Live Text in macOS Monterey

Text und Bitmap-Bilder sind zwei verschiedene Arten von Dateien. Text kann man tippen, bearbeiten, kopieren, einfügen, löschen und verarbeiten. Bilder hingegen sind ein Haufen von Pixeln in einem Raster, die sich auf die richtige Weise kombinieren lassen, um eine Art von Information zu vermitteln: Sie ähneln einem Foto, einer Illustration oder einem gerenderten Text. Wo können sich die beiden also treffen?

Optische Zeichenerkennung (OCR) war der Name, dem die Informatiker der Extraktion von Text aus Bildern gegeben haben. Aber der Begriff ist in Ungnade gefallen, da Software zunehmend und automatisch versucht, Text in einem Bild zu identifizieren und ihn durchsuchbar und oft auch zum Kopieren verfügbar zu machen.

Mehrere Möglichkeiten, um Texte aus Bildern zu bekommen

Wenn Sie versuchen, auf Text in Ihren Bildern zuzugreifen, egal ob es sich um Dokumente, Fotos oder Formulare handelt, stehen Ihnen viele Möglichkeiten zur Verfügung. Dazu gehören auch PDFs mit gescannten Bildern, bei denen noch keine Textebene eingefügt oder extrahiert wurde. Möglicherweise haben Sie bereits ein kostenloses Konto oder ein kostenpflichtiges Abonnement für einen der unten aufgeführten Dienste oder Sie besitzen die Software.

Hier sind mehrere Möglichkeiten, Text zu extrahieren, und einige, die auch eine Suche ermöglichen. Für einen schnellen Test habe ich den gleichen lesbaren Schriftsatz aus einem "Popular Mechanics"-Artikel aus den 1920er-Jahren über die Produktion von Comics verglichen und sehr unterschiedliche Ergebnisse erzielt. Sie können die Ergebnisse unten sehen, wobei jede App oder jeder Dienst vermerkt ist. PDFpen und Live Text von macOS Monterey schnitten einwandfrei ab. OneNote lag ebenfalls recht nah an diesen beiden, nachdem Microsoft seine verzögerte Erkennung durchgeführt hatte. Evernote zeigt während der Eingabe Übereinstimmungen im Text an und schien mit Monterey und PDFpen zu konkurrieren. Alle vier waren überwältigend besser als Acrobat und Google Docs, die peinlich schlechte Ergebnisse erzielten.

Ich habe alle diese Apps und Dienste gegen die zweite Spalte dieses Scans einer Seite aus einem "Popular Mechanics"-Artikel aus den 1920er-Jahren getestet.

macOS Monterey: Live Text in Safari und Fotos

In der kommenden Version von macOS 12 Monterey (wie auch in iOS 15 und iPadOS 15) erkennt Safari automatisch Text in Bildern auf einer Webseite und in der Fotos-App, wenn Sie ein Bild betrachten . Sie können diesen Text auswählen und kopieren. Die Funktion erfordert Apples Neuronale Engine, die in Macs und Handys mit einem A12-Bionic-Chip oder höher verfügbar ist und ab 2018 in einigen iPhones und 2019 in einigen iPads auftaucht. Sie können das etwa mit der  Public Beta von iOS 15 , iPadOS 15 oder macOS Monterey ausprobieren. Live Text macht einen hervorragenden Job.

Mit Monterey können Sie mit der Maus über ein Bild in Safari, Fotos und Quicklook fahren und dort, wo ein Einfügecursor erscheint, Text auswählen. Die Ergebnisse waren nahezu perfekt.

Adobe Acrobat Pro DC

Das Öffnen eines PDFs in Acrobat Pro DC startet die Texterkennung normalerweise automatisch. Wenn diese abgeschlossen ist, können Sie beliebige Textbereiche zum Kopieren auswählen. OCR in Acrobat ist Teil eines vollständigen Creative-Cloud-Abonnements (59,49 Euro pro Monat), und Adobe bietet auch Acrobat allein im Abo für 17,84 Euro im Monat an. Die Ergebnisse lassen jedoch zu wünschen übrig.

Trotz jahrzehntelanger Entwicklung lieferte Acrobats OCR Ergebnisse unter aller Erwartung - und viel schlechter als vier bessere Optionen in diesem Test.

Evernote

Evernote führt OCR an jedem Bild oder PDF mit eingebetteten Bildern durch, die in den Dienst importiert oder mit der Kamera eines mobilen Geräts aufgenommen wurden. Dadurch wird der Text vollständig durchsuchbar, aber es ist verwunderlich, dass Sie den erkannten Text nicht kopieren können. (Ein exportiertes PDF benötigt jedoch die hinzugefügte Textebene.) Die kostenlose Version ermöglicht die Suche nach Text in Bildern, die kostenpflichtige (7,99 US-Dollar pro Monat) ist für die Suche mit PDFs erforderlich, unabhängig davon, ob sie Text enthalten oder der Text durch OCR extrahiert wurde.

Evernote erlaubt keine Extraktion, aber Sie können innerhalb des Bildes suchen und sehen Ergebnisse, die helfen, die Genauigkeit abzuschätzen.

Google Drive und Google Docs

Bei der kostenlosen und der kostenpflichtigen Variante laden Sie das PDF oder Bild in Google Drive hoch, entweder über Google Drive auf Ihrem Desktop oder in einem Webbrowser. Dann öffnen Sie die Datei in Google Text & Tabellen. Diese Aktion importiert das Bild oder PDF und fügt den extrahierten Text mit einigen Formatierungen darunter ein. Wie Sie sehen können, schnitt der Dienst überhaupt nicht gut ab.

Google Docs hat nicht viele Wörter erfasst.

Microsoft OneNote

OneNote überprüft automatisch jedes Bild, das in eine OneNote-Seite eingefügt wird, auf Text. Klicken Sie bei gedrückter Steuerungstaste auf das Bild und wählen Sie Text aus Bild kopieren. Microsoft merkt jedoch an: "Der OCR-Texterkennungsprozess ist ein sehr komplexer Prozess, der Microsoft-Onlinedienste nutzt und daher einige Minuten für einfache Bilder und bis zu Stunden für komplexe Bilder dauern kann, bevor der Befehl "Text aus Bild kopieren" verfügbar ist, wenn Sie bei gedrückter Ctrl-Taste auf das Bild klicken." Angesichts der Tatsache, dass Apple, Google und Apps von Drittanbietern OCR sofort durchführen können, hinkt OneNote vielleicht hinterher, obwohl die Ergebnisse ausgezeichnet sind. OneNote ist Teil von Microsoft 365-Abonnements.

Aus OneNote kopierter Text, der in der App keine Ergebnisse anzeigt, zeigte eine nahezu perfekte Erkennung.

PDFpen

PDFpen ist eine hervorragende App für die Arbeit mit PDFs. Um Text in PDFpen zu verdecken, wählen Sie "Bearbeiten > OCR-Seite" oder halten Sie die Optionstaste gedrückt und wählen Sie Bearbeiten > OCR-Dokument. Wenn es vorhandene OCR-Textebenen gibt, müssen Sie diese zuerst über "Bearbeiten > OCR-Ebene löschen" in "Seite/Dokument" löschen. PDFpen gibt es in einer normalen (79,95 US-Dollar) und einer Pro-Version (129,95 US-Dollar). Die Arbeit, die es in meinem Test geleistet hat, war beeindruckend.

PDFpen erzeugte eine nahezu exakte Konvertierung, beeindruckend für ein Produkt, das von einer Firma entwickelt wurde, die weitaus kleiner ist als alle diese Konkurrenten, außer Evernote.

Dieser Artikel stammt im Original von unseren Kollegen der Macworld