Finereader Pro – Der Ferrari unter den Texterkennungsprogrammen

Wer von Windows auf einen Mac umsteigen möchte, stellt sich unweigerlich die folgende Frage: Welche Texterkennungssoftware ist für mich geeignet? Für alle, die Wert auf korrektes Layout und hervorragende Ergebnisse, auch bei Sachbüchern mit Tabellen, wert legen, ist der Finereader das richtige. Wer nur mal eben einen Brief einscannen möchte, kann getrost nach anderen, evtl. preisgünstigeren Alternativen suchen.

Auf einen Blick

  • Preis: 89,99
  • Sprachen (Benutzeroberfläche): Deutsch, englisch, Französisch, Italienisch, Japanisch, Russisch, Spanisch
  • Systemvoraussetzungen: OS X 10.8.4 oder neuer, 64-Bit-Prozessor
  • Benötigte Hardware: Mac-Computer mit Intel Prozessor, 2,5 GB Festplattenspeicher
  • Erkennungssprachen: 189 Erkennungssprachen, 45 davon mit Wörterbuchunterstützung
  • Unterstützte Scanner: Alle von Apple unterstützten Scanner sowie Kameras und Smartphones
  • Testversion vorhanden: Ja
  • Kaufoptionen: Über den App Store oder direkt bei ABBYY

Funktionsumfang

  • Scannen und Konvertieren von Dokumenten und Bildern in eine Vielzahl von gängigen elektronischen Formaten, einschließlich DOCX, ODT, RTF, XSLX, PDF und PDF/A, PPTX, HTML, EPUB und FB2
  • Genaue Rekonstruktion von Dokumentenstruktur, Layout und Formatierungen auch von mehrseitigen Dokumenten – einschließlich Kopf- und Fußzeilen, Fußnoten, Inhaltsverzeichnisse, Seitennummerierungen, Überschriften, etc.
    Konvertieren von gescannten Dokumenten und Bild-PDFs in editierbare, durchsuchbare und sichere PDFs, die optimal für Archivierung und Teilen mit anderen geeignet sind
    E-Book-Erstellung im EPUB- und FB2-Format für Tablets und tragbare Lesegeräte
    Bildvorverarbeitung mit ABBYYs Advanced Digital Camera OCR-Technologie
  • Erweiterte OCR-Eigenschaften für komplexe Konvertierungsaufgaben

Zur App im App Store

Zur App auf der ABBYY Webseite

Aufbau des Programms

Nachdem man das Programm installiert und geöffnet hat, erscheint standardmäßig ein Fenster, in dem man wählen kann, welche Aufgabe erledigt werden soll. Der VoiceOver Cursor steht normalerweise auf einer Tabelle. Hier wird erst einmal grundsätzlich festgelegt, ob eine Konvertierung mit Dateien auf dem Computer stattfinden oder ob von einer Bildvorlage gescannt werden soll. Interagiert man mit dieser Tabelle kann man also zwischen der Option „Mein Mac, Computer“ oder dem angeschlossenen Scanner wählen. Ist aktuell kein Scanner angeschlossen und auch eingeschaltet, wird nur die Option Computer angezeigt.

Beendet man die Interaktion mit der Tabelle, kann man sich nach rechts oder links orientieren. Mit VoiceOver pfeil links erreicht man nur noch ein wichtiges Kontrollkästchen, nämlich „Nach rechts gehen“, das abgehakt ist. Dazu gleich noch mehr. Orientiert man sich nach der Tabelle mit VoiceOver + Pfeil rechts, findet man verschiedene Schalter, die jeweils eine Aufgabe bezeichnen. Man kann bei der Computer Option jeweils in Pdf, Excel, Word und HTML konvertieren. Danach kommt die Option zur Erstellung eines neuen Finereader Dokuments, nämlich „Bilder in neues Dokument importieren“. Zuletzt kann man noch die festgelegte Dokumentsprache sehen und mit einem Druck auf diese auch ändern.

Hat man zuvor in der Tabelle den Scanner gewählt, erscheinen dieselben Optionen, mit dem Unterschied, dass jetzt jeweils in die verschiedenen Formate gescannt statt konvertiert werden kann. Eigentlich sehr schlüssig. Möchte man eine Pdf-Datei konvertieren, die bereits auf dem Mac gespeichert ist, wählt man Computer und die entsprechende Konvertierungsaufgabe. Möchte man ein neues Dokument scannen, wählt man seinen Scanner und die entsprechende Aufgabe. In beiden Optionen kann man ein neues Finereader Dokument erstellen oder die Dokumentsprache wechseln. Am Ende findet sich außerdem noch die Taste Abbrechen.

Aktiviert man das Kästchen „nach rechts gehen“ links von der Tabelle, verändert sich der Bildschirm etwas. Es gibt immer noch die oben beschriebene Tabelle. Daneben befindet sich aber ein Rollbereich. Nachdem man damit interagiert hat, kann man alle Formate auswählen, in welche gescannt bzw. konvertiert werden kann.

Wichtiger Hinweis: Nachdem man eine Aufgabe gewählt hat, öffnet sich automatisch entweder ein Dialog zum Wählen einer Datei oder aber der Scannen Dialog. Die Einstellungen für das jeweilige Format, also was man übernehmen möchte usw. kann man dann nicht mehr vornehmen. Es werden die aktuell gespeicherten Einstellungen gewählt. Zu Beginn empfiehlt es sich daher, erst einmal ein neues Finereader Dokument zu erstellen und dann den Text zu exportieren.

Einstellungen

Bevor man anfängt, lohnt es sich, mit cmd+, die Einstellungen aufzurufen und nach Gusto zu verändern. Es gibt nur zwei Registerkarten, nämlich „Allgemein“ und „Sprachen“, die über eine Symbolleiste mittels VoiceOver+Leertaste gewählt werden können.

Registerkarte allgemein

Hierfinden sich die unten stehenden Kontrollkästchen, die wahlweise an- oder abgehakt werden können. Diese Einstellungen lassen sich auch in dem Dialogfeld tätigen, das sich beim Scannen eines Dokuments öffnet.

  • Neu hinzugefügte Seiten automatisch lesen
  • Bilder verbessern
  • Gegenüberliegende Seiten teilen
  • Seitenausrichtung erfassen
  • am Kundenzufriedenheitsprogramm teilnehmen

Es ist ratsam, alle Felder zu aktivieren, außer vielleicht das Zufriedenheitsprogramm 🙂 Gegenüberliegende Seiten sollte man unbedingt teilen, wenn man Doppelseiten eines Buches auf den Scanner legt, aber mir scheint, dass diese Option auch bei mehrspaltigen Dokumenten hilft.

Registerkarte Sprachen

Hier findet sich eine Tabelle, in welcher alle verfügbaren Sprachen gelistet sind. Die Sprachen sind als Kontrollkästchen designed, die man an- und abhaken kann. Außerdem sind sie gruppiert nach „Natürliche Sprachen“, „Künstliche Sprachen“ und „formale Sprachen“. Sprachen, die mehrere Schriften verwenden, können getrennt für jede Schrift angehakt werden, z. B. serbisch kyrillisch und / oder serbisch latein. Man kann in der Tabelle die ersten Zeichen der gesuchten Sprache eingeben, und der Cursor springt dann zu der ersten Sprache, die mit dieser Zeichenfolge beginnt. Dadurch kommt man bei 189 Sprachen trotzdem schnell ans Ziel. Es ist außerdem auch möglich, mehrere Sprachen zu wählen, falls man mehrsprachige Dokumente scannt. Dabei sollte man allerdings bedenken, dass die Erkennung länger dauert, je mehr Sprachen aktiviert sind.

Scannen eines Dokuments

Um ein Dokument zu scannen wählt man entweder oben bei den Aufgaben „In neues Dokument Scannen“ oder aus dem Menü unter Datei „von Gerät importieren“ im Untermenü den Scanner aus. Der Scanner macht eine kurze Vorschau von der ersten Seite, und gleichzeitig erscheint das Dialogfeld zum Scannen. Die Vorschau kann man leider nicht abstellen, was etwas nervig ist, aber glücklicherweise kommt sie nur beim ersten Scannen. Im Dialogfeld zum Scannen folgen von rechts nach links die folgenden Einstellmöglichkeiten:

Importieren von: Hier erscheint ein Einblendmenü mit den Geräten, von denen man importieren kann. Dies ist nur interessant, wenn man mehr als ein Gerät hierfür angeschlossen hat.

Scanmodus: In diesem Einblendmenü steht die Art des angeschlossenen Scanners, bei mir z. B. Flachbett. Hier kann man auch nichts ändern, sofern man nicht mehrere Geräte besitzt.

Mehrere Seiten mit Pause scannen: Windows-Nutzer kennen diese Option vom Finereader. Hier kann man einstellen, dass der Scanner automatisch nach einer definierten Pause jeweils einen neuen Scanvorgang einleitet. Die Sekunden werden nach diesem Kästchen eingegeben.

Farbtiefe: In diesem Einblendmenü kann man einstellen, ob in Vollfarbe, Graustufen oder Schwarz-weiß gescannt werden soll. Bei Graustufen steht in Klammern dabei, dass es optimal für OCR ist. Für einfache belletristische Texte ist diese Einstellung gut geeignet. Wer allerdings mit Zoom Probleme bei der Anzeige des Textes hat, sollte es einmal in der Einstellung schwarz-weiß versuchen. Bei farbigen Vorlagen ist die Erkennung außerdem besser, wenn Vollfarbe ausgewählt wird.

Auflösung: Hier wird gewählt, mit welcher Auflösung gescannt werden soll, 200, 300, 600 und 1200 dpi. Dahinter stehen auch kleine Anmerkungen, z. B. 300 Standard, 600 für kleine Schrift usw. Grundsätzlich wird ein Scanvorgang immer langsamer, je höher die Auflösung gewählt ist.

Scanbereich: Hier lassen sich in einem Einblendmenü verschiedene Papierformate wählen. Somit kann der Scanvorgang entsprechend optimiert werden. Außerdem gibt es auch die Möglichkeit, ein eigenes Format einzustellen, z. B. wenn man ein Dokument hat, das in keinem der Standardformate gedruckt wurde. Die Eingabefelder folgen nach dem Einblendmenü. Anschließend gibt es noch ein Einblendmenü, in welchem man festlegen kann, in welcher Maßeinheit man die Größe angegeben hat. Hier sind nur cm oder Zoll wählbar. Die Millimeter werden nicht mit einem Komma, sondern mit einem Punkt als Dezimaltrennzeichen angegeben.

Es folgen die Tasten Vorschau anzeigen, was man nicht braucht, und Auf Standard zurücksetzen. Dies kann hilfreich sein, wenn man irgendetwas unglücklich verstellt hat und nicht mehr weiß, was es war.

Anschließend folgen die Kontrollkästchen für die Bildeinstellung, die ich bereits in den Einstellungen vorgestellt habe, und danach nur noch die Schalter Scannen und Import abschließen. Die hier getätigten Einstellungen bleiben so lange gespeichert, bis man etwas neues einstellt.

Wenn man alles eingestellt hat, wie man es braucht, kann man auf Scannen drücken. Der Fokus bleibt auf dieser Taste, sodass man sie bequem immer wieder aktivieren kann, bis man alles eingescannt hat. Anschließend geht man auf Import abschließen. Die Texterkennung wurde, sofern eingestellt, bereits im Hintergrund während des Scannens der anderen Seiten durchgeführt, sodass am Schluss nur wenige zu erkennende Seiten übrig sein sollten. Es erscheint ggf. ein Dialogfeld, in welchem angegeben wird, wie viele Seiten gescannt und wie viele davon bereits erkrannt wurden. Nach Abschluss des Scanvorgangs erscheint das neue Finereader Dokument. Manchmal taucht auch ein Bereich mit Warnungen auf, den man aber einfach mit Schließen wegklicken kann. In diesem Bereich stehen Hinweise auf Leerseiten und Ähnliches.

Dokument exportieren

Das Dokument ist eingescannt. Was nun? Der Bildschirm, der nach Abschluss des Imports auftaucht, ist für uns eigentlich nicht sehr interessant. Neben der Symbolleiste gibt es die Schalter „Seiten“ bzw. „Warnungen“. Danach kommt ein vertikal Trenner und im Anschluss die Information, auf welcher Seite wir uns befinden, i. d. R. wird die letzte angezeigt, z. B. „Seite 4 von 4“.

Hinweis: Das Wählen mehrerer zusammenhängender Seiten aus dem Dokument, z. B. Seiten 4-6 von 10, ist ein wenig tricky, da die Auswahl nicht so barrierefrei ist wie unter Windows. Stellt man sich auf die Meldung Seiten x von y, kann man bei ausgeschalteter Schnellnavigation mit Pfeil auf- und abwärts durch die Seiten navigieren. Es ertönt ein kurzes Knacken, wenn die Seite weiter geblättert wird. Dies funktioniert aber bei mir nicht zuverlässig und wirkt auf mich nicht wie ein Feature, sondern wie etwas, das zufällig funktioniert. Wenn es funktionniert, kann man aber die Seite aussuchen und mit shift+Pfeil aufwärts oder Shift + Pfeil abwärts jeweils die Auswahl nach oben oder unten hin erweitern. Außerdem gibt es im Menü Seite den Punkt Gehe zu, wo man auch gezielt eine Seite anspringen kann. Unter dem Menüpunkt Bearbeiten findet sich außerdem die Möglichkeit, alle Seiten oder alle geraden oder ungeraden Seiten zu wählen.

Meist wird man aber wohl alle Seiten exportieren wollen. Hierzu drückt man cmd+s. Es erscheint ein Dialogfeld, in welchem das Format und die dazugehörigen Einstellungen festgelegt werden können. Im oberen Bereich befinden sich die Formate, die durch VoiceOver+Leertaste gewählt werden können, im unteren Bereich stehen die dazugehörigen Einstellungen. Da diese für jedes Format leicht differieren, werde ich sie nicht alle aufzählen. Generell legt man hier fest, wie das Layout übernommen werden soll (genaue Kopie, bearbeitbare Kopie, formatierter Text usw.) und ob man Zeilen- und Seitenumbrüche sowie Kopf- und Fußzeilen und Bilder beibehalten möchte. Es gibt außerdem für die einzelnen Formate auch erweiterte Einstellungen, die sich etwas unterscheiden. Es lohnt sich, für die häufiger benutzten Formate alles anzugucken und nach Vorliebe einzustellen. Außerdem sollte man auch die verschiedenen Layout-Optionen ein wenig durchprobieren, um zu sehen, wie die Anzeige des exportierten Texts sich verändert, jej nach dem, was man eingestellt hat.

Hat man alles eingestellt, drückt man auf Weiter. Dies ist die Standardtaste, was bedeutet, dass sie mittels Enter aktiviert wird. Neben dieser Taste gibt es auch hier die Tasten „Auf Standard zurücksetzen“ und „Abbrechen“.

Hinweis: Die vorgenommenen Einstellungen werden für das aktuelle Format gespeichert. Das bedeutet, dass man sie für ein Format nur einmal vornehmen muss. Nutzt man verschiedene Formate, muss man aber für jedes Format die Einstellungen einmal vornehmen.

Hat man auf Weiter gedrückt, erscheint das alt bekante Dialogfeld zum Sichern von Dokumenten. Es wird nach dem Browser zur Wahl des Ordners nur noch von zwei Einstellmöglichkeiten ergänzt. Ein Einblendmenü erlaubt es, auszuwählen, wie man die einzelnen Seiten speichern möchte, als gemeinsame Datei, als einzelne Dateien pro Seite und noch einiges mehr (diese Einstellungen lassen sich in manchen Formaten nicht ändern). Danach folgt ein Kontrollkästchen, das einstellt, ob die Datei nach dem Export geöffnet werden soll oder nicht. Wenn es aktiviert ist, wird die Datei im für das aktuelle Format üblichen Programm geöffnet.

Zugänglichkeit

Das Scannen und Exportieren von Dokumenten lässt sich mit VoiceOver komfortabel durchführen. Außerdem gibt es überall im Menü verstreut und in der Hilfe eine Reihe von Tastenkombinationen, die einem das Leben etwas erleichtern können. Die Funktionen, die das Programm sonst noch besitzt, v. a. zum Korrigieren der Seite, festlegen einzelner Bereiche wie z. B. Tabellen usw. sind hingegen nicht zugänglich. Das sind sie unter Windows allerdings auch nicht. Sehr ärgerlich ist, dass man nicht willkürlich mehrere Seiten am Stück auswählen kann. Der oben geschilderte Workaround klappt nicht zuverlässig und ist nicht mehr als genau das: Ein Workaround. Hier besteht noch Nachholbedarf. Ein weiteres Ärgernis ist das Fehlen eines Texteditors. Man kann zwar den Text als Bild sehen, nicht aber den erkannten Text. Das zwingt einen dazu, jede gescannte seite erst einmal zu exportieren, bevor man sie lesen kann. Es gibt im Menü zwar irgendwo einen Befehl „Copy recognized Text“, aber zumindest bei mir ist der aus irgendeinem Grund immer ausgegraut, auch wenn ich alle seiten gewählt habe.

Der Support bei ABBYY ist sehr nett, und auch wenn man oft erst einmal vertröstet wird, hat man doch das Gefühl, ernst genommen zu werden. Es lohnt sich also durchaus, mit Belangen der Zugänglichkeit, Hinweisen auf Fehler oder Verbesserungsvorschlägen an ihn heranzutreten.

Fazit

Der ABBYY Finereader ist ein professionelles Programm zum Digitalisieren von Dokumenten, das sehr gute Texterkennung liefert. Vor allem beim Scannen von Sachbüchern, Dokumenten mit kleiner Schrift oder schlechten Kopiervorlagen wird dies deutlich. Außerdem ist das Programm als bislang einziges für den Mac in der Lage, das Seitenlayout von Dokumenten inkl. Seiten- und Zeilenumbrüchen zu übernehmen, besonders wichtig für Schüler und Studenten, die Arbeiten schreiben und Literatur zitieren müssen. Die Zugänglichkeit ist als gut zu bewerten, wobei noch Raum nach oben besteht. Manche Arbeitsabläufe könnten effizienter sein, z. B. ist es ärgerlich, dass die Scanvorschau vor dem Scannen der ersten Seite nicht abgestellt werden kann. Dennoch ist das Programm sehr empfehlenswert, wenn man sich auf die geschilderten Workarounds einlassen möchte oder muss. Für Leute, die nur hin und wieder ihre Post oder etwas belletristische Literatur einscannen möchten, ist das Programm vermutlich etwas zu überfrachtet, und es könnte auch eine preiswertere Alternative ausreichend sein.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.