Texterkennung vom Digital-Foto
Dies berichtet die Computerzeitschrift PC Professionell (11/2005). Die Marktführer bei der Erkennungssoftware, Finereader 8.0 Pro und Omnipage 15, können in ihren neuen Versionen beide sowohl Texte auch von qualitativ minderwertigen Vorlagen wie von Faxen lesen.
Der Test ergab, dass beide Tools akkurater arbeiten als ihre Vorgänger, jede der 21 Prüfdateien bewältigten die Kandidaten in höchstens fünf Sekunden. Layout und Text wurden in 40 Sekunden gut erkannt. Um das Kleingedruckte in Verträgen zu digitalisieren, ist bei beiden Programmen die Auflösung von 600 dpi Pflicht. Bei Faxen mit niedriger Auflösung zeigt sich im Test die gute Vorverarbeitung der Vorlagen: Finereader und Omnipage korrigieren die Seiten und liefern bis auf wenige Zeichenfehler einwandfreie Ergebnisse. Bei per Digitalfoto eingelesenen Buchseiten identifizieren die OCR-Tools knapp 95 Prozent der Zeichen korrekt.
Der größte Unterschied: Finereader hat den größeren Ressourcen-Hunger. Das Programm benötigt einen Rechner mit 2-GHz-CPU und 512 MByte Arbeitsspeicher. Omnipage dagegen läuft auf einem 700er Pentium langsam, aber komfortabel.