Tag Experten.
Kann jemand empfehlen OCR Software für Linux oder Windoze, die erkennt nicht nur Text, sondern auch Formeln und Bilder ?
Mit
|
Quellcode
|
1
|
tesseract bilddatei.tif textdatei -l deu
|
ich kann erfolgreich umwandeln normale Textzeilen ,
aber sobald
tesseract stolpert über Formeln, bekomme ich nur Haufen Müll.
Z.b. Formel
E=mc2 wird erkannt als E-mc .
Im Bruchrechnungen, Zähler und Nenner werden überhaupt nicht als solche erkannt.
Bider auch sind verloren.
Gibt es OCR Software, die erkennt auch Formeln, und kann die exportieren als Libreoffice-Formel z B zu ODT, DOCX... , und Bilder als Bildobjekte ?
Oder nicht als Text erkannte Objekte, wie Formeln und Bilder, zusammen mit umgewandeltem Text , exportieren nach ODT oder DOCX ?
Im voraus besten dank an alle.