Was ist OCR (Texterkennung)?
OCR (Optical Character Recognition, deutsch: optische Zeichenerkennung) wandelt Text in Bildern in bearbeitbaren digitalen Text um. Die Software erkennt Buchstaben, Zahlen und Sonderzeichen anhand ihrer Form.
Wir nutzen Tesseract, die leistungsstaerkste Open-Source OCR-Engine, entwickelt von Google. Sie erkennt ueber 100 Sprachen mit hoher Genauigkeit.
OCR-Faehigkeiten
| Eigenschaft | Wert |
|---|---|
| Gedruckter Text | Sehr gute Erkennung |
| Screenshots | Optimale Erkennung |
| Gescannte Dokumente | Gute Erkennung |
| Handschrift | Begrenzte Erkennung |