OCR-Verarbeitung von Belegen

OCR steht für Optical Character Recognition (optische Zeichenerkennung) und bezeichnet die automatische Texterkennung, bei der der Textinhalt eines gescannten Bildes oder einer PDF-Datei extrahiert und in Daten umgewandelt wird, die von einem Computer verarbeitet werden können.

Immer wenn Sie ein PDF-Dokument in Continia Document Capture erhalten, wird das Dokument automatisch mit OCR verarbeitet, sodass es zur Registrierung und weiteren Verarbeitung in Document Capture importiert werden kann. Für die eigentliche OCR-Verarbeitung nutzt Document Capture Technologie des offiziellen Continia-Partners ABBYY, einem der weltweit führenden Anbieter von Diensten für OCR und Scannen von Dokumenten. Die jeweilige OCR-Methode hängt von Ihrer Umgebung ab, wie unten beschrieben.

Die zu Grunde liegende Technologie

ABBYY stellt die Technologie bereit, die zur OCR-Verarbeitung eingehender Dokumente in Document Capture verwendet wird. Die jeweilige Methode hängt jedoch davon ab, ob Sie mit einer Online- oder On-Premises-Installation arbeiten:

Wenn Sie Microsoft Dynamics 365 Business Central Online verwenden, ist Ihre Standard-OCR-Methode Continia Cloud OCR. Cloud OCR nutzt die ABBYY-Technologie zur OCR-Verarbeitung eingehender Dokumente mit dem ABBYY Cloud OCR SDK.

Wenn Sie Microsoft Dynamics NAV/Business Central On-Premises verwenden, können Sie entweder On-Premises OCR oder Continia Cloud OCR verwenden. Bei On-Premises OCR wird der Prozess vom Continia OCR-Dienst ausgeführt. Dieser besteht aus dem Document Capture-Dienst, der E-Mails herunterlädt und eingehende Dateien für die OCR-Verarbeitung überwacht, und der ABBYY FineReader Engine, die die eigentliche OCR-Verarbeitung importierter Dokumente ausführt.

Weitere Informationen zu Continia Cloud OCR und der entsprechenden Einrichtung, finden Sie unter Configuring Cloud OCR for NAV or Business Central on-premises.

Weitere Informationen zu On-Premises OCR und dem Continia OCR-Dienst so wie Informationen, wie Sie dies einrichten finden Sie unter On-Premises OCR konfigurieren und ABBYY und Document Capture-Dienst installieren. Die jeweiligen Mindestanforderungen finden Sie unter OCR-Serveranforderungen und Firewall-Anforderungen.

Der gesamte Prozess

Die ABBYY-Engine versucht in jedem PDF-Dokument, dass in Document Capture importiert wird, alle Zeichen und deren Position zu erfassen. Anhand dieser OCR-Daten kann Document Capture dann alle Wörter und Textzeilen im Dokument ermitteln und so nach Suchtexten und den entsprechenden Werten suchen. Um das gescannte PDF-Dokument mit allen identifizierten Suchtexten und Werten optimal in der Benutzeroberfläche anzeigen zu können, wandelt Document Capture es in eine TIFF-Datei um, da diese übersichtlicher und einfacher darzustellen ist. Sie können das Original-PDF-Dokument jedoch jederzeit über die Aktionsleiste abrufen, indem Sie Dokument > PDF-Datei auswählen.

Für jeden identifizierten Suchtext sucht Document Capture zunächst nach dem Wert rechts neben dem Suchtext. Wenn dort kein Wert gefunden wird, wird direkt unter dem Suchtext danach gesucht. Wenn Document Capture keinen Wert finden kann oder den falschen Wert findet, haben Sie die Möglichkeit, den richtigen Wert manuell zu identifizieren. Sobald ein Wert gefunden wurde (von Document Capture oder von Ihnen), speichert Document Capture die relative Position des Suchtextes und des Werts und verwendet diese dann, um die Werte dieses Suchtextes in allen zukünftigen Dokumenten zu identifizieren, die von demselben Kreditor gesendet werden. Die Position des Suchtextes selbst ist unwichtig; es wird nur die relative Position zwischen dem Suchtext und dem Wert verwendet.

Siehe auch

ABBYY-Website
Configuring Cloud OCR for NAV or Business Central on-premises )
On-Premises OCR konfigurieren
ABBYY und Document Capture-Dienst installieren
Mindestanforderungen für die Verwendung von Continia Document Capture On-Premises
Mit Papier- und PDF-Dokumenten arbeiten