OCR-Verarbeitung von Belegen

06.11.2025
4 Minuten Lesedauer

OCR steht für Optical Character Recognition (optische Zeichenerkennung) und bezeichnet die automatische Texterkennung, bei der der Textinhalt eines gescannten Bildes oder einer PDF-Datei extrahiert und in Daten umgewandelt wird, die von einem Computer verarbeitet werden können.

Immer wenn Sie ein PDF-Dokument in Continia Document Capture erhalten, wird das Dokument automatisch mit OCR verarbeitet, sodass es zur Registrierung und weiteren Verarbeitung in Document Capture importiert werden kann. Für die OCR-Verarbeitung nutzt Document Capture einige der weltweit führenden Anbieter von OCR- und Dokumentenscan-Diensten. Die jeweilige OCR-Methode hängt von Ihrer Umgebung ab, wie unten beschrieben.

Die zu Grunde liegende Technologie

Die Technologie, die zur OCR-Verarbeitung eingehender Dokumente in Document Capture verwendet wird, hängt davon ab, ob Sie mit einer Online- oder On-Premises-Installation arbeiten:

Wenn Sie Microsoft Dynamics 365 Business Central Online verwenden, ist Ihre Standard-OCR-Methode Continia Cloud OCR. Cloud OCR verwendet Azure AI Document Intelligence, ein vordefiniertes Rechnungsmodell.

Wenn Sie Microsoft Dynamics NAV/Business Central On-Premises verwenden, können Sie entweder On-Premises OCR oder Continia Cloud OCR verwenden. Dieser besteht aus dem Document Capture-Dienst, der E-Mails herunterlädt und eingehende Dateien für die OCR-Verarbeitung überwacht, und der ABBYY FineReader Engine, die die eigentliche OCR-Verarbeitung importierter Dokumente ausführt.

Weitere Informationen zu Continia Cloud OCR und der entsprechenden Einrichtung, finden Sie unter Cloud OCR für NAV oder Business Central On-Premises konfigurieren.

Informationen zu On-Premises OCR und zum Continia OCR-Dienst sowie für Informationen zur Einrichtung finden Sie unter On-Premises OCR konfigurieren und ABBYY und Document Capture-Dienste installieren. Die entsprechenden Mindestanforderungen finden Sie unter OCR-Serveranforderungen und Firewall-Anforderungen.

Der gesamte Prozess

Die OCR-Engine versucht in jedem PDF-Dokument, das in Document Capture importiert wird, alle Zeichen und deren Position zu erfassen. Anhand dieser OCR-Daten kann Document Capture dann alle Wörter und Textzeilen im Dokument ermitteln und so nach Suchtexten und den entsprechenden Werten suchen. Um das gescannte PDF-Dokument mit allen identifizierten Suchtexten und Werten optimal in der Benutzeroberfläche anzeigen zu können, wandelt Document Capture es in eine TIFF-Datei um, da diese übersichtlicher und einfacher darzustellen ist. Sie können das Original-PDF-Dokument jedoch jederzeit über die Aktionsleiste abrufen, indem Sie Dokument > PDF-Datei auswählen.

Für jeden identifizierten Suchtext sucht Document Capture zunächst nach dem Wert rechts neben dem Suchtext. Wenn Document Capture keinen Wert finden kann oder den falschen Wert findet, haben Sie die Möglichkeit, den richtigen Wert manuell zu identifizieren. Sobald ein Wert gefunden wurde (von Document Capture oder von Ihnen), speichert Document Capture die relative Position des Suchtextes und des Werts und verwendet diese dann, um die Werte dieses Suchtextes in allen zukünftigen Dokumenten zu identifizieren, die von demselben Kreditor gesendet werden. Die Position des Suchtextes selbst ist unwichtig; es wird nur die relative Position zwischen dem Suchtext und dem Wert verwendet.

Inhaltsverzeichnis

OCR-Verarbeitung von Belegen

Die zu Grunde liegende Technologie

Der gesamte Prozess

Ist diese Seite hilfreich?