Erweiterte OCR-Optionen konfigurieren

Alle in Continia Document Capture importierten PDF-Dateien werden mit den OCR-Einstellungen verarbeitet, die zum Zeitpunkt der Verarbeitung gültig sind. Wenn Sie keine Anpassungen vornehmen, gelten die Standardeinstellungen. Es ist jedoch möglich, einige der erweiterten Einstellungen an Ihre Anforderungen anzupassen. Informationen hierzu finden Sie in den folgenden Abschnitten.

So konfigurieren Sie OCR-Einstellungen

Mit den folgenden Schritten können Sie konfigurieren, wie eingehende Dokumente mit OCR verarbeitet werden:

  1. Wählen Sie das Symbol Search, geben Sie Belegkategorien ein, und wählen Sie dann den zugehörigen Link.
  2. Öffnen Sie die entsprechende Belegkategorie. Um beispielsweise die Kategorie für Einkaufsbelege zu öffnen, wählen Sie die Zeile EINKAUF (nicht den Code EINKAUF), und wählen Sie dann Bearbeiten in der Aktionsleiste.
  3. Konfigurieren Sie im Inforegister OCR-Verarbeitung die Einstellungen nach Bedarf. Weitere Informationen und Empfehlungen finden Sie unter Tipps und empfohlene Einstellungen weiter unten.

Tipps und empfohlene Einstellungen

Die folgende Tabelle enthält eine Reihe von Tipps und Empfehlungen für jedes der Felder, das Sie mit der obigen Anleitung anpassen können:


FeldTipps und Empfehlungen
Bild-AuflösungIn diesem Feld können Sie die DPI-Auflösung festlegen, die Document Capture für die durch die OCR-Verarbeitung erstellten Dokumentenbilddateien verwenden soll. Der eingegebene Wert muss mindestens 150 DPI betragen; bei Werten darunter erhalten Sie einen Fehler.

Je höher der eingegebene Wert, desto besser ist die Auflösung. Beachten Sie jedoch, dass sehr hohe Werte zu entsprechend großen Bilddateien führen, deren Laden in der Benutzeroberfläche lange dauert. Aus diesem Grund empfehlen wir die Auswahl von 300 DPI, um eine gute Auflösung und akzeptable Dateigrößen zu gewährleisten.
TIFF Image FarbmodusHier können Sie den Farbmodus der Bilddateien festlegen, in den alle importierten PDF-Dateien konvertiert werden. Sie können zwischen den folgenden Optionen wählen:
  • Schwarz & Weiß: Es werden Bilddateien erstellt und gespeichert, die nur aus schwarzen und weißen Farben bestehen.
  • Grau: Es werden Bilddateien erstellt und gespeichert, die nur aus Graustufentönen bestehen.
  • Farbe: Es werden Bilddateien mit allen Originalfarben erstellt und gespeichert.
Wir raten davon ab, die Option Farbe zu wählen, da diese die Größe der gespeicherten Bilddateien erhöht und somit die Bildwiedergabe verlangsamt.
Max. Anzahl zu verarbeitender Seiten pro DateiIn diesem Feld können Sie festlegen, wie viele Seiten für jede importierte Datei OCR-verarbeitet werden sollen. So können Sie die Importzeit verkürzen und so den Importvorgang optimieren. Die letzten drei Seiten jeder importierten Datei werden immer verarbeitet, da sie normalerweise wichtige Informationen enthalten.

Beachten Sie, dass Document Capture den Dokumentenimport insgesamt auf 500 Seiten begrenzt. Dies bedeutet, dass keine Dokumente mit mehr als 500 Seiten in Document Capture importiert werden können, unabhängig davon, welchen Wert Sie in dieses Feld eingeben.
OCR SprachenIn diesem Feld können Sie alle Sprachen hinzufügen, deren Zeichensätze von Document Capture bei der OCR-Verarbeitung eingehender Belege erkannt werden sollen.

Wir empfehlen, die Anzahl der aktivierten Sprachen auf die beim Dokumentenimport am häufigsten verwendeten Sprachen zu beschränken (im Allgemeinen nur Ihre Landessprache und, falls relevant, Englisch), da die Aktivierung zu vieler Sprachen wahrscheinlich die Gesamtqualität der Texterkennung beeinträchtigt.
PDF mit eingebetteten XML-Dateien verarbeitenMit diesem Schalter können Sie den Import von XML-Dateien aktivieren, die in PDFs eingebettet sind (z. B. ZUGFeRD, Factur-X und XRechnung). Weitere Informationen finden Sie unter Import von PDF-Dateien mit eingebetteten XML-Dateien aktivieren (ZUGFeRD, XRechnung).

Informationen zu den übrigen anpassbaren Feldern im Inforegister OCR Verarbeitung, die sich alle auf die automatische Aufteilung von Dokumenten beziehen, finden Sie unter Dokumente automatisch aufteilen.

Siehe auch

Dokumente automatisch aufteilen