DocumentRecognitionSettings

DocumentRecognitionSettings class

Einstellungen für die PDF-Erkennung. Enthält Elemente, mit denen der Erkennungsprozess angepasst werden kann.

public class DocumentRecognitionSettings

Konstrukteure

Name Beschreibung
DocumentRecognitionSettings(int, int) Initialisiert eine neue Instanz vonDocumentRecognitionSettings Klasse mit kurzen Eigenschaften.
DocumentRecognitionSettings(int, int, Language, bool, bool, int) Initialisiert eine neue Instanz vonDocumentRecognitionSettings Klasse mit vollständigem Satz von Eigenschaften.

Eigenschaften

Name Beschreibung
Allowed { get; set; } Erlaubter Zeichensatz. Legt den für das Erkennungsergebnis zulässigen Zeichentyp fest.
AutoContrast { get; set; } Ermöglicht die Verwendung eines zusätzlichen Kontrastkorrekturalgorithmus für das Bild vor der Erkennung.
AutoDenoising { get; set; } Ermöglicht die Verwendung eines zusätzlichen neuronalen Netzwerks zur Verbesserung des Bildes – Reduzierung von Rauschen. Nützlich für Bilder mit Scanartefakten, Verzerrungen, Flecken, Lichtreflexen, Farbverläufen und Fremdelementen.
AutoSkew { set; } Ruft ein Flag ab oder setzt es, das angibt, ob die automatische Korrektur der Bildneigung aktiviert werden soll. Standardmäßig aktiviert (true).
DetectAreas { set; } Ruft ein Flag ab oder setzt es, das angibt, ob die automatische Erkennung von Textbereichen aktiviert werden soll. Aktiviert das Dokumentstruktur-Erkennungsmodul. Dies erfordert mehr Zeit und Speicher, um ein Bild zu verarbeiten, liefert aber in komplexen Fällen genauere Ergebnisse. Deaktivieren (auf „false“ setzen) für eine schnellere Bildverarbeitung oder bei Bildern mit einfacher Struktur.
DetectAreasMode { get; set; } Ermöglicht die Auswahl des optimalen Modus für Dokumenttypbereiche: Dokument, Foto, einfacher Text, Spalte, Bild.
IgnoredCharacters { get; set; } Legt eine schwarze Liste für Erkennungssymbole fest.
Language { set; } Ruft die für OCR verwendete Sprache ab oder legt sie fest. Legt das während der Erkennung verwendete Alphabet fest. Standardmäßig mehrsprachig.
LinesFiltration { get; set; } Ermöglicht das Erkennen von Text in den Tabellen (Bereiche umgeben von Linien).
PagesNumber { get; set; } Legen Sie die Anzahl der Seiten für die Erkennung mehrseitiger PDF-Dateien fest.
StartPage { get; set; } Legen Sie die erste Seite für die Erkennung fest.
ThreadsCount { set; } Ruft die Anzahl der zu verarbeitenden Threads ab oder legt sie fest. Standardmäßig bedeutet 0, dass das Bild mit der Anzahl von Threads verarbeitet wird, die Ihrer Anzahl von Prozessoren entspricht. ThreadsCount = 1 bedeutet, dass das Bild im Hauptthread verarbeitet wird.
ThresholdValue { set; } Ruft einen benutzerdefinierten Schwellenwert für die Bildbinarisierung ab oder legt ihn fest. Bereich von 1 bis 255.

Siehe auch