DocumentRecognitionSettings

DocumentRecognitionSettings class

Inställningar för pdf-igenkänning. Innehåller element som gör det möjligt att anpassa igenkänningsprocessen.

public class DocumentRecognitionSettings

Konstruktörer

namn Beskrivning
DocumentRecognitionSettings(int, int) Initierar en ny instans avDocumentRecognitionSettings klass med kort uppsättning egenskaper.
DocumentRecognitionSettings(int, int, Language, bool, bool, int) Initierar en ny instans avDocumentRecognitionSettings klass med fullständig uppsättning egenskaper.

Egenskaper

namn Beskrivning
Allowed { get; set; } Tillåtna teckenuppsättningar. Bestämmer vilken typ av tecken som tillåts för igenkänningsresultat.
AutoContrast { get; set; } Gör det möjligt att använda en extra kontrastkorrigeringsalgoritm för bilden före igenkänning.
AutoDenoising { get; set; } Möjliggör användningen av ytterligare ett neuralt nätverk för att förbättra bilden - reducera brus. Användbart för bilder med skanningsartefakter, distorsion, fläckar, flare, gradienter, främmande element.
AutoSkew { set; } Hämtar eller ställer in en flagga som indikerar om automatisk snedställningskorrigering ska vara aktiverad. Aktiverad (true) som standard.
DetectAreas { set; } Hämtar eller ställer in en flagga som indikerar om automatisk detektering av textområden ska vara aktiverad. Aktiverar modulen för igenkänning av dokumentstruktur. Detta tar mer tid och minne för att bearbeta en bild, men ger mer exakta resultat i komplexa fall. Inaktivera (ställ in på false) för snabbare bildbehandling eller vid bilder med enkel struktur.
DetectAreasMode { get; set; } Gör det möjligt att välja det optimala läget för dokumenttypområden: dokument, foto, vanlig text, kolumn, bild.
IgnoredCharacters { get; set; } Ställer in svartlista för igenkänningssymboler.
Language { set; } Hämtar eller ställer in språket som används för OCR. Bestämmer alfabetet som används under igenkänning. Flerspråkigt som standard.
LinesFiltration { get; set; } Tillåter att känna igen text i tabellerna (regioner omgivna linjer).
PagesNumber { get; set; } Ställ in antalet sidor för igenkänning av flersidig pdf-fil.
StartPage { get; set; } Ställ in första sidan för igenkänning.
ThreadsCount { set; } Hämtar eller ställer in antalet trådar för bearbetning. Som standard betyder 0 att bilden kommer att bearbetas med antalet trådar lika med ditt antal processorer. ThreadsCount = 1 betyder att bilden kommer att bearbetas i huvudtråden.
ThresholdValue { set; } Hämtar eller ställer in anpassat tröskelvärde för bildbinarisering. Intervall från 1 till 255.

Se även