DocumentRecognitionSettings

DocumentRecognitionSettings class

Paramètres pour la reconnaissance pdf. Contient des éléments qui permettent de personnaliser le processus de reconnaissance.

public class DocumentRecognitionSettings

Constructeurs

Nom La description
DocumentRecognitionSettings(int, int) Initialise une nouvelle instance duDocumentRecognitionSettings classe avec un ensemble court de propriétés.
DocumentRecognitionSettings(int, int, Language, bool, bool, int) Initialise une nouvelle instance duDocumentRecognitionSettings classe avec un ensemble complet de propriétés.

Propriétés

Nom La description
Allowed { get; set; } Jeu de caractères autorisés. Détermine le type de caractères autorisés pour le résultat de la reconnaissance.
AutoContrast { get; set; } Permet d’utiliser un algorithme de correction de contraste supplémentaire pour l’image avant la reconnaissance.
AutoDenoising { get; set; } Permet l’utilisation d’un réseau de neurones supplémentaire pour améliorer l’image - réduire le bruit. Utile pour les images avec des artefacts de numérisation, des distorsions, des taches, des reflets, des dégradés, des éléments étrangers.
AutoSkew { set; } Obtient ou définit un indicateur indiquant si la correction automatique de l’inclinaison de l’image doit être activée. Activé (true) par défaut.
DetectAreas { set; } Obtient ou définit un indicateur indiquant si la détection automatique des zones de texte doit être activée. Active le module de reconnaissance de la structure du document. Cela prend plus de temps et de mémoire pour traiter une image, mais fournit des résultats plus précis sur les cas complexes. Désactiver (réglé sur faux) pour un traitement d’image plus rapide ou en cas d’images avec une structure simple.
DetectAreasMode { get; set; } Permet de sélectionner le mode optimal pour les zones de type document : document, photo, texte brut, colonne, image.
IgnoredCharacters { get; set; } Définit la liste noire des symboles de reconnaissance.
Language { set; } Obtient ou définit la langue utilisée pour l’OCR. Détermine l’alphabet utilisé lors de la reconnaissance. Multi-langue par défaut.
LinesFiltration { get; set; } Permet de reconnaître du texte dans les tableaux (régions entourées de lignes).
PagesNumber { get; set; } Définir le nombre de pages pour le fichier pdf multipage de reconnaissance.
StartPage { get; set; } Définir la première page pour la reconnaissance.
ThreadsCount { set; } Obtient ou définit le nombre de threads à traiter. Par défaut, 0 signifie que l’image sera traitée avec un nombre de threads égal à votre nombre de processeurs. ThreadsCount = 1 signifie que l’image sera traitée dans le thread principal.
ThresholdValue { set; } Obtient ou définit une valeur de seuil personnalisée pour la binarisation de l’image. Plage de 1 à 255.

Voir également