DocumentRecognitionSettings

DocumentRecognitionSettings class

Configuración para el reconocimiento de pdf. Contiene elementos que permiten personalizar el proceso de reconocimiento.

public class DocumentRecognitionSettings

Constructores

Nombre Descripción
DocumentRecognitionSettings(int, int) Inicializa una nueva instancia delDocumentRecognitionSettings clase con un conjunto corto de propiedades.
DocumentRecognitionSettings(int, int, Language, bool, bool, int) Inicializa una nueva instancia delDocumentRecognitionSettings clase con conjunto completo de propiedades.

Propiedades

Nombre Descripción
Allowed { get; set; } Conjunto de caracteres permitidos. Determina el tipo de caracteres permitidos para el resultado del reconocimiento.
AutoContrast { get; set; } Permite utilizar un algoritmo de corrección de contraste adicional para la imagen antes del reconocimiento.
AutoDenoising { get; set; } Permite el uso de una red neuronal adicional para mejorar la imagen: reduce el ruido. Útil para imágenes con artefactos de escaneo, distorsión, manchas, destellos, degradados, elementos extraños.
AutoSkew { set; } Obtiene o establece un indicador que indica si se debe habilitar la corrección automática de la inclinación de la imagen. Habilitado (verdadero) de forma predeterminada.
DetectAreas { set; } Obtiene o establece un indicador que indica si se debe habilitar la detección automática de áreas de texto. Habilita el módulo de reconocimiento de la estructura del documento. Esto requiere más tiempo y memoria para procesar una imagen, pero brinda resultados más precisos en casos complejos. Deshabilitar (establecer en falso) para un procesamiento de imágenes más rápido o en el caso de imágenes con una estructura simple.
DetectAreasMode { get; set; } Permite seleccionar el modo óptimo para las áreas del tipo de documento: documento, foto, texto sin formato, columna, imagen.
IgnoredCharacters { get; set; } Establece la lista negra para los símbolos de reconocimiento.
Language { set; } Obtiene o establece el idioma utilizado para OCR. Determina el alfabeto utilizado durante el reconocimiento. Multi-idioma por defecto.
LinesFiltration { get; set; } Permite reconocer texto en las tablas (regiones rodeadas de líneas).
PagesNumber { get; set; } Establezca el número de páginas para el reconocimiento de un archivo pdf de varias páginas.
StartPage { get; set; } Establecer la primera página para el reconocimiento.
ThreadsCount { set; } Obtiene o establece el número de subprocesos para procesar. De forma predeterminada, 0 significa que la imagen se procesará con un número de subprocesos igual a su número de procesadores. ThreadsCount = 1 significa que la imagen se procesará en el subproceso principal.
ThresholdValue { set; } Obtiene o establece un valor de umbral personalizado para la binarización de imágenes. Rango de 1 a 255.

Ver también