DocumentRecognitionSettings

DocumentRecognitionSettings class

Настройки для распознавания pdf. Содержит элементы, позволяющие настроить процесс распознавания.

public class DocumentRecognitionSettings

Конструкторы

Имя Описание
DocumentRecognitionSettings(int, int) Инициализирует новый экземплярDocumentRecognitionSettings класс с коротким набором свойств.
DocumentRecognitionSettings(int, int, Language, bool, bool, int) Инициализирует новый экземплярDocumentRecognitionSettings класс с полным набором свойств.

Характеристики

Имя Описание
Allowed { get; set; } Установлены допустимые символы. Определяет тип символов, разрешенных для результата распознавания.
AutoContrast { get; set; } Позволяет использовать дополнительный алгоритм коррекции контраста изображения перед распознаванием.
AutoDenoising { get; set; } Позволяет использовать дополнительную нейронную сеть для улучшения изображения — уменьшения шума. Полезно для изображений с артефактами сканирования, искажениями, пятнами, бликами, градиентами, посторонними элементами.
AutoSkew { set; } Получает или задает флаг, указывающий, следует ли включить автоматическую коррекцию перекоса изображения. Включено (true) по умолчанию.
DetectAreas { set; } Получает или задает флаг, указывающий, следует ли включить автоматическое обнаружение текстовых областей. Включает модуль распознавания структуры документа. Это требует больше времени и памяти для обработки изображения, , но обеспечивает более точные результаты в сложных случаях. Отключите (установите значение false) для более быстрой обработки изображения или в случае изображений с простой структурой.
DetectAreasMode { get; set; } Позволяет выбрать оптимальный режим для областей типа документа: документ, фотография, обычный текст, столбец, изображение.
IgnoredCharacters { get; set; } Устанавливает черный список для символов распознавания.
Language { set; } Получает или задает язык, используемый для OCR. Определяет алфавит, используемый при распознавании. Многоязычный по умолчанию.
LinesFiltration { get; set; } Позволяет распознавать текст в таблицах (области, окруженные строками).
PagesNumber { get; set; } Установить количество страниц для распознавания многостраничного файла pdf.
StartPage { get; set; } Установить первую страницу для распознавания.
ThreadsCount { set; } Получает или задает количество потоков для обработки. По умолчанию 0 означает, что изображение будет обрабатываться количеством потоков, равным количеству ваших процессоров. ThreadsCount = 1 означает, что изображение будет обрабатываться в основном потоке.
ThresholdValue { set; } Получает или задает пользовательское пороговое значение для бинаризации изображения. Диапазон значений от 1 до 255.

Смотрите также