Class DocumentRecognitionSettings

DocumentRecognitionSettings class

pdf 识别设置。包含允许自定义识别过程的元素。

public class DocumentRecognitionSettings : BaseRecognitionSettings

构造函数

姓名	描述
DocumentRecognitionSettings(int, int)	初始化一个新的实例`DocumentRecognitionSettings`具有短属性集的类.
DocumentRecognitionSettings(int, int, Language, bool, bool, int)	初始化一个新的实例`DocumentRecognitionSettings`具有全套属性的类.

特性

姓名	描述
AllowedCharacters { get; set; }	允许的字符集。确定识别结果允许的字符类型。
AutoContrast { get; set; }	允许在识别前对图像使用额外的对比度校正算法。
AutoDenoising { get; set; }	允许使用额外的神经网络来改善图像 - 减少噪声。适用于具有扫描伪影、失真、斑点、光斑、渐变、外来元素的图像。
AutoSkew { set; }	获取或设置一个标志，指示是否应启用自动图像倾斜校正。默认启用 (true)。
DetectAreasMode { get; set; }	允许为文档类型区域选择最佳模式：文档、照片、纯文本、列、图像。
IgnoredCharacters { get; set; }	为识别符号设置黑名单。
Language { set; }	获取或设置用于 OCR 的语言。确定识别时使用的字母表。默认为多语言。
LinesFiltration { get; set; }	允许识别表格中的文本（区域包围线）。
PagesNumber { get; set; }	设置识别多页pdf文件的页数.
PreprocessingFilters { get; set; }	允许通过调整预处理方法为 OCR 准备图像。
SkewAngle { set; }	获取或设置图像旋转的角度（以度为单位）。设置该值将禁用`AutoSkew`属性，以便不应用自动倾斜校正。默认为零。
StartPage { get; set; }	设置识别第一页。
ThreadsCount { set; }	获取或设置用于处理的线程数。默认情况下，0 表示将使用等于处理器数量的线程数处理图像。 ThreadsCount = 1 表示将在主线程中处理图像。
ThresholdValue { set; }	获取或设置图像二值化的自定义阈值。范围从 1 到 255.
UpscaleSmallFont { get; set; }	允许您使用专门用于小字体识别的附加算法。对于具有小尺寸字符的图像很有用。

也可以看看

Enum DetectAreasMode Class IDCardRecognitionSettings