DocSaveOptions

DocSaveOptions class

保存导出为文档格式的选项

public class DocSaveOptions : UnifiedSaveOptions, IPipelineOptions

构造函数

姓名 描述
DocSaveOptions() 默认构造函数。

特性

姓名 描述
AddReturnToLineEnd { get; set; } 使用段落或换行符
BatchSize { get; set; } 如果批量转换适用,则定义批量大小 到源格式和目标格式对。
CloseResponse { get; set; } 获取或设置布尔值,指示在文档保存到响应后将关闭响应对象。
ExtractOcrSublayerOnly { get; set; } 这个属性开启了为带有 OCR 子层的 PDF 文档提取图像或文本 的功能。
Format { get; set; } 输出格式
ImageResolutionX { get; set; } 转换后的图像 X 分辨率。
ImageResolutionY { get; set; } 转换后的图像 Y 分辨率。
MaxDistanceBetweenTextLines { get; set; } 此参数用于将文本行分组为段落。 确定两个相对文本行可以相隔多远。指定文本行高度的百分之百。
MemorySaveModePath { get; set; } 定义保存路径(文件名或目录名) 在内存节省模式下转换时的临时数据。
Mode { get; set; } 识别模式。
RecognizeBullets { get; set; } 开启子弹识别功能
RelativeHorizontalProximity { get; set; } 在 Pdf 中,单词可以通过独立打印其字母或音节来打印 words 的运算符进行内部表示。因此,为了检测单词,有时我们需要检测实际上是单词的独立字符的 groups 。 此设置定义文本元素(字母、音节)之间的空间宽度 ,在识别源 PDF 中的单词期间必须将其视为单词之间的距离. (至少在字母之间存在这个宽度的空格意味着 文本元素属于不同的单词)。 它的字体大小是规范的 - 1.0 表示假定单词的字体大小的 100%。 注意!它仅在某些情况下使用当源 PDF 包含特定的很少使用的 fonts 时,无法从字体计算出最佳值。 因此,在绝大多数情况下,此参数不会改变结果文档中的任何内容。
SaveFormat { get; } 数据保存的格式。
WarningHandler { get; set; } 回调以处理生成的任何警告。 WarningHandler 返回指定 Continue 或 Abort 的 ReturnAction 枚举项。 Continue 是默认操作,Save 操作继续,但是用户也可以返回 Abort,在这种情况下 Save 操作应该停止。

字段

姓名 描述
CustomProgressHandler 此处理程序可用于处理转换进度事件 fe 它可用于显示进度条或有关当前已处理页面数量 的消息,在控制台上显示进度的处理程序代码示例是:
TryMergeAdjacentSameBackgroundImages 有时 PDF 包含(页面或表格单元格的)背景图像 由多个相同的平铺背景图像构成,彼此相邻。 在这种情况下,目标格式的渲染器(对于 DOCS 格式的 Fe MsWord)有时会在部分背景图像之间生成 可见边界, 因为他们的图像边缘平滑(抗锯齿)技术与 Acrobat Reader 不同。 如果导出的文档看起来在相同背景图像的 部分之间包含这样的可见边界,请尝试使用此设置来消除 不想要的效果。 注意!这种质量优化通常会减慢转换速度, 所以,请仅在真正需要时使用此选项。

也可以看看