HtmlSaveOptions

HtmlSaveOptions class

保存导出为 Html 格式的选项

public class HtmlSaveOptions : UnifiedSaveOptions, IPageSetOptions, IPipelineOptions

构造函数

姓名 描述
HtmlSaveOptions() 初始化HtmlSaveOptions类.
HtmlSaveOptions(bool) 初始化HtmlSaveOptions类.
HtmlSaveOptions(HtmlDocumentType) 初始化HtmlSaveOptions类.
HtmlSaveOptions(HtmlDocumentType, bool) 初始化HtmlSaveOptions类.

特性

姓名 描述
BatchSize { get; set; } 如果批量转换适用,则定义批量大小 到源格式和目标格式对。
CloseResponse { get; set; } 获取或设置布尔值,指示在文档保存到响应后将关闭响应对象。
CompressSvgGraphicsIfAny { get; set; } 获取或设置标志,指示在保存过程中 找到的 SVG 图形(如果有)是否将被压缩(压缩) 为 SVGZ 格式
ConvertMarkedContentToLayers { get; set; } 如果属性 ConvertMarkedContentToLayers 设置为 true,则 PDF 中的所有元素被标记 内容(层)将被放入 HTML div 中,“data-pdflayer”属性指定层名称。 该层名称将从 PDF 的可选属性中提取标记的内容。 如果此属性为 false(默认情况下),则不会从 PDF 标记的内容创建任何图层。
DefaultFontName { get; set; } 指定已安装字体的名称,用于替换 任何未嵌入且未安装在系统中的文档字体。 如果为 null,则使用默认替换字体。
DocumentType { get; set; } 获取或设置HtmlDocumentType.
ExplicitListOfSavedPages { get; set; } 使用此属性您可以明确定义 应转换哪些文档页面。 此列表中的页面必须具有从1 开始的数字。即 有效页数必须取自范围 (1…[NumberOfPagesInConvertedDocument]) 此列表中页面出现的顺序不会影响 their 结果 HTML 页面中的顺序 - 结果页面中的所有内容都会按顺序排列其中 出现在源 PDF 中。 如果此列表为空(默认情况下),所有页面都将被转换。 如果此列表的任何页码超出当前页面的范围(1-[ amountOfPagesInDocument]) 异常将被抛出。
ExtractOcrSublayerOnly { get; set; } 这个属性开启了为带有 OCR 子层的 PDF 文档提取图像或文本 的功能。
FixedLayout { get; set; } 获取或设置一个值,该值指示该 HTML 是否创建为固定布局。
FlowLayoutParagraphFullWidth { get; set; } 该属性指定Flow模式的全宽段落文本,FixedLayout = false
FontSources { get; } 预存字体的字体来源。
ImageResolution { get; set; } 获取或设置图像渲染的分辨率。
MinimalLineWidth { get; set; } 此属性设置图形路径线的最小宽度。 如果线的粗细小于 1 像素,Adobe Acrobat 会将其四舍五入到此值。所以这个属性可以 用来模拟HTML浏览器的这种行为。
PreventGlyphsGrouping { get; set; } 该属性开启文本字形不会被分组为单词和字符串的模式 该模式允许在页面上定位字形时保持最大精度,它可以 用于转换带有音符或字形的文档,应该单独放置 只有当 FixedLayout 属性的值为 true 时,此参数才会应用于文档。
RenderTextAsImage { get; set; } 如果属性 RenderTextAsImage 设置为 true,则来自源的文本将变为 HTML 中的图像。 可能有助于使文本无法选择 或 HTML 文本无法正确呈现。
SaveFormat { get; } 数据保存的格式。
SimpleTextboxModeGrouping { get; set; } 此属性指定字形和单词的顺序分组为字符串 例如标签和单词在转换后的 HTML 中具有不同的顺序,您希望它们匹配。 只有当 FixedLayout 属性的值为 true 时,此参数才会应用于文档。
SplitCssIntoPages { get; set; } 选择多页模式时(即 ‘SplitIntoPages’ 为 ’true’), 则此属性定义是否应为每个结果 HTML 页面创建单独的 CSS-file 。 默认情况下此属性为 false,因此,将创建一个 所有创建页面的大通用 CSS。在此模式下生成的所有 CSS 的摘要大小(每页一个 CSS)通常 比一个大 CSS 文件的大小大得多,因为在前一种情况下, CSS 类在这种情况下在每个页面的多个 CSS 文件中是重复的。 所以,这设置更糟糕,只有在您对以后单独处理每个 HTML 页面感兴趣 时才使用,因此每个页面拆开的 CSS 的 size 是最关键的问题。
SplitIntoPages { get; set; } 获取或设置标志,指示是否将源 文档的每一页转换为它自己的目标HTML文档, 即是否将结果HTML拆分为多个HTML页面。
UseZOrder { get; set; } 如果属性 UseZORder 设置为 true,则图形和文本将添加到生成的 HTML 文档 相应地在原始 PDF 文档中的 Z 顺序。如果此属性为 false,则所有图形都将 作为单层放置,这可能会对重叠对象造成一些不必要的影响。
WarningHandler { get; set; } 回调以处理生成的任何警告。 WarningHandler 返回指定 Continue 或 Abort 的 ReturnAction 枚举项。 Continue 是默认操作,Save 操作继续,但是用户也可以返回 Abort,在这种情况下 Save 操作应该停止。

字段

姓名 描述
AntialiasingProcessing 此参数定义在将复合背景图像从 PDF 转换为 HTML 期间所需的抗锯齿措施
CssClassNamesPrefix PDFtoHTML 转换器生成结果 CSS 时,会生成 CSS 类名 (类似于“.stl_01 {}” …“.stl_NN {}) 并用于结果 CSS。此属性允许强制设置类名 prefix 例如,如果您希望所有类名都以 ‘my_prefix_’ 开头(即类似于 ‘my_prefix_1’ … ‘my_prefix_NNN’ ), 然后在转换之前将 ‘my_prefix_’ 分配给此属性。 如果此属性保持不变(即 null将保留为 value ),then 转换器将自己生成类名 (它将类似于 “.stl_01 {}” … “.stl_NN {}”)
CustomCssSavingStrategy 此字段可以包含保存策略 必须在转换 的 Pdf 到 Html 期间使用(如果存在)用于处理将 CSS 相关的 保存到创建的 HTML 文档作为整个或它的页面(如果生成多个 HTML 页面) 如果你想要以某种特定的方式处理 CSS 文件,只需创建相关的方法并 将由它创建的委托分配给该属性。
CustomHtmlSavingStrategy 转换结果可以包含一个或多个 HTML 页面 您可以分配给从自定义方法创建的属性委托,该方法实现一个 HTML 页面的处理是在转换期间创建的。 在这种情况下,可以在该自定义代码中进行处理(例如将页面的 HTML 保存在流或磁盘中)。 在这种情况下,必须在提供的方法代码中执行保存 HTML 页面的所有必要操作 ,因为将不使用转换器代码中的结果保存。 如果出于某种原因必须由转换器的代码本身来处理这种或那种情况, 不在自定义代码中,请在“htmlSavingInfo”参数变量的自定义代码标志“CustomProcessingCancelled” 中设置:它将向转换器发出信号,表明所有处理该资源的必要 步骤必须在转换器本身中以与 相同的方式完成,就好像没有任何用于处理的外部自定义代码一样。
CustomProgressHandler 此处理程序可用于处理转换进度事件 fe 它可用于显示进度条或有关当前已处理页面数量 的消息,在控制台上显示进度的处理程序代码示例是:
CustomResourceSavingStrategy 此字段可以包含保存策略 必须在转换期间使用(如果存在)表示在生成的 HTML 中保存的资源 的理想 URL。
CustomStrategyOfCssUrlCreation 此字段可以包含自定义方法,返回 URL(或 URL 模板,如果多页生成已开启 - 请参阅下面的详细信息)的主题 CSS,因为它应该放在生成的结果 HTML 中。 Fe 如果您想要转换器放置一些特定的 URL 而不是标准 CSS 文件名到生成的 CSS 中,然后您应该创建并放入生成所需 URL 的这个属性 method 。 string that (在使用转换器内的 string.Format() 函数替换占位符后)可以解析为这个或那个页面的 CSS URL 的 URL。 在这种情况下预期返回字符串的示例是: ‘SomeTargetLocation-page_{0}.css’,’../PartHandlers/GetCss.aspx?DocumentId=45654&CssPage={0}’)
ExcludeFontNameList 未嵌入 HTML 的 PDF 嵌入字体名称列表。
FontEncodingStrategy 定义编码特殊规则以调整当前文档的 PDF 解码
FontSavingMode 定义在将 PDF 保存为所需格式期间将使用的字体保存模式
HtmlMarkupGenerationMode 有时会出现生成 HTML 标记的特定要求。 此参数定义在将 PDF 转换为 HTML 期间可以使用的 HTML 准备模式 以匹配此类特定要求。
LettersPositioningMethod 在结果 HTML 中设置单词中字母的定位模式
PageBorderIfAny 此属性表示用于在代表源 PDF 页面的区域周围绘制结果 HTML 文档中的边框(如果有) 的设置集。 本质上它涉及显示页面的纸张边缘, 不是 PDF 页面本身引用的页面边框。
PageMarginIfAny 此属性表示结果 HTML 文档中代表源 PDF 页面的区域周围的一组额外页边距(如果有) 。
PagesFlowTypeDependsOnViewersScreenSize 如果属性“SplitOnPages=false”,那么代表所有输入 PDF 页面的整个 HTML 将被 放入一个大的结果 HTML 文件中。 此标志定义结果 HTML 是否将以这样的方式生成 以使在结果 HTML 中表示 PDF 页面的区域流将取决于 查看器的屏幕分辨率。 假设查看器一侧的屏幕宽度足够大,可以在水平方向上放置 2 个或更多页面,其中一个靠近 other。如果这个标志设置为真,那么这个机会 将被使用(尽可能多的页面将在水平方向上显示在另一个 附近,然后下一组水平页面将显示在第一个下方)。 否则页面将流入这样:下一页总是在前一页之下。
PartsEmbeddingMode 它定义引用的文件(HTML、字体、图像、CSSes) 是嵌入到主 HTML 文件中还是生成为单独的二进制实体
RasterImagesSavingMode 转换后的 PDF 可以包含光栅图像 此参数定义在将 PDF 转换为 HTML 期间应如何处理它们
RemoveEmptyAreasOnTopAndBottom 定义是否在创建的 HTML 中删除顶部和底部的空白区域,没有任何内容(如果有)。
SaveFullFont 表示将保存完整字体,仅支持 True Type 字体。 默认情况下 SaveFullFont = false 并且转换器保存显示文档文本所需的初始字体 的子集。
SaveShadowedTextsAsTransparentTexts Pdf 可以包含被其他元素遮蔽的文本(fe by images),但 可以在 Acrobat Reader 中选择到剪贴板(通常在文档包含从中提取的图像和 OCRed 文本时发生)。 此设置告诉转换器我们是否需要在结果 HTML 中将此类文本保存为 transparent 可选文本以模仿 Acrobat Reader 的行为(否则此类文本通常保存为隐藏,不可复制到剪贴板)
SaveTransparentTexts Pdf 可以包含可以选择到剪贴板的透明文本(通常在文档包含从中提取的图像和 OCRed 文本时发生)。 此设置告诉转换器我们是否需要将此类文本保存为透明 结果 HTML 中的可选文本
SpecialFolderForAllImages 获取或设置目录的路径,如果在将文档保存为 HTML 期间遇到 ,则必须将任何图像保存到该目录。如果参数为空或 null ,则图像文件(如果有)将与链接到 HTML 的其他文件一起保存,如果 CustomImageSavingStrategy 属性成功用于处理相关图像文件,则不会影响任何内容。
SpecialFolderForSvgImages 获取或设置目录的路径,如果在将文档保存为 HTML 期间遇到 ,则必须仅将 SVG 图像保存到该目录。如果参数为空或 null ,则 SVG 文件(如果有)将与其他图像文件(靠近输出文件) 或图像的特殊文件夹(如果在 SpecialImagesFolderIfAny 选项中指定)一起保存。 它不会影响任何东西如果 CustomImageSavingStrategy 属性成功用于处理相关图像文件。
TryMergeAdjacentSameBackgroundImages 有时 PDF 包含(页面或表格单元格的)背景图像 由多个相同的平铺背景图像构成,彼此相邻。 在这种情况下,目标格式的渲染器(对于 DOCS 格式的 Fe MsWord)有时会在部分背景图像之间生成 可见边界, 因为他们的图像边缘平滑(抗锯齿)技术与 Acrobat Reader 不同。 如果导出的文档看起来在相同背景图像的 部分之间包含这样的可见边界,请尝试使用此设置来消除 不想要的效果。 注意!这种质量优化通常会减慢转换速度, 所以,请仅在真正需要时使用此选项。
TrySaveTextUnderliningAndStrikeoutingInCss PDF 本身不包含文本的下划线标记。它使用位于 text. 下的行进行模拟

也可以看看