ExtractionOptions

TextAbsorber.ExtractionOptions property

获取或设置文本提取选项。

public virtual TextExtractionOptions ExtractionOptions { get; set; }

评论

允许定义文本格式模式TextExtractionOptions在提取过程中。 默认模式是Pure

例子

该示例演示了如何设置纯文本格式模式并执行文本提取。

// 打开文档
Document doc = new Document(inFile);

// 创建 TextAbsorber 对象以提取带有格式的文本
TextAbsorber absorber = new TextAbsorber();

// 设置纯文本格式化模式
absorber.ExtractionOptions = new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Pure);

// 接受所有文档页面的吸收器
doc.Pages.Accept(absorber);

// 获取提取的文本
string extractedText = absorber.Text;

也可以看看