ExtractionOptions
TextAbsorber.ExtractionOptions property
获取或设置文本提取选项。
public virtual TextExtractionOptions ExtractionOptions { get; set; }
评论
允许定义文本格式模式TextExtractionOptions
在提取过程中。 默认模式是Pure
例子
该示例演示了如何设置纯文本格式模式并执行文本提取。
// 打开文档
Document doc = new Document(inFile);
// 创建 TextAbsorber 对象以提取带有格式的文本
TextAbsorber absorber = new TextAbsorber();
// 设置纯文本格式化模式
absorber.ExtractionOptions = new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Pure);
// 接受所有文档页面的吸收器
doc.Pages.Accept(absorber);
// 获取提取的文本
string extractedText = absorber.Text;
也可以看看
- class TextExtractionOptions
- class TextAbsorber
- 命名空间 Aspose.Pdf.Text
- 部件 Aspose.PDF