TextFragmentAbsorber

TextFragmentAbsorber class

表示文本片段的吸收器对象。 执行文本搜索并通过以下方式访问搜索结果TextFragments集合.

public sealed class TextFragmentAbsorber : TextAbsorber

构造函数

姓名描述
TextFragmentAbsorber()初始化TextFragmentAbsorber执行文档或页面的所有文本段的搜索。
TextFragmentAbsorber(Regex)初始化TextFragmentAbsorber指定 System.Text.RegularExpressions.Regex 类对象的类。
TextFragmentAbsorber(string)初始化TextFragmentAbsorber指定文本短语的类。
TextFragmentAbsorber(TextEditOptions)初始化TextFragmentAbsorber带有文本编辑选项,执行文档或页面的所有文本段的搜索。
TextFragmentAbsorber(Regex, TextEditOptions)初始化TextFragmentAbsorber指定文本短语和文本编辑选项的类。
TextFragmentAbsorber(Regex, TextSearchOptions)初始化TextFragmentAbsorber指定文本短语和文本搜索选项的类。
TextFragmentAbsorber(string, TextEditOptions)初始化TextFragmentAbsorber指定文本短语和文本编辑选项的类。
TextFragmentAbsorber(string, TextSearchOptions)初始化TextFragmentAbsorber指定文本短语和文本搜索选项的类。
TextFragmentAbsorber(string, TextSearchOptions, TextEditOptions)初始化TextFragmentAbsorber指定文本短语、文本搜索选项和文本编辑选项的类。

特性

姓名描述
Errors { get; }列表TextExtractionError对象。它包含有关在文本提取期间发现错误的信息。 仅当 TextSearchOptions.LogTextExtractionErrors = true 时才会执行错误搜索;它可能会降低性能。
override ExtractionOptions { get; set; }获取或设置文本提取选项。
HasErrors { get; }值表示在文本提取过程中是否发现错误。 只有在 TextSearchOptions.LogTextExtractionErrors = true 时才会执行错误搜索;它可能会降低性能。
Phrase { get; set; }获取或设置短语TextFragmentAbsorber在 PDF 文档或页面上搜索。
override Text { get; }获取提取的文本TextAbsorber在 PDF 文档或页面上提取。
TextEditOptions { get; set; }获取或设置文本编辑选项。当请求的符号不能用字体写入时,选项定义特殊行为。
TextFragments { get; set; }获取出现的搜索事件的集合TextFragment对象.
TextReplaceOptions { get; set; }获取或设置文本替换选项。选项定义片段文本替换为更短/更长时的行为。
TextSearchOptions { get; set; }获取或设置搜索选项。选项启用使用正则表达式进行搜索。

方法

姓名描述
ApplyForAllFragments(float)为所有被吸收的文本片段应用字体大小。如果页面上的所有片段都被吸收,它比遍历片段更快。否则它与循环类似。
ApplyForAllFragments(Font)为所有被吸收的文本片段应用字体。如果页面上的所有片段都被吸收,它比遍历片段更快。否则它与循环类似。
ApplyForAllFragments(Font, float)为所有被吸收的文本片段应用字体和大小。如果页面上的所有片段都被吸收,它比遍历片段更快。否则它与循环类似。
RemoveAllText(Document)从文档中删除所有文本。
RemoveAllText(Page)删除指定页面中的所有文本。
RemoveAllText(Page, Rectangle)从指定页面中删除指定矩形内的文本。
Reset()清除此 TextFragments 集合TextFragmentAbsorber对象.
override Visit(Document)对指定文档执行搜索。
override Visit(Page)在指定页面上执行搜索。
Visit(XForm)对指定的表单对象执行搜索。
virtual Visit(XForm)提取指定 XForm 上的文本。

评论

TextFragmentAbsorber对象基本上用于文本搜索场景。 搜索完成后,出现的次数用TextFragment对象TextFragments集合包含. TextFragment对象提供对搜索出现文本、文本属性的访问,并允许编辑文本和更改文本状态(字体、字体大小、颜色等)。

例子

该示例演示如何在第一个 PDF 文档页面上查找文本并替换文本及其字体。

// 打开文档
Document doc = new Document(@"D:\Tests\input.pdf");

// 查找将用于更改文档文本字体的字体
Aspose.Pdf.Txt.Font font = FontRepository.FindFont("Arial");

// 创建 TextFragmentAbsorber 对象以查找所有“hello world”文本出现
TextFragmentAbsorber absorber = new TextFragmentAbsorber("hello world");

// 接受第一页的吸收器
doc.Pages[1].Accept(absorber);

// 更改第一个文本出现的文本和字体
absorber.TextFragments[1].Text = "hi world";
absorber.TextFragments[1].TextState.Font = font;

// 保存文档
doc.Save(@"D:\Tests\output.pdf");  

也可以看看