Visit

Visit(Page)

提取指定页面上的文本

public virtual void Visit(Page page)
范围类型描述
pagePagePdf pocument 页面对象。

例子

该示例演示了如何在 PDF 文档的第一个页面上提取文本。

// 打开文档
Document doc = new Document(inFile);

// 创建 TextAbsorber 对象以提取文本
TextAbsorber absorber = new TextAbsorber();

// 接受所有文档页面的吸收器
absorber.Visit(doc.Pages[1]);

// 获取提取的文本
string extractedText = absorber.Text;

也可以看看


Visit(XForm)

提取指定 XForm 上的文本。

public virtual void Visit(XForm form)
范围类型描述
formXFormPdf 表单对象。

例子

该示例演示了如何在 PDF 文档的第一个页面上提取文本。

// 打开文档
Document doc = new Document(inFile);

// 创建 TextAbsorber 对象以提取文本
TextAbsorber absorber = new TextAbsorber();

// 接受所有文档页面的吸收器
absorber.Visit(doc.Pages[1].Resources.Forms["Xform1"]);

// 获取提取的文本
string extractedText = absorber.Text;

也可以看看


Visit(Document)

提取指定文档上的文本

public virtual void Visit(Document pdf)
范围类型描述
pdfDocumentPdf pocument 对象。

例子

该示例演示如何在 PDF 文档中提取文本。

// 打开文档
Document doc = new Document(inFile);

// 创建 TextAbsorber 对象以提取文本
TextAbsorber absorber = new TextAbsorber();

// 接受所有文档页面的吸收器
absorber.Visit(doc);

// 获取提取的文本
string extractedText = absorber.Text;

也可以看看