TextAbsorber.Visit

Visit(Page)

提取指定页面上的文本

public virtual void Visit(Page page)
参数类型描述
pagePagePdf 文档页面对象。

示例

该示例演示如何提取第一个 PDF 文档页面上的文本。

// open document
Document doc = new Document(inFile);

// create TextAbsorber object to extract text
TextAbsorber absorber = new TextAbsorber();

// accept the absorber for all document's pages
absorber.Visit(doc.Pages[1]);

// get the extracted text
string extractedText = absorber.Text;

另请参见


Visit(XForm)

提取指定 XForm 上的文本。

public virtual void Visit(XForm form)
参数类型描述
formXFormPdf 表单对象。

示例

该示例演示如何提取第一个 PDF 文档页面上的文本。

// open document
Document doc = new Document(inFile);

// create TextAbsorber object to extract text
TextAbsorber absorber = new TextAbsorber();

// accept the absorber for all document's pages
absorber.Visit(doc.Pages[1].Resources.Forms["Xform1"]);

// get the extracted text
string extractedText = absorber.Text;

另请参见


Visit(Document)

提取指定文档上的文本

public virtual void Visit(Document pdf)
参数类型描述
pdfDocumentPdf 文档对象。

示例

该示例演示如何提取 PDF 文档上的文本。

// open document
Document doc = new Document(inFile);

// create TextAbsorber object to extract text
TextAbsorber absorber = new TextAbsorber();

// accept the absorber for all document's pages
absorber.Visit(doc);

// get the extracted text
string extractedText = absorber.Text;

另请参见