TextExtractor

遗产: java.lang.Object, com.aspose.pdf.groupprocessor.IVentureLicenseTarget

所有已实现的接口: com.aspose.pdf.groupprocessor.interfaces.IPdfTypeExtractor

public final class TextExtractor extends IVentureLicenseTarget implements IPdfTypeExtractor

表示与提取器交互的实例。

构造函数

构造函数描述
TextExtractor()创建 TextExtractor 实例。

领域

场地描述
_numberedPages

方法

方法描述
buildProperties(ByteRange range, PdfTreeNode parentNode)构建包含所有 pdf 参数及其值的节点树。
buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)构建包含所有 pdf 参数及其值的节点树。
close()关闭此实例使用的所有资源。
dispose()Dispose object 此方法已过时,请改用 close()。
equals(Object arg0)
extractAllText()从文档中提取文本
extractAllTextInternal()
extractPageText(int pageNumber)从页面中提取文本
getClass()
getPageCount()获取文档中的页数。
getVentureLicense()
getVersion()仅供内部使用
hashCode()
initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)初始化 TextExtractor 实例。
initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)初始化 TextExtractor 实例。
initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)初始化 TextExtractor 实例。
initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)初始化 TextExtractor 实例。
initializeAlternative(System.IO.Stream pdfDocumentStream)初始化 TextExtractor 实例。
initializeAlternative(System.IO.Stream pdfDocumentStream, String password)初始化 TextExtractor 实例。
initializeAlternative(String pdfDocumentPath)初始化 TextExtractor 实例。
initializeAlternative(String pdfDocumentPath, String password)初始化 TextExtractor 实例。
isFastExtractionUsed()如果使用快速提取,则返回 TRUE
notify()
notifyAll()
setVentureLicense(VentureLicense license)
toString()
wait()
wait(long arg0)
wait(long arg0, int arg1)

TextExtractor()

public TextExtractor()

创建 TextExtractor 实例。

_numberedPages

public final System.Collections.Generic.Dictionary<Integer,Page> _numberedPages

buildProperties(ByteRange range, PdfTreeNode parentNode)

public long buildProperties(ByteRange range, PdfTreeNode parentNode)

构建包含所有 pdf 参数及其值的节点树。

参数:

范围类型描述
rangecom.aspose.pdf.groupprocessor.ByteRange解析参数的字节范围。
parentNodecom.aspose.pdf.groupprocessor.PdfTreeNode用于构建树的初始(根)节点。

退货: long - long 值,已解析范围的最后一个索引。

buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)

public long buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)

构建包含所有 pdf 参数及其值的节点树。

参数:

范围类型描述
rangecom.aspose.pdf.groupprocessor.ByteRange解析参数的字节范围。
parentNodecom.aspose.pdf.groupprocessor.PdfTreeNode用于构建树的初始(根)节点。
extractJustValueboolean用于递归调用。只是表明下一个递归函数应该找到参数值而不是参数本身。

退货: long - 解析范围的最后一个索引。

close()

public void close()

关闭此实例使用的所有资源。

dispose()

public void dispose()

Dispose object 此方法已过时,请改用 close()。

equals(Object arg0)

public boolean equals(Object arg0)

参数:

范围类型描述
arg0java.lang.Object

退货: 布尔值

extractAllText()

public String[] extractAllText()

从文档中提取文本

退货: java.lang.字符串[] - 表示文档文本的字符串数组

extractAllTextInternal()

public String[] extractAllTextInternal()

退货: java.lang.字符串[]

extractPageText(int pageNumber)

public String extractPageText(int pageNumber)

从页面中提取文本

参数:

范围类型描述
pageNumberint基于 1 的页码

退货: java.lang.String - 文本

getClass()

public final native Class<?> getClass()

退货: java.lang.Class

getPageCount()

public int getPageCount()

获取文档中的页数。

退货: int - 页数

getVentureLicense()

public final VentureLicense getVentureLicense()

退货: VentureLicense

getVersion()

public String getVersion()

仅供内部使用

退货: java.lang.String - 字符串对象

hashCode()

public native int hashCode()

退货: 整数

initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)

public void initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentStreamcom.aspose.ms.System.IO.Stream包含 pdf 文档的流。
bufferSizeint可以保存在内存中的最大内容大小(以字节为单位)。
allowAsyncInitializationboolean允许资源的异步初始化。

initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)

public void initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentStreamcom.aspose.ms.System.IO.Stream包含 pdf 文档的流。
passwordjava.lang.String文档密码。
bufferSizeint可以保存在内存中的最大内容大小(以字节为单位)。
allowAsyncInitializationboolean允许资源的异步初始化。

initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)

public void initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentPathjava.lang.Stringpdf 文档的路径。
bufferSizeint可以保存在内存中的最大内容大小(以字节为单位)。
allowAsyncInitializationboolean允许资源的异步初始化。

initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)

public void initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentPathjava.lang.Stringpdf 文档的路径。
passwordjava.lang.String文档密码。
bufferSizeint可以保存在内存中的最大内容大小(以字节为单位)。
allowAsyncInitializationboolean允许资源的异步初始化。

initializeAlternative(System.IO.Stream pdfDocumentStream)

public void initializeAlternative(System.IO.Stream pdfDocumentStream)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentStreamcom.aspose.ms.System.IO.Stream包含 pdf 文档的流。

initializeAlternative(System.IO.Stream pdfDocumentStream, String password)

public void initializeAlternative(System.IO.Stream pdfDocumentStream, String password)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentStreamcom.aspose.ms.System.IO.Stream包含 pdf 文档的流。
passwordjava.lang.String

initializeAlternative(String pdfDocumentPath)

public void initializeAlternative(String pdfDocumentPath)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentPathjava.lang.Stringpdf 文档的路径。

initializeAlternative(String pdfDocumentPath, String password)

public void initializeAlternative(String pdfDocumentPath, String password)

初始化 TextExtractor 实例。

参数:

范围类型描述
pdfDocumentPathjava.lang.Stringpdf 文档的路径。
passwordjava.lang.String

isFastExtractionUsed()

public boolean isFastExtractionUsed()

如果使用快速提取,则返回 TRUE

退货: boolean - 布尔值

notify()

public final native void notify()

notifyAll()

public final native void notifyAll()

setVentureLicense(VentureLicense license)

public final void setVentureLicense(VentureLicense license)

参数:

范围类型描述
licenseVentureLicense

toString()

public String toString()

退货: java.lang.字符串

wait()

public final void wait()

wait(long arg0)

public final native void wait(long arg0)

参数:

范围类型描述
arg0long

wait(long arg0, int arg1)

public final void wait(long arg0, int arg1)

参数:

范围类型描述
arg0long
arg1int