TextExtractor

Наследование: java.lang.Object, com.aspose.pdf.groupprocessor.IVentureLicenseTarget

Все реализованные интерфейсы: com.aspose.pdf.groupprocessor.interfaces.IPdfTypeExtractor

public final class TextExtractor extends IVentureLicenseTarget implements IPdfTypeExtractor

Представляет экземпляр для взаимодействия с экстрактором.

Конструкторы

КонструкторОписание
TextExtractor()Создает экземпляр TextExtractor.

Поля

ПолеОписание
_numberedPages

Методы

МетодОписание
buildProperties(ByteRange range, PdfTreeNode parentNode)Строит дерево узлов, содержащих все параметры pdf с их значениями.
buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)Строит дерево узлов, содержащих все параметры pdf с их значениями.
close()Закрывает все ресурсы, используемые этим экземпляром.
dispose()Dispose object Этот метод устарел, вместо него используйте close().
equals(Object arg0)
extractAllText()Извлекает текст из документа
extractAllTextInternal()
extractPageText(int pageNumber)Извлекает текст со страницы
getClass()
getPageCount()Получает количество страниц в документе.
getVentureLicense()
getVersion()Только для внутреннего использования
hashCode()
initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)Инициализирует экземпляр TextExtractor.
initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)Инициализирует экземпляр TextExtractor.
initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)Инициализирует экземпляр TextExtractor.
initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)Инициализирует экземпляр TextExtractor.
initializeAlternative(System.IO.Stream pdfDocumentStream)Инициализирует экземпляр TextExtractor.
initializeAlternative(System.IO.Stream pdfDocumentStream, String password)Инициализирует экземпляр TextExtractor.
initializeAlternative(String pdfDocumentPath)Инициализирует экземпляр TextExtractor.
initializeAlternative(String pdfDocumentPath, String password)Инициализирует экземпляр TextExtractor.
isFastExtractionUsed()Возвращает TRUE, если использовалось быстрое извлечение
notify()
notifyAll()
setVentureLicense(VentureLicense license)
toString()
wait()
wait(long arg0)
wait(long arg0, int arg1)

TextExtractor()

public TextExtractor()

Создает экземпляр TextExtractor.

_numberedPages

public final System.Collections.Generic.Dictionary<Integer,Page> _numberedPages

buildProperties(ByteRange range, PdfTreeNode parentNode)

public long buildProperties(ByteRange range, PdfTreeNode parentNode)

Строит дерево узлов, содержащих все параметры pdf с их значениями.

Параметры:

ПараметрТипОписание
rangecom.aspose.pdf.groupprocessor.ByteRangeДиапазон байтов, где анализировать параметры.
parentNodecom.aspose.pdf.groupprocessor.PdfTreeNodeНачальный (корневой) узел для построения дерева.

Возвращает: long - длинное значение, последний индекс анализируемого диапазона.

buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)

public long buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)

Строит дерево узлов, содержащих все параметры pdf с их значениями.

Параметры:

ПараметрТипОписание
rangecom.aspose.pdf.groupprocessor.ByteRangeДиапазон байтов, где анализировать параметры.
parentNodecom.aspose.pdf.groupprocessor.PdfTreeNodeНачальный (корневой) узел для построения дерева.
extractJustValuebooleanДля рекурсивного вызова. Просто показывает, что следующая рекурсивная функция должна найти значение параметра, но не сам параметр.

Возвращает: long — последний индекс анализируемого диапазона.

close()

public void close()

Закрывает все ресурсы, используемые этим экземпляром.

dispose()

public void dispose()

Dispose object Этот метод устарел, вместо него используйте close().

equals(Object arg0)

public boolean equals(Object arg0)

Параметры:

ПараметрТипОписание
arg0java.lang.Object

Возвращает: логический

extractAllText()

public String[] extractAllText()

Извлекает текст из документа

Возвращает: java.lang.String[] — массив строк, представляющих текст документа

extractAllTextInternal()

public String[] extractAllTextInternal()

Возвращает: java.lang.String[]

extractPageText(int pageNumber)

public String extractPageText(int pageNumber)

Извлекает текст со страницы

Параметры:

ПараметрТипОписание
pageNumberint1 номер страницы

Возвращает: java.lang.String — Текст

getClass()

public final native Class<?> getClass()

Возвращает: java.lang.Класс

getPageCount()

public int getPageCount()

Получает количество страниц в документе.

Возвращает: int - количество страниц

getVentureLicense()

public final VentureLicense getVentureLicense()

Возвращает: VentureLicense

getVersion()

public String getVersion()

Только для внутреннего использования

Возвращает: java.lang.String — строковый объект

hashCode()

public native int hashCode()

Возвращает: инт

initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)

public void initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentStreamcom.aspose.ms.System.IO.StreamПоток, содержащий PDF-документ.
bufferSizeintМаксимальный размер содержимого в байтах, которое может храниться в памяти.
allowAsyncInitializationbooleanРазрешает асинхронную инициализацию ресурсов.

initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)

public void initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentStreamcom.aspose.ms.System.IO.StreamПоток, содержащий PDF-документ.
passwordjava.lang.StringПароль документа.
bufferSizeintМаксимальный размер содержимого в байтах, которое может храниться в памяти.
allowAsyncInitializationbooleanРазрешает асинхронную инициализацию ресурсов.

initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)

public void initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentPathjava.lang.StringПуть к pdf-документу.
bufferSizeintМаксимальный размер содержимого в байтах, которое может храниться в памяти.
allowAsyncInitializationbooleanРазрешает асинхронную инициализацию ресурсов.

initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)

public void initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentPathjava.lang.StringПуть к pdf-документу.
passwordjava.lang.StringПароль документа.
bufferSizeintМаксимальный размер содержимого в байтах, которое может храниться в памяти.
allowAsyncInitializationbooleanРазрешает асинхронную инициализацию ресурсов.

initializeAlternative(System.IO.Stream pdfDocumentStream)

public void initializeAlternative(System.IO.Stream pdfDocumentStream)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentStreamcom.aspose.ms.System.IO.StreamПоток, содержащий PDF-документ.

initializeAlternative(System.IO.Stream pdfDocumentStream, String password)

public void initializeAlternative(System.IO.Stream pdfDocumentStream, String password)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentStreamcom.aspose.ms.System.IO.StreamПоток, содержащий PDF-документ.
passwordjava.lang.String

initializeAlternative(String pdfDocumentPath)

public void initializeAlternative(String pdfDocumentPath)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentPathjava.lang.StringПуть к pdf-документу.

initializeAlternative(String pdfDocumentPath, String password)

public void initializeAlternative(String pdfDocumentPath, String password)

Инициализирует экземпляр TextExtractor.

Параметры:

ПараметрТипОписание
pdfDocumentPathjava.lang.StringПуть к pdf-документу.
passwordjava.lang.String

isFastExtractionUsed()

public boolean isFastExtractionUsed()

Возвращает TRUE, если использовалось быстрое извлечение

Возвращает: boolean - логическое значение

notify()

public final native void notify()

notifyAll()

public final native void notifyAll()

setVentureLicense(VentureLicense license)

public final void setVentureLicense(VentureLicense license)

Параметры:

ПараметрТипОписание
licenseVentureLicense

toString()

public String toString()

Возвращает: java.lang.String

wait()

public final void wait()

wait(long arg0)

public final native void wait(long arg0)

Параметры:

ПараметрТипОписание
arg0long

wait(long arg0, int arg1)

public final void wait(long arg0, int arg1)

Параметры:

ПараметрТипОписание
arg0long
arg1int