TextExtractor
Наследование: java.lang.Object, com.aspose.pdf.groupprocessor.IVentureLicenseTarget
Все реализованные интерфейсы: com.aspose.pdf.groupprocessor.interfaces.IPdfTypeExtractor
public final class TextExtractor extends IVentureLicenseTarget implements IPdfTypeExtractor
Представляет экземпляр для взаимодействия с экстрактором.
Конструкторы
Конструктор | Описание |
---|---|
TextExtractor() | Создает экземпляр TextExtractor. |
Поля
Поле | Описание |
---|---|
_numberedPages |
Методы
TextExtractor()
public TextExtractor()
Создает экземпляр TextExtractor.
_numberedPages
public final System.Collections.Generic.Dictionary<Integer,Page> _numberedPages
buildProperties(ByteRange range, PdfTreeNode parentNode)
public long buildProperties(ByteRange range, PdfTreeNode parentNode)
Строит дерево узлов, содержащих все параметры pdf с их значениями.
Параметры:
Параметр | Тип | Описание |
---|---|---|
range | com.aspose.pdf.groupprocessor.ByteRange | Диапазон байтов, где анализировать параметры. |
parentNode | com.aspose.pdf.groupprocessor.PdfTreeNode | Начальный (корневой) узел для построения дерева. |
Возвращает: long - длинное значение, последний индекс анализируемого диапазона.
buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)
public long buildProperties(ByteRange range, PdfTreeNode parentNode, boolean extractJustValue)
Строит дерево узлов, содержащих все параметры pdf с их значениями.
Параметры:
Параметр | Тип | Описание |
---|---|---|
range | com.aspose.pdf.groupprocessor.ByteRange | Диапазон байтов, где анализировать параметры. |
parentNode | com.aspose.pdf.groupprocessor.PdfTreeNode | Начальный (корневой) узел для построения дерева. |
extractJustValue | boolean | Для рекурсивного вызова. Просто показывает, что следующая рекурсивная функция должна найти значение параметра, но не сам параметр. |
Возвращает: long — последний индекс анализируемого диапазона.
close()
public void close()
Закрывает все ресурсы, используемые этим экземпляром.
dispose()
public void dispose()
Dispose object Этот метод устарел, вместо него используйте close().
equals(Object arg0)
public boolean equals(Object arg0)
Параметры:
Параметр | Тип | Описание |
---|---|---|
arg0 | java.lang.Object |
Возвращает: логический
extractAllText()
public String[] extractAllText()
Извлекает текст из документа
Возвращает: java.lang.String[] — массив строк, представляющих текст документа
extractAllTextInternal()
public String[] extractAllTextInternal()
Возвращает: java.lang.String[]
extractPageText(int pageNumber)
public String extractPageText(int pageNumber)
Извлекает текст со страницы
Параметры:
Параметр | Тип | Описание |
---|---|---|
pageNumber | int | 1 номер страницы |
Возвращает: java.lang.String — Текст
getClass()
public final native Class<?> getClass()
Возвращает: java.lang.Класс
getPageCount()
public int getPageCount()
Получает количество страниц в документе.
Возвращает: int - количество страниц
getVentureLicense()
public final VentureLicense getVentureLicense()
Возвращает: VentureLicense
getVersion()
public String getVersion()
Только для внутреннего использования
Возвращает: java.lang.String — строковый объект
hashCode()
public native int hashCode()
Возвращает: инт
initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)
public void initialize(System.IO.Stream pdfDocumentStream, int bufferSize, boolean allowAsyncInitialization)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentStream | com.aspose.ms.System.IO.Stream | Поток, содержащий PDF-документ. |
bufferSize | int | Максимальный размер содержимого в байтах, которое может храниться в памяти. |
allowAsyncInitialization | boolean | Разрешает асинхронную инициализацию ресурсов. |
initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)
public void initialize(System.IO.Stream pdfDocumentStream, String password, int bufferSize, boolean allowAsyncInitialization)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentStream | com.aspose.ms.System.IO.Stream | Поток, содержащий PDF-документ. |
password | java.lang.String | Пароль документа. |
bufferSize | int | Максимальный размер содержимого в байтах, которое может храниться в памяти. |
allowAsyncInitialization | boolean | Разрешает асинхронную инициализацию ресурсов. |
initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)
public void initialize(String pdfDocumentPath, int bufferSize, boolean allowAsyncInitialization)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentPath | java.lang.String | Путь к pdf-документу. |
bufferSize | int | Максимальный размер содержимого в байтах, которое может храниться в памяти. |
allowAsyncInitialization | boolean | Разрешает асинхронную инициализацию ресурсов. |
initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)
public void initialize(String pdfDocumentPath, String password, int bufferSize, boolean allowAsyncInitialization)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentPath | java.lang.String | Путь к pdf-документу. |
password | java.lang.String | Пароль документа. |
bufferSize | int | Максимальный размер содержимого в байтах, которое может храниться в памяти. |
allowAsyncInitialization | boolean | Разрешает асинхронную инициализацию ресурсов. |
initializeAlternative(System.IO.Stream pdfDocumentStream)
public void initializeAlternative(System.IO.Stream pdfDocumentStream)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentStream | com.aspose.ms.System.IO.Stream | Поток, содержащий PDF-документ. |
initializeAlternative(System.IO.Stream pdfDocumentStream, String password)
public void initializeAlternative(System.IO.Stream pdfDocumentStream, String password)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentStream | com.aspose.ms.System.IO.Stream | Поток, содержащий PDF-документ. |
password | java.lang.String |
initializeAlternative(String pdfDocumentPath)
public void initializeAlternative(String pdfDocumentPath)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentPath | java.lang.String | Путь к pdf-документу. |
initializeAlternative(String pdfDocumentPath, String password)
public void initializeAlternative(String pdfDocumentPath, String password)
Инициализирует экземпляр TextExtractor.
Параметры:
Параметр | Тип | Описание |
---|---|---|
pdfDocumentPath | java.lang.String | Путь к pdf-документу. |
password | java.lang.String |
isFastExtractionUsed()
public boolean isFastExtractionUsed()
Возвращает TRUE, если использовалось быстрое извлечение
Возвращает: boolean - логическое значение
notify()
public final native void notify()
notifyAll()
public final native void notifyAll()
setVentureLicense(VentureLicense license)
public final void setVentureLicense(VentureLicense license)
Параметры:
Параметр | Тип | Описание |
---|---|---|
license | VentureLicense |
toString()
public String toString()
Возвращает: java.lang.String
wait()
public final void wait()
wait(long arg0)
public final native void wait(long arg0)
Параметры:
Параметр | Тип | Описание |
---|---|---|
arg0 | long |
wait(long arg0, int arg1)
public final void wait(long arg0, int arg1)
Параметры:
Параметр | Тип | Описание |
---|---|---|
arg0 | long | |
arg1 | int |