TextDevice

Наследование: java.lang.Object, com.aspose.pdf.devices.Device, com.aspose.pdf.devices.PageDevice

public final class TextDevice extends PageDevice

Представляет класс для преобразования страниц документа PDF в текст.


The example demonstrates how to extract text on the first PDF document page.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       ByteArrayOutputStream ms = new ByteArrayOutputStream();
	       try 
	       {
	           // создать текстовое устройство
	           TextDevice device = new TextDevice();
	           // преобразовать страницу и сохранить текст в поток
	           device.process(doc.getPages().get_Item(1), ms);
	           // использовать извлеченный текст
	           extractedText = Encoding.getUnicode().getString(ms.toByteArray());
	           
		    ms.close();
		} catch (IOException e) {
		    e.printStackTrace();
		}

Объект TextDevice в основном используется для извлечения текста из страницы PDF.

Конструкторы

КонструкторОписание
TextDevice(TextExtractionOptions extractionOptions)Инициализирует новый экземпляр TextDevice с параметрами извлечения текста.
TextDevice()Инициализирует новый экземпляр TextDevice с режимом форматирования необработанного текста и кодировкой текста Unicode.
TextDevice(TextEncodingInternal encoding)Инициализирует новый экземпляр TextDevice для указанной кодировки.
TextDevice(Charset encoding)Инициализирует новый экземпляр TextDevice для указанной кодировки.
TextDevice(TextExtractionOptions extractionOptions, TextEncodingInternal encoding)Инициализирует новый экземпляр TextDevice для указанной кодировки с параметрами извлечения текста.
TextDevice(TextExtractionOptions extractionOptions, Charset encoding)Инициализирует новый экземпляр TextDevice для указанной кодировки с параметрами извлечения текста.

Методы

МетодОписание
equals(Object arg0)
getClass()
getEncoding()Получает кодировку извлеченного текста.
getEncodingInternal()Получает кодировку извлеченного текста.
getExtractionOptions()Получает параметры извлечения текста.
hashCode()
notify()
notifyAll()
process(Page page, System.Drawing.Graphics gr)Отрисовывает страницу на графике
process(Page page, OutputStream output)Конвертируйте страницу и сохраните ее как текстовый поток.
process(Page page, String outputFileName)Выполняет некоторую операцию на данной странице и сохраняет результаты в файл.
processInternal(Page page, System.IO.Stream output)Конвертируйте страницу и сохраните ее как текстовый поток.
setEncoding(Charset value)Устанавливает кодировку извлеченного текста.
setEncodingInternal(TextEncodingInternal value)Устанавливает кодировку извлеченного текста.
setExtractionOptions(TextExtractionOptions value)Задает параметры извлечения текста.
toString()
wait()
wait(long arg0)
wait(long arg0, int arg1)

TextDevice(TextExtractionOptions extractionOptions)

public TextDevice(TextExtractionOptions extractionOptions)

Инициализирует новый экземпляр TextDevice с параметрами извлечения текста.

Параметры:

ПараметрТипОписание
extractionOptionsTextExtractionOptionsВарианты извлечения текста.

TextDevice()

public TextDevice()

Инициализирует новый экземпляр TextDevice с режимом форматирования необработанного текста и кодировкой текста Unicode.

TextDevice(TextEncodingInternal encoding)

public TextDevice(TextEncodingInternal encoding)

Инициализирует новый экземпляр TextDevice для указанной кодировки.

Параметры:

ПараметрТипОписание
encodingTextEncodingInternalКодирование извлеченного текста

TextDevice(Charset encoding)

public TextDevice(Charset encoding)

Инициализирует новый экземпляр TextDevice для указанной кодировки.

Параметры:

ПараметрТипОписание
encodingjava.nio.charset.CharsetКодирование извлеченного текста

TextDevice(TextExtractionOptions extractionOptions, TextEncodingInternal encoding)

public TextDevice(TextExtractionOptions extractionOptions, TextEncodingInternal encoding)

Инициализирует новый экземпляр TextDevice для указанной кодировки с параметрами извлечения текста.

Параметры:

ПараметрТипОписание
extractionOptionsTextExtractionOptionsВарианты извлечения текста.
encodingTextEncodingInternalКодирование извлеченного текста.

TextDevice(TextExtractionOptions extractionOptions, Charset encoding)

public TextDevice(TextExtractionOptions extractionOptions, Charset encoding)

Инициализирует новый экземпляр TextDevice для указанной кодировки с параметрами извлечения текста.

Параметры:

ПараметрТипОписание
extractionOptionsTextExtractionOptionsВарианты извлечения текста.
encodingjava.nio.charset.CharsetКодирование извлеченного текста.

equals(Object arg0)

public boolean equals(Object arg0)

Параметры:

ПараметрТипОписание
arg0java.lang.Object

Возвращает: логический

getClass()

public final native Class<?> getClass()

Возвращает: java.lang.Класс

getEncoding()

public Charset getEncoding()

Получает кодировку извлеченного текста.

Возвращает: java.nio.charset.Charset — элемент набора символов


The example demonstrates how to represent extracted text in UTF-8 encoding.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       // создать текстовое устройство
	       TextDevice device = new TextDevice(java.nio.charset.Charset.forName("UTF-8"));
	       // преобразовать страницу и сохранить текст в поток
	       device.process(doc.getPages().get_Item(1), outFile);

getEncodingInternal()

public TextEncodingInternal getEncodingInternal()

Получает кодировку извлеченного текста.

Возвращает: TextEncodingInternal - Элемент TextEncodingInternal


The example demonstrates how to represent extracted text in UTF-8 encoding.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       // создать текстовое устройство
	       TextDevice device = new TextDevice(java.nio.charset.Charset.forName("UTF-8"));
	       // преобразовать страницу и сохранить текст в поток
	       device.process(doc.getPages().get_Item(1), outFile);

getExtractionOptions()

public TextExtractionOptions getExtractionOptions()

Получает параметры извлечения текста.

Возвращает: TextExtractionOptions - Элемент TextExtractionOptions


The example demonstrates how to extracted text in raw order.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       // создать текстовое устройство
	       TextDevice device = new TextDevice(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Raw));
	       // преобразовать страницу и сохранить текст в поток
	       device.process(doc.getPages().get_Item(1), outFile);

hashCode()

public native int hashCode()

Возвращает: инт

notify()

public final native void notify()

notifyAll()

public final native void notifyAll()

process(Page page, System.Drawing.Graphics gr)

public void process(Page page, System.Drawing.Graphics gr)

Отрисовывает страницу на графике

Параметры:

ПараметрТипОписание
pagePageОбъект страницы
grcom.aspose.ms.System.Drawing.Graphicsвнутренний объект

process(Page page, OutputStream output)

public void process(Page page, OutputStream output)

Конвертируйте страницу и сохраните ее как текстовый поток.


The example demonstrates how to extract text on the first PDF document page.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       ByteArrayOutputStream ms = new ByteArrayOutputStream();
	       
	           // создать текстовое устройство
	           TextDevice device = new TextDevice();
	           // преобразовать страницу и сохранить текст в поток
	           device.process(doc.getPages().get_Item(1), ms);
	           //использовать извлеченный текст
	           extractedText = Encoding.getUnicode().getString(ms.toByteArray());
	           ms.close();

Параметры:

ПараметрТипОписание
pagePageСтраница для конвертации.
outputjava.io.OutputStreamПоток результатов.

process(Page page, String outputFileName)

public void process(Page page, String outputFileName)

Выполняет некоторую операцию на данной странице и сохраняет результаты в файл.

Параметры:

ПараметрТипОписание
pagePageСтраница для обработки.
outputFileNamejava.lang.StringЭтот файл содержит результаты обработки.

processInternal(Page page, System.IO.Stream output)

public void processInternal(Page page, System.IO.Stream output)

Конвертируйте страницу и сохраните ее как текстовый поток.


The example demonstrates how to extract text on the first PDF document page.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       ByteArrayOutputStream ms = new ByteArrayOutputStream();
	       
	           // создать текстовое устройство
	           TextDevice device = new TextDevice();
	           // преобразовать страницу и сохранить текст в поток
	           device.process(doc.getPages().get_Item(1), ms);
	           //использовать извлеченный текст
	           extractedText = Encoding.getUnicode().getString(ms.toByteArray());
	           ms.close();

Параметры:

ПараметрТипОписание
pagePageСтраница для конвертации.
outputcom.aspose.ms.System.IO.StreamПоток результатов.

setEncoding(Charset value)

public void setEncoding(Charset value)

Устанавливает кодировку извлеченного текста.

Параметры:

ПараметрТипОписание
valuejava.nio.charset.CharsetЭлемент набора символов

The example demonstrates how to represent extracted text in UTF-8 encoding.
 
		       Document doc = new Document(inFile);
		       String extractedText;
		       // создать текстовое устройство
		       TextDevice device = new TextDevice(java.nio.charset.Charset.forName("UTF-8"));
		       // преобразовать страницу и сохранить текст в поток
		       device.process(doc.getPages().get_Item(1), outFile);
``` |

### setEncodingInternal(TextEncodingInternal value) {#setEncodingInternal-com.aspose.pdf.TextEncodingInternal-}

public void setEncodingInternal (значение TextEncodingInternal)



Sets encoding of extracted text.

**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| value | [TextEncodingInternal](../../com.aspose.pdf/textencodinginternal) | TextEncodingInternal element

--------------------

В примере показано, как представить извлеченный текст в кодировке UTF-8.

	       Document doc = new Document(inFile);
	       String extractedText;
	       // create text device
	       TextDevice device = new TextDevice(TextEncodingInternal.getUTF8());
	       // convert the page and save text to the stream
	       device.process(doc.getPages().get_Item(1), outFile);

### setExtractionOptions(TextExtractionOptions value) {#setExtractionOptions-com.aspose.pdf.TextExtractionOptions-}

public void setExtractionOptions (значение TextExtractionOptions)



Sets text extraction options.

**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| value | [TextExtractionOptions](../../com.aspose.pdf/textextractionoptions) | TextExtractionOptions element

--------------------

В примере показано, как извлечь текст в необработанном порядке.

       Document doc = new Document(inFile);
       String extractedText;
       // create text device
       TextDevice device = new TextDevice(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Raw));
       // convert the page and save text to the stream
       device.process(doc.getPages().get_Item(1), outFile);

### toString() {#toString--}

публичная строка toString()





**Returns:**
java.lang.String
### wait() {#wait--}

публичный окончательный недействительный ожидание ()





### wait(long arg0) {#wait-long-}

public final native void wait(long arg0)





**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| arg0 | long |  |

### wait(long arg0, int arg1) {#wait-long-int-}

public final void wait(long arg0, int arg1)





**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| arg0 | long |  |
| arg1 | int |  |