TextDevice

遗产: java.lang.Object, com.aspose.pdf.devices.Device, com.aspose.pdf.devices.PageDevice

public final class TextDevice extends PageDevice

表示将 pdf 文档页面转换为文本的类。


The example demonstrates how to extract text on the first PDF document page.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       ByteArrayOutputStream ms = new ByteArrayOutputStream();
	       try 
	       {
	           //创建文本设备
	           TextDevice device = new TextDevice();
	           //转换页面并将文本保存到流中
	           device.process(doc.getPages().get_Item(1), ms);
	           //使用提取的文本
	           extractedText = Encoding.getUnicode().getString(ms.toByteArray());
	           
		    ms.close();
		} catch (IOException e) {
		    e.printStackTrace();
		}

TextDevice 对象主要用于从 pdf 页面中提取文本。

构造函数

构造函数描述
TextDevice(TextExtractionOptions extractionOptions)使用文本提取选项初始化 TextDevice 的新实例。
TextDevice()使用 Raw 文本格式化模式和 Unicode 文本编码初始化 TextDevice 的新实例。
TextDevice(TextEncodingInternal encoding)为指定的编码初始化 TextDevice 的新实例。
TextDevice(Charset encoding)为指定的编码初始化 TextDevice 的新实例。
TextDevice(TextExtractionOptions extractionOptions, TextEncodingInternal encoding)使用文本提取选项为指定编码初始化 TextDevice 的新实例。
TextDevice(TextExtractionOptions extractionOptions, Charset encoding)使用文本提取选项为指定编码初始化 TextDevice 的新实例。

方法

方法描述
equals(Object arg0)
getClass()
getEncoding()获取提取文本的编码。
getEncodingInternal()获取提取文本的编码。
getExtractionOptions()获取文本提取选项。
hashCode()
notify()
notifyAll()
process(Page page, System.Drawing.Graphics gr)在图形上呈现页面
process(Page page, OutputStream output)转换页面并将其保存为文本流。
process(Page page, String outputFileName)在给定页面上执行一些操作并将结果保存到文件中。
processInternal(Page page, System.IO.Stream output)转换页面并将其保存为文本流。
setEncoding(Charset value)设置提取文本的编码。
setEncodingInternal(TextEncodingInternal value)设置提取文本的编码。
setExtractionOptions(TextExtractionOptions value)设置文本提取选项。
toString()
wait()
wait(long arg0)
wait(long arg0, int arg1)

TextDevice(TextExtractionOptions extractionOptions)

public TextDevice(TextExtractionOptions extractionOptions)

使用文本提取选项初始化 TextDevice 的新实例。

参数:

范围类型描述
extractionOptionsTextExtractionOptions文本提取选项。

TextDevice()

public TextDevice()

使用 Raw 文本格式化模式和 Unicode 文本编码初始化 TextDevice 的新实例。

TextDevice(TextEncodingInternal encoding)

public TextDevice(TextEncodingInternal encoding)

为指定的编码初始化 TextDevice 的新实例。

参数:

范围类型描述
encodingTextEncodingInternal提取文本的编码

TextDevice(Charset encoding)

public TextDevice(Charset encoding)

为指定的编码初始化 TextDevice 的新实例。

参数:

范围类型描述
encodingjava.nio.charset.Charset提取文本的编码

TextDevice(TextExtractionOptions extractionOptions, TextEncodingInternal encoding)

public TextDevice(TextExtractionOptions extractionOptions, TextEncodingInternal encoding)

使用文本提取选项为指定编码初始化 TextDevice 的新实例。

参数:

范围类型描述
extractionOptionsTextExtractionOptions文本提取选项。
encodingTextEncodingInternal提取文本的编码。

TextDevice(TextExtractionOptions extractionOptions, Charset encoding)

public TextDevice(TextExtractionOptions extractionOptions, Charset encoding)

使用文本提取选项为指定编码初始化 TextDevice 的新实例。

参数:

范围类型描述
extractionOptionsTextExtractionOptions文本提取选项。
encodingjava.nio.charset.Charset提取文本的编码。

equals(Object arg0)

public boolean equals(Object arg0)

参数:

范围类型描述
arg0java.lang.Object

退货: 布尔值

getClass()

public final native Class<?> getClass()

退货: java.lang.Class

getEncoding()

public Charset getEncoding()

获取提取文本的编码。

退货: java.nio.charset.Charset - 字符集元素


The example demonstrates how to represent extracted text in UTF-8 encoding.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       //创建文本设备
	       TextDevice device = new TextDevice(java.nio.charset.Charset.forName("UTF-8"));
	       //转换页面并将文本保存到流中
	       device.process(doc.getPages().get_Item(1), outFile);

getEncodingInternal()

public TextEncodingInternal getEncodingInternal()

获取提取文本的编码。

退货: TextEncodingInternal TextEncoding内部元素


The example demonstrates how to represent extracted text in UTF-8 encoding.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       //创建文本设备
	       TextDevice device = new TextDevice(java.nio.charset.Charset.forName("UTF-8"));
	       //转换页面并将文本保存到流中
	       device.process(doc.getPages().get_Item(1), outFile);

getExtractionOptions()

public TextExtractionOptions getExtractionOptions()

获取文本提取选项。

退货: TextExtractionOptions TextExtractionOptions 元素


The example demonstrates how to extracted text in raw order.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       //创建文本设备
	       TextDevice device = new TextDevice(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Raw));
	       //转换页面并将文本保存到流中
	       device.process(doc.getPages().get_Item(1), outFile);

hashCode()

public native int hashCode()

退货: 整数

notify()

public final native void notify()

notifyAll()

public final native void notifyAll()

process(Page page, System.Drawing.Graphics gr)

public void process(Page page, System.Drawing.Graphics gr)

在图形上呈现页面

参数:

范围类型描述
pagePage页面对象
grcom.aspose.ms.System.Drawing.Graphics内部对象

process(Page page, OutputStream output)

public void process(Page page, OutputStream output)

转换页面并将其保存为文本流。


The example demonstrates how to extract text on the first PDF document page.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       ByteArrayOutputStream ms = new ByteArrayOutputStream();
	       
	           //创建文本设备
	           TextDevice device = new TextDevice();
	           //转换页面并将文本保存到流中
	           device.process(doc.getPages().get_Item(1), ms);
	           //使用提取的文本
	           extractedText = Encoding.getUnicode().getString(ms.toByteArray());
	           ms.close();

参数:

范围类型描述
pagePage要转换的页面。
outputjava.io.OutputStream结果流。

process(Page page, String outputFileName)

public void process(Page page, String outputFileName)

在给定页面上执行一些操作并将结果保存到文件中。

参数:

范围类型描述
pagePage要处理的页面。
outputFileNamejava.lang.String该文件包含处理结果。

processInternal(Page page, System.IO.Stream output)

public void processInternal(Page page, System.IO.Stream output)

转换页面并将其保存为文本流。


The example demonstrates how to extract text on the first PDF document page.
 
	       Document doc = new Document(inFile);
	       String extractedText;
	       ByteArrayOutputStream ms = new ByteArrayOutputStream();
	       
	           //创建文本设备
	           TextDevice device = new TextDevice();
	           //转换页面并将文本保存到流中
	           device.process(doc.getPages().get_Item(1), ms);
	           //使用提取的文本
	           extractedText = Encoding.getUnicode().getString(ms.toByteArray());
	           ms.close();

参数:

范围类型描述
pagePage要转换的页面。
outputcom.aspose.ms.System.IO.Stream结果流。

setEncoding(Charset value)

public void setEncoding(Charset value)

设置提取文本的编码。

参数:

范围类型描述
valuejava.nio.charset.Charset字符集元素

The example demonstrates how to represent extracted text in UTF-8 encoding.
 
		       Document doc = new Document(inFile);
		       String extractedText;
		       //创建文本设备
		       TextDevice device = new TextDevice(java.nio.charset.Charset.forName("UTF-8"));
		       //转换页面并将文本保存到流中
		       device.process(doc.getPages().get_Item(1), outFile);
``` |

### setEncodingInternal(TextEncodingInternal value) {#setEncodingInternal-com.aspose.pdf.TextEncodingInternal-}

public void setEncodingInternal(TextEncodingInternal 值)



Sets encoding of extracted text.

**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| value | [TextEncodingInternal](../../com.aspose.pdf/textencodinginternal) | TextEncodingInternal element

--------------------

该示例演示了如何以 UTF-8 编码表示提取的文本。

	       Document doc = new Document(inFile);
	       String extractedText;
	       // create text device
	       TextDevice device = new TextDevice(TextEncodingInternal.getUTF8());
	       // convert the page and save text to the stream
	       device.process(doc.getPages().get_Item(1), outFile);

### setExtractionOptions(TextExtractionOptions value) {#setExtractionOptions-com.aspose.pdf.TextExtractionOptions-}

public void setExtractionOptions(TextExtractionOptions 值)



Sets text extraction options.

**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| value | [TextExtractionOptions](../../com.aspose.pdf/textextractionoptions) | TextExtractionOptions element

--------------------

该示例演示了如何以原始顺序提取文本。

       Document doc = new Document(inFile);
       String extractedText;
       // create text device
       TextDevice device = new TextDevice(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Raw));
       // convert the page and save text to the stream
       device.process(doc.getPages().get_Item(1), outFile);

### toString() {#toString--}

公共字符串 toString()





**Returns:**
java.lang.String
### wait() {#wait--}

公共最终无效等待()





### wait(long arg0) {#wait-long-}

public final native void wait(long arg0)





**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| arg0 | long |  |

### wait(long arg0, int arg1) {#wait-long-int-}

公共最终无效等待(长 arg0,int arg1)





**Parameters:**
| Parameter | Type | Description |
| --- | --- | --- |
| arg0 | long |  |
| arg1 | int |  |