TextDevice
Содержание
[
Скрывать
]TextDevice class
Представляет класс для преобразования страниц документа PDF в текст.
public sealed class TextDevice : PageDevice
Конструкторы
Имя | Описание |
---|---|
TextDevice() | Инициализирует новый экземплярTextDevice с режимом форматирования текста Raw и кодировкой текста Unicode. |
TextDevice(Encoding) | Инициализирует новый экземплярTextDevice для указанной кодировки. |
TextDevice(TextExtractionOptions) | Инициализирует новый экземплярTextDevice с опциями извлечения текста. |
TextDevice(TextExtractionOptions, Encoding) | Инициализирует новый экземплярTextDevice для указанной кодировки с параметрами извлечения текста. |
Характеристики
Имя | Описание |
---|---|
Encoding { get; set; } | Получает или задает кодировку извлеченного текста. |
ExtractionOptions { get; set; } | Получает или задает параметры извлечения текста. |
Методы
Имя | Описание |
---|---|
override Process(Page, Stream) | Конвертировать страницу и сохранить ее как текстовый поток. |
Process(Page, string) | Выполняет некоторую операцию на данной странице и сохраняет результаты в файл. |
Примечания
TextDevice
Объект в основном используется для извлечения текста из страницы PDF.
Примеры
В примере показано, как извлечь текст на первой странице документа PDF.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// создать текстовое устройство
TextDevice device = new TextDevice();
// конвертируем страницу и сохраняем текст в поток
device.Process(doc.Pages[1], ms);
// используем извлеченный текст
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
Смотрите также
- class PageDevice
- пространство имен Aspose.Pdf.Devices
- сборка Aspose.PDF