TextDevice

TextDevice class

Представляет класс для преобразования страниц документа PDF в текст.

public sealed class TextDevice : PageDevice

Конструкторы

Имя Описание
TextDevice() Инициализирует новый экземплярTextDevice с режимом форматирования текста Raw и кодировкой текста Unicode.
TextDevice(Encoding) Инициализирует новый экземплярTextDevice для указанной кодировки.
TextDevice(TextExtractionOptions) Инициализирует новый экземплярTextDevice с опциями извлечения текста.
TextDevice(TextExtractionOptions, Encoding) Инициализирует новый экземплярTextDevice для указанной кодировки с параметрами извлечения текста.

Характеристики

Имя Описание
Encoding { get; set; } Получает или задает кодировку извлеченного текста.
ExtractionOptions { get; set; } Получает или задает параметры извлечения текста.

Методы

Имя Описание
override Process(Page, Stream) Конвертировать страницу и сохранить ее как текстовый поток.
Process(Page, string) Выполняет некоторую операцию на данной странице и сохраняет результаты в файл.

Примечания

TextDevice Объект в основном используется для извлечения текста из страницы PDF.

Примеры

В примере показано, как извлечь текст на первой странице документа PDF.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // создать текстовое устройство
    TextDevice device = new TextDevice();

    // конвертируем страницу и сохраняем текст в поток
    device.Process(doc.Pages[1], ms);

    // используем извлеченный текст
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Смотрите также