TextDevice

TextDevice class

Представляет класс для преобразования страниц документа PDF в текст.

public sealed class TextDevice : PageDevice

Конструкторы

ИмяОписание
TextDevice()Инициализирует новый экземплярTextDevice с режимом форматирования текста Raw и кодировкой текста Unicode.
TextDevice(Encoding)Инициализирует новый экземплярTextDevice для указанной кодировки.
TextDevice(TextExtractionOptions)Инициализирует новый экземплярTextDevice с опциями извлечения текста.
TextDevice(TextExtractionOptions, Encoding)Инициализирует новый экземплярTextDevice для указанной кодировки с параметрами извлечения текста.

Характеристики

ИмяОписание
Encoding { get; set; }Получает или задает кодировку извлеченного текста.
ExtractionOptions { get; set; }Получает или задает параметры извлечения текста.

Методы

ИмяОписание
override Process(Page, Stream)Конвертировать страницу и сохранить ее как текстовый поток.
Process(Page, string)Выполняет некоторую операцию на данной странице и сохраняет результаты в файл.

Примечания

TextDevice Объект в основном используется для извлечения текста из страницы PDF.

Примеры

В примере показано, как извлечь текст на первой странице документа PDF.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // создать текстовое устройство
    TextDevice device = new TextDevice();

    // конвертируем страницу и сохраняем текст в поток
    device.Process(doc.Pages[1], ms);

    // используем извлеченный текст
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Смотрите также