TextAbsorber

TextAbsorber class

Представляет объект-поглотитель текста. Выполняет извлечение текста и предоставляет доступ к результату черезText объект.

public class TextAbsorber

Конструкторы

ИмяОписание
TextAbsorber()Инициализирует новый экземплярTextAbsorber .
TextAbsorber(TextExtractionOptions)Инициализирует новый экземплярTextAbsorber с опциями извлечения.
TextAbsorber(TextSearchOptions)Инициализирует новый экземплярTextAbsorber с параметрами текстового поиска.
TextAbsorber(TextExtractionOptions, TextSearchOptions)Инициализирует новый экземплярTextAbsorber с возможностью извлечения и текстового поиска.

Характеристики

ИмяОписание
Errors { get; }СписокTextExtractionError объекты. Содержит информацию об ошибках, обнаруженных при извлечении текста. Поиск ошибок будет производиться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность.
virtual ExtractionOptions { get; set; }Получает или задает параметры извлечения текста.
HasErrors { get; }Значение указывает, были ли обнаружены ошибки при извлечении текста. Поиск ошибок будет выполняться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность.
virtual Text { get; }Получает извлеченный текст,TextAbsorber выдержки из документа PDF или страницы.
virtual TextSearchOptions { get; set; }Получает или задает параметры текстового поиска.

Методы

ИмяОписание
virtual Visit(Document)Извлекает текст из указанного документа
virtual Visit(Page)Извлекает текст на указанной странице
virtual Visit(XForm)Извлекает текст из указанной формы XForm.

Примечания

TextAbsorber объект используется для извлечения текста из документа Pdf или страницы документа.

Примеры

В примере показано, как извлечь текст на первой странице документа PDF.

// открыть документ
Document doc = new Document(inFile);

// создаем объект TextAbsorber для извлечения текста
TextAbsorber absorber = new TextAbsorber();

// принимаем поглотитель для первой страницы
doc.Pages[1].Accept(absorber);

// получаем извлеченный текст
string extractedText = absorber.Text;

Смотрите также