TextAbsorber

TextAbsorber class

Представляет объект-поглотитель текста. Выполняет извлечение текста и предоставляет доступ к результату черезText объект.

public class TextAbsorber

Конструкторы

Имя	Описание
TextAbsorber()	Инициализирует новый экземпляр`TextAbsorber` .
TextAbsorber(TextExtractionOptions)	Инициализирует новый экземпляр`TextAbsorber` с опциями извлечения.
TextAbsorber(TextSearchOptions)	Инициализирует новый экземпляр`TextAbsorber` с параметрами текстового поиска.
TextAbsorber(TextExtractionOptions, TextSearchOptions)	Инициализирует новый экземпляр`TextAbsorber` с возможностью извлечения и текстового поиска.

Характеристики

Имя	Описание
Errors { get; }	Список`TextExtractionError` объекты. Содержит информацию об ошибках, обнаруженных при извлечении текста. Поиск ошибок будет производиться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность.
virtual ExtractionOptions { get; set; }	Получает или задает параметры извлечения текста.
HasErrors { get; }	Значение указывает, были ли обнаружены ошибки при извлечении текста. Поиск ошибок будет выполняться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность.
virtual Text { get; }	Получает извлеченный текст,`TextAbsorber` выдержки из документа PDF или страницы.
virtual TextSearchOptions { get; set; }	Получает или задает параметры текстового поиска.

Методы

Имя	Описание
virtual Visit(Document)	Извлекает текст из указанного документа
virtual Visit(Page)	Извлекает текст на указанной странице
virtual Visit(XForm)	Извлекает текст из указанной формы XForm.

Примечания

TextAbsorber объект используется для извлечения текста из документа Pdf или страницы документа.

Примеры

В примере показано, как извлечь текст на первой странице документа PDF.

// открыть документ
Document doc = new Document(inFile);

// создаем объект TextAbsorber для извлечения текста
TextAbsorber absorber = new TextAbsorber();

// принимаем поглотитель для первой страницы
doc.Pages[1].Accept(absorber);

// получаем извлеченный текст
string extractedText = absorber.Text;

Смотрите также

пространство имен Aspose.Pdf.Text
сборка Aspose.PDF

TableAbsorber TextBuilder