TextAbsorber
Содержание
[
Скрывать
]TextAbsorber class
Представляет объект-поглотитель текста. Выполняет извлечение текста и предоставляет доступ к результату черезText
объект.
public class TextAbsorber
Конструкторы
Имя | Описание |
---|---|
TextAbsorber() | Инициализирует новый экземплярTextAbsorber . |
TextAbsorber(TextExtractionOptions) | Инициализирует новый экземплярTextAbsorber с опциями извлечения. |
TextAbsorber(TextSearchOptions) | Инициализирует новый экземплярTextAbsorber с параметрами текстового поиска. |
TextAbsorber(TextExtractionOptions, TextSearchOptions) | Инициализирует новый экземплярTextAbsorber с возможностью извлечения и текстового поиска. |
Характеристики
Имя | Описание |
---|---|
Errors { get; } | СписокTextExtractionError объекты. Содержит информацию об ошибках, обнаруженных при извлечении текста. Поиск ошибок будет производиться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность. |
virtual ExtractionOptions { get; set; } | Получает или задает параметры извлечения текста. |
HasErrors { get; } | Значение указывает, были ли обнаружены ошибки при извлечении текста. Поиск ошибок будет выполняться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность. |
virtual Text { get; } | Получает извлеченный текст,TextAbsorber выдержки из документа PDF или страницы. |
virtual TextSearchOptions { get; set; } | Получает или задает параметры текстового поиска. |
Методы
Имя | Описание |
---|---|
virtual Visit(Document) | Извлекает текст из указанного документа |
virtual Visit(Page) | Извлекает текст на указанной странице |
virtual Visit(XForm) | Извлекает текст из указанной формы XForm. |
Примечания
TextAbsorber
объект используется для извлечения текста из документа Pdf или страницы документа.
Примеры
В примере показано, как извлечь текст на первой странице документа PDF.
// открыть документ
Document doc = new Document(inFile);
// создаем объект TextAbsorber для извлечения текста
TextAbsorber absorber = new TextAbsorber();
// принимаем поглотитель для первой страницы
doc.Pages[1].Accept(absorber);
// получаем извлеченный текст
string extractedText = absorber.Text;
Смотрите также
- пространство имен Aspose.Pdf.Text
- сборка Aspose.PDF