TextFragmentAbsorber

TextFragmentAbsorber class

Представляет объект-поглотитель текстовых фрагментов. Выполняет текстовый поиск и предоставляет доступ к результатам поиска черезTextFragments коллекция.

public sealed class TextFragmentAbsorber : TextAbsorber

Конструкторы

ИмяОписание
TextFragmentAbsorber()Инициализирует новый экземплярTextFragmentAbsorber который выполняет поиск всех текстовых сегментов документа или страницы.
TextFragmentAbsorber(Regex)Инициализирует новый экземплярTextFragmentAbsorber класс для указанного объекта класса System.Text.RegularExpressions.Regex.
TextFragmentAbsorber(string)Инициализирует новый экземплярTextFragmentAbsorber класс для указанной текстовой фразы.
TextFragmentAbsorber(TextEditOptions)Инициализирует новый экземплярTextFragmentAbsorberс опциями редактирования текста, выполняющими поиск по всем текстовым сегментам документа или страницы.
TextFragmentAbsorber(Regex, TextEditOptions)Инициализирует новый экземплярTextFragmentAbsorber класс для указанной текстовой фразы и параметров редактирования текста.
TextFragmentAbsorber(Regex, TextSearchOptions)Инициализирует новый экземплярTextFragmentAbsorber класс для указанной текстовой фразы и опций текстового поиска.
TextFragmentAbsorber(string, TextEditOptions)Инициализирует новый экземплярTextFragmentAbsorber класс для указанной текстовой фразы и параметров редактирования текста.
TextFragmentAbsorber(string, TextSearchOptions)Инициализирует новый экземплярTextFragmentAbsorberкласс для указанной текстовой фразы и опций текстового поиска.
TextFragmentAbsorber(string, TextSearchOptions, TextEditOptions)Инициализирует новый экземплярTextFragmentAbsorber класс для указанной текстовой фразы, параметров поиска текста и параметров редактирования текста.

Характеристики

ИмяОписание
Errors { get; }СписокTextExtractionError объекты. Содержит информацию об ошибках, обнаруженных при извлечении текста. Поиск ошибок будет производиться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность.
override ExtractionOptions { get; set; }Получает или задает параметры извлечения текста.
HasErrors { get; }Значение указывает, были ли обнаружены ошибки при извлечении текста. Поиск ошибок будет выполняться, только если TextSearchOptions.LogTextExtractionErrors = true; И это может снизить производительность.
Phrase { get; set; }Получает или задает фразу, которуюTextFragmentAbsorber поиск в документе PDF или на странице.
override Text { get; }Получает извлеченный текст,TextAbsorber выдержки из документа PDF или страницы.
TextEditOptions { get; set; }Получает или задает параметры редактирования текста. Параметры определяют особое поведение, когда запрошенный символ не может быть написан шрифтом.
TextFragments { get; set; }Получает коллекцию вхождений поиска, представленныхTextFragment объекты.
TextReplaceOptions { get; set; }Получает или задает параметры замены текста. Параметры определяют поведение при замене текста фрагмента на более короткий/длинный.
TextSearchOptions { get; set; }Получает или задает параметры поиска. Параметры включают поиск с использованием регулярных выражений.

Методы

ИмяОписание
ApplyForAllFragments(float)Применяет размер шрифта ко всем фрагментам текста, которые были поглощены. Это работает быстрее, чем перебор фрагментов, если все фрагменты на странице (страницах) были поглощены. В противном случае он работает аналогично циклу.
ApplyForAllFragments(Font)Применяет шрифт ко всем фрагментам текста, которые были поглощены. Это работает быстрее, чем перебор фрагментов, если все фрагменты на странице (страницах) были поглощены. В противном случае он работает аналогично циклу.
ApplyForAllFragments(Font, float)Применяет шрифт и размер ко всем фрагментам текста, которые были поглощены. Это работает быстрее, чем перебор фрагментов, если все фрагменты на странице (страницах) были поглощены. В противном случае он работает аналогично циклу.
RemoveAllText(Document)Удаляет весь текст из документа.
RemoveAllText(Page)Удаляет весь текст с указанной страницы.
RemoveAllText(Page, Rectangle)Удаляет текст внутри указанного прямоугольника с указанной страницы.
Reset()Очищает коллекцию TextFragments этогоTextFragmentAbsorber объект.
override Visit(Document)Выполняет поиск в указанном документе.
override Visit(Page)Выполняет поиск на указанной странице.
Visit(XForm)Выполняет поиск по указанному объекту формы.
virtual Visit(XForm)Извлекает текст из указанной формы XForm.

Примечания

TextFragmentAbsorber объект в основном используется в сценарии текстового поиска. Когда поиск завершен, вхождения представленыTextFragment объекты, которыеTextFragments коллекция содержит. TextFragment Объект предоставляет доступ к тексту вхождения поиска, свойствам текста, а также позволяет редактировать текст и изменять его состояние (шрифт, размер шрифта, цвет и т. д.).

Примеры

Пример демонстрирует, как найти текст на первой странице документа PDF и заменить текст и его шрифт.

// Открыть документ
Document doc = new Document(@"D:\Tests\input.pdf");

// Находим шрифт, который будет использоваться для изменения шрифта текста документа
Aspose.Pdf.Txt.Font font = FontRepository.FindFont("Arial");

// Создаем объект TextFragmentAbsorber для поиска всех вхождений текста "hello world"
TextFragmentAbsorber absorber = new TextFragmentAbsorber("hello world");

// Принять поглотитель для первой страницы
doc.Pages[1].Accept(absorber);

// Изменяем текст и шрифт первого вхождения текста
absorber.TextFragments[1].Text = "hi world";
absorber.TextFragments[1].TextState.Font = font;

// Сохранить документ
doc.Save(@"D:\Tests\output.pdf");  

Смотрите также