Class ParagraphAbsorber

Classe ParagraphAbsorber

Représente un objet absorbeur d’objets de structure de page tels que des sections et des paragraphes. Effectue une recherche de sections et de paragraphes de texte et fournit un accès aux rectangles et polygones qui les décrivent dans l’espace de coordonnées de texte. Effectue également une recherche de segments de texte et fournit un accès aux résultats de recherche via des collections de !:TextFragments regroupées par éléments de structure.

public class ParagraphAbsorber

Constructeurs

NomDescription
ParagraphAbsorber()Initialise une nouvelle instance de ParagraphAbsorber qui effectue une recherche de sections/paragraphes du document ou de la page.
ParagraphAbsorber(int)Initialise une nouvelle instance de ParagraphAbsorber qui effectue une recherche de sections/paragraphes du document ou de la page.
ParagraphAbsorber(ParagraphAbsorberOptions)Initialise une nouvelle instance de ParagraphAbsorber qui effectue une recherche de sections/paragraphes du document ou de la page avec les paramètres spécifiés.
ParagraphAbsorber(int, ParagraphAbsorberOptions)Initialise une nouvelle instance de ParagraphAbsorber qui effectue une recherche de sections/paragraphes du document ou de la page avec les paramètres spécifiés.

Propriétés

NomDescription
IsMulticolumnParagraphsAllowed { get; set; }Obtient ou définit la valeur qui indique si les lignes de texte de début d’une section suivante peuvent être considérées comme une continuation du dernier paragraphe d’une section précédente.
PageMarkups { get; }Obtient la collection de PageMarkup qui ont été absorbés.
ParagraphAbsorberOptions { get; set; }Obtient ou définit les options de ParagraphAbsorber.
SectionsSearchDepth { get; set; }Obtient ou définit la valeur qui indique combien de fois des recherches séquentielles pour des éléments de structure plus fins seront effectuées. La profondeur de recherche par défaut est de 3. Cela signifie trois recherches pour des sections divisées horizontalement (en-têtes, paragraphes, etc.) et trois recherches pour celles divisées verticalement (colonnes).
TextReplaceOptions { get; set; }Obtient ou définit les options de remplacement de texte.

Méthodes

NomDescription
Visit(Document)Effectue une recherche de sections et de paragraphes sur le Document spécifié.
Visit(Page)Effectue une recherche sur la Page spécifiée.

Remarques

Lorsque la recherche est terminée, la collection PageMarkups contiendra des objets PageMarkup qui représentent la structure de la page par des collections de MarkupSection et MarkupParagraph. L’objet TextFragment fournit un accès au texte d’occurrence de la recherche, aux propriétés du texte, et permet d’éditer le texte et de changer l’état du texte (police, taille de police, couleur, etc.).

Exemples

L’exemple démontre comment trouver le premier segment de texte de chaque paragraphe sur la première page du document PDF et le mettre en surbrillance.

// Open document
Document doc = new Document("input.pdf");

// Create ParagraphAbsorber object
ParagraphAbsorber absorber = new ParagraphAbsorber();

// Accept the absorber for first page
absorber.Visit(doc.Pages[1]);

// Get markup object of first page
PageMarkup markup = absorber.PageMarkups[0];

// Loop through structure elements of the page text to find first text fragment of each paragraph
foreach (MarkupSection section in markup.Sections)
{
    foreach (MarkupParagraph paragraph in section.Paragraphs)
    {
        TextFragment fragment = paragraph.Fragments[0];
        // Update text properties
        fragment.TextState.BackgroundColor = Color.LightBlue;
    }
}

// Save document
doc.Save(GetOutputPath("output.pdf"));

Voir aussi