TextAbsorber

TextAbsorber class

Représente un objet absorbeur d’un texte. Effectue une extraction de texte et donne accès au résultat viaText objet.

public class TextAbsorber

Constructeurs

NomLa description
TextAbsorber()Initialise une nouvelle instance duTextAbsorber .
TextAbsorber(TextExtractionOptions)Initialise une nouvelle instance duTextAbsorber avec options d’extraction.
TextAbsorber(TextSearchOptions)Initialise une nouvelle instance duTextAbsorber avec des options de recherche de texte.
TextAbsorber(TextExtractionOptions, TextSearchOptions)Initialise une nouvelle instance duTextAbsorber avec options d’extraction et de recherche de texte.

Propriétés

NomLa description
Errors { get; }Liste desTextExtractionError objets. Il contient des informations sur les erreurs trouvées lors de l’extraction de texte. La recherche d’erreurs ne sera effectuée que si TextSearchOptions.LogTextExtractionErrors = true ; Et cela peut diminuer les performances.
virtual ExtractionOptions { get; set; }Obtient ou définit les options d’extraction de texte.
HasErrors { get; }La valeur indique si des erreurs ont été trouvées lors de l’extraction de texte. La recherche d’erreurs ne sera effectuée que si TextSearchOptions.LogTextExtractionErrors = true ; Et cela peut diminuer les performances.
virtual Text { get; }Obtient le texte extrait que leTextAbsorber extraits sur le document ou la page PDF.
virtual TextSearchOptions { get; set; }Obtient ou définit les options de recherche de texte.

Méthodes

NomLa description
virtual Visit(Document)Extrait le texte sur le document spécifié
virtual Visit(Page)Extrait le texte sur la page spécifiée
virtual Visit(XForm)Extrait le texte sur le XForm spécifié.

Remarques

LeTextAbsorber L’objet est utilisé pour extraire du texte d’un document Pdf ou de la page du document.

Exemples

L’exemple montre comment extraire du texte sur la première page du document PDF.

// ouvre le document
Document doc = new Document(inFile);

// crée un objet TextAbsorber pour extraire le texte
TextAbsorber absorber = new TextAbsorber();

// accepte l'absorbeur pour la première page
doc.Pages[1].Accept(absorber);

// récupère le texte extrait
string extractedText = absorber.Text;

Voir également