TextAbsorber

TextAbsorber class

Représente un objet absorbeur d’un texte. Effectue une extraction de texte et donne accès au résultat viaText objet.

public class TextAbsorber

Constructeurs

Nom	La description
TextAbsorber()	Initialise une nouvelle instance du`TextAbsorber` .
TextAbsorber(TextExtractionOptions)	Initialise une nouvelle instance du`TextAbsorber` avec options d’extraction.
TextAbsorber(TextSearchOptions)	Initialise une nouvelle instance du`TextAbsorber` avec des options de recherche de texte.
TextAbsorber(TextExtractionOptions, TextSearchOptions)	Initialise une nouvelle instance du`TextAbsorber` avec options d’extraction et de recherche de texte.

Propriétés

Nom	La description
Errors { get; }	Liste des`TextExtractionError` objets. Il contient des informations sur les erreurs trouvées lors de l’extraction de texte. La recherche d’erreurs ne sera effectuée que si TextSearchOptions.LogTextExtractionErrors = true ; Et cela peut diminuer les performances.
virtual ExtractionOptions { get; set; }	Obtient ou définit les options d’extraction de texte.
HasErrors { get; }	La valeur indique si des erreurs ont été trouvées lors de l’extraction de texte. La recherche d’erreurs ne sera effectuée que si TextSearchOptions.LogTextExtractionErrors = true ; Et cela peut diminuer les performances.
virtual Text { get; }	Obtient le texte extrait que le`TextAbsorber` extraits sur le document ou la page PDF.
virtual TextSearchOptions { get; set; }	Obtient ou définit les options de recherche de texte.

Méthodes

Nom	La description
virtual Visit(Document)	Extrait le texte sur le document spécifié
virtual Visit(Page)	Extrait le texte sur la page spécifiée
virtual Visit(XForm)	Extrait le texte sur le XForm spécifié.

Remarques

LeTextAbsorber L’objet est utilisé pour extraire du texte d’un document Pdf ou de la page du document.

Exemples

L’exemple montre comment extraire du texte sur la première page du document PDF.

// ouvre le document
Document doc = new Document(inFile);

// crée un objet TextAbsorber pour extraire le texte
TextAbsorber absorber = new TextAbsorber();

// accepte l'absorbeur pour la première page
doc.Pages[1].Accept(absorber);

// récupère le texte extrait
string extractedText = absorber.Text;

Voir également

espace de noms Aspose.Pdf.Text
Assemblée Aspose.PDF

TableAbsorber TextBuilder