TextAbsorber
Contenu
[
Cacher
]TextAbsorber class
Représente un objet absorbeur d’un texte. Effectue une extraction de texte et donne accès au résultat viaText
objet.
public class TextAbsorber
Constructeurs
Nom | La description |
---|---|
TextAbsorber() | Initialise une nouvelle instance duTextAbsorber . |
TextAbsorber(TextExtractionOptions) | Initialise une nouvelle instance duTextAbsorber avec options d’extraction. |
TextAbsorber(TextSearchOptions) | Initialise une nouvelle instance duTextAbsorber avec des options de recherche de texte. |
TextAbsorber(TextExtractionOptions, TextSearchOptions) | Initialise une nouvelle instance duTextAbsorber avec options d’extraction et de recherche de texte. |
Propriétés
Nom | La description |
---|---|
Errors { get; } | Liste desTextExtractionError objets. Il contient des informations sur les erreurs trouvées lors de l’extraction de texte. La recherche d’erreurs ne sera effectuée que si TextSearchOptions.LogTextExtractionErrors = true ; Et cela peut diminuer les performances. |
virtual ExtractionOptions { get; set; } | Obtient ou définit les options d’extraction de texte. |
HasErrors { get; } | La valeur indique si des erreurs ont été trouvées lors de l’extraction de texte. La recherche d’erreurs ne sera effectuée que si TextSearchOptions.LogTextExtractionErrors = true ; Et cela peut diminuer les performances. |
virtual Text { get; } | Obtient le texte extrait que leTextAbsorber extraits sur le document ou la page PDF. |
virtual TextSearchOptions { get; set; } | Obtient ou définit les options de recherche de texte. |
Méthodes
Nom | La description |
---|---|
virtual Visit(Document) | Extrait le texte sur le document spécifié |
virtual Visit(Page) | Extrait le texte sur la page spécifiée |
virtual Visit(XForm) | Extrait le texte sur le XForm spécifié. |
Remarques
LeTextAbsorber
L’objet est utilisé pour extraire du texte d’un document Pdf ou de la page du document.
Exemples
L’exemple montre comment extraire du texte sur la première page du document PDF.
// ouvre le document
Document doc = new Document(inFile);
// crée un objet TextAbsorber pour extraire le texte
TextAbsorber absorber = new TextAbsorber();
// accepte l'absorbeur pour la première page
doc.Pages[1].Accept(absorber);
// récupère le texte extrait
string extractedText = absorber.Text;
Voir également
- espace de noms Aspose.Pdf.Text
- Assemblée Aspose.PDF