TextAbsorber

TextAbsorber class

Stellt ein Absorberobjekt eines Textes dar. Führt eine Textextraktion durch und bietet Zugriff auf das Ergebnis überText Objekt.

public class TextAbsorber

Konstrukteure

Name	Beschreibung
TextAbsorber()	Initialisiert eine neue Instanz von`TextAbsorber` .
TextAbsorber(TextExtractionOptions)	Initialisiert eine neue Instanz von`TextAbsorber` mit Extraktionsoptionen.
TextAbsorber(TextSearchOptions)	Initialisiert eine neue Instanz von`TextAbsorber` mit Textsuchoptionen.
TextAbsorber(TextExtractionOptions, TextSearchOptions)	Initialisiert eine neue Instanz von`TextAbsorber` mit Extraktions- und Textsuchoptionen.

Eigenschaften

Name	Beschreibung
Errors { get; }	Liste von`TextExtractionError` Objekte. Es enthält Informationen über Fehler, die während der Textextraktion gefunden wurden. Die Suche nach Fehlern wird nur durchgeführt, wenn TextSearchOptions.LogTextExtractionErrors = true; Und es kann die Leistung beeinträchtigen.
virtual ExtractionOptions { get; set; }	Ruft Textextraktionsoptionen ab oder legt sie fest.
HasErrors { get; }	Wert gibt an, ob bei der Textextraktion Fehler gefunden wurden. Die Suche nach Fehlern wird nur durchgeführt, wenn TextSearchOptions.LogTextExtractionErrors = true; Und es kann die Leistung beeinträchtigen.
virtual Text { get; }	Ruft extrahierten Text ab, der die`TextAbsorber` Auszüge auf dem PDF-Dokument oder der Seite.
virtual TextSearchOptions { get; set; }	Ruft Textsuchoptionen ab oder legt sie fest.

Methoden

Name	Beschreibung
virtual Visit(Document)	Extrahiert Text aus dem angegebenen Dokument
virtual Visit(Page)	Extrahiert Text auf der angegebenen Seite
virtual Visit(XForm)	Extrahiert Text aus dem angegebenen XForm.

Bemerkungen

DieTextAbsorber Objekt wird verwendet, um Text aus einem PDF-Dokument oder der Seite des Dokuments zu extrahieren.

Beispiele

Das Beispiel zeigt, wie Text auf der ersten PDF-Dokumentseite extrahiert wird.

// Dokument öffnen
Document doc = new Document(inFile);

// TextAbsorber-Objekt erstellen, um Text zu extrahieren
TextAbsorber absorber = new TextAbsorber();

// Akzeptiere den Absorber für die erste Seite
doc.Pages[1].Accept(absorber);

// Holen Sie sich den extrahierten Text
string extractedText = absorber.Text;

Siehe auch

namensraum Aspose.Pdf.Text
Montage Aspose.PDF

TableAbsorber TextBuilder