TextAbsorber
Inhalt
[
Ausblenden
]TextAbsorber class
Stellt ein Absorberobjekt eines Textes dar. Führt eine Textextraktion durch und bietet Zugriff auf das Ergebnis überText
Objekt.
public class TextAbsorber
Konstrukteure
Name | Beschreibung |
---|---|
TextAbsorber() | Initialisiert eine neue Instanz vonTextAbsorber . |
TextAbsorber(TextExtractionOptions) | Initialisiert eine neue Instanz vonTextAbsorber mit Extraktionsoptionen. |
TextAbsorber(TextSearchOptions) | Initialisiert eine neue Instanz vonTextAbsorber mit Textsuchoptionen. |
TextAbsorber(TextExtractionOptions, TextSearchOptions) | Initialisiert eine neue Instanz vonTextAbsorber mit Extraktions- und Textsuchoptionen. |
Eigenschaften
Name | Beschreibung |
---|---|
Errors { get; } | Liste vonTextExtractionError Objekte. Es enthält Informationen über Fehler, die während der Textextraktion gefunden wurden. Die Suche nach Fehlern wird nur durchgeführt, wenn TextSearchOptions.LogTextExtractionErrors = true; Und es kann die Leistung beeinträchtigen. |
virtual ExtractionOptions { get; set; } | Ruft Textextraktionsoptionen ab oder legt sie fest. |
HasErrors { get; } | Wert gibt an, ob bei der Textextraktion Fehler gefunden wurden. Die Suche nach Fehlern wird nur durchgeführt, wenn TextSearchOptions.LogTextExtractionErrors = true; Und es kann die Leistung beeinträchtigen. |
virtual Text { get; } | Ruft extrahierten Text ab, der dieTextAbsorber Auszüge auf dem PDF-Dokument oder der Seite. |
virtual TextSearchOptions { get; set; } | Ruft Textsuchoptionen ab oder legt sie fest. |
Methoden
Name | Beschreibung |
---|---|
virtual Visit(Document) | Extrahiert Text aus dem angegebenen Dokument |
virtual Visit(Page) | Extrahiert Text auf der angegebenen Seite |
virtual Visit(XForm) | Extrahiert Text aus dem angegebenen XForm. |
Bemerkungen
DieTextAbsorber
Objekt wird verwendet, um Text aus einem PDF-Dokument oder der Seite des Dokuments zu extrahieren.
Beispiele
Das Beispiel zeigt, wie Text auf der ersten PDF-Dokumentseite extrahiert wird.
// Dokument öffnen
Document doc = new Document(inFile);
// TextAbsorber-Objekt erstellen, um Text zu extrahieren
TextAbsorber absorber = new TextAbsorber();
// Akzeptiere den Absorber für die erste Seite
doc.Pages[1].Accept(absorber);
// Holen Sie sich den extrahierten Text
string extractedText = absorber.Text;
Siehe auch
- namensraum Aspose.Pdf.Text
- Montage Aspose.PDF