TextAbsorber

TextAbsorber class

Stellt ein Absorberobjekt eines Textes dar. Führt eine Textextraktion durch und bietet Zugriff auf das Ergebnis überText Objekt.

public class TextAbsorber

Konstrukteure

NameBeschreibung
TextAbsorber()Initialisiert eine neue Instanz vonTextAbsorber .
TextAbsorber(TextExtractionOptions)Initialisiert eine neue Instanz vonTextAbsorber mit Extraktionsoptionen.
TextAbsorber(TextSearchOptions)Initialisiert eine neue Instanz vonTextAbsorber mit Textsuchoptionen.
TextAbsorber(TextExtractionOptions, TextSearchOptions)Initialisiert eine neue Instanz vonTextAbsorber mit Extraktions- und Textsuchoptionen.

Eigenschaften

NameBeschreibung
Errors { get; }Liste vonTextExtractionError Objekte. Es enthält Informationen über Fehler, die während der Textextraktion gefunden wurden. Die Suche nach Fehlern wird nur durchgeführt, wenn TextSearchOptions.LogTextExtractionErrors = true; Und es kann die Leistung beeinträchtigen.
virtual ExtractionOptions { get; set; }Ruft Textextraktionsoptionen ab oder legt sie fest.
HasErrors { get; }Wert gibt an, ob bei der Textextraktion Fehler gefunden wurden. Die Suche nach Fehlern wird nur durchgeführt, wenn TextSearchOptions.LogTextExtractionErrors = true; Und es kann die Leistung beeinträchtigen.
virtual Text { get; }Ruft extrahierten Text ab, der dieTextAbsorber Auszüge auf dem PDF-Dokument oder der Seite.
virtual TextSearchOptions { get; set; }Ruft Textsuchoptionen ab oder legt sie fest.

Methoden

NameBeschreibung
virtual Visit(Document)Extrahiert Text aus dem angegebenen Dokument
virtual Visit(Page)Extrahiert Text auf der angegebenen Seite
virtual Visit(XForm)Extrahiert Text aus dem angegebenen XForm.

Bemerkungen

DieTextAbsorber Objekt wird verwendet, um Text aus einem PDF-Dokument oder der Seite des Dokuments zu extrahieren.

Beispiele

Das Beispiel zeigt, wie Text auf der ersten PDF-Dokumentseite extrahiert wird.

// Dokument öffnen
Document doc = new Document(inFile);

// TextAbsorber-Objekt erstellen, um Text zu extrahieren
TextAbsorber absorber = new TextAbsorber();

// Akzeptiere den Absorber für die erste Seite
doc.Pages[1].Accept(absorber);

// Holen Sie sich den extrahierten Text
string extractedText = absorber.Text;

Siehe auch