TextDevice

TextDevice class

Repräsentiert eine Klasse zum Konvertieren von PDF-Dokumentseiten in Text.

public sealed class TextDevice : PageDevice

Konstrukteure

NameBeschreibung
TextDevice()Initialisiert eine neue Instanz vonTextDevice mit dem Rohtext-Formatierungsmodus und der Unicode-Textkodierung.
TextDevice(Encoding)Initialisiert eine neue Instanz vonTextDevice für die angegebene Codierung.
TextDevice(TextExtractionOptions)Initialisiert eine neue Instanz vonTextDevice mit Textextraktionsoptionen.
TextDevice(TextExtractionOptions, Encoding)Initialisiert eine neue Instanz vonTextDevice für die angegebene Codierung mit Textextraktionsoptionen.

Eigenschaften

NameBeschreibung
Encoding { get; set; }Ruft die Codierung von extrahiertem Text ab oder legt sie fest.
ExtractionOptions { get; set; }Ruft Textextraktionsoptionen ab oder legt sie fest.

Methoden

NameBeschreibung
override Process(Page, Stream)Seite konvertieren und als Textstream speichern.
Process(Page, string)Führt einige Operationen auf der angegebenen Seite aus und speichert die Ergebnisse in der Datei.

Bemerkungen

DieTextDevice Das Objekt wird im Wesentlichen verwendet, um Text aus einer PDF-Seite zu extrahieren.

Beispiele

Das Beispiel zeigt, wie Text auf der ersten PDF-Dokumentseite extrahiert wird.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // Textgerät erstellen
    TextDevice device = new TextDevice();

    // Konvertiere die Seite und speichere den Text im Stream
    device.Process(doc.Pages[1], ms);

    // den extrahierten Text verwenden
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Siehe auch