TextDevice
Inhalt
[
Ausblenden
]TextDevice class
Repräsentiert eine Klasse zum Konvertieren von PDF-Dokumentseiten in Text.
public sealed class TextDevice : PageDevice
Konstrukteure
Name | Beschreibung |
---|---|
TextDevice() | Initialisiert eine neue Instanz vonTextDevice mit dem Rohtext-Formatierungsmodus und der Unicode-Textkodierung. |
TextDevice(Encoding) | Initialisiert eine neue Instanz vonTextDevice für die angegebene Codierung. |
TextDevice(TextExtractionOptions) | Initialisiert eine neue Instanz vonTextDevice mit Textextraktionsoptionen. |
TextDevice(TextExtractionOptions, Encoding) | Initialisiert eine neue Instanz vonTextDevice für die angegebene Codierung mit Textextraktionsoptionen. |
Eigenschaften
Name | Beschreibung |
---|---|
Encoding { get; set; } | Ruft die Codierung von extrahiertem Text ab oder legt sie fest. |
ExtractionOptions { get; set; } | Ruft Textextraktionsoptionen ab oder legt sie fest. |
Methoden
Name | Beschreibung |
---|---|
override Process(Page, Stream) | Seite konvertieren und als Textstream speichern. |
Process(Page, string) | Führt einige Operationen auf der angegebenen Seite aus und speichert die Ergebnisse in der Datei. |
Bemerkungen
DieTextDevice
Das Objekt wird im Wesentlichen verwendet, um Text aus einer PDF-Seite zu extrahieren.
Beispiele
Das Beispiel zeigt, wie Text auf der ersten PDF-Dokumentseite extrahiert wird.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// Textgerät erstellen
TextDevice device = new TextDevice();
// Konvertiere die Seite und speichere den Text im Stream
device.Process(doc.Pages[1], ms);
// den extrahierten Text verwenden
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
Siehe auch
- class PageDevice
- namensraum Aspose.Pdf.Devices
- Montage Aspose.PDF