PdfExtractor

PdfExtractor class

Klasse zum Extrahieren von Bildern und Text aus einem PDF-Dokument.

public sealed class PdfExtractor : Facade

Konstrukteure

NameBeschreibung
PdfExtractor()Initialisiert neuPdfExtractor Objekt.
PdfExtractor(Document)Initialisiert neuPdfExtractor Objekt auf Basis derdocument .

Eigenschaften

NameBeschreibung
Document { get; }Ruft die Dokumentfassade ab, an der gearbeitet wird.
EndPage { get; set; }Ruft die Endseite im Seitenbereich ab oder legt sie fest, in der der Extraktionsvorgang ausgeführt wird.
ExtractImageMode { get; set; }Legt den Modus zum Extrahieren von Bildern fest.
ExtractTextMode { get; set; }Legt den Modus für das Ergebnis des Extrahierens von Text fest.
IsBidi { get; }Ist wahr, wenn der Text hebräische oder arabische Symbole enthält. Dieser Fall muss besonders berücksichtigt werden, da Zeichenfolgenfunktionen ihr Verhalten ändern und Text von rechts nach links beginnen (außer Zahlen und andere Nicht-Textzeichen).
Password { get; set; }Ruft das Passwort der Eingabedatei ab oder legt es fest.
Resolution { get; set; }Auflösung für extrahierte Bilder festlegen oder abrufen. Der Standardwert ist 150. Bilder mit einem höheren Auflösungswert sind klarer. Eine Erhöhung des Auflösungswerts führt jedoch zu einem erhöhten Zeit- und Speicherbedarf zum Extrahieren von Bildern. Normalerweise reicht es aus, um ein klares Bild zu erhalten um die Auflösung auf 150 oder 300 einzustellen.
StartPage { get; set; }Ruft die Startseite im Seitenbereich ab oder legt sie fest, in dem der Extraktionsvorgang ausgeführt wird.
TextSearchOptions { get; set; }Ruft Textsuchoptionen ab oder legt sie fest.

Methoden

NameBeschreibung
virtual BindPdf(Document)Initialisiert die Fassade.
override BindPdf(Stream)Bindet PDF-Dokument aus Stream.
override BindPdf(string)PDF-Eingabedatei binden.
virtual Close()Disposes Aspose.Pdf.Document gebunden mit einer Fassade.
Dispose()Entsorgt die Fassade.
ExtractAttachment()Extrahiert Anhänge aus einem PDF-Dokument.
ExtractAttachment(string)Extrahiert den Anhang in eine PDF-Datei nach Anhangsname.
ExtractImage()Bilder aus PDF-Datei extrahieren.
ExtractText()Extrahiert Text aus einem PDF-Dokument mit Unicode-Codierung.
ExtractText(Encoding)Extrahiert Text aus einem PDF-Dokument unter Verwendung der angegebenen Kodierung.
GetAttachment()Speichert alle angehängten Dateien in Streams.
GetAttachment(string)Speichert Anhang in Datei.
GetAttachmentInfo()Ruft die Liste der Anhänge ab.
GetAttachNames()Gibt eine Liste der Anhänge in der PDF-Datei zurück. Hinweis: ExtractAttachments muss vor der Verwendung dieser Methode aufgerufen werden.
GetNextImage(Stream)Ruft das nächste Bild aus der PDF-Datei ab und speichert es im Stream.
GetNextImage(string)Ruft das nächste Bild aus dem PDF-Dokument ab. Hinweis: ExtractImage muss vor der Verwendung dieser Methode aufgerufen werden.
GetNextImage(Stream, ImageFormat)Ruft das nächste Bild aus der PDF-Datei ab und speichert es im Stream mit dem angegebenen Bildformat.
GetNextImage(string, ImageFormat)Ruft das nächste Bild aus dem PDF-Dokument mit dem angegebenen Bildformat ab. Hinweis: ExtractImage muss vor der Verwendung dieser Methode aufgerufen werden.
GetNextPageText(Stream)Speichert den Text einer Seite im Stream.
GetNextPageText(string)Speichert den Text einer Seite in einer Datei.
GetText(Stream)Speichert Text im Stream. siehe auch:ExtractText
GetText(string)Speichert Text in Datei. siehe auch:ExtractText
GetText(Stream, bool)Speichert Text im Stream. siehe auch:ExtractText
HasNextImage()Prüft, ob mehr Bilder im PDF-Dokument zugänglich sind. Hinweis: ExtractImage muss vor der Verwendung dieser Methode aufgerufen werden.
HasNextPageText()Gibt an, ob weitere SMS empfangen werden können oder nicht.

Siehe auch