ExtractText
Inhalt
[
Ausblenden
]ExtractText()
Extrahiert Text aus einem PDF-Dokument mit Unicode-Codierung.
public void ExtractText()
Beispiele
Das erste Beispiel zeigt, wie der gesamte Text aus einer PDF-Datei extrahiert wird. Das zweite Beispiel zeigt, wie der Text jeder Seite in eine TXT-Datei extrahiert wird.
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(@"D:\Text\text.pdf");
extractor.ExtractText();
extractor.GetText(@"D:\Text\text.txt");
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf("D:\Text\text.pdf")
extractor.ExtractText()
extractor.GetText("D:\Text\text.txt")
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(TestPath + @"Aspose.Pdf.Kit.Pdf");
extractor.ExtractText();
String prefix = TestPath + @"Aspose.Pdf.Kit";
String suffix = ".txt";
int pageCount = 1;
while (extractor.HasNextPageText())
{
extractor.GetNextPageText(prefix + pageCount + suffix);
pageCount++;
}
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf(TestPath + "Aspose.Pdf.Kit.Pdf")
extractor.ExtractText()
Dim prefix As String = TestPath + "Aspose.Pdf.Kit"
Dim suffix As String = ".txt"
Dim pageCount As Integer = 1
While extractor.HasNextPageText()
extractor.GetNextPageText(prefix + pageCount + suffix)
pageCount = pageCount + 1
End While
Siehe auch
- class PdfExtractor
- namensraum Aspose.Pdf.Facades
- Montage Aspose.PDF
ExtractText(Encoding)
Extrahiert Text aus einem PDF-Dokument unter Verwendung der angegebenen Kodierung.
public void ExtractText(Encoding encoding)
Parameter | Typ | Beschreibung |
---|---|---|
encoding | Encoding | Die Kodierung des extrahierten Textes. |
Beispiele
Das erste Beispiel zeigt, wie der gesamte Text aus einer PDF-Datei extrahiert wird. Das zweite Beispiel zeigt, wie der Text jeder Seite in eine TXT-Datei extrahiert wird.
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(@"D:\Text\text.pdf");
extractor.ExtractText(Encoding.Unicode);
extractor.GetText(@"D:\Text\text.txt");
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf("D:\Text\text.pdf")
extractor.ExtractText(Encoding.Unicode)
extractor.GetText("D:\Text\text.txt")
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(TestPath + @"Aspose.Pdf.Kit.Pdf");
extractor.ExtractText(Encoding.Unicode);
String prefix = TestPath + @"Aspose.Pdf.Kit";
String suffix = ".txt";
int pageCount = 1;
while (extractor.HasNextPageText())
{
extractor.GetNextPageText(prefix + pageCount + suffix);
pageCount++;
}
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf(TestPath + "Aspose.Pdf.Kit.Pdf")
extractor.ExtractText(Encoding.Unicode)
Dim prefix As String = TestPath + "Aspose.Pdf.Kit"
Dim suffix As String = ".txt"
Dim pageCount As Integer = 1
While extractor.HasNextPageText()
extractor.GetNextPageText(prefix + pageCount + suffix)
pageCount = pageCount + 1
End While
Siehe auch
- class PdfExtractor
- namensraum Aspose.Pdf.Facades
- Montage Aspose.PDF