ExtractText
İçindekiler
[
Saklamak
]ExtractText()
Unicode kodlamasını kullanarak bir Pdf belgesinden metin çıkarır.
public void ExtractText()
Örnekler
İlk örnek, tüm metnin PDF dosyasından nasıl çıkarılacağını gösterir. İkinci örnek, her sayfanın metninin tek bir txt dosyasına nasıl çıkarılacağını gösterir.
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(@"D:\Text\text.pdf");
extractor.ExtractText();
extractor.GetText(@"D:\Text\text.txt");
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf("D:\Text\text.pdf")
extractor.ExtractText()
extractor.GetText("D:\Text\text.txt")
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(TestPath + @"Aspose.Pdf.Kit.Pdf");
extractor.ExtractText();
String prefix = TestPath + @"Aspose.Pdf.Kit";
String suffix = ".txt";
int pageCount = 1;
while (extractor.HasNextPageText())
{
extractor.GetNextPageText(prefix + pageCount + suffix);
pageCount++;
}
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf(TestPath + "Aspose.Pdf.Kit.Pdf")
extractor.ExtractText()
Dim prefix As String = TestPath + "Aspose.Pdf.Kit"
Dim suffix As String = ".txt"
Dim pageCount As Integer = 1
While extractor.HasNextPageText()
extractor.GetNextPageText(prefix + pageCount + suffix)
pageCount = pageCount + 1
End While
Ayrıca bakınız
- class PdfExtractor
- ad alanı Aspose.Pdf.Facades
- toplantı Aspose.PDF
ExtractText(Encoding)
Belirtilen kodlamayı kullanarak bir Pdf belgesinden metin çıkarır.
public void ExtractText(Encoding encoding)
Parametre | Tip | Tanım |
---|---|---|
encoding | Encoding | Ayıklanan metnin kodlaması. |
Örnekler
İlk örnek, tüm metnin PDF dosyasından nasıl çıkarılacağını gösterir. İkinci örnek, her sayfanın metninin tek bir txt dosyasına nasıl çıkarılacağını gösterir.
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(@"D:\Text\text.pdf");
extractor.ExtractText(Encoding.Unicode);
extractor.GetText(@"D:\Text\text.txt");
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf("D:\Text\text.pdf")
extractor.ExtractText(Encoding.Unicode)
extractor.GetText("D:\Text\text.txt")
PdfExtractor extractor = new PdfExtractor();
extractor.BindPdf(TestPath + @"Aspose.Pdf.Kit.Pdf");
extractor.ExtractText(Encoding.Unicode);
String prefix = TestPath + @"Aspose.Pdf.Kit";
String suffix = ".txt";
int pageCount = 1;
while (extractor.HasNextPageText())
{
extractor.GetNextPageText(prefix + pageCount + suffix);
pageCount++;
}
Dim extractor As PdfExtractor = New PdfExtractor()
extractor.BindPdf(TestPath + "Aspose.Pdf.Kit.Pdf")
extractor.ExtractText(Encoding.Unicode)
Dim prefix As String = TestPath + "Aspose.Pdf.Kit"
Dim suffix As String = ".txt"
Dim pageCount As Integer = 1
While extractor.HasNextPageText()
extractor.GetNextPageText(prefix + pageCount + suffix)
pageCount = pageCount + 1
End While
Ayrıca bakınız
- class PdfExtractor
- ad alanı Aspose.Pdf.Facades
- toplantı Aspose.PDF