PdfExtractor

PdfExtractor class

PDF belgesinden resim ve metin çıkarmak için sınıf.

public sealed class PdfExtractor : Facade

yapıcılar

İsim Tanım
PdfExtractor() Yeniyi başlatırPdfExtractor nesne.
PdfExtractor(Document) Yeniyi başlatırPdfExtractor temelinde nesnedocument .

Özellikleri

İsim Tanım
Document { get; } Üzerinde çalıştığı belge cephesini alır.
EndPage { get; set; } Çıkarma işleminin gerçekleştirileceği sayfa aralığındaki bitiş sayfasını alır veya ayarlar.
ExtractImageMode { get; set; } Görüntü çıkarma işlemi için modu ayarlar.
ExtractTextMode { get; set; } Metin çıkarma sonucunun modunu ayarlar.
IsBidi { get; } Metinde İbranice veya Arapça semboller olduğunda doğrudur. Bu durum özellikle dikkate alınmalıdır, çünkü dize işlevleri davranışlarını değiştirir ve işlem metnini sağdan sola başlatır ( sayıları ve diğer metin olmayan karakterler hariç).
Password { get; set; } Girdi dosyasının parolasını alır veya ayarlar.
Resolution { get; set; } Çıkarılan görüntüler için çözünürlüğü ayarlar veya alır. Varsayılan değer 150’dir. Çözünürlük değeri daha yüksek olan görüntüler daha nettir. Ancak çözünürlük değerini artırmak, görüntüleri çıkarmak için gereken süreyi ve belleği artırır. Genellikle net görüntü elde etmek için yeterlidir. çözünürlüğü 150 veya 300. olarak ayarlamak için
StartPage { get; set; } Çıkarma işleminin gerçekleştirileceği sayfa aralığındaki başlangıç sayfasını alır veya ayarlar.
TextSearchOptions { get; set; } Metin arama seçeneklerini alır veya ayarlar.

yöntemler

İsim Tanım
virtual BindPdf(Document) Cepheyi başlatır.
override BindPdf(Stream) Akıştan PDF belgesini bağlar.
override BindPdf(string) Giriş PDF dosyasını bağla.
virtual Close() Aspose.Pdf.Document’ı bir cepheye bağlı olarak imha eder.
Dispose() Cepheyi ortadan kaldırır.
ExtractAttachment() Bir Pdf belgesinden ekleri çıkarır.
ExtractAttachment(string) Eki, ek adına göre PDF dosyasına çıkarır.
ExtractImage() PDF dosyasından görüntüleri çıkarın.
ExtractText() Unicode kodlamasını kullanarak bir Pdf belgesinden metin çıkarır.
ExtractText(Encoding) Belirtilen kodlamayı kullanarak bir Pdf belgesinden metin çıkarır.
GetAttachment() Tüm ek dosyasını akışlara kaydeder.
GetAttachment(string) Eki dosyada saklar.
GetAttachmentInfo() Eklerin listesini alır.
GetAttachNames() PDF dosyasındaki eklerin listesini döndürür. Not: Bu yöntemi kullanmadan önce ExtractAttachments çağrılmalıdır.
GetNextImage(Stream) PDF dosyasından sonraki görüntüyü alın ve akışta depolayın.
GetNextImage(string) PDF belgesinden sonraki görüntüyü alır. Not: Bu yöntem kullanılmadan önce ExtractImage çağrılmalıdır.
GetNextImage(Stream, ImageFormat) PDF dosyasından sonraki görüntüyü alın ve verilen görüntü formatı ile akışta saklar.
GetNextImage(string, ImageFormat) Verilen görüntü biçimiyle PDF belgesinden sonraki görüntüyü alır. Not: Bu yöntem kullanılmadan önce ExtractImage çağrılmalıdır.
GetNextPageText(Stream) Bir sayfanın metnini akışa kaydeder.
GetNextPageText(string) Bir sayfanın metnini dosyaya kaydeder.
GetText(Stream) Metni akışa kaydeder. Ayrıca bakınız:ExtractText
GetText(string) Metni dosyaya kaydeder. Ayrıca bakınız:ExtractText
GetText(Stream, bool) Metni akışa kaydeder. Ayrıca bakınız:ExtractText
HasNextImage() PDF belgesinde daha fazla görüntünün erişilebilir olup olmadığını kontrol eder. Not: Bu yöntem kullanılmadan önce ExtractImage çağrılmalıdır.
HasNextPageText() Daha fazla metin alıp alamayacağını belirtir.

Ayrıca bakınız