Class PdfExtractor

PdfExtractor class

فئة لاستخراج الصور والنصوص من مستند PDF.

public sealed class PdfExtractor : Facade

Constructors

NameDescription
PdfExtractor()Initializes new PdfExtractor object.
PdfExtractor(Document)Initializes new PdfExtractor object on base of the document.

Properties

NameDescription
Document { get; }يحصل على واجهة المستند التي يعمل عليها.
EndPage { get; set; }يحصل أو يحدد الصفحة النهائية في نطاق الصفحات حيث سيتم تنفيذ عملية الاستخراج.
ExtractImageMode { get; set; }يحدد الوضع لعملية استخراج الصور.
ExtractTextMode { get; set; }يحدد الوضع لنتيجة استخراج النص.
IsBidi { get; }يكون صحيحًا عندما يحتوي النص على رموز عبرية أو عربية. يجب أن تؤخذ هذه الحالة بعين الاعتبار بشكل خاص لأن دوال السلسلة تغير سلوكها وتبدأ في معالجة النص من اليمين إلى اليسار (باستثناء الأرقام وغيرها من الأحرف غير النصية).
Password { get; set; }يحصل أو يحدد كلمة مرور الملف المدخل.
Resolution { get; set; }يحدد أو يحصل على الدقة للصور المستخرجة. القيمة الافتراضية هي 150. الصور التي تحتوي على قيمة دقة أكبر تكون أكثر وضوحًا. ومع ذلك، فإن زيادة قيمة الدقة تؤدي إلى زيادة الوقت والذاكرة المطلوبة لاستخراج الصور. عادةً للحصول على صورة واضحة، يكفي ضبط الدقة على 150 أو 300.
StartPage { get; set; }يحصل أو يحدد الصفحة الأولى في نطاق الصفحات حيث سيتم تنفيذ عملية الاستخراج.
TextSearchOptions { get; set; }يحصل أو يحدد خيارات بحث النص.

Methods

NameDescription
virtual BindPdf(Document)Initializes the facade.
override BindPdf(Stream)يربط مستند PDF من الدفق.
override BindPdf(string)يربط ملف PDF المدخل.
virtual Close()يتخلص من Aspose.Pdf.Document المرتبط بواجهة.
Dispose()يتخلص من الواجهة.
ExtractAttachment()يستخرج المرفقات من مستند PDF.
ExtractAttachment(string)يستخرج المرفق إلى ملف PDF حسب اسم المرفق.
ExtractImage()يستخرج الصور من ملف PDF.
ExtractText()يستخرج النص من مستند PDF باستخدام ترميز Unicode.
ExtractText(Encoding)يستخرج النص من مستند PDF باستخدام الترميز المحدد.
GetAttachment()يحفظ جميع ملفات المرفقات إلى الدفقات.
GetAttachment(string)يخزن المرفق في ملف.
GetAttachmentInfo()يحصل على قائمة المرفقات.
GetAttachNames()يعيد قائمة المرفقات في ملف PDF. ملاحظة: يجب استدعاء ExtractAttachments قبل استخدام هذه الطريقة.
GetNextImage(Stream)يسترجع الصورة التالية من ملف PDF ويخزنها في الدفق.
GetNextImage(string)يسترجع الصورة التالية من مستند PDF. ملاحظة: يجب استدعاء ExtractImage قبل استخدام هذه الطريقة.
GetNextImage(Stream, ImageFormat)يسترجع الصورة التالية من ملف PDF ويخزنها في الدفق بالتنسيق المحدد للصورة.
GetNextImage(string, ImageFormat)يسترجع الصورة التالية من مستند PDF بالتنسيق المحدد للصورة. ملاحظة: يجب استدعاء ExtractImage قبل استخدام هذه الطريقة.
GetNextPageText(Stream)يحفظ نص صفحة واحدة في الدفق.
GetNextPageText(string)يحفظ نص صفحة واحدة في ملف.
GetText(Stream)يحفظ النص في الدفق. انظر أيضًا: ExtractText
GetText(string)يحفظ النص في ملف. انظر أيضًا: ExtractText
GetText(Stream, bool)يحفظ النص في الدفق. انظر أيضًا: ExtractText
HasNextImage()يتحقق مما إذا كانت هناك المزيد من الصور المتاحة في مستند PDF. ملاحظة: يجب استدعاء ExtractImage قبل استخدام هذه الطريقة.
HasNextPageText()يشير إلى ما إذا كان يمكن الحصول على المزيد من النصوص أم لا.

See Also