PdfExtractor

PdfExtractor class

فئة لاستخراج الصور والنصوص من مستند PDF.

public sealed class PdfExtractor : Facade

المنشئون

اسم وصف
PdfExtractor() تهيئة جديدPdfExtractor الكائن .
PdfExtractor(Document) تهيئة جديدPdfExtractor كائن على قاعدةdocument .

الخصائص

اسم وصف
Document { get; } الحصول على واجهة المستند التي تعمل عليها.
EndPage { get; set; } الحصول على أو تعيين صفحة النهاية في نطاق الصفحات حيث سيتم تنفيذ عملية الاستخراج.
ExtractImageMode { get; set; } يحدد وضع عملية استخراج الصور.
ExtractTextMode { get; set; } يضبط الوضع الخاص بنتيجة استخراج النص.
IsBidi { get; } يكون هذا صحيحًا عندما يكون للنص رموز عبري أو عربي. يجب مراعاة هذه الحالة بشكل خاص لأن دالات السلسلة تغير سلوكها وتبدأ معالجة النص من اليمين إلى اليسار (باستثناء الأرقام والأحرف غير النصية الأخرى) .
Password { get; set; } الحصول على أو تعيين كلمة مرور ملف الإدخال.
Resolution { get; set; } قم بتعيين أو الحصول على دقة للصور المستخرجة . القيمة الافتراضية هي 150. الصور التي لها قيمة دقة أكبر تكون أكثر وضوحًا . ومع ذلك ، تؤدي قيمة الدقة المتزايدة إلى زيادة الوقت والذاكرة اللازمتين لاستخراج الصور . عادةً ما يكفي الحصول على صورة واضحة. لضبط الدقة على 150 أو 300.
StartPage { get; set; } الحصول على أو تعيين صفحة البداية في نطاق الصفحات حيث سيتم تنفيذ عملية الاستخراج.
TextSearchOptions { get; set; } الحصول على أو تعيين خيارات البحث عن النص.

طُرق

اسم وصف
virtual BindPdf(Document) تهيئة الواجهة .
override BindPdf(Stream) ربط مستند PDF من الدفق .
override BindPdf(string) ربط ملف إدخال PDF .
virtual Close() Disposes Aspose.Pdf. وثيقة مرتبطة بواجهة .
Dispose() التخلص من الواجهة .
ExtractAttachment() لاستخراج المرفقات من مستند PDF .
ExtractAttachment(string) لاستخراج المرفقات إلى ملف PDF حسب اسم المرفق.
ExtractImage() استخراج الصور من ملف PDF .
ExtractText() استخراج نص من مستند Pdf باستخدام ترميز Unicode.
ExtractText(Encoding) استخراج نص من مستند Pdf باستخدام ترميز محدد.
GetAttachment() يحفظ كل ملفات المرفقات في streams.
GetAttachment(string) تخزين المرفقات في ملف .
GetAttachmentInfo() يحصل على قائمة المرفقات .
GetAttachNames() يقوم بإرجاع قائمة المرفقات في ملف PDF. ملاحظة: يجب استدعاء ExtractAttachments قبل استخدام هذه الطريقة.
GetNextImage(Stream) استرجع الصورة التالية من ملف PDF وتخزينها في البث المباشر.
GetNextImage(string) يسترجع الصورة التالية من مستند PDF. ملاحظة: يجب استدعاء ExtractImage قبل استخدام هذه الطريقة.
GetNextImage(Stream, ImageFormat) استرجع الصورة التالية من ملف PDF وقم بتخزينها في البث باستخدام تنسيق الصورة المحدد.
GetNextImage(string, ImageFormat) يسترجع الصورة التالية من مستند PDF بتنسيق معين للصورة. ملاحظة: يجب استدعاء ExtractImage قبل استخدام هذه الطريقة.
GetNextPageText(Stream) يحفظ نص صفحة واحدة للدفق.
GetNextPageText(string) يحفظ نص صفحة واحدة في ملف.
GetText(Stream) يحفظ النص للدفق. أنظر أيضا:ExtractText
GetText(string) يحفظ النص في ملف. أنظر أيضا:ExtractText
GetText(Stream, bool) يحفظ النص للدفق. أنظر أيضا:ExtractText
HasNextImage() للتحقق مما إذا كان يمكن الوصول إلى المزيد من الصور في مستند PDF. ملاحظة: يجب استدعاء ExtractImage قبل استخدام هذه الطريقة.
HasNextPageText() يشير إلى إمكانية الحصول على المزيد من النصوص أم لا.

أنظر أيضا