TextDevice
محتويات
[
يخفي
]TextDevice class
يمثل فئة لتحويل صفحات مستند pdf إلى نص.
public sealed class TextDevice : PageDevice
المنشئون
اسم | وصف |
---|---|
TextDevice() | يقوم بتهيئة مثيل جديد لملفTextDevice مع وضع تنسيق النص الخام وترميز نص Unicode. |
TextDevice(Encoding) | يقوم بتهيئة مثيل جديد لملفTextDevice للترميز المحدد. |
TextDevice(TextExtractionOptions) | يقوم بتهيئة مثيل جديد لملفTextDevice مع خيارات استخراج النص. |
TextDevice(TextExtractionOptions, Encoding) | يقوم بتهيئة مثيل جديد لملفTextDevice للترميز المحدد مع خيارات استخراج النص. |
الخصائص
اسم | وصف |
---|---|
Encoding { get; set; } | الحصول على أو تعيين ترميز النص المستخرج. |
ExtractionOptions { get; set; } | الحصول على أو تعيين خيارات استخراج النص. |
طُرق
اسم | وصف |
---|---|
override Process(Page, Stream) | تحويل الصفحة وحفظها كتدفق نصي . |
Process(Page, string) | يقوم ببعض العمليات على الصفحة المحددة ويحفظ النتائج في الملف. |
ملاحظات
ملفTextDevice
يتم استخدام الكائن بشكل أساسي لاستخراج النص من صفحة pdf.
أمثلة
يوضح المثال كيفية استخراج النص من صفحة مستند PDF الأولى.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// إنشاء جهاز نصي
TextDevice device = new TextDevice();
// تحويل الصفحة وحفظ النص في الدفق
device.Process(doc.Pages[1], ms);
// استخدام النص المستخرج
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
أنظر أيضا
- class PageDevice
- مساحة الاسم Aspose.Pdf.Devices
- المجسم Aspose.PDF