TextDevice

TextDevice class

يمثل فئة لتحويل صفحات مستند pdf إلى نص.

public sealed class TextDevice : PageDevice

المنشئون

اسم وصف
TextDevice() يقوم بتهيئة مثيل جديد لملفTextDevice مع وضع تنسيق النص الخام وترميز نص Unicode.
TextDevice(Encoding) يقوم بتهيئة مثيل جديد لملفTextDevice للترميز المحدد.
TextDevice(TextExtractionOptions) يقوم بتهيئة مثيل جديد لملفTextDevice مع خيارات استخراج النص.
TextDevice(TextExtractionOptions, Encoding) يقوم بتهيئة مثيل جديد لملفTextDevice للترميز المحدد مع خيارات استخراج النص.

الخصائص

اسم وصف
Encoding { get; set; } الحصول على أو تعيين ترميز النص المستخرج.
ExtractionOptions { get; set; } الحصول على أو تعيين خيارات استخراج النص.

طُرق

اسم وصف
override Process(Page, Stream) تحويل الصفحة وحفظها كتدفق نصي .
Process(Page, string) يقوم ببعض العمليات على الصفحة المحددة ويحفظ النتائج في الملف.

ملاحظات

ملفTextDevice يتم استخدام الكائن بشكل أساسي لاستخراج النص من صفحة pdf.

أمثلة

يوضح المثال كيفية استخراج النص من صفحة مستند PDF الأولى.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // إنشاء جهاز نصي
    TextDevice device = new TextDevice();

    // تحويل الصفحة وحفظ النص في الدفق
    device.Process(doc.Pages[1], ms);

    // استخدام النص المستخرج
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

أنظر أيضا