Class ParagraphAbsorber

فئة ParagraphAbsorber

تمثل كائن ماص لأشياء هيكل الصفحة مثل الأقسام والفقرات. يقوم بالبحث عن الأقسام والفقرات النصية ويوفر الوصول إلى المستطيلات والأشكال المتعددة التي تصفها في فضاء إحداثيات النص. كما يقوم أيضًا بالبحث عن مقاطع النص ويوفر الوصول إلى نتائج البحث عبر !:TextFragments المجمعة حسب عناصر الهيكل.

public class ParagraphAbsorber

المنشئات

الاسمالوصف
ParagraphAbsorber()يقوم بتهيئة مثيل جديد من ParagraphAbsorber الذي يقوم بالبحث عن الأقسام/الفقرات في المستند أو الصفحة.
ParagraphAbsorber(int)يقوم بتهيئة مثيل جديد من ParagraphAbsorber الذي يقوم بالبحث عن الأقسام/الفقرات في المستند أو الصفحة.
ParagraphAbsorber(ParagraphAbsorberOptions)يقوم بتهيئة مثيل جديد من ParagraphAbsorber الذي يقوم بالبحث عن الأقسام/الفقرات في المستند أو الصفحة مع المعلمات المحددة.
ParagraphAbsorber(int, ParagraphAbsorberOptions)يقوم بتهيئة مثيل جديد من ParagraphAbsorber الذي يقوم بالبحث عن الأقسام/الفقرات في المستند أو الصفحة مع المعلمات المحددة.

الخصائص

الاسمالوصف
IsMulticolumnParagraphsAllowed { get; set; }يحصل أو يحدد القيمة التي تشير إلى ما إذا كانت خطوط النص التي تبدأ في قسم جديد يمكن اعتبارها استمرارًا للفقرة الأخيرة من القسم السابق.
PageMarkups { get; }يحصل على مجموعة من PageMarkup التي تم امتصاصها.
ParagraphAbsorberOptions { get; set; }يحصل أو يحدد خيارات ParagraphAbsorber.
SectionsSearchDepth { get; set; }يحصل أو يحدد القيمة التي تو instructs عدد مرات البحث المتسلسل عن عناصر الهيكل الأكثر دقة. عمق البحث الافتراضي هو 3. وهذا يعني ثلاث عمليات بحث عن الأقسام المقسمة أفقيًا (العناوين، الفقرات، إلخ) وثلاث عمليات بحث عن الأقسام المقسمة عموديًا (الأعمدة).
TextReplaceOptions { get; set; }يحصل أو يحدد خيارات TextReplace.

الطرق

الاسمالوصف
Visit(Document)يقوم بالبحث عن الأقسام والفقرات في Document.
Visit(Page)يقوم بالبحث في Page.

ملاحظات

عند الانتهاء من البحث، ستحتوي مجموعة PageMarkups على كائنات PageMarkup التي تمثل هيكل الصفحة من خلال مجموعات MarkupSection وMarkupParagraph. يوفر كائن TextFragment الوصول إلى نص حدوث البحث، وخصائص النص، ويسمح بتحرير النص وتغيير حالة النص (الخط، حجم الخط، اللون، إلخ).

أمثلة

توضح المثال كيفية العثور على أول مقطع نصي من كل فقرة في الصفحة الأولى من مستند PDF وتظليله.

// Open document
Document doc = new Document("input.pdf");

// Create ParagraphAbsorber object
ParagraphAbsorber absorber = new ParagraphAbsorber();

// Accept the absorber for first page
absorber.Visit(doc.Pages[1]);

// Get markup object of first page
PageMarkup markup = absorber.PageMarkups[0];

// Loop through structure elements of the page text to find first text fragment of each paragraph
foreach (MarkupSection section in markup.Sections)
{
    foreach (MarkupParagraph paragraph in section.Paragraphs)
    {
        TextFragment fragment = paragraph.Fragments[0];
        // Update text properties
        fragment.TextState.BackgroundColor = Color.LightBlue;
    }
}

// Save document
doc.Save(GetOutputPath("output.pdf"));

انظر أيضًا