स्टाम्प एनोटेशन से टेक्स्ट निकालें

इस ट्यूटोरियल में, हम आपको चरण दर चरण बताएंगे कि .NET के लिए Aspose.PDF का उपयोग करके पीडीएफ दस्तावेज़ में स्टैम्प एनोटेशन से टेक्स्ट कैसे निकाला जाए। हम आपको दिखाएंगे कि पीडीएफ दस्तावेज़ के दिए गए पृष्ठ पर एक विशिष्ट स्टाम्प एनोटेशन से टेक्स्ट निकालने के लिए दिए गए सी # स्रोत कोड का उपयोग कैसे करें।

चरण 1: वातावरण स्थापित करना

शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित हैं:

  • एक स्थापित .NET विकास वातावरण।
  • .NET के लिए Aspose.PDF लाइब्रेरी डाउनलोड की गई और आपके प्रोजेक्ट में संदर्भित की गई।

चरण 2: पीडीएफ दस्तावेज़ लोड हो रहा है

पहला कदम मौजूदा पीडीएफ दस्तावेज़ को अपने प्रोजेक्ट में लोड करना है। ऐसे:

// दस्तावेज़ निर्देशिका का पथ.
string dataDir = "YOUR DOCUMENTS DIRECTORY";

// दस्तावेज़ लोड करें
Document doc = new Document(dataDir + "test.pdf");

“आपकी दस्तावेज़ निर्देशिका” को उस निर्देशिका के वास्तविक पथ से बदलना सुनिश्चित करें जहां आपका पीडीएफ दस्तावेज़ स्थित है।

चरण 3: स्टाम्प एनोटेशन से टेक्स्ट निकालें

अब जब आपने पीडीएफ दस्तावेज़ लोड कर लिया है, तो आप विशिष्ट स्टाम्प एनोटेशन से टेक्स्ट निकाल सकते हैं। ऐसे:

// बफ़र एनोटेशन पुनर्प्राप्त करें
StampAnnotation annot = doc.Pages[1].Annotations[3] as StampAnnotation;

// एक टेक्स्ट अवशोषक बनाएं
TextAbsorber ta = new TextAbsorber();

// एनोटेशन के स्वरूप पर जाएँ
XForm ap = annot. Appearance["N"];
ta.Visit(ap);

// निकाले गए पाठ को प्रदर्शित करें
Console.WriteLine(ta.Text);

उपरोक्त कोड पीडीएफ दस्तावेज़ के निर्दिष्ट पृष्ठ से स्टाम्प एनोटेशन को पुनः प्राप्त करता है और फिर एनोटेशन की उपस्थिति से टेक्स्ट को निकालने के लिए एक टेक्स्ट अवशोषक का उपयोग करता है। फिर निकाला गया टेक्स्ट आउटपुट में प्रदर्शित होता है।

.NET के लिए Aspose.PDF का उपयोग करके स्टाम्प एनोटेशन से टेक्स्ट निकालने के लिए नमूना स्रोत कोड


string dataDir = "YOUR DOCUMENT DIRECTORY";
Document doc = new Document(dataDir + "test.pdf");
StampAnnotation annot = doc.Pages[1].Annotations[3] as StampAnnotation;
TextAbsorber ta = new TextAbsorber();
XForm ap = annot.Appearance["N"];
ta.Visit(ap);
Console.WriteLine(ta.Text);

निष्कर्ष

बधाई हो! आपने सीखा है कि .NET के लिए Aspose.PDF का उपयोग करके पीडीएफ दस्तावेज़ में स्टैम्प एनोटेशन से टेक्स्ट कैसे निकाला जाता है। अब आप अपने पीडीएफ दस्तावेज़ों में अन्य एनोटेशन से टेक्स्ट निकालने के लिए इस पद्धति का उपयोग कर सकते हैं।

स्टाम्प एनोटेशन से टेक्स्ट निकालने के लिए अक्सर पूछे जाने वाले प्रश्न

प्रश्न: पीडीएफ दस्तावेज़ में स्टाम्प एनोटेशन क्या है, और मुझे इससे टेक्स्ट निकालने की आवश्यकता क्यों होगी?

उ: पीडीएफ दस्तावेज़ में स्टैम्प एनोटेशन एक ग्राफिकल तत्व है जिसका उपयोग वॉटरमार्क या रबर स्टैम्प जैसी अतिरिक्त जानकारी प्रदान करने के लिए किया जा सकता है। स्टैम्प एनोटेशन से टेक्स्ट निकालना तब उपयोगी होता है जब आप इन एनोटेशन से टेक्स्ट-आधारित सामग्री पुनर्प्राप्त करना चाहते हैं, जिसमें नोट्स, लेबल या अन्य टेक्स्ट संबंधी जानकारी शामिल हो सकती है।

प्रश्न: प्रदान किया गया C# स्रोत कोड स्टैम्प एनोटेशन से टेक्स्ट कैसे निकालता है?

उ: प्रदान किया गया स्रोत कोड दर्शाता है कि पीडीएफ दस्तावेज़ के दिए गए पृष्ठ पर एक विशिष्ट स्टाम्प एनोटेशन से टेक्स्ट कैसे निकाला जाए। यह स्टाम्प एनोटेशन को पुनः प्राप्त करने के लिए Aspose.PDF लाइब्रेरी का उपयोग करता है, इसका उपयोग करके इसके स्वरूप पर जाएँTextAbsorber, और फिर आउटपुट में निकाले गए टेक्स्ट को प्रदर्शित करता है।

प्रश्न: क्या मैं एक समान दृष्टिकोण का उपयोग करके विभिन्न प्रकार के एनोटेशन से टेक्स्ट निकाल सकता हूँ?

उ: हां, आप अन्य प्रकार के एनोटेशन, जैसे टेक्स्ट एनोटेशन या पॉपअप एनोटेशन से टेक्स्ट निकालने के लिए एक समान दृष्टिकोण का उपयोग कर सकते हैं। आपको उस विशिष्ट प्रकार के एनोटेशन को लक्षित करने के लिए कोड को संशोधित करने की आवश्यकता होगी जिससे आप टेक्स्ट निकालना चाहते हैं।

प्रश्न: इसका उद्देश्य क्या है?TextAbsorber class in the code?

ए: दTextAbsorber क्लास का उपयोग स्टाम्प एनोटेशन सहित पीडीएफ दस्तावेज़ के विभिन्न हिस्सों से टेक्स्ट निकालने के लिए किया जाता है। यह पीडीएफ के निर्दिष्ट क्षेत्र या तत्व में पाई गई पाठ सामग्री को “अवशोषित” या कैप्चर करता है।

प्रश्न: मैं उस विशिष्ट स्टाम्प एनोटेशन की पहचान कैसे करूँ जिससे मैं पाठ निकालना चाहता हूँ?

ए: दिए गए कोड में, स्टाम्प एनोटेशन को एक्सेस करके पहचाना जाता हैAnnotations एक विशिष्ट पृष्ठ का संग्रह और वांछित एनोटेशन को पुनः प्राप्त करने के लिए सूचकांक का उपयोग करना। आप लक्ष्य एनोटेशन की पहचान करने के लिए सूचकांक को समायोजित कर सकते हैं या अन्य मानदंडों का उपयोग कर सकते हैं।

प्रश्न: क्या मैं एक ही पृष्ठ पर एकाधिक स्टाम्प एनोटेशन से टेक्स्ट निकाल सकता हूँ?

उ: हाँ, आप कोड को लूप के माध्यम से संशोधित कर सकते हैंAnnotationsएक पृष्ठ का संग्रह, स्टाम्प एनोटेशन फ़िल्टर करें, और उनमें से प्रत्येक से पाठ निकालें।

प्रश्न: यदि स्टाम्प एनोटेशन में कोई पाठ्य सामग्री नहीं है तो क्या होगा? क्या कोड अभी भी काम करेगा?

उ: कोड अभी भी काम करेगा, लेकिन यदि स्टाम्प एनोटेशन की उपस्थिति में कोई पाठ्य सामग्री नहीं है तो यह एक खाली स्ट्रिंग निकालेगा और प्रदर्शित करेगा।

प्रश्न: मैं निकाले गए टेक्स्ट को आउटपुट में प्रदर्शित करने के बजाय फ़ाइल में कैसे सहेज सकता हूं?

उ: आप निकाले गए टेक्स्ट को कंसोल में प्रदर्शित करने के बजाय फ़ाइल में सहेजने के लिए कोड को संशोधित कर सकते हैं। बस प्रतिस्थापित करेंConsole.WriteLine फ़ाइल में टेक्स्ट लिखने के लिए कोड के साथ स्टेटमेंट।

प्रश्न: मैं निकाले गए पाठ का उपयोग आगे की प्रक्रिया या विश्लेषण में कैसे कर सकता हूं?

उ: एक बार जब आप दिए गए तरीके का उपयोग करके पाठ निकाल लेते हैं, तो आप इसे एक चर में संग्रहीत कर सकते हैं, इसमें हेरफेर कर सकते हैं, इसका विश्लेषण कर सकते हैं, या आवश्यकतानुसार इसे अपने एप्लिकेशन के अन्य हिस्सों में एकीकृत कर सकते हैं।