Szöveg kivonat a bélyegző megjegyzéséből
Ebben az oktatóanyagban lépésről lépésre bemutatjuk, hogyan lehet szöveget kivonni egy PDF-dokumentum bélyegzőjegyzetéből az Aspose.PDF for .NET használatával. Megmutatjuk, hogyan használhatja a megadott C# forráskódot a szöveg kinyerésére egy adott bélyegző megjegyzéséből a PDF dokumentum adott oldalán.
1. lépés: A környezet beállítása
Mielőtt elkezdené, győződjön meg arról, hogy rendelkezik a következőkkel:
- Telepített .NET fejlesztői környezet.
- A projektben letöltött és hivatkozott Aspose.PDF könyvtár a .NET-hez.
2. lépés: A PDF dokumentum betöltése
Az első lépés a meglévő PDF dokumentum betöltése a projektbe. Itt van, hogyan:
// A dokumentumok könyvtárának elérési útja.
string dataDir = "YOUR DOCUMENTS DIRECTORY";
// Töltse be a dokumentumot
Document doc = new Document(dataDir + "test.pdf");
Feltétlenül cserélje ki a „DOKUMENTUMKÖNYVTÁR” elemet a PDF-dokumentum könyvtárának tényleges elérési útjára.
3. lépés: Szöveg kibontása a bélyegző megjegyzéséből
Most, hogy betöltötte a PDF dokumentumot, kivonhatja a szöveget az adott bélyegző megjegyzéséből. Itt van, hogyan:
// Puffer annotáció lekérése
StampAnnotation annot = doc.Pages[1].Annotations[3] as StampAnnotation;
// Hozzon létre egy szövegelnyelőt
TextAbsorber ta = new TextAbsorber();
// Tekintse meg a kommentár megjelenését
XForm ap = annot. Appearance["N"];
ta.Visit(ap);
// A kivont szöveg megjelenítése
Console.WriteLine(ta.Text);
fenti kód lekéri a bélyegző megjegyzést a PDF-dokumentum megadott oldaláról, majd egy szövegelnyelő segítségével kiemeli a szöveget a megjegyzés megjelenéséből. A kivont szöveg ezután megjelenik a kimenetben.
Minta forráskód a bélyegjegyzet szövegének kivonásához az Aspose.PDF for .NET használatával
string dataDir = "YOUR DOCUMENT DIRECTORY";
Document doc = new Document(dataDir + "test.pdf");
StampAnnotation annot = doc.Pages[1].Annotations[3] as StampAnnotation;
TextAbsorber ta = new TextAbsorber();
XForm ap = annot.Appearance["N"];
ta.Visit(ap);
Console.WriteLine(ta.Text);
Következtetés
Gratulálok ! Megtanulta, hogyan lehet szöveget kivonni egy PDF-dokumentum bélyegző megjegyzéséből az Aspose.PDF for .NET használatával. Most már használhatja ezt a módszert a PDF-dokumentumok más megjegyzéseiből való szöveg kivonására.
GYIK a bélyegjegyzet szövegének kivonásához
K: Mi az a bélyegző megjegyzés egy PDF-dokumentumban, és miért kell szöveget kivonnom belőle?
V: A PDF-dokumentumban található bélyegző megjegyzés olyan grafikus elem, amely további információk, például vízjel vagy gumibélyegző biztosítására használható. Szöveg kinyerése egy bélyegző megjegyzésből akkor hasznos, ha szövegalapú tartalmat szeretne lekérni ezekből a megjegyzésekből, amelyek tartalmazhatnak megjegyzéseket, címkéket vagy egyéb szöveges információkat.
K: Hogyan bontja ki a megadott C#-forráskód a szöveget a bélyegző megjegyzéséből?
V: A mellékelt forráskód bemutatja, hogyan lehet szöveget kivonni egy adott bélyegző megjegyzésből a PDF-dokumentum adott oldalán. Az Aspose.PDF könyvtárat használja a bélyegző megjegyzésének lekéréséhez, a megjelenés meglátogatásához egyTextAbsorber
, majd megjeleníti a kivont szöveget a kimenetben.
K: Kivonhatok-e szöveget különböző típusú megjegyzésekből hasonló megközelítéssel?
V: Igen, hasonló megközelítést használhat más típusú megjegyzésekből, például szöveges megjegyzésekből vagy felugró megjegyzésekből szöveg kinyerésére. Módosítania kell a kódot, hogy megcélozza azt a konkrét típusú megjegyzést, amelyből szöveget szeretne kivonni.
K: Mi a célja aTextAbsorber
class in the code?
V: ATextAbsorber
osztály a PDF-dokumentum különböző részeinek szövegének kinyerésére szolgál, beleértve a bélyegző megjegyzéseket is. “Elnyeli” vagy rögzíti a PDF meghatározott területén vagy elemében található szöveges tartalmat.
K: Hogyan azonosíthatom be azt a bélyegző megjegyzést, amelyből szöveget szeretnék kivonni?
V: A megadott kódban a bélyegző annotáció azonosítása aAnnotations
egy adott oldal gyűjteménye, és az index segítségével lekérheti a kívánt megjegyzést. Módosíthatja az indexet, vagy más kritériumok segítségével azonosíthatja a célfeljegyzést.
K: Kivonhatok szöveget több bélyegző megjegyzésből ugyanazon az oldalon?
V: Igen, módosíthatja a kódot, hogy végigfusson aAnnotations
egy oldal gyűjteménye, szűrje ki a bélyegző megjegyzéseket, és mindegyikből kinyerje ki a szöveget.
K: Mi a teendő, ha a bélyegző megjegyzésének nincs szöveges tartalma? Működni fog még a kód?
V: A kód továbbra is működik, de kibontja és üres karakterláncot jelenít meg, ha a bélyegző megjegyzés megjelenése nem tartalmaz szöveges tartalmat.
K: Hogyan menthetem el a kicsomagolt szöveget fájlba ahelyett, hogy a kimenetben jelenítené meg?
V: Módosíthatja a kódot, hogy a kibontott szöveget fájlba mentse, ahelyett, hogy a konzolon jelenítené meg. Egyszerűen cserélje ki aConsole.WriteLine
utasítás kóddal a szöveg fájlba írásához.
K: Hogyan használhatom a kivont szöveget további feldolgozáshoz vagy elemzéshez?
V: Miután a megadott módszerrel kibontotta a szöveget, eltárolhatja azt egy változóban, módosíthatja, elemezheti, vagy szükség szerint integrálhatja az alkalmazás más részeibe.