Szöveg keresése és téglalap rajzolása
Bevezetés
Szeretné fejleszteni PDF-kezelési készségeit? Szeretné megtanulni, hogyan kereshet konkrét szöveget PDF-fájlokban, és hogyan emelheti ki téglalappal? A tökéletes útmutatóhoz jutottál! Ma végigvezetem Önt, hogyan használhatja az Aspose.PDF for .NET fájlt szövegek keresésére egy PDF-dokumentumban, és téglalapokat rajzolhat köré. Ez a cikk lépésről lépésre bemutatja az egyértelműséget és a hasznosságot szem előtt tartó oktatóanyagot, amely biztosítja, hogy követni tudja és alkalmazni tudja ezeket a technikákat projektjeinél.
Előfeltételek
Mielőtt belevágna az oktatóanyagba, készítsük elő, mire van szüksége a zökkenőmentes munkafolyamat biztosításához:
A .NET alapjai: ismernie kell a C# programozást és a .NET keretrendszert, hogy hatékonyan kövesse ezt az oktatóanyagot.
A Visual Studio telepítve: A kód írásához és teszteléséhez integrált fejlesztői környezetre (IDE) lesz szüksége. A Visual Studio Community nagyszerű lehetőség, és ingyenes.
Aspose.PDF for .NET: Telepíteni kell az Aspose.PDF könyvtárat a projektben. Letölthetiitt vagy fontolja meg aideiglenes engedély kiterjesztett funkciókhoz.
Minta PDF-dokumentum: Ehhez az oktatóanyaghoz szüksége lesz egy PDF-mintafájlra
SearchAndGetTextFromAll.pdf
a projektkönyvtárban tárolva.
Csomagok importálása
A kezdéshez először importálnia kell a szükséges csomagokat a .NET-projektbe. Kövesse az alábbi lépéseket:
Nyissa meg a Visual Studio-t
Indítsa el a Visual Studio alkalmazást, és hozzon létre egy új konzolalkalmazást, vagy használjon egy meglévőt, ahol a PDF-funkciókat szeretné megvalósítani.
Adja hozzá az Aspose.PDF fájlt projektjéhez
- Kattintson a jobb gombbal a projektre a Solution Explorerben.
- Válassza a “NuGet-csomagok kezelése” lehetőséget.
- Keressen rá
Aspose.PDF
és telepítse a legújabb verziót.
Ezzel megteremti az alapot minden elképesztő PDF-manipulációhoz, amelyet éppen végrehajtani készül.
Névterek importálása
A programfájl tetején érdemes importálni a vonatkozó névtereket az Aspose könyvtárból:
using System.IO;
using Aspose.Pdf;
using Aspose.Pdf.Text;
using System;
using Aspose.Pdf.Facades;
Ez megkönnyíti az osztályok és metódusok elérését az Aspose.PDF könyvtáron belül a feladatokhoz.
Most, hogy mindent beállított, bontsuk fel kezelhető lépésekre a PDF-ben található szöveg keresésének folyamatát, és rajzoljunk köré egy téglalapot.
1. lépés: Állítsa be a dokumentum elérési útját
Először állítsa be a PDF-fájl elérési útját. Ügyeljen arra, hogy cserélje kiYOUR DOCUMENT DIRECTORY
a tényleges útvonallal, ahol az ÖnSearchAndGetTextFromAll.pdf
tárolva van.
string dataDir = "YOUR DOCUMENT DIRECTORY";
2. lépés: Nyissa meg a PDF-dokumentumot
Ezután hozzon létre egy példányt aDocument
osztály a PDF betöltéséhez:
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
Ez a kódsor megnyitja a megadott PDF-fájlt, lehetővé téve annak további manipulálását.
3. lépés: Hozzon létre egy szövegelnyelőt
Most szüksége lesz egy módra, hogy szöveget keressen a dokumentumban. Ehhez használjuk aTextFragmentAbsorber
:
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
A reguláris kifejezés@"[\S]+"
úgy lett kialakítva, hogy illeszkedjen a PDF-ben található nem szóközökhöz.
4. lépés: Konfigurálja a szöveges keresési beállításokat
Ezután be kell állítania a szöveges keresési beállításokat:
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
Itt, atrue
paraméter azt jelenti, hogy a keresés megkülönbözteti a kis- és nagybetűket. Beállíthatjafalse
ha kis- és nagybetűket nem érző keresést szeretne.
5. lépés: Fogadja el a szövegelnyelőt a dokumentumban
A tiéddelTextFragmentAbsorber
és a keresési lehetőségek készen állnak, itt az ideje, hogy szöveget vegyen fel a dokumentumból:
document.Pages.Accept(textAbsorber);
Ez a módszer megvizsgálja a PDF minden oldalát, hogy megtalálja a megadott mintának megfelelő szövegrészleteket.
6. lépés: Hozzon létre egy PdfContentEditort
Ha alakzatokat szeretne rajzolni a dokumentumra, szüksége lesz aPdfContentEditor
:
var editor = new PdfContentEditor(document);
Ez a szerkesztő lehetővé teszi a PDF-tartalom egyszerű kezelését és szerkesztését.
7. lépés: Ismételje meg a talált szövegtöredékeket
Most érdemes végigpörgetni a talált szövegrészleteket, és téglalapokat rajzolni köréjük:
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
foreach (TextSegment textSegment in textFragment.Segments)
{
DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
}
}
Ez a ciklus minden szövegtöredéken és szegmensükön iterál, és meghívja aDrawBox
módszer a téglalap rajzolására.
8. lépés: Határozza meg a DrawBox módszert
Meg kell határoznia aDrawBox
metódust, amely kezeli a téglalap rajzolási logikát. Íme egy egyszerű megvalósítás:
private static void DrawBox(PdfContentEditor editor, int pageNumber, TextSegment textSegment, System.Drawing.Color color)
{
// Számítsa ki a téglalap méreteit a szövegszegmens alapján
float x = textSegment.Rectangle.LLX;
float y = textSegment.Rectangle.LLY;
float width = textSegment.Rectangle.Width;
float height = textSegment.Rectangle.Height;
// Rajzoljon egy téglalapot a számított értékek felhasználásával
editor.DrawRectangle(pageNumber, x, y, width, height, color, 1);
}
Ez a módszer a szegmens határoló téglalapja alapján határozza meg a téglalap helyzetét és méretét, és a szerkesztő segítségével rajzolja meg.
9. lépés: Mentse el a módosított dokumentumot
Miután a talált szöveg köré rajzolta a téglalapokat, elmentheti a módosított dokumentumot:
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Győződjön meg arról, hogy az új fájlt más néven menti, hogy elkerülje az eredeti dokumentum felülírását.
10. lépés: Megerősítő üzenet
Végül nyomtasson egy megerősítő üzenetet a konzolra, hogy tudassa a művelet sikerességéről:
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);
És megvan! Sikeresen létrehozott egy szkriptet, amellyel szöveget kereshet a PDF-ben, és téglalapokkal kiemelheti.
Következtetés
Gratulálok! Ön most egy olyan hatékony készségre tett szert, amely nagymértékben javíthatja PDF-kezelési képességeit az Aspose.PDF for .NET használatával. Néhány egyszerű lépéssel megkereshet bármilyen szöveget a dokumentumban, és vizuálisan kiemelheti, így PDF-dokumentumait interaktívabbá és kezelhetőbbé teheti. Ne habozzon kísérletezni a különböző regex mintákkal és színválasztékkal, hogy valóban a magáévá tegye ezt az eszközt!
GYIK
Mi az Aspose.PDF for .NET?
Az Aspose.PDF for .NET egy olyan könyvtár, amely átfogó módot biztosít PDF-dokumentumok programozott létrehozására, kezelésére és konvertálására.
Használhatom ingyenesen az Aspose.PDF-et?
Igen, az Aspose ingyenes próbaverziót kínál, amellyel tesztelheti a könyvtár funkcióit. Nézd megitt.
Milyen programozási nyelvet kell használnom az Aspose.PDF for .NET-hez?
Az Aspose.PDF for .NET a C# és más .NET nyelvekkel való használatra készült.
Hogyan kaphatok segítséget az Aspose.PDF-hez?
Bármilyen problémával vagy kérdéssel kapcsolatban felkeresheti az Aspose támogatási fórumát. Keressen támogatástitt.
Honnan tölthetem le az Aspose.PDF-et .NET-hez?
A könyvtár letölthető az Aspose weboldaláról,itt.