Szöveg keresése és téglalap rajzolása

Bevezetés

Szeretné fejleszteni PDF-kezelési készségeit? Szeretné megtanulni, hogyan kereshet konkrét szöveget PDF-fájlokban, és hogyan emelheti ki téglalappal? A tökéletes útmutatóhoz jutottál! Ma végigvezetem Önt, hogyan használhatja az Aspose.PDF for .NET fájlt szövegek keresésére egy PDF-dokumentumban, és téglalapokat rajzolhat köré. Ez a cikk lépésről lépésre bemutatja az egyértelműséget és a hasznosságot szem előtt tartó oktatóanyagot, amely biztosítja, hogy követni tudja és alkalmazni tudja ezeket a technikákat projektjeinél.

Előfeltételek

Mielőtt belevágna az oktatóanyagba, készítsük elő, mire van szüksége a zökkenőmentes munkafolyamat biztosításához:

  1. A .NET alapjai: ismernie kell a C# programozást és a .NET keretrendszert, hogy hatékonyan kövesse ezt az oktatóanyagot.

  2. A Visual Studio telepítve: A kód írásához és teszteléséhez integrált fejlesztői környezetre (IDE) lesz szüksége. A Visual Studio Community nagyszerű lehetőség, és ingyenes.

  3. Aspose.PDF for .NET: Telepíteni kell az Aspose.PDF könyvtárat a projektben. Letölthetiitt vagy fontolja meg aideiglenes engedély kiterjesztett funkciókhoz.

  4. Minta PDF-dokumentum: Ehhez az oktatóanyaghoz szüksége lesz egy PDF-mintafájlraSearchAndGetTextFromAll.pdf a projektkönyvtárban tárolva.

Csomagok importálása

A kezdéshez először importálnia kell a szükséges csomagokat a .NET-projektbe. Kövesse az alábbi lépéseket:

Nyissa meg a Visual Studio-t

Indítsa el a Visual Studio alkalmazást, és hozzon létre egy új konzolalkalmazást, vagy használjon egy meglévőt, ahol a PDF-funkciókat szeretné megvalósítani.

Adja hozzá az Aspose.PDF fájlt projektjéhez

  1. Kattintson a jobb gombbal a projektre a Solution Explorerben.
  2. Válassza a “NuGet-csomagok kezelése” lehetőséget.
  3. Keressen ráAspose.PDF és telepítse a legújabb verziót.

Ezzel megteremti az alapot minden elképesztő PDF-manipulációhoz, amelyet éppen végrehajtani készül.

Névterek importálása

A programfájl tetején érdemes importálni a vonatkozó névtereket az Aspose könyvtárból:

using System.IO;
using Aspose.Pdf;
using Aspose.Pdf.Text;
using System;
using Aspose.Pdf.Facades;

Ez megkönnyíti az osztályok és metódusok elérését az Aspose.PDF könyvtáron belül a feladatokhoz.

Most, hogy mindent beállított, bontsuk fel kezelhető lépésekre a PDF-ben található szöveg keresésének folyamatát, és rajzoljunk köré egy téglalapot.

1. lépés: Állítsa be a dokumentum elérési útját

Először állítsa be a PDF-fájl elérési útját. Ügyeljen arra, hogy cserélje kiYOUR DOCUMENT DIRECTORY a tényleges útvonallal, ahol az ÖnSearchAndGetTextFromAll.pdf tárolva van.

string dataDir = "YOUR DOCUMENT DIRECTORY";

2. lépés: Nyissa meg a PDF-dokumentumot

Ezután hozzon létre egy példányt aDocument osztály a PDF betöltéséhez:

Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");

Ez a kódsor megnyitja a megadott PDF-fájlt, lehetővé téve annak további manipulálását.

3. lépés: Hozzon létre egy szövegelnyelőt

Most szüksége lesz egy módra, hogy szöveget keressen a dokumentumban. Ehhez használjuk aTextFragmentAbsorber:

TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");

A reguláris kifejezés@"[\S]+" úgy lett kialakítva, hogy illeszkedjen a PDF-ben található nem szóközökhöz.

4. lépés: Konfigurálja a szöveges keresési beállításokat

Ezután be kell állítania a szöveges keresési beállításokat:

TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;

Itt, atrue paraméter azt jelenti, hogy a keresés megkülönbözteti a kis- és nagybetűket. Beállíthatjafalse ha kis- és nagybetűket nem érző keresést szeretne.

5. lépés: Fogadja el a szövegelnyelőt a dokumentumban

A tiéddelTextFragmentAbsorber és a keresési lehetőségek készen állnak, itt az ideje, hogy szöveget vegyen fel a dokumentumból:

document.Pages.Accept(textAbsorber);

Ez a módszer megvizsgálja a PDF minden oldalát, hogy megtalálja a megadott mintának megfelelő szövegrészleteket.

6. lépés: Hozzon létre egy PdfContentEditort

Ha alakzatokat szeretne rajzolni a dokumentumra, szüksége lesz aPdfContentEditor:

var editor = new PdfContentEditor(document);

Ez a szerkesztő lehetővé teszi a PDF-tartalom egyszerű kezelését és szerkesztését.

7. lépés: Ismételje meg a talált szövegtöredékeket

Most érdemes végigpörgetni a talált szövegrészleteket, és téglalapokat rajzolni köréjük:

foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
    foreach (TextSegment textSegment in textFragment.Segments)
    {
        DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
    }
}

Ez a ciklus minden szövegtöredéken és szegmensükön iterál, és meghívja aDrawBox módszer a téglalap rajzolására.

8. lépés: Határozza meg a DrawBox módszert

Meg kell határoznia aDrawBox metódust, amely kezeli a téglalap rajzolási logikát. Íme egy egyszerű megvalósítás:

private static void DrawBox(PdfContentEditor editor, int pageNumber, TextSegment textSegment, System.Drawing.Color color)
{
    // Számítsa ki a téglalap méreteit a szövegszegmens alapján
    float x = textSegment.Rectangle.LLX;
    float y = textSegment.Rectangle.LLY;
    float width = textSegment.Rectangle.Width;
    float height = textSegment.Rectangle.Height;

    // Rajzoljon egy téglalapot a számított értékek felhasználásával
    editor.DrawRectangle(pageNumber, x, y, width, height, color, 1);
}

Ez a módszer a szegmens határoló téglalapja alapján határozza meg a téglalap helyzetét és méretét, és a szerkesztő segítségével rajzolja meg.

9. lépés: Mentse el a módosított dokumentumot

Miután a talált szöveg köré rajzolta a téglalapokat, elmentheti a módosított dokumentumot:

dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);

Győződjön meg arról, hogy az új fájlt más néven menti, hogy elkerülje az eredeti dokumentum felülírását.

10. lépés: Megerősítő üzenet

Végül nyomtasson egy megerősítő üzenetet a konzolra, hogy tudassa a művelet sikerességéről:

Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);

És megvan! Sikeresen létrehozott egy szkriptet, amellyel szöveget kereshet a PDF-ben, és téglalapokkal kiemelheti.

Következtetés

Gratulálok! Ön most egy olyan hatékony készségre tett szert, amely nagymértékben javíthatja PDF-kezelési képességeit az Aspose.PDF for .NET használatával. Néhány egyszerű lépéssel megkereshet bármilyen szöveget a dokumentumban, és vizuálisan kiemelheti, így PDF-dokumentumait interaktívabbá és kezelhetőbbé teheti. Ne habozzon kísérletezni a különböző regex mintákkal és színválasztékkal, hogy valóban a magáévá tegye ezt az eszközt!

GYIK

Mi az Aspose.PDF for .NET?

Az Aspose.PDF for .NET egy olyan könyvtár, amely átfogó módot biztosít PDF-dokumentumok programozott létrehozására, kezelésére és konvertálására.

Használhatom ingyenesen az Aspose.PDF-et?

Igen, az Aspose ingyenes próbaverziót kínál, amellyel tesztelheti a könyvtár funkcióit. Nézd megitt.

Milyen programozási nyelvet kell használnom az Aspose.PDF for .NET-hez?

Az Aspose.PDF for .NET a C# és más .NET nyelvekkel való használatra készült.

Hogyan kaphatok segítséget az Aspose.PDF-hez?

Bármilyen problémával vagy kérdéssel kapcsolatban felkeresheti az Aspose támogatási fórumát. Keressen támogatástitt.

Honnan tölthetem le az Aspose.PDF-et .NET-hez?

A könyvtár letölthető az Aspose weboldaláról,itt.