Szövegszegmensek oldal keresése PDF-fájlban

Ez az oktatóanyag elmagyarázza, hogyan használhatja az Aspose.PDF for .NET fájlt meghatározott szövegszegmensek kereséséhez a PDF-fájl egy oldalán, és lekérheti azok tulajdonságait. A mellékelt C# forráskód lépésről lépésre mutatja be a folyamatot.

Előfeltételek

Mielőtt folytatná az oktatóanyagot, győződjön meg arról, hogy rendelkezik a következőkkel:

  • C# programozási nyelv alapismerete.
  • Aspose.PDF for .NET könyvtár telepítve. Beszerezheti az Aspose webhelyéről, vagy a NuGet segítségével telepítheti a projektbe.

1. lépés: Állítsa be a projektet

Kezdje azzal, hogy hozzon létre egy új C# projektet a kívánt integrált fejlesztői környezetben (IDE), és adjon hozzá egy hivatkozást az Aspose.PDF for .NET könyvtárhoz.

2. lépés: Importálja a szükséges névtereket

Adja hozzá a következőket direktívák használatával a C# fájl elejéhez a szükséges névterek importálásához:

using Aspose.Pdf;
using Aspose.Pdf.Text;

3. lépés: Állítsa be a dokumentumkönyvtár elérési útját

Állítsa be a dokumentumkönyvtár elérési útját adataDir változó:

string dataDir = "YOUR DOCUMENT DIRECTORY";

Cserélje ki"YOUR DOCUMENT DIRECTORY" a dokumentumkönyvtár tényleges elérési útjával.

4. lépés: Töltse be a PDF dokumentumot

Töltse be a PDF dokumentumot aDocument osztály:

Document pdfDocument = new Document(dataDir + "SearchTextSegmentsPage.pdf");

Cserélje ki"SearchTextSegmentsPage.pdf" a PDF-fájl tényleges nevével.

5. lépés: Hozzon létre egy TextFragmentAbsorber-t

Hozzon létre egyTextFragmentAbsorber objektumot a bemeneti keresési kifejezés összes példányának megtalálásához:

TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("text");

Cserélje ki"text" a kívánt keresési kifejezéssel.

6. lépés: Fogadja el az abszorbert egy adott oldalhoz

Fogadja el az abszorbert a dokumentum kívánt oldalához:

pdfDocument.Pages[2].Accept(textFragmentAbsorber);

Cserélje ki2 a kívánt oldalszámmal (1 alapú index).

7. lépés: Töltse le a kibontott szövegrészeket

Szerezze be a kivont szövegszegmenseket aTextFragments tulajdona aTextFragmentAbsorber tárgy:

TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;

8. lépés: Lapozzon át a szövegrészeken

Lapozzon át a letöltött szövegszegmenseken, és érje el tulajdonságaikat:

foreach (TextFragment textFragment in textFragmentCollection)
{
	foreach (TextSegment textSegment in textFragment.Segments)
	{
		Console.WriteLine("Text: {0} ", textSegment.Text);
		Console.WriteLine("Position: {0} ", textSegment.Position);
		Console.WriteLine("XIndent: {0} ", textSegment.Position.XIndent);
		Console.WriteLine("YIndent: {0} ", textSegment.Position.YIndent);
		Console.WriteLine("Font - Name: {0}", textSegment.TextState.Font.FontName);
		Console.WriteLine("Font - IsAccessible: {0} ", textSegment.TextState.Font.IsAccessible);
		Console.WriteLine("Font - IsEmbedded: {0} ", textSegment.TextState.Font.IsEmbedded);
		Console.WriteLine("Font - IsSubset: {0} ", textSegment.TextState.Font.IsSubset);
		Console.WriteLine("Font Size: {0} ", textSegment.TextState.FontSize);
		Console.WriteLine("Foreground Color: {0} ", textSegment.TextState.ForegroundColor);
	}
}

Módosítsa a kódot a cikluson belül, hogy szükség esetén további műveleteket hajtson végre az egyes szövegszegmenseken.

Forráskód minta a Search Text Segments oldalhoz az Aspose.PDF for .NET használatával

// A dokumentumok könyvtárának elérési útja.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Nyissa meg a dokumentumot
Document pdfDocument = new Document(dataDir + "SearchTextSegmentsPage.pdf");
// Hozzon létre TextAbsorber objektumot a bemeneti keresési kifejezés összes példányának megtalálásához
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("text");
// Fogadja el az összes oldal elnyelőjét
pdfDocument.Pages[2].Accept(textFragmentAbsorber);
// Szerezze be a kivont szövegrészleteket
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;
// Hurok át a töredékeken
foreach (TextFragment textFragment in textFragmentCollection)
{
	foreach (TextSegment textSegment in textFragment.Segments)
	{
		Console.WriteLine("Text : {0} ", textSegment.Text);
		Console.WriteLine("Position : {0} ", textSegment.Position);
		Console.WriteLine("XIndent : {0} ",
		textSegment.Position.XIndent);
		Console.WriteLine("YIndent : {0} ",
		textSegment.Position.YIndent);
		Console.WriteLine("Font - Name : {0}",
		textSegment.TextState.Font.FontName);
		Console.WriteLine("Font - IsAccessible : {0} ",
		textSegment.TextState.Font.IsAccessible);
		Console.WriteLine("Font - IsEmbedded : {0} ",
		textSegment.TextState.Font.IsEmbedded);
		Console.WriteLine("Font - IsSubset : {0} ",
		textSegment.TextState.Font.IsSubset);
		Console.WriteLine("Font Size : {0} ",
		textSegment.TextState.FontSize);
		Console.WriteLine("Foreground Color : {0} ",
		textSegment.TextState.ForegroundColor);
	}
}

Következtetés

Gratulálunk! Sikeresen megtanulta, hogyan kereshet meghatározott szövegszegmenseket egy PDF-dokumentum oldalán az Aspose.PDF for .NET segítségével. Ez az oktatóanyag lépésről lépésre nyújt útmutatót a dokumentum betöltésétől a kivont szövegrészek eléréséig. Most már beépítheti ezt a kódot saját C#-projektjeibe, hogy speciális szövegszegmens-kereséseket hajtson végre PDF-fájlokban.

GYIK

K: Mi a célja a „Szövegszegmensek oldal keresése PDF-fájlban” oktatóanyagnak?

V: A “Szövegszegmensek keresése a PDF-fájlban” oktatóanyag átfogó útmutatót nyújt az Aspose.PDF könyvtár használatához a .NET-hez a PDF-dokumentum adott oldalán található szövegszegmensek kereséséhez. Tartalmazza a projekt beállításának, a PDF dokumentum betöltésének, a szövegszegmensek keresésének és a tulajdonságaik lekérésének folyamatát C# kóddal.

K: Hogyan segít ez az oktatóanyag meghatározott szövegszegmensek keresésében egy PDF-dokumentumban?

V: Ez az oktatóanyag azt a folyamatot mutatja be, amellyel meghatározott szövegszegmenseket kereshet meg és nyerhet ki egy PDF-dokumentum egy adott oldalán. A megadott lépések és kódminták követésével a felhasználók hatékonyan kereshetnek a kívánt szövegszegmensek között, és információkat kaphatnak a tulajdonságaikról.

K: Milyen előfeltételek szükségesek az oktatóanyag követéséhez?

V: Mielőtt elkezdené az oktatóanyagot, ismernie kell a C# programozási nyelvet. Ezenkívül telepítenie kell az Aspose.PDF for .NET könyvtárat. Beszerezheti az Aspose webhelyéről, vagy telepítheti projektjébe a NuGet segítségével.

K: Hogyan állíthatom be a projektemet, hogy kövesse ezt az oktatóanyagot?

V: A kezdéshez hozzon létre egy új C# projektet az előnyben részesített integrált fejlesztői környezetben (IDE), és adjon hozzá egy hivatkozást az Aspose.PDF for .NET könyvtárhoz. Ez lehetővé teszi a könyvtár funkcióinak használatát a PDF-dokumentumok keresésére és kezelésére.

K: Használhatom ezt az oktatóanyagot meghatározott szövegszegmensek keresésére a PDF bármely oldalán?

V: Igen, ez az oktatóanyag útmutatást nyújt arra vonatkozóan, hogyan kereshet meghatározott szövegszegmenseket a PDF-dokumentum egy kiválasztott oldalán. Útmutatást ad a felhasználóknak a projekt beállításához, a PDF betöltéséhez, valamint az Aspose.PDF könyvtár használatához a kívánt szövegszegmensek tulajdonságainak megkereséséhez és lekéréséhez.

K: Hogyan adhatom meg a keresni kívánt szöveget ebben az oktatóanyagban?

V: A keresni kívánt szöveg megadásához hozzon létre aTextFragmentAbsorber objektumot, és állítsa be a keresési paraméterét aText ingatlan. Cserélje ki az alapértelmezettet"text" az oktatóprogram kódjában a kívánt keresési kifejezéssel.

K: Hogyan kérhetem le a kivont szövegszegmensek tulajdonságait?

Miután elfogadta aTextFragmentAbsorber a PDF egy adott oldalához a kivonatolt szövegrészeket a következővel kérheti leTextFragments az elnyelő tárgy tulajdonsága. Ez hozzáférést biztosít a szövegrészletek gyűjteményéhez, amelyek mindegyike több szövegszegmenst tartalmaz.

K: Testreszabhatom a kódot úgy, hogy minden szövegszegmensen további műveleteket hajtson végre?

V: Abszolút. Az oktatóanyag mintakódja egy ciklust biztosít a lekért szövegszegmensek ismétléséhez. Testreszabhatja a kódot ebben a ciklusban, hogy további műveleteket hajtson végre minden szövegszegmensen, a projekt követelményei alapján.

K: Hogyan menthetem el a módosított PDF-dokumentumot a szövegszegmensek kibontása után?

V: Ez az oktatóanyag elsősorban a szövegszegmensek keresésére és tulajdonságaik lekérésére összpontosít. Ha módosítani kívánja a PDF-fájlt, tekintse meg az Aspose.PDF többi dokumentációját, ahol megtudhatja, hogyan kezelheti és mentheti el a dokumentumot sajátos igényei szerint.