Html-ből való konvertálás után távolítsa el a hiperhivatkozásokat

Bevezetés

A digitális korban gyakori feladat a HTML-dokumentumok PDF-be konvertálása. Előfordulhat azonban, hogy különféle okokból – például az olvashatóság javítása vagy a nem kívánt navigáció megakadályozása miatt – el szeretné távolítani a hiperhivatkozásokat a konvertált PDF-fájlból. Ebben az oktatóanyagban megvizsgáljuk, hogyan érhetjük el ezt az Aspose.PDF for .NET használatával.

Előfeltételek

Mielőtt belemerülne a kódba, győződjön meg arról, hogy rendelkezik a következő előfeltételekkel:

  1. Visual Studio: Győződjön meg arról, hogy a Visual Studio telepítve van a gépen. Ez lesz az Ön fejlesztési környezete.
  2. Aspose.PDF .NET-hez: rendelkeznie kell az Aspose.PDF könyvtárral. Letöltheti innenitt.
  3. Alapvető C# ismerete: A C# programozás ismerete segít a kód jobb megértésében.

Csomagok importálása

A kezdéshez importálnia kell a szükséges csomagokat a C# projektbe. A következőképpen teheti meg:

  1. Nyissa meg a Visual Studio projektet.
  2. Kattintson a jobb gombbal a projektre a Solution Explorerben, és válassza a “NuGet-csomagok kezelése” lehetőséget.
  3. Keressen ráAspose.PDF és telepítse.
using Aspose.Pdf.Annotations;
using Aspose.Pdf.Text;
using System.IO;

Most, hogy mindent beállított, részletezzük a hiperhivatkozások eltávolításának folyamatát egy HTML-fájlból, miután PDF formátumba konvertálta.

1. lépés: Állítsa be a dokumentumkönyvtárat

Először is meg kell adnia a dokumentumkönyvtár elérési útját. Itt található a HTML-fájl, és a kimeneti PDF mentésre kerül.

// A dokumentumok könyvtárának elérési útja.
string dataDir = "YOUR DOCUMENT DIRECTORY";

Cserélje ki"YOUR DOCUMENT DIRECTORY" a HTML-fájl tárolási útvonalával.

2. lépés: Töltse be a HTML-dokumentumot

Ezután töltse be a HTML dokumentumot aDocument osztály az Aspose.PDF-ből. Ez az osztály lehetővé teszi a PDF dokumentumok egyszerű kezelését.

Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());

Itt betöltjük a nevű HTML-fájltSampleHtmlFile.html. Győződjön meg arról, hogy ez a fájl létezik a megadott könyvtárban.

3. lépés: Mentse el a dokumentumot a memóriafolyamba

Mielőtt elkezdené a megjegyzések feldolgozását, el kell mentenünk a dokumentumot egy memóriafolyamba. Ez a lépés kulcsfontosságú, mivel előkészíti a dokumentumot a további manipulációkhoz.

doc.Save(new MemoryStream());

Ez a sor a memóriába menti a dokumentumot, így anélkül dolgozhatunk vele, hogy még lemezre írnánk.

4. lépés: Ismétlés megjegyzésekkel

Most ismételjük a dokumentum megjegyzéseit. A kommentárok olyan elemek, mint a linkek, megjegyzések és kiemelések. Kifejezetten a link-annotációk érdekelnek bennünket.

foreach (Annotation a in doc.Pages[1].Annotations)
{
    if (a.AnnotationType == AnnotationType.Link)
    {
        // A link megjegyzés feldolgozása
    }
}

Ebben a ciklusban ellenőrizzük, hogy a megjegyzés típusa hivatkozás. Ha igen, akkor folytassa a következő lépésekkel.

5. lépés: Távolítsa el a hiperhivatkozási műveletet

Minden hivatkozás megjegyzésénél ellenőriznünk kell, hogy van-e benne hiperhivatkozási művelet. Ha igen, akkor eltávolítjuk a hiperhivatkozást úgy, hogy az URI-jét üres karakterláncra állítjuk.

LinkAnnotation la = (LinkAnnotation)a;
if (la.Action is GoToURIAction)
{
    GoToURIAction gta = (GoToURIAction)la.Action;
    gta.URI = "";

Ez a kódrészlet biztosítja a hiperhivatkozási művelet hatékony eltávolítását.

6. lépés: Szövegtöredékek felszívása

Ezután felvesszük a hivatkozás megjegyzéséhez kapcsolódó szövegrészleteket. Ez lehetővé teszi számunkra, hogy módosítsuk a szöveg megjelenését.

TextFragmentAbsorber tfa = new TextFragmentAbsorber();
tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
doc.Pages[a.PageIndex].Accept(tfa);

Itt létrehozunk aTextFragmentAbsorber és állítsa be a keresési beállításait a megjegyzés téglalapjára. Ez segít megtalálni a linkelt szöveget.

7. lépés: Módosítsa a szöveg megjelenését

Ha megvannak a szövegrészletek, módosíthatjuk a megjelenésüket. Ebben az esetben eltávolítjuk az aláhúzást, és a szöveg színét feketére változtatjuk.

foreach (TextFragment tf in tfa.TextFragments)
{
    tf.TextState.Underline = false;
    tf.TextState.ForegroundColor = Color.Black;
}

Ez a lépés javítja a szöveg olvashatóságát azáltal, hogy eltávolítja a hiperhivatkozás stílusát.

8. lépés: Törölje a megjegyzést

A szöveg módosítása után nyugodtan törölhetjük a hivatkozási megjegyzést a dokumentumból.

doc.Pages[a.PageIndex].Annotations.Delete(a);
}

Ez a sor eltávolítja a hiperhivatkozást a PDF-ből, biztosítva, hogy az már ne szerepeljen a végső kimenetben.

9. lépés: Mentse el a módosított dokumentumot

Végül el kell mentenünk a módosított dokumentumot egy új PDF fájlba. Ez folyamatunk utolsó lépése.

doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");

Ez a sor menti a dokumentumot a hiperhivatkozások eltávolításával, és létrehoz egy új nevű PDF-fájltRemoveHyperlinksFromText_out.pdf.

Következtetés

És megvan! Sikeresen eltávolította a hiperhivatkozásokat egy HTML-dokumentumból, miután PDF-be konvertálta az Aspose.PDF for .NET segítségével. Ez a folyamat nemcsak a PDF olvashatóságát javítja, hanem a megjelenített tartalom felett is irányítani tudja.

GYIK

Eltávolíthatom a hiperhivatkozásokat bármely PDF-dokumentumból?

Igen, az Aspose.PDF for .NET használatával eltávolíthat hivatkozásokat bármely PDF-dokumentumból.

Ingyenesen használható az Aspose.PDF?

Az Aspose.PDF ingyenes próbaverziót kínál, de a teljes funkciók használatához licencet kell vásárolnia. Ellenőrizze aoldal vásárlása.

Mi a teendő, ha problémákat tapasztalok az Aspose.PDF használata közben?

Segítséget kérhetsz atámogatási fórum.

Átalakíthatok más fájlformátumokat PDF-be az Aspose segítségével?

Igen, az Aspose különféle fájlformátumokat támogat a PDF-be való konvertáláshoz.

Honnan tölthetem le az Aspose.PDF-et .NET-hez?

Letöltheti aletöltési link.