Html-ből való konvertálás után távolítsa el a hiperhivatkozásokat
Ebben az oktatóanyagban végigvezetjük a hiperhivatkozások eltávolításának folyamatán egy HTML-fájlból előállított PDF-fájlból az Aspose.PDF for .NET használatával. A hiperhivatkozások kattintható hivatkozások, amelyek más oldalakra vagy webhelyekre irányíthatnak át. Az alábbi lépések követésével eltávolíthatja a hiperhivatkozásokat a kapott PDF-fájlból.
Előfeltételek
Mielőtt elkezdené, győződjön meg arról, hogy megfelel a következő előfeltételeknek:
- C# programozási nyelv alapismerete.
- Aspose.PDF könyvtár a .NET-hez telepítve a rendszerére.
- Fejlesztői környezet, például a Visual Studio.
1. lépés: HTML-fájl betöltése és a hiperhivatkozások eltávolítása
Ebben a lépésben betöltjük a HTML-fájlt, és eltávolítjuk a hiperhivatkozásokat a kapott PDF-dokumentumból. Használja a következő kódot:
// A dokumentumok könyvtár elérési útja.
string dataDir = "YOUR DOCUMENTS DIRECTORY";
// Töltse be a HTML-fájlt a HTML-betöltési beállítások segítségével
Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());
// Böngésszen a dokumentum első oldalának megjegyzései között
foreach(Annotation a in doc.Pages[1].Annotations)
{
// Ellenőrizze, hogy a megjegyzés hivatkozás-e
if (a.AnnotationType == AnnotationType.Link)
{
LinkAnnotation the = (LinkAnnotation)a;
// Ellenőrizze, hogy a művelet GoToOURIAction típusú-e
if (the.Action is GoToURIAction)
{
GoToURIAction gta = (GoToURIAction)the.Action;
gta.URI = "";
// Használjon szövegtöredék-elnyelőt a megfelelő szövegrészletek megtalálásához
TextFragmentAbsorber tfa = new TextFragmentAbsorber();
tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
doc.Pages[a.PageIndex].Accept(tfa);
// Keresse át az egyező szövegrészleteket, és távolítsa el az attribútumokat a hiperhivatkozásokból
foreach(TextFragment tf in tfa.TextFragments)
{
tf.TextState.Underline = false;
tf.TextState.ForegroundColor = Color.Black;
}
}
// Távolítsa el a megjegyzést az oldalról
doc.Pages[a.PageIndex].Annotations.Delete(a);
}
}
Feltétlenül cserélje ki"YOUR DOCUMENTS DIRECTORY"
azzal a könyvtárral, ahol a HTML-fájl található.
2. lépés: Mentse el a kapott PDF-fájlt
Végül elmentjük a kapott PDF-fájlt a hiperhivatkozások nélkül. Használja a következő kódot:
// Mentse el a kapott PDF-fájlt
doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");
A fenti kód elmenti az eredményül kapott PDF-fájlt a fájlnévvel"RemoveHyperlinksFromText_out.pdf"
.
Példa forráskód a Hiperhivatkozások eltávolítása HTML-ből való konvertálás után az Aspose.PDF for .NET használatával programhoz
// A dokumentumok könyvtárának elérési útja.
string dataDir = "YOUR DOCUMENT DIRECTORY";
Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());
doc.Save(new MemoryStream());
foreach (Annotation a in doc.Pages[1].Annotations)
{
if (a.AnnotationType == AnnotationType.Link)
{
LinkAnnotation la = (LinkAnnotation)a;
if (la.Action is GoToURIAction)
{
GoToURIAction gta = (GoToURIAction)la.Action;
gta.URI = "";
TextFragmentAbsorber tfa = new TextFragmentAbsorber();
tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
doc.Pages[a.PageIndex].Accept(tfa);
foreach (TextFragment tf in tfa.TextFragments)
{
tf.TextState.Underline = false;
tf.TextState.ForegroundColor = Color.Black;
}
}
doc.Pages[a.PageIndex].Annotations.Delete(a);
}
}
doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");
Következtetés
Ebben az oktatóanyagban lépésről lépésre bemutattuk a hiperhivatkozások eltávolításának folyamatát egy HTML-fájlból előállított PDF-fájlból az Aspose.PDF for .NET használatával. A fent leírt utasításokat követve sikeresen eltávolíthatja a hiperhivatkozásokat a létrejövő PDF-fájlból.
GYIK
K: Mi az Aspose.PDF for .NET?
V: Az Aspose.PDF for .NET egy hatékony könyvtár, amely lehetővé teszi a fejlesztők számára, hogy PDF dokumentumokkal dolgozzanak C# alkalmazásokban. A funkciók széles skáláját kínálja, beleértve a HTML-fájlok PDF-formátumba konvertálását és a PDF-tartalom manipulálását.
K: Miért szeretném eltávolítani a hiperhivatkozásokat egy PDF-fájlból?
V: Különféle okai vannak a hiperhivatkozások PDF-fájlból való eltávolításának. Előfordulhat például, hogy el szeretné távolítani a külső hivatkozásokat nyomtatási vagy archiválási célból, vagy biztosítania kell, hogy a PDF-tartalom ne legyen navigálható hiperhivatkozásokon keresztül.
K: Hogyan tölthetek be egy HTML-fájlt és távolíthatok el hiperhivatkozásokat az Aspose.PDF for .NET használatával?
V: Egy HTML-fájl betöltéséhez és a hiperhivatkozások eltávolításához használhatja az Aspose.PDF-et .NET-hez.HtmlLoadOptions
osztály. Ismételje meg a PDF-oldalak megjegyzéseit, hogy megtalálja a hivatkozásokat, és módosítsa azok attribútumait.
K: Testreszabhatom a kimeneti fájl nevét az eredményül kapott PDF-hez?
V: Igen, testreszabhatja az eredményül kapott PDF-fájl kimeneti fájlnevét a PDF-dokumentumot mentő kód módosításával. Egyszerűen módosítsa a kívánt fájlnevet adoc.Save()
módszer.
K: Lehetséges a hiperhivatkozások szelektív eltávolítása bizonyos kritériumok alapján?
V: Igen, adott kritériumok alapján szelektíven eltávolíthatja a hiperhivatkozásokat. Dönthet például úgy, hogy csak a külső hivatkozásokat vagy az adott URL-ekre mutató hivatkozásokat távolítsa el.