Entfernen Sie Hyperlinks nach der Konvertierung aus HTML

In diesem Tutorial führen wir Sie durch den Prozess des Entfernens von Hyperlinks aus einer PDF-Datei, die mit Aspose.PDF für .NET aus einer HTML-Datei generiert wurde. Hyperlinks sind anklickbare Links, die auf andere Seiten oder Websites weiterleiten können. Wenn Sie die folgenden Schritte ausführen, können Sie Hyperlinks aus der resultierenden PDF-Datei entfernen.

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Sie die folgenden Voraussetzungen erfüllen:

  • Grundkenntnisse der Programmiersprache C#.
  • Aspose.PDF-Bibliothek für .NET auf Ihrem System installiert.
  • Eine Entwicklungsumgebung wie Visual Studio.

In diesem Schritt laden wir die HTML-Datei und entfernen die Hyperlinks aus dem resultierenden PDF-Dokument. Verwenden Sie den folgenden Code:

// Pfad zum Dokumentenverzeichnis.
string dataDir = "YOUR DOCUMENTS DIRECTORY";

// Laden Sie die HTML-Datei mit den HTML-Ladeoptionen
Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());

// Durchsuchen Sie die Anmerkungen der ersten Seite des Dokuments
foreach(Annotation a in doc.Pages[1].Annotations)
{
     // Überprüfen Sie, ob es sich bei der Anmerkung um einen Link handelt
     if (a.AnnotationType == AnnotationType.Link)
     {
         LinkAnnotation the = (LinkAnnotation)a;
        
         // Überprüfen Sie, ob die Aktion vom Typ GoToURIAction ist
         if (the.Action is GoToURIAction)
         {
             GoToURIAction gta = (GoToURIAction)the.Action;
             gta.URI = "";
            
             // Verwenden Sie einen Textfragment-Absorber, um passende Textfragmente zu finden
             TextFragmentAbsorber tfa = new TextFragmentAbsorber();
             tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
             doc.Pages[a.PageIndex].Accept(tfa);
            
             // Durchlaufen Sie passende Textfragmente und entfernen Sie Attribute aus Hyperlinks
             foreach(TextFragment tf in tfa.TextFragments)
             {
                 tf.TextState.Underline = false;
                 tf.TextState.ForegroundColor = Color.Black;
             }
         }
        
         // Entfernen Sie die Anmerkung von der Seite
         doc.Pages[a.PageIndex].Annotations.Delete(a);
     }
}

Unbedingt austauschen"YOUR DOCUMENTS DIRECTORY" mit dem tatsächlichen Verzeichnis, in dem sich Ihre HTML-Datei befindet.

Schritt 2: Speichern der resultierenden PDF-Datei

Abschließend speichern wir die resultierende PDF-Datei ohne die Hyperlinks. Verwenden Sie den folgenden Code:

// Speichern Sie die resultierende PDF-Datei
doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");

Der obige Code speichert die resultierende PDF-Datei unter dem Dateinamen"RemoveHyperlinksFromText_out.pdf".

// Der Pfad zum Dokumentenverzeichnis.
string dataDir = "YOUR DOCUMENT DIRECTORY";

Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());
doc.Save(new MemoryStream());
foreach (Annotation a in doc.Pages[1].Annotations)
{
	if (a.AnnotationType == AnnotationType.Link)
	{
		LinkAnnotation la = (LinkAnnotation)a;
		if (la.Action is GoToURIAction)
		{
			GoToURIAction gta = (GoToURIAction)la.Action;
			gta.URI = "";
			TextFragmentAbsorber tfa = new TextFragmentAbsorber();
			tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
			doc.Pages[a.PageIndex].Accept(tfa);
			foreach (TextFragment tf in tfa.TextFragments)
			{
				tf.TextState.Underline = false;
				tf.TextState.ForegroundColor = Color.Black;
			}
		}
		doc.Pages[a.PageIndex].Annotations.Delete(a);
	}
}
doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");

Abschluss

In diesem Tutorial haben wir den Schritt-für-Schritt-Prozess zum Entfernen von Hyperlinks aus einer PDF-Datei behandelt, die mit Aspose.PDF für .NET aus einer HTML-Datei generiert wurde. Wenn Sie die oben beschriebenen Anweisungen befolgen, können Sie Hyperlinks erfolgreich aus der resultierenden PDF-Datei entfernen.

FAQs

F: Was ist Aspose.PDF für .NET?

A: Aspose.PDF für .NET ist eine leistungsstarke Bibliothek, die Entwicklern die Arbeit mit PDF-Dokumenten in C#-Anwendungen ermöglicht. Es bietet eine breite Palette an Funktionen, einschließlich der Möglichkeit, HTML-Dateien in PDF zu konvertieren und PDF-Inhalte zu bearbeiten.

A: Es gibt verschiedene Gründe, Hyperlinks aus einer PDF-Datei zu entfernen. Beispielsweise möchten Sie möglicherweise externe Links für Druck- oder Archivierungszwecke entfernen oder sicherstellen, dass der PDF-Inhalt nicht über Hyperlinks navigierbar ist.

A: Um eine HTML-Datei zu laden und Hyperlinks zu entfernen, können Sie Aspose.PDF für .NET verwendenHtmlLoadOptions Klasse. Durchlaufen Sie die Anmerkungen der PDF-Seiten, um Linkanmerkungen zu finden und deren Attribute zu ändern.

F: Kann ich den Ausgabedateinamen für das resultierende PDF anpassen?

A: Ja, Sie können den Ausgabedateinamen für die resultierende PDF-Datei anpassen, indem Sie den Code ändern, der das PDF-Dokument speichert. Ändern Sie einfach den gewünschten Dateinamen imdoc.Save() Methode.

A: Ja, Sie können Hyperlinks anhand bestimmter Kriterien selektiv entfernen. Sie können beispielsweise festlegen, dass nur externe Links oder Links, die auf bestimmte URLs verweisen, entfernt werden.