Usuń hiperłącza po konwersji z HTML

W tym samouczku przeprowadzimy Cię przez proces usuwania hiperłączy z pliku PDF wygenerowanego z pliku HTML przy użyciu Aspose.PDF dla .NET. Hiperłącza to klikalne łącza, które mogą przekierowywać do innych stron lub witryn internetowych. Wykonując poniższe czynności, będziesz mógł usunąć hiperłącza z wynikowego pliku PDF.

Warunki wstępne

Zanim zaczniesz, upewnij się, że spełniasz następujące wymagania wstępne:

Podstawowa znajomość języka programowania C#.
Biblioteka Aspose.PDF dla .NET zainstalowana w Twoim systemie.
Środowisko programistyczne, takie jak Visual Studio.

Krok 1: Ładowanie pliku HTML i usuwanie hiperłączy

Na tym etapie załadujemy plik HTML i usuniemy hiperłącza z wynikowego dokumentu PDF. Użyj następującego kodu:

// Ścieżka do katalogu dokumentów.
string dataDir = "YOUR DOCUMENTS DIRECTORY";

// Załaduj plik HTML, korzystając z opcji ładowania HTML
Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());

// Przeglądaj adnotacje na pierwszej stronie dokumentu
foreach(Annotation a in doc.Pages[1].Annotations)
{
     // Sprawdź, czy adnotacja jest linkiem
     if (a.AnnotationType == AnnotationType.Link)
     {
         LinkAnnotation the = (LinkAnnotation)a;
        
         // Sprawdź, czy akcja jest typu GoToURIAction
         if (the.Action is GoToURIAction)
         {
             GoToURIAction gta = (GoToURIAction)the.Action;
             gta.URI = "";
            
             // Użyj pochłaniacza fragmentów tekstu, aby znaleźć pasujące fragmenty tekstu
             TextFragmentAbsorber tfa = new TextFragmentAbsorber();
             tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
             doc.Pages[a.PageIndex].Accept(tfa);
            
             // Przeglądaj pasujące fragmenty tekstu i usuwaj atrybuty z hiperłączy
             foreach(TextFragment tf in tfa.TextFragments)
             {
                 tf.TextState.Underline = false;
                 tf.TextState.ForegroundColor = Color.Black;
             }
         }
        
         // Usuń adnotację ze strony
         doc.Pages[a.PageIndex].Annotations.Delete(a);
     }
}

Pamiętaj o wymianie"YOUR DOCUMENTS DIRECTORY" z rzeczywistym katalogiem, w którym znajduje się plik HTML.

Krok 2: Zapisanie wynikowego pliku PDF

Na koniec zapiszemy wynikowy plik PDF bez hiperłączy. Użyj następującego kodu:

// Zapisz wynikowy plik PDF
doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");

Powyższy kod zapisuje wynikowy plik PDF z nazwą pliku"RemoveHyperlinksFromText_out.pdf".

Przykładowy kod źródłowy narzędzia Usuń hiperłącza po konwersji z HTML przy użyciu Aspose.PDF dla .NET

// Ścieżka do katalogu dokumentów.
string dataDir = "YOUR DOCUMENT DIRECTORY";

Document doc = new Document(dataDir + "SampleHtmlFile.html", new HtmlLoadOptions());
doc.Save(new MemoryStream());
foreach (Annotation a in doc.Pages[1].Annotations)
{
	if (a.AnnotationType == AnnotationType.Link)
	{
		LinkAnnotation la = (LinkAnnotation)a;
		if (la.Action is GoToURIAction)
		{
			GoToURIAction gta = (GoToURIAction)la.Action;
			gta.URI = "";
			TextFragmentAbsorber tfa = new TextFragmentAbsorber();
			tfa.TextSearchOptions = new TextSearchOptions(a.Rect);
			doc.Pages[a.PageIndex].Accept(tfa);
			foreach (TextFragment tf in tfa.TextFragments)
			{
				tf.TextState.Underline = false;
				tf.TextState.ForegroundColor = Color.Black;
			}
		}
		doc.Pages[a.PageIndex].Annotations.Delete(a);
	}
}
doc.Save(dataDir + "RemoveHyperlinksFromText_out.pdf");

Wniosek

W tym samouczku omówiliśmy krok po kroku proces usuwania hiperłączy z pliku PDF wygenerowanego z pliku HTML przy użyciu Aspose.PDF dla .NET. Postępując zgodnie z instrukcjami opisanymi powyżej, będziesz mógł skutecznie usunąć hiperłącza z wynikowego pliku PDF.

Często zadawane pytania

P: Co to jest Aspose.PDF dla .NET?

Odp.: Aspose.PDF dla .NET to potężna biblioteka, która umożliwia programistom pracę z dokumentami PDF w aplikacjach C#. Oferuje szeroką gamę funkcjonalności, w tym możliwość konwersji plików HTML do formatu PDF i manipulowania zawartością PDF.

P: Dlaczego miałbym chcieć usunąć hiperłącza z pliku PDF?

Odp.: Istnieje wiele powodów usuwania hiperłączy z pliku PDF. Na przykład możesz chcieć wyeliminować linki zewnętrzne do celów drukowania lub archiwizacji lub upewnić się, że po zawartości pliku PDF nie będzie można nawigować za pomocą hiperłączy.

P: Jak mogę załadować plik HTML i usunąć hiperłącza przy użyciu Aspose.PDF dla .NET?

O: Aby załadować plik HTML i usunąć hiperłącza, możesz użyć Aspose.PDF dla .NETHtmlLoadOptions klasa. Przeglądaj adnotacje na stronach PDF, aby znaleźć adnotacje do linków i zmodyfikować ich atrybuty.

P: Czy mogę dostosować nazwę pliku wyjściowego wynikowego pliku PDF?

O: Tak, możesz dostosować nazwę pliku wyjściowego wynikowego pliku PDF, modyfikując kod, który zapisuje dokument PDF. Po prostu zmień żądaną nazwę pliku wdoc.Save() metoda.

P: Czy możliwe jest selektywne usuwanie hiperłączy w oparciu o określone kryteria?

O: Tak, możesz selektywnie usuwać hiperłącza na podstawie określonych kryteriów. Możesz na przykład usunąć tylko linki zewnętrzne lub linki prowadzące do określonych adresów URL.

Podaj dane uwierzytelniające podczas HTML do formatu PDF Zastąp brakujące czcionki