Wyszukaj tekst i dodaj hiperłącze
tym samouczku wyjaśniono, jak używać Aspose.PDF dla .NET do wyszukiwania określonego tekstu w dokumencie PDF, dodawania hiperłącza do znalezionego tekstu i zapisywania zmodyfikowanego dokumentu. Dostarczony kod źródłowy języka C# demonstruje proces krok po kroku.
Warunki wstępne
Przed kontynuowaniem samouczka upewnij się, że posiadasz następujące elementy:
- Podstawowa znajomość języka programowania C#.
- Zainstalowana biblioteka Aspose.PDF dla .NET. Możesz go uzyskać ze strony internetowej Aspose lub użyć NuGet, aby zainstalować go w swoim projekcie.
Krok 1: Skonfiguruj projekt
Zacznij od utworzenia nowego projektu C# w preferowanym zintegrowanym środowisku programistycznym (IDE) i dodaj odwołanie do biblioteki Aspose.PDF dla .NET.
Krok 2: Zaimportuj niezbędne przestrzenie nazw
Dodaj następujące dyrektywy using na początku pliku C#, aby zaimportować wymagane przestrzenie nazw:
using Aspose.Pdf;
using Aspose.Pdf.Content;
using Aspose.Pdf.Facades;
using Aspose.Pdf.Text;
Krok 3: Ustaw ścieżkę do katalogu dokumentów
Ustaw ścieżkę do katalogu dokumentów za pomocądataDir
zmienny:
string dataDir = "YOUR DOCUMENT DIRECTORY";
Zastępować"YOUR DOCUMENT DIRECTORY"
z rzeczywistą ścieżką do katalogu dokumentów.
Krok 4: Utwórz absorber TextFragment
StwórzTextFragmentAbsorber
obiekt, aby znaleźć wszystkie wystąpienia wprowadzonej frazy wyszukiwania:
TextFragmentAbsorber absorber = new TextFragmentAbsorber("\\d{4}-\\d{4}");
Zastępować"\\d{4}-\\d{4}"
z żądanym wzorcem wyrażenia regularnego.
Krok 5: Włącz wyszukiwanie wyrażeń regularnych
Włącz wyszukiwanie wyrażeń regularnych, ustawiającTextSearchOptions
właściwość absorbera:
absorber.TextSearchOptions = new TextSearchOptions(true);
Krok 6: Otwórz i zwiąż dokument PDF
StwórzPdfContentEditor
obiekt i powiąż go ze źródłowym plikiem PDF:
PdfContentEditor editor = new PdfContentEditor();
editor.BindPdf(dataDir + "SearchRegularExpressionPage.pdf");
Zastępować"SearchRegularExpressionPage.pdf"
z rzeczywistą nazwą pliku PDF.
Krok 7: Zaakceptuj absorber dla strony
Zaakceptuj absorber dla żądanej strony dokumentu:
editor.Document.Pages[1].Accept(absorber);
Zastępować1
z żądanym numerem strony.
Krok 8: Dodaj hiperłącza do znalezionego tekstu
Przejrzyj pobrane fragmenty tekstu i dodaj do nich hiperłącza:
foreach (TextFragment textFragment in absorber.TextFragments)
{
textFragment.TextState.ForegroundColor = Aspose.Pdf.Color.Blue;
// Utwórz prostokąt na podstawie położenia fragmentu tekstu
System.Drawing.Rectangle rect = new System.Drawing.Rectangle((int)textFragment.Rectangle.LLX,
(int)Math.Round(textFragment.Rectangle.LLY), (int)Math.Round(textFragment.Rectangle.Width + 2),
(int)Math.Round(textFragment.Rectangle.Height + 1));
//Dodaj łącze internetowe do prostokąta
editor.CreateWebLink(rect, "http://www.aspose.com”, 1, System.Drawing.Color.Blue);
}
Zastępować"http://www.aspose.com"
z żądanym adresem URL hiperłącza.
Krok 9: Zapisz i zamknij zmodyfikowany dokument
Zapisz zmodyfikowany dokument i zamknij edytor:
dataDir = dataDir + "SearchTextAndAddHyperlink_out.pdf";
editor.Save(dataDir);
editor.Close();
Console.WriteLine("\nText replaced and hyperlink added successfully based on a regular expression.\nFile saved at " + dataDir);
Pamiętaj o wymianie"SearchTextAndAddHyperlink_out.pdf"
z żądaną nazwą pliku wyjściowego.
Przykładowy kod źródłowy wyszukiwania tekstu i dodawania hiperłącza przy użyciu Aspose.PDF dla .NET
// Ścieżka do katalogu dokumentów.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Utwórz obiekt absorbera, aby znaleźć wszystkie wystąpienia wejściowej frazy wyszukiwania
TextFragmentAbsorber absorber = new TextFragmentAbsorber("\\d{4}-\\d{4}");
// Włącz wyszukiwanie wyrażeń regularnych
absorber.TextSearchOptions = new TextSearchOptions(true);
// Otwórz dokument
PdfContentEditor editor = new PdfContentEditor();
// Powiąż źródłowy plik PDF
editor.BindPdf(dataDir + "SearchRegularExpressionPage.pdf");
// Zaakceptuj pochłaniacz dla strony
editor.Document.Pages[1].Accept(absorber);
int[] dashArray = { };
String[] LEArray = { };
System.Drawing.Color blue = System.Drawing.Color.Blue;
// Przejrzyj fragmenty
foreach (TextFragment textFragment in absorber.TextFragments)
{
textFragment.TextState.ForegroundColor = Aspose.Pdf.Color.Blue;
System.Drawing.Rectangle rect = new System.Drawing.Rectangle((int)textFragment.Rectangle.LLX,
(int)Math.Round(textFragment.Rectangle.LLY), (int)Math.Round(textFragment.Rectangle.Width + 2),
(int)Math.Round(textFragment.Rectangle.Height + 1));
Enum[] actionName = new Enum[2] { Aspose.Pdf.Annotations.PredefinedAction.Document_AttachFile, Aspose.Pdf.Annotations.PredefinedAction.Document_ExtractPages };
editor.CreateWebLink(rect, "http:// Www.aspose.com”, 1, niebieski, nazwaakcji);
editor.CreateLine(rect, "", (float)textFragment.Rectangle.LLX + 1, (float)textFragment.Rectangle.LLY - 1,
(float)textFragment.Rectangle.URX, (float)textFragment.Rectangle.LLY - 1, 1, 1, blue, "S", dashArray, LEArray);
}
dataDir = dataDir + "SearchTextAndAddHyperlink_out.pdf";
editor.Save(dataDir);
editor.Close();
Console.WriteLine("\nText replaced and hyperlink added successfully based on a regular expression.\nFile saved at " + dataDir);
Wniosek
Gratulacje! Pomyślnie nauczyłeś się wyszukiwać określony tekst w dokumencie PDF, dodawać hiperłącza do znalezionego tekstu i zapisywać zmodyfikowany dokument za pomocą Aspose.PDF dla .NET. Ten samouczek zawiera przewodnik krok po kroku, od skonfigurowania projektu do wykonania wymaganych działań. Możesz teraz włączyć ten kod do własnych projektów C#, aby manipulować tekstem i dodawać hiperłącza w plikach PDF.
Często zadawane pytania
P: Jaki jest cel samouczka „Wyszukaj tekst i dodaj hiperłącze”?
O: Samouczek „Wyszukaj tekst i dodaj hiperłącze” ma na celu zademonstrowanie, jak używać biblioteki Aspose.PDF dla .NET do wyszukiwania określonego tekstu w dokumencie PDF, dodawania hiperłączy do znalezionego tekstu, a następnie zapisywania zmodyfikowanego dokumentu. Samouczek zawiera kompleksowy przewodnik i przykłady kodu C# ilustrujące proces krok po kroku.
P: W jaki sposób ten samouczek pomaga w dodawaniu hiperłączy do określonego tekstu w dokumencie PDF?
Odp.: Ten samouczek poprowadzi Cię przez proces korzystania z biblioteki Aspose.PDF w celu zlokalizowania określonego tekstu w dokumencie PDF, zastosowania hiperłącza do zidentyfikowanego tekstu i zapisania zmodyfikowanego pliku PDF. Obejmuje podstawowe kroki, takie jak konfiguracja projektu, ładowanie dokumentu, umożliwienie wyszukiwania wyrażeń regularnych i dodanie hiperłączy do znalezionego tekstu.
P: Jakie wymagania wstępne są potrzebne, aby móc skorzystać z tego samouczka?
Odp.: Zanim zaczniesz, powinieneś posiadać podstawową wiedzę na temat języka programowania C#. Dodatkowo musisz mieć zainstalowaną bibliotekę Aspose.PDF dla .NET, którą można uzyskać ze strony internetowej Aspose lub zainstalować przy użyciu NuGet w swoim projekcie.
P: Jak skonfigurować projekt tak, aby działał zgodnie z tym samouczkiem?
Odpowiedź: Rozpocznij od utworzenia nowego projektu C# w preferowanym zintegrowanym środowisku programistycznym (IDE). Następnie dodaj odwołanie do biblioteki Aspose.PDF for .NET, co umożliwi wykorzystanie możliwości biblioteki w Twoim projekcie.
P: Czy za pomocą tego samouczka mogę dodać hiperłącza do określonego tekstu?
Odp.: Tak, ten samouczek koncentruje się szczególnie na dodawaniu hiperłączy do określonego tekstu w dokumencie PDF. Pokazuje, jak znaleźć i wyodrębnić żądany tekst za pomocą wyrażeń regularnych, utworzyć hiperłącza powiązane z fragmentami tekstu i zapisać zmodyfikowany plik PDF.
P: Jak zdefiniować tekst, który chcę wyszukać i dodać do niego hiperłącze?
O: Aby określić tekst, który chcesz wyszukać i dodać do niego hiperłącze, utwórz plikTextFragmentAbsorber
obiekt i ustaw jego wzór za pomocąText
parametr. Zastąp domyślny wzór"\\d{4}-\\d{4}"
w kodzie samouczka żądanym wzorcem wyrażenia regularnego.
P: Jak mogę włączyć wyszukiwanie tekstu za pomocą wyrażeń regularnych?
O: Wyszukiwanie wyrażeń regularnych włącza się poprzez utworzenie plikuTextSearchOptions
obiekt i ustawienie jego wartości natrue
. Przypisz ten obiekt doTextSearchOptions
własnośćTextFragmentAbsorber
instancja. Dzięki temu podczas wyszukiwania tekstu zostanie zastosowany wzorzec wyrażenia regularnego.
P: Jak dodać hiperłącza do znalezionego tekstu?
Odp.: Po zidentyfikowaniu fragmentów tekstu za pomocą metodyTextFragmentAbsorber
samouczek udostępnia pętlę umożliwiającą iterację po tych fragmentach. Dla każdego fragmentu tekstu tutorial pokazuje, jak ustawić kolor tekstu na niebieski i utworzyć hiperłącze za pomocąCreateWebLink
metoda.
P: Jakie są kroki, aby zapisać zmodyfikowany plik PDF z hiperłączami?
Odp.: Po dodaniu hiperłączy do żądanych fragmentów tekstu użyj metodyPdfContentEditor
class, aby zapisać zmodyfikowany dokument. Przykładowy kod samouczka pokazuje, jak zapisać edytowany plik PDF, zamknąć edytor i wyświetlić komunikat o powodzeniu.