Dodaj i wyszukaj ukryty tekst w pliku PDF

Wstęp

W tym samouczku przeprowadzimy Cię przez przewodnik krok po kroku, jak dodawać i wyszukiwać ukryty tekst w pliku PDF za pomocą Aspose.PDF dla .NET. Niezależnie od tego, czy jesteś doświadczonym programistą, czy nowicjuszem, który chce poprawić swoje umiejętności programistyczne, ten artykuł dostarczy Ci informacji, których potrzebujesz, aby włączyć funkcjonalność ukrytego tekstu do swoich aplikacji.

Wymagania wstępne

Zanim przejdziesz do części poświęconej kodowaniu, musisz spełnić kilka warunków wstępnych:

Lista kontrolna wymagań

Visual Studio: Upewnij się, że masz zainstalowany Visual Studio. Ten samouczek zakłada, że używasz .NET Framework.
Aspose.PDF dla .NET: Musisz mieć bibliotekę Aspose.PDF dla .NET. Możesz ją pobraćTutaj.
Podstawowa znajomość języka C#: Znajomość programowania w języku C# pomoże Ci lepiej zrozumieć fragmenty kodu.

Importuj pakiety

Zanim zaczniesz pracę nad kodem, musisz upewnić się, że zaimportowałeś niezbędne przestrzenie nazw Aspose.PDF. Oto, jak to zrobić:

Skonfiguruj swój projekt

Otwórz program Visual Studio i utwórz nowy projekt C# lub użyj istniejącego.
Zainstaluj Aspose.PDF, dodając pakiet NuGet. Możesz to zrobić, przechodząc do Menedżera pakietów NuGet i wyszukującAspose.PDF.
Alternatywnie możesz pobrać bibliotekę bezpośrednio zTutaj i dodaj go jako odniesienie w swoim projekcie.

Importuj wymagane przestrzenie nazw

Na górze pliku C# zaimportuj następujące przestrzenie nazw:

using Aspose.Pdf.Text;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

Ten krok jest kluczowy, ponieważ te przestrzenie nazw zawierają klasy i metody niezbędne do manipulowania dokumentami PDF.

Tworzenie dokumentu PDF z ukrytym tekstem

Teraz, gdy wszystko jest już skonfigurowane, przejdźmy przez kroki tworzenia dokumentu PDF zawierającego zarówno widoczny, jak i niewidoczny tekst.

Krok 1: Zdefiniuj katalog dokumentów

Najpierw musisz ustawić ścieżkę, w której plik PDF zostanie zapisany. To tutaj zaczyna się magia!

string dataDir = "YOUR DOCUMENT DIRECTORY"; // Zmień to na swój katalog

Ta linia definiuje, gdzie będzie przechowywany wygenerowany plik PDF. Nie zapomnij zastąpićYOUR DOCUMENT DIRECTORY z twoją rzeczywistą ścieżką.

Krok 2: Utwórz dokument PDF

Następnie utwórzmy nowy dokument PDF i dodajmy do niego strony.

Aspose.Pdf.Document doc = new Aspose.Pdf.Document();
Page page = doc.Pages.Add();

Tutaj inicjujemy nowy dokument i dodajemy stronę, na której umieścimy fragmenty tekstu.

Krok 3: Dodaj widoczny i ukryty tekst

Teraz dodamy do naszego pliku PDF zarówno widoczny, jak i niewidoczny tekst.

TextFragment frag1 = new TextFragment("This is common text.");
TextFragment frag2 = new TextFragment("This is invisible text.");

W tym fragmencie,frag1 będzie widoczny, podczas gdyfrag2 zostanie ustawiony jako niewidoczny.

Krok 4: Ustaw tekst jako niewidoczny

Aby utworzyć tekstfrag2 niewidoczne, po prostu je modyfikujeszTextState.

frag2.TextState.Invisible = true;

Ustawiając tę właściwość, każdy tekst powiązany zfrag2 nie zostanie wyświetlona podczas przeglądania pliku PDF.

Krok 5: Dodaj fragmenty tekstu do strony

Na koniec dodajemy te fragmenty tekstu do strony i zapisujemy plik PDF.

page.Paragraphs.Add(frag1);
page.Paragraphs.Add(frag2);
doc.Save(dataDir + "39400_out.pdf");
doc.Dispose();

Ta część kodu dodaje nasze fragmenty tekstu do strony. Następnie zapisujemy i usuwamy dokument prawidłowo.

Wyszukiwanie ukrytego tekstu w pliku PDF

Teraz, gdy utworzyliśmy nasz plik PDF z widocznym i ukrytym tekstem, jak wyszukać ten ukryty tekst? Rozłóżmy to na czynniki pierwsze.

Krok 1: Załaduj dokument PDF

Aby przeszukać tekst w pliku PDF, musimy najpierw załadować właśnie utworzony dokument.

doc = new Aspose.Pdf.Document(dataDir + "39400_out.pdf");

Krok 2: Utwórz absorber fragmentów tekstu

UżyjemyTextFragmentAbsorber aby przechwycić wszystkie fragmenty tekstu w pliku PDF.

TextFragmentAbsorber absorber = new TextFragmentAbsorber();
absorber.Visit(doc.Pages[1]);

Tutaj określamy, że chcemy wchłonąć wszystkie fragmenty tekstu z pierwszej strony.

Krok 3: Przejrzyj fragmenty

Teraz możemy przejrzeć zebrane fragmenty tekstu, aby dowiedzieć się, które z nich są widoczne, a które ukryte.

foreach (TextFragment fragment in absorber.TextFragments)
{
    Console.WriteLine("Text '{0}' on pos {1} invisibility: {2}",
        fragment.Text, fragment.Position.ToString(), fragment.TextState.Invisible);
}

Ta pętla sprawdza każdy fragment tekstu i drukuje jego zawartość wraz z jego pozycją i statusem widoczności. Jeślifragment.TextState.Invisible jest ustawione na true, oznacza to, że tekst jest ukryty!

Krok 4: Usuń dokument

Na koniec pamiętaj, żeby usunąć dokument, gdy już skończysz.

doc.Dispose();

Wniosek

W tym samouczku przeszliśmy przez ekscytujący proces dodawania i wyszukiwania ukrytego tekstu w plikach PDF przy użyciu Aspose.PDF dla .NET. Dowiedzieliśmy się, jak utworzyć dokument PDF z widocznym i ukrytym tekstem, a także jak programowo wyszukiwać ten ukryty tekst. Ta możliwość może być niezwykle przydatna w różnych aplikacjach, niezależnie od tego, czy musisz przechowywać poufne informacje, czy zapewnić unikalne wrażenia użytkownika w swoich dokumentach.

W miarę jak będziesz coraz bardziej zaznajomiony z ASPose.PDF, możliwości staną się nieograniczone. Eksperymentuj i przesuwaj granice tego, co możesz osiągnąć dzięki swoim dokumentom PDF!

Najczęściej zadawane pytania

Czy Aspose.PDF obsługuje zaszyfrowane pliki PDF?

Tak, Aspose.PDF obsługuje szyfrowanie i deszyfrowanie dokumentów PDF. Możesz łatwo zabezpieczyć swoje pliki PDF hasłami.

Czy jest dostępna wersja próbna Aspose.PDF?

Oczywiście! Możesz pobrać darmową wersję próbną zTutaj.

Jakie języki programowania obsługuje Aspose.PDF?

Aspose.PDF obsługuje wiele języków, w tym C#, Java i Python.

Gdzie mogę znaleźć dokumentację dla Aspose.PDF?

Możesz uzyskać dostęp do dokumentacjiTutaj.

Jak mogę uzyskać pomoc, jeśli napotkam problemy?

Aby uzyskać pomoc, możesz odwiedzić fora AsposeTutaj.

Dodaj uporządkowaną listę HTML do dokumentów