Pobierz wszystkie załączniki w pliku PDF
Wstęp
W erze cyfrowej pliki PDF stały się podstawą udostępniania dokumentów. Są wszechstronne, bezpieczne i mogą zawierać mnóstwo informacji, w tym załączniki. Czy kiedykolwiek zastanawiałeś się, jak wyodrębnić wszystkie te ukryte perełki z pliku PDF? Cóż, masz szczęście! W tym samouczku zagłębimy się w używanie Aspose.PDF dla .NET, aby uzyskać wszystkie załączniki w pliku PDF. Niezależnie od tego, czy jesteś doświadczonym programistą, czy dopiero zaczynasz, ten przewodnik przeprowadzi Cię przez ten proces krok po kroku.
Wymagania wstępne
Zanim przejdziemy do kodu, upewnijmy się, że masz wszystko, czego potrzebujesz, aby zacząć:
- Visual Studio: Upewnij się, że masz zainstalowane na swoim komputerze Visual Studio. To najlepsze IDE do tworzenia oprogramowania .NET.
- Aspose.PDF dla .NET: Musisz pobrać i zainstalować bibliotekę Aspose.PDF. Możesz ją znaleźćTutaj.
- Podstawowa wiedza o języku C#: Znajomość programowania w języku C# pomoże Ci lepiej zrozumieć fragmenty kodu.
Importuj pakiety
Na początek musisz zaimportować niezbędne pakiety do swojego projektu C#. Oto jak to zrobić:
Utwórz nowy projekt
Otwórz Visual Studio i utwórz nowy projekt C#. Wybierz aplikację konsolową dla uproszczenia.
Dodaj odniesienie Aspose.PDF
- Kliknij prawym przyciskiem myszy swój projekt w Eksploratorze rozwiązań.
- Wybierz „Zarządzaj pakietami NuGet”.
- Wyszukaj „Aspose.PDF” i zainstaluj najnowszą wersję.
Importuj przestrzeń nazw
Na górze pliku C# zaimportuj przestrzeń nazw Aspose.PDF
using System.IO;
using Aspose.Pdf;
using System;
Teraz, gdy mamy już skonfigurowane środowisko, możemy przejść do szczegółów wyodrębniania załączników z pliku PDF.
Krok 1: Skonfiguruj katalog dokumentów
Po pierwsze, musisz określić ścieżkę do katalogu dokumentów. To tutaj będzie znajdował się plik PDF.
string dataDir = "YOUR DOCUMENT DIRECTORY";
ZastępowaćYOUR DOCUMENT DIRECTORY
z rzeczywistą ścieżką, gdzie przechowywany jest plik PDF. Jest to kluczowe, ponieważ program musi wiedzieć, gdzie szukać pliku.
Krok 2: Otwórz dokument PDF
Następnie otworzymy dokument PDF za pomocą biblioteki Aspose.PDF. To tutaj zaczyna się magia!
Document pdfDocument = new Document(dataDir + "GetAlltheAttachments.pdf");
Tutaj tworzymy nowyDocument
obiekt i przekaż ścieżkę do pliku PDF. Upewnij się, że nazwa pliku jest dokładnie taka sama, łącznie z rozszerzeniem.
Krok 3: Uzyskaj dostęp do kolekcji osadzonych plików
Teraz, gdy mamy już otwarty dokument, uzyskajmy dostęp do kolekcji osadzonych plików. To tutaj przechowywane są wszystkie załączniki.
EmbeddedFileCollection embeddedFiles = pdfDocument.EmbeddedFiles;
Za pomocą tego wiersza ściągamy wszystkie osadzone pliki do kolekcji, którą możemy łatwo przeglądać w pętli.
Krok 4: Policz osadzone pliki
Zawsze dobrze jest wiedzieć, z iloma załącznikami masz do czynienia. Wydrukujmy całkowitą liczbę osadzonych plików.
Console.WriteLine("Total files : {0}", embeddedFiles.Count);
Dzięki temu szybko sprawdzisz, ile załączników znajduje się w Twoim pliku PDF.
Krok 5: Przejrzyj załączniki
Teraz nadchodzi zabawna część! Przejdziemy przez każdą specyfikację pliku w kolekcji osadzonych plików i wyodrębnimy szczegóły.
int count = 1;
foreach (FileSpecification fileSpecification in embeddedFiles)
{
Console.WriteLine("Name: {0}", fileSpecification.Name);
Console.WriteLine("Description: {0}", fileSpecification.Description);
Console.WriteLine("Mime Type: {0}", fileSpecification.MIMEType);
W tej pętli drukujemy nazwę, opis i typ MIME każdego załącznika. Daje to jasny obraz tego, co znajduje się w pliku PDF.
Krok 6: Sprawdź dodatkowe parametry
Niektóre załączniki mogą mieć dodatkowe parametry. Sprawdźmy, czy istnieją i wydrukujmy je.
if (fileSpecification.Params != null)
{
Console.WriteLine("CheckSum: {0}", fileSpecification.Params.CheckSum);
Console.WriteLine("Creation Date: {0}", fileSpecification.Params.CreationDate);
Console.WriteLine("Modification Date: {0}", fileSpecification.Params.ModDate);
Console.WriteLine("Size: {0}", fileSpecification.Params.Size);
}
Ten krok gwarantuje, że nie pominiesz żadnych ważnych szczegółów dotyczących załączników.
Krok 7: Wypakuj i zapisz załączniki
Na koniec wyodrębnijmy zawartość każdego załącznika i zapiszmy go do pliku. Tutaj zobaczysz efekty swojej ciężkiej pracy!
byte[] fileContent = new byte[fileSpecification.Contents.Length];
fileSpecification.Contents.Read(fileContent, 0, fileContent.Length);
FileStream fileStream = new FileStream(dataDir + count + "_out" + ".txt", FileMode.Create);
fileStream.Write(fileContent, 0, fileContent.Length);
fileStream.Close();
count += 1;
W tym kodzie odczytujemy zawartość każdego załącznika do tablicy bajtów, a następnie zapisujemy ją do nowego pliku. Pliki będą nazywane sekwencyjnie (np.1_out.txt
, 2_out.txt
itp.).
Wniosek
I masz to! Udało Ci się wyodrębnić wszystkie załączniki z pliku PDF za pomocą Aspose.PDF dla .NET. Ta potężna biblioteka ułatwia manipulowanie dokumentami PDF i dostęp do ich ukrytych skarbów. Niezależnie od tego, czy pracujesz nad osobistym projektem, czy profesjonalną aplikacją, wiedza o tym, jak wyodrębnić załączniki, może być niezwykle przydatna.
Najczęściej zadawane pytania
Czym jest Aspose.PDF dla .NET?
Aspose.PDF dla platformy .NET to biblioteka umożliwiająca programistom programowe tworzenie, modyfikowanie i konwertowanie dokumentów PDF.
Czy mogę używać Aspose.PDF bezpłatnie?
Tak, Aspose oferuje bezpłatną wersję próbną, której możesz użyć do eksploracji funkcji biblioteki. Sprawdź jąTutaj.
Jak uzyskać pomoc techniczną dotyczącą Aspose.PDF?
Możesz uzyskać pomoc poprzez forum AsposeTutaj.
Czy jest dostępna licencja tymczasowa?
Tak, możesz uzyskać tymczasową licencję na Aspose.PDFTutaj.
Gdzie mogę znaleźć dokumentację?
Dokumentację Aspose.PDF dla .NET można znaleźćTutaj.