Získejte všechny přílohy v souboru PDF

Zavedení

V digitálním věku se soubory PDF staly základem sdílení dokumentů. Jsou univerzální, bezpečné a mohou obsahovat velké množství informací, včetně příloh. Přemýšleli jste někdy, jak extrahovat všechny ty skryté drahokamy ze souboru PDF? Tak to máš štěstí! V tomto tutoriálu se ponoříme do používání Aspose.PDF pro .NET k získání všech příloh v souboru PDF. Ať už jste zkušený vývojář nebo teprve začínáte, tento průvodce vás provede procesem krok za krokem.

Předpoklady

Než se pustíme do kódu, ujistěte se, že máte vše, co potřebujete, abyste mohli začít:

  1. Visual Studio: Ujistěte se, že máte na svém počítači nainstalované Visual Studio. Je to výchozí IDE pro vývoj .NET.
  2. Aspose.PDF for .NET: Budete si muset stáhnout a nainstalovat knihovnu Aspose.PDF. Můžete to najítzde.
  3. Základní znalost C#: Znalost programování v C# vám pomůže lépe porozumět úryvkům kódu.

Importujte balíčky

Chcete-li začít, budete muset importovat potřebné balíčky do svého projektu C#. Jak na to:

Vytvořit nový projekt

Otevřete Visual Studio a vytvořte nový projekt C#. Pro jednoduchost zvolte konzolovou aplikaci.

Přidejte odkaz Aspose.PDF

  1. Klepněte pravým tlačítkem myši na svůj projekt v Průzkumníku řešení.
  2. Vyberte „Spravovat balíčky NuGet“.
  3. Vyhledejte „Aspose.PDF“ a nainstalujte nejnovější verzi.

Importujte jmenný prostor

V horní části souboru C# importujte jmenný prostor Aspose.PDF

using System.IO;
using Aspose.Pdf;
using System;

Nyní, když máme naše prostředí nastavené, pojďme se pustit do hrubky extrahování příloh ze souboru PDF.

Krok 1: Nastavte adresář dokumentů

Nejprve musíte zadat cestu k adresáři dokumentů. Zde bude umístěn váš soubor PDF.

string dataDir = "YOUR DOCUMENT DIRECTORY";

NahraditYOUR DOCUMENT DIRECTORY se skutečnou cestou, kde je uložen váš soubor PDF. To je zásadní, protože program potřebuje vědět, kde má soubor hledat.

Krok 2: Otevřete dokument PDF

Dále otevřeme dokument PDF pomocí knihovny Aspose.PDF. Tady začíná kouzlo!

Document pdfDocument = new Document(dataDir + "GetAlltheAttachments.pdf");

Zde vytvoříme novýDocument objekt a předat cestu k souboru PDF. Ujistěte se, že se název souboru přesně shoduje, včetně přípony.

Krok 3: Přístup ke kolekci Embedded Files

Nyní, když máme dokument otevřený, pojďme se dostat do kolekce vložených souborů. Zde jsou uloženy všechny přílohy.

EmbeddedFileCollection embeddedFiles = pdfDocument.EmbeddedFiles;

Pomocí tohoto řádku stahujeme všechny vložené soubory do kolekce, kterou můžeme snadno procházet.

Krok 4: Spočítejte vložené soubory

Vždy je dobré vědět, s kolika přílohami máte co do činění. Pojďme si vytisknout celkový počet vložených souborů.

Console.WriteLine("Total files : {0}", embeddedFiles.Count);

Získáte tak rychlý přehled o tom, kolik příloh je ve vašem PDF.

Krok 5: Projděte přílohy

Nyní přichází ta zábavná část! Projdeme každou specifikaci souboru v kolekci vložených souborů a extrahujeme podrobnosti.

int count = 1;

foreach (FileSpecification fileSpecification in embeddedFiles)
{
    Console.WriteLine("Name: {0}", fileSpecification.Name);
    Console.WriteLine("Description: {0}", fileSpecification.Description);
    Console.WriteLine("Mime Type: {0}", fileSpecification.MIMEType);

V této smyčce vytiskneme název, popis a typ MIME každé přílohy. Získáte tak jasný obrázek o tom, co je uvnitř vašeho PDF.

Krok 6: Zkontrolujte další parametry

Některé přílohy mohou mít další parametry. Zkontrolujeme, zda existují a vytiskneme je.

if (fileSpecification.Params != null)
{
    Console.WriteLine("CheckSum: {0}", fileSpecification.Params.CheckSum);
    Console.WriteLine("Creation Date: {0}", fileSpecification.Params.CreationDate);
    Console.WriteLine("Modification Date: {0}", fileSpecification.Params.ModDate);
    Console.WriteLine("Size: {0}", fileSpecification.Params.Size);
}

Tento krok zajistí, že vám nebudou chybět žádné důležité podrobnosti o přílohách.

Krok 7: Rozbalte a uložte přílohy

Nakonec rozbalme obsah každé přílohy a uložme ji do souboru. Tady uvidíte výsledky své tvrdé práce!

byte[] fileContent = new byte[fileSpecification.Contents.Length];
fileSpecification.Contents.Read(fileContent, 0, fileContent.Length);
FileStream fileStream = new FileStream(dataDir + count + "_out" + ".txt", FileMode.Create);
fileStream.Write(fileContent, 0, fileContent.Length);
fileStream.Close();
count += 1;

V tomto kódu načteme obsah každé přílohy do bajtového pole a poté jej zapíšeme do nového souboru. Soubory budou pojmenovány postupně (např.1_out.txt, 2_out.txtatd.).

Závěr

A tady to máte! Úspěšně jste extrahovali všechny přílohy ze souboru PDF pomocí Aspose.PDF pro .NET. Tato výkonná knihovna usnadňuje manipulaci s dokumenty PDF a přístup k jejich skrytým pokladům. Ať už pracujete na osobním projektu nebo na profesionální aplikaci, vědět, jak extrahovat přílohy, může být neuvěřitelně užitečné.

FAQ

Co je Aspose.PDF pro .NET?

Aspose.PDF for .NET je knihovna, která umožňuje vývojářům vytvářet, manipulovat a převádět dokumenty PDF programově.

Mohu používat Aspose.PDF zdarma?

Ano, Aspose nabízí bezplatnou zkušební verzi, kterou můžete použít k prozkoumání funkcí knihovny. Podívejte se na tozde.

Jak získám podporu pro Aspose.PDF?

Podporu můžete získat prostřednictvím fóra Asposezde.

Je k dispozici dočasná licence?

Ano, můžete získat dočasnou licenci pro Aspose.PDFzde.

Kde najdu dokumentaci?

Dokumentaci k Aspose.PDF pro .NET lze naléztzde.