Oznacz obraz w istniejącym pliku PDF

Wstęp

tym samouczku przeprowadzimy Cię przez proces tagowania obrazu w istniejącym pliku PDF przy użyciu Aspose.PDF dla .NET. Do końca tego przewodnika będziesz w stanie ustawić tekst alternatywny dla obrazów, dostosować atrybuty układu i upewnić się, że Twój plik PDF jest zgodny ze standardami dostępności.

Wymagania wstępne

Zanim przejdziemy do konkretów, omówmy, czego będziesz potrzebować, żeby zacząć:

  • Aspose.PDF dla platformy .NET: Upewnij się, że pobrałeś i zainstalowałeś najnowszą wersję pliku Aspose.PDF dla platformy .NET.Pobierz tutaj.
  • .NET Framework: Upewnij się, że masz skonfigurowane środowisko programistyczne .NET, np. Visual Studio.
  • Podstawowa znajomość struktury dokumentu PDF: Znajomość elementów struktury dokumentu PDF, takich jak akapity, rozpiętości, tabele i obrazy.
  • Ważna licencja: Możesz kupić licencjęTutaj lub użyj tymczasowegoTutaj.

Importuj pakiety

Aby rozpocząć kodowanie, musisz zaimportować niezbędne przestrzenie nazw z Aspose.PDF dla .NET. Dadzą ci one dostęp do niezbędnych klas i metod do manipulowania dokumentem PDF.

using Aspose.Pdf.LogicalStructure;
using Aspose.Pdf.Tagged;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

Teraz, gdy już omówiliśmy szczegóły, podzielmy proces tagowania obrazu na kilka kroków.

Krok 1: Załaduj istniejący dokument PDF

Pierwszym krokiem jest załadowanie pliku PDF, z którym chcesz pracować. Może to być dowolny plik PDF z obrazem, który chcesz oznaczyć.

// Ścieżka do katalogu dokumentów.
string dataDir = "YOUR DOCUMENT DIRECTORY";
string inFile = dataDir + "TH.pdf";
string outFile = dataDir + "TH_out.pdf";
string logFile = dataDir + "TH_out.xml";

// Otwórz dokument
Document document = new Document(inFile);
  • Zastępować"YOUR DOCUMENT DIRECTORY" z rzeczywistą ścieżką do pliku.
  • TenDocument Klasa pozwala załadować istniejący plik PDF. Będziesz modyfikować ten plik PDF, aby oznaczyć obraz.

Krok 2: Dostęp do oznaczonej zawartości i elementu struktury głównej

Po otwarciu pliku PDF następnym krokiem jest dostęp do oznaczonej zawartości i zidentyfikowanie elementu struktury głównej. Jest to kluczowe, ponieważ umożliwia nawigację po elementach w pliku PDF i wprowadzanie modyfikacji.

// Pobierz oznaczoną zawartość i element struktury głównej
ITaggedContent taggedContent = document.TaggedContent;
StructureElement rootElement = taggedContent.RootElement;
  • TaggedContent zapewnia dostęp do ustrukturyzowanych elementów w pliku PDF.
  • TenRootElement jest najwyższym elementem struktury, z którego można przejść do innych elementów, takich jak akapity, tabele i obrazy.

Krok 3: Ustaw tytuł dla oznaczonego dokumentu PDF

Dodanie tytułu do oznaczonego dokumentu PDF gwarantuje, że dokument będzie prawidłowo oznaczony, co jest przydatne w kontekście dostępności i zgodności ze standardem PDF/UA.

// Ustaw tytuł dla oznaczonego dokumentu PDF
taggedContent.SetTitle("Document with images");
  • Ustawienie tytułu dla oznaczonego pliku PDF zwiększa dostępność i poprawia przejrzystość dokumentu dla czytników ekranu i technologii wspomagających.

Krok 4: Znajdź i oznacz obraz

Teraz znajdźmy element obrazu (nazywanyFigureElement w pliku Aspose.PDF), ustaw dla niego tekst alternatywny i skonfiguruj jego atrybuty układu.

// Przejdź przez wszystkie elementy Figure (obrazy) i ustaw alternatywny tekst oraz atrybuty układu
foreach (FigureElement figureElement in rootElement.FindElements<FigureElement>(true))
{
    // Ustaw alternatywny tekst dla rysunku
    figureElement.AlternativeText = "Figure alternative text (technique 2)";
    
    // Utwórz i ustaw atrybut BBox (pole ograniczające)
    StructureAttribute bboxAttribute = new StructureAttribute(AttributeKey.BBox);
    bboxAttribute.SetRectangleValue(new Aspose.Pdf.Rectangle(0.0, 0.0, 100.0, 100.0));
    
    // Ustaw atrybuty układu dla rysunku
    StructureAttributes figureLayoutAttributes = figureElement.Attributes.GetAttributes(AttributeOwnerStandard.Layout);
    figureLayoutAttributes.SetAttribute(bboxAttribute);
}
  • Ten kod przechodzi przez wszystkieFigureElement obiekty w strukturze głównej, które reprezentują obrazy.
  • Ustawia tekst alternatywny na potrzeby ułatwień dostępu (czytniki ekranu będą go używać do opisu obrazu).
  • Pole ograniczające (BBoxokreśla współrzędne układu obrazu, zapewniając jego prawidłowe wyświetlanie w dokumencie.

Krok 5: Modyfikowanie elementów rozpiętości w tabeli

W niektórych przypadkach może być konieczna modyfikacja elementów span w tabeli. Tutaj pokażemy, jak znaleźćSpanElement i przenieś do akapitu.

// Znajdź elementy tabeli, rozpiętości i akapitu
TableElement tableElement = rootElement.FindElements<TableElement>(true)[0];
SpanElement spanElement = tableElement.FindElements<SpanElement>(true)[0];
TableTDElement firstTdElement = tableElement.FindElements<TableTDElement>(true)[0];
ParagraphElement paragraph = firstTdElement.FindElements<ParagraphElement>(true)[0];

// Przenieś element span do akapitu
spanElement.ChangeParentElement(paragraph);
  • Tutaj znajdujemyTableElement, SpanElement , IParagraphElement w pliku PDF.
  • Korzystanie zChangeParentElement metodą przenosimy rozpiętość do akapitu, aby zapewnić właściwe tagowanie i strukturę.

Krok 6: Zapisz dokument i sprawdź zgodność z PDF/UA

Po wprowadzeniu wszystkich zmian ostatnim krokiem jest zapisanie zaktualizowanego pliku PDF i sprawdzenie, czy jest on zgodny ze standardami PDF/UA.

// Zapisz zaktualizowany dokument PDF
document.Save(outFile);

// Sprawdź zgodność z PDF/UA
document = new Document(outFile);
bool isPdfUaCompliance = document.Validate(logFile, PdfFormat.PDF_UA_1);
Console.WriteLine(String.Format("PDF/UA compliance: {0}", isPdfUaCompliance));
  • TenValidate Metoda sprawdza zgodność dokumentu PDF ze standardami PDF/UA i rejestruje wyniki.
  • Zapewnienie zgodności pomaga poprawić dostępność i spełnić wymogi regulacyjne dotyczące publikowania dokumentów.

Wniosek

tym samouczku pokazaliśmy, jak oznaczać obrazy w istniejącym pliku PDF za pomocą Aspose.PDF dla .NET. Ustawiając tekst alternatywny, dostosowując atrybuty układu i weryfikując zgodność dokumentu z PDF/UA, możesz zapewnić dostępność plików PDF i ich zgodność z nowoczesnymi standardami. Aspose.PDF ułatwia pracę ze strukturalnymi elementami, dając Ci kontrolę nad układem i dostępnością dokumentu.

Najczęściej zadawane pytania

Do czego służy Aspose.PDF for .NET?

Aspose.PDF dla platformy .NET to zaawansowana biblioteka służąca do tworzenia, edytowania i manipulowania dokumentami PDF programowo w środowisku .NET.

Jak zapewnić zgodność ze standardem PDF/UA?

Możesz użyć Aspose.PDFValidate metoda sprawdzania zgodności dokumentu ze standardem PDF/UA po wprowadzeniu modyfikacji.

Czym jest tekst alternatywny w plikach PDF?

Tekst alternatywny to opis dodawany do obrazów w plikach PDF w celu ułatwienia dostępu, zwłaszcza dla użytkowników korzystających z czytników ekranu.

Czy mogę manipulować tabelami i rozpiętościami w pliku PDF za pomocą Aspose.PDF?

Tak, Aspose.PDF pozwala na manipulowanie tabelami, rozpiętościami i innymi elementami strukturalnymi w dokumencie PDF.

Gdzie mogę pobrać Aspose.PDF dla .NET?

Możesz pobrać najnowszą wersję Aspose.PDF dla .NETTutaj.