แท็กภาพใน PDF ที่มีอยู่

การแนะนำ

ในบทช่วยสอนนี้ เราจะแนะนำคุณเกี่ยวกับวิธีการแท็กภาพใน PDF ที่มีอยู่โดยใช้ Aspose.PDF สำหรับ .NET เมื่ออ่านคู่มือนี้จบ คุณจะสามารถตั้งค่าข้อความทางเลือกสำหรับภาพ ปรับคุณลักษณะเค้าโครง และตรวจสอบให้แน่ใจว่า PDF ของคุณเป็นไปตามมาตรฐานการเข้าถึง

ข้อกำหนดเบื้องต้น

ก่อนที่เราจะเริ่มต้น มาดูสิ่งที่คุณต้องมีกันก่อน:

  • Aspose.PDF สำหรับ .NET: ตรวจสอบให้แน่ใจว่าคุณได้ดาวน์โหลดและติดตั้ง Aspose.PDF สำหรับ .NET เวอร์ชันล่าสุดแล้วดาวน์โหลดที่นี่.
  • .NET Framework: ตรวจสอบให้แน่ใจว่าคุณมีการตั้งค่าสภาพแวดล้อมการพัฒนา .NET เช่น Visual Studio
  • ความเข้าใจพื้นฐานเกี่ยวกับโครงสร้าง PDF: ความคุ้นเคยกับองค์ประกอบโครงสร้าง PDF เช่น ย่อหน้า ช่วง ตาราง และรูปภาพ
  • ใบอนุญาตที่ถูกต้อง: คุณสามารถซื้อใบอนุญาตได้ที่นี่ หรือใช้แบบชั่วคราวที่นี่.

แพ็คเกจนำเข้า

ในการเริ่มต้นเขียนโค้ด คุณต้องนำเข้าเนมสเปซที่จำเป็นจาก Aspose.PDF สำหรับ .NET ซึ่งจะทำให้คุณเข้าถึงคลาสและวิธีการที่จำเป็นในการจัดการเอกสาร PDF ได้

using Aspose.Pdf.LogicalStructure;
using Aspose.Pdf.Tagged;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

ตอนนี้เราได้เตรียมฉากเรียบร้อยแล้ว มาแบ่งขั้นตอนการแท็กภาพออกเป็นหลายขั้นตอนกัน

ขั้นตอนที่ 1: โหลดเอกสาร PDF ที่มีอยู่

ขั้นตอนแรกคือโหลดไฟล์ PDF ที่คุณต้องการใช้งาน ซึ่งอาจเป็นไฟล์ PDF ใดก็ได้ที่มีรูปภาพที่คุณต้องการแท็ก

// เส้นทางไปยังไดเร็กทอรีเอกสาร
string dataDir = "YOUR DOCUMENT DIRECTORY";
string inFile = dataDir + "TH.pdf";
string outFile = dataDir + "TH_out.pdf";
string logFile = dataDir + "TH_out.xml";

// เปิดเอกสาร
Document document = new Document(inFile);
  • แทนที่"YOUR DOCUMENT DIRECTORY" ด้วยเส้นทางจริงไปยังไฟล์ของคุณ
  • การDocument คลาสนี้ช่วยให้คุณโหลดไฟล์ PDF ที่มีอยู่ได้ คุณจะแก้ไขไฟล์ PDF นี้เพื่อแท็กรูปภาพ

ขั้นตอนที่ 2: เข้าถึงเนื้อหาที่แท็กและองค์ประกอบโครงสร้างราก

เมื่อคุณเปิดไฟล์ PDF แล้ว ขั้นตอนต่อไปคือการเข้าถึงเนื้อหาที่แท็กไว้และระบุองค์ประกอบโครงสร้างหลัก ซึ่งเป็นสิ่งสำคัญมาก เนื่องจากช่วยให้คุณสามารถนำทางผ่านองค์ประกอบต่างๆ ใน PDF และปรับเปลี่ยนได้

// รับเนื้อหาที่แท็กและองค์ประกอบโครงสร้างราก
ITaggedContent taggedContent = document.TaggedContent;
StructureElement rootElement = taggedContent.RootElement;
  • TaggedContent ให้การเข้าถึงองค์ประกอบที่มีโครงสร้างใน PDF
  • การRootElement เป็นองค์ประกอบโครงสร้างบนสุด ซึ่งคุณสามารถเลื่อนลงไปยังองค์ประกอบอื่นๆ เช่น ย่อหน้า ตาราง และรูปภาพได้

ขั้นตอนที่ 3: ตั้งชื่อให้กับเอกสาร PDF ที่ถูกแท็ก

การเพิ่มชื่อเรื่องให้กับเอกสาร PDF ที่ถูกแท็กจะช่วยให้แน่ใจว่าเอกสารของคุณมีป้ายกำกับอย่างถูกต้อง ซึ่งมีประโยชน์ต่อการเข้าถึงและการปฏิบัติตามมาตรฐาน PDF/UA

// ตั้งชื่อเรื่องให้กับเอกสาร PDF ที่ถูกแท็ก
taggedContent.SetTitle("Document with images");
  • การตั้งชื่อให้กับ PDF ที่คุณแท็กจะช่วยเพิ่มการเข้าถึงและปรับปรุงความชัดเจนของเอกสารสำหรับโปรแกรมอ่านหน้าจอและเทคโนโลยีช่วยเหลือ

ขั้นตอนที่ 4: ค้นหาและแท็กภาพ

ตอนนี้เรามาดูองค์ประกอบของภาพ (เรียกอีกอย่างว่าFigureElement ใน Aspose.PDF) ให้ตั้งค่าข้อความทางเลือกและกำหนดค่าแอตทริบิวต์เค้าโครงของมัน

// วนซ้ำผ่านองค์ประกอบรูปภาพทั้งหมดและตั้งค่าข้อความทางเลือกและคุณลักษณะเค้าโครง
foreach (FigureElement figureElement in rootElement.FindElements<FigureElement>(true))
{
    // ตั้งค่าข้อความทางเลือกสำหรับรูปภาพ
    figureElement.AlternativeText = "Figure alternative text (technique 2)";
    
    // สร้างและตั้งค่าแอตทริบิวต์ BBox (กล่องขอบเขต)
    StructureAttribute bboxAttribute = new StructureAttribute(AttributeKey.BBox);
    bboxAttribute.SetRectangleValue(new Aspose.Pdf.Rectangle(0.0, 0.0, 100.0, 100.0));
    
    // ตั้งค่าคุณลักษณะเค้าโครงของรูป
    StructureAttributes figureLayoutAttributes = figureElement.Attributes.GetAttributes(AttributeOwnerStandard.Layout);
    figureLayoutAttributes.SetAttribute(bboxAttribute);
}
  • รหัสนี้จะวนซ้ำผ่านทั้งหมดFigureElement วัตถุในโครงสร้างรากซึ่งแสดงถึงรูปภาพ
  • กำหนดข้อความทางเลือกเพื่อการเข้าถึงได้ (โปรแกรมอ่านหน้าจอจะใช้ข้อความนี้เพื่ออธิบายรูปภาพ)
  • กล่องขอบเขต (BBoxระบุพิกัดสำหรับเค้าโครงของรูปภาพเพื่อให้แน่ใจว่าจะแสดงในเอกสารอย่างถูกต้อง

ขั้นตอนที่ 5: แก้ไของค์ประกอบช่วงภายในตาราง

ในบางกรณี คุณอาจต้องปรับเปลี่ยนองค์ประกอบ span ภายในตาราง ที่นี่ เราจะสาธิตวิธีค้นหาSpanElement และย้ายมันเข้าไปในย่อหน้า

// ค้นหาองค์ประกอบของตาราง ช่วง และย่อหน้า
TableElement tableElement = rootElement.FindElements<TableElement>(true)[0];
SpanElement spanElement = tableElement.FindElements<SpanElement>(true)[0];
TableTDElement firstTdElement = tableElement.FindElements<TableTDElement>(true)[0];
ParagraphElement paragraph = firstTdElement.FindElements<ParagraphElement>(true)[0];

// ย้ายองค์ประกอบช่วงเข้าไปในย่อหน้า
spanElement.ChangeParentElement(paragraph);
  • ที่นี่เราจะค้นหาTableElement, SpanElement , และParagraphElement ภายในไฟล์ PDF
  • การใช้ChangeParentElement วิธีการนี้ เราจะย้ายช่วงไปยังย่อหน้าเพื่อให้แน่ใจว่ามีการแท็กและโครงสร้างที่เหมาะสม

ขั้นตอนที่ 6: บันทึกเอกสารและตรวจสอบการปฏิบัติตาม PDF/UA

เมื่อทำการเปลี่ยนแปลงทั้งหมดแล้ว ขั้นตอนสุดท้ายคือการบันทึก PDF ที่อัปเดตและตรวจสอบว่าเป็นไปตามมาตรฐาน PDF/UA หรือไม่

// บันทึกเอกสาร PDF ที่ได้รับการอัพเดต
document.Save(outFile);

// ตรวจสอบการปฏิบัติตาม PDF/UA
document = new Document(outFile);
bool isPdfUaCompliance = document.Validate(logFile, PdfFormat.PDF_UA_1);
Console.WriteLine(String.Format("PDF/UA compliance: {0}", isPdfUaCompliance));
  • การValidate วิธีการตรวจสอบเอกสาร PDF ตามมาตรฐาน PDF/UA และบันทึกผลลัพธ์
  • การรับรองการปฏิบัติตามจะช่วยปรับปรุงการเข้าถึงและตอบสนองข้อกำหนดด้านกฎระเบียบสำหรับการเผยแพร่เอกสาร

บทสรุป

ในบทช่วยสอนนี้ เราได้แสดงให้คุณเห็นถึงวิธีการแท็กรูปภาพใน PDF ที่มีอยู่โดยใช้ Aspose.PDF สำหรับ .NET คุณสามารถมั่นใจได้ว่า PDF ของคุณสามารถเข้าถึงได้และเป็นไปตามมาตรฐานสมัยใหม่ โดยการตั้งค่าข้อความทางเลือก การปรับแอตทริบิวต์เค้าโครง และการตรวจสอบเอกสารให้สอดคล้องกับ PDF/UA Aspose.PDF ช่วยให้คุณทำงานกับองค์ประกอบที่มีโครงสร้างได้ง่าย ช่วยให้คุณควบคุมเค้าโครงและการเข้าถึงเอกสารของคุณได้

คำถามที่พบบ่อย

Aspose.PDF สำหรับ .NET ใช้ทำอะไร?

Aspose.PDF สำหรับ .NET เป็นไลบรารีอันทรงพลังที่ใช้ในการสร้าง แก้ไข และจัดการเอกสาร PDF ด้วยโปรแกรมในสภาพแวดล้อม .NET

ฉันจะมั่นใจได้อย่างไรว่าเป็นไปตามมาตรฐาน PDF/UA

คุณสามารถใช้ Aspose.PDF ได้Validate วิธีการตรวจสอบความสอดคล้องกับ PDF/UA หลังจากทำการแก้ไขเอกสาร

ข้อความทางเลือกใน PDF คืออะไร

ข้อความทางเลือกคือคำอธิบายที่เพิ่มลงในรูปภาพใน PDF เพื่อปรับปรุงการเข้าถึง โดยเฉพาะสำหรับผู้ใช้ที่ต้องใช้โปรแกรมอ่านหน้าจอ

ฉันสามารถจัดการตารางและช่วงใน PDF ด้วย Aspose.PDF ได้หรือไม่

ใช่ Aspose.PDF ช่วยให้คุณสามารถจัดการตาราง ช่วง และองค์ประกอบที่มีโครงสร้างอื่น ๆ ภายในเอกสาร PDF ได้

ฉันสามารถดาวน์โหลด Aspose.PDF สำหรับ .NET ได้ที่ไหน

คุณสามารถดาวน์โหลด Aspose.PDF เวอร์ชันล่าสุดสำหรับ .NET ได้ที่นี่.