เพิ่มและค้นหาข้อความที่ซ่อนอยู่ในไฟล์ PDF

การแนะนำ

ในบทช่วยสอนนี้ เราจะแนะนำคุณทีละขั้นตอนเกี่ยวกับวิธีเพิ่มและค้นหาข้อความที่ซ่อนอยู่ในไฟล์ PDF โดยใช้ Aspose.PDF สำหรับ .NET ไม่ว่าคุณจะเป็นนักพัฒนาที่มีประสบการณ์หรือมือใหม่ที่ต้องการพัฒนาทักษะการเขียนโปรแกรม บทความนี้จะให้ข้อมูลเชิงลึกที่คุณต้องการเพื่อรวมฟังก์ชันข้อความที่ซ่อนอยู่ในแอปพลิเคชันของคุณ

ข้อกำหนดเบื้องต้น

ก่อนที่จะเริ่มเขียนโค้ด มีข้อกำหนดเบื้องต้นบางประการที่คุณจะต้องดูแล:

รายการตรวจสอบความต้องการ

  • Visual Studio: ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Visual Studio แล้ว บทช่วยสอนนี้ถือว่าคุณใช้ .NET Framework
  • Aspose.PDF สำหรับ .NET: คุณต้องมีไลบรารี Aspose.PDF สำหรับ .NET คุณสามารถดาวน์โหลดได้ที่นี่.
  • ความรู้พื้นฐานเกี่ยวกับ C#: ความคุ้นเคยกับการเขียนโปรแกรม C# จะช่วยให้คุณเข้าใจชิ้นส่วนโค้ดได้ดีขึ้น

แพ็คเกจนำเข้า

ก่อนที่คุณจะเริ่มใช้โค้ด คุณต้องแน่ใจว่าได้นำเข้าเนมสเปซ Aspose.PDF ที่จำเป็นแล้ว วิธีดำเนินการมีดังต่อไปนี้:

ตั้งค่าโครงการของคุณ

  1. เปิด Visual Studio และสร้างโครงการ C# ใหม่หรือใช้โครงการที่มีอยู่
  2. ติดตั้ง Aspose.PDF โดยเพิ่มแพ็คเกจ NuGet คุณสามารถทำได้โดยไปที่ตัวจัดการแพ็คเกจ NuGet และค้นหาAspose.PDF.
  3. นอกจากนี้คุณสามารถดาวน์โหลดไลบรารีโดยตรงจากที่นี่ และเพิ่มไว้เป็นข้อมูลอ้างอิงในโครงการของคุณ

นำเข้าเนมสเปซที่จำเป็น

ที่ด้านบนของไฟล์ C# ของคุณ นำเข้าเนมสเปซต่อไปนี้:

using Aspose.Pdf.Text;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

ขั้นตอนนี้มีความสำคัญเนื่องจากเนมสเปซเหล่านี้ประกอบด้วยคลาสและวิธีการที่จำเป็นในการจัดการเอกสาร PDF

การสร้างเอกสาร PDF ที่มีข้อความที่ซ่อนอยู่

ตอนนี้คุณได้ตั้งค่าเรียบร้อยแล้ว เรามาดูขั้นตอนการสร้างเอกสาร PDF ที่มีทั้งข้อความที่มองเห็นและมองไม่เห็นกัน

ขั้นตอนที่ 1: กำหนดไดเรกทอรีเอกสาร

ขั้นแรก คุณต้องกำหนดเส้นทางที่จะบันทึกไฟล์ PDF นี่คือจุดเริ่มต้นของความมหัศจรรย์!

string dataDir = "YOUR DOCUMENT DIRECTORY"; // เปลี่ยนสิ่งนี้ไปยังไดเร็กทอรีของคุณ

บรรทัดนี้จะกำหนดว่าไฟล์ PDF ที่คุณสร้างขึ้นจะถูกจัดเก็บไว้ที่ไหน อย่าลืมแทนที่YOUR DOCUMENT DIRECTORY ด้วยเส้นทางที่แท้จริงของคุณ

ขั้นตอนที่ 2: สร้างเอกสาร PDF

ต่อไปเราจะสร้างเอกสาร PDF ใหม่และเพิ่มหน้าลงไป

Aspose.Pdf.Document doc = new Aspose.Pdf.Document();
Page page = doc.Pages.Add();

ที่นี่ เรากำลังเริ่มต้นเอกสารใหม่และเพิ่มหน้าที่เราจะวางส่วนข้อความของเรา

ขั้นตอนที่ 3: เพิ่มข้อความที่มองเห็นและซ่อนไว้

ตอนนี้เราจะเพิ่มข้อความทั้งที่มองเห็นและมองไม่เห็นลงใน PDF ของเรา

TextFragment frag1 = new TextFragment("This is common text.");
TextFragment frag2 = new TextFragment("This is invisible text.");

ในข้อความนี้frag1 จะมองเห็นได้ในขณะที่frag2 จะถูกตั้งเป็นมองไม่เห็นต่อไป

ขั้นตอนที่ 4: ตั้งค่าข้อความให้มองไม่เห็น

เพื่อทำให้ข้อความของfrag2 มองไม่เห็น คุณเพียงแค่ปรับเปลี่ยนมันTextState.

frag2.TextState.Invisible = true;

การตั้งค่าคุณสมบัตินี้จะทำให้ข้อความใดๆ ที่เกี่ยวข้องกับfrag2 จะไม่แสดงผลเมื่อดูไฟล์ PDF

ขั้นตอนที่ 5: เพิ่มส่วนข้อความลงในหน้า

สุดท้ายเราเพิ่มชิ้นส่วนข้อความเหล่านี้ลงในหน้าและบันทึก PDF

page.Paragraphs.Add(frag1);
page.Paragraphs.Add(frag2);
doc.Save(dataDir + "39400_out.pdf");
doc.Dispose();

ส่วนนี้ของโค้ดจะเพิ่มส่วนข้อความของเราลงในหน้า หลังจากนั้นเราจะบันทึกและกำจัดเอกสารอย่างถูกต้อง

การค้นหาข้อความที่ซ่อนอยู่ใน PDF

ตอนนี้เราได้สร้าง PDF ที่มีทั้งข้อความที่มองเห็นและซ่อนไว้แล้ว เราจะค้นหาข้อความที่ซ่อนอยู่ได้อย่างไร มาแยกรายละเอียดกัน

ขั้นตอนที่ 1: โหลดเอกสาร PDF

หากต้องการค้นหาข้อความภายใน PDF ก่อนอื่นเราต้องโหลดเอกสารที่เราเพิ่งสร้างขึ้น

doc = new Aspose.Pdf.Document(dataDir + "39400_out.pdf");

ขั้นตอนที่ 2: สร้าง Text Fragment Absorber

เราจะใช้TextFragmentAbsorber เพื่อจับส่วนข้อความทั้งหมดใน PDF

TextFragmentAbsorber absorber = new TextFragmentAbsorber();
absorber.Visit(doc.Pages[1]);

ที่นี่ เราระบุว่าเราต้องการดูดซับส่วนข้อความทั้งหมดจากหน้าแรก

ขั้นตอนที่ 3: ทำซ้ำผ่านชิ้นส่วนต่างๆ

ตอนนี้ เราสามารถวนซ้ำผ่านชิ้นส่วนข้อความที่รวบรวมไว้ เพื่อค้นหาว่าชิ้นส่วนใดมองเห็นได้และชิ้นส่วนใดซ่อนอยู่

foreach (TextFragment fragment in absorber.TextFragments)
{
    Console.WriteLine("Text '{0}' on pos {1} invisibility: {2}",
        fragment.Text, fragment.Position.ToString(), fragment.TextState.Invisible);
}

ลูปนี้จะตรวจสอบแต่ละส่วนของข้อความและพิมพ์เนื้อหาพร้อมกับตำแหน่งและสถานะการมองเห็น หากfragment.TextState.Invisible ถูกตั้งค่าเป็น true หมายความว่าข้อความถูกซ่อน!

ขั้นตอนที่ 4: กำจัดเอกสาร

สุดท้ายอย่าลืมกำจัดเอกสารอีกครั้งเมื่อใช้งานเสร็จแล้ว

doc.Dispose();

บทสรุป

ในบทช่วยสอนนี้ เราแนะนำขั้นตอนที่น่าตื่นเต้นในการเพิ่มและค้นหาข้อความที่ซ่อนอยู่ในไฟล์ PDF โดยใช้ Aspose.PDF สำหรับ .NET เราได้เรียนรู้วิธีการสร้างเอกสาร PDF ที่มีทั้งข้อความที่มองเห็นได้และซ่อนอยู่ รวมถึงวิธีการค้นหาข้อความที่ซ่อนอยู่นั้นด้วยโปรแกรม ความสามารถนี้มีประโยชน์อย่างยิ่งในแอปพลิเคชันต่างๆ ไม่ว่าคุณจะต้องจัดเก็บข้อมูลที่เป็นความลับหรือมอบประสบการณ์ผู้ใช้ที่ไม่ซ้ำใครภายในเอกสารของคุณ

เมื่อคุณคุ้นเคยกับ ASPose.PDF มากขึ้น ความเป็นไปได้ก็จะไม่มีที่สิ้นสุด ทดลองและขยายขอบเขตของสิ่งที่คุณสามารถทำได้กับเอกสาร PDF ของคุณต่อไป!

คำถามที่พบบ่อย

Aspose.PDF จัดการไฟล์ PDF ที่เข้ารหัสได้หรือไม่

ใช่ Aspose.PDF รองรับการเข้ารหัสและถอดรหัสเอกสาร PDF คุณสามารถรักษาความปลอดภัยไฟล์ PDF ของคุณได้อย่างง่ายดายด้วยรหัสผ่าน

มีเวอร์ชันทดลองใช้สำหรับ Aspose.PDF หรือไม่

แน่นอน! คุณสามารถดาวน์โหลดรุ่นทดลองใช้งานฟรีได้จากที่นี่.

Aspose.PDF รองรับภาษาโปรแกรมอะไรบ้าง?

Aspose.PDF รองรับหลายภาษา รวมถึง C#, Java และ Python

ฉันสามารถค้นหาเอกสารสำหรับ Aspose.PDF ได้ที่ไหน

คุณสามารถเข้าถึงเอกสารได้ที่นี่.

ฉันจะได้รับการสนับสนุนได้อย่างไรหากประสบปัญหา?

หากต้องการความช่วยเหลือ คุณสามารถเยี่ยมชมฟอรัม Asposeที่นี่.