เพิ่มและค้นหาข้อความที่ซ่อนอยู่ในไฟล์ PDF
การแนะนำ
ในบทช่วยสอนนี้ เราจะแนะนำคุณทีละขั้นตอนเกี่ยวกับวิธีเพิ่มและค้นหาข้อความที่ซ่อนอยู่ในไฟล์ PDF โดยใช้ Aspose.PDF สำหรับ .NET ไม่ว่าคุณจะเป็นนักพัฒนาที่มีประสบการณ์หรือมือใหม่ที่ต้องการพัฒนาทักษะการเขียนโปรแกรม บทความนี้จะให้ข้อมูลเชิงลึกที่คุณต้องการเพื่อรวมฟังก์ชันข้อความที่ซ่อนอยู่ในแอปพลิเคชันของคุณ
ข้อกำหนดเบื้องต้น
ก่อนที่จะเริ่มเขียนโค้ด มีข้อกำหนดเบื้องต้นบางประการที่คุณจะต้องดูแล:
รายการตรวจสอบความต้องการ
- Visual Studio: ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Visual Studio แล้ว บทช่วยสอนนี้ถือว่าคุณใช้ .NET Framework
- Aspose.PDF สำหรับ .NET: คุณต้องมีไลบรารี Aspose.PDF สำหรับ .NET คุณสามารถดาวน์โหลดได้ที่นี่.
- ความรู้พื้นฐานเกี่ยวกับ C#: ความคุ้นเคยกับการเขียนโปรแกรม C# จะช่วยให้คุณเข้าใจชิ้นส่วนโค้ดได้ดีขึ้น
แพ็คเกจนำเข้า
ก่อนที่คุณจะเริ่มใช้โค้ด คุณต้องแน่ใจว่าได้นำเข้าเนมสเปซ Aspose.PDF ที่จำเป็นแล้ว วิธีดำเนินการมีดังต่อไปนี้:
ตั้งค่าโครงการของคุณ
- เปิด Visual Studio และสร้างโครงการ C# ใหม่หรือใช้โครงการที่มีอยู่
- ติดตั้ง Aspose.PDF โดยเพิ่มแพ็คเกจ NuGet คุณสามารถทำได้โดยไปที่ตัวจัดการแพ็คเกจ NuGet และค้นหา
Aspose.PDF
. - นอกจากนี้คุณสามารถดาวน์โหลดไลบรารีโดยตรงจากที่นี่ และเพิ่มไว้เป็นข้อมูลอ้างอิงในโครงการของคุณ
นำเข้าเนมสเปซที่จำเป็น
ที่ด้านบนของไฟล์ C# ของคุณ นำเข้าเนมสเปซต่อไปนี้:
using Aspose.Pdf.Text;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
ขั้นตอนนี้มีความสำคัญเนื่องจากเนมสเปซเหล่านี้ประกอบด้วยคลาสและวิธีการที่จำเป็นในการจัดการเอกสาร PDF
การสร้างเอกสาร PDF ที่มีข้อความที่ซ่อนอยู่
ตอนนี้คุณได้ตั้งค่าเรียบร้อยแล้ว เรามาดูขั้นตอนการสร้างเอกสาร PDF ที่มีทั้งข้อความที่มองเห็นและมองไม่เห็นกัน
ขั้นตอนที่ 1: กำหนดไดเรกทอรีเอกสาร
ขั้นแรก คุณต้องกำหนดเส้นทางที่จะบันทึกไฟล์ PDF นี่คือจุดเริ่มต้นของความมหัศจรรย์!
string dataDir = "YOUR DOCUMENT DIRECTORY"; // เปลี่ยนสิ่งนี้ไปยังไดเร็กทอรีของคุณ
บรรทัดนี้จะกำหนดว่าไฟล์ PDF ที่คุณสร้างขึ้นจะถูกจัดเก็บไว้ที่ไหน อย่าลืมแทนที่YOUR DOCUMENT DIRECTORY
ด้วยเส้นทางที่แท้จริงของคุณ
ขั้นตอนที่ 2: สร้างเอกสาร PDF
ต่อไปเราจะสร้างเอกสาร PDF ใหม่และเพิ่มหน้าลงไป
Aspose.Pdf.Document doc = new Aspose.Pdf.Document();
Page page = doc.Pages.Add();
ที่นี่ เรากำลังเริ่มต้นเอกสารใหม่และเพิ่มหน้าที่เราจะวางส่วนข้อความของเรา
ขั้นตอนที่ 3: เพิ่มข้อความที่มองเห็นและซ่อนไว้
ตอนนี้เราจะเพิ่มข้อความทั้งที่มองเห็นและมองไม่เห็นลงใน PDF ของเรา
TextFragment frag1 = new TextFragment("This is common text.");
TextFragment frag2 = new TextFragment("This is invisible text.");
ในข้อความนี้frag1
จะมองเห็นได้ในขณะที่frag2
จะถูกตั้งเป็นมองไม่เห็นต่อไป
ขั้นตอนที่ 4: ตั้งค่าข้อความให้มองไม่เห็น
เพื่อทำให้ข้อความของfrag2
มองไม่เห็น คุณเพียงแค่ปรับเปลี่ยนมันTextState
.
frag2.TextState.Invisible = true;
การตั้งค่าคุณสมบัตินี้จะทำให้ข้อความใดๆ ที่เกี่ยวข้องกับfrag2
จะไม่แสดงผลเมื่อดูไฟล์ PDF
ขั้นตอนที่ 5: เพิ่มส่วนข้อความลงในหน้า
สุดท้ายเราเพิ่มชิ้นส่วนข้อความเหล่านี้ลงในหน้าและบันทึก PDF
page.Paragraphs.Add(frag1);
page.Paragraphs.Add(frag2);
doc.Save(dataDir + "39400_out.pdf");
doc.Dispose();
ส่วนนี้ของโค้ดจะเพิ่มส่วนข้อความของเราลงในหน้า หลังจากนั้นเราจะบันทึกและกำจัดเอกสารอย่างถูกต้อง
การค้นหาข้อความที่ซ่อนอยู่ใน PDF
ตอนนี้เราได้สร้าง PDF ที่มีทั้งข้อความที่มองเห็นและซ่อนไว้แล้ว เราจะค้นหาข้อความที่ซ่อนอยู่ได้อย่างไร มาแยกรายละเอียดกัน
ขั้นตอนที่ 1: โหลดเอกสาร PDF
หากต้องการค้นหาข้อความภายใน PDF ก่อนอื่นเราต้องโหลดเอกสารที่เราเพิ่งสร้างขึ้น
doc = new Aspose.Pdf.Document(dataDir + "39400_out.pdf");
ขั้นตอนที่ 2: สร้าง Text Fragment Absorber
เราจะใช้TextFragmentAbsorber
เพื่อจับส่วนข้อความทั้งหมดใน PDF
TextFragmentAbsorber absorber = new TextFragmentAbsorber();
absorber.Visit(doc.Pages[1]);
ที่นี่ เราระบุว่าเราต้องการดูดซับส่วนข้อความทั้งหมดจากหน้าแรก
ขั้นตอนที่ 3: ทำซ้ำผ่านชิ้นส่วนต่างๆ
ตอนนี้ เราสามารถวนซ้ำผ่านชิ้นส่วนข้อความที่รวบรวมไว้ เพื่อค้นหาว่าชิ้นส่วนใดมองเห็นได้และชิ้นส่วนใดซ่อนอยู่
foreach (TextFragment fragment in absorber.TextFragments)
{
Console.WriteLine("Text '{0}' on pos {1} invisibility: {2}",
fragment.Text, fragment.Position.ToString(), fragment.TextState.Invisible);
}
ลูปนี้จะตรวจสอบแต่ละส่วนของข้อความและพิมพ์เนื้อหาพร้อมกับตำแหน่งและสถานะการมองเห็น หากfragment.TextState.Invisible
ถูกตั้งค่าเป็น true หมายความว่าข้อความถูกซ่อน!
ขั้นตอนที่ 4: กำจัดเอกสาร
สุดท้ายอย่าลืมกำจัดเอกสารอีกครั้งเมื่อใช้งานเสร็จแล้ว
doc.Dispose();
บทสรุป
ในบทช่วยสอนนี้ เราแนะนำขั้นตอนที่น่าตื่นเต้นในการเพิ่มและค้นหาข้อความที่ซ่อนอยู่ในไฟล์ PDF โดยใช้ Aspose.PDF สำหรับ .NET เราได้เรียนรู้วิธีการสร้างเอกสาร PDF ที่มีทั้งข้อความที่มองเห็นได้และซ่อนอยู่ รวมถึงวิธีการค้นหาข้อความที่ซ่อนอยู่นั้นด้วยโปรแกรม ความสามารถนี้มีประโยชน์อย่างยิ่งในแอปพลิเคชันต่างๆ ไม่ว่าคุณจะต้องจัดเก็บข้อมูลที่เป็นความลับหรือมอบประสบการณ์ผู้ใช้ที่ไม่ซ้ำใครภายในเอกสารของคุณ
เมื่อคุณคุ้นเคยกับ ASPose.PDF มากขึ้น ความเป็นไปได้ก็จะไม่มีที่สิ้นสุด ทดลองและขยายขอบเขตของสิ่งที่คุณสามารถทำได้กับเอกสาร PDF ของคุณต่อไป!
คำถามที่พบบ่อย
Aspose.PDF จัดการไฟล์ PDF ที่เข้ารหัสได้หรือไม่
ใช่ Aspose.PDF รองรับการเข้ารหัสและถอดรหัสเอกสาร PDF คุณสามารถรักษาความปลอดภัยไฟล์ PDF ของคุณได้อย่างง่ายดายด้วยรหัสผ่าน
มีเวอร์ชันทดลองใช้สำหรับ Aspose.PDF หรือไม่
แน่นอน! คุณสามารถดาวน์โหลดรุ่นทดลองใช้งานฟรีได้จากที่นี่.
Aspose.PDF รองรับภาษาโปรแกรมอะไรบ้าง?
Aspose.PDF รองรับหลายภาษา รวมถึง C#, Java และ Python
ฉันสามารถค้นหาเอกสารสำหรับ Aspose.PDF ได้ที่ไหน
คุณสามารถเข้าถึงเอกสารได้ที่นี่.
ฉันจะได้รับการสนับสนุนได้อย่างไรหากประสบปัญหา?
หากต้องการความช่วยเหลือ คุณสามารถเยี่ยมชมฟอรัม Asposeที่นี่.