รับแบบอักษรทั้งหมดในไฟล์ PDF

การแนะนำ

คุณเคยสงสัยไหมว่าจะดึงแบบอักษรทั้งหมดที่ใช้ในไฟล์ PDF ได้อย่างไร ไม่ว่าคุณจะเป็นนักพัฒนาที่ต้องการวิเคราะห์เอกสาร PDF หรือเพียงแค่สงสัยเกี่ยวกับแบบอักษรใน eBook ที่คุณชื่นชอบ การทำความเข้าใจวิธีการดึงข้อมูลแบบอักษรอาจเป็นประโยชน์อย่างยิ่ง ในบทช่วยสอนนี้ เราจะเจาะลึกเข้าไปในโลกของ Aspose.PDF สำหรับ .NET ซึ่งเป็นไลบรารีที่มีประสิทธิภาพที่ช่วยให้คุณจัดการไฟล์ PDF ได้อย่างง่ายดาย เมื่ออ่านคู่มือนี้จบ คุณจะสามารถดึงและแสดงรายการแบบอักษรทั้งหมดที่ใช้ในเอกสาร PDF ได้ ดังนั้น มาเริ่มกันเลย!

ข้อกำหนดเบื้องต้น

ก่อนที่เราจะเริ่มต้นเขียนโค้ด มีบางสิ่งที่คุณต้องมี:

  1. Visual Studio: ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Visual Studio ไว้ในเครื่องของคุณแล้ว นี่คือ IDE ที่เราจะใช้ในบทช่วยสอนนี้
  2. Aspose.PDF สำหรับ .NET: คุณต้องมีไลบรารี Aspose.PDF คุณสามารถดาวน์โหลดได้จากเว็บไซต์.
  3. ความรู้พื้นฐานเกี่ยวกับ C#: ความคุ้นเคยกับการเขียนโปรแกรม C# จะช่วยให้คุณเข้าใจชิ้นส่วนโค้ดได้ดีขึ้น

แพ็คเกจนำเข้า

ในการเริ่มต้น คุณต้องนำเข้าแพ็คเกจที่จำเป็นลงในโปรเจ็กต์ C# ของคุณ โดยคุณสามารถทำได้ดังนี้:

สร้างโครงการใหม่

เปิด Visual Studio และสร้างโปรเจ็กต์ C# Console Application ใหม่ ซึ่งจะเป็นสภาพแวดล้อมที่เราจะเขียนโค้ด

เพิ่มการอ้างอิง Aspose.PDF

  1. คลิกขวาที่โครงการของคุณใน Solution Explorer
  2. เลือก “จัดการแพ็คเกจ NuGet”
  3. ค้นหา “Aspose.PDF” และติดตั้งเวอร์ชันล่าสุด

นำเข้าเนมสเปซที่จำเป็น

ที่ด้านบนของไฟล์ C# ของคุณ นำเข้าเนมสเปซที่จำเป็นโดยรวมบรรทัดต่อไปนี้:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

ตอนนี้เราได้ตั้งค่าทุกอย่างเรียบร้อยแล้ว มาดูโค้ดกันเลย!

ขั้นตอนที่ 1: ตั้งค่าไดเรกทอรีเอกสารของคุณ

ขั้นแรก คุณต้องระบุเส้นทางไปยังเอกสาร PDF ของคุณ นี่คือจุดที่ Aspose.PDF จะค้นหาไฟล์ที่คุณต้องการวิเคราะห์

// เส้นทางไปยังไดเร็กทอรีเอกสาร
string dataDir = "YOUR DOCUMENT DIRECTORY";

แทนที่"YOUR DOCUMENT DIRECTORY" ด้วยเส้นทางจริงที่ไฟล์ PDF ของคุณตั้งอยู่ อาจเป็นเช่นนี้@"C:\Documents\".

ขั้นตอนที่ 2: โหลดเอกสาร PDF

ขั้นต่อไป คุณจะต้องโหลดเอกสาร PDF ลงในแอปพลิเคชันของคุณ ซึ่งทำได้โดยใช้Document คลาสที่จัดทำโดย Aspose.PDF

Document doc = new Document(dataDir + "input.pdf");

ที่นี่แทนที่"input.pdf" ด้วยชื่อไฟล์ PDF ของคุณ บรรทัดโค้ดนี้จะเริ่มต้นไฟล์ใหม่Document วัตถุที่แสดงถึง PDF ของคุณ

ขั้นตอนที่ 3: ดึงแบบอักษรทั้งหมด

ตอนนี้มาถึงส่วนที่น่าตื่นเต้นแล้ว! คุณจะใช้FontUtilities คลาสเพื่อรับแบบอักษรทั้งหมดที่ใช้ในเอกสาร

Aspose.Pdf.Text.Font[] fonts = doc.FontUtilities.GetAllFonts();

บรรทัดนี้จะดึงอาร์เรย์ของFont วัตถุ โดยแต่ละอันแสดงถึงแบบอักษรที่ใช้ใน PDF

ขั้นตอนที่ 4: วนซ้ำผ่านแบบอักษร

สุดท้ายคุณจะต้องการแสดงชื่อของแบบอักษร ซึ่งทำได้โดยใช้ลูปธรรมดา

foreach (Aspose.Pdf.Text.Font font in fonts)
{
    Console.WriteLine(font.FontName);
}

ลูปนี้จะวนซ้ำผ่านแบบอักษรแต่ละตัวในอาร์เรย์และพิมพ์ชื่อแบบอักษรนั้นไปยังคอนโซล เป็นวิธีง่ายๆ ที่จะดูว่ามีแบบอักษรใดบ้างที่พร้อมใช้งานใน PDF ของคุณ

บทสรุป

และแล้วคุณก็จะได้มันมา! คุณได้แยกแบบอักษรทั้งหมดจากไฟล์ PDF สำเร็จแล้วโดยใช้ Aspose.PDF สำหรับ .NET ไลบรารีอันทรงพลังนี้ทำให้การจัดการเอกสาร PDF เป็นเรื่องง่าย และด้วยโค้ดเพียงไม่กี่บรรทัด คุณสามารถเข้าถึงข้อมูลที่มีค่า เช่น ชื่อแบบอักษรได้ ไม่ว่าคุณจะกำลังพัฒนาโปรแกรมดู PDF วิเคราะห์เอกสาร หรือเพียงแค่สงสัย ความรู้เหล่านี้จะเป็นประโยชน์อย่างแน่นอน

คำถามที่พบบ่อย

Aspose.PDF สำหรับ .NET คืออะไร?

Aspose.PDF สำหรับ .NET เป็นไลบรารีที่ช่วยให้นักพัฒนาสามารถสร้าง จัดการ และแปลงเอกสาร PDF ได้ด้วยโปรแกรม

ฉันสามารถใช้ Aspose.PDF ได้ฟรีหรือไม่?

ใช่ Aspose นำเสนอเวอร์ชันทดลองใช้งานฟรีที่คุณสามารถใช้ประเมินไลบรารีได้ คุณสามารถดาวน์โหลดได้ที่นี่.

ฉันสามารถหาเอกสารเพิ่มเติมได้ที่ไหน

คุณสามารถค้นหาเอกสารประกอบที่ครอบคลุมได้ที่เว็บไซต์อาโพส.

สามารถดึงข้อมูลอื่น ๆ จาก PDF ได้หรือไม่?

แน่นอน! Aspose.PDF ช่วยให้คุณแยกข้อความ รูปภาพ และข้อมูลเมตา รวมถึงสิ่งอื่นๆ ได้

ฉันจะได้รับการสนับสนุนสำหรับ Aspose.PDF ได้อย่างไร

คุณสามารถรับการสนับสนุนได้โดยการเยี่ยมชมฟอรั่ม Aspose.