刪除單字

介紹

您是否曾經發現自己需要透過刪除來強調 PDF 中的特定文字?無論您是在審閱文件、標記文本,還是只是需要突出顯示某些部分,刪除單字都是一個有價值的工具。在本教學中,我們將探索如何使用 Aspose.PDF for .NET 來實現這一點。這個綜合指南將引導您完成每個步驟,確保您擁有在 .NET 應用程式中有效實現此功能所需的所有資訊。

先決條件

在我們開始編寫程式碼之前,您需要滿足一些先決條件才能遵循本教學:

  1. Aspose.PDF for .NET 程式庫:請確定您已安裝 Aspose.PDF for .NET 程式庫。你可以在這裡下載.

  2. .NET Framework:請確定您的電腦上安裝了 .NET Framework。本教程專為 .NET 應用程式而設計。

  3. 開發環境:您需要一個像 Visual Studio 這樣的 IDE 來編寫和執行程式碼。

  4. PDF 文件:準備好您想要使用的範例 PDF 文件。我們將在該文件中刪除文字。

  5. 基本 C# 知識:要理解並實作本教學中的步驟,需要熟悉 C# 程式設計。

導入包

在開始編碼之前,我們需要在 .NET 專案中匯入必要的命名空間。這將使我們能夠存取使用 Aspose.PDF 操作 PDF 文件所需的類別和方法。

using System;
using System.IO;
using Aspose.Pdf.Annotations;
using Aspose.Pdf;

這些命名空間對於處理 PDF 文件、處理文字和添加刪除線等註釋至關重要。

在本節中,我們將刪除 PDF 文件中的單字的過程分解為簡單、易於管理的步驟。每個步驟都將附有詳細的說明,以確保您了解一切是如何運作的。

第 1 步:載入 PDF 文檔

第一步是載入您要編輯的 PDF 文件。您將在這份文件中刪除特定單字或片語。

//文檔目錄的路徑。
string dataDir = "YOUR DOCUMENT DIRECTORY";

//開啟 PDF 文檔
Document document = new Document(dataDir + "input.pdf");
  • dataDir:此變數保存文檔目錄的路徑。代替"YOUR DOCUMENT DIRECTORY"與您的 PDF 檔案所在的實際路徑。
  • Document : 這Document類別代表一個 PDF 文件。透過將文件路徑傳遞給其建構函數,我們打開 PDF 文件進行處理。

步驟 2:建立一個 TextFragment 吸收器來尋找特定文本

接下來,我們將建立一個實例TextFragmentAbsorber在 PDF 文件中搜尋特定文字片段。這使我們能夠找到要刪除的文字。

//建立 TextFragment Absorber 實例來搜尋特定的文字片段
Aspose.Pdf.Text.TextFragmentAbsorber textFragmentAbsorber = new Aspose.Pdf.Text.TextFragmentAbsorber("Estoque");
  • TextFragmentAbsorber:此類用於尋找和處理 PDF 文件中的特定文字片段。在此範例中,我們正在搜尋單字“Estoque”。將“Estoque”替換為您要在文件中尋找的單字或短語。

步驟 3:遍歷 PDF 文件的頁面

現在我們有了我們的TextFragmentAbsorber,我們需要遍歷 PDF 文件的每一頁來尋找指定的文字。

//遍歷 PDF 文件的頁面
for (int i = 1; i <= document.Pages.Count; i++)
{
    //取得PDF文件的目前頁
    Page page = document.Pages[i];
    page.Accept(textFragmentAbsorber);
}
  • for (int i = 1; i <= document.Pages.Count; i++):此循環遍歷 PDF 文件的每一頁。
  • document.Pages[i]:檢索目前正在處理的頁面。
  • page.Accept(textFragmentAbsorber) :該方法適用於TextFragmentAbsorber到目前頁面,搜尋指定文字。

第四步:收集並處理文字片段

遍歷頁面後,我們將收集找到的文字片段並為進一步處理做好準備。

//建立吸收文字片段的集合
Aspose.Pdf.Text.TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;
  • TextFragmentCollection:此集合儲存在文件中找到的所有文字片段。我們將在下一步中使用這個集合來刪除文字。

第 5 步:遍歷文字片段並將其刪除

在此步驟中,我們將循環遍歷集合中的每個文字片段並對其應用刪除線註釋。

//迭代文字片段的集合
for (int j = 1; j <= textFragmentCollection.Count; j++)
{
	Aspose.Pdf.Text.TextFragment textFragment = textFragmentCollection[j];

    //取得 TextFragment 物件的矩形尺寸
    Aspose.Pdf.Rectangle rect = new Aspose.Pdf.Rectangle(
        (float)textFragment.Position.XIndent,
        (float)textFragment.Position.YIndent,
        (float)textFragment.Position.XIndent + (float)textFragment.Rectangle.Width,
        (float)textFragment.Position.YIndent + (float)textFragment.Rectangle.Height);

    //實例化刪除線註解實例
    StrikeOutAnnotation strikeOut = new StrikeOutAnnotation(textFragment.Page, rect);

    //設定刪除線註釋的屬性
    strikeOut.Opacity = .80f;
    strikeOut.Border = new Border(strikeOut);
    strikeOut.Color = Aspose.Pdf.Color.Red;

    //將註釋加入到文字片段頁面的註釋集合中
    textFragment.Page.Annotations.Add(strikeOut);
}
  • TextFragment textFragment = textFragmentCollection[j]:此行檢索目前文字片段。
  • Aspose.Pdf.Rectangle:我們計算文字片段的矩形尺寸以確定在何處套用刪除線。
  • StrikeOutAnnotation:該類別代表刪除線註解。我們用計算出的矩形和目前頁面來實例化它。
  • strikeOut.Opacity:此屬性設定刪除線的不透明度,使其可見 80%。
  • strikeOut.Color:我們將三振的顏色設定為紅色。您可以將其變更為您喜歡的任何顏色。
  • textFragment.Page.Annotations.Add(strikeOut):這會在頁面上新增刪除線註解。

步驟6:儲存修改後的PDF文檔

最後一步是儲存修改後的 PDF 文件並套用刪除線。

//儲存更新的 PDF 文檔
dataDir = dataDir + "StrikeOutWords_out.pdf";
document.Save(dataDir);
  • dataDir + "StrikeOutWords_out.pdf":這將為修改後的文件建立一個新文件名。原始文件保持不變。
  • document.Save(dataDir):將帶有刪除線的 PDF 文件儲存到指定位置。

結論

恭喜!您已使用 Aspose.PDF for .NET 成功刪除了 PDF 文件中的特定單字。透過遵循此逐步指南,您現在可以透過突出顯示或刪除文字來自訂 PDF 文檔,使它們更加動態並根據您的需求進行自訂。無論您是在註釋法律文件、準備報告,還是只是標記文字以供審閱,本教學都為您提供了高效完成這些工作的技能。

常見問題解答

我可以更改三振線的顏色嗎?

是的,您可以透過修改strikeOut.Color財產。例如,您可以將其設定為Aspose.Pdf.Color.Blue藍色三振。

可以一次刪除多個單字嗎?

絕對地!這TextFragmentAbsorber可用於搜尋文件中的任何單字或短語。您可以透過迭代將刪除線套用至多個實例TextFragmentCollection.

如果我只想刪除特定頁面上的文字怎麼辦?

您可以修改循環存取頁面以僅包含您要修改的頁面。例如,for (int i = 1; i <= 3; i++)將僅對前三頁套用刪除線。

如何調整刪除線的粗細?

您可以透過修改刪除線的粗細來調整Border的財產StrikeOutAnnotation。這允許定制三振外觀。

有沒有辦法在儲存文件後撤銷刪除線?

儲存文件後,刪除線將永久存在。如果您需要保留原始文字而不刪除刪除線,請考慮在套用任何修改之前儲存原始文件的備份。