创建带有标记文本的 PDF

介绍

在当今的数字时代,PDF 文档已成为共享和显示内容的最流行格式之一。无论是商业报告、学术论文还是用户手册,PDF 无处不在!但是,好的 PDF 与优秀的 PDF 的区别在于可访问性和结构。没错!带标签的 PDF 使屏幕阅读器和辅助技术更容易理解和浏览内容。猜猜怎么着?在本教程中,我将逐步指导您使用 Aspose.PDF for .NET 创建带标签的 PDF!

所以,拿起您最喜欢的饮料,坐下来,让我们一起进入标记 PDF 的世界吧!

先决条件

在开始之前,您需要准备好以下几件事:

  1. Visual Studio - 确保您的计算机上安装了 Visual Studio。您可以使用任何支持 .NET 的版本。
  2. Aspose.PDF for .NET - 从以下网站下载最新版本的 Aspose.PDF for .NET网站。您还可以选择免费试用来探索其功能。
  3. .NET Framework - 这些示例将为 .NET 构建。确保您的计算机上安装了兼容的版本。
  4. C# 基础知识 - 熟悉 C# 编程将在我们编写一些代码时派上用场!

都搞定了吗?太棒了!让我们开始编码吧!

导入包

现在我们已经满足了先决条件,让我们进入最有趣的部分:导入必要的包。要使用 Aspose.PDF,您肯定需要将该库添加到您的项目中。

创建新项目

首先,启动 Visual Studio 并创建一个新的 C# 项目。

  1. 打开 Visual Studio。
  2. 点击“创建新项目”。
  3. 选择“控制台应用程序(.NET)”并单击“下一步”。
  4. 为您的项目命名(例如,TaggedPdfExample) 并设置其位置。
  5. 点击“创建”。

添加 Aspose.PDF 参考

现在,让我们添加 Aspose.PDF 库:

  1. 在解决方案资源管理器中右键单击您的项目。
  2. 选择“管理 NuGet 包”。
  3. 搜索“Aspose.PDF”并安装最新版本。

导入所需的命名空间

在主程序文件的顶部(例如Program.cs),导入以下命名空间:

using Aspose.Pdf.LogicalStructure;
using Aspose.Pdf.Tagged;
using Aspose.Pdf.Text;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

现在我们已经完成所有设置,让我们将代码分解为易于理解的部分,并逐步创建带标签的 PDF!

步骤 1:定义文档目录

在开始编码之前,让我们定义保存 PDF 文件的文档目录:

//文档目录的路径。
string dataDir = "YOUR DOCUMENT DIRECTORY"; //将其更新到您的路径

代替"YOUR DOCUMENT DIRECTORY"使用您想要保存 PDF 的实际路径。

第 2 步:创建 PDF 文档

让我们创建一个新的 PDF 文档实例。这就像画一个空白画布,我们将在其中添加内容。

//创建 PDF 文档
Document document = new Document();

步骤 3:获取文档的标记内容

接下来,我们需要获取文档的标记内容。将标记内容视为使其可访问的底层结构。操作方法如下:

//获取使用 TaggedPdf 工作的内容
ITaggedContent taggedContent = document.TaggedContent;

步骤 4:设置文档的标题和语言

现在,让我们设置文档的标题和语言。这对于可访问性来说非常重要!

//设置文档的标题和语言
taggedContent.SetTitle("Tagged Pdf Document");
taggedContent.SetLanguage("en-US");

步骤 5:创建文本块级结构元素

我们将在这里创建内容。我们将创建标题和段落,就像构建块一样!

步骤 5.1:创建标题元素

首先,让我们创建一个标题元素:

//创建文本块级结构元素
HeaderElement headerElement = taggedContent.CreateHeaderElement();
headerElement.ActualText = "Heading 1";

步骤 5.2:创建段落元素

接下来,让我们添加一些段落。我会为您添加几个,但您可以根据需要自定义!

ParagraphElement paragraphElement1 = taggedContent.CreateParagraphElement();
paragraphElement1.ActualText = "test1";

ParagraphElement paragraphElement2 = taggedContent.CreateParagraphElement();
paragraphElement2.ActualText = "test 2";

ParagraphElement paragraphElement3 = taggedContent.CreateParagraphElement();
paragraphElement3.ActualText = "test 3";

ParagraphElement paragraphElement4 = taggedContent.CreateParagraphElement();
paragraphElement4.ActualText = "test 4";

ParagraphElement paragraphElement5 = taggedContent.CreateParagraphElement();
paragraphElement5.ActualText = "test 5";

ParagraphElement paragraphElement6 = taggedContent.CreateParagraphElement();
paragraphElement6.ActualText = "test 6";

ParagraphElement paragraphElement7 = taggedContent.CreateParagraphElement();
paragraphElement7.ActualText = "test 7";

步骤 6:保存 PDF 文档

最后,让我们保存这个杰作!以下是保存标记 PDF 的方法:

//保存 PDF 文档
document.Save(dataDir + "PDFwithTaggedText.pdf");

您刚刚创建了一个带标签的 PDF!

结论

一旦掌握了窍门,使用 Aspose.PDF for .NET 创建带标签的 PDF 就变得轻而易举!它不仅使您的文档易于使用,而且可供更广泛的受众访问。强调语义结构肯定会带来回报,特别是如果您所在的行业内容可访问性至关重要。

常见问题解答

什么是带标签的 PDF?

带标签的 PDF 包含结构化数据,使得屏幕阅读器和辅助技术可以更轻松地有效浏览内容。

我需要购买 Aspose.PDF 才能使用它吗?

虽然您可以免费试用,但长期使用需要许可证。您可以了解更多信息这里.

我可以自定义 PDF 中的结构元素吗?

当然!您可以根据需要操纵各种元素并创建复杂的结构。

Aspose.PDF 是否与所有.NET 应用程序兼容?

是的,Aspose.PDF 设计用于各种 .NET 平台,包括 .NET Framework、.NET Core 等。

在哪里可以找到对 Aspose.PDF 的支持?

您可以访问Aspose 支持论坛对于您遇到的任何疑问或问题。