检测带有空格的编号

在本教程中,我们将探索为 Aspose.Words for .NET 的“检测空白编号”功能提供的 C# 源代码。此功能允许您从包含列表编号后跟空格的文本文档中检测和创建列表。

第一步:搭建环境

在开始之前,请确保您已使用 Aspose.Words for .NET 设置开发环境。确保您已添加必要的引用并导入适当的命名空间。

第 2 步:创建文本文档

//文档目录的路径
string dataDir = "YOUR DOCUMENTS DIRECTORY";

string textDoc = "Full stop delimiters:\n" +
                  "1. First list item 1\n" +
                  "2. First list item 2\n" +
                  "3. First list item 3\n\n" +
                  "Right bracket delimiters:\n" +
                  "1) Second list item 1\n" +
                  "2) Second list item 2\n" +
                  "3) Second list item 3\n\n" +
                  "Bullet delimiters:\n" +
                  "• Third list item 1\n" +
                  "• Third list item 2\n" +
                  "• Third list item 3\n\n" +
                  "Whitespace delimiters:\n" +
                  "1 Fourth list item 1\n" +
                  "2 Fourth list item 2\n" +
                  "3 Fourth list item 3";

在此步骤中,我们创建一个文本字符串来模拟包含列表数字后跟空格的文本文档。我们使用不同的列表分隔符,例如句点、右括号、项目符号和空格。

第 3 步:配置上传选项

TxtLoadOptions loadOptions = new TxtLoadOptions { DetectNumberingWithWhitespaces = true };

在此步骤中,我们配置文档加载选项。我们创建一个新的TxtLoadOptions对象并设置DetectNumberingWithWhitespaces财产给true。这将允许 Aspose.Words 检测列表编号,即使它们后面跟着空格。

第四步:加载文档并保存

Document doc = new Document(new MemoryStream(Encoding.UTF8.GetBytes(textDoc)), loadOptions);

doc.Save(dataDir + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");

在此步骤中,我们使用指定的文本字符串和加载选项加载文档。我们使用一个MemoryStream将文本字符串转换为内存流。然后我们将生成的文档保存为 .docx 格式。

Aspose.Words for .NET 的空白编号检测功能的示例源代码。


            
//文档目录的路径
string dataDir = "YOUR DOCUMENT DIRECTORY";
			
//创建一个字符串形式的纯文本文档,其中的部分可以解释为列表。
//加载后,前三个列表将始终被 Aspose.Words 检测到,
//加载后将为它们创建 List 对象。
const string textDoc = "Full stop delimiters:\n" +
					   "1. First list item 1\n" +
					   "2. First list item 2\n" +
					   "3. First list item 3\n\n" +
					   "Right bracket delimiters:\n" +
					   "1) Second list item 1\n" +
					   "2) Second list item 2\n" +
					   "3) Second list item 3\n\n" +
					   "Bullet delimiters:\n" +
					   "• Third list item 1\n" +
					   "• Third list item 2\n" +
					   "• Third list item 3\n\n" +
					   "Whitespace delimiters:\n" +
					   "1 Fourth list item 1\n" +
					   "2 Fourth list item 2\n" +
					   "3 Fourth list item 3";

//第四个列表,列表编号和列表项内容之间有空格,
//仅当 LoadOptions 对象中的“DetectNumberingWithWhitespaces”设置为 true 时,才会将其检测为列表,
//以避免以数字开头的段落被错误地检测为列表。
TxtLoadOptions loadOptions = new TxtLoadOptions { DetectNumberingWithWhitespaces = true };

//将 LoadOptions 作为参数应用时加载文档并验证结果。
Document doc = new Document(new MemoryStream(Encoding.UTF8.GetBytes(textDoc)), loadOptions);

doc.Save(dataDir + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");
            
        

现在,您可以运行源代码来加载包含带有空格的列表编号的文本文档,然后使用检测到的列表创建一个 .docx 文档。输出文件将保存在指定目录中,名称为“WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx”。

结论

在本教程中,我们探索了 Aspose.Words for .NET 中的空白编号检测功能。我们学习了如何从包含列表数字后跟空格的文本文档创建列表。

此功能对于处理包含以不同方式格式化的列表编号的文档非常有用。通过使用适当的加载选项,Aspose.Words 能够检测这些列表编号(即使它们后面跟着空格),并将它们转换为最终文档中的结构化列表。

使用此功能可以节省您的时间并提高工作流程效率。您可以轻松地从文本文档中提取信息,并将其转换为具有适当列表的结构良好的文档。

请记住考虑加载选项,例如配置空白拨号检测,以达到所需的结果。

Aspose.Words for .NET 提供了许多用于文档操作和生成的高级功能。通过进一步探索 Aspose.Words 提供的文档和示例,您将能够充分利用这个强大库的功能。

因此,请毫不犹豫地将空白编号检测集成到您的 Aspose.Words for .NET 项目中,并利用其优势来创建结构良好且可读的文档。