Загрузка текстовых файлов с помощью Aspose.Words для Java

Введение в загрузку текстовых файлов с помощью Aspose.Words для Java

В этом руководстве мы рассмотрим, как загружать текстовые файлы с помощью Aspose.Words для Java и манипулировать ими как документами Word. Мы рассмотрим различные аспекты, такие как обнаружение списков, обработка пробелов и управление направлением текста.

Шаг 1. Поиск списков

Чтобы загрузить текстовый документ и обнаружить списки, вы можете выполнить следующие действия:

// Создайте текстовый документ в виде строки с частями, которые можно интерпретировать как списки.
// При загрузке первые три списка всегда будут обнаруживаться Aspose.Words,
// и объекты List будут созданы для них после загрузки.
final String TEXT_DOC = "Full stop delimiters:\n" +
        "1. First list item 1\n" +
        "2. First list item 2\n" +
        "3. First list item 3\n\n" +
        "Right bracket delimiters:\n" +
        "1) Second list item 1\n" +
        "2) Second list item 2\n" +
        "3) Second list item 3\n\n" +
        "Bullet delimiters:\n" +
        "• Third list item 1\n" +
        "• Third list item 2\n" +
        "• Third list item 3\n\n" +
        "Whitespace delimiters:\n" +
        "1 Fourth list item 1\n" +
        "2 Fourth list item 2\n" +
        "3 Fourth list item 3";
//Четвертый список с пробелами между номером списка и содержимым элемента списка.
// будет обнаружен в виде списка только в том случае, если для параметра DetectNumberingWithWhitespaces в объекте LoadOptions установлено значение true,
// чтобы абзацы, начинающиеся с цифр, не были ошибочно определены как списки.
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
    loadOptions.setDetectNumberingWithWhitespaces(true);
}
// Загрузите документ, применив LoadOptions в качестве параметра, и проверьте результат.
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");

Этот код демонстрирует, как загрузить текстовый документ с различными форматами списков и использоватьDetectNumberingWithWhitespaces опция для правильного обнаружения списков.

Шаг 2. Обработка параметров пробелов

Чтобы контролировать начальные и конечные пробелы при загрузке текстового документа, вы можете использовать следующий код:

@Test
public void handleSpacesOptions() throws Exception {
    final String TEXT_DOC = "      Line 1 \n" +
            "    Line 2   \n" +
            " Line 3       ";
    TxtLoadOptions loadOptions = new TxtLoadOptions();
    {
        loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
        loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
    }
    Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
    doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.HandleSpacesOptions.docx");
}

В этом примере мы загружаем текстовый документ и обрезаем начальные и конечные пробелы, используяTxtLeadingSpacesOptions.TRIMиTxtTrailingSpacesOptions.TRIM.

Шаг 3. Управление направлением текста

Чтобы указать направление текста при загрузке текстового документа, вы можете использовать следующий код:

@Test
public void documentTextDirection() throws Exception {
    TxtLoadOptions loadOptions = new TxtLoadOptions();
    {
        loadOptions.setDocumentDirection(DocumentDirection.AUTO);
    }
    Document doc = new Document("Your Directory Path" + "Hebrew text.txt", loadOptions);
    Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
    System.out.println(paragraph.getParagraphFormat().getBidi());
    doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DocumentTextDirection.docx");
}

Этот код устанавливает автоматическое определение направления документа (DocumentDirection.AUTOи загружает текстовый документ с текстом на иврите. При необходимости вы можете отрегулировать направление документа.

Полный исходный код для загрузки текстовых файлов с помощью Aspose.Words для Java

public void detectNumberingWithWhitespaces() throws Exception {
	// Создайте текстовый документ в виде строки с частями, которые можно интерпретировать как списки.
	// При загрузке первые три списка всегда будут обнаруживаться Aspose.Words,
	// и объекты List будут созданы для них после загрузки.
	final String TEXT_DOC = "Full stop delimiters:\n" +
			"1. First list item 1\n" +
			"2. First list item 2\n" +
			"3. First list item 3\n\n" +
			"Right bracket delimiters:\n" +
			"1) Second list item 1\n" +
			"2) Second list item 2\n" +
			"3) Second list item 3\n\n" +
			"Bullet delimiters:\n" +
			"• Third list item 1\n" +
			"• Third list item 2\n" +
			"• Third list item 3\n\n" +
			"Whitespace delimiters:\n" +
			"1 Fourth list item 1\n" +
			"2 Fourth list item 2\n" +
			"3 Fourth list item 3";
	// Четвертый список с пробелами между номером списка и содержимым элемента списка.
	// будет обнаружен в виде списка только в том случае, если для параметра DetectNumberingWithWhitespaces в объекте LoadOptions установлено значение true,
	// чтобы абзацы, начинающиеся с цифр, не были ошибочно определены как списки.
	TxtLoadOptions loadOptions = new TxtLoadOptions();
	{
		loadOptions.setDetectNumberingWithWhitespaces(true);
	}
	// Загрузите документ, применив LoadOptions в качестве параметра, и проверьте результат.
	Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
	doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");
}
@Test
public void handleSpacesOptions() throws Exception {
	final String TEXT_DOC = "      Line 1 \n" +
			"    Line 2   \n" +
			" Line 3       ";
	TxtLoadOptions loadOptions = new TxtLoadOptions();
	{
		loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
		loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
	}
	Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
	doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.HandleSpacesOptions.docx");
}
@Test
public void documentTextDirection() throws Exception {
	TxtLoadOptions loadOptions = new TxtLoadOptions();
	{
		loadOptions.setDocumentDirection(DocumentDirection.AUTO);
	}
	Document doc = new Document("Your Directory Path" + "Hebrew text.txt", loadOptions);
	Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
	System.out.println(paragraph.getParagraphFormat().getBidi());
	doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DocumentTextDirection.docx");
	}

Заключение

В этом руководстве мы рассмотрели, как загружать текстовые файлы с помощью Aspose.Words для Java, обнаруживать списки, обрабатывать пробелы и управлять направлением текста. Эти методы позволяют эффективно манипулировать текстовыми документами в ваших Java-приложениях.

Часто задаваемые вопросы

Что такое Aspose.Words для Java?

Aspose.Words for Java — это мощная библиотека обработки документов, которая позволяет разработчикам создавать, манипулировать и преобразовывать документы Word программным способом в приложениях Java. Он предоставляет широкий спектр возможностей для работы с текстом, таблицами, изображениями и другими элементами документа.

Как мне начать работу с Aspose.Words для Java?

Чтобы начать работу с Aspose.Words для Java, выполните следующие действия:

  1. Загрузите и установите библиотеку Aspose.Words для Java.
  2. Обратитесь к документации по адресуСправочник по API Aspose.Words для Javaдля получения подробной информации и примеров.
  3. Изучите пример кода и руководства, чтобы научиться эффективно использовать библиотеку.

Как загрузить текстовый документ с помощью Aspose.Words для Java?

Чтобы загрузить текстовый документ с помощью Aspose.Words для Java, вы можете использовать командуTxtLoadOptions класс иDocument сорт. Убедитесь, что вы указали соответствующие параметры для обработки пробелов и направления текста по мере необходимости. Подробный пример можно найти в пошаговом руководстве в этой статье.

Могу ли я преобразовать загруженный текстовый документ в другие форматы?

Да, Aspose.Words for Java позволяет конвертировать загруженный текстовый документ в различные форматы, включая DOCX, PDF и другие. Вы можете использоватьDocument класс для выполнения преобразований. Проверьте документацию на предмет конкретных примеров преобразования.

Как обрабатывать пробелы в загруженных текстовых документах?

Вы можете контролировать, как обрабатываются начальные и конечные пробелы в загруженных текстовых документах, используяTxtLoadOptions . Такие варианты, какTxtLeadingSpacesOptionsиTxtTrailingSpacesOptionsпозволяют обрезать или сохранять пробелы по мере необходимости. Пример см. в разделе «Параметры обработки пробелов» данного руководства.

Каково значение направления текста в Aspose.Words для Java?

Направление текста важно для документов, содержащих смешанные алфавиты или языки, например иврит или арабский. Aspose.Words для Java предоставляет параметры для указания направления текста, обеспечивая правильное отображение и форматирование текста на этих языках. В разделе «Управление направлением текста» данного руководства показано, как установить направление текста.

Где я могу найти дополнительные ресурсы и поддержку Aspose.Words для Java?

Дополнительные ресурсы, документацию и поддержку можно найти на страницеДокументация Aspose.Words для Java. Вы также можете принять участие в форумах сообщества Aspose.Words или обратиться в службу поддержки Aspose за помощью по конкретным вопросам или вопросам.

Подходит ли Aspose.Words for Java для коммерческих проектов?

Да, Aspose.Words for Java подходит как для личных, так и для коммерческих проектов. Он предлагает варианты лицензирования для различных сценариев использования. Обязательно ознакомьтесь с условиями лицензирования и ценами на веб-сайте Aspose, чтобы выбрать подходящую лицензию для вашего проекта.