Aspose.Words for Java에서 문서를 HTML 페이지로 분할하기

Aspose.Words for Java에서 문서를 HTML 페이지로 분할하는 방법 소개

이 단계별 가이드에서는 Aspose.Words for Java를 사용하여 문서를 HTML 페이지로 분할하는 방법을 살펴보겠습니다. Aspose.Words는 Microsoft Word 문서 작업을 위한 강력한 Java API이며 문서를 HTML을 포함한 다양한 형식으로 변환하는 기능을 포함하여 문서 조작을 위한 광범위한 기능을 제공합니다.

전제 조건

시작하기 전에 다음 전제 조건이 충족되었는지 확인하세요.

  • 시스템에 JDK(Java Development Kit)가 설치되어 있습니다.
  • Aspose.Words for Java 라이브러리. 다음에서 다운로드할 수 있습니다.여기.

1단계: 필요한 패키지 가져오기

import com.aspose.words.*;
import java.io.*;
import java.util.ArrayList;

2단계: Word를 HTML로 변환하는 방법 만들기

class WordToHtmlConverter
{
    // Word에서 HTML로의 변환에 대한 구현 세부정보입니다.
    // ...
}

3단계: 주제 시작으로 제목 단락 선택

private ArrayList<Paragraph> selectTopicStarts()
{
    NodeCollection paras = mDoc.getChildNodes(NodeType.PARAGRAPH, true);
    ArrayList<Paragraph> topicStartParas = new ArrayList<Paragraph>();
    for (Paragraph para : (Iterable<Paragraph>) paras)
    {
        int style = para.getParagraphFormat().getStyleIdentifier();
        if (style == StyleIdentifier.HEADING_1)
            topicStartParas.add(para);
    }
    return topicStartParas;
}

4단계: 단락 제목 앞에 구역 나누기 삽입

private void insertSectionBreaks(ArrayList<Paragraph> topicStartParas)
{
    DocumentBuilder builder = new DocumentBuilder(mDoc);
    for (Paragraph para : topicStartParas)
    {
        Section section = para.getParentSection();
        if (para != section.getBody().getFirstParagraph())
        {
            builder.moveTo(para.getFirstChild());
            builder.insertBreak(BreakType.SECTION_BREAK_NEW_PAGE);
            section.getBody().getLastParagraph().remove();
        }
    }
}

5단계: 문서를 주제별로 나누기

private ArrayList<Topic> saveHtmlTopics() throws Exception
{
    ArrayList<Topic> topics = new ArrayList<Topic>();
    for (int sectionIdx = 0; sectionIdx < mDoc.getSections().getCount(); sectionIdx++)
    {
        Section section = mDoc.getSections().get(sectionIdx);
        String paraText = section.getBody().getFirstParagraph().getText();
        String fileName = makeTopicFileName(paraText);
        if ("".equals(fileName))
            fileName = "UNTITLED SECTION " + sectionIdx;
        fileName = mDstDir + fileName + ".html";
        String title = makeTopicTitle(paraText);
        if ("".equals(title))
            title = "UNTITLED SECTION " + sectionIdx;
        Topic topic = new Topic(title, fileName);
        topics.add(topic);
        saveHtmlTopic(section, topic);
    }
    return topics;
}

6단계: 각 주제를 HTML 파일로 저장

private void saveHtmlTopic(Section section, Topic topic) throws Exception
{
    Document dummyDoc = new Document();
    dummyDoc.removeAllChildren();
    dummyDoc.appendChild(dummyDoc.importNode(section, true, ImportFormatMode.KEEP_SOURCE_FORMATTING));
    dummyDoc.getBuiltInDocumentProperties().setTitle(topic.getTitle());
    HtmlSaveOptions saveOptions = new HtmlSaveOptions();
    {
        saveOptions.setPrettyFormat(true);
        saveOptions.setAllowNegativeIndent(true);
        saveOptions.setExportHeadersFootersMode(ExportHeadersFootersMode.NONE);
    }
    dummyDoc.save(topic.getFileName(), saveOptions);
}

7단계: 주제에 대한 목차 생성

private void saveTableOfContents(ArrayList<Topic> topics) throws Exception
{
    Document tocDoc = new Document(mTocTemplate);
    tocDoc.getMailMerge().setFieldMergingCallback(new HandleTocMergeField());
    tocDoc.getMailMerge().executeWithRegions(new TocMailMergeDataSource(topics));
    tocDoc.save(mDstDir + "contents.html");
}

이제 단계의 개요를 설명했으므로 Java 프로젝트의 각 단계를 구현하여 Aspose.Words for Java를 사용하여 문서를 HTML 페이지로 분할할 수 있습니다. 이 프로세스를 통해 문서의 구조화된 HTML 표현을 생성하여 문서에 더 쉽게 접근하고 사용자 친화적으로 만들 수 있습니다.

결론

이 종합 가이드에서는 Aspose.Words for Java를 사용하여 문서를 HTML 페이지로 분할하는 프로세스를 다루었습니다. 설명된 단계를 따르면 Word 문서를 HTML 형식으로 효율적으로 변환하여 웹에서 콘텐츠에 더 쉽게 액세스할 수 있습니다.

FAQ

Java용 Aspose.Words를 어떻게 설치하나요?

Java용 Aspose.Words를 설치하려면 다음에서 라이브러리를 다운로드할 수 있습니다.여기 설명서에 제공된 설치 지침을 따르세요.

HTML 출력을 사용자 정의할 수 있나요?

예, 다음에서 저장 옵션을 조정하여 HTML 출력을 사용자 정의할 수 있습니다.HtmlSaveOptions 수업. 이를 통해 생성된 HTML 파일의 형식과 모양을 제어할 수 있습니다.

Aspose.Words for Java는 어떤 버전의 Microsoft Word를 지원합니까?

Aspose.Words for Java는 DOC, DOCX, RTF 등을 포함한 광범위한 Microsoft Word 문서 형식을 지원합니다. 다양한 버전의 Microsoft Word와 호환됩니다.

변환된 HTML의 이미지를 어떻게 처리할 수 있나요?

Aspose.Words for Java는 변환된 HTML의 이미지를 HTML 파일과 동일한 폴더에 별도의 파일로 저장하여 처리할 수 있습니다. 이렇게 하면 이미지가 HTML 출력에 올바르게 표시됩니다.

Aspose.Words for Java 평가판이 있습니까?

예, Aspose 웹사이트에서 Aspose.Words for Java의 무료 평가판을 요청하여 라이선스를 구매하기 전에 기능을 평가할 수 있습니다.