जावा के लिए Aspose.Words में दस्तावेज़ प्रारूप का निर्धारण

जावा के लिए Aspose.Words में दस्तावेज़ प्रारूप निर्धारित करने का परिचय

जावा में दस्तावेज़ प्रसंस्करण के साथ काम करते समय, जिन फ़ाइलों से आप निपट रहे हैं उनका प्रारूप निर्धारित करना महत्वपूर्ण है। जावा के लिए Aspose.Words दस्तावेज़ प्रारूपों की पहचान करने के लिए शक्तिशाली सुविधाएँ प्रदान करता है, और हम आपको इस प्रक्रिया के बारे में बताएंगे।

आवश्यक शर्तें

शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित आवश्यकताएँ हैं:

  • जावा के लिए Aspose.शब्द
  • आपके सिस्टम पर जावा डेवलपमेंट किट (जेडीके) स्थापित है
  • जावा प्रोग्रामिंग का बुनियादी ज्ञान

चरण 1: निर्देशिका सेटअप

सबसे पहले, हमें अपनी फ़ाइलों को प्रभावी ढंग से व्यवस्थित करने के लिए आवश्यक निर्देशिकाएँ स्थापित करने की आवश्यकता है। हम विभिन्न दस्तावेज़ प्रकारों के लिए निर्देशिकाएँ बनाएंगे।

File supportedDir = new File("Your Directory Path" + "Supported");
File unknownDir = new File("Your Directory Path" + "Unknown");
File encryptedDir = new File("Your Directory Path" + "Encrypted");
File pre97Dir = new File("Your Directory Path" + "Pre97");

// यदि निर्देशिकाएँ पहले से मौजूद नहीं हैं तो बनाएँ।
if (!supportedDir.exists())
    supportedDir.mkdir();
if (!unknownDir.exists())
    unknownDir.mkdir();
if (!encryptedDir.exists())
    encryptedDir.mkdir();
if (!pre97Dir.exists())
    pre97Dir.mkdir();

हमने समर्थित, अज्ञात, एन्क्रिप्टेड और प्री-97 दस्तावेज़ प्रकारों के लिए निर्देशिकाएँ बनाई हैं।

चरण 2: दस्तावेज़ प्रारूप का पता लगाना

अब, आइए हमारी निर्देशिकाओं में दस्तावेज़ों के प्रारूप का पता लगाएं। इसे प्राप्त करने के लिए हम जावा के लिए Aspose.Words का उपयोग करेंगे।

Set<String> listFiles = Stream.of(new File("Your Directory Path").listFiles())
    .filter(file -> !file.getName().endsWith("Corrupted document.docx") && !Files.isDirectory(file.toPath()))
    .map(File::getPath)
    .collect(Collectors.toSet());

for (String fileName : listFiles) {
    String nameOnly = Paths.get(fileName).getFileName().toString();
    System.out.println(nameOnly);
    FileFormatInfo info = FileFormatUtil.detectFileFormat(fileName);

    // दस्तावेज़ प्रकार प्रदर्शित करें
    switch (info.getLoadFormat()) {
        case LoadFormat.DOC:
            System.out.println("\tMicrosoft Word 97-2003 document.");
            break;
        // आवश्यकतानुसार अन्य दस्तावेज़ प्रारूपों के लिए केस जोड़ें
    }

    // एन्क्रिप्टेड दस्तावेज़ संभालें
    if (info.isEncrypted()) {
        System.out.println("\tAn encrypted document.");
        FileUtils.copyFile(new File(fileName), new File(encryptedDir, nameOnly));
    } else {
        // अन्य दस्तावेज़ प्रकार संभालें
        switch (info.getLoadFormat()) {
            case LoadFormat.DOC_PRE_WORD_60:
                FileUtils.copyFile(new File(fileName), new File(pre97Dir, nameOnly));
                break;
            case LoadFormat.UNKNOWN:
                FileUtils.copyFile(new File(fileName), new File(unknownDir, nameOnly));
                break;
            default:
                FileUtils.copyFile(new File(fileName), new File(supportedDir, nameOnly));
                break;
        }
    }
}

इस कोड स्निपेट में, हम फ़ाइलों के माध्यम से पुनरावृत्ति करते हैं, उनके प्रारूपों का पता लगाते हैं, और उन्हें संबंधित निर्देशिकाओं में व्यवस्थित करते हैं।

जावा के लिए Aspose.Words में दस्तावेज़ प्रारूप निर्धारित करने के लिए पूर्ण स्रोत कोड

        File supportedDir = new File("Your Directory Path" + "Supported");
        File unknownDir = new File("Your Directory Path" + "Unknown");
        File encryptedDir = new File("Your Directory Path" + "Encrypted");
        File pre97Dir = new File("Your Directory Path" + "Pre97");
        // यदि निर्देशिकाएँ पहले से मौजूद नहीं हैं तो बनाएँ।
        if (supportedDir.exists() == false)
            supportedDir.mkdir();
        if (unknownDir.exists() == false)
            unknownDir.mkdir();
        if (encryptedDir.exists() == false)
            encryptedDir.mkdir();
        if (pre97Dir.exists() == false)
            pre97Dir.mkdir();
        Set<String> listFiles = Stream.of(new File("Your Directory Path").listFiles())
                .filter(file -> !file.getName().endsWith("Corrupted document.docx") && !Files.isDirectory(file.toPath()))
                .map(File::getPath)
                .collect(Collectors.toSet());
        for (String fileName : listFiles) {
            String nameOnly = Paths.get(fileName).getFileName().toString();
            System.out.println(nameOnly);
            FileFormatInfo info = FileFormatUtil.detectFileFormat(fileName);
            // दस्तावेज़ प्रकार प्रदर्शित करें
            switch (info.getLoadFormat()) {
                case LoadFormat.DOC:
                    System.out.println("\tMicrosoft Word 97-2003 document.");
                    break;
                case LoadFormat.DOT:
                    System.out.println("\tMicrosoft Word 97-2003 template.");
                    break;
                case LoadFormat.DOCX:
                    System.out.println("\tOffice Open XML WordprocessingML Macro-Free Document.");
                    break;
                case LoadFormat.DOCM:
                    System.out.println("\tOffice Open XML WordprocessingML Macro-Enabled Document.");
                    break;
                case LoadFormat.DOTX:
                    System.out.println("\tOffice Open XML WordprocessingML Macro-Free Template.");
                    break;
                case LoadFormat.DOTM:
                    System.out.println("\tOffice Open XML WordprocessingML Macro-Enabled Template.");
                    break;
                case LoadFormat.FLAT_OPC:
                    System.out.println("\tFlat OPC document.");
                    break;
                case LoadFormat.RTF:
                    System.out.println("\tRTF format.");
                    break;
                case LoadFormat.WORD_ML:
                    System.out.println("\tMicrosoft Word 2003 WordprocessingML format.");
                    break;
                case LoadFormat.HTML:
                    System.out.println("\tHTML format.");
                    break;
                case LoadFormat.MHTML:
                    System.out.println("\tMHTML (Web archive) format.");
                    break;
                case LoadFormat.ODT:
                    System.out.println("\tOpenDocument Text.");
                    break;
                case LoadFormat.OTT:
                    System.out.println("\tOpenDocument Text Template.");
                    break;
                case LoadFormat.DOC_PRE_WORD_60:
                    System.out.println("\tMS Word 6 or Word 95 format.");
                    break;
                case LoadFormat.UNKNOWN:
                    System.out.println("\tUnknown format.");
                    break;
            }
            if (info.isEncrypted()) {
                System.out.println("\tAn encrypted document.");
                FileUtils.copyFile(new File(fileName), new File(encryptedDir, nameOnly));
            } else {
                switch (info.getLoadFormat()) {
                    case LoadFormat.DOC_PRE_WORD_60:
                        FileUtils.copyFile(new File(fileName), new File(pre97Dir, nameOnly));
                        break;
                    case LoadFormat.UNKNOWN:
                        FileUtils.copyFile(new File(fileName), new File(unknownDir, nameOnly));
                        break;
                    default:
                        FileUtils.copyFile(new File(fileName), new File(supportedDir, nameOnly));
                        break;
                }
            }
        }

निष्कर्ष

कुशल दस्तावेज़ प्रसंस्करण के लिए जावा के लिए Aspose.Words में दस्तावेज़ प्रारूप निर्धारित करना आवश्यक है। इस गाइड में उल्लिखित चरणों के साथ, आप दस्तावेज़ प्रकारों की पहचान कर सकते हैं और उन्हें अपने जावा अनुप्रयोगों में तदनुसार संभाल सकते हैं।

अक्सर पूछे जाने वाले प्रश्न

मैं जावा के लिए Aspose.Words कैसे स्थापित करूं?

आप जावा के लिए Aspose.Words डाउनलोड कर सकते हैंयहाँ और दिए गए इंस्टॉलेशन निर्देशों का पालन करें।

समर्थित दस्तावेज़ प्रारूप क्या हैं?

जावा के लिए Aspose.Words DOC, DOCX, RTF, HTML और अन्य सहित विभिन्न दस्तावेज़ प्रारूपों का समर्थन करता है। आप पूरी सूची के लिए दस्तावेज़ का संदर्भ ले सकते हैं।

मैं Java के लिए Aspose.Words का उपयोग करके एन्क्रिप्टेड दस्तावेज़ों का पता कैसे लगा सकता हूँ?

आप इसका उपयोग कर सकते हैंFileFormatUtil.detectFileFormat() एन्क्रिप्टेड दस्तावेज़ों का पता लगाने की विधि, जैसा कि इस गाइड में दिखाया गया है।

क्या पुराने दस्तावेज़ प्रारूपों के साथ काम करते समय कोई सीमाएँ हैं?

पुराने दस्तावेज़ प्रारूप, जैसे एमएस वर्ड 6 या वर्ड 95, में सुविधाओं और आधुनिक अनुप्रयोगों के साथ संगतता के संदर्भ में सीमाएं हो सकती हैं। आवश्यकता पड़ने पर इन दस्तावेज़ों को अपग्रेड करने या परिवर्तित करने पर विचार करें।

क्या मैं अपने जावा एप्लिकेशन में दस्तावेज़ प्रारूप पहचान को स्वचालित कर सकता हूँ?

हां, आप अपने जावा एप्लिकेशन में दिए गए कोड को एकीकृत करके दस्तावेज़ प्रारूप पहचान को स्वचालित कर सकते हैं। यह आपको दस्तावेज़ों को उनके ज्ञात प्रारूपों के आधार पर संसाधित करने की अनुमति देता है।