Načítání textových souborů pomocí Aspose.Words pro Java
Úvod do načítání textových souborů pomocí Aspose.Words pro Javu
V této příručce prozkoumáme, jak načíst textové soubory pomocí Aspose.Words for Java a jak s nimi pracovat jako s dokumenty aplikace Word. Pokryjeme různé aspekty, jako je zjišťování seznamů, manipulace s mezerami a ovládání směru textu.
Krok 1: Detekce seznamů
Chcete-li načíst textový dokument a zjistit seznamy, postupujte takto:
// Vytvořte dokument ve formátu prostého textu ve formě řetězce s částmi, které lze interpretovat jako seznamy.
// Při načítání budou Aspose.Words vždy detekovány první tři seznamy,
// Po načtení se pro ně vytvoří objekty seznamu.
final String TEXT_DOC = "Full stop delimiters:\n" +
"1. First list item 1\n" +
"2. First list item 2\n" +
"3. First list item 3\n\n" +
"Right bracket delimiters:\n" +
"1) Second list item 1\n" +
"2) Second list item 2\n" +
"3) Second list item 3\n\n" +
"Bullet delimiters:\n" +
"• Third list item 1\n" +
"• Third list item 2\n" +
"• Third list item 3\n\n" +
"Whitespace delimiters:\n" +
"1 Fourth list item 1\n" +
"2 Fourth list item 2\n" +
"3 Fourth list item 3";
// Čtvrtý seznam s mezerami mezi číslem seznamu a obsahem položky seznamu,
// bude detekováno jako seznam pouze v případě, že je "DetectNumberingWithWhitespaces" v objektu LoadOptions nastaveno na hodnotu true,
// abyste předešli tomu, že odstavce začínající čísly nebudou mylně rozpoznány jako seznamy.
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDetectNumberingWithWhitespaces(true);
}
// Načtěte dokument při použití LoadOptions jako parametru a ověřte výsledek.
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");
Tento kód ukazuje, jak načíst textový dokument s různými formáty seznamů a použítDetectNumberingWithWhitespaces
možnost správně detekovat seznamy.
Krok 2: Práce s možnostmi Spaces
Chcete-li ovládat úvodní a koncové mezery při načítání textového dokumentu, můžete použít následující kód:
@Test
public void handleSpacesOptions() throws Exception {
final String TEXT_DOC = " Line 1 \n" +
" Line 2 \n" +
" Line 3 ";
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
}
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.HandleSpacesOptions.docx");
}
tomto příkladu načteme textový dokument a ořízneme úvodní a koncové mezery pomocíTxtLeadingSpacesOptions.TRIM
aTxtTrailingSpacesOptions.TRIM
.
Krok 3: Ovládání směru textu
Chcete-li určit směr textu při načítání textového dokumentu, můžete použít následující kód:
@Test
public void documentTextDirection() throws Exception {
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDocumentDirection(DocumentDirection.AUTO);
}
Document doc = new Document("Your Directory Path" + "Hebrew text.txt", loadOptions);
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
System.out.println(paragraph.getParagraphFormat().getBidi());
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DocumentTextDirection.docx");
}
Tento kód nastavuje směr dokumentu na automatickou detekci (DocumentDirection.AUTO
) a načte textový dokument s hebrejským textem. Směr dokumentu můžete upravit podle potřeby.
Kompletní zdrojový kód pro načítání textových souborů pomocí Aspose.Words pro Javu
public void detectNumberingWithWhitespaces() throws Exception {
// Vytvořte dokument ve formátu prostého textu ve formě řetězce s částmi, které lze interpretovat jako seznamy.
// Při načítání budou Aspose.Words vždy detekovány první tři seznamy,
// Po načtení se pro ně vytvoří objekty seznamu.
final String TEXT_DOC = "Full stop delimiters:\n" +
"1. First list item 1\n" +
"2. First list item 2\n" +
"3. First list item 3\n\n" +
"Right bracket delimiters:\n" +
"1) Second list item 1\n" +
"2) Second list item 2\n" +
"3) Second list item 3\n\n" +
"Bullet delimiters:\n" +
"• Third list item 1\n" +
"• Third list item 2\n" +
"• Third list item 3\n\n" +
"Whitespace delimiters:\n" +
"1 Fourth list item 1\n" +
"2 Fourth list item 2\n" +
"3 Fourth list item 3";
// Čtvrtý seznam s mezerami mezi číslem seznamu a obsahem položky seznamu,
// bude detekováno jako seznam pouze v případě, že je "DetectNumberingWithWhitespaces" v objektu LoadOptions nastaveno na hodnotu true,
// abyste předešli tomu, že odstavce začínající čísly nebudou mylně rozpoznány jako seznamy.
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDetectNumberingWithWhitespaces(true);
}
// Načtěte dokument při použití LoadOptions jako parametru a ověřte výsledek.
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");
}
@Test
public void handleSpacesOptions() throws Exception {
final String TEXT_DOC = " Line 1 \n" +
" Line 2 \n" +
" Line 3 ";
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
}
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.HandleSpacesOptions.docx");
}
@Test
public void documentTextDirection() throws Exception {
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDocumentDirection(DocumentDirection.AUTO);
}
Document doc = new Document("Your Directory Path" + "Hebrew text.txt", loadOptions);
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
System.out.println(paragraph.getParagraphFormat().getBidi());
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DocumentTextDirection.docx");
}
Závěr
V této příručce jsme prozkoumali, jak načíst textové soubory pomocí Aspose.Words pro Java, zjistit seznamy, zacházet s mezerami a ovládat směr textu. Tyto techniky vám umožňují efektivně manipulovat s textovými dokumenty ve vašich aplikacích Java.
FAQ
Co je Aspose.Words for Java?
Aspose.Words for Java je výkonná knihovna pro zpracování dokumentů, která umožňuje vývojářům vytvářet, manipulovat a převádět dokumenty Word programově v aplikacích Java. Poskytuje širokou škálu funkcí pro práci s textem, tabulkami, obrázky a dalšími prvky dokumentu.
Jak mohu začít s Aspose.Words pro Java?
Chcete-li začít s Aspose.Words pro Java, postupujte takto:
- Stáhněte a nainstalujte knihovnu Aspose.Words for Java.
- Podívejte se na dokumentaci naAspose.Words for Java API Reference pro podrobné informace a příklady.
- Prozkoumejte ukázkový kód a výukové programy, abyste se naučili, jak knihovnu efektivně používat.
Jak načtu textový dokument pomocí Aspose.Words for Java?
Chcete-li načíst textový dokument pomocí Aspose.Words for Java, můžete použítTxtLoadOptions
třída aDocument
třída. Ujistěte se, že jste podle potřeby zadali vhodné volby pro manipulaci s mezerami a směr textu. Podrobný příklad naleznete v podrobném průvodci v tomto článku.
Mohu převést načtený textový dokument do jiných formátů?
Ano, Aspose.Words for Java umožňuje převést načtený textový dokument do různých formátů, včetně DOCX, PDF a dalších. Můžete použítDocument
třídy provádět konverze. Konkrétní příklady převodu naleznete v dokumentaci.
Jak zacházím s mezerami v načtených textových dokumentech?
Pomocí můžete ovládat, jak se zachází s úvodními a koncovými mezerami v načtených textových dokumentechTxtLoadOptions
. Možnosti jakoTxtLeadingSpacesOptions
aTxtTrailingSpacesOptions
umožňují oříznout nebo zachovat místa podle potřeby. Příklad naleznete v části „Možnosti manipulace s prostory“ v této příručce.
Jaký je význam směrování textu v Aspose.Words pro Javu?
Směr textu je nezbytný pro dokumenty obsahující smíšená písma nebo jazyky, jako je hebrejština nebo arabština. Aspose.Words for Java poskytuje možnosti pro určení směru textu a zajišťuje správné vykreslování a formátování textu v těchto jazycích. Část “Ovládání směru textu” v této příručce ukazuje, jak nastavit směr textu.
Kde najdu další zdroje a podporu pro Aspose.Words for Java?
Další zdroje, dokumentaci a podporu naleznete na adreseAspose.Words pro dokumentaci Java. Můžete se také zúčastnit komunitních fór Aspose.Words nebo kontaktovat podporu Aspose pro pomoc s konkrétními problémy nebo dotazy.
Je Aspose.Words for Java vhodný pro komerční projekty?
Ano, Aspose.Words for Java je vhodný pro osobní i komerční projekty. Nabízí možnosti licencování pro různé scénáře použití. Nezapomeňte si přečíst licenční podmínky a ceny na webu Aspose, abyste vybrali vhodnou licenci pro svůj projekt.