Laden von Textdateien mit Aspose.Words für Java
Einführung in das Laden von Textdateien mit Aspose.Words für Java
In dieser Anleitung erfahren Sie, wie Sie Textdateien mit Aspose.Words für Java laden und als Word-Dokumente bearbeiten. Wir behandeln verschiedene Aspekte wie das Erkennen von Listen, den Umgang mit Leerzeichen und die Steuerung der Textrichtung.
Schritt 1: Listen erkennen
Um ein Textdokument zu laden und Listen zu erkennen, können Sie die folgenden Schritte ausführen:
// Erstellen Sie ein Klartextdokument in Form einer Zeichenfolge mit Teilen, die als Listen interpretiert werden können.
// Beim Laden werden die ersten drei Listen immer von Aspose.Words erkannt,
// und nach dem Laden werden Listenobjekte für sie erstellt.
final String TEXT_DOC = "Full stop delimiters:\n" +
"1. First list item 1\n" +
"2. First list item 2\n" +
"3. First list item 3\n\n" +
"Right bracket delimiters:\n" +
"1) Second list item 1\n" +
"2) Second list item 2\n" +
"3) Second list item 3\n\n" +
"Bullet delimiters:\n" +
"• Third list item 1\n" +
"• Third list item 2\n" +
"• Third list item 3\n\n" +
"Whitespace delimiters:\n" +
"1 Fourth list item 1\n" +
"2 Fourth list item 2\n" +
"3 Fourth list item 3";
// Die vierte Liste, mit Leerzeichen zwischen der Listennummer und dem Inhalt des Listenelements,
// wird nur dann als Liste erkannt, wenn "DetectNumberingWithWhitespaces" in einem LoadOptions-Objekt auf true gesetzt ist,
// um zu vermeiden, dass Absätze, die mit Zahlen beginnen, fälschlicherweise als Listen erkannt werden.
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDetectNumberingWithWhitespaces(true);
}
// Laden Sie das Dokument, während Sie LoadOptions als Parameter anwenden, und überprüfen Sie das Ergebnis.
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");
Dieser Code zeigt, wie man ein Textdokument mit verschiedenen Listenformaten lädt und dieDetectNumberingWithWhitespaces
Option zum korrekten Erkennen von Listen.
Schritt 2: Umgang mit Leerzeichen-Optionen
Um führende und nachfolgende Leerzeichen beim Laden eines Textdokuments zu steuern, können Sie den folgenden Code verwenden:
@Test
public void handleSpacesOptions() throws Exception {
final String TEXT_DOC = " Line 1 \n" +
" Line 2 \n" +
" Line 3 ";
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
}
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.HandleSpacesOptions.docx");
}
In diesem Beispiel laden wir ein Textdokument und entfernen führende und nachfolgende Leerzeichen mitTxtLeadingSpacesOptions.TRIM
UndTxtTrailingSpacesOptions.TRIM
.
Schritt 3: Textrichtung steuern
Um die Textrichtung beim Laden eines Textdokuments festzulegen, können Sie den folgenden Code verwenden:
@Test
public void documentTextDirection() throws Exception {
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDocumentDirection(DocumentDirection.AUTO);
}
Document doc = new Document("Your Directory Path" + "Hebrew text.txt", loadOptions);
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
System.out.println(paragraph.getParagraphFormat().getBidi());
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DocumentTextDirection.docx");
}
Dieser Code setzt die Dokumentrichtung auf automatische Erkennung (DocumentDirection.AUTO
) und lädt ein Textdokument mit hebräischem Text. Sie können die Dokumentrichtung nach Bedarf anpassen.
Vollständiger Quellcode zum Laden von Textdateien mit Aspose.Words für Java
public void detectNumberingWithWhitespaces() throws Exception {
// Erstellen Sie ein Klartextdokument in Form einer Zeichenfolge mit Teilen, die als Listen interpretiert werden können.
// Beim Laden werden die ersten drei Listen immer von Aspose.Words erkannt,
// und nach dem Laden werden Listenobjekte für sie erstellt.
final String TEXT_DOC = "Full stop delimiters:\n" +
"1. First list item 1\n" +
"2. First list item 2\n" +
"3. First list item 3\n\n" +
"Right bracket delimiters:\n" +
"1) Second list item 1\n" +
"2) Second list item 2\n" +
"3) Second list item 3\n\n" +
"Bullet delimiters:\n" +
"• Third list item 1\n" +
"• Third list item 2\n" +
"• Third list item 3\n\n" +
"Whitespace delimiters:\n" +
"1 Fourth list item 1\n" +
"2 Fourth list item 2\n" +
"3 Fourth list item 3";
// Die vierte Liste, mit Leerzeichen zwischen der Listennummer und dem Inhalt des Listenelements,
// wird nur dann als Liste erkannt, wenn "DetectNumberingWithWhitespaces" in einem LoadOptions-Objekt auf true gesetzt ist,
// um zu vermeiden, dass Absätze, die mit Zahlen beginnen, fälschlicherweise als Listen erkannt werden.
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDetectNumberingWithWhitespaces(true);
}
// Laden Sie das Dokument, während Sie LoadOptions als Parameter anwenden, und überprüfen Sie das Ergebnis.
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DetectNumberingWithWhitespaces.docx");
}
@Test
public void handleSpacesOptions() throws Exception {
final String TEXT_DOC = " Line 1 \n" +
" Line 2 \n" +
" Line 3 ";
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setLeadingSpacesOptions(TxtLeadingSpacesOptions.TRIM);
loadOptions.setTrailingSpacesOptions(TxtTrailingSpacesOptions.TRIM);
}
Document doc = new Document(new ByteArrayInputStream(TEXT_DOC.getBytes()), loadOptions);
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.HandleSpacesOptions.docx");
}
@Test
public void documentTextDirection() throws Exception {
TxtLoadOptions loadOptions = new TxtLoadOptions();
{
loadOptions.setDocumentDirection(DocumentDirection.AUTO);
}
Document doc = new Document("Your Directory Path" + "Hebrew text.txt", loadOptions);
Paragraph paragraph = doc.getFirstSection().getBody().getFirstParagraph();
System.out.println(paragraph.getParagraphFormat().getBidi());
doc.save("Your Directory Path" + "WorkingWithTxtLoadOptions.DocumentTextDirection.docx");
}
Abschluss
In diesem Handbuch haben wir untersucht, wie Sie Textdateien mit Aspose.Words für Java laden, Listen erkennen, Leerzeichen verarbeiten und die Textrichtung steuern. Mit diesen Techniken können Sie Textdokumente in Ihren Java-Anwendungen effektiv bearbeiten.
Häufig gestellte Fragen
Was ist Aspose.Words für Java?
Aspose.Words für Java ist eine leistungsstarke Dokumentverarbeitungsbibliothek, mit der Entwickler Word-Dokumente programmgesteuert in Java-Anwendungen erstellen, bearbeiten und konvertieren können. Es bietet eine breite Palette von Funktionen für die Arbeit mit Text, Tabellen, Bildern und anderen Dokumentelementen.
Wie kann ich mit Aspose.Words für Java beginnen?
Um mit Aspose.Words für Java zu beginnen, befolgen Sie diese Schritte:
- Laden Sie die Aspose.Words-Bibliothek für Java herunter und installieren Sie sie.
- Weitere Informationen finden Sie in der Dokumentation unterAspose.Words für Java API-Referenz für detaillierte Informationen und Beispiele.
- Sehen Sie sich den Beispielcode und die Tutorials an, um zu erfahren, wie Sie die Bibliothek effektiv nutzen können.
Wie lade ich ein Textdokument mit Aspose.Words für Java?
Um ein Textdokument mit Aspose.Words für Java zu laden, können Sie denTxtLoadOptions
Klasse und dieDocument
Klasse. Stellen Sie sicher, dass Sie bei Bedarf die entsprechenden Optionen für die Handhabung von Leerzeichen und Textrichtung angeben. Ein ausführliches Beispiel finden Sie in der Schritt-für-Schritt-Anleitung in diesem Artikel.
Kann ich ein geladenes Textdokument in andere Formate konvertieren?
Ja, Aspose.Words für Java ermöglicht es Ihnen, ein geladenes Textdokument in verschiedene Formate zu konvertieren, darunter DOCX, PDF und mehr. Sie können dasDocument
Klasse zum Durchführen von Konvertierungen. Spezifische Konvertierungsbeispiele finden Sie in der Dokumentation.
Wie gehe ich mit Leerzeichen in geladenen Textdokumenten um?
Sie können die Behandlung führender und nachfolgender Leerzeichen in geladenen Textdokumenten steuern mitTxtLoadOptions
Optionen wieTxtLeadingSpacesOptions
UndTxtTrailingSpacesOptions
ermöglicht es Ihnen, Leerzeichen nach Bedarf zu kürzen oder beizubehalten. Ein Beispiel finden Sie im Abschnitt „Behandlung von Leerzeichenoptionen“ in diesem Handbuch.
Welche Bedeutung hat die Textrichtung in Aspose.Words für Java?
Die Textrichtung ist für Dokumente mit gemischten Schriften oder Sprachen wie Hebräisch oder Arabisch von entscheidender Bedeutung. Aspose.Words für Java bietet Optionen zum Festlegen der Textrichtung, um eine korrekte Darstellung und Formatierung des Textes in diesen Sprachen sicherzustellen. Der Abschnitt „Steuern der Textrichtung“ in diesem Handbuch zeigt, wie Sie die Textrichtung festlegen.
Wo finde ich weitere Ressourcen und Support für Aspose.Words für Java?
Weitere Ressourcen, Dokumentation und Support finden Sie imAspose.Words für Java-Dokumentation. Sie können auch an den Aspose.Words-Community-Foren teilnehmen oder sich bei bestimmten Problemen oder Anfragen an den Aspose-Support wenden, wenn Sie Hilfe benötigen.
Ist Aspose.Words für Java für kommerzielle Projekte geeignet?
Ja, Aspose.Words für Java eignet sich sowohl für private als auch für kommerzielle Projekte. Es bietet Lizenzierungsoptionen für verschiedene Nutzungsszenarien. Lesen Sie unbedingt die Lizenzbedingungen und Preise auf der Aspose-Website, um die passende Lizenz für Ihr Projekt auszuwählen.