Wörter durchstreichen

Einführung

Mussten Sie schon einmal bestimmten Text in einer PDF-Datei durchstreichen, um ihn hervorzuheben? Egal, ob Sie Dokumente überprüfen, Text markieren oder einfach nur bestimmte Abschnitte hervorheben müssen, das Durchstreichen von Wörtern kann ein wertvolles Werkzeug sein. In diesem Tutorial erfahren Sie, wie Sie genau das mit Aspose.PDF für .NET tun können. Diese umfassende Anleitung führt Sie durch jeden Schritt und stellt sicher, dass Sie über alle erforderlichen Informationen verfügen, um diese Funktion effektiv in Ihren .NET-Anwendungen zu implementieren.

Voraussetzungen

Bevor wir uns in den Code stürzen, müssen Sie einige Voraussetzungen erfüllen, um diesem Tutorial folgen zu können:

  1. Aspose.PDF für .NET-Bibliothek: Stellen Sie sicher, dass Sie die Aspose.PDF für .NET-Bibliothek installiert haben. Sie könnenLaden Sie es hier herunter.

  2. .NET Framework: Stellen Sie sicher, dass .NET Framework auf Ihrem Computer installiert ist. Dieses Tutorial ist für .NET-Anwendungen konzipiert.

  3. Entwicklungsumgebung: Sie benötigen eine IDE wie Visual Studio, um Ihren Code zu schreiben und auszuführen.

  4. PDF-Dokument: Halten Sie eine Beispiel-PDF-Datei bereit, mit der Sie arbeiten möchten. Dies ist das Dokument, in dem wir den Text streichen.

  5. Grundlegende C#-Kenntnisse: Um die Schritte in diesem Tutorial zu verstehen und umzusetzen, sind Kenntnisse in der C#-Programmierung erforderlich.

Pakete importieren

Bevor wir mit dem Programmieren beginnen können, müssen wir die erforderlichen Namespaces in unser .NET-Projekt importieren. Dadurch erhalten wir Zugriff auf die Klassen und Methoden, die zum Bearbeiten von PDF-Dateien mit Aspose.PDF erforderlich sind.

using System;
using System.IO;
using Aspose.Pdf.Annotations;
using Aspose.Pdf;

Diese Namespaces sind für die Arbeit mit PDF-Dokumenten, die Textbearbeitung und das Hinzufügen von Anmerkungen wie Durchstreichungen von entscheidender Bedeutung.

In diesem Abschnitt unterteilen wir den Vorgang zum Durchstreichen von Wörtern in einem PDF-Dokument in einfache, überschaubare Schritte. Jeder Schritt wird von einer ausführlichen Erklärung begleitet, damit Sie verstehen, wie alles funktioniert.

Schritt 1: Laden Sie das PDF-Dokument

Der erste Schritt besteht darin, das PDF-Dokument zu laden, das Sie bearbeiten möchten. In diesem Dokument werden Sie bestimmte Wörter oder Ausdrücke streichen.

// Der Pfad zum Dokumentverzeichnis.
string dataDir = "YOUR DOCUMENT DIRECTORY";

// Öffnen Sie das PDF-Dokument
Document document = new Document(dataDir + "input.pdf");
  • dataDir : Diese Variable enthält den Pfad zu Ihrem Dokumentverzeichnis. Ersetzen Sie"YOUR DOCUMENT DIRECTORY" durch den tatsächlichen Pfad, in dem sich Ihre PDF-Datei befindet.
  • Document : DerDocument Klasse stellt ein PDF-Dokument dar. Indem wir den Dateipfad an seinen Konstruktor übergeben, öffnen wir die PDF-Datei zur Verarbeitung.

Schritt 2: Erstellen Sie einen TextFragment-Absorber, um bestimmten Text zu finden

Als nächstes erstellen wir eine Instanz vonTextFragmentAbsorber um nach einem bestimmten Textfragment im PDF-Dokument zu suchen. So können wir den Text finden, den wir streichen möchten.

// Erstellen Sie eine TextFragment Absorber-Instanz, um nach einem bestimmten Textfragment zu suchen
Aspose.Pdf.Text.TextFragmentAbsorber textFragmentAbsorber = new Aspose.Pdf.Text.TextFragmentAbsorber("Estoque");
  • TextFragmentAbsorberDiese Klasse wird verwendet, um bestimmte Textfragmente im PDF-Dokument zu finden und damit zu arbeiten. In diesem Beispiel suchen wir nach dem Wort „Estoque“. Ersetzen Sie „Estoque“ durch das Wort oder die Phrase, die Sie in Ihrem Dokument finden möchten.

Schritt 3: Durch die Seiten des PDF-Dokuments iterieren

Jetzt, da wir unsereTextFragmentAbsorbermüssen wir jede Seite des PDF-Dokuments durchsuchen, um den angegebenen Text zu finden.

// Durch die Seiten des PDF-Dokuments iterieren
for (int i = 1; i <= document.Pages.Count; i++)
{
    // Aktuelle Seite des PDF-Dokuments abrufen
    Page page = document.Pages[i];
    page.Accept(textFragmentAbsorber);
}
  • for (int i = 1; i <= document.Pages.Count; i++): Diese Schleife durchläuft jede Seite des PDF-Dokuments.
  • document.Pages[i]: Ruft die aktuell verarbeitete Seite ab.
  • page.Accept(textFragmentAbsorber) : Diese Methode wendet dieTextFragmentAbsorber zur aktuellen Seite und sucht nach dem angegebenen Text.

Schritt 4: Sammeln und verarbeiten Sie die Textfragmente

Nach der Iteration durch die Seiten sammeln wir die gefundenen Textfragmente und bereiten diese für die weitere Verarbeitung auf.

// Erstellen Sie eine Sammlung aufgenommener Textfragmente
Aspose.Pdf.Text.TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;
  • TextFragmentCollectionIn dieser Sammlung sind alle Textfragmente gespeichert, die im Dokument gefunden wurden. Diese Sammlung verwenden wir im nächsten Schritt, um den Text durchzustreichen.

Schritt 5: Durchlaufen Sie die Textfragmente und streichen Sie sie durch

In diesem Schritt durchlaufen wir jedes Textfragment in unserer Sammlung und wenden eine Durchstreichungsanmerkung darauf an.

// Iterieren Sie über die Sammlung von Textfragmenten
for (int j = 1; j <= textFragmentCollection.Count; j++)
{
	Aspose.Pdf.Text.TextFragment textFragment = textFragmentCollection[j];

    // Holen Sie sich die rechteckigen Abmessungen des TextFragment-Objekts
    Aspose.Pdf.Rectangle rect = new Aspose.Pdf.Rectangle(
        (float)textFragment.Position.XIndent,
        (float)textFragment.Position.YIndent,
        (float)textFragment.Position.XIndent + (float)textFragment.Rectangle.Width,
        (float)textFragment.Position.YIndent + (float)textFragment.Rectangle.Height);

    // Instanziieren einer StrikeOut-Annotation
    StrikeOutAnnotation strikeOut = new StrikeOutAnnotation(textFragment.Page, rect);

    // Eigenschaften der Durchstreichungsanmerkung festlegen
    strikeOut.Opacity = .80f;
    strikeOut.Border = new Border(strikeOut);
    strikeOut.Color = Aspose.Pdf.Color.Red;

    // Fügen Sie die Anmerkung zur Anmerkungssammlung der Seite des Textfragments hinzu
    textFragment.Page.Annotations.Add(strikeOut);
}
  • TextFragment textFragment = textFragmentCollection[j]: Diese Zeile ruft das aktuelle Textfragment ab.
  • Aspose.Pdf.Rectangle: Wir berechnen die rechteckigen Abmessungen des Textfragments, um zu bestimmen, wo die Durchstreichung angewendet werden soll.
  • StrikeOutAnnotation: Diese Klasse stellt die Strikeout-Annotation dar. Wir instanziieren sie mit dem berechneten Rechteck und der aktuellen Seite.
  • strikeOut.Opacity: Diese Eigenschaft legt die Deckkraft des Durchstreichungszeichens fest, sodass es zu 80 % sichtbar ist.
  • strikeOut.ColorWir haben die Farbe des Durchstreichungszeichens auf Rot gesetzt. Sie können dies in jede beliebige Farbe ändern.
  • textFragment.Page.Annotations.Add(strikeOut): Dadurch wird der Seite die Durchstreichungsanmerkung hinzugefügt.

Schritt 6: Speichern Sie das geänderte PDF-Dokument

Der letzte Schritt besteht darin, das geänderte PDF-Dokument mit den angewendeten Durchstreichungen zu speichern.

// Speichern Sie das aktualisierte PDF-Dokument
dataDir = dataDir + "StrikeOutWords_out.pdf";
document.Save(dataDir);
  • dataDir + "StrikeOutWords_out.pdf": Dadurch wird ein neuer Dateiname für das geänderte Dokument erstellt. Die Originaldatei bleibt unverändert.
  • document.Save(dataDir): Speichert das PDF-Dokument mit den Durchstreichungen am angegebenen Speicherort.

Abschluss

Herzlichen Glückwunsch! Sie haben mit Aspose.PDF für .NET erfolgreich bestimmte Wörter in einem PDF-Dokument durchgestrichen. Wenn Sie dieser Schritt-für-Schritt-Anleitung folgen, können Sie PDF-Dokumente jetzt anpassen, indem Sie Text hervorheben oder durchstreichen, sodass sie dynamischer und auf Ihre Bedürfnisse zugeschnitten sind. Egal, ob Sie juristische Dokumente kommentieren, Berichte erstellen oder einfach nur Text zur Überprüfung markieren, dieses Tutorial hat Ihnen die Fähigkeiten vermittelt, dies effizient zu tun.

Häufig gestellte Fragen

Kann ich die Farbe des Durchgestrichenen ändern?

Ja, Sie können die Farbe ändern, indem Sie diestrikeOut.ColorEigenschaft. Sie können sie beispielsweise aufAspose.Pdf.Color.Blue für einen blauen Strikeout.

Ist es möglich, mehrere Wörter auf einmal durchzustreichen?

Absolut! DieTextFragmentAbsorber kann verwendet werden, um nach einem beliebigen Wort oder einer beliebigen Phrase im Dokument zu suchen. Sie können die Durchstreichung auf mehrere Instanzen anwenden, indem Sie dieTextFragmentCollection.

Was ist, wenn ich Text nur auf bestimmten Seiten streichen möchte?

Sie können die Schleife, die die Seiten durchläuft, so ändern, dass nur die Seiten einbezogen werden, die Sie ändern möchten. Beispiel:for (int i = 1; i <= 3; i++) würde die Durchstreichung nur auf die ersten drei Seiten anwenden.

Wie kann ich die Dicke der Durchstreichlinie anpassen?

Sie können die Dicke der durchgestrichenen Linie anpassen, indem Sie dieBorder Eigentum derStrikeOutAnnotation. Dadurch kann das Erscheinungsbild des Durchgestrichenen angepasst werden.

Gibt es eine Möglichkeit, die Durchstreichung nach dem Speichern des Dokuments rückgängig zu machen?

Sobald das Dokument gespeichert ist, ist die Durchstreichung dauerhaft. Wenn Sie den Originaltext ohne Durchstreichung beibehalten möchten, sollten Sie vor dem Anwenden von Änderungen eine Sicherungskopie des Originaldokuments erstellen.