Αναζήτηση κειμένου και σχεδίαση ορθογωνίου

Αυτό το σεμινάριο εξηγεί πώς να χρησιμοποιήσετε το Aspose.PDF για .NET για να αναζητήσετε συγκεκριμένο κείμενο σε ένα έγγραφο PDF, να σχεδιάσετε ένα ορθογώνιο γύρω από το κείμενο που βρέθηκε και να αποθηκεύσετε το τροποποιημένο έγγραφο. Ο παρεχόμενος πηγαίος κώδικας C# δείχνει τη διαδικασία βήμα προς βήμα.

Προαπαιτούμενα

Πριν συνεχίσετε με το σεμινάριο, βεβαιωθείτε ότι έχετε τα εξής:

  • Βασικές γνώσεις γλώσσας προγραμματισμού C#.
  • Εγκαταστάθηκε το Aspose.PDF για τη βιβλιοθήκη .NET. Μπορείτε να το αποκτήσετε από τον ιστότοπο Aspose ή να χρησιμοποιήσετε το NuGet για να το εγκαταστήσετε στο έργο σας.

Βήμα 1: Ρύθμιση του έργου

Ξεκινήστε δημιουργώντας ένα νέο έργο C# στο ενσωματωμένο περιβάλλον ανάπτυξης (IDE) που προτιμάτε και προσθέστε μια αναφορά στη βιβλιοθήκη Aspose.PDF για .NET.

Βήμα 2: Εισαγάγετε τους απαραίτητους χώρους ονομάτων

Προσθέστε τα ακόλουθα χρησιμοποιώντας οδηγίες στην αρχή του αρχείου C# για να εισαγάγετε τους απαιτούμενους χώρους ονομάτων:

using Aspose.Pdf;
using Aspose.Pdf.Text;
using Aspose.Pdf.Content;
using Aspose.Pdf.Facades;

Βήμα 3: Ορίστε τη διαδρομή προς τον κατάλογο εγγράφων

Ορίστε τη διαδρομή προς τον κατάλογο εγγράφων σας χρησιμοποιώντας τοdataDir μεταβλητός:

string dataDir = "YOUR DOCUMENT DIRECTORY";

Αντικαθιστώ"YOUR DOCUMENT DIRECTORY" με την πραγματική διαδρομή προς τον κατάλογο εγγράφων σας.

Βήμα 4: Φορτώστε το έγγραφο PDF

Φορτώστε το έγγραφο PDF χρησιμοποιώντας τοDocument τάξη:

Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");

Αντικαθιστώ"SearchAndGetTextFromAll.pdf" με το πραγματικό όνομα του αρχείου PDF σας.

Βήμα 5: Δημιουργήστε ένα TextFragmentAbsorber

Δημιουργώ έναTextFragmentAbsorber αντικείμενο για να βρείτε όλες τις παρουσίες της φράσης αναζήτησης εισόδου:

TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");

Αντικαθιστώ@"[\S]+" με το επιθυμητό μοτίβο κανονικής έκφρασης.

Βήμα 6: Ενεργοποιήστε την αναζήτηση τυπικών εκφράσεων

Ενεργοποιήστε την αναζήτηση τυπικών εκφράσεων ορίζοντας τοTextSearchOptions ιδιότητα του απορροφητή:

TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;

Βήμα 7: Αναζήτηση σε όλες τις σελίδες

Αποδεχτείτε τον απορροφητή για όλες τις σελίδες του εγγράφου:

document.Pages.Accept(textAbsorber);

Βήμα 8: Σχεδιάστε ένα ορθογώνιο γύρω από το κείμενο που βρέθηκε

Δημιουργώ έναPdfContentEditor αντικείμενο και βρόχο μέσα από τα ανακτημένα τμήματα κειμένου, σχεδιάζοντας ένα ορθογώνιο γύρω από κάθε τμήμα κειμένου:

var editor = new PdfContentEditor(document);
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
    foreach (TextSegment textSegment in textFragment.Segments)
    {
        DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
    }
}

Βήμα 9: Αποθηκεύστε το τροποποιημένο έγγραφο

Αποθηκεύστε το τροποποιημένο έγγραφο:

dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);

Φροντίστε να αντικαταστήσετε"SearchTextAndDrawRectangle_out.pdf" με το επιθυμητό όνομα αρχείου εξόδου.

Δείγμα πηγαίου κώδικα για Αναζήτηση κειμένου και σχεδίαση ορθογωνίου χρησιμοποιώντας το Aspose.PDF για .NET

// Η διαδρομή προς τον κατάλογο εγγράφων.
string dataDir = "YOUR DOCUMENT DIRECTORY";
// Άνοιγμα εγγράφου
Document document = new Document(dataDir + "SearchAndGetTextFromAll.pdf");
// Δημιουργήστε αντικείμενο TextAbsorber για να βρείτε όλες τις φράσεις που ταιριάζουν με την κανονική έκφραση
TextFragmentAbsorber textAbsorber = new TextFragmentAbsorber(@"[\S]+");
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textAbsorber.TextSearchOptions = textSearchOptions;
document.Pages.Accept(textAbsorber); 
var editor = new PdfContentEditor(document); 
foreach (TextFragment textFragment in textAbsorber.TextFragments)
{
	foreach (TextSegment textSegment in textFragment.Segments)
	{
			DrawBox(editor, textFragment.Page.Number, textSegment, System.Drawing.Color.Red);
	}
}
dataDir = dataDir + "SearchTextAndDrawRectangle_out.pdf";
document.Save(dataDir);
Console.WriteLine("\nRectangle drawn successfully on searched text.\nFile saved at " + dataDir);

συμπέρασμα

Συγχαρητήρια! Έχετε μάθει με επιτυχία πώς να αναζητάτε συγκεκριμένο κείμενο σε ένα έγγραφο PDF, να σχεδιάζετε ένα ορθογώνιο γύρω από το κείμενο που βρέθηκε και να αποθηκεύετε το τροποποιημένο έγγραφο χρησιμοποιώντας το Aspose.PDF για .NET. Αυτό το σεμινάριο παρείχε έναν οδηγό βήμα προς βήμα, από τη ρύθμιση του έργου έως την εκτέλεση των απαιτούμενων ενεργειών. Τώρα μπορείτε να ενσωματώσετε αυτόν τον κώδικα στα δικά σας έργα C# για να χειριστείτε κείμενο και να σχεδιάσετε ορθογώνια σε αρχεία PDF.

Συχνές ερωτήσεις

Ε: Ποιος είναι ο σκοπός του σεμιναρίου “Αναζήτηση κειμένου και σχεδίαση ορθογωνίου”;

Α: Το σεμινάριο “Αναζήτηση κειμένου και σχεδίασης ορθογωνίου” στοχεύει να καθοδηγήσει τους χρήστες στη διαδικασία χρήσης της βιβλιοθήκης Aspose.PDF για .NET για αναζήτηση συγκεκριμένου κειμένου μέσα σε ένα έγγραφο PDF, σχεδίαση ορθογωνίων γύρω από τα τμήματα κειμένου που βρέθηκαν και αποθήκευση των τροποποιημένων έγγραφο. Το σεμινάριο παρέχει λεπτομερείς οδηγίες και δείγματα κώδικα C# για να απεικονίσει κάθε βήμα της διαδικασίας.

Ε: Πώς βοηθά αυτό το σεμινάριο στη σχεδίαση ορθογωνίων γύρω από συγκεκριμένο κείμενο σε ένα έγγραφο PDF;

Α: Αυτό το σεμινάριο παρέχει έναν περιεκτικό οδηγό για τον εντοπισμό και τη σχεδίαση ορθογωνίων γύρω από συγκεκριμένα τμήματα κειμένου σε ένα έγγραφο PDF. Δείχνει τη διαδικασία ρύθμισης ενός έργου, φόρτωσης ενός εγγράφου PDF, ενεργοποίησης αναζήτησης κανονικών εκφράσεων, σχεδίασης ορθογωνίων γύρω από τμήματα κειμένου που βρέθηκαν και αποθήκευσης του τροποποιημένου PDF.

Ε: Ποιες προϋποθέσεις απαιτούνται για να ακολουθήσετε αυτό το σεμινάριο;

Α: Πριν ξεκινήσετε το σεμινάριο, θα πρέπει να έχετε μια βασική κατανόηση της γλώσσας προγραμματισμού C#. Επιπλέον, πρέπει να έχετε εγκατεστημένη τη βιβλιοθήκη Aspose.PDF για .NET. Μπορείτε να το αποκτήσετε από τον ιστότοπο Aspose ή να το εγκαταστήσετε στο έργο σας χρησιμοποιώντας το NuGet.

Ε: Πώς μπορώ να ρυθμίσω το έργο μου για να ακολουθήσω αυτό το σεμινάριο;

Α: Ξεκινήστε δημιουργώντας ένα νέο έργο C# στο προτιμώμενο περιβάλλον ολοκληρωμένης ανάπτυξης (IDE). Στη συνέχεια, προσθέστε μια αναφορά στη βιβλιοθήκη Aspose.PDF για .NET στο έργο σας. Αυτό θα σας επιτρέψει να χρησιμοποιήσετε τη λειτουργικότητα της βιβλιοθήκης για να χειριστείτε έγγραφα PDF.

Ε: Μπορώ να σχεδιάσω ορθογώνια γύρω από συγκεκριμένο κείμενο χρησιμοποιώντας αυτό το σεμινάριο;

Α: Ναι, το σεμινάριο εστιάζει στη σχεδίαση ορθογωνίων γύρω από συγκεκριμένα τμήματα κειμένου σε ένα έγγραφο PDF. Δείχνει πώς να εντοπίσετε το επιθυμητό κείμενο χρησιμοποιώντας κανονικές εκφράσεις, να δημιουργήσετε ορθογώνια γύρω από τα προσδιορισμένα τμήματα κειμένου και να αποθηκεύσετε το τροποποιημένο PDF.

Ε: Πώς μπορώ να καθορίσω το κείμενο που θέλω να αναζητήσω και να σχεδιάσω ορθογώνια γύρω;

Α: Για να καθορίσετε το κείμενο που θέλετε να αναζητήσετε και να σχεδιάσετε ορθογώνια γύρω, δημιουργήστε έναTextFragmentAbsorber αντικείμενο και ορίστε το μοτίβο του χρησιμοποιώντας τοText παράμετρος. Αντικαταστήστε το προεπιλεγμένο μοτίβο@"[\S]+" στον κώδικα του σεμιναρίου με το επιθυμητό μοτίβο κανονικής έκφρασης.

Ε: Πώς μπορώ να ενεργοποιήσω την αναζήτηση κανονικών εκφράσεων για κείμενο;

Α: Η αναζήτηση κανονικών εκφράσεων ενεργοποιείται δημιουργώντας έναTextSearchOptions αντικείμενο και ορίζοντας την τιμή του σεtrue . Αντιστοιχίστε αυτό το αντικείμενο στοTextSearchOptions ιδιοκτησία τουTextFragmentAbsorber παράδειγμα. Αυτό διασφαλίζει ότι το πρότυπο κανονικής έκφρασης χρησιμοποιείται κατά την αναζήτηση κειμένου.

Ε: Πώς σχεδιάζω ορθογώνια γύρω από το κείμενο που βρήκα;

Α: Αφού προσδιορίσετε τα τμήματα κειμένου χρησιμοποιώντας τοTextFragmentAbsorber , το σεμινάριο παρέχει έναν βρόχο για επανάληψη μέσω αυτών των τμημάτων. Για κάθε τμήμα κειμένου, το σεμινάριο δείχνει πώς να δημιουργήσετε ένα ορθογώνιο γύρω από αυτό χρησιμοποιώντας τοDrawBox μέθοδο και καθορίστε την εμφάνιση του ορθογωνίου.

Ε: Ποια είναι τα βήματα για να αποθηκεύσετε το τροποποιημένο PDF με σχεδιαζόμενα ορθογώνια;

Α: Αφού σχεδιάσετε ορθογώνια γύρω από τα επιθυμητά τμήματα κειμένου, χρησιμοποιήστε τοDocument της τάξηςSave μέθοδος αποθήκευσης του τροποποιημένου εγγράφου. Το δείγμα κώδικα του σεμιναρίου δείχνει πώς να αποθηκεύσετε το επεξεργασμένο PDF και να εμφανίσετε ένα μήνυμα επιτυχίας.

Ε: Μπορώ να προσαρμόσω την εμφάνιση των σχεδιαζόμενων ορθογωνίων;

Α: Ναι, μπορείτε να προσαρμόσετε την εμφάνιση των σχεδιαζόμενων ορθογωνίων. Στο δείγμα κώδικα του σεμιναρίου, τοDrawBox μέθοδος χρησιμοποιείται για τη δημιουργία ορθογωνίων. Μπορείτε να τροποποιήσετε ιδιότητες όπως το χρώμα, το στυλ και το πάχος για να προσαρμόσετε την εμφάνιση των σχεδιαζόμενων ορθογωνίων.