Αφαιρέστε τις αχρησιμοποίητες γραμματοσειρές σε αρχείο PDF

Σε αυτό το σεμινάριο, θα εξηγήσουμε πώς να αφαιρέσετε τις αχρησιμοποίητες γραμματοσειρές σε αρχείο PDF χρησιμοποιώντας τη βιβλιοθήκη Aspose.PDF για .NET. Θα ακολουθήσουμε τη διαδικασία βήμα προς βήμα φόρτωσης ενός PDF, αναγνώρισης και αφαίρεσης αχρησιμοποίητων γραμματοσειρών και αποθήκευσης του ενημερωμένου PDF χρησιμοποιώντας τον παρεχόμενο πηγαίο κώδικα C#.

Απαιτήσεις

Πριν ξεκινήσετε, βεβαιωθείτε ότι έχετε τα ακόλουθα:

  • Εγκαταστάθηκε η βιβλιοθήκη Aspose.PDF για .NET.
  • Βασική κατανόηση του προγραμματισμού C#.

Βήμα 1: Ρυθμίστε τον Κατάλογο Εγγράφων

Αρχικά, πρέπει να ορίσετε τη διαδρομή προς τον κατάλογο όπου βρίσκονται τα αρχεία PDF σας. Αντικαθιστώ"YOUR DOCUMENT DIRECTORY" στοdataDir μεταβλητή με τη διαδρομή προς τα αρχεία PDF σας.

string dataDir = "YOUR DOCUMENT DIRECTORY";

Βήμα 2: Φορτώστε το αρχείο προέλευσης PDF

Στη συνέχεια, φορτώνουμε το έγγραφο προέλευσης PDF χρησιμοποιώντας τοDocument τάξη από τη βιβλιοθήκη Aspose.PDF.

Document doc = new Document(dataDir + "ReplaceTextPage.pdf");

Βήμα 3: Προσδιορίστε και αφαιρέστε τις αχρησιμοποίητες γραμματοσειρές

Δημιουργούμε αTextFragmentAbsorber αντικείμενο με τοTextEditOptions η παράμετρος έχει οριστεί σεTextEditOptions.FontReplace.RemoveUnusedFonts . Αυτή η επιλογή μας επιτρέπει να αναγνωρίζουμε και να αφαιρούμε αχρησιμοποίητες γραμματοσειρές στο έγγραφο PDF. Στη συνέχεια επαναλαμβάνουμε όλα ταTextFragments και ορίστε τη γραμματοσειρά σε μια γραμματοσειρά που θέλετε.

TextFragmentAbsorber absorber = new TextFragmentAbsorber(new TextEditOptions(TextEditOptions.FontReplace.RemoveUnusedFonts));
doc.Pages.Accept(absorb);

foreach(TextFragment textFragment in absorber.TextFragments)
{
     textFragment.TextState.Font = FontRepository.FindFont("Arial, Bold");
}

Βήμα 4: Αποθηκεύστε το ενημερωμένο PDF

Τέλος, αποθηκεύουμε το ενημερωμένο έγγραφο PDF στο καθορισμένο αρχείο εξόδου.

dataDir = dataDir + "RemoveUnusedFonts_out.pdf";
doc.Save(dataDir);
Console.WriteLine("\nUnused fonts removed successfully from the PDF document.\nFile saved at " + dataDir);

Δείγμα πηγαίου κώδικα για Κατάργηση αχρησιμοποίητων γραμματοσειρών χρησιμοποιώντας το Aspose.PDF για .NET

try
{
	// Η διαδρομή προς τον κατάλογο εγγράφων.
	string dataDir = "YOUR DOCUMENT DIRECTORY";
	// Φόρτωση αρχείου PDF πηγής
	Document doc = new Document(dataDir + "ReplaceTextPage.pdf");
	TextFragmentAbsorber absorber = new TextFragmentAbsorber(new TextEditOptions(TextEditOptions.FontReplace.RemoveUnusedFonts));
	doc.Pages.Accept(absorber);
	// Επανάληψη σε όλα τα TextFragments
	foreach (TextFragment textFragment in absorber.TextFragments)
	{
		textFragment.TextState.Font = FontRepository.FindFont("Arial, Bold");
	}
	dataDir = dataDir + "RemoveUnusedFonts_out.pdf";
	// Αποθήκευση ενημερωμένου εγγράφου
	doc.Save(dataDir);
	Console.WriteLine("\nUnused fonts removed successfully from pdf document.\nFile saved at " + dataDir);
}
catch (Exception ex)
{
	Console.WriteLine(ex.Message + "\nThis example will only work if you apply a valid Aspose License. You can purchase full license or get 30 day temporary license from http:// Www.aspose.com/purchase/default.aspx.");
}

συμπέρασμα

Σε αυτό το σεμινάριο, μάθατε πώς να αφαιρείτε αχρησιμοποίητες γραμματοσειρές από ένα έγγραφο PDF χρησιμοποιώντας τη βιβλιοθήκη Aspose.PDF για .NET. Ακολουθώντας τον οδηγό βήμα προς βήμα και εκτελώντας τον παρεχόμενο κώδικα C#, μπορείτε να φορτώσετε ένα PDF, να αναγνωρίσετε και να αφαιρέσετε γραμματοσειρές που δεν χρησιμοποιούνται και να αποθηκεύσετε το ενημερωμένο PDF.

Συχνές ερωτήσεις

Ε: Ποιος είναι ο σκοπός του σεμιναρίου “Κατάργηση αχρησιμοποίητων γραμματοσειρών σε αρχείο PDF”;

Α: Το σεμινάριο “Κατάργηση αχρησιμοποίητων γραμματοσειρών σε αρχείο PDF” εξηγεί πώς να χρησιμοποιήσετε τη βιβλιοθήκη Aspose.PDF για .NET για να αφαιρέσετε τις αχρησιμοποίητες γραμματοσειρές από ένα έγγραφο PDF. Το σεμινάριο σάς καθοδηγεί στη διαδικασία φόρτωσης ενός PDF, αναγνώρισης και αφαίρεσης αχρησιμοποίητων γραμματοσειρών και αποθήκευσης του ενημερωμένου PDF.

Ε: Γιατί θα ήθελα να αφαιρέσω τις αχρησιμοποίητες γραμματοσειρές από ένα έγγραφο PDF;

Α: Η κατάργηση των αχρησιμοποίητων γραμματοσειρών από ένα έγγραφο PDF μπορεί να βοηθήσει στη μείωση του μεγέθους του αρχείου και στη βελτιστοποίηση του εγγράφου για καλύτερη απόδοση. Αυτό είναι ιδιαίτερα χρήσιμο όταν ασχολείστε με αρχεία PDF που περιέχουν ενσωματωμένες γραμματοσειρές που δεν χρησιμοποιούνται πραγματικά στο περιεχόμενο του εγγράφου.

Ε: Πώς μπορώ να ρυθμίσω τον κατάλογο εγγράφων;

Α: Για να ρυθμίσετε τον κατάλογο εγγράφων:

  1. Αντικαθιστώ"YOUR DOCUMENT DIRECTORY" στοdataDir μεταβλητή με τη διαδρομή προς τον κατάλογο όπου βρίσκονται τα αρχεία PDF σας.

Ε: Πώς μπορώ να αφαιρέσω αχρησιμοποίητες γραμματοσειρές από ένα έγγραφο PDF χρησιμοποιώντας τη βιβλιοθήκη Aspose.PDF;

Α: Το σεμινάριο σας καθοδηγεί στη διαδικασία βήμα προς βήμα:

  1. Ανοίξτε το έγγραφο PDF χρησιμοποιώντας τοDocument τάξη.
  2. Δημιουργώ έναTextFragmentAbsorber αντικείμενο μεTextEditOptions οριστεί σεFontReplace.RemoveUnusedFonts.
  3. Αποδεχτείτε τον απορροφητή για να αναγνωρίσετε και να αφαιρέσετε τις αχρησιμοποίητες γραμματοσειρές από το PDF.
  4. Επαναλάβετε σε όλαTextFragments και ορίστε τη γραμματοσειρά σε μια γραμματοσειρά που θέλετε.
  5. Αποθηκεύστε το ενημερωμένο έγγραφο PDF.

Ε: Ποιος είναι ο σκοπός τουTextEditOptions.FontReplace.RemoveUnusedFonts parameter?

Α: ΤοTextEditOptions.FontReplace.RemoveUnusedFonts παράμετρος καθοδηγεί τοTextFragmentAbsorber για να αναγνωρίσετε και να αφαιρέσετε τις αχρησιμοποίητες γραμματοσειρές από το έγγραφο PDF.

Ε: Μπορώ να αντικαταστήσω τις αχρησιμοποίητες γραμματοσειρές με μια γραμματοσειρά της επιλογής μου;

Α: Ναι, μπορείτε να τροποποιήσετε τον κώδικα για να αντικαταστήσετε τις αχρησιμοποίητες γραμματοσειρές με μια γραμματοσειρά της επιλογής σας. Στο παρεχόμενο δείγμα κώδικα, η γραμματοσειρά “Arial, Bold” χρησιμοποιείται ως αντικατάσταση.

Ε: Πώς κάνει τοTextFragmentAbsorber work to remove unused fonts?

Α: ΤοTextFragmentAbsorber έχει ρυθμιστεί με τοTextEditOptions.FontReplace.RemoveUnusedFonts παράμετρος, η οποία προσδιορίζει τις αχρησιμοποίητες γραμματοσειρές στα τμήματα κειμένου του PDF. Μετά την απορρόφηση, μπορείτε να επαναλάβετε μέσω τουTextFragments και ορίστε τις γραμματοσειρές τους στις επιθυμητές γραμματοσειρές αντικατάστασης.

Ε: Ποιο είναι το αναμενόμενο αποτέλεσμα από την εκτέλεση του παρεχόμενου κώδικα;

Α: Ακολουθώντας το σεμινάριο και εκτελώντας τον παρεχόμενο κώδικα C#, θα αφαιρέσετε τις αχρησιμοποίητες γραμματοσειρές από το έγγραφο εισόδου PDF και θα αποθηκεύσετε την ενημερωμένη έκδοση ως αρχείο PDF εξόδου.

Ε: Μπορώ να τροποποιήσω τον κώδικα για να αφαιρέσω γραμματοσειρές μόνο από συγκεκριμένες σελίδες ή περιοχές;

Α: Ο παρεχόμενος κώδικας εστιάζει στην αφαίρεση των αχρησιμοποίητων γραμματοσειρών από ολόκληρο το έγγραφο PDF. Εάν θέλετε να στοχεύσετε συγκεκριμένες σελίδες ή περιοχές για αφαίρεση γραμματοσειρών, θα πρέπει να τροποποιήσετε την προσέγγιση και να χρησιμοποιήσετε πιο περίπλοκη λογική για να προσδιορίσετε τις αχρησιμοποίητες γραμματοσειρές σε αυτές τις περιοχές.