Class TextExtractor
Contenu
[
Cacher
]Classe TextExtractor
Représente le plugin TextExtractor.
public class TextExtractor : PdfExtractor
Constructeurs
| Nom | Description |
|---|---|
| TextExtractor() | Le constructeur par défaut. |
Méthodes
| Nom | Description |
|---|---|
| Dispose() | Implémentation de IDisposable. En fait, ce n’est pas nécessaire pour PdfExtractor. |
| Process(IPluginOptions) | Démarre le traitement de PdfExtractor avec les paramètres spécifiés. |
Remarques
L’objet TextExtractor est utilisé pour extraire du texte dans des documents PDF.
Exemples
L’exemple démontre comment extraire le contenu textuel d’un document PDF.
// create TextExtractor object to extract text in PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddDataSource(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Voir aussi
- classe PdfExtractor
- espace de noms Aspose.Pdf.Plugins
- assembly Aspose.PDF