Class TextExtractorOptions
Innehåll
[
Dölj
]TextExtractorOptions klass
Representerar alternativ för textutvinning för TextExtractor-plugin.
public sealed class TextExtractorOptions : PdfExtractorOptions
Konstruktörer
| Namn | Beskrivning |
|---|---|
| TextExtractorOptions() | Initierar en ny instans av TextExtractorOptions-objektet med ‘Raw’ (standard) textformateringsläge. |
| TextExtractorOptions(TextFormattingMode) | Initierar en ny instans av TextExtractorOptions-objektet för det angivna textformateringsläget. |
Egenskaper
| Namn | Beskrivning |
|---|---|
| FormattingMode { get; } | Hämtar formateringsläge. |
| Inputs { get; } | Returnerar PdfExtractor-pluginens datainsamling. |
| override OperationName { get; } | Returnerar namnet på operationen. |
Metoder
| Namn | Beskrivning |
|---|---|
| AddInput(IDataSource) | Lägger till en ny datakälla till PdfExtractor-pluginens datainsamling. |
Andra Medlemmar
| Namn | Beskrivning |
|---|---|
| enum TextFormattingMode | Definierar olika lägen som kan användas vid konvertering av ett PDF-dokument till text. Se TextExtractorOptions klass. |
Kommentarer
TextExtractorOptions-objektet används för att ställa in TextFormattingMode och andra alternativ för textutvinningsoperationen. Det är ocksåverkar funktioner för att lägga till data (filer, strömmar) som representerar inmatnings-PDF-dokument.
Exempel
Exemplet visar hur man extraherar textinnehållet i ett PDF-dokument.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set TextFormattingMode (Pure, or Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// add input file path to data sources
extractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(extractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Se Även
- klass PdfExtractorOptions
- namnrymd Aspose.Pdf.Plugins
- assembly Aspose.PDF