TextAbsorber
Innehåll
[
Dölj
]TextAbsorber class
Representerar ett absorberande objekt av en text. Utför textextraktion och ger tillgång till resultatet viaText
objekt.
public class TextAbsorber
Konstruktörer
namn | Beskrivning |
---|---|
TextAbsorber() | Initierar en ny instans avTextAbsorber . |
TextAbsorber(TextExtractionOptions) | Initierar en ny instans avTextAbsorber med extraktionsalternativ. |
TextAbsorber(TextSearchOptions) | Initierar en ny instans avTextAbsorber med textsökningsalternativ. |
TextAbsorber(TextExtractionOptions, TextSearchOptions) | Initierar en ny instans avTextAbsorber med alternativ för extraktion och textsökning. |
Egenskaper
namn | Beskrivning |
---|---|
Errors { get; } | Lista överTextExtractionError objekt. Den innehåller information om fel som hittades under textextraktion. Sökning efter fel utförs endast om TextSearchOptions.LogTextExtractionErrors = true; Och det kan minska prestandan. |
virtual ExtractionOptions { get; set; } | Hämtar eller ställer in alternativ för textextraktion. |
HasErrors { get; } | Värde anger om fel hittades under textextrahering. Sökning efter fel utförs endast om TextSearchOptions.LogTextExtractionErrors = true; Och det kan minska prestandan. |
virtual Text { get; } | Får extraherad text somTextAbsorber utdrag på PDF-dokumentet eller sidan. |
virtual TextSearchOptions { get; set; } | Hämtar eller ställer in alternativ för textsökning. |
Metoder
namn | Beskrivning |
---|---|
virtual Visit(Document) | Extraherar text på det angivna dokumentet |
virtual Visit(Page) | Extraherar text på den angivna sidan |
virtual Visit(XForm) | Extraherar text på den angivna XForm. |
Anmärkningar
DenTextAbsorber
objekt används för att extrahera text från ett pdf-dokument eller dokumentets sida.
Exempel
Exemplet visar hur man extraherar text på den första PDF-dokumentsidan.
// öppna dokument
Document doc = new Document(inFile);
// skapa TextAbsorber-objekt för att extrahera text
TextAbsorber absorber = new TextAbsorber();
// acceptera absorbenten för första sidan
doc.Pages[1].Accept(absorber);
// få den extraherade texten
string extractedText = absorber.Text;
Se även
- namnutrymme Aspose.Pdf.Text
- hopsättning Aspose.PDF