TextAbsorber

TextAbsorber class

Representerar ett absorberande objekt av en text. Utför textextraktion och ger tillgång till resultatet viaText objekt.

public class TextAbsorber

Konstruktörer

namn	Beskrivning
TextAbsorber()	Initierar en ny instans av`TextAbsorber` .
TextAbsorber(TextExtractionOptions)	Initierar en ny instans av`TextAbsorber` med extraktionsalternativ.
TextAbsorber(TextSearchOptions)	Initierar en ny instans av`TextAbsorber` med textsökningsalternativ.
TextAbsorber(TextExtractionOptions, TextSearchOptions)	Initierar en ny instans av`TextAbsorber` med alternativ för extraktion och textsökning.

Egenskaper

namn	Beskrivning
Errors { get; }	Lista över`TextExtractionError` objekt. Den innehåller information om fel som hittades under textextraktion. Sökning efter fel utförs endast om TextSearchOptions.LogTextExtractionErrors = true; Och det kan minska prestandan.
virtual ExtractionOptions { get; set; }	Hämtar eller ställer in alternativ för textextraktion.
HasErrors { get; }	Värde anger om fel hittades under textextrahering. Sökning efter fel utförs endast om TextSearchOptions.LogTextExtractionErrors = true; Och det kan minska prestandan.
virtual Text { get; }	Får extraherad text som`TextAbsorber` utdrag på PDF-dokumentet eller sidan.
virtual TextSearchOptions { get; set; }	Hämtar eller ställer in alternativ för textsökning.

Metoder

namn	Beskrivning
virtual Visit(Document)	Extraherar text på det angivna dokumentet
virtual Visit(Page)	Extraherar text på den angivna sidan
virtual Visit(XForm)	Extraherar text på den angivna XForm.

Anmärkningar

DenTextAbsorber objekt används för att extrahera text från ett pdf-dokument eller dokumentets sida.

Exempel

Exemplet visar hur man extraherar text på den första PDF-dokumentsidan.

// öppna dokument
Document doc = new Document(inFile);

// skapa TextAbsorber-objekt för att extrahera text
TextAbsorber absorber = new TextAbsorber();

// acceptera absorbenten för första sidan
doc.Pages[1].Accept(absorber);

// få den extraherade texten
string extractedText = absorber.Text;

Se även

namnutrymme Aspose.Pdf.Text
hopsättning Aspose.PDF

TableAbsorber TextBuilder