TextDevice

TextDevice class

Representerar klass för att konvertera pdf-dokumentsidor till text.

public sealed class TextDevice : PageDevice

Konstruktörer

namn Beskrivning
TextDevice() Initierar en ny instans avTextDevice med formateringsläget för råtext och Unicode-textkodning.
TextDevice(Encoding) Initierar en ny instans avTextDevice för den angivna kodningen.
TextDevice(TextExtractionOptions) Initierar en ny instans avTextDevice med alternativ för textextrahering.
TextDevice(TextExtractionOptions, Encoding) Initierar en ny instans avTextDevice för den angivna kodningen med textextraheringsalternativ.

Egenskaper

namn Beskrivning
Encoding { get; set; } Hämtar eller ställer in kodning av extraherad text.
ExtractionOptions { get; set; } Hämtar eller ställer in alternativ för textextraktion.

Metoder

namn Beskrivning
override Process(Page, Stream) Konvertera sida och spara den som textström.
Process(Page, string) Utför någon operation på den givna sidan och sparar resultat i filen.

Anmärkningar

DenTextDevice objekt används i princip för att extrahera text från pdf-sida.

Exempel

Exemplet visar hur man extraherar text på den första PDF-dokumentsidan.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // skapa textenhet
    TextDevice device = new TextDevice();

    // konvertera sidan och spara text i strömmen
    device.Process(doc.Pages[1], ms);

    // använd den extraherade texten
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Se även