TextDevice

TextDevice class

Rappresenta la classe per la conversione di pagine di documenti pdf in testo.

public sealed class TextDevice : PageDevice

Costruttori

NomeDescrizione
TextDevice()Inizializza una nuova istanza diTextDevice con la modalità di formattazione del testo non elaborato e la codifica del testo Unicode.
TextDevice(Encoding)Inizializza una nuova istanza diTextDevice per la codifica specificata.
TextDevice(TextExtractionOptions)Inizializza una nuova istanza diTextDevice con opzioni di estrazione del testo.
TextDevice(TextExtractionOptions, Encoding)Inizializza una nuova istanza diTextDevice per la codifica specificata con opzioni di estrazione del testo.

Proprietà

NomeDescrizione
Encoding { get; set; }Ottiene o imposta la codifica del testo estratto.
ExtractionOptions { get; set; }Ottiene o imposta le opzioni di estrazione del testo.

Metodi

NomeDescrizione
override Process(Page, Stream)Converti la pagina e salvala come flusso di testo.
Process(Page, string)Esegue alcune operazioni sulla pagina data e salva i risultati nel file.

Osservazioni

IlTextDevice l’oggetto è fondamentalmente utilizzato per estrarre il testo dalla pagina pdf.

Esempi

L’esempio mostra come estrarre il testo sulla prima pagina del documento PDF.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // aggiungi un altro segmento alla raccolta Segments del frammento di testo
    TextDevice device = new TextDevice();

    // crea un oggetto TextBuilder
    device.Process(doc.Pages[1], ms);

    // aggiunge il frammento di testo alla pagina Pdf
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Guarda anche