Class TextDevice

Clase TextDevice

Representa una clase para convertir páginas de documentos pdf en texto.

public sealed class TextDevice : PageDevice

Constructores

NombreDescripción
TextDevice()Inicializa una nueva instancia de TextDevice con el modo de formato de texto sin procesar y codificación de texto Unicode.
TextDevice(Encoding)Inicializa una nueva instancia de TextDevice para la codificación especificada.
TextDevice(TextExtractionOptions)Inicializa una nueva instancia de TextDevice con opciones de extracción de texto.
TextDevice(TextExtractionOptions, Encoding)Inicializa una nueva instancia de TextDevice para la codificación especificada con opciones de extracción de texto.

Propiedades

NombreDescripción
Encoding { get; set; }Obtiene o establece la codificación del texto extraído.
ExtractionOptions { get; set; }Obtiene o establece las opciones de extracción de texto.

Métodos

NombreDescripción
override Process(Page, Stream)Convierte la página y la guarda como un flujo de texto.
Process(Page, string)Realiza alguna operación en la página dada y guarda los resultados en el archivo.

Observaciones

El objeto TextDevice se utiliza básicamente para extraer texto de la página pdf.

Ejemplos

El ejemplo demuestra cómo extraer texto en la primera página del documento PDF.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // create text device
    TextDevice device = new TextDevice();

    // convert the page and save text to the stream
    device.Process(doc.Pages[1], ms);

    // use the extracted text
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Véase también