TextDevice

TextDevice class

Representa la clase para convertir páginas de documentos PDF en texto.

public sealed class TextDevice : PageDevice

Constructores

NombreDescripción
TextDevice()Inicializa una nueva instancia delTextDevice con el modo de formato de texto sin formato y codificación de texto Unicode.
TextDevice(Encoding)Inicializa una nueva instancia delTextDevice para la codificación especificada.
TextDevice(TextExtractionOptions)Inicializa una nueva instancia delTextDevice con opciones de extracción de texto.
TextDevice(TextExtractionOptions, Encoding)Inicializa una nueva instancia delTextDevice para la codificación especificada con opciones de extracción de texto.

Propiedades

NombreDescripción
Encoding { get; set; }Obtiene o establece la codificación del texto extraído.
ExtractionOptions { get; set; }Obtiene o establece opciones de extracción de texto.

Métodos

NombreDescripción
override Process(Page, Stream)Convertir página y guardarla como flujo de texto.
Process(Page, string)Realiza alguna operación en la página dada y guarda los resultados en el archivo.

Observaciones

ElTextDevice El objeto se usa básicamente para extraer texto de la página PDF.

Ejemplos

El ejemplo muestra cómo extraer texto en la primera página del documento PDF.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // crear dispositivo de texto
    TextDevice device = new TextDevice();

    // convertir la página y guardar el texto en la secuencia
    device.Process(doc.Pages[1], ms);

    // usa el texto extraído
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Ver también