Class TextDevice
Contenido
[
Ocultar
]Clase TextDevice
Representa una clase para convertir páginas de documentos pdf en texto.
public sealed class TextDevice : PageDevice
Constructores
Nombre | Descripción |
---|---|
TextDevice() | Inicializa una nueva instancia de TextDevice con el modo de formato de texto sin procesar y codificación de texto Unicode. |
TextDevice(Encoding) | Inicializa una nueva instancia de TextDevice para la codificación especificada. |
TextDevice(TextExtractionOptions) | Inicializa una nueva instancia de TextDevice con opciones de extracción de texto. |
TextDevice(TextExtractionOptions, Encoding) | Inicializa una nueva instancia de TextDevice para la codificación especificada con opciones de extracción de texto. |
Propiedades
Nombre | Descripción |
---|---|
Encoding { get; set; } | Obtiene o establece la codificación del texto extraído. |
ExtractionOptions { get; set; } | Obtiene o establece las opciones de extracción de texto. |
Métodos
Nombre | Descripción |
---|---|
override Process(Page, Stream) | Convierte la página y la guarda como un flujo de texto. |
Process(Page, string) | Realiza alguna operación en la página dada y guarda los resultados en el archivo. |
Observaciones
El objeto TextDevice
se utiliza básicamente para extraer texto de la página pdf.
Ejemplos
El ejemplo demuestra cómo extraer texto en la primera página del documento PDF.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// create text device
TextDevice device = new TextDevice();
// convert the page and save text to the stream
device.Process(doc.Pages[1], ms);
// use the extracted text
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
Véase también
- clase PageDevice
- espacio de nombres Aspose.Pdf.Devices
- ensamblado Aspose.PDF