TextAbsorber

TextAbsorber class

Representa un objeto absorbente de un texto. Realiza la extracción de texto y proporciona acceso al resultado a través deText objeto.

public class TextAbsorber

Constructores

NombreDescripción
TextAbsorber()Inicializa una nueva instancia delTextAbsorber .
TextAbsorber(TextExtractionOptions)Inicializa una nueva instancia delTextAbsorber con opciones de extracción.
TextAbsorber(TextSearchOptions)Inicializa una nueva instancia delTextAbsorber con opciones de búsqueda de texto.
TextAbsorber(TextExtractionOptions, TextSearchOptions)Inicializa una nueva instancia delTextAbsorber con opciones de extracción y búsqueda de texto.

Propiedades

NombreDescripción
Errors { get; }Lista deTextExtractionError objetos. Contiene información sobre errores encontrados durante la extracción de texto. La búsqueda de errores se realizará solo si TextSearchOptions.LogTextExtractionErrors = true; Y puede disminuir el rendimiento.
virtual ExtractionOptions { get; set; }Obtiene o establece opciones de extracción de texto.
HasErrors { get; }El valor indica si se encontraron errores durante la extracción de texto. La búsqueda de errores se realizará solo si TextSearchOptions.LogTextExtractionErrors = true; Y puede disminuir el rendimiento.
virtual Text { get; }Obtiene el texto extraído que elTextAbsorber extractos en el documento o página PDF.
virtual TextSearchOptions { get; set; }Obtiene o establece opciones de búsqueda de texto.

Métodos

NombreDescripción
virtual Visit(Document)Extrae texto en el documento especificado
virtual Visit(Page)Extrae texto en la página especificada
virtual Visit(XForm)Extrae texto en el XForm especificado.

Observaciones

ElTextAbsorber El objeto se utiliza para extraer texto de un documento PDF o de la página del documento.

Ejemplos

El ejemplo muestra cómo extraer texto en la primera página del documento PDF.

// abrir documento
Document doc = new Document(inFile);

// crea un objeto TextAbsorber para extraer texto
TextAbsorber absorber = new TextAbsorber();

// aceptar el absorbedor para la primera página
doc.Pages[1].Accept(absorber);

// obtener el texto extraído
string extractedText = absorber.Text;

Ver también