TextAbsorber
Contenido
[
Ocultar
]TextAbsorber class
Representa un objeto absorbente de un texto. Realiza la extracción de texto y proporciona acceso al resultado a través deText
objeto.
public class TextAbsorber
Constructores
Nombre | Descripción |
---|---|
TextAbsorber() | Inicializa una nueva instancia delTextAbsorber . |
TextAbsorber(TextExtractionOptions) | Inicializa una nueva instancia delTextAbsorber con opciones de extracción. |
TextAbsorber(TextSearchOptions) | Inicializa una nueva instancia delTextAbsorber con opciones de búsqueda de texto. |
TextAbsorber(TextExtractionOptions, TextSearchOptions) | Inicializa una nueva instancia delTextAbsorber con opciones de extracción y búsqueda de texto. |
Propiedades
Nombre | Descripción |
---|---|
Errors { get; } | Lista deTextExtractionError objetos. Contiene información sobre errores encontrados durante la extracción de texto. La búsqueda de errores se realizará solo si TextSearchOptions.LogTextExtractionErrors = true; Y puede disminuir el rendimiento. |
virtual ExtractionOptions { get; set; } | Obtiene o establece opciones de extracción de texto. |
HasErrors { get; } | El valor indica si se encontraron errores durante la extracción de texto. La búsqueda de errores se realizará solo si TextSearchOptions.LogTextExtractionErrors = true; Y puede disminuir el rendimiento. |
virtual Text { get; } | Obtiene el texto extraído que elTextAbsorber extractos en el documento o página PDF. |
virtual TextSearchOptions { get; set; } | Obtiene o establece opciones de búsqueda de texto. |
Métodos
Nombre | Descripción |
---|---|
virtual Visit(Document) | Extrae texto en el documento especificado |
virtual Visit(Page) | Extrae texto en la página especificada |
virtual Visit(XForm) | Extrae texto en el XForm especificado. |
Observaciones
ElTextAbsorber
El objeto se utiliza para extraer texto de un documento PDF o de la página del documento.
Ejemplos
El ejemplo muestra cómo extraer texto en la primera página del documento PDF.
// abrir documento
Document doc = new Document(inFile);
// crea un objeto TextAbsorber para extraer texto
TextAbsorber absorber = new TextAbsorber();
// aceptar el absorbedor para la primera página
doc.Pages[1].Accept(absorber);
// obtener el texto extraído
string extractedText = absorber.Text;
Ver también
- espacio de nombres Aspose.Pdf.Text
- asamblea Aspose.PDF