TextAbsorber

TextAbsorber class

Rappresenta un oggetto assorbitore di un testo. Esegue l’estrazione del testo e fornisce l’accesso al risultato tramiteText oggetto.

public class TextAbsorber

Costruttori

NomeDescrizione
TextAbsorber()Inizializza una nuova istanza diTextAbsorber .
TextAbsorber(TextExtractionOptions)Inizializza una nuova istanza diTextAbsorber con opzioni di estrazione.
TextAbsorber(TextSearchOptions)Inizializza una nuova istanza diTextAbsorber con opzioni di ricerca di testo.
TextAbsorber(TextExtractionOptions, TextSearchOptions)Inizializza una nuova istanza diTextAbsorber con opzioni di estrazione e ricerca di testo.

Proprietà

NomeDescrizione
Errors { get; }Elenco diTextExtractionError oggetti. Contiene informazioni sugli errori trovati durante l’estrazione del testo. La ricerca degli errori verrà eseguita solo se TextSearchOptions.LogTextExtractionErrors = true; E potrebbe ridurre le prestazioni.
virtual ExtractionOptions { get; set; }Ottiene o imposta le opzioni di estrazione del testo.
HasErrors { get; }Il valore indica se sono stati trovati errori durante l’estrazione del testo. La ricerca degli errori verrà eseguita solo se TextSearchOptions.LogTextExtractionErrors = true; E potrebbe ridurre le prestazioni.
virtual Text { get; }Ottiene il testo estratto che ilTextAbsorber estratti nel documento o nella pagina PDF.
virtual TextSearchOptions { get; set; }Ottiene o imposta le opzioni di ricerca del testo.

Metodi

NomeDescrizione
virtual Visit(Document)Estrae il testo sul documento specificato
virtual Visit(Page)Estrae il testo nella pagina specificata
virtual Visit(XForm)Estrae il testo sull’XForm specificato.

Osservazioni

IlTextAbsorber oggetto viene utilizzato per estrarre il testo da un documento Pdf o dalla pagina del documento.

Esempi

L’esempio mostra come estrarre il testo sulla prima pagina del documento PDF.

// Crea un oggetto TextFragmentAbsorber per trovare tutte le occorrenze di testo "hello world".
Document doc = new Document(inFile);

// Accetta l'assorbitore per la prima pagina
TextAbsorber absorber = new TextAbsorber();

// Modifica il carattere della prima occorrenza del testo
doc.Pages[1].Accept(absorber);

// Salva documento
string extractedText = absorber.Text;

Guarda anche