TextDevice
Contenuti
[
Nascondere
]TextDevice class
Rappresenta la classe per la conversione di pagine di documenti pdf in testo.
public sealed class TextDevice : PageDevice
Costruttori
Nome | Descrizione |
---|---|
TextDevice() | Inizializza una nuova istanza diTextDevice con la modalità di formattazione del testo non elaborato e la codifica del testo Unicode. |
TextDevice(Encoding) | Inizializza una nuova istanza diTextDevice per la codifica specificata. |
TextDevice(TextExtractionOptions) | Inizializza una nuova istanza diTextDevice con opzioni di estrazione del testo. |
TextDevice(TextExtractionOptions, Encoding) | Inizializza una nuova istanza diTextDevice per la codifica specificata con opzioni di estrazione del testo. |
Proprietà
Nome | Descrizione |
---|---|
Encoding { get; set; } | Ottiene o imposta la codifica del testo estratto. |
ExtractionOptions { get; set; } | Ottiene o imposta le opzioni di estrazione del testo. |
Metodi
Nome | Descrizione |
---|---|
override Process(Page, Stream) | Converti la pagina e salvala come flusso di testo. |
Process(Page, string) | Esegue alcune operazioni sulla pagina data e salva i risultati nel file. |
Osservazioni
IlTextDevice
l’oggetto è fondamentalmente utilizzato per estrarre il testo dalla pagina pdf.
Esempi
L’esempio mostra come estrarre il testo sulla prima pagina del documento PDF.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// aggiungi un altro segmento alla raccolta Segments del frammento di testo
TextDevice device = new TextDevice();
// crea un oggetto TextBuilder
device.Process(doc.Pages[1], ms);
// aggiunge il frammento di testo alla pagina Pdf
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
Guarda anche
- class PageDevice
- spazio dei nomi Aspose.Pdf.Devices
- assemblea Aspose.PDF