TextDevice

TextDevice class

Représente la classe pour convertir des pages de document pdf en texte.

public sealed class TextDevice : PageDevice

Constructeurs

NomLa description
TextDevice()Initialise une nouvelle instance duTextDevice avec le mode Formatage du texte brut et l’encodage de texte Unicode.
TextDevice(Encoding)Initialise une nouvelle instance duTextDevice pour le codage spécifié.
TextDevice(TextExtractionOptions)Initialise une nouvelle instance duTextDevice avec options d’extraction de texte.
TextDevice(TextExtractionOptions, Encoding)Initialise une nouvelle instance duTextDevice pour l’encodage spécifié avec les options d’extraction de texte.

Propriétés

NomLa description
Encoding { get; set; }Obtient ou définit l’encodage du texte extrait.
ExtractionOptions { get; set; }Obtient ou définit les options d’extraction de texte.

Méthodes

NomLa description
override Process(Page, Stream)Convertissez la page et enregistrez-la en tant que flux de texte.
Process(Page, string)Effectue une opération sur la page donnée et enregistre les résultats dans le fichier.

Remarques

LeTextDevice l’objet est essentiellement utilisé pour extraire du texte d’une page pdf.

Exemples

L’exemple montre comment extraire du texte sur la première page du document PDF.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // crée un périphérique texte
    TextDevice device = new TextDevice();

    // convertit la page et enregistre le texte dans le flux
    device.Process(doc.Pages[1], ms);

    // utilise le texte extrait
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Voir également