TextDevice

TextDevice class

Pdf belge sayfalarını metne dönüştürmek için sınıfı temsil eder.

public sealed class TextDevice : PageDevice

yapıcılar

İsimTanım
TextDevice()Yeni bir örneğini başlatırTextDevice Ham metin biçimlendirme modu ve Unicode metin kodlaması ile.
TextDevice(Encoding)Yeni bir örneğini başlatırTextDevice belirtilen kodlama için.
TextDevice(TextExtractionOptions)Yeni bir örneğini başlatırTextDevice metin çıkarma seçenekleriyle.
TextDevice(TextExtractionOptions, Encoding)Yeni bir örneğini başlatırTextDevice metin çıkarma seçenekleriyle belirtilen kodlama için.

Özellikleri

İsimTanım
Encoding { get; set; }Ayıklanan metnin kodlamasını alır veya ayarlar.
ExtractionOptions { get; set; }Metin çıkarma seçeneklerini alır veya ayarlar.

yöntemler

İsimTanım
override Process(Page, Stream)Sayfayı dönüştürün ve metin akışı olarak kaydedin.
Process(Page, string)Verilen sayfada bazı işlemler gerçekleştirir ve sonuçları dosyaya kaydeder.

Notlar

TextDevice nesne temel olarak pdf sayfasından metin çıkarmak için kullanılır.

Örnekler

Örnek, metnin ilk PDF belgesi sayfasından nasıl çıkarılacağını gösterir.

Document doc = new Document(inFile);
string extractedText;

using (MemoryStream ms = new MemoryStream())
{
    // metin aygıtı oluştur
    TextDevice device = new TextDevice();

    // sayfayı dönüştür ve metni akışa kaydet
    device.Process(doc.Pages[1], ms);

    // ayıklanan metni kullan
    ms.Close();
    extractedText = Encoding.Unicode.GetString(ms.ToArray());
}

Ayrıca bakınız