TextDevice
İçindekiler
[
Saklamak
]TextDevice class
Pdf belge sayfalarını metne dönüştürmek için sınıfı temsil eder.
public sealed class TextDevice : PageDevice
yapıcılar
İsim | Tanım |
---|---|
TextDevice() | Yeni bir örneğini başlatırTextDevice Ham metin biçimlendirme modu ve Unicode metin kodlaması ile. |
TextDevice(Encoding) | Yeni bir örneğini başlatırTextDevice belirtilen kodlama için. |
TextDevice(TextExtractionOptions) | Yeni bir örneğini başlatırTextDevice metin çıkarma seçenekleriyle. |
TextDevice(TextExtractionOptions, Encoding) | Yeni bir örneğini başlatırTextDevice metin çıkarma seçenekleriyle belirtilen kodlama için. |
Özellikleri
İsim | Tanım |
---|---|
Encoding { get; set; } | Ayıklanan metnin kodlamasını alır veya ayarlar. |
ExtractionOptions { get; set; } | Metin çıkarma seçeneklerini alır veya ayarlar. |
yöntemler
İsim | Tanım |
---|---|
override Process(Page, Stream) | Sayfayı dönüştürün ve metin akışı olarak kaydedin. |
Process(Page, string) | Verilen sayfada bazı işlemler gerçekleştirir ve sonuçları dosyaya kaydeder. |
Notlar
TextDevice
nesne temel olarak pdf sayfasından metin çıkarmak için kullanılır.
Örnekler
Örnek, metnin ilk PDF belgesi sayfasından nasıl çıkarılacağını gösterir.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// metin aygıtı oluştur
TextDevice device = new TextDevice();
// sayfayı dönüştür ve metni akışa kaydet
device.Process(doc.Pages[1], ms);
// ayıklanan metni kullan
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
Ayrıca bakınız
- class PageDevice
- ad alanı Aspose.Pdf.Devices
- toplantı Aspose.PDF