TextAbsorber

TextAbsorber class

Bir metnin emici nesnesini temsil eder. Metin çıkarma işlemini gerçekleştirir ve sonuca şu yolla erişim sağlar:Text nesne.

public class TextAbsorber

yapıcılar

İsimTanım
TextAbsorber()Yeni bir örneğini başlatırTextAbsorber .
TextAbsorber(TextExtractionOptions)Yeni bir örneğini başlatırTextAbsorber çıkarma seçenekleriyle.
TextAbsorber(TextSearchOptions)Yeni bir örneğini başlatırTextAbsorber metin arama seçenekleriyle.
TextAbsorber(TextExtractionOptions, TextSearchOptions)Yeni bir örneğini başlatırTextAbsorber çıkarma ve metin arama seçenekleriyle.

Özellikleri

İsimTanım
Errors { get; }ListesiTextExtractionError nesneler. Metin çıkarma sırasında bulunan hatalarla ilgili bilgileri içerir. Hata arama, yalnızca TextSearchOptions.LogTextExtraksiyonErrors = true; Ve performansı düşürebilir.
virtual ExtractionOptions { get; set; }Metin çıkarma seçeneklerini alır veya ayarlar.
HasErrors { get; }Değer, metin çıkarma sırasında hataların bulunup bulunmadığını gösterir. Hata arama, yalnızca TextSearchOptions.LogTextExtraksiyonErrors = true; Ve performansı düşürebilir.
virtual Text { get; }TextAbsorber PDF belgesinden veya sayfasından alıntılar.
virtual TextSearchOptions { get; set; }Metin arama seçeneklerini alır veya ayarlar.

yöntemler

İsimTanım
virtual Visit(Document)Belirtilen belgedeki metni çıkarır
virtual Visit(Page)Belirtilen sayfadaki metni çıkarır
virtual Visit(XForm)Belirtilen XForm’daki metni ayıklar.

Notlar

TextAbsorber nesne, bir Pdf belgesinden veya belgenin sayfasından metin çıkarmak için kullanılır.

Örnekler

Örnek, metnin ilk PDF belgesi sayfasından nasıl çıkarılacağını gösterir.

// belgeyi aç
Document doc = new Document(inFile);

// metni çıkarmak için TextAbsorber nesnesi oluştur
TextAbsorber absorber = new TextAbsorber();

// ilk sayfa için emiciyi kabul et
doc.Pages[1].Accept(absorber);

// ayıklanan metni al
string extractedText = absorber.Text;

Ayrıca bakınız