Vurgulanan Metni PDF Dosyasından Çıkart
Vurgulanan metni PDF dosyasından çıkarmak için Aspose.PDF for .NET API’sini kullanabilirsiniz. Bu API, bir belgede vurgulanan tüm metni almanın basit bir yolunu sağlar.
1. Adım: PDF belgesini yükleyin
PDF dosyasında vurgulanan metni çıkarmanın ilk adımı, belgeyi Aspose.PDF for .NET API’sini kullanarak yüklemektir. Bunu, yeni bir örneğini oluşturarak yapabilirsiniz.Document
sınıf ve PDF belgesinin yolunu parametre olarak geçirmek.
// Belgeler dizininin yolu.
string dataDir ="YOUR DOCUMENT DIRECTORY";
Document doc = new Document(dataDir + "ExtractHighlightedText.pdf");
2. Adım: Tüm ek açıklamalar arasında geçiş yapın
Bir sonraki adım, PDF belgesindeki tüm ek açıklamalar arasında geçiş yapmaktır. Bunu bir kullanarak yapabilirsinizforeach
döngü, şöyle:
foreach (Annotation annotation in doc.Pages[1].Annotations)
{
// Kod buraya gelecek
}
3. Adım: Metin işaretleme ek açıklamalarını filtreleyin
İçindeforeach
döngüsünde, metin işaretleme ek açıklamaları olmayan tüm ek açıklamaları filtrelemeniz gerekecektir. Ek açıklamanın bir örneği olup olmadığını kontrol ederek bunu yapabilirsiniz.TextMarkupAnnotation
sınıf.
if (annotation is TextMarkupAnnotation)
{
// Kod buraya gelecek
}
4. Adım: Vurgulanan metin parçalarını alın
Tüm metin işaretleme ek açıklamalarını filtreledikten sonra, her ek açıklama için vurgulanan metin parçalarını alabilirsiniz. Bunu arayarak yapabilirsiniz.GetMarkedTextFragments()
konusundaki yöntemTextMarkupAnnotation
nesne.
TextMarkupAnnotation highlightedAnnotation = annotation as TextMarkupAnnotation;
TextFragmentCollection collection = highlightedAnnotation.GetMarkedTextFragments();
5. Adım: Vurgulanan metni görüntüleyin
Son olarak, vurgulanan metni kullanıcıya görüntüleyebilirsiniz. Bunu her biri arasında döngü yaparak yapabilirsiniz.TextFragment
içindeki nesneTextFragmentCollection
ve arayarakText
mülk.
foreach (TextFragment tf in collection)
{
Console.WriteLine(tf.Text);
}
Aspose.PDF for .NET kullanarak Vurgulanan Metni Çıkarma için örnek kaynak kodu
// Belgeler dizininin yolu.
string dataDir ="YOUR DOCUMENT DIRECTORY";
Document doc = new Document(dataDir + "ExtractHighlightedText.pdf");
foreach (Annotation annotation in doc.Pages[1].Annotations)
{
if (annotation is TextMarkupAnnotation)
{
TextMarkupAnnotation highlightedAnnotation = annotation as TextMarkupAnnotation;
TextFragmentCollection collection = highlightedAnnotation.GetMarkedTextFragments();
foreach (TextFragment tf in collection)
{
Console.WriteLine(tf.Text);
}
}
}
Çözüm
Bu eğitimde, Aspose.PDF for .NET kullanarak vurgulanan metni bir PDF belgesinden nasıl çıkaracağımızı araştırdık. Geliştiriciler, adım adım kılavuzu izleyerek ve sağlanan C# kaynak kodunu kullanarak, PDF belgelerindeki vurgulanan metni kolayca çıkarabilir ve yönetebilir.
PDF dosyasında vurgulanan metni ayıklamak için SSS
S: PDF belgesindeki metin işaretleme açıklamaları nedir?
C: Metin işaretleme ek açıklamaları, bir PDF belgesindeki belirli metni vurgulayan veya işaretleyen ek açıklamalardır. Metin işaretleme ek açıklamalarına örnek olarak vurgulamalar, alt çizgiler ve üstü çizili çizgiler verilebilir.
S: Aspose.PDF for .NET’i kullanarak diğer açıklama türlerinden metin çıkarabilir miyim?
C: Evet, Aspose.PDF for .NET, metin işaretleme ek açıklamaları, serbest metin ek açıklamaları ve daha fazlası dahil olmak üzere farklı türdeki ek açıklamalardan metin çıkarmak için çeşitli yöntemler sağlar.
S: Aspose.PDF for .NET, parola korumalı PDF dosyalarından metin çıkarmayı destekliyor mu?
C: Evet, Aspose.PDF for .NET, parola korumalı PDF dosyalarından metin çıkarmayı destekler. PDF belgesini kullanarak yüklerken doğru şifreyi girmeniz gerekir.Document
sınıf.
S: Vurgulanan metni renk veya yazar gibi diğer ölçütlere göre filtreleyebilir miyim?
C: Evet, vurgulanan metni renk, yazar veya oluşturulma tarihi gibi diğer kriterlere göre filtreleyebilirsiniz. Aspose.PDF for .NET, özelliklerine göre açıklamalara erişmek ve bunları filtrelemek için yöntemler sağlar.
S: Çıkarılan vurgulanan metni ayrı bir dosyaya kaydetmek mümkün mü?
C: Evet, çıkarılan vurgulanan metni ayrı bir dosyaya kaydedebilir veya daha ileri işlemler veya analizler için bir veri yapısında saklayabilirsiniz.