TextDevice
Innehåll
[
Dölj
]TextDevice class
Representerar klass för att konvertera pdf-dokumentsidor till text.
public sealed class TextDevice : PageDevice
Konstruktörer
namn | Beskrivning |
---|---|
TextDevice() | Initierar en ny instans avTextDevice med formateringsläget för råtext och Unicode-textkodning. |
TextDevice(Encoding) | Initierar en ny instans avTextDevice för den angivna kodningen. |
TextDevice(TextExtractionOptions) | Initierar en ny instans avTextDevice med alternativ för textextrahering. |
TextDevice(TextExtractionOptions, Encoding) | Initierar en ny instans avTextDevice för den angivna kodningen med textextraheringsalternativ. |
Egenskaper
namn | Beskrivning |
---|---|
Encoding { get; set; } | Hämtar eller ställer in kodning av extraherad text. |
ExtractionOptions { get; set; } | Hämtar eller ställer in alternativ för textextraktion. |
Metoder
namn | Beskrivning |
---|---|
override Process(Page, Stream) | Konvertera sida och spara den som textström. |
Process(Page, string) | Utför någon operation på den givna sidan och sparar resultat i filen. |
Anmärkningar
DenTextDevice
objekt används i princip för att extrahera text från pdf-sida.
Exempel
Exemplet visar hur man extraherar text på den första PDF-dokumentsidan.
Document doc = new Document(inFile);
string extractedText;
using (MemoryStream ms = new MemoryStream())
{
// skapa textenhet
TextDevice device = new TextDevice();
// konvertera sidan och spara text i strömmen
device.Process(doc.Pages[1], ms);
// använd den extraherade texten
ms.Close();
extractedText = Encoding.Unicode.GetString(ms.ToArray());
}
Se även
- class PageDevice
- namnutrymme Aspose.Pdf.Devices
- hopsättning Aspose.PDF