HtmlSaveOptions

HtmlSaveOptions class

Speicheroptionen für den Export in das HTML-Format

public class HtmlSaveOptions : UnifiedSaveOptions, IPageSetOptions, IPipelineOptions

Konstrukteure

NameBeschreibung
HtmlSaveOptions()Initialisiert eine neue Instanz vonHtmlSaveOptions Klasse.
HtmlSaveOptions(bool)Initialisiert eine neue Instanz vonHtmlSaveOptions Klasse.
HtmlSaveOptions(HtmlDocumentType)Initialisiert eine neue Instanz vonHtmlSaveOptions Klasse.
HtmlSaveOptions(HtmlDocumentType, bool)Initialisiert eine neue Instanz vonHtmlSaveOptions Klasse.

Eigenschaften

NameBeschreibung
BatchSize { get; set; }Definiert die Stapelgröße, wenn eine Stapelkonvertierung anwendbar ist in ein Paar aus Quell- und Zielformaten.
CloseResponse { get; set; }Ruft einen booleschen Wert ab oder legt ihn fest, der angibt, dass das Antwortobjekt geschlossen wird, nachdem das Dokument in der Antwort gespeichert wurde.
CompressSvgGraphicsIfAny { get; set; }Holt oder setzt das Flag, das angibt, ob gefundene SVG-Grafiken (falls vorhanden) beim Speichern in das SVGZ-Format komprimiert (gezippt) werden
ConvertMarkedContentToLayers { get; set; }Wenn das Attribut „ConvertMarkedContentToLayers“ auf „true“ gesetzt ist, werden alle Elemente in einem PDF mit „marked “-Inhalt (Ebene) in ein HTML-Div mit dem „data-pdflayer“-Attribut eingefügt, das einen Ebenennamen angibt. Dieser Ebenenname wird aus optionalen PDF-Eigenschaften extrahiert markierter Inhalt. Wenn dieses Attribut falsch ist (standardmäßig), werden keine Ebenen aus markiertem PDF-Inhalt erstellt.
DefaultFontName { get; set; }Gibt den Namen einer installierten Schriftart an, die verwendet wird, um jede Dokumentschriftart zu ersetzen, die nicht eingebettet und nicht im System installiert ist. Wenn null, dann wird die Standard-Substitutionsschriftart verwendet.
DocumentType { get; set; }Ruft ab oder setzt dieHtmlDocumentType .
ExplicitListOfSavedPages { get; set; }Mit dieser Eigenschaft können Sie explizit festlegen, welche Seiten des Dokuments konvertiert werden sollen. Seiten in dieser Liste müssen 1-basierte Nummern haben. Dh gültige Seitenzahlen müssen aus dem Bereich (1…[NumberOfPagesInConvertedDocument]) Reihenfolge des Erscheinens der Seiten in dieser Liste hat keinen Einfluss auf ihre Reihenfolge in der/den Ergebnis-HTML-Seite(n) - in Ergebnisseiten werden immer der Reihe nach angezeigt in denen sie im Quell-PDF vorhanden sind. Wenn diese Liste null ist (wie es standardmäßig der Fall ist), werden alle Seiten konvertiert. Wenn eine Seitenzahl dieser Liste außerhalb des Bereichs der vorhandenen Seiten liegt (1-[ Die Ausnahme amountOfPagesInDocument]) wird ausgelöst.
ExtractOcrSublayerOnly { get; set; }Dieses Attribut aktiviert die Funktionalität zum Extrahieren von Bild oder Text für PDF-Dokumente mit OCR-Unterebene.
FixedLayout { get; set; }Ruft einen Wert ab oder legt einen Wert fest, der angibt, ob dieser HTML-Code als festes Layout erstellt wird.
FlowLayoutParagraphFullWidth { get; set; }Dieses Attribut gibt Absatztext in voller Breite für den Fließmodus an, FixedLayout = false
FontSources { get; }Schriftartquellen von vorgespeicherten Schriftarten.
ImageResolution { get; set; }Ruft die Auflösung für die Bildwiedergabe ab oder legt sie fest.
MinimalLineWidth { get; set; }Dieses Attribut legt die Mindestbreite der Grafikpfadlinie fest. Wenn die Linienstärke weniger als 1 Pixel beträgt, rundet Adobe Acrobat sie auf diesen Wert. Daher kann dieses Attribut verwendet werden, um dieses Verhalten für HTML-Browser zu emulieren.
PreventGlyphsGrouping { get; set; }Dieses Attribut schaltet den Modus ein, in dem Textglyphen nicht in Wörter und Zeichenketten gruppiert werden Dieser Modus ermöglicht es, maximale Präzision bei der Positionierung von Glyphen auf der Seite beizubehalten und kann für Konvertierungsdokumente mit Musiknoten oder Glyphen verwendet werden, die separat platziert werden sollten einander. Dieser Parameter wird nur dann auf das Dokument angewendet, wenn der Wert des FixedLayout-Attributs wahr ist.
RenderTextAsImage { get; set; }Wenn das Attribut RenderTextAsImage auf „true“ gesetzt ist, wird der Text aus der Quelle zu einem Bild in HTML. Kann nützlich sein, um Text nicht auswählbar zu machen oder HTML-Text wird nicht richtig gerendert.
SaveFormat { get; }Format der Datenspeicherung.
SimpleTextboxModeGrouping { get; set; }Dieses Attribut gibt eine sequenzielle Gruppierung von Glyphen und Wörtern in Zeichenfolgen an Beispielsweise haben Tags und Wörter in konvertiertem HTML eine andere Reihenfolge und Sie möchten, dass sie übereinstimmen. Dieser Parameter wird nur dann auf das Dokument angewendet, wenn der Wert des FixedLayout-Attributs wahr ist.
SplitCssIntoPages { get; set; }Wenn der Mehrseitenmodus ausgewählt ist (dh ‘SplitIntoPages’ ist ’true’), dann definiert dieses Attribut, ob eine separate CSS-Datei für jede HTML-Ergebnisseite erstellt werden soll. Standardmäßig ist dieses Attribut falsch, also wird eine erstellt großes gemeinsames CSS für alle erstellten Seiten. Zusammenfassende Größe aller CSS, die in diesem Modus generiert werden (ein CSS pro Seite), normalerweise viel größer als die Größe einer großen CSS-Datei, da in früheren Fällen CSS-Klassen Duplikate in solchen Fällen in mehreren CSS-Dateien für jede Seite sind. So, das hier Es ist schlechter, die Einstellung nur dann zu verwenden, wenn Sie daran interessiert sind, jede HTML-Seite unabhängig voneinander zu verarbeiten, und daher die Größe des CSS für jede Seite, die auseinander genommen wird, das kritischste Problem ist.
SplitIntoPages { get; set; }Ruft oder setzt das Flag, das angibt, ob jede Seite des Quelldokuments in ihr eigenes Ziel-HTML-Dokument konvertiert wird, dh ob das HTML-Ergebnis in mehrere HTML-Seiten aufgeteilt wird.
UseZOrder { get; set; }Wenn das Attribut UseZORder auf true gesetzt ist, werden Grafiken und Text dem resultierenden HTML-Dokument entsprechend der Z-Reihenfolge im ursprünglichen PDF-Dokument hinzugefügt. Wenn dieses Attribut falsch ist, werden alle Grafiken als einzelne Ebene platziert, was einige unnötige Effekte für überlappende Objekte verursachen kann.
WarningHandler { get; set; }Rückruf zur Behandlung von generierten Warnungen. Der WarningHandler gibt das ReturnAction-Aufzählungselement zurück, das entweder Continue oder Abort angibt. Continue ist die Standardaktion und der Speichervorgang wird fortgesetzt, der Benutzer kann jedoch auch Abbrechen zurückgeben, in diesem Fall sollte der Speichervorgang beendet werden.

Felder

NameBeschreibung
AntialiasingProcessingDieser Parameter definiert erforderliche Antialiasing-Maßnahmen bei der Konvertierung zusammengesetzter Hintergrundbilder von PDF nach HTML
CssClassNamesPrefixWenn der PDF-zu-HTML-Konverter Ergebnis-CSSs generiert, werden CSS-Klassennamen (etwas wie „.stl_01 {}“ … „.stl_NN {}) generiert und im Ergebnis-CSS verwendet wollen, dass alle Klassennamen mit ‘my_prefix_’ beginnen (also so etwas wie ‘my_prefix_1’ … ‘my_prefix_NNN’ ) , dann weisen Sie dieser Property vor der Konvertierung einfach ‘my_prefix_’ zu. Wenn diese Property unverändert bleibt (also null wird als Wert belassen), dann generiert der Konverter selbst Klassennamen (es wird so etwas wie “.stl_01 {}” … “.stl_NN {}”) sein
CustomCssSavingStrategyDieses Feld kann eine Speicherstrategie enthalten, die (falls vorhanden) während der Konvertierung von Pdf in Html verwendet werden muss, um das Speichern von CSS-Dateien im Zusammenhang mit dem erstellten HTML-Dokument als Ganzes oder mit seinen Seiten (wenn mehrere HTML-Seiten generiert werden) zu handhaben, wenn Sie möchten Behandeln Sie die CSS-Datei auf eine bestimmte Weise, erstellen Sie einfach die relevante Methode und weisen Sie dieser Eigenschaft einen daraus erstellten Delegaten zu.
CustomHtmlSavingStrategyDas Ergebnis der Konvertierung kann eine oder mehrere HTML-Seiten enthalten Sie können dieser Eigenschaft einen Delegaten zuweisen, der aus einer benutzerdefinierten Methode erstellt wurde, die die Verarbeitung einer HTML-Seite (genauer gesagt - Markup-HTML, ohne externe verknüpfte Dateien, falls vorhanden) implementiert wurde während der Konvertierung erstellt. In diesem Fall kann die Verarbeitung (wie das Speichern des HTML-Codes der Seite im Stream oder auf der Festplatte) in diesem benutzerdefinierten Code erfolgen. In diesem Fall müssen alle notwendigen Aktionen zum Speichern der HTML-Seite im Code der bereitgestellten Methode durchgeführt werden , da das Speichern des Ergebnisses im Code des Konverters nicht verwendet wird. Wenn die Verarbeitung für diesen oder jenen Fall aus irgendeinem Grund vom Konvertercode selbst durchgeführt werden muss, nicht im benutzerdefinierten Code, setzen Sie bitte im benutzerdefinierten Code das Flag ‘CustomProcessingCancelled’ der Variable des ‘htmlSavingInfo’-Parameters: Es wird dem Konverter signalisieren, dass dies alles der Fall ist notwendige Schritte zur Verarbeitung dieser Ressource müssen im Konverter selbst auf dieselbe Weise ausgeführt werden, als gäbe es keinen externen benutzerdefinierten Code zur Verarbeitung .
CustomProgressHandlerDieser Handler kann verwendet werden, um Konvertierungsfortschrittsereignisse zu verarbeiten z. B. kann er verwendet werden, um Fortschrittsbalken oder Meldungen über die aktuelle Menge verarbeiteter Seiten anzuzeigen.
CustomResourceSavingStrategyDieses Feld kann die Speicherstrategie enthalten, die (falls vorhanden) während der Konvertierung für die angepasste Handhabung von erstellten referenzierten Ressourcen -Dateien (wie Bilder und Schriftarten) in Bezug auf Knoten von gespeichertem HTML verwendet werden muss. Diese Strategie muss Ressourcen verarbeiten und die Zeichenfolge zurückgeben stellt die gewünschte URL der gespeicherten Ressource in generiertem HTML dar.
CustomStrategyOfCssUrlCreationDieses Feld kann eine benutzerdefinierte Methode enthalten, die eine URL (oder URL-Vorlage, wenn die Generierung mehrerer Seiten aktiviert ist - siehe Details unten) von subject CSS zurückgibt, da es in das generierte HTML-Ergebnis eingefügt werden sollte. CSS-Dateiname in generiertes CSS, dann sollten Sie einfach method erstellen und in diese Eigenschaft einfügen, die die gewünschte URL generiert. Wenn das Flag ‘SplitCssIntoPages’ gesetzt ist, dann muss diese benutzerdefinierte Strategie (falls vorhanden) nicht die exakte URL des CSS zurückgeben, sondern eher die Vorlage string that (nach Ersetzen des Platzhalters durch die Seitenzahl durch die Funktion string.Format() im Konverter) kann in eine URL für die CSS-URL dieser oder jener Seite aufgelöst werden. Beispiele für erwartete Rückgabezeichenfolgen in einem solchen Fall sind: ‘SomeTargetLocation-page_{0}.css’,’../PartHandlers/GetCss.aspx?DocumentId=45654&CssPage={0}’)
ExcludeFontNameListListe der in PDF eingebetteten Schriftartnamen, die nicht in HTML eingebettet sind.
FontEncodingStrategyDefiniert eine spezielle Codierungsregel, um die PDF-Decodierung für das aktuelle Dokument zu optimieren
FontSavingModeDefiniert den Schriftartspeichermodus, der beim Speichern von PDF im gewünschten Format verwendet wird
HtmlMarkupGenerationModeManchmal sind spezifische Anforderungen an die Generierung von HTML-Markup vorhanden. Dieser Parameter definiert HTML-Vorbereitungsmodi, die während der Konvertierung von PDF in HTML verwendet werden können , um diese spezifischen Anforderungen zu erfüllen.
LettersPositioningMethodLegt den Modus der Positionierung von Buchstaben in Wörtern im Ergebnis fest HTML
PageBorderIfAnyDieses Attribut stellt eine Reihe von Einstellungen dar, die zum Zeichnen von Rändern (falls vorhanden) im HTML-Ergebnisdokument um den Bereich herum verwendet werden, der die PDF-Quellseite darstellt. Im Wesentlichen betrifft es die Anzeige der Papierkanten der Seite, nicht den Seitenrand, auf den in der PDF-Seite selbst verwiesen wird.
PageMarginIfAnyDieses Attribut stellt einen Satz zusätzlicher Seitenränder (falls vorhanden) im HTML-Ergebnisdokument um den Bereich dar, der die PDF-Quellseite darstellt.
PagesFlowTypeDependsOnViewersScreenSizeWenn das Attribut ‘SplitOnPages=false’ ist, dann wird der gesamte HTML-Code, der alle eingegebenen PDF-Seiten darstellt, in eine große Ergebnis-HTML-Datei gepackt. Dieses Flag definiert, ob Ergebnis-HTML so generiert wird, dass der Fluss von Bereichen, die PDF-Seiten im Ergebnis-HTML darstellen, von der Bildschirmauflösung des Viewers abhängt . Angenommen, die Breite des Bildschirms auf der Betrachterseite ist groß genug, um 2 oder mehr Seiten nebeneinander in horizontaler Richtung nebeneinander zu platzieren. Wenn dieses Flag auf wahr gesetzt ist, wird diese Gelegenheit verwendet (es werden so viele Seiten wie möglich in horizontaler Richtung nebeneinander angezeigt, dann wird die nächste horizontale Gruppe von Seiten unter der ersten angezeigt). Andernfalls fließen Seiten ein so: nächste Seite geht immer unter vorherige.
PartsEmbeddingModeEs definiert, ob referenzierte Dateien (HTML, Schriftarten, Bilder, CSS) in die Haupt-HTML-Datei eingebettet oder als getrennte Binäreinheiten generiert werden
RasterImagesSavingModeKonvertiertes PDF kann Rasterbilder enthalten Dieser Parameter definiert, wie sie bei der Konvertierung von PDF nach HTML behandelt werden sollen
RemoveEmptyAreasOnTopAndBottomDefiniert, ob im erstellten HTML der obere und untere leere Bereich ohne Inhalt (falls vorhanden) entfernt wird.
SaveFullFontGibt an, dass die vollständige Schriftart gespeichert wird, unterstützt nur TrueType-Schriftarten. Standardmäßig speichert SaveFullFont = false und der Konverter speichert die Teilmenge der anfänglichen Schriftart , die zum Anzeigen des Texts des Dokuments benötigt wird.
SaveShadowedTextsAsTransparentTextsPdf kann Texte enthalten, die von anderen Elementen (z. B. von Bildern) schattiert werden, aber kann in Acrobat Reader in die Zwischenablage ausgewählt werden (normalerweise passiert es, wenn Dokumente Bilder und daraus extrahierte OCRed-Texte enthalten). Diese Einstellungen teilen dem Konverter mit, ob wir müssen solche Texte als transparente auswählbare Texte im HTML-Ergebnis speichern, um das Verhalten von Acrobat Reader nachzuahmen (ansonsten werden solche Texte normalerweise versteckt gespeichert und können nicht in die Zwischenablage kopiert werden)
SaveTransparentTextsPdf kann transparente Texte enthalten, die in der Zwischenablage ausgewählt werden können (normalerweise geschieht dies, wenn das Dokument Bilder und daraus extrahierte OCRed-Texte enthält). Diese Einstellung teilt dem Konverter mit, ob wir solche Texte als transparente auswählbare Texte im Ergebnis HTML speichern müssen
SpecialFolderForAllImagesErmittelt oder setzt den Pfad zum Verzeichnis, in dem alle Bilder gespeichert werden müssen, wenn sie beim Speichern des Dokuments als HTML angetroffen werden. Wenn der Parameter leer oder null ist, werden Bilddateien (falls vorhanden) zusammen mit anderen Dateien gespeichert, die mit HTML verknüpft sind. Es hat keinen Einfluss, wenn die CustomImageSavingStrategy -Eigenschaft erfolgreich verwendet wurde, um die relevante Bilddatei zu verarbeiten.
SpecialFolderForSvgImagesErmittelt oder setzt den Pfad zum Verzeichnis, in das nur SVG-Bilder gespeichert werden dürfen, wenn sie beim Speichern des Dokuments als HTML gefunden werden. Wenn der Parameter leer oder null ist, werden SVG-Dateien (falls vorhanden) zusammen mit anderen Bilddateien (in der Nähe der Ausgabedatei) oder in einem speziellen Ordner für Bilder gespeichert (wenn dies in der Option SpecialImagesFolderIfAny angegeben ist). Dies hat keinen Einfluss wenn die Eigenschaft CustomImageSavingStrategy erfolgreich verwendet wurde, um die relevante Bilddatei zu verarbeiten.
TryMergeAdjacentSameBackgroundImagesManchmal enthalten PDFs Hintergrundbilder (von Seiten oder Tabellenzellen) die aus mehreren, nebeneinander angeordneten, gleichen Hintergrundbildern bestehen. In solchen Fällen erzeugen Renderer von Zielformaten (z. B. MsWord für DOCS-Format) manchmal sichtbare Grenzen zwischen Teilen von Hintergrundbildern , weil sich ihre Techniken der Bildkantenglättung (Anti-Aliasing) von Acrobat Reader unterscheiden. Wenn es so aussieht, als ob das exportierte Dokument solche sichtbaren Grenzen zwischen Teilen derselben Hintergrundbilder enthält, versuchen Sie bitte, diese Einstellung zu verwenden, um davon zu befreien unerwünschte Wirkung. ACHTUNG! Diese Qualitätsoptimierung verlangsamt normalerweise die Konvertierung erheblich, also verwenden Sie diese Option bitte nur, wenn es wirklich notwendig ist.
TrySaveTextUnderliningAndStrikeoutingInCssPDF selbst enthält keine Unterstreichungszeichen für Texte. Es wird mit einer Linie unter dem Text emuliert. Diese Option ermöglicht es dem Konverter, zu erraten, dass diese oder jene Linie die Unterstreichung eines Textes ist und diese Informationen in CSS einzufügen, anstatt sie grafisch zu unterstreichen

Siehe auch