HtmlSaveOptions

HtmlSaveOptions class

Enregistrer les options d’exportation au format Html

public class HtmlSaveOptions : UnifiedSaveOptions, IPageSetOptions, IPipelineOptions

Constructeurs

NomLa description
HtmlSaveOptions()Initialise une nouvelle instance duHtmlSaveOptions classe.
HtmlSaveOptions(bool)Initialise une nouvelle instance duHtmlSaveOptions classe.
HtmlSaveOptions(HtmlDocumentType)Initialise une nouvelle instance duHtmlSaveOptions classe.
HtmlSaveOptions(HtmlDocumentType, bool)Initialise une nouvelle instance duHtmlSaveOptions classe.

Propriétés

NomLa description
BatchSize { get; set; }Définit la taille du lot si la conversion par lots est applicable à la paire de formats source et destination.
CloseResponse { get; set; }Obtient ou définit une valeur booléenne qui indique que l’objet de réponse sera fermé après l’enregistrement du document dans la réponse.
CompressSvgGraphicsIfAny { get; set; }Obtient ou définit l’indicateur qui indique si les graphiques SVG trouvés (le cas échéant) seront compressés (zippés) au format SVGZ lors de l’enregistrement
ConvertMarkedContentToLayers { get; set; }Si l’attribut ConvertMarkedContentToLayers est défini sur true, tous les éléments d’un contenu PDF marqué (calque) seront placés dans une div HTML avec l’attribut “data-pdflayer” spécifiant un nom de calque. Ce nom de calque sera extrait des propriétés facultatives du PDF contenu marqué. Si cet attribut est faux (par défaut), aucune couche ne sera créée à partir du contenu marqué PDF.
DefaultFontName { get; set; }Spécifie le nom d’une police installée qui est utilisée pour remplacer toute police de document qui n’est pas intégrée et non installée dans le système. Si null, la police de substitution par défaut est utilisée.
DocumentType { get; set; }Obtient ou définit leHtmlDocumentType .
ExplicitListOfSavedPages { get; set; }Avec cette propriété, vous pouvez définir explicitement quelles pages du document doivent être converties. Les pages de cette liste doivent avoir des numéros en base 1. C’est-à-dire que nombres de pages valides doivent être pris dans la plage (1…[NumberOfPagesInConvertedDocument]) L’ordre d’apparition des pages dans cette liste n’affecte pas leur ordre dans la ou les pages HTML de résultat - dans les pages de résultat, elles iront toujours dans l’ordre dans lequel ils sont présents dans le PDF source. Si cette liste est nulle (comme c’est le cas par défaut), toutes les pages seront converties. Si un numéro de page de cette liste sortira de la plage des pages présentes (1-[ L’exception amountOfPagesInDocument]) sera levée.
ExtractOcrSublayerOnly { get; set; }Cet attribut a activé la fonctionnalité d’extraction d’image ou de texte pour les documents PDF avec sous-couche OCR.
FixedLayout { get; set; }Obtient ou définit une valeur indiquant si ce code HTML est créé en tant que mise en page fixe.
FlowLayoutParagraphFullWidth { get; set; }Cet attribut spécifie un texte de paragraphe pleine largeur pour le mode Flow, FixedLayout = false
FontSources { get; }Sources de polices de polices pré-enregistrées.
ImageResolution { get; set; }Obtient ou définit la résolution pour le rendu d’image.
MinimalLineWidth { get; set; }Cet attribut définit la largeur minimale de la ligne du chemin graphique. Si l’épaisseur de la ligne est inférieure à 1px, Adobe Acrobat l’arrondit à cette valeur. Cet attribut peut donc être utilisé pour émuler ce comportement pour les navigateurs HTML.
PreventGlyphsGrouping { get; set; }Cet attribut active le mode lorsque les glyphes de texte ne seront pas regroupés en mots et en chaînes Ce mode permet de conserver une précision maximale lors du positionnement des glyphes sur la page et il peut être utilisé pour la conversion de documents avec des notes de musique ou des glyphes qui doivent être placés séparément mutuellement. Ce paramètre sera appliqué au document uniquement lorsque la valeur de l’attribut FixedLayout est true.
RenderTextAsImage { get; set; }Si l’attribut RenderTextAsImage est défini sur true, le texte de la source devient une image au format HTML. Peut être utile pour rendre le texte non sélectionnable ou le texte HTML n’est pas rendu correctement.
SaveFormat { get; }Format de sauvegarde des données.
SimpleTextboxModeGrouping { get; set; }Cet attribut spécifie un regroupement séquentiel de glyphes et de mots dans des chaînes Par exemple, les balises et les mots ont un ordre différent dans le code HTML converti et vous souhaitez qu’ils correspondent. Ce paramètre sera appliqué au document uniquement lorsque la valeur de l’attribut FixedLayout est true.
SplitCssIntoPages { get; set; }Lorsque le mode multipage est sélectionné (par exemple, ‘SplitIntoPages’ est ’true’), alors cet attribut définit s’il faut créer un fichier CSS séparé pour chaque page HTML de résultat. Par défaut, cet attribut est faux, donc, sera créé un gros CSS commun pour toutes les pages créées. Taille récapitulative de tous CSS générés dans ce mode (un CSS par page) généralement beaucoup plus que la taille d’un gros fichier CSS, car dans le cas précédent, les classes CSS sont des doublons dans ce cas dans plusieurs fichiers CSS pour chaque page. Donc, cela paramètre est pire pour être utilisé uniquement lorsque vous êtes intéressé par le traitement futur de chaque page HTML indépendamment, et donc la taille du CSS de chaque page séparée est le problème le plus critique.
SplitIntoPages { get; set; }Obtient ou définit l’indicateur qui indique si chaque page du document source sera convertie en son propre document HTML cible, c’est-à-dire si le résultat HTML sera divisé en plusieurs pages HTML.
UseZOrder { get; set; }Si l’attribut UseZORder est défini sur true, les graphiques et le texte sont ajoutés au document HTML résultant en conséquence dans l’ordre Z du document PDF d’origine. Si cet attribut est faux, tous les graphiques sont mis en tant que calque unique, ce qui peut entraîner des effets inutiles pour les objets superposés.
WarningHandler { get; set; }Rappel pour gérer les avertissements générés. Le WarningHandler renvoie l’élément d’énumération ReturnAction en spécifiant Continuer ou Abandonner. Continuer est l’action par défaut et l’opération de sauvegarde se poursuit, mais l’utilisateur peut également renvoyer Abort, auquel cas l’opération de sauvegarde doit cesser.

Des champs

NomLa description
AntialiasingProcessingCe paramètre définit les mesures d’anticrénelage requises lors de la conversion d’images d’arrière-plan composées de PDF en HTML
CssClassNamesPrefixLorsque le convertisseur PDFtoHTML génère des CSS de résultat, les noms de classe CSS (quelque chose comme “.stl_01 {}” … “.stl_NN {}) sont générés et utilisés dans le résultat CSS. Cette propriété permet de définir de force le nom de classe prefix Par exemple, si vous voulez que tous les noms de classe commencent par ‘my_prefix_’ (c’est-à-dire quelque chose comme ‘my_prefix_1’ … ‘my_prefix_NNN’ ), puis attribuez simplement ‘my_prefix_’ à cette propriété avant la conversion. Si cette propriété restera intacte (c’est-à-dire null sera laissé comme value ), then converter générera lui-même des noms de classe (ce sera quelque chose comme “.stl_01 {}” … “.stl_NN {}”)
CustomCssSavingStrategyCe champ peut contenir une stratégie de sauvegarde qui doit être utilisée (si présente) lors de la conversion de Pdf en Html pour la gestion de la sauvegarde des CSS liés au document HTML créé dans son ensemble ou à ses pages (si plusieurs pages HTML sont générées) Si vous le souhaitez gérez le fichier CSS d’une manière spécifique, créez simplement une méthode appropriée et attribuez le délégué créé à partir de celui-ci à cette propriété.
CustomHtmlSavingStrategyLe résultat de la conversion peut contenir une ou plusieurs pages HTML Vous pouvez attribuer à ce délégué de propriété créé à partir d’une méthode personnalisée qui implémente le traitement d’une page HTML (pour être précis - balisage HTML, sans fichiers externes liés, le cas échéant) qui a été créé lors de la conversion. Dans ce cas, le traitement (comme l’enregistrement du code HTML de la page dans le flux ou le disque) peut être effectué dans ce code personnalisé. Dans ce cas, toutes les actions nécessaires à la sauvegarde de la page HTML doivent être entreprises dans le code de la méthode fournie, car la sauvegarde du résultat dans le code du convertisseur ne sera pas utilisée. Si le traitement pour tel ou tel cas, pour une raison quelconque, doit être effectué par le code du convertisseur lui-même, pas dans le code personnalisé, veuillez définir dans le code personnalisé le drapeau ‘CustomProcessingCancelled’ de la variable du paramètre ‘htmlSavingInfo’ : il signalera au convertisseur que tous les les étapes nécessaires pour le traitement de cette ressource doivent être effectuées dans le convertisseur lui-même de la même manière comme s’il n’y avait pas de code personnalisé externe pour le traitement .
CustomProgressHandlerCe gestionnaire peut être utilisé pour gérer les événements de progression de la conversion fe il peut être utilisé pour afficher la barre de progression ou des messages sur la quantité actuelle de pages traitées, exemple de code de gestionnaire qui montre la progression sur la console est :
CustomResourceSavingStrategyCe champ peut contenir la stratégie d’enregistrement qui doit être utilisée (le cas échéant) lors de la conversion pour la gestion personnalisée des fichiers de ressources référencés créés (comme les images et les polices) liés aux nœuds du code HTML enregistré. Cette stratégie doit traiter les ressources et renvoyer la chaîne qui représente l’URL souhaitable de la ressource enregistrée dans le HTML généré.
CustomStrategyOfCssUrlCreationCe champ peut contenir une méthode personnalisée qui renvoie l’URL (ou le modèle d’URL si la génération multipage est activée - voir les détails ci-dessous) du sujet CSS, car il doit être mis dans le résultat généré HTML. Fe si vous voulez que le convertisseur mette une URL spécifique au lieu de standard Nom du fichier CSS dans le CSS généré, alors vous devez simplement créer et mettre dans cette propriété method qui génère l’URL souhaitable. Si le drapeau ‘SplitCssIntoPages’ est défini, alors cette stratégie personnalisée (le cas échéant) doit renvoyer non pas l’URL exacte du CSS mais plutôt le modèle La chaîne that (après remplacement de l’espace réservé par le numéro de page avec la fonction string.Format() à l’intérieur du convertisseur) peut être résolue en URL pour l’URL CSS de telle ou telle page. Exemples de chaîne de retour attendue dans ce cas : ‘SomeTargetLocation-page_{0}.css’,’../PartHandlers/GetCss.aspx?DocumentId=45654&CssPage={0}’)
ExcludeFontNameListListe des noms de polices intégrées PDF qui ne doivent pas être intégrées dans HTML.
FontEncodingStrategyDéfinit une règle spéciale d’encodage pour ajuster le décodage PDF pour le document actuel
FontSavingModeDéfinit le mode d’enregistrement des polices qui sera utilisé lors de l’enregistrement du PDF au format souhaité
HtmlMarkupGenerationModeParfois, des exigences spécifiques à la génération de balisage HTML sont présentes. Ce paramètre définit les modes de préparation HTML qui peuvent être utilisés lors de la conversion de PDF en HTML pour répondre à ces exigences spécifiques.
LettersPositioningMethodDéfinit le mode de positionnement des lettres dans les mots dans le résultat HTML
PageBorderIfAnyCet attribut représente un ensemble de paramètres utilisés pour dessiner la bordure (le cas échéant) dans le document HTML résultant autour de la zone qui représente la page PDF source. En substance, il s’agit d’afficher les bords de papier de la page, et non la bordure de page référencée dans la page PDF elle-même.
PageMarginIfAnyCet attribut représente un ensemble de marge de page supplémentaire (le cas échéant) dans le document HTML de résultat autour de la zone qui représente la page PDF source.
PagesFlowTypeDependsOnViewersScreenSizeSi l’attribut ‘SplitOnPages=false’, le code HTML entier représentant toutes les pages PDF d’entrée sera placé dans un seul gros fichier HTML de résultat. Cet indicateur définit si le résultat HTML sera généré de telle manière que le flux de zones représentant les pages PDF dans le résultat HTML dépendra de la résolution d’écran du visualiseur. Supposons que la largeur de l’écran côté spectateur soit suffisamment grande pour mettre 2 pages ou plus l’une près de l’autre dans le sens horizontal. Si cet indicateur est défini sur vrai, alors cette opportunité sera utilisée (autant de pages seront affichées horizontalement les unes près des autres que possible, alors le prochain groupe horizontal de pages sera affiché sous le premier). Sinon, les pages s’écouleront telle manière : la page suivante passe toujours sous la précédente.
PartsEmbeddingModeIl définit si les fichiers référencés (HTML, polices, images, CSS) seront intégrés dans le fichier HTML principal ou seront générés en tant qu’entités binaires distinctes
RasterImagesSavingModeLe PDF converti peut contenir des images raster Ce paramètre définit comment elles doivent être traitées lors de la conversion du PDF en HTML
RemoveEmptyAreasOnTopAndBottomDéfinit si le HTML créé sera supprimé des zones vides en haut et en bas sans aucun contenu (le cas échéant).
SaveFullFontIndique que la police complète sera enregistrée, ne prend en charge que les polices True Type. Par défaut SaveFullFont = false et le convertisseur enregistre le sous-ensemble de la police initiale nécessaire pour afficher le texte du document.
SaveShadowedTextsAsTransparentTextsPdf peut contenir des textes masqués par d’autres éléments (par exemple par des images), mais peut être sélectionné dans le presse-papiers d’Acrobat Reader (généralement, cela se produit lorsque le document contient des images et des textes OCR extraits de celui-ci). Ce paramètre indique au convertisseur si nous besoin d’enregistrer ces textes en tant que textes transparents sélectionnables dans le résultat HTML pour imiter le comportement d’Acrobat Reader (sinon ces textes sont généralement enregistrés comme masqués, non disponibles pour être copiés dans le presse-papiers)
SaveTransparentTextsPdf peut contenir des textes transparents pouvant être sélectionnés dans le presse-papiers (généralement, cela se produit lorsque le document contient des images et des textes OCR extraits). Ce paramètre indique au convertisseur si nous devons enregistrer ces textes en tant que textes transparents sélectionnables dans le résultat HTML
SpecialFolderForAllImagesObtient ou définit le chemin d’accès au répertoire dans lequel doivent être enregistrées les images si elles sont rencontrées lors de l’enregistrement du document au format HTML. Si le paramètre est vide ou null , les fichiers image (le cas échéant) seront enregistrés avec d’autres fichiers liés à HTML Cela n’affecte rien si la propriété CustomImageSavingStrategy a été utilisée avec succès pour traiter le fichier image pertinent.
SpecialFolderForSvgImagesObtient ou définit le chemin d’accès au répertoire dans lequel doivent être enregistrées uniquement les images SVG si elles sont rencontrées lors de l’enregistrement du document au format HTML. Si le paramètre est vide ou null , les fichiers SVG (le cas échéant) seront enregistrés avec d’autres fichiers image (près du fichier de sortie) ou dans un dossier spécial pour les images (s’il est spécifié dans l’option SpecialImagesFolderIfAny). Cela n’affecte rien si la propriété CustomImageSavingStrategy a été utilisée avec succès pour traiter le fichier image pertinent.
TryMergeAdjacentSameBackgroundImagesParfois, les fichiers PDF contiennent des images d’arrière-plan (de pages ou de cellules de tableau) construites à partir de plusieurs images d’arrière-plan en mosaïque placées les unes à côté des autres. Dans ce cas, les rendus de formats cibles (par exemple MsWord pour le format DOCS) génèrent parfois des limites visibles entre les parties des images d’arrière-plan , car leurs techniques de lissage des bords de l’image (anti-crénelage) sont différentes d’Acrobat Reader. S’il semble que le document exporté contient de telles limites visibles entre parties des mêmes images d’arrière-plan, veuillez essayer d’utiliser ce paramètre pour vous débarrasser de de cela effet indésirable. ATTENTION ! Cette optimisation de la qualité ralentit généralement essentiellement la conversion, donc, s’il vous plaît, n’utilisez cette option que lorsque c’est vraiment nécessaire.
TrySaveTextUnderliningAndStrikeoutingInCssLe PDF lui-même ne contient pas de marqueurs de soulignement pour les textes. Il est émulé avec une ligne située sous le texte. Cette option permet au convertisseur d’essayer de deviner que telle ou telle ligne est le soulignement d’un texte et de mettre cette information dans CSS au lieu de dessiner le soulignement graphiquement

Voir également