HtmlSaveOptions

Наследование: java.lang.Object, com.aspose.pdf.SaveOptions, com.aspose.pdf.UnifiedSaveOptions

Все реализованные интерфейсы: com.aspose.pdf.IPageSetOptions, com.aspose.pdf.IPipelineOptions

public class HtmlSaveOptions extends UnifiedSaveOptions implements IPageSetOptions, IPipelineOptions

Сохранить параметры для экспорта в формат Html

Конструкторы

КонструкторОписание
HtmlSaveOptions()Инициализирует новый экземпляр класса HtmlSaveOptions.
HtmlSaveOptions(int documentType)Инициализирует новый экземпляр класса HtmlSaveOptions.
HtmlSaveOptions(boolean fixedLayout)Инициализирует новый экземпляр класса HtmlSaveOptions.
HtmlSaveOptions(int documentType, boolean fixedLayout)Инициализирует новый экземпляр класса HtmlSaveOptions.

Методы

МетодОписание
equals(Object arg0)
getAdditionalMarginWidthInPoints()Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, не будет разделен на разные HTML-страницы, а будет помещен в один большой результирующий HTML-файл.
getAntialiasingProcessing()Этот параметр определяет необходимые меры сглаживания при преобразовании составных фоновых изображений из PDF в HTML.
getBatchSize()Определяет размер пакета, если пакетное преобразование применимо к паре исходного и целевого форматов.
getClass()
getCompressSvgGraphicsIfAny()Получает флаг, указывающий, будет ли найденная графика SVG (если есть) сжата (заархивирована) в формат SVGZ во время сохранения.
getConvertMarkedContentToLayers()Если для атрибута ConvertMarkedContentToLayers задано значение true, то все элементы внутри помеченного PDF-содержимого (слоя) будут помещены в элемент div HTML с атрибутом «data-pdflayer», указывающим имя слоя.
getCssClassNamesPrefix()Когда конвертер PDFtoHTML генерирует результирующие CSS, имена классов CSS (что-то вроде «.stl\ _01{}" … “.stl\ _NN{}) генерируются и используются в результирующем CSS.
getCustomCssSavingStrategy()Это поле может содержать стратегию сохранения, которая должна использоваться (если присутствует) во время преобразования Pdf в Html для управления сохранением CSS, связанных с созданным HTML-документом в целом или с его страницами (если создается несколько HTML-страниц). Если вы хотите обрабатывать файл CSS каким-то особым образом, просто создайте соответствующий метод и назначьте делегата, созданного из него, этому свойству.
getCustomHtmlSavingStrategy()Результат конвертации может содержать одну или несколько HTML-страниц. Этому свойству можно присвоить делегат, созданный из пользовательского метода, реализующего обработку одной HTML-страницы (точнее - разметки-HTML, без внешних связанных файлов, если таковые имеются), которая была создана во время преобразование.
getCustomProgressHandler()Этот обработчик можно использовать для обработки событий о ходе преобразования, например, для отображения индикатора выполнения или сообщений о текущем количестве обработанных страниц. Пример кода обработчика, показывающего ход выполнения на консоли:
getCustomResourceSavingStrategy()Это поле может содержать стратегию сохранения, которую необходимо использовать (если она присутствует) во время преобразования для индивидуальной обработки созданных файлов ресурсов (например, изображений и шрифтов), связанных с узлами сохраненного HTML.
getCustomStrategyOfCssUrlCreation()Это поле может содержать пользовательский метод, который возвращает URL-адрес (или шаблон URL-адреса, если включена многостраничная генерация — см. подробности ниже) предметного CSS, поскольку он должен быть помещен в сгенерированный результирующий HTML-код.
getDefaultFontName()Указывает имя установленного шрифта, который используется для замены любого шрифта документа, который не встроен и не установлен в системе.
getDocumentType()Получает HtmlDocumentTypeInternal .
getExcludeFontNameList()Список имен встроенных шрифтов PDF, которые не могут быть встроены в HTML.
getExplicitListOfSavedPages()С помощью этого свойства вы можете явно указать, какие страницы документа должны быть преобразованы.
getFixedLayout()Получает значение, указывающее, создан ли этот HTML как фиксированный макет.
getFontEncodingStrategy()Определяет специальное правило кодирования для настройки декодирования PDF для текущего документа.
getFontSavingMode()Определяет режим сохранения шрифта, который будет использоваться при сохранении PDF в желаемом формате.
getFontSources()Источники предварительно сохраненных шрифтов.
getHtmlMarkupGenerationMode()Иногда предъявляются особые требования к генерации HTML-разметки.
getImageResolution()Получает или задает разрешение для рендеринга изображения.
getLettersPositioningMethod()Задает способ расположения букв в словах в результирующем HTML
getMinimalLineWidth()Этот атрибут задает минимальную ширину линии графического контура.
getPageBorderIfAny()Этот атрибут представляет собой набор настроек, используемых для рисования границы (если есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF.
getPageMarginIfAny()Этот атрибут представляет набор дополнительных полей страницы (если они есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF.
getPartsEmbeddingMode()Он определяет, будут ли ссылочные файлы (HTML, шрифты, изображения, CSS) встроены в основной файл HTML или будут сгенерированы как отдельные двоичные объекты.
getPreventGlyphsGrouping()Этот атрибут включает режим, при котором текстовые глифы не будут группироваться в слова и строки. Этот режим позволяет сохранить максимальную точность при позиционировании глифов на странице и может быть использован для конвертации документов с нотами или глифами, которые необходимо размещать отдельно друг от друга. Другой.
getProgressEventsRetranslator()Представляет внутренний обработчик событий выполнения, который работает во время преобразования и переводит события преобразования внутренних этапов преобразования во внешние общие события выполнения. Также класс транслирует события, которые позволяют высвободить ресурсы, которые больше не нужны.[Другой формат] progress для расчета общего прогресса и информирования кода клиента об этих событиях общего прогресса. Этот класс использует два типа событий: преобразование модели ApsToExternal и события преобразования Pdf в APS для создания событий общего прогресса Экспорт состоит из трех этапов: 1) Pdf в Aps 2) Распознавание приложений 3_ Экспорт приложений в целевой формат Конструктор позволяет настроить, сколько страниц конвертируется и какова приблизительная часть того или иного этапа в общем прогрессе
getRasterImagesSavingMode()Преобразованный PDF может содержать растровые изображения. Этот параметр определяет, как они должны обрабатываться при преобразовании PDF в HTML.
getSaveFormat()Формат сохранения данных.
getSimpleTextboxModeGrouping()Этот атрибут указывает последовательную группировку глифов и слов в строки. Например, теги и слова имеют разный порядок в преобразованном HTML, и вы хотите, чтобы они совпадали.
getSpecialFolderForAllImages()Получает или задает путь к каталогу, в который должны быть сохранены любые изображения, если они встречаются при сохранении документа в формате HTML.
getSpecialFolderForSvgImages()Получает или задает путь к каталогу, в который должны быть сохранены только SVG-изображения, если они встречаются при сохранении документа в формате HTML.
getSplitCssIntoPages()Когда выбран многостраничный режим (т.е. ‘SplitIntoPages’ имеет значение ’true’), то этот атрибут определяет, должен ли быть создан отдельный CSS-файл для каждой результирующей HTML-страницы.
getSplitIntoPages()Получает флаг, указывающий, будет ли каждая страница исходного документа преобразована в свой собственный целевой HTML-документ, т.е. будет ли результирующий HTML разбит на несколько HTML-страниц.
getUseZOrder()Если для атрибута UseZORder установлено значение true, графика и текст добавляются в результирующий HTML-документ в соответствии с Z-порядком в исходном PDF-документе.
getWarningHandler()Обратный вызов для обработки любых сгенерированных предупреждений.
hashCode()
isCloseResponse()Получает логическое значение, указывающее, будет ли объект Response закрыт после сохранения документа в ответ.
isExtractOcrSublayerOnly()Этот атрибут включает функцию извлечения изображения или текста для документов PDF с подслоем OCR.
isPagesFlowTypeDependsOnViewersScreenSize()Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, будет помещен в один большой результирующий HTML-файл.
isRemoveEmptyAreasOnTopAndBottom()Определяет, будут ли в созданном HTML удаляться верхняя и нижняя пустые области без содержимого (если оно есть).
isRenderTextAsImage()Если для атрибута RenderTextAsImage задано значение true, текст из источника становится изображением в формате HTML.
isSaveFullFont()Указывает, что будет сохранен полный шрифт, поддерживаются только шрифты True Type.
isSaveShadowedTextsAsTransparentTexts()Pdf может содержать тексты, которые затенены другими элементами (например, изображениями), но могут быть выделены в буфер обмена в Acrobat Reader (обычно это происходит, когда документ содержит изображения и извлеченные из них тексты, подвергнутые распознаванию).
isSaveTransparentTexts()Pdf может содержать прозрачные тексты, которые можно выделить в буфер обмена (обычно это происходит, когда документ содержит изображения и извлеченные из него OCR-тексты).
isTryMergeAdjacentSameBackgroundImages()Иногда PDF-файлы содержат фоновые изображения (страниц или ячеек таблицы), составленные из нескольких одинаковых мозаичных фоновых изображений, расположенных рядом друг с другом.
isTrySaveTextUnderliningAndStrikeoutingInCss()Сам PDF не содержит маркеров подчеркивания для текстов.
notify()
notifyAll()
setAdditionalMarginWidthInPoints(int value)Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, не будет разделен на разные HTML-страницы, а будет помещен в один большой результирующий HTML-файл.
setAntialiasingProcessing(int antialiasingProcessing)Этот параметр определяет необходимые меры сглаживания при преобразовании составных фоновых изображений из PDF в HTML.
setBatchSize(int value)Определяет размер пакета, если пакетное преобразование применимо к паре исходного и целевого форматов.
setCloseResponse(boolean value)Устанавливает логическое значение, указывающее, будет ли объект Response закрыт после сохранения документа в ответ.
setCompressSvgGraphicsIfAny(boolean value)Устанавливает флаг, указывающий, будет ли найденная графика SVG (если есть) сжата (заархивирована) в формат SVGZ во время сохранения
setConvertMarkedContentToLayers(boolean value)Если для атрибута ConvertMarkedContentToLayers задано значение true, то все элементы внутри помеченного PDF-содержимого (слоя) будут помещены в элемент div HTML с атрибутом «data-pdflayer», указывающим имя слоя.
setCssClassNamesPrefix(String cssClassNamesPrefix)Когда конвертер PDFtoHTML генерирует результирующие CSS, имена классов CSS (что-то вроде «.stl\ _01{}” … “.stl\ _NN{}) генерируются и используются в результирующем CSS.
setCustomCssSavingStrategy(HtmlSaveOptions.CssSavingStrategy customCssSavingStrategy)Это поле может содержать стратегию сохранения, которая должна использоваться (если присутствует) во время преобразования Pdf в Html для управления сохранением CSS, связанных с созданным HTML-документом в целом или с его страницами (если создается несколько HTML-страниц). Если вы хотите обрабатывать файл CSS каким-то особым образом, просто создайте соответствующий метод и назначьте делегата, созданного из него, этому свойству.
setCustomHtmlSavingStrategy(HtmlSaveOptions.HtmlPageMarkupSavingStrategy customHtmlSavingStrategy)Результат конвертации может содержать одну или несколько HTML-страниц. Этому свойству можно присвоить делегат, созданный из пользовательского метода, реализующего обработку одной HTML-страницы (точнее - разметки-HTML, без внешних связанных файлов, если таковые имеются), которая была создана во время преобразование.
setCustomProgressHandler(UnifiedSaveOptions.ConversionProgressEventHandler customProgressHandler)Этот обработчик можно использовать для обработки событий о ходе преобразования, например, для отображения индикатора выполнения или сообщений о текущем количестве обработанных страниц. Пример кода обработчика, показывающего ход выполнения на консоли:
setCustomResourceSavingStrategy(HtmlSaveOptions.ResourceSavingStrategy customResourceSavingStrategy)Это поле может содержать стратегию сохранения, которую необходимо использовать (если она присутствует) во время преобразования для индивидуальной обработки созданных файлов ресурсов (например, изображений и шрифтов), связанных с узлами сохраненного HTML.
setCustomStrategyOfCssUrlCreation(HtmlSaveOptions.CssUrlMakingStrategy customStrategyOfCssUrlCreation)Это поле может содержать пользовательский метод, который возвращает URL-адрес (или шаблон URL-адреса, если включена многостраничная генерация — см. подробности ниже) предметного CSS, поскольку он должен быть помещен в сгенерированный результирующий HTML-код.
setDefaultFontName(String value)Указывает имя установленного шрифта, который используется для замены любого шрифта документа, который не встроен и не установлен в системе.
setDocumentType(int value)Задает HtmlDocumentType .
setExcludeFontNameList(String[] excludeFontNameList)Список имен встроенных шрифтов PDF, которые не могут быть встроены в HTML.
setExplicitListOfSavedPages(int[] value)С помощью этого свойства вы можете явно указать, какие страницы документа должны быть преобразованы.
setExtractOcrSublayerOnly(boolean value)Этот атрибут включает функцию извлечения изображения или текста для документов PDF с подслоем OCR.
setFixedLayout(boolean value)Задает значение, указывающее, создан ли этот HTML как фиксированный макет.
setFontEncodingStrategy(byte fontEncodingStrategy)Определяет специальное правило кодирования для настройки декодирования PDF для текущего документа.
setFontSavingMode(int fontSavingMode)Определяет режим сохранения шрифта, который будет использоваться при сохранении PDF в желаемом формате.
setHtmlMarkupGenerationMode(int htmlMarkupGenerationMode)Иногда предъявляются особые требования к генерации HTML-разметки.
setImageResolution(int value)Получает или задает разрешение для рендеринга изображения.
setLettersPositioningMethod(int lettersPositioningMethod)Задает способ расположения букв в словах в результирующем HTML
setMinimalLineWidth(float value)Этот атрибут задает минимальную ширину линии графического контура.
setPageBorderIfAny(SaveOptions.BorderInfo pageBorderIfAny)Этот атрибут представляет собой набор настроек, используемых для рисования границы (если есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF.
setPageMarginIfAny(SaveOptions.MarginInfo pageMarginIfAny)Этот атрибут представляет набор дополнительных полей страницы (если они есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF.
setPagesFlowTypeDependsOnViewersScreenSize(boolean pagesFlowTypeDependsOnViewersScreenSize)Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, будет помещен в один большой результирующий HTML-файл.
setPartsEmbeddingMode(int partsEmbeddingMode)Он определяет, будут ли ссылочные файлы (HTML, шрифты, изображения, CSS) встроены в основной файл HTML или будут сгенерированы как отдельные двоичные объекты.
setPreventGlyphsGrouping(boolean value)Этот атрибут включает режим, при котором текстовые глифы не будут группироваться в слова и строки. Этот режим позволяет сохранить максимальную точность при позиционировании глифов на странице и может быть использован для конвертации документов с нотами или глифами, которые необходимо размещать отдельно друг от друга. Другой.
setProgressEventsRetranslator(ConversionProgressEventsTranslator progressEventsRetranslator)Представляет внутренний обработчик событий выполнения, который работает во время преобразования и переводит события преобразования внутренних этапов преобразования во внешние общие события выполнения. Также класс транслирует события, которые позволяют высвободить ресурсы, которые больше не нужны.[Другой формат] progress для расчета общего прогресса и информирования кода клиента об этих событиях общего прогресса. Этот класс использует два типа событий: преобразование модели ApsToExternal и события преобразования Pdf в APS для создания событий общего прогресса Экспорт состоит из трех этапов: 1) Pdf в Aps 2) Распознавание приложений 3_ Экспорт приложений в целевой формат Конструктор позволяет настроить, сколько страниц конвертируется и какова приблизительная часть того или иного этапа в общем прогрессе
setRasterImagesSavingMode(int rasterImagesSavingMode)Преобразованный PDF может содержать растровые изображения. Этот параметр определяет, как они должны обрабатываться при преобразовании PDF в HTML.
setRemoveEmptyAreasOnTopAndBottom(boolean removeEmptyAreasOnTopAndBottom)Определяет, будут ли в созданном HTML удаляться верхняя и нижняя пустые области без содержимого (если оно есть).
setRenderTextAsImage(boolean value)Если для атрибута RenderTextAsImage задано значение true, текст из источника становится изображением в формате HTML.
setSaveFullFont(boolean saveFullFont)Указывает, что будет сохранен полный шрифт, поддерживаются только шрифты True Type.
setSaveShadowedTextsAsTransparentTexts(boolean saveShadowedTextsAsTransparentTexts)Pdf может содержать тексты, которые затенены другими элементами (например, изображениями), но могут быть выделены в буфер обмена в Acrobat Reader (обычно это происходит, когда документ содержит изображения и извлеченные из них тексты, подвергнутые распознаванию).
setSaveTransparentTexts(boolean saveTransparentTexts)Pdf может содержать прозрачные тексты, которые можно выделить в буфер обмена (обычно это происходит, когда документ содержит изображения и извлеченные из него OCR-тексты).
setSimpleTextboxModeGrouping(boolean value)Этот атрибут указывает последовательную группировку глифов и слов в строки. Например, теги и слова имеют разный порядок в преобразованном HTML, и вы хотите, чтобы они совпадали.
setSpecialFolderForAllImages(String specialFolderForAllImages)Получает или задает путь к каталогу, в который должны быть сохранены любые изображения, если они встречаются при сохранении документа в формате HTML.
setSpecialFolderForSvgImages(String specialFolderForSvgImages)Получает или задает путь к каталогу, в который должны быть сохранены только SVG-изображения, если они встречаются при сохранении документа в формате HTML.
setSplitCssIntoPages(boolean value)Когда выбран многостраничный режим (т.е. ‘SplitIntoPages’ имеет значение ’true’), то этот атрибут определяет, должен ли быть создан отдельный CSS-файл для каждой результирующей HTML-страницы.
setSplitIntoPages(boolean value)Устанавливает флаг, указывающий, будет ли каждая страница исходного документа преобразована в свой собственный целевой HTML-документ, т.е. будет ли результирующий HTML разбит на несколько HTML-страниц.
setTryMergeAdjacentSameBackgroundImages(boolean tryMergeAdjacentSameBackgroundImages)Иногда PDF-файлы содержат фоновые изображения (страниц или ячеек таблицы), составленные из нескольких одинаковых мозаичных фоновых изображений, расположенных рядом друг с другом.
setTrySaveTextUnderliningAndStrikeoutingInCss(boolean trySaveTextUnderliningAndStrikeoutingInCss)Сам PDF не содержит маркеров подчеркивания для текстов.
setUseZOrder(boolean value)Если для атрибута UseZORder установлено значение true, графика и текст добавляются в результирующий HTML-документ в соответствии с Z-порядком в исходном PDF-документе.
setWarningHandler(WarningCallback value)Обратный вызов для обработки любых сгенерированных предупреждений.
toString()
wait()
wait(long arg0)
wait(long arg0, int arg1)

HtmlSaveOptions()

public HtmlSaveOptions()

Инициализирует новый экземпляр класса HtmlSaveOptions.

HtmlSaveOptions(int documentType)

public HtmlSaveOptions(int documentType)

Инициализирует новый экземпляр класса HtmlSaveOptions.

Параметры:

ПараметрТипОписание
documentTypeintHtmlDocumentTypeInternal .

HtmlSaveOptions(boolean fixedLayout)

public HtmlSaveOptions(boolean fixedLayout)

Инициализирует новый экземпляр класса HtmlSaveOptions.

Параметры:

ПараметрТипОписание
fixedLayoutbooleanлогическое значение

HtmlSaveOptions(int documentType, boolean fixedLayout)

public HtmlSaveOptions(int documentType, boolean fixedLayout)

Инициализирует новый экземпляр класса HtmlSaveOptions.

Параметры:

ПараметрТипОписание
documentTypeintHtmlDocumentTypeInternal .
fixedLayoutbooleanесли установлено значение true, HTML создается как фиксированный макет.

equals(Object arg0)

public boolean equals(Object arg0)

Параметры:

ПараметрТипОписание
arg0java.lang.Object

Возвращает: логический

getAdditionalMarginWidthInPoints()

public int getAdditionalMarginWidthInPoints()

Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, не будет разделен на разные HTML-страницы, а будет помещен в один большой результирующий HTML-файл. Но каждая исходная PDF-страница будет представлена своей собственной прямоугольной областью в HTML (при необходимости эти области могут быть ограничены для отображения краев бумаги страницы с помощью специального атрибута «PageBorderIfAny». Этот параметр определяет ширину поля, которое будет принудительно оставлено вокруг этого выходного HTML-кода. -области, которые представляют собой страницы исходного PDF-документа. По сути, он определяет гарантированный интервал между HTML-представлениями “бумажных” страниц PDF, такой режим преобразования.

Возвращает: интервал - целочисленное значение

getAntialiasingProcessing()

public int getAntialiasingProcessing()

Этот параметр определяет необходимые меры сглаживания при преобразовании составных фоновых изображений из PDF в HTML.

Возвращает: int — элемент AntialiasingProcessingType

getBatchSize()

public final int getBatchSize()

Определяет размер пакета, если пакетное преобразование применимо к паре исходного и целевого форматов.

Возвращает: инт

getClass()

public final native Class<?> getClass()

Возвращает: java.lang.Класс

getCompressSvgGraphicsIfAny()

public boolean getCompressSvgGraphicsIfAny()

Получает флаг, указывающий, будет ли найденная графика SVG (если есть) сжата (заархивирована) в формат SVGZ во время сохранения.

Значение: HtmlDocumentType.

Возвращает: boolean - логическое значение

getConvertMarkedContentToLayers()

public boolean getConvertMarkedContentToLayers()

Если для атрибута ConvertMarkedContentToLayers задано значение true, то все элементы внутри помеченного PDF-содержимого (слоя) будут помещены в элемент div HTML с атрибутом «data-pdflayer», указывающим имя слоя. Это имя слоя будет извлечено из необязательных свойств помеченного содержимого PDF. Если этот атрибут имеет значение false (по умолчанию), то никакие слои не будут созданы из содержимого, помеченного PDF.

Возвращает: boolean - логическое значение

getCssClassNamesPrefix()

public String getCssClassNamesPrefix()

Когда конвертер PDFtoHTML генерирует результирующие CSS, имена классов CSS (что-то вроде «.stl\ _01{}” … “.stl\ _NN{}) генерируются и используются в результирующем CSS. Это свойство позволяет принудительно установить префикс имени класса. Например, если Вы хотите, чтобы все имена классов начинались с ‘my_префикс_’ (т.е. были чем-то вроде ‘мой_префикс_1’…‘мой_префикс_NNN’ ), затем просто назначьте ‘мой_префикс_’ к этому свойству перед преобразованием. Если это свойство останется нетронутым (т.е. в качестве значения будет оставлено значение null ), то конвертер сам сгенерирует имена классов (это будет что-то вроде “.stl\ _01{}” … “.stl\ _NN{}”)

Возвращает: java.lang.String — строковое значение

getCustomCssSavingStrategy()

public HtmlSaveOptions.CssSavingStrategy getCustomCssSavingStrategy()

Это поле может содержать стратегию сохранения, которая должна использоваться (если присутствует) во время преобразования Pdf в Html для управления сохранением CSS, связанных с созданным HTML-документом в целом или с его страницами (если создается несколько HTML-страниц). Если вы хотите обрабатывать файл CSS каким-то особым образом, просто создайте соответствующий метод и назначьте делегата, созданного из него, этому свойству.

Возвращает: CssSavingStrategy - Экземпляр CssSavingStrategy

getCustomHtmlSavingStrategy()

public HtmlSaveOptions.HtmlPageMarkupSavingStrategy getCustomHtmlSavingStrategy()

Результат конвертации может содержать одну или несколько HTML-страниц. Этому свойству можно присвоить делегат, созданный из пользовательского метода, реализующего обработку одной HTML-страницы (точнее - разметки-HTML, без внешних связанных файлов, если таковые имеются), которая была создана во время преобразование. В этом случае обработка (например, сохранение HTML-кода страницы в потоке или на диске) может выполняться в этом пользовательском коде. В таком случае все необходимые действия по сохранению HTML-страницы должны быть выполнены в коде предоставленного метода, т.к. сохранение результата в коде конвертера не будет использоваться. Если обработка в том или ином случае по каким-либо причинам должна производиться самим кодом конвертера, а не в пользовательском коде, пожалуйста, установите в пользовательском коде флаг CustomProcessingCancelled переменной параметра htmlSavingInfo: это будет сигнализировать конвертеру, что все необходимые шаги для обработка этого ресурса должна производиться в самом конвертере так же, как если бы не было никакого внешнего пользовательского кода для обработки.

Возвращает: HtmlPageMarkupSavingStrategy Экземпляр HtmlPageMarkupSavingStrategy

getCustomProgressHandler()

public UnifiedSaveOptions.ConversionProgressEventHandler getCustomProgressHandler()

Этот обработчик можно использовать для обработки событий о ходе преобразования, например, для отображения индикатора выполнения или сообщений о текущем количестве обработанных страниц. Пример кода обработчика, показывающего ход выполнения на консоли:


public static void ConvertWithShowingProgress()
     {
         (new com.aspose.pdf.License()).setLicense("Aspose.Total.lic");
         Document doc = new Document("Booklet.pdf");
         HtmlSaveOptions saveOptions = new HtmlSaveOptions();
         saveOptions.CustomProgressHandler = new com.aspose.pdf.UnifiedSaveOptions.ConversionProgressEventHandler() {
        public void invoke(
    	    UnifiedSaveOptions.ProgressEventHandlerInfo eventInfo) {
    	showProgressOnConsole(eventInfo);
        }
    };
         doc.save("Booklet.doc", saveOptions);
     }
     public static void showProgressOnConsole(HtmlSaveOptions.ProgressEventHandlerInfo eventInfo)
     {
         switch (eventInfo.EventType)
         {
             case HtmlSaveOptions.ProgressEventType.TotalProgress:
                 System.out.println(String.format("%s  - Conversion progress : %d % .", (new Date()).toString(), eventInfo.Value));
                 break;
             case HtmlSaveOptions.ProgressEventType.SourcePageAnalized:
        	 System.out.println(String.format("%s  - Source page %d of %d analyzed.", (new Date()).toString(), eventInfo.Value, eventInfo.MaxValue));
                 break;
             case HtmlSaveOptions.ProgressEventType.ResultPageCreated:
        	 System.out.println(String.format("%s  - Result page's %d of %d layout created.", (new Date()).toString(), eventInfo.Value, eventInfo.MaxValue));
                 break;
             case HtmlSaveOptions.ProgressEventType.ResultPageSaved:
        	 System.out.println(String.format("%s  - Result page %d of %d exported.", (new Date()).toString(), eventInfo.Value, eventInfo.MaxValue));
                 break;
             default:
                 break;
         }
      }

Возвращает: ConversionProgressEventHandler - Экземпляр ConversionProgressEventHandler

getCustomResourceSavingStrategy()

public HtmlSaveOptions.ResourceSavingStrategy getCustomResourceSavingStrategy()

Это поле может содержать стратегию сохранения, которую необходимо использовать (если она присутствует) во время преобразования для индивидуальной обработки созданных файлов ресурсов (например, изображений и шрифтов), связанных с узлами сохраненного HTML. Эта стратегия должна обрабатывать ресурсы и возвращать строку, представляющую желаемый URL-адрес сохраненного ресурса в сгенерированном HTML.

Возвращает: ResourceSavingStrategy - Экземпляр ResourceSavingStrategy

getCustomStrategyOfCssUrlCreation()

public HtmlSaveOptions.CssUrlMakingStrategy getCustomStrategyOfCssUrlCreation()

Это поле может содержать пользовательский метод, который возвращает URL-адрес (или шаблон URL-адреса, если включена многостраничная генерация — см. подробности ниже) предметного CSS, поскольку он должен быть помещен в сгенерированный результирующий HTML-код. Например, если вы хотите, чтобы конвертер поместил какой-то конкретный URL-адрес вместо стандартного имени файла CSS в сгенерированный CSS-файл, вам нужно просто создать и поместить в это свойство метод, который генерирует желаемый URL-адрес. Если установлен флаг «SplitCssIntoPages», то эта пользовательская стратегия (если есть) должна возвращать не точный URL-адрес CSS, а строку шаблона, которая (после замены заполнителя номером страницы с помощью функции String.Format() внутри конвертера) может быть преобразована в URL-адрес для URL той или иной страницы CSS. Примеры ожидаемой возвращаемой строки в таком случае: ‘SomeTargetLocation-page_{0}.css’,’../PartHandlers/GetCss.aspx?DocumentId=45654&CssPage=\ {0} ’ )

Возвращает: CssUrlMakingStrategy - Экземпляр CssUrlMakingStrategy

getDefaultFontName()

public String getDefaultFontName()

Указывает имя установленного шрифта, который используется для замены любого шрифта документа, который не встроен и не установлен в системе. Если null, то используется шрифт замены по умолчанию.

Возвращает: java.lang.String — строковое значение: имя шрифта

getDocumentType()

public int getDocumentType()

Получает HtmlDocumentTypeInternal .

Возвращает: int — HtmlDocumentTypeInternal.

getExcludeFontNameList()

public String[] getExcludeFontNameList()

Список имен встроенных шрифтов PDF, которые не могут быть встроены в HTML.

Возвращает: java.lang.String[] - массив строковых элементов

getExplicitListOfSavedPages()

public final int[] getExplicitListOfSavedPages()

С помощью этого свойства вы можете явно указать, какие страницы документа должны быть преобразованы. Страницы в этом списке должны иметь номера, начинающиеся с 1. Т.е. действительные номера страниц должны быть взяты из диапазона (1…[NumberOfPagesInConvertedDocument]) Порядок появления страниц в этом списке не влияет на их порядок в результирующей HTML-странице (-ах) - в результирующих страницах всегда будет следовать порядок, в котором они присутствуют в исходном PDF-файле. Если этот список пуст (по умолчанию), все страницы будут преобразованы. Если какой-либо номер страницы этого списка выйдет за пределы диапазона существующих страниц (1-[количество страниц в документе]) будет выдано исключение.

Возвращает: инт[]

getFixedLayout()

public boolean getFixedLayout()

Получает значение, указывающее, создан ли этот HTML как фиксированный макет.

Возвращает: логическое значение: истинно, если[фиксированная раскладка]; в противном случае ложь.

getFontEncodingStrategy()

public byte getFontEncodingStrategy()

Определяет специальное правило кодирования для настройки декодирования PDF для текущего документа.

Возвращает: byte — элемент FontEncodingRules

getFontSavingMode()

public int getFontSavingMode()

Определяет режим сохранения шрифта, который будет использоваться при сохранении PDF в желаемом формате.

Возвращает: int - элемент FontSavingModes

getFontSources()

public FontSourceCollection getFontSources()

Источники предварительно сохраненных шрифтов.

Возвращает: FontSourceCollection - Объект FontSourceCollection


Шрифты могут быть предварительно сохранены для целей кеша, а затем переданы в процесс преобразования Html. Например, это может быть полезно в сценарии разделения документа и обработки страниц документа в нескольких потоках с одним набором шрифтов.

getHtmlMarkupGenerationMode()

public int getHtmlMarkupGenerationMode()

Иногда предъявляются особые требования к генерации HTML-разметки. Этот параметр определяет режимы подготовки HTML, которые можно использовать во время преобразования PDF в HTML для соответствия таким конкретным требованиям.

Возвращает: int — элемент HtmlMarkupGenerationModes

getImageResolution()

public int getImageResolution()

Получает или задает разрешение для рендеринга изображения.

Возвращает: int — значение: разрешение

getLettersPositioningMethod()

public int getLettersPositioningMethod()

Задает способ расположения букв в словах в результирующем HTML

Возвращает: int — элемент LettersPositioningMethods

getMinimalLineWidth()

public float getMinimalLineWidth()

Этот атрибут задает минимальную ширину линии графического контура. Если толщина линии меньше 1 пикселя, Adobe Acrobat округляет ее до этого значения. Таким образом, этот атрибут можно использовать для имитации такого поведения HTML-браузеров.

Возвращает: float - плавающее значение

getPageBorderIfAny()

public SaveOptions.BorderInfo getPageBorderIfAny()

Этот атрибут представляет собой набор настроек, используемых для рисования границы (если есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF. По сути, это касается отображения краев бумаги страницы, а не границы страницы, на которую ссылается сама страница PDF.

Возвращает: BorderInfo - экземпляр BorderInfo

getPageMarginIfAny()

public SaveOptions.MarginInfo getPageMarginIfAny()

Этот атрибут представляет набор дополнительных полей страницы (если они есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF.

Возвращает: MarginInfo - Экземпляр MarginInfo

getPartsEmbeddingMode()

public int getPartsEmbeddingMode()

Он определяет, будут ли ссылочные файлы (HTML, шрифты, изображения, CSS) встроены в основной файл HTML или будут сгенерированы как отдельные двоичные объекты.

Возвращает: int — элемент PartsEmbeddingModes

getPreventGlyphsGrouping()

public boolean getPreventGlyphsGrouping()

Этот атрибут включает режим, при котором текстовые глифы не будут группироваться в слова и строки. Этот режим позволяет сохранить максимальную точность при позиционировании глифов на странице и может быть использован для конвертации документов с нотами или глифами, которые необходимо размещать отдельно друг от друга. Другой. Этот параметр будет применяться к документу только в том случае, если значение атрибута FixedLayout равно true.

Возвращает: boolean - логическое значение

getProgressEventsRetranslator()

public ConversionProgressEventsTranslator getProgressEventsRetranslator()

Представляет внутренний обработчик событий выполнения, который работает во время преобразования и переводит события преобразования внутренних этапов преобразования во внешние общие события выполнения. Также класс транслирует события, которые позволяют высвободить ресурсы, которые больше не нужны.[Другой формат] progress для расчета общего прогресса и информирования кода клиента об этих событиях общего прогресса. Этот класс использует два типа событий: преобразование модели ApsToExternal и события преобразования Pdf в APS для создания событий общего прогресса Экспорт состоит из трех этапов: 1) Pdf в Aps 2) Распознавание приложений 3_ Экспорт приложений в целевой формат Конструктор позволяет настроить, сколько страниц конвертируется и какова приблизительная часть того или иного этапа в общем прогрессе

Возвращает: com.aspose.pdf.ConversionProgressEventsTranslator — экземпляр ConversionProgressEventsTranslator

getRasterImagesSavingMode()

public int getRasterImagesSavingMode()

Преобразованный PDF может содержать растровые изображения. Этот параметр определяет, как они должны обрабатываться при преобразовании PDF в HTML.

Возвращает: int - элемент RasterImagesSavingModes

getSaveFormat()

public SaveFormat getSaveFormat()

Формат сохранения данных.

Возвращает: SaveFormat - Значение формата сохранения

getSimpleTextboxModeGrouping()

public final boolean getSimpleTextboxModeGrouping()

Этот атрибут указывает последовательную группировку глифов и слов в строки. Например, теги и слова имеют разный порядок в преобразованном HTML, и вы хотите, чтобы они совпадали. Этот параметр будет применяться к документу только в том случае, если значение атрибута FixedLayout равно true.

Возвращает: boolean - логическое значение

getSpecialFolderForAllImages()

public String getSpecialFolderForAllImages()

Получает или задает путь к каталогу, в который должны быть сохранены любые изображения, если они встречаются при сохранении документа в формате HTML. Если параметр пуст или нулевой, то файлы изображений (если они есть) будут сохранены вместе с другими файлами, связанными с HTML. Это ни на что не влияет, если свойство CustomImageSavingStrategy было успешно использовано для обработки соответствующего файла изображения.

Возвращает: java.lang.String — строковое значение

getSpecialFolderForSvgImages()

public String getSpecialFolderForSvgImages()

Получает или задает путь к каталогу, в который должны быть сохранены только SVG-изображения, если они встречаются при сохранении документа в формате HTML. Если параметр пустой или нулевой, то файлы SVG (если они есть) будут сохранены вместе с другими файлами-изображениями (рядом с выходным файлом) или в специальную папку для изображений (если это указано в опции SpecialImagesFolderIfAny). Это ни на что не влияет, если свойство CustomImageSavingStrategy было успешно использовано для обработки соответствующего файла изображения.

Возвращает: java.lang.String — строковое значение

getSplitCssIntoPages()

public boolean getSplitCssIntoPages()

Когда выбран многостраничный режим (т.е. ‘SplitIntoPages’ имеет значение ’true’), то этот атрибут определяет, должен ли быть создан отдельный CSS-файл для каждой результирующей HTML-страницы. По умолчанию этот атрибут имеет значение false, поэтому для всех создаваемых страниц будет создан один большой общий CSS. Суммарный размер всех CSS, сгенерированных в этом режиме (один CSS на страницу), обычно намного больше, чем размер одного большого файла CSS, потому что в первом случае классы CSS дублируются в таком случае в нескольких файлах CSS для каждой страницы. Таким образом, этот параметр хуже использовать только тогда, когда Вы заинтересованы в дальнейшей обработке каждой HTML-страницы независимо, и поэтому размер CSS каждой отдельной страницы, разобранной на части, является наиболее критичным вопросом.

Возвращает: boolean - логическое значение

getSplitIntoPages()

public boolean getSplitIntoPages()

Получает флаг, указывающий, будет ли каждая страница исходного документа преобразована в свой собственный целевой HTML-документ, т.е. будет ли результирующий HTML разбит на несколько HTML-страниц.

Возвращает: boolean - логическое значение

getUseZOrder()

public boolean getUseZOrder()

Если для атрибута UseZORder установлено значение true, графика и текст добавляются в результирующий HTML-документ в соответствии с Z-порядком в исходном PDF-документе. Если этот атрибут имеет значение false, вся графика помещается в один слой, что может вызвать некоторые ненужные эффекты для перекрывающихся объектов.

Возвращает: boolean - логическое значение

getWarningHandler()

public WarningCallback getWarningHandler()

Обратный вызов для обработки любых сгенерированных предупреждений. WarningHandler возвращает элемент перечисления ReturnAction, указывающий либо Продолжить, либо Прервать. «Продолжить» — это действие по умолчанию, и операция «Сохранить» продолжается, однако пользователь может также вернуть команду «Прервать», и в этом случае операция «Сохранить» должна быть прекращена.

Возвращает: WarningCallback - Значение IWarningCallback

hashCode()

public native int hashCode()

Возвращает: инт

isCloseResponse()

public boolean isCloseResponse()

Получает логическое значение, указывающее, будет ли объект Response закрыт после сохранения документа в ответ.

Возвращает: boolean - логическое значение

isExtractOcrSublayerOnly()

public boolean isExtractOcrSublayerOnly()

Этот атрибут включает функцию извлечения изображения или текста для документов PDF с подслоем OCR.

Значение: в результирующий документ будет извлечен истинный текст; в противном случае ложь.

Возвращает: boolean - логическое значение

isPagesFlowTypeDependsOnViewersScreenSize()

public boolean isPagesFlowTypeDependsOnViewersScreenSize()

Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, будет помещен в один большой результирующий HTML-файл. Этот флаг определяет, будет ли результирующий HTML генерироваться таким образом, что поток областей, представляющих страницы PDF в результирующем HTML, будет зависеть от разрешения экрана средства просмотра. Предположим, что ширина экрана со стороны зрителя достаточно велика, чтобы разместить 2 или более страниц одну рядом с другой в горизонтальном направлении. Если этот флаг установлен в true, то эта возможность будет использована (будет показано столько страниц в горизонтальном направлении одна рядом с другой, сколько возможно, тогда следующая горизонтальная группа страниц будет показана под первой). В противном случае страницы будут перетекать таким образом: следующая страница всегда идет под предыдущей.

Возвращает: boolean - логическое значение

isRemoveEmptyAreasOnTopAndBottom()

public boolean isRemoveEmptyAreasOnTopAndBottom()

Определяет, будут ли в созданном HTML удаляться верхняя и нижняя пустые области без содержимого (если оно есть).

Возвращает: boolean - логическое значение

isRenderTextAsImage()

public boolean isRenderTextAsImage()

Если для атрибута RenderTextAsImage задано значение true, текст из источника становится изображением в формате HTML. Может быть полезно, чтобы сделать текст недоступным для выбора или HTML-текст не отображается должным образом.

Возвращает: boolean - логическое значение

isSaveFullFont()

public boolean isSaveFullFont()

Указывает, что будет сохранен полный шрифт, поддерживаются только шрифты True Type. По умолчанию SaveFullFont = false и конвертер сохраняет подмножество исходного шрифта, необходимое для отображения текста документа.

Возвращает: boolean - логическое значение

isSaveShadowedTextsAsTransparentTexts()

public boolean isSaveShadowedTextsAsTransparentTexts()

Pdf может содержать тексты, которые затенены другими элементами (например, изображениями), но могут быть выделены в буфер обмена в Acrobat Reader (обычно это происходит, когда документ содержит изображения и извлеченные из них тексты, подвергнутые распознаванию). Эти настройки сообщают конвертеру, нужно ли нам сохранять такие тексты как прозрачные выбираемые тексты в результирующем HTML, чтобы имитировать поведение Acrobat Reader (иначе такие тексты обычно сохраняются как скрытые, недоступные для копирования в буфер обмена)

Возвращает: boolean - логическое значение

isSaveTransparentTexts()

public boolean isSaveTransparentTexts()

Pdf может содержать прозрачные тексты, которые можно выделить в буфер обмена (обычно это происходит, когда документ содержит изображения и извлеченные из него OCR-тексты). Эти настройки сообщают конвертеру, нужно ли нам сохранять такие тексты как прозрачные выбираемые тексты в результирующем HTML.

Возвращает: boolean - логическое значение

isTryMergeAdjacentSameBackgroundImages()

public boolean isTryMergeAdjacentSameBackgroundImages()

Иногда PDF-файлы содержат фоновые изображения (страниц или ячеек таблицы), составленные из нескольких одинаковых мозаичных фоновых изображений, расположенных рядом друг с другом. В этом случае визуализаторы целевых форматов (например, MsWord для формата DOCS) иногда создают видимые границы между частями фоновых изображений, поскольку их методы сглаживания краев изображения (сглаживания) отличаются от Acrobat Reader. Если кажется, что экспортированный документ содержит такие видимые границы между частями одних и тех же фоновых изображений, попробуйте использовать этот параметр, чтобы избавиться от этого нежелательного эффекта. ВНИМАНИЕ! Такая оптимизация качества обычно существенно замедляет конвертацию, поэтому, пожалуйста, используйте эту опцию только тогда, когда это действительно необходимо.

Возвращает: boolean - логическое значение

isTrySaveTextUnderliningAndStrikeoutingInCss()

public boolean isTrySaveTextUnderliningAndStrikeoutingInCss()

Сам PDF не содержит маркеров подчеркивания для текстов. Он эмулируется строкой, расположенной под текстом. Эта опция позволяет конвертеру попытаться угадать, что та или иная строка является подчеркиванием текста, и занести эту информацию в CSS вместо того, чтобы рисовать или подчеркивать графически.

Возвращает: boolean - логическое значение

notify()

public final native void notify()

notifyAll()

public final native void notifyAll()

setAdditionalMarginWidthInPoints(int value)

public void setAdditionalMarginWidthInPoints(int value)

Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, не будет разделен на разные HTML-страницы, а будет помещен в один большой результирующий HTML-файл. Но каждая исходная PDF-страница будет представлена своей собственной прямоугольной областью в HTML (при необходимости эти области могут быть ограничены для отображения краев бумаги страницы с помощью специального атрибута «PageBorderIfAny». Этот параметр определяет ширину поля, которое будет принудительно оставлено вокруг этого выходного HTML-кода. -области, которые представляют собой страницы исходного PDF-документа. По сути, он определяет гарантированный интервал между HTML-представлениями “бумажных” страниц PDF, такой режим преобразования.

Параметры:

ПараметрТипОписание
valueintцелое значение

setAntialiasingProcessing(int antialiasingProcessing)

public void setAntialiasingProcessing(int antialiasingProcessing)

Этот параметр определяет необходимые меры сглаживания при преобразовании составных фоновых изображений из PDF в HTML.

Параметры:

ПараметрТипОписание
antialiasingProcessingintЭлемент AntialiasingProcessingType

setBatchSize(int value)

public final void setBatchSize(int value)

Определяет размер пакета, если пакетное преобразование применимо к паре исходного и целевого форматов.

Параметры:

ПараметрТипОписание
valueint

setCloseResponse(boolean value)

public void setCloseResponse(boolean value)

Устанавливает логическое значение, указывающее, будет ли объект Response закрыт после сохранения документа в ответ.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setCompressSvgGraphicsIfAny(boolean value)

public void setCompressSvgGraphicsIfAny(boolean value)

Устанавливает флаг, указывающий, будет ли найденная графика SVG (если есть) сжата (заархивирована) в формат SVGZ во время сохранения

Значение: HtmlDocumentType.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setConvertMarkedContentToLayers(boolean value)

public void setConvertMarkedContentToLayers(boolean value)

Если для атрибута ConvertMarkedContentToLayers задано значение true, то все элементы внутри помеченного PDF-содержимого (слоя) будут помещены в элемент div HTML с атрибутом «data-pdflayer», указывающим имя слоя. Это имя слоя будет извлечено из необязательных свойств помеченного содержимого PDF. Если этот атрибут имеет значение false (по умолчанию), то никакие слои не будут созданы из содержимого, помеченного PDF.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setCssClassNamesPrefix(String cssClassNamesPrefix)

public void setCssClassNamesPrefix(String cssClassNamesPrefix)

Когда конвертер PDFtoHTML генерирует результирующие CSS, имена классов CSS (что-то вроде «.stl\ _01{}” … “.stl\ _NN{}) генерируются и используются в результирующем CSS. Это свойство позволяет принудительно установить префикс имени класса. Например, если Вы хотите, чтобы все имена классов начинались с ‘my_префикс_’ (т.е. были чем-то вроде ‘мой_префикс_1’…‘мой_префикс_NNN’ ), затем просто назначьте ‘мой_префикс_’ к этому свойству перед преобразованием. Если это свойство останется нетронутым (т.е. в качестве значения будет оставлено значение null ), то конвертер сам сгенерирует имена классов (это будет что-то вроде “.stl\ _01{}” … “.stl\ _NN{}”)

Параметры:

ПараметрТипОписание
cssClassNamesPrefixjava.lang.StringСтроковое значение

setCustomCssSavingStrategy(HtmlSaveOptions.CssSavingStrategy customCssSavingStrategy)

public void setCustomCssSavingStrategy(HtmlSaveOptions.CssSavingStrategy customCssSavingStrategy)

Это поле может содержать стратегию сохранения, которая должна использоваться (если присутствует) во время преобразования Pdf в Html для управления сохранением CSS, связанных с созданным HTML-документом в целом или с его страницами (если создается несколько HTML-страниц). Если вы хотите обрабатывать файл CSS каким-то особым образом, просто создайте соответствующий метод и назначьте делегата, созданного из него, этому свойству.

Параметры:

ПараметрТипОписание
customCssSavingStrategyCssSavingStrategyЭкземпляр CssSavingStrategy

setCustomHtmlSavingStrategy(HtmlSaveOptions.HtmlPageMarkupSavingStrategy customHtmlSavingStrategy)

public void setCustomHtmlSavingStrategy(HtmlSaveOptions.HtmlPageMarkupSavingStrategy customHtmlSavingStrategy)

Результат конвертации может содержать одну или несколько HTML-страниц. Этому свойству можно присвоить делегат, созданный из пользовательского метода, реализующего обработку одной HTML-страницы (точнее - разметки-HTML, без внешних связанных файлов, если таковые имеются), которая была создана во время преобразование. В этом случае обработка (например, сохранение HTML-кода страницы в потоке или на диске) может выполняться в этом пользовательском коде. В таком случае все необходимые действия по сохранению HTML-страницы должны быть выполнены в коде предоставленного метода, т.к. сохранение результата в коде конвертера не будет использоваться. Если обработка в том или ином случае по каким-либо причинам должна производиться самим кодом конвертера, а не в пользовательском коде, пожалуйста, установите в пользовательском коде флаг CustomProcessingCancelled переменной параметра htmlSavingInfo: это будет сигнализировать конвертеру, что все необходимые шаги для обработка этого ресурса должна производиться в самом конвертере так же, как если бы не было никакого внешнего пользовательского кода для обработки.

Параметры:

ПараметрТипОписание
customHtmlSavingStrategyHtmlPageMarkupSavingStrategyЭкземпляр HtmlPageMarkupSavingStrategy

setCustomProgressHandler(UnifiedSaveOptions.ConversionProgressEventHandler customProgressHandler)

public void setCustomProgressHandler(UnifiedSaveOptions.ConversionProgressEventHandler customProgressHandler)

Этот обработчик можно использовать для обработки событий о ходе преобразования, например, для отображения индикатора выполнения или сообщений о текущем количестве обработанных страниц. Пример кода обработчика, показывающего ход выполнения на консоли:


public static void ConvertWithShowingProgress()
     {
     (new com.aspose.pdf.License()).setLicense("Aspose.Total.lic");
     Document doc = new Document("Booklet.pdf");
     HtmlSaveOptions saveOptions = new HtmlSaveOptions();
     saveOptions.CustomProgressHandler = new com.aspose.pdf.UnifiedSaveOptions.ConversionProgressEventHandler() {
     public void invoke(
     UnifiedSaveOptions.ProgressEventHandlerInfo eventInfo) {
     showProgressOnConsole(eventInfo);
     }
     };
     doc.save("Booklet.doc", saveOptions);
     }
     public static void showProgressOnConsole(HtmlSaveOptions.ProgressEventHandlerInfo eventInfo)
     {
     switch (eventInfo.EventType)
     {
     case HtmlSaveOptions.ProgressEventType.TotalProgress:
     System.out.println(String.format("%s  - Conversion progress : %d % .", (new Date()).toString(), eventInfo.Value));
     break;
     case HtmlSaveOptions.ProgressEventType.SourcePageAnalized:
     System.out.println(String.format("%s  - Source page %d of %d analyzed.", (new Date()).toString(), eventInfo.Value, eventInfo.MaxValue));
     break;
     case HtmlSaveOptions.ProgressEventType.ResultPageCreated:
     System.out.println(String.format("%s  - Result page's %d of %d layout created.", (new Date()).toString(), eventInfo.Value, eventInfo.MaxValue));
     break;
     case HtmlSaveOptions.ProgressEventType.ResultPageSaved:
     System.out.println(String.format("%s  - Result page %d of %d exported.", (new Date()).toString(), eventInfo.Value, eventInfo.MaxValue));
     break;
     default:
     break;
     }
     }

Параметры:

ПараметрТипОписание
customProgressHandlerConversionProgressEventHandlerЭкземпляр ConversionProgressEventHandler

setCustomResourceSavingStrategy(HtmlSaveOptions.ResourceSavingStrategy customResourceSavingStrategy)

public void setCustomResourceSavingStrategy(HtmlSaveOptions.ResourceSavingStrategy customResourceSavingStrategy)

Это поле может содержать стратегию сохранения, которую необходимо использовать (если она присутствует) во время преобразования для индивидуальной обработки созданных файлов ресурсов (например, изображений и шрифтов), связанных с узлами сохраненного HTML. Эта стратегия должна обрабатывать ресурсы и возвращать строку, представляющую желаемый URL-адрес сохраненного ресурса в сгенерированном HTML.

Параметры:

ПараметрТипОписание
customResourceSavingStrategyResourceSavingStrategyЭкземпляр ResourceSavingStrategy

setCustomStrategyOfCssUrlCreation(HtmlSaveOptions.CssUrlMakingStrategy customStrategyOfCssUrlCreation)

public void setCustomStrategyOfCssUrlCreation(HtmlSaveOptions.CssUrlMakingStrategy customStrategyOfCssUrlCreation)

Это поле может содержать пользовательский метод, который возвращает URL-адрес (или шаблон URL-адреса, если включена многостраничная генерация — см. подробности ниже) предметного CSS, поскольку он должен быть помещен в сгенерированный результирующий HTML-код. Например, если вы хотите, чтобы конвертер поместил какой-то конкретный URL-адрес вместо стандартного имени файла CSS в сгенерированный CSS-файл, вам нужно просто создать и поместить в это свойство метод, который генерирует желаемый URL-адрес. Если установлен флаг «SplitCssIntoPages», то эта пользовательская стратегия (если есть) должна возвращать не точный URL-адрес CSS, а строку шаблона, которая (после замены заполнителя номером страницы с помощью функции String.Format() внутри конвертера) может быть преобразована в URL-адрес для URL той или иной страницы CSS. Примеры ожидаемой возвращаемой строки в таком случае: ‘SomeTargetLocation-page_{0}.css’,’../PartHandlers/GetCss.aspx?DocumentId=45654&CssPage=\ {0} ’ )

Параметры:

ПараметрТипОписание
customStrategyOfCssUrlCreationCssUrlMakingStrategyЭкземпляр CssUrlMakingStrategy

setDefaultFontName(String value)

public void setDefaultFontName(String value)

Указывает имя установленного шрифта, который используется для замены любого шрифта документа, который не встроен и не установлен в системе. Если null, то используется шрифт замены по умолчанию.

Параметры:

ПараметрТипОписание
valuejava.lang.StringНазвание шрифта

setDocumentType(int value)

public void setDocumentType(int value)

Задает HtmlDocumentType .

Параметры:

ПараметрТипОписание
valueintHtmlDocumentType .

setExcludeFontNameList(String[] excludeFontNameList)

public void setExcludeFontNameList(String[] excludeFontNameList)

Список имен встроенных шрифтов PDF, которые не могут быть встроены в HTML.

Параметры:

ПараметрТипОписание
excludeFontNameListjava.lang.String[]массив строковых элементов

setExplicitListOfSavedPages(int[] value)

public final void setExplicitListOfSavedPages(int[] value)

С помощью этого свойства вы можете явно указать, какие страницы документа должны быть преобразованы. Страницы в этом списке должны иметь номера, начинающиеся с 1. Т.е. действительные номера страниц должны быть взяты из диапазона (1…[NumberOfPagesInConvertedDocument]) Порядок появления страниц в этом списке не влияет на их порядок в результирующей HTML-странице (-ах) - в результирующих страницах всегда будет следовать порядок, в котором они присутствуют в исходном PDF-файле. Если этот список пуст (по умолчанию), все страницы будут преобразованы. Если какой-либо номер страницы этого списка выйдет за пределы диапазона существующих страниц (1-[количество страниц в документе]) будет выдано исключение.

Параметры:

ПараметрТипОписание
valueint[]

setExtractOcrSublayerOnly(boolean value)

public void setExtractOcrSublayerOnly(boolean value)

Этот атрибут включает функцию извлечения изображения или текста для документов PDF с подслоем OCR.

Значение: в результирующий документ будет извлечен истинный текст; в противном случае ложь.


Значение по умолчанию == ложь

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setFixedLayout(boolean value)

public void setFixedLayout(boolean value)

Задает значение, указывающее, создан ли этот HTML как фиксированный макет.

Параметры:

ПараметрТипОписание
valueboolean: верно, если[фиксированная раскладка]; в противном случае ложь.

setFontEncodingStrategy(byte fontEncodingStrategy)

public void setFontEncodingStrategy(byte fontEncodingStrategy)

Определяет специальное правило кодирования для настройки декодирования PDF для текущего документа.

Параметры:

ПараметрТипОписание
fontEncodingStrategybyteЭлемент FontEncodingRules

setFontSavingMode(int fontSavingMode)

public void setFontSavingMode(int fontSavingMode)

Определяет режим сохранения шрифта, который будет использоваться при сохранении PDF в желаемом формате.

Параметры:

ПараметрТипОписание
fontSavingModeintЭлемент FontSavingModes

setHtmlMarkupGenerationMode(int htmlMarkupGenerationMode)

public void setHtmlMarkupGenerationMode(int htmlMarkupGenerationMode)

Иногда предъявляются особые требования к генерации HTML-разметки. Этот параметр определяет режимы подготовки HTML, которые можно использовать во время преобразования PDF в HTML для соответствия таким конкретным требованиям.

Параметры:

ПараметрТипОписание
htmlMarkupGenerationModeintЭлемент HtmlMarkupGenerationModes

setImageResolution(int value)

public void setImageResolution(int value)

Получает или задает разрешение для рендеринга изображения.

Параметры:

ПараметрТипОписание
valueintЗначение: Разрешение

setLettersPositioningMethod(int lettersPositioningMethod)

public void setLettersPositioningMethod(int lettersPositioningMethod)

Задает способ расположения букв в словах в результирующем HTML

Параметры:

ПараметрТипОписание
lettersPositioningMethodintЭлемент LettersPositioningMethods

setMinimalLineWidth(float value)

public void setMinimalLineWidth(float value)

Этот атрибут задает минимальную ширину линии графического контура. Если толщина линии меньше 1 пикселя, Adobe Acrobat округляет ее до этого значения. Таким образом, этот атрибут можно использовать для имитации такого поведения HTML-браузеров.

Параметры:

ПараметрТипОписание
valuefloatплавающее значение

setPageBorderIfAny(SaveOptions.BorderInfo pageBorderIfAny)

public void setPageBorderIfAny(SaveOptions.BorderInfo pageBorderIfAny)

Этот атрибут представляет собой набор настроек, используемых для рисования границы (если есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF. По сути, это касается отображения краев бумаги страницы, а не границы страницы, на которую ссылается сама страница PDF.

Параметры:

ПараметрТипОписание
pageBorderIfAnyBorderInfoЭкземпляр BorderInfo

setPageMarginIfAny(SaveOptions.MarginInfo pageMarginIfAny)

public void setPageMarginIfAny(SaveOptions.MarginInfo pageMarginIfAny)

Этот атрибут представляет набор дополнительных полей страницы (если они есть) в результирующем HTML-документе вокруг области, представляющей исходную страницу PDF.

Параметры:

ПараметрТипОписание
pageMarginIfAnyMarginInfoЭкземпляр MarginInfo

setPagesFlowTypeDependsOnViewersScreenSize(boolean pagesFlowTypeDependsOnViewersScreenSize)

public void setPagesFlowTypeDependsOnViewersScreenSize(boolean pagesFlowTypeDependsOnViewersScreenSize)

Если атрибут ‘SplitOnPages=false’, то весь HTML-код, представляющий все входные PDF-страницы, будет помещен в один большой результирующий HTML-файл. Этот флаг определяет, будет ли результирующий HTML генерироваться таким образом, что поток областей, представляющих страницы PDF в результирующем HTML, будет зависеть от разрешения экрана средства просмотра. Предположим, что ширина экрана со стороны зрителя достаточно велика, чтобы разместить 2 или более страниц одну рядом с другой в горизонтальном направлении. Если этот флаг установлен в true, то эта возможность будет использована (будет показано столько страниц в горизонтальном направлении одна рядом с другой, сколько возможно, тогда следующая горизонтальная группа страниц будет показана под первой). В противном случае страницы будут перетекать таким образом: следующая страница всегда идет под предыдущей.

Параметры:

ПараметрТипОписание
pagesFlowTypeDependsOnViewersScreenSizebooleanлогическое значение

setPartsEmbeddingMode(int partsEmbeddingMode)

public void setPartsEmbeddingMode(int partsEmbeddingMode)

Он определяет, будут ли ссылочные файлы (HTML, шрифты, изображения, CSS) встроены в основной файл HTML или будут сгенерированы как отдельные двоичные объекты.

Параметры:

ПараметрТипОписание
partsEmbeddingModeintЭлемент PartsEmbeddingModes

setPreventGlyphsGrouping(boolean value)

public void setPreventGlyphsGrouping(boolean value)

Этот атрибут включает режим, при котором текстовые глифы не будут группироваться в слова и строки. Этот режим позволяет сохранить максимальную точность при позиционировании глифов на странице и может быть использован для конвертации документов с нотами или глифами, которые необходимо размещать отдельно друг от друга. Другой. Этот параметр будет применяться к документу только в том случае, если значение атрибута FixedLayout равно true.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setProgressEventsRetranslator(ConversionProgressEventsTranslator progressEventsRetranslator)

public void setProgressEventsRetranslator(ConversionProgressEventsTranslator progressEventsRetranslator)

Представляет внутренний обработчик событий выполнения, который работает во время преобразования и переводит события преобразования внутренних этапов преобразования во внешние общие события выполнения. Также класс транслирует события, которые позволяют высвободить ресурсы, которые больше не нужны.[Другой формат] progress для расчета общего прогресса и информирования кода клиента об этих событиях общего прогресса. Этот класс использует два типа событий: преобразование модели ApsToExternal и события преобразования Pdf в APS для создания событий общего прогресса Экспорт состоит из трех этапов: 1) Pdf в Aps 2) Распознавание приложений 3_ Экспорт приложений в целевой формат Конструктор позволяет настроить, сколько страниц конвертируется и какова приблизительная часть того или иного этапа в общем прогрессе

Параметры:

ПараметрТипОписание
progressEventsRetranslatorcom.aspose.pdf.ConversionProgressEventsTranslatorЭкземпляр ConversionProgressEventsTranslator

setRasterImagesSavingMode(int rasterImagesSavingMode)

public void setRasterImagesSavingMode(int rasterImagesSavingMode)

Преобразованный PDF может содержать растровые изображения. Этот параметр определяет, как они должны обрабатываться при преобразовании PDF в HTML.

Параметры:

ПараметрТипОписание
rasterImagesSavingModeintЭлемент RasterImagesSavingModes

setRemoveEmptyAreasOnTopAndBottom(boolean removeEmptyAreasOnTopAndBottom)

public void setRemoveEmptyAreasOnTopAndBottom(boolean removeEmptyAreasOnTopAndBottom)

Определяет, будут ли в созданном HTML удаляться верхняя и нижняя пустые области без содержимого (если оно есть).

Параметры:

ПараметрТипОписание
removeEmptyAreasOnTopAndBottombooleanлогическое значение

setRenderTextAsImage(boolean value)

public void setRenderTextAsImage(boolean value)

Если для атрибута RenderTextAsImage задано значение true, текст из источника становится изображением в формате HTML. Может быть полезно, чтобы сделать текст недоступным для выбора или HTML-текст не отображается должным образом.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setSaveFullFont(boolean saveFullFont)

public void setSaveFullFont(boolean saveFullFont)

Указывает, что будет сохранен полный шрифт, поддерживаются только шрифты True Type. По умолчанию SaveFullFont = false и конвертер сохраняет подмножество исходного шрифта, необходимое для отображения текста документа.

Параметры:

ПараметрТипОписание
saveFullFontbooleanлогическое значение

setSaveShadowedTextsAsTransparentTexts(boolean saveShadowedTextsAsTransparentTexts)

public void setSaveShadowedTextsAsTransparentTexts(boolean saveShadowedTextsAsTransparentTexts)

Pdf может содержать тексты, которые затенены другими элементами (например, изображениями), но могут быть выделены в буфер обмена в Acrobat Reader (обычно это происходит, когда документ содержит изображения и извлеченные из них тексты, подвергнутые распознаванию). Эти настройки сообщают конвертеру, нужно ли нам сохранять такие тексты как прозрачные выбираемые тексты в результирующем HTML, чтобы имитировать поведение Acrobat Reader (иначе такие тексты обычно сохраняются как скрытые, недоступные для копирования в буфер обмена)

Параметры:

ПараметрТипОписание
saveShadowedTextsAsTransparentTextsbooleanлогическое значение

setSaveTransparentTexts(boolean saveTransparentTexts)

public void setSaveTransparentTexts(boolean saveTransparentTexts)

Pdf может содержать прозрачные тексты, которые можно выделить в буфер обмена (обычно это происходит, когда документ содержит изображения и извлеченные из него OCR-тексты). Эти настройки сообщают конвертеру, нужно ли нам сохранять такие тексты как прозрачные выбираемые тексты в результирующем HTML.

Параметры:

ПараметрТипОписание
saveTransparentTextsbooleanлогическое значение

setSimpleTextboxModeGrouping(boolean value)

public final void setSimpleTextboxModeGrouping(boolean value)

Этот атрибут указывает последовательную группировку глифов и слов в строки. Например, теги и слова имеют разный порядок в преобразованном HTML, и вы хотите, чтобы они совпадали. Этот параметр будет применяться к документу только в том случае, если значение атрибута FixedLayout равно true.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setSpecialFolderForAllImages(String specialFolderForAllImages)

public void setSpecialFolderForAllImages(String specialFolderForAllImages)

Получает или задает путь к каталогу, в который должны быть сохранены любые изображения, если они встречаются при сохранении документа в формате HTML. Если параметр пуст или нулевой, то файлы изображений (если они есть) будут сохранены вместе с другими файлами, связанными с HTML. Это ни на что не влияет, если свойство CustomImageSavingStrategy было успешно использовано для обработки соответствующего файла изображения.

Параметры:

ПараметрТипОписание
specialFolderForAllImagesjava.lang.StringСтроковое значение

setSpecialFolderForSvgImages(String specialFolderForSvgImages)

public void setSpecialFolderForSvgImages(String specialFolderForSvgImages)

Получает или задает путь к каталогу, в который должны быть сохранены только SVG-изображения, если они встречаются при сохранении документа в формате HTML. Если параметр пустой или нулевой, то файлы SVG (если они есть) будут сохранены вместе с другими файлами-изображениями (рядом с выходным файлом) или в специальную папку для изображений (если это указано в опции SpecialImagesFolderIfAny). Это ни на что не влияет, если свойство CustomImageSavingStrategy было успешно использовано для обработки соответствующего файла изображения.

Параметры:

ПараметрТипОписание
specialFolderForSvgImagesjava.lang.StringСтроковое значение

setSplitCssIntoPages(boolean value)

public void setSplitCssIntoPages(boolean value)

Когда выбран многостраничный режим (т.е. ‘SplitIntoPages’ имеет значение ’true’), то этот атрибут определяет, должен ли быть создан отдельный CSS-файл для каждой результирующей HTML-страницы. По умолчанию этот атрибут имеет значение false, поэтому для всех создаваемых страниц будет создан один большой общий CSS. Суммарный размер всех CSS, сгенерированных в этом режиме (один CSS на страницу), обычно намного больше, чем размер одного большого файла CSS, потому что в первом случае классы CSS дублируются в таком случае в нескольких файлах CSS для каждой страницы. Таким образом, этот параметр хуже использовать только тогда, когда Вы заинтересованы в дальнейшей обработке каждой HTML-страницы независимо, и поэтому размер CSS каждой отдельной страницы, разобранной на части, является наиболее критичным вопросом.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setSplitIntoPages(boolean value)

public void setSplitIntoPages(boolean value)

Устанавливает флаг, указывающий, будет ли каждая страница исходного документа преобразована в свой собственный целевой HTML-документ, т.е. будет ли результирующий HTML разбит на несколько HTML-страниц.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setTryMergeAdjacentSameBackgroundImages(boolean tryMergeAdjacentSameBackgroundImages)

public void setTryMergeAdjacentSameBackgroundImages(boolean tryMergeAdjacentSameBackgroundImages)

Иногда PDF-файлы содержат фоновые изображения (страниц или ячеек таблицы), составленные из нескольких одинаковых мозаичных фоновых изображений, расположенных рядом друг с другом. В этом случае визуализаторы целевых форматов (например, MsWord для формата DOCS) иногда создают видимые границы между частями фоновых изображений, поскольку их методы сглаживания краев изображения (сглаживания) отличаются от Acrobat Reader. Если кажется, что экспортированный документ содержит такие видимые границы между частями одних и тех же фоновых изображений, попробуйте использовать этот параметр, чтобы избавиться от этого нежелательного эффекта. ВНИМАНИЕ! Такая оптимизация качества обычно существенно замедляет конвертацию, поэтому, пожалуйста, используйте эту опцию только тогда, когда это действительно необходимо.

Параметры:

ПараметрТипОписание
tryMergeAdjacentSameBackgroundImagesbooleanлогическое значение

setTrySaveTextUnderliningAndStrikeoutingInCss(boolean trySaveTextUnderliningAndStrikeoutingInCss)

public void setTrySaveTextUnderliningAndStrikeoutingInCss(boolean trySaveTextUnderliningAndStrikeoutingInCss)

Сам PDF не содержит маркеров подчеркивания для текстов. Он эмулируется строкой, расположенной под текстом. Эта опция позволяет конвертеру попытаться угадать, что та или иная строка является подчеркиванием текста, и занести эту информацию в CSS вместо того, чтобы рисовать или подчеркивать графически.

Параметры:

ПараметрТипОписание
trySaveTextUnderliningAndStrikeoutingInCssbooleanлогическое значение

setUseZOrder(boolean value)

public void setUseZOrder(boolean value)

Если для атрибута UseZORder установлено значение true, графика и текст добавляются в результирующий HTML-документ в соответствии с Z-порядком в исходном PDF-документе. Если этот атрибут имеет значение false, вся графика помещается в один слой, что может вызвать некоторые ненужные эффекты для перекрывающихся объектов.

Параметры:

ПараметрТипОписание
valuebooleanлогическое значение

setWarningHandler(WarningCallback value)

public void setWarningHandler(WarningCallback value)

Обратный вызов для обработки любых сгенерированных предупреждений. WarningHandler возвращает элемент перечисления ReturnAction, указывающий либо Продолжить, либо Прервать. «Продолжить» — это действие по умолчанию, и операция «Сохранить» продолжается, однако пользователь может также вернуть команду «Прервать», и в этом случае операция «Сохранить» должна быть прекращена.

Параметры:

ПараметрТипОписание
valueWarningCallbackЗначение IWarningCallback

toString()

public String toString()

Возвращает: java.lang.String

wait()

public final void wait()

wait(long arg0)

public final native void wait(long arg0)

Параметры:

ПараметрТипОписание
arg0long

wait(long arg0, int arg1)

public final void wait(long arg0, int arg1)

Параметры:

ПараметрТипОписание
arg0long
arg1int