DocSaveOptions

DocSaveOptions class

Сохранить параметры для экспорта в формат Doc

public class DocSaveOptions : UnifiedSaveOptions, IPipelineOptions

Конструкторы

Имя Описание
DocSaveOptions() Конструктор по умолчанию.

Характеристики

Имя Описание
AddReturnToLineEnd { get; set; } Использовать разрывы абзаца или строки
BatchSize { get; set; } Определяет размер пакета, если пакетное преобразование применимо к паре исходного и целевого форматов.
CloseResponse { get; set; } Получает или задает логическое значение, указывающее, будет ли объект Response закрыт после сохранения документа в response.
ExtractOcrSublayerOnly { get; set; } Этот атрибут включает функцию извлечения изображения или текста для документов PDF с подслоем OCR.
Format { get; set; } Формат вывода
ImageResolutionX { get; set; } Преобразованные изображения с разрешением X.
ImageResolutionY { get; set; } Преобразованные изображения с разрешением Y.
MaxDistanceBetweenTextLines { get; set; } Этот параметр используется для группировки строк текста в абзацы. Определяет, насколько далеко друг от друга могут быть две относительные строки текста. Указывается в сотнях процентов от высоты строки текста.
MemorySaveModePath { get; set; } Определяет путь (имя файла или имя каталога) для хранения временных данных при преобразовании в режиме сохранения памяти.
Mode { get; set; } Режим распознавания.
RecognizeBullets { get; set; } Включить распознавание пуль
RelativeHorizontalProximity { get; set; } В Pdf слова могут быть внутренне представлены операторами, которые печатают words , независимо печатая их буквы или слоги. Таким образом, для обнаружения слов иногда нам нужно определить группы независимых символов, которые на самом деле являются словами. Этот параметр определяет ширину интервала между элементами текста (буквами, слогами) , который должен рассматриваться как расстояние между словами при распознавании слов в исходном PDF. . (наличие пробела хотя бы при такой ширине между буквами означает, что элементы текста относятся к разным словам). Нормировано к размеру шрифта - 1.0 означает 100% размера шрифта предполагаемого слова. ВНИМАНИЕ! Используется только в случаях когда исходный PDF-файл содержит определенные редко используемые шрифты , для которых невозможно вычислить оптимальное значение из шрифта. Таким образом, в подавляющем большинстве случаев этот параметр ничего не меняет в результирующем документе.
SaveFormat { get; } Формат сохранения данных.
WarningHandler { get; set; } Обратный вызов для обработки любых сгенерированных предупреждений. WarningHandler возвращает элемент перечисления ReturnAction, указывающий либо Продолжить, либо Прервать. Продолжить — это действие по умолчанию, и операция сохранения продолжается, однако пользователь может также вернуть команду Прервать, и в этом случае операция сохранения должна быть прекращена.

Поля

Имя Описание
CustomProgressHandler Этот обработчик может использоваться для обработки событий процесса преобразования например, его можно использовать для отображения индикатора выполнения или сообщений о текущем количестве обработанных страниц, пример кода обработчика, который показывает ход выполнения на консоли: :
TryMergeAdjacentSameBackgroundImages Иногда PDF-файлы содержат фоновые изображения (страниц или ячеек таблицы) составленные из нескольких одинаковых мозаичных фоновых изображений, расположенных рядом друг с другом. В этом случае визуализаторы целевых форматов (например, MsWord для формата DOCS) иногда создают видимые границы между частями фоновых изображений , , потому что их методы сглаживания краев изображения (сглаживания) отличаются от Acrobat Reader. Если экспортированный документ содержит такие видимые границы между частями одних и тех же фоновых изображений, попробуйте использовать этот параметр, чтобы избавиться от этого нежелательный эффект. ВНИМАНИЕ! Такая оптимизация качества обычно существенно замедляет конвертацию, поэтому, пожалуйста, используйте эту опцию только тогда, когда это действительно необходимо.

Смотрите также