Создание djvu файлов. Работа с DjVu-файлами: незаменимые программы для чтения, конвертирования и создания DjVu

Многие пользователи сталкиваются с необходимостью открытия файлов в формате DjVu на компьютере. Формат DjVu, наряду с форматом PDF, является самым популярными форматом для хранения сканированных документов.

Название формата DjVu происходит от французского слова déjà vu - «уже виденное». В данном формате сохраняют сканированные электронные книги и журналы, в основном, энциклопедического, учебного, научного и технического характера, в которых имеется много графики: изображений, картинок, схем и т. п. Пользователи сканируют книги с большим количеством изображений, а затем сохраняют их в электронном виде в файле формата DjVu.

Формат DjVu приобрел популярность, в том числе из-за того, что файл в формате DjVu весит намного меньше аналогичного файла в формате PDF. Это особенно актуально для мобильных устройств, а также полезно для компьютера. Файлы очень большого размера с трудом открывают даже специализированные программы - просмотрщики для файлов данного типа.

Поэтому, во многих случаях, оптимально сохранять документы и картинки в графическом формате DjVu. Документ в формате DjVu имеет в несколько раз меньший размер, чем аналогичный файл, сохраненный в формате PDF.

Чем открыть DjVu? В этой статье я расскажу, как открыть файл DjVu на компьютере в операционной системе Windows. Для этого, нам понадобиться программа открывающая файлы DjVu.

Какой программой открыть файлы с расширением DjVu? Для открытия файлов в формате djvu можно использовать специализированные программы для открытия файлов в DjVu формате, или приложения, поддерживающие открытие нескольких типов файлов текстовых форматов, в том числе «дежавю».

В этой статье я расскажу о 5 программах. Две программы: WinDjView и DjVu Reader, специально созданы для просмотра формата djvu, а три другие: STDU Viewer, Sumatra PDF, Universal Viewer Pro имеют поддержку нескольких форматов, в том числе DjVu.

djvu - сравнительно недавно появившийся формат для сжатия графических файлов. Стоит ли говорить, что компрессия, достигаемая этим форматом, позволяет обычную книгу поместить в файл размером в 5-10мб! Формату pdf до этого далеко…

В основном, в этом формате по сети распространяются книги, картинки, журналы. Для их открытия вам понадобиться одна из ниже-перечисленных программ.

Как открыть файл djvu

1) DjVu Reader

Отличная программа для открытия файлов djvu. Поддерживает настройку яркости, контрасности изображения. С документами можно работать в двух-страничном режиме.

Для открытия файла, нажмите на file/open .

После этого вы увидите содержание документа.

Программа для открытия файлов djvu. Один из самых опасных конкурентов для DjVu Reader. Эта программа более удобна: есть прокрутка всех открытых страниц колесиком мышки, более быстрая работа, вкладки для открытых файлов и пр.

Возможности программы:

  • Вкладки для открытых документов. Есть альтернативный режим открытия каждого документа в отдельном окне.
  • Непрерывный и одностраничный режимы просмотра, возможность отображения разворота
  • Пользовательские закладки и аннотации
  • Поиск по тексту и копирование
  • Поддержка словарей, переводящих слова под указателем мыши
  • Список миниатюр страниц с настраиваемым размером
  • Оглавление и гиперссылки
  • Расширенные возможности печати
  • Полноэкранный режим
  • Режимы быстрого увеличения и масштабирования по выделению
  • Экспорт страниц (или части страницы) в bmp, png, gif, tif и jpg
  • Поворот страниц на 90 градусов
  • Масштаб: страница целиком, по ширине страницы, 100% и пользовательский
  • Настройка яркости, контраста и гаммы
  • Режимы отображения: цветной, чёрно-белый, передний план, задний план
  • Навигация и скроллинг как мышью, так и с клавиатуры
  • Если требуется, ассоциирует себя с файлами DjVu в Проводнике

Открытый файл в WinDjView.

Как создать файл Djvu

1) DjVu Small

Программа для создания файла djvu из картинок формата bmp, jpg, gif и пр. Кстати, программа может не только создавать, но и извлекать из djvu все графические файлы, которые находятся в сжатом формате.

Пользоваться ей очень просто. После запуска программы, вы увидите небольшое окно, в котором за несколько шагов можно создать файл djvu.

1. Для начала нажимаете на кнопку Open Files (красная единичка на скрине ниже) и выбираете те картинки, которые вы хотите запаковать в данный формат.

2. Вторым шагом выбираете место, где будет сохранен созданный файл.

3. Выбираете, что сделать с вашими файлами. Document - > Djvu - это преобразовать документы в формат djvu; Djvu Decoding - этот пункт нужно выбирать, когда вы вместо картинок в первой вкладке выбираете файл djvu, чтобы его извлечь и получить его содержимое.

4. Select encoding profile - выбор качества сжатия. Лучшим вариантом будет эксперимент: взять пару картинок и попробовать их сжать, если качество вас устроит - то затем можно и всю книгу сжать с этими же настройками. Если же нет - то попробовать увеличить качество. Dpi - это количество точек, чем выше это значение - тем лучше качество, и тем больше получается размер исходного файла.

5. Convert - кнопка, которая запускает создание сжатого файла djvu. Время на эту операцию будет зависеть от количества картинок, их качества, мощности ПК и т.д. На 5-6 картинок ушло примерно 1-2 сек. на среднем по мощности компьютере на сегодняшний день. Кстати, ниже приведен скриншот: размер файла получился примерно 24 кб. из 1мб исходных данных. Нетрудно посчитать, что файлы были сжаты в 43* раза!

Еще одна неплохая программа для создания и извлечения файлов djvu. Многим пользователям она кажется не такой удобной и наглядной, как DjVu Small, но все равно рассмотрим процесс создания файла и в ней.

1. Открываете файлы картинок, которые вы отсканировали, скачали, взяли у друзей и пр. Важно! Сначала откройте всего лишь 1 картинку из всех желаемых конвертировать!

Важный момент! Многие не могут открыть картинки в этой программе, т.к. по умолчанию она открывает файлы формата djvu. Чтобы открыть другие графические файлы, просто поставьте в графе типы файлов значение как на картинке снизу.

2. После того, как ваша одна картинка была открыта, можно добавить остальные. Для этого в левом окне программы вы увидите столбик с маленьким превью вашей картинки. Щелкните по ней правой кнопкой мышки и выберите пункт «Insert page after» - добавить страницы (картинки) после этой.

Затем выделяете все картинки, которые хотите сжать и добавляете в программу.

3. Теперь жмете на file/Encode As Djvu - произвести кодирование в Djvu.

В следующем шаге вас просят указать место, где будет сохранен кодированные файл. По умолчанию вам предлагается папка для сохранения та, из которой вы добавляли файлы картинок. Можно выбрать и ее.

Теперь вам необходимо выбрать качество, с которым программа сожмет картинки. Лучше всего, его подобрать экспериментально (т.к. у многих вкусы разные и давать конкретные цифры бесполезно). Просто оставьте сначала по умолчанию, сожмите файлы - затем проверьте, устроит ли вас качество документа. Если не устроит - то затем увеличьте/уменьшите качество и опять проверьте и т.д. пока не найдете свой баланс между размером файла и его качеством.

Файлы в примере были сжаты до 28кб! Довольно неплохо, особенно для тех, кто хочет сэкономить место на диске, или у тех у кого медленный интернет.

В этой статье расскажу как создавать djvu файлы и разбивать их. Допустим у нас есть 200 изображений, которые мы хотим загнать в единый djvu. Устанавливаем программу DjvuSolo. Скачать DjvuSolo (2 Mb) . Идем в File → Open и открываем первую картинку. Затем, щелкаем правой мышкой на эскизе (thumbnail) этого изображения (в левой панели) и выбираем пункт из выпадающего меню "Insert Page(s) After" → "Добавить страницы после"

Выделяем файлы, которые мы хотим добавить. У DjvuSolo наблюдались проблемы при добавлении более 300 файлов одновременно, поэтому лучше добавлять их по 50 или 100, а затем конвертировать все разом.

Для начала конвертирования в djvu жмем File Save As... Появится диалог, в котором нужно выбрать тип сохраняемого файла. Выбираем "Bundled", в следующем диалоге указываем имя файла и папку для сохранения, после нажатия на ОК, появляется диалог выбора типа сжатия djvu файла и установка разрешения в dpi (ставим 300). Для черно-белых книг, где мало фотоизображений, выбираем Bitonal. Запускаем процесс и ждем несколько минут.

Разбиение djvu

Иногда необходимо выдрать несколько страниц или полностью разбить файл djvu на отдельные изображения. Для этого существует програмка djvu2graf. Скачать конвертер djvu (0.8 Mb) . Распаковываем архив djvu_convert. Внутрь этой папки кидаем книжку (например book.djvu), из которой нужно выдрать страницы, и создаем текстовый файл, в котором прописываем

djvu2graf -g tif book.djvu mm
// "mm" - все страницы будут именоваться mm0001.tif,....mm1234.tif...

djvu2graf -g tif -p 6-10 book.djvu mm
// извлекает страницы #6-10 в tif

djvu2graf -g jpg -p 6-10 book.djvu mm
// извлекает страницы 6-10 в jpg

Document Express with DjVu - группа приложений, позволяющих создавать, управлять, записывать и распространять файлы в формате DjVu. Document Express Editor - одна из наиболее распространенных программ для создания и просмотра DjVu-документов на локальном компьютере.
Рассмотрим коротко ее основные возможности и кратко опишем принцип создания DjVu-документов.
В Document Express Editor, можно открывать и конвертировать файлы таких форматов: DjVu (*.djvu, *.djv), BMP (*.bmp), GIF (*.gif), JPEG (*.jpeg, *.jpg), PNM (*.pnm, *.ppm, *.pgm, *.pbm), TIFF (*.tiff, *.tif), PICT (*.pict).

Для создания DjVu-файла нужно отсканировать страницу (меню “Файл” -> “Сканировать”), либо открыть уже готовое изображение поддерживаемого формата (меню “Файл” -> “Открыть”). Если в документ должен быть многостраничный, то при помощи меню “Правка” > “Добавить страницы до...” или “Правка” > “Добавить страницы после...” вставить в документ до или после открытого изображения остальные изображения.

При сохранении файла программа предложит выбрать настройки: распознавать ли текст; профиль; разрешение (от 100 до 600 dpi); качество текста (возможны 5 уровней от «агрессивного», т.е. со значительной потерей до «без потери»), сохранять изображения каждое в отдельном или все в одном файле.

Так называемый профиль – это тоже настройки, только пользователь выбирает тип документа, а программа автоматически подстраивается под тип изображения.

Всего доступны 7 профилей :
1. «Нормальный» – для большинства отсканированных печатных документов
2. «Электронный» – для растровых изображений электронного происхождения, таких, как скриншоты и т.п.
3. «Фото» - для фотографий. При этом функция OCR не работает, поэтому функция поиска и копирования текста в созданном документе не будет работать.
4. «Битональный» - для черно-белых изображений
5. «Рукопись» - для старых или рукописных изданий без рисунков или фотографий
6. «Рисунок» - похож на «Рукопись», но с поддержкой рисунков и фотографий
7. «Карта» - похож на «Рисунок», но с лучшей поддержкой перевернутого текста

Этими настройками, как правило, действительно можно добиться удовлетворительного результата. После того, как настройки заданы, нужно выбрать место на локальном диске и сохранить файл в формате DjVu.
После сохранения добавляется возможность подсвечивать области в документе, вставлять внутренние (для самого документа) и внешние гиперссылки и т.п. Так же если при создании DjVu-документа не было задано распознавание текста, это можно сделать позже. Document Express Editor 6.0.1 умеет распознавать около 100 языков, в том числе русский и украинский.

Вообще вопрос о необходимости добавления текстового OCR-слоя при создании DjVu-документа является дискуссионным. Помимо того, что процедура распознавания текста занимает значительное время, OCR-слой увеличивает размер DjVu-файла. Однако наличие текстового слоя очень удобно при дальнейшей работе с электронной книгой. Во-первых, появляется возможность копировать нужные фрагменты текста для последующей обработки; во-вторых – искать по ключевому слову или выражению в самом DjVu-документе и среди всего множества DjVu-документов как на локальных дисках, так и в сети. Функция поиска по ключевому слову присутствует практически во всех DjVu-программах.

Так как многие DjVu-документы содержат текстовый OCR-слой, у некоторых пользователей создается впечатление, что их можно конвертировать в формат DOC, или подобный. Однако формат DjVu – это графический, а не текстовый формат. Поэтому напрямую конвертировать DjVu-документ в формат "Word-processor" – подобного редактора нельзя. DjVu-файл может лишь содержать встроенный OCR-слой – простой текст без какого-либо форматирования. Используя буфер обмена этот текстовый слой можно перенести в текстовый редактор и вручную форматировать.