Программы для чтения книг

Довольно таки часто пользователи сталкиваются с проблемой разнообразия файлов в различных форматах и выбором софта для их открытия. Эта новость посвящается формату DJVU.

DjVu (дежа-вю) - это оптимизированный графический формат, предназначенный для хранения отсканированных документов. Этот формат наилучшим образом подходит для создания электронных книг. Как известно, есть два классических способа хранения отсканированной книги: это трудоемкое распознавание (OCR) и последующая подготовка полноценного текстового документа. А те, кто себя особо не хочет обременять распознаванием текстов, выкладывают сами отсканированные картинки, на которых вы увидите страницу книги. Не редко такие изображения объединяют в один pdf документ. В первом случае необходимо потратить время сначала на распознавание текста, а затем - на коррекцию, так как программы распознавания вовсе не идеальны. Во втором случае к закачке мы получаем файлы размером в десятки или, чего доброго, в сотни мегабайт.
Совсем недавно появился компромисс - перевод отсканированных картинок, без распознавания, в формат DjVu. Алгоритм прост - текст и рисунки сохраняются с достаточно большим разрешением 300dpi, а пустая область страницы считается фоном и сохраняется в низком разрешении. Эти свойства формата достаточно хорошо сжимают электронный документ, и, в тоже время, сохраняют его читабельность. Вес отсканированной книги в DjVu формате обычно в пределах нескольких мегабайт.
Особо ценен этот формат для оцифровки различной технической литературы, изобилующей схемами и формулами, ведь в программах для распознавания текста работать с такими данными практически невозможно. В ближайшее будущее формат DjVu станет фактическим стандартом для электронных библиотек технической и научной литературы, а файлы «дежавю» перейдут из разряда экзотикой в широко используемый формат.