Разница между EPUB и FB2
Форматы электронных книг EPUB и FB2 относятся к самым популярным. В чем особенности каждого из них?
Факты о EPUB
Электронная книга, представленная в формате EPUB, имеет структуру, схожую с веб-сайтом со ссылками, однако все ее страницы так или иначе объединены в один файл, который фактически является особой разновидностью ZIP-архива. Данные страницы могут быть представлены в форматах HTML, XHTML, PDF, дополняться графикой, различными шрифтами, стилями. Но для обеспечения связи между разными типами файлов, составляющих контент электронной книги, в стандарте EPUB используются XML-скрипты.
Формат EPUB чаще всего задействуется издателями электронных книг в тех случаях, когда произведение представлено главным образом текстом — в котором немного дополняющих его графических элементов. Это связано с некоторыми сложностями с распознаванием файлов EPUB больших форматов (их величина определяется как раз таки присутствием графики) на ряде устройств.
Вместе с тем формат EPUB, разработанный западными программистами, относится к числу наиболее универсальных. Он поддерживается электронными «читалками» от большинства современных производителей.
Формат EPUB предусматривает защиту цифровых произведений от копирования посредством технологии DRM. Многие магазины электронных книг, а также частные авторы, продающие свою литературу в интернете, пользуются данной возможностью. Цифровое произведение, которое защищено посредством DRM, будет открываться только на определенных устройствах — например, тех, которыми пользуется человек, купивший произведение в онлайне.
Факты об FB2
Электронная книга, представленная в формате FB2, как и выполненная в виде файла EPUB, является XML-документом особой структуры. Каждый из ее элементов имеет собственные теги. В книге, которая выполнена в формате FB2, способны успешно размещаться как текст, так и графика. В XML-коде файла FB2 также можно прописывать различные метаданные — например, содержание книги, наименование произведения, ISBN, сведения об авторе. Соответствующие документы в целях экономии места на диске упаковываются в ZIP-архивы.
Формат FB2 разработан российскими программистами, поэтому он по умолчанию поддерживается не всеми зарубежными производителями электронных книг. Однако есть большое количество приложений для «читалок», которые могут распознавать данный стандарт. Они доступны для скачивания в основных магазинах, таких как Google Play.
Сравнение
Главное отличие EPUB от FB2 заключается в разнообразии XML-алгоритмов, используемых для форматирования текста, а также дополнения его графикой и иными мультимедийными компонентами. Стандарт EPUB традиционно рассматривается специалистами как более функциональный, поскольку XML-алгоритмы, которые им предусмотрены, могут применяться в целях форматирования таких сложных элементов, как, например, формулы. Вместе с тем файлы EPUB имеют больший размер, чем аналогичные по содержанию электронные книги, которые представлены в стандарте FB2.
Еще одно существенное различие между EPUB и FB2 в том, что первый формат позволяет защитить цифровое произведение от несанкционированного копирования. Стандарт FB2 такой возможности не дает.
Определив то, в чем разница между EPUB и FB2, зафиксируем основные выводы в небольшой таблице.
Электронные книги и их форматы: говорим про EPUB — его историю, плюсы и минусы
Ранее в блоге мы писали о том, как появились форматы электронных книг DjVu и FB2.
Тема сегодняшней статьи — EPUB.

Изображение: Nathan Oakley / CC BY
История формата
В то время Microsoft собиралась завоевывать рынок электронных книг и занималась разработкой приложения-читалки для Windows 95. Можно сказать, что создание нового формата являлось частью бизнес-стратегии ИТ-гиганта.
Если говорить о NuvoMedia, то эта компания считается производителем первой массовой электронной читалки Rocket eBook. Внутренняя память устройства составляла всего восемь мегабайт, а время автономной работы не превышало 40 часов. Что касается SoftBook Press, они также занимались разработкой электронных читалок. Но их девайсы имели отличительную особенность — встроенный модем — он позволял скачивать цифровую литературу напрямую из магазина SoftBookstore.
В начале нулевых обе компании — NuvoMedia и SoftBook — были куплены медиакомпанией Gemstar и объединены в Gemstar eBook Group. Эта организация еще несколько лет занималась продажей ридеров (например, RCA REB 1100) и цифровых книг, однако в 2003 году вышла из бизнеса.
Но вернемся к разработке единого стандарта. В 1999 году Microsoft, NuvoMedia и SoftBook Press основали организацию Open eBook Forum, в составе которой стали работать над черновиком документа, положившим начало EPUB. Изначально стандарт назывался OEBPS (расшифровывается как Open EBook Publication Structure). Он позволил распространять цифровую публикацию в одном файле (ZIP-архиве) и упростил перенос книг между различными аппаратными платформами.
Позже к Open eBook Forum присоединились ИТ-компании Adobe, IBM, HP, Nokia, Xerox и издатели McGraw Hill и Time Warner. Все вместе они продолжили разработку OEBPS и занимались развитием экосистемы цифровой литературы в целом. В 2005 году организацию переименовали в Международный форум по цифровым публикациям, или IDPF.
В 2007 году IDPF сменили название формата OEBPS на EPUB и начали разработку его второй версии. Её представили широкой публике в 2010 году. Новинка почти не отличалась от своего предшественника, однако получила поддержку векторной графики и встроенных шрифтов.
К этому времени EPUB завоевывал рынок и стал стандартом по умолчанию для многих издателей и производителей электронных гаджетов. Форматом уже пользовались O’Reilly и Cisco Press, плюс его поддерживали устройства Apple, Sony, Barnes & Noble, ONYX BOOX.
В 2009 году проект Google Books объявил о поддержке EPUB — его использовали для распространения более миллиона бесплатных книг. Популярность формат начал приобретать и у писателей. В 2011 году Джоан Роулинг рассказала о планах запустить сайт Pottermore и сделать его единственной точкой продаж книг Поттерианы в цифровом виде.
Стандартом для распространения литературы был выбран EPUB, в первую очередь из-за его возможности реализовать защиту от копирования (DRM). Все книги в онлайн-магазине писательницы до сих пор доступны только в этом в формате.
Третья версия формата EPUB вышла в 2011 году. Разработчики добавили возможность работать с аудио- и видеофайлами и сносками. Сегодня стандарт продолжает развиваться — в 2017 году IDPF даже вошла в состав консорциума W3C, который внедряет технологические стандарты для Всемирной паутины.
Как устроен EPUB
Книга в формате EPUB представляет собой ZIP-архив. В нем хранится текст публикации в виде XHTML- или HTML-страниц или файлов PDF. Также в архиве лежит медиаконтент (аудио, видео или изображения), шрифты и метаданные. Еще в нем могут находиться дополнительные файлы со стилями CSS или PLS-документы с информацией для сервисов генерации речи.
За отображение контента отвечает XML-разметка. Фрагмент книги со встроенной аудиозаписью и изображением может выглядеть следующим образом:
Помимо контентных файлов в архиве находится специальный навигационный документ (Navigation Document). Он описывает расположение текста и изображений в книге. Приложения-ридеры обращаются к нему в том случае, если читатель желает «перескочить» через несколько страниц.
Еще один обязательный файл в архиве — package. Он включает в себя метаданные — информацию об авторе, издателе, языке, названии и так далее. Туда же входит перечень (spine) подразделов книги. Пример package-документа можно посмотреть в репозитории IDPF на GitHub.
Достоинства
Преимущество формата — его гибкость. EPUB позволяет создавать динамическую разметку документа, адаптирующуюся под размеры экрана устройства. Это одна из главных причин, почему формат поддерживает большое количество читалок (и других электронных устройств). К примеру, с EPUB работают «из коробки» все ридеры ONYX BOOX: от базовой и 6-дюймовой Caesar 3 до премиальной и 9,7-дюймовой Euclid.

/ ONYX BOOX Caesar 3
Так как формат построен на основе популярных стандартов (XML), его легко конвертировать для чтения в интернете. Также EPUB поддерживает интерактивные элементы. Да, подобные элементы они есть и в PDF, однако добавить их в PDF-документ можно только c помощью проприетарного программного обеспечения. В случае с EPUB они добавляются в книгу разметкой и тегами XML в любом текстовом редакторе.
Другим достоинством EPUB являются функции для людей, испытывающих проблемы со зрением или страдающих дислексией. Стандарт дает модифицировать отображение текста на экране — например, подсветить определённые буквосочетания.
Еще EPUB, как мы уже отметили, дает издателю возможность установить защиту от копирования. При желании продавцы электронных книг могут использовать свои механизмы, ограничивающие доступ к документу. Для этого нужно модифицировать файл rights.xml в архиве.
Недостатки
Для создания EPUB-публикации необходимо разбираться в синтаксисе XML, XHTML и CSS. При этом приходится работать с большим количеством меток-идентификаторов. Для сравнения, тот же стандарт FB2 включает в себя лишь минимально необходимый набор тегов — достаточный для верстки художественной литературы. А для создания PDF-документов вообще не требуются особые знания — за все отвечает специализированное ПО.
Также EPUB критикуют за сложность оформления комиксов и других книг со множеством иллюстраций. В этом случае издателю приходится создавать статичный макет с фиксированными координатами для каждой картинки — на это может уходить много сил и времени.
Что дальше
Сейчас IDPF работает над новыми спецификациями для формата. Например, одна из них поможет создавать интерактивные учебные пособия со скрытыми разделами. Одна и та же книга будет по-разному выглядеть для преподавателя и студента — во втором случае окажутся скрыты, например, ответы на тесты или контрольные вопросы.

Изображение: Guian Bolisay / CC BY-SA
Ожидается, что новая функция поможет реорганизовать образовательный процесс. Сегодня EPUB довольно активно используется крупными вузами, например Оксфордским университетом. Несколько лет назад они добавили в свое приложение с цифровой библиотекой поддержку EPUB 3.0.
Также IDPF создает спецификацию для внедрения в EPUB сносок Open Annotation. Этот стандарт разработали в W3C в 2013 году — он упрощает работу со сложными видами аннотаций. Например, с его помощью можно поставить примечание к определенному участку JPEG-изображения. Дополнительно стандарт реализует механизм синхронизации изменений в аннотациях между копиями одного EPUB-документа. Примечания формата Open Annotation можно добавлять в EPUB-файлы и сейчас, однако формальная спецификация для них пока не принята.
Также ведется работа над новой версией стандарта — EPUB 3.2. В ней появятся форматы WOFF 2.0 и SFNT, которые используются для сжатия шрифтов (в некоторых случаях они позволяют сократить размеры файла на 30%). Также разработчики заменят некоторые устаревшие атрибуты HTML. Например, вместо отдельного элемента trigger для активации аудио- и видеофайлов в новом стандарте будут нативные HTML-элементы audio и video.
Черновик спецификации и список изменений уже доступны в GitHub-репозитории W3C.
Какой формат файлов для электронной книги лучше — FB2 или EPUB?
Содержание
Содержание
С появлением мобильных гаджетов электронные книги сравнялись или даже опередили по популярности свои бумажные аналоги. Если вы заядлый книгоман, то вам необходимо ориентироваться не только в специализированных электронных «читалках», но и знать существующие форматы. Мы рассмотрим наиболее популярные форматы для чтения — FB2 и EPUB.
Что такое FB2 и EPUB
Любой файл — это всего лишь набор битов, единичек и нулей. Формат же позволяет конкретному программному обеспечению определять, как именно работать с этим набором битов. Например, текстовый файл может иметь формат docx или txt, для изображений популярны jpg, png, tif и так далее. Каждый формат имеет свою структуру, которая во многом определяет возможности работы с данными.
Если говорить про электронные книги, то тут также существует целый список форматов. Помимо уже знакомых pdf и txt пользователи могут столкнуться с ePub, mobi, fb2, lrf, kf8 и не только. Общепризнанным и самым популярным форматом в мире считается ePub, а на территории стран СНГ активно распространен fb2.
Зачем в принципе нужно знать форматы — неужели недостаточно просто скачать желанную книгу и насладиться чтением? Знание форматов будет полезным по нескольким причинам.
Во-первых, это пригодится при покупке ридеров. Например, многие гаджеты «из коробки» не поддерживают формат fb2, другие имеют лишь ограниченную поддержку. В таком случае для чтения книг вам придется устанавливать кастомную прошивку или дополнительные программы. Альтернативный вариант — конвертирование форматов, но далеко не каждое разрешение можно преобразовать в другое.
Во-вторых, каждый формат имеет свои преимущества и недостатки, поэтому подходит далеко не для всех задач. Например, если сравнивать техническую и научную литературу, то в последней помимо текста часто встречаются изображения и формулы — насколько удобно будет с ними работать также зависит от формата книги.
Формат ePub был разработан Международным форумом по цифровым публикациям в 2007 году. Книга представляет собой ZIP-архив, внутри которого могут располагаться ХHTML-файлы, изображения, таблицы стилей и другие данные. По своей сути, ePub можно назвать практически полноценным веб-сайтом, а с поддержкой HTML5 появилась возможность встраивать даже видео и аудио.
ePub активно используется крупными издателями и во многом благодаря возможности ограничить несанкционированное копирование с помощью DRM защиты. Поддержка ePub реализована практически в каждом ридере, а в большинстве заграничных магазинов электронные книги распространяются исключительно в ePub.
Формат FB2 (FictionBook) в 2006 году создала группа энтузиастов во главе с Дмитрием Грибовым, директором небезызвестной компании «ЛитРес», и Михаилом Мацневым — создателем приложения Haali Reader. Стоит отметить, что существовал формат FB1, но это была экспериментальная версия, которая сейчас уже не поддерживается.
Фактически, такой документ не имеет привязки к аппаратному обеспечению или формату бумаги, нигде не указана и единица измерения — дюйм, пиксель или кегль. Такая универсальность и выводит FB2 в список самых популярных форматов. Однако в отличие от ePub здесь не предусмотрена защита от копирования, из-за чего формат не применяется издателями в коммерческих целях.
Многие считают FB2 устаревшим, поскольку его развитие фактически закончилось в 2008 году, в то время как последняя версия ePub 3.1 датируется 2017 годом. Существует бета-версия FB3, но пока она не получила распространения, а поддерживают ее лишь некоторые ридеры Onyx Boox.
Сравнение FB2 и EPUB: преимущества и недостатки
Для начала отметим, что воспользоваться полным списком преимуществ каждого формата можно только в том случае, если ридер или программа имеют полную поддержку.
EPUB — международный формат электронных книг, поэтому он считается практически универсальным. Его гибкость позволяет создавать разметку, которая без проблем будет адаптироваться под различные экраны. Реализована поддержка следующих элементов:
Также файлы в формате ePub весят меньше по сравнению с FB2, причем разница может быть практически вдвое. Если на устройстве ограниченный объем памяти, то хранить большую библиотеку книг в ePub будет выгоднее.
Одна из проблем — сложность конвертации в другие форматы. ePub это фактически zip-архив с достаточно сложной структурой, CSS-стилями и другими элементами. Конвертору необходимо не только все это распаковать, но и правильно определить содержимое — стили, картинки, шрифты. После следует «упаковать» все это обратно, например, в XML-документ, выставив соответствующие теги в нужных местах. При неправильном конвертировании картинки или блоки текста могут «поехать» или даже потеряться. Впрочем, современные конверторы вполне справляются с задачами преобразования ePub в другие форматы.
FB2 — это отечественный формат электронных книг, который по возможностям лишь незначительно уступает ePub. Например, FB2 также поддерживает встраиваемые картинки, но задать им выравнивание, наложение или другие эффекты невозможно. Реализовано и интерактивное оглавление, но перейти можно только через якорные ссылки, которые ведут непосредственно на части текста, отмеченные как заголовки. Возможностей форматирования текста меньше, нет поддержки таблицы стилей и формул.
Главная же проблема — невысокая распространенность, из-за чего некоторые ридеры в стандартной прошивке не способны читать файлы FB2. С другой стороны вы получаете куда более легкие файлы, а текст легко и быстро адаптируются под различные экраны.
| EPUB | FB2 | |
| Структура | zip-архив с набором файлов | Один XML-документ |
| Размер файла | Меньше | Больше |
| Форматирование | Изображения, базовая разметка, интерактивные элементы, блочная верстка | Изображения, базовая разметка |
| Интерактивное оглавление | Да | Да |
| Совместимость с ридерами | Полная | Частичная |
| Расположение сносок | Только в конце | На странице и в конце |
| Конвертируемость в другие форматы | Срдне-низкая | Высокая |
Формат ePub имеет больший функционал и возможности оформления по сравнению с FB2, однако в рамках художественной литературы эти преимущества обычно не играют большой роли, особенно для читателей. FB2 предлагает все основные элементы базовой разметки, поэтому с удобством в чтении, особенно на смартфонах, не возникает проблем, но файлы этого формата весят больше.
Большинству пользователей при чтении художественных произведений будет одинаково удобен как ePub, так и FB2, если в самих файлах реализованы все удобства вроде интерактивного оглавления и сносок. Выбор стоит делать только с учетом свободной памяти и поддержки формата самим устройством. Однако для научной и учебной литературы, где имеются многочисленные изображения и даже формулы, лучше всего подойдет именно EPUB.
Fb2 epub что за форматы
Какой формат чтения лучше? Давайте попробуем разобрать самые популярные электронные форматы и выбрать из них лучший.
Носить с собой десятки книг в электронной «читалке» гораздо удобнее, чем таскаться с тяжёлым томиком. А ещё ридер безопасен для зрения, у него много дополнительных функций вроде встроенных словарей и он поддерживает разные форматы электронного контента. Отвечая на вопрос, какой формат чтения лучше, выбрали несколько самых популярных:
Многие форматы можно конвертировать один в другой: например, если у вас есть файл в DOC, его можно превратить в FB2. А если заморачиваться с конвертированием не хочется, выбирайте ридеры, которые поддерживают большинство популярных форматов.
Хотите что-то спросить – сделайте это в комментариях, а мы постараемся найти исчерпывающий ответ. А если Вас интересуют книжные новинки, тогда предлагаем самые ожидаемые книги октябрь 2021.
Электронные книги и их форматы: FB2 и FB3 — история, плюсы, минусы и принципы работы
В прошлом материале мы рассказывали об особенностях формата DjVu. Сегодня мы решили остановиться на формате FictionBook2, более известном как FB2, и его «наследнике» FB3.
Появление формата
В середине 90-х годов энтузиасты начали оцифровывать советские книги. Они переводили и сохраняли литературу в самых разнообразных форматах. Одна из первых библиотек в Рунете — Библиотека Максима Мошкова — использовала форматированный текстовый файл (TXT).
Выбор в его пользу был сделан из-за устойчивости к повреждению байтов и универсальности — TXT открывается на любой операционной системе. Однако он затруднял обработку хранимой текстовой информации. Например, для перехода на тысячную строку приходилось обрабатывать 999 строк, идущих перед ней. Книги также хранили в «вордовских» документах и PDF — последний было сложно преобразовывать в другие форматы, а слабые компьютеры открывали и отображали PDF-документы с задержками.
Также для «хранения» электронной литературы использовали HTML. Он упростил индексацию, преобразование в другие форматы и создание документов (разметку текста тегами), но привнес собственные недостатки. Одним из самых значимых была «расплывчатость» стандарта: он позволял определенные вольности при написании тегов. Некоторые из них должны были быть закрыты, другие (например,
) — закрывать было необязательно. Сами теги могли иметь произвольный порядок вложения.
И хотя подобная работа с файлами не поощрялась — такие документы считались некорректными — стандарт требовал от ридеров попробовать отобразить содержимое. Здесь и возникали сложности, так как в каждом приложении процесс «домысливания» был реализован по-своему. При этом на тот момент имеющиеся на рынке устройства и приложения для чтения понимали один-два специализированных формата. Если книга имелась в одном формате, её приходилось переформатировать, чтобы прочесть. Решить все эти недостатки и был призван FictionBook2, или FB2, который взял на себя первичное «причесывание» текста и конвертацию.
Отметим, что у формата была первая версия — FictionBook1 — однако она носила лишь экспериментальный характер, просуществовала недолго, на сегодняшний день не поддерживается и не имеет обратной совместимости. Поэтому под FictionBook чаще всего подразумевают его «последователя» — формат FB2.
FB2 создала группа разработчиков, возглавляемая Дмитрием Грибовым, который является техническим директором компании «ЛитРес», и Михаилом Мацневым, создателем читалки Haali Reader. В основу формата лег XML, который строже, чем HTML, регламентирует работу с незакрытыми и вложенными тегами. XML-документ сопровождается так называемой XML-схемой. XML-схема — это специальный файл, в котором собраны все теги и описаны правила их применения (последовательность, вложенность, обязательность и необязательность и др.). В FictionBook схема находится в файле FictionBook2.xsd. Пример XML-схемы вы можете найти по ссылке (она используется магазином электронных книг «ЛитРес»).
Структура документа FB2
Тег содержит таблицы стилей, чтобы облегчить конвертацию в другие форматы. В лежат закодированные с помощью base64 данные, которые могут понадобится для рендеринга документа.
Элемент содержит всю необходимую информацию о книге: жанр произведения, список авторов (Ф. И. О., адрес электронной почты и сайт в интернете), название, блок с ключевыми словами, аннотацию. Также в нем может быть информация о вносимых в документ изменениях и данные об издателе книги, если она выпускалась на бумажном носителе.
Вот так выглядит часть блока в записи FictionBook для произведения «Этюд в багровых тонах» Артура Конана Дойла, взятого из Проекта «Гутенберг»:
FictionBook также предоставляет несколько тегов для работы с гиперссылками. Они основываются на спецификации XLink, разработанной консорциумом W3C специально для создания ссылок между различными ресурсами в XML-документах.
Достоинства формата
Стандарт FB2 включает в себя лишь минимально необходимый набор тегов (достаточный для «оформления» художественной литературы), что упрощает его обработку ридерами. Причем в случае прямой работы ридера с форматом FB, пользователь получает возможность настроить под себя практически все параметры отображения.
Строгая структура документа позволяет автоматизировать процесс преобразования из формата FB в любой другой. Эта же структура дает возможность работать с отдельными элементами документов — настраивать фильтры по авторам книг, названию, жанру и др. По этой причине формат FB2 и приобрел популярность в Рунете, став стандартом по умолчанию в российских электронных библиотеках и библиотеках стран СНГ.
Недостатки формата
Простота формата FB2 является его достоинством и недостатком одновременно. Это ограничивает функционал для сложной верстки текста (например, примечаний на полях). В нем нет векторной графики и поддержки нумерованных списков. По этой причине формат не очень подходит для учебников, справочников и технической литературы (об этом даже говорит само название формата — fiction book, или «художественная книга»).
При этом, чтобы отобразить минимальную информацию о книге — название, автора и обложку — программе требуется обработать практически весь XML-документ. Это связано с тем, что метаданные располагаются в начале текста, а изображения — в конце.
FB3 — развитие формата
В связи с возросшими требованиями к форматированию текстов книг (и чтобы нивелировать некоторые из недостатков FB2), Грибов начал работу над форматом FB3. Позже разработка остановилась, но в 2014 году была возобновлена.
По словам авторов, они изучили реальные потребности при издании технической литературы, посмотрели учебники, справочники, пособия и очертили более конкретный набор тегов, который бы позволил отобразить любую книгу.
В новой спецификации формат FictionBook представляет собой zip-архив, в котором отдельными файлами хранятся метаданные, изображения и текст. Требования к формату zip-файла и соглашения о его организации прописаны в стандарте ECMA-376, определяющем Open XML.
Был сделан ряд улучшений, связанных с форматированием (разрядка, подчеркивание) и добавлен новый объект — «блок» — оформляющий произвольный фрагмент книги в виде четырехугольника и способный внедряться в текст с обтеканием. Появилась поддержка нумерованных и маркированных списков.
FB3 распространяется по свободной лицензии и имеет открытый код, поэтому издателям и пользователям доступны все утилиты: конвертеры, облачные редакторы, читалки. Текущую версию формата, читалку и редактор можно найти в репозитории проекта на GitHub.
В целом FictionBook3 пока менее распространён, чем его старший брат, однако книги в этом формате уже предлагают несколько электронных библиотек. А в «ЛитРес» еще пару лет назад заявляли о намерении перевести весь свой каталог на новый формат. Часть ридеров уже поддерживает весь необходимый функционал FB3. Например, работать с этим форматом «из коробки» умеют все современные модели ридеров ONYX, например, Darwin 3 или Cleopatra 3.
/ ONYX BOOX Cleopatra 3
Более широкое распространение FictionBook3 позволит сформировать экосистему, ориентированную на полноценную и эффективную работу с текстом на любом устройстве с ограниченными ресурсами: черно-белым или небольшим дисплеем, низким объемом памяти и др. По словам разработчиков, единожды сверстанная книга будет максимально удобной в любой среде.









