栄助兵衛の四方山(よもやま)話

人生いろいろあって楽しい!

電子書籍の新標準「EPUB」とは何か

www.informe.co.jp

電子書籍の新標準「EPUB」とは何か

電子書籍におけるフォーマット

KindleiPadが話題になったことで、このところ一般メディアでも電子書籍に大きな注目が集まっています。出版業界の対応が定まっていない日本では、今すぐ電子書籍が主流になるとは考えにくいのですが、近い将来、一般的な書籍形態として普及する可能性は十分あります。

ところで、ニュースバリュー的にはハードウェアばかりに目が行きがちですが、電子書籍の場合、ハード以上に問題になるのがデータ・フォーマット(およびそれを扱うソフト)です。データの制作方法、レイアウトの品質、あるいは操作性や使い勝手も、フォーマットによって左右されてしまう部分が大きいからです。

電子書籍ではこれまで数多くのフォーマットが作られ、使われてきました。主なものを挙げてみても、プレーンなテキストデータやHTMLのほか、ボイジャーが開発したエキスパンドブック・TTZ・ドットブック、アドビのPDF、シャープのXMDFソニーが採用したBBeB、ΣBookで使われていたebi.j、Kindleで使われるMOBIやAZW、Topazといったようにきりがないほどです。

その多くは互いに互換性がなく、汎用性という点で問題があります。このことが電子書籍全体に与える影響は小さくないでしょう。そのフォーマットが今後高いシェアを得られればいいものの、もし得られなければ読む環境が限られることになり、将来性としても疑問符が付いてしまうわけですから、利用者として手を出しにくくなります。いきおい、フォーマットやビューワのシェア争いは激しくなりますが、肝心の読者は置いてきぼりという感じもありました。

プレーンテキストやHTML、PDFといった汎用性の高いフォーマットを採用すればこういった問題は解消しますが、いずれも電子書籍を読むという点では弱点があります。テキストはレイアウト指定ができませんし、HTMLも機能的に不十分、PDFはレイアウトの再現性は高いものの、版面が固定されているため小画面のデバイスでは読みにくくなります。

こういった問題を踏まえて、電子書籍に適した機能を備え、しかも汎用性の高いフォーマットが求められるようになってきました。そこで最近注目を集めているのがアメリカで開発された「EPUB」というフォーマットです。

EPUBiPadでも採用されましたが、ソニーも自社のBBeBを捨ててサポート、Google BooksでもEPUBに対応しており、世界的には電子書籍フォーマットの主役になりつつあるといっても過言ではないでしょう。なお、InDesign CS3以降であれば、ドキュメントをEPUBフォーマットで書き出すことができます。ただし、元のレイアウトをそのまま完全な形で書き出すというのはなかなか難しく、多くの場合、書き出した後である程度手を入れる必要があります。

EPUBとは

(追記:ここから先はEPUB 2.0.1についての記述。現在の最新バージョンはEPUB 3.0であり、日本語EPUBはほとんど3.0で作られている)

EPUBは、ある程度レイアウトを自由に作ることができ、しかも固定レイアウトでなく、画面のサイズに合わせてコンテンツが流動するという点で、電子書籍に適した特徴を備えたフォーマットです(追記:現在では固定レイアウトタイプのEPUBも登場している)。

EPUBフォーマットを開発したのは出版社や大学、書店、アドビやソニーといったメーカーなどが加盟するInternational Digital Publishing Forum(IDPF)という団体です。IDPFはもともと「Open eBook Forum」という名前の団体で電子書籍のための規格を開発しており、1999年にはOpen eBook PublicationStructure(OeBPS)という規格を公開しています。

その後、IDPFはOeBPSをコンテンツ構造の仕様であるOpen Publication Structure(OPS)と各ファイルをまとめるための仕様Open Packaging Format(OPF)に分割しました。実際には、各ファイルをアーカイブ化する仕様であるOeBPS Container Format(OCF)もあり、この3つの仕様によってEPUBフォーマットは構成されていることになります。

なお、電子書籍には音声読み上げなどの機能を使うことで視覚障害者などでも本を読めるようになるというメリットもあり、以前から障害者向けの開発も進められてきました。DAISYコンソーシアムという団体が作った「DAISY」という規格もその一つで、EPUBにはDAISY 3(DTBook:Digital Talking Book)も扱えるようになっています。

EPUBファイルはZIP圧縮したアーカイブの拡張子を「.epub」に変えただけのものです(mimetypeというファイルだけは無圧縮)。つまり、EPUBファイルの拡張子を「.zip」にすればそのままWindowsで開くことができるわけです。アーカイブの中に必ず一つだけ入っているのがOPFパッケージドキュメントファイル(拡張子「.opf」)で、その他にXHTMLXMLなどで作られたOPSコンテンツドキュメントデータ、画像データ、フォントなどがあり、さらにCSSや各種データが含まれます。なお、OCF規格によると、各ファイルのファイル名はUTF-8でなければならず、また、EPUBアーカイブのルート直下に出版物に関するメタデータや権利などの情報ファイルを収めるMETA-INFというディレクトリも必要です。

OPFドキュメントには、出版物のタイトルや著者名、出版社名などを記述する<metadata>、EPUB出版物を構成するドキュメントや画像、スタイルシートなどのファイルを一覧記述した<manifest>、ドキュメントファイルの読み順を示す<spine>、目次や序文、文献目録のようなドキュメントの参照を示す<guide>といった要素があります。つまり、EPUBのリーダーソフトは、まずOPFファイルを調べて全体の構造を把握し、<manifest>や<spine>に書かれたファイル名を元に各ファイルを読み込むということになります。

次に実際のコンテンツが記述されるOPSコンテンツドキュメントについて見ていきましょう。OPS仕様によると、OPSコンテンツドキュメントは「OPS仕様で定義するXHTMLサブセットとOPSのコンテンツ拡張で構成されるもの」「DTBook仕様に適合したもの」「その他のXMLドキュメント」の3種類です。また、画像にはGIF、PNGJPEGSVGが基本的にサポートされています。

DTBookを除いた純粋なOPS規格として考えると、OPSドキュメントは、推奨するXHTMLボキャブラリ(タグ)を使うというのが基本であり、EPUBに対応するソフトもこれらのボキャブラリは必ずサポートすることになっています。それ以外のボキャブラリを使うXMLEPUBに含めることはできるものの、ドキュメントを実際に表示するソフトがそれを解釈できる保証はありません。

なお、EPUB対応ソフトが解釈できない可能性があるボキャブラリを使ったXMLファイル(アウトオブラインXMLアイランドという)がある場合には、フォールバック処理(他の対応可能なものを表示するなどの代替処理)の指示がOPFドキュメントの<manifest>に記述されなければなりません。また、OPSドキュメント中に部分的に推奨ボキャブラリを使っていない部分がある(インラインXMLアイランドという)場合は、switchという要素を使い、そのボキャブラリを解釈できないソフトでどのように表示するかを指定します。

EPUBにおける日本語の問題

EPUBフォーマットを作ったIDPFの基本的な姿勢は、できるだけデバイスやソフトへ依存する要素を排除し、汎用的なフォーマットを作るということのようです。そのため、EPUBの機能はかなり限定的であり、特に日本語の表示で必要な処理はほとんど考慮されていないというのが実際のところです。

たとえば、日本語の書籍で必須となる縦書きへの対応は、EPUBの各仕様書にまったく書かれていません。また、ルビの機能もサポートされておらず、欧文出版物はいいとしても、日本語の出版物をできるだけ紙と同じように読みたいというニーズにはとても応えられないでしょう。

ただし、電子書籍EPUBへの流れは無視できないところまできているのも事実であり、これを憂慮して、日本電子出版協会(JEPA)では縦書き、禁則、ルビといった基本的な仕様をまとめた日本語拡張仕様案を策定し、IDPFに働きかけを行おうとしています。

この働きかけが功を奏するかどうか現時点ではまったく分かりませんが、特定の言語固有の仕様をIDPFがそのまま受け入れるというのは難しいのではないかという気もします(追記:結局、関係者の尽力のおかげでEPUB 3.0には日本語関連の仕様がかなり取り込まれ、正式に日本語をサポートする仕組みが用意された)。

そもそも電子書籍の分野で日本はこれまでかなり先進的な取り組みを行ってきたはずです。Kindleなど電子ペーパーを使うデバイスも、2004年に世界で最初に発売したのはソニーでした。個々の技術で先行しながら規格という点で国際的な標準を作ることができず、結果的に後れを取るというのはデジタルの世界で日本が今までに何度も経験してきたことですが、またしてもその轍を踏んでしまったという感は否めません。

もちろん、EPUBのフォーマットを使っても、日本語独自の機能を日本だけで策定し、それを解釈できる日本語用デバイスを作れば表示することは可能です。しかし、それでは日本独自仕様のデバイスと日本独自仕様のドキュメントが必要ということになり、世界標準から取り残されてしまうことにもなりかねません。もっとも、電子書籍に関しては販売・流通という点でも難問があり、いずれにしても日本でアメリカのようにすんなり普及するという保証はないわけですが。

現在、電子書籍への流れが世界的に加速しつつあるのは間違いありません。しかし、こと日本に関しては短期的な予測がつきにくい状況にあるのも確かです。電子出版が日本でどのように展開していくかは、単なるデバイスのブームとは別の次元にあるわけで、私たちとしてもそういった点に注意して今後も電子書籍を追いかけていく必要があるのではないでしょうか。

(田村 2010.4.19初出)

(田村 2016.11.7更新)