Kindleでアラビア語、多言語 mobi,epub,azw3

シェアする

 Kindle Direct Publishingで電子書籍を出してみたのですが、作業の過程で思わぬ伏兵が待ち構えていました。

 ネット上には、Kindle Direct Publishingで個人出版した経験を書かれたブログ記事などがいくつも見られます。これらを自前にチェックしたところでは、面倒そうなのは税金関係の手続きに見えました。Amazonでは放っておくとアメリカに源泉徴収で30%とられてしまうので、米国への納税義務がないことを証明するため、ファックスで書類を送信したりと、いかにも大変そうでした。ただ、こちらの手続きは現在では電子化されており、Kindle Direct Publishingのサイト上だけですべての操作が完結します。全然大変ではないです。これについては、以下の記事が参考になりました。

Kindle Direct Publishing (KDP):税に関する情報を登録する方法

 さて、伏兵だったのは肝心のファイル作成。
 この本は画像や図版もほぼなく、横書きの文章主体で、非常にシンプルなものです。最近はWordファイルもそのままアップできる、と聞いていたので、ファイル作成については完全に見くびっていました。
 問題になったのはアラビア語です。この本の中には、数はそれほど多くありませんがアラビア語の箇所があり、これがどうにもマトモに出力できないのです。もう、何十通りも変換パターンを試して、七転八倒しました。
 結論から申しますと、2015年2月現在のKindleでは、アラビア語は扱えません! 驚くべき事実です。多分、ヘブライ語もダメだと思います。

 参考になるか分かりませんが、とりあえずわたし自身がたどった作業経緯を記録しておきます。
 原稿作成自体については、主にOpen Office Writerで作業していました。最初テキストファイルで簡単にまとめ、その後Open Office Writerでタイトルや引用などの書式、脚注などをつけていった形です。

 Kindle Direct Publishingのサイトによると、使えるフォーマットは、

Word (DOC または DOCX)
注: 現在、Word については縦書きやルビなどの日本語固有のフォーマットはサポートされていません。
HTML (ZIP、HTM、または HTML)
MOBI (MOBI)
ePub (EPUB)
RTF (リッチ テキスト フォーマット)
TXT (プレーン テキスト)
Adobe PDF (PDF) 注: 現在、日本語の本はサポートされていません。
Kindle Package Format (KPF)

 とあります。
 流石にodtファイルそのままは受け付けていなかったので、とりあえずdoc形式で保存しアップしてみましたがNG。htmlで出力してみてアップしてもNG。
 htmlをブラウザ等で開くと、正常に表示されます。しかしKindle Direct Publishingにアップし、サーバー上での変換プロセスを経るとNGになっています。
 また、htmlにしてみた時点で無用なタグが大量に入っていたりして、アラビア語以前に色々修正する必要を感じました。
 ここら辺りで本腰を据えて、とりあえずepubで編集し直すことにしました。確認にはKindle Previewというプレビューソフトを使いました。

 この時点でアラビア語以前に言えることですが、Open Office WriterやWordで作業することはお薦めしません。既にそうしたワープロ系ツールで作成してしまっている場合は、そこから変換しても良いと思いますが、書き始め段階であれば、可能な限りプレーンテキストで作業した方が良いです。見出しや脚注などの簡単な書式であれば、Markdownなどで入れておけば、色々なツールで簡単に変換できます。ワープロで作ると無用なタグが沢山入って、後で作業が大変になります。わたしは結局、htmlに出力したものをエディタで開き、怒涛の正規表現で綺麗にしてから、calibreに入れてepubにする、という流れになりました(この流れに行き着くまでも紆余曲折がありましたが)。ワープロからcalibreなどに入れてそこで綺麗にする、という流れでも同じです。
 ちなみに、epubの編集ソフトとしては、Sigilというのもメジャーだったようですが、開発が止まっているらしく、一番一般的らしいcalibreにしておきました。この辺も作業を始めてやっと知ったことで、epubに2やら3があるというのも、この時初めて理解しました。epub3は多言語対応のようなので、これで編集すべきです。
 calibreに辿り着く前に、web上の変換ツールを色々試したみたのですが、うまく行きませんでした。odtからepub、odtからmobi、htmlからepub、htmlからmobi、pdfからepub、pdfからmobiなど、色々やってみても、Kindle Previewでは表示が崩れます。この時点ではツールの問題かと思っていましたが、そうではなく、そもそもKindleが使っているmobiというファイル形式ダメなので、何を使っても無駄です

 さて、こんな流れで作業してみますと、calibre上では問題なく表示されます。そこからまた色々なパターンを試してみます。

odt > calibreでepub > Kindle Preview
 一部の文字だけが表示される
odt > calibreでepub > アップロード
 箱(白い四角)になる
odt > calibreでazw3 > Kindle Preview
 一部の文字だけが表示される
odt > calibreでazw3 > アップロード
 エラー
odt > calibreでmobi > Kindle Preview
 文字は表示されるが、語順がおかしい(rtlにならない)
odt > open office writerでepub > Kindle Preview
 エラー
odt > open office writerでepub > calibreで開く
 アラビア語は正しく表示されるが改ページ等がおかしい
 (calibreで開いた段階なので、mobi等に出力すれば同様に表示されなくなると予想)
odt > open office writerでpdf > webツールでepub > Kindle Preview
 一部が表示される、やたら改行された変な状態になる

 これくらいやって、やっと「そもそもmobiがアカンのでは」と気づきました。ネット上で調べると、azw3という新しいファイル形式なら大丈夫、という記述も見られたのですが、azw3に変換してKindle Previewで見てもやっぱりダメです。アップするとそもそも変換過程でエラーになりました。
 また、ついでですが、Open Office Writerの拡張機能であるwriter2epubも使えません。出力されるepubのバージョンのせいなのか、よく分かりません。writer2epubで上手く行ったという記述もネット上に見られるので、アラビア語さえ含まなければ大丈夫なのかもしれません。疲れ果てたので調べていません!
 これもついでですが、→電子ブックファイルのフォーマットを変換するepub mobi lrf pdb pdf rtfというweb上のツールで作業してみると、このサイトは自動翻訳で多言語対応しているらしく、変換後に寄付を募る「私たちを助けてください」という変な日本語の表示が出ます。もちろんここで変換したファイルもNGで、「助けて欲しいのはこっちや!」とヘナヘナになっていました。

 この辺りで参考にしたのは、以下のあたりのページ。

Arabic mobi conversion problems – MobileRead Forums
Problems with RTL texts (Arabic, Hebrew) – MobileRead Forums
Egypt’s BookBake: E-publishing for Arabic (and Everyone Else) – Publishing Perspectives
キャンペーン ・ Provide Direct Publishing Support for Arabic ・ Change.org

 epub3は多言語対応しており、AppleのiBookなどではアラビア語も扱えるようですが、Kindleのmobiはどうにもダメなようです。圧倒的なシェアを持っている筈なのに、愕然としました。先行していただけに、かえって新しいフォーマット等への対応が難しいのかもしれません。
 おそらくヘブライ語もダメなので、両方合わせるとかなり巨大なマーケットを失っていることになるかと思います。ただ、アラビア語圏では著作権関係の法整備がまったくなっていませんし、「そんな世界を相手にしても商売にならん」と判断されたのかもしれません。ネット上には無断スキャンした画像のままのpdfが大量に転がっていますし、わたしが直接見知っている文化圏でも「本なんかコピーして配って当たり前」みたいな雰囲気があります。そもそも、アラブ人一般にあまり本を読みません。まぁ、これはアラブ人に限った話ではなく、読書人口・読書環境などについては、むしろ日本が特例的なのではないかとも思いますが・・。
 多言語と言っても、何せ日本語が大丈夫なくらいですから、中国語や韓国語などは多分問題ないのでしょう(試していません)。右から左に書くアラビア語・ヘブライ語などに限って問題が出るのではないかと思います。

 最終的にどのように対応したかというと、アラビア語をすべて画像にしました。なんというトホホな結末でしょう!(NHKラジオアラビア語講座のKindle版テキストも画像のようです)
 幸い、アラビア語の箇所は限られていたので、手作業でも何とかなりましたが、本格的にやるなら何かツールでも作って一括変換する方法を考えないといけないかもしれません。
 その前に、Amazon Kindleがepub3をキチンと取り入れてくれるのではないかと期待しますが・・。

 ただ、色々不満はあるものの、電子書籍の世界はweb草創期を思わせるところがあり、変な手作り感が面白い面もあります。もう少し経つと色々標準化が進んで、作業や利用環境は楽になると思うのですが、むしろゴチャゴチャしている今の方が遊び場としては楽しいかもしれません。

 それから、書籍『数えられなかった羊』をお買い上げ頂いた方には、アラビア語の部分がちょっとズレていたりして申し訳ございません。画面キャプチャして1つずつトリミングして貼り付ける、という、超原始的な作業の結果です。多分、そこを見ている人はほとんどいらっしゃらないかと思うのですが、「しょうがねぇなぁ」くらいに温く見守って頂けると幸いです。もうほんと、手作りすぎてすいません。