カラクリスタ

「輝かしい青春」なんて失かった人のブログ

PDF の電子書籍を ePub に出来ないかと挑戦してみたが、予想以上に難行だった

という話。


まあ、昨日、久しぶりに、

なんか久しぶりに読書でもすっか!!1

と思い立ち、その後、

あ、 KindlePDF を快適に読めないかな……?

と思いついたのが運の尽き、なんか色々試行錯誤してたら、

あれ、 読書 しようと思ってたのはどこ行ったんや……

という感じになったので、今日はその時の試行錯誤の話をします。


1. PDF の電子書籍ePub に直接変換することは可能か?

まず、文字主体の PDF をダイレクトに ePub に変換するのは 多分、ムリ で、PDF を ePub に変換するには、一旦、 PDF を html に変換する必要が有ります。

で、PDF を HTML に変換するソフトウェアに、

  • poppler 付属の pdftohtml

や、

  • pdf2htmlEX

つーのが有るんですが、これらのソフトウェアを使ったとしても、 綺麗に構造化された HTML を一発で得るのはほぼムリ です。

というのも、これはまあ元の PDF という文書フォーマットが、 印刷を前提としたファイル形式であり、そもそも構造化とか考慮されてないファイル形式 であるため、上記のソフトウェアのどっちを使うにしても、ファイルを構造化した HTML にしようと思うと、どっちにしろ、 HTML ファイルの校正が必要になってきます

で、僕はその辺りで、

やってらんねー、クソして(ry

という感じになったので、そのまま寝ました。夜も遅かったし。

で、HTML の校正とか 生 HTML ではつらたん……という方等は、

  • pandoc

というツールで 、 HTML から Markdown に変換した上で編集すると良いんじゃね?という感触は得ています。まあそれでも面倒は面倒だけども。

まあ、そんな感じで、昨日の時点では、

  • 文字情報主体の PDF を ePub にする

というのは、かなり辛い、という結論になりました。南無。

2. 自炊 PDF を ePub (というか Kindle 向け) に最適化するには、 kindlizer を使うと良い

まあ、自炊環境持ってないので、基本的にこの方法は使えなかったのですが、 自炊 PDF (画像中心のやつ) を Kindle 向けに最適化するソフトウェアとして、

というのが有ります。

んで、これは必要なツールさえ揃えておけば、rake コマンド一発で PDF を Kindle 向けに最適化してくるすごいやつなのですが、いかんせん僕は書籍の自炊とかを行なえる環境を所持しなかったので、正直、使うためのタネが用意できなくて、使いようが有りませんでした。なので、これを使える環境を整えたけど、あんまし意味なかったという。

まあでも、 kindlizer 自体は UNIX 系環境で使うにはかなり便利そうでは有るので、自炊とかしている Mac ユーザーな方には向くんじゃないでしょうか、と思います。

で、最後。

3. 一般に販売されている PDF な電子書籍を快適に読もうと思ったら、まともに動作する タブレットバイスを買った方が手っ取り早い

という結論になりましたとさ。おしまい。

……というか、マジメに言いますが、マジでオライリーの PDF とかを快適に読もうと思ったら、最新の iPad とか Android タブレットとか、あるいは変化球で Windows タブレットとかを買ってアプリを揃えた方が手っ取り早いし、そっちの方が確実です。

つーかそもそも Kindle の画面サイズで PDF を快適に(ry とか思うの、ガチで苦行への道に他ならないので、マネーで解決できるコトはマネーで解決した方が良い、と個人的には思う。

あと、PDF というファイル形式は、何度も言うように、固定レイアウトで紙とかに印刷する前提のファイルフォーマットなので、Kindle とかその他の電子書籍特化デバイスで閲覧するには向かないんじゃねーの? っていうファイルフォーマットです。

そのため、画面が小さくて、文字の再配置が前提となる Kindle みたいな電子書籍特化デバイスには、そもそも PDF は向いてないっぽいので、その辺りはスッパリと諦めた方が精神衛生上楽です。というか少なくとも、その辺り諦めた方が、俺みたいに読書をしようとしてその準備で日が文字通り暮れた、なんてコトは起きないと思います。南無三。

以上

なんか割と雑に書いてきたけど、これでも 2000 字越えてるってどういうことよ……

まあともかく。

PDF を ePub に変換する、というのは、或る種のクソゲーじみた行為なので、相当に手間とヒマを掛けられるのでない限り、止めておいた方が良い、というのが今回の僕の結論です。とにかく悪いコトは言わないから止めとけ、という感じですかね。はい。


というコトで、昨日のかなり成果がなかった試行錯誤のまとめは以上です。いや、本当に成果物とか無いんでアレなんですが、まあ何かの参考になればな、と思います。

というワケで以上、終ります。はい。