20ドルで電子化

 昨日の続編だが、Amazonの書籍のデジタル化経費、20ドルはショックである。

 数年前まで「たまたま紙だった」と題して、電子書籍の普及促進を目的としたセミナーを行っていた。その中で、Amazonに対抗する、リアル書店「Barnes and Noble」(http://www.barnesandnoble.com/)が2000年8月のSeybold Seminarで発表した電子化コストを紹介したことがある。

 紙の本からタグつきのテキストを作る経費で、300頁、図版ナシの場合、

-基本料金   $50

-ページ処理  $0.15×300頁

-タグ付け作業 $250 (確認作業を含む)

-合計      $345 (36,000円)

 これが、日本の場合、概算だが1,000円×300頁+50,000円=350,000円くらいになる。

 書籍をバラバラにして->スキャン->OCR->テキスト校正->タグ校正 という作業だが、日本が米国の10倍高いのは、アルファベットと漢字の文字数の違いによるところが大きい。

 345ドルが数年で20ドルになった理由は、上記の工程が完全に自動化できたからで、テキストの校正は、単語(コーパス)や複合句の充実したデータベースを使って自動化できるし、タグ(論理構造)校正も章や節からキャプション、柱まで、自動認識が可能である。

  

 以下の2003年11月の報道の通り、Amazonでは日本語版も検討しているようで、文庫、新書、そして特に全文検索が威力を発揮する技術書などが、1冊20ドルとはいかないまでも、数万円でXML化できる生産ラインが整備されれば、欧米や中国に遅れを取っている日本の書籍のデジタル化に、拍車がかかることになる。

http://japan.cnet.com/news/media/story/0,2000047715,20061821,00.htm