昨日のPage2005基調講演で「Google徹底解剖」という40ページの冊子をもらった。インターネット・マガジン(http://internet.impress.co.jp)2004年1月号の別冊なのだが、Googleを面白く解剖している。特に、早稲田大学 山名早人先生の記事が興味深い。山名先生はオライリーの「Google Hacks」の翻訳者で、大規模検索などの研究で知られている。
Google Hacks―プロが使うテクニック&ツール100選
- 作者: タラ・カリシェイン,ラエル・ドーンフェスト,山名早人,田中裕子
- 出版社/メーカー: オライリー・ジャパン
- 発売日: 2003/08/20
- メディア: 単行本(ソフトカバー)
- クリック: 11回
- この商品を含むブログ (47件) を見る
2003年11月現在、アメリカ、スイス、アイルランドなどに11ヵ所のデータセンターがあり、それぞれに1000から3000台のサーバが設置されている。2002年12月の時点で合計2万台のサーバが、1日平均2億件の検索を実現しているとのこと。当時のサーバはCeleron533MHz~Dual Pentium III 1.4GHz、メモリ256MB~1GB、HD 80GB×2、RedHat Linuxを使用。
2年前の情報で、当時は33億ページを収集しインデックス化していたが、現在は以下の通り80億ページとなっている。世界のWebサイトが80億ぺージとは、60数億の人口に比べて、ちょっと少ない気もするが、そんな世界で私などは齷齪(あくせく)働いているのである。
-© 2005 Google - 8,058,044,651ウェブページから検索
サーバ・ハードウェアの性能は格段に向上しているので、現在4万台ということはないと思うが、いったい何台のサーバをどのような構成で使っているのか興味深い。
今日は夕方から、鉢山町で近藤さん、長沖さんと打ち合わせ。その後、長沖さん、竹田さんと桜丘で会食。そして、長沖さんと私は山名先生の奥さんと知り合い。ウ~ん、ちょっと複雑なソーシャル・ネットワーク??