統計数理研究所

DIAMOND ハーバード・ビジネス・レビュー誌 2012年2月号の巻頭言「OPINION」に樋口所長の記事が掲載されました。

ビッグ・データを操る者が勝つ

統計数理研究所 所長
樋口知之

データ集約型科学という科学的探究手法が、科学の世界のみならず、ビジネス社会でも注目されている。基本方程式を理論解析や計算機シミュレーションで解く演繹的な手法ではなく、ビッグ・データ(莫大な量のデータ)から課題を見つけ出しモデル化することによって、よりよい予測を行ったり、新しい法則を見つけ出したりする帰納的な手法である。科学の「第四のパラダイム」として学問領域を超えて人類に新しい価値をもたらすと期待され、統計学と社会とのつながりがきわめて重視される時代が到来している。

データ集約型科学は、すでに一九九〇年代に日米欧で研究が始まり、その黎明期において日本も大きく貢献した。当時私が研究していた人工衛星データはビッグ・データの走りであり、その後、ヒト・ゲノム計画で膨大なゲノム・データが獲得された結果、地球・宇宙科学と生命科学の両分野で先行して、ビッグ・データの解析手法が発展した。

サイバー系のデータが爆発的に増加し、ビジネス分野の応用が注目されてきたのは、二〇〇〇年以降のことである。グーグルやアマゾン、IBM、マイクロソフトなどのIT企業が、クラウド上に蓄積され世界じゅうにちりばめられたビッグ・データの活用に目を向けたことにより、ブームに火がついた。欧米諸国、あるいは中国、韓国などの先進アジア諸国では、大学における統計学科の設置数がうなぎ登りで、企業の認識も飛躍的に高まっている。こうして、ビッグ・データをビジネスへ展開できる環境が整った。

ところが、日本においてはここ一〇年、教育機関の整備も、企業における投資や人材育成もほとんど行われず、この分野で大きく後れを取ってしまった。このビハインドは相当なものである。その原因はどこにあるのか。

日本はイノベーションが好きで、モノづくりでは世界で最も長けているが、サービスを提供したり、データを収集して分析したりすることは、「タダ」あるいは「オマケ」ととらえる意識が根強いからである。データを蓄積し、解析し、予測し、そこから有効なアクションを取ることが莫大な富を生むことを、日本企業は真に理解していない。

一方、一部の企業では、データ量を増やせば増やすほどよいと錯覚する向きもあるが、実はそう簡単にはいかない。顧客を何百万人、何千万人集めて、顧客データを膨大に増やしても、その情報空間の質がデータ量に比例して向上するわけではない。データとデータの間を稠密に埋めて、真理や実像を描き出すことは、統計学的に不可能なのである。

ただし、人間には広範な多様性があるものの、偏りもある。単純ではないが、そこには構造がある。デモグラフィック上の癖を読み解き、複雑な構造をどのようにして素早く見つけ出すか。それが統計学、機械学習、データ・マイニングの専門家の仕事である。

この分野で欧米のみならずアジアの諸外国に追いつくためには、企業はデータ解析にもっと多くの資金や人材を割り当てなければならない。その現状を正しく認識し、経営資源を投入するビジネス・リーダーが現れれば、間違いなく他社が持たない強みとなり、勝利を手にできる。一つ確かなことは、いまだにデータ解析を「タダ」だと思っている企業は立ち行かないということである。

bar-blue.gif