研究室訪問

大量の統計データの可視化と対話的利用法を研究

 少年のころからSF小説を好み、将来は科学者にと憧れ、その1人となった。大量のデータが集まる時代の中で、データを分かりやすくする可視化やデータの中に隠れている意味を掘り起こす統計システムの研究に取り組んでいる。データ・ビジュアライゼーションとデータ・マイニング。その道の日本での第一人者であり、日本から世界へ情報発信もしている。不確実な時代を生き抜く方法の1つとして将来的にニーズの高い「対話的統計グラフィックス」の分野で、ワールドワイドな活躍をしている研究者である。

対話的グラフィックスでデータの特徴をつかむ

 数理工学を学んだ大学時代、大型コンピューターはあまり好きではなかったという。徳島大学で助手をしていた20代半ばのころ、パソコンが普及し始め、論文を書くツールとして自らワープロソフトをつくった。1980年代早々、ワープロが何百万円もしていた時代である。

顔写真

中野 純司
データ科学研究系
計算機統計グループ教授

 以来、コンピューターの世界にのめりこんだ。埼玉大学大学院政策科学研究科講師、一橋大学経済学部助教授を経て1998年4月、「計算機統計学をやりたい」と統計数理研究所統計計算開発センター教授に就任した。

 専門分野は計算機統計学、時系列解析。研究テーマは「統計解析のための計算機環境の研究」(インターネット、並列計算、対話的グラフィックスなどを利用する統計解析システムの作成)である。

 現在、もっとも力を入れているのは統計データの可視化だ。大量のデータを数字の羅列ではなく、特徴が分かりやすいようにコンピューターで視覚化し、その画面を対話的に操作することによって、より多くの情報や特徴をとらえ、医学や経営などの分野に役立てようとする。

 そのプログラムJasplotは、中野ら4人が取り組んでいる統計解析システムJaspから派生したものだ。Jaspはインターネット上から利用できる柔軟な統計解析システムとして、2008年度の日本計算機統計学会ソフトウェア賞(開発賞)に輝いている。

 「多量のデータの数字だけを見て特徴をとらえることは不可能です。計算機の力を借りると巨大な表を視覚化したり、似た性質のデータを視覚的に示すことができる。対話的に利用できる統計グラフィックス、それをJasplotをつくりながら研究しています」

計算機の力を借りると巨大な表を視覚化したり、似た性質のデータを視覚的に示すことができる

データ可視化の分野で日本と世界の橋渡し役

 「シンボリックデータ解析」の研究にも力を入れている。多量のデータから、ある特徴を持つデータの集合体を取り出す。例えば、スーパーの販売状況や人工衛星が集めた膨大なデータをグループに分けたり、そのグループ間の性格を明らかにしていく。データの中に潜んでいる意味をつかむものである。

 洗練された美しいグラフィックスで知られる統計解析システムRは、世界中の研究者がインターネット上でグレードアップに参加しているが、中野も日本のソフトを提供したり外国の開発者を呼び、日本と世界の橋渡し役を務めている。2008年12月には横浜で開かれ、国内231人、海外233人が参加した国際計算機統計学会(IASC)の実行委員長を務め、4日間の会議を見事に仕切った。

 統計データの可視化の研究を通じ中野が目ざすのは、大量データの中の特徴をできるだけ早くつかむ手法を見つけることである。「データの特徴をきちっととらえる可視化手法をつくるのが目標です。データ・マイニングは、データベースの中に多量のデータがある時、その中から意味のあるデータを探ってくる手法です。可視化はビジュアル・データ・マイニングと言われている。可視化の手法を使ってデータ、情報を掘り出す。いいデータ・マイニングの手法をつくりたいと思いますね」

「日本の弱さの1つは不確実性、統計への無理解」

 実は研究所の重要なマネジメントも担当している。スパコンや図書、刊行物、講演会などを担当する統計科学技術センター長と、統計学の底上げや人材育成を考える統計思考院の院長である。研究者としては余分な仕事のように思えるが、本人は「年配者の義務のひとつ」とこなしている。管理的才能もあるのだろう。

 統計で一般の方々に知ってもらいたいのは「統計や数学などで不確実性に対する基礎力を高めていただきたいこと」という。アメリカのビジネスマンは統計が必須で、大学でも統計学部・学科が多くあるが、日本では統計学科さえない時代が長く続いた。

 「日本が弱い理由の1つが数字とか不確実性、統計への無理解だと思う。日本で通用していたカンとか根回し、アウンの呼吸とか言っていたんじゃ絶対ダメです。世界を相手にしているいまは、数字を出しリスクを客観的に評価することをやらないと太刀打ちできない」

 そのためには、小中高校の段階から統計学と不確実性への理解を深め、すでに社会人となっているビジネスマンらは、統計学の入門書を読むことが必要という。「ロングスパンで考えること。統計や確率は1回の予測にはほとんど無意味です。長期間で見ると、だいたい予想通りになる。一喜一憂するんじゃなくて長い目で見ることが大切です」

 いまもSFの読書が趣味で、コンピューターの手づくりも楽しんでいる。若い心を持ち続けているのだろう。先が見えない不確実性な時代の中で多くのデータを見て判断し、進むべき道を決めていく統計的思考。それが強く求められる中で、中野は人間の感性と連動する「データの分かりやすさ」にこだわっている。統計学者として日本及び人類の発展に貢献していこうとする積極的姿勢である。その重要性が広く理解されて中野の研究が進めば、多くの分野での決断がはるかに効果的なものとなっていくだろう。 

(広報室)

図1.統計解析システムJaspの実行例。左側のウインドウでJasp言語を実行し、結果が右側のウインドウのグラフィックスで表示されている。


図2.統計グラフィックライブラリJasplotを、統計解析システムRから利用した例。


図3.多数の集計的なシンボリックデータを可視化するためのグラフィックスの一例。

ページトップへ