研究室訪問

多数の動的モデルの統合・予測と知識発見手法の開発

 統数研所長室の壁に1枚の感謝状が掛っている。それは05年12月にJR羽越線の最上川にかかる鉄橋付近で起きた死者5人、負傷者33人の痛ましい事故の記憶とともにある。JR東日本が取り組んだ「鉄道の強風予測に関する時系列解析」で統数研チームが活躍した。開発された「強風警報システム」により、安全性を確保しながら強風による列車の運転休止時間を短縮することが可能になった。

 樋口さんは北川源四郎所長とともに「統計的時系列モデルによる鉄道・高速道安全運航支援システムの開発」研究チームで指導的な役割を果たした。「突発的な強風の発生を予測するのは困難。しかし、影響緩和に向けて“このあたりで大丈夫”という根拠を示すことに統計学的手法が有効でした。」

複雑な事象を読み解く際に有効なベイズ統計学

顔写真

樋口 知之
モデリング研究系
時空間モデリンググループ教授、副所長

 定理や法則によって現象を解き明かすことは、だれもが認める科学的な手法だ。しかし、自然界や人間社会で現実に起こる事象には多様な要素が絡み合う。因果関係について概ね説明はできても、結果に対する具体的な対処法を明示できないことが多くある。そこで、経験とデータと予測を組み合わせることで、現実的な選択にたどりつく手法が求められる。この点に関して、「統計学は帰納法的な発想を大切にすることで、世の中の現実的な諸課題の解決に多く貢献できる」と樋口さんは指摘する。

 大学院の学生だったころ、地球物理の専門課程で当時としては膨大な量の人工衛星のデータ解析をしていたが、ベイズ(18世紀の英国の数学者)の確率理論に出会ったことが統計学に接近する契機となった。さまざまな経験や見通しを交えながら確率推論を行うことの有効性を示唆するベイズの定理は、新しい情報によって過去に起きたことの確率を修正していく。現在、気象予測やインターネットによるサービス、新薬開発、かな漢字変換など広い分野で活用されている。樋口さんは「対象の表現方法が階層的であること、また漠然とした期待も確率モデルとして推論プロセスに明示的に導入する点に惹かれた」という。

 IT(情報技術)革命によって人間を取り巻くあらゆるシステムが大きく変容する現代。超大量のデータから有益な情報をどのように抽出するか。樋口さんは、「時空間データを組み合わせる分野でも、バイオインフォマティクス(生命科学と情報科学、情報工学を融合した学問分野)でも、ベイズの枠組みは大変有用である」と力説する。

現場にいるほど、柔らかな情報処理の必要性を痛感する

発見科学の新たな挑戦としてのデータ同化論

 いま樋口さんが考えているのは、理論と実験をつなぎ合わせて科学の駆動力をアップさせる手法だ。地球規模の複雑な現象を高精度で予測するための大規模シミュレーションが行われているが、設定したパラメータや境界条件が適切かどうか分らなくなるケースも多い。初期条件と境界条件をいったん与えてしまえばデータなしに独自に計算は進んでしまう。そこで、モデルの性能と妥当性を系統的に診断するために、シミュレーション計算による予測と大量データの処理を合体させる「データ同化」の必要性が出てくる。

 このデータ同化の実験により、日本海の津波と海底地形に関する新たな知見が得られた。津波の到達時間は浅水波方程式で求められるが、津波伝搬のシミュレーションモデルと実際の潮位データを融合する過程で、海底地形に関する情報の不確実性が問題になった。これを逆手にとって、樋口さんらの研究チームは潮位計測のデータから海底の深さを推定できることに気がついた。

 日本海の中央には大和堆と呼ばれる水深400mの浅い部分があるが、これまで知られていた4つのデータベースでは、水深に関する平均値に対して5%もの差異があった。データ同化手法で探ったところ、実際の海底地形は水深がずっと浅いことが示唆された。日本海の体積はこれまで考えられていたよりも小さいらしい。

“個”に焦点をあてた研究に意欲

 さらに樋口さんの研究意欲を高める分野は、“個”に焦点を当てた「マイクロマーケティング」の創出だ。統計学はこれまで、デパートの月次売上高データ(観測値)による長期傾向(トレンド)推定などに生かされてきた。しかしその一方では各個人の嗜好は多様化・細分化されて消費傾向は複雑になる一方だ。個人レベルの消費者が自分の現実的環境に適合して何を選択したらいいか。その嗜好性を理解できないか。

 樋口さんは「統計という言葉がもつマクロ的な情報抽出だけというイメージをぬぐい去りたい。高度化されたモデリング機能を用いれば、“個”からの情報抽出も得意であることを訴えたい」と、新たな挑戦への抱負を語る。

 05年から副所長を兼ねる。統数研の将来は「未来のサイバー空間に立ち向かえる組織構造改革を実現できるかどうかにかかっている」と説く。

 自分自身については、「たたき上げのデータ解析屋」であると言う。そして「現場にいるほど、柔らかな情報処理の必要性を痛感する」といつも話す。“柔らかな”という単語の選択に、異種情報を自然に組み合わせて有効な統計モデルにたどり着こうとする、研究者としての強い自負がこもっている。

(企画/広報室)

図1.科学研究推進におけるデータ同化の役割を模式的に図化


図2.日本海の津波シミュレーションモデルと数カ所の観測点における潮位計測データの情報を統合する、津波データ同化実験


図3.あるレストランの日毎売上データを説明するモデルを構成することで、個別レストランの売上予測が可能に。

ページトップへ