研究室訪問

統計数理的な問題の幾何学化への探究

 人間は「考える葦」に譬えられる。その知性は、複雑な事象を解きほぐすことに挑戦し、飛躍したり、苦悩したりする。

 問題の構造を視覚によって直感的に理解できるように表現したら、どれほど思考の効率が上がるだろうか。それは古来、人々の普遍的な望みであり、さまざまな学問領域で多くの絵や図の作成が試みられてきた。

 時にはパスカル(フランスの数学者、1623-62年)のような思いを込めながら、栗木さんは数理的な問題を幾何学化する研究に取り組んでいる。「それは対象への理解を深めるにとどまらず、未解決問題の解決や新たな問題提起にもつながるはずと、私は考えている」と話す。

顔写真

栗木 哲
数理・推論研究系・
統計基礎数理グループ教授

チューブ法で理解される「確率場」

 栗木さんの永年の研究対象は、チューブ法と呼ばれる。学問分野としては確率過程論および積分幾何学の境界に位置するものだ。時間ごとにデータを観測する時系列、空間の各点で観測する空間系列。この両者を合わせた「確率場」の最大値の確率分布を幾何学的な直感を通して求める手法であると、栗木さんは説明する。複雑な統計モデルを使い、仮説検定と呼ばれる手法によってデータ解析を行う場合に、その成果があらわれる。

 一般に多くの変数を観測すればするほど、ランダム誤差によるみせかけの統計的「発見」がなされるという。その中にはデータ解析者にとって都合のよい結果が含まれることもあるが、多くは再現実験では確認されないもので「偽陽性(false positive)」と呼ばれる。たとえば、ある病気の治療に効果がある薬を開発しようとする際、多くの項目についてデータを取得すればするほど特異な薬効の出現によって全体の統計解析が惑わされることが多い。そのような偽陽性の確率を制御するために、チューブ法は応用される。

 栗木さんは東京大学の竹村彰通氏との共同研究によって、検定統計量を多様体上の確率過程としてとらえ、その最大値分布を計算する方法を確立した。「学際的であることが、時として実り多いことであることを示す一つの例であると感じている」と、ひかえめな表現で胸を張る。

学際的であることは時に実り多いこともある

ゲノムスキャンにおける多重性調整

 現在、国立遺伝研究所など4つの研究所を横断する融合プロジェクト「生物多様性」のサブリーダーをつとめている。その関係で遺伝データ解析の機会が増えたことが、これまでの研究成果の社会的応用に自信を深めることにつながった。

 時には数万もの遺伝子を扱うゲノムスキャンは、多数の検定の繰り返しであり、そのために多重比較の考え方が不可欠だ。栗木さんは遺伝研が取り組む生殖隔離障壁の検出問題で、多重性を克服する方法をいくつか考案し、統計学者としての役割を果たした。その成果について現在、論文を執筆中だ。

 たとえば、イネの品種改良に関する実験。短粒種であるニホンバレと長粒種のカサラスを掛け合わせ、その生存率を推計しようとする。研究チームは、ある遺伝学上の研究仮説を実証するために、どんな条件下で遺伝子が子孫を残せなくなるかを知る必要があった。致死遺伝子の出現に関する偽陽性に惑わされることなく、統計的に正しく研究成果を導くために、栗木さんの研究が役立った。

AISMの編集者として

 子供のころから数学が好きだった。一方では社会に関わることもしたいと思った。大学生の当時は環境問題(公害問題)に統計学が多用されていると聞き、専攻する気持ちを固めた。そのような観点で統計学をとらえたのは間違いではなかったと、今でも思っている。

 研究に打ち込むうちに、いつの間にか自分が若手研究者の発表の舞台を整えるような役回りを演じるようになった。統数研が編集しSpringer が発売するAISM(Annals of the Institute ofStatistical Mathematics)のGeneral Section 編集長に、3年前に就任した。

 雑誌の名は「統計数理研究所紀要」を意味するものだが、現在は主として数理統計に関する学術雑誌として国際的に認知されている。外国人からは Tokyo Annals などと呼ばれる。

 こんなことがあった。08年8月、米国デンバーで開催された連合統計大会に参加した折に地元のデンバー大学を訪れた。退職間近い老教授が栗木さんの自己紹介を聞き、「あの雑誌を出しているところだよね。昔、私の論文を載せてくれた。その時はうれしかったな」と、親しみをこめて声をかけてくれた。「統数研が編集する雑誌が、まだ顔を見たこともない世界の研究者を励ましていることがわかり、仕事の手ごたえを感じた」と栗木さんは言う。

 「大学共同利用機関である統計数理研究所が編集する雑誌として、今後ますます統計科学の発展に寄与することを目指したい。日本の若い統計学研究者が世界への足がかりとできるような雑誌に育てていきたい。そのためには若手研究者たちの奮起を求めたい。積極的な投稿を待っています。」

図1.チューブ法の概念図 確率場の最大値の確率分布は、球面上のチューブ(管状領域)の面積の計算を通して計算することができる。(出典:Kuriki and Takemura,The Annals of Statistics, 2001,Vol. 29, 328-371)

図2.イネの生殖隔離障壁の検出 左図は、イネの1番染色体遺伝子と6番染色体遺伝子の組合せによって生ずる致死頻度をプロットしたもの。頻度が大きい部分は赤で示されている。右図は、生殖隔離障壁がどこにも存在しないという仮定の下で、遺伝モデルによって生成した人工データにおける対応する図。同様に赤い組合せが観測される。左図の赤い箇所の組合せは、見せかけの偽陽性であることが確認できる。

若手研究者の発表舞台となっている「AISM」

ページトップへ