研究室訪問

古典統計学の“破壊”と“再生”を目指して

 新装6階の江口さんの研究室には、よく音楽が流れている。「宗教曲が多いですね。言葉になる以前の脳を使って、柔軟なアイデアを得るにはこのタイプの音楽がいい。」

 カメラを向けると、「最尤推定」の文字を背景にポーズを取った。毛筆で書かれた作品が10年以上も研究室の“備品”のひとつとなっていた。「つまり読んで字の如し。最も尤もらしい推定はいかにあるべきか。いつもこの字を眺め、統計学の本質を問うています」とユーモアを交えながら笑顔で話す。

伝統的な統計理論に疑問提起する本質論

 「最尤(M L = Maximum Likelihood)」は統計学の独特の用語であり、最も基本的な方法のひとつだという。しかし、江口さんの頭の中にある最尤とは、確率の分布の実態そのものへの問いであり、統計学の巨星・ロナルド・フィッシャー(英国の統計学者、集団遺伝学者。1890〜 1962年)が開発した最尤法への異論の提起でもあると言うから興味深い。

顔写真

江口 真透
数理・推論研究系学習推論グループ教授、
予測発見戦略研究センター長

 「問題はデータのランダム性とは何かということです。フィッシャーの最尤法は、ある仮定に従ってデータを取られるときにのみ有効である。しかし現実のデータはこの仮定に従っている保証はない。これでは真実が反映されたとは言えない。つまり、最も尤もらしい状態と判断すると大きな誤りが生じる。」専門外の人には頭が混乱するような理屈だが、データの分布の本質とは何かを問う姿勢が伝わってくる。

 江口さんは自分の研究テーマを「選択バイアス」と呼ぶ。「統計理論の大部分がランダムサンプルの仮定のもとで構築されたものだが、その仮定を置くことが適当であるかどうか確かめることが困難だ。「典型的にはミッシングデータが生じた場合に、この問題が生じる」と江口さんは指摘する。アンケート調査の場合などの無回答や非回収をどのように解釈するか。それは無視可能なのか。無視可能でないなら、得られたデータだけによってどのような推論が可能なのか。それは余りにも基本的な問題とも思えるが、現代統計学でもいまだ良い解決策を見出していないのだという。

いつも若い世代と共に統計学の最先端の知識を共有していたい

“師匠”コーパス氏との共同研究で研究業績賞

 江口さんにこのような研究テーマを導いてくれたのは、英国ウォーリック大学のジョン・コーパス教授だ。94年に同大学に情報幾何学の研究のために留学研修した際、偶然に出会ったことから共同研究が始まった。「正直言って目指すべき方向に迷っている時期であり、コーパス教授の指導によって40歳を過ぎてから統計学の再教育を受けたことになります。」

 2005年に2人が共同で発表した論文は、「受動喫煙は肺がんのリスクとなるか」という問題について30の施設から公表されたデータから下された統計的結論を再考することから始まった。統計学はしばしば現実の問題に最終的な判断を下す際に重要な役割を担うが、ここでも受動喫煙に対して行政がどこまで関与できるかという問題にも関わっていた。公表されなかったケースは無視可能なのか? 観察されなかった交絡因子(結果に影響を与える背景因子)は無いのか?

 江口さんら師弟コンビは得られた受動喫煙のデータを不完全データと見て、現実には公表されていない完全データに対していくつかの仮想を巡らした。最尤推定量の分布が新たな角度から考察され、従来の信頼領域の補正をした。「統計的結論を導くために課せられた仮定に対して慎重な考察が必要であることの典型的な例題になった」と江口さんは総括する。この論文は英国王立統計学会で発表され22人との討論とその返答とともに掲載された。その後、その共同研究は日本統計学会の第2 回研究業績賞に輝いた。今年10月にウォーリック大名誉教授となったコーパス氏との共同研究は更に9編目の論文を目指して続けられている。

若い世代に「乗り越えられる」ことの喜び

 江口さんは今、研究主幹として数理・推論研究系を束ねる立場にいる。その中の学習推論グループとは何かと問うと、「機械学習という統計学の流れと異なる分野から出現した方法と発想を融合して統計学理論の再構築を目指す」ものだとの答が返ってきた。現在、バイオインフォマティクスへの適用にも意欲的だ。

 研究者としての自分の考えや行動の記録をホームページに発信することにも熱心だ。2001年からスタートした「Shintoの統計日記」には、日常の出来事とともに統計学の過去、現在、未来に関する感想が述べられ、学問とは何かを問いかけると共に、常に若い人々へのメッセージが託される。「この21世紀、システム全体の在り方が大きく変わる時に、統計学はどのように位置づけられるべきなのか。」そんな問題意識を多くの人々と共有したいと江口さんは考える。画面には江口さんの気持ちがあふれ出る。時には研究室の若者たちもこのホームページに写真を提供するなど、師弟の交流の場でもある。

 江口さんが総合研究大学院大学の博士課程で指導した学生は現在までに11人。「いつも若い世代と共に統計学の最先端の知識を共有していたい。そして、統計学の新しい姿を模索する作業に取り組んでいたい」と江口さんは話す。「若者が自分を乗り越えることが最大の喜び」と語りながら、統計の本質とは何かを問う“哲学する日々”が続く。

(企画/広報室)

図1.モデルの不確定性から生じる選択バイアスの図


図2.機械学習から学んでフィッシャー統計学を再構築する


江口研究室のメンバーらと交流するコーパス・ウォーリック大教授

ページトップへ