コラム

日本学術振興会と統計

持橋 大地(数理・推論研究系)

 JR中央線四ツ谷駅の近く、千代田区麹町に日本学術振興会、略して学振があります。学振は、研究者として最も基礎的な研究費である科研費(科学研究費)の審査・配分や学振特別研究員の採用など多くの予算配分を行う、日本の学術の中核となる組織の一つです。この学振に2013年に設置されたグローバル学術情報センター(図1)の二人の外部からの研究員の一人を、椿教授(現在は(独)統計センター理事長)の後をうけて、2015年から兼務しています。

 センターの役割は、科研費をはじめ学振の業務全体に関わるデータを収集・分析して業務へとフィードバックし、学振のより公正で効率的な運営に貢献することで、学振内部の一種のシンクタンクです。所長の前島信先生(慶応大学名誉教授)およびもう一人の研究員である三浦良造先生(一橋大学名誉教授)とは、三人とも確率論・統計学が専門ということもあり、前島先生の穏やかなお人柄の下、大学の研究室のようなアカデミックかつ、科学政策の根本に関わる話を毎週議論することができ、若輩の私にとってきわめて貴重な経験となりました。

 三年間の勤務の中でさまざまな統計的なモデル化や分析を行いましたが、最も力を入れたものの一つが、科研費の審査における評点の統計的な標準化です。科研費の審査は、一般に信じられているものと異なり、各申請に4〜6名程度の審査員が5または4段階の評点と意見を付け、それをさらに合議によって議論することで採否を決定するという、公正かつ精密な方法で行われています。各審査員には5点何%、4点何%という割合が事前に指示されているものの、正確に割合に従うことは難しく、割合がない種目もあるため、たまたま「甘い」審査員に当たった申請が有利になったり、その逆になることがあります。ボーダーラインでは、その微妙な差が特に重要になります。このために現在使われているTスコアという補正は、離散的な得点を審査員ごとに正規分布に似るように変換するもので、本来連続値のための分布を無理に当てはめているために多数の同点が生じることや、審査員間の相関を見ていないなどの問題を持っていました。そこで、心理統計学の分野で開発された「項目反応理論」とよばれる統計モデルを応用し、申請書ごとに見えない「良さ」θを図2のように潜在変数として推定することで、同点になることがなく、各審査員の審査傾向や相関を精密にモデル化する標準化が行えることを示しました。θは正規分布に従う確率変数ですが、必ずしも1次元である必要はないため、図2のように2次元や3次元のθで各申請の良さを多角的に評価することもできます。

 上の理論は平成30年度の科研費改革には間に合いませんでしたが、今後導入できるものと考えています。今年度からは、五ヶ年計画の終了とともにグローバル学術情報センターは改組され、学術情報分析センターとしてさらに拡充されることになりました。私も、新センター長となった前学振理事長である安西祐一郎先生の下で、現在も分析研究員として新たな課題に取り組んでいます。この他に、専門である統計的自然言語処理の知見を生かし、科研費の申請書のテキストを分析することで分野全体を可視化するなどの仕事も行っています。科学政策に関する毎回の会議での話を聞くにつれ、統計はそれ自身科学であるだけでなく、科学的な営み全体を知る武器でもある、ということを日々実感しています。

図1 日本学術振興会10階にあるグローバル学術情報センターの標札(最下段)。

図2 項目反応理論によって評点から推定した科研費の各申請書の潜在的な3次元のθ(× 印)と各審査員の評価軸(矢印)。

ページトップへ