平成252013)年度 一般研究1実施報告書

 

課題番号

25−共研−1018

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

2

研究課題名

多重共線性を考慮したモデル構築法の開発

フリガナ

代表者氏名

ウエキ マサオ

植木 優夫

ローマ字

Ueki Masao

所属機関

東北大学

所属部局

東北メディカル・メガバンク

職  名

助教

 

 

研究目的と成果(経過)の概要

様々な分野においてデータの高次元化が進み、事前知識をなるべく利用することなく知見を得たいという要望が増えてきている。
そのような期待に応えようと、Lassoに端を発したスパースなモデル構築法の研究は近年ますます熱を帯びており、新たな手法が次々と生み出されている。ところが同時に、ゲノムデータ等の高次元データ解析へ適用すると、背後のメカニズムからかけ離れた結論が導かれ、さらには再現性にも欠けるという難解な現象も多々報告されているのが実情である。
これは度々指摘されてきたモデル選択の安定性の議論ともオーバーラップするが、さかのぼれば、最適モデルをただ一つ見出すというモデル選択の原理に起因している可能性がある。
なぜならば、回帰係数に基づいた変数の取捨選択は多重共線性(つまり同程度に最適なモデルが複数存在する)によって不安定となるが、データの次元が上がるにつれて多重共線性も生じやすくなっていると考えられるからである。
Lassoに2次罰則項を付与したElastic netは多重共線性の下でも解を得ることができ、高相関の変数が含まれる際の動作が保証されているが、多重共線性が高相関の変数セットによって引き起こされるばかりでないことを鑑みると、これまでのところこの問題を満足のいく形で取り扱う研究は皆無であった。
本課題において、一般的な多重共線性の条件下でも機能するモデル構築法を開発し、研究成果を学術雑誌に発表した。
現在、さらなる改良と発展を目指して研究を進めている。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Ueki, M. and Kawasaki, Y. (2013): Multiple choice from competing regression models under multicollinearity based on standardized update, Computational Statistics & Data Analysis, Vol. 63, 31-41. (doi: 10.1016/j.csda.2013.01.019)

植木・川崎 (2013) 多重共線条件下における複数の回帰モデル選択.2013年度統計関連連合大会.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

川崎 能典

統計数理研究所