平成262014)年度 一般研究1実施報告書

 

課題番号

26−共研−1014

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

2

研究課題名

多重共線性を考慮したモデル構築法の開発

フリガナ

代表者氏名

ウエキ マサオ

植木 優夫

ローマ字

Ueki Masao

所属機関

東北大学

所属部局

東北メディカル・メガバンク

職  名

助教

 

 

研究目的と成果(経過)の概要

様々な分野において高次元データの活用が進んでおり、多くの候補要因から有益な情報を取り出す上で、統計学への期待は大きい。
Lassoに代表されるスパースなモデル構築法の研究は近年ますます盛んになっており、新たな手法が次々と生み出されているが、例えばゲノムワイドデータ等の高次元データへの適用においては、期待されるメカニズムとかけ離れた結論が導かれ、さらには再現性にも欠けるというケースがときどき観察される。
特に、モデル選択は低〜中次元においても充分に理解が進んでいない部分があり、そのうちの一つが多重共線性の存在するケースである。この場合、奇妙な挙動を示すことが知られている。
高次元データはしばしば多重共線を引き起こすため、回帰モデルおよびモデル選択の多重共線状況下における理解は高次元データを扱う上で重要であると考えられる。

本研究では、Ueki & Kawasaki (2013, Comput Statist Data Anal)の羅生門効果をもつ重回帰モデルを利用し、様々な状況を想定した数値実験を行った。
数値実験においては、既存のelastic netやsure independence screening法のパフォーマンスを調べた。既存のモデル選択法は最適モデルをただ一つ見出すため、最適モデルが複数存在する羅生門効果のモデルの下では、常に有用な変数を見逃すことがわかった。
さらに実データへの適用を通して、実際のデータ解析における問題を調査した。
結果の一部を、CSA-KSS-JSS joint International Sessionにおいて報告した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

招待講演

Ueki M, Kawasaki Y. Choosing multiple good regression models under multicollinearity, CSA-KSS-JSS joint International Session. Taipei; December 2014.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

開催なし

 

研究参加者一覧

氏名

所属機関

川崎 能典

統計数理研究所