平成272015)年度 共同利用登録実施報告書

 

課題番号

27−共研−26

分野分類

統計数理研究所内分野分類

c

主要研究分野分類

1

研究課題名

低ランク構造を用いた欠測データの補完におけるベイズモデリングを用いたモデル選択手法の開発研究

フリガナ

代表者氏名

クロサワ ヒロキ

黒澤 大樹

ローマ字

Kurosawa Hiroki

所属機関

中央大学大学院

所属部局

理工学研究科数学専攻博士課程前期課程2年

職  名

大学院生 修士課程

 

 

研究目的と成果の概要

協調フィルタリングによる自動推薦アルゴリズム,欠測を含む画像処理,ゲノムデータ解析など様々な場面において,欠測を含む行列に対する低ランクモデリングが活用されるようになった.それにしたがって,低ランク行列に関する様々なモデリングや推定法の開発や,その理論的性質に関する研究が近年飛躍的に進んできている.
行列の低ランクモデリングとは,データ行列が潜在的には低ランク(低階数)で表現あるいは近似するモデルとその推定法を意味し,項目がすべて観測されている完全データに対するものと,項目に未観測の欠測値が含まれる不完全データに対するものの2通りに分けられる.
完全データに対する低ランク行列モデリングとしては,誤差をある程度に抑えつつ階数を最小化する方法である特異値分解が考えられるが,不完全データの場合にはそのまま適用することはできず,非凸最適化問題となり計算的に非常に解きにくい.そこで Mazumder et al. (2010) では階数ではなく,核ノルムを最小化することによって不完全データに対する低ランク行列モデリングを行うアルゴリズム soft-impute を提案した.核ノルムは行列の特異値の総和である.また Todeschini et al. (2013) では,soft-impute の推定量を EM アルゴリズムと MAP 推定により表現できることを示した.
本研究では,soft-impute において重要な課題である調整パラメータの選択について,ベイズ推定を用いてアプローチすることを考えた.一つは,MAP 推定量表現の考えを元に,soft-impute アルゴリズムを Gibbs sampling を用いた完全ベイズ推定へ拡張したBayesian soft-imputeを提案した.もう一つは,WAIC や WBIC など,ベイズ的な情報量規準を用いたモデル選択法の適用を考えた.
両者ともに大規模行列の演算を要し計算コストがかかるが,特に前者は Stiefel 多様体上の特定の分布に従う行列の乱数生成が必要であり,膨大なコストを要する.このため,統計数理研究所の共同利用登録に申請し,スーパーコンピュータを利用した.数値実験を実行し,安定的に低ランク行列のベイズモデリングを行うことが可能であることを確認した.これにより得られた結果を論文として投稿する予定である.