平成282016)年度 一般研究1実施報告書

 

課題番号

28−共研−1024

分野分類

統計数理研究所内分野分類

h

主要研究分野分類

1

研究課題名

遺伝データに対する主成分回帰

フリガナ

代表者氏名

カワノ シュウイチ

川野 秀一

ローマ字

Kawano Shuichi

所属機関

電気通信大学

所属部局

大学院情報理工学研究科情報・ネットワーク工学専攻

職  名

准教授

 

 

研究目的と成果(経過)の概要

研究目的:
 主成分回帰とは,一段階目で,説明変数に対して主成分分析を行い,対応する固有値が大きい主成分スコアをいくつか選び,二段階目で,それらを新しい説明変数として回帰分析を行う二段階法である.二段階法の欠点は,固有値が小さい主成分スコアが本質であるとき,それを見つけることができないことである.目的変数が連続型であるときは,スパース学習を組み込むことで上記の二段階を一段階で行う方法Sparse Principal Component Regression (SPCR) を研究代表者らは提案した (Kawano, Fujisawa, Takada, Shiroishi, 2015; Comput. Stat. Data Anal.).本研究では,それを目的変数が離散型の場合に拡張する.また,提案手法を国立遺伝学研究所から頂いた実データに適用し,新たな知識発見を狙う.

成果:
 SPCRの回帰に関する損失関数を一般化線形モデルに拡張することにより,2値データ,多値データ,計数データ含む様々なデータ形式に対応した1段階法による主成分回帰モデルSparse Principal Component Regression for Generalized Linear Models (SPCR-glm) を構築した.SPCR-glmの損失関数にテイラー展開を施し,SPCRとほぼ同様の枠組みに落とし込むことで効率的な推定アルゴリズムの構築を実現した.遺伝研から頂いた多値データにSPCR-glmを適用したところ,これまで発見されていない新たな知見が得られ始めている.これらの研究成果はプレプリントとしてまとめられ現在投稿中である.なお,SPCR-glmは統計解析ソフトRのパッケージ "spcr" としてCRANに登録した.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

学会発表
川野秀一,藤澤洋徳,高田豊行,城石俊彦「スパース主成分多項ロジスティック回帰モデリングとその応用」2016年度統計関連学会連合大会.金沢大学.2016年9月.

プレプリント
Kawano, S., Fujisawa, H., Takada, T. and Shiroishi, T. (2016) Sparse principal component regression for generalized linear models. Preprint, arXiv:1609.08886.
http://arxiv.org/abs/1609.08886

ソフトウェア
Rパッケージ spcr: Sparse Principal Component Regression
https://cran.r-project.org/package=spcr

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

該当なし.

 

研究参加者一覧

氏名

所属機関

藤澤 洋徳

統計数理研究所