平成292017)年度 一般研究2実施報告書

 

課題番号

29−共研−2043

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

3

研究課題名

高次元データの判別解析: データ構造の経験ベイズ推定に基づくアプローチ

フリガナ

代表者氏名

マツイ シゲユキ

松井 茂之

ローマ字

Matsui Shigeyuki

所属機関

名古屋大学

所属部局

医学系研究科生物統計学分野

職  名

教授

配分経費

研究費

40千円

旅 費

83千円

研究参加者数

6 人

 

 

研究目的と成果(経過)の概要

興味ある現象や形質などに対して,ゲノムデータなどの高次元データを用いて両者の関連の構造を推定するという枠組みを考える.具体的には,高次元データ全体に対して階層混合モデルを仮定し,データに基づいてこれを推定する(経験ベイズ).この解析によって,高次元データに含まれるシグナル成分を定量的に評価することが可能となる.また,推定されたデータ構造に基づいて判別解析を構成することで判別精度の改善を目指す.さらに,個々の遺伝子の発現量等に関する効果サイズや分散の縮小推定量を用いて判別式の安定化を図る.加えて,縮小推定量に基づくある種のデータ変換を考案して,過適合の主要因である遺伝子選択バイアスを取り除いた人工データを作製し,判別式の構成や判別精度を直接推定するといった方法論も検討する.

平成29年度は,前年度に引き続き,最もシンプルな判別法の一つである対角線形判別解析(diagonal linear discriminate analysis; DLDA)について検討を行った.前年度の検討では,形質クラス内分散の縮小推定量の良さが敏感に性能に影響したことから,分散の縮小推定量の改善を図った.逆ガンマ分布を事前分布に用いた方法を中心に検討し,小サンプルのもとで一定の改善を確認した.ノンパラメトリックな事前分布も検討したが,計算負荷が大きくなったことからごく限られた条件下でのみしか性能は確認できなかった.一方,判別精度改善の試みとして,より複雑な判別式である分散共分散行列の正則化を伴う判別解析(Guo Y et al., 2007),L1ノルムを用いた正則化法(特に,線形回帰の設定におけるleast angle regression (Efron et al., 2004)のstage-wise変数選択の切り口)についても縮小推定量を用いた拡張を試みたが,後者については実装に至っていない.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

なし

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

なし

 

研究参加者一覧

氏名

所属機関

植木 優夫

理化学研究所

小森 理

福井大学

西野 穣

名古屋大学大学院医学系研究科

逸見 昌之

統計数理研究所

松井 孝太

名古屋大学