平成282016)年度 一般研究2実施報告書

 

課題番号

28−共研−2040

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

3

研究課題名

高次元データの判別解析: データ構造の経験ベイズ推定に基づくアプローチ

フリガナ

代表者氏名

マツイ シゲユキ

松井 茂之

ローマ字

Matsui Shigeyuki

所属機関

名古屋大学

所属部局

医学系研究科生物統計学分野

職  名

教授

配分経費

研究費

40千円

旅 費

87千円

研究参加者数

6 人

 

 

研究目的と成果(経過)の概要

興味ある現象や形質などに対して,ゲノムデータなどの高次元データを用いて両者の関連の構造(関連遺伝子の割合,効果サイズ分布)を推定するという枠組みを考える.具体的には,高次元データ全体に対して階層混合モデルを仮定し,データに基づいて推定する(経験ベイズ).この解析によって,高次元データに含まれるシグナル成分を定量的に評価することが可能となる.また,推定されたデータ構造に基づいて判別解析を構成することで判別精度の改善を目指す.さらに,個々の遺伝子の発現量等に関する効果サイズや分散の縮小推定量を用いて判別式の安定化を図る.加えて,縮小推定量に基づくある種のデータ変換を考案して,過適合の主要因である遺伝子選択バイアスを取り除いた人工データを作製し,判別式の構成や判別精度を直接推定するといった方法論についても検討する.

平成28年度は,最も単純な判別式の一つである対角線形判別解析(diagonal linear discriminate analysis; DLDA)を想定して,提案するアプローチの妥当性について検討した.形質クラス間での発現量の差(効果サイズ)に対してノンパラメトリックな事前分布を指定した経験ベイズ推定を行い,遺伝子別に効果サイズの事後平均(縮小推定量)を求めた.また,これを重みに用いた判別式を構成した.選択遺伝子のデータ(学習データ)に適当な線形変換を施し,「選択バイアスが除去された人工データ」を作成し,これをテストデータとみなして判別精度を評価した.判別精度については,従来の(縮小推定を用いない)DLDAと大きな差は認められなかった.しかし,人工データに対してはほぼ偏りのない正判別率の推定値が得られ,その推定精度は標準的なクロスバリデーションを用いた推定法よりも小さいことを確認した.一方で,特に小サンプル下では,形質クラス内分散の縮小推定量の良さが想定以上に性能に影響することがわかった.今後は,クラス内分散の縮小推定量の改良を考えている.また,事例研究として,薬剤の第二相臨床試験への適用も検討したい.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

なし

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

なし

 

研究参加者一覧

氏名

所属機関

植木 優夫

久留米大学

小森 理

福井大学

西野 穣

名古屋大学大学院医学系研究科

野間 久史

統計数理研究所

松井 孝太

名古屋大学