平成272015)年度 一般研究1実施報告書

 

課題番号

27−共研−1013

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

2

研究課題名

高次元データから隠れた要因を探索するアルゴリズムの開発

フリガナ

代表者氏名

ウエキ マサオ

植木 優夫

ローマ字

Ueki Masao

所属機関

久留米大学

所属部局

バイオ統計センター

職  名

講師

 

 

研究目的と成果(経過)の概要

大規模高次元データは、昨今、幅広い分野で普及しつつあり実際に活用が進んでいる。
医学分野でのゲノムワイド一塩基多型(SNP)はその代表的な例であり、
SNPを用いたゲノムワイド関連研究(GWAS)は世界中で研究が進められている。
GWASデータは、数十万〜数千万のSNPが含まれる超高次元データである。
ヒトを対象とすることから、充分なサンプル数を確保することが原理的に難しく、
その結果、限られたサンプル数のもとで統計解析を行う必要があり、多くの困難が存在する。
ひとつの重要な課題として、GWASデータを用いて疾病などを予測するモデルの構築が挙げられる。
これは個別化医療の実現において必要不可欠であるが、現在のところ、多くの疾患において、GWASを用いて構築された予測モデルの精度は実用に耐える水準とはなっていない。
本課題において、申請者は、GWASを用いた予測モデリング法として、smooth-threshold multivariate genetic prediction法を開発し、
研究成果を論文として発表した。
提案された手法は、現在のGWASの標準である、個々のSNPと応答変数との関連性(周辺効果)をひとつづつ調べる手法と、スパース回帰手法を組み合わせることで、高速かつ高精度な予測モデルを作成できる。
実際に、Alzheimer's Disease Neuroimaging Initiative(ADNI)が提供している全ゲノム次世代シーケンシングデータに適用し、開発した予測モデルが既存手法よりも高い予測精度を示すことが確認できた。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

1. Ueki M, Tamiya G and for Alzheimer's Disease Neuroimaging Initiative. Smooth-threshold multivariate genetic prediction with unbiased model selection. Genet Epidemiol 掲載決定.
2. Kawasaki Y, Ueki M. Sparse predictive modeling for bank telemarketing success using smooth-threshold estimating equations. J Jpn Comp Statist 28:53-66, 2015.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

該当なし。

 

研究参加者一覧

氏名

所属機関

川崎 能典

統計数理研究所