平成292017)年度 一般研究2実施報告書

 

課題番号

29−共研−2044

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

3

研究課題名

疾患異質性の推定と判別解析への応用

フリガナ

代表者氏名

マツイ シゲユキ

松井 茂之

ローマ字

Matsui Shigeyuki

所属機関

名古屋大学

所属部局

医学系研究科生物統計学分野

職  名

教授

配分経費

研究費

40千円

旅 費

54千円

研究参加者数

5 人

 

 

研究目的と成果(経過)の概要

がんを対象として疾患異質性を考慮したデータ解析の枠組みの構築を試みる.具体的には,がん患者及び健常者の遺伝子発現量データを対象に,データの外れ値の構造(cancer outlier構造,以下CO構造)をモデルベースに推定し,遺伝子・サンプルの二方向クラスタリングにより,似た挙動を示すがん関連遺伝子のクラスタの同定と,同じ遺伝子サブセットの寄与で発がんしているがんサブグループの同定を試みる.その上で,推定されたデータ構造に基づいたがんの判別解析法を構成する.また,別のアプローチとして,CO構造を反映したがん・健常者間の乖離の度合いを表す統計量を構成し,ノンパラメトリックに判別を行う方法についても検討する.

平成29年度は,推定した入れ子型混合モデルに基づいて,がんと健常人の判別解析法の開発を行った.新たなサンプルの発現量データが与えられたとき,がん関連遺伝子の各コンポーネントに対してそのサンプルがCOに属する事後確率を計算した.このとき,全コンポーネントで全ての組み合わせの確率を考えてもよいが,実在しない組み合わせも多く存在すると考えられるため,各コンポーネントの併合の方法をいくつか検討した.数値実験や実データ(白血病,大腸がん・膵がん研究のデータ)への適用により,従来の判別法(Fisherの線形判別分析,サポートベクターマシンなど)との性能比較を行った.なお,選抜した遺伝子セットの偽陽性の評価については,並べ替え法などを用いた簡易的な方法しか存在しないことから,入れ子型混合モデルに基づいた偽陽性の判定基準とその推定法を新たに構築した.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Oura T, Matsui K, Matsui S. Nested finite mixture modeling for cancer outlier analysis. (Submitted).

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

なし

 

研究参加者一覧

氏名

所属機関

小森 理

福井大学

西野 穣

名古屋大学大学院医学系研究科

逸見 昌之

統計数理研究所

松井 孝太

名古屋大学