平成302018)年度 一般研究1実施報告書

 

課題番号

30−共研−1013

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

3

研究課題名

全ゲノムデータと様々な臨床情報の総合的統計遺伝解析

フリガナ

代表者氏名

ウエキ マサオ

植木 優夫

ローマ字

Ueki Masao

所属機関

理化学研究所

所属部局

革新知能統合研究センター

職  名

研究員

 

 

研究目的と成果(経過)の概要

昨今のゲノム医学研究では、数万人以上からなる大規模集団コホートを用いた研究が盛んに行われている。
SNPアレイや、より網羅的な全ゲノムシーケンシングデータに加えて、多数の臨床情報が測定された大規模なデータが収集されており、有益な情報を含むことが期待される。データは超高次元であり複雑なものとなっている反面、利用される統計手法は非常に単純な回帰モデルが用いられている。例えば、ゲノムワイド関連研究(GWAS)では、ひとつの形質と一塩基多型(SNP)をひとつづつ一変量回帰に当てはめ、回帰係数の検定によって検査する単純な方法(単点解析)が標準的に用いられる。一方で、このような手法で発見される遺伝子効果は小さいことがほとんどであり、形質の変動を充分に説明できないことが報告されている。これを失われた遺伝率問題という。
この問題を解決するため、その他の臨床情報を組み合わせた様々な仮説の探索的な検証が求められている。
例えば、遺伝子と環境間の相互作用解析はひとつの重用な方向性であるが、データが大規模であれば候補の環境要因の数も膨大となるため、網羅的な解析を行う上では、統計手法の高速化が必要となる。

本研究では、大規模ゲノムコホートデータの情報をより効率的に解析するための統計手法の開発を行った。Sato & Ueki (2018)において、遺伝的効果が存在しないという帰無仮説下では、原理的に、帰無推定量が全ゲノムにわたって同一のものを利用できるはずであるが、実際にはバリアントごとに異なる欠測が起こるために、異なる帰無推定が各バリアントごとに必要となり、計算量が増大していた点を、単一の帰無推定量のみで済むスコア検定を新たに開発することで計算の高速化を達成した。提案法は、単点解析および遺伝子環境間相互作用解析に応用された。また、Ueki (2018)では、スコア検定と偏相関係数の関係から、Fisher変換によって検出力を向上させる手法を開発した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Sato S, Ueki M (2018) Fast score test with global null estimation regardless of missing genotypes. PLoS ONE. 13: e0199692.

Ueki M (2018) Enhancing power of score tests for regression models via Fisher transformation. Journal of the Japanese Society of Computational Statistics. 30: 37-53.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

該当しない

 

研究参加者一覧

氏名

所属機関

川崎 能典

統計数理研究所

櫻井 利恵子

理化学研究所

佐藤 俊太朗

久留米大学大学院