平成242012)年度 一般研究1実施報告書

 

課題番号

24−共研−1003

分野分類

統計数理研究所内分野分類

a

主要研究分野分類

3

研究課題名

次世代シーケンスデータの統計解析基盤

フリガナ

代表者氏名

ヨシダ リョウ

吉田 亮

ローマ字

Yoshida Ryo

所属機関

統計数理研究所

所属部局

モデリング研究系

職  名

准教授

 

 

研究目的と成果(経過)の概要

高速シーケンサがゲノム情報の爆発的な大規模化をもたらした今、シーケンスデータ解析の方法論の抜本的な見直しが求められている。モチーフ配列の発見、すなわち塩基配列に埋め込まれた短い保存配列を検出する問題は、生物情報学の創世期からの研究対象であり、現在に至るまで実に多くの方法論が提案されてきた。しかしながら、近年のデータの大規模化により、これら第一世代のモチーフ検出手法はその機能を果たせなくなりつつある。そこで、第二世代アルゴリズムの開発競争が始まることとなる。次世代シーケンサ以降の第二世代アルゴリズムの中で、真に実用レベルに達するものは今のところ存在しない。本研究では、タスク分割型モチーフサンプラーという新しいモチーフ検出法のプロトタイプを開発した。アルゴリズムの設計概念は、以下のように説明される:複数のモチーフ検出アルゴリズムを並列実行する際、探索軌道間に「反発作用」を与え、各々が異なるモチーフ配列に到達するように作業分担させる。このタスク分割機能により、多様なモチーフ配列を重複なく、一回の並列計算で網羅的に検出することが可能になった。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

池端久貴, 吉田亮 (2012) ベイジアン・コンピューティングとDNA配列からのプロモータ部位の予測, 2012年度統計関連学会連合大会

池端久貴, 吉田亮 (2012) タスク分割型ベイジアンモデリングに基づくDNAモチーフ配列の探索, 第15回情報論的学習理論ワークショップ(IBIS2012)

Saethang T, Hirose O, Kimkong I, Tran VA, Dang XT, Nguyen LA, Le TK,
Kubo M, Yamada Y, Satou K., EpicCapo: epitope prediction using combined information of amino acid pairwise contact potentials and HLA-peptide contact site
information, BMC Bioinformatics, 2012 Nov 24;13:313.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

長崎 正朗

東北大学

広瀬 修

金沢大学