平成272015)年度 一般研究1実施報告書

 

課題番号

27−共研−1029

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

3

研究課題名

ビッグデータ解析によるエボラ出血熱やインフルエンザ等の核酸医薬デザイン

フリガナ

代表者氏名

ホンダ ケイスケ

本多 啓介

ローマ字

Honda Keisuke

所属機関

統計数理研究所

所属部局

運営企画本部

職  名

リサーチ・アドミニストレーター

 

 

研究目的と成果(経過)の概要

ヒトのゲノム配列には個人や人種による差異があるのを考慮した、かつ、可能な限り副作用の少ない核酸医薬のデザインが本研究の最終的な目的である。ヒトゲノムやヒトRNA、並びに病原ウイルス株での出現頻度特性の把握(word countによる)には広大なメモリ領域が必要となる。BLSOM(一括学習型自己組織化マップ法)のプログラムで国際DNAデータバンクに収録されているようなデータを扱うには約54テラバイトほどのメモリが必要となる。そこで統計数理研究所の世界最大の共有メモリ型スーパーコンピューターで実行することで大量のヒトRNA全体や大量のウイルス株全体のRNA類について、オリゴヌクレオチド頻度解析を可能な限り多量で高次元なデータで行った。
また新たにデータベースソフトウェアを開発することでDNAだけでなく、タンパクでも網羅的な使用頻度辞書の総覧をつくることが可能となった。このデーターベースを用いてインフルエンザの、1930年〜2015年まで、可能な限り収集できるデータを用いてタンパクの使用頻度の網羅的な辞書を作成した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Big data analyses on genome sequences with special focus on oligonucleotide word count
Yoshiko Wada(Nagahama Institute of Bio-Science and Technology, Nara Institute of Science and Technology)
Kennosuke Wada (Nagahama Institute of Bio-Science and Technology)
Yuki Iwasaki(Nagahama Institute of Bio-Science and Technology
Takashi Abe(Niigata University)
Shigehiko Kanay(Nara Institute of Science and Technology)
Toshimichi Ikemura (Nagahama Institute of Bio-Science and Technology)
http://ura3.c.ism.ac.jp/hpccon15/

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

2015年10月9日
ISM High Performance Computing Conference参加発表
池村、和田、本多
2015年10月10日
ISM High Performance Computing Conference参加
池村、和田、本多

 

研究参加者一覧

氏名

所属機関

池村 淑道

長浜バイオ大学

Mark Ravinet

国立遺伝学研究所

和田 健之介

長浜バイオ大学