平成242012)年度 共同利用登録実施報告書

 

課題番号

24−共研−24

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

3

研究課題名

分散処理による大型臨床研究の対話的データ解析

フリガナ

代表者氏名

オカダ マサフミ

岡田 昌史

ローマ字

Okada Masafumi

所属機関

筑波大学

所属部局

医学医療系

職  名

講師

 

 

研究目的と成果の概要

約2500名を対象とした大型の臨床介入研究であるFROM-J研究のデータ解析の効率化にあたり、統計数理研究所の共同利用スーパーコンピューター環境を利用し、大規模データに対しても対話的に統計解析を行える環境を開発することを目的に研究を実施した。
スーパーコンピューター環境に導入されている統計解析環境R上で、解析とレポート生成を同時に実施できる拡張パッケージであるknitRを利用する環境を整備した。同時にRmpiパッケージを導入して並列計算を実施可能とした。その結果、12コアCPUを持つデスクトップPCで4.56秒必要であった処理が、スーパーコンピューターの128ノードを使用した場合は0.225秒で完了し、大幅な高速化に成功した。臨床研究で得られるデータは入力ミスや欠損値等が非常に多く含まれる、ノイズの多いデータであり、そのデータクリーニングおよび解析にあたっては、プログラムを頻繁に修正して結果をみていく対話的作業が必要になる。統計数理研究所のスーパーコンピューターシステムでRとRmpiを使用することで、対話的作業においても大きな計算能力を活用でき、研究者の待ち時間を大きく短縮することが可能であった。本研究の成果を一般化することで、大規模な臨床研究のデータクリーニング、および視覚化がより容易かつ効率的に行えるようになることが期待される。