平成91997)年度 共同研究A実施報告書

 

課題番号

9−共研−122

専門分類

2

研究課題名

統計データ解析の並列処理

フリガナ

代表者氏名

シラカワ トモノリ

白川 友紀

ローマ字

所属機関

筑波大学

所属部局

構造工学系

職  名

助教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

3 人

 

 

 

研究目的と成果(経過)の概要

近年,高速な情報処理のために並列計算機が様々な分野で導入されているが,並列計算機はその構成方式によって実際の性能が異なる。そのため,構成方式の異なる並列計算機でデータ解析の処理の速度の違いを調べる。


並列計算機上で統計データ解析の高速な処理を行なうことを目的する。
そのために構成方式の異なる並列計算機を用いて、統計データ解析の処理速度の違いを想定し評価した。
具体的には、統計数理研究所にある IBM RS/6000 SP(SP2)、筑波大学にある日立 SR2201、及び8台のパソコンを用いたパソコン・クラスタ上で、基本的な統計量を求める処理、重回帰分析、主成分分析を実行し、その処理時間、並列処理効率、速度向上の様子などを測定した。
その結果、実処理時間の比較では、基本統計量では CP-PACS が、通信に頻繁に行われる重回帰分析では RS-6000 SP が、主成分分析では RS-6000 SP が最も処理に適しているという結果が得られた。
また、主成分分析では計算途中に通信が行なわれないこともあり、パソコン・クラスタでも実用に耐え得る速度が得られた。
なお、プログラムの開発は、メッセージ通信用の標準ライブラリである MPI(Message Passing Interface)を用いて行なった。
MPI を使用して開発することにより、プログラムの移植性(可般性)が高くなり、異なる環境での処理の実行が容易になった。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

下平 文彦、白川 友紀、田村 義保、統計データ解析における並列計算機システムの性能評価、統計数理、掲載予定


研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

筑波大学には富士通のVPP500,日立のSR2201という並列計算機があり,後者において既に統計データ解析の並列処理を行って,その実行速度や並列処理効率を測定している。また,パソコンクラスタにおいても同様のことを行っている。これらの結果に加え,統計数理研究所のIBM SP2での結果を測定し,互いに比較検討することにより,並列計算機の構成方式による違いを明らかにするとともに,統計データ解析をいろいろな並列計算機で効率良く行うことを検討する。


 

研究参加者一覧

氏名

所属機関

下平 文彦

筑波大学大学院

田村 義保

統計数理研究所