平成272015)年度 重点型研究実施報告書

 

課題番号

27−共研−4205

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

2

研究課題名

クラウド指向ビッグデータ解析処理に関する実践的研究

重点テーマ

ビッグデータの統計数理 II

フリガナ

代表者氏名

ミナミ ヒロユキ

南 弘征

ローマ字

Minami Hiroyuki

所属機関

北海道大学

所属部局

情報基盤センター

職  名

教授

配分経費

研究費

40千円

旅 費

448千円

研究参加者数

7 人

 

研究目的と成果(経過)の概要

本研究課題は、クラウド環境下におけるビッグデータ解析処理として,統計科学者が行う標準的手順をあらためて検討し,各ステップにおける情報工学的技法の利活用の可能性を整理し,統計科学者として標準的な,R言語を用いる解析手順と対比させ,それぞれの長短所を明らかにし,多種多量データの解析に対する指針の確立を最終的な目的とした。
実際の作業工程において、Python言語によるデータ解析パッケージ群(NumPy, SciPy, matplotlib)を軸とし、大規模なデータセットの参照のために用いられるHDF5も併用し、R言語単体では十分なパフォーマンスを得にくかった解析作業について、相応の結果を得られることがわかった。しかしながら、比較例として十分な分量に至ったとは考えておらず、今後も継続的に検討を進めたい。また、情報源として記した発表の演題に含まれる、ビッグデータを適切に区分して扱うMini dataのアイデアについても、クラウド環境との親和性が高いものと考えており、具体な実装に向け研究を進めたい。
なお、南、水田以外の参加者は、予算および日程の制約から、来所が叶わなかった。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

H. Minami, M. Mizuta: Revisit on Big Data Analysis Framework - How to Make Proper 'Mini data'? The 2015 conference of the International Federation of Classification Societies, CONTR2-3 (2015).
H. Minami, M. Mizuta: Empirical study on analytic software toward 'Mini-data' analysis. The 9th Conference of the Asian Regional Section of the IASC (IASC-ARS 2015), Invited Talk (IS35) (held in December 16-19, 2015).

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

統計数理研究所共同利用研究 平成27年度「ビッグデータの統計数理 II」共同研究集会
(2015.10.26 13:30-17:00、統計数理研究所 セミナー室2(D304)、20名程度)

 

研究参加者一覧

氏名

所属機関

小宮 由里子

北海道大学

清水 信夫

統計数理研究所

難波江 貴行

北海道大学

水田 正弘

北海道大学

棟朝 雅晴

北海道大学