平成192007)年度 一般研究2実施報告書

 

課題番号

19−共研−2040

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

2

研究課題名

シンボリックデータ解析法と関数データ解析法の関連性に関する研究

フリガナ

代表者氏名

ミズタ マサヒロ

水田 正弘

ローマ字

Masahiro MIZUTA

所属機関

北海道大学

所属部局

情報基盤センター

職  名

教授

配分経費

研究費

40千円

旅 費

210千円

研究参加者数

4 人

 

 

研究目的と成果(経過)の概要

 近年の情報過多時代において統計学の専門家が扱わなくてはいけないデータの範囲が拡張している。このようなデータに対するアプローチとして、シンボリックデータ解析法と関数データ解析法が独立に提案されている。本研究課題の目的は、シンボリックデータ解析法と関数データ解析法の類似点と差異を検討するとともに、新たな解析手法を開発することである。
 シンボリックデータ解析法において取り扱うデータの型は、従来の連続量や離散量のみならず、分布、集合、ヒストグラム、インターバルなど広範囲にわたっている。最も典型的な状況としては、次元およびデータ量が大きすぎ、従来の多次元データ解析法では計算量の制約より扱うことが不可な場合、個体を縮約させ、計算可能なサイズにしてから扱う場合である。縮約した値が従来の多次元データ解析法で扱えるとき(例えば、行列やベクトルで表現できる場合)には問題とはならない。しかし、縮約したものが集合、インターバル、超球などの場合、従来の解析法は適用できない。そこで、新たな解析方法が望まれる。これが、シンボリックデータ解析法である。また、関数データ解析法では、解析対象が関数または、関数で表現できる観測値を扱う。代表的なデータは、時間に依存して値が変化するデータであるが、関数の定義域は時間に限定されない。両者とも、従来のデータ解析の枠組みを広げるアプローチである。
 本研究では、基本的なシンボリックデータであるインターバルデータおよび、最も理解しやすい関数データである時間的に変化するデータの共通部分を想定した。すなわち、時間的に変化するインターバルデータの解析法を検討した。ここでは、主成分分析法に着目し、関数インターバルデータに対する主成分分析法(PCA for Functional Interval Data)を開発し、国際会議などで報告した。提案手法は、腫瘍治療に関する医療データに適用することなどが可能であることが分かった。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Masahiro Mizuta,
PCA for Functional Interval Data,
Bulletin of the International Statistical Institute, 56th Session, CD-ROM 4Pages(2007)
22 - 29 AUG, Lisboa 2007

Nobuo Shimizu and Masahiro Mizuta,
Functional clustering and functional principal points.
B.Apolloni et al. (Eds.): KES 2007/ WIRN 2007, Part II, LNAI 4693, 501-508, 2007.
KES2007 11th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems

水田正弘,
シンボリックデータ解析と関数データ解析の融合, 2007年度統計関連学会連合大会講演報告集, 102 (2007)
2007年9月6日-9日、神戸大学、(9月7日15:15-17:15 1/6講演)

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

小宮 由里子

北海道大学

清水 信夫

統計数理研究所

原田 剛

北海道大学