平成232011)年度 一般研究1実施報告書

 

課題番号

23−共研−1021

分野分類

統計数理研究所内分野分類

g

主要研究分野分類

1

研究課題名

M-decomposability and Elliptical Unimodal Densities

フリガナ

代表者氏名

ナカノ ジュンジ

中野 純司

ローマ字

Nakano Junji

所属機関

統計数理研究所

所属部局

データ科学研究系

職  名

教授

 

 

研究目的と成果(経過)の概要

 われわれは、確率密度関数の形状に関して、対称単峰分布の混合を用いる M-decomposability という概念を提案した。これは1変量分布の場合は、その分布の標準偏差と、それを2つの分布の混合分布で表現したときのそれぞれの分布の標準偏差の和を比較し、前者が後者より大きければ M-decomposable であるとするものである。また、対称単峰分布は平均が同一の一様分布の混合分布で漸近的に近似できることも示し、その構成より、一様分布のひとつの特長付けも行った。また、この手法が、核関数による密度関数推定などに利用できることも示した。
 この結果をより一般化して、M-decomposabilityにおいて、混合分布の数が2つ以上にも適用することを証明した。その拡張は多変量の場にも適用できる。そして、ほとんどの場合、1変量分布の場合の考え方が、そのまま多変量分布に自然に拡張できることがわかった。この結果がクラスター解析や統計的学習法に応用出来ることを示した。
 M-decomposableである分布のうち、尖度(4次)以上の高次モーメントが低いものが多い。そして、高次モーメントと低次モーメントがある条件を満たせばその元の分布はM-decomposableであることが存在することがわかった。その結果をより厳密に拡張すればM-decomposabilityの十分条件を見つけることによって、クラスター解析や学習法にも役立つことであろう。
1変量分布の場合、標準偏差をバラツキの尺度として使用されることが普通だが、それは確率分布のL2ノルム空間に相当する定義である。本年度は、バラツキをより一般的にLpノルムに拡張していても、M-decomposabilityの結果がそのまま適用できることを証明した。この結果は、M-decomposabilityはバラツキの定義に関して強靭性があることを示した。
 さらに、多変量分布はM-decomposable であるかどうかを判定する時、その多変量分布の各々の変量周辺分布のうち、一つでもM-decomposable なものが存在すれば十分条件が満たされていることを示した。その結果は、変量数がデータ数を上回る場合の分析にも利用できることが期待される。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Nicholas Chia and Junji Nakano, M-decomposability, elliptical unimodal densities, and applications to clustering and kernel density estimation,
arXiv: 0802.1669 ( http://arxiv.org/abs/0802.1669 )

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

謝 剛強

野村證券株式会社