平成31991)年度 共同研究実施報告書

 

課題番号

3−共研−4

専門分類

1

研究課題名

非線形構造を持つ多次元データの解析法の数理的研究

フリガナ

代表者氏名

ミズタ マサヒロ

水田 正弘

ローマ字

所属機関

北海道大学

所属部局

大学院工学研究科

職  名

助教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

2 人

 

 

 

研究目的と成果(経過)の概要

多次元データ解析の理論的基礎として線形構造の解析があり,数多くの成果が上げられている。しかし,線形構成を仮定できないデータも少なくない。例えば角度データや特定の曲面の近くに分布していると考えられるデータでは,それらの特性を利用する方が有効である。そこで本研究では,非線形構造を持つデータの解析法の開発を目的とする。


非線形構造を持つデータの解析法として、曲線当てはめを中心に研究を進めた。データの各次元(各変量)が説明変量と目的変量に分かれている場合には、回帰分析法や平滑化の手法が数多く開発されている。しかし、各次元が同等であり、説明変量や目的変量の区別が明確でないとき(外的基準のない場合)には、有効な解析方法はそれほど存在しない。以上の背景から、外的基準のない多次元データに対する曲線あてはめの手法を中心に検討・開発した。
自由曲線によって、曲線を当てはめる方法としては、Principal Curvesがある。しかし、この方法には、(1)計算時間がかかる、(2)バイアスを生ずる、(3)曲線の端点で当てはまりが悪くなる、などの問題点がある。本研究において、それぞれの問題について検討した。(1)の計算量については、Principal CurvesのアルゴリズムにおけるProjection Stepにおいて2分木を利用することにより、従来データ数Nの2乗の計算量が必要であったところ、大幅な計算量が短縮が可能になった。(2)のバイアスについては、バイアスの原因を、Principal Curvesが理論的に有するバイアス(曲線の外側に膨れる)とlowessによる平滑化のバイアス(内側に縮む)とに分離すると平滑化の影響の方が通常は大きいことが判明した。このバイアスはlowessの次数を2次にすることにより少なくすることができた。(3)の端点の問題については完全には解決していないが、曲線を閉曲線に限定する場合には平滑化のアルゴリズムを改良することにより、適切な曲線あてはめが可能になった。
解析曲線によって、曲線をあてはめる方法としては、Gnanadesikanによる一般化主成分分析などが1970年代から提案されているが、得られ曲線の意味付けが困難であった。そこで、本研究では、Taubinが1990年に提案した陰関数による当てはめの追試を実施した。しかしTaubinの曲線当てはめにおいても、曲線とデータとの(集合としての)2乗距離の総和を最小とするという意味での最適化はなされておらず、曲線と点との2乗近似距離の総和を最小にしているにすぎないことが分かった。この課題を検討すると共に、陰関数による当てはめの新たなアルゴリズムの開発を行った。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

水田正弘、2次元データに対して最小2乗距離を有する2次曲線の導出法、投稿中

水田正弘、Shape Polynimialsについて、日本統計学会、1991年7月24日
馬場康維、ランキングに基づく分類法、日本分類学会、1991年11月16日

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

多次元データが有する可能性のある非線形構造を非常に多様であるが,本研究では,曲線や曲面の近くに分布していると仮定できる構造を有するデータを中心に扱う。特に,principal curvesの概念に基づいた曲線の当てはめおよび,その拡張である枝分かれがある場合の曲線当てはめを利用して,複雑な構造を有するデータの解析法を検討する。
統数研の馬場助教授は従来から角度データの解析についての研究成果があり,その基礎のもとに種々のデータ解析法の研究・開発を行ってきた。また北海道大学の水田助教授は曲面的構造を解析する方法を研究・改良している。そこで両者の共同研究によって非線形構造を統一的に解析するための基礎理論の構築を目指すことができる。


 

研究参加者一覧

氏名

所属機関

馬場 康維

統計数理研究所