平成222010)年度 一般研究2実施報告書

 

課題番号

22−共研−2022

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

1

研究課題名

シンボリックデータの解析に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

HIROSHI YADOHISA

所属機関

同志社大学

所属部局

文化情報学部文化情報学科

職  名

教授

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

1 人

 

 

研究目的と成果(経過)の概要

Diday (1988)によって提案されたシンボリックデータ解析に関する研究がヨーロッパを中心に進んでいる.シンボリックデータとは,データの表現を一般化するための概念であり,従来のデータは,データ点が実数空間の一点で表現されるのに対して,データ点の値としてシンボリックオブジェクトといわれる区間値,多値,modal値などを仮定したデータである.シンボリックデータは,従来のデータを包含する概念であり,シンボリックデータ解析は,シンボリックデータに対する解析手法であり,従来のデータ解析手法をシンボリックデータに対するものへと拡張するものとなっている.
近年,インターネットや計算機の発展,普及によって,様々な分野で扱われるデータが大規模かつ複雑なものとなっており,従来のデータ解析手法では対応しきれない場合がある.そのため,大規模かつ複雑なデータに対する解析手法が必要とされている.
シンボリックデータの概念を用いれば,大規模なデータを要約してより小さなデータとして表現することが可能であり,より複雑な情報を記述することができることからシンボリックデータ解析は,大規模かつ複雑なデータに対して非常に有用である.
本研究においては,既存の多変量データ解析法を拡張し,シンボリックデータに対応させた手法をいくつか提案した.また,提案手法を実データに適用し,提案手法の有効性の確認を行った.研究を進めていく中で,既存手法の単純な拡張では対応できない課題も多いことが判明し,さらなる検討の必要性が確認された.次年度以降も本研究を継続し,シンボリックデータ解析法の体系化を目指したいと考えている.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Terada, Y. and Yadohisa, H. (2010). Non-Hierarchical Clustering for Distribution-Valued Data. to appear in COMPSTAT 2010: Proceedings in Computational Statistics, Psysica-Verlag, Heidelberg, p1653-p1660.
[2] Terada, Y. and Yadohisa, H. (2010). Modal Interval-Valued Dissimilarity Between Histogram-Valued Data. 3rd German-Japanese Workshop ``ADVANCES IN DATA
ANALYSIS AND RELATED NEW TECHNIQUES AND APPLICATIONS", Karlsruhe, German.
[3] Terada, Y. and Yadohisa, H. (2010). Kernel Methods for Analyzing Symbolic Data.
GfKl 2010, Karlsruhe, German.
[4] Tanioka, K. and Yadohisa, H. (2010), Effect of Data Standardization on the Result of k-Means Clustering, GfKl 2010, Karlsruhe, German.
[5] Saito, Y. and Yadohisa, H. (2010). Visualization of Asymmetric Clustering Result with
Digraph and Dendrogram, GfKl 2010, Karlsruhe, German.
[6] Terada, Y. and Yadohisa, H. (2010),Principle Component Analysis for Histogram-valued Data, The 10th China-Japan Symposium on Statistics Collected Papers, 254-257.
[7] 寺田吉壱, 宿久洋. (2010). 分布値データに対するクラスタリング法の提案. 日本計算機統計学会第24回大会報告集, p1-p4.
[8] 齊藤裕一, 宿久洋. (2010). 非対称階層的重複クラスタリング法の提案. 日本行動計量学会 第38回大会発表論文抄録集, p88-p89.
[9] 齊藤裕一, 寺田吉壱, 宿久洋. (2010). 対象の密集度を考慮した重複クラスタリング法の提案.
日本分類学会 28回研究報告会 予稿集, p15-18.
[10] 寺田吉壱, 宿久洋. (2010), 区間値非類似性データに対する超球モデルMDSについて.
日本分類学会 第27回研究報告会予稿集, p35-p38.
[11] 寺田吉壱, 宿久洋. (2010), ヒストグラム値データに対する主成分分析法について. 2010年度統計関連学会連合大会講演報告集, , p282.
[12] 阿部寛康, 池田健人, 波多野賢治, 宿久洋. (2010), 内容ベースフィルタリングを用いた動画検索サイトの利用履歴分析. 日本分類学会 第27回研究報告会予稿集, p31-p34.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関