平成232011)年度 一般研究2実施報告書

 

課題番号

23−共研−2037

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

2

研究課題名

シンボリックデータの解析に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

YADOHISA HIROSHI

所属機関

同志社大学

所属部局

文化情報学部

職  名

教授

配分経費

研究費

40千円

旅 費

357千円

研究参加者数

17 人

 

 

研究目的と成果(経過)の概要

近年,「大量データ(big data; huge data; massive data)」,「複雑データ(complex data)」が研究キーワードとして挙げられるようになった.情報機器の発達,それに伴う分析者の興味の多様化によりこれらのデータに対する分析法の需要が高まってきたためであり,シンボリックデータ解析は,それらのデータに対する分析法の1つとして,Diday (1988) によって提案された.ここで,シンボリックデータとは,データの表現を一般化した概念である.従来のデータは,データ点が実数空間の一点で表現されるのに対して,シンボリックデータは,データが区間やヒストグラムなどシンボリックオブジェクトによって表現される.そして,シンボリックデータ解析は,シンボリックデータに対する解析手法であり,従来のデータ解析手法をシンボリックデータに対するものへと拡張したものである.
シンボリックデータ解析が大規模かつ複雑なデータに対して有用であると考えられている所以は,大規模なデータをより小さいデータに集約する際に,シンボリックデータの概念を用いれば複雑な情報をもたせて表現することが可能である点にある.このため,特にヨーロッパを中心に,分析法の提案,実用的なソフトウェアの開発が行われている.
本研究においては,既存の多変量データ解析法を拡張し,シンボリックデータに対応させた手法をいくつか提案した.また,シンボリックデータがもつ性質に注目した,新しい分析法の提案も行った.シンボリックデータ解析研究において,今後は後者に着目した研究が主流になると考えられるため,次年度以降は特に後者に着目して,新しいシンボリックデータ解析法の提案を目指したいと考えている.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Abe, H., Terada, Y. and Yadohisa, H. (2011): Measuring an equivalence of purchase intervals using a revised Gini index, The 58th World Statistics Congress of the International Statistical Institute, Dublin, Ireland.
[2] Kitano, M. and Yadohisa, H. (2011): Text mining with extraction of similar expression patterns by using signed bipartite graph, Joint Meeting of the Taipei International Statistical Symposium and 7th Conference of the Asian Regional Section of the IASC, Tipei, Taiwan.
[3] Saito, Y. and Yadohisa, H. (2012): Visualization of Asymmetric Clustering Result with Digraph and Dendrogram, Challenges at the interface of Data Analysis, Computer Science, and Optimization (W, Gaul et al. eds), Springer, Heidelbarg, pp. 151--159.
[4] Takagi, I. and Yadohisa, H. (2011): Correspondence analysis for symbolic contingency tables based on interval algebra, in Complex Adaptive Systems 2011: Procedia Computer Science, Elsevier, 6, pp. 352--357.
[5] Tanioka, K. and Yadohisa, H. (2011): Hierarchical clustering algorithm with combined criteria for large and complex similarity data International Journal of Knowledge Engineering and Soft Data Paradigms, 3(2), pp. 121--131.
[6] Tanioka, K. and Yadohisa, H. (2012): Effect of Data Standardization on the Result of k-Means Clustering, Challenges at the interface of Data Analysis, Computer Science, and Optimization (W, Gaul et al. eds), Springer, Heidelbarg, pp. 59--67.
[7] Tanioka, K. and Yadohisa, H. (2012):Three-Mode Subspace Clustering for Considering Effects under Noise Variables and Occasions, The 4th Japanese-German Symposium on Classification, Kyoto, Japan.
[8] Terada, Y. and Yadohisa, H. (2011): Multidimensional Scaling with the Nested Hypersphere Model for Percentile Dissimilarities, in Complex Adaptive Systems 2011: Procedia Computer Science, Elsevier, 6, pp. 364--369.
[9] Terada, Y. and Yadohisa, H. (2012):Asymmetric Multidimensional Scaling with Generalized Hyperellipse Model, The 4th Japanese-German Symposium on Classification, Japan.
[10] 石井涼, 北野道春, 宿久洋. (2012): 社会ネットワーク分析を用いたサッカーナショナルチームの攻撃パターンの評価と比較, 第1回スポーツデータ解析コンペティション, 優秀賞, (於 統計数理研究所).
[11] 谷岡健資, 高木育史, 宿久洋. (2012): 視覚化法を用いた投手の特徴把握について, 第1回スポーツデータ解析コンペティション, 最優秀賞, (於 統計数理研究所).
[12] 寺田吉壱, 宿久洋. (2012): クラスタリング法と多次元尺度構成法の同時分析について, 日本分類学会 第30回研究報告会 研究報告予稿集, pp. 1--4.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

テーマ: シンボリックデータ解析に関する研究会
日時: 2012年2月23日9:30〜12:00
場所: 統計数理研究所セミナー室5
参加者数: 30人

 

研究参加者一覧

氏名

所属機関

阿部寛康

同志社大学大学院

石井 涼

同志社大学大学院

大森 崇

同志社大学

北野 道春

同志社大学

小池啓介

同志社大学大学院

酒折 文武

中央大学

高木 育史

同志社大学

谷岡 健資

同志社大学

田村 義保

統計数理研究所

寺田 吉壱

大阪大学

波多野 賢治

同志社大学

松井 佑介

北海道大学大学院

水田 正弘

北海道大学

南 弘征

北海道大学

山下 陽司

同志社大k学

山下陽司

同志社大学大学院