平成272015)年度 一般研究2実施報告書

 

課題番号

27−共研−2016

分野分類

統計数理研究所内分野分類

b

主要研究分野分類

2

研究課題名

行列分解型多変量データ解析法に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

Yadohisa Hiroshi

所属機関

同志社大学

所属部局

文化情報学部

職  名

教授

配分経費

研究費

40千円

旅 費

304千円

研究参加者数

11 人

 

 

研究目的と成果(経過)の概要

 本研究では,ビッグデータに対して行列分解型多変量データ解析法の開発を行っている.行列分解型多変量データ解析法とはデータが持っている構造を利用し,データ行列をパラメータを含むいくつかの行列に分解することで,記述的に特徴を抽出する方法である.具体的には,実現値とモデルとの誤差について特定の確率分布を仮定せず低階数近似を行う手法であり,以下では行列分解型多変量解析法とする.多変量解析法の多くは行列分解型多変量解析法として記述することができる.例えば,対応分析ではデータ行列を分割表とし,データの標準化行列とパラメータである行得点行列と列得点行列に分解し,行と列の項目の関連性について把握することができる.このような形で表現される行列分解型多変量解析法ではデータ行列とパラメータ行列の乖離度を測る目的関数を最小化することによりパラメータを推定する.すでに提案されている行列分解型多変量解析法の目的関数について共通点が数多く存在し,個々の手法を体系的にとらえることが可能であると考えられる.
また,多変量解析法の多くはデータの型・種類や分析目的に応じて個々に提案されている.ビッグデータの入手が容易になった昨今では,データの型や種類は多種多様に存在している.例えば,同一個体群に同一変量群を異なる条件下で得る「3相3元データ」やすべての値が非負であるような「非負値データ」など,それぞれのデータの型・種類に応じて多変量解析法が必要となっているのが現状である.このために,テンソルの表記を用いることで行列分解型多変量解析の手法を拡張することが考えられる.さらに,変量数の増加に伴い,データに対し一度主成分分析などの次元縮約法を適用した後に別の多変量解析を行うタンデムアナリシスと呼ばれる方法がデータに適用されることがある.しかし,タンデムアナリシスでは最終目的である回帰やクラスタリングに適した次元縮約となることは少ない.この問題点を解決するために,次元縮約とクラスタリング,回帰のパラメータを同時推定する同時分析法がある.これらの手法も行列分解型多変量解析法を用いて定義されている方法があり,目的関数についても共通点を見出せると考えられる.
本研究では,既存の多変量解析法や近年提案された行列分解型の多変量解析における共通点や問題点の把握・整理を行い,それらの解析法の特徴を踏まえ,新たな手法の提案を行った.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Mitsuhiro, M. and Yadohisa, H. (2015): Reduced k-means clustering with MCA in a low-dimensional space, Computational Statistics, 30 (2), 463-475.
[2] Takagishi, M. and Yadohisa, H. (2015): Semi-supervised clustering for sparsely sampled longitudinal data, Procedia Computer Science, 61, p18-23.
[3] Ikuta, H., Tanioka, K. and Yadohisa, H. (2015): Simultaneous analysis of multi-label classification and dimensionality reduction with clustering labels, 60th World Statistics Congress, Rio de Janeiro, Brazil.
[4] Tsuchida, J. and Yadohisa, H. (2015): Bayesian Asymmetric Multidimensional Scaling for Two-mode Three-way Count Data by Using Log-linear Model, The 9th Conference of the Asian Regional Section (ARS) of the International Association for Statistical Computing (IASC), Shingapore, (December 17 - 19, 2015).
[5] Tanioka, K. and Yadohisa, H. (2015): Constrained asymmetric MDS based on raidus model, The 9th Conference of the Asian Regional Section (ARS) of the International Association for Statistical Computing (IASC), Shingapore, (December 17 - 19, 2015).
[6] Hasegawa, K. and Yadohisa, H. (2015): Multidimensional scaling for one-mode three-way symbolic dissimilarity data, The 9th Conference of the Asian Regional Section (ARS) of the International Association for Statistical Computing (IASC), Shingapore, (December 17 - 19, 2015).
[7] Tsuchida, J. and Yadohisa, H. (2015): Bayesian unfolding for count data by using log-linear model, Statistical Computing Asia, p13, Taipei, Taiwan.
[8] Tsuchida, J. and Yadohisa, H. (2015): Canonical correlation analysis for three-mode three-way data, The 2015 conference of the International Federation of Classification Societies, p253, Bologna, Italy.
[9] Tanioka, K. and Yadohisa, H. (2015): Clustering for categorical data based on non-negative subspace, The 24th South Taiwan Statistics Conference and 2015 Chinse Institute of Probability and Statistics Annual Meeting, p95, Changhua, Taiwan.
[10] Tsuchida, J. and Yadohisa, H. (2015): Canonical covariance analysis for three-mode three-way data based on Tucker model, Japan-China Symposium on Theory and Application of Data Science, p8, Kyotanabe, Kyoto.
[11] Abe, H. and Yadohisa, H. (2015): Automatic Relevance Determination in NMF based on a Zero-Inflated Compound Poisson Model, 2015 International Workshop for JSCS 30th Anniversary in Okinawa, Okinawa Institute of Science and Technology Graduate University.
[12]谷岡健資, 上阪彩香, 山下陽司, 大森崇, 寒水崇 (2015): 日本の医学部医学科における統計学の入門講義の実態調査, 計量生物学, 35(2).
[13] 谷岡健資, 宿久洋 (2015): 非負値制約に基づくカテゴリカルデータのクラスタリング法について, 応用統計学会2015年度年会 (於 京都大学).
[14] 土田潤,宿久洋 (2015): 対数線形モデルを用いたベイジアンUnfoldingについて, 第9回日本統計学会春季集会 (於 明治大学)
[15] 高岸茉莉子, 宿久洋 (2015): 関数データ解析法による放射線モニタリングで得られたデータの解析について, 科研費シンポジウム空間データと災害の統計モデル (於 同志社大学今出川キャンパス).
[16] 阿部寛康, 宿久洋 (2015): 気象および地理情報による竜巻発生予測, 科研費シンポジウム空間データと災害の統計モデル (於 同志社大学今出川キャンパス).
[17] 土田潤,宿久洋 (2015): 3相3元データに対するTucker3モデルを用いた正準共分散分析について, 日本計算機統計学会第29回シンポジウム, p77-80, (於 釧路市生涯学習センター)
[18] 阿部寛康, 宿久洋 (2015): 零過剰複合ポアソン分布に基づく非負値行列のTri-factorization について, 日本計算機統計学会第29回シンポジウム, p131-134, (於 釧路市生涯学習センター).
[19] 阿部寛康,宿久洋 (2015): 零過剰非負値行列に対するTri-factorizationについて, 統計サマーセミナー2015, (於 海峡ビューしものせき).
[20] 土田潤,宿久洋 (2015): 2相3元データに対する対数線形モデルを用いたベイズ非対称MDSについて, 日本行動計量学会第43回大会, p402-403, (於 首都大学東京南大沢キャンパス).
[21] 阿部寛康,宿久洋 (2015): 零過剰非負値行列に対するTri-factorizationについて, 日本行動計量学会第43回大会, p342-345, (於 首都大学東京南大沢キャンパス).
[22] 谷岡健資, 宿久洋 (2015): radius modelに基づく制約付き非対称多次元尺度構成法について, 第30回大規模データ科学研究会 (於 北海道大学).
[23] 土田潤,宿久洋 (2015): 対応分析と対数線形モデルを用いたMDSについて, 質的データ分析への再接近-基本理解と周辺理論- (於 統計数理研究所)
[24] 高岸茉莉子, 宿久洋 (2015): スパースな経時データに対する半教師ありクラスタリング法について, 日本計算機統計学会第29回大会, p1-4,(於 山梨県立図書館).
[25] 阿部寛康, 宿久洋 (2015): 零過剰Tweedie分布に基づく非負値行列因子分解について, 日本計算機統計学会第29回大会, p9-12, (於 山梨県立図書館).
[26] 坂上潤, 宿久洋 (2015): 教師付データのためのRKM法について, 日本分類学科第33回大会, p52-54, (於 帝京大学)
[27] 生田洋輝, 谷岡健資, 宿久洋 (2015): ラベルの分類を伴う次元縮約とマルチラベル判別の同時分析法について, 日本分類学科第33回大会, p48-51, (於 帝京大学)
[28] 山下陽司, 宿久洋 (2015): 時系列非類似度データに対するトレンドを考慮した多次元尺度構成法について, 日本分類学科第33回大会, p5-8, (於 帝京大学)
[29] 谷岡健資, 宿久洋 (2015): 直交制約に基づく非計量非負値行列因子分解について, 2015年度統計関連学会連合大会, p176, (於 岡山大学)

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

テーマ:「行列分解型多変量データ解析法に関する研究」研究会
日 時:2016年2月26日(金)13時〜18時
場 所:統計数理研究所セミナー室2
参加者数20名

 

研究参加者一覧

氏名

所属機関

足立 浩平

大阪大学

阿部寛康

同志社大学

池本 大樹

大阪大学

高木 育史

同志社大学

谷岡 健資

同志社大学

田村 義保

統計数理研究所

寺田 吉壱

独立行政法人 情報通信研究機構

水田 正弘

北海道大学

南 弘征

北海道大学

山本 倫生

京都大学大学院