平成282016)年度 一般研究2実施報告書

 

課題番号

28−共研−2016

分野分類

統計数理研究所内分野分類

b

主要研究分野分類

2

研究課題名

行列分解型多変量データ解析法に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

Yadohisa Hiroshi

所属機関

同志社大学

所属部局

文化情報学部

職  名

教授

配分経費

研究費

40千円

旅 費

279千円

研究参加者数

13 人

 

 

研究目的と成果(経過)の概要

本研究では,ビッグデータに対して行列分解型多変量データ解析法の開発を行っている.行列分解型多変量データ解析法とはデータ行列が持っている「構造」をモデルとして表現し,データ行列をパラメータを含むいくつかの行列に分解することで,記述的に特徴を抽出する方法である.具体的には,実現値とモデルとの誤差について特定の確率分布を仮定せず低階数近似を行う手法であり,この手法を以下では行列分解型多変量解析法とする.古典的な多変量解析法の多くは行列分解型多変量解析法として記述することができる.例えば,主成分分析ではデータ行列を多変量データとし,データ行列をパラメータである主成分得点行列と負荷量行列に分解し,負荷量行列によって変量間の関連性について把握することができる.このような形で表現される行列分解型多変量解析法では,データ行列とパラメータ行列の乖離度を測る目的関数を最小化することによりパラメータを推定する.すでに提案されている行列分解型多変量解析法の目的関数について共通点が数多く存在し,個々の手法を体系的にとらえることが可能であると考えられる.
また,多変量解析法の多くは分析目的だけでなく,扱えるデータの型・種類やに応じて個々に提案されている.しかしながら,ビッグデータの入手が容易になった昨今では,データの型や種類は多種多様に存在している.例えば,同一個体群に同一変量群を異なる条件下で得る「3相3元データ」やすべての値が非負であるような「非負値データ」などである.そのため,多種多様なデータの型・種類に応じて多変量解析法が必要となっているのが現状である.この問題を解決するために,テンソルの表記を用いることで行列分解型多変量解析の手法を拡張することが考えられる.さらに,ビッグデータでは,従来扱っていたデータに比べ,変量数が増加しており,データに対し一度主成分分析などの次元縮約法を適用した後に別の多変量解析を行うタンデムアナリシスと呼ばれる方法がデータに適用されることがある.しかし,タンデムアナリシスでは最終目的である回帰やクラスタリングに適した次元縮約となることは少ない.この問題点を解決するために,次元縮約とクラスタリング,回帰のパラメータを同時推定する同時分析法がある.これらの手法も行列分解型多変量解析法を用いて定義されている方法があり,目的関数についても共通点を見出せると考えられる.
 本研究では,既存の多変量解析法や近年提案された行列分解型の多変量解析における共通点や問題点の把握・整理を行い,それらの解析法の特徴を踏まえ,新たな手法の提案を行った.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Abe, H. and Yadohisa, H. (2016): Automatic Relevance Determination in Nonnegative Matrix Factorization based on Zero-inflated Compound Poisson-gamma distribution, Journal of the Japanese Society of Computational Statistics. (in press)
[2] Abe, H. and Yadohisa, H. (2016): A non-negative matrix factorization model based on the zero-inflated Tweedie distribution, Computational Statistics.(in press)
[3] Tsuchida, J. and Yadohisa, H. (2016): Asymmetric multidimensional scaling of n-mode m-way categorical data using a log-linear model, Behaviormetrika, 43, pp.103-138.
[4] Tsuchida, J., Yadohisa, H. (2016): Connected Categorical Canonical Covariance Analysis for Three-mode Three-way data Sets Based on Tucker Model, Procedia Computer Science, 96, p.912-919.
[5] Abe, H. and Yadohisa, H. (2016): Orthogonal Non-negative Matrix Tri-factorization Based on the Tweedie Family, 9th International Conference of the European Research Consortium for Informatics and Mathematics Working Group on Computational and Methodological Statistics 2016, p219, University of Seville, Spain.
[6] Takagishi, M. and Yadohisa, H. (2016): Registration method for functional data based on shape invariant model with t distribution, The 22nd International Conference on Computational Statistics, p.46, Oviedo,Spain .
[7] Tsuchida, J., Yadohisa, H. (2016): Canonical covariance analysis for three-mode three-way data by using connector matrix, The 22nd International Conference on Computational Statistics, p. 3, Oviedo, Spain.
[8] Tsuchida, J., Yadohisa, H. (2016): Majorization algorithm for dominance point model, 5th German-Japanese Workshop on Classification, p.16, Gunzburg, Germany.
[9] Abe, H. and Yadohisa, H. (2016): Orthogonal Non-negative Matrix Tri-factorization Based on the Tweedie Family, The 4th Institute of Mathematical Statistics Asia Pacific Rim Meeting, Hong Kong, China.
[10] Tsuchida, J. and Yadohisa, H. (2016): L1 Penalized Three-mode Three-way Canonical Covariance Analysis Based on Tucker2 Model, The 7th International Forum on Statistics of Renmin University of China, Beijing, China.
[11] Takagishi, M. and Yadohisa, H. (2016): Iteratively Reweighted Alignment Method Based on Shape Invariant Model, The 7th International Forum on Statistics of Renmin University of China, Beijing, China.
[12] Abe, H. and Yadohisa, H. (2016): Two Soft Clustering Approaches for Weighted Spherical K-means, The 7th International Forum on Statistics of Renmin University of China, Beijing, China.
[13] Tsuchida, J., Yadohisa, H. (2016): Constrained canonical covariance analysis by using Tucker2 model. Joint Statistical Meeting 2016,Chicago, U.S.A.
[14] 高岸茉莉子, 宿久洋 (2016): Shape Invariant Modelに基づく繰り返し加重アライメント法の提案, 第9回日本統計学会春季集会, (於 東北大学).
[15] 阿部寛康, 宿久洋 (2016): Tweedie分布族に基づく非負値行列の直交制約付Tri-factorizationについて, 第9回日本統計学会春季集会, (於 東北大学).
[16] 土田潤,宿久洋 (2016): 制約付き2相3元Dominance点モデルについて, 日本計算機統計学会第30回シンポジウム, pp.97-100, (於 プラサ ヴェルデ).
[17] 阿部博康,宿久洋 (2016):順序制約を伴う直交制約付非負値行列因子分解, 日本計算機統計学会第30回シンポジウム, pp.93-96, (於 プラサ ヴェルデ).
[18] 土田潤, 宿久洋 (2016): Dominance 点モデルのMajorization アルゴリズムについて, 日本行動計量学会第44回大会, p.90-91, (於 札幌学院大学).
[19] 阿部寛康, 宿久洋 (2016): 直交制約付き非負値テンソル因子分解について, 日本計算機統計学会第30回大会, p141-142, (於 ハートピア京都).
[20] 高木育史, 宿久洋 (2016): クラスタリングを伴う射影追跡法の提案, 日本計算機統計学会第30回大会, p157-158, (於 ハートピア京都).
[21] 高岸茉莉子, 宿久洋 (2016): t分布を用いたロバストなアライメント法の提案, 日本計算機統計学会第30回大会, p93-96, (於 ハートピア京都).
[22] 阿部寛康, 宿久洋 (2016): 複合ポアソン分布に基づく直交制約付の非負値行列因子分解について, 「行列分解に基づく大規模複雑データ解析法に関する研究」研究会, (於 北海道大学).
[23] 谷岡健資, 宿久洋 (2016): CDSに基づく制約付き非対称多次元尺度構成法について, 「行列分解型多変量データ解析法に関する研究」研究会, (於 統計数理研究所).
[24] 阿部寛康, 宿久洋 (2016): 複合ポアソン分布に基づく非負値行列の直交制約付Tri-factorizationについて, 「行列分解型多変量データ解析法に関する研究」研究会, (於 統計数理研究所).
[25] 土田潤, 岡部格明, 宿久洋 (2016): 統計力の分類-統計検定受験者の解答を用いて-, 日本分類学会第34回大会, p34-36, (於 東海大学)

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

統計数理研究所共同研究

「複雑多変量データの解析法に関する研究」研究会

日 時:2017年3月8日(金)13時〜18時
場 所:統計数理研究所セミナー室2

〔プログラム〕
13:00〜13:30 北條大樹(専修大学)・岡田謙介(専修大学)
 係留寸描法を用いた反応傾向バイアス補正のためのIRTモデルの応用
13:30〜14:00 分寺杏介(東京大学)・岡田謙介(専修大学)
 反応時間の情報を活用する新たな項目反応モデル
14:00〜14:30 高岸茉莉子(同志社大学)・宿久洋(同志社大学)
ノンパラメトリックアプローチに基づく係留寸描法について
14:30〜15:00 土田潤(同志社大学)・宿久洋(同志社大学)
多次元多値項目反応理論の等化法の比較について

15:00〜15:30 休憩

15:30〜16:00 足立浩平(大阪大学)
 因子分析の正体
16:00〜16:30 山本倫生(京都大学)
 "意味のあるクラスター構造"の推定方法とその性質について
16:30〜17:00 LI JI YAO(大阪大学)
 バイクラスタリングの新たな手法に関する研究
17:00〜17:30 田中利夫(専修大学)・岡田謙介(専修大学)
 拡散モデルを用いた視線手がかり課題における情報処理過程のモデリング
17:30〜18:00 山口一大(東京大学)・岡田謙介(専修大学)
 TIMSSデータを用いた認知診断モデルの国際比較

参加人数:20名

 

研究参加者一覧

氏名

所属機関

足立 浩平

大阪大学

阿部 寛康

同志社大学

高木 育史

同志社大学

高岸 茉莉子

同志社大学

谷岡 健資

同志社大学

田村 義保

統計数理研究所

土田 潤

同志社大学

寺田 吉壱

独立行政法人 情報通信研究機構

水田 正弘

北海道大学

南 弘征

北海道大学

山本 倫生

京都大学大学院

LI JI YAO

大阪大学