平成292017)年度 一般研究2実施報告書

 

課題番号

29−共研−2036

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

2

研究課題名

制約付き多変量解析法に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

Yadohisa Hiroshi

所属機関

同志社大学

所属部局

文化情報学部

職  名

教授

配分経費

研究費

40千円

旅 費

305千円

研究参加者数

14 人

 

 

研究目的と成果(経過)の概要

本研究では,制約付き多変量解析法の開発を行なっている.
 制約付き多変量解析法とは,得られたデータに関して,分析者のもつ仮説を制約として考慮する多変量解析法である.具体的には,既知の情報を制約として,モデルのパラメータを推定する方法である.例えば,制約付き主成分分析法では,変数や個体に対して既知の情報をもとに回帰分析を行いデータを分割したのちに,分割された部分に対して主成分分析を行うことで,パラメータである,既知の情報特有の主成分得点行列と負荷量行列に分解する.このことにより,既知の情報が元のデータに与えている変動の解釈が可能になる.このような形で表現される制約付き多変量解析法では,データとモデルの乖離度を測る目的関数を,制約を与えて最小化することによりパラメータを推定する.すでに提案されている多変量解析法について,それぞれを制約の整理を行うことで,個々の手法を体系的にとらえることが可能であると考えられる.
 多変量解析法の多くは分析目的に応じて提案されている.ビッグデータの入手が容易になった昨今では,各変量の上位概念や各対象に関する特性を表したデータも共に得られることが多く,既存の多変量解析手法では,これらの外部情報を考慮できない.そのため,既存手法による分析では,解釈が困難になることがある.この問題を解決するために,外部情報を取り入れた手法の開発を行うことで,外部情報を用いた容易な解釈が可能になると考えられる.
 さらに,多変量解析法は,扱えるデータの型・種類に応じて個々に提案されている.しかしながら,ビッグデータでは,データの型や種類は多種多様に存在している.例えば,同一個体群に同一変量群を異なる条件下で得る「3相3元データ」やすべての値が非負であるような「非負値データ」などである.そのため,多種多様なデータの型・種類に応じて多変量解析法が必要となっているのが現状である.この問題を解決するために,それぞれのデータの種類を制約として表現することで,多種多様なデータに対応した多変量解析の手法を拡張することが考えられる.
 本研究では,既存の多変量解析法や近年提案された行列分解型の多変量解析における共通点や問題点の把握・整理を行い,それらの解析法の特徴を踏まえ,新たな手法の提案を行った.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Jun Tsuchida, Hiroshi Yadohisa (2017). Partial least-squares method for three-mode three-way datasets based on Tucker model. Procedia Computer Science , 114, pp. 234-241, doi: 10.1016/j.procs.2017.09.065
[2] Abe, H. and Yadohisa, H. (2017): A non-negative matrix factorization model based on the zero-inflated Tweedie distribution, Computational Statistics, 32(2), pp. 475-499. doi:10.1007/s00180-016-0689-8
[3] Abe, H. and Yadohisa, H. (2017): Automatic Relevance Determination in Nonnegative Matrix Factorization based on Zero-inflated Compound Poisson-gamma distribution, Journal of the Japanese Society of Computational Statistics,29, pp. 29-54.
[4] Yamagishi, Y., Tanioka, K. and Yadohisa, H. (2017): Constrained Principal Component Analysis for Nonmetric Data, 61th World Statistics Congress, The Palais des Congr_s, Marrakech, Morocco.
[5] Takagishi, M. and Yadohisa, H. (2017): Visualization of clustering on multiple data, 10th International Conference of the European Research Consortium for Informatics and Mathematics Working Group on Computational and Methodological Statistics 2017, p198, University of London, United Kingdom.
[6] Goto, S. and Yadohisa, H. (2017): Pattern prediction for time series data with change points, New Zealand Statistical Association and the International Association of Statistical Computing (Asian Regional Section) Joint Conference 2017, Auckland University, Auckland, New Zealand.
[7] Yamayoshi, M., Yadohisa, H. (2017): Estimating causal structures for continuous and discrete variables, New Zealand Statistical Association and the International Association of Statistical Computing (Asian Regional Section) Joint Conference 2017, Auckland University, Auckland, New Zealand.
[8] Mizutani, S., Yadohisa, H. (2017): Local canonical correlation analysis for multimodal labeled data, New Zealand Statistical Association and the International Association of Statistical Computing (Asian Regional Section) Joint Conference 2017, Auckland University, Auckland, New Zealand.
[9] Tanioka,K. and Yadohisa, H. (2017): Cluster difference scaling for asymmetric dissimilarity data based on unfolding models, 2017 Hangzhou International Statistical Symposium, p23-26, Hangzhou Huagang HNA Resort, Hangzhou, China.
[10] Takagishi, M. Velden, M. van de, and Yadohisa, H. (2017): Clustering Methods for Ordered Categorical Data with Response Style, Joint Statistical Meeting 2017, Baltimore, U.S.A..
[11] Tsuchida, J. and Yadohisa, H. (2017): Gini index penalized canonical covariance analysis for three-mode three-way data, 6th Japanese-German Symposium on Classification, Tokai University, Tokyo, Japan.
[12] Tsuchida, J. and Yadohisa, H. (2017): Regularization method using Gini index for core array of Tucker3 model, The 2017 Conference of the International Federation of Classification Societies, Tama University, Tokyo, Japan.
[13] Takagishi, M. Velden, M. van de, and Yadohisa, H. (2017): Clustering methods for preference data in the presence of response styles, The 2017 Conference of the International Federation of Classification Societies, Tokai University, Tokyo, Japan.
[14] Tsuchida, J. and Yadohisa, H. (2017): Two-mode three-way dominance points model for periodic dissimilarity, The 2017 Conference of the International Federation of Classification Societies, 2nd International Conference on Big Data, Cloud Computing, and Data Science Engineering, pp. 320-325, Congres Center at ACT CITY Hamamatsu, Hamamatsu, Japan.
[15] Tanioka, K. and Yadohisa, H. (2017): Generalized Structured Component Analysis for dissimilarity data and multivariate data, The 2017 Conference of the International Federation of Classification Societies, 2nd International Conference on Big Data, Cloud Computing, and Data Science Engineering,, p.326-331, Congress Center at ACT CITY Hamamatsu, Hamamatsu, Japan.
[16] 水谷成吾,宿久洋(2017): クラスラベルに構造がある場合の2値分類問題に対する半教師あり局所正準相関分析, 日本分類学会第36回大会, pp. 1-4 (於 札幌コンベンションセンター).
[17] 岡部格明,土田潤,宿久洋(2017): 相対密度比を用いた多クラス分類について, 日本分類学会第36回大会,pp.5-8, (於 札幌コンベンションセンター).
[18] 水谷成吾,宿久洋(2017): 一対他分類問題に対する局所正準相関分析, 日本計算機統計学会第31回シンポジウム, pp. 21-24, (於 和歌山県立医科大学).
[19] 山佳眞子,宿久洋(2017): 連続値データと2値離散データ混在時における因果構造推定について, 日本計算機統計学会第31回シンポジウム, pp. 25-28, (於 和歌山県立医科大学).
[20] 後藤智紀,宿久洋(2017): 複数時系列パターン混在時における時系列予測について, 日本計算機統計学会第31回シンポジウム, pp. 67-70, (於 和歌山県立医科大学).
[21] 後藤智紀 (2017): 変化点を考慮した系列パターンの予測, 日本計算機統計学会2017年度若手セミナー, (於 お宿信田).
[22] 藤澤将広 (2017): Bayesian GP-LVMによる複雑な構造を持つデータの可視化について, 日本計算機統計学会2017年度若手セミナー, (於 お宿信田).
[23] 岡部格明 (2017): クラスラベルが不均衡なデータに対するロジスティック回帰分析について, 日本計算機統計学会2017年度若手セミナー, (於 お宿信田).

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

足立 浩平

大阪大学

大田 靖

岡山理科大学

Cai Jingyu

大阪大学

高木 育史

同志社大学

高岸 茉莉子

同志社大学

谷岡 健資

和歌山県立医科大学

田村 義保

統計数理研究所

土田 潤

同志社大学

寺田吉壱

大阪大学

永野 駿太

山口大学

水田 正弘

北海道大学

南 弘征

北海道大学

山本 倫生

京都大学大学院