平成302018)年度 一般研究2実施報告書

 

課題番号

30−共研−2015

分野分類

統計数理研究所内分野分類

b

主要研究分野分類

2

研究課題名

制約付き多変量解析法に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

Yadohisa Hiroshi

所属機関

同志社大学

所属部局

文化情報学部

職  名

教授

配分経費

研究費

40千円

旅 費

382千円

研究参加者数

14 人

 

 

研究目的と成果(経過)の概要

 本研究では,既存の多変量解析法の制約付き多変量解析法としての特徴づけ,および新たな手法の開発を行なっている.制約付き多変量解析法とは,既存の多変量解析に制約を入れることで,より解釈しやすい特徴を抽出するような方法である.具体的には,外部データやデータに基づいた仮説を制約として与え,これを満たすような解を分析結果から得る手法である.例えば,制約付き主成分分析ではデータ行列を多変量データとし,データ行列の行または列に関するデータを外部情報として用い,これを制約とする.その上で,データ行列を各主成分によって説明される主成分得点行列と負荷量行列に分解し,負荷量行列によって変量の外部情報間の関連性について把握することができる.これにより,制約のない主成分分析に比べ,解釈が容易になるという特徴がある.制約付き主成分分析法のほかにもすでに提案されている行列分解型多変量解析法についてもデータに関する制約を付けたものとして記述することができ,これらの手法には共通点が数多く存在し,個々の手法を体系的にとらえることが可能であると考えられる.また,多変量解析法の多くは分析目的だけでなく,扱えるデータの型・種類やに応じて個々に提案されている.しかしながら,ビッグデータの入手が容易になった昨今では,データの型や種類は多種多様に存在している.例えば,同一個体群に同一変量群を異なる条件下で得る「3相3元データ」やすべての値が非負であるような「非負値データ」などである.そのため,多種多様なデータの型・種類に応じて多変量解析法が必要となっているのが現状である.この問題を解決するために,テンソルの表記を用いることで行列分解型多変量解析の手法を拡張することが考えられる.さらに,ビッグデータでは,従来扱っていたデータに比べ,変量数が増加しており,データに対し一度主成分分析などの次元縮約法を適用した後に別の多変量解析を行うタンデムアナリシスと呼ばれる方法がデータに適用されることがある.しかし,タンデムアナリシスでは最終目的である回帰やクラスタリングに適した次元縮約となることは少ない.この問題点を解決するために,次元縮約とクラスタリング,回帰のパラメータを同時推定する同時分析法がある.これらの手法も扱うデータに関する情報をデータに関する制約として定義されている方法があり,共通点を見出せると考えられる.
本研究では,既存の多変量解析法や近年提案された行列分解型の多変量解析における共通点や問題点の把握・整理を手法に対する制約の観点から行い,それらの解析法の特徴を踏まえ,新たな手法の提案を行った.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Tanioka, K and Yadohisa, H. (2018): Asymmetric MDS with Categorical External Information Based on Radius Model, Procedia Computer Science, 140, pp.284-291. DOI:10.1016/j.procs.2018.10.318
[2] Mitsuhiro, M. and Yadohisa, H. (2018): A unified representation of simultaneous analysis methods of reduction and clustering, Japanese Journal of Statistics and Data Science , 1(2), pp.393-412. DOI: 10.1007/s42081-018-0022-6
[3] Tanioka, K. and Yadohisa, H. (2018). Unfolding models for asymmetric dissimilarity data with external information based on path structures. International Journal of Software Innovation, 6(3), pp. 53-66. DOI: 10.4018/IJSI.2018070104
[4] An Duong T.B., Tsuchida J., Yadohisa H. (2018) Multivariate Multiple Orthogonal Linear Regression. In: Czarnowski I., Howlett R., Jain L., Vlacic L. (eds) Intelligent Decision Technologies 2018. KES-IDT 2018 2018. Smart Innovation, Systems and Technologies, vol 97, pp.44-53. Springer, Cham. DOI:10.1007/978-3-319-92028-3_5
[5] Morioka, Y., Tanioka, K. and Yadohisa, H. (2018): Constrained matrix completion algorithm considering individual differences, 11th International Conference of the European Research Consortium for Informatics and Mathematics Working Group on Computational and Methodological Statistics 2018, p171, University of Pisa, Itary.
[6] Takasawa, I., Tanioka, K. and Yadohisa, H. (2018): Constrained LiNGAM approach for tensor data, 11th International Conference of the European Research Consortium for Informatics and Mathematics Working Group on Computational and Methodological Statistics 2018, p61, University of Pisa, Itary.
[7] Goto, S., Sakaori, F. and Yadohisa, H. (2018): Decision Making in Baseball Using an Infinite Relational Model, The Cascadia Symposium on Statistics in Sports (CASIS 2018), Simon Fraser University, Vancouver, Canada.
[8] Takagishi, M. and van de Velden, M. (2018): Visualizing external information in cluster correspondence analysis, The conference of Data Science, Statistics & Visualisation (DSSV 2018), TU Wien, Austria.
[9] Mizutani,S. and Yadohisa, H. (2018): Robust canonical correlation analysis via $gamma$-divergence, The conference of Data Science, Statistics & Visualisation (DSSV 2018), TU Wien, Austria.
[10] Yamayoshi, M., Tsuchida, J. and Yadohisa, H. (2018): A Representation of the Relationship Between Variables in Quantitative and Qualitative Mixed Data, European Conference on Data Analysis (ECDA) 2018, Heinz Nixdorf MuseumsForum, Paderborn, Germany.
[11] Okabe, M., Tsuchida, J. and Yadohisa, H. (2018): Using Multi-Label Logistic Regression to Maximize Macro F-measure, European Conference on Data Analysis (ECDA) 2018, Heinz Nixdorf MuseumsForum, Paderborn, Germany.
[12] 土田潤,宿久洋 (2018): Gini Index をペナルティ関数としたTucker Model について, 2018年度日本分類学会シンポジウム, pp.89-92, (於 沖縄県青年会館).
[13] 後藤智紀,宿久洋 (2018): カウントデータ分析のための動的無限関係モデルの提案, 2018年度日本分類学会シンポジウム, pp.47-50, (於 沖縄県青年会館).
[14] 山岸勇輝,宿久洋 (2018): スパース主成分分析を伴う冗長性分析について, 2018年度日本分類学会シンポジウム, pp.35-38, (於 沖縄県青年会館).
[15] 土田潤,宿久洋(2018): 相対誤差を誤差関数とした単調回帰分析について, 日本計算機統計学会第32回シンポジム, p137-138, (於 滋賀大学彦根キャンパス).
[16] 後藤智紀,宿久洋(2018): 時系列カウントデータのための共クラスタリング法について, 日本計算機統計学会第32回シンポジム, p31-34, (於 滋賀大学彦根キャンパス).
[17] 土田潤,宿久洋 (2018): 2相3元Dominance点モデルを用いたFunctional MDSについて, 日本行動計量学会第46回大会,p34--35,(於 慶応義塾大学三田キャンパス).
[18] 岡部格明,宿久洋(2018): 異なるドメイン間の類似性を考慮したクラスタリンク法について, 日本分類学会第37回大会, p11-14, (於 統計数理研究所).
[19] 谷岡健資, 日和悟, 廣安知之, 宿久洋(2018): 相関行列の差の内積に対するクラスタリングを伴う低ランク近似について, 2018年度人工知能学会全国大会(第32回), (於 城山観光ホテル).

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

統計数理研究所研究集会( 30-共研-2015 )
「複雑データ解析法に関する研究会」

日 時: 2019年2月23日(土)13:00〜18:00
場 所: セミナー室1(D305)
参加者数:20名
---------------------------------------------------------------------------------
<セッション1:13:00〜14:00>
1. 分寺杏介(東京大学大学院教育学研究科・日本学術振興会)・岡田謙介(東京大学大学院教育学研究科)
「反応時間を用いて多肢強制選択式尺度を分析する項目反応モデル」
2. 高岸茉莉子(同志社大学大学院文化情報学研究科/大阪大学大学院基礎工学研究科)
「係留寸描法を用いた回答傾向の違いの補正について」
3. 北條大樹(東京大学大学院教育学研究科・日本学術振興会)・岡田謙介(東京大学大学院教育学研究科)
「係留ビネットにより反応スタイルを測定する多次元部分得点項目反応モデル」
<セッション2:14:10〜15:10>
4. 藤田和也(東京大学大学院教育学研究科)・岡田謙介(東京大学大学院教育学研究科)
「意思決定課題における適応的な刺激選択法について」
5. 土田潤(東京理科大学工学部)
「修正カイ2乗統計量を類似度行列とした正準相関分析」
6. 阿部寛康(京都大学大学院医学研究科)
「ベイズ推定に基づく零過剰負の二項分布行列分解」
<セッション3:15:30〜16:50>
7. 山本倫生(岡山大学大学院環境生命科学研究科/理化学研究所革新知能統合研究センター (AIP))
「Sufficient Dimension Reductionを用いた因果効果の推定」
8. 寺田吉壱(大阪大学大学院基礎工学研究科)
「グラフカットを用いたクラスタリング法とその性質」
9. 宇野光平(大阪大学大学院人間科学研究科)
「ロバストなスパース因子分析」
10. 足立浩平(大阪大学大学院人間科学研究科)
「PCAとFAの解の違いを示す不等式」
総合討論:17:00〜18:00
---------------------------------------------------------------------

 

研究参加者一覧

氏名

所属機関

足立 浩平

大阪大学

阿部 寛康

京都大学

宇野 浩平

大阪大学

大田 靖

岡山理科大学

清水 信夫

統計数理研究所

高木 育史

同志社大学

高岸 茉莉子

同志社大学

谷岡 健資

和歌山県立医科大学

田村 義保

統計数理研究所

寺田吉壱

大阪大学

水田 正弘

北海道大学

南 弘征

北海道大学

山本 倫生

岡山大学大学院