平成262014)年度 一般研究2実施報告書

 

課題番号

26−共研−2056

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

2

研究課題名

行列分解型多変量データ解析法に関する研究

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

Yadohisa Hiroshi

所属機関

同志社大学

所属部局

文化情報学部

職  名

教授

配分経費

研究費

40千円

旅 費

235千円

研究参加者数

12 人

 

 

研究目的と成果(経過)の概要

 本研究では,大規模複雑なデータに対して,はデータが持っている構造を利用して,データ行列を分解することにより,記述的に特徴を抽出することを考える. 具体的には,実現値とモデルとの誤差に分布を仮定せず,データ行列を低階数近似できるような行列に分解する手法であり,以下では,行列分解型多変量データ 解析法とよぶことにする.一般的に利用されている多変量解析法の多くは,行列分解型の多変量解析法として表現することができる.例えば,主成分分析法で は,データ行列を主成分得点の行列と主成分負荷量の行列とに分解し,対象の特徴把握を行う.このような形で表現される行列分解型の多変量データ解析法で は,データ行列からなる目的関数の最小化によってパラメータを推定するといった共通点がある.すでに提案されている行列分解型多変量データ解析法には,共 通点が数多く存在し,個々の手法を体系的に捉えることが可能であると考えられる.
 また,データの型・種類や分析目的に応じて,多変量解析法は提案されている.データの種類は多種多様に変化しているため,例えば,我々がターゲットとし ているデータ行列のような行列に手法を適用するだけでなく,同一個体群,同一変量群に関して異なる条件下で観測された,立方体で表現される「3相3元デー タ」に手法を適用する必要性も出てきている.そのため,データの表記として,テンソルを用いることで手法を拡張することも可能であると考えられる.さら に,複数の手法を順番に適用するタンデムアナリシスの代替法として,同時分析といわれるパラメータの同時最適化法が提案されている.これらは,タンデムア ナリシスよりも元データの構造を捉えられているとして,クラスタリングや回帰分析の際に有用である.これら手法も,行列分解型多変量解析法を用いており, 調査を進める必要がある.
 本研究では,既存の多変量解析法や近年提案された行列分解型の多変量解析法における共通点や問題点の把握・整理を行い,それらの解析法の特徴を踏まえ,新たな手法の提案を行った.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Mitsuhiro, M. and Yadohisa, H. (2014): Reduced k-means clustering with MCA in a low-dimensional space, to appear in Computational Statistics.(to appear)
[2] Abe, H., Tanioka, K. and Yadohisa, H. (2014): Clusterwise Linear Regression Model for Modal Multi-Valued Data, Proceedings of the International Conference on Mathmatics, Statistics, and Financial Mathematics 2014, p.35-p.40.
[3] Tanioka, K. and Yadohisa, H. (2014): K-mode clustering with dimensional reduction for categorical data, European Conference on Data Analysis 2014, Bremen, Germany.
[4] Takagi, I., Tanioka, K. and Yadohisa, H. (2014): Constrained VPCA for interval-valued data, 2014 Workshop in Symbolic Data Analysis, Taipei, Taiwan.
[5] Tsuchida, J. Yadohisa, H. (2014): Partial least squares logistic regression using F-measure, COMPSTAT 2014, Geneva.
[6] Tsuchida, J. Yadohisa, H. (2014): Two-mode three-way asymmetric MDS using the log linear model, 7th International Conference of the European Research Consortium for Informatics and Mathematics Working Group on Computational and Methodological Statistics 2014, University of Pisa, Italy.
[7] Abe, H., Tanioka, K. and Yadohisa, H. (2014): Reduced k-means for multivalued quantitative symbolic variables, 7th International Conference of the European Research Consortium for Informatics and Mathematics Working Group on Computational and Methodological Statistics 2014, University of Pisa, Italy.
[8] 有重文平, 宿久洋 (2014): 探索的因子回帰分析法の定式化について, 第26回大規模データ科学に関する研究会, (於 北海道大学).
[9] 光廣正基, 宿久洋 (2014): 量質混在データに対する cardinality 制約を用いたスパースPCAについて, 第26回大規模データ科学に関する研究会, (於 北海道大学).
[10] 谷岡健資, 宿久洋 (2014): ベータ-divergenceに基づく制約付きTri-factorizationについて, 第26回大規模データ科学に関する研究会, (於 北海道大学).
[11] 光廣正基, 宿久洋 (2014): 縮約とクラスタリングの同時分析法における統一的表記について, 複雑データの解析法に関する研究会, (於 統計数理研究所).
[12] 谷岡健資, 宿久洋 (2014): カテゴリカルデータに対する異なる部分空間に属するクラスターの検知法について, 複雑データの解析法に関する研究会, (於 統計数理研究所).
[13] 土田潤, 宿久洋 (2014): F-measureを誤差関数とする潜在クラス2項ロジットモデル, 日本分類学会第32回大会, (於 首都大学東京秋葉原サテライトキャンパス).
[14] 谷岡健資, 宿久洋 (2014): 正則化に基づく次元縮約を伴うk-mode法について, 日本計算機統計学会第28回大会, 学生研究発表賞受賞, (於 中央大学).
[15] 高岸茉莉子, 谷岡健資, 宿久洋(2014): 雑音を考慮した独立成分分析混合モデルについて, 日本計算機統計学会第28回大会, (於 中央大学).
[16] 谷岡健資, 上阪彩香, 山下陽司, 大森崇, 寒水孝司(2014): 日本の医学部医学科における統計関連講義の現状〜シラバスに基づく実態調査と改善案の提示〜, 第46回日本医学教育学会大会, (於 和歌山県立医科大学).
[17] 谷岡健資, 宿久洋 (2014): 非対称(非)類似度データに対するk-medoids法と制約付きMDSの同時分析法について, 行動計量学会第42回大会, (於 東北大学).
[18] 土田潤, 宿久洋 (2014): 対数線形モデルを用いた2相3元非対称MDSについて, 行動計量学会第42回大会, (於 東北大学).
[19] 土田潤, 宿久洋(2014): n相m元データに対する対数線形モデルを用いた非対称MDSについて, 計算機統計学会第28回シンポジウム, 学生研究発表賞受賞, (於 沖縄科学技術大学院大学)
[20] 有重文平, 宿久洋(2014): 2変量群の関係を考慮した主成分分析と解のスパース推定, 行動計量学会第42回大会, (於 東北大学).
[21] 阿部寛康, 谷岡健資, 宿久洋 (2014): 連続値の多値シンボリック変数に対するRKM法について, 行動計量学会第42回大会, (於 東北大学).
[22] 阿部寛康, 宿久洋 (2014): シンボリックデータ解析法を用いた竜巻データの解析, 科研費シンポジウム空間データと災害の統計モデル, (於 アクロス福岡).
[23] 長谷川公宏, 谷岡健資, 宿久洋(2014): コンセプト間非類似度における外部展開法について, 日本計算機統計学会第28回シンポジウム, (於 沖縄科学技術大学院大学).

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

テーマ:複雑データの解析法に関する研究会
日 時:2015年2月19日(木)13時〜18時(意見交換会〜21時)
場 所:統計数理研究所セミナー室5(D313/314)
参加人数:20名

[1] graph embeddingから見た非重み付きグラフ解析の限界と可能性
寺田吉壱(情報通信研究機構 脳情報通信融合研究センター)
[2] オミックスビッグデータ解析の現状と課題
島村徹平(名古屋大学大学院医学系研究科)
[3] 非凸ペナルティに基づく正則化最小二乗法による結果変数に関連したクラスターの推定山本倫生(京都大学大学院医学研究科)
[4] 非補償型多次元項目反応モデル研究の展開
岡田謙介(専修大学人間科学部)
[5] カテゴリカルデータに対する非負値制約による次元縮約クラスタリング法について
谷岡健資(同志社大学大学院文化情報学研究科),宿久 洋(同志社大学文化情報学部)

 

研究参加者一覧

氏名

所属機関

足立 浩平

大阪大学

有重 文平

同志社大学

島村 徹平

名古屋大学

高木 育史

同志社大学

谷岡 健資

同志社大学

田村 義保

統計数理研究所

土田 潤

同志社大学

寺田 吉壱

独立行政法人 情報通信研究機構

水田 正弘

北海道大学

南 弘征

北海道大学

山本 倫生

京都大学大学院