第16回統計的機械学習セミナー / The 16th Statistical Machine Learning Seminar

日時
2014年2月21日(金) 13:30-15:30

登録不要・参加無料

会場
統計数理研究所 セミナー室5(3階D313)
区切り線
講演1
「データに潜在する構造形式の推定」
講演者
麻生英樹(産業技術総合研究所 知能システム研究部門)
概要
高次元の観測データのそれぞれが少数の基底によって記述できるというスパース(疎)性を利用して情報処理を効率的に行う「スパースモデリング」が様々な分野に適用されて成功をおさめている。通常のスパースモデリングでは、フラットな基底の線形和によってデータが表現されることを想定しているが、そこに、基底間のさまざまな種類の関係などの構造を導入することによって、より複雑なデータの構造が利用可能になると期待される。しかし、どのような種類の構造を導入するべきかは必ずしも明らかではない。この発表では、導入する構造の種類をデータから選択する試みの例として、Kemp らによるデータからの構造形式(Structural Form) の推定の研究を紹介するとともに、連想記憶モデルから生成される、構造が既知の観測データに対して手法を適用した結果について紹介する。さらに、構造的スパースモデリングの今後の発展方向についても議論したい。
区切り線
講演2
「教師なしオブジェクトマッチング」
講演者
岩田具治(NTTコミュニケーション科学基礎研究所)
概要
オブジェクトマッチングとは、異なるドメインに含まれる事例間の対応を見つけるタスクである。例えば、英語と日本語の対応付け、画像と文の対応付け、異なる種の遺伝子の対応付けなどに応用できる。本講演ではドメイン間の類似度尺度や対応事例がない「教師なし」の状況でオブジェクトマッチングを行う手法を紹介する。提案法では、全ドメインで1つの潜在空間が共有されると仮定し、潜在空間上で全事例をクラスタリングすることにより異ドメイン事例の多対多対応を見つける。また、教師なし(辞書や対訳文なし)で複数言語の文法を対応付ける研究についても紹介する。提案法では確率文脈自由文法の階層ベイズモデルを用い、全言語に共有される普遍文法とともに、各言語の文法を学習する。
区切り線