平成232011)年度 一般研究1実施報告書

 

課題番号

23−共研−1024

分野分類

統計数理研究所内分野分類

b

主要研究分野分類

2

研究課題名

統計的トピックモデルに関する研究

フリガナ

代表者氏名

マツイ トモコ

松井 知子

ローマ字

Tomoko Matsui

所属機関

統計数理研究所

所属部局

モデリング研究系

職  名

教授

 

 

研究目的と成果(経過)の概要

 本研究では、奈良先端科学技術大学院大学 情報科学研究科 音情報処理学講座で開発された音声情報案内を行うシステム「たけまるくん」を用いて収集した質問応答データベースを利用した。データベース中の応答をいくつかのカテゴリに分類して、ユーザの質問の応答カテゴリ(トピック)を識別する問題に取り組んだ。
 まず、一般的な教師/半教師あり統計的機械学習について調査を行い、Transductive SVMによる方法に注目した。本問題に適して、特に子供のデータについて有効性を確認した。
 また、トピックラベルが付与されていないデータについて、latent Dirichlet allocation (LDA)を用い、いくつかの(統計的)トピックに分類することを試みた。各トピックはある程度、意味付けできることを確かめるとともに、各トピックごとに言語モデルを作成することにより、音声認識性能を向上できることを示した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[1] Rafael Torres, Hiromichi Kawanami (NAIST), Tomoko Matsui (ISM), Hiroshi Saruwatari, Kiyohiro Shikano (NAIST), "Semi-Supervised Topic Detection with Transductive SVM," 日本音響学会講演論文集, pp. 281-284.

[2] 吉田 雄太,真嶋 温佳,平井 良佑,久保 慶伍,川波 弘道,猿渡 洋,鹿野 清宏(奈良先端大), "Juliusにおける複数言語モデルの検討," 日本音響学会講演論文集, pp. 239-242.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

トレス ラファエル

奈良先端科学技術大学院大学

真嶋 温佳

奈良先端科学技術大学院大学