平成182006)年度 一般研究1実施報告書

 

課題番号

18−共研−1018

専門分類

5

研究課題名

カーネル法によるマルチモーダル認識

フリガナ

代表者氏名

マツイ トモコ

松井 知子

ローマ字

Tomoko Matsui

所属機関

統計数理研究所

所属部局

モデリング研究系

職  名

助教授

所在地

TEL

FAX

E-mail

URL

 

 

 

研究目的と成果(経過)の概要

本研究では Penalized Logistic Regression Machines(PLRM)、Kernel Conditional Random Fields(KCRF)などのカーネル法による確率予測型のマルチモーダル認識パラダイムの確立を目指す。例えば、マルチモーダルデータの一つである音声に関しては、隠れマルコフモデルが用いられ、数百時間の大規模なデータから、そのパラメータを学習する。また、認識誤りに対処するために、認識結果の照合(発声照合)を後処理として行うことが多い。そこで大規模データが扱えるPLRMの学習アルゴリズムを開発し、カーネルマシンによる認識結果の照合の後処理を必要としないマルチモーダル認識系の構成について検討する。
今年度は大規模データが扱えるPLRMの学習アルゴリズムを開発し、PLRMによる認識結果の照合の後処理を必要としない音声認識法を提案した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

学会発表:
1. Birkenes (NTNU), T. Matsui (ISM) and K. Tanabe (Waseda Univ.), “Isolated-Word Recognition with Penalized Logistic Regression Machines,” Proc. ICASSP, Toulouse, 2006.
2. Birkenes (NTNU), T. Matsui (ISM), K. Tanabe (Waseda Univ.) and T. A. Myrvoll (NTNU), “Continuous Speech Recognition with Penalized Logistic Regression Machines,” Proc. Norsig, Iceland, 2006.
3. T. A. Myrvoll (NTNU) and T. Matsui (ISM), “On a Greedy Learning Algorithm for dPLRM with Applications to Phonetic Feature Detection,” Proc. Norsig, Iceland , 2006.
4. T. A. Myrvoll (NTNU) and T. Matsui (ISM), “On a greedy learning algorithm for dPLRM with applications to phonetic feature detection,” Proc. Interspeech, Pittsburgh, 2006.
5. T. A. Myrvoll(NTNU), 松井知子(統数研), “Information fusion using multiple kernel logistic regression with applications to phonetic feature detection,” 日本音響学会春季研究発表会, 東京, 2007.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

Oystein Birkenes

ノルウェー工科自然科学大学

Tor Andre Myrvoll

ノルウェー工科自然科学大学