情報・システム研究機構
- - - - - - - - -
| >> | >> | >> |
  |   |     |     |  

    マルチモーダルデータからの不変情報の発見とその方法論の研究
----- - -----
 

研究目標

21世紀の知識社会では,インターネットや大容量の電子媒体を通して,多様なマルチモーダルデータが一層利用できるようになることは確実である.その中で,それらのデータをいろいろな目的でうまく処理する技術が強く求められている.本サブテーマでは,各目的に合わせて,マルチモーダルデータから重要な情報(ここでは“不変情報”と呼ぶ)を自動的に発見するための新しい帰納的方法論について検討を行う.マルチモーダルデータを扱う,画像・音声・言語・対話処理などに関する具体的な課題をいくつか取り上げ,それぞれに不変情報の発見を試み,それらのアプローチを横断的に解析する.

従来の方法論の多くは,先験的な知識に基づいた要素還元による.例えば,マルチモーダルデータの統合の問題においては,個々のモダリティごとに先験的に分節化を行った上で,連関を構造化するというアプローチが取られている.しかし,これは人間が行う処理とは異なり,雑音やスケールの違いによる影響を受け易い.人間の処理を探求し,より高性能なデータ処理を実現するためには,マルチモーダルデータを先験的に分離しないで,一つのまとまりとして捉えることが必要である.

その手段として,近年,開発されたPLRM(Penalized Logistic Regression Machine)[1,2,3]やSVM(Support Vector Machine)[4]など,自動モデル選択の機構を含む帰納的学習機械を用いることが有望である.これらの学習機械は画像や音声処理などのパターン認識の分野で利用されているが,個別のデータに対して適用されているに過ぎない.本サブテーマでは,マルチモーダルデータを統合的に捕らえ,帰納的アプローチにより不変情報を発見するしくみを見出すことを目標とする.具体的には,次の四つの課題への取り組むことにより,その方法論の有効性・可能性を明らかにする.

A) 映像データからの不変事象の学習検索

B) ダイナミカルシステムを用いた身体協調の不変原理の探求

C) 身体性制約下における外界データの不変情報抽出機械としての知覚神経回路の特定

D) 対話データからの不変情報(コミュニケーション・パターン)を規定する要因の特定

上記A)〜D)の検討においては適宜,帰納的学習機械を利用する.また大規模データを扱い,量的な問題に取り組むことにより,新たに見えてくる質的な問題を明らかにしていく.本研究を通して,従来の先験的要素還元的な方法とは異なる科学方法論の新しいパラダイムを創造する.

〔参考文献〕

[1] K. Tanabe, “Penalized Logistic Regression Machines: New methods for statistical prediction 1,” ISM Cooperative Research Report 143, pp. 163-194, 2001.
[2] K. Tanabe, “Penalized Logistic Regression Machines: New methods for statistical prediction 2,” Proc. IBIS, Tokyo, pp. 71-76, 2001.
[3] K. Tanabe, “Penalized Logistic Regression Machines and Related Linear Numerical Algebra,” KOKYUROKU 1320, Institute for Mathematical Sciences, Kyoto University, pp. 239-249, 2003.
[4] V. N. Vapnik, “The Nature of Statistical Learning Theory,” Springer, 1995.