情報・システム研究機構
- - - - - - - - -
| >> | >> | >> |
  |   |     |     |  

    マルチモーダルデータからの不変情報の発見とその方法論の研究
----- - -----
 

研究課題 : 映像データからの不変事象の学習検索

TRECVID(映像索引付け・検索に関する国際的な競争型評価プロジェクト)[5]の高レベル特徴抽出タスクにおいて,機械学習を用いた帰納的なアプローチにより,適切な不変情報すなわち適切な特徴量の設計を行う.

TRECVID高レベル特徴抽出タスクとは,プロジェクト参加者に配布される数百時間規模の大量のニュース映像を構成するショットを,その意味内容に応じて,群衆,建物,動物,航空機などのクラスに分類する,映像意味解析の高度化を狙いとしたタスクである.参加者は,訓練用映像セットとして,上記のクラスに分類されたショットが与えられ,これを用いてまず上記のクラスに適切に自動分類する手法の構築を行う.後ほど,評価用映像セットに対し構築した手法を適用し,クラスに分類した結果をプロジェクトオーガナイザーに送付することにより,分類結果の精度の相互比較が行われる.

従って,プロジェクト参加者は,ニュース映像から意味解析に必要な特徴量を適切に抽出することと,訓練用映像セットから適切なクラス分けが可能な分類器の設計とが求められる.本研究では,映像というマルチモーダルな対象からの適切な特徴量の抽出を,マルチモーダルデータからの不変情報の抽出と捕らえ,また訓練用映像セットからの分類器の設計に対し,帰納的な学習機械を用いたアプローチをとることにより,本サブテーマへの貢献をねらう.

〔参考文献〕

[5] http://www-nlpir.nist.gov/projects/trecvid/