平成202008)年度 一般研究2実施報告書

 

課題番号

20−共研−2051

分野分類

統計数理研究所内分野分類

g

主要研究分野分類

5

研究課題名

確率モデルを用いた画像認識・分類に関する研究

フリガナ

代表者氏名

マルヤマ ミオル

丸山 稔

ローマ字

Minoru Maruyama

所属機関

信州大学

所属部局

工学部情報工学科

職  名

准教授

配分経費

研究費

55千円

旅 費

30千円

研究参加者数

2 人

 

 

研究目的と成果(経過)の概要

近年デジタルメディア関連技術、計算機および計算機ネットワーク技術の発展に伴い、多種多様な情報に対して計算機ネットワークを介してアクセスが可能になってきている。このとき、ユーザが意図する内容を有するデータを取得するためには対象データのモデル化と、これに基づく内容の認識、分類、検索技術の確立が不可欠である。特に、単に文書データに留まらず、動画、画像などの多様なメディアデータを含む近年のデータ集合についても有効なモデル化手法、認識手法を確立することが要求される。本研究の目的は、主として文書データのモデル化手法として研究が進められてきたpLSA(probabilistic latent semantic analysis),LDA (latent Dirichlet allocation)などの確率的トピックモデルを画像認識・分類に適用するための手法を確立することである。
確率的トピックモデルは文書中に含まれる単語分布から、単語の語順は問わないbag of word表現に基づいて構築される。このモデルを画像に対して適用するためには、文書における単語に相当する画像特徴(visual word)抽出手法を確立する必要がある。本研究においては、画像特徴表現方式としてよく用いられるSIFT, Haar wavelet等に基づくvisual word抽出手法を検討し、画像のスケール変化や回転に対する画像分類能力の比較より、ロバストなSIFT descriptorが優れていることを明らかにした。また、SIFTに基づくpLSAモデルを文書画像分類に適用するための手法を検討し、グリッド状に分割された画像領域にpLSAモデルを適用し、得られたトピック比に基づいて文書領域分類を行う手法を提案した。実験の結果、確率的トピックモデルに基づく提案手法により従来用いられているような文字認識過程を経ることなく高精度で文書の内容に基づく分割が可能であることを示した。さらに、文書画像の詳細分割を行うために、データを十分に含む領域データ(親領域)からトピックモデルを用いて検出されたトピック比を小領域(子領域)のトピックを推定する際に効果的に用いるための手法に関する検討を行った。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

論文
1. 山口拓真, 丸山稔, ” 確率的トピックモデルによる文書画像の領域分割”, 電子情報通信学会論文誌, Vol. J92-D, No.6 (2009). (論文採録、2009年6月号掲載予定).
2. 谷岡広樹, 中川尚, 丸山稔, ”特徴抽出方法の改善によるベイジアンフィルタの精度向上”,情報処理学会論文誌 数理モデル化と応用, Vol. 1, No. 1 , pp. 175-184 (2008).

学会発表
1. Takuma Yamaguchi and Minoru Maruyama, “Image categorization by a classifier based on probabilistic topic model”, Proc. 19th International Conference on Pattern Recognition (ICPR-2008), pp. (2008).
2. Takuma Yamaguchi and Minoru Maruyama, “Feature extraction for document image segmentation by pLSA model”, Proc. 8th International Workshop on Document Analysis Systems (DAS2008), pp. 53 − 60 (2008).

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 

研究参加者一覧

氏名

所属機関

栗木 哲

統計数理研究所