平成91997)年度 共同研究A実施報告書

 

課題番号

9−共研−11

専門分類

1

研究課題名

マルコフモデルを用いた文字認識手法の研究

フリガナ

代表者氏名

ナカノ ヤスアキ

中野 康明

ローマ字

所属機関

信州大学

所属部局

工学部

職  名

教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

5 人

 

 

 

研究目的と成果(経過)の概要

手書き文字認識において、手書き文字の生成原理を利用することは有効であると期待される。本研究では手書き文字パターンがマルコフモデルに従って生成されるとの仮説の下に、水平方向の特徴パラメータの連鎖を利用した文字認識の手法について研究する。


昨年度に引き続き、HMM(隠れマルコフモデル)の文字認識への適用方法について検討し、文字は2次元パターンではあるものの、1次元化して表現することにより、1次元マルコフモデルが適用できるとのの見通しを得た。
この結論に基づき、2次元の手書き英字パターンを水平方向に輪切りにし、各切片から複数個の特徴を抽出する。この特徴を1次元ベクトルとして表現する。クラスタリングによりベクトルを128個の代表ベクトルのいずれかに対応させる(ベクトル量子化)。
ベクトル量子化された短冊状のパターンは、シンボルとして表現できるので、結局文字パターンは1次元シンボル系列として表現できる。入力されたパターンの大きさ正規化を行うことにより、シンボル系列長を一定の値とした。コードブック生成には約2000個の手書き英字パターンを使用した。
学習用セットとして、約4000パターンの手書き英字を使用した。各パターンについて上記のシンボル系列を求め、状態数5のHMMに学習させた。本実験では、大文字と小文字を区別したかったので、HMMの個数は26個である。学習法としては、標準的なBWアルゴリズムを用いた。
学習完了後、約5000パターンの未知手書き英字よりなる検査セットを用いて認識実験を行い、1位正解率65%、5位累積正解率86%を得た。使用する特徴の改良により、パターン整合法と同等の認識率が達成できる見通しを得た。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Y.Nakano,A Model-Based Approach for Writer Recognition,Workshop on Document
Analysis Systems(Malvern,USA),Oct.15,1996.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

手書き文字の生成原理として、マルコフ過程モデルを採用し、実際の手書き文字パターンの学習セットを用いて、モデルパラメータを学習的に決定する。このモデルを用いた文字認識能力について実験的に検討する。研究代表者は、長年の研究により、手書き文字認識には生成原理の解明が重要であること、モデルとしてはマルコフ過程が適していることを確信するに到った。マルコフ過程については、初等的な知識を有してはいるものの、手書き文字のような複雑な対象の解明には不十分であり、高度の確率統計学の知識を有する専門家との共同研究が必要である。


 

研究参加者一覧

氏名

所属機関

栗木 哲

統計数理研究所

西村 広光

信州大学大学院

丸山 稔

信州大学

宮尾 秀俊

信州大学