平成81996)年度 共同研究A実施報告書

 

課題番号

8−共研−7

専門分類

1

研究課題名

マルコフモデルを用いた文字認識原理の解明

フリガナ

代表者氏名

ナカノ ヤスアキ

中野 康明

ローマ字

所属機関

信州大学

所属部局

工学部

職  名

教授

所在地

TEL

FAX

E-mail

URL

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

5 人

 

 

 

研究目的と成果(経過)の概要

手書き文字認識の研究の歴史は古いが、その能力は人間に未だ遠く及ばない。その理由の一つは、手書き文字の生成原理が解明されていないことにある。本研究では手書き文字パターンがマルコフモデルに従って生成されるとの仮説の下に、現実の文字パターンがどれだけ良く再現できるかを解明し本モデルを利用した文字認識の可能性を探る。


HMM(隠れマルコフモデル)の基礎検討を行い、HMMではパターン生成がある1次元確率モデルに従って行われると仮定しているが、連続筆記体手書き英単語では、本モデルが良い近似になっているとの前提に立って研究を進めることとした。
最終的には単語全体に対してHMMを適用する方針であるが、本年度はまず各文字に対してHMMによる認識を行うこととした。すなわち、単語内の各文字が正確に切り出されたと仮定し、切り出された各文字の認識を試みた。なお、切り出しと認識を統合した単語認識アルゴリズムについては、既に方針が確立しており、文字認識部である程度の認識精度が得られれば、単語認識部でかなりの精度が得られると推定される。
HMMではモデルの状態数が性能を大きく左右するが、本年度は基礎検討の段階であるのでモデルの状態数を変化させた実験は行わず、音声認識等で実績のある5状態を採用した。ついで、1次元モデルにおける学習アルゴリズムの比較検討を行い、LBG型の学習アルゴリズムが優れているとの結論を得て、そのシミュレーションプログラムを作成した。
1次元モデルを2次元パターンである文字に適用するため、文字パターンを垂直方向に輪切りし、各切片内で3個の特徴を求めて、その特徴系列を用いて認識した。筆記体手書き英字26種類を対象として認識実験を行ったが、認識率はかなり低く満足すべきものでなかった。認識率の向上が今後の検討課題である。


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Y.Nakano,A Model-Based Approach for Writer Recognition,Workshop on Document
Analysis System(Malvern,USA),Oct.15,1996.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

手書き文字の生成原理として、マルコフ過程モデルを採用し、実際の手書き文字パターンの学習セットを用いて、モデルパラメータを学習的に決定する。このパラメータを用いた文字生成モデルにより、現実の未学習パターンセットがどれだけ良く近似できるかを実験的に解明する。研究代表者は、長年の研究により、手書き文字認識には生成原理の解明が重要であること、モデルとしてはマルコフ過程が適していることを確信するに到った。マルコフ過程については、初等的な知識を有してはいるものの、手書き文字のような複雑な対象の解明には不十分であり、高度の確率統計学の知識を有する専門家との共同研究が必要である。


 

研究参加者一覧

氏名

所属機関

遠藤 健

信州大学大学院

栗木 哲

統計数理研究所

宮尾 秀俊

信州大学

山田 博文

豊橋技術科学大学