JPH08194781A - 文字認識装置の評価方法及び装置 - Google Patents

文字認識装置の評価方法及び装置

Info

Publication number
JPH08194781A
JPH08194781A JP7004622A JP462295A JPH08194781A JP H08194781 A JPH08194781 A JP H08194781A JP 7004622 A JP7004622 A JP 7004622A JP 462295 A JP462295 A JP 462295A JP H08194781 A JPH08194781 A JP H08194781A
Authority
JP
Japan
Prior art keywords
character
image
feature vector
images
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7004622A
Other languages
English (en)
Inventor
Ei Sakano
鋭 坂野
Hiromi Kida
博巳 木田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP7004622A priority Critical patent/JPH08194781A/ja
Publication of JPH08194781A publication Critical patent/JPH08194781A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識装置を改良する際の指針を明確に与
えることができる文字認識装置の評価技術を提供する。 【構成】 入力画像に遺伝的アルゴリズムを適用して該
入力画像に対応する特徴ベクトルの持つ情報を画像の形
で構築する。具体的には、入力画像に類似する文字パタ
ーンの集合を文字パターンデータベース4から抽出し、
文字特徴抽出部22及び特徴比較部23で各文字パター
ンの特徴ベクトルの抽出と入力画像の特徴ベクトルとの
比較を行う。文字パターン選択部24は、より類似する
2つの文字パターンを選択する。文字パターン交差部2
5は、上記2つの文字パターンの所定部位を交差して新
たな文字パターンを生成(構築)する。これを所定基準
に達するまで繰り返し、得られた文字画像を正解画像か
否かの評価に用いる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、認識精度の高い文字認
識装置を開発する際の支援手段として利用される文字認
識装置の評価技術に関する。
【0002】
【従来の技術】文字認識に関する処理は、例えば橋本新
一郎著、文字認識概論、オーム社(1982)などに紹
介されているように、特徴抽出系と識別系の処理とに大
別される。より認識精度の高い高性能な文字認識装置を
実現するためには、これらのそれぞれについての処理技
術の高度化、及びこれら処理技術の相性を考慮した設計
を行い、さらに、設計した文字認識装置の性能評価を適
切に行うことが要求される。従来のこの種の文字認識装
置における性能評価は、特徴抽出系と識別系の総合評価
が一般的であり、その具体的手法は、認識率や誤読パタ
ーンを専門家が解析することにより行われていた。
【0003】
【発明が解決しようとする課題】上述のように、従来の
文字認識処理の性能評価は、特徴抽出系と識別系の総合
評価のみであり、例えば特徴抽出系において認識対象文
字が具体的にどのような形で表現されているかという問
題は看過されてきた。これには、文字認識に用いられる
特徴抽出系の多くは、理論的な背景なしに設計されてお
り、また、パラメータ数、つまり特徴ベクトルの次元数
が数百から数千と極めて大量になることから直感的な理
解が難しく、定量的な手法による分析も困難であるとい
う背景があったことによる。
【0004】また、認識に用いられる典型的なベクトル
である辞書ベクトルは、多くのパターンから抽出された
特徴ベクトルの平均や人工神経回路網などの方法で生成
されるが、これらの辞書ベクトルが何を表現しているか
という基本的な点についても概念的且つ不明確な範囲で
しか判別することができなかった。
【0005】本発明の課題は、上記背景に鑑み、特徴ベ
クトル、すなわち文字の特徴空間での表現を画像空間へ
の表現に変換することにより、文字認識装置の特徴抽出
系が果たして文字の基本的な特徴を捉えているか否か、
誤読が生じた場合はどのような意味で誤読となったのか
等を特定し、認識アルゴリズムを改良する際の指針を明
確に与えることができる文字認識装置の評価技術を提供
することにある。
【0006】
【課題を解決するための手段】上記課題を解決するた
め、本発明においては、Hollandによって提案さ
れた遺伝的アルゴリズム(北野宏明編、「遺伝的アルゴ
リズム」、産業図書発行(1994)参照)を用い、認
識対象文字を可視化する。この遺伝的アルゴルズムは、
生命の進化をモデル化した最適化アルゴリズムであり、
ある最適化問題を解くために遺伝子をある最適化問題の
解の形式でコード化し、以下の過程を繰り返すことによ
り最適解を探索する。 (1)初期集団を生成する初期集団生成過程、(2)個
体評価過程、(3)集団から子孫を残す個体を選択する
選択過程、(4)選択された個体の遺伝子を交差させる
交差過程、(5)交差により得られた遺伝子をランダム
に変動させる突然変異過程。
【0007】初期集団生成過程は、最適解に近いものを
複数選択することにより行われる。個体評価過程は、与
えられた最適化問題に当該個体を当てはめ、その解を算
出することにより行われる。選択過程は、個体の評価値
を用いて評価の高い個体ほど次の世代に子孫を残しやす
いように重み付けをした確率を用いて乱数的に行われ
る。交差過程は、選択された複数個体の遺伝子を混ぜ合
わせる操作である。突然変異過程は、例えば特定の遺伝
子を異種のものに交換する操作である。このような遺伝
的アルゴリズムは、生物の進化をモデルとして、ある評
価値を良くする方向に生成した遺伝子を進化させるの
で、ある種の最適化問題の近似解を高速で求めるのに有
効となることが知られている。
【0008】そこで本発明の文字認識処理評価方法は、
文字認識装置への入力画像に上記遺伝的アルゴリズムを
適用して該入力画像に対応する特徴ベクトルの持つ情報
を画像の形で構築する過程を有し、この構築された文字
画像を文字認識装置の性能評価資料とする。この場合の
遺伝的アルゴリズムは、例えば前記入力画像から抽出さ
れた特徴ベクトルに対して所定類似度の特徴ベクトルを
持つ複数の画像を生成する第1の過程と、生成された画
像の各々の特徴ベクトルと前記入力画像の特徴ベクトル
との相関評価値を導出する第2の過程と、前記相関評価
値がより高い2つの画像を選択する第3の過程と、選択
された2つの画像の所定部位を互いに交差して新たな画
像を生成する第4の過程とを含み、前記第2乃至第4の
過程を所定基準に達するまで繰り返すことにより実現す
る。
【0009】上記相関評価値としては一般にどのような
値乃至関数を用いても良いが、好ましくは、評価対象と
なる文字認識装置において採用される識別関数、例えば
ユークリッド距離や余弦、あるいは多層神経回路網から
の出力の強度を最大あるいは最小とする関数を用いる。
また、第1の過程で生成される画像集団も、文字画像集
団や記号画像集団など任意の画像の集合を採用し得る
が、性能評価を高速で行うためには文字画像集団である
ことが好ましい。
【0010】また、上記評価方法を実現する本発明の文
字認識装置の評価装置は、入力画像の特徴ベクトルに対
して所定類似度の特徴ベクトルを持つ初期画像集団を生
成する初期画像集団生成手段と、前記初期画像集団の各
々に対して前記入力画像との特徴比較を行う特徴比較手
段と、前記文字画像集団から前記入力画像の特徴により
類似する特徴を持つ2つの文字画像を選択出力する文字
画像選択手段と、選択された2つの文字画像の所定部位
を互いに交差して新たな文字画像を生成する文字画像交
差手段とを少なくとも有しており、前記生成された新た
な文字画像を可視化手段に導く文字画像出力手段を必要
に応じて設ける。
【0011】
【作用】初期画像集団生成手段は、入力画像から抽出し
た特徴ベクトルに対して所定類似度の特徴ベクトルを持
つ複数の初期画像、例えば文字画像の集合を生成してこ
れを特徴抽出手段に導く(第1の過程)。特徴抽出手段
は、各々の文字画像の特徴ベクトルを抽出して前記入力
画像の特徴ベクトルとの相関評価値を導出する(第2の
過程)。文字画像選択手段は、相関評価値がより高い2
つの画像を選択して文字画像交差手段に送る(第3の過
程)。この操作を所定回数だけ繰り返す。文字画像交差
手段は、選択された2つの画像の所定部位を互いに交差
して新たな画像を生成する(第4の過程)。この新たな
文字画像が所定基準に達しているとき、例えば操作を繰
り返しても十分に類似している文字画像が得られるまで
第2乃至第4の過程を繰り返す。必要に応じて文字画像
出力手段で文字画像を可視化して出力し、これを正解画
像か否かの評価に用いる。
【0012】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。図1は、本発明の一実施例に係る文字認識
処理評価装置の機能ブロック図であり、磁気ディスク装
置などにより実現される文字特徴入力部1と、入力され
た文字特徴から文字画像に構築するための遺伝的アルゴ
リズム実行部2と、構築された文字画像を出力するため
の出力部3と、初期画像集団として用いるための複数の
文字パターンを例えば64×64ビットのバッファ中に
格納した文字パターンデータベース4とから構成され
る。出力部3は、画像を直接可視化するプリンタやディ
スプレイのほか、画像を一時的に格納する磁気ディスク
などの記憶媒体であっても良い。
【0013】本実施例の遺伝的アルゴリズム実行部2
は、初期集団生成部21、文字特徴抽出部22、特徴比
較部23、文字パターン比較部24、及び、文字パター
ン選択部25から構成される。なお、図示を省略した
が、例えば画素を一部反転させたり、異なる種類の画像
を掛け合わせる突然変異実行部を文字パターン選択部2
5の後段に設けても良い。
【0014】このような構成の文字認識処理評価装置に
おいて、例えば入力手書画像「あ」の特徴Iが図示のよ
うに文字特徴入力部1から遺伝的アルゴリズム実行部2
に入力されると、初期集団生成部21は、文字パターン
データベース4から当該画像「あ」に類似する100個
程度の文字パターンを選択して初期集団を生成する。こ
のときの選択基準は、入力画像から抽出した特徴ベクト
ルが属すべきカテゴリが明らかであった場合には当該カ
テゴリ集合が選択され、そうでない場合には当該特徴ベ
クトルが最も類似したと考えられる文字パターンより選
択される。
【0015】初期集団が生成されると、その集団に属す
る文字パターンは、それぞれ特徴抽出部22で特徴抽出
処理を受け、各々の文字パターンに対応する特徴ベクト
ルviが生成される。生成された特徴ベクトルviは、
それぞれ特徴比較部23に送られ、例えば余弦si(=
(vi・I)/|vi||I|)のような尺度で比較さ
れ、その尺度siが各文字パターンの属性として与えら
れる。
【0016】類似性の評価が与えられた各文字パターン
は、文字パターン選択部24に送られる。文字パターン
選択部24においては、上記類似性評価に基づいて類似
性が高いと判定される文字パターンほど高くなるような
重み付き確率を用いることで例えば2つの文字パターン
から成る組を選択し、これらを文字パターン交差部に送
る。この操作を所定回数だけ繰り返し、複数組の文字パ
ターンを選択する。文字パターン交差部25に送られた
各組の文字パターンは、例えば図2に示される方法でパ
ターンの下部を互いに入れ替え、新しい文字パターンの
組を生成する。この操作を各組に対して行って次の世代
の文字パターン集合を生成する。
【0017】この操作を十分に類似した文字パターンが
得られるまで繰り返すことにより、結果的に入力された
特徴ベクトルに対応する文字パターンを構築することが
できる。この構築された文字パターンを出力部3に出力
し、特徴抽出系、すなわち文字特徴抽出部22及び特徴
比較部23の正当性評価を行う。
【0018】図3〜図7に本実施例による評価結果の例
を示す。図3の例では、ある入力画像「あ」から抽出し
た外郭方向寄与度特徴に対応する文字画像、図4は世代
数に対する類似度の相関関係説明図である。図3におい
て、各文字画像の下部表記は、紙面左から順に、JIS
CODE、文字種、世代数を示し、図4における上段
のグラフは各世代の最大類似度、下段のグラフは各世代
の平均値と標準偏差をそれぞれ示している。図3及び図
4を参照すると、世代が進むごとに類似性の高い文字パ
ターンが得られていることがわかる。
【0019】また、図5の例は、学習サンプルの単純平
均によって得た認識辞書からの構築文字画像であり、各
文字画像の下部表記は、紙面左から順に、JIS CO
DE、文字種、類似度を示し、類似度はそれぞれ100
0で正規化されている。図6は図5の各文字種に対する
類似度の関係を示す説明図であり上段のグラフは最終世
代の類似度、下段のグラフは初期集団の最高類似度を示
している。図5及び図6を参照すると、構築を開始する
際に用いた初期集団よりも各々類似性が高い文字パター
ンが作成されていることがわかる。従ってこれらの文字
画像と誤識別パターンとを比較することにより、誤読の
原因を従来よりも簡単に把握することが可能になる。
【0020】図7の例は、ひらがなの「あ」の辞書と
「お」の辞書との中点、すなわち、余弦、ユークリッド
距離などの識別関数を用いた場合の識別境界面のうちの
一点を可視化したものである。図7から明らかなよう
に、文字種は「お」であるが、構築された文字画像は
「あ」にかなり類似しているため誤読の原因となる。こ
のときの正規化された類似度は図5の例では「940」
であったのに対し、図7の例では「930」に低下して
いることがわかる。このような知見から文字認識装置に
おいて識別系の改良を行う契機を与えることができる。
【0021】本実施例は以上のとおりであるが、本発明
は入力画像に遺伝的アルゴリズムを適用して特徴ベクト
ルが持つ情報を画像化する点に主眼があるので、必ずし
も上記実施例に限定されるものではなく、種々の実施態
様が可能である。例えば本実施例では、評価の高速化を
図るため入力画像として文字画像を用いた場合について
説明したが、丸、四角等の記号画像を入力画像としても
良い。また、本実施例では初期集団を生成する際に文字
パターンデータベース4に格納された複数の文字パター
ンを用いたが、他の文字パターン入力手段から該当する
複数の文字パターンを入力する構成であっても良い。
【0022】
【効果】以上の説明から明らかなように、本発明によれ
ば、遺伝的アルゴリズムを適用することにより入力画像
から抽出した特徴ベクトルに対応する画像を構築するこ
とが可能となるため、従来の認識率一辺倒による文字認
識の性能評価よりも精度が格段に高まり、特に特徴抽出
系の具体的な問題点を明確化することができる効果があ
る。これにより高精度の文字認識装置を実現することが
できる。
【0023】また、本発明は遺伝的アルゴリズムによる
画像探索手法なので、原理的には、パターンマッチング
を用いるどのような文字認識処理系にも適用することが
でき、高性能な文字認識装置の開発の有力な支援手段と
なり得る。さらに、文字画像を初期集団として用いるこ
とにより高速で処理を行うことが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字認識処理評価装置
の機能ブロック図。
【図2】本実施例による文字パターンの交差処理の一例
を示す説明図。
【図3】入力画像「あ」の正解画像と本実施例により再
構築した画像「あ」の変遷を示す説明図。
【図4】図3の画像例に対する世代数と類似度との相関
関係説明図。
【図5】本実施例により学習サンプルの単純平均によっ
て得た認識辞書からの構築文字画像の一例を示す説明
図。
【図6】図5の各文字種に対する類似度の関係を示す説
明図。
【図7】本実施例によりひらがなの「あ」の辞書と
「お」の辞書との中点、すなわち、余弦、ユークリッド
距離などの識別関数を用いた場合の識別境界面のうちの
一点を可視化した実験結果説明図。
【符号の説明】
1 文字特徴入力部 2 遺伝的アルゴリズム実行部 21 初期集団生成部 22 文字特徴抽出部 23 特徴比較部 24 文字パターン選択部 25 文字パターン交差部 3 出力部 4 文字パターンデータベース

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字認識装置への入力画像に遺伝的アル
    ゴリズムを適用して該入力画像に対応する特徴ベクトル
    の持つ情報を画像の形で構築する過程を有することを特
    徴とする文字認識装置の評価方法。
  2. 【請求項2】 前記遺伝的アルゴリズムは、 前記入力画像から抽出された特徴ベクトルに対して所定
    類似度の特徴ベクトルを持つ複数の画像を生成する第1
    の過程と、生成された画像の各々の特徴ベクトルと前記
    入力画像の特徴ベクトルとの相関評価値を導出する第2
    の過程と、前記相関評価値がより高い2つの画像を選択
    する第3の過程と、選択された2つの画像の所定部位を
    互いに交差して新たな画像を生成する第4の過程とを含
    み、前記第2乃至第4の過程を所定基準に達するまで繰
    り返すことを特徴とする請求項1記載の文字認識装置の
    評価方法。
  3. 【請求項3】 前記相関評価値として前記文字認識装置
    における識別関数を用いることを特徴とする請求項2記
    載の文字認識装置の評価方法。
  4. 【請求項4】 前記第1の過程で生成される画像集団が
    文字画像集団であることを特徴とする請求項2記載の文
    字認識装置の評価方法。
  5. 【請求項5】 入力画像の特徴ベクトルに対して所定類
    似度の特徴ベクトルを持つ初期画像集団を生成する初期
    画像集団生成手段と、前記初期画像集団の各々に対して
    前記入力画像との特徴比較を行う特徴比較手段と、前記
    文字画像集団から前記入力画像の特徴により類似する特
    徴を持つ2つの文字画像を選択出力する文字画像選択手
    段と、選択された2つの文字画像の所定部位を互いに交
    差して新たな文字画像を生成する文字画像交差手段とを
    有することを特徴とする文字認識装置の評価装置。
  6. 【請求項6】 請求項5記載の文字認識装置の評価装置
    において、前記文字画像交差手段により生成された新た
    な文字画像を可視化手段に導く文字画像出力手段を有す
    ることを特徴とする文字認識装置の評価装置。
JP7004622A 1995-01-17 1995-01-17 文字認識装置の評価方法及び装置 Pending JPH08194781A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7004622A JPH08194781A (ja) 1995-01-17 1995-01-17 文字認識装置の評価方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7004622A JPH08194781A (ja) 1995-01-17 1995-01-17 文字認識装置の評価方法及び装置

Publications (1)

Publication Number Publication Date
JPH08194781A true JPH08194781A (ja) 1996-07-30

Family

ID=11589161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7004622A Pending JPH08194781A (ja) 1995-01-17 1995-01-17 文字認識装置の評価方法及び装置

Country Status (1)

Country Link
JP (1) JPH08194781A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066310A (ja) * 2005-08-26 2007-03-15 Fujitsu Ltd 文字列認識プログラム、方法および装置
JP2008052333A (ja) * 2006-08-22 2008-03-06 Takafumi Terasawa 入力情報分析方法および入力情報分析装置
CN101968847A (zh) * 2009-06-30 2011-02-09 甲骨文美国公司 统计学在线字符识别

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066310A (ja) * 2005-08-26 2007-03-15 Fujitsu Ltd 文字列認識プログラム、方法および装置
JP2008052333A (ja) * 2006-08-22 2008-03-06 Takafumi Terasawa 入力情報分析方法および入力情報分析装置
CN101968847A (zh) * 2009-06-30 2011-02-09 甲骨文美国公司 统计学在线字符识别

Similar Documents

Publication Publication Date Title
CN111667066B (zh) 网络模型的训练、文字识别方法、装置和电子设备
EP1433118A1 (en) System and method of face recognition using portions of learned model
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
Ozcan et al. Partial shape matching using genetic algorithms
JP2010134957A (ja) パターン認識方法
CN110619347A (zh) 一种基于机器学习的图像生成方法及其方法
Basaj et al. Explaining self-supervised image representations with visual probing
CN112784921A (zh) 任务注意力引导的小样本图像互补学习分类算法
JP4039708B2 (ja) パターン認識方法およびパターン認識装置
Bala et al. Shape analysis using genetic algorithms
CN113822377A (zh) 基于对比自学习的伪造人脸检测方法
Kim et al. Off-line recognition of handwritten Korean and alphanumeric characters using hidden Markov models
CN112052663B (zh) 客服语句质检方法及相关设备
Cucchiara Genetic algorithms for clustering in machine vision
KR20210082222A (ko) 화상 인식 장치 및 방법
JP2007179413A (ja) パターン認識装置、パターン認識方法、および特徴抽出パラメータの生成方法
JPH08194781A (ja) 文字認識装置の評価方法及び装置
JP2005352997A (ja) 事例データベースの構築方法、判別装置の学習方法、データ判別支援装置、データ判別支援プログラム
CN117237688A (zh) 一种基于融合特征的apt恶意样本攻击组织溯源方法
Bala et al. Shape analysis using morphological processing and genetic algorithms
Bellini et al. Optical music recognition: Architecture and algorithms
JP2004038744A (ja) 画像認識アルゴリズム生成方法,画像認識アルゴリズム生成装置,画像認識アルゴリズム生成プログラムおよび画像認識アルゴリズム生成プログラムを記録した記録媒体
JP2009037640A (ja) パターン認識装置および特徴抽出パラメータの生成方法
JP2009043280A (ja) パターン認識装置
JP3925011B2 (ja) パターン認識装置及び認識方法