JP2843167B2 - パターン読取装置 - Google Patents

パターン読取装置

Info

Publication number
JP2843167B2
JP2843167B2 JP3139822A JP13982291A JP2843167B2 JP 2843167 B2 JP2843167 B2 JP 2843167B2 JP 3139822 A JP3139822 A JP 3139822A JP 13982291 A JP13982291 A JP 13982291A JP 2843167 B2 JP2843167 B2 JP 2843167B2
Authority
JP
Japan
Prior art keywords
recognition dictionary
character
recognition
pattern
accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3139822A
Other languages
English (en)
Other versions
JPH04337892A (ja
Inventor
康裕 岡田
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3139822A priority Critical patent/JP2843167B2/ja
Publication of JPH04337892A publication Critical patent/JPH04337892A/ja
Application granted granted Critical
Publication of JP2843167B2 publication Critical patent/JP2843167B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文字等のパターンを読
み取って認識するパターン読取装置に関するものであ
る。
【0002】
【従来の技術】近年、計算機などへの大量かつ高速デー
タをエントリする手段としてパターン読取装置が注目さ
れており、このようなパターン読取装置の一例としては
文字を読み取る光学式文字読取装置(OCR)が知られ
ている。
【0003】図18は例えば「The Self-Organizing Ma
p」(Proceedings of The IEEE,vol.78,no.9 sep 1990)
に示される音声認識で有効とされる認識辞書構築法を文
字認識に応用した場合の従来の文字読取装置の構成を示
すブロック図である。図18において、1は文字が記載
されている帳票、2は上記帳票1をイメージリーダ等に
より走査して帳票上の濃度情報を電気信号に変換してデ
ィジタル化したパターンの文字イメージ情報信号を出力
する走査手段、3は上記走査手段2による光電変換で得
られる文字イメージ情報信号に対して、文字を認識する
上で文字カテゴリの本質的な特徴であり、未知入力文字
がいずれの文字カテゴリに属するかを判定する上で有効
な特徴を取り出す操作を行う特徴抽出手段、4は抽出し
た特徴値と認識辞書の演算を行い、抽出された特徴値と
認識辞書とを比較し最も類似した文字を出力する文字判
定手段、5は文字を正しく認識できるように上記文字判
定手段4の認識辞書を変更する認識辞書変更手段、6は
認識辞書を記憶する認識辞書記憶手段である。
【0004】図3は、文字が記載されている帳票1の一
例、特に学習用の文字が記載された帳票を示す説明図
で、図において7,8は帳票1に記載された文字“H”
であり、9,10,11は帳票1に記載された文字
“M”である。
【0005】図4は、文字が記載されている帳票1の一
例,特に未知の文字が記載された帳票1を示す説明図
で、図において12は帳票1に記載された文字“H”で
ある。
【0006】図5は、図3に示した文字が記載された帳
票1を走査手段2により走査した結果得られる文字パタ
ーンの一例を示す説明図で、図において、『●』は文字
パターンの黒画素を表わし、空白は白画素を表わす。1
3は帳票1に記載された文字“H”7の文字パターン、
14は帳票1に記載された文字“H”8の文字パター
ン、15は帳票1に記載された文字“M”9の文字パタ
ーン、16は帳票1に記載された文字“M”10の文字
パターン、17は帳票1に記載された文字“M”11の
文字パターンを示す。
【0007】図6は、図4に示した文字が記載された帳
票1を走査手段2により走査した結果得られる文字パタ
ーンの一例を示す説明図で、図において、『●』は文字
パターンの黒画素を表わし、空白は白画素を表わす。1
8は帳票1に記載された文字“H”12の文字パターン
を示す。
【0008】図7は、図5に示した文字パターンを特徴
抽出手段3により特徴を抽出した結果得られる特徴値の
一例を示す説明図で、図において19は文字“H”7の
文字パターン13に対する特徴値、20は文字“H”8
の文字パターン14に対する特徴値、21は文字“M”
9の文字パターン15に対する特徴値、22は文字
“M”10の文字パターン16に対する特徴値、23は
文字“M”11の文字パターン17に対する特徴値を示
す。
【0009】図8は、図6に示した文字パターンを特徴
抽出手段3により特徴抽出した結果得られる特徴値の一
例を示す説明図で、図において、24は文字“H”12
の文字パターン18に対する特徴値を示す。
【0010】図9は、認識辞書記憶手段6の一例を示す
説明図で、図において、25は文字“H”の認識辞書、
26は文字“M”の認識辞書を示す。
【0011】図19は、上記構成の文字読取装置の文字
判定手段4と認識辞書変更手段5の動作を説明する動作
説明図で、27は学習前の文字“H”の認識辞書、28
は学習前の文字“M”の認識辞書、29は学習後の文字
“H”の認識辞書、30は学習後の文字“M”の認識辞
書、31は文字“H”7の文字パターン13の特徴値1
9と学習前の文字“H”の認識辞書27との距離、32
は文字“H”7の文字パターン13の特徴値19と学習
前の文字“M”の認識辞書28との距離、33は文字
“H”の認識辞書との距離31と文字“M”の認識辞書
との距離32との関係により決定される認識結果、34
は学習後の文字“H”の認識辞書、35は学習後の文字
“M”の認識辞書、36は文字“M”9の文字パターン
15の特徴値21と学習前の文字“H”の認識辞書29
との距離、37は文字“M”9の文字パターン15の特
徴値21と学習前の文字“H”の認識辞書30との距
離、38は文字“H”の認識辞書との距離36と文字
“M”の認識辞書との距離37との関係により決定され
る認識結果、39は文字“H”8の文字パターン14の
特徴値20と学習前の文字“H”の認識辞書34との距
離、40は文字“H”8の文字パターン14の特徴値2
0と学習前の文字“M”の認識辞書35との距離、41
は文字“H”の認識辞書との距離39と文字“M”の認
識辞書との距離40との関係により決定される認識結
果、42は文字パターンに対する特徴値13〜17をす
べて学習したあとの文字“H”の認識辞書、43は文字
パターンに対する特徴値13〜17をすべて学習したあ
との文字“M”の認識辞書を示す。なお、認識辞書のう
ち認識辞書27,28,29,30,34,35,4
2,43についてのデータ内容を図20〜27に示す。
【0012】次に、従来装置の動作について説明する。
図3に示した帳票に記載された文字を認識できるように
認識辞書を調整し、調整後の認識辞書を用いて図4に示
した未知文字を認識する。認識辞書の調整は下記の手法
で行う。
【0013】まず、図3に示した帳票に記載された文字
を走査手段2で走査し、図5に示す2値パターン(白か
黒)を得る。図3の文字“H”7に対しては、図5の文
字パターン13が対応し、『●』が黒画素,空白が白画
素を表わす。同様に文字“H”8には文字パターン14
が、文字“M”9には文字パターン15が、文字“M”
10には文字パターン16が、文字“M”11には文字
パターン17が対応する。
【0014】次に、特徴抽出手段3により文字の2値パ
ターンから特徴を抽出する。この特徴は
【0015】
【数1】
【0016】に示す算式で求める。図5の文字パターン
13に対して数1の算式を適用すると文字パターンの左
上部の画素は黒なので特徴値は、“1”となり、最上部
左から2番目の画素は白なので特徴値は“−1”とな
る。すべての画素について特徴値を求めると、図7中の
19の特徴値が得られる。同様に図5の14〜17の他
の文字パターンに対しても特徴値を求めると、図7中の
20〜23の特徴値が得られる。特徴抽出の後、文字判
定手段4と認識辞書変更手段5を用いて、図7の各文字
ごとの特徴値19〜23を“H”と“M”に正しく分類
するように認識辞書を変更し、適切な認識辞書を求め
る。認識辞書の変更は下記の手法で行う。
【0017】まず、図9に示す認識辞書記憶手段6の
“H”の認識辞書25と“M”の認識辞書26の初期値
をすべて“0”とする。次に、文字判定手段4で文字
“H”7に対する特徴値19と“H”の認識辞書27と
の距離,文字“H”7に対する特徴値19と“M”の認
識辞書28との距離を求める。距離計算は数2の算式を
用いる。
【0018】
【数2】
【0019】数2の算式より文字“H”7に対する特徴
値19と“H”の認識辞書27との距離31は25とな
り、文字“H”7に対する特徴値19と“M”の認識辞
書28との距離32は25となる。距離算出の後、認識
辞書変更手段5により認識辞書の変更を行う。変更は数
3の算式を用い、TH1は“2”とする。この場合、数
3の条件判定により認識辞書は変更され、数3の算式に
従い、“H”の認識辞書は29、“M”の認識辞書は3
0に変更される。
【0020】次に、文字判定手段4で文字“M”9に対
する特徴値21と“H”の認識辞書29との距離、文字
“M”9に対する特徴値21と“M”の認識辞書30と
の距離を求める。数2より、文字“M”9に対する特徴
値と“H”の認識辞書29との距離36は15.5とな
り、文字“M”9に対する特徴値21と“M”の認識辞
書30との距離37は34.5となる。
【0021】距離算出の後、認識辞書変更手段5により
認識辞書の変更を行う。この場合、数3の条件判定によ
り認識辞書は変更され、数3の算式に従い、“H”の認
識辞書は34,“M”の認識辞書は35に変更される。
【0022】
【数3】
【0023】次に、文字判定手段4で文字“H”8に対
する特徴値20と“H”の認識辞書34との距離,文字
“H”8に対する特徴値20と“M”の認識辞書35と
の距離を求める。数2より、文字“H”8に対する特徴
値20と“H”の認識辞書34との距離39は17.2
5となり、文字“H”8に対する特徴値20と“M”の
認識辞書35との距離40は22.25となる。距離算
出の後、認識辞書変更手段5により認識辞書の変更を行
う。この場合、数3の条件判定により認識辞書は変更さ
れない。数3の算式に従い、“H”の認識辞書34、
“M”の認識辞書35は変更されない。
【0024】上記の処理を図3の7〜11の文字がすべ
て正しく認識できるようになるまで繰り返す。その結
果、図19中の42,43に示す認識辞書が得られる。
【0025】上記の学習の結果、認識辞書が得られたの
で、この認識辞書を用いて未知文字を認識する。図4の
12に示した文字を認識する場合、帳票1上の文字12
を走査手段2により走査し、図6の文字パターン18を
得る。次に特徴抽出手段3により、図8の文字パターン
18の特徴値24を求め、文字判定手段4により、文字
パターン18の特徴値24と“H”の認識辞書42との
距離、及び文字パターン18の特徴値24と“M”の認
識辞書43との距離を求め、TH1=2として
【0026】
【数4】
【0027】数4の判定条件により認識結果を決定す
る。この場合、文字パターン18の特徴値24と“H”
の認識辞書42と距離は19.75、文字パターン18
の特徴値24と“M”の認識辞書43と距離は20.7
5であるので、認識結果は“棄却”(“M”か“H”か
わからない)となり、正しく認識することができない。
【0028】
【発明が解決しようとする課題】従来のパターン読取装
置は以上のように構成され、認識辞書を更新する条件が
固定であるため、認識辞書が最適な値に設定されないこ
とがあり、これにより文字を正しく認識できない確率が
増大するという問題点があった。
【0029】この発明は上記のような問題点を解決する
ためになされたもので、認識辞書を最適な値に設定で
き、認識精度の高いパターン読取装置を提供することを
目的とする。
【0030】
【課題を解決するための手段】この発明に係るパターン
読取装置は、辞書の学習に用いる学習パターンを正しく
認識できるように認識辞書を変更する認識辞書変更手段
と、上記認識辞書を変更した後の認識精度を判定する認
識精度判定手段と、上記認識精度判定後の認識辞書を記
憶する第2の認識辞書記憶手段と、上記認識精度判定手
段の判定結果に従って、認識精度が所定の精度以上であ
れば上記認識辞書を更新する強度を強め、認識精度が所
定の精度未満であれば上記認識辞書を更新する強度を弱
める認識辞書更新条件変更手段とを設け、上記認識辞書
更新条件変更手段により更新条件を変更して作成した
識辞書に基づいて入力パターンを読み取るものである。
【0031】
【作用】認識辞書変更手段は、辞書の学習に用いる学習
パターンを正しく認識できるように認識辞書を変更し、
認識精度判定手段は認識辞書を変更した後の認識精度
を判定する。第2の認識辞書記憶手段は認識精度判定
後の認識辞書を記憶し、認識辞書更新条件変更手段は
認識精度判定結果に従って、認識精度が所定の精度以上
であれば認識辞書を更新する強度を強め、認識精度が所
定の精度未満であれば認識辞書を更新する強度を弱める
よう認識辞書を更新する条件を変更する。したがって、
認識辞書更新条件変更手段により、TH1の初期値が大
きくても小さくても最適なTH1が得られ、学習に用い
る文字のすべてを正しく認識できる最もよい条件で認識
辞書を作成できる。
【0032】
【実施例】図1はこの発明の一実施例に係るパターン読
取方式を採用した文字読取装置の構成を示すブロック図
である。図1において、図18に示す構成要素に対応す
るものには同一の符号を付し、その説明を省略する。図
1において、44は文字判定手段4の結果を解析して第
1の認識辞書記憶手段6の認識辞書を変更した後の認識
精度を判定する認識精度判定手段、45は認識精度判定
手段44による認識精度判定後の認識辞書を記憶する第
2の認識辞書記憶手段、46は認識精度判定手段44の
判定結果により認識辞書を更新する条件を変更する認識
辞書更新条件変更手段である。
【0033】また、図10は第2の認識辞書記憶手段4
5の一例を示す説明図である。図10において、46は
文字“H”の認識辞書、47は文字“M”の認識辞書を
示す。
【0034】また、図11,図12,図13は認識辞書
更新条件変更手段46により変更された認識辞書更新条
件下での、文字判定手段4と認識辞書変更手段5の動作
を説明する動作説明図で、図19に示す従来装置のもの
と同一または相当部分は同一符号を用いて示す。
【0035】図11で、48は学習後の文字“H”の認
識辞書、49は学習後の文字“M”の認識辞書、50は
文字“M”10の文字パターン16の特徴値22と学習
前の文字“H”の認識辞書34との距離、51は文字
“M”10の文字パターン16の特徴値22と学習前の
文字“M”の認識辞書35との距離、52は文字“H”
の認識辞書との距離50と文字“M”の認識辞書との距
離51とを数3の算式に代入することにより決定される
認識結果である。図13で、53は文字パターンに対す
る特徴値13〜17をすべて学習したあとの文字“H”
の認識辞書、54は文字パターンに対する特徴値13〜
17をすべて学習したあとの文字“M”の認識辞書を示
す。なお、認識辞書のうち認識辞書48,49,53,
54についてのデータ内容を図14〜17に示す。
【0036】次に、この実施例の動作を図3に示す文字
を学習した後、図4の未知文字を認識する場合について
説明する。まず、数3のTH1を“2”にして認識辞書
を調整する。これは従来装置と全く同一の動作を行い、
最終的に図19の42と43の認識辞書が得られ、図3
に示した学習に用いる文字がすべて正読することがてき
る。次に、認識精度判定手段44で認識精度の判定を行
う。認識精度の判定は学習に用いる文字がすべて正読で
きたか否かを判定する。この場合、『すべての文字を正
読できた』と判定する。第2の認識辞書記憶手段45は
認識精度判定手段44の判定結果により、『学習に用い
る文字がすべて正読できた』の場合は第1の認識辞書記
憶手段6に格納されている認識辞書を記憶する。『学習
に用いる文字で正読できない文字がある』の場合は第2
の認識辞書記憶手段45内の内容は変更しない。この場
合、『学習に用いる文字がすべて正読できた』であるの
で、第2の認識辞書記憶手段6に格納されている認識辞
書を記憶する。
【0037】認識辞書更新条件変更手段46は認識精度
判定手段44の判定結果により、『学習に用いる文字が
すべて正読できた』の場合、『学習に用いる文字で正読
できない文字がある』の場合に応じて、数5に従って認
識辞書更新条件を変更する。この場合、『学習に用いる
文字がすべて正読できた』であるので、TH1は“3”
に変更される。次に、数3のTH1を認識辞書更新条件
変更手段46により変更された“3”にして認識辞書を
調整する。走査手段2による帳票1の走査、特徴抽出手
段3による特徴の抽出はTH1の値によらず従来装置と
同様の動作を行う。
【0038】特徴抽出の後、文字判定手段4と認識辞書
変更手段5を用いて、図7の各文字ごとの特徴値19〜
23を“H”と“M”に正しく分類するように認識辞書
を変更し、適切な認識辞書を求める。認識辞書の変更は
下記の手法で行う。まず、図9に示す第1の認識辞書記
憶手段6の“H”の認識辞書25と“M”の認識辞書2
6の初期値をすべて“0”とする。次に、文字判定手段
4で文字“H”7に対する特徴値19と“H”の認識辞
書27との距離、文字“H”7に対する特徴値19と
“M”の認識辞書28との距離を求める。距離計算は数
2の算式を用いる。数2の算式より、文字“H”7に対
する特徴値19と“H”の認識辞書27との距離31は
25となり、文字“H”7に対する特徴値19と“M”
の認識辞書28との距離32は25となる。距離計算の
後、認識辞書変更手段5により認識辞書の変更を行う。
変更は数3を用い、TH1は“3”なので、数3の条件
判定により認識辞書は変更され、数3の算式に従い、
“H”の認識辞書は29,“M”の認識辞書は30に変
更される。
【0039】次に、文字判定手段4で文字“M”9に対
する特徴値21と“H”の認識辞書29との距離,文字
“M”9に対する特徴値21と“M”の認識辞書30と
の距離を求める。数2の算式により、文字“M”9に対
する特徴値と“H”の認識辞書29との距離36は1
5.5となり、文字“M”9に対する特徴値21と
“M”の認識辞書30との距離37は34.5となる。
距離算出の後、認識辞書変更手段5により認識辞書の変
更を行う。この場合、数3の条件判定により認識辞書は
変更され、数3の算式に従い、“H”の認識辞書は3
4,“M”の認識辞書は35に変更される。
【0040】次に、文字判定手段4で文字“H”8に対
する特徴値20と“H”の認識辞書34との距離,文字
“H”8に対する特徴値20と“M”の認識辞書35と
の距離を求める。数2より、文字“H”8に対する特徴
値20と“H”の認識辞書34との距離39は17.2
5となり、文字“H”8に対する特徴値20と“M”の
認識辞書35との距離40は22.25となる。距離算
出の後、認識辞書変更手段5により認識辞書の変更を行
う。この場合、数3の条件判定により認識辞書は変更さ
れない。
【0041】次に、文字判定手段4で文字“M”10に
対する特徴値22と“H”の認識辞書34との距離,文
字“M”10に対する特徴値22と“M”の認識辞書3
5との距離を求める。数2の算式より、文字“M”10
に対する特徴値22と“H”の認識辞書34との距離5
0は21.25となり、文字“M”10に対する特徴値
22と“M”の認識辞書35との距離51は18.75
となる。距離算出の後、認識辞書変更手段5により認識
辞書の変更を行う。TH1が“2”の場合、数3の条件
判定により認識辞書は変更されないが、この場合、TH
1が“3”に変更されているので、文字判定の結果は数
3の条件判定により“棄却”となり認識辞書は変更され
る。数3の算式に従い、“H”の認識辞書48、“M”
の認識辞書49は変更される。上記の処理を図3の7〜
11の文字がすべて正しく認識できるようになるまで繰
り返す。その結果、図11の52,53に示す認識辞書
が得られ、図3に示した学習に用いる文字がすべて正読
することができる。
【0042】次に、認識精度判定手段44で認識精度の
判定を行う。認識精度の判定は学習に用いる文字がすべ
て正読できたか否かを判定する。この場合、すべての文
字を正読できることを判定する。第2の認識辞書記憶手
段45は認識精度判定手段44の判定結果により、『学
習に用いる文字がすべて正読できた』の場合は第1の認
識辞書記憶手段6に格納されている認識辞書を記憶す
る。『学習に用いる文字で正読できない文字がある』の
場合は第2の認識辞書記憶手段45内の内容は変更しな
い。この場合、『学習に用いる文字がすべて正読でき
た』であるので、第1の認識辞書記憶手段6に格納され
ている認識辞書を記憶する。認識辞書更新条件変更手段
46は認識精度判定手段44の判定結果により、『学習
に用いる文字がすべて正読できた』の場合、『学習に用
いる文字で正読できない文字がある』の場合に応じて、
【0043】
【数5】
【0044】上記数5に従って認識辞書更新条件を変更
する。この場合、『学習に用いる文字がすべて正読でき
た』ので、TH1は“4”に変更される。
【0045】次に、数3のTH1を認識辞書更新条件変
更手段46により変更された“4”にして認識辞書を調
整する。走査手段2による帳票1の走査、特徴抽出手段
3による特徴の抽出はTH1の値によらず従来装置と同
様の動作を行う。
【0046】特徴抽出の後、文字判定手段4と認識辞書
変更手段5を用いて、図3の各文字ごとの特徴値19〜
23を“H”と“M”に正しく分類するように認識辞書
を変更し、適切な認識辞書を求める。認識辞書の変更は
上記と同様の手法で行う。この場合、認識辞書の変化の
図面は省略するが、TH1=4の条件下ではすべての文
字を正しく認識することができない。認識精度判定手段
44で認識精度の判定は『学習に用いる文字で正読でき
ない文字がある』となる。第2の認識辞書記憶手段45
は認識精度判定手段44の判定結果が、『学習に用いる
文字で正読できない文字がある』であるので、第2の認
識辞書記憶手段45の内容は変更しない。また、学習は
認識精度判定手段44の判定結果が変わった時、すなわ
ち、『学習に用いる文字がすべて正読できた』から『学
習に用いる文字で正読できない文字がある』に変わった
時、あるいは『学習に用いる文字で正読できない文字が
ある』から『学習に用いる文字がすべて正読できた』時
に終了する。この場合、『学習に用いる文字がすべて正
読できた』から『学習に用いる文字で正読できない文字
がある』に変わったので学習は終了する。
【0047】上記の学習の結果、認識辞書が得られたの
で、第2の認識辞書記憶手段45に格納された認識辞書
を用いて未知文字を認識する。図4の12に示した文字
を認識する場合、帳票上の文字12を走査手段2により
走査し、図6の文字パターン18を得る。次に特徴抽出
手段3により、文字パターン18の特徴値24を求め、
文字判定手段4により、文字パターン18の特徴値24
と図10の46の“H”の認識辞書すなわち図13の5
3の認識辞書との距離、及び文字パターン18の特徴値
24と図10の47の“M”の認識辞書すなわち図13
の53の認識辞書との距離を求め、TH1=2として数
4の判定条件により認識結果を決定する。この場合、文
字パターン18の特徴値24と“H”の認識辞書53と
距離は16.52、文字パターン18の特徴値24と
“M”の認識辞書54と距離は19.37であるので、
認識結果は“H”となり、正しく認識することができ
る。
【0048】上述したように認識精度判定手段44は、
『学習に用いる文字がすべて認識できたか否か』の情報
を出力する。認識辞書更新条件変更手段46ではその情
報を受けて、段落番号0035で示すように数5の式を
用いて認識辞書更新条件すなわちTH1を変更する。こ
こでの認識辞書更新条件は、数3〜数5に出てくるTH
1のことであり、数4に示すようにTH1の値が大きく
なればなるほど、距離を大きく隔てて正しく認識しなけ
ればならず条件としては厳しくなる。数5ではこのTH
1を変更する。数5の示すところの意味はすべての文字
が正しく認識できた場合はTH1の値を大きくし条件を
厳しくし、すべての文字を認識できない場合にはTH1
を小さくし、条件を甘くすることを示している。数1〜
数5の中で認識辞書更新条件変更手段46に直接関連が
あるのは数5のみである。数1は特徴抽出手段3の特徴
抽出のアルゴリズムを示す式である。数2は文字判定手
段4の入力されたパターンと認識辞書との距離計算のア
ルゴリズムを示す式である。数3は認識辞書変更手段5
の認識辞書を変更するアルゴリズムを示す式である。数
4は文字判定手段4の認識判定アルゴリズムを示す式で
ある。
【0049】次に、図2のフローチャートを参照してこ
の実施例の動作を要約して説明する。ステップS1では
特徴抽出手段3により入力パターンの有効な特徴を抽出
する。ステップS2では文字判定手段4により入力パタ
ーンの特徴値と認識辞書とを比較し類似したパターンと
の類似の度合を示す距離計算を行い、ステップS3では
数3,4に関する正誤、棄却判定を行う。ステップS4
において正読と判定したとき、ステップS5へ進み、認
識精度判定手段44によりすべての文字が正読できたか
判定し、YESの場合、ステップS5aへ進み、NOの
場合、ステップS1bに戻る。ステップS5aでは、1
回目のループですべての文字が正読できたか判定する。
ステップS5aでYESの場合、認識辞書更新条件変更
手段46により認識辞書更新条件変更を行う。すなわ
ち、ステップS6で認識辞書の更新条件を厳しく設定し
てステップS1aに戻る。ステップS5aでNOの場合
は処理を終了する。 また、ステップS4において正読で
ないと判定したときステップS7へ進み認識辞書変更手
段5により認識辞書の変更を行う。ステップS8bに進
んで、1回目のループですべての文字が正読できたか判
定する。ステップS8bでNOの場合、認識辞書更新条
件変更手段46により認識辞書更新条件変更を行う。す
なわち、ステップS9で、認識辞書の更新条件を緩めて
設定してステップS1aに戻る。ステップS8bでYE
Sの場合は処理を終了する。 尚、ステップS1a,S1
b,S8aの「i]は、例えば、図5のパターン1つに
対して1ずつインクリメントされるカウンタの値を示し
ており、例えば、最初、図5のパターン13に対してス
テップS2以降の処理が実行され、ステップS8aを経
て、ステップS1bに戻った場合は、「i」は1だけイ
ンクリメントされ、次に、図5のパターン14に対して
ステップS2以降の処理を実行する。以降、同様にし
て、図5のパターン15,16,17に対して処理を行
う。 また、「i=6」になった場合、図5では規定値は
「5」なので、ステップS8bに進み、ステップS8b
でNOであれば、ステップS1aに戻って、図5のパタ
ーン13から再度処理し、以降、サイクリックに図5の
パターン14〜17を学習する。 本実施例によれば、T
H1の初期値が大きくても小さくても最適なTH1が得
られ、学習に用いる文字のすべてを正しく認識できる最
もよい条件で認識辞書を作成できる。すなわち、認識辞
書を最適な値に設定でき、認識精度の高いパターン読取
装置が得られる。
【0050】なお、上記実施例では“H”と“M”の活
字の認識を例にあげたが、これに限らず手書きの文字
(数字,漢字など)の多数の文字認識にも適用できる。
また、文字認識以外にも音声認識などの他のパターン認
識にも適用できる。また、特徴として文字の白黒特徴を
用いたが、これに限らず他の特徴を用いてもよい。ま
た、認識精度の判定にすべての文字が認識できることを
用いたがこれに限らず90%の文字が認識できるなどの
条件も設定できる。また、90%の文字が認識できると
いう条件設定にした場合、すべての文字が認識できると
いう条件設定に比較して高速に学習できる。また、認識
辞書の更新条件のしきい値増分を1に設定したがこれに
限らず自由に設定できる。
【0051】
【発明の効果】以上のように本発明によれば、辞書の学
習に用いる学習パターンを正しく認識できるように認識
辞書を変更する認識辞書変更手段と、上記認識辞書を変
更した後の認識精度を判定する認識精度判定手段と、上
記認識精度判定後の認識辞書を記憶する第2の認識辞書
記憶手段と、上記認識精度判定手段の判定結果に従っ
、認識精度が所定の精度以上であれば上記認識辞書を
更新する強度を強め、認識精度が所定の精度未満であれ
ば上記認識辞書を更新する強度を弱める認識辞書更新条
件変更手段とを設け、上記認識辞書更新条件変更手段に
より更新条件を変更して作成した認識辞書に基づいて入
力パターンを読み取るようにしたので、TH1の初期値
が大きくても小さくても最適なTH1が得られ、学習に
用いる文字のすべてを正しく認識できる最もよい条件で
認識辞書を作成できる。すなわち、認識辞書を最適な値
に設定でき、認識精度の高いパターン読取装置が得られ
る。
【図面の簡単な説明】
【図1】この発明の一実施例によるパターン読取装置と
しての文字読取装置の構成を示すブロック図である。
【図2】この実施例の動作を説明するためのフローチャ
ートである。
【図3】文字読取装置に入力する帳票と記載文字の一例
を示す説明図である。
【図4】文字読取装置に入力する帳票と記載文字の一例
を示す説明図である。
【図5】文字読取装置の走査により得られる文字パター
ンの一例を示す図である。
【図6】文字読取装置の走査により得られる文字パター
ンの一例を示す説明図である。
【図7】文字読取装置の特徴抽出により得られる特徴値
の一例を示す説明図である。
【図8】文字読取装置の特徴抽出により得られる特徴値
の一例を示す説明図である。
【図9】文字認識装置において文字を認識するための認
識辞書の格納形態の一例を示す説明図である。
【図10】文字読取装置で文字を認識するための認識辞
書の格納形態の一例を示す説明図である。
【図11】この実施例による認識辞書変更方法の一例を
示す動作説明図である。
【図12】この実施例による認識辞書変更方法の一例を
示す動作説明図である。
【図13】この実施例による認識辞書変更方法の一例を
示す動作説明図である。
【図14】この実施例において認識辞書についてのデー
タ内容を示す図である。
【図15】この実施例において認識辞書についてのデー
タ内容を示す図である。
【図16】この実施例において認識辞書についてのデー
タ内容を示す図である。
【図17】この実施例において認識辞書についてのデー
タ内容を示す図である。
【図18】従来の文字読取装置の構成を示すブロック図
である。
【図19】従来の認識辞書変更方法の一例を示す動作説
明図である。
【図20】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図21】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図22】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図23】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図24】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図25】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図26】この従来例において認識辞書についてのデー
タ内容を示す図である。
【図27】この従来例において認識辞書についてのデー
タ内容を示す図である。
【符号の説明】
3 特徴抽出手段 4 文字判定手段(パターン判定手段) 5 認識辞書変更手段 6 第1の認識辞書記憶手段 44 認識精度判定手段 45 第2の認識辞書記憶手段 46 認識辞書更新条件変更手段
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/68 G06T 7/00 G10L 3/00

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力パターンの有効な特徴を抽出する特
    徴抽出手段と、パターンを認識するための認識辞書を記
    憶した第1の認識辞書記憶手段と、上記特徴抽出手段で
    抽出された特徴値と上記第1の認識辞書記憶手段の認識
    辞書とを比較し類似したパターンを判定し出力するパタ
    ーン判定手段とを備えたパターン読取装置において、辞書の学習に用いる学習 パターンを正しく認識できるよ
    うに認識辞書を変更する認識辞書変更手段と、 上記認識辞書を変更した後の認識精度を判定する認識精
    度判定手段と、 上記認識精度判定後の認識辞書を記憶する第2の認識辞
    書記憶手段と、 上記認識精度判定手段の判定結果に従って、認識精度が
    所定の精度以上であれば上記認識辞書を更新する強度を
    強め、認識精度が所定の精度未満であれば上記認識辞書
    を更新する強度を弱める認識辞書更新条件変更手段とを
    設け、 上記認識辞書更新条件変更手段により更新条件を変更し
    作成した認識辞書に基づいて入力パターンを読み取る
    ことを特徴とするパターン読取装置
JP3139822A 1991-05-15 1991-05-15 パターン読取装置 Expired - Lifetime JP2843167B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3139822A JP2843167B2 (ja) 1991-05-15 1991-05-15 パターン読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3139822A JP2843167B2 (ja) 1991-05-15 1991-05-15 パターン読取装置

Publications (2)

Publication Number Publication Date
JPH04337892A JPH04337892A (ja) 1992-11-25
JP2843167B2 true JP2843167B2 (ja) 1999-01-06

Family

ID=15254281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3139822A Expired - Lifetime JP2843167B2 (ja) 1991-05-15 1991-05-15 パターン読取装置

Country Status (1)

Country Link
JP (1) JP2843167B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11526696B2 (en) 2017-11-28 2022-12-13 Kabushiki Kaisha Toshiba Model maintenance device, pattern recognition system, model maintenance method, and computer program product

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11526696B2 (en) 2017-11-28 2022-12-13 Kabushiki Kaisha Toshiba Model maintenance device, pattern recognition system, model maintenance method, and computer program product

Also Published As

Publication number Publication date
JPH04337892A (ja) 1992-11-25

Similar Documents

Publication Publication Date Title
US5287275A (en) Image recognition apparatus and method for recognizing a pattern within an image
US20020154815A1 (en) Character recognition device and a method therefore
JP2843167B2 (ja) パターン読取装置
JPH11272800A (ja) 文字認識装置
Madan Kumar et al. Text extraction from business cards and classification of extracted text into predefined classes
JP2751865B2 (ja) 文字列認識装置
Jain et al. A survey of Gujarati handwritten character recognition techniques
JPH11328315A (ja) 文字認識装置
JP3113769B2 (ja) 文字認識装置
Parker et al. Vector templates for symbol recognition
JP3463255B2 (ja) 多値画像パターンの認識処理方法
Iryna et al. ON THE FEATURES OF METHODS OF PROCESSING AND RECOGNITION OF HANDWRITTEN TEXT
Mantas et al. Handwritten character recognition by parallel labelling and shape analysis
JP3446794B2 (ja) 文字認識における多角形近似法および文字認識装置
Gyan et al. Intelligent Character Recognition of Handwritten Characters using Artificial Neural Network
JPH051512B2 (ja)
Bagga et al. CHARACTER SEGMENTATION MACHINE-TYPED DOCUMENTS USING KNN ALGORITHM
Aarthi et al. Advanced character based recognition and Phone handling for Blind peoples
JPH04219883A (ja) 活字文字認識装置
Bhuvaneswari et al. Recognition of ancient stone inscription characters using normalized positional distance metric features
JPH04352296A (ja) パターン認識装置及び認識辞書変更方法
JP2972443B2 (ja) 文字認識装置
JPS63269267A (ja) 文字認識方法
Ahmadi et al. Off-line persian handwritten recognition using hidden Markov models
JPH0351982A (ja) 文字列認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071023

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081023

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091023

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091023

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101023

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111023

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111023

Year of fee payment: 13