JPH05258116A - 文字認識方法及び文字認識における辞書作成方法 - Google Patents
文字認識方法及び文字認識における辞書作成方法Info
- Publication number
- JPH05258116A JPH05258116A JP4087815A JP8781592A JPH05258116A JP H05258116 A JPH05258116 A JP H05258116A JP 4087815 A JP4087815 A JP 4087815A JP 8781592 A JP8781592 A JP 8781592A JP H05258116 A JPH05258116 A JP H05258116A
- Authority
- JP
- Japan
- Prior art keywords
- shape
- character
- dictionary
- code
- codes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 前処理の低減を行なって処理の高速化が可能
であり、高精度認識が可能な文字認識方法及び文字認識
における辞書作成方法を提供することである。 【構成】 あるカテゴリーの広がりを代表する標準パタ
ーンの集合についての第1層の学習と、複数の競合する
カデゴリーを分離するための標準パターンの集合につい
て第2層の学習とを行なう。全体として手書きの変形を
輪郭情報の高次化とDPマッチングにより吸収してい
る。
であり、高精度認識が可能な文字認識方法及び文字認識
における辞書作成方法を提供することである。 【構成】 あるカテゴリーの広がりを代表する標準パタ
ーンの集合についての第1層の学習と、複数の競合する
カデゴリーを分離するための標準パターンの集合につい
て第2層の学習とを行なう。全体として手書きの変形を
輪郭情報の高次化とDPマッチングにより吸収してい
る。
Description
【0001】
【産業上の利用分野】本発明は、帳票上に印刷、記録さ
れた文字を読取り、輪郭情報により文字を認識する文字
認識方法に関すると共に、学習により基準文字の辞書を
登録させるようにした文字認識における辞書作成方法に
関する。
れた文字を読取り、輪郭情報により文字を認識する文字
認識方法に関すると共に、学習により基準文字の辞書を
登録させるようにした文字認識における辞書作成方法に
関する。
【0002】
【従来の技術】従来、文字認識にDP(Dynamic
Programming)マッチングを用いたものが
あるが、一般にオンライン文字の認識など筆順が既知で
ベクトル順序が分かるものに限られている。帳票上の文
字を読取り、その輪郭情報をそのままDPマッチングに
用いることは始点が決まらないため、DPマッチングの
回数が多くなり実用的ではない。しかし、輪郭情報にD
Pマッチングを用いたものとして特公平4−1385号
公報に記載されたものがある。
Programming)マッチングを用いたものが
あるが、一般にオンライン文字の認識など筆順が既知で
ベクトル順序が分かるものに限られている。帳票上の文
字を読取り、その輪郭情報をそのままDPマッチングに
用いることは始点が決まらないため、DPマッチングの
回数が多くなり実用的ではない。しかし、輪郭情報にD
Pマッチングを用いたものとして特公平4−1385号
公報に記載されたものがある。
【0003】
【発明が解決しようとする課題】しかし、上記特公平4
−1385号公報に記載された文字読取装置では、符号
間の対応づけをDPマッチングを用いて行なっているた
めに辞書の削減とはなっているが、全てのカテゴリーと
マッチングを行なっているため、かなりの時間を要して
しまう欠点がある。また、基本辞書についての開示がな
いため、精度の面でも問題がある。
−1385号公報に記載された文字読取装置では、符号
間の対応づけをDPマッチングを用いて行なっているた
めに辞書の削減とはなっているが、全てのカテゴリーと
マッチングを行なっているため、かなりの時間を要して
しまう欠点がある。また、基本辞書についての開示がな
いため、精度の面でも問題がある。
【0004】本発明は上述のような事情より成されたも
のであり、本発明の目的は、前処理の低減を行なって処
理の高速化が達成でき、しかも高精度の認識と辞書の作
成が容易な文字認識方法及び文字認識における辞書作成
方法を提供することにある。
のであり、本発明の目的は、前処理の低減を行なって処
理の高速化が達成でき、しかも高精度の認識と辞書の作
成が容易な文字認識方法及び文字認識における辞書作成
方法を提供することにある。
【0005】
【課題を解決するための手段】本発明は、帳票上に記録
された文字を光学的に読取り、読取画像から前記文字の
輪郭線を抽出し、この輪郭線の屈折情報により前記文字
を複数の形状要素コードで符号化して形状コードを作成
し、予め登録された基準文字の形状コードと照合して前
記文字を認識する文字認識方法に関するもので、本発明
の上記目的は、前記複数の形状要素コードのうち特定の
複数の形状要素コードの重心を求め、読取画像の原点に
一番近い前記特定の形状要素コードを形状コードの開始
コードと決定して、形状コードを作成した後に基準文字
の形状コードと照合することによって達成される。
された文字を光学的に読取り、読取画像から前記文字の
輪郭線を抽出し、この輪郭線の屈折情報により前記文字
を複数の形状要素コードで符号化して形状コードを作成
し、予め登録された基準文字の形状コードと照合して前
記文字を認識する文字認識方法に関するもので、本発明
の上記目的は、前記複数の形状要素コードのうち特定の
複数の形状要素コードの重心を求め、読取画像の原点に
一番近い前記特定の形状要素コードを形状コードの開始
コードと決定して、形状コードを作成した後に基準文字
の形状コードと照合することによって達成される。
【0006】また、本発明は、認識しようとする文字を
多数読取り、学習により基準文字の辞書を登録するよう
にした文字認識における辞書作成方法に関するもので、
本発明の上記目的は、文字を光学的に読取り、読取画像
から前記文字の輪郭線を抽出し、この輪郭線の屈折情報
により前記文字を複数の形状要素コードで符号化し、前
記複数の形状要素コードのうち特定の複数の形状要素コ
ードの重心を求め、読取画像の原点に一番近い前記特定
の形状要素コードを形状コードの開始コードと決定して
形状コードを作成し、この形状コードで表わされるベク
トル列を辞書のベクトル列とDPマッチングして距離が
所定値を越えた場合の読取画像の形状コードのベクトル
列を辞書に追加登録することによって達成される。
多数読取り、学習により基準文字の辞書を登録するよう
にした文字認識における辞書作成方法に関するもので、
本発明の上記目的は、文字を光学的に読取り、読取画像
から前記文字の輪郭線を抽出し、この輪郭線の屈折情報
により前記文字を複数の形状要素コードで符号化し、前
記複数の形状要素コードのうち特定の複数の形状要素コ
ードの重心を求め、読取画像の原点に一番近い前記特定
の形状要素コードを形状コードの開始コードと決定して
形状コードを作成し、この形状コードで表わされるベク
トル列を辞書のベクトル列とDPマッチングして距離が
所定値を越えた場合の読取画像の形状コードのベクトル
列を辞書に追加登録することによって達成される。
【0007】
【作用】文字認識のアルゴリズムの開発では、認識率の
向上と、エラー率及びリジェクト率の低減とに多くの時
間を費やしているのが実状である。本発明では、能力ア
ップに必要な時間を短縮し、かつ高精度の認識率を実現
するために、輪郭情報の高次化による大分類とDPマッ
チングにより、手書きの変形を吸収することを基本にし
て詳細分類で2段の辞書の自動作成を行なう。
向上と、エラー率及びリジェクト率の低減とに多くの時
間を費やしているのが実状である。本発明では、能力ア
ップに必要な時間を短縮し、かつ高精度の認識率を実現
するために、輪郭情報の高次化による大分類とDPマッ
チングにより、手書きの変形を吸収することを基本にし
て詳細分類で2段の辞書の自動作成を行なう。
【0008】手書き文字の認識に際して、細線化方式に
よる構造解析的な手法もある。この細線化方式は図3
(A)に示すように、文字のセグメント処理などを可能
にするためにデータの扱い易さを求めたものであるが、
文字認識のための前処理(細線化)が必要であるといっ
た欠点があると共に、つぶれ文字やひげ雑音によるエラ
ー低減のために特殊な処理も多く、能力アップに要する
時間も長いと考えられる。これに対し、本発明では図3
(B)に示すような輪郭情報を用いており、つぶれやひ
げ雑音の影響の少ない輪郭情報を基本データに用いた特
徴抽出から辞書作成までを行なっている。
よる構造解析的な手法もある。この細線化方式は図3
(A)に示すように、文字のセグメント処理などを可能
にするためにデータの扱い易さを求めたものであるが、
文字認識のための前処理(細線化)が必要であるといっ
た欠点があると共に、つぶれ文字やひげ雑音によるエラ
ー低減のために特殊な処理も多く、能力アップに要する
時間も長いと考えられる。これに対し、本発明では図3
(B)に示すような輪郭情報を用いており、つぶれやひ
げ雑音の影響の少ない輪郭情報を基本データに用いた特
徴抽出から辞書作成までを行なっている。
【0009】
【実施例】図1は本発明の認識システムを機能ブロック
で示しており、認識対象文字を読取って輪郭情報の抽出
を図3(B)のように行ない、輪郭情報から変化点を抽
出し形状要素コードの抽出を行なう。次に、抽出された
形状要素コードから形状コードi〜nを作成するが、本
発明ではこれを大分類と称する。このような大分類の
後、作成された形状コードi〜nについて詳細分類を行
なう。形状コードi〜nは文字に対応するコードのこと
であり、このコードで表わされる文字カテゴリーは複数
個存在することも多い。そして、形状コード毎に各カテ
ゴリーに分類するための辞書が存在し、辞書の作成は学
習によって行なう。詳細分類はDPマッチングによって
行ない、辞書作成時においてもDPマッチングによる距
離計算を用いて辞書作成を行なう。詳細に関しては後述
する。
で示しており、認識対象文字を読取って輪郭情報の抽出
を図3(B)のように行ない、輪郭情報から変化点を抽
出し形状要素コードの抽出を行なう。次に、抽出された
形状要素コードから形状コードi〜nを作成するが、本
発明ではこれを大分類と称する。このような大分類の
後、作成された形状コードi〜nについて詳細分類を行
なう。形状コードi〜nは文字に対応するコードのこと
であり、このコードで表わされる文字カテゴリーは複数
個存在することも多い。そして、形状コード毎に各カテ
ゴリーに分類するための辞書が存在し、辞書の作成は学
習によって行なう。詳細分類はDPマッチングによって
行ない、辞書作成時においてもDPマッチングによる距
離計算を用いて辞書作成を行なう。詳細に関しては後述
する。
【0010】次に、大分類における輪郭情報の高次化に
ついて説明する。先ず図4(A)に示す輪郭画像につい
て、同図(B)に示すようにnドットピッチの点座標を
求め、これら点座標の各ドット間を同図(C)に示すよ
うに直線で結線する。そして、隣接した3点毎に、隣接
する線分の角度差がm度(例えば15度)以上になる点
を変化点として求める。この場合、凹の変化点を○と
し、凸の変化点を●として、図4(E)に示す如く分類
する。
ついて説明する。先ず図4(A)に示す輪郭画像につい
て、同図(B)に示すようにnドットピッチの点座標を
求め、これら点座標の各ドット間を同図(C)に示すよ
うに直線で結線する。そして、隣接した3点毎に、隣接
する線分の角度差がm度(例えば15度)以上になる点
を変化点として求める。この場合、凹の変化点を○と
し、凸の変化点を●として、図4(E)に示す如く分類
する。
【0011】次に、上述の如くして求めた変化点に基づ
いて、形状要素コードの抽出を行なう。変化点の中で、
凹の変化点を挟む2つの凸の変化点で構成される形状に
よりV型とU型に分類し、更に上下左右の方向も含め図
5(B)のように8個の形状要素コード1〜8に分類す
る。この場合、2つの凸点の間に1つの凹点が存在する
か、2つの凹点が連続して存在するパターンがV型であ
り、2つの凸点の間に2つ以上の凹点が離れて存在する
パターンがU型である。図5(A)は“3”の輪郭情報
に対して、形状要素コード3及び4のV型と、形状要素
コード7のU型を示している。形状要素コードの抽出
後、形状の統一条件に従って形状コードを作成する。図
6(A)及び(B)に示すように追跡のスタート点ST
の違いにより、形状要素コードの出現順序が異なる場合
がある。出現順番をもとに形状コードを決めた場合、同
じ様な形状でも対応する形状コードが異なる。すなわ
ち、図6(A)の場合はスタート点STからP方向に追
跡するので、形状要素コードの出現順序は右向きV
(3)→左向きV(4)→下向きV(1)→下向きU
(5)となり、同図(C)のような形状コード“341
5”となる。これに対し、図6(B)の場合はスタート
点STからQ方向に追跡するので、形状要素コードの出
現順序は下向きU(5)→右向きV(3)→左向きV
(4)→下向きV(1)となり、同図(D)のような形
状コード“5341”となる。このため、形状順序の統
一条件を定め、形状コードの安定的な抽出を行なう必要
がある。本発明では、下向きU(5)、右向きU
(7)、下向きV(1)、右向きV(3)(図5(B)
参照)のいずれかの形状要素コードで、各重心から原点
(x=0,y=0)に最も近い形状要素コードを形状コ
ードの開始コードとしており、これを以下、統合条件と
する。図6(A)及び(B)の例では、上記統合条件よ
り下向きU(5)が最も原点に近いので、この下向きU
(5)が開始コードとなり、(A)及び(B)共に形状
コード“5341”となる。尚、本発明では、図7
(A)に示すようなループ数と、同図(B)に示すよう
なブロック数とを最後のコードに2桁付加し、図6
(A)及び(B)に関してはループ数が1で、ブロック
数が1であるので、形状コードを“534111”とす
る。ループ数は内部ループを含む閉ループ数であり、ブ
ロック数は内部ループを含まない閉ループ数である。
いて、形状要素コードの抽出を行なう。変化点の中で、
凹の変化点を挟む2つの凸の変化点で構成される形状に
よりV型とU型に分類し、更に上下左右の方向も含め図
5(B)のように8個の形状要素コード1〜8に分類す
る。この場合、2つの凸点の間に1つの凹点が存在する
か、2つの凹点が連続して存在するパターンがV型であ
り、2つの凸点の間に2つ以上の凹点が離れて存在する
パターンがU型である。図5(A)は“3”の輪郭情報
に対して、形状要素コード3及び4のV型と、形状要素
コード7のU型を示している。形状要素コードの抽出
後、形状の統一条件に従って形状コードを作成する。図
6(A)及び(B)に示すように追跡のスタート点ST
の違いにより、形状要素コードの出現順序が異なる場合
がある。出現順番をもとに形状コードを決めた場合、同
じ様な形状でも対応する形状コードが異なる。すなわ
ち、図6(A)の場合はスタート点STからP方向に追
跡するので、形状要素コードの出現順序は右向きV
(3)→左向きV(4)→下向きV(1)→下向きU
(5)となり、同図(C)のような形状コード“341
5”となる。これに対し、図6(B)の場合はスタート
点STからQ方向に追跡するので、形状要素コードの出
現順序は下向きU(5)→右向きV(3)→左向きV
(4)→下向きV(1)となり、同図(D)のような形
状コード“5341”となる。このため、形状順序の統
一条件を定め、形状コードの安定的な抽出を行なう必要
がある。本発明では、下向きU(5)、右向きU
(7)、下向きV(1)、右向きV(3)(図5(B)
参照)のいずれかの形状要素コードで、各重心から原点
(x=0,y=0)に最も近い形状要素コードを形状コ
ードの開始コードとしており、これを以下、統合条件と
する。図6(A)及び(B)の例では、上記統合条件よ
り下向きU(5)が最も原点に近いので、この下向きU
(5)が開始コードとなり、(A)及び(B)共に形状
コード“5341”となる。尚、本発明では、図7
(A)に示すようなループ数と、同図(B)に示すよう
なブロック数とを最後のコードに2桁付加し、図6
(A)及び(B)に関してはループ数が1で、ブロック
数が1であるので、形状コードを“534111”とす
る。ループ数は内部ループを含む閉ループ数であり、ブ
ロック数は内部ループを含まない閉ループ数である。
【0012】上述のような形状コードの作成により、文
字は高次の特徴に置き換えられて大分類される。詳細分
類の役割は、上記大分類の形状コードに分類された文字
候補を一意のカテゴリーに決定することである。かかる
認識系を構成するために、人間が特徴関数並びにパラメ
ータを決めることは、認識対象字種が増加すると共に極
めて困難となる。このような問題を解決するために、本
発明ではパターンマッチング的な要素を取り入れ、2段
階に分けて辞書を自動的に作成する。
字は高次の特徴に置き換えられて大分類される。詳細分
類の役割は、上記大分類の形状コードに分類された文字
候補を一意のカテゴリーに決定することである。かかる
認識系を構成するために、人間が特徴関数並びにパラメ
ータを決めることは、認識対象字種が増加すると共に極
めて困難となる。このような問題を解決するために、本
発明ではパターンマッチング的な要素を取り入れ、2段
階に分けて辞書を自動的に作成する。
【0013】詳細分類では辞書とのマッチングにDPマ
ッチングを用いるが、文字をベクトル情報(2次元のベ
クトル列で、既知のスタート点からnドット毎のベクト
ル列)で表現する。図8(A)に示すように、一般的に
ベクトルAとBの距離Lとして考える場合、1−cos
2θ=sin2θを定義する。θ=0の場合は距離Lは
0と考えられるし、角度θが大きくなるに従ってsin
2θは増加する。しかし、図8(B)に示すようにθ=
πの位置で0となるが、この不合理を避けるために実距
離|A−B|を加算して距離Lを与えている。即ち、距
離Lは
ッチングを用いるが、文字をベクトル情報(2次元のベ
クトル列で、既知のスタート点からnドット毎のベクト
ル列)で表現する。図8(A)に示すように、一般的に
ベクトルAとBの距離Lとして考える場合、1−cos
2θ=sin2θを定義する。θ=0の場合は距離Lは
0と考えられるし、角度θが大きくなるに従ってsin
2θは増加する。しかし、図8(B)に示すようにθ=
πの位置で0となるが、この不合理を避けるために実距
離|A−B|を加算して距離Lを与えている。即ち、距
離Lは
【0014】
【数1】 L=(1−cos2θ)・k1+|A−B|・k2 ただし、k1及びk2は定数である。このように形状コ
ードで文字を分類することにより、(1)輪郭情報によ
りコード化されたカテゴリー内のデータではスタート点
が既知であり、安定して求めることができる、(2)大
分類後の処理であるため、全数マッチングが回避され
る、といった利点がある。
ードで文字を分類することにより、(1)輪郭情報によ
りコード化されたカテゴリー内のデータではスタート点
が既知であり、安定して求めることができる、(2)大
分類後の処理であるため、全数マッチングが回避され
る、といった利点がある。
【0015】文字のベクトル列の表現は図9(A),
(B)に示すようになり、例えば図9(A)は、スター
ト点からのnドットピッチの点座標に対する辺a1,a
2,…,anをそれぞれベクトルで表わし、
(B)に示すようになり、例えば図9(A)は、スター
ト点からのnドットピッチの点座標に対する辺a1,a
2,…,anをそれぞれベクトルで表わし、
【数2】 と表現する。同様に、図9(B)に示す文字のベクトル
列は、
列は、
【数3】 と表現する。尚、各文字のスタート点は、図10に示す
●印のように、各形状要素コードによって予め定められ
た点を用いる。
●印のように、各形状要素コードによって予め定められ
た点を用いる。
【0016】図11はDPマッチングの様子を示してお
り、入力パターンのベクトル
り、入力パターンのベクトル
【数4】 を予め格納されている標準パターンのベクトル
【数5】 とマッチングさせるが、格子点(1,1)から格子点
(n,m)までの距離が最小となるような経路を求め
る。その場合、マッチング窓と称されるj=i+rとj
=i−rとの間で行なわれ、歪み関数の条件は、(1)
単調増加(順番の入れ替わりがない)、(2)極端に歪
んでいない(マッチング窓を設ける)、である。また、
DPマッチングでの漸化式は、初期条件をg(1,1)
=d(1,1)として、
(n,m)までの距離が最小となるような経路を求め
る。その場合、マッチング窓と称されるj=i+rとj
=i−rとの間で行なわれ、歪み関数の条件は、(1)
単調増加(順番の入れ替わりがない)、(2)極端に歪
んでいない(マッチング窓を設ける)、である。また、
DPマッチングでの漸化式は、初期条件をg(1,1)
=d(1,1)として、
【数6】 g(i,j)=min{g(i,j−1)+d(i,j),g(i−1 ,j−1)+2d(i,j),g(i−1,j) +d(i,j)} で与えられる。
【0017】学習データが大分類により各形状コードに
分類された後、それぞれの形状コード内のカテゴリーに
対して辞書を作成する。学習は大きく分けて2段階に分
かれる。1つは、カテゴリー内だけで標準パターンを決
定する第1層の学習であり、もう1つは、第1層のみで
は判断できないパターンのみを標準パターンとして決定
する第2層の学習である。ここでは例として、形状コー
ドAの中にカテゴリー“1”と“2”が存在する場合、
この“1”と“2”を分類すべき辞書を作成する場合を
説明する。
分類された後、それぞれの形状コード内のカテゴリーに
対して辞書を作成する。学習は大きく分けて2段階に分
かれる。1つは、カテゴリー内だけで標準パターンを決
定する第1層の学習であり、もう1つは、第1層のみで
は判断できないパターンのみを標準パターンとして決定
する第2層の学習である。ここでは例として、形状コー
ドAの中にカテゴリー“1”と“2”が存在する場合、
この“1”と“2”を分類すべき辞書を作成する場合を
説明する。
【0018】図12は第1層の学習の様子を示してお
り、“1”であると分っているデータ10の中のデータ
を順次辞書11とDPマッチング12を行ない、その距
離がスレッショルドTH1よりも大きいか否かを判定
(13)する。そして、距離がスレッショルドTH1よ
りも大きいデータだけを登録(14)し、辞書11に加
える。尚、登録14はベクトルデータで行なう。カテゴ
リー“2”に関しても同様である。もう少し詳細に説明
すると、一番最初はスレッショルドTH1のみが与えら
れており、第1層の“1”の辞書11の中身は空であ
り、“1”であると分っているデータ10の中のデータ
を先ず1個取出して辞書11とDPマッチングを行なう
と、当然距離は定義出来ないので、このデータのベクト
ル列を辞書11に標準パターンとして登録する。次に、
データ10の中の2個目のデータを取出して辞書11と
DPマッチングを行ない、既に登録された1個目のベク
トル列との距離がスレッショルドTH1より小さければ
新たに辞書11には登録しないが、もし1個目のベクト
ル列との距離がスレッショルドTH1より大きければ、
この2個目のデータのベクトル列も辞書11に標準パタ
ーンとして登録する。こうして1個目と2個目のデータ
のベクトル列をそれぞれ登録した場合に、次の3個目の
データは、辞書11の中の全ての標準パターン(今の例
では1個目のベクトル列と2個目のベクトル列の両方)
とDPマッチングを行ない、もし各標準パターンとの距
離が1つでもスレッショルドTH1より小さければ登録
はしない(辞書11に既に登録されているある1つの標
準パターンで、そのデータは表わされていることになる
からである)。辞書11の中に登録されている全ての標
準パターンとの距離が全てスレッショルドTH1より大
きければ、いい換えれば各標準パターンとの距離の最小
値(最小距離)がスレッショルドTH1より大きけれ
ば、新たな標準パターンとして辞書11にそのデータの
ベクトル列を追加登録する。
り、“1”であると分っているデータ10の中のデータ
を順次辞書11とDPマッチング12を行ない、その距
離がスレッショルドTH1よりも大きいか否かを判定
(13)する。そして、距離がスレッショルドTH1よ
りも大きいデータだけを登録(14)し、辞書11に加
える。尚、登録14はベクトルデータで行なう。カテゴ
リー“2”に関しても同様である。もう少し詳細に説明
すると、一番最初はスレッショルドTH1のみが与えら
れており、第1層の“1”の辞書11の中身は空であ
り、“1”であると分っているデータ10の中のデータ
を先ず1個取出して辞書11とDPマッチングを行なう
と、当然距離は定義出来ないので、このデータのベクト
ル列を辞書11に標準パターンとして登録する。次に、
データ10の中の2個目のデータを取出して辞書11と
DPマッチングを行ない、既に登録された1個目のベク
トル列との距離がスレッショルドTH1より小さければ
新たに辞書11には登録しないが、もし1個目のベクト
ル列との距離がスレッショルドTH1より大きければ、
この2個目のデータのベクトル列も辞書11に標準パタ
ーンとして登録する。こうして1個目と2個目のデータ
のベクトル列をそれぞれ登録した場合に、次の3個目の
データは、辞書11の中の全ての標準パターン(今の例
では1個目のベクトル列と2個目のベクトル列の両方)
とDPマッチングを行ない、もし各標準パターンとの距
離が1つでもスレッショルドTH1より小さければ登録
はしない(辞書11に既に登録されているある1つの標
準パターンで、そのデータは表わされていることになる
からである)。辞書11の中に登録されている全ての標
準パターンとの距離が全てスレッショルドTH1より大
きければ、いい換えれば各標準パターンとの距離の最小
値(最小距離)がスレッショルドTH1より大きけれ
ば、新たな標準パターンとして辞書11にそのデータの
ベクトル列を追加登録する。
【0019】図14は第1層の学習を一般化したフロー
チャートであり、カテゴリーiに属するデータを順次そ
のカテゴリーiの標準パターン(辞書)とDPマッチン
グを行ない(ステップS10)、DPマッチングによる
距離計算で求められた最小距離がスレッショルドTH1
よりも大きいか否かを判断し(ステップS11)、スレ
ッショルドTH1を越えた文字データのベクトル列を新
しいパターンとしてカテゴリーiの標準パターンに加え
る(ステップS12)。上記動作をカテゴリーiからn
まで順次行なう。この結果、カテゴリーi〜nに含まれ
るデータは、すべてそれぞれの標準パターンとの距離が
スレッショルドTH1以下となる。
チャートであり、カテゴリーiに属するデータを順次そ
のカテゴリーiの標準パターン(辞書)とDPマッチン
グを行ない(ステップS10)、DPマッチングによる
距離計算で求められた最小距離がスレッショルドTH1
よりも大きいか否かを判断し(ステップS11)、スレ
ッショルドTH1を越えた文字データのベクトル列を新
しいパターンとしてカテゴリーiの標準パターンに加え
る(ステップS12)。上記動作をカテゴリーiからn
まで順次行なう。この結果、カテゴリーi〜nに含まれ
るデータは、すべてそれぞれの標準パターンとの距離が
スレッショルドTH1以下となる。
【0020】図13は第2層の学習の様子を示してお
り、第1層での学習のときと同じデータを用い、第1層
で作成された辞書で認識したときに文字が競合する場
合、つまり1つのデータが2つの辞書の標準パターンに
似ている場合に、その競合を解消するために第2層の辞
書を作成する様子を示している。先ず、“1”であると
分っているデータ30(図12のデータ10と全く同じ
データ)の中のデータを1個取出し、“1”の辞書31
の各標準パターンとDPマッチングを行なうと共に、同
じ形状コードの他の辞書である“2”の辞書34の各標
準パターンともDPマッチングを行ない、各々の距離を
求める。“1”の辞書31の各標準パターンとの距離の
最小値(最小距離)は当然スレッショルドTH1より小
さいが(そうなるように第1層の辞書を作成しているの
で)、“2”の辞書34の各標準パターンとの距離の最
小値(最小距離)が、もしスレッショルドTH1より小
さければそのデータは“2”とも判断されることにな
り、競合が生じたことになる。この場合には、スレッシ
ョルドTH1より小さい値のスレッショルドTH2が、
予め設定された第2層の辞書と照合することになるが、
“1”の第2層の辞書35にはまだ標準パターンが1つ
も登録されていないので、第2層の辞書35とDPマッ
チングを行なうと、当然距離は定義出来ないので、この
“1”のデータのベクトル列が第2層の“1”の辞書3
5に登録される。次に、“1”のデータ30の中の2つ
目のデータを取出して同様にDPマッチングを行ない、
もし競合があれば、第2層の“1”の辞書35の標準パ
ターンとDPマッチングを行ない、距離の最小値(今は
標準パターンはまだ1個しかないので、距離の値は1個
しかないが)がスレッショルドTH2より大きければ、
そのデータのベクトル列を第2層の“1”の辞書35に
登録する。このように、“1”のデータ30の中の全て
のデータについて順次行なって、第2層の“1”の辞書
35を自動作成する。全く同様にして、“2”と分って
いるデータ33(図12のデータ20と全く同一)の個
々のデータについても、“1”と競合が生じて第2層の
“2”の辞書36との距離がスレッショルドTH2より
大きければ、第2層の“2”の辞書36に順次自動登録
していく。
り、第1層での学習のときと同じデータを用い、第1層
で作成された辞書で認識したときに文字が競合する場
合、つまり1つのデータが2つの辞書の標準パターンに
似ている場合に、その競合を解消するために第2層の辞
書を作成する様子を示している。先ず、“1”であると
分っているデータ30(図12のデータ10と全く同じ
データ)の中のデータを1個取出し、“1”の辞書31
の各標準パターンとDPマッチングを行なうと共に、同
じ形状コードの他の辞書である“2”の辞書34の各標
準パターンともDPマッチングを行ない、各々の距離を
求める。“1”の辞書31の各標準パターンとの距離の
最小値(最小距離)は当然スレッショルドTH1より小
さいが(そうなるように第1層の辞書を作成しているの
で)、“2”の辞書34の各標準パターンとの距離の最
小値(最小距離)が、もしスレッショルドTH1より小
さければそのデータは“2”とも判断されることにな
り、競合が生じたことになる。この場合には、スレッシ
ョルドTH1より小さい値のスレッショルドTH2が、
予め設定された第2層の辞書と照合することになるが、
“1”の第2層の辞書35にはまだ標準パターンが1つ
も登録されていないので、第2層の辞書35とDPマッ
チングを行なうと、当然距離は定義出来ないので、この
“1”のデータのベクトル列が第2層の“1”の辞書3
5に登録される。次に、“1”のデータ30の中の2つ
目のデータを取出して同様にDPマッチングを行ない、
もし競合があれば、第2層の“1”の辞書35の標準パ
ターンとDPマッチングを行ない、距離の最小値(今は
標準パターンはまだ1個しかないので、距離の値は1個
しかないが)がスレッショルドTH2より大きければ、
そのデータのベクトル列を第2層の“1”の辞書35に
登録する。このように、“1”のデータ30の中の全て
のデータについて順次行なって、第2層の“1”の辞書
35を自動作成する。全く同様にして、“2”と分って
いるデータ33(図12のデータ20と全く同一)の個
々のデータについても、“1”と競合が生じて第2層の
“2”の辞書36との距離がスレッショルドTH2より
大きければ、第2層の“2”の辞書36に順次自動登録
していく。
【0021】図15は第2層の学習を一般化したフロー
チャートであり、カテゴリーiに属するデータから順次
第1層の標準パターン辞書i〜nまで全てについて、D
Pマッチングによる距離計算を行なう(ステップS2
0)。そして、求められた最小距離がスレッショルドT
H1より小さくなるカテゴリーが複数個存在するか否か
を判定し(ステップS21)、複数個存在する場合に
は、第2層目のカテゴリーiの標準パターンとのDPマ
ッチングを行なう(ステップS22)。その最小距離が
スレッショルドTH2よりも大きいか否かを判定し(ス
テップS23)、大きいものが存在すればその文字のベ
クトル列をカテゴリーiの標準パターンに登録する(ス
テップS24)。上記動作をカテゴリーi〜nについて
行なう。ただし、スレッショルドTH1及びスレッショ
ルドTH2は、TH1>TH2なる正の定数である。こ
の結果、第1層で分離できない文字は2層目で、更に小
さい距離TH2以内の標準パターンをもつ辞書に登録さ
れていく。
チャートであり、カテゴリーiに属するデータから順次
第1層の標準パターン辞書i〜nまで全てについて、D
Pマッチングによる距離計算を行なう(ステップS2
0)。そして、求められた最小距離がスレッショルドT
H1より小さくなるカテゴリーが複数個存在するか否か
を判定し(ステップS21)、複数個存在する場合に
は、第2層目のカテゴリーiの標準パターンとのDPマ
ッチングを行なう(ステップS22)。その最小距離が
スレッショルドTH2よりも大きいか否かを判定し(ス
テップS23)、大きいものが存在すればその文字のベ
クトル列をカテゴリーiの標準パターンに登録する(ス
テップS24)。上記動作をカテゴリーi〜nについて
行なう。ただし、スレッショルドTH1及びスレッショ
ルドTH2は、TH1>TH2なる正の定数である。こ
の結果、第1層で分離できない文字は2層目で、更に小
さい距離TH2以内の標準パターンをもつ辞書に登録さ
れていく。
【0022】このようにして作成された辞書を用いて、
文字を認識させるフローを図2に示す。先ずある形状コ
ードに分類された文字が、未知サンプルとして入力され
て来る(ステップS1)。今、この形状コードにはカテ
ゴリーi〜nが存在していると考える。そして、入力さ
れた文字のベクトルデータと、第1層で用意されたカテ
ゴリーi〜nの辞書を用いてDPマッチングで距離計算
を行なう(ステップS2)。ここで、計算された距離の
うち、最小距離がスレッショルドTH1より小さくなる
カデゴリーが1つだけであれば、その結果を出力し(ス
テップS3)、複数のカテゴリーが有ればステップS4
に進む。ステップS4ではカテゴリーi〜nの第2層で
の辞書を用いて、DPマッチングにより距離計算を行な
う。その結果、スレッショルドTH2より大きいTH3
なるスレッショルド内で最小距離のカテゴリーを結果と
して出力する(ただし、第2候補も共にスレッショルド
TH2以下になるときは除く)。従って、第1及び第2
候補とのカテゴリー距離が共にスレッショルドTH2以
下、又は同距離の場合のみ判定出来ないとしてリジェク
トする。尚、スレッショルドTH3は、TH2<TH3
<TH1の関係を有する定数である。
文字を認識させるフローを図2に示す。先ずある形状コ
ードに分類された文字が、未知サンプルとして入力され
て来る(ステップS1)。今、この形状コードにはカテ
ゴリーi〜nが存在していると考える。そして、入力さ
れた文字のベクトルデータと、第1層で用意されたカテ
ゴリーi〜nの辞書を用いてDPマッチングで距離計算
を行なう(ステップS2)。ここで、計算された距離の
うち、最小距離がスレッショルドTH1より小さくなる
カデゴリーが1つだけであれば、その結果を出力し(ス
テップS3)、複数のカテゴリーが有ればステップS4
に進む。ステップS4ではカテゴリーi〜nの第2層で
の辞書を用いて、DPマッチングにより距離計算を行な
う。その結果、スレッショルドTH2より大きいTH3
なるスレッショルド内で最小距離のカテゴリーを結果と
して出力する(ただし、第2候補も共にスレッショルド
TH2以下になるときは除く)。従って、第1及び第2
候補とのカテゴリー距離が共にスレッショルドTH2以
下、又は同距離の場合のみ判定出来ないとしてリジェク
トする。尚、スレッショルドTH3は、TH2<TH3
<TH1の関係を有する定数である。
【0023】
【発明の効果】以上のように本発明によれば、つぶれた
データでも1つのパターンとして辞書に登録可能であ
り、細線化処理が不要なために輪郭追跡もソフト対応で
十分である。また、エラー率が極めて低く認識能力も高
く、辞書の作成はデータさえ揃えば自動的に行なえ、個
人特有の辞書も作成できる。更に、辞書のマッチング処
理の並列化により高速化が可能である。
データでも1つのパターンとして辞書に登録可能であ
り、細線化処理が不要なために輪郭追跡もソフト対応で
十分である。また、エラー率が極めて低く認識能力も高
く、辞書の作成はデータさえ揃えば自動的に行なえ、個
人特有の辞書も作成できる。更に、辞書のマッチング処
理の並列化により高速化が可能である。
【図1】本発明の認識システムの機能ブロック図であ
る。
る。
【図2】本発明の認識時のフローチャートである。
【図3】文字情報の細線化と輪郭情報を説明するための
図である。
図である。
【図4】輪郭情報についての変化点の抽出を説明するた
めの図である。
めの図である。
【図5】形状要素コードの抽出を説明するための図であ
る。
る。
【図6】形状コードの作成を説明するための図である。
【図7】ループ数とブロック数を説明するための図であ
る。
る。
【図8】本発明による距離の計算をするための図であ
る。
る。
【図9】文字のベクトル列表現を説明するための図であ
る。
る。
【図10】文字ベクトルを作成するときのスタート点を
各形状要素コード毎に示す図である。
各形状要素コード毎に示す図である。
【図11】DPマッチングを説明するための図である。
【図12】第1層の学習(カテゴリー毎の辞書登録)を
説明するための図である。
説明するための図である。
【図13】第2層の学習(カテゴリー間の競合解消)を
説明するための図である。
説明するための図である。
【図14】第1層の学習例を示すフローチャートであ
る。
る。
【図15】第2層の学習例を示すフローチャートであ
る。
る。
10、20、30、33 データ 12、22、37 DPマッチング 11、21、31、34、35、36 辞書
Claims (3)
- 【請求項1】 帳票上に記録された文字を光学的に読取
り、読取画像から前記文字の輪郭線を抽出し、この輪郭
線の屈折情報により前記文字を複数の形状要素コードで
符号化して形状コードを作成し、予め登録された基準文
字の形状コードと照合して前記文字を認識する文字認識
方法において、前記複数の形状要素コードのうち特定の
複数の形状要素コードの重心を求め、読取画像の原点に
一番近い前記特定の形状要素コードを形状コードの開始
コードと決定して、形状コードを作成した後に基準文字
の形状コードと照合するようにしたことを特徴とする文
字認識方法。 - 【請求項2】 認識しようとする文字を多数読取り、学
習により基準文字のベクトル列を辞書として登録するよ
うにした文字認識における辞書作成方法において、文字
を光学的に読取り、読取画像から前記文字の輪郭線を抽
出し、この輪郭線の屈折情報により前記文字を複数の形
状要素コードで符号化し、前記複数の形状要素コードの
うち特定の複数の形状要素コードの重心を求め、読取画
像の原点に一番近い前記特定の形状要素コードを形状コ
ードの開始コードと決定して形状コードを作成し、この
形状コードで表わされる文字のベクトル列を辞書のベク
トル列とDPマッチングして距離が所定値を越えた場合
の読取画像の形状コードのベクトル列を辞書に追加登録
するようにしたことを特徴とする文字認識における辞書
作成方法。 - 【請求項3】請求項2で作成された辞書により、予め用
意された認識しようとする文字を読取ってDPマッチン
グしたとき、2種類以上の文字の辞書と競合が生じるこ
とを避けるための第2の辞書を設け、請求項2で作成し
た読取画像の形状コードで表わされる文字のベクトル列
を前記第2の辞書の形状コード毎に用意されたベクトル
列群とDPマッチングして、距離が前記所定値より小さ
い第2の値を越えた場合の読取画像の形状コードで表わ
される文字のベクトル列を前記第2の辞書に追加登録す
るようにしたことを特徴とする文字認識における辞書作
成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4087815A JPH05258116A (ja) | 1992-03-11 | 1992-03-11 | 文字認識方法及び文字認識における辞書作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4087815A JPH05258116A (ja) | 1992-03-11 | 1992-03-11 | 文字認識方法及び文字認識における辞書作成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05258116A true JPH05258116A (ja) | 1993-10-08 |
Family
ID=13925473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4087815A Pending JPH05258116A (ja) | 1992-03-11 | 1992-03-11 | 文字認識方法及び文字認識における辞書作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05258116A (ja) |
-
1992
- 1992-03-11 JP JP4087815A patent/JPH05258116A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Connell et al. | Template-based online character recognition | |
Denker et al. | Neural network recognizer for hand-written zip code digits | |
Suen et al. | Building a new generation of handwriting recognition systems | |
US5542006A (en) | Neural network based character position detector for use in optical character recognition | |
EP0564827A2 (en) | A post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
Kim et al. | Bankcheck recognition using cross validation between legal and courtesy amounts | |
Pham et al. | Offline handwritten signature verification using local and global features | |
Ali et al. | A novel features and classifiers fusion technique for recognition of Arabic handwritten character script | |
Palacios et al. | Handwritten bank check recognition of courtesy amounts | |
Xiu et al. | Offline handwritten arabic character segmentation with probabilistic model | |
JP3095069B2 (ja) | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 | |
Magrina | Convolution Neural Network based Ancient Tamil Character Recognition from Epigraphical Inscriptions | |
Halder et al. | Individuality of isolated Bangla numerals | |
Lamba et al. | Handwriting Recognition System-A Review | |
Saritha et al. | An efficient hidden markov model for offline handwritten numeral recognition | |
Muñoz | Mathematical expression recognition based on probabilistic grammars | |
EL ATILLAH et al. | Classification of Arabic alphabets using a combination of a convolutional neural network and the morphological gradient method | |
JPH05258116A (ja) | 文字認識方法及び文字認識における辞書作成方法 | |
JPH11328309A (ja) | 光学的文字読み取り方法とその装置 | |
AlKhateeb et al. | Interactive knowledge discovery for baseline estimation and word segmentation in handwritten Arabic text | |
Palacios et al. | Feedback-based architecture for reading courtesy amounts on checks | |
Ziaratban et al. | Use of legal amount to confirm or correct the courtesy amount on Farsi bank checks | |
Prasad | English Numerals Recognition System Using Novel Curve Coding | |
Aktaruzzaman et al. | Improved low-cost recognition system for handwritten Bengali numerals | |
Senior et al. | O-line cursive handwriting recognition using recurrent neural networks |