JP2734387B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP2734387B2 JP2734387B2 JP6327715A JP32771594A JP2734387B2 JP 2734387 B2 JP2734387 B2 JP 2734387B2 JP 6327715 A JP6327715 A JP 6327715A JP 32771594 A JP32771594 A JP 32771594A JP 2734387 B2 JP2734387 B2 JP 2734387B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- unit
- extracted
- specific
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Description
出して文字を切り出し認識する文字認識装置に係わり、
特に文字ごとに記入枠が存在しない自由書式で書かれた
文字を認識するのに好適な文字認識装置に関する。
に、記入枠が存在しない自由書式で書いた文字列を認識
することの可能な文字認識装置では、まず文字列を認識
し、次に文字列から各文字を切り出して、この後にそれ
ぞれの文字の認識を行うようになっていることが多い。
この種の文字認識装置では、文字の切り出しと文字認識
という2つの処理を直列に行って、その結果を出力する
ようにしている。
構成の概要を表わしたものである。この装置は、スキャ
ナ等の画像入力部11を備えている。画像入力部11か
ら入力された入力文字列画像は、画像メモリ12に格納
されるようになっている。画像メモリ12から読み出さ
れた入力文字列画像は、認識処理部13の文字切り出し
部14に送られて、文字の切り出しが行われる。切り出
された文字画像は正規化部15に送られる。正規化部1
5では、同じ文字種同士ではなるべく同じ特徴が現わ
れ、異なる文字種では異なる特徴が表われるように前処
理を施し、特徴抽出部16にこれを送出する。
徴群に変換する。例えば特開昭61−285588号公
報では、文字を複数の線分の集合と考えて、線分の傾
き、長さ、交点、折れ角、太さを特徴として抽出してい
る。文字認識部17は特徴抽出部16から特徴群を受け
取り、予め用意された辞書特徴とのマッチングをとる。
そして、特徴間の距離の小さい順に幾つかの認識文字候
補を挙げて認識結果出力部18に送出するようにしてい
る。
認識装置では、文字の切り出しと認識というそれぞれ独
立した処理が逐次行われるようになっている。したがっ
て、各処理で生じた誤りが蓄積されながら処理が進行す
ることになり、最終結果における文字認識の誤りを低く
抑えることは困難である。特に、郵便物等の住所表示を
認識する際には、漢数字の“一”、“二”、“三”や番
地を区切るためのハイフン“|”、“−”あるいは
“ノ”等からなる単純ストロークで構成される文字が頻
繁に使用される。これら単純ストロークで構成される文
字から成る文字列については、文字の切り出し方によっ
ていかようにも認識される可能性があり、文字認識を誤
る可能性が高い。
り出しを行った場合の幾つかの例を示したものである。
同図(a)、(b)、(c)では共に枠19で文字の切
り出しを行った結果、漢数字の“三”が認識されている
が、このうちの同図(b)が正しい認識であり、同図
(a)は本来“二一”と、また同図(c)は本来“一
二”と判読されるべきものである。このように文字の切
り出しの仕方によっては文字認識を誤る可能性が高く、
しかも書き手によってこれらの変形の度合いが大きい。
したがって、一般のパターンマッチング的な認識手法を
用いたとしても誤認する確率が高い。このため、このよ
うな漢数字等の文字認識の誤りを減少させることが大き
な課題となっている。
構成される文字から成る文字列に対しても高精度かつ軽
処理で切り出しを行うことのできる文字認識装置を提供
することにある。
は、(イ)文書画像から文字列を検出する文字列検出手
段と、(ロ)検出した文字列の文字列画像を格納する画
像記憶手段と、(ハ)画像記憶手段に格納された文字列
画像から文字として認識すべき認識対象を抽出する文字
切り出し手段と、(ニ)この文字切り出し手段によって
切り出された個々の認識対象に対して文字認識を行う文
字認識手段と、(ホ)この文字認識手段によって認識さ
れた文字のうち単純ストロークで構成される特定の文字
を抽出する特定文字抽出手段と、(ヘ)この特定文字抽
出手段によって文字が抽出されたときその領域に対して
文字として認識すべき認識対象を再度抽出する再文字切
り出し手段と、(ト)特定文字抽出手段によって抽出さ
れた文字領域に対して再度認識を行う際、この領域中に
存在する文字パターン内に存在する単純ストロークの個
々の位置、長さおよび傾きを用いることで再文字切り出
し手段によって切り出された個々の認識対象に対して文
字認識を再度行う特定文字検証手段とを文字認識装置に
具備させる。
識手段によって文字認識を行ったとき、例えば漢数字の
“一”、“二”、“三”やハイフン“|”、“−”ある
いは“ノ”等の単純ストロークで構成される予め定めた
特定の文字を抽出し、これが抽出された場合にはその抽
出領域から認識対象を再度抽出し、これら認識を誤る可
能性の高い文字列について文字認識を再度行うことにし
て、単純ストロークで構成される文字から成る文字列に
ついても精度の高い処理を行えるようにしている。加え
て請求項1記載の発明では、上記文字認識装置におい
て、特定文字検証手段が文字列画像における前記した単
純ストロークで構成される文字が出現する領域に対して
再度文字認識を行う際、この領域中に存在する文字パタ
ーン内に存在する単純ストロークの個々の位置、長さお
よび傾きを用いることを特徴とするものである。これに
より、例えばストロークの両端を結ぶ線分の傾きからハ
イフン“|”、“−”あるいは“ノ”を決定することが
できる。
記載の文字認識装置において、特定文字検証手段が前記
した領域に対して、再度認識を行う際、この領域中に存
在する文字パターン内に存在する単純ストロークの個々
の位置、長さおよび傾きを変換した隣接したストローク
間の距離、長さおよび傾きを求めてこれらを用いること
を特徴とするものである。これにより、例えば隣り合っ
た未決定の2つの線分の間隔やこれら線分の長さや長さ
の比を計算して新しい特徴量とすることができる。これ
らの特徴量を用いることで、2つの線分が別の文字で構
成するかの識別が可能になる。
記載の文字認識装置において、特定文字検証手段が隣接
したストローク間の距離、長さおよび傾きを用いる際、
これらの特徴量を使用した文字の識別境界を表わす識別
面のパラメータを予め与えられたサンプルデータにより
決定することを特徴とするものである。
記載の文字認識装置において、特定文字抽出手段によっ
て抽出されるべき文字が抽出されるときその検知を行う
認識対象選択手段が具備されていることを特徴とするも
のである。
装置の機能的な構成を表わしたものである。図10と同
一部分には同一の符号を付している。本実施例の文字認
識装置の認識処理部21では、文字認識部17の認識結
果を認識対象選択部22に送って、ここで所定の認識対
象に対しては漢数字検証部23で画像メモリ12に格納
されている入力文字列画像を用いた検証が行われる。こ
の結果は、CRTあるいは液晶ディスプレイ等の出力装
置で構成される認識結果出力部24に出力されるように
なっている。
部21は、図示しないCPU(中央処理装置)と、プロ
グラムや特徴抽出等のために必要な固定的なデータを格
納したROM(リード・オンリ・メモリ)と、このプロ
グラムを実行する際に必要な各種データを一時的に格納
する作業用メモリから構成されている。
11から入力された入力文字列画像は、画像メモリ12
に格納される。文字切り出し部14はこの文字列画像か
ら個別の文字画像を切り出し、正規化部15に送出す
る。切り出された画像は、正規化部15で大きさ揃え等
の前処理を施される。ここでは、例えば各々の文字パタ
ーンの外接枠の大きさが一定になるように正規化する。
特徴抽出部16は文字の認識に必要な特徴群にこれを変
換する。文字認識部17はこの特徴群を受け取り、予め
用意した辞書を用いて特徴のマッチングをとり、特徴間
の距離の小さい順に、幾つかの認識文字候補を出力す
る。
出力した認識文字候補が特定の文字であると推論される
文字領域を選択し、漢数字検証部23を起動させる。こ
こで特定の文字とは、本実施例では漢数字の“一”、
“二”、“三”やハイフン“|”、“−”あるいは
“ノ”等の単純ストロークで構成される予め定めた文字
をいう。
によって指定された領域の画像に対して、専用の切り出
し認識処理を行う。そして、認識文字候補を認識対象選
択部22に受け渡す。認識対象選択部22は文字認識部
17と漢数字検証部23の双方から受け取った認識文字
候補を合わせて認識結果出力部24に出力させることに
なる。このような文字認識装置には、文字認識部17の
後段に知識処理部を設け、単語知識による結果チェック
を行うようにしてもよい。
体化して示したものである。漢数字検証部23は、ラベ
リング部31と、この出力側に配置されたノイズ除去部
32と、この出力側に配置された端点検出部33と、こ
の出力側に配置された特徴抽出部34と、この出力側に
配置された切り出し認識部35と、特徴抽出部34に接
続された傾き測定部36、長さ測定部37および位置測
定部38から構成されている。
によって指定された画像領域から黒画素連結成分をすべ
て抽出して、これをノイズ除去部32に送出するように
なっている。ノイズ除去部32では、このうちの所定値
よりも小さい黒画素連結成分をノイズとして除去する。
そして、残った黒画素連結成分を端点検出部33に送出
する。
分(ストローク)を線分で近似して、その両端点の座標
を抽出する。抽出された座標は、線分情報として特徴抽
出部34に送られる。特徴抽出部34は、受け取った線
分情報を傾き測定部36、長さ測定部37および位置測
定部38に送る。これらの測定部36〜38では、3つ
の特徴量である線分の傾き、長さおよび位置を測定す
る。このようにして得られた特徴量は、切り出し認識部
35に送られる。切り出し認識部35では、特徴抽出部
34から受け取った3つの特徴量を用いて、文字列全体
の切り出しと認識を並列して行い、認識結果としての各
文字の文字コードを認識対象選択部22へ返すことにな
る。
ここでは、「二ノ三一」という文字が縦書きで記された
例を示している。ここでは縦軸をxで、また横軸をyで
表わしている。この例を用いて、図4に示す切り出し認
識部35の制御の様子を説明する。
傾きから特定文字の中の縦方向のハイフンおよびこれに
類する文字の決定を行う(ステップS101)。図5は
ストローク(線分)の一例を表わしたものである。スト
ロークの両端を結んだ線分41の長さを一般にLi で表
わし、傾きをSi で表わすものとする。切り出し認識部
35では与えられたそれぞれの線分の傾きSi を順に見
ていって、これが所定の値tS よりも大きい場合には、
垂直に近い線分であるので、ハイフン“|”あるいは片
仮名“ノ”のような所定の文字であると決定する。な
お、郵便物の仕分けに使用される文字認識装置では、番
地のセパレータとしてハイフン“|”や片仮名“ノ”が
使用されるので、ハイフン“|”と片仮名“ノ”を更に
区別して認識する必要はない。
を実際のストローク(線分)について例示したものであ
る。図6に示した線分41は傾きSi が値tS よりも大
きく、これはこの時点で縦方向のハイフンあるいはこれ
に類する所定の文字であると決定される。図7の場合に
は線分41の傾きSi が値tS よりも小さいので、漢数
字の“一”や横方向のハイフンあるいはこれに類する文
字であると決定することになる。また、ハイフン
“|”、“−”の場合には、例えば住所表示においてこ
れが連続することがないので、この前後に挟まれた線分
を“一”であると定める。
に取り出して、それらの間の距離D i と長さLi および
Li+1 の総合評価値Eを計算する(ステップS10
2)。図8は距離Di と長さLi およびLi+1 の関係を
示したものである。2つの線分41i 、41i+1 のx軸
方向の座標値の差xi+1 −xi が距離Di となる。総合
評価値Eの計算式は次の(1)式のようになる。 E=aDi +bLi +cLi / Li+1 ……(1) ここでa、b、cは定数係数である。
おける定数係数の学習方法の一例を説明する。予め与え
られた学習用文字列のサンプルデータから、それぞれの
線分位置および長さの特徴抽出を行ったデータセットを
用意する。このデータセットから、隣り合う2つの線分
41i 、41i+1 を取り出し(図8参照)、 (Di ,Li ,Li / Li+1 ) の計算を行う。これら2つの線分41i 、41i+1 が同
一文字に属するものであれば、これらの線分41i 、4
1i+1 に“統合”というカテゴリを付与する。
が異なる2つの文字にそれぞれ属するものであれば、こ
れらの線分41i 、41i+1 に“分割”というカテゴリ
を付与する。
を、“分割”に対して目標値“10”を設定して、重回
帰分析を適用する。すなわち、 (Di ,Li ,Li / Li+1 ,0または10) という4つの変数の組に対して、最も適合する超平面 aDi +bLi +cLi / Li+1 =D を求めることによって、定数係数a、b、cおよび所定
のしきい値dを決定することができる。
がしきい値dよりも大きいかどうかの判別が行われ(ス
テップS103)、大きいときには(Y)、第iの線分
41 i とこれに隣接する第(i+1)の線分41i+1 の
間に文字の分割を意味する分割フラグが立てられる(ス
テップS104)。これ以外の場合には(N)、2つの
線分41i 41i+1 が同じ文字に属するとして統合フラ
グを立て(ステップS105)、これらを同一グループ
として統合させる。
の済んでいない線分がある場合(ステップS105;
Y)、すなわち1つのグループ内に3本あるいはこれ以
上の線分が含まれているような場合には、ステップS1
02に戻って今まで説明したと同様の作業を確定した線
分と次の未決定の線分との間で行う(ステップS102
〜S106)。
終了したら(ステップS106;N)、同一文字に属す
る線分の数に応じて文字を決定して文字コードの付与を
行う(ステップS107)。例えば同一グループに含ま
れる線分の数がそれぞれ1本、2本、3本の場合には、
漢数字の“一”、“二”、“三”であることが決定さ
れ、対応する文字コードが付されることになる。
グループに含まれる線分の数が4つ以上の場合には、該
当する文字が存在しない。そこでこの場合には、総合評
価値Eの最も大きな2つの線分間に新たに分割フラグを
立てる。そして再度グループ分けと文字コードの決定を
行う。この作業は、すべてのグループ内の線分の数が3
本以下になるまで行われる。
絶対値|E−d|が所定値よりも小さな2線分を含んで
いるような文字が存在する場合には、その文字の認識結
果を認識不能であるとして棄却する(ステップS10
8)。
したものである。ここでは、文字認識部17の認識結果
から認識対象選択部22が漢数字検証部23の呼び出し
を行うか否かの決定方法を示したものである。文字認識
部17が認識結果として順位付けした1位候補、2位候
補、3位候補の3つの候補の文字コードを出力可能であ
るとし、それぞれの候補が出現する組み合わせをケース
〜ケースとして示している。図中で“○”で示した
ものは、1つの文字に対する認識候補が漢数字またはハ
イフン等の単純ストロークで構成される特定の文字であ
ることを示している。また、“−”で示したのはそれ以
外の認識候補であることを示している。
〜ケースの場合である。これは、1位候補が“○”で
あるか、2位候補と3位候補がともに“○”である場合
となる。
た論理で漢数字検証部23の呼び出しを行ったが、呼び
出し条件は各種設定することができる。例えば、文字認
識部17が複数の候補の文字コードに加えて、それぞれ
の候補文字コードに対する信頼度rj を出力するものと
する。この場合には、信頼度rj に対する候補文字コー
ドが漢数字またはハイフン等の単純ストロークで構成さ
れる特定の文字であるものの総和Σrj を計算する。そ
して、この総和Σrj が所定値よりも大きいときに漢数
字検証部23を呼び出すようにしてもよい。
4記載の発明によれば、文字認識手段によって文字認識
を行ったとき、例えば漢数字の“一”、“二”、“三”
やハイフン“|”、“−”あるいは“ノ”等の単純スト
ロークで構成される予め定めた特定の文字を抽出し、こ
れらが抽出された場合にはその抽出領域から認識対象を
再度抽出し、これら認識を誤る可能性の高い文字列につ
いて文字認識を再度行うことにした。したがって、処理
量をわずかに増加させるだけで、単純ストロークで構成
される文字から成る文字列について、極めて精度の高い
処理を行うことができる。
文字検証手段が文字列画像における前記した単純ストロ
ークで構成される文字が出現する領域に対して再度認識
を行う際、この領域中に存在する文字位置、長さおよび
傾きを用いることにしている。したがって、特に、パタ
ーン内に存在する単純ストロークの個々の住所表示に使
用されるハイフン“|”、“−”あるいは“ノ”のよう
なセパレータと漢数字を明確に区別することができ、郵
便物の仕分け等の文字認識に有効である。
識を行う領域に存在する文字パターン内に存在する単純
ストロークの個々の位置、長さおよび傾きを変換した隣
接したストローク間の距離、長さおよび傾きを求めてこ
れらを用いるので、文字の分離や統合の判別が容易にな
る。また、請求項3記載の発明では各システムに合った
文字識別パラメータを予め与えられたサンプルデータに
より決定することができ、効果を得ることができる。
的な構成を表わしたブロック図である。
を示すブロック図である。
クで構成される特定の文字列を例示した説明図である。
した流れ図である。
ある。
した平面図である。
した平面図である。
びLi+1 の関係を示した平面図である。
した説明図である。
ブロック図である。
た場合の幾つかの例を示した平面図である。
Claims (4)
- 【請求項1】 文書画像から文字列を検出する文字列検
出手段と、 検出した文字列の文字列画像を格納する画像記憶手段
と、 画像記憶手段に格納された文字列画像から文字として認
識すべき認識対象を抽出する文字切り出し手段と、 この文字切り出し手段によって切り出された個々の認識
対象に対して文字認識を行う文字認識手段と、 この文字認識手段によって認識された文字のうち単純ス
トロークで構成される特定の文字を抽出する特定文字抽
出手段と、 この特定文字抽出手段によって特定の文字が抽出された
ときその領域に対して文字として認識すべき認識対象を
再度抽出する再文字切り出し手段と、特定文字抽出手段によって抽出された文字領域に対して
再度認識を行う際、この領域中に存在する文字パターン
内に存在する単純ストロークの個々の位置、長さおよび
傾きを用いることで 再文字切り出し手段によって切り出
された個々の認識対象に対して文字認識を再度行う特定
文字検証手段とを具備することを特徴とする文字認識装
置。 - 【請求項2】 前記特定文字検証手段が前記領域に対し
て再度認識を行う際、この領域に存在する単純ストロー
クの個々の位置、長さおよび傾きを変換したストローク
間の距離、長さおよび傾きを求めてこれらを用いること
を特徴とする請求項1記載の文字認識装置。 - 【請求項3】 前記特定文字検証手段が前記隣接したス
トローク間の距離、長さおよび傾きを用いる際、これら
の特徴量を使用した文字の識別境界を表わす識別面のパ
ラメータを予め与えられたサンプルデータにより決定す
ることを特徴とする請求項2記載の文字認識装置。 - 【請求項4】 前記特定文字抽出手段によって抽出され
るべき文字が抽出されるときその領域の検知を行う認識
対象選択手段を具備することを特徴とする請求項1記載
の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6327715A JP2734387B2 (ja) | 1994-12-28 | 1994-12-28 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6327715A JP2734387B2 (ja) | 1994-12-28 | 1994-12-28 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08185481A JPH08185481A (ja) | 1996-07-16 |
JP2734387B2 true JP2734387B2 (ja) | 1998-03-30 |
Family
ID=18202186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6327715A Expired - Fee Related JP2734387B2 (ja) | 1994-12-28 | 1994-12-28 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2734387B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6628808B1 (en) * | 1999-07-28 | 2003-09-30 | Datacard Corporation | Apparatus and method for verifying a scanned image |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6111886A (ja) * | 1984-06-28 | 1986-01-20 | Mitsubishi Electric Corp | 文字認識方式 |
JPH0264882A (ja) * | 1988-08-31 | 1990-03-05 | Toshiba Corp | 住所読取装置 |
JP3105918B2 (ja) * | 1990-11-30 | 2000-11-06 | 株式会社東芝 | 文字認識装置、および文字認識方法 |
JPH06124366A (ja) * | 1992-10-14 | 1994-05-06 | Toshiba Corp | 住所読取装置 |
-
1994
- 1994-12-28 JP JP6327715A patent/JP2734387B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08185481A (ja) | 1996-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3842006B2 (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3453134B2 (ja) | 複数の記号ストリングの等価性を判定する方法 | |
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
US6249605B1 (en) | Key character extraction and lexicon reduction for cursive text recognition | |
JPH0772905B2 (ja) | 記号列の認識方法 | |
KR19980018029A (ko) | 문자 인식 장치 | |
JP3485020B2 (ja) | 文字認識方法及び装置ならびに記憶媒体 | |
US7512272B2 (en) | Method for optical recognition of a multi-language set of letters with diacritics | |
JP2000315247A (ja) | 文字認識装置 | |
JP3232991B2 (ja) | 文字読取り方法及び住所読取り方法 | |
JP2734387B2 (ja) | 文字認識装置 | |
JP3370934B2 (ja) | 光学的文字読み取り方法とその装置 | |
JP4194020B2 (ja) | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 | |
JPH06124366A (ja) | 住所読取装置 | |
JPH08255223A (ja) | 文字認識装置における類似文字判別方法 | |
JP3411796B2 (ja) | 文字認識装置 | |
JP3374762B2 (ja) | 文字認識方法及びその装置 | |
JP2001283157A (ja) | 単語認識方法および単語認識プログラム | |
JP2000331122A (ja) | 文字認識方法および装置 | |
JPH0632070B2 (ja) | 文字認識装置 | |
JP3444123B2 (ja) | 筆者識別装置及び筆者識別方法 | |
Suters et al. | Connected handwritten digit separation using external boundary curvature | |
JP2906758B2 (ja) | 文字読取装置 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
JP4805485B2 (ja) | 単語認識方法および単語認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080109 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090109 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100109 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110109 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110109 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 15 |
|
LAPS | Cancellation because of no payment of annual fees |