JPH0769934B2 - 文字抽出方法 - Google Patents

文字抽出方法

Info

Publication number
JPH0769934B2
JPH0769934B2 JP2084391A JP8439190A JPH0769934B2 JP H0769934 B2 JPH0769934 B2 JP H0769934B2 JP 2084391 A JP2084391 A JP 2084391A JP 8439190 A JP8439190 A JP 8439190A JP H0769934 B2 JPH0769934 B2 JP H0769934B2
Authority
JP
Japan
Prior art keywords
bar
character
block
mask
end points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2084391A
Other languages
English (en)
Other versions
JPH03282983A (ja
Inventor
博史 亀山
章司 三木
Original Assignee
グローリー工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グローリー工業株式会社 filed Critical グローリー工業株式会社
Priority to JP2084391A priority Critical patent/JPH0769934B2/ja
Priority to CA002037173A priority patent/CA2037173C/en
Priority to US07/665,230 priority patent/US5239592A/en
Priority to GB9104799A priority patent/GB2246229A/en
Priority to FR9103617A priority patent/FR2660463B1/fr
Publication of JPH03282983A publication Critical patent/JPH03282983A/ja
Publication of JPH0769934B2 publication Critical patent/JPH0769934B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 発明の目的; (産業上の利用分野) この発明は、小切手等に手書きされたバーを含む文字情
報から、バーを検出して取り除いて文字(数字)のみを
認識するための文字抽出方法に関する。
(従来の技術) 従来、バーを含む文字情報の文字認識に際して、この文
字情報からバーを検出する方法としては、第14図
(A),(B)に示す方法が知られている。この方法
は、第14(A)に示すように予め水平に直線のバー1が
基準線として書かれており、その上に文字2を書くよう
になっている。そして、このようにバー1の上側の書か
れた文字2を認識する際には、まず文字群の水平方向の
画素数の合計を垂直方向に向って各々係数し、垂直方向
に向って各々計数し、垂直方向にドット数のヒストグラ
ムを同図(B)のように作成し、その極端に多い部分を
基準線のバー1と判断するようになっている。そして、
この基準線を基準に上側の文字2を判別するようになっ
ている。
(発明が解決しようとする課題) しかし、上記バー検出方法では、基準線として予め直線
状のバーが水平方向に書かれているので、垂直方向に画
素数のヒストグラムを作成すれば必ず検出できるが、予
め基準線として直線状のバーが記載されていない場合に
は問題が生じる。例えば第15図(A)に示すようにバー
3自体も手書きとするような場合には、バー3が必ず水
平になるとは限らず、画素数によりヒストグラムを作成
しても文字バーと区別できずバーの判断ができなかっ
た。
この発明は上述のような事情より無されたものであり、
この発明の目的は、バーが水平方向に直線状でない場合
であっても、又バー自体が手書きであっても、バーを含
む文字情報からバーを確実に検出して文字を抽出する方
法を提供することにある。
発明の構成; (課題を解決するための手段) この発明は、バーを含む文字情報からバーを検出し、前
記バーを分離して文字を抽出する文字抽出方法に関する
もので、この発明の上記目的は、前記文字情報から端点
を検出し、各端点間の直線距離を検出し、前記各端点間
を結ぶ画素数を求め、前記各端点間の直線距離と実効パ
ス長との比に基づいて前記バーを検出し、前記検出され
たバーを分離して文字を抽出することによって達成され
る。
(作用) この発明では手書きを文字と、文字記入のために予め印
刷されているかもしくは手書きで記入されたバーとを確
実に区別して、バーを文字認識の対象から除去して文字
のみを抽出するようにしている。バーの検出に際して
は、文字との関係でアンダーバー,ミドルバー,アッパ
ーバー,斜めバー,斜めアンダーバー,斜めアッパーバ
ーの6種類の式によってバーの確信度を求め、確信度の
最も高いバーを検出するようにしている。
(実施例) 以下、本発明の実施例を図面を参照して説明する。先ず
この実施例は第2図又は第11図(A)〜(F)に示され
るような米国小切手上に手書きされた金額を認識するに
際して、ドルオーダーとセントオーダーを明確に区別す
るために設けられたセントバーを自動的に検出する方法
であり、セントバーを検出することによってドルオーダ
ー及びセントオーダーの認識に役立てることができるよ
うにしたものである。
第1図はこの発明の動作を示すフローチャートであり、
大きく分けて文字情報の中からバーを含む領域の検出
と、その領域の中からバーの検出と、検出されたバー及
び各文字の位置関係による文字の認識動作とから成って
いる。具体的に第2図に示す小切手の例を基に、第1図
のフローチャートに従って説明する。
先ず、第2図の小切手の文字情報からブロックの抽出を
行なう(ステップS1)。ブロックの抽出は連続する画素
数が4以上のものについて行ない、4以下のものについ
ては文字情報を構成しないとして採用しない。そして、
連続する画素数が4以上のものついてはその平均の高さ
をEF1とし、高さ>FE1×0.9以上のものの高さの平均をE
F2とした場合、高さがEF2×1/3より大きいもの又は画素
数がEF2×1/2より大きいものをブロックとして抽出す
る。第2図の文字情報から上記のようにブロックを抽出
すれば第3図のように7つのブロックが抽出され、左側
からの位置に従ってBL1〜BL7の番号が付される。なお、
ブロックの抽出は特開平1−233585号公報に示されるよ
うな方法によって行なうようにしても良い。
ブロックの抽出が終了すると、次に各ブロック毎にブロ
ック内にバーを含む確信度の算出動作に移る。先ず得ら
てた各ブロックBL1〜BL7を第5図に示す如く3×3の9
個のマトリクスエリアに区分する(ステップS2)。例え
ばブロックBL4に対しては第4図で示すような9個のエ
リアZ(i,j)が得られ、第5図で示すような各エリア
(i,j)毎に垂直マスク数ZV(i,j),斜めマスク数ZS
(i,j),水平マスク数ZH(i,j)を求める(ステップS
3)。
ここで、ブロックを3×3の9個のエリアに区分したの
は、後述するようにバーの存在と共にバーの種類の判別
を行なうためである。すなわち、ブロック図内のバーの
存在位置の確立情報によりそのバーが、例えばブロック
内の下方(Z(0,2),Z(1,2),Z(2,2))のエリアの
存在している場合にはアンダーバーと判別でき、ブロッ
ク内の上方のエリア(Z(0,0),(1,0),
Z(2,0))に存在していればアッパーバーと判別でき、
ブロック内の中段のエリア(Z(0,1),Z(1,1),Z
(2,1))に存在していればミドルバーと判別でき、又
ブロック内を斜めに遮断するエリア(Z(0,0),Z
(1,1),Z(2,2))又は(Z(2,0),Z(1,1),Z
(0,2))に存在している場合には斜めバー,斜めアン
ダーバー,斜めアッパーバーと判別でき、アンダーバ
ー,アッパーバー,斜めバー,斜めアンダーバー,斜め
アッパーバーのブロック内のバーの種類の判別に利用で
きる。
次にマスクの説明をする。マスクは3×3の9のドット
(画素)で構成されており、文字情報の一部のドットに
おいて垂直成分を構成するであろうドットマスクのマス
クパターンを垂直マスク、水平成分を構成するであろう
マスクパターンを水平マスク、斜め成分を構成するであ
ろうマスクパターンを斜めマスクとしている。
ここに、垂直マスクの例は第6図(A)〜(G)に示す
7種類があり、斜めマスクは第7図(A)及び(B)で
示す2種類があり、水平マスクは第8図(A)〜(G)
に示す7種類がある。なお、上記マスクは3×3で作成
されているが、3×3以上のマトリクスであれば良い。
そして、上述したように各垂直マスクを各エリアZ
(i,j)内で走査させることによって、ブロック内の水
直マスク数ZV(i,j)を求め、各斜めマスクを各エリア
(i,j)内で走査させることによって、ブロック図内
の斜めマスク数ZS(i,j)を求め、各水平マスクを各エ
リアZ(i,j)内で走査させることによって、ブロック
内の水平マスク数ZH(i,j)を求める。そして、バーを
含む確信度の算出を各ブロックについて行なうが(ステ
ップS4)、確信度の算出は以下のように行なう。
アンダーバーの確信度αは、次のアンダーラインの抽出
を行なってから行なう。すなわち、先ず ud−hline[0]=ZH(0,2)+ZH(1,2)+ZH(2,2) −(ZS(0,2)+ZS(1,2)+ZS(2,2))/ 2−(ZV(0,2)+ZV(1,2)+ZV(2,2)/2 ……(1) ud−hline[1]=ZH(0,2)+ZH(1,2)+ZH(2,1)] −(ZS(0,2)+ZS(1,2)+ZS(2,1))/2 −(ZV(0,2)+ZV(1,2)+ZV(2,1)/2 ……(2) ud−hline[2]=ZH(0,1)+ZH(1,2)+ZH(2,2) −(ZS(0,1)+ZS(1,2)+ZS(2,2))/2 −(ZV(0,1)+ZV(1,2)+ZV(2,2)/2 ……(3) を求め、このようにして求められたアンダーラインの抽
出データud−hline[0],ud−hline[1],ud−hline
[2]を用いて、アンダーバーの確信度αを下式に従っ
て求める。
α=K1・MAX[ud−hline[0],ud−hline[1], ud−hline[2]/(1ブロック内の黒の全画素数) …
…(4) ただし、0≦α≦1でK1は定数 また、アッパーバーの確信度βは、アッパーラインの抽
出を ud−hline[0]=ZH(0,0)+ZH(1,0)+ZH(2,0) −(ZS(0,0)+ZS(1,0)+ZS(2,0))/2 −(ZV(0,0)+ZV(1,0)+ZV(2,0)/2 ……(5) ud−hline[1]=ZH(0,1)+ZH(1,0)+ZH(2,0) −(ZS(0,1)+ZS(1,0)+ZS(2,0))/2 −(ZV(0,1)+ZV(1,0)+ZV(2,0)/2 ……(6) ud−hline[2]=ZH(0,0)+ZH(1,0)+ZH(2,1) −(ZS(0,0)+ZS(1,0)+ZS(2,1))/2 −(ZV(0,0)+ZV(1,0)+ZV(2,1)/2 ……(7) で求めた後、下式に従って求める。
β=K1・MAX[ud−hline[0],ud−hline[1], ud−hline[2]/(1ブロック内の黒の全画素数) ……(8) ただし、0≦β≦1でK2は定数 そして、ミドルバーの確信度γは ud−hline[0]=ZH(0,1)+ZH(1,1)+ZH(2,1) を求めた後に、 γ=K3・ud−hline[0]/ (1ブロック内の横幅の画素数) ……(9) ただし、0≦γ≦1でK3は定数 で求める。さらに、又、斜めバーの確信度δ1,斜めアン
ダーバーの確信度δ斜めアッパーバーの確信度δ
次のように求める。先ず、斜めバーの確信度δは s−bar[0] =−3・ZV(0,0)−1・ZV(1,0)+1・ZV(2,0) −1・ZV(0,1)+1・ZV(1,1)−1・ZV(2,1) +1・ZV(0,2)−1・ZV(1,2)−3・ZV(2,2) −3・ZS(0,0)−1・ZS(1,0)+1・ZS(2,0) −1・ZS(0,1)+1・ZS(1,1)−1・ZS(2,1) +1・ZS(0,2)−1・ZS(1,2)−3・ZS(2,2) −3・ZH(0,0)−1・ZH(1,0)+1・ZH(2,0) −1・ZH(0,1)+1・ZH(1,1)−1・ZH(2,1) +1・ZH(0,2)−1・ZH(1,2)−3・ZH(2,2) ……
(10) を求めた後に下式に従って確信度δを算出する。
δ=K4・s−bar[0]/ (1ブロックの横幅の画素数) ……(11) ただし、0≦δ≦1でK4は定数 そして、斜めアンダーバーの確信度δは s−ud−bar[0] =+0・ZV(0,0)+0・ZV(1,0)+1・ZV(2,0) +0・ZV(0,1)+1・ZV(1,1)−1・ZV(2,1) +1・ZV(2,0)−1・ZV(1,2)−3・ZV(2,2) +0・ZS(0,0)+0・ZS(1,2)+1・ZS(2,0) +0・ZS(0,1)+1・ZS(1,1)−1・ZS(2,1) +1・ZS(0,2)−1・ZS(1,2)−3・ZS(2,2) +0・ZH(0,0)+0・ZH(1,0)+1・ZH(2,0) +0・ZH(0,1)+1・ZH(1,1)−1・ZH(2,1) +1・ZH(0,2)−1・ZH(1,2)−3・ZH(2,2) ……
(12) を求めた後に下式に従って確信度δを算出する。
δ=K5・S−ud−bar[0]/ (1ブロックの横幅の画素数) ……(13) ただし、0≦δでK5は定数 さらに、斜めアッパーバーの確信度δは s−ud−bar[0] =−3・ZV(0,0)−1・ZV(1,0)+1・ZV(2,0) −1・ZV(0,1)+1・ZV(1,1)+1・ZV(2,1) +1・ZV(0,2)+0・ZV(1,2)+0・ZV(2,2) −3・ZS(0,0)−1・ZS(1,0)+1・ZS(2,0) −1・ZS(0,1)+1・ZS(1,1)+0・ZS(2,1) +1・ZS(0,2)+0・ZS(1,2)+0・ZS(2,2) −3・ZH(0,0)−1・ZH(1,0)+1・ZH(2,0) −1・ZH(0,1)+1・ZH(1,1)+0・ZH(2,1) +1・ZH(0,2)+0・ZH(1,2)+0・ZH(2,2) ……
(14) を求めた後に、下式に従って、確信度δを算出する。
δ=K6・s−up−bar[0]/ (1ブロック内の横幅の黒の画素数) ……(15) ただし、0≦δでK6は定数 上述のようなバーを含む確信度の算出を全てのブロック
について算出したか否かを判断し(ステップS5)、全て
のブロックについての算出が終了するまで上記動作を繰
返す。
そして、全てのブロックについて確信度α,β,γ,δ
12が求められると、その中で確信度の最も高い
ブロックを選択し(ステップS10)、該当ブロック内の
端点を抽出する(ステップS11)。ただし、水平方向距
離がブロックの横幅の1/2以上の長さの2つの端点のみ
を有効とし、極端に短かいものを除いて取扱う。そし
て、第4図のブロックBL4に関しては、第9図で示すよ
うに、例えば点a(x1,y1)及びb(x2,y2),a及びc,a
及びd,a及びeの4組の端点が抽出され、各端点間の実
行パス長Pk(k=1〜n;ただし、nは2つの端点間の組
合せ数)を求める(ステップS12)。実効パス長Pkは2
つの端点a及びb間の線が接続されている距離(画素
数)である。端点間に複数のパスが有るときには、最も
短かいパス長を実効パス長とする。例えば第12図のブロ
ックに対して、端点a,bに関しては第13図(A),
(B)に示す2つのパスが有り、端点a,cに関しては同
図(C),(D)に示す2つのパスがあるが、短かい方
のパスa−イ−ロ−b(同図(A))及びa−イ−ハ−
c、(同図(c))を採用する。そして各端点間の直線
距離(最短距離)をDkで求め、(ステップS13)、各パスについて直線性Skを Sk=Dk/Pk ……(17) で求める(ステップS14)。このような直線性Skを全て
のパスについて求めるまで上記動作を繰返し(ステップ
S15)、全てのパスについて直線性Skが求められるとパ
スの中から最も直線性Skの大きいパスをセントバーと仮
説する(ステップS20)。
そして、仮説されたセントバー内に数字と共有するブラ
ンチ有るか否かを判断し(ステップS21)、共有するブ
ランチが有る場合には補間ブランチ(共有部分)を除い
て、仮説されたセントバーを取り除く(ステップS2
3)。これは、バーと数字とが重なって接触している場
合に対処するためである。又、数字と共有するブランチ
がない場合には、仮説されたバーをブロックから取り除
く(ステップS22)。第10図(B)は、同図(A)のブ
ロックに対して仮説されたセントバー内の補間ブランチ
以外を取り除く例を示しており、同図(C)は仮説され
たセントバーを取り除く例を示している。
そして、特開平1−121988号公報に記載の方法により数
字部のセグメント化を行ない(ステップS24)、数字の
認識,検証を行ない(ステップS25)、認識,検証がOK
が否かを判断する(ステップS26)。そして、認識検証
がOKでない場合には仮説されたパスを仮説候補から外し
(ステップS27)、上記ステップS20にリターンする。そ
して、仮説候補から外す回数が2回目以上の場合には、
エラー処理となっている。(ステップS28)。
上述の実施例ではドルについて説明しているが、円やポ
ンド等の他の通貨に関しても同様に適用できる。また、
第14図(A)及び第15図(A)に示すような基準線の抽
出にも適用できる。
発明の効果; 以上のようにこの発明の文字抽出方法によれば、バーを
含む文字情報から端点を検出し、各端点間の直線距離及
び実効パス長の比に基づいてバーを検出して、バーをブ
ロックから取り除いて文字を認識するようにしているた
め、バーに接触した文字に関しても確実な文字認識が可
能となる。この発明によれば、第11図(A)〜(F)で
示すような文字に関しても、認識が可能である。
【図面の簡単な説明】
第1図はこの発明の動作例を示すフローチャート、第2
図は手書きされた文字の一例を示す図、第3図及び第4
図はブロック化処理を説明するための図、第5図は分割
されたエリアを示す図、第6図(A)〜(G)は垂直マ
スクの例を示す図、第7図(A)及び(B)は斜めマス
クの例を示す図、第8図(A)〜(G)は水平マスクの
例を示す図、第9図は端点間の実効パス,最短距離,直
線性を説明するための図、第10図は仮説に基づく処理例
を説明するための図、第11図(A)〜(F)は手書き文
字の一例を示す図第12図及び第13図(A)〜(D)は端
点のパス長を説明するための図、第14図(A),(B)
及び第15図(A),(B)は従来の文字の抽出を説明す
るための図である。 BL1〜BL7……ブロック、a,b,c,d,e……端点。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】バーを含む文字情報の文字を認識するに際
    にして、前記文字情報からバーを検出して文字のみを抽
    出する文字抽出方法において、前記文字情報から連続す
    る1つの文字群を1つのブロックとしてブロックを抽出
    し、抽出されたブロックを複数のエリアZ(i,j)(i
    =0〜m,j=0〜n)に区分し、文字を構成する垂直成
    分である垂直マスク,斜め成分である斜めマスク及び水
    平成分である水平マスクの各エリア(i,j)毎の存在数
    を求め、各エリアZ(i,j)内の各マスク存在数により
    前記ブロック内にバーを含む確信度を前記ブロック毎に
    求め、前記バーを含む確信度の高いブロック内の端点を
    検出し、検出された各端点間の画素数で示された直線距
    離及び前記端点間の線分の画素数である実効パス長を求
    め、求められた各端点間の直線距離及び実効パス長の比
    に基づいて前記バーを検出して前記文字を抽出するよう
    にしたことを特徴とする文字抽出方法。
JP2084391A 1990-03-30 1990-03-30 文字抽出方法 Expired - Fee Related JPH0769934B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2084391A JPH0769934B2 (ja) 1990-03-30 1990-03-30 文字抽出方法
CA002037173A CA2037173C (en) 1990-03-30 1991-02-27 Character recognizing system
US07/665,230 US5239592A (en) 1990-03-30 1991-03-06 Character recognizing system
GB9104799A GB2246229A (en) 1990-03-30 1991-03-07 Character recognising system
FR9103617A FR2660463B1 (fr) 1990-03-30 1991-03-26 Dispositif de reconnaissance de caracteres, procede d'extraction de caracteres et procede de reconnaissance de chiffres successifs utilisant un tel dispositif.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2084391A JPH0769934B2 (ja) 1990-03-30 1990-03-30 文字抽出方法

Publications (2)

Publication Number Publication Date
JPH03282983A JPH03282983A (ja) 1991-12-13
JPH0769934B2 true JPH0769934B2 (ja) 1995-07-31

Family

ID=13829265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2084391A Expired - Fee Related JPH0769934B2 (ja) 1990-03-30 1990-03-30 文字抽出方法

Country Status (1)

Country Link
JP (1) JPH0769934B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5117728B2 (ja) 2007-01-11 2013-01-16 株式会社リコー シート処理装置、画像形成装置及びシート処理方法

Also Published As

Publication number Publication date
JPH03282983A (ja) 1991-12-13

Similar Documents

Publication Publication Date Title
JP2822189B2 (ja) 文字認識装置及び方法
US7336813B2 (en) System and method of determining image skew using connected components
JP3108979B2 (ja) 画像処理方法および画像処理装置
KR100315531B1 (ko) 패턴추출장치
JPH07182448A (ja) 文字認識方法
JPH0769934B2 (ja) 文字抽出方法
JP3376175B2 (ja) バーコード認識装置
JPH03232100A (ja) ナンバープレート読み取り装置
JP3177138B2 (ja) 図面閉領域の抽出方法
JPS615383A (ja) 文字パタ−ン分離装置
JP2899383B2 (ja) 文字切出し装置
JP3019897B2 (ja) 行切出し方法
JP2581809B2 (ja) 文字切出し装置
JP2002366900A (ja) 光学式文字読取装置
JP3197441B2 (ja) 文字認識装置
JPH1125218A (ja) 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置
JP3047857B2 (ja) 光学式文字読み取り装置
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
JP3648270B2 (ja) 帳票類読取装置及び会計帳票読取装置
JP2856989B2 (ja) 領域境界の内外ループ識別方法
JPH0636174B2 (ja) 文字列対応線分抽出方式
JPH0434793B2 (ja)
JPH01234985A (ja) 文字読取装置の文字切出し装置
JPH1125217A (ja) 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置
JP2792655B2 (ja) 手書き数字認識における下線処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees