JPH07296113A - 文字パターン抽出方法及びその認識方法 - Google Patents

文字パターン抽出方法及びその認識方法

Info

Publication number
JPH07296113A
JPH07296113A JP6090106A JP9010694A JPH07296113A JP H07296113 A JPH07296113 A JP H07296113A JP 6090106 A JP6090106 A JP 6090106A JP 9010694 A JP9010694 A JP 9010694A JP H07296113 A JPH07296113 A JP H07296113A
Authority
JP
Japan
Prior art keywords
character
pattern
area
rectangular area
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6090106A
Other languages
English (en)
Inventor
Hideki Fujimori
秀木 藤森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP6090106A priority Critical patent/JPH07296113A/ja
Publication of JPH07296113A publication Critical patent/JPH07296113A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 濃淡画像から字画の込み入った部分でも少な
い部分でも均質な文字パターンを抽出し、良好な文字認
識結果を得る。 【構成】 文字領域を縦方向の分割点および横方向の分
割点の計算をおこない、その分割で分けられた領域を設
定し、各領域の平均濃度を計算し、その平均濃度に応じ
たしきい値で二値化し、それらを組み合せ文字パターン
を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は濃淡画像中の文字の二
値パターンを抽出する方法およびそのパターンを認識す
る方法に関する。
【0002】
【従来の技術】図14は従来の文字パターン抽出および
認識方法を示すブロック図である。撮像装置100で得
られた濃淡画像93を、画像二値化手段101であるし
きい値を用いてそのしきい値より濃かったら黒、薄かっ
たら白とする二値画像96に変換する。特徴量計算手段
102では、特徴量としてX方向の黒画素ヒストグラム
98とY方向の黒画素ヒストグラム99を算出する。そ
して特徴量比較手段103で、あらかじめ同じ方法で計
算しておいた基準パターンの特徴量Aとの差を計算し、
文字判定手段104ではその差の最も少なかった基準パ
ターンの文字として認識する。
【0003】図15は従来からの文字認識方法の1つで
ある射影側面特徴を用いた文字認識方法を説明する図で
ある。まずあらかじめ基準となる文字パターン105に
ついて縦方向および横方向に黒画素数を積算し各々の方
向にヒストグラム98,99を得る。次に認識したいパ
ターン96についても同じくX方向の黒画素ヒストグラ
ム98、Y方向の黒画素ヒストグラム99を計算する。
そして各ヒストグラムを重ね合せその差となる領域(図
中の斜線領域)の面積を計算する。そしてその面積が一
定値以内であればその文字と認識する、あるいは面積の
最も小さい文字として認識するものである。
【0004】図16は従来の文字パターン抽出方法を示
すフロー図である。ステップ63で濃度の積算値を入れ
るSUMの零クリアおよび濃淡画像IMG(X,Y)中
の文字の存在する領域(STX,STY)−(EDX,
EDY)の画素数PIXSの計算を行い、ステップ64
でカウンタJに初期値STYを代入し、ステップ65で
カウンタIに初期値STXを代入し、ステップ66
(I,J)の画素の濃度値をSUMに加算する。ステッ
プ7でカウンタIをインクレメントしながらステップ6
7でIがEDXより大きいと判定されるまでステップ6
6を繰り返すことにより1ライン分の濃度値がSUMに
加算され、さらにステップ32でカウンタJをインクレ
メントしながらステップ68でJがEDYより大きいと
判定されるまでステップ65から32までを繰り返すこ
とにより、文字領域の濃度値がSUMに積算される。ス
テップ69では濃度積算値SUMを画素数PIXSで割
ることにより平均濃度AVGを求める。次にステップ6
4でカウントJに初期値STYを代入し、ステップ65
でカウンタIに初期値STXを代入し、ステップ70で
(I,J)の画素の濃度値が平均濃度AVGより大きい
か否か判定する。濃度値が平均より大きい場合はステッ
プ71で二値パターンPAT(I,J)に黒を示す1を
代入し、濃度値が平均より小さい場合はステップ72で
二値パターンPAT(I,J)に白を示す0を代入す
る。ステップ7でIをインクレメントしながらステップ
67でIがEDXより大きいと判定されるまでステップ
70および71,72を繰り返すことにより1ライン分
の二値パターンが作成され、さらにステップ32でカウ
ンタJをインクレメントしながらステップ68でJがE
DYより大きいと判定されるまでステップ70から67
までを繰り返すことにより文字領域分の二値パターンが
作成される。
【0005】図17は従来の文字パターン認識方法を示
すフロー図である。ステップ41では文字領域の二値パ
ターンを作成し、ステップ102でその文字パターンの
特徴量Vを計算する。ステップ1でカウンタIを初期化
した後ステップ73であらかじめ登録されたI番目の文
字の基準パターンの特徴量V(I)を検索し、ステップ
74でVとV(I)の差の絶対値をSV(I)に代入す
る。ステップ7でカウンタIをインクレメントしなが
ら、ステップ75でIがデータ数を越えると判定される
までステップ73,74を繰り返す。次にステップ76
で特徴量の差の絶対値が入った配列SVを昇順にソート
しステップ77で最も少ない差であるSV(1)がある
しきい値THより少ないか否か判定し少なかった場合、
ステップ78でSV(1)の差が計算された基準パター
ンの文字として認識し結果を出力する。しきい値THよ
り大きかった場合、ステップ79で認識不可能として処
理を終了する。
【0006】
【発明が解決しようとする課題】図18は二値化の過程
を説明する図である。文字のような白黒の画を撮像する
場合その濃度値のグラフは(a)上で点線で示すように
長方形の形となるが、実際には収差等の問題により実線
で示すような分散を持った山の形となる。分解能が十分
あり焦点の良くあった画像であれば、理想的な長方形と
その山形の差はほとんど無くあるしきい値で二値化した
場合、(b)のように元の理想的な長方形と同じかたち
の二値画像が得られる。しかしながら、分解能が低いあ
るいは焦点の良くあっていない画像では、光の分散が激
しいため山形のピークの値が低くなり、分散も広がる傾
向にある。そのため(c)の右側のように線が近い位置
にある場合などは、山形同志がくっついた状態となり、
しきい値を用いて二値化した場合(d)のように2本の
線が1本の太い線になってしまう。また全体的に黒くな
るため、平均濃度に応じてしきい値を決める場合には、
しきい値そのものが高くなるため、(c)の左側のよう
に線が1本しかない場合、線の太さが細ってしまうこと
がある。
【0007】上記のような現象のため、従来の文字パタ
ーン抽出方法のように文字の矩形領域を1つのしきい値
で二値化する場合、分解能の低い撮像系で得られた画像
や焦点の十分あっていない画像を二値化すると字画の込
み入った部分は黒くつぶれ反対に字画の少ない部分は白
くかすれた文字パターンになってしまい、文字の認識を
悪くする原因となっていた。特に漢字の認識では、偏や
冠とつくりの部分で字画の込み入りかたが違うものが多
く適切な文字パターンが得られず誤った文字として認識
してしまうという問題があった。
【0008】また、車両番号読取装置のように、屋外で
撮像された画像中の文字を認識する場合、太陽光の影響
により文字の一部に障害物の影がかかり、二値化した場
合影のかかっている部分が黒く潰れてしまう、逆にハレ
ーションが起こった場合ハレーションの周囲の文字部分
が白く欠けてしまうという問題があった。
【0009】この発明は上記のような問題点を解消する
ためになされたもので、字画の込み入った部分も少ない
部分も、また影やハレーションがあった場合でも一様に
均質な文字パターンを得、良好な文字認識結果を得るこ
とを目的とする。
【0010】
【課題を解決するための手段】この発明に係わる文字パ
ターン抽出方法は、文字領域を上下に2分割し各々の部
分領域毎にその平均濃度に応じたしきい値で二値化し文
字パターンを抽出するようにしたものである。
【0011】またこの発明に係わる文字パターン抽出方
法は、文字領域を左右に2分割し各々の部分領域毎にそ
の平均濃度に応じたしきい値で二値化し文字パターンを
抽出するようにしたものである。
【0012】この発明に係わる文字パターン抽出方法
は、文字領域を上下左右に2分割しできる4つの部分領
域毎にその平均濃度に応じたしきい値で二値化し文字パ
ターンを抽出するようにしたものである。
【0013】またこの発明に係わる文字パターン抽出方
法は、文字領域を上下方向に黒画素のヒストグラムをと
り、黒画素数が一定値以下の行が存在した場合、その行
を境に分割し、各々の部分領域毎にその平均濃度に応じ
たしきい値で二値化し文字パターンを抽出するようにし
たものである。
【0014】この発明に係わる文字パターン抽出方法
は、文字領域を左右方向に黒画素のヒストグラムをと
り、黒画素数が一定値以下の行が存在した場合、その列
を境に分割し、各々の部分領域毎にその平均濃度に応じ
たしきい値で二値化し文字パターンを抽出するようにし
たものである。
【0015】またこの発明に係わる文字パターン抽出方
法は、文字領域を上下左右方向に黒画素のヒストグラム
をとり、黒画素数が一定値以下の行あるいは列が存在し
た場合、その行あるいは列を境に分割し、できる各々の
部分領域毎にその平均濃度に応じたしきい値で二値化し
文字パターンを抽出するようにしたものである。
【0016】この発明に係わる文字認識方法は、上下に
2分割して得られた文字パターン、左右に2分割して得
られた文字パターン、上下左右に2分割して得られる文
字パターンそれぞれを特徴量をもとに認識し最も特徴量
の差の少ないパターンの認識結果を最終的な認識結果と
するようにしたものである。
【0017】また、この発明に係わる文字認識方法は、
上下に2分割して得られた文字パターン、左右に2分割
して得られた文字パターン、上下左右に2分割して得ら
れる文字パターンそれぞれを特徴量をもとに認識し複数
のパターンで同じ認識結果が得られた場合、その認識結
果を最終的な認識結果とするようにしたものである。
【0018】
【作用】この発明においては、上方の障害物により文字
領域の上側に影がかかった場合、上下に分割された上側
の領域の平均濃度が濃くなり、しいき値があるため影の
部分が白くなり、文字の部分だけが黒くうかびあがる。
【0019】また、この発明においては、側方の障害物
により文字領域の左あるいは右側に影がかかった場合、
左右に分割された領域の影のかかった方の領域の平均濃
度が濃くなり、しきい値があがるため影の部分が白くな
り、文字の部分だけが黒くうかびあがる。
【0020】この発明においては、文字の一部でハレー
ションなどが起きそのまわりが白くかすれた場合、その
ハレーションの起こった部分領域のしきい値がさがるた
め黒めのパターンとなり文字がうかびあがる。
【0021】また、この発明においては、縦方向にヒス
トグラムをとりその積算値の小さい位置で上下に文字領
域を分割するため、漢字の冠やあしとつくりの部分が分
離され各々の領域で適切な二値化しきい値で二値化され
る。
【0022】この発明においては、横方向にヒストグラ
ムをとりその積算値の小さい位置で左右に文字領域を分
割するため、漢字の偏とつくりの部分が分離され各々の
領域で適切な二値化しきい値で二値化される。
【0023】また、この発明においては、縦横方向にヒ
ストグラムをとりその積算値の小さい位置で文字領域を
分割するため、いくつかの分離したブロックで構成され
ている漢字ではブロック毎に適切な二値化しきい値で二
値化される。
【0024】この発明においては、いくつかの分割方法
で得られたパターン各々をその特徴量を比較することに
より認識し、それらの認識結果の中から最も特徴量の差
の少ない物を最終的な認識結果とする。
【0025】またこの発明においては、いくつかの分割
方法で得られたパターン各々をその特徴量を比較するこ
とにより認識し、それらの認識結果の中で複数のパター
ンの認識結果が一致した場合それを最終的な認識結果と
する。
【0026】
【実施例】
実施例1.図1はこの発明による文字パターン抽出方法
の一実施例を示したフロー図である。ステップ1でカウ
ンタIを1に初期化し、ステップ2で横方向の分割点の
座標MDXを計算し、ステップ3でIの値によって分岐
する。Iが1の時ステップ4で二値化する領域の座標X
0,X1を各々STX,STX+MDXに設定する。I
が2の時はステップ5で二値化する領域の座標X0,X
1を各々STX+MDX,EDXに設定する。次にステ
ップ6で矩形領域(X0,STY)−(X1,EDY)
を平均濃度をしきい値として二値化し、ステップ7でI
をインクレメントし、ステップ8でIが2を越えたと判
定されるまでステップ3にもどり処理を続ける。
【0027】図2は図1に示した文字パターン抽出方法
の概要と効果を説明する図である。原画像97を撮像し
て得られる濃淡画像93から二値の文字パターンを抽出
する。従来の方法で、文字領域全体の平均濃度で二値化
した場合、字画の込み入っている左側は文字が潰れぎみ
になり反対に右側は字画が少ないため線がかすれぎみに
なってしまう。これに対し、文字を中点で2分割する
と、左側の文字領域は平均濃度が高くなり、その結果二
値化のしきい値が高いものとなり従来に比べ文字は細め
に二値化される。反対に、右側では平均濃度が低いため
しきい値が低くなり文字は太めに二値化される。こうし
て左右別々に二値化された画像を合成して得られた文字
パターンは従来の方法で得られた文字パターンより、よ
り原画像に近いものとなる。
【0028】図3は図1に示した文字パターン抽出方法
の別の効果を説明する図である。原画像97に影が左側
にかかっている場合の濃淡画像93から二値の文字パタ
ーンを抽出する。従来の方法で文字領域全体の平均濃度
で二値化した場合、影のかかっている左側は真っ黒に潰
れ反対に右側は影の影響で平均濃度が濃くなり二値化し
きい値が上がるための線がかすれぎみなってしまう。こ
れに対し、文字を中点で2分割すると、左側の文字領域
は平均濃度が高くなり、その結果二値化のしきい値が高
いものとなり従来に比べ影の部分は白く二値化される。
反対に、右側では平均濃度が低いためしきい値が低くな
り文字は太めに二値化される。こうして左右別々に二値
化された画像を合成して得られた文字パターンは従来の
方法で得られた文字パターンより、より原画像に近いも
のとなる。
【0029】実施例2.図4はこの発明による文字パタ
ーン抽出方法の実施例2を示したフロー図である。ステ
ップ1でカウンタIを1に初期化し、ステップ9で縦方
向の分割点の座標MDYを計算し、ステップ3でIの値
によって分岐する。Iが1の時ステップ10で二値化す
る領域の座標Y0,Y1を各々STY,STY+MDY
に設定する。Iが2の時はステップ11で二値化する領
域の座標Y0,Y1を各々STY+MDY,EDYに設
定する。次にステップ6で矩形領域(STX,Y0)−
(EDX,Y1)を平均濃度をしきい値として二値化
し、ステップ7でIをインクレメントし、ステップ8で
Iが2を越えたとき判定されるまでステップ3にもどり
処理を続ける。
【0030】この実施例によれば文字領域を上下に分割
するので上側に影がかかった場合、上側の文字領域の二
値化しきい値が上がり、影の部分が白くなり文字が潰れ
ることが無くなり、下側の領域は二値化しきい値が下が
り文字が太めに黒くなり、かすれることが無くなる。ま
た実施例1の図2で説明したのと同様に、文字の上側と
下側で字画の込み入り方が異なる場合より原画像に近い
二値パターンが得られるという効果が有る。
【0031】実施例3.図5はこの発明による文字パタ
ーン抽出方法の実施例3を示したフロー図である。ステ
ップ1でカウンタIを1に初期化し、ステップ2で横方
向の分割点の座標MDXを計算し、ステップ9で縦方向
の分割点の座標MDYを計算し、ステップ3でIの値に
よって分岐する。Iが1の時ステップ12で二値化する
領域の座標X0,X1,Y0,Y1を各々STX,ST
X+MDX,STY,STY+MDYに設定する。Iが
2の時はステップ13で二値化する領域の座標X0,X
1,Y0,Y1を各々STX,STX+MDX,STY
+MDY,EDYに設定する。Iが3の時はステップ1
4で二値化する領域の座標X0,X1,Y0,Y1を各
々STX+MDX,EDX,STY,STY+MDYに
設定する。Iが4の時はステップ15で二値化する領域
の座標X0,X1,Y0,Y1を各々STX+MDX,
EDX,STY+MDY,EDYに設定する。次にステ
ップ6で矩形領域(X0,Y0)−(X1,Y1)を平
均濃度をしきい値として二値化し、ステップ7でIをイ
ンクレメントし、ステップ16でIが4を越えたと判定
されるまでステップ3にもどり処理を続ける。
【0032】この実施例によれば文字領域を上下左右に
各々2分割するので実施例1および実施例2と同様の効
果が得られることは言うまでもない。さらに4分割と細
かく分割しているため、文字の一部でハレーションが起
こった場合そのハレーションの起こった部分領域の二値
化しきい値が下がりより文字が太めに二値化される。ま
たハレーションの影響が1/4の領域に制限され、他の
部分の二値化への影響を抑制することができる。
【0033】実施例4.図6はこの発明の文字パターン
抽出方法の実施例4を示したフロー図である。ステップ
17でX0に初期値STXを代入し、ステップ18でカ
ウンタIを零クリアする。ステップ19でI番目の垂直
ライン上の画素の濃度値を積算し、ステップ20ではそ
の積算値があるしきい値βより大きいか判定する。β以
上の場合は、ステップ7でIをインクレメントしステッ
プ21でIが文字幅であるEDX−STXより大きいと
判断されるまでステップ19に戻り処理を続け、大きい
と判断された場合は、ステップ22でX1にEDXを代
入しステップ6の二値化に進む。ステップ20で積算値
がβより小さいと判定された場合、ステップ23でX1
にSTX+Iを代入し、ステップ6で矩形領域(X0,
STY)−(X1,EDY)をその平均濃度をしきい値
として二値化する。そしてステップ7でIをインクレメ
ントし、ステップ39で次回の二値化用の座標としてX
0にSTX+Iを代入する。ステップ21でIが文字幅
EDX−STXより大きいか否か判定し、大きくない場
合はステップ19にもどり、大きい場合は処理を終了す
る。
【0034】図7は、図6で示した実施例の概要を説明
する図である。濃淡画像93のX方向の濃度値のヒスト
グラム98を算出し、その積算値があるしきい値以下に
なる点の座標を求める。そしてその座標において文字領
域を分割し、各々の領域を実施例1と同様に二値化しそ
れらを合成し、その文字の二値パターン96とする。
【0035】この実施例によれば左右方向に濃度値のヒ
ストグラムをとりその値の少ない点で分割するため、偏
と作りで構成されている漢字の場合偏と作りの間の点が
分割点となり、偏と作り各々の部分が適当な二値化しき
い値で二値化されるので偏と作りで字画の込み入り具合
が違う漢字でも良好な文字パターンが得られる。
【0036】実施例5.図8はこの発明による文字パタ
ーン抽出方法の実施例5を示したフロー図である。ステ
ップ24でY0に初期値STYを代入し、ステップ18
でカウンタIを零クリアする。ステップ25でI番目の
水平ライン上の画素の温度値を積算し、ステップ26で
はその積算値があるしきい値αより大きいか判定する。
α以上の場合は、ステップ7でIをインクレメントしス
テップ27でIが文字高さであるEDY−STYより大
きいと判断されるまでステップ25に戻り処理を続け、
大きいと判断された場合は、ステップ28でY1にED
Yを代入しステップ6の二値化に進む。ステップ26で
積算値がαより小さいと判定された場合、ステップ29
でY1にSTY+Iを代入し、ステップ6で矩形領域
(STX,Y0)−(STX,Y1)をその平均濃度を
しきい値として二値化する。そしてステップ7でIをイ
ンクレメントし、ステップ40で次回の二値化用の座標
としてY0にSTY+Iを代入する。ステップ21でI
が文字高さEDY−STYより大きいか否か判定し、大
きくない場合はステップ25にもどり、大きい場合は処
理を終了する。
【0037】この実施例によれば上下方向に濃度値のヒ
ストグラムをとりその値の少ない点で分割するため、冠
やあしと作りで構成されている漢字の場合冠やあしと作
りの間の点が分割点となり、冠やあしと作り各々の部分
が適当な二値化しきい値で二値化されるので偏と作りで
字画の込み具合が違う漢字でも良好な文字パターンが得
られる。
【0038】実施例6.図9はこの発明による文字パタ
ーン抽出方法の実施例6を示したフロー図である。ステ
ップ30でカウンタI,Jをそれぞれ0,1に設定し、
ステップ25でI番目の水平ライン上の画素の濃度値を
積算し、ステップ26でその積算値があるしきい値αよ
り大きいか否か判定する。αより大きい場合ステップ7
へ進み、小さかった場合、ステップ31で配列YL
(J)にIの値を代入し、ステップ32でJをインクレ
メントする。そしてステップ7でIをインクレメントし
ステップ27でIが文字高さEDY−STYより大きい
か否か判定する。IがEDY−STY以下の場合、ステ
ップ25に戻り処理を繰り返し、IがEDY−STYよ
り大きい場合ステップ33でYL(J)にEDYを代入
する。次にステップ17でX0にSTXを代入した後、
ステップ18でIを零クリアし、ステップ19でI番目
の垂直ライン上の画素の濃度値を積算する。ステップ2
0ではその積算値があるしきい値βより大きいか判定す
る。β以上の場合は、ステップ7でIをインクレメント
しステップ21でIが文字幅であるEDX−STXより
大きいと判断されるまでステップ19に戻り処理を続
け、大きいと判断された場合は、ステップ22でX1に
EDXを代入しステップ34に進む。ステップ20で積
算値がβより小さいと判定された場合、ステップ23で
X1にSTX+Iを代入する。ステップ34ではカウン
タKを1に初期設定し、ステップ35ではY0,Y1に
それぞれSTY,YL(K)を代入する。次にステップ
6で矩形領域(X0,Y0)−(X1,Y1)を平均濃
度をしきい値として二値化し、ステップ36でKをイン
クレメントし、ステップ37でKとJを比較する。Kが
J以下の場合ステップ38でY0,Y1にYL(K−
1),YL(K)を代入しステップ6に戻る。ステップ
37でK>Jと判定された時、ステップ7でIをインク
レメントし、ステップ39でX0にSTX+Iを代入
し、ステップ21でIが文字幅EDX−STXより大き
いか判定する。Iが文字幅より小さい時ステップ19に
戻り、大きいときは処理を終了する。
【0039】この実施例によれば上下左右方向に濃度値
のヒストグラムをとりその値の少ない点で分割するた
め、実施例4および実施例5と同様の効果が得られるこ
とは言うまでもない。また筋のように複数のブロックか
らなる漢字の場合各々のブロックが分離され適当な二値
化しきい値で二値化されるので各ブロックで字画の込み
入り具合が違う漢字でも良好な文字パターンが得られ
る。
【0040】なお、以上の例では二値化のしきい値とし
て平均濃度を用いているが、しきい値として、平均濃度
にある比率を掛けた値、平均濃度にある値を加えた値等
としても同様の効果が得られる。
【0041】実施例7.図10はこの発明による文字パ
ターン認識方法の一実施例を示したフロー図である。ス
テップ1でカウンタIを1に初期設定し、ステップ3で
Iの値により分岐する。Iが1の時ステップ41で文字
領域全域をあるしきい値によって二値化する。Iが2の
時はステップ42で文字領域を上下に分割し各々の領域
を適当なしきい値によって二値化する。Iが3の時はス
テップ43で文字領域を左右に分割し各々の領域を適当
なしきい値によって二値化する。Iが4の時はステップ
44で文字領域を上下左右に分割し各々の領域を適当な
しきい値によって二値化する。次にステップ45で得ら
れた二値パターンの特徴量を計算し、あらかじめ計算し
てある複数の文字の特徴量との差を求めその最も少ない
候補を同定する。ステップ46ではその候補の文字をC
H(I)にその候補の文字の特徴量との差の絶対値をV
M(I)に代入する。ステップ7でIをインクレメント
し、ステップ47でIが4より大きいと判断されるまで
ステップ3に戻り処理を繰り返す。次にステップ48で
Iに2を代入し、ステップ49でVM(1)とVM
(I)の値を比較し、VM(1)がVM(I)の値以下
の場合は何もせずステップ7に進み、VM(1)がVM
(I)の値より大きいときVM(1)とCH(1)をそ
れぞれVM(I),CH(I)に置き換える。ステップ
7でIをインクレメントし、ステップ47でIが4より
大きいか判定する。Iが4以下の場合はステップ49に
戻り処理を繰り返し、4より大きい場合は、ステップ5
1でCH(1)の文字を認識結果として出力し処理を終
了する。
【0042】図11は、図10の実施例を説明する図で
ある。濃淡画像63を従来通り分割せず二値化した場
合、左右に分割した場合、上下に分割した場合、上下左
右に4分割した場合の各々について、画像の二値化9
5、特徴量の計算92、その特徴量に基づく文字判定1
04を行う。こうして得られる4つの候補をその特徴量
差の少ない順にソート108し、その1位の候補文字を
最終的な認識結果として出力するものである。
【0043】この実施例によれば分割しないで得られた
二値パターン、左右に分割して得られたパターン、上下
に分割して得られたパターン、上下左右に分割して得ら
れたパターン各々を特徴値を計算し認識しその中から最
も特徴値の差の少ない認識結果を最終的な認識結果とす
るため、従来の分割しないパターンのみで認識した場合
では認識できなかったパターンも認識できるようにな
る。
【0044】実施例8.図12、図13はこの発明によ
る文字パターン認識方法の別の実施例を示したフロー図
である。ステップ1でカウンタIを1に初期設定し、ス
テップ3でIの値により分岐する。Iが1の時ステップ
41で文字領域全域をあるしきい値によって二値化す
る。Iが2の時はステップ42で文字領域を上下に分割
し各々の領域を適当なしきい値によって二値化する。I
が3の時はステップ43で文字領域を左右に分割し各々
の領域を適当なしきい値によって二値化する。Iが4の
時はステップ44で文字領域を上下左右に分割し各々の
領域を適当なしきい値によって二値化する。次にステッ
プ45で得られた二値パターンの特徴量を計算し、あら
かじめ計算してある複数の文字の特徴量との差を求めそ
の最も少ない候補を同定する。ステップ46ではその候
補の文字をCH(I)にその候補の文字の特徴量との差
の絶対値をVM(I)に代入する。ステップ7でIをイ
ンクレメントし、ステップ47でIが4より大きいと判
断されるまでステップ3に戻り処理を繰り返す。次にス
テップ52でカウンタJに初期値1を代入し、ステップ
1でカウンタIに1を代入する。ステップ53ではCH
(J)とCH(I)が同じ文字か判定し、同じ文字の場
合、ステップ55でCNT(J)に0を代入し、ステッ
プ57でCNT(I)をインクレメントした後、ステッ
プ32へ進む。ステップ53で違う文字と判定した場
合、ステップ7でIをインクレメントしステップ54で
IとJを比較する。I≠Jの時ステップ53に戻り、I
=Jの時はステップ56でCNT(J)に1を代入す
る。次にステップ32ではJをインクレメントし、ステ
ップ58でJが4より大きいか判定する。Jが4以下の
ときはステップ1に戻り処理を繰り返し、Jが4より大
きい時は図13のステップ1へ進む。
【0045】図13ではステップ1でカウンタIに1を
代入し、ステップ59でCNT(I)が3以上か判定す
る。3以上の場合ステップ62でCH(I)の文字を認
識結果として出力し処理を終了する。3より小さい時
は、ステップ60に進みステップ60でCNT(I)が
2か判定する。CH(I)=2の場合、ステップ61で
JにI+1を代入しステップ60でCNT(J)=2か
判断する。CNT(J)=2のときはステップ48へ分
岐し、CNT(J)≠2のときはステップ32でJをイ
ンクレメントしステップ58でJと4を比較する。Jが
4以下の時はステップ60に戻り処理を繰り返し、Jが
4より大きいときはステップ62でCH(I)の文字を
認識結果として出力し処理を終了する。ステップ60で
CNT(I)≠2と判定された場合は、ステップ7でI
をインクレメントしステップ16でIが4を越えたと判
断されるまでステップ59に戻り処理を繰り返す。次に
ステップ48では、Iに2を代入し、ステップ49でV
M(1)とVM(I)の値を比較し、VM(1)がVM
(I)の値以下の場合は何もせずステップ7に進み、V
M(1)がVM(I)の値より大きいときVM(1)と
CH(1)をそれぞれVM(I)、CH(1)に置き換
える。ステップ7でIをインクレメントし、ステップ4
7でIが4より大きいか判定する。Iが4以下の場合は
ステップ49に戻り処理を繰り返し、4より大きい場合
は、ステップ51でCH(1)の文字を認識結果として
出力し処理を終了する。
【0046】この実施例によれば分割しないで得られた
二値パターン、左右に分割して得られたパターン、上下
に分割して得られたパターン、上下左右に分割して得ら
れたパターン各々を特徴値を計算し認識しそれらの認識
結果の中で複数のパターンの認識結果が一致した場合そ
れを最終的な認識結果とするので、偶然あるパターンが
他の文字の特徴量に近く誤ってその文字に認識するケー
スを除くことができ誤読が抑制される。
【0047】
【発明の効果】以上のようにこの発明は文字領域を左右
に分割し各々適当なしきい値で二値化するため、文字の
左側と右側で字画の込み入り方が違う場合でも良好な文
字パターンが得られる。また側方の障害物の影がかかっ
ても文字パターンが潰れることなく抽出できるという効
果が有る。
【0048】また、この発明は文字領域を上下に分割し
各々適当なしきい値で二値化するため、文字の上側と下
側で字画の込み入り方が違う場合でも良好な文字パター
ンが得られる。また上方の障害物の影がかかっても文字
パターンが潰れることなく抽出できるという効果が有
る。
【0049】この発明は、文字領域を上下左右に分割し
各々適当なしきい値で二値化するため、請求項1及び請
求項2と同様の効果が得られる。さらに文字の一部でハ
レーションが起こった場合でもハレーションの影響を1
/4の領域に抑えることができ良好な文字パターンを得
られるという効果がある。
【0050】またこの発明は、文字領域を濃度値のヒス
トグラムを用いて左右に分割するため漢字の偏と作り各
々を適当なしきい値で二値化できるので、偏と作りで字
画の込み入り方が違う漢字でも良好な文字パターンが得
られる。
【0051】この発明は文字領域を濃度値のヒストグラ
ムを用いて上下に分割するため漢字の冠やあしと作り各
々を適当なしきい値で二値化できるので、冠やあしと作
りで字画の込み入り方が違う漢字でも良好な文字パター
ンが得られる。
【0052】またこの発明は、文字領域を濃度値のヒス
トグラムを用いて上下左右に分割するためいくつかの分
離したブロックで構成される漢字ではブロック毎に適切
なしきい値で二値化できるので良好文字パターンが得ら
れる。
【0053】この発明においてはいくつかの分割方法で
得られたパターン各々をその特徴量を比較することによ
り認識し、それらの認識結果の中から最も特徴量の差の
少ない物を最終的な認識結果とするのでより良好なパタ
ーンの認識結果が採用され認識率が向上する。
【0054】この発明においては、いくつかの分割方法
で得られたパターン各々をその特徴量を比較することに
より認識し、そららの認識結果の中で複数のパターンの
認識結果が一致した場合それを最終的な認識結果とする
ので、あるパターンが偶然に他に文字の特徴量と差が無
くなり誤って認識してしまうケースを除くことができ誤
読が防止される。
【図面の簡単な説明】
【図1】この発明による実施例1の文字パターン抽出方
法を示すフロー図である。
【図2】この発明による実施例1の文字パターン抽出方
法の概要を説明する図である。
【図3】この発明による実施例1の文字パターン抽出方
法の概要を説明する図である。
【図4】この発明による実施例2の文字パターン抽出方
法を示すフロー図である。
【図5】この発明による実施例3の文字パターン抽出方
法を示すフロー図である。
【図6】この発明による実施例4の文字パターン抽出方
法を示すフロー図である。
【図7】この発明による実施例4の文字パターン抽出方
法の概要を説明する図である。
【図8】この発明による実施例5の文字パターン抽出方
法を示すフロー図である。
【図9】この発明による実施例6の文字パターン抽出方
法を示すフロー図である。
【図10】この発明による実施例1の文字パターン認識
方法を示すフロー図である。
【図11】この発明による実施例1の文字パターン認識
方法の概要を説明する図である。
【図12】この発明による実施例2の文字パターン認識
方法を示すフロー図である。
【図13】この発明による実施例2の文字パターン認識
方法を示すフロー図である。
【図14】従来の文字パターン抽出方法を示すブロック
図である。
【図15】従来の文字パターン認識方法の実施例を説明
する図である。
【図16】従来の文字パターン抽出方法を示すフロー図
である。
【図17】従来の文字パターン認識方法を示すフロー図
である。
【図18】従来の文字パターン抽出方法の問題点を説明
する図である。
【符号の説明】
1 カウンタI初期化手順 2 横方向分割点MDX計算手順 3 Iの値による分岐手順 4 X0=STX,X1=STX+MDX代入手順 5 X0=STX+MDX,X1=EDX代入手順 6 矩形領域二値化手順 7 カウンタIインクレメント手順 8 I,2比較手順 9 縦方向分割点MDY計算手順 10 Y0=STY,Y1=STY+MDY代入手順 11 Y0=STY+MDY,Y1=EDY代入手順 12 X0=STX,X1=STX+MDX,Y0=S
TY,Y1=STY+MDY代入手順 13 X0=STX,X1=STX+MDX,Y0=S
TY+MDY,Y1=EDY代入手順 14 X0=STX+MDX,X1=EDX,Y0=S
TY,Y1=STY+MDY代入手順 15 X0=STX+MDX,X1=EDX,Y0=S
TY+MDY,Y1=EDY代入手順 16 I,4比較手順 17 X0,STX代入手順 18 I零クリア手順 19 I番目垂直ライン上の画素の濃度値積算手順 20 積算値、β比較手順 21 I,文字幅比較手順 22 X1,EDX代入手順 23 X1,STX+I代入手順 24 Y0,STY代入手順 25 I番目水平ライン上の画素の濃度値積算手順 26 積算値、α比較手順 27 I,文字高さ比較手順 28 Y1,EDY代入手順 29 Y1,STY+I代入手順 30 I零クリア,J初期化手順 31 YL(J),I代入手順 32 カウンタJインクレメント手順 33 YL(J),EDY代入手順 34 カウンタK初期化手順 35 Y0=STY,Y1=YL(K)代入手順 36 カウンタKインクレメント手順 37 K,J比較手順 38 Y0=YL(K−1),Y1=YL(K)代入手
順 39 X0=STX+I代入手順 40 Y0=STY+I代入手順 41 文字全領域の一定しきい値による二値パターン化
手順 42 縦方向に分割しての二値パターン化手順 43 横方向に分割しての二値パターン化手順 44 縦横方向に分割しての二値パターン化手順 45 二値パターン認識手順 46 候補文字,特徴量保存手順 47 I,4比較手順 48 I=2代入順 49 VM(1),VM(I)比較手順 50 VM(1),CH(1)置き換え手順 51 CH(1)の文字,認識出力手順 52 カウンタJ初期化手順 53 CH(J),CH(I)比較手順 54 I,J比較手順 55 CNT(J)零クリア手順 56 CNT(J),1代入手順 57 CNT(I)インクレメント手順 58 J,4比較手順 59 CNT(I),3比較手順 60 CNT(I),2比較手順 61 J,I+1代入手順 62 CH(I)の文字,認識出力手順 93 濃淡画像 94 分割された濃淡画像 95 分割された二値画像 96 二値画像 97 原画像 98 X方向黒画素ヒストグラム 99 Y方向黒画素ヒストグラム 100 撮像装置 101 画像二値化手段 102 特徴量計算手段 103 特徴量比較手段 104 文字判定手段 105 基準パターン

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 濃淡画像中の文字の存在する矩形領域を
    あるしきい値を用いて二値化し、白黒の文字パターンを
    抽出する方法において、文字の矩形領域を左右方向にあ
    る比率で2分割してできた2つの領域それぞれの平均濃
    度を求め、各領域毎にその平均濃度に応じたしきい値で
    二値化し、各領域の二値パターンを組み合せ文字パター
    ンとすることを特徴とする文字パターン抽出方法。
  2. 【請求項2】 濃淡画像中の文字の存在する矩形領域を
    あるしきい値を用いて二値化し、白黒の文字パターンを
    抽出する方法において、文字の矩形領域を上下方向にあ
    る比率で2分割してできた2つの領域それぞれの平均濃
    度を求め、各領域毎にその平均濃度に応じたしきい値で
    二値化し、各領域の二値パターンを組み合せ文字パター
    ンとすることを特徴とする文字パターン抽出方法。
  3. 【請求項3】 濃淡画像中の文字の存在する矩形領域を
    あるしきい値を用いて二値化し、白黒の文字パターンを
    抽出する方法において、文字の矩形領域を上下左右にあ
    る比率で2分割してできた4つの領域それぞれの平均濃
    度を求め、各領域毎にその平均濃度に応じたしきい値で
    二値化し、4つの領域の二値パターンを組み合せ文字パ
    ターンとすることを特徴とする文字パターン抽出方法。
  4. 【請求項4】 濃淡画像中の文字の存在する矩形領域を
    あるいしき値を用いて二値化し、白黒の文字パターンを
    抽出する方法において、矩形領域の各垂直ライン上の濃
    度値を積算し、その積算値がある一定値以下の垂直ライ
    ンが存在した場合、その水平ラインを境に矩形領域を左
    右に分割し、分割されてできた各領域毎にその平均濃度
    を求め、各領域毎にその平均濃度に応じたしきい値で二
    値化し、各領域の二値パターンを組み合せ文字パターン
    とすることを特徴とする文字パターン抽出方法。
  5. 【請求項5】 濃淡画像中の文字の存在する矩形領域を
    あるいしき値を用いて二値化し、白黒の文字パターンを
    抽出する方法において、矩形領域の各水平ライン上の濃
    度値を積算し、その積算値がある一定値以下の水平ライ
    ンが存在した場合、その水平ラインを境に矩形領域を上
    下に分割し、分割されてできた各領域毎にその平均濃度
    を求め、各領域毎にその平均濃度に応じたしきい値で二
    値化し、各領域の二値パターンを組み合せ文字パターン
    とすることを特徴とする文字パターン抽出方法。
  6. 【請求項6】 濃淡画像中の文字の存在する矩形領域を
    あるいしき値を用いて二値化し、白黒の文字パターンを
    抽出する方法において、矩形領域の各水平ライン上の濃
    度値を積算し、その積算値がある一定値以下の水平ライ
    ンが存在した場合、その水平ラインを境に矩形領域を上
    下に分割し、矩形領域の各垂直ライン上の濃度値を積算
    し、その積算値がある一定値以下の垂直ラインが存在し
    た場合、その水平ラインを境に矩形領域を左右に分割
    し、分割されてできた各領域毎にその平均濃度を求め、
    各領域毎にその平均濃度に応じたしきい値で二値化し、
    各領域の二値パターンを組み合せ文字パターンとするこ
    とを特徴とする文字パターン抽出方法。
  7. 【請求項7】 濃淡画像の矩形領域を二値化し、白黒の
    文字パターンを抽出し、得られた文字パターンの特徴量
    を計算し、あらかじめ計算された複数の文字の基準パタ
    ーンの特徴量との差を算出し、その差の最も少ない基準
    パターンの文字に認識する方法において、矩形領域全体
    をあるしきい値で二値化して得られる文字パターンと左
    右方向に分割してできる各領域毎にしきい値を決めて得
    られるパターンと上下方向に分割してできる各領域毎に
    しきい値を決めて得られるパターンと矩形領域を上下左
    右それぞれの方向に分割してできる各領域毎にしきい値
    を決め二値化して得られるパターンと、それぞれを基準
    パターンと比較し最も相違度の少ない候補を同定とした
    後、それら4つの候補のうち、特徴量の差が最も少ない
    文字を最終的な候補として認識することを特徴とする文
    字認識方法。
  8. 【請求項8】 濃淡画像の矩形領域を二値化し、白黒の
    文字パターンを抽出し、得られた文字パターンの特徴量
    を計算し、あらかじめ計算された複数の文字の基準パタ
    ーンの特徴量との差を算出し、その差の最も少ない基準
    パターンの文字に認識する方法において、矩形領域全体
    をあるしきい値で二値化して得られる文字パターンと左
    右方向に分割してできる各領域毎にしきい値を決めて得
    られるパターンと上下方向に分割してできる各領域毎に
    しきい値を決めて得られるパターンと矩形領域を上下左
    右それぞれの方向に分割してできる各領域毎にしきい値
    を決め二値化して得られるパターンと、それぞれを基準
    パターンと比較し最も相違度の少ない候補を同定とした
    後、それら4つの候補のうち、3つ以上の候補が同じ文
    字であった場合には、その文字を最終的な候補として認
    識し、2つが同じ文字で残りの2つがそれぞれ違う文字
    の場合は2つの候補となった文字の最終的な候補の文字
    として認識し、4つの候補が2つづつ2種類の文字とな
    った場合と4つの候補が全部違う文字であった場合は、
    4つの候補のうち特徴徴量の差が最も少ない文字を最終
    的な候補として認識することを特徴とする文字認識方
    法。
JP6090106A 1994-04-27 1994-04-27 文字パターン抽出方法及びその認識方法 Pending JPH07296113A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6090106A JPH07296113A (ja) 1994-04-27 1994-04-27 文字パターン抽出方法及びその認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6090106A JPH07296113A (ja) 1994-04-27 1994-04-27 文字パターン抽出方法及びその認識方法

Publications (1)

Publication Number Publication Date
JPH07296113A true JPH07296113A (ja) 1995-11-10

Family

ID=13989274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6090106A Pending JPH07296113A (ja) 1994-04-27 1994-04-27 文字パターン抽出方法及びその認識方法

Country Status (1)

Country Link
JP (1) JPH07296113A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356389C (zh) * 2002-12-26 2007-12-19 富士通株式会社 视频文本处理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356389C (zh) * 2002-12-26 2007-12-19 富士通株式会社 视频文本处理装置

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
CN107784669A (zh) 一种光斑提取及其质心确定的方法
CN109886896A (zh) 一种蓝色车牌分割与矫正方法
CN103034848B (zh) 一种表单类型的识别方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN111461131B (zh) 身份证号码信息识别方法、装置、设备及存储介质
US20030012438A1 (en) Multiple size reductions for image segmentation
CN110991440B (zh) 一种像素驱动的手机操作界面文本检测方法
JPH06215293A (ja) 車番認識装置
JP2001043313A (ja) 文字切出し方法
EP1296283A2 (en) Half-tone dot elimination method and system thereof
JP3416058B2 (ja) 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体
US9934599B2 (en) Method of capturing and reconstructing court lines
Bala et al. Image simulation for automatic license plate recognition
JPH07296113A (ja) 文字パターン抽出方法及びその認識方法
JPH0256688A (ja) 文字切出し装置
CN104794469A (zh) 基于图像异构计算的实时视频流文字定位方法
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
JP2000357287A (ja) ナンバープレート認識方法および認識装置
CN117291208B (zh) 一种二维码提取方法及系统
CN116994261B (zh) 一种大数据精准教学智能题卡图像智能识别系统
JP3104355B2 (ja) 特徴抽出装置
JP2789622B2 (ja) 文字/図形領域判定装置
Wang et al. The Chinese characters extraction method based on area Voronoi diagram in inscription