JP2000163516A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP2000163516A JP2000163516A JP10341390A JP34139098A JP2000163516A JP 2000163516 A JP2000163516 A JP 2000163516A JP 10341390 A JP10341390 A JP 10341390A JP 34139098 A JP34139098 A JP 34139098A JP 2000163516 A JP2000163516 A JP 2000163516A
- Authority
- JP
- Japan
- Prior art keywords
- character
- observation point
- contribution
- character pattern
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
識できる文字認識装置を提供する。 【解決手段】 二値の文字パターンの正規化処理を行う
正規化手段2と、正規化処理後の文字パターンをぼかし
て多値の文字パターンを作成するぼかし手段10と、上
記多値の文字パターンを外側から内側に向けて走査し、
走査方向に画素の濃度が増加するゼロ交差点と交差した
点を観測点として特徴を抽出するための観測点を求める
観測点抽出手段11と、この観測点抽出手段で求めた各
観測点から文字の局所的な形状を表わす多値方向寄与度
を抽出する多値方向寄与度抽出手段12と、この多値方
向寄与度抽出手段で求めた多値方向寄与度から文字の識
別に用いる特徴量を生成する特徴生成手段5と、この特
徴生成手段で生成した特徴量を用いて文字を識別する文
字識別手段6と、を備える。
Description
する文字認識装置、特にその特徴抽出に関するものであ
る。
パターンから特徴量を抽出し、その特徴量を予め文字毎
に用意した標準の特徴量と比較することで文字を認識す
る。この特徴量に外郭方向寄与度特徴を用いた方式とし
て、例えば、電子情報通信学会誌1983,J66−
D,No.10, “外郭方向寄与度特徴による手書漢
字の識別”,1185〜1192頁、に示す従来方式が
ある。以下、この従来方式について図6〜10を用いて
説明する。
構成を示すブロック図であり、図において1は二値の文
字パターン、2は正規化手段、3は外郭点抽出手段、4
は方向寄与度抽出手段、5は特徴生成手段、6は文字識
別手段であり、2〜6は例えばプログラムに従って動作
するコンピュータにより構成される。
図であり、70は正規化した文字パターン、71は深度
1の観測点、72は深度1と深度2の観測点である。
する図であり、80は観測点、81は観測点から触手を
伸ばす方向である。
である。
する図であり、100は掠れた文字パターン、101と
102は走査線、103と104は深度1の観測点であ
る。以下、従来の装置の動作を図6〜10に基づいて説
明する。
を所定の文字枠サイズに収める正規化処理を行う。
ターンから特徴を抽出するための観測点を求める。具体
的には、正規化した文字パターンの上、下、左、右、右
上、右下、左下、左上の各走査方向より文字の内側に向
けて走査を行い、最初に白画素から黒画素に変化する点
を深度1の観測点、2番目に白画素から黒画素に変化す
る点を深度2の観測点として、深度M(M>1)までの観
測点を求める。従って、深度の値が小さいほど文字の外
郭に近い観測点となる。例えば、図7に示す正規化した
文字パターン70に対して右側(D=1)から走査を行っ
た場合、深度1の観測点は文字パターン71の太線部
分、深度1と深度2の観測点は文字パターン72の太線
部分となる。
段3で得た各観測点において文字の局所的な構造を表わ
す方向寄与度を求める。ここでは、図8に示すように、
観測点80を中心として所定の方向81(8方向)に向け
て黒画素が続くかぎり触手を伸ばし、方向毎に黒画素が
連続する長さLd(方向d=1〜8)を求め、この長さL
dを元に式(1)に従い方向寄与度Xn(n=1〜4)を求
める。この方向寄与度は観測点を中心にして縦、横、右
斜め、左斜め方向に黒画素がどの程度連続しているかを
表わす4次元の特徴である。
段4で求めた各観測点の方向寄与度を元に、文字の識別
に用いる特徴量として外郭方向寄与度特徴を生成する。
ここでは、まず図7に示す走査方向D(D=1〜8)と平
行に、正規化した文字パターンをN個の短冊領域に分割
する。例えば右側からの走査(D=1)の場合は図9に示
す短冊領域を得る。次に各短冊領域に含まれる観測点群
の方向寄与度Xn(n=1〜4)を深度毎に集計する。こ
れにより各短冊領域から次元数A{A=深度(M)×集計
した方向寄与度の次元数(4次元)}の特徴量を得る。こ
れを全ての短冊領域から求めて合計した特徴量(次元数
=走査方向数(8方向)×短冊領域数(N)×A)が、外郭
方向寄与度特徴である。
で得た外郭方向寄与度特徴を予め文字毎に用意した標準
的な外郭方向寄与度特徴と比較することで、文字パター
ンを認識する。
して以上のようなものがあったが、一般に文字が潰れた
場合でも、文字の外郭部分は変形が少ない。そのため文
字の外郭部分に注目した外郭方向寄与度特徴は潰れた文
字を高精度に認識できる。しかし文字が掠れた場合は、
(1)観測点の位置がずれる、(2)方向寄与度の触手が途
切れる、ことにより認識率が悪くなる問題がある。例え
ば、図10に示す掠れた文字パターン100において、
走査線102上で検出した深度1の観測点104は本来
深度2の観測点であり、位置がずれている。また、走査
線101上で検出した深度1の観測点103では、観測
点から下方向に伸ばした触手が掠れにより途切れる。
された文字認識装置では、方向寄与度を求める際に、途
切れた触手の進行方向にある画素を調べ、進行方向の所
定距離内に黒画素がある場合は、白画素を飛び越して触
手の進行を続けることで、触手の途切れに対処してい
る。しかし、観測点の位置ずれに対する対策はなく、掠
れ文字を高精度に認識するには十分でない。従来の文字
認識装置には以上のような問題点があった。
されたものであり、潰れた文字と掠れた文字の両方を高
精度に認識できる文字認識装置の提供を目的とする。
明は、二値の文字パターンの正規化処理を行う正規化手
段と、正規化処理後の文字パターンをぼかして多値の文
字パターンを作成するぼかし手段と、上記多値の文字パ
ターンを外側から内側に向けて走査し、走査方向に画素
の濃度が増加するゼロ交差点と交差した点を観測点とし
て特徴を抽出するための観測点を求める観測点抽出手段
と、この観測点抽出手段で求めた各観測点から文字の局
所的な形状を表わす多値方向寄与度を抽出する多値方向
寄与度抽出手段と、この多値方向寄与度抽出手段で求め
た多値方向寄与度から文字の識別に用いる特徴量を生成
する特徴生成手段と、この特徴生成手段で生成した特徴
量を用いて文字を識別する文字識別手段と、を備えるこ
とを特徴とする文字認識装置にある。
化処理を行う多値文字パターン正規化手段と、上記正規
化処理した多値の文字パターンを外側から内側に向けて
走査し、走査方向に画素の濃度が増加するゼロ交差点と
交差した点を観測点として特徴を抽出するための観測点
を求める観測点抽出手段と、この観測点抽出手段で求め
た各観測点から文字の局所的な形状を表わす多値方向寄
与度を抽出する多値方向寄与度抽出手段と、この多値方
向寄与度抽出手段で求めた多値方向寄与度から文字の識
別に用いる特徴量を生成する特徴生成手段と、この特徴
生成手段で生成した特徴量を用いて文字を識別する文字
識別手段と、を備えることを特徴とする文字認識装置に
ある。
手段において、多値の文字パターン上にある観測点の濃
度を元に閾値を設定し、観測点から所定の方向にむけて
触手を伸ばして閾値よりも高い濃度を持つ画素が連続す
る長さを求め、この長さを元に多値方向寄与度を計算す
ることを特徴とする文字認識装置にある。
実施の形態による文字認識装置ついて図1〜図4を用い
て説明する。図1は本発明の一実施の形態による文字認
識装置の構成図である。図中、従来例と同一または相当
部分は同一の符号を付し、その説明を省略する。図にお
いて10はぼかし手段、11は観測点抽出手段、12は
多値方向寄与度抽出手段である。なお、2,10,1
1,12,5,6は例えばプログラムに従って動作する
コンピュータにより構成される。
であり、20は多値の文字パターンである。
る図であり、30はゼロ交差点、31は深度1の観測
点、32は深度1と深度2の観測点である。
を説明する図であり、40は観測点である。
作を説明する。まず、正規化手段2は二値の文字パター
ン1を所定の文字枠サイズに収める正規化処理を行う。
ターンから、ぼかした多値の文字パターンを作成する。
具体的には、まず正規化された文字パターンにおいて、
画素(x,y)の濃度I(x,y)を黒画素の場合は1、白画素の
場合は0とする。次に、濃度I(x,y)を式(2)に従い変更
する。ここでtは時間であり、tが所定時間Tとなるま
で処理を繰返した時の濃度IT(x,y)を、ぼかした多値の
文字パターンにおける画素(x,y)の濃度とする。例え
ば、図2に示す掠れた文字パターン100に本処理を適
用することで、ぼかした多値の文字パターン20を得
る。
観測点抽出手段11は、前記ぼかし手段10で作成した
多値の文字パターンから観測点を求める。ここでは最初
に、ぼかし手段10で作成した多値の文字パターンの各
画素(x,y)に対してラプラシアン(2次の微分)処理であ
る式(3)を適用し、多値の文字パターンにおける濃度変
化量J(x,y)を求める。ここでJ(x,y)の値は正から負の連
続値を取り、J(x,y)=0となる画素(x,y)は多値の文字
パターン上で濃度が急激に変化する画素である。このJ
(x,y)=0となる画素(x,y)はゼロ交差点(またはゼロ・
クロッシング)と呼ばれる。ゼロ交差点については“コ
ンピュータ画像処理入門”,田村秀行監修,総研出版,
123〜125頁に詳しく説明されている。例えば、図
3に示すように、二値の掠れた文字パターン100から
作成した多値の文字パターン20に対して上記処理を適
用するとゼロ交差点の分布30を得る。ここでゼロ交差
点の分布30は掠れの影響が補正された文字の輪郭とな
っていることが分かる。
右、右上、右下、左下、左上の走査方向より各々、文字
の内側に向けて走査を行い、最初に走査線方向に画素の
濃度が増加(画素の色が白から黒に変化)するゼロ交差点
を深度1の観測点、2番目に走査線方向に画素の濃度が
増加するゼロ交差点を深度2の観測点として、深度M
(M>1)までの観測点を求める。例えば、図3に示す多
値の文字パターン20に対して右側から走査を行った場
合、深度1の観測点は文字パターン31の太線部分、深
度1と深度2の観測点は文字パターン32の太線部分と
なる。
抽出手段11で得た各観測点から文字の局所的な構造を
表わす多値方向寄与度を抽出する。具体的には、まず多
値の文字パターン上で、観測点の画素が持つ濃度の値よ
りも小さい値を閾値として設定する。そして観測点を中
心に所定の方向に向けて閾値よりも高い濃度の画素が続
くかぎり触手を伸ばす。例えば、図4において40は多
値の文字パターンにおける各画素(x,y)の濃度を0〜1
6の値で示したマトリクスとする。ここでマトリクス中
の値が大きいほど画素の濃度が高い(画素の色が黒い)。
マトリクスの中心を観測点41とした場合、観測点41
が持つ濃度は値10であるため、例えば閾値を6と設定
する。この時、観測点41から所定の方向42に向けて
伸ばした触手は、マトリクス40上の灰色で示した領域
となる。具体的に、方向dへ伸びた触手の長さL’d(d
=1〜8)は L’1=1、L’2=3、L’3=4、L’4=
2、L’5=3、L’6=3、L’7=3、L’8=0となる。
このd方向へ伸びた触手の長さL’dから、式(4)に従い
多値方向寄与度X’n(n=1〜4)を求める。
出手段12で得た各観測点が持つ多値方向寄与度から、
文字の識別に用いる特徴量である外郭ゼロ交差特徴を生
成する。処理内容は従来例と同じであり、従来例で用い
た方向寄与度が多値方向寄与度に置き換わっただけであ
る。具体的には、まず文字の外側からの走査方向D(D
=1〜8)と平行に、多値の文字パターンをN個の短冊
領域に分割する。そして各短冊領域に含まれるの観測点
が持つ多値方向寄与度X’n(n=1〜4)の値を深度毎に
集計する。これにより各短冊領域から次元数A{A=深
度(M)×集計した多値方向寄与度の次元数(4次元)}の
特徴量を得る。この特徴量を全ての短冊領域から求めて
合計した特徴量{次元数=走査方向数(8方向)×短冊領
域数(N)×A}が外郭ゼロ交差特徴である。
で得た外郭ゼロ交差特徴を予め文字毎に用意した標準的
な外郭ゼロ交差特徴と比較することで、文字パターンを
認識する。
特徴は文字の外郭形状に注目した特徴であるため、潰れ
た文字を高精度に認識できる。さらに観測点抽出手段1
1では、ぼかした多値の文字パターンから抽出したゼロ
交差点より文字の観測点を求めるため、入力された二値
の文字パターンが掠れていても、正しい観測点の位置を
抽出することができる。また、多値方向寄与度抽出手段
12は、ぼかした多値の文字パターン上で、観測点の画
素が持つ濃度の値よりも小さい値を閾値とし、観測点を
中心に所定の方向に向けて閾値よりも高い濃度の画素が
続くかぎり触手を伸ばすため、入力された二値の文字パ
ターンが少々掠れていても、触手が途切れることはな
い。そのため掠れた文字も高精度に認識できる。
て、入力された二値の文字パターン1から、ぼかし手段
10によって擬似的な多値の文字パターンを作成した
が、多値の階調を持つCCDカメラやスキャナ等で取得
した多値の文字パターンを直接入力してもよい。
5を用いて説明する。図中、上記実施の形態1と共通な
部分は同一の符号を付し、説明を省略する。
全体構成を示す図である。図中の50は多値の文字パタ
ーン、51は多値文字パターン正規化手段である。な
お、51,11,12,5,6は例えばプログラムに従
って動作するコンピュータにより構成される。
説明する。ここで多値文字パターン正規化手段51以外
の動作は実施の形態1と同じであるため説明を省略す
る。
は、入力された多値の文字パターン50を正規化する。
具体的には、多値の文字パターン50を所定の文字枠サ
イズに収めると共に、多値の文字パターン50上にある
画素の最大濃度値を1に、最小濃度値を0になるよう濃
度値のレンジを正規化する。
度抽出手段12、特徴生成手段5では、多値文字パター
ン正規化手段51で正規化した多値の文字パターンに対
して、実施の形態1と同様な処理を行い、外郭ゼロ交差
特徴を求める。
ターンが文字認識装置に入力された場合でも、外郭ゼロ
交差特徴が抽出して、文字を認識することができる。
ターンの正規化処理を行う正規化手段と、正規化処理後
の文字パターンをぼかして多値の文字パターンを作成す
るぼかし手段と、上記多値の文字パターンを外側から内
側に向けて走査し、走査方向に画素の濃度が増加するゼ
ロ交差点と交差した点を観測点として特徴を抽出するた
めの観測点を求める観測点抽出手段と、この観測点抽出
手段で求めた各観測点から文字の局所的な形状を表わす
多値方向寄与度を抽出する多値方向寄与度抽出手段と、
この多値方向寄与度抽出手段で求めた多値方向寄与度か
ら文字の識別に用いる特徴量を生成する特徴生成手段
と、この特徴生成手段で生成した特徴量を用いて文字を
識別する文字識別手段と、を備えた文字認識装置とした
ので、外郭ゼロ交差特徴は文字の外郭形状に注目した特
徴であるため、潰れた文字を高精度に認識できる。さら
に観測点抽出手段では、ぼかした多値の文字パターンか
ら抽出したゼロ交差点より文字の観測点を求めるため、
入力された二値の文字パターンが掠れていても、正しい
観測点の位置を抽出することができる。
規化処理を行う多値文字パターン正規化手段と、上記正
規化処理した多値の文字パターンを外側から内側に向け
て走査し、走査方向に画素の濃度が増加するゼロ交差点
と交差した点を観測点として特徴を抽出するための観測
点を求める観測点抽出手段と、この観測点抽出手段で求
めた各観測点から文字の局所的な形状を表わす多値方向
寄与度を抽出する多値方向寄与度抽出手段と、この多値
方向寄与度抽出手段で求めた多値方向寄与度から文字の
識別に用いる特徴量を生成する特徴生成手段と、この特
徴生成手段で生成した特徴量を用いて文字を識別する文
字識別手段と、を備えた文字認識装置としたので、多値
の文字パターンが文字認識装置に入力された場合でも、
外郭ゼロ交差特徴を抽出して、文字を認識することがで
きる。
が、ぼかした多値の文字パターン上で、観測点の画素が
持つ濃度の値よりも小さい値を閾値とし、観測点を中心
に所定の方向に向けて閾値よりも高い濃度の画素が続く
かぎり触手を伸ばすため、入力された二値の文字パター
ンが少々掠れていても、触手が途切れることはなく、そ
のため掠れた文字も高精度に認識できる。
の全体の構成を示す図である。
明するための図である。
を説明するための図である。
段の動作を説明するための図である。
の全体の構成を示す図である。
ある。
の図である。
ための図である。
図である。
の図である。
成手段、6 文字識別手段、10 ぼかし手段、11
観測点抽出手段、12 多値方向寄与度抽出手段、20
多値の文字パターン、30 ゼロ交差点の分布、31
深度1の観測点、32 深度1と深度2の観測点、4
0 マトリクス、41 観測点、50多値文字パター
ン、51 多値文字パターン正規化手段。
Claims (3)
- 【請求項1】 二値の文字パターンの正規化処理を行う
正規化手段と、 正規化処理後の文字パターンをぼかして多値の文字パタ
ーンを作成するぼかし手段と、 上記多値の文字パターンを外側から内側に向けて走査
し、走査方向に画素の濃度が増加するゼロ交差点と交差
した点を観測点として特徴を抽出するための観測点を求
める観測点抽出手段と、 この観測点抽出手段で求めた各観測点から文字の局所的
な形状を表わす多値方向寄与度を抽出する多値方向寄与
度抽出手段と、 この多値方向寄与度抽出手段で求めた多値方向寄与度か
ら文字の識別に用いる特徴量を生成する特徴生成手段
と、 この特徴生成手段で生成した特徴量を用いて文字を識別
する文字識別手段と、 を備えることを特徴とする文字認識装置。 - 【請求項2】 多値の文字パターンの正規化処理を行う
多値文字パターン正規化手段と、 上記正規化処理した多値の文字パターンを外側から内側
に向けて走査し、走査方向に画素の濃度が増加するゼロ
交差点と交差した点を観測点として特徴を抽出するため
の観測点を求める観測点抽出手段と、 この観測点抽出手段で求めた各観測点から文字の局所的
な形状を表わす多値方向寄与度を抽出する多値方向寄与
度抽出手段と、 この多値方向寄与度抽出手段で求めた多値方向寄与度か
ら文字の識別に用いる特徴量を生成する特徴生成手段
と、 この特徴生成手段で生成した特徴量を用いて文字を識別
する文字識別手段と、を備えることを特徴とする文字認
識装置。 - 【請求項3】 上記多値方向寄与度抽出手段において、
多値の文字パターン上にある観測点の濃度を元に閾値を
設定し、観測点から所定の方向にむけて触手を伸ばして
閾値よりも高い濃度を持つ画素が連続する長さを求め、
この長さを元に多値方向寄与度を計算することを特徴と
する請求項1または2に記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10341390A JP2000163516A (ja) | 1998-12-01 | 1998-12-01 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10341390A JP2000163516A (ja) | 1998-12-01 | 1998-12-01 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000163516A true JP2000163516A (ja) | 2000-06-16 |
Family
ID=18345701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10341390A Pending JP2000163516A (ja) | 1998-12-01 | 1998-12-01 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000163516A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016444A (ja) * | 2001-07-03 | 2003-01-17 | Nec Corp | パターン認識装置とそのパターン認識方法、及びパターン認識プログラム |
-
1998
- 1998-12-01 JP JP10341390A patent/JP2000163516A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016444A (ja) * | 2001-07-03 | 2003-01-17 | Nec Corp | パターン認識装置とそのパターン認識方法、及びパターン認識プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8335402B1 (en) | Method and system for detecting and recognizing text in images | |
US8644616B2 (en) | Character recognition | |
EP2545499B1 (en) | Text enhancement of a textual image undergoing optical character recognition | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
Kasar et al. | Font and background color independent text binarization | |
EP2112620A2 (en) | Image binarization using dynamic sub-image division | |
US7010166B2 (en) | Character recognition system and method using spatial and structural feature extraction | |
US7130085B2 (en) | Half-tone dot elimination method and system thereof | |
Nandini et al. | Estimation of skew angle in binary document images using hough transform | |
JP3636936B2 (ja) | 濃淡画像の2値化方法および濃淡画像の2値化プログラムを記録した記録媒体 | |
JP2000163516A (ja) | 文字認識装置 | |
El-Zaart | Synthetic aperture radar images segmentation using minimum cross entropy with Gamma distribution | |
Block et al. | Local contrast segmentation to binarize images | |
CN113537216A (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
JP2871590B2 (ja) | 画像抽出方式 | |
JP3150762B2 (ja) | グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式 | |
Sherkat et al. | Use of colour for hand-filled form analysis and recognition | |
JP2785747B2 (ja) | 文字読取装置 | |
Xi et al. | A novel binarization system for degraded document images | |
JP6797763B2 (ja) | 文字認識装置 | |
JP2960468B2 (ja) | 濃淡画像の2値化方法及び装置 | |
JP2003173436A (ja) | 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体 | |
Saini et al. | Echocardiographic Image Segmentation with Threshold Operation | |
CN117853860A (zh) | 一种基于语义分割的表结构识别单元格还原方法 | |
JPH0546733A (ja) | 微生物認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081225 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090310 |