JP2708604B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JP2708604B2 JP2708604B2 JP2083161A JP8316190A JP2708604B2 JP 2708604 B2 JP2708604 B2 JP 2708604B2 JP 2083161 A JP2083161 A JP 2083161A JP 8316190 A JP8316190 A JP 8316190A JP 2708604 B2 JP2708604 B2 JP 2708604B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature
- pattern
- linear
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000012937 correction Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 description 23
- 238000012545 processing Methods 0.000 description 15
- 238000009826 distribution Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000012447 hatching Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、手書き文字等を光学的に読取る光学式文字
読取装置(Optical Chracter Reader、以下、CORとい
う)等に用いられ、伝票等に見られるような記入枠等の
線形図形と文字とが描かれた入力媒体上で線形図形と文
字とが互いに交わる部分がある場合においても、高速か
つ操作性が良く、しかも高精度で文字認識が可能な文字
認識方法に関するものである。
読取装置(Optical Chracter Reader、以下、CORとい
う)等に用いられ、伝票等に見られるような記入枠等の
線形図形と文字とが描かれた入力媒体上で線形図形と文
字とが互いに交わる部分がある場合においても、高速か
つ操作性が良く、しかも高精度で文字認識が可能な文字
認識方法に関するものである。
(従来の技術) 従来、この種の分野の技術としては、特開昭55−1621
76号公報(文献1)、特開昭59−119484号公報(文献
2)、特開昭61−255483号公報(文献3)等に記載され
るものがあった。なお、以下では、入力媒体上に描かれ
た文字、記号及び数字を「文字」と呼び、例えば、記入
枠、アンダーライン、括弧、円、ハッチング、及び網掛
け等の文字の記入位置を示す線形図形と区別する。
76号公報(文献1)、特開昭59−119484号公報(文献
2)、特開昭61−255483号公報(文献3)等に記載され
るものがあった。なお、以下では、入力媒体上に描かれ
た文字、記号及び数字を「文字」と呼び、例えば、記入
枠、アンダーライン、括弧、円、ハッチング、及び網掛
け等の文字の記入位置を示す線形図形と区別する。
OCRでは、帳票上に手書きされた文字を認識する場
合、先ず、帳票上の文字を光電変換装置により量子化さ
れた電気信号(ディジタル信号)である2値画像に変換
し、その2値画像から1文字分の矩形領域の2値画像
(以下、入力文字パターンという)を取出す文字切出し
を行い、さらに、切り出された入力文字パタンについて
認識処理を行っている。この文字切出しを容易にするた
めに、従来のOCRでは、予め定められたフォーマットで
帳票にドロップアウトカラー(OCRの光電変換部は検出
しないが、人間には可視である色)の記入枠を印刷して
おき、記入者にはその記入枠内に入るように文字を記入
させ、OCRは、前述のフォーマットに従って文字切り出
しを行っていた。
合、先ず、帳票上の文字を光電変換装置により量子化さ
れた電気信号(ディジタル信号)である2値画像に変換
し、その2値画像から1文字分の矩形領域の2値画像
(以下、入力文字パターンという)を取出す文字切出し
を行い、さらに、切り出された入力文字パタンについて
認識処理を行っている。この文字切出しを容易にするた
めに、従来のOCRでは、予め定められたフォーマットで
帳票にドロップアウトカラー(OCRの光電変換部は検出
しないが、人間には可視である色)の記入枠を印刷して
おき、記入者にはその記入枠内に入るように文字を記入
させ、OCRは、前述のフォーマットに従って文字切り出
しを行っていた。
しかしながら、記入枠の印刷色にOCRの機種ごとに規
定されたドラップアウトカラーを使用しなければならな
いので、帳票設計の自由度が狭くなり、その上、帳票の
設計及び製作コストが高くなるという問題があった。ま
た、複数の機種のOCRで同時に使用できるような帳票を
設計しようとすると、記入枠の色が大幅に限定されてし
まうという問題があった。
定されたドラップアウトカラーを使用しなければならな
いので、帳票設計の自由度が狭くなり、その上、帳票の
設計及び製作コストが高くなるという問題があった。ま
た、複数の機種のOCRで同時に使用できるような帳票を
設計しようとすると、記入枠の色が大幅に限定されてし
まうという問題があった。
以上の理由から、記入枠の印刷色に対する制限除去の
要望が高かった。
要望が高かった。
ところが、記入枠の印刷にドロップアウトカラーを使
用しない場合、第2図(a),(b),(c)に示すよ
うに、記入文字1が記入枠2に対して交差部分3のよう
に交差することがある。したがって、文字の部分から記
入枠を除去する処理が必要である。このような記入枠除
去を考慮した文字認識方法として、上記の文献1、文献
2、文献3が提案されていた。
用しない場合、第2図(a),(b),(c)に示すよ
うに、記入文字1が記入枠2に対して交差部分3のよう
に交差することがある。したがって、文字の部分から記
入枠を除去する処理が必要である。このような記入枠除
去を考慮した文字認識方法として、上記の文献1、文献
2、文献3が提案されていた。
文献1に記載された方法は、伝票等の線形図形と文字
が書かれた原稿の情報から、線形図形と文字とを抽出す
る、あるいは文字のみを抽出することを目的とする。こ
の方法は、入力文字パタンを走査し、この黒ビットの連
続である黒ランを検出してこれを記憶部に残しておき、
その情報から当該線候補の太さと長さに関する条件を満
たす画像を線図形として抽出する。さらに、該線図形を
消去すると共に、該線図形と他の画像が交わっている部
分の画情報を得ようとするものである。
が書かれた原稿の情報から、線形図形と文字とを抽出す
る、あるいは文字のみを抽出することを目的とする。こ
の方法は、入力文字パタンを走査し、この黒ビットの連
続である黒ランを検出してこれを記憶部に残しておき、
その情報から当該線候補の太さと長さに関する条件を満
たす画像を線図形として抽出する。さらに、該線図形を
消去すると共に、該線図形と他の画像が交わっている部
分の画情報を得ようとするものである。
文献2に記載された方法は、記入枠を輪郭追跡して変
位が予め定められた閾値と比較し、輪郭位置を修正して
いくことにより、記入枠部分の輪郭を追跡抽出していく
ものである。記入枠を検出することにより、文字の部分
と記入枠部分とを分離することを目的とする。
位が予め定められた閾値と比較し、輪郭位置を修正して
いくことにより、記入枠部分の輪郭を追跡抽出していく
ものである。記入枠を検出することにより、文字の部分
と記入枠部分とを分離することを目的とする。
文献3に記載された方法は、記入枠を含む1文字分の
画像データから構成画素によって囲まれ全領域の抽出手
段、背景画素領域の抽出手段、及び記入枠に対応する画
素の検出手段を備え、前記画像データから検出された記
入枠に対応する画素を分離することにより、文字部分と
記入枠とを分離するものである。
画像データから構成画素によって囲まれ全領域の抽出手
段、背景画素領域の抽出手段、及び記入枠に対応する画
素の検出手段を備え、前記画像データから検出された記
入枠に対応する画素を分離することにより、文字部分と
記入枠とを分離するものである。
(発明が解決しようとする課題) しかしながら、上記の文字認識方法では、次のような
課題があった。
課題があった。
上記文献1及び文献3の方法では、入力媒体を何度も
走査なければならないので、処理時間がかかると共に、
中間情報をメモリに蓄える必要があり、そのためのハー
ドウェアが要求され、文字認識方法を実施するための装
置が大型化するという問題があった。
走査なければならないので、処理時間がかかると共に、
中間情報をメモリに蓄える必要があり、そのためのハー
ドウェアが要求され、文字認識方法を実施するための装
置が大型化するという問題があった。
また、文献2の方法では、入力媒体について、複雑な
処理である輪郭追跡を行わなければならないので、処理
時間がかかると共に、実施用の装置が複雑になるという
問題があった。
処理である輪郭追跡を行わなければならないので、処理
時間がかかると共に、実施用の装置が複雑になるという
問題があった。
本発明は、前記従来技術が持っていた課題として、処
理時間がかかる点及び装置が大型化する点について解決
した文字認識方法を提供するものである。
理時間がかかる点及び装置が大型化する点について解決
した文字認識方法を提供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、線形図形及び文
字が描かれた入力媒体を光電変換して2値画像を生成
し、その2値画像から該文字に対応した矩形領域の切出
し処理を行い、該矩形領域の2値画像を用いて前記文字
の認識を行う文字認識方法において、前記矩形領域の切
出し処理後、その矩形領域内における文字の背景部分に
存在する前記線形図形の特徴を抽出し、予め標準特徴メ
モリに格納された標準特徴に対して、前記線形図形の特
徴に基づき修正を施して修正標準特徴を生成すると共
に、前記矩形領域の2値画像の特徴を抽出し、前記矩形
領域の2値画像の特徴と修正標準特徴との照合を行うよ
うにしたものである。
字が描かれた入力媒体を光電変換して2値画像を生成
し、その2値画像から該文字に対応した矩形領域の切出
し処理を行い、該矩形領域の2値画像を用いて前記文字
の認識を行う文字認識方法において、前記矩形領域の切
出し処理後、その矩形領域内における文字の背景部分に
存在する前記線形図形の特徴を抽出し、予め標準特徴メ
モリに格納された標準特徴に対して、前記線形図形の特
徴に基づき修正を施して修正標準特徴を生成すると共
に、前記矩形領域の2値画像の特徴を抽出し、前記矩形
領域の2値画像の特徴と修正標準特徴との照合を行うよ
うにしたものである。
さらに、前記線形図形の特徴を、前記線形図形の2次
元位置とし、前記標準特徴に対する修正を、前記線形図
形の2次元位置で表す前記線形図形の特徴に基づき、前
記背景部分に存在する線形図形の特徴を付加して行うよ
うにしてもよい。
元位置とし、前記標準特徴に対する修正を、前記線形図
形の2次元位置で表す前記線形図形の特徴に基づき、前
記背景部分に存在する線形図形の特徴を付加して行うよ
うにしてもよい。
(作 用) 本発明によれば、以上のように文字認識方法を構成し
たので、2値画像が入力されると、矩形領域の切出し処
理がなされ、その矩形領域内における文字の背景部分に
存在する線形図形の特徴を、例えば線形図形の2次元位
置として抽出する。その抽出結果に基づき標準特徴に対
し、例えば線形図形の2次元位置を表す前記背景部分に
存在する線形図形の特徴を付加するような修正を施して
修正標準特徴を生成する。と同時に、矩形領域の特徴を
抽出して、その矩形領域の特徴と修正標準特徴の特徴と
の照合を行えば、簡単かつ的確に文字の認識が行える。
たので、2値画像が入力されると、矩形領域の切出し処
理がなされ、その矩形領域内における文字の背景部分に
存在する線形図形の特徴を、例えば線形図形の2次元位
置として抽出する。その抽出結果に基づき標準特徴に対
し、例えば線形図形の2次元位置を表す前記背景部分に
存在する線形図形の特徴を付加するような修正を施して
修正標準特徴を生成する。と同時に、矩形領域の特徴を
抽出して、その矩形領域の特徴と修正標準特徴の特徴と
の照合を行えば、簡単かつ的確に文字の認識が行える。
したがって、前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示す文字認識方法を実施
するための文字認識装置の構成ブロック図である。
するための文字認識装置の構成ブロック図である。
この文字認識装置は、線形図形である記入枠及び文字
が描かれた所定形式の入力媒体(帳票等)からの光信号
Lを入力するための入力端10を有し、その入力端10に
は、その光信号Lを量子化された電気信号(2値のディ
ジタル信号)に変換して2値画像Gを生成するCCDセン
サ等の光電変換部12が接続されている。光電変換部12の
出力側には、2値画像Gから入力媒体上の1文字に対応
した矩形領域である入力文字パタンの切出し処理をした
後、その矩形領域内における文字の背景部分に存在する
線形図形の特徴を抽出する前処理部13が接続されてい
る。ここで、前処理部13は、2値画像G中の文字列1行
分を格納するラインバッファと、そのラインバッファか
ら入力文字パタンを切出す切出し部と、切出し部により
切出しされた入力文字パタンを一時保持するパタンレジ
スタ(容量は、例えば64×64ビット)とを、備えてい
る。
が描かれた所定形式の入力媒体(帳票等)からの光信号
Lを入力するための入力端10を有し、その入力端10に
は、その光信号Lを量子化された電気信号(2値のディ
ジタル信号)に変換して2値画像Gを生成するCCDセン
サ等の光電変換部12が接続されている。光電変換部12の
出力側には、2値画像Gから入力媒体上の1文字に対応
した矩形領域である入力文字パタンの切出し処理をした
後、その矩形領域内における文字の背景部分に存在する
線形図形の特徴を抽出する前処理部13が接続されてい
る。ここで、前処理部13は、2値画像G中の文字列1行
分を格納するラインバッファと、そのラインバッファか
ら入力文字パタンを切出す切出し部と、切出し部により
切出しされた入力文字パタンを一時保持するパタンレジ
スタ(容量は、例えば64×64ビット)とを、備えてい
る。
さらに、前処理部13には、線形図形の特徴の抽出結果
に基づき、標準特徴メモリ17aに予め格納された標準特
徴に対して背景部分に存在する線形図形の特徴を付加し
て修正標準特徴を生成する標準特徴修正部17と、入力文
字パタンから文字の認識に必要な特徴を抽出する特徴抽
出部14とが接続されている。ここで、標準特徴メモリ17
aは、RAM(ランダム・アクセス・メモリ)等で構成さ
れ、数字を認識対称とした10種類の標準特徴が格納され
ている。
に基づき、標準特徴メモリ17aに予め格納された標準特
徴に対して背景部分に存在する線形図形の特徴を付加し
て修正標準特徴を生成する標準特徴修正部17と、入力文
字パタンから文字の認識に必要な特徴を抽出する特徴抽
出部14とが接続されている。ここで、標準特徴メモリ17
aは、RAM(ランダム・アクセス・メモリ)等で構成さ
れ、数字を認識対称とした10種類の標準特徴が格納され
ている。
特徴抽出部14の出力側には、その特徴抽出部14から抽
出された入力文字パタンの特徴を格納するRAM等の入力
パタン特徴メモリ15と、入力文字パタンの特徴と修正標
準特徴との照合を行って文字の識別を行う識別部16と
が、接続されている。
出された入力文字パタンの特徴を格納するRAM等の入力
パタン特徴メモリ15と、入力文字パタンの特徴と修正標
準特徴との照合を行って文字の識別を行う識別部16と
が、接続されている。
ここで、特徴抽出部14は、入力文字パタンの線幅を算
出する線幅計算部と、その入力文字パタンの文字線部
(黒画素の部分)に外接する文字枠を検出する文字枠検
出部と、入力文字パタンを格納するためのパタンレジス
タと、各走査方向別のサブパタンを格納するサブパタン
メモリとを備えている。パタンレジスタ及びサブパタン
メモリ上にはX−Y座標系を仮想的に設定している。
出する線幅計算部と、その入力文字パタンの文字線部
(黒画素の部分)に外接する文字枠を検出する文字枠検
出部と、入力文字パタンを格納するためのパタンレジス
タと、各走査方向別のサブパタンを格納するサブパタン
メモリとを備えている。パタンレジスタ及びサブパタン
メモリ上にはX−Y座標系を仮想的に設定している。
第3図は入力文字パタンの切出し処理を示す図、及び
第4図は切出された入力文字パタンの一例を示す図であ
り、これらの図を参照しつつ、上記のように構成される
文字認識装置を用いて実施される文字認識方法を説明す
る。
第4図は切出された入力文字パタンの一例を示す図であ
り、これらの図を参照しつつ、上記のように構成される
文字認識装置を用いて実施される文字認識方法を説明す
る。
例えば、第2図(b)に示すような入力媒体の光信号
Lが入力端10より光電変換部12に入力されると、その光
信号Lは2値のディジタル信号に変換される。即ち、文
字線部は“1"とし、その文字線部以外の領域は“0"とす
る2値画像Gが生成される。その後、前処理部13におい
て、2値画像Gから入力文字パタンが次のようにして切
出される。
Lが入力端10より光電変換部12に入力されると、その光
信号Lは2値のディジタル信号に変換される。即ち、文
字線部は“1"とし、その文字線部以外の領域は“0"とす
る2値画像Gが生成される。その後、前処理部13におい
て、2値画像Gから入力文字パタンが次のようにして切
出される。
第3図において、ラインバッファ上にX軸及びY軸を
設定し、記入枠を表す直線をX=xp、X=xq、Y=yp、
Y=yqとする。なお、各直線は、左辺、右辺、上辺、及
び下辺をそれぞれ表している。
設定し、記入枠を表す直線をX=xp、X=xq、Y=yp、
Y=yqとする。なお、各直線は、左辺、右辺、上辺、及
び下辺をそれぞれ表している。
次に、記入枠のやや内側を走査して周辺分布を作成す
る。走査範囲を表す座標として、X1=xp+e、X2=xq−
e、Y1=yp+e、Y2=yq−eを設定する。本実施例で
は、e=5とする。そして、ラインバッファを垂直方向
にy1、y2の区間について走査し、1ライン毎の黒ビット
の和より、周辺分布を得る。この周辺分布により文字の
存在するX軸方向の範囲xs,xeを検出する。本実施例で
は、周辺分布が1以上の値を取る連続区間の長さを求
め、文字領域とする。また、ラインバッファを水平方向
にx1,x2の区間について走査し、1ライン毎の黒ビット
の和より、周辺分布を得る。この周辺分布により文字の
存在するY軸方向の範囲ys,yeを検出する。
る。走査範囲を表す座標として、X1=xp+e、X2=xq−
e、Y1=yp+e、Y2=yq−eを設定する。本実施例で
は、e=5とする。そして、ラインバッファを垂直方向
にy1、y2の区間について走査し、1ライン毎の黒ビット
の和より、周辺分布を得る。この周辺分布により文字の
存在するX軸方向の範囲xs,xeを検出する。本実施例で
は、周辺分布が1以上の値を取る連続区間の長さを求
め、文字領域とする。また、ラインバッファを水平方向
にx1,x2の区間について走査し、1ライン毎の黒ビット
の和より、周辺分布を得る。この周辺分布により文字の
存在するY軸方向の範囲ys,yeを検出する。
さらに、前処理部13は、xs,xe,ys,yeで定まる矩形領
域を切出し、パタンレジスタに格納する。その一例が第
4図に示されている。
域を切出し、パタンレジスタに格納する。その一例が第
4図に示されている。
以上のような切出し処理の後、前記矩形領域に含まれ
る記入枠があれば、標準特徴修正部17に対して、その記
入枠のパタンレジスタ上のアドレスを出力する。即ち、
第3図の例では、X=xqの右辺が前記文字領域に含まれ
ている。そこで、次式(1)に従ってxqを該記入枠のパ
タンレジスタ上のアドレスに変換した値、xq1を標準特
徴修正部17へ出力する。
る記入枠があれば、標準特徴修正部17に対して、その記
入枠のパタンレジスタ上のアドレスを出力する。即ち、
第3図の例では、X=xqの右辺が前記文字領域に含まれ
ている。そこで、次式(1)に従ってxqを該記入枠のパ
タンレジスタ上のアドレスに変換した値、xq1を標準特
徴修正部17へ出力する。
xq1=xq−xs ……(1) 特徴抽出部14では、次のような処理を行う。
線幅計算部において、入力文字パタンのパタンレスタ
への格納と並行して、線幅WLを算出する処理を行う。線
幅計算部は、例えば2×2の窓の全ての点が黒ビットと
なる状態の個数Qと、入力文字パタン中の全黒ビットの
個数とを計数し、従来周知の次式(2)にしたがって線
幅WLを算出する。
への格納と並行して、線幅WLを算出する処理を行う。線
幅計算部は、例えば2×2の窓の全ての点が黒ビットと
なる状態の個数Qと、入力文字パタン中の全黒ビットの
個数とを計数し、従来周知の次式(2)にしたがって線
幅WLを算出する。
WL=A/(A−Q) ……(2) この線幅WLに基づいて、サブパタンを抽出するために
用いる閾値Lthが次式(3)のように得られる。
用いる閾値Lthが次式(3)のように得られる。
Lth=N・WL ……(3) 但し、N;サブパタン抽出時の主走査方向毎に任意好適
に設定される定数 次に、サブパタン抽出部はパタンレジスタの主走査方
向を、例えばX軸方向に垂直な方向(垂直方向)及び平
行な方向(水平方向)と、X軸から反時計方向45゜の方
向(右斜め方向)及び時計方向45゜の方向(左斜め方
向)とし、これら各方向毎にパタンレジスタを走査して
各方向別のサブパタンを抽出する。
に設定される定数 次に、サブパタン抽出部はパタンレジスタの主走査方
向を、例えばX軸方向に垂直な方向(垂直方向)及び平
行な方向(水平方向)と、X軸から反時計方向45゜の方
向(右斜め方向)及び時計方向45゜の方向(左斜め方
向)とし、これら各方向毎にパタンレジスタを走査して
各方向別のサブパタンを抽出する。
例えば、垂直方向のサブパタンの抽出では、パタンレ
ジスタの垂直方向の走査線上で連続する黒ビット(黒ラ
ン)を検出し、L≧Lthとなる長さLを有する黒ランを
垂直方向のサブパタンの黒ビットとして抽出し、また、
パタンレジスタの走査線上の白ビット及びL≧Lthを満
足しない黒ランを垂直方向のサブパタンの白ビット部分
として抽出する。
ジスタの垂直方向の走査線上で連続する黒ビット(黒ラ
ン)を検出し、L≧Lthとなる長さLを有する黒ランを
垂直方向のサブパタンの黒ビットとして抽出し、また、
パタンレジスタの走査線上の白ビット及びL≧Lthを満
足しない黒ランを垂直方向のサブパタンの白ビット部分
として抽出する。
垂直方向のサブパタン抽出と同様にして、残りの他の
方向を主走査方向としたときのサブパタンの抽出も行
う。抽出した各サブパタンは各走査方向別にサブパタン
メモリへ格納される。
方向を主走査方向としたときのサブパタンの抽出も行
う。抽出した各サブパタンは各走査方向別にサブパタン
メモリへ格納される。
また、文字枠検出部は、パタンレジスタに格納し終え
た切出しパタンを走査して、従来周知の手法により、入
力文字パタンの文字の部分に外接する文字枠を検出す
る。
た切出しパタンを走査して、従来周知の手法により、入
力文字パタンの文字の部分に外接する文字枠を検出す
る。
次に、特徴抽出部14は、入力文字パタンの黒ビット部
分に外接する文字枠に対応するサブパタンメモリ上の領
域をN×M個(例えばN=M=4)の分割領域に区分
し、線幅WLと分割領域内の黒画素総個数b(i,j,k)と
に基づいて各分割領域毎に分割領域内のサブパタンの文
字線量を表す特徴量F(i,j,k)を抽出する。但し、i
=1,2,……,M、j=1,2,……,N、及びk=1,2,3,4であ
り、b(i,j,k)及びF(i,j,k)は、第i行第i列の分
割領域の黒画素総個数および特徴量を表して、k=1,2,
3,4のとき、水平、垂直、左斜め及び右斜め方向のサブ
パタンの分割領域の特徴量であることを表す。
分に外接する文字枠に対応するサブパタンメモリ上の領
域をN×M個(例えばN=M=4)の分割領域に区分
し、線幅WLと分割領域内の黒画素総個数b(i,j,k)と
に基づいて各分割領域毎に分割領域内のサブパタンの文
字線量を表す特徴量F(i,j,k)を抽出する。但し、i
=1,2,……,M、j=1,2,……,N、及びk=1,2,3,4であ
り、b(i,j,k)及びF(i,j,k)は、第i行第i列の分
割領域の黒画素総個数および特徴量を表して、k=1,2,
3,4のとき、水平、垂直、左斜め及び右斜め方向のサブ
パタンの分割領域の特徴量であることを表す。
特徴量F(i,j,k)は次式(4)によって定義され
る。
る。
F(i,j,1)=b(i,j,1)/WL F(i,j,2)=b(i,j,2)/WL F(i,j,3)=b(i,j,3)/WL F(i,j,4)=b(i,j,4)/WL ……(4) そして、特徴抽出部14は、認識対称の文字の大きさ例
えば、文字枠の高さ(文字列方向と直交する方向におけ
る文字枠の幅)YWあるいは横幅(文字列方向に沿う方向
における文字枠の幅)XWで各特徴量を正規化し、正規化
した特徴量からなるm次元(例えばm=N×M×4=6
4)の特徴マトリックスを得る。特徴量F(i,j,k)の正
規化して得た特徴量f(i,j,k)を次式(5)に示す。
えば、文字枠の高さ(文字列方向と直交する方向におけ
る文字枠の幅)YWあるいは横幅(文字列方向に沿う方向
における文字枠の幅)XWで各特徴量を正規化し、正規化
した特徴量からなるm次元(例えばm=N×M×4=6
4)の特徴マトリックスを得る。特徴量F(i,j,k)の正
規化して得た特徴量f(i,j,k)を次式(5)に示す。
但し、KI;定数(本実施例では100とする) 以上のように、m次元の特徴マトリックスを得る。
特徴抽出部14は、以上のような処理を行って、文字入
力パタンから抽出した特徴を入力パタン特徴メモリ15に
格納する。
力パタンから抽出した特徴を入力パタン特徴メモリ15に
格納する。
標準特徴修正部17は、標準特徴メモリ17aに格納され
た標準特徴を読み出し、前処理部13より受け取った記入
枠座標位置に従って、該標準特徴に記入枠に相当する特
徴を付加する処理を行う。
た標準特徴を読み出し、前処理部13より受け取った記入
枠座標位置に従って、該標準特徴に記入枠に相当する特
徴を付加する処理を行う。
第4図に示す例では、文字文字パタン上のX=xq1に
記入枠右辺が存在する。まず、標準特徴修正部17は、
(6)式を適用して、該記入枠右辺が含まれる特徴の要
素番号を求める。
記入枠右辺が存在する。まず、標準特徴修正部17は、
(6)式を適用して、該記入枠右辺が含まれる特徴の要
素番号を求める。
XQ=(xq1・N/xw)+1 ……(6) さらに、この要素番号の要素に当該記入枠右辺直線に
相当する特徴値が与えられた特徴を、入力文字パタンの
特徴に加算して修正する。その修正の一例が第5図
(a)〜(c)に示されている。第5図(a)は数字
「2」の標準特徴の一例を示している。水平、垂直、左
斜め、及び右斜めのそれぞれ4×4分割の特徴マトリッ
クスである。同図(bは当該記入枠右辺に相当する特徴
の一例を示している。記入枠右辺は垂直線なので、垂直
特徴マトリクスのXQ=4、即ち左から4番目の縦列に、
記入枠の直線に相当する要素値を与える。また、同図
(c)は、同図(a)に示す特徴と同図(b)に示す特
徴とを加算した修正標準特徴を示している。本実施例で
は、用意されている10種類の標準特徴について同様の処
理を行う。
相当する特徴値が与えられた特徴を、入力文字パタンの
特徴に加算して修正する。その修正の一例が第5図
(a)〜(c)に示されている。第5図(a)は数字
「2」の標準特徴の一例を示している。水平、垂直、左
斜め、及び右斜めのそれぞれ4×4分割の特徴マトリッ
クスである。同図(bは当該記入枠右辺に相当する特徴
の一例を示している。記入枠右辺は垂直線なので、垂直
特徴マトリクスのXQ=4、即ち左から4番目の縦列に、
記入枠の直線に相当する要素値を与える。また、同図
(c)は、同図(a)に示す特徴と同図(b)に示す特
徴とを加算した修正標準特徴を示している。本実施例で
は、用意されている10種類の標準特徴について同様の処
理を行う。
以上、入力文字パタンに記入枠が含まれる場合につい
て説明したが、左辺、上辺、及び下辺が含まれる場合の
分割領域番号は、それぞれ次式(7)〜(9)で求める
ことができる。
て説明したが、左辺、上辺、及び下辺が含まれる場合の
分割領域番号は、それぞれ次式(7)〜(9)で求める
ことができる。
XP=(xp1・N/xw)+1 ……(7) YP=(yp1・M/yw)+1 ……(8) YQ=(yq1・M/yw)+1 ……(9) 但し、xw=xe−xs+1、yw=ye−ys+1とする。
本実施例では、記入枠に相当する特徴マトリクスは、
予め標準特徴修正部17に用意されている。記入枠右辺ま
たは左辺に相当する特徴マトリクスは、第5図(b)に
示すようにXQまたはXPの縦列に記入枠の垂直線に相当す
る要素値が与えられる。記入枠上辺または下辺に相当す
る特徴マトリクスは、YPまたはYQの横列に記入枠の水平
線に相当する要素値が与えられる。
予め標準特徴修正部17に用意されている。記入枠右辺ま
たは左辺に相当する特徴マトリクスは、第5図(b)に
示すようにXQまたはXPの縦列に記入枠の垂直線に相当す
る要素値が与えられる。記入枠上辺または下辺に相当す
る特徴マトリクスは、YPまたはYQの横列に記入枠の水平
線に相当する要素値が与えられる。
識別部16は、入力パタン特徴メモリ15に格納された特
徴fsと修正標準特徴gsとの間に次式(10)を適用して距
離Dを計算する。全ての標準パタンについて距離を計算
し、最も距離の小さな標準パタンの標準特徴に対応する
文字名を出力端11へ出力する。
徴fsと修正標準特徴gsとの間に次式(10)を適用して距
離Dを計算する。全ての標準パタンについて距離を計算
し、最も距離の小さな標準パタンの標準特徴に対応する
文字名を出力端11へ出力する。
次に、第6図の動作フローチャートを用いて特徴抽出
部14以降の処理を詳細に説明する。
部14以降の処理を詳細に説明する。
まず、入力文字パタンは、前処理部13から特徴抽出部
14へ送出される。特徴抽出部14は、特徴抽出を行い入力
パタン特徴メモリ15に当該入力文字パタンの特徴を格納
する(ステップ50,51)。続いてiを0に初期化する
(ステップ52)。i番目の標準特徴を標準特徴メモリ17
aから読み出し、その標準特徴を標準特徴修正部17にお
いて修正して修正標準特徴を生成する。さらに、修正標
準特徴を識別部16へ送出する。(ステップ53)。
14へ送出される。特徴抽出部14は、特徴抽出を行い入力
パタン特徴メモリ15に当該入力文字パタンの特徴を格納
する(ステップ50,51)。続いてiを0に初期化する
(ステップ52)。i番目の標準特徴を標準特徴メモリ17
aから読み出し、その標準特徴を標準特徴修正部17にお
いて修正して修正標準特徴を生成する。さらに、修正標
準特徴を識別部16へ送出する。(ステップ53)。
識別部16は、入力パタン特徴メモリ15に格納された特
徴と修正標準特徴との距離を、上記(10)式を適用して
計算し、その結果を保持する(ステップ54)。続いて、
ステップ53,54の処理を全ての標準特徴について行った
か否かを判断する(ステップ55)。ノーであれば、iを
1増した後(ステップ56)、ステップ53を実行する。本
実施例では、標準特徴が10種類あるので、ステップ55で
は、iが10か否かを判断する。全標準特徴について、ス
テップ53,54の判断が終了した後、識別部16に保持され
た距離のうち最も小さい標準特徴に対応する文字名を出
力端11へ出力する(ステップ57,58)。
徴と修正標準特徴との距離を、上記(10)式を適用して
計算し、その結果を保持する(ステップ54)。続いて、
ステップ53,54の処理を全ての標準特徴について行った
か否かを判断する(ステップ55)。ノーであれば、iを
1増した後(ステップ56)、ステップ53を実行する。本
実施例では、標準特徴が10種類あるので、ステップ55で
は、iが10か否かを判断する。全標準特徴について、ス
テップ53,54の判断が終了した後、識別部16に保持され
た距離のうち最も小さい標準特徴に対応する文字名を出
力端11へ出力する(ステップ57,58)。
なお、本発明は図示の実施例に限定されず、種々の変
形が可能である。その変形例としては、例えば次のよう
なものがある。
形が可能である。その変形例としては、例えば次のよう
なものがある。
(イ)上記実施例では、線形図形として記入枠のみを用
いたが、これに限定されず、アンダーライン、括弧、
円、ハッチング、及び網掛け等の文字の記入位置を示す
線形図形にも適用できる。即ち、これらの記号が入力文
字パタンに含まれる場合は、その記号の位置や形状を表
す特徴を抽出し、抽出された特徴に基づいて、標準特徴
に対して該記号に相当する特徴を加算する処理を上記実
施例と同様に行えばよい。
いたが、これに限定されず、アンダーライン、括弧、
円、ハッチング、及び網掛け等の文字の記入位置を示す
線形図形にも適用できる。即ち、これらの記号が入力文
字パタンに含まれる場合は、その記号の位置や形状を表
す特徴を抽出し、抽出された特徴に基づいて、標準特徴
に対して該記号に相当する特徴を加算する処理を上記実
施例と同様に行えばよい。
(ロ)上記実施例のラインバッファは、文字列1行分の
デジタル信号を格納するようにしたが、格納容量はこれ
に限定されない。
デジタル信号を格納するようにしたが、格納容量はこれ
に限定されない。
(ハ)上記実施例において、周辺分布を作成する際の走
査範囲を表す座標として、X1=xp+e、X2=xq−2、Y1
=yp+e、Y2=yq−eを設定し、その際、e=5とした
が、本発明の趣旨に沿っていれば、e=5に限定されな
い。
査範囲を表す座標として、X1=xp+e、X2=xq−2、Y1
=yp+e、Y2=yq−eを設定し、その際、e=5とした
が、本発明の趣旨に沿っていれば、e=5に限定されな
い。
(ニ)上記実施例では、周辺分布が1以上の値を取る連
続区間の長さを求めて文字領域としたが、本発明の趣旨
に沿っていれば、周辺分布の値は1以上でなくともよ
い。
続区間の長さを求めて文字領域としたが、本発明の趣旨
に沿っていれば、周辺分布の値は1以上でなくともよ
い。
(ホ)上記実施例では、第3図に示すように、X=xqの
記入枠の右辺が文字の領域に含まれている。そこで、上
記の(1)式に従ってxqを記入枠のパタンレジスタ上の
アドレスに変換した値、xq1を標準特徴修正部17へ出力
するようにしたが、記入枠が左辺、上辺、または下辺に
含まれている場合についても同様の処理をする。
記入枠の右辺が文字の領域に含まれている。そこで、上
記の(1)式に従ってxqを記入枠のパタンレジスタ上の
アドレスに変換した値、xq1を標準特徴修正部17へ出力
するようにしたが、記入枠が左辺、上辺、または下辺に
含まれている場合についても同様の処理をする。
(ヘ)上記実施例は数字を認識対称としたが、これに限
定されず、例えば、漢字等の他の文字を認識対称として
もよい。
定されず、例えば、漢字等の他の文字を認識対称として
もよい。
(ト)上記実施例では、特徴抽出部14に入力文字パタン
の線幅を算出する線幅計算部を設けたが、入力文字パタ
ンの線幅をあらかじめ予測できる場合には、線幅計算部
を省略していもよい。
の線幅を算出する線幅計算部を設けたが、入力文字パタ
ンの線幅をあらかじめ予測できる場合には、線幅計算部
を省略していもよい。
(発明の効果) 以上詳細に説明したように、本発明によれば、矩形領
域内における文字の背景部分に存在する前記線形図形の
特徴を抽出し、線形図形の特徴の抽出結果に基づき標準
特徴に対して修正を施して修正標準特徴を生成すると共
に、前記矩形領域の2値画像の特徴を抽出し、該矩形領
域の2値画像の特徴と修正標準特徴との照合を行うよう
にしたので、従来のように、文字に対応した矩形領域か
ら記入枠等の線形図形を除去するというような複雑な処
理を行わずに文字の認識を行うことができ、処理の簡
単化、高速化、小形化、認識精度の向上等の効果
が期待できる。
域内における文字の背景部分に存在する前記線形図形の
特徴を抽出し、線形図形の特徴の抽出結果に基づき標準
特徴に対して修正を施して修正標準特徴を生成すると共
に、前記矩形領域の2値画像の特徴を抽出し、該矩形領
域の2値画像の特徴と修正標準特徴との照合を行うよう
にしたので、従来のように、文字に対応した矩形領域か
ら記入枠等の線形図形を除去するというような複雑な処
理を行わずに文字の認識を行うことができ、処理の簡
単化、高速化、小形化、認識精度の向上等の効果
が期待できる。
【図面の簡単な説明】 第1図は本発明の実施例を示す文字認識装置の構成ブロ
ック図、第2図(a),(b),(c)は記入枠中の文
字記入例を示す図、第3図は入力文字パタンの切出し処
理を示す図、第4図は切出された入力文字パタンの一例
を示す図、第5図は特徴の修正例を示す図、第6図は特
徴抽出部以降の処理を示す動作フローチャートである。 12……光電変換部、13……前処理部、14……特徴抽出
部、15……入力パタン特徴メモリ、16……認識部、17…
…標準特徴修正部、17a……標準特徴メモリ、G……2
値画像。
ック図、第2図(a),(b),(c)は記入枠中の文
字記入例を示す図、第3図は入力文字パタンの切出し処
理を示す図、第4図は切出された入力文字パタンの一例
を示す図、第5図は特徴の修正例を示す図、第6図は特
徴抽出部以降の処理を示す動作フローチャートである。 12……光電変換部、13……前処理部、14……特徴抽出
部、15……入力パタン特徴メモリ、16……認識部、17…
…標準特徴修正部、17a……標準特徴メモリ、G……2
値画像。
Claims (3)
- 【請求項1】線形図形及び文字が描かれた入力媒体を光
電変換して2値画像を生成し、その2値画像から該文字
に対応した矩形領域の切出し処理を行い、該矩形領域の
2値画像を用いて前記文字の認識を行う文字認識方法に
おいて、 前記矩形領域の切出し処理後、その矩形領域内における
文字の背景部分に存在する前記線形図形の特徴を抽出
し、 予め標準特徴メモリに格納された標準特徴に対して、前
記線形図形の特徴に基づき修正を施して修正標準特徴を
生成すると共に、前記矩形領域の2値画像の特徴を抽出
し、 前記矩形領域の2値画像の特徴と修正標準特徴との照合
を行うことを特徴とする文字認識方法。 - 【請求項2】請求項1記載の文字認識方法において、 前記線形図形の特徴を、 前記線形図形の2次元位置とした文字認識方法。
- 【請求項3】請求項1及び2記載の文字認識方法におい
て、 前記標準特徴に対する修正を、 前記線形図形の2次元位置で表す前記線形図形の特徴に
基づき、前記背景部分に存在する線形図形の特徴を付加
して行うようにした文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2083161A JP2708604B2 (ja) | 1990-03-30 | 1990-03-30 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2083161A JP2708604B2 (ja) | 1990-03-30 | 1990-03-30 | 文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03282791A JPH03282791A (ja) | 1991-12-12 |
| JP2708604B2 true JP2708604B2 (ja) | 1998-02-04 |
Family
ID=13794532
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2083161A Expired - Lifetime JP2708604B2 (ja) | 1990-03-30 | 1990-03-30 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2708604B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5859929A (en) * | 1995-12-01 | 1999-01-12 | United Parcel Service Of America, Inc. | System for character preserving guidelines removal in optically scanned text |
-
1990
- 1990-03-30 JP JP2083161A patent/JP2708604B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH03282791A (ja) | 1991-12-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS6159568A (ja) | 文書処理装置 | |
| JPH03122773A (ja) | 画像形成装置 | |
| US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
| JP2708604B2 (ja) | 文字認識方法 | |
| JP3127413B2 (ja) | 文字認識装置 | |
| JPH09134404A (ja) | 棒グラフ認識装置 | |
| JP2582611B2 (ja) | マルチフオント辞書の作成法 | |
| JPH0916713A (ja) | 画像領域分割方法 | |
| JP2973892B2 (ja) | 文字認識方式 | |
| JP2827288B2 (ja) | 文字認識装置 | |
| JP2747136B2 (ja) | 文字認識装置 | |
| JPH03271883A (ja) | 文字認識方法 | |
| JP2908495B2 (ja) | 文字画像抽出装置 | |
| JP3083609B2 (ja) | 情報処理装置及びそれを用いた文字認識装置 | |
| JP2544589B2 (ja) | 文書処理方法及び装置 | |
| JP3090928B2 (ja) | 文字認識装置 | |
| JP2674286B2 (ja) | 特徴抽出方式 | |
| JP2626084B2 (ja) | 文字認識装置 | |
| JPH04241074A (ja) | 自動文書清書装置 | |
| JP3084833B2 (ja) | 特徴抽出装置 | |
| JP2980636B2 (ja) | 文字認識装置 | |
| JP3199033B2 (ja) | 光学式文字読取方法、及び光学式文字読取装置 | |
| JP2902904B2 (ja) | 文字認識装置 | |
| JP3277977B2 (ja) | 文字認識方法 | |
| JP2616995B2 (ja) | 文字認識装置 |