JPH06274682A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPH06274682A
JPH06274682A JP5085176A JP8517693A JPH06274682A JP H06274682 A JPH06274682 A JP H06274682A JP 5085176 A JP5085176 A JP 5085176A JP 8517693 A JP8517693 A JP 8517693A JP H06274682 A JPH06274682 A JP H06274682A
Authority
JP
Japan
Prior art keywords
normalization
pattern
retry
character
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5085176A
Other languages
English (en)
Inventor
Kyoichi Sumiya
恭一 角谷
Toshio Tsutsumida
敏夫 堤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP5085176A priority Critical patent/JPH06274682A/ja
Publication of JPH06274682A publication Critical patent/JPH06274682A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 (修正有) 【目的】正規化により入力パターンの一部が欠損した場
合もリトライすることにより、より確からしい候補文字
を得る。 【構成】正規化によって入力パターンAの一部が欠損し
ていた場合、その欠損の方向をパターン欠損方向算出部
16が検出する。次に、判定部18が、メモリ17に予
め蓄積してある文字毎の誤読が予想される欠損方向の情
報Hと、パターン欠損方向算出部16からの欠損方向情
報Gとを基に、得られた候補文字Eが誤読である可能性
を判定する。その結果、誤読の可能性がある場合は、リ
トライ条件決定部19が、外接枠座標算出部15からの
入力パターンA全体をとらえた外接枠座標Fに基づき、
欠損が生じないような新たな正規化条件Jを決定し、こ
の新たな正規化条件Jを用いて、正規化及びこれに引き
続く文字認識をリトライする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置等に用い
られる文字認識方式に関し、特に特徴抽出に供するパタ
ーンの位置と大きさの正規化処理に関するものである。
【0002】
【従来の技術】従来、文字認識用の特徴を抽出するのに
先立ち、入力パターンの位置ズレおよびパターンの大き
さのばらつきを排除するため、入力パターンの位置およ
び大きさの正規化処理を行う文字認識方式がある。
【0003】図2は従来のこの種の文字認識方式の構成
を示すブロック図である。
【0004】同図において、モーメント算出部1は入力
パターンを解析して1次および2次モーメントからなる
モーメント情報を算出する。正規化条件決定部2は上記
モーメント情報を基に、後述する正規化処理部3の処理
条件となる中心座標および拡大率からなる正規化条件を
決定する。正規化処理部3は上記正規化条件に従って、
入力パターンを正規化パターンに変換する。文字認識部
4は上記正規化パターンの特徴を抽出し、予め格納して
いる文字毎の標準的特徴との比較により候補文字を出力
する。この文字認識部4から出力される候補文字が図示
しない認識結果表示部等に入力される。
【0005】このような構成において、帳票上の認識対
象領域に記述された文字列を認識する場合、その文字列
をスキャナまたは文字切出し等の手段によって文字単位
に2値量子化し、入力パターンaとしてモーメント算出
部1に入力する。
【0006】すると、モーメント算出部1は入力された
入力パターンaから、1次モーメント(M1)および1
次モーメント回りの2次モーメント(M2)をモーメン
ト情報bとして以下のように抽出する。
【0007】入力パターンaを、パターンの垂直方向を
x、水平方向をy、および各画素を点P(本例では、0
≦x,y≦96とする)として以下の(1)式のように
定義する。
【0008】
【数1】
【0009】入力パターンaをラスタスキャンして、以
下の情報S,MX,MY,NX及びNYを抽出する。
【0010】
【数2】
【0011】
【数3】
【0012】
【数4】
【0013】
【数5】
【0014】
【数6】
【0015】次に、上記情報から次の(7)、(8)及
び(9)式によりモーメント情報bを算出する。
【0016】
【数7】
【0017】
【数8】
【0018】
【数9】
【0019】正規化条件決定部2は、入力したモーメン
ト情報bと予め格納している正規化係数(C)を基に、
中心座標(P0)と垂直拡大率(Ry)と水平拡大率(R
x)を正規化条件cとして次の(10)、(11)及び
(12)式により決定する。
【0020】
【数10】
【0021】
【数11】
【0022】
【数12】
【0023】以上のように決定した正規化条件cを入力
した正規化処理部3は、正規化条件cに従って入力パタ
ーンaを正規化パターンdに変換する。具体的な変換処
理は、以下に示す(13)式により正規化パターンdの
全ての点(本例では、0≦X,Y≦64とする)につい
て入力パターンa上に射影し、入力パターンa上で黒点
であれば黒点化、白点であれば白点化するものである。
【0024】
【数13】 文字認識部4は、正規化パターンdの文字認識用特徴ベ
クトルを抽出し、予め格納している文字毎の標準的特徴
ベクトルとの比較により一致度の最も高い文字を候補文
字eとして出力する。
【0025】
【発明が解決しようとする課題】上記従来技術のような
一律の正規化条件による文字認識方式では、パターン固
有の構造に起因して、パターンの欠損が発生する場合で
もそのパターンによる候補文字がそのまま出力され、こ
れが誤読の一因となるという問題がある。
【0026】図3を用いて正規化時のパターン欠損の例
を説明する。
【0027】同図において、(a)は入力パターン例、
(b)は正規化パターン例であり、実線枠内がそれぞれ
正規化対象領域および特徴抽出対象領域である。
【0028】参照番号101で示す点Pは入力パターン
の重心であり、矩形領域102は同パターンの外接枠で
ある。参照番号103で示す点P’は正規化パターンの
中心であり、矩形領域104は正規化後の外接枠であ
る。また、参照番号105が正規化パターンから欠損し
た入力パターンの一部を示す。
【0029】同図に示すように、モーメント情報に基づ
いた正規化条件は入力パターンの外接枠を考慮しておら
ず、パターンの広がりのばらつきを正規化するものなの
で、この例のようにパターンの部分的欠損が発生するこ
とがある。
【0030】この例では図3(b)の正規化パターンは
文字「大」と同パターンとなるため、入力文字「犬」が
文字「大」と誤読されることとなる。
【0031】従って、本発明の目的は、入力パターンの
正規化により入力パターンの一部が欠損した場合、欠損
の発生しない別の条件による正規化及び認識をリトライ
することにより、より確からしい候補文字を得ることが
可能な文字認識方式を提供することにある。
【0032】
【課題を解決するための手段】前記目的を達成するため
に、本発明の文字認識方式は、入力パターンに基づき所
定の方法で正規化条件を決定し、この正規化条件に従っ
て、入力パターンを正規化することにより正規化パター
ンに変換し、この正規化パターンに基づいて入力パター
ンに該当する候補文字を決定するという基本的構成に加
えて、次の(a)〜(e)の要素を具備することを特徴
とする。
【0033】(a) 入力パターンの外接枠座標を算出
する外接枠座標算出部。
【0034】(b) 正規化条件および外接枠座標を基
に、正規化によって正規化パターンから欠損した入力パ
ターンの一部分の方向を示すパターン欠損方向情報を求
めるパターン欠損方向算出部。
【0035】(c) 文字毎に予め定めた、正規化によ
るパターンの欠損に起因して誤読の生じる可能性がある
欠損の方向を示す正規化リトライ参照情報を予め蓄積
し、候補文字をアドレスとして対応する正規化リトライ
参照情報を選択的に出力する正規化リトライ参照情報メ
モリ。
【0036】(d) 正規化リトライ参照情報とパター
ン欠損方向情報とを基に、正規化リトライの要否を判定
し、必要と判断した場合に正規化リトライ指示を出力す
る正規化リトライ判定部。
【0037】(e) 正規化リトライ指示に応答して、
前記外接枠座標を基に、欠損が生じないように前記入力
パターンの正規化をリトライするための正規化条件であ
る正規化リトライ条件を決定する正規化リトライ条件決
定部。
【0038】
【作用】本発明の方式によれば、基本的構成において実
行した正規化によって入力パターンの一部が欠損してい
た場合、その欠損の方向(例えば、上、下、左、右)を
パターン欠損方向算出部が検出する。
【0039】次に、正規化リトライ判定部が、メモリに
予め蓄積してある文字毎の誤読が予想される欠損方向の
情報と、パターン欠損方向算出部からの欠損方向情報と
を基に、得られた候補文字が誤読である可能性を判定す
る。
【0040】その結果、誤読の可能性がある場合は、リ
トライ条件決定部が、外接枠座標算出部からの入力パタ
ーン全体をとらえた外接枠座標に基づき、欠損が生じな
いような新たな正規化条件を決定し、これを基本的構成
に与える。
【0041】基本的構成では、この新たな正規化条件を
用いて、正規化及びこれに引き続く文字認識をリトライ
する。それにより、パターン欠損を修復した状態での候
補文字を得ることができる。
【0042】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
【0043】図1は、本発明に係る文字認識方式の一実
施例の全体構成を示すブロック図である。
【0044】同図において、モーメント算出部11、正
規化条件決定部12、正規化処理部13及び文字認識部
14は、図2の従来方式におけるモーメント算出部1、
正規化条件決定部2、正規化処理部3及び文字認識部4
としれぞれ基本的に同一の機能を有するものであり、そ
の詳細な説明は省略する。本実施例は、この従来の構成
に加え、参照番号15〜19で示す要素をさらに備え
る。
【0045】外接枠座標算出部15は、入力パターンA
を解析してその外接枠座標Fを算出する。
【0046】パターン欠損方向算出部16は、正規化条
件決定部12からの正規化条件C及び外接枠座標算出部
15からの外接枠座標Fを基に、正規化処理部13の正
規化処理によって正規化パターンDから欠損した入力パ
ターンAの一部分の方向(上、下、左、右)を示すパタ
ーン欠損方向情報Gを求める。
【0047】正規化リトライ参照情報メモリ17は、文
字毎にその固有のパターンに基づき予め定められた、正
規化によるパターン欠損により誤読の発生が予想される
欠損方向(上、下、左、右)を示す正規化リトライ参照
情報Hを蓄積し、文字認識部14からの候補文字Eをア
ドレスとして受けて、その候補文字Eの正規化リトライ
参照情報Hを出力する。
【0048】正規化リトライ判定部18は、メモリ17
からの正規化リトライ参照情報Hと、欠損方向算出部1
6からのパターン欠損方向情報Gとを基に、正規化リト
ライの要否(つまり、誤読の発生可能性の有無)を判定
し、必要と判断した場合には正規化リトライ指示Iを出
力する。
【0049】正規化リトライ条件決定部9は、正規化リ
トライ指示Iを受け、記憶しておいた外接枠座標Fを基
に、正規化リトライ処理条件Jとなる中心座標および拡
大率を決定するものである。
【0050】このような構成の下で、帳票上の認識対象
領域に記述された文字列を認識する場合における動作を
以下に説明する。
【0051】ここでは、入力パターンAを96×96画
素、正規化パターンDを64×64画素として説明す
る。また、座標系はxy直交座標系(xが水平座標、y
が垂直座標)であり、入力パターン及び正規化パターン
共にその左上点を原点(0,0)とし、右下点を入力パ
ターンでは座標(96,96)、正規化パターンでは座
標(64,64)とする。なお、他の任意のパターンサ
イズや他の座標系に関しても本実施例が同様に適用でき
ることは、当業者であれば以下の説明から容易に理解す
る筈である。
【0052】入力パターンAがモーメント算出部11に
入力されると、続いて順次、正規化条件決定部12、正
規化処理部13、文字認識部14の処理が進められて、
候補文字Eが出力される。この一連の処理は従来と基本
的に同様である。
【0053】これと並行して、外接枠座標算出部15が
入力パターンAをラスタスキャンして以下の4つの値
(ymin、ymax、xmin、xmax)からなる外接枠座標F
を求める。
【0054】即ち、入力パターンAにおいて、y=0か
らy=96までy座標を増加させつつ各y座標において
x方向にスキャンするというラスタスキャンを行ったと
き、最初にP(x,y)=1となった時のyを上端(y
min)とし、最後にP(x,y)=1となった時のyを
下端(ymax)とする。また、P(x,y)=1となっ
た時のxの最小値を左端(xmin)とし、最大値を右端
(xmax)とする。
【0055】パターン欠損方向算出部16は、上記外接
枠座標Fよび正規化条件決定部12からの正規化条件C
(前述の式(10)〜(12)により決定されたもの)
を入力して、以下の式により外接枠の4端点が0≦x,
y≦64で規定される領域となるかどうかを判定して、
方向毎に領域の内部か外部かを表すパターン欠損方向情
報Gを出力する。
【0056】
【数14】 ここで、図4を参照して、パターン欠損の例とそのとき
のパターン欠損方向情報Gについて説明する。
【0057】同図(a)は正規化パターンであり、参照
番号201が文字認識部14における特徴抽出領域であ
り、参照番号202は正規化後の外接枠領域である。こ
の例では、外接枠の4つの端点のうち左側の2点つまり
左下点203および左上点204だけが特徴抽出領域2
01内であり、右側の2つの端点は特徴抽出領域201
外である。このときパターン欠損方向情報Gは同図
(b)で示す内容となる。
【0058】正規化リトライ参照情報メモリ17は、文
字認識部14からの候補文字Eを参照アドレスとして、
その候補文字Eについての正規化リトライ参照情報Hを
出力する。
【0059】正規化リトライ判定部18はパターン欠損
方向情報Gと正規化リトライ参照情報Hとを基に、正規
化リトライの判定を行う。ここで、図5を参照して具体
的な処理を説明する。
【0060】図5(a)は正規化リトライ参照情報メモ
リ17の構成例を示しており、種々の文字C1〜CNの
各々について、予め定めた4ビットの正規化リトライ情
報が格納されている。例えば、候補文字Eが「大」であ
れば、”1001”という正規化リトライ情報302が
読みだされる。これは、上あるいは右の方向にパターン
の欠損があった場合、文字「大」が候補文字Eとなる他
の文字(例えば「犬」)が存在することを意味してい
る。即ち、各候補文字の正規化リトライ情報は、そのリ
トライ情報のビットが”1”である方向のいずれかにパ
ターン欠損があった場合、元の文字はその候補文字以外
の文字である可能性があることを示している。
【0061】このような正規化リトライ参照情報Hを読
みだしたならば、これと図5(b)で示すパターン欠損
方向情報Gとの間で各ビットごとの論理積を求める。こ
の結果、図5(c)に示すリトライ判定情報を得る。こ
のリトライ判定情報は、右方向のビットが”1”である
から、正規化パターンDは入力パターンAにおける右方
向で文字の一部が欠損して誤読した可能性のあることを
表現している。
【0062】そして、正規化リトライ判定部18は、リ
トライ判定情報のいずれかのビットが”1”であれば、
正規化リトライ指示Iを正規化リトライ条件決定部19
に出力する。
【0063】正規化リトライ条件決定部19は、正規化
リトライ指示Iを入力すると、記憶しておいた外接枠座
標Fを基に次の(15)〜(17)式により正規化リト
ライ条件Jを決定する。
【0064】
【数15】
【0065】
【数16】
【0066】
【数17】
【0067】この後、正規化処理部13は新たに決定し
た正規化リトライ条件Jによる正規化処理を行い、文字
認識部14は正規化リトライ条件Jに基づく正規化パタ
ーンDに対して再度文字認識を行い、新たな候補文字E
を出力する。
【0068】このように、正規化リトライ参照情報とパ
ターン欠損方向情報に基づき、通常処理として実行した
モーメント情報による正規化によって得られた候補文字
がパターンの欠損による誤読の可能性を判定し、外接枠
座標による正規化リトライ条件による正規化および文字
認識のリトライを行うことで、パターンの欠損の修復し
た正規化パターンに対する候補文字を得ることができ
る。
【0069】
【発明の効果】以上説明したように本発明によれば、正
規化時のパターン欠損が発生した際、入力パターン固有
の構造に着目して、候補文字のパターン欠損による誤読
の可能性を判定し、必要に応じて、パターン欠損を修復
する正規化条件による正規化および認識のリトライを行
うため、誤読を減少させる効果がある。
【図面の簡単な説明】
【図1】本発明の文字認識方式の一実施例の構成を示す
ブロック図である。
【図2】従来の文字認識方式の構成を示すブロック図で
ある。
【図3】図2の従来方式における正規化時のパターン欠
損の例を説明する図である。
【図4】図1の実施例におけるパターン欠損の例とその
ときのパターン欠損情報について説明する図である。
【図5】図1の実施例における正規化リトライ判定部の
具体的な処理を説明する図である。
【符号の説明】
11 モーメント算出部 12 正規化条件決定部 13 正規化処理部 14 文字認識部 15 外接枠座標算出部 16 パターン欠損方向算出部 17 正規化リトライ参照情報メモリ 18 正規化リトライ判定部 19 正規化リトライ条件決定部 A 入力パターン B モーメント情報 C 正規化条件 D 正規化パターン E 候補文字 F 外接枠座標 G パターン欠損方向情報 H 正規化リトライ参照情報 I 正規化リトライ指示 J 正規化リトライ条件

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力パターンに基づき所定の方法で正規
    化条件を決定し、この正規化条件に従って、前記入力パ
    ターンを正規化することにより正規化パターンに変換
    し、この正規化パターンに基づいて前記入力パターンに
    該当する候補文字を決定する文字認識方式において、 前記入力パターンの外接枠座標を算出する外接枠座標算
    出部と、 前記正規化条件および上記外接枠座標を基に、前記正規
    化によって前記正規化パターンから欠損した前記入力パ
    ターンの一部分の方向を示すパターン欠損方向情報を求
    めるパターン欠損方向算出部と、 文字毎に予め定めた、前記正規化によるパターンの欠損
    に起因して誤読の生じる可能性がある前記欠損の方向を
    示す正規化リトライ参照情報を予め蓄積し、前記候補文
    字をアドレスとして対応する前記正規化リトライ参照情
    報を選択的に出力する正規化リトライ参照情報メモリ
    と、 前記正規化リトライ参照情報と前記パターン欠損方向情
    報とを基に、正規化リトライの要否を判定し、必要と判
    断した場合に正規化リトライ指示を出力する正規化リト
    ライ判定部と、 前記正規化リトライ指示に応答して、前記外接枠座標を
    基に、前記欠損が生じないように前記入力パターンの正
    規化をリトライするための正規化条件である正規化リト
    ライ条件を決定する正規化リトライ条件決定部と、を具
    備することを特徴とする文字認識方式。
JP5085176A 1993-03-22 1993-03-22 文字認識方式 Pending JPH06274682A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5085176A JPH06274682A (ja) 1993-03-22 1993-03-22 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5085176A JPH06274682A (ja) 1993-03-22 1993-03-22 文字認識方式

Publications (1)

Publication Number Publication Date
JPH06274682A true JPH06274682A (ja) 1994-09-30

Family

ID=13851358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5085176A Pending JPH06274682A (ja) 1993-03-22 1993-03-22 文字認識方式

Country Status (1)

Country Link
JP (1) JPH06274682A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259030A (ja) * 2008-04-17 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 画像識別装置、画像識別方法、プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259030A (ja) * 2008-04-17 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 画像識別装置、画像識別方法、プログラム

Similar Documents

Publication Publication Date Title
JP7113657B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JP3533722B2 (ja) 不良検査方法およびその装置
CN112419207A (zh) 一种图像矫正方法及装置、系统
JPH0418351B2 (ja)
JPH06274682A (ja) 文字認識方式
JPH0718812B2 (ja) 異物検出方法
JP2846486B2 (ja) 画像入力装置
JP3395346B2 (ja) フィレ座標生成方法およびその装置
JP2674475B2 (ja) 文字読取装置
JP2871233B2 (ja) 二値化像修正方法
JP3087788B2 (ja) 部品の位置検出方法及び装置
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JPS60116076A (ja) 画像抽出回路
CN117912048A (zh) 一种建筑图纸图像中楼板筋的识别方法和装置
JP3046532B2 (ja) 物体の認識方法
JP2003016386A (ja) 文字認識方法および装置
JPH05290162A (ja) 画像入力装置の線図形分岐点接続方法
JP3025365B2 (ja) 画像の二値化処理装置
JPH0581430A (ja) エツジ検出方法
JPS60200375A (ja) テンプレ−トマツチング方式
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
JPH1074261A (ja) パターン欠陥検出装置
JPH03150689A (ja) 数字認識方法