JPH09161005A - 文字認識装置及び方法並びにそれを用いたスキャナ - Google Patents

文字認識装置及び方法並びにそれを用いたスキャナ

Info

Publication number
JPH09161005A
JPH09161005A JP7345468A JP34546895A JPH09161005A JP H09161005 A JPH09161005 A JP H09161005A JP 7345468 A JP7345468 A JP 7345468A JP 34546895 A JP34546895 A JP 34546895A JP H09161005 A JPH09161005 A JP H09161005A
Authority
JP
Japan
Prior art keywords
character
recognition
pattern
partial
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7345468A
Other languages
English (en)
Inventor
Tetsuya Miwa
哲也 三輪
Yoshinori Yamaguchi
芳徳 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP7345468A priority Critical patent/JPH09161005A/ja
Publication of JPH09161005A publication Critical patent/JPH09161005A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 手書き文字でバランスの悪い文字であっても
精度よく認識できる文字認識方法を提供すること 【解決手段】 与えられた文字パターン(図(A))に
対して所定の文字認識処理をした結果、部首部分の面積
が大きくその部首のグループに属する文字までは特定で
きるが、その中の相互の差別化がしにくい際に、非部首
部分(図示の例では「日」)を抽出し、部分パターンを
生成する(図(B))。次に、その部分パターンに対
し、拡大処理を行い所定の大きさに正規化する(図
(C))。この正規化された画像データに対して再認識
処理を行う。すると情報量が大きくなり、類似する文字
相互を判別するに必要な特徴量を抽出でき、認識率が向
上する。拡大の際に、部分パターンの重心が正規化後の
中心にくるように重心正規化するので、余白部分が少な
くなり、バランスが悪い文字でも標準パターンに近づ
く。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置及び
方法並びにそれを用いたスキャナに関するもので、より
具体的には手書き文字でも認識可能なものに関する。
【0002】
【従来の技術】よく知られているように、OCR(文字
認識)は、読み取った画像データに対して、行切出処理
をして一行ごとに分離し、抽出した各行に対して文字切
出処理を行い1文字ごとに分離する。そのようにして抽
出した各文字を正規化して大きさをそろえ、その状態で
特徴量を抽出し、抽出した特徴量と予め用意した各文字
の標準パターンとの比較を行う所定の文字認識をし、各
文字に対する類似度を求め、類似度の高い文字を該当文
字と決定する。
【0003】また、そして決定した該当文字を表示す
る。さらに同時に類似度の高いものから所定数を候補文
字として確保し、決定した該当文字が間違っている場合
には、ユーザーからの入力をまって候補データを表示
し、その中から正しい文字を選択させるようになってい
る。
【0004】多くの漢字は、部首と非部首の組み合わせ
からなる。そして、便宜上パターンの共通する部首をキ
ーにグループ分けをした場合には、部首部分から得られ
る特徴量に基づいてどのグループに属するものかを判別
でき、さらに非部首部分から得られる特徴量に基づいて
同一の部首を有する漢字の中で相互に差別化でき、その
グループ中のどの漢字なのかを特定することができる。
【0005】ところで、「門構え」,「国構え」,「し
んにょう」等の部首部分の占める面積が大きい文字の場
合には、部首部分の特徴量データは多いため、あるグル
ープに属する文字らしいということは比較的精度よく認
識できる。しかし、非部首部分のエリアが小さいことか
ら、係る非部首部分の特徴量データが少なく、同一グル
ープに属する文字相互の判別・認識が多少困難になるこ
とがある。
【0006】係る問題を解決する手法として、特徴量を
増やすことが考えられる。しかし、特徴量が増えると、
それにつれて認識処理に時間がかかってしまう。そして
多くの文字が現在の特徴量で非常に高精度に認識できて
いることに鑑みれば、上記した「門構え」等以外の文字
に対しては、必要以上に特徴量データを設定することに
なるので、無駄な処理となり、全体のパフォーマンスを
低下させてしまうため、好ましくない。
【0007】そこで、従来係る問題を解決するものとし
て、特開昭59−45587号公報に示された発明があ
る。この発明は、図1に示すように文字認識した結果、
ある部首のグループ(図示の例では「しんにょう」)に
属する文字であると認識した場合には、画像処理により
当該部首部分を除去し同図(B)に示すように、非部首
部分のみ(図示の例では「首」)を抽出し、その非部首
部分に対して再度特徴量を抽出し、グループ内相互の文
字の判別を行うようにしている。これにより、認識率の
向上を図っている。
【0008】
【発明が解決しようとする課題】しかしながら、上記し
た従来のものでは、以下に示す問題を有している。ま
ず、上記公報のものでは、グループを示す支配的な特徴
を有する部分(グループ内での文字相互の判別に寄与し
ない部首部分)を消去をし、相互に異なる部分(非部首
部分)のみのデータを残すために必要な情報部分のみが
得られ、その点では認識率が向上する。しかし、残った
非部首部分についての情報量(特徴量)自体は増えてい
ないので、再認識処理を行うというように処理工程を増
したのに見合うほどは、認識率の向上が図れない。
【0009】特に本発明が目標とする手書き文字に対す
る認識の場合には、部首部分と非部首部分のバランスが
正しくない場合が多く、バランスが悪い場合には、認識
率も低下する。すなわち、例えば図1(A)に示すよう
な文字パターンが正常なものとすると、例えば図2に示
す文字は、非部首部分が標準のものよりも小さい。する
と、標準パターン(特徴量)は、図1(B)を想定して
作成しているので、図2(B)のようなパターンの場合
には、特徴量を抽出した結果、標準パターンに対する類
似度が低くなり、「道」と認識されないおそれがある。
【0010】また、例えば図3,図4に示すように、
「国構え」の文字の場合には、非部首部分の占める面積
が非常に小さくしかも文字枠の周囲に部首部分が存在す
るため、手書き文字の場合には、非部首部分を書く際に
図示したように、小さく書く傾向が強い。そうすると、
判別するための非部首部分から得られる特徴量は非常に
少なくなり、より判別しにくくなる。
【0011】そして、図3,図4の例では、非部首部分
は「日」と「口」であり、人間が見た場合には両者を識
別できるものの、例えば認識する際に同図(B)に示す
ように、特徴量空間を縦横にそれぞれ4分割したとする
と、いずれも4列目の中央の2つの領域に存在する。す
ると、「日」と「口」を判別するための真ん中の「−」
部分が周囲の「口」の部分と同じ領域に存在するので、
その「−」部分の有無を特徴量として精度よく抽出でき
ないおそれがあるので、誤認識のおそれが高くなる。
【0012】また、部首部分を消去する際に、前処理と
して当該部首部分の存在エリアを特定する必要があり、
係る工程を上記した公報に示した発明では、文字パター
ンを構成するビットを縦軸,横軸に投影して、ヒストグ
ラムを生成し、そのヒストグラムにより得られた所定の
谷部分を検出することにより行っている。従って、係る
投影装置や各部首の形状に応じた分離・抽出用のパター
ンも用意しておく必要があり、装置が大型化する。そし
て、係る判別は手書き文字の場合には、部首部分のパタ
ーン形状も多種多様となるので、精度よく行うために
は、複雑なアルゴリズムが必要となり、処理時間が長期
化するという問題も有する。
【0013】本発明は、上記した背景に鑑みてなされた
もので、その目的とするところは、上記した問題を解決
し、たとえ手書き文字であって、しかもバランスの悪い
文字であっても精度よく認識することができ、また、認
識するためのアルゴリズムも簡易で、回路規模を大型化
させることなく構成できる文字認識装置及び方法並びに
それを用いたスキャナを提供することにある。
【0014】
【課題を解決するための手段】上記した目的を達成する
ために、本発明に係る文字認識装置では、与えられた文
字パターンの一部を抽出して得られる部分パターンに基
づいて再認識処理をする機能を備えた文字認識装置を前
提とし、前記再認識処理をするに際し、前記抽出した部
分パターンを拡大して所定形状に正規化する正規化手段
を備え、その正規化手段により拡大正規化された画像デ
ータに対して上記再認識処理を行うように構成した(請
求項1)。
【0015】ここで拡大処理は、部分パターン全体の形
状が拡大されていればよく、部分的には拡大率が1以下
(縮小)になる領域を含んでいてもよい。そして、拡大
する所定形状とは、再認識処理する際の認識率が向上す
るような情報量(特徴量)が抽出されるようになってい
ればよい。そして、元の文字パターンの大きさと同一に
すると、認識装置を共通化できる。
【0016】このように再認識処理する前に拡大処理す
ることにより、情報量が増加する。よって、従来判別し
にくかった部首部分の占める面積が大きい「門構え」や
「国構え」等の文字であっても、小さな非部首部分が拡
大されることにより、確実に相互の文字を判別できるよ
うになる。
【0017】そして好ましくは、前記正規化手段による
拡大処理が、前記部分パターンにおける重心が正規化目
標の前記所定形状の重心に来るように前記部分パターン
上の各部位を拡大する重心正規化法を用いるようにする
ことである(請求項2)。
【0018】ここで重心正規化法とは、正規化前のパタ
ーン(部分パターン)の重心が、正規化後の領域の中心
に位置するように各部分をそれぞれ所定の倍率で拡大す
る(元の部分パターンが極端に偏っている場合には、部
分的に縮小することもある)ものをいう。これにより、
元の文字のバランスが悪くても、そのバランスの悪さが
解消され、また部分パターン中に余白部分が多く含まれ
ていても、係る場合には重心は余白部分と反対側に偏る
ので余白部分の拡大率は小さくなり、正規化された画像
データ中に存在する余白部分の割合が小さくなる。よっ
て、手書き文字のように元のパターン形状が千差万別の
ものであっても、標準パターンに近くなり、認識率が向
上する。
【0019】また、前記部分パターンを抽出するに際
し、予め定めた固定領域を抽出するようにしてもよい
(請求項3)。すなわち、文字パターンは、多くの場合
部首部分と非部首部分により構成され、再認識処理が必
要な文字の場合には、統計的に部首部分と非部首部分の
存在する領域がわかっているので、係る領域を固定的に
画一的に抽出しても、再認識に必要な特徴量データを抽
出できる。これにより、認識率を低下させることなく、
処理が高速化され、また、部分パターンを抽出するため
に文字パターンの状態を検出する特別な装置が不要とな
り、構成が簡易化する。
【0020】また、前記部分パターンを抽出するに際
し、文字パターンの状態に基づいて再認識対象の文字部
分の存在領域を特定し、抽出するようにしてもよい(請
求項4)。ここで再認識対象の文字部分とは、実施の形
態でいう非部首部分のことをいい、判別したい文字間で
非共通のパターン部分である。そして、その存在領域と
は、文字部分を含みできるだけその周囲に余白部分を含
まないような領域を意味し、実施の形態では図19にお
ける二点鎖線で囲んだ文字部分に外接する四角形であ
る。なお、その形状は四角形に限る必要はなく、また外
接していなくても近接していればよい。
【0021】係る構成にすると、文字パターンの状態を
検出する装置が必要となり、請求項3の発明に比べると
装置が大型化する。しかし、部分パターン中には余白部
分が存在しないか或いは可及的に少なくなるので、認識
率が向上する。また、余白部分をほぼ含まないため、上
記のように重心正規化法を用いずに、パターン部分の形
状が一致するように部分パターンの全体を同一の倍率
(縦横方向ではもちろん異なっても可)で拡大するよう
にしても精度の良い認識が可能となる。
【0022】また、より具体化した解決手段としては、
与えられた文字パターンに対して所定の認識処理をして
各文字の標準パターンに対する類似度を求め、文字候補
を特定する認識手段と、前記認識手段の認識結果に基づ
いて、再認識が必要か否かを判断する再認識判定手段
と、前記文字パターン中の所定の領域を抽出する部分抽
出手段と、前記部分抽出手段の出力を受けて、その部分
パターンを所定形状に拡大し正規化する正規化手段と、
前記正規化手段により正規化された画像データに対して
所定の認識処理をして各文字の標準パターンに対する類
似度を求め、文字候補を特定する再認識用認識手段と、
前記認識手段による認識結果と前記再認識用認識手段に
よる認識結果に基づいて、文字候補の順位を決定する判
定結果決定手段とを備えて構成することである(請求項
5)。
【0023】ここで、再認識する部分の装置構成は、請
求項1〜4に記載されたものと同様のものを適用でき
る。
【0024】一方、本発明に係る文字認識方法では、与
えられた文字パターンの一部を抽出して部分パターンを
生成し、その生成した前記部分パターンに対し、拡大処
理を行い所定の大きさに正規化し、前記正規化されて得
られた画像データに対して認識処理を行うようにした
(請求項6)。これが本発明の要部である再認識処理部
分についてのものである。
【0025】そして、文字認識全体、すなわち、最終的
に処理中の文字パターンの文字候補を決定するための文
字認識方法としては、文字パターン全体に対して所定の
認識処理を行い各文字の標準パターンに対する類似度を
求め、文字候補を複数抽出し、前記認識結果が再認識必
要か否かを判断し、再認識必要な場合には、前記文字パ
ターン中の所定の領域を抽出して部分パターンを生成
し、次いで、その部分パターンを所定形状に拡大して正
規化し、得られた正規化後の画像データに対して所定の
再認識処理をして各文字の標準パターンに対する類似度
を求め、少なくとも最も類似度の高い第1文字候補を抽
出し、前記文字パターン全体に対して行った認識処理に
より得られた最も類似度の高い文字候補と、前記第1文
字候補とを比較し、一致していない場合に認識処理及び
再認識処理の結果に基づいて、文字候補の順位を決定す
るようにした(請求項7)。
【0026】そして、上記いずれの場合にも好ましく
は、前記正規化処理が、部分パターンの重心を求めると
ともに、その部分パターン中の基準位置を複数箇所選択
し、前記部分パターンの重心が拡大処理後の所定の大き
さからなる画像データの重心になり、前記複数の基準位
置が、それぞれ対応する前記画像データの基準位置にく
るように前記部分パターンの各部分を拡大する重心正規
化法を用いることである(請求項8)。
【0027】ここで基準位置とは、拡大(座標変換)す
る際の元画像と拡大後の画像との対応関係をつけるため
の基準となるマーク部分で、実施の形態では、元画像す
なわち部分パターン上では、重心を交点とする縦軸・横
軸と枠との交点(X1,X2,Y1,Y2)であり、拡
大後の画像データ上では枠を構成する各辺の中点(X
1′,X2′,Y1′,Y2′)である。
【0028】また、本発明に係るスキャナでは、画像読
取手段と、その画像読取手段により撮像して得られた画
像データに対して所定の画像処理を行い文字単位で切出
して文字パターンを抽出する手段と、前記文字パターン
に対して所定の文字認識処理及び再認識処理を行う請求
項1〜5のいずれかに記載の文字認識装置とを備えて構
成した(請求項9)。
【0029】スキャナ内に文字認識装置を組み込み一体
化することにより、スキャナの出力を外部のコンピュー
タなどに接続することによって、直接読み取ったデータ
が適すとデータとして取り込ませることができる。ま
た、画像読取手段との相性もよくなり、認識率が高くな
る。
【0030】
【発明の実施の形態】図5は、本発明の文字認識装置の
実施の形態の一例を示すブロック図である。同図に示す
ように、入力側に行切出回路10を備え、この行切出回
路10にイメージスキャナなどの画像読取手段を介して
取得した画像データを与えるようになっている。
【0031】行切出回路10は、与えられた画像データ
中の行部分を抽出するもので、例をあげて説明すると、
図6(A)に示すような画像データが与えられられる
と、所定の軸(図示の例では縦軸)に対して濃度値の投
影を行い、同図(B)に示すようにヒストグラムを作成
する。なお、前処理で2値化されている場合は文字を構
成する黒画素の濃度値を「1」として加算し、文字を構
成する画素数を計数することになる。そして、あるしき
い値Th以上の部分が行を構成する部分とみなし、原則
として連続してしきい値Th以上となっている部分を1
つの行として抽出する。なお、連続してしきい値Th以
上となっている部分の高さが一定の範囲内に無い場合に
は、行でないとして抽出しない。すなわち、高さが所定
の範囲より大きい場合には、図形等の可能性があり、ま
た所定の範囲よりも小さい場合に文字でない可能性が高
いためである。
【0032】なお、本例では、比較的大型の装置、すな
わち、原稿全体を読み取るとともに、文字認識処理をす
るタイプのものに適用した例を示しているが、例えばハ
ンディタイプのスキャナにより、1行ずつ読取るタイプ
のものに適用する場合には、係る行切出回路10は必ず
しも設けなくてもよい。
【0033】行切出回路10の後段に、文字切出回路1
1が設けられている。この文字切出回路11は、行切出
回路10により切出された各行の画像データから1文字
単位で文字部分を抽出するようになっている。一例を示
すと、図7のように、文字切出回路11は、切出された
各行に対し、行単位でその行の延びる方向の軸に対して
投影し、濃度値のヒストグラムを作成する。
【0034】そして、行の先頭から濃度値ヒストグラム
を走査し、濃度値が0よりも大きい(所定のしきい値を
設定し、それ以上としてもよい)箇所は文字を構成する
部分とみなし、濃度値が0(或いはしきい値以下)の箇
所が文字と文字の間の部分とみなせる。
【0035】そこで、原則として連続して濃度値がある
値より大きくなっている部分を1つの文字として抽出す
る。なお、行抽出の際と同様に、連続している幅が一定
の範囲外の場合には、文字でないとして抽出しないよう
にする。また、逆に幅が小さくても例えば「い」のよう
に一つの文字で二つの濃度ヒストグラムの山が生じる
(特に手書きの場合には中間に空白が生じやすい)もの
もあるので、係る場合には、抽出するようにする。な
お、上記抽出の適否の具体的なアルゴリズムは従来のも
のを適用できるので詳細な説明を省略する。
【0036】この文字切出回路11の後段には、正規化
回路12が接続され、文字切出回路11によって切出さ
れた各文字部分のパターンを拡大または縮小してそのパ
ターンの大きさを標準のものに修正するようになってい
る。そして、この正規化回路12の後段に認識回路13
が接続されている。この認識回路13にて、正規化され
たパターンを認識回路13に内蔵される各文字の標準パ
ターンと比較し、各標準パターンに対する類似度を求め
る。本例では疑似ベイズ関数による数値、すなわち、固
有ベクトルと特徴量の積和を中心とする数値を求め、そ
れを類似度としている。
【0037】そして、求めた類似度の高い順にソート
し、高いものから第1候補文字,第2候補文字…とす
る。そして、類似度の高いものから所定数(例えば10
個)の候補文字を候補文字群として出力する。なお、認
識処理アルゴリズムも従来の各種のものを適用できるの
で、詳細な説明を省略する。
【0038】ここまでの構成が従来のものと同様で、従
来のものでは、第1候補文字を表示し、第1候補文字が
違う場合には、そのユーザーからの修正命令を待って候
補文字群を一括或いは候補順に順次表示し、正しい文字
を選択させるようにしていたが、本発明では以下のよう
に再認識機能を付加し、その再認識した結果を反映させ
ることにより精度よく認識できるようにしている。
【0039】ここで本発明では、認識回路13の出力を
再認識判定回路14に与えるようにしている。再認識判
定回路14は、認識回路13による認識結果に基づき、
再認識処理をするか否かの判断をするもので、具体的に
は、以下の2つの条件を満たすか否かを判断し、ともに
満たす場合に再認識処理をするとの決定を行うようにな
っている。
【0040】第1候補文字が対象文字 第1候補文字と第2候補文字の距離差が一定値以内 ここで対象文字とは、誤認識しやすい文字パターン中で
比較的大きな面積を占める所定の部首からなる漢字のグ
ループであり、予め定めておき、再認識判定回路14内
に辞書として保持しておく。一例をあげると、「門構
え」における「間,問,聞」等や、「国構え」における
「回,囲」等や「しんにょう」における「違,達,逢」
等がある。
【0041】そして、対象文字には、上記所定の部首で
あればすべてを該当させておいてもよいが、上記と同一
の部首であっても、相互に間違いにくい(判別できる)
文字もあるので、係る文字の場合には対象文字としない
ようにしてもよい。このように対象文字を制限すること
により、再認識処理を実行する回数を減少させ、認識処
理を短時間化することができる。なおまた、対象文字に
該当する部首も上記のものに限定されない。
【0042】また、の条件である距離差とは、認識回
路13で求められた各候補文字に対する類似度の数値の
差である。そして、このように一定値以内という条件を
付加したのは、第1候補文字と第2候補文字の距離差が
大きく違う場合には、第1候補文字である確率が非常に
高く、再認識処理をしても同様の結果となる蓋然性が高
いためである。
【0043】そして、上記との条件は、まずを満
たすか否かを判断し、満たす場合にはの条件の適否を
判断するようにしている。これにより、距離差を求める
処理を実行する回数が可及的に抑制され、認識処理の高
速化が図れる。また、本発明ではとの2つの要件を
具備するものに対して再認識対象と認定したが、本発明
はこれに限ることはなく、の条件を具備する場合には
再認識対象とするようにしてもよい。
【0044】そして、その再認識判定回路14による判
定結果を部分抽出回路15並びに判定結果決定部19に
送るようになっている。また、判定結果決定部19に
は、上記再認識の要否の判定結果とともに、認識回路1
3から与えられた候補文字群に関するデータ、すなわち
各候補文字及びその候補順位も併せて出力するようにな
っている。
【0045】部分抽出回路15は、再認識処理をすると
の判定結果を受け取った場合に、再認識対象の文字パタ
ーンから非部首部分に相当する部分パターンを抽出する
もので、具体的には以下のような処理を実行する。
【0046】まず、正規化回路12より再認識対象の文
字パターンデータを取得する。また、どの対象文字のグ
ループ(部首)についての再認識処理かもわかっている
ので、その部首に対応した切出位置に関するデータ(切
出パラメータ)を切出パラメータ記憶部16から取得す
る。そして切出パラメータで特定される領域内に存在す
る部分パターンを抽出し、次段の正規化回路17に転送
する。
【0047】ここで切出パラメータとは、例えば図8
(A)に示すように正規化した文字パターンの外枠W1
を基準とし、非部首部分が存在する領域を規定する内枠
W2を特定するためのデータで、例えば4つの頂点の座
標である(内枠W2が長方形に固定される場合には、対
角線上の2つの頂点の座標でもよい)。
【0048】すなわち、文字パターンが正規化されてい
るので、おおよその部首部分の存在する領域と非部首部
分の存在する領域が統計的に特定される。そこで、本例
では画一的に部首に応じて切出す領域を決定することに
より、処理を簡易にして高速化が図れるとともに、非部
首部分を特定するための特別な装置を不要にして装置全
体の小型化が図れる。
【0049】また、仮に上記内枠W2内に非部首部分の
一部が入りきらなかったり、部首部分の一部が含まれる
(図8(B)に示された枠の左隅)ことがあっても、後
述するごとく最終的な認識結果にはさほど影響を与えな
い。また上記のように切出す枠W2を画一的にしたた
め、例えば図9(A)に示すように、内枠W2内に非部
首部分以外の余白が多く存在する(図示の例では枠内の
下方部分)こともあるが、これも後述するごとく最終的
に認識結果に影響を与えない。よって、認識率を低下さ
せることなく処理が高速化されるので、好ましい。
【0050】なお、「門構え」と「国構え」についての
切出パラメータで特定される内枠W2の一例を示すと、
それぞれ図10,図11に示すようになる。
【0051】ところで、各回路がそれぞれ与えられたデ
ータに対して順次所定の処理を行い出力するので、正規
化回路12から認識回路13に正規化した文字パターン
を出力する際に同時に部分抽出回路15にも係る文字パ
ターンを出力しておき、部分抽出回路15では与えられ
た文字パターンを一時保持し、再認識判定回路14の判
定出力が「処理要」の時には上記のような部分抽出処理
をし、「処理不要」の時には何もしないようにしてもよ
い。
【0052】正規化回路17は、部分抽出回路15から
与えられた部分パターンを所定の大きさに拡大するもの
で、本例では、正規化回路12で正規化された文字パタ
ーン全体の大きさに正規化している。これにより、単に
抽出しただけでは面積も小さく得られる情報量も少ない
が、拡大することにより、情報量が多くなり、より精度
のよい判別が行える。
【0053】また、ここでの正規化処理は、正規化回路
12と同一構成のものを使用することができ、重心方向
を中心とする正規化法(重心正規化)を用いて正規化す
る。具体的には、例えば抽出した部分パターンが図12
(A)に示すようになっているとすると、そのパターン
上での重心位置を求める。つまり、濃淡ヒストグラムを
求めて両側に存在する黒画素のビット数が等しくなるよ
うな境界線を縦横方向でそれぞれ求め、その交差点を重
心Oとする。また、上記境界線と部分パターン領域を決
定する枠W2との交点をそれぞれX1,X2,Y1,Y
2とする。
【0054】そして、重心Oが、正規化後の領域(同図
(B))を決定する枠W3の中心O′に位置し、枠との
各交点X1,X2,Y1,Y2が、正規化後の枠の各辺
の中点X1′,X2′,Y1′,Y2′になるように座
標変換する。すなわち、重心Oを基準として、上側,下
側,左側,右側の倍率をそれぞれ決定し、それに基づい
て変倍する。なお、OとY1間の距離がdとし、O′と
Y1′の距離がd′とすると、上記倍率は、d′/dと
なる。
【0055】そして、重心正規化法を用いることによ
り、バランスが崩れていて、正規化前の部分パターンの
状態では、余白部分が片側に偏っているような場合で
も、その時の重心は余白と反対側にずれるので、余白部
分の拡大率が小さくなり、最終的に正規化された状態で
は、パターン全体に対する余白部分の占める割合が少な
くなる。
【0056】一例を示すと、図8(A)と図9(A)を
比較すると、図9の方が非部首部部分の「首」の字が小
さくバランスが悪いが、ともに重心正規化法により正規
化すると、同図(B)に示すように、バランスがよく枠
W3内に収まるのがわかる。さらに、文字部分が常に枠
W3の中心に位置するので、標準パターンと近くなり、
整合性がとりやすく、認識率が高くなる。
【0057】さらに、正規化回路17の出力を認識回路
18に接続し、部分パターンに対して正規化した画像デ
ータを認識回路18に転送するようにしている。そして
認識回路18では、与えられた画像データから特徴量抽
出を行い、標準パターンと比較して類似度を求める。そ
して、求めた類似度の高い順にソートし、高いものから
第1候補文字、第2候補文字…とする。そして、類似度
の高いものから所定数(例えば10個)の候補文字を候
補文字群として判定結果決定部19に出力する。
【0058】なお、この認識回路18における認識処理
は、比較基準となる標準パターンが異なるだけで、認識
処理自体は認識回路13と同一のものを用いることがで
きる。また、本例では2つの認識回路13,18の共通
化を図るために、部分パターンに対する認識回路18で
も所定数の候補文字を出力するようにしたが、本発明で
は、必ずしも複数の候補文字を出力する必要はなく、少
なくとも第1候補文字のみを出力するようになっていれ
ばよい。
【0059】判定結果決定部19では、再認識判定回路
14から送られてきた候補文字群の中の第1候補文字
と、認識回路18から与えられた第1候補文字とを比較
し、両者が同じ場合には、認識回路13で求めた上記候
補文字群の候補順で決定する。一方、両第1候補文字が
異なる場合には、再認識した結果である認識回路18か
ら与えられた第1候補文字を最終的な第1候補文字とな
るように、その順序を入れ替える。
【0060】つまり、認識回路18で決定された第1候
補文字が、候補文字群の中に入っている場合(通常の場
合はこれに該当する)には、その文字を繰り上げて候補
順位を1位にし、候補文字群における第1位から確定さ
れた第1候補の元の順位までの候補文字の順位を1ずつ
繰り下げる(図13参照)。また、候補文字群の中に入
っていなかった場合には、先頭に認識回路18で確定さ
れた第1候補文字を挿入し、候補文字群を構成する各候
補文字の順位を1つずつ繰り下げる(図14参照)。な
お、図13,図14中丸数字は候補順位を示している。
また各図に列挙した各文字の順位は上記した入れ替えの
説明のために便宜上列挙したもので、実際の認識結果に
基づくものではない。
【0061】また、再認識判定回路14における判定結
果が「再認識不要」の場合には、判定結果決定部19で
は、受け取った文字候補群のまま順位を決定し、出力部
20に出力する。
【0062】そして、確定した候補文字及びその順位を
出力部20に送り、その出力部20を介して、その確定
した候補文字及び順位のデータを外部のコンピュータ等
の処理装置に出力する。そしてコンピュータ等では、受
け取ったデータに基づいて図示省略の表示装置上に第1
候補文字を出力表示する。また必要に応じてその文字に
ついての第2候補文字以降も表示し、ユーザーからの指
示にしたがって最終的に文字を確定する。
【0063】次に、本発明に係る文字認識方法の実施の
形態について上記した装置を用いて説明する。基本的な
処理の流れは、図15に示すフローチャートのようにな
っている。すなわち、所定の前処理(行・文字切り出
し,正規化)を経た後、通常の文字認識を行い、各文字
に対する類似度を求め、候補文字群を生成する(ST
1)。
【0064】次に、再認識判定回路14を実行して処理
中の文字が再認識対象条件に合致するか否かを判断する
(ST2)。すなわち、候補文字群の中の第1候補文字
が対象文字か否かを判断し、対象文字の場合は第1候補
文字と第2候補文字の類似度の差(距離差)を求め、一
定値以内の場合に再認識対象条件に合致すると判断す
る。
【0065】そして、再認識対象条件に合致しない場合
には、ステップ9に飛び、ステップ1で求めた認識結果
で確定し、出力する。一方、再認識対象条件に合致する
場合には、本発明の要部となる再認識アルゴリズムに移
行する。すなわち、ステップ3に飛び、非部首部分を抽
出する(ST3)。この時、ステップ1で文字認識した
正規化後の画像データと同一の画像データに対し、部首
部分に応じた固定領域を抽出する。これにより、元とな
る認識対象の画像データが図16(A),図17(A)
に示すようになっているとすると、それぞれ図16
(B),図17(B)に示すような部分パターンが抽出
される。
【0066】次いで、抽出された部分パターンに対して
正規化処理を行い、所定の大きさに拡大する。この時重
心正規化法を用いることにより、それぞれ図16
(C),図17(C)に示すような正規化画像が生成さ
れる。同図から明らかなように、重心正規化法により、
部分パターンの際に存在した上方の余白部分の占める割
合が高さ方向で半分以上であったものが、正規化画像で
は半分以下になり小さくなるのがわかる。
【0067】そして、得られた正規化画像に対して特徴
量を抽出し(ST5)、所定の文字認識処理を行う(S
T6)。そして、この2つの処理ステップが、認識回路
18で実行される。上記した図16(C),図17
(C)に示す例では、それぞれ「日」,「口」,…に対
する類似度が求められ、「日」に対する類似度が最も高
い場合には、第1候補文字は「間」になり、「口」に対
する類似度が最も高い場合には、第1候補文字は「問」
になる。また、この再認識における認識処理では、予め
該当する文字群がわかっているので、比較対象となる標
準パターンの数も少なくなり、短時間で認識処理をする
ことができる。また、そのように比較対象が少ないこと
から、特徴量を増やしたとしてもさほど処理の長時間化
はしないで済むので、より認識率が向上する。
【0068】また、図16(B),図17(B)の部分
パターンは、それぞれ図18(A),(B)のように表
現でき、図16(C),図17(C)の正規化画像は、
それぞれ図18(C),(D)のように表現できる。同
図から明らかなように、部分抽出して得られた図18
(A),(B)に示す部分パターンに基づいて再認識処
理するものに比べ、本発明では、同図(C),(D)に
示すように、正規化して拡大した画像に基づいて再認識
処理するので、情報利用が増え、特徴量を精度よく抽出
でき、認識率が向上する。すなわち、特徴量空間を4×
4の局所領域に分割した際に、部分パターンでは2つの
マスメにしか入らないが、正規化画像では、それに比べ
て数多くのマスメ内に存在するので、抽出される特徴量
データも増加する。
【0069】そして、特徴量について一例を示すと、
「日」及び「口」の横棒の部分に注目すると、同図
(A),(B)では、すべての横棒が一番下の列に存在
し差別化するための特徴量として十分ではないが、同図
(C)では、3つの横棒がそれぞれ別々の列に存在し、
同図(D)では、2つの横棒がそれぞれ別々の列に存在
するので、両者を正しく判別できる。
【0070】そして、再認識結果は有効か否かを判断し
(ST7)、有効であればステップ1における認識処理
で求めた文字候補群の順位を適宜入れ替える置き換え処
理を行い認識結果を確定する(ST8,9)。そして、
このステップ7〜9が、判定結果決定部19で行われ
る。なお、再認識結果が有効か否かは、再認識処理によ
り得られた第1候補文字がステップ1で求めた第1候補
文字と異なる場合に有効と判断する。
【0071】なお、上記した実施例では、部分パターン
を抽出する際に、固定データの切出パラメータに基づい
て画一的に画像パターン中の所定領域を切出したが、本
発明はこれに限ることはなく、例えば図19に示すよう
に、切出パラメータに基づく枠W2に対し、非部首部分
のパターンが小さくて余白部分が多い場合に、重心正規
化法を実施する前に余白部分を除去し、その後正規化を
行うようにしてもよい。
【0072】すなわち、図示するように、枠W2は、4
つの直線(辺)L1〜L4から構成されるので、例えば
各辺をそれぞれ中央に向かって1画素分ずつ移動させて
行き、文字部分のパターンに接触(線上に黒画素が存在
する)した場合にはその辺の移動を停止する。これによ
り、図中二点鎖線で示すように、余白部分を除去した新
たな枠を構成する各線分L1′〜L4′が設定され、そ
の線分で囲まれた領域に対して重心正規化法などの各種
の正規化法を用いて拡大処理するようにしていもよい。
これにより、認識に不要な余白部分が除去され、正規化
後の画像データのばらつきが小さくなるので、認識率が
より向上する。
【0073】さらには、このように一旦固定の枠を設定
し切出すのではなく、従来例で示した公報に開示されて
いるように、投影法を用いて縦・横軸に対して濃淡ヒス
トグラムを生成し、そのヒストグラムの谷部分から、部
首部分と非部首部分の境界部位を求め、それに基づいて
非部首部分の部分パターンを抽出するようにしても良
い。このようにすると、従来装置が有する投影手段が別
途必要となり、従来品に比べて装置の小型化を図るとい
う目的は達成されないが、部分パターンを拡大すること
により、再認識時の情報量が増加するので、第1の目的
である認識率の向上は達成できる。
【0074】また、上記した正規化回路17における正
規化後の大きさを正規化回路12におけるそれと同一に
したが、これは両回路を共通化するためで、本発明では
必ずしも同一にする必要はない。また、共通化する場合
も、同一の構成からなる回路を2つ用意し、それらを図
5に示すようなブロック図の配置に設定しても良く、或
いは、ハード的にも単一の部品で正規化回路12,17
の2つの機能を持たせたり、認識回路13,18の2つ
の機能をもたせるようにしても良い。
【0075】そして、係る単一部品を用いるタイプとし
ては、例えば図29に示すように、ゲートアレイにより
文字認識ユニット25を構成し、文字切出回路11から
データを入力した場合には、その処理結果を再認識判定
回路19に出力し、部分抽出回路15からデータが与え
られた場合には、その処理結果を判定結果決定部19に
出力するようにすることによって実行できる。ここで文
字認識ユニット25は図5に示す、一組の正規化回路と
認識回路を直列に接続したもので、入力されたデータに
対して正規化、認識処理を行い、指示された所定の装置
に処理結果を出力するようになっている。なお、その他
の構成並びに作用効果は図5に示すものと同様であるの
で各部の詳細な説明は省略する。
【0076】図21は、本発明に係るスキャナの好適な
実施の形態の一例を示している。同図に示すように、ス
キャナは、CCD等にイメージスキャナを備えた画像読
取部26と、その画像読取部26の出力(濃淡画像デー
タ)に対して所定の画像処理を施す前処理部27と、そ
の前処理して得られた画像データを受けとり、文字認識
処理を行う文字認識装置28とを備えている。前処理部
27では、孤立点等のノイズを除去したり、背景部分と
文字部分を分離するための2値化処理等の各種の処理を
行うものである。そして、文字認識装置28が、上記し
た各実施の形態や変形例の構成を備えたものである。こ
のようにスキャナに対して文字認識装置を組み込むと、
スキャナ自体に文字認識(OCR)機能が付加されるの
で、別途のOCR機能のためのアプリケーションを用意
する必要がなく、また、一体化されることによりデータ
通信も精度良くなる。そして、このスキャナとしては、
据え置き型のものでもよく、或いはハンディタイプのも
のでも良い。
【0077】
【発明の効果】以上のように、本発明に係る文字認識装
置及び方法並びにそれを用いたスキャナでは、再認識処
理する際に、文字パターンの一部を抽出して得られた部
分パターンに対し、拡大処理して所定の大きさに正規化
した状態で認識処理するので、情報量が拡大され、たと
え部分パターンが小さい場合であっても確実に所望の特
徴量を抽出でき、例えば同一部首の類似した文字相互間
であっても正確に判別でき、認識率が向上する。
【0078】このように拡大することにより、手書き文
字やバランスの悪い文字であっても情報量が増えること
から正しく認識され、しかも、請求項2,8のように重
心正規化法を用いることにより、バランスが悪い文字等
でもそれが解消されるので、認識率が向上する。
【0079】さらに、請求項3のようにすると、部分抽
出に特別な装置を設ける必要がなく、回路規模を大型化
させることがなくなる。さらに、文字パターンに対する
認識処理と部分パターン対する再認識処理を同一の認識
装置で処理が可能となるので、より小型化が可能とな
る。
【図面の簡単な説明】
【図1】従来例を説明する図である。
【図2】従来例を説明する図である。
【図3】従来の問題点を説明する図である。
【図4】従来の問題点を説明する図である。
【図5】本発明に係る文字認識装置の実施の形態の一例
を示すブロック図である。
【図6】行切出回路の機能を説明する図である。
【図7】文字切出回路の機能を説明する図である。
【図8】部分抽出回路及び正規化回路の機能を説明する
図である。
【図9】部分抽出回路及び正規化回路の機能を説明する
図である。
【図10】部分抽出回路の機能を説明する図である。
【図11】部分抽出回路の機能を説明する図である。
【図12】正規化回路の機能を説明する図である。
【図13】判定結果決定部の機能を説明する図である。
【図14】判定結果決定部の機能を説明する図である。
【図15】本発明に係る文字認識方法の実施の形態の一
例を示すフローチャートである。
【図16】文字認識方法の部分抽出から正規化処理まで
の処理結果を示す図である。
【図17】文字認識方法の部分抽出から正規化処理まで
の処理結果を示す図である。
【図18】本発明の効果を説明する図である。
【図19】部分抽出回路の別の機能を説明する図であ
る。
【図20】本発明に係る文字認識装置の実施の形態の他
の例を示すブロック図である。
【図21】本発明に係るスキャナの実施の形態の一例を
示すブロック図である。
【符号の説明】
13 認識回路(文字パターン全体に対する) 14 再認識判定回路 15 部分抽出回路 16 切り出しパラメータ記憶部(固定領域を決定) 17 正規化回路(再認識用) 18 認識回路(再認識用) 19 判定結果決定部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 与えられた文字パターンの一部を抽出し
    て得られる部分パターンに基づいて再認識処理をする機
    能を備えた文字認識装置において、 前記再認識処理をするに際し、前記抽出した部分パター
    ンを拡大して所定形状に正規化する正規化手段を備え、 その正規化手段により拡大正規化された画像データに対
    して上記再認識処理を行うようにしたことを特徴とする
    文字認識装置。
  2. 【請求項2】 前記正規化手段による拡大処理が、前記
    部分パターンにおける重心が正規化目標の前記所定形状
    の重心に来るように前記部分パターン上の各部位を拡大
    する重心正規化法を用いたものであることを特徴とする
    請求項1に記載の文字認識装置。
  3. 【請求項3】 前記部分パターンを抽出するに際し、予
    め定めた固定領域を抽出するようにしたことを特徴とす
    る請求項1または2に記載の文字認識装置。
  4. 【請求項4】 前記部分パターンを抽出するに際し、文
    字パターンの状態に基づいて再認識対象の文字部分の存
    在領域を特定し、抽出するようにしたことを特徴とする
    請求項1または2に記載の文字認識装置。
  5. 【請求項5】 与えられた文字パターンに対して所定の
    認識処理をして各文字の標準パターンに対する類似度を
    求め、文字候補を特定する認識手段と、 前記認識手段の認識結果に基づいて、再認識が必要か否
    かを判断する再認識判定手段と、 前記文字パターン中の所定の領域を抽出する部分抽出手
    段と、 前記部分抽出手段の出力を受けて、その部分パターンを
    所定形状に拡大し正規化する正規化手段と、 前記正規化手段により正規化された画像データに対して
    所定の認識処理をして各文字の標準パターンに対する類
    似度を求め、文字候補を特定する再認識用認識手段と、 前記認識手段による認識結果と前記再認識用認識手段に
    よる認識結果に基づいて、文字候補の順位を決定する判
    定結果決定手段とを備えたことを特徴とする文字認識装
    置。
  6. 【請求項6】 与えられた文字パターンの一部を抽出し
    て部分パターンを生成し、 その生成した前記部分パターンに対し、拡大処理を行い
    所定の大きさに正規化し、 前記正規化されて得られた画像データに対して認識処理
    を行うようにしたことを特徴とする文字認識方法。
  7. 【請求項7】 文字パターン全体に対して所定の認識処
    理を行い各文字の標準パターンに対する類似度を求め、
    文字候補を複数抽出し、 前記認識結果が再認識必要か否かを判断し、再認識必要
    な場合には、前記文字パターン中の所定の領域を抽出し
    て部分パターンを生成し、 次いで、その部分パターンを所定形状に拡大して正規化
    し、得られた正規化後の画像データに対して所定の再認
    識処理をして各文字の標準パターンに対する類似度を求
    め、少なくとも最も類似度の高い第1文字候補を抽出
    し、 前記文字パターン全体に対して行った認識処理により得
    られた最も類似度の高い文字候補と、前記第1文字候補
    とを比較し、一致していない場合に認識処理及び再認識
    処理の結果に基づいて、文字候補の順位を決定するよう
    にした文字認識方法。
  8. 【請求項8】 前記正規化処理が、部分パターンの重心
    を求めるとともに、その部分パターン中の基準位置を複
    数箇所選択し、 前記部分パターンの重心が拡大処理後の所定の大きさか
    らなる画像データの重心になり、前記複数の基準位置
    が、それぞれ対応する前記画像データの基準位置にくる
    ように前記部分パターンの各部分を拡大する重心正規化
    法を用いたことを特徴とする請求項6または7に記載の
    文字認識方法。
  9. 【請求項9】 画像読取手段と、 その画像読取手段により撮像して得られた画像データに
    対して所定の画像処理を行い文字単位で切出して文字パ
    ターンを抽出する手段と、 前記文字パターンに対して所定の文字認識処理及び再認
    識処理を行う請求項1〜5のいずれかに記載の文字認識
    装置とを備えたスキャナ。
JP7345468A 1995-12-11 1995-12-11 文字認識装置及び方法並びにそれを用いたスキャナ Pending JPH09161005A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7345468A JPH09161005A (ja) 1995-12-11 1995-12-11 文字認識装置及び方法並びにそれを用いたスキャナ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7345468A JPH09161005A (ja) 1995-12-11 1995-12-11 文字認識装置及び方法並びにそれを用いたスキャナ

Publications (1)

Publication Number Publication Date
JPH09161005A true JPH09161005A (ja) 1997-06-20

Family

ID=18376808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7345468A Pending JPH09161005A (ja) 1995-12-11 1995-12-11 文字認識装置及び方法並びにそれを用いたスキャナ

Country Status (1)

Country Link
JP (1) JPH09161005A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190092155A (ko) * 2018-01-30 2019-08-07 광운대학교 산학협력단 단말기에서 실시간 글자 인식시 영상을 안정화하는 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190092155A (ko) * 2018-01-30 2019-08-07 광운대학교 산학협력단 단말기에서 실시간 글자 인식시 영상을 안정화하는 방법

Similar Documents

Publication Publication Date Title
US7627148B2 (en) Image data processing apparatus and method, and image data processing program
US6643401B1 (en) Apparatus and method for recognizing character
US6970601B1 (en) Form search apparatus and method
US5799115A (en) Image filing apparatus and method
JP4172584B2 (ja) 文字認識結果出力装置、文字認識装置、その方法及びプログラム
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
JP3411472B2 (ja) パターン抽出装置
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JPH09161005A (ja) 文字認識装置及び方法並びにそれを用いたスキャナ
JP3372005B2 (ja) 文字認識装置
JPH06180771A (ja) 英文字認識装置
KR19980058349A (ko) 영상정보를 이용한 사람 식별 방법
JP2917427B2 (ja) 図面読取装置
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JPH0916713A (ja) 画像領域分割方法
JP2003162688A (ja) 文字認識用辞書作成装置及び文字認識装置
JP2972443B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JP2001060250A (ja) 文字認識方法および装置
JPH10214308A (ja) 文字判別方法
JPS63131287A (ja) 文字認識方式
JPH08147411A (ja) 文字認識装置
JPH1021398A (ja) 方向特徴ベクトル抽出方法
JPH03219384A (ja) 文字認識装置
JPH03177985A (ja) 文字データの登録方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021105