JP2973892B2 - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JP2973892B2
JP2973892B2 JP7244129A JP24412995A JP2973892B2 JP 2973892 B2 JP2973892 B2 JP 2973892B2 JP 7244129 A JP7244129 A JP 7244129A JP 24412995 A JP24412995 A JP 24412995A JP 2973892 B2 JP2973892 B2 JP 2973892B2
Authority
JP
Japan
Prior art keywords
character
image
mask
background
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7244129A
Other languages
English (en)
Other versions
JPH0991378A (ja
Inventor
慎治 佐瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP7244129A priority Critical patent/JP2973892B2/ja
Publication of JPH0991378A publication Critical patent/JPH0991378A/ja
Application granted granted Critical
Publication of JP2973892B2 publication Critical patent/JP2973892B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学的に文字を読み
取る文字認識方式に関し、特に様々な筆記具で書かれた
手書き文字を読み取るための文字認識方式に関するもの
である。
【0002】
【従来の技術】手書き文字の認識方式では、文字の線部
分または背景部分の分布状況に応じて文字の整形を行う
処理方式の有効性が確認されている。この処理を一般的
に非線形正規化と呼ぶ。このような処理は手書きによる
文字の歪みを補正する能力を有しており、複雑な構造を
持つ漢字を読み取る場合などに特に有効であるとされて
いる。この非線形正規化技術の代表的な文献として、”
階層的な位置ずれ補正処理に基づく手書き漢字認識”
(電子情報通信学会研究会資料PRU87−104)が
知られている。
【0003】上記した非線形正規化処理では、入力され
た文字の画像のうち、文字の背景の狭い部分については
拡大し、背景の広い部分については縮小する処理が行わ
れている。このように整形することによって、文字を認
識するために予め持っている文字カテゴリ毎の特徴デー
タと重なる部分が増し、文字の認識率を向上させること
ができる。
【0004】
【発明が解決しようとする課題】しかしながら上記のよ
うな従来の文字認識方式では、文字を構成する文字線が
全て得られることを前提にして処理が行われているた
め、太いマジックや筆などで書かれた文字の文字線が重
なっていたり接触している場合にかえって認識性能が劣
化してしまうことがあった。
【0005】例えば、図10(a)に示すような通常の
ペンで書かれた文字イメージ「束」の場合、図に示すよ
うに文字線が全て与えられているため、図10(b)に
示すように非線形正規化を行っても正しい文字「束」が
認識される。しかしながら、図10(c)に示すように
中央部が潰れた文字イメージ「束」に非線形正規化を適
用すると、中央部に背景部分がないために、文字の整形
によって中央部が縮小され、図10(d)に示すような
画像に変換されてしまう。このため、正しい文字「束」
との形状差が大きくなり、文字カテゴリ毎の特徴データ
と照合した結果、誤った文字に認識されることがあっ
た。
【0006】また、特願昭60−111444号には
潰れた活字文字に対する認識方法として、文字線部のエ
ッジからある範囲の部分については照合領域とし、それ
より内部は照合領域外として認識する方法を記載してい
る。しかしながらこの方法は照合時の演算方法に関する
ものであるため、非線形正規化のような文字の整形が行
われず、手書き文字を読み取る場合に十分な効果を得る
ことができなかった。さらに、上記特願昭60−111
444号には、文字線の幅を抽出することが記載されて
いるが、その具体的な方法については触れられていな
い。
【0007】本発明は上記したような従来の技術が有す
る問題点を解決するためになされたものであり、様々な
太さで書かれ、文字線が重なった文字などに対しても、
文字の整形の効果を生かして、正しい文字を安定して認
識することができる文字認識方式を提供することを目的
とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
本発明の文字認識方式は、文字を画像として読み取り、
前記文字の認識結果あるいは候補を出力する文字認識方
式であって、読み取った文字の画像を予め定められた大
きさのマスクで走査し、前記マスク内の画素がすべて文
字線となる場合に、前記マスクの中央に位置する画素を
背景に置き換える第1の画像変換手段と、前記第1の画
像変換手段の出力画像から、背景の画素の並びの長さを
垂直に交わる2方向についてそれぞれ測定し、測定した
方向と垂直な方向に前記長さの逆数に比例する値をそれ
ぞれ累積し、前記累積した値がそれぞれ均一になるよう
にする第2の画像変換手段と、文字カテゴリ毎の特徴が
蓄積された辞書部と、前記第2の画像変換手段の出力画
像から文字の特徴を抽出し、前記辞書部に蓄積された特
徴と比較して類似している文字カテゴリを探しだし、前
記読み取った文字の認識結果あるいは候補を出力する照
合部とを有するものである。
【0009】このとき、前記第1の画像変換手段は、予
め定められた大きさの第1のマスクと、前記第1のマス
クと相似形で前記第1のマスクの周辺に形成される第2
のマスクとによって読み取った文字の画像を走査し、
第1のマスク内の画素がすべて文字線であり、かつ前
記第2のマスク内の画素に背景がある場合に、前記第1
のマスクの中央に位置する画素を背景に置き換えてもよ
い。
【0010】また、文字を画像として読み取り、前記文
字の認識結果あるいは候補を出力する文字認識方式であ
って、文字を画像として読み取り、前記文字の認識結果
あるいは候補を出力する文字認識方式であって、最も近
い背景の画素までの距離を各文字線の画素についてそれ
ぞれ計算する距離演算部、前記距離演算部の演算結果か
ら文字線の画素の数に対して前記距離が最小の画素の数
の比率を求め該比率から文字線の画素を背景に置き換え
るためのしきい値を算出するしきい値設定部、及び前記
しきい値より長い距離の画素を背景に置き換える画像変
換部を備えた第1の画像変換手段と、前記第1の画像変
換手段の出力画像から、背景の画素の並びの長さを垂直
に交わる2方向についてそれぞれ測定し、測定した方向
と垂直な方向に前記長さの逆数に比例する値をそれぞれ
累積し、前記累積した値がそれぞれ均一になるようにす
る第2の画像変換手段と、文字カテゴリ毎の特徴が蓄積
された辞書部と、前記第2の画像変換手段の出力画像か
ら文字の特徴を抽出し、前記辞書部に蓄積された特徴と
比較して類似している文字カテゴリを探しだし、前記読
み取った文字の認識結果あるいは候補を出力する照合部
と、を有するものである。
【0011】このとき、前記しきい値設定部は、前記
離演算部の演算結果から、文字線の画素の数に対する前
記距離が最小の画素の数の比率を求め、該比率から文字
線の画素を背景に置き換えるための下限のしきい値と、
前記下限のしきい値に予め定められた値を加算した上限
のしきい値とを算出し、前記画像変換部は、前記下限の
しきい値と上限のしきい値と間の距離の画素を背景に置
き換えてもよい。
【0012】さらに、上記したいずれかの文字認識方式
において、読み取った文字を一様な大きさに変換する正
規化手段を有していてもよい。
【0013】上記のように構成された本発明の文字認識
方式は、第1の画像変換手段によって読み取った文字の
画像を予め定められた大きさのマスクで走査し、マスク
内の画素がすべて文字線となる場合にマスクの中央に位
置する画素を背景に置き換えることで、2本の文字線が
重なったり接触している場合に、それらの文字線が分離
されて正しい文字に近い画像を得ることができる。
【0014】また、第1の画像変換手段で予め定められ
た大きさの第1のマスクと、第1のマスクの周辺に形成
される第2のマスクとによって読み取った文字の画像を
走査し、第1のマスク内の画素がすべて文字線であり、
かつ第2のマスク内の画素に背景がある場合に、第1の
マスクの中央に位置する画素を背景に置き換えること
で、2本の文字線が重なったり接触している場合だけで
なく、3本の文字線が重なったり接触している場合にも
それらの文字線が分離されて正しい文字に近い画像を得
ることができる。
【0015】さらに、第1の画像変換手段の距離演算部
で最も近い背景の画素までの距離を各文字線の画素につ
いてそれぞれ計算し、しきい値設定部で文字線の画素の
数に対して距離が最小の画素の数の比率を求め、文字線
の画素を背景に置き換えるためのしきい値を算出し、画
像変換部でしきい値より長い距離の画素を背景に置き換
えることで、様々な太さの文字を読み取る場合にも2本
の文字線が重なったり接触しているときに、それらの文
字線が分離されて正しい文字に近い画像を得ることがで
きる。特に、しきい値設定部でこのしきい値に予め定め
られた値を加算して上限のしきい値を設定し、画像変換
部で2つのしきい値の間の画素を背景に変換すること
で、3本の文字線が重なったり接触している場合にも対
応することができる。
【0016】
【発明の実施の形態】次に、本発明について図面を参照
して説明する。
【0017】(第1実施例)図1は本発明の文字認識方
式の第1実施例の装置構成を示すブロック図である。図
1において、文字認識装置は、光学的な手段によって文
字を読み込む入力部1と、入力された文字の画像を予め
定められた大きさのマスクで連続的に走査し、マスク内
がすべて文字線の場合に、マスク中央の画素を背景に置
き換える第1の画像変換手段2と、第1の画像変換手段
2から出力される第1の整形画像の背景の分布に基づ
き、垂直に交わる縦横2方向それぞれについて、その背
景の分布が均一になるように文字画像を整形する第2の
画像変換手段3と、文字カテゴリ毎の特徴が蓄積された
辞書部4と、第2の画像変換手段3から出力された第2
の整形画像から文字の特徴を抽出し、辞書部4に蓄積さ
れた文字の特徴と比較演算を行って入力された文字を認
識する照合部5と、照合部5の文字認識結果を出力する
出力部6とによって構成されている。
【0018】従来例で述べたような文字整形を行う場合
には前提条件となる文字線をなるべく正確に得ることが
重要である。本実施例では文字線の太さに注目し、文字
線が重なったと想定される太い線については、第1の画
像変換手段2によって強制的に中央部に背景を設けるよ
うにしている。そして、第1の画像変換手段2で処理し
た後、第2の画像変換手段3で非線形正規化にしたがっ
た文字の整形を行い、照合部5で文字の認識を行う。
【0019】このような構成において、入力部1によっ
て取り込まれた文字は入力文字画像として第1の画像変
換手段2に出力される。ここで、入力文字画像は格子状
に配列された複数の画素に対してそれぞれ白(背景)ま
たは黒(文字線)の値が設定された1文字分の2値画像
である。入力文字画像を受け取った第1の画像変換手段
2は入力文字画像の全面を予め定められた大きさのマス
クによって走査する。このマスクは、マスク内に納まる
入力文字画像の各画素が文字線あるいは背景であるかを
判定するための処理単位である。
【0020】ここで、マスク内の画素がすべて文字線の
場合、第1の画像変換手段2はマスクの中心部に相当す
る画素を背景の画素に変換し、それ以外の画素について
は入力文字画像のまま変換しないで出力する。この第1
の画像変換手段2で処理した文字画像を第1の整形画像
とする。
【0021】第2の画像変換手段3では、第1の整形画
像の背景の画素の分布にもとづいて第2の整形画像を作
成する。第2の画像変換手段3は、第1の整形画像の背
景の画素について、その縦方向と横方向の並びの長さを
それぞれ検出し、横方向の背景長はその逆数に比例する
値を縦方向に累積し、縦方向の背景長はその逆数に比例
する値を横方向に累積する。そして、その累積分布が一
様になるように画像変換基準を設定し、画像変換基準に
基づいて累積値の高い部分は圧縮し、累積値の低い部分
は拡大する。この処理は従来例で説明した非線形正規化
処理であり、この処理によって精度よく文字を認識する
ことができる。
【0022】これらの処理の様子を示したのが図2およ
び図3である。図2では文字「田」を例にして第1の整
形画像から第2の整形画像への変換過程を示している。
図2に示すように第1の整形画像で歪んでいた文字
「田」は、第2の整形画像では背景が均一にされて文字
「田」の形により正確に整形されている。また、図3
は、図10(c)で示したような中央部が潰れた文字
「束」を例にした場合の様子を示している。ここで、図
3(a)は第1の整形画像を表わしており、図3(b)
は第2の整形画像を表わしている。ここでも第2の整形
画像は従来に比較して文字「束」により近い画像に整形
されていることが分かる。
【0023】照合部5では、第2の整形画像から文字の
特徴を抽出し、予め辞書部4に登録されている文字カテ
ゴリ毎の特徴データと比較演算して類似している文字を
探しだす。そして、類似していると判定した文字を文字
認識結果として出力し、1文字分の認識処理を終了す
る。ここで、照合部5から出力される文字認識結果の信
号は、比較演算結果、および比較演算結果から導かれた
1つないし複数の文字コードなどから構成される。
【0024】なお、照合部5で文字の特徴を抽出する方
法には、文字エッジ部の特徴を抽出する方法(文字エッ
ジ部のみに着目)、方向の特徴を抽出する方法(文字線
部あるいはエッジ部の線の方向)、細線化によって特徴
を抽出する方法、画像の圧縮処理によって特徴を抽出す
る方法(変動を吸収するために画像を圧縮する)、畳み
込み演算により特徴を抽出する方法(マスクの各位置に
適当な係数を付与し、局所的に入力画像との積和演算を
行う)、およびマトリクス積による次元変換により特徴
を抽出する方法(画像全体とそれに対応するマスクとの
積和演算の組み合わせ)などがあり、これらの方法は処
理速度、読み取り対象、および認識精度要求からいずれ
を採用してもよく、任意に組み合わせて文字の特徴を抽
出してもよい。
【0025】また、照合部5で実施する比較演算につい
ても、様々な距離計算(市街区距離、ユークリッド距
離、マハラノビス距離、バタチャリヤ距離等)や内積等
の類似度計算、DPマッチング等のいずれを採用しても
よい。
【0026】上述した特徴抽出演算、比較演算について
は周知の技術であるので詳細な説明は省略する。さら
に、第2の画像変換手段3の処理内容についても、従来
例で示した引用文献”階層的な位置ずれ補正処理に基づ
く手書き漢字認識”およびその参考文献に詳しい説明が
あるのでその詳細な説明は省略する。
【0027】次に、本実施例の第1の画像変換手段2で
使用するマスクについて図面を参照して説明する。
【0028】図4に本実施例で使用するマスクの例を示
す。図4(a)において、マスク中央の○印の画素は背
景に置き換えるか否かの処理が行われる画素であり、以
下ではこの画素のことを評価画素と称す。マスク7は文
字の記入に使用した筆記具、記入した文字の大きさ、お
よび入力部1の分解能等の条件(活字の場合は文字フォ
ントと分解能になる)によって、文字線の太さよりも余
裕をもって大きくなるように実験的に定められ、本実施
例ではその縦横の幅を仮にそれぞれ画素9つ分とする。
このときのマスク7のサイズと入力文字画像の大きさの
関係を示したのが図4(b)である。
【0029】第1の画像変換手段2は、マスク7を使っ
て入力文字画像中の全画素がそれぞれ評価画素となるよ
うに走査し、マスク7内が全て文字線の場合に評価画素
を背景の値に設定し、それ以外の場合は評価画素を入力
文字画像と同じにする。このときの走査の順は任意に行
う。
【0030】また、第1の画像変換手段2では入力文字
画像の周辺が背景であると仮定し、入力文字画像の内部
にマスクがおさまる場合(図4(b)の斜線の部分がそ
の時の評価画素に対応する)についてのみ処理を行い、
評価画素とならなかった画素(図4(b)の斜線の以外
の部分)については、入力文字画像の画素と同じ値で出
力する。
【0031】上記したような処理を文字の整形を行う前
に第1の画像変換手段2で行うことで、2本の文字線が
重なったり接触している文字についても非常に簡単な処
理で正しい文字により近い画像を得ることができ、誤っ
た文字に認識されることが低減される。
【0032】なお、図4に示したように本実施例のマス
ク7の形状は正方形を採用しているが、活字等のように
縦横の幅が明らかに異なるものに対しては長方形のマス
ク7を使用してもよい。また、中央からマスク周辺部ま
での距離が一定になるような菱形(市街区距離ベース)
や疑似円形(ユークリッド距離ベース)のマスク形状を
採用してもよい。
【0033】(第2実施例)次に本発明の第2実施例に
ついて説明する。本実施例では第1の画像変換手段の処
理のみが第1実施例と異なっており、その他の構成およ
び処理内容は第1実施例と同様であるので、その説明は
省略する。
【0034】まず、本実施例の第1の画像変換手段で使
用するマスクについて説明する。
【0035】図5は本発明の文字認識方式の第1の画像
変換手段で使用するマスクの第2実施例の構成を示す図
である。本実施例の第1の画像変換手段で使用するマス
クは、3本の文字線が重なっている場合を想定して処理
を行うために、第1実施例で示したマスクの周囲にさら
にマスクを追加した構成としている。図5に示した斜線
部分(内側マスク)が第1実施例と同様のマスクに相当
し、斜線のない部分(周辺マスク)が本実施例で追加し
た部分である。このマスクの追加部分は入力文字画像の
対応する部分がすべて文字線ではないことを確認するた
めのものであり、そのサイズは、第1実施例のマスクと
同様の考え方で設定される。ここでは、一例として第1
実施例のマスクの周囲に縦横方向それぞれ5画素分の幅
のマスクを追加する。
【0036】なお、本実施例のマスク形状は第1実施例
で説明したように長方形でもよく、またその周囲に追加
するマスクの幅も縦横で均等である必要はない。
【0037】次に、本実施例の第1の画像変換手段の処
理手順を図6を参照して説明する。図6は本発明の文字
認識方式の第1の画像変換手段の第2実施例の処理手順
を示すフローチャートである。
【0038】図6において、第1の画像変換手段は、ま
ず最初に現在のマスクの位置が入力文字画像の照合範囲
(処理範囲)内にあるか否かを確認し(ステップS
1)、照合範囲内にある場合はステップS2に移って内
側のマスクを使用して第1実施例と同様の処理を行う。
内側のマスクによる処理では内側のマスク内の画素が全
て文字線であるか否かを確認し(ステップS3)、全て
文字線である場合にはステップS4に移って周辺のマス
クの位置が照合範囲内にあるか否かを確認する。周辺の
マスクが照合範囲にある場合、ステップS5に移って周
辺のマスクによる処理を開始する。周辺のマスクによる
処理では周辺のマスク内の画素がすべて文字線であるか
否かを確認し(ステップS6)、マスク内がすべて文字
線でないときに評価画素を背景に変換する(ステップS
7)。
【0039】ここで、スッテプS1でマスク位置が照合
範囲でない場合、ステップS3で内側のマスク内に背景
がある場合、およびステップS6で周辺のマスク内がす
べて文字線の場合には、評価画素を入力文字画像と同じ
値に設定する(ステップS8)。また、ステップS4で
周辺のマスク位置が照合範囲でない場合にはステップS
7に移って評価画素を背景に変換する。以上の処理が終
了したら照合範囲内すべてについて処理が終了したか否
かを確認し(ステップS9)、処理がすべて終了してい
ない場合には次の照合位置にマスクをセットして(ステ
ップS10)、ステップS1に戻って上記処理を繰り返
す。
【0040】このときの整形画像の様子を示したのが図
7である。図7(a)は文字「東」の中心が潰れたとき
の様子を示しており、図7(b)および(c)はこの潰
れた文字に対して第1実施例にもとづいて処理を行った
場合の第1の整形画像および第2の整形画像を示してい
る。また、同図(a)に対して、第2実施例にもとづい
て作成した第1の整形画像と第2の整形画像をそれぞれ
図7(d)および(e)に示している。
【0041】図7(b)、(c)に示すように第1実施
例の処理では「東」ではなく「束」と認識されてしまう
可能性があったのが、図7(d)、(e)に示すように
本実施例の処理を行うことで正しい「東」により近い文
字画像を得ることができる。したがって、3本の文字線
が重なったり接触している文字に対しても、簡単な処理
で正しい文字により近い画像を得ることができ、誤った
文字に認識されることが低減される。
【0042】なお、本実施例の第1の画像変換手段の処
理においても、第1実施例と同様に入力文字画像の周辺
を背景と仮定して処理が行われるため、周辺に追加した
マスクが入力文字画像の外にかかるときには、後半の処
理が不要になるため、前半の処理だけで第1の整形画像
を作成することができる。
【0043】(第3実施例)次に本発明の第3実施例に
ついて説明する。本実施例においても第1の画像変換手
段のみが第1実施例と異なっており、その他の構成およ
び処理内容は第1実施例と同様であるので、その説明は
省略する。
【0044】本実施例の第1の画像変換手段は、太さの
異なる様々な筆記具で書かれた文字にも対応するため
に、文字線の太さを求めてしきい値を設定し、しきい値
より太い文字線に対応する画素は背景に変換する処理を
行っている。
【0045】図8は本発明の文字認識方式の第1の画像
変換手段の第3実施例の構成を示すブロック図である。
図8において、本実施例の第1の画像変換手段20は、
入力文字画像の各文字線の画素について最も近い背景の
画素までの距離を計算する距離計算部21と、距離計算
部21で計算した結果と予め定められた値から文字線画
素を背景に変換するためのしきい値を設定するしきい値
設定部22と、距離演算部21としきい値設定部22の
処理結果から第1の整形画像を出力する画像変換部23
とによって構成されている。
【0046】このような構成において、図9(a)の入
力文字画像の文字線(斜線内)の画素から最も近い背景
(斜線以外の部分)の画素までの距離を距離演算部21
で算出し、それぞれの値を各画素上に記載すると図9
(b)に示すような距離画像と呼ばれる画像を得ること
ができる。ここで背景に相当する画素の距離は常に0で
あり、距離の値は市街区距離計算を用いて算出している
ものとする。
【0047】なお、距離の算出方法には市街区距離だけ
でなく、ユークリッド距離やチェス盤距離であってもよ
い。
【0048】距離演算部21から出力された距離画像の
うち、距離が最小値の1となる画素の数は文字のエッジ
の長さを表わし、距離が0以外の画素の数は文字線の画
素の数を表わすことになる。したがって、距離が0以外
の画素の数を距離が1の画素の数で割るとその文字の平
均的な文字線幅の半分に近い値を得ることができる。し
きい値設定部22ではこのようにして得られた平均的な
文字線幅に、文字線の幅の変動を考慮して予め設定した
値を加え、推定最大線幅として設定する。
【0049】この推定最大線幅をしきい値として、距離
が推定最大線幅以上の画素を画像変換部23で背景の画
像に変換し、それ以外の部分(距離が0の画素は除く)
を文字線とすることにより第1の整形画像を作成する。
【0050】このような処理を行うことで、筆記具が特
定できない様々な太さの文字線を読み取る場合にも、2
本の文字線が重なったり接触している文字から正しい文
字に近い文字画像を得ることができ、誤った文字に認識
されることが低減される。
【0051】ところで、上記した推定最大線幅を下限の
しきい値として設定し、これに予め実験等によって得ら
れた値を加えて上限のしきい値として設定し、この2つ
のしきい値の間にある画素を背景に変換し、それ以外の
画素(距離が0の画素を除く)を文字線とすることで第
1の整形画像を作成してもよい。
【0052】このような処理を実行することで、2本の
文字線が重なったり接触している文字だけでなく、3本
の文字線が重なったり接触している文字にも対応するこ
とができる。
【0053】なお、上述した各実施例の第1の画像変換
手段の処理を行う前に、入力文字画像の外接文字枠サイ
ズ、あるいは重心位置からの一次モーメントや2次モー
メントが一様になるように文字の大きさを変換する正規
化手段を設けると、記入された文字の大きさにバラつき
がある場合、例えば郵便物の差出人と受取人の両方を読
み取るときなどや記入された文字の大きさの変化が大き
い文字に対しても、文字線の太さの変動を相対的に小さ
くすることができ、様々な筆記具により書かれた文字を
簡単な処理で確実に認識することができる。
【0054】また、第1の画像変換手段、第2の画像変
換手段、辞書部、および照合部は、中央演算処理装置
(CPU)およびメモリを組み合わせ、プログラムにし
たがった処理で実現することも可能であるが、高速化を
考慮した場合、専用のハードウェア(DSP等)を使用
してもよい。
【0055】
【発明の効果】本発明は以上説明したように構成されて
いるので、以下に記載する効果を奏する。
【0056】請求項1に記載のものにおいては、2本の
文字線が重なったり接触している場合に、第1の画像変
換手段によってそれらの文字線が分離されて正しい文字
に近い画像を得ることができ、誤った文字に認識される
ことが低減される。また第2の画像変換手段によって非
線形正規化による文字整形が行われるため、より精度よ
く文字を認識することができる。特に請求項2に記載の
ものにおいては、3本の文字線が重なったり接触してい
る文字に対しても同様の効果を得ることができる。
【0057】請求項3に記載のものにおいては、筆記具
が特定できない様々な太さの文字線を読み取る場合に
も、第1の画像変換手段によって2本の文字線が重なっ
たり接触している文字から正しい文字に近い文字画像を
得ることができ、誤った文字に認識されることが低減さ
れる。また第2の画像変換手段によって非線形正規化に
よる文字整形が行われるため、より精度よく文字を認識
することができる。特に請求項4に記載のものにおいて
は、3本の文字線が重なったり接触している文字に対し
ても同様の効果を得ることができる。
【0058】請求項5に記載のものにおいては、記入さ
れた文字の大きさにバラつきがある場合、例えば郵便物
の差出人と受取人の両方を読み取るときなどや記入され
た文字の大きさの変化が大きい文字に対しても、文字線
の太さの変動を相対的に小さくすることができ、様々な
筆記具により書かれた文字を簡単な処理で確実に認識す
ることができる。
【図面の簡単な説明】
【図1】本発明の文字認識方式の第1実施例の装置構成
を示すブロック図である。
【図2】図1に示した第1の画像変換手段の出力である
第1の整形画像から、第2の画像変換手段の出力である
第2の整形画像への変換過程を示す図である。
【図3】図1に示した第1の画像変換手段の出力である
第1の整形画像、および第2の画像変換手段の出力であ
る第2の整形画像の他の例を示した図である。
【図4】図1に示した第1の画像変換手段で使用するマ
スクの第1実施例の構成を示す図である。
【図5】本発明の文字認識方式の第1の画像変換手段で
使用するマスクの第2実施例の構成を示す図である。
【図6】本発明の文字認識方式の第1の画像変換手段の
第2実施例の処理手順を示すフローチャートである。
【図7】第1の整形画像、および第2の整形画像の例を
示す図である。
【図8】本発明の文字認識方式の第1の画像変換手段の
第3実施例の構成を示すブロック図である。
【図9】図8に示した第1の画像変換手段の処理結果の
例を示す図である。
【図10】従来の画像認識方式で文字を認識する場合の
認識例を示した図である。
【符号の説明】
1 入力部 2、20 第1の画像変換手段 3 第2の画像変換手段 4 辞書部 5 照合部 6 出力部 7、17 マスク 21 距離演算部 22 しきい値設定部 23 画像変換部

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字を画像として読み取り、前記文字の
    認識結果あるいは候補を出力する文字認識方式であっ
    て、 読み取った文字の画像を予め定められた大きさのマスク
    で走査し、前記マスク内の画素がすべて文字線となる場
    合に、前記マスクの中央に位置する画素を背景に置き換
    える第1の画像変換手段と、 前記第1の画像変換手段の出力画像から、背景の画素の
    並びの長さを垂直に交わる2方向についてそれぞれ測定
    し、測定した方向と垂直な方向に前記長さの逆数に比例
    する値をそれぞれ累積し、前記累積した値がそれぞれ均
    一になるようにする第2の画像変換手段と、 文字カテゴリ毎の特徴が蓄積された辞書部と、 前記第2の画像変換手段の出力画像から文字の特徴を抽
    出し、前記辞書部に蓄積された特徴と比較して類似して
    いる文字カテゴリを探しだし、前記読み取った文字の認
    識結果あるいは候補を出力する照合部と、 を有する文字認識方式。
  2. 【請求項2】 前記第1の画像変換手段は、 予め定められた大きさの第1のマスクと、前記第1のマ
    スクと相似形で前記第1のマスクの周辺に形成される第
    2のマスクとによって読み取った文字の画像を走査し、
    前記第1のマスク内の画素がすべて文字線であり、かつ
    前記第2のマスク内の画素に背景がある場合に、前記第
    1のマスクの中央に位置する画素を背景に置き換える
    求項1記載の文字認識方式。
  3. 【請求項3】 文字を画像として読み取り、前記文字の
    認識結果あるいは候補を出力する文字認識方式であっ
    て、 最も近い背景の画素までの距離を各文字線の画素につい
    てそれぞれ計算する距離演算部、前記距離演算部の演算
    結果から文字線の画素の数に対して前記距離が最小の画
    素の数の比率を求め該比率から文字線の画素を背景に置
    き換えるためのしきい値を算出するしきい値設定部、
    前記しきい値より長い距離の画素を背景に置き換える
    画像変換部を備えた第1の画像変換手段と、 前記第1の画像変換手段の出力画像から、背景の画素の
    並びの長さを垂直に交わる2方向についてそれぞれ測定
    し、測定した方向と垂直な方向に前記長さの逆数に比例
    する値をそれぞれ累積し、前記累積した値がそれぞれ均
    一になるようにする第2の画像変換手段と、 文字カテゴリ毎の特徴が蓄積された辞書部と、 前記第2の画像変換手段の出力画像から文字の特徴を抽
    出し、前記辞書部に蓄積された特徴と比較して類似して
    いる文字カテゴリを探しだし、前記読み取った文字の認
    識結果あるいは候補を出力する照合部と、 を有する文字認識方式。
  4. 【請求項4】 前記しきい値設定部は、前記 距離演算部の演算結果から、文字線の画素の数に対
    する前記距離が最小の画素の数の比率を求め、該比率か
    ら文字線の画素を背景に置き換えるための下限のしきい
    値と、前記下限のしきい値に予め定められた値を加算し
    た上限のしきい値とを算出し、前記 画像変換部は、 前記下限のしきい値と上限のしきい値と間の距離の画素
    を背景に置き換える請求項3記載の文字認識方式。
  5. 【請求項5】 読み取った文字を一様な大きさに変換す
    る正規化手段を有する請求項1乃至4のいずれか1項記
    載の文字認識方式。
JP7244129A 1995-09-22 1995-09-22 文字認識方式 Expired - Fee Related JP2973892B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7244129A JP2973892B2 (ja) 1995-09-22 1995-09-22 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7244129A JP2973892B2 (ja) 1995-09-22 1995-09-22 文字認識方式

Publications (2)

Publication Number Publication Date
JPH0991378A JPH0991378A (ja) 1997-04-04
JP2973892B2 true JP2973892B2 (ja) 1999-11-08

Family

ID=17114202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7244129A Expired - Fee Related JP2973892B2 (ja) 1995-09-22 1995-09-22 文字認識方式

Country Status (1)

Country Link
JP (1) JP2973892B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216470A (ja) 2000-01-31 2001-08-10 Keyence Corp パターンマッチング方法及び装置

Also Published As

Publication number Publication date
JPH0991378A (ja) 1997-04-04

Similar Documents

Publication Publication Date Title
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
JP3452774B2 (ja) 文字認識方法
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP2000278514A (ja) 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP4395188B2 (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP3006466B2 (ja) 文字入力装置
JP2973892B2 (ja) 文字認識方式
WO2006080568A1 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2000076378A (ja) 文字認識方法
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2885185B2 (ja) 文字認識装置
JP2708604B2 (ja) 文字認識方法
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2580976B2 (ja) 文字切出し装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2747136B2 (ja) 文字認識装置
JP3127413B2 (ja) 文字認識装置
JP2902905B2 (ja) 文字認識装置
JP3084833B2 (ja) 特徴抽出装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees