JPH05250518A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH05250518A JPH05250518A JP4051305A JP5130592A JPH05250518A JP H05250518 A JPH05250518 A JP H05250518A JP 4051305 A JP4051305 A JP 4051305A JP 5130592 A JP5130592 A JP 5130592A JP H05250518 A JPH05250518 A JP H05250518A
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature amount
- mesh
- matching
- division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】文字認識に用いる特徴量の求め方を工夫するこ
とで、特徴数を減らしても、高精度な認識が可能とし、
また、高速な認識を可能とすること。 【構成】上記目的を達成するため、特徴量として、10
1の文字パターンより、文字を構成するストロークの方
向性に着目した特徴(102、103)を画素ごとに求
める。この特徴に対して、文字パターンのストロークに
適応したメッシュ分割を行ない、マッチングのための特
徴量(104、105)を得る。この特徴に対して、特
徴量辞書(106、107)とのずらしマッチングを行
なうことで文字認識を行なう。 【効果】文字パターンごとに、そのストロークに適応し
たメッシュ分割を行なうことで、特徴数を減らすことが
できる。また、特徴数が減ることで、マッチングの処理
時間を減少することができる。
とで、特徴数を減らしても、高精度な認識が可能とし、
また、高速な認識を可能とすること。 【構成】上記目的を達成するため、特徴量として、10
1の文字パターンより、文字を構成するストロークの方
向性に着目した特徴(102、103)を画素ごとに求
める。この特徴に対して、文字パターンのストロークに
適応したメッシュ分割を行ない、マッチングのための特
徴量(104、105)を得る。この特徴に対して、特
徴量辞書(106、107)とのずらしマッチングを行
なうことで文字認識を行なう。 【効果】文字パターンごとに、そのストロークに適応し
たメッシュ分割を行なうことで、特徴数を減らすことが
できる。また、特徴数が減ることで、マッチングの処理
時間を減少することができる。
Description
【0001】
【産業上の利用分野】本発明は、画像で表現された文字
パターンを光学的に読み取り、各文字パターンを対応す
る文字コードに変換する文字認識技術に関し、特に印刷
文字を対象とし、1つの辞書で各種フォントの文字認識
を行うのに適した文字認識アルゴリズムに関する。
パターンを光学的に読み取り、各文字パターンを対応す
る文字コードに変換する文字認識技術に関し、特に印刷
文字を対象とし、1つの辞書で各種フォントの文字認識
を行うのに適した文字認識アルゴリズムに関する。
【0002】
【従来の技術】従来、文字認識技術の1例として、例え
ば、電子通信学会論文誌’79/11Vol.J62−
D No.11 「マルチフォント印刷漢字認識のため
の粗分類」(従来技術1)などで使われているメッシュ
分割方式によるものがある。これは、文字パターンを均
等な複数のメッシュ領域に分割し、その中の黒画素の割
合を特徴量とするものである。基本的には、特徴をぼか
すことによって位置ずれに対処したものであり、本発明
の如く、ずらしマッチングへの応用は考慮されていな
い。このため、詳細な認識には適さないという問題があ
る。
ば、電子通信学会論文誌’79/11Vol.J62−
D No.11 「マルチフォント印刷漢字認識のため
の粗分類」(従来技術1)などで使われているメッシュ
分割方式によるものがある。これは、文字パターンを均
等な複数のメッシュ領域に分割し、その中の黒画素の割
合を特徴量とするものである。基本的には、特徴をぼか
すことによって位置ずれに対処したものであり、本発明
の如く、ずらしマッチングへの応用は考慮されていな
い。このため、詳細な認識には適さないという問題があ
る。
【0003】従来の文字認識技術の他の例として、電子
通信学会論文誌’85/1 Vol.J68−D N
o.1 pp.56−63 「動的整合法による手書き
漢字認識」(従来技術2)がある。これは、文字パター
ンを取り出した後、一定サイズのパターンに正規化し、
正規化されたパターンについて、各画素ごとに縦、横、
斜めの方向性特徴を抽出し、各方向成分ごとに、別の文
字パターンとして求めた後、それぞれの画像について、
各画素ごとに一方向のみのずらしマッチングを行なうこ
とで、文字認識を実現するものである。本方式では、画
素の順序関係の整合性は、ずらす方向の1ライン中での
み行なわれ、他のラインとの整合性はとられていないと
いう問題がある。また、現パターンについて、正規化す
るために特徴数が増えてしまうという問題がある。
通信学会論文誌’85/1 Vol.J68−D N
o.1 pp.56−63 「動的整合法による手書き
漢字認識」(従来技術2)がある。これは、文字パター
ンを取り出した後、一定サイズのパターンに正規化し、
正規化されたパターンについて、各画素ごとに縦、横、
斜めの方向性特徴を抽出し、各方向成分ごとに、別の文
字パターンとして求めた後、それぞれの画像について、
各画素ごとに一方向のみのずらしマッチングを行なうこ
とで、文字認識を実現するものである。本方式では、画
素の順序関係の整合性は、ずらす方向の1ライン中での
み行なわれ、他のラインとの整合性はとられていないと
いう問題がある。また、現パターンについて、正規化す
るために特徴数が増えてしまうという問題がある。
【0004】その他、メッシュ分割を動的に行なう文字
認識技術として、電子通信学会論文誌’84/11 V
ol.J67−D No.11 pp.1379−13
83「線密度イコライゼーション−相関法のための非線
形正規化法」(ジュライ具術3)がある。これは、手書
き文字の変形を補正するために、パターン中の黒画素の
重心を基にして分割位置を変化させるものである。これ
は、全体パターンの歪を補正することができるが、ずら
しマッチングのための特徴量抽出には適さない。
認識技術として、電子通信学会論文誌’84/11 V
ol.J67−D No.11 pp.1379−13
83「線密度イコライゼーション−相関法のための非線
形正規化法」(ジュライ具術3)がある。これは、手書
き文字の変形を補正するために、パターン中の黒画素の
重心を基にして分割位置を変化させるものである。これ
は、全体パターンの歪を補正することができるが、ずら
しマッチングのための特徴量抽出には適さない。
【0005】
【発明が解決しようとする課題】従来技術1に示された
メッシュパターン特徴は、線幅の違いや線の位置ずれに
よって特徴量が大きく変動し、様々なフォントを1つの
辞書で認識するのには適さない。また、ぼかしによって
位置ずれに対処をしており、識別率が低いという問題が
ある。
メッシュパターン特徴は、線幅の違いや線の位置ずれに
よって特徴量が大きく変動し、様々なフォントを1つの
辞書で認識するのには適さない。また、ぼかしによって
位置ずれに対処をしており、識別率が低いという問題が
ある。
【0006】従来技術2では、漢字など複雑な文字の認
識を行なう場合、文字パターンの正規化の数を小さくす
ると、文字パターンそのものが元のパターンと異なった
ものになるため、得られたパターンの特徴からは十分な
認識が行なえないという問題がある。したがって、認識
率をあげるためには分解能を下げることができず、マッ
チングのための特徴数が多くなる。また、マッチングの
ずらし許容度も大きくしないと、文字パターンの変形に
十分対応できなくなってしまう。こうしたことから、上
記従来方式では、認識率を維持しながら、認識速度を上
げることは困難である。また、ずらしについても、縦方
向性特徴については、各行ごとに、そこに含まれる全て
の画素の特徴をずらす必要があり、処理に時間がかかる
という問題点がある。
識を行なう場合、文字パターンの正規化の数を小さくす
ると、文字パターンそのものが元のパターンと異なった
ものになるため、得られたパターンの特徴からは十分な
認識が行なえないという問題がある。したがって、認識
率をあげるためには分解能を下げることができず、マッ
チングのための特徴数が多くなる。また、マッチングの
ずらし許容度も大きくしないと、文字パターンの変形に
十分対応できなくなってしまう。こうしたことから、上
記従来方式では、認識率を維持しながら、認識速度を上
げることは困難である。また、ずらしについても、縦方
向性特徴については、各行ごとに、そこに含まれる全て
の画素の特徴をずらす必要があり、処理に時間がかかる
という問題点がある。
【0007】従来技術3のメッシュ分割方式は、パター
ンの変形を補正するためのものであり、特徴数を減らし
て認識速度の高速化を図るためのものではない。
ンの変形を補正するためのものであり、特徴数を減らし
て認識速度の高速化を図るためのものではない。
【0008】本発明の目的は、各種フォントの認識を1
つの辞書で高精度に行なえるようにした文字認識方法を
提供することにある。
つの辞書で高精度に行なえるようにした文字認識方法を
提供することにある。
【0009】本発明の他の目的は、特徴数を減らすこと
によって、高速に認識処理できる文字認識方法を提供す
ることにある。
によって、高速に認識処理できる文字認識方法を提供す
ることにある。
【0010】
【課題を解決するための手段】これらの目的を達成する
ために、本発明では、文字パターンを正規化する前に元
の文字パターンから特徴を抽出し、これを正規化する。
正規化は、文字パターンの持つ特徴をできるだけ失わな
い方式、例えばメッシュ分割方式を用いる。
ために、本発明では、文字パターンを正規化する前に元
の文字パターンから特徴を抽出し、これを正規化する。
正規化は、文字パターンの持つ特徴をできるだけ失わな
い方式、例えばメッシュ分割方式を用いる。
【0011】この場合、文字線のストローク方向に着目
した特徴量を抽出し、この特徴量が隣の画素と大きく異
なる位置を分割位置としてメッシュ分割する。特徴の変
化位置だけで分割すると正規化のための分割数が足りな
い場合は、全体のバランスを保った補間位置での分割を
行なう。
した特徴量を抽出し、この特徴量が隣の画素と大きく異
なる位置を分割位置としてメッシュ分割する。特徴の変
化位置だけで分割すると正規化のための分割数が足りな
い場合は、全体のバランスを保った補間位置での分割を
行なう。
【0012】本発明は、認識対象を印刷文字とし、縦方
向性の特徴については縦1ラインのメッシュごとに、横
方向性の特徴については横1ラインのメッシュごとにず
らした「ずらしマッチング方式」適用する。また、左右
分離、あるいは上下分離が生じた文字パターンについて
は、それぞれの部分について独立に特徴量を抽出して、
ずらしマッチングを行なう。
向性の特徴については縦1ラインのメッシュごとに、横
方向性の特徴については横1ラインのメッシュごとにず
らした「ずらしマッチング方式」適用する。また、左右
分離、あるいは上下分離が生じた文字パターンについて
は、それぞれの部分について独立に特徴量を抽出して、
ずらしマッチングを行なう。
【0013】
【作用】本発明の文字認識方法によれば、文字認識のた
めに抽出する特徴の数を減少した場合でも、従来技術と
同様の認識率を得ることができ、高速度の文字認識が可
能となる。
めに抽出する特徴の数を減少した場合でも、従来技術と
同様の認識率を得ることができ、高速度の文字認識が可
能となる。
【0014】
【実施例】先ず、図1を参照して、本発明による文字認
識方法の概要を説明する。
識方法の概要を説明する。
【0015】文字パターン101から、画素ごとの特徴
量(画素特徴量)を抽出する。画素特徴量は、その画素
が含まれるストロークの方向性に関する特徴量であり、
縦、横、左斜め、右斜めの4つの方向について求められ
る。これら4つの特徴量のうち、縦方向、横方向の特徴
(102、103)だけをマッチングのための特徴量と
して用いる。このままでは、文字サイズの正規化が為さ
れていないので、縦方向と横方向のそれぞれの特徴につ
いて、文字パターンを一定の分割数で碁盤目状に分割
(メッシュ分割)する。このメッシュ分割の際、特徴の
ぼけを防ぐために、特徴量の値の差が大きくなる位置を
メッシュ分割位置に設定する。また、元の文字パターン
のバランスが崩れないようにメッシュ分割位置を追加
し、得られた各メッシュ内の画素特徴量の平均値をマッ
チングのためのメッシュ特徴量とする(104、10
5)。次に、メッシュ特徴量を用いて対象の絞り込みを
行なった後、縦方向と横方向の各メッシュ特徴量を、特
徴量辞書(106、107)に用意してある縦方向性、
横方向性の特徴量とストローク単位のマッチングが行え
るように、図2に示すようなDP(動的計画法)による
ずらしマッチング(DPマッチング)を行なう。
量(画素特徴量)を抽出する。画素特徴量は、その画素
が含まれるストロークの方向性に関する特徴量であり、
縦、横、左斜め、右斜めの4つの方向について求められ
る。これら4つの特徴量のうち、縦方向、横方向の特徴
(102、103)だけをマッチングのための特徴量と
して用いる。このままでは、文字サイズの正規化が為さ
れていないので、縦方向と横方向のそれぞれの特徴につ
いて、文字パターンを一定の分割数で碁盤目状に分割
(メッシュ分割)する。このメッシュ分割の際、特徴の
ぼけを防ぐために、特徴量の値の差が大きくなる位置を
メッシュ分割位置に設定する。また、元の文字パターン
のバランスが崩れないようにメッシュ分割位置を追加
し、得られた各メッシュ内の画素特徴量の平均値をマッ
チングのためのメッシュ特徴量とする(104、10
5)。次に、メッシュ特徴量を用いて対象の絞り込みを
行なった後、縦方向と横方向の各メッシュ特徴量を、特
徴量辞書(106、107)に用意してある縦方向性、
横方向性の特徴量とストローク単位のマッチングが行え
るように、図2に示すようなDP(動的計画法)による
ずらしマッチング(DPマッチング)を行なう。
【0016】図3は、本実施例の文字認識装置の全体ブ
ロック図である。
ロック図である。
【0017】スキャナ301で入力された画像データ
は、スキャナコントローラ302を通して、メモリ30
5に格納される。本実施例では、スキャナからの読み込
みによって得られる画像は、一定の閾値によって決定さ
れる2値のパターンである。
は、スキャナコントローラ302を通して、メモリ30
5に格納される。本実施例では、スキャナからの読み込
みによって得られる画像は、一定の閾値によって決定さ
れる2値のパターンである。
【0018】ディスク303は、画像、パターンマッチ
ング用辞書、認識結果などを格納する。必要に応じて、
ディスクコントローラ304を介して、メモリ内容の格
納とメモリへの書き込みを行なう。認識処理はメモリ上
のデータを用いて行われる。メインメモリ305には、
認識時のワークデータや特徴量辞書が記憶される。
ング用辞書、認識結果などを格納する。必要に応じて、
ディスクコントローラ304を介して、メモリ内容の格
納とメモリへの書き込みを行なう。認識処理はメモリ上
のデータを用いて行われる。メインメモリ305には、
認識時のワークデータや特徴量辞書が記憶される。
【0019】CPU306では、システム全体のコント
ロールを行ない、キーボード310からの入力などによ
り、順次処理を進めていく。各認識処理もここで行なわ
れる。ディスプレイ/キーボードコントローラ307
は、CPUから送られた表示内容をメモリ308に格納
し、これをディスプレイ309に表示する。また、キー
ボード310からの入力をメモリ308に蓄え、CPU
からの読みだし要求に応ずる。311は、各装置間を接
続するためのバスである。
ロールを行ない、キーボード310からの入力などによ
り、順次処理を進めていく。各認識処理もここで行なわ
れる。ディスプレイ/キーボードコントローラ307
は、CPUから送られた表示内容をメモリ308に格納
し、これをディスプレイ309に表示する。また、キー
ボード310からの入力をメモリ308に蓄え、CPU
からの読みだし要求に応ずる。311は、各装置間を接
続するためのバスである。
【0020】図4に、文字認識処理の概略ブロック図を
示す。画像読みだし部401は、画データ402と、4
03に格納された書式解析結果の文字外接矩形とから、
1文字分ごとの画像データを読みだす。読みだした内容
は、画素特徴量格納メモリ404に格納する。画素特徴
量格納メモリは、a,b,c,dの4枚あり、それぞれ
に白画素が「0」、黒画素が「1」の値を持つ画像デー
タとして格納される。
示す。画像読みだし部401は、画データ402と、4
03に格納された書式解析結果の文字外接矩形とから、
1文字分ごとの画像データを読みだす。読みだした内容
は、画素特徴量格納メモリ404に格納する。画素特徴
量格納メモリは、a,b,c,dの4枚あり、それぞれ
に白画素が「0」、黒画素が「1」の値を持つ画像デー
タとして格納される。
【0021】画素特徴抽出部405では、404に格納
された文字パターンを基に、各画素ごとに、縦、横、左
斜め、右斜めの方向性特徴を4次元分抽出し、それぞ
れ、メモリ404の領域a,b,c,dに格納する。
された文字パターンを基に、各画素ごとに、縦、横、左
斜め、右斜めの方向性特徴を4次元分抽出し、それぞ
れ、メモリ404の領域a,b,c,dに格納する。
【0022】メッシュ分割部406では、404に格納
された画素特徴量を基に、同一メッシュ内には類似の特
徴を持つ画素ができるだけ入るように、所定数のメッシ
ュ分割位置を設定し、メッシュ分割位置格納メモリ40
7に格納する。
された画素特徴量を基に、同一メッシュ内には類似の特
徴を持つ画素ができるだけ入るように、所定数のメッシ
ュ分割位置を設定し、メッシュ分割位置格納メモリ40
7に格納する。
【0023】メッシュ特徴量抽出部408では、メモリ
407に格納されたメッシュ分割位置から得られる各メ
ッシュごとに、404に格納された画素特徴量中の画素
の持つ特徴の平均を求め、これを、メッシュの特徴量と
する。得られた特徴量は、メッシュ特徴量格納メモリ4
09に格納する。
407に格納されたメッシュ分割位置から得られる各メ
ッシュごとに、404に格納された画素特徴量中の画素
の持つ特徴の平均を求め、これを、メッシュの特徴量と
する。得られた特徴量は、メッシュ特徴量格納メモリ4
09に格納する。
【0024】パターンマッチング部410では、メモリ
409に格納された特徴量と、特徴量辞書格納メモリ4
11に格納された特徴量辞書とのパターンマッチングを
行なう。そして、辞書中の各文字とのマッチングの評価
値と、辞書中の各文字の識別番号を、評価値格納メモリ
412に格納する。
409に格納された特徴量と、特徴量辞書格納メモリ4
11に格納された特徴量辞書とのパターンマッチングを
行なう。そして、辞書中の各文字とのマッチングの評価
値と、辞書中の各文字の識別番号を、評価値格納メモリ
412に格納する。
【0025】ソート部413では、評価値格納メモリ4
12の内容を評価値を基に、評価の高い順になるように
ソートする。ここでは、評価値と一緒に文字の識別番号
もソートし、このソートで得られる順位が認識候補の順
位となる。
12の内容を評価値を基に、評価の高い順になるように
ソートする。ここでは、評価値と一緒に文字の識別番号
もソートし、このソートで得られる順位が認識候補の順
位となる。
【0026】図5に、本文字認識装置の処理の概略フロ
ーチャートを示す。
ーチャートを示す。
【0027】501:初期化。特徴量辞書の読みだし等
を行なう。
を行なう。
【0028】502:画像データの読みだし方法を決定
する。
する。
【0029】503:スキャナ起動。スキャナから読み
だす場合は、301のスキャナを起動し、画像データを
メモリに格納する。
だす場合は、301のスキャナを起動し、画像データを
メモリに格納する。
【0030】504:画像データ読みだし。ディスクに
格納された画像データを読みだす場合は、303のディ
スクからデータを読みだし、メモリに格納する。
格納された画像データを読みだす場合は、303のディ
スクからデータを読みだし、メモリに格納する。
【0031】505:連結成分抽出。画像データがメモ
リに格納されると、画像全体をスキャンし、上下左右斜
めの8方向のいずれかで連続している黒画素の塊(連結
成分)を抽出し、それに外接する矩形で取り出す。
リに格納されると、画像全体をスキャンし、上下左右斜
めの8方向のいずれかで連続している黒画素の塊(連結
成分)を抽出し、それに外接する矩形で取り出す。
【0032】506:書式解析。505で取り出した、
連結成分の並びをもとに、文字列抽出、領域抽出を行な
い、文字列、図、表などを判定する。
連結成分の並びをもとに、文字列抽出、領域抽出を行な
い、文字列、図、表などを判定する。
【0033】507:文字抽出。書式解析で、文字列と
判断された部分について、文字切り出しを行ない、各行
ごとに1文字づつの境界を設定し、文字の外接矩形を抽
出する。
判断された部分について、文字切り出しを行ない、各行
ごとに1文字づつの境界を設定し、文字の外接矩形を抽
出する。
【0034】508:文字認識。抽出された文字パター
ンを認識し、文字コードに変換する。
ンを認識し、文字コードに変換する。
【0035】文字認識の処理は、文字パターンからの特
徴抽出と抽出した特徴のパターンマッチングよりなる。
図6の文字認識処理全体のフローチャートにしたがっ
て、処理内容を詳しく述べる。
徴抽出と抽出した特徴のパターンマッチングよりなる。
図6の文字認識処理全体のフローチャートにしたがっ
て、処理内容を詳しく述べる。
【0036】601:認識対象となる文字数をMに設定
する。
する。
【0037】602:カウンタmを0クリアする。
【0038】603:認識対象文字を全て認識したか判
定する。m<M 604:文字矩形情報と画像データから、次に認識する
文字パターンを、1文字分読みだす。
定する。m<M 604:文字矩形情報と画像データから、次に認識する
文字パターンを、1文字分読みだす。
【0039】605:特徴抽出。読みだした文字パター
ンについて、パターンマッチングのための特徴量を求め
る。
ンについて、パターンマッチングのための特徴量を求め
る。
【0040】606:マッチング対象となる特徴量辞書
の文字数をNに設定する。
の文字数をNに設定する。
【0041】607:カウンタnを0クリアする。
【0042】608:特徴量辞書のN文字と比較が終わ
ったか、チェックする。
ったか、チェックする。
【0043】609:411の特徴量辞書格納メモリに
格納された標準特徴量を読みだす。
格納された標準特徴量を読みだす。
【0044】610:辞書に格納された各文字コードに
対応する標準特徴量と、605で画像からの文字パター
ンから求めた特徴量とのずらしマッチングを行ない、マ
ッチング距離値を求め、これを412のマッチング距離
格納メモリに格納する。
対応する標準特徴量と、605で画像からの文字パター
ンから求めた特徴量とのずらしマッチングを行ない、マ
ッチング距離値を求め、これを412のマッチング距離
格納メモリに格納する。
【0045】611:カウンタnのインクリメントを行
なう。
なう。
【0046】612:412に格納したマッチングの距
離値を基に、ソートを行なう。
離値を基に、ソートを行なう。
【0047】613:認識結果として、ソート結果の上
位10文字の文字コードと、マッチングの距離値を返
す。
位10文字の文字コードと、マッチングの距離値を返
す。
【0048】614:カウンタmのインクリメントを行
なう。
なう。
【0049】図7は、特徴抽出方式全体のフローチャー
トである。特徴量としては、文字パターンを構成するス
トロークの方向性に注目したものを用い、これを、画素
ごとに求めたあと、メッシュ分割して得る。
トである。特徴量としては、文字パターンを構成するス
トロークの方向性に注目したものを用い、これを、画素
ごとに求めたあと、メッシュ分割して得る。
【0050】701:文字パターン読み出しでは、ま
ず、画像データと文字矩形データとから、1文字分の文
字パターンを読みだし、404−a,b,c,dの4枚
の画素特徴量格納メモリに格納する。この際、各パター
ンの周囲には、一画素分の余白(白画素の特徴量:0)
を書き込む。図8は、各画素ごとに、黒の部分は1、白
の部分は0が格納されている状態。
ず、画像データと文字矩形データとから、1文字分の文
字パターンを読みだし、404−a,b,c,dの4枚
の画素特徴量格納メモリに格納する。この際、各パター
ンの周囲には、一画素分の余白(白画素の特徴量:0)
を書き込む。図8は、各画素ごとに、黒の部分は1、白
の部分は0が格納されている状態。
【0051】702:ラン長ラベル作成では、図9に示
したように、404−a,b,c,dの黒画素の位置に
は、それぞれ、その画素を含む、縦、横、左斜め、右斜
め、の各方向の連続した黒画素の数(以下これをラン長
とよぶ)を書き込む。白画素の位置には、すべて0を書
き込む。
したように、404−a,b,c,dの黒画素の位置に
は、それぞれ、その画素を含む、縦、横、左斜め、右斜
め、の各方向の連続した黒画素の数(以下これをラン長
とよぶ)を書き込む。白画素の位置には、すべて0を書
き込む。
【0052】703:画素特徴量抽出では、404−
a,b,c,dに格納された各方向のラン長の同一の位
置の値を取り出し、式1で正規化し、これを再び、40
4−a,b,c,dに書き込む。これにより、各方向の
画素特徴量は、0から128に正規化される。
a,b,c,dに格納された各方向のラン長の同一の位
置の値を取り出し、式1で正規化し、これを再び、40
4−a,b,c,dに書き込む。これにより、各方向の
画素特徴量は、0から128に正規化される。
【0053】
【数1】
【0054】図10のa,b,c,dは、図9のa,
b,c,dの同一の位置に格納されている値をH,V,
L,Rとした場合、これを数1で正規化した値(h,
v,l,r)を格納した状態を示す。例えば、図9の、
位置901、902、903、904の値は、それぞれ
正規化されて、図10の位置1001、1002、10
03、1004の値になる。
b,c,dの同一の位置に格納されている値をH,V,
L,Rとした場合、これを数1で正規化した値(h,
v,l,r)を格納した状態を示す。例えば、図9の、
位置901、902、903、904の値は、それぞれ
正規化されて、図10の位置1001、1002、10
03、1004の値になる。
【0055】704:メッシュ分割では、204−a,
204−bに格納した縦方向性、横方向性の画素特徴量
の値をもとに、特徴のぼけを防ぐように、メッシュ分割
を行なう。斜め方向性特徴については、本実施例ではマ
ッチングに用いない為、メッシュ分割しないが、特徴を
斜方軸変換することで、同様にメッシュ分割して特徴抽
出してもよい。
204−bに格納した縦方向性、横方向性の画素特徴量
の値をもとに、特徴のぼけを防ぐように、メッシュ分割
を行なう。斜め方向性特徴については、本実施例ではマ
ッチングに用いない為、メッシュ分割しないが、特徴を
斜方軸変換することで、同様にメッシュ分割して特徴抽
出してもよい。
【0056】705:メッシュ特徴量抽出では、704
で求めたメッシュ分割位置をもとに、404−a,40
2−bに格納された画素特徴量をメッシュ分割し、各メ
ッシュに含まれる画素特徴量の平均値を求め、これを各
メッシュのメッシュ特徴量とし、マッチングに用いる特
徴量とする。
で求めたメッシュ分割位置をもとに、404−a,40
2−bに格納された画素特徴量をメッシュ分割し、各メ
ッシュに含まれる画素特徴量の平均値を求め、これを各
メッシュのメッシュ特徴量とし、マッチングに用いる特
徴量とする。
【0057】メッシュ分割では、1つのメッシュ内にで
きるだけ多くの特徴が入るように、メッシュ分割位置を
設定する。このために、隣合う画素の特徴量の差分を求
め、これが最も大きくなるような位置で分割を行なう。
きるだけ多くの特徴が入るように、メッシュ分割位置を
設定する。このために、隣合う画素の特徴量の差分を求
め、これが最も大きくなるような位置で分割を行なう。
【0058】以下、図11のフローチャートに従って、
本文字認識方式におけるメッシュ分割方式について詳し
く述べる。図12から図18は、メッシュ分割の際、4
07に格納されるメッシュ分割位置を求めるための作業
テーブルの内容を示したものである。
本文字認識方式におけるメッシュ分割方式について詳し
く述べる。図12から図18は、メッシュ分割の際、4
07に格納されるメッシュ分割位置を求めるための作業
テーブルの内容を示したものである。
【0059】1101:差分投影値抽出では、隣合う画
素の画素特徴量の差分値を求め、これを1方向に投影し
た値を求める。縦方向性画素特徴量については、横に隣
りあう画素の特徴量の差分値を縦方向に投影する。横方
向性画素特徴量については、縦に隣りあう画素の特徴量
の差分値を横方向に投影する。この際、縦方向性画素特
徴量については、左右に並んだ特徴量が、”左側の値<
右側の値”の場合と、”左側の値>右側の値”の場合に
分けて、投影する。同様に、横方向性画素特徴量につい
ても、上下に並んだ特徴量が、”上側の値<下側の値”
の場合と、”上側の値>下側の値”の場合に分けて、投
影する。図12に、図10−aに示した特徴量の、左右
に隣合った画素の値の差分値の縦方向への投影の様子を
示す。1201が、”左側の値<右側の値”の投影値、
1202が、”左側の値>右側の値”の投影値。
素の画素特徴量の差分値を求め、これを1方向に投影し
た値を求める。縦方向性画素特徴量については、横に隣
りあう画素の特徴量の差分値を縦方向に投影する。横方
向性画素特徴量については、縦に隣りあう画素の特徴量
の差分値を横方向に投影する。この際、縦方向性画素特
徴量については、左右に並んだ特徴量が、”左側の値<
右側の値”の場合と、”左側の値>右側の値”の場合に
分けて、投影する。同様に、横方向性画素特徴量につい
ても、上下に並んだ特徴量が、”上側の値<下側の値”
の場合と、”上側の値>下側の値”の場合に分けて、投
影する。図12に、図10−aに示した特徴量の、左右
に隣合った画素の値の差分値の縦方向への投影の様子を
示す。1201が、”左側の値<右側の値”の投影値、
1202が、”左側の値>右側の値”の投影値。
【0060】1102:差分投影値の極大点取り出しで
は、1101で得た、差分投影値を画素境界の並びの方
向の関数として、極大になる位置を取り出す。図13
に、図12に示した投影値が、並びの位置の関数とし
て、極大となるような画素境界線の位置を”1”で示
す。
は、1101で得た、差分投影値を画素境界の並びの方
向の関数として、極大になる位置を取り出す。図13
に、図12に示した投影値が、並びの位置の関数とし
て、極大となるような画素境界線の位置を”1”で示
す。
【0061】1103:極大点ソートでは、1102で
得た極大点の、差分投影値が降順になるようにソートす
る。図14に、図13で極大になる位置を、その位置
の、差分の投影値(図12)の大きさの降順でソートし
た結果を示す。このように、極大点のみを、メッシュ分
割位置とするのは、スキャナで文字パターンを読み込ん
だ際の線境界のがたつきや、ストロークの傾きにより、
投影値が大きい位置が連続した場合に、どこで、分割す
るかを決定するためである。
得た極大点の、差分投影値が降順になるようにソートす
る。図14に、図13で極大になる位置を、その位置
の、差分の投影値(図12)の大きさの降順でソートし
た結果を示す。このように、極大点のみを、メッシュ分
割位置とするのは、スキャナで文字パターンを読み込ん
だ際の線境界のがたつきや、ストロークの傾きにより、
投影値が大きい位置が連続した場合に、どこで、分割す
るかを決定するためである。
【0062】1104:極大点による分割位置設定で
は、1103でソートして得られた順序で画素境界を取
り出して、メッシュ分割位置を設定する。図15に、図
14の差分投影値の大きな方から、分割位置として設定
した状態を示す。
は、1103でソートして得られた順序で画素境界を取
り出して、メッシュ分割位置を設定する。図15に、図
14の差分投影値の大きな方から、分割位置として設定
した状態を示す。
【0063】この例では、図12の1201、1202
に示した投影値が、大きな位置から選択している。
に示した投影値が、大きな位置から選択している。
【0064】分割位置を設定する、別の方法としては、
図12の1201と1202のそれぞれから、交互に分
割位置を取り出す方法がある。これは、次のようなもの
である。
図12の1201と1202のそれぞれから、交互に分
割位置を取り出す方法がある。これは、次のようなもの
である。
【0065】文字パターンの1本のストロークに注目し
た場合、その両側に白画素との境界線が現れることか
ら、たとえば、1201の投影値で設定された分割位置
と、ストロークをはさんで、反対側の分割位置が、12
02に存在するはずである。したがって、分割位置が1
つ得られた場合、その分割位置が、”左の値<右の値”
の投影値(1201)から得られた分割位置であれば、
1201で見つかった分割位置の右側の、ストローク幅
として許容される範囲の、”左の値>右の値”の投影値
(1202)の中から、この範囲の中で極大点を見つ
け、これを分割位置とする。同様に、”左の値>右の
値”の投影値(1202)の中から見つかれば、見つか
った位置の左側の、ストローク幅として許容される範囲
の、”左の値<右の値”の投影値(1201)の中か
ら、極大点を見つけ、これを分割位置とする。いずれの
場合も対応する分割位置が見つからなければ、特に対応
する分割は行なわない。このような分割を行なうこと
で、確実にストロークを抽出するような、分割を行なう
ことができる。
た場合、その両側に白画素との境界線が現れることか
ら、たとえば、1201の投影値で設定された分割位置
と、ストロークをはさんで、反対側の分割位置が、12
02に存在するはずである。したがって、分割位置が1
つ得られた場合、その分割位置が、”左の値<右の値”
の投影値(1201)から得られた分割位置であれば、
1201で見つかった分割位置の右側の、ストローク幅
として許容される範囲の、”左の値>右の値”の投影値
(1202)の中から、この範囲の中で極大点を見つ
け、これを分割位置とする。同様に、”左の値>右の
値”の投影値(1202)の中から見つかれば、見つか
った位置の左側の、ストローク幅として許容される範囲
の、”左の値<右の値”の投影値(1201)の中か
ら、極大点を見つけ、これを分割位置とする。いずれの
場合も対応する分割位置が見つからなければ、特に対応
する分割は行なわない。このような分割を行なうこと
で、確実にストロークを抽出するような、分割を行なう
ことができる。
【0066】1105:分割位置のソートでは、110
4で得た分割位置を、位置の順に並ぶように並びかえ
る。図16に、図15の分割位置をソートした状態を示
す。
4で得た分割位置を、位置の順に並ぶように並びかえ
る。図16に、図15の分割位置をソートした状態を示
す。
【0067】1106:補間分割では、1104で、分
割数が足りない場合、1105で設定した分割位置の間
を、全体で一定の分割数になるよう、さらに分割する。
割数が足りない場合、1105で設定した分割位置の間
を、全体で一定の分割数になるよう、さらに分割する。
【0068】補間分割の詳しい内容を以下に述べる。
【0069】図17(a),(b)に、図15で設定さ
れた分割位置と、一定数で均等分割した場合の位置で最
も近いものとを対応づけた様子を示す。
れた分割位置と、一定数で均等分割した場合の位置で最
も近いものとを対応づけた様子を示す。
【0070】図17(a)の場合は、1対1に対応して
いるが、図17(b)は、1対2に対応する位置があ
る。
いるが、図17(b)は、1対2に対応する位置があ
る。
【0071】図17(c)に、図17(b)のように、
1対2(あるいはそれ以上)に対応する位置がある場合
に、全体として最もずれが少なくなるように、1対1に
対応づけた状態を示す。
1対2(あるいはそれ以上)に対応する位置がある場合
に、全体として最もずれが少なくなるように、1対1に
対応づけた状態を示す。
【0072】このように、単純に、最も近い位置との対
応をとるだけでは、だめな場合があり、全体としてのず
れが、最小になるような対応を見つけるのが本方式であ
る。
応をとるだけでは、だめな場合があり、全体としてのず
れが、最小になるような対応を見つけるのが本方式であ
る。
【0073】図18は、図17(c)のマッピングの結
果をもとに、分割数を一定にするために加える分割位置
を示したもの。このように、ストロークに適応した分割
位置と均等分割の分割位置と対応づけることで、元の文
字パターンからの変形をできるだけ防ぐようにメッシュ
分割位置を決定する。
果をもとに、分割数を一定にするために加える分割位置
を示したもの。このように、ストロークに適応した分割
位置と均等分割の分割位置と対応づけることで、元の文
字パターンからの変形をできるだけ防ぐようにメッシュ
分割位置を決定する。
【0074】図19と図20に、全体としてのずれが最
小になるような対応を求めるために用いるテーブルを示
す。
小になるような対応を求めるために用いるテーブルを示
す。
【0075】図19の位置ずれ量では、図15で取り出
した分割位置と、メッシュ分割数で均等分割した場合の
分割位置との差分値(差の絶対値)を求め、ここに示し
たマトリクス上に格納する。たとえば、1901に示し
た、”1”という値は、1902の”11”という値
と、1903の”12”という値の差分値である。
した分割位置と、メッシュ分割数で均等分割した場合の
分割位置との差分値(差の絶対値)を求め、ここに示し
たマトリクス上に格納する。たとえば、1901に示し
た、”1”という値は、1902の”11”という値
と、1903の”12”という値の差分値である。
【0076】この際、両端は固定であることと、順序関
係は一定であることと、1対1の対応しか許されないこ
とから、図中の斜線で示した位置が示す対応は許されな
い。
係は一定であることと、1対1の対応しか許されないこ
とから、図中の斜線で示した位置が示す対応は許されな
い。
【0077】図20に示した、DPによる均等分割位置
との対応づけでは、図19の表の左側の列から順に、D
Pを用いて、最もずれの小さくなる対応を見つける。
との対応づけでは、図19の表の左側の列から順に、D
Pを用いて、最もずれの小さくなる対応を見つける。
【0078】この対応を見つける際、次の条件を満たさ
なければならない。
なければならない。
【0079】(a)対応は1対1。 (b)順序関係は変わらない。
【0080】図19のマトリクスの左下を、原点(0,
0)として、横方向の位置をx,縦方向の位置をyとす
る。(x,y)の位置の値は、それぞれの分割位置、f
(x)と、g(y)の差となる。したがって、(x,
y)の位置の値を、C(x,y)とすると、C(x,
y)の値は、数2で表わされる値となる。
0)として、横方向の位置をx,縦方向の位置をyとす
る。(x,y)の位置の値は、それぞれの分割位置、f
(x)と、g(y)の差となる。したがって、(x,
y)の位置の値を、C(x,y)とすると、C(x,
y)の値は、数2で表わされる値となる。
【0081】
【数2】
【0082】このC(x,y)は、ずれの大きさをあら
わすので、全体として最もずれを小さくするためには、
トータルでC(x,y)の累積値が最も小さくなるよう
な対応を、全てのxについて、上記条件を満たしながら
決めなければならない。
わすので、全体として最もずれを小さくするためには、
トータルでC(x,y)の累積値が最も小さくなるよう
な対応を、全てのxについて、上記条件を満たしながら
決めなければならない。
【0083】T(x,y)は、(x,y)の位置までの
ずれの累積値を示す。マトリクスのxの値を0≦x≦
m、yの値を0≦y≦nとする。T(x,y)を求める
ための漸化式を数3に示す。
ずれの累積値を示す。マトリクスのxの値を0≦x≦
m、yの値を0≦y≦nとする。T(x,y)を求める
ための漸化式を数3に示す。
【0084】
【数3】
【0085】図20は、上記漸化式のT(m,n)を、
DPにより解いた結果の対応づけを示す。表中の値は、
左から順に、上記条件を満たしながらその位置までのず
れの累積値の最小値を示す。〇印は、全体として最もず
れが小さくなるような対応を示す。また、各値から左下
に伸びている線は、1つ左の列中で上記条件を満たし、
最も小さい累積値を指している。つまり、数3のx≧2
の場合のminで選ばれた位置を示す。このように、図
19から、図20を作成し、これにより累積のずれが最
小になる様な対応づけを設定する。
DPにより解いた結果の対応づけを示す。表中の値は、
左から順に、上記条件を満たしながらその位置までのず
れの累積値の最小値を示す。〇印は、全体として最もず
れが小さくなるような対応を示す。また、各値から左下
に伸びている線は、1つ左の列中で上記条件を満たし、
最も小さい累積値を指している。つまり、数3のx≧2
の場合のminで選ばれた位置を示す。このように、図
19から、図20を作成し、これにより累積のずれが最
小になる様な対応づけを設定する。
【0086】図21は、図20から得た、各分割位置と
均等分割位置との対応関係を示す。
均等分割位置との対応関係を示す。
【0087】図22と図23に、対応位置をずらして、
全体として、最もずれを小さくするための均等分割位置
との対応設定方式の処理フローチャートを示す。両端は
固定であり、1≦x≦m−1の範囲の対応を求める。
全体として、最もずれを小さくするための均等分割位置
との対応設定方式の処理フローチャートを示す。両端は
固定であり、1≦x≦m−1の範囲の対応を求める。
【0088】2201:ずれの大きさを図19のマトリ
クスに書き込むためのループのカウンタxの初期値(x
=1)を設定する。
クスに書き込むためのループのカウンタxの初期値(x
=1)を設定する。
【0089】2202:x≦m−1を満たすかどうか、
xの値のチェックを行う。
xの値のチェックを行う。
【0090】2203:カウンタyの初期値(y=x)
を設定する。
を設定する。
【0091】2204:y≦x+n−mを満たすかどう
か、yの値のチェックする。
か、yの値のチェックする。
【0092】2205:ずれの大きさを計算。C(x,
y)=|f(x)−g(y)| 2206:yをインクリメント。y=y+1; 2207:xをインクリメント。x=x+1; 2208:トータルのずれ量の計算のための初期値設
定。
y)=|f(x)−g(y)| 2206:yをインクリメント。y=y+1; 2207:xをインクリメント。x=x+1; 2208:トータルのずれ量の計算のための初期値設
定。
【0093】 T(1,y)=C(1,y)(1≦y≦1+n−m) 2209:トータルのずれ量を計算するための、ループ
のカウンタxの初期値を設定する。x=2; 2210:xの値のチェックを行なう。x≦m−1; 2211:カウンタyの初期値を設定する。y=x; 2212:yの値のチェックを行なう。y≦x+n−
m; 2213:x−1≦z≦y−1の範囲のzのうちで、T
(x−1,z)が最小となるzをZとする。
のカウンタxの初期値を設定する。x=2; 2210:xの値のチェックを行なう。x≦m−1; 2211:カウンタyの初期値を設定する。y=x; 2212:yの値のチェックを行なう。y≦x+n−
m; 2213:x−1≦z≦y−1の範囲のzのうちで、T
(x−1,z)が最小となるzをZとする。
【0094】2214:F(x,y)に、Zを書き込
む。
む。
【0095】 T(x,y)=T(x−1,Z)+C(x,y)。
【0096】2215:yをインクリメント。y=y+
1; 2216:xをインクリメント。x=x+1; 2217:カウンタxに、初期値代入。x=m−1; 2218:m−1≦z≦n−1の範囲のzのうちで、T
(m−1,z)が最小になるzをZとする。
1; 2216:xをインクリメント。x=x+1; 2217:カウンタxに、初期値代入。x=m−1; 2218:m−1≦z≦n−1の範囲のzのうちで、T
(m−1,z)が最小になるzをZとする。
【0097】2219:均等分割との対応テーブルM
(m−1)に、Zを格納。
(m−1)に、Zを格納。
【0098】M(m−1)=Z; 2220:zに初期値Zを代入する。
【0099】2221:xの値のチェックを行なう。x
>1; 2222:F(x,y)の値を見て、1つ左の分割位置
について、均等分割位置との対応を求める。z=F
(x,z); 2223:xをデクリメント。x=x−1; 2224:均等分割との対応テーブルM(x)に、zを
格納。M(x)=z;以上により、すべての、極大点に
よる分割位置の、均等分割位置との対応関係が得られ
る。
>1; 2222:F(x,y)の値を見て、1つ左の分割位置
について、均等分割位置との対応を求める。z=F
(x,z); 2223:xをデクリメント。x=x−1; 2224:均等分割との対応テーブルM(x)に、zを
格納。M(x)=z;以上により、すべての、極大点に
よる分割位置の、均等分割位置との対応関係が得られ
る。
【0100】このようにして得られた特徴量をもとに、
パターンマッチングを行なうが、認識対象が印刷文字で
ある場合、文字を構成するストロークの方向にそれほど
変動は無い。従って、ずらしを、ライン単位に行なうこ
とで、ずらしマッチングによるコストの増大を押さえて
いる。
パターンマッチングを行なうが、認識対象が印刷文字で
ある場合、文字を構成するストロークの方向にそれほど
変動は無い。従って、ずらしを、ライン単位に行なうこ
とで、ずらしマッチングによるコストの増大を押さえて
いる。
【0101】文字パターン全体のマッチングを行なうた
めには、端のライン上の特徴量は、必ずマッチング対象
の同一の位置の特徴とマッチングしなければならない、
という制約が生じる。しかし、図24に示したように、
元の文字パターンによっては、ストロークが端のライン
に現れる場合と、現れない場合がある。2301の文字
パターンからは、一番上のラインにストロークが現われ
る2302の特徴が得られるが、2303の文字パター
ンからは、一番上のラインにストロークが現われない、
2304の特徴が得られる。このため、正しくマッチン
グできない場合がある。
めには、端のライン上の特徴量は、必ずマッチング対象
の同一の位置の特徴とマッチングしなければならない、
という制約が生じる。しかし、図24に示したように、
元の文字パターンによっては、ストロークが端のライン
に現れる場合と、現れない場合がある。2301の文字
パターンからは、一番上のラインにストロークが現われ
る2302の特徴が得られるが、2303の文字パター
ンからは、一番上のラインにストロークが現われない、
2304の特徴が得られる。このため、正しくマッチン
グできない場合がある。
【0102】このような問題を解決するため、図25に
示したように、特徴量の端のラインの外側に、1ライン
分、特徴量0のラインが存在すると仮定して、マッチン
グを行なう。これにより、上記の制約を満たしながら、
正しいマッチングが可能となる。
示したように、特徴量の端のラインの外側に、1ライン
分、特徴量0のラインが存在すると仮定して、マッチン
グを行なう。これにより、上記の制約を満たしながら、
正しいマッチングが可能となる。
【0103】本実施例では、DPマッチングによるずら
しマッチングを行なっている。文字パターンのマッチン
グの特性から、 (a)左右の順序関係は、入れ替わってはならない。 (b)文字の線幅が異なる場合があるので、マッチング
は1対多も認める。 (c)マッチング漏れの文字線がないように、すべての
特徴量を対応させなければならない。 という、3つの条件を満たしながらの、マッチングにな
る。
しマッチングを行なっている。文字パターンのマッチン
グの特性から、 (a)左右の順序関係は、入れ替わってはならない。 (b)文字の線幅が異なる場合があるので、マッチング
は1対多も認める。 (c)マッチング漏れの文字線がないように、すべての
特徴量を対応させなければならない。 という、3つの条件を満たしながらの、マッチングにな
る。
【0104】図2は、DPマッチングの原理を示す。各
点が、それぞれのラインの対応で生じる特徴量の差によ
り得られるマッチングのコスト値になっている。図の左
下と右上をつなぐ経路の通る各点のコストの合計値が、
最小となるような経路を求め、このコスト値をパターン
マッチングのマッチングコストとする。
点が、それぞれのラインの対応で生じる特徴量の差によ
り得られるマッチングのコスト値になっている。図の左
下と右上をつなぐ経路の通る各点のコストの合計値が、
最小となるような経路を求め、このコスト値をパターン
マッチングのマッチングコストとする。
【0105】上記の条件(a),(b),(c)を満た
すために、経路は、図に示した上、右、右上しか許され
ない。
すために、経路は、図に示した上、右、右上しか許され
ない。
【0106】図26は、文字の2次元的なストロークの
位置ずれを、1方向のみのずらしで吸収する原理を示し
たもの。このように、方向成分を抽出した上で、各々で
は、一方向のみにずらしを行なうことで、2次元方向の
ずらしを行なうことによる、処理時間の2次元的な増大
を押さえ、ずらしの許容度を広げることを可能としてい
る。
位置ずれを、1方向のみのずらしで吸収する原理を示し
たもの。このように、方向成分を抽出した上で、各々で
は、一方向のみにずらしを行なうことで、2次元方向の
ずらしを行なうことによる、処理時間の2次元的な増大
を押さえ、ずらしの許容度を広げることを可能としてい
る。
【0107】図27は、マッチング方式のフローチャー
ト。ここでは、M×Nにメッシュ分割して得られた特徴
を、縦方向の1ライン分のメッシュ単位に、横方向のみ
にPメッシュ分まで許容して、ずらす場合を示す。この
場合、Mは、ずらし方向のライン数。Nは、1ライン中
の特徴数となる。先に示したように、マッチングの際
に、両端に特徴量0のメッシュのラインをつけるので、
実際にマッチングの対象となるライン数は、M+2とな
る。以下の説明ではMが16の場合を示す。
ト。ここでは、M×Nにメッシュ分割して得られた特徴
を、縦方向の1ライン分のメッシュ単位に、横方向のみ
にPメッシュ分まで許容して、ずらす場合を示す。この
場合、Mは、ずらし方向のライン数。Nは、1ライン中
の特徴数となる。先に示したように、マッチングの際
に、両端に特徴量0のメッシュのラインをつけるので、
実際にマッチングの対象となるライン数は、M+2とな
る。以下の説明ではMが16の場合を示す。
【0108】2601:コスト値計算を行なう。
【0109】C(x,y)に、認識対象側xラインと,
辞書側yラインの対応を行なったときのマッチングコス
トを入れる。
辞書側yラインの対応を行なったときのマッチングコス
トを入れる。
【0110】各点のマッチングのコスト値は、次のよう
に求められる。
に求められる。
【0111】例えば、図2の、201の位置に示された
コスト値は、x側が6で、y側が7なので、202のパ
ターンの6番のラインの特徴量の上から順に、取り出
す。これと、203のパターンの7番のラインの左から
順に取り出した特徴量と差分の絶対値の合計値を求め、
これをC(6,7)の値とする。
コスト値は、x側が6で、y側が7なので、202のパ
ターンの6番のラインの特徴量の上から順に、取り出
す。これと、203のパターンの7番のラインの左から
順に取り出した特徴量と差分の絶対値の合計値を求め、
これをC(6,7)の値とする。
【0112】したがって、x軸側の文字パターンの2次
元で表される特徴量を、 A(x,i)(0≦i≦N−1) y軸側の文字パターンの2次元で表される特徴量を、 B(y,j)(0≦j≦N−1)(図2では、x,yが
入れ替わっている) とすると、C(x,y)は、次の式で得られる。
元で表される特徴量を、 A(x,i)(0≦i≦N−1) y軸側の文字パターンの2次元で表される特徴量を、 B(y,j)(0≦j≦N−1)(図2では、x,yが
入れ替わっている) とすると、C(x,y)は、次の式で得られる。
【0113】
【数4】
【0114】2602:DPマッチングの初期値設定。
【0115】
【数5】
【0116】2603:ループカウンタxの初期化 x=0 2604:DPマッチングの値の更新(2<=x<=1
5)
5)
【0117】
【数6】
【0118】2605:カウンタインクリメント x=x+1 2606:ループチェック x<=17 2607:マッチング結果(最小値M)計算
【0119】
【数7】
【0120】以上の、特徴抽出、マッチングにより得ら
れたコスト値をソートして、文字認識結果とする。
れたコスト値をソートして、文字認識結果とする。
【0121】ところで、漢字には、偏と作り、あるい
は、冠と足からできているものが存在する。偏と作りか
らできている文字の横方向のストロークの位置関係は、
偏と作りで必ずしも一定とは限らない。同様に、冠と足
からできている文字の、縦方向のストロークの位置関係
も、一定とは限らない。このため、文字パターンを半
分、あるいは、4つに分割して、それぞれのパターンに
ついて、上記方式によるメッシュ分割を行ない、特徴量
を抽出することで、このような、ずれに対処することが
できる。横方向性特徴を文字パターンから、求めたあ
と、これを、左右に2分割してメッシュ分割、マッチン
グする処理内容を、図28に示す。
は、冠と足からできているものが存在する。偏と作りか
らできている文字の横方向のストロークの位置関係は、
偏と作りで必ずしも一定とは限らない。同様に、冠と足
からできている文字の、縦方向のストロークの位置関係
も、一定とは限らない。このため、文字パターンを半
分、あるいは、4つに分割して、それぞれのパターンに
ついて、上記方式によるメッシュ分割を行ない、特徴量
を抽出することで、このような、ずれに対処することが
できる。横方向性特徴を文字パターンから、求めたあ
と、これを、左右に2分割してメッシュ分割、マッチン
グする処理内容を、図28に示す。
【0122】2701:方向性特徴抽出で、縦方向の特
徴抽出を行なう。
徴抽出を行なう。
【0123】2702:方向性特徴を抽出した文字パタ
ーンのデータを左右に2分割する。
ーンのデータを左右に2分割する。
【0124】2703:分割したそれぞれについて、分
割しない場合と同様な、メッシュ分割を行なう。
割しない場合と同様な、メッシュ分割を行なう。
【0125】2704:分割したそれぞれについて、ず
らしマッチングを行ない、それぞれのコストの合計値に
よって認識結果とする。
らしマッチングを行ない、それぞれのコストの合計値に
よって認識結果とする。
【0126】
【発明の効果】本発明の認識方法によれば、パターンマ
ッチングの特徴数を正規化するためのメッシュ分割を行
なうとき、分割による特徴量のぼけを防ぎ、ずらしマッ
チングに適した特徴量を得ることができる。また、ずら
しマッチングにより文字の2次元的なずれを吸収しなが
ら、ずらし量の許容度の増加による処理時間の増大を1
次元的な増加に押さえることができる。
ッチングの特徴数を正規化するためのメッシュ分割を行
なうとき、分割による特徴量のぼけを防ぎ、ずらしマッ
チングに適した特徴量を得ることができる。また、ずら
しマッチングにより文字の2次元的なずれを吸収しなが
ら、ずらし量の許容度の増加による処理時間の増大を1
次元的な増加に押さえることができる。
【図1】本発明の文字認識方法の概略説明図。
【図2】DPマッチングの原理説明図。
【図3】実施例の文字認識装置のシステム構成ブロック
図。
図。
【図4】文字認識の処理内容のブロック図。
【図5】実施例の文字認識装置の処理フローチャート。
【図6】文字認識処理のフローチャート。
【図7】特徴抽出処理のフローチャート。
【図8】文字パターンの特徴抽出用メモリへの格納状態
を示す図。
を示す図。
【図9】文字データの各方向のラン長格納状態を示す
図。
図。
【図10】文字データの各画素の画素方向性特徴量格納
状態を示す図。
状態を示す図。
【図11】メッシュ分割方式フローチャート。
【図12】画素特徴量の差分値の格納状態を示す図。
【図13】画素特徴量の差分値の極大点の抽出結果を示
図。
図。
【図14】画素特徴量の差分値の極大値のソート結果を
示す図。
示す図。
【図15】画素特徴量の差分値の極大点による、メッシ
ュ分割候補位置の設定を示す図。
ュ分割候補位置の設定を示す図。
【図16】極大点によるメッシュ分割位置のソート結果
を示す図。
を示す図。
【図17】極大点によるメッシュ分割位置と均等分割位
置の対応付けの例を示す図。
置の対応付けの例を示す図。
【図18】補間分割位置の設定状態を示す図。
【図19】分割位置の対応のずれ量を示すマトリクス
図。
図。
【図20】DPによる分割位置のずれ量を最小にする対
応付けを示す図。
応付けを示す図。
【図21】DPにより設定されたずれ量を最小にする対
応付けを示す図。
応付けを示す図。
【図22】極大点と均等分割位置の対応を求めるための
処理のフローチャート(その1)。
処理のフローチャート(その1)。
【図23】極大点と均等分割位置の対応を求めるための
処理のフローチャート。(その2)
処理のフローチャート。(その2)
【図24】文字パターンの変動による端のラインのメッ
シュの特徴の変化を示す図。
シュの特徴の変化を示す図。
【図25】文字パターンの端の変動を吸収するための値
0の特徴量ラインの追加を示す図。
0の特徴量ラインの追加を示す図。
【図26】擬似的2次元DPマッチングの原理を示す
図。
図。
【図27】DPマッチング方式のフローチャート。
【図28】2分割マッチングの処理内容のフローチャー
ト。
ト。
301…スキャナ、302…スキャナコントローラ、3
03…ディスク、304…ディスクコントローラ、30
5…メインメモリ、306…CPU、307…ディスプ
レイ/キーボードコントローラ、308…メモリ(ビデ
オメモリ)、309…ディスプレイ、310…キーボー
ド、311…システムバス、401…画像読み出し部、
402…画像データ格納メモリ、403…書式解析結果
格納メモリ、404…画素特徴量格納メモリ、405…
画素特徴抽出部、406…メッシュ分割部、407…メ
ッシュ分割位置格納メモリ、408…メッシュ特徴量抽
出部、409…メッシュ特徴量格納メモリ、410…パ
ターンマッチング部、411…特徴量辞書格納メモリ、
412…マッチング評価値格納メモリ、413…ソート
部。
03…ディスク、304…ディスクコントローラ、30
5…メインメモリ、306…CPU、307…ディスプ
レイ/キーボードコントローラ、308…メモリ(ビデ
オメモリ)、309…ディスプレイ、310…キーボー
ド、311…システムバス、401…画像読み出し部、
402…画像データ格納メモリ、403…書式解析結果
格納メモリ、404…画素特徴量格納メモリ、405…
画素特徴抽出部、406…メッシュ分割部、407…メ
ッシュ分割位置格納メモリ、408…メッシュ特徴量抽
出部、409…メッシュ特徴量格納メモリ、410…パ
ターンマッチング部、411…特徴量辞書格納メモリ、
412…マッチング評価値格納メモリ、413…ソート
部。
Claims (3)
- 【請求項1】2値画像で表現された文字パターンに対し
て、画素ごとの特徴量(画素特徴量)を求め、文字パタ
ーン全体を所定数のメッシュ領域に分割し、それぞれの
メッシュ中に含まれる画素の特徴量に基づいて各メッシ
ュごとの特徴(メッシュ特徴量)を求め、文字を認識す
る文字認識方法において、 文字を構成するストロークの方向性に関する特徴量を求
め、各方向性特徴量をストロークが含まれる1ラインご
とにまとめ、そのラインに垂直な1方向に限定した、ず
らしマッチングを行なうことを特徴とする文字認識方
法。 - 【請求項2】請求項1の文字認識方法において、方向性
特徴量ごとに、各画素特徴量と、この画素に隣りあう画
素特徴量との差分値を求め、方向性と同じ方向に投影し
た投影値に基ぢて分割位置を決定し、該分割位置では前
記所定数のメッシュ領域分割ができない場合は、既に設
定済の分割位置と一定数の均等分割を行なった場合の分
割位置とを対応付け、対応付けされた均等分割位置の間
に存在する対応しなかった均等分割位置の数だけ、メッ
シュ分割位置を設定するようにしたことを特徴とする文
字認識方法。 - 【請求項3】請求項1の文字認識方法において、ずらし
マッチングを行なう際に、各ラインを複数の部分に分割
し、それぞれの部分で独立にずらしマッチングすること
を特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05130592A JP3196291B2 (ja) | 1992-03-10 | 1992-03-10 | 文字認識方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05130592A JP3196291B2 (ja) | 1992-03-10 | 1992-03-10 | 文字認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05250518A true JPH05250518A (ja) | 1993-09-28 |
JP3196291B2 JP3196291B2 (ja) | 2001-08-06 |
Family
ID=12883211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05130592A Expired - Fee Related JP3196291B2 (ja) | 1992-03-10 | 1992-03-10 | 文字認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3196291B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014141881A1 (ja) * | 2013-03-11 | 2014-09-18 | Ido Nobuhiko | 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム |
CN113591855A (zh) * | 2021-08-18 | 2021-11-02 | 易思维(杭州)科技有限公司 | 一种粘连vin码分割方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7528977B2 (ja) | 2022-04-14 | 2024-08-06 | 株式会社村田製作所 | センサ装置 |
-
1992
- 1992-03-10 JP JP05130592A patent/JP3196291B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014141881A1 (ja) * | 2013-03-11 | 2014-09-18 | Ido Nobuhiko | 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム |
JP2014174780A (ja) * | 2013-03-11 | 2014-09-22 | Nobuhiko Ido | 特徴点集合間の対応付け方法、対応付け装置ならびに対応付けプログラム |
CN113591855A (zh) * | 2021-08-18 | 2021-11-02 | 易思维(杭州)科技有限公司 | 一种粘连vin码分割方法 |
CN113591855B (zh) * | 2021-08-18 | 2023-07-04 | 易思维(杭州)科技有限公司 | 一种粘连vin码分割方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3196291B2 (ja) | 2001-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4408342A (en) | Method for recognizing a machine encoded character | |
US6327384B1 (en) | Character recognition apparatus and method for recognizing characters | |
JP2009003937A (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP4395188B2 (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JPH05501776A (ja) | 光学式文字認識のための自動中心配置式文字字画太線化 | |
US5228095A (en) | Apparatus for recognizing printed characters | |
JP4541995B2 (ja) | 図形認識方法 | |
JP3196291B2 (ja) | 文字認識方法および装置 | |
CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
US5307424A (en) | Character recognition system | |
JPS6311832B2 (ja) | ||
CN114241486A (zh) | 一种提高识别试卷学生信息准确率的方法 | |
JP3524339B2 (ja) | 光学式文字読取装置用帳票のフォーマット情報生成方法 | |
JP2000076378A (ja) | 文字認識方法 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JPH0728939A (ja) | 表のベクトル化装置 | |
JP2616994B2 (ja) | 特徴抽出装置 | |
KR930008060B1 (ko) | 문서 인식방법 | |
JPH09120430A (ja) | 画像処理装置 | |
JP2613211B2 (ja) | 画像入力装置 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JP2674286B2 (ja) | 特徴抽出方式 | |
JP2975067B2 (ja) | 文字の認識方法 | |
JPH0656625B2 (ja) | 特徴抽出方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |