JPS63109592A - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JPS63109592A JPS63109592A JP61256379A JP25637986A JPS63109592A JP S63109592 A JPS63109592 A JP S63109592A JP 61256379 A JP61256379 A JP 61256379A JP 25637986 A JP25637986 A JP 25637986A JP S63109592 A JPS63109592 A JP S63109592A
- Authority
- JP
- Japan
- Prior art keywords
- character
- sorting
- threshold
- feature
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 76
- 238000000034 method Methods 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 abstract description 28
- 230000008569 process Effects 0.000 description 10
- 238000007781 pre-processing Methods 0.000 description 9
- 238000003909 pattern recognition Methods 0.000 description 7
- 230000008707 rearrangement Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は手書き漢字などの文字の認識方式に関し、さら
に詳細には、多層方向ヒストグラム法による特徴ベクト
ルを用いる文字認識方式に関する。
に詳細には、多層方向ヒストグラム法による特徴ベクト
ルを用いる文字認識方式に関する。
〔従来技術〕
本出願人は、多層方向ヒストグラム法による文字認識方
式を既に提案している。本発明は、このような文字認識
方式の改良に関するものである。
式を既に提案している。本発明は、このような文字認識
方式の改良に関するものである。
この多層方向ヒストグラム法による文字認識方式におい
ては、文字パターンの文字線輪郭画素に方向コードを付
け、その文字の各辺から対向する辺に向って文字パター
ンを走査して白画素(背景)の次に出現する方向コード
を検出し、その方向コードをそれが走査線上で何番目に
検出されたかによって複数の層に層別する。そして、文
字の枠内の分割領域毎に、ある層までの層別に方向コー
ド別ヒストグラムを求め、それぞれのヒストグラム(特
徴量)を成分としたベクトルを、文字の特徴ベクトルと
して用いる。
ては、文字パターンの文字線輪郭画素に方向コードを付
け、その文字の各辺から対向する辺に向って文字パター
ンを走査して白画素(背景)の次に出現する方向コード
を検出し、その方向コードをそれが走査線上で何番目に
検出されたかによって複数の層に層別する。そして、文
字の枠内の分割領域毎に、ある層までの層別に方向コー
ド別ヒストグラムを求め、それぞれのヒストグラム(特
徴量)を成分としたベクトルを、文字の特徴ベクトルと
して用いる。
例えば、方向コードとして8種類のコードを付け、文字
枠内を4×4のメツシュ領域に分割し、第1Mおよび第
2Mの方向コードまでを対象とすると、特徴ベクトルの
次元数は256 (=4X4X2X8)となる。
枠内を4×4のメツシュ領域に分割し、第1Mおよび第
2Mの方向コードまでを対象とすると、特徴ベクトルの
次元数は256 (=4X4X2X8)となる。
辞書に関しては1文字種毎の複数のパターンから同様の
特徴ベクトルを抽出し、その平均を辞書パターン(標準
パターン)の特徴ベクトルとして登録する。
特徴ベクトルを抽出し、その平均を辞書パターン(標準
パターン)の特徴ベクトルとして登録する。
また、本出願人は、層別のための走査方向も加味してさ
らに詳細に方向コードを層別する同様の文字認識方式も
既に提案している0本発明は、この文字認識方式にも同
様に適用できるものである。
らに詳細に方向コードを層別する同様の文字認識方式も
既に提案している0本発明は、この文字認識方式にも同
様に適用できるものである。
さて、このような多層方向ヒストグラム法による文字認
識方式においては、入力文字から抽出された特徴ベクト
ルと、辞書の特徴ベクトルとの距離演算を行って、入力
文字の文字種を同定する。
識方式においては、入力文字から抽出された特徴ベクト
ルと、辞書の特徴ベクトルとの距離演算を行って、入力
文字の文字種を同定する。
しかし、前記のように特徴ベクトルの次元数が大きくな
ると、距離演算が多く、マツチング処理時間が長くなる
という問題があった。
ると、距離演算が多く、マツチング処理時間が長くなる
という問題があった。
したがって、本発明の目的は、多層方向ヒストグラム法
による文字認識方式において、マツチング処理の効率化
を図ることにある。
による文字認識方式において、マツチング処理の効率化
を図ることにある。
本発明のもう一つの目的は、多層方向ヒストグラム法に
よる文字認識方式において、マツチング処理の高速化と
\もに「つぶれ」文字の認識率の向上を図ることにある
。
よる文字認識方式において、マツチング処理の高速化と
\もに「つぶれ」文字の認識率の向上を図ることにある
。
多層方向ヒストグラム法による特徴ベクトルは。
文字識別効果の大きい次元の成分と、その効果がそれほ
ど顕著でない次元の成分とがある。これに関し、説明を
簡単にするために、2次元の特徴ベクトルを考える。
ど顕著でない次元の成分とがある。これに関し、説明を
簡単にするために、2次元の特徴ベクトルを考える。
次元数を2として多層方向ヒストグラム法による辞書を
作成した場合、″文n、u字TI、It認″。
作成した場合、″文n、u字TI、It認″。
“識″のそれぞれの特徴ベクトルは、それぞれ第6図の
glv gzt gyt g*のようになる。この例で
は、図から明らかなように、各特徴ベクトルの成分(特
徴量)Aのほうが、成分(特徴量)Bよりも分散(また
は標]ψ偏差)が大きい。換言すれば、成分Aのほうが
、未知文字に対する識別能力が高い。
glv gzt gyt g*のようになる。この例で
は、図から明らかなように、各特徴ベクトルの成分(特
徴量)Aのほうが、成分(特徴量)Bよりも分散(また
は標]ψ偏差)が大きい。換言すれば、成分Aのほうが
、未知文字に対する識別能力が高い。
このような特徴ベクトルの性質に着目すれば、文字識別
能力の高い成分から優先的に距離を演算することにより
、識別能力の高い一部の次元まで距離演算を実行した段
階で、候補となり得ない文字種を排除し、候補となり得
る文字種を早い段階で絞り込むことができるであろう。
能力の高い成分から優先的に距離を演算することにより
、識別能力の高い一部の次元まで距離演算を実行した段
階で、候補となり得ない文字種を排除し、候補となり得
る文字種を早い段階で絞り込むことができるであろう。
また、多層方向ヒストグラム法による特徴ベクトルは、
その各次元成分の順番を入れ替えてもパターンの特徴と
保存されるという性質がある。
その各次元成分の順番を入れ替えてもパターンの特徴と
保存されるという性質がある。
以上のような点に着目し、本発明にあっては、多層方向
ヒストグラム法によって全文字種の仮辞書パターンの特
徴ベクトルを得て、その特徴ベクトルの成分を標準偏差
(もしくは偏差)または分散の大きい次元順に並べ替え
たベクトルを辞書パターンの特徴ベクトルとして辞書に
登録する。
ヒストグラム法によって全文字種の仮辞書パターンの特
徴ベクトルを得て、その特徴ベクトルの成分を標準偏差
(もしくは偏差)または分散の大きい次元順に並べ替え
たベクトルを辞書パターンの特徴ベクトルとして辞書に
登録する。
そして1文字認識は次のようにして行う、入力文字から
多層方向ヒストグラム法によって特徴ベクトルを抽出し
、その成分を前記標準偏差または分散の大きい次元順に
並べ替えたベクトルと、各パターン種の辞書パターンの
特徴ベクトルとの距離演算を上位のある次元まで行い、
その距離と当該文字種に対応した判定閾値とを比較し、
その比較結果によって当該文字種に関する距離演算を中
断するか、さらに下位次元までの詳細マツチングを行う
か否かの判定を行う。
多層方向ヒストグラム法によって特徴ベクトルを抽出し
、その成分を前記標準偏差または分散の大きい次元順に
並べ替えたベクトルと、各パターン種の辞書パターンの
特徴ベクトルとの距離演算を上位のある次元まで行い、
その距離と当該文字種に対応した判定閾値とを比較し、
その比較結果によって当該文字種に関する距離演算を中
断するか、さらに下位次元までの詳細マツチングを行う
か否かの判定を行う。
また、その判定閾値は例えば次のようにして文字種毎に
決定する。文字種毎に複数のパターンから多層方向ヒス
トグラム法によって特徴ベクトルをそれぞれ抽出して、
その成分を前記標準偏差(偏差)または分散の大きい次
元順に並べかえたベクトルと、同一文字種の前記辞書パ
ターンの特徴ベクトルとの上位のある次元までの距離の
標準偏差(偏差)または分散を求め、この値に基づいて
前記判定閾値を決定する。
決定する。文字種毎に複数のパターンから多層方向ヒス
トグラム法によって特徴ベクトルをそれぞれ抽出して、
その成分を前記標準偏差(偏差)または分散の大きい次
元順に並べかえたベクトルと、同一文字種の前記辞書パ
ターンの特徴ベクトルとの上位のある次元までの距離の
標準偏差(偏差)または分散を求め、この値に基づいて
前記判定閾値を決定する。
このような文字認識方式によれば、入力文字の候補とな
り得ないような文字種に関するマツチング処理が早期に
中断するので、マツチング処理の効率が向上して認識速
度が上がる。また、マツチング処理の中断の判定閾値を
前記のように文字種別に決定するので、候補から排除す
べきでない文字種のマツチング処理が誤って中断するエ
ラーも確実に防止できるため、多層方向ヒストグラム法
による文字認識方式の本質的な利点は損なわれず、高い
tgfIi率を達成できる。
り得ないような文字種に関するマツチング処理が早期に
中断するので、マツチング処理の効率が向上して認識速
度が上がる。また、マツチング処理の中断の判定閾値を
前記のように文字種別に決定するので、候補から排除す
べきでない文字種のマツチング処理が誤って中断するエ
ラーも確実に防止できるため、多層方向ヒストグラム法
による文字認識方式の本質的な利点は損なわれず、高い
tgfIi率を達成できる。
以下、本発明の実施例について図面を参照し説明する。
第1図は本発明の一実施例の機能的構成を簡略化して示
す概略ブロック図である。
す概略ブロック図である。
図において、10は原稿から文字パターンを読み取り、
文字パターン情報を前処理部12に入力する読み取り部
である。前処理部12は、入力文字パターンの切り出し
、正規化などの前処理を行い、処理後の文字パターンを
1字毎に特徴抽出部14に入力する部分である。
文字パターン情報を前処理部12に入力する読み取り部
である。前処理部12は、入力文字パターンの切り出し
、正規化などの前処理を行い、処理後の文字パターンを
1字毎に特徴抽出部14に入力する部分である。
特徴抽出部14は、入力文字パターンから多層方向ヒス
トグラム法により特徴ベクトルを抽出する部分である。
トグラム法により特徴ベクトルを抽出する部分である。
こトで、この実施例においては、動作モードとして辞書
作成モードと文字認識モードとがある。
作成モードと文字認識モードとがある。
まず、辞書作成モードの場合について以下に説明する6
また、このモードにおける辞書作成処理の概略フローチ
ャートを第2図に示し、以下の説明において対応するス
テップ番号を()内に示す。
また、このモードにおける辞書作成処理の概略フローチ
ャートを第2図に示し、以下の説明において対応するス
テップ番号を()内に示す。
一つの文字種について、M個の文字パターンが読み取り
部10より順次入力される(ステップ50)。その入力
文字パターンは前処理部12で前処理を受け(ステップ
52)、特徴抽出部14に入力されて多層方向ヒストグ
ラム法による特徴ベクトル(二Nでは256次元のベク
トルとする)を抽出される(ステップ54)。抽出され
た特徴ベクトルは並べ替え部16を介して辞書作成部2
0に入力される。この辞書作成部20により、M個の入
力文字パターンから抽出された特徴ベクトルを平均した
ベクトルが求められ(ステップ56)、その平均ベクト
ルは、その文字種の仮辞書パターンの特徴ベクトルとし
て辞#22に仮登録される(ステップ58)。
部10より順次入力される(ステップ50)。その入力
文字パターンは前処理部12で前処理を受け(ステップ
52)、特徴抽出部14に入力されて多層方向ヒストグ
ラム法による特徴ベクトル(二Nでは256次元のベク
トルとする)を抽出される(ステップ54)。抽出され
た特徴ベクトルは並べ替え部16を介して辞書作成部2
0に入力される。この辞書作成部20により、M個の入
力文字パターンから抽出された特徴ベクトルを平均した
ベクトルが求められ(ステップ56)、その平均ベクト
ルは、その文字種の仮辞書パターンの特徴ベクトルとし
て辞#22に仮登録される(ステップ58)。
辞書作成部20により、最後の文字種まで処理が終了し
たか調べられ(ステップ60)、未処理の文字種が残っ
ていれば、ステップ51に戻り、次の文字種に対する同
様の処理が行われる。
たか調べられ(ステップ60)、未処理の文字種が残っ
ていれば、ステップ51に戻り、次の文字種に対する同
様の処理が行われる。
全ての文字種について処理が終ると、並べ替えテーブル
作成部26において、辞書22に仮登録されている金板
辞書パターンの特徴ベクトルの、次元毎の標準偏差(も
しくは偏差)または分散が計算される(ステップ62)
。そして、もとの特徴ベクトルを標準偏差(偏差)また
は分散の大きい次元順に並べ替えるための情報のテーブ
ル(並べ替えテーブル)が作成され、並べ替えテーブル
部18に登録される(ステップ64)。
作成部26において、辞書22に仮登録されている金板
辞書パターンの特徴ベクトルの、次元毎の標準偏差(も
しくは偏差)または分散が計算される(ステップ62)
。そして、もとの特徴ベクトルを標準偏差(偏差)また
は分散の大きい次元順に並べ替えるための情報のテーブ
ル(並べ替えテーブル)が作成され、並べ替えテーブル
部18に登録される(ステップ64)。
二Nまでは、並べ替えテーブルを作成するための処理段
階であり、この後に実際の辞書作成処理が始まる。
階であり、この後に実際の辞書作成処理が始まる。
一つの文字種kについて、M個の文字パターンが読み取
り部10より順次入力される(ステップ66)。その入
力文字パターンは前処理部12で前処理を受け(ステッ
プ68)、特徴抽出部14に入力されて多層方向ヒスト
グラム法による特徴ベクトルを抽出される(ステップ7
0)。
り部10より順次入力される(ステップ66)。その入
力文字パターンは前処理部12で前処理を受け(ステッ
プ68)、特徴抽出部14に入力されて多層方向ヒスト
グラム法による特徴ベクトルを抽出される(ステップ7
0)。
抽出された特徴ベクトルは、並べ替え部16によって、
並べ替えテーブル部18に登録されている並べ替えテー
ブルの情報に従い、前記標準偏差(偏差)または分散の
大きい次元順に成分が並べ替えられる(ステップ72)
。このように成分の並べ替え後のM個の特徴ベクトルは
辞書作成部20に送られ、それらの平均ベクトルが、そ
の文字種にの辞書パターンの特徴ベクトルとして辞書2
0に本登録される(ステップ74)。
並べ替えテーブル部18に登録されている並べ替えテー
ブルの情報に従い、前記標準偏差(偏差)または分散の
大きい次元順に成分が並べ替えられる(ステップ72)
。このように成分の並べ替え後のM個の特徴ベクトルは
辞書作成部20に送られ、それらの平均ベクトルが、そ
の文字種にの辞書パターンの特徴ベクトルとして辞書2
0に本登録される(ステップ74)。
辞書作成部20により、全部の文字種(K種)について
辞書作成処理が終了したか調べられ(ステップ76)、
未処理の文字種が残っているならば、未処理の文字種に
ついてステップ66から同様の処理が行われる。
辞書作成処理が終了したか調べられ(ステップ76)、
未処理の文字種が残っているならば、未処理の文字種に
ついてステップ66から同様の処理が行われる。
全文字種について処理が完了すると、辞書そのもの\作
成は終わりであるが、次に判定閾値決定の処理が行われ
る。
成は終わりであるが、次に判定閾値決定の処理が行われ
る。
この処理においては、文字種毎に辞書作成に用いられた
と同様なM個の文字パターンが入力され(ステップ78
)、前処理(ステップ80)の後、それぞれ多層方向ヒ
ストグラム法による特徴ベクトルを抽出される・(ステ
ップ82)。このM個の文字パターンの特徴ベクトルは
それぞれ、並べ替え部16によって並べ替えテーブルの
情報に従い成分が並べ替えられ(ステップ84)、マツ
チング部24に入力される。
と同様なM個の文字パターンが入力され(ステップ78
)、前処理(ステップ80)の後、それぞれ多層方向ヒ
ストグラム法による特徴ベクトルを抽出される・(ステ
ップ82)。このM個の文字パターンの特徴ベクトルは
それぞれ、並べ替え部16によって並べ替えテーブルの
情報に従い成分が並べ替えられ(ステップ84)、マツ
チング部24に入力される。
次にマツチング部24および閾値決定部28の起動によ
り、閾値決定が行われる。すなわち、マツチング部24
により、その各特徴ベクトルと文字種にの辞書パターン
の特徴ベクトルとの距離が上位N次元まで演算され、閾
値決定部28において、その演算結果から、上位N次元
までの距離の標準偏差が求められる(ステップ86)、
そして、その標y<6値が文字値にの判定閾値として閾
値テーブル部30に登録される(ステップ88)。
り、閾値決定が行われる。すなわち、マツチング部24
により、その各特徴ベクトルと文字種にの辞書パターン
の特徴ベクトルとの距離が上位N次元まで演算され、閾
値決定部28において、その演算結果から、上位N次元
までの距離の標準偏差が求められる(ステップ86)、
そして、その標y<6値が文字値にの判定閾値として閾
値テーブル部30に登録される(ステップ88)。
同様にして、他の文字種の判定閾値が決定され、閾値テ
ーブル部30に登録される。
ーブル部30に登録される。
全文字種について閾値の決定9.@が完了したと判定さ
れると(ステップ90)、辞書作成モードの処理全体が
終了する。
れると(ステップ90)、辞書作成モードの処理全体が
終了する。
つぎに、文字認識モードの場合について以下に説明する
。また、このモードにおける処理の概略フローチャート
を第3図に示し、以下の説明において対応するステップ
番号を()内に示す。
。また、このモードにおける処理の概略フローチャート
を第3図に示し、以下の説明において対応するステップ
番号を()内に示す。
認識対象の未知の文字パターンは、読み取り部10より
入力され(ステップ100)、前処理部12により前処
理(ステップ102)の後、特徴抽出部14で多層方向
ヒストグラム法によって特徴ベクトル(こへでは256
次元のベクトル)を抽出される(ステップ104)。
入力され(ステップ100)、前処理部12により前処
理(ステップ102)の後、特徴抽出部14で多層方向
ヒストグラム法によって特徴ベクトル(こへでは256
次元のベクトル)を抽出される(ステップ104)。
この特徴ベクトルは、並べ替え部16によって並べ替え
テーブルの情報に従い成分が並べ替えられ、その並べ替
え後の特徴ベクトルY、nがマツチング部24に入力さ
れる(ステップ106)。
テーブルの情報に従い成分が並べ替えられ、その並べ替
え後の特徴ベクトルY、nがマツチング部24に入力さ
れる(ステップ106)。
マツチング部24において、文字種にの辞書パターンの
特徴ベクトルFknと、入力文字の特徴ベクトルYnと
の上位N次元までのマツチング距離dが演算される(ス
テップ108)。そして、その距離dと、閾値テーブル
部30に登録されている対応文字種にの判定閾値Thk
との比較判定が行われる(ステップ110)。
特徴ベクトルFknと、入力文字の特徴ベクトルYnと
の上位N次元までのマツチング距離dが演算される(ス
テップ108)。そして、その距離dと、閾値テーブル
部30に登録されている対応文字種にの判定閾値Thk
との比較判定が行われる(ステップ110)。
d>Thkであれば、その入力文字の文字種は現在の文
字種にである可能性はないので、その辞書パターンとの
マツチング処理を中断し、終了判定を行う(ステップ1
16)。
字種にである可能性はないので、その辞書パターンとの
マツチング処理を中断し、終了判定を行う(ステップ1
16)。
d≦Thkであれば、現在の文字種は入力文字の文字種
である可能性が高いので、詳細マツチングが行われる。
である可能性が高いので、詳細マツチングが行われる。
すなわち、全次元についてマツチング距離りが演算され
る(ステップ112)。そして、その距離りと、それま
での候補の距離とが比較され、距離が小さいほうが文字
種が新しい候補として残され(ステップ114)、終了
判定のステップ116に進む。
る(ステップ112)。そして、その距離りと、それま
での候補の距離とが比較され、距離が小さいほうが文字
種が新しい候補として残され(ステップ114)、終了
判定のステップ116に進む。
ステップ116において、マツチングすべき文字種が残
っていると判定されると、次の文字種についてステップ
108以降のマツチング処理が行われる。
っていると判定されると、次の文字種についてステップ
108以降のマツチング処理が行われる。
すべての文字種についてマツチング処理が行われると、
ステップ116で終了と判定され、最終的に残った候補
の文字種の文字コードが認識結果として出力される。こ
れで、一つの入力文字の認識処理を完了する。
ステップ116で終了と判定され、最終的に残った候補
の文字種の文字コードが認識結果として出力される。こ
れで、一つの入力文字の認識処理を完了する。
さて、手書き漢字などの文字の変形や傾向や程度は、記
入者(認識システムの使用者)によって様々である。こ
れに対処するために、様々な文字変形を考慮した文字パ
ターンを用意し、辞書作成に用いる。
入者(認識システムの使用者)によって様々である。こ
れに対処するために、様々な文字変形を考慮した文字パ
ターンを用意し、辞書作成に用いる。
しかし、そのようにしても、使用者によって、その手書
き文字パターンと辞書パターンとのマツチングの良し悪
しがある。また、同一の使用者でも、認識システムに対
し慣れるに従い、辞書とのマツチング性が向上し、認識
率が高く成る傾向が詔められる。
き文字パターンと辞書パターンとのマツチングの良し悪
しがある。また、同一の使用者でも、認識システムに対
し慣れるに従い、辞書とのマツチング性が向上し、認識
率が高く成る傾向が詔められる。
このような点に着目すると、詳細マツチングを行うか否
かの判定のための閾値を変更できると好都合である。す
なわち、辞書とのマツチングの良い使用者の場合または
慣れた使用者の場合、判定閾値を下げて詳細マツチング
の頻度を下げることにより、認識率を下げることなく、
認識速度を上げることができる。
かの判定のための閾値を変更できると好都合である。す
なわち、辞書とのマツチングの良い使用者の場合または
慣れた使用者の場合、判定閾値を下げて詳細マツチング
の頻度を下げることにより、認識率を下げることなく、
認識速度を上げることができる。
次に、このような閾値の調整を可能とした本発明の第2
実施例について説明する。なおSこの実施例の機能的構
成は前記実施例と同様であるので、そのブロック図は省
略し、以下の説明において必要に応じ第1図に参照する
。
実施例について説明する。なおSこの実施例の機能的構
成は前記実施例と同様であるので、そのブロック図は省
略し、以下の説明において必要に応じ第1図に参照する
。
この実施例においては、辞書作成モードにおいて、前記
実施例と同様に、並べ替えテーブルと辞書が作成される
。たゾし、詳細マツチングを行うか否かの判定のための
閾値が、文字種毎の複数種類決定される。
実施例と同様に、並べ替えテーブルと辞書が作成される
。たゾし、詳細マツチングを行うか否かの判定のための
閾値が、文字種毎の複数種類決定される。
この点について、前記第1実施例に関連した第2図のフ
ローチャートを参照して説明すれば、ステップ88にお
いて決定される閾値をThkとすれば、この実施例にあ
っては、Thk/1.Thk/2〜Thk/L (Lは
正の整数)の値が、それぞれ文字種にの閾値Thk (
1)、Thk (2)〜Thk(L)として閾値決定部
28により決定され、閾値テーブル部30に登録される
。
ローチャートを参照して説明すれば、ステップ88にお
いて決定される閾値をThkとすれば、この実施例にあ
っては、Thk/1.Thk/2〜Thk/L (Lは
正の整数)の値が、それぞれ文字種にの閾値Thk (
1)、Thk (2)〜Thk(L)として閾値決定部
28により決定され、閾値テーブル部30に登録される
。
第4図は、この実施例におけるパターン認識モードの概
略フローチャートである。この回を参照し、この実施例
におけるパターン認識モードについて説明する。
略フローチャートである。この回を参照し、この実施例
におけるパターン認識モードについて説明する。
この実施例においては、閾値の選択のためのパラメータ
であるユーザレベルUL (=1.2,3゜・・・、L
)が最初のステップ200で設定される。
であるユーザレベルUL (=1.2,3゜・・・、L
)が最初のステップ200で設定される。
このユーザレベルULは、この実施例に係るパターン認
識システムの使用者側で指定できるものである。
識システムの使用者側で指定できるものである。
ステップ202からステップ210までは、第3図のス
テップ100からステップ108までと同一内容である
。ステップ214からステップ220までは、第3図の
ステップ112からステップ118までと同一内容であ
る。
テップ100からステップ108までと同一内容である
。ステップ214からステップ220までは、第3図の
ステップ112からステップ118までと同一内容であ
る。
ステップ212は、上位N次元までのマツチング距離か
ら詳細マツチングを行うか否かを判定するためのステッ
プであり、第3図のステップ110と対応する。この実
施例の場合、文字種にの複数の閾値Th (1)〜Th
(L)の中から、ユーザレベルULに対応する一つの
閾値Th (UL)が、その判定の閾値として用いられ
る。
ら詳細マツチングを行うか否かを判定するためのステッ
プであり、第3図のステップ110と対応する。この実
施例の場合、文字種にの複数の閾値Th (1)〜Th
(L)の中から、ユーザレベルULに対応する一つの
閾値Th (UL)が、その判定の閾値として用いられ
る。
つまり、この実施例に係わるパターン認識システムに慣
れた使用者の場合、ユーザレベルULを高いレベル(最
高はL)に指定すれば、より小さい閾値(最低はTh
(L))が選択されて判定に用いられるから、詳細マツ
チング(ステップ214)に進む頻度が少なくなり、そ
れだけマツチング効率が向上して文字認識速度が上がる
。
れた使用者の場合、ユーザレベルULを高いレベル(最
高はL)に指定すれば、より小さい閾値(最低はTh
(L))が選択されて判定に用いられるから、詳細マツ
チング(ステップ214)に進む頻度が少なくなり、そ
れだけマツチング効率が向上して文字認識速度が上がる
。
逆に、慣れていない使用者または辞書とのマツチングの
良くない使用者の場合、低いユーザレベルUL(最低は
1)を指定すれば、大きい閾値(最高はThk (1)
)が選択されて判定に用いられ、詳細マツチングの頻度
が上がるから、認識速度は落ちるが認識率を上げること
ができる。
良くない使用者の場合、低いユーザレベルUL(最低は
1)を指定すれば、大きい閾値(最高はThk (1)
)が選択されて判定に用いられ、詳細マツチングの頻度
が上がるから、認識速度は落ちるが認識率を上げること
ができる。
さて、前述のように、認識率は使用者によって変動する
が、さらに文字種によっても変動する。
が、さらに文字種によっても変動する。
これは、辞書作成用のパターンとして、ある癖を持った
パターンが用いられた場合などに顕著であるが、このよ
うな点は漢字のように文字種が多い場合、辞書作成段階
ではチェックが困難である。
パターンが用いられた場合などに顕著であるが、このよ
うな点は漢字のように文字種が多い場合、辞書作成段階
ではチェックが困難である。
そのような文字種ごとに認識率の変動を吸収することが
できる。本発明の第3実施例について以下に説明する。
できる。本発明の第3実施例について以下に説明する。
なお、この実施例に係るパターン認識システムの機能的
構成は前記第1実施例と同様である。また、辞書作成モ
ードの処理は前記第2実施例と同様であり、文字種毎に
複数種類の判定用閾値Th (1)〜Th (L)が決
定される。
構成は前記第1実施例と同様である。また、辞書作成モ
ードの処理は前記第2実施例と同様であり、文字種毎に
複数種類の判定用閾値Th (1)〜Th (L)が決
定される。
第5図は、この実施例におけるパターン認識モードの処
理の概略フローチャートである。この図において、ステ
ップ300〜308は第4図のステップ202〜210
と同一内容であり、ステップ314〜320も第4図の
ステップ214〜220と同一内容である。
理の概略フローチャートである。この図において、ステ
ップ300〜308は第4図のステップ202〜210
と同一内容であり、ステップ314〜320も第4図の
ステップ214〜220と同一内容である。
ステップ310では1文字種毎のレベルLV(k)が、
閾値選択用のパラメータ■として設定される。このレベ
ルLV (k)は、例えばパターン認識システムの運用
中に文字種にのリジェクト・認識率Rkを菩えておき、
そのPk値をある定数で割り算した値として与えられる
。
閾値選択用のパラメータ■として設定される。このレベ
ルLV (k)は、例えばパターン認識システムの運用
中に文字種にのリジェクト・認識率Rkを菩えておき、
そのPk値をある定数で割り算した値として与えられる
。
そして、ステップ312は第4図のステップ212に対
応するステップであり、文字種にの複数の閾値Thk
(1)〜Th (L)の中から、パラメータVに対応す
る一つの閾値Thk(V)を選択し、距離dと比較する
ことにより詳細マツチング(ステップ314)に進むか
否かを判定する。
応するステップであり、文字種にの複数の閾値Thk
(1)〜Th (L)の中から、パラメータVに対応す
る一つの閾値Thk(V)を選択し、距離dと比較する
ことにより詳細マツチング(ステップ314)に進むか
否かを判定する。
なお、この実施例と、前記第2実施例とを組み合わせた
第4の実施例について、便宜上、第5図のフローチャー
トを参照して説明する。
第4の実施例について、便宜上、第5図のフローチャー
トを参照して説明する。
この実施例にあっては、ステップ300の前にユーザレ
ベルULの設定ステップ(第4図のステップ200に相
当)が追加される。また、ステップ310において、文
字種にのレベルLV (k)とユーザレベルULとの和
がパラメータVとして設定される。そして、ステップ3
12において、パラメータ■に対応する閾値Thk(V
)が判定に用いられる。
ベルULの設定ステップ(第4図のステップ200に相
当)が追加される。また、ステップ310において、文
字種にのレベルLV (k)とユーザレベルULとの和
がパラメータVとして設定される。そして、ステップ3
12において、パラメータ■に対応する閾値Thk(V
)が判定に用いられる。
これ以外は、前記各実施例と同様である。
この実施例によれば、使用者および文字種による変動要
因を吸収し、最適な閾値を用いて詳細マツチングを行う
か否かの判定を行うことができるので、前記第2実施例
と第3実施例の両方の利点が得られる。
因を吸収し、最適な閾値を用いて詳細マツチングを行う
か否かの判定を行うことができるので、前記第2実施例
と第3実施例の両方の利点が得られる。
さて、漢字のような複雑な文字は、活字印刷であっても
手書きであっても、「つぶれ」が起こりやすい。発明者
の研究によれば、第1層の画素は文字の「つぶれ」の影
響を受けにく\、第1層の特徴量は「つぶれ」文字の場
合でも安定しており、「つぶれ」文字の認識に有効であ
ることが分かった。
手書きであっても、「つぶれ」が起こりやすい。発明者
の研究によれば、第1層の画素は文字の「つぶれ」の影
響を受けにく\、第1層の特徴量は「つぶれ」文字の場
合でも安定しており、「つぶれ」文字の認識に有効であ
ることが分かった。
このような点に基づき、1つぶれ」文字に対しても高い
認識率を達成でき、また、効率的な認識処理の可能な他
の実施例について、以下に説明する。
認識率を達成でき、また、効率的な認識処理の可能な他
の実施例について、以下に説明する。
なお、この実施例の機能的構成は前記各実施例と殆ど同
様であるので、第1図のブロック図を参照して説明する
。
様であるので、第1図のブロック図を参照して説明する
。
この実施例においては、第1図に破線で示すようにつぶ
れ判定部32が追加される。このつぶれ判定部32は、
入力文字の周囲長Scと黒画素数Tbとの比Reを81
q定し、その比Rc(つぶれ度合い)が所定の閾値以上
の場合には、入力文字を正常文字と判定し、その閾値を
下回る場合には、入力文字を「つぶれ」文字と判定する
。この判定結果は並べ替え部16およびマツチング部2
4に与えられる。
れ判定部32が追加される。このつぶれ判定部32は、
入力文字の周囲長Scと黒画素数Tbとの比Reを81
q定し、その比Rc(つぶれ度合い)が所定の閾値以上
の場合には、入力文字を正常文字と判定し、その閾値を
下回る場合には、入力文字を「つぶれ」文字と判定する
。この判定結果は並べ替え部16およびマツチング部2
4に与えられる。
なお、つぶれ判定のアルゴリズムは適宜変更してよいも
のである。
のである。
また、この実施例においては、正常文字用の第1の並べ
替えテーブルと、つぶれ文字用の第2の並べ替えテーブ
ルとが辞書作成時に作成されて。
替えテーブルと、つぶれ文字用の第2の並べ替えテーブ
ルとが辞書作成時に作成されて。
それぞれ並べ替えテーブル部18に登録される。
正常文字用の第1の並べ替えテーブルには、辞書の特徴
ベクトルの並べ替え後の成分量に合わせて、入力文字か
ら抽出された特徴ベクトルを、第1層および第2層の特
徴量に関して標準偏差もしくは偏差または分散の大きい
次元順に並べ替えるための情報が格納される。つぶれ文
字用の第2の並べ替えテーブルには、入力文字から抽出
された特徴ベクトルを、第1層の特徴量に関して標準偏
差もしくは偏差または分散の大きい次元順に特徴ベクト
ルの成分を並べ替えるための情報が格納される。
ベクトルの並べ替え後の成分量に合わせて、入力文字か
ら抽出された特徴ベクトルを、第1層および第2層の特
徴量に関して標準偏差もしくは偏差または分散の大きい
次元順に並べ替えるための情報が格納される。つぶれ文
字用の第2の並べ替えテーブルには、入力文字から抽出
された特徴ベクトルを、第1層の特徴量に関して標準偏
差もしくは偏差または分散の大きい次元順に特徴ベクト
ルの成分を並べ替えるための情報が格納される。
文字認識モードにおいては、入力文字が正常文字と判定
された場合、入力文字から抽出された特徴ベクトルは、
並べ替え部16により第1の並べ替えテーブルの情報に
従って第1層および第2層の特徴量に関して成分の並べ
替えが行われてからマツチング部24へ送られる。他方
、入力文字が「つぶれ」文字と判定された場合、その抽
出特徴ベクトルは、第2の並べ替えテーブルの情報に従
って、第1層の特徴量に関してだけ成分量の並べ替えが
行われる。
された場合、入力文字から抽出された特徴ベクトルは、
並べ替え部16により第1の並べ替えテーブルの情報に
従って第1層および第2層の特徴量に関して成分の並べ
替えが行われてからマツチング部24へ送られる。他方
、入力文字が「つぶれ」文字と判定された場合、その抽
出特徴ベクトルは、第2の並べ替えテーブルの情報に従
って、第1層の特徴量に関してだけ成分量の並べ替えが
行われる。
マツチング部24においては、その並べ替え後の入力文
字の特徴ベクトルと辞書の特徴ベクトルとの距離演算を
行うが、正常文字の場合には第1層および第2層の特徴
量に関して最高256次元まで距離の演算を行い、他方
、「つぶれj文字の場合には第1層の特徴量に関して最
高128次元まで距離の演算を行う。つまり、「つぶれ
」文字に関しては、「つぶれ」の影響を受けにくい第1
層の特徴量に限って距離演算が行われ、しかも有効次元
を限定している。
字の特徴ベクトルと辞書の特徴ベクトルとの距離演算を
行うが、正常文字の場合には第1層および第2層の特徴
量に関して最高256次元まで距離の演算を行い、他方
、「つぶれj文字の場合には第1層の特徴量に関して最
高128次元まで距離の演算を行う。つまり、「つぶれ
」文字に関しては、「つぶれ」の影響を受けにくい第1
層の特徴量に限って距離演算が行われ、しかも有効次元
を限定している。
いずれの場合にも、前記実施例と同様に、上位のある次
元までの距離を判定閾値と比較し、距離演算を中止する
か継続するかの判定を行う。
元までの距離を判定閾値と比較し、距離演算を中止する
か継続するかの判定を行う。
この実施例によれば、「つぶれ」文字に対しても高い認
識率を達成でき、しかも距離演算量が削減されるので、
マツチング処理の一層の効率化が可能である。
識率を達成でき、しかも距離演算量が削減されるので、
マツチング処理の一層の効率化が可能である。
以上、本発明を実施例について説明したが、本発明はそ
九だけに限定されるものではなく、様々な変形が許され
るものである。
九だけに限定されるものではなく、様々な変形が許され
るものである。
以上の説明から明らかなように、本発明によれば、多層
方向ヒストグラム法の利点を損なうことなく、マツチン
グ処理の効率を大幅に向上し、高速の文字認識が可能で
あり、また、つぶれ文字に対しても高い認識率を達成で
きる。
方向ヒストグラム法の利点を損なうことなく、マツチン
グ処理の効率を大幅に向上し、高速の文字認識が可能で
あり、また、つぶれ文字に対しても高い認識率を達成で
きる。
第1図は本発明の第1の実施例ならびに他の実施例に拘
わるブロック図、第2図は第1の実施例における辞書作
成処理の概略フローチャート、第3図は第1実施例にお
ける文字認識処理の概略フローチャート、第4図は本発
明の第2実施例における文字認識処理の概略フローチャ
ート、第5図は本発明の第3実施例における文字認識処
理の概略フローチャート、第6図は多層方向ヒストグラ
ム法の特徴ベクトルの性質を説明するためのベクトル図
である。 10・・・読み取り部、 14・・・特徴抽出部、16
・・・並べ替え部、 18・・・並べ替えテーブル部
、 22・・・辞書、 24・・・マツチング部、30
・・・閾値テーブル部。 第2図(2) 第2図(3)
わるブロック図、第2図は第1の実施例における辞書作
成処理の概略フローチャート、第3図は第1実施例にお
ける文字認識処理の概略フローチャート、第4図は本発
明の第2実施例における文字認識処理の概略フローチャ
ート、第5図は本発明の第3実施例における文字認識処
理の概略フローチャート、第6図は多層方向ヒストグラ
ム法の特徴ベクトルの性質を説明するためのベクトル図
である。 10・・・読み取り部、 14・・・特徴抽出部、16
・・・並べ替え部、 18・・・並べ替えテーブル部
、 22・・・辞書、 24・・・マツチング部、30
・・・閾値テーブル部。 第2図(2) 第2図(3)
Claims (2)
- (1)多層方向ヒストグラム法による文字認識方式であ
って、標準偏差もしくは偏差または分散の大きい次元順
に成分が並べ替えられた各種文字の特徴ベクトルを格納
する辞書と、前記次元順による並べ替えのための情報を
格納する並べ替えテーブルと、文字種対応の判定閾値を
格納する閾値テーブルと、入力文字から特徴ベクトルを
抽出するための手段と、この手段によって抽出された特
徴ベクトルの成分を前記並べ替えテーブルの格納情報に
従って前記次元順に並べ替えるための手段と、この手段
による並べ替え後の特徴ベクトルと辞書に格納されてい
る特徴ベクトルとの距離演算を上位のある次元数につい
て行い、その距離が前記閾値テーブルに格納されている
対応文字種の判定閾値以下の場合にだけ、さらに下位次
元までの距離演算を行って入字を認識する手段とを具備
することを特徴とする文字認識方式。 - (2)多層方向ヒストグラム法による文字認識方式であ
って、標準偏差もしくは偏差または分散の大きい次元順
に成分が並べ替えられた各種文字の特徴ベクトルを格納
する辞書と、第1層および第2層の特徴量に関して標準
偏差もしくは偏差または分散の大きい次元順に特徴ベク
トルの成分を並べ替えるための情報を格納する第1の並
べ替えテーブルと、第1層の特徴量に関して標準偏差も
しくは偏差または分散の大きい次元順に特徴ベクトルの
成分を並べ替えるための情報を格納する第2の並べ替え
テーブルと、文字種対応の判定閾値を格納する閾値テー
ブルと、入力文字から特徴ベクトルを抽出するための特
徴抽出手段と、入力文字が正常文字かつぶれ文字かの判
定を行うための判定手段と、この判定手段により正常文
字と判定された入力文字から抽出された特徴ベクトルの
成分を前記第1の並べ替えテーブルの格納情報に従って
並べ替え、前記判定手段によりつぶれ文字と判定された
入力文字から抽出された特徴ベクトルの成分を前記第2
の並べ替えテーブルの格納情報に従って並べ替えるため
の手段と、この手段によって並べ替え後の入力文字の特
徴ベクトルと辞書に格納されている特徴ベクトルとの距
離演算を、正常文字と判定された入力文字の場合には第
1層および第2層の特徴量に関して、また、つぶれ文字
と判定された入力文字の場合には第1層の特徴量に関し
て、それぞれ上位のある次元数について行い、その距離
が前記閾値データに格納されている対応文字種の判定閾
値以下の場合にだけ、さらに下位次元までの距離演算を
行って入力文字を認識する手段とを具備することを特徴
とする文字認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61256379A JPH0795336B2 (ja) | 1986-10-28 | 1986-10-28 | 文字認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61256379A JPH0795336B2 (ja) | 1986-10-28 | 1986-10-28 | 文字認識方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63109592A true JPS63109592A (ja) | 1988-05-14 |
JPH0795336B2 JPH0795336B2 (ja) | 1995-10-11 |
Family
ID=17291862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61256379A Expired - Fee Related JPH0795336B2 (ja) | 1986-10-28 | 1986-10-28 | 文字認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0795336B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03223986A (ja) * | 1989-12-26 | 1991-10-02 | Fuji Facom Corp | 認識結果のリジェクト方法 |
JP2007188190A (ja) * | 2006-01-11 | 2007-07-26 | Sharp Corp | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 |
WO2008044380A1 (fr) | 2006-10-11 | 2008-04-17 | Sharp Kabushiki Kaisha | Dispositif de reconnaissance de motif pour reconnaître un motif de saisie à l'aide d'un motif de dictionnaire |
-
1986
- 1986-10-28 JP JP61256379A patent/JPH0795336B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03223986A (ja) * | 1989-12-26 | 1991-10-02 | Fuji Facom Corp | 認識結果のリジェクト方法 |
JP2007188190A (ja) * | 2006-01-11 | 2007-07-26 | Sharp Corp | パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体 |
WO2008044380A1 (fr) | 2006-10-11 | 2008-04-17 | Sharp Kabushiki Kaisha | Dispositif de reconnaissance de motif pour reconnaître un motif de saisie à l'aide d'un motif de dictionnaire |
Also Published As
Publication number | Publication date |
---|---|
JPH0795336B2 (ja) | 1995-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7519226B2 (en) | Form search apparatus and method | |
CA2601144C (en) | Method and system for adaptive recognition of distorted text in computer images | |
JPS63109592A (ja) | 文字認識方式 | |
JP3868637B2 (ja) | 文字認識装置および辞書作成方法および記録媒体 | |
JPS63778A (ja) | パターン認識方法 | |
KR19980058361A (ko) | 한글 문자 인식 방법 및 시스템 | |
JPH10222602A (ja) | 光学式文字読取装置 | |
JP2832928B2 (ja) | 文字認識方法 | |
JPH09305707A (ja) | 画像抽出方式 | |
JP2001092924A (ja) | パターン認識方法および装置 | |
JP2002056356A (ja) | 文字認識装置、文字認識方法および記録媒体 | |
JP2894111B2 (ja) | 光学式活字文字認識装置における認識結果の総合判定方式 | |
JPH05120488A (ja) | 線図形認識方法 | |
KR930012141B1 (ko) | 온라인 필기체 문자인식방법 | |
JP3277977B2 (ja) | 文字認識方法 | |
KR100480024B1 (ko) | 획의두께정보를이용한모음인식방법 | |
JP2002157552A (ja) | 光学式文字読取装置 | |
KR930012139B1 (ko) | 문자인식을 위한 자획추출방법 | |
JP2003281470A (ja) | 文字認識装置及び文字認識方法 | |
JPS59211175A (ja) | 文字認識装置 | |
JPS63269267A (ja) | 文字認識方法 | |
KR910005390B1 (ko) | 자동문서처리 및 영문자 인식방법 | |
JPH11120291A (ja) | パタン認識システム | |
JP4766451B2 (ja) | 符号化装置、画像処理装置、符号化方法及び符号化プログラム | |
JP2832035B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |