JPH0436432B2 - - Google Patents
Info
- Publication number
- JPH0436432B2 JPH0436432B2 JP59094916A JP9491684A JPH0436432B2 JP H0436432 B2 JPH0436432 B2 JP H0436432B2 JP 59094916 A JP59094916 A JP 59094916A JP 9491684 A JP9491684 A JP 9491684A JP H0436432 B2 JPH0436432 B2 JP H0436432B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- characters
- input
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 239000000872 buffer Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
Description
【発明の詳細な説明】
(イ) 産業上の利用分野
本発明は、手書きあるいは印刷による文字を認
識する文字認識装置に係り、特に、特徴パターン
のマツチング方式に関する。
識する文字認識装置に係り、特に、特徴パターン
のマツチング方式に関する。
(ロ) 従来技術
一般に、文字認識装置では、入力文字パターン
から特徴パターンを抽出し、得られた特徴パター
ンを、予め辞書部に登録されている標準特徴パタ
ーンとマツチングすることにより、文字の認識を
行なつているが、通常、抽出された特徴パターン
は、辞書部の全ての標準特徴パターンとマツチン
グされるため、認識速度が遅いと共に、類似文字
による誤認識が多く、認識率低下原因の一つとな
つている。
から特徴パターンを抽出し、得られた特徴パター
ンを、予め辞書部に登録されている標準特徴パタ
ーンとマツチングすることにより、文字の認識を
行なつているが、通常、抽出された特徴パターン
は、辞書部の全ての標準特徴パターンとマツチン
グされるため、認識速度が遅いと共に、類似文字
による誤認識が多く、認識率低下原因の一つとな
つている。
そこで、認識率を向上させるために、従来、特
開昭59−32080号公報に開示されているように、
文字の前後の関係等の文法的な要素を追加した
り、特公昭58−22781号公報に開示されているよ
うに、階層的に特徴パターンの認識を行なう方式
が考えられた。しかしながら、前者では文法的な
辞書部が必要となり、又、後者は各階層毎の標準
特徴パターンを辞書部に登録しておかなければな
らないため、共に辞書部の容量が膨大となり、更
に、手順が複雑となつて認識時間がかかり過ぎ、
従つて、システムが大型にならざるを得ないとい
う欠点があつた。
開昭59−32080号公報に開示されているように、
文字の前後の関係等の文法的な要素を追加した
り、特公昭58−22781号公報に開示されているよ
うに、階層的に特徴パターンの認識を行なう方式
が考えられた。しかしながら、前者では文法的な
辞書部が必要となり、又、後者は各階層毎の標準
特徴パターンを辞書部に登録しておかなければな
らないため、共に辞書部の容量が膨大となり、更
に、手順が複雑となつて認識時間がかかり過ぎ、
従つて、システムが大型にならざるを得ないとい
う欠点があつた。
(ハ) 発明の目的
本発明は、辞書部の容量を増大させることな
く、簡単な処理で認識率を向上させ、且つ、認識
速度を速めることを目的としたものである。
く、簡単な処理で認識率を向上させ、且つ、認識
速度を速めることを目的としたものである。
(ニ) 発明の構成
本発明は、縦長文字の標準特徴パターンを記憶
した第1の領域と、横長文字の標準特徴パターン
を記憶した第2の領域と、縦長文字及び横長文字
以外の標準特徴パターンを記憶した第3の領域と
を有する辞書部を備え、入力文字パターンから抽
出した特徴パターンを、前記辞書部に登録された
標準特徴パターンとマツチングして、文字の認識
を行う文字認識装置において、前記入力文字パタ
ーンの縦横の長さを検出して該文字が縦長文字又
は横長文字であることを判別する手段を設け、該
手段により入力文字が縦長文字であると判別され
たときは、前記マツチングの範囲を前記第1の領
域に限定し、横長文字であると判別されたとき
は、前記マツチングの範囲を前記第2の領域に限
定するように構成したものである。
した第1の領域と、横長文字の標準特徴パターン
を記憶した第2の領域と、縦長文字及び横長文字
以外の標準特徴パターンを記憶した第3の領域と
を有する辞書部を備え、入力文字パターンから抽
出した特徴パターンを、前記辞書部に登録された
標準特徴パターンとマツチングして、文字の認識
を行う文字認識装置において、前記入力文字パタ
ーンの縦横の長さを検出して該文字が縦長文字又
は横長文字であることを判別する手段を設け、該
手段により入力文字が縦長文字であると判別され
たときは、前記マツチングの範囲を前記第1の領
域に限定し、横長文字であると判別されたとき
は、前記マツチングの範囲を前記第2の領域に限
定するように構成したものである。
(ホ) 実施例
第1図は、本発明の一実施例を実現するための
文字認識装置全体の構成を示すブロツク図であ
り、1は文字観測部、2は前処理部、3は特徴抽
出部、4はパターンマツチング部、5は辞書部、
6は識別部、7は文字コードメモリである。
文字認識装置全体の構成を示すブロツク図であ
り、1は文字観測部、2は前処理部、3は特徴抽
出部、4はパターンマツチング部、5は辞書部、
6は識別部、7は文字コードメモリである。
認識される文字は、第2図に示すように、文字
の記入枠だけが印刷された原稿用紙8に手書きさ
れ、この手書き文字が文字観測部1に入力され
る。文字観測部1は、CCDイメージセンサー等
により、入力された全ての手書き文字を走査及び
光電変換し、各文字を濃淡に応じた観測文字パタ
ーンに変換し、前処理部2へ送る。前処理部2で
は、先ず、2値化部21で、観測文字パターンを
M×Nメツシユの各格子点が「0」か「1」を採
る入力文字パターンに変換し、認識対象文字パタ
ーンを1文字だけ切出し、文字切出し部22で、
外接矩形枠によつて囲まれた文字パターンを切出
す。即ち、第3図に示すように、.M×Nメツシ
ユの入力文字パターンにおいて、各辺より中心方
向に触手をのばし、最初に文字部分に出合つたと
ころでその辺の外接枠を検出し、このようにして
検出された各外接枠によつて囲まれた部分の情報
を文字パターンとして切出す。この際、各外接枠
の座標x1,x2及びy1,y2が検出される。そして、
切出された文字パターンは、正規化部24で伸縮
処理が施され、大きさの正規化及び位置の正規化
が行なわれるが、本実施例では、文字切出し時に
検出した座標情報に基づき、文字大きさ検出部2
3で、文字の縦横の長さの検出を行なう。即ち、
文字の横長a及び縦長bを、a=(x2−x1+1)
及びb=(y2−y1+1)として求め、これらの値
a及びbを所定の閾値W及びHと比較し、比較結
果に応じて第4図に示すように、文字の大きさを
4段階に分類し、各分類にデイメンシヨンフラグ
Fdを割り当てる。つまり文字大きさ検出部23
では、入力文字パターンをその文字の縦横の長さ
によつて、大文字,縦長文字,横長文字,小文字
に分類し、対応するデイメンシヨンフラグFdを
付すのである。
の記入枠だけが印刷された原稿用紙8に手書きさ
れ、この手書き文字が文字観測部1に入力され
る。文字観測部1は、CCDイメージセンサー等
により、入力された全ての手書き文字を走査及び
光電変換し、各文字を濃淡に応じた観測文字パタ
ーンに変換し、前処理部2へ送る。前処理部2で
は、先ず、2値化部21で、観測文字パターンを
M×Nメツシユの各格子点が「0」か「1」を採
る入力文字パターンに変換し、認識対象文字パタ
ーンを1文字だけ切出し、文字切出し部22で、
外接矩形枠によつて囲まれた文字パターンを切出
す。即ち、第3図に示すように、.M×Nメツシ
ユの入力文字パターンにおいて、各辺より中心方
向に触手をのばし、最初に文字部分に出合つたと
ころでその辺の外接枠を検出し、このようにして
検出された各外接枠によつて囲まれた部分の情報
を文字パターンとして切出す。この際、各外接枠
の座標x1,x2及びy1,y2が検出される。そして、
切出された文字パターンは、正規化部24で伸縮
処理が施され、大きさの正規化及び位置の正規化
が行なわれるが、本実施例では、文字切出し時に
検出した座標情報に基づき、文字大きさ検出部2
3で、文字の縦横の長さの検出を行なう。即ち、
文字の横長a及び縦長bを、a=(x2−x1+1)
及びb=(y2−y1+1)として求め、これらの値
a及びbを所定の閾値W及びHと比較し、比較結
果に応じて第4図に示すように、文字の大きさを
4段階に分類し、各分類にデイメンシヨンフラグ
Fdを割り当てる。つまり文字大きさ検出部23
では、入力文字パターンをその文字の縦横の長さ
によつて、大文字,縦長文字,横長文字,小文字
に分類し、対応するデイメンシヨンフラグFdを
付すのである。
一方、正規化された文字パターンは、特徴抽出
部3でその特徴パターンが抽出され、この特徴パ
ターンは付されたデイメンシヨンフラグFdと共
に、パターンマツチング部4に送られる。
部3でその特徴パターンが抽出され、この特徴パ
ターンは付されたデイメンシヨンフラグFdと共
に、パターンマツチング部4に送られる。
ところで、辞書部5は、各文字に対応する標準
特徴パターンを記憶するものであるが、この辞書
部5には、文字の大きさ及び縦横の長さの比率に
応じて、標準特徴パターンをグループ毎にまとめ
て記憶している。即ち、第1図に示すように、小
文字「ア」「ヤ」「ヨ」「。」「,」等の標準特徴パタ
ーンをアドレス0〜14の領域51に、縦長文字
「」「1」「(」「)」「:」等の標準特徴パターン
をアドレス15〜24の領域52に、横長文字「一」
「二」「=」等の標準特徴パターンをアドレス25〜
29の領域53に、そして、その他の大文字の標準
特徴パターンをアドレス30〜99までの領域54に
記憶せしめている。
特徴パターンを記憶するものであるが、この辞書
部5には、文字の大きさ及び縦横の長さの比率に
応じて、標準特徴パターンをグループ毎にまとめ
て記憶している。即ち、第1図に示すように、小
文字「ア」「ヤ」「ヨ」「。」「,」等の標準特徴パタ
ーンをアドレス0〜14の領域51に、縦長文字
「」「1」「(」「)」「:」等の標準特徴パターン
をアドレス15〜24の領域52に、横長文字「一」
「二」「=」等の標準特徴パターンをアドレス25〜
29の領域53に、そして、その他の大文字の標準
特徴パターンをアドレス30〜99までの領域54に
記憶せしめている。
又、パターンマツチング部4は、各デイメンシ
ヨンフラグFdに対して、特徴パターンとマツチ
ングすべき標準特徴パターンが記憶されている辞
書部5の領域の先頭アドレスと最終アドレスとを
記憶した対応テーブル41を備えており、この対
応テーブル41には、第5図に示すように、小文
字を示すデイメンシヨンフラグ「11」,縦長文字
を示すデイメンシヨンフラグ「01」,横長文字を
示すデイメンシヨンフラグ「10」に対して、
各々、文字の大きさの分類に対応したグループの
領域51,52,53の各先頭アドレス「0」,
「15」,「25」と、各最終アドレス「14」,「24」,
「29」が記憶されている。そして、大文字のデイ
メンシヨンフラグ「00」に対しては、辞書部5の
全領域の先頭アドレス「0」と最終アドレス
「99」が記憶されている。
ヨンフラグFdに対して、特徴パターンとマツチ
ングすべき標準特徴パターンが記憶されている辞
書部5の領域の先頭アドレスと最終アドレスとを
記憶した対応テーブル41を備えており、この対
応テーブル41には、第5図に示すように、小文
字を示すデイメンシヨンフラグ「11」,縦長文字
を示すデイメンシヨンフラグ「01」,横長文字を
示すデイメンシヨンフラグ「10」に対して、
各々、文字の大きさの分類に対応したグループの
領域51,52,53の各先頭アドレス「0」,
「15」,「25」と、各最終アドレス「14」,「24」,
「29」が記憶されている。そして、大文字のデイ
メンシヨンフラグ「00」に対しては、辞書部5の
全領域の先頭アドレス「0」と最終アドレス
「99」が記憶されている。
そこで、パターンマツチング部4に、入力文字
パターンの特徴パターン及びその文字の大きさの
分類を示すデイメンシヨンフラグFdが入力され
ると、これらのデータは、一旦バツフア42及び
43に各々格納され、その後、制御部44は入力
されたデイメンシヨンフラグFdに対応する先頭
アドレスを、対応テーブル41を参照して選び出
し、この先頭アドレスをアドレスカウンタ45に
セツトする。例えば、デイメンシヨンフラグ
「01」が入力されたときは、アドレスカウンタ4
5には領域52の先頭アドレス「15」が入力さ
れ、そのアドレスに記憶された標準特徴パターン
が呼び出され、この標準特徴パターンとバツフア
43に記憶された特徴パターンとが、距離計算部
46でパターンマツチングされ、両パターンの距
離が計算される。そして、計算が終了すると、制
御部44はアドレスカウンタ45を順次インクリ
メントしていくので、先頭アドレス「15」に続く
アドレス「16」,「17」,「18」……の各標準特徴パ
ターンと入力特徴パターンとのマツチングが順次
行なわれて行く。そして、アドレスカウンタ45
の値が対応テーブル41に記憶された領域52の
最終アドレス「24」となり、そのアドレスに記憶
された標準特徴パターンとのマツチングが終了す
ると、パターンマツチング部4は処理を終了す
る。従つてこの場合、入力された特徴パターン
は、縦長文字のグループの標準特徴パターンとだ
けマツチングされることとなる。
パターンの特徴パターン及びその文字の大きさの
分類を示すデイメンシヨンフラグFdが入力され
ると、これらのデータは、一旦バツフア42及び
43に各々格納され、その後、制御部44は入力
されたデイメンシヨンフラグFdに対応する先頭
アドレスを、対応テーブル41を参照して選び出
し、この先頭アドレスをアドレスカウンタ45に
セツトする。例えば、デイメンシヨンフラグ
「01」が入力されたときは、アドレスカウンタ4
5には領域52の先頭アドレス「15」が入力さ
れ、そのアドレスに記憶された標準特徴パターン
が呼び出され、この標準特徴パターンとバツフア
43に記憶された特徴パターンとが、距離計算部
46でパターンマツチングされ、両パターンの距
離が計算される。そして、計算が終了すると、制
御部44はアドレスカウンタ45を順次インクリ
メントしていくので、先頭アドレス「15」に続く
アドレス「16」,「17」,「18」……の各標準特徴パ
ターンと入力特徴パターンとのマツチングが順次
行なわれて行く。そして、アドレスカウンタ45
の値が対応テーブル41に記憶された領域52の
最終アドレス「24」となり、そのアドレスに記憶
された標準特徴パターンとのマツチングが終了す
ると、パターンマツチング部4は処理を終了す
る。従つてこの場合、入力された特徴パターン
は、縦長文字のグループの標準特徴パターンとだ
けマツチングされることとなる。
又、入力文字に付されたデイメンシヨンフラグ
Fdが「10」のときは、アドレスカウンタ45に
は、先頭アドレスとしてアドレス「25」がセツト
され、以降最終アドレス「29」まで順次インクリ
メントされるので、この場合、横長文字のグルー
プの標準特徴パターンとだけ入力特徴パターンは
マツチングされることとなり、同様に、デイメン
シヨンフラグFdが「11」のときは、小文字のグ
ループの標準特徴パターンとだけマツチングが行
なわれる。
Fdが「10」のときは、アドレスカウンタ45に
は、先頭アドレスとしてアドレス「25」がセツト
され、以降最終アドレス「29」まで順次インクリ
メントされるので、この場合、横長文字のグルー
プの標準特徴パターンとだけ入力特徴パターンは
マツチングされることとなり、同様に、デイメン
シヨンフラグFdが「11」のときは、小文字のグ
ループの標準特徴パターンとだけマツチングが行
なわれる。
このように、入力文字が縦長文字,横長文字,
小文字である場合は、入力文字の特徴パターン
は、辞書部5の対応するグループの標準特徴パタ
ーンとしかマツチングが行なわれず、マツチング
すべき辞書部5の範囲が限定される。尚、本実施
例では、入力文字が大文字であるときは、辞書部
5の全範囲とマツチングが行なわれる。
小文字である場合は、入力文字の特徴パターン
は、辞書部5の対応するグループの標準特徴パタ
ーンとしかマツチングが行なわれず、マツチング
すべき辞書部5の範囲が限定される。尚、本実施
例では、入力文字が大文字であるときは、辞書部
5の全範囲とマツチングが行なわれる。
そして、距離計算部46で計算されたパターン
間の距離は、マツチングした標準特徴パターンに
対応して決定される文字番号と対にして、順次、
識別部6に送られ、結果として、マツチングした
標準特徴パターンの数と同一の数の文字番号及び
距離が、識別部6のバツフア61に貯えられる。
識別部6は、入力された全ての距離を比較し、そ
の距離が最小値となるものを識別し、対応する文
字番号に基づいて、文字コードメモリ7を検索す
る。文字コードメモリ7は文字番号順に対応する
文字コードを記憶しており、検索により距離が最
小値である文字コードが選び出され、この文字コ
ードが認識結果として外部に出力される。
間の距離は、マツチングした標準特徴パターンに
対応して決定される文字番号と対にして、順次、
識別部6に送られ、結果として、マツチングした
標準特徴パターンの数と同一の数の文字番号及び
距離が、識別部6のバツフア61に貯えられる。
識別部6は、入力された全ての距離を比較し、そ
の距離が最小値となるものを識別し、対応する文
字番号に基づいて、文字コードメモリ7を検索す
る。文字コードメモリ7は文字番号順に対応する
文字コードを記憶しており、検索により距離が最
小値である文字コードが選び出され、この文字コ
ードが認識結果として外部に出力される。
ところで、本実施例では、前処理部2の正規化
部24で、大きさの正規化を行なうため、正期化
後の文字パターンは、大文字と小文字、例えば
「ア」と「ア」あるいは「ツ」と「ツ」で同一と
なり、特徴パターンも同一となる。このため、標
準特徴パターンとしては、大文字と小文字に対し
て、共通に使用することが可能である。そこで、
辞書部5の大文字グループの領域54には、小文
字になり得る文字の標準特徴パターンを記憶せ
ず、小文字グループの領域51の標準特徴パター
ンを兼用するようにし、入力文字が大文字の場合
は、上記したように、領域54だけでなく領域5
1の標準特徴パターンともマツチングを行なうよ
うにしている。しかしながら、認識結果が大文字
であるか小文字であるかを判断しなくてはならな
いため、本実施例では、文字番号ポインタ47を
用い、大文字と小文字で異なる文字番号を出力す
るようにしている。即ち、デイメンシヨンフラグ
Fdが大文字を示す「00」のときは、文字番号ポ
インタ47に初期値として「0」をセツトし、小
文字を示す「11」のときは、初期値として「100」
をセツトするようにし、アドレスカウンタ45を
インクリメントとすると同時に文字番号ポインタ
47をインクリメントするようにする。そして、
更に、文字コードメモリ7には、「ア」「ツ」「ヤ」
等の大文字に対応する文字コードを文字番号0,
1,2……に対応させて記憶し、「ア」「ツ」「ヤ」
等の小文字に対応する文字コードを文字番号100,
101,102……に対応させて記憶しておくのであ
る。このようにすれば、パターンマツチング部4
では、「ア」と「ア」あるいは「ツ」と「ツ」等
のように字形が同一である大文字と小文字のパタ
ーンマツチングが、同一の標準特徴パターンを用
いて行なわれ、且つ、デイメンシヨンフラグに応
じて大文字と小文字で異なる文字番号が出力され
るので、識別部6からは大文字と小文字に対応し
た異なる文字コードが認識結果として出力される
ようになる。尚、縦長文字及び横長文字の場合
は、文字番号ポインタ47に、各々、「15」及び
「25」を初期値としてセツトすればよい。勿論、
文字番号としては、辞書部5のアドレスそのもの
を必ずしも用いる必要はなく、このアドレスを演
算あるいはテーブルにより変換した値を文字番号
として用いてもよい。
部24で、大きさの正規化を行なうため、正期化
後の文字パターンは、大文字と小文字、例えば
「ア」と「ア」あるいは「ツ」と「ツ」で同一と
なり、特徴パターンも同一となる。このため、標
準特徴パターンとしては、大文字と小文字に対し
て、共通に使用することが可能である。そこで、
辞書部5の大文字グループの領域54には、小文
字になり得る文字の標準特徴パターンを記憶せ
ず、小文字グループの領域51の標準特徴パター
ンを兼用するようにし、入力文字が大文字の場合
は、上記したように、領域54だけでなく領域5
1の標準特徴パターンともマツチングを行なうよ
うにしている。しかしながら、認識結果が大文字
であるか小文字であるかを判断しなくてはならな
いため、本実施例では、文字番号ポインタ47を
用い、大文字と小文字で異なる文字番号を出力す
るようにしている。即ち、デイメンシヨンフラグ
Fdが大文字を示す「00」のときは、文字番号ポ
インタ47に初期値として「0」をセツトし、小
文字を示す「11」のときは、初期値として「100」
をセツトするようにし、アドレスカウンタ45を
インクリメントとすると同時に文字番号ポインタ
47をインクリメントするようにする。そして、
更に、文字コードメモリ7には、「ア」「ツ」「ヤ」
等の大文字に対応する文字コードを文字番号0,
1,2……に対応させて記憶し、「ア」「ツ」「ヤ」
等の小文字に対応する文字コードを文字番号100,
101,102……に対応させて記憶しておくのであ
る。このようにすれば、パターンマツチング部4
では、「ア」と「ア」あるいは「ツ」と「ツ」等
のように字形が同一である大文字と小文字のパタ
ーンマツチングが、同一の標準特徴パターンを用
いて行なわれ、且つ、デイメンシヨンフラグに応
じて大文字と小文字で異なる文字番号が出力され
るので、識別部6からは大文字と小文字に対応し
た異なる文字コードが認識結果として出力される
ようになる。尚、縦長文字及び横長文字の場合
は、文字番号ポインタ47に、各々、「15」及び
「25」を初期値としてセツトすればよい。勿論、
文字番号としては、辞書部5のアドレスそのもの
を必ずしも用いる必要はなく、このアドレスを演
算あるいはテーブルにより変換した値を文字番号
として用いてもよい。
ここで、小文字グループの領域51に記憶した
標準特徴パターンのうち、「ア」「ツ」等のように
大文字にもなり得る文字の標準特徴パターンを、
大文字グループの領域54にも記憶しておき、入
力文字が大文字である場合は、マツチングすべき
範囲を辞書部5の大文字グループの領域だけに限
定してもよい。
標準特徴パターンのうち、「ア」「ツ」等のように
大文字にもなり得る文字の標準特徴パターンを、
大文字グループの領域54にも記憶しておき、入
力文字が大文字である場合は、マツチングすべき
範囲を辞書部5の大文字グループの領域だけに限
定してもよい。
次に、本発明を用いた認識実験の一例を示して
おく。
おく。
原稿としては、13mm角の記入枠に手書き文字を
書き、これを解像度が8本/mmのCCDイメージ
センサーにより走査するのである。この場合、M
×NメツシユのM及びN値は「96」となり、認識
対象として、カタカナ,アルフアベツト,数字,
小文字,記号の計138文字種を用いると、従来の
方式では、認識率が92%で認識速度が0.4秒/1
文字であつたが、本発明の方式を用い、閾値W及
びHを「32」とすると、小文字,縦長文字,横長
文字については、認識率が99%、認識速度が0.1
秒/1文字と飛躍的に向上した。
書き、これを解像度が8本/mmのCCDイメージ
センサーにより走査するのである。この場合、M
×NメツシユのM及びN値は「96」となり、認識
対象として、カタカナ,アルフアベツト,数字,
小文字,記号の計138文字種を用いると、従来の
方式では、認識率が92%で認識速度が0.4秒/1
文字であつたが、本発明の方式を用い、閾値W及
びHを「32」とすると、小文字,縦長文字,横長
文字については、認識率が99%、認識速度が0.1
秒/1文字と飛躍的に向上した。
(ヘ) 発明の効果
本発明による文字認識装置のパターンマツチン
グ方式によれば、入力文字の大きさに応じて、特
徴パターンとマツチングする標準特徴パターンの
数が限定されるので、類似文字による誤認識が防
止されて認識率が向上すると共に、認識速度が極
めて速くなる。又、本発明では、マツチングする
標準特徴パターンの数を限定することが、非常に
簡単な処理で実現できる。更に、標準特徴パター
ンとしては各字種に対して唯一持てばよいので、
辞書部の容量は必要最小限でよく、従つて、シス
テム全体を小型化することが可能となる。
グ方式によれば、入力文字の大きさに応じて、特
徴パターンとマツチングする標準特徴パターンの
数が限定されるので、類似文字による誤認識が防
止されて認識率が向上すると共に、認識速度が極
めて速くなる。又、本発明では、マツチングする
標準特徴パターンの数を限定することが、非常に
簡単な処理で実現できる。更に、標準特徴パター
ンとしては各字種に対して唯一持てばよいので、
辞書部の容量は必要最小限でよく、従つて、シス
テム全体を小型化することが可能となる。
第1図は本発明の一実施例を実現するための文
字認識装置全体の構成を示すブロツク図、第2図
は入力原稿のフオーマツトを示す図、第3図は入
力文字パターンを示す説明図、第4図はデイメン
シヨンフラグの決定方法を示す説明図、第5図は
対応テーブルの内容を示す図である。 主な図番の説明、1……文字観測部、2……前
処理部、3……特徴抽出部、4……パターンマツ
チング部、5……辞書部、6……識別部、7……
文字コードメモリ。
字認識装置全体の構成を示すブロツク図、第2図
は入力原稿のフオーマツトを示す図、第3図は入
力文字パターンを示す説明図、第4図はデイメン
シヨンフラグの決定方法を示す説明図、第5図は
対応テーブルの内容を示す図である。 主な図番の説明、1……文字観測部、2……前
処理部、3……特徴抽出部、4……パターンマツ
チング部、5……辞書部、6……識別部、7……
文字コードメモリ。
Claims (1)
- 1 縦長文字の標準特徴パターンを記憶した第1
の領域と、横長文字の標準特徴パターンを記憶し
た第2の領域と、縦長文字及び横長文字以外の標
準特徴パターンを記憶した第3の領域とを有する
辞書部を備え、入力文字パターンから抽出した特
徴パターンを、前記辞書部に登録された標準特徴
パターンとマツチングして、文字の認識を行う文
字認識装置において、前記入力文字パターンの縦
横の長さを検出して該文字が縦長文字又は横長文
字であることを判別する手段を設け、該手段によ
り入力文字が縦長文字であると判別されたとき
は、前記マツチングの範囲を前記第1の領域に限
定し、横長文字であると判別されたときは、前記
マツチングの範囲を前記第2の領域に限定するこ
とを特徴とする文字認識装置のパターンマツチン
グ方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59094916A JPS60238986A (ja) | 1984-05-11 | 1984-05-11 | 文字認識装置のパタ−ンマツチング方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59094916A JPS60238986A (ja) | 1984-05-11 | 1984-05-11 | 文字認識装置のパタ−ンマツチング方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60238986A JPS60238986A (ja) | 1985-11-27 |
JPH0436432B2 true JPH0436432B2 (ja) | 1992-06-16 |
Family
ID=14123320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59094916A Granted JPS60238986A (ja) | 1984-05-11 | 1984-05-11 | 文字認識装置のパタ−ンマツチング方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60238986A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62154186A (ja) * | 1985-12-27 | 1987-07-09 | Matsushita Electric Ind Co Ltd | マツチング回路 |
JPH01114991A (ja) * | 1987-10-29 | 1989-05-08 | Fuji Electric Co Ltd | 大文字,小文字の判別方法 |
CA2153684C (en) * | 1993-12-01 | 2000-03-21 | John L. C. Seybold | Combined dictionary based and likely character string method of handwriting recognition |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5882382A (ja) * | 1981-11-12 | 1983-05-17 | ロ−レルバンクマシン株式会社 | 紙幣整理集積装置 |
-
1984
- 1984-05-11 JP JP59094916A patent/JPS60238986A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5882382A (ja) * | 1981-11-12 | 1983-05-17 | ロ−レルバンクマシン株式会社 | 紙幣整理集積装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS60238986A (ja) | 1985-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2713622B2 (ja) | 表形式文書読取装置 | |
US4757551A (en) | Character recognition method and system capable of recognizing slant characters | |
JPH0436432B2 (ja) | ||
KR19980058361A (ko) | 한글 문자 인식 방법 및 시스템 | |
JPH0436431B2 (ja) | ||
JP2917427B2 (ja) | 図面読取装置 | |
JPH0728935A (ja) | 文書画像処理装置 | |
JPH0632070B2 (ja) | 文字認識装置 | |
JP2788506B2 (ja) | 文字認識装置 | |
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JPH07168911A (ja) | 文書認識装置 | |
JP3140079B2 (ja) | 罫線認識方法及び表処理方法 | |
JPS6254380A (ja) | 文字認識装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JPH0564396B2 (ja) | ||
JP2697790B2 (ja) | 文字タイプ決定方法 | |
JP2827288B2 (ja) | 文字認識装置 | |
JP2972443B2 (ja) | 文字認識装置 | |
JPH0632074B2 (ja) | 正規化方法 | |
JPH10171924A (ja) | 文字認識装置 | |
JP2570311B2 (ja) | 文字列認識装置 | |
JPH01201789A (ja) | 文字読取装置 | |
JPS59128682A (ja) | 文字読取り装置 | |
JPH03111983A (ja) | 類似文字識別方法 | |
JPS62169285A (ja) | 文書処理装置 |