JPH0436432B2 - - Google Patents

Info

Publication number
JPH0436432B2
JPH0436432B2 JP59094916A JP9491684A JPH0436432B2 JP H0436432 B2 JPH0436432 B2 JP H0436432B2 JP 59094916 A JP59094916 A JP 59094916A JP 9491684 A JP9491684 A JP 9491684A JP H0436432 B2 JPH0436432 B2 JP H0436432B2
Authority
JP
Japan
Prior art keywords
character
pattern
characters
input
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59094916A
Other languages
English (en)
Other versions
JPS60238986A (ja
Inventor
Hiroshi Matsumura
Tatsunosuke Iwahara
Katsuharu Aoki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP59094916A priority Critical patent/JPS60238986A/ja
Publication of JPS60238986A publication Critical patent/JPS60238986A/ja
Publication of JPH0436432B2 publication Critical patent/JPH0436432B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (イ) 産業上の利用分野 本発明は、手書きあるいは印刷による文字を認
識する文字認識装置に係り、特に、特徴パターン
のマツチング方式に関する。
(ロ) 従来技術 一般に、文字認識装置では、入力文字パターン
から特徴パターンを抽出し、得られた特徴パター
ンを、予め辞書部に登録されている標準特徴パタ
ーンとマツチングすることにより、文字の認識を
行なつているが、通常、抽出された特徴パターン
は、辞書部の全ての標準特徴パターンとマツチン
グされるため、認識速度が遅いと共に、類似文字
による誤認識が多く、認識率低下原因の一つとな
つている。
そこで、認識率を向上させるために、従来、特
開昭59−32080号公報に開示されているように、
文字の前後の関係等の文法的な要素を追加した
り、特公昭58−22781号公報に開示されているよ
うに、階層的に特徴パターンの認識を行なう方式
が考えられた。しかしながら、前者では文法的な
辞書部が必要となり、又、後者は各階層毎の標準
特徴パターンを辞書部に登録しておかなければな
らないため、共に辞書部の容量が膨大となり、更
に、手順が複雑となつて認識時間がかかり過ぎ、
従つて、システムが大型にならざるを得ないとい
う欠点があつた。
(ハ) 発明の目的 本発明は、辞書部の容量を増大させることな
く、簡単な処理で認識率を向上させ、且つ、認識
速度を速めることを目的としたものである。
(ニ) 発明の構成 本発明は、縦長文字の標準特徴パターンを記憶
した第1の領域と、横長文字の標準特徴パターン
を記憶した第2の領域と、縦長文字及び横長文字
以外の標準特徴パターンを記憶した第3の領域と
を有する辞書部を備え、入力文字パターンから抽
出した特徴パターンを、前記辞書部に登録された
標準特徴パターンとマツチングして、文字の認識
を行う文字認識装置において、前記入力文字パタ
ーンの縦横の長さを検出して該文字が縦長文字又
は横長文字であることを判別する手段を設け、該
手段により入力文字が縦長文字であると判別され
たときは、前記マツチングの範囲を前記第1の領
域に限定し、横長文字であると判別されたとき
は、前記マツチングの範囲を前記第2の領域に限
定するように構成したものである。
(ホ) 実施例 第1図は、本発明の一実施例を実現するための
文字認識装置全体の構成を示すブロツク図であ
り、1は文字観測部、2は前処理部、3は特徴抽
出部、4はパターンマツチング部、5は辞書部、
6は識別部、7は文字コードメモリである。
認識される文字は、第2図に示すように、文字
の記入枠だけが印刷された原稿用紙8に手書きさ
れ、この手書き文字が文字観測部1に入力され
る。文字観測部1は、CCDイメージセンサー等
により、入力された全ての手書き文字を走査及び
光電変換し、各文字を濃淡に応じた観測文字パタ
ーンに変換し、前処理部2へ送る。前処理部2で
は、先ず、2値化部21で、観測文字パターンを
M×Nメツシユの各格子点が「0」か「1」を採
る入力文字パターンに変換し、認識対象文字パタ
ーンを1文字だけ切出し、文字切出し部22で、
外接矩形枠によつて囲まれた文字パターンを切出
す。即ち、第3図に示すように、.M×Nメツシ
ユの入力文字パターンにおいて、各辺より中心方
向に触手をのばし、最初に文字部分に出合つたと
ころでその辺の外接枠を検出し、このようにして
検出された各外接枠によつて囲まれた部分の情報
を文字パターンとして切出す。この際、各外接枠
の座標x1,x2及びy1,y2が検出される。そして、
切出された文字パターンは、正規化部24で伸縮
処理が施され、大きさの正規化及び位置の正規化
が行なわれるが、本実施例では、文字切出し時に
検出した座標情報に基づき、文字大きさ検出部2
3で、文字の縦横の長さの検出を行なう。即ち、
文字の横長a及び縦長bを、a=(x2−x1+1)
及びb=(y2−y1+1)として求め、これらの値
a及びbを所定の閾値W及びHと比較し、比較結
果に応じて第4図に示すように、文字の大きさを
4段階に分類し、各分類にデイメンシヨンフラグ
Fdを割り当てる。つまり文字大きさ検出部23
では、入力文字パターンをその文字の縦横の長さ
によつて、大文字,縦長文字,横長文字,小文字
に分類し、対応するデイメンシヨンフラグFdを
付すのである。
一方、正規化された文字パターンは、特徴抽出
部3でその特徴パターンが抽出され、この特徴パ
ターンは付されたデイメンシヨンフラグFdと共
に、パターンマツチング部4に送られる。
ところで、辞書部5は、各文字に対応する標準
特徴パターンを記憶するものであるが、この辞書
部5には、文字の大きさ及び縦横の長さの比率に
応じて、標準特徴パターンをグループ毎にまとめ
て記憶している。即ち、第1図に示すように、小
文字「ア」「ヤ」「ヨ」「。」「,」等の標準特徴パタ
ーンをアドレス0〜14の領域51に、縦長文字
「」「1」「(」「)」「:」等の標準特徴パターン
をアドレス15〜24の領域52に、横長文字「一」
「二」「=」等の標準特徴パターンをアドレス25〜
29の領域53に、そして、その他の大文字の標準
特徴パターンをアドレス30〜99までの領域54に
記憶せしめている。
又、パターンマツチング部4は、各デイメンシ
ヨンフラグFdに対して、特徴パターンとマツチ
ングすべき標準特徴パターンが記憶されている辞
書部5の領域の先頭アドレスと最終アドレスとを
記憶した対応テーブル41を備えており、この対
応テーブル41には、第5図に示すように、小文
字を示すデイメンシヨンフラグ「11」,縦長文字
を示すデイメンシヨンフラグ「01」,横長文字を
示すデイメンシヨンフラグ「10」に対して、
各々、文字の大きさの分類に対応したグループの
領域51,52,53の各先頭アドレス「0」,
「15」,「25」と、各最終アドレス「14」,「24」,
「29」が記憶されている。そして、大文字のデイ
メンシヨンフラグ「00」に対しては、辞書部5の
全領域の先頭アドレス「0」と最終アドレス
「99」が記憶されている。
そこで、パターンマツチング部4に、入力文字
パターンの特徴パターン及びその文字の大きさの
分類を示すデイメンシヨンフラグFdが入力され
ると、これらのデータは、一旦バツフア42及び
43に各々格納され、その後、制御部44は入力
されたデイメンシヨンフラグFdに対応する先頭
アドレスを、対応テーブル41を参照して選び出
し、この先頭アドレスをアドレスカウンタ45に
セツトする。例えば、デイメンシヨンフラグ
「01」が入力されたときは、アドレスカウンタ4
5には領域52の先頭アドレス「15」が入力さ
れ、そのアドレスに記憶された標準特徴パターン
が呼び出され、この標準特徴パターンとバツフア
43に記憶された特徴パターンとが、距離計算部
46でパターンマツチングされ、両パターンの距
離が計算される。そして、計算が終了すると、制
御部44はアドレスカウンタ45を順次インクリ
メントしていくので、先頭アドレス「15」に続く
アドレス「16」,「17」,「18」……の各標準特徴パ
ターンと入力特徴パターンとのマツチングが順次
行なわれて行く。そして、アドレスカウンタ45
の値が対応テーブル41に記憶された領域52の
最終アドレス「24」となり、そのアドレスに記憶
された標準特徴パターンとのマツチングが終了す
ると、パターンマツチング部4は処理を終了す
る。従つてこの場合、入力された特徴パターン
は、縦長文字のグループの標準特徴パターンとだ
けマツチングされることとなる。
又、入力文字に付されたデイメンシヨンフラグ
Fdが「10」のときは、アドレスカウンタ45に
は、先頭アドレスとしてアドレス「25」がセツト
され、以降最終アドレス「29」まで順次インクリ
メントされるので、この場合、横長文字のグルー
プの標準特徴パターンとだけ入力特徴パターンは
マツチングされることとなり、同様に、デイメン
シヨンフラグFdが「11」のときは、小文字のグ
ループの標準特徴パターンとだけマツチングが行
なわれる。
このように、入力文字が縦長文字,横長文字,
小文字である場合は、入力文字の特徴パターン
は、辞書部5の対応するグループの標準特徴パタ
ーンとしかマツチングが行なわれず、マツチング
すべき辞書部5の範囲が限定される。尚、本実施
例では、入力文字が大文字であるときは、辞書部
5の全範囲とマツチングが行なわれる。
そして、距離計算部46で計算されたパターン
間の距離は、マツチングした標準特徴パターンに
対応して決定される文字番号と対にして、順次、
識別部6に送られ、結果として、マツチングした
標準特徴パターンの数と同一の数の文字番号及び
距離が、識別部6のバツフア61に貯えられる。
識別部6は、入力された全ての距離を比較し、そ
の距離が最小値となるものを識別し、対応する文
字番号に基づいて、文字コードメモリ7を検索す
る。文字コードメモリ7は文字番号順に対応する
文字コードを記憶しており、検索により距離が最
小値である文字コードが選び出され、この文字コ
ードが認識結果として外部に出力される。
ところで、本実施例では、前処理部2の正規化
部24で、大きさの正規化を行なうため、正期化
後の文字パターンは、大文字と小文字、例えば
「ア」と「ア」あるいは「ツ」と「ツ」で同一と
なり、特徴パターンも同一となる。このため、標
準特徴パターンとしては、大文字と小文字に対し
て、共通に使用することが可能である。そこで、
辞書部5の大文字グループの領域54には、小文
字になり得る文字の標準特徴パターンを記憶せ
ず、小文字グループの領域51の標準特徴パター
ンを兼用するようにし、入力文字が大文字の場合
は、上記したように、領域54だけでなく領域5
1の標準特徴パターンともマツチングを行なうよ
うにしている。しかしながら、認識結果が大文字
であるか小文字であるかを判断しなくてはならな
いため、本実施例では、文字番号ポインタ47を
用い、大文字と小文字で異なる文字番号を出力す
るようにしている。即ち、デイメンシヨンフラグ
Fdが大文字を示す「00」のときは、文字番号ポ
インタ47に初期値として「0」をセツトし、小
文字を示す「11」のときは、初期値として「100」
をセツトするようにし、アドレスカウンタ45を
インクリメントとすると同時に文字番号ポインタ
47をインクリメントするようにする。そして、
更に、文字コードメモリ7には、「ア」「ツ」「ヤ」
等の大文字に対応する文字コードを文字番号0,
1,2……に対応させて記憶し、「ア」「ツ」「ヤ」
等の小文字に対応する文字コードを文字番号100,
101,102……に対応させて記憶しておくのであ
る。このようにすれば、パターンマツチング部4
では、「ア」と「ア」あるいは「ツ」と「ツ」等
のように字形が同一である大文字と小文字のパタ
ーンマツチングが、同一の標準特徴パターンを用
いて行なわれ、且つ、デイメンシヨンフラグに応
じて大文字と小文字で異なる文字番号が出力され
るので、識別部6からは大文字と小文字に対応し
た異なる文字コードが認識結果として出力される
ようになる。尚、縦長文字及び横長文字の場合
は、文字番号ポインタ47に、各々、「15」及び
「25」を初期値としてセツトすればよい。勿論、
文字番号としては、辞書部5のアドレスそのもの
を必ずしも用いる必要はなく、このアドレスを演
算あるいはテーブルにより変換した値を文字番号
として用いてもよい。
ここで、小文字グループの領域51に記憶した
標準特徴パターンのうち、「ア」「ツ」等のように
大文字にもなり得る文字の標準特徴パターンを、
大文字グループの領域54にも記憶しておき、入
力文字が大文字である場合は、マツチングすべき
範囲を辞書部5の大文字グループの領域だけに限
定してもよい。
次に、本発明を用いた認識実験の一例を示して
おく。
原稿としては、13mm角の記入枠に手書き文字を
書き、これを解像度が8本/mmのCCDイメージ
センサーにより走査するのである。この場合、M
×NメツシユのM及びN値は「96」となり、認識
対象として、カタカナ,アルフアベツト,数字,
小文字,記号の計138文字種を用いると、従来の
方式では、認識率が92%で認識速度が0.4秒/1
文字であつたが、本発明の方式を用い、閾値W及
びHを「32」とすると、小文字,縦長文字,横長
文字については、認識率が99%、認識速度が0.1
秒/1文字と飛躍的に向上した。
(ヘ) 発明の効果 本発明による文字認識装置のパターンマツチン
グ方式によれば、入力文字の大きさに応じて、特
徴パターンとマツチングする標準特徴パターンの
数が限定されるので、類似文字による誤認識が防
止されて認識率が向上すると共に、認識速度が極
めて速くなる。又、本発明では、マツチングする
標準特徴パターンの数を限定することが、非常に
簡単な処理で実現できる。更に、標準特徴パター
ンとしては各字種に対して唯一持てばよいので、
辞書部の容量は必要最小限でよく、従つて、シス
テム全体を小型化することが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を実現するための文
字認識装置全体の構成を示すブロツク図、第2図
は入力原稿のフオーマツトを示す図、第3図は入
力文字パターンを示す説明図、第4図はデイメン
シヨンフラグの決定方法を示す説明図、第5図は
対応テーブルの内容を示す図である。 主な図番の説明、1……文字観測部、2……前
処理部、3……特徴抽出部、4……パターンマツ
チング部、5……辞書部、6……識別部、7……
文字コードメモリ。

Claims (1)

    【特許請求の範囲】
  1. 1 縦長文字の標準特徴パターンを記憶した第1
    の領域と、横長文字の標準特徴パターンを記憶し
    た第2の領域と、縦長文字及び横長文字以外の標
    準特徴パターンを記憶した第3の領域とを有する
    辞書部を備え、入力文字パターンから抽出した特
    徴パターンを、前記辞書部に登録された標準特徴
    パターンとマツチングして、文字の認識を行う文
    字認識装置において、前記入力文字パターンの縦
    横の長さを検出して該文字が縦長文字又は横長文
    字であることを判別する手段を設け、該手段によ
    り入力文字が縦長文字であると判別されたとき
    は、前記マツチングの範囲を前記第1の領域に限
    定し、横長文字であると判別されたときは、前記
    マツチングの範囲を前記第2の領域に限定するこ
    とを特徴とする文字認識装置のパターンマツチン
    グ方式。
JP59094916A 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式 Granted JPS60238986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59094916A JPS60238986A (ja) 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59094916A JPS60238986A (ja) 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式

Publications (2)

Publication Number Publication Date
JPS60238986A JPS60238986A (ja) 1985-11-27
JPH0436432B2 true JPH0436432B2 (ja) 1992-06-16

Family

ID=14123320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59094916A Granted JPS60238986A (ja) 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式

Country Status (1)

Country Link
JP (1) JPS60238986A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62154186A (ja) * 1985-12-27 1987-07-09 Matsushita Electric Ind Co Ltd マツチング回路
JPH01114991A (ja) * 1987-10-29 1989-05-08 Fuji Electric Co Ltd 大文字,小文字の判別方法
CA2153684C (en) * 1993-12-01 2000-03-21 John L. C. Seybold Combined dictionary based and likely character string method of handwriting recognition

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882382A (ja) * 1981-11-12 1983-05-17 ロ−レルバンクマシン株式会社 紙幣整理集積装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882382A (ja) * 1981-11-12 1983-05-17 ロ−レルバンクマシン株式会社 紙幣整理集積装置

Also Published As

Publication number Publication date
JPS60238986A (ja) 1985-11-27

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JPH0436432B2 (ja)
KR19980058361A (ko) 한글 문자 인식 방법 및 시스템
JPH0436431B2 (ja)
JP2917427B2 (ja) 図面読取装置
JPH0728935A (ja) 文書画像処理装置
JPH0632070B2 (ja) 文字認識装置
JP2788506B2 (ja) 文字認識装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH07168911A (ja) 文書認識装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JPS6254380A (ja) 文字認識装置
JPH07160810A (ja) 文字認識装置
JPH0564396B2 (ja)
JP2697790B2 (ja) 文字タイプ決定方法
JP2827288B2 (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JPH0632074B2 (ja) 正規化方法
JPH10171924A (ja) 文字認識装置
JP2570311B2 (ja) 文字列認識装置
JPH01201789A (ja) 文字読取装置
JPS59128682A (ja) 文字読取り装置
JPH03111983A (ja) 類似文字識別方法
JPS62169285A (ja) 文書処理装置