JPS60238986A - 文字認識装置のパタ−ンマツチング方式 - Google Patents

文字認識装置のパタ−ンマツチング方式

Info

Publication number
JPS60238986A
JPS60238986A JP59094916A JP9491684A JPS60238986A JP S60238986 A JPS60238986 A JP S60238986A JP 59094916 A JP59094916 A JP 59094916A JP 9491684 A JP9491684 A JP 9491684A JP S60238986 A JPS60238986 A JP S60238986A
Authority
JP
Japan
Prior art keywords
character
pattern
standard feature
characters
feature patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59094916A
Other languages
English (en)
Other versions
JPH0436432B2 (ja
Inventor
Hiroshi Matsumura
松村 博
Tatsunosuke Iwahara
岩原 達之助
Katsuharu Aoki
青木 勝春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Sanyo Electric Co Ltd
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Original Assignee
Tokyo Sanyo Electric Co Ltd
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Sanyo Electric Co Ltd, Sanyo Electric Co Ltd, Sanyo Denki Co Ltd filed Critical Tokyo Sanyo Electric Co Ltd
Priority to JP59094916A priority Critical patent/JPS60238986A/ja
Publication of JPS60238986A publication Critical patent/JPS60238986A/ja
Publication of JPH0436432B2 publication Critical patent/JPH0436432B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は、手書きあるいは印刷による文字を認識する文
字認識装置に係り、特に、特徴パターンのマツチング方
式に関する。
(ロ)従来技術 一般K、文字認識装置では、人力文字パターンから特徴
パターンを抽出し、得られた特徴パターンを、予め辞書
部に登録されている標準特徴パターンとマツチングする
ことにより、文字の認識を行なっているが、通常、抽出
された特徴パターンは、辞書部の全ての標準特徴パター
ンとマツチングされるため、認識速度が遅いと共に、類
似文字による誤認識が多く、認識率低下原因の一つとな
っている。
そこで、認識率を向上させるために、従来、特開昭59
−32080号公報に開示されているように、文字の前
後の関係等の文法的な要素を追加したり、特公昭58−
22781号公報に開示されているように、階層的に特
徴パターンの認識を行なう方式が考えられた。しかしな
がら、前者では文法的な辞書部が必要となり、又、後者
は各階層毎の標準特徴パターンを辞書部に登録しておか
なければならないため、共に辞書部の容量が膨大となり
、更に、手順が複雑となって認識時間がかかり過ぎ、従
って、システムが大型にならざるを得ないという欠点が
あった。
(ハ) 発明の目的 本発明は、辞書部の容量を増大させることなく、簡単な
処理で認識率を向上させ、且つ、認識速度を速めること
を目的としたものである。
に) 発明の構成 本発明は、入力文字パターンから抽出した特徴パターン
を、予め辞書部に登録された標準特徴パターンとマツチ
ングして、文字の認識を行なう文字認識装置において、
文字の大きさ及び縦横の長さの比率に応じて前記標準特
徴パターンをグループ毎Kまとめて前記辞書部に記憶せ
しめておくと共に、前記人力文字パターンの文字の縦横
の長さを検出する手段を設け、前記抽出した特徴パター
ンを前記辞書部の対応するグループの標準特徴パターン
とマツチングするよう罠構成したものである。
(ホ)実施例 第1図は、本発明の一実施例を実現するための文字認識
装置全体の構成を示すブロック図であり、(1)は文字
観測部、(2)は前処理部、(3)は特徴抽出部、(4
)はパターンマツチング部、(5)は辞書部、(6)は
識別部、(7)は文字コードメモリである。
認識される文字は、第2図に示すように、文字の記入枠
だけが印刷された原稿用紙(8)に手書きされ、この手
書き文字が文字観測部(1)に入力される。
文字観測部(1)は、CCDイメージセンサ−等により
、入力された全ての手書き文字を走査及び光電変換し、
各文字を濃淡に応じた観測文字パターンに変換し、前処
理部(2)へ送る。前処理部(2)では、先ず、2値化
部(21)で、観測文字パターンをMXNメツシュの各
格子点が「0」か「1」を採る入力文字パターンに変換
し、認識対象文字パターンを1文字だけ切出し、文字切
出し部(2渇で、外接矩形枠によって囲まれた文字パタ
ーンを切出す。即ち、第3図に示すように、MxNメツ
シーの入力文字パターンにおいて、各辺より中心方向に
触手をのばし、最初に文字部分に出合ったところでその
辺の外接枠を検出し、このようにして検出された各外接
枠によって囲まれた部分の情報を文字パターンとして切
出す。この際、各外接枠の座標xl yX、及びYI 
+Y*が検出される。そして、切出された文字パターン
は、正規化部(財)で伸縮処理が施され、大きさの正規
化及び位置の正規化が行なわれるが、本実施例では、文
字切出し時に検出した座標情報に基づき、文字大きさ検
出部(ハ)で、文字の縦横の長さの検出を行なう。即ち
、文字の横長a及び縦長すを、a=(Xfi −Xl 
+ 1 )及びb=1=(yt −)’+ +1 )と
してめ、これらの値a及びbを所定の閾値W及びHと比
較し、比較結果に応じて第4図に示すように、文字の大
きさを4段階に分類し、各分類にディメンションフラグ
Fdを割り当てる。つまり文字大きさ検出部(ハ)では
、入力文字パターンをその文字の縦横の長さKよって、
大文字、縦長文字、横長文字、小文字に分類し、対応す
るディメンションフラグFdを付すのである。
一方、正規化された文字パターンは、特徴抽出部(3)
でその特徴パターンが抽出され、この特徴パターンは付
されたディメンションフラグFdと共に、パターンマツ
チング部(4)に送られる。
ところで、辞書部(5)は、各文字に対応する標準特徴
パターンを記憶するものであるが、この辞書部(5)に
は、文字の大きさ及び縦横の長さの比率に応じて、標準
特徴パターンをグループ毎にまとめて記憶している。即
ち、第1図に示すように、小文字「ア」 「ヤ」 「ヨ
」 「。」「、」等の標準特徴パターンをアドレスO〜
14の領域6υに、縦長文字rIJ rlJ r(J 
r)j r:J等の標準特徴パターンをアドレス15〜
24の領域53に、横長文字「−」「二」「=j等の標
準特徴パターンをアドレス25〜29の領域53)に、
そして、その他の大文字の標準特徴パターンをアドレス
30〜99までの領域54)に記憶せしめている。
又、パターンマツチング部(4)は、各ディメンション
フラグFdに対して、特徴パターンとマツチングすべき
標準特徴パターンが記憶されている辞書部(5)の領域
の先頭アドレスと最終アドレスとを記憶した対応テーブ
ル(41)を備えており、この対応テーブル(41)に
は、第5図に示すように、小文字を示すディメンション
フラグ「IIJ、縦長文字を示すディメンションフラグ
「01」、横長文字を示すディメンションフラグ「lO
」に対して、各々、文も大きさの分類に対応したグルー
プの領域51) 、 5の、(へ)の各先頭アドレス「
0」、「15」 。
「25」と、各最終アドレス「14」 、「24」。
「29」が記憶されている。そして、大文字のディメン
ションフラグl’−00Jに対しては、辞書部そこで、
パターンマツチング部(4)に、入力文字パターンの特
徴パターン及びその文字の大きさの分類を示すディメン
ションフラグFdが入力されると、これらのデータは、
一旦バッファ(421及び(431に各々格納され、そ
の後、制御部(4(イ)は入力されたディメンションフ
ラグFdに対応する先頭アドレスを、対応テーブル(4
1)を参照して選び出し、この先頭アドレスをアドレス
カウンタ(4!51にセットする。
例えば、ディメンションフラグ「可算」が入力されたど
きは、アドレスカウンタ(451には領域(!+2の先
頭アドレス「15」が入力され、そのアドレスに記憶さ
れた標準特徴パターンが呼び出され、この標準特徴パタ
ーンとバッファ(4りに記憶された特徴パターンとが、
距離計算部(461でパターンマツチングされ、両パタ
ーンの距離が計算される。そして、計算が終了すると、
制御部(44)はアドレスカウンタ(45)を順次イン
クリメントしていくので、先頭アドレスrl 5J K
続くアドレスr+ 6J t r】7」。
「18」・・・・・・の各標準特徴パターンと入力特徴
パターンとのマツチングが順次行なわれて行く。そして
、アドレスカウンタ(4ツの値が対応テーブル回に記憶
された領域521の最終アドレス「24」となり、その
アドレスに記憶された標準特徴パターンとのマツチング
が終了すると、パターンマツチング部(4)は処理を終
了する。従ってこの場合、入力された特徴パターンは、
縦長文字のグループの標準特徴パターンとだけマツチン
グされることとなる。
又、入力文字に付されたディメンションフラグFd#(
rlOJのときは、アドレスカウンタ(4印には、先頭
アドレスとしてアドレス「25」がセットされ、以降最
終アドレス「29」まで順次インクリメントされるので
、この場合、横長文字のグループの標準特徴パターンと
だけ入力特徴パターンはマツチングされることとなり、
同様に、ディメンションフラグFdが「11」のときは
、小文字のグループの標準特徴パターンとだけマツチン
グが行なわれる。
このように、入力文字が縦長文字、横長文字。
小文字である場合は、入力文字の特徴パターンは、辞書
部(5)の対応するグループの標準特徴パターンとしか
マツチングが行なわれず、マツチングすべき辞書部(5
)の範囲が限定される。尚、本実施例では、入力文字が
大文字であるときは、辞書部(5)の全範囲とマツチン
グが行なわれる。
そして、距離計算部(46)で計算されたパターン間の
距離は、マツチングした標準特徴パターンに対応して決
定される文字番号と対にして、順次、識別部(6)に送
られ、結果として、マツチングした標準特徴パターンの
数と同一の数の文字番号及び距離が、識別部(6)のバ
ッファ61)に貯えられる。m別部(6)は、入力され
た全ての距離を比較し、その距離が最小値となるものを
識別し、対応する文字番号に基づいて、文字コードメモ
リ(力を検索する。
文字コードメモリ(力は文字番号順に対応する文字コー
ドを記憶しており、検索により距離が般小値である文字
コードが選び出され、この文字コードが認識結果として
外部に出力される。
ところで、本実施例では、前処理部(2)の正規化部c
!4)で、大きさの正規化を行なうため、正期化後の文
字パターンは、大文字と小文字、例えば「ア」と「ア」
あるいは「ツ」と「ツ」で同一となり、特徴パターンも
同一となる。このため、標準特徴パターンとしては、大
文字と小文字に対して、共通に使用することが可能であ
る。そこで、辞書部(5)の大文字グループの領域64
)には、小文字になり得る文字の標準特徴パターンを記
憶せず、小文字グループの領域51)の標準特徴パター
ンを兼用するようにし、入力文字が大文字の場合は、上
記したように、領域54)だけでなく領域51)の標準
特徴パターンともマツチングを行なうようにしている。
しかしながら、認識結果が大文字であるか小文字である
かを判断しなくてはならないため、本実施例では、文字
番号ポインタ+47)を用い、大文字と小文字で異なる
文字番号を出力するようにしている。
即ち、ディメンションフラグFdが大文字を示す「00
」のときは、文字番号ポインタ(47)に初期値とし℃
「0」をセットし、小文字を示す「11」のときは、初
期値としてl−100Jをセットするようにし、アドレ
スカウンタ(45)をインクリメントとすると同時に文
字番号ポインタ(47)をインクリメントするようKす
る。そして、東に、文字コードメモリ(力には、「ア」
「ツ」 「ヤ」等の大文字に対応する文字コードを文字
番号0,1.2・・・・・・に対応させて記憶し、「ア
」 「ツ」 「ヤ」等の小文字に対応する文字コードを
文字番号100,101.102・・・・・・に対応さ
せて記憶しておくのである。このようにすれば、パター
ンマツチング部(4)では、「ア」と「ア」あるいは「
ツ」と「ツ」等のように字形が同一である大文字と小文
字のパターンマツチングが、同一の標準特徴パターンを
用いて行なわれ、且つ、ディメンションフラグに応じて
大文字と小文字で異なる文字番号が出力されるので、識
別部(6)からは大文字と小文字に対応した異なる文字
コードが認識結果として出力されるようになる。尚、縦
長文字及び横長文字の場合は、文字番号ポインタ(47
)に、各々、「15」及び「25」を初期値としてセッ
トすればよい。勿論、文字番号としては、辞書部(5)
のアドレスそのものを必ずしも用いる必要はなく、この
アドレスを演算あるいはテーブルにより変換した値を文
字番号として用いてもよい。
ここで、小文字グループの領域61)に記憶した標準特
徴パターンのうち、「ア」 「ツ」等のように大文字に
もなり得る文字の標準特徴パターンを、大文字グループ
の領域6aにも記憶しておき、入力文字が大文字である
場合は、マツチングすべき範囲を辞書部(5)の大文字
グループの領域だけに限定してもよい。
次に、本発明を用いた認識実験の一例を示しておく。
原稿としては、13關角の記入枠に手書き文字を書き、
これを解像度が8本/朋のCCUイメージセンサ−によ
り走査するのである。この場合、MXNメツシュのM及
びN値は「96」となり、認識対象Eして、カタカナ、
アルファベット、数字、小文字、記号の計138文字種
を用いると。
従来の方式では、認識率が92%で認識速度が0.4秒
/1文字であったが、本発明の方式を用い、閾値W及び
Hな「32」とすると、小文字、縦長文字、横長文字に
ついては、認識率が99%、認識速度が0.1秒/1文
字と飛躍的に向上した。
(へ)発明の効果 本発明忙よる文字認識装置のパターンマツチング方式に
よれば、入力文字の大きさに応じて、特徴パターンとマ
ツチングする標準特徴パターンの数が限定されるので、
類似文字による誤認識が防止されて認識率が向上すると
共に、認識速度が極めて速くなる。又、本発明では、マ
ツチングする標準特徴パターンの数を限定することが、
非常に簡単な処理で実現できる。更に、標準特徴パター
ンとしては各字種に対して唯−持てばよいので、辞書部
の容量は必要最小限でよく、従って、システム全体を小
型化することが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を実現するための文字認識装
置全体の構成を示すブロック図、第2図は入力原稿のフ
ォーマットを示す図、第3図は入力文字パターンを示す
説明図、第4図はディメンションフラグの決定方法を示
す説明図、第5図は対応テーブルの内容を示す図である
。 主な図番の説明 出願人 三洋電機株式会社 外1名 代理人 弁理士 佐 野 静 夫

Claims (1)

    【特許請求の範囲】
  1. (1)入力文字パターンから抽出した特徴パターンを、
    予め辞書部に登録された標準特徴パターンとマツチング
    して、文字の認識を行なう文字認識装置において、文字
    の大きさ及び縦横の長さの比率に応じて前記標準特徴パ
    ターンをグループ毎にまとめて前記辞書部に記憶せしめ
    ておくと共に、前記入力文字パターンの文字の縦横の長
    さを検出する手段を設け、前記抽出した特徴パターンを
    前記辞書部の対応するグループの標準特徴パターンとマ
    ツチングするよう圧したことを特徴とする文字認識装置
    のパターンマツチング方式。
JP59094916A 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式 Granted JPS60238986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59094916A JPS60238986A (ja) 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59094916A JPS60238986A (ja) 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式

Publications (2)

Publication Number Publication Date
JPS60238986A true JPS60238986A (ja) 1985-11-27
JPH0436432B2 JPH0436432B2 (ja) 1992-06-16

Family

ID=14123320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59094916A Granted JPS60238986A (ja) 1984-05-11 1984-05-11 文字認識装置のパタ−ンマツチング方式

Country Status (1)

Country Link
JP (1) JPS60238986A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62154186A (ja) * 1985-12-27 1987-07-09 Matsushita Electric Ind Co Ltd マツチング回路
JPH01114991A (ja) * 1987-10-29 1989-05-08 Fuji Electric Co Ltd 大文字,小文字の判別方法
US6005973A (en) * 1993-12-01 1999-12-21 Motorola, Inc. Combined dictionary based and likely character string method of handwriting recognition

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882382A (ja) * 1981-11-12 1983-05-17 ロ−レルバンクマシン株式会社 紙幣整理集積装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882382A (ja) * 1981-11-12 1983-05-17 ロ−レルバンクマシン株式会社 紙幣整理集積装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62154186A (ja) * 1985-12-27 1987-07-09 Matsushita Electric Ind Co Ltd マツチング回路
JPH01114991A (ja) * 1987-10-29 1989-05-08 Fuji Electric Co Ltd 大文字,小文字の判別方法
US6005973A (en) * 1993-12-01 1999-12-21 Motorola, Inc. Combined dictionary based and likely character string method of handwriting recognition

Also Published As

Publication number Publication date
JPH0436432B2 (ja) 1992-06-16

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
JPS60238986A (ja) 文字認識装置のパタ−ンマツチング方式
JPH0436431B2 (ja)
JPH0548510B2 (ja)
JPH0564396B2 (ja)
JPH0728935A (ja) 文書画像処理装置
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JPH01201789A (ja) 文字読取装置
JPH07160810A (ja) 文字認識装置
JPH07168911A (ja) 文書認識装置
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP2972443B2 (ja) 文字認識装置
JP2832035B2 (ja) 文字認識装置
JPS59128682A (ja) 文字読取り装置
JPS63136286A (ja) オンライン文字認識方式
JPH01124082A (ja) 文字認識装置
JPH05114047A (ja) 文字切り出し装置
JPH03111983A (ja) 類似文字識別方法
JPH02166583A (ja) 文字認識装置
JPS60110089A (ja) 文字認識装置
JPH0550785B2 (ja)
JPH07104911B2 (ja) パタ−ン認識装置
JPS63208181A (ja) パターン認識方法及び情報処理装置
JPS59109979A (ja) 文字分類処理方式