JP2940974B2 - マッチング方法 - Google Patents

マッチング方法

Info

Publication number
JP2940974B2
JP2940974B2 JP2016568A JP1656890A JP2940974B2 JP 2940974 B2 JP2940974 B2 JP 2940974B2 JP 2016568 A JP2016568 A JP 2016568A JP 1656890 A JP1656890 A JP 1656890A JP 2940974 B2 JP2940974 B2 JP 2940974B2
Authority
JP
Japan
Prior art keywords
character
class
standard
character image
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2016568A
Other languages
English (en)
Other versions
JPH03220685A (ja
Inventor
正之 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2016568A priority Critical patent/JP2940974B2/ja
Publication of JPH03220685A publication Critical patent/JPH03220685A/ja
Application granted granted Critical
Publication of JP2940974B2 publication Critical patent/JP2940974B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、認識対象文字イメージの特徴パターンと辞
書に格納されている標準特徴パターン(テンプレート)
とのマッチング処理により、距離の小さい候補文字を決
定し、マッチング処理の距離演算の打ち切りをその時点
の最下位候補文字の距離を閾値として判定する方式(ダ
イナミックスレッシュ方式)の文字認識装置に関する。
〔従来の技術及び発明が解決しようとする課題〕
この種の文字認識装置は、距離演算の打ち切り判定閾
値を固定する方式に比べ、無駄な距離演算時間を減らし
マッチング処理を高速化することができる。しかし、ダ
イナミックスレッシュ(動的閾値)方式によっても、文
字数並びに文字の特徴量が著しく多い漢字OCR等におい
ては、認識処理速度が不足しているのが実情である。
よって本発明の目的は、ダイナミックスレッシュ方式
による時間節約効果を最大限発揮させ、より高速の文字
認識処理を達成するためのマッチング方法を提供するこ
とにある。
なお、この目的を達成する手段として、特徴パターン
の類似した文字を集めてクラス分けし、各クラスに属す
る文字の特徴パターンを代表するクラス特徴パターンを
用意し、まず、認識対象文字の特徴パターンとクラス特
徴パターンとのマッチング(一種の大分類)をして距離
の小さい順にクラスの優先順位を決定し、この優先順位
の高いクラスから順に、該当クラス所属文字の標準特徴
パターン(テンプレート)とのマッチングを実行する方
式が考案されている(特願昭63−275133号)。
この方式によれば、正解の可能性の高い候補文字を早
期に得て距離演算打ち切りの判定閾値を速やかに減少さ
せ、無駄な距離演算時間の節約効果の向上を期待でき
る。しかし、その反面、クラス特徴パターンのメモリが
必要であるほか、クラス特徴パターンとのマッチング処
理と各クラス別の文字の標準特徴パターンとのマッチン
グ処理を別々に扱わなければならないため、制御の複雑
化が避けられない。
本発明のもう一つの目的は、このような制御の複雑化
及びメモリ容量の増加を排除しつつ、ダイナミックスレ
ッシュ方式の効果を最大限に発揮させるマッチング方法
を提供することである。
〔課題を解決するための手段〕
本発明は、認識対象文字イメージの輪郭に方向コード
を付け、この方向コードから特徴パターンを生成し、こ
れと辞書とのマッチングをダイナミックスレッシュ方式
で行う文字認識処理において、標準特徴パターンの生成
時に算出した当該標準文字イメージの方向コードの総数
(輪郭につけられた全ての方向の方向コードの数で、以
下、方向コード数と称す)により、あらかじめ辞書をク
ラス分けし、各認識対象文字イメージについて、当該特
徴パターン生成時に算出された方向コード数によってマ
ッチング処理を実行するクラス順を決定し、該決定され
たクラス順に実行することを特徴とする。
〔作 用〕
認識対象文字イメージの輪郭につけた方向コードによ
って生成する特徴パターンを採用した場合、マッチング
によって上位の候補となる可能性の高い文字は当然に方
向コード数が認識対象文字の方向コード数と近いはずで
ある。
したがって、方向コード数によって辞書をクラス分け
し、認識対象文字イメージの輪郭につけた方向コードの
個数と方向コード数が近いクラスを優先してマッチング
処理を実行すれば、殆どの場合に正解の確率の高い候補
文字を早い時点で得て、距離演算打ち切り判定の閾値を
十分に小さくすることができるため、正解の可能性の小
さい文字に対する無駄な距離演算時間が大幅に減り、マ
ッチング処理時間が大幅に短縮される。
また、大分類のためのマッチング処理を詳細マッチン
グ処理と別に行わないので制御が複雑化する心配はな
く、またクラス特徴パターンの格納メモリを必要としな
い。
〔実施例〕
第1図は本発明の一実施例に係るマッチング処理系の
ブロック図である。
1は認識対象文字イメージの特徴抽出によって得られ
た特徴パターンが格納される特徴パターンメモリであ
る。この特徴パターンは認識対象文字イメージの輪郭に
方向コードをつけ、方向コード別のヒストグラムを求め
る等の方法によって生成されるが、その際に輪郭につけ
られた方向コードの総数(方向コード数)も計算され
る。
2は各文字の標準特徴パターン(テンプレート)と文
字コードよりなる辞書を格納する辞書メモリである。テ
ンプレートの生成時にも文字イメージの輪郭につけられ
た方向コードの個数が計算され、辞書は方向コード数に
より複数のクラスに分けられ、各クラスに所属するテン
プレート及び文字コードは、方向コード数の多いクラス
順または少ないクラス順に辞書内に登録されている。各
クラスのテンプレート数及び辞書内の登録位置は固定し
ている。
3は辞書メモリ2及び特徴パターンメモリ1に対する
アドレスを生成するメモリアドレス生成回路である。4
は特徴パターン及びテンプレートの次元毎の距離データ
を得るための距離テーブルメモリ、5は特徴パターンと
テンプレートの対応した1次元のデータを合成して距離
テーブルメモリ4にアドレスとして与える距離テーブル
アドレスレジスタである。
6及び7は次元毎の距離データの累積加算を行うため
の加算器及びアキュムレータである。8は文字コードと
距離データを距離値の小さい順にソートして保持するソ
ーティング回路、9はダイナミックスレッシュによる距
離演算打ち切り判定すなわちアキュムレータ7に得られ
た距離データとソーティング回路8に得られた最下位候
補文字の距離データとの比較判定を行う比較回路であ
る。
10はマッチング処理系全体の制御、系外部との通信並
びに方向コード数によりマッチング処理を実行するクラ
ス順の決定を行うコントロール回路である。クラスの優
先順位は、例えば認識対象文字イメージの特徴パターン
生成時に計算された方向コード数い近いクラスほど優先
するように決定する。ただし、最も方向コード数が近い
クラスを第1位とし、残りのクラスの順位を固定するな
どの方法とすることも可能である。
第2図はメモリアドレス生成回路3のブロック図であ
る。11はクラスの番号とそれに所属するテンプレート数
をマッチング処理の順に記憶するFIFOメモリ、12はマッ
チング処理実行中のクラスが辞書内で何番目にあるクラ
スであるかを示すクラス番号レジスタ、13はマッチング
処理実行中のテンプレートがクラス内で何番目のテンプ
レートであるかを示すテンプレート番号カウンタ、14は
テンプレート内で何番目のデータ(次元番号)であるか
を示す最下位アドレスカウンタ、15はマッチング処理実
行中のクラス内の残りのテンプレート数を保持するクラ
ス内テンプレートカウンタである。
なお、コントロール回路10内には、特徴パターンの処
理すべき残りバイト(次元)数を保持する次元カウンタ
10Aがある。
次に動作を説明する。
動作ステップ コントロール回路10は、認識対象文字イメージの方向
コード数に従ってマッチング処理を実行するクラス順を
決定し、その順番に従って各クラスの番号とテンプレー
ト数を辞書アドレス生成回路3内のFIFOメモリ11に書込
み、次に認識対象文字イメージの特徴パターンを特徴パ
ターンメモリ1に書き込む。
動作ステップ コントロール回路10は、辞書アドレス生成回路3内の
テンプレート番号カウンタ15及び最下位アドレスアウン
タ14を初期化し、FIFOメモリ11より処理する一つのクラ
スの番号及びテンプレート数を読み出してクラス番号レ
ジスタ12及びクラス内テンプレートカウンタ15にセット
する。
特徴パターンメモリ1は最下位アドレスカウンタ14の
値によりアドレッシングされ、辞書メモリ2はクラス番
号レジスタ12、テンプレート番号カウンタ13及び最下位
アドレッシングカウンタ14の合成値によりアドレッシン
グされる。
動作ステップ 特徴パターンメモリ1より特徴パターンの一つの次元
(最下位アドレスカウンタ14の値により指定される)の
データが読み出され、辞書メモリ2より一つのクラス
(クラス番号レジスタ12の値で指定される)に所属する
一つのテンプレート(テンプレート番号カウンタ13で指
定される)の一つの対応した次元(最下位アドレスカウ
ンタ14の値で指定される)のデータが読み出され、それ
ぞれ距離テーブルアドレスレジスタ5にセットされる。
動作ステップ 距離テーブメモリ4は距離テーブルアドレスレジスタ
5の値によりアドレッシングされることにより距離デー
タを出力する。この距離データは加算回路6によってア
キュムレータ7の値に加算され、その結果がアキュムレ
ータ7に保持されるとともに、比較回路9によって最下
位候補文字の距離データと比較される。
アキュムレータ7の値が最下位候補文字の距離データ
(判定閾値)より小さいときは、コントロール回路10は
最下位アドレスカウンタ14の値を1だけ増加させるとと
もに次元カウンタ10Aの値を1だけ減らして動作ステッ
プに戻り、次次元の処理を開始させる。コントロール
回路10は、次元カウンタ10Aが0になったときに(一つ
のテンプレートについての距離演算が最終次元まで終了
したときに)動作ステップの制御に遷移するが、アキ
ュムレータ7の値が判定閾値を越えたとき(途中打ち切
りと判定されたとき)には動作ステップの制御へ遷移
する。
動作ステップ コントロール回路10は、アキュムレータ7内の距離デ
ータをキーとして、この距離データと辞書メモリ2より
出力された文字コードとのソートをソーティング回路8
に行わせ、候補データを更新する。
動作ステップ コントロール回路10は、最下位アドレスカウンタ14及
び次元カウンタ10Aを初期化するとともにテンプレート
番号カウンタ13の値を1だけ増加させ、クラス内テンプ
レートカウンタ15の値を1だけ減らし、動作ステップ
の制御に遷移する。ただし、クラス内テンプレートカン
ウンタ15の値が0になったときは、動作ステップの制
御に遷移し、次のクラスについてのマッチング処理を開
始する。次に処理すべきクラスが残っていないときは処
理を終了する。
なお、認識対象文字に対する方向コード数の差が一定
値を越え、候補となる可能性が低いクラスはマッチング
処理を実行しないようにしてよい。
また、あるクラスに所属する文字のテンプレートを、
方向コード数の差が小さい別のクラスに重複して所属さ
せることも可能である。
〔発明の効果〕
以上説明した如く、本発明よれば、単純に文字輪郭の
方向コードの総数(方向コード数)によって辞書をクラ
ス分けし、認識対象文字イメージの輪郭につけられた方
向コードの個数によって決定したクラス順にマッチング
処理を実行することにより、処理が簡単で、距離演算打
ち切り判定閾値を早期に減少させ、ダイナミックスレッ
シュによる処理時間短縮効果を最大限に発揮させてマッ
チング処理を大幅に高速化することができ、また大分類
のためのマッチング処理を行う方式の課題であった制御
の複雑化とメモリ増加を解決できる。
【図面の簡単な説明】
第1図は本発明の一実施例に係るマッチング処理系のブ
ロック図、第2図はアドレス生成回路のブロック図であ
る。 1……特徴パターンメモリ、2……辞書メモリ、 3……メモリアドレス生成回路、 4……距離テーブルメモリ、 5……距離テーブルアドレスレジスタ、 6……加算器、7……アキュムレータ、 8……ソーティング回路、9……比較回路、 10……コントロール回路、 10A……次元カウンタ、 11……FIFOメモリ、 12……クラス番号レジスタ、 13……テンプレート番号カウンタ、 14……最下位アドレスカウンタ、 15……クラス内テンプレートカウンタ。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/48 G06K 9/62 G06K 9/68

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象文字イメージの輪郭に方向コード
    をつけ、該方向コードから特徴パターンを生成し、該生
    成された認識対象文字イメージの特徴パターンと辞書に
    登録された各標準文字の標準特徴パターンとのマッチン
    グ処理により距離の小さい候補文字を決定するマッチン
    グ方法において、 各標準文字の標準特徴パターンを登録した辞書を、標準
    特徴パターンを生成する際に当該標準文字イメージの輪
    郭につけられた方向コードの総数(以下、方向コード数
    という)によってクラス分けし、 各認識対象文字イメージについて、当該認識対象文字イ
    メージの特徴パターン生成時に算出された方向コード数
    によってマッチング処理を実行するクラス順を決定し、 前記決定されたクラス順に、認識対象文字イメージの特
    徴パターンと辞書に登録された各標準文字の標準特徴パ
    ターンとのマッチング処理を実行し、該マッチング処理
    の距離演算を最下位候補文字の距離を判定閾値として打
    ち切ることを特徴とするマッチング方法。
JP2016568A 1990-01-26 1990-01-26 マッチング方法 Expired - Lifetime JP2940974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016568A JP2940974B2 (ja) 1990-01-26 1990-01-26 マッチング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016568A JP2940974B2 (ja) 1990-01-26 1990-01-26 マッチング方法

Publications (2)

Publication Number Publication Date
JPH03220685A JPH03220685A (ja) 1991-09-27
JP2940974B2 true JP2940974B2 (ja) 1999-08-25

Family

ID=11919895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016568A Expired - Lifetime JP2940974B2 (ja) 1990-01-26 1990-01-26 マッチング方法

Country Status (1)

Country Link
JP (1) JP2940974B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2766205B2 (ja) * 1994-12-27 1998-06-18 長野日本電気ソフトウェア株式会社 文字認識装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60110087A (ja) * 1983-11-18 1985-06-15 Ricoh Co Ltd 特徴抽出方法
JPS61163479A (ja) * 1985-01-16 1986-07-24 Nec Corp 分類処理回路
JPS6244897A (ja) * 1985-08-22 1987-02-26 Nec Corp 文字認識装置

Also Published As

Publication number Publication date
JPH03220685A (ja) 1991-09-27

Similar Documents

Publication Publication Date Title
EP0325233B1 (en) Character string recognition system
US6389166B1 (en) On-line handwritten Chinese character recognition apparatus
CN113626444B (zh) 基于位图算法的表格查询方法、装置、设备及介质
US5448651A (en) Texture discrimination method
CN110232381B (zh) 车牌分割方法、装置、计算机设备及计算机可读存储介质
JP2940974B2 (ja) マッチング方法
JPH03212783A (ja) マッチング方式
JP2751865B2 (ja) 文字列認識装置
JP2774113B2 (ja) 文字認識方法
JP3121401B2 (ja) 認識辞書及び文字認識装置
JP3706646B2 (ja) Ocrの制御方法並びに分類方法及び装置
JPS62192886A (ja) 文字認識装置における特徴量生成方法
JP2938276B2 (ja) 文字認識装置
JP2515732B2 (ja) パタン照合装置
JPH051512B2 (ja)
JP2972443B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JPH07104940B2 (ja) 図形認識装置
JP3251704B2 (ja) 認識処理装置
JP2957097B2 (ja) パタン認識用辞書作成方法およびパタン認識方法
JP2917396B2 (ja) 文字認識方式
JPH0394325A (ja) データ処理装置
JPH07104911B2 (ja) パタ−ン認識装置
JPS6019550B2 (ja) 図形認識装置
JPH03268088A (ja) 総合評価回路

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11