JP2774113B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP2774113B2
JP2774113B2 JP63275133A JP27513388A JP2774113B2 JP 2774113 B2 JP2774113 B2 JP 2774113B2 JP 63275133 A JP63275133 A JP 63275133A JP 27513388 A JP27513388 A JP 27513388A JP 2774113 B2 JP2774113 B2 JP 2774113B2
Authority
JP
Japan
Prior art keywords
class
character
distance
dictionary
distance calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63275133A
Other languages
English (en)
Other versions
JPH02121077A (ja
Inventor
正之 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63275133A priority Critical patent/JP2774113B2/ja
Publication of JPH02121077A publication Critical patent/JPH02121077A/ja
Application granted granted Critical
Publication of JP2774113B2 publication Critical patent/JP2774113B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、認識対象文字の特徴パターンと辞書に格納
されている文字の特徴パターン(テンプレート)との距
離演算の途中の距離値(中間距離値)が閾値を越えたと
きに、その距離演算を途中で打ち切る方式の文字認識装
置に係り、特に距離演算の途中打ち切りの判定閾値とし
て、その時点における最下位候補の距離(動的閾値)を
用いる方式の文字認識方法に関する。
〔従来の技術〕
この種の動的閾値を用いて距離演算の途中打ち切りを
判定する方式によれば、候補となり得ない文字とのマッ
チングの無駄時間を減らし、認識処理時間を短縮でき
る。しかし、このような方式によっても、文字数並びに
文字の特徴量が著しく多い漢字OCRなどにおいては、認
識処理の高速化が不十分である。
一層高速の文字認識を抑うための手法として、個々の
文字とのマッチング処理の前に、大分類処理により認識
対象文字が属すると想定される1つまたは複数のクラス
を決定し、そのクラスに属する文字についてのみマッチ
ング処理を行う方式が採用されている。
〔発明が解決しようとする課題〕
しかし、このような大分類による方式は、例えばノイ
ズの影響により認識対象文字のイメージが変動し大分類
の誤りが生じた場合に、認識対象文字が属するクラスに
ついてのマッチングが実行されない結果、第2位以下の
候補としても正しい文字が得られず、後処理による誤認
識の訂正も難しくなってしまうという問題があった。
本発明の目的は、かかる大分類による方式の欠点を解
消するとともに、動的閾値による距離演算の途中打ち切
り制御の効果を最大限に発揮させることにより、認識速
度を向上した文字認識方法を提供することにある。
〔課題を解決するための手段〕
本発明による文字認識方法は、動的閾値によって個々
の文字と認識対象文字との距離演算の途中打ち切り制御
を行うものであるが、特徴パターンが類似した文字を集
めてクラス分けし、クラス別に文字の特徴パターンを辞
書に格納し、また各クラスに属する文字特徴パターンを
代表するクラス特徴パターンを辞書に格納するととも
に、認識対象文字の特徴パターンと辞書に格納されてい
るクラス特徴パターンとの距離演算を行い、距離が小さ
い順に従ってクラスの優先度を決定し、該決定された優
先度の高いクラスより先にクラス別の各文字特徴パター
ンと対象文字の特徴パターンと距離演算を実行すること
を特徴とするものである。
〔作 用〕
動的閾値によって距離演算の打ち切り制御を行う方式
においては、認識対象文字との距離が小さい候補が得ら
れる時期が早ければ早い程、距離演算が途中で打ち切ら
れる文字数が多くなり、かつ、そのような文字の距離演
算の打ち切り時点が早くなるため、距離演算の途中打ち
切りによる時間節減効果が大きい。
本発明の文字認識方法においては、認識対象文字の特
徴パターンとの距離が小さいクラスから順に、クラス別
の文字の特徴パターンとの距離演算が行われるため、上
記時間節減効果を最大限に発揮させる条件を満たすこと
ができる。
また、本発明の文字認識装置においては、クラスに優
先度はつけられるが、大分類方式のように限られたクラ
スについてだけ詳細マッチングを行う方式ではないた
め、ノイズによって認識対象文字のイメージが変動した
場合などにおいても、必要なクラスの詳細マッチングが
実行されないという事態を回避できる。
〔実施例〕
以下、図面を用い本発明の実施例を説明する。
まず、本発明の文字認識方法において用いられる辞書
の一例について説明する。
第2図は辞書の論理的構成の一例を示す図である。こ
こに示す辞書は、第1クラスから第10クラスまで10クラ
スに分かれ、各クラス毎にテンプレート部1と文字コー
ド部2が設けられる。文字は特徴パターンが類似したも
のが集められて1つのクラスとされ、全文字は第1クラ
スから第10クラスに分けられる。第1クラスに属する各
文字の特徴パターン(テンプレート)および文字コード
は、第1クラスのテンプレート部1および文字コード部
2に格納される。他のクラスの文字についても同様に、
該当クラスのテンプレート部1および文字コード部2に
特徴パターンと文字コードが格納される。また辞書には
クラス特徴パターン部3とクラスID部4が設けられる。
クラス特徴パターン部3には、各クラスの所属文字の特
徴パターンを代表するクラス特徴パターンが格納され、
これと対応付けられてクラスID(例えばクラスの番号)
がクラスID部4に格納される。クラス特徴パターンとし
ては、クラス内の一つまたは複数の文字の特徴パターン
が用いられる。
次に第1図により本発明方法による文字認識装置の構
成例を説明する。11は上記辞書を記憶する辞書メモリ、
12は辞書メモリ11のアドレス生成回路である。13は認識
対象文字イメージから抽出された特徴パターンを保持す
るための特徴パターンメモリ、14はそのアドレスカウン
タである。
15は辞書内の各文字の特徴パターン(テンプレート)
またはクラス特徴パターンと認識対象文字の特徴パター
ンとの各次元の距離(局所距離と称する。なお特徴パタ
ーンは複数次元のベクトルとして表現されている)を得
るための距離テーブルメモリ、16はそのアドレスレジス
タである。17および18は局所距離の累積加算によって距
離を求めるための加算器およびアキュムレータである。
19は距離演算終了後に文字コードまたはクラスIDと距
離を距離の値が小さい順にソートし保持するソーティン
グ回路である。20は距離演算途中におけるアキュレータ
18の値(中間距離値)ソーティング回路19内の最大の距
離値(各時点における最下位候補または初期設定値)と
を比較する比較器である。
21はクラスIDを優先度順に保持するための優先度スタ
ック、22はクラスIDに対応するクラスの文字の特徴パタ
ーンを読み出すためのクラス情報を保持するためのクラ
ス情報メモリである。
23は当該マッチング処理部内の初期設定値やマッチン
グ結果を外部とやりとりするための外部インタフェース
回路、24は当該マッチング処理部内の各部に必要なコン
トロール信号を生成し、マッチング処理部全体をコント
ロールするコントロール回路である。
次に動作を説明する。外部インタフェース回路23を介
して認識対象文字の特徴パターンが特徴パターンメモリ
13にセットされ、続いてアドレス生成回路12,アドレス
カウンタ14,アドレスレジスタ16,アキュムレータ18,ソ
ーティング回路19,クラス優先度スタック21,コントロー
ル回路24内のカウンタ(特徴パターンの処理済み次元数
のカウンタなど)が初期設定される。
まずクラス優先度の決定処理が実行される。辞書メモ
リ11から第1クラスよりクラス特徴パターンが1次元ず
つ読み出され、同時に特徴パターンメモリ13から認識対
象文字の特徴パターンが1次元ずつ読み出され、それぞ
れアドレスレジスタ16にセットされる。距離テーブル15
より局所距離のデータが出力され、その累積加算が加算
器17およびアキュムレータ18によって行われる。
この距離演算の途中の累積加算値すなわち中間距離値
と、ソーティング回路19に保持された距離の最大値(こ
れは初期設定時にセットされている)とが比較器20によ
って比較される。中間距離値が最大値を越えた場合、当
該クラスは認識対象文字との距離が大きく最低の優先度
を与えてよいので、距離演算を打ち切り、そのクラスID
を辞書メモリ11より読み出してクラス優先度スタック21
にプッシュダウンする。このクラスIDと距離(中間距離
値)はソーティング回路19に保持されない。そして、次
のクラスについての距離演算を開始する。
中間距離値が最大値を越えない場合は距離演算を続行
する。最終的に得られた距離が最大値を越えない場合、
当該クラスIDを辞書メモリ11より読み出し距離とともに
ソーティング回路19に入力し、距離の小さい順にソーテ
ィングを行わせる。
同様の処理を第10クラスまで実行すれば、クラス優先
度スタック21に保持済みのクラスID以外のクラスIDが距
離の小さい順にソーティングされてソーティング回路19
内に保持されることになる。このソーティングされたク
ラスIDは、距離の大きいものから順にクラス優先度スタ
ック21にプッシュダウンされる。クラス優先度スタック
21のトップ側のクラスIDほど高い優先度が与えられたこ
とになる。
なお、クラス優先度決定のための距離演算の途中打ち
切りを行わず、全クラスについて最終的な距離の小さい
順にソーティング回路19でソーティングを行い、距離の
大きい順にクラスIDをクラス優先度スタック21にプッシ
ュダウンしてもよい。
このようなクラスの優先度決定が終了すると、クラス
優先度スタック21および特徴パターンメモリ13を除くカ
ウンタやレジスタの初期設定が行われ、優先度の高いク
ラスから辞書に格納されている文字の特徴パターンと認
識対象文字の特徴パターンとのマッチング処理が実行さ
れる。
クラス優先度スタック21から一つのクラスIDがポップ
アップされ、このクラスIDに対応するクラス情報がクラ
ス情報メモリ22より読み出されてアドレス生成回路12に
セットされる。
当該クラスに属する一つの文字の特徴パターンおよび
認識対象文字特徴パターンが1次元ずつ辞書メモリ11お
よび特徴パターンメモリ13より順次読み出され、その局
所距離が順次距離テーブルメモリ15より出力されて、そ
の累積加算が加算器17およびアキュムレータ18により実
行される。この距離演算の中間距離値(各次元までの累
積距離値)とソーティング回路19に保持されている距離
の最大値(その時点における最下位候補の距離)とが比
較器20によって比較される。この距離の最大値(閾値と
称する)を中間距離値が越えないときは距離演算が続行
されるが、最大値を越えたときは距離演算は途中で打ち
切られ、該当文字コードと距離はソーティング回路19に
入力されない。すなわち候補から排除される。
最終次元まで距離演算が終了し、その距離が閾値を越
えない場合、該当文字コードが辞書メモリ11より読み出
され、距離と一緒にソーティング回路19に入力され、距
離の小さい順にソーティングされる。なお、ソーティン
グ回路19に残る認識結果候補は例えば第10位までであ
る。
当該クラスの最終の文字まで同様の距離演算が実行さ
れると、クラス優先度スタック21より次の優先度のクラ
スIDがポップアップされ、そのクラス情報がアドレス生
成回路12にセットされる。そして、当該クラスに属する
各文字の特徴パターンと認識対象文字の特徴パターンと
の距離演算と候補のソーティングが実行される。
同様の処理が最後のクラスまで終了し、最終的な10候
補の文字コードと距離がソーティング回路19に得られる
と、コントロール回路24はマッチング処理終了を外部の
制御部へ通知し、この制御部からの結果転送要求に従っ
てソーティング回路19内のマッチング処理結果を外部イ
ンタフェース回路23を介して順次転送する。
辞書の文字とのマッチング処理は、候補となる可能性
が大きく高い優先度を与えられたクラスの文字より実行
されるため、早い段階で十分に距離の小さい候補がソー
ティング回路19に得られるため、距離演算が途中で打ち
切られる文字が増加し、また、その打ち切りも早い時点
で行われる。したがって、距離演算の途中打ち切りによ
る時間節減効果を最大限に発揮させることができる。ま
た、ノイズなどの影響で認識対象文字イメージが変動し
た場合においても、クラスの優先度決定が不適切なもの
となることはあっても全クラスについてマッチングが実
行されるので、大分類処理による方式の問題は生じな
い。
なお、辞書編成に関して、特定の文字について、その
特徴パターンを複数のクラスに重複させて格納してもよ
い。すなわち、特徴パターンが類似した文字を集めてク
ラス分けが行われるが、実際にクラス分けを行う場合、
2以上のクラスのいずれに所属させても大差のないよう
な文字(クラス境界文字)が必ず存在する。このような
クラス境界文字を一つのクラスAだけに所属させた辞書
編成とすると、当該文字の認識の際にクラスAの優先度
が低く決定されてしまうことがあり得る。この場合、ク
ラスAのマッチング開始が遅くなるため距離演算途中打
ち切りの効果が充分に発揮されないことがある。
これに対し、2以上のクラスの境界文字については、
その2以上のクラスに重複させて特徴パターンを格納し
た辞書編成とすれば、当該文字の認識時に、それが所属
するクラスのいずれかに高い優先度が与えられる確率が
高いため、距離演算途中打ち切りの効果を確実に発揮さ
せることができる。
〔発明の効果〕 以上、詳細に説明したように、本発明によれば、距離
演算の途中打ち切りの効果を最大限に発揮させてマッチ
ング処理を高速化し、かつ大分類処理による方式の欠点
を排除した高性能の文字認識方法を実現できる。
【図面の簡単な説明】
第1図は本発明方法による文字認識装置のマッチング処
理部の一実施例の概略ブロック図、第2図は辞書の論理
構成を示す図である。 1……クラス別テンプレート部、2……クラス別文字コ
ード部、3……クラス特徴パターン部、4……クラスI
D、11……辞書メモリ、13……特徴パターンメモリ、15
……距離テーブルメモリ、17……加算器、18……アキュ
ムレータ、19……ソーティング回路、20……比較器、21
……クラス優先度スタック、22……クラス情報メモリ。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/62 G06K 9/68 G06K 9/70

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】辞書に、特徴パターンが類似した文字の集
    合であるクラス別に文字の特徴パターンを格納するとと
    もに、各クラスに属する文字の特徴パターンを代表する
    クラス特徴パターンを格納し、 認識対象文字の特徴パターンと前記辞書に格納されてい
    るクラス特徴パターンとの距離演算を行い、距離が小さ
    い順に従ってクラスの優先度を決定し、 上記決定された優先度の高いクラスより先にクラス別の
    文字の特徴パターンと前記認識対象文字の特徴パターン
    との距離演算を行い、距離の小さい順に文字をソーティ
    ングして認識結果候補を決定するとともに、文字の特徴
    パターンとの距離演算の途中における距離値がその時点
    における最下位候補の距離を越えたときに該距離演算を
    打ち切ることを特徴とする文字認識方法。
  2. 【請求項2】辞書は特定の文字特徴パターンを2以上の
    クラスに重複して格納していることを特徴とする請求項
    (1)記載の文字認識方法。
JP63275133A 1988-10-31 1988-10-31 文字認識方法 Expired - Fee Related JP2774113B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63275133A JP2774113B2 (ja) 1988-10-31 1988-10-31 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63275133A JP2774113B2 (ja) 1988-10-31 1988-10-31 文字認識方法

Publications (2)

Publication Number Publication Date
JPH02121077A JPH02121077A (ja) 1990-05-08
JP2774113B2 true JP2774113B2 (ja) 1998-07-09

Family

ID=17551158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63275133A Expired - Fee Related JP2774113B2 (ja) 1988-10-31 1988-10-31 文字認識方法

Country Status (1)

Country Link
JP (1) JP2774113B2 (ja)

Also Published As

Publication number Publication date
JPH02121077A (ja) 1990-05-08

Similar Documents

Publication Publication Date Title
EP0325233B1 (en) Character string recognition system
US4685142A (en) Method and device for handwritten letter recognition
AU706080B2 (en) Character recognition system identification of scanned and real time handwritten characters
US7630551B2 (en) Method and system for line extraction in digital ink
RU2370814C2 (ru) Система и способ для обнаружения списка в рукописных входных данных
US10438083B1 (en) Method and system for processing candidate strings generated by an optical character recognition process
Hamida et al. A novel feature extraction system for cursive word vocabulary recognition using local features descriptors and gabor filter
JPH07107708B2 (ja) パタ−ン認識方法
US20230161811A1 (en) Image search system, method, and apparatus
JP2774113B2 (ja) 文字認識方法
WO1990003012A2 (en) Image recognition
US20200387691A1 (en) A quick match algorithm for biometric data
KR20220068357A (ko) 딥러닝 객체 검출 처리 장치
JP2556477B2 (ja) パタン照合装置
JP3904397B2 (ja) 表認識方法
JPH0520794B2 (ja)
JP2940974B2 (ja) マッチング方法
JP2801602B2 (ja) 単語認識装置
JP2515732B2 (ja) パタン照合装置
CN111626364B (zh) 手势图像分类方法、装置、计算机设备及存储介质
JP2851865B2 (ja) 文字認識装置
JPH0766423B2 (ja) 文字認識装置
JPH09179935A (ja) 文字認識装置およびその制御方法
CN114445470A (zh) 一种基于dfs由粗到细的图像配准方法、系统、终端及可读存储介质
JPH0746363B2 (ja) 図面読取装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees