JPH0344791A - 文字認識装置のマッチング装置 - Google Patents

文字認識装置のマッチング装置

Info

Publication number
JPH0344791A
JPH0344791A JP1179665A JP17966589A JPH0344791A JP H0344791 A JPH0344791 A JP H0344791A JP 1179665 A JP1179665 A JP 1179665A JP 17966589 A JP17966589 A JP 17966589A JP H0344791 A JPH0344791 A JP H0344791A
Authority
JP
Japan
Prior art keywords
circuit
dictionary
distance
memory
feature pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1179665A
Other languages
English (en)
Inventor
Masayuki Ishigami
正之 石上
Shinsuke Teramura
信介 寺村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1179665A priority Critical patent/JPH0344791A/ja
Publication of JPH0344791A publication Critical patent/JPH0344791A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は1文学認識装置においてマツチング処理(辞書
検索処理)を行う装置に関する。
〔従来の技術〕
文字認識装置においては、テキノ5トイメージから(文
字毎のイメージを切り出し、その特徴パターンを抽出す
る。そして、この認識対象文字の特徴パターンと、予め
用意された辞書の標準特徴パターンとの距離演算を行い
、距離によって文字コートをソートすることにより、距
離の小さい認識結果候補を掛る。このようなマツチング
処理(辞書検索処理)はかなり峙間のかかるものであり
、その高速化が要請されでいる。特に、漢字OCRにお
いては、1文字についての特徴量が多く、辞書の標準特
徴パターン数も多いため、マツチング処理の高連化は極
めて重要である。
マツチング処理の高速化に関しては、特開昭61−51
260号公報に、マイクロプロセッサと辞書メモリから
なる複数の処理ユニットによって。
マツチング処理を並列的に実行する方式が述べられてい
る。これによれば、単一のマイクロプロセッサと単一の
辞書によってマツチング処理を実行する場合よりも、処
理の高速化がr+(能である。
〔発明が解決しよ′うとする課題〕
しかし、マイクロプロセッサを使用するので各ユニット
の処理速度は比較的遅いため7処理の並列化の割りに処
理速度が」二がらず、また、′3に置のLSr化が難し
く、コストも高い。
よって本発明の目的は、−層の処理の高速化が可能で、
かつLSI化が容易な構成のマツチング′装置を提供す
ることにある。
〔a!題を解決するための手段〕
請求項(1)記載の発明における前記課題を解決するた
めの手段は、n(>2)個のマツチング回路系と、この
マツチング回路系にそれぞれ1対上に対応したn個の辞
書メモリおよびn個の距離テーブルメモリと、特徴パタ
ーンメモリとを右し、前記各マツチング回路系は、対応
した前ε己辞書メモリより標準特徴パターンのデータを
1次元ずつ読み出す回路と、この回路により読み出され
たデータおよび前記特徴パターンメモリより1次元ずつ
出力された認識対象文字の特徴パターンのデータを用い
て次元もの距離のデータを対J、t; した前記距離テ
ーブルメモリより読み出す回路と、この回路により読み
出された次元毎の距離のデータの累積加算を行う回路と
、この回路により得られた最終的な距離のデータと認識
候補文字コードとを距離の値によりソートするソート回
路とをイ1.辞書は標準特徴パターン単位でΩ分割され
た前記各辞dメモリに格納されることである。
請求項(2)記載の発明における前記課題を解決するた
めの手段は、n(>2)個の特徴パターンメモリと、こ
の特徴パターンメモリにt対1に対応したn個の辞芽メ
モリと、荊記各特徴パターンメモリおよび前記各辞書メ
モリより認識対象文字の特徴パターンおよび捕型特徴パ
ターンのデータをそれぞれ1次元ずつ出力さするための
ア1−レスを生成する回路と、前記特徴パターンメモリ
および前記辞書メモリと1対1に対応し、対応した前記
特徴パターンメモリおよび前記辞書メモリの出力データ
の合成データによりアクセスされて次元毎の距離のデー
タを出力するn個の距離テーブルメモリと、このn個の
距離テーブルメモリより出力される次元毎の距離のデー
タの累積加算を行う回路と、この回路により得られた最
終的な距離(乃データと認識対象文字コードとを距離の
値によりソートするソート回路とを有し、認識対象文字
の特徴パターンは次元単位でn分割されて前記各特徴バ
タ・−ンメモリに格納され、また辞書は1% 7(JJ
特徴パターンの次元単位でn分割されて前記各辞書メモ
リに格納されることである7 〔作 用〕 請求項(1)記載の発明によれば、一つの認識λ・1象
文字の特徴パターンとn個の標準特徴パターンとの距離
演算が並列的番こ実行され、また認識結果候補のソート
も同様に並列的に実行される。また、このよう松距離演
算およびソートはマイクロプロセッサでむく専用回路に
より実行される。したがって、マイクロプロセッサを用
いて並列的に処理を行う構成に比べ、マツチング処理を
大幅に高速化することが可能である。また、辞書メモリ
および距離テーブルメモリを除く、あるいは辞書メモリ
だけを除く、距離演算およびソー1〜のための回路は、
マイクロプロセッサに比べLSI化が容易であり、LS
I化によりマツチング装置のコストも下げることができ
る。
請求項(2)記載の発明によれば、一つの認識対象文字
の特徴パターンと一つの標準特徴パターンとの距離演算
がn次元分並列的に実行される。また、このような距離
演算と認識結果候補のソーI・はマイクロプロセッサで
はなく専用の回路により実行される。したがって、マイ
クロプロセッサを用いて並列的に処理を行う構成に比へ
、マツチング処理を大幅に高速化することが可能である
。また、辞書メモリおよび距離テーブルメモリを除く、
あるいは辞書メモリだけを除く、距離演算およびソート
のための回路は、マイクロプロセッサに比/<LSI化
が容易であり、LSI化によりマツチング装置のコスト
も下げることができる。
〔実施例〕
第1図は本発明の一実施例を示すブロック図である。特
徴パターンメモリ1は認識対象文字の特徴パターンを保
持するメモリである。ここに格納される特徴パターンは
、図示しない外部装置により認識対象文字イメージより
抽出され、外部インタフェース回路3を介して入力され
る。
ここに示すマツチング装置は、特徴パターンメモリ1に
格納された特徴パターンについて2系統(一般的にはn
fh統)のマツチング回路系によって辞書検索(マツチ
ング)を並列に実行する。辞書の標準特徴パターン(テ
ンプレート)は二つの群(一般的には0群)に分けられ
、各系統用の辞書メモリ10..102(一般的にはn
個の辞書メモリ)に−群ずつ格納される。すなわち、辞
書はテンプレート単位で系統数分に分割されて各辞書メ
モリに格納される。
第1のマツチング回路系は、辞書メモリLO3に格納さ
れた辞書の標準特徴パターン(テンプレート)と認識対
象文字の特徴パターンとの距tel ?IA算を行い、
認識結果候補を例えば最高第10位まで求めるものであ
る。このマツチング回路系には、辞書メモリ101に対
するメモリインタフェース回路97、次元毎の距離のテ
ーブルを格納する距離テーブルメモリ8.に対するメモ
リインタフェース回路7□、距離テーブルメモリ8tよ
り出力される次元毎の距離データを累積加算する距m演
算回路58、距離の値により候補文字コードと距離デー
タをソートシて保持するソート回路6□が含まれる。
第2のマツチング回路系は、辞書メモリ102に格納さ
れた辞書の4nQ特徴パターン(テンプレート)とLJ
&識対象文字の特徴パターンとの距離演算を行い、認識
結果候補を例えば最高第10位まで求めるものである。
このマツチングIrjJ路系には。
辞書メモリ102に対するメモリインタフェース回路9
8、次元毎の距離のテーブルを格納する距離テーブルメ
モリ8□に対するメモリインタフェース回路7□、距離
テーブルメモリ8□より出力される次元毎の距離データ
を累積加算する距離演算回路52.距離の値により候補
文字コー1〜と距離データをソートして保持するソート
回路6□が含まれる。
コントロール回路2は、マツチング動作に伴う前記各回
路の制御を行う部分であり、外部インタフェース回路3
は当該装置と外部装置との交信のための部分である。以
上の装置内部の各回路n!Iのデータおよび制御情報の
交換は内部バス4を通じて行われる。
なお、実際的には破線で囲まれた回路部はlチップ上に
集積される。
次に、辞書メモリ10..102および距離テーブルメ
モリ8□、8□に辞書および距離テーブルが格納されて
いるとして、マツチング動作を説明する。なお、これら
メモリのローディングは、外部n4iWlより外部イン
タフェース回路3、対応のメモリインタフェース回$9
.,92,71.72を通じて行われる。
外部インタフェース回路3を介して、外部装置より認識
対象文字の特徴パターンが特徴メモリ1に格納され、続
いてコントロール回路2内の各種カウンタ、メモリイン
タフェース回路9□、92゜7□、72内のアドレス生
成のためのレジスタやカウンタ、距離演算回路5□、5
.内のアキュムレータ、ソート回路6..62が初期設
定されることにより、一つの認識対象文字に対するマツ
チング処理が、2系統のマツチング回路系で並列に実行
される。
メモリインタフェース回路9□、9□によって、辞書メ
モリ10□、↓0□より一つの標準特徴パターンのデー
タが1次元ずつ読み出され、また、特徴パターンメモリ
上より特徴パターンの同じ次元のデータが読み出される
6なお、辞書メモリ1゜、、10.は同じアドレス情報
によりアクセスされる。読み出された標準特徴パターン
と特徴パターンのi次元のデータはメモリインタフェー
ス回路71.7□内のアドレスレジスタにセットされる
ことにより、同次元について距離のデータが距離テーブ
ルメモリ81.82より読み出される。この距離のデー
タが距離演算回路5□、52に入力し、それまでの累積
値に加算される。
標準特徴パターンの最後の次元まで同様の動作が繰り返
されることにより、基糸で一つの標準特徴パターンと認
識対象文字の特徴パターンとの距#を演算が終了する。
そうすると、この最終的な距離のデータがソー1〜回路
61,6□に入力され、また当該標準特徴パターンに対
応する文字コードがメモリインタフェース回路9□、9
□によって辞書メモリ10□、to□より読み込まれて
内部バス4を介してソート回路6..6□に入力され、
ソート回路6..62において、この文字コードおよび
距離データが距離の小さい順にソートされる。距離演算
回路5..52のアキュムレータはクリアされる。なお
5文字コートを別のメモリに格納し、ここからソート回
路6..6□に入力してもよい。
次の標準特徴パターンの読出しが開始し、同様の距離演
算が実行されるゆこれが終わると、再び認識結果候補の
ソートが行われる。
各辞書メモリ101.10□内の最後の標準特徴パター
ンまで同様の処理が終Yすると、第2のマツチング回路
系のソート回路62より認識結果候補の文字コードと距
離データが、第1のマツチング回路系のソート回路6i
に順次転送され、このソート回路61内の認識結果候補
と一結に改めてソートされることにより、最終的な認識
結果候補がソー1−回路6□に得られる。
コントロール回路2は、外部インタフェース回路3を通
し、認識処理全体を制御している外部製置へマツチング
処理終了を通知し、この外部装置からの結果転送要求に
従ってソート回路61内に得られた認識結果候補のデー
タを外部装置へ順次転送する。
以上説明した本実施例のデータの流れにそくした概念的
構成図を第2図に示す。
なお、マツチング回路系をn系M設けた場合、LA識結
果候補の再ソートは、第n系統のソート回路の内容を第
(n−1)系統のソート回路へ転送して再ソート()、
その結果を第(n−2)系統のソート回路へ転送して再
ソートn、以下類に第1系統のソート回路まで同様の転
送と百ソートを繰り返し、その結果を最終結果として外
部へ出力する。
第3図は本発明の他の実施例を示すブロック図である6
本実施例においては、認識対象文字の特徴パターンと辞
書の標準特徴パターンとの距、i7I M算を、奇数次
元と偶数次元とに分けて並列的に実行する。そのため、
認識対象文字の特徴パターンを偶数次元と奇数次元とに
分けて格納するための二つの特徴パターンメモリn..
n□を有し、また辞書の標準特徴パターン(テンプレー
ト)を同じく偶数次元と奇数次元に分けて格納する二つ
の辞書メモリ19..,19.を有する。すなわち、本
実施例では、辞書がaQ特徴パターンの次元車位で2分
割されて辞書メモリ土9□、19□に格納される。
なお、−殻内には特徴パターンメモリ及び辞書メモリを
それぞれn個設け、それぞれに特徴パタ−ンまたは標準
特徴パターンを次元単位でn分割して格納し、n系統で
距離演算を並列的に実行することができる。
アドレス生成回路12は、特徴パターンメモリn1、上
12および辞書メモリ19□、19□をアクセスするた
めのアドレスを生成する回路である。
特徴パターンメモリn..n2からは特徴パターンが1
次元ずつ出力され、同時に辞書メモリt91.19.か
らは標準特徴パターンの対応したt次元のデータが出力
されるが、これらのデータを合成して距離テーブルメモ
リ20□、202をアクセスするためのアドレス情報を
生成するために二つのアドレスレジスタ13□、t32
が設けられている。
距離テーブルメモリ20□、202は、特徴パターンと
IJl準特徴パターンとの1次元についての距離のテー
ブルを格納し、アドレスレジスタ131゜13□からの
アドレス情報によりアクセスされると次元間距離のデー
タを出力するものである。加算回路17は、距離テーブ
ルメモリ20□、202から出力される距離データの加
算を行う回路である。加算回路14およびアキュムレー
タ15は、加算回路17の出力データを積算(累積加算
)するためのものである。ソート回路部6は、アキュム
レータ15に得られる距離データと文字コートを、距離
値の小さい順にソートすることにより、例えば最高値第
10位までの認識結果を得るものである。文字コードは
一方の辞書メモリ19□(または19□)より読み出さ
れてソート回路16に入力する。なお、文字コードを別
のメモリブロックに格納し、そこから読み出すようにし
てもよい。
コントロール回路18は、マツチング動作に伴う前記各
回路の制御を行う部分である。なお、外部装置との通信
のためのインタフェース回路もあるが、第3図では省略
されている。
また、実際的には破線で囲まれた範囲内の回路部はエチ
ップ上に集積される。
次に、辞書メモリ19..19□に辞書が格納されてい
るとして、マツチング動作を説明する。
外部インタフェース回路(図示されていない)を介して
、外部装置より認識対象文字の特徴パターンが、偶数次
元は特徴パターンメモリn.に。
奇数次元は特徴パターンメモリ1↓2に、それぞれ順次
格納され、続いてコントロール回路18内の各種カウン
タや、アドレス生成回路12内のレジスタやカウンタ、
アキュムレータ15、ソート回路t6が初期設定され、
一つの認識対象文字についてのマツチング処理が開始す
る。
特徴パターンメモリエ1□、n2および辞書メモリ19
□、192より、特徴パターンおよび一つの標準特徴パ
ターンが1次元ずつ出力され、偶数次元のデータはアド
レスレジスタ13Lに、奇数次元のデータはアドレスレ
ジスタL32にそれぞれセットされる。その結果、偶数
次元データ間の距離のデータが距離テープメモリ20よ
より、奇数次元データ間の距離のデータが距離テーブル
メモリ202よりそれぞれ出力され、加算回路17によ
って加算される。すなわち、奇偶2次元についての距離
が得られる。この距離のデータは加算量i%14によっ
てアキュムレータ15の値に加′痒される。
特徴パターンおよび標7ψ特徴パターンの触接の次元ま
で同様の動作が繰り返されることにより、一つの標準特
徴パターンと認識対象文i≠の特徴パターンとの距#!
演算が終了する。そうすると、アキュムレータ15に得
られた最終的な距離のデータがソート回路16に入力し
、また当該標準特徴パターンに対応する文字コードが辞
書メモリ191より読み出されてソート回路6□、6□
に入力し。
ソー1〜回路16において、この文字コードおよび距離
データが距離の小さい順にソートされる。アキュムレー
タ15はクリアされる。
同様の距離演算と認識結果候補のソートが、辞書メモリ
19□、192内の最後の標準特徴パターンまで繰り返
され、最終的な認識結果候補のデータがソート回路16
に得られる。
コントロール回路18は、外部インタフェース回路を通
じ、認識処理全体を制御している外部装置へマツチング
処理終了を通知し、この外部装置からの結氷転送要求に
従ってソート回路t6内に得られた認識結果候補のデー
タを外部装置へ順次転送する。
〔発明の効果〕
以上説明した如く、請求項(1)または(2)記載の発
明によれば、マイクロプロセッサを用いて並列的に処理
を行う構成に比べ、マツチング処理を大幅に高速化する
ことが可能であり、また、辞書メモリおよび距離テーブ
ルメモリを除く、あるいは辞書メモリだけを除く回路系
のLSI化が容易で、そのlLSI化によりマツチング
処理のコスト引き下げが可能である。
【図面の簡単な説明】
第を図は本発明の一実施例を示すブロック図、第2図は
同実施例のデータの流れにそった概念的構成図、第3図
は本発明の他の実施例を示すブロック図である。 ↓・・・特徴パターンメモリ。 3・・・外部インタフェース回路。 5□、52・・・距離演算回路、 6□、6.・・・ソート回路、 7□、72・・・メモリインタフェース回路、81、8
t・・・距離テープメモリ、 9□、9□・・・メモリインタフェース回路、10、.
101・・辞書メモリ、 n□、n□・・・特徴パターンメモリ。 12・・・アドレス生成回路、 13□、131・・アドレスレジスタ、14・・・加算
回路、  15・・アキュムレータ、16・・・ソート
回路、  17・・・加算回路、191.19□・・・
辞書メモリ、 20□、202・・・距離テープメモリ。

Claims (2)

    【特許請求の範囲】
  1. (1)n(>2)個のマッチング回路系と、このマッチ
    ング回路系にそれぞれ1対1に対応したn個の辞書メモ
    リおよびn個の距離テーブルメモリと、特徴パターンメ
    モリとを有し、前記各マッチング回路系は、対応した前
    記辞書メモリより標準特徴パターンのデータを1次元ず
    つ読み出す回路と、この回路により読み出されたデータ
    および前記特徴パターンメモリより1次元ずつ出力され
    た認識対象文字の特徴パターンのデータを用いて次元毎
    の距離のデータを対応した前記距離テーブルメモリより
    読み出す回路と、この回路により読み出された次元毎の
    距離のデータの累積加算を行う回路と、この回路により
    得られた最終的な距離のデータと認識候補文字コードと
    を距離の値によりソートするソート回路とを有し、辞書
    は標準特徴パターン単位でn分割されて前記各辞書メモ
    リに格納されることを特徴とする文字認識装置のマッチ
    ング装置。
  2. (2)n(>2)個の特徴パターンメモリと、この特徴
    パターンメモリに1対1に対応したn個の辞書メモリと
    、前記各特徴パターンメモリおよび前記各辞書メモリよ
    り認識対象文字の特徴パターンおよび標準特徴パターン
    のデータをそれぞれ1次元ずつ出力させるためのアドレ
    スを生成する回路と、前記特徴パターンメモリおよび前
    記辞書メモリと1対1に対応し、対応した前記特徴パタ
    ーンメモリおよび前記辞書メモリの出力データの合成デ
    ータによりアクセスされて次元毎の距離のデータを出力
    するn個の距離テーブルメモリと、このn個の距離テー
    ブルメモリより出力される次元毎の距離のデータの累積
    加算を行う回路と、この回路により得られた最終的な距
    離のデータと認識候補文字コードとを距離の値によりソ
    ートするソート回路とを有し、認識対象文字の特徴パタ
    ーンは次元単位でn分割されて前記各特徴パターンメモ
    リに格納され、また辞書は標準特徴パターンの次元単位
    でn分割されて前記各辞書メモリに格納されることを特
    徴とする文字認識装置のマッチング装置。
JP1179665A 1989-07-12 1989-07-12 文字認識装置のマッチング装置 Pending JPH0344791A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1179665A JPH0344791A (ja) 1989-07-12 1989-07-12 文字認識装置のマッチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1179665A JPH0344791A (ja) 1989-07-12 1989-07-12 文字認識装置のマッチング装置

Publications (1)

Publication Number Publication Date
JPH0344791A true JPH0344791A (ja) 1991-02-26

Family

ID=16069738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1179665A Pending JPH0344791A (ja) 1989-07-12 1989-07-12 文字認識装置のマッチング装置

Country Status (1)

Country Link
JP (1) JPH0344791A (ja)

Similar Documents

Publication Publication Date Title
US4755974A (en) Content-addressable memory
EP0325233B1 (en) Character string recognition system
EP0117344A2 (en) Memory system
US4907284A (en) Image processing apparatus having function of enlargement and/or shrinkage of image
KR100267133B1 (ko) 표준스트로크를사용하여입력문자를인식하는온라인문자인식시스템
JPS61210478A (ja) ベクトル処理装置
JPH0344791A (ja) 文字認識装置のマッチング装置
JPS6142031A (ja) ソ−ト処理装置
JPH03116393A (ja) マッチング方式
Murphy et al. A dynamic programming algorithm for check sorting
JP2540899B2 (ja) ソ―タ記憶管理方式
JPH03251974A (ja) 文字認識装置のマッチング装置
JPH0259884A (ja) 文字認識装置
JPH0256084A (ja) マッチング方式
JPS6261427A (ja) 符号化方式
SU1541593A1 (ru) Устройство дл сравнени
JPH03160584A (ja) 辞書検索装置
JPH06274701A (ja) 単語照合装置
JPH04142689A (ja) 文字認識装置
JPH01183796A (ja) 文字認識装置
JPH0424887A (ja) 文子認識装置
JPS62180488A (ja) パタ−ンマツチング方式
JPH02193279A (ja) ソーティング装置
JPH0527917B2 (ja)
JPH0527912B2 (ja)