JPH03116393A - マッチング方式 - Google Patents

マッチング方式

Info

Publication number
JPH03116393A
JPH03116393A JP1254367A JP25436789A JPH03116393A JP H03116393 A JPH03116393 A JP H03116393A JP 1254367 A JP1254367 A JP 1254367A JP 25436789 A JP25436789 A JP 25436789A JP H03116393 A JPH03116393 A JP H03116393A
Authority
JP
Japan
Prior art keywords
feature pattern
dictionary
distance
memory
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1254367A
Other languages
English (en)
Inventor
Masayuki Ishigami
正之 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1254367A priority Critical patent/JPH03116393A/ja
Publication of JPH03116393A publication Critical patent/JPH03116393A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字畔識装置におけるマツチング方式に関す
る。
〔従来の技術〕
テキストイメージから1文字毎のイメージを切出し、そ
の特徴パターンを抽出し、これを予め用意された標準特
徴パターン(認識辞書)との距離演算により認識結果候
補を決定する文字認識装置においては、マツチング(辞
書検索処理)にかなりの時間を有する。特に日本語を対
象とした漢字○CHにおいては、1文字についての特徴
量が多く、また対象文字数も多いので辞書容量が大きく
なるため、マツチング処理の高速化が極めて重要な課題
となっている。
従来の漢字OCR等における一般的なマツチング方式を
第2図に示す。距離特徴パターンメモリ20に未知文字
の特徴パターンが格納されると、アドレス生成回路21
で生成されたアドレス情報により特徴パターンメモリ2
0及び辞書メモリ22が同時にアクセスされ、未知文字
の特徴パターン及び標準特徴パターンのデータが1次元
ずつ特徴パターンメモリ20及び辞書メモリ22より出
力される。このデータをレジスタ23で合成することに
より得られたアドレス情報により距離テーブルメモリ2
4がアクセスされ、該当の1次元に関する距離データが
出力される。この距離データは、加算回路25及びアキ
ュムレータ26よりなる累積加算回路によって累積加算
される。アキュムレータ26に最終的に得られた距離デ
ータ及び候補文字コードは、ソーティング回路27によ
ってソートされ保持される。
また、特開昭61−51260号公報には、マイクロプ
ロセッサと辞書メモリとからなる複数の処理ユニットに
よって、マツチング処理を並列化する方式が述べられて
いる。
〔発明が解決しようとする課題〕
第2図により説明したマツチング方式は、ソフトウェア
による方式よりも処理の高速化が期待できるが、漢字O
CR等においては処理速度が不足しているのが実情であ
る。
特開昭61−51260号公報に述べられた方式は、マ
イクロプロセッサを使用するので各ユニットの処理速度
が比較的遅く、並列化の割りに処理速度が上がらず、ま
た−船釣に装置のLSI化が難しく装置が高価なものに
なる。
よって本発明の目的は、漢字OCRにおいても十分な処
理速度を達成可能なマツチング方式を提供することにあ
る。
〔課題を解決するための手段〕
本発明のマツチング方式は、未知文字の特徴パターンが
次元単位にn分割されてそれぞれ格納されるn個(但し
n〉2)の特徴パターンメモリと。
それぞれ異なった標準特徴パターンが格納されるm個(
但しm〉2)の辞書記憶部とを有し、該各辞書記憶部は
標準特徴パターンが次元単位にn分割されて格納される
n個の辞書メモリよりなり。
また該各特徴パターンメモリ及び該各辞書メモリより特
徴パターン及び標準特徴パターンのデータをそれぞれ1
次元ずつ同時に出力させるためのアドレス情報を発生す
る回路と、m個の距離テーブル記憶部とを有し、該各距
離テーブル記憶部は次元単位の距離データが格納される
n個の距離テーブルメモリよりなり、該各距離テーブル
記憶部中の各距離テーブルメモリは、対応した該辞書記
憶部中の対応した辞書メモリ及び対応した該特徴パター
ンメモリの各出力データの合成データをアドレス情報と
してアクセスされて該各出力データ間の距離データを出
力し、また対応した該距離テーブル記憶部中の距離テー
ブルメモリより出力された距離データを加算するm個の
加算回路と、対応した該加算回路の出力データの累積加
算をするm個の累積加算回路と、該累積加算回路より出
力された距離データをキーとして候補文字コードをソー
トし保持する複数のソーティング回路とを有し、m×n
の並列度でマツチング処理を実行することを特徴とする
〔作 用〕
ハードウェアによる並列度m x nの並列処理である
ので1m及びnを増加させて並列度を上げることにより
、漢字OCRにおいても十分な速度でマツチング処理が
可能となる。
〔実施例〕
第1図は本発明の一実施例を示すブロック図である。本
実施例は、m = n = 2とした例であり、m個の
標準特徴パターンと未知文字の特徴パターンとのマツチ
ング処理を並列して行い、また各標準パターンと未知文
字の特徴パターンとの距離演算をn次元分並列に行う。
第1図において、1□、12は未知文字の特徴パターン
が次元毎に2 (=n)分割されて格納される特徴パタ
ーンメモリであり、本実施例においては特徴パターンの
奇数番目の次元のデータは特徴パターンメモリ11に格
納され、偶数番目の次元のデータは特徴パターンメモリ
1□に格納される。
2□、22はそれぞれ異なった文字の標準特徴パターン
が格納される辞書記憶部である。すなわち、本実施例に
おいては、標準特徴パターンは文字単位で2 (=m)
分割され、半分の文字の標準特徴パターンは辞書記憶部
2□に格納され、残りの半分の文字の標準特徴パターン
は他方の辞書記憶部2□に格納される。
辞書記憶部2□及び2□は2 (=n)個の辞書メモリ
211.2□2及び2□□、222よりそれぞれなって
おり、それぞれの辞書メモリには標準特徴パターンが次
元単位で2 (=n)分割されて格納される。本実施例
においては、辞書メモリ21□、2□1には標準特徴パ
ターンの奇数番目の次元のデータが格納され、辞書メモ
リ21□、2□2には標準特徴パターンの偶数番目の次
元のデータが格納される。
3は上記特徴パターンメモリ及び辞書メモリを同時にア
クセスするためのアドレス情報を生成するアドレス生成
回路である6 4□、4□はそれぞれ標準特徴パターンと未知文字の特
徴パターンとの次元毎の距離のデータが格納される距離
テーブル記憶部であり、それぞれ辞書記憶部21,2□
に対応している。これらの距離テーブル記憶部41.4
2はそれぞれ2(=n)個の距離テーブルメモリ4□□
、41□及び4□□、4□2よりなる。
5□2,5□2,5□11522はレジスタであり、そ
れぞれ対応した一つの辞書メモリ及び特徴パターンメモ
リの出力データを合成し、対応した一つの距離テーブル
メモリへアドレス情報を供給する。
6□及び62はそれぞれ対応した距離テーブルメモリ4
11.4□2及び4□□、422の出力データ(次元毎
の距離)を加算する加算回路である。
7□及び72はそれぞれ対応した加算回路6□及び6□
の出力データ(2次元分の距離)を、特徴パターンの次
元数の2 (=n)分の1の回数、累積加算することに
より1文字単位の距離データを得る累積加算回路であり
、それぞれ加算回路8□及び8□並びにアキュムレータ
9□及び9.よりなる。
10□は累積加算回路71によって得られた距離データ
及び候補文字コード(辞書記憶部21より与えられる)
を、距離値をキーとしてソートし保持するソーティング
回路である。10□は累積演算回路78により得られた
距離データ及び候補文字コード(辞書記憶部2□より与
えられる)を。
距離値をキードしてソートし保持するソーティング回路
であるが、これは自回路のソート結果とソーティング回
路10□のソート結果を含む最終的なソートも行う。
11はマツチング処理動作に伴う上記全回路の制御を行
うコントロール回路である。
次にマツチング処理動作について説明する。外部インタ
フェース(図示されていない)を介して。
認識すべき未知文字の特徴パターンが奇数番目の次元デ
ータと偶数番目の次元のデータに分けられて標準パター
ンメモリ11,1□にそれぞれ格納される。
続いて、コントロール回路11中の各種カウンタや、ア
ドレス生成回路3中のレジスタやカウンタ、アキュムレ
ータ9□、92及びソーティング回路10□、10□が
初期設定される。
アドレス生成回路3で生成されたアドレス情報によって
特徴パターンメモリ11,12及び辞書メモリ2□0,
2□2,2□1,2□2がアクセスされ、それぞれ特徴
パターンまたは標準特徴パターンのデータを1次元毎に
出力する。これらの出力データは対応したレジスタ51
□、5□2,5□0,5oにセットされ合成される。
距離テーブルメモリ4□1,41□、4□□、422は
対応のレジスタ5 ill 5tz+ 5□1,5□2
で合成されたアドレス情報によりアクセスされ、標準特
徴パターンと特徴パターンとの次元毎の距離データを出
力する。この距離データは対応した加算回路6□、6.
によって加算され、さらに対応した累積加算回路7□、
78によって累積加算される。
特徴パターンメモリ14,1□より特徴パターンが最後
の次元まで読出され、また各辞書記憶部2□、2□より
それぞれ一つの標準特徴パターンが最後の次元まで読出
されると、二つの標準特徴パターンと未知文字の標準パ
ターンとの最終的な距離データがアキュムレータ9□、
9□にそれぞれ得られ、ソーティング回路10工、10
2でソートが実行される。
特徴パターンメモリ11.1□から特徴パターンの読出
しが再び始まり、同時に、辞書記憶部2□。
2□から別の文字の標準特徴パターンの読出しが始まり
、同様の距離演算が実行され、その結果について再びソ
ートが行われる。
各辞書記憶部2□、2□に格納された全標準特徴パター
ンとの距離演算が終了すると、ソーティング回路101
よりソート結果がソーティング回路10、に順次転送さ
れ、ソートが行ねれ、最終的な候補データがソーティン
グ回路10.に得られる。
コントロール回路11は、このソートが終了すると、外
部へ処理終了を通知し、その後の結果転送要求に従って
ソーティング回路101Iに得られた最終的な候補デー
タを外部へ順次転送する。
なお、文字コードを辞書記憶部21,2□以外のメモリ
に格納し、このメモリより候補文字コードをソーティン
グ回路1oz−Lozへ転送してもよい。
なお、辞書メモリ及び距離テーブルメモリを除いた部分
全体を1チツプ上に集積化することは容易である。
〔発明の効果〕
以上説明した如く1本発明によれば、1文字当たりの特
徴量が多く、標準特徴パターン数も多い漢字OCRにお
いても、マツチング処理速度を十分に高速化することが
でき、また処理回路系のLSI化も容易であるので多数
のマイクロプロセッサを用いる方式に比べ比較的安価に
実施可能である。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図。 第2図は従来のマツチング方式のブロック図である。 11.1.・・・特徴パターンメモリ、21.2□・・
・辞書記憶部。 21□〜2゜・・・辞書メモリ。 3・・・アドレス生成回路。 41.4□・・・距離テーブル記憶部、4□1〜4o・
・・距離テーブルメモリ、511〜5゜・・・レジスタ
、 61,6.・・・加算回路、71.7□・・・累積
加算回路、 10、.10.・・・ソーティング回路。 箆2図

Claims (1)

    【特許請求の範囲】
  1. (1)未知文字の特徴パターンが次元単位にn分割され
    てそれぞれ格納されるn個(但しn>2)の特徴パター
    ンメモリと、それぞれ異なった標準特徴パターンが格納
    されるm個(但しm>2)の辞書記憶部とを有し、該各
    辞書機憶部は標準特徴パターンが次元単位にn分割され
    て格納されるn個の辞書メモリよりなり、また該各特徴
    パターンメモリ及び該各辞書メモリより特徴パターン及
    び標準特徴パターンのデータをそれぞれ1次元すづ同時
    に出力させるためのアドレス情報を発生する回路と、m
    個の距離テーブル記憶部とを有し、該各距離テーブル記
    憶部は次元単位の距離データが格納されるn個の距離テ
    ーブルメモリよりなり、該距離テーブル記憶部中の各距
    離テーブルメモリは、対応した該辞書記憶部中の対応し
    た辞書メモリ及び対応した該特徴パターンメモリの出力
    データの合成データをアドレス情報としてアクセスされ
    て該各出力データ間の距離データを出力し、また対応し
    た該距離テーブル記憶部中の各距離テーブメメモリより
    出力された距離データを加算するm個の加算回路と、対
    応した該加算回路の出力データの累積加算をするm個の
    累積加算回路と、該累積加算より出力された距離データ
    をキーとして候補文字コードをソートし保持する複数の
    ソーティング回路を有し、m×nの並列度でマッチング
    処理を実行することを特徴とするマッチング方式。
JP1254367A 1989-09-29 1989-09-29 マッチング方式 Pending JPH03116393A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1254367A JPH03116393A (ja) 1989-09-29 1989-09-29 マッチング方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1254367A JPH03116393A (ja) 1989-09-29 1989-09-29 マッチング方式

Publications (1)

Publication Number Publication Date
JPH03116393A true JPH03116393A (ja) 1991-05-17

Family

ID=17264007

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1254367A Pending JPH03116393A (ja) 1989-09-29 1989-09-29 マッチング方式

Country Status (1)

Country Link
JP (1) JPH03116393A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8031942B2 (en) 2007-09-14 2011-10-04 Ricoh Company, Ltd. Matching device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8031942B2 (en) 2007-09-14 2011-10-04 Ricoh Company, Ltd. Matching device

Similar Documents

Publication Publication Date Title
JP2994926B2 (ja) 有限状態機械作成方法とパターン照合機械作成方法とこれらを変形する方法および駆動方法
EP0180239A2 (en) Content-addressable memory
JP3754791B2 (ja) 画像検索装置及び方法
US5226135A (en) Method for sorting vector data on the basis of partial vectors and vector processor
JP2847715B2 (ja) 文字認識装置及び文字認識方法
JPH03116393A (ja) マッチング方式
JPS5892076A (ja) 巻片編集印刷装置
JPS6261427A (ja) 符号化方式
JPH0256084A (ja) マッチング方式
JP4036514B2 (ja) データ圧縮方法とデータ復元方法およびソートマージ処理装置とソートマージ処理方法およびこれら方法のプログラムを記録した媒体
JPH0344791A (ja) 文字認識装置のマッチング装置
JP2940974B2 (ja) マッチング方法
JP2895892B2 (ja) データ処理装置
JPH0424887A (ja) 文子認識装置
JPS6217797B2 (ja)
JP2774113B2 (ja) 文字認識方法
JPH0394325A (ja) データ処理装置
JPH0259884A (ja) 文字認識装置
JPH03251974A (ja) 文字認識装置のマッチング装置
JPH03212783A (ja) マッチング方式
JPH09330322A (ja) データ検索装置
JPS59725A (ja) 入力装置
JPS6211389B2 (ja)
JPS59116851A (ja) 使用制限のある情報検索方式
JPH10143408A (ja) 索引付順編成ファイル作成装置