JPH03223988A - 辞書検索方式 - Google Patents

辞書検索方式

Info

Publication number
JPH03223988A
JPH03223988A JP2018577A JP1857790A JPH03223988A JP H03223988 A JPH03223988 A JP H03223988A JP 2018577 A JP2018577 A JP 2018577A JP 1857790 A JP1857790 A JP 1857790A JP H03223988 A JPH03223988 A JP H03223988A
Authority
JP
Japan
Prior art keywords
character
distance calculation
distance
threshold value
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018577A
Other languages
English (en)
Inventor
Osamu Adachi
修 足立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2018577A priority Critical patent/JPH03223988A/ja
Publication of JPH03223988A publication Critical patent/JPH03223988A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置における辞書検索方式〔従来の
技術〕 文字認識装置では一般に、認識対象文字の特徴量を抽出
し、この特徴量と予め辞書として用意した標準文字の特
徴量との差すなわち距離を計算し、距離の小さいものか
ら順に候補文字とする。
特徴量は複数次元のバク1〜ルデータとして扱われ、演
算は一般に1次元毎の差(距離)を順時求めて累積加算
することにより演算されるが、漢字のような特徴量の多
い文字を扱う場合には処理時間が増加する。
このような距離演算の時間を短縮するため、距離演算の
途中で演算値がある閾値を越えたときに、正解の可能性
がないと判断して距離演算を打ち切るようにした辞書検
索方式が考案されている。これには、距離演算打ち切り
判定の閾値として予め設定した固定値を用いる方式のほ
かに、各時点における最下位候補の距離を閾値として用
いる方式%式% 〔発明が解決しようとする課題〕 ある文字認識装置において、「待」と「つ」に対する認
識結果は次表の如くとなり、第1候補であっても複雑な
「待」の距離に比べ単純な「つ」の距離は遥かに小さい
。なお距離の値は装置によって違いがある。
第1表 この例から明らかなように、正解の可能性の高い候補で
あっても、距離は文字が複雑で特徴量が多いほど大きく
なる傾向がある。
− したがって、閾値を固定する方式においては、複雑な文
字に合わぜて大きめな閾値にしなければならない(単純
な文字に合せると複雑な文字の正解が得られなくなる)
ため、距離演算の打ち切り効果を十分に発揮させること
ができない。
他方、最下位候補の距離を閾値とする方式は、正解のi
J能性が高い(距離の小さい)候補が早い時点で得られ
た場合に距離演算打ち切りによる効果が大ぎいが、複雑
な文字を認識対象としている場合に、単純な文字が候補
として得られると、その後に正解文字に対する距離演算
が打ち切られてしまい正解が得られないという問題があ
る。これを防ぐためには、複雑な文字の認識に支障を来
さないある値を下回らないように閾値の最小値を制限し
なければならず、結局、距離演算打ち切り効果を最大限
に発揮させることができない。
よって本発明の目的は、単純な文字から複雑な文字まで
距離演算の打ち切り効果を最大限に発揮させ処理効率を
大幅に向上できるた辞書検水方式を提供することにある
4− 〔課題を解決するための手段〕 本発明は、請求項(1)記載の如く、距離演算の打ち切
り判定のために演算値と比較される閾値を、認識対象文
字画像の黒画素数により変化させ、もしくは請求項(2
)記載の如く、距離演算値を認識対象文字の黒画素数で
正規化した値をある閾値と比較することによって距離演
算打ち切りの判定をし、または、請求項(3)記載の如
く、距離演算の打ち切り判定のために演算値と比較され
る閾値として、標準文字毎にその複雑さに応じて予め決
めて辞書に格納した値を用いることを特徴とする〔作 
用〕 文字認識装置においては、文字の領域を正規化して大き
さを揃えてから特徴抽出を行うので、複雑な文字はど黒
画素数が多い。したがって、請求項(1)記載のように
、距離演算値と比較される閾値を、認識対象文字の黒画
素数が多いほど大きな値とするように適切に変化させれ
ば、単純な文字から複雑な文字まで正解の可能性のない
標準文字に対する距離演算を早い時点で適切に打ち切っ
て、最大限の時間節約効果を得ることができる。請求項
(3)記載の方式によっても同様の効果が得られること
は明らかである。
また、請求項(2)記載のように、距離演算値を認識対
象文字の黒画素数により正規化してからある閾値と比較
すれば、実質的に閾値が黒画素数に比例的に変化するこ
とになるため、単純な文字から複雑な文字まで距離演算
打ち切り効果を最大限に発揮させることが可能である。
〔実施例〕
第1−図は本発明の第1実施例を示すブロック図である
。特徴抽出回路IAによって認識対象文字の特徴量が抽
出されて距離演算回路2Aに入力し、また黒画素数が計
数されて閾値テーブル3に入力し、この黒画素数に対応
した閾値が閾値テーブル3より距離演算回路2Aに入力
する。
この閾値テーブル3は第2表に示す如き内容のテーブル
である。
第2表 ただし、a o < a x < a 2 < a 3
(・・・xa< xt〈x2< x3<=− 制御回路4Aからのアドレシングによって辞書(メモリ
)5Aより標準文字の特徴量が1次元ずつ読出されて距
離演算回路2Aに入力する。距離演算回路2Aにおいて
、標準文字の特徴量と認識対象文字の特徴量との対応次
元毎の差の累積加算による距離演算が実行されるが、1
次元毎に演算値と閾値テーブル3から入力した閾値との
比較が行われ、演算値が閾値を越えたときには距離演算
が打ち切られるとともに、打ち切り通知が制御回路4A
へ送られる。
7− 距離演算が最終次元まで完了したときには、制御回路4
Aより該当文字コードとともにソート指示がソーティン
グ回路6Aへ送られる。ソーティング回路6Aにおいて
、距離演算回路2Aより入力した距離のデータ及び制御
回路4Aより入力した文字コード並びにその時までの候
補の文字コード及び距離データを、距離をキーとして再
度ソートする。その後、制御回路4Aは距離演算回路2
Aをリセットし、次の標準文字の特徴量の読出しのため
のアドレシングを開始する。
距離演算が途中で打ち切りとなった場合には、制御回路
4Aは距離演算回路2Aをリセットした後、次の標準文
字の特徴量の読出しのためのアドレシングを開始する。
本実施例によれば、認識対象文字の黒画素数すなわち複
雑さの程度に比例させて距離演算打ち切り判定の閾値を
段階的に変化させるため、単純な文字の認識の場合にも
複雑な文字の認識の場合にも、正解の可能性のある標準
文字に対する距離演算の打ち切りを避けつつ、正解の可
能性の低い標8− 準文字に対する無駄な距1lr18j1.算を早い時点
で打ち切って処理の効率を上げることができる。
なお、本実施例においては、制御回路4Aが辞書アドレ
スより文字コードを算出して出力したが、辞書5Aより
文字コードを読出してもよい。
第2図は本発明の第2実施例を示すブロック図である。
特徴抽出回路IBによって認識対象文字の特徴量が抽出
されて距離演算回路2Bに入力し、また黒画素数が計数
されて距離正規化回路7に入力する。
制御回路4Bからのアドレシングによって辞書(メモリ
)5Bより標準文字の特徴量が1次元ずつ読出されて距
離演算回路2Bに入力する。距離演算回路2Bにおいて
、準標文字の特徴量と認識対象文字の特徴量との対応次
元毎の差の累積加算による距離演算が実行される。各次
元の時点の演算値(距離)は距離正規化回路7に入力し
、これを黒画素数で正規化した値(例えば演算値を黒画
素数で除した値)が距離正規化回路7より距離演算回路
2Bに入力する。距離演算回路2Bでは、この正規化距
離値がある閾値を越えたときには距離演算を打ち切ると
ともに、打ち切り通知を制御回路4Bへ送る。
距離演算が最終次元まで完了したときには、制御回路4
Bにおいて該当文字コードを辞書5Bより読出すととも
にソート指示をソーティング回路6Bへ送る。ソーティ
ング回路6Bにおいて、距離演算回路2Bより入力した
距離のデータ及び辞書5Bより入力した文字コード並び
にその時点までの候補の文字コード及び距離データを、
距離をキーとしてソートする。その後、制御回路4Bは
距離演算回路2Bをリセットし、次の標準文字の特徴量
の読出しのためのアドレシングを開始する。
距離演算が途中で打ち切りとなった場合には、制御回路
4Bは距離演算回路2Bをリセットした後、次の標準文
字の特徴量の読出しのためのアドレシングを開始する。
本実施例によれば、実質的に第1実施例と同様に認識対
象文字の黒画素数すなわち複雑さの程度に比例させて距
離演算打ち切り判定の閾値を変化させることにより、単
純な文字から複雑な文字まで、無駄な距離演算時間を減
らして認識処理を効率的に行うことができる。
第3図は本発明の第3実施例を示すブロック図である。
特徴抽出回路ICによって認識対象文字の特徴量が抽出
されて距離演算回路2Cに入力する。
制御回路4Cからのアドレシングによって辞書(メモリ
)5Cより、これから距離計算をすべき標準文字に対応
した閾値が読出されてラッチ回路8にセットされ、次に
当該標準文字の特徴が1次元ずつ読出されて距離演算回
路2Cに入力する。
なお、辞書5Cには各標準文字に対応した打ち切り判定
用閾値が格納されている。
距離演算回路2Cにおいて、標準文字の特徴量と認識対
象文字の特徴量との対応次元毎の差の累積加算による距
離演算が実行される。各次元の時点の演算値(距離)は
ラッチ回路8にセットされた閾値と比較され、演算値が
閾値を越えたときには距離演算が打ち切られるとともに
、打ち切り通11 知が制御回路4Cへ送られる。
距離演算が最終次元まで完了したときには、制御回路4
Cにおいて該当文字コードを辞書5Cより読出すととも
にソート指示をソーティング回路6Cへ送る。ソーティ
ング回路6Cにおいて、距離演算回路2Cより入力した
距離のデータ及び辞書5Cより入力した文字コード並び
にその時点までの候補の文字コード及び距離データを、
距離をキーとしてソートする。その後、制御回路4Cは
距離演算回路2Cをリセットし、次の標準文字の特徴量
の読出しのための71−レッシグを開始する。
距離演算が途中で打ち切りとなった場合には、制御回路
4Cは距離演算回路2Cをリセットした後、次の標準文
字とのマツチングのための制御を開始する。
本実施例によれば、個々の文字に最適な閾値を用いて距
離演算の打ち切り判定を行うことができるので、前記各
実施例と同様に距離演算の打ち切り効果を最大限に発揮
させることができる。
〔発明の効果〕
=12− 以上詳細に説明した如く、本発明によれば、単純な文字
から複雑な文字まで距離演算の打ち切り効果を最大限に
発揮させて認識処理を高速化することができる。
【図面の簡単な説明】
第1図、第2図及び第3図はそれぞれ本発明の第1実施
例、第2実施例及び第3実施例を示ずブロック図である
。 LA、IB、iG・・・特徴抽出回路、2A、2B、2
G・・・距離演算回路、3・・・閾値テーブル、 4A、4B、4.C・・・制御回路、 5A、5B、5C・・・辞書、 6A、6B、6G・・・ソーティング回路、7・・・距
離正規化回路、 8・・・ラッチ回路。

Claims (3)

    【特許請求の範囲】
  1. (1)認識対象文字の特徴量と辞書に格納された標準文
    字の特徴量との差の累積加算による距離演算を、演算値
    がある閾値を越えた時点で打ち切るが、該閾値を認識対
    象文字画像の黒画素数により変化させることを特徴とす
    る文字認識装置における辞書検索方式。
  2. (2)認識対象文字の特徴量と辞書に格納された標準文
    字の特徴量との差の累積加算による距離加算を、演算値
    を認識対象文字の黒画素数で正規化した値がある閾値を
    越えた時点で打ち切ることを特徴とする文字認識装置に
    おける辞書検索方式。
  3. (3)認識対象文字の特徴量と辞書に格納された標準文
    字の特徴量との差の累積加算による距離演算を、演算値
    が標準文字毎にその複雑さに応じて予め決られている辞
    書に格納された閾値を越えた時点で打ち切ることを特徴
    とする文字認識装置における辞書検索方式。
JP2018577A 1990-01-29 1990-01-29 辞書検索方式 Pending JPH03223988A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018577A JPH03223988A (ja) 1990-01-29 1990-01-29 辞書検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018577A JPH03223988A (ja) 1990-01-29 1990-01-29 辞書検索方式

Publications (1)

Publication Number Publication Date
JPH03223988A true JPH03223988A (ja) 1991-10-02

Family

ID=11975481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018577A Pending JPH03223988A (ja) 1990-01-29 1990-01-29 辞書検索方式

Country Status (1)

Country Link
JP (1) JPH03223988A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052782A (ja) * 2005-08-18 2007-03-01 Fujitsu Ltd 認識距離を調整するプログラム、装置および方法、ならびに文字列を認識するプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052782A (ja) * 2005-08-18 2007-03-01 Fujitsu Ltd 認識距離を調整するプログラム、装置および方法、ならびに文字列を認識するプログラム

Similar Documents

Publication Publication Date Title
EP2073146A1 (en) Pattern recognizing device for recognizing input pattern by using dictionary pattern
CN110502975B (zh) 一种行人重识别的批量处理系统
JPH03223988A (ja) 辞書検索方式
CN115410281A (zh) 电子签名识别方法、装置、设备及存储介质
US20050141754A1 (en) Method and system for quality based fingerprint matching
JPH03212783A (ja) マッチング方式
CN107357819A (zh) 一种搜索内容的输入方法、装置、移动终端及存储介质
CN110009110B (zh) 基于类utxo库的stn网络优化方法、存储介质
JP3074691B2 (ja) 文字認識装置
JP3121401B2 (ja) 認識辞書及び文字認識装置
JP2844789B2 (ja) 文字認識方法及び文字認識装置
JPH03154985A (ja) 最尤度単語認識方式
JPH051512B2 (ja)
JP2774113B2 (ja) 文字認識方法
JPH04316182A (ja) マッチング処理の打ち切り制御方法
JPS63121990A (ja) 文字認識装置の辞書検索方式
JPH06259602A (ja) 候補文字抽出装置
CN113449073A (zh) 一种关键词的选取方法及系统
CN116680735A (zh) 数据脱敏方法、装置、计算设备及计算机存储介质
JPS5917670A (ja) 情報検索方式
JPS61224088A (ja) 文字図形認識装置
JPH05151384A (ja) 認識文字の修正方法
JPH0259884A (ja) 文字認識装置
JPH04142689A (ja) 文字認識装置
JPH0244488A (ja) 文字認識方法及び文字認識装置