JPS6244897A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6244897A
JPS6244897A JP60184847A JP18484785A JPS6244897A JP S6244897 A JPS6244897 A JP S6244897A JP 60184847 A JP60184847 A JP 60184847A JP 18484785 A JP18484785 A JP 18484785A JP S6244897 A JPS6244897 A JP S6244897A
Authority
JP
Japan
Prior art keywords
distance
candidate
storage means
distance calculation
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60184847A
Other languages
English (en)
Inventor
Hiroyuki Kami
上 博行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60184847A priority Critical patent/JPS6244897A/ja
Publication of JPS6244897A publication Critical patent/JPS6244897A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、認識対象カテゴリ数が多い場合に適した文字
認識装置に関する。
(従来技術とその問題点) 認識対象カテゴリ数が多くなると候補カテゴリ検出速度
の低下が問題となる。従来候補カテゴリ検出速度の高速
化のために次のような手法がとられてきた。
(a)段階的な検出すなわち最初の段では少数の大局的
な特徴によって表わされた照合辞書との照合で候補カテ
ゴリを求め、次の段では次に大局的な特徴によって表わ
された照合辞書との照合で候補カテゴリを絞り、次の段
ではさらに微小な特徴にて表わされた照合辞書との照合
で絞られた候補カテゴリの内で絞っていくのを繰り返す
方法で、照合対象カテゴリ数を減らす。
(b)照合辞書はカテゴリごとでなく類似している特徴
をもつカテゴリはまとめて統合した照合辞書として仮の
カテゴリ名を付け(a)と同様に段階的に検出すること
で照合回数を減らす。
(C)認識対象カテゴリの照合辞書を使用頻度に応じて
分類し、頻度の多い分類内で類似の程度の高いカテゴリ
があれば頻度の少ない分類にある照合辞書との照合を行
なわないことで照合対象カテゴリ数を減らす。
(d)照合辞書との距離を計算するのにオーバーフロー
検出付きのレジスタを使用し距離計算の途中でオーバー
フローが生じたら次の照合辞書との距離計算に制御を変
更する。
(a)、(b)及び(e)は各カテゴリ又は仮のカテゴ
リの照合辞書の長さによって速度が決まってしまい、(
d)はレジスタのビット長によって速度の向上が限定さ
れるという問題、αがあった。
そこで、本発明の目的は、照合辞書との照合計算を照合
辞書の長さによって分けて分けられたところまでの照合
の程度で次の照合辞書との照合に制御し、候補カテゴリ
が高速に検出できる文字認識装置を提供することにある
(問題点を解決するための手段) 前述の問題点を解決するために本発明が提供する手段は
、入力された未知パターンに類似する候補カテゴリ名を
求める文字認識装置であって、前記未知パターンがら特
徴を抽出し特徴ベクトルに変換する特徴抽出手段と、認
識対象カテゴリの標準パターンの特徴を抽出し得られた
特徴ベクトルとその標準パターンのカテゴリ名とを記憶
する辞書記憶手段と、距離の小きい順に定められた数の
距離及びカテゴリの名を記憶する候補記憶手段と、前記
未知パターンの特徴ベクトルと前記辞書記憶手段に記憶
されている一つの標準パターンの特徴ベクトルとの距離
を求めるのにベクトルの次元を分け9分けた途中までの
累積圧mが前記候補記憶手段にある距離のうちの最大の
距離より大きいときは次の前記標準パターンの特徴ベク
トルとの距蔑計算に制御を移し、前記累積距離が前記最
大距離より小さいときは距離計算を続行し最後の次元ま
での距離と前記標準パターンのカテゴリ名とを出力する
距離計算制御手段と、前記距離計算制御手段からの距離
と前記候補記憶手段にある距難との比較により前記候補
記憶手段にある距離とカテゴリ名との更新を行なう候補
制御手段とを有することを特徴とする。
(作用) 本発明では、照合辞書が特徴ベクトルで表現されている
ときに距離計算の途中で、途中までの距離と今までの照
合で得られた候補カテゴリの内で最大の距離との比較を
行ない、途中までの距離の方が大きければ残りの部分の
距離計算を行なわないで候補カテゴリを検出する。距離
はベクトルの積和演算で求まり、積和の途中までの距離
と最大距離との比較を行なっても比較の時間は積和の時
間に比べて無視できるほど小さい。そこで、本発明では
、途中までの距離が最大距離より大きければ、残りの部
分に対する積和演算を中止して次のベクトルの距離計算
に入るようにすることで、照合時間の短縮を計っている
候補カテゴリが求まると、候補カテゴリの距離の中から
最小距離d□と次設小距離d、とを検出し、絶対同値T
工と相対閾値T2によって次の判定を行なうのが一般的
である。
■d1≦T1か・つ市−d、≧T、のときには最ノド距
離d。
であるカテゴリ名を判定結果とする。
■dI>TIであれば読取り不能を判定結果とする。
■d、≦TIかつdz  dI<Ttであれば、d、と
d2の距離をもつカテゴリを次のペア判定手段に送るか
、゛または読取り不能を判定結果とする。
従って類似パターンの数が最大2個に限定できる一合、
候補カテゴリ数や相対閾値T2を候補カテゴリ検出に使
用することにより、本発明ではさらに高速化が計れる。
(実施例) 以下、本発明の実施例を図面を参照して詳細に説明する
第1図は本発明の一実施例の装置のブロック図である。
同図において信号10け帳票の反射光で、観測手段1へ
入力される。観測手段1は帳票上のパターンを光学的に
走査して信号10を得て、信号10を光電変換する。光
電変換して得られる電気信号について票面の白の部分は
”0”に、黒の部分は”1”に量子化して2値信号を生
成することにより、1文字ごとに切出した文字パターン
を得る。
この文字パターンを表わす2次元の配置にある”0“と
”1″を信号11として特徴抽出手段2に出力する。特
徴抽出手段2は、信号11からその未知の文字パターン
の特徴の抽出を行って特徴ベクトルを得、この特徴ベク
トルを信号21として距離計算制御手段4に出力する。
辞書記憶手段3は、認識対象カテゴリの標準パターンか
ら特徴抽出し得られた特徴ベクトルと対応するカテゴリ
名とを記憶していて、前記文字パターンが特徴ベクトル
に変換され距離計算制御手段4に出力された後で以下の
検出処理が開始され、このとき記憶している特徴ベクト
ルとカテゴリ名とを一つづつ信号31として出力する。
2つの特徴ベクトル間の距離は、対応するベクトル要素
間距離を特徴ベクトルの次元数だけ累積することで求ま
る。
候補記憶手段5は、距離が小さい順に決まった数の距離
と対応する標準パターンのカテゴリ名とを記憶しておく
記憶部をもち、複数個ある距離の記憶部は判定処理開始
前に大きな値で初期化しておく。距離計算制御手段4は
、信号21の前記文字パターンからの特徴ベクトルと信
号31の辞書の特徴ベクトルとの距離計算を行なうのに
、まず予め決めた回数の要素間距離までの累積である距
離を求める。次に求まった距離と候補記憶手段5からの
最大の距離である信号51との比較を行なう。比較して
最大の距離の方が小きければ、残りの要素に対する距離
計算を中断して辞書記憶手段3から次の標準パターンの
特徴ベクトルとの距離計算に制御を移す。また、最大の
距離の方が大きければ、前記法められた回数の距離計算
処理を繰り返す。そして、全部の次元までの距離計算が
繰り返されたときは、得られた距離と信号31として入
力した標準パターンのカテゴリ名とを信号41として出
力する。
候補制御手段6は候補記憶手段5に記憶されている距離
の小さい順に並べられた複数個の距離と信号41の距離
とを比較して第1位と第2位の距離とカテゴリ名の更新
を行なう。
上記処理の流れ図を第2図(b)に示す。
また候補カテゴリ数が2個にでき、第1位の距離と第2
位との距離の差が閾値以上でなければならないという条
件を使用するとさらに高速化が可能である。距離計算制
御手段4.候補記憶手段5及び候補制御手段6は次の処
理を行なう。
候補記憶手段5は距離が小さい順に第1位と第2位の距
離と対応する標準パターンのカテゴリ名とを記憶してお
く記憶部をもち、二つの距離の記憶部は判定処理開始前
に大きな値で初期化しておく。距離計算制御手段4は信
号21の文字パターンからの特徴ベクトルと信号31の
辞書の特徴ベクトルとの距離計算を行なうのに、まず予
め決めた回数の要素間距離までの累積である距離を求め
る。次に求まった距離と候補記憶手段5からの第1位の
距離に閾値を加えた値と第2位の距離のうちの小さい側
である信号51との比較を行う。前記信号51が小さけ
れば残りの要素に対する距離計算を中断して辞書記憶手
段3からの標準パターンの特徴ベクトルとの距離計算に
制御を移す。又、信号51が大きければ前述の決められ
た回数の距離計算処理を繰り返し、全部の次元までの距
離計算が繰り返きれたときは得られた距離と信号31と
して入力した標準パターンのカテゴリ名とを信号41と
して出力する。
この場合の処理は、同様に流れ図で表わすと第2図(c
)となる。
4.5及び6は実際にはマイクロプロセッサ−で構成さ
れたシステムのプログラムによって処理される。第3図
は第1図実施例の要部をマイクロプロセッサ−で構成し
てなるシステムの具体例のブロックである。
第3図において、401はマイクロプログラムを格納す
るROMとシーフェンス制御手段で、402はALU(
算術論理演算回路)、403は距離とカテゴリ名とを一
時的に記憶するRAMであり、402はデータバス40
4を通してデータの受は渡しを行なう。候補カテゴリ名
はインタフェース701を介して出力され、また特徴抽
出手段2はインタフェース201を介してつながってい
て、入カバターンの特徴ベクトルが入力される。
(発明の効果) 以上説明したように本発明によれば距離を累積する途中
で距離が大きくなれば残りの次元についての距離計算が
不要となるので認識時間の短縮が計れ効果は大である。
また従来の距離計算の一部を変更するだけですむので効
率的である。本発明は複数回の距離計算で得られる累積
距離との比較に限定されず一回ごとに比較しても良いこ
とは言うまでもない。
上記実施例では文字パターンから特徴抽出を行ない得ら
れる特徴ベクトルで距離計算を行なっているが、文字パ
ターンの”0”と”1”とを用いて距離計算する方法も
利用出来る。
また本発明は文字に限らず一般のパターンに対しても適
用可能である。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図である。第2図
(a)〜(c)は第1図実施例の要点の処理を示す流れ
図である。第3図は第1図実施例の要部を詳細に示すブ
ロック図である。 図において、1は観測手段、2は特徴抽出手段・、3は
辞書記憶手段、4は距離計算制御手段、5は候補記憶手
段、6は候補制御手段である。 代理人 弁理士 本 庄 伸 介 第30

Claims (3)

    【特許請求の範囲】
  1. (1)入力された未知パターンに類似する候補カテゴリ
    名を求める文字認識装置において、前記未知パターンか
    ら特徴を抽出し特徴ベクトルに変換する特徴抽出手段と
    、認識対象カテゴリの標準パターンの特徴を抽出し得ら
    れた特徴ベクトルとその標準パターンのカテゴリ名とを
    記憶する辞書記憶手段と、距離の小さい順に定められた
    数の距離及びカテゴリ名を記憶する候補記憶手段と、前
    記未知パターンの特徴ベクトルと前記辞書記憶手段に記
    憶されている一つの標準パターンの特徴ベクトルとの距
    離を求めるのにベクトルの次元を分け、分けた途中まで
    の累積距離が前記候補記憶手段にある距離のうちの最大
    の距離より大きいときは次の前記標準パターンの特徴ベ
    クトルとの距離計算に制御を移し、前記累積距離が前記
    最大距離より小さいときは距離計算を続行し最後の次元
    までの距離と前記標準パターンのカテゴリ名とを出力す
    る距離計算制御手段と、前記距離計算制御手段からの距
    離と前記候補記憶手段にある距離との比較により前記候
    補記憶手段にある距離とカテゴリ名との更新を行なう候
    補制御手段とを有することを特徴とする文字認識装置。
  2. (2)特許請求の範囲第1項記載の文字認識装置におい
    て、前記候補記憶手段の候補カテゴリ数を距離の小さい
    順に整列された2個とすることを特徴とする文字認識装
    置。
  3. (3)特許請求の範囲第一項記載の文字認識装置におい
    て、前記候補記憶手段の候補カテゴリ数を2個とし、前
    記候補制御手段は距離計算制御手段からの距離と、前記
    候補記憶手段の第1位の距離に閾値を加えた値と第2位
    の距離とのうちの小さい方とを比較して、前記距離計算
    制御手段における前記距離計算を続行するか否かを制御
    することを特徴とする文字認識装置。
JP60184847A 1985-08-22 1985-08-22 文字認識装置 Pending JPS6244897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60184847A JPS6244897A (ja) 1985-08-22 1985-08-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60184847A JPS6244897A (ja) 1985-08-22 1985-08-22 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6244897A true JPS6244897A (ja) 1987-02-26

Family

ID=16160353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60184847A Pending JPS6244897A (ja) 1985-08-22 1985-08-22 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6244897A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
JPH03212783A (ja) * 1990-01-18 1991-09-18 Ricoh Co Ltd マッチング方式
JPH03220685A (ja) * 1990-01-26 1991-09-27 Ricoh Co Ltd マッチング方法
JPH07287717A (ja) * 1994-02-28 1995-10-31 Fujitsu Ltd 共通構造抽出装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
JPH03212783A (ja) * 1990-01-18 1991-09-18 Ricoh Co Ltd マッチング方式
JPH03220685A (ja) * 1990-01-26 1991-09-27 Ricoh Co Ltd マッチング方法
JPH07287717A (ja) * 1994-02-28 1995-10-31 Fujitsu Ltd 共通構造抽出装置
US6453064B1 (en) * 1994-02-28 2002-09-17 Fujitsu Limited Common structure extraction apparatus

Similar Documents

Publication Publication Date Title
EP0085545B1 (en) Pattern recognition apparatus and method for making same
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
EP0736857A3 (en) Speech recognizing method and apparatus, and speech translating system
KR19990010210A (ko) 대용량 패턴 정합 장치 및 방법
JPS6244897A (ja) 文字認識装置
CN110163136B (zh) 一种基于感知机的指纹和指静脉双模态识别决策融合方法
JPS60132280A (ja) 直線/曲線デ−タ分離装置
JPS62271190A (ja) セグメント数字認識方式
JPS63136286A (ja) オンライン文字認識方式
JP2851865B2 (ja) 文字認識装置
JPS6334682A (ja) 文字認識装置
CN114387653A (zh) 视频数据处理方法、装置、设备及存储介质
JPS5922178A (ja) 図形認識装置
JPS62280985A (ja) 光学文字読み取り装置
JPS6327991A (ja) 入力情報認識装置用ヒストグラム作成方法
JPH05197813A (ja) 特徴選択方法
CN112329589A (zh) 一种基于高维特征算法的人脸识别方法
JPH0362289A (ja) 文字認識方法及び装置
JPH07104911B2 (ja) パタ−ン認識装置
JPS575182A (en) Character recognition processing system
JPH05258117A (ja) 文字認識装置
JPH02165287A (ja) 文字列入力方式
JPS6379192A (ja) 文字認識装置
JPH06187506A (ja) 文字認識装置
JPH0557633B2 (ja)