JPH04142689A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04142689A
JPH04142689A JP2266060A JP26606090A JPH04142689A JP H04142689 A JPH04142689 A JP H04142689A JP 2266060 A JP2266060 A JP 2266060A JP 26606090 A JP26606090 A JP 26606090A JP H04142689 A JPH04142689 A JP H04142689A
Authority
JP
Japan
Prior art keywords
register
dictionary
data
character
bits
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2266060A
Other languages
English (en)
Inventor
Hiromi Ishizaki
寛美 石崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2266060A priority Critical patent/JPH04142689A/ja
Publication of JPH04142689A publication Critical patent/JPH04142689A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、辞書マツチングの処理を高速化した文字認識
装置に関する。
〔従来技術〕
文字認識の認識手法の一つとして、多層方向ヒストグラ
ム法がある。この方法は、文字パターンの輪郭画素に方
向コードを付加し、文字パターン枠の各辺から対向辺に
向かって枠内を走査して白(背景)の次に出現する方向
コードを検出し、走査線上で最初に検出した場合は第1
層、2番目に検出した場合は第2層、というように検出
方向コードを層別する。そして、文字パターン枠内の分
割領域毎に、ある層までの層別の各方向コードのヒスト
グラムを求め、それぞれのヒストグラム値を成分とする
ベクトルを文字パターンの特徴ベクトルとして利用する
ものである。
文字認識を行う場合、このような特徴ベクトルを入力文
字パターンから抽出し、辞書の特徴ベクトルとのマツチ
ングを行うことによって入力文字を認識する。
このような多層方向ヒストグラム法は、手書き漢字のよ
うな変形の大きい文字に対して高い認識率を得ることが
できるものの、その反面特徴ベクトルの次元数が多いと
いう欠点がある。例えば、方向コードとして8種類のコ
ードを付加し、文字パターン枠内を4×4の領域に縦横
に分割し、第2層までの方向コードを抽出した場合、特
徴ベクトルの次元数は256 (=4x4x2x8)と
なる。
このように特徴ベクトルの次元数が多いと、辞書が大容
量になり、また辞書とのマツチング演算量が増加してマ
ツチング時間が長くなるという問題がある。
そこで、本出願人は、256次元の特徴ベクトルを非線
形量子化によって64次元(64バイト)に特徴ベクト
ルを圧縮することにより、辞書容量を削減した文字認識
装置を提案した(特開昭64−7184号公報)。
〔発明が解決しようとする課題〕
第3図は、1バイトの圧縮データの構成を示し、上位か
らの4ビツト、3ビツト、1ビツトはそれぞれ量子化レ
ベル数を表している。
第4図は、上記1バイトの圧縮データで構成された辞書
と抽出された特徴量とのマツチング距離を演算する従来
の辞書マツチングの構成図である。
また、第5図は、従来の辞書からの読みだし方法を示す
図である。
すなわち、辞書の1文字目を構成する64バイトのデー
タと64バイトの特徴量とをそれぞれ図示しないテーブ
ルを参照することによって圧縮前のデータに展開しなが
らマツチング距離を演算し、その距離を累積することに
よって、1文字の距離を算出する。この距離が所定の閾
値内のものについて、距離値の小さい順にn個の文字を
認識候補文字として出力する。そして、所定の閾値を超
える文字については、距離演算を中止する。
しかしながら、このような従来の辞書マツチングの方法
によれば、類似していない辞書の文字をアクセスすると
き、重みの小さいデータを読みだしているために多くの
データを読みださなければならず、辞書メモリに対する
アクセス回数が多くなり、マツチング時間が長くなると
いう問題があった。
本発明の目的は、重みの大きいデータを先に読みだすこ
とにより辞書マツチングの処理を高速に行う文字認識装
置を提供することにある。
〔課題を解決するための手段] 前記目的を達成するために、本発明では、特徴ベクトル
を圧縮した辞書を有する文字認識装置において、該辞書
の各文字領域を、重みの大きい圧縮データ領域と重みの
小さい圧縮データ領域によって構成し、入力文字の特徴
ベクトルと前記辞書の特徴ベクトルとのマツチング距離
を算出するときに、前記辞書の重みの大きい圧縮データ
を先に読みだすことを特徴としている。
〔作 用〕
本発明によれば、重みの大きな圧縮データから距離演算
を行っているので、類似していない辞書の文字との距離
演算では、従来の方法に比べて速く所定の閾値を超える
ため、演算を中止することができ、従って辞書マツチン
グ時間を従来のものに比べて短縮できる。
[実施例] 以下、本発明の一実施例を図面を用いて具体的に説明す
る。
第1図は、本発明の一実施例に係る文字認識装置の具体
的な構成を示す図である。図において、1は特徴量が格
納されている64バイトの特徴量レジスタ、2は該特徴
量レジスタ1のアドレスが保持される特徴量アドレスレ
ジスタ、3は辞書メモリ、4は辞書メモリ3のアドレス
が保持される辞書アドレスレジスタ、5は特徴量レジス
タ1から読みだされたデータが保持されるレジスタ、6
は辞書メモリから読みだされたデータが保持されるレジ
スタ、7.8はそれぞれレジスタ5.6の上位4ビツト
と下位4ビツトとを選択する選択回路、91.92.9
3は圧縮前のデータを生成するためのテーブルメモリ、
10.11はテーブルメモリ91.92.93から読み
だされたデータがセットされるレジスタ、12はレジス
タ10.11のデータの差を求める減算器、13はその
差を累積する累積器である。
第2図は、本発明の辞書メモリの構成を示し、従来の辞
書メモリの構成と相違する点は、重みの大きい(すなわ
ち、情報量が多い)4ビツトを上位と下位に配置するこ
とによって1バイトを構成し、このようなバイト構成の
データを32バイト分(1文字目のデータの半分)、辞
書メモリの低位のアドレスから記憶する。そして、次の
アドレスから、]文字目の残りのデータ、すなわち重み
の小さいビットのデータが1バイトを構成して32バイ
ト分記憶される。以下、同様にして2文字目の重みの大
きいデータ(2文字目のデータの半分)、次いで重みの
小さいデータ(2文字目のブタの半分)が記憶され、3
文字目以降も同様である。
従って、辞書メモリの読みたしは、1文字の重みの大き
い32バイトのデータを読みだし、続いて重みの小さい
32バイトのデータを読みだすことになる。
以下に、本発明の動作を図面を参照しつつ詳細に説明す
る。
特徴量レジスタ1がらm番目の特徴量を読みだし、レジ
スタ5に格納する。辞書メモリ3がらn文字目のm番目
のデータを読みだして、レジスタ6に格納する。レジス
タ5の上位4ビツトが選択回路7によって選択され、該
上位4ビツトをアドレスとしてテーブルメモリ91を参
照する。該テブルメモリ91から読みだされた圧縮前の
データはレジスタ10に格納される。同様に、レジスタ
6の上位4ビツトが選択回路8によって選択され、メモ
リアドレスとなってテーブルメモリ91を参照する。該
テーブルメモリ91がら読みだされたデータはレジスタ
11に格納される。そして、レジスタ10.11の値の
差が減算器12によって求められ、その結果が累積器1
3に加算される。
次いで、レジスタ5.6の下位4ビツトに対しても前述
したと同様に処理する。
重みの大きいデータが全て読みだされると、続いて、重
みの小さい32バイトに読みだし処理が移り、前述した
と同様にして処理される。ただし、選択回路7.8はレ
ジスタ5.6の上位4ビツトの内の3ビツトをまず選択
し、該3ビツトでテーブルメモリ92を参照して、距離
を算出し、続いて上位4ビツトの内の1ビツトを選択し
、該1ビツトでテーブルメモリ93を参照して、距離を
算出する。下位4ビツトについても同様である。
以上の処理を1テンプレート(辞書の1文字分の特徴量
)に対して行い、辞書の対象文字との距離を累積器13
に累積し、所定の閾値以下のときその距離を登録する。
従って、辞書の文字と類似していないときは、辞書メモ
リの重みの大きなデータから距離演算を行っているので
、その累積値が所定の閾値を超え、その文字領域へのア
クセスを中止することができる。この結果、従来のアク
セス方法に比べてそのアクセス回数が削減される。
そして、次の文字についても同様の距離演算を実行する
。この動作と平行して距離が所定の閾値以下であって、
距離の小さい順番に候補文字を並べ替える図示しない手
段が機能し、第n候補までを演算し、その第n候補目の
距離を距離演算の打ち切りとして使用する。
[発明の効果] 以上、説明したように、本発明によれば、辞書メモリの
重みの大きなデータから距離演算を行っているので、類
似していない辞書の文字との距離演算では所定の閾値を
超えるため、演算を中止することができ、従って辞書マ
ツチング時間を従来のものに比べて短縮することができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識装置の具体的
な構成を示す図、第2図は本発明の辞書メモリの構成を
示す図、第3図は従来の1バイトの圧縮データの構成を
示す図、第4図は従来の辞書マツチングの構成図、第5
図は従来の辞書からの読みだしを方法を示す図である。 1・・・特徴量レジスタ、 2・・・特徴量アドレスレジスタ、 3・・・辞書メモリ、 4・・・辞書アドレスレジスタ、 5.6,10.11・・・レジスタ、 7.8・・・選択回路、 91.92.93・・テーブルメモリ、第 1図 二と胃巳 第2図

Claims (1)

    【特許請求の範囲】
  1. (1)特徴ベクトルを圧縮した辞書を有する文字認識装
    置において、該辞書の各文字領域を、重みの大きい圧縮
    データ領域と重みの小さい圧縮データ領域によって構成
    し、入力文字の特徴ベクトルと前記辞書の特徴ベクトル
    とのマッチング距離を算出するときに、前記辞書の重み
    の大きい圧縮データを先に読みだすことを特徴とする文
    字認識装置。
JP2266060A 1990-10-03 1990-10-03 文字認識装置 Pending JPH04142689A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2266060A JPH04142689A (ja) 1990-10-03 1990-10-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2266060A JPH04142689A (ja) 1990-10-03 1990-10-03 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04142689A true JPH04142689A (ja) 1992-05-15

Family

ID=17425823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2266060A Pending JPH04142689A (ja) 1990-10-03 1990-10-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04142689A (ja)

Similar Documents

Publication Publication Date Title
US20220139085A1 (en) Method and apparatus for video frame processing
KR101192365B1 (ko) 얼굴 검출 시스템 및 그 방법
CN111814618A (zh) 行人重识别方法、步态识别网络训练方法及相关装置
JPH04142689A (ja) 文字認識装置
KR20220068357A (ko) 딥러닝 객체 검출 처리 장치
KR19990016894A (ko) 영상 데이터베이스 검색방법
CN111783655A (zh) 一种图像处理方法、装置、电子设备和存储介质
JP2801602B2 (ja) 単語認識装置
JP2540899B2 (ja) ソ―タ記憶管理方式
JP2940974B2 (ja) マッチング方法
JP3046711B2 (ja) 相関演算装置
JP2931934B2 (ja) 数値検索装置
JPH03240187A (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JPH03212783A (ja) マッチング方式
JPH0557633B2 (ja)
JPH03268088A (ja) 総合評価回路
JP3483416B2 (ja) 文書画像構成要素抽出方法および装置
JPH03189889A (ja) 辞書メモリアクセス方法
CN116993571A (zh) 图像数据处理装置及方法
CN114913591A (zh) 一种眼周特征提取方法、装置、设备及介质
JPH03100776A (ja) 矩形及び表領域抽出方式
JPH04340684A (ja) マルチフォント印刷漢字認識装置
JPS5814708B2 (ja) パタ−ン認識装置の分類装置
JPH03214285A (ja) データ変換方式