JP2938276B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2938276B2
JP2938276B2 JP4173165A JP17316592A JP2938276B2 JP 2938276 B2 JP2938276 B2 JP 2938276B2 JP 4173165 A JP4173165 A JP 4173165A JP 17316592 A JP17316592 A JP 17316592A JP 2938276 B2 JP2938276 B2 JP 2938276B2
Authority
JP
Japan
Prior art keywords
flag
character
character image
mesh
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4173165A
Other languages
English (en)
Other versions
JPH0620098A (ja
Inventor
純司 三谷
義弘 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP4173165A priority Critical patent/JP2938276B2/ja
Publication of JPH0620098A publication Critical patent/JPH0620098A/ja
Application granted granted Critical
Publication of JP2938276B2 publication Critical patent/JP2938276B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を含む原稿を画像
として読取り、読取った文字画像を文字として認識する
文字認識装置に関する。
【0002】
【従来の技術】従来、漢字を含む文字を対象とする文字
認識において、様々な認識方法が提案されているが、漢
字は1字1字のパターンが複雑で、字種も当用漢字だけ
でも1945字あり、さらに印刷活字でも明朝体やゴシ
ック体などがあり、手書き文字まで含めると、機械で認
識させることが非常に難しい。このため、個々の装置に
おいて、マッチング法や構造解析などの種々の方法の組
合せによって認識精度向上および処理の高速化のための
工夫が試みられている。
【0003】また前記のように、漢字は複雑な上に字種
が多いので、1度に1つの文字を認識してしまうより
も、特徴によって大分類をして、似通った文字のグルー
プ(カテゴリ)に分けて、次にそのグループの中を細か
く識別して、最後に1つの文字として認識するという方
法が採られている。
【0004】
【発明が解決しようとする課題】図6は、従来行われて
いる一般的な大分類の動作を示すフローチャートであ
る。ステップk1で切出された1つの文字画像を認識す
る場合、ステップk2で特徴抽出を行い、ステップk3
〜k5で、大分類辞書に含まれる全てのカテゴリ毎に、
各カテゴリを代表する標準パターンと照合し、その標準
パターンと入力された文字画像とがどの程度類似してい
るのかを数値で表すための単純類似度計算を行い、ステ
ップk6で、この結果得られた数値に基づいて、類似度
順に全カテゴリを並べ換え、ステップk7で、上位第1
位〜n位までのカテゴリを大分類の分類結果とする。
【0005】ステップk8〜k10では、ステップk7
で出力されたカテゴリに含まれる文字認識辞書内の全て
の標準パターンと詳細な照合を行い、類似度を計算し、
ステップk11でこの類似度に基づいて文字コードを並
べ換え、ステップk12で、そのうち上位1位〜m位の
文字コードを認識結果として出力する。
【0006】このような場合、大分類においても単純類
似度計算および計算結果の並べ換えを行うので、計算量
が多く、認識処理に比較的長時間を要する。
【0007】本発明の目的は、認識処理における計算量
を減少し、高速な文字認識処理を行える文字認識装置を
提供することである。
【0008】
【課題を解決するための手段】本発明は、文字画像を入
力する入力手段と、複数の規準文字画像が互いに類似す
るグループに分類され、各グループ毎に標準文字画像と
該標準文字画像をメッシュに区切った場合の各行での特
徴量が最大になる可能性のあるメッシュ位置を示す標準
フラグデータが記憶される文字辞書と、入力文字画像を
メッシュに区切った場合の各行での特徴量が最大になる
メッシュ位置を示すフラグデータを求め、このフラグデ
ータと適合する標準フラグデータのグループを求め、各
グループの標準文字画像との照合を行い、類似度が予め
定めるしきい値以上のグループに分類されている各規準
文字画像との照合を行い、類似度順に認識結果として出
力する認識手段とを含むことを特徴とする文字認識装置
である。
【0009】
【作用】本発明に従えば、文字認識装置は、複数の規準
文字画像が互いに類似するグループに分類され、各グル
ープ毎に特徴を示す標準フラグデータおよび標準文字画
像が記憶される文字辞書を有し、認識手段において入力
手段によって入力された文字画像の特徴を示すフラグデ
ータを求め、このフラグデータと適合する標準フラグデ
ータのグループを求め、各グループの標準文字画像との
照合を行い、類似度が予め定めるしきい値以上のグルー
プに分類されている各規準文字画像との照合を行い、類
似度順に認識結果として出力する。
【0010】
【実施例】図1は、本発明の一実施例の全体の構成を示
すブロック図である。CPU(中央処理装置)2は、本
装置全体を制御する演算処理用の中央処理部である。R
OM(リードオンリメモリ)3は、CPU2の処理プロ
グラムなどを格納するメモリである。RAM(ランダム
アクセスメモリ)4は、CPU2の作業バッファ22を
提供するとともに、後述する入力部5からの入力画像の
座標データを記憶する画像メモリ19、特徴抽出部7か
らの特徴データメモリ21、特徴抽出部7において、特
徴データから作成される大分類フラグメモリ20などを
含む。
【0011】入力部5は、イメージスキャナなどの文字
画像入力装置であり、画像メモリ19に、これらの文字
画像を出力する。切出部6は、画像メモリに蓄えられた
画像から、1文字分の文字画像を切出す。前述のCPU
2が、これを行ってもよい。
【0012】特徴抽出部7は、予め定められた方法で、
切出された文字画像の特徴量を抽出し、後述の認識用特
徴パターンを作成して、これをもとに大分類フラグを作
成し、RAM4の大分類フラグメモリ20、特徴データ
メモリ21にそれぞれ格納する。
【0013】認識部8は、大分類演算部12と、詳細識
別部13と、大分類辞書部14と、認識用辞書部15と
から成る。大分類辞書部14は、後述の8×8ビットの
2値メッシュフラグである辞書フラグ16と、大分類に
よって分類される各カテゴリを代表する標準パターンの
ファイルである大分類用辞書17、入力された文字画像
の特徴パターンと、大分類用辞書17との照合の結果と
して得られる単純類似度と比較して、カテゴリの単純類
似度がこの値を超えた場合のみ、後述の詳細識別を行う
ところの、各カテゴリ毎のしきい値18とを記憶するメ
モリである。
【0014】大分類演算部12は、大分類辞書部14に
記憶された標準データをもとに大分類を行う。認識用辞
書部15は、各1文字に対応して作成された標準パター
ンを記憶するメモリであり、詳細識別部13は、大分類
によって選び出されたカテゴリ内の全文字について、1
文字単位の標準パターンと詳細な照合を行う。インタフ
ェイス9は、プリンタや磁気ディスクなどの外部出力1
0に、文字認識装置1からのデータを出力するための接
続部である。表示部11は、液晶表示装置などの表示装
置であり、文字認識装置1の認識結果などを表示する。
【0015】図2は、抽出された文字画像の特徴パター
ンのうち、8×8のメッシュ特徴および8×8ビットの
2値メッシュフラグである大分類フラグを説明する図で
ある。
【0016】図2(1)は、8×8のメッシュ特徴を説
明する図である。8×8のメッシュ特徴とは、1文字画
像を縦横にそれぞれ8等分して64メッシュに区切り、
それぞれのメッシュの中で画像の特徴量を抽出し、8×
8次元ベクトルあるいはマトリクスで表したものであ
る。
【0017】図2(2)は、図2(1)に示されるメッ
シュ特徴から作成される2値メッシュフラグである。図
2(1)のメッシュ特徴における行が、それぞれ2値メ
ッシュフラグの各8ビットに対応しており、メッシュ特
徴の各行で特徴量が最大になる位置に、対応するメッシ
ュフラグのビットを1に、その他のビットを0にする。
たとえば、ある行の特徴として(0,11,25,3
6,33,20,8,7)が得られた場合、その行に対
するフラグには、(00010000)を設定する。
【0018】図3は、8×8のメッシュ特徴量抽出の一
例を示す図である。まず、切出された文字画像を8×8
のメッシュに分割する。図3(1)に示すように、文字
画像を縦横に8等分する。特徴抽出部7は、たとえば図
3(2)に示すように、64等分された各メッシュにつ
いて濃度分布を求める。濃度分布特徴量は、一般に、メ
ッシュ中の黒点の数を求め、さらに縦横のバランスを図
るため、メッシュを構成する全画素数で割ったものを定
数倍して整数化し用いる。
【0019】図3(1)の左下のメッシュに着目する
と、このメッシュ内の黒点の数は45であり、横方向の
画素数は8(ドットの数)である。図3(1)において
は、メッシュ特徴量を簡略化して説明するため、黒点の
数をメッシュの横方向の画素数で割っている。ここで、
濃度分布特徴量は約5である。このようにして、メッシ
ュ毎の特徴量を抽出し、図3(3)のメッシュ特徴を得
る。
【0020】図4は、8×8ビットの2値メッシュフラ
グである大分類フラグと辞書フラグとを説明する図であ
る。
【0021】図4(1)は、図3(3)のメッシュ特徴
から作成された大分類フラグである。図3(3)に示す
メッシュ特徴の各行の特徴量が最大である位置に対応す
る大分類フラグのビット、たとえば、メッシュ特徴の1
行4列目、2行4,5列目、3行5列目、…、8行2,
7列目に対応して、大分類フラグの1行4列目、2行
4,5列目、3行5列目、…、8行2,7列目の各ビッ
トが1に、他のビットは0に設定されている。
【0022】図4(2)は、カテゴリ毎に予め設定され
る辞書フラグ16の一例である。辞書フラグ16は、カ
テゴリ毎に各行の特徴量が最大になる可能性のある位置
に対応するビットが1に、可能性のないビットが0に設
定される。
【0023】大分類フラグと辞書フラグとの照合の際
に、大分類フラグにおいて1であり、辞書フラグにおい
てそれに対応するビットが0となるようなビットがあれ
ば、そのカテゴリについては以後の認識処理を行わな
い。
【0024】図5は、本実施例の文字認識装置1が1文
字の認識を行う際の動作を示すフローチャートである。
【0025】ステップm1で切出部6は、画像メモリ1
9に記憶されている画像から、1文字分の文字画像を切
出し、特徴抽出部7に出力する。ステップm2で、特徴
抽出部7は、予め定められた方法で予め定められた数の
8×8メッシュ特徴を作成し、それぞれ特徴データメモ
リ21に出力する。
【0026】ステップm3では、特徴抽出部7におい
て、前記8×8メッシュ特徴に基づいて8×8ビット2
値メッシュフラグである大分類フラグが作成され、大分
類フラグメモリ20に記憶される。ステップm4では、
認識部8において、大分類辞書部14内から、各カテゴ
リの辞書フラグ16、大分類用辞書17、しきい値18
が大分類演算部12に読出される。ステップm5におい
て、大分類辞書部14内に照合すべきデータの有無を判
断し、データがあれば次のステップm6に移る。
【0027】ステップm6では、大分類フラグと辞書フ
ラグとの照合が行われる。この際、大分類フラグにおい
て1で、辞書フラグの対応するビットが0となるような
ビットがあれば、そのカテゴリについては以後の処理を
行わず、ステップm4に戻り、次のカテゴリの大分類処
理を行う。大分類フラグと辞書フラグとの照合において
適合したカテゴリは、次のステップm7の処理を受け
る。
【0028】ステップm7において、大分類演算部12
は、8×8メッシュ特徴と大分類用辞書7との照合を行
い、単純類似度を計算する。この際、単純類似度は、大
分類用辞書特徴ベクトルと、8×8メッシュ特徴ベクト
ルとの内積とする。
【0029】次のステップm8において、ステップm7
で計算された単純類似度の値が、予めカテゴリ毎に設定
されたしきい値と比較され、単純類似度の値がしきい値
以下となったカテゴリについては、以後の詳細識別を行
わず、ステップm4に戻り、次のカテゴリの大分類処理
に移る。単純類似度がしきい値を超えたカテゴリについ
ては、次のステップm9に移り、詳細識別を行う。
【0030】ステップm9では、詳細識別部13に認識
用辞書15が読出され、単純類似度がしきい値を超えた
カテゴリに属する全文字に関して、詳細な識別が行われ
る。詳細識別において、詳細識別部13は、8×8メッ
シュ特徴ベクトルと認識用辞書15との類似度を計算し
た後、ステップm4に戻り、大分類用辞書7内の次のカ
テゴリを読出す。次のステップm5で、大分類辞書7内
の全カテゴリとの照合が終了したと判断されると、ステ
ップm10に移る。
【0031】次のステップm10において、ステップm
9で計算され、蓄積された類似度をもとに、類似度順に
対応する文字コードを並べ換える。ステップm11で
は、ステップm10で並べ換えられた文字コードの第1
位〜第n位を、認識結果としてRAM3に出力する。
【0032】このように本実施例において、予め設定し
た2値フラグと、得られたメッシュ特徴で決定される2
値フラグとの照合という簡単な計算によって、単純類似
度を求めるべきカテゴリを限定することができる。ま
た、さらに、単純類似度の値に基づくカテゴリの並べ換
えを行わず、カテゴリ毎に予め設定されたしきい値と比
較することによって、適合、不適合を決定する。これに
よって、大分類の計算量を減少することができ、文字認
識処理の高速化を図ることができる。
【0033】
【発明の効果】以上のように本発明によれば、入力文字
画像の特徴を示すフラグデータを求め、このフラグデー
タと適合する標準フラグデータのグループを求め、各グ
ループの標準文字画像との照合を行い、類似度が予め定
めるしきい値以上のグループに分類されている各規準文
字画像との照合を行うので、入力文字画像が属するグル
ープの認識処理において計算量が少なく、したがって高
速な文字認識処理を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例の全体の構成を示すブロック
図である。
【図2】抽出された文字画像の特徴パターンのうち、8
×8のメッシュ特徴および8×8ビットの2値メッシュ
フラグである大分類フラグを説明する図である。
【図3】8×8のメッシュ特徴量抽出の一例を示す図で
ある。
【図4】8×8ビットの2値メッシュフラグである大分
類フラグと、辞書フラグとを説明する図である。
【図5】本実施例の文字認識装置1が1文字の認識を行
う際の動作を示すフローチャートである。
【図6】従来行われている一般的な大分類の動作を示す
フローチャートである。
【符号の説明】
1 文字認識装置 2 CPU 5 入力部 7 特徴抽出部 8 認識部 12 大分類演算部 13 詳細識別部 14 大分類辞書部 15 認識用辞書部 16 辞書フラグ 17 大分類用辞書 18 しきい値
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−118993(JP,A) 特開 昭63−83891(JP,A) 特開 昭63−126082(JP,A) 特開 昭63−131287(JP,A) 特開 昭61−272887(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/46 G06K 9/62

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字画像を入力する入力手段と、 複数の規準文字画像が互いに類似するグループに分類さ
    れ、各グループ毎に標準文字画像と該標準文字画像をメ
    ッシュに区切った場合の各行での特徴量が最大になる可
    能性のあるメッシュ位置を示す標準フラグデータが記憶
    される文字辞書と、 入力文字画像をメッシュに区切った場合の各行での特徴
    量が最大になるメッシュ位置を示すフラグデータを求
    め、このフラグデータと適合する標準フラグデータのグ
    ループを求め、各グループの標準文字画像との照合を行
    い、類似度が予め定めるしきい値以上のグループに分類
    されている各規準文字画像との照合を行い、類似度順に
    認識結果として出力する認識手段とを含むことを特徴と
    する文字認識装置。
JP4173165A 1992-06-30 1992-06-30 文字認識装置 Expired - Lifetime JP2938276B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4173165A JP2938276B2 (ja) 1992-06-30 1992-06-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4173165A JP2938276B2 (ja) 1992-06-30 1992-06-30 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0620098A JPH0620098A (ja) 1994-01-28
JP2938276B2 true JP2938276B2 (ja) 1999-08-23

Family

ID=15955309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4173165A Expired - Lifetime JP2938276B2 (ja) 1992-06-30 1992-06-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP2938276B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4087421B2 (ja) * 2006-10-11 2008-05-21 シャープ株式会社 パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体
CN112580620A (zh) * 2020-12-25 2021-03-30 北京百度网讯科技有限公司 标志图片处理方法、装置、设备和介质

Also Published As

Publication number Publication date
JPH0620098A (ja) 1994-01-28

Similar Documents

Publication Publication Date Title
US4881069A (en) Font compression method and apparatus
US5373566A (en) Neural network-based diacritical marker recognition system and method
JP3155577B2 (ja) 文字認識方法及び装置
JP4172584B2 (ja) 文字認識結果出力装置、文字認識装置、その方法及びプログラム
KR19980018029A (ko) 문자 인식 장치
JPH11120293A (ja) 文字認識/修正方式
EP0810542A2 (en) Bitmap comparison apparatus and method
CN111523622A (zh) 基于特征图像自学习的机械臂模拟手写笔迹方法
JP2938276B2 (ja) 文字認識装置
EP0617381B1 (en) Character recognition
JPH0516632B2 (ja)
KR0186025B1 (ko) 후보 문자 분류 방법
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP2788506B2 (ja) 文字認識装置
JP2803709B2 (ja) 文字認識装置及び文字認識方法
JP3072126B2 (ja) 書体を識別する方法及び装置
JP2827288B2 (ja) 文字認識装置
JP2582611B2 (ja) マルチフオント辞書の作成法
JP2626084B2 (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
JP2612383B2 (ja) 文字認識処理方式
JP3281530B2 (ja) 文字認識装置
JP3320083B2 (ja) 文字認識装置及び方法