JP2803709B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JP2803709B2
JP2803709B2 JP7118668A JP11866895A JP2803709B2 JP 2803709 B2 JP2803709 B2 JP 2803709B2 JP 7118668 A JP7118668 A JP 7118668A JP 11866895 A JP11866895 A JP 11866895A JP 2803709 B2 JP2803709 B2 JP 2803709B2
Authority
JP
Japan
Prior art keywords
complexity
character
feature
features
stroke interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7118668A
Other languages
English (en)
Other versions
JPH08315079A (ja
Inventor
雅彦 濱中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7118668A priority Critical patent/JP2803709B2/ja
Publication of JPH08315079A publication Critical patent/JPH08315079A/ja
Application granted granted Critical
Publication of JP2803709B2 publication Critical patent/JP2803709B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に、入力文字パタンの複雑度によって適応的に文字認識
を行う文字認識装置に関する。
【0002】
【従来の技術】文字認識処理は、一般に特徴と呼ばれる
文字パタン特有の情報を抽出する特徴抽出処理と、この
処理により抽出された特徴を用いて文字のクラスを決定
する分類(認識)処理とからなる。ここで、分類処理を
特徴パタンの重ね合わせにより行うためには、ストロー
クの位置ずれに対処するための処理が不可欠である。
【0003】このような位置ずれに対処するための処理
の一例としてぼかし処理がある。ぼかし処理とは、特徴
要素を隣接特徴要素と加重平均して、隣接要素内での位
置ずれに対処する手法であって、例えば、「電子通信学
会論文誌(D),Vol.J67−D,No. 2,pp224−
231(昭和59年2月),安田、他:文字認識のため
の相関法の一改良−相補的特徴抽出の提案−」等によっ
て提案されている。
【0004】ところで、ここで提案されたぼかし処理に
使用されるぼかしのパラメータは、すべての文字に対し
て同一である。一般に、複雑な字形の文字ほどストロー
クの位置ずれが小さく、単純な字形の文字ほどストロー
クの位置ずれが大きい傾向がある。そこで、高い認識率
を得るためには、文字の複雑さによって、ぼかしのパラ
メータを変化させる必要がある。
【0005】文字の複雑さによってぼかしのパラメータ
を変化させる文字認識方式は、特公平1−47834号
公報に記載されている。この文字認識方式では、入力文
字パタンのサブパタンの黒ビット和を文字線幅とストロ
ーク方向の文字枠の大きさとで正規化した量の総和、ま
たは、各サブパタンのストローク数の総和を、複雑度と
して検出し、この複雑度に従ってぼかし係数を決定す
る。そして、入力文字パタンの特徴マトリックス(特徴
パタン)の特徴要素にぼかし処理を施し、ぼかし係数に
応じた辞書を参照して文字認識を行う。ここでのぼかし
処理は、ぼかし係数をCとすると、注目特徴要素の荷重
をC/(C+2)とし、かつ、隣接特徴要素の荷重を1
/(C+2)として、各特徴要素をそのストローク方向
と直交する方向で隣接する2つの隣接要素で加重平均す
る。また、辞書は、複数のぼかし係数に対応して複数の
辞書を用意され、各辞書には、そのぼかし係数に対応す
る複雑度の文字の標準マスク(標準特徴パタン)が収容
される。
【0006】上記例では、ぼかし処理を行うために、文
字の複雑度をもとめ利用している。この文字の複雑度
は、さらに、辞書に対するアクセス領域の限定に利用す
ることもできる。例えば、特開昭62−26588号公
報には、入力文字に対して、垂直、右上がり、水平、及
び右下がりの4方向に走査を行ったときに横切る文字線
数の和を複雑度として検出し、この複雑度に応じて、予
め標準パタンを複雑度の大小関係に従って配列しておい
た辞書に対するアクセス領域を決定する「パタン照合処
理方式」が開示されている。また、特開平1−1428
91号公報には、垂直方向及び水平方向の複雑度をそれ
ぞれ求め、予め2変数(即ち、垂直及び水平方向の複雑
度)でクラスタリングされた辞書に対して、アクセスす
るクラスタを限定する「文字候補選択回路」が開示され
ている。なお、これらのパタン照合処理方式は、上述し
たぼかし処理を含む文字認識方式と組み合わせることも
できる。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
文字認識方式におけるぼかし処理では、すべての特徴要
素(例えば、4方向特徴)に対して同一のぼかし係数で
ぼかし処理を行っているので、特徴毎に位置ずれの度合
いが異なる場合に対処できないという問題点がある。
【0008】また、辞書へのアクセス領域を限定する文
字認識方式では、複雑度をそのまま用いてアクセス領域
を限定するため、必ずしも分類性能が高くないという問
題がある。また、従来の辞書は、平均複雑度が同程度の
カテゴリでは、その複雑度の分布(ばらつき、分散)は
同程度であるとの仮定に基づいて分類を行っているの
で、複雑度の分散が大きいカテゴリに対しては分解性能
が低下するという問題もある。
【0009】本発明は、特徴毎に複雑度を求めてぼかし
処理の程度を設定することにより、高い精度で文字を認
識できる文字認識方法及び装置を提供することを目的と
する。また、本発明は、特徴毎に求めた複雑度から合成
複雑度を求めることにより、高い文分類性能と、安定し
た文字認識を実現できる文字認識方法及び装置を提供す
ることを目的ととする。
【0010】
【課題を解決するための手段】本発明によれば、入力さ
れた文字イメージを記憶する文字イメージ記憶手段と、
前記文字イメージを正規化して複数の特徴を抽出する特
徴抽出手段と、前記複数の特徴をそれぞれ圧縮し複数の
特徴パタンを得る特徴記述手段と、前記複数の特徴の複
雑度をそれぞれ求める複雑度計算手段と、前記複雑度に
基づいて前記複数の特徴にそれぞれ対応するぼかし回数
を求めるぼかし回数計算手段と、前記複数の特徴パタン
に対し各々に対応する前記ぼかし回数だけぼかし処理を
施すぼかし処理手段と、多数の標準文字パタンを記憶し
ている辞書記憶手段と、前記複数の特徴に対応する全て
の前記複雑度から合成複雑度を求め、該合成複雑度に基
づいて前記多数の標準文字パタンの中から少なくとも1
つの標準文字パタンを選出する辞書選出部と、ぼかし処
理された前記特徴パタンと選出された前記標準文字パタ
ンとの類似度を求め文字の識別を行う文字識別手段とを
備えたことを特徴とする文字認識装置が得られる。
【0011】また、本発明によれば、入力された文字イ
メージを記憶する文字イメージ記憶工程と、前記文字イ
メージを正規化して複数の特徴を抽出する特徴抽出工程
と、前記複数の特徴をそれぞれ圧縮し複数の特徴パタン
を得る特徴記述工程と、前記複数の特徴の複雑度をそれ
ぞれ求める複雑度計算工程と、前記複雑度に基づいて前
記複数の特徴にそれぞれ対応するぼかし回数を求めるぼ
かし回数計算工程と、前記複数の特徴パタンに対し各々
に対応する前記ぼかし回数だけぼかし処理を施すぼかし
処理工程と、前記複数の特徴に対応する全ての前記複雑
度から合成複雑度を求め、該合成複雑度に基づいて辞書
記憶手段に記憶された多数の標準文字パタンの中から少
なくとも1つの標準文字パタンを選出する辞書選出工程
と、ぼかし処理された前記特徴パタンと選出された前記
標準文字パタンとの類似度を求め文字の識別を行う文字
識別工程とを含むことを特徴とする文字認識方法が得ら
れる
【0012】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1に本発明の第1の実施例を示す。本実施例の
文字認識装置は、文字データ記憶部1と、正規化及び特
徴抽出手段2と、特徴記述手段3と、複雑度計算手段4
と、ぼかし回数計算手段5と、ぼかし処理手段6と、辞
書記憶部7と、辞書選出手段8と、識別手段9とを有し
ている。
【0013】正規化及び特徴抽出手段2は、ストローク
間隔係数手段21と、正規化関数計算手段22と、正規
化特徴抽出手段23とを備え、辞書記憶部7は、各文字
の標準特徴パタンを予め記憶している。
【0014】次に図2をも参照してこの文字認識装置の
動作を説明する。ここで、文字データ記憶部1には、認
識しようとする入力文字イメージが記憶されているもの
とする。
【0015】まず、ストローク間隔計数手段21は、ス
テップS101で、文字データ記憶部1から読み出した
文字イメージに対してストローク間隔を計数する。そし
て、正規化関数計算手段22は、ステップS102で、
ストローク間隔計数手段21で得られたストローク間隔
に基づいて、文字イメージを非線形に正規化する正規化
関数を計算する。このストローク間隔から正規化関数を
計算する方法については、特開昭64−29988号公
報「パタン正規化方式」に記載された方法を使用するこ
とができる。
【0016】即ち、2値の文字イメージをI(x,y)
={0,1}(x=1〜Mx ,y=1〜My ;Mx 、M
y は外接サイズ)とする。すべての背景画素(I(x,
y)=0)に対して、各方向に走査を行い画素0が連続
する長さをストローク間隔とする。(文字画素(I
(x,y)=1)に対しては、ストローク間隔∞とす
る。)水平方向のストローク間隔をh(x,y)、右下
がり方向のストローク間隔をd(x,y)、垂直方向の
ストローク間隔をv(x,y)、右上がり方向のストロ
ーク間隔をu(x,y)とする。水平方向と垂直方向の
正規化関数{K(x) ,L(y) }を用いて文字イメージを
正規化する場合、各正規化関数は水平方向と垂直方向の
ストローク間隔{h(x,y),v(x,y)}より数
1式で求められる。
【0017】
【数1】 ここで、(x',y') は正規化後のイメージ座標(x'=1〜
M'x,y'=1〜M'y)を表す。また、Σx ,Σy の
(x,y)の範囲は、{x=1〜Mx ,y=1〜My}
である。
【0018】次に、正規化特徴抽出手段23は、ステッ
プS103で、文字データ記憶部1からの文字イメージ
を正規化関数計算手段22より得られる正規化関数を用
いて正規化し、正規化イメージを得る。そして、得られ
た正規化イメージから特徴(即ち、正規化特徴)を計算
する。なお、正規化特徴は、文字イメージから特徴を抽
出し、抽出した特徴を正規化関数を用いて座標変換して
も得ることができる。その方法については、例えば、
「電子情報通信学会研究会技報、PRU91−85,1
991年11月,濱中、他:手書き漢字認識における非
線形正規化と特徴抽出の整合性について」に記載され
た、正規化方法及び特徴抽出法を使用できる。
【0019】次に、特徴記述手段3は、ステップS10
4で、計算された正規化特徴を識別に適した要素数に圧
縮する(以下、圧縮された正規化特徴を特徴パタンと呼
ぶ)。この方法については、例えば、「電子情報通信学
会研究会技報、PRU90−20,1990年6月,津
雲:方向パタンマッチング法の改良と手書き漢字認識へ
の応用」や特開平2−83687号公報「特徴抽出方
式」に記載された方法を使用することができる。
【0020】ステップS103及び104の動作を具体
的に説明する。例えば、文字データ記憶部1に、図3
(a)に示す文字イメージ「う」が記憶されているとす
ると、ステップS103で、正規化特徴抽出部23は図
3(b)に示すような正規化イメージを作成する。そし
て、この正規化イメージから、垂直方向、右上がり方
向、水平方向、及び右下がり方向の4方向の方向特徴
(正規化特徴)を抽出する。この抽出では、正規化イメ
ージに対して輪郭部の方向が検出され、図3(c)に示
すような方向特徴が得られる。次に、ステップS104
で、特徴記述手段3は、各方向特徴をそれぞれ図4
(a)に示すように64の領域に分割し、領域ごとに各
特徴量を総和する。なお、図4(a)から分かるよう
に、ここでは、ストローク方向と平行な方向には圧縮率
を高く(分割数を少なく)、直交する方向には、圧縮率
を低く(分割数を多く)して圧縮が行われる。こうし
て、図4(b)に示すような特徴パタンF0 (k,i,
j)が作成される。ここで、kは、方向番号(k=0〜
3)を示し、k=0は垂直方向、k=1は右上がり方
向、k=2は水平方向、そして、k=3は右下がり方向
を指す。また、iはコラム番号(i=0〜Nc(k)-1;N
c(k)は、方向k内のコラム数。)、jは各コラム内の要
素番号(j=0〜Ne(k,i)−1;Ne(k,i)は方向k、コ
ラムi内の要素数)を示す。コラムはストローク方向と
直交する方向に連続する要素の集合である。例えば、垂
直方向(k=0)と水平方向(k=2)の場合は、それ
ぞれ4個のコラム(Nc(0)=Nc(2)=4)があり、各コ
ラムには、16個の要素(Ne(0,i)=Ne(2,i)=16)
が含まれる。また、右上がり方向(k=1)と右下がり
方向(=3)の場合は、それぞれ7個のコラム(Nc
(1)=Nc(3)=7)があり、各コラムには、Ne(1,i)=
Ne(3,i)={4,8,12,16,12,8,4}要素
が含まれている。
【0021】次に、ステップS105において、複雑度
計算手段4は、ストローク間隔計数手段21から得られ
る各方向へのストローク間隔を示す情報に基づいて、各
特徴毎に複雑度を計算する。ここで、複雑度はストロー
ク間隔の逆数として求められ、一般的に、単純な文字で
は小さく、複雑な文字では大きくなる。
【0022】次に、ぼかし回数計算手段5は、ステップ
S106で複雑度計算手段4より得られる特徴毎の複雑
度に応じて、特徴記述手段3から得れる特徴パタンにぼ
かし処理を施す回数を計算する。ぼかし処理手段6は、
ぼかし回数計算手段5により求められたぼかし回数に従
い、ステップS107で、特徴パタンにぼかし処理を施
す。
【0023】ここで、ステップS105〜107につい
て具体的に説明する。ここでは、特徴を4方向の方向特
徴とし、複雑度計算手段4で各方向毎の複雑度を求め、
ぼかし回数計算手段5で各方向毎のぼかし回数を求める
場合について説明する。
【0024】垂直方向(k=0)、右上がり方向(k=
1)、水平方向(k=2)、及び右下がり方向(k=
3)の各方向の線分の複雑度をPK とすると、各方向の
複雑度は、線分方向と直交する方向のストローク間隔を
用いて数2式で表される。
【0025】
【数2】 ここで、Aは正規化定数、Σx Σy の(x,y)の範囲
は{x=1〜Mx ,y=1〜My }である。複雑度は、
ストローク間隔の広い単純な部分では小さく、ストロー
ク間隔の狭い複雑な部分では大きくなる。
【0026】ぼかし回数計算手段5では、各方向の複雑
度PK (k=0〜3)から計算式またはテーブルを用い
て各方向のぼかし回数Tk を求める。計算による場合
は、例えば数3式を用いる。
【0027】
【数3】 ここで、Σm のmの範囲は{m=0〜3}である。ま
た、akmは、各方向の複雑度Pm と各方向のぼかし回数
TK の関係を示す係数で、事前に学習データを基に回帰
分析等で求めることができる。
【0028】上記説明では、各特徴に対して複雑度及び
ぼかし回数を求める場合について説明したが、さらに細
かい単位で複雑度及びぼかし回数を求めることもでき
る。例えば、コラム単位で複雑度を求め、ぼかし回数を
求めることができる。以下に詳述する。
【0029】方向k、コラムiの複雑度をPki(k=0
〜3,i=0〜NC(K)−1)とすると、各コラムの複雑
度は各ストローク間隔より数4式を用いて計算できる。
【0030】
【数4】 ここで、Bは正規化定数、Skiはコラム領域の面積、
(x',y') は正規化後のイメージの座標(x'=K(x) y'
=L(y) )を表し、Σx'Σy'の(x',y') の範囲は、Rki
(Rkiは各コラム領域)の要素、である。また、Ms
斜め方向の文字サイズを表し、例えば、(Mx +My
/2,(Mx y 1/2 ,(Mx 2 +My 21/2 等に
より近似的に求められる。
【0031】ぼかし回数計算手段5では、各コラムの複
雑度Pkiから計算式またはテーブルを用いて各コラムの
ぼかし回数Tkiを求める。計算式を用いる場合は、例え
ば、数5式を用いることができる。
【0032】
【数5】 ここで、Σm Σn の(m、n)の範囲は、{m=0〜
3,n=0〜NC(m)−1}である。係数akimnは、各コ
ラムの複雑度Pmnと各方向のぼかし回数Tkiの関係を示
す係数で、事前に学習データを基に回帰分析等で求める
ことができる。
【0033】このように、本実施例の文字認識装置で
は、特徴の複雑度、及びぼかし回数をコラム単位で求め
ることができる。さらに、本実施例では、コラムをさら
に細かい領域に分割して複雑度を求め、ぼかし回数を求
めることができる。なお、複雑度を求める特徴の単位
と、ぼかし処理を施す特徴単位とは必ずしも一致してい
なくても良い。例えば、各方向特徴毎に複雑度を求め、
全体のぼかし回数を求めても良いし、各コラム毎に複雑
度を求めて、方向特徴毎のぼかし回数を求めるようにし
ても良い。
【0034】ぼかし処理手段6は、例えば、図4(b)
に示す特徴パタンに対して、ストローク方向と直交する
方向に一元的にぼかしをかける。この方法は、特徴パタ
ンをメモリ上にコラム毎に順番に記憶しておけば、どの
方向についても、メモリ上の隣接する要素間でぼかし処
理を行うことにより、方向ごとに異なる方向のぼかし処
理を実現できるという利点を有する。このぼかし処理
は、特徴パタンに対して各要素毎に、求められたぼかし
回数だけ施す。例えば、{0.25, 0.5, 0.25 }の重み係
数ぼかしを行う場合は、数6式により実現できる。
【0035】
【数6】 ここで、Ft はt回ぼかし処理を行った特徴パタンを示
す。なお、j−1<0の場合には、j=0の要素に置き
換え、j+1が最大要素番号を越える場合は、最大要素
番号の要素に置き換える。このぼかし処理によれば、ぼ
かし処理の回数に応じて、各要素のぼかしの範囲が広が
っていく。その様子を図示すると図5に示すようにな
る。
【0036】なお、本実施例では、ある要素に対してぼ
かし処理を複数回行う場合、同一の重み係数でぼかし処
理を行うようにしたが、ぼかし回数に応じて重み係数を
変更するようにしてもよい。また、上記例では、隣接す
る2つの要素との加重平均を取ることでぼかし処理を行
っているが、さらに多くの要素との加重平均を取るよう
にしてもよい。
【0037】上述したようにして、特徴パタンのぼかし
処理が終了すると、辞書選出手段8は、ステップS10
8で、複雑度計算手段4より得られる特徴毎の複雑度か
ら合成複雑度を計算する。辞書記憶部7には、標準特徴
パタンが、複雑度を表す情報と共に記憶されているの
で、辞書選出手段8は、辞書記憶部7に記憶されている
各カテゴリの標準特徴パタンの中から合成複雑度に近い
複雑度を有するパタンを選出する。次に、識別手段9
は、ぼかし処理手段6からの特徴パタンと、辞書選出手
段8からの標準特徴パタンとを比較し、距離値の小さい
カテゴリを選出する。
【0038】以下、ステップS108について具体的に
説明する。ここでは、標準パタンが各カテゴリに1個の
場合について説明する。辞書選出手段8では、複雑度計
算手段4から得られる各方向毎の複雑度PK (k=0〜
3)に基づいて、1つまたは複数の合成複雑度Qr (r
=0〜Nq −1;Nq は合成複雑度の個数)を求めるた
めに、数7式を使用する。
【0039】
【数7】 ここで、Σk のkの範囲は、{k=0〜3}である。ま
た、brkは、各複雑度PK と合成複雑度Qr の関係を表
す係数で、事前に学習データから判別分析等で求めるこ
とができる。判別分析では、合成複雑度Qr のカテゴリ
内分散が小さく、カテゴリ間分散が大きくなるようにb
rkを求めることにより、合成複雑度Qr による高い分類
性能を得ることができる。また、複雑度計算手段4がコ
ラム毎、あるいはその分割領域毎の複雑度を求めるとき
には、これらの複雑度に基づいて合成複雑度を求めるこ
ともできる。
【0040】こうして求められた合成複雑度に応じて辞
書のアクセス領域を限定する方法は、例えば、特開昭6
2−26588号公報「パタン照合処理方式」や特開平
1−142891号公報「文字候補選択回路」に記載さ
れている方法を用いることができる。1つ(1次元)の
合成複雑度を用いる場合には、辞書記憶部7に予め複雑
度の大小に従って標準パタンを配列しておき、テーブル
を利用して入力文字の合成複雑度に応じたアクセス領域
を選出する。複数(2次元以上)の合成複雑度を用いる
場合は、予め辞書を多変数でクラスタリングしておき、
入力文字の各合成複雑度に応じてアクセスするクラスタ
を選出する。
【0041】次に、図6を参照して、1次元の合成複雑
度に対して辞書のアクセス領域を選出する方法について
説明する。図6では、横軸が個々の文字の複雑度を、縦
軸がカテゴリ毎の平均複雑度を表している。ここでは、
各文字の複雑度が、境界{Pav=gL(P)、Pav=gH
(P)}の間に分布しているものとする。このとき、入力
文字の合成複雑度Pが与えられると、その入力文字は、
gL(P)<Pav<gH(P)の平均複雑度Pavを持つカテゴリ
に属する可能性が高い。そこで、各カテゴリを平均複雑
度の小さい順に並べたときの平均複雑度Pavと順番との
関係をZ=e(Pav)とすると、入力文字の合成複雑度P
が与えられたときは、e(gL(P))<Z<e(gH(P))
の範囲をアクセス領域とすればよい。なお、境界関数
{gL ,gH }は任意の単調増加関数であればよく、両
関数で挟まれる範囲を狭めるとアクセス領域が絞られ、
処理の高速化を達成できるが、複雑度の大きいカテゴリ
に関しては誤分類の可能性が高くなる。
【0042】次に、処理の高速化を図り誤分類の可能性
を低減するための辞書構成方法を説明する。まず、境界
関数{gL ,gH }を複数組用意する。各カテゴリに対
して複雑度の分布が含まれる境界関数を対応させ、各カ
テゴリのグループ分けを行う。例えば、図7に示すよう
に、2組の境界関数{gL1,gH1}及び{gL2,gH2}
を用意する。そして、各カテゴリをその複雑度の分布に
応じて、境界{gL1,gH1}に含まれるグループ1と、
それ以外のグループ2とに分ける。
【0043】辞書は、各グループに応じてサブグループ
を構成し、グループごとに複雑度の小さい順に並べて配
列する。即ち、2つのグループに分類されたときは、図
8に示すように2つのサブグループを設ける。そして、
アクセス領域の選出は、グループ単位で行われる。例え
ば、図10のグループ1とグループ2の平均複雑度Pav
と順番Zとの関係を、それぞれZ=e1 (Pav) ,Z=e
2 (Pav) とすると、入力文字の複雑度Pが与えられたと
き、e1 (gL1(P) )<Z<e1 (gH1(P) )及びe2
(gL2(P) )<Z<e2 (gH2(P) )の範囲をアクセス
領域とする。図7にその範囲を示す。
【0044】なお、最終グループに対してはアクセス領
域を限定せずにすべてアクセスするようにしてもよい。
また、この方法は、2次元以上の複雑度に対しても適用
できる。
【0045】また、上記実施例では、辞書の標準パタン
は、各カテゴリ毎に1個としたが、各カテゴリ毎に変形
などに応じて適宜複数用意してもよい。
【0046】次に本発明の第2の実施例について説明す
る。図9に本実施例の文字認識装置を示す。この装置
が、第1の実施例の装置と異なる点は、正規化特徴抽出
手段23とストローク間隔係数手段21とが接続されて
いる点である。
【0047】以下、図9及び図10を参照して本実施例
の動作について説明する。ステップS201からステッ
プS204までは、それぞれ第1の実施例におけるステ
ップS101からステップS104に対応するので、そ
の説明を省略する。
【0048】次に、ストローク間隔係数手段21は、ス
テップS205で、正規化特徴抽出手段23より得られ
る正規化イメージに対して、各方向へのストローク間隔
を計数する。そして、複雑度計算手段4は、ステップS
206でストローク間隔計数手段21より得られる正規
化イメージに対する各方向へのストローク間隔情報に基
づいて特徴ごとの複雑度を計算する。
【0049】以降、ステップS207からステップS2
09までは、それぞれ第1の実施例におけるステップS
106からステップS108と同じなのでその説明を省
略する。
【0050】次に、ステップS206について具体的に
説明する。複雑度計数手段4が各方向(4方向)毎に複
雑度を求めるときは、正規化イメージに対して求めた各
方向へのストローク間隔を{h'(x',y'), d'(x',y'), v'
(x',y'), u'(x',y')}として、垂直方向(k=0)、右
上がり方向(k=1)、水平方向(k=2)、右下がり
方向(k=3)の各線分の複雑度P'Kを、数8式を用い
て求める。
【0051】
【数8】 ここで、Aは正規化定数、Σx'Σy'の(x',y') の範囲
は、{x'=1〜M'x,y'=1〜M'y}である。
【0052】また、複雑度計数手段4がコラム単位で複
雑度を求める場合は、方向k,コラムiの複雑度をP'k
i (k=0〜3,i=0〜NC(K)−1)とすると、数9
式で求められる。
【0053】
【数9】 ここで、Bは正規化定数、Σx'Σy'の(x',y') の範囲
は、Rki(Rkiは各コラム領域)に属する範囲である。
【0054】次に本発明の第3の実施例について説明す
る。本実施例の文字認識装置は、ストローク間隔計数手
段21及び正規化関数計算手段22を有していない点で
第1の実施例と異なる。即ち、複雑度計算手段4への入
力が特徴記述手段3から得られる点で異なっている。特
徴記述手段3から得られる特徴パタンの各要素の和はス
トローク量を反映しているので、単純な字では小さくな
り複雑な字では大きくなる。即ち、特徴記述手段3から
得られる特徴パタンの各要素の和は文字の複雑さを表し
ている。
【0055】複雑度計算手段4が各方向(4方向)毎の
複雑度を求める場合、各方向の複雑度をP''k とする
と、各方向の複雑度は特徴パタンF0 (k,i,j)を
用いて、数10式で求めることができる。
【0056】
【数10】 ここで、A''は正規化定数、Σi Σj の(i,j)の範
囲は{i=0〜NC(K)−1,j=0〜Ne(k,i)−1}で
ある。
【0057】また、複雑度計算手段4が、各コラム毎に
複雑度を求める場合には、方向k、コラムiの複雑度を
Pkiとすると、各コラムの複雑度は、数11式で表され
る。
【0058】
【数11】 ここで、B''は正規化関数、Σj のjの範囲は、{j=
0〜Ne(k,i)−1}である。
【0059】なお、上記各実施例では、特徴を4方向特
徴としたが、これに限るものではない。また、特徴パタ
ンの要素数は256と下が、これに限られるものではな
い。
【0060】
【発明の効果】本発明によれば、文字イメージから抽出
した特徴ごとに複雑度を求め、この複雑度に応じて特徴
毎のぼかし回数を設定するようにしたことで、より適切
なぼかし処理を行うことができるので、高い文字認識精
度を得ることができる。
【0061】また、本発明によれば、特徴毎に求められ
た複雑度に基づいて合成複雑度を求めるようにしたこと
で、高い判別性を得ることができ、この合成複雑度を用
いて辞書へのアクセス領域限定することにより、高速か
つ高い精度で文字を認識することができる。
【0062】さらに、辞書の構成を複雑度の安定性に基
づくサブグループ構成とすることにより、複雑度の不安
定なカテゴリに対しても安定した認識が行なえる。
【図面の簡単な説明】
【図1】本発明の第1の実施例のブロック図である。
【図2】図1の文字認識装置の動作を示すフローチャー
トである。
【図3】(a)は文字イメージの一例を示す図、(b)
は(a)の文字イメージを正規化した正規化イメージを
示す図、(c)は(b)の正規化イメージから抽出した
方向特徴を示す図である。
【図4】(a)は方向特徴の分割例を示す図、(b)は
図3(c)の方向特徴を圧縮してえられる特徴パタンを
示す図である。
【図5】ぼかし処理の回数とぼかしの程度との関係を説
明するための図である。
【図6】辞書に記憶されたカテゴリの平均複雑度と、各
標準パタンの複雑度との分布を示す、辞書へのアクセス
領域決定方法の一例を説明するためのグラフである。
【図7】辞書へのアクセス領域決定方法の他の例を説明
するためのグラフである。
【図8】辞書の構成と、アクセス領域との関係を示す図
である。
【図9】本発明の第2の実施例のブロック図である。
【図10】図9の文字認識装置の動作を説明するための
図である。
【図11】本発明の第3の実施例のブロック図である。
【符号の説明】
1 文字データ記憶部 2 正規化及び特徴抽出手段 3 特徴記述手段 4 複雑度計算手段 5 ぼかし回数計算手段 6 ぼかし処理手段 7 辞書記憶部 8 辞書選出手段 9 識別手段 21 ストローク間隔係数手段 22 正規化関数計算手段 23 正規化特徴抽出手段
フロントページの続き (56)参考文献 特開 昭62−26588(JP,A) 特開 平1−142891(JP,A) 特開 平2−83687(JP,A) 特開 昭62−26588(JP,A) 特公 平1−47834(JP,B2) 「電子情報通信学会研究会技報、PR U90−20,PP.35−42,1990年6月, 津雲:方向パタンマッチング法の改良と 手書き漢字認識への応用] 「電子通信学会論文誌(D),VO L.J67−D,NO.2,PP.224− 231(昭和59年2月),安田、他:文字 認識のための相関法の−改良−相補的特 徴抽出の提案−」 (58)調査した分野(Int.Cl.6,DB名) G06K 9/46 G06K 9/62

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された文字イメージを記憶する文字
    イメージ記憶手段と、前記文字イメージを正規化して複
    数の特徴を抽出する特徴抽出手段と、前記複数の特徴を
    それぞれ圧縮し複数の特徴パタンを得る特徴記述手段
    と、前記複数の特徴の複雑度をそれぞれ求める複雑度計
    算手段と、前記複雑度に基づいて前記複数の特徴にそれ
    ぞれ対応するぼかし回数を求めるぼかし回数計算手段
    と、前記複数の特徴パタンに対し各々に対応する前記ぼ
    かし回数だけぼかし処理を施すぼかし処理手段と、多数
    の標準文字パタンを記憶している辞書記憶手段と、前記
    複数の特徴に対応する全ての前記複雑度から合成複雑度
    を求め、該合成複雑度に基づいて前記多数の標準文字パ
    タンの中から少なくとも1つの標準文字パタンを選出す
    る辞書選出部と、ぼかし処理された前記特徴パタンと選
    出された前記標準文字パタンとの類似度を求め文字の識
    別を行う文字識別手段とを備えたことを特徴とする文字
    認識装置。
  2. 【請求項2】 前記文字イメージのストローク間隔を計
    数するストローク間隔計数手段と、前記ストローク間隔
    に基づいて正規化関数を求める正規化関数計算手段とを
    有し、前記特徴抽出手段が前記正規化関数を用いて前記
    文字イメージの正規化を行い、前記複雑度計算手段が前
    記ストローク間隔に基づいて前記複雑度を求めることを
    特徴とする請求項1の文字認識装置。
  3. 【請求項3】 前記ストローク間隔計数手段が、前記特
    徴手段から得られる正規化された文字イメージのストロ
    ーク間隔をさらに求め、前記複雑度計算手段が前記正規
    化された文字イメージのストローク間隔に基づいて前記
    複雑度を求めることを特徴とする請求項2の文字認識装
    置。
  4. 【請求項4】 前記辞書記憶手段が、前記多数の標準パ
    タンを複数のカテゴリに分割したときの各カテゴリに属
    する標準パタンの複雑度の安定性に応じて構成された複
    数のサブグループを有し、前記文字識別手段が前記合成
    複雑度に基づいて、各サブグループのアクセス範囲を決
    定することを特徴とする請求項1、2、または、3の文
    字認識装置。
  5. 【請求項5】 前記複数の特徴が方向特徴であることを
    特徴とする請求項1、2、3、または、4の文字認識装
    置。
  6. 【請求項6】 入力された文字イメージを記憶する文字
    イメージ記憶工程と、前記文字イメージを正規化して複
    数の特徴を抽出する特徴抽出工程と、前記複数の特徴を
    それぞれ圧縮し複数の特徴パタンを得る特徴記述工程
    と、前記複数の特徴の複雑度をそれぞれ求める複雑度計
    算工程と、前記複雑度に基づいて前記複数の特徴にそれ
    ぞれ対応するぼかし回数を求めるぼかし回数計算工程
    と、前記複数の特徴パタンに対し各々に対応する前記ぼ
    かし回数だけぼかし処理を施すぼかし処理工程と、前記
    複数の特徴に対応する全ての前記複雑度から合成複雑度
    を求め、該合成複雑度に基づいて辞書記憶手段に記憶さ
    れた多数の標準文字パタンの中から少なくとも1つの標
    準文字パタンを選出する辞書選出工程と、ぼかし処理さ
    れた前記特徴パタンと選出された前記標準文字パタンと
    の類似度を求め文字の識別を行う文字識別工程とを含む
    ことを特徴とする文字認識方法。
  7. 【請求項7】 前記特徴抽出工程の前に、前記文字イメ
    ージのストローク間隔を計数する第1のストローク間隔
    計数工程と、前記ストローク間隔に基づいて正規化関数
    を求める正規化関数計算工程とを有し、前記特徴抽出工
    程が前記正規化関数を用いて行われ、前記複雑度計算工
    程が前記ストローク間隔を用いて行われることを特徴と
    する請求項6の文字認識方法。
  8. 【請求項8】 前記特徴抽出工程が、前記文字イメージ
    を正規化して得られる正規化イメージを出力する工程を
    含み、前記正規化イメージのストローク間隔を計数する
    第2のストローク間隔計数工程を有し、前記複雑度計算
    工程が前記正規化イメージのストローク間隔に基づいて
    前記複雑度を求めるようにしたことを特徴とする請求項
    7の文字認識方法。
  9. 【請求項9】 前記文字認識工程が、前記辞書記憶手段
    の各カテゴリに属する標準パタンの複雑度の安定性に応
    じて構成された複数のサブグループに対し、前記合成複
    雑度に基づいて、各サブグループへのアクセス範囲を決
    定する工程を含むことを特徴とする請求項6、7、また
    は、8の文字認識装置。
  10. 【請求項10】 前記複数の特徴が方向特徴であること
    を特徴とする請求項6、7、8、または、9の文字認識
    方法。
JP7118668A 1995-05-17 1995-05-17 文字認識装置及び文字認識方法 Expired - Fee Related JP2803709B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7118668A JP2803709B2 (ja) 1995-05-17 1995-05-17 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7118668A JP2803709B2 (ja) 1995-05-17 1995-05-17 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JPH08315079A JPH08315079A (ja) 1996-11-29
JP2803709B2 true JP2803709B2 (ja) 1998-09-24

Family

ID=14742264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7118668A Expired - Fee Related JP2803709B2 (ja) 1995-05-17 1995-05-17 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP2803709B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4960516B2 (ja) * 2011-03-24 2012-06-27 株式会社東芝 画像認識装置、画像認識方法
CN112598093B (zh) * 2020-12-18 2024-05-28 湖南特能博世科技有限公司 图例复杂度排序方法、图例匹配方法、装置及计算机设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
「電子情報通信学会研究会技報、PRU90−20,PP.35−42,1990年6月,津雲:方向パタンマッチング法の改良と手書き漢字認識への応用]
「電子通信学会論文誌(D),VOL.J67−D,NO.2,PP.224−231(昭和59年2月),安田、他:文字認識のための相関法の−改良−相補的特徴抽出の提案−」

Also Published As

Publication number Publication date
JPH08315079A (ja) 1996-11-29

Similar Documents

Publication Publication Date Title
EP1453000B1 (en) Image texture retrieving method and apparatus thereof
US7440638B2 (en) Image retrieving system, image classifying system, image retrieving program, image classifying program, image retrieving method and image classifying method
US4903312A (en) Character recognition with variable subdivisions of a character region
JP4414401B2 (ja) 顔特徴点検出方法および装置並びにプログラム
CN111209873A (zh) 一种基于深度学习的高精度人脸关键点定位方法及系统
CN112070116B (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
CN112380978A (zh) 基于关键点定位的多人脸检测方法、系统及存储介质
JP2803709B2 (ja) 文字認識装置及び文字認識方法
CN109800702B (zh) 指静脉识别的快速比对方法及计算机可读取的存储介质
JP2865528B2 (ja) 指紋照合装置
Rahma et al. The using of Gaussian pyramid decomposition, compact watershed segmentation masking and DBSCAN in copy-move forgery detection with SIFT
CN113744241A (zh) 基于改进slic算法的细胞图像分割方法
CN108334884B (zh) 一种基于机器学习的手写文档检索方法
CN112069885A (zh) 人脸属性识别方法、装置及移动终端
JP3661774B2 (ja) 文字列認識方法、文字認識装置およびプログラム
JP3462960B2 (ja) 画像処理方法
JP2865529B2 (ja) 指紋照合装置
JP2766205B2 (ja) 文字認識装置
JP3196291B2 (ja) 文字認識方法および装置
JP3948943B2 (ja) 図形認識方法及び装置
JPH1021332A (ja) 非線形正規化方法
JP2007026470A (ja) パターン認識装置
JP3277977B2 (ja) 文字認識方法
JP3104355B2 (ja) 特徴抽出装置
JP3372631B2 (ja) パターン認識方法及び装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980617

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070717

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080717

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090717

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100717

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110717

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110717

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees