JP3454626B2 - 大分類方法 - Google Patents

大分類方法

Info

Publication number
JP3454626B2
JP3454626B2 JP00138696A JP138696A JP3454626B2 JP 3454626 B2 JP3454626 B2 JP 3454626B2 JP 00138696 A JP00138696 A JP 00138696A JP 138696 A JP138696 A JP 138696A JP 3454626 B2 JP3454626 B2 JP 3454626B2
Authority
JP
Japan
Prior art keywords
bit string
bit
dictionary
large classification
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00138696A
Other languages
English (en)
Other versions
JPH09190503A (ja
Inventor
幸央 内山
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP00138696A priority Critical patent/JP3454626B2/ja
Publication of JPH09190503A publication Critical patent/JPH09190503A/ja
Application granted granted Critical
Publication of JP3454626B2 publication Critical patent/JP3454626B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する分野】本発明は文字認識技術に係り、特
に、文字認識において詳細識別の前に候補文字種を絞り
込むための大分類技術に関する。
【0002】
【従来の技術】文字認識装置は一般に、入力文字パター
ンから特徴量を抽出し、識別部において、この特徴量と
辞書に登録されている標準特徴量とのマッチングを行う
ことによって、一致の度合が最も高いカテゴリを認識結
果として出力するが、辞書に登録されている全カテゴリ
に対してマッチングを行うことは、特に漢字のような多
数のカテゴリを含む文字種の場合、非常に長い処理時間
がかかり、認識処理の高速化の妨げとなる。
【0003】この問題を解決するため、識別部によるマ
ッチングに先だって、入力文字パターンの大分類処理を
行い、マッチングを行うべきカテゴリを絞り込む方法が
用いられる。大分類処理部では、その処理にかかる時間
を小さくするため、識別部で用いられる特徴量とは別の
簡素な大分類用特徴量を用いる。また、注目したカテゴ
リに対する処理を識別部へ進めるか否かを判定できれば
足りるので、詳細な一致度を求めることなく、入力文字
パターンの大分類用特徴量が注目カテゴリについて定め
られた特徴量の下限から上限までの範囲に含まれている
か否かによって判定する方法が知られており、例えば特
開平6−231309号の方法はこの考え方に基づいて
いる。
【0004】
【発明が解決しようとする課題】上記の特徴量の下限、
上限という2つのパラメータを用いる大分類方法におい
ては、大分類用特徴量の1つの次元について、上限と下
限の2つの大小判定プロセスが必要であるため、1つの
カテゴリについての判定に[大分類用特徴量の次元]×
2だけの比較演算を必要とし、処理にかなりの時間がか
かるという問題があった。また、特徴量の分布関数が分
離した複数の峰を持つ場合や分布領域が単連結でない場
合に、分布の空隙領域までも1つの特徴量区間に含まれ
てしまうため、カテゴリの絞り込みを十分に行い得ない
ことがあった。
【0005】本発明は、そのような問題点を解決し、大
分類を高速かつ確実に行う手段を提供することにある。
【0006】
【課題を解決するための手段】請求項1記載の発明は、
文字パターンから大分類用の複数次元の特徴量を抽出
し、該抽出された大分類用の複数次元の特徴量を表わす
大分類用特徴量空間をあらかじめ複数のセルに分割して
定義しておき、入力文字パターンから大分類用の特徴量
を抽出し、該抽出された特徴量が属するセルに対応した
ビットのみをONにした、セル総数に等しいビット長の
ビット列を作成し、該作成されたビット列と、カテゴリ
別又はカテゴリ群別にあらかじめ用意された大分類用の
辞書ビット列との論理演算を行うことを特徴とするもの
である。
【0007】請求項2記載の発明は、入力文字パターン
から大分類用の特徴量を抽出し、該抽出された特徴量に
対して各次元毎に量子化を行い、該量子化により決定さ
れた量子レベルに対応したビットのみをONにした、該
量子化の量子レベルの数に等しいビット長のビット列を
各次元毎に作成し、該作成されたビット列と、カテゴリ
別又はカテゴリ群別にあらかじめ用意された大分類用の
辞書ビット列との論理演算を行うことを特徴とするもの
である。
【0008】請求項3記載の発明は、請求項2記載の発
明の大分類方法において、特徴量の量子化のための閾値
は、全カテゴリにわたる大分類用の特徴量分布をそれぞ
れの座標軸へ射影したときに、射影された分布関数の積
算がすべての量子レベル区間で等しくなるように大分類
用特徴量の各次元毎に定められることを特徴とするもの
である。
【0009】請求項4記載の発明は、請求項1又は2記
載の発明の大分類方法において、大分類用の辞書ビット
列は、カテゴリ別又はカテゴリ群別の複数の学習パター
ンそれぞれに対し、入力文字パターンに対するビット列
の作成方法と同じ方法で作成されたビット列を論理和し
たものであることを特徴とするものである。
【0010】請求項5記載の発明は、請求項1記載の発
明の大分類方法において、辞書ビット列に対し、そのO
Nビットに対応したセルの近傍の、文字画像の品質に応
じて選択したセルに対応するビットをONにする補正を
施し、該補正の後の辞書ビット列を入力文字パターンに
対して作成されたビット列との論理演算に用いることを
特徴とするものである。
【0011】請求項6記載の発明は、請求項2記載の発
明の大分類方法において、辞書ビット列に対し、そのO
Nビットに対応した量子レベルの近傍の、文字画像の品
質に応じて選択した量子レベルに対応するビットをON
にする補正を施し、該補正の後の辞書ビット列を入力文
字パターンに対して作成されたビット列との論理演算に
用いることを特徴とするものである。
【0012】請求項7記載の発明は、請求項1記載の発
明の大分類方法において、入力文字パターンに対して作
成されたビット列に対し、そのONビットを、それに対
応するセルの近傍の、文字画像の品質に応じて選択した
セルに対応する位置へ移動する補正を施し、該補正の後
のビット列を辞書ビット列との論理演算に用いることを
特徴とするものである。
【0013】請求項8記載の発明は、請求項2記載の発
明の大分類方法において、入力文字パターンに対して作
成されたビット列に対し、そのONビットを、それに対
応する量子レベルの近傍の、文字画像の品質に応じて選
択した量子レベルに対応する位置へ移動させる補正を施
し、該補正の後のビット列を辞書ビット列との論理演算
に用いることを特徴とするものである。
【0014】請求項9記載の発明は、請求項5、6、7
又は8記載の発明の大分類方法において、文字画像の品
質として文字パターンの平均線幅を用い、辞書ビット列
又は入力文字パターンに対して作成されたビット列に対
する補正を平均線幅に応じて制御することにより、平均
線幅が太くなるにつれて段階的につぶれの影響を補償
し、また、平均線幅が細くなるにつれて段階的にかすれ
の影響を補償することを特徴とするものである。
【0015】請求項10記載の発明は、請求項5、6、
7又は8記載の発明の大分類方法において、文字画像の
品質として文字画像を入力するためのスキャナーの解像
度を用い、入力文字パターンに対して作成されたビット
列又は辞書ビット列に対する補正を解像度に応じて制御
することにより、解像度が低くなるにつれて段階的につ
ぶれの影響を補償することを特徴とするものである。
【0016】
【発明の実施の形態】本発明の実施の形態を明らかにす
るため、図面を用い、本発明の幾つかの実施例について
説明する。
【0017】[実施例1]図1は、本実施例による文字
認識装置の構成を示すブロック図である。図1を参照
し、装置構成と関連させて大分類辞書作成時及び文字認
識時の処理内容を説明する。
【0018】図示されないスキャナーにより原稿の画像
が読み取られ、デジタル画像データとして前処理部10
0に入力される。前処理部100において、原稿画像中
の個々の文字画像が切り出され、各文字画像を正規化し
た文字パターンが大分類用特徴抽出部101及び識別用
特徴抽出部108に入力される。ただし、識別用特徴抽
出部108が動作するのは文字認識時のみである。大分
類辞書作成時には、カテゴリ別に、あるいは類似したカ
テゴリー群別に、同様の方法により複数の文字パターン
が学習パターンとして大分類用特徴抽出部101に入力
される。前処理部100は文字パターンの平均線幅も出
力する。ただし、この平均線幅の情報は本実施例では利
用されない。また、原稿読み取り用のスキャナーの解像
度も入力されるが、この情報は本実施例では利用されな
い。
【0019】大分類用特徴抽出部101によって、入力
文字パターンより大分類のための特徴量が抽出される。
本実施例では、大分類用の特徴量空間をあらかじめ複数
のセルに分割しておき、セル決定部102において、入
力文字パターンから抽出された特徴量がどのセルに属す
るかを決定する。そして、ビット列作成部104は、大
分類用特徴量空間のセル総数と同じ長さでセルとビット
が1対1に対応したビット列であって、セル決定部10
2により決定されたセルに対応するビットのみをON、
その他ビットをOFFにしたビット列を生成する。この
ビット列生成の際に、ビット列作成部104は、セル・
ビット対応テーブル103を参照することにより、セル
とビット列中のビット位置との対応関係を把握する。
【0020】より具体的に述べる。本実施例では、大分
類用特徴量として、次に述べるような線密度を反映する
簡単な特徴が用いられる。すなわち、大分類用特徴抽出
部101は、入力文字パターンを横及び縦方向について
走査し、各ライン上での白画素から黒画素への変化点の
数をそれぞれ横線密度Fh(y)、縦線密度Fv(x)
として抽出し、これらの線密度をy軸、x軸について平
均した(Mh,Mv)を大分類用の2次元特徴量として
抽出する。図2に、漢字「木」のサンプルに対する線密
度及び大分類用2次元特徴量の例を示す。
【0021】特徴量空間(2次元平面)は、図3に示す
ように、16個のセルに分割される。そして、1≦i≦
4,1≦j≦4、また、I[0]=0,I[1]=1,
I[2]=2,I[3]=3,I[4]=∞としたと
き、(i+4(j−1))番目のセルは、区間I[i−
1]≦Mh<I[i],I[j−1]≦Mv<I[j]
で表される領域とする。また、図3に示すように、n番
目のセルは、16ビット長のビット列の右からn番目の
ビットに対応させる。しかして、例えば入力文字パター
ンより抽出された特徴量が第8セルに属するとセル決定
部102で決定されると、ビット列生成部104により
8ビット目のみがONに設定され、残りの15ビットが
OFFに設定された16ビット長のビット列が該入力文
字パターンに対して作成される。本実施例では、このビ
ット列がそのままビット列作成部104より出力され
る。
【0022】大分類辞書作成時には、各カテゴリ別また
は各カテゴリ群別に学習パターンとして入力された複数
の文字パターンそれぞれより、同じの方法で16ビット
長ビット列が作成される。そして、大分類辞書作成部1
05において、それらビット列の論理和をとることによ
り、該カテゴリ又はカテゴリ群のための辞書ビット列
(16ビット長)を作成する。この辞書ビット列、すな
わち学習パターンが少なくとも1つ属するセルに対応す
るビットをONしたビット列は、カテゴリ又はカテゴリ
群の識別情報とともに大分類辞書106に格納される。
大分類辞書作成部105は、文字認識時には動作しな
い。
【0023】以下、通常の文字認識時の処理を説明す
る。入力文字パターンに対するビット列がビット列作成
部104によって作成される一方、詳細識別用特徴量が
識別用特徴抽出部108により抽出される。論理演算部
107は、大分類辞書106に格納されている辞書ビッ
ト列の1の補数(各ビットの論理状態を反転させたビッ
ト列)をマスクとして、入力文字パターンに対しビット
列作成部104より出力されたビット列との論理積をと
る。このようなビット列の論理積の例を図4に示す。
【0024】この論理積の結果ビットのすべてがOFF
であれば、当該辞書ビット列に対応したカテゴリ又はカ
テゴリ群の識別情報を識別部110に与え詳細識別を指
示する(図4の左側に示した辞書ビット列の場合)。論
理積結果ビットの1ビットでもONであれば(図4の右
側に示した辞書ビット列の場合)、当該辞書ビット列に
対応したカテゴリ又はカテゴリ群は識別部110の詳細
識別の対象から外される。このような分類処理は、大分
類辞書106内のすべてのカテゴリ又はカテゴリ群の辞
書ビット列に関して実行される。
【0025】このような分類の方法によれば、特徴量の
上限、下限を用いるだけでは表現しきれない、図5に示
すような特徴量分布を持つカテゴリについても十分な絞
り込みが可能である。また、デジタル演算装置の多くは
16ビットを1ワードとし、1回のAND演算で、2つ
の16ビット長ビット列の論理積をとることができ、ま
た、論理積結果のすべてのビットがOFFであるかどう
かもワードとして0であるか否かの1回の等号演算によ
って判定できる。したがって、(次元数)×2回の大小
比較演算を必要とした従来方法よりも高速の分類判定が
可能である。
【0026】識別部110においては、上記分類処理に
よって詳細識別の対象と判定されたカテゴリ又はカテゴ
リ群に関し、あらかじめ識別辞書109に格納されてい
る詳細識別用特徴量と、識別用特徴抽出部108によっ
て入力文字パターンから抽出された特徴量とのマッチン
グが行われ、その一致度に応じた認識結果が出力され
る。詳細識別に用いる特徴量は従来と同様でよいので、
具体例は提示しない。
【0027】なお、大分類のための特徴量、特徴量空間
のセル分割方法、セルとビット列のビットとの対応付け
の方法等は、前述したものに限定されるものではなく、
必要に応じ変更してよい。
【0028】[実施例2]図6は、本実施例による文字
認識装置の構成を示すブロック図である。図6を参照
し、装置構成と関連させて大分類辞書作成時及び文字認
識時の処理内容を説明する。
【0029】図示されないスキャナーにより原稿の画像
が読み取られ、デジタル画像データとして前処理部20
0に入力される。前処理部200において、個々の文字
画像を切り出し、それを正規化した文字パターンを大分
類用特徴抽出部101及び識別用特徴抽出部208に入
力する。大分類辞書作成時には、カテゴリ別に、あるい
は類似したカテゴリー群別に、同様の方法により複数の
文字パターンが学習パターンとして大分類用特徴抽出部
201に入力される。前処理部200は文字パターンの
平均線幅も出力するが、この平均線幅の情報は本実施例
では利用されない。また、原稿読み取り用のスキャナー
の解像度も入力されるが、この情報は本実施例では利用
されない。
【0030】大分類用特徴抽出部201によって、入力
文字パターンより大分類のための特徴量が抽出される。
本実施例では、量子レベル決定部202において、抽出
された大分類用特徴量に対し各次元毎に量子化を行い、
それぞれの成分がどの量子レベルに属するかを決定す
る。この量子化のための閾値は、全カテゴリにわたる大
分類用特徴量の分布をそれぞれの座標軸へ射影したとき
に、射影された分布関数の積算がどの量子レベル区間で
も等しくなるように、あらかじめ各次元毎に定められ
る。ビット列作成部204において、特徴量の各次元毎
に、量子レベル数に等しいビット長を持ち、各ビットが
量子レベルと1対1に対応したビット列であって、量子
レベル決定部202で決定された量子レベルに対応した
ビットのみONにしたビット列を作成する。本実施例で
は、このビット列がそのままビット列作成部204より
出力される。
【0031】より具体的に述べる。大分類用特徴抽出部
201において、前記実施例1と同じ文字パターンの2
次元の平均線密度(Mh,Mv)が大分類用特徴量とし
て抽出される(図2参照)。量子レベル決定部202で
は、Mh,Mvそれぞれについて8レベルの量子化を行
う。この量子化のための閾値は、あらかじめ学習パター
ンよりMh,Mvの全カテゴリにわたる分布関数P(M
h),P(Mv)を作成し、それぞれの分布関数毎に、
分布関数の積算がどの量子レベル区間でも等しくなるよ
うに定められる。図7に、Mh,Mvの分布関数の例が
実線で示されており、その量子化のための閾値の例が点
線で示されている。
【0032】量子化レベル数は8であるから、ビット列
作成部204により作成されるビット列は、Mhに対応
した8ビット長のビット列とMvに対応した8ビット長
のビット列である。そして、n番目の量子レベルをビッ
ト列の右からn番目のビットに対応させると、例えばあ
る入力文字パターンに対し、Mhが第3レベル、Mvが
第7レベルに属すると判定された場合、図7に示すよう
に、Mhのビット列00000100とMvのビット列
01000000がビット作成部204より出力され
る。
【0033】大分類辞書作成時には、カテゴリ別又はカ
テゴリー群別に複数の文字パターンを学習パターンとし
て入力し、それぞれの学習パターンに対するMh,Mv
のビット列を作成する。そして、大分類辞書作成部20
5において、それらのビット列の論理和をとり、大分類
辞書用の辞書ビット列として大分類辞書206に格納す
る。すなわち、あるカテゴリ又はカテゴリ群に関する辞
書ビット列は、該カテゴリ又はカテゴリ群のための学習
パターンが少なくとも1つ属する量子レベルに対応した
ビットのみをONにしたビット列である。
【0034】以下、通常の文字認識時の処理を説明す
る。入力文字パターンに対するビット列がビット列作成
部204によって作成される一方、詳細識別用特徴量が
識別用特徴抽出部208により抽出される。論理演算部
207は、大分類辞書206に格納されている辞書ビッ
ト列の1の補数(各ビットの論理状態を反転させたビッ
ト列)をマスクとして、入力文字パターンに対しビット
列作成部204より出力されたビット列との論理積をと
る。このようなビット列の論理積の例を図8に示す。
【0035】この論理積の結果ビットのすべてがOFF
であれば、当該辞書ビット列に対応したカテゴリ又はカ
テゴリ群の識別情報を識別部210に与え詳細識別を指
示する(図8の左側に示した辞書ビット列の場合)。論
理積結果ビットの1ビットでもONであれば(図8の右
側に示した辞書ビット列の場合)、当該辞書ビット列に
対応したカテゴリ又はカテゴリ群は識別部210の詳細
識別の対象から外される。このような分類処理は、大分
類辞書206内のすべてのカテゴリ又はカテゴリ群の辞
書ビット列に関して実行される。
【0036】デジタル演算装置の多くは16ビットを1
ワードとして1回のAND演算で論理積をとることがで
き、ワードのすべてのビットがOFFであるかどうかも
ワードとして0か否かの1回の等号演算によって判定で
きる。したがって、上述の大分類処理においては、2つ
の8ビット長のビット列を連結して16ビット長とする
ことにより、2つの特徴量次元についての判定を一度に
行うことができる。
【0037】なお、大分類のための特徴量、量子レベル
数、量子レベルとビット列のビットとの対応付けの方法
等は、前述したものに限定されるものではなく、必要に
応じ変更してよい。
【0038】[実施例3]本実施例による文字認識装置
の構成は前記実施例2と同じであるので、装置構成に関
しては図6を参照して説明する。なお、本実施例におい
ては、通常の文字認識時に前処理部200より出力され
る文字パターンの平均線幅Wが文字画像の品質の情報と
して論理演算部207で利用される。大分類辞書作成時
の処理内容は前記実施例2と同一であるので説明を省略
し、文字認識時の処理内容について以下説明する。
【0039】本実施例では、文字認識時に、論理演算部
207において、大分類辞書206内の辞書ビット列を
文字画像の品質に応じて補正した補正辞書ビット列を作
成し、その1の補数をマスクとして入力文字パターンに
対して作成されたビット列と論理積をとる。より詳しく
は、辞書ビット列中のONビットに加えて、その近傍の
ビットもONにしたビット列を補正辞書ビット列として
分類に用いるが、そのONにする近傍ビットの選択基準
として文字パターンの平均線幅Wを用いる。換言すれ
ば、辞書ビット列に対して、そのONビットに対応する
量子レベルの近傍の量子レベルに対応するビットをON
にする補正を施し、この補正ビット列を補正辞書ビット
列として用いるが、その追加するONビットに対応する
近傍量子レベルの選択基準を文字画像の品質を表す文字
パターンの平均線幅によって可変にする。
【0040】具体例により説明する。例えば、あるカテ
ゴリに関する辞書ビット列が Mh:00111000 Mv:00001100 であったとする。認識したい文字パターンの平均線幅W
が大きいときは、線が太いのでつぶれが生じ、きれいな
文字画像の場合よりも線密度が低く評価されている可能
性がある。そこで、上の辞書ビット列において、Mhの
第3ビットをONにし、つぶれの程度によっては、さら
に第2ビットもONにしたビット列を補正辞書ビット列
として用いれば、元の辞書ビットを用いるよりも低密度
側をもカバーできるため、つぶれの影響を補償し、正解
カテゴリが分類から洩れるのを抑えることができる。同
様に、辞書ビット列のMvの第2ビット、つぶれの程度
によっては、さらに第1ビットをONにしたビット列を
補正辞書ビット列として用いる。
【0041】一方、平均線幅Wが小さいときは、線が細
いのでかすれが生じ、かすれた線と直交する方向の線が
存在しないように見えるため、線密度は高く評価されて
いる可能性がある。そこで、上記辞書ビット列におい
て、Mhの第3ビット、第7ビットもONにしたビット
列を補正辞書ビット列として用いるほうが密度の多少の
ずれをカバーでき、かすれの影響を補償し、正解カテゴ
リが分類から洩れるのを抑えることができる。同様に、
Mvの第2ビット、第5ビットもONにしたビット列を
補正辞書ビット列として用いる。
【0042】平均線幅Wと、辞書ビット列に本来のON
ビットのほかに付加されるONビット(マージンビッ
ト)の例を図9に示す。例えば、W=5のような当該カ
テゴリのつぶれた文字パターンが入力し、この文字パタ
ーンの線密度が低く評価され、それより作成されたMh
のビット列が00000100となった場合、このビッ
ト列と、当該カテゴリのMhの元の辞書ビット列の1の
補数(ビット反転)であるマスク11000111との
論理積は00000100となり0でない。すなわち、
当該カテゴリが分類から洩れる。これに対し、Mhの補
正辞書ビット列00111100の1の補正であるマス
ク11000011との論理積は0になるので、当該カ
テゴリが分類から洩れることを防ぐことができる。
【0043】[実施例4]本実施例による文字認識装置
の構成は前記実施例1と同じであるので、装置構成に関
しては図1を参照して説明する。なお、本実施例におい
ては、通常の文字認識時に前処理部100より出力され
る文字パターンの平均線幅Wが文字画像の品質の情報と
して論理演算部107で利用される。大分類辞書作成時
の処理内容は前記実施例1と同一であるので説明を省略
し、文字認識時の処理内容について以下説明する。
【0044】本実施例では、文字認識時に、論理演算部
107において、大分類辞書106内の辞書ビット列を
文字画像の品質に応じて補正した補正辞書ビット列を作
成し、その1の補数をマスクとして入力文字パターンに
対して作成されたビット列と論理積をとる。より詳しく
は、辞書ビット列に対して、そのONビットに対応する
セルの近傍のセルに対応するビットもONにする補正を
施し、この補正ビット列を補正辞書ビット列として用い
るが、この追加のONビットに対応する近傍セルの選択
基準として文字パターンの平均線幅Wを用いる。
【0045】具体例により説明する。例えば、あるカテ
ゴリに関する大分類用特徴量が図10(b)のハッチン
グを施された2つのセルに分布しており、したがって当
該カテゴリの辞書ビット列が000001000010
0000として与えられているとする。
【0046】入力文字パターンの平均線幅Wが大きいと
きは、つぶれのため、きれいな文字パターンに比べて線
密度が低く評価される可能性がある。そこで、つぶれの
影響を補償するために、図10(b)に示した元々の分
布が属するセルの左方向(Mhが減少する方向)及び下
方向(Mvが減少する方向)に隣接したセルを選択し、
選択したセルに対応したビットをONにする補正を辞書
ビット列に施す。すなわち、図10(c)のハッチング
が施されたセルに対応したビットをONにしたビット列
が補正辞書ビット列として用いられる。つぶれの程度に
よっては、さらに左下方向(Mh,Mvが同時に減少す
る方向)に隣接するセルも選択し、それに対応するビッ
トもONにする(すなわち、図10(d)のハッチング
が施されたセルに対応するビットをONにした補正辞書
ビット列を用いる)。
【0047】一方、入力文字パターンの平均線幅Wが小
さいときは、かすれのために、きれいな文字パターンに
比べて線密度がずれる可能性がある。そこで、かすれの
影響を補償するため、元のセルに加え、その上下左右に
隣接するセルについても、辞書ビット列中の対応ビット
をONにする(図10(a)のハッチングを施されたセ
ルに対応するビットをONにした補正辞書ビット列を用
いる)。
【0048】以上に述べた補正辞書ビット列と平均線幅
との関係を図11に示す。例えば、W=5のような該カ
テゴリのつぶれ文字パターンが入力され、その大分類用
特徴量が図10(c)にX印で示したセルに属する場合
を考える。この入力文字パターンより作成されるビット
列は0000000000000010であるので、該
カテゴリの元の辞書ビット列の1の補数であるマスク1
111101111011111との論理積は0となら
ない。しかし、補正辞書ビット列の1の補数であるマス
ク1111100110001101との論理積は0と
なるので、当該カテゴリが分類から洩れるのを防ぐこと
ができる。
【0049】[実施例5]本実施例による文字認識装置
の構成は前記実施例2と同じであるので、装置構成に関
しては図6を参照して説明する。なお、本実施例におい
ては、通常の文字認識時にスキャナー解像度の情報が文
字画像の品質の情報としてビット列作成部204で利用
される。大分類辞書作成時の処理内容は前記実施例2と
同一であるので説明を省略し、文字認識時の処理内容に
ついて以下説明する。
【0050】本実施例では、文字認識時に、ビット列作
成部204において、入力文字パターンに対して前記実
施例2と同様のビット列、すなわち量子レベル決定部2
02により決定された量子レベルに対応したビットだけ
をONにしたビット列を作成し、このビット列をスキャ
ナー解像度に応じた量だけ左へシフトした(ONビット
をシフトした)補正ビット列を作成し、これを論理演算
部207へ入力する。論理演算部207による分類処理
の内容は前記実施例2と同じである。
【0051】より詳しく説明する。一般に原稿の読み取
りに使うスキャナーの解像度が十分に高ければ、つぶれ
のないきれいな画像を得られるが、スキャナーの解像度
が低くなるにつれて、画像のつぶれる箇所が多くなって
くる。このため、低解像度で入力された文字パターンの
線密度は、きれいな文字パターンよりも低く評価されて
いると考えられる。そこで、スキャナーが低解像度の場
合は、入力文字パターンに対して作成されたビット列
を、解像度に応じた量だけ左側へ、すなわち、線密度が
高い側へシフトさせることにより、つぶれによる影響を
補償し、正解カテゴリが分類から洩れるのを抑えること
ができる。
【0052】解像度とビットシフト量との関係を例示す
れば、解像度が400dpi以上のときはシフトを行わ
ず、解像度が200dpi以上400dpi未満のとき
には左に1ビットだけシフトし、解像度が200dpi
未満のときは左に2ビットだけシフトする。
【0053】低解像度のスキャナーに対して適切な分類
が行われる例を示せば、あるカテゴリに関し図12に示
すような辞書ビット列が与えられているとする。この例
において、理想的なスキャナー解像度で入力した時にM
hが00010000、Mvが00000100となる
ような当該カテゴリのあるサンプルを解像度200dp
iで入力した場合、つぶれのためにMhが000010
00、Mvが00000010となったとする。この場
合、入力ビット列に対するビットシフトを行わないと、
Mvに関して辞書ビット列の1の補数であるマスクとの
論理積は00000010となり、0にならない。しか
し、上述のように入力文字パターンのビット列を左に1
ビットだけシフトすれば、Mhが00010000、M
vが00000100となり、これは理想的な解像度の
場合と同じビット列であるため、マスクとの論理積は0
となり、当該カテゴリが分類から洩れることはない。
【0054】[実施例6]本実施例による文字認識装置
の構成は前記実施例1と同じであるので、装置構成に関
しては図1を参照して説明する。なお、本実施例におい
ては、通常の文字認識時にスキャナー解像度の情報が文
字画像の品質の情報としてビット列作成部104で利用
される。大分類辞書作成時の処理内容は前記実施例1と
同一であるので説明を省略し、文字認識時の処理内容に
ついて以下説明する。
【0055】本実施例では、文字認識時に、ビット列作
成部104において入力文字パターンに対する前記実施
例1と同様のビット列、すなわちセル決定部102によ
り決定されたセルに対応したビットだけをONにしたビ
ット列を作成し、このビット列に対して、スキャナー解
像度に応じた量だけONビットを移動する補正を行い、
補正後のビット列を論理演算部107へ入力する。論理
演算部107による分類処理の内容は前記実施例1と同
じである。
【0056】具体例によって説明する。あるカテゴリに
関する特徴量が図13のハッチングを施した4つのセル
に分布しており、したがって該カテゴリの辞書ビット列
として、1100110000000000が与えられ
ているとする。また、理想的なスキャナー解像度で入力
したときには、特徴量が図13のPで示したセルに属す
るような該カテゴリのサンプル画像を考える。ここで
は、スキャナーの解像度を水平方向、垂直方向に独立に
変えることができるものとする。
【0057】そして、 (1)水平方向解像度が400dpi以上、かつ、垂直
方向解像度が400dpi以上のとき:サンプル画像よ
り作成されたビット列のONビットの移動を行わない。 (2)水平方向解像度が400dpi以上、かつ、垂直
方向解像度が400dpi未満のとき:垂直方向の線密
度Mvが低くなると考えられるので、その影響を補正す
るため、サンプル画像より作成されたビット列中のON
ビットを、それに対応するセルの上側に隣接するセルに
対応する位置へ移動させる。 (3)水平解像度が400dpi未満、かつ、垂直方向
解像度が400dpiも万のとき:水平方向の線密度M
h、垂直方向の線密度Mvが共に低くなると考えられる
ので、サンプル画像より作成されたビット列中のONビ
ットを、それに対応するセルの右上に隣接するセルに対
応した位置へ移動させる。
【0058】図13を参照して説明すれば、つぶれのた
めに、サンプル画像の特徴量が、上記(2)のケースで
はXのセルに属することになっても、また上記(3)の
ケースではYのセルに属することになっても、それぞれ
のONビットの移動により、理想的な解像度の場合と同
じビット列(セルPに対応するビットがONのビット
列)0000010000000000がビット列生成
部104より論理演算部107へ与えられるため、辞書
ビット列をビット反転したマスク0011001111
111111との論理積は0となり、該カテゴリが分類
から洩れるのを防ぐことができる。
【0059】なお、前記実施例3及び4において、文字
画像の品質として、文字パターンの平均線幅の代わり
に、原稿読み取り用のスキャナーの解像度を用いてもよ
い。この場合、スキャナー解像度が低くなるにつれて段
階的に、パターンのつぶれの影響を補償する方向に、辞
書ビット列に付加するONビットの増やすことにより、
前記実施例3及び4と同様に正解カテゴリを分類から洩
れにくくすることができることは以上の説明より明らか
であろう。
【0060】また、前記実施例5及び6において、文字
画像の品質として、スキャナーの解像度の代わりに、文
字パターンの平均線幅を用いてもよい。この場合、平均
線幅が太くなるにつれて段階的に、つぶれの影響を補償
する方向に、また、平均線幅が細くなるにつれて段階的
に、かすれの影響を補償する方向に、入力文字パターン
に対して作成されたビット列のONビットを移動させる
ことにより、前記実施例5及び6と同様に正解カテゴリ
を分類から洩れにくくすることができることは以上の説
明から明らかであろう。
【0061】
【発明の効果】以上の詳細な説明から明らかなように、
請求項1乃至10の各項記載の発明によれば、特徴量の
上限、下限の2つのパラメータだけでは表現しきれない
ような特徴量分布を持つカテゴリについても確実な大分
類が可能になる。デジタル演算装置が一般的に持つ、複
数のビットをまとめて論理演算する命令セットを生か
し、少ない論理演算により分類判定を高速に行うことが
できる。したがって、確実かつ高速な大分類処理を実現
し、文字認識処理の高精度化、高速化に寄与することが
できるという効果を得られる。
【0062】請求項5乃至10の各項記載の発明によれ
ば、文字画像の品質に応じて、具体的には文字パターン
の平均線幅又はスキャナー解像度に応じて、入力文字パ
ターンに対するビット列又は辞書ビット列を補正するこ
とにより、文字パターンのつぶれ又はかすれが無視でき
ない場合にも、つぶれ又はかすれの影響を補償し、より
確実な大分類を達成できるという効果を得られる。
【図面の簡単な説明】
【図1】本発明を実施する文字認識装置の構成の一例を
示すブロック図である。
【図2】文字パターンの大分類用特徴量の例を示す図で
ある。
【図3】大分類用特徴量空間のセル分割、並びにセルと
ビット列のビットとの対応の説明図である。
【図4】実施例1における入力文字パターンに対するビ
ット列と辞書ビット列との論理演算の例を示す図であ
る。
【図5】分離しかつ凹状のセルにまたがった特徴量分布
と、それに対応したビット列表現を示す図である。
【図6】本発明を実施する文字認識装置の構成の他の例
を示すブロック図である。
【図7】大分類用特徴量の量子化及びビット列の説明図
である。
【図8】実施例2における入力文字パターンに対するビ
ット列と辞書ビット列との論理演算の例を示す図であ
る。
【図9】実施例3における文字パターンの平均線幅によ
る辞書ビット列の補正の例を示す図である。
【図10】実施例4における文字パターンの平均線幅に
よる辞書ビット列の補正の説明図である。
【図11】実施例4における文字パターンの平均線幅に
よる辞書ビット列の補正例を示す図である。
【図12】実施例5に関連した辞書ビット例を示す図で
ある。
【図13】実施例6における入力文字パターンに対する
ビット列のスキャナー解像度による補正の説明図であ
る。
【符号の説明】
100,200 前処理部 101,201 大分類用特徴抽出部 102 セル決定部 103 セル・ビット対応テーブル 104,204 ビット列作成部 105,205 大分類辞書作成部 106,206 大分類辞書 107,207 論理演算部 108,208 識別用特徴抽出部 109,209 識別辞書 110,210 識別部 203 量子レベル・ビット対応テーブル
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力文字パターンを大分類する大分類方
    法であって、 文字パターンから大分類用の複数次元の特徴量を抽出
    し、該抽出された大分類用の複数次元の特徴量を表わす
    大分類用特徴量空間をあらかじめ複数のセルに分割して
    定義しておき、 入力文字パターンから大分類用の特徴量を抽出し、該抽
    出された特徴量が属するセルに対応したビットのみをO
    Nにした、前記大分類用特徴量空間のセル総数に等しい
    ビット長のビット列を作成し、該作成されたビット列
    と、カテゴリ別又はカテゴリ群別にあらかじめ用意され
    た大分類用の辞書ビット列との論理演算を行うことを特
    徴とする大分類方法。
  2. 【請求項2】 入力文字パターンを大分類する大分類
    方法であって、 入力文字パターンから大分類用の特徴量を抽出し、該抽
    出された特徴量に対して各次元毎に量子化を行い、該量
    子化により決定された量子レベルに対応したビットのみ
    をONにした、該量子化の量子レベルの数に等しいビッ
    ト長のビット列を各次元毎に作成し、該作成されたビッ
    ト列と、カテゴリ別又はカテゴリ群別にあらかじめ用意
    された大分類用の辞書ビット列との論理演算を行うこと
    を特徴とする大分類方法。
  3. 【請求項3】 請求項2記載の大分類方法において、特
    徴量の量子化のための閾値は、全カテゴリにわたる大分
    類用の特徴量分布をそれぞれの座標軸へ射影したとき
    に、射影された分布関数の積算がすべての量子レベル区
    間で等しくなるように大分類用特徴量の各次元毎に定め
    られることを特徴とする大分類方法。
  4. 【請求項4】 請求項1又は2記載の大分類方法におい
    て、大分類用の辞書ビット列は、カテゴリ別又はカテゴ
    リ群別の複数の学習パターンそれぞれに対し、入力文字
    パターンに対するビット列の作成方法と同じ方法で作成
    されたビット列を論理和したものであることを特徴とす
    る大分類方法。
  5. 【請求項5】 請求項1記載の大分類方法において、辞
    書ビット列に対し、そのONビットに対応したセルの近
    傍の、文字画像の品質に応じて選択したセルに対応する
    ビットをONにする補正を施し、該補正の後の辞書ビッ
    ト列を入力文字パターンに対して作成されたビット列と
    の論理演算に用いることを特徴とする大分類方法。
  6. 【請求項6】 請求項2記載の大分類方法において、辞
    書ビット列に対し、そのONビットに対応した量子レベ
    ルの近傍の、文字画像の品質に応じて選択した量子レベ
    ルに対応するビットをONにする補正を施し、該補正の
    後の辞書ビット列を入力文字パターンに対して作成され
    たビット列との論理演算に用いることを特徴とする大分
    類方法。
  7. 【請求項7】 請求項1記載の大分類方法において、入
    力文字パターンに対して作成されたビット列に対し、そ
    のONビットを、それに対応するセルの近傍の、文字画
    像の品質に応じて選択したセルに対応する位置へ移動す
    る補正を施し、該補正の後のビット列を辞書ビット列と
    の論理演算に用いることを特徴とする大分類方法。
  8. 【請求項8】 請求項2記載の大分類方法において、入
    力文字パターンに対して作成されたビット列に対し、そ
    のONビットを、それに対応する量子レベルの近傍の、
    文字画像の品質に応じて選択した量子レベルに対応する
    位置へ移動させる補正を施し、該補正の後のビット列を
    辞書ビット列との論理演算に用いることを特徴とする大
    分類方法。
  9. 【請求項9】 請求項5、6、7又は8記載の大分類方
    法において、文字画像の品質として文字パターンの平均
    線幅を用い、辞書ビット列又は入力文字パターンに対し
    て作成されたビット列に対する補正を平均線幅に応じて
    制御することにより、平均線幅が太くなるにつれて段階
    的につぶれの影響を補償し、また、平均線幅が細くなる
    につれて段階的にかすれの影響を補償することを特徴と
    する大分類方法。
  10. 【請求項10】 請求項5、6、7又は8記載の大分類
    方法において、文字画像の品質として文字画像を入力す
    るためのスキャナーの解像度を用い、入力文字パターン
    に対して作成されたビット列又は辞書ビット列に対する
    補正を解像度に応じて制御することにより、解像度が低
    くなるにつれて段階的につぶれの影響を補償することを
    特徴とする大分類方法。
JP00138696A 1996-01-09 1996-01-09 大分類方法 Expired - Fee Related JP3454626B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00138696A JP3454626B2 (ja) 1996-01-09 1996-01-09 大分類方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00138696A JP3454626B2 (ja) 1996-01-09 1996-01-09 大分類方法

Publications (2)

Publication Number Publication Date
JPH09190503A JPH09190503A (ja) 1997-07-22
JP3454626B2 true JP3454626B2 (ja) 2003-10-06

Family

ID=11500054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00138696A Expired - Fee Related JP3454626B2 (ja) 1996-01-09 1996-01-09 大分類方法

Country Status (1)

Country Link
JP (1) JP3454626B2 (ja)

Also Published As

Publication number Publication date
JPH09190503A (ja) 1997-07-22

Similar Documents

Publication Publication Date Title
EP1999688B1 (en) Converting digital images containing text to token-based files for rendering
US5111514A (en) Apparatus for converting handwritten characters onto finely shaped characters of common size and pitch, aligned in an inferred direction
US5625707A (en) Training a neural network using centroid dithering by randomly displacing a template
EP0431958B1 (en) Identification and segmentation of finely textured and solid regions of binary images
US6782142B2 (en) Method and apparatus for using rotatable templates within look-up tables to enhance image reproduction
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH03260787A (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
JPH0750751A (ja) 画像情報の処理及び再生装置
CN110180186A (zh) 一种地形图转换方法及系统
EP0343786A2 (en) Method and apparatus for reading and recording text in digital form
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
CA2192023C (en) Separation of touching characters in optical character recognition
JP3454626B2 (ja) 大分類方法
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
JP2700131B2 (ja) パターン認識方法
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
Jeng Optical Chinese character recognition using accumulated stroke features
Kurdy et al. Omnifont Arabic optical character recognition system
Okada et al. A morphological subtraction scheme for form analysis
JP3019287B2 (ja) 画像領域分割方法
CA2201557A1 (en) Degraded character image restoration
JP2613211B2 (ja) 画像入力装置
JPH05282489A (ja) 文章画像の属性判別方法
JPH05128306A (ja) 文章画像の属性判別方法
JP3463255B2 (ja) 多値画像パターンの認識処理方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070725

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080725

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090725

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090725

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100725

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees