JP3454626B2

JP3454626B2 - 大分類方法

Info

Publication number: JP3454626B2
Application number: JP00138696A
Authority: JP
Inventors: 幸央内山; 秀明山形
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1996-01-09
Filing date: 1996-01-09
Publication date: 2003-10-06
Anticipated expiration: 2016-01-09
Also published as: JPH09190503A

Description

【発明の詳細な説明】

【０００１】

【発明の属する分野】本発明は文字認識技術に係り、特
に、文字認識において詳細識別の前に候補文字種を絞り
込むための大分類技術に関する。

【０００２】

【従来の技術】文字認識装置は一般に、入力文字パター
ンから特徴量を抽出し、識別部において、この特徴量と
辞書に登録されている標準特徴量とのマッチングを行う
ことによって、一致の度合が最も高いカテゴリを認識結
果として出力するが、辞書に登録されている全カテゴリ
に対してマッチングを行うことは、特に漢字のような多
数のカテゴリを含む文字種の場合、非常に長い処理時間
がかかり、認識処理の高速化の妨げとなる。

【０００３】この問題を解決するため、識別部によるマ
ッチングに先だって、入力文字パターンの大分類処理を
行い、マッチングを行うべきカテゴリを絞り込む方法が
用いられる。大分類処理部では、その処理にかかる時間
を小さくするため、識別部で用いられる特徴量とは別の
簡素な大分類用特徴量を用いる。また、注目したカテゴ
リに対する処理を識別部へ進めるか否かを判定できれば
足りるので、詳細な一致度を求めることなく、入力文字
パターンの大分類用特徴量が注目カテゴリについて定め
られた特徴量の下限から上限までの範囲に含まれている
か否かによって判定する方法が知られており、例えば特
開平６−２３１３０９号の方法はこの考え方に基づいて
いる。

【０００４】

【発明が解決しようとする課題】上記の特徴量の下限、
上限という２つのパラメータを用いる大分類方法におい
ては、大分類用特徴量の１つの次元について、上限と下
限の２つの大小判定プロセスが必要であるため、１つの
カテゴリについての判定に［大分類用特徴量の次元］×
２だけの比較演算を必要とし、処理にかなりの時間がか
かるという問題があった。また、特徴量の分布関数が分
離した複数の峰を持つ場合や分布領域が単連結でない場
合に、分布の空隙領域までも１つの特徴量区間に含まれ
てしまうため、カテゴリの絞り込みを十分に行い得ない
ことがあった。

【０００５】本発明は、そのような問題点を解決し、大
分類を高速かつ確実に行う手段を提供することにある。

【０００６】

【課題を解決するための手段】請求項１記載の発明は、
文字パターンから大分類用の複数次元の特徴量を抽出
し、該抽出された大分類用の複数次元の特徴量を表わす
大分類用特徴量空間をあらかじめ複数のセルに分割して
定義しておき、入力文字パターンから大分類用の特徴量
を抽出し、該抽出された特徴量が属するセルに対応した
ビットのみをＯＮにした、セル総数に等しいビット長の
ビット列を作成し、該作成されたビット列と、カテゴリ
別又はカテゴリ群別にあらかじめ用意された大分類用の
辞書ビット列との論理演算を行うことを特徴とするもの
である。

【０００７】請求項２記載の発明は、入力文字パターン
から大分類用の特徴量を抽出し、該抽出された特徴量に
対して各次元毎に量子化を行い、該量子化により決定さ
れた量子レベルに対応したビットのみをＯＮにした、該
量子化の量子レベルの数に等しいビット長のビット列を
各次元毎に作成し、該作成されたビット列と、カテゴリ
別又はカテゴリ群別にあらかじめ用意された大分類用の
辞書ビット列との論理演算を行うことを特徴とするもの
である。

【０００８】請求項３記載の発明は、請求項２記載の発
明の大分類方法において、特徴量の量子化のための閾値
は、全カテゴリにわたる大分類用の特徴量分布をそれぞ
れの座標軸へ射影したときに、射影された分布関数の積
算がすべての量子レベル区間で等しくなるように大分類
用特徴量の各次元毎に定められることを特徴とするもの
である。

【０００９】請求項４記載の発明は、請求項１又は２記
載の発明の大分類方法において、大分類用の辞書ビット
列は、カテゴリ別又はカテゴリ群別の複数の学習パター
ンそれぞれに対し、入力文字パターンに対するビット列
の作成方法と同じ方法で作成されたビット列を論理和し
たものであることを特徴とするものである。

【００１０】請求項５記載の発明は、請求項１記載の発
明の大分類方法において、辞書ビット列に対し、そのＯ
Ｎビットに対応したセルの近傍の、文字画像の品質に応
じて選択したセルに対応するビットをＯＮにする補正を
施し、該補正の後の辞書ビット列を入力文字パターンに
対して作成されたビット列との論理演算に用いることを
特徴とするものである。

【００１１】請求項６記載の発明は、請求項２記載の発
明の大分類方法において、辞書ビット列に対し、そのＯ
Ｎビットに対応した量子レベルの近傍の、文字画像の品
質に応じて選択した量子レベルに対応するビットをＯＮ
にする補正を施し、該補正の後の辞書ビット列を入力文
字パターンに対して作成されたビット列との論理演算に
用いることを特徴とするものである。

【００１２】請求項７記載の発明は、請求項１記載の発
明の大分類方法において、入力文字パターンに対して作
成されたビット列に対し、そのＯＮビットを、それに対
応するセルの近傍の、文字画像の品質に応じて選択した
セルに対応する位置へ移動する補正を施し、該補正の後
のビット列を辞書ビット列との論理演算に用いることを
特徴とするものである。

【００１３】請求項８記載の発明は、請求項２記載の発
明の大分類方法において、入力文字パターンに対して作
成されたビット列に対し、そのＯＮビットを、それに対
応する量子レベルの近傍の、文字画像の品質に応じて選
択した量子レベルに対応する位置へ移動させる補正を施
し、該補正の後のビット列を辞書ビット列との論理演算
に用いることを特徴とするものである。

【００１４】請求項９記載の発明は、請求項５、６、７
又は８記載の発明の大分類方法において、文字画像の品
質として文字パターンの平均線幅を用い、辞書ビット列
又は入力文字パターンに対して作成されたビット列に対
する補正を平均線幅に応じて制御することにより、平均
線幅が太くなるにつれて段階的につぶれの影響を補償
し、また、平均線幅が細くなるにつれて段階的にかすれ
の影響を補償することを特徴とするものである。

【００１５】請求項１０記載の発明は、請求項５、６、
７又は８記載の発明の大分類方法において、文字画像の
品質として文字画像を入力するためのスキャナーの解像
度を用い、入力文字パターンに対して作成されたビット
列又は辞書ビット列に対する補正を解像度に応じて制御
することにより、解像度が低くなるにつれて段階的につ
ぶれの影響を補償することを特徴とするものである。

【００１６】

【発明の実施の形態】本発明の実施の形態を明らかにす
るため、図面を用い、本発明の幾つかの実施例について
説明する。

【００１７】［実施例１］図１は、本実施例による文字
認識装置の構成を示すブロック図である。図１を参照
し、装置構成と関連させて大分類辞書作成時及び文字認
識時の処理内容を説明する。

【００１８】図示されないスキャナーにより原稿の画像
が読み取られ、デジタル画像データとして前処理部１０
０に入力される。前処理部１００において、原稿画像中
の個々の文字画像が切り出され、各文字画像を正規化し
た文字パターンが大分類用特徴抽出部１０１及び識別用
特徴抽出部１０８に入力される。ただし、識別用特徴抽
出部１０８が動作するのは文字認識時のみである。大分
類辞書作成時には、カテゴリ別に、あるいは類似したカ
テゴリー群別に、同様の方法により複数の文字パターン
が学習パターンとして大分類用特徴抽出部１０１に入力
される。前処理部１００は文字パターンの平均線幅も出
力する。ただし、この平均線幅の情報は本実施例では利
用されない。また、原稿読み取り用のスキャナーの解像
度も入力されるが、この情報は本実施例では利用されな
い。

【００１９】大分類用特徴抽出部１０１によって、入力
文字パターンより大分類のための特徴量が抽出される。
本実施例では、大分類用の特徴量空間をあらかじめ複数
のセルに分割しておき、セル決定部１０２において、入
力文字パターンから抽出された特徴量がどのセルに属す
るかを決定する。そして、ビット列作成部１０４は、大
分類用特徴量空間のセル総数と同じ長さでセルとビット
が１対１に対応したビット列であって、セル決定部１０
２により決定されたセルに対応するビットのみをＯＮ、
その他ビットをＯＦＦにしたビット列を生成する。この
ビット列生成の際に、ビット列作成部１０４は、セル・
ビット対応テーブル１０３を参照することにより、セル
とビット列中のビット位置との対応関係を把握する。

【００２０】より具体的に述べる。本実施例では、大分
類用特徴量として、次に述べるような線密度を反映する
簡単な特徴が用いられる。すなわち、大分類用特徴抽出
部１０１は、入力文字パターンを横及び縦方向について
走査し、各ライン上での白画素から黒画素への変化点の
数をそれぞれ横線密度Ｆｈ（ｙ）、縦線密度Ｆｖ（ｘ）
として抽出し、これらの線密度をｙ軸、ｘ軸について平
均した（Ｍｈ，Ｍｖ）を大分類用の２次元特徴量として
抽出する。図２に、漢字「木」のサンプルに対する線密
度及び大分類用２次元特徴量の例を示す。

【００２１】特徴量空間（２次元平面）は、図３に示す
ように、１６個のセルに分割される。そして、１≦ｉ≦
４，１≦ｊ≦４、また、Ｉ［０］＝０，Ｉ［１］＝１，
Ｉ［２］＝２，Ｉ［３］＝３，Ｉ［４］＝∞としたと
き、（ｉ＋４（ｊ−１））番目のセルは、区間Ｉ［ｉ−
１］≦Ｍｈ＜Ｉ［ｉ］，Ｉ［ｊ−１］≦Ｍｖ＜Ｉ［ｊ］
で表される領域とする。また、図３に示すように、ｎ番
目のセルは、１６ビット長のビット列の右からｎ番目の
ビットに対応させる。しかして、例えば入力文字パター
ンより抽出された特徴量が第８セルに属するとセル決定
部１０２で決定されると、ビット列生成部１０４により
８ビット目のみがＯＮに設定され、残りの１５ビットが
ＯＦＦに設定された１６ビット長のビット列が該入力文
字パターンに対して作成される。本実施例では、このビ
ット列がそのままビット列作成部１０４より出力され
る。

【００２２】大分類辞書作成時には、各カテゴリ別また
は各カテゴリ群別に学習パターンとして入力された複数
の文字パターンそれぞれより、同じの方法で１６ビット
長ビット列が作成される。そして、大分類辞書作成部１
０５において、それらビット列の論理和をとることによ
り、該カテゴリ又はカテゴリ群のための辞書ビット列
（１６ビット長）を作成する。この辞書ビット列、すな
わち学習パターンが少なくとも１つ属するセルに対応す
るビットをＯＮしたビット列は、カテゴリ又はカテゴリ
群の識別情報とともに大分類辞書１０６に格納される。
大分類辞書作成部１０５は、文字認識時には動作しな
い。

【００２３】以下、通常の文字認識時の処理を説明す
る。入力文字パターンに対するビット列がビット列作成
部１０４によって作成される一方、詳細識別用特徴量が
識別用特徴抽出部１０８により抽出される。論理演算部
１０７は、大分類辞書１０６に格納されている辞書ビッ
ト列の１の補数（各ビットの論理状態を反転させたビッ
ト列）をマスクとして、入力文字パターンに対しビット
列作成部１０４より出力されたビット列との論理積をと
る。このようなビット列の論理積の例を図４に示す。

【００２４】この論理積の結果ビットのすべてがＯＦＦ
であれば、当該辞書ビット列に対応したカテゴリ又はカ
テゴリ群の識別情報を識別部１１０に与え詳細識別を指
示する（図４の左側に示した辞書ビット列の場合）。論
理積結果ビットの１ビットでもＯＮであれば（図４の右
側に示した辞書ビット列の場合）、当該辞書ビット列に
対応したカテゴリ又はカテゴリ群は識別部１１０の詳細
識別の対象から外される。このような分類処理は、大分
類辞書１０６内のすべてのカテゴリ又はカテゴリ群の辞
書ビット列に関して実行される。

【００２５】このような分類の方法によれば、特徴量の
上限、下限を用いるだけでは表現しきれない、図５に示
すような特徴量分布を持つカテゴリについても十分な絞
り込みが可能である。また、デジタル演算装置の多くは
１６ビットを１ワードとし、１回のＡＮＤ演算で、２つ
の１６ビット長ビット列の論理積をとることができ、ま
た、論理積結果のすべてのビットがＯＦＦであるかどう
かもワードとして０であるか否かの１回の等号演算によ
って判定できる。したがって、（次元数）×２回の大小
比較演算を必要とした従来方法よりも高速の分類判定が
可能である。

【００２６】識別部１１０においては、上記分類処理に
よって詳細識別の対象と判定されたカテゴリ又はカテゴ
リ群に関し、あらかじめ識別辞書１０９に格納されてい
る詳細識別用特徴量と、識別用特徴抽出部１０８によっ
て入力文字パターンから抽出された特徴量とのマッチン
グが行われ、その一致度に応じた認識結果が出力され
る。詳細識別に用いる特徴量は従来と同様でよいので、
具体例は提示しない。

【００２７】なお、大分類のための特徴量、特徴量空間
のセル分割方法、セルとビット列のビットとの対応付け
の方法等は、前述したものに限定されるものではなく、
必要に応じ変更してよい。

【００２８】［実施例２］図６は、本実施例による文字
認識装置の構成を示すブロック図である。図６を参照
し、装置構成と関連させて大分類辞書作成時及び文字認
識時の処理内容を説明する。

【００２９】図示されないスキャナーにより原稿の画像
が読み取られ、デジタル画像データとして前処理部２０
０に入力される。前処理部２００において、個々の文字
画像を切り出し、それを正規化した文字パターンを大分
類用特徴抽出部１０１及び識別用特徴抽出部２０８に入
力する。大分類辞書作成時には、カテゴリ別に、あるい
は類似したカテゴリー群別に、同様の方法により複数の
文字パターンが学習パターンとして大分類用特徴抽出部
２０１に入力される。前処理部２００は文字パターンの
平均線幅も出力するが、この平均線幅の情報は本実施例
では利用されない。また、原稿読み取り用のスキャナー
の解像度も入力されるが、この情報は本実施例では利用
されない。

【００３０】大分類用特徴抽出部２０１によって、入力
文字パターンより大分類のための特徴量が抽出される。
本実施例では、量子レベル決定部２０２において、抽出
された大分類用特徴量に対し各次元毎に量子化を行い、
それぞれの成分がどの量子レベルに属するかを決定す
る。この量子化のための閾値は、全カテゴリにわたる大
分類用特徴量の分布をそれぞれの座標軸へ射影したとき
に、射影された分布関数の積算がどの量子レベル区間で
も等しくなるように、あらかじめ各次元毎に定められ
る。ビット列作成部２０４において、特徴量の各次元毎
に、量子レベル数に等しいビット長を持ち、各ビットが
量子レベルと１対１に対応したビット列であって、量子
レベル決定部２０２で決定された量子レベルに対応した
ビットのみＯＮにしたビット列を作成する。本実施例で
は、このビット列がそのままビット列作成部２０４より
出力される。

【００３１】より具体的に述べる。大分類用特徴抽出部
２０１において、前記実施例１と同じ文字パターンの２
次元の平均線密度（Ｍｈ，Ｍｖ）が大分類用特徴量とし
て抽出される（図２参照）。量子レベル決定部２０２で
は、Ｍｈ，Ｍｖそれぞれについて８レベルの量子化を行
う。この量子化のための閾値は、あらかじめ学習パター
ンよりＭｈ，Ｍｖの全カテゴリにわたる分布関数Ｐ（Ｍ
ｈ），Ｐ（Ｍｖ）を作成し、それぞれの分布関数毎に、
分布関数の積算がどの量子レベル区間でも等しくなるよ
うに定められる。図７に、Ｍｈ，Ｍｖの分布関数の例が
実線で示されており、その量子化のための閾値の例が点
線で示されている。

【００３２】量子化レベル数は８であるから、ビット列
作成部２０４により作成されるビット列は、Ｍｈに対応
した８ビット長のビット列とＭｖに対応した８ビット長
のビット列である。そして、ｎ番目の量子レベルをビッ
ト列の右からｎ番目のビットに対応させると、例えばあ
る入力文字パターンに対し、Ｍｈが第３レベル、Ｍｖが
第７レベルに属すると判定された場合、図７に示すよう
に、Ｍｈのビット列０００００１００とＭｖのビット列
０１００００００がビット作成部２０４より出力され
る。

【００３３】大分類辞書作成時には、カテゴリ別又はカ
テゴリー群別に複数の文字パターンを学習パターンとし
て入力し、それぞれの学習パターンに対するＭｈ，Ｍｖ
のビット列を作成する。そして、大分類辞書作成部２０
５において、それらのビット列の論理和をとり、大分類
辞書用の辞書ビット列として大分類辞書２０６に格納す
る。すなわち、あるカテゴリ又はカテゴリ群に関する辞
書ビット列は、該カテゴリ又はカテゴリ群のための学習
パターンが少なくとも１つ属する量子レベルに対応した
ビットのみをＯＮにしたビット列である。

【００３４】以下、通常の文字認識時の処理を説明す
る。入力文字パターンに対するビット列がビット列作成
部２０４によって作成される一方、詳細識別用特徴量が
識別用特徴抽出部２０８により抽出される。論理演算部
２０７は、大分類辞書２０６に格納されている辞書ビッ
ト列の１の補数（各ビットの論理状態を反転させたビッ
ト列）をマスクとして、入力文字パターンに対しビット
列作成部２０４より出力されたビット列との論理積をと
る。このようなビット列の論理積の例を図８に示す。

【００３５】この論理積の結果ビットのすべてがＯＦＦ
であれば、当該辞書ビット列に対応したカテゴリ又はカ
テゴリ群の識別情報を識別部２１０に与え詳細識別を指
示する（図８の左側に示した辞書ビット列の場合）。論
理積結果ビットの１ビットでもＯＮであれば（図８の右
側に示した辞書ビット列の場合）、当該辞書ビット列に
対応したカテゴリ又はカテゴリ群は識別部２１０の詳細
識別の対象から外される。このような分類処理は、大分
類辞書２０６内のすべてのカテゴリ又はカテゴリ群の辞
書ビット列に関して実行される。

【００３６】デジタル演算装置の多くは１６ビットを１
ワードとして１回のＡＮＤ演算で論理積をとることがで
き、ワードのすべてのビットがＯＦＦであるかどうかも
ワードとして０か否かの１回の等号演算によって判定で
きる。したがって、上述の大分類処理においては、２つ
の８ビット長のビット列を連結して１６ビット長とする
ことにより、２つの特徴量次元についての判定を一度に
行うことができる。

【００３７】なお、大分類のための特徴量、量子レベル
数、量子レベルとビット列のビットとの対応付けの方法
等は、前述したものに限定されるものではなく、必要に
応じ変更してよい。

【００３８】［実施例３］本実施例による文字認識装置
の構成は前記実施例２と同じであるので、装置構成に関
しては図６を参照して説明する。なお、本実施例におい
ては、通常の文字認識時に前処理部２００より出力され
る文字パターンの平均線幅Ｗが文字画像の品質の情報と
して論理演算部２０７で利用される。大分類辞書作成時
の処理内容は前記実施例２と同一であるので説明を省略
し、文字認識時の処理内容について以下説明する。

【００３９】本実施例では、文字認識時に、論理演算部
２０７において、大分類辞書２０６内の辞書ビット列を
文字画像の品質に応じて補正した補正辞書ビット列を作
成し、その１の補数をマスクとして入力文字パターンに
対して作成されたビット列と論理積をとる。より詳しく
は、辞書ビット列中のＯＮビットに加えて、その近傍の
ビットもＯＮにしたビット列を補正辞書ビット列として
分類に用いるが、そのＯＮにする近傍ビットの選択基準
として文字パターンの平均線幅Ｗを用いる。換言すれ
ば、辞書ビット列に対して、そのＯＮビットに対応する
量子レベルの近傍の量子レベルに対応するビットをＯＮ
にする補正を施し、この補正ビット列を補正辞書ビット
列として用いるが、その追加するＯＮビットに対応する
近傍量子レベルの選択基準を文字画像の品質を表す文字
パターンの平均線幅によって可変にする。

【００４０】具体例により説明する。例えば、あるカテ
ゴリに関する辞書ビット列がＭｈ：００１１１０００Ｍｖ：００００１１００であったとする。認識したい文字パターンの平均線幅Ｗ
が大きいときは、線が太いのでつぶれが生じ、きれいな
文字画像の場合よりも線密度が低く評価されている可能
性がある。そこで、上の辞書ビット列において、Ｍｈの
第３ビットをＯＮにし、つぶれの程度によっては、さら
に第２ビットもＯＮにしたビット列を補正辞書ビット列
として用いれば、元の辞書ビットを用いるよりも低密度
側をもカバーできるため、つぶれの影響を補償し、正解
カテゴリが分類から洩れるのを抑えることができる。同
様に、辞書ビット列のＭｖの第２ビット、つぶれの程度
によっては、さらに第１ビットをＯＮにしたビット列を
補正辞書ビット列として用いる。

【００４１】一方、平均線幅Ｗが小さいときは、線が細
いのでかすれが生じ、かすれた線と直交する方向の線が
存在しないように見えるため、線密度は高く評価されて
いる可能性がある。そこで、上記辞書ビット列におい
て、Ｍｈの第３ビット、第７ビットもＯＮにしたビット
列を補正辞書ビット列として用いるほうが密度の多少の
ずれをカバーでき、かすれの影響を補償し、正解カテゴ
リが分類から洩れるのを抑えることができる。同様に、
Ｍｖの第２ビット、第５ビットもＯＮにしたビット列を
補正辞書ビット列として用いる。

【００４２】平均線幅Ｗと、辞書ビット列に本来のＯＮ
ビットのほかに付加されるＯＮビット（マージンビッ
ト）の例を図９に示す。例えば、Ｗ＝５のような当該カ
テゴリのつぶれた文字パターンが入力し、この文字パタ
ーンの線密度が低く評価され、それより作成されたＭｈ
のビット列が０００００１００となった場合、このビッ
ト列と、当該カテゴリのＭｈの元の辞書ビット列の１の
補数（ビット反転）であるマスク１１０００１１１との
論理積は０００００１００となり０でない。すなわち、
当該カテゴリが分類から洩れる。これに対し、Ｍｈの補
正辞書ビット列００１１１１００の１の補正であるマス
ク１１００００１１との論理積は０になるので、当該カ
テゴリが分類から洩れることを防ぐことができる。

【００４３】［実施例４］本実施例による文字認識装置
の構成は前記実施例１と同じであるので、装置構成に関
しては図１を参照して説明する。なお、本実施例におい
ては、通常の文字認識時に前処理部１００より出力され
る文字パターンの平均線幅Ｗが文字画像の品質の情報と
して論理演算部１０７で利用される。大分類辞書作成時
の処理内容は前記実施例１と同一であるので説明を省略
し、文字認識時の処理内容について以下説明する。

【００４４】本実施例では、文字認識時に、論理演算部
１０７において、大分類辞書１０６内の辞書ビット列を
文字画像の品質に応じて補正した補正辞書ビット列を作
成し、その１の補数をマスクとして入力文字パターンに
対して作成されたビット列と論理積をとる。より詳しく
は、辞書ビット列に対して、そのＯＮビットに対応する
セルの近傍のセルに対応するビットもＯＮにする補正を
施し、この補正ビット列を補正辞書ビット列として用い
るが、この追加のＯＮビットに対応する近傍セルの選択
基準として文字パターンの平均線幅Ｗを用いる。

【００４５】具体例により説明する。例えば、あるカテ
ゴリに関する大分類用特徴量が図１０（ｂ）のハッチン
グを施された２つのセルに分布しており、したがって当
該カテゴリの辞書ビット列が０００００１００００１０
００００として与えられているとする。

【００４６】入力文字パターンの平均線幅Ｗが大きいと
きは、つぶれのため、きれいな文字パターンに比べて線
密度が低く評価される可能性がある。そこで、つぶれの
影響を補償するために、図１０（ｂ）に示した元々の分
布が属するセルの左方向（Ｍｈが減少する方向）及び下
方向（Ｍｖが減少する方向）に隣接したセルを選択し、
選択したセルに対応したビットをＯＮにする補正を辞書
ビット列に施す。すなわち、図１０（ｃ）のハッチング
が施されたセルに対応したビットをＯＮにしたビット列
が補正辞書ビット列として用いられる。つぶれの程度に
よっては、さらに左下方向（Ｍｈ，Ｍｖが同時に減少す
る方向）に隣接するセルも選択し、それに対応するビッ
トもＯＮにする（すなわち、図１０（ｄ）のハッチング
が施されたセルに対応するビットをＯＮにした補正辞書
ビット列を用いる）。

【００４７】一方、入力文字パターンの平均線幅Ｗが小
さいときは、かすれのために、きれいな文字パターンに
比べて線密度がずれる可能性がある。そこで、かすれの
影響を補償するため、元のセルに加え、その上下左右に
隣接するセルについても、辞書ビット列中の対応ビット
をＯＮにする（図１０（ａ）のハッチングを施されたセ
ルに対応するビットをＯＮにした補正辞書ビット列を用
いる）。

【００４８】以上に述べた補正辞書ビット列と平均線幅
との関係を図１１に示す。例えば、Ｗ＝５のような該カ
テゴリのつぶれ文字パターンが入力され、その大分類用
特徴量が図１０（ｃ）にＸ印で示したセルに属する場合
を考える。この入力文字パターンより作成されるビット
列は００００００００００００００１０であるので、該
カテゴリの元の辞書ビット列の１の補数であるマスク１
１１１１０１１１１０１１１１１との論理積は０となら
ない。しかし、補正辞書ビット列の１の補数であるマス
ク１１１１１００１１０００１１０１との論理積は０と
なるので、当該カテゴリが分類から洩れるのを防ぐこと
ができる。

【００４９】［実施例５］本実施例による文字認識装置
の構成は前記実施例２と同じであるので、装置構成に関
しては図６を参照して説明する。なお、本実施例におい
ては、通常の文字認識時にスキャナー解像度の情報が文
字画像の品質の情報としてビット列作成部２０４で利用
される。大分類辞書作成時の処理内容は前記実施例２と
同一であるので説明を省略し、文字認識時の処理内容に
ついて以下説明する。

【００５０】本実施例では、文字認識時に、ビット列作
成部２０４において、入力文字パターンに対して前記実
施例２と同様のビット列、すなわち量子レベル決定部２
０２により決定された量子レベルに対応したビットだけ
をＯＮにしたビット列を作成し、このビット列をスキャ
ナー解像度に応じた量だけ左へシフトした（ＯＮビット
をシフトした）補正ビット列を作成し、これを論理演算
部２０７へ入力する。論理演算部２０７による分類処理
の内容は前記実施例２と同じである。

【００５１】より詳しく説明する。一般に原稿の読み取
りに使うスキャナーの解像度が十分に高ければ、つぶれ
のないきれいな画像を得られるが、スキャナーの解像度
が低くなるにつれて、画像のつぶれる箇所が多くなって
くる。このため、低解像度で入力された文字パターンの
線密度は、きれいな文字パターンよりも低く評価されて
いると考えられる。そこで、スキャナーが低解像度の場
合は、入力文字パターンに対して作成されたビット列
を、解像度に応じた量だけ左側へ、すなわち、線密度が
高い側へシフトさせることにより、つぶれによる影響を
補償し、正解カテゴリが分類から洩れるのを抑えること
ができる。

【００５２】解像度とビットシフト量との関係を例示す
れば、解像度が４００ｄｐｉ以上のときはシフトを行わ
ず、解像度が２００ｄｐｉ以上４００ｄｐｉ未満のとき
には左に１ビットだけシフトし、解像度が２００ｄｐｉ
未満のときは左に２ビットだけシフトする。

【００５３】低解像度のスキャナーに対して適切な分類
が行われる例を示せば、あるカテゴリに関し図１２に示
すような辞書ビット列が与えられているとする。この例
において、理想的なスキャナー解像度で入力した時にＭ
ｈが０００１００００、Ｍｖが０００００１００となる
ような当該カテゴリのあるサンプルを解像度２００ｄｐ
ｉで入力した場合、つぶれのためにＭｈが００００１０
００、Ｍｖが００００００１０となったとする。この場
合、入力ビット列に対するビットシフトを行わないと、
Ｍｖに関して辞書ビット列の１の補数であるマスクとの
論理積は００００００１０となり、０にならない。しか
し、上述のように入力文字パターンのビット列を左に１
ビットだけシフトすれば、Ｍｈが０００１００００、Ｍ
ｖが０００００１００となり、これは理想的な解像度の
場合と同じビット列であるため、マスクとの論理積は０
となり、当該カテゴリが分類から洩れることはない。

【００５４】［実施例６］本実施例による文字認識装置
の構成は前記実施例１と同じであるので、装置構成に関
しては図１を参照して説明する。なお、本実施例におい
ては、通常の文字認識時にスキャナー解像度の情報が文
字画像の品質の情報としてビット列作成部１０４で利用
される。大分類辞書作成時の処理内容は前記実施例１と
同一であるので説明を省略し、文字認識時の処理内容に
ついて以下説明する。

【００５５】本実施例では、文字認識時に、ビット列作
成部１０４において入力文字パターンに対する前記実施
例１と同様のビット列、すなわちセル決定部１０２によ
り決定されたセルに対応したビットだけをＯＮにしたビ
ット列を作成し、このビット列に対して、スキャナー解
像度に応じた量だけＯＮビットを移動する補正を行い、
補正後のビット列を論理演算部１０７へ入力する。論理
演算部１０７による分類処理の内容は前記実施例１と同
じである。

【００５６】具体例によって説明する。あるカテゴリに
関する特徴量が図１３のハッチングを施した４つのセル
に分布しており、したがって該カテゴリの辞書ビット列
として、１１００１１００００００００００が与えられ
ているとする。また、理想的なスキャナー解像度で入力
したときには、特徴量が図１３のＰで示したセルに属す
るような該カテゴリのサンプル画像を考える。ここで
は、スキャナーの解像度を水平方向、垂直方向に独立に
変えることができるものとする。

【００５７】そして、（１）水平方向解像度が４００ｄｐｉ以上、かつ、垂直
方向解像度が４００ｄｐｉ以上のとき：サンプル画像よ
り作成されたビット列のＯＮビットの移動を行わない。（２）水平方向解像度が４００ｄｐｉ以上、かつ、垂直
方向解像度が４００ｄｐｉ未満のとき：垂直方向の線密
度Ｍｖが低くなると考えられるので、その影響を補正す
るため、サンプル画像より作成されたビット列中のＯＮ
ビットを、それに対応するセルの上側に隣接するセルに
対応する位置へ移動させる。（３）水平解像度が４００ｄｐｉ未満、かつ、垂直方向
解像度が４００ｄｐｉも万のとき：水平方向の線密度Ｍ
ｈ、垂直方向の線密度Ｍｖが共に低くなると考えられる
ので、サンプル画像より作成されたビット列中のＯＮビ
ットを、それに対応するセルの右上に隣接するセルに対
応した位置へ移動させる。

【００５８】図１３を参照して説明すれば、つぶれのた
めに、サンプル画像の特徴量が、上記（２）のケースで
はＸのセルに属することになっても、また上記（３）の
ケースではＹのセルに属することになっても、それぞれ
のＯＮビットの移動により、理想的な解像度の場合と同
じビット列（セルＰに対応するビットがＯＮのビット
列）０００００１００００００００００がビット列生成
部１０４より論理演算部１０７へ与えられるため、辞書
ビット列をビット反転したマスク００１１００１１１１
１１１１１１との論理積は０となり、該カテゴリが分類
から洩れるのを防ぐことができる。

【００５９】なお、前記実施例３及び４において、文字
画像の品質として、文字パターンの平均線幅の代わり
に、原稿読み取り用のスキャナーの解像度を用いてもよ
い。この場合、スキャナー解像度が低くなるにつれて段
階的に、パターンのつぶれの影響を補償する方向に、辞
書ビット列に付加するＯＮビットの増やすことにより、
前記実施例３及び４と同様に正解カテゴリを分類から洩
れにくくすることができることは以上の説明より明らか
であろう。

【００６０】また、前記実施例５及び６において、文字
画像の品質として、スキャナーの解像度の代わりに、文
字パターンの平均線幅を用いてもよい。この場合、平均
線幅が太くなるにつれて段階的に、つぶれの影響を補償
する方向に、また、平均線幅が細くなるにつれて段階的
に、かすれの影響を補償する方向に、入力文字パターン
に対して作成されたビット列のＯＮビットを移動させる
ことにより、前記実施例５及び６と同様に正解カテゴリ
を分類から洩れにくくすることができることは以上の説
明から明らかであろう。

【００６１】

【発明の効果】以上の詳細な説明から明らかなように、
請求項１乃至１０の各項記載の発明によれば、特徴量の
上限、下限の２つのパラメータだけでは表現しきれない
ような特徴量分布を持つカテゴリについても確実な大分
類が可能になる。デジタル演算装置が一般的に持つ、複
数のビットをまとめて論理演算する命令セットを生か
し、少ない論理演算により分類判定を高速に行うことが
できる。したがって、確実かつ高速な大分類処理を実現
し、文字認識処理の高精度化、高速化に寄与することが
できるという効果を得られる。

【００６２】請求項５乃至１０の各項記載の発明によれ
ば、文字画像の品質に応じて、具体的には文字パターン
の平均線幅又はスキャナー解像度に応じて、入力文字パ
ターンに対するビット列又は辞書ビット列を補正するこ
とにより、文字パターンのつぶれ又はかすれが無視でき
ない場合にも、つぶれ又はかすれの影響を補償し、より
確実な大分類を達成できるという効果を得られる。

【図面の簡単な説明】

【図１】本発明を実施する文字認識装置の構成の一例を
示すブロック図である。

【図２】文字パターンの大分類用特徴量の例を示す図で
ある。

【図３】大分類用特徴量空間のセル分割、並びにセルと
ビット列のビットとの対応の説明図である。

【図４】実施例１における入力文字パターンに対するビ
ット列と辞書ビット列との論理演算の例を示す図であ
る。

【図５】分離しかつ凹状のセルにまたがった特徴量分布
と、それに対応したビット列表現を示す図である。

【図６】本発明を実施する文字認識装置の構成の他の例
を示すブロック図である。

【図７】大分類用特徴量の量子化及びビット列の説明図
である。

【図８】実施例２における入力文字パターンに対するビ
ット列と辞書ビット列との論理演算の例を示す図であ
る。

【図９】実施例３における文字パターンの平均線幅によ
る辞書ビット列の補正の例を示す図である。

【図１０】実施例４における文字パターンの平均線幅に
よる辞書ビット列の補正の説明図である。

【図１１】実施例４における文字パターンの平均線幅に
よる辞書ビット列の補正例を示す図である。

【図１２】実施例５に関連した辞書ビット例を示す図で
ある。

【図１３】実施例６における入力文字パターンに対する
ビット列のスキャナー解像度による補正の説明図であ
る。

【符号の説明】

１００，２００前処理部１０１，２０１大分類用特徴抽出部１０２セル決定部１０３セル・ビット対応テーブル１０４，２０４ビット列作成部１０５，２０５大分類辞書作成部１０６，２０６大分類辞書１０７，２０７論理演算部１０８，２０８識別用特徴抽出部１０９，２０９識別辞書１１０，２１０識別部２０３量子レベル・ビット対応テーブル

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/00 - 9/82

Claims

(57)【特許請求の範囲】

【請求項１】入力文字パターンを大分類する大分類方
法であって、文字パターンから大分類用の複数次元の特徴量を抽出
し、該抽出された大分類用の複数次元の特徴量を表わす
大分類用特徴量空間をあらかじめ複数のセルに分割して
定義しておき、入力文字パターンから大分類用の特徴量を抽出し、該抽
出された特徴量が属するセルに対応したビットのみをＯ
Ｎにした、前記大分類用特徴量空間のセル総数に等しい
ビット長のビット列を作成し、該作成されたビット列
と、カテゴリ別又はカテゴリ群別にあらかじめ用意され
た大分類用の辞書ビット列との論理演算を行うことを特
徴とする大分類方法。
【請求項２】入力文字パターンを大分類する大分類
方法であって、入力文字パターンから大分類用の特徴量を抽出し、該抽
出された特徴量に対して各次元毎に量子化を行い、該量
子化により決定された量子レベルに対応したビットのみ
をＯＮにした、該量子化の量子レベルの数に等しいビッ
ト長のビット列を各次元毎に作成し、該作成されたビッ
ト列と、カテゴリ別又はカテゴリ群別にあらかじめ用意
された大分類用の辞書ビット列との論理演算を行うこと
を特徴とする大分類方法。
【請求項３】請求項２記載の大分類方法において、特
徴量の量子化のための閾値は、全カテゴリにわたる大分
類用の特徴量分布をそれぞれの座標軸へ射影したとき
に、射影された分布関数の積算がすべての量子レベル区
間で等しくなるように大分類用特徴量の各次元毎に定め
られることを特徴とする大分類方法。
【請求項４】請求項１又は２記載の大分類方法におい
て、大分類用の辞書ビット列は、カテゴリ別又はカテゴ
リ群別の複数の学習パターンそれぞれに対し、入力文字
パターンに対するビット列の作成方法と同じ方法で作成
されたビット列を論理和したものであることを特徴とす
る大分類方法。
【請求項５】請求項１記載の大分類方法において、辞
書ビット列に対し、そのＯＮビットに対応したセルの近
傍の、文字画像の品質に応じて選択したセルに対応する
ビットをＯＮにする補正を施し、該補正の後の辞書ビッ
ト列を入力文字パターンに対して作成されたビット列と
の論理演算に用いることを特徴とする大分類方法。
【請求項６】請求項２記載の大分類方法において、辞
書ビット列に対し、そのＯＮビットに対応した量子レベ
ルの近傍の、文字画像の品質に応じて選択した量子レベ
ルに対応するビットをＯＮにする補正を施し、該補正の
後の辞書ビット列を入力文字パターンに対して作成され
たビット列との論理演算に用いることを特徴とする大分
類方法。
【請求項７】請求項１記載の大分類方法において、入
力文字パターンに対して作成されたビット列に対し、そ
のＯＮビットを、それに対応するセルの近傍の、文字画
像の品質に応じて選択したセルに対応する位置へ移動す
る補正を施し、該補正の後のビット列を辞書ビット列と
の論理演算に用いることを特徴とする大分類方法。
【請求項８】請求項２記載の大分類方法において、入
力文字パターンに対して作成されたビット列に対し、そ
のＯＮビットを、それに対応する量子レベルの近傍の、
文字画像の品質に応じて選択した量子レベルに対応する
位置へ移動させる補正を施し、該補正の後のビット列を
辞書ビット列との論理演算に用いることを特徴とする大
分類方法。
【請求項９】請求項５、６、７又は８記載の大分類方
法において、文字画像の品質として文字パターンの平均
線幅を用い、辞書ビット列又は入力文字パターンに対し
て作成されたビット列に対する補正を平均線幅に応じて
制御することにより、平均線幅が太くなるにつれて段階
的につぶれの影響を補償し、また、平均線幅が細くなる
につれて段階的にかすれの影響を補償することを特徴と
する大分類方法。
【請求項１０】請求項５、６、７又は８記載の大分類
方法において、文字画像の品質として文字画像を入力す
るためのスキャナーの解像度を用い、入力文字パターン
に対して作成されたビット列又は辞書ビット列に対する
補正を解像度に応じて制御することにより、解像度が低
くなるにつれて段階的につぶれの影響を補償することを
特徴とする大分類方法。