JP3454626B2 - 大分類方法 - Google Patents
大分類方法Info
- Publication number
- JP3454626B2 JP3454626B2 JP00138696A JP138696A JP3454626B2 JP 3454626 B2 JP3454626 B2 JP 3454626B2 JP 00138696 A JP00138696 A JP 00138696A JP 138696 A JP138696 A JP 138696A JP 3454626 B2 JP3454626 B2 JP 3454626B2
- Authority
- JP
- Japan
- Prior art keywords
- bit string
- bit
- dictionary
- large classification
- character pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
に、文字認識において詳細識別の前に候補文字種を絞り
込むための大分類技術に関する。
ンから特徴量を抽出し、識別部において、この特徴量と
辞書に登録されている標準特徴量とのマッチングを行う
ことによって、一致の度合が最も高いカテゴリを認識結
果として出力するが、辞書に登録されている全カテゴリ
に対してマッチングを行うことは、特に漢字のような多
数のカテゴリを含む文字種の場合、非常に長い処理時間
がかかり、認識処理の高速化の妨げとなる。
ッチングに先だって、入力文字パターンの大分類処理を
行い、マッチングを行うべきカテゴリを絞り込む方法が
用いられる。大分類処理部では、その処理にかかる時間
を小さくするため、識別部で用いられる特徴量とは別の
簡素な大分類用特徴量を用いる。また、注目したカテゴ
リに対する処理を識別部へ進めるか否かを判定できれば
足りるので、詳細な一致度を求めることなく、入力文字
パターンの大分類用特徴量が注目カテゴリについて定め
られた特徴量の下限から上限までの範囲に含まれている
か否かによって判定する方法が知られており、例えば特
開平6−231309号の方法はこの考え方に基づいて
いる。
上限という2つのパラメータを用いる大分類方法におい
ては、大分類用特徴量の1つの次元について、上限と下
限の2つの大小判定プロセスが必要であるため、1つの
カテゴリについての判定に[大分類用特徴量の次元]×
2だけの比較演算を必要とし、処理にかなりの時間がか
かるという問題があった。また、特徴量の分布関数が分
離した複数の峰を持つ場合や分布領域が単連結でない場
合に、分布の空隙領域までも1つの特徴量区間に含まれ
てしまうため、カテゴリの絞り込みを十分に行い得ない
ことがあった。
分類を高速かつ確実に行う手段を提供することにある。
文字パターンから大分類用の複数次元の特徴量を抽出
し、該抽出された大分類用の複数次元の特徴量を表わす
大分類用特徴量空間をあらかじめ複数のセルに分割して
定義しておき、入力文字パターンから大分類用の特徴量
を抽出し、該抽出された特徴量が属するセルに対応した
ビットのみをONにした、セル総数に等しいビット長の
ビット列を作成し、該作成されたビット列と、カテゴリ
別又はカテゴリ群別にあらかじめ用意された大分類用の
辞書ビット列との論理演算を行うことを特徴とするもの
である。
から大分類用の特徴量を抽出し、該抽出された特徴量に
対して各次元毎に量子化を行い、該量子化により決定さ
れた量子レベルに対応したビットのみをONにした、該
量子化の量子レベルの数に等しいビット長のビット列を
各次元毎に作成し、該作成されたビット列と、カテゴリ
別又はカテゴリ群別にあらかじめ用意された大分類用の
辞書ビット列との論理演算を行うことを特徴とするもの
である。
明の大分類方法において、特徴量の量子化のための閾値
は、全カテゴリにわたる大分類用の特徴量分布をそれぞ
れの座標軸へ射影したときに、射影された分布関数の積
算がすべての量子レベル区間で等しくなるように大分類
用特徴量の各次元毎に定められることを特徴とするもの
である。
載の発明の大分類方法において、大分類用の辞書ビット
列は、カテゴリ別又はカテゴリ群別の複数の学習パター
ンそれぞれに対し、入力文字パターンに対するビット列
の作成方法と同じ方法で作成されたビット列を論理和し
たものであることを特徴とするものである。
明の大分類方法において、辞書ビット列に対し、そのO
Nビットに対応したセルの近傍の、文字画像の品質に応
じて選択したセルに対応するビットをONにする補正を
施し、該補正の後の辞書ビット列を入力文字パターンに
対して作成されたビット列との論理演算に用いることを
特徴とするものである。
明の大分類方法において、辞書ビット列に対し、そのO
Nビットに対応した量子レベルの近傍の、文字画像の品
質に応じて選択した量子レベルに対応するビットをON
にする補正を施し、該補正の後の辞書ビット列を入力文
字パターンに対して作成されたビット列との論理演算に
用いることを特徴とするものである。
明の大分類方法において、入力文字パターンに対して作
成されたビット列に対し、そのONビットを、それに対
応するセルの近傍の、文字画像の品質に応じて選択した
セルに対応する位置へ移動する補正を施し、該補正の後
のビット列を辞書ビット列との論理演算に用いることを
特徴とするものである。
明の大分類方法において、入力文字パターンに対して作
成されたビット列に対し、そのONビットを、それに対
応する量子レベルの近傍の、文字画像の品質に応じて選
択した量子レベルに対応する位置へ移動させる補正を施
し、該補正の後のビット列を辞書ビット列との論理演算
に用いることを特徴とするものである。
又は8記載の発明の大分類方法において、文字画像の品
質として文字パターンの平均線幅を用い、辞書ビット列
又は入力文字パターンに対して作成されたビット列に対
する補正を平均線幅に応じて制御することにより、平均
線幅が太くなるにつれて段階的につぶれの影響を補償
し、また、平均線幅が細くなるにつれて段階的にかすれ
の影響を補償することを特徴とするものである。
7又は8記載の発明の大分類方法において、文字画像の
品質として文字画像を入力するためのスキャナーの解像
度を用い、入力文字パターンに対して作成されたビット
列又は辞書ビット列に対する補正を解像度に応じて制御
することにより、解像度が低くなるにつれて段階的につ
ぶれの影響を補償することを特徴とするものである。
るため、図面を用い、本発明の幾つかの実施例について
説明する。
認識装置の構成を示すブロック図である。図1を参照
し、装置構成と関連させて大分類辞書作成時及び文字認
識時の処理内容を説明する。
が読み取られ、デジタル画像データとして前処理部10
0に入力される。前処理部100において、原稿画像中
の個々の文字画像が切り出され、各文字画像を正規化し
た文字パターンが大分類用特徴抽出部101及び識別用
特徴抽出部108に入力される。ただし、識別用特徴抽
出部108が動作するのは文字認識時のみである。大分
類辞書作成時には、カテゴリ別に、あるいは類似したカ
テゴリー群別に、同様の方法により複数の文字パターン
が学習パターンとして大分類用特徴抽出部101に入力
される。前処理部100は文字パターンの平均線幅も出
力する。ただし、この平均線幅の情報は本実施例では利
用されない。また、原稿読み取り用のスキャナーの解像
度も入力されるが、この情報は本実施例では利用されな
い。
文字パターンより大分類のための特徴量が抽出される。
本実施例では、大分類用の特徴量空間をあらかじめ複数
のセルに分割しておき、セル決定部102において、入
力文字パターンから抽出された特徴量がどのセルに属す
るかを決定する。そして、ビット列作成部104は、大
分類用特徴量空間のセル総数と同じ長さでセルとビット
が1対1に対応したビット列であって、セル決定部10
2により決定されたセルに対応するビットのみをON、
その他ビットをOFFにしたビット列を生成する。この
ビット列生成の際に、ビット列作成部104は、セル・
ビット対応テーブル103を参照することにより、セル
とビット列中のビット位置との対応関係を把握する。
類用特徴量として、次に述べるような線密度を反映する
簡単な特徴が用いられる。すなわち、大分類用特徴抽出
部101は、入力文字パターンを横及び縦方向について
走査し、各ライン上での白画素から黒画素への変化点の
数をそれぞれ横線密度Fh(y)、縦線密度Fv(x)
として抽出し、これらの線密度をy軸、x軸について平
均した(Mh,Mv)を大分類用の2次元特徴量として
抽出する。図2に、漢字「木」のサンプルに対する線密
度及び大分類用2次元特徴量の例を示す。
ように、16個のセルに分割される。そして、1≦i≦
4,1≦j≦4、また、I[0]=0,I[1]=1,
I[2]=2,I[3]=3,I[4]=∞としたと
き、(i+4(j−1))番目のセルは、区間I[i−
1]≦Mh<I[i],I[j−1]≦Mv<I[j]
で表される領域とする。また、図3に示すように、n番
目のセルは、16ビット長のビット列の右からn番目の
ビットに対応させる。しかして、例えば入力文字パター
ンより抽出された特徴量が第8セルに属するとセル決定
部102で決定されると、ビット列生成部104により
8ビット目のみがONに設定され、残りの15ビットが
OFFに設定された16ビット長のビット列が該入力文
字パターンに対して作成される。本実施例では、このビ
ット列がそのままビット列作成部104より出力され
る。
は各カテゴリ群別に学習パターンとして入力された複数
の文字パターンそれぞれより、同じの方法で16ビット
長ビット列が作成される。そして、大分類辞書作成部1
05において、それらビット列の論理和をとることによ
り、該カテゴリ又はカテゴリ群のための辞書ビット列
(16ビット長)を作成する。この辞書ビット列、すな
わち学習パターンが少なくとも1つ属するセルに対応す
るビットをONしたビット列は、カテゴリ又はカテゴリ
群の識別情報とともに大分類辞書106に格納される。
大分類辞書作成部105は、文字認識時には動作しな
い。
る。入力文字パターンに対するビット列がビット列作成
部104によって作成される一方、詳細識別用特徴量が
識別用特徴抽出部108により抽出される。論理演算部
107は、大分類辞書106に格納されている辞書ビッ
ト列の1の補数(各ビットの論理状態を反転させたビッ
ト列)をマスクとして、入力文字パターンに対しビット
列作成部104より出力されたビット列との論理積をと
る。このようなビット列の論理積の例を図4に示す。
であれば、当該辞書ビット列に対応したカテゴリ又はカ
テゴリ群の識別情報を識別部110に与え詳細識別を指
示する(図4の左側に示した辞書ビット列の場合)。論
理積結果ビットの1ビットでもONであれば(図4の右
側に示した辞書ビット列の場合)、当該辞書ビット列に
対応したカテゴリ又はカテゴリ群は識別部110の詳細
識別の対象から外される。このような分類処理は、大分
類辞書106内のすべてのカテゴリ又はカテゴリ群の辞
書ビット列に関して実行される。
上限、下限を用いるだけでは表現しきれない、図5に示
すような特徴量分布を持つカテゴリについても十分な絞
り込みが可能である。また、デジタル演算装置の多くは
16ビットを1ワードとし、1回のAND演算で、2つ
の16ビット長ビット列の論理積をとることができ、ま
た、論理積結果のすべてのビットがOFFであるかどう
かもワードとして0であるか否かの1回の等号演算によ
って判定できる。したがって、(次元数)×2回の大小
比較演算を必要とした従来方法よりも高速の分類判定が
可能である。
よって詳細識別の対象と判定されたカテゴリ又はカテゴ
リ群に関し、あらかじめ識別辞書109に格納されてい
る詳細識別用特徴量と、識別用特徴抽出部108によっ
て入力文字パターンから抽出された特徴量とのマッチン
グが行われ、その一致度に応じた認識結果が出力され
る。詳細識別に用いる特徴量は従来と同様でよいので、
具体例は提示しない。
のセル分割方法、セルとビット列のビットとの対応付け
の方法等は、前述したものに限定されるものではなく、
必要に応じ変更してよい。
認識装置の構成を示すブロック図である。図6を参照
し、装置構成と関連させて大分類辞書作成時及び文字認
識時の処理内容を説明する。
が読み取られ、デジタル画像データとして前処理部20
0に入力される。前処理部200において、個々の文字
画像を切り出し、それを正規化した文字パターンを大分
類用特徴抽出部101及び識別用特徴抽出部208に入
力する。大分類辞書作成時には、カテゴリ別に、あるい
は類似したカテゴリー群別に、同様の方法により複数の
文字パターンが学習パターンとして大分類用特徴抽出部
201に入力される。前処理部200は文字パターンの
平均線幅も出力するが、この平均線幅の情報は本実施例
では利用されない。また、原稿読み取り用のスキャナー
の解像度も入力されるが、この情報は本実施例では利用
されない。
文字パターンより大分類のための特徴量が抽出される。
本実施例では、量子レベル決定部202において、抽出
された大分類用特徴量に対し各次元毎に量子化を行い、
それぞれの成分がどの量子レベルに属するかを決定す
る。この量子化のための閾値は、全カテゴリにわたる大
分類用特徴量の分布をそれぞれの座標軸へ射影したとき
に、射影された分布関数の積算がどの量子レベル区間で
も等しくなるように、あらかじめ各次元毎に定められ
る。ビット列作成部204において、特徴量の各次元毎
に、量子レベル数に等しいビット長を持ち、各ビットが
量子レベルと1対1に対応したビット列であって、量子
レベル決定部202で決定された量子レベルに対応した
ビットのみONにしたビット列を作成する。本実施例で
は、このビット列がそのままビット列作成部204より
出力される。
201において、前記実施例1と同じ文字パターンの2
次元の平均線密度(Mh,Mv)が大分類用特徴量とし
て抽出される(図2参照)。量子レベル決定部202で
は、Mh,Mvそれぞれについて8レベルの量子化を行
う。この量子化のための閾値は、あらかじめ学習パター
ンよりMh,Mvの全カテゴリにわたる分布関数P(M
h),P(Mv)を作成し、それぞれの分布関数毎に、
分布関数の積算がどの量子レベル区間でも等しくなるよ
うに定められる。図7に、Mh,Mvの分布関数の例が
実線で示されており、その量子化のための閾値の例が点
線で示されている。
作成部204により作成されるビット列は、Mhに対応
した8ビット長のビット列とMvに対応した8ビット長
のビット列である。そして、n番目の量子レベルをビッ
ト列の右からn番目のビットに対応させると、例えばあ
る入力文字パターンに対し、Mhが第3レベル、Mvが
第7レベルに属すると判定された場合、図7に示すよう
に、Mhのビット列00000100とMvのビット列
01000000がビット作成部204より出力され
る。
テゴリー群別に複数の文字パターンを学習パターンとし
て入力し、それぞれの学習パターンに対するMh,Mv
のビット列を作成する。そして、大分類辞書作成部20
5において、それらのビット列の論理和をとり、大分類
辞書用の辞書ビット列として大分類辞書206に格納す
る。すなわち、あるカテゴリ又はカテゴリ群に関する辞
書ビット列は、該カテゴリ又はカテゴリ群のための学習
パターンが少なくとも1つ属する量子レベルに対応した
ビットのみをONにしたビット列である。
る。入力文字パターンに対するビット列がビット列作成
部204によって作成される一方、詳細識別用特徴量が
識別用特徴抽出部208により抽出される。論理演算部
207は、大分類辞書206に格納されている辞書ビッ
ト列の1の補数(各ビットの論理状態を反転させたビッ
ト列)をマスクとして、入力文字パターンに対しビット
列作成部204より出力されたビット列との論理積をと
る。このようなビット列の論理積の例を図8に示す。
であれば、当該辞書ビット列に対応したカテゴリ又はカ
テゴリ群の識別情報を識別部210に与え詳細識別を指
示する(図8の左側に示した辞書ビット列の場合)。論
理積結果ビットの1ビットでもONであれば(図8の右
側に示した辞書ビット列の場合)、当該辞書ビット列に
対応したカテゴリ又はカテゴリ群は識別部210の詳細
識別の対象から外される。このような分類処理は、大分
類辞書206内のすべてのカテゴリ又はカテゴリ群の辞
書ビット列に関して実行される。
ワードとして1回のAND演算で論理積をとることがで
き、ワードのすべてのビットがOFFであるかどうかも
ワードとして0か否かの1回の等号演算によって判定で
きる。したがって、上述の大分類処理においては、2つ
の8ビット長のビット列を連結して16ビット長とする
ことにより、2つの特徴量次元についての判定を一度に
行うことができる。
数、量子レベルとビット列のビットとの対応付けの方法
等は、前述したものに限定されるものではなく、必要に
応じ変更してよい。
の構成は前記実施例2と同じであるので、装置構成に関
しては図6を参照して説明する。なお、本実施例におい
ては、通常の文字認識時に前処理部200より出力され
る文字パターンの平均線幅Wが文字画像の品質の情報と
して論理演算部207で利用される。大分類辞書作成時
の処理内容は前記実施例2と同一であるので説明を省略
し、文字認識時の処理内容について以下説明する。
207において、大分類辞書206内の辞書ビット列を
文字画像の品質に応じて補正した補正辞書ビット列を作
成し、その1の補数をマスクとして入力文字パターンに
対して作成されたビット列と論理積をとる。より詳しく
は、辞書ビット列中のONビットに加えて、その近傍の
ビットもONにしたビット列を補正辞書ビット列として
分類に用いるが、そのONにする近傍ビットの選択基準
として文字パターンの平均線幅Wを用いる。換言すれ
ば、辞書ビット列に対して、そのONビットに対応する
量子レベルの近傍の量子レベルに対応するビットをON
にする補正を施し、この補正ビット列を補正辞書ビット
列として用いるが、その追加するONビットに対応する
近傍量子レベルの選択基準を文字画像の品質を表す文字
パターンの平均線幅によって可変にする。
ゴリに関する辞書ビット列が Mh:00111000 Mv:00001100 であったとする。認識したい文字パターンの平均線幅W
が大きいときは、線が太いのでつぶれが生じ、きれいな
文字画像の場合よりも線密度が低く評価されている可能
性がある。そこで、上の辞書ビット列において、Mhの
第3ビットをONにし、つぶれの程度によっては、さら
に第2ビットもONにしたビット列を補正辞書ビット列
として用いれば、元の辞書ビットを用いるよりも低密度
側をもカバーできるため、つぶれの影響を補償し、正解
カテゴリが分類から洩れるのを抑えることができる。同
様に、辞書ビット列のMvの第2ビット、つぶれの程度
によっては、さらに第1ビットをONにしたビット列を
補正辞書ビット列として用いる。
いのでかすれが生じ、かすれた線と直交する方向の線が
存在しないように見えるため、線密度は高く評価されて
いる可能性がある。そこで、上記辞書ビット列におい
て、Mhの第3ビット、第7ビットもONにしたビット
列を補正辞書ビット列として用いるほうが密度の多少の
ずれをカバーでき、かすれの影響を補償し、正解カテゴ
リが分類から洩れるのを抑えることができる。同様に、
Mvの第2ビット、第5ビットもONにしたビット列を
補正辞書ビット列として用いる。
ビットのほかに付加されるONビット(マージンビッ
ト)の例を図9に示す。例えば、W=5のような当該カ
テゴリのつぶれた文字パターンが入力し、この文字パタ
ーンの線密度が低く評価され、それより作成されたMh
のビット列が00000100となった場合、このビッ
ト列と、当該カテゴリのMhの元の辞書ビット列の1の
補数(ビット反転)であるマスク11000111との
論理積は00000100となり0でない。すなわち、
当該カテゴリが分類から洩れる。これに対し、Mhの補
正辞書ビット列00111100の1の補正であるマス
ク11000011との論理積は0になるので、当該カ
テゴリが分類から洩れることを防ぐことができる。
の構成は前記実施例1と同じであるので、装置構成に関
しては図1を参照して説明する。なお、本実施例におい
ては、通常の文字認識時に前処理部100より出力され
る文字パターンの平均線幅Wが文字画像の品質の情報と
して論理演算部107で利用される。大分類辞書作成時
の処理内容は前記実施例1と同一であるので説明を省略
し、文字認識時の処理内容について以下説明する。
107において、大分類辞書106内の辞書ビット列を
文字画像の品質に応じて補正した補正辞書ビット列を作
成し、その1の補数をマスクとして入力文字パターンに
対して作成されたビット列と論理積をとる。より詳しく
は、辞書ビット列に対して、そのONビットに対応する
セルの近傍のセルに対応するビットもONにする補正を
施し、この補正ビット列を補正辞書ビット列として用い
るが、この追加のONビットに対応する近傍セルの選択
基準として文字パターンの平均線幅Wを用いる。
ゴリに関する大分類用特徴量が図10(b)のハッチン
グを施された2つのセルに分布しており、したがって当
該カテゴリの辞書ビット列が000001000010
0000として与えられているとする。
きは、つぶれのため、きれいな文字パターンに比べて線
密度が低く評価される可能性がある。そこで、つぶれの
影響を補償するために、図10(b)に示した元々の分
布が属するセルの左方向(Mhが減少する方向)及び下
方向(Mvが減少する方向)に隣接したセルを選択し、
選択したセルに対応したビットをONにする補正を辞書
ビット列に施す。すなわち、図10(c)のハッチング
が施されたセルに対応したビットをONにしたビット列
が補正辞書ビット列として用いられる。つぶれの程度に
よっては、さらに左下方向(Mh,Mvが同時に減少す
る方向)に隣接するセルも選択し、それに対応するビッ
トもONにする(すなわち、図10(d)のハッチング
が施されたセルに対応するビットをONにした補正辞書
ビット列を用いる)。
さいときは、かすれのために、きれいな文字パターンに
比べて線密度がずれる可能性がある。そこで、かすれの
影響を補償するため、元のセルに加え、その上下左右に
隣接するセルについても、辞書ビット列中の対応ビット
をONにする(図10(a)のハッチングを施されたセ
ルに対応するビットをONにした補正辞書ビット列を用
いる)。
との関係を図11に示す。例えば、W=5のような該カ
テゴリのつぶれ文字パターンが入力され、その大分類用
特徴量が図10(c)にX印で示したセルに属する場合
を考える。この入力文字パターンより作成されるビット
列は0000000000000010であるので、該
カテゴリの元の辞書ビット列の1の補数であるマスク1
111101111011111との論理積は0となら
ない。しかし、補正辞書ビット列の1の補数であるマス
ク1111100110001101との論理積は0と
なるので、当該カテゴリが分類から洩れるのを防ぐこと
ができる。
の構成は前記実施例2と同じであるので、装置構成に関
しては図6を参照して説明する。なお、本実施例におい
ては、通常の文字認識時にスキャナー解像度の情報が文
字画像の品質の情報としてビット列作成部204で利用
される。大分類辞書作成時の処理内容は前記実施例2と
同一であるので説明を省略し、文字認識時の処理内容に
ついて以下説明する。
成部204において、入力文字パターンに対して前記実
施例2と同様のビット列、すなわち量子レベル決定部2
02により決定された量子レベルに対応したビットだけ
をONにしたビット列を作成し、このビット列をスキャ
ナー解像度に応じた量だけ左へシフトした(ONビット
をシフトした)補正ビット列を作成し、これを論理演算
部207へ入力する。論理演算部207による分類処理
の内容は前記実施例2と同じである。
りに使うスキャナーの解像度が十分に高ければ、つぶれ
のないきれいな画像を得られるが、スキャナーの解像度
が低くなるにつれて、画像のつぶれる箇所が多くなって
くる。このため、低解像度で入力された文字パターンの
線密度は、きれいな文字パターンよりも低く評価されて
いると考えられる。そこで、スキャナーが低解像度の場
合は、入力文字パターンに対して作成されたビット列
を、解像度に応じた量だけ左側へ、すなわち、線密度が
高い側へシフトさせることにより、つぶれによる影響を
補償し、正解カテゴリが分類から洩れるのを抑えること
ができる。
れば、解像度が400dpi以上のときはシフトを行わ
ず、解像度が200dpi以上400dpi未満のとき
には左に1ビットだけシフトし、解像度が200dpi
未満のときは左に2ビットだけシフトする。
が行われる例を示せば、あるカテゴリに関し図12に示
すような辞書ビット列が与えられているとする。この例
において、理想的なスキャナー解像度で入力した時にM
hが00010000、Mvが00000100となる
ような当該カテゴリのあるサンプルを解像度200dp
iで入力した場合、つぶれのためにMhが000010
00、Mvが00000010となったとする。この場
合、入力ビット列に対するビットシフトを行わないと、
Mvに関して辞書ビット列の1の補数であるマスクとの
論理積は00000010となり、0にならない。しか
し、上述のように入力文字パターンのビット列を左に1
ビットだけシフトすれば、Mhが00010000、M
vが00000100となり、これは理想的な解像度の
場合と同じビット列であるため、マスクとの論理積は0
となり、当該カテゴリが分類から洩れることはない。
の構成は前記実施例1と同じであるので、装置構成に関
しては図1を参照して説明する。なお、本実施例におい
ては、通常の文字認識時にスキャナー解像度の情報が文
字画像の品質の情報としてビット列作成部104で利用
される。大分類辞書作成時の処理内容は前記実施例1と
同一であるので説明を省略し、文字認識時の処理内容に
ついて以下説明する。
成部104において入力文字パターンに対する前記実施
例1と同様のビット列、すなわちセル決定部102によ
り決定されたセルに対応したビットだけをONにしたビ
ット列を作成し、このビット列に対して、スキャナー解
像度に応じた量だけONビットを移動する補正を行い、
補正後のビット列を論理演算部107へ入力する。論理
演算部107による分類処理の内容は前記実施例1と同
じである。
関する特徴量が図13のハッチングを施した4つのセル
に分布しており、したがって該カテゴリの辞書ビット列
として、1100110000000000が与えられ
ているとする。また、理想的なスキャナー解像度で入力
したときには、特徴量が図13のPで示したセルに属す
るような該カテゴリのサンプル画像を考える。ここで
は、スキャナーの解像度を水平方向、垂直方向に独立に
変えることができるものとする。
方向解像度が400dpi以上のとき:サンプル画像よ
り作成されたビット列のONビットの移動を行わない。 (2)水平方向解像度が400dpi以上、かつ、垂直
方向解像度が400dpi未満のとき:垂直方向の線密
度Mvが低くなると考えられるので、その影響を補正す
るため、サンプル画像より作成されたビット列中のON
ビットを、それに対応するセルの上側に隣接するセルに
対応する位置へ移動させる。 (3)水平解像度が400dpi未満、かつ、垂直方向
解像度が400dpiも万のとき:水平方向の線密度M
h、垂直方向の線密度Mvが共に低くなると考えられる
ので、サンプル画像より作成されたビット列中のONビ
ットを、それに対応するセルの右上に隣接するセルに対
応した位置へ移動させる。
めに、サンプル画像の特徴量が、上記(2)のケースで
はXのセルに属することになっても、また上記(3)の
ケースではYのセルに属することになっても、それぞれ
のONビットの移動により、理想的な解像度の場合と同
じビット列(セルPに対応するビットがONのビット
列)0000010000000000がビット列生成
部104より論理演算部107へ与えられるため、辞書
ビット列をビット反転したマスク0011001111
111111との論理積は0となり、該カテゴリが分類
から洩れるのを防ぐことができる。
画像の品質として、文字パターンの平均線幅の代わり
に、原稿読み取り用のスキャナーの解像度を用いてもよ
い。この場合、スキャナー解像度が低くなるにつれて段
階的に、パターンのつぶれの影響を補償する方向に、辞
書ビット列に付加するONビットの増やすことにより、
前記実施例3及び4と同様に正解カテゴリを分類から洩
れにくくすることができることは以上の説明より明らか
であろう。
画像の品質として、スキャナーの解像度の代わりに、文
字パターンの平均線幅を用いてもよい。この場合、平均
線幅が太くなるにつれて段階的に、つぶれの影響を補償
する方向に、また、平均線幅が細くなるにつれて段階的
に、かすれの影響を補償する方向に、入力文字パターン
に対して作成されたビット列のONビットを移動させる
ことにより、前記実施例5及び6と同様に正解カテゴリ
を分類から洩れにくくすることができることは以上の説
明から明らかであろう。
請求項1乃至10の各項記載の発明によれば、特徴量の
上限、下限の2つのパラメータだけでは表現しきれない
ような特徴量分布を持つカテゴリについても確実な大分
類が可能になる。デジタル演算装置が一般的に持つ、複
数のビットをまとめて論理演算する命令セットを生か
し、少ない論理演算により分類判定を高速に行うことが
できる。したがって、確実かつ高速な大分類処理を実現
し、文字認識処理の高精度化、高速化に寄与することが
できるという効果を得られる。
ば、文字画像の品質に応じて、具体的には文字パターン
の平均線幅又はスキャナー解像度に応じて、入力文字パ
ターンに対するビット列又は辞書ビット列を補正するこ
とにより、文字パターンのつぶれ又はかすれが無視でき
ない場合にも、つぶれ又はかすれの影響を補償し、より
確実な大分類を達成できるという効果を得られる。
示すブロック図である。
ある。
ビット列のビットとの対応の説明図である。
ット列と辞書ビット列との論理演算の例を示す図であ
る。
と、それに対応したビット列表現を示す図である。
を示すブロック図である。
である。
ット列と辞書ビット列との論理演算の例を示す図であ
る。
る辞書ビット列の補正の例を示す図である。
よる辞書ビット列の補正の説明図である。
よる辞書ビット列の補正例を示す図である。
ある。
ビット列のスキャナー解像度による補正の説明図であ
る。
Claims (10)
- 【請求項1】 入力文字パターンを大分類する大分類方
法であって、 文字パターンから大分類用の複数次元の特徴量を抽出
し、該抽出された大分類用の複数次元の特徴量を表わす
大分類用特徴量空間をあらかじめ複数のセルに分割して
定義しておき、 入力文字パターンから大分類用の特徴量を抽出し、該抽
出された特徴量が属するセルに対応したビットのみをO
Nにした、前記大分類用特徴量空間のセル総数に等しい
ビット長のビット列を作成し、該作成されたビット列
と、カテゴリ別又はカテゴリ群別にあらかじめ用意され
た大分類用の辞書ビット列との論理演算を行うことを特
徴とする大分類方法。 - 【請求項2】 入力文字パターンを大分類する大分類
方法であって、 入力文字パターンから大分類用の特徴量を抽出し、該抽
出された特徴量に対して各次元毎に量子化を行い、該量
子化により決定された量子レベルに対応したビットのみ
をONにした、該量子化の量子レベルの数に等しいビッ
ト長のビット列を各次元毎に作成し、該作成されたビッ
ト列と、カテゴリ別又はカテゴリ群別にあらかじめ用意
された大分類用の辞書ビット列との論理演算を行うこと
を特徴とする大分類方法。 - 【請求項3】 請求項2記載の大分類方法において、特
徴量の量子化のための閾値は、全カテゴリにわたる大分
類用の特徴量分布をそれぞれの座標軸へ射影したとき
に、射影された分布関数の積算がすべての量子レベル区
間で等しくなるように大分類用特徴量の各次元毎に定め
られることを特徴とする大分類方法。 - 【請求項4】 請求項1又は2記載の大分類方法におい
て、大分類用の辞書ビット列は、カテゴリ別又はカテゴ
リ群別の複数の学習パターンそれぞれに対し、入力文字
パターンに対するビット列の作成方法と同じ方法で作成
されたビット列を論理和したものであることを特徴とす
る大分類方法。 - 【請求項5】 請求項1記載の大分類方法において、辞
書ビット列に対し、そのONビットに対応したセルの近
傍の、文字画像の品質に応じて選択したセルに対応する
ビットをONにする補正を施し、該補正の後の辞書ビッ
ト列を入力文字パターンに対して作成されたビット列と
の論理演算に用いることを特徴とする大分類方法。 - 【請求項6】 請求項2記載の大分類方法において、辞
書ビット列に対し、そのONビットに対応した量子レベ
ルの近傍の、文字画像の品質に応じて選択した量子レベ
ルに対応するビットをONにする補正を施し、該補正の
後の辞書ビット列を入力文字パターンに対して作成され
たビット列との論理演算に用いることを特徴とする大分
類方法。 - 【請求項7】 請求項1記載の大分類方法において、入
力文字パターンに対して作成されたビット列に対し、そ
のONビットを、それに対応するセルの近傍の、文字画
像の品質に応じて選択したセルに対応する位置へ移動す
る補正を施し、該補正の後のビット列を辞書ビット列と
の論理演算に用いることを特徴とする大分類方法。 - 【請求項8】 請求項2記載の大分類方法において、入
力文字パターンに対して作成されたビット列に対し、そ
のONビットを、それに対応する量子レベルの近傍の、
文字画像の品質に応じて選択した量子レベルに対応する
位置へ移動させる補正を施し、該補正の後のビット列を
辞書ビット列との論理演算に用いることを特徴とする大
分類方法。 - 【請求項9】 請求項5、6、7又は8記載の大分類方
法において、文字画像の品質として文字パターンの平均
線幅を用い、辞書ビット列又は入力文字パターンに対し
て作成されたビット列に対する補正を平均線幅に応じて
制御することにより、平均線幅が太くなるにつれて段階
的につぶれの影響を補償し、また、平均線幅が細くなる
につれて段階的にかすれの影響を補償することを特徴と
する大分類方法。 - 【請求項10】 請求項5、6、7又は8記載の大分類
方法において、文字画像の品質として文字画像を入力す
るためのスキャナーの解像度を用い、入力文字パターン
に対して作成されたビット列又は辞書ビット列に対する
補正を解像度に応じて制御することにより、解像度が低
くなるにつれて段階的につぶれの影響を補償することを
特徴とする大分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00138696A JP3454626B2 (ja) | 1996-01-09 | 1996-01-09 | 大分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00138696A JP3454626B2 (ja) | 1996-01-09 | 1996-01-09 | 大分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09190503A JPH09190503A (ja) | 1997-07-22 |
JP3454626B2 true JP3454626B2 (ja) | 2003-10-06 |
Family
ID=11500054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00138696A Expired - Fee Related JP3454626B2 (ja) | 1996-01-09 | 1996-01-09 | 大分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3454626B2 (ja) |
-
1996
- 1996-01-09 JP JP00138696A patent/JP3454626B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09190503A (ja) | 1997-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1999688B1 (en) | Converting digital images containing text to token-based files for rendering | |
US5111514A (en) | Apparatus for converting handwritten characters onto finely shaped characters of common size and pitch, aligned in an inferred direction | |
US5625707A (en) | Training a neural network using centroid dithering by randomly displacing a template | |
EP0431958B1 (en) | Identification and segmentation of finely textured and solid regions of binary images | |
US6782142B2 (en) | Method and apparatus for using rotatable templates within look-up tables to enhance image reproduction | |
US6327384B1 (en) | Character recognition apparatus and method for recognizing characters | |
JPH03260787A (ja) | テキスト又は線図形を識別する方法及びデジタル処理システム | |
JPH0750751A (ja) | 画像情報の処理及び再生装置 | |
CN110180186A (zh) | 一种地形图转换方法及系统 | |
EP0343786A2 (en) | Method and apparatus for reading and recording text in digital form | |
JP4077919B2 (ja) | 画像処理方法及び装置及びその記憶媒体 | |
CA2192023C (en) | Separation of touching characters in optical character recognition | |
JP3454626B2 (ja) | 大分類方法 | |
US7508986B2 (en) | Document recognition device, document recognition method and program, and storage medium | |
JP2700131B2 (ja) | パターン認識方法 | |
JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
Jeng | Optical Chinese character recognition using accumulated stroke features | |
Kurdy et al. | Omnifont Arabic optical character recognition system | |
Okada et al. | A morphological subtraction scheme for form analysis | |
JP3019287B2 (ja) | 画像領域分割方法 | |
CA2201557A1 (en) | Degraded character image restoration | |
JP2613211B2 (ja) | 画像入力装置 | |
JPH05282489A (ja) | 文章画像の属性判別方法 | |
JPH05128306A (ja) | 文章画像の属性判別方法 | |
JP3463255B2 (ja) | 多値画像パターンの認識処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070725 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080725 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100725 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |