JPH0481988A

JPH0481988A - クラスタリング方式

Info

Publication number: JPH0481988A
Application number: JP2196749A
Authority: JP
Inventors: Hideaki Tanaka; 秀明田中
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1990-07-24
Filing date: 1990-07-24
Publication date: 1992-03-16
Also published as: US5187751A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】【産業上の利用分野】

本発明は、光学的文字読み取り装置（以下、ＯＣＲと称
する）において文字データを所定個数のフォントクラス
に分類するクラスタリング方式に関する。

【従来の技術】

一般に、ＯＣＲにおけるクラスタリングには、多変量解
析でのクラスタ分析の各手法やＫ　−ｍｅａｎｓ法が用
いられており、クラスの個数と各クラスの代表ベクトル
を初期値として入力するものと、自動的に代表ベクトル
やクラスの個数が求まるものの２種類に大別できる。これらの手法のうち、従来から多く用いられているのは
初期値を与えるＫ　−ｍｅａｎｓ法であり、この手法は
、文字データの特徴ベクトル群を初期値として与えられ
た各代表ベクトルとの距離計算で最も近い代表ベクトル
のクラスへの分類した後、各クラスごとに平均ベクトル
を求め、この平均ベクトルを新たな代表ベクトルとする
。そして、この新たな代表ベクトルとの距離計算による
クラス分類を再び行ない、クラス間での特徴ベクトルの
入れ換えがなくなるまで、つまり収束するまで新代表ベ
クトルの算出とクラスの再分類を繰り返すものである。

【発明が解決しようとする課題】

ところが、上記従来のＫ　−ｍｅａｎｓ法は、代表ベク
トルとの距離計算により分類された各クラスごとにその
クラスに属する特徴ベクトルの単なる平均ベクトルを求
め、これをそのクラスの新たな代表ベクトルとしている
ため、そのクラスにたまたまイレギュラなベクトルが入
ってしまった場合、次の代表ベクトルである平均ベクト
ルにずれが生じ、その結果次のクラス分類でさらに他の
イレギユラベクトルを拾って、収束後にはそのクラスに
最初の代表ベクトル（初期値）が存在しなくなるという
不具合が生じる。フォント数が膨大（１０００以上）な英数字や、各個人
が１フオントに対応する手書文字は、フォント数が明朝
、ゴシック、教科書体、＃書体と少ない日本語のような
フォント名によるクラスタリング処理が難しい。しかし
、これらの文字でも、活字英数字であれば、一般書物に
見られる普通の文字を代表として１クラス、ボールド体
の如き構成線分が太い文字を代表として１クラスという
ように、また手會文字であれば、例えば左に傾いた°Ｉ
゛を代表として１クラス、右に傾いた°夏°を代表とし
て１クラスというように、人間がクラスの個数および各
クラスの代表ベクトルを直感的に決定することは簡単に
できる。しかるに、このように直感的に決定したクラス個数と代
表ベクトルの初期値を用いても、上記従来のに一−ｅａ
ｎｓ法による限り、収束後のクラスにそのクラスの代表
ベクトルの上記初期値が存在しなくなるという不具合が
生じるのであって、初期値を決めた人間に従来法の欠点
を感じさせるうえ、収束後に求まった各クラスの代表ベ
クトルを標準フォントとして辞書に登録し、この標準フ
ォントに基づいて文字データを認識処理しても認識率が
向上しない。そこで、本発明の目的は、新たな代表ベクトルの生成手
法を改善することにより、イレギュラなベクトルによる
代表ベクトルの変動を押さえて、収束後のクラスに最初
の代表ベクトルを存在せしめ、求まった代表ベクトルに
基づいて高い認識率で文字データの認識処理を行なうこ
とができるクラスタリング方式を提供することにある。

【課題を解決するための手段】

上記目的を達成するため、本発明のクラスタリング方式
は、光学的文字読み取り装置における辞書作成時に、文
字データを所定個数のフォントクラスに分類するもので
あって、分類すべき文字データの特徴ベクトル群を記憶
する第１記憶手段と、予め与えられるクラスの個数およ
び各クラスを代表するフォントの文字特徴たる代表ベク
トルを記憶する第２記憶手段と、上記第１記憶手段に記
憶された各特徴ベクトルと上記第２記憶手段に記憶され
た各代表ベクトルとのｅＯ８θを夫々計算する余弦計算
手段と、各特徴ベクトルを上記余弦計算手段で算出され
たＣＯＳθが最も大きいクラスへ分類するとともに、そ
の特徴ベクトルに最大のｃｏｓｏ値を第３記憶手段に格
納する分類手段と、この分類手段で分類されたクラス毎
にそのクラスに含まれる各特徴ベクトルから上記第３記
憶手段に格納されたその特徴ベクトルに最大のｅ（Ｍθ
値を重みとして総和ベクトルを計算し、計算結果たる重
み付き総和ベクトルをそのクラスの新たな代表ベクトル
として上記第２記憶手段の記憶内容を更新する総和ベク
トル計算手段と、上記余弦計算手段。分類手段、総和ベクトル計算手段を分類手段によるクラ
ス分けでクラス間に特徴ベクトルの移動がなくなるまで
繰り返し動作させる収束判別手段を備えたことを特徴と
する。

【作用】

分類すべき文字データの特徴ベクトル群は、第１記憶手
段に、予め与えられたクラスの個数と各クラスを代表す
るフォントの文字特徴たる代表ベクトルは、第２記憶手
段に夫々記憶されている。余弦計算手段は、第１記憶手段に記憶された各特徴ベク
トルと第２記憶手段に記憶された各代表ベクトルとのｃ
ｏｓθを夫々計算し、分類手段は、各特徴ベクトルを算
出された上記ｃｏｓθが最も大きいクラスへ分類し、か
つその特徴ベクトルに最大のｃｏｓＯ値を第３記憶手段
に格納する。次に、総和ベクトル計算手段は、分類され
たクラス毎にそのクラスに含まれる各特徴ベクトルから
第３記憶手段に格納されたその特徴ベクトルの最大のｃ
ｏｓＯ値を重みとして総和ベクトルを計算し、計算結果
たる重み付き総和ベクトルをそのクラスの新たな代表ベ
クトルとして上記第２記憶手段の記憶内容を更新する。一方、収束判別手段は、余弦計算手段９分類手段、総和
ベクトル計算手段を、分類手段によるクラス分けでクラ
ス間に特徴ベクトルの移動つまり入れ換えがなくなるま
で繰り返し動作させ、移動がなくなるとクラスタリング
が収束したとして処理を終了する。このように、各クラ
スの新たな代表ベクトルを、そのクラスに属する特徴ベ
クトルから前回の代表ベクトルとのｅＯ８θを重みとし
た総和ベクトルにより生成しているので、仮にイレギュ
ラな特徴ベクトルがクラスに入り込んでも、収束時のク
ラスに最初の代表ベクトル（初期値）が存在しなくなる
ということがなく、適切なりラスタリングができ、各ク
ラスに最適の代表ベクトルが求まる。従って、この代表
ベクトルに基づいてＯＣＲで読み取った文字データの認
識処理を行なえば、認識率を向上させることができる。

【実施例】

以下、本発明を図示の実施例により詳細に説明する。第１図は、本発明のクラスタリング方式を採用したＯＣ
Ｒの一実施例を示す概略ブロック図であこのＯＣＲは、
読み取った文字データを辞書作成のため所定個数のフォ
ントクラスに分類するものであり、分類すべき文字デー
タの特徴ベクトル群を記憶する第１記憶手段としてのベ
クトル群メモリｌと、予め与えられるクラスの個数およ
び各クラスを代表するフォントの文字特徴たる代表ベク
トルを記憶する第２記憶手段としての代表ベクトルメモ
リ２と、上記メモリｌに記憶された各特徴ベクトルと上
記メモリ２に記憶された各代表ベクトルとのｅＯ８θを
夫々計算する余弦計算手段としてのＣＯ８θ計算部４と
、各特徴ベクトルを上記ｃｏｓθ計算部４で算出された
ＣＯＳθが最も大きいクラスへ分類し、かつその特徴ベ
クトルに最大のｅ。Ｓｅ値を第３記憶手段たるｅＯ８θメモリ３に格納する
分類手段としてのクラスタリング制御部５を備える。また、上記ＯＣＲは、クラスタリング制御部５で分類さ
れたクラス毎に、そのクラスに含まれる各特徴ベクトル
からＣｏｇθメモリ３に格納されたその特徴ベクトルに
最大のｅｏ１１θ値を重みとして総和ベクトルを計算し
、計算結果たる霞み付き総和ベクトルをそのクラスの新
たな代表ベクトルとして上記代表ベクトルメモリ２の記
憶内容を更新する総和ベクトル計算部６を備える。さら
に、上記クラスタリング制御部５は、収束判別手段とし
て、自らが分類手段として行なうクラス分けでクラス間
に特徴ベクトルの移動がなくなったか否かを判別し、肯
と判別するまで上記Ｃｏｇθ計算部４゜総和ベクトル計
算部６を繰り返し動作させ、かつ自ら上述のクラス分類
を繰り返し行なう。上記構成のＯＣＲによるクラスタリング動作は、次のと
おりである。いま、説明を簡単にするため、例えば同一文字に対して
Ｐ個の特徴ベクトルＸ　ｒ　、　Ｘ　＊　、・・・、Ｘ
Ｐが、ベクトル群メモリ！に記憶されており、２つのク
ラスｆとｇの代表ベクトルＦ、Ｇが、上記特徴ベクトル
の中からＦ＝Ｘｉ＝（Ｘｉｔ、Ｘｉｔ、−、Ｘ１ｎ）、
Ｇ＝Ｘｊ＝（Ｘｉｔ、ＸＪ＊、Ｘ３ｎ）と選択されて代
表ベクトルメモリ２に記憶されているものとする（第２
図のＳｌ、Ｓ２参照）。但し、Ｘ＋＝（Ｘ＋＋＋Ｘ＋ｔ、”・、Ｘｌ）Ｘｔ＝（
Ｘｔ＋＋Ｘｔｔ、−、Ｘ＊ｎ）Ｘｐ＝（Ｘｐ＋、Ｘｐｚ
、・、Ｘｐｎ）ｉ＋ｊかつｌ≦ｉ≦ｐ、ｌ≦ｊ≦ｐＣＯＳθ計算部４は、各特徴ベクトルＸ１〜．Ｘｐと代
表ベクトルＦ、Ｇ　とのＣＯＳθを次式により計算する
（第２図の５４参照）。ＸｋとＦ　とのｃｏｓθ クラスタリング制御部５は、特徴ベクトルＸｋを上記ｃ
ｏｓθ計算部４で算出されたｃｏｓθが大きい方のクラ
スへ分類する（第２図のＳ５参照）。即ち、ｃｏｓθｆ
ｘｋ≧ｃｏｓθｇｘｇならばＸｋをクラスｆに、Ｃｏｓ
θｒｘｋ＜ｃｏｓθｇｘｋならばＸｋをクラスｇに夫々
分類するとともに、その特徴ベクトルに最大のｃｏｓθ
値、即ちｃｃ＋ｆｋ＝ｃｏｓθｆｘｋまたはωｇｋ＝ｃ
ｏｓθｇｘｋのいずれか大きい方をＣＯＳθメモリ３に
格納する。かくて、分類後のクラス「には、例えばｌ１
１（≦ｇ＋＜ｐ）個の特徴ベクトルＸ＋、Ｘｔ、・・・
、’Ｘ＋ａ（ここでは、各ペクトｃｏｓｏｆｘｋ＝（ｊ
”、　Ｙｋ）／（Ｉｔ　Ｗ　Ｉｔ　・ＩＩ　Ｙｋｌｌ　
）ＸｋとＧとのｃｏｓθ ｅｏｇθｇｘｋ＝（Ｇ、″”１ｋ）ｉ（１１６＋＋　−
＋＋　ｘｋ＋＋　＞（ｋ＝１，２．・・・、ｐ）ルに新たな添数字を与えて表わしている）が所属し、分
類後のクラスｇには、残るｐ−ｍ個の特徴ベクトルが所
属することになる。但し、なお、 ω値Ｘ＋＝（Ｘ＋＋、Ｘ＋ｚ、・−Ｘ＋ｎ）　　　ωＬクラ
スｒ　　ｘｔ＝ｃｘｔ＋、ｘｔｔ、”’、ｘｔｎ）　　
（＋ＪｆｔＸｍ＝（Ｘｗ＋、Ｘｍｔ、−、Ｘｍｎ）　　
　ωｆｓ＋次に、総和ベクトル計算部６は、上記クラス
ｆの新たな代表ベクトルＦ’＝ＣＦ’、、Ｆ’ｌ、−、
Ｆ’ｎ）を、このクラスｆに属する各特徴ベクトルから
、Ｃｏｓθメモリ３に格納された上記ωｒＱ（Ｑ＝　１
　、２　、・・・ｍ）による重み付き総和ベクトルとし
て次式により計算する（第２図の８９参照）。表ベクトルメモリ２の記憶内容を更新する。さらに、クラスタリング制御部５は、ＣＯＳθ計算部４
を再び動作させ、上記新たな代表ベクトルＦ’、Ｇ’に
よる再度のクラス分類を行ない、このクラス分類が前回
のクラス分類と同じ結果つまりクラス１１８間に特徴ベ
クトルＸｋの移動即ち入れ換但し、ωｒ（１＝ｃｏｓｅ
　ｒｘｋ：　ｆみ（＠回の代表ベクトルとのｃｏｓθ）０≦ωｒＱ≦１つまり、前回の代表ベクトルＦに近い特徴ベクトルの要
素は強められ、遠い特徴ベクトルの要素は弱められて加
算されて新たな代表ベクトルＦの各要素が生成されるこ
とになるので、イレギュラな特徴ベクトルがたまたまク
ラスｆに入り込んでも、新たな代表ベクトルＦが最初に
与えられた代表ベクトルＦから大きく外れることはない
。総和ベクトル計算部６は、クラスｇの新たな代表ベクト
ルＧ′も、上述と同様にして計算し、その後、計算結果
たる重み付き総和ベクトルＦ’　、Ｇ’を夫々クラスｆ
、ｇの新たな代表ベクトルとして代えがなかったなら、
クラスタリングが収束したとして処理を終了する（第２
図の８６参照）。一方、クラス１１８間に特徴ベクトル
の移動があり、例えばクラスｇに属していた特徴ベクト
ルＸαがクラスｆに分類されたなら、クラスｆのｍ＋１
個の特徴ベクトルならびにクラスｇのｐ−ｔａ−１個の
特徴ベクトルの夫々について、総和ベクトル計算部６を
動作させて次の新たな代表ベクトルを求め、上述のｃ。Ｓθ計算とクラス分類をクラスタリングが収束するまで
縁り返すのである（第２図の９６．Ｓ９参照）。なお、第２図において、ステップＳ３では、ＣＯ８θ計
算部計算上４特徴ベクトル群の各特徴ベクトルと代表ベ
クトルとのｃｏｓθ計算が終了したか否かが判断され、
ステップＳ７では、各クラスの代表ベクトルとのＣｏｇ
θ計算が終了したか否かおよび総てのクラス間でベクト
ル移動の有無を調へたか否かが判断され、ステップＳ８
では、総和ベクトル計算部６による各クラスの新代表ベ
クトルの算出が終了したか否かが判断される。このように、本発明では、各クラスｆ側の新たな代表ベ
クトルＦ’、Ｇ’を、そのクラスに属する特のｅＯ８θ
（ωｒａ、ωｇＱ）を重みとした総和ベクトルにより生
成しているので、仮にイレギュラな特徴ベクトルがその
クラスに入り込んでも、新たな代表ベクトルＦ”、Ｇ’
が最初に与えられた代表ベクトルＦ、Ｇから大きく外れ
ず、収束時のクラスに最初の代表ベクトル（初期値）が
存在しなくなるということがない。従って、本発明によ
れば適切なりラスタリングができ、各クラスに最適の代
表ベクトルが求まり、この代表ベクトルに基づいて辞書
を作成し、ＯＣＲで読み取った文字データのフォント認
識処理を行なえば、英数字や手書文字のようなフォント
数の多い文字でも、初期値を与えることでフォント数の
少ない日本語のフォント名によるクラスタリングと同様
のクラスタリングが可能となり、認識率を大いに向上さ
せることができる。なお、本発明の各手段は、実施例のものに限られず、ま
た、クラスの個数は、実施例の２個に限らず３個以上に
することができる。

【発明の効果】

以上の説明で明らかなように、本発明のＯＣＲにおける
クラスタリング方式は、分類すべき文字データの特徴ベ
クトル群を第１記憶手段に、予め与えられたクラス数と
各クラスの代表ベクトルを第２記憶手段に夫々記憶し、
余弦計算手段で両記憶手段の各特徴ベクトルと各代表ベ
クトルとのｃ。Ｓθを計算した後、算出されたｃＯ８θが最大のクラス
へ分類手段により各特徴ベクトルを分類し、かつ最大の
ｃｏｓＯ値を第３記憶手段に格納する一方、総和ベクト
ル計算手段によって、分類手段で分類されたクラス毎に
、そのクラスに属する各特徴ベクトルから第３記憶手段
に格納されたその特徴ベクトルに最大のｃｏｓＯ値を重
みとして総和ヘクトルを計算し、計算結果たる重み付き
総和ベクトルをそのクラスの新たな代表ベクトルとして
第２記憶手段の記憶内容を更新するとともに、収束判別
手段によって、分類手段によるクラス分けでクラス間に
特徴ベクトルの移動がなくなるまで上記余弦計算手段１
分類手段、総和ベクトル計算手段を繰り返し動作させる
ようにしているので、イレギュラな特徴ベクトルが入り
込んでも、収束時の各クラスに最初の代表ベクトルが存
在しなくなることがなく、適切なりラスタリングで各ク
ラスに最適の代表ベクトルが求まり、読取り文字データ
をこの代表ベクトルに基づいてフォント認識処理すれば
、英数字等のフォント数の多い文字でも認識率を向上さ
せることができる。

【図面の簡単な説明】

第１図は本発明のクラスタリング方式を採用したＯＣＲ
の一実施例を示す概略ブロック図、第２図は上記実施例
のクラスタリング処理の流れを示すフローチャートであ
る。ｌ　・ベクトル群メモリ、２・・代表ベクトルメモリ、３　・ＣＯＳθメモリ、４
−・・・ｃｏｓθ計算部、５・・クラスタリング制御部
、６・・・総和ベクトル計算部。

Claims

【特許請求の範囲】

（１）光学的文字読み取り装置における辞書作成時に、
文字データを所定個数のフォントクラスに分類するクラ
スタリング方式であって、分類すべき文字データの特徴ベクトル群を記憶する第１
記憶手段と、予め与えられるクラスの個数および各クラ
スを代表するフォントの文字特徴たる代表ベクトルを記
憶する第２記憶手段と、上記第１記憶手段に記憶された
各特徴ベクトルと上記第２記憶手段に記憶された各代表
ベクトルとのｃｏｓθを夫々計算する余弦計算手段と、
各特徴ベクトルを上記余弦計算手段で算出されたｃｏｓ
θが最も大きいクラスへ分類するとともに、その特徴ベ
クトルに最大のｃｏｓθ値を第３記憶手段に格納する分
類手段と、この分類手段で分類されをたクラス毎にその
クラスに含まれる各特徴ベクトルから上記第３記憶手段
に格納されたその特徴ベクトルに最大のｃｏｓθ値を重
みとして総和ベクトルを計算し、計算結果たる重み付き
総和ベクトルをそのクラスの新たな代表ベクトルとして
上記第２記憶手段の記憶内容を更新する総和ベクトル計
算手段と、上記余弦計算手段、分類手段、総和ベクトル
計算手段を分類手段によるクラス分けでクラス間に特徴
ベクトルの移動がなくなるまで繰り返し動作させる収束
判別手段を備えたことを特徴とするクラスタリング方式
。