JP3281530B2

JP3281530B2 - 文字認識装置

Info

Publication number: JP3281530B2
Application number: JP03021796A
Authority: JP
Inventors: 悦伸堀田; 聡直井; 美佐子諏訪
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1996-02-19
Filing date: 1996-02-19
Publication date: 2002-05-13
Anticipated expiration: 2016-02-19
Also published as: JPH09223196A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、手書きした文書を
イメージスキャナで光学的に読み取ってイメージデータ
を生成し、そのイメージデータから手書き文字の認識処
理を行う文字認識装置（ＯＣＲ）に関する。近年、手書
き用の入力周辺機器として手書き文字認識装置、すなわ
ちＯＣＲの需要が増加している。前記手書き文字認識装
置の実用化を考えた場合、非常に高い認識率が必要とさ
れる。一般に文字認識装置では、入力文字と事前登録さ
れた文字辞書とを照合して文字の認識を行う。

【０００２】しかし、文字辞書を汎用に作成しているた
めに、個人毎に癖のある文字変動を完全に吸収すること
は困難であり、文字認識率の低下を招いていた。本願発
明はこのような問題に対処するものであり、文字認識処
理の際に個人の筆記特性を考慮することにより、高い文
字認識率を実現するものである。

【０００３】なお、本願発明は、手書き文字認識装置
（ハードウェア構成の装置）だけでなく、手書き文字認
識ソフトウェア（コンピュータ内で処理する文字認識用
のプログラム）など、広い意味での手書き文字認識技術
に関する。また、個人の筆記特性を利用する処理上、１
枚の文書中にある程度以上の文字数が同一筆者によって
記入されている必要があり、そのような条件を満たす文
書としては、仕入れ伝票、販売原票などのＯＣＲ用の伝
票がある。

【０００４】

【従来の技術】以下、従来例ついて説明する。従来、手
書き文字の認識処理を行う手書き文字認識装置として各
種の装置が知られていた。前記文字認識装置の内、筆者
毎の筆記特性を利用する装置としては、予め筆者毎の文
字サンプルをとり、それに基づいて筆者毎の文字辞書を
作成する手書文字認識装置が知られていた（特開昭５８
−０９４０６４号公報参照）。

【０００５】また、予め、筆者毎の文字サンプルをと
り、それに基づいて文字特徴要素算出時に、筆者毎の補
正を加える手書文字認識装置が知られていた（特開昭６
０−０３１６８３号公報参照）。

【０００６】

【発明が解決しようとする課題】前記のような従来のも
のにおいては、次のような課題があった。 (1) ：前記筆者毎の文字サンプルをとり、それに基づい
て筆者毎の文字辞書を作成したり、文字特徴要素を算出
する装置では、ユーザが文字認識装置、或いは文字認識
ソフトウェアを用いる前に、文字サンプルを登録する作
業が必要であり、余計な手間と時間がかかる。

【０００７】(2) ：前記従来の文字認識装置では、個人
の筆記特性も年月の経過と共に少しずつ変わって行くこ
とが予想されるため、高い認識率を維持し続けるために
は、或る特定の期間毎に文字サンプルを再登録する作業
が必要である。このため、余計な手間と時間がかかり、
効率の悪い装置となる。

【０００８】(3) ：前記従来の文字認識装置では、使用
ユーザ数が多い場合は、筆者毎に文字辞書或いは文字特
徴算出補正パラメータを保持する必要上、ハードウェア
的には使用するメモリ量が多くなり、装置がコスト高と
なる。

【０００９】本発明は、このような従来の課題を解決
し、手書き文字認識処理を行う際に、予め筆者毎の筆記
特性を登録するなどの事前の処理を不要とし、常に正確
で効率の良い手書き文字認識処理ができるようにするこ
とを目的とする。

【００１０】

【課題を解決するための手段】図１は本発明の原理説明
図である。本発明は前記の目的を達成するため、次のよ
うに構成した。 (1) ：文書のイメージデータから手書き文字の認識処理
を行う文字認識装置において、イメージスキャナ１から
出力された文書のイメージデータを格納するイメージデ
ータ格納部６と、同一筆者記入領域抽出部７（同一筆者
記入領域抽出手段）と、同一筆者記入領域格納部８と、
文字切り出し部９と、特徴ベクトル算出部１０（特徴ベ
クトル算出手段）と、文字カテゴリ判定部１１（文字カ
テゴリ判定手段）と、全文字カテゴリ判定結果格納部１
２と、識別辞書１３と、全特徴ベクトル格納部１４と、
クラスタリング処理部１５（クラスタリング処理手段）
と、クラスタリング処理結果格納部１６と、文字カテゴ
リ判定結果修正部１７（文字カテゴリ判定結果修正手
段）を設けた。

【００１１】(2) ：文書のイメージデータから手書き文
字の認識処理を行う文字認識装置において、前記文書の
イメージデータから同一筆者によって記入された領域を
抽出する同一筆者記入領域抽出部７と、同一筆者記入領
域抽出部７が抽出した領域内の全ての文字に対し各文字
毎に文字の特徴ベクトルを算出する特徴ベクトル算出部
１０と、特徴ベクトル算出部１０によって算出された各
文字毎の特徴ベクトルと識別辞書１３に登録された特徴
ベクトルとの距離比較に基づいて各文字の文字カテゴリ
を判定する文字カテゴリ判定部１１と、特徴ベクトル算
出部１０で算出した全ての特徴ベクトルに対して類似度
の高いもの同士をクラスタとして順次統合して行くクラ
スタリング処理を行うクラスタリング処理部１５と、ク
ラスタリング処理部１５によるクラスタリング処理結果
を文字カテゴリ判定手段１１による文字カテゴリ判定結
果と比較して文字カテゴリ判定結果を修正する文字カテ
ゴリ判定結果修正部１７を備えている。

【００１２】(3) ：前記(2) の文字認識装置において、
文字カテゴリ判定結果修正手段１７は、クラスタリング
処理手段１５の処理結果から、全カテゴリの全クラスタ
を対象に各クラスタ間の距離比較を行い、クラスタ間距
離が予め設定した閾値以下となるクラスタ同士を統合す
るクラスタ統合手段と、文字カテゴリ判定部１１が判定
した全文字カテゴリ判定結果を基に、クラスタ統合手段
で統合されたクラスタ同士の文字カテゴリが異なるか否
かを判定するクラスタ内文字カテゴリ判定手段と、クラ
スタ内文字カテゴリ判定手段により前記統合されたクラ
スタが異なる文字カテゴリ同士と判定された場合、クラ
スタ内要素が少ない方のクラスタについてその文字カテ
ゴリを統合相手の文字カテゴリに修正する文字カテゴリ
修正手段を備えている。

【００１３】(4) ：前記(2) の文字認識装置において、
クラスタリング処理部１５は、文字カテゴリ内で特徴ベ
クトルに対する階層的クラスタリング処理を行うこと
で、特徴ベクトルに対して類似度の高いもの同士をクラ
スタとして順次統合して行く階層的クラスタリング処理
手段と、前記階層的クラスタリング処理手段による階層
的クラスタリング処理を行って、カテゴリ内のクラスタ
数が予め設定された一定数に達した際、前記階層的クラ
スタリング処理を打ち切るクラスタリング打ち切り手段
を備えている。

【００１４】(5) ：前記(2) の文字認識装置において、
クラスタリング処理部１５は、文字カテゴリ内で特徴ベ
クトルに対する階層的クラスタリング処理を行うこと
で、特徴ベクトルに対して類似度の高いもの同士をクラ
スタとして順次統合して行く階層的クラスタリング処理
手段と、前記階層的クラスタリング処理手段による階層
的クラスタリング処理を行って、階層的クラスタリング
によるクラスタ統合時のクラスタ間距離が或る閾値以上
になった時点でクラスタリングを打ち切るクラスタリン
グ打ち切り手段を備えている。

【００１５】(6) ：前記(2) の文字認識装置において、
クラスタリング処理部１５は、文字カテゴリ内で特徴ベ
クトルに対する階層的クラスタリング処理を行うこと
で、特徴ベクトルに対して類似度の高いもの同士をクラ
スタとして順次統合して行く階層的クラスタリング処理
手段と、前記階層的クラスタリング処理手段による階層
的クラスタリング処理を行って、階層的クラスタリング
によるクラスタ統合時のクラスタ間距離の増加率が或る
閾値以上になった時点でクラスタリングを打ち切るクラ
スタリング打ち切り手段を備えている。

【００１６】（作用）前記構成に基づく本発明の作用
を、図１に基づいて説明する。：前記(1) の作用イメージスキャナ１では手書き文字を有する文書を光学
的に読み取り、２値のイメージデータを生成して出力す
る。前記イメージスキャナ１から出力されたイメージデ
ータはイメージデータ格納部６に格納する。その後、同
一筆者記入領域抽出部７はイメージデータ格納部６に格
納されているイメージデータから、同一筆者が記入した
領域のイメージデータを抽出し、同一筆者記入領域格納
部８に格納する。

【００１７】その後、文字切り出し部９は同一筆者記入
領域格納部８に格納されている同一筆者が記入した領域
のイメージデータから、１文字分の領域を切り出し、特
徴ベクトル算出部１０へ出力する。特徴ベクトル算出部
１０は、文字切り出し部９が切り出したイメージデータ
から特徴ベクトルを算出する。この時、前記算出された
特徴ベクトルは全特徴ベクトル格納部１４へ格納すると
共に、文字カテゴリ判定部１１へ出力する。

【００１８】文字カテゴリ判定部１１は、特徴ベクトル
算出部１０が算出した特徴ベクトルを基に、識別辞書１
３を参照して文字カテゴリの判定処理を行い、判定結果
を全文字カテゴリ判定結果格納部１２に格納する。ま
た、クラスタリング処理部１５は、全特徴ベクトル格納
部１４に格納されている全ての特徴ベクトルを対象に、
文字カテゴリ毎に階層的クラスタリング処理を行い、ク
ラスタリング処理結果をクラスタリング処理結果格納部
１６に格納する。

【００１９】次に、文字カテゴリ判定結果修正部１７
は、クラスタリング処理結果格納部１６に格納されてい
るクラスタリング処理結果と、全文字カテゴリ判定結果
格納部１２に格納されている全文字のカテゴリ判定結果
を基に、文字カテゴリ判定結果の修正処理を行う。そし
て、修正結果を出力する。

【００２０】以上のようにして、従来の文字認識装置に
加えて筆者毎の筆記特性に基づいた文字認識結果修正処
理を行うため、文字認識を正確に行うことが可能であ
る。また、入力された複数の文字を基に筆記特性を算出
するため、事前に筆者毎の文字サンプルを取る、という
作業が不要になる上、文字サンプル用のメモリも不要に
なる。更に、従来提案されている様々な文字認識処理の
後処理として本願発明の処理を追加することができるた
め、従来の文字認識処理自体は変更する必要がなく、イ
ンプリメントも容易になる。

【００２１】：前記(2) の作用同一筆者記入領域抽出部７はイメージデータ格納部６に
格納されている文書のイメージデータから同一筆者によ
って記入された領域を抽出し、特徴ベクトル算出部１０
は同一筆者記入領域抽出部７が抽出した領域内の全ての
文字に対し各文字毎に文字の特徴ベクトルを算出し、文
字カテゴリ判定部１１は特徴ベクトル算出部１０によっ
て算出された各文字毎の特徴ベクトルと識別辞書１３に
登録された特徴ベクトルとの距離比較に基づいて各文字
の文字カテゴリを判定する。

【００２２】また、クラスタリング処理部１５は特徴ベ
クトル算出部１０で算出した全ての特徴ベクトルに対し
て類似度の高いもの同士をクラスタとして順次統合して
行くクラスタリング処理を行い、文字カテゴリ判定結果
修正部１７はクラスタリング処理部１５によるクラスタ
リング処理結果を文字カテゴリ判定部１１による文字カ
テゴリ判定結果と比較して文字カテゴリ判定結果を修正
し、修正結果を出力する。

【００２３】以上のようにして、従来の文字認識装置に
加えて筆者毎の筆記特性に基づいた文字認識結果修正処
理を行うため、文字認識を正確に行うことが可能であ
り、入力された複数の文字を基に筆記特性を算出するた
め、事前に筆者毎の文字サンプルを取る、という作業が
不要になる上、文字サンプル用のメモリも不要になる。
また、従来提案されている様々な文字認識処理の後処理
として本願発明の処理を追加することができるため、従
来の文字認識処理自体は変更する必要がなく、インプリ
メントも容易になる。

【００２４】更に、各文字カテゴリ毎にクラスタリング
処理を行うため、筆者の筆記特性を反映した文字特徴を
捕らえ易く、従来の処理で誤って認識された文字を容易
に修正することが可能である。

【００２５】：前記(3) の作用文字カテゴリ判定結果修正部１７では、クラスタ統合手
段がクラスタリング処理部１５の処理結果から全カテゴ
リの全クラスタを対象に各クラスタ間の距離比較を行
い、クラスタ間距離が予め設定した閾値以下となるクラ
スタ同士を統合する。次に、クラスタ内文字カテゴリ判
定手段は、文字カテゴリ判定部１１が判定した全文字カ
テゴリ判定結果を基に、クラスタ統合手段で統合された
クラスタ同士の文字カテゴリが異なるか否かを判定す
る。

【００２６】そして、文字カテゴリ修正手段は、前記ク
ラスタ内文字カテゴリ判定手段により統合されたクラス
タが異なる文字カテゴリ同士と判定された場合、クラス
タ内要素が少ない方のクラスタについてその文字カテゴ
リを統合相手の文字カテゴリに修正する。

【００２７】この場合、前記クラスタリング処理により
各文字カテゴリ毎にクラスタリング処理を行い、その結
果のデータを用いて前記修正処理を行うので、筆者の筆
記特性を反映した文字特徴を捕らえ易く、従来の処理で
誤って認識された文字を容易に修正することが可能であ
る。

【００２８】また、前記クラスタリング処理では、近傍
のクラスタ同士が段階的に統合されて行くので、結果的
に離れて位置するクラスタだけを抽出し易くなり、誤読
文字だけからなるクラスタを抽出し易い。このため、前
記クラスタリング処理結果から誤読文字の修正を行うこ
とが容易になる。

【００２９】：前記(4) の作用クラスタリング処理部１５では、先ず、階層的クラスタ
リング処理手段が文字カテゴリ内で特徴ベクトルに対す
る階層的クラスタリング処理を行うことで、特徴ベクト
ルに対して類似度の高いもの同士をクラスタとして順次
統合して行く。そして、前記階層的クラスタリング処理
手段により階層的クラスタリング処理を行って、カテゴ
リ内のクラスタ数が予め設定された一定数に達した際、
クラスタリング打ち切り手段が階層的クラスタリング処
理を打ち切る。

【００３０】このようにすれば、クラスタリング打ち切
り基準が単純であるため、前記クラスタリング打ち切り
手段の追加が容易であり、高速な処理を行うことが可能
である。

【００３１】：前記(5) の作用クラスタリング処理部１５では、階層的クラスタリング
処理手段が文字カテゴリ内で特徴ベクトルに対する階層
的クラスタリング処理を行うことで、特徴ベクトルに対
して類似度の高いもの同士をクラスタとして順次統合し
て行く。そして前記階層的クラスタリング処理手段によ
る階層的クラスタリング処理を行って、階層的クラスタ
リングによるクラスタ統合時のクラスタ間距離が或る閾
値以上になった時点でクラスタリング打ち切り手段がク
ラスタリングを打ち切る。このように、クラスタ間距離
に基づいてクラスタリングを行うため、クラスタのまと
まりをより正確に求めることが可能になる。

【００３２】：前記(6) の作用クラスタリング処理部１５では、先ず、階層的クラスタ
リング処理手段が文字カテゴリ内で特徴ベクトルに対す
る階層的クラスタリング処理を行うことで、特徴ベクト
ルに対して類似度の高いもの同士をクラスタとして順次
統合して行く。そして、前記階層的クラスタリング処理
手段による階層的クラスタリング処理を行って、階層的
クラスタリングによるクラスタ統合時のクラスタ間距離
の増加率が或る閾値以上になった時点でクラスタリング
打ち切り手段がクラスタリングを打ち切る。

【００３３】このようにすれば、文字カテゴリ毎に文字
特徴ベクトルの分布のばらつき具合が異なる場合でも、
クラスタ統合時におけるクラスタ間距離の増加率を用い
ているため、クラスタのばらつきに応じて、クラスタの
まとまりをより正確に求めることが可能である。その結
果、常に正確な文字カテゴリの修正が可能となる。

【００３４】

【発明の実施の形態】以下、発明の実施の形態を図面に
基づいて詳細に説明する。 §１：本実施の形態における装置の説明・・・図２参照図２は実施の形態の装置構成図である。図示のように、
本実施の形態の装置には、イメージスキャナ１と文字認
識部２を設ける。この場合、イメージスキャナ１は、文
字認識装置（ハードウェア構成の専用の装置）に内蔵し
たスキャナでも良いし、文字認識装置（ハードウェア構
成の専用の装置）にケーブルで接続可能な単独のスキャ
ナでも良いし、パーソナルコンピュータ、ワークステー
ション等の汎用の情報処理装置に内蔵したスキャナでも
良いし、前記汎用の情報処理装置にケーブルで接続可能
な単独のスキャナでも良い。

【００３５】また、前記文字認識部２は、前記文字認識
装置（ハードウェア構成の専用の装置）に内蔵した文字
認識部でも良いし、前記パーソナルコンピュータ等の汎
用の情報処理装置に内蔵した文字認識部（手書き文字認
識ソフトウェアのみ）でも良い。

【００３６】前記文字認識部２には、イメージデータ受
信部５、イメージデータ格納部６、同一筆者記入領域抽
出部７、同一筆者記入領域格納部８、文字切り出し部
９、特徴ベクトル算出部１０、文字カテゴリ判定部１
１、全文字カテゴリ判定結果格納部１２、識別辞書１
３、全特徴ベクトル格納部１４、クラスタリング処理部
１５、クラスタリング処理結果格納部１６、文字カテゴ
リ判定結果修正部１７、クラスタリング打ち切り条件格
納部１８等が設けてある。また、前記文字カテゴリ判定
結果修正部１７にはクラスタ内文字カテゴリ判定部１９
が設けてある。前記各部の機能等は次の通りである。

【００３７】(1) ：イメージスキャナ１は手書き文字を
含む文書を光学的に読み取り、２値のイメージデータを
生成して出力するものである。 (2) ：文字認識部２はイメージスキャナ１から出力され
たイメージデータから文字認識処理により手書き文字の
認識処理を行うものである。

【００３８】(3) ：イメージデータ受信部５はイメージ
スキャナ１から出力されたイメージデータを受信してイ
メージデータ格納部６に格納する処理を行うものであ
る。 (4) ：イメージデータ格納部６はイメージスキャナ１か
ら出力されたイメージデータを格納しておくメモリであ
る。

【００３９】(5) ：同一筆者記入領域抽出部７はイメー
ジデータ格納部６に格納されているイメージデータから
同一筆者が記入した領域を抽出し、同一筆者記入領域格
納部８に格納する処理を行うものである。

【００４０】(6) ：同一筆者記入領域格納部８は同一筆
者記入領域抽出部７が抽出した同一筆者記入領域のイメ
ージデータを格納しておくメモリである。 (7) ：文字切り出し部９は同一筆者記入領域格納部８に
格納されている同一筆者記入領域のイメージデータか
ら、１文字分のデータを切り出す処理を行うものであ
る。

【００４１】(8) ：特徴ベクトル算出部１０は同一筆者
記入領域格納部８に格納されている全ての文字に対し、
文字切り出し部９が切り出した各文字毎に特徴ベクトル
を算出するものである。

【００４２】(9) ：文字カテゴリ判定部１１は特徴ベク
トル算出手段１０が算出した各特徴ベクトルと識別辞書
１３に登録されている辞書登録ベクトルとの距離比較に
基づいて、各文字カテゴリを判定するものである。

【００４３】(10)：全文字カテゴリ判定結果格納部１２
は文字カテゴリ判定部１１が判定した結果のデータを格
納するメモリである。 (11)：識別辞書１３は、予め学習パターンを用いて各カ
テゴリ（１つの文字）毎に特徴ベクトルを算出し、この
特徴ベクトルを辞書ベクトルとして登録したものであ
る。

【００４４】(12)：全特徴ベクトル格納部１４は特徴ベ
クトル算出部１０が算出した全てのカテゴリ（文字）の
特徴ベクトルを格納するメモリである。 (13)：クラスタリング処理部１５は特徴ベクトル算出部
１０が算出した全ての特徴ベクトルに対してクラスタリ
ング処理（階層的クラスタリング処理）を行うものであ
る。

【００４５】(14)：クラスタリング処理結果格納部１６
はクラスタリング処理部１５が処理した結果のデータを
格納するメモリである。 (15)：文字カテゴリ判定結果修正部１７は前記クラスタ
リング処理結果と、文字カテゴリ判定部１１が判定した
各文字の文字カテゴリを比較し、文字カテゴリ判定結果
を修正するものである（誤読文字の修正）。

【００４６】(16)：クラスタリング打ち切り条件格納部
１８は、予めクラスタリング打ち切り条件を格納してお
くメモリである。 (17)：クラスタ内文字カテゴリ判定部１９は全文字カテ
ゴリ判定結果格納部１２に格納されている全文字カテゴ
リを参照し、統合されたクラスタ同士の文字カテゴリが
異なるか否かについて、クラスタ内文字カテゴリの判定
処理を行うものである。

【００４７】なお、前記構成の内、クラスタリング処理
部１５、文字カテゴリ判定結果修正部１７、クラスタリ
ング打ち切り条件格納部１８、クラスタ内文字カテゴリ
判定部１９は本願発明に特有の処理を行うものである
が、それ以外の各部（符号５、７、９、１０、１１、１
３等で示される各部）は、それぞれ従来の装置に使用さ
れていたものである。

【００４８】§２：処理対象の手書き文字文書例の説明
・・・図３、図４参照図３は文書例１、図４は文書例２である。イメージスキ
ャナ１による読み取り対象の手書き文字文書として、例
えば、図３に示した文書例１、或いは図４に示した文書
例２などがある。これらの文書は、クラスタリング処理
部１５によるクラスタリング処理では統計的処理を行う
ため、手書き文字文書中にはある程度以上の手書き文字
の文字数が有るものである。

【００４９】前記文書例１は、例えば、商品の仕入れ伝
票等に使用されるものであり、「金額記入欄」と「筆者
番号記入欄」等が設けてある。そして、この伝票を使用
する場合は、前記「筆者番号記入欄」に筆者番号（この
例では０３２１）を記入し、前記「金額記入欄」にはそ
れぞれ商品毎の金額を手書きにより記入する。この文書
例１は、１枚の文書に一人の筆者が金額を記入するもの
である。

【００５０】また、前記文書例２は、「販売原票」の例
であり、例えば、複数の商品を販売する際に使用するも
のである。この「販売原票」には、各商品毎の品名、単
価、買受人、数量の各欄が設けてあり、それぞれ手書き
により文字を記入するようになっている。また、「販売
原票」の下端には前記文字を手書きにより記入した担当
者の氏名（日本太郎）等を記入するようになっている。

【００５１】§３：文字認識処理の概要説明クラスタリング処理部１５によるクラスタリング処理で
は統計的処理を行うため、前記のような手書き文字文書
中にはある程度以上の手書き文字の文字数が有るものと
する。また、文字認識処理の対象とするイメージデータ
（画像イメージデータ）は、雑音除去や文書の傾き補正
等の前処理がなされているものとする。更に、文字切り
出し部９による文字切り出し処理では、各文字が正確に
１文字ずつ切り出されるものとする。

【００５２】イメージスキャナ１では手書き文字文書を
光学的に読み取り、２値のイメージデータを生成して出
力する。前記イメージスキャナ１から出力されたイメー
ジデータはイメージデータ受信部５が受信しイメージデ
ータ格納部６に格納する。その後、同一筆者記入領域抽
出部７はイメージデータ格納部６に格納されているイメ
ージデータから、同一筆者が記入した領域のイメージデ
ータを抽出し、同一筆者記入領域格納部８に格納する。

【００５３】その後、文字切り出し部９は同一筆者記入
領域格納部８に格納されている同一筆者が記入した領域
のイメージデータから１文字分の領域を切り出し、特徴
ベクトル算出部１０へ出力する。特徴ベクトル算出部１
０は、前記文字切り出し部９が切り出したイメージデー
タから特徴ベクトルを算出する。この時、前記算出され
た特徴ベクトルは全特徴ベクトル格納部１４へ格納する
と共に、文字カテゴリ判定部１１へ出力する。

【００５４】文字カテゴリ判定部１１は、特徴ベクトル
算出部１０が算出した特徴ベクトルを基に、識別辞書１
３を参照して文字カテゴリの判定処理を行い、判定結果
を全文字カテゴリ判定結果格納部１２に格納する。ま
た、クラスタリング処理部１５は、全特徴ベクトル格納
部１４に格納されている全ての特徴ベクトルを対象に、
文字カテゴリ毎に、階層的クラスタリング処理を行い、
全ての文字カテゴリのクラスタリング処理が終了した時
点でクラスタリング結果をクラスタリング処理結果格納
部１６に格納する。

【００５５】次に、文字カテゴリ判定結果修正部１７
は、クラスタリング処理結果格納部１６に格納されてい
るクラスタリング処理結果と、全文字カテゴリ判定結果
格納部１２に格納されている全文字のカテゴリ判定結果
を基に、文字カテゴリ判定結果の修正処理を行い（誤読
文字カテゴリの修正）、修正結果を出力する。

【００５６】§４：各部の詳細な説明・・・図５〜図１
１参照以下、図５〜図１１に基づいて前記各部の詳細な処理に
ついて説明する。 (1) ：同一筆者記入領域抽出部７の説明同一筆者記入領域抽出部７は、イメージデータ格納部６
に格納されているイメージデータから同一筆者によって
記入された領域だけを抽出し、そのイメージデータを同
一筆者記入領域格納部８に格納するものである。この場
合、イメージデータ格納部６に格納されている文書のイ
メージデータには、：同一筆記者により手書きされた
文書を読み取って生成した同一筆記者のみのイメージデ
ータと、：複数の筆記者が手書きで記入した文書から
読み取って生成した複数筆記者のイメージデータとがあ
る。

【００５７】前記の同一筆記者のみのイメージデータ
の場合、同一筆者記入領域抽出部７は、イメージデータ
格納部６のイメージデータをそのまま全部読み出して同
一筆者記入領域格納部８へ格納する。また、前記の複
数筆記者のイメージデータの場合は、指定された筆記者
のイメージデータのみを抽出して同一筆者記入領域格納
部８へ格納する。この場合の処理は、例えば次のように
して行う。

【００５８】前記の同一筆記者のみのイメージデータ
の場合、例えば、同一筆者記入領域抽出部７に対し、予
め同一筆記者のイメージデータである旨、指示情報（キ
ーボードから係員が入力した指示情報）を送り、その指
示情報を内部に設定（例えば、メモリに設定）しておく
ことで実現可能である。また、処理対象領域に対する筆
者番号等の入力等によっても実現可能である。

【００５９】また、前記の複数筆記者のイメージデー
タの場合は、前記イメージデータの各処理対象領域に対
し、筆記者毎の抽出領域情報を指定し、この指定情報に
従って同一筆者毎に領域を抽出することで実現すること
が可能である。更に、前記の場合、文書中に筆者番号
を記入しておき、この文書を読み取って生成されたイメ
ージデータから筆者番号を読み取り、その筆者番号と、
予め設定された読み取り対象領域の情報を基に、筆者毎
の記入領域を識別し、同一筆者記入領域を抽出すること
でも実現可能である。更に、従来から行われている他の
任意の方法で同一筆者記入領域を抽出することが可能で
ある。

【００６０】(2) ：特徴ベクトル算出部１０の説明・・
・図５参照図５は特徴ベクトル算出例である。特徴ベクトル算出部
１０は、文字切り出し部９が切り出した１文字の領域か
ら特徴ベクトルを算出するものである。特徴ベクトルの
算出方法としては、従来より種々のものが提案されてお
り、例えば、「加重方向ヒストグラム法」などを用い
る。

【００６１】前記加重方向ヒストグラム法は、例えば、
「加重方向ヒストグラム法による手書き漢字・ひらがな
認識，電子情報通信学会論文誌Ｄ，Ｖｏｌ，Ｊ７０−
Ｄ，Ｎｏ．７，ｐｐ．１３９０〜１３９７，１９８７年
７月発行」に記載されている。前記特徴ベクトルの算出
法を用いれば、１文字当たり６４次元の特徴ベクトルが
算出できる。

【００６２】以下、特徴ベクトルの１例を図５に基づい
て説明する。この例は、図に示したように、縦５×横
４の枡目に書かれている文字について、枡目の黒い部分
を１、白い部分を０として、枡目の左上から右下までの
順に枡を見てみる。その時現れる数値（１又は０）を順
に並べたものを特徴ベクトルとした例である。この例で
は、３つの異なる「２」という文字についての特徴ベク
トルを示している。具体的には次の通りである。

【００６３】例えば、図の例では、特徴ベクトルｖｅ
ｃｔｏｒ＿２ａは、ｖｅｃｔｏｒ＿２ａ＝（１，１，
１，１，０，０，０，１，１，１，１，１，１，０，
０，０，１，１，１，１）となる。図の例では、特徴
ベクトルｖｅｃｔｏｒ＿２ｂは、ｖｅｃｔｏｒ＿２ｂ＝
（０，１，１，１，０，０，０，１，１，１，１，１，
１，０，０，０，１，１，１，１）となる。図の例で
は、特徴ベクトルｖｅｃｔｏｒ＿２ｃは、ｖｅｃｔｏｒ
＿２ｃ＝（１，１，１，１，０，０，０，１，０，１，
１，０，１，０，０，０，１，１，１，１）となる。

【００６４】(3) ：文字カテゴリ判定部１１の説明・・
・図６参照図６は文字カテゴリ判定例を示した図である。文字カテ
ゴリ判定部１１は、特徴ベクトル算出部１０が算出した
特徴ベクトルを基に、識別辞書１３を参照して文字カテ
ゴリの判定処理を行うものである。この場合、予め学習
パターンを用いて各文字カテゴリ（カテゴリ：１つの文
字を表す）毎に特徴ベクトルを算出しておき、それらを
識別辞書１３として登録しておく。

【００６５】そして文字カテゴリ判定部１１は、特徴ベ
クトル算出部１０で算出された入力文字の特徴ベクトル
と、識別辞書１３に登録された各カテゴリの特徴ベクト
ルとの距離比較を行い、入力文字の特徴ベクトルと最も
近い辞書ベクトル（識別辞書１３に登録されている特徴
ベクトル）のカテゴリを入力文字の文字カテゴリと判定
する。

【００６６】なお、前記距離比較の方法については、前
記の文献「加重方向ヒストグラム法による手書き漢字・
ひらがな認識，電子情報通信学会論文誌Ｄ，Ｖｏｌ，Ｊ
７０−Ｄ，Ｎｏ．７，ｐｐ．１３９０〜１３９７，１９
８７年７月発行」を参照されたい。

【００６７】以下、図に基づいて特徴ベクトルの距離比
較の１例を説明する。この場合、識別辞書１３には、
「１」〜「４」までの文字（文字の特徴ベクトル）が登
録されているものとする。ここでは、入力文字の特徴ベ
クトルと識別辞書１３に登録されている文字の各特徴ベ
クトルの距離を「シティブロック距離」を用いて算出し
ている。ベクトル間距離が最小となるのが「２」の文字
の場合なので、入力文字の文字カテゴリを「２」と判定
する。

【００６８】前記「シティブロック距離」は次のように
定義される。すなわち、特徴ベクトルの次元数をＮ、特
徴ベクトルの番号をｉとすると、ｉ番目の特徴ベクトル
ｘ_iは、ｘ_i＝（ｘ_i1，ｘ_i2，ｘ_i3・・・ｘ_iN）と表さ
れ、ｊ番目の特徴ベクトルｘ _jは、ｘ_j＝（ｘ_j1，
ｘ_j2，ｘ_j3・・・ｘ_jN）と表される。そして、前記ベク
トルｘ_iとベクトルｘ_j間の距離ｄ(i,j) は、ｄ(i,j)
＝｜ｘ_i−ｘ_j｜と定義される。

【００６９】具体的には次の通りである。図示のよう
に、入力文字「２」の特徴ベクトルをｖｅｃｔｏｒとす
ると、ｖｅｃｔｏｒ＝（０，１，１，１，０，０，０，
１，１，１，１，１，１，０，０，０，１，１，１，
１）である。一方、識別辞書１３に登録されている文字
「１」、「２」、「３」、「４」の各の特徴ベクトルｖ
ｅｃｔｏｒ＿１、ｖｅｃｔｏｒ＿２、ｖｅｃｔｏｒ＿
３、ｖｅｃｔｏｒ＿４はそれぞれ図示の通りである。

【００７０】すなわち、文字「１」の特徴ベクトルｖｅ
ｃｔｏｒ＿１は、ｖｅｃｔｏｒ＿１＝（０，１，１，
０，０，１，１，０，０，１，１，０，０，１，１，
０，０，１，１，０）、文字「２」の特徴ベクトルｖｅ
ｃｔｏｒ＿２は、ｖｅｃｔｏｒ＿２＝（１，１，１，
１，０，０，０，１，１，１，１，１，１，０，０，
０，１，１，１，１）、文字「３」の特徴ベクトルｖｅ
ｃｔｏｒ＿３は、ｖｅｃｔｏｒ＿３＝（１，１，１，
１，０，０，０，１，１，１，１，１，０，０，０，
１，１，１，１，１）、文字「４」の特徴ベクトルｖｅ
ｃｔｏｒ＿４は、ｖｅｃｔｏｒ＿４＝（１，０，１，
０，１，０，１，０，１，１，１，１，０，０，１，
０，０，０，１，０）である。

【００７１】そこで、前記入力文字の特徴ベクトルと識
別辞書１３に登録されている各文字の特徴ベクトルとの
距離（ｄｉｓｔａｎｃｅ）を算出すると、図示の通りと
なる。すなわち、入力文字の特徴ベクトルと辞書登録文
字「１」の特徴ベクトルとの距離「ｄｉｓｔａｎｃｅ」
は、「ｄｉｓｔａｎｃｅ」＝｜ｖｅｃｔｏｒ−ｖｅｃｔ
ｏｒ＿１｜＝｜０−０｜＋｜１−１｜＋｜１−１｜＋｜
１−０｜＋｜０−０｜＋｜０−１｜＋｜０−１｜＋｜１
−０｜＋｜１−０｜＋｜１−１｜＋｜１−１｜＋｜１−
０｜＋｜１−０｜＋｜０−１｜＋｜０−１｜＋｜０−０
｜＋｜１−０｜＋｜１−１｜＋｜１−１｜＋｜１−０｜
＝１１となる。

【００７２】以下同様にして、入力文字の特徴ベクトル
と辞書登録文字「２」の特徴ベクトルとの距離「ｄｉｓ
ｔａｎｃｅ」は、「ｄｉｓｔａｎｃｅ」＝１、入力文字
の特徴ベクトルと辞書登録文字「３」の特徴ベクトルと
の距離「ｄｉｓｔａｎｃｅ」は、「ｄｉｓｔａｎｃｅ」
＝３、入力文字の特徴ベクトルと辞書登録文字「４」の
特徴ベクトルとの距離「ｄｉｓｔａｎｃｅ」は、「ｄｉ
ｓｔａｎｃｅ」＝１１となる。

【００７３】そこで前記入力文字の特徴ベクトルと辞書
登録文字の特徴ベクトルとの距離「ｄｉｓｔａｎｃｅ」
を比較すると、入力文字の特徴ベクトルと辞書登録文字
「２」の特徴ベクトルとの距離「ｄｉｓｔａｎｃｅ」＝
１が最小である。すなわち、ベクトル間距離が最小とな
るのが「２」の文字の場合なので、入力文字の文字カテ
ゴリを「２」と判定する。

【００７４】文字カテゴリ判定部１１は、以上のように
して特徴ベクトル算出部１０が算出した特徴ベクトルを
基に、識別辞書１３を参照して文字カテゴリの判定処理
を行い、全ての文字についてのカテゴリ判定結果のデー
タを全文字カテゴリ判定結果格納部１２に格納する。

【００７５】(4) ：クラスタリング処理部１５の説明・
・・図７、図８参照図７は階層的クラスタリング処理の概念図、図８はクラ
スタ統合時のクラスタ統合回数とクラスタ間距離の関係
を示した図である。クラスタリング処理部１５は、特徴
ベクトル算出部１０で算出された全ての特徴ベクトルを
対象に、文字カテゴリ毎に、階層的クラスタリング処理
を行い、全ての文字カテゴリのクラスタリング処理が終
了した時点でクラスタリング結果をクラスタリング処理
結果格納部１６に格納する。

【００７６】前記処理では、クラスタリング処理部１５
は全特徴ベクトル格納部１４から特徴ベクトルを読み出
し、クラスタリング打ち切り条件格納部１８からのクラ
スタリング打ち切り条件を使用してクラスタリング処理
を行い、クラスタリング処理結果のデータをクラスタリ
ング処理結果格納部１６に格納する。

【００７７】前記階層的クラスタリング処理とは、特徴
ベクトルのそれぞれを「変数が１つのクラスタ」と考
え、クラスタ間の距離が最も近いもの同士を統合して新
たなクラスタを作り（生成し）、以後同様にクラスタ間
距離が最も近いもの同士を統合して行く処理である。

【００７８】図示の階層的クラスタリング処理の概念図
では、「４」の文字カテゴリに判定された特徴ベクトル
に対する階層的クラスタリング処理を示している。図で
は「２」の文字が１つだけ「４」と間違って判定されて
いる。このような状態で１回目、２回目、３回目、４回
目・・・９回目、１１回目と順次階層的クラスタリング
処理を進めて行き、クラスタリング打ち切り条件を満た
すと、クラスタリング処理を打ち切る。

【００７９】クラスタ同士を統合する場合、要素数が１
つのクラスタ、すなわち、特徴ベクトル同士の距離比較
には、例えば、前記「シティブロック距離」を用いる。
要素数が複数あるクラスタ同士の距離比較には、例え
ば、「重心法」を用いる。この「重心法」とは、或るク
ラスタのｉ番目（ｉ＝１，２，３，・・・Ｍ）の特徴ベ
クトルｘ_iをｘ_i＝（ｘ_i1，ｘ_i2，ｘ_i3・・・ｘ_iN）と
表した時、そのクラスタを代表するベクトルｘｍを、そ
のクラスタ内のベクトルの平均で表し、

【００８０】

【数１】

【００８１】のように表す。そして、代表ベクトル同士
をシティブロック距離を用いて比較する方法である。図
７より明らかなように、最後までクラスタリングを行う
と誤読文字を見つけられないので、前記クラスタリング
打ち切り条件を設定する。クラスタリング打ち切り条件
としては、：最終クラスタ数が一定数（例えば、３
つ）以下になった時、：クラスタ統合時のクラスタ間
距離が予め設定した閾値以上になった時、：クラスタ
統合時のクラスタ間距離の増加率が予め設定した閾値以
上になった時、のどれかを用いる。

【００８２】なお、前記、、のクラスタリング打
ち切り条件の内から任意の１つのクラスタリング打ち切
り条件を選択し、クラスタリング打ち切り条件格納部１
８に格納しておき、クラスタリング処理部１５が前記打
ち切り条件を参照してクラスタリング処理を行う。

【００８３】前記のクラスタリング打ち切り条件での
「クラスタ間距離の閾値」としては、例えば、辞書登録
ベクトル同士間で最小となる距離値の１／３の値を用い
る。すなわち、辞書登録ベクトルをＪ_i（ｉ＝０，１，
２，・・・９）、辞書登録ベクトル間の最小距離をＬ
_min、閾値をＬ_th とすると、Ｌ_min＝min （｜Ｊ_i−
Ｊ_j｜）（ｉ＝０，１，・・・９、ｉ≠ｊ）、Ｌ_ih ＝
１／３Ｌ_minと表される。

【００８４】前記のクラスタリング打ち切り条件での
「クラスタ間距離増加率」は、階層的クラスタリングに
おいては、近いクラスタ同志を順に統合して行くため、
統合する際のクラスタ間距離は徐々に増加して行く。誤
読文字のクラスタは、正読文字のクラスタに比べて距離
が離れたところに位置するため、正読文字のクラスタ同
志を統合した場合に比べ、正読文字のクラスタと誤読文
字のクラスタを統合した場合は、クラスタ間距離の増加
率が上がる。

【００８５】そこで、クラスタ間距離増加率が上がる直
前でクラスタリングを打ち切る。閾値としては、例えば
クラスタ間距離増加率が、その前の統合時の増加率の３
倍以上となった時点とする。

【００８６】図８は、横軸がクラスタ同士を統合した回
数（クラスタ統合回数）であり、縦軸がクラスタ統合時
のクラスタ間距離を示す。また、Ｐ点は、誤読文字のク
ラスタ統合時（正読文字のクラスタと誤読文字のクラス
タを統合した時）の点を表す。図示のように、階層的ク
ラスタリングを行うにつれてクラスタ間距離が増加し、
誤読文字を統合した時（図示のＰ点参照）に急にクラス
タ間距離が増加している。

【００８７】すなわち、階層的クラスタリングにおい
て、ｉ番目のクラスタ統合時のクラスタ間距離をｄ_iと
すると、クラスタリング打ち切り条件は、（ｄ_i+1−ｄ
_i）／（ｄ_i−ｄ_i-1）＞３と表される。

【００８８】(5) ：フローチャートによるクラスタリン
グ処理の説明・・・図９参照図９はクラスタリング処理フローチャートである。以
下、図９に基づいてクラスタリング処理を説明する。な
お、Ｓ１〜Ｓ７は各処理ステップを示す。

【００８９】クラスタリング処理部１５は、全特徴ベク
トル格納部１４から特徴ベクトルを取り出しクラスタリ
ング処理を開始する。このクラスタリング処理では、先
ず、或る文字カテゴリの特徴ベクトルだけを抽出する
（Ｓ１）。そしてクラスタリング処理部１５は、クラス
タリング打ち切り条件格納部１８からクラスタリング打
ち切り条件を取り込み、内部に設定する（Ｓ２）。

【００９０】次にクラスタリング処理部１５は、全特徴
ベクトル格納部１４に格納されている全ての特徴ベクト
ルを対象にして、全クラスタ（特徴ベクトルのそれぞれ
を要素数が１つのクラスタと考える）中、最も近い２つ
のクラスタを選択する（Ｓ３）。

【００９１】そして、クラスタリング処理部１５は、ク
ラスタリング打ち切り条件を満たしているか否かを判断
し（Ｓ４）、前記クラスタリング打ち切り条件を満たし
ていない場合は、クラスタ同士を統合し（Ｓ５）、再び
全特徴ベクトル格納部前記Ｓ３の処理から繰り返す。

【００９２】その後、前記Ｓ４の処理でクラスタリング
打ち切り条件を満たしていた場合は、全文字カテゴリに
対してクラスタリング処理を行ったか否かを判断し（Ｓ
６）、全文字カテゴリに対してクラスタリング処理を行
っていない場合は、再び前記Ｓ１の処理（次の文字につ
いての処理）から繰り返す。このようにして全文字カテ
ゴリに対してクラスタリング処理を行った場合は、クラ
スタリング処理結果をクラスタリング処理結果格納部１
６へ格納して（Ｓ７）、クラスタリング処理を終了す
る。

【００９３】(6) ：文字カテゴリ判定結果修正部１７の
説明・・・図１０参照図１０は階層的クラスタリングと文字カテゴリ判定結果
修正処理概念図である。文字カテゴリ判定結果修正部１
７は、クラスタリング処理結果格納部１６に格納されて
いるクラスタリング処理結果と、全文字カテゴリ判定結
果格納部１２に格納されている全文字のカテゴリ判定結
果を基に、文字カテゴリ判定結果の修正処理を次のよう
にして行う。

【００９４】文字カテゴリ判定結果修正部１７は、文字
カテゴリ判定結果の修正処理を行う場合、クラスタリン
グ処理部１５で得られた全てのカテゴリの全てのクラス
タ（クラスタリング処理結果格納部１６に格納されてい
るデータ）について、各クラスタ間で、クラスタ間距離
を算出する。

【００９５】そして、算出したクラスタ間距離が予め設
定した或る閾値以下の場合に、そのクラスタ同士の統合
を行う。その際、クラスタ内文字カテゴリ判定部１９
は、全文字カテゴリ判定結果格納部１２に格納されてい
る全文字のカテゴリ判定結果を参照し、前記統合された
クラスタ同士の文字カテゴリが異なるか否かを判定す
る。その結果、クラスタ同士が異なるカテゴリの場合
は、文字カテゴリ判定結果修正部１７が要素数が少ない
方のクラスタの文字カテゴリを、要素数が多い方のクラ
スタの文字カテゴリに修正する。

【００９６】クラスタ統合時のクラスタ間距離の閾値と
しては、例えば、２つのクラスタの内、要素数が多い方
のクラスタ内のベクトル間距離の定数倍を用いる。すな
わち、クラスタＡ（要素数＝Ｍ）とクラスタＢ（要素数
＝Ｎ）（Ｍ＞Ｎ）を統合するかどうか判定するには以下
のようにする。クラスタＡの平均ベクトルをｘａｍ、ク
ラスタＢの平均ベクトルをｘｂｍとし、クラスタＡ内の
特徴ベクトルをｘａｉ（ｉ＝１，２，・・・Ｍ）と表す
と、Ｍ＞Ｎであるから、クラスタＡ内のベクトル間平均
距離ｄ_th は、次の式で表わされる。

【００９７】

【数２】

【００９８】クラスタ同士を統合する条件は、｜ｘａｍ
−ｘｂｍ｜＜１．５ｄ_th となる。ここでは、定数を
１．５とした。次に、図１０に基づいて前記処理を具体
的に説明する。なお、図１０のａ、ｂ、ｃ、ｄ、ｅ、
ｆ、ｇ、ｈはクラスタ識別用の番号（記号）である。こ
の例では、階層的クラスタリングの打ち切り条件は、
「各カテゴリ内の要素数が３つになった時点」とする。
先ず、文字カテゴリ判定結果修正部１７は、特徴ベクト
ルに対し、各カテゴリ内でクラスタ数が３つになるまで
クラスタリングを行う。

【００９９】次に、文字カテゴリ判定結果修正部１７
は、クラスタ間距離の近いもの同士のクラスタ統合処理
を行う。ここでは、ｂクラスタと、ｃクラスタが統合さ
れてｈクラスタになっている。ｂとｃのクラスタの文字
カテゴリは共に、「２」であるので、クラスタ統合によ
ってそれぞれの文字カテゴリが変わらない。

【０１００】また、ａクラスタとｄクラスタが統合され
てｇクラスタとなっている。ａクラスタの文字カテゴリ
は「２」で、ｄクラスタの文字カテゴリは「４」で互い
に異なる。ａクラスタの要素数がｄクラスタの要素数よ
り多いので、ｄクラスタの文字カテゴリを「４」から
「２」に修正する。

【０１０１】(7) ：フローチャートによる文字カテゴリ
判定結果修正部１７の説明・・・図１１参照図１１は文字カテゴリ判定結果修正処理フローチャート
である。以下、図１１に基づいて文字カテゴリ判定結果
修正部の処理を説明する。なお、Ｓ１１〜Ｓ１８は各処
理ステップを示す。

【０１０２】文字カテゴリ判定結果修正部１７は、文字
カテゴリ判定結果の修正処理を行う場合、クラスタリン
グ処理結果格納部１６からクラスタリング処理結果のデ
ータを入力する（Ｓ１１）。そして、クラスタリング処
理部１５で得られた全てのカテゴリの全てのクラスタに
ついて、各クラスタ間で、クラスタ間距離を算出して比
較する（Ｓ１２）。

【０１０３】その結果、前記算出したクラスタ間距離が
予め設定した閾値以下か否かを判定し（Ｓ１３）、前記
閾値以下でない場合は何もしない（リジェクトする）
が、前記算出したクラスタ間距離が前記閾値以下の場合
には、そのクラスタ同士の統合を行い（Ｓ１４）、再び
前記Ｓ１２の処理から繰り返して行う。

【０１０４】その際、クラスタ内文字カテゴリ判定部１
９は、全文字カテゴリ判定結果格納部１２に格納されて
いる全文字のカテゴリ判定結果を参照し、クラスタ内文
字カテゴリの判定処理を行う（Ｓ１５）。そして、前記
統合されたクラスタ同士の文字カテゴリが異なるか否か
を判定する（Ｓ１６）。

【０１０５】その結果、クラスタ同士が異なるカテゴリ
の場合は、文字カテゴリ判定結果修正部１７は、要素数
が少ない方のクラスタの文字カテゴリを、要素数が多い
方のクラスタの文字カテゴリに修正し（Ｓ１７）、クラ
スタ内文字について、その文字カテゴリを出力する。ま
た、前記Ｓ１６の処理で統合されたクラスタ同士の文字
カテゴリが異なっていない場合は、文字カテゴリ判定結
果修正部１７は、そのまま、クラスタ内文字について、
その文字カテゴリを出力する（Ｓ１８）。

【０１０６】

【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1) ：従来の文字認識装置に加えて、筆者毎の筆記特性
に基づいた文字認識結果修正処理を行うため、手書き文
字の文字認識を常に正確に行うことが可能である。

【０１０７】(2) ：入力された複数の文字を基に筆記特
性を算出するため、事前に筆者毎の文字サンプルを取
る、という作業が不要になる上、従来のような文字サン
プル用のメモリも不要になる。

【０１０８】(3) ：従来提案されている様々な文字認識
処理の後処理として本願発明の文字認識装置による処理
を追加することができるため、従来の文字認識処理自体
は変更する必要がなく、インプリメントも容易である。

【０１０９】(4) ：各文字カテゴリ毎にクラスタリング
処理を行うため、筆者の筆記特性を反映した文字特徴を
捕らえ易く、従来の処理で誤って認識された文字を容易
に修正することが可能である。また、階層的クラスタリ
ングを用いることで、近傍のクラスタ同士が段階的に統
合されて行くので、結果的に離れて位置するクラスタだ
けを抽出し易くなり、誤読文字だけからなるクラスタを
抽出しやすい。更に、同じ理由で、誤読された文字を正
読文字に修正することができない場合でも、クラスタ間
距離を基に、リジェクト判定することができる。

【０１１０】(5) ：文字カテゴリ内で特徴ベクトルに対
するクラスタリング処理を行って複数のクラスタを生成
する際に、階層的クラスタリングを用いて、カテゴリ内
のクラスタが或る一定数になった時点でクラスタリング
処理を打ち切っている。従って、クラスタリング打ち切
り基準が単純であるため、本願発明による処理の追加が
容易であり、高速な処理を行うことが可能である。

【０１１１】(6) ：文字カテゴリ内で特徴ベクトルに対
するクラスタリング処理を行って複数のクラスタを生成
する際に、階層的クラスタリングにおけるクラスタ統合
時のクラスタ間距離が或る閾値以上になった時点でクラ
スタリング処理を打ち切っている。このようにクラスタ
間距離に基づいてクラスタリングを行うため、クラスタ
のまとまりをより正確に求めることが可能になる。

【０１１２】(7) ：文字カテゴリ内で特徴ベクトルに対
するクラスタリング処理を行って複数のクラスタを生成
する際に、階層的クラスタリングにおけるクラスタ統合
時のクラスタ間距離の増加率が或る閾値以上になった時
点でクラスタリング処理を打ち切っている。このように
すれば、文字カテゴリ毎に文字特徴ベクトルの分布のば
らつき具合が異なる場合でも、クラスタ統合時における
クラスタ間距離の増加率を用いているため、クラスタの
ばらつきに応じて、クラスタのまとまりをより正確に求
めることが可能である。

【０１１３】前記効果の外、各請求項に対応して次のよ
うな効果がある。 (8) ：請求項１では、クラスタリング処理手段は特徴ベ
クトル算出手段で算出した全ての特徴ベクトルに対して
類似度の高いもの同士をクラスタとして順次統合して行
くクラスタリング処理を行い、文字カテゴリ判定結果修
正手段はクラスタリング処理手段によるクラスタリング
処理結果を文字カテゴリ判定手段による文字カテゴリ判
定結果と比較して前記文字カテゴリ判定結果を修正し、
修正結果を出力する。

【０１１４】以上のようにして、従来の文字認識処理に
加えて、筆者毎の筆記特性に基づいた文字認識結果修正
処理を行うため、文字認識を正確に行うことが可能であ
り、入力された複数の文字を基に筆記特性を算出するた
め、事前に筆者毎の文字サンプルを取る、という作業が
不要になる上、文字サンプル用のメモリも不要になる。
更に、従来提案されている様々な文字認識処理の後処理
として本願発明の処理を追加することができるため、従
来の文字認識処理自体は変更する必要がなく、インプリ
メントも容易になる。

【０１１５】また、各文字カテゴリ毎にクラスタリング
処理を行うため、筆者の筆記特性を反映した文字特徴を
捕らえ易く、従来の処理で誤って認識された文字を容易
に修正することが可能である。

【０１１６】(9) ：請求項２では、クラスタ統合手段が
クラスタリング処理部の処理結果から全カテゴリの全ク
ラスタを対象に各クラスタ間の距離比較を行い、クラス
タ間距離が予め設定した閾値以下となるクラスタ同士を
統合する。そして、クラスタ内文字カテゴリ判定手段
は、文字カテゴリ判定部が判定した全文字カテゴリ判定
結果を基に、クラスタ統合手段で統合されたクラスタ同
士の文字カテゴリが異なるか否かを判定する。

【０１１７】そして、文字カテゴリ修正手段は、前記ク
ラスタ内文字カテゴリ判定手段により統合されたクラス
タが異なる文字カテゴリ同士と判定された場合、クラス
タ内要素が少ない方のクラスタについてその文字カテゴ
リを統合相手の文字カテゴリに修正する。

【０１１８】この場合、前記クラスタリング処理により
各文字カテゴリ毎にクラスタリング処理を行い、その結
果のデータを用いて前記修正処理を行うので、筆者の筆
記特性を反映した文字特徴を捕らえ易く、従来の処理で
誤って認識された文字を容易に修正することが可能であ
る。

【０１１９】また、前記階層的クラスタリング処理で
は、近傍のクラスタ同士が段階的に統合されて行くの
で、結果的に離れて位置するクラスタだけを抽出し易く
なり、誤読文字だけからなるクラスタを抽出し易い。こ
のため、前記クラスタリング処理結果から誤読文字の修
正を行うことが容易になる。更に、同じ理由で、誤読さ
れた文字を正読文字に修正することができない場合で
も、クラスタ間距離を基に、リジェクト判定することが
できる。

【０１２０】(10)：請求項３では、階層的クラスタリン
グ処理手段が文字カテゴリ内で特徴ベクトルに対する階
層的クラスタリング処理を行うことで、特徴ベクトルに
対して類似度の高いもの同士をクラスタとして順次統合
して行く。そして、前記階層的クラスタリング処理手段
により階層的クラスタリング処理を行って、カテゴリ内
のクラスタ数が予め設定された一定数に達した際、クラ
スタリング打ち切り手段が階層的クラスタリング処理を
打ち切る。

【０１２１】このようにすれば、クラスタリング打ち切
り基準が単純であるため、前記クラスタリング打ち切り
手段の追加が容易であり、高速な処理を行うことが可能
である。

【０１２２】(11)：請求項４では、階層的クラスタリン
グ処理手段が文字カテゴリ内で特徴ベクトルに対する階
層的クラスタリング処理を行うことで、特徴ベクトルに
対して類似度の高いもの同士をクラスタとして順次統合
して行く。そして前記階層的クラスタリング処理手段に
よる階層的クラスタリング処理を行って、階層的クラス
タリングによるクラスタ統合時のクラスタ間距離が或る
閾値以上になった時点でクラスタリング打ち切り手段が
クラスタリングを打ち切る。このようにクラスタ間距離
に基づいてクラスタリングを行うため、クラスタのまと
まりをより正確に求めることが可能になる。

【０１２３】(12)：請求項５では、階層的クラスタリン
グ処理手段が文字カテゴリ内で特徴ベクトルに対する階
層的クラスタリング処理を行うことで、特徴ベクトルに
対して類似度の高いもの同士をクラスタとして順次統合
して行く。そして、前記階層的クラスタリング処理手段
による階層的クラスタリング処理を行って、階層的クラ
スタリングによるクラスタ統合時のクラスタ間距離の増
加率が或る閾値以上になった時点でクラスタリング打ち
切り手段がクラスタリングを打ち切る。

【０１２４】このようにすれば、文字カテゴリ毎に文字
特徴ベクトルの分布のばらつき具合が異なる場合でも、
クラスタ統合時にクラスタ間距離の増加率を用いている
ため、クラスタのばらつきに応じて、クラスタのまとま
りをより正確に求めることが可能である。

【図面の簡単な説明】

【図１】本発明の原理説明図である。

【図２】実施の形態の装置構成図である。

【図３】実施の形態における文書例１である。

【図４】実施の形態における文書例２である。

【図５】実施の形態における特徴ベクトル算出例であ
る。

【図６】実施の形態における文字カテゴリ判定例であ
る。

【図７】実施の形態における階層的クラスタリング処理
の概念図である。

【図８】実施の形態におけるクラスタ統合時のクラスタ
統合回数とクラスタ間距離の関係を示した図である。

【図９】実施の形態におけるクラスタリング処理フロー
チャートである。

【図１０】実施の形態における階層的クラスタリングと
文字カテゴリ判定結果修正処理概念図である。

【図１１】実施の形態における文字カテゴリ判定結果修
正処理フローチャートである。

【符号の説明】

１イメージスキャナ２文字認識部６イメージデータ格納部７同一筆者記入領域抽出部８同一筆者記入領域格納部９文字切り出し部１０特徴ベクトル算出部１１文字カテゴリ判定部１２全文字カテゴリ判定結果格納部１３識別辞書１４全特徴ベクトル格納部１５クラスタリング処理部１６クラスタリング処理結果格納部１７文字カテゴリ判定結果修正部１８クラスタリング打ち切り条件格納部１９クラスタ内文字カテゴリ判定部

フロントページの続き (56)参考文献特開平６−187499（ＪＰ，Ａ) 特開平２−300989（ＪＰ，Ａ) 川谷隆彦，筆記個人性を用いた手書き数字認識の改善，電子情報通信学会論文誌，日本，電子情報通信学会，1995年７月25日，Ｄ−２Ｖｏｌ．Ｊ78−Ｄ−２Ｎｏ．７，ｐ．1047−1057 川谷隆彦宮本信夫，認識結果を用いた手書き数字字形の数量化とその応用, 電子情報通信学会論文誌，日本，電子情報通信学会，1991年３月25日，Ｄ−２Ｖｏｌ．Ｊ74−Ｄ−２Ｎｏ．３，ｐ. 357−365 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/03 - 9/62 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】文書のイメージデータから手書き文字の認
識処理を行う文字認識装置において、前記文書のイメージデータから同一筆者によって記入さ
れた領域を抽出する同一筆者記入領域抽出手段と、前記
同一筆者記入領域抽出手段が抽出した領域内の全ての文
字に対し各文字毎に文字の特徴ベクトルを算出する特徴
ベクトル算出手段と、前記特徴ベクトル算出手段によっ
て算出された各文字毎の特徴ベクトルと辞書に登録され
た特徴ベクトルとの距離比較に基づいて各文字の文字カ
テゴリを判定する文字カテゴリ判定手段と、前記特徴ベ
クトル算出手段で算出した全ての特徴ベクトルに対して
類似度の高いもの同士をクラスタとして順次統合して行
くクラスタリング処理を行うクラスタリング処理手段
と、前記クラスタリング処理手段によるクラスタリング
処理結果を前記文字カテゴリ判定手段による文字カテゴ
リ判定結果と比較して前記文字カテゴリ判定結果を修正
する文字カテゴリ判定結果修正手段を備えていることを
特徴とした文字認識装置。
【請求項２】前記文字カテゴリ判定結果修正手段は、前
記クラスタリング処理手段の処理結果から、全カテゴリ
の全クラスタを対象に各クラスタ間の距離比較を行い、
クラスタ間距離が予め設定した閾値以下となるクラスタ
同士を統合するクラスタ統合手段と、前記文字カテゴリ判定手段が判定した全文字カテゴリ判
定結果を基に、前記クラスタ統合手段で統合されたクラ
スタ同士の文字カテゴリが異なるか否かを判定するクラ
スタ内文字カテゴリ判定手段と、前記クラスタ内文字カテゴリ判定手段により前記統合さ
れたクラスタが異なる文字カテゴリ同士と判定された場
合、クラスタ内要素が少ない方のクラスタについてその
文字カテゴリを統合相手の文字カテゴリに修正する文字
カテゴリ修正手段を備えていることを特徴とした請求項
１記載の文字認識装置。
【請求項３】前記クラスタリング処理手段は、文字カテ
ゴリ内で特徴ベクトルに対する階層的クラスタリング処
理を行うことで、特徴ベクトルに対して類似度の高いも
の同士をクラスタとして順次統合して行く階層的クラス
タリング処理手段と、前記階層的クラスタリング処理手段による階層的クラス
タリング処理を行って、カテゴリ内のクラスタ数が予め
設定された一定数に達した際、前記階層的クラスタリン
グ処理を打ち切るクラスタリング打ち切り手段を備えて
いることを特徴とした請求項１記載の文字認識装置。
【請求項４】前記クラスタリング処理手段は、文字カテ
ゴリ内で特徴ベクトルに対する階層的クラスタリング処
理を行うことで、特徴ベクトルに対して類似度の高いも
の同士をクラスタとして順次統合して行く階層的クラス
タリング処理手段と、前記階層的クラスタリング処理手段による階層的クラス
タリング処理を行って、階層的クラスタリングによるク
ラスタ統合時のクラスタ間距離が或る閾値以上になった
時点でクラスタリングを打ち切るクラスタリング打ち切
り手段を備えていることを特徴とした請求項１記載の文
字認識装置。
【請求項５】前記クラスタリング処理手段は、文字カテ
ゴリ内で特徴ベクトルに対する階層的クラスタリング処
理を行うことで、特徴ベクトルに対して類似度の高いも
の同士をクラスタとして順次統合して行く階層的クラス
タリング処理手段と、前記階層的クラスタリング処理手段による階層的クラス
タリング処理を行って、階層的クラスタリングによるク
ラスタ統合時のクラスタ間距離の増加率が或る閾値以上
になった時点でクラスタリングを打ち切るクラスタリン
グ打ち切り手段を備えていることを特徴とした請求項１
記載の文字認識装置。