JP3281530B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3281530B2
JP3281530B2 JP03021796A JP3021796A JP3281530B2 JP 3281530 B2 JP3281530 B2 JP 3281530B2 JP 03021796 A JP03021796 A JP 03021796A JP 3021796 A JP3021796 A JP 3021796A JP 3281530 B2 JP3281530 B2 JP 3281530B2
Authority
JP
Japan
Prior art keywords
character
cluster
feature vector
clustering
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03021796A
Other languages
English (en)
Other versions
JPH09223196A (ja
Inventor
悦伸 堀田
聡 直井
美佐子 諏訪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03021796A priority Critical patent/JP3281530B2/ja
Priority to US08/801,139 priority patent/US6345119B1/en
Priority to DE69732156T priority patent/DE69732156D1/de
Priority to EP97301064A priority patent/EP0790574B1/en
Priority to KR1019970004938A priority patent/KR100249055B1/ko
Publication of JPH09223196A publication Critical patent/JPH09223196A/ja
Application granted granted Critical
Publication of JP3281530B2 publication Critical patent/JP3281530B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、手書きした文書を
イメージスキャナで光学的に読み取ってイメージデータ
を生成し、そのイメージデータから手書き文字の認識処
理を行う文字認識装置(OCR)に関する。近年、手書
き用の入力周辺機器として手書き文字認識装置、すなわ
ちOCRの需要が増加している。前記手書き文字認識装
置の実用化を考えた場合、非常に高い認識率が必要とさ
れる。一般に文字認識装置では、入力文字と事前登録さ
れた文字辞書とを照合して文字の認識を行う。
【0002】しかし、文字辞書を汎用に作成しているた
めに、個人毎に癖のある文字変動を完全に吸収すること
は困難であり、文字認識率の低下を招いていた。本願発
明はこのような問題に対処するものであり、文字認識処
理の際に個人の筆記特性を考慮することにより、高い文
字認識率を実現するものである。
【0003】なお、本願発明は、手書き文字認識装置
(ハードウェア構成の装置)だけでなく、手書き文字認
識ソフトウェア(コンピュータ内で処理する文字認識用
のプログラム)など、広い意味での手書き文字認識技術
に関する。また、個人の筆記特性を利用する処理上、1
枚の文書中にある程度以上の文字数が同一筆者によって
記入されている必要があり、そのような条件を満たす文
書としては、仕入れ伝票、販売原票などのOCR用の伝
票がある。
【0004】
【従来の技術】以下、従来例ついて説明する。従来、手
書き文字の認識処理を行う手書き文字認識装置として各
種の装置が知られていた。前記文字認識装置の内、筆者
毎の筆記特性を利用する装置としては、予め筆者毎の文
字サンプルをとり、それに基づいて筆者毎の文字辞書を
作成する手書文字認識装置が知られていた(特開昭58
−094064号公報参照)。
【0005】また、予め、筆者毎の文字サンプルをと
り、それに基づいて文字特徴要素算出時に、筆者毎の補
正を加える手書文字認識装置が知られていた(特開昭6
0−031683号公報参照)。
【0006】
【発明が解決しようとする課題】前記のような従来のも
のにおいては、次のような課題があった。 (1) :前記筆者毎の文字サンプルをとり、それに基づい
て筆者毎の文字辞書を作成したり、文字特徴要素を算出
する装置では、ユーザが文字認識装置、或いは文字認識
ソフトウェアを用いる前に、文字サンプルを登録する作
業が必要であり、余計な手間と時間がかかる。
【0007】(2) :前記従来の文字認識装置では、個人
の筆記特性も年月の経過と共に少しずつ変わって行くこ
とが予想されるため、高い認識率を維持し続けるために
は、或る特定の期間毎に文字サンプルを再登録する作業
が必要である。このため、余計な手間と時間がかかり、
効率の悪い装置となる。
【0008】(3) :前記従来の文字認識装置では、使用
ユーザ数が多い場合は、筆者毎に文字辞書或いは文字特
徴算出補正パラメータを保持する必要上、ハードウェア
的には使用するメモリ量が多くなり、装置がコスト高と
なる。
【0009】本発明は、このような従来の課題を解決
し、手書き文字認識処理を行う際に、予め筆者毎の筆記
特性を登録するなどの事前の処理を不要とし、常に正確
で効率の良い手書き文字認識処理ができるようにするこ
とを目的とする。
【0010】
【課題を解決するための手段】図1は本発明の原理説明
図である。本発明は前記の目的を達成するため、次のよ
うに構成した。 (1) :文書のイメージデータから手書き文字の認識処理
を行う文字認識装置において、イメージスキャナ1から
出力された文書のイメージデータを格納するイメージデ
ータ格納部6と、同一筆者記入領域抽出部7(同一筆者
記入領域抽出手段)と、同一筆者記入領域格納部8と、
文字切り出し部9と、特徴ベクトル算出部10(特徴ベ
クトル算出手段)と、文字カテゴリ判定部11(文字カ
テゴリ判定手段)と、全文字カテゴリ判定結果格納部1
2と、識別辞書13と、全特徴ベクトル格納部14と、
クラスタリング処理部15(クラスタリング処理手段)
と、クラスタリング処理結果格納部16と、文字カテゴ
リ判定結果修正部17(文字カテゴリ判定結果修正手
段)を設けた。
【0011】(2) :文書のイメージデータから手書き文
字の認識処理を行う文字認識装置において、前記文書の
イメージデータから同一筆者によって記入された領域を
抽出する同一筆者記入領域抽出部7と、同一筆者記入領
域抽出部7が抽出した領域内の全ての文字に対し各文字
毎に文字の特徴ベクトルを算出する特徴ベクトル算出部
10と、特徴ベクトル算出部10によって算出された各
文字毎の特徴ベクトルと識別辞書13に登録された特徴
ベクトルとの距離比較に基づいて各文字の文字カテゴリ
を判定する文字カテゴリ判定部11と、特徴ベクトル算
出部10で算出した全ての特徴ベクトルに対して類似度
の高いもの同士をクラスタとして順次統合して行くクラ
スタリング処理を行うクラスタリング処理部15と、ク
ラスタリング処理部15によるクラスタリング処理結果
を文字カテゴリ判定手段11による文字カテゴリ判定結
果と比較して文字カテゴリ判定結果を修正する文字カテ
ゴリ判定結果修正部17を備えている。
【0012】(3) :前記(2) の文字認識装置において、
文字カテゴリ判定結果修正手段17は、クラスタリング
処理手段15の処理結果から、全カテゴリの全クラスタ
を対象に各クラスタ間の距離比較を行い、クラスタ間距
離が予め設定した閾値以下となるクラスタ同士を統合す
るクラスタ統合手段と、文字カテゴリ判定部11が判定
した全文字カテゴリ判定結果を基に、クラスタ統合手段
で統合されたクラスタ同士の文字カテゴリが異なるか否
かを判定するクラスタ内文字カテゴリ判定手段と、クラ
スタ内文字カテゴリ判定手段により前記統合されたクラ
スタが異なる文字カテゴリ同士と判定された場合、クラ
スタ内要素が少ない方のクラスタについてその文字カテ
ゴリを統合相手の文字カテゴリに修正する文字カテゴリ
修正手段を備えている。
【0013】(4) :前記(2) の文字認識装置において、
クラスタリング処理部15は、文字カテゴリ内で特徴ベ
クトルに対する階層的クラスタリング処理を行うこと
で、特徴ベクトルに対して類似度の高いもの同士をクラ
スタとして順次統合して行く階層的クラスタリング処理
手段と、前記階層的クラスタリング処理手段による階層
的クラスタリング処理を行って、カテゴリ内のクラスタ
数が予め設定された一定数に達した際、前記階層的クラ
スタリング処理を打ち切るクラスタリング打ち切り手段
を備えている。
【0014】(5) :前記(2) の文字認識装置において、
クラスタリング処理部15は、文字カテゴリ内で特徴ベ
クトルに対する階層的クラスタリング処理を行うこと
で、特徴ベクトルに対して類似度の高いもの同士をクラ
スタとして順次統合して行く階層的クラスタリング処理
手段と、前記階層的クラスタリング処理手段による階層
的クラスタリング処理を行って、階層的クラスタリング
によるクラスタ統合時のクラスタ間距離が或る閾値以上
になった時点でクラスタリングを打ち切るクラスタリン
グ打ち切り手段を備えている。
【0015】(6) :前記(2) の文字認識装置において、
クラスタリング処理部15は、文字カテゴリ内で特徴ベ
クトルに対する階層的クラスタリング処理を行うこと
で、特徴ベクトルに対して類似度の高いもの同士をクラ
スタとして順次統合して行く階層的クラスタリング処理
手段と、前記階層的クラスタリング処理手段による階層
的クラスタリング処理を行って、階層的クラスタリング
によるクラスタ統合時のクラスタ間距離の増加率が或る
閾値以上になった時点でクラスタリングを打ち切るクラ
スタリング打ち切り手段を備えている。
【0016】(作用)前記構成に基づく本発明の作用
を、図1に基づいて説明する。 :前記(1) の作用 イメージスキャナ1では手書き文字を有する文書を光学
的に読み取り、2値のイメージデータを生成して出力す
る。前記イメージスキャナ1から出力されたイメージデ
ータはイメージデータ格納部6に格納する。その後、同
一筆者記入領域抽出部7はイメージデータ格納部6に格
納されているイメージデータから、同一筆者が記入した
領域のイメージデータを抽出し、同一筆者記入領域格納
部8に格納する。
【0017】その後、文字切り出し部9は同一筆者記入
領域格納部8に格納されている同一筆者が記入した領域
のイメージデータから、1文字分の領域を切り出し、特
徴ベクトル算出部10へ出力する。特徴ベクトル算出部
10は、文字切り出し部9が切り出したイメージデータ
から特徴ベクトルを算出する。この時、前記算出された
特徴ベクトルは全特徴ベクトル格納部14へ格納すると
共に、文字カテゴリ判定部11へ出力する。
【0018】文字カテゴリ判定部11は、特徴ベクトル
算出部10が算出した特徴ベクトルを基に、識別辞書1
3を参照して文字カテゴリの判定処理を行い、判定結果
を全文字カテゴリ判定結果格納部12に格納する。ま
た、クラスタリング処理部15は、全特徴ベクトル格納
部14に格納されている全ての特徴ベクトルを対象に、
文字カテゴリ毎に階層的クラスタリング処理を行い、ク
ラスタリング処理結果をクラスタリング処理結果格納部
16に格納する。
【0019】次に、文字カテゴリ判定結果修正部17
は、クラスタリング処理結果格納部16に格納されてい
るクラスタリング処理結果と、全文字カテゴリ判定結果
格納部12に格納されている全文字のカテゴリ判定結果
を基に、文字カテゴリ判定結果の修正処理を行う。そし
て、修正結果を出力する。
【0020】以上のようにして、従来の文字認識装置に
加えて筆者毎の筆記特性に基づいた文字認識結果修正処
理を行うため、文字認識を正確に行うことが可能であ
る。また、入力された複数の文字を基に筆記特性を算出
するため、事前に筆者毎の文字サンプルを取る、という
作業が不要になる上、文字サンプル用のメモリも不要に
なる。更に、従来提案されている様々な文字認識処理の
後処理として本願発明の処理を追加することができるた
め、従来の文字認識処理自体は変更する必要がなく、イ
ンプリメントも容易になる。
【0021】:前記(2) の作用 同一筆者記入領域抽出部7はイメージデータ格納部6に
格納されている文書のイメージデータから同一筆者によ
って記入された領域を抽出し、特徴ベクトル算出部10
は同一筆者記入領域抽出部7が抽出した領域内の全ての
文字に対し各文字毎に文字の特徴ベクトルを算出し、文
字カテゴリ判定部11は特徴ベクトル算出部10によっ
て算出された各文字毎の特徴ベクトルと識別辞書13に
登録された特徴ベクトルとの距離比較に基づいて各文字
の文字カテゴリを判定する。
【0022】また、クラスタリング処理部15は特徴ベ
クトル算出部10で算出した全ての特徴ベクトルに対し
て類似度の高いもの同士をクラスタとして順次統合して
行くクラスタリング処理を行い、文字カテゴリ判定結果
修正部17はクラスタリング処理部15によるクラスタ
リング処理結果を文字カテゴリ判定部11による文字カ
テゴリ判定結果と比較して文字カテゴリ判定結果を修正
し、修正結果を出力する。
【0023】以上のようにして、従来の文字認識装置に
加えて筆者毎の筆記特性に基づいた文字認識結果修正処
理を行うため、文字認識を正確に行うことが可能であ
り、入力された複数の文字を基に筆記特性を算出するた
め、事前に筆者毎の文字サンプルを取る、という作業が
不要になる上、文字サンプル用のメモリも不要になる。
また、従来提案されている様々な文字認識処理の後処理
として本願発明の処理を追加することができるため、従
来の文字認識処理自体は変更する必要がなく、インプリ
メントも容易になる。
【0024】更に、各文字カテゴリ毎にクラスタリング
処理を行うため、筆者の筆記特性を反映した文字特徴を
捕らえ易く、従来の処理で誤って認識された文字を容易
に修正することが可能である。
【0025】:前記(3) の作用 文字カテゴリ判定結果修正部17では、クラスタ統合手
段がクラスタリング処理部15の処理結果から全カテゴ
リの全クラスタを対象に各クラスタ間の距離比較を行
い、クラスタ間距離が予め設定した閾値以下となるクラ
スタ同士を統合する。次に、クラスタ内文字カテゴリ判
定手段は、文字カテゴリ判定部11が判定した全文字カ
テゴリ判定結果を基に、クラスタ統合手段で統合された
クラスタ同士の文字カテゴリが異なるか否かを判定す
る。
【0026】そして、文字カテゴリ修正手段は、前記ク
ラスタ内文字カテゴリ判定手段により統合されたクラス
タが異なる文字カテゴリ同士と判定された場合、クラス
タ内要素が少ない方のクラスタについてその文字カテゴ
リを統合相手の文字カテゴリに修正する。
【0027】この場合、前記クラスタリング処理により
各文字カテゴリ毎にクラスタリング処理を行い、その結
果のデータを用いて前記修正処理を行うので、筆者の筆
記特性を反映した文字特徴を捕らえ易く、従来の処理で
誤って認識された文字を容易に修正することが可能であ
る。
【0028】また、前記クラスタリング処理では、近傍
のクラスタ同士が段階的に統合されて行くので、結果的
に離れて位置するクラスタだけを抽出し易くなり、誤読
文字だけからなるクラスタを抽出し易い。このため、前
記クラスタリング処理結果から誤読文字の修正を行うこ
とが容易になる。
【0029】:前記(4) の作用 クラスタリング処理部15では、先ず、階層的クラスタ
リング処理手段が文字カテゴリ内で特徴ベクトルに対す
る階層的クラスタリング処理を行うことで、特徴ベクト
ルに対して類似度の高いもの同士をクラスタとして順次
統合して行く。そして、前記階層的クラスタリング処理
手段により階層的クラスタリング処理を行って、カテゴ
リ内のクラスタ数が予め設定された一定数に達した際、
クラスタリング打ち切り手段が階層的クラスタリング処
理を打ち切る。
【0030】このようにすれば、クラスタリング打ち切
り基準が単純であるため、前記クラスタリング打ち切り
手段の追加が容易であり、高速な処理を行うことが可能
である。
【0031】:前記(5) の作用 クラスタリング処理部15では、階層的クラスタリング
処理手段が文字カテゴリ内で特徴ベクトルに対する階層
的クラスタリング処理を行うことで、特徴ベクトルに対
して類似度の高いもの同士をクラスタとして順次統合し
て行く。そして前記階層的クラスタリング処理手段によ
る階層的クラスタリング処理を行って、階層的クラスタ
リングによるクラスタ統合時のクラスタ間距離が或る閾
値以上になった時点でクラスタリング打ち切り手段がク
ラスタリングを打ち切る。このように、クラスタ間距離
に基づいてクラスタリングを行うため、クラスタのまと
まりをより正確に求めることが可能になる。
【0032】:前記(6) の作用 クラスタリング処理部15では、先ず、階層的クラスタ
リング処理手段が文字カテゴリ内で特徴ベクトルに対す
る階層的クラスタリング処理を行うことで、特徴ベクト
ルに対して類似度の高いもの同士をクラスタとして順次
統合して行く。そして、前記階層的クラスタリング処理
手段による階層的クラスタリング処理を行って、階層的
クラスタリングによるクラスタ統合時のクラスタ間距離
の増加率が或る閾値以上になった時点でクラスタリング
打ち切り手段がクラスタリングを打ち切る。
【0033】このようにすれば、文字カテゴリ毎に文字
特徴ベクトルの分布のばらつき具合が異なる場合でも、
クラスタ統合時におけるクラスタ間距離の増加率を用い
ているため、クラスタのばらつきに応じて、クラスタの
まとまりをより正確に求めることが可能である。その結
果、常に正確な文字カテゴリの修正が可能となる。
【0034】
【発明の実施の形態】以下、発明の実施の形態を図面に
基づいて詳細に説明する。 §1:本実施の形態における装置の説明・・・図2参照 図2は実施の形態の装置構成図である。図示のように、
本実施の形態の装置には、イメージスキャナ1と文字認
識部2を設ける。この場合、イメージスキャナ1は、文
字認識装置(ハードウェア構成の専用の装置)に内蔵し
たスキャナでも良いし、文字認識装置(ハードウェア構
成の専用の装置)にケーブルで接続可能な単独のスキャ
ナでも良いし、パーソナルコンピュータ、ワークステー
ション等の汎用の情報処理装置に内蔵したスキャナでも
良いし、前記汎用の情報処理装置にケーブルで接続可能
な単独のスキャナでも良い。
【0035】また、前記文字認識部2は、前記文字認識
装置(ハードウェア構成の専用の装置)に内蔵した文字
認識部でも良いし、前記パーソナルコンピュータ等の汎
用の情報処理装置に内蔵した文字認識部(手書き文字認
識ソフトウェアのみ)でも良い。
【0036】前記文字認識部2には、イメージデータ受
信部5、イメージデータ格納部6、同一筆者記入領域抽
出部7、同一筆者記入領域格納部8、文字切り出し部
9、特徴ベクトル算出部10、文字カテゴリ判定部1
1、全文字カテゴリ判定結果格納部12、識別辞書1
3、全特徴ベクトル格納部14、クラスタリング処理部
15、クラスタリング処理結果格納部16、文字カテゴ
リ判定結果修正部17、クラスタリング打ち切り条件格
納部18等が設けてある。また、前記文字カテゴリ判定
結果修正部17にはクラスタ内文字カテゴリ判定部19
が設けてある。前記各部の機能等は次の通りである。
【0037】(1) :イメージスキャナ1は手書き文字を
含む文書を光学的に読み取り、2値のイメージデータを
生成して出力するものである。 (2) :文字認識部2はイメージスキャナ1から出力され
たイメージデータから文字認識処理により手書き文字の
認識処理を行うものである。
【0038】(3) :イメージデータ受信部5はイメージ
スキャナ1から出力されたイメージデータを受信してイ
メージデータ格納部6に格納する処理を行うものであ
る。 (4) :イメージデータ格納部6はイメージスキャナ1か
ら出力されたイメージデータを格納しておくメモリであ
る。
【0039】(5) :同一筆者記入領域抽出部7はイメー
ジデータ格納部6に格納されているイメージデータから
同一筆者が記入した領域を抽出し、同一筆者記入領域格
納部8に格納する処理を行うものである。
【0040】(6) :同一筆者記入領域格納部8は同一筆
者記入領域抽出部7が抽出した同一筆者記入領域のイメ
ージデータを格納しておくメモリである。 (7) :文字切り出し部9は同一筆者記入領域格納部8に
格納されている同一筆者記入領域のイメージデータか
ら、1文字分のデータを切り出す処理を行うものであ
る。
【0041】(8) :特徴ベクトル算出部10は同一筆者
記入領域格納部8に格納されている全ての文字に対し、
文字切り出し部9が切り出した各文字毎に特徴ベクトル
を算出するものである。
【0042】(9) :文字カテゴリ判定部11は特徴ベク
トル算出手段10が算出した各特徴ベクトルと識別辞書
13に登録されている辞書登録ベクトルとの距離比較に
基づいて、各文字カテゴリを判定するものである。
【0043】(10):全文字カテゴリ判定結果格納部12
は文字カテゴリ判定部11が判定した結果のデータを格
納するメモリである。 (11):識別辞書13は、予め学習パターンを用いて各カ
テゴリ(1つの文字)毎に特徴ベクトルを算出し、この
特徴ベクトルを辞書ベクトルとして登録したものであ
る。
【0044】(12):全特徴ベクトル格納部14は特徴ベ
クトル算出部10が算出した全てのカテゴリ(文字)の
特徴ベクトルを格納するメモリである。 (13):クラスタリング処理部15は特徴ベクトル算出部
10が算出した全ての特徴ベクトルに対してクラスタリ
ング処理(階層的クラスタリング処理)を行うものであ
る。
【0045】(14):クラスタリング処理結果格納部16
はクラスタリング処理部15が処理した結果のデータを
格納するメモリである。 (15):文字カテゴリ判定結果修正部17は前記クラスタ
リング処理結果と、文字カテゴリ判定部11が判定した
各文字の文字カテゴリを比較し、文字カテゴリ判定結果
を修正するものである(誤読文字の修正)。
【0046】(16):クラスタリング打ち切り条件格納部
18は、予めクラスタリング打ち切り条件を格納してお
くメモリである。 (17):クラスタ内文字カテゴリ判定部19は全文字カテ
ゴリ判定結果格納部12に格納されている全文字カテゴ
リを参照し、統合されたクラスタ同士の文字カテゴリが
異なるか否かについて、クラスタ内文字カテゴリの判定
処理を行うものである。
【0047】なお、前記構成の内、クラスタリング処理
部15、文字カテゴリ判定結果修正部17、クラスタリ
ング打ち切り条件格納部18、クラスタ内文字カテゴリ
判定部19は本願発明に特有の処理を行うものである
が、それ以外の各部(符号5、7、9、10、11、1
3等で示される各部)は、それぞれ従来の装置に使用さ
れていたものである。
【0048】§2:処理対象の手書き文字文書例の説明
・・・図3、図4参照 図3は文書例1、図4は文書例2である。イメージスキ
ャナ1による読み取り対象の手書き文字文書として、例
えば、図3に示した文書例1、或いは図4に示した文書
例2などがある。これらの文書は、クラスタリング処理
部15によるクラスタリング処理では統計的処理を行う
ため、手書き文字文書中にはある程度以上の手書き文字
の文字数が有るものである。
【0049】前記文書例1は、例えば、商品の仕入れ伝
票等に使用されるものであり、「金額記入欄」と「筆者
番号記入欄」等が設けてある。そして、この伝票を使用
する場合は、前記「筆者番号記入欄」に筆者番号(この
例では0321)を記入し、前記「金額記入欄」にはそ
れぞれ商品毎の金額を手書きにより記入する。この文書
例1は、1枚の文書に一人の筆者が金額を記入するもの
である。
【0050】また、前記文書例2は、「販売原票」の例
であり、例えば、複数の商品を販売する際に使用するも
のである。この「販売原票」には、各商品毎の品名、単
価、買受人、数量の各欄が設けてあり、それぞれ手書き
により文字を記入するようになっている。また、「販売
原票」の下端には前記文字を手書きにより記入した担当
者の氏名(日本太郎)等を記入するようになっている。
【0051】§3:文字認識処理の概要説明 クラスタリング処理部15によるクラスタリング処理で
は統計的処理を行うため、前記のような手書き文字文書
中にはある程度以上の手書き文字の文字数が有るものと
する。また、文字認識処理の対象とするイメージデータ
(画像イメージデータ)は、雑音除去や文書の傾き補正
等の前処理がなされているものとする。更に、文字切り
出し部9による文字切り出し処理では、各文字が正確に
1文字ずつ切り出されるものとする。
【0052】イメージスキャナ1では手書き文字文書を
光学的に読み取り、2値のイメージデータを生成して出
力する。前記イメージスキャナ1から出力されたイメー
ジデータはイメージデータ受信部5が受信しイメージデ
ータ格納部6に格納する。その後、同一筆者記入領域抽
出部7はイメージデータ格納部6に格納されているイメ
ージデータから、同一筆者が記入した領域のイメージデ
ータを抽出し、同一筆者記入領域格納部8に格納する。
【0053】その後、文字切り出し部9は同一筆者記入
領域格納部8に格納されている同一筆者が記入した領域
のイメージデータから1文字分の領域を切り出し、特徴
ベクトル算出部10へ出力する。特徴ベクトル算出部1
0は、前記文字切り出し部9が切り出したイメージデー
タから特徴ベクトルを算出する。この時、前記算出され
た特徴ベクトルは全特徴ベクトル格納部14へ格納する
と共に、文字カテゴリ判定部11へ出力する。
【0054】文字カテゴリ判定部11は、特徴ベクトル
算出部10が算出した特徴ベクトルを基に、識別辞書1
3を参照して文字カテゴリの判定処理を行い、判定結果
を全文字カテゴリ判定結果格納部12に格納する。ま
た、クラスタリング処理部15は、全特徴ベクトル格納
部14に格納されている全ての特徴ベクトルを対象に、
文字カテゴリ毎に、階層的クラスタリング処理を行い、
全ての文字カテゴリのクラスタリング処理が終了した時
点でクラスタリング結果をクラスタリング処理結果格納
部16に格納する。
【0055】次に、文字カテゴリ判定結果修正部17
は、クラスタリング処理結果格納部16に格納されてい
るクラスタリング処理結果と、全文字カテゴリ判定結果
格納部12に格納されている全文字のカテゴリ判定結果
を基に、文字カテゴリ判定結果の修正処理を行い(誤読
文字カテゴリの修正)、修正結果を出力する。
【0056】§4:各部の詳細な説明・・・図5〜図1
1参照 以下、図5〜図11に基づいて前記各部の詳細な処理に
ついて説明する。 (1) :同一筆者記入領域抽出部7の説明 同一筆者記入領域抽出部7は、イメージデータ格納部6
に格納されているイメージデータから同一筆者によって
記入された領域だけを抽出し、そのイメージデータを同
一筆者記入領域格納部8に格納するものである。この場
合、イメージデータ格納部6に格納されている文書のイ
メージデータには、:同一筆記者により手書きされた
文書を読み取って生成した同一筆記者のみのイメージデ
ータと、:複数の筆記者が手書きで記入した文書から
読み取って生成した複数筆記者のイメージデータとがあ
る。
【0057】前記の同一筆記者のみのイメージデータ
の場合、同一筆者記入領域抽出部7は、イメージデータ
格納部6のイメージデータをそのまま全部読み出して同
一筆者記入領域格納部8へ格納する。また、前記の複
数筆記者のイメージデータの場合は、指定された筆記者
のイメージデータのみを抽出して同一筆者記入領域格納
部8へ格納する。この場合の処理は、例えば次のように
して行う。
【0058】前記の同一筆記者のみのイメージデータ
の場合、例えば、同一筆者記入領域抽出部7に対し、予
め同一筆記者のイメージデータである旨、指示情報(キ
ーボードから係員が入力した指示情報)を送り、その指
示情報を内部に設定(例えば、メモリに設定)しておく
ことで実現可能である。また、処理対象領域に対する筆
者番号等の入力等によっても実現可能である。
【0059】また、前記の複数筆記者のイメージデー
タの場合は、前記イメージデータの各処理対象領域に対
し、筆記者毎の抽出領域情報を指定し、この指定情報に
従って同一筆者毎に領域を抽出することで実現すること
が可能である。更に、前記の場合、文書中に筆者番号
を記入しておき、この文書を読み取って生成されたイメ
ージデータから筆者番号を読み取り、その筆者番号と、
予め設定された読み取り対象領域の情報を基に、筆者毎
の記入領域を識別し、同一筆者記入領域を抽出すること
でも実現可能である。更に、従来から行われている他の
任意の方法で同一筆者記入領域を抽出することが可能で
ある。
【0060】(2) :特徴ベクトル算出部10の説明・・
・図5参照 図5は特徴ベクトル算出例である。特徴ベクトル算出部
10は、文字切り出し部9が切り出した1文字の領域か
ら特徴ベクトルを算出するものである。特徴ベクトルの
算出方法としては、従来より種々のものが提案されてお
り、例えば、「加重方向ヒストグラム法」などを用い
る。
【0061】前記加重方向ヒストグラム法は、例えば、
「加重方向ヒストグラム法による手書き漢字・ひらがな
認識,電子情報通信学会論文誌D,Vol,J70−
D,No.7,pp.1390〜1397,1987年
7月発行」に記載されている。前記特徴ベクトルの算出
法を用いれば、1文字当たり64次元の特徴ベクトルが
算出できる。
【0062】以下、特徴ベクトルの1例を図5に基づい
て説明する。この例は、図に示したように、縦5×横
4の枡目に書かれている文字について、枡目の黒い部分
を1、白い部分を0として、枡目の左上から右下までの
順に枡を見てみる。その時現れる数値(1又は0)を順
に並べたものを特徴ベクトルとした例である。この例で
は、3つの異なる「2」という文字についての特徴ベク
トルを示している。具体的には次の通りである。
【0063】例えば、図の例では、特徴ベクトルve
ctor_2aは、vector_2a=(1,1,
1,1,0,0,0,1,1,1,1,1,1,0,
0,0,1,1,1,1)となる。図の例では、特徴
ベクトルvector_2bは、vector_2b=
(0,1,1,1,0,0,0,1,1,1,1,1,
1,0,0,0,1,1,1,1)となる。図の例で
は、特徴ベクトルvector_2cは、vector
_2c=(1,1,1,1,0,0,0,1,0,1,
1,0,1,0,0,0,1,1,1,1)となる。
【0064】(3) :文字カテゴリ判定部11の説明・・
・図6参照 図6は文字カテゴリ判定例を示した図である。文字カテ
ゴリ判定部11は、特徴ベクトル算出部10が算出した
特徴ベクトルを基に、識別辞書13を参照して文字カテ
ゴリの判定処理を行うものである。この場合、予め学習
パターンを用いて各文字カテゴリ(カテゴリ:1つの文
字を表す)毎に特徴ベクトルを算出しておき、それらを
識別辞書13として登録しておく。
【0065】そして文字カテゴリ判定部11は、特徴ベ
クトル算出部10で算出された入力文字の特徴ベクトル
と、識別辞書13に登録された各カテゴリの特徴ベクト
ルとの距離比較を行い、入力文字の特徴ベクトルと最も
近い辞書ベクトル(識別辞書13に登録されている特徴
ベクトル)のカテゴリを入力文字の文字カテゴリと判定
する。
【0066】なお、前記距離比較の方法については、前
記の文献「加重方向ヒストグラム法による手書き漢字・
ひらがな認識,電子情報通信学会論文誌D,Vol,J
70−D,No.7,pp.1390〜1397,19
87年7月発行」を参照されたい。
【0067】以下、図に基づいて特徴ベクトルの距離比
較の1例を説明する。この場合、識別辞書13には、
「1」〜「4」までの文字(文字の特徴ベクトル)が登
録されているものとする。ここでは、入力文字の特徴ベ
クトルと識別辞書13に登録されている文字の各特徴ベ
クトルの距離を「シティブロック距離」を用いて算出し
ている。ベクトル間距離が最小となるのが「2」の文字
の場合なので、入力文字の文字カテゴリを「2」と判定
する。
【0068】前記「シティブロック距離」は次のように
定義される。すなわち、特徴ベクトルの次元数をN、特
徴ベクトルの番号をiとすると、i番目の特徴ベクトル
iは、xi =(xi1,xi2,xi3・・・xiN)と表さ
れ、j番目の特徴ベクトルx j は、xj =(xj1
j2,xj3・・・xjN)と表される。そして、前記ベク
トルxi とベクトルxj 間の距離d(i,j) は、d(i,j)
=|xi −xj |と定義される。
【0069】具体的には次の通りである。図示のよう
に、入力文字「2」の特徴ベクトルをvectorとす
ると、vector=(0,1,1,1,0,0,0,
1,1,1,1,1,1,0,0,0,1,1,1,
1)である。一方、識別辞書13に登録されている文字
「1」、「2」、「3」、「4」の各の特徴ベクトルv
ector_1、vector_2、vector_
3、vector_4はそれぞれ図示の通りである。
【0070】すなわち、文字「1」の特徴ベクトルve
ctor_1は、vector_1=(0,1,1,
0,0,1,1,0,0,1,1,0,0,1,1,
0,0,1,1,0)、文字「2」の特徴ベクトルve
ctor_2は、vector_2=(1,1,1,
1,0,0,0,1,1,1,1,1,1,0,0,
0,1,1,1,1)、文字「3」の特徴ベクトルve
ctor_3は、vector_3=(1,1,1,
1,0,0,0,1,1,1,1,1,0,0,0,
1,1,1,1,1)、文字「4」の特徴ベクトルve
ctor_4は、vector_4=(1,0,1,
0,1,0,1,0,1,1,1,1,0,0,1,
0,0,0,1,0)である。
【0071】そこで、前記入力文字の特徴ベクトルと識
別辞書13に登録されている各文字の特徴ベクトルとの
距離(distance)を算出すると、図示の通りと
なる。すなわち、入力文字の特徴ベクトルと辞書登録文
字「1」の特徴ベクトルとの距離「distance」
は、「distance」=|vector−vect
or_1|=|0−0|+|1−1|+|1−1|+|
1−0|+|0−0|+|0−1|+|0−1|+|1
−0|+|1−0|+|1−1|+|1−1|+|1−
0|+|1−0|+|0−1|+|0−1|+|0−0
|+|1−0|+|1−1|+|1−1|+|1−0|
=11となる。
【0072】以下同様にして、入力文字の特徴ベクトル
と辞書登録文字「2」の特徴ベクトルとの距離「dis
tance」は、「distance」=1、入力文字
の特徴ベクトルと辞書登録文字「3」の特徴ベクトルと
の距離「distance」は、「distance」
=3、入力文字の特徴ベクトルと辞書登録文字「4」の
特徴ベクトルとの距離「distance」は、「di
stance」=11となる。
【0073】そこで前記入力文字の特徴ベクトルと辞書
登録文字の特徴ベクトルとの距離「distance」
を比較すると、入力文字の特徴ベクトルと辞書登録文字
「2」の特徴ベクトルとの距離「distance」=
1が最小である。すなわち、ベクトル間距離が最小とな
るのが「2」の文字の場合なので、入力文字の文字カテ
ゴリを「2」と判定する。
【0074】文字カテゴリ判定部11は、以上のように
して特徴ベクトル算出部10が算出した特徴ベクトルを
基に、識別辞書13を参照して文字カテゴリの判定処理
を行い、全ての文字についてのカテゴリ判定結果のデー
タを全文字カテゴリ判定結果格納部12に格納する。
【0075】(4) :クラスタリング処理部15の説明・
・・図7、図8参照 図7は階層的クラスタリング処理の概念図、図8はクラ
スタ統合時のクラスタ統合回数とクラスタ間距離の関係
を示した図である。クラスタリング処理部15は、特徴
ベクトル算出部10で算出された全ての特徴ベクトルを
対象に、文字カテゴリ毎に、階層的クラスタリング処理
を行い、全ての文字カテゴリのクラスタリング処理が終
了した時点でクラスタリング結果をクラスタリング処理
結果格納部16に格納する。
【0076】前記処理では、クラスタリング処理部15
は全特徴ベクトル格納部14から特徴ベクトルを読み出
し、クラスタリング打ち切り条件格納部18からのクラ
スタリング打ち切り条件を使用してクラスタリング処理
を行い、クラスタリング処理結果のデータをクラスタリ
ング処理結果格納部16に格納する。
【0077】前記階層的クラスタリング処理とは、特徴
ベクトルのそれぞれを「変数が1つのクラスタ」と考
え、クラスタ間の距離が最も近いもの同士を統合して新
たなクラスタを作り(生成し)、以後同様にクラスタ間
距離が最も近いもの同士を統合して行く処理である。
【0078】図示の階層的クラスタリング処理の概念図
では、「4」の文字カテゴリに判定された特徴ベクトル
に対する階層的クラスタリング処理を示している。図で
は「2」の文字が1つだけ「4」と間違って判定されて
いる。このような状態で1回目、2回目、3回目、4回
目・・・9回目、11回目と順次階層的クラスタリング
処理を進めて行き、クラスタリング打ち切り条件を満た
すと、クラスタリング処理を打ち切る。
【0079】クラスタ同士を統合する場合、要素数が1
つのクラスタ、すなわち、特徴ベクトル同士の距離比較
には、例えば、前記「シティブロック距離」を用いる。
要素数が複数あるクラスタ同士の距離比較には、例え
ば、「重心法」を用いる。この「重心法」とは、或るク
ラスタのi番目(i=1,2,3,・・・M)の特徴ベ
クトルxi をxi =(xi1,xi2,xi3・・・xiN)と
表した時、そのクラスタを代表するベクトルxmを、そ
のクラスタ内のベクトルの平均で表し、
【0080】
【数1】
【0081】のように表す。そして、代表ベクトル同士
をシティブロック距離を用いて比較する方法である。図
7より明らかなように、最後までクラスタリングを行う
と誤読文字を見つけられないので、前記クラスタリング
打ち切り条件を設定する。クラスタリング打ち切り条件
としては、:最終クラスタ数が一定数(例えば、3
つ)以下になった時、:クラスタ統合時のクラスタ間
距離が予め設定した閾値以上になった時、:クラスタ
統合時のクラスタ間距離の増加率が予め設定した閾値以
上になった時、のどれかを用いる。
【0082】なお、前記、、のクラスタリング打
ち切り条件の内から任意の1つのクラスタリング打ち切
り条件を選択し、クラスタリング打ち切り条件格納部1
8に格納しておき、クラスタリング処理部15が前記打
ち切り条件を参照してクラスタリング処理を行う。
【0083】前記のクラスタリング打ち切り条件での
「クラスタ間距離の閾値」としては、例えば、辞書登録
ベクトル同士間で最小となる距離値の1/3の値を用い
る。すなわち、辞書登録ベクトルをJi (i=0,1,
2,・・・9)、辞書登録ベクトル間の最小距離をL
min 、閾値をLt h とすると、Lmin =min (|Ji
j |)(i=0,1,・・・9、i≠j)、Li h =
1/3Lmin と表される。
【0084】前記のクラスタリング打ち切り条件での
「クラスタ間距離増加率」は、階層的クラスタリングに
おいては、近いクラスタ同志を順に統合して行くため、
統合する際のクラスタ間距離は徐々に増加して行く。誤
読文字のクラスタは、正読文字のクラスタに比べて距離
が離れたところに位置するため、正読文字のクラスタ同
志を統合した場合に比べ、正読文字のクラスタと誤読文
字のクラスタを統合した場合は、クラスタ間距離の増加
率が上がる。
【0085】そこで、クラスタ間距離増加率が上がる直
前でクラスタリングを打ち切る。閾値としては、例えば
クラスタ間距離増加率が、その前の統合時の増加率の3
倍以上となった時点とする。
【0086】図8は、横軸がクラスタ同士を統合した回
数(クラスタ統合回数)であり、縦軸がクラスタ統合時
のクラスタ間距離を示す。また、P点は、誤読文字のク
ラスタ統合時(正読文字のクラスタと誤読文字のクラス
タを統合した時)の点を表す。図示のように、階層的ク
ラスタリングを行うにつれてクラスタ間距離が増加し、
誤読文字を統合した時(図示のP点参照)に急にクラス
タ間距離が増加している。
【0087】すなわち、階層的クラスタリングにおい
て、i番目のクラスタ統合時のクラスタ間距離をdi
すると、クラスタリング打ち切り条件は、(di+1 −d
i )/(di −di-1 )>3と表される。
【0088】(5) :フローチャートによるクラスタリン
グ処理の説明・・・図9参照 図9はクラスタリング処理フローチャートである。以
下、図9に基づいてクラスタリング処理を説明する。な
お、S1〜S7は各処理ステップを示す。
【0089】クラスタリング処理部15は、全特徴ベク
トル格納部14から特徴ベクトルを取り出しクラスタリ
ング処理を開始する。このクラスタリング処理では、先
ず、或る文字カテゴリの特徴ベクトルだけを抽出する
(S1)。そしてクラスタリング処理部15は、クラス
タリング打ち切り条件格納部18からクラスタリング打
ち切り条件を取り込み、内部に設定する(S2)。
【0090】次にクラスタリング処理部15は、全特徴
ベクトル格納部14に格納されている全ての特徴ベクト
ルを対象にして、全クラスタ(特徴ベクトルのそれぞれ
を要素数が1つのクラスタと考える)中、最も近い2つ
のクラスタを選択する(S3)。
【0091】そして、クラスタリング処理部15は、ク
ラスタリング打ち切り条件を満たしているか否かを判断
し(S4)、前記クラスタリング打ち切り条件を満たし
ていない場合は、クラスタ同士を統合し(S5)、再び
全特徴ベクトル格納部前記S3の処理から繰り返す。
【0092】その後、前記S4の処理でクラスタリング
打ち切り条件を満たしていた場合は、全文字カテゴリに
対してクラスタリング処理を行ったか否かを判断し(S
6)、全文字カテゴリに対してクラスタリング処理を行
っていない場合は、再び前記S1の処理(次の文字につ
いての処理)から繰り返す。このようにして全文字カテ
ゴリに対してクラスタリング処理を行った場合は、クラ
スタリング処理結果をクラスタリング処理結果格納部1
6へ格納して(S7)、クラスタリング処理を終了す
る。
【0093】(6) :文字カテゴリ判定結果修正部17の
説明・・・図10参照 図10は階層的クラスタリングと文字カテゴリ判定結果
修正処理概念図である。文字カテゴリ判定結果修正部1
7は、クラスタリング処理結果格納部16に格納されて
いるクラスタリング処理結果と、全文字カテゴリ判定結
果格納部12に格納されている全文字のカテゴリ判定結
果を基に、文字カテゴリ判定結果の修正処理を次のよう
にして行う。
【0094】文字カテゴリ判定結果修正部17は、文字
カテゴリ判定結果の修正処理を行う場合、クラスタリン
グ処理部15で得られた全てのカテゴリの全てのクラス
タ(クラスタリング処理結果格納部16に格納されてい
るデータ)について、各クラスタ間で、クラスタ間距離
を算出する。
【0095】そして、算出したクラスタ間距離が予め設
定した或る閾値以下の場合に、そのクラスタ同士の統合
を行う。その際、クラスタ内文字カテゴリ判定部19
は、全文字カテゴリ判定結果格納部12に格納されてい
る全文字のカテゴリ判定結果を参照し、前記統合された
クラスタ同士の文字カテゴリが異なるか否かを判定す
る。その結果、クラスタ同士が異なるカテゴリの場合
は、文字カテゴリ判定結果修正部17が要素数が少ない
方のクラスタの文字カテゴリを、要素数が多い方のクラ
スタの文字カテゴリに修正する。
【0096】クラスタ統合時のクラスタ間距離の閾値と
しては、例えば、2つのクラスタの内、要素数が多い方
のクラスタ内のベクトル間距離の定数倍を用いる。すな
わち、クラスタA(要素数=M)とクラスタB(要素数
=N)(M>N)を統合するかどうか判定するには以下
のようにする。クラスタAの平均ベクトルをxam、ク
ラスタBの平均ベクトルをxbmとし、クラスタA内の
特徴ベクトルをxai(i=1,2,・・・M)と表す
と、M>Nであるから、クラスタA内のベクトル間平均
距離dt h は、次の式で表わされる。
【0097】
【数2】
【0098】クラスタ同士を統合する条件は、|xam
−xbm|<1.5dt h となる。ここでは、定数を
1.5とした。次に、図10に基づいて前記処理を具体
的に説明する。なお、図10のa、b、c、d、e、
f、g、hはクラスタ識別用の番号(記号)である。こ
の例では、階層的クラスタリングの打ち切り条件は、
「各カテゴリ内の要素数が3つになった時点」とする。
先ず、文字カテゴリ判定結果修正部17は、特徴ベクト
ルに対し、各カテゴリ内でクラスタ数が3つになるまで
クラスタリングを行う。
【0099】次に、文字カテゴリ判定結果修正部17
は、クラスタ間距離の近いもの同士のクラスタ統合処理
を行う。ここでは、bクラスタと、cクラスタが統合さ
れてhクラスタになっている。bとcのクラスタの文字
カテゴリは共に、「2」であるので、クラスタ統合によ
ってそれぞれの文字カテゴリが変わらない。
【0100】また、aクラスタとdクラスタが統合され
てgクラスタとなっている。aクラスタの文字カテゴリ
は「2」で、dクラスタの文字カテゴリは「4」で互い
に異なる。aクラスタの要素数がdクラスタの要素数よ
り多いので、dクラスタの文字カテゴリを「4」から
「2」に修正する。
【0101】(7) :フローチャートによる文字カテゴリ
判定結果修正部17の説明・・・図11参照 図11は文字カテゴリ判定結果修正処理フローチャート
である。以下、図11に基づいて文字カテゴリ判定結果
修正部の処理を説明する。なお、S11〜S18は各処
理ステップを示す。
【0102】文字カテゴリ判定結果修正部17は、文字
カテゴリ判定結果の修正処理を行う場合、クラスタリン
グ処理結果格納部16からクラスタリング処理結果のデ
ータを入力する(S11)。そして、クラスタリング処
理部15で得られた全てのカテゴリの全てのクラスタに
ついて、各クラスタ間で、クラスタ間距離を算出して比
較する(S12)。
【0103】その結果、前記算出したクラスタ間距離が
予め設定した閾値以下か否かを判定し(S13)、前記
閾値以下でない場合は何もしない(リジェクトする)
が、前記算出したクラスタ間距離が前記閾値以下の場合
には、そのクラスタ同士の統合を行い(S14)、再び
前記S12の処理から繰り返して行う。
【0104】その際、クラスタ内文字カテゴリ判定部1
9は、全文字カテゴリ判定結果格納部12に格納されて
いる全文字のカテゴリ判定結果を参照し、クラスタ内文
字カテゴリの判定処理を行う(S15)。そして、前記
統合されたクラスタ同士の文字カテゴリが異なるか否か
を判定する(S16)。
【0105】その結果、クラスタ同士が異なるカテゴリ
の場合は、文字カテゴリ判定結果修正部17は、要素数
が少ない方のクラスタの文字カテゴリを、要素数が多い
方のクラスタの文字カテゴリに修正し(S17)、クラ
スタ内文字について、その文字カテゴリを出力する。ま
た、前記S16の処理で統合されたクラスタ同士の文字
カテゴリが異なっていない場合は、文字カテゴリ判定結
果修正部17は、そのまま、クラスタ内文字について、
その文字カテゴリを出力する(S18)。
【0106】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1) :従来の文字認識装置に加えて、筆者毎の筆記特性
に基づいた文字認識結果修正処理を行うため、手書き文
字の文字認識を常に正確に行うことが可能である。
【0107】(2) :入力された複数の文字を基に筆記特
性を算出するため、事前に筆者毎の文字サンプルを取
る、という作業が不要になる上、従来のような文字サン
プル用のメモリも不要になる。
【0108】(3) :従来提案されている様々な文字認識
処理の後処理として本願発明の文字認識装置による処理
を追加することができるため、従来の文字認識処理自体
は変更する必要がなく、インプリメントも容易である。
【0109】(4) :各文字カテゴリ毎にクラスタリング
処理を行うため、筆者の筆記特性を反映した文字特徴を
捕らえ易く、従来の処理で誤って認識された文字を容易
に修正することが可能である。また、階層的クラスタリ
ングを用いることで、近傍のクラスタ同士が段階的に統
合されて行くので、結果的に離れて位置するクラスタだ
けを抽出し易くなり、誤読文字だけからなるクラスタを
抽出しやすい。更に、同じ理由で、誤読された文字を正
読文字に修正することができない場合でも、クラスタ間
距離を基に、リジェクト判定することができる。
【0110】(5) :文字カテゴリ内で特徴ベクトルに対
するクラスタリング処理を行って複数のクラスタを生成
する際に、階層的クラスタリングを用いて、カテゴリ内
のクラスタが或る一定数になった時点でクラスタリング
処理を打ち切っている。従って、クラスタリング打ち切
り基準が単純であるため、本願発明による処理の追加が
容易であり、高速な処理を行うことが可能である。
【0111】(6) :文字カテゴリ内で特徴ベクトルに対
するクラスタリング処理を行って複数のクラスタを生成
する際に、階層的クラスタリングにおけるクラスタ統合
時のクラスタ間距離が或る閾値以上になった時点でクラ
スタリング処理を打ち切っている。このようにクラスタ
間距離に基づいてクラスタリングを行うため、クラスタ
のまとまりをより正確に求めることが可能になる。
【0112】(7) :文字カテゴリ内で特徴ベクトルに対
するクラスタリング処理を行って複数のクラスタを生成
する際に、階層的クラスタリングにおけるクラスタ統合
時のクラスタ間距離の増加率が或る閾値以上になった時
点でクラスタリング処理を打ち切っている。このように
すれば、文字カテゴリ毎に文字特徴ベクトルの分布のば
らつき具合が異なる場合でも、クラスタ統合時における
クラスタ間距離の増加率を用いているため、クラスタの
ばらつきに応じて、クラスタのまとまりをより正確に求
めることが可能である。
【0113】前記効果の外、各請求項に対応して次のよ
うな効果がある。 (8) :請求項1では、クラスタリング処理手段は特徴ベ
クトル算出手段で算出した全ての特徴ベクトルに対して
類似度の高いもの同士をクラスタとして順次統合して行
くクラスタリング処理を行い、文字カテゴリ判定結果修
正手段はクラスタリング処理手段によるクラスタリング
処理結果を文字カテゴリ判定手段による文字カテゴリ判
定結果と比較して前記文字カテゴリ判定結果を修正し、
修正結果を出力する。
【0114】以上のようにして、従来の文字認識処理に
加えて、筆者毎の筆記特性に基づいた文字認識結果修正
処理を行うため、文字認識を正確に行うことが可能であ
り、入力された複数の文字を基に筆記特性を算出するた
め、事前に筆者毎の文字サンプルを取る、という作業が
不要になる上、文字サンプル用のメモリも不要になる。
更に、従来提案されている様々な文字認識処理の後処理
として本願発明の処理を追加することができるため、従
来の文字認識処理自体は変更する必要がなく、インプリ
メントも容易になる。
【0115】また、各文字カテゴリ毎にクラスタリング
処理を行うため、筆者の筆記特性を反映した文字特徴を
捕らえ易く、従来の処理で誤って認識された文字を容易
に修正することが可能である。
【0116】(9) :請求項2では、クラスタ統合手段が
クラスタリング処理部の処理結果から全カテゴリの全ク
ラスタを対象に各クラスタ間の距離比較を行い、クラス
タ間距離が予め設定した閾値以下となるクラスタ同士を
統合する。そして、クラスタ内文字カテゴリ判定手段
は、文字カテゴリ判定部が判定した全文字カテゴリ判定
結果を基に、クラスタ統合手段で統合されたクラスタ同
士の文字カテゴリが異なるか否かを判定する。
【0117】そして、文字カテゴリ修正手段は、前記ク
ラスタ内文字カテゴリ判定手段により統合されたクラス
タが異なる文字カテゴリ同士と判定された場合、クラス
タ内要素が少ない方のクラスタについてその文字カテゴ
リを統合相手の文字カテゴリに修正する。
【0118】この場合、前記クラスタリング処理により
各文字カテゴリ毎にクラスタリング処理を行い、その結
果のデータを用いて前記修正処理を行うので、筆者の筆
記特性を反映した文字特徴を捕らえ易く、従来の処理で
誤って認識された文字を容易に修正することが可能であ
る。
【0119】また、前記階層的クラスタリング処理で
は、近傍のクラスタ同士が段階的に統合されて行くの
で、結果的に離れて位置するクラスタだけを抽出し易く
なり、誤読文字だけからなるクラスタを抽出し易い。こ
のため、前記クラスタリング処理結果から誤読文字の修
正を行うことが容易になる。更に、同じ理由で、誤読さ
れた文字を正読文字に修正することができない場合で
も、クラスタ間距離を基に、リジェクト判定することが
できる。
【0120】(10):請求項3では、階層的クラスタリン
グ処理手段が文字カテゴリ内で特徴ベクトルに対する階
層的クラスタリング処理を行うことで、特徴ベクトルに
対して類似度の高いもの同士をクラスタとして順次統合
して行く。そして、前記階層的クラスタリング処理手段
により階層的クラスタリング処理を行って、カテゴリ内
のクラスタ数が予め設定された一定数に達した際、クラ
スタリング打ち切り手段が階層的クラスタリング処理を
打ち切る。
【0121】このようにすれば、クラスタリング打ち切
り基準が単純であるため、前記クラスタリング打ち切り
手段の追加が容易であり、高速な処理を行うことが可能
である。
【0122】(11):請求項4では、階層的クラスタリン
グ処理手段が文字カテゴリ内で特徴ベクトルに対する階
層的クラスタリング処理を行うことで、特徴ベクトルに
対して類似度の高いもの同士をクラスタとして順次統合
して行く。そして前記階層的クラスタリング処理手段に
よる階層的クラスタリング処理を行って、階層的クラス
タリングによるクラスタ統合時のクラスタ間距離が或る
閾値以上になった時点でクラスタリング打ち切り手段が
クラスタリングを打ち切る。このようにクラスタ間距離
に基づいてクラスタリングを行うため、クラスタのまと
まりをより正確に求めることが可能になる。
【0123】(12):請求項5では、階層的クラスタリン
グ処理手段が文字カテゴリ内で特徴ベクトルに対する階
層的クラスタリング処理を行うことで、特徴ベクトルに
対して類似度の高いもの同士をクラスタとして順次統合
して行く。そして、前記階層的クラスタリング処理手段
による階層的クラスタリング処理を行って、階層的クラ
スタリングによるクラスタ統合時のクラスタ間距離の増
加率が或る閾値以上になった時点でクラスタリング打ち
切り手段がクラスタリングを打ち切る。
【0124】このようにすれば、文字カテゴリ毎に文字
特徴ベクトルの分布のばらつき具合が異なる場合でも、
クラスタ統合時にクラスタ間距離の増加率を用いている
ため、クラスタのばらつきに応じて、クラスタのまとま
りをより正確に求めることが可能である。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】実施の形態の装置構成図である。
【図3】実施の形態における文書例1である。
【図4】実施の形態における文書例2である。
【図5】実施の形態における特徴ベクトル算出例であ
る。
【図6】実施の形態における文字カテゴリ判定例であ
る。
【図7】実施の形態における階層的クラスタリング処理
の概念図である。
【図8】実施の形態におけるクラスタ統合時のクラスタ
統合回数とクラスタ間距離の関係を示した図である。
【図9】実施の形態におけるクラスタリング処理フロー
チャートである。
【図10】実施の形態における階層的クラスタリングと
文字カテゴリ判定結果修正処理概念図である。
【図11】実施の形態における文字カテゴリ判定結果修
正処理フローチャートである。
【符号の説明】
1 イメージスキャナ 2 文字認識部 6 イメージデータ格納部 7 同一筆者記入領域抽出部 8 同一筆者記入領域格納部 9 文字切り出し部 10 特徴ベクトル算出部 11 文字カテゴリ判定部 12 全文字カテゴリ判定結果格納部 13 識別辞書 14 全特徴ベクトル格納部 15 クラスタリング処理部 16 クラスタリング処理結果格納部 17 文字カテゴリ判定結果修正部 18 クラスタリング打ち切り条件格納部 19 クラスタ内文字カテゴリ判定部
フロントページの続き (56)参考文献 特開 平6−187499(JP,A) 特開 平2−300989(JP,A) 川谷隆彦,筆記個人性を用いた手書き 数字認識の改善,電子情報通信学会論文 誌,日本,電子情報通信学会,1995年7 月25日,D−2 Vol.J78−D−2 No.7,p.1047−1057 川谷隆彦 宮本信夫,認識結果を用い た手書き数字字形の数量化とその応用, 電子情報通信学会論文誌,日本,電子情 報通信学会,1991年3月25日,D−2 Vol.J74−D−2 No.3,p. 357−365 (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 - 9/62 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】文書のイメージデータから手書き文字の認
    識処理を行う文字認識装置において、 前記文書のイメージデータから同一筆者によって記入さ
    れた領域を抽出する同一筆者記入領域抽出手段と、前記
    同一筆者記入領域抽出手段が抽出した領域内の全ての文
    字に対し各文字毎に文字の特徴ベクトルを算出する特徴
    ベクトル算出手段と、前記特徴ベクトル算出手段によっ
    て算出された各文字毎の特徴ベクトルと辞書に登録され
    た特徴ベクトルとの距離比較に基づいて各文字の文字カ
    テゴリを判定する文字カテゴリ判定手段と、前記特徴ベ
    クトル算出手段で算出した全ての特徴ベクトルに対して
    類似度の高いもの同士をクラスタとして順次統合して行
    くクラスタリング処理を行うクラスタリング処理手段
    と、前記クラスタリング処理手段によるクラスタリング
    処理結果を前記文字カテゴリ判定手段による文字カテゴ
    リ判定結果と比較して前記文字カテゴリ判定結果を修正
    する文字カテゴリ判定結果修正手段を備えていることを
    特徴とした文字認識装置。
  2. 【請求項2】前記文字カテゴリ判定結果修正手段は、前
    記クラスタリング処理手段の処理結果から、全カテゴリ
    の全クラスタを対象に各クラスタ間の距離比較を行い、
    クラスタ間距離が予め設定した閾値以下となるクラスタ
    同士を統合するクラスタ統合手段と、 前記文字カテゴリ判定手段が判定した全文字カテゴリ判
    定結果を基に、前記クラスタ統合手段で統合されたクラ
    スタ同士の文字カテゴリが異なるか否かを判定するクラ
    スタ内文字カテゴリ判定手段と、 前記クラスタ内文字カテゴリ判定手段により前記統合さ
    れたクラスタが異なる文字カテゴリ同士と判定された場
    合、クラスタ内要素が少ない方のクラスタについてその
    文字カテゴリを統合相手の文字カテゴリに修正する文字
    カテゴリ修正手段を備えていることを特徴とした請求項
    1記載の文字認識装置。
  3. 【請求項3】前記クラスタリング処理手段は、文字カテ
    ゴリ内で特徴ベクトルに対する階層的クラスタリング処
    理を行うことで、特徴ベクトルに対して類似度の高いも
    の同士をクラスタとして順次統合して行く階層的クラス
    タリング処理手段と、 前記階層的クラスタリング処理手段による階層的クラス
    タリング処理を行って、カテゴリ内のクラスタ数が予め
    設定された一定数に達した際、前記階層的クラスタリン
    グ処理を打ち切るクラスタリング打ち切り手段を備えて
    いることを特徴とした請求項1記載の文字認識装置。
  4. 【請求項4】前記クラスタリング処理手段は、文字カテ
    ゴリ内で特徴ベクトルに対する階層的クラスタリング処
    理を行うことで、特徴ベクトルに対して類似度の高いも
    の同士をクラスタとして順次統合して行く階層的クラス
    タリング処理手段と、 前記階層的クラスタリング処理手段による階層的クラス
    タリング処理を行って、階層的クラスタリングによるク
    ラスタ統合時のクラスタ間距離が或る閾値以上になった
    時点でクラスタリングを打ち切るクラスタリング打ち切
    り手段を備えていることを特徴とした請求項1記載の文
    字認識装置。
  5. 【請求項5】前記クラスタリング処理手段は、文字カテ
    ゴリ内で特徴ベクトルに対する階層的クラスタリング処
    理を行うことで、特徴ベクトルに対して類似度の高いも
    の同士をクラスタとして順次統合して行く階層的クラス
    タリング処理手段と、 前記階層的クラスタリング処理手段による階層的クラス
    タリング処理を行って、階層的クラスタリングによるク
    ラスタ統合時のクラスタ間距離の増加率が或る閾値以上
    になった時点でクラスタリングを打ち切るクラスタリン
    グ打ち切り手段を備えていることを特徴とした請求項1
    記載の文字認識装置。
JP03021796A 1996-02-19 1996-02-19 文字認識装置 Expired - Fee Related JP3281530B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP03021796A JP3281530B2 (ja) 1996-02-19 1996-02-19 文字認識装置
US08/801,139 US6345119B1 (en) 1996-02-19 1997-02-18 Handwritten character recognition apparatus and method using a clustering algorithm
DE69732156T DE69732156D1 (de) 1996-02-19 1997-02-19 Verfahren und Gerät zur Zeichenerkennung
EP97301064A EP0790574B1 (en) 1996-02-19 1997-02-19 Character recognition apparatus and method
KR1019970004938A KR100249055B1 (ko) 1996-02-19 1997-02-19 문자인식장치및방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03021796A JP3281530B2 (ja) 1996-02-19 1996-02-19 文字認識装置

Publications (2)

Publication Number Publication Date
JPH09223196A JPH09223196A (ja) 1997-08-26
JP3281530B2 true JP3281530B2 (ja) 2002-05-13

Family

ID=12297564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03021796A Expired - Fee Related JP3281530B2 (ja) 1996-02-19 1996-02-19 文字認識装置

Country Status (1)

Country Link
JP (1) JP3281530B2 (ja)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
川谷隆彦 宮本信夫,認識結果を用いた手書き数字字形の数量化とその応用,電子情報通信学会論文誌,日本,電子情報通信学会,1991年3月25日,D−2 Vol.J74−D−2 No.3,p.357−365
川谷隆彦,筆記個人性を用いた手書き数字認識の改善,電子情報通信学会論文誌,日本,電子情報通信学会,1995年7月25日,D−2 Vol.J78−D−2 No.7,p.1047−1057

Also Published As

Publication number Publication date
JPH09223196A (ja) 1997-08-26

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
US11514698B2 (en) Intelligent extraction of information from a document
US5287275A (en) Image recognition apparatus and method for recognizing a pattern within an image
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
JP3452774B2 (ja) 文字認識方法
US20060050962A1 (en) System, process and software arrangement for recognizing handwritten characters
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
Davis et al. Recognition of handwritten characters—a review
JPH08180139A (ja) 拘束のない手書き英数字のオンライン認識の方法及び装置
Ghiasi et al. An efficient method for offline text independent writer identification
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
Zohrevand et al. Line segmentation in Persian handwritten documents based on a novel projection histogram method
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
Zhou et al. Discrimination of characters by a multi-stage recognition process
JP3216800B2 (ja) 手書き文字認識方法
JP3281530B2 (ja) 文字認識装置
Vaidya et al. Handwritten numeral identification system using pixel level distribution features
JP2556477B2 (ja) パタン照合装置
Benafia et al. Handwritten character recognition on focused on the segmentation of character prototypes in small strips
JP3180792B2 (ja) 文字認識装置、文字学習装置およびコンピュータ可読記録媒体
Amer et al. Arabic Word Recognition Using SURF Descriptor
JP2906758B2 (ja) 文字読取装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP3374762B2 (ja) 文字認識方法及びその装置
Tavoli et al. A Novel Word-Spotting Method for Handwritten Documents Using an Optimization-Based Classifier

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140222

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees