JPH0253832B2

JPH0253832B2 -

Info

Publication number: JPH0253832B2
Application number: JP57107354A
Authority: JP
Inventors: Tozen Hai; Yukikazu Kaburayama; Hiroshi Kamata
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-06-21
Filing date: 1982-06-21
Publication date: 1990-11-19
Also published as: JPS58223887A

Description

【発明の詳細な説明】 (1) 発明の技術分野本発明は文字認識装置における個人辞書作成処
理方式、特に特定筆者の文字を高精度で認識しよ
うとする個人辞書を有する文字認識装置におい
て、ある個人の字体が予め用意された複数人の字
体のどれに似ているかを少数の学習文字によつて
調査し、似ている字体の人の辞書を初期個人辞書
とし、この初期個人辞書の更新により、目的の個
人辞書を作成することによつて、個人辞書作成の
労力の大幅な削減と、初期辞書からの精度よい認
識を可能にした文字認識装置における個人辞書作
成処理方式に関するものである。

(2) 従来技術と問題点手書き文字には個人の癖が表われ、手書き文字
を高精度で認識しようとする場合、１つの標準的
な共通辞書を用いるよりも、各筆者に個有の辞書
を用いたほうがよいことは、音声認識装置の場合
と同様である。しかし、従来、文字認識装置の個
人辞書を作成する場合には、予め各個人毎に辞書
作成文字として、各字種につき数文字から数十文
字を書くようにされていた。従つて、日本語文章
を対象とした場合、例えば字種が約2500種あり、
何度も繰り返して筆記するのは大変な労力であつ
た。この労力を軽減するために、とりあえず初期
辞書として標準化された汎用辞書を用いる方式も
ある。すなわち、辞書作成文字を書くかわりに汎
用辞書を初期個人辞書とし、その辞書を文字認識
に用いながら、例えば誤認識の場合の修正指示が
あつた場合に、辞書に記憶された特徴を修正す
る。この方式では、初期辞書の段階での認識精度
が悪く、良い認識率を得られるような個人辞書に
なるまでの更新に時間がかかるという欠点があ
る。

(3) 発明の目的と構成ところで、手書き文字の特徴として、例えば個
人の癖が右上りに字を書くとか、右下りに字を書
くとか、また丸い字を書くとか、角ばつた字を書
くというように、字種に関係なく表われることが
多いので、少数の文字字形が似ている個人同士
は、他の文字の字形も比較的似ているという性質
がある。

この点に着目して、本発明は上記問題点の解決
を図り、個人辞書作成時における労力を軽減し、
しかも初期辞書の段階から良い認識率を得ること
ができるようにすることを目的としている。

そのため、本発明は、これから個人辞書を作成
しようとする個人の字形が、すでに作成されてい
る個人辞書のどの人の字形と似ているかを調べ、
似ている辞書を初期個人辞書として代用し、以降
使用するにつれて初期個人辞書を更新してゆくよ
う処理するものである。すなわち、本発明の文字
認識装置における個人辞書作成処理方式は、少な
くとも文字図形を入力する観測部と、該観測部に
よつて入力された文字図形から入力文字の特徴を
抽出する特徴抽出部と、各個人毎に上記特徴抽出
部が抽出した特徴と照合されカテゴリの決定に用
いられる特徴が記憶された個人辞書とをそなえ、
文字を認識する文字認識装置において、新たな個
人辞書を作成する場合に個人辞書作成用の学習文
字を入力し、該学習文字の特徴と、既存の複数の
上記個人辞書に記憶された上記学習文字のカテゴ
リの特徴とを照合し、距離の最も近い個人辞書を
初期個人辞書として選択する選択処理部をそなえ
るとともに、入力文字の認識結果の修正によつ
て、修正されたカテゴリの上記個人辞書の特徴を
当該入力文字から抽出された特徴にもとづいて更
新する辞書更新処理部とをそなえ、個人辞書を作
成するようにしたことを特徴としている。以下図
面を参照しつつ実施例にもとづいて説明する。

(4) 発明の実施例第１図は本発明の一実施例構成、第２図は個人
辞書の構成例を示す。

図中、１は個人辞書の選択に用いられる学習文
字、２は文字図形を光学的手段によつて入力する
観測部、３は入力文字の特徴を抽出する特徴抽出
部、４は既存の個人辞書の中から新たな初期個人
辞書を選択する選択処理部、５は特徴抽出部３が
抽出した特徴と辞書の特徴とを照合するマツチン
グ部、６は各個人毎に各カテゴリの特徴が記憶さ
れている辞書部、７は認識対象とされる入力文
字、８は例えばCRTデイスプレイ等の認識結果
の表示部、９は認識結果の修正指示に用いられる
キーボード等の入力部、１０は辞書更新処理部を
表わす。

第１図において、新たに第（ｎ＋１）番目の筆
者の個人辞書を作成する場合、次のように処理さ
れる。筆者（ｎ＋１）は、まず適当な学習文字１
を入力する。この学習文字１は特定のものであつ
てもよいし、あるいは不特定のものであつてもよ
い。学習文字１の入力情報は、観測部２によつて
光電変換され、特徴抽出部３に転送される。特徴
抽出部３はその観測文字について１または複数の
特徴を抽出する。

一方、学習文字１はその属するカテゴリがすで
にわかつている文字なので、このカテゴリを知ら
せる信号が前もつて選択処理部４に通知される。
選択処理部４は、この信号にもとづいて辞書部６
から学習文字１と同じカテゴリの辞書を読み出
し、マツチング部５へ転送する。

辞書部６は、例えば現在ｎ人分の個人辞書を有
しているとすると、第２図図示の如く構成され、
第１番目の筆者から第ｎ番目の筆者までの、すべ
てのカテゴリについての各筆者個有の特徴からな
る辞書を有している。選択処理部４は、学習文字
１が例えばカテゴリｂに属するとすると、第２図
図示Ａの部分の辞書をマツチング部５に転送する
ことになる。

マツチング部５は、特徴抽出部３が抽出した学
習文字１の特徴と、選択処理部４によつて転送さ
れた学習文字１のカテゴリの各個人の特徴とをす
べて照合する。そして、第（ｎ＋１）番目の筆者
の書いた学習文字１が、すでに作成されたｎ人の
筆者のどれに一番似ているかを調べる。すなわち
観測した学習文字１の特徴と、辞書中のｎ人分の
特徴との距離をそれぞれ演算し、各筆者毎に特徴
の距離を算出する。例えば特徴が複数種類あると
きには、各特徴の平均距離が算出される。この結
果は選択処理部４に通知される。

以上の処理を、複数の比較的少数の学習文字１
について繰り返し、上記特徴の距離の筆者毎の合
計値が最も小さい筆者をｎ人の筆者の中から選出
する。例えば、第ｉ番目の筆者が選出されて、第
（ｎ＋１）番目の筆者の文字が第ｉ番目の筆者の
文字に最も近似していることが判別すると、選択
処理部４は第ｉ番目の筆者の個人辞書を、第（ｎ
＋１）番目の筆者の初期個人辞書として採用す
る。すなわち、辞書部６に第（ｎ＋１）番目の筆
者の辞書用の領域を確保し、第２図図示Ｂの部分
の第ｉ番目の筆者の辞書情報をコピーする。この
ようにして、すでに作成されている個人辞書の似
ている字体の人の辞書が、新たな筆者に最もふさ
わしい初期個人辞書として利用され、以降の未学
習文字の認識に使用されることになる。

初期個人辞書が作成された後に、第（ｎ＋１）
番目の筆者が認識対象となる入力文字７を入力す
ると、観測部２は観測結果を特徴抽出部３に通知
する。特徴抽出部３は入力文字７の特徴を抽出し
てマツチング部５に転送する。マツチング部５は
辞書部６から第（ｎ＋１）番目の筆者の辞書を読
み出し、その辞書の各カテゴリ毎の特徴と、特徴
抽出部３が抽出した特徴とを比較する。そして、
特徴が最も近いカテゴリを認識結果として、デイ
スプレイ等の表示部８に表示する。

表示部８に表示された認識結果が正しくない場
合には、キーボード等の入力部９から修正すべき
旨の指示をする。この修正指示は辞書更新処理部
１０に伝達される。正しいカテゴリが例えばカテ
ゴリＺであつたとすると、辞書更新処理部１０は
特徴抽出部３から入力文字７の特徴を受けとり、
この特徴と、辞書部６の第（ｎ＋１）番目の筆者
の辞書のカテゴリＺの部分の特徴とを用いて、例
えばこれらの特徴量の平均が新たな辞書内容とな
るようにカテゴリＺの部分を更新する。こうし
て、使用によつて個人辞書が完成していくように
される。

(5) 発明の効果以上説明した如く本発明によれば、新たな筆者
の個人辞書を簡易・迅速に作成することができ、
個人辞書作成の労力を大幅に軽減することができ
る。しかも、初期段階から高い認識率を得ること
ができる。個人辞書の数が多くなればなるほど、
初期段階における認識率は自然に向上する。

【図面の簡単な説明】

第１図は本発明の一実施例構成、第２図は個人
辞書の構成例を示す。図中、１は学習文字、２は観測部、３は特徴抽
出部、４は選択処理部、５はマツチング部、６は
辞書部、７は入力文字、８は表示部、９は入力
部、１０は辞書更新処理部を表わす。

Claims

【特許請求の範囲】

１少なくとも文字図形を入力する観測部と、該
観測部によつて入力された文字図形から入力文字
の特徴を抽出する特徴抽出部と、各個人毎に上記
特徴抽出部が抽出した特徴と照合されカテゴリの
決定に用いられる特徴が記憶された個人辞書とを
そなえ、文字を認識する文字認識装置において、
新たな個人辞書を作成する場合に個人辞書作成用
の学習文字を入力し、該学習文字の特徴と、既存
の複数の上記個人辞書に記憶された上記学習文字
のカテゴリの特徴とを照合し、距離の最も近い個
人辞書を初期個人辞書として選択する選択処理部
をそなえるとともに、入力文字の認識結果の修正
によつて修正されたカテゴリの上記個人辞書の特
徴を当該入力文字から抽出された特徴にもとづい
て更新する辞書更新処理部とをそなえ、個人辞書
を作成するようにしたことを特徴とする文字認識
装置における個人辞書作成処理方式。