JPH0253832B2 - - Google Patents
Info
- Publication number
- JPH0253832B2 JPH0253832B2 JP57107354A JP10735482A JPH0253832B2 JP H0253832 B2 JPH0253832 B2 JP H0253832B2 JP 57107354 A JP57107354 A JP 57107354A JP 10735482 A JP10735482 A JP 10735482A JP H0253832 B2 JPH0253832 B2 JP H0253832B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- character
- personal
- characters
- personal dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(1) 発明の技術分野
本発明は文字認識装置における個人辞書作成処
理方式、特に特定筆者の文字を高精度で認識しよ
うとする個人辞書を有する文字認識装置におい
て、ある個人の字体が予め用意された複数人の字
体のどれに似ているかを少数の学習文字によつて
調査し、似ている字体の人の辞書を初期個人辞書
とし、この初期個人辞書の更新により、目的の個
人辞書を作成することによつて、個人辞書作成の
労力の大幅な削減と、初期辞書からの精度よい認
識を可能にした文字認識装置における個人辞書作
成処理方式に関するものである。
理方式、特に特定筆者の文字を高精度で認識しよ
うとする個人辞書を有する文字認識装置におい
て、ある個人の字体が予め用意された複数人の字
体のどれに似ているかを少数の学習文字によつて
調査し、似ている字体の人の辞書を初期個人辞書
とし、この初期個人辞書の更新により、目的の個
人辞書を作成することによつて、個人辞書作成の
労力の大幅な削減と、初期辞書からの精度よい認
識を可能にした文字認識装置における個人辞書作
成処理方式に関するものである。
(2) 従来技術と問題点
手書き文字には個人の癖が表われ、手書き文字
を高精度で認識しようとする場合、1つの標準的
な共通辞書を用いるよりも、各筆者に個有の辞書
を用いたほうがよいことは、音声認識装置の場合
と同様である。しかし、従来、文字認識装置の個
人辞書を作成する場合には、予め各個人毎に辞書
作成文字として、各字種につき数文字から数十文
字を書くようにされていた。従つて、日本語文章
を対象とした場合、例えば字種が約2500種あり、
何度も繰り返して筆記するのは大変な労力であつ
た。この労力を軽減するために、とりあえず初期
辞書として標準化された汎用辞書を用いる方式も
ある。すなわち、辞書作成文字を書くかわりに汎
用辞書を初期個人辞書とし、その辞書を文字認識
に用いながら、例えば誤認識の場合の修正指示が
あつた場合に、辞書に記憶された特徴を修正す
る。この方式では、初期辞書の段階での認識精度
が悪く、良い認識率を得られるような個人辞書に
なるまでの更新に時間がかかるという欠点があ
る。
を高精度で認識しようとする場合、1つの標準的
な共通辞書を用いるよりも、各筆者に個有の辞書
を用いたほうがよいことは、音声認識装置の場合
と同様である。しかし、従来、文字認識装置の個
人辞書を作成する場合には、予め各個人毎に辞書
作成文字として、各字種につき数文字から数十文
字を書くようにされていた。従つて、日本語文章
を対象とした場合、例えば字種が約2500種あり、
何度も繰り返して筆記するのは大変な労力であつ
た。この労力を軽減するために、とりあえず初期
辞書として標準化された汎用辞書を用いる方式も
ある。すなわち、辞書作成文字を書くかわりに汎
用辞書を初期個人辞書とし、その辞書を文字認識
に用いながら、例えば誤認識の場合の修正指示が
あつた場合に、辞書に記憶された特徴を修正す
る。この方式では、初期辞書の段階での認識精度
が悪く、良い認識率を得られるような個人辞書に
なるまでの更新に時間がかかるという欠点があ
る。
(3) 発明の目的と構成
ところで、手書き文字の特徴として、例えば個
人の癖が右上りに字を書くとか、右下りに字を書
くとか、また丸い字を書くとか、角ばつた字を書
くというように、字種に関係なく表われることが
多いので、少数の文字字形が似ている個人同士
は、他の文字の字形も比較的似ているという性質
がある。
人の癖が右上りに字を書くとか、右下りに字を書
くとか、また丸い字を書くとか、角ばつた字を書
くというように、字種に関係なく表われることが
多いので、少数の文字字形が似ている個人同士
は、他の文字の字形も比較的似ているという性質
がある。
この点に着目して、本発明は上記問題点の解決
を図り、個人辞書作成時における労力を軽減し、
しかも初期辞書の段階から良い認識率を得ること
ができるようにすることを目的としている。
を図り、個人辞書作成時における労力を軽減し、
しかも初期辞書の段階から良い認識率を得ること
ができるようにすることを目的としている。
そのため、本発明は、これから個人辞書を作成
しようとする個人の字形が、すでに作成されてい
る個人辞書のどの人の字形と似ているかを調べ、
似ている辞書を初期個人辞書として代用し、以降
使用するにつれて初期個人辞書を更新してゆくよ
う処理するものである。すなわち、本発明の文字
認識装置における個人辞書作成処理方式は、少な
くとも文字図形を入力する観測部と、該観測部に
よつて入力された文字図形から入力文字の特徴を
抽出する特徴抽出部と、各個人毎に上記特徴抽出
部が抽出した特徴と照合されカテゴリの決定に用
いられる特徴が記憶された個人辞書とをそなえ、
文字を認識する文字認識装置において、新たな個
人辞書を作成する場合に個人辞書作成用の学習文
字を入力し、該学習文字の特徴と、既存の複数の
上記個人辞書に記憶された上記学習文字のカテゴ
リの特徴とを照合し、距離の最も近い個人辞書を
初期個人辞書として選択する選択処理部をそなえ
るとともに、入力文字の認識結果の修正によつ
て、修正されたカテゴリの上記個人辞書の特徴を
当該入力文字から抽出された特徴にもとづいて更
新する辞書更新処理部とをそなえ、個人辞書を作
成するようにしたことを特徴としている。以下図
面を参照しつつ実施例にもとづいて説明する。
しようとする個人の字形が、すでに作成されてい
る個人辞書のどの人の字形と似ているかを調べ、
似ている辞書を初期個人辞書として代用し、以降
使用するにつれて初期個人辞書を更新してゆくよ
う処理するものである。すなわち、本発明の文字
認識装置における個人辞書作成処理方式は、少な
くとも文字図形を入力する観測部と、該観測部に
よつて入力された文字図形から入力文字の特徴を
抽出する特徴抽出部と、各個人毎に上記特徴抽出
部が抽出した特徴と照合されカテゴリの決定に用
いられる特徴が記憶された個人辞書とをそなえ、
文字を認識する文字認識装置において、新たな個
人辞書を作成する場合に個人辞書作成用の学習文
字を入力し、該学習文字の特徴と、既存の複数の
上記個人辞書に記憶された上記学習文字のカテゴ
リの特徴とを照合し、距離の最も近い個人辞書を
初期個人辞書として選択する選択処理部をそなえ
るとともに、入力文字の認識結果の修正によつ
て、修正されたカテゴリの上記個人辞書の特徴を
当該入力文字から抽出された特徴にもとづいて更
新する辞書更新処理部とをそなえ、個人辞書を作
成するようにしたことを特徴としている。以下図
面を参照しつつ実施例にもとづいて説明する。
(4) 発明の実施例
第1図は本発明の一実施例構成、第2図は個人
辞書の構成例を示す。
辞書の構成例を示す。
図中、1は個人辞書の選択に用いられる学習文
字、2は文字図形を光学的手段によつて入力する
観測部、3は入力文字の特徴を抽出する特徴抽出
部、4は既存の個人辞書の中から新たな初期個人
辞書を選択する選択処理部、5は特徴抽出部3が
抽出した特徴と辞書の特徴とを照合するマツチン
グ部、6は各個人毎に各カテゴリの特徴が記憶さ
れている辞書部、7は認識対象とされる入力文
字、8は例えばCRTデイスプレイ等の認識結果
の表示部、9は認識結果の修正指示に用いられる
キーボード等の入力部、10は辞書更新処理部を
表わす。
字、2は文字図形を光学的手段によつて入力する
観測部、3は入力文字の特徴を抽出する特徴抽出
部、4は既存の個人辞書の中から新たな初期個人
辞書を選択する選択処理部、5は特徴抽出部3が
抽出した特徴と辞書の特徴とを照合するマツチン
グ部、6は各個人毎に各カテゴリの特徴が記憶さ
れている辞書部、7は認識対象とされる入力文
字、8は例えばCRTデイスプレイ等の認識結果
の表示部、9は認識結果の修正指示に用いられる
キーボード等の入力部、10は辞書更新処理部を
表わす。
第1図において、新たに第(n+1)番目の筆
者の個人辞書を作成する場合、次のように処理さ
れる。筆者(n+1)は、まず適当な学習文字1
を入力する。この学習文字1は特定のものであつ
てもよいし、あるいは不特定のものであつてもよ
い。学習文字1の入力情報は、観測部2によつて
光電変換され、特徴抽出部3に転送される。特徴
抽出部3はその観測文字について1または複数の
特徴を抽出する。
者の個人辞書を作成する場合、次のように処理さ
れる。筆者(n+1)は、まず適当な学習文字1
を入力する。この学習文字1は特定のものであつ
てもよいし、あるいは不特定のものであつてもよ
い。学習文字1の入力情報は、観測部2によつて
光電変換され、特徴抽出部3に転送される。特徴
抽出部3はその観測文字について1または複数の
特徴を抽出する。
一方、学習文字1はその属するカテゴリがすで
にわかつている文字なので、このカテゴリを知ら
せる信号が前もつて選択処理部4に通知される。
選択処理部4は、この信号にもとづいて辞書部6
から学習文字1と同じカテゴリの辞書を読み出
し、マツチング部5へ転送する。
にわかつている文字なので、このカテゴリを知ら
せる信号が前もつて選択処理部4に通知される。
選択処理部4は、この信号にもとづいて辞書部6
から学習文字1と同じカテゴリの辞書を読み出
し、マツチング部5へ転送する。
辞書部6は、例えば現在n人分の個人辞書を有
しているとすると、第2図図示の如く構成され、
第1番目の筆者から第n番目の筆者までの、すべ
てのカテゴリについての各筆者個有の特徴からな
る辞書を有している。選択処理部4は、学習文字
1が例えばカテゴリbに属するとすると、第2図
図示Aの部分の辞書をマツチング部5に転送する
ことになる。
しているとすると、第2図図示の如く構成され、
第1番目の筆者から第n番目の筆者までの、すべ
てのカテゴリについての各筆者個有の特徴からな
る辞書を有している。選択処理部4は、学習文字
1が例えばカテゴリbに属するとすると、第2図
図示Aの部分の辞書をマツチング部5に転送する
ことになる。
マツチング部5は、特徴抽出部3が抽出した学
習文字1の特徴と、選択処理部4によつて転送さ
れた学習文字1のカテゴリの各個人の特徴とをす
べて照合する。そして、第(n+1)番目の筆者
の書いた学習文字1が、すでに作成されたn人の
筆者のどれに一番似ているかを調べる。すなわち
観測した学習文字1の特徴と、辞書中のn人分の
特徴との距離をそれぞれ演算し、各筆者毎に特徴
の距離を算出する。例えば特徴が複数種類あると
きには、各特徴の平均距離が算出される。この結
果は選択処理部4に通知される。
習文字1の特徴と、選択処理部4によつて転送さ
れた学習文字1のカテゴリの各個人の特徴とをす
べて照合する。そして、第(n+1)番目の筆者
の書いた学習文字1が、すでに作成されたn人の
筆者のどれに一番似ているかを調べる。すなわち
観測した学習文字1の特徴と、辞書中のn人分の
特徴との距離をそれぞれ演算し、各筆者毎に特徴
の距離を算出する。例えば特徴が複数種類あると
きには、各特徴の平均距離が算出される。この結
果は選択処理部4に通知される。
以上の処理を、複数の比較的少数の学習文字1
について繰り返し、上記特徴の距離の筆者毎の合
計値が最も小さい筆者をn人の筆者の中から選出
する。例えば、第i番目の筆者が選出されて、第
(n+1)番目の筆者の文字が第i番目の筆者の
文字に最も近似していることが判別すると、選択
処理部4は第i番目の筆者の個人辞書を、第(n
+1)番目の筆者の初期個人辞書として採用す
る。すなわち、辞書部6に第(n+1)番目の筆
者の辞書用の領域を確保し、第2図図示Bの部分
の第i番目の筆者の辞書情報をコピーする。この
ようにして、すでに作成されている個人辞書の似
ている字体の人の辞書が、新たな筆者に最もふさ
わしい初期個人辞書として利用され、以降の未学
習文字の認識に使用されることになる。
について繰り返し、上記特徴の距離の筆者毎の合
計値が最も小さい筆者をn人の筆者の中から選出
する。例えば、第i番目の筆者が選出されて、第
(n+1)番目の筆者の文字が第i番目の筆者の
文字に最も近似していることが判別すると、選択
処理部4は第i番目の筆者の個人辞書を、第(n
+1)番目の筆者の初期個人辞書として採用す
る。すなわち、辞書部6に第(n+1)番目の筆
者の辞書用の領域を確保し、第2図図示Bの部分
の第i番目の筆者の辞書情報をコピーする。この
ようにして、すでに作成されている個人辞書の似
ている字体の人の辞書が、新たな筆者に最もふさ
わしい初期個人辞書として利用され、以降の未学
習文字の認識に使用されることになる。
初期個人辞書が作成された後に、第(n+1)
番目の筆者が認識対象となる入力文字7を入力す
ると、観測部2は観測結果を特徴抽出部3に通知
する。特徴抽出部3は入力文字7の特徴を抽出し
てマツチング部5に転送する。マツチング部5は
辞書部6から第(n+1)番目の筆者の辞書を読
み出し、その辞書の各カテゴリ毎の特徴と、特徴
抽出部3が抽出した特徴とを比較する。そして、
特徴が最も近いカテゴリを認識結果として、デイ
スプレイ等の表示部8に表示する。
番目の筆者が認識対象となる入力文字7を入力す
ると、観測部2は観測結果を特徴抽出部3に通知
する。特徴抽出部3は入力文字7の特徴を抽出し
てマツチング部5に転送する。マツチング部5は
辞書部6から第(n+1)番目の筆者の辞書を読
み出し、その辞書の各カテゴリ毎の特徴と、特徴
抽出部3が抽出した特徴とを比較する。そして、
特徴が最も近いカテゴリを認識結果として、デイ
スプレイ等の表示部8に表示する。
表示部8に表示された認識結果が正しくない場
合には、キーボード等の入力部9から修正すべき
旨の指示をする。この修正指示は辞書更新処理部
10に伝達される。正しいカテゴリが例えばカテ
ゴリZであつたとすると、辞書更新処理部10は
特徴抽出部3から入力文字7の特徴を受けとり、
この特徴と、辞書部6の第(n+1)番目の筆者
の辞書のカテゴリZの部分の特徴とを用いて、例
えばこれらの特徴量の平均が新たな辞書内容とな
るようにカテゴリZの部分を更新する。こうし
て、使用によつて個人辞書が完成していくように
される。
合には、キーボード等の入力部9から修正すべき
旨の指示をする。この修正指示は辞書更新処理部
10に伝達される。正しいカテゴリが例えばカテ
ゴリZであつたとすると、辞書更新処理部10は
特徴抽出部3から入力文字7の特徴を受けとり、
この特徴と、辞書部6の第(n+1)番目の筆者
の辞書のカテゴリZの部分の特徴とを用いて、例
えばこれらの特徴量の平均が新たな辞書内容とな
るようにカテゴリZの部分を更新する。こうし
て、使用によつて個人辞書が完成していくように
される。
(5) 発明の効果
以上説明した如く本発明によれば、新たな筆者
の個人辞書を簡易・迅速に作成することができ、
個人辞書作成の労力を大幅に軽減することができ
る。しかも、初期段階から高い認識率を得ること
ができる。個人辞書の数が多くなればなるほど、
初期段階における認識率は自然に向上する。
の個人辞書を簡易・迅速に作成することができ、
個人辞書作成の労力を大幅に軽減することができ
る。しかも、初期段階から高い認識率を得ること
ができる。個人辞書の数が多くなればなるほど、
初期段階における認識率は自然に向上する。
第1図は本発明の一実施例構成、第2図は個人
辞書の構成例を示す。 図中、1は学習文字、2は観測部、3は特徴抽
出部、4は選択処理部、5はマツチング部、6は
辞書部、7は入力文字、8は表示部、9は入力
部、10は辞書更新処理部を表わす。
辞書の構成例を示す。 図中、1は学習文字、2は観測部、3は特徴抽
出部、4は選択処理部、5はマツチング部、6は
辞書部、7は入力文字、8は表示部、9は入力
部、10は辞書更新処理部を表わす。
Claims (1)
- 1 少なくとも文字図形を入力する観測部と、該
観測部によつて入力された文字図形から入力文字
の特徴を抽出する特徴抽出部と、各個人毎に上記
特徴抽出部が抽出した特徴と照合されカテゴリの
決定に用いられる特徴が記憶された個人辞書とを
そなえ、文字を認識する文字認識装置において、
新たな個人辞書を作成する場合に個人辞書作成用
の学習文字を入力し、該学習文字の特徴と、既存
の複数の上記個人辞書に記憶された上記学習文字
のカテゴリの特徴とを照合し、距離の最も近い個
人辞書を初期個人辞書として選択する選択処理部
をそなえるとともに、入力文字の認識結果の修正
によつて修正されたカテゴリの上記個人辞書の特
徴を当該入力文字から抽出された特徴にもとづい
て更新する辞書更新処理部とをそなえ、個人辞書
を作成するようにしたことを特徴とする文字認識
装置における個人辞書作成処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57107354A JPS58223887A (ja) | 1982-06-21 | 1982-06-21 | 文字認識装置における個人辞書作成処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57107354A JPS58223887A (ja) | 1982-06-21 | 1982-06-21 | 文字認識装置における個人辞書作成処理方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58223887A JPS58223887A (ja) | 1983-12-26 |
JPH0253832B2 true JPH0253832B2 (ja) | 1990-11-19 |
Family
ID=14456931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57107354A Granted JPS58223887A (ja) | 1982-06-21 | 1982-06-21 | 文字認識装置における個人辞書作成処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58223887A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5319721A (en) * | 1992-04-14 | 1994-06-07 | International Business Machines Corporation | Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set |
JP3131287B2 (ja) * | 1992-05-27 | 2001-01-31 | 株式会社日立製作所 | パターン認識装置 |
-
1982
- 1982-06-21 JP JP57107354A patent/JPS58223887A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS58223887A (ja) | 1983-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0844583B1 (en) | Method and apparatus for character recognition | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
KR19990078364A (ko) | 문서처리장치 및 그의 방법 | |
JPH0253832B2 (ja) | ||
JPH0516632B2 (ja) | ||
KR940007932B1 (ko) | 표의문자 식별장치 및 처리방법 | |
JP4101345B2 (ja) | 文字認識装置 | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
JP3274014B2 (ja) | 文字認識装置および文字認識方法 | |
JPS6061875A (ja) | パターン認識装置における標準パターン作成方法 | |
JP2538543B2 (ja) | 文字情報認識装置 | |
JP3075808B2 (ja) | 文書処理装置 | |
JPH05346974A (ja) | 文字認識装置 | |
JP2974145B2 (ja) | 文字認識結果の修正方法 | |
JP2660998B2 (ja) | 日本語処理装置 | |
JPS6160189A (ja) | 光学的文字読取装置 | |
JPH096920A (ja) | 手書き文字認識方法及びその装置 | |
JPS61260354A (ja) | カナ筆記漢字変換方式 | |
JP3481850B2 (ja) | 文字認識装置 | |
JP2886690B2 (ja) | 光学的文字読取装置における文字認識方法 | |
JPH05165817A (ja) | 文書処理装置 | |
JPH0632087B2 (ja) | パタ−ン認識装置 | |
JPH1091387A (ja) | 語意検索システムの単語入力方法 | |
KR970049822A (ko) | 필기체 다중 문자 인식방법 |