JPH0344356B2 - - Google Patents

Info

Publication number
JPH0344356B2
JPH0344356B2 JP57216468A JP21646882A JPH0344356B2 JP H0344356 B2 JPH0344356 B2 JP H0344356B2 JP 57216468 A JP57216468 A JP 57216468A JP 21646882 A JP21646882 A JP 21646882A JP H0344356 B2 JPH0344356 B2 JP H0344356B2
Authority
JP
Japan
Prior art keywords
dictionary
pattern
correct
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57216468A
Other languages
English (en)
Other versions
JPS59106085A (ja
Inventor
Koya Fujita
Tetsuji Morishita
Yasuhiko Yoshinaga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57216468A priority Critical patent/JPS59106085A/ja
Publication of JPS59106085A publication Critical patent/JPS59106085A/ja
Publication of JPH0344356B2 publication Critical patent/JPH0344356B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明は、特に手書き文字認識装置、音声認識
装置等において、特定者が入力する認識対象パタ
ーンを認識するための辞書パターンを特定者に対
して認識率が向上するように更新する認識装置の
辞書更新方法に関する。
(B) 技術の背景 通常、認識装置、例えば、文字認識装置は入力
された文字が、どのカテゴリに属する文字である
かを判定する資料として標準的な字体を文字パタ
ーンとして格納した、いわゆる標準辞書が設けら
れる。
そして、この標準辞書と入力された認識対象パ
ターン、つまり入力された文字とを比較すること
により入力された文字の認識を行なつている。
しかしながら、例えば、手書き文字等の個人差
のある文字を認識する場合、つまり個人の字体の
みを認識対象として考えた場合には、標準的な字
体を文字パターンとして格納した標準辞書より
も、当該個人の字体を文字パターンとして登録し
た個人辞書を使用した方が認識率を高くすること
ができる。
しかし、この個人辞書を作成するためには、個
人の一人づつが認識対象文字のすべてについて最
初から登録しなければならず、すなわち、通常使
用されるであろう文字すべてについて登録せねば
ならず、その数は膨大な数となり、当該個人にと
つて非常に大変な作業となる。
また、使用する個人が変る場合、変る毎に個人
辞書を作成しなければならず、汎用性が全くな
く、また、個人字体が時間の変化や記入条件等に
より変化することがある等個人差のある文字等を
認識するための個人辞書の作成は大変困難な作業
であつた。
(C) 従来技術と問題点 このため、従来の文字認識装置は、装置に予め
標準辞書を持たせ、後に個人辞書を追加登録して
ゆく方法、つまり、認識対象文字が認識装置内の
辞書で認識できなかつた場合は、この認識対象文
字を個人辞書として追加登録してゆく方法を用い
ていた。
しかしながら、このような従来の認識装置は、
標準辞書に単に個人辞書を追加してゆくだけだつ
たので、あるカテゴリの標準辞書の文字パターン
と、他のカテゴリの個人辞書の文字パターンが非
常に似ていた場合は、誤読を起しやすい、欠点が
あり、筆記者個人の字体が時間の経過によつて変
化した場合は、使用されない文字パターンが増大
し、メモリの容量が増える欠点を有する。
この欠点を解消するため、本出願人は、特願昭
57−111007号にて上記追加方法にさらに文字認識
装置に辞書中の文字パターンの正読、誤読回数を
記録しておく正読誤読管理テーブルを格納したメ
モリを設けることにより辞書中の文字パターンの
正読、誤読の発生頻度を正確に把握し、誤読率の
高い辞書については、すなわち、誤読回数の多い
辞書については、当該辞書を削除し、正読率の高
い文字パターンのみを辞書中に残すことにより、
個人字体の変化に対応が可能な文字認識装置を提
案した。
確かに、本出願人が先に提案した文字認識装置
では、誤読回数の多い辞書を削除し、正読率の高
い文字パターンのみを辞書中に残すので、従来の
認識装置に比べて認識率を高めることができる。
しかしながら、本出願人が先に提案した文字認
識装置であつても正読、誤読が同程度に起るよう
な場合、この辞書を削除することにより、誤読の
原因を少なくすることができるが、この辞書で正
読を起こしていたようなものについては、辞書が
なくなつたことにより認識できなくなる。つま
り、この文字認識装置では、正読が多い辞書であ
つても、誤読が多い場合には、当該辞書を削除し
てしまうので、この辞書を正読として使用する入
力文字パターンは認識できなくなつてしまうとい
う欠点を有している。
(D) 発明の目的 本発明の目的は、前述した欠点に鑑み、個人字
体の細かい変化に対応が可能な認識装置の辞書更
新方法を提供することにある。
(E) 発明の構成 そして、この目的は、本発明によれば、認識対
象パターンと辞書パターンとを比較して前記認識
対象パターンを認識するとともに、前記認識対象
パターンの認識結果として使用された前記辞書パ
ターンの正読、誤読回数を正読誤読管理テーブル
に格納する認識装置において、前記認識対象パタ
ーンを既にある辞書パターンでは認識することが
できない場合は、前記認識対象パターンを辞書パ
ターンとして追加登録し、前記認識対象パターン
が誤読された場合であつて、前記正読誤読管理テ
ーブルに格納されている前記誤読に使用された辞
書パターンの正読回数が所定値以下で、且つ誤読
回数が所定値以上の場合は、前記誤読に使用され
た辞書パターンを削除し、前記認識対象パターン
が正読された場合であつて、正読に使用された辞
書パターンの正読、誤読回数が共に所定値以上と
なつた場合は、前記正読に使用された辞書パター
ンを削除するとともに、前記認識対象パターンを
辞書パターンとして追加登録することを特徴とす
る認識装置の辞書更新方法を提供することにより
達成される。
(F) 発明の実施例 以下、本発明の実施例を図面を用いて詳細に説
明する。
第1図は、本実施例にかかる文字認識装置の辞
書更新方法を説明するための図である。
図において、1は入力された文字の特徴を抽出
する特徴抽出部、2は特徴抽出部1により抽出さ
れた文字の特徴パターンと後述する特徴辞書4内
に格納されている文字パターンとを照合し、入力
された文字の認識を行なうマツチング部、3は特
徴抽出部1からの特徴パターンが格納される特徴
パターン一時格納部、4は入力された文字を認識
するための文字パターンが格納されている特徴辞
書、5はマツチング部2の認識結果が格納される
認識結果格納部、6は認識結果格納部5に格納さ
れた認識結果を表示する表示部、7は表示部6に
表示された認識結果が誤読されている場合、これ
を修正する筆の名種の操作を行なうためのキーボ
ード、8はキーボード7からの修正情報に基づい
て入力された文字が特徴辞書4のどの文字パター
ンで正読あるいは誤読されたかを判定し、後述す
る正読誤読管理テーブル10の正読、誤読回数を
入換える入換え部、9は正読あるいは誤読に使用
された特徴辞書4の文字パターンの正読、誤読回
数をカウントし、該文字パターンを変更あるいは
更新すべきであるか否かを判定する辞書変更判定
部9,10は第2図に示すように、カテゴリ毎
に、カテゴリ名KNA、特徴辞書4中に格納され
た当該カテゴリに属する文字パターンPAT、そ
れ等文字パターンPATが格納されている特徴辞
書4中の辞書アドレスARS、及びそれ等各パタ
ーンPATについての正読回数CAR、誤読回数
WARが格納されている正読誤読管理テーブルで
ある。
以上説明したような構成において、入力された
文字は特徴抽出部1に入力され、そこで文字の特
徴が抽出され、特徴パターンがマツチング部2と
特徴パターン一時格納部3へ出力される。マツチ
ング部2は入力された特徴パターンと特徴辞書4
中に格納された文字パターンPATとを照合し、
一致、ないしは似た文字パターンPATが存在し
た場合には、当該文字パターンPATが属するカ
テゴリKNAの文字が入力されたものとして認識
結果格納部5に当該カテゴリKNAの文字を認識
結果として格納する。
認識結果格納部5に格納された認識結果は表示
部6にて表示され、オペレータが表示部6上に表
示された認識結果を見ながらキーボード7を操作
し、このキーボード7からの情報に基づいて、認
識装置は以下に述べる動作を行なう。
まず、入力された文字が認識できなかつた場合
は、表示部6に「?」マークが表示されるので、
これを見たオペレータは、キーボード7を操作
し、正しい文字を入力するとともに、入力された
文字を特徴辞書4に格納するため、キーボード7
上の図示しない入力文字格納ボタンを押下する。
この入力文字格納ボタンが押下されたことによ
り、入力文字格納情報が辞書変更判定部9に入力
される。
辞書変更判定部9は入力文字の文字パターンを
特徴辞書4に格納するため、辞書変更情報を特徴
パターン一時格納部3、特徴辞書4、及び正読誤
読管理テーブル10に出力する。
特徴パターン一時格納部3は辞書変更情報に基
づいて、入力文字を特徴辞書4に格納し、正読誤
読管理テーブル10は入力文字の正読、誤読回数
管理のための情報を格納する。
次に正読されている文字については放置し、正
読回数をカウントするため、そのまま入換え部8
に出力され、誤読している文字についてはキーボ
ード7により修正する。
つまり、認識結果格納部5にはマツチング部2
にて認識された認識結果が一つしか格納されてい
るのではなく、第2、第3の候補が同時に格納さ
れており、誤読されている文字については第1の
候補に続く最も近いカテゴリKNAの文字を順次
表示部6に表示し、正しい文字が表示されるまで
キーボード7を操作して誤読された文字の修正を
行なう。
ここでマツチング部2より出力される認識結果
情報は、カテゴリKNAのみではなく、正読、誤
読回数を格納するための、文字パターンPATが
カテゴリKNAのうちのどれであるかを示す情
報、すなわち文字パターンPATの特徴辞書4の
辞書アドレスARSも出力される。
その後、誤読回数をカウントするため、誤読に
使用された文字パターンPATと修正に用いられ
た文字パターンPATとを入換え部8に出力する。
次に、このキーボード7からの修正情報に基づ
いて、入換え部8は、正読な場合は、即ち、オペ
レータ側から何らの通知もない場合には、正読誤
読管理テーブル10の、入力された文字の判断の
基準となつた文字パターンPATの正読回数CAR
を1だけ増やし、誤読の場合、即ち、オペレータ
側からキーボード7を介して誤読の通知があつた
場合には誤読回数WARを1だけ増やす。また修
正に用いられた文字パターンPATの正読回数
CARを1だけ増やす。
その後、辞書変更判定部9により、今正読、あ
るいは誤読に用いられた辞書の更新あるいは変更
が必要であるか否かを判定し、辞書の更新、ある
いは変更を行なう。
すなわち、入力された文字が誤読された場合に
は、辞書変更判定部9は正読誤読管理テーブル1
0を検索し、誤読に使用された文字パターン
PATの正読回数CARが一定値以下で、且つ誤読
回数WARが一定値以上の場合は、辞書変更情報
を出力し、特徴辞書4内のその文字パターン
PATを削除するとともに正読誤読管理テーブル
10をクリアする。
また、辞書変更判定部9は誤読回数WARが一
定値以下の場合は、辞書変更情報を出力せず、特
徴辞書4の変更あるいは更新を行なわない。
また、入力文字が正読された場合は、正読誤読
管理テーブル10を検索し、正読に使用された文
字パターンPATの正読回数CAR、誤読回数
WARが共に一定値以上の場合は、辞書変更判定
部9は辞書変更情報を出力し、特徴辞書4内の前
記正読に使用された文字パターンPATを削除す
るとともに正読誤読管理テーブル10をクリアす
る。これと同時に特徴パターン一時格納部3は辞
書変更情報に基づいて、入力文字を特徴辞書4に
格納するとともに、正読誤読管理テーブル10に
入力文字の正読、誤読回数管理のための情報を格
納する。
また正読のみが一定値以上で、誤読が一定値以
下の場合は、その辞書は変更しない。
こうして、入力された文字の認識を行なつてゆ
くうちに、例えば、個人の字体が変化していつた
場合、特徴辞書4内において、入力された文字の
認識のために使用される回数の少ない文字パター
ンPATが出現する。
このような文字パターンPATは、いたずらに
特徴辞書4の領域を占有するだけであり、削除す
る必要がある。
このため、文字の入力を行なつてゆくうちに、
正読誤読管理テーブル10には各カテゴリの各パ
ターンPAT別にその正読、誤読回数が記録され
るので、一定時間経過した時点でオペレータがキ
ーボード7より入換え指令を辞書変更判定部9に
出力する。
すると、辞書変更判定部9は、正読誤読管理テ
ーブル10を検索し、余り使用されなかつた文字
パターンPAT(例えば、第2図に示す辞書アドレ
スARSが13の文字パターンPAT)を当該文字パ
ターンPATが標準辞書であつても個人辞書であ
つても入換え候補として選定し、特徴辞書4中か
ら消去するとともに、正読誤読管理テーブル10
の当該文字パターンPATの正読、誤読情報を削
除する。
以上説明したように、本実施例によれば、個人
字体の細かい変化に対応することができる。
尚、本実施例において、誤読回数が一定値以上
の場合としたのは、使用頻度により辞書の使用回
数は増えるが、それと共に誤読が発生するという
ことは、全体の誤読率が高くなるため、このよう
な辞書は削除する方が好ましいからである。
つまり、使用頻度の少ない辞書に誤読があつた
としても全体の誤読率には大きな影響を与えない
からである。
また、本実施例においては、文字の場合につい
て説明したが、これに限定されるものではなく、
例えば音声認識に用いてもよい。
また、本実施例においては、正読、誤読回数が
所定値以上の場合について、辞書の更新を行なつ
ているが、例えば、正読回数と誤読回数の割合、
正読回数と誤読回数との差等任意に設定して辞書
の更新を行なうようにしてもよい。
(G) 発明の効果 以上説明したように、本発明によれば、個人字
体の細かい変化に対応することができ、正読率の
高い辞書パターンのみを辞書中に残すことがで
き、認識率を高めることができる。
また、正読、誤読回数が多い辞書であつても、
認識対象パターンが正読された場合正読、誤読回
数が所定値以上の場合、正読に使用された辞書パ
ターンを削除し、認識対象パターンを辞書パター
ンとして登録するので、この辞書を正読として使
用する入力文字パターンの認識を行なうことがで
きる。
【図面の簡単な説明】
第1図は、本発明の実施例を説明するための
図、第2図は正読誤読管理テーブルを説明する図
である。 図において、1は特徴抽出部、2はマツチング
部、3は特徴パターン一時格納部、4は特徴辞
書、5は認識結果格納部、6は表示部、7はキー
ボード、8は入換え部、9は辞書変更判定部、1
0は正読誤読管理テーブルである。

Claims (1)

    【特許請求の範囲】
  1. 1 認識対象パターンと辞書パターンとを比較し
    て前記認識対象パターンを認識するとともに、前
    記認識対象パターンの認識結果として使用された
    前記辞書パターンの正読、誤読回数を正読誤読管
    理テーブルに格納する認識装置において、前記認
    識対象パターンを既にある辞書パターンでは認識
    することができない場合は、前記認識対象パター
    ンを辞書パターンとして追加登録し、前記認識対
    象パターンが誤読された場合であつて、前記正読
    誤読管理テーブルに格納されている前記誤読に使
    用された辞書パターンの正読回数が所定値以下
    で、且つ誤読回数が所定値以上の場合は、前記誤
    読に使用された辞書パターンを削除し、前記認識
    対象パターンが正読された場合であつて、正読に
    使用された辞書パターンの正読、誤読回数が共に
    所定値以上となつた場合は、前記正読に使用され
    た辞書パターンを削除するとともに、前記認識対
    象パターンを辞書パターンとして追加登録するこ
    とを特徴とする認識装置の辞書更新方法。
JP57216468A 1982-12-10 1982-12-10 認識装置の辞書更新方法 Granted JPS59106085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57216468A JPS59106085A (ja) 1982-12-10 1982-12-10 認識装置の辞書更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57216468A JPS59106085A (ja) 1982-12-10 1982-12-10 認識装置の辞書更新方法

Publications (2)

Publication Number Publication Date
JPS59106085A JPS59106085A (ja) 1984-06-19
JPH0344356B2 true JPH0344356B2 (ja) 1991-07-05

Family

ID=16688934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57216468A Granted JPS59106085A (ja) 1982-12-10 1982-12-10 認識装置の辞書更新方法

Country Status (1)

Country Link
JP (1) JPS59106085A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59214900A (ja) * 1983-05-23 1984-12-04 株式会社日立製作所 音声認識装置
JPS6141199A (ja) * 1984-07-31 1986-02-27 シャープ株式会社 日本語音声入力装置
JPS6214700A (ja) * 1985-07-12 1987-01-23 三洋電機株式会社 音声認識装置
JPH0752354B2 (ja) * 1985-09-11 1995-06-05 沖電気工業株式会社 音声認識装置
JPH0632087B2 (ja) * 1985-11-06 1994-04-27 株式会社日立製作所 パタ−ン認識装置
JPH01307887A (ja) * 1988-06-06 1989-12-12 Patoroma Res Kk 手書き文字読取装置
US5319721A (en) * 1992-04-14 1994-06-07 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set
JPH0626723U (ja) * 1992-09-21 1994-04-12 瓔子 三浦 オレンジ皮むきスティック
JP3466689B2 (ja) 1994-01-26 2003-11-17 キヤノン株式会社 手書き文字認識方法及びその装置
JP3428512B2 (ja) * 1999-07-14 2003-07-22 日本電気株式会社 文字認識装置およびコンピュータ可読記録媒体
CN103019398A (zh) * 2011-09-20 2013-04-03 腾讯科技(深圳)有限公司 一种文字输入方法及文字输入装置

Also Published As

Publication number Publication date
JPS59106085A (ja) 1984-06-19

Similar Documents

Publication Publication Date Title
JPH0344356B2 (ja)
EP0665506B1 (en) Method and apparatus for handwritten character recognition
JPH07509576A (ja) 文字の認識方法
JPS6228889A (ja) 情報認識装置
JP3481850B2 (ja) 文字認識装置
JPH0347554B2 (ja)
JPH10162101A (ja) 手書き文字認識装置および手書き文字認識方法
JPS59794A (ja) 文字認識装置
JP3130392B2 (ja) 文字認識装置
JP3365538B2 (ja) オンライン文字認識方法および装置
JPH10105645A (ja) 文字認識装置
JPH0816571A (ja) 漢字入力装置
JPH03176786A (ja) 手書き文字の認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPS6330991A (ja) 文字認識装置
JPS6293776A (ja) 情報認識装置
JPH07110844A (ja) 日本語文書処理装置
JPS63188284A (ja) 文字読取装置
JP3743252B2 (ja) アルファベット表記法人名検索システムと方法およびその処理プログラムを記録した記録媒体
JPH0935007A (ja) 手書き文字・図形認識装置
JPS61133487A (ja) 文字認識装置
JP2665488B2 (ja) 個人辞書登録方式
JPS63233489A (ja) 文字読取装置
JPH056456A (ja) 文字認識装置
JPH07325888A (ja) 辞書登録方法,文字認識方法及び文字認識装置