JPS59106085A - 認識装置の辞書更新方法 - Google Patents

認識装置の辞書更新方法

Info

Publication number
JPS59106085A
JPS59106085A JP57216468A JP21646882A JPS59106085A JP S59106085 A JPS59106085 A JP S59106085A JP 57216468 A JP57216468 A JP 57216468A JP 21646882 A JP21646882 A JP 21646882A JP S59106085 A JPS59106085 A JP S59106085A
Authority
JP
Japan
Prior art keywords
dictionary
pattern
character
correct
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57216468A
Other languages
English (en)
Other versions
JPH0344356B2 (ja
Inventor
Koya Fujita
藤田 孝弥
Tetsuji Morishita
森下 哲次
Yasuhiko Yoshinaga
吉永 泰彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57216468A priority Critical patent/JPS59106085A/ja
Publication of JPS59106085A publication Critical patent/JPS59106085A/ja
Publication of JPH0344356B2 publication Critical patent/JPH0344356B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (4)発明の技術分野 本発明は、特に手書き文字認識装置、音声認識装置等に
おいて、特定者が人力する認識対象バター/を認識する
ための辞書パターンを特定者に対して認識率が向上する
ように更新する認識装置の辞書更新方法に関する。
■)技術の背景 通常、認識装置2例えば、文字認識装置は入力された文
字が、どのカテゴリに属する文字であるかを判定する資
料として標準的な字体を文字パターンとして格納した、
いわゆる標準辞書が設けられる。
そして、この標準辞書と人力された認識対象パターン、
つま少入力された文字とを比較することによ少入力され
た文字の認識を行なっている。
しかしながら、例えば、手省き文字等の個人差のある文
字を認識する場合、つまシ個人の字体のみを認識対象と
して考えた場合には、標準的な字体を文字パターンとし
て格納した標準辞書よシも、当該個人の字体を文字パタ
ーンとして登録した個人辞4I−を使用した方が認識率
を高くすることができる。
しかし、この個人辞書を作成するためには、個人の一人
づつが認識対象文字のすべてについて最初から登録しな
ければならず、すなわち、通常使用をワ、るであろう文
字すべてについて登録せねはならず、その数は膨大な数
となシ、当該個人ンことって非常に大変な作業となる。
また、使用する個人が変る場合、変る毎に個人辞書を作
成しlければならず、汎用性が全くなく、まだ、個人字
体が時間の変化や記入条件等によシ変化することがある
等個人差のある文字等を認識するだめの個人解重の作成
は大変困難なfi−業であった0 (Q  従来技術と問題点 このだめ、従来の文字認識装置は、装置に予め標準辞書
を持たせ、後に個人辞書を追加登録して°ゆく方法、つ
まシ、認識対象文字が認識装置内の辞書で認識できなか
った場合は、この認識対象文字を個人辞書として追加登
録してゆく方法を用゛いていた。
しかしながら、このような従来の認識装置は、標準辞書
に単に個人辞書を追加してゆくだけだったので、あるカ
テゴリの標準辞書の文字パターンと、他のカテゴリの個
人辞書の文字パターンが非常に似ていた場合は、誤読を
起しやすい、欠点があシ、筆記者個人の字体が時間の経
過によって変化した場合は、使用されない文字パターン
が増大し、メモリの容量が増える欠点を有する。
この欠点を解消するため、本出願人は、特願昭57−1
11007号にて上記追加方法にさらに文字認識装置に
辞1.中の文字パターンの正読、誤読回数を記録してお
く正読誤読管理テーブルを格納したメモリを設けること
によシ辞書中の文字パターンの正読、誤読の発生頻度を
正確に把握し、誤読率の高い辞書については、すなわち
、誤読回数の多い辞書については、当該辞書を削除し、
正読率の高い文字パターンのみを辞書中に残すことによ
シ、個人字体の変化に対応が可能な文字認識装置を提案
した。
確かに、本出願人が先に提案した文字認識装置では、誤
読回数の多い辞書を削除し、正読率の高い文字パターン
のみを辞書中に残すので、従来の認識装置に比べて認識
率を高めることができる。
しかしながら、本出願人が先に提案した文字認識装置で
あっても正読、誤読が同程度に起るような場合、この解
重を削除することによシ、誤読の原因を少なくすること
ができるが、この辞書で正読を起こしていたようなもの
については、辞書がなくなったことによシ認識できなく
なる。つまシ、この文字認識装置では、正読が多い辞書
であっても、誤読が多い場合には、当該辞書を削除して
しまうので、この辞書を正読として使用する人力文字パ
ターンは認識できなくなってしまうという欠点を有して
いる。
(2)発明の目的 本発明の目的は、前述した欠点に鑑み、個人字体の細か
い変化に対応が可能な認識装置の辞書更新方法を提供す
ることにある。
(ト)発明の・構成 そして、この目的は、本発明によれば、認識対象パター
ンと辞書パターンとを比較して前記認識対象パターンを
認識するとともに1前記認識対象パターンの認識結果と
して使用された前記辞書パターンの正読、誤読回数を正
読誤読管理テーブルに格納する認識装置において、前記
認識対象パターンを既にある辞書パターンでは認識する
ことができない場合は、前記認識対象パターンを辞書パ
ターンとして追加登録し、前記認識対象パターンが誤読
された場合であって、前記正読誤読管理テーブルに格納
されている前記誤読に使用された辞書パターンの正読回
数が所定値以下で、且つ誤読回数が所定値以上の場合は
、前記誤読に使用された辞書パターンを削除し、前記認
識対象パターンが正読された場合であって、正読に使用
された辞書パターンの正読、誤読回数が共に所定値以下
となっだ場合は、前記正読に使用された辞書パターンを
削除するとともに1前記認識対象パターンを辞書パター
ンとして追加登録することを特徴とする認識装置の辞書
更新方法を提供することにより達成される。
■ 発明の実施例 以下、本発明の実施例を図面を用いて詳細に説明する。
第1図は、本実施例にかかる文字認識装置の辞書更新方
法を説明するだめの図である。
図において、1は入力された文字の特徴を抽出する特徴
抽出部、2は特徴抽出部1によシ抽出された文字の特徴
パターンと後述する特徴辞書4内に格納されている文字
パターンとを照合し、入力された文字の認識を行なうマ
ツチング部、3は特徴抽出部1からの特徴パターンが格
納される特徴パターン一時格納部、4は入力された文字
を認識するための文字パターンが格納されている特徴辞
書、5はマツチング部2の認識結果が格納される認識結
果格納部、6は認識結果格納部5に格納された認識結果
を表示する表示部、7は表示部6に表示された認識結果
が誤読されている場合、これを修正する筆の各種の操作
を行なうだめのキーボード、8はキーボード7からの修
正情報に基づいて入力された文字が特徴辞書4のどの文
字パターンで正読あるいは誤読されたかを判定し、後述
する正読誤読管理テーブル10の正読、誤読回数を入換
える入換え部、9は正読あるいは誤読に使用された特徴
辞書4の文字バク−/の正読、誤読回数をカウントし、
該文字パターンを変更あるいは更新すべきであるか否か
を判定する辞書変更判定部9,10は第2図に示すよう
に、カテゴリ毎に、カテゴリ名KNA、特徴辞書4中に
格納された当該カテゴリに属する文字パターンFAT、
  それ等文字パターンFATが格納されている特徴辞
書4中の辞書アドレスAR8,及びそれ等各パターンP
ATKついての正読回数CAR,誤読回数WARが格納
されている正続誤読管理テーブルである。
以上説明したような構成において、入力された文字は特
徴抽出部1に入力され、そこで文字の特徴が抽出され、
特徴パターンがマツチング部2と特徴パターン一時格納
部3へ出力される。マツチング部2は入力さノした特徴
パターンと特徴語−書4中例格納された文字パターンF
ATとを照合し、一致、ないしは似た文字パターンFA
Tが存在した場合には、当該文字パターンP A 1’
が柄するカテゴリKNAの文字が入力されたものとして
誌if+<結果格納部5に当該カテゴ1.IKNAの文
字を認識結果として格納する。
誌職結果格#′+都5に格納さtlノね認識結果は表示
部6にて城示ぜtl、オペレータが表示部6上に表示き
れたJ識紅1果を見ながらキーボード7を操作し、この
キーボード7がらの情報に基づいて、認識装置゛は以下
に述べる動作を行なう。
まず、人力された文字が認識できなかった場合は、表示
部6に「?」マークが表示されるので、これを見たオペ
レータは、キーボード7を操作し、正しい文字を人力す
るとともに、人力された文字を特徴辞書4に格納するた
め、キーボード7上の図示しない人力文字格納ボタンを
押下する。
この入力文字格納ボタンが押下されたことによ)、入力
文字格納情報が辞書変更判定部9に入力される。
辞書変更判定部9は入力文字の文字パターン・を特徴辞
書4に格納するため、辞書変更情報を特徴パターン一時
格納部3.特徴辞書4.及び正読誤読管理テーブル10
に出力する。
特徴パターン一時格納部3は辞書変更情報に基づいて、
入力文字を特徴辞書4に格納し、正読誤読管理テーブル
10は入力文字の正読、誤読回数管理のだめの情報を格
納する。
次に正読されている文字については放置し、正読回数を
カウントするため、そのまま人換え部8に出力され、誤
読している文字についてはキーボード7によシ修正する
つまシ、認識結果格納部5にはマツチング部2にて認識
された認識結果が一つしか格納されているのではなく、
第2.第3の候補が同時に格納されておシ、誤読されて
いる文字については第1の候補に続く最も近いカテゴI
JKNAの文字を順次表示部6に表示し、正しい文字が
表示されるまでキーボード7を操作して誤読された文字
の修正を行なう。
ここでマツチング部2よシ出力される認識結果情報は、
カテゴ1.IKNAのみではなく、正統、誤読回数を格
納するための、文字パターンPATがカテゴリKNAの
うちのどれであるかを示す情報、すなわち文字パターン
FATの特徴辞書4の辞書アドレスAR8も出力される
その後、誤読回数をカウントするため、誤読に使用され
た文字パターンPATと修正に用いられた文字パターン
FATとを入換え部8に出力する。
次に、このキーボード7からの修正情報に基づいて、入
換え部8は、正読の場合は、即ち、オペレータ側から何
らの通知もない場合には、正読誤読管理テーブル10の
、入力された文字の判断の基準となった文字パターンP
ATの正読回数CARを・1だけ増やし、誤読の場合、
即ち、オペレータ側からキーボード7を介して誤読の通
知があった場合には誤読回数WARを1だけ増やす。ま
た修正に用いられた文字パターンPATの正読回数CA
Rを1だけ増やす。
その後、辞書変更判定部9によシ、今正読、あるいは誤
読に用いられた辞書の更新あるいは変゛更が必要である
か否かを判定し、辞書の更新、あるいは変更を行なう。
すなわち、入力された文字が訝読された場合には、辞書
変更判定部9は正読誤読管理テーブル10を検索し、誤
読に使用された文字パターンPATの正読回数CARが
一定値以下で、且つ誤読回数WARが一定値以上の場合
は、辞1変更情報を出力し、特徴辞書4内のその文字パ
ターンFATを削除するとともに正読誤読管理テーブル
10をクリアする。
また、辞書変更判定部9は誤読回数WARが一定値以下
の場合は、辞書変更情報を出力せず、特徴辞書4の変更
あるいは更新を行なわない。
また、入力文字が正読された場合は、正読誤読管理テー
ブル10を検索し、正読に使用された文字パターンPA
Tの正読回数CAR,誤読回数WARが共に一定値以上
の場合は、辞書変更判定部9は#を変更情報を出力し、
特徴辞書4内の前記正読に使用はれた文字パターンFA
Tを削除するとともに正統誤読管理テーブル1oをクリ
アする。これと同時に特徴パターン一時格納部3は辞書
変更情報に基ついて、入力文字を特徴辞書4に格納すル
トともに、正読誤読gf理テーブル1oに入力文字の正
読、誤読回数管理のための情報を格納する。
また正読のみが一定値以上で、誤読が一定値以下の場合
は、その静上、は変更しない。
こうして、人力ざil、た文字の認識を行なってゆくう
ちに、例えば、個人の字体が変化していった場合、特徴
辞書4内において、人力された文字のU fJcのため
に使用される回数の少ない文字パターンF A Tが出
現する。
このような文字パターンFATは、いたずらに特徴辞書
4の領域を占有する7ヒけて;lりjl)、削除する必
要がある。
このため、文字の入力を行なってゆくうちに、正読誤読
管理テーブル10には各カテゴリの各パターンFAT別
にその正読、誤読回数が記録されるので、一定時間経過
した時点でオペレータがキーボード7よシ入換え指令を
辞書変更判定部9に出力する。
すると、辞書変更判定部9は、正統誤読管理テーブル1
0を検索し、余シ使用されなかった文字パターンFAT
 (例えば、f:g2図に示す辞書アドレスAR8が1
3の文字パターンFAT)を当該文字パターンFATが
標準辞書であっても個人辞書であっても入換え候補とし
て選定し、特徴辞書4中から消去するとともに、正読誤
読管理テーブル10の当該文字パターンFATの正読、
誤読情報を削除する。
以上説明したように、本実施例によれば、個人字体の細
かい変化に対応することができる。
尚、本実施例において、誤読回数が一定値以上の場合と
したのは、使用頻度により辞1の使用回数は増えるが、
それと共に誤読が発生するということは、全体の誤読率
が高く々るため、このような辞書は削除する方が好まし
いからである。
つまり、使用頻度の少ない辞書に誤読があったとしても
全体の誤読率には大きな影響を与えないからである。
また、本実施例においては、文字の場合について説明し
たが、これに限定されるものではなく、例えば音声認識
に用いてもよい。
まだ、本実施例においては、正読、誤読回数が所定値以
上の場合について、辞書の更新を行なっているが、例え
ば、正読回数と誤読回数の割合、正読回数と誤読回数と
の差等任意に設定して辞書の更新を行なうようにしても
よい。
(G)  発明の詳細 な説明したように、本発明によれば、個人字体の細かい
変化に対応することができ、正読率の高い辞書パターン
のみを辞書中に残すことができ、認識率を高めることが
できる。
また、正読、誤読回数が多い辞書であっても、認識対象
パターンが正読された場合正読、誤読回数が所定値以上
の場合、正読に使用された辞書パターンを削除し、認識
対象パターンを辞書パターンとして登録するので、この
辞書を正読として使用する入力文字パターンの認識を行
なうととができる。
【図面の簡単な説明】
第1図は、本発明の詳細な説明するだめの図、第2図は
正読誤読管理テーブルを説明する図である0 図において、1は特徴抽出部、2はマツチング部、3は
特徴パターン一時格納部、4は特徴辞書、5は認識結果
格納部、6は表示部、7はキーボード、8は入換え部、
9は辞書変更判定部、10は正読誤読管理テ良プルであ
る。 入〃へ°ターン 等1図 第 2 図

Claims (1)

    【特許請求の範囲】
  1. 認識対象パターンと辞書パターンとを比較して前記認識
    対象パターンを認識するとともに、前記認識対象パター
    ンの認識結果として使用された前記辞書パターンの正読
    、誤読回数を正読誤読管理テーブルに格納する認識装置
    において、前記認識対象パターンを既にある辞書パター
    ンでは認識することができない場合は、前記認識対象パ
    ターンを静聴パターンとして追加登録し、前記認識対象
    パターンが誤読された場合であって、前記正読誤読管理
    テーブルに格納されている前記誤読に使用された辞書パ
    ターンの正読回数が所定値以下で、且つ誤読回数が用足
    値以上の場合は、前記誤読に使用された辞書パターンを
    削除し、前記認識対象パターンが正読された場合でおっ
    て、正読に使用された辞1<ターンの正読、誤読回数が
    共に所定を以上となった場合は、前記正読に使用された
    辞書パターンを削除するとともに、前記認識対象パター
    ンを辞書パターンとして追加登録することを特徴とする
    認識装置の辞書更新方法。
JP57216468A 1982-12-10 1982-12-10 認識装置の辞書更新方法 Granted JPS59106085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57216468A JPS59106085A (ja) 1982-12-10 1982-12-10 認識装置の辞書更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57216468A JPS59106085A (ja) 1982-12-10 1982-12-10 認識装置の辞書更新方法

Publications (2)

Publication Number Publication Date
JPS59106085A true JPS59106085A (ja) 1984-06-19
JPH0344356B2 JPH0344356B2 (ja) 1991-07-05

Family

ID=16688934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57216468A Granted JPS59106085A (ja) 1982-12-10 1982-12-10 認識装置の辞書更新方法

Country Status (1)

Country Link
JP (1) JPS59106085A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59214900A (ja) * 1983-05-23 1984-12-04 株式会社日立製作所 音声認識装置
JPS6141199A (ja) * 1984-07-31 1986-02-27 シャープ株式会社 日本語音声入力装置
JPS6214700A (ja) * 1985-07-12 1987-01-23 三洋電機株式会社 音声認識装置
JPS6259997A (ja) * 1985-09-11 1987-03-16 沖電気工業株式会社 音声認識装置
JPS62107389A (ja) * 1985-11-06 1987-05-18 Hitachi Ltd パタ−ン認識装置
JPH01307887A (ja) * 1988-06-06 1989-12-12 Patoroma Res Kk 手書き文字読取装置
EP0565871A2 (en) * 1992-04-14 1993-10-20 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set
JPH0626723U (ja) * 1992-09-21 1994-04-12 瓔子 三浦 オレンジ皮むきスティック
EP0665506A2 (en) * 1994-01-26 1995-08-02 Canon Kabushiki Kaisha Method and apparatus for handwritten character recognition
JP2001028035A (ja) * 1999-07-14 2001-01-30 Nec Corp 文字認識装置およびコンピュータ可読記録媒体
CN103019398A (zh) * 2011-09-20 2013-04-03 腾讯科技(深圳)有限公司 一种文字输入方法及文字输入装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0554116B2 (ja) * 1983-05-23 1993-08-11 Hitachi Ltd
JPS59214900A (ja) * 1983-05-23 1984-12-04 株式会社日立製作所 音声認識装置
JPS6141199A (ja) * 1984-07-31 1986-02-27 シャープ株式会社 日本語音声入力装置
JPS6214700A (ja) * 1985-07-12 1987-01-23 三洋電機株式会社 音声認識装置
JPS6259997A (ja) * 1985-09-11 1987-03-16 沖電気工業株式会社 音声認識装置
JPS62107389A (ja) * 1985-11-06 1987-05-18 Hitachi Ltd パタ−ン認識装置
JPH01307887A (ja) * 1988-06-06 1989-12-12 Patoroma Res Kk 手書き文字読取装置
EP0565871A2 (en) * 1992-04-14 1993-10-20 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set
EP0565871A3 (ja) * 1992-04-14 1994-02-16 Ibm
JPH0626723U (ja) * 1992-09-21 1994-04-12 瓔子 三浦 オレンジ皮むきスティック
EP0665506A2 (en) * 1994-01-26 1995-08-02 Canon Kabushiki Kaisha Method and apparatus for handwritten character recognition
EP0665506A3 (en) * 1994-01-26 1996-02-21 Canon Kk Method and device for recognizing handwritten characters.
US6208755B1 (en) 1994-01-26 2001-03-27 Canon Kabushiki Kaisha Method and apparatus for developing a character recognition dictionary
JP2001028035A (ja) * 1999-07-14 2001-01-30 Nec Corp 文字認識装置およびコンピュータ可読記録媒体
CN103019398A (zh) * 2011-09-20 2013-04-03 腾讯科技(深圳)有限公司 一种文字输入方法及文字输入装置

Also Published As

Publication number Publication date
JPH0344356B2 (ja) 1991-07-05

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPS59106085A (ja) 認識装置の辞書更新方法
KR20010093764A (ko) 어근 모델에 근거한 초서체 한자 주석의 검색법
JP5455364B2 (ja) 情報処理装置及び軌跡データ認識方法
JPH06215184A (ja) 抽出領域のラベリング装置
JP3481850B2 (ja) 文字認識装置
JP2002163608A (ja) 手書き文字認識装置
JPS6228889A (ja) 情報認識装置
WO2023021636A1 (ja) データ処理装置、データ処理方法及びプログラム
JPS59794A (ja) 文字認識装置
JP4263928B2 (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び記録媒体
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP3033554B2 (ja) 文字認識装置
JPS61272882A (ja) 情報認識装置
JP2618018B2 (ja) 文字認識装置
JPH0347554B2 (ja)
JP2001022891A (ja) 認識装置および認識用記憶媒体
JPH07110844A (ja) 日本語文書処理装置
JPH0366704B2 (ja)
JPH10162101A (ja) 手書き文字認識装置および手書き文字認識方法
JPS6293776A (ja) 情報認識装置
JPH0589281A (ja) 誤読修正・検出方法
JPH0355874B2 (ja)
JP2000251017A (ja) 単語辞書作成装置および単語認識装置
JPH10105645A (ja) 文字認識装置