JPH0488490A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0488490A
JPH0488490A JP2197336A JP19733690A JPH0488490A JP H0488490 A JPH0488490 A JP H0488490A JP 2197336 A JP2197336 A JP 2197336A JP 19733690 A JP19733690 A JP 19733690A JP H0488490 A JPH0488490 A JP H0488490A
Authority
JP
Japan
Prior art keywords
character
characters
candidate
dictionary
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2197336A
Other languages
English (en)
Inventor
Kazuharu Usui
薄井 一治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP2197336A priority Critical patent/JPH0488490A/ja
Publication of JPH0488490A publication Critical patent/JPH0488490A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文字認識装置に関し、特に、入力文字パター
ンから抽出した特徴量と特徴量辞書との比較によって候
補文字を一つに絞り込むことが難しい漢字や手書き文字
の認識に好適な文字認識装置に関する。
従来の技術 一般に文字認識装置においては、入力文字パターンから
特徴量を抽出し、この特徴量と特徴量辞書との比較を行
って、特徴量の距離が小さい候補文字を求める。しかし
、類似文字が多い漢字や、文字変形によって特徴量の変
動が大きな手書き文字などを認識対象とした場合、特徴
量の比較によって候補文字を一つに絞り込むと認識率が
低下してしまう。
そこで、漢字や手書き文字を認識する文字認識装置にお
いては、特徴量辞書との比較によって、特徴量の距離が
小さい順に順位をつけて複数の候補文字を求め、これを
デイスプレィに表示し、オペレータにより第1位候補文
字が誤っている場合には、他の候補文字より正解文字を
選択させ認識誤りを修正させている。そして、この修正
の場合には、正解文字に選ばれた文字の特徴量に基づい
て特徴量辞書を修正することにより、次回の認識時の正
解率向上を図る方式が採られている。すなわち、特徴量
辞書自体の学習を行う方式である。
しかし、このような特徴量辞書自体の学習を行う方式は
、その処理が一般に複雑であるうえに、学習内容が不適
切であると逆に正解率の著しい低下を招く危険が常に付
きまとい、その場合の回復も簡単ではなく、辞書容量も
一般に大きくなるという問題がある。
また、入力文字パターンの特徴量と特徴量辞書との比較
によって得た複数の候補文字の共通パターン要素(部首
など)を識別し、入力文字パターンから共通パターン要
素を除いた部分パターンの認識を行い、その結果に基づ
き候補文字群から一つの候補文字を選択する文字認識手
法も考案されている(特開昭59−45587号)。
しかし、これは共通パターン要素の識別、除去、部分パ
ターンの認識といった面倒な処理が必要となるため、文
字認識装置の構成の複雑化及び認識処理速度の低下を避
けることができない。
このような装置構成の複雑化及び処理速度の低下を招く
ことなく候補文字の絞り込みを行うための技術として、
予め選ばれた文字毎の特徴量の距離の小さい類似文字が
登録されたテーブルを用意し、入力文字パターンの特徴
量と特徴量辞書との照合によって得られた複数の候補文
字に関し、各候補文字毎に、それに対応して前記テーブ
ルに登録された類似文字と他の候補文字との一致数を調
べ、この一致数が最大の候補文字を第1位候補文字とし
て他の候補文字の順位を修正する技術が考案され、同一
出願人の特許出願に係る特開平1173272号公報に
詳細に述べられている。
発明が解決しようとする課題 この技術によれば、装置構成の複雑化や処理速度の低下
を招くことなく、特徴量辞書との照合により得られる第
1位候補文字にくらべ、第1位候補文字の正解率を大幅
に向上できることが確認されている。
しかし、印刷文字であってもユーザによって様々な字体
が用いられること、また手書き文字認識の場合には予測
できないような字形変動もあることから、予め様々な字
体や多数の筆者による手書き文字のデータベースに基づ
いて特徴量辞書及びテーブルを作成しても、実際の装置
利用上で期待される正解率を達成できない場合がある。
本発明は、上述の問題点に鑑みてなされたもので、装置
構成の複雑化及び認識処理速度の低下を招くことなく、
また正解率の低下を招く危険などが付きまとう特徴量辞
書自体の学習を行うことなく、ユーザの装置利用の実情
に適応させて高い正解率を達成可能な文字認識装置を提
供することを目的とする。
課題を解決するための手段 本発明は上述の課題を解決するため、入力文字パターン
から抽出された特徴量と特徴量辞書との比較により特徴
量の距離の小さい順に順位付けした複数の候補文字を求
める辞書照合手段と、予め選ばれた文字毎に特徴量の距
離の小さい類似文字が登録される学習テーブルと、前記
辞書照合手段により求められた複数の候補文字に関し、
各候補文字毎に、それに対応して前記学習テーブルに登
録された類似文字と他の候補文字との一致数を調べ、こ
の一致数が最大の候補文字を第1位候補文字として他の
候補文字の順位を修正するテーブル照合手段と、このテ
ーブル照合手段により順位修正後の複数の候補文字に対
し入力手段を通じオペレータから正解文字の修正情報が
入力された場合に、この修正情報により正解文字として
指定された候補文字に対応した前記学習テーブル内の類
似文字を他の候補文字によって書き替える手段とを有す
るという構成を備えたものである。
作用 特徴量辞書との照合によって候補文字を絞り込みにくい
文字とは、特徴量の距離が小さい類似文字が多い文字で
あるが、このような文字は特微量辞書の作成段階である
程度限定することができる。
上述の本発明による文字認識装置によれば、そのような
類似文字の多い文字毎に、例えば特徴量辞書作成の段階
で類似文字を調べて学習テーブルに予め登録しておくな
らば、入力文字パターンの特微量と特徴量辞書との照合
により得られた複数の候補文字の中から、学習テーブル
との照合により正解文字を高い確度で第1位候補文字に
選ぶことができ、正解率を大幅に向上できることが実験
的に確認されている。
また、ユーザが特徴辞書作成の際に予定していなかった
字体や癖のある手書き文字を認識させるような場合、当
初は学習テーブルの内容が必ずしも適切でないために期
待した通りの正解率を得られないこともあるが、実際に
文字認識を行い、その誤りの修正を行う過程で比較的短
期間に学習テーブルの内容がユーザの装置利用の実情に
適応した内容に更新されるため、高い正解率を達成でき
るようになる。
そして、テーブル照合手段や学習テーブルを更新する手
段は比較的簡単な構成とすることができ、また、テーブ
ル照合による候補文字順位修正の処理は容易に高速化す
ることができるので文字認識処理速度の低下を招く恐れ
はない。さらに、学習テーブルの更新によって、いわゆ
る学習機能が実現されるので、特徴量辞書自体に学習を
行う方式のような問題は避けられる。
実施例 以下本発明の一実施例について、図面を参照しながら説
明する。
第1図は本発明の一実施例による文字認識装置の概略ブ
ロック図であって、1は文書などの原稿を読み取る原稿
読取部、2は読み取られた原稿イメージから一つ一つの
文字パターンの切り出し、正規化などを行う前処理部で
ある。3は前処理部2かも入力された文字パターンの特
微量を抽出する特徴抽出部である。4は各種文字パター
ンの特微量を登録した特徴量辞書であり、これは実際的
にはRAMやROMなどの記憶装置上におかれる。
6は入力文字パターンから抽出された特微量と特徴量辞
書4との比較を行って、特微量の距離が小さい複数の候
補文字を、距離の小さい順に順位付けして求める辞書照
合部であり、6はその候補文字のコードを一時的に保持
するレジスタである。
ここまでの構成は従来の一般的な文字認識装置と同様で
ある。
了は学習テーブルであり、実際的にはRAMなどの書き
替え可能な記憶装置上に置かれる。この学習テーブル7
は、予め選ばれた文字毎に特微量の距離が小さい類似文
字が登録されるものである。
当初は、この学習テーブル7には特徴量辞書4に基づい
て予め決定された類似文字が登録されているが、装置利
用中の学習により、その登録内容は随時更新される。類
似文字の並び順は例えば対応文字との距離の小さい順と
なっている。
8はテーブル照合部であり、これはレジスタ6に設定さ
れた候補文字毎に、それに対応して学習テーブル8に登
録されている類似文字と他の候補文字との一致数を調べ
、一致数が最大の候補文字を第1位候補文字に決定し、
他の候補文字の順位を修正する。
10は書き替え可能な記憶装置であり、ここにオペレー
タによる修正前または修正後の認識結果のデータなどが
蓄積される。
11はデイスプレィ、12はキーボードである。
オペレータは、このデイスプレィ11及びキーボード1
2を介して認識結果の修正などを行うことができる。
13は装置各部の動作やデータの流れの制御のほか、認
識結果の修正や、この修正に伴う学習テーブル70更新
(学習)を行う主制御部である。
第2図はテーブル照合部8の構成例を示すもので、16
は制御判定回路、16は文字比較回路、17は一致数カ
ウンタ、18は最大値レジスタ、19は候補レジスタで
ある。
以上のように構成された文字認識装置について、以下そ
の動作を説明する。
主制御部13の制御下で、原稿読取部1によって原稿の
イメージが読み取られ、このイメージから前処理部2に
よって文字パターンが切り出され、その正規化パターン
が特徴抽出部3に入力され、その特徴量が抽出されて辞
書照合部6に入力される。辞書照合部6により、その特
徴量と特徴量辞書4との比較が行われ、特徴量の距離が
小さな候補文字が距離の小さい順に順位付けされ最高7
位まで抽出され、それぞれの文字コードがレジスタ6に
設定される。
一つの入力文字パターンに対する候補文字が得られる度
に、テーブル照合部8内の制御判定回路15は主制御部
13より起動される。
談ず主制御部16は、一致数カウンタ17及び最大値レ
ジスタ18をリセットし、次にレジスタe内の第1位候
補の文字に対応して学習テーブル7に登録されている類
似文字(7文字)の最初の文字コードを読み出して文字
比較回路16に入力する。次にレジスタ6内の他の候補
文字のコードを順に文字比較回路16に入力し、文字コ
ードの比較を行わせ、文字比較回路16から出る一致信
号を一致数カウンタ17でカウントさせる。
次に第1位候補文字に対応した2番目の類似文字のコー
ドを学習テーブル7より読み出して文字比較回路16に
入力し、第1位候補文字以外の候補文字のコードを順に
文字比較回路16に入力し、その一致信号を一致カウン
タ17でカウントさせる。
同様にして、第1位候補文字に対応する最後の類似文字
まで他の候補文字との一致を調べる。これを終わると、
一致数カウンタ17の値すなわち一致数を最大値レジス
タ18と比較し、大きいほうの値を最大値レジスタ18
に再設定する。
次に制御判定回路15は、一致数カウンタ17をリセッ
ト後、レジスタ6内の第2位候補文字に対応した類似文
字の1番目の文字コードを学習テーブル7から読み出し
て文字比較回路16に入力してから、第2位以外の各候
補文字のコードを順に文字比較回路16に入力して比較
な行わせ、一致数を一致数カウンタ17でカウントさせ
る。
同様に、2番目以降の各類似文字についても他の候補文
字との比較を行わせて一致数をカウントさせる。そして
、最終的な一致数と最大値レジメタ18とを比較し、大
きいほうの値を最大値レジスタ18に再設定する。
同様の一致数のカウントと最大値の更新を、最後の候補
文字まで実行する。そして、最終的に最大の一致数が得
られた候補文字を第1位候補文字に決定し、他の候補文
字は順に順位付けして候補レジスタ19に設定する。
なお、学習テーブル7に類似文字が登録されていない候
補文字についての一致数は0とされろ。
例えば、辞書照合部6によって第1表に示す候補文字が
得られたとする。
第1表 そして、学習テーブル7に第2表の内容が登録されてい
るとする。
以下余白 第2表 この場合、第1位から第7位までの各候補文字について
の一致数は4,3,3,6,1,2.0となるので、候
補文字の順位は「払」が第1位とされ、つづけて「私」
 「弘」 「仏」 「拡j 「扶」「技」の順となる。
テーブル照合部8によって順位が修正された候補文字は
、認識結果として主制御部13により記憶装置10に格
納され、才だ同時にデイスプレィ11に第1位候補文字
だけが表示される(表示させないこともできる)。
オペレータは認識結果の修正を、このような認識処理中
または認識処理が完了後に行うことができることは従来
の文字認識装置と同様である。
オペレータは、デイスプレィ11の画面上が誤っている
と判定した文字をキーボード12(マウスなどのポイン
ティングデバイスでもよい)を介し指定する。例えば画
面上のカーソルを間違っている文字に合わせ、特定のキ
ーなどを押す。主制御部13は、指定された文字の第2
位以下の候補文字を記憶装置10より読み出しデイスプ
レィ11の画面に表示させる。オペレータは、第2位以
下の候補文字中に正解文字を見つけると、それをキーボ
ード11を介して画面上で指定し、あるいは番号などに
よって直接的に指定する。主制御部13は、指定された
正解文字を画面に表示し、同時に(または後に)記憶装
置1o内の認識結果を修正する。
また、このような文字修正の場合、主制御部13は、学
習テーブル7内の正解文字に対応した類似文字を、当該
正解文字の他の候補文字によって書き替える。
上述の例において、第1位候補となった「弘」が間違い
で「私」に修正されたとすると、「私」に対応した類似
文字は、例えば「弘」 「仏」 「払」「拡」「扶」 
「技」 「秋」に更新される。
このような学習が行われる結果、同じような「私」のパ
ターンが次回入力した場合には、「私」の−成敗が最大
となって第1位候補に自動的に選ばれる確率が大幅に上
がることになり、正解率の大幅な向上と修正作業量の大
幅な減少を期待できる。
なお、本実施例においては、辞書照合部6により抽出さ
れる候補文字数を7、学・習テーブル7に登録される類
似文字数を1文字自たり7としたが、これらの文字数は
増減可能であり、これを増加させることにより正解率を
さらに改善可能である。
また、学習テーブル7に登録された類似文字の順位によ
り重みを加えて一致数をカウントすることも可能である
またテーブル照合部8は、第2図に示したような比較的
簡単なハードウェア回路として容易に実現できるが、マ
イクロプロセッサシステム上でソフトウェア、によって
実現することも容易である。
この場合でも、当該処理は辞書照合などの処理に比べて
単純で短時間に実行可能であるから、認識処理速度の低
下を招くことはない。
発明の効果 以上の説明から明らかなように、本発明は、特微量辞書
との照合によって候補文字を絞り込みにくい類似文字が
多い文字について、学習テーブルとの照合により正解文
字を高い確度で絞り込むことができるので正解率の大幅
な向上が可能となり、また文字認識結果の誤り修正を行
う過程で学習テーブルの内容がユーザの装置利用の実情
に適応した内容に更新されるため様々なユーザに対し高
い正解率を達成可能であり、またテーブル照合手段や学
習テーブルを更新する手段は比較的簡単な構成とするこ
とができ、その処理も容易に高速化することができるの
で、文字認識装置の構成の複雑化や認識処理速度の低下
を招くことがなく、さらに学習テーブルの更新によって
学習機能を実現するので、特徴量辞書自体に学習を行う
方式のような問題も避けられるという効果を有するもの
である。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の概略ブ
ロック図、第2図は同装置内のテーブル照合部の一構成
例を示すブロック図である。 1・・・原稿読取部、2・・・前処理部、3・・・特微
量抽出部、4・・・特微量辞書、6・・・辞書照合部、
6・・・レジスタ、7・・・学習テーブル、8・・・テ
ーブル照合部、1o・・・記憶装置、11・・・デイス
プレィ、12・・・キーボード、13・・・主制御部、
15・・・制御判定部、16・・・文字比較回路、17
・・・−成敗カウンタ、18・・・最大値レジスタ、1
9・・・候補レジスタ。 代理人の氏名 弁理士 粟 野 重 孝 ほか1名第1
図 11・・デイスプレィ 12・・・キーボード

Claims (1)

    【特許請求の範囲】
  1.  入力文字パターンから抽出された特徴量と特徴量辞書
    との比較により特徴量の距離が小さい順に順位付けした
    複数の候補文字を求める辞書照合手段と、予め選ばれた
    文字毎に特徴量の距離の小さい類似文字が登録される学
    習テーブルと、前記辞書照合手段により求められた複数
    の候補文字に関し、各候補文字毎に、それに対応して前
    記学習テーブルに登録された類似文字と他の候補文字と
    の一致数を調べ、この一致数が最大の候補文字を第1位
    候補文字として他の候補文字の順位を修正するテーブル
    照合手段と、このテーブル照合手段により順位修正後の
    複数の候補文字に対し入力手段を通じオペレータから正
    解文字の修正情報が入力された場合に、この修正情報に
    より正解文字として指定された候補文字に対応した前記
    学習テーブル内の類似文字を他の候補文字によつて書き
    替える手段とを有することを特徴とする文字認識装置。
JP2197336A 1990-07-25 1990-07-25 文字認識装置 Pending JPH0488490A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2197336A JPH0488490A (ja) 1990-07-25 1990-07-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2197336A JPH0488490A (ja) 1990-07-25 1990-07-25 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0488490A true JPH0488490A (ja) 1992-03-23

Family

ID=16372779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2197336A Pending JPH0488490A (ja) 1990-07-25 1990-07-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0488490A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066214A1 (ja) * 2003-01-20 2004-08-05 Ssd Company Limited カードを用いるエンターテインメント装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066214A1 (ja) * 2003-01-20 2004-08-05 Ssd Company Limited カードを用いるエンターテインメント装置
US7963851B2 (en) 2003-01-20 2011-06-21 Ssd Company Limited Entertainment device using cards

Similar Documents

Publication Publication Date Title
EP1312038B1 (en) Orthogonal technology for multi-line character recognition
JPH05108883A (ja) 文字認識方法及び装置
JPH05346970A (ja) 文書認識装置
US5940532A (en) Apparatus for and method of recognizing hand-written characters
JP3792755B2 (ja) 文字認識方法及び装置
JPH0488490A (ja) 文字認識装置
JP3333362B2 (ja) 文字入力装置
EP1655673A2 (en) Automated collation creation
US20060100857A1 (en) Custom collation tool
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JP3037727B2 (ja) Ocrシステム
JP2001022891A (ja) 認識装置および認識用記憶媒体
JP2677271B2 (ja) 文字認識装置
JP3335494B2 (ja) 文字認識処理装置
JP3481850B2 (ja) 文字認識装置
JPH117492A (ja) キー入力編集方法及び編集装置
JPH0362280A (ja) 文字読取装置
JPH1021325A (ja) 文字認識方法
JPH0734207B2 (ja) 文字認識装置
JPH09231310A (ja) 情報処理装置
JP3242525B2 (ja) オンライン認識における文字列提示方法
JPH10247221A (ja) オンライン文字認識装置
JP3022790B2 (ja) 手書き文字入力装置
JPH0728929A (ja) 文字入力装置
JPH0612520A (ja) 文字認識装置の確認修正方式