JP4285960B2 - 文字認識装置及び文字認識方法 - Google Patents
文字認識装置及び文字認識方法 Download PDFInfo
- Publication number
- JP4285960B2 JP4285960B2 JP2002268450A JP2002268450A JP4285960B2 JP 4285960 B2 JP4285960 B2 JP 4285960B2 JP 2002268450 A JP2002268450 A JP 2002268450A JP 2002268450 A JP2002268450 A JP 2002268450A JP 4285960 B2 JP4285960 B2 JP 4285960B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- template
- recognition
- dictionary
- availability information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
本発明は、文字認識技術に関し、特に、認識対象文字を絞り込むことによって誤認識を防止可能な文字認識装置及び文字認識方法に関する。
【0002】
【従来の技術】
従来の認識辞書を用いて文字認識処理を行う文字認識方法では、文字種(漢字、数字、アルファベット、カタカナ、平仮名等)に認識対象文字を絞込み、記入されない文字への誤認識結果を出力しないようにしていた(例えば、特許文献1)。
【0003】
【特許文献1】
特開平6−36072号公報
【0004】
【発明が解決しようとする課題】
上記従来の認識対象文字の絞込み方法によれば、全ての文字種に対して個々に認識候補を求めることにより、認識前あるいは認識後にユーザによる文字種の選択を行っても個々の文字種自体の認識候補数を減少させることなく認識候補の限定を行うことができるが、例えば、漢字に認識対象文字を絞り込んだ場合、中には、使用しないカテゴリが多く含まれ、それによって誤認識しやすくなる文字が含まれる場合があった。
【0005】
本発明は、上記問題点を解決するためになされたものであり、認識対象カテゴリを絞り込むことにより認識処理に使用しないカテゴリへの誤認識を防止し得る文字認識装置及び文字認識方法の提供を目的とする。
【0006】
【課題を解決するための手段】
上記課題を解決するために、第1の発明の文字認識装置は、認識辞書を用いて文字認識処理を行う文字認識装置において、認識辞書は、1または複数の文字コードと、各文字コードに対応付けて設けられた自テンプレートの使用可否を決定するための使用可否情報を有する複数のテンプレートを格納してなり、文字認識処理時に、各テンプレートのうち使用可否情報が自テンプレート使用可を意味する内容に設定されているテンプレートのみを用いて、入力された文字イメージの特徴量との距離計算を行い、文字イメージの特徴量との距離が最も近いテンプレートの文字コードに対応する文字を認識候補文字として出力する認識処理手段を備え、認識処理手段は各テンプレートのうち文字コードが複数設けられたテンプレートについては各文字コードに対応付けられている使用可否情報が自テンプレート使用可を意味する内容に設定されているか否かをそれぞれ調べる、ことを特徴とする。
【0007】
また、第2の発明は上記第1の発明の文字認識装置において、認識辞書のテンプレートは、更に、各文字コードに対応付けられた各使用可否情報を変更する際に用いられる1または複数の使用履歴情報を有し、文字認識処理時に、認識辞書の使用量を計測する使用量計測手段と、文字認識処理による認識結果に対し修正を行うための修正手段と、修正手段による修正が行われなかった認識結果について、該認識結果の認識に用いられた文字コードを有するテンプレートにおける当該文字コードの使用履歴情報を使用済みを意味する内容に変更し、使用量計測手段による計測値が所定値と等しくなったとき、認識辞書のテンプレートのうち自テンプレート未使用を意味する使用履歴情報を有するテンプレートであって使用可否情報が使用可となっているテンプレートの使用可否情報を自テンプレート使用不可を意味する内容に変更し、自テンプレート使用済みを意味する使用履歴情報を有するテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する認識辞書更新手段と、を備えたことを特徴とする。
【0008】
また、第3の発明は上記第1の発明の文字認識装置において、認識処理手段によって出力された認識候補文字列のうち、単語と推定される文字群の文字単位の認識候補文字を単語辞書に格納されている単語データと照合し、照合結果を出力する単語照合手段と、単語照合手段による出力結果による単語辞書の更新後に、該単語辞書に登録されている文字コードで順次認識辞書のテンプレートの文字コードを比較し、文字コードが一致したテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更し、単語辞書に登録されている文字コードとは文字コードが一致しないテンプレートの文字コードに対応する使用可否情報を自テンプレート使用不可を意味する内容に変更する認識辞書更新手段と、を備えたことを特徴とする。
【0009】
また、第4の発明は上記第1の発明の文字認識装置において、認識処理手段による認識結果に対し修正を行うための修正手段と、修正手段によって、修正された認識結果に対応する文字コードの使用可否情報が自テンプレート使用不可を意味する内容に設定されているとき、当該テンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する認識辞書更新手段と、を備えたことを特徴とする。
【0010】
第5の発明の文字認識方法は、1または複数の文字コードと、各文字コードに対応付けて設けられた自テンプレートの使用可否を決定するための使用可否情報を有する複数のテンプレートを格納してなる認識辞書を用いて文字認識処理を行う文字認識方法であって、文字認識処理時に、使用可否情報が自テンプレート使用可を意味する内容に設定されているテンプレートのみを用いて、入力された文字イメージの特徴量との距離計算を行う工程と、文字イメージの特徴量との距離が最も近いテンプレートの文字コードに対応する文字を認識候補文字として出力する工程と、を備え、距離計算を行う工程は、各テンプレートのうち文字コードが複数設けられたテンプレートについては各文字コードに対応付けられている使用可否情報が自テンプレート使用可を意味する内容に設定されているか否かをそれぞれ調べる工程を含む、ことを特徴とする。
【0011】
また、第6の発明は上記第5の発明の文字認識方法において、更に、認識辞書のテンプレートは各文字コードに対応付けられた各使用可否情報を変更する際に用いられる1または複数の使用履歴情報を有し、文字認識処理時に、認識辞書の使用量を計測する工程と、文字認識処理による認識結果に誤認識がある場合に該認識結果の修正を行う工程と、この工程による修正が行われなかった認識結果について、該認識結果の認識に用いられた文字コードを有するテンプレートにおける当該文字コードの使用履歴情報を使用済みを意味する内容に変更する工程と、計測値と所定値とを比較し、計測値が所定値と等しくなったとき、認識辞書のテンプレートのうち使用履歴情報が自テンプレート未使用を意味するテンプレートであって使用可否情報が使用可となっているテンプレートの使用可否情報を自テンプレート使用不可を意味する内容に変更し、使用履歴情報が自テンプレート使用済みを意味するテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する工程と、を備えたことを特徴とする。
【0012】
また、第7の発明は上記第5の発明の文字認識方法において、文字認識処理による認識候補文字列のうち、単語と推定される文字群の文字単位の認識候補文字を単語辞書に格納されている単語データと照合し、照合結果を出力する工程と、照合結果の出力によって単語辞書の更新を行う工程と、該単語辞書に登録されている文字コードで順次認識辞書のテンプレートの文字コードを比較する工程と、この比較により文字コードが一致したテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更し、単語辞書に登録されている文字コードとは文字コードが一致しないテンプレートの文字コードに対応する使用可否情報を自テンプレート使用不可を意味する内容に変更する工程と、を備えたことを特徴とする。
【0013】
また、第8の発明は上記第5の発明の文字認識方法において、認識処理による認識結果を修正する工程と、この修正によって、修正された認識結果に対応する文字コードの使用可否情報が自テンプレート使用不可を意味する内容に設定されているとき、当該テンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する工程と、
を備えたことを特徴とする。
ことを特徴とする。
【0014】
【発明の実施の形態】
図1は本発明に基く文字認識方法を適用した文字認識装置の一実施例の構成を示すブロック図であり、文字認識装置100は、認識辞書101、単語辞書102、特徴抽出部103、認識処理部104、単語照合処理部105、表示及び修正部106及び認識辞書更新処理部107を備えている。
【0015】
認識辞書101は、認識対象文字の代表的な特徴量Fd、文字コードCo、使用可否情報If、使用履歴情報Hi等から構成されるテンプレート構成をなし、各文字に対して予め単数又は複数のテンプレートを格納してなる。
【0016】
単語辞書102は、帳票、原稿等に記入されるであろう単語(語句)を認識対象単語(語句)として格納したものであり、使用する状況により、ユーザによる追加、削除等の編集も可能とする。
【0017】
特徴抽出部103は、未知入力文字イメージImに対し特徴抽出を行い、特徴量Feを取得して保持する。
【0018】
認識処理部104は、特徴抽出部103で保持した特徴量Feと、認識辞書101内に格納されている認識対象文字の代表的な特徴量Fd1〜Fdi(i:認識対象文字の代表的な特徴量を表したテンプレート数)のうち使用可否情報Ifが使用可を意味するテンプレートの特徴量との距離計算をそれぞれ行い、計算距離結果をソート(sort:特定の順序に並び替え)して候補文字を選出し、保持し、出力する。この際、候補文字は1つだけ選出するようにしてもよいし、複数個の候補文字を選出するようにすることもできるが、単語照合を行う場合には複数の候補文字を選出するように構成する。また、候補文字を出力する際に候補文字としての信頼性を判定し、判定結果(信頼性)を候補文字に関連付けて保持することもできる。
【0019】
単語照合処理部105は、単語(語句)として判断された文字群のそれぞれの候補文字コードの組み合わせから単語辞書102に格納されている単語(語句)の中で最も近いものを信頼性が高いと判定し、それらの文字コードを認識結果(照合結果)として保持し、出力する。
【0020】
表示及び修正部106は、単語照合処理部105で選出し保持されている認識単語(語句)を認識結果としてモニタに表示してオペレータに認識結果の確認を促す。オペレータはモニタ上の表示結果を目視で確認し、間違って認識されたものに対しキーボード等の入力装置により認識結果の修正入力を行うので、表示及び修正部106は認識結果を入力データで置き換えて修正する。
【0021】
認識辞書更新処理部107は所定の条件下でテンプレートの使用可否情報Ifを変更する。つまり、認識辞書更新処理部107は、第2の実施例(図5)では、認識辞書101の使用回数又は使用日数をカウントし、カウント結果が設定値になった場合、カウンタの設定値を満たした認識辞書101の各テンプレートのうち使用履歴情報が「未使用」になっているテンプレートで使用可否情報が「使用可」になっているテンプレートの使用可否情報を「使用不可」に変更する。また、使用履歴情報が「使用済み」となっているテンプレートの使用可否情報を「使用可」に変更する。また、第3の実施例(図6)では、単語辞書102に格納されている単語を構成している文字の文字コードを持つテンプレートの使用可否情報を「使用可」に変更する。また、第4の実施例(図7)では、表示部及び修正部106でオペレータが使用可否情報が「使用不可」になっているテンプレートの文字コードに修正した場合、「使用不可」であった使用可否情報を「使用可」に変更する。
【0022】
<第1の実施例> テンプレートの絞込みによる文字認識
図2は本発明に基く文字認識方法による文字認識装置100の文字認識動作例を示すフローチャートである。
【0023】
特徴抽出部103は、未知入力文字イメージImの特徴抽出を行って特徴量Feを取得してメモリに保持(一時記憶)する(ステップS1)。
【0024】
認識処理部104は、上記ステップS1でメモリに保持された未知入力文字イメージImの特徴量Feとの距離計算を行うテンプレートの初期番号(この例では、n=1)をセットする。また、このステップで候補文字の初期化を行うこともできる(ステップS2)。
【0025】
また、認識処理部104は、上記ステップS2又は後述するステップS8でセットされたテンプレート番号のテンプレートが持っている使用可否情報を調べ、「使用可」を意味する場合はステップS4に遷移し、「使用不可」を意味する場合はS7に遷移する。なお、1つのテンプレートで複数の文字コードを持つように構成されたテンプレート(例えば、カタカナの「カ」と漢字の「力」のような同形異字文字を1つの特徴量で表し、文字コードを2つ持つようなテンプレート)の場合は、それぞれの文字コードに対し使用可否情報を持たせ、このステップでそれぞれの使用可否情報を調べ、「使用可」である文字コードについてステップS4以降の処理を行うことができる(ステップS3)。
【0026】
次に、認識処理部104は上記ステップS3で使用可否情報が「使用可」であることが確認されたテンプレートの持つ特徴量Fdn(n:ステップS2又はステップS8でセットされたテンプレート番号)と、上記ステップS1でメモリに保持されている未知入力文字イメージImの特徴量Feとの距離計算を行う。なお、この距離計算にはユークリッド距離、シティブロック距離等の計算方法が可能であるがこれらに限定されない(ステップS4)。
【0027】
次に、認識処理部104は、上記ステップS4での距離計算結果と未知入力文字イメージImの候補文字としての信頼性判定を行った候補文字の距離計算結果とを比較し、直前の距離計算結果が小さいか否かを判定する。つまり、このステップでは上記ステップS3で「使用可」であると確認されたテンプレートに対して距離計算を行って距離の小さいものを選出する。具体的には、テンプレート番号n=1の場合は過去に計算された距離計算結果がないので相対的に信頼性有りと判定してステップS6に遷移する。また、n>1の場合は過去に計算された距離計算結果と直前に計算された距離計算結果とを比較し、直前に計算された距離計算結果が小さい場合には信頼性ありとしてステップS6に遷移し、そうでない場合は相対的に信頼性なしとしてステップS7に遷移する。なお、ここで、相対的に信頼性ありとされる文字は候補文字となり得るものであり、複数の候補文字を得ようとする場合には相対的な信頼性判定の距離計算結果によって順位を付け必要とする候補文字分を上位から選出するようにする(ステップS5)。
【0028】
次に、認識処理部104は上記ステップS5で選出された相対的に信頼性ありとされた文字を候補文字としてメモリに保持する。すなわち、上記ステップS3で「使用可」と判定されたテンプレート数分、ステップS4で距離計算が行われ、ステップS5で候補文字としての相対的な信頼性ありとされた文字が候補文字として保持される(ステップS6)。
【0029】
次に、認識処理部104は直前まで処理を行ってきたテンプレートのテンプレート番号nがテンプレート数を超えていないかどうか、つまり、最終テンプレートであるか否かを判定し、最終テンプレートでない場合はステップS8に遷移し、最終テンプレートの場合は認識処理を終了する(ステップS7)。
【0030】
認識処理部104はテンプレート番号nに1を加え新たなテンプレート番号をn+1として新たなテンプレートについてステップS3以降の処理を行うためにステップS3に戻る(ステップS8)。
【0031】
(具体例)
図3は認識辞書の一実施例を示す図であり、図4は未知入力文字イメージの例を示す図である。
【0032】
認識辞書101が図3に示すようなテンプレートT1、T2、T3、T4、T5、T6を含んでいる場合を例として、以下、上述した第1の実施例の具体例について説明する。
【0033】
先ず、認識辞書101は図3に示すように1つのテンプレートに付き2つの文字コードを持つことを可能に構成されている。また、この認識辞書101では、テンプレートT1及びテンプレートT2の使用可否情報から「カ」(カタカナ)が「使用可」(認識対象文字)、「力」(漢字)が「使用不可」(認識対象外文字)、テンプレートT3及びテンプレートT4の使用可否情報から「上」(漢字)が「使用可」(認識対象文字)、テンプレートT5及びテンプレートT6の使用可否情報から「土」(漢字)が「使用不可」(認識対象文字)であることがわかる。
【0034】
また、この認識辞書101においてはカテゴリ毎に「使用可」、「使用不可」に分かれているが、必ずしもカテゴリ別に分ける必要はない。例えば、テンプレートT5で傾きがなくきれいに記入された文字の特徴を表し、テンプレートT6で右傾きに記入された文字の特徴を表してあるとした場合、右傾きの記入文字を認識しなくてもよいとする時には、テンプレートT6の使用可否情報を「使用不可」にするようにすればよい。
【0035】
今、図4に示すように「上田」と記入されている未知入力文字イメージ40を読み込み、文字認識装置100で図3の認識辞書101を用いて認識処理を行うものとする。未知入力文字イメージ中の「上」は左側への突き出しがあり、「土」と誤認識を起こしやすいような記入の仕方であり、全てのカテゴリを認識対象とした認識辞書では「土」と認識される場合がある(但し、説明上、このユーザでは「土田」と記入することはないものとする)。また、単語辞書102では「上田」、「土田」が登録されており、単語照合処理によってどちらかであるかを判定することは困難であるとする。
【0036】
まず、読み込まれた未知入力文字イメージ40は文字認識装置100によって1文字ずつの文字イメージ41、42に分けられる。今、図1の特徴抽出部103に入力される未知入力文字イメージImを図4の1文字目の文字イメージ41(「上」)とすると、図2のステップS1で、特徴抽出部103は特徴抽出により未知入力文字イメージImの特徴量Feを得る。
【0037】
次に、ステップS1で、認識処理部104は未知入力文字イメージImの特徴量Feとの距離計算を行う特徴量を持つテンプレートの初期番号をセット(この例においては、テンプレート番号1から処理を行うものとするので、処理するテンプレート番号nに1をセット)する。
【0038】
(n=1)
次に、ステップS3で、認識処理部104は上記ステップS2でセットされたテンプレート番号1のテンプレートが持つ使用可否情報を調べ、「使用可」であればステップS4に遷移し、「使用不可」であればステップS7に遷移する。今、テンプレート番号1のテンプレートを図3のテンプレートT1とすると、ステップS3ではテンプレートT1の使用可否情報を調べる。但し、この例では認識辞書101は1テンプレートにつき文字コードを2つ持っているので使用可否情報も対応して2つあるから、2つの使用可否情報を調べることとなる。テンプレートT1では「カ」(カタカナ)の文字コードの使用可否情報が「使用可」であるのでステップS4に遷移することとなる。
【0039】
次に、ステップS4で、認識処理部104は未知入力文字イメージImの特徴量FeとテンプレートT1の特徴量Fdt1との距離計算を行い、算出された距離Dt1(Dt1=17860とする)を保持する。
【0040】
次に、ステップS5で、認識処理部104はテンプレートT1の文字(この場合は使用可否情報が「使用可」となっているカタカナ「カ」)の候補文字としての信頼性を判定する。この例では、テンプレート番号n=1であるから相対的な信頼性ありと判定し、ステップS6に遷移する。
【0041】
次に、ステップS6で、認識処理部104は上記ステップS5で信頼性ありと判定されたテンプレートT1の文字「カ」(カタカナ)を候補文字としてメモリに保持する。なお、認識処理装置100が候補文字を複数持つことが可能に構成されている場合は、ここでテンプレートT1の文字「力」(漢字)の使用可否情報も「使用可」である場合は「力」(漢字)も文字候補として保持する(認識処理装置100が候補文字を複数持つことが可能に構成されていない場合には優先順位を決めておく必要がある)。
【0042】
次に、ステップS7で、認識処理部104は今まで処理を行ってきたテンプレート番号nがテンプレート数を超えていないかを判定する。今回は未だテンプレートが存在するのでステップS8に遷移し、ステップS8でテンプレート番号を1つ増加させ次のテンプレートに対する認識処理を行うためにステップS3に戻る。
【0043】
(n=2)
2度目のループのステップS3で、認識処理部104はステップS8でセットされたテンプレート番号2のテンプレートが持つ使用可否情報を調べ、「使用可」であればステップS4に遷移し、「使用不可」であればステップS7に遷移する。今、テンプレート番号2のテンプレートを図3のテンプレートT2とすると、テンプレートT1の場合と同様にカタカナ「カ」の使用可否情報が「使用可」であるからS4に遷移する。
【0044】
次に、ステップS4で、認識処理部104は未知入力文字イメージImの特徴量FeとテンプレートT2の特徴量Fdt2との距離計算を行い、算出された距離Dt2(=16500とする)を保持する。
【0045】
次に、ステップS5で、認識処理部104はテンプレートT2の文字の候補文字としての信頼性を判定する。今回は、前回信頼性ありとして保持されているテンプレートT1の距離計算結果Dt1(=17860)と今回計算したテンプレートT2の距離計算結果Dt2(=16500)を比較すると、Dt2<Dt1であるから、テンプレートT2の文字の特徴量が未知入力文字イメージImの特徴量と近いのでテンプレートT2の文字「カ」(カタカナ)の方が相対的に信頼性ありと判定し、ステップS6に遷移する。
【0046】
次に、ステップS6で、認識処理部104は上記ステップS5で信頼性ありと判定されたテンプレートT2の文字「カ」(カタカナ)を候補文字としてメモリに保持し直す。
【0047】
次に、ステップS7で、認識処理部104はテンプレートT2が最終テンプレートか否かを判定するがテンプレートが存在するのでステップS8に遷移し、ステップS8でテンプレート番号を1つ増加させ次のテンプレートに対する認識処理を行うためにステップS3に戻る。
【0048】
(n=3)
3度目のループのステップS3で、認識処理部104はステップS8でセットされたテンプレート番号3のテンプレートT3が持つ使用可否情報を調べると「使用可」であるのでステップS4に遷移する。
【0049】
次に、ステップS4で、認識処理部104は未知入力文字イメージImの特徴量FeとテンプレートT3の特徴量Fdt3との距離計算を行い、算出された距離Dt3(=6600とする)を保持する。
【0050】
次に、ステップS5で、認識処理部104はテンプレートT3の文字の候補文字としての信頼性を判定する。今回は、前回信頼性ありとして保持されているテンプレートT2の距離計算結果Dt2(=16500)と今回計算したテンプレートT3の距離計算結果Dt3(=6600)を比較すると、Dt3<Dt2であるから、テンプレートT3の文字の特徴量が未知入力文字イメージImの特徴量と近いのでテンプレートT3の文字「上」(漢字)の方が相対的に信頼性ありと判定し、ステップS6に遷移する。
【0051】
次に、ステップS6で、認識処理部104は上記ステップS5で信頼性ありと判定されたテンプレートT3の文字「上」(漢字)を候補文字としてメモリに保持し直す。
【0052】
次に、ステップS7で、認識処理部104はテンプレートT3が最終テンプレートか否かを判定するがテンプレートが存在するのでステップS8に遷移し、ステップS8でテンプレート番号を1つ増加させ次のテンプレートに対する認識処理を行うためにステップS3に戻る。
【0053】
(n=4)
4度目のループのステップS3で、認識処理部104はステップS8でセットされたテンプレート番号4のテンプレートT4が持つ使用可否情報を調べると「使用可」であるのでステップS4に遷移する。
【0054】
次に、ステップS4で、認識処理部104は未知入力文字イメージImの特徴量FeとテンプレートT4の特徴量Fdt4との距離計算を行い、算出された距離Dt4(=7100とする)を保持する。
【0055】
次に、ステップS5で、認識処理部104はテンプレートT4の文字の候補文字としての信頼性を判定する。今回は、前回信頼性ありとして保持されているテンプレートT3の距離計算結果Dt3(=6600)と今回計算したテンプレートT4の距離計算結果Dt4(=7100)を比較すると、Dt3<Dt4であるから、テンプレートT3の文字の特徴量の方が未知入力文字イメージImの特徴量と近いのでテンプレートT4の文字「上」(漢字)は候補文字として信頼性がないと判定し、ステップS7に遷移する。
【0056】
次に、ステップS7で、認識処理部104はテンプレートT4が最終テンプレートか否かを判定するがテンプレートがまだ存在するのでステップS8に遷移し、ステップS8でテンプレート番号を1つ増加させ次のテンプレートに対する認識処理を行うためにステップS3に戻る。
【0057】
(n=5)
5度目のループのステップS3で、認識処理部104はステップS8でセットされたテンプレート番号5のテンプレートT5が持つ使用可否情報を調べると「使用不可」になっているのでステップS4以降の距離計算等を行うことなくステップS7に遷移し、テンプレートT5が最終テンプレートか否かを判定するがテンプレートが存在するのでステップS8に遷移し、ステップS8でテンプレート番号を1つ増加させ次のテンプレートT6に対する認識処理を行うためにステップS3に戻る。
【0058】
(n=6)
6度目のループのステップS3で、認識処理部104はステップS8でセットされたテンプレート番号6のテンプレートT6が持つ使用可否情報を調べると「使用不可」になっているのでステップS4以降の距離計算等を行うことなくステップS7に遷移し、テンプレートT6が最終テンプレートなので処理を終了する。
【0059】
以上により、未知入力文字イメージImの候補文字が「土」に誤認識されることなく候補文字「上」を選出することができる。また、これにより、距離計算が少なく済み処理速度の向上が望め、更に、認識性能の安定と向上を期待できる。なお、この例で、認識辞書を全てのカテゴリを対象にし、単語辞書の「土田」を削除した場合にも同様に「上田」と正しい認識結果を選出することができるが、処理速度が向上しない。
【0060】
<第2の実施例> 使用履歴による使用可否情報の変更
図5は本発明に基く文字認識方法による文字認識装置100の文字認識動作例を示すフローチャートである。
【0061】
まず、認識処理部104で、第1の実施例(図2)と同様の文字認識処理を行うと共に、その際に、認識辞書101の使用回数又は使用日数をカウントし、カウント結果が設定値になった場合、カウンタの設定値を満たした認識辞書101の各テンプレートのうち使用履歴情報が「未使用」のテンプレートで使用可否情報が「使用可」になっているテンプレートの使用可否情報を「使用不可」に変更する。また、使用履歴情報が「使用済み」となっているテンプレートの使用可否情報を「使用可」に変更する。
【0062】
なお、認識辞書101の使用回数のカウント方法として、文字認識処理を行った文字数をカウントしてもよいし、認識処理を行った帳票や原稿の枚数をカウントするようにしてもよい。つまり、認識処理を設定値(所定値)分だけ行ったことがわかるものをカウントするようにすればよい(ステップU1)。
【0063】
次に、表示及び修正部106は、読み取られた帳票等の記入文字について上記ステップU1で行われた認識結果を表示し、オペレータに確認及び誤認識があった場合の修正入力を促し、修正文字がある場合はステップU3に遷移し、修正文字がない場合はステップU4に遷移する。なお、修正文字がない場合というのは表示されている帳票等の認識結果が全て正しい場合か又はステップU3の修正処理を経て帳票等の誤認識文字が全て正しく修正された場合をいう(ステップU2)。
【0064】
上記ステップU2で誤認識文字があるとオペレータが判断した場合は、オペレータは正しい文字をキー入力する。表示及び修正部106は誤認識された認識結果(=誤認識文字)とキー入力された文字とを置換して誤認識文字を修正し、次の認識文字の正否判断のためにステップU2に戻る(ステップU3)。
【0065】
上記ステップU2でオペレータが修正文字がないと判断した場合は、認識辞書更新処理部107は認識辞書101内にある使用履歴情報Hiを更新する。ここで、使用履歴情報Hiの更新とは、修正文字がないと判断された結果、つまり、記入された文字の文字コードを基に、使用された文字コードを持つテンプレートの使用履歴情報を「使用済み」を意味する情報にすることをいう。なお、使用履歴情報を「使用済み」にする際には、使用された文字コードを持つテンプレートのうち記入された未知入力文字イメージImに一番近い特徴量を持つテンプレートの使用履歴情報だけを「使用済み」にするように構成する。なお、使用された文字コードを持つ全てのテンプレートの使用履歴情報を「使用済み」にするように構成することもできる(ステップU4)。
【0066】
次に、認識辞書更新処理部107は、上記ステップU1での認識辞書101の使用回数(又は使用日数)のカウント値と設定値(所定値)を比較し、カウント値が設定値より小さい場合は処理を終了し、カウント値が設定値以上の場合はステップU6に遷移する(ステップU5)。
【0067】
認識辞書更新処理部107は、カウンタ値が設定値を満たした認識辞書101の各テンプレートのうち使用履歴情報が「未使用」のテンプレートで使用可否情報が「使用可」になっているテンプレートの使用可否情報を「使用不可」に変更する。また、使用履歴情報が「使用済み」となっているテンプレートの使用可否情報を「使用可」に変更する。また、このステップでカウンタ値と各テンプレートの使用履歴とを初期化してもよいし、カウント値が設定値を超えたときにカウンタと各テンプレートの使用履歴を初期化するようにしてもよい。
【0068】
上記図5のフローチャートのステップU4の使用履歴情報の変更の際、1テンプレートずつ変更を行うことの利点、つまり、使用された文字コードを持つテンプレートのうち記入された未知入力文字イメージImに一番近い特徴量を持つテンプレートの使用履歴情報だけを「使用済み」にする利点は、未知入力文字イメージを学習する際に、従来のようにその未知入力文字イメージの特徴をそのまま登録する方法であれば、他のカテゴリへの悪影響が考慮されていないために誤認識を招く恐れがあるが、1テンプレートずつ変更を行うステップの場合は、認識辞書101を作成するときに予めある程度の変形文字のテンプレートを含むようにしておき、初期状態では使用可否情報を「使用不可」に設定しておき、ステップU4で使用履歴情報が「使用済み」にされたテンプレートの使用可否情報を、ステップU5で認識辞書101がカウンタの設定値を満たした場合に、「使用可」にできるので、次回からの認識処理の際に悪影響を小さめにすることができるので、誤認識を最小限にとどめることができる点である。
【0069】
また、上記図5のフローチャートのステップU5で、カウンタの設定値を満たした認識辞書101の各テンプレートのうち使用履歴情報が「未使用」のテンプレートで使用可否情報が「使用可」になっているテンプレートの使用可否情報を「使用不可」に変更するようにしたことにより、使われなくなった文字を認識対象から外すことができ、この文字を持つテンプレートによる誤認識が生じないようにすることができる。また、使われなくなった文字を認識対象から外すことにより認識処理速度を向上させることができる。
【0070】
なお、上記ステップU5の使用可否情報の変更動作は自動的に行うように構成したが、これに限定されず、変更の際にオペレータが確認するように構成してもよい。使用可否情報の変更にオペレータによる確認操作を介入させるようにすることにより、極めて使用頻度の低い文字であっても使用する場合があるものについてはそのテンプレートの使用可否情報を「使用可」に保つことが可能となり、次回その文字の認識を行う際に正しく認識することができる。
【0071】
(具体例)
認識辞書101が図3に示したようなテンプレートT1〜T6を含んでいる場合を例として、以下、上述した第2の実施例の具体例について説明する。
【0072】
前提として、図3に示した認識辞書101が初期状態(使用履歴情報1が「未使用」に設定されている)とし、図4に示す未知入力文字イメージ40が読み込まれたものとする。但し、第1の実施例では未知入力文字イメージ40は記入者は「上田」と正しく記入したものとして説明したが、本実施例では記入者は「土田」と記入したつもりが客観的には「上田」のように見える文字イメージを記入したものとする。また、処理のカウントを文字単位に行うものとし、カウンタの比較用設定値を20000、現在のカウンタ値を10000とする(つまり、すでに10000文字分の認識処理が行われたものとする)。
【0073】
(カウンタ値=21300)
図5のフローチャートのステップU1で、認識処理部104は第1の実施例で述べたような文字認識処理を行い、認識結果「上田」を得る。この場合、認識結果の文字数は2文字であるからカウンタ値=10000+2=10002となる。更に、文字「上田」以外にも複数(11298文字)の文字の認識処理がこのステップで行われたとすると、カウンタ値=21300で認識処理が終了し、ステップU2に遷移する。
【0074】
ステップU2で、表示及び修正部106は上記ステップU1での認識結果を表示する。この例では図4の「土田」に対し認識結果は「上田」と出力(表示)されるので、オペレータは修正文字ありとし、ステップU3に遷移する。
【0075】
ステップU3で、オペレータは誤認識文字「上」に対し正しい文字「土」を入力するので、表示及び修正部106は文字「上」を修正入力文字「土」で置き換え、ステップU2に戻り、更に、ステップU2で他に修正対象の文字があるか否かを調べると、この例では他に修正文字がないのでステップU4に遷移する。
【0076】
ステップU4で、認識辞書更新処理部107は正しい認識結果(ステップU3により修正された認識結果も含む)の文字コードを持つ認識辞書101のテンプレートの使用履歴情報を「使用済み」に変更する。この例では「土」と「田」の文字コードを持つテンプレートの使用履歴情報を「使用済み」に変更することになるが、図3の例では「土」の文字コードを持つテンプレートはテンプレートT5とテンプレートT6があるのでこの2つのテンプレートの使用履歴情報を「使用済み」に変更する(なお、前述したようにこの2つのテンプレートのうち未知入力文字イメージ(図4の「土」)の特徴量により近い特徴量を持つテンプレートを1つ選出してそのテンプレートの使用履歴情報を「使用済み」に変更するようにしてもよい)。
【0077】
次に、ステップU5で、認識辞書更新処理部107は認識処理のカウント値(=21300)と設定値(=20000)を比較すると認識処理のカウント値>設定値であるからステップU6に遷移する。
【0078】
ステップU6で、認識辞書更新処理部107は使用履歴情報が「未使用」のテンプレートT3、T4(「上」の文字コードを表すテンプレート)の使用可否情報を「使用不可」に変更し、更に、使用履歴情報が「使用済み」のテンプレートT5、T6(「土」の文字コードを表すテンプレート)の使用可否情報を「使用可」に変更する。これにより、次回の認識処理からテンプレートT3、T4は使用不可になるので「上」の認識結果が出力されることがなくなり、テンプレートT5、T6が使用されることとなる。
【0079】
なお、ステップU6で認識処理カウンタのカウント値を0にし、更に、認識辞書101内の使用履歴情報を「未使用」にリセットしてもよい。また、リセットせずに、次回以降は常に使用履歴情報が「使用済み」のテンプレートの使用可否情報を「使用可」に変更するようにしてもよい。
【0080】
上記具体例から明らかなように、図4に示した未知入力文字イメージのように記入文字が紛らわしい文字であっても認識辞書101を自動的に正しく認識可能な認識辞書にすることができる。
【0081】
以上説明したように、認識辞書に格納されているテンプレートのうち最小必要限度のテンプレートを用いて認識処理を行うことができるので認識性能の安定と処理速度の向上が期待できる。
【0082】
<第3の実施例> 単語辞書の格納状態による使用可否情報の変更
図6は本発明に基く文字認識方法による文字認識装置100の文字認識動作例を示すフローチャートである。
【0083】
まず、図1の符号10で示す部分(つまり、認識辞書101、単語辞書102、特徴抽出部103、認識処理部104、単語照合処理部105)による認識処理を行う(本実施例では、1文字単位で認識候補文字を出力し、その候補文字を用いて単語照合を行い、単語単位での認識結果を出力するまでをいう)(ステップV1)。
【0084】
次に、表示及び修正部106は上記ステップV1で得られた認識結果を表示し、オペレータに認識結果の確認を促すと共に、誤認識がある場合は修正入力を促し、修正入力があると誤認識文字を入力された文字で置き換えて修正する(ステップV2)。
【0085】
認識辞書更新処理部107は上記ステップV2で確認又は修正された結果に対し、単語と推定された文字群が単語辞書102にない場合に単語と推定されたそれら文字群を単語辞書102に登録する(ステップV3)。
【0086】
次に、認識辞書更新処理部107は上記ステップV3で学習(登録、更新)された単語辞書102を構成する文字コードを同じ文字コードが重ならないようにソート(SORT)する。これにより、単語辞書102に登録されている全ての文字コードが、降順又は昇順に並び替えられる(ステップV4)。
【0087】
更に、認識辞書更新処理部107は、認識辞書101のテンプレートのうち、上記ステップV4でソートされた文字コードを持つテンプレートを順番にサーチしてそのテンプレートの使用可否情報を「使用可」に変更し、それ以外のテンプレートについては使用可否情報を「使用不可」に変更する。この動作を行うタイミングはオペレータが指定するように構成してもよいし、第2の実施例のように認識処理カウンタを設けて自動的に行うように構成してもよい(ステップV5)。
【0088】
上記図6のフローチャートに示す動作により、認識辞書に格納されているテンプレートのうち記入が予測される単語(語句)を集めた単語辞書に登録されている文字のみのテンプレートを用いることにより、必要最小限度のテンプレートを用いて認識処理を行うことができるので認識性能の安定と処理速度の向上が期待できる。
【0089】
(具体例)
図3に示したような認識辞書101で、説明上、単語辞書102には下記のような10単語のみがある場合を例として第3の実施例の具体例について説明する。なお、読み込まれる帳票の認識対象欄には「携帯電話 上田 5月分」と記入されているものとする。
[単語辞書に格納されている単語]
社会保険料、源泉所得税、借入返済、国民年金、携帯電話、普通預金、退職掛金、法人税、五月分、土田
[動作]
先ず、ステップV1では、認識対象欄の文字イメージ群「携帯電話 上田 5月分」が切り出され、1文字単位で文字認識が行われてそれぞれの文字に対し認識候補文字が得られる。そして、それら認識候補文字を基に単語照合処理部105は単語辞書102内にある単語データから最も近いものを選出し認識結果(照合結果)として出力する(この例では、「携帯電話 土田 5月分」と出力されたものとする)。
【0090】
次に、ステップV2では、表示及び修正部106でステップV1で出力された結果(「携帯電話 土田 5月分」)を表示し、オペレータに認識結果の確認を促すと共に誤認識がある場合は修正入力を促し、全てが正しい認識結果になればステップV3に遷移する。この例では「上田」が「土田」に誤認識されているのでオペレータが「土」に対して「上」を入力すると「土」が「上」に置き換えられてすべてが正しい結果になるのでステップV3に遷移する。
【0091】
ステップV3では、認識辞書更新処理部107は上記ステップV2で確認・修正された認識結果で単語と判定された文字群が単語辞書102にあるか否かを調べ単語辞書102にない場合は単語辞書102に登録する。この例で、認識結果で単語と判定された文字群が「携帯電話」、「上田」、「5月分」とすると、認識辞書更新処理部107はこれらの文字群が単語辞書102にデータとして存在しているか否か確認していく。この確認により、単語として「携帯電話」と「5月分」が認識辞書102に存在し、「上田」は存在しないことがわかるので、「上田」が学習され、単語辞書102にデータとして追加される(この結果、単語辞書102には11個の単語が存在することになる)。
【0092】
ステップV4では、認識辞書更新処理部107が上記ステップV2で更新した単語辞書102を構成する文字コードをソートすると、
5、会、掛、金、携、月、険、原、国、済、社、借、
所、上、職、人、税、泉、帯、退、通、田、電、土、
得、入、年、普、分、返、保、法、民、話、預、料
となる。個々でのソートは同じ文字コードが何度も現れないようにするためのものであり、この例では、「金」、「税」が単語辞書102に複数存在しているがソートによりそれぞれ1回の出現となっている。
【0093】
次に、ステップV5では、認識辞書更新処理部107は上記ステップV4でソートされた文字コードを持つ認識辞書101のテンプレートを順番にサーチしてそのテンプレートの使用可否情報を「使用可」に変更し、それ以外のテンプレートについては使用可否情報を「使用不可」に変更する。
【0094】
以上により、単語辞書102に格納されている文字データは認識対象文字となり、それ以外の文字は認識対象外となる。これによって各ユーザに合わせた単語辞書から認識辞書が作成されるので、認識対象外の文字に誤認識されることがなくなる。
【0095】
<第4の実施例> カテゴリの修正に伴う使用可否情報の変更
図7は本発明に基く文字認識方法による文字認識装置100の文字認識動作例を示すフローチャートである。
【0096】
まず、図1の符号10で示す部分(つまり、認識辞書101、単語辞書102、特徴抽出部103、認識処理部104、単語照合処理部105)による認識処理を行う(ステップW1)。
【0097】
表示及び修正部106は上記ステップW1で得られた認識結果を表示し、オペレータに認識結果の確認を促すと共に、誤認識がある場合は修正入力を促し、修正文字がある場合はステップW3に遷移し、修正文字がない場合は処理を終了する。なお、修正文字がない場合というのは表示されている帳票等の認識結果が全て正しい場合か又はステップU3の修正処理を経て帳票等の誤認識文字が全て正しく修正された場合をいう(ステップW2)。
【0098】
また、表示及び修正部106はオペレータによる修正入力があると誤認識文字を入力された文字で置き換えて修正する(ステップW3)。
【0099】
認識辞書更新処理部107は、上記ステップW3で修正された文字コードを持つテンプレートを認識辞書101の中から抽出する(ステップW4)。
【0100】
次に、認識辞書更新処理部107は、上記ステップW4で抽出したテンプレートの使用可否情報を調べ、使用可否情報が「使用可」であればステップW2に戻り、「使用不可」であればステップW6に遷移する(ステップW5)。
【0101】
また、認識辞書更新処理部107は、使用可否情報が「使用不可」のテンプレートの使用可否情報を「使用可」に変更する(ステップW6)。
【0102】
上記図7のフローチャートに示す動作により、「使用不可」にされていたテンプレートを「使用可」に変更することにより、次回認識処理時からそのテンプレートの文字が認識対象文字となり、認識可能となる。
【0103】
また、同一カテゴリにおいて複数のテンプレートが存在する場合、上記ステップW5で、ステップW4で抽出した全てのテンプレートの使用可否情報を「使用可」に変更するようにしてもよいし、記入された文字(未知入力文字)の特徴量に最も近い特徴量を持つテンプレートの使用可否情報だけを「使用可」に変更するようにしてもよい。
【0104】
また、読み込まれた文字の特徴をそのまま学習すると文字認識の基本である認識辞書に悪影響を及ぼす場合があるが、予め変形の強い文字の特徴を認識辞書に加え、そのテンプレートの使用可否情報を「使用不可」にしておき、その文字の特徴に近い未知入力文字イメージの認識結果が誤認識され、修正されたときにその文字の特徴を持つテンプレートの使用可否情報を「使用可」に変更して学習効果を得るようにしてもよい。このように変形文字の特徴を持つテンプレートを格納した認識辞書を予め作成しておくことにより悪影響を抑制することができる。
【0105】
また、認識処理の初期段階として、使用頻度の高い文字の文字コードを持つテンプレートの使用可否情報を「使用可」にしておき、その後はユーザの使用状況に合わせて認識対象文字を増やすようにすることにより、それぞれのユーザにおいて、使用しない文字への誤認識を起こさないようにすることができる。更に、それぞれのユーザにおいて、認識対象文字のみに対して認識処理を行うようにすることにより、最適化された処理による処理速度の向上が期待できる。
【0106】
(具体例)
認識辞書101が図3に示したようなテンプレートT1〜T6を含んでいる場合を例として、以下、上述した第2の実施例の具体例について説明する。
【0107】
前提として、図4に示す未知入力文字イメージ40が読みこまれたものとする。但し、第1の実施例では未知入力文字イメージ40は記入者は「上田」と正しく記入したものとして説明したが、本実施例では記入者は「土田」と記入したつもりが客観的には「上田」のように見える未知文字イメージ40を記入したものとする。
【0108】
ステップW1では、未知入力文字イメージ40が切り出され、1文字単位で文字認識が行われて認識結果「上」、「田」を得る。
【0109】
次に、ステップW2では、表示及び修正部106はステップW1での認識結果「上田」を表示してオペレータに認識結果の確認を促す。ここで、正解は「土田」のためオペレータは誤認識に気付きステップW3に遷移する。
【0110】
ステップW3で、表示及び修正部106はオペレータが認識結果「上」に対し正解文字「土」を入力すると、「上」を修正入力文字「土」で置き換える。
【0111】
次に、ステップW4で、認識辞書更新処理部107は修正された文字コード「土」を持つテンプレートT5、T6(図3)を抽出する。
【0112】
また、ステップW5で、認識辞書更新処理部107が抽出されたテンプレートT5、T6の使用可否情報を調べると「使用不可」になっているのでステップW6に遷移する。
【0113】
更に、ステップW6で、認識辞書更新処理部107は「使用不可」であるテンプレートT5、T6の使用可否情報を「使用可」に変更する。なお、上記説明ではステップW4で抽出したテンプレート全て(テンプレートT5、T6)の使用可否情報を「使用可」に変更したが、図4に示した未知入力イメージ「土」の特徴により近いテンプレート一つ(テンプレートT5又はテンプレートT6)だけを選出し、そのテンプレートの使用可否情報を「使用可」に変更するようにしてもよい。
【0114】
例えば、テンプレートT5はきれいに記入された「土」の特徴を表しているテンプレートであり、テンプレートT6は図4に示した未知入力文字イメージ41のように上の横棒の左への突出しが少ない「土」の特徴を表したものとすると、初めからテンプレートT6を認識対象テンプレートとすると、「上」と記入された文字の認識処理への悪影響が考えられるので、初めは「使用不可」にしておき、図4の未知入力文字イメージのように記入された場合のみ「使用可」に変更することが望ましい。また、きれいに記入された「土」の場合にはテンプレートT5だけを使用すると上の横棒の左への突出しが少ない「土」に対応するテンプレートT6による誤認識が起きない。
【0115】
上記動作により、認識対象を絞り込んだ場合にも認識辞書を安定的に更新することができる。
【0116】
以上、本発明の一実施例について説明したが本発明は上記各実施例に限定されるものではなく、種々の変形実施が可能であることはいうまでもない。
【0117】
【発明の効果】
上記説明したように、第1の発明の文字認識装置及び第5の発明の文字認識方法によれば、認識対象文字のテンプレートを絞り込むことができるので、使用しないテンプレートに起因する誤認識が生じない。また、使用するテンプレートが限定されるため、認識候補文字を求める際の距離計算量が削減されることから処理速度の向上を実現できる。
【0118】
また、第2の発明の文字認識装置及び第6の発明の文字認識方法によれば、個々のユーザ毎に、使用するテンプレートと使用しないテンプレートの使用量を把握でき、テンプレートの使用可否を決定する使用可否情報をテンプレート毎に設定できるので、次回からの認識処理において使用しないテンプレートに起因する誤認識が生じない。
【0119】
また、第3の発明の文字認識装置及び第7の発明の文字認識方法によれば、使用する単語を予めある程度把握できるので、単語辞書を構成するカテゴリの文字コードによって使用するテンプレートと使用しないテンプレートの使用量を把握でき、テンプレートの使用可否を決定する使用可否情報をテンプレート毎に設定できるので、次回からの認識処理において使用しないテンプレートに起因する誤認識が生じない。
【0120】
また、第4の発明の文字認識装置及び第8の発明の文字認識方法によれば、使用不可にされていたテンプレートのカテゴリが記入された場合に、修正情報を基に使用不可に設定されていた使用可否情報を使用可に変更することにより、次回からの認識処理において記入された文字を自動的に認識対象文字とすることができる。
【図面の簡単な説明】
【図1】本発明に基く文字認識方法を適用した文字認識装置の一実施例の構成を示すブロック図である。
【図2】本発明に基く文字認識方法による文字認識装置の文字認識動作例を示すフローチャートである。
【図3】認識辞書の一実施例を示す図である。
【図4】未知入力文字イメージの例を示す図である。
【図5】本発明に基く文字認識方法による文字認識装置の文字認識動作例を示すフローチャートである。
【図6】本発明に基く文字認識方法による文字認識装置の文字認識動作例を示すフローチャートである。
【図7】本発明に基く文字認識方法による文字認識装置の文字認識動作例を示すフローチャートである。
【符号の説明】
100 文字認識装置
101 認識辞書
102 単語辞書
104 認識処理部(認識処理手段)
106 単語照合処理部(単語照合手段)
107 認識辞書更新処理部(使用可否情報変更手段)
Claims (8)
- 認識辞書を用いて文字認識処理を行う文字認識装置において、
前記認識辞書は、1または複数の文字コードと、各文字コードに対応付けて設けられた自テンプレートの使用可否を決定するための使用可否情報を有する複数のテンプレートを格納してなり、
文字認識処理時に、前記各テンプレートのうち前記使用可否情報が自テンプレート使用可を意味する内容に設定されているテンプレートのみを用いて、入力された文字イメージの特徴量との距離計算を行い、前記文字イメージの特徴量との距離が最も近いテンプレートの文字コードに対応する文字を認識候補文字として出力する認識処理手段を備え、
前記認識処理手段は前記各テンプレートのうち文字コードが複数設けられたテンプレートについては各文字コードに対応付けられている使用可否情報が自テンプレート使用可を意味する内容に設定されているか否かをそれぞれ調べる、
ことを特徴とする文字認識装置。 - 前記認識辞書のテンプレートは、更に、前記各文字コードに対応付けられた前記各使用可否情報を変更する際に用いられる1または複数の使用履歴情報を有し、
文字認識処理時に、前記認識辞書の使用量を計測する使用量計測手段と、
文字認識処理による認識結果に対し修正を行うための修正手段と、
前記修正手段による修正が行われなかった認識結果について、該認識結果の認識に用いられた文字コードを有するテンプレートにおける当該文字コードの使用履歴情報を使用済みを意味する内容に変更し、前記使用量計測手段による計測値が所定値と等しくなったとき、前記認識辞書のテンプレートのうち自テンプレート未使用を意味する使用履歴情報を有するテンプレートであって使用可否情報が使用可となっているテンプレートの使用可否情報を自テンプレート使用不可を意味する内容に変更し、自テンプレート使用済みを意味する使用履歴情報を有するテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する認識辞書更新手段と、
を備えたことを特徴とする請求項1に記載の文字認識装置。 - 前記認識処理手段によって出力された認識候補文字列のうち、単語と推定される文字群の文字単位の認識候補文字を単語辞書に格納されている単語データと照合し、照合結果を出力する単語照合手段と、
前記単語照合手段による出力結果による前記単語辞書の更新後に、該単語辞書に登録されている文字コードで順次前記認識辞書のテンプレートの文字コードを比較し、文字コードが一致したテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更し、前記単語辞書に登録されている文字コードとは文字コードが一致しないテンプレートの文字コードに対応する使用可否情報を自テンプレート使用不可を意味する内容に変更する認識辞書更新手段と、
を備えたことを特徴とする請求項1に記載の文字認識装置。 - 前記認識処理手段による認識結果に対し修正を行うための修正手段と、
前記修正手段によって、修正された認識結果に対応する文字コードの使用可否情報が自テンプレート使用不可を意味する内容に設定されているとき、当該テンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する認識辞書更新手段と、
を備えたことを特徴とする請求項1に記載の文字認識装置。 - 1または複数の文字コードと、各文字コードに対応付けて設けられた自テンプレートの使用可否を決定するための使用可否情報を有する複数のテンプレートを格納してなる認識辞書を用いて文字認識処理を行う文字認識方法であって、
文字認識処理時に、
前記使用可否情報が自テンプレート使用可を意味する内容に設定されているテンプレートのみを用いて、入力された文字イメージの特徴量との距離計算を行う工程と、
前記文字イメージの特徴量との距離が最も近いテンプレートの文字コードに対応する文字を認識候補文字として出力する工程と、
を備え、
前記距離計算を行う工程は、前記各テンプレートのうち文字コードが複数設けられたテンプレートについては各文字コードに対応付けられている使用可否情報が自テンプレート使用可を意味する内容に設定されているか否かをそれぞれ調べる工程を含む、
ことを特徴とする文字認識方法。 - 更に、前記認識辞書のテンプレートは前記各文字コードに対応付けられた前記各使用可否情報を変更する際に用いられる1または複数の使用履歴情報を有し、
前記文字認識処理時に、
前記認識辞書の使用量を計測する工程と、
文字認識処理による認識結果に誤認識がある場合に該認識結果の修正を行う工程と、
前記工程による修正が行われなかった認識結果について、該認識結果の認識に用いられた文字コードを有するテンプレートにおける当該文字コードの使用履歴情報を使用済みを意味する内容に変更する工程と、
前記計測値と所定値とを比較し、計測値が所定値と等しくなったとき、前記認識辞書のテンプレートのうち前記使用履歴情報が自テンプレート未使用を意味するテンプレートであって使用可否情報が使用可となっているテンプレートの使用可否情報を自テンプレート使用不可を意味する内容に変更し、前記使用履歴情報が自テンプレート使用済みを意味するテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する工程と、
を備えたことを特徴とする請求項5に記載の文字認識方法。 - 文字認識処理による認識候補文字列のうち、単語と推定される文字群の文字単位の認識候補文字を単語辞書に格納されている単語データと照合し、照合結果を出力する工程と、
前記照合結果の出力によって前記単語辞書の更新を行う工程と、
該単語辞書に登録されている文字コードで順次前記認識辞書のテンプレートの文字コードを比較する工程と、
前記比較により文字コードが一致したテンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更し、前記単語辞書に登録されている文字コードとは文字コードが一致しないテンプレートの文字コードに対応する使用可否情報を自テンプレート使用不可を意味する内容に変更する工程と、
を備えたことを特徴とする請求項5に記載の文字認識方法。 - 前記認識処理による認識結果を修正する工程と、
前記修正によって、修正された認識結果に対応する文字コードの使用可否情報が自テンプレート使用不可を意味する内容に設定されているとき、当該テンプレートの使用可否情報を自テンプレート使用可を意味する内容に変更する工程と、
を備えたことを特徴とする請求項5に記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002268450A JP4285960B2 (ja) | 2002-09-13 | 2002-09-13 | 文字認識装置及び文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002268450A JP4285960B2 (ja) | 2002-09-13 | 2002-09-13 | 文字認識装置及び文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004110135A JP2004110135A (ja) | 2004-04-08 |
JP4285960B2 true JP4285960B2 (ja) | 2009-06-24 |
Family
ID=32266657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002268450A Expired - Lifetime JP4285960B2 (ja) | 2002-09-13 | 2002-09-13 | 文字認識装置及び文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4285960B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100390815C (zh) * | 2005-08-18 | 2008-05-28 | 北大方正集团有限公司 | 模板优化的字符识别方法和系统 |
-
2002
- 2002-09-13 JP JP2002268450A patent/JP4285960B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2004110135A (ja) | 2004-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9489371B2 (en) | Detection of data in a sequence of characters | |
JP3639126B2 (ja) | 住所認識装置及び住所認識方法 | |
JPH10105655A (ja) | 光学文字認識のための検証および訂正の方法およびシステム | |
EP1559061A2 (en) | Post-processing system and method for correcting machine recognized text | |
CN112560842A (zh) | 一种信息识别方法、装置、设备和可读存储介质 | |
CN113128504A (zh) | 一种基于校验规则的ocr识别结果纠错方法、设备 | |
US20110229036A1 (en) | Method and apparatus for text and error profiling of historical documents | |
JP4285960B2 (ja) | 文字認識装置及び文字認識方法 | |
CN117422064A (zh) | 搜索文本纠错方法、装置、计算机设备及存储介质 | |
JP2000089786A (ja) | 音声認識結果の修正方法および装置 | |
US6859556B2 (en) | Word recognizing apparatus for dynamically generating feature amount of word and method thereof | |
JP2023507881A (ja) | ドメインベースのテキスト抽出方法およびシステム | |
CN114049642A (zh) | 一种表格证件影像件的文本识别方法及计算设备 | |
JPH076215A (ja) | ニューラルネットワークに基づく文字処理装置のための字句の後処理方法 | |
CN106250354A (zh) | 处理文书的信息处理装置、信息处理方法以及程序 | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
US11321955B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20240020473A1 (en) | Domain Based Text Extraction | |
CN114997147B (zh) | 基于混合mask的poi地址纠错方法、装置、存储介质和设备 | |
JP3548372B2 (ja) | 文字認識装置 | |
JP2894305B2 (ja) | 認識装置の候補修正方式 | |
CN117764694A (zh) | 风险账户识别方法、装置、电子设备和存储介质 | |
JP4633271B2 (ja) | 辞書学習方法及び辞書学習プログラム | |
JPH0256086A (ja) | 文字認識の後処理方法 | |
CN115984869A (zh) | 一种文本纠正方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040608 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040608 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090324 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4285960 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150403 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |