JP4143148B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP4143148B2
JP4143148B2 JP31590597A JP31590597A JP4143148B2 JP 4143148 B2 JP4143148 B2 JP 4143148B2 JP 31590597 A JP31590597 A JP 31590597A JP 31590597 A JP31590597 A JP 31590597A JP 4143148 B2 JP4143148 B2 JP 4143148B2
Authority
JP
Japan
Prior art keywords
character
candidate character
distance
candidate
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31590597A
Other languages
English (en)
Other versions
JPH11134438A (ja
Inventor
寿太郎 石岡
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP31590597A priority Critical patent/JP4143148B2/ja
Publication of JPH11134438A publication Critical patent/JPH11134438A/ja
Application granted granted Critical
Publication of JP4143148B2 publication Critical patent/JP4143148B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は文字認識装置に関し、特に、文字パターンの認識結果の正誤を評価し、その結果を出力する文字認識装置に関する。
【0002】
【従来の技術】
従来の文字認識装置として、認識処理において読取った文字パターン(未知の文字)と候補文字の特徴を比較し、比較結果としてのパターン間の距離を得て候補文字のコードを未知の文字候補として出力するか否かのリジェクト判定を行うものがある。この場合、第1候補文字の距離を閾値と比較し、第1候補文字の距離が閾値以下の場合に第1候補文字のコードを未知の文字コードとして出力し、第1候補文字の距離が閾値より大きい場合にはリジェクト信号を出していた。
【0003】
しかしながら、上記従来技術の問題点として、第1候補文字が正解であっても距離が閾値より大きい場合にはリジェクト信号が出力されてしまうという問題点があった。この問題点は閾値を大きめに取ることにより軽減されるが、この場合、リジェクト信号を出力すべき信号についてもリジェクト信号が出力しにくくなり、誤認識率が増加するという不都合が生じるので得策ではないという問題が生じていた。
【0004】
このような問題点を解決する技術として、特開平8−272910号公報に開示の技術がある。同技術では、第1候補の文字コードと第2候補の文字コードを比較し、一致した場合は第1候補文字の距離と第1の閾値を比較し、距離が第1の閾値以下の場合には第1候補文字のコードを認識結果として出力し、第2の閾値を越える場合はリジェクト信号を出力する。また、第1候補文字と第2候補文字のコードが不一致の場合は第1候補文字の距離と第2の閾値を比較し距離が第2の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第2の閾値を越える場合はリジェクト信号を出力するようにしている。
【0005】
【発明が解決しようとする課題】
上記の特開平8−272910号公報に開示の技術によれば、第1候補のみを認識対象としているので、第1候補文字がリジェクト信号を出力すべき文字の場合で、他の候補文字が正解の場合に、他の候補文字が閾値以下でも第1候補文字の距離がより大きければリジェクト信号を出してしまうという不都合があった。
【0006】
本発明は、上記不都合に鑑みてなされたものであり、1カテゴリ(1文字種)に対して複数の辞書を用意するマルチ・テンプレート構成の文字認識装置において、最初に第1候補文字のコードと第2候補文字のコードの比較の結果リジェクト信号を出す場合に、更に、第2候補文字以降の辞書の優先の有無の判定動作を加えることによって、更に、リジェクト判定性能の向上および誤認識率の低減を実現し得る文字認識装置の提供を目的とする。
【0007】
【課題を解決するための手段】
上記課題を解決するために、請求項1に記載の発明の文字認識装置は、文字種ごとに、文字コード、閾値、辞書属性、及び該文字の標準特徴量を含むマルチテンプレート構成の複数の辞書を有する文字認識装置において、入力された1文字分の文字パターンについて複数の認識候補文字を取得する認識部と、文字パターン毎に設定された記入文字情報を格納するフィールド情報格納部と、(1)認識部で得た第1候補文字のコードと第2候補文字のコードとを比較し、(2)文字コードが一致する場合に、第1候補文字の距離と第1の閾値とを比較し、第1候補文字の距離が第1の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第1の閾値を越える場合には第1候補文字が優先するか否かをフィールド情報格納部に格納されている記入文字情報に基づいて判定し、(3)第1候補文字が優先する場合は、第1候補文字の距離と第2の閾値とを比較し、第1候補文字の距離が第2の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字が優先しない場合または第1候補文字の距離が第2の閾値を超える場合に、第2候補文字優先の可否をフィールド情報格納部に格納されている記入文字情報に基づいて判定し、(4)第2候補文字が優先する場合は、第2候補文字の距離と第3の閾値とを比較し、第2候補文字の距離が第3の閾値以下の場合に第2候補文字のコードを認識結果として出力し、(5)第2候補文字が優先しない場合または第2候補文字の距離が第3の閾値を超える場合にリジェクト信号を出力する判定部、を備えたことを特徴とする。
【0008】
また、請求項2に記載の発明は、請求項1に記載の発明の文字認識装置において、判定部は、第1候補文字と第2候補文字のコードが一致しない場合には、(6)第1候補文字の距離と第4の閾値とを比較し、第1候補文字の距離が第4の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第4の閾値を越える場合には第1候補文字が優先するか否かをフィールド情報格納部に格納されている記入文字情報に基づいて判定し、(7)第1候補文字が優先する場合には第1候補文字の距離と第5の閾値とを比較し、第1候補文字の距離が第5の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第5の閾値を超える場合または第1候補文字が優先しない場合に第2候補文字優先の可否をフィールド情報格納部に格納されている記入文字情報に基づいて判定し、(8)第2候補文字が優先する場合には、第2候補文字の距離と第6の閾値とを比較し、第2候補文字の距離が第6の閾値以下の場合に第2候補文字のコードを認識結果として出力し、(9)第2候補文字が優先しない場合または第2候補文字の距離が第6の閾値を超える場合にリジェクト信号を出力する、ことを特徴とする。
【0009】
また、請求項3に記載の文字認識装置は、文字種ごとに、文字コード、閾値、辞書属性、及び該文字の標準特徴量を含むマルチテンプレート構成の複数の辞書を有する文字認識装置において、入力された1文字分の文字パターンについて複数の認識候補文字を取得する認識部と、文字パターン毎に設定された記入文字情報を格納するフィールド情報格納部と、(1)第1候補文字が優先するか否かをフィールド情報格納部に格納されている記入文字情報に基づいて判定し、(2)第1候補文字が優先する場合には、第1候補文字の距離と第1の閾値とを比較し、第1候補文字の距離が第1の閾値以下の場合に第1候補文字のコードを認識結果として出力し、(3)第1候補文字が優先しない場合または第1候補文字の距離が第1の閾値を超える場合に、第2候補文字が優先するか否かをフィールド情報格納部に格納されている記入文字情報に基づいて判定し、(4)第2候補文字が優先する場合には、第2候補文字の距離と第2の閾値とを比較し、第2候補文字の距離が第2の閾値以下の場合に第2候補文字のコードを認識結果として出力し、(5)第2候補文字が優先しない場合または第2候補文字の距離が第2の閾値を超える場合には、第1候補文字の距離と第1の閾値とは異なる値の閾値とを比較し、第1候補文字の距離が該閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が該閾値を越える場合にリジェクト信号を出力する判定部、を備えたことを特徴とする。
また、請求項4に記載の発明は請求項3の記載の発明の文字認識装置において、判定部は、(5−1)第2候補文字が優先しない場合または第2候補文字の距離が第2の閾値を超える場合には、第1候補文字のコードと第2候補文字のコードとを比較し、(5−2)文字コードが一致する場合には、第1候補文字の距離と第3の閾値を比較し、第1候補文字の距離が第3の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第3の閾値を越える場合にはリジェクト信号を出力し、(5−3)文字コードが一致しない場合には、第1候補文字の距離と第4の閾値を比較し、第1候補文字の距離が第4の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第4の閾値を越える場合にはリジェクト信号を出力する、ことを特徴とする。
【0010】
【発明の実施の形態】
図1は本発明に基づく文字認識装置の一実施例の文字認識処理ブロック100の構成図であり、101は文字特徴格納部、102は認識部、103は辞書部、104はリジェクト判定部であり、105はフィールド情報格納部である。
【0011】
文字特徴格納部101は、1文字分のパターンCpを入力して文字パターンCpの特徴量Fdとの距離計算を行う。
【0012】
認識部102は、文字特徴格納部101で得た距離の小さい順(昇順)に当該距離の文字コードおよびその距離を格納する。
【0013】
辞書部103は、例えば数字、アルファベットなどの標準的な特徴量Fd、辞書属性At、閾値Thおよび文字コードCo等から構成されるテンプレート構成をなし、各文字種に対して予め複数個のテンプレートを格納している。
【0014】
リジェクト判定部104は、認識部102によって候補文字となった文字の文字コードを認識結果として出力するか否かを判定する。すなわち、リジェクト判定部104は、候補文字となった文字の距離と閾値とを比較し、距離が閾値以下の場合に候補文字の文字コードを認識結果として出力し、距離が閾値より大きい場合に、認識候補文字に対応する辞書の認識属性、および文字入力パターンに対応するフィールド情報格納部105のフィールド情報によってその候補文字を優先するか否かを判定する。なお、認識候補文字に対応する辞書の辞書属性には、例えば、優先されるべきフィールドの位置などの情報があり、入力文字パターンに対応するフィールド情報格納部105のフィールド情報の位置をあらわす情報と優先されるべきフィールドの位置が一致する場合にその候補文字を優先させる。
【0015】
フィールド情報格納部105は、例えば、文字パターンCpの記入欄の記入条件や記入欄の番号などから構成されている。
【0016】
<実施形態1>
図2は、辞書部103の辞書テーブルの一実施例の構成を示す図であり、辞書テーブル20は、テーブル番号NT、文字コードCo、第1閾値Th1、第2閾値Th2、第3閾値Th3、第4閾値Th4、第5閾値Th5、第6閾値Th6、辞書属性Atおよび標準特徴量Fdから構成されている。なお、テーブル番号NTは順次割当てられる。
図2の例では、文字種Co1の辞書がテーブル番号1〜3までの3種類あり、文字種Co2の辞書がテーブル番号4,5の2種類ある。なお、標準特徴量欄の添字nは1文字の特徴数であり、特徴抽出の方法によって異なる。
【0017】
図3は、リジェクト判定部104の動作例を示すフローチャートであり、認識部102で第1候補文字となった文字と第2候補文字となった文字のコードを比較して一致した場合にはS2に移行し、一致しなかった場合にはS7に移行する(S1)。
【0018】
上記S1で、第1候補文字と第2候補文字の文字コードが一致した場合は認識部102に格納されている第1候補文字の距離を辞書部103の辞書テーブル20の第1閾値と比較し、第1候補文字の距離が第1閾値より大きい場合にはS3に移行し、第1候補文字の距離が第1閾値以下の場合にはS14に移行する(S2)。
【0019】
上記S2で第1候補文字の距離が第1閾値より大きい場合には第1候補文字が優先されるか否かを判定し、第1候補文字が優先すると判定された場合にはS4に移行し、優先しないと判定された場合にはS5に移行する(S3)。
【0020】
上記S3で、第1候補文字が優先すると判定された場合には認識部102に格納されている第1候補文字の距離を辞書部103の辞書テーブル20の第2閾値と比較し、第1候補文字の距離が第2閾値以下の場合にはS14に移行し、第1候補文字の距離が第2閾値より大きい場合にはS5に移行する(S4)。
【0021】
上記S3で第1候補文字が優先しないと判定された場合または上記S4で第1候補文字の距離が第2閾値より大きい場合には、第2候補文字が優先されるか否かを判定し、第2候補文字が優先する場合にはS6に移行し、優先しない場合にはS12に移行する(S5)。
【0022】
上記S5で、第2候補文字が優先すると判定された場合には認識部102に格納されている第2項候補文字の距離を辞書部103の辞書テーブル20の第3閾値Th3と比較し、第2候補文字の距離が第3閾値以下の場合にはS13に移行し、第2候補文字の距離が第3閾値より大きい場合にはS12に移行する(S6)。
【0023】
上記S1で、第1候補文字となった文字と第2候補文字となった文字のコードが一致しなかった場合には、認識部102に格納されている第1項候補文字の距離を辞書部103の辞書テーブル20の第4閾値Th4と比較し、第1候補文字の距離が第4閾値以下の場合にはS14に移行し、第1候補文字の距離が第1閾値より大きい場合にはS8に移行する(S7)。
【0024】
上記S7で、第1候補文字の距離が第1閾値より大きい場合には第1候補文字が優先されるか否かを判定し、第1候補文字が優先すると判定された場合にはS9に移行し、優先しないと判定された場合にはS10に移行する(S8)。
【0025】
上記S8で、第1候補文字が優先すると判定された場合には認識部102に格納されている第1候補文字の距離を辞書部103の辞書テーブル20の第5閾値Th5と比較し、第1候補文字の距離が第5閾値以下の場合にはS14に移行し、第1候補文字の距離が第5閾値より大きい場合にはS10に移行する(S9)。
【0026】
上記S8で第1候補文字が優先しないと判定された場合または上記S9で第1候補文字の距離が第5閾値より大きい場合には、第2候補文字が優先されるか否かを判定し、第2候補文字が優先する場合にはS11に移行し、優先しない場合にはS12に移行する(S10)。
【0027】
上記S10で、第2候補文字が優先すると判定された場合には認識部102に格納されている第2候補文字の距離を辞書部103の辞書テーブル20の第6閾値Th6と比較し、第2候補文字の距離が第6閾値以下の場合にはS13に移行し、第2候補文字の距離が第5閾値より大きい場合にはS12に移行する(S11)。
【0028】
上記S5,S6,またはS10で第2候補文字が優先しないと判定された場合または上記S11で第2候補文字の距離が第5閾値より大きい場合にはリジェクト信号を出力して1文字分の判定動作を終了する(S12)。
【0029】
上記S6で第2候補文字の距離が第3閾値以下の場合または上記S11で第2候補文字の距離が第6閾値以下の場合には第2候補の文字コードを認識結果として出力して1文字分の判定動作を終了する(S13)。
【0030】
上記S2で第1候補文字の距離が第1閾値以下の場合、上記S4で第1候補文字の距離が第2閾値以下の場合、上記S7で第1候補文字の距離が第4閾値以下の場合、または上記S9で第1候補文字の距離が第5閾値以下の場合、には第1候補の文字コードを認識結果として出力して1文字分の判定動作を終了する(S14)。
【0031】
例えば、図2の辞書テーブル20で、文字コードCo1の文字を’8’文字コードCo2の文字を’B’とし、第1閾値Th11,Th12,Th13,Th14,Th15を 200第2閾値Th21,Th22,Th23,Th24,Th25を250第3閾値Th31,Th32,Th33,Th34,Th35を230第4閾値Th41,Th42,Th43,Th44,Th45を150、第5閾値Th51,Th52,Th53,Th54,Th55を 200第6閾値Th61,Th62,Th63,Th64,Th65を 180とするとき、文字パターンCpが’8’であり、認識部102で次のような結果を得たものとする。
第1候補文字 テーブル番号:1 文字コード:Co1 距離:210第2候補文字 テーブル番号:2 文字コード:Co1 距離:220さらに、第1候補文字の辞書属性At1と文字パターンCpに対応するフィールド情報が一致している。
【0032】
この場合、リジェクト判定部104は図3のフローチャートに従って、S1で第1候補の文字コードと第2文字コードを比較する。その結果、両者が一致しているのでS2に移行する。
S2では、第1候補文字の距離’210’と第1閾値Th11(=200)を比較し、第1候補文字の距離のほうが第1閾値より大きいのでS3に移行して、第1候補文字を優先するか否かの判定を行なう。ここで、第1候補文字の辞書属性At1と文字パターンCpに対応するフィールド情報が一致しているので、第1候補文字を優先すると判定されS4に移行する。
S4では、第1候補文字の距離’210’と第2閾値Th21(=200)を比較し、第1候補文字の距離が第2閾値以下なのでS14に移行して、第1候補文字の文字コードCo1が認識結果として出力される。
次に、文字パターンCpが’B’であり、認識部102で次のような結果を得たものとする。
第1候補文字
テーブル番号:3 文字コード:Co1 距離:160
第2候補文字
テーブル番号:5 文字コード:Co2 距離:170
さらに、第1候補文字の辞書属性At3と文字パターンCpに対応するフィールド情報が一致せず、第2候補文字の辞書属性At5と文字パターンCpに対応するフィールド情報が一致している。
【0033】
この場合、リジェクト判定部104は図3のフローチャートに従って、S1で第1候補の文字コードと第2文字コードを比較する。その結果、両者が一致していないのでS7に移行する。
S7では、第1候補文字の距離’160’と第4閾値Th43(=150)を比較し、第1候補文字の距離のほうが第1閾値より大きいのでS8に移行して、第1候補文字を優先するか否かの判定を行なう。ここで、第1候補文字の辞書属性At3と文字パターンCpに対応するフィールド情報が一致していないので、第1候補文字を優先しないと判定されS10に移行する。
S10では、第2候補文字を優先するか否かの判定を行なう。ここで、第2候補文字の辞書属性At5と文字パターンCpに対応するフィールド情報が一致しているので、第2候補文字を優先すると判定されS11に移行する。
S11では、第2候補文字の距離’170’と第6閾値Th65(=180)を比較し、第2候補文字の距離が第2閾値以下なのでS13に移行して、第2候補文字の文字コードCo2が認識結果として出力される。
【0034】
<実施形態2>
図4は、辞書部103の辞書テーブルの一実施例の構成を示す図であり、辞書テーブル40は、テーブル番号NT、文字コードCo、第1閾値Th11、第2閾値Th12、第3閾値Th13、第4閾値Th14、辞書属性Atおよび標準特徴量Fdから構成されている。なお、テーブル番号NTは順次割当てられる。
図4の例では、文字種Co1の辞書がテーブル番号1〜3までの3種類あり、文字種Co2の辞書がテーブル番号4,5の2種類ある。なお、標準特徴量欄の添字nは1文字の特徴数であり、特徴抽出の方法によって異なる。
【0035】
図5は、リジェクト判定部104の動作例を示すフローチャートであり、認識部102で第1候補文字となった文字が優先されるか否かについて判定し、第1候補文字が優先すると判定された場合にはT2に移行し、優先しないと判定された場合にはT3に移行する(T1)。
【0036】
上記T1で、第1候補文字が優先すると判定された場合には認識部102に格納されている第1候補文字の距離を辞書部103の辞書テーブル40の第1閾値と比較し、第1候補文字の距離が第1閾値より大きい場合にはT3に移行し、第1候補文字の距離が第1閾値以下の場合にはT9に移行する(T2)。
【0037】
上記T1で第1候補文字が優先しない場合または上記T2で第1候補文字の距離が第1閾値より大きい場合には、第2候補文字が優先されるか否かについて判定し、第2候補文字が優先すると判定された場合にはT4に移行し、優先しないと判定された場合にはT5に移行する(T3)。
【0038】
上記T3で、第2候補文字が優先すると判定された場合には認識部102に格納されている第2候補文字の距離を辞書部103の辞書テーブル40の第2閾値と比較し、第2候補文字の距離が第2閾値より大きい場合にはT5に移行し、第2候補文字の距離が第2閾値以下の場合にはT10に移行する(T4)。
【0039】
上記T3で第2候補文字が優先しない場合または上記T4で第2候補文字の距離が第2閾値より大きい場合には、第1候補文字の文字コードと第候補文字の文字コードを比較し、第1候補文字の文字コードと第候補文字の文字コードが一致する場合にはT6に移行し、一致しない場合にはT7に移行する(T5)。
【0040】
上記T5で、第1候補文字の文字コードと第候補文字の文字コードが一致した場合には認識部102に格納されている第1候補文字の距離を辞書部103の辞書テーブル40の第3閾値と比較し、第1候補文字の距離が第3閾値より大きい場合にはT8に移行し、第1候補文字の距離が第3閾値以下の場合にはT9に移行する(T6)。
【0041】
上記T5で、第1候補文字の文字コードと第候補文字の文字コードが一致しない場合には認識部102に格納されている第1候補文字の距離を辞書部103の辞書テーブル40の第4閾値と比較し、第1候補文字の距離が第4閾値より大きい場合にはT8に移行し、第1候補文字の距離が第4閾値以下の場合にはT9に移行する(T7)。
【0042】
上記T6で第1候補文字の距離が第3閾値より大きい場合または上記T7で第1候補文字の距離が第4閾値より大きい場合にはリジェクト信号を出力して1文字分の判定動作を終了する(T8)。
【0043】
上記T2で第1候補文字の距離が第1閾値より大きい場合と上記T6で第1候補文字の距離が第3閾値以下の場合または上記T7で第1候補文字の距離が第4閾値以下の場合には第1候補の文字コードを認識結果として出力して1文字分の判定動作を終了する(T9)。
【0044】
上記T4で第2候補文字の距離が第2閾値以下の場合は第2候補の文字コードを認識結果として出力して1文字分の判定動作を終了する(T10)。例えば、図4の辞書テーブル40で、文字コードCo1の文字を’8’文字コードCo2の文字を’B’とし、第1閾値Th111,Th112,Th113,Th114,Th115を250第2閾値Th121,Th122,Th123,Th124,Th125を230第3閾値Th131,Th132,Th133,Th134,Th135を230第4閾値Th141,Th142,Th143,Th144,Th145を200とするとき、文字パターンCpが’8’であり、認識部102で次のような結果を得たものとする。
第1候補文字 テーブル番号:1 文字コード:Co1 距離:240第2候補文字 テーブル番号:2 文字コード:Co1 距離:280さらに、第1候補文字の辞書属性At1と文字パターンCpに対応するフィールド情報が一致している。
【0045】
この場合、リジェクト判定部104は図5のフローチャートに従って、T1で第1候補文字を優先するか否かを判定する。ここで、第1候補文字の辞書属性At1と文字パターンCpに対応するフィールド情報が一致しているので第1候補文字を優先すると判定してT2に移行する。
T2では、第1候補文字の距離’240’が第1閾値Th111(=250)以下なので、T9に移行して、第1候補の文字コードCo1が認識結果として出力される。
【0046】
次に、文字パターンCpが’B’であり、認識部102で次のような結果を得たものとする。
第1候補文字
テーブル番号:3 文字コード:Co1 距離:220
第2候補文字
テーブル番号:5 文字コード:Co2 距離:230
さらに、第1候補文字の辞書属性At3と文字パターンCpに対応するフィールド情報が一致せず、第2候補文字の辞書属性At5と文字パターンCpに対応するフィールド情報が一致している。
【0047】
この場合、リジェクト判定部104は図5のフローチャートに従って、T1で第1候補文字を優先するか否かを判定する。ここで、第1候補文字の辞書属性At3と文字パターンCpに対応するフィールド情報が一致していないので、第1候補文字を優先しないと判定されT3に移行する。
【0048】
T3では、第2候補文字を優先するか否かを判定する。ここで、第2候補文字の辞書属性At5と文字パターンCpに対応するフィールド情報が一致しているので、第2候補文字を優先すると判定されT4に移行する。
【0049】
T4では、第2候補文字の距離’230’と第2閾値Th125(=230)を比較し、第2候補文字の距離が第2閾値以下なのでT10に移行して、第2候補文字の文字コードCo2が認識結果として出力される。
【0050】
【発明の効果】
以上説明したように、本発明の文字認識装置によれば、1文字種に対して複数の辞書を用意するマルチテンプレート構成の文字認識装置で、本来ならばリジェクトとなる文字でも記入場所毎の優先順位によっては第2候補文字以降の辞書が優先され、その文字コードを認識結果として出力できるので、誤認識率の低減に加えリジェクト判定性能のいっそうの向上が実現する。
【図面の簡単な説明】
【図1】本発明に基づく文字認識装置の一実施例の文字認識処理ブロックの構成図である。
【図2】辞書部のテーブル構成の一例である。
【図3】リジェクト判定部の第1の動作例を示すフローチャートである。
【図4】辞書部のテーブル構成の一例である。
【図5】リジェクト判定部の第2の動作例を示すフローチャートである。
【符号の説明】
20,40 辞書テーブル
100 文字認識処理ブロック
101 文字特徴格納部
102 認識部
103 辞書部
104 リジェクト判定部
105 フィールド情報格納部

Claims (4)

  1. 文字種ごとに、文字コード、閾値、辞書属性、及び該文字の標準特徴量を含むマルチテンプレート構成の複数の辞書を有する文字認識装置において、
    入力された1文字分の文字パターンについて複数の認識候補文字を取得する認識部と、
    文字パターン毎に設定された記入文字情報を格納するフィールド情報格納部と、
    (1)認識部で得た第1候補文字のコードと第2候補文字のコードとを比較し、
    (2)文字コードが一致する場合に、第1候補文字の距離と第1の閾値とを比較し、第1候補文字の距離が第1の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第1の閾値を越える場合には第1候補文字が優先するか否かを前記フィールド情報格納部に格納されている記入文字情報に基づいて判定し、
    (3)第1候補文字が優先する場合は、第1候補文字の距離と第2の閾値とを比較し、第1候補文字の距離が第2の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字が優先しない場合または第1候補文字の距離が第2の閾値を超える場合に、第2候補文字優先の可否を前記フィールド情報格納部に格納されている記入文字情報に基づいて判定し、
    (4)第2候補文字が優先する場合は、第2候補文字の距離と第3の閾値とを比較し、第2候補文字の距離が第3の閾値以下の場合に第2候補文字のコードを認識結果として出力し、
    (5)第2候補文字が優先しない場合または第2候補文字の距離が前記第3の閾値を超える場合にリジェクト信号を出力する判定部、
    を備えたことを特徴とする文字認識装置。
  2. 前記判定部は、前記第1候補文字と第2候補文字のコードが一致しない場合には、
    (6)第1候補文字の距離と第4の閾値とを比較し、第1候補文字の距離が第4の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第4の閾値を越える場合には第1候補文字が優先するか否かを前記フィールド情報格納部に格納されている記入文字情報に基づいて判定し、
    (7)第1候補文字が優先する場合には第1候補文字の距離と第5の閾値とを比較し、第1候補文字の距離が第5の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第5の閾値を超える場合または第1候補文字が優先しない場合に第2候補文字優先の可否を前記フィールド情報格納部に格納されている記入文字情報に基づいて判定し、
    (8)第2候補文字が優先する場合には、第2候補文字の距離と第6の閾値とを比較し、第2候補文字の距離が第6の閾値以下の場合に第2候補文字のコードを認識結果として出力し、
    (9)第2候補文字が優先しない場合または第2候補文字の距離が前記第6の閾値を超える場合にリジェクト信号を出力する、
    ことを特徴とする請求項1に記載の文字認識装置。
  3. 文字種ごとに、文字コード、閾値、辞書属性、及び該文字の標準特徴量を含むマルチテンプレート構成の複数の辞書を有する文字認識装置において、
    入力された1文字分の文字パターンについて複数の認識候補文字を取得する認識部と、
    文字パターン毎に設定された記入文字情報を格納するフィールド情報格納部と、
    (1)第1候補文字が優先するか否かを前記フィールド情報格納部に格納されている記入文字情報に基づいて判定し、
    (2)第1候補文字が優先する場合には、第1候補文字の距離と第1の閾値とを比較し、第1候補文字の距離が第1の閾値以下の場合に第1候補文字のコードを認識結果として出力し、
    (3)第1候補文字が優先しない場合または第1候補文字の距離が第1の閾値を超える場合に、第2候補文字が優先するか否かを前記フィールド情報格納部に格納されている記入文字情報に基づいて判定し、
    (4)第2候補文字が優先する場合には、第2候補文字の距離と第2の閾値とを比較し、第2候補文字の距離が第2の閾値以下の場合に第2候補文字のコードを認識結果として出力し、
    (5)第2候補文字が優先しない場合または第2候補文字の距離が前記第2の閾値を超える場合には、第1候補文字の距離と第1の閾値とは異なる値の閾値とを比較し、第1候補文字の距離が該閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が該閾値を越える場合にリジェクト信号を出力する判定部、
    を備えたことを特徴とする文字認識装置。
  4. 前記判定部は、
    (5−1)第2候補文字が優先しない場合または第2候補文字の距離が前記第2の閾値を超える場合には、第1候補文字のコードと第2候補文字のコードとを比較し、
    (5−2)文字コードが一致する場合には、第1候補文字の距離と第3の閾値を比較し、第1候補文字の距離が第3の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第3の閾値を越える場合にはリジェクト信号を出力し、
    (5−3)文字コードが一致しない場合には、第1候補文字の距離と第4の閾値を比較し、第1候補文字の距離が第4の閾値以下の場合に第1候補文字のコードを認識結果として出力し、第1候補文字の距離が第4の閾値を越える場合にはリジェクト信号を出力する、
    ことを特徴とする請求項3に記載の文字認識装置。
JP31590597A 1997-10-31 1997-10-31 文字認識装置 Expired - Fee Related JP4143148B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31590597A JP4143148B2 (ja) 1997-10-31 1997-10-31 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31590597A JP4143148B2 (ja) 1997-10-31 1997-10-31 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11134438A JPH11134438A (ja) 1999-05-21
JP4143148B2 true JP4143148B2 (ja) 2008-09-03

Family

ID=18071026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31590597A Expired - Fee Related JP4143148B2 (ja) 1997-10-31 1997-10-31 文字認識装置

Country Status (1)

Country Link
JP (1) JP4143148B2 (ja)

Also Published As

Publication number Publication date
JPH11134438A (ja) 1999-05-21

Similar Documents

Publication Publication Date Title
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
EP2073146A1 (en) Pattern recognizing device for recognizing input pattern by using dictionary pattern
JPH07509576A (ja) 文字の認識方法
JP4143148B2 (ja) 文字認識装置
JPS62271086A (ja) パタ−ン認識装置
JP3659688B2 (ja) 文字認識装置
JP2894305B2 (ja) 認識装置の候補修正方式
JP2875678B2 (ja) 文字認識結果の後処理方法
JP2851865B2 (ja) 文字認識装置
JP3446769B2 (ja) 文字認識装置
JP2639314B2 (ja) 文字認識方式
JPS6224382A (ja) 手書き文字の認識方法
JPH02285477A (ja) 英文の大文字,小文字の判別方法
JPH0944604A (ja) 文字認識処理方法
JPH05298489A (ja) 文字認識方式
JPH0573027A (ja) 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置
JPS6344287A (ja) 文字読取装置
JPH01114991A (ja) 大文字,小文字の判別方法
JPH0765131A (ja) 文字認識装置
JPH04219883A (ja) 活字文字認識装置
JPS6215682A (ja) 文字入力方式
JPH0765128A (ja) 活字文字認識用辞書の作成方法
JPH01171080A (ja) 誤り自動訂正文字認識装置
JPS62271191A (ja) パタ−ン認識装置
JPS62236087A (ja) 文字認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041028

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080610

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080616

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees