JP3133846B2 - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JP3133846B2 JP3133846B2 JP04338754A JP33875492A JP3133846B2 JP 3133846 B2 JP3133846 B2 JP 3133846B2 JP 04338754 A JP04338754 A JP 04338754A JP 33875492 A JP33875492 A JP 33875492A JP 3133846 B2 JP3133846 B2 JP 3133846B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- distance
- recognition result
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
書き文字の書き手の癖などによる文字の変形の多様性に
よって生ずる誤差を最小限におさえることができる文字
認識方式に関する。OCRの適用分野が広まるに伴っ
て、文字を記入する書き手が専従の特定筆記者から、各
種申込み用紙に申込み者本人が記入する場合のように、
不特定筆記者へと広がっている。このため、文字認識に
おいて、予め標準パターン辞書として登録されている文
字からずれた文字をリジェクト(棄却)したり誤読した
りするなど、不安定な場合が発生する。このような、文
字字形を高精度で認識するためには、これら不安定な文
字はできるだけリジェクトし、人間の判断に委ねる方法
が必要となる。
パターンは、多数の不特定の筆記者より予め決められた
書式に従って記入された文字を収集し、この文字から認
識方式に依存する特徴を抽出し、抽出された特徴の平均
パターン等を得ることにより作成している。
ン辞書と、入力帳票から読み取った文字画像とを照合す
るには、切り出した一文字から特徴を抽出し、この特徴
と標準パターン辞書との間で類似度計算、あるいは、例
えば下式(1)による距離計算を行い、最大の類似度を
持つカテゴリあるいは、最小の距離となるカテゴリを認
識結果としている。
クトル、x(i):入力文字の特徴ベクトル
文字認識方式においては、多数の不特定の筆記者により
記入された文字を収集し、その特徴を抽出して作成され
た標準パターン辞書と、入力帳票から読み取った文字画
像とを照合しているので、入力帳票上に記入された文字
が標準パターン辞書を作成するのに使われた文字パター
ン、すなわち不特定多数の筆記者で書かれた文字集合か
ら大きく離れた変形を持つ文字であると、その文字の誤
読あるいはリジェクトとなる可能性が大きくなる。
する全ての人の全ての文字パターンを収集することは不
可能なので、誤読あるいはリジェクトは避けられない。
さらに、文字認識装置としては標準パターン辞書のメモ
リ容量にも現実上は制限があるので、標準パターン辞書
としてもつ文字パターンは限られた範囲のものとなり、
全ての文字パターンを標準パターン辞書としてもつこと
はできない。
なされたものであって、標準パターンの文字字形からは
ずれた文字字形を、その認識結果の不安定さを利用し
て、リジェクトすることにより、認識精度を向上させ、
文字の誤読率を減少させた文字認識方式を提供すること
を目的とする。
ック図である。上記課題を解決するため、本発明の請求
項1の発明は、同図に示すように、一文字として切り出
された文字画像1から特徴抽出を行い、抽出された特徴
とあらかじめ標準パターンとして作られた標準パターン
辞書2とのマッチングを行い認識結果を求める文字認識
方式において、1枚の入力シート上に記入された複数の
文字の一文字毎に特徴を抽出し、抽出された特徴を用い
て任意の2文字間の距離を求め、全ての文字間の距離を
記憶しておき、それぞれの文字の特徴と標準パターン辞
書2との距離計算することにより、最小距離となるカテ
ゴリを認識結果として求め、上記2文字間の距離テーブ
ルに記憶された2文字間の距離があらかじめ決められた
閾値以内となる文字について、その2文字の認識結果が
一致したとき、その認識結果を出力し、一致しないと
き、その文字の認識結果をリジェクトするようにしたも
のである。
切り出された文字画像1から特徴抽出を行い、抽出され
た特徴とあらかじめ標準パターンとして作られた標準パ
ターン辞書2とのマッチングを行い認識結果を求める文
字認識方式において、1枚の入力シート上に記入された
複数の文字の一文字毎に特徴を抽出し、抽出されたそれ
ぞれの文字の特徴と標準パターン辞書2との距離計算す
ることにより、最小距離となるカテゴリを認識結果とし
て求めて記憶しておき、全ての文字の認識結果が得られ
たのち、抽出された特徴を用いて任意の2文字間の距離
を求め、注目する文字の認識結果と、その文字からあら
かじめ決められた閾値以内の距離にある文字の認識結果
が一致したとき、その認識結果を出力し、一致しないと
き、その文字の認識結果をリジェクトするようにしたも
のである。
切り出された文字画像1から特徴抽出を行い、抽出され
た特徴とあらかじめ標準パターンとして作られた標準パ
ターン辞書2とのマッチングを行い認識結果を求める文
字認識方式において、1枚の入力シート上に記入された
複数の文字の一文字毎に特徴を抽出し、抽出された特徴
を用いて任意の2文字間の距離を求め、全ての文字間の
距離を記憶しておき、それぞれの文字の特徴と標準パタ
ーン辞書との距離計算することにより、最小距離となる
カテゴリを認識結果として求め、上記2文字間の距離テ
ーブルに記憶された2文字間の距離があらかじめ決めら
れた閾値以内となる文字について、認識結果の多数決を
求め、その認識結果を文字認識結果とするようにしたも
のである。
者であるので、同一のカテゴリであれば、似た字形をし
ている。例えば、数字の4の字形は記入者によって大き
く異なるが、同一の記入者であれば、ほぼ似たような字
形となる。例えば、図1の(a),(b)に示すよう
に、上部が開いた数字「4」を書く人は常に、あるいは
一枚の帳票上に文字を書く間は上部が開いた「4」を書
くと推測できる。
からずれのある「くせ字」を書く人は、一枚の帳票上で
は同じような癖字を書くと推測することができる。ま
た、そのような字は標準パターンとは遠い距離にあるの
で文字画像の認識にあたっては、誤読、あるいはリジェ
クトになってしまう可能性が高い。そこで、記入者によ
り書かれた文字間の距離を求め、文字間の距離が所定の
閾値以内の文字の認識結果が一致するか否かにより認識
結果を編集すれば、標準的に書かれる文字字形からはず
れた「くせ字」を安定にリジェクトすることができ、誤
読を少なくすることができる。
は、上記原理に基づき不安定な認識結果となるくせ字を
リジェクトするようにしたものであり、本発明の請求項
1の発明においては、あらかじめ、記入された文字の全
ての2文字間の距離を計算してテーブルに記憶してお
き、帳票上の全ての文字について認識結果が求まったと
き、それぞれの文字について、上記テーブルを参照して
2文字間の距離が所定の閾値より小さい文字群を求め、
その文字群の認識結果が一致する場合、認識結果をその
まま出力し、一致しない場合に、認識結果をリジェクト
するようにしたものである。本発明の請求項1の発明に
よれば、申込み書などの帳票に記入する文字が、例え
ば、図1(c),(d)に示すように標準パターン辞書
を作成するときに使った文字字形からはずれたものであ
っても、安定にリジェクトすることができ、認識精度を
向上させることができる。また、上記閾値をパラメタ指
定で変更することにより、最適な状態に設定することが
可能である。
上の文字について認識結果を求めて記憶しておき、全て
の文字の認識結果が得られたのち、抽出された特徴を用
いて任意の2文字間の距離を求め、注目する文字の認識
結果と、その文字からあらかじめ決められた閾値以内の
距離にある文字の認識結果が一致したとき、その認識結
果を出力し、一致しないときその文字の認識結果をリジ
ェクトするようにしたので、請求項1の発明と同様な効
果を得ることができるとともに、認識結果が異なる2文
字について、2文字間距離を求めればよいので、2文字
間距離を算出する処理量を請求項1の発明のものと比べ
減少させることができる。
字間の距離テーブルに記憶された2文字間の距離があら
かじめ決められた閾値以内となる文字について、認識結
果の多数決を求めその結果を文字認識結果とするように
したので、請求項1,請求項2の発明と較べ、リジェク
トされる文字を減少させることができる。
す図であり、同図において、11は帳票上に記入された
入力文字列、12は入力文字列をイメージとして読み込
み2値画像に変換する観測部、13は読み込まれたイメ
ージを格納する画像メモリ、14は読み込んだイメージ
より1文字を切りだし、文字位置を決める文字切り出し
位置決め部、15は切り出した1文字のイメージを格納
する画像メモリ、16は画像メモリに格納された1文字
のイメージから文字の形状を表す入力特徴ベクトル、例
えば、線密度、線方向特徴などを抽出する特徴抽出部、
17は抽出された入力特徴ベクトルを格納する特徴メモ
リである。
された平均ベクトルからなる標準パターン辞書、19は
特徴メモリ17に格納された入力特徴ベクトルと標準パ
ターン辞書の標準パターン・ベクトルとのマッチングを
行い距離を求め、認識結果を求める距離計算部、20は
距離計算部19により求めた認識結果を格納する認識結
果メモリである。
された入力特徴ベクトルと標準パターン辞書の特徴ベク
トルとのマッチングを行い、距離の小さいカテゴリから
M位までを候補として候補メモリに格納し、その内最小
となった距離のカテゴリを認識結果とする。また、入力
特徴ベクトルと標準パターン・ベクトルでのマッチング
距離としては、例えば、シティ・ブロック距離を用い
る。
(2)により計算され、入力特徴ベクトルとカテゴリA
との距離は、各特徴毎の最小距離の和として定義されて
おり、入力特徴ベクトルを全てのカテゴリの標準パター
ンと照合し、最小の距離となったカテゴリを認識結果と
する。ここで、x(i)は入力文字の特徴ベクトル、s
(i)は標準パターン辞書のカテゴリAの特徴ベクト
ル、mはカテゴリAの標準パターンの数、すなわち、テ
ンプレート数、nは特徴の数、例えば、特徴が線密度、
線方向特徴であれば、特徴数は2となる。qは特徴の次
元数である。
全ての2文字間の特徴ベクトルの距離を求める距離計算
部、22は距離計算部21により求めた2文字間の特徴
ベクトルの距離を格納する2文字間距離テーブル、23
は2文字間距離テーブル22に格納された2文字間の距
離に基づき、認識結果メモリ20に格納された認識結果
を編集し、リジェクトする文字を決定する認識結果編集
部、24は上記した観測部12、文字切り出し位置決め
部14、特徴抽出部16、距離計算部19,21、認識
結果編集部23を制御する制御部である。
識処理について説明する。帳票等に記入された文字列1
1は観測部12により読み取られ、画像メモリ13に格
納される。文字切り出し位置決め部14は画像メモリ1
3に格納されたイメージより一文字分のイメージを切り
出し、その位置を求めて画像メモリ15に格納する。特
徴抽出部16は画像メモリ15に格納された一文字の画
像より文字の形状を表す特徴、例えば、線密度、線方向
特徴等を抽出し、特徴メモリ17に格納する。
いしFが入力されたとき、その特徴ベクトルaないしf
が特徴抽出部16において抽出され、特徴メモリ17に
格納される。距離計算部21は、特徴メモリ17に格納
された全ての2文字間の特徴ベクトルの距離計算を行
い、各文字間の距離を2文字間距離テーブル22に格納
していくことにより、2文字間距離テーブル22を作成
する。
示す文字Aと文字Bについて、特徴ベクトルaとbとの
距離dABを計算し、その結果を2文字間距離テーブル
22に格納する。同様に、入力された全ての文字につい
て距離計算を行い、図4に示すように、各文字間の距離
dAB,dAC,…,を格納した2文字間距離テーブル
22を作成する。
ルと標準パターン辞書の特徴ベクトルとのマッチングを
行い、文字A,B,C,D,E,F等の認識結果を認識
結果メモリ20に格納する。認識結果編集部23は2文
字間距離テーブル22に格納された2文字間の距離によ
り認識結果を編集し、2文字間距離テーブル22に格納
された2文字間の距離が閾値以下でその2文字の認識結
果が異なるとき、それらの文字の認識結果をリジェクト
する。
に示すように、文字A,B,Cが似た字形の場合、2文
字間距離dAB,dACは閾値以下となり、文字Aの認
識結果が図5に示すように「2」、文字Bの認識結果が
「7」、文字Cの認識結果が「7」であると、文字Aの
認識結果は「2」からリジェクトに変更される。同様
に、2文字間距離dBA,dBCが閾値以下となり、文
字A、文字B、文字Cの認識結果が上記のように異なる
と、文字Bの認識結果は「7」からリジェクトに変更さ
れる。また、文字Cについても、同様に認識結果は
「7」からリジェクトに変更される。
間距離が閾値以上となり、認識結果が図5に示すように
「3」,「4」,「5」とそれぞれ異なっても、認識結
果はリジェクトされない。なお、閾値はあらかじめ一意
に決められた数値であり、この値を小さく設定すれば、
リジェクトは少なくなり、大きく設定すれば、リジェク
トは多くなる。この値は実際の運用時に最適の状態に試
行錯誤に設定することも可能である。
処理を示すフローチャートである。同図において、ステ
ップS1で、i=2,j=1に設定して、ステップS2
において、2文字間距離テーブル22からi番目とj番
目の文字間の距離を読み出し、ステップS3において、
i番目とj番目の文字間の距離が閾値以内か否かを判定
する。
の場合には、ステップS4に行き、認識結果メモリ20
よりi番目とj番目の文字の認識結果を読み出し、ステ
ップS5において、i番目とj番目の文字の認識結果が
同じか否かを判定する。また、i番目とj番目の文字間
の距離が閾値以内でない場合には、ステップS7に行
く。
文字の認識結果が同じないと判定された場合には、ステ
ップS6に行き、i番目とj番目の文字の認識結果をリ
ジェクトし、ステップS7に行く。また、ステップS5
において、i番目とj番目の文字の認識結果が同じであ
ると判定された場合には、ステップS7に行く。ステッ
プS7において、j=j+1とし、ステップS8におい
て、j<iか否かを判定する。ステップS8において、
j<iと判定された場合には、ステップS2に戻り上記
処理を繰り返す。
9に行き、i=i+1,j=1に設定して、ステップS
10において、i>文字数であるか否かを判定し、i>
文字数でない場合には、ステップS2に戻り上記処理を
繰り返す。また、i>文字数の場合には終了する。すな
わち、図4に示す2文字間距離テーブル22は対角線に
対して対象なので(例えば、距離dABと距離dBAは
等しい)、j<iの範囲内でjの値を順次増加して2文
字間距離テーブル22より各i,j番目の文字の2文字
間距離を読み出し、ついで、iを1増加して各i,j番
目の文字の2文字間距離を読み出し、この処理をi>文
字数になるまで順次繰り返すことにより、2文字間距離
テーブル22より全ての2文字間距離を読み出すことが
でき、それらの2文字間距離と閾値を比較することによ
り、認識結果を編集することができる。
離テーブル22を各文字を認識する前に作成している
が、2文字間距離テーブル22を、各文字の認識結果を
得たあとで作成してもよい。この場合には、認識結果が
異なる2文字について、2文字間距離を求め、その2文
字間距離が閾値以下の場合に、その文字をリジェクトす
る。
文字について、2文字間距離を求めればよいので、2文
字間距離を算出する処理量を前記した実施例のものと比
べ減少させることができる。また、図5に示したよう
に、文字A,B,Cの2文字間距離が小さく、文字A,
B,Cの認識結果が異なるとき、前記した実施例のよう
に全ての文字をリジェクトするのではなく、上記3文字
の認識結果の多数決をとることにより、認識結果を編集
してもよい。例えば、認識結果が図5に示すように、
「2」,「7」,「7」のとき、多数決により、上記3
文字の認識結果を「7」とする。
本発明においては、記入者により書かれた標準パターン
の文字字形からはずれた文字字形を、その認識結果の不
安定さを利用してリジェクトしているので、認識精度を
向上させることができ、文字の誤読率の減少に寄与する
ところが大きい。
ートである。
Claims (3)
- 【請求項1】 一文字として切り出された文字画像から
特徴抽出を行い、抽出された特徴とあらかじめ標準パタ
ーンとして作られた標準パターン辞書とのマッチングを
行い認識結果を求める文字認識方式において、 1枚の入力シート上に記入された複数の文字の一文字毎
に特徴を抽出し、抽出された特徴を用いて任意の2文字
間の距離を求め、全ての文字間の距離を記憶しておき、 それぞれの文字の特徴と標準パターン辞書との距離計算
することにより、最小距離となるカテゴリを認識結果と
して求め、 上記2文字間の距離テーブルに記憶された2文字間の距
離があらかじめ決められた閾値以内となる文字につい
て、その2文字の認識結果が一致したとき、その認識結
果を出力し、一致しないとき、その文字の認識結果をリ
ジェクトすることを特徴とする文字認識方式。 - 【請求項2】 一文字として切り出された文字画像から
特徴抽出を行い、抽出された特徴とあらかじめ標準パタ
ーンとして作られた標準パターン辞書とのマッチングを
行い認識結果を求める文字認識方式において、 1枚の入力シート上に記入された複数の文字の一文字毎
に特徴を抽出し、抽出されたそれぞれの文字の特徴と標
準パターン辞書との距離計算することにより、最小距離
となるカテゴリを認識結果として求めて記憶しておき、 全ての文字の認識結果が得られたのち、抽出された特徴
を用いて任意の2文字間の距離を求め、 注目する文字の認識結果と、その文字からあらかじめ決
められた閾値以内の距離にある文字の認識結果が一致し
たとき、その認識結果を出力し、一致しないとき、その
文字の認識結果をリジェクトすることを特徴とする文字
認識方式。 - 【請求項3】 一文字として切り出された文字画像から
特徴抽出を行い、抽出された特徴とあらかじめ標準パタ
ーンとして作られた標準パターン辞書とのマッチングを
行い認識結果を求める文字認識方式において、1枚の入
力シート上に記入された複数の文字の一文字毎に特徴を
抽出し、抽出された特徴を用いて任意の2文字間の距離
を求め、全ての文字間の距離を記憶しておき、 それぞれの文字の特徴と標準パターン辞書との距離計算
することにより、最小距離となるカテゴリを認識結果と
して求め、 上記2文字間の距離テーブルに記憶された2文字間の距
離があらかじめ決められた閾値以内となる文字につい
て、認識結果の多数決を求め、その認識結果を文字認識
結果とすることを特徴とする文字認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP04338754A JP3133846B2 (ja) | 1992-12-18 | 1992-12-18 | 文字認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP04338754A JP3133846B2 (ja) | 1992-12-18 | 1992-12-18 | 文字認識方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH06187499A JPH06187499A (ja) | 1994-07-08 |
| JP3133846B2 true JP3133846B2 (ja) | 2001-02-13 |
Family
ID=18321146
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP04338754A Expired - Lifetime JP3133846B2 (ja) | 1992-12-18 | 1992-12-18 | 文字認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3133846B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115546774A (zh) * | 2022-10-21 | 2022-12-30 | 南京极目机器人科技有限公司 | 一种母本雄穗检测方法及母本雄穗检测系统 |
-
1992
- 1992-12-18 JP JP04338754A patent/JP3133846B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
| Title |
|---|
| 「電子情報通信学会論文誌 D−2」Vol.J74−D−2 No.3 p.357−365(1991)"認識結果を用いた手書き数字字形の数量化とその応用" |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH06187499A (ja) | 1994-07-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69907513T2 (de) | Handgeschriebene oder gesprochene wort-erkennung mit neuronalen netzwerken | |
| DE69428527T2 (de) | Kritzlervergleich | |
| US7336827B2 (en) | System, process and software arrangement for recognizing handwritten characters | |
| JP3480404B2 (ja) | 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 | |
| CA2375355A1 (en) | Character recognition system and method | |
| US20100135576A1 (en) | Identifying method of hand-written Latin letter | |
| US8340428B2 (en) | Unsupervised writer style adaptation for handwritten word spotting | |
| JP3133846B2 (ja) | 文字認識方式 | |
| Kumar et al. | A novel framework for grading of writers using offline Gurmukhi characters | |
| Powers | Pen direction sequences in character recognition | |
| KR100248601B1 (ko) | 온라인 문자 인식 방법 및 장치 | |
| JP3419251B2 (ja) | 文字認識装置及び文字認識方法 | |
| JP3130392B2 (ja) | 文字認識装置 | |
| JP3198218B2 (ja) | オンライン手書き文字認識方法 | |
| CN119339393B (zh) | 基于n-gram模型的中文文档的OCR后处理方法、装置及可读介质 | |
| JP3115369B2 (ja) | 局所的字形変動を考慮したオンライン走り書き文字認識装置 | |
| JP3249654B2 (ja) | 活字文字認識用辞書の作成方法 | |
| JP3083609B2 (ja) | 情報処理装置及びそれを用いた文字認識装置 | |
| JP2671533B2 (ja) | 文字列認識方法及びその装置 | |
| JPH06243295A (ja) | 文字の特徴データ発生方法および発生装置 | |
| Puspasari et al. | Eigen Space Based Character Recognition Application for Learning Chinese Handwriting in Palembang | |
| JP2891211B2 (ja) | 光学式文字読取装置および方法 | |
| Halder et al. | Application of fuzzy logic in writer identification based on numerals | |
| JP2851865B2 (ja) | 文字認識装置 | |
| Shridhar et al. | Recognition strategies for general handwritten text documents |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20001114 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081124 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081124 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091124 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101124 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101124 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111124 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111124 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121124 Year of fee payment: 12 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121124 Year of fee payment: 12 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131124 Year of fee payment: 13 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131124 Year of fee payment: 13 |