JP2906743B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2906743B2
JP2906743B2 JP3159316A JP15931691A JP2906743B2 JP 2906743 B2 JP2906743 B2 JP 2906743B2 JP 3159316 A JP3159316 A JP 3159316A JP 15931691 A JP15931691 A JP 15931691A JP 2906743 B2 JP2906743 B2 JP 2906743B2
Authority
JP
Japan
Prior art keywords
character
character code
classification
candidate
dimensional vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3159316A
Other languages
English (en)
Other versions
JPH0512493A (ja
Inventor
大輔 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP3159316A priority Critical patent/JP2906743B2/ja
Publication of JPH0512493A publication Critical patent/JPH0512493A/ja
Application granted granted Critical
Publication of JP2906743B2 publication Critical patent/JP2906743B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、2種類及び3種類以上
の文字分類手段の併用した文字認識装置に関する。
【0002】
【従来の技術】従来のパターン整合法による文字認識装
置では、未知文字と認識辞書部に記憶されている標準文
字との類似度を計算し、最大類似度が予めその標準文字
に対して設定した閾値以上であり、かつ最大類似度と次
大類似度との差が予め設定したもうひとつの閾値以上の
場合に、未知文字は最大類似度を示す標準文字と同一の
字種という認識結果を出力する。各字種毎に、これらの
2個の閾値を適当に設定することより、誤読する未知文
字の数を抑えるとともに認識不能となる未知文字の数も
減らすことができる。(特公昭58−178484号公
報)。
【0003】また、複数の文字分類手段を併用した文字
認識装置であって前述のような閾値を使う装置が知られ
ている(特願平3−526号)。この装置における判定
アルゴリズムの概要を図7に示す。これによれば、複数
種の分類手段が出力する分類結果の第一候補が異なった
場合に、それぞれの分類手段が出力する分類結果の第一
候補に対して評価値を計算し、これによりどちらの分類
手段が出力する分類結果の第一候補を最終認識結果とす
るかを判定する。また、この時それぞれの分類手段が出
力する分類結果の第一候補に対する評価値に対し閾値を
設定し、これを越える分類結果の第一候補に対しては棄
却を行っている。
【0004】
【発明が解決しようとする課題】しかしながら、前述の
複数の文字の分類手段を併用することにより、認識率の
低下を防ぐ装置は、それぞれの分類手段が出力する分類
結果の第一候補が同一であった場合には、棄却の判定を
行なわずその候補を直ちに最終認識結果としてしまう。
この場合には、誤読を起こしやすい。そこで、それぞれ
の分類手段が出力する分類結果の第一候補が同一だった
場合でもそれを最終認識結果とするか、もしくは、棄却
するかを判定し認識精度を向上させることが必要とな
る。
【0005】本発明の目的は、誤読又は棄却する未知文
字の数を減少させることができる文字認識装置を提供す
ることにある。
【0006】
【課題を解決するための手段】第1の発明の文字認識装
置は、2種類の文字分類手段を有し、それぞれの分類手
段により選択された第一候補の文字コードから最終認識
結果を出力する文字認識装置において、 (1)第一の分類手段により選択された第一候補の文字
コードCiとその距離値d1(i)と、第二の分類手段
における、前記文字コードCiに対する距離値d2
(i)とから、2次元ベクトルCi(d1(i),d2
(i))を生成する手段と、 (2)第二の分類手段により選択された第一候補の文字
コードCjとその距離値d2(j)と、第一の分類手段
における、前記文字コードCjに対する距離値d1
(j)とから、2次元ベクトルCj(d1(j),d2
(j))を生成する手段と、 (3)前記2次元ベクトルCi(d1(i),d2
(i))とCj(d1(j),d2(j))とから、前
記文字コードCiに対する評価値Eiと前記文字コード
Cjに対する評価値Ejとを計算する手段において、分
類対象となる字種Kに属する学習用の文字パターンDk
に対する距離値であるd1(k)とd2(k)とを座標
軸とした平面上における、2次元ベクトルCk(d1
(k),d2(k))の分布の主軸をVk(p1
(k),p2(k)))を、主成分分析法を用い各ベク
トルの要素d1(k)、d2(k)を変量として得られ
る2次元の分散共分散行列の最大固有値から求め、前記
Vk(p1(k),p2(k))と前記2次元ベクトル
Ck(d1(k),d2(k))とから前記文字コード
Ckに対する評価値Ekを決定することにより前記評価
値EiとEjとを計算する手段と (4)前記文字コードCiと前記文字コードCjとが同
一の場合に前記評価値Eiを用いて前記文字コードCi
を最終認識結果として出力するか、若しくは棄却するか
を判定し、又は前記文字コードCiと前記文字コードC
jとが異なる場合には、前記評価値Ejとを用いてどち
らの文字コードを最終認識結果として出力するか若しく
はどちらも棄却するかを対判定する手段とから構成され
ることを特徴とする。
【0007】第2の発明の文字認識装置は、2種類の文
字分類手段を有し、それぞれの分類手段により選択され
た第一候補の文字コードから最終認識結果を出力する文
字認識装置において、 (1)第一の分類手段により選択された第一候補の文字
コードCiとその距離値d1(i)と、第二の分類手段
における、前記文字コードCiに対する距離値d2
(i)とから2次元ベクトルCi(d1(i),d2
(i))を生成する手段と、 (2)第二の分類手段により選択された第一候補の文字
コードCjとその距離値d2(j)と、第一の分類手段
における、前記文字コードCjに対する距離値d1
(j)とから2次元ベクトルCj(d1(j),d2
(j))を生成する手段と、 (3)前記2次元ベクトルCi(d1(i),d2
(i))とCj(d1(j),d2(j)とから、前記
文字コードCiに対する評価値Eiと前記文字コードC
jに対する評価値Ejとを計算する手段において、分類
対象となる字種kに属する学習用の文字パターンCkに
対する距離値であるd1(k)とd2(k)とを座標軸
とした平面上における、2次元ベクトルCk(d1
(k),d2(k))の分布の主軸をVk(p1
(k),p2(k)))を、主成分分析法を用い各ベク
トルの要素d1(k)、d2(k)を変量として得られ
る2次元の相関行列の最大固有値から求め、前記Vk
(p1(k),p2(k))と前記2次元ベクトルCk
(d1(k),d2(k))とから文字コードCkに対
する評価値Ekを決定することにより前記評価値Eiと
Ejとを計算する手段と (4)前記文字コードCiと前記文字コードCjとが同
一の場合に前記評価値Eiを用いて前記文字コードCi
を最終認識結果として出力するか、若しくは棄却するか
を判定し、又は前記文字コードCiと前記文字コードC
jとが異なる場合には、前記評価値Eiと前記評価値E
jとを用いてどちらの文字コードを最終認識結果として
出力するか若しくはどちらも棄却するかを対判定する手
段とから構成されることを特徴とする。
【0008】第3の発明の文字認識装置は、3種類以上
全n種類の文字分類手段を有し、それぞれの分類手段に
より選択された第一候補の文字コードから最終認識結果
を出力する文字認識装置において、 (1)nを越えないmに対する第m番目の分類手段によ
り選択された第一候補の文字コードChとその距離値d
m(h)と、第m番目以外のn−1個の分類手段におけ
る、前記文字コードChに対する距離値とからそれらを
分類手段の順に並べたn次元ベクトルCh(d1
(h),d2(h),...,dm(h),...,d
n(h))を生成することを全分類手段の第一候補に対
して行なう手段と、 (2)前記n次元ベクトルCh(d1(h),d2
(h),...,dm(h),...,dn(h))か
ら、全n個の分類手段の各々により選択された第一候補
の文字コードに対して評価値を計算する手段において、
分類対象となる字種kに属する学習用の文字パターンC
hから得たn次元ベクトルCk(d1(k),d2
(k),...,dm(k),...,dn(k))の
各要素を座標軸とした空間内におけるn次元ベクトルC
k(d1(k),d2(k),...,dm
(k),...,dn(k))の分布の主軸Vk(p1
(k),p2(k),...,pm(k),...,p
n(k))を、主成分分析法を用い各ベクトルの要素d
m(k)を変量として得られるn次元の分散共分散行列
の最大固有値から求め、前記Vk(p1(k),p2
(k),...,pm(k),...,pn(k))と
前記n次元ベクトルCk(d1(k),d2
(k),...,dm(k),...,dn(k))と
から前記文字コードCkに対する評価値Ekを決定する
ことにより前記評価値を計算する手段と、 (3)第n番目までの全分類手段により選択された第一
候補の文字コードが同一の場合には、第一候補の文字コ
ードに対する評価値を用いて候補の文字コードを最終認
識結果として選択するか、若しくは棄却するかを判定
し、又は第n番目までの分類手段に対する分類結果の第
一候補の文字コードが異なる場合において、全n個の第
一候補の文字コードに対するそれぞれの評価値からどの
候補を最終認識結果として出力するか、若しくはどちら
も棄却するかを判定する手段とから構成されることを特
徴とする。
【0009】第4の発明の文字認識装置は、3種類以上
全n種類の文字分類手段を有し、それぞれの分類手段に
より選択された第一候補の文字コードから最終認識結果
を出力する文字認識装置において、 (1)nを越えないmに対する第m番目の分類手段によ
り選択された第一候補の文字コードChとその距離値d
m(h)と、第m番目以外のn−1個の分類手段におけ
る、前記文字コードChに対する距離値とから、それら
を分類手段の順に並べたn次元ベクトルCh(d1
(h),d2(h),...,dm(h),...,d
n(h))を生成することを全分類手段の第一候補に対
して行なう手段と、 (2)前記n次元ベクトルCh(d1(h),d2
(h),...,dm(h),...,dn(h))か
ら、全n個の分類手段の各々により選択された第一候補
の文字コードに対して評価値を計算する手段において、
分類対象となる字種kに属する学習用の文字パターンC
kから得たn次元ベクトルCk(d1(k),d2
(k),...,dm(k),...,dn(k))の
各要素を座標軸とした空間内におけるn次元ベクトルC
k(d1(k),d2(k),...,dm
(k),...,dn(k))の分布の主軸Vk(p1
(k),p2(k),...,pm(k),...,p
n(k))を、主成分分析法を用い各ベクトルの要素d
m(k)を変量として得られるn次元の相関行列の最大
固有値から求め、前記Vk(p1(k),p2
(k),...,pm(k),...,pn(k))と
前記n次元ベクトルCk(d1(k),d2
(k),...,dm(k),...,dn(k))と
から前記文字コードCkに対する評価値Ekを決定する
ことにより前記評価値を計算する手段と、 (3)第n番目までの全分類手段により選択された第一
候補の文字コードが同一の場合には、第一候補の文字コ
ードに対する評価値を用いて候補の文字コードを最終認
識結果として選択するか、若しくは棄却するかを判定
し、又は第n番目までの分類手段に対する分類結果の第
一候補の文字コードが異なる場合において、全n個の第
一候補の文字コードに対するそれぞれの評価値からどの
候補を最終認識結果として出力するか、もしくはどちら
も棄却するかを判定する手段とから構成されることを特
徴とする。
【0010】
【作用】本発明の作用を図3の2種類の分類手段を併用
した場合を例として説明する。
【0011】第一の分類手段が出力する分類結果の第一
候補の文字コードCiに対する評価値Eiと第二の分類
手段が出力する分類結果の第一候の文字コードCiに対
する評価値Ejを計算する手段において、分類対象とな
る字種k毎に、第一の分類手段、第二の分類手段の距離
値をそれぞれ軸とする平面に、字種kに属する学習用の
文字パターンCkに対して得られた第一の分類手段、第
二の分類手段の距離値d1(k)、d2(k)をプロッ
トすると、図中の閉じた曲線Sの内部のように分布す
る。この分布の傾きを代表する主軸Vk(p1(k),
p2(k))は、同図に示されるようになり、主成分分
析法により求まる。
【0012】この主軸Vkに対し、図中Lで示すような
主軸Vkに直交し、かつ前述の分布Sに接する直線を設
定する。候補の文字コードCkの2次元ベクトルCk
(d1(k),d2(k))がこれより原点側にある場
合に、Ckは字種kに属するとすることにより、 図中
四角印で示すような一方の距離値が小さいものも字種k
に属すると判定する。また、図中三角印で示す候補の文
字コードC’kに対する2次元ベクトルC’k(d1’
(k),d2’(k))は斜線の領域外であるから、字
種kに属するとは判断せずに、これを棄却する。またE
kmaxは、この例においては前述の直線Lと先に求め
た主軸Vkの交点に対する主軸Vk上の値であり、これ
を候補の文字コードCkが字種kに属すると考えてよい
か否かの判定閾値とする。
【0013】第一の分類手段、第二の分類手段をそれぞ
れ単独で閾値を設定した場合を考え、その時の第一の分
類手段、第二の分類手段に対する閾値をそれぞれt1、
t2とする。t1、t2は学習用のパタンに対する距離
値の最大値とすると、これらをどちらも越えない領域は
図において、縦軸、横軸と一点鎖線、二点鎖線で囲まれ
る長方形の領域となり、必要以上の棄却領域を設定する
ことになり認識率が低下する。この比較から明らかなよ
うに、本手法によれば、棄却されない領域が広くとれ、
一方の分類手法の第一候補の文字コードが非常に近い距
離値を出力しているものに対しては閾値以下であれば、
その字種と判定することが可能となる。
【0014】第一の分類手段の第一候補の文字コードC
iと第二の分類手段の第一候補の文字コードCjに対し
て、どちらを出力するか、もしくは棄却するかを判定す
る手段においては、それぞれの分類手段の第一候補の文
字コードCi、Cjに対して計算された評価値Ei、E
jに対し、どちらとも閾値Eimax、Ejmaxを越
えていれば、第一の分類手段と第二の分類手段の出力す
る第一の候補の文字コードCi、Cjを棄却する。それ
以外の場合においては、この評価値は小さい方が原点に
近いことから、評価値の小さい方が、その字種に対する
判定閾値を越えていない時、その評価値に対する第一候
補の文字コードを最終認識結果とし、そうでない場合は
第一の分類手段と第二の分類手段の出力する第一の候補
の文字コードCi、Cjを棄却とする。第一の分類手段
の第一候補の文字コードCiと第二の分類手段の第一候
補の文字コードCjが同一である場合においては、該当
の文字コードに対して評価値を計算し、それがその字種
に対する判定閾値を越えていない場合、その文字コード
を最終認識結果とし、逆に判定閾値を越えている場合そ
の文字コードを棄却する。これにより、併用する分類手
法が全て同じ候補を出力している場合においても棄却判
定ができ、誤読の低減が可能となる。
【0015】3種の分類手段を併用する際も同一の作用
を持つ。
【0016】
【実施例】以下図面により本発明の実施例について説明
する。図1は本発明の一実施例を示すブロック図であ
る。
【0017】文字パターン入力手段1は帳票上の文字イ
メージを取り込む手段であり、通常のイメージスキャナ
ーでよい。取り込まれた文字イメージは、第一の分類手
段14と第二の分類手段15とで分類される。対判定手
段16は、第一の分類手段14と第二の分類手段15と
が各々出力する第一候補の文字コードのどちらを最終認
識結果をとして採用するか、もしくはどちらも棄却する
かを判定し、判定結果を最終認識結果出力手段13に送
る。これら文字パターン入力手段1、第一の分類手段1
4、第二の分類手段15、対判定手段16、最終認識結
果出力手段13の制御は制御手段17が行う。
【0018】分類手段14、15に係わる内部の要素と
しては、例えば図4、図5に示すような構成が考えられ
る。図4のように、第一の分類手段は、第一の文字認識
手段2、第一の文字認識手段2が参照する第一の分類辞
書メモリ3及び第一の文字認識手段2が出力する分類結
果を記憶する第一の分類結果格納メモリ4から構成され
る。又、図5に示すように、第二の分類手段は、第二の
文字認識手段5、第二の文字認識手段5が参照する第二
の分類辞書メモリ6及び第二の文字認識手段5が出力す
る分類結果を記憶する第二の分類結果格納メモリ7から
構成される。第一の分類辞書メモリ3と第二の分類辞書
メモリ6はそれぞれ第一の文字認識手段2と第二の文字
認識手段5が参照する特徴量を記憶する。なお、この特
徴量は、予め学習用のパターンから作成しておく。第一
の分類手段14と第二の分類手段15は、それぞれの分
類辞書メモリに記憶されている分類対象字種kに対する
標準と未知文字パターンとの距離計算を行ない、距離の
小さい順に、距離を該当する文字コードとともに、分類
結果格納メモリ4と分類結果格納メモリ7に記憶する。
【0019】対判定手段16に係わる内部の要素として
は、例えば図6に示すような構成が考えられる。
【0020】分類結果統合手段8は、第一の分類手段1
4と第二の分類手段15の処理が終了すると、制御手段
17により起動される。
【0021】起動された分類結果統合手段8は、ルート
r1経由で、分類結果格納メモリ4から第一の分類手段
14における第一候補の文字コードCiと距離値d1
(i)を抽出する。さらに第二の分類結果格納メモリ7
から文字コードCiに対応する距離値d2(i)を抽出
する。そして、Ci、d1(i)、d2(i)を2次元
のベクトル形式に変換し、統合結果格納レジスタ10に
格納する。
【0022】同様に、分類結果統合手段8は、ルート2
経由で、分類結果格納メモリ7から文字コードCjと距
離値d2(j)を抽出する。さらに第一の分類結果格納
メモリ4から文字コードCjに対応する距離値d1
(j)を抽出する。そしてCj、d2(j)、d1
(j)を2次元のベクトル形式に変換し、統合結果格納
レジスタ10に格納する。
【0023】評価値計算手段9は、分類結果統合手段8
の処理が終了した後、制御手段17により起動され、統
合結果格納レジスタ10と評価値計算用辞書メモリ11
を参照し、第一の分類手段14、第二の分類手段15が
出力した候補の文字コードに対する評価値Ei、Ejを
例えば次式(1)、(2)により計算する。
【0024】 Ei=d1(i)p1(i)+d2(i)p2(i) Ej=d1(j)p1(j)+d2(j)p2(j) 第一の分類手段14と第二の分類手段15の分類結果の
第一候補が同一である場合は式(1)、式(2)いずれ
かを用いて評価値を計算する。
【0025】評価値計算用辞書メモリ11には、前述の
分散共分散行列から求められた主軸Vk(p1(k),
p2(K))と判定用の閾値Ekmaxを字種k毎に記
憶する。ここで各字種kに対する主軸Vkの計算は、先
のd1(k)、d2(k)を変量とした場合の2次元の
分散共分散行列を使うが、第一の分類手段14、第二の
分類手段15が出力する距離値のスケールが大きく異な
る場合には、相関行列を代わりに用いてもよい。これに
よって、評価値の計算時に距離値の分散の大きな方の分
散手段の評価値に重みがかかる作用をなくすことがで
き、第一の分類手段14、第二の分類手段15の出力す
る距離値を閾値判定手段12において対等に評価でき
る。
【0026】閾値判定手段12は評価値計算手段9の処
理が終了すると、制御手段17によって起動され、評価
値計算手段9によって計算された第一の分類手段14、
第二の分類手段15が出力した式(1)、式(2)より
得られる、それぞれの候補の文字コードに対する評価値
のEi、Ejの比較を評価値計算用辞書メモリ11に記
憶されている閾値との比較により行い、どちらの分類結
果を採用するか、もしくはどちらの分類結果も棄却する
かを判定する。そのアルゴリズムの一例を図2を用いて
説明する。第一の分類手段14、第二の分類手段15の
出力する候補の文字コードが同一である場合は、判断d
1で式(1)または式(2)ひとつを用いて評価値を計
算する。同一でない場合は、式(1)、式(2)両方を
用いて各第一候補に対して評価値を計算する。これらの
計算は評価値計算手段9が行う。閾値判定手段12は、
第一の分類手段14と第二の分類手段15とが出力する
第一候補の文字コードが同一でない場合には、判断d2
以下の処理を行う。評価値計算手段9で得た、第一の分
類手段14、第二の分類手段15の出力した第一候補の
文字コードに対する評価値が、どちらも評価値計算用辞
書メモリ11の閾値を越えている場合には、どちらの候
補の文字コードも棄却する。そうでない場合には、閾値
を越えていない方の候補の文字コードを選択し、判断d
3によりその評価値がもう一方の評価値以下であれば、
該当する候補の文字コードを最終認識結果として採用し
その文字コードを最終認識結果出力手段13に送り、そ
うでなければ該当する候補の文字コードを棄却し、棄却
に対応する予め設定してある棄却コードを最終認識結果
出力手段13に送る。また、第一の分類手段14、第二
の分類手段15の出力する候補の文字コードが同一であ
る場合には、判断d4以下の処理を行う。評価値計算手
段9で得た評価値が、評価値計算用辞書メモリ11の閾
値を越えている場合には、その候補の文字コードを棄却
し、棄却に対応する予め設定してある棄却コードを最終
認識結果出力手段13に送る。閾値を越えていない場合
には、該当する候補の文字コードを最終認識結果として
採用しその文字コードを最終認識結果出力手段13に送
る。
【0027】最終認識結果出力手段13は、制御手段1
7の命令に応じて、対判定手段16の出力する最終認識
結果を文字コードとして出力すればよい。
【0028】以上、本発明に係わる2種類の分類手段を
併用した場合の実施例を説明してきたが、第一の分類手
段14、第二の分類手段15で計算する距離の尺度は文
字認識において通常使用されるものに限らず、いずれの
距離尺度、または類似性の尺度でも対応が可能であり、
またそれらの混用も可能である。また、3種類以上の分
類手段を併用した場合においても容易に本実施例に示す
装置が構成可能である。 これらの各機能はハードウェ
アまたはソフトウェアいずれの手段によって実現しても
よい。
【0029】
【発明の効果】以上説明したように、本発明によれば、
2種または3種類以上の文字の分類手段を併用すること
で誤読される文字数を減らすと同時に、各分類手段が出
力する候補の文字コードに対して計算された評価値の大
小比較と、1回の閾値判定処理で棄却判定を行なうこと
により、2種類の文字分類手段に対して、個別に棄却判
定用の閾値を設定する場合に比べ、棄却される文字数を
減らすことができるので、認識精度の向上が可能とな
る。この時、従来の技術で述べた「文字認識方式および
装置」(特願平3−526)に比べ、誤読数の一層の低
減が可能である。
【図面の簡単な説明】
【図1】本発明に係わる文字認識装置の一実施例を説明
するためのブロック図である。
【図2】図1の処理例を示すフローチャート図である。
【図3】本手法の作用を説明するための図である。
【図4】第一文字分類手段14の一構成例である
【図5】第二文字分類手段15の一構成例である。
【図6】対判定手段16の一構成例である。
【図7】従来方式のフローチャート図である。
【符号の説明】
1 文字パターン入力手段 2、5 文字認識手段 3、6 分類辞書メモリ 4、7 分類結果格納メモリ 8 分類結果統合手段 9 評価値計算手段 10 統合結果格納レジスタ 11 評価値計算用辞書メモリ 12 閾値判定手段 13 最終認識結果出力手段 14、15 文字分類手段 16 対判定手段 17 制御手段
フロントページの続き (56)参考文献 特開 昭63−263588(JP,A) 特開 昭63−79191(JP,A) 特開 昭57−25082(JP,A) 特開 昭62−74188(JP,A) 電子情報通信学会全国大会講演論文 集、VOL.1991,NO.Spring Pt 7 PAGE.7−244 電子情報通信学会研究技術報告、VO L.89,NO.436(PRU89 118− 125)PAGE.15−22 (58)調査した分野(Int.Cl.6,DB名) G06K 9/62 G06K 9/03 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 2種類の文字分類手段を有し、それぞれ
    の分類手段により選択された第一候補の文字コードから
    最終認識結果を出力する文字認識装置であって、 (1)第一の分類手段により選択された第一候補の文字
    コードCiとその距離値d1(i)と、第二の分類手段
    における、前記文字コードCiに対する距離値d2
    (i)とから、2次元ベクトルCi(d1(i),d2
    (i))を生成する手段と、 (2)第二の分類手段により選択された第一候補の文字
    コードCjとその距離値d2(j)と、第一の分類手段
    における、前記文字コードCjに対する距離値d1
    (j)とから、2次元ベクトルCj(d1(j),d2
    (j))を生成する手段と、 (3)前記二つの2次元ベクトルCi(d1(i),d
    2(i))およびCj(d1(j),d2(j)から、
    前記文字コードCiに対する評価値Eiおよび前記文字
    コードCjに対する評価値Ejを計算するに際して、分
    類対象となる字種Kに属する学習用の文字パターンCk
    に対する距離値であるd1(k)およびd2(k)を座
    標軸とした平面上における、2次元ベクトルCk(d1
    (k),d2(k))の分布の主軸をVk(p1
    (k),p2(k)))を、主成分分析法を用い各ベク
    トルの要素d1(k)、d2(k)を変量として得られ
    る2次元の分散共分散行列の最大固有から求め、前記V
    k(p1(k),p2(k))および前記2次元ベクト
    ルCk(d1(k),d2(k))から前記文字コード
    Ckに対する評価値Ekを決定することにより前記評価
    値EiおよびEjを計算する手段とを備え、さらに、 (4)前記文字コードCiと前記文字コードCjとが異
    なる場合には、前記評価値Ejとを用いてどちらの文字
    コードを最終認識結果として出力するか若しくはどちら
    も棄却するかを対判定する手段と、 前記文字コードCiと前記文字コードCjとが同一であ
    る場合にも前記評価値Eiを用いて前記文字コードCi
    を最終的認識結果として出力するか、若しくは棄却する
    かを判定する手段とを備えたことを特徴とする文字認識
    装置。
  2. 【請求項2】 2種類の文字分類手段を有し、それぞれ
    の分類手段により選択された第一候補の文字コードから
    最終認識結果を出力する文字認識装置であって、 (1)第一の分類手段により選択された第一候補の文字
    コードCiとその距離値d1(i)と、第二の分類手段
    における、前記文字コードCiに対する距離値d2
    (i)とから2次元ベクトルCi(d1(i),d2
    (i))を生成する手段と、 (2)第二の分類手段により選択された第一候補の文字
    コードCjとその距離値d2(j)と、第一の分類手段
    における、前記文字コードCjに対する距離値d1
    (j)とから、2次元ベクトルCj(d1(j),d2
    (j))を生成する手段と、 (3)前記2次元ベクトルCi(d1(i),d2
    (i))およびCj(d1(j),d2(j)から、前
    記文字コードCiに対する評価値Eiおよび前記文字コ
    ードCjに対する評価値Ejを計算するに際して、分類
    対象となる字種Kに属する学習用の文字パターンCkに
    対する距離値であるd1(k)およびd2(k)を座標
    軸とした平面上における、2次元ベクトルCk(d1
    (k),d2(k))の分布の主軸Vk(p1(k),
    p2(k)))を主成分分析法を用い各ベクトルの要素
    d1(k)、d2(k)を変量として得られる2次元の
    相関行列の最大固有から求め、前記Vk(p1(k),
    p2(k))および前記2次元ベクトルCk(d1
    (k),d2(k))から文字コードCkに対する評価
    値Ekを決定することにより前記評価値EiおよびEj
    を計算する手段とを備え、さらに、 (4)前記文字コードCiと前記文字コードCjとが異
    なる場合には、前記評価値Ejとを用いてどちらの文字
    コードを最終認識結果として出力するか若しくはどちら
    も棄却するかを対判定する手段と、 前記文字コードCiと前記文字コードCjとが同一であ
    る場合にも前記評価値Eiを用いて前記文字コードCi
    を最終的認識結果として出力するか、若しくは棄却する
    かを判定する手段とを備えたことを特徴とする文字認識
    装置。
  3. 【請求項3】 3種類以上全n種類の文字分類手段を有
    し、それぞれの分類手段により選択された第一候補の文
    字コードから最終認識結果を出力する文字認識装置であ
    って、 (1)nを越えないmに対する第m番目の分類手段によ
    り選択された第一候補の文字コードChおよびその距離
    値dm(h)と、第m番目以外のn−1個の分類手段に
    おける、前記文字コードChに対する距離値とから、そ
    れらを分類手段の順に並べたn次元ベクトルCh(d1
    (h),d2(h),...,dm(h),...,d
    n(h))を生成することを全分類手段の第一候補に対
    して行なう手段と、 (2)前記n次元ベクトルCh(d1(h),d2
    (h),...,dm(h),...,dn(h))か
    ら、全n個の分類手段の各々により選択された第一候補
    の文字コードに対して評価値を計算する手段において、
    分類対象となる字種kに属する学習用の文字パターンC
    hから得たn次元ベクトルCk(d1(k),d2
    (k),...,dm(k),...,dn(k))の
    各要素を座標軸とした空間内におけるn次元ベクトルC
    k(d1(k),d2(k),...,dm
    (k),...,dn(k))の分布の主軸Vk(p1
    (k),p2(k),...,pm(k),...,p
    n(k))を主成分分析法を用い各ベクトルの要素dm
    (k)を変量として得られるn次元の分散共分散行列の
    最大固有値から求め、前記Vk(p1(k),p2
    (k),...,pm(k),...,pn(k))お
    よび前記n次元ベクトルCk(d1(k),d2
    (k),...,dm(k),...,dn(k))か
    ら前記文字コードCkに対する評価値Ekを決定するこ
    とにより前記評価値を計算する手段とを備え、さらに、 (3)第n番目までの分類手段に対する分類結果の第一
    候補の文字コードに異なるものがある場合に、全n個の
    第一候補の文字コードに対するそれぞれの評価値からど
    の候補を最終認識結果として出力するか、若しくはいず
    れも棄却するかを判定する手段と、 第n番目までの全分類手段により選択された第一候補の
    文字コードが同一である場合に、その第一候補の文字コ
    ードに対する評価値を用いて、その第一候補の文字コー
    ドを最終認識結果として選択するか、若しくは棄却する
    かを判定する手段とを備えたことを特徴とする文字認識
    装置。
  4. 【請求項4】 3種類以上全n種類の文字分類手段を有
    し、それぞれの分類手段により選択された第一候補の文
    字コードから最終認識結果を出力する文字認識装置であ
    って、 (1)nを越えないmに対する第m番目の分類手段によ
    り選択された第一候補の文字コードChとその距離値d
    m(h)と、第m番以外のn−1個の分類手段におけ
    る、前記文字コードChに対する距離値とから、それら
    を分類手段の順に並べたn次元ベクトルCh(d1
    (h),d2(h),...,dm(h),...,d
    n(h))を生成することを全分類手段の第一候補に対
    して行なう手段と、 (2)前記n次元ベクトルCh(d1(h),d2
    (h),...,dm(h),...,dn(h))か
    ら、全n個の分類手段の各々により選択された第一候補
    の文字コードに対して評価値を計算する手段において、
    分類対象となる字種kに属する学習用の文字パターンC
    kから得たn次元ベクトルCk(d1(k),d2
    (k),...,dm(k),...,dn(k))の
    各要素を座標軸とした空間内におけるn次元ベクトルC
    k(d1(k),d2(k),...,dm
    (k),...,dn(k))の分布の主軸Vk(p1
    (k),p2(k),...,pm(k),...,p
    n(k))を、主成分分析法を用い各ベクトルの要素d
    m(k)を変量として得られるn次元の相関行列の最大
    固有値から求め、前記Vk(p1(k),p2
    (k),...,pm(k),...,pn(k))お
    よび前記n次元ベクトルCk(d1(k),d2
    (k),...,dm(k),...,dn(k))か
    ら前記文字コードCkに対する評価値Ekを決定するこ
    とにより前記評価値を計算する手段とを備え、さらに、 (3)第n番目までの分類手段に対する分類結果の第一
    候補の文字コードに異なるものがある場合に、全n個の
    第一候補の文字コードに対するそれぞれの評価値からど
    の候補を最終認識結果として出力するか、若しくはいず
    れも棄却するかを判定する手段と、 第n番目までの全分類手段により選択された第一候補の
    文字コードが同一である場合に、その第一候補の文字コ
    ードに対する評価値を用いて、その第一候補の文字コー
    ドを最終認識結果として選択するか、若しくは棄却する
    かを判定する手段とを備えたことを特徴とする文字認識
    装置。
JP3159316A 1991-07-01 1991-07-01 文字認識装置 Expired - Fee Related JP2906743B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3159316A JP2906743B2 (ja) 1991-07-01 1991-07-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3159316A JP2906743B2 (ja) 1991-07-01 1991-07-01 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0512493A JPH0512493A (ja) 1993-01-22
JP2906743B2 true JP2906743B2 (ja) 1999-06-21

Family

ID=15691133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3159316A Expired - Fee Related JP2906743B2 (ja) 1991-07-01 1991-07-01 文字認識装置

Country Status (1)

Country Link
JP (1) JP2906743B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会全国大会講演論文集、VOL.1991,NO.Spring Pt 7 PAGE.7−244
電子情報通信学会研究技術報告、VOL.89,NO.436(PRU89 118−125)PAGE.15−22

Also Published As

Publication number Publication date
JPH0512493A (ja) 1993-01-22

Similar Documents

Publication Publication Date Title
US11544628B2 (en) Information processing apparatus and information processing method for generating classifier using target task learning data and source task learning data, and storage medium
EP2091021A1 (en) Face authentication device
JP4514687B2 (ja) パターン認識装置
JP2977032B2 (ja) 距離及び方向に鑑みたパターン整合装置及びその方法
EP1978456A1 (en) Image-processing apparatus and image-processing method
Justino et al. The interpersonal and intrapersonal variability influences on off-line signature verification using HMM
JP2006146626A (ja) パターン認識方法および装置
JP3083562B2 (ja) 文字認識機構
US11507780B2 (en) Image analysis device, image analysis method, and image analysis program
EP0446632A2 (en) Method and system for recognizing characters
Toh Fingerprint and speaker verification decisions fusion
JP4749884B2 (ja) 顔判別装置の学習方法、顔判別方法および装置並びにプログラム
US7386172B2 (en) Image recognition method
JP2906743B2 (ja) 文字認識装置
JP3537949B2 (ja) パターン認識装置及び同装置における辞書修正方法
JP2797721B2 (ja) 文字認識装置
CN113569934B (zh) Logo分类模型构建方法、系统、电子设备及存储介质
JP2000090191A (ja) 顔認識装置及び方法
JP2013218530A (ja) 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体
JP2003168113A (ja) 画像認識システム、画像認識方法および画像認識プログラム
Nilsson et al. On histograms and spatiograms-introduction of the mapogram
JPH08115387A (ja) パターン認識装置
KR20020074330A (ko) 계층적 주요 성분 분석에 기반한 얼굴 인식 방법 및 장치
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JP2009032046A (ja) 分類装置、分類方法、ならびに、プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080402

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090402

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100402

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees