JPH08137997A - 文字認識方法および文字認識装置 - Google Patents

文字認識方法および文字認識装置

Info

Publication number
JPH08137997A
JPH08137997A JP6275388A JP27538894A JPH08137997A JP H08137997 A JPH08137997 A JP H08137997A JP 6275388 A JP6275388 A JP 6275388A JP 27538894 A JP27538894 A JP 27538894A JP H08137997 A JPH08137997 A JP H08137997A
Authority
JP
Japan
Prior art keywords
value
dimension
vector
unknown input
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6275388A
Other languages
English (en)
Inventor
Yoshiteru Uchiyama
喜照 内山
Takashi Nitta
隆志 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP6275388A priority Critical patent/JPH08137997A/ja
Publication of JPH08137997A publication Critical patent/JPH08137997A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 本発明は、学習データの特徴量の各次元の値
の分布形状を考慮した文字認識を高速にしかも高精度に
行うことを可能とする。 【構成】 特徴量抽出手段10からの未知入力値Uiは、
評価値計算手段20内の差分計算部21に与えられる。
一方、辞書ベクトル格納手段32からの各次元ごとの辞
書値Siは差分計算部21に入力され、差分値( Si−Ui)
が計算され、その差分値( Si−Ui)は大小比較手段22
に与えられる。この大小比較手段22では、前記差分値
( Si−Ui)と標準偏差ベクトル格納手段33からの標準
偏差値の定数倍αδiとを大小比較する。この大小比較
の結果から、差分値の絶対値が定数倍値より大きい次元
数をカウントし、そのカウント値を基に評価値を算出す
る。そして、この評価値を文字認識手段40が受けて、
未知入力Xが何の文字であるかの認識を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はスキャナなどの画像入力
装置により読み取られた文字画像から文字の切り出しを
行ったのち文字認識を行う文字認識方法および文字認識
装置に関する。
【0002】
【従来の技術】文字画像から文字の切り出しを行ったの
ち、切り出された文字(これを未知入力という)を辞書
と比較して文字認識を行う場合、一般的には、未知入
力、辞書ともに、それぞれ特徴量としての多次元ベクト
ルで表し、両者の多次元ベクトルを比較することにより
文字認識を行っている。
【0003】たとえば、未知入力として「あ」という文
字画像が切り出されて、これを文字認識する場合、この
「あ」の多次元ベクトルを、U1,U2,・・・,UN とし、ま
た、「あ」に対する辞書の多次元ベクトルを、S1,S2,・
・・,SN とすると、これらの多次元ベクトルを構成する
各次元の値(この例では、たとえばU1あるいはS1を指
す)を比較して文字認識する。なお、ここで辞書とは、
一つ一つのカテゴリ(このカテゴリについては後述す
る)に対して、その文字を認識するために必要な様々な
サンプルパターン(これを学習データという)の多次元
ベクトルを構成する各次元の値を各次元ごとに平均をと
ったものである。つまり、文字として「あ」を例にとる
と、この「あ」という文字を認識するために必要な学習
データがM個あるとすると、その学習データのベクトル
は、(1) S11,S12,・・・,S1N、(2) S21,S22,・・・,S2
N、(3) S31,S32,・・・,S3N、・・・,(M) SM1,SM2, ・
・・,SMNというようなM個の多次元ベクトルを持ってい
る。そして、これらのM個の多次元ベクトルの各次元ご
との値を各次元毎に平均して求めたものが、「あ」の辞
書ベクトルであり、これをS1,S2,・・・,SN で表す。
【0004】なお、前記カテゴリとは、たとえば、アル
ファベットの小文字の「オー」を例に取ると、この文字
は「o」もあればまた「ο」もある。このように、ある
文字を表すための文字の種類をここではカテゴリとい
い、1文字で2つのカテゴリ、1文字で3つのカテゴリ
というように一つの文字で複数のカテゴリを持つ場合も
ある。したがって、実際には、学習データは各カテゴリ
に対応して設けられており、辞書も各カテゴリに対応し
て求められる。
【0005】そして、上記未知入力のベクトル(これを
未知入力ベクトルという)の各次元ごとの未知入力値と
辞書ベクトルの各次元ごとの辞書値との距離を計算し
て、この距離値をもとに未知入力画像が何の文字である
かを認識する。
【0006】具体的には、図14に示すように、たとえ
ば「あ」という文字は、その学習ベクトル(図中、小さ
な黒丸で示す)がほぼ円を描くように分布し、その中心
に辞書ベクトルS(図中、大きな黒丸で示す)が有るも
のとし、また、「い」という文字は、その学習ベクトル
(図中、小さな白丸で示す)がほぼ円を描くように分布
し、その中心に辞書ベクトルS(図中、大きな白丸で示
す)が有るものとする。今、ここで、未知入力ベクトル
Uが図示のような位置であるとすると、この未知入力ベ
クトルUと「あ」または「い」の辞書ベクトルSとの間
の距離を計算し、その距離が短い方にその未知入力が属
するものと判断する。したがって、この場合は、未知入
力画像は「あ」の文字であるとの認識を行う。なお、上
記未知入力ベクトルUと各辞書ベクトルSとの間の距離
は、次式により計算される。
【0007】
【数1】
【0008】ただし、上記(1)式において、 D:未知入力ベクトルUと各辞書ベクトルSとの間の距
離 Si:辞書ベクトルSの各次元の値 Ui :未知入力ベクトルUの各次元の値 N:ベクトルの全次元数 であり、この(1)式はユークリッド距離計算式と呼ば
れている。
【0009】
【発明が解決しようとする課題】しかしながら、学習ベ
クトルの分布は、平面的な分布状態を考えた場合、図1
4のような真円形を描くような分布とならない場合もあ
る。
【0010】たとえば、図15のように、ある文字にお
いては、学習ベクトル(図中、小さな黒丸で示す)が横
方向に長い楕円形状に分布したり、あるいは他の文字に
おいては、学習ベクトル(図中、小さな黒丸で示す)が
縦方向に長い楕円形状に分布したりする場合もある。
【0011】このような分布状態において、未知入力ベ
クトルUがたとえば図示の位置であった場合は、未知入
力は、本来、黒丸で示す辞書の文字として認識されなけ
ればならないにも係わらず、前記(1)式による距離計
算では、白丸で示す辞書の文字であると認識されること
になる。
【0012】このように、学習ベクトルが真円形(また
は球形)を描く分布状態とならない場合に対処するた
め、各文字のカテゴリごとに学習ベクトルの各次元ごと
における標準偏差値( この標準偏差値の集合を標準偏差
ベクトルδといい、これを、δ1 , δ2,・・・, δN で
表す)を求め、この標準偏差ベクトルを距離計算時の重
み付け値として用いた距離計算式がある。これを以下に
示す。
【0013】
【数2】
【0014】ただし、上記(2)式において、 D:未知入力ベクトルUと各辞書ベクトルSとの間の距
離 Si:辞書ベクトルSの各次元の値 Ui :未知入力ベクトルUの各次元の値 N:ベクトルの全次元数 wii:重み付け値 δi:標準偏差ベクトルδの各次元の値 である。
【0015】また、重み付け値wiiは、
【0016】
【数3】
【0017】で求められる。
【0018】ところで上記標準偏差値は同一カテゴリ内
の分散を表し、この値からその学習データは各次元ごと
にどの方向への広がりを持っているかを判断することが
できる。
【0019】上記した(2)式は、空間分布の広がりを
考慮した重み付け値wiiを用いて、この重み付け値wii
を(1)式の(Si−ui)に掛けることにより、分布形状
を考慮した距離計算を行うものであり、この計算式によ
れば、未知入力ベクトルUがたとえば図15の位置であ
った場合でも、この未知入力ベクトルUは、黒丸側の分
布空間内に属する文字として認識されるような距離計算
値が得られ、誤認識を防止することができる。
【0020】しかし、上記した(2)式は、(1)式に
比べると重み付け値wiiを掛けるための掛け算を含むた
め(1)式に比べて2倍近くの演算時間を要し、これに
より、文字認識処理装置全体の処理時間に大きな影響を
与えるという問題があった。
【0021】そこで本発明は、学習ベクトルの分布形状
を考慮した文字認識を高速にかつ正確に行える文字認識
方法および文字認識装置を提供することを目的とする。
【0022】
【課題を解決するための手段】本発明の文字認識方法
は、入力画像から文字画像の切り出しを行ったのち、こ
の切り出された文字の特徴量として未知入力ベクトルを
出力し、この未知入力ベクトルの各次元ごとの未知入力
値と各文字のカテゴリ対応に設けられたそれぞれの辞書
ベクトルの各次元ごとの辞書値との差分をとって求めた
各次元ごとの差分値の絶対値と、各文字の全カテゴリ対
応に設けられたそれぞれの標準偏差ベクトルの各次元ご
との標準偏差値を定数倍して求めた各次元ごとの定数倍
値とを、前記各次元ごとに、すべての次元に渡って大小
を比較し、その結果を評価値として求め、この評価値に
基づいて未知入力の文字認識を行うようにしている。
【0023】この文字認識方法において、前記未知入力
ベクトルの全次元数のうち所定の次元数をランダムに抽
出して構成した未知入力部分ベクトルを出力し、この未
知入力部分ベクトルの各次元ごとの未知入力値と、この
未知入力値に対応した次元の辞書値との差分をとって求
めた各次元ごとの差分値と、前記未知入力値に対応した
次元ごとの標準偏差値の定数倍値とを、前記それぞれ対
応する次元ごとに大小を比較し、その結果を評価値とし
て求めるようにしてもよい。
【0024】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0025】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0026】また、本発明の文字認識方法は、入力画像
から文字画像の切り出しを行ったのち、この切り出され
た文字の特徴量として未知入力ベクトルを出力し、この
未知入力ベクトルの各次元ごとの未知入力値と各文字の
全カテゴリ対応に設けられたそれぞれの辞書ベクトルの
各次元ごとの辞書値との差分をとって求めた各次元ごと
の差分値の絶対値と、各文字の全カテゴリ対応に設けら
れたそれぞれの標準偏差ベクトルの各次元ごとの標準偏
差値を定数倍して求めた各次元ごとの定数倍値とを、前
記各次元ごとに、すべての次元に渡って大小を比較し、
その結果を評価値として求める。そして、全カテゴリの
評価値に基づいて、認識、再切り出し、棄却のいずれか
を判断し、認識の場合は未知入力の文字認識を行い、再
切り出しの場合は再度文字の切り出しを行い、棄却の場
合は認識対象外として棄却するようにしている。
【0027】この文字認識方法において、前記未知入力
ベクトルの全次元数のうち所定の次元数をランダムに抽
出して構成した未知入力部分ベクトルを出力し、この未
知入力部分ベクトルの各次元ごとの未知入力値と、この
未知入力値に対応した次元ごとの辞書値との差分をとっ
て求めた各次元ごとの差分値と、前記未知入力値に対応
した次元ごとの標準偏差値の定数倍値とを、前記それぞ
れ対応する次元ごとに大小を比較し、その結果を評価値
として求めるようにしてもよい。
【0028】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0029】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0030】また、本発明の文字認識方法は、入力画像
から文字画像の切り出しを行ったのち、この切り出され
た文字の特徴量として未知入力ベクトルを出力し、この
未知入力ベクトルの各次元ごとの未知入力値と各文字の
全カテゴリ対応に設けられたそれぞれの辞書ベクトルの
各次元ごとの辞書値との差分をとって求めた各次元ごと
の差分値の絶対値と、各文字の全カテゴリ対応に設けら
れたそれぞれの標準偏差ベクトルの各次元ごとの標準偏
差値を定数倍して求めた各次元ごとの定数倍値とを、前
記各次元ごとに、すべての次元に渡って大小を比較し、
その結果を評価値として求めるとともに、前記未知入力
ベクトルの各次元ごとの未知入力値と前記辞書ベクトル
の各次元ごとの辞書値との間の空間上の距離を計算す
る。そして、前記求められた評価値と距離値とから総合
評価を行い総合評価値を出力して、この総合評価値によ
り未知入力の文字認識を行うようにしている。
【0031】この文字認識方法において、前記未知入力
ベクトルの全次元数のうち所定の次元数をランダムに抽
出して構成した未知入力部分ベクトルを出力し、この未
知入力部分ベクトルの各次元ごとの未知入力値と、この
未知入力値に対応した次元ごとの辞書値との差分をとっ
て求めた各次元ごとの差分値と、前記未知入力値に対応
した次元ごとの標準偏差値の定数倍値とを、前記それぞ
れ対応する次元ごとに大小を比較し、その結果を評価値
として求めるようにしてもよい。
【0032】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0033】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0034】また、本発明の文字認識方法は、入力画像
から文字画像の切り出しを行ったのち、この切り出され
た文字の特徴量として未知入力ベクトルを出力し、前記
未知入力ベクトルの各次元ごとの未知入力値と各文字の
全カテゴリ対応に設けられたそれぞれの辞書ベクトルの
各次元ごとの辞書値との間の空間上の距離を計算し、こ
れによって求められた距離値から全カテゴリのうち所定
数の上位認識候補を選び出したのち、この選びだされた
所定数の上位認識候補に対応する辞書ベクトルのみの各
次元ごとの辞書値との差分をとって求めた各次元ごとの
差分値の絶対値と、選びだされた所定数の上位認識候補
に対応する標準偏差ベクトルのみの各次元ごとの標準偏
差値を定数倍して求めた各次元ごとの定数倍値とを、前
記各次元ごとに大小を比較し、その結果を評価値として
求める。そして、この評価値と、未知入力と前記選び出
された所定数の上位認識候補との間の距離値とから総合
評価を行い総合評価値を出力して、この総合評価値によ
り未知入力の文字認識を行うようにしている。
【0035】この文字認識方法において、前記未知入力
ベクトルの全次元数のうち所定の次元数をランダムに抽
出して構成される未知入力部分ベクトルを出力し、この
未知入力部分ベクトルの各次元ごとの未知入力値と、こ
の未知入力値に対応した次元ごとの辞書値との差分をと
って求めた各次元ごとの差分値と、前記未知入力値に対
応した次元ごとの標準偏差値の定数倍値とを、前記それ
ぞれ対応する次元ごとに大小を比較し、その結果を評価
値として求めるようにしてもよい。
【0036】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0037】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0038】また、本発明の文字認識装置は、入力画像
から文字の切り出しを行う文字切り出し手段と、この文
字切り出し手段により切り出された文字の特徴量として
未知入力ベクトルを出力する特徴量抽出手段と、各文字
の全カテゴリ対応の辞書ベクトルを格納した辞書ベクト
ル格納手段、各文字の全カテゴリ対応の標準偏差ベクト
ルを格納した標準偏差ベクトル格納手段、これら辞書ベ
クトル格納手段および標準偏差ベクトル格納手段に対し
て各カテゴリに対応した辞書ベクトルおよび標準偏差ベ
クトルを読み出すための読出指定信号を出力する候補文
字指定手段を有する認識候補データ出力手段と、前記特
徴量抽出手段からの未知入力ベクトルの各次元ごとの未
知入力値と前記辞書ベクトルの各次元ごとの辞書値との
差分をとる差分値計算手段、この差分値と前記標準偏差
ベクトルの各次元ごとの標準偏差値を定数倍して求めた
各次元ごとの定数倍値とを各次元ごとにすべての次元に
渡って大小を比較する大小比較手段、この大小比較手段
からの比較結果をもとに評価値として出力する評価値出
力手段を有する評価値計算手段と、この評価値計算手段
で求められた評価値に基づいて未知入力の文字認識を行
う文字認識手段とを備えている。
【0039】この文字認識装置において、前記特徴量抽
出手段からの未知入力ベクトルの全次元数のうち所定の
次元数をランダムに抽出して構成される未知入力部分ベ
クトルを出力する次元抽出手段を設け、この次元抽出手
段から出力される未知入力部分ベクトルの各次元ごとの
未知入力値と、この未知入力値に対応した次元ごとの辞
書値との差分をとって求めた各次元ごとの差分値と、前
記未知入力値に対応した次元ごとの標準偏差値の定数倍
値とを、前記それぞれ対応する次元ごとに大小を比較
し、その結果を評価値として求めるようにしてもよい。
【0040】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0041】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0042】また、本発明の文字認識装置は、入力画像
から文字の切り出しを行う文字切り出し手段と、この文
字切り出し手段により切り出された文字の特徴量として
未知入力ベクトルを出力する特徴量抽出手段と、各文字
の全カテゴリ対応の辞書ベクトルを格納した辞書ベクト
ル格納手段、各文字の全カテゴリ対応の標準偏差ベクト
ルを格納した標準偏差ベクトル格納手段、これら辞書ベ
クトル格納手段および標準偏差ベクトル格納手段に対し
て各カテゴリに対応した辞書ベクトルおよび標準偏差ベ
クトルを読み出すための読出指定信号を出力する候補文
字指定手段を有する認識候補データ出力手段と、前記特
徴量抽出手段からの未知入力ベクトルの各次元ごとの未
知入力値と前記辞書ベクトルの各次元ごとの辞書値との
差分をとる差分値計算手段、この差分値と前記標準偏差
ベクトルの各次元ごとの標準偏差値を定数倍して求めた
各次元ごとの定数倍値とを各次元ごとにすべての次元に
渡って大小を比較する大小比較手段、この大小比較手段
からの比較結果をもとに評価値として出力する評価値出
力手段を有する評価値計算手段と、この評価値計算手段
で求められた全カテゴリの評価値に基づいて、文字とし
て認識、再切り出し、認識対象外として棄却のいずれか
の判断を行う棄却判断処理手段と、この棄却判断処理手
段からの文字認識要求により未知入力の文字認識を行う
文字認識手段とを備えている。
【0043】この文字認識装置において、前記特徴量抽
出手段からの未知入力ベクトルの全次元数のうち所定の
次元数をランダムに抽出して構成される未知入力部分ベ
クトルを出力する次元抽出手段を設け、この次元抽出手
段から出力される未知入力部分ベクトルを構成する各次
元ごとの未知入力値と、この未知入力値に対応した次元
ごとの辞書値との差分をとって求めた各次元ごとの差分
値と、前記未知入力値に対応した次元ごとの標準偏差値
の定数倍値とを、前記それぞれ対応する次元ごとに大小
を比較し、その結果を評価値として求めるようにしても
よい。
【0044】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0045】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0046】また、本発明の文字認識装置は、入力画像
から文字の切り出しを行う文字切り出し手段と、この文
字切り出し手段により切り出された文字の特徴量として
未知入力ベクトルを出力する特徴量抽出手段と、各文字
の全カテゴリ対応の辞書ベクトルを格納した辞書ベクト
ル格納手段、各文字の全カテゴリ対応の標準偏差ベクト
ルを格納した標準偏差ベクトル格納手段、これら辞書ベ
クトル格納手段および標準偏差ベクトル格納手段に対し
て各カテゴリに対応した辞書ベクトルおよび標準偏差ベ
クトルを読み出すための読出指定信号を出力する候補文
字指定手段を有する認識候補データ出力手段と、前記特
徴量抽出手段からの未知入力ベクトルの各次元ごとの未
知入力値と前記辞書ベクトルの各次元ごとの辞書値との
差分をとる差分値計算手段、この差分値と前記標準偏差
ベクトルの各次元ごとの標準偏差値を定数倍して求めた
各次元ごとの定数倍値とを各次元ごとにすべての次元に
渡って大小を比較する大小比較手段、この大小比較手段
からの比較結果をもとに評価値として出力する評価値出
力手段を有する評価値計算手段と、前記特徴量抽出手段
からの未知入力ベクトルの各次元ごとの未知入力値と前
記辞書ベクトルの各次元ごとの辞書値との間の空間上の
距離を計算する距離計算手段と、この距離計算手段によ
って求められた距離値と前記評価値計算手段によって求
められた評価値とから総合評価を行い総合評価値を出力
する総合評価手段と、この総合評価手段からの総合評価
値により未知入力の文字認識を行う文字認識手段とを備
えている。
【0047】この文字認識装置において、前記特徴量抽
出手段からの未知入力ベクトルの全次元数のうち所定の
次元数をランダムに抽出して構成される未知入力部分ベ
クトルを出力する次元抽出手段を設け、この次元抽出手
段から出力される未知入力部分ベクトルを構成する各次
元ごとの未知入力値と、この未知入力値に対応した次元
ごとの辞書値との差分をとって求めた各次元ごとの差分
値と、前記未知入力値に対応した次元ごとの標準偏差値
の定数倍値とを、前記それぞれ対応する次元ごとに大小
を比較し、その結果を評価値として求めるようにしても
よい。
【0048】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0049】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0050】また、本発明の文字認識装置は、入力画像
から文字の切り出しを行う文字切り出し手段と、この文
字切り出し手段により切り出された文字の特徴量として
未知入力ベクトルを出力する特徴量抽出手段と、各文字
の全カテゴリ対応の辞書ベクトルを格納した辞書ベクト
ル格納手段、各文字の全カテゴリ対応の標準偏差ベクト
ルを格納した標準偏差ベクトル格納手段、これら辞書ベ
クトル格納手段および標準偏差ベクトル格納手段に対し
て各カテゴリに対応した辞書ベクトルおよび標準偏差ベ
クトルを読み出すための読出指定信号を出力する候補文
字指定手段を有する認識候補データ出力手段と、前記特
徴量抽出手段からの未知入力ベクトルの各次元ごとの未
知入力値と前記辞書ベクトルの各次元ごとの辞書値との
差分をとる差分値計算手段、この差分値と前記標準偏差
ベクトルの各次元ごとの標準偏差値を定数倍して求めた
各次元ごとの定数倍値とを各次元ごとにすべての次元に
渡って大小を比較する大小比較手段、この大小比較手段
からの比較結果をもとに評価値として出力する評価値出
力手段を有する評価値計算手段と、前記特徴量抽出手段
からの未知入力ベクトルの各次元ごとの未知入力値と前
記辞書ベクトルの各次元ごとの辞書値との間の空間上の
距離を計算する距離計算手段と、この距離計算手段によ
って求められた距離値から全カテゴリのうち所定数の上
位認識候補を選び出し、前記距離計算手段にて計算され
た所定数の上位認識候補との間の距離値を出力するとと
もに、前記認識候補データ出力手段に対して上位認識候
補指定信号を出力する評価値計算制御手段と、この評価
値計算制御手段から出力される所定数の上位認識候補と
の間の距離値と前記評価値計算手段によって求められた
評価値とから総合評価を行い総合評価値を出力する総合
評価手段と、この総合評価手段からの総合評価値により
未知入力の文字認識を行う文字認識手段とを備えてい
る。そして、前記認識候補データ出力手段は、前記評価
値計算制御手段からの上位認識候補指定信号を受けてそ
れに対応する辞書ベクトルおよび標準偏差ベクトルを前
記評価値計算手段に出力し、評価値計算手段は前記所定
数の上位認識候補と未知入力との間の評価値を計算する
ようにしている。
【0051】この文字認識装置において、前記特徴量抽
出手段からの未知入力ベクトルの全次元数のうち所定の
次元数をランダムに抽出して構成された未知入力部分ベ
クトルを出力する次元抽出手段を設け、この次元抽出手
段から出力される未知入力部分ベクトルを構成する各次
元ごとの未知入力値と、この未知入力値に対応した次元
ごとの辞書値との差分をとって求めた各次元ごとの差分
値と、前記未知入力値に対応した次元ごとの標準偏差値
の定数倍値とを、前記それぞれ対応する次元ごとに大小
を比較し、その結果を評価値として求めるようにしても
よい。
【0052】また、前記標準偏差値を定数倍するための
定数を複数用意して複数の定数倍値を設定し、この複数
の定数倍値と前記差分値とを大小比較するようにしても
よい。
【0053】そして、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得る。
【0054】
【作用】このように本発明は、切り出された文字の特徴
量としての未知入力ベクトルの各次元ごとの未知入力値
と各文字の全カテゴリ対応に求められたそれぞれの辞書
ベクトルの各次元ごとの辞書値との差分をとって得られ
た各次元ごとの差分値の絶対値と、各文字の全カテゴリ
対応に求められたそれぞれの標準偏差ベクトルの各次元
ごとの標準偏差値を定数倍して求めた各次元ごとの定数
倍値とを、前記各次元ごとに、すべての次元に渡って大
小を比較し、その結果をもとにして評価値を求め、この
評価値に基づいて未知入力の文字認識を行うようにして
いる。
【0055】前記評価値は、前記差分値の絶対値と定数
倍値との各次元ごとの大小比較の結果、差分値の絶対値
が定数倍値より大きい次元数をカウントし、そのカウン
ト値を基に得る。そして、この評価値を文字認識の指標
として用いる。この評価値を求めるに必要な演算は、差
分値を取る演算と比較演算が主であるので、計算量が少
なく高速な処理が可能となり、これによって得られた評
価値を用いることにより、空間分布の広がりをも考慮し
た高精度な認識が可能となる。
【0056】また、切り出された未知入力を文字として
認識するか、再切り出しを要するか、認識対象外として
棄却するかのいずれかの判断を行う棄却判断処理を行う
際、この評価値を用いて行う。この評価値は定量的な値
であるので、相対的な距離比較によって棄却判断処理を
行う場合に比べ、より正確な棄却判断処理が可能とな
る。
【0057】さらに、前記評価値と距離値(この場合の
距離値は空間分布を考慮しない距離計算式によって得ら
れる値)との両方を用いて、これらの値から総合的な評
価値を得て、これにより文字認識を行うことにより、ノ
イズ等にも影響されにくく、しかも高速な認識が可能と
なる。
【0058】また、前記距離値を併用する際、まず、未
知入力値と辞書値との距離を計算し、その計算結果から
類似度の上位から所定数までを認識候補辞書値として選
び出し、その上位から所定数までの認識候補辞書値と未
知入力値との間で評価値を求めるようすることにより、
ノイズ等に影響されにくいという効果の他、処理を大幅
に高速化することができる。
【0059】
【実施例】以下、本発明の実施例を図面を参照して説明
する。
【0060】(実施例1)図1は本発明の実施例による
文字認識装置の構成図である。この文字認識装置は、概
略的には、文字切り出し手段1、特徴量抽出手段10、
評価値計算手段20、認識候補データ出力手段30、文
字認識手段40から構成されている。
【0061】前記評価値計算手段20は差分計算手段2
1、大小比較手段22、評価値出力手段23から構成さ
れている。また、前記認識候補データ出力手段30は、
候補文字指定手段31、辞書ベクトル値格納手段32、
標準偏差ベクトル値格納手段33から構成されている。
これら評価値計算手段20および認識候補データ出力手
段30のそれぞれの構成要素における機能などについて
は後述する。
【0062】このような構成において、前記文字切り出
し手段1によって切り出された文字(これを未知入力X
という)の矩形画像は、特徴量抽出手段10に送られ、
特徴量ベクトル(前記した未知入力ベクトルU1,U2,・・
・,UN )として出力されたのち、各次元ごとの未知入力
値Uiが順次、評価値計算手段20内の差分計算部21に
与えられる。
【0063】一方、認識候補データ出力手段30におけ
る辞書ベクトル格納手段32には、全てのカテゴリに対
応した辞書ベクトルがそれぞれ所定のアドレスに格納さ
れている。また、標準偏差ベクトル格納手段33には、
全てのカテゴリに対応した標準偏差ベクトルがそれぞれ
所定のアドレスに格納されている。
【0064】そして、候補文字指定手段31により、ア
ドレスを指定するコード信号が出されると、指定された
アドレスから辞書ベクトルの各次元ごとの辞書値および
標準偏差ベクトルの各次元ごとの標準偏差値がそれぞれ
対応する次元ごとに順次出力される。すなわち、前記候
補文字指定手段31からは全てのカテゴリに対応してそ
のカテゴリの辞書ベクトルおよび標準偏差ベクトルを指
定するコードが順次出力され、これにより指定された辞
書ベクトルおよび標準偏差ベクトルのそれぞれの値が各
次元(同じ次元)ごとに順次出力される。たとえば、あ
るカテゴリの辞書ベクトルとしてS1,S2,・・・,SN が指
定され、また標準偏差ベクトルとしてδ1 , δ2,・・
・, δN が指定されたとすると、辞書ベクトル格納手段
32からは辞書値S1が、標準偏差ベクトル格納手段33
からは標準偏差値δ1 が出力される.つまり、ある次元
をiとすれば、辞書ベクトル格納手段32からは辞書値
Siが、標準偏差ベクトル格納手段33からは標準偏差値
δiが出力される。ただし、この場合、標準偏差ベクト
ル格納手段33からは、標準偏差値δiに定数αを掛け
た値αδiが出力される。なお、この定数αについての
説明は後述する。
【0065】そして、辞書ベクトル格納手段32からの
各次元ごとの辞書値Siは差分計算手段21に入力され、
前記特徴量抽出手段10からの未知入力ベクトルU1,U2,
・・・,UN の各次元ごとの未知入力値Uiとの間で差分値
( Si−Ui)が計算され、その差分値( Si−Ui)は大小比
較手段22に与えられる。この大小比較手段22では、
前記差分値( Si−Ui)と前記標準偏差ベクトル格納手段
33からの標準偏差値δ1 , δ2,・・・, δN のうちの
対応する次元の標準偏差値の定数倍(定数をαとし、α
δi)とを大小比較する。なお、ここで、iは1からN
までの値(正の整数)を取るものとする。したがって、
1からNの各次元にわたって辞書値と未知入力値の差分
値と、標準偏差値の定数倍との大小比較、つまり、|Si
−Ui|≧αδiの判断が行われる。この大小比較の結果
は、評価値出力手段23に与えられ、その大小比較の結
果に基づいて評価値を算出する。なお、この評価値につ
いては後で説明する。
【0066】そして、この評価値を文字認識手段40が
受けて、前記未知入力Xが何の文字であるかの認識を行
い、その文字に対応する文字コードを出力する。なお、
以上の処理動作において、評価値計算手段20における
評価値算出処理については、以下で詳細に説明する。
【0067】次に前記した評価値算出処理について説明
する。
【0068】まず、前述したように、ある文字を認識す
るために必要な学習データがM個あるとすると、その学
習データは、(1) S11,S12,・・・,S1N、(2) S21,S22,・
・・,S2N、(3) S31,S32,・・・,S3N、・・・,(M) SM1,S
M2, ・・・,SMNというような、M個の多次元ベクトルを
持っている。そして、これらのM個の多次元ベクトルを
各次元毎に平均値を求めたものが、辞書ベクトルS1,S2,
・・・,SN である。
【0069】そして、カテゴリごとに前記学習データの
各次元ごとに分散を求め、その分散から各次元ごとの標
準偏差値を求める。この標準偏差値から空間がどの方向
への広がりを持っているかをおおよそ判断することがで
きる。この各次元ごとの標準偏差値の集合が標準偏差ベ
クトルδ1,δ2,・・・, δN である。
【0070】ここで、学習データにより平均値と標準偏
差値があらかじめ分かっているとき、未知入力値は統計
的に図2で示す正規分布曲線にしたがって現れる。
【0071】この正規分布曲線から分かるように、当然
のことながら、未知入力値は分布の中心付近にたくさん
出現し、中心から遠ざかるに連れて出現数は減少する。
【0072】このような正規分布曲線はあらかじめ知る
ことができる。この図2に示す正規分布曲線において、
横軸は、辞書値Siと未知入力値Uiとの差分値( Si−Ui)
を標準偏差値δiで正規化した値であり、( Si−Ui)が
標準偏差値δiに対してどの程度(何倍)の値を持つか
という数値である。換言すれば、たとえば、「1」とい
うのは「1δi 」、「2」というのは「2δi 」、「−
1」というのは「−1δi 」、「−2」というのは「−
2δi 」という意味をもつ。また、縦軸は生起確率
(%)を表している。この生起確率は、未知入力値と辞
書値の差分値が図2の横軸上の或る位置に出現する確率
を示している。たとえば、1δi ,2δi に対応する確
率は、図2の正規分布曲線からそれぞれ約30%,5%
と求められる。すなわち、辞書値Siと未知入力値Uiの差
分値( Si−Ui)が、たとえば、1δiとなる確率は約3
0%であり、2δi となる確率は約5%であるというこ
とになる。
【0073】さらに、差分値( Si−Ui)が、2δi より
大きくなる確率は、図2の中の斜線を施した部分の面積
と、図2の横軸と曲線全体で囲まれる面積との比率によ
り求めることができる。ここでの差分値( Si−Ui)が、
2δi より大きくなる確率は6.6%となる。
【0074】以上のことをふまえて、このような正規分
布曲線において、辞書値Siと未知入力値Uiとの差分値(
Si−Ui)の絶対値が、標準偏差値δiの定数倍(前記し
たように、αδi)より大きくなる確率pを求める。こ
こで、αを2.5 とすれば、 2.5δi の確率p、つまり、
差分値|Si−Ui|≧ 2.5δi の位置における未知入力値
の出現確率pは、前記した面積の比率から、pは約1.2%
となる。換言すれば、差分値( Si−Ui)が 2.5δi を越
える位置においては、未知入力値Uiは約1.2%の確率でし
か出現しないということである。
【0075】そして、1からNまでの各次元において、
前記差分値|Si−Ui|≧ 2.5δi を判断して、これを満
たす次元が1からNまでのN次元のうち幾つあるかをカ
ウントして、そのカウント数nを評価値(以下これを評
価値nという)とする。このときの評価値nの生起確率
qは二項分布に従って計算できる。
【0076】
【数3】
【0077】たとえば今、Nを64とし、αを2.5 とし
たとき、n=0となる確率は約45%、n=1となる確
率は35%、n=2となる確率は15%、n=3となる
確率は約5%であり、さらにn=4となる確率は殆ど0
%となる。このときの二項分布曲線を図3に示す。とこ
ろで、|Si−Ui|≧ 2.5δi を満たす出現確率pは約1.
2%であることから、次元数Nが64である場合でも、そ
の出現数の期待値は、64×0.012 =0.77となり、せいぜ
い1個以下である。したがって、nが4個以上もある場
合は、その未知入力Xはその認識対象として読み出され
た辞書の文字である確率は殆ど0%であることを示し、
また、nが2個の場合も、その未知入力Xはその認識対
象として読み出された辞書の文字である確率は高々15
%程度であることを示している。
【0078】具体的には、次元数Nが64の場合、今、
i=2,i=10,i=41、i=64のときに、差分
値|Si−Ui|≧ 2.5δi であったとすると、そのカウン
ト数nは「4」である。このカウント数n=4が評価値
であるので、この評価値に基づいて、未知入力Xがその
ときの認識候補文字として出力された文字であるか否か
の判断を行う。この場合は、前記したように、nが4個
もある場合は、確率は殆ど0%であるため、その未知入
力Xはその認識対象として読み出された辞書の文字でな
いとの評価を行う。
【0079】このように、本発明では前記評価値を文字
認識の指標として用いている。したがって、この評価値
が幾つまでであれば、未知入力Xが認識対象となる辞書
の文字であるかという判断を行うことができる。
【0080】ところで、この評価値算出を行うに際して
の計算量としては、まず、δiにαを掛ける掛け算と、
差分値( Si−Ui)を求める引き算と、大小の比較演算が
有るが、δiにαを掛ける掛け算は、αはあらかじめ設
定された値(この実施例ではα=2.5 としている)であ
るため、α×δiの計算はその都度行う必要はなくあら
かじめ計算しておくことができる。したがって、この実
施例での評価値算出は、引き算と比較演算だけで済むた
め、前記(2)式のように、その都度、2乗計算や掛け
算を行う計算に比べて処理を高速化できる。これによ
り、横方向あるいは縦方向など空間分布の特定方向への
広がりをも考慮した文字認識を高速に行うことが可能と
なる。
【0081】なお、この実施例1では未知入力ベクトル
U1,U2,・・・,UN の1からNの全ての次元について、前
記差分値|Si−Ui|≧2.5 δi を判断して、これを満た
す次元が1からNまでのN次元のうち幾つあるかをカウ
ントして、そのカウント数nを評価値を求めたが、この
方法に限らず、1からNの次元のうち幾つかを抽出し
て、この抽出した次元について差分値|Si−Ui|≧2.5
δi を判断して、これを満たす次元が1からNまでのN
次元のうち幾つあるかをカウントして、そのカウント数
nを評価値を求めるようにしてもよい。これを図4を参
照して以下に説明する。
【0082】図4に示す構成は、図1で示した評価値計
算手段20に次元抽出手段24を設けた構成となってい
る他は、図1と同じであるため、同一部分には同一符号
を付してそれらの説明はここでは省略する。
【0083】前記次元抽出手段24は、特徴量抽出手段
10から出力される未知入力ベクトルU1,U2,・・・,UN
のうち、幾つかの値をランダムに抽出して未知入力ベク
トルを構成して(これをここでは未知入力部分ベクトル
と呼ぶ)、その未知入力部分ベクトルの各次元の未知入
力値を差分計算手段21に出力するものである。
【0084】すなわち、特徴量抽出手段10から出力さ
れる未知入力ベクトルU1,U2,・・・,UN の1からNの次
元数のうち、たとえば半数を偏りのないようにランダム
に取り出す。このようにサンプル数の十分有る母集団か
ら偏りのないようにランダムに幾つかのサンプルを抽出
した場合、この抽出したサンプルにより得るデータは、
統計的には、母集団で得られる結果に近づくものとされ
ている。
【0085】このように未知入力ベクトルU1,U2,・・
・,UN のうち、幾つかを抽出する例として、たとえば、
U1,U2,U4,U7,U8,U10, ・・・,UN というように半数を
抽出することも考えられる。このように抽出された未知
入力ベクトルは、差分計算手段21で抽出された各次元
ごとに辞書ベクトルの対応する次元の辞書値との差が取
られたのち、その差分値と対応する標準偏差値δiの定
数倍(前記したように、αδi)より大きくなる確率p
を求める。ここで、αを2.5 とすれば、2.5 δiの確率
p、つまり、差分値|Si−Ui|≧2.5 δi の位置におけ
る未知入力の出現確率pは、前記した面積の比率から、
pは約1.2%となる。換言すれば、差分値(Si−Ui)が2.
5 δi を越える位置においては、未知入力値は約1.2%の
確率でしか出現しないということである。
【0086】そして、前記iを1,2,4,7,8,1
0,・・・,Nというようにランダムに変化させた各次
元において、差分値|Si−Ui|≧2.5 δi を判断して、
これを満たす次元が幾つあるかをカウントして評価値n
を得る。そして、前記同様、文字認識手段40が、評価
値nに基づいて、未知入力Xが何の文字であるかの認識
を行う。
【0087】前記実施例では、Nを64としたが、これ
は場合によっては、N=1000以上という場合も考え
られるので、このように次元数の多い場合には、次元を
ランダムに抽出して処理を行う方法は、処理量を大幅に
減らすことができ、処理の高速化が図れることからきわ
めて有効な方法となる。
【0088】また、この実施例1において、標準偏差ベ
クトル値δi の定数倍としてのαは、ある一つの値(こ
こではα=2.5 とした)を設定した場合について説明し
たが、αをα1,α2,・・・,αk というように複数
用意し、複数の評価値を得るようにしてこの複数の評価
値から総合的に評価を行うようにしてもよい。これにつ
いてを図5を参照しながら以下に説明する。
【0089】図5に示す構成は、図1で示した構成に対
して、標準偏差ベクトル値格納手段33の出力側にベク
トル定数倍手段34を設けた点が異なるだけで、他は図
1と同じであるため、同一部分には同一符号を付してそ
れらの説明はここでは省略する。
【0090】前記ベクトル定数倍手段34は、標準偏差
ベクトル値格納手段33から出力される標準偏差ベクト
ルδ1 , δ2,・・・, δN に対して、各次元ごとに、複
数の定数α(ここでは、このαはα1,α2の2種類と
する)を掛けた値、つまりα1・δi とα2・δi を、
大小比較手段22に出力する。
【0091】そして、大小比較手段22では、前記差分
値( Si−Ui)と前記標準偏差ベクトル格納部33からの
標準偏差ベクトルδ1 , δ2,・・・, δN のうちの対応
する次元の標準偏差値の定数倍(α1・δi およびα2
・δi )とをそれぞれ大小比較する。なお、ここで、i
は1からNまでの値(正の整数)を取るものとする。
【0092】すなわち、未知入力ベクトルU1,U2,・・
・,UN の1からNの全ての次元について、辞書値S1,S2,
・・・,SN との差分値( Si−Ui)をとり、この差分値(
Si−Ui)と前記α1・δi の大小関係、および差分値(
Si−Ui)と前記α2・δi の大小関係を判断して、差分
値|Si−Ui|≧α1・δi を満たす次元が1からNまで
のN次元のうち幾つあるかをカウントするとともに、差
分値|Si−Ui|≧α2・δi を満たす次元が1からNま
でのN次元のうち幾つあるかをカウントして、それぞれ
のカウント数n1,n2を評価値n1,n2として求め
る。たとえば、α1=2.5 、α2=3.0 とした場合、差
分値|Si−Ui|≧2.5 δi を満たす次元が1からNまで
のN次元のうち4個(評価値n1)、差分値|Si−Ui|
≧3.0 δiを満たす次元が1からNまでのN次元のうち
2個(評価値n2)というような値が得られたとする
と、評価値出力手段23によりこれら2つの評価値が出
力され、文字認識手段40にて、そのときの未知入力X
が、認識対象として読み出された辞書の文字であるか否
かの評価を行う。
【0093】このように、標準偏差値δi の定数倍とし
てのαを複数用意し、複数の評価値を得るようにして、
この複数の評価値から総合的に評価を行うようにするこ
とにより、認識精度をより高いものとすることができ
る。特に、ベクトルの次元数が少ない場合、あるいは学
習データのサンプル数が少なく標準偏差値など統計的に
求められるデータの信頼性が低い場合に大きな効果が得
られる。
【0094】(実施例2)次に本発明の実施例2につい
て説明する。この実施例2は、前記実施例1で得られた
評価値を用いて、たとえば、文字の切り出しをを誤った
場合などにおいて、それをリジェクト(棄却)する処理
を行うものである。
【0095】図6は実施例2を説明する構成図である。
同図において、文字切り出し手段1、特徴量抽出手段1
0、評価値計算手段20、認識候補データ出力手段3
0、文字認識手段40は図1で示したものと同じであ
る。この実施例では、棄却判断処理手段50を設け、前
記評価値計算手段20で計算された評価値を棄却判断処
理手段50に与える構成となっている。
【0096】このような構成において、前記特徴量抽出
部10からは特徴量として未知入力ベクトルU1,U2,・・
・,UN を出力し、その未知入力ベクトルU1,U2,・・・,U
N を評価値計算部20に与える。この評価値計算部20
では、未知入力ベクトルU1,U2,・・・,UN の各次元ごと
の値および認識候補データ出力手段30からの辞書ベク
トルと標準偏差ベクトルの各次元ごとのそれぞれの値を
得て、前記実施例1で説明したような評価値nを出力す
る。なお、この評価値nの計算処理については前記実施
例1にて説明済みであるので、ここではその説明は省略
する。
【0097】そして、前記評価値計算部20で求められ
た評価値nは、棄却判断手段50に与えられる。この棄
却判断処理手段50は、評価値nにもとづいてそのとき
の未知入力Xの矩形画像が文字であるか否かを判断し
て、文字でないと判断した場合には、文字切り出し手段
1に対して再切り出し要求50aを出力し、文字である
と判断した場合には、文字認識手段40に対して文字で
あることを示す文字確定信号50bを出力する。
【0098】この動作を具体例を用いて説明する。たと
えば、未知入力Xとして「い」という文字が入力され、
文字切り出し手段1によって、この「い」が真ん中から
左右に分けて切り出されてしまった場合を考える。今、
この「い」の左側の部分だけが特徴量抽出手段10に入
力されたとすると、特徴量抽出手段10からは、それに
対応した未知入力ベクトルが出力され、評価値計算部2
0に入力される。
【0099】この評価値計算部20には、その未知入力
ベクトルに対応して全てのカテゴリの辞書ベクトルの各
次元ごとの値が入力されるとともに、それに対応する標
準偏差ベクトルの各次元ごとの値の定数倍(α・δi )
が入力される。そして、図6では図示されていないが差
分計算手段で未知入力値と辞書ベクトル値の差が各次元
ごとに計算されるとともに、この差分値とα・δi の大
小比較が行われる。これらの処理は、全てのカテゴリに
対して行われる。そして、その大小比較により評価値が
棄却判断処理手段50に出力される。
【0100】そして、棄却判断処理手段50では入力さ
れた評価値のうち最も小さい評価値から、再切り出し要
求か、文字確定かを判断する。つまり、入力された評価
値のうち最も小さい評価値がたとえば「8」であった場
合には、どのカテゴリにも属さない(各評価値の値から
みて文字である可能性は低い)と判定し、さらに未知入
力が文字の一部か否かの判断も行い、この場合は、文字
の一部であるので、再切り出し要求信号70aを出力す
る。
【0101】図7は実施例2における全体の処理手順を
説明するフローチャートである。同図において、まず、
文字の切り出し(ステップS1)を行ったのち、特徴量
抽出(未知入力ベクトル出力)を行い(ステップS
2)、前記したような評価値計算を行う(ステップS
3)。次に、この評価値計算がすべてのカテゴリに対し
て終了したか否かを判断し(ステップS4)、終了して
いなければ終了していないカテゴリに対する評価値計算
を行い、終了していれば棄却判断を行う(ステップS
5)。この棄却判断において文字であるか否かの判断を
行い(ステップS6)、文字であれば文字認識を行って
認識結果を出力する(ステップS7)。一方、ステップ
S6の判断において文字でないと判断された場合は、そ
れが文字の一部であるか否かを判断し(ステップS
8)、文字の一部でない場合にはノイズなど認識対象外
の画像であるとみなして棄却する。一方、ステップS8
における判断において文字の一部であると判断された場
合には、再切り出しの要求を出す(ステップS9)。そ
して、再びステップS1からの処理を行う。
【0102】図8は、切り出された画像に対する未知入
力ベクトルが、認識対象として読みだされた全てのカテ
ゴリに属さないという状態を示したものである。同図に
おいて、C1〜C4は4つのカテゴリにおける平面的な
分布空間を示すもので、黒丸印がそれぞれのカテゴリの
辞書ベクトルを示している。そして、未知入力ベクトル
Uが図示の如く位置した場合の評価値は前記したように
どのカテゴリにおいても大きな値となり、どのカテゴリ
にも属さないと判定される。
【0103】ところで、切り出された画像に対する未知
入力ベクトルが、全てのカテゴリのいずれかに属するか
否かを判断する場合、従来では、分布形状を考慮しない
真円形状の分布空間(平面で考えた場合)であるため、
それぞれの円形分布外の空間(どのカテゴリにも属さな
い部分)は大きくなり、そのどのカテゴリにも属さない
部分の空間に存在する未知入力ベクトルが前記したよう
に棄却すべき画像であるか否かの判断を高精度に行うこ
とができない。また、従来では、未知入力がどの分布空
間に属するかという判断を距離計算で行い、たとえば、
その距離値と他の候補文字の距離値との比を比較して棄
却すべきか否かを判断している。つまり、従来の方法は
相対的な評価で棄却すべきか否かを判断しているため、
正確な判断が行えなかった。
【0104】これに対して本発明では、図8で示すよう
に真円形空間ではなく特定方向への広がりを持つ分布形
状を考慮して、未知入力がどの分布空間に属するか否か
を前記したような評価値を用いて判断している。しか
も、その評価値は相対的な評価ではなく定量的な評価で
ある。つまり、本発明では1文字1文字に対して評価値
が計算される。この評価値は、未知入力が或る文字であ
るとの確率を示す値に近いものとなる。このように、本
発明では、未知入力を分布空間内の文字に対して定量的
な評価を行うことによって棄却すべきか否かの判断を行
うことにより、より正確な判断を行うことができる。
【0105】なお、この実施例2においても、前記図4
を用いて説明したように、特徴量抽出手段10から出力
される未知入力ベクトルを、ランダムに抽出して差分値
を計算するようにしてもよい。また、図5で説明したよ
うに、定数αを複数用意し、たとえば前述したように、
差分値( Si−Ui)と前記α1・δi の大小関係、および
差分値( Si−Ui)と前記α2・δi の大小関係を判断し
て、差分値|Si−Ui|≧α1・δi を満たす次元が1か
らNまでのN次元のうち幾つあるかをカウントするとと
もに、差分値|Si−Ui|≧α2・δi を満たす次元が1
からNまでのN次元のうち幾つあるかをカウントして、
それぞれのカウント数n1,n2を評価値n1,n2と
して求めるようにしてもよい。
【0106】(実施例3)次に、本発明の実施例3につ
いて説明する。この実施例3は、これまで説明してきた
本発明の評価値に距離値を併用して、これらから総合的
に評価値を求めるようにした例である。
【0107】図9は実施例3を説明する構成図である。
同図において、文字切り出し手段1、特徴量計算手段1
0、評価値計算手段20、認識候補データ出力手段3
0、文字認識手段40はこれまで説明したものと同じで
ある。ここでは、さらに距離値計算手段60と総合評価
手段70が新たに設けられている。
【0108】前記距離値計算手段60は、たとえば前述
した(1)式の計算を行う距離値計算手段である。そし
て、この距離値計算手段60で計算された距離値は総合
評価手段70に与えられ、この距離値と評価値計算手段
20で計算された評価値とによって総合評価が行われ、
その総合評価によって文字認識手段40が何の文字であ
るかの文字認識を行い、その文字に対応する文字コード
が出力される。
【0109】なお、前記評価値計算手段20による評価
値計算処理は、前記実施例1で説明したのでここではそ
の説明は省略する。また、距離値計算手段60による距
離計算は、この場合、分布空間が真円形の場合の距離計
算式、つまり、(1)式で示したユークリッド距離計算
を用いた場合であり、これについては公知の技術である
のでここでは説明を省略する。
【0110】図10はこの実施例3の処理手順を示すフ
ローチャートであり、以下、同図を参照して説明する。
まず、切り出された文字画像が入力されると(ステップ
S11)、特徴量抽出手段10にて特徴量としての未知
入力ベクトルが抽出され(ステップS12)たのち、こ
の抽出された未知入力ベクトルから評価値計算手段20
によって、前記した方法により或るカテゴリに対する評
価値が計算される(ステップS13)とともに、距離値
計算手段60によって、或るカテゴリに対する辞書値と
の間の距離値が計算される(ステップS14)。
【0111】次に、このようにして求められた評価値と
距離値をもとに総合評価手段70にて総合評価値を計算
する(ステップS15)。そして、この総合評価値の計
算が全カテゴリについて終了したか否かを判断して(ス
テップS16)、終了していなければ、再び、ステップ
S13とステップS14に戻る。全カテゴリについて終
了した場合は、その総合評価値の値をもとに、文字認識
手段40により文字認識を行う(ステップS17)。
【0112】以上のようにして、評価値と距離値の両方
の値から総合的に評価値を求める。これによって、より
正確な認識を行うことができる。
【0113】すなわち、本発明の評価値による認識処理
は、未知入力の様々なパターンに対しては、様々な学習
データをもとに得られた標準偏差によって対応すること
ができるが、未知入力に学習データからは予測できない
ような変動が生じている場合、たとえば図11に示すよ
うに入力画像にノイズNsが存在しているような場合
は、標準偏差によってもそれに対応できない場合もあり
得る。
【0114】これに対して、距離値による認識はこのよ
うなノイズには比較的影響されにくいという面を持って
いる。
【0115】したっがて、本発明の評価値に距離値を併
用して、これらの値から総合的に評価値を求めることに
よって、より正確な認識を行うことができる。
【0116】なお、この実施例3においても、前記図4
を用いて説明したように、特徴量抽出手段10から出力
される未知入力ベクトルを、ランダムに抽出して差分値
を計算するようにしてもよい。また、図5で説明したよ
うに、定数αを複数用意し、たとえば前述したように、
差分値( Si−Ui)と前記α1・δi の大小関係、および
差分値( Si−Ui)と前記α2・δi の大小関係を判断し
て、差分値|Si−Ui|≧α1・δi を満たす次元が1か
らNまでのN次元のうち幾つあるかをカウントするとと
もに、差分値|Si−Ui|≧α2・δi を満たす次元が1
からNまでのN次元のうち幾つあるかをカウントして、
それぞれのカウント数n1,n2を評価値n1,n2と
して求めるようにしてもよい。
【0117】(実施例4)前記実施例3では、評価値に
距離値を併用するに際して、全てのカテゴリにおいて評
価値と距離値を計算して総合評価を行う例を示したが、
全てのカテゴリにおいて評価値と距離値を計算するの
は、処理としては無駄な部分もあるので、まず、距離値
により上位候補を幾つか選び出し、その上位候補に対し
てのみ評価値を計算するようにしてもよい。これについ
て、図12の構成図を参照して説明する。
【0118】図12は図9に対して構成的には、距離値
データ処理手段80を設けた点が異なっている。この距
離値データ処理手段80は、距離値計算手段60にて計
算された全カテゴリに対する距離値を一旦、蓄積したの
ち、この蓄積された距離値をもとに類似度の上位候補
(ここでは認識候補の類似度上位1位から30位までの
候補とする)選択コード信号を認識候補データ出力手段
30に対して出力し、さらにその上位30位までの候補
に対するそれぞれの距離値を総合評価手段70に対して
出力する。
【0119】認識候補データ出力手段30は、認識候補
データ出力手段30からの上位30位までの上位候補選
択コード信号を受けると、ここでは図示されていない辞
書ベクトル格納手段32と標準偏差ベクトル格納手段3
3から、30位までの上位候補選択信号に対応した辞書
ベクトルと標準偏差ベクトルのそれぞれの値を各次元ご
とに評価値計算手段20に対して順次出力する。これに
より、未知入力値Uiは、この上位30位までの認識候補
との間で、前記したような評価値計算が行われる(この
計算については実施例1参照)。そして、この上位30
位までの認識候補との間で計算された評価値を総合評価
手段70に出力する。
【0120】この総合評価手段70は、評価値計算手段
20からの類似度上位30位までの評価値と距離値デー
タ処理手段80からの類似度上位30位までの距離値と
によって総合評価を行い、その総合評価値を文字認識手
段40に出力し、この文字認識手段40から総合評価値
に基づいた文字認識が行われる。
【0121】図13は以上の処理手順を示すフローチャ
ートである。以下、同図を参照して説明する。まず、切
り出された文字画像が入力されると(ステップS2
1)、特徴量抽出手段10にて特徴量としての未知入力
値が抽出され(ステップS22)たのち、距離値計算手
段60によって、あるカテゴリにおける辞書ベクトルと
の間の距離値が計算される(ステップS23)。次に、
全カテゴリについて距離値計算処理が終了したか否かを
判断し(ステップS24)、終了していなければ、ステ
ップS23に処理が戻り、終了していれば、上位候補
(ここでは上位30位まで)に対する評価値計算が行わ
れる(ステップS25)。
【0122】そして、この上位候補に対する各評価値
と、前記ステップS23で計算された距離値のうち上位
候補に対する各距離値とからそれぞれに対して総合評価
値を計算し(ステップS26)する。この総合評価値の
計算が上位30位までの候補に対して終了したか否かを
判断して(ステップS27)、終了していなければステ
ップS23に処理が戻り、終了していれば、その総合評
価値に基づいて文字認識結果を出力する(ステップS2
8)。
【0123】以上のように、評価値と距離値の両方の値
から総合的に評価値を求めるに際して、まず、距離値に
より類似度の上位候補を抽出し、この抽出された候補に
対してのみ評価値を計算するようにしているので、図9
で示した方法と同様の効果が得られる他、この場合、高
速な処理が可能となるという効果が得られる。たとえ
ば、JIS 第1水準の文字は約3000あるが、これを3
0程度に絞り込んだのち評価値計算を行うようにしてい
るので、その計算量を大幅に減らすことができ処理の高
速化を図ることができる。
【0124】なお、前記実施例3およびこの実施例4に
おいて用いる距離計算手段は、前記した(1)式(ユー
クリッド距離計算方法)に限られることなく、たとえ
ば、
【0125】
【数4】
【0126】のシティブロック距離計算方法を用いても
よい。このシティブロック距離計算方法によれば、より
高速化が可能となる。
【0127】また、この実施例4においても、前記図4
を用いて説明したように、特徴量抽出手段10から出力
される未知入力ベクトルを、ランダムに抽出して差分値
を計算するようにしてもよい。また、図5で説明したよ
うに、定数αを複数用意し、たとえば前述したように、
差分値( Si−Ui)と前記α1・δi の大小関係、および
差分値( Si−Ui)と前記α2・δi の大小関係を判断し
て、差分値|Si−Ui|≧α1・δi を満たす次元が1か
らNまでのN次元のうち幾つあるかをカウントするとと
もに、差分値|Si−Ui|≧α2・δi を満たす次元が1
からNまでのN次元のうち幾つあるかをカウントして、
それぞれのカウント数n1,n2を評価値n1,n2と
して求めるようにしてもよい。
【0128】
【発明の効果】以上説明したように本発明による文字認
識方法は、まず請求項1によれば、未知入力ベクトルの
各次元ごとの未知入力値と各文字の全カテゴリ対応に設
けられたそれぞれの辞書ベクトルの各次元ごとの辞書値
との差分をとって求めた各次元ごとの差分値の絶対値
と、各文字の全カテゴリ対応に設けられたそれぞれの標
準偏差ベクトルの各次元ごとの標準偏差値を定数倍して
求めた各次元ごとの定数倍値とを、前記各次元ごとに、
すべての次元に渡って大小を比較し、その結果を評価値
として求め、この評価値に基づいて未知入力の文字認識
を行うようにしたので、空間分布の形状を考慮した文字
の定量的な評価値を、少ない計算量で高速に求めること
ができる。
【0129】また、請求項2によれば請求項1におい
て、前記未知入力ベクトルの全次元数のうち所定の次元
数をランダムに抽出して構成した未知入力部分ベクトル
を用いて、評価値をもとめるようにしたので、さらに計
算量を少なくすることができ、より高速な認識処理が可
能となる。
【0130】また、請求項3によれば請求項1におい
て、前記標準偏差値を定数倍するための定数を複数用意
して複数の定数倍値を設定し、この複数の定数倍値と前
記差分値とを大小比較するようにしたので、ベクトルの
次元数の少ないとき、あるいはサンプル数が少なく統計
的な判断が困難な場合に、より正確な評価値を計算する
ことができ、信頼性の高い文字認識が可能となる。
【0131】また、請求項4によれば請求項1から請求
項3において、前記評価値は、前記差分値の絶対値と定
数倍値との各次元ごとの大小比較の結果、差分値の絶対
値が定数倍値より大きい次元数をカウントし、そのカウ
ント値を基に得るようにしている。このような評価値を
用いることにより空間分布の形状を考慮した文字認識を
高速、かつ、高精度に行うことができる。
【0132】また、請求項5によれば、前記評価値を用
いて、認識、再切り出し、棄却のいずれかを判断し、認
識の場合は未知入力の文字認識を行い、再切り出しの場
合は再度文字の切り出しを行い、棄却の場合は認識対象
外として棄却する処理を行うようにしている。本発明に
より求められる評価値は定量的な値でであり、この定量
的な評価値を用いることにより、従来のように、求めら
れた距離値と予め設定された距離値とを比較して棄却す
べきか否かを判断するというような相対的な評価で棄却
すべきか否かを判断する方法に比べて、より正確な棄却
判断をが行うことが可能となる。
【0133】また、請求項6によれば請求項5におい
て、前記未知入力ベクトルの全次元数のうち所定の次元
数をランダムに抽出して構成した未知入力部分ベクトル
を用いて、評価値をもとめるようにしたので、さらに計
算量を少なくすることができ、より高速な認識処理が可
能となる。
【0134】また、請求項7によれば請求項5におい
て、前記標準偏差値を定数倍するための定数を複数用意
して複数の定数倍値を設定し、この複数の定数倍値と前
記差分値とを大小比較するようにしたので、ベクトルの
次元数の少ないとき、あるいはサンプル数が少なく統計
的な判断が困難な場合に、より正確な評価値を計算する
ことができ、信頼性の高い文字認識が可能となる。
【0135】また、請求項8によれば請求項5から請求
項7において、前記評価値は、前記差分値の絶対値と定
数倍値との各次元ごとの大小比較の結果、差分値の絶対
値が定数倍値より大きい次元数をカウントし、そのカウ
ント値を基に得るようにしている。このような評価値を
用いることにより空間分布の形状を考慮した文字認識を
高速、かつ、高精度に行うことができる。
【0136】また、請求項9によれば、前記評価値と距
離値とから総合評価を行い総合評価値を出力して、この
総合評価値により未知入力の文字認識を行うようにした
ので、ノイズなどにも影響されにくく、しかも空間分布
の形状を考慮した文字認識を高速、かつ、高精度に行う
ことができる。
【0137】また、請求項10によれば請求項9におい
て、前記未知入力ベクトルの全次元数のうち所定の次元
数をランダムに抽出して構成した未知入力部分ベクトル
を用いて、評価値をもとめるようにしたので、さらに計
算量を少なくすることができ、より高速な認識処理が可
能となる。
【0138】また、請求項11によれば請求項9におい
て、前記標準偏差値を定数倍するための定数を複数用意
して複数の定数倍値を設定し、この複数の定数倍値と前
記差分値とを大小比較するようにしたので、ベクトルの
次元数の少ないとき、あるいはサンプル数が少なく統計
的な判断が困難な場合に、より正確な評価値を計算する
ことができ、信頼性の高い文字認識が可能となる。
【0139】また、請求項12によれば請求項9から請
求項11において、前記評価値は、前記差分値の絶対値
と定数倍値との各次元ごとの大小比較の結果、差分値の
絶対値が定数倍値より大きい次元数をカウントし、その
カウント値を基に得るようにしている。このような評価
値を用いることにより空間分布の形状を考慮した文字認
識を高速、かつ、高精度に行うことができる。
【0140】また、請求項13によれば、まず、辞書ベ
クトルの各次元ごとの辞書値との間の空間上の距離を計
算し、これによって求められた距離値から全カテゴリの
うち所定数の上位認識候補を選び出したのち、この選び
出された所定数の上位認識候補との間で評価値を求める
ようにしたので、評価値は全カテゴリについて求める必
要がなくなり、ノイズなどにも影響されにくいという効
果のほかに、処理工程を大幅に減らすことができさらに
高速化が図れる。
【0141】また、請求項14によれば請求項13にお
いて、前記未知入力ベクトルの全次元数のうち所定の次
元数をランダムに抽出して構成した未知入力部分ベクト
ルを用いて、評価値をもとめるようにしたので、さらに
計算量を少なくすることができ、より高速な認識処理が
可能となる。
【0142】また、請求項15によれば請求項13にお
いて、前記標準偏差値を定数倍するための定数を複数用
意して複数の定数倍値を設定し、この複数の定数倍値と
前記差分値とを大小比較するようにしたので、ベクトル
の次元数の少ないとき、あるいはサンプル数が少なく統
計的な判断が困難な場合に、より正確な評価値を計算す
ることができ、信頼性の高い文字認識が可能となる。
【0143】また、請求項16によれば請求項13から
請求項15において、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得るようにしている。このような評
価値を用いることにより空間分布の形状を考慮した文字
認識を高速、かつ、高精度に行うことができる。
【0144】また、本発明の文字認識装置は、まず、請
求項17によれば、未知入力ベクトルの各次元ごとの未
知入力値と各文字の全カテゴリ対応に設けられたそれぞ
れの辞書ベクトルの各次元ごとの辞書値との差分をとっ
て求めた各次元ごとの差分値の絶対値と、各文字の全カ
テゴリ対応に設けられたそれぞれの標準偏差ベクトルの
各次元ごとの標準偏差値を定数倍して求めた各次元ごと
の定数倍値とを、前記各次元ごとに、すべての次元に渡
って大小を比較し、その結果を評価値として求め、この
評価値に基づいて未知入力の文字認識を行うようにした
ので、空間分布の形状を考慮した文字の定量的な評価値
を、少ない計算量で高速に求めることができる。
【0145】また、請求求項18によれば請求項17に
おいて、前記未知入力ベクトルの全次元数のうち所定の
次元数をランダムに抽出して構成した未知入力部分ベク
トルを用いて、評価値をもとめるようにしたので、さら
に計算量を少なくすることができ、より高速な認識処理
が可能となる。
【0146】また、請求項19によれば請求項17にお
いて、前記標準偏差値を定数倍するための定数を複数用
意して複数の定数倍値を設定し、この複数の定数倍値と
前記差分値とを大小比較するようにしたので、ベクトル
の次元数の少ないとき、あるいはサンプル数が少なく統
計的な判断が困難な場合に、より正確な評価値を計算す
ることができ、信頼性の高い文字認識が可能となる。
【0147】また、請求項20によれば請求項17から
請求項19において、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得るようにしている。このような評
価値を用いることにより空間分布の形状を考慮した文字
認識を高速、かつ、高精度に行うことができる。
【0148】また、請求項21によれば、前記評価値を
用いて、認識、再切り出し、棄却のいずれかを判断し、
認識の場合は未知入力の文字認識を行い、再切り出しの
場合は再度文字の切り出しを行い、棄却の場合は認識対
象外として棄却する処理を行うようにしている。本発明
により求められる評価値は定量的な値でであり、この定
量的な評価値を用いることにより、従来のように、求め
られた距離値と予め設定された距離値とを比較して棄却
すべきか否かを判断するというような相対的な評価で棄
却すべきか否かを判断する方法に比べて、より正確な棄
却判断をが行うことが可能となる。
【0149】また、請求項22によれば請求項21にお
いて、前記未知入力ベクトルの全次元数のうち所定の次
元数をランダムに抽出して構成した未知入力部分ベクト
ルを用いて、評価値をもとめるようにしたので、さらに
計算量を少なくすることができ、より高速な認識処理が
可能となる。
【0150】また、請求項23によれば請求項21にお
いて、前記標準偏差値を定数倍するための定数を複数用
意して複数の定数倍値を設定し、この複数の定数倍値と
前記差分値とを大小比較するようにしたので、ベクトル
の次元数の少ないとき、あるいはサンプル数が少なく統
計的な判断が困難な場合に、より正確な評価値を計算す
ることができ、信頼性の高い文字認識が可能となる。
【0151】また、請求項24によれば請求項21から
請求項23において、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得るようにしている。このような評
価値を用いることにより空間分布の形状を考慮した文字
認識を高速、かつ、高精度に行うことができる。
【0152】また、請求項25によれば、前記評価値と
距離値とから総合評価を行い総合評価値を出力して、こ
の総合評価値により未知入力の文字認識を行うようにし
たので、ノイズなどにも影響されにくく、しかも空間分
布の形状を考慮した文字認識を高速、かつ、高精度に行
うことができる。
【0153】また、請求項26によれば請求項25にお
いて、前記未知入力ベクトルの全次元数のうち所定の次
元数をランダムに抽出して構成した未知入力部分ベクト
ルを用いて、評価値をもとめるようにしたので、さらに
計算量を少なくすることができ、より高速な認識処理が
可能となる。
【0154】また、請求項27によれば請求項25にお
いて、前記標準偏差値を定数倍するための定数を複数用
意して複数の定数倍値を設定し、この複数の定数倍値と
前記差分値とを大小比較するようにしたので、ベクトル
の次元数の少ないとき、あるいはサンプル数が少なく統
計的な判断が困難な場合に、より正確な評価値を計算す
ることができ、信頼性の高い文字認識が可能となる。
【0155】また、請求項28によれば請求項25から
請求項27において、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得るようにしている。このような評
価値を用いることにより空間分布の形状を考慮した文字
認識を高速、かつ、高精度に行うことができる。
【0156】また、請求項29によれば、まず、辞書ベ
クトルの各次元ごとの辞書ベクトル値との間の空間上の
距離を計算し、これによって求められた距離値から全カ
テゴリのうち所定数の上位認識候補を選び出したのち、
この選びだされた所定数の上位認識候補との間で評価値
を求めるようにしたので、評価値は全カテゴリについて
求める必要がなくなり、ノイズなどにも影響されにくい
という効果のほかに、処理工程を大幅に減らすことがで
きさらに高速化が図れる。
【0157】また、請求項30によれば請求項29にお
いて、前記未知入力ベクトルの全次元数のうち所定の次
元数をランダムに抽出して構成した未知入力部分ベクト
ルを用いて、評価値をもとめるようにしたので、さらに
計算量を少なくすることができ、より高速な認識処理が
可能となる。
【0158】また、請求項31によれば請求項29にお
いて、前記標準偏差値を定数倍するための定数を複数用
意して複数の定数倍値を設定し、この複数の定数倍値と
前記差分値とを大小比較するようにしたので、ベクトル
の次元数の少ないとき、あるいはサンプル数が少なく統
計的な判断が困難な場合に、より正確な評価値を計算す
ることができ、信頼性の高い文字認識が可能となる。
【0159】また、請求項32によれば請求項29から
請求項31において、前記評価値は、前記差分値の絶対
値と定数倍値との各次元ごとの大小比較の結果、差分値
の絶対値が定数倍値より大きい次元数をカウントし、そ
のカウント値を基に得るようにしている。このような評
価値を用いることにより空間分布の形状を考慮した文字
認識を高速、かつ、高精度に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施例1を説明する構成図。
【図2】本発明の実施例を説明するための正規分布曲線
を示す図。
【図3】本発明の実施例を説明するための二項分布曲線
を示す図。
【図4】実施例1の変形例(その1)を説明する構成
図。
【図5】実施例1の変形例(その2)を説明する構成
図。
【図6】本発明の実施例2を説明する構成図。
【図7】実施例2の処理手順を説明するフローチャー
ト。
【図8】実施例2の棄却処理の具体例を説明する図。
【図9】本発明の実施例3を説明する構成図。
【図10】実施例3の処理手順を説明するフローチャー
ト。
【図11】実施例3においてノイズを有する画像の一例
を示す図。
【図12】本発明の実施例4を説明する構成図。
【図13】実施例4の処理手順を説明するフローチャー
ト。
【図14】従来の円形分布における距離値計算方法を説
明する図。
【図15】従来の分布形状を考慮した距離値計算方法を
説明する図。
【符号の説明】
1・・・文字切り出し手段 10・・・特徴量抽出手段 20・・・評価値計算手段 21・・・差分値計算手段 22・・・大小比較手段 23・・・評価値出力手段 24・・・次元抽出手段 30・・・認識候補データ出力手段 31・・・候補文字指定手段 32・・・辞書ベクトル格納手段 33・・・標準偏差ベクトル格納手段 34・・・ベクトル定数倍手段 40・・・文字認識手段 50・・・棄却判断処理手段 60・・・距離値計算手段 70・・・総合評価手段 80・・・距離値データ処理手段

Claims (32)

    【特許請求の範囲】
  1. 【請求項1】 入力画像から文字画像の切り出しを行っ
    たのち、この切り出された文字の特徴量として未知入力
    ベクトルを出力し、 この未知入力ベクトルの各次元ごとの未知入力値と各文
    字のカテゴリ対応に求められた辞書ベクトルの各次元ご
    との辞書値との差分をとって求めた各次元ごとの差分値
    の絶対値と、各文字のカテゴリ対応に求められた標準偏
    差ベクトルの各次元ごとの標準偏差値を定数倍した各次
    元ごとの定数倍値とを、前記各次元ごとに、すべての次
    元に渡って大小を比較し、その結果を評価値として求
    め、この評価値に基づいて未知入力の文字認識を行うこ
    とを特徴とする文字認識方法。
  2. 【請求項2】 前記未知入力ベクトルの全次元数のうち
    所定の次元数をランダムに抽出して構成した未知入力部
    分ベクトルを出力し、 この未知入力部分ベクトルを構成する各次元ごとの未知
    入力値と、この未知入力値に対応した次元の辞書値との
    差分をとって求めた各次元ごとの差分値の絶対値と、前
    記未知入力値に対応した次元ごとの標準偏差値の定数倍
    値とを、前記それぞれ対応する次元ごとに大小比較し、
    その結果を評価値として求めることを特徴とする請求項
    1記載の文字認識方法。
  3. 【請求項3】 前記標準偏差値を定数倍するための定数
    を複数用意して複数の定数倍値を設定し、この複数の定
    数倍値と前記差分値とを大小比較するようにしたことを
    特徴とする請求項1記載の文字認識方法。
  4. 【請求項4】 前記評価値は、前記差分値の絶対値と定
    数倍値との各次元ごとの大小比較の結果、差分値の絶対
    値が定数倍値より大きい次元数をカウントし、そのカウ
    ント値を基に得ることを特徴とする請求項1、請求項2
    または請求項3記載の文字認識方法。
  5. 【請求項5】 入力画像から文字画像の切り出しを行っ
    たのち、この切り出された文字の特徴量として未知入力
    ベクトルを出力し、 この未知入力ベクトルの各次元ごとの未知入力値と各文
    字のカテゴリ対応に求められた辞書ベクトルの各次元ご
    との辞書値との差分をとって求めた各次元ごとの差分値
    の絶対値と、各文字のカテゴリ対応に求められた標準偏
    差ベクトルの各次元ごとの標準偏差値を定数倍して求め
    た各次元ごとの定数倍値とを、前記各次元ごとに、すべ
    ての次元に渡って大小比較し、その結果を評価値として
    求め、全カテゴリの評価値に基づいて、認識、再切り出
    し、棄却のいずれかを判断し、認識の場合は未知入力の
    文字認識を行い、再切り出しの場合は再度文字の切り出
    しを行い、棄却の場合は認識対象外として棄却すること
    を特徴とする文字認識方法。
  6. 【請求項6】 前記未知入力ベクトルの全次元数のうち
    所定の次元数をランダムに抽出して構成した未知入力部
    分ベクトルを出力し、 この未知入力部分ベクトルを構成する各次元ごとの未知
    入力値と、この未知入力値に対応した次元の辞書値との
    差分をとって求めた各次元ごとの差分値の絶対値と、前
    記未知入力値に対応した次元の標準偏差値の定数倍値と
    を、前記それぞれ対応する次元ごとに大小比較し、その
    結果を評価値として求めることを特徴とする請求項5記
    載の文字認識方法。
  7. 【請求項7】 前記標準偏差値を定数倍するための定数
    を複数用意して複数の定数倍値を設定し、この複数の定
    数倍値と前記差分値とを大小比較するようにしたことを
    特徴とする請求項5記載の文字認識方法。
  8. 【請求項8】 前記評価値は、前記差分値の絶対値と定
    数倍値との各次元ごとの大小比較の結果、差分値の絶対
    値が定数倍値より大きい次元数をカウントし、そのカウ
    ント値を基に得ることを特徴とする請求項5、請求項6
    または請求項7記載の文字認識方法。
  9. 【請求項9】 入力画像から文字画像の切り出しを行っ
    たのち、この切り出された文字の特徴量として未知入力
    ベクトルを出力し、 この未知入力ベクトルの各次元ごとの未知入力値と各文
    字のカテゴリ対応に求められた辞書ベクトルの各次元ご
    との辞書値との差分をとって求めた各次元ごとの差分値
    の絶対値と、各文字のカテゴリ対応に求められた標準偏
    差ベクトルの各次元ごとの標準偏差値を定数倍して求め
    た各次元ごとの定数倍値とを、前記各次元ごとに、すべ
    ての次元に渡って大小比較し、その結果を評価値として
    求めるとともに、前記未知入力ベクトルの各次元ごとの
    未知入力値と前記辞書ベクトルの各次元ごとの辞書値と
    の間の空間上の距離値を計算し、 前記求められた評価値と距離値とから総合評価を行い総
    合評価値を出力して、この総合評価値により未知入力の
    文字認識を行うことを特徴とする文字認識方法。
  10. 【請求項10】 前記未知入力ベクトルの全次元数のう
    ち所定の次元数をランダムに抽出して構成した未知入力
    部分ベクトルを出力し、 この未知入力部分ベクトルを構成する各次元ごとの未知
    入力値と、この未知入力値に対応した次元の辞書値との
    差分をとって求めた各次元ごとの差分値の絶対値と、前
    記未知入力値に対応した次元の標準偏差値の定数倍値と
    を、前記それぞれ対応する次元ごとに大小比較し、その
    結果を評価値として求めることを特徴とする請求項9記
    載の文字認識方法。
  11. 【請求項11】 前記標準偏差値を定数倍するための定
    数を複数用意し、複数の定数倍値を設定し、この複数の
    定数倍値と前記差分値とを大小比較するようにしたこと
    を特徴とする請求項9記載の文字認識方法。
  12. 【請求項12】 前記評価値は、前記差分値の絶対値と
    定数倍値との各次元ごとの大小比較の結果、差分値の絶
    対値が定数倍値より大きい次元数をカウントしてそのカ
    ウント値を基に得ることを特徴とする請求項9、請求項
    10または請求項11記載の文字認識方法。
  13. 【請求項13】 入力画像から文字画像の切り出しを行
    ったのち、この切り出された文字の特徴量として未知入
    力ベクトルを出力し、 前記未知入力ベクトルの各次元ごとの未知入力値と各文
    字の全カテゴリ対応に求められた辞書ベクトルの各次元
    ごとの辞書値との間の空間上の距離値を計算し、これに
    よって求められた距離値から全カテゴリのうち所定数の
    上位認識候補を選び出したのち、この選びだされた所定
    数の上位認識候補に対応する辞書ベクトルの各次元ごと
    の辞書値との差分をとって求めた各次元ごとの差分値の
    絶対値と、選びだされた所定数の上位認識候補に対応す
    る標準偏差ベクトルの各次元ごとの標準偏差値を定数倍
    して求めた各次元ごとの定数倍値とを、前記対応する次
    元ごとに大小を比較し、その結果を評価値として求め、 この評価値と、未知入力と前記選び出された所定数の上
    位認識候補との間の距離値とから総合評価を行い総合評
    価値を出力して、この総合評価値により未知入力の文字
    認識を行うことを特徴とする文字認識方法。
  14. 【請求項14】 前記未知入力ベクトルの全次元数のう
    ち所定の次元数をランダムに抽出して構成される未知入
    力部分ベクトルを出力し、 この未知入力部分ベクトルを構成する各次元ごとの未知
    入力値と、この未知入力値に対応した次元の辞書値との
    差分をとって求めた各次元ごとの差分値の絶対値と、前
    記未知入力値に対応した次元の標準偏差値の定数倍値と
    を、前記それぞれ対応する次元ごとに大小比較し、その
    結果を評価値として求めることを特徴とする請求項13
    記載の文字認識方法。
  15. 【請求項15】 前記標準偏差値を定数倍するための定
    数を複数用意して複数の定数倍値を設定し、この複数の
    定数倍値と前記差分値とを大小比較するようにしたこと
    を特徴とする請求項13記載の文字認識方法。
  16. 【請求項16】 前記評価値は、前記差分値の絶対値と
    定数倍値との各次元ごとの大小比較の結果、差分値の絶
    対値が定数倍値より大きい次元数をカウントし、そのカ
    ウント値を基に得ることを特徴とする請求項13、請求
    項14または請求項15記載の文字認識方法。
  17. 【請求項17】 入力画像から文字の切り出しを行う文
    字切り出し手段と、 この文字切り出し手段により切り出された文字の特徴量
    として未知入力ベクトルを出力する特徴量抽出手段と、 各文字のカテゴリ対応の辞書ベクトルを格納した辞書ベ
    クトル格納手段、各文字のカテゴリ対応の標準偏差ベク
    トルを格納した標準偏差ベクトル格納手段、これら辞書
    ベクトル格納手段および標準偏差ベクトル格納手段に対
    して各カテゴリに対応した辞書ベクトルおよび標準偏差
    ベクトルを読み出すための読出指定信号を出力する候補
    文字指定手段を有する認識候補データ出力手段と、 前記特徴量抽出手段からの未知入力ベクトルの各次元ご
    との未知入力値と前記辞書ベクトルの各次元ごとの辞書
    値との差分をとる差分値計算手段、この差分値と前記標
    準偏差ベクトルの各次元ごとの標準偏差値を定数倍して
    求めた各次元ごとの定数倍値とを各次元ごとにすべての
    次元に渡って大小を比較する大小比較手段、この大小比
    較手段からの比較結果をもとに評価値として出力する評
    価値出力手段を有する評価値計算手段と、 この評価値計算手段で求められた評価値に基づいて未知
    入力の文字認識を行う文字認識手段と、 を備えたことを特徴とする文字認識装置。
  18. 【請求項18】 前記特徴量抽出手段からの未知入力ベ
    クトルの全次元数のうち所定の次元数をランダムに抽出
    して構成される未知入力部分ベクトルを出力する次元抽
    出手段を設け、 この次元抽出手段から出力される未知入力部分ベクトル
    の各次元ごとの未知入力値と、この未知入力値に対応し
    た次元ごとの辞書値との差分をとって求めた各次元ごと
    の差分値と、前記未知入力値に対応した次元ごとの標準
    偏差値の定数倍値とを、前記それぞれ対応する次元ごと
    に大小を比較し、その結果を評価値として求めることを
    特徴とする請求項17記載の文字認識装置。
  19. 【請求項19】 前記標準偏差値を定数倍するための定
    数を複数用意して複数の定数倍値を設定し、この複数の
    定数倍値と前記差分値とを大小比較するようにしたこと
    を特徴とする請求項17記載の文字認識装置。
  20. 【請求項20】 前記評価値は、前記差分値の絶対値と
    定数倍値との各次元ごとの大小比較の結果、差分値の絶
    対値が定数倍値より大きい次元数をカウントし、そのカ
    ウント値を基に得ることを特徴とする請求項17、請求
    項18または請求項19記載の文字認識装置。
  21. 【請求項21】 入力画像から文字の切り出しを行う文
    字切り出し手段と、 この文字切り出し手段により切り出された文字の特徴量
    として未知入力ベクトルを出力する特徴量抽出手段と、 各文字のカテゴリ対応の辞書ベクトルを格納した辞書ベ
    クトル格納手段、各文字のカテゴリ対応の標準偏差ベク
    トルを格納した標準偏差ベクトル格納手段、これら辞書
    ベクトル格納手段および標準偏差ベクトル格納手段に対
    して各カテゴリに対応した辞書ベクトルおよび標準偏差
    ベクトルを読み出すための読出指定信号を出力する候補
    文字指定手段を有する認識候補データ出力手段と、 前記特徴量抽出手段からの未知入力ベクトルの各次元ご
    との未知入力値と前記辞書ベクトルの各次元ごとの辞書
    値との差分をとる差分値計算手段、この差分値と前記標
    準偏差ベクトルの各次元ごとの標準偏差値を定数倍して
    求めた各次元ごとの定数倍値とを各次元ごとにすべての
    次元に渡って大小を比較する大小比較手段、この大小比
    較手段からの比較結果をもとに評価値として出力する評
    価値出力手段を有する評価値計算手段と、 この評価値計算手段で求められた全カテゴリの評価値に
    基づいて、文字として認識、再切り出し、認識対象外と
    して棄却のいずれかの判断を行う棄却判断処理手段と、 この棄却判断処理手段からの文字認識要求により未知入
    力の文字認識を行う文字認識手段と、 を備えたことを特徴とする文字認識装置。
  22. 【請求項22】 前記特徴量抽出手段からの未知入力ベ
    クトルの全次元数のうち所定の次元数をランダムに抽出
    して構成される未知入力部分ベクトルを出力する次元抽
    出手段を設け、 この次元抽出手段から出力される未知入力部分ベクトル
    を構成する各次元ごとの未知入力値と、この未知入力値
    に対応した次元ごとの辞書値との差分をとって求めた各
    次元ごとの差分値と、前記未知入力値に対応した次元ご
    との標準偏差値の定数倍値とを、前記それぞれ対応する
    次元ごとに大小を比較し、その結果を評価値として求め
    ることを特徴とする請求項21記載の文字認識装置。
  23. 【請求項23】 前記標準偏差値を定数倍するための定
    数を複数用意して複数の定数倍値を設定し、この複数の
    定数倍値と前記差分値とを大小比較するようにしたこと
    を特徴とする請求項21記載の文字認識装置。
  24. 【請求項24】前記評価値は、前記差分値の絶対値と定
    数倍値との各次元ごとの大小比較の結果、差分値の絶対
    値が定数倍値より大きい次元数をカウントし、そのカウ
    ント値を基に得ることを特徴とする請求項21、請求項
    22または請求項23記載の文字認識装置。
  25. 【請求項25】 入力画像から文字の切り出しを行う文
    字切り出し手段と、 この文字切り出し手段により切り出された文字の特徴量
    として未知入力ベクトルを出力する特徴量抽出手段と、 各文字のカテゴリ対応の辞書ベクトルを格納した辞書ベ
    クトル格納手段、各文字のカテゴリ対応の標準偏差ベク
    トルを格納した標準偏差ベクトル格納手段、これら辞書
    ベクトル格納手段および標準偏差ベクトル格納手段に対
    して各カテゴリに対応した辞書ベクトルおよび標準偏差
    ベクトルを読み出すための読出指定信号を出力する候補
    文字指定手段を有する認識候補データ出力手段と、 前記特徴量抽出手段からの未知入力ベクトルの各次元ご
    との未知入力値と前記辞書ベクトルの各次元ごとの辞書
    値との差分をとる差分値計算手段、この差分値と前記標
    準偏差ベクトルの各次元ごとの標準偏差値を定数倍して
    求めた各次元ごとの定数倍値とを各次元ごとにすべての
    次元に渡って大小を比較する大小比較手段、この大小比
    較手段からの比較結果をもとに評価値として出力する評
    価値出力手段を有する評価値計算手段と、 前記特徴量抽出手段からの未知入力ベクトルの各次元ご
    との未知入力値と前記辞書ベクトルの各次元ごとの辞書
    値との間の空間上の距離を計算する距離計算手段と、 この距離計算手段によって求められた距離値と前記評価
    値計算手段によって求められた評価値とから総合評価を
    行い総合評価値を出力する総合評価手段と、 この総合評価手段からの総合評価値により未知入力の文
    字認識を行う文字認識手段と、 を備えたことを特徴とする文字認識装置。
  26. 【請求項26】 前記特徴量抽出手段からの未知入力ベ
    クトルの全次元数のうち所定の次元数をランダムに抽出
    して構成される未知入力部分ベクトルを出力する次元抽
    出手段を設け、 この次元抽出手段から出力される未知入力部分ベクトル
    を構成する各次元ごとの未知入力値と、この未知入力値
    に対応した次元ごとの辞書値との差分をとって求めた各
    次元ごとの差分値と、前記未知入力値に対応した次元ご
    との標準偏差値の定数倍値とを、前記それぞれ対応する
    次元ごとに大小を比較し、その結果を評価値として求め
    ることを特徴とする請求項25記載の文字認識装置。
  27. 【請求項27】 前記標準偏差値を定数倍するための定
    数を複数用意して複数の定数倍値を設定し、この複数の
    定数倍値と前記差分値とを大小比較するようにしたこと
    を特徴とする請求項25記載の文字認識装置。
  28. 【請求項28】 前記評価値は、前記差分値の絶対値と
    定数倍値との各次元ごとの大小比較の結果、差分値の絶
    対値が定数倍値より大きい次元数をカウントし、そのカ
    ウント値を基に得ることを特徴とする請求項25、請求
    項26または請求項27記載の文字認識装置。
  29. 【請求項29】 入力画像から文字の切り出しを行う文
    字切り出し手段と、 この文字切り出し手段により切り出された文字の特徴量
    として未知入力ベクトルを出力する特徴量抽出手段と、 各文字のカテゴリ対応の辞書ベクトルを格納した辞書ベ
    クトル格納手段、各文字のカテゴリ対応の標準偏差ベク
    トルを格納した標準偏差ベクトル格納手段、これら辞書
    ベクトル格納手段および標準偏差ベクトル格納手段に対
    して各カテゴリに対応した辞書ベクトルおよび標準偏差
    ベクトルを読み出すための読出指定信号を出力する候補
    文字指定手段を有する認識候補データ出力手段と、 前記特徴量抽出手段からの未知入力ベクトルの各次元ご
    との未知入力値と前記辞書ベクトルの各次元ごとの辞書
    値との差分をとる差分値計算手段、この差分値と前記標
    準偏差ベクトルの各次元ごとの標準偏差値を定数倍して
    求めた各次元ごとの定数倍値とを各次元ごとにすべての
    次元に渡って大小を比較する大小比較手段、この大小比
    較手段からの比較結果をもとに評価値として出力する評
    価値出力手段を有する評価値計算手段と、 前記特徴量抽出手段からの未知入力ベクトルの各次元ご
    との未知入力値と前記辞書ベクトルの各次元ごとの辞書
    値との間の空間上の距離を計算する距離計算手段と、 この距離計算手段によって求められた距離値から全カテ
    ゴリのうち所定数の上位認識候補を選び出し、前記距離
    計算手段にて計算された所定数の上位認識候補との間の
    距離値を出力するとともに、前記認識候補データ出力手
    段に対して上位認識候補指定信号を出力する評価値デー
    タ処理手段と、 この評価値データ処理手段から出力される所定数の上位
    認識候補との間の距離値と前記評価値計算手段によって
    求められた評価値とから総合評価を行い総合評価値を出
    力する総合評価手段と、 この総合評価手段からの総合評価値により未知入力の文
    字認識を行う文字認識手段と、 を備え、前記認識候補データ出力手段は、前記評価値デ
    ータ処理手段からの上位認識候補指定信号を受けてそれ
    に対応する辞書ベクトルおよび標準偏差ベクトルを前記
    評価値計算手段に出力し、評価値計算手段は前記所定数
    の上位認識候補と未知入力との間の評価値を計算するよ
    うにしたことを特徴とする文字認識装置。
  30. 【請求項30】 前記特徴量抽出手段からの未知入力ベ
    クトルの全次元数のうち所定の次元数をランダムに抽出
    して構成された未知入力部分ベクトルを出力する次元抽
    出手段を設け、 この次元抽出手段から出力される未知入力部分ベクトル
    を構成する各次元ごとの未知入力値と、この未知入力値
    に対応した次元ごとの辞書値との差分をとって求めた各
    次元ごとの差分値と、前記未知入力値に対応した次元ご
    との標準偏差値の定数倍値とを、前記それぞれ対応する
    次元ごとに大小を比較し、その結果を評価値として求め
    ることを特徴とする請求項29記載の文字認識装置。
  31. 【請求項31】 前記標準偏差値を定数倍するための定
    数を複数用意して複数の定数倍値を設定し、この複数の
    定数倍値と前記差分値とを大小比較するようにしたこと
    を特徴とする請求項29記載の文字認識装置。
  32. 【請求項32】 前記評価値は、前記差分値の絶対値と
    定数倍値との各次元ごとの大小比較の結果、差分値の絶
    対値が定数倍値より大きい次元数をカウントし、そのカ
    ウント値を基に得ることを特徴とする請求項29、請求
    項30または請求項31記載の文字認識装置。
JP6275388A 1994-11-09 1994-11-09 文字認識方法および文字認識装置 Pending JPH08137997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6275388A JPH08137997A (ja) 1994-11-09 1994-11-09 文字認識方法および文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6275388A JPH08137997A (ja) 1994-11-09 1994-11-09 文字認識方法および文字認識装置

Publications (1)

Publication Number Publication Date
JPH08137997A true JPH08137997A (ja) 1996-05-31

Family

ID=17554805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6275388A Pending JPH08137997A (ja) 1994-11-09 1994-11-09 文字認識方法および文字認識装置

Country Status (1)

Country Link
JP (1) JPH08137997A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276937A (ja) * 2008-05-13 2009-11-26 Fujitsu Ltd 辞書作成装置、認識装置、認識方法及び認識プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276937A (ja) * 2008-05-13 2009-11-26 Fujitsu Ltd 辞書作成装置、認識装置、認識方法及び認識プログラム
US8379983B2 (en) 2008-05-13 2013-02-19 Fujitsu Limited Dictionary creating apparatus, recognizing apparatus, and recognizing method

Similar Documents

Publication Publication Date Title
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
US11132576B2 (en) Text recognition method and apparatus, electronic device, and storage medium
CN110928992B (zh) 文本搜索方法、装置、服务器及存储介质
CN107909119B (zh) 集合间相似度的确定方法和装置
CN107292302B (zh) 检测图片中兴趣点的方法和系统
CN111881289B (zh) 分类模型的训练方法、数据风险类别的检测方法及装置
CN111221960A (zh) 文本检测方法、相似度计算方法、模型训练方法及装置
JPH09507721A (ja) 文字認識機構
JPH08137997A (ja) 文字認識方法および文字認識装置
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JP2556477B2 (ja) パタン照合装置
CN113516165B (zh) 一种基于图像金字塔匹配后验的客户满意度判别方法
JP3487400B2 (ja) 文字認識装置、文字認識方法、及び、記憶媒体
JP3421200B2 (ja) 文字認識方法および装置
JP2002183667A (ja) 文字認識装置及び記録媒体
CN115189922B (zh) 风险识别方法及装置和电子设备
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3466903B2 (ja) 文字認識用マルチテンプレート辞書作成方法
JP2923295B2 (ja) パターン同定処理方式
CN113344109A (zh) 一种图像分类网络性能评估方法及装置
JP3079202B2 (ja) 文字認識方法及び文字認識装置
JP4666875B2 (ja) 単語照合方法及び文字認識装置
JP2001243425A (ja) オンライン文字認識装置およびオンライン文字認識方法
JP2000090203A (ja) 文字認識方法及びその装置
CN115828137A (zh) 一种处理训练数据的方法、存储介质以及电子设备