JPH1139432A - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置

Info

Publication number
JPH1139432A
JPH1139432A JP9190801A JP19080197A JPH1139432A JP H1139432 A JPH1139432 A JP H1139432A JP 9190801 A JP9190801 A JP 9190801A JP 19080197 A JP19080197 A JP 19080197A JP H1139432 A JPH1139432 A JP H1139432A
Authority
JP
Japan
Prior art keywords
category
regression function
function
pattern
regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9190801A
Other languages
English (en)
Inventor
Hiroyuki Mizutani
博之 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9190801A priority Critical patent/JPH1139432A/ja
Publication of JPH1139432A publication Critical patent/JPH1139432A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】本発明は、従来の多峰性の分布形状をもつ複雑
な密度関数を用いた場合に伴う演算量の増加を抑えると
ともに、次元圧縮の際にパターン分布の高次元性の為に
生じる適切なモデル当てはめの困難さを解消し、学習サ
ンプルに対してクラスタ解析等のアドホックな処理を行
わなくても、分布に応じた識別境界を自動的に決定する
ことを目的とする。 【解決手段】本発明は、予め与えられた文字パターンの
サンプルの集合から各カテゴリごとに確率密度関数を推
定し、推定された前記確率密度関数を用い、前記文字パ
ターンの属する各カテゴリを示す代表ベクトル値により
構成された回帰関数を求め、求められた前記回帰関数の
パラメータを近似した回帰関数値を求め、求められた回
帰関数値の分布に応じてカテゴリの識別境界を設定し、
設定された前記識別境界をもとに、入力された文字パタ
ーンのカテゴリの識別を行なうことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字パターンの分
布に応じた識別境界を自動的に決定する文字認識方法及
び装置に関する。
【0002】
【従来の技術】文献「パターン認識:森健一監修、電子
情報通信学会、1993年」によると、ベイズ識別で代
表される統計的決定理論を用いた文字認識では、原文字
パターンから特徴抽出を経て変換された特徴パターンが
構成するパターン空間において、パターンベクトルの確
率密度関数(分布密度)が知られれば未知文字パターン
の類別を行なうことが出来る。従来の統計的決定理論で
は、確率密度関数として正規分布を仮定することが多か
った。
【0003】しかしながら、この確率密度関数は特徴抽
出に応じて変化すると考えるのが自然であり、必ずしも
正規分布が適切な分布であるとは考えにくい。この視点
にたち、多峰性の分布を学習サンプルから推定してパタ
ーン認識を行なう手法が提案されているが、この手法で
は一般にパラメータ数が多くなり、認識率の割には認識
に関わる演算量が多くなり、実用的なシステムには不向
きであるという問題があった。
【0004】また、部分空間法で代表されるように、学
習サンプルに対して主成分分析により次元圧縮を行う手
法は、パターン空間におけるパターンベクトルの分布に
対して超平面を当てはめるものであるが、一般には分布
の形状に応じて適切な当てはめモデルを導入した方がよ
り次元圧縮の効果が期待される。
【0005】従って当てはめモデルを導入して適切な次
元圧縮を行おうとするには、用いる特徴に応じて事前に
パターン空間におけるパターンベクトルの分布を調べる
必要がある。しかしながらパターン空間は一般に高次元
空間であるため、分布の形状を調査することは大変難し
いという問題があった。
【0006】一方、パターン空間において学習サンプル
からカテゴリの境界を表す識別関数を求め、これを元に
未知パターンの類別を行なう手法がある。この手法で
は、識別関数として線形関数あるいは区分的線形関数や
非線形関数を用いているが、これら識別関数の決定はあ
らかじめ学習サンプルをクラスタ解析することにより、
予め幾つかの部分群に分けるなどの操作を必要とするこ
とが多く、関数を決定することに対してアドホックなア
ルゴリズムを導入することが多く、処理が煩雑になると
ともに、得られた識別関数の最適性について議論するこ
とは難しかった。
【0007】
【発明が解決しようとする課題】そこで本発明は、従来
の多峰性の分布形状をもつ複雑な密度関数を用いた場合
に伴う演算量の増加を抑えるとともに、次元圧縮の際パ
ターン分布の高次元性の為に生じる適切なモデル当ては
めの困難さを解消し、学習サンプルに対してクラスタ解
析等の処理を行わなくても、分布に応じた識別境界を自
動的に決定することを目的とする。
【0008】
【課題を解決するための手段】本発明は、予め与えられ
た文字パターンのサンプルの集合の各カテゴリごとに確
率密度関数を推定し、推定された前記確率密度関数を用
い、前記文字パターンの属する各カテゴリを示す代表ベ
クトル値により構成された回帰関数を求め、求められた
前記回帰関数のパラメータを近似した回帰関数値を求
め、求められた回帰関数値の分布に応じてカテゴリの識
別境界を設定し、設定された前記識別境界をもとに、入
力された文字パターンのカテゴリの識別を行なうことを
特徴とするものである。
【0009】
【発明の実施の形態】本発明は、離散的に与えられた文
字のサンプル集合からカテゴリ毎に少なくとも1つの連
続な確率密度関数を推定し、従来の回帰分析で必要だっ
た当てはめモデルを用いることなく、推定された密度関
数を用いるだけで、各カテゴリを指し示すよう付加され
た代表ベクトル値を回帰する回帰関数を求める。
【0010】また、この回帰関数を少数パラメータで近
似することにより、認識処理に係わる演算量を軽減させ
るとともに、クラスタ解析等の処理を行うこと無しに、
学習サンプルに対する回帰関数値と代表ベクトルとの2
乗誤差を最小化させる自動学習により分布の形状に応じ
た識別境界を構成する。
【0011】そして認識は、近似された回帰関数の未知
パターンに対するベクトル関数値を計算し、各成分値の
最大値をとる成分と1対1に対応したカテゴリへ未知パ
ターンの類別を行なうものである。以下、図面をもとに
本願発明を説明する。
【0012】図1は、文字認識装置の全体構成図であ
る。前処理手段1は、スキャナーやタブレット等の入力
手段から入力された文字データの文字区切りやノイズ消
去、文字の大きさの正規化等を行う。
【0013】認識手段2は、前処理手段1において処理
された文字列を、文字認識辞書4をもとにマッチング処
理を行い認識する。次に、後処理手段3は、認識手段2
において認識された文字列を、単語認識辞書5をもとに
認識単語を導き出し出力する。ここで、文字認識辞書4
と単語認識辞書5を1つの辞書として構成しても良い。
【0014】本発明は、認識手段2における認識処理の
一部であり、図2に示したように4段階の手順からな
る。また認識に用いられる認識辞書は図3に示したよう
に4段回の手順を経て作成される。はじめに認識辞書作
成手順を説明する。
【0015】確率変数{x、y}と確率密度ρ{x、
y}が与えられた時、yを回帰するxに対する回帰関数
f(x)は一般回帰によると次式で求まる。(ここで、
x,y,fはベクトル値である。)
【0016】
【数1】
【0017】今、サンプルパターン数をN,このうちi
番目のパターンをxi(ベクトル値)とし、このパター
ンの属するカテゴリを指標する指標ベクトルをyiと書
く。以下では、密度関数ρの具体例として、多次元正規
分布から構成される混合分布を用いるが、一般的には
[数1]の右辺の各積分が存在し、かつ右辺が有限とな
る如何なる密度関数ρを用いてもよい。混合分布を用い
た場合、密度関数ρは
【0018】
【数2】 である。ここでG(x,Σ)は平均が0、共分散行列を
Σとした多次元正規分布である。[数1]に[数2]を
代入すると、具体的に近似した回帰関数として
【0019】
【数3】 が得られる。
【0020】次に、回帰関数fをm組のパラメータ{α
i,βi,Σi}(iは1,,,m)を用いて近似する
(ここで、α,βはベクトル値)。これらm組のパラメ
ータ{αi,βi,Σi}のうち、αを第1のパラメー
タ、βを第2のパラメータ、Σを第3のパラメータとす
る。
【0021】本実施例では、[数3]で表されたfを直
接関数近似するのではなく、サンプルデータと近似され
た回帰関数f*との2乗誤差を最小にするパラメータの
組を求めることで近似を行なう。また、m組のパラメー
タ{αi,βi,Σi}の内、簡単のためにΣ1=Σ2
=・・・=Σm=Σとし、Σの値は予め設定されている
ものとする。この場合、近似される回帰関数f*はm組
のパラメータ{αi,βi}(iは1,,,m)を有す
る。この場合、サンプルデータと近似関数との2乗誤差
Eは、
【0022】
【数4】 となる。そして、変分法によりE({αi,βi})を
最小にするパラメータの組は次式の連立方程式を満足す
る。
【0023】
【数5】
【0024】これらm組の連立方程式を各パラメータに
関して解けば2乗誤差を最小にする意味で最適なパラメ
ータが求まる。しかしこれらの連立方程式式は、一般に
は非線形連立方程式となり解析解を求めることは難し
い。
【0025】また、各パラメータの次元が大きい場合、
数値的に連立方程式を解くことも困難である。ここでは
一例として最急降下法による数値解法を示す。最急降下
法では学習の進行の具合を調整する任意の正実数εを導
入して、次式のようにパラメータを逐次更新する。
【0026】
【数6】
【0027】
【数7】 [数6]と[数7]でf*を具体的に書き下すと、学習
アルゴリズムは次のようになる。
【0028】
【数8】
【0029】
【数9】 である。ここで、
【0030】
【数10】 および<,>はベクトルの内積を表す。
【0031】学習はパラメータの初期値を適切に設定し
た後、上の更新規則で各パラメータを更新し、[数4]
で計算されるEの減少率がある一定の閾値を割った時点
で終了させればよい。
【0032】学習時のパラメータ初期値設定に関して
は、最適化問題が非線形最適化の場合は最適化アルゴリ
ズムによっては学習の効率化や解の最適性に影響するこ
とが知られており重要である。本実施例では一例とし
て、サンプルデータの重心を出発点とした代表パターン
選出する手順を示す。この処理は各カテゴリごとに独立
に行なう。
【0033】まず、サンプルパターンから重心を求め
る。次に、サンプルパターンから各重心から最も近い代
表パターンを選出する。次に、各サンプルパターンと代
表パターンのユークリッド距離を計算し、ユークリッド
距離を合計し記憶する。次に、合計されたユークリッド
距離が最大となるサンプルパターンを代表パターンとす
る。そして、必要な代表パターン数が得られれば、これ
らを{αi}の初期値として登録し終了する。そうでな
ければ3に戻る。
【0034】以上の手法以外に、例えばファジークラス
タリングやk-meanクラスタリング等の手法によりサンプ
ルデータから各カテゴリを代表する代表パターンを選出
し、{αi}の初期値としてもよい。
【0035】認識用辞書には、{αi,βi,Σi}を
登録する。本実施例ではΣを共分散行列としたが、パラ
メータ数を減らす目的で、例えば、単位行列Iおよび正
実数σを用いて、
【0036】
【数11】 と表されるΣを用いることも出来る。また、指標べクト
ルの各成分とカテゴリを1対1に対応させ、対応した成
分の値を1、それ以外の成分を0と設定すると、{β
i}を上記学習アルゴリズムで学習しなくてもよい。
【0037】次に認識手順について説明する。まず、認
識辞書から{αi,βi,Σi}を読み込み、回帰関数
を[数3]の形式で再構成する。すなわち、未知のパタ
ーンをxとして、
【0038】
【数12】 となる。
【0039】今、カテゴリ数をnとしたとき、未知のパ
ターンをxに対する回帰関数f(x)のうち、i番目の
カテゴリciに対する成分をfciと書く。このときカ
テゴリへ類別はC(・)を類別演算として
【0040】
【数13】 である。
【0041】そしてこの場合、回帰関数の各成分の値は
未知パターンxが各カテゴリに属する確率を表すことを
次に示す。ここで、n個のカテゴリのうち、i番目のカ
テゴリciに対する確率密度関数をρciと書くと、回
帰関数fの各成分fciは次式で表現される。
【0042】
【数14】
【0043】この式からfci(x)の値は、あるxに
おける全カテゴリの確率密度に対するciカテゴリの確
率密度の比を表している。従ってこの密度比の大きさ
は、xにおける識別結果の信頼度(統計的な確からし
さ)を表している。従って、この値を用いて識別結果を
棄却するリジェクト処理が容易に行える。
【0044】リジェクト処理としては、例えばある一定
の閾値を設け、この閾値よりも信頼度が低ければ識別結
果を棄却すればよい。図4は類別すべきカテゴリが3つ
ある場合の識別関数を説明する概念図である。この図で
はパターン空間は2次元であり、3つの大きな黒点は3
つのパラメータαを表している。また、fA,fB,f
Cは回帰関数の各成分を表している。すなわち、
【0045】
【数15】 である。この時、識別境界は
【0046】
【数16】 を満足する。図中、太い実線で識別境界を示した。細い
実線および破線は等高線を表す。
【0047】さて、[数14]を用いて[数16]に対
応する方程式を導き、確率密度関数として等方的で均一
な正規分布を仮定すると、識別境界上の関数値は3直線
の交点では1/3であり、交点から離れるにしたがって
次第に1/2に近付くことが示される。
【0048】また、境界から離れた位置では距離が遠ざ
かるに従い各成分の値は1に漸近することが示される。
この例の場合リジェクト処理としては、例えば回帰関数
値の最大成分値が0.6未満の場合は識別結果を棄却す
ればよい。
【0049】別なリジェクト処理例として、回帰関数値
の最大成分値だけではなく、最大成分値を含む複数の成
分値を用いることも出来る。例えば最大成分値と第二最
大成分値とからなる2次元ベクトルを構成し、これに対
して予め2次元の棄却領域を設け、この2次元ベクトル
が棄却領域内の値を取った場合は棄却するといった処理
を行なうことが考えられる。
【0050】また、本願発明の別の実施形態として、予
め与えられた文字パターンのサンプルの集合の各カテゴ
リごとに確率密度関数を推定し、推定された前記確率密
度関数を用い、前記文字パターンの属する各カテゴリを
示す代表ベクトル値により構成された回帰関数を求め、
求められた前記回帰関数のパラメータを近似した回帰関
数値を求め、求められた回帰関数値の分布に応じてカテ
ゴリの識別境界を設定し、設定された前記識別境界をも
とに、入力された文字パターンのカテゴリの識別を行な
う手順で実現されるプログラムをコンピュータで読み込
み可能なフロッピィディスクやCD−ROMなどの記録
媒体として実施することも可能である。
【0051】
【発明の効果】以上説明したように本発明によれば、当
てはめモデルを用いることなく学習サンプルから推定さ
れた密度関数に基づいて識別関数を構成し、この識別関
数を適切なパラメータ数で近似することにより、認識に
係わる演算量を軽減させると共に分布に応じた識別境界
を自動学習により構成することができるものである。さ
らに、識別結果に対する統計的な信頼度を表すように回
帰関数を構成することが容易であり、これに伴い識別結
果を棄却するリジェクト処理が容易になる。
【図面の簡単な説明】
【図1】本願発明の一実施形態に関わる文字認識装置の
全体構成を示す図である。
【図2】本願発明の一実施形態に関わる文字認識装置の
認識手順を示す図である。
【図3】本願発明の一実施形態に関わる文字認識装置の
認識辞書を作成する手順を示す図である。
【図4】本願発明の一実施形態に関わる類別すべきカテ
ゴリが3つある場合の識別関数を説明する図である。
【符合の説明】
1 前処理手段、 2 認識手段、 3 後処理手段、
4 文字認識辞書 5 単語認識辞書

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】予め与えられた文字パターンのサンプルの
    集合の各カテゴリごとに確率密度関数を推定し、 推定された前記確率密度関数を用い、前記文字パターン
    の属する各カテゴリを示す代表ベクトル値により構成さ
    れた回帰関数を求め、 求められた前記回帰関数のパラメータを近似した回帰関
    数値を求め、 求められた回帰関数値の分布に応じてカテゴリの識別境
    界を設定し、 設定された前記識別境界をもとに、入力された文字パタ
    ーンのカテゴリの識別を行なうことを特徴とする文字認
    識方法。
  2. 【請求項2】予め与えられた文字パターンのサンプルの
    集合の各カテゴリごとに確率密度関数を推定する密度関
    数推定手段と、 この密度関数推定手段によって推定された前記確率密度
    関数を用い、前記文字パターンの属する各カテゴリを示
    す代表ベクトル値により構成された回帰関数を求める回
    帰関数算出手段と、 この回帰関数算出手段によって求められた前記回帰関数
    のパラメータを近似した回帰関数値を求める回帰関数値
    算出手段と、 この回帰関数値算出手段によって求められた回帰関数値
    の分布に応じてカテゴリの識別境界を設定する設定手段
    と、 この設定手段によって設定された前記識別境界をもと
    に、入力された文字パターンのカテゴリの識別を行なう
    識別手段とを有することを特徴とする文字認識装置。
JP9190801A 1997-07-16 1997-07-16 文字認識方法及び装置 Pending JPH1139432A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9190801A JPH1139432A (ja) 1997-07-16 1997-07-16 文字認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9190801A JPH1139432A (ja) 1997-07-16 1997-07-16 文字認識方法及び装置

Publications (1)

Publication Number Publication Date
JPH1139432A true JPH1139432A (ja) 1999-02-12

Family

ID=16263978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9190801A Pending JPH1139432A (ja) 1997-07-16 1997-07-16 文字認識方法及び装置

Country Status (1)

Country Link
JP (1) JPH1139432A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003164B2 (en) 2001-01-31 2006-02-21 Fujitsu Limited Pattern recognition apparatus and method using probability density function

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003164B2 (en) 2001-01-31 2006-02-21 Fujitsu Limited Pattern recognition apparatus and method using probability density function
CN100416589C (zh) * 2001-01-31 2008-09-03 富士通株式会社 采用概率密度函数的模式识别装置及其方法

Similar Documents

Publication Publication Date Title
CN110070141B (zh) 一种网络入侵检测方法
CN106951825B (zh) 一种人脸图像质量评估系统以及实现方法
US9910829B2 (en) Automatic document separation
Senior A combination fingerprint classifier
US6026397A (en) Data analysis system and method
US7447338B2 (en) Method and system for face detection using pattern classifier
CN112464638B (zh) 一种基于改进谱聚类算法的文本聚类方法
JP7414901B2 (ja) 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
Badawi et al. A hybrid memetic algorithm (genetic algorithm and great deluge local search) with back-propagation classifier for fish recognition
CN110069630B (zh) 一种改进的互信息特征选择方法
JP2002304626A (ja) データ分類装置および物体認識装置
WO2021189830A1 (zh) 样本数据优化方法、装置、设备及存储介质
CN112069307B (zh) 一种法律法条引用信息抽取系统
CN111401440B (zh) 目标分类识别方法、装置、计算机设备及存储介质
CN113762005A (zh) 特征选择模型的训练、对象分类方法、装置、设备及介质
CN115019305B (zh) 一种根尖细胞的识别方法、装置、设备及可读存储介质
CN114782761B (zh) 基于深度学习的智能仓储物料识别方法和系统
CN113920573B (zh) 基于对抗学习的人脸变化解耦的亲属关系验证方法
JPH1139432A (ja) 文字認識方法及び装置
Gorokhovatskiy et al. Vector Quantization, Learning and Recognition in the Space of Descriptors of Structural Features of Images
CN110942089B (zh) 一种基于多级决策的击键识别方法
CN112183336A (zh) 表情识别模型训练方法、装置、终端设备及存储介质
JPH0638276B2 (ja) パターン識別装置
Pemmaraju et al. Identification of noise outliers in clustering by a fuzzy neural network
CN110390309B (zh) 一种基于残差分布的手指静脉非法用户识别方法