JP3110478B2 - パターン認識方法および装置 - Google Patents

パターン認識方法および装置

Info

Publication number
JP3110478B2
JP3110478B2 JP03061842A JP6184291A JP3110478B2 JP 3110478 B2 JP3110478 B2 JP 3110478B2 JP 03061842 A JP03061842 A JP 03061842A JP 6184291 A JP6184291 A JP 6184291A JP 3110478 B2 JP3110478 B2 JP 3110478B2
Authority
JP
Japan
Prior art keywords
standard
pattern
data
standard pattern
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03061842A
Other languages
English (en)
Other versions
JPH04295893A (ja
Inventor
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP03061842A priority Critical patent/JP3110478B2/ja
Publication of JPH04295893A publication Critical patent/JPH04295893A/ja
Application granted granted Critical
Publication of JP3110478B2 publication Critical patent/JP3110478B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、標準パターンを用いて
データの認識を行なうパターン認識方法および装置に係
り、特に、各カテゴリごとに複数個の標準パターンを用
意してデータの識別を行なうパターン認識方法および装
置に関する。
【0002】
【発明の概要】本発明は、各カテゴリごとに複数個ずつ
用意した標準パターンを用いてデータの認識を行なうパ
ターン認識のための標準パターン構成法および装置に関
するもので、与えられた学習データ全体を標準パターン
を用いて認識した時の誤認識の程度を当該標準パターン
の関数として構成した上、この関数を最小化する最適標
準パターンを求めることにより、従来から用いられてい
る標準パターンの学習法を用いて標準パターンを構成し
て認識を行なう場合よりも高い識別性能を提供するパタ
ーン認識方法および装置である。
【0003】
【従来の技術】各カテゴリごとに複数個の標準パターン
を用意してデータの識別を行なうパターン認識方式のた
めの標準パターン構成法として、例えば、T.Koho
nen“Self Organization and
Associative Memory”に示されて
いるLVQ(Learning Vector Qua
ntization)があり、その改良版であるLVQ
2は広く用いられているる。LVQ2は、学習データを
用いて繰返し標準パターンを修正していく方法で、t回
目の学習ステップについて考えると、先ず1つの学習デ
ータ(xで表わす)を選んだ上、xに最も近い標準パタ
ーン(mi (t)で表わす)がxとは異なるカテゴリに
属し、かつxに2番目に近い標準パターン(mj (t)
で表わす)がxと同じカテゴリに属する場合において、
x,mi (t),mj (t)の位置関係がある条件(x
がmi (t)とmj (t)によって決まる「窓」の中に
入る)を満たす場合に次のような「学習」を行なう方法
である: (1)mi をxから遠ざけるように修正する; mi (t+1)=mi (t)−α(t)(x−m
i(t)) (2)mj をxに近づけるよう修正する; mj (t+1)=mj (t)+α(t)(x−m
j(t)) (3)mi ,mj 以外の標準パターンは修正しない; mk (t+1)=mk (t), k≠i,j 上式において、α(t)は、初期値が0≦α(0)≦1
を満たすtの単調減少関数で、繰返しの最終段階におい
て0となるように設定される。LVQ2ではこのような
学習の繰返し数と、α(t)を適当に設計してやれば、
学習データに対して誤認識数を少なくするような標準パ
ターンの組が得られることが知られている。
【0004】
【発明が解決しようとする課題】LVQ2が標準パター
ンの構成に有効であることは広く知られているが、LV
Q2には「学習データに対する誤認識数の減少のみを目
的としているため、特に学習データ数が少ない場合に
は、未知データに対し高い識別能力を得ることが難し
い。」という問題点がある。
【0005】そこで本発明の目的は、誤認識数の概念を
拡張して誤認識の程度を表わす関数を定義した上、この
関数を学習データに対し最小化することによって、少な
い学習データからでも精度良く最適標準パターンを構成
し、この最適標準パターンを用いてデータの識別を行な
うという枠組みの中で、従来法に比べ未知データに対し
て高い識別能力を持つパターン認識方法および装置を提
供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
本発明は、各カテゴリごとに複数個ずつ用意された標準
パターンを用いてデータの認識を行なうパターン認識方
法において、与えられた学習データを標準パターンを用
いて認識した時の誤認識の程度を前記学習データと前記
標準パターンとの間の距離の関数として構成し、該標準
パターンの集合にランダムな摂動を与えて新たな標準パ
ターン集合を生成し、この新たな標準パターン集合に最
適化手法を適用して前記関数を最小化する最適標準パタ
ーンを求め、当該最適標準パターンを用いてデータの認
識を行なうことを特徴とする。また本発明は、各カテゴ
リごとに複数個ずつ用意された標準パターンを用いてデ
ータの認識を行なうパターン認識装置において、与えら
れた学習データを標準パターンを用いて認識した時の誤
認識の程度を前記学習データと前記標準パターンとの間
の距離の関数として構成する手段と、該標準パターンの
集合にランダムな摂動を与えて新たな標準パターン集合
を生成する手段と、生成されたこの新たな標準パターン
集合に最適化手法を適用して前記構成された関数を最小
化する最適標準パターンを求める手段と、前記求められ
た最適標準パターンを用いてデータの認識を行なう手段
とを具えたことを特徴とする。
【0007】
【作用】本発明によれば与えられた学習データ全体を標
準パターンを用いて認識した時の誤認識の程度を当該標
準パターンの関数として構成し、この関数を最小化する
最適標準パターンを求め、この最適標準パターンを用い
てデータ認識を行なうことによって、高い識別性能が得
られる。
【0008】
【実施例】以下、実施例に基づいて本発明を詳細に説明
する。
【0009】先ず、次のように記法を定める。
【0010】 Rp :p次元ユークリッド空間 K:認識すべきパターンのカテゴリ数 Ni :カテゴリiに対する学習データの数 (i=1,…,K) Mi :カテゴリiに対する標準パターンの数 (i=1,…,K) xij:学習データ(xij ∈Rp ) (i=1,…,K、j=1,…,Ni ) tir:カテゴリiに対するr番目の標準パターン (tir ∈Rp ) (i=1,…,K、r=1,…,Mi ) E:標準パターンの組{tir}を用いて全学習データ
{xij}を識別した時の誤認識の程度を表わす関数 L,m:繰り返しの回数 本発明は、上記のEを最小にする標準パターンの組{t
ir}を構成することを特徴とする方式である。Eを最小
化する方法として、組合せ最適化問題を解く方法の1つ
であるアニーリング法(simulated anne
aling)を用いた場合の、本発明の実施例のフロー
チャートを、図1から図3までに示した。図示した各ブ
ロックにおける実行内容は次の通りである。
【0011】B2:クラスタリング等の方法を用いて、
学習データの集合{xij}から、各カテゴリごとに予め
決められた数の標準パターンを作成した後、得られた標
準パターンの組{tir}を出力する。本実施例では、L
BGクラスタリングアルゴリズムを用いて初期標準パタ
ーンを作成した。
【0012】B4:集合{tir}を標準パターンとし
て、学習データの集合{xij}を認識した時の誤認識の
程度を表わす関数Eを計算する。誤認識された学習デー
タの個数でEを定義しても良いが、本実施例では、次の
ようにしてEを計算した。先ず、ある学習データxij
対して次の2つの距離d1 、d2 を定義する。
【0013】
【数1】
【0014】
【数2】 d2(xij,{tir}) =min(d(xij,tur)) u=1,k(u≠i) r=1,Mu ここにdは2つのパターン間のユークリッド距離を表わ
す。この時、λを
【0015】
【数3】 で定義する。明らかに、0≦λ≦1。このλと、
パラメータκ(0<κ<0.5)に対して関数μ
(xij,{tir})を定義する。具体的には、λ<0.
5−κの場合にはμ=0、0.5−κ≦λ<0.5+κ
に対して μ=(λ+κ−0.5)/2κ 0.5+κ≦λに対してμ=1とする。標準パターンを
用いる識別の場合には、λ<0.5なら正しく識別さ
れ、λ≧0.5ならば誤って識別される。従って、λ≧
0.5に対して1、それ以外のλに対して0となる関数
μ′を考えると、μ′は誤認識かどうかを0と1で表現
する。上式のμは、このμ′にパラメータκを導入した
ものであり、誤認識の程度を表わす関数となっている。
関数Eを
【0016】
【数4】 で定義する。明らかにEは標準パターンの組{t
ir}の関数であり、標準パターンとして{tir}を選ん
で学習データ全体を識別したときの誤認識の程度を表わ
す。本実施例では、κ=0.1と設定した。
【0017】B6:変数nに0を代入する。
【0018】B8:変数iに0を代入する。
【0019】B10:2つの誤認識の程度EとE* を比
較する。
【0020】B12:B10でE<E* のときに実行す
るブロックであって、標準パターンの集合{tir}の全
要素を集合{tir * }の要素とし、Eの値をE* に代入
する操作を行なう。
【0021】B14:B10でE<E* でないときにお
よびB12の次に実行するブロックであって、アニーリ
ング法におけるパラメータの1つである「温度」Tn
設定する。
【0022】B16:学習データの集合{xij}から、
なんらかの方法で1つの要素xijを選択する。本実施例
では、集合{xij}からランダムに1つの学習データx
ijを選択した。
【0023】B18:標準パターンの集合{tij}か
ら、なんらかの方法で1つの要素turを選択する。本実
施例では、集合{tij}からランダムに1つの標準パタ
ーンturを選択した。
【0024】B20:標準パターンの集合{tir}に摂
動を与え、新たな標準パターン集合{tir′}を出力す
る。摂動は、次式によって与える。
【0025】 tur′=tur+ν・θ・(xij−tur), tik′=tik; i≠μ,k≠r. ここに、θは区間[−1.0,1.0]上の一様乱数、
νは0≦ν≦1を満たすパラメータで、本実施例では
0.02と設定した。
【0026】B4:前記同様に、集合{tir′}を標準
パターンとして、学習データの集合{xij}を認識した
時の誤認識の程度を表わす関数E′を計算する。
【0027】B22:区間[0,1)の間で一様分布す
る乱数ωを発生する。
【0028】B24:E′−Eが負であるか、あるいは
B22で発生されたωがexp(−(E′−E)/T
n )未満であるかどうかを判定する。
【0029】B26:B24の判定がYesのときに実
行するブロックであって、標準パターンの集合
{tir′}の全要素を集合{tir}の要素とし、E′の
値をEに代入する操作を行なう。
【0030】B28:B24の判定がNoのとき、およ
びB26の次に実行するブロックであって、iの値を1
だけ増加させる。
【0031】B30:iが予め判定された値mより大き
いかどうかを判定する。判定がNoのときはB10にす
すむ。
【0032】B32:B30で判定がYesのときに実
行するブロックであって、nの値を1だけ増加させる。
【0033】B34:nが予め設定された値Lより大き
いかどうかを判定する。判定がNoのときはB8にすす
む。
【0034】B36:B34で判定がYesのときに実
行するブロックであって、B10と同様。
【0035】B12:前記B12と同様 B38:集合{tir * }を最終的な標準パターンの集合
とする。
【0036】以上に示した実施例では、アニーリング法
を用いた場合について述べてきたが、例えば、B24の
判断条件をE′−E<0のみにすると最急降下法を用い
る場合に対応する。従って、本発明は、アニーリング法
を用いる場合に限らず、他の最適化手法を用いる場合に
も常に適応し得ることは勿論である。
【0037】以上に述べた通り、少ない学習データから
認識精度の高い標準パターンを構成することができるの
で、標準パターンを用いるパターン認識の問題であれ
ば、認識能力の向上を図るために本方法を適応すること
ができる。
【0038】ついで音声認識において、標準パターンを
用いて母音を認識する装置に本発明を適応した場合につ
いて述べる図4は、本発明を実施したパターン認識装置
の機能構成を示すブロック図であり、その詳細は以下の
通りである。
【0039】1:入力された音声情報を標本化する標本
化手段。
【0040】2:標本化された音声データに基づいて短
い時間区間ごとにLPCケプストラム係数を計算するL
PCケプストラム分析手段。
【0041】3:手段2からの音声データの中から母音
中心部分のLPCケプストラム係数を切り出す母音デー
タ切り出し手段。
【0042】4:手段3からのデータを学習データと
し、標準パターンを構成する標準パターン学習手段であ
って、CPUと、前記のB2〜B38に示す各ブロック
をCPUに実行させるためのプログラムを格納したRO
Mと、ワークエリアを有するRAMとを具えている。
【0043】5:手段4により得られた標準パターンを
記憶した記憶手段。
【0044】6:手段5の標準パターンの集合と手段3
からの入力音声母音データとを照合し、入力データと標
準パターンとの距離を計算する照合手段。
【0045】7:手段6からの計算結果に基づいて入力
と最も距離が近かった標準パターンに対応する母音カテ
ゴリを判定し、認識結果として出力する判定手段。
【0046】上記装置を用いて母音を認識した結果につ
いて述べる。母音として撥音を含む6母音/a/,/i
/,/u/,/e/,/o/,/N/を想定し、これら
6つの各カテゴリごとに複数個の標準パターンを用意し
て母音認識を行なう場合について検討した。但し各カテ
ゴリごとの標準パターン数は同数とした。検討に当って
はATRデータベースの中の話者MAUが文節単位に発
声した音声データを、標本化周波数15kHzで標本化
し(手段1)、18次のLPCケプストラム分析を行な
った後(手段2)、母音中心3フレームを平均して母音
データを作成した。母音中心部は同データベースに付与
された母音中心のラベルに基づいて定めた。このような
データを、各カテゴリごとに350個ずつ作成し、これ
らを50個ずつに分割(7分割)して、データセットA
〜Gを作成した。また、各カテゴリごとに175個ずつ
に分割(2分割)して、データセット1,2を作成した
(手段3)。
【0047】学習データ数の少ない場合として、データ
セットA〜Gを用いて手段4,5,6,7によって実験
を行なった。先ず、データセットAを用いて標準パター
ンを構成し、データセットA以外のデータ(未知デー
タ)の認識を行なった。さらに、データセットA以外の
データを用いて学習を行なう場合についても同様の認識
を行なった。これらの7通りの結果を平均して最終的な
認識結果とした。また、学習データが比較的多い場合と
して、データセット1,2を用いて上記と同様な実験を
行なった。なお、本発明を用いるに当っては、繰返し回
数をL=5000、m=10と設定した。
【0048】従来の代表的な標準パターン学習アルゴリ
ズムであるLVQ2アルゴリズムを用いる場合について
も同様の認識実験を行なった。先ず、全学習データをラ
ンダムに並べかえたものを10通り作成し、これらの中
から順に学習データを選択してLVQ2により標準パタ
ーンの修正を行なった。その際、α(0)=0.015
と設定し、標準パターン修正の条件を決める窓には、2
0%窓を用いた。これらはLVQ2の提案者T.Koh
onenが推奨する値である。初期標準パターンは、本
発明と同じくLBGクラスタリングアルゴリズムで与え
た。
【0049】実験の結果を図5,図6に表で示す。図5
は学習データ数が比較的多い場合、図6は学習データ数
の少ない場合である。図5,図6の縦軸は誤認識率、横
軸は各カテゴリごとの標準パターン数を示す。また、参
考のため、図5,図6にLBGアルゴリズムで得られた
標準パターン(すなわち、本発明およびLVQ2の初期
標準パターン)を用いた場合についての結果も示した。
図5に示されているように学習データ数が比較的多い場
合には、本発明、LVQ2とも初期状態を与えたLBG
アルゴリズムより誤認識率が少なくなっており、学習が
良好に行なわれいることが分る。しかも本発明の方が良
好な結果となっている。学習データ数が少ない場合(図
6)には、LVQ2の結果はLBGアルゴリズムと余り
変わらず、従ってLVQ2学習の効果がほとんど表われ
ていない。一方、本発明を用いた場合には概ね良好な結
果が得られている。
【0050】
【発明の効果】以上説明したように、本発明によれば、
従来法に見られた学習データ数が少ない場合に学習効果
が現われないという欠点を改善することができ、しかも
学習データをある程度増やした場合でも従来法を上回る
高い識別性能を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施例の動作を示すフローチャートの
一部である。
【図2】同フローチャートの他の一部である。
【図3】同フローチャートの残りの一部である。
【図4】本発明実施例にかかるパターン認識装置の機能
構成を示すブロック図である。
【図5】本発明の実施例における実験結果の一例を示す
図である。
【図6】同実験結果の他の例を示す図である。
【符号の説明】
1 標本化手段 2 LPCケプストラム分析手段 3 母音データ切り出し手段 4 標準パターン学習手段 5 記憶手段 6 照合手段 7 判定手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 9/18 E (56)参考文献 特開 昭63−213898(JP,A) 特開 平3−176781(JP,A) 特開 昭61−99195(JP,A) 特開 平4−205389(JP,A) 特開 昭62−14700(JP,A) 特開 平2−136899(JP,A) 特開 昭59−17598(JP,A) 特開 昭59−17597(JP,A) 特開 昭57−191698(JP,A) 特開 平1−154098(JP,A) 特開 昭63−32597(JP,A) 特公 平7−52354(JP,B2) 特公 平4−45839(JP,B2) 特公 平4−22520(JP,B2) 特公 平3−44356(JP,B2) 特許2543584(JP,B2) Proceeding of 1988 IEEE International Conference on Neu ral Networks,Vol. 1,T.Kohonen et a l,”Statistical Pat tern Recognition w ith Neural Network s:Benchmarking Stu dies”,p.I−61〜I−68,Sa n Diego,Calfornia, July 24−27,1988 電子情報通信学会論文誌Vol.J76 −A no.4「誤認識関数を最小化す る標準パターン学習アルゴリズム」p p.580−588 1993年4月 (58)調査した分野(Int.Cl.7,DB名) G10L 15/06 G10L 15/02 G10L 101:10 IEEE/IEE Electroni c Library Online

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 各カテゴリごとに複数個ずつ用意された
    標準パターンを用いてデータの認識を行なうパターン認
    識方法において、与えられた学習データを標準パターン
    を用いて認識した時の誤認識の程度を前記学習データと
    前記標準パターンとの間の距離の関数として構成し、
    標準パターンの集合にランダムな摂動を与えて新たな標
    準パターン集合を生成し、この新たな標準パターン集合
    に最適化手法を適用して前記関数を最小化する最適標準
    パターンを求め、当該最適標準パターンを用いてデータ
    の認識を行なうことを特徴とするパターン認識方法。
  2. 【請求項2】 各カテゴリごとに複数個ずつ用意された
    標準パターンを用いてデータの認識を行なうパターン認
    識装置において、与えられた学習データを標準パターン
    を用いて認識した時の誤認識の程度を前記学習データと
    前記標準パターンとの間の距離の関数として構成する手
    段と、該標準パターンの集合にランダムな摂動を与えて
    新たな標準パターン集合を生成する手段と、生成された
    この新たな標準パターン集合に最適化手法を適用して
    記構成された関数を最小化する最適標準パターンを求め
    る手段と、前記求められた最適標準パターンを用いてデ
    ータの認識を行なう手段とを具えたことを特徴とするパ
    ターン認識装置。
JP03061842A 1991-03-26 1991-03-26 パターン認識方法および装置 Expired - Fee Related JP3110478B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03061842A JP3110478B2 (ja) 1991-03-26 1991-03-26 パターン認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03061842A JP3110478B2 (ja) 1991-03-26 1991-03-26 パターン認識方法および装置

Publications (2)

Publication Number Publication Date
JPH04295893A JPH04295893A (ja) 1992-10-20
JP3110478B2 true JP3110478B2 (ja) 2000-11-20

Family

ID=13182750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03061842A Expired - Fee Related JP3110478B2 (ja) 1991-03-26 1991-03-26 パターン認識方法および装置

Country Status (1)

Country Link
JP (1) JP3110478B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4631076B2 (ja) * 2004-11-01 2011-02-16 株式会社国際電気通信基礎技術研究所 音素単位セットを最適化する方法及びシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2543584B2 (ja) 1988-09-09 1996-10-16 沖電気工業株式会社 音声標準パタン登録方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2543584B2 (ja) 1988-09-09 1996-10-16 沖電気工業株式会社 音声標準パタン登録方式

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Proceeding of 1988 IEEE International Conference on Neural Networks,Vol.1,T.Kohonen et al,"Statistical Pattern Recognition with Neural Networks:Benchmarking Studies",p.I−61〜I−68,San Diego,Calfornia,July 24−27,1988
電子情報通信学会論文誌Vol.J76−A no.4「誤認識関数を最小化する標準パターン学習アルゴリズム」pp.580−588 1993年4月

Also Published As

Publication number Publication date
JPH04295893A (ja) 1992-10-20

Similar Documents

Publication Publication Date Title
EP0314908B1 (en) Automatic determination of labels and markov word models in a speech recognition system
US6922669B2 (en) Knowledge-based strategies applied to N-best lists in automatic speech recognition systems
Najkar et al. A novel approach to HMM-based speech recognition systems using particle swarm optimization
JPH01102599A (ja) 音声認識方法
JPH07104952B2 (ja) パターンマッチング装置
Maghsoodi et al. Speaker recognition with random digit strings using uncertainty normalized HMM-based i-vectors
JP3311460B2 (ja) 音声認識装置
JP3110478B2 (ja) パターン認識方法および装置
CN114530142A (zh) 基于随机森林的信息推荐方法、装置、设备及存储介质
Khasawneh et al. The application of polynomial discriminant function classifiers to isolated Arabic speech recognition
JP2923243B2 (ja) 音声認識のための単語モデル生成装置及び音声認識装置
JP3090204B2 (ja) 音声モデル学習装置及び音声認識装置
JP3007357B2 (ja) 音声認識装置の辞書更新方式
EP0190489B1 (en) Speaker-independent speech recognition method and system
JPS6147999A (ja) 音声認識装置
JP3291073B2 (ja) 音声認識方式
JP2000122693A (ja) 話者認識方法および話者認識装置
JPH0424700A (ja) 子音セグメンテーション法
JPS59212900A (ja) 音声認識装置
JPH05197397A (ja) 音声認識方法及びその装置
JPH0465399B2 (ja)
JPS5946696A (ja) 音声認識方式
Li et al. Effect of reference set selection on speaker dependent speech recognition
Yu et al. A probability decision criterion for speech recognition
JPH01285996A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees