JP3044741B2

JP3044741B2 - 標準パターン学習方法

Info

Publication number: JP3044741B2
Application number: JP2104030A
Authority: JP
Inventors: 浩一篠田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-04-19
Filing date: 1990-04-19
Publication date: 2000-05-22
Anticipated expiration: 2015-05-22
Also published as: JPH043098A

Description

【発明の詳細な説明】（産業上の利用分野）本発明は標準パターンとのパターンマッチングに基づ
くパターン認識に用いられ、少量の学習用発声データか
ら標準パターンを学習する音声認識などにおける標準パ
ターン学習方法に関する。

（従来の技術）現在、音声認識手法として隠れマルコフモデル（Hidd
en Markov Model、以下HMMとする）が広く使われてい
る。HMMの詳細については、例えば「確率モデルによる
音声認識」中川聖一著、1988年、電子情報通信学会（以
下文献１とする）に詳しく解説されている。HMMでは、
いくつかの状態を用意し、その状態と、各々の状態の遷
移確率、および各々の状態でのシンボルの出現確率を標
準パターンとして蓄える。入力パターンと標準パターン
との整合性を表す尤度値は、標準パターンであるHMMが
入力パターンのシンボル列を生成する確率で与えられ
る。

このHMMを用いる手法においては、各状態間の遷移確
率および各状態でのシンボルの出現確率を、学習用デー
タから推測する学習アルゴリズム（バウム−ウェルチの
アルゴリズム）が存在する。HMMを用いる音声認識にお
いては、話者が予め発声した学習用データを用いて、こ
の学習アルゴリズムにより標準パターンを作成する。

このHMMを用いる音声認識では、高い認識率を得るた
めには多くの学習用データで学習することが必要であ
り、話者の発声の負担が大きくなる。この話者の負担を
軽減するために、少ない学習用データを用いて、予め登
録されている標準話者の標準パターンを未知話者に適応
させる話者適応化方式がこれまでにいくつか考案されて
きた。話者適応化方式の詳細については「音声認識にお
ける話者適応化技術」、古井貞煕著、テレビジョン学会
誌、Vol.43、NO.9、1989、pp.929-934（以下文献２とす
る）に解説されている。

音声認識における話者適応化方式には、例えば「マル
チテンプレートと話者適応化による音声認識」、古井貞
煕、日本音響学会平成元年度春季研究発表会講演論文
集、第２巻、6-10号にあげられているようなベクトル量
子化を用いたものがある。この話者適応化方式は予め登
録されている符号帳と新しい話者の符号帳の要素間の対
応関係（マッピング）を学習用データを用いて求め、話
者に適応した符号帳に置き換えている。

また、ベクトル量子化を用いない話者適応化方式であ
って、対応する学習用データが存在しない標準パターン
をも適応化する重回帰解析を用いる話者適応化方式が、
アイ・イー・イー・イートランザクションズオン
アコースティクス、スピーチ、アンドシグナルプロ
セシング（IEEE Transactions on Acoustics,Speech,an
d Signal Processing）、S.Furui、アメリカ合衆国、第
28巻、第２号、129ページ、（以下文献３とする）の中
に「A Training Procedure for Isolated Word Recog
nition Systems」と題して示されている。この話者適応
化方式では、予め多数の話者の標準パターンの発声デー
タを用いて標準パターン間の対応関係を求めておき、こ
の対応関係を用いて学習データが存在しない標準パター
ンを適応化している。

（発明が解決しようとする課題）ベクトル量子化を用いた話者適応化では、ベクトル量
子化に付随する量子化誤差が存在するため高い認識性能
が得にくいという欠点がある。

また、ベクトル量子化を用いない音声認識における話
者適応化方式としては文献３にあげた方法があるが、こ
の方法には、標準パターン間の対応関係を求める際に多
くの話者の大量の発声データが必要になるという欠点が
ある。

そこで本発明の目的は、予め多くの話者による多量の
発声データを用意することなく、高精度な話者適応化方
式を実現するための標準パターン学習方法を提供するこ
とにある。

（課題を解決するための手段）本発明に係る第１の標準パターン学習方法は、出力確
率密度分布関数をガウス分布とした連続HMMである、標
準パターンとのパターンマッチングに基づくパターン認
識に用いられ、複数の学習用データを用いて標準パター
ンを修正することにより各カテゴリの標準パターンを特
徴づける新しい連続HMMにおける平均ベクトルμの集合
である、第１のパラメータ集合を決定する標準パターン
学習方法であって、前記第１のパラメータ集合と学習用
データ（ｗ＝1,2,…,W）を表す第２のパラメータ集合と
の間の整合性を表す第１の評価関数L1と、前記連続HMM
における適応化後の平均ベクトルと平均ベクトルの初期
値との差分ベクトル間である、第１のパラメータ集合内
の各第１のパラメータの修正量間の距離に関する関数V1
を平均ベクトル間の距離を変数とした単調減少な関数ρ
の出力値である、第１のパラメータ間の整合性を表す値
により重みづけたものの和からなる第２の評価関数L2と
の２つの評価関数からつくられる評価関数の値を最適に
するように前記第１のパラメータ集合を決定することを
特徴とする。

本発明に係る第２の標準パターン学習方法は、前述し
た第１の標準パターン学習方法であって、前記第２の評
価関数L2は、第１のパラメータ集合内の各第１パラメー
タの修正量間の内積に関する関数V2を第１のパラメータ
集合間の整合性を表す値により重みづけたものの和から
なる評価関数であることを特徴とする。

本発明に係る第３の標準パターン学習方法は、請求項
１に記載の標準パターン学習方法であって、前記第２の
評価関数L2は、前記第１のパラメータ集合内の各第１パ
ラメータの修正量間の距離に関する関数V1の和からなる
評価関数であることを特徴とする。

本発明に係る第４の標準パターン学習方法は、請求項
１に記載の標準パターン学習方法であって、前記第２の
評価関数L2は、前記第１のパラメータ集合内の各第１パ
ラメータの修正量間の内積に関する関数V2の和からなる
評価関数であることを特徴とする。

（作用）以下に本発明に係る第１の標準パターン学習方法の作
用について説明する。ここでは文献１の69ページの（3.
3.2）節にあげてあるようなHMMを具体例としてあげ、こ
れに従って説明する。以下の説明での用語の記号、意味
は文献１と同一である。HMMとしては状態のベクトル出
力確率密度分布関数を単一ガウス分布関数としたものを
考える。標準パターンを特徴づけるパラメータとして
は、HMMの各状態s_i（ｉ＝１…N:Nは状態の総数）のガウ
ス分布の平均ベクトルμ_ｉ、ガウス分布の分散▲σ
² _i▼、各状態s_i,s_j間の遷移確率a_ijがある。

それぞれの平均ベクトル（μ_ｉ）の話者適応後と話者
適応前の差のパラメータ（これを適応化ベクトルζ_ｉと
名付ける）を定義する。すなわち、話者適応後の平均ベ
クトルを、話者適応前の平均ベクトルμ_１と適応化ベクトルζ
_１との和のベクトルで表す。

学習用データの数をＷとし、１つ１つの学習用データ
をｗ（ｗ＝1,…,W）で表す。それぞれのｗは、ｗ＝▲O
^(w) ₁▼，…，▲O^(w) _T▼と表される。ここに、▲O^(w) _t▼
（ｔ＝1,…,T）は学習用データｗの第ｔ番目のフレーム
の特徴ベクトルである。

この学習用データを用いて適応化する場合、次のよう
な評価関数Ｌを考え、この値が最大になるように適応化
ベクトルζ_１を選ぶ。

式（１）の第１項(L₁)は各HMMの標準パターンが学習
用データｗを発声する確率Ｐの対数値（尤度）の総和で
ある。この第１項は学習用データに対する尤度を大きく
するように適応化ベクトル｛ζ｝を選ぶ項である。この
第１項は標準パターンのうち、対応する学習用データが
存在するものに対してのみ有効にはたらく。

また、第２項(L₂)は各標準パターンの特徴ベクトル間
の距離による重みづけの項（ρ）と、適応化ベクトル間
の類似度に関する項（Ｖ）とからなる。ここでλは予め
定められた定数である。R_ijは特徴ベクトルμ_ｉ，μ_ｊ
間の物理的距離を表す項であり、ρはR_ijに関する単調
減少関数である。Ｖ（ζ_ｉ，ζ_ｉ）は適応化ベクトル、
ζ_ｉ，ζ_ｊ間の類似度を表す。この第２項は学習用デー
タに含まれない標準パターンにも標準パターン間の距離
に応じて話者適応の効果が及ぶようにした項である。す
なわち、距離の近い標準パターンの適応化ベクトル同士
が同じ向き、同じ大きさに近づけば近づくほどL₂の値は
大きくなる。これにより、学習用データが存在しない標
準パターンに対しても学習することが可能になる。

以下に、最急降下法に基づき評価関数を極大化する手
順を説明する。L₂における距離R_ijを以下のように定義
する。

ここで、▲σ² _i,k▼（ｋ＝1,…,M;Mは次元数）は状態ｉ
のガウス分布の第ｋパラメータの分散である。

ポテンシャルρはR_ijに対して単調減少な関数であ
り、様々な形の関数を用いることができる。例えば、 ρ(R_ij)＝exp(-c₁R_ij) …（４）というような指数関数があげられる。ここで、C₁は適当
な定数である。

次のように適応化ベクトル間の距離r_ijを定義する。

そして、Ｖは、適応化ベクトル間の距離r_ijのみの関数
とし、r_ijについて単調減少な関数V₁をとる。これもρ
と同様、様々な形のものが考えられる。例えば、Ｖ（ζ_ｉ，ζ_ｊ）＝V₁(r_ij) ＝exp(-c₂r_ij) …（６）という形があげられる。ここで、c₂は適当な定数であ
る。また、式（６）の代わりに次式、という形も考えられる（c₃は適当な定数）。

以下、最急降下法を行うために、評価関数Ｌのζ_ｉに
よる導関数∂L/∂ζ_ｉを求める。まず、第１項L₁は、となる。確率Ｐは次のように表せる。

ここで、α_ｔ（ｉ）はｔフレーム目の状態ｉでの前向き
確率、β_t+1（ｊ）は（ｔ＋１）フレーム目の状態ｊで
の後向き確率、b_j(O_t+1)は状態ｊにおいて（ｔ＋１）フ
レーム目の学習用データのベクトル▲O^(w) _t+1▼が出現
する確率（出現確率）である。（ここでは文献１での出
現確率b_ij(O)は遷移元の状態ｉにのみ依存するものとし
ている。すなわち、b_ij(O)＝b_i(O)，（ｊ＝1,…,
N）。）また、これ以後▲O^(w) _t▼の（ｗ）の添え字は省
略する。式（９）をζ_ｉで微分すると、となる。式（９）、（10）を式（８）に代入すると、となる。＜＞_BWはバウム・ウェルチのアルゴリズムにお
ける期待値を表す。

次に、第２項L₂は、となる。結局、式（11），（14）より、となる。以上により、∂L/∂ζ_ｉが求められた。

いま、ζをδζだけ変化させると、となるように、δζ_ｉを決めれば、Ｌを増加させること
ができる。そして、次にζ_ｉをζ_ｉ＋δζ_ｉに置き換え
て、再度上の式（15），（16），（17）の計算を実行す
る。この手続きを繰り返すことにより、Ｌを極大値に収
束させることができる。

以上が本発明に係る第１の標準パターン学習方法に関
する説明である。この発明においては、式（14）を見る
とわかるように、適応化ベクトルζ_ｊ，ζ_ｉの差のベク
トルにかかっている係数の値がζ_ｉ，ζ_ｊ間の距離の値
r_ijの単調減少関数である。従って、適応化ベクトル間
の向きと大きさが同じであるほど係数の値が大きくな
り、∂L₂／∂ζ_ｉへの寄与が大きくなる。つまり、ζ_ｉ
の変化量は適応化ベクトルの空間において距離の近い適
応化ベクトルの影響を強く受ける。また、（ζ_ｊ−
ζ_ｉ）の係数は、それぞれの対応する平均ベクトル
μ_ｉ，μ_ｊ間の距離R_ijの単調減少関数でもある。従っ
て、対応する平均ベクトル同士の距離が近いほど、係数
の値が大きくなり、∂L₂／∂ζ_ｉへの寄与が大きくな
る。つまり、ζ_ｉの変化量は平均ベクトルの空間におい
て平均ベクトル同士の距離が近い適応化ベクトルの影響
を強く受ける。以上から本発明の第１の標準パターン学
習方法においては、適応化ベクトル、平均ベクトルそれ
ぞれの空間の局所的な構造に対応して、適応化ベクトル
が定まることがわかる。

本発明に係る第２の標準パターン学習方法ではＶとし
て、式（６），（７）のように適応化ベクトル間の距離
の関数を用いる代わりに、次のように適応化ベクトル間
の内積の関数を用いる。

このとき、このV₂（ζ_ｉ，ζ_ｊ）を式（13）に代入する
ことにより∂L₂／∂ζ_ｉがもとまり、となる。このようにＶとして適応化ベクトル間の内積を
とると、式（６）におけるc₁のような距離のスケールを
表す定数がなくなる。

この本発明の第２の標準パターン学習方法において
は、適応化ベクトルζ_１，ζ_ｊの差のベクトル（ζ_ｊ−
ζ_ｉ）にかかっている係数は適応ベクトル間の距離r_ij
の関数ではない。すなわち、適応化ベクトル間の向き、
大きさが全く違っていても、∂L₂／∂ζ_ｉへの寄与の程
度は変わらない。つまり、ζ_ｉの変化量は適応化ベクト
ルの空間において全体の適応化ベクトルからの影響を均
一に受ける。以上から本発明の第２の標準パターン学習
方法においては、適応化ベクトルの空間の全体的な構
造、平均ベクトルの空間の局所的な構造に対応して、適
応化ベクトルが定まることがわかる。

なお、式（19）を式（14）の代わりに用いることによ
り、第１の標準パターン学習方法と同様に最急降下法で
評価関数を極大化することができる。

本発明に係る第３の標準パターン学習方法では、第１
の標準パターン学習方法における関数ρを定数（ρ＝
１）とする。すなわち、となる。この第３の標準パターン学習方法では適応化ベ
クトルζ_ｊ，ζ_ｉの差のベクトル（ζ_ｊ−ζ_ｉ）に係る
係数は、値がζ_ｉ，ζ_ｊ間の距離の値r_ijの単調減少関
数である。従って、適応化ベクトルの向き、大きさが同
じであるほど、係数の値が大きくなり∂L₂／∂ζ_ｉへの
寄与が大きくなる。つまり、ζ_ｉの変化量は適応化ベク
トルの空間において距離の近い適応化ベクトルの影響を
強く受ける。また、（ζ_ｊ−ζ_ｉ）に係る係数は、それ
ぞれの対応する平均ベクトルμ_ｉ，μ_ｊ間の距離R_ijに
は関係なく定まる。従って、対応する平均ベクトル同士
の距離に関係なく、∂L₂／∂ζ_ｉへの寄与が定まる。つ
まり、ζ_ｉの変化量は平均ベクトルの空間において全体
から均一に、対応する適応化ベクトルの影響を強く受け
る。以上からこの第３の標準パターン学習方法において
は、適応化ベクトルの空間における局所的な構造と、平
均ベクトルの空間の全体的な構造に対応して、適応化ベ
クトルが定まることがわかる。

本発明に係る第４の標準パターン学習方法では、第２
の標準パターン学習方法における関数ρを定数としてい
る。すなわち、L₂は、となる。この場合、となる。この第４の標準パターン学習方法においては適
応化ベクトルζ_ｊ，ζ_ｉの差のベクトル（ζ_ｊ−ζ_ｉ）
には定数がかかっているのみであり、適応化ベクトルの
変化量は適応化ベクトル間の距離によらない。すなわ
ち、適応化ベクトル間の向き、大きさが全く違っていて
も、∂L₂／∂ζ_ｉへの寄与の程度は変わらない。つま
り、ζ_ｉの変化量は適応化ベクトルの空間において全体
の適応化ベクトルからの影響は均一に受ける。また、
（ζ_ｊ−ζ_ｉ）に係る係数は、それぞれの対応する平均
ベクトルμ_ｉ，μ_ｊ間の距離R_ijには関係なく定まる。
従って、対応する平均ベクトル同士の距離に関係なく、
∂L₂／∂ζ_ｉへの寄与が定まる。つまり、ζ_ｉの変化量
は平均ベクトルの空間において全体から均一に、対応す
る適応化ベクトルの影響を強く受ける。以上からこの第
４の標準パターン学習方法においては、適応化ベクトル
の空間、におよび平均ベクトルの空間のそれぞれにおけ
る全体的な構造に対応して、適応化ベクトルが定まるこ
とがわかる。

以上、認識方式としてHMMを具体的な例としてあげ本
発明の作用の説明を行った。上の説明から容易にわかる
ように、本発明においては、ベクトル量子化を用いてい
ない。また文献３にあげられた話者適応化方式と違い、
多数話者の大量の発声データを必要とするということは
ない。

なお、本発明は標準パターンとのパターンマッチング
に基づく様々なパターン認識に対しても全く同様に適用
することができる。

（実施例）以下、本発明について図面を参照して説明する。

第１図は本発明に係る第１の標準パターン学習方式の
一実施例を示すフローチャートである。本実施例では認
識方式として文献１に述べているような単一ガウス分布
HMMを用いている。ここではμ_ｉ，σ_ｉ，a_ijで表される
ある話者のHMMを適応化させてを求めることとする。これは作用の項で説明した計算例
に対応しており、変数などの標記は作用の項で与えられ
たものと同一のものを用いることとする。以下、第１図
に示すフローチャートの処理の流れに沿って説明する。

ステップ101では、入力として標準話者のHMMおよび未
知話者の学習用データを読み込む。

ステップ102は必要なパラメータの初期設定を行う。
設定されるパラメータはλ，ε，Σ_ij,R_ij，ρ_ijであ
る。

ステップ103では、全ての状態の適応化ベクトルζ_ｉ
の初期値を０に設定する。

ステップ104,105はカウンタn,iの初期設定をそれぞれ
行う。

ステップ106は式（11）に従って、∂L₁／∂ζ_ｉを算
出する。ステップ107から109では、∂L₂／∂ζ_ｉを算
出する。学習回数ｎのloop数が０ならば全適応化ベクト
ルは０であるから、ステップ108で∂L₂／∂ζ_ｉの値を
すべて０に設定する。それ以外の場合は、ステップ109
において式（14）に従って、∂L₂／∂ζ_ｉを算出する。

ステップ110は式（17）に従って適応化ベクトルの修
正量を計算し、その修正量を用いて適応化ベクトルの更
新を行う。

ステップ111ではカウンタｉを１増やし、ベクトルパ
ラメータの最大数Ｎまでステップ106からステップ111ま
での計算を行う。

ステップ114ではベクトルパラメータの最急降下法に
よる逐次修正の収束性の判定して、収束していなければ
ステップ104に戻って、修正量の計算を続ける。収束性
の判定条件としては、逐次修正の回数ｎがある一定値を
越えたかどうかを調べて判定する条件や、評価関数Ｌの
改善量がある一定値を下回ったかどうかを調べて判定す
る条件や、それらの組合せなどの条件が用いられる。

ステップ115では、最終的に求められた適応化ベクト
ルζ_ｉを用いて未知話者に適応化した平均ベクトルを算出し、ステップ116で適応化されたHMMを出力する。

本発明に係る第２、第３および第４の標準パターン学
習方法においては、第１図のステップ109の∂L₂／∂ζ
_ｉを求める式をそれぞれ式（19），（21），および（2
3）とすれば、後の部分は上述した第１図のフローチャ
ートに示した処理と全く同様の処理を用いることで実現
できる。

（発明の効果）以上述べたように本発明によれば、未知話者が発声し
た少ない学習用データにより学習データに含まれない標
準パターンの話者適応化が可能であり、ベクトル量子化
を用いていないから量子化誤差の混入がなく、これら２
点により精度の高い標準パターンを作成することが可能
になり、多数の話者の大量の発声データを必要とするこ
となく高い認識性能を者するパターン認識を実現するこ
とができる。

【図面の簡単な説明】

第１図は本発明に係る第１の標準パターン学習方法のフ
ローチャートを示す図である。

フロントページの続き (56)参考文献電子情報通信学会技術研究報告［音声］Ｖｏｌ．88，Ｎｏ．329，ＳＰ88− 106，「ベクトル量子化話者適応アルゴリズムのＨＭＭ音韻認識による評価」ｐ．１−８（1988年12月16日発行) 電子情報通信学会技術研究報告［音声］Ｖｏｌ．89，Ｎｏ．341，ＳＰ89−90, 「話者重畳型ＨＭＭによる文節認識」ｐ．31−38（1989年12月15日発行) Ｐｒｏｃｅｅｄｉｎｇｓｏｆ 1988 ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，”Ｓ５．７ＳｐｅａｋｅｒＡｄａｐｔａｔｉｏｎＭｅｔｈｏｄｆｏｒＨＭＭ−ｂａｓｅｄＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎ”ｐ．207− 210 Ｐｒｏｃｅｅｄｉｎｇｓｏｆ 1989 ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，”Ｓ６．13 ＥｎｈａｎｃｉｎｇｔｈｅＤｉｓｃｒｉｍｉｎａｔｉｏｎｏｆＳｐｅａｋｅｒＩｎｄｅｐｅｎｄｅｎｔＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌｗｉｔｈＣｏｒｒｅｃｔｉｖｅＴｒａｉｎｉｎｇ”ｐ. 302−305 日本音響学会誌Ｖｏｌ．42，Ｎｏ. 12，「ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌに基づいた音声認識」ｐ. 936−941（昭和61年12月１日発行) 日本音響学会誌Ｖｏｌ．45，Ｎｏ. 12，「ベクトル量子化話者適応のＨＭＭ音韻認識への適用」ｐ．942−949（平成元年12月１日発行) 日本音響学会誌Ｖｏｌ．45，Ｎｏ. ２，「ファジィベクトル量子化を用いたスペクトログラムの正規化」ｐ．107− 114（平成元年２月１日発行) 日本音響学会昭和63年度春季研究発表会講演論文集▲Ｉ▼ ２−２−14「ベクトル量子化誤差に基づくスペクトルの話者適応化 −単語認識への適用−」ｐ．79−80（昭和63年３月発行) 電子情報通信学会技術研究報告［音声］Ｖｏｌ．90，Ｎｏ．111，ＳＰ90−16, 「連続出力分布型ＨＭＭにおける話者適応化の日本語音韻認識による評価」ｐ. 57−64（1990年６月28日発行) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/14 G10L 15/06 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】出力確率密度分布関数をガウス分布とした
連続HMMである、標準パターンとのパターンマッチング
に基づくパターン認識に用いられ、複数の学習用データ
を用いて標準パターンを修正することにより各カテゴリ
の標準パターンを特徴づける新しい連続HMMにおける平
均ベクトルμの集合である、第１のパラメータ集合を決
定する標準パターン学習方法であって、前記第１のパラ
メータ集合と学習用データ（ｗ＝1,2,…,W）を表す第２
のパラメータ集合との間の整合性を表す第１の評価関数
L1と、前記連続HMMにおける適応化後の平均ベクトルと
平均ベクトルの初期値との差分ベクトル間である、第１
のパラメータ集合内の各第１のパラメータの修正量間の
距離に関する関数V1を平均ベクトル間の距離を変数とし
た単調減少な関数ρの出力値である、第１のパラメータ
間の整合性を表す値により重みづけたものの和からなる
第２の評価関数L2との２つの評価関数からつくられる評
価関数の値を最適にするように前記第１のパラメータ集
合を決定することを特徴とする標準パターン学習方法。
【請求項２】請求項１に記載の標準パターン学習方法に
おいて、前記第２の評価関数L2は、第１のパラメータ集
合内の各第１パラメータの修正量間の内積に関する関数
V2を第１のパラメータ集合間の整合性を表す値により重
みづけたものの和からなる評価関数であることを特徴と
する標準パターン学習方法。
【請求項３】請求項１に記載の標準パターン学習方法に
おいて、前記第２の評価関数L2は、前記第１のパラメー
タ集合内の各第１パラメータの修正量間の距離に関する
関数V1の和からなる評価関数であることを特徴とする標
準パターン学習方法。
【請求項４】請求項１に記載の標準パターン学習方法に
おいて、前記第２の評価関数L2は、前記第１のパラメー
タ集合内の各第１パラメータの修正量間の内積に関する
関数V2の和からなる評価関数であることを特徴とする標
準パターン学習方法。