JP3536471B2

JP3536471B2 - 識別装置および識別方法、並びに音声認識装置および音声認識方法

Info

Publication number: JP3536471B2
Application number: JP24789095A
Authority: JP
Inventors: 直人岩橋
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1995-09-26
Filing date: 1995-09-26
Publication date: 2004-06-07
Anticipated expiration: 2015-09-26
Also published as: JPH0990976A; US5828998A; US6134525A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、識別装置および識
別方法、並びに音声認識装置および音声認識方法に関す
る。特に、例えば音声認識や画像認識などのパターン認
識を行う場合に用いて好適な識別装置および識別方法、
並びに音声認識装置および音声認識方法に関する。

【０００２】

【従来の技術】例えば、音声認識や画像認識などのパタ
ーン認識では、入力されたパターンから特徴ベクトルを
抽出し、その特徴ベクトルを入力値にして、識別関数の
関数値を計算するようになされている。識別関数は、入
力された特徴ベクトルを、所定の数のクラスのうちのい
ずれかに分類するためのもので、少なくともクラスの数
だけ用意されており、入力された特徴ベクトルに対し、
その関数値を最も大きくする識別関数に対応するクラス
が、認識結果（識別結果）として出力される。

【０００３】ところで、パターン認識を行う際には、変
動要因の状態が変化しても、高い認識性能が得られるこ
とが望ましい。そこで、従来より、パターン認識を行う
ための識別関数の学習は、多くの変動状態において観測
された学習サンプルを用いて行われるようになされてい
る。

【０００４】即ち、例えば、音声認識を行う場合であれ
ば、発話環境、話者、入力機器系の特性（例えば、マイ
クや、そのマイクの出力をＡ／Ｄ変換するＡ／Ｄ変換器
の特性など）などの、音声の変動要因の状態が変化して
も、これらの変動に対して耐性の高い識別関数（例え
ば、音韻認識を行う場合であれば、音韻識別関数）を得
ることができるように、多くの変動状態において観測さ
れた音声データを、学習サンプルとして、学習が行われ
る。

【０００５】ここで、上述のような学習方法について
は、例えば「確率モデルによる音声認識」、中川聖一、
電子情報通信学会や、KAI-FU LEE, Context-Dependent
Phonetic Hidden Markov Models for Speaker-Independ
ent Continuous Speech Recognition, IEEE Transactio
n on ASSP VOL. 38, NO. 4, APRIL 1990などに、その詳
細が開示されている。

【０００６】図７は、従来の識別関数算出装置の一例の
構成を示している。多くの学習サンプルが、識別関数算
出器５１に入力され、そこでは、その学習サンプルに基
づいて、識別関数、即ち、識別関数を表すパラメータ
（識別関数を構成するパラメータ）が求められる。

【０００７】しかしながら、上述のような学習によって
得られた識別関数を、そのまま用いた場合、必ずしも満
足する認識性能を得ることができないことがあった。そ
こで、より高い認識性能を得るために、認識時におい
て、例えば、識別関数を、音声の変動要因の状態に適応
させる方法がある。例えば、音韻識別関数を、話者に適
用させる方法としては、Chin-Hui Lee et al., A Study
on Speaker Adaptationof the Parameters of Continu
ous Density Hidden Markov Models, IEEE, Transsacti
on on signal processing, VOL. 39, NO. 4, 1991や、
F. Class, et al., Fast Speaker Adaptation for Spee
ch Recognition Systems, Proceeding ofIEEE ICASSP,
pp. 133-136, 1990などに開示されているものなどがあ
る。

【０００８】

【発明が解決しようとする課題】ところで、従来、学習
時においては、上述のように、認識時に用いられる適応
方法とは無関係に識別関数が求められる（決定される）
ようになされていた。即ち、識別関数は、適応が行われ
ないときに最高の性能を発揮するような基準を用いて決
定されていた。このため、認識時に、そのような識別関
数を用いて適応を行ったとしても、必ずしも最適な適応
を行うことができず、その結果、適応処理を行っても、
識別率（認識率）を、大きく向上させるのは困難であっ
た。

【０００９】本発明は、このような状況に鑑みてなされ
たものであり、パターン認識を行うにあたって最適な適
応を行うことができるようにし、これにより識別率（認
識率）を大きく向上させることができるようにするもの
である。

【００１０】

【００１１】

【００１２】

【課題を解決するための手段】請求項１に記載の識別装
置は、変動状態に依存しないユニバーサル識別関数を構
成するパラメータを記憶するユニバーサルパラメータ記
億手段と、特徴ベクトルに基づいて、ユニバーサル識別
関数を所定の変動状態に適応させるための適応用パラメ
ータを算出する適応手段と、ユニバーサル識別関数を構
成するパラメータを読み出し、ユニバーサル識別関数を
適応用パラメータにより適応させて、適応識別関数を構
成するパラメータを算出する適応パラメータ算出手段
と、適応識別関数を構成するパラメータおよび特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
手段と、適応識別関数の関数値からクラスを決定するク
ラス決定手段とを備えることを特徴とする。

【００１３】請求項２に記載の識別方法は、変動状態に
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、特
徴ベクトルに基づいて、ユニバーサル識別関数を所定の
変動状態に適応させるための適応用パラメータを算出す
る適応ステップと、ユニバーサル識別関数を構成するパ
ラメータを読み出し、ユニバーサル識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータを算出する適応パラメータ算出ステップと、適
応識別関数を構成するパラメータおよび特徴ベクトルか
ら適応識別関数の関数値を演算する識別関数演算ステッ
プと、適応識別関数の関数値からクラスを決定するクラ
ス決定ステップとを含むことを特徴とする。

【００１４】請求項３に記載の音声認識装置は、変動状
態に依存しないユニバーサル識別関数を構成するパラメ
ータを記憶するユニバーサルパラメータ記億手段と、特
徴ベクトルに基づいて、ユニバーサル識別関数を所定の
話者に適応させるための適応用パラメータを算出する話
者適応手段と、ユニバーサル識別関数を構成するパラメ
ータを読み出し、ユニバーサル識別関数を適応用パラメ
ータにより適応させて適応識別関数を構成するパラメー
タを算出する適応パラメータ算出手段と、適応識別関数
を構成するパラメータおよび特徴ベクトルから適応識別
関数の関数値を演算する識別関数演算手段と、適応識別
関数の関数値からクラスを決定するクラス決定手段とを
備えることを特徴とする。

【００１５】

【００１６】

【００１７】請求項４に記載の識別装置は、変動状態に
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億手段と、特徴ベ
クトルをユニバーサル識別関数に適応させるための適応
用パラメータを算出する適応手段と、適応用パラメータ
により特徴ベクトルを、ユニバーサル識別関数に適応さ
せて適応特徴パラメータを算出する適応ベクトル算出手
段と、ユニバーサル識別関数を構成するパラメータおよ
び適応特徴パラメータから適応識別関数の関数値を演算
する識別関数演算手段と、適応識別関数の関数値からク
ラスを決定するクラス決定手段とを備えることを特徴と
する。

【００１８】請求項５に記載の識別方法は、変動状態に
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、特
徴ベクトルをユニバーサル識別関数に適応させるための
適応用パラメータを算出する適応ステップと、適応用パ
ラメータにより特徴ベクトルを、ユニバーサル識別関数
に適応させて適応特徴パラメータを算出する適応ベクト
ル算出ステップと、ユニバーサル識別関数を構成するパ
ラメータおよび適応特徴パラメータから適応識別関数の
関数値を演算する識別関数演算ステップと、適応識別関
数の関数値からクラスを決定するクラス決定ステップと
を含むことを特徴とする。

【００１９】請求項６に記載の音声認識方法は、変動状
態に依存しないユニバーサル識別関数を構成するパラメ
ータを記憶するユニバーサルパラメータ記億ステップ
と、所定の話者により入力された音声の特徴ベクトル
を、ユニバーサル識別関数に適応させるための適応用パ
ラメータを算出する話者適応ステップと、適応用パラメ
ータにより特徴ベクトルを、ユニバーサル識別関数に適
応させて適応特徴パラメータを算出する適応ベクトル算
出ステップと、ユニバーサル識別関数を構成するパラメ
ータおよび適応特徴パラメータから適応識別関数の関数
値を演算する識別関数演算ステップと、適応識別関数の
関数値からクラスを決定するクラス決定ステップとを含
むことを特徴とする。請求項７に記載の識別装置は、変
動状態に依存しない識別関数を構成するパラメータを記
憶するパラメータ記億手段と、特徴ベクトルに基づい
て、識別関数を所定の変動状態に適応させるための適応
用パラメータを算出する適応手段と、識別関数を構成す
るパラメータを読み出し、識別関数を適応用パラメータ
により適応させて、適応識別関数を構成するパラメータ
を算出する適応パラメータ算出手段と、適応識別関数を
構成するパラメータおよび特徴ベクトルから適応識別関
数の関数値を演算する識別関数演算手段と、適応識別関
数の関数値からクラスを決定するクラス決定手段とを備
えることを特徴とする。請求項８に記載の識別方法は、
変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億ステップと、特徴ベクトルに基
づいて、識別関数を所定の変動状態に適応させるための
適応用パラメータを算出する適応ステップと、識別関数
を構成するパラメータを読み出し、識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータを算出する適応パラメータ算出ステップと、適
応識別関数を構成するパラメータおよび特徴ベクトルか
ら適応識別関数の関数値を演算する識別関数演算ステッ
プと、適応識別関数の関数値からクラスを決定するクラ
ス決定ステップとを含むことを特徴とする。請求項９に
記載の音声認識装置は、変動状態に依存しない識別関数
を構成するパラメータを記憶するパラメータ記億手段
と、特徴ベクトルに基づいて、識別関数を所定の話者に
適応させるための適応用パラメータを算出する話者適応
手段と、識別関数を構成するパラメータを読み出し、識
別関数を適応用パラメータにより適応させて適応識別関
数を構成するパラメータを算出する適応パラメータ算出
手段と、適応識別関数を構成するパラメータおよび特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、適応識別関数の関数値からクラスを決定す
るクラス決定手段とを備えることを特徴とする。

【００２０】

【００２１】

【００２２】請求項１に記載の識別装置および請求項２
に記載の識別方法においては、変動状態に依存しないユ
ニバーサル識別関数を構成するパラメータが記憶され、
特徴ベクトルに基づいて、ユニバーサル識別関数を所定
の変動状態に適応させるための適応用パラメータが算出
されるとともに、ユニバーサル識別関数を構成するパラ
メータが読み出され、ユニバーサル識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータが算出される。そして、適応識別関数を構成す
るパラメータおよび特徴ベクトルから適応識別関数の関
数値が演算され、適応識別関数の関数値からクラスが決
定される。

【００２３】

【００２４】請求項３に記載の音声認識装置において
は、変動状態に依存しないユニバーサル識別関数を構成
するパラメータが記憶され、特徴ベクトルに基づいて、
ユニバーサル識別関数を所定の話者に適応させるための
適応用パラメータが算出されるとともに、ユニバーサル
識別関数を構成するパラメータが読み出され、ユニバー
サル識別関数を適応用パラメータにより適応させて適応
識別関数を構成するパラメータが算出される。そして、
適応識別関数を構成するパラメータおよび特徴ベクトル
から適応識別関数の関数値が演算され、適応識別関数の
関数値からクラスが決定される。

【００２５】

【００２６】

【００２７】請求項４に記載の識別装置および請求項５
に記載の識別方法においては、変動状態に依存しないユ
ニバーサル識別関数を構成するパラメータが記憶され、
特徴ベクトルをユニバーサル識別関数に適応させるため
の適応用パラメータが算出されるとともに、適応用パラ
メータにより特徴ベクトルを、ユニバーサル識別関数に
適応させて適応特徴パラメータが算出される。そして、
ユニバーサル識別関数を構成するパラメータおよび適応
特徴パラメータから適応識別関数の関数値が演算され、
適応識別関数の関数値からクラスが決定される。

【００２８】

【００２９】請求項６に記載の音声認識方法において
は、変動状態に依存しないユニバーサル識別関数を構成
するパラメータが記憶され、所定の話者により入力され
た音声の特徴ベクトルを、ユニバーサル識別関数に適応
させるための適応用パラメータが算出されるとともに、
適応用パラメータにより特徴ベクトルを、ユニバーサル
識別関数に適応させて適応特徴パラメータが算出され
る。そして、ユニバーサル識別関数を構成するパラメー
タおよび適応特徴パラメータから適応識別関数の関数値
が演算され、適応識別関数の関数値からクラスが決定さ
れる。請求項７に記載の識別装置および請求項８に記載
の識別方法においては、変動状態に依存しない識別関数
を構成するパラメータが記憶され、特徴ベクトルに基づ
いて、識別関数を所定の変動状態に適応させるための適
応用パラメータが算出されるとともに、識別関数を構成
するパラメータが読み出され、識別関数を適応用パラメ
ータにより適応させて、適応識別関数を構成するパラメ
ータが算出される。そして、適応識別関数を構成するパ
ラメータおよび特徴ベクトルから適応識別関数の関数値
が演算され、適応識別関数の関数値からクラスが決定さ
れる。請求項９に記載の音声認識装置においては、変動
状態に依存しない識別関数を構成するパラメータが記憶
され、特徴ベクトルに基づいて、識別関数を所定の話者
に適応させるための適応用パラメータが算出され、識別
関数を構成するパラメータが読み出され、識別関数を適
応用パラメータにより適応させて適応識別関数を構成す
るパラメータが算出される。そして、適応識別関数を構
成するパラメータおよび特徴ベクトルから適応識別関数
の関数値が演算され、適応識別関数の関数値からクラス
が決定される。

【００３０】

【発明の実施の形態】以下に、本発明の実施例を説明す
るが、その前に、特許請求の範囲に記載の発明の各手段
と以下の実施例との対応関係を明らかにするために、各
手段の後の括弧内に、対応する実施例（但し、一例）を
付加して、本発明の特徴を記述すると、次のようにな
る。

【００３１】

【００３２】

【００３３】

【００３４】

【００３５】請求項１に記載の識別装置は、入力された
特徴ベクトル（例えば、特徴ベクトルＯ）を所定クラス
に分類することにより識別を行う識別装置（例えば、図
１の識別器５）において、変動状態に依存しないユニバ
ーサル識別関数（例えば、ユニバーサル識別関数Ｇ
_k （Ｏ））を構成するパラメータ（例えば、ユニバーサ
ルパラメータλ _k ）を記憶するユニバーサルパラメータ
記億手段（例えば、ユニバーサルパラメータ記憶部１
１）と、前記特徴ベクトルに基づいて、前記ユニバーサ
ル識別関数を所定の変動状態（例えば、変動状態Ｖ _t ）
に適応させるための適応用パラメータ（例えば、適応用
パラメータΓ _(ML)t ）を算出する適応手段（例えば、図
１の話者適応器４）と、前記ユニバーサル識別関数を構
成するパラメータを読み出し、前記ユニバーサル識別関
数を前記適応用パラメータにより適応させて、適応識別
関数を構成するパラメータ（例えば、パラメータ
ψ _t,k ）を算出する適応パラメータ算出手段（例えば、
図１の適応パラメータ算出器１２）と、前記適応識別関
数を構成するパラメータおよび前記特徴ベクトルから適
応識別関数の関数値を演算する識別関数演算手段（例え
ば、図１の識別関数演算器１３−ｋ）と、前記適応識別
関数の関数値からクラスを決定するクラス決定手段（例
えば、図１のクラス決定回路１４）とを備えることを特
徴とする。

【００３６】請求項２に記載の識別方法は、入力された
特徴ベクトル（例えば、特徴ベクトルＯ）を所定クラス
に分類することにより識別を行う識別方法において、変
動状態に依存しないユニバーサル識別関数（例えば、ユ
ニバーサル識別関数Ｇ _k （Ｏ））を構成するパラメータ
（例えば、ユニバーサルパラメータλ _k ）を記憶するユ
ニバーサルパラメータ記億ステップと、前記特徴ベクト
ルに基づいて、前記ユニバーサル識別関数を所定の変動
状態（例えば、変動状態Ｖ _t ）に適応させるための適応
用パラメータ（例えば、適応用パラメータΓ _(ML)t ）を
算出する適応ステップと、前記ユニバーサル識別関数を
構成するパラメータを読み出し、前記ユニバーサル識別
関数を前記適応用パラメータにより適応させて、適応識
別関数を構成するパラメータ（例えば、パラメータψ
_t,k ）を算出する適応パラメータ算出ステップと、前記
適応識別関数を構成するパラメータおよび前記特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
ステップと、前記適応識別関数の関数値からクラスを決
定するクラス決定ステップとを含むことを特徴とする。

【００３７】請求項３に記載の音声認識装置は、入力さ
れた音声の特徴ベクトル（例えば、特徴ベクトルＯ）を
所定クラスに分類することにより音声を認識する音声認
識装置において、変動状態に依存しないユニバーサル識
別関数（例えば、ユニバーサル識別関数Ｇ _k （Ｏ））を
構成するパラメータ（例えば、ユニバーサルパラメータ
λ _k ）を記憶するユニバーサルパラメータ記億手段（例
えば、ユニバーサルパラメータ記憶部１１）と、前記特
徴ベクトルに基づいて、前記ユニバーサル識別関数を所
定の話者に適応させるための適応用パラメータ（例え
ば、適応用パラメータΓ _(ML)t ）を算出する話者適応手
段（例えば、図１の話者適応器４）と、前記ユニバーサ
ル識別関数を構成するパラメータを読み出し、前記ユニ
バーサル識別関数を前記適応用パラメータにより適応さ
せて適応識別関数を構成するパラメータ（例えば、パラ
メータψ _t,k ）を算出する適応パラメータ算出手段（例
えば、図１の適応パラメータ算出器１２）と、前記適応
識別関数を構成するパラメータおよび前記特徴ベクトル
から適応識別関数の関数値を演算する識別関数演算手段
（例えば、図１の識別関数演算器１３−ｋ）と、前記適
応識別関数の関数値からクラスを決定するクラス決定手
段（例えば、図１のクラス決定回路１４）とを備えるこ
とを特徴とする。

【００３８】

【００３９】

【００４０】

【００４１】

【００４２】請求項４に記載の識別装置は、入力された
特徴ベクトル（例えば、特徴ベクトルＯ）を所定クラス
に分類することにより識別を行う識別装置（例えば、図
５の識別器３５）において、変動状態に依存しないユニ
バーサル識別関数（例えば、ユニバーサル識別関数Ｇ _k
（Ｏ））を構成するパラメータを記憶するユニバーサル
パラメータ記億手段（例えば、図５のユニバーサルパラ
メータ記憶部１１）と、前記特徴ベクトルを前記ユニバ
ーサル識別関数に適応させるための適応用パラメータ
（例えば、適応用パラメータΓ _(ML)t ）を算出する適応
手段（例えば、図５の話者適応器３４）と、前記適応用
パラメータにより前記特徴ベクトルを、前記ユニバーサ
ル識別関数に適応させて適応特徴パラメータ（例えば、
Ｆ（Ｏ｜γ _t,k ））を算出する適応ベクトル算出手段
（例えば、図５の適応ベクトル算出器３６）と、前記ユ
ニバーサル識別関数を構成するパラメータおよび前記適
応特徴パラメータから適応識別関数の関数値を演算する
識別関数演算手段（例えば、図５の識別関数演算器１３
−ｋ）と、前記適応識別関数の関数値からクラスを決定
するクラス決定手段（例えば、図５のクラス決定回路１
４）とを備えることを特徴とする。

【００４３】請求項５に記載の識別方法は、入力された
特徴ベクトル（例えば、特徴ベクトルＯ）を所定クラス
に分類することにより識別を行う識別方法において、変
動状態に依存しないユニバーサル識別関数（例えば、ユ
ニバーサル識別関数Ｇ _k （Ｏ））を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、前
記特徴ベクトルを前記ユニバーサル識別関数に適応させ
るための適応用パラメータ（例えば、適応用パラメータ
Γ _(ML)t ）を算出する適応ステップと、前記適応用パラ
メータにより前記特徴ベクトルを、前記ユニバーサル識
別関数に適応させて適応特徴パラメータ（例えば、Ｆ
（Ｏ｜γ _t,k ））を算出する適応ベクトル算出ステップ
と、前記ユニバーサル識別関数を構成するパラメータお
よび前記適応特徴パラメータから適応識別関数の関数値
を演算する識別関数演算ステップと、前記適応識別関数
の関数値からクラスを決定するクラス決定ステップとを
含むことを特徴とする。

【００４４】請求項６に記載の音声認識方法は、入力さ
れた音声の特徴ベクトル（例えば、特徴ベクトルＯ）を
所定クラスに分類することにより音声を認識する音声認
識方法において、変動状態に依存しないユニバーサル識
別関数（例えば、ユニバーサル識別関数Ｇ _k （Ｏ））を
構成するパラメータを記憶するユニバーサルパラメータ
記億ステップと、所定の話者により入力された音声の前
記特徴ベクトルを、前記ユニバーサル識別関数に適応さ
せるための適応用パラメータ（例えば、適応用パラメー
タΓ _(ML)t ）を算出する話者適応ステップと、前記適応
用パラメータにより前記特徴ベクトルを、前記ユニバー
サル識別関数に適応させて適応特徴パラメータ（例え
ば、Ｆ（Ｏ｜γ _t,k ））を算出する適応ベクトル算出ス
テップと、前記ユニバーサル識別関数を構成するパラメ
ータおよび前記適応特徴パラメータから適応識別関数の
関数値を演算する識別関数演算ステップと、前記適応識
別関数の関数値からクラスを決定するクラス決定ステッ
プとを含むことを特徴とする。請求項７に記載の識別装
置は、入力された特徴ベクトル（例えば、特徴ベクトル
Ｏ）を所定クラスに分類することにより識別を行う識別
装置（例えば、図１の識別器５）において、変動状態に
依存しない識別関数（例えば、識別関数Ｇ _k （Ｏ））を
構成するパラメータ（例えば、パラメータλ _k ）を記憶
するパラメータ記億手段（例えば、パラメータ記憶部１
１）と、前記特徴ベクトルに基づいて、前記識別関数を
所定の変動状態（例えば、変動状態Ｖ _t ）に適応させる
ための適応用パラメータ（例えば、適応用パラメータΓ
_(ML)t ）を算出する適応手段（例えば、図１の話者適応
器４）と、前記識別関数を構成するパラメータを読み出
し、前記識別関数を前記適応用パラメータにより適応さ
せて、適応識別関数を構成するパラメータ（例えば、パ
ラメータψ _t,k ）を算出する適応パラメータ算出手段
（例えば、図１の適応パラメータ算出器１２）と、前記
適応識別関数を構成するパラメータおよび前記特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
手段（例えば、図１の識別関数演算器１３−ｋ）と、前
記適応識別関数の関数値からクラスを決定するクラス決
定手段（例えば、図１のクラス決定回路１４）とを備え
ることを特徴とする。請求項８に記載の識別方法は、入
力された特徴ベクトル（例えば、特徴ベクトルＯ）を所
定クラスに分類することにより識別を行う識別方法にお
いて、変動状態に依存しない識別関数（例えば、識別関
数Ｇ _k （Ｏ））を構成するパラメータ（例えば、パラメ
ータλ _k ）を記憶するパラメータ記億ステップと、前記
特徴ベクトルに基づいて、前記識別関数を所定の変動状
態（例えば、変動状態Ｖ _t ）に適応させるための適応用
パラメータ（例えば、適応用パラメータΓ _(ML)t ）を算
出する適応ステップと、前記識別関数を構成するパラメ
ータを読み出し、前記識別関数を前記適応用パラメータ
により適応させて、適応識別関数を構成するパラメータ
（例えば、パラメータψ _t,k ）を算出する適応パラメー
タ算出ステップと、前記適応識別関数を構成するパラメ
ータおよび前記特徴ベクトルから適応識別関数の関数値
を演算する識別関数演算ステップと、前記適応識別関数
の関数値からクラスを決定するクラス決定ステップとを
含むことを特徴とする。請求項９に記載の音声認識装置
は、入力された音声の特徴ベクトル（例えば、特徴ベク
トルＯ）を所定クラスに分類することにより音声を認識
する音声認識装置において、変動状態に依存しない識別
関数（例えば、識別関数Ｇ _k （Ｏ））を構成するパラメ
ータ（例えば、パラメータλ _k ）を記憶するパラメータ
記億手段（例えば、パラメータ記憶部１１）と、前記特
徴ベクトルに基づいて、前記識別関数を所定の話者に適
応させるための適応用パラメータ（例えば、適応用パラ
メータΓ _(ML)t ）を算出する話者適応手段（例えば、図
１の話者適応器４）と、前記識別関数を構成するパラメ
ータを読み出し、前記識別関数を前記適応用パラメータ
により適応させて適応識別関数を構成するパラメータ
（例えば、パラメータψ _t,k ）を算出する適応パラメー
タ算出手段（例えば、図１の適応パラメータ算出器１
２）と、前記適応識別関数を構成するパラメータおよび
前記特徴ベクトルから適応識別関数の関数値を演算する
識別関数演算手段（例えば、図１の識別関数演算器１３
−ｋ）と、前記適応識別関数の関数値からクラスを決定
するクラス決定手段（例えば、図１のクラス決定回路１
４）とを備えることを特徴とする。

【００４５】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。

【００４６】図１は、本発明を適用した音声認識装置の
一実施例の構成を示している。なお、この音声認識装置
においては、話者に適応した音声の認識が行われるよう
になされている。

【００４７】即ち、マイク１に入力された音声は、電気
信号としての音声信号に変換され、音響分析部２に出力
される。音響分析部２では、マイク１からの音声信号が
Ａ／Ｄ変換されることによりディジタルの音声信号とさ
れ、さらに、その音声信号に対し、所定の音響分析処理
が施されることで、音声の特徴ベクトル（例えば、ＬＰ
Ｃ（線形予測係数）や、ＬＰＣケプストラム、所定の帯
域幅ごとのパワーなど）が抽出される。この特徴ベクト
ルＯは、スイッチ３に供給される。

【００４８】スイッチ３は、例えば、ある話者によって
発話が開始された場合などの、話者Ｖ_tに対する適応を
行う必要がある場合、端子ａを選択する。従って、この
ような場合、音響分析部２から出力された特徴ベクトル
Ｏは、話者Ｖ_tに対する適応を行うための適応用のサン
プルＡ_tとして、スイッチ３および端子ａを介して、話
者適応器４に出力される。

【００４９】話者適応器４では、適応用のサンプルＡ_t
に基づいて、後述する識別器５が記憶しているユニバー
サル識別関数を話者Ｖ_tに適応させるための適応用パラ
メータΓ_(ML)tが算出され、識別器５を構成する適応パ
ラメータ算出器１２に供給される。

【００５０】話者適応器４から識別器５に対し、適応用
パラメータΓ_(ML)tが出力されると、スイッチ３は、端
子ｂを選択し、これにより、音響分析部２から出力され
た特徴ベクトルＯは、スイッチ３および端子ｂを介し
て、識別器５の識別関数演算器１３（識別関数演算器１
３−１乃至１３−Ｋ）に供給されるようになる。

【００５１】識別器５では、入力された特徴ベクトルＯ
が、識別関数（ユニバーサル識別関数）を用いて、所定
の数ＫのクラスＣ_kのうちのいずれかに分類されるこ
で、マイク１に入力された音声の識別（認識）が行われ
る。即ち、ユニバーサルパラメータ記憶部１１には、ク
ラスＣ_kに対応するユニバーサル識別関数を構成するパ
ラメータ（例えば、関数ｆ（ｘ）＝ａｘ²＋ｂｘ＋ｃに
ついては、ａ，ｂ，ｃ）（本実施例中において、適宜、
ユニバーサルパラメータという）λ_k（ベクトル）が記
憶されており、適応パラメータ算出器１２は、話者適応
器４から適応用パラメータΓ_(ML)tを受信すると、ユニ
バーサルパラメータ記憶部１１からユニバーサル識別関
数（ユニバーサルパラメータ）を読み出し、適応用パラ
メータΓ_(M _L)tに基づいて適応させる（変換する）。こ
れにより、適応用のサンプルＡ_t、即ち、この場合は話
者Ｖ_tに適応した識別関数（本実施例において、適宜、
適応識別関数という）を構成するパラメータψ_t,k（＝
Ｆ（（λ_k，Γ_(ML)t））が算出される。

【００５２】パラメータψ_t,kは、クラスＣ_kに対応する
適応識別関数の関数値を演算する識別関数演算器１３−
ｋに供給される。識別関数演算器１３−ｋでは、パラメ
ータψ_t,kで表現される適応識別関数の関数値が、特徴
ベクトルＯを入力値として計算され、クラス決定回路１
４に出力される。クラス決定回路１４では、識別関数演
算器１３−１乃至１３−Ｋが出力する関数値のうち、例
えば最も値の大きいものが検出され、その関数値が得ら
れた適応識別関数に対応するクラスＣ_kのサフィックス
ｋが、音声認識結果として決定されて出力される。

【００５３】次に、図１の音声認識装置の認識（識別）
原理について説明する。いま、ある変動要因の状態（変
動状態）Ｖ_tに適応された、あるクラスＣ_kに対応する適
応識別関数をｇ_t,k（・）と表す。例えば、音韻を音声
認識結果として出力する音声認識を考えた場合、Ｖ_tは
話者に、クラスＣ_kは認識結果としての音韻に、それぞ
れ対応する。

【００５４】さらに、変動状態Ｖ_tが既知で、その変動
状態Ｖ_tにおいてサンプル（特徴ベクトル）Ｏが観測さ
れた場合に、そのサンプルＯが、どのクラスに識別され
るかを決定するクラス決定規則を次式で定義する。

【００５５】

【数１】

【００５６】この場合、サンプルＯは、式（１）によっ
て与えられるｋをサフィックスとするクラスＣ_kに識別
される。

【００５７】いま、クラスＣ_kとして、クラスＣ₁乃至Ｃ
_KのＫ個のクラスがあり、変動状態Ｖ_tにおいて、クラス
Ｃ₁乃至Ｃ_Kそれぞれに属するサンプルＯが観測される事
前確率ｐ（Ｃ₁，Ｖ_t）乃至ｐ（Ｃ_K，Ｖ_t）が等しいとす
ると、即ち、音声認識についていえば、例えば、ある話
者Ｖ_tが、認識対象となっている音韻Ｃ₁乃至Ｃ_Kそれぞ
れを発話する事前確率ｐ（Ｃ₁，Ｖ_t）乃至ｐ（Ｃ_K，
Ｖ_t）が等しいとすると、変動状態Ｖ_tにおいて、サンプ
ルＯが観測された場合に、最小誤り率を実現する適応識
別関数ｇ_t,k（Ｏ）は、例えば次式で与えられる。

【００５８】ｇ_t,k（Ｏ）＝ｐ（Ｏ｜Ｃ_k，Ｖ_t）・・・（２）

【００５９】即ち、この場合、適応識別関数ｇ
_t,k（Ｏ）は、変動状態Ｖ_tおよびクラスＣ_kによって条
件づけられる確率密度関数（以下、適宜、条件付き確率
密度関数という）ｐ（Ｏ｜Ｃ_k，Ｖ_t）で表される。い
ま、この条件付き確率密度関数ｐ（Ｏ｜Ｃ_k，Ｖ_t）が、
パラメータ（ベクトル）ψ_t,kによって一意に決定され
るもの、即ち、パラメトリック形式で表わされるものと
する。ここで、条件付き確率密度関数ｐ（Ｏ｜Ｃ_k，
Ｖ_t）がパラメータψ_t,kに依存していることを表すため
に、以下、ｐ（Ｏ｜Ｃ_k，Ｖ_t）を、ｐ（Ｏ｜ψ_t,k）と
表すこととする。

【００６０】この条件付き確率密度ｐ（Ｏ｜ψ_t,k）
は、クラスＣ_kによって条件づけられ、かつパラメトリ
ック形式で表される確率密度関数（これも、以下、適
宜、条件付き確率密度関数という）ｐ（Ｏ｜λ_k）をあ
らかじめ決めておけば、この条件付き確率密度関数ｐ
（Ｏ｜λ_k）を、変動状態Ｖ_tに適応させることによって
得ることができる。

【００６１】条件付き確率密度関数ｐ（Ｏ｜λ_k）は、
変動状態Ｖ_tに依存せず、従って、すべての変動状態Ｖ_t
について用いることができることから、「ユニバーサ
ル」な、条件付き確率密度関数ということができる。こ
こで、Ｇ_k（Ｏ）＝ｐ（Ｏ｜λ_k）とし、以下、適宜、Ｇ
_k（Ｏ）を、ユニバーサル識別関数という。また、λ
_kは、ユニバーサル識別関数Ｇ_k（・）を構成（表現）す
るパラメータであるから、本実施例中においては、λ_k
を、適宜、ユニバーサルパラメータという。

【００６２】以上から、適応識別関数ｇ_t,k（Ｏ）は、
ユニバーサル識別関数Ｇ_k（Ｏ）を、変動状態Ｖ_tに適応
させることによって得ることができるが、この適応に対
応する変換を行う関数（以下、適宜、適応用関数とい
う）をＦ（・）と表し、その適応用関数Ｆ（・）が、適
応用パラメータ（ベクトル）γ_t,kで制御されるものと
すると、適応識別関数ｇ_t,k（Ｏ）を表すパラメータ
（本実施例中において、適宜、適応パラメータという）
ψ_t,kは、次式で示される。

【００６３】ψ_t,k＝Ｆ（λ_k，γ_t,k）・・・（３）

【００６４】なお、以下、適宜、適応パラメータ
ψ_t,1，ψ_t,2，・・・，ψ_t,Kの集合でなるベクトル
［ψ_t,1，ψ_t,2，・・・，ψ_t,K］をΨ_tと、ユニバーサ
ルパラメータλ₁，λ₂，・・・，λ_Kの集合でなるベク
トル［λ₁，λ₂，・・・，λ_K］をΛと、適応用パラメ
ータγ_t,1，γ_t,2，・・・，γ_t,Kの集合でなるベクト
ル［γ_t,1，γ_t,2，・・・，γ_t,K］をΓ_tと、それぞれ
表す。この場合、例えば、式（３）は次式のようにな
る。

【００６５】Ψ_t＝Ｆ（Λ，Γ_t）・・・（４）

【００６６】認識時（識別時）においては、ユニバーサ
ル識別関数Ｇ_k（Ｏ）を、変動状態Ｖ_tに適応させ、適応
識別関数ｇ_t,k（Ｏ）を得る必要があるが、このために
は、適応用関数Ｆ（Λ，Γ_t）を制御（構成）する適応
用パラメータΓ_tであって、変動状態Ｖ_tに対応するもの
を求める必要がある。この適応用パラメータΓ_tは、変
動状態Ｖ_tにおいて観測されるサンプル（このサンプル
は、ユニバーサル識別関数Ｇ_k（Ｏ）を変動状態Ｖ_tに適
応させるために用いられるので、本実施例中において、
適宜、適応用のサンプルという）Ａ_tに基づいて決定す
ることができる。

【００６７】ここで、適応用のサンプルＡ_tは、次式で
与えられるものとする。

【００６８】

【数２】

【００６９】但し、上式において、Ｏ_t,k,i ^(A)は、変動
状態Ｖ_tにおいて観測された、クラスＣ_kに属する特徴ベ
クトルＯであって、第ｉ番目のものを表しており、ｍ
_t,kは、変動状態Ｖ_tにおいて観測された、クラスＣ_kに
属する特徴ベクトルＯの総数を表す。また、特徴ベクト
ルＯ_t,k,i ^(A)における（Ａ）は、特徴ベクトルＯ _t,k,i
が、ユニバーサル識別関数Ｇ_k（Ｏ）を変動状態Ｖ_tに適
応させるために用いられるものであることを表す。な
お、ｍ_t,kは、小さな値で良く、例えば１であっても良
い。

【００７０】この場合、適応用パラメータΓ_tの最尤推
定値（Maximum Likelihood）Γ_(ML)tは、次式によって
得ることができる。

【００７１】

【数３】

【数４】

【００７２】なお、ユニバーサルパラメータΛは固定値
とする。

【００７３】式（６）により適応用パラメータΓ_t（適
応用パラメータの最尤推定値Γ_(ML)t)を得た後は、式
（４）にしたがって、適応パラメータΨ_tを求め、入力
された特徴ベクトルＯに対する条件付き確率密度関数ｐ
（Ｏ｜ψ _t,k ）、即ち、適応識別関数ｇ_t,k（Ｏ）を計
算し、式（１）で示される条件を満たすｋを求めること
で、入力された特徴ベクトルＯの識別結果であるクラ
スＣ_kを得ることができる。

【００７４】図１の音声認識装置では、以上の原理に基
づき、クラスＣ_kのサフィックスｋが、音声認識結果と
して出力されるようになされている。即ち、話者適応器
４では、適応用のサンプルＡ_tを用い、式（６）にした
がって、適応用パラメータΓ_t（最尤推定値Γ_(ML)t）が
求められる。ユニバーサルパラメータ記憶部１１には、
ユニバーサルパラメータΛ（λ₁，λ₂，・・・，λ_K）
が記憶されており、適応パラメータ算出器１２では、そ
のユニバーサルパラメータΛが、話者適応器４で求めら
れた適応用パラメータΓ_tを用い、式（３）または
（４）にしたがって変換され、これにより、ユニバーサ
ル識別関数Ｇ_k（・）を、適応用のサンプルＡ_tに適応さ
せた適応識別関数ｇ_t,k（・）を構成する適応パラメー
タΨｔ（ψ_t, ₁，ψ_t,2，・・・，ψ_t,K）が算出され
る。そして、識別関数演算器１３−１乃至１３−Ｋで
は、適応パラメータψ_t,1，ψ_t,2，・・・，ψ_t,Kで表
される適応識別関数ｇ_t,k（・）の、特徴ベクトルＯに
ついての関数値ｇ_t,1（Ｏ），ｇ_t,2（Ｏ），・・・，ｇ
_t, _K（Ｏ）が計算される。その後、クラス決定回路１４
では、関数値ｇ_t,1（Ｏ），ｇ_t,2（Ｏ），・・・，ｇ
_t,K（Ｏ）を用いて、式（１）を満たすｋが求められ
る。

【００７５】次に、図１のユニバーサルパラメータ記憶
部１１に記憶させるユニバーサル識別関数Ｇ_k（・）、
即ち、ユニバーサルパラメータΛの算出方法（学習方
法）について説明する。いま、Ｔ個の変動状態Ｖ₁，
Ｖ₂，・・・，Ｖ_Tにおいてそれぞれ観測（抽出）され
た、Ｋ個のクラスＣ₁，Ｃ₂，・・・，Ｃ_Kそれぞれに属
する特徴ベクトルの集合でなる学習サンプルＸを考え、
これを、以下のように表す。

【００７６】

【数５】

【数６】

【数７】

【００７７】なお、式（８）において、Ｘ_tは、変動状
態Ｖ_tにおいて観測された学習サンプルの集合を表し、
式（９）において、Ｏ_t,kは、変動状態Ｖ_tにおいて観測
された学習サンプルのうち、クラスＣ_kに属するものの
集合を表す。また、式（９）において、ｍ_t,kは、学習
サンプル（学習サンプルの集合）Ｏ_t,kを構成する特徴
ベクトル、即ち、変動状態Ｖ_tにおいて観測された、ク
ラスＣ_kに属する学習サンプルの総数を表し、Ｏ
_t,k,iは、学習サンプルＯ_t,kの中の第ｉ番目の特徴ベク
トルを表す。

【００７８】ここで、以下、適宜、適応用パラメータΓ
₁，Γ₂，・・・，Γ_Kの集合でなるベクトルまたは適応
パラメータΨ₁，Ψ₂，・・・，Ψ_Kの集合でなるベクト
ルを、それぞれ式（１１）または（１２）に示すよう
に、ΓまたはΨで表す。 Γ＝［Γ₁，Γ₂，・・・，Γ_T］・・・（１１） Ψ＝［Ψ₁，Ψ₂，・・・，Ψ_T］・・・（１２）

【００７９】この場合、例えば、式（３）または（４）
は次式のように表される。 Ψ＝Ｆ（Λ，Γ）・・・（１３）

【００８０】次に、本実施例では、ユニバーサルパラメ
ータΛの学習を、例えば、ユニバーサル識別関数Ｇ
_k（・）を、学習サンプルＸに適応させる変換（適応用
関数Ｆによる変換）Ｆ（・）を行って得られる適応識別
関数ｇ_t,k（・）（これは、上述したように、Ψ、即
ち、Ｆ（Λ，Γ）をパラメータとする）の、学習サンプ
ルＸに対する尤度を評価基準として行うものとし、以
下、この尤度を、ｐ（Ｘ｜Ｆ（Λ，Γ））と表す。

【００８１】適応用パラメータΓ_tは、ユニバーサルパ
ラメータΛを、変動状態Ｖ_t、即ち、適応用のサンプル
Ａ_tに適応させるものであるから、この適応用パラメー
タΓ_tは、ユニバーサルパラメータΛおよび適応用のサ
ンプルＡ _tの関係から得ることができ、さらに、適応用
のサンプルＡ_tは、変動状態Ｖ_tにおいて任意に観測され
るものであるから、適応用パラメータΓ_tは確率変数と
みなすことができる。この場合、学習サンプルＸに対
するユニバーサルパラメータΛの対数尤度Ｕ₁（Ｘ，
Λ）は、次式で定義することができる。

【００８２】

【数８】

【００８３】ユニバーサルパラメータΛの最尤推定値Λ
_(ML)は、次式に示すように、対数尤度Ｕ₁（Ｘ，Λ）を
最大化することで求めることができる。

【００８４】

【数９】

【００８５】しかしながら、上式におけるｐ（Γ_t｜
Λ）を求めるには、一般に無限のサンプルが必要とな
る。そこで、次のようにして、ｐ（Γ_t｜Λ）を帰納的
に学習しながら、尤度の最大化を図ることとする。

【００８６】即ち、例えば学習サンプルＸ_t（但し、こ
れは、学習サンプルＸ_tである必要は必ずしもなく、変
動状態Ｖ_tにおいて観測されたものであれば良い）の中
から、適応用パラメータΓを求めるためのサンプル（以
下、適宜、このサンプルも適応用のサンプルという）Ｂ
_t,hを選択する。但し、ｈ＝１，２，・・・，Ｈ_tで、Ｈ
_tは、適応用のサンプルの総数である。なお、Ｈ_tは１以
上であれば良い。

【００８７】この場合、学習サンプルＸに対するユニバ
ーサルパラメータΛの対数尤度Ｕ₂（Ｘ，Λ）は、次式
で与えられる。

【００８８】

【数１０】

【００８９】ここで、Γ_(ML)t,hは、サンプルＢ_t,hに基
づいて得られる適応用パラメータΓの最尤推定値で、次
式で与えられるものである。

【００９０】

【数１１】

【００９１】この場合、ユニバーサルパラメータΛの最
尤推定値Λ_(ML)は、次式にしたがって、式（１６）を最
大化することで求めることができる。

【００９２】

【数１２】

【００９３】図２は、以上のような原理に基づいて、ユ
ニバーサル識別関数Ｇ_k（・）、即ち、ユニバーサルパ
ラメータΛを算出する識別関数算出装置の一実施例の構
成を示している。学習サンプルＸは、適応用関数パラメ
ータ算出用学習サンプル抽出器２１およびユニバーサル
パラメータ算出器２３に供給される。ここで、図１の識
別器５に適用される（ユニバーサルパラメータ記憶部１
１に記憶させる）ユニバーサルパラメータΛを算出する
場合においては、学習サンプルＸとしては、音響分析部
２から出力される特徴ベクトルが用いられる。

【００９４】適応用関数パラメータ算出用学習サンプル
抽出器２１では、学習サンプルＸから、上述したような
サンプルＢ_t,hが抽出される。ここで、サンプルＢ_t,hの
抽出は、例えば、適応用関数パラメータ算出用学習サン
プル抽出器２１で乱数が発生され、その乱数に基づい
て、学習サンプルＸからサンプルを選択することで行わ
れる。

【００９５】適応用関数パラメータ算出用学習サンプル
抽出器２１で抽出されたサンプルＢ_t,hは、適応用パラ
メータ算出器２２に供給される。さらに、適応用パラメ
ータ算出器２２には、ユニバーサルパラメータ算出器２
３から、所定のユニバーサルパラメータも供給される。
適応用パラメータ算出器２２では、ユニバーサルパラメ
ータ算出器２３からのユニバーサルパラメータΛを、サ
ンプルＢ_t,hに適応させるための適応用パラメータΓが
算出される。即ち、適応用パラメータ算出器２２は、式
（１７）にしたがって、適応用パラメータΓの最尤推定
値Γ_(ML)t,hを算出する。この適応用パラメータΓ
_(ML)t,hは、ユニバーサルパラメータ算出器２３に出力
される。

【００９６】ユニバーサルパラメータ算出器２３では、
式（１８）にしたがって、ユニバーサルパラメータΛの
最尤推定値Λ_(ML)が求められる。即ち、ユニバーサルパ
ラメータ算出器２３では、適応用パラメータ算出器２２
からの適応用パラメータΓ_(M _L)t,hに基づいて、ユニバ
ーサルパラメータΛが変換され、これにより、式（１
６）におけるＦ（Λ，Γ_(ML)t,h）（これは、ユニバー
サル識別関数Ｇ_k（・）をサンプルＢ_t,hに適応させる変
換を行って得られる適応識別関数ｇ_t,k（・）のパラメ
ータΨ_tである）が求められる。そして、サンプルＸに
対するＦ（Λ，Γ_(ML _)t,h）の尤度（本実施例において
は、上述したように、式（１６）で表される対数尤度Ｕ
₂）を最も高くするユニバーサルパラメータΛ_(ML)が算
出される。

【００９７】さらに、ユニバーサルパラメータ算出器２
３は、ユニバーサルパラメータΛ_(M _L)を与える対数尤度
Ｕ₂が、例えば所定の閾値以上であるかどうかを判定す
る。そして、対数尤度Ｕ₂が、所定の閾値以上でない場
合、その対数尤度Ｕ₂が向上するようなユニバーサルパ
ラメータΛを、適応用パラメータ算出器２２に供給す
る。適応用パラメータ算出器２２は、新たなユニバーサ
ルパラメータを受信すると、再び、式（１７）にしたが
って、適応用パラメータΓの最尤推定値Γ_(ML)t,hを算
出し、ユニバーサルパラメータ算出器２３に出力する。

【００９８】以下、適応用パラメータ算出器２２および
ユニバーサルパラメータ算出器２３では、ユニバーサル
パラメータΛ_(ML)を与える対数尤度Ｕ₂が所定の閾値以
上となるまで、同様の処理が繰り返される。

【００９９】そして、ユニバーサルパラメータΛ_(ML)を
与える対数尤度Ｕ₂が所定の閾値以上となると、ユニバ
ーサルパラメータ算出器２３は、そのユニバーサルパラ
メータΛ_(ML)を、メモリ２４に出力して記憶させる。メ
モリ２４に記憶されたユニバーサルパラメータΛ
_(ML)は、その後、必要に応じて、例えばユニバーサルパ
ラメータ記憶部１１（図１）などに転送される。

【０１００】以上のように、変動状態Ｖ_tとユニバーサ
ル識別関数Ｇ_k（・）との関係に応じて、ユニバーサル
識別関数Ｇ_k（・）を、学習サンプルＸ_tに適応させなが
ら学習を行うようにしたので、適応処理を行ったときに
最高の性能を発揮するようなユニバーサル識別関数Ｇ_k
（・）を得ることができ、その結果、認識時において、
このユニバーサル識別関数Ｇ_k（・）を用いることで、
認識率を向上させることができる。

【０１０１】なお、式（１４）におけるｐ（Γ_t｜Λ）
が、比較的少ない数のパラメータで表され、サンプルＢ
_t,hとして、比較的多くのサンプルが与えられた場合、
適応用パラメータΓ_tの分散は非常に小さくなる。そこ
で、いま、適応用パラメータΓ_tの分散を０と仮定する
と、学習サンプルＸに対するユニバーサルパラメータΛ
の対数尤度Ｕ₃（Ｘ，Λ）は、次式で与えられる。

【０１０２】

【数１３】

【０１０３】但し、Γ_(ML)tは、次式にしたがって得ら
れる適応用パラメータΓ_tの最尤推定値である。

【０１０４】

【数１４】

【０１０５】この場合、式（１９）および（２０）か
ら、最大化すべき目的関数Ｕ₄（Ｘ，Λ，Γ）は、次式
のようになる。

【０１０６】

【数１５】

【０１０７】上式より、ユニバーサルパラメータΛの最
尤推定値Λ_(ML)は、Ｕ₄（Ｘ，Λ，Γ）を、ΛおよびΓ
の両方に関して最大化することにより求めることができ
る。このＵ₄（Ｘ，Λ，Γ）を最大化するΛおよびΓ
は、例えばシミュレーテッドアーニング法や、最急降下
法、ＥＭ（Expectation Maximization）アルゴリズムな
どにしたがって求めることができる。なお、シミュレー
テッドアーニング法によれば、演算量は多いが、比較的
良好な解を求めることができる。また、最急降下法やＥ
Ｍアルゴリズムによれば、解として、局所的な最大値が
得られることが多いが、演算量は少なくて済む。

【０１０８】次に、上述した学習方法において、ユニバ
ーサル識別関数Ｇ_k（・）として、例えば対角成分以外
の共分散成分を０とした、パラメトリックに表現可能な
正規分布（混合正規分布）関数を、適応用パラメータΓ
として、例えば加算ベクトルを、それぞれ用いた場合に
ついて説明する。この場合、ユニバーサル識別関数Ｇ_k
（Ｏ）は、次式のように表すことができる。

【０１０９】

【数１６】

【０１１０】但し、Ｊは、特徴ベクトルＯの成分（コン
ポーネント）の数（次元数）を表し、ｏ_jは、特徴ベク
トルＯのｊ番目の成分（第ｊ成分）を表す。また、μ
_k,jまたはσ_k,j ²は、第ｊ成分ｏ_jの平均値または分散を
それぞれ表す。

【０１１１】この場合、ユニバーサルパラメータλ
_kは、λ_k＝［μ_k,1，μ_k,2，・・・，μ_k,J，σ_k,1 ²，
σ_k,2 ²，・・・，σ_k,J ²］と表すことができる。

【０１１２】そして、適応用関数Ｆ（・）の適応用パラ
メータ、即ち、この場合、加算ベクトルΓ_tを、Γ_t＝
［γ_t,k,1，γ_t,k,2，・・・，γ_t,k,J］と表すととも
に、学習サンプルＸ_tに適応させたμ_k,jまたはσ
_k,j ²を、それぞれμ_t,k,jまたはσ_t,k _,j ²と表すとする
と、適応パラメータψ_t,kは、次のように表すことがで
きる。

【０１１３】 ψ_t,k＝Ｆ（λ_k，Γ_t）＝［μ_t,k,1，μ_t,k,2，・・・，μ_t,k,J， σ_t,k,1 ²，σ_t,k,2 ²，・・・，σ_t,k,J ²］＝［μ_k,1＋γ_t,k,1，μ_k,2＋γ_t,k,2，・・・，μ_k,J＋γ_t,k,J， σ_k,1 ²，σ_k,2 ²，・・・，σ_k,J ²］・・・（２３）

【０１１４】従って、この場合、適応識別関数ｇ
_t,k（Ｏ）は、次式で与えられる。

【０１１５】

【数１７】

【０１１６】ユニバーサル識別関数Ｇ_k（・）、即ち、
ユニバーサルパラメータΛは、式（１６）乃至（１８）
から、次式に示す対数尤度Ｌ（Ｘ，Λ）を、Λについて
最大化することで求めることができる。

【０１１７】

【数１８】

【０１１８】但し、Γ_(ML)t,hは、学習サンプルＢ_t,h∈
Ｘ_tを用いて得られる加算ベクトルΓ_tの最尤推定値で、
次式で与えられる。

【０１１９】

【数１９】

【０１２０】但し、この場合Ｆ（Λ，Γ_t,h）は、次式
で表される。Ｆ（Λ，Γ_t,h）＝［μ_k,1＋γ_t,k,1,h，μ_k,2＋γ_t,k,2,h，・・・， μ_k,J＋γ_t,k,J,h，σ_k,1 ²，σ_k,2 ²，・・・，σ_k,J ²］・・・（２７）

【０１２１】なお、γ_t,k,j,hは、サンプルＢ_t,hについ
てのγ_t,k,jを表す。

【０１２２】ところで、上述した学習方法の原理は、直
感的には、次にように考えることができる。即ち、例え
ば画像認識（文字認識）において、ユニバーサル識別関
数Ｇ_k（・）に相当する文字「Ａ」の標準パターンの学
習を行う場合、認識時に、例えば、ほぼ同一形状の、傾
きのない文字「Ａ」のみが認識対象として入力されるな
らば、そのような文字「Ａ」を、学習サンプルとして、
従来と同様の学習を行えば、例えば図３（Ａ）に示すよ
うな、入力された文字「Ａ」の特徴を反映した標準パタ
ーンが得られる。

【０１２３】しかしながら、認識時において、上述のよ
うな形の揃った、傾きのない文字「Ａ」が、常時入力さ
れることは皆無であり、通常は、例えば図３（Ｂ）に示
すように、傾きのない「Ａ」の他、右や左に傾いた
「Ａ」が入力される。このような場合、従来において
は、傾きのない「Ａ」、並びに右および左に傾いた
「Ａ」がそのままの状態で、標準パターンに、いわば包
含されるように学習が行われていたため、その結果得ら
れる文字「Ａ」の標準パターンは、極端には、図３
（Ｄ）に示すように、文字「Ａ」の特徴が損なわれたも
のとなっていた。

【０１２４】そこで、本願においては、文字「Ａ」の標
準パターンを、図３（Ｃ）に示すように、学習サンプル
としての文字「Ａ」の傾きに対応して回転し、即ち、ユ
ニバーサルパラメータΛに相当する標準パターンを、適
応用関数Ｆ（・）によって変換することにより学習サン
プルに適応させて学習を行うことで、文字「Ａ」の特徴
が充分に反映された標準パターンを得ることができるよ
うになされている。

【０１２５】そして、認識時においては、文字「Ａ」の
特徴が充分に反映された標準パターンを、認識対象とし
て入力された文字に適応させることで、認識性能を向上
させることができるようになされている。

【０１２６】ところで、学習時において行われる標準パ
ターンと学習サンプルとの適応は、図３（Ｃ）に示した
ように、文字「Ａ」の標準パターンを、学習サンプルと
しての文字「Ａ」の傾きに対応して回転することによ
り、標準パターンを学習サンプルに適応させることで行
うことができる他、例えば図４に示すように、学習サン
プルとしての文字「Ａ」を、その傾きに対応して回転す
ることにより、学習サンプルを標準パターンに適応させ
ることでも行うことができる。これは、認識時について
も同様のことがいえる。

【０１２７】そこで、図５は、そのような適応処理を行
うことにより音声の認識を行う音声認識装置の一実施例
の構成を示している。なお、図中、図１における場合と
対応する部分については同一の符号を付してあり、以下
では、その説明は、適宜、省略する。また、この音声認
識装置においては、図１における場合と同様に、話者に
適応した音声の認識が行われるようになされている。

【０１２８】上述したように、スイッチ３は、話者Ｖ_t
に対する適応を行う必要がある場合、端子ａを選択し、
これにより、音響分析部２から出力された特徴ベクトル
Ｏは、話者Ｖ_tに対する適応を行うための適応用のサン
プルＡ_tとして、スイッチ３および端子ａを介して、話
者適応器３４に出力される。

【０１２９】話者適応器３４では、適応用のサンプルＡ
_tに基づいて、特徴ベクトルＯを、後述する識別器３５
が記憶しているユニバーサル識別関数に適応させるため
の適応用パラメータΓ_(ML)tが算出され、適応ベクトル
算出器３６に供給される。

【０１３０】話者適応器３４から適応ベクトル算出器３
６に対し、適応用パラメータΓ_(ML) _tが出力されると、
スイッチ３は、端子ｂを選択し、これにより、音響分析
部２から出力された特徴ベクトルＯは、スイッチ３およ
び端子ｂを介して、適応ベクトル算出器３６に供給され
るようになる。

【０１３１】適応ベクトル算出器３６は、話者適応器３
４から適応用パラメータΓ_(ML)tを受信すると、音響分
析部２からスイッチ３および端子ｂを介して供給される
特徴ベクトルＯを、適応用パラメータΓ_(ML)tに基づい
て適応させる（変換する）。これにより、ユニバーサル
パラメータ記憶部１１に記憶されているユニバーサル識
別関数に適応した特徴パラメータ（本実施例において、
適宜、適応特徴パラメータという）Ｆ（Ｏ，γ _t,k ）が
算出される。この適応特徴パラメータＦ（Ｏ，γ _t,1 ）
乃至Ｆ（Ｏ，γ _t,k ）は、識別器３５の識別関数演算器
１３−１乃至１３−Ｋにそれぞれ供給される。

【０１３２】識別器３５では、入力された適応特徴ベク
トルが、ユニバーサル識別関数を用いて、所定の数Ｋの
クラスＣ_kのうちのいずれかに分類されるこで、マイク
１に入力された音声の識別（認識）が行われる。即ち、
ユニバーサルパラメータ記憶部１１からは、ユニバーサ
ルパラメータλ_kが読み出され、識別関数演算器１３−
ｋに供給される。識別関数演算器１３−ｋでは、ユニバ
ーサルパラメータλ_kで表現されるユニバーサル識別関
数の関数値が、適応特徴ベクトルＦ（Ｏ，γ _t,k ）を入
力値として計算され、クラス決定回路１４に出力され
る。クラス決定回路１４では、図１における場合と同様
にして、音声認識結果が決定されて出力される。

【０１３３】次に、図５の音声認識装置の認識（識別）
原理について説明するが、この音声認識装置では、基本
的には、上述したように、ユニバーサル識別関数Ｇ
_k（・）を適応させずに、入力された特徴ベクトルＯ
を、ユニバーサル識別関数Ｇ_k（・）に適応させて認識
を行うのであるから、適応用関数Ｆ（・）による変換の
対象が、ユニバーサル識別関数Ｇ_k（・）（ユニバーサ
ルパラメータΛ）ではなく、特徴ベクトルＯとなること
と、識別に際して用いる識別関数が、適応識別関数ｇ
_t,k（・）ではなく、ユニバーサル識別関数Ｇ_k（・）と
なることが、図１における場合と異なるだけである。

【０１３４】従って、クラス決定規則は、式（１）にお
ける適応識別関数ｇ_t,k（・）を、ユニバーサル識別関
数Ｇ_k（・）に置換するとともに、特徴ベクトルＯを、
それをユニバーサル識別関数Ｇ_k（・）に適応させた適
応特徴ベクトルＦ（Ｏ，γ _t,k ）に置換したものとな
る。即ち、この場合、クラス決定規則は、次式で定義さ
れる。

【０１３５】

【数２０】

【０１３６】また、適応用パラメータΓ_tの最尤推定値
Γ_(ML)tは、式（６）におけるＡ_tをＦ（Ａ_t，Γ_t）に、
Ｆ（Λ，Γ_t）をΛに、それぞれ置換した式（２９）、
および式（７）におけるＡ_tをＦ（Ａ_t，Γ_t）に、Ｆ
（Λ，Γ_t）をΛに、Ｏ_t,k,i ^(A)をＦ（Ｏ_t,k,i ^(A)，γ
_t,k）に、Ｆ（λ_k，γ_t,k）をλ_kに、それぞれ置換した
式（３０）にしたがって得ることができる。

【０１３７】

【数２１】

【数２２】

【０１３８】よって、式（２９）により適応用パラメー
タΓ_t（適応用パラメータの最尤推定値Γ_(ML)t）を得た
後は、式（２８）における左辺におけるＦ（Ｏ，
γ_t,k）、即ち、適応特徴ベクトルを計算し、式（２
８）で示される条件を満たすｋを求めることで、入力さ
れた特徴ベクトルＯの識別結果であるクラスＣ_kを得る
ことができる。

【０１３９】図５の音声認識装置では、以上の原理に基
づき、クラスＣ_kのサフィックスｋが、音声認識結果と
して出力される。即ち、話者適応器３４では、適応用の
サンプルＡ_tを用い、式（２９）にしたがって、適応用
パラメータΓ_t（最尤推定値Γ_(ML) _t）が求められる。適
応ベクトル算出器３６では、特徴ベクトルＯが、話者適
応器３４で求められた適応用パラメータΓ_tを用い、式
Ｆ（Ｏ，Γ_t）にしたがって変換され、これにより、特
徴ベクトルＯを、ユニバーサル識別関数Ｇ_k（・）に適
応に適応させた適応特徴ベクトルＦ（Ｏ，γ_t,1），Ｆ
（Ｏ，γ_t,2），・・・，Ｆ（Ｏ，γ_t,K）が算出され
る。そして、識別関数演算器１３−１乃至１３−Ｋで
は、ユニバーサルパラメータλ₁，λ₂，・・・，λ_Kで
表される適応識別関数Ｇ_k（・）の、適応特徴ベクトル
Ｆ（Ｏ，γ_t,1），Ｆ（Ｏ，γ_t,2），・・・，Ｆ（Ｏ，
γ_t,K）についての関数値Ｇ₁（Ｆ（Ｏ，γ_t,1）），Ｇ₂
（Ｆ（Ｏ，γ_t,2）），・・・，Ｇ_K（Ｆ（Ｏ，
γ_t,K））が計算される。その後、クラス決定回路１４
では、関数値Ｇ₁（Ｆ（Ｏ，γ_t,1）），Ｇ₂（Ｆ（Ｏ，
γ_t,2）），・・・，Ｇ_K（Ｆ（Ｏ，γ_t,K））を用い
て、式（２８）を満たすｋが求められる。

【０１４０】次に、図５に示した音声認識装置において
用いられるユニバーサル識別関数Ｇ_k（・）、即ち、ユ
ニバーサルパラメータΛの算出方法（学習方法）につい
て説明するが、基本的には、上述したように、ユニバー
サル識別関数Ｇ_k（・）を適応させずに、学習サンプル
Ｘを、ユニバーサル識別関数Ｇ_k（・）に適応させて学
習をを行うのであるから、適応用関数Ｆ（・）による変
換の対象が、ユニバーサル識別関数Ｇ_k（・）（ユニバ
ーサルパラメータΛ）ではなく、学習サンプルＸとなる
ことが、ユニバーサル識別関数Ｇ_k（・）を学習サンプ
ルＸに適応させながら学習を行う場合と異なるだけであ
る（本実施例中では、適宜、学習サンプルＸをユニバー
サル識別関数Ｇ_k（・）に適応させたもの、即ち、学習
サンプルＸを適応用関数Ｆ（・）にしたがって変換した
ものを、適応学習サンプルという）。

【０１４１】従って、上述した式（１４）乃至（１８）
における適応用関数Ｆ（・）による変換の対象を、ユニ
バーサルパラメータΛではなく、学習サンプルＸ（ある
いは、適応用のサンプルＢ_t,h）に替えた場合には、式
（３１）乃至（３５）がそれぞれ得られるから、ユニバ
ーサルパラメータΛの最尤推定値Λ_(ML)は、式（３５）
にしたがって、式（３３）を最大化することで、求める
ことができる。

【０１４２】

【数２３】

【数２４】

【数２５】

【数２６】

【数２７】

【０１４３】図６は、以上のような原理に基づいて、ユ
ニバーサル識別関数Ｇ_k（・）、即ち、ユニバーサルパ
ラメータΛを算出する識別関数算出装置の一実施例の構
成を示している。なお、図中、図２における場合と対応
する部分については同一の符号を付してあり、以下で
は、その説明は、適宜省略する。

【０１４４】適応用パラメータ算出器４２には、適応用
関数パラメータ算出用学習サンプル抽出器２１で抽出さ
れたサンプルＢ_t,hと、ユニバーサルパラメータ算出器
４３からユニバーサルパラメータΛとが供給される。適
応用パラメータ算出器４２では、適応用関数パラメータ
算出用学習サンプル抽出器２１からのサンプルＢ
_t,hを、ユニバーサルパラメータ算出器４３からのユニ
バーサルパラメータΛに適応させるための適応用パラメ
ータΓが算出される。即ち、適応用パラメータ算出器４
２は、式（３４）にしたがって、適応用パラメータΓの
最尤推定値Γ_(ML)t,hを算出する。この適応用パラメー
タΓ_(ML)t,hは、ユニバーサルパラメータ算出器４３に
出力される。

【０１４５】ユニバーサルパラメータ算出器４３では、
式（３５）にしたがって、ユニバーサルパラメータΛの
最尤推定値Λ_(ML)が求められる。即ち、ユニバーサルパ
ラメータ算出器４３では、適応用パラメータ算出器４２
からの適応用パラメータΓ_(M _L)t,hに基づいて、学習サ
ンプルＸが変換され、これにより、式（３３）における
Ｆ（Ｘ_t，Γ_(ML)t,h）、即ち、適応学習サンプルが求め
られる。そして、その適応学習サンプルＦ（Ｘ，Γ
_(ML)t,h）に対する尤度（対数尤度）Ｕ₂を最も高くする
ユニバーサルパラメータΛ_(ML)が算出される。

【０１４６】さらに、ユニバーサルパラメータ算出器４
３は、ユニバーサルパラメータΛ_(M _L)を与える対数尤度
Ｕ₂が、例えば所定の閾値以上であるかどうかを判定す
る。そして、対数尤度Ｕ₂が、所定の閾値以上でない場
合、その対数尤度Ｕ₂が向上するようなユニバーサルパ
ラメータΛを、適応用パラメータ算出器４２に供給す
る。適応用パラメータ算出器４２は、新たなユニバーサ
ルパラメータを受信すると、再び、式（３４）にしたが
って、適応用パラメータΓの最尤推定値Γ_(ML)t,hを算
出し、ユニバーサルパラメータ算出器４３に出力する。

【０１４７】以下、適応用パラメータ算出器４２および
ユニバーサルパラメータ算出器４３では、ユニバーサル
パラメータΛ_(ML)を与える対数尤度Ｕ₂が所定の閾値以
上となるまで、同様の処理が繰り返される。

【０１４８】そして、ユニバーサルパラメータΛ_(ML)を
与える対数尤度Ｕ₂が所定の閾値以上となると、ユニバ
ーサルパラメータ算出器４３は、そのユニバーサルパラ
メータΛ_(ML)を、メモリ２４に出力して記憶させる。

【０１４９】以上のように、変動状態Ｖ_tとユニバーサ
ル識別関数Ｇ_k（・）との関係に応じて、学習サンプル
Ｘ_tを、ユニバーサル識別関数Ｇ_k（・）に適応させなが
ら学習を行うようにしたので、適応処理を行ったときに
最高の性能を発揮するようなユニバーサル識別関数Ｇ_k
（・）を得ることができ、その結果、認識時において、
このユニバーサル識別関数Ｇ_k（・）を用いることで、
認識率を向上させることができる。

【０１５０】なお、式（３１）におけるｐ（Γ_t｜Λ）
が、比較的少ない数のパラメータで表され、サンプルＢ
_t,hとして、比較的多くのサンプルが与えられた場合、
適応用パラメータΓ_tの分散は非常に小さくなる。そこ
で、適応用パラメータΓ_tの分散を０と仮定すると、上
述した式（１９）乃至（２１）にそれぞれ相当する式
（３６）乃至（３８）を得ることができる。

【０１５１】

【数２８】

【数２９】

【数３０】

【０１５２】従って、この場合、ユニバーサルパラメー
タΛの最尤推定値Λ_(ML)は、式（３８）におけるＵ
₄（Ｘ，Λ，Γ）を、ΛおよびΓの両方に関して最大化
することにより求めることができる。

【０１５３】以上、本発明を、音声の認識を行う場合に
適用した場合について説明したが、本発明は、音声の認
識を行う場合の他、例えば画像の認識を行う場合などの
あらゆるパターン認識を行う場合に適用可能である。

【０１５４】なお、本実施例においては、ユニバーサル
識別関数の具体例として、正規分布識別関数を用いた場
合を説明したが、ユニバーサル識別関数としては、正規
分布識別関数の他、例えばマハラノビス識別関数や、Ｈ
ＭＭ（Hidden Markov Model）による識別関数、多項式
識別関数、ニューラルネットワークにより表現される識
別関数などを用いることが可能である。

【０１５５】また、本実施例では、適応用パラメータと
して、加算ベクトルを算出し、この加算ベクトルを用い
て、ユニバーサル識別関数を適応させる変換を行う場合
について説明したが、適応用パラメータとしては、加算
ベクトルの他、例えば、線形変換を行うパラメータなど
を算出するようにし、これを用いて、ユニバーサル識別
関数を線形変換することで適応させるようにすることが
可能である。さらに、ユニバーサル識別関数を適応させ
る変換としては、例えば１次変換や、２次以上の項を含
んだ多項式変換、ニューラルネットワークによる変換な
どを用いることが可能である。また、学習サンプルを適
応させる変換についても、同様の変換手法を用いること
が可能である。

【０１５６】さらに、本実施例では、ユニバーサル識別
関数を学習サンプルに適応させる場合において、ユニバ
ーサルパラメータの最尤推定値を求めるようにしたが、
即ち、適応識別関数の、学習サンプルに対する尤度（対
数尤度）を評価基準とし、その尤度を最大化するユニバ
ーサルパラメータを求めるようにしたが、その他、例え
ば相互情報量や誤認識率などを評価基準とし、相互情報
量を最大化するユニバーサルパラメータや、誤認識率を
最小化するユニバーサルパラメータなどを求めるように
することが可能である。同様に、学習サンプルをユニバ
ーサル識別関数に適応させる場合においても、尤度以外
に、例えば相互情報量や誤認識率などを評価基準として
用いることが可能である。

【０１５７】また、本実施例では、ユニバーサル識別関
数を学習サンプルに適応させるために、適応用パラメー
タの最尤推定値を求めるようにしたが、即ち、適応識別
関数の、学習サンプルに対する尤度（対数尤度）を評価
基準とし、その尤度を最大化する適応用パラメータを求
めるようにしたが、この適応用パラメータについても、
尤度の他、相互情報量や誤認識率などを評価基準として
用いることが可能である。さらに、学習サンプルをユニ
バーサル識別関数に適応させる場合においても同様に、
評価基準として、尤度の他、例えば相互情報量や誤認識
率などを用いることができる。

【０１５８】また、本実施例では、１クラスに対し、１
つのユニバーサル識別関数を用意するようにしたが、こ
の他、例えば、１つのクラスに対しては、複数のユニバ
ーサル識別関数を割り当てることも可能である。

【０１５９】

【０１６０】

【発明の効果】請求項１に記載の識別装置および請求項
２に記載の識別方法によれば、特徴ベクトルに対し、識
別関数を適応させ、その結果得られる適応識別関数を用
いて、特徴ベクトルが識別される。この場合において、
識別関数は、それを、学習サンプルに適応させながら学
習を行うことにより得られたものとされている。従っ
て、識別関数は、それを適応処理したときに高い性能を
発揮するものであるから、特徴ベクトルの識別率を向上
させることができる（誤認識率を低減することができ
る）。

【０１６１】請求項３に記載の音声認識装置によれば、
特徴ベクトルに対し、識別関数を適応させ、その結果得
られる適応識別関数を用いて、特徴ベクトルが、所定の
数のクラスのうちのいずれかに分類される。この場合に
おいて、識別関数は、それを、学習サンプルに適応させ
ながら学習を行うことにより得られたものとされてい
る。従って、識別関数は、それを適応処理したときに高
い性能を発揮するものであるから、音声の認識率を向上
させることができる。

【０１６２】

【０１６３】請求項４に記載の識別装置および請求項５
に記載の識別方法によれば、識別関数に対し、特徴ベク
トルを適応させ、その結果得られる適応特徴ベクトル
が、識別関数を用いて識別される。この場合において、
識別関数は、それに、学習サンプルを適応させながら学
習を行うことにより得られたものとされている。従っ
て、識別関数は、特徴ベクトルを適応処理したときに高
い性能を発揮するものであるから、特徴ベクトルの識別
率を向上させることができる。

【０１６４】請求項６に記載の音声認識装置によれば、
識別関数に対し、特徴ベクトルを適応させ、その結果得
られる適応特徴ベクトルが、識別関数を用いて、所定の
数のクラスのうちのいずれかに分類される。この場合に
おいて、識別関数は、それに、学習サンプルを適応させ
ながら学習を行うことにより得られたものとされてい
る。従って、識別関数は、特徴ベクトルを適応処理した
ときに高い性能を発揮するものであるから、音声の認識
率を向上させることができる。

【図面の簡単な説明】

【図１】本発明を適用した音声認識装置の第１実施例の
構成を示すブロック図である。

【図２】本発明を適用した識別関数算出装置の第１実施
例の構成を示すブロック図である。

【図３】本発明の原理を説明するための図である。

【図４】本発明の原理を説明するための図である。

【図５】本発明を適用した音声認識装置の第２実施例の
構成を示すブロック図である。

【図６】本発明を適用した識別関数算出装置の第２実施
例の構成を示すブロック図である。

【図７】従来の識別関数算出装置の一例の構成を示すブ
ロック図である。

【符号の説明】

１マイク２音響分析部３スイッチ４話者適応器５識別器１１ユニバーサルパラメータ記憶部１２適応パラメータ算出器１３（１３−１乃至１３−Ｋ）識別関数演算器１４クラス決定回路２１適応用関数パラメータ算出用学習サンプル抽出器２２適応用パラメータ算出器２３ユニバーサルパラメータ算出器２４メモリ３４話者適応器３５識別器３６適応ベクトル算出器４２適応用パラメータ算出器４３ユニバーサルパラメータ算出器

フロントページの続き (56)参考文献特開昭58−29226（ＪＰ，Ａ) Ａ．Ｂｉｅｍ，Ｓ．Ｋａｔａｇｉｒｉ，Ｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｂａｓｅｄｏｎｍｉｎｉｍｕｍｃｌａｓｓｉｆｉｃａｔｉｏｎｅｒｒｏｒ／ｇｅｎｅｒａｌｉｚｅｄｐｒｏｂａｂｉｌｉｓｔｉｃｄｅｃｅｎｔｍｅｔｈｏｄ，Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ 1993 ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（Ｉ，米国，1993年４月27日，Ｖｏｌ．２，Ｐａｇｅｓ 275−278) Ｂ．Ｈ．Ｊｕａｎｇ，Ｓ．Ｋａｔａｇｉｒｉ，Ｄｉｓｃｒｉｍｉｎａｔｉｖｅｌｅａｒｎｉｎｇｆｏｒｍｉｎｉｍｕｍｅｒｒｏｒｃｌａｓｓｉｆｉｃａｔｉｏｎ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，米国, 1992年12月，Ｖｏｌ．40，Ｎｏ．12, Ｐａｇｅｓ 3043−3054 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/10 - 15/28 G06K 9/68 ＪＩＣＳＴファイル（ＪＯＩＳ) ＩＥＥＥＸｐｌｏｒｅ

Claims

(57)【特許請求の範囲】

【請求項１】入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別装置において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億手段
と、前記特徴ベクトルに基づいて、前記ユニバーサル識別関
数を所定の変動状態に適応させるための適応用パラメー
タを算出する適応手段と、前記ユニバーサル識別関数を構成するパラメータを読み
出し、前記ユニバーサル識別関数を前記適応用パラメー
タにより適応させて、適応識別関数を構成するパラメー
タを算出する適応パラメータ算出手段と、前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、前記適応識別関数の関数値からクラスを決定するクラス
決定手段とを備えることを特徴とする識別装置。
【請求項２】入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別方法において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億ステ
ップと、前記特徴ベクトルに基づいて、前記ユニバーサル識別関
数を所定の変動状態に適応させるための適応用パラメー
タを算出する適応ステップと、前記ユニバーサル識別関数を構成するパラメータを読み
出し、前記ユニバーサル識別関数を前記適応用パラメー
タにより適応させて、適応識別関数を構成するパラメー
タを算出する適応パラメータ算出ステップと、前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算ステップと、前記適応識別関数の関数値からクラスを決定するクラス
決定ステップとを含むことを特徴とする識別方法。
【請求項３】入力された音声の特徴ベクトルを所定ク
ラスに分類することにより音声を認識する音声認識装置
において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億手段
と、前記特徴ベクトルに基づいて、前記ユニバーサル識別関
数を所定の話者に適応させるための適応用パラメータを
算出する話者適応手段と、前記ユニバーサル識別関数を構成するパラメータを読み
出し、前記ユニバーサル識別関数を前記適応用パラメー
タにより適応させて適応識別関数を構成するパラメータ
を算出する適応パラメータ算出手段と、前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、前記適応識別関数の関数値からクラスを決定するクラス
決定手段とを備えることを特徴とする音声認識装置。
【請求項４】入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別装置において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億手段
と、前記特徴ベクトルを前記ユニバーサル識別関数に適応さ
せるための適応用パラメータを算出する適応手段と、前記適応用パラメータにより前記特徴ベクトルを、前記
ユニバーサル識別関数に適応させて適応特徴パラメータ
を算出する適応ベクトル算出手段と、前記ユニバーサル識別関数を構成するパラメータおよび
前記適応特徴パラメータから適応識別関数の関数値を演
算する識別関数演算手段と、前記適応識別関数の関数値からクラスを決定するクラス
決定手段とを備えることを特徴とする識別装置。
【請求項５】入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別方法において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億ステ
ップと、前記特徴ベクトルを前記ユニバーサル識別関数に適応さ
せるための適応用パラメータを算出する適応ステップ
と、前記適応用パラメータにより前記特徴ベクトルを、前記
ユニバーサル識別関数に適応させて適応特徴パラメータ
を算出する適応ベクトル算出ステップと、前記ユニバーサル識別関数を構成するパラメータおよび
前記適応特徴パラメータから適応識別関数の関数値を演
算する識別関数演算ステップと、前記適応識別関数の関数値からクラスを決定するクラス
決定ステップとを含むことを特徴とする識別方法。
【請求項６】入力された音声の特徴ベクトルを所定ク
ラスに分類することにより音声を認識する音声認識方法
において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億ステ
ップと、所定の話者により入力された音声の前記特徴ベクトル
を、前記ユニバーサル識別関数に適応させるための適応
用パラメータを算出する話者適応ステップと、前記適応用パラメータにより前記特徴ベクトルを、前記
ユニバーサル識別関数に適応させて適応特徴パラメータ
を算出する適応ベクトル算出ステップと、前記ユニバーサル識別関数を構成するパラメータおよび
前記適応特徴パラメータから適応識別関数の関数値を演
算する識別関数演算ステップと、前記適応識別関数の関数値からクラスを決定するクラス
決定ステップとを含むことを特徴とする音声認識方法。
【請求項７】入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別装置において、変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億手段と、前記特徴ベクトルに基づいて、前記識別関数を所定の変
動状態に適応させるための適応用パラメータを算出する
適応手段と、前記識別関数を構成するパラメータを読み出し、前記識
別関数を前記適応用パラメータにより適応させて、適応
識別関数を構成するパラメータを算出する適応パラメー
タ算出手段と、前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、前記適応識別関数の関数値からクラスを決定するクラス
決定手段とを備えることを特徴とする識別装置。
【請求項８】入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別方法において、変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億ステップと、前記特徴ベクトルに基づいて、前記識別関数を所定の変
動状態に適応させるための適応用パラメータを算出する
適応ステップと、前記識別関数を構成するパラメータを読み出し、前記識
別関数を前記適応用パラメータにより適応させて、適応
識別関数を構成するパラメータを算出する適応パラメー
タ算出ステップと、前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算ステップと、前記適応識別関数の関数値からクラスを決定するクラス
決定ステップとを含むことを特徴とする識別方法。
【請求項９】入力された音声の特徴ベクトルを所定ク
ラスに分類することにより音声を認識する音声認識装置
において、変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億手段と、前記特徴ベクトルに基づいて、前記識別関数を所定の話
者に適応させるための適応用パラメータを算出する話者
適応手段と、前記識別関数を構成するパラメータを読み出し、前記識
別関数を前記適応用パラメータにより適応させて適応識
別関数を構成するパラメータを算出する適応パラメータ
算出手段と、前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、前記適応識別関数の関数値からクラスを決定するクラス
決定手段とを備えることを特徴とする音声認識装置。