JP3536471B2 - 識別装置および識別方法、並びに音声認識装置および音声認識方法 - Google Patents
識別装置および識別方法、並びに音声認識装置および音声認識方法Info
- Publication number
- JP3536471B2 JP3536471B2 JP24789095A JP24789095A JP3536471B2 JP 3536471 B2 JP3536471 B2 JP 3536471B2 JP 24789095 A JP24789095 A JP 24789095A JP 24789095 A JP24789095 A JP 24789095A JP 3536471 B2 JP3536471 B2 JP 3536471B2
- Authority
- JP
- Japan
- Prior art keywords
- function
- discriminant function
- adaptive
- parameters
- universal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
別方法、並びに音声認識装置および音声認識方法に関す
る。特に、例えば音声認識や画像認識などのパターン認
識を行う場合に用いて好適な識別装置および識別方法、
並びに音声認識装置および音声認識方法に関する。
ーン認識では、入力されたパターンから特徴ベクトルを
抽出し、その特徴ベクトルを入力値にして、識別関数の
関数値を計算するようになされている。識別関数は、入
力された特徴ベクトルを、所定の数のクラスのうちのい
ずれかに分類するためのもので、少なくともクラスの数
だけ用意されており、入力された特徴ベクトルに対し、
その関数値を最も大きくする識別関数に対応するクラス
が、認識結果(識別結果)として出力される。
動要因の状態が変化しても、高い認識性能が得られるこ
とが望ましい。そこで、従来より、パターン認識を行う
ための識別関数の学習は、多くの変動状態において観測
された学習サンプルを用いて行われるようになされてい
る。
ば、発話環境、話者、入力機器系の特性(例えば、マイ
クや、そのマイクの出力をA/D変換するA/D変換器
の特性など)などの、音声の変動要因の状態が変化して
も、これらの変動に対して耐性の高い識別関数(例え
ば、音韻認識を行う場合であれば、音韻識別関数)を得
ることができるように、多くの変動状態において観測さ
れた音声データを、学習サンプルとして、学習が行われ
る。
は、例えば「確率モデルによる音声認識」、中川聖一、
電子情報通信学会や、KAI-FU LEE, Context-Dependent
Phonetic Hidden Markov Models for Speaker-Independ
ent Continuous Speech Recognition, IEEE Transactio
n on ASSP VOL. 38, NO. 4, APRIL 1990などに、その詳
細が開示されている。
構成を示している。多くの学習サンプルが、識別関数算
出器51に入力され、そこでは、その学習サンプルに基
づいて、識別関数、即ち、識別関数を表すパラメータ
(識別関数を構成するパラメータ)が求められる。
得られた識別関数を、そのまま用いた場合、必ずしも満
足する認識性能を得ることができないことがあった。そ
こで、より高い認識性能を得るために、認識時におい
て、例えば、識別関数を、音声の変動要因の状態に適応
させる方法がある。例えば、音韻識別関数を、話者に適
用させる方法としては、Chin-Hui Lee et al., A Study
on Speaker Adaptationof the Parameters of Continu
ous Density Hidden Markov Models, IEEE, Transsacti
on on signal processing, VOL. 39, NO. 4, 1991や、
F. Class, et al., Fast Speaker Adaptation for Spee
ch Recognition Systems, Proceeding ofIEEE ICASSP,
pp. 133-136, 1990などに開示されているものなどがあ
る。
時においては、上述のように、認識時に用いられる適応
方法とは無関係に識別関数が求められる(決定される)
ようになされていた。即ち、識別関数は、適応が行われ
ないときに最高の性能を発揮するような基準を用いて決
定されていた。このため、認識時に、そのような識別関
数を用いて適応を行ったとしても、必ずしも最適な適応
を行うことができず、その結果、適応処理を行っても、
識別率(認識率)を、大きく向上させるのは困難であっ
た。
たものであり、パターン認識を行うにあたって最適な適
応を行うことができるようにし、これにより識別率(認
識率)を大きく向上させることができるようにするもの
である。
置は、変動状態に依存しないユニバーサル識別関数を構
成するパラメータを記憶するユニバーサルパラメータ記
億手段と、特徴ベクトルに基づいて、ユニバーサル識別
関数を所定の変動状態に適応させるための適応用パラメ
ータを算出する適応手段と、ユニバーサル識別関数を構
成するパラメータを読み出し、ユニバーサル識別関数を
適応用パラメータにより適応させて、適応識別関数を構
成するパラメータを算出する適応パラメータ算出手段
と、適応識別関数を構成するパラメータおよび特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
手段と、適応識別関数の関数値からクラスを決定するク
ラス決定手段とを備えることを特徴とする。
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、特
徴ベクトルに基づいて、ユニバーサル識別関数を所定の
変動状態に適応させるための適応用パラメータを算出す
る適応ステップと、ユニバーサル識別関数を構成するパ
ラメータを読み出し、ユニバーサル識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータを算出する適応パラメータ算出ステップと、適
応識別関数を構成するパラメータおよび特徴ベクトルか
ら適応識別関数の関数値を演算する識別関数演算ステッ
プと、適応識別関数の関数値からクラスを決定するクラ
ス決定ステップとを含むことを特徴とする。
態に依存しないユニバーサル識別関数を構成するパラメ
ータを記憶するユニバーサルパラメータ記億手段と、特
徴ベクトルに基づいて、ユニバーサル識別関数を所定の
話者に適応させるための適応用パラメータを算出する話
者適応手段と、ユニバーサル識別関数を構成するパラメ
ータを読み出し、ユニバーサル識別関数を適応用パラメ
ータにより適応させて適応識別関数を構成するパラメー
タを算出する適応パラメータ算出手段と、適応識別関数
を構成するパラメータおよび特徴ベクトルから適応識別
関数の関数値を演算する識別関数演算手段と、適応識別
関数の関数値からクラスを決定するクラス決定手段とを
備えることを特徴とする。
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億手段と、特徴ベ
クトルをユニバーサル識別関数に適応させるための適応
用パラメータを算出する適応手段と、適応用パラメータ
により特徴ベクトルを、ユニバーサル識別関数に適応さ
せて適応特徴パラメータを算出する適応ベクトル算出手
段と、ユニバーサル識別関数を構成するパラメータおよ
び適応特徴パラメータから適応識別関数の関数値を演算
する識別関数演算手段と、適応識別関数の関数値からク
ラスを決定するクラス決定手段とを備えることを特徴と
する。
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、特
徴ベクトルをユニバーサル識別関数に適応させるための
適応用パラメータを算出する適応ステップと、適応用パ
ラメータにより特徴ベクトルを、ユニバーサル識別関数
に適応させて適応特徴パラメータを算出する適応ベクト
ル算出ステップと、ユニバーサル識別関数を構成するパ
ラメータおよび適応特徴パラメータから適応識別関数の
関数値を演算する識別関数演算ステップと、適応識別関
数の関数値からクラスを決定するクラス決定ステップと
を含むことを特徴とする。
態に依存しないユニバーサル識別関数を構成するパラメ
ータを記憶するユニバーサルパラメータ記億ステップ
と、所定の話者により入力された音声の特徴ベクトル
を、ユニバーサル識別関数に適応させるための適応用パ
ラメータを算出する話者適応ステップと、適応用パラメ
ータにより特徴ベクトルを、ユニバーサル識別関数に適
応させて適応特徴パラメータを算出する適応ベクトル算
出ステップと、ユニバーサル識別関数を構成するパラメ
ータおよび適応特徴パラメータから適応識別関数の関数
値を演算する識別関数演算ステップと、適応識別関数の
関数値からクラスを決定するクラス決定ステップとを含
むことを特徴とする。請求項7に記載の識別装置は、変
動状態に依存しない識別関数を構成するパラメータを記
憶するパラメータ記億手段と、特徴ベクトルに基づい
て、識別関数を所定の変動状態に適応させるための適応
用パラメータを算出する適応手段と、識別関数を構成す
るパラメータを読み出し、識別関数を適応用パラメータ
により適応させて、適応識別関数を構成するパラメータ
を算出する適応パラメータ算出手段と、適応識別関数を
構成するパラメータおよび特徴ベクトルから適応識別関
数の関数値を演算する識別関数演算手段と、適応識別関
数の関数値からクラスを決定するクラス決定手段とを備
えることを特徴とする。 請求項8に記載の識別方法は、
変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億ステップと、特徴ベクトルに基
づいて、識別関数を所定の変動状態に適応させるための
適応用パラメータを算出する適応ステップと、識別関数
を構成するパラメータを読み出し、識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータを算出する適応パラメータ算出ステップと、適
応識別関数を構成するパラメータおよび特徴ベクトルか
ら適応識別関数の関数値を演算する識別関数演算ステッ
プと、適応識別関数の関数値からクラスを決定するクラ
ス決定ステップとを含むことを特徴とする。 請求項9に
記載の音声認識装置は、変動状態に依存しない識別関数
を構成するパラメータを記憶するパラメータ記億手段
と、特徴ベクトルに基づいて、識別関数を所定の話者に
適応させるための適応用パラメータを算出する話者適応
手段と 、識別関数を構成するパラメータを読み出し、識
別関数を適応用パラメータにより適応させて適応識別関
数を構成するパラメータを算出する適応パラメータ算出
手段と、適応識別関数を構成するパラメータおよび特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、適応識別関数の関数値からクラスを決定す
るクラス決定手段とを備えることを特徴とする。
に記載の識別方法においては、変動状態に依存しないユ
ニバーサル識別関数を構成するパラメータが記憶され、
特徴ベクトルに基づいて、ユニバーサル識別関数を所定
の変動状態に適応させるための適応用パラメータが算出
されるとともに、ユニバーサル識別関数を構成するパラ
メータが読み出され、ユニバーサル識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータが算出される。そして、適応識別関数を構成す
るパラメータおよび特徴ベクトルから適応識別関数の関
数値が演算され、適応識別関数の関数値からクラスが決
定される。
は、変動状態に依存しないユニバーサル識別関数を構成
するパラメータが記憶され、特徴ベクトルに基づいて、
ユニバーサル識別関数を所定の話者に適応させるための
適応用パラメータが算出されるとともに、ユニバーサル
識別関数を構成するパラメータが読み出され、ユニバー
サル識別関数を適応用パラメータにより適応させて適応
識別関数を構成するパラメータが算出される。そして、
適応識別関数を構成するパラメータおよび特徴ベクトル
から適応識別関数の関数値が演算され、適応識別関数の
関数値からクラスが決定される。
に記載の識別方法においては、変動状態に依存しないユ
ニバーサル識別関数を構成するパラメータが記憶され、
特徴ベクトルをユニバーサル識別関数に適応させるため
の適応用パラメータが算出されるとともに、適応用パラ
メータにより特徴ベクトルを、ユニバーサル識別関数に
適応させて適応特徴パラメータが算出される。そして、
ユニバーサル識別関数を構成するパラメータおよび適応
特徴パラメータから適応識別関数の関数値が演算され、
適応識別関数の関数値からクラスが決定される。
は、変動状態に依存しないユニバーサル識別関数を構成
するパラメータが記憶され、所定の話者により入力され
た音声の特徴ベクトルを、ユニバーサル識別関数に適応
させるための適応用パラメータが算出されるとともに、
適応用パラメータにより特徴ベクトルを、ユニバーサル
識別関数に適応させて適応特徴パラメータが算出され
る。そして、ユニバーサル識別関数を構成するパラメー
タおよび適応特徴パラメータから適応識別関数の関数値
が演算され、適応識別関数の関数値からクラスが決定さ
れる。 請求項7に記載の識別装置および請求項8に記載
の識別方法においては、変動状態に依存しない識別関数
を構成するパラメータが記憶され、特徴ベクトルに基づ
いて、識別関数を所定の変動状態に適応させるための適
応用パラメータが算出されるとともに、識別関数を構成
するパラメータが読み出され、識別関数を適応用パラメ
ータにより適応させて、適応識別関数を構成するパラメ
ータが算出される。そして、適応識別関数を構成するパ
ラメータおよび特徴ベクトルから適応識別関数の関数値
が演算され、適応識別関数の関数値からクラスが決定さ
れる。 請求項9に記載の音声認識装置においては、変動
状態に依存しない識別関数を構成するパラメータが記憶
され、特徴ベクトルに基づいて、識別関数を所定の話者
に適応させるための適応用パラメータが算出され、識別
関数を構成するパラメータが読み出され、識別関数を適
応用パラメータにより適応させて適応識別関数を構成す
るパラメータが算出される。そして、適応識別関数を構
成するパラメータおよび特徴ベクトルから適応識別関数
の関数値が演算され、適応識別関数の関数値からクラス
が決定される。
るが、その前に、特許請求の範囲に記載の発明の各手段
と以下の実施例との対応関係を明らかにするために、各
手段の後の括弧内に、対応する実施例(但し、一例)を
付加して、本発明の特徴を記述すると、次のようにな
る。
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
に分類することにより識別を行う識別装置(例えば、図
1の識別器5)において、変動状態に依存しないユニバ
ーサル識別関数(例えば、ユニバーサル識別関数G
k (O))を構成するパラメータ(例えば、ユニバーサ
ルパラメータλ k )を記憶するユニバーサルパラメータ
記億手段(例えば、ユニバーサルパラメータ記憶部1
1)と、前記特徴ベクトルに基づいて、前記ユニバーサ
ル識別関数を所定の変動状態(例えば、変動状態V t )
に適応させるための適応用パラメータ(例えば、適応用
パラメータΓ (ML)t )を算出する適応手段(例えば、図
1の話者適応器4)と、前記ユニバーサル識別関数を構
成するパラメータを読み出し、前記ユニバーサル識別関
数を前記適応用パラメータにより適応させて、適応識別
関数を構成するパラメータ(例えば、パラメータ
ψ t,k )を算出する適応パラメータ算出手段(例えば、
図1の適応パラメータ算出器12)と、前記適応識別関
数を構成するパラメータおよび前記特徴ベクトルから適
応識別関数の関数値を演算する識別関数演算手段(例え
ば、図1の識別関数演算器13−k)と、前記適応識別
関数の関数値からクラスを決定するクラス決定手段(例
えば、図1のクラス決定回路14)とを備えることを特
徴とする。
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
に分類することにより識別を行う識別方法において、変
動状態に依存しないユニバーサル識別関数(例えば、ユ
ニバーサル識別関数G k (O))を構成するパラメータ
(例えば、ユニバーサルパラメータλ k )を記憶するユ
ニバーサルパラメータ記億ステップと、前記特徴ベクト
ルに基づいて、前記ユニバーサル識別関数を所定の変動
状態(例えば、変動状態V t )に適応させるための適応
用パラメータ(例えば、適応用パラメータΓ (ML)t )を
算出する適応ステップと、前記ユニバーサル識別関数を
構成するパラメータを読み出し、前記ユニバーサル識別
関数を前記適応用パラメータにより適応させて、適応識
別関数を構成するパラメータ(例えば、パラメータψ
t,k )を算出する適応パラメータ算出ステップと、前記
適応識別関数を構成するパラメータおよび前記特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
ステップと、前記適応識別関数の関数値からクラスを決
定するクラス決定ステップとを含むことを特徴とする。
れた音声の特徴ベクトル(例えば、特徴ベクトルO)を
所定クラスに分類することにより音声を認識する音声認
識装置において、変動状態に依存しないユニバーサル識
別関数(例えば、ユニバーサル識別関数G k (O))を
構成するパラメータ(例えば、ユニバーサルパラメータ
λ k )を記憶するユニバーサルパラメータ記億手段(例
えば、ユニバーサルパラメータ記憶部11)と、前記特
徴ベクトルに基づいて、前記ユニバーサル識別関数を所
定の話者に適応させるための適応用パラメータ(例え
ば、適応用パラメータΓ (ML)t )を算出する話者適応手
段(例えば、図1の話者適応器4)と、前記ユニバーサ
ル識別関数を構成するパラメータを読み出し、前記ユニ
バーサル識別関数を前記適応用パラメータにより適応さ
せて適応識別関数を構成するパラメータ(例えば、パラ
メータψ t,k )を算出する適応パラメータ算出手段(例
えば、図1の適応パラメータ算出器12)と、前記適応
識別関数を構成するパラメータおよび前記特徴ベクトル
から適応識別関数の関数値を演算する識別関数演算手段
(例えば、図1の識別関数演算器13−k)と、前記適
応識別関数の関数値からクラスを決定するクラス決定手
段(例えば、図1のクラス決定回路14)とを備えるこ
とを特徴とする。
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
に分類することにより識別を行う識別装置(例えば、図
5の識別器35)において、変動状態に依存しないユニ
バーサル識別関数(例えば、ユニバーサル識別関数G k
(O))を構成するパラメータを記憶するユニバーサル
パラメータ記億手段(例えば、図5のユニバーサルパラ
メータ記憶部11)と、前記特徴ベクトルを前記ユニバ
ーサル識別関数に適応させるための適応用パラメータ
(例えば、適応用パラメータΓ (ML)t )を算出する適応
手段(例えば、図5の話者適応器34)と、前記適応用
パラメータにより前記特徴ベクトルを、前記ユニバーサ
ル識別関数に適応させて適応特徴パラメータ(例えば、
F(O|γ t,k ))を算出する適応ベクトル算出手段
(例えば、図5の適応ベクトル算出器36)と、前記ユ
ニバーサル識別関数を構成するパラメータおよび前記適
応特徴パラメータから適応識別関数の関数値を演算する
識別関数演算手段(例えば、図5の識別関数演算器13
−k)と、前記適応識別関数の関数値からクラスを決定
するクラス決定手段(例えば、図5のクラス決定回路1
4)とを備えることを特徴とする。
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
に分類することにより識別を行う識別方法において、変
動状態に依存しないユニバーサル識別関数(例えば、ユ
ニバーサル識別関数G k (O))を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、前
記特徴ベクトルを前記ユニバーサル識別関数に適応させ
るための適応用パラメータ(例えば、適応用パラメータ
Γ (ML)t )を算出する適応ステップと、前記適応用パラ
メータにより前記特徴ベクトルを、前記ユニバーサル識
別関数に適応させて適応特徴パラメータ(例えば、F
(O|γ t,k ))を算出する適応ベクトル算出ステップ
と、前記ユニバーサル識別関数を構成するパラメータお
よび前記適応特徴パラメータから適応識別関数の関数値
を演算する識別関数演算ステップと、前記適応識別関数
の関数値からクラスを決定するクラス決定ステップとを
含むことを特徴とする。
れた音声の特徴ベクトル(例えば、特徴ベクトルO)を
所定クラスに分類することにより音声を認識する音声認
識方法において、変動状態に依存しないユニバーサル識
別関数(例えば、ユニバーサル識別関数G k (O))を
構成するパラメータを記憶するユニバーサルパラメータ
記億ステップと、所定の話者により入力された音声の前
記特徴ベクトルを、前記ユニバーサル識別関数に適応さ
せるための適応用パラメータ(例えば、適応用パラメー
タΓ (ML)t )を算出する話者適応ステップと、前記適応
用パラメータにより前記特徴ベクトルを、前記ユニバー
サル識別関数に適応させて適応特徴パラメータ(例え
ば、F(O|γ t,k ))を算出する適応ベクトル算出ス
テップと、前記ユニバーサル識別関数を構成するパラメ
ータおよび前記適応特徴パラメータから適応識別関数の
関数値を演算する識別関数演算ステップと、前記適応識
別関数の関数値からクラスを決定するクラス決定ステッ
プとを含むことを特徴とする。請求項7に記載の識別装
置は、入力された特徴ベクトル(例えば、特徴ベクトル
O)を所定クラスに分類することにより識別を行う識別
装置(例えば、図1の識別器5)において、変動状態に
依存しない識別関数(例えば、識別関数G k (O))を
構成するパラメータ(例えば、パラメータλ k )を記憶
するパラメータ記億手段(例えば、パラメータ記憶部1
1)と、前記特徴ベクトルに基づいて、前記識別関数を
所定の変動状態(例えば、変動状態V t )に適応させる
ための適応用パラメータ(例えば、適応用パラメータΓ
(ML)t )を算出する適応手段(例えば、図1の話者適応
器4)と、前記識別関数を構成するパラメータを読み出
し、前記識別関数を前記適応用パラメータにより適応さ
せて、適応識別関数を構成するパラメータ(例えば、パ
ラメータψ t,k )を算出する適応パラメータ算出手段
(例えば、図1の適応パラメータ算出器12)と、前記
適応識別関数を構成するパラメータおよび前記特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
手段(例えば、図1の識別関数演算器13−k)と、前
記適応識別関数の関数値からクラスを決定するクラス決
定手段(例えば、図1のクラス決定回路14)とを備え
ることを特徴とする。 請求項8に記載の識別方法は、入
力された特徴ベクトル(例えば、特徴ベクトルO)を所
定クラスに分類することにより識別を行う識別方法にお
いて、変動状態に依存しない識別関数(例えば、識別関
数G k (O))を構成するパラメータ(例えば、パラメ
ータλ k )を記憶するパラメータ記億ステップと、前記
特徴ベクトルに基づいて、前記識別関数を所定の変動状
態(例えば、変動状態V t )に適応させるための適応用
パラメータ(例えば、適応用パラメータΓ (ML)t )を算
出する適応ステップと、前記識別関数を構成するパラメ
ータを読み出し、前記識別関数を前記適応用パラメータ
により適応させて、適応識別関数を構成するパラメータ
(例えば、パラメータψ t,k )を算出する適応パラメー
タ算出ステップと、前記適応識別関数を構成するパラメ
ータおよび前記特徴ベクトルから適応識別関数の関数値
を演算する識別関数演算ステップと、前記適応識別関数
の関数値からクラスを決定するクラス決定ステップとを
含むことを特徴とする。 請求項9に記載の音声認識装置
は、入力された音声の特徴ベクトル(例えば、特徴ベク
トルO)を所定クラスに分類することにより音声を認識
する音声認識装置において、変動状態に依存しない識別
関数(例えば、識別関数G k (O))を構成するパラメ
ータ(例えば、パラメータλ k )を記憶するパラメータ
記億手段(例えば、パラメータ記憶部11)と、前記特
徴ベクトルに基づいて、前記識別関数を所定の話者に適
応させるための適応用パラメータ(例えば、適応用パラ
メータΓ (ML)t )を算出する話者適応手段(例えば、図
1の話者適応器4)と、前記識別関数を構成するパラメ
ータを読み出し、前記識別関数を前記適応用パラメータ
により適応させて適応識別関数を構成するパラメータ
(例えば、パラメータψ t,k )を算出する適応パラメー
タ算出手段(例えば、図1の適応パラメータ算出器1
2)と、前記適応識別関数を構成するパラメータおよび
前記特徴ベクトルから適応識別関数の関数値を演算する
識別関数演算手段(例えば、図1の識別関数演算器13
−k)と、前記適応識別関数の関数値からクラスを決定
するクラス決定手段(例えば、図1のクラス決定回路1
4)とを備えることを特徴とする。
ものに限定することを意味するものではない。
一実施例の構成を示している。なお、この音声認識装置
においては、話者に適応した音声の認識が行われるよう
になされている。
信号としての音声信号に変換され、音響分析部2に出力
される。音響分析部2では、マイク1からの音声信号が
A/D変換されることによりディジタルの音声信号とさ
れ、さらに、その音声信号に対し、所定の音響分析処理
が施されることで、音声の特徴ベクトル(例えば、LP
C(線形予測係数)や、LPCケプストラム、所定の帯
域幅ごとのパワーなど)が抽出される。この特徴ベクト
ルOは、スイッチ3に供給される。
発話が開始された場合などの、話者Vtに対する適応を
行う必要がある場合、端子aを選択する。従って、この
ような場合、音響分析部2から出力された特徴ベクトル
Oは、話者Vtに対する適応を行うための適応用のサン
プルAtとして、スイッチ3および端子aを介して、話
者適応器4に出力される。
に基づいて、後述する識別器5が記憶しているユニバー
サル識別関数を話者Vtに適応させるための適応用パラ
メータΓ(ML)tが算出され、識別器5を構成する適応パ
ラメータ算出器12に供給される。
パラメータΓ(ML)tが出力されると、スイッチ3は、端
子bを選択し、これにより、音響分析部2から出力され
た特徴ベクトルOは、スイッチ3および端子bを介し
て、識別器5の識別関数演算器13(識別関数演算器1
3−1乃至13−K)に供給されるようになる。
が、識別関数(ユニバーサル識別関数)を用いて、所定
の数KのクラスCkのうちのいずれかに分類されるこ
で、マイク1に入力された音声の識別(認識)が行われ
る。即ち、ユニバーサルパラメータ記憶部11には、ク
ラスCkに対応するユニバーサル識別関数を構成するパ
ラメータ(例えば、関数f(x)=ax2+bx+cに
ついては、a,b,c)(本実施例中において、適宜、
ユニバーサルパラメータという)λk(ベクトル)が記
憶されており、適応パラメータ算出器12は、話者適応
器4から適応用パラメータΓ(ML)tを受信すると、ユニ
バーサルパラメータ記憶部11からユニバーサル識別関
数(ユニバーサルパラメータ)を読み出し、適応用パラ
メータΓ(M L)tに基づいて適応させる(変換する)。こ
れにより、適応用のサンプルAt、即ち、この場合は話
者Vtに適応した識別関数(本実施例において、適宜、
適応識別関数という)を構成するパラメータψt,k(=
F((λk,Γ(ML)t))が算出される。
適応識別関数の関数値を演算する識別関数演算器13−
kに供給される。識別関数演算器13−kでは、パラメ
ータψt,kで表現される適応識別関数の関数値が、特徴
ベクトルOを入力値として計算され、クラス決定回路1
4に出力される。クラス決定回路14では、識別関数演
算器13−1乃至13−Kが出力する関数値のうち、例
えば最も値の大きいものが検出され、その関数値が得ら
れた適応識別関数に対応するクラスCkのサフィックス
kが、音声認識結果として決定されて出力される。
原理について説明する。いま、ある変動要因の状態(変
動状態)Vtに適応された、あるクラスCkに対応する適
応識別関数をgt,k(・)と表す。例えば、音韻を音声
認識結果として出力する音声認識を考えた場合、Vtは
話者に、クラスCkは認識結果としての音韻に、それぞ
れ対応する。
状態Vtにおいてサンプル(特徴ベクトル)Oが観測さ
れた場合に、そのサンプルOが、どのクラスに識別され
るかを決定するクラス決定規則を次式で定義する。
て与えられるkをサフィックスとするクラスCkに識別
される。
KのK個のクラスがあり、変動状態Vtにおいて、クラス
C1乃至CKそれぞれに属するサンプルOが観測される事
前確率p(C1,Vt)乃至p(CK,Vt)が等しいとす
ると、即ち、音声認識についていえば、例えば、ある話
者Vtが、認識対象となっている音韻C1乃至CKそれぞ
れを発話する事前確率p(C1,Vt)乃至p(CK,
Vt)が等しいとすると、変動状態Vtにおいて、サンプ
ルOが観測された場合に、最小誤り率を実現する適応識
別関数gt,k(O)は、例えば次式で与えられる。
t,k(O)は、変動状態VtおよびクラスCkによって条
件づけられる確率密度関数(以下、適宜、条件付き確率
密度関数という)p(O|Ck,Vt)で表される。い
ま、この条件付き確率密度関数p(O|Ck,Vt)が、
パラメータ(ベクトル)ψt,kによって一意に決定され
るもの、即ち、パラメトリック形式で表わされるものと
する。ここで、条件付き確率密度関数p(O|Ck,
Vt)がパラメータψt,kに依存していることを表すため
に、以下、p(O|Ck,Vt)を、p(O|ψt,k)と
表すこととする。
は、クラスCkによって条件づけられ、かつパラメトリ
ック形式で表される確率密度関数(これも、以下、適
宜、条件付き確率密度関数という)p(O|λk)をあ
らかじめ決めておけば、この条件付き確率密度関数p
(O|λk)を、変動状態Vtに適応させることによって
得ることができる。
変動状態Vtに依存せず、従って、すべての変動状態Vt
について用いることができることから、「ユニバーサ
ル」な、条件付き確率密度関数ということができる。こ
こで、Gk(O)=p(O|λk)とし、以下、適宜、G
k(O)を、ユニバーサル識別関数という。また、λ
kは、ユニバーサル識別関数Gk(・)を構成(表現)す
るパラメータであるから、本実施例中においては、λk
を、適宜、ユニバーサルパラメータという。
ユニバーサル識別関数Gk(O)を、変動状態Vtに適応
させることによって得ることができるが、この適応に対
応する変換を行う関数(以下、適宜、適応用関数とい
う)をF(・)と表し、その適応用関数F(・)が、適
応用パラメータ(ベクトル)γt,kで制御されるものと
すると、適応識別関数gt,k(O)を表すパラメータ
(本実施例中において、適宜、適応パラメータという)
ψt,kは、次式で示される。
ψt,1,ψt,2,・・・,ψt,Kの集合でなるベクトル
[ψt,1,ψt,2,・・・,ψt,K]をΨtと、ユニバーサ
ルパラメータλ1,λ2,・・・,λKの集合でなるベク
トル[λ1,λ2,・・・,λK]をΛと、適応用パラメ
ータγt,1,γt,2,・・・,γt,Kの集合でなるベクト
ル[γt,1,γt,2,・・・,γt,K]をΓtと、それぞれ
表す。この場合、例えば、式(3)は次式のようにな
る。
ル識別関数Gk(O)を、変動状態Vtに適応させ、適応
識別関数gt,k(O)を得る必要があるが、このために
は、適応用関数F(Λ,Γt)を制御(構成)する適応
用パラメータΓtであって、変動状態Vtに対応するもの
を求める必要がある。この適応用パラメータΓtは、変
動状態Vtにおいて観測されるサンプル(このサンプル
は、ユニバーサル識別関数Gk(O)を変動状態Vtに適
応させるために用いられるので、本実施例中において、
適宜、適応用のサンプルという)Atに基づいて決定す
ることができる。
与えられるものとする。
状態Vtにおいて観測された、クラスCkに属する特徴ベ
クトルOであって、第i番目のものを表しており、m
t,kは、変動状態Vtにおいて観測された、クラスCkに
属する特徴ベクトルOの総数を表す。また、特徴ベクト
ルOt,k,i (A)における(A)は、特徴ベクトルO t,k,i
が、ユニバーサル識別関数Gk(O)を変動状態Vtに適
応させるために用いられるものであることを表す。な
お、mt,kは、小さな値で良く、例えば1であっ ても良
い。
定値(Maximum Likelihood)Γ(ML)tは、次式によって
得ることができる。
とする。
応用パラメータの最尤推定値Γ(ML)t)を得た後は、式
(4)にしたがって、適応パラメータΨtを求め、入力
された特徴ベクトルOに対する条件付き確率密度関数p
(O|ψ t,k )、即ち、適応識別 関数gt,k(O)を計
算し、式(1)で示される条件を満たすkを求めること
で 、入力された特徴ベクトルOの識別結果であるクラ
スCkを得ることができる。
づき、クラスCkのサフィックスkが、音声認識結果と
して出力されるようになされている。即ち、話者適応器
4では、適応用のサンプルAtを用い、式(6)にした
がって、適応用パラメータΓt(最尤推定値Γ(ML)t)が
求められる。ユニバーサルパラメータ記憶部11には、
ユニバーサルパラメータΛ(λ1,λ2,・・・,λK)
が記憶されており、適応パラメータ算出器12では、そ
のユニバーサルパラメータΛが、話者適応器4で求めら
れた適応用パラメータΓtを用い、式(3)または
(4)にしたがって変換され、これにより、ユニバーサ
ル識別関数Gk(・)を、適応用のサンプルAtに適応さ
せた適応識別関数gt,k(・)を構成する適応パラメー
タΨt(ψt, 1,ψt,2,・・・,ψt,K)が算出され
る。そして、識別関数演算器13−1乃至13−Kで
は、適応パラメータψt,1,ψt,2,・・・,ψt,Kで表
される適応識別関数gt,k(・)の、特徴ベクトルOに
ついての関数値gt,1(O),gt,2(O),・・・,g
t, K(O)が計算される。その後、クラス決定回路14
では、関数値gt,1(O),gt,2(O),・・・,g
t,K(O)を用いて、式(1)を満たすkが求められ
る。
部11に記憶させるユニバーサル識別関数Gk(・)、
即ち、ユニバーサルパラメータΛの算出方法(学習方
法)について説明する。いま、T個の変動状態V1,
V2,・・・,VTにおいてそれぞれ観測(抽出)され
た、K個のクラスC1,C2,・・・,CKそれぞれに属
する特徴ベクトルの集合でなる学習サンプルXを考え、
これを、以下のように表す。
態Vtにおいて観測された学習サンプルの集合を表し、
式(9)において、Ot,kは、変動状態Vtにおいて観測
された学習サンプルのうち、クラスCkに属するものの
集合を表す。また、式(9)において、mt,kは、学習
サンプル(学習サンプルの集合)Ot,kを構成する特徴
ベクトル、即ち、変動状態Vtにおいて観測された、ク
ラスCkに属する学習サンプルの総数を表し、O
t,k,iは、学習サンプルOt,kの中の第i番目の特徴ベク
トルを表す。
1,Γ2,・・・,ΓKの集合でなるベクトルまたは適応
パラメータΨ1,Ψ2,・・・,ΨKの集合でなるベクト
ルを、それぞれ式(11)または(12)に示すよう
に、ΓまたはΨで表す。 Γ=[Γ1,Γ2,・・・,ΓT] ・・・(11) Ψ=[Ψ1,Ψ2,・・・,ΨT] ・・・(12)
は次式のように表される。 Ψ=F(Λ,Γ) ・・・(13)
ータΛの学習を、例えば、ユニバーサル識別関数G
k(・)を、学習サンプルXに適応させる変換(適応用
関数Fによる変換)F(・)を行って得られる適応識別
関数gt,k(・)(これは、上述したように、Ψ、即
ち、F(Λ,Γ)をパラメータとする)の、学習サンプ
ルXに対する尤度を評価基準として行うものとし、以
下、この尤度を、p(X|F(Λ,Γ))と表す。
ラメータΛを、変動状態Vt、即ち、適応用のサンプル
Atに適応させるものであるから、この適応用パラメー
タΓtは、ユニバーサルパラメータΛおよび適応用のサ
ンプルA tの関係から得ることができ、さらに、適応用
のサンプルAtは、変動状態Vtにおいて任意に観測され
るものであるから、適応用パラメータΓtは確率変数と
みなすことができる。この場合 、学習サンプルXに対
するユニバーサルパラメータΛの対数尤度U1(X,
Λ) は、次式で定義することができる。
(ML)は、次式に示すように、対数尤度U1(X,Λ)を
最大化することで求めることができる。
Λ)を求めるには、一般に無限のサンプルが必要とな
る。そこで、次のようにして、p(Γt|Λ)を帰納的
に学習しながら、尤度の最大化を図ることとする。
れは、学習サンプルXtである必要は必ずしもなく、変
動状態Vtにおいて観測されたものであれば良い)の中
から、適応用パラメータΓを求めるためのサンプル(以
下、適宜、このサンプルも適応用のサンプルという)B
t,hを選択する。但し、h=1,2,・・・,Htで、H
tは、適応用のサンプルの総数である。なお、Htは1以
上であれば良い。
ーサルパラメータΛの対数尤度U2(X,Λ)は、次式
で与えられる。
づいて得られる適応用パラメータΓの最尤推定値で、次
式で与えられるものである。
尤推定値Λ(ML)は、次式にしたがって、式(16)を最
大化することで求めることができる。
ニバーサル識別関数Gk(・)、即ち、ユニバーサルパ
ラメータΛを算出する識別関数算出装置の一実施例の構
成を示している。学習サンプルXは、適応用関数パラメ
ータ算出用学習サンプル抽出器21およびユニバーサル
パラメータ算出器23に供給される。ここで、図1の識
別器5に適用される(ユニバーサルパラメータ記憶部1
1に記憶させる)ユニバーサルパラメータΛを算出する
場合においては、学習サンプルXとしては、音響分析部
2から出力される特徴ベクトルが用いられる。
抽出器21では、学習サンプルXから、上述したような
サンプルBt,hが抽出される。ここで、サンプルBt,hの
抽出は、例えば、適応用関数パラメータ算出用学習サン
プル抽出器21で乱数が発生され、その乱数に基づい
て、学習サンプルXからサンプルを選択することで行わ
れる。
抽出器21で抽出されたサンプルBt,hは、適応用パラ
メータ算出器22に供給される。さらに、適応用パラメ
ータ算出器22には、ユニバーサルパラメータ算出器2
3から、所定のユニバーサルパラメータも供給される。
適応用パラメータ算出器22では、ユニバーサルパラメ
ータ算出器23からのユニバーサルパラメータΛを、サ
ンプルBt,hに適応させるための適応用パラメータΓが
算出される。即ち、適応用パラメータ算出器22は、式
(17)にしたがって、適応用パラメータΓの最尤推定
値Γ(ML)t,hを算出する。この適応用パラメータΓ
(ML)t,hは、ユニバーサルパラメータ算出器23に出力
される。
式(18)にしたがって、ユニバーサルパラメータΛの
最尤推定値Λ(ML)が求められる。即ち、ユニバーサルパ
ラメータ算出器23では、適応用パラメータ算出器22
からの適応用パラメータΓ(M L)t,hに基づいて、ユニバ
ーサルパラメータΛが変換され、これにより、式(1
6)におけるF(Λ,Γ(ML)t,h)(これは、ユニバー
サル識別関数Gk(・)をサンプルBt,hに適応させる変
換を行って得られる適応識別関数gt,k(・)のパラメ
ータΨtである)が求められる。そして、サンプルXに
対するF(Λ,Γ(ML )t,h)の尤度(本実施例において
は、上述したように、式(16)で表される対数尤度U
2)を最も高くするユニバーサルパラメータΛ(ML)が算
出される。
3は、ユニバーサルパラメータΛ(M L)を与える対数尤度
U2が、例えば所定の閾値以上であるかどうかを判定す
る。そして、対数尤度U2が、所定の閾値以上でない場
合、その対数尤度U2が向上するようなユニバーサルパ
ラメータΛを、適応用パラメータ算出器22に供給す
る。適応用パラメータ算出器22は、新たなユニバーサ
ルパラメータを受信すると、再び、式(17)にしたが
って、適応用パラメータΓの最尤推定値Γ(ML)t,hを算
出し、ユニバーサルパラメータ算出器23に出力する。
ユニバーサルパラメータ算出器23では、ユニバーサル
パラメータΛ(ML)を与える対数尤度U2が所定の閾値以
上となるまで、同様の処理が繰り返される。
与える対数尤度U2が所定の閾値以上となると、ユニバ
ーサルパラメータ算出器23は、そのユニバーサルパラ
メータΛ(ML)を、メモリ24に出力して記憶させる。メ
モリ24に記憶されたユニバーサルパラメータΛ
(ML)は、その後、必要に応じて、例えばユニバーサルパ
ラメータ記憶部11(図1)などに転送される。
ル識別関数Gk(・)との関係に応じて、ユニバーサル
識別関数Gk(・)を、学習サンプルXtに適応させなが
ら学習を行うようにしたので、適応処理を行ったときに
最高の性能を発揮するようなユニバーサル識別関数Gk
(・)を得ることができ、その結果、認識時において、
このユニバーサル識別関数Gk(・)を用いることで、
認識率を向上させることができる。
が、比較的少ない数のパラメータで表され、サンプルB
t,hとして、比較的多くのサンプルが与えられた場合、
適応用パラメータΓtの分散は非常に小さくなる。そこ
で、いま、適応用パラメータΓtの分散を0と仮定する
と、学習サンプルXに対するユニバーサルパラメータΛ
の対数尤度U3(X,Λ)は、次式で与えられる。
れる適応用パラメータΓtの最尤推定値である。
ら、最大化すべき目的関数U4(X,Λ,Γ)は、次式
のようになる。
尤推定値Λ(ML)は、U4(X,Λ,Γ)を、ΛおよびΓ
の両方に関して最大化することにより求めることができ
る。このU4(X,Λ,Γ)を最大化するΛおよびΓ
は、例えばシミュレーテッドアーニング法や、最急降下
法、EM(Expectation Maximization)アルゴリズムな
どにしたがって求めることができる。なお、シミュレー
テッドアーニング法によれば、演算量は多いが、比較的
良好な解を求めることができる。また、最急降下法やE
Mアルゴリズムによれば、解として、局所的な最大値が
得られることが多いが、演算量は少なくて済む。
ーサル識別関数Gk(・)として、例えば対角成分以外
の共分散成分を0とした、パラメトリックに表現可能な
正規分布(混合正規分布)関数を、適応用パラメータΓ
として、例えば加算ベクトルを、それぞれ用いた場合に
ついて説明する。この場合、ユニバーサル識別関数Gk
(O)は、次式のように表すことができる。
ポーネント)の数(次元数)を表し、ojは、特徴ベク
トルOのj番目の成分(第j成分)を表す。また、μ
k,jまたはσk,j 2は、第j成分ojの平均値または分散を
それぞれ表す。
kは、λk=[μk,1,μk,2,・・・,μk,J,σk,1 2,
σk,2 2,・・・,σk,J 2]と表すことができる。
メータ、即ち、この場合、加算ベクトルΓtを、Γt=
[γt,k,1,γt,k,2,・・・,γt,k,J]と表すととも
に、学習サンプルXtに適応させたμk,jまたはσ
k,j 2を、それぞれμt,k,jまたはσt,k ,j 2と表すとする
と、適応パラメータψt,kは、次のように表すことがで
きる。
t,k(O)は、次式で与えられる。
ユニバーサルパラメータΛは、式(16)乃至(18)
から、次式に示す対数尤度L(X,Λ)を、Λについて
最大化することで求めることができる。
Xtを用いて得られる加算ベクトルΓtの最尤推定値で、
次式で与えられる。
で表される。 F(Λ,Γt,h) =[μk,1+γt,k,1,h,μk,2+γt,k,2,h,・・・, μk,J+γt,k,J,h,σk,1 2,σk,2 2,・・・,σk,J 2] ・・・(27)
てのγt,k,jを表す。
感的には、次にように考えることができる。即ち、例え
ば画像認識(文字認識)において、ユニバーサル識別関
数Gk(・)に相当する文字「A」の標準パターンの学
習を行う場合、認識時に、例えば、ほぼ同一形状の、傾
きのない文字「A」のみが認識対象として入力されるな
らば、そのような文字「A」を、学習サンプルとして、
従来と同様の学習を行えば、例えば図3(A)に示すよ
うな、入力された文字「A」の特徴を反映した標準パタ
ーンが得られる。
うな形の揃った、傾きのない文字「A」が、常時入力さ
れることは皆無であり、通常は、例えば図3(B)に示
すように、傾きのない「A」の他、右や左に傾いた
「A」が入力される。このような場合、従来において
は、傾きのない「A」、並びに右および左に傾いた
「A」がそのままの状態で、標準パターンに、いわば包
含されるように学習が行われていたため、その結果得ら
れる文字「A」の標準パターンは、極端には、図3
(D)に示すように、文字「A」の特徴が損なわれたも
のとなっていた。
準パターンを、図3(C)に示すように、学習サンプル
としての文字「A」の傾きに対応して回転し、即ち、ユ
ニバーサルパラメータΛに相当する標準パターンを、適
応用関数F(・)によって変換することにより学習サン
プルに適応させて学習を行うことで、文字「A」の特徴
が充分に反映された標準パターンを得ることができるよ
うになされている。
特徴が充分に反映された標準パターンを、認識対象とし
て入力された文字に適応させることで、認識性能を向上
させることができるようになされている。
ターンと学習サンプルとの適応は、図3(C)に示した
ように、文字「A」の標準パターンを、学習サンプルと
しての文字「A」の傾きに対応して回転することによ
り、標準パターンを学習サンプルに適応させることで行
うことができる他、例えば図4に示すように、学習サン
プルとしての文字「A」を、その傾きに対応して回転す
ることにより、学習サンプルを標準パターンに適応させ
ることでも行うことができる。これは、認識時について
も同様のことがいえる。
うことにより音声の認識を行う音声認識装置の一実施例
の構成を示している。なお、図中、図1における場合と
対応する部分については同一の符号を付してあり、以下
では、その説明は、適宜、省略する。また、この音声認
識装置においては、図1における場合と同様に、話者に
適応した音声の認識が行われるようになされている。
に対する適応を行う必要がある場合、端子aを選択し、
これにより、音響分析部2から出力された特徴ベクトル
Oは、話者Vtに対する適応を行うための適応用のサン
プルAtとして、スイッチ3および端子aを介して、話
者適応器34に出力される。
tに基づいて、特徴ベクトルOを、後述する識別器35
が記憶しているユニバーサル識別関数に適応させるため
の適応用パラメータΓ(ML)tが算出され、適応ベクトル
算出器36に供給される。
6に対し、適応用パラメータΓ(ML) tが出力されると、
スイッチ3は、端子bを選択し、これにより、音響分析
部2から出力された特徴ベクトルOは、スイッチ3およ
び端子bを介して、適応ベクトル算出器36に供給され
るようになる。
4から適応用パラメータΓ(ML)tを受信すると、音響分
析部2からスイッチ3および端子bを介して供給される
特徴ベクトルOを、適応用パラメータΓ(ML)tに基づい
て適応させる(変換する)。これにより、ユニバーサル
パラメータ記憶部11に記憶されているユニバーサル識
別関数に適応した特徴パラメータ(本実施例において、
適宜、適応特徴パラメータという)F(O,γ t,k )が
算出される。この適応特徴パラメータF(O,γ t,1 )
乃至F(O,γ t,k )は、識別器35の識別関数演算器
13−1乃至13−Kにそれぞれ供給される。
トルが、ユニバーサル識別関数を用いて、所定の数Kの
クラスCkのうちのいずれかに分類されるこで、マイク
1に入力された音声の識別(認識)が行われる。即ち、
ユニバーサルパラメータ記憶部11からは、ユニバーサ
ルパラメータλkが読み出され、識別関数演算器13−
kに供給される。識別関数演算器13−kでは、ユニバ
ーサルパラメータλkで表現されるユニバーサル識別関
数の関数値が、適応特徴ベクトルF(O,γ t,k )を入
力値として計算され、クラス決定回路14に出力され
る。クラス決定回路14では、図1における場合と同様
にして、音声認識結果が決定されて出力される。
原理について説明するが、この音声認識装置では、基本
的には、上述したように、ユニバーサル識別関数G
k(・)を適応させずに、入力された特徴ベクトルO
を、ユニバーサル識別関数Gk(・)に適応させて認識
を行うのであるから、適応用関数F(・)による変換の
対象が、ユニバーサル識別関数Gk(・)(ユニバーサ
ルパラメータΛ)ではなく、特徴ベクトルOとなること
と、識別に際して用いる識別関数が、適応識別関数g
t,k(・)ではなく、ユニバーサル識別関数Gk(・)と
なることが、図1における場合と異なるだけである。
ける適応識別関数gt,k(・)を、ユニバーサル識別関
数Gk(・)に置換するとともに、特徴ベクトルOを、
それをユニバーサル識別関数Gk(・)に適応させた適
応特徴ベクトルF(O,γ t,k )に置換したものとな
る。即ち、この場合、クラス決定規則は、次式で定義さ
れる。
Γ(ML)tは、式(6)におけるAtをF(At,Γt)に、
F(Λ,Γt)をΛに、それぞれ置換した式(29)、
および式(7)におけるAtをF(At,Γt)に、F
(Λ,Γt)をΛに、Ot,k,i (A)をF(Ot,k,i (A),γ
t,k)に、F(λk,γt,k)をλkに、それぞれ置換した
式(30)にしたがって得ることができる。
タΓt(適応用パラメータの最尤推定値Γ(ML)t)を得た
後は、式(28)における左辺におけるF(O,
γt,k)、即ち、適応特徴ベクトルを計算し、式(2
8)で示される条件を満たすkを求めることで、入力さ
れた特徴ベクトルOの識別結果であるクラスCkを得る
ことができる。
づき、クラスCkのサフィックスkが、音声認識結果と
して出力される。即ち、話者適応器34では、適応用の
サンプルAtを用い、式(29)にしたがって、適応用
パラメータΓt(最尤推定値Γ(ML) t)が求められる。適
応ベクトル算出器36では、特徴ベクトルOが、話者適
応器34で求められた適応用パラメータΓtを用い、式
F(O,Γt)にしたがって変換され、これにより、特
徴ベクトルOを、ユニバーサル識別関数Gk(・)に適
応に適応させた適応特徴ベクトルF(O,γt,1),F
(O,γt,2),・・・,F(O,γt,K)が算出され
る。そして、識別関数演算器13−1乃至13−Kで
は、ユニバーサルパラメータλ1,λ2,・・・,λKで
表される適応識別関数Gk(・)の、適応特徴ベクトル
F(O,γt,1),F(O,γt,2),・・・,F(O,
γt,K)についての関数値G1(F(O,γt,1)),G2
(F(O,γt,2)),・・・,GK(F(O,
γt,K))が計算される。その後、クラス決定回路14
では、関数値G1(F(O,γt,1)),G2(F(O,
γt,2)),・・・,GK(F(O,γt,K))を用い
て、式(28)を満たすkが求められる。
用いられるユニバーサル識別関数Gk(・)、即ち、ユ
ニバーサルパラメータΛの算出方法(学習方法)につい
て説明するが、基本的には、上述したように、ユニバー
サル識別関数Gk(・)を適応させずに、学習サンプル
Xを、ユニバーサル識別関数Gk(・)に適応させて学
習をを行うのであるから、適応用関数F(・)による変
換の対象が、ユニバーサル識別関数Gk(・)(ユニバ
ーサルパラメータΛ)ではなく、学習サンプルXとなる
ことが、ユニバーサル識別関数Gk(・)を学習サンプ
ルXに適応させながら学習を行う場合と異なるだけであ
る(本実施例中では、適宜、学習サンプルXをユニバー
サル識別関数Gk(・)に適応させたもの、即ち、学習
サンプルXを適応用関数F(・)にしたがって変換した
ものを、適応学習サンプルという)。
における適応用関数F(・)による変換の対象を、ユニ
バーサルパラメータΛではなく、学習サンプルX(ある
いは、適応用のサンプルBt,h)に替えた場合には、式
(31)乃至(35)がそれぞれ得られるから、ユニバ
ーサルパラメータΛの最尤推定値Λ(ML)は、式(35)
にしたがって、式(33)を最大化することで、求める
ことができる。
ニバーサル識別関数Gk(・)、即ち、ユニバーサルパ
ラメータΛを算出する識別関数算出装置の一実施例の構
成を示している。なお、図中、図2における場合と対応
する部分については同一の符号を付してあり、以下で
は、その説明は、適宜省略する。
関数パラメータ算出用学習サンプル抽出器21で抽出さ
れたサンプルBt,hと、ユニバーサルパラメータ算出器
43からユニバーサルパラメータΛとが供給される。適
応用パラメータ算出器42では、適応用関数パラメータ
算出用学習サンプル抽出器21からのサンプルB
t,hを、ユニバーサルパラメータ算出器43からのユニ
バーサルパラメータΛに適応させるための適応用パラメ
ータΓが算出される。即ち、適応用パラメータ算出器4
2は、式(34)にしたがって、適応用パラメータΓの
最尤推定値Γ(ML)t,hを算出する。この適応用パラメー
タΓ(ML)t,hは、ユニバーサルパラメータ算出器43に
出力される。
式(35)にしたがって、ユニバーサルパラメータΛの
最尤推定値Λ(ML)が求められる。即ち、ユニバーサルパ
ラメータ算出器43では、適応用パラメータ算出器42
からの適応用パラメータΓ(M L)t,hに基づいて、学習サ
ンプルXが変換され、これにより、式(33)における
F(Xt,Γ(ML)t,h)、即ち、適応学習サンプルが求め
られる。そして、その適応学習サンプルF(X,Γ
(ML)t,h)に対する尤度(対数尤度)U2を最も高くする
ユニバーサルパラメータΛ(ML)が算出される。
3は、ユニバーサルパラメータΛ(M L)を与える対数尤度
U2が、例えば所定の閾値以上であるかどうかを判定す
る。そして、対数尤度U2が、所定の閾値以上でない場
合、その対数尤度U2が向上するようなユニバーサルパ
ラメータΛを、適応用パラメータ算出器42に供給す
る。適応用パラメータ算出器42は、新たなユニバーサ
ルパラメータを受信すると、再び、式(34)にしたが
って、適応用パラメータΓの最尤推定値Γ(ML)t,hを算
出し、ユニバーサルパラメータ算出器43に出力する。
ユニバーサルパラメータ算出器43では、ユニバーサル
パラメータΛ(ML)を与える対数尤度U2が所定の閾値以
上となるまで、同様の処理が繰り返される。
与える対数尤度U2が所定の閾値以上となると、ユニバ
ーサルパラメータ算出器43は、そのユニバーサルパラ
メータΛ(ML)を、メモリ24に出力して記憶させる。
ル識別関数Gk(・)との関係に応じて、学習サンプル
Xtを、ユニバーサル識別関数Gk(・)に適応させなが
ら学習を行うようにしたので、適応処理を行ったときに
最高の性能を発揮するようなユニバーサル識別関数Gk
(・)を得ることができ、その結果、認識時において、
このユニバーサル識別関数Gk(・)を用いることで、
認識率を向上させることができる。
が、比較的少ない数のパラメータで表され、サンプルB
t,hとして、比較的多くのサンプルが与えられた場合、
適応用パラメータΓtの分散は非常に小さくなる。そこ
で、適応用パラメータΓtの分散を0と仮定すると、上
述した式(19)乃至(21)にそれぞれ相当する式
(36)乃至(38)を得ることができる。
タΛの最尤推定値Λ(ML)は、式(38)におけるU
4(X,Λ,Γ)を、ΛおよびΓの両方に関して最大化
することにより求めることができる。
適用した場合について説明したが、本発明は、音声の認
識を行う場合の他、例えば画像の認識を行う場合などの
あらゆるパターン認識を行う場合に適用可能である。
識別関数の具体例として、正規分布識別関数を用いた場
合を説明したが、ユニバーサル識別関数としては、正規
分布識別関数の他、例えばマハラノビス識別関数や、H
MM(Hidden Markov Model)による識別関数、多項式
識別関数、ニューラルネットワークにより表現される識
別関数などを用いることが可能である。
して、加算ベクトルを算出し、この加算ベクトルを用い
て、ユニバーサル識別関数を適応させる変換を行う場合
について説明したが、適応用パラメータとしては、加算
ベクトルの他、例えば、線形変換を行うパラメータなど
を算出するようにし、これを用いて、ユニバーサル識別
関数を線形変換することで適応させるようにすることが
可能である。さらに、ユニバーサル識別関数を適応させ
る変換としては、例えば1次変換や、2次以上の項を含
んだ多項式変換、ニューラルネットワークによる変換な
どを用いることが可能である。また、学習サンプルを適
応させる変換についても、同様の変換手法を用いること
が可能である。
関数を学習サンプルに適応させる場合において、ユニバ
ーサルパラメータの最尤推定値を求めるようにしたが、
即ち、適応識別関数の、学習サンプルに対する尤度(対
数尤度)を評価基準とし、その尤度を最大化するユニバ
ーサルパラメータを求めるようにしたが、その他、例え
ば相互情報量や誤認識率などを評価基準とし、相互情報
量を最大化するユニバーサルパラメータや、誤認識率を
最小化するユニバーサルパラメータなどを求めるように
することが可能である。同様に、学習サンプルをユニバ
ーサル識別関数に適応させる場合においても、尤度以外
に、例えば相互情報量や誤認識率などを評価基準として
用いることが可能である。
数を学習サンプルに適応させるために、適応用パラメー
タの最尤推定値を求めるようにしたが、即ち、適応識別
関数の、学習サンプルに対する尤度(対数尤度)を評価
基準とし、その尤度を最大化する適応用パラメータを求
めるようにしたが、この適応用パラメータについても、
尤度の他、相互情報量や誤認識率などを評価基準として
用いることが可能である。さらに、学習サンプルをユニ
バーサル識別関数に適応させる場合においても同様に、
評価基準として、尤度の他、例えば相互情報量や誤認識
率などを用いることができる。
つのユニバーサル識別関数を用意するようにしたが、こ
の他、例えば、1つのクラスに対しては、複数のユニバ
ーサル識別関数を割り当てることも可能である。
2に記載の識別方法によれば、特徴ベクトルに対し、識
別関数を適応させ、その結果得られる適応識別関数を用
いて、特徴ベクトルが識別される。この場合において、
識別関数は、それを、学習サンプルに適応させながら学
習を行うことにより得られたものとされている。従っ
て、識別関数は、それを適応処理したときに高い性能を
発揮するものであるから、特徴ベクトルの識別率を向上
させることができる(誤認識率を低減することができ
る)。
特徴ベクトルに対し、識別関数を適応させ、その結果得
られる適応識別関数を用いて、特徴ベクトルが、所定の
数のクラスのうちのいずれかに分類される。この場合に
おいて、識別関数は、それを、学習サンプルに適応させ
ながら学習を行うことにより得られたものとされてい
る。従って、識別関数は、それを適応処理したときに高
い性能を発揮するものであるから、音声の認識率を向上
させることができる。
に記載の識別方法によれば、識別関数に対し、特徴ベク
トルを適応させ、その結果得られる適応特徴ベクトル
が、識別関数を用いて識別される。この場合において、
識別関数は、それに、学習サンプルを適応させながら学
習を行うことにより得られたものとされている。従っ
て、識別関数は、特徴ベクトルを適応処理したときに高
い性能を発揮するものであるから、特徴ベクトルの識別
率を向上させることができる。
識別関数に対し、特徴ベクトルを適応させ、その結果得
られる適応特徴ベクトルが、識別関数を用いて、所定の
数のクラスのうちのいずれかに分類される。この場合に
おいて、識別関数は、それに、学習サンプルを適応させ
ながら学習を行うことにより得られたものとされてい
る。従って、識別関数は、特徴ベクトルを適応処理した
ときに高い性能を発揮するものであるから、音声の認識
率を向上させることができる。
構成を示すブロック図である。
例の構成を示すブロック図である。
構成を示すブロック図である。
例の構成を示すブロック図である。
ロック図である。
Claims (9)
- 【請求項1】 入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別装置において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億手段
と、 前記特徴ベクトルに基づいて、前記ユニバーサル識別関
数を所定の変動状態に適応させるための適応用パラメー
タを算出する適応手段と、 前記ユニバーサル識別関数を構成するパラメータを読み
出し、前記ユニバーサル識別関数を前記適応用パラメー
タにより適応させて、適応識別関数を構成するパラメー
タを算出する適応パラメータ算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
決定手段と を備える ことを特徴とする識別装置。 - 【請求項2】 入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別方法において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億ステ
ップと、 前記特徴ベクトルに基づいて、前記ユニバーサル識別関
数を所定の変動状態に適応させるための適応用パラメー
タを算出する適応ステップと、 前記ユニバーサル識別関数を構成するパラメータを読み
出し、前記ユニバーサル識別関数を前記適応用パラメー
タにより適応させて、適応識別関数を構成するパラメー
タを算出する適応パラメータ算出ステップと、 前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
決定ステップと を含む ことを特徴とする識別方法。 - 【請求項3】 入力された音声の特徴ベクトルを所定ク
ラスに分類することにより音声を認識する音声認識装置
において、 変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億手段
と、 前記特徴ベクトルに基づいて、前記ユニバーサル識別関
数を所定の話者に適応させるための適応用パラメータを
算出する話者適応手段と、 前記ユニバーサル識別関数を構成するパラメータを読み
出し、前記ユニバーサル識別関数を前記適応用パラメー
タにより適応させて適応識別関数を構成するパラメータ
を算出する適応パラメータ算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
決定手段と を備える ことを特徴とする音声認識装置。 - 【請求項4】 入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別装置において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億手段
と、 前記特徴ベクトルを前記ユニバーサル識別関数に適応さ
せるための適応用パラメータを算出する適応手段と、 前記適応用パラメータにより前記特徴ベクトルを、前記
ユニバーサル識別関数に適応させて適応特徴パラメータ
を算出する適応ベクトル算出手段と、 前記ユニバーサル識別関数を構成するパラメータおよび
前記適応特徴パラメータから適応識別関数の関数値を演
算する識別関数演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
決定手段と を備える ことを特徴とする識別装置。 - 【請求項5】 入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別方法において、変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億ステ
ップと、 前記特徴ベクトルを前記ユニバーサル識別関数に適応さ
せるための適応用パラメータを算出する適応ステップ
と、 前記適応用パラメータにより前記特徴ベクトルを、前記
ユニバーサル識別関数に適応させて適応特徴パラメータ
を算出する適応ベクトル算出ステップと、 前記ユニバーサル識別関数を構成するパラメータおよび
前記適応特徴パラメータから適応識別関数の関数値を演
算する識別関数演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
決定ステップと を含む ことを特徴とする識別方法。 - 【請求項6】 入力された音声の特徴ベクトルを所定ク
ラスに分類することにより音声を認識する音声認識方法
において、 変動状態に依存しないユニバーサル識別関数を構成する
パラメータを記憶するユニバーサルパラメータ記億ステ
ップと、 所定の話者により入力された音声の前記特徴ベクトル
を、前記ユニバーサル識別関数に適応させるための適応
用パラメータを算出する話者適応ステップと、 前記適応用パラメータにより前記特徴ベクトルを、前記
ユニバーサル識別関数に適応させて適応特徴パラメータ
を算出する適応ベクトル算出ステップと、 前記ユニバーサル識別関数を構成するパラメータおよび
前記適応特徴パラメータから適応識別関数の関数値を演
算する識別関数演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
決定ステップと を含む ことを特徴とする音声認識方法。 - 【請求項7】 入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別装置において、 変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億手段と、 前記特徴ベクトルに基づいて、前記識別関数を所定の変
動状態に適応させるための適応用パラメータを算出する
適応手段と、 前記識別関数を構成するパラメータを読み出し、前記識
別関数を前記適応用パラメータにより適応させて、適応
識別関数を構成するパラメータを算出する適応パラメー
タ算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
決定手段と を備えることを特徴とする識別装置。 - 【請求項8】 入力された特徴ベクトルを所定クラスに
分類することにより識別を行う識別方法において、 変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億ステップと、 前記特徴ベクトルに基づいて、前記識別関数を所定の変
動状態に適応させるための適応用パラメータを算出する
適応ステップと、 前記識別関数を構成するパラメータを読み出し、前記識
別関数を前記適応用パラメータにより適応させて、適応
識別関数を構成するパラメータを算出する適応パラメー
タ算出ステップと、 前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
決定ステップと を含むことを特徴とする識別方法。 - 【請求項9】 入力された音声の特徴ベクトルを所定ク
ラスに分類することにより音声を認識する音声認識装置
において、 変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億手段と、 前記特徴ベクトルに基づいて、前記識別関数を所定の話
者に適応させるための適応用パラメータを算出する話者
適応手段と、 前記識別関数を構成するパラメータを読み出し、前記識
別関数を前記適応用パラメータにより適応させて適応識
別関数を構成するパラメータを算出する適応パラメータ
算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
決定手段と を備えることを特徴とする音声認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24789095A JP3536471B2 (ja) | 1995-09-26 | 1995-09-26 | 識別装置および識別方法、並びに音声認識装置および音声認識方法 |
US08/710,941 US5828998A (en) | 1995-09-26 | 1996-09-24 | Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system |
US09/176,138 US6134525A (en) | 1995-09-26 | 1998-10-21 | Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24789095A JP3536471B2 (ja) | 1995-09-26 | 1995-09-26 | 識別装置および識別方法、並びに音声認識装置および音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0990976A JPH0990976A (ja) | 1997-04-04 |
JP3536471B2 true JP3536471B2 (ja) | 2004-06-07 |
Family
ID=17170115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24789095A Expired - Lifetime JP3536471B2 (ja) | 1995-09-26 | 1995-09-26 | 識別装置および識別方法、並びに音声認識装置および音声認識方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US5828998A (ja) |
JP (1) | JP3536471B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3584458B2 (ja) * | 1997-10-31 | 2004-11-04 | ソニー株式会社 | パターン認識装置およびパターン認識方法 |
US7123166B1 (en) | 2000-11-17 | 2006-10-17 | Haynes Michael N | Method for managing a parking lot |
US6816085B1 (en) | 2000-01-14 | 2004-11-09 | Michael N. Haynes | Method for managing a parking lot |
JP4716605B2 (ja) * | 2001-03-29 | 2011-07-06 | 株式会社リコー | 音声認識装置及び音声認識方法 |
JP4194433B2 (ja) * | 2003-07-07 | 2008-12-10 | キヤノン株式会社 | 尤度算出装置および方法 |
GB2424970A (en) * | 2005-04-05 | 2006-10-11 | Giga Byte Tech Co Ltd | Method and Apparatus for dynamic physical network layer monitoring |
JP4298672B2 (ja) * | 2005-04-11 | 2009-07-22 | キヤノン株式会社 | 混合分布hmmの状態の出力確率計算方法および装置 |
CN106407976B (zh) * | 2016-08-30 | 2019-11-05 | 百度在线网络技术(北京)有限公司 | 图像字符识别模型生成和竖列字符图像识别方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4741036A (en) * | 1985-01-31 | 1988-04-26 | International Business Machines Corporation | Determination of phone weights for markov models in a speech recognition system |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
US5749072A (en) * | 1994-06-03 | 1998-05-05 | Motorola Inc. | Communications device responsive to spoken commands and methods of using same |
JP2690027B2 (ja) * | 1994-10-05 | 1997-12-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | パターン認識方法及び装置 |
US5638486A (en) * | 1994-10-26 | 1997-06-10 | Motorola, Inc. | Method and system for continuous speech recognition using voting techniques |
US5737489A (en) * | 1995-09-15 | 1998-04-07 | Lucent Technologies Inc. | Discriminative utterance verification for connected digits recognition |
-
1995
- 1995-09-26 JP JP24789095A patent/JP3536471B2/ja not_active Expired - Lifetime
-
1996
- 1996-09-24 US US08/710,941 patent/US5828998A/en not_active Expired - Lifetime
-
1998
- 1998-10-21 US US09/176,138 patent/US6134525A/en not_active Expired - Lifetime
Non-Patent Citations (2)
Title |
---|
A. Biem, S. Katagiri,Feature extraction based on minimum classification error / generalized probabilistic decent method,Proceedings of the 1993 IEEE International Conference on Acoustics, Speech, and Signal Processing (I,米国,1993年 4月27日,Vol.2,Pages 275−278) |
B. H. Juang, S. Katagiri,Discriminative learning for minimum error classification,IEEE Transactions on Signal Processing,米国,1992年12月,Vol.40, No.12,Pages 3043−3054 |
Also Published As
Publication number | Publication date |
---|---|
JPH0990976A (ja) | 1997-04-04 |
US5828998A (en) | 1998-10-27 |
US6134525A (en) | 2000-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0966736B1 (en) | Method for discriminative training of speech recognition models | |
US5440662A (en) | Keyword/non-keyword classification in isolated word speech recognition | |
US5675706A (en) | Vocabulary independent discriminative utterance verification for non-keyword rejection in subword based speech recognition | |
JP4531166B2 (ja) | 信頼性尺度の評価を用いる音声認識方法 | |
US5812975A (en) | State transition model design method and voice recognition method and apparatus using same | |
US4783804A (en) | Hidden Markov model speech recognition arrangement | |
JP5418223B2 (ja) | 音声分類装置、音声分類方法、および音声分類用プログラム | |
US6076053A (en) | Methods and apparatus for discriminative training and adaptation of pronunciation networks | |
EP0921519A2 (en) | Technique for adaptation of hidden Markov Models for speech recognition | |
EP1465154B1 (en) | Method of speech recognition using variational inference with switching state space models | |
US5594834A (en) | Method and system for recognizing a boundary between sounds in continuous speech | |
WO1998040876A9 (en) | Speech recognition system employing discriminatively trained models | |
AU684214B2 (en) | System for recognizing spoken sounds from continuous speech and method of using same | |
EP0788649A2 (en) | Method and system for pattern recognition based on tree organised probability densities | |
Katagiri et al. | A new hybrid algorithm for speech recognition based on HMM segmentation and learning vector quantization | |
McDermott et al. | Prototype-based minimum classification error/generalized probabilistic descent training for various speech units | |
JP3536471B2 (ja) | 識別装置および識別方法、並びに音声認識装置および音声認識方法 | |
KR100574769B1 (ko) | 최우법을 포함한 고유음성에 기초한 화자 및 환경 적응 방법 | |
JP2852298B2 (ja) | 標準パターン適応化方式 | |
KR101229108B1 (ko) | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | |
JP2996925B2 (ja) | 音素境界検出装置及び音声認識装置 | |
Yu et al. | Speaker recognition models. | |
JP3448371B2 (ja) | Hmmの学習装置 | |
JP3166708B2 (ja) | 音声認識装置及び方法 | |
Rigoll | Information theory-based supervised learning methods for self-organizing maps in combination with hidden Markov modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040308 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080326 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090326 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100326 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100326 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110326 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 9 |