JP3536471B2 - 識別装置および識別方法、並びに音声認識装置および音声認識方法 - Google Patents

識別装置および識別方法、並びに音声認識装置および音声認識方法

Info

Publication number
JP3536471B2
JP3536471B2 JP24789095A JP24789095A JP3536471B2 JP 3536471 B2 JP3536471 B2 JP 3536471B2 JP 24789095 A JP24789095 A JP 24789095A JP 24789095 A JP24789095 A JP 24789095A JP 3536471 B2 JP3536471 B2 JP 3536471B2
Authority
JP
Japan
Prior art keywords
function
discriminant function
adaptive
parameters
universal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP24789095A
Other languages
English (en)
Other versions
JPH0990976A (ja
Inventor
直人 岩橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP24789095A priority Critical patent/JP3536471B2/ja
Priority to US08/710,941 priority patent/US5828998A/en
Publication of JPH0990976A publication Critical patent/JPH0990976A/ja
Priority to US09/176,138 priority patent/US6134525A/en
Application granted granted Critical
Publication of JP3536471B2 publication Critical patent/JP3536471B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、識別装置および識
別方法、並びに音声認識装置および音声認識方法に関す
る。特に、例えば音声認識や画像認識などのパターン認
識を行う場合に用いて好適な識別装置および識別方法、
並びに音声認識装置および音声認識方法に関する。
【0002】
【従来の技術】例えば、音声認識や画像認識などのパタ
ーン認識では、入力されたパターンから特徴ベクトルを
抽出し、その特徴ベクトルを入力値にして、識別関数の
関数値を計算するようになされている。識別関数は、入
力された特徴ベクトルを、所定の数のクラスのうちのい
ずれかに分類するためのもので、少なくともクラスの数
だけ用意されており、入力された特徴ベクトルに対し、
その関数値を最も大きくする識別関数に対応するクラス
が、認識結果(識別結果)として出力される。
【0003】ところで、パターン認識を行う際には、変
動要因の状態が変化しても、高い認識性能が得られるこ
とが望ましい。そこで、従来より、パターン認識を行う
ための識別関数の学習は、多くの変動状態において観測
された学習サンプルを用いて行われるようになされてい
る。
【0004】即ち、例えば、音声認識を行う場合であれ
ば、発話環境、話者、入力機器系の特性(例えば、マイ
クや、そのマイクの出力をA/D変換するA/D変換器
の特性など)などの、音声の変動要因の状態が変化して
も、これらの変動に対して耐性の高い識別関数(例え
ば、音韻認識を行う場合であれば、音韻識別関数)を得
ることができるように、多くの変動状態において観測さ
れた音声データを、学習サンプルとして、学習が行われ
る。
【0005】ここで、上述のような学習方法について
は、例えば「確率モデルによる音声認識」、中川聖一、
電子情報通信学会や、KAI-FU LEE, Context-Dependent
Phonetic Hidden Markov Models for Speaker-Independ
ent Continuous Speech Recognition, IEEE Transactio
n on ASSP VOL. 38, NO. 4, APRIL 1990などに、その詳
細が開示されている。
【0006】図7は、従来の識別関数算出装置の一例の
構成を示している。多くの学習サンプルが、識別関数算
出器51に入力され、そこでは、その学習サンプルに基
づいて、識別関数、即ち、識別関数を表すパラメータ
(識別関数を構成するパラメータ)が求められる。
【0007】しかしながら、上述のような学習によって
得られた識別関数を、そのまま用いた場合、必ずしも満
足する認識性能を得ることができないことがあった。そ
こで、より高い認識性能を得るために、認識時におい
て、例えば、識別関数を、音声の変動要因の状態に適応
させる方法がある。例えば、音韻識別関数を、話者に適
用させる方法としては、Chin-Hui Lee et al., A Study
on Speaker Adaptationof the Parameters of Continu
ous Density Hidden Markov Models, IEEE, Transsacti
on on signal processing, VOL. 39, NO. 4, 1991や、
F. Class, et al., Fast Speaker Adaptation for Spee
ch Recognition Systems, Proceeding ofIEEE ICASSP,
pp. 133-136, 1990などに開示されているものなどがあ
る。
【0008】
【発明が解決しようとする課題】ところで、従来、学習
時においては、上述のように、認識時に用いられる適応
方法とは無関係に識別関数が求められる(決定される)
ようになされていた。即ち、識別関数は、適応が行われ
ないときに最高の性能を発揮するような基準を用いて決
定されていた。このため、認識時に、そのような識別関
数を用いて適応を行ったとしても、必ずしも最適な適応
を行うことができず、その結果、適応処理を行っても、
識別率(認識率)を、大きく向上させるのは困難であっ
た。
【0009】本発明は、このような状況に鑑みてなされ
たものであり、パターン認識を行うにあたって最適な適
応を行うことができるようにし、これにより識別率(認
識率)を大きく向上させることができるようにするもの
である。
【0010】
【0011】
【0012】
【課題を解決するための手段】 請求項に記載の識別装
置は、変動状態に依存しないユニバーサル識別関数を構
成するパラメータを記憶するユニバーサルパラメータ記
億手段と、特徴ベクトルに基づいてユニバーサル識別
関数を所定の変動状態に適応させるための適応用パラメ
ータを算出する適応手段と、ユニバーサル識別関数を構
成するパラメータを読み出し、ユニバーサル識別関数を
適応用パラメータにより適応させて、適応識別関数を構
成するパラメータを算出する適応パラメータ算出手段
と、適応識別関数を構成するパラメータおよび特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
手段と、適応識別関数の関数値からクラスを決定するク
ラス決定手段とを備えることを特徴とする。
【0013】請求項に記載の識別方法は、変動状態に
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、特
徴ベクトルに基づいて、ユニバーサル識別関数を所定の
変動状態に適応させるための適応用パラメータを算出す
る適応ステップと、ユニバーサル識別関数を構成するパ
ラメータを読み出し、ユニバーサル識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータを算出する適応パラメータ算出ステップと、適
応識別関数を構成するパラメータおよび特徴ベクトルか
ら適応識別関数の関数値を演算する識別関数演算ステッ
プと、適応識別関数の関数値からクラスを決定するクラ
ス決定ステップとを含むことを特徴とする。
【0014】請求項に記載の音声認識装置は、変動状
態に依存しないユニバーサル識別関数を構成するパラメ
ータを記憶するユニバーサルパラメータ記億手段と、特
徴ベクトルに基づいて、ユニバーサル識別関数を所定の
話者に適応させるための適応用パラメータを算出する話
者適応手段と、ユニバーサル識別関数を構成するパラメ
ータを読み出し、ユニバーサル識別関数を適応用パラメ
ータにより適応させて適応識別関数を構成するパラメー
タを算出する適応パラメータ算出手段と、適応識別関数
を構成するパラメータおよび特徴ベクトルから適応識別
関数の関数値を演算する識別関数演算手段と、適応識別
関数の関数値からクラスを決定するクラス決定手段とを
備えることを特徴とする。
【0015】
【0016】
【0017】請求項に記載の識別装置は、変動状態に
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億手段と、特徴ベ
クトルをユニバーサル識別関数に適応させるための適応
用パラメータを算出する適応手段と、適応用パラメータ
により特徴ベクトルを、ユニバーサル識別関数に適応さ
せて適応特徴パラメータを算出する適応ベクトル算出手
段と、ユニバーサル識別関数を構成するパラメータおよ
び適応特徴パラメータから適応識別関数の関数値を演算
する識別関数演算手段と、適応識別関数の関数値からク
ラスを決定するクラス決定手段とを備えることを特徴と
する。
【0018】請求項に記載の識別方法は、変動状態に
依存しないユニバーサル識別関数を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、特
徴ベクトルをユニバーサル識別関数に適応させるための
適応用パラメータを算出する適応ステップと、適応用パ
ラメータにより特徴ベクトルを、ユニバーサル識別関数
に適応させて適応特徴パラメータを算出する適応ベクト
ル算出ステップと、ユニバーサル識別関数を構成するパ
ラメータおよび適応特徴パラメータから適応識別関数の
関数値を演算する識別関数演算ステップと、適応識別関
数の関数値からクラスを決定するクラス決定ステップと
を含むことを特徴とする。
【0019】請求項に記載の音声認識方法は、変動状
態に依存しないユニバーサル識別関数を構成するパラメ
ータを記憶するユニバーサルパラメータ記億ステップ
と、所定の話者により入力された音声の特徴ベクトル
を、ユニバーサル識別関数に適応させるための適応用パ
ラメータを算出する話者適応ステップと、適応用パラメ
ータにより特徴ベクトルを、ユニバーサル識別関数に適
応させて適応特徴パラメータを算出する適応ベクトル算
出ステップと、ユニバーサル識別関数を構成するパラメ
ータおよび適応特徴パラメータから適応識別関数の関数
値を演算する識別関数演算ステップと、適応識別関数の
関数値からクラスを決定するクラス決定ステップとを含
ことを特徴とする。請求項7に記載の識別装置は、変
動状態に依存しない識別関数を構成するパラメータを記
憶するパラメータ記億手段と、特徴ベクトルに基づい
て、識別関数を所定の変動状態に適応させるための適応
用パラメータを算出する適応手段と、識別関数を構成す
るパラメータを読み出し、識別関数を適応用パラメータ
により適応させて、適応識別関数を構成するパラメータ
を算出する適応パラメータ算出手段と、適応識別関数を
構成するパラメータおよび特徴ベクトルから適応識別関
数の関数値を演算する識別関数演算手段と、適応識別関
数の関数値からクラスを決定するクラス決定手段とを備
えることを特徴とする。 請求項8に記載の識別方法は、
変動状態に依存しない識別関数を構成するパラメータを
記憶するパラメータ記億ステップと、特徴ベクトルに基
づいて、識別関数を所定の変動状態に適応させるための
適応用パラメータを算出する適応ステップと、識別関数
を構成するパラメータを読み出し、識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータを算出する適応パラメータ算出ステップと、適
応識別関数を構成するパラメータおよび特徴ベクトルか
ら適応識別関数の関数値を演算する識別関数演算ステッ
プと、適応識別関数の関数値からクラスを決定するクラ
ス決定ステップとを含むことを特徴とする。 請求項9に
記載の音声認識装置は、変動状態に依存しない識別関数
を構成するパラメータを記憶するパラメータ記億手段
と、特徴ベクトルに基づいて、識別関数を所定の話者に
適応させるための適応用パラメータを算出する話者適応
手段と 、識別関数を構成するパラメータを読み出し、識
別関数を適応用パラメータにより適応させて適応識別関
数を構成するパラメータを算出する適応パラメータ算出
手段と、適応識別関数を構成するパラメータおよび特徴
ベクトルから適応識別関数の関数値を演算する識別関数
演算手段と、適応識別関数の関数値からクラスを決定す
るクラス決定手段とを備えることを特徴とする。
【0020】
【0021】
【0022】請求項に記載の識別装置および請求項2
に記載の識別方法においては、変動状態に依存しないユ
ニバーサル識別関数を構成するパラメータが記憶され、
特徴ベクトルに基づいてユニバーサル識別関数を所定
の変動状態に適応させるための適応用パラメータが算出
されるとともに、ユニバーサル識別関数を構成するパラ
メータが読み出され、ユニバーサル識別関数を適応用パ
ラメータにより適応させて、適応識別関数を構成するパ
ラメータが算出される。そして、適応識別関数を構成す
るパラメータおよび特徴ベクトルから適応識別関数の関
数値が演算され、適応識別関数の関数値からクラスが決
定される。
【0023】
【0024】請求項に記載の音声認識装置において
は、変動状態に依存しないユニバーサル識別関数を構成
するパラメータが記憶され、特徴ベクトルに基づいて、
ユニバーサル識別関数を所定の話者に適応させるための
適応用パラメータが算出されるとともに、ユニバーサル
識別関数を構成するパラメータが読み出され、ユニバー
サル識別関数を適応用パラメータにより適応させて適応
識別関数を構成するパラメータが算出される。そして、
適応識別関数を構成するパラメータおよび特徴ベクトル
から適応識別関数の関数値が演算され、適応識別関数の
関数値からクラスが決定される。
【0025】
【0026】
【0027】請求項に記載の識別装置および請求項5
に記載の識別方法においては、変動状態に依存しないユ
ニバーサル識別関数を構成するパラメータが記憶され、
特徴ベクトルをユニバーサル識別関数に適応させるため
の適応用パラメータが算出されるとともに、適応用パラ
メータにより特徴ベクトルを、ユニバーサル識別関数に
適応させて適応特徴パラメータが算出される。そして、
ユニバーサル識別関数を構成するパラメータおよび適応
特徴パラメータから適応識別関数の関数値が演算され、
適応識別関数の関数値からクラスが決定される。
【0028】
【0029】請求項に記載の音声認識方法において
は、変動状態に依存しないユニバーサル識別関数を構成
するパラメータが記憶され、所定の話者により入力され
た音声の特徴ベクトルを、ユニバーサル識別関数に適応
させるための適応用パラメータが算出されるとともに、
適応用パラメータにより特徴ベクトルを、ユニバーサル
識別関数に適応させて適応特徴パラメータが算出され
る。そして、ユニバーサル識別関数を構成するパラメー
タおよび適応特徴パラメータから適応識別関数の関数値
が演算され、適応識別関数の関数値からクラスが決定さ
れる。 請求項7に記載の識別装置および請求項8に記載
の識別方法においては、変動状態に依存しない識別関数
を構成するパラメータが記憶され、特徴ベクトルに基づ
いて、識別関数を所定の変動状態に適応させるための適
応用パラメータが算出されるとともに、識別関数を構成
するパラメータが読み出され、識別関数を適応用パラメ
ータにより適応させて、適応識別関数を構成するパラメ
ータが算出される。そして、適応識別関数を構成するパ
ラメータおよび特徴ベクトルから適応識別関数の関数値
が演算され、適応識別関数の関数値からクラスが決定さ
れる。 請求項9に記載の音声認識装置においては、変動
状態に依存しない識別関数を構成するパラメータが記憶
され、特徴ベクトルに基づいて、識別関数を所定の話者
に適応させるための適応用パラメータが算出され、識別
関数を構成するパラメータが読み出され、識別関数を適
応用パラメータにより適応させて適応識別関数を構成す
るパラメータが算出される。そして、適応識別関数を構
成するパラメータおよび特徴ベクトルから適応識別関数
の関数値が演算され、適応識別関数の関数値からクラス
が決定される。
【0030】
【発明の実施の形態】以下に、本発明の実施例を説明す
るが、その前に、特許請求の範囲に記載の発明の各手段
と以下の実施例との対応関係を明らかにするために、各
手段の後の括弧内に、対応する実施例(但し、一例)を
付加して、本発明の特徴を記述すると、次のようにな
る。
【0031】
【0032】
【0033】
【0034】
【0035】請求項に記載の識別装置は、入力された
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
分類することにより識別を行う識別装置(例えば、図
1の識別器5)において変動状態に依存しないユニバ
ーサル識別関数(例えば、ユニバーサル識別関数G
k (O))を構成するパラメータ(例えば、ユニバーサ
ルパラメータλ k )を記憶するユニバーサルパラメータ
記億手段(例えば、ユニバーサルパラメータ記憶部1
1)と、前記特徴ベクトルに基づいて、前記ユニバーサ
識別関数を所定の変動状態(例えば、変動状態V t
適応させるための適応用パラメータ(例えば、適応用
パラメータΓ (ML)t )を算出する適応手段(例えば、図
1の話者適応器4)と、前記ユニバーサル識別関数を構
成するパラメータを読み出し、前記ユニバーサル識別関
数を前記適応用パラメータにより適応させて、適応識別
関数を構成するパラメータ(例えば、パラメータ
ψ t,k )を算出する適応パラメータ算出手段(例えば、
図1の適応パラメータ算出器12)と、前記適応識別関
数を構成するパラメータおよび前記特徴ベクトルから適
応識別関数の関数値を演算する識別関数演算手段(例え
ば、図1の識別関数演算器13−k)と、前記適応識別
関数の関数値からクラスを決定するクラス決定手段(例
えば、図1のクラス決定回路14)とを備えることを特
徴とする。
【0036】請求項に記載の識別方法は、入力された
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
分類することにより識別を行う識別方法において、
動状態に依存しないユニバーサル識別関数(例えば、ユ
ニバーサル識別関数G k (O))を構成するパラメータ
(例えば、ユニバーサルパラメータλ k )を記憶するユ
ニバーサルパラメータ記億ステップと、前記特徴ベクト
ルに基づいて、前記ユニバーサル識別関数を所定の変動
状態(例えば、変動状態V t )に適応させるための適応
用パラメータ(例えば、適応用パラメータΓ (ML)t )を
算出する適応ステップと、前記ユニバーサル識別関数を
構成するパラメータを読み出し、前記ユニバーサル識別
関数を前記適応用パラメータにより適応させて、適応識
別関数を構成するパラメータ(例えば、パラメータψ
t,k )を算出する適応パラメータ算出ステップと、前記
適応識別関数を構成するパラメータおよび前記特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
ステップと、前記適応識別関数の関数値からクラスを決
定するクラス決定ステップとを含むことを特徴とする。
【0037】請求項に記載の音声認識装置は、入力さ
れた音声特徴ベクトル(例えば、特徴ベクトルO)
所定クラスに分類することにより音声を認識する音声認
識装置において、変動状態に依存しないユニバーサル識
別関数(例えば、ユニバーサル識別関数G k (O))を
構成するパラメータ(例えば、ユニバーサルパラメータ
λ k )を記憶するユニバーサルパラメータ記億手段(例
えば、ユニバーサルパラメータ記憶部11)と、前記特
徴ベクトルに基づいて、前記ユニバーサル識別関数を所
定の話者に適応させるための適応用パラメータ(例え
ば、適応用パラメータΓ (ML)t )を算出する話者適応手
例えば、図1の話者適応器4)と、前記ユニバーサ
ル識別関数を構成するパラメータを読み出し、前記ユニ
バーサル識別関数を前記適応用パラメータにより適応さ
せて適応識別関数を構成するパラメータ(例えば、パラ
メータψ t,k )を算出する適応パラメータ算出手段(例
えば、図1の適応パラメータ算出器12)と、前記適応
識別関数を構成するパラメータおよび前記特徴ベクトル
から適応識別関数の関数値を演算する識別関数演算手段
(例えば、図1の識別関数演算器13−k)と、前記適
応識別関数の関数値からクラスを決定するクラス決定手
段(例えば、図1のクラス決定回路14)とを備える
とを特徴とする。
【0038】
【0039】
【0040】
【0041】
【0042】請求項に記載の識別装置は、入力された
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
分類することにより識別を行う識別装置(例えば、図
5の識別器35)において変動状態に依存しないユニ
バーサル識別関数(例えば、ユニバーサル識別関数G k
(O))を構成するパラメータを記憶するユニバーサル
パラメータ記億手段(例えば、図5のユニバーサルパラ
メータ記憶部11)と、前記特徴ベクトルを前記ユニバ
ーサル識別関数に適応させるための適応用パラメータ
(例えば、適応用パラメータΓ (ML)t )を算出する適応
手段例えば、図5の話者適応器34)と、前記適応用
パラメータにより前記特徴ベクトルを、前記ユニバーサ
ル識別関数に適応させて適応特徴パラメータ(例えば、
F(O|γ t,k ))を算出する適応ベクトル算出手段
(例えば、図5の適応ベクトル算出器36)と、前記ユ
ニバーサル識別関数を構成するパラメータおよび前記適
応特徴パラメータから適応識別関数の関数値を演算する
識別関数演算手段(例えば、図5の識別関数演算器13
−k)と、前記適応識別関数の関数値からクラスを決定
するクラス決定手段(例えば、図5のクラス決定回路1
4)とを備えることを特徴とする。
【0043】請求項に記載の識別方法は、入力された
特徴ベクトル(例えば、特徴ベクトルO)を所定クラス
分類することにより識別を行う識別方法において、
動状態に依存しないユニバーサル識別関数(例えば、ユ
ニバーサル識別関数G k (O))を構成するパラメータ
を記憶するユニバーサルパラメータ記億ステップと、前
記特徴ベクトルを前記ユニバーサル識別関数に適応させ
るための適応用パラメータ(例えば、適応用パラメータ
Γ (ML)t )を算出する適応ステップと、前記適応用パラ
メータにより前記特徴ベクトルを、前記ユニバーサル識
別関数に適応させて適応特徴パラメータ(例えば、F
(O|γ t,k ))を算出する適応ベクトル算出ステップ
と、前記ユニバーサル識別関数を構成するパラメータお
よび前記適応特徴パラメータから適応識別関数の関数値
を演算する識別関数演算ステップと、前記適応識別関数
の関数値からクラスを決定するクラス決定ステップとを
含むことを特徴とする。
【0044】請求項に記載の音声認識方法は、入力さ
れた音声の特徴ベクトル(例えば、特徴ベクトルO)を
所定クラスに分類することにより音声を認識する音声認
識方法において、変動状態に依存しないユニバーサル識
別関数(例えば、ユニバーサル識別関数G k (O))を
構成するパラメータを記憶するユニバーサルパラメータ
記億ステップと、所定の話者により入力された音声の前
記特徴ベクトルを、前記ユニバーサル識別関数に適応さ
せるための適応用パラメータ(例えば、適応用パラメー
タΓ (ML)t )を算出する話者適応ステップと、前記適応
用パラメータにより前記特徴ベクトルを、前記ユニバー
サル識別関数に適応させて適応特徴パラメータ(例え
ば、F(O|γ t,k ))を算出する適応ベクトル算出ス
テップと、前記ユニバーサル識別関数を構成するパラメ
ータおよび前記適応特徴パラメータから適応識別関数の
関数値を演算する識別関数演算ステップと、前記適応識
別関数の関数値からクラスを決定するクラス決定ステッ
プとを含むことを特徴とする。請求項7に記載の識別装
置は、入力された特徴ベクトル(例えば、特徴ベクトル
O)を所定クラスに分類することにより識別を行う識別
装置(例えば、図1の識別器5)において、変動状態に
依存しない識別関数(例えば、識別関数G k (O))を
構成するパラメータ(例えば、パラメータλ k )を記憶
するパラメータ記億手段(例えば、パラメータ記憶部1
1)と、前記特徴ベクトルに基づいて、前記識別関数を
所定の変動状態(例えば、変動状態V t )に適応させる
ための適応用パラメータ(例えば、適応用パラメータΓ
(ML)t )を算出する適応手段(例えば、図1の話者適応
器4)と、前記識別関数を構成するパラメータを読み出
し、前記識別関数を前記適応用パラメータにより適応さ
せて、適応識別関数を構成するパラメータ(例えば、パ
ラメータψ t,k )を算出する適応パラメータ算出手段
(例えば、図1の適応パラメータ算出器12)と、前記
適応識別関数を構成するパラメータおよび前記特徴ベク
トルから適応識別関数の関数値を演算する識別関数演算
手段(例えば、図1の識別関数演算器13−k)と、前
記適応識別関数の関数値からクラスを決定するクラス決
定手段(例えば、図1のクラス決定回路14)とを備え
ることを特徴とする。 請求項8に記載の識別方法は、入
力された特徴ベクトル(例えば、特徴ベクトルO)を所
定クラスに分類することにより識別を行う識別方法にお
いて、変動状態に依存しない識別関数(例えば、識別関
数G k (O))を構成するパラメータ(例えば、パラメ
ータλ k )を記憶するパラメータ記億ステップと、前記
特徴ベクトルに基づいて、前記識別関数を所定の変動状
態(例えば、変動状態V t )に適応させるための適応用
パラメータ(例えば、適応用パラメータΓ (ML)t )を算
出する適応ステップと、前記識別関数を構成するパラメ
ータを読み出し、前記識別関数を前記適応用パラメータ
により適応させて、適応識別関数を構成するパラメータ
(例えば、パラメータψ t,k )を算出する適応パラメー
タ算出ステップと、前記適応識別関数を構成するパラメ
ータおよび前記特徴ベクトルから適応識別関数の関数値
を演算する識別関数演算ステップと、前記適応識別関数
の関数値からクラスを決定するクラス決定ステップとを
含むことを特徴とする。 請求項9に記載の音声認識装置
は、入力された音声の特徴ベクトル(例えば、特徴ベク
トルO)を所定クラスに分類することにより音声を認識
する音声認識装置において、変動状態に依存しない識別
関数(例えば、識別関数G k (O))を構成するパラメ
ータ(例えば、パラメータλ k )を記憶するパラメータ
記億手段(例えば、パラメータ記憶部11)と、前記特
徴ベクトルに基づいて、前記識別関数を所定の話者に適
応させるための適応用パラメータ(例えば、適応用パラ
メータΓ (ML)t )を算出する話者適応手段(例えば、図
1の話者適応器4)と、前記識別関数を構成するパラメ
ータを読み出し、前記識別関数を前記適応用パラメータ
により適応させて適応識別関数を構成するパラメータ
(例えば、パラメータψ t,k )を算出する適応パラメー
タ算出手段(例えば、図1の適応パラメータ算出器1
2)と、前記適応識別関数を構成するパラメータおよび
前記特徴ベクトルから適応識別関数の関数値を演算する
識別関数演算手段(例えば、図1の識別関数演算器13
−k)と、前記適応識別関数の関数値からクラスを決定
するクラス決定手段(例えば、図1のクラス決定回路1
4)とを備えることを特徴とする。
【0045】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。
【0046】図1は、本発明を適用した音声認識装置の
一実施例の構成を示している。なお、この音声認識装置
においては、話者に適応した音声の認識が行われるよう
になされている。
【0047】即ち、マイク1に入力された音声は、電気
信号としての音声信号に変換され、音響分析部2に出力
される。音響分析部2では、マイク1からの音声信号が
A/D変換されることによりディジタルの音声信号とさ
れ、さらに、その音声信号に対し、所定の音響分析処理
が施されることで、音声の特徴ベクトル(例えば、LP
C(線形予測係数)や、LPCケプストラム、所定の帯
域幅ごとのパワーなど)が抽出される。この特徴ベクト
ルOは、スイッチ3に供給される。
【0048】スイッチ3は、例えば、ある話者によって
発話が開始された場合などの、話者Vtに対する適応を
行う必要がある場合、端子aを選択する。従って、この
ような場合、音響分析部2から出力された特徴ベクトル
Oは、話者Vtに対する適応を行うための適応用のサン
プルAtとして、スイッチ3および端子aを介して、話
者適応器4に出力される。
【0049】話者適応器4では、適応用のサンプルAt
に基づいて、後述する識別器5が記憶しているユニバー
サル識別関数を話者Vtに適応させるための適応用パラ
メータΓ(ML)tが算出され、識別器5を構成する適応パ
ラメータ算出器12に供給される。
【0050】話者適応器4から識別器5に対し、適応用
パラメータΓ(ML)tが出力されると、スイッチ3は、端
子bを選択し、これにより、音響分析部2から出力され
た特徴ベクトルOは、スイッチ3および端子bを介し
て、識別器5の識別関数演算器13(識別関数演算器1
3−1乃至13−K)に供給されるようになる。
【0051】識別器5では、入力された特徴ベクトルO
が、識別関数(ユニバーサル識別関数)を用いて、所定
の数KのクラスCkのうちのいずれかに分類されるこ
で、マイク1に入力された音声の識別(認識)が行われ
る。即ち、ユニバーサルパラメータ記憶部11には、ク
ラスCkに対応するユニバーサル識別関数を構成するパ
ラメータ(例えば、関数f(x)=ax2+bx+cに
ついては、a,b,c)(本実施例中において、適宜、
ユニバーサルパラメータという)λk(ベクトル)が記
憶されており、適応パラメータ算出器12は、話者適応
器4から適応用パラメータΓ(ML)tを受信すると、ユニ
バーサルパラメータ記憶部11からユニバーサル識別関
数(ユニバーサルパラメータ)を読み出し、適応用パラ
メータΓ(M L)tに基づいて適応させる(変換する)。こ
れにより、適応用のサンプルAt、即ち、この場合は話
者Vtに適応した識別関数(本実施例において、適宜、
適応識別関数という)を構成するパラメータψt,k(=
F((λk,Γ(ML)t))が算出される。
【0052】パラメータψt,kは、クラスCkに対応する
適応識別関数の関数値を演算する識別関数演算器13−
kに供給される。識別関数演算器13−kでは、パラメ
ータψt,kで表現される適応識別関数の関数値が、特徴
ベクトルOを入力値として計算され、クラス決定回路1
4に出力される。クラス決定回路14では、識別関数演
算器13−1乃至13−Kが出力する関数値のうち、例
えば最も値の大きいものが検出され、その関数値が得ら
れた適応識別関数に対応するクラスCkのサフィックス
kが、音声認識結果として決定されて出力される。
【0053】次に、図1の音声認識装置の認識(識別)
原理について説明する。いま、ある変動要因の状態(変
動状態)Vtに適応された、あるクラスCkに対応する適
応識別関数をgt,k(・)と表す。例えば、音韻を音声
認識結果として出力する音声認識を考えた場合、Vt
話者に、クラスCkは認識結果としての音韻に、それぞ
れ対応する。
【0054】さらに、変動状態Vtが既知で、その変動
状態Vtにおいてサンプル(特徴ベクトル)Oが観測さ
れた場合に、そのサンプルOが、どのクラスに識別され
るかを決定するクラス決定規則を次式で定義する。
【0055】
【数1】
【0056】この場合、サンプルOは、式(1)によっ
て与えられるkをサフィックスとするクラスCkに識別
される。
【0057】いま、クラスCkとして、クラスC1乃至C
KのK個のクラスがあり、変動状態Vtにおいて、クラス
1乃至CKそれぞれに属するサンプルOが観測される事
前確率p(C1,Vt)乃至p(CK,Vt)が等しいとす
ると、即ち、音声認識についていえば、例えば、ある話
者Vtが、認識対象となっている音韻C1乃至CKそれぞ
れを発話する事前確率p(C1,Vt)乃至p(CK
t)が等しいとすると、変動状態Vtにおいて、サンプ
ルOが観測された場合に、最小誤り率を実現する適応識
別関数gt,k(O)は、例えば次式で与えられる。
【0058】 gt,k(O)=p(O|Ck,Vt)・・・(2)
【0059】即ち、この場合、適応識別関数g
t,k(O)は、変動状態VtおよびクラスCkによって条
件づけられる確率密度関数(以下、適宜、条件付き確率
密度関数という)p(O|Ck,Vt)で表される。い
ま、この条件付き確率密度関数p(O|Ck,Vt)が、
パラメータ(ベクトル)ψt,kによって一意に決定され
るもの、即ち、パラメトリック形式で表わされるものと
する。ここで、条件付き確率密度関数p(O|Ck
t)がパラメータψt,kに依存していることを表すため
に、以下、p(O|Ck,Vt)を、p(O|ψt,k)と
表すこととする。
【0060】この条件付き確率密度p(O|ψt,k
は、クラスCkによって条件づけられ、かつパラメトリ
ック形式で表される確率密度関数(これも、以下、適
宜、条件付き確率密度関数という)p(O|λk)をあ
らかじめ決めておけば、この条件付き確率密度関数p
(O|λk)を、変動状態Vtに適応させることによって
得ることができる。
【0061】条件付き確率密度関数p(O|λk)は、
変動状態Vtに依存せず、従って、すべての変動状態Vt
について用いることができることから、「ユニバーサ
ル」な、条件付き確率密度関数ということができる。こ
こで、Gk(O)=p(O|λk)とし、以下、適宜、G
k(O)を、ユニバーサル識別関数という。また、λ
kは、ユニバーサル識別関数Gk(・)を構成(表現)す
るパラメータであるから、本実施例中においては、λk
を、適宜、ユニバーサルパラメータという。
【0062】以上から、適応識別関数gt,k(O)は、
ユニバーサル識別関数Gk(O)を、変動状態Vtに適応
させることによって得ることができるが、この適応に対
応する変換を行う関数(以下、適宜、適応用関数とい
う)をF(・)と表し、その適応用関数F(・)が、適
応用パラメータ(ベクトル)γt,kで制御されるものと
すると、適応識別関数gt,k(O)を表すパラメータ
(本実施例中において、適宜、適応パラメータという)
ψt,kは、次式で示される。
【0063】ψt,k=F(λk,γt,k)・・・(3)
【0064】なお、以下、適宜、適応パラメータ
ψt,1,ψt,2,・・・,ψt,Kの集合でなるベクトル
[ψt,1,ψt,2,・・・,ψt,K]をΨtと、ユニバーサ
ルパラメータλ1,λ2,・・・,λKの集合でなるベク
トル[λ1,λ2,・・・,λK]をΛと、適応用パラメ
ータγt,1,γt,2,・・・,γt,Kの集合でなるベクト
ル[γt,1,γt,2,・・・,γt,K]をΓtと、それぞれ
表す。この場合、例えば、式(3)は次式のようにな
る。
【0065】Ψt=F(Λ,Γt)・・・(4)
【0066】認識時(識別時)においては、ユニバーサ
ル識別関数Gk(O)を、変動状態Vtに適応させ、適応
識別関数gt,k(O)を得る必要があるが、このために
は、適応用関数F(Λ,Γt)を制御(構成)する適応
用パラメータΓtであって、変動状態Vtに対応するもの
を求める必要がある。この適応用パラメータΓtは、変
動状態Vtにおいて観測されるサンプル(このサンプル
は、ユニバーサル識別関数Gk(O)を変動状態Vtに適
応させるために用いられるので、本実施例中において、
適宜、適応用のサンプルという)Atに基づいて決定す
ることができる。
【0067】ここで、適応用のサンプルAtは、次式で
与えられるものとする。
【0068】
【数2】
【0069】但し、上式において、Ot,k,i (A)は、変動
状態Vtにおいて観測された、クラスCkに属する特徴ベ
クトルOであって、第i番目のものを表しており、m
t,kは、変動状態Vtにおいて観測された、クラスCk
属する特徴ベクトルOの総数を表す。また、特徴ベクト
ルOt,k,i (A)における(A)は、特徴ベクトルO t,k,i
が、ユニバーサル識別関数Gk(O)を変動状態Vtに適
応させるために用いられるものであることを表す。な
お、mt,kは、小さな値で良く、例えば1であっ ても良
い。
【0070】この場合、適応用パラメータΓtの最尤推
定値(Maximum Likelihood)Γ(ML)tは、次式によって
得ることができる。
【0071】
【数3】
【数4】
【0072】なお、ユニバーサルパラメータΛは固定値
とする。
【0073】式(6)により適応用パラメータΓt(適
応用パラメータの最尤推定値Γ(ML)t)を得た後は、式
(4)にしたがって、適応パラメータΨtを求め、入力
された特徴ベクトルOに対する条件付き確率密度関数
(O|ψ t,k 、即ち、適応識別 関数gt,k(O)を計
算し、式(1)で示される条件を満たすkを求めること
で 、入力された特徴ベクトルOの識別結果であるクラ
スCkを得ることができる。
【0074】図1の音声認識装置では、以上の原理に基
づき、クラスCkのサフィックスkが、音声認識結果と
して出力されるようになされている。即ち、話者適応器
4では、適応用のサンプルAtを用い、式(6)にした
がって、適応用パラメータΓt(最尤推定値Γ(ML)t)が
求められる。ユニバーサルパラメータ記憶部11には、
ユニバーサルパラメータΛ(λ1,λ2,・・・,λK
が記憶されており、適応パラメータ算出器12では、そ
のユニバーサルパラメータΛが、話者適応器4で求めら
れた適応用パラメータΓtを用い、式(3)または
(4)にしたがって変換され、これにより、ユニバーサ
ル識別関数Gk(・)を、適応用のサンプルAtに適応さ
せた適応識別関数gt,k(・)を構成する適応パラメー
タΨt(ψt, 1,ψt,2,・・・,ψt,K)が算出され
る。そして、識別関数演算器13−1乃至13−Kで
は、適応パラメータψt,1,ψt,2,・・・,ψt,Kで表
される適応識別関数gt,k(・)の、特徴ベクトルOに
ついての関数値gt,1(O),gt,2(O),・・・,g
t, K(O)が計算される。その後、クラス決定回路14
では、関数値gt,1(O),gt,2(O),・・・,g
t,K(O)を用いて、式(1)を満たすkが求められ
る。
【0075】次に、図1のユニバーサルパラメータ記憶
部11に記憶させるユニバーサル識別関数Gk(・)、
即ち、ユニバーサルパラメータΛの算出方法(学習方
法)について説明する。いま、T個の変動状態V1
2,・・・,VTにおいてそれぞれ観測(抽出)され
た、K個のクラスC1,C2,・・・,CKそれぞれに属
する特徴ベクトルの集合でなる学習サンプルXを考え、
これを、以下のように表す。
【0076】
【数5】
【数6】
【数7】
【0077】なお、式(8)において、Xtは、変動状
態Vtにおいて観測された学習サンプルの集合を表し、
式(9)において、Ot,kは、変動状態Vtにおいて観測
された学習サンプルのうち、クラスCkに属するものの
集合を表す。また、式(9)において、mt,kは、学習
サンプル(学習サンプルの集合)Ot,kを構成する特徴
ベクトル、即ち、変動状態Vtにおいて観測された、ク
ラスCkに属する学習サンプルの総数を表し、O
t,k,iは、学習サンプルOt,kの中の第i番目の特徴ベク
トルを表す。
【0078】ここで、以下、適宜、適応用パラメータΓ
1,Γ2,・・・,ΓKの集合でなるベクトルまたは適応
パラメータΨ1,Ψ2,・・・,ΨKの集合でなるベクト
ルを、それぞれ式(11)または(12)に示すよう
に、ΓまたはΨで表す。 Γ=[Γ1,Γ2,・・・,ΓT] ・・・(11) Ψ=[Ψ1,Ψ2,・・・,ΨT] ・・・(12)
【0079】この場合、例えば、式(3)または(4)
は次式のように表される。 Ψ=F(Λ,Γ) ・・・(13)
【0080】次に、本実施例では、ユニバーサルパラメ
ータΛの学習を、例えば、ユニバーサル識別関数G
k(・)を、学習サンプルXに適応させる変換(適応用
関数Fによる変換)F(・)を行って得られる適応識別
関数gt,k(・)(これは、上述したように、Ψ、即
ち、F(Λ,Γ)をパラメータとする)の、学習サンプ
ルXに対する尤度を評価基準として行うものとし、以
下、この尤度を、p(X|F(Λ,Γ))と表す。
【0081】適応用パラメータΓtは、ユニバーサルパ
ラメータΛを、変動状態Vt、即ち、適応用のサンプル
tに適応させるものであるから、この適応用パラメー
タΓtは、ユニバーサルパラメータΛおよび適応用のサ
ンプルA tの関係から得ることができ、さらに、適応用
のサンプルAtは、変動状態Vtにおいて任意に観測され
るものであるから、適応用パラメータΓtは確率変数と
みなすことができる。この場合 、学習サンプルXに対
するユニバーサルパラメータΛの対数尤度U1(X,
Λ) は、次式で定義することができる。
【0082】
【数8】
【0083】ユニバーサルパラメータΛの最尤推定値Λ
(ML)は、次式に示すように、対数尤度U1(X,Λ)を
最大化することで求めることができる。
【0084】
【数9】
【0085】しかしながら、上式におけるp(Γt
Λ)を求めるには、一般に無限のサンプルが必要とな
る。そこで、次のようにして、p(Γt|Λ)を帰納的
に学習しながら、尤度の最大化を図ることとする。
【0086】即ち、例えば学習サンプルXt(但し、こ
れは、学習サンプルXtである必要は必ずしもなく、変
動状態Vtにおいて観測されたものであれば良い)の中
から、適応用パラメータΓを求めるためのサンプル(以
下、適宜、このサンプルも適応用のサンプルという)B
t,hを選択する。但し、h=1,2,・・・,Htで、H
tは、適応用のサンプルの総数である。なお、Htは1以
上であれば良い。
【0087】この場合、学習サンプルXに対するユニバ
ーサルパラメータΛの対数尤度U2(X,Λ)は、次式
で与えられる。
【0088】
【数10】
【0089】ここで、Γ(ML)t,hは、サンプルBt,hに基
づいて得られる適応用パラメータΓの最尤推定値で、次
式で与えられるものである。
【0090】
【数11】
【0091】この場合、ユニバーサルパラメータΛの最
尤推定値Λ(ML)は、次式にしたがって、式(16)を最
大化することで求めることができる。
【0092】
【数12】
【0093】図2は、以上のような原理に基づいて、ユ
ニバーサル識別関数Gk(・)、即ち、ユニバーサルパ
ラメータΛを算出する識別関数算出装置の一実施例の構
成を示している。学習サンプルXは、適応用関数パラメ
ータ算出用学習サンプル抽出器21およびユニバーサル
パラメータ算出器23に供給される。ここで、図1の識
別器5に適用される(ユニバーサルパラメータ記憶部1
1に記憶させる)ユニバーサルパラメータΛを算出する
場合においては、学習サンプルXとしては、音響分析部
2から出力される特徴ベクトルが用いられる。
【0094】適応用関数パラメータ算出用学習サンプル
抽出器21では、学習サンプルXから、上述したような
サンプルBt,hが抽出される。ここで、サンプルBt,h
抽出は、例えば、適応用関数パラメータ算出用学習サン
プル抽出器21で乱数が発生され、その乱数に基づい
て、学習サンプルXからサンプルを選択することで行わ
れる。
【0095】適応用関数パラメータ算出用学習サンプル
抽出器21で抽出されたサンプルBt,hは、適応用パラ
メータ算出器22に供給される。さらに、適応用パラメ
ータ算出器22には、ユニバーサルパラメータ算出器2
3から、所定のユニバーサルパラメータも供給される。
適応用パラメータ算出器22では、ユニバーサルパラメ
ータ算出器23からのユニバーサルパラメータΛを、サ
ンプルBt,hに適応させるための適応用パラメータΓが
算出される。即ち、適応用パラメータ算出器22は、式
(17)にしたがって、適応用パラメータΓの最尤推定
値Γ(ML)t,hを算出する。この適応用パラメータΓ
(ML)t,hは、ユニバーサルパラメータ算出器23に出力
される。
【0096】ユニバーサルパラメータ算出器23では、
式(18)にしたがって、ユニバーサルパラメータΛの
最尤推定値Λ(ML)が求められる。即ち、ユニバーサルパ
ラメータ算出器23では、適応用パラメータ算出器22
からの適応用パラメータΓ(M L)t,hに基づいて、ユニバ
ーサルパラメータΛが変換され、これにより、式(1
6)におけるF(Λ,Γ(ML)t,h)(これは、ユニバー
サル識別関数Gk(・)をサンプルBt,hに適応させる変
換を行って得られる適応識別関数gt,k(・)のパラメ
ータΨtである)が求められる。そして、サンプルXに
対するF(Λ,Γ(ML )t,h)の尤度(本実施例において
は、上述したように、式(16)で表される対数尤度U
2)を最も高くするユニバーサルパラメータΛ(ML)が算
出される。
【0097】さらに、ユニバーサルパラメータ算出器2
3は、ユニバーサルパラメータΛ(M L)を与える対数尤度
2が、例えば所定の閾値以上であるかどうかを判定す
る。そして、対数尤度U2が、所定の閾値以上でない場
合、その対数尤度U2が向上するようなユニバーサルパ
ラメータΛを、適応用パラメータ算出器22に供給す
る。適応用パラメータ算出器22は、新たなユニバーサ
ルパラメータを受信すると、再び、式(17)にしたが
って、適応用パラメータΓの最尤推定値Γ(ML)t,hを算
出し、ユニバーサルパラメータ算出器23に出力する。
【0098】以下、適応用パラメータ算出器22および
ユニバーサルパラメータ算出器23では、ユニバーサル
パラメータΛ(ML)を与える対数尤度U2が所定の閾値以
上となるまで、同様の処理が繰り返される。
【0099】そして、ユニバーサルパラメータΛ(ML)
与える対数尤度U2が所定の閾値以上となると、ユニバ
ーサルパラメータ算出器23は、そのユニバーサルパラ
メータΛ(ML)を、メモリ24に出力して記憶させる。メ
モリ24に記憶されたユニバーサルパラメータΛ
(ML)は、その後、必要に応じて、例えばユニバーサルパ
ラメータ記憶部11(図1)などに転送される。
【0100】以上のように、変動状態Vtとユニバーサ
ル識別関数Gk(・)との関係に応じて、ユニバーサル
識別関数Gk(・)を、学習サンプルXtに適応させなが
ら学習を行うようにしたので、適応処理を行ったときに
最高の性能を発揮するようなユニバーサル識別関数Gk
(・)を得ることができ、その結果、認識時において、
このユニバーサル識別関数Gk(・)を用いることで、
認識率を向上させることができる。
【0101】なお、式(14)におけるp(Γt|Λ)
が、比較的少ない数のパラメータで表され、サンプルB
t,hとして、比較的多くのサンプルが与えられた場合、
適応用パラメータΓtの分散は非常に小さくなる。そこ
で、いま、適応用パラメータΓtの分散を0と仮定する
と、学習サンプルXに対するユニバーサルパラメータΛ
の対数尤度U3(X,Λ)は、次式で与えられる。
【0102】
【数13】
【0103】但し、Γ(ML)tは、次式にしたがって得ら
れる適応用パラメータΓtの最尤推定値である。
【0104】
【数14】
【0105】この場合、式(19)および(20)か
ら、最大化すべき目的関数U4(X,Λ,Γ)は、次式
のようになる。
【0106】
【数15】
【0107】上式より、ユニバーサルパラメータΛの最
尤推定値Λ(ML)は、U4(X,Λ,Γ)を、ΛおよびΓ
の両方に関して最大化することにより求めることができ
る。このU4(X,Λ,Γ)を最大化するΛおよびΓ
は、例えばシミュレーテッドアーニング法や、最急降下
法、EM(Expectation Maximization)アルゴリズムな
どにしたがって求めることができる。なお、シミュレー
テッドアーニング法によれば、演算量は多いが、比較的
良好な解を求めることができる。また、最急降下法やE
Mアルゴリズムによれば、解として、局所的な最大値が
得られることが多いが、演算量は少なくて済む。
【0108】次に、上述した学習方法において、ユニバ
ーサル識別関数Gk(・)として、例えば対角成分以外
の共分散成分を0とした、パラメトリックに表現可能な
正規分布(混合正規分布)関数を、適応用パラメータΓ
として、例えば加算ベクトルを、それぞれ用いた場合に
ついて説明する。この場合、ユニバーサル識別関数Gk
(O)は、次式のように表すことができる。
【0109】
【数16】
【0110】但し、Jは、特徴ベクトルOの成分(コン
ポーネント)の数(次元数)を表し、ojは、特徴ベク
トルOのj番目の成分(第j成分)を表す。また、μ
k,jまたはσk,j 2は、第j成分ojの平均値または分散を
それぞれ表す。
【0111】この場合、ユニバーサルパラメータλ
kは、λk=[μk,1,μk,2,・・・,μk,J,σk,1 2
σk,2 2,・・・,σk,J 2]と表すことができる。
【0112】そして、適応用関数F(・)の適応用パラ
メータ、即ち、この場合、加算ベクトルΓtを、Γt
[γt,k,1,γt,k,2,・・・,γt,k,J]と表すととも
に、学習サンプルXtに適応させたμk,jまたはσ
k,j 2を、それぞれμt,k,jまたはσt,k ,j 2と表すとする
と、適応パラメータψt,kは、次のように表すことがで
きる。
【0113】 ψt,k=F(λk,Γt) =[μt,k,1,μt,k,2,・・・,μt,k,J, σt,k,1 2,σt,k,2 2,・・・,σt,k,J 2] =[μk,1+γt,k,1,μk,2+γt,k,2,・・・,μk,J+γt,k,J, σk,1 2,σk,2 2,・・・,σk,J 2] ・・・(23)
【0114】従って、この場合、適応識別関数g
t,k(O)は、次式で与えられる。
【0115】
【数17】
【0116】ユニバーサル識別関数Gk(・)、即ち、
ユニバーサルパラメータΛは、式(16)乃至(18)
から、次式に示す対数尤度L(X,Λ)を、Λについて
最大化することで求めることができる。
【0117】
【数18】
【0118】但し、Γ(ML)t,hは、学習サンプルBt,h
tを用いて得られる加算ベクトルΓtの最尤推定値で、
次式で与えられる。
【0119】
【数19】
【0120】但し、この場合F(Λ,Γt,h)は、次式
で表される。 F(Λ,Γt,h) =[μk,1+γt,k,1,h,μk,2+γt,k,2,h,・・・, μk,J+γt,k,J,h,σk,1 2,σk,2 2,・・・,σk,J 2] ・・・(27)
【0121】なお、γt,k,j,hは、サンプルBt,hについ
てのγt,k,jを表す。
【0122】ところで、上述した学習方法の原理は、直
感的には、次にように考えることができる。即ち、例え
ば画像認識(文字認識)において、ユニバーサル識別関
数Gk(・)に相当する文字「A」の標準パターンの学
習を行う場合、認識時に、例えば、ほぼ同一形状の、傾
きのない文字「A」のみが認識対象として入力されるな
らば、そのような文字「A」を、学習サンプルとして、
従来と同様の学習を行えば、例えば図3(A)に示すよ
うな、入力された文字「A」の特徴を反映した標準パタ
ーンが得られる。
【0123】しかしながら、認識時において、上述のよ
うな形の揃った、傾きのない文字「A」が、常時入力さ
れることは皆無であり、通常は、例えば図3(B)に示
すように、傾きのない「A」の他、右や左に傾いた
「A」が入力される。このような場合、従来において
は、傾きのない「A」、並びに右および左に傾いた
「A」がそのままの状態で、標準パターンに、いわば包
含されるように学習が行われていたため、その結果得ら
れる文字「A」の標準パターンは、極端には、図3
(D)に示すように、文字「A」の特徴が損なわれたも
のとなっていた。
【0124】そこで、本願においては、文字「A」の標
準パターンを、図3(C)に示すように、学習サンプル
としての文字「A」の傾きに対応して回転し、即ち、ユ
ニバーサルパラメータΛに相当する標準パターンを、適
応用関数F(・)によって変換することにより学習サン
プルに適応させて学習を行うことで、文字「A」の特徴
が充分に反映された標準パターンを得ることができるよ
うになされている。
【0125】そして、認識時においては、文字「A」の
特徴が充分に反映された標準パターンを、認識対象とし
て入力された文字に適応させることで、認識性能を向上
させることができるようになされている。
【0126】ところで、学習時において行われる標準パ
ターンと学習サンプルとの適応は、図3(C)に示した
ように、文字「A」の標準パターンを、学習サンプルと
しての文字「A」の傾きに対応して回転することによ
り、標準パターンを学習サンプルに適応させることで行
うことができる他、例えば図4に示すように、学習サン
プルとしての文字「A」を、その傾きに対応して回転す
ることにより、学習サンプルを標準パターンに適応させ
ることでも行うことができる。これは、認識時について
も同様のことがいえる。
【0127】そこで、図5は、そのような適応処理を行
うことにより音声の認識を行う音声認識装置の一実施例
の構成を示している。なお、図中、図1における場合と
対応する部分については同一の符号を付してあり、以下
では、その説明は、適宜、省略する。また、この音声認
識装置においては、図1における場合と同様に、話者に
適応した音声の認識が行われるようになされている。
【0128】上述したように、スイッチ3は、話者Vt
に対する適応を行う必要がある場合、端子aを選択し、
これにより、音響分析部2から出力された特徴ベクトル
Oは、話者Vtに対する適応を行うための適応用のサン
プルAtとして、スイッチ3および端子aを介して、話
者適応器34に出力される。
【0129】話者適応器34では、適応用のサンプルA
tに基づいて、特徴ベクトルOを、後述する識別器35
が記憶しているユニバーサル識別関数に適応させるため
の適応用パラメータΓ(ML)tが算出され、適応ベクトル
算出器36に供給される。
【0130】話者適応器34から適応ベクトル算出器3
6に対し、適応用パラメータΓ(ML) tが出力されると、
スイッチ3は、端子bを選択し、これにより、音響分析
部2から出力された特徴ベクトルOは、スイッチ3およ
び端子bを介して、適応ベクトル算出器36に供給され
るようになる。
【0131】適応ベクトル算出器36は、話者適応器3
4から適応用パラメータΓ(ML)tを受信すると、音響分
析部2からスイッチ3および端子bを介して供給される
特徴ベクトルOを、適応用パラメータΓ(ML)tに基づい
て適応させる(変換する)。これにより、ユニバーサル
パラメータ記憶部11に記憶されているユニバーサル識
別関数に適応した特徴パラメータ(本実施例において、
適宜、適応特徴パラメータという)F(O,γ t,k
算出される。この適応特徴パラメータF(O,γ t,1
乃至F(O,γ t,k は、識別器35の識別関数演算器
13−1乃至13−Kにそれぞれ供給される。
【0132】識別器35では、入力された適応特徴ベク
トルが、ユニバーサル識別関数を用いて、所定の数Kの
クラスCkのうちのいずれかに分類されるこで、マイク
1に入力された音声の識別(認識)が行われる。即ち、
ユニバーサルパラメータ記憶部11からは、ユニバーサ
ルパラメータλkが読み出され、識別関数演算器13−
kに供給される。識別関数演算器13−kでは、ユニバ
ーサルパラメータλkで表現されるユニバーサル識別関
数の関数値が、適応特徴ベクトルF(O,γ t,k を入
力値として計算され、クラス決定回路14に出力され
る。クラス決定回路14では、図1における場合と同様
にして、音声認識結果が決定されて出力される。
【0133】次に、図5の音声認識装置の認識(識別)
原理について説明するが、この音声認識装置では、基本
的には、上述したように、ユニバーサル識別関数G
k(・)を適応させずに、入力された特徴ベクトルO
を、ユニバーサル識別関数Gk(・)に適応させて認識
を行うのであるから、適応用関数F(・)による変換の
対象が、ユニバーサル識別関数Gk(・)(ユニバーサ
ルパラメータΛ)ではなく、特徴ベクトルOとなること
と、識別に際して用いる識別関数が、適応識別関数g
t,k(・)ではなく、ユニバーサル識別関数Gk(・)と
なることが、図1における場合と異なるだけである。
【0134】従って、クラス決定規則は、式(1)にお
ける適応識別関数gt,k(・)を、ユニバーサル識別関
数Gk(・)に置換するとともに、特徴ベクトルOを、
それをユニバーサル識別関数Gk(・)に適応させた適
応特徴ベクトルF(O,γ t,k に置換したものとな
る。即ち、この場合、クラス決定規則は、次式で定義さ
れる。
【0135】
【数20】
【0136】また、適応用パラメータΓtの最尤推定値
Γ(ML)tは、式(6)におけるAtをF(At,Γt)に、
F(Λ,Γt)をΛに、それぞれ置換した式(29)、
および式(7)におけるAtをF(At,Γt)に、F
(Λ,Γt)をΛに、Ot,k,i (A)をF(Ot,k,i (A),γ
t,k)に、F(λk,γt,k)をλkに、それぞれ置換した
式(30)にしたがって得ることができる。
【0137】
【数21】
【数22】
【0138】よって、式(29)により適応用パラメー
タΓt(適応用パラメータの最尤推定値Γ(ML)t)を得た
後は、式(28)における左辺におけるF(O,
γt,k)、即ち、適応特徴ベクトルを計算し、式(2
8)で示される条件を満たすkを求めることで、入力さ
れた特徴ベクトルOの識別結果であるクラスCkを得る
ことができる。
【0139】図5の音声認識装置では、以上の原理に基
づき、クラスCkのサフィックスkが、音声認識結果と
して出力される。即ち、話者適応器34では、適応用の
サンプルAtを用い、式(29)にしたがって、適応用
パラメータΓt(最尤推定値Γ(ML) t)が求められる。適
応ベクトル算出器36では、特徴ベクトルOが、話者適
応器34で求められた適応用パラメータΓtを用い、式
F(O,Γt)にしたがって変換され、これにより、特
徴ベクトルOを、ユニバーサル識別関数Gk(・)に適
応に適応させた適応特徴ベクトルF(O,γt,1),F
(O,γt,2),・・・,F(O,γt,K)が算出され
る。そして、識別関数演算器13−1乃至13−Kで
は、ユニバーサルパラメータλ1,λ2,・・・,λK
表される適応識別関数Gk(・)の、適応特徴ベクトル
F(O,γt,1),F(O,γt,2),・・・,F(O,
γt,K)についての関数値G1(F(O,γt,1)),G2
(F(O,γt,2)),・・・,GK(F(O,
γt,K))が計算される。その後、クラス決定回路14
では、関数値G1(F(O,γt,1)),G2(F(O,
γt,2)),・・・,GK(F(O,γt,K))を用い
て、式(28)を満たすkが求められる。
【0140】次に、図5に示した音声認識装置において
用いられるユニバーサル識別関数Gk(・)、即ち、ユ
ニバーサルパラメータΛの算出方法(学習方法)につい
て説明するが、基本的には、上述したように、ユニバー
サル識別関数Gk(・)を適応させずに、学習サンプル
Xを、ユニバーサル識別関数Gk(・)に適応させて学
習をを行うのであるから、適応用関数F(・)による変
換の対象が、ユニバーサル識別関数Gk(・)(ユニバ
ーサルパラメータΛ)ではなく、学習サンプルXとなる
ことが、ユニバーサル識別関数Gk(・)を学習サンプ
ルXに適応させながら学習を行う場合と異なるだけであ
る(本実施例中では、適宜、学習サンプルXをユニバー
サル識別関数Gk(・)に適応させたもの、即ち、学習
サンプルXを適応用関数F(・)にしたがって変換した
ものを、適応学習サンプルという)。
【0141】従って、上述した式(14)乃至(18)
における適応用関数F(・)による変換の対象を、ユニ
バーサルパラメータΛではなく、学習サンプルX(ある
いは、適応用のサンプルBt,h)に替えた場合には、式
(31)乃至(35)がそれぞれ得られるから、ユニバ
ーサルパラメータΛの最尤推定値Λ(ML)は、式(35)
にしたがって、式(33)を最大化することで、求める
ことができる。
【0142】
【数23】
【数24】
【数25】
【数26】
【数27】
【0143】図6は、以上のような原理に基づいて、ユ
ニバーサル識別関数Gk(・)、即ち、ユニバーサルパ
ラメータΛを算出する識別関数算出装置の一実施例の構
成を示している。なお、図中、図2における場合と対応
する部分については同一の符号を付してあり、以下で
は、その説明は、適宜省略する。
【0144】適応用パラメータ算出器42には、適応用
関数パラメータ算出用学習サンプル抽出器21で抽出さ
れたサンプルBt,hと、ユニバーサルパラメータ算出器
43からユニバーサルパラメータΛとが供給される。適
応用パラメータ算出器42では、適応用関数パラメータ
算出用学習サンプル抽出器21からのサンプルB
t,hを、ユニバーサルパラメータ算出器43からのユニ
バーサルパラメータΛに適応させるための適応用パラメ
ータΓが算出される。即ち、適応用パラメータ算出器4
2は、式(34)にしたがって、適応用パラメータΓの
最尤推定値Γ(ML)t,hを算出する。この適応用パラメー
タΓ(ML)t,hは、ユニバーサルパラメータ算出器43に
出力される。
【0145】ユニバーサルパラメータ算出器43では、
式(35)にしたがって、ユニバーサルパラメータΛの
最尤推定値Λ(ML)が求められる。即ち、ユニバーサルパ
ラメータ算出器43では、適応用パラメータ算出器42
からの適応用パラメータΓ(M L)t,hに基づいて、学習サ
ンプルXが変換され、これにより、式(33)における
F(Xt,Γ(ML)t,h)、即ち、適応学習サンプルが求め
られる。そして、その適応学習サンプルF(X,Γ
(ML)t,h)に対する尤度(対数尤度)U2を最も高くする
ユニバーサルパラメータΛ(ML)が算出される。
【0146】さらに、ユニバーサルパラメータ算出器4
3は、ユニバーサルパラメータΛ(M L)を与える対数尤度
2が、例えば所定の閾値以上であるかどうかを判定す
る。そして、対数尤度U2が、所定の閾値以上でない場
合、その対数尤度U2が向上するようなユニバーサルパ
ラメータΛを、適応用パラメータ算出器42に供給す
る。適応用パラメータ算出器42は、新たなユニバーサ
ルパラメータを受信すると、再び、式(34)にしたが
って、適応用パラメータΓの最尤推定値Γ(ML)t,hを算
出し、ユニバーサルパラメータ算出器43に出力する。
【0147】以下、適応用パラメータ算出器42および
ユニバーサルパラメータ算出器43では、ユニバーサル
パラメータΛ(ML)を与える対数尤度U2が所定の閾値以
上となるまで、同様の処理が繰り返される。
【0148】そして、ユニバーサルパラメータΛ(ML)
与える対数尤度U2が所定の閾値以上となると、ユニバ
ーサルパラメータ算出器43は、そのユニバーサルパラ
メータΛ(ML)を、メモリ24に出力して記憶させる。
【0149】以上のように、変動状態Vtとユニバーサ
ル識別関数Gk(・)との関係に応じて、学習サンプル
tを、ユニバーサル識別関数Gk(・)に適応させなが
ら学習を行うようにしたので、適応処理を行ったときに
最高の性能を発揮するようなユニバーサル識別関数Gk
(・)を得ることができ、その結果、認識時において、
このユニバーサル識別関数Gk(・)を用いることで、
認識率を向上させることができる。
【0150】なお、式(31)におけるp(Γt|Λ)
が、比較的少ない数のパラメータで表され、サンプルB
t,hとして、比較的多くのサンプルが与えられた場合、
適応用パラメータΓtの分散は非常に小さくなる。そこ
で、適応用パラメータΓtの分散を0と仮定すると、上
述した式(19)乃至(21)にそれぞれ相当する式
(36)乃至(38)を得ることができる。
【0151】
【数28】
【数29】
【数30】
【0152】従って、この場合、ユニバーサルパラメー
タΛの最尤推定値Λ(ML)は、式(38)におけるU
4(X,Λ,Γ)を、ΛおよびΓの両方に関して最大化
することにより求めることができる。
【0153】以上、本発明を、音声の認識を行う場合に
適用した場合について説明したが、本発明は、音声の認
識を行う場合の他、例えば画像の認識を行う場合などの
あらゆるパターン認識を行う場合に適用可能である。
【0154】なお、本実施例においては、ユニバーサル
識別関数の具体例として、正規分布識別関数を用いた場
合を説明したが、ユニバーサル識別関数としては、正規
分布識別関数の他、例えばマハラノビス識別関数や、H
MM(Hidden Markov Model)による識別関数、多項式
識別関数、ニューラルネットワークにより表現される識
別関数などを用いることが可能である。
【0155】また、本実施例では、適応用パラメータと
して、加算ベクトルを算出し、この加算ベクトルを用い
て、ユニバーサル識別関数を適応させる変換を行う場合
について説明したが、適応用パラメータとしては、加算
ベクトルの他、例えば、線形変換を行うパラメータなど
を算出するようにし、これを用いて、ユニバーサル識別
関数を線形変換することで適応させるようにすることが
可能である。さらに、ユニバーサル識別関数を適応させ
る変換としては、例えば1次変換や、2次以上の項を含
んだ多項式変換、ニューラルネットワークによる変換な
どを用いることが可能である。また、学習サンプルを適
応させる変換についても、同様の変換手法を用いること
が可能である。
【0156】さらに、本実施例では、ユニバーサル識別
関数を学習サンプルに適応させる場合において、ユニバ
ーサルパラメータの最尤推定値を求めるようにしたが、
即ち、適応識別関数の、学習サンプルに対する尤度(対
数尤度)を評価基準とし、その尤度を最大化するユニバ
ーサルパラメータを求めるようにしたが、その他、例え
ば相互情報量や誤認識率などを評価基準とし、相互情報
量を最大化するユニバーサルパラメータや、誤認識率を
最小化するユニバーサルパラメータなどを求めるように
することが可能である。同様に、学習サンプルをユニバ
ーサル識別関数に適応させる場合においても、尤度以外
に、例えば相互情報量や誤認識率などを評価基準として
用いることが可能である。
【0157】また、本実施例では、ユニバーサル識別関
数を学習サンプルに適応させるために、適応用パラメー
タの最尤推定値を求めるようにしたが、即ち、適応識別
関数の、学習サンプルに対する尤度(対数尤度)を評価
基準とし、その尤度を最大化する適応用パラメータを求
めるようにしたが、この適応用パラメータについても、
尤度の他、相互情報量や誤認識率などを評価基準として
用いることが可能である。さらに、学習サンプルをユニ
バーサル識別関数に適応させる場合においても同様に、
評価基準として、尤度の他、例えば相互情報量や誤認識
率などを用いることができる。
【0158】また、本実施例では、1クラスに対し、1
つのユニバーサル識別関数を用意するようにしたが、こ
の他、例えば、1つのクラスに対しては、複数のユニバ
ーサル識別関数を割り当てることも可能である。
【0159】
【0160】
【発明の効果】 請求項に記載の識別装置および請求項
に記載の識別方法によれば、特徴ベクトルに対し、識
別関数を適応させ、その結果得られる適応識別関数を用
いて、特徴ベクトルが識別される。この場合において、
識別関数は、それを、学習サンプルに適応させながら学
習を行うことにより得られたものとされている。従っ
て、識別関数は、それを適応処理したときに高い性能を
発揮するものであるから、特徴ベクトルの識別率を向上
させることができる(誤認識率を低減することができ
る)。
【0161】請求項に記載の音声認識装置によれば、
特徴ベクトルに対し、識別関数を適応させ、その結果得
られる適応識別関数を用いて、特徴ベクトルが、所定の
数のクラスのうちのいずれかに分類される。この場合に
おいて、識別関数は、それを、学習サンプルに適応させ
ながら学習を行うことにより得られたものとされてい
る。従って、識別関数は、それを適応処理したときに高
い性能を発揮するものであるから、音声の認識率を向上
させることができる。
【0162】
【0163】請求項に記載の識別装置および請求項
に記載の識別方法によれば、識別関数に対し、特徴ベク
トルを適応させ、その結果得られる適応特徴ベクトル
が、識別関数を用いて識別される。この場合において、
識別関数は、それに、学習サンプルを適応させながら学
習を行うことにより得られたものとされている。従っ
て、識別関数は、特徴ベクトルを適応処理したときに高
い性能を発揮するものであるから、特徴ベクトルの識別
率を向上させることができる。
【0164】請求項に記載の音声認識装置によれば、
識別関数に対し、特徴ベクトルを適応させ、その結果得
られる適応特徴ベクトルが、識別関数を用いて、所定の
数のクラスのうちのいずれかに分類される。この場合に
おいて、識別関数は、それに、学習サンプルを適応させ
ながら学習を行うことにより得られたものとされてい
る。従って、識別関数は、特徴ベクトルを適応処理した
ときに高い性能を発揮するものであるから、音声の認識
率を向上させることができる。
【図面の簡単な説明】
【図1】本発明を適用した音声認識装置の第1実施例の
構成を示すブロック図である。
【図2】本発明を適用した識別関数算出装置の第1実施
例の構成を示すブロック図である。
【図3】本発明の原理を説明するための図である。
【図4】本発明の原理を説明するための図である。
【図5】本発明を適用した音声認識装置の第2実施例の
構成を示すブロック図である。
【図6】本発明を適用した識別関数算出装置の第2実施
例の構成を示すブロック図である。
【図7】従来の識別関数算出装置の一例の構成を示すブ
ロック図である。
【符号の説明】
1 マイク 2 音響分析部 3 スイッチ 4 話者適応器 5 識別器 11 ユニバーサルパラメータ記憶部 12 適応パラメータ算出器 13(13−1乃至13−K) 識別関数演算器 14 クラス決定回路 21 適応用関数パラメータ算出用学習サンプル抽出器 22 適応用パラメータ算出器 23 ユニバーサルパラメータ算出器 24 メモリ 34 話者適応器 35 識別器 36 適応ベクトル算出器 42 適応用パラメータ算出器 43 ユニバーサルパラメータ算出器
フロントページの続き (56)参考文献 特開 昭58−29226(JP,A) A. Biem, S. Katag iri,Feature extrac tion based on mini mum classification error / generaliz ed probabilistic d ecent method,Proce edings of the 1993 I EEE International Conference on Acou stics, Speech, and Signal Processing (I,米国,1993年 4月27日,Vo l.2,Pages 275−278) B. H. Juang, S. K atagiri,Discrimina tive learning for minimum error clas sification,IEEE Tr ansactions on Sign al Processing,米国, 1992年12月,Vol.40, No.12, Pages 3043−3054 (58)調査した分野(Int.Cl.7,DB名) G10L 15/10 - 15/28 G06K 9/68 JICSTファイル(JOIS) IEEE Xplore

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された特徴ベクトルを所定クラスに
    分類することにより識別を行う識別装置において変動状態に依存しないユニバーサル識別関数を構成する
    パラメータを記憶するユニバーサルパラメータ記億手段
    と、 前記特徴ベクトルに基づいて、前記ユニバーサル識別関
    数を所定の変動状態に適応させるための適応用パラメー
    タを算出する適応手段と、 前記ユニバーサル識別関数を構成するパラメータを読み
    出し、前記ユニバーサル識別関数を前記適応用パラメー
    タにより適応させて、適応識別関数を構成するパラメー
    タを算出する適応パラメータ算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
    ベクトルから適応識別関数の関数値を演算する識別関数
    演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
    決定手段と を備える ことを特徴とする識別装置。
  2. 【請求項2】 入力された特徴ベクトルを所定クラスに
    分類することにより識別を行う識別方法において、変動状態に依存しないユニバーサル識別関数を構成する
    パラメータを記憶するユニバーサルパラメータ記億ステ
    ップと、 前記特徴ベクトルに基づいて、前記ユニバーサル識別関
    数を所定の変動状態に適応させるための適応用パラメー
    タを算出する適応ステップと、 前記ユニバーサル識別関数を構成するパラメータを読み
    出し、前記ユニバーサル識別関数を前記適応用パラメー
    タにより適応させて、適応識別関数を構成するパラメー
    タを算出する適応パラメータ算出ステップと、 前記適応識別関数を構成するパラメータおよび前記特徴
    ベクトルから適応識別関数の関数値を演算する識別関数
    演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
    決定ステップと を含む ことを特徴とする識別方法。
  3. 【請求項3】 入力された音声特徴ベクトルを所定ク
    ラスに分類することにより音声を認識する音声認識装置
    において、 変動状態に依存しないユニバーサル識別関数を構成する
    パラメータを記憶するユニバーサルパラメータ記億手段
    と、 前記特徴ベクトルに基づいて、前記ユニバーサル識別関
    数を所定の話者に適応させるための適応用パラメータを
    算出する話者適応手段と、 前記ユニバーサル識別関数を構成するパラメータを読み
    出し、前記ユニバーサル識別関数を前記適応用パラメー
    タにより適応させて適応識別関数を構成するパラメータ
    を算出する適応パラメータ算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
    ベクトルから適応識別関数の関数値を演算する識別関数
    演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
    決定手段と を備える ことを特徴とする音声認識装置。
  4. 【請求項4】 入力された特徴ベクトルを所定クラスに
    分類することにより識別を行う識別装置において変動状態に依存しないユニバーサル識別関数を構成する
    パラメータを記憶するユニバーサルパラメータ記億手段
    と、 前記特徴ベクトルを前記ユニバーサル識別関数に適応さ
    せるための適応用パラメータを算出する適応手段と、 前記適応用パラメータにより前記特徴ベクトルを、前記
    ユニバーサル識別関数に適応させて適応特徴パラメータ
    を算出する適応ベクトル算出手段と、 前記ユニバーサル識別関数を構成するパラメータおよび
    前記適応特徴パラメータから適応識別関数の関数値を演
    算する識別関数演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
    決定手段と を備える ことを特徴とする識別装置。
  5. 【請求項5】 入力された特徴ベクトルを所定クラスに
    分類することにより識別を行う識別方法において、変動状態に依存しないユニバーサル識別関数を構成する
    パラメータを記憶するユニバーサルパラメータ記億ステ
    ップと、 前記特徴ベクトルを前記ユニバーサル識別関数に適応さ
    せるための適応用パラメータを算出する適応ステップ
    と、 前記適応用パラメータにより前記特徴ベクトルを、前記
    ユニバーサル識別関数に適応させて適応特徴パラメータ
    を算出する適応ベクトル算出ステップと、 前記ユニバーサル識別関数を構成するパラメータおよび
    前記適応特徴パラメータから適応識別関数の関数値を演
    算する識別関数演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
    決定ステップと を含む ことを特徴とする識別方法。
  6. 【請求項6】 入力された音声の特徴ベクトルを所定ク
    ラスに分類することにより音声を認識する音声認識方法
    において、 変動状態に依存しないユニバーサル識別関数を構成する
    パラメータを記憶するユニバーサルパラメータ記億ステ
    ップと、 所定の話者により入力された音声の前記特徴ベクトル
    を、前記ユニバーサル識別関数に適応させるための適応
    用パラメータを算出する話者適応ステップと、 前記適応用パラメータにより前記特徴ベクトルを、前記
    ユニバーサル識別関数に適応させて適応特徴パラメータ
    を算出する適応ベクトル算出ステップと、 前記ユニバーサル識別関数を構成するパラメータおよび
    前記適応特徴パラメータから適応識別関数の関数値を演
    算する識別関数演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
    決定ステップと を含む ことを特徴とする音声認識方法
  7. 【請求項7】 入力された特徴ベクトルを所定クラスに
    分類することにより識別を行う識別装置において、 変動状態に依存しない識別関数を構成するパラメータを
    記憶するパラメータ記億手段と、 前記特徴ベクトルに基づいて、前記識別関数を所定の変
    動状態に適応させるための適応用パラメータを算出する
    適応手段と、 前記識別関数を構成するパラメータを読み出し、前記識
    別関数を前記適応用パラメータにより適応させて、適応
    識別関数を構成するパラメータを算出する適応パラメー
    タ算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
    ベクトルから適応識別関数の関数値を演算する識別関数
    演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
    決定手段と を備えることを特徴とする識別装置。
  8. 【請求項8】 入力された特徴ベクトルを所定クラスに
    分類することにより識別を行う識別方法において、 変動状態に依存しない識別関数を構成するパラメータを
    記憶するパラメータ記億ステップと、 前記特徴ベクトルに基づいて、前記識別関数を所定の変
    動状態に適応させるための適応用パラメータを算出する
    適応ステップと、 前記識別関数を構成するパラメータを読み出し、前記識
    別関数を前記適応用パラメータにより適応させて、適応
    識別関数を構成するパラメータを算出する適応パラメー
    タ算出ステップと、 前記適応識別関数を構成するパラメータおよび前記特徴
    ベクトルから適応識別関数の関数値を演算する識別関数
    演算ステップと、 前記適応識別関数の関数値からクラスを決定するクラス
    決定ステップと を含むことを特徴とする識別方法。
  9. 【請求項9】 入力された音声の特徴ベクトルを所定ク
    ラスに分類することにより音声を認識する音声認識装置
    において、 変動状態に依存しない識別関数を構成するパラメータを
    記憶するパラメータ記億手段と、 前記特徴ベクトルに基づいて、前記識別関数を所定の話
    者に適応させるための適応用パラメータを算出する話者
    適応手段と、 前記識別関数を構成するパラメータを読み出し、前記識
    別関数を前記適応用パラメータにより適応させて適応識
    別関数を構成するパラメータを算出する適応パラメータ
    算出手段と、 前記適応識別関数を構成するパラメータおよび前記特徴
    ベクトルから適応識別関数の関数値を演算する識別関数
    演算手段と、 前記適応識別関数の関数値からクラスを決定するクラス
    決定手段と を備えることを特徴とする音声認識装置。
JP24789095A 1995-09-26 1995-09-26 識別装置および識別方法、並びに音声認識装置および音声認識方法 Expired - Lifetime JP3536471B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP24789095A JP3536471B2 (ja) 1995-09-26 1995-09-26 識別装置および識別方法、並びに音声認識装置および音声認識方法
US08/710,941 US5828998A (en) 1995-09-26 1996-09-24 Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system
US09/176,138 US6134525A (en) 1995-09-26 1998-10-21 Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24789095A JP3536471B2 (ja) 1995-09-26 1995-09-26 識別装置および識別方法、並びに音声認識装置および音声認識方法

Publications (2)

Publication Number Publication Date
JPH0990976A JPH0990976A (ja) 1997-04-04
JP3536471B2 true JP3536471B2 (ja) 2004-06-07

Family

ID=17170115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24789095A Expired - Lifetime JP3536471B2 (ja) 1995-09-26 1995-09-26 識別装置および識別方法、並びに音声認識装置および音声認識方法

Country Status (2)

Country Link
US (2) US5828998A (ja)
JP (1) JP3536471B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3584458B2 (ja) * 1997-10-31 2004-11-04 ソニー株式会社 パターン認識装置およびパターン認識方法
US7123166B1 (en) 2000-11-17 2006-10-17 Haynes Michael N Method for managing a parking lot
US6816085B1 (en) 2000-01-14 2004-11-09 Michael N. Haynes Method for managing a parking lot
JP4716605B2 (ja) * 2001-03-29 2011-07-06 株式会社リコー 音声認識装置及び音声認識方法
JP4194433B2 (ja) * 2003-07-07 2008-12-10 キヤノン株式会社 尤度算出装置および方法
GB2424970A (en) * 2005-04-05 2006-10-11 Giga Byte Tech Co Ltd Method and Apparatus for dynamic physical network layer monitoring
JP4298672B2 (ja) * 2005-04-11 2009-07-22 キヤノン株式会社 混合分布hmmの状態の出力確率計算方法および装置
CN106407976B (zh) * 2016-08-30 2019-11-05 百度在线网络技术(北京)有限公司 图像字符识别模型生成和竖列字符图像识别方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4741036A (en) * 1985-01-31 1988-04-26 International Business Machines Corporation Determination of phone weights for markov models in a speech recognition system
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
US5749072A (en) * 1994-06-03 1998-05-05 Motorola Inc. Communications device responsive to spoken commands and methods of using same
JP2690027B2 (ja) * 1994-10-05 1997-12-10 株式会社エイ・ティ・アール音声翻訳通信研究所 パターン認識方法及び装置
US5638486A (en) * 1994-10-26 1997-06-10 Motorola, Inc. Method and system for continuous speech recognition using voting techniques
US5737489A (en) * 1995-09-15 1998-04-07 Lucent Technologies Inc. Discriminative utterance verification for connected digits recognition

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A. Biem, S. Katagiri,Feature extraction based on minimum classification error / generalized probabilistic decent method,Proceedings of the 1993 IEEE International Conference on Acoustics, Speech, and Signal Processing (I,米国,1993年 4月27日,Vol.2,Pages 275−278)
B. H. Juang, S. Katagiri,Discriminative learning for minimum error classification,IEEE Transactions on Signal Processing,米国,1992年12月,Vol.40, No.12,Pages 3043−3054

Also Published As

Publication number Publication date
JPH0990976A (ja) 1997-04-04
US5828998A (en) 1998-10-27
US6134525A (en) 2000-10-17

Similar Documents

Publication Publication Date Title
EP0966736B1 (en) Method for discriminative training of speech recognition models
US5440662A (en) Keyword/non-keyword classification in isolated word speech recognition
US5675706A (en) Vocabulary independent discriminative utterance verification for non-keyword rejection in subword based speech recognition
JP4531166B2 (ja) 信頼性尺度の評価を用いる音声認識方法
US5812975A (en) State transition model design method and voice recognition method and apparatus using same
US4783804A (en) Hidden Markov model speech recognition arrangement
JP5418223B2 (ja) 音声分類装置、音声分類方法、および音声分類用プログラム
US6076053A (en) Methods and apparatus for discriminative training and adaptation of pronunciation networks
EP0921519A2 (en) Technique for adaptation of hidden Markov Models for speech recognition
EP1465154B1 (en) Method of speech recognition using variational inference with switching state space models
US5594834A (en) Method and system for recognizing a boundary between sounds in continuous speech
WO1998040876A9 (en) Speech recognition system employing discriminatively trained models
AU684214B2 (en) System for recognizing spoken sounds from continuous speech and method of using same
EP0788649A2 (en) Method and system for pattern recognition based on tree organised probability densities
Katagiri et al. A new hybrid algorithm for speech recognition based on HMM segmentation and learning vector quantization
McDermott et al. Prototype-based minimum classification error/generalized probabilistic descent training for various speech units
JP3536471B2 (ja) 識別装置および識別方法、並びに音声認識装置および音声認識方法
KR100574769B1 (ko) 최우법을 포함한 고유음성에 기초한 화자 및 환경 적응 방법
JP2852298B2 (ja) 標準パターン適応化方式
KR101229108B1 (ko) 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법
JP2996925B2 (ja) 音素境界検出装置及び音声認識装置
Yu et al. Speaker recognition models.
JP3448371B2 (ja) Hmmの学習装置
JP3166708B2 (ja) 音声認識装置及び方法
Rigoll Information theory-based supervised learning methods for self-organizing maps in combination with hidden Markov modeling

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080326

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110326

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 9