JP3316352B2 - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JP3316352B2
JP3316352B2 JP24972095A JP24972095A JP3316352B2 JP 3316352 B2 JP3316352 B2 JP 3316352B2 JP 24972095 A JP24972095 A JP 24972095A JP 24972095 A JP24972095 A JP 24972095A JP 3316352 B2 JP3316352 B2 JP 3316352B2
Authority
JP
Japan
Prior art keywords
state
probability
transition
hmm
appearance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24972095A
Other languages
English (en)
Other versions
JPH0990980A (ja
Inventor
計美 大倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP24972095A priority Critical patent/JP3316352B2/ja
Publication of JPH0990980A publication Critical patent/JPH0990980A/ja
Application granted granted Critical
Publication of JP3316352B2 publication Critical patent/JP3316352B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識の分野で
用いられている統計的認識手法であるHidden M
arkov Model(以下、「HMM」という。)
を用いた音声認識方法に関する。
【0002】
【従来の技術】近年、HMMを用いた音声認識方法の開
発が盛んに行われている。このHMMは大量の音声デー
タから得られる音声の統計的特徴をモデル化したもので
あり、このHMMは、(1)発声の揺らぎを分布という
形で統計的に処理できる、(2)話者による発声時間長
の違いを吸収できる、といった利点を備えている。
【0003】以下に、従来のHMMを用いた音声認識方
法を実現する音声認識装置の例を図5乃至図7に基づい
て説明する。
【0004】図5は、従来のHMMを用いた音声認識方
法を実現する音声認識装置の概略構成図である。
【0005】以下に音素HMMを用いて単語の音声認識
を行なう場合を例に挙げ、処理の概要を説明する。
【0006】一般的に、単語はそれより小さい単位、例
えば音素が繋ぎ合わさって成立しているように、音素単
位でHMMを作成しておくと、その音素HMMの連結に
より任意の単語に対する単語認識を行なうことができ
る。
【0007】例えば、辞書に登録されている認識対象が
「うちけす(U/CH/I/K/E/S/U)」、「う
ちあわせ(U/CH/I/A/W/A/S/E)」及び
「うる(U/R/U)」の3単語である場合、作成する
必要がある音素HMMは辞書中に出現する「U/CH/
I/K/E/S/A/W/R」の9種類のみでよい。
【0008】したがって、音声認識装置は、該音素HM
Mを連結することにより辞書内に存在する単語に対応す
る単語HMMを作成し、入力音声(単語)と近いものを
確率的ゆう度(確からしさ)として得ることができるよ
うな構成をとっている。
【0009】このように、予め話者の音声情報を学習し
て音素HMMを作成しておき、該音素HMMをHMM記
憶部1に記憶しておき、HMM連結部4−2において、
辞書データ記憶部5に記憶されている認識対象に対応す
る様に音素HMMを連結し、生起確率P計算部4−1に
おいて生起確率を計算することにより、入力音声が単語
の場合であっても認識することが可能になる。
【0010】また、HMM記憶部1に記憶される音素H
MMは図6に示すように、複数の状態と、状態から状態
への遷移方向を規定するアーク(図中の矢印)とから構
成される。
【0011】また、図6のaij,bij (i = 1, 2, 3, 4、
j = 1, 2, 3, 4)は、状態iから状態jに遷移するアーク
に関する遷移確率および出現確率を表している。本HM
Mは、4個の状態と3つのループしたアークをもつこと
から4状態3ループのHMMと呼ばれるものである。
【0012】実際の認識は、生起確率P計算部4−1に
おいて、数1の漸化式により前向き確率α(j,t)を
計算することにより、最終的な認識ゆう度Pが数2のよ
うに求められる。
【0013】
【数1】
【0014】ここで、Tは観測ベクトル(vt)の時間
長である。
【0015】
【数2】
【0016】然し乍ら、図6に示した4状態3ループの
HMMは最小3フレームの入力パラメータとマッチング
してしまう場合がある。例えば、分析周期が5msecの場
合、5msecx3フレームの15msecの区間でマッチング
が行なわれ、非常に短い区間でHMMと入力との不適当
なマッチングを行ってしまい、これが挿入誤りとなり認
識率低下の原因となっていた。
【0017】上記の挿入誤りの問題点を回避するため、
状態数の多いHMMを用いて音声認識を行う方法がある
が、本方法では状態数の増加に伴い、遷移確率及び出現
確率といった学習時に推定すべきHMMのパラメータ数
が増加し、かかる多くのパラメータを十分な精度で推定
するために大量の音声データが必要になるという新たな
問題を生じている。
【0018】一方、不適当なマッチングを避ける手段と
して、状態数を増やすのではなく、音素の標準的な長さ
の情報に基づき、HMMと入力音声とのマッチング範囲
を制御する継続時間長制御法が特公平5−81919号
公報において開示されている。
【0019】同公報に開示されている方法を用いて音声
認識を行うための概略構成図を図7に示す。同公報にお
いて開示されている方法は、継続時間長制御パラメータ
記憶部6−1に記憶された負荷係数p(m)τおよびP
(si)τを、生起確率P計算部6−2における生起確率P
の計算処理時にペナルティーとして与えることにより実
現されるものである。
【0020】HMM連結部6−3は音素や音韻を単位と
したHMMにより単語や文章を認識する場合に必要にな
るものであり、HMM連結部4−2と同一機能を有する
ものである。
【0021】以下に、生起確率P計算部6−2で行われ
る処理について説明する。
【0022】HMM全体の継続時間長制御法は、音韻に
よる負荷係数p(m)τを周知のトレリスアルゴリズム
によって求める生起確率Pにかけることにより音韻長の
情報を確率値に反映させるものである。またHMMの状
態ごとの継続時間長制御法は、各状態ごとの継続時間長
に対する負荷係数P(si)τを使用し、数3に従い前向き
確率を計算することにより音韻長の情報を確率値に反映
させるものである。
【0023】また、最終的な認識ゆう度Pは継続時間長
制御を用いない場合と同様に数2により求められる。
【0024】
【数3】
【0025】ここで、Wsは、重み付け定数である。
【0026】
【発明が解決しようとする課題】然し乍ら、挿入誤りの
問題点を回避するために状態数の多いHMMを用いて音
声認識を行う方法では状態数の増加に伴い、学習時に推
定すべきHMMのパラメータ数が増加し、かかる多くの
パラメータを十分な精度で推定するために大量の音声デ
ータが必要になるという問題点があった。
【0027】また、継続時間長制御を行なう場合は、数
1に示した周知の前向き確率α(j,t)の演算が、継
続時間によるペナルティーを与える処理により数3に示
した演算となり、演算量が極端に増大してしまうといっ
た問題点があった。
【0028】
【課題を解決するための手段】本発明は上述の問題点に
鑑み為されたものであり、複数の状態をもち、該状態が
遷移を規定する状態遷移確率により接続されるHMMに
おいて、上記状態遷移確率により接続された2状態間に
新たな状態を内挿する状態内挿部をもち、該状態内挿部
において状態を内挿したHMMを用いて音声認識を行う
ものであって、上記状態内挿部を状態Nと状態Mの間に状
態Xを内挿する場合は、状態Nから状態Xへの遷移に関す
る遷移確率ANXと出現確率BNXを、状態Nから状態Mの遷移
確率aNMと出現確率bNMとする第一ステップと、状態Xか
ら状態Mへの遷移に関する遷移確率AXMと出現確率B
XMを、状態Mから状態Mの遷移確率aMMと出現確率bMMとす
る第二ステップと、からなることを特徴とする。
【0029】本発明は、複数の状態をもち、該状態が遷
移を規定する状態遷移確率により接続されるHMMにお
いて、上記状態遷移確率により接続された2状態間に新
たな状態を内挿する状態内挿部をもち、該状態内挿部に
おいて状態を内挿したHMMを用いて音声認識を行うも
のであって、上記状態内挿部で状態Nと状態Mの間に状態
Xを内挿する場合は、内挿した状態Xの自己ループの遷移
確率Axxと出現確率Bxxを、状態Nの自己ループの遷移確
率aNNと出現確率bNNとする第一ステップと、状態Nから
状態Xへの遷移に関する遷移確率ANXと出現確率BNXを、
状態Nの自己ループの遷移確率aNNと出現確率bNNとする
第二ステップと、状態Xから状態Mへの遷移に関するアー
クの遷移確率AXMと出現確率BXMを、状態Nから状態Mへの
遷移確率aNMと出現確率bNMとする第三ステップと、から
なることを特徴とする。
【0030】
【0031】
【0032】
【0033】本発明は上記出現確率Bxxは出現確率bNN
び出現確率bNMに基づいて求められる値であることを特
徴とする。
【0034】本発明は上記出現確率bNMと上記出現確率b
NNが複数の分布から構成されるものである場合は、出現
確率bNNに含まれる各分布と近い出現確率bNMに含まれる
分布から出現確率Bxxが求められることを特徴とする。
【0035】本発明は上記出現確率Bxxは出現確率bNM
び出現確率bMMからに基づいて求められる値であること
を特徴とする。
【0036】本発明は上記出現確率bNMと上記出現確率b
MMが複数の分布から構成されるものである場合は、出現
確率bNMに含まれる各分布と近い出現確率bMMに含まれる
分布から出現確率Bxxが求められることを特徴とする。
【0037】
【発明の実施の形態】本発明の実施の形態の一例を図1
乃至図4に基づいて説明する。
【0038】図1は、本発明に係わる音声認識装置の概
略構成図である。
【0039】HMM記憶部1には、予め学習しておいた
音素HMMが記憶されている。
【0040】状態内挿部2は、HMM記憶部1に記憶さ
れている音素HMMの状態を内挿することにより状態内
挿HMMを作成する。
【0041】状態内挿HMM記憶部3では該状態内挿H
MMを記憶する。
【0042】HMM連結部4−2は、状態内挿HMM記
憶部3に記憶された状態内挿HMMを辞書データ記憶部
5に記憶されている認識対象語彙に対応する様に連結す
る。
【0043】生起確率P計算部4−1では、連結したH
MMを用いて、数1の漸化式により前向き確率α(j,
t)を計算し、最終的な認識ゆう度Pを数2に従い計算
する。
【0044】以下に、本発明の代表的な構成要件である
状態内挿部2の機能について説明する。
【0045】本発明の第一の実施の形態の例を以下に示
す。
【0046】HMM記憶部1に記憶されているHMMの
構造が図2(a)である場合について説明する。
【0047】図中のAij,Bij (i = 1, 2, 3, 4、 j = 1,
2, 3, 4)は、状態iから状態jに遷移するアークに関す
る遷移確率および出現確率の符号を表す。
【0048】具体的には、A11=a11、A12=a12、A22=
a22、A23=a23、A33=a33、A34=a34、B11=b11、B12=b12
B22=b22、B23=b23、B33=b33、B34=b34、である。
【0049】ここで、aij、bij、(i = 1, 2, 3, 4、 j
= 1, 2, 3, 4)は、Aij,Bijの実際の値を表す。
【0050】本発明は、挿入誤りによる音声認識率の低
下を防ぐためにHMMの状態を内挿することにより、挿
入誤りを減少させるものである。
【0051】第一の実施の形態では、図2(a)の4状態
3ループを5状態4ループにする場合を示す。一般的な
5状態4ループのHMMは図2(b)に示されるものであ
る。
【0052】第一の実施の形態では、図2(a)の状態2
と状態3の間に新しく状態Xを内挿し図2(b)のHMMを
作成する一例を示す。
【0053】具体的には、第一の実施の形態の場合、状
態2と状態3の間に状態を内挿するので、内挿した状態
Xの自己ループの遷移確率Axxと出現確率Bxxを、内挿し
た状態の1つ前の状態である状態2の自己ループの遷移
確率a22と出現確率b22とする。更に、状態2から状態X
への遷移に関する遷移確率A2xと出現確率B2xを状態2の
自己ループの遷移確率a22と出現確率b22とする。また、
状態Xから状態3への遷移に関するアークの遷移確率Ax3
と出現確率Bx3を、状態2から状態3への遷移確率a23
出現確率b23とする。HMM全体の遷移確率と出現確率
は、以下の様になる。
【0054】A11=a11、A12=a12、A22=a22、A2x=a22、A
xx=a22、Ax3=a23、A33=a33、A34=a34、B11=a11、B12=b
12、B22=b22、B2x=b22、Bxx=b22、Bx3=b23、B33=b33、B
34=b34
【0055】ここで、B2xとBxxはB22と同じb22という値
であるので、計算結果は共通に使用できる。
【0056】この様に状態を内挿したHMMを図2(c)
に示す。
【0057】以上の手順により、状態の内挿を行なう。
【0058】第一の実施の形態により状態の内挿を行っ
たHMMに対する最終的な認識ゆう度Pは、数1の漸化
式により前向き確率α(j,t)を計算することによ
り、数2により得られる。
【0059】第一の実施の形態では、1つの状態の内挿
について述べたが、複数の状態の内挿を行なう場合も、
同様の手順で実現できる。
【0060】また、出現確率Bxxは出現確率b22と出現確
率b23から計算される値を用いてもよい。
【0061】例えば、出現確率がガウス分布のような確
率密度関数b=N{μ,Σ}で与えられるとき、出現確
率b22=N{μ22,Σ22}と出現確率b23=N{μ23,Σ
23}から、出現確率Bxx=N{μXX,Σxx}を求める。
例えば、Bxx=N{μXX,Σxx}は、数4に従い計算す
る。
【0062】
【数4】
【0063】更に、出現確率b22と出現確率b23が複数の
分布から構成されるものである場合は、出現確率b22
含まれる各分布と近い出現確率b23に含まれる分布から
出現確率Bxxを計算してもよい。
【0064】例えば、出現確率が混合ガウス分布のよう
な出現確率b22={α1,α2,α3}、出現確率b23
{β1,β2,β3}で与えられる場合の一例を示す。
【0065】ここで、α1,α2,α3はそれぞれN{μ1
22,Σ1 22},N{μ2 22,Σ2 22},N{μ3 22,Σ3 22
で表されるものである。同様にβ1,β2,β3はそれぞ
れN{μ1 23,Σ1 23},N{μ2 23,Σ2 23},N
{μ3 23,Σ3 23}で表されるものである。
【0066】まず、α1と最も類似した分布を出現確率b
23中から選ぶ。β2が選ばれたとすればα1とβ2から新
しい分布γ1を計算する。次に、α2と最も類似した分布
を出現確率b23中から選び、α2と該被選択分布とから新
しい分布γ2を計算する。次に、α3と最も類似した分布
を出現確率b23中から選び、α3と該被選択分布とから新
しい分布γ3を計算する。計算したかかる新しい分布に
より出現確率BxxをBx x={γ1,γ2,γ3}とする。
【0067】一方、出現確率Bxxは出現確率b23と出現確
率b33から計算される値を用いてもよい。
【0068】例えば、出現確率がガウス分布のような確
率密度関数b=N{μ,Σ}で与えられるとき、出現確
率b23=N{μ23,Σ23}と出現確率b33=N{μ33,Σ
33}から、上記と同様の手順で出現確率Bxx=N
{μXX,Σxx}を求める。
【0069】また、出現確率b23と出現確率b33が複数の
分布から構成されるものである場合は、出現確率b23
含まれる各分布と近い出現確率b33に含まれる分布から
上記と同様の手順で出現確率Bxxを計算してもよい。
【0070】本発明の第二の実施の形態の例を以下に示
す。
【0071】HMM記憶部1に記憶されているHMMの
構造が図3(a)である場合について説明する。
【0072】第二の実施の形態では、図3(a)の4状態
3ループを5状態3ループ場合を示す。かかる5状態3
ループのHMMは図3(b)に示されるものである。
【0073】第二の実施の形態では、図3(a)の状態1
と状態2の間に新しく状態Xを内挿し図3(b)のHMMを
作成する一例を示す。ここで述べる内挿は、状態2の自
己ループのアークに関する遷移確率と、出現確率の展開
である。
【0074】具体的には、第二の実施の形態の場合、状
態1と状態2の間に状態Xを内挿するので、状態1から
状態Xへの遷移に関する遷移確率A1xと出現確率B1xを、
状態1から状態2の遷移確率a12と出現確率b12とする。
【0075】更に、状態Xから状態2への遷移に関する
遷移確率Ax2と出現確率Bx2を、状態2から状態2の遷移
確率a22と出現確率b22とする。
【0076】つまり、HMM全体の遷移確率と出現確率
は、以下の様になる。
【0077】A11=a11、A1x=a12、Ax2=a22、A22=a22、A
23=a23、A33=a33、A34=a34、B11=b11、B1x=b12、Bx2=b
22、B22=b22、B23=b23、B33=b33、B34=b34
【0078】以上の手順により、状態の内挿を行なう。
【0079】第二の実施の形態により状態の内挿を行っ
たHMMに対する最終的な認識ゆう度Pは、数1の漸化
式により前向き確率α(j,t)を計算することによ
り、数2により得られる。
【0080】第二の実施の形態では、1つの状態の内挿
について述べたが、複数の状態の内挿を行なう場合も、
同様の手順で実現できる。
【0081】本発明の第三の実施の形態の例を以下に示
す。
【0082】HMM記憶部1に記憶されているHMMの
構造が図4(a)である場合について説明する。
【0083】第三の実施の形態では、図4(a)の4状態
3ループを5状態3ループにする場合を示す。かかる5
状態3ループのHMMは図4(b)に示されるものであ
る。
【0084】第三の実施の形態では、図4(a)の状態2
と状態3の間に新しく状態Xを内挿し図4(b)のHMMを
作成する一例を示す。ここで述べる内挿は、状態2の自
己ループのアークに関する遷移確率と、出現確率の展開
である。
【0085】具体的には、第三の実施の形態の場合、状
態2と状態3の間に状態を内挿するので、状態2から状
態Xへの遷移に関する遷移確率A2xと出現確率B2xを、内
挿した状態の1つ前の状態である状態2の自己ループの
遷移確率a22と出現確率b22とする。
【0086】また、状態Xから状態3への遷移に関する
アークの遷移確率Ax3と出現確率Bx3を、状態2から状態
3への遷移確率a23と出現確率b23とする。
【0087】HMM全体の遷移確率と出現確率は、以下
の様になる。
【0088】A11=a11、A12=a12、A22=a22、A2x=a22、A
x3=a23、A33=a33、A34=a34、B11=b11、B12=b12、B22=b
22、B2x=b22、Bx3=b23、B33=b33、B34=b34
【0089】この様に状態を内挿したHMMを図4(c)
に示す。
【0090】以上の手順により、状態の内挿を行なう。
【0091】第三の実施の形態により状態の内挿を行っ
たHMMに対する最終的な認識ゆう度Pは、数1の漸化
式により前向き確率α(j,t)を計算することによ
り、数2により得られる。
【0092】第三の実施の形態では、1つの状態の内挿
について述べたが、複数の状態の内挿を行なう場合も同
様の手順で実現できる。
【0093】以下に本発明の効果を実験により示す。
【0094】初期HMMには、日本音響学会連続音声デ
ータベースの男性話者30名の音声資料の一部から作成し
た不特定話者HMMを用いた。
【0095】評価は、電子協日本語共通音声データに含
まれる男性話者5名の地名100単語を用いた。分析条件
は、サンプリング周波数12kHz、ハミング窓長21.3ms、1
6次LPC分析、フレーム周期5msである。特徴量には、16
次LPCケプストラム、16次Δケプストラム、Δ対数パワ
ーの33次元ベクトルを用いた。HMM記憶部1に記憶さ
れたHMMは4状態3ループ、対角共分散行列の混合ガウ
ス分布型であり、各状態の混合数は4、各状態からのア
ークはタイドアークとした。
【0096】HMM数は39種とした。
【0097】状態内挿部2における状態内挿の方法は、
上記の第一の実施の形態を用いて、状態1と状態2の間
に1つ、状態2と状態3の間に2つ、状態3と状態4の
間に1つとした。認識結果を表1に示す。状態の内挿を
行なうことにより認識率が向上しており、本発明の有効
性が分かる。
【0098】
【表1】
【0099】
【発明の効果】以上の説明から明らかなように、本発明
によれば、HMMの学習のための音声データ量の増加を
招かずに、任意の数に状態数を増加できるという効果を
奏する。
【0100】また、従来例に示したような特別な音素や
音韻の継続時間長制御を行なう必要がなく、周知のトレ
リス演算やビタビ演算のみで音声認識時のHMMの挿入
誤りを減らすことができるという効果を奏する。
【0101】周知のトレリス演算やビタビ演算のみで認
識できるということは、従来例のような継続時間長制御
よりも演算量が少なくてすむという効果を奏する。
【0102】更に、HMMを作成した後に、再学習無し
に任意の状態数のHMMを実現できるため、最適なHM
Mの状態数を簡単に設定できるという効果を奏する。
【0103】状態の内挿とともに出現確率の補間を行う
ため、モデルを高精度化できるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の概略構成図である。
【図2】本発明の第一の実施の形態の説明図である。
【図3】本発明の第二の実施の形態の説明図である。
【図4】本発明の第三の実施の形態の説明図である。
【図5】従来の音声認識装置の概略構成図である。
【図6】HMMの概略図である。
【図7】従来の継続時間長制御を有する音声認識装置の
概略構成図である。
【符号の説明】
1・・・・・・・・モデル記憶部 2・・・・・・・・状態内挿部 3・・・・・・・・状態内挿HMM記憶部 4・・・・・・・・認識部 4−1・・・・生起確率P計算部 4−2・・・・HMM連結部 5・・・・・・・・辞書データ記憶部 6・・・・・・・・認識部 6−1・・・・継続時間長制御パラメータ記憶部 6−2・・・・生起確率P計算部 6−3・・・・HMM連結部

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の状態をもち、該状態が遷移を規定
    する状態遷移確率により接続されるHMMにおいて、上
    記状態遷移確率により接続された2状態間に新たな状態
    を内挿する状態内挿部をもち、該状態内挿部において状
    態を内挿したHMMを用いて音声認識を行う音声認識方
    法において、 上記状態内挿部を状態Nと状態Mの間に状態Xを内挿する
    場合は、状態Nから状態Xへの遷移に関する遷移確率ANX
    と出現確率BNXを、状態Nから状態Mの遷移確率aNMと出現
    確率bNMとする第一ステップと、状態Xから状態Mへの遷
    移に関する遷移確率AXMと出現確率BXMを、状態Mから状
    態Mの遷移確率aMMと出現確率bMMとする第二ステップ
    と、からなることを特徴とする音声認識方法。
  2. 【請求項2】複数の状態をもち、該状態が遷移を規定す
    る状態遷移確率により接続されるHMMにおいて、上記
    状態遷移確率により接続された2状態間に新たな状態を
    内挿する状態内挿部をもち、該状態内挿部において状態
    を内挿したHMMを用いて音声認識を行う音声認識方法
    において、 上記状態内挿部で状態Nと状態Mの間に状態Xを内挿する
    場合は、内挿した状態Xの自己ループの遷移確率AXXと出
    現確率BXXを、状態Nの自己ループの遷移確率aNNと出現
    確率bNNとする第一ステップと、状態Nから状態Xへの遷
    移に関する遷移確率ANXと出現確率BNXを、状態Nの自己
    ループの遷移確率aNNと出現確率bNNとする第二ステップ
    と、状態Xから状態Mへの遷移に関するアークの遷移確率
    AXMと出現確率BXMを、状態Nから状態Mへの遷移確率aNM
    と出現確率bNMとする第三ステップと、からなることを
    特徴とする音声認識方法。
  3. 【請求項3】 請求項2において、上記出現確率BXXは出
    現確率bNN及び出現確率bNMに基づいて求められる値であ
    ることを特徴とする音声認識方法。
  4. 【請求項4】 請求項2において、上記出現確率BXXは出
    現確率bNM及び出現確率bMMに基づいて求められる値であ
    ることを特徴とする音声認識方法。
JP24972095A 1995-09-27 1995-09-27 音声認識方法 Expired - Fee Related JP3316352B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24972095A JP3316352B2 (ja) 1995-09-27 1995-09-27 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24972095A JP3316352B2 (ja) 1995-09-27 1995-09-27 音声認識方法

Publications (2)

Publication Number Publication Date
JPH0990980A JPH0990980A (ja) 1997-04-04
JP3316352B2 true JP3316352B2 (ja) 2002-08-19

Family

ID=17197202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24972095A Expired - Fee Related JP3316352B2 (ja) 1995-09-27 1995-09-27 音声認識方法

Country Status (1)

Country Link
JP (1) JP3316352B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018047966A1 (ja) * 2016-09-12 2018-03-15 日本電気株式会社 波形分離装置、方法、プログラム

Also Published As

Publication number Publication date
JPH0990980A (ja) 1997-04-04

Similar Documents

Publication Publication Date Title
US8301445B2 (en) Speech recognition based on a multilingual acoustic model
JP2733955B2 (ja) 適応型音声認識装置
US5787396A (en) Speech recognition method
Lee et al. Improved acoustic modeling for large vocabulary continuous speech recognition
US6490555B1 (en) Discriminatively trained mixture models in continuous speech recognition
EP1465154B1 (en) Method of speech recognition using variational inference with switching state space models
EP0903730B1 (en) Search and rescoring method for a speech recognition system
US7133827B1 (en) Training speech recognition word models from word samples synthesized by Monte Carlo techniques
Boite et al. A new approach towards keyword spotting.
JP3535292B2 (ja) 音声認識システム
Steinbiss et al. The Philips research system for continuous-speech recognition
JP2002358097A (ja) 音声認識装置
Roucos et al. A stochastic segment model for phoneme-based continuous speech recognition
JPH11184491A (ja) 音声認識装置
Rabiner et al. Hidden Markov models for speech recognition—strengths and limitations
JP3316352B2 (ja) 音声認識方法
JP2886118B2 (ja) 隠れマルコフモデルの学習装置及び音声認識装置
JP2001255887A (ja) 音声認識装置、音声認識方法及び音声認識方法を記録した媒体
JP3532248B2 (ja) 学習音声パタンモデル使用音声認識装置
JP3368989B2 (ja) 音声認識方法
JP3406672B2 (ja) 話者適応化装置
JPH10143190A (ja) 音声認識装置
JPH05224692A (ja) 連続音声認識方式
JP2002055691A (ja) 音声認識方法
JP3285048B2 (ja) 不特定話者用音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees