JPH0844390A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0844390A
JPH0844390A JP6173990A JP17399094A JPH0844390A JP H0844390 A JPH0844390 A JP H0844390A JP 6173990 A JP6173990 A JP 6173990A JP 17399094 A JP17399094 A JP 17399094A JP H0844390 A JPH0844390 A JP H0844390A
Authority
JP
Japan
Prior art keywords
noise
spectrum
frequency
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6173990A
Other languages
English (en)
Inventor
Kenichi Taniguchi
賢一 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6173990A priority Critical patent/JPH0844390A/ja
Publication of JPH0844390A publication Critical patent/JPH0844390A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 入力雑音に追従するように周波数領域で環境
雑音を推定し、雑音の重畳した音声を入力として認識す
ることができる音声認識装置を提供することを目的とす
る。 【構成】 環境雑音を常時入力・更新し雑音の重畳した
音声のスペクトルから雑音のスペクトルを減算した特徴
量を求める雑音除去・特徴抽出部32と、標準パタンの
特徴量を記憶しておく標準パタン辞書36と、入力の特
徴量と標準パタンの特徴量を比較する類似度比較部34
と、最終的な認識結果を判定する判定処理部35とを構
成し、雑音の周波数特性の時間的変化に追従するように
推定雑音を更新することにより雑音の重畳した音声での
認識性能の向上が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、雑音除去処理部を備え
た音声認識装置に関するものである。
【0002】
【従来の技術】近年、より良いマンマシンインタフェー
スが要求されるようになってきたこと、DSP(デジタ
ルシグナルプロセッサ)などのハードウェア能力の向上
により安価なものが作れるようになったことにより、各
種の機器のマンマシンインタフェースとして音声認識装
置が採用されるようになってきた。以下、図面を参照し
ながら従来の音声認識装置について説明を行う。
【0003】図6は従来の音声認識装置の構成を示すブ
ロック図であり、図中、1はマイク、2は雑音除去処理
部、3は特徴抽出部、4は類似度比較部、5は判定処理
部、6は標準パタン辞書である。
【0004】以上のように構成された従来の音声認識装
置について、以下その動作を説明する。マイク1から入
力された音声は、雑音除去処理部2で周囲雑音が除かれ
た信号となり、特徴抽出部3で10ms程度の周期で線
形予測分析あるいはフーリエ分析などの方法で周波数分
析され、かつ、音声の始端、終端の検知を行い、音声区
間の周波数分析結果が得られる。類似度計算部4では特
徴抽出部3からの音声区間の周波数分析結果と標準パタ
ン辞書6に登録されている複数の単語の音声区間の周波
数分析結果を比較し、最も類似した単語の周波数分析結
果の類似度を得る。判定処理部5では類似度計算部4か
らの類似度がある閾値よりも似ているか判定し、似てい
ればその単語を認識結果として出力する。
【0005】さらに、従来の音声認識装置で行われてい
る雑音除去処理部2について動作を説明する。従来の雑
音除去処理部の手法として主なものが2種類ある。一つ
は1979年4月に発表されたIEEE Transa
cion on Acoustics,speech,
and signal processing vo
l.ASSP−27 No.2pp.113−120
「Supressionof Acoustic No
ise Speech Using Spectral
Subtraction」で示されるスペクトルサブ
トラクション法であり、もう一つは1988年5月に発
表された電子情報通信学会論文誌A vol.J71−
A No.5 pp.1100−1108「雑音環境下
の単語音声認識の性能改善」で示される適応コムフィル
タ法である。
【0006】まず、スペクトルサブトラクション法につ
いて説明する。図7は従来の音声認識装置の雑音除去部
のブロック図である。雑音の重畳した音声信号はフーリ
エ分析部11と音声区間検知部15に入力される。フー
リエ分析部11では入力信号である雑音の重畳した音声
信号に対して10ms程度の周期で20ms程度の区間
の信号を用いてフーリエ分析する。フーリエ分析した結
果は実数部と虚数部から構成されるため、これを振幅と
位相に変換する。各周波数に対応する振幅情報は振幅引
算部12と雑音記憶部16に出力される。また、各周波
数に対応する位相情報は逆フーリエ処理部14に出力さ
れる。音声区間検知部15では入力される雑音信号の重
畳した音声信号及び音声のない区間での雑音信号から音
声のある区間のみを判別する。これは入力信号のパワー
情報を用いてパワーの大きいところでは音声のある区間
として、また、パワーの小さいところでは音声のない区
間とする。この音声のあり/なしの情報は雑音記憶部1
6に出力される。雑音記憶部16では音声区間検知部1
5から音声なしの信号がきたとき、フーリエ分析部11
からの各周波数に対応する振幅情報を雑音の振幅情報と
して記憶する。振幅引算部12ではフーリエ分析部11
からの雑音の重畳した音声信号の各周波数に対応する振
幅から雑音記憶部16で記憶している各周波数に対する
雑音の振幅を各々の周波数について引き算し、音声のみ
の振幅を計算する。半波整流部13では振幅引算部12
での雑音の重畳した音声の振幅から雑音のみの振幅を引
き算した結果、振幅が負になる周波数についてその振幅
を0にする。逆フーリエ処理部14では半波整流部13
からの各周波数に対応する振幅とフーリエ分析部11か
らの各信号に対応する位相から雑音が除かれた音声波形
を合成することにより、雑音のない音声波形が得られ
る。
【0007】次に、適応コムフィルタ法について説明す
る。図8は従来の音声認識装置の雑音除去部のブロック
図である。雑音の重畳した音声信号はフーリエ分析部2
1とピッチ周波数抽出部26に入力される。フーリエ分
析部21では入力信号である雑音の重畳した音声信号に
対して10ms程度の周期で20ms程度の区間の信号
を用いてフーリエ分析する。フーリエ分析した結果は実
数部と虚数部から構成されるため、これを振幅と位相に
変換する。各周波数に対する振幅情報は線スペクトル列
抽出処理部22と雑音バイアス推定処理部23と雑音引
算処理部24に出力される。また、各周波数に対応する
位相情報は逆フーリエ処理部25に出力される。ピッチ
周波数抽出部26では入力された雑音の重畳した音声信
号から音声ピッチ周波数の抽出を行う。ピッチ周波数の
抽出は雑音の重畳した音声信号および線形予測分析後の
残差信号の自己相関関数のうち最大値を示すものの遅延
時間をピッチの周期とする。ここでピッチ周波数は線ス
ペクトル列抽出処理部22に、最大値の自己相関関数の
値を雑音引算処理部24に出力する。線スペクトル列抽
出処理部22ではフーリエ分析部21からの各周波数に
対応する振幅からピッチ周波数抽出部26で抽出された
ピッチ周波数の整数倍の周波数に対応する周波数の振幅
情報のみを抜き出す。抜き出された後の振幅情報はピッ
チ周波数の整数倍の部分のみに成分がある櫛形になる。
このピッチ周波数の整数倍の部分のみからなる振幅デー
タは雑音バイアス推定処理部23と雑音引算処理部24
に出力される。雑音バイアス推定処理部23では、フー
リエ分析部21からの雑音の重畳した音声のスペクトル
から線スペクトル列抽出処理部22で抽出した音声のピ
ッチの整数倍の成分を除いた雑音のみの成分を抽出す
る。抽出した雑音成分のスペクトルは一定帯域幅のいく
つかの帯域に分割され、各帯域毎に平均スペクトルを求
め、雑音のスペクトルとする。求めた雑音のスペクトル
は雑音引算処理部24に出力される。雑音引算処理部2
4では、ピッチ周波数抽出部26からの最大値の自己相
関関数の値が閾値より大きい時は入力の音声が有声音で
あると判定し、線スペクトル列抽出処理部22で抽出し
た音声の線スペクトル列から雑音バイアス推定処理部2
3で求めた雑音のスペクトルを引き算する。スペクトル
が負の部分はスペクトルを零とする。ピッチ周波数抽出
部26からの最大値の自己相関関数の値が閾値より小さ
い時は入力の音声が無声音であると判定し、フーリエ分
析部21からの雑音重畳した音声のスペクトルから雑音
バイアス推定処理部23で求めた雑音のスペクトルを引
き算する。この引き算の結果を逆フーリエ処理部25に
出力する。逆フーリエ処理部25では雑音引算処理部2
4からの各周波数に対応する振幅とフーリエ分析部21
からの各信号に対応する位相から雑音が除かれた音声波
形を合成することにより、雑音のない音声波形が得られ
る。
【0008】
【発明が解決しようとする課題】しかしながら、上記し
た従来の音声認識装置の雑音除去処理部では、スペクト
ルサブトラクション法の場合については雑音の推定量を
計算するためにどれだけ過去にまでさかのぼり、何フレ
ーム分の周波数特徴量の平均をとれば最大の効果が得ら
れるかを求めるための明確な手段がないという問題点、
適応コムフィルタについては音声の基本周波数を求めな
ければならず、雑音の混じった音声について音声の基本
周波数を求めることが難しく、良い性能が得られないと
いう問題点を有していた。
【0009】本発明は、上記課題を解決し、雑音の重畳
した音声から雑音を除去する最大の効果を得るための明
確な手段を提供し、雑音の混じった音声でも効果的に動
作することが可能な音声認識装置を提供することを目的
とする。
【0010】
【課題を解決するための手段】本発明は上記目的を達成
するために、所定時間間隔のフレーム毎に環境雑音及び
入力音声の分析をし、雑音を除去した特徴量の時系列を
抽出する雑音除去・特徴抽出部と、あらかじめ発声され
た単語音声から特徴を抽出した特徴量の時系列を格納し
た辞書と、入力された特徴量の時系列と辞書の複数の単
語の特徴量の時系列を比較し、各単語の類似度を計算す
る類似度計算部と、各単語の類似度から最も類似した単
語を選択する判定処理部とを備え、雑音除去・特徴抽出
部において、環境雑音を常時入力し、特徴分析する分析
部と雑音及び雑音の重畳した音声のスペクトルを時間方
向に平滑化するスペクトル平滑化処理部と、入力雑音の
雑音スペクトルを記憶する雑音スペクトル記憶部と、入
力雑音に追従するように雑音スペクトルを更新する雑音
スペクトル更新部を有し、平滑化処理部から出力される
スペクトルから雑音スペクトル記憶部において入力雑音
に追従するように更新されている雑音スペクトルを減算
するようにしたものである。
【0011】また、構成において、スペクトル平滑化処
理部の処理後、所定時間間隔のフレーム毎に求めたスペ
クトルの各周波数について、該当周波数のスペクトル成
分に対応するマスキングパタンを求め、該当周波数に隣
接する周波数のスペクトルを計算し、全周波数について
各周波数に対応するマスキングパタンによる総和を用い
て入力雑音の推定を行うことと雑音の重畳した音声から
雑音スペクトル記憶部に記憶されている雑音スペクトル
の減算を行うようにしたものである。
【0012】
【作用】本発明は上記した構成により、特徴量抽出部の
前に入力雑音に自動的に追従する雑音除去部を設け、雑
音除去部により雑音の混じった音声から音声信号のみを
抽出する。
【0013】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。図1は本発明の一実施例の音声認
識装置の構成を示すブロック図であり、図中、31はマ
イク、32は雑音除去・特徴抽出部、34は類似度比較
部、35は判定処理部、36は標準パタン辞書である。
【0014】以上のように構成された音声認識装置につ
いて、以下その動作を説明する。マイク31から入力さ
れた音声は、雑音除去・特徴抽出部32で10ms程度
の周期でフーリエ分析され、後に述べる雑音除去方法に
より周囲雑音が除かれた周波数分析結果が得られる。ま
た、同時に音声の始端、終端の検知を行い音声区間を検
知する。類似度比較部34では雑音除去・特徴抽出部3
2からの音声区間の周波数分析結果と標準パタン辞書3
6に登録されている複数の単語の音声区間の周波数分析
結果を比較し、最も類似した単語の周波数分析結果の類
似度を得る。判定処理部35では類似度比較部34から
の類似度がある閾値よりも似ているか判定し、似ていれ
ばその単語を認識結果として出力する。
【0015】図2は本発明の一実施例の音声認識装置の
雑音除去・特徴抽出部のブロック図であり、図3は同動
作のフローチャートである。図2において41はフーリ
エ分析部、42はフーリエ係数バッファ、43はスペク
トル平滑化処理部、45はケプストラム処理部、46は
雑音スペクトル記憶部、47は雑音スペクトル更新部、
48は音声区間検出部である。
【0016】以上のように構成された雑音除去・特徴抽
出部について、以下その動作を図2と図3を参照して説
明する。雑音の重畳した音声信号はステップ1で入力さ
れ、、フーリエ分析部41に入力される。ステップ2に
おいて、フーリエ分析部41では入力信号である雑音の
重畳した音声信号に対して10ms程度の周期で20m
s程度の区間の信号を用いてフーリエ分析する。フーリ
エ分析した結果は実数部と虚数部からなる複素数で構成
されるため、これを振幅と位相に変換する。フーリエ分
析での各周波数に対応する振幅情報はフーリエ係数バッ
ファ42に出力される。ステップ3において、フーリエ
係数バッファ42では、入力された過去3フレーム程度
の振幅情報を記憶しておく。記憶の際にはバッファの容
量が有限のため、一番過去の振幅情報を消去して、最新
の振幅情報を記憶することで最新から3フレーム程度の
振幅情報を記憶する。スペクトル平滑化処理部43では
(数1)のようにフーリエ係数バッファ42に記憶され
ている最新Kフレーム分の各周波数に対応する振幅情報
X(i,k)の平均をとり、雑音が重畳する音声信号か
ら雑音がランダムに変化することを利用して変動のない
雑音の重畳した音声信号Xd(i)を推定する。
【0017】
【数1】
【0018】ステップ4では、音声区間検出部48にお
いて、現在の分析データが音声であるか、雑音であるか
の判定を、現在の入力信号のパワーの時間的変化から求
める。(数2)に示すように前の分析フレームのパワー
と現在の分析フレームのパワーの比がパワー比の閾値T
Hpよりも大きい時、音声が始まったと判定する。
【0019】
【数2】
【0020】また、(数3)に示すように、閾値よりも
小さい状態が(数4)に示すように継続時間の閾値TH
dより続いた時に、音声の終了と判断する。
【0021】
【数3】
【0022】
【数4】
【0023】ステップ5において、雑音スペクトル記憶
部46で記憶している雑音信号N(i)は雑音スペクト
ル更新部47により更新される。雑音信号N(i)は
(数5)のようにスペクトル平滑化処理部43の出力の
各周波数に対応する振幅情報Xd(i)と、後で示すE
(i)を用いて計算される。
【0024】
【数5】
【0025】ステップ5において、雑音スペクトル更新
部47で用いている値μは音声区間検出部48の結果に
より(数6)に従って変化する。(数5)のように雑音
信号N(i)は雑音が入力されている間は入力雑音に適
応して変化し、雑音の重畳した音声が入力されている間
は、直前までに適応した雑音信号を保持するように、音
声区間検出部48で入力信号が雑音であると判定された
時にはゼロでない定数を、音声が入力された時にはゼロ
とする。
【0026】
【数6】
【0027】音声区間検出部48において、音声と判定
されたときは、ケプストラム処理部45では、ステップ
6において(数7)のようにスペクトル平滑化処理部4
3からの音声信号Xd(i)から雑音スペクトル記憶部
46に記憶さている雑音信号N(i)を引いた値E
(i)を求め、ステップ7でケプストラム分析する。
【0028】
【数7】
【0029】ケプストラム係数c(i)は(数8)のよ
うに複素数E(i)の大きさを求め、その対数をとって
逆フーリエ変換することにより求め、ステップ8で雑音
除去・特徴抽出部32の出力とする。
【0030】
【数8】
【0031】以上のようにして、図1における雑音除去
・特徴抽出部32において、音声の始端、終端の検知を
行い、雑音の重畳した音声から周囲雑音が除かれた信号
の周波数分析結果としてケプストラム係数が得られる。
【0032】さらに、音声のスペクトルの同時マスキン
グによる効果を考慮にいれた雑音除去部の構成を図4に
示す。図4は本発明の一実施例の音声認識装置の雑音除
去部のブロック図、図5は同音声認識装置のマスキング
効果を示す図である。図4において、同時マスキング処
理部54が追加されている。同時マスキング処理部54
ではスペクトル平滑化処理部53の出力の各周波数に対
応する振幅情報Xd(i)を入力とし、以下に述べる同
時マスキング処理を行った出力を雑音スペクトル記憶部
56で記憶している各周波数に対応する振幅情報N
(i)との差をとる。同時マスキング処理は図5に示す
ような同時マスキング効果を実現する。その根拠は聴覚
器官である耳のうち、最も末端で周波数分析を行う基底
膜上の音を検知する有毛細胞の興奮パターンである。単
一の音に対して図5に相当するような各周波数に対応す
る有毛細胞の興奮を行うことがわかっている。これに対
応して、周波数フーリエ分析した各周波数の振幅に対し
て、同時マスキングにより中心周波数に隣接する周波数
の振幅もある割合で入力されたものとみなし、同時マス
キング効果を実現することができる。毎フレームのスペ
クトル平滑化処理部53の出力の各周波数に対応する振
幅情報Xd(i)に対して、それぞれの周波数の成分に
ついて図5に相当する範囲で隣接する各周波数の振幅を
計算する。(数9)に示すように、それぞれの周波数の
成分について求めたものを全部加算し、同時マスキング
の影響による各周波数に対応する振幅情報Xd’(i)
とする。
【0033】
【数9】
【0034】ここで、P(i,j)は中心周波数をiと
するマスキングパタンにおいて、中心周波数のマスキン
グレベルに対する周波数jのマスキングレベルの比であ
る。これ以降の処理は先に述べたXd(i)の代わりに
Xd’(i)を用いて処理を行うことになる。
【0035】
【発明の効果】以上のように本発明は、雑音の推定量を
計算するための明確な手段を提供することができ、音声
の基本周波数を求める必要のない音声認識装置を実現で
きる。さらに従来の雑音除去部では、フーリエ分析し、
周波数領域で雑音除去処理を行い、次に逆フーリエ変換
で雑音の除去波形を求めてから特徴抽出していたのに対
し、本発明ではフーリエ変換し、雑音除去処理をした周
波数特徴量を波形に戻さずに特徴抽出することにより、
雑音除去処理と特徴抽出処理の削減を図ることができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の音声認識装置の構成を示す
ブロック図
【図2】本発明の一実施例の音声認識装置の雑音除去・
特徴抽出部のブロック図
【図3】本発明の一実施例の音声認識装置の雑音除去・
特徴抽出部の動作のフローチャート
【図4】本発明の一実施例の音声認識装置の雑音除去部
のブロック図
【図5】本発明の一実施例の音声認識装置のマスキング
効果を示す図
【図6】従来の音声認識装置の構成を示すブロック図
【図7】従来の音声認識装置の雑音除去部のブロック図
【図8】従来の音声認識装置の雑音除去部のブロック図
【符号の説明】
32 雑音除去・特徴抽出部 34 類似度比較部 35 判定処理部 36 標準パタン辞書 41 フーリエ分析部 42,52 フーリエ係数バッファ 43,53 スペクトル平滑化処理部 54 同時マスキング処理部 45,55 ケプストラム処理部 46,56 雑音スペクトル記憶部 47,57 雑音スペクトル更新部 48,58 音声区間検出部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】音声認識において、所定時間間隔のフレー
    ム毎に環境雑音及び入力音声の分析をし、雑音を除去し
    た特徴量の時系列を抽出する雑音除去・特徴抽出部と、
    あらかじめ発声された単語音声から特徴を抽出した特徴
    量の時系列を格納した辞書と、入力された特徴量の時系
    列と辞書の複数の単語の特徴量の時系列を比較し、各単
    語の類似度を計算する類似度計算部と、各単語の類似度
    から最も類似した単語を選択する判定処理部とを備え、 前記雑音除去・特徴抽出部において、環境雑音を常時入
    力し、特徴分析する分析部と雑音及び雑音の重畳した音
    声のスペクトルを時間方向に平滑化するスペクトル平滑
    化処理部と、入力雑音の雑音スペクトルを記憶する雑音
    スペクトル記憶部と、入力雑音に追従するように雑音ス
    ペクトルを更新する雑音スペクトル更新部を有し、前記
    平滑化処理部から出力されるスペクトルから前記雑音ス
    ペクトル記憶部において入力雑音に追従するように更新
    されている雑音スペクトルを減算することを特徴とする
    音声認識装置。
  2. 【請求項2】前記スペクトル平滑化処理の処理後、所定
    時間間隔のフレーム毎に求めたスペクトルの各周波数に
    ついて、該当周波数のスペクトル成分に対応するマスキ
    ングパタンを求め、該当周波数に隣接する周波数のスペ
    クトルを計算し、全周波数について各周波数に対応する
    マスキングパタンによる総和を用いて入力雑音の推定を
    行うことと雑音の重畳した音声から前記雑音スペクトル
    記憶部に記憶されている雑音スペクトルの減算を行うこ
    とを特徴とする請求項1記載の音声認識装置。
JP6173990A 1994-07-26 1994-07-26 音声認識装置 Pending JPH0844390A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6173990A JPH0844390A (ja) 1994-07-26 1994-07-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6173990A JPH0844390A (ja) 1994-07-26 1994-07-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0844390A true JPH0844390A (ja) 1996-02-16

Family

ID=15970733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6173990A Pending JPH0844390A (ja) 1994-07-26 1994-07-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0844390A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100393196B1 (ko) * 1996-10-23 2004-01-28 삼성전자주식회사 음성인식장치및방법
JP2013015606A (ja) * 2011-07-01 2013-01-24 Clarion Co Ltd 直接音抽出装置および残響音抽出装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100393196B1 (ko) * 1996-10-23 2004-01-28 삼성전자주식회사 음성인식장치및방법
JP2013015606A (ja) * 2011-07-01 2013-01-24 Clarion Co Ltd 直接音抽出装置および残響音抽出装置

Similar Documents

Publication Publication Date Title
US10504539B2 (en) Voice activity detection systems and methods
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
KR101247652B1 (ko) 잡음 제거 장치 및 방법
JP3451146B2 (ja) スペクトルサブトラクションを用いた雑音除去システムおよび方法
KR100713366B1 (ko) 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
CN110232933B (zh) 音频检测方法、装置、存储介质及电子设备
JP5156043B2 (ja) 音声判別装置
US20090177468A1 (en) Speech recognition with non-linear noise reduction on mel-frequency ceptra
KR101892733B1 (ko) 켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법
JP5752324B2 (ja) 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
CN111292758B (zh) 语音活动检测方法及装置、可读存储介质
US6826528B1 (en) Weighted frequency-channel background noise suppressor
US8423360B2 (en) Speech recognition apparatus, method and computer program product
JP4705414B2 (ja) 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体
JP4965891B2 (ja) 信号処理装置およびその方法
US7966179B2 (en) Method and apparatus for detecting voice region
KR100784456B1 (ko) Gmm을 이용한 음질향상 시스템
JP2007093635A (ja) 既知雑音除去装置
JPH0844390A (ja) 音声認識装置
JP4325044B2 (ja) 音声認識システム
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
JP4537821B2 (ja) オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体
JP2000259198A (ja) パターン認識装置および方法、並びに提供媒体
JP3761497B2 (ja) 音声認識装置、音声認識方法、および、音声認識プログラム
KR20040073145A (ko) 음성인식기의 성능 향상 방법