JP4058987B2 - 雑音除去装置及び雑音除去方法 - Google Patents
雑音除去装置及び雑音除去方法 Download PDFInfo
- Publication number
- JP4058987B2 JP4058987B2 JP2002111733A JP2002111733A JP4058987B2 JP 4058987 B2 JP4058987 B2 JP 4058987B2 JP 2002111733 A JP2002111733 A JP 2002111733A JP 2002111733 A JP2002111733 A JP 2002111733A JP 4058987 B2 JP4058987 B2 JP 4058987B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- model
- noise model
- output
- power spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
この発明は雑音除去装置及び雑音除去方法に係り、特に周期性を持った非定常雑音環境下でも入力された音声に重畳する背景雑音を正確に除去できる雑音除去装置及方法に関するものである。
【0002】
【従来の技術】
音声に重畳した雑音を除去するための簡単で有効な手法として、スペクトルサブトラクション法(以下SS法)が広く用いられる。ここではその一例として、文献「音声・音情報のディジタル信号処理」(鹿野清宏他、昭晃堂、P.146-147)に記載されているSS法を用いる従来の音声認識装置の説明を行う。
【0003】
図14は従来の音声認識装置の構成を示す図である。図14において、1は背景雑音が重畳した音声を収集するマイクロホン、2は雑音重畳音声信号を周波数変換して雑音重畳音声パワースペクトルを時系列として出力する音響分析手段、3は雑音重畳音声パワースペクトルから音声区間か雑音区間かを判定し、切り替え手段20を動作させ雑音区間モード4と音声区間モード5を切り替える音声区間判定手段である。
【0004】
16は雑音区間モード4において雑音パワースペクトルの平均値を算出する平均雑音パワースペクトル演算手段、17は平均スペクトル演算手段が出力する平均雑音パワースペクトルを記憶する平均雑音パワースペクトルメモリ、11は音声区間モード5において雑音重畳音声スペクトル時系列から平均パワースペクトルメモリに記憶されている平均雑音パワースペクトルを減算し雑音除去スペクトル時系列を出力する雑音除去手段である。
【0005】
以下従来の音声認識装置の動作について説明する。マイクロホン1では背景雑音が重畳した音声を収集する。
【0006】
音響分析手段2では雑音重畳音声入力に対して、一定時間ごとにフーリエ変換によりパワースペクトルを計算し、雑音重畳音声スペクトルの時系列として出力する。
【0007】
音声区間判定手段3では音響分析手段2から出力される雑音重畳音声スペクトルから当該フレームが音声であるか雑音であるかを判定し、切り替え手段20を動作させ雑音区間モード4と音声区間モード5を切り替える。一般的な雑音除去装置では入力パワーが閾値を超えたかどうかで音声区間かどうかを判定する。
【0008】
平均雑音パワースペクトル演算手段16では雑音区間モード4において、雑音パワースペクトル時系列を式(1)により周波数毎に平均し、平均雑音パワースペクトルとして出力する。
【0009】
【数1】
【0010】
式(1)において、N (ω)は平均雑音パワースペクトルの周波数ωにおけるパワー、Nは平均化するフレームの総数、Xi(ω)はフレームiにおける雑音スペクトルの周波数ωにおけるパワーである。
【0011】
平均雑音パワースペクトルメモリ17では平均雑音パワースペクトル演算手段16が出力する平均雑音パワースペクトルを記憶する。
【0012】
雑音除去手段11では音声区間モード5において、音響分析手段2から出力される雑音重畳音声スペクトルの時系列の各雑音重畳音声スペクトルから以下の式(2)に従い雑音スペクトルを減算する。
【0013】
【数2】
【0014】
式(2)においてS(ω)は雑音除去音声スペクトルの周波数ωにおけるパワー、X(ω)は雑音重畳音声スペクトルの周波数ωにおけるパワー、N(ω)は平均雑音スペクトルの周波数ωにおけるパワーをそれぞれ表す。αはサブトラクト係数と呼ばれるパラメータで雑音成分を除去する程度を表す。通常認識精度を最大にするように調整する。またmax{ }は、括弧内の要素の中で最大の値の要素を返す関数である。
【0015】
【発明が解決しようとする課題】
従来のSS法を用いた雑音除去装置は上記のように構成されているため、発声直前等の雑音の平均パワースペクトルと実際の音声区間に重畳している雑音パワースペクトルの差が小さい場合、即ち雑音の変動が小さい場合は比較的良好に動作する。しかし雑音区間に一定周期毎に発生する非定常雑音が混入している場合や、雑音の変動が大きく定常的な雑音区間が少ない場合、雑音区間が十分な長さを取れない場合等は、推定した雑音パワースペクトルと実際に音声に重畳している雑音パワースペクトルとの推定誤差が大きくなり、正確に雑音除去できないという問題があった。
【0016】
本発明は上記の課題を解決するためのもので、まず雑音区間において周期的な非定常騒音の周期を学習し、雑音周期メモリに記憶する。その後音声区間において当該処理フレームが雑音周期と重なるかどうかを判定し、重なる場合には雑音重畳音声パワースペクトルから当該雑音モデルに係る雑音パワースペクトルを除去することで、一定周期毎に発生する非定常雑音下でも正確な雑音除去を行うことを目的としている。
【0017】
また、雑音照合結果と雑音区間における雑音パワースペクトルの時系列を基に、予め大量のデータから学習しておいた標準雑音モデルメモリに記憶されている雑音モデルを逐次的に適応化しておき、新たに適応化した雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、雑音環境が時々刻々と変化するような場合においても正確な雑音除去を行うことを目的としている。
【0018】
また、雑音照合結果を基に雑音区間における雑音パワースペクトルの時系列から新たに雑音モデルを学習しておき、新たに学習した雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、事前に学習した雑音環境と現在の雑音環境の間に変化があった場合においても正確な雑音除去を行うことを目的としている。
【0019】
また、複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルをそれぞれ除去することで、複数の雑音が重なるフレームにおいても正確な雑音除去を行うことを目的としている。
【0020】
また、定常的な雑音の他に複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルの他に雑音照合の際に最頻であった雑音モデルに係る雑音パワースペクトルをそれぞれ除去することで正確な雑音除去を行うことを目的としている。
【0021】
また、雑音照合結果を基に雑音区間における雑音パワースペクトルの時系列から新たに学習した雑音モデルの学習データ量が閾値未満である場合には信頼性が小さいとして、予め大量のデータから学習しておいた標準雑音モデルメモリに記憶されている雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、雑音の変動が大きく定常的な雑音区間が少ない場合や雑音区間が十分な長さを取れない場合においても正確な雑音除去を行うことを目的としている。
【0022】
【課題を解決する為の手段】
本発明に係る雑音除去装置は、雑音重畳音声信号を入力し、雑音重畳音声パワースペクトルを時系列として出力する音響分析手段と、
前記音響分析手段から出力される雑音重畳音声パワースペクトルから音声区間か雑音区間かを判定する音声区間判定手段と、
予め学習した複数の雑音モデルを記憶する標準雑音モデルメモリと、
前記音声区間判定手段が雑音区間と判定した場合に、前記標準雑音モデルメモリに記憶されている標準雑音モデルと前記音響分析手段から出力される雑音パワースペクトルとの照合を行い,各時刻における標準雑音モデルを選択する雑音照合手段と、
前記雑音照合手段から出力される標準雑音モデルの列をもとに,周期性をもつ周期性雑音モデルとその周期性を決定する雑音周期決定手段と、
前記雑音周期決定手段から出力される周期性雑音モデルとその出現時刻並びに周期性雑音モデル以外でもっとも頻繁に出現する最頻雑音モデルを記憶する雑音周期メモリと、
前記音声区間判定手段が音声区間と判定した場合に、その時刻が周期性雑音が出現する時刻と一致するかどうかを判定し、一致する場合には周期性雑音モデルを、そうでない場合には最頻雑音モデルを出力する雑音モデル選択手段と、
前記音響分析手段から出力される雑音重畳音声パワースペクトルから、前記標準雑音モデルメモリに記憶されている前記雑音モデル選択手段が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する雑音除去手段とを備える。
【0023】
また、本発明に係る雑音除去装置は、前記雑音照合手段から出力される各雑音モデルについて,同一の雑音モデルに該当する入力音声の雑音パワースペクトルと6:標準雑音モデルメモリに記憶されている該雑音モデルから,該雑音モデルの適応化を行い該雑音モデルを更新する雑音モデル適応化手段と、
前記雑音モデル適応化手段が出力する適応化後の雑音モデルをそのパワースペクトルト共に記憶する適応雑音モデルメモリとを設け、
雑音除去手段は前記音響分析手段から出力される雑音重畳音声パワースペクトルから、適応雑音モデルメモリに記憶された前記雑音モデル選択手段が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する。
【0024】
また、本発明に係る雑音除去装置は、前記雑音照合手段から出力される各雑音モデルについて,同一の雑音モデルに該当する入力信号の各時刻における雑音パワースペクトルから周期性雑音モデルまたは最頻雑音モデルを作成する雑音モデル学習手段と、
前記雑音モデル学習手段が出力する雑音モデルを記憶する学習雑音モデルメモリとを設け、
前記雑音除去手段は音響分析手段から出力される雑音重畳音声パワースペクトルから、前記学習標準雑音モデルメモリに記憶されている前記雑音モデル選択手段が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する構成にされる。
【0025】
また、本発明に係る雑音除去装置は、雑音周期メモリが、前記雑音周期決定手段から出力される周期性雑音モデルとその周期性から,その周期性雑音モデルの出現時刻・周期・継続時間・識別子を周期性雑音として記憶すると共に最頻雑音モデルとその識別子を最頻雑音として記憶し,
前記雑音モデル選択手段は、前記音声区間判定手段が音声区間と判定した場合に、各時刻についてその時刻が周期性雑音が出現する時刻と一致するかどうかを判定し、一致する場合には周期性雑音モデルの識別子を、そうでない場合は最頻雑音モデルの識別子出力し、
前記雑音除去手段は、前記雑音モデル選択手段が出力した識別子に対応する雑音モデルに係るパワースペクトルを、前記音響分析手段から出力される雑音重畳音声パワースペクトルから減算し、識別子が複数ある場合、複数の識別子に対応する複数の雑音モデルに係るパワースペクトルをそれぞれ減算し、雑音除去音声パワースペクトルを出力する。
【0026】
また、本発明に係る雑音除去装置は、前記雑音除去手段が、前記雑音周期メモリに記憶されている周期性をもつ雑音モデルの出現時刻・周期・継続時間・識別子から当該時刻が周期性雑音の出現時刻と重なるかどうかを判定し、重なる場合には周期性雑音モデルの識別子と最頻雑音モデルの識別子を出力し、そうでない場合には最頻雑音モデルの識別子のみを出力する。
【0027】
また、本発明に係る雑音除去装置は、前記雑音除去手段が、前記雑音モデル選択手段が出力した識別子が複数ある場合、前記音響分析手段から出力される雑音重畳音声パワースペクトルから、前記雑音モデル選択手段が出力した複数の識別子に対応する複数の雑音モデルに係るパワースペクトルをそれぞれ減算し、雑音除去音声パワースペクトルを出力する。
【0028】
また、本発明に係る雑音除去装置は、前記雑音モデル選択手段が、前記雑音周期メモリに記憶されている周期性をもつ雑音モデルの出現時刻・周期・識別子から当該フレームが周期性雑音と重なるかどうかを判定し、重なりかつ前記学習雑音モデルメモリに記憶されている雑音モデルの学習データが所定の閾値以上の場合、前記学習雑音モデルメモリに記憶されている当該雑音モデルの識別子を、前記学習雑音モデルメモリにおける雑音モデルの学習データが所定の閾値未満の場合、前記標準雑音モデルメモリに記憶されている当該雑音モデルの識別子を出力し、
重ならずかつ前記学習雑音モデルメモリに記憶されている雑音モデルの学習データが第2の所定閾値以上の場合、前記学習雑音モデルメモリに記憶されている最頻雑音モデルの識別子を、前記学習雑音モデルメモリにおける雑音モデルの学習データが第2の所定の閾値未満の場合、前記標準雑音モデルメモリに記憶されている最頻雑音モデルの識別子を出力する。
【0029】
また、本発明に係る雑音除去方法は、雑音重畳音声信号を入力し、雑音重畳音声パワースペクトルを時系列として出力する音響分析工程と、
前記音響分析工程から出力される雑音重畳音声パワースペクトルから音声区間か雑音区間かを判定する音声区間判定工程と、
前記音声区間判定工程が雑音区間と判定した場合に、予め学習した複数の雑音モデルを記憶した標準雑音モデルメモリの標準雑音モデルと前記音響分析工程から出力される雑音パワースペクトルとの照合を行い,各時刻における標準雑音モデルを選択する雑音照合工程と、
前記雑音照合工程から出力される標準雑音モデルの列をもとに,周期性をもつ周期性雑音モデルとその周期性を決定する雑音周期決定工程と、
前記雑音周期決定工程から出力される周期性雑音モデルとその出現時刻並びに周期性雑音モデル以外でもっとも頻繁に出現する最頻雑音モデルを雑音周期メモリに記憶する雑音周期工程と、
前記音声区間判定工程が音声区間と判定した場合に、その時刻が周期性雑音が出現する時刻と一致するかどうかを判定し、一致する場合には周期性雑音モデルを、そうでない場合には最頻雑音モデルを出力する雑音モデル選択工程と、
前記音響分析工程から出力される雑音重畳音声パワースペクトルから、前記標準雑音モデルメモリに記憶されている前記雑音モデル選択工程が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する雑音除去工程とを備える。
【0030】
【発明の実施の形態】
以下、この発明の実施の形態を説明する。
実施の形態1.
図1は、この発明の実施の形態1による雑音除去装置の構成を示す図である。図において、1は背景雑音が重畳した音声を収集するマイクロホン、2は雑音重畳音声信号を周波数変換して雑音重畳音声パワースペクトルを時系列として出力する音響分析手段、3は雑音重畳音声パワースペクトルから音声区間か雑音区間かを判定し、切り替え手段20を動作させ雑音区間モード4と音声区間モード5を切り替える音声区間判定手段、6は予め大量のデータから学習した雑音モデルを記憶する6:標準雑音モデルメモリ、7は雑音区間モード4において、標準雑音モデルメモリ6に記憶されている雑音モデルと音響分析手段2が出力する雑音パワースペクトルの照合を行う雑音照合手段である。
【0031】
8は雑音照合手段7の照合結果を基に雑音モデルの周期性を判定する雑音周期決定手段、9は雑音周期決定手段8が出力する周期性を持つ雑音モデルの周期・時刻・継続時間・識別子並びに最頻雑音モデルの識別子を記憶する雑音周期メモリ、10は音声区間モード5において、現在処理フレームが周期性雑音と重なるかを判定し、重なる場合には当該雑音モデルの識別子を、そうでない場合には最頻雑音モデルの識別子を出力する雑音モデル選択手段、11は、標準雑音モデルメモリ6に記憶されている雑音モデル選択手段10が出力する識別子に対応する雑音モデルに係るパワースペクトルを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する雑音除去手段である。
【0032】
図2は実施の形態1のフローチャートである。以下この図を基に動作を説明する。
【0033】
マイクロホン1は一般的に話者の近傍に設置されて、背景雑音が重畳した音声を取り込む(S01)。
【0034】
音響分析手段2はマイクロホン1が取り込んだ雑音重畳音声に対して、一定時間毎にシフトする分析フレーム毎にFFT(高速フーリエ変換)を用いて周波数変換を実施して、雑音重畳音声信号に係る分析フレーム毎のパワースペクトルを時系列として出力する(S02)。
【0035】
音声区間判定手段3は音響分析手段2から出力される雑音重畳音声スペクトルから当該フレームが音声であるか雑音であるかを判定する。この音声区間判定手段3は一般的に用いられる入力パワーが閾値を超えたかどうかで音声区間かどうかを判定する(S03)。
【0036】
音声区間判定手段3の結果から切り替え手段20で雑音区間モード4と音声区間モード5を切り替える(S04)。
【0037】
雑音照合手段7では、雑音区間モード4において標準雑音モデルメモリ6に記憶されている雑音モデルと音響分析手段2が出力する雑音パワースペクトルの照合を行う(S05)。標準雑音モデルメモリ6には予め大量のデータから学習しておいた様々な雑音モデルを記憶しておく。本実施の形態では雑音モデルとしてHMM(隠れマルコフモデル)を使用し、図3のように各雑音モデルが網羅的に接続しているエルゴティックHMMを用いる。また後述する雑音除去のために各雑音モデルに対応する平均パワースペクトルも同様に記憶しておく。ここでは雑音照合手法の一例として、文献「音声認識の基礎(下)」(Lawrence Rabiner, Biing-Hwang Juang 共著、NTTアドバンステクノロジ株式会社、P.125-127)に記載されている、Viterbiサーチを用いた最大尤度の演算方法を説明する。
【0038】
時刻1〜Tまでの雑音パワースペクトル時系列Y=(y1,y2,・・・,yr)に対して尤度最大となる一本の最適状態系列q=(q1,q2,・・・,qr)を見つけるViterbiサーチは以下の4つのステップから構成される。
【0039】
STEP1(初期化)
【0040】
【数3】
【0041】
【数4】
【0042】
STEP2(繰り返し)
【0043】
【数5】
【0044】
【数6】
【0045】
STEP3(終了)
【数7】
【0046】
【数8】
【0047】
STEP4(バックトラック)
【数9】
【0048】
ここでδt(i)は一本のパス上の、時刻tでの最大尤度であり以下の式10で表される。
【0049】
【数10】
【0050】
雑音モデル学習手段8では雑音照合手段7から出力される雑音モデルの照合結果系列q1 q2・・・qTから雑音の周期を決定し周期性を持つ雑音モデルの周期・時刻・継続時間・識別子を雑音周期メモリ9に記憶する。また同時に照合結果系列中の最頻雑音モデルの識別子を雑音周期メモリ9に記憶する(S06)。図4は雑音照合結果の例である。図4から雑音モデルBが5フレーム間隔に2フレーム毎に出現しており周期性を持っていると判定する。この場合、雑音周期メモリに雑音モデルの周期TC=5,出現時刻TA={4,5,11,12,18,19},継続時間TD=2並びに識別子ID=Bを、関連付けを保ったまま記憶する。また照合結果系列の雑音モデルの中で最頻である識別子IDmax=Aも同様に記憶する。
なお、図4は間隔及び継続時間が完全に一致する例であるが、間隔及び継続時間に適当な閾値を設け誤差が閾値未満であれば周期性があると判定することもできる。
【0051】
雑音モデル選択手段10では音声区間モードにおいて雑音周期メモリ9に記憶されている周期性を持つ雑音モデルの周期・時刻・継続時間並びに識別子を基に現在処理フレームが周期性雑音と重なるかを判定する(S07)。現在処理フレームをt、雑音モデルの周期をTC、最終非出現時刻をTN、最終出現時刻をTL、継続時間をTDとした場合、以下の式(11)(12)のどちらかを満たす場合、周期性雑音と重なると判定し当該雑音モデルの識別子IDを出力する。そうでない場合は定常雑音区間として最頻雑音モデルの識別子IDmaxを出力する。
【0052】
TN <t AND TN+TD>=t (11)
TL+kTC+(k-1)TD<t AND TL+k(TC+TD)>=t (k=1,2・・・) (12)
【0053】
雑音除去手段11では雑音モデル選択手段10が周期性を持つ雑音モデルの識別子を出力した場合、標準雑音モデルメモリ6から周期性を持つ雑音モデルに係るパワースペクトルを選択し(S08)、これを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する(S10)。
【0054】
【数11】
【0055】
式(13)においてS(ω)は雑音除去音声スペクトルの周波数ωにおけるパワー、X(ω)は雑音重畳音声スペクトルの周波数ωにおけるパワー、αCは周期性を持つ雑音モデルに対するサブトラクト係数、NC (ω)は周期性を持つ雑音モデルに係るパワースペクトルの周波数ωにおけるパワーをそれぞれ表す。
【0056】
また、雑音モデル選択手段10が最頻雑音モデルの識別子を出力した場合、標準雑音モデルメモリ6から最頻雑音モデルに係るパワースペクトルを選択し(S09)、これを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する(S10)。
【0057】
【数12】
【0058】
式(14)においてS(ω)は雑音除去音声スペクトルの周波数ωにおけるパワー、X(ω)は雑音重畳音声スペクトルの周波数ωにおけるパワー、αSは最頻雑音モデルに対するサブトラクト係、NS(ω)は最頻雑音モデルに係るパワースペクトルの周波数ωにおけるパワーをそれぞれ表す。
【0059】
以上のようにこの実施の形態1によれば、雑音区間において周期的な非定常騒音の周期を学習し、雑音周期メモリに記憶する。その後音声区間において当該処理フレームが雑音周期と重なるかどうかを判定し、重なる場合には雑音重畳音声パワースペクトルから当該雑音モデルに係る雑音パワースペクトルを除去するため、一定周期毎に発生する非定常雑音下でも正確な雑音除去を行うことができる。
【0060】
また、複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルを順番に除去することで、複数の雑音が重なるフレームにおいても正確な雑音除去を行うことができる。
【0061】
【数13】
【0062】
式(15)においてS(ω)は雑音除去音声スペクトルの周波数ωにおけるパワー、X(ω)は雑音重畳音声スペクトルの周波数ωにおけるパワー、N1(ω)は周期性を持つ雑音モデル1に係るパワースペクトルの周波数ωにおけるパワー、N2(ω)は周期性を持つ雑音モデル2に係るパワースペクトルの周波数ωにおけるパワー、NK(ω)は周期性を持つ雑音モデルKに係るパワースペクトルの周波数ωにおけるパワー、α1〜αKはそれぞれの雑音モデルに対するサブトラクト係数である。
【0063】
また、図2の(S08)の処理を図5の(S17)のように変形することで、定常的な雑音の他に複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルの他に雑音照合の際に最頻であった雑音モデルに係る雑音パワースペクトルを順番に除去することで正確な雑音除去を行うことができる。
【0064】
【数14】
【0065】
式(16)においてS(ω)は雑音除去音声スペクトルの周波数ωにおけるパワー、X(ω)は雑音重畳音声スペクトルの周波数ωにおけるパワー、NC(ω)は周期性を持つ雑音モデルに係るパワースペクトルの周波数ωにおけるパワー、NS(ω)は最頻雑音モデルに係るパワースペクトルの周波数ωにおけるパワー、αCは周期性を持つ雑音モデルに対するサブトラクト係数、αSは最頻雑音モデルに対するサブトラクト係数である。
【0066】
実施の形態2.
実施の形態1による雑音除去装置では予め大量のデータから学習した標準雑音モデルを雑音除去に用いるため、事前に学習した雑音環境と現在の雑音環境の間に変化があった場合に正確な雑音除去ができないという問題がある。
図6は、この点を改善した発明の実施の形態2による雑音除去装置の構成を示す図である。図において、12は音響分析手段から出力される雑音パワースペクトルから、雑音照合手段から出力される雑音モデルとの照合結果をもとに、雑音モデルの学習を行う雑音モデル学習手段、13は雑音モデル学習手段が出力する雑音モデルを記憶する:学習雑音モデルメモリである。その他は実施の形態1と同様であるので説明を省略する。
【0067】
図7は実施の形態2のフローチャートである。以下この図を基に動作を説明する。
【0068】
(S01)〜(S07)は実施の形態1と同様であるので説明を省略する。
【0069】
雑音モデル学習手段12では音響分析手段2から出力される雑音重畳音声パワースペクトルから、雑音照合手段7から出力される雑音モデルとの照合結果をもとに、雑音モデルに係る雑音パワースペクトルの演算を行い、結果を学習雑音モデルメモリ13に記憶する(S11)。例えば図4のような雑音照合結果の場合、以下の式(17)によって雑音モデルAの平均パワースペクトルを演算する。
【0070】
【数15】
【0071】
式(17)において、NA(ω)は雑音モデルAの平均スペクトルの周波数ωにおけるパワー、ΦAは雑音モデルAに割り当てられたフレームの集合、Nは雑音モデルAに割り当てられたフレームの総数、Xi(ω)はフレームiにおける雑音重畳音声スペクトルの周波数ωにおけるパワーである。
【0072】
雑音除去手段11では雑音モデル選択手段10が周期性を持つ雑音モデルの識別子を出力した場合、学習雑音モデルメモリ13から周期性を持つ雑音モデルに係るパワースペクトルを選択し(S12)、これを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する(S10)。
【0073】
また、雑音モデル選択手段10が最頻雑音モデルの識別子を出力した場合、学習雑音モデルメモリ13から最頻雑音モデルに係るパワースペクトルを選択し(S13)、これを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する(S10)。
【0074】
以上のようにこの実施の形態2によれば、雑音照合結果を基に雑音区間における入力パワースペクトルの時系列から新たに雑音モデルを学習しておき、新たに学習した雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、事前に学習した雑音環境と現在の雑音環境の間に変化があった場合においても正確な雑音除去を行うことができる。
【0075】
また、複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルを順番に除去することで、複数の雑音が重なるフレームにおいても正確な雑音除去を行うことができる。
【0076】
また、図7の(S12)の処理を図8の(S18)のように変形することで、定常的な雑音の他に複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルの他に雑音照合の際に最頻であった雑音モデルに係る雑音パワースペクトルを順番に除去することで正確な雑音除去を行うことができる。
【0077】
実施の形態3.
実施の形態2による雑音除去装置では、音響分析手段2から出力される雑音重畳音声パワースペクトルから雑音照合手段7から出力される雑音モデルとの照合結果をもとに学習した雑音モデルを雑音除去に用いるため、雑音の変動が大きく定常的な雑音区間が少ない場合や雑音区間が十分な長さを取れない場合に正確な雑音除去ができないという問題があった。図9は、この点を改善した発明の実施の形態3による雑音除去装置の構成を示す図である。各手段、メモリは実施の形態2と同様であるので説明を省略する。
【0078】
実施の形態2との差異は雑音モデル選択手段10の選択方法である。図10は実施の形態3の雑音モデル選択手段のフローチャートである。以下この図を基に動作を説明する。
【0079】
雑音モデル選択手段10では音声区間モード5において雑音周期メモリ9に記憶されている周期性を持つ雑音モデルの周期・時刻・継続時間並びに識別子を基に現在処理フレームが周期性雑音と重なるかを判定する(S07)。重なると判定した場合、周期性雑音モデルの学習データ数が閾値以上であるかを判定し(S20)、閾値以上である場合は学習雑音モデルメモリ13から周期性雑音モデルに係るパワースペクトルを選択する(S12)。閾値未満である場合は標準雑音モデルメモリ6から周期性雑音モデルに係るパワースペクトルを選択する(S08)。
【0080】
また重ならないと判定した場合、最頻雑音モデルの学習データ数が別の閾値以上であるかを判定し(S20)、閾値以上である場合は、学習雑音モデルメモリ13から最頻雑音モデルに係るパワースペクトルを選択し(S13)、閾値未満である場合は標準雑音モデルメモリ6から最頻雑音モデルに係るパワースペクトルを選択する(S09)。
【0081】
以上のようにこの実施の形態3によれば、雑音照合結果を基に雑音区間における入力パワースペクトルの時系列から新たに学習した雑音モデルの学習データ量が閾値未満である場合には信頼性が小さいとして、予め大量のデータから学習しておいた標準雑音モデルメモリ6に記憶されている雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、雑音の変動が大きく定常的な雑音区間が少ない場合や雑音区間が十分な長さ取れない場合においても正確な雑音除去を行うことができる。
【0082】
実施の形態4.
実施の形態3による雑音除去装置では雑音モデルの学習データ数が閾値未満の場合には、予め大量のデータから学習した標準雑音モデルを雑音除去に用いるため、雑音環境が時々刻々と変化するような場合に正確に雑音除去できないという問題がある。図11は、この点を改善した本発明の実施の形態4による雑音除去装置の構成を示す図である。
【0083】
図において、14は音響分析手段2から出力される雑音重畳音声パワースペクトルと雑音照合手段7から出力される雑音モデルとの照合結果をもとに、標準雑音モデルメモリ6に記憶されている標準雑音モデルの適応化を行う雑音モデル適応化手段、15は雑音モデル適応化手段14が出力する適応化後の雑音モデルを記憶する適応雑音モデルメモリである。その他は実施の形態1と同様であるので説明を省略する。
【0084】
図12は実施の形態4のフローチャートである。以下この図を基に動作を説明する。
【0085】
(S01)〜(S07)は実施の形態1と同様であるので説明を省略する。雑音モデル適応化手段14では音響分析手段2から出力される雑音重畳音声パワースペクトルと雑音照合手段7から出力される雑音モデルとの照合結果をもとに、標準雑音モデルメモリ6に記憶されている標準雑音モデルの適応化を行い、適応雑音モデルメモリ13に記憶する(S14)。例えば図4のような雑音照合結果の場合、以下の式(18)によって雑音モデルAの平均パワースペクトルを演算する。
【0086】
【数16】
【0087】
式(18)において、NA(ω)は雑音モデルAの平均スペクトルの周波数ωにおけるパワー、ΦAは同一雑音モデルAに割り当てられたフレームの集合、Xi(ω)はフレームiにおける雑音重畳音声スペクトルの周波数ωにおけるパワー、MA(ω)は標準雑音モデルAの平均スペクトルの周波数ωにおけるパワー、nは学習データ数、Nは標準雑音モデル学習時のデータ数、wは新たに学習したデータに対する重みパラメータである。
【0088】
式(18)では雑音照合結果系列に含まれる雑音モデルに対してのみ適応化を行っているが、音声認識で一般的に使用されているMLLR(重回帰写像)等の適応化方式を用いて、雑音照合結果に含まれていない雑音モデルについても適応化することもできる。
【0089】
雑音除去手段11では雑音モデル選択手段10が周期性を持つ雑音モデルの識別子を出力した場合、適応雑音モデルメモリ13から周期性を持つ雑音モデルに係るパワースペクトルを選択し(S15)、これを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する(S10)。
【0090】
また、雑音モデル選択手段10が最頻雑音モデルの識別子を出力した場合、適応雑音モデルメモリ13から最頻雑音モデルに係るパワースペクトルを選択し(S16)、これを雑音重畳音声パワースペクトルから減算し雑音除去スペクトル時系列を出力する(S10)。
【0091】
以上のようにこの実施の形態4によれば、雑音照合結果と雑音区間における入力パワースペクトルの時系列を基に、予め大量のデータから学習しておいた標準雑音モデルメモリに記憶されている雑音モデルを逐次的に適応化しておき、新たに適応化した雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、雑音環境が時々刻々と変化するような場合においても正確な雑音除去を行うことができる。
【0092】
また、雑音照合の際に前回までの雑音照合結果と雑音区間における入力パワースペクトルの時系列を基に標準雑音モデルメモリに記憶されている雑音モデルを逐次的に適応化した雑音モデルを用いることで、雑音環境が時々刻々と変化するような場合においても正確な雑音除去ができる。
【0093】
また、複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルを順番に除去することで、複数の雑音が重なるフレームにおいても正確な雑音除去を行うことができる。
【0094】
また、図12の(S15)の処理を図13の(S19)のように変形することで、定常的な雑音の他に複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルの他に雑音照合の際に最頻であった雑音モデルに係る雑音パワースペクトルを順番に除去することで正確な雑音除去を行うことができる。
【0095】
【発明の効果】
本発明は、まず雑音区間において周期的な非定常騒音の周期を学習し、雑音周期メモリに記憶する。その後音声区間において当該処理フレームが雑音周期と重なるかどうかを判定し、重なる場合には雑音重畳音声パワースペクトルから当該雑音モデルに係る雑音パワースペクトルを除去することで、一定周期毎に発生する非定常雑音下でも正確な雑音除去を行うことができる。
【0096】
また、雑音照合結果と雑音区間における雑音パワースペクトルの時系列を基に、予め学習しておいた標準雑音モデルメモリに記憶されている雑音モデルを逐次的に適応化しておき、新たに適応化した雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、雑音環境が時々刻々と変化するような場合においても正確な雑音除去を行うことができる。
【0097】
また、雑音照合結果を基に雑音区間における雑音パワースペクトルの時系列から新たに雑音モデルを学習しておき、新たに学習した雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、事前に学習した雑音環境と現在の雑音環境の間に変化があった場合においても正確な雑音除去を行うことができる。
【0098】
また、複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルをそれぞれ除去することで、複数の雑音が重なるフレームにおいても正確な雑音除去を行うことができる。
【0099】
また、定常的な雑音の他に複数の周期性のある非定常雑音が存在する環境下においても当該雑音モデルに係る雑音パワースペクトルの他に雑音照合の際に最頻であった雑音モデルに係る雑音パワースペクトルをそれぞれ除去することで正確な雑音除去を行うことができる。
【0100】
また、雑音照合結果を基に雑音区間における雑音パワースペクトルの時系列から新たに学習した雑音モデルの学習データ量が閾値未満である場合には信頼性が小さいとして、予め大量のデータから学習しておいた標準雑音モデルメモリに記憶されている雑音モデルに係る雑音パワースペクトルを雑音重畳音声パワースペクトルから除去することで、雑音の変動が大きく定常的な雑音区間が少ない場合や雑音区間が十分な長さを取れない場合においても正確な雑音除去を行うことができる。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による雑音除去装置の構成図である。。
【図2】 実施の形態1のフローチャートである
【図3】 標準雑音モデルメモリに記憶された雑音モデルの説明図である。
【図4】 雑音照合手段の雑音照合結果説明図である。
【図5】 実施の形態1の雑音モデル選択手段における他のフローチャートである。
【図6】 この発明の実施の形態2による雑音除去装置の構成図である。
【図7】 実施の形態2のフローチャートである。
【図8】 実施の形態2の雑音モデル選択手段における他のフローチャートである。
【図9】 この発明の実施の形態3による雑音除去装置の構成図である
【図10】 実施の形態3の雑音モデル選択手段のフローチャートである。
【図11】 発明の実施の形態4による雑音除去装置の構成図である。
【図12】 実施の形態4のフローチャートである。
【図13】 実施の形態4の雑音モデル選択手段における他のフローチャートである。
【図14】 従来の音声認識装置の構成図である。
【符号の説明】
1:マイクロホン、2:音響分析手段、3:音声区間判定手段、4:雑音区間モード、5:音声区間モード、6:標準雑音モデルメモリ、7:雑音照合手段、8:雑音周期決定手段、9:雑音周期メモリ、10:雑音モデル選択手段、11:雑音除去手段、12:雑音モデル学習手段、13:学習雑音モデルメモリ、14:雑音モデル適応化手段、15:適応雑音モデルメモリ、20:切り替え手段。
Claims (8)
- 雑音重畳音声信号を入力し、雑音重畳音声パワースペクトルを時系列として出力する音響分析手段と、
前記音響分析手段から出力される雑音重畳音声パワースペクトルから音声区間か雑音区間かを判定する音声区間判定手段と、
予め学習した複数の雑音モデルを記憶する標準雑音モデルメモリと、
前記音声区間判定手段が雑音区間と判定した場合に、前記標準雑音モデルメモリに記憶されている標準雑音モデルと前記音響分析手段から出力される雑音パワースペクトルとの照合を行い,各時刻における標準雑音モデルを選択する雑音照合手段と、
前記雑音照合手段から出力される標準雑音モデルの列をもとに,周期性をもつ周期性雑音モデルとその周期性を決定する雑音周期決定手段と、
前記雑音周期決定手段から出力される周期性雑音モデルとその出現時刻並びに周期性雑音モデル以外でもっとも頻繁に出現する最頻雑音モデルを記憶する雑音周期メモリと、
前記音声区間判定手段が音声区間と判定した場合に、その時刻が周期性雑音が出現する時刻と一致するかどうかを判定し、一致する場合には周期性雑音モデルを、そうでない場合には最頻雑音モデルを出力する雑音モデル選択手段と、
前記音響分析手段から出力される雑音重畳音声パワースペクトルから、前記標準雑音モデルメモリに記憶されている前記雑音モデル選択手段が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する雑音除去手段とを備えることを特徴とする雑音除去装置。 - 前記雑音照合手段から出力される各雑音モデルについて,同一の雑音モデルに該当する入力音声の雑音パワースペクトルと標準雑音モデルメモリに記憶されている該雑音モデルから,該雑音モデルの適応化を行い該雑音モデルを更新する雑音モデル適応化手段と、
前記雑音モデル適応化手段が出力する適応化後の雑音モデルをそのパワースペクトルと共に記憶する適応雑音モデルメモリとを設け、
雑音除去手段は前記音響分析手段から出力される雑音重畳音声パワースペクトルから、適応雑音モデルメモリに記憶された前記雑音モデル選択手段が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力することを特徴とする請求項1記載の雑音除去装置。 - 前記雑音照合手段から出力される各雑音モデルについて,同一の雑音モデルに該当する入力信号の各時刻における雑音パワースペクトルから周期性雑音モデルまたは最頻雑音モデルを作成する雑音モデル学習手段と、
前記雑音モデル学習手段が出力する雑音モデルを記憶する学習雑音モデルメモリとを設け、
前記雑音除去手段は音響分析手段から出力される雑音重畳音声パワースペクトルから、前記学習標準雑音モデルメモリに記憶されている前記雑音モデル選択手段が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する構成にされたことを特徴とする請求項1記載の雑音除去装置。 - 雑音周期メモリは、前記雑音周期決定手段から出力される周期性雑音モデルとその周期性から,その周期性雑音モデルの出現時刻・周期・継続時間・識別子を周期性雑音として記憶すると共に最頻雑音モデルとその識別子を最頻雑音として記憶し,
前記雑音モデル選択手段は、前記音声区間判定手段が音声区間と判定した場合に、各時刻についてその時刻が周期性雑音が出現する時刻と一致するかどうかを判定し、一致する場合には周期性雑音モデルの識別子を、そうでない場合は最頻雑音モデルの識別子出力し、
前記雑音除去手段は、前記雑音モデル選択手段が出力した識別子に対応する雑音モデルに係るパワースペクトルを、前記音響分析手段から出力される雑音重畳音声パワースペクトルから減算し、識別子が複数ある場合、複数の識別子に対応する複数の雑音モデルに係るパワースペクトルをそれぞれ減算し、雑音除去音声パワースペクトルを出力することを特徴とする請求項1乃至3の何れかに記載の雑音除去装置。 - 前記雑音除去手段は、
前記雑音周期メモリに記憶されている周期性をもつ雑音モデルの出現時刻・周期・継続時間・識別子から当該時刻が周期性雑音の出現時刻と重なるかどうかを判定し、重なる場合には周期性雑音モデルの識別子と最頻雑音モデルの識別子を出力し、そうでない場合には最頻雑音モデルの識別子のみを出力すること
を特徴とする請求項4記載の雑音除去装置。 - 前記雑音除去手段は、
前記雑音モデル選択手段が出力した識別子が複数ある場合、前記音響分析手段から出力される雑音重畳音声パワースペクトルから、前記雑音モデル選択手段が出力した複数の識別子に対応する複数の雑音モデルに係るパワースペクトルをそれぞれ減算し、雑音除去音声パワースペクトルを出力すること
を特徴とする請求項4記載の雑音除去装置。 - 前記雑音モデル選択手段は、前記雑音周期メモリに記憶されている周期性をもつ雑音モデルの出現時刻・周期・識別子から当該フレームが周期性雑音と重なるかどうかを判定し、重なりかつ前記学習雑音モデルメモリに記憶されている雑音モデルの学習データ数が所定の閾値以上の場合、前記学習雑音モデルメモリに記憶されている当該雑音モデルの識別子を、前記学習雑音モデルメモリにおける雑音モデルの学習データ数が所定の閾値未満の場合、前記標準雑音モデルメモリに記憶されている当該雑音モデルの識別子を出力し、
重ならずかつ前記学習雑音モデルメモリに記憶されている雑音モデルの学習データ数が第2の所定閾値以上の場合、前記学習雑音モデルメモリに記憶されている最頻雑音モデルの識別子を、前記学習雑音モデルメモリにおける雑音モデルの学習データ数が第2の所定の閾値未満の場合、前記標準雑音モデルメモリに記憶されている最頻雑音モデルの識別子を出力すること
を特徴とする請求項3乃至6の何れかに記載の雑音除去装置。 - 雑音重畳音声信号を入力し、雑音重畳音声パワースペクトルを時系列として出力する音響分析工程と、
前記音響分析工程から出力される雑音重畳音声パワースペクトルから音声区間か雑音区間かを判定する音声区間判定工程と、
前記音声区間判定工程が雑音区間と判定した場合に、予め学習した複数の雑音モデルを記憶した標準雑音モデルメモリの標準雑音モデルと前記音響分析工程から出力される雑音パワースペクトルとの照合を行い,各時刻における標準雑音モデルを選択する雑音照合工程と、
前記雑音照合工程から出力される標準雑音モデルの列をもとに,周期性をもつ周期性雑音モデルとその周期性を決定する雑音周期決定工程と、
前記雑音周期決定工程から出力される周期性雑音モデルとその出現時刻並びに周期性雑音モデル以外でもっとも頻繁に出現する最頻雑音モデルを雑音周期メモリに記憶する雑音周期工程と、
前記音声区間判定工程が音声区間と判定した場合に、その時刻が周期性雑音が出現する時刻と一致するかどうかを判定し、一致する場合には周期性雑音モデルを、そうでない場合には最頻雑音モデルを出力する雑音モデル選択工程と、
前記音響分析工程から出力される雑音重畳音声パワースペクトルから、前記標準雑音モデルメモリに記憶されている前記雑音モデル選択工程が出力した周期性雑音モデルまたは最頻雑音モデルに係るパワースペクトルを減算し、雑音除去音声パワースペクトルを出力する雑音除去工程とを備えることを特徴とする雑音除去方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002111733A JP4058987B2 (ja) | 2002-04-15 | 2002-04-15 | 雑音除去装置及び雑音除去方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002111733A JP4058987B2 (ja) | 2002-04-15 | 2002-04-15 | 雑音除去装置及び雑音除去方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003308092A JP2003308092A (ja) | 2003-10-31 |
JP4058987B2 true JP4058987B2 (ja) | 2008-03-12 |
Family
ID=29394445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002111733A Expired - Fee Related JP4058987B2 (ja) | 2002-04-15 | 2002-04-15 | 雑音除去装置及び雑音除去方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4058987B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4530199B2 (ja) * | 2004-02-24 | 2010-08-25 | 株式会社河合楽器製作所 | 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム |
JP4519169B2 (ja) * | 2005-02-02 | 2010-08-04 | 富士通株式会社 | 信号処理方法および信号処理装置 |
JP2006279185A (ja) * | 2005-03-28 | 2006-10-12 | Casio Comput Co Ltd | 撮像装置、音声記録方法及びプログラム |
JP4316583B2 (ja) | 2006-04-07 | 2009-08-19 | 株式会社東芝 | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム |
JP4868999B2 (ja) | 2006-09-22 | 2012-02-01 | 富士通株式会社 | 音声認識方法、音声認識装置及びコンピュータプログラム |
JP5487062B2 (ja) * | 2010-09-22 | 2014-05-07 | Necトーキン株式会社 | 雑音除去装置 |
JP5724361B2 (ja) * | 2010-12-17 | 2015-05-27 | 富士通株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
CN102300140B (zh) * | 2011-08-10 | 2013-12-18 | 歌尔声学股份有限公司 | 一种通信耳机的语音增强方法及降噪通信耳机 |
JP6163924B2 (ja) * | 2013-07-11 | 2017-07-19 | 株式会社Jvcケンウッド | 雑音検出装置、雑音検出方法、雑音低減装置、雑音低減方法、通信装置およびプログラム。 |
JP6489163B2 (ja) * | 2017-06-22 | 2019-03-27 | 株式会社Jvcケンウッド | 雑音低減装置、雑音低減方法およびプログラム。 |
JP7028311B2 (ja) * | 2018-03-12 | 2022-03-02 | 日本電信電話株式会社 | 学習用音声データ生成装置、その方法、およびプログラム |
WO2021166243A1 (ja) * | 2020-02-21 | 2021-08-26 | 日本電気株式会社 | 識別装置、識別装置の学習方法、及びコンピュータプログラム |
WO2024069964A1 (ja) * | 2022-09-30 | 2024-04-04 | Tdk株式会社 | ノイズ処理回路、信号処理装置、ノイズ処理方法、および記録媒体 |
-
2002
- 2002-04-15 JP JP2002111733A patent/JP4058987B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003308092A (ja) | 2003-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4058987B2 (ja) | 雑音除去装置及び雑音除去方法 | |
JP4842583B2 (ja) | 多感覚音声強調のための方法および装置 | |
JP5411936B2 (ja) | 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体 | |
US5924065A (en) | Environmently compensated speech processing | |
CN112447191A (zh) | 信号处理装置以及信号处理方法 | |
JP4958303B2 (ja) | 雑音抑圧方法およびその装置 | |
CA2607981C (en) | Multi-sensory speech enhancement using a clean speech prior | |
JP6464005B2 (ja) | 雑音抑圧音声認識装置およびそのプログラム | |
US20060165202A1 (en) | Signal processor for robust pattern recognition | |
JP2012155339A (ja) | 音声状態モデルを使用したマルチセンサ音声高品質化 | |
JP3632529B2 (ja) | 音声認識装置及び方法ならびに記録媒体 | |
JP2011203700A (ja) | 音声判別装置 | |
JP2013020252A (ja) | 音響処理装置、音響処理方法、及び音響処理プログラム | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
JP3907194B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2000132181A (ja) | 音声処理装置及び方法 | |
US7120580B2 (en) | Method and apparatus for recognizing speech in a noisy environment | |
JP3962445B2 (ja) | 音声処理方法及び装置 | |
JP2000122688A (ja) | 音声処理装置及び方法 | |
FI111572B (fi) | Menetelmä puheen käsittelemiseksi akustisten häiriöiden läsnäollessa | |
US9311916B2 (en) | Apparatus and method for improving voice recognition | |
JP2011039434A (ja) | 音声認識装置およびその特徴量正規化方法 | |
JP6439174B2 (ja) | 音声強調装置、および音声強調方法 | |
JP2001318687A (ja) | 音声認識装置 | |
JP4464797B2 (ja) | 音声認識方法、この方法を実施する装置、プログラムおよびその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050407 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101228 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111228 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111228 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121228 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |