JP2000029500A - 雑音抑圧装置及び当該装置を用いた音声認識システム - Google Patents

雑音抑圧装置及び当該装置を用いた音声認識システム

Info

Publication number
JP2000029500A
JP2000029500A JP10193177A JP19317798A JP2000029500A JP 2000029500 A JP2000029500 A JP 2000029500A JP 10193177 A JP10193177 A JP 10193177A JP 19317798 A JP19317798 A JP 19317798A JP 2000029500 A JP2000029500 A JP 2000029500A
Authority
JP
Japan
Prior art keywords
noise
spectrum
predicted
noise spectrum
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10193177A
Other languages
English (en)
Other versions
JP3900691B2 (ja
Inventor
Isamu Tateno
勇 立野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP19317798A priority Critical patent/JP3900691B2/ja
Publication of JP2000029500A publication Critical patent/JP2000029500A/ja
Application granted granted Critical
Publication of JP3900691B2 publication Critical patent/JP3900691B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声信号と雑音信号とが混在した入力信号か
ら雑音成分を適切に除去し、音声認識における認識率の
向上に寄与する。 【解決手段】 PTTスイッチ40がオフとなっている
期間(雑音区間)にフーリエ変換部12で算出されたス
ペクトルを予測雑音スペクトルとして、オーディオ機器
51などの状態から定まる車両状態に対応させて雑音記
憶部18に記憶しておく。そして、PTTスイッチ40
がオンとなっている期間(音声区間)に算出されたスペ
クトルから、そのスペクトルに含まれる雑音スペクトル
を雑音スペクトル推定部14が推定すると、音声制御部
15は、この推定した雑音スペクトルに類似する予測雑
音スペクトルを雑音記憶部18から読み出し、減算部1
6へ出力する。減算部16は、上記音声区間に算出され
たスペクトルから、音声制御部15によって出力される
予測雑音スペクトルを減算する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識等の音声
信号処理の前処理として用いる雑音抑圧に関し、特に、
認識対象となる音声信号と雑音信号とが混在した入力信
号から雑音成分を除去する技術に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来よ
り、例えばカーナビゲーションシステムにおける目的地
の設定などを音声によって入力できるようにする場合な
どに有効な音声認識装置が提案され、また実現されてい
る。このような音声認識装置においては、入力音声を予
め記憶されている複数の比較対象パターン候補と比較
し、一致度合の高いものを認識結果とするのであるが、
現在の認識技術ではその認識結果が完全に正確なものと
は限らない。これは、静かな環境下にあってもそうであ
るため、周囲に雑音が発生するような環境下ではなおさ
らである。特に、上述したカーナビゲーションシステム
などの実際の使用環境を考慮すると、雑音がないことは
想定しにくい。したがって、認識率の向上を実現する上
では、音声認識装置への入力の前処理として、認識に必
要な音声信号と雑音信号とが混在した入力信号から雑音
成分を除去する雑音抑圧を行なうことが望ましい。
【0003】このような雑音抑圧を行なってから音声認
識を行なうシステム構成として、例えば図6(a)のよ
うな音声認識システム200が考えられている。つま
り、音声用マイク201からは雑音が混入した音声信号
が入力される。一方、雑音用マイク202からは雑音の
みの雑音信号が入力される。音声用マイク201及び雑
音用マイク202からの入力信号は雑音抑圧装置203
へ入力され、雑音抑圧装置203で雑音抑圧された音声
信号が音声認識装置204へ転送される。また、この場
合、利用者がPTT(Push-To-Talk)スイッチ205を
押しながらマイク201を介して音声を入力するように
されている。そして、雑音抑圧装置203での雑音抑圧
は次のように行われる。
【0004】つまり、図6(b)に示すように、PTT
スイッチ205が押されると音声区間であるとして、雑
音抑圧装置203は音声用マイク201及び雑音用マイ
ク202からの入力信号を取り込む。しかし、音声用マ
イク201からの入力信号は「音声信号+雑音信号」と
なる。したがって、雑音用マイク202から入力された
「雑音信号」を、音声用マイク201からの「音声信号
+雑音信号」から差し引けば、雑音信号の抑圧された音
声信号を抽出することができるというものである。な
お、雑音の混入した音声信号から雑音信号を差し引く際
には、それぞれの信号をフーリエ変換した周波数スペク
トルやその周波数スペクトルの振幅である振幅スペクト
ルあるいは振幅スペクトルを2乗したパワースペクトル
の形式で差し引くことが考えられる。
【0005】しかしながら、図6として上述したような
手法では、雑音用マイク202が音声信号をひろわない
ように、音声用マイク201と雑音用マイク202とを
所定距離だけ離した場所に設置することが必要となり、
システム全体が煩雑となる。また、2本のマイクを設置
するため、マイクを設置する場所によっては、発生する
雑音の種類が異なる可能性がある。すなわち、音声用マ
イク201から音声信号と共に入力される雑音信号と雑
音用マイク202から入力される雑音信号とが同一であ
る保障はない。そのため、音声信号と雑音信号とが混在
した入力信号から雑音成分のみを適切に除去することが
できない可能性があった。
【0006】ここで雑音の種類が異なると、適切な雑音
成分の除去ができないことを説明する。図5は、種類の
異なる雑音の周波数スペクトルを例示する説明図である
が、図5(a)では、1キロHz、2キロHz、4キロ
Hz付近の周波数成分のレベル変化率が大きくなってお
り、図5(b)では、図5(a)と比べて、1キロH
z、2キロHz、4キロHz付近の周波数成分のレベル
変化率がさらに大きくなっている。また、図5(c)で
は、1.5キロHz、3キロHz、6キロHz付近の周
波数成分のレベル変化率が大きくなっており、図5
(d)では、0〜6キロHzの全ての周波数成分のレベ
ル変化率が大きくなっている。なお、レベル変化率とは
スペクトル波形における傾きの絶対値をいい、レベル変
化率の大きな部分は、図中ではグラフの縦軸方向に突出
した部分として示される。
【0007】このように種類の異なる雑音を周波数スペ
クトルとして見た場合、レベル変化率やそのレベル変化
率の大きくなる周波数などが異なってくる。従って、音
声信号と雑音信号とが混在する入力信号から雑音成分を
差し引く際、種類の異なる雑音のスペクトルを差し引く
と、却って音声信号のスペクトルに歪みを生じさせるこ
とになる。つまり、図6(a)に示すようなシステムで
は、音声用マイク201から入力される雑音と雑音用マ
イク202から入力される雑音が同じ種類のものでなけ
れば、適切な雑音抑圧ができないのである。
【0008】ところで、従来、1本のマイクを使用した
システムもあったが、この場合は、PTTスイッチのオ
ン・オフを検出して雑音区間、音声区間を区別し、雑音
区間において取り込んだ「雑音信号」を、音声区間にお
いて取り込んだ「音声信号+雑音信号」から差し引い
て、雑音信号の抑圧された音声信号を抽出する。しか
し、この手法も、音声区間において混入した雑音を直接
検知しているのではなく、音声区間の開始以前の雑音区
間にて取り込んだ雑音信号を基に音声区間における雑音
を推定し、雑音の混入した音声信号から、推定された雑
音信号を差し引いているに過ぎない。
【0009】従って、例えば自動車内というように周囲
の環境が時々刻々変化し、それに伴って発生する雑音の
種類も変化するような環境下では、雑音区間において入
力された雑音が音声区間において音声信号に混入した雑
音と同じ種類のものである保障がなく、この場合も、適
切に雑音信号を差し引くことができない可能性があっ
た。
【0010】本発明は、上述した問題点を解決するため
になされたものであり、音声信号と雑音信号とが混在し
た入力信号から雑音成分を適切に除去し、音声認識にお
ける認識率の向上に寄与することを目的とする。
【0011】
【課題を解決するための手段及び発明の効果】本発明の
雑音抑圧装置では、例えばマイクロフォンなどを介して
入力された入力信号を、フレーム分割手段が分割しフレ
ーム信号として切り出し、スペクトル算出手段が、その
フレーム信号からスペクトルを算出する。ここでスペク
トル算出手段が算出するスペクトルは、一例として、フ
レーム信号のフーリエ変換にて定義される周波数スペク
トルであることが考えられる。但し、フーリエ変換にて
定義されるものには限られず、例えばフーリエ級数展
開、Z変換、離散的フーリエ変換(DFT)にて定義さ
れるスペクトルを用いてもよい。また、上述した周波数
スペクトルの振幅成分である振幅スペクトルを用いても
よいし、その振幅スペクトルを2乗して得たパワースペ
クトルを用いてもよい。
【0012】上述した入力信号は、利用者からの音声信
号が入力される場合は、雑音の混入した音声信号である
し、利用者からの音声信号が入力されない場合は、雑音
のみの信号である。ここで特に、本発明の雑音抑圧装置
では、雑音スペクトル推定手段が、入力信号に基づいて
算出したスペクトルに現れる雑音成分の特徴に基づい
て、そのスペクトルに含まれる雑音のスペクトルを雑音
スペクトルとして推定する。なお、雑音スペクトルは、
繰り返し算出されるスペクトルにそれぞれ対応させて推
定してもよいし、所定数のスペクトル毎に、それらスペ
クトルに共通するものとして推定してもよい。例えば繰
り返し算出されるスペクトルに同じ種類の雑音のスペク
トルが含まれている場合は、雑音のスペクトルの周波数
成分がそれらスペクトルに共通して現出することが考え
られるため、複数のスペクトルに基づいて雑音スペクト
ルを推定すれば、より正確な雑音スペクトルを推定でき
る可能性が高くなる。逆に、雑音の種類が時々刻々変化
するような環境下では、相対的に早いタイミングで繰り
返し雑音スペクトルを推定することが望ましい。
【0013】このようにして、雑音スペクトル推定手段
によって雑音スペクトルが推定されると、減算手段が、
入力信号に基づいて算出したスペクトルから、その雑音
スペクトルを差し引く。従来より、雑音の混入した音声
信号に基づいて算出したスペクトルから雑音のスペクト
ルを差し引いて、音声認識装置での認識率を向上させる
ことが行われていたが、このときの雑音のスペクトル
は、上述したように別のマイクロフォンを介して入力さ
れた雑音信号に基づいて算出されたり、または、音声信
号が入力される以前に入力された過去の雑音信号に基づ
いて算出されたりしていたため、音声信号に混入した雑
音と同じ種類の雑音のスペクトルである保障がなかっ
た。従って、音声信号に混入した雑音を適切に抑圧でき
ないことがあり、音声認識率の低下につながっていた。
【0014】これに対して、本発明では、雑音スペクト
ル推定手段が、入力信号に基づいて算出したスペクトル
に現れる雑音成分の特徴に基づいて、当該スペクトルに
含まれる雑音スペクトルを推定し、減算手段が、この推
定された雑音スペクトルを減算する。すなわち、入力信
号に基づいて算出したスペクトルから雑音スペクトルを
直接的に検知し、これを差し引く。従って、音声信号に
混入した雑音を適切に抑圧できる可能性が高くなる。
【0015】ここで、音声区間の入力信号に基づいて算
出したスペクトルに現れる雑音成分の特徴に基づき、雑
音スペクトルを推定する具体的な手法を説明する。例え
ば請求項2に示すように、雑音スペクトル推定手段は、
入力信号に基づいて算出したスペクトルのレベル変化率
が所定の閾値以上となる周波数を検出し、当該検出した
周波数におけるスペクトル成分に基づいて雑音スペクト
ルを推定するよう構成することが考えられる。
【0016】これは、図5に例示したように雑音のスペ
クトルには特定の周波数成分にレベル変化率の大きな部
分が現れる可能性が高いという事実に着目したものであ
る。このような特定周波数成分のレベル変化率が大きな
雑音のスペクトルが重畳した音声信号のスペクトルに
は、図3(b)に示すように、特定の周波数成分にレベ
ル変化率の大きな部分が現出する。そして、図3(a)
に示すような雑音の混入していない理想的な音声信号の
スペクトルと比較すると、このレベル変化率の大きな部
分を差し引けば、理想的な音声信号のスペクトルに近づ
けられることが分かる。
【0017】従って、以下のようにして雑音スペクトル
を推定することができる。例えばスペクトル算出手段が
周波数スペクトルを算出する場合、その周波数スペクト
ルは、時間関数であるフレーム信号のフーリエ変換にて
定義され、周波数fの関数として表される。そのため、
周波数fで微分することによってスペクトルのレベル変
化率を求め、この変化率が所定の閾値以上となる周波数
を検出し、そして、当該周波数におけるスペクトル成分
に基づいて雑音スペクトルを推定する。ここでスペクト
ル成分に基づいて推定するとは、例えばそのスペクトル
成分そのものを有するスペクトルを雑音スペクトルとし
て推定することも考えられるし、あるいは、検出された
周波数以外の周波数におけるスペクトル成分を用いてそ
のスペクトル成分を逓倍補正し、その補正したスペクト
ル成分を有するスペクトルを雑音スペクトルとして推定
することも考えられる。例えば図4(a)に示すような
雑音の混入した音声信号のスペクトルがある場合にレベ
ル変化率が所定の閾値を越える周波数が、1kHz、2
kHz、4kHz付近の周波数である場合には、1,
2,4kHz付近のスペクトル成分に基づくスペクトル
成分を有する例えば図4(b)に示すようなスペクトル
を雑音スペクトルとして推定するという具合である。
【0018】このように、雑音のスペクトルは、特定の
周波数成分のレベルの変化率が大きくなることが多く、
雑音の混入した音声信号のスペクトルにレベルの変化率
が大きくなる周波数成分を現出させるという点に着目す
れば、音声信号に混入した雑音のスペクトルを推定する
ことができる。
【0019】なお、上述したように、周波数成分のレベ
ルの変化率だけによって、混入した雑音のスペクトルを
推定することもできるが、上述した閾値の設定は困難で
ある場合も考えられる。つまり、雑音のスペクトルのレ
ベル変化率が音声のスペクトルのレベル変化率とかけ離
れていればよいが、雑音のスペクトルと音声のスペクト
ルとのレベル変化率の差が小さい場合、それを判定する
ための閾値の設定は難しくなる。
【0020】そこで、請求項3に示すように、雑音スペ
クトル推定手段は、入力信号に基づいて算出したスペク
トルのレベル変化率が第1の閾値以上となる周波数を検
出すると共に、当該周波数の2n 倍(nは整数)の近傍
の周波数で、当該周波数におけるレベル変化率が第1の
閾値よりも小さな第2の閾値以上となっているものを検
出し、レベル変化率が第1又は第2の閾値以上となって
いる周波数におけるスペクトル成分に基づいて雑音スペ
クトルを推定するよう構成することが考えられる。
【0021】これは、雑音のスペクトルのレベル変化率
と周波数との関係に着目したものである。すなわち、雑
音のスペクトル中にレベル変化率が大きくなる周波数が
あると、その周波数を2n 倍した周波数でもレベル変化
率が大きくなることが多いという関係に着目したもので
ある。例えば図4に示すように、1kHz、その倍の2
kHz、さらにその倍の4kHz付近でレベル変化率が
大きくなるという具合である。この前提に立てば、相対
的にレベル変化率の大きな周波数があった場合、その周
波数の2n 倍の周波数でレベル変化率が大きくなってい
れば、その2n倍の周波数におけるレベル変化は、雑音
のスペクトルに起因するものとみなしてよい。そこで、
最初に第1の閾値以上となる周波数を検出し、次に第1
の閾値では判定できない雑音のスペクトルに起因するレ
ベル変化を、上述した周波数間の関係を用い、第1の閾
値よりも小さな第2の閾値で判定する。そして、このよ
うにして検出された周波数におけるスペクトル成分に基
づいて雑音スペクトルを推定する。ここでスペクトル成
分に基づいて雑音スペクトルを推定するというのは、請
求項2と同様である。この場合、周波数間の関係を用い
ることによって、閾値の設定が簡単になると共に、より
正確に雑音のスペクトルを推定することができる。
【0022】なお、ここで「nは整数」としたが、例え
ば図4に示す例では、0kHz<(周波数×2n )<6
kHzとなるようなnについて考えればよい。すなわ
ち、周波数×2n が考慮すべき周波数帯域に入るような
nに限定される。但し、nは負の整数であることも考え
られる。つまり、最初に検出された周波数の1/2倍の
周波数、1/4倍の周波数・・・も考慮するのである。
【0023】以上説明した雑音抑圧装置は雑音スペクト
ル推定手段が推定した雑音スペクトルを減算するもので
あったが、さらに、請求項4に示す構成を採用すること
も考えられる。すなわち、その構成は、請求項1〜3に
示した構成に加え、さらに、雑音信号に基づいて算出さ
れた雑音のスペクトルである予測雑音スペクトルを記憶
する予測雑音スペクトル記憶手段と、予測雑音スペクト
ル記憶手段に記憶された予測雑音スペクトルの中から、
雑音スペクトル推定手段によって推定された雑音スペク
トルとの類似度合の高いものを特定する予測雑音スペク
トル特定手段とを備え、減算手段は、雑音スペクトルに
代えて予測雑音スペクトル特定手段によって特定された
予測雑音スペクトルを、スペクトル算出手段によって算
出されたスペクトルから減算するよう構成されているこ
とを特徴とするものである。
【0024】上述した請求項1〜3の構成は、雑音の混
入した音声信号のスペクトルから雑音スペクトルを推定
し、推定した雑音スペクトルを減算するものであった。
しかしながら、音声信号のスペクトルから雑音スペクト
ルを推定する場合、真の雑音のスペクトルを推定するこ
とは困難である。そこで、雑音信号に基づいて算出され
た雑音のスペクトルを予測雑音スペクトルとして予測雑
音スペクトル記憶手段に記憶しておき、減算手段は、こ
の予測雑音スペクトルを減算するようにするのである。
【0025】このとき、予測雑音スペクトルを複数種類
記憶しておき、音声信号のスペクトルに重畳している雑
音のスペクトルに近いものを予測雑音スペクトル特定手
段が特定する。予測雑音スペクトル特定手段は、予測雑
音スペクトル記憶手段に記憶された予測雑音スペクトル
の中で、上述した雑音スペクトル推定手段によって推定
された雑音スペクトルとの類似度合が高いものを特定す
る。例えば、図4(b)に示す雑音スペクトルとの類似
度合が最も高い図4(c)に示す予測雑音スペクトルが
特定されるという具合である。
【0026】つまり、予測雑音スペクトルとして、音声
信号に混入する可能性の高い雑音のスペクトルを記憶し
ておけば、音声信号と雑音信号の混在する入力信号から
雑音成分のみを除去できる。その結果、音声認識率を飛
躍的に向上させることができる。
【0027】ところで、予測雑音スペクトルとして、音
声信号に混入する可能性の高い雑音のスペクトルを記憶
するため、入力信号として雑音のみの雑音信号が入力さ
れた場合に、この雑音信号に基づいてスペクトルを算出
し、算出したスペクトルを予測雑音スペクトルとして記
憶しておくようにすることが考えられる。例えば、本装
置が自動車内に設置されることを前提とすれば、請求項
5に示すような構成を採用することが考えられる。すな
わち、請求項4の構成に加え、さらに、車両状態を検出
する車両状態検出手段と、入力信号に音声が含まれてい
る音声区間と音声が含まれていない雑音区間とを判定す
る判定手段と、判定手段によって判定された雑音区間の
入力信号に基づいて算出したスペクトルを予測雑音スペ
クトルとし、車両状態検出手段によって検出される各車
両状態に対応させて記憶する予測雑音スペクトル記憶制
御手段を備える構成とすることが考えられる。
【0028】車両状態検出手段は、例えば車載オーディ
オ機器の音量、車速、窓の開閉状態、道路状態、車両の
振動状態といった車両状態を検出する。そして、入力信
号に音声が含まれている音声区間であるか音声が含まれ
ていない雑音区間であるかは、判定手段によって判定さ
れ、予測雑音スペクトル記憶制御手段が、雑音区間にお
ける入力信号に基づいて算出されたスペクトルである予
測雑音スペクトルを、上述した車両状態に対応させて記
憶する。
【0029】本発明では、実際に雑音区間において入力
された入力信号からスペクトルを算出し、予測雑音スペ
クトルとして記憶するのであるが、ここで特に、車両状
態に対応させて記憶することを特徴としている。この技
術思想の前提となるのは、車両状態が変われば発生する
雑音の種類が変わるという認識である。すなわち、自動
車内を考えた場合、各車両状態に対応して異なる種類の
雑音が、音声信号に混入すると考えられるため、各車両
状態に対応させて予測雑音スペクトルを記憶しておけ
ば、それら予測雑音スペクトルは、音声信号に混入する
可能性のある雑音のスペクトルとなるのである。
【0030】なお、予測雑音スペクトル記憶手段は、あ
る車両状態に対応する予測雑音スペクトルを一度記憶し
た後は、その車両状態となった場合であっても予測雑音
スペクトルを記憶しないように構成することもできる
し、同じように窓を開けた状態であっても周囲の環境が
街中であるのと郊外であるのとでは雑音の種類も変わっ
てくることが考えられるため、ある車両状態に対応する
予測雑音スペクトルを一度記憶した後であっても、記憶
した時から所定時間が経過している場合には、算出され
た予測雑音スペクトルを改めて記憶するように構成して
もよい。前者のような構成とすれば、各車両状態に対応
する予測雑音スペクトルを一度記憶すれば、その後は記
憶処理が実行されないため、処理負荷軽減の点で有効で
あるし、一方、後者のような構成とすれば、所定時間が
経過した後に予測雑音スペクトルが更新されるため、比
較的現在時点に近い過去の雑音信号に基づいて算出され
た予測雑音スペクトルが記憶される。従って、音声信号
に混入する雑音のスペクトルに類似した予測雑音スペク
トルが記憶される可能性が高くなり、雑音成分の除去が
効果的に行われる可能性がある。
【0031】また、上述した判定手段は、入力信号に音
声が含まれている音声区間であるか音声が含まれていな
い雑音区間であるかを判定するのであるが、これは入力
信号のパワーに基づいて判定することが考えられる。ま
た、音声を入力させる期間を発声者自身が指定するため
に設けられた入力期間指定手段によって指定された入力
期間を音声区間として判定するようにしてもよい。この
入力期間指定手段としては、例えばPTT(Push-To-Ta
lk)スイッチなどが考えられる。つまり、利用者がPT
Tスイッチを押しながら音声を入力すると、そのPTT
スイッチが押されている間に入力された音声を処理対象
として受け付けるのである。
【0032】なお、これまでは雑音抑圧装置としての構
成及びその作用効果について説明したが、上述した雑音
抑圧装置と、該雑音抑圧装置からの出力を、予め記憶さ
れている複数の比較対象パターン候補と比較して一致度
合の高いものを認識結果とする音声認識装置と、を備え
ることを特徴とする音声認識システムとして実現するこ
ともできる。
【0033】これら音声認識システムとして実現した場
合の効果については、雑音抑圧装置として実現した場合
と同様であるので、ここでは省略する。また、このよう
な音声認識システムは、種々の適用先が考えられるが、
例えばいわゆるカーナビゲーションシステム用として用
いることが考えられる。この場合には、例えば経路設定
のための目的地などが音声にて入力できれば非常に便利
である。また、ナビゲーションシステムだけでなく、例
えば音声認識システムを車載空調システム用として用い
ることも考えられる。この場合には、空調システムにお
ける空調状態関連指示を利用者が音声にて入力するため
に用いることとなる。
【0034】
【発明の実施の形態】図1は本発明の実施形態の音声認
識システムの概略構成を示すブロック図である。本音声
認識システムは、車載用であり、マイク30を介して入
力された音声に対して雑音抑圧を行なう雑音抑圧装置1
0と、その雑音抑圧装置10からの出力を、予め記憶さ
れている複数の比較対象パターン候補と比較して一致度
合の高いものを認識結果とする音声認識装置20とを備
えている。また、雑音抑圧装置10には、利用車が音声
を入力する場合に押下するPTT(PushーtoーTalk)スイ
ッチ40が接続されている。さらに、車両状態を検出す
るためのオーディオ機器51、速度センサ52、加速度
センサ53、ナビゲーション装置54及び窓開閉装置5
5が接続されている。
【0035】図1に示すように、雑音抑圧装置10は、
音声入力部11と、フレーム分割部12と、フーリエ変
換部13と、雑音スペクトル推定部14と、音声制御部
15と、減算部16と、逆フーリエ変換部17と、雑音
記憶部18とを備えている。以下各ブロックでの処理内
容について説明する。
【0036】音声入力部11は、マイク30を介して入
力されたアナログ音声信号を例えば10KHzのサンプ
リング周波数でデジタル信号に変換し、フレーム分割部
12へ出力する。フレーム分割部12は、音声入力部1
1からの入力信号の区切りを判断し、例えば「とうきょ
うと」、「ちよだく」というような単語毎のフレームに
切り出し、フーリエ変換部13へ出力する。フーリエ変
換部13では、フレーム毎の時間関数の入力信号に対し
てフーリエ変換を行い、入力信号の周波数スペクトルを
求める。この周波数スペクトルは、雑音スペクトル推定
部14及び減算部16へ出力される。なお、以下、周波
数スペクトルを単にスペクトルと記述する。
【0037】雑音スペクトル推定部14には上述したP
TTスイッチ40からの音声入力検出信号が入力される
ようになっており、この音声入力信号を受け取ると、雑
音スペクトル推定部14は、フーリエ変換部13からの
スペクトルに基づき、そのスペクトルに含まれる雑音の
スペクトルを推定する。そして、推定した雑音スペクト
ルを音声制御部15へ出力する。
【0038】ここで雑音スペクトル推定部14における
雑音スペクトルの具体的な推定方法を説明する。なお、
最初に、実際に測定した雑音信号に基づいて算出された
雑音のスペクトルを示す図5を参照し、雑音のスペクト
ルの特徴を説明する。図5に示すように、雑音の種類に
よって雑音のスペクトルの周波数成分は変わるのである
が、特に特定の周波数成分にレベル変化率の大きな部分
が現出することが多い。レベル変化率とはスペクトル波
形の傾きの絶対値であり、このレベル変化率が大きな部
分は、図で言えば、スペクトル波形がグラフ縦軸方向に
大きく突出した部分である。例えば図5(a)及び
(b)では、1k,2k,4kHz付近でレベル変化率
が大きくなっており、図5(c)では、1.5k,3
k,6kHz付近でレベル変化率が大きくなっており、
図5(d)では、0〜6kHzの全体でレベル変化率が
大きくなっている。
【0039】従って、雑音の混入した音声信号のスペク
トルにもこのような雑音スペクトルの特徴が現れること
が多い。例えば、図3(a)には、雑音の混入していな
い理想的な音声信号のスペクトルを示し、一方、図3
(b)には、雑音の混入した音声信号のスペクトルを示
した。図3(a)と図3(b)を比較すると分かるよう
に、雑音の混入した音声信号のスペクトルには、特定の
周波数成分にレベル変化率の大きな部分が現出してい
る。
【0040】また、雑音のスペクトルにレベル変化率が
大きくなる周波数があると、その周波数を2n 倍した周
波数でもレベル変化率が大きくなることが多い。例えば
図5(a)及び(b)では、1k,2k,4kHz付近
でレベルの変化率が大きくなっており、図5(c)で
は、1.5k,3k,6k付近でレベル変化率が大きく
なっている。
【0041】そこで、本実施形態では、雑音の混入した
音声信号のスペクトルのレベル変化率と周波数とに基づ
いて雑音スペクトルを推定している。具体的には、フー
リエ変換部13から出力される周波数fの関数であるス
ペクトルを周波数fで微分し、レベル変化率が第1の閾
値以上となる周波数f1を検出する。さらに、周波数f
1の2n 倍の周波数で、レベル変化率が第2の閾値以上
となる周波数f2を検出する。そして、レベル変化率が
第1又は第2の閾値以上となっている周波数f1,f2
におけるスペクトル成分を抽出し、検出された周波数f
1,f2以外の周波数におけるスペクトル成分を用いて
周波数f1,f2におけるスペクトル成分を補正し、そ
の補正したスペクトル成分を有する雑音スペクトルを推
定する。例えば、図4(a)に示した雑音の混入した音
声信号のスペクトルから図4(b)に示した雑音スペク
トルが推定される。
【0042】なお、この雑音スペクトル推定部14は、
音声が入力されたことを示す音声入力検出信号を受け取
っていない期間は、雑音スペクトルの推定処理を中止す
る。本実施形態においては、PTT(Push-To-Talk)ス
イッチ40が押されている場合にはこの音声入力検出信
号が出力される。つまり、本音声認識システムでは、利
用者がPTTスイッチ40を押しながらマイク30を介
して音声を入力するという使用方法である。そのため、
PTTスイッチ40が押されているということは利用者
が音声を入力しようとする意志をもって操作したことで
あるので、その場合、実際には音声入力があるかないか
を判断することなく、音声入力がされる期間(音声区
間)であると捉えて処理しているのである。
【0043】PTTスイッチ40の押下による音声入力
検出信号が出力されない場合は、音声が入力されない期
間(雑音区間)であると捉えて、フーリエ変換部13か
らのスペクトルをそのまま音声制御部15へ出力する。
次に音声制御部15について説明する。音声制御部15
には、オーディオ機器51からの音量、速度センサ52
からの車速、加速度センサ53からの車両の振動状態、
ナビゲーション装置54からの道路状態(トンネル、砂
利道など)、窓開閉装置55からの窓の開閉状態が入力
されるようになっており、音声制御部15は、これら5
つのデータに基づき車両状態を特定すると共に、以下説
明する処理を行う。この音声制御部15にも音声が入力
されたことを示す音声入力検出信号が入力され、音声入
力検出信号が入力されている場合(音声区間)と、音声
入力検出信号が入力されていない場合(雑音区間)とで
処理を変える。そこで、音声制御部15における処理を
以下分説する。
【0044】最初に、音声入力信号が入力されていない
場合である雑音区間の処理を説明する。この場合、上述
したように音量、車速、加速度、道路状態、窓の開閉状
態という5つのパラメータから定まる車両状態に対応す
る雑音のスペクトルが雑音記憶部18に記憶されている
か否かを判断し、記憶されていない場合には雑音スペク
トル推定部14から出力されたスペクトルを雑音記憶部
18に記憶する。これによって、雑音区間の入力信号に
基づいてフーリエ変換部13にて算出されたスペクトル
が、各車両状態に対応して記憶されることになる。な
お、雑音区間の入力信号に基づいてフーリエ変換部13
にて算出されたスペクトルを以下「予測雑音スペクト
ル」という。
【0045】続けて、音声入力検出信号が入力されてい
る場合である音声区間の処理を説明する。このとき、上
述したように雑音スペクトル推定部14からは、音声区
間の入力信号に基づいてフーリエ変換部13にて算出さ
れたスペクトルに含まれる雑音のスペクトルを推定した
雑音スペクトルが出力される。ここで音声制御部15
は、雑音スペクトル推定部14から出力された雑音スペ
クトルと、各車両状態に対応させて雑音記憶部18に記
憶されている各予測雑音スペクトルとの類似度合を計算
し、類似度合が所定値を越える予測雑音スペクトルを発
見すると、その予測雑音スペクトルを減算部16へ出力
する。例えば、図4(b)に示すような雑音スペクトル
に基づいて、複数の予測雑音スペクトルの中から図4
(c)に示すような予測雑音スペクトルを出力するとい
う具合である。
【0046】減算部16では、フーリエ変換部13から
出力された雑音の混入した音声信号のスペクトルから、
音声制御部15から出力された予測雑音スペクトルを減
算する。そして、逆フーリエ変換部17では、減算部1
6からの出力に対して逆フーリエ変換を施して時間関数
の信号を求める。逆フーリエ変換部17は、この信号を
音声認識装置20へ出力する。
【0047】このようにして、フレーム分割部12での
切り出し単位であるフレーム毎に得られる雑音の抑圧さ
れた時間関数の信号が順次音声認識装置20へ送られ
る。次に、この音声認識装置20について説明する。音
声認識装置20は、雑音抑圧装置10からの出力を用い
て一般的な分析手法である線形予測分析を行いパラメー
タを計算する。そして、予め計算しておいた認識対象語
彙の標準パターン(特徴パラメータ系列)と、計算され
たパラメータとの間で類似度計算を行なう。これらは周
知のDPマッチング法、HMM(隠れマルコフモデル)
あるいはニューラルネットなどによって、この時系列デ
ータをいくつかの区間に分け、各区間が辞書データとし
て格納されたどの単語に対応しているかを求める。そし
て、各認識対象語彙のうち類似度が所定値を越える語彙
を認識結果として図示しない各種アクチュエータ等の制
御部へ出力する。一方、各認識対象語彙のうち類似度が
所定値を越える語彙がない場合には、雑音抑圧装置10
の音声制御部15へ認識不可であることを通知する。
【0048】音声認識装置20から認識不可である旨の
通知を受けると、雑音抑圧装置10の音声制御部15
は、再び雑音スペクトル推定部14から出力された雑音
スペクトルに類似する別の予測雑音スペクトルを発見す
べく、各車両状態に対応させて雑音記憶部18に記憶さ
れている予測雑音スペクトルとの類似度合を計算する。
そして、類似度合が所定値を越える予測雑音スペクトル
が発見されると、その予測雑音スペクトルを減算部16
へ出力する。一方、類似度合が所定値を越える予測雑音
スペクトルが発見されない場合は、オーディオ機器51
及びナビゲーション装置54へ利用者からの再入力を促
すための指示信号を出力する。この指示信号に基づく指
示は、スピーカ60から音声として出力されると共に、
ナビゲーション装置54のモニタに文字として表示され
る。
【0049】以上、図1に基づいて各機能ブロックの説
明をしたが、さらに上述した各処理の流れを明確にする
ため、次に本音声認識システムでの処理を図2のフロー
チャートに基づいて説明する。まず最初のステップS1
00において、入力処理を行う。この処理は、図1に示
した音声入力部11及びフレーム分割部12の処理に相
当するものである。すなわち、マイク30を介して入力
されたアナログ音声信号を例えば10KHzのサンプリ
ング周波数でデジタル信号に変換し、変換されたデジタ
ル信号を例えば単語毎のフレームとして順次切り出す。
【0050】S110では、フーリエ変換を行う。この
処理は、図1中に示したフーリエ変換部13の処理に相
当する。ここでは、フレーム毎の入力信号に対してフー
リエ変換を行い、入力信号の周波数スペクトルを求め、
その周波数スペクトルの振幅成分を2乗して入力信号の
パワースペクトルを算出する。
【0051】S120では、車両状態を取得する。本実
施形態で車両状態とは、図1中に示したオーディオ機器
51からの音量、速度センサ52からの車速、加速度セ
ンサ53からの車両の振動状態、ナビゲーション装置5
4からの道路状態及び窓開閉装置55からの窓の開閉状
態という5つのパラメータによって定まる状態をいう。
従って、ここではこれら5つのパラメータを取得し、こ
の5つのパラメータから車両状態を特定する。なお、こ
の処理は、図1中の音声制御部15の処理に相当する。
【0052】S130では、PTTスイッチ40がオン
であるか否かを判断する。ここでPTTスイッチ40が
オンである場合(S130:YES)、すなわち音声が
入力される期間(音声区間)である場合には、S160
へ移行する。一方、PTTスイッチ40がオンでない場
合(S130:NO)、すなわち雑音のみが入力される
期間(雑音区間)である場合には、S140へ移行す
る。PTTスイッチ40がオフである場合に移行するS
140からの処理は、S110でフーリエ変換されたフ
レーム信号が雑音のみの雑音信号である場合に相当す
る。S140では、S120にて特定された車両状態に
対応して予測雑音スペクトルが既に雑音記憶部18に記
憶されているか否かを判断する。ここで予測雑音スペク
トルが既に記憶されていると判断されると(S140:
YES)、S150の処理を実行せずに、本雑音抑圧処
理を終了する。一方、予測雑音スペクトルがまだ記憶さ
れていないと判断されると(S140:NO)、S15
0にて、S110で算出されたスペクトルを予測雑音ス
ペクトルとして雑音記憶部18に記憶し、本雑音抑圧処
理を終了する。なお、S140及びS150の処理は音
声制御部15の処理に相当する。
【0053】PTTスイッチ40がオンである場合に移
行するS160からの処理は、S110でフーリエ変換
されたフレーム信号が雑音の混入した音声信号である場
合に相当する。S160では、S110にて算出された
スペクトルに含まれる雑音スペクトルを推定する。この
処理は、図1中に示した雑音スペクトル推定部14の処
理に相当する。
【0054】続くS170では、S160にて算出され
た雑音スペクトルに類似する予測雑音スペクトルが雑音
記憶部18に記憶されているか否かを判断するものであ
る。ここでは、雑音記憶部18に記憶されている予測雑
音スペクトルとS160にて算出された雑音スペクトル
との類似度合を順次算出しつつ、類似度合が所定値以上
であるか否かを判断する。ここで類似度合が所定値以上
の予測雑音スペクトルがあった場合(S170:YE
S)、S180へ移行する。一方、類似度合が所定値以
上の予測雑音スペクトルがなかった場合(S170:N
O)、S210へ移行する。
【0055】S180では、減算処理を行う。この処理
は、図1中の減算部16の処理に相当する。ここでは、
S110にて算出されたスペクトルから、S170にて
読み出された予測雑音スペクトルを減算する。その後、
逆フーリエ変換が行われ、時間関数の信号が音声認識装
置20へ出力される。
【0056】S190では、音声認識できたか否かを判
断する。この処理は、図1中の音声認識装置20におけ
る処理である。ここでは、上述したような周知の方法に
よって、予め記憶されている各認識対象語彙のうち類似
度が所定値を越える語彙があるか否かを判断する。ここ
で類似度が所定値を越える語彙があると判断された場合
(S190:YES)、S200にて、その語彙を認識
結果として図示しない制御部へ出力する。一方、類似度
が所定値を越える語彙がないと判断された場合(S19
0:NO)、S210へ移行する。
【0057】S170及びS190で否定判断された場
合に移行するS210では、雑音記憶部18に記憶され
ている予測雑音スペクトルについてS160にて算出さ
れた雑音スペクトルとの類似度合をすべて算出し類似判
定したか否かを判断する。ここで雑音記憶部18に記憶
されている予測雑音スペクトルについてすべて類似判定
している場合(S210:YES)、S220にて利用
者に再入力を促す。この処理は、音声制御部15が、オ
ーディオ機器51及びナビゲーション装置54へ利用者
からの再入力を促すための指示信号を出力するものであ
る。その後、本雑音抑圧処理を終了する。一方、雑音記
憶部18に記憶されている予測雑音スペクトルについて
類似判定をしていないものがある場合(S210:N
O)、S170からの処理を繰り返す。
【0058】次に、本実施形態の音声認識システムの発
揮する効果を説明する。なお、ここでの説明に対する理
解を容易にするため、最初に従来の問題点について簡単
に説明しておく。従来より、雑音の混入した音声信号に
基づいて算出したスペクトルから雑音のスペクトルを差
し引いて、音声認識装置での認識率を向上させることが
行われていたが、このときの雑音のスペクトルは、上述
したように別のマイクロフォンを介して入力された雑音
信号に基づいて算出されたり、または、音声信号が入力
される以前に入力された過去の雑音信号に基づいて算出
されたりしていたため、音声信号に混入した雑音と同じ
種類の雑音のスペクトルである保障がなかった。従っ
て、音声信号に混入した雑音とは異なる種類の雑音スペ
クトルを差し引いてしまうことがあり、音声信号に混入
した雑音を適切に抑圧できず、音声認識率の低下につな
がっていた。
【0059】そこで、本実施形態の音声認識システムで
は、PTTスイッチ40がオフとなっている期間(雑音
区間)に算出された雑音のスペクトルを予測雑音スペク
トルとして雑音記憶部18に記憶する際、取得した車両
状態(図2中のS120)に対応させて複数種類記憶し
ておく(図2中のS140及びS150)。そして、P
TTスイッチ40がオンとなっている期間(音声区間)
に算出された音声信号のスペクトルから、そのスペクト
ルに重畳した雑音スペクトルを推定し(図2中のS16
0)、この推定した雑音スペクトルに類似する予測雑音
スペクトルが雑音記憶部18に記憶されているか否かを
判断する(図2中のS170)。ここで、雑音記憶部1
8に記憶された予測雑音スペクトルに雑音スペクトルと
類似するものがあれば、その予測雑音スペクトルを、雑
音の混入した音声信号のスペクトルから減算し(図2中
のS180)、音声認識を行う(図2中のS190)。
【0060】つまり、雑音区間にて算出された雑音のス
ペクトルである予測雑音スペクトルを従来ように一律に
記憶しておくのではなく、車両状態が変われば発生する
雑音の種類が変わるという前提に立ち、車両状態に対応
させて記憶しておくのである。これによって、複数の種
類の雑音のスペクトルが予測雑音スペクトルとして記憶
されることになる。そして、音声区間にて算出された雑
音の混入した音声のスペクトルに含まれる雑音のスペク
トルを推定し、この雑音スペクトルに類似する予測雑音
スペクトルを差し引く。従って、全く種類の異なる雑音
のスペクトルを差し引いてしまう可能性がなくなり、音
声信号と雑音信号とが混在した入力信号から雑音成分の
みを適切に除去できる可能性が高くなる。結果として、
音声認識装置20における音声認識率の向上に寄与する
ことができる。
【0061】なお、本実施形態においては、フレーム分
割部12における切り出し機能が「フレーム分割手段」
に相当する。また、雑音スペクトル推定部14におい
て、音声入力検出信号の入力があると雑音の推定処理を
始めたり、音声制御部15において、音声入力検出信号
の入力があると予測雑音スペクトルの検索処理を行い、
音声入力検出信号の入力がないと雑音のスペクトルを予
測雑音スペクトルとして記憶する処理を実行している
が、これが「判定手段」による音声区間と雑音区間の判
定結果に基づく処理内容の変更に相当する。そして、フ
ーリエ変換部13が「スペクトル算出手段」に相当し、
雑音スペクトル推定部14が「雑音スペクトル推定手
段」に相当する。また、減算部16が「減算手段」に相
当し、雑音記憶部18が「予測雑音スペクトル記憶手
段」に相当し、オーディオ機器51、速度センサ52、
加速度センサ53、ナビゲーション装置54及び窓開閉
装置55が「車両状態検出手段」に相当し、音声制御部
15が「予測雑音スペクトル記憶制御手段」に相当し、
PTTスイッチ40が「入力期間指定手段」に相当す
る。
【0062】以上、本発明はこのような実施形態に何等
限定されるものではなく、本発明の主旨を逸脱しない範
囲において種々なる形態で実施し得る。 (1)例えば、上記実施形態においては、PTTスイッ
チ40のオン・オフを判定し、PTTスイッチがオフで
ある期間(雑音区間)の雑音のみの入力信号に基づいて
算出された雑音のスペクトルを予測雑音スペクトルとし
て雑音記憶部18に記憶する構成であった。このとき、
車両状態に対応する予測雑音スペクトルを一度記憶した
後は、その車両状態となった場合であっても予測雑音ス
ペクトルを記憶しないようになっていた(図2中のS1
40:YES)。すなわち、各車両状態に対応する予測
雑音スペクトルを一度記憶すれば、その後は記憶処理が
実行されないため、処理負荷軽減の点で有効である。
【0063】これに対して、ある車両状態に対応する予
測雑音スペクトルを一度記憶した後であっても、記憶し
た時から所定時間が経過している場合には、既に記憶さ
れている予測雑音スペクトルを更新するように構成して
もよい。なぜなら、同じように窓を開けた状態であって
も周囲の環境が街中であるのと郊外であるのとでは雑音
の種類も変わってくることが考えられ、なるべく現時点
に近い過去に記憶された雑音のスペクトルを予測雑音ス
ペクトルとした方がよいからである。このような構成と
すれば、所定時間が経過した後に予測雑音スペクトルが
更新されるため、より音声信号に混入した雑音に近い予
測雑音スペクトルが記憶される可能性が高くなり、雑音
成分の除去が効果的に行われる可能性が高くなる。
【0064】また、発生が予想される雑音が分かってい
る場合には、それら雑音のスペクトルを予測雑音スペク
トルとして予め雑音記憶部18に記憶しておいてもよ
い。この場合、PTTスイッチ40によって音声区間と
雑音区間を区別し、雑音区間において算出した雑音のス
ペクトルを記憶する必要がなくなるため、処理負荷軽減
という点で有利である。
【0065】(2)また、上記実施形態では、雑音スペ
クトル推定部14にて音声信号に混入した雑音のスペク
トルを雑音スペクトルとして推定し(図2中のS16
0)、雑音記憶部18に記憶された予測雑音スペクトル
の中でこの雑音スペクトルに類似するものを減算部16
にて減算するようにしていたが(図2中のS180)、
雑音スペクトル推定部14にて推定した雑音スペクトル
そのものを減算するようにしてもよい。この場合は、P
TTスイッチ40によって音声区間と雑音区間を区別
し、雑音区間において算出した雑音のスペクトルを記憶
する必要がなくなると共に、予測雑音スペクトルを記憶
するための雑音記憶部も必要なくなるため、処理負荷軽
減及び装置構成の簡略化を実現することができる。
【0066】(3)さらにまた、雑音スペクトル推定部
14における雑音スペクトルの推定方法について言え
ば、上記実施形態では、雑音の混入した音声のスペクト
ルのレベル変化率及び周波数に基づいて雑音を推定して
いたが、レベル変化率のみに基づいて雑音スペクトルを
推定することもできる。
【0067】(4)また、上記実施形態では、フレーム
信号をフーリエ変換した周波数スペクトルを用いて処理
を行っていたが、フーリエ変換して得た周波数スペクト
ルの振幅成分である振幅スペクトルや、その振幅成分を
2乗したパワースペクトルを用いて処理を行う構成とす
ることも考えられる。
【0068】(5)さらにまた、上記実施形態において
は、音声を入力させる期間を発声者自身が指定するため
に設けられたPTTスイッチ40を用い、利用者がPT
Tスイッチ40を押しながら音声を入力すると、そのP
TTスイッチ40が押されている間を音声区間とみなす
ようにしたが、実際の入力信号に基づいて音声区間と雑
音区間を判定するようにしてもよい。例えば、入力信号
のパワーに基づいて判定することが考えられる。
【図面の簡単な説明】
【図1】 実施形態の音声認識システムの概略構成を示
すブロック図である。
【図2】 実施形態の音声認識システムで実行される雑
音抑圧処理を示すフローチャートである。
【図3】 (a)は雑音の混入していない音声信号のス
ペクトルを例示し、(b)は雑音の混入した音声信号の
スペクトルを例示した説明図である。
【図4】 (a)は雑音の混入した音声信号のスペクト
ルを例示し、(b)は(a)のスペクトルに基づいて推
定された雑音スペクトルを例示し、(c)は予め記憶さ
れた予測雑音スペクトルの中で(b)のスペクトルに類
似するものを例示した説明図である。
【図5】 種類の異なる雑音のスペクトルを例示した説
明図である。
【図6】 従来の音声認識システムを例示する説明図で
ある。
【符号の説明】
10…雑音抑圧装置 11…音声入
力部 12…フレーム分割部 13…フーリ
エ変換部 14…雑音スペクトル推定部 15…音声制
御部 16…減算部 17…逆フー
リエ変換部 18…雑音記憶部 20…音声認
識装置 30…マイク 40…PTT
スイッチ 51…オーディオ機器 52…速度セ
ンサ 53…加速度センサ 54…ナビゲ
ーション装置 55…窓開閉装置 60…スピー
カ 200…音声認識システム 201…音声
用マイク 202…雑音用マイク 203…雑音
抑圧装置 204…音声認識装置 205…PT
Tスイッチ

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 雑音を含む入力信号を分割し、フレーム
    信号として切り出すフレーム分割手段と、 該フレーム分割手段によって切り出されたフレーム信号
    からスペクトルを算出するスペクトル算出手段と、 前記スペクトル算出手段によって算出されたスペクトル
    に現れる雑音成分の特徴に基づいて、当該スペクトルか
    ら前記雑音のスペクトルを雑音スペクトルとして推定す
    る雑音スペクトル推定手段と、 前記スペクトル算出手段によって算出されたスペクトル
    から、前記雑音スペクトル推定手段によって推定された
    前記雑音スペクトルを減算する減算手段とを備えること
    を特徴とする雑音抑圧装置。
  2. 【請求項2】 請求項1に記載の雑音抑圧装置におい
    て、 前記雑音スペクトル推定手段は、前記入力信号に基づい
    て算出したスペクトルのレベル変化率が所定の閾値以上
    となる周波数を検出し、当該検出した周波数におけるス
    ペクトル成分に基づいて前記雑音スペクトルを推定する
    よう構成されていることを特徴とする雑音抑圧装置。
  3. 【請求項3】 請求項1に記載の雑音抑圧装置におい
    て、 前記雑音スペクトル推定手段は、前記入力信号に基づい
    て算出したスペクトルのレベル変化率が第1の閾値以上
    となる周波数を検出すると共に、当該周波数の2n
    (nは整数)の近傍の周波数で、当該周波数におけるレ
    ベル変化率が前記第1の閾値よりも小さな第2の閾値以
    上となっているものを検出し、前記レベル変化率が前記
    第1又は第2の閾値以上となっている周波数におけるス
    ペクトル成分に基づいて前記雑音スペクトルを推定する
    よう構成されていることを特徴とする雑音抑圧装置。
  4. 【請求項4】 請求項1〜3のいずれかに記載の雑音抑
    圧装置において、 さらに、 雑音のスペクトルである予測雑音スペクトルを記憶する
    予測雑音スペクトル記憶手段と、 該予測雑音スペクトル記憶手段に記憶された予測雑音ス
    ペクトルの中から、前記雑音スペクトル推定手段によっ
    て推定された雑音スペクトルとの類似度合の高いものを
    特定する予測雑音スペクトル特定手段とを備え、 前記減算手段は、前記雑音スペクトルに代えて前記予測
    雑音スペクトル特定手段によって特定された予測雑音ス
    ペクトルを、前記スペクトル算出手段によって算出され
    たスペクトルから減算するよう構成されていることを特
    徴とする雑音抑圧装置。
  5. 【請求項5】 請求項4に記載の雑音抑圧装置におい
    て、 さらに、 車両に搭載されて用いられ、 車両状態を検出する車両状態検出手段と、 前記入力信号に音声が含まれている音声区間と前記音声
    が含まれていない雑音区間とを判定する判定手段と、 前記判定手段によって判定された前記雑音区間の入力信
    号に基づいて算出した前記スペクトルを前記予測雑音ス
    ペクトルとし、前記車両状態検出手段によって検出され
    る各車両状態に対応させて記憶する予測雑音スペクトル
    記憶制御手段を備えることを特徴とする雑音抑圧装置。
  6. 【請求項6】 請求項5に記載の雑音抑圧装置におい
    て、 前記予測雑音スペクトル記憶制御手段は、前記車両状態
    検出手段によって検出される車両状態に対応する予測雑
    音スペクトルが前記予測雑音スペクトル記憶手段に記憶
    されていない場合に、前記算出された予測雑音スペクト
    ルを記憶するよう構成されていることを特徴とする雑音
    抑圧装置。
  7. 【請求項7】 請求項5に記載の雑音抑圧装置におい
    て、 前記予測雑音スペクトル記憶制御手段は、前記車両状態
    検出手段によって検出される車両状態に対応する予測雑
    音スペクトルが前記予測雑音スペクトル記憶手段に既に
    記憶されている場合であっても、記憶されてから所定時
    間が経過している場合には、当該予測雑音スペクトルを
    更新するよう構成されていることを特徴とする雑音抑圧
    装置。
  8. 【請求項8】 請求項1〜7のいずれかに記載の雑音抑
    圧装置において、 前記判定手段は、前記入力信号のパワーに基づいて前記
    音声区間及び雑音区間を判定するよう構成されているこ
    とを特徴とする雑音抑圧装置。
  9. 【請求項9】 請求項1〜7のいずれかに記載の雑音抑
    圧装置において、 音声を入力させる期間を発声者自身が指定するために設
    けられた入力期間指定手段を備え、 前記判定手段は、前記入力期間指定手段によって指定さ
    れた入力期間を前記音声区間として判定するよう構成さ
    れていることを特徴とする雑音抑圧装置。
  10. 【請求項10】 請求項1〜9のいずれかに記載の雑音
    抑圧装置と、 該雑音抑圧装置からの出力を、予め記憶されている複数
    の比較対象パターン候補と比較して一致度合の高いもの
    を認識結果とする音声認識装置と、 を備えることを特徴とする音声認識システム。
JP19317798A 1998-07-08 1998-07-08 雑音抑圧装置及び当該装置を用いた音声認識システム Expired - Fee Related JP3900691B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19317798A JP3900691B2 (ja) 1998-07-08 1998-07-08 雑音抑圧装置及び当該装置を用いた音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19317798A JP3900691B2 (ja) 1998-07-08 1998-07-08 雑音抑圧装置及び当該装置を用いた音声認識システム

Publications (2)

Publication Number Publication Date
JP2000029500A true JP2000029500A (ja) 2000-01-28
JP3900691B2 JP3900691B2 (ja) 2007-04-04

Family

ID=16303593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19317798A Expired - Fee Related JP3900691B2 (ja) 1998-07-08 1998-07-08 雑音抑圧装置及び当該装置を用いた音声認識システム

Country Status (1)

Country Link
JP (1) JP3900691B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331195A (ja) * 2000-05-19 2001-11-30 Sony Corp 車載機器、カーナビゲーションシステムおよびモニタ装置
JP2007065122A (ja) * 2005-08-30 2007-03-15 Aisin Seiki Co Ltd 車載用音声認識装置の雑音抑圧装置
JP2008224960A (ja) * 2007-03-12 2008-09-25 Nippon Seiki Co Ltd 音声認識装置
JP2010039059A (ja) * 2008-08-01 2010-02-18 Yamaha Motor Co Ltd 発話区間検出装置
JP2010237269A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声認識装置、その方法及びそのプログラム
JP2011186384A (ja) * 2010-03-11 2011-09-22 Fujitsu Ltd 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
JP2012132950A (ja) * 2010-12-17 2012-07-12 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム
JP2013085196A (ja) * 2011-10-12 2013-05-09 Hoya Corp 固定パターンノイズ検出装置、除去装置、およびその方法
WO2015029362A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 機器制御方法及び機器制御システム
KR101516733B1 (ko) * 2014-06-27 2015-05-04 한국전자통신연구원 아날로그 무전기용 잡음 제거 장치 및 그 방법

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331195A (ja) * 2000-05-19 2001-11-30 Sony Corp 車載機器、カーナビゲーションシステムおよびモニタ装置
JP2007065122A (ja) * 2005-08-30 2007-03-15 Aisin Seiki Co Ltd 車載用音声認識装置の雑音抑圧装置
JP2008224960A (ja) * 2007-03-12 2008-09-25 Nippon Seiki Co Ltd 音声認識装置
JP2010039059A (ja) * 2008-08-01 2010-02-18 Yamaha Motor Co Ltd 発話区間検出装置
JP2010237269A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声認識装置、その方法及びそのプログラム
JP2011186384A (ja) * 2010-03-11 2011-09-22 Fujitsu Ltd 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
JP2012132950A (ja) * 2010-12-17 2012-07-12 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム
JP2013085196A (ja) * 2011-10-12 2013-05-09 Hoya Corp 固定パターンノイズ検出装置、除去装置、およびその方法
WO2015029362A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 機器制御方法及び機器制御システム
US9418665B2 (en) 2013-08-29 2016-08-16 Panasonic Intellectual Property Corporation Of America Method for controlling device and device control system
JPWO2015029362A1 (ja) * 2013-08-29 2017-03-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器制御方法及び機器制御システム
KR101516733B1 (ko) * 2014-06-27 2015-05-04 한국전자통신연구원 아날로그 무전기용 잡음 제거 장치 및 그 방법

Also Published As

Publication number Publication date
JP3900691B2 (ja) 2007-04-04

Similar Documents

Publication Publication Date Title
KR100870889B1 (ko) 음신호 처리 방법, 음신호 처리 장치 및 기록 매체
KR100574594B1 (ko) 잡음 보상되는 음성 인식 시스템 및 방법
US8768692B2 (en) Speech recognition method, speech recognition apparatus and computer program
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
EP1903560B1 (en) Sound signal correcting method, sound signal correcting apparatus and computer program
JP2012025270A (ja) 車両用の音量制御装置および音量制御装置用のプログラム
JP3900691B2 (ja) 雑音抑圧装置及び当該装置を用いた音声認識システム
JP3654045B2 (ja) 音声認識装置
JP4016529B2 (ja) 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置
JP3270866B2 (ja) 雑音除去方法および雑音除去装置
JP2007093635A (ja) 既知雑音除去装置
JP4026198B2 (ja) 音声認識装置
JP2007065122A (ja) 車載用音声認識装置の雑音抑圧装置
JP4325044B2 (ja) 音声認識システム
WO2018029071A1 (en) Audio signature for speech command spotting
JP2000322074A (ja) 音声入力区間判定装置,音声データ抽出装置,音声認識装置,車両用ナビゲーション装置及び入力用マイク
JP2000163099A (ja) 雑音除去装置、音声認識装置および記憶媒体
JPH11327593A (ja) 音声認識システム
JP3444198B2 (ja) 雑音抑圧装置及び該装置を用いた音声認識システム
JP2004198810A (ja) 音声認識装置
JP2009031809A (ja) 音声認識装置
JP3065739B2 (ja) 音声区間検出装置
JP4459729B2 (ja) 車載音声認識システム
JPH04230798A (ja) 雑音予測装置
WO2020065771A1 (ja) 音声感情認識装置および音声感情認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061225

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140112

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees