JP5387459B2 - 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム - Google Patents

雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム Download PDF

Info

Publication number
JP5387459B2
JP5387459B2 JP2010054345A JP2010054345A JP5387459B2 JP 5387459 B2 JP5387459 B2 JP 5387459B2 JP 2010054345 A JP2010054345 A JP 2010054345A JP 2010054345 A JP2010054345 A JP 2010054345A JP 5387459 B2 JP5387459 B2 JP 5387459B2
Authority
JP
Japan
Prior art keywords
stationary
estimation
signal
index
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010054345A
Other languages
English (en)
Other versions
JP2011186384A (ja
Inventor
智佳子 松本
直司 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010054345A priority Critical patent/JP5387459B2/ja
Publication of JP2011186384A publication Critical patent/JP2011186384A/ja
Application granted granted Critical
Publication of JP5387459B2 publication Critical patent/JP5387459B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、マイクロフォン等で収音した信号に含まれる雑音成分を低減する音声信号処理技術に関する。
話者の発声をマイクロフォン等で収音した収音信号に含まれる雑音成分を低減させる音声信号処理技術が幾つか知られており、そのうちのひとつに、スペクトルサブトラクション等と称されている雑音抑圧処理技術がある。この技術は、雑音モデルを収音信号に基づき推定し、この雑音モデルを収音信号から減じることで雑音成分を低減させるという技術である。
この雑音モデルを推定する技術について、幾つかの提案がされている。
例えば、そのうちのひとつは、音声データ中に含まれるノイズレベルを、所定時間幅毎に求めたパワーレベルの頻度分布から検出するという技術である。
また、例えば、そのうちの別のひとつは、雑音が混入した音声信号のスペクトル波形の傾きに基づいて、その雑音のスペクトルを推定するという技術である。
特開平10−319985号公報 特開2000−29500号公報
収音信号に連続的に含まれている雑音成分である定常性雑音成分についての雑音モデルの推定を行う場合を考える。例えば、雑踏の中で発声している話者の側を車が通過する状況を想定する。このような状況では、定常性雑音成分は雑踏に車のエンジン音が加わったものになる。この定常性雑音成分は、車が近づいてくるに従って徐々に大きくなっていき、話者の側を車が通過した後には、車が遠ざかるにつれて徐々に小さくなっていく。このような環境での収音された信号からに含まれる雑音成分の低減に用いる定常性雑音成分モデルは、車のエンジン音には追随し、その一方で話者の発声には引っ張られないようなものであることが極めて好ましい。
しかし、徐々にレベルが変化する定常性雑音成分と、非定常性信号成分(収音対象の音声成分と、定常性雑音成分以外の雑音成分とを含む、収音信号に単発若しくは断続的に含まれている信号成分)とを区別することは難しい。このため、従来の定常性雑音モデルの推定技術では、雑音追随性が悪かったり、あるいはその逆に、音声や非定常性信号成分の影響により、本来の定常性雑音成分よりもモデルの方が高レベルになってしまったりする傾向が見られた。
定常性雑音モデルに音声が含まれてしまうと、雑音低減処理(例えば前述したスペクトルサブトラクション等)を行う際に、音声を定常性雑音成分と誤ってしまうことになり、これは、雑音低減処理後の音声に歪をもたらす原因となる。
また、異なる位置のマイクロフォンでの収音信号の周波数スペクトル毎の位相差に基づき、話者の方向以外から到来する雑音成分を定常性雑音成分として推定するという技術がある。しかしながら、この技術では、話者と同一方向からの雑音は話者音声とみなされてしまうため、話者方向の定常性雑音モデルの精度が悪くなってしまう。その結果、話者と同一方向の定常性雑音成分は減らないという問題が生じる。
本発明は上述した問題に鑑みてなされたものであり、その解決しようとする課題は、発音体による発音を収音した収音信号に含まれる定常性雑音成分を精度良く推定することである。
本明細書で後述する雑音推定装置のひとつには、推定手段と制御手段とを有しているというものがある。このうち、推定手段は、発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定を行う。また、制御手段は、ある時刻での該収音信号である現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づいて該推定手段を制御する。ここで、該推定手段は、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、該現在収音信号に含まれる定常性雑音成分の推定を行う。また、該制御手段は、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該推定手段を制御する。
また、本明細書で後述する雑音推定方法のひとつには、発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定を行うというものがある。この方法では、まず、ある時刻での該収音信号である現在収音信号に含まれる定常性雑音成分の推定を、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、行う。そして、次に、該現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づき、該定常性雑音成分の推定を制御する。この推定の制御では、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるようにする。
また、本明細書で後述するプログラムのひとつには、発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定をコンピュータに行わせるためのものがある。このプログラムは、推定処理と制御処理とをコンピュータに行わせる。ここで、推定処理は、ある時刻での該収音信号である現在収音信号に含まれる定常性雑音成分の推定を、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、行う。また、制御処理は、該現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づき、該定常性雑音成分の推定を制御する。この推定の制御では、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるようにする。
本明細書で後述する定常雑音推定装置は、発音体による発音を収音した収音信号に含まれる定常性雑音成分を精度良く推定することができる。
雑音低減システムの構成図である。 雑音推定装置の第一の例の構成図である。 雑音推定装置の各部での信号波形である。 雑音推定装置として動作させることのできるコンピュータの構成例である。 コンピュータにより実行される制御処理の第一の例の処理内容を図解したフローチャートである。 非定常性指標に基づく制御を行わなかった場合の定常性雑音モデルの推定結果例である。 非定常性指標に基づく制御を行った場合の定常性雑音モデルの推定結果例である。 雑音推定装置の第二の例の構成図である。 位相差係数の設定手法の説明図である。 コンピュータにより実行される制御処理の第二の例の処理内容を図解したフローチャートである。 雑音推定装置の第一の例による定常性雑音モデルの推定結果例である。 雑音推定装置の第二の例による定常性雑音モデルの推定結果例である。 雑音推定装置の第三の例の構成図である。 コンピュータにより実行される制御処理の第三の例の処理内容を図解したフローチャートである。 コンピュータにより実行される制御処理の第四の例の処理内容を図解したフローチャートである。 コンピュータにより実行される制御処理の第五の例の処理内容を図解したフローチャートである。
まず図1について説明する。図1は、雑音低減システムの構成図である。
雑音低減システム1は、雑音推定装置2、雑音低減装置3、及びIFFT装置4を備えて構成されている。この雑音低減システム1には、マイクA5がマイクアンプ6を介して接続されており、更に、マイクB7がマイクアンプ8を介して接続されている。
マイクA5及びマイクアンプ6は、発音体である人9の発する音声を収音するための収音装置である。マイクアンプ6から出力される収音信号は、雑音低減システム1に備えられている、雑音推定装置2及び雑音低減装置3に送られる。
雑音推定装置2は、収音信号に含まれる定常性雑音成分の推定を行い、その推定結果である定常性雑音モデルを出力する。
IFFT(Inverse Fast Fourier Transform)装置4は高速フーリエ逆変換を行う装置であり、雑音推定装置2から出力される定常性雑音モデルを、周波数領域で表現されているものから時間領域で表現するものへと変換して雑音低減装置3に送る。なお、雑音推定装置2内にIFFT装置4を備えるようにして、周波数領域で表現されている定常性雑音モデルを雑音推定装置2内で時間領域での表現に変換してから雑音低減装置3に送るようにしてもよい。あるいは、雑音低減装置3内にIFFT装置4を備えるようにして、雑音推定装置2から受け取った、周波数領域で表現されている定常性雑音モデルを、雑音低減装置3内で時間領域での表現に変換するようにしてもよい。
雑音低減装置3は、雑音推定装置2から得た定常性雑音モデルを収音信号から減算する音声信号処理を行うことによって、その収音信号に含まれる定常性雑音成分を低減させ、その処理結果を、雑音低減システム1の出力信号として出力する。
マイクB7及びマイクアンプ8は、マイクA5及びマイクアンプ6が収音するものと同一の音を収音するための副収音装置であり、人9の発する音声を、マイクA5とは異なる位置で収音する。マイクアンプ8から出力される副収音信号は、雑音低減システム1に備えられている、雑音推定装置2に送られる。雑音推定装置2は、この副収音信号と前述した収音信号とを用いて、当該収音信号に含まれる定常性雑音成分の推定を行う。但し、後述する雑音推定装置2の構成のうち、次に説明する第一の例のみは、副収音信号を用いずに、収音信号のみを用いて、当該定常性雑音成分の推定を行う。従って、この場合には、マイクB7及びマイクアンプ8は不要である。
なお、マイクA5及びマイクB7の距離は、両マイクでそれぞれ測定された雑音が著しくは変わらず、かつ、位相差測定可能な距離であればよい。
次に図2について説明する。図2は、雑音推定装置2の第一の例の構成図である。この雑音推定装置2は、FFT部11、非定常性指標算出部12、定常性雑音モデル更新係数設定部13、及び定常性雑音モデル推定部14を備えて構成されている。
FFT(Fast Fourier Transform)部11は、高速フーリエ変換を行うものであり、収音信号の所定のサンプル数分の信号波形を周波数スペクトルに変換して非定常性指標算出部12に送る。なお、この高速フーリエ変換のために行う収音信号のサンプリングでは、人9の発声音を表現するのに十分なサンプリング間隔で行うものとする。
なお、非定常性指標算出部12、定常性雑音モデル更新係数設定部13、及び定常性雑音モデル推定部14は、収音信号についてそれぞれが行う処理を、収音信号の周波数スペクトル毎に行う。
非定常性指標算出部12は非定常性指標の算出を行う。非定常性指標とは、ある時刻での収音信号(以降の説明では、便宜上、この収音信号を「現在収音信号」と称することとする)に含まれる非定常性信号成分の推定割合を数値の大きさで表した指標である。なお、本願において、収音信号に含まれる非定常性信号成分とは、定常性雑音成分と、収音装置による収音対象である発音体の発音(本実施形態においては人9の発声音)との両者を含むものとする。
非定常性指標算出部12による非定常性指標の算出手法については後述する。
定常性雑音モデル更新係数設定部13は、定常性雑音モデルの推定を行う際に使用する定常性雑音モデル更新係数を、非定常性指標に基づいて設定することで、定常性雑音モデル推定部14による定常性雑音モデルの推定を制御する。
定常性雑音モデル推定部14は、収音信号に含まれる定常性雑音成分の推定を行う。本実施形態では、定常性雑音モデル推定部14は、現在収音信号を得た時刻よりも過去の収音信号(以降の説明では、便宜上、この収音信号を「過去収音信号」と称することとする)に基づき推定した定常性雑音成分の推定結果を、現在収音信号を用いて更新する。次に、このようにして行う、現在収音信号に含まれる定常性雑音成分の推定手法について、更に説明する。
定常性雑音モデル推定部14は、時刻t(但し、tは0以上の整数)における現在収音信号(周波数スペクトルiの振幅成分)Si(t)に含まれる定常性雑音成分の推定結果Ni(t)を、下記の[1]式により算出する。
Ni(t)=γ×Si(t)+(1−γ)×Ni(t−1)………[1]
なお、この[1]式において、γは定常性雑音モデル更新係数であり、0≦γ<1とする。また、Ni(t−1)は、過去収音信号に基づき推定した定常性雑音成分の推定結果である。つまり、この式[1]は、Ni(t−1)を、現在収音信号Si(t)を用いて更新して、現在収音信号に含まれる定常性雑音成分の推定結果Ni(t)を得る式である。より具体的には、この式[1]は、Si(t)とNi(t−1)とをγ:(1−γ)の割合(「第一の割合」)で加算した加算結果を、現在収音信号に含まれる定常性雑音成分の推定結果Ni(t)とする式である。なお、Ni(−1)=0とする。
この[1]式において、定常性雑音モデル更新係数γを以下のようにして設定する。すなわち、現在収音信号における定常性雑音成分の割合が大きいほど、定常性雑音モデル更新係数γを「1」に近い値とする。すると、[1]式により算出される定常性雑音成分Ni(t)は現在収音信号Si(t)に近い値となる。その一方、現在収音信号における定常性雑音成分の割合が小さい(すなわち、非定常性信号成分の割合が大きい)ほど、定常性雑音モデル更新係数γを「0」に近い値とする。すると、[1]式により算出される現在収音信号に含まれる定常性雑音成分Ni(t)は、過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)に近い値となる。
従って、定常性雑音モデル更新係数設定部13が、以上のように、定常性雑音モデル更新係数γの値を、現在収音信号における、定常性雑音成分の割合若しくは非定常性信号成分の割合に基づき設定すれば、定常性雑音成分の推定を[1]式により行うことができる。定常性雑音モデル更新係数設定部13は、定常性雑音モデル更新係数γをこのように設定するために、前述した非定常性指標を用いる。
ここで、非定常性指標算出部12により行われる、この非定常性指標の算出について説明する。
まず、前述した式[1]において、定常性雑音モデル更新係数γを、予め定めておいた定数値αとして、現在収音信号に含まれる定常性雑音成分の仮推定が行われる。すなわち、下記の式[2]の値が計算される。
VNi(t)=α×Si(t)+(1−α)×Ni(t−1)………[2]
但し、このαの値は、t=0のときは「1」とする。また、t>0のときは、αの値は0<α<1とし、マイクA5の特性や設置環境、定常性雑音の種類等に応じて具体的な数値を設定する(αを例えば「0.1」に設定する)。また、実際に雑音低減システムを設置して動作させて、定常性雑音低減効果が良好な定数αの値を実験により求めるようにしてもよい。
次に、式[2]により求めた、現在収音信号に含まれる定常性雑音成分の仮推定値VNi(t)を、前述した式[1]を用いて過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)で除算する計算が行われる。すなわち、下記の式[3]の値が計算されて、ASIi(t)が算出される。
ASIi(t)=VNi(t)/Ni(t−1)………[3]
従って、この式[2]及び[3]を計算することで、Si(t)とNi(t−1)とをα:(1−α)の割合(「第二の割合」)で加算した結果を、Ni(t−1)で除算した値がASIi(t)として算出される。
式[3]を参照すれば、現在収音信号に含まれる定常性雑音成分の仮推定値が、過去収音信号に基づき推定した定常性雑音成分の推定結果に比べて大きいほど、ASIi(t)は大きくなることが分かる。
また、式[2]を参照すれば、この仮推定値がこの推定結果に比べて大きくなるのは、αの値が定数であるので、現在収音信号Si(t)が大きい値であった場合であることは明らかである。しかし、本来は、定常性雑音成分のレベルの変化は、この時間tの時間間隔程度ではそれほど大きくはならないはずである。(もしも、現在収音信号Si(t)が定常性雑音成分のみであり、その成分のレベルが過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)に等しければ、ASIi(t)は「1」となることは式[2]及び[3]から明らかである。)従って、現在収音信号Si(t)が大きい値になった場合には、その現在収音信号Si(t)は、定常性雑音成分に比べて非定常性信号成分の割合が大きいと推定することができる。
以上のことから、ASIi(t)は、現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表しているといえるので、従って、前述した非定常性指標であるいえる。本実施形態において、非定常性指標算出部12は、上記の式[2]及び[3]を計算することによって求まるASIi(t)を、非定常性指標として算出する。
定常性雑音モデル更新係数設定部13は、このようにして非定常性指標算出部12により算出される非定常性指標の値と、所定の閾値との大小比較を行う。そして、この非定常性指標の値が当該閾値よりも小さい場合には、現在収音信号に含まれる非定常性信号成分の割合は小さいとの判定を下す。本実施形態においては、このように判定した場合には、前述した式[1]における定常性雑音モデル更新係数γを、式[2]で定常性雑音成分の仮推定に用いたαと等しい値に設定する。この結果、式[1]において、Si(t)とNi(t−1)とを加算するときの加算割合(γ:(1−γ)、「第一の割合」)が、式[2]におけるSi(t)とNi(t−1)とを加算するときの加算割合(α:(1−α)、「第二の割合」)に一致する。
一方、この非定常性指標の値が当該閾値以上である場合には、現在収音信号に含まれる非定常性信号成分の割合は大きいとの判定を下す。本実施形態においては、このように判定した場合には、前述した式[1]における定常性雑音モデル更新係数γを、非定常性指標の値が当該閾値よりも小さい場合に設定する値よりも小さい値に設定する。本実施形態においては、このように判定した場合には、定常性雑音モデル更新係数γを、式[2]で定常性雑音成分の仮推定に用いたαよりも小さい値に設定する。例えば、αが「0.1」に設定されている場合には、γを例えば「0.01」に設定する。
現在収音信号に含まれる定常性雑音成分Ni(t)の推定を、前掲した[1]式に従い、過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)に対する、現在収音信号Si(t)を用いた更新により行うことは既に説明した。従って、γを上述したように小さくして設定すれば、この更新による定常性雑音成分Ni(t)の推定結果の変化量が少なくなることは、[1]式から明らかである。
但し、t=0のときは、前述したように、Ni(−1)=0としたから、前掲した[3]式でASIi(t)を算出することができない。また、この場合におけるNi(−1)は、定常性雑音成分の推定結果としても明らかに不適切である。そこで、この場合には、非定常性指標の値が当該閾値よりも小さい場合と同様に、定常性雑音モデル更新係数γを、定数αと等しい値に設定するようにする。
定常性雑音モデル更新係数設定部13は、以上のようにして設定した定常性雑音モデル更新係数γを定常性雑音モデル推定部14に送って前述したγ:(1−γ)の割合(「第一の割合」)を変更させることで、定常性雑音モデル推定部14による定常性雑音モデルの推定を制御する。
なお、非定常性指標の値と大小比較を行う閾値は、例えば以下のようにして値を決定する。
図3について説明する。図3は、雑音推定装置2の各部での信号波形例である。
図3の波形例は、いずれも収音信号の300Hz付近におけるスペクトルについての波形であり、その途中で、人9による発声が開始されている。なお、図3において、[A]は現在収音信号Si(t)の振幅スペクトルであり、[B]は、上記[2]式による現在収音信号に含まれる定常性雑音成分の仮推定値VNi(t)の波形であり、[C]は、上記[3]式による非定常性指標ASIi(t)の波形である。
この図3の波形における「雑音のみの区間」を参照すると、[C]の波形では、非定常性指標ASIi(t)がほぼ「1」に近い値となっていることが分かる。前述した閾値は、例えば、実際に雑音低減システムを設置してこのように動作させて、この「雑音のみの区間」での非定常性指標ASIi(t)の最大値を、少し(例えば「0.1」程度)大きくした値に設定する。
なお、雑音推定装置2の動作、すなわち、収音信号に含まれる定常性雑音成分の推定を行い、その推定結果である定常性雑音モデルを出力する動作を、標準的な構成のコンピュータに行わせることもできる。
ここで、図4について説明する。図4には、雑音推定装置2として動作させることのできるコンピュータ20の構成例が図解されている。
このコンピュータ20は、MPU21、ROM22、RAM23、ハードディスク装置24、入力装置25、表示装置26、インタフェース装置27、及び記録媒体駆動装置28を備えている。なお、これらの構成要素はバス29を介して接続されており、MPU21の管理の下で各種のデータを相互に授受することができる。
MPU(Micro Processing Unit)21は、このコンピュータ20全体の動作を制御する演算処理装置である。
ROM(Read Only Memory)22は、所定の基本制御プログラムが予め記録されている読み出し専用半導体メモリである。MPU21は、この基本制御プログラムをコンピュータ20の起動時に読み出して実行することにより、このコンピュータ20の各構成要素の動作制御が可能になる。
RAM(Random Access Memory)23は、MPU21が各種の制御プログラムを実行する際に、必要に応じて作業用記憶領域として使用する、随時書き込み読み出し可能な半導体メモリである。
ハードディスク装置24は、MPU21によって実行される各種の制御プログラムや各種のデータを記憶しておく記憶装置である。
MPU21は、ハードディスク装置24に記憶されている所定の制御プログラムを読み出して実行することにより、後述する制御処理を行えるようになる。
入力装置25は、例えばキーボード装置やマウス装置であり、コンピュータ20の使用者により操作されると、その操作内容に対応付けられている使用者からの各種情報の入力を取得し、取得した入力情報をMPU21に送付する。
表示装置26は例えば液晶ディスプレイであり、MPU21から送付される表示データに応じて各種のテキストや画像を表示する。
インタフェース装置27は、このコンピュータ20に接続される各種機器との間での各種データの授受の管理を行う。より具体的には、インタフェース装置27は、マイクA5からマイクアンプ6を経て送られてくる収音信号のアナログ−デジタル変換や、雑音推定装置2の出力である定常性雑音モデルデータの後続機器への送信などを行う。
記録媒体駆動装置28は、可搬型記録媒体30に記録されている各種の制御プログラムやデータの読み出しを行う装置である。MPU21は、可搬型記録媒体30に記録されている所定の制御プログラムを、記録媒体駆動装置28を介して読み出して実行することによって、後述する各種の制御処理を行うようにすることもできる。なお、可搬型記録媒体30としては、例えばCD−ROM(Compact Disc Read Only Memory)やDVD−ROM(Digital Versatile Disc Read Only Memory)などがある。
このようなコンピュータ20を雑音推定装置2として動作させるには、まず、後述する雑音推定処理の処理内容をMPU21に行わせるための制御プログラムを作成する。作成された制御プログラムはハードディスク装置24若しくは可搬型記録媒体30に予め格納しておく。そして、MPU21に所定の指示を与えてこの制御プログラムを読み出させて実行させる。こうすることで、MPU21が、FFT部11、非定常性指標算出部12、定常性雑音モデル更新係数設定部13、及び定常性雑音モデル推定部14として機能し、このコンピュータ20による雑音推定装置2の機能の提供が可能になる。
なお、同様にして制御プログラムを作成して実行させることで、このようなコンピュータ20を、雑音低減装置3やIFFT装置4として動作させることも可能である。更には、同様にして制御プログラムを作成してコンピュータ20に実行させることで、雑音推定装置2、雑音低減装置3、及びIFFT装置4の機能を並行して提供させるようにすることで、雑音低減システム1をコンピュータ20で構成することも可能である。
次に図5について説明する。図5は、図4のコンピュータ20におけるMPU21により行われる雑音推定処理の第一の例の処理内容を図解したフローチャートである。
この処理が開始されると、まず、S101において、FFT処理が行われる。この処理は、収音信号の所定のサンプル数分の信号波形を周波数スペクトルへと変換する高速フーリエ変換処理である。なお、この処理は、FFT部11としてMPU21が機能するための処理である。
上述したS101に続くS102からS108にかけての処理は、S101の処理により得られた収音信号の周波数スペクトル毎に行う。
まず、S102からS104にかけての処理は、非定常性指標算出部12としてMPU21が機能するための処理である。
S102では、前述した定数αを、前述したようにして定めた所定の値(図5では「0.1」)に設定する処理が行われる。次に、S103において、設定された定数αの値を用いて、前掲した[2]式を計算して、現在収音信号に含まれる定常性雑音成分の仮推定値VNi(t)を算出する処理が行われる。そして、続くS104において、前掲した[3]式を計算して、非定常性指標ASIi(t)を算出する処理が行われる。
S105からS107にかけての処理は、定常性雑音モデル更新係数設定部13としてMPU21が機能するための処理である。
まず、S105では、S104の処理によって算出された非定常性指標ASIi(t)と、前述した所定の閾値との大小比較を行い、非定常性指標ASIi(t)が当該閾値よりも小さいか否かを判定する処理が行われる。ここで、非定常性指標ASIi(t)が当該閾値よりも小さいと判定されたとき(判定結果がYesのとき)にはS106に処理を進める。一方、非定常性指標ASIi(t)が当該閾値以上であると判定されたとき(判定結果がNoのとき)にはS107に処理を進める。
S106では、前述した定常性雑音モデル更新係数γの値を、行われの処理で値を設定した定数αとする処理が行われ、その後はS108に処理を進める。
S107では、前述した定常性雑音モデル更新係数γを、上述したS107の処理で設定する値よりも小さい値に設定する。本実施形態においては、このように判定した場合には、定常性雑音モデル更新係数γを、式[2]で定常性雑音成分の仮推定に用いたαよりも小さい値に設定する。図5では、αを「0.1」に設定しているので、γを、「0.1」よりも小さい値として、例えば「0.01」に設定する。
次に、S108では、S106の処理若しくはS107の処理により設定された定常性雑音モデル更新係数γの値を用いて前掲した[1]式を計算して、現在収音信号に含まれる定常性雑音成分の推定結果Ni(t)を算出して出力する処理が行われる。こうして収音信号の周波数スペクトル毎に得られた定常性雑音成分の推定結果が、定常性雑音モデルである。
以上のS108の処理を終えると図5の雑音推定処理は完了し、以降、この雑音推定処理が繰り返し実行される。
MPU21が以上の雑音推定処理を行うことで、コンピュータ20が雑音推定装置2として機能し、収音信号に含まれる定常性雑音成分の推定が行われて、その推定結果である定常性雑音モデルが得られる。
以上のように動作する雑音推定装置2による定常性雑音成分の推定結果例を提示する。図6Aは、非定常性指標に基づく制御を行うことなく定常性雑音モデルの推定を行った場合(定常性雑音モデル更新係数γを固定値とした場合)の波形である。一方、図6Bは、非定常性指標に基づく制御を行って定常性雑音モデルの推定を行った場合(定常性雑音モデル更新係数γを非定常性指標の値に基づき変更した場合)の波形である。
図6A及び図6Bの各々において、黒線の波形は、収音信号の約300Hzのスペクトルであり、白線の波形は、その周波数での定常性雑音モデルである。なお、横軸は時間の経過を表しており、縦軸はレベルの大きさを表している。
図6A及び図6Bにおける囲み部分に注目すると、図6Aでは、白線の波形が黒線の波形に似た形状になっており、定常性雑音モデルに、収音信号に含まれる非定常性信号である、人9の発声音が含まれてしまっている。これに対し、図6Bでは、白線の波形と黒線の波形とは図6Aの波形ほどは似ておらず、従って、非定常性信号が定常性雑音モデルから抑制されていることが分かる。
次に図7について説明する。図7は雑音推定装置2の第二の例の構成図である。この雑音推定装置2を図2に図解した第一の例と比較すると、第一の例の構成に対してFFT部31及び位相差算出部32が追加されている点が相違している。
FFT部11は、前述した第一の例におけるものと同一のものであり、収音信号の所定のサンプル数分の信号波形を周波数スペクトルに変換して非定常性指標算出部12に送る。
FFT部31は、高速フーリエ変換を行うものであり、副収音信号の所定のサンプル数分の信号波形を周波数スペクトルに変換し、その各スペクトルの位相情報を位相差算出部32に送る。なお、この高速フーリエ変換のために行う副収音信号のサンプリングは、収音信号のものと同一のタイミングで行うようにし、FFT部31により得られる副収音信号の各スペクトルの周波数がFFT部11により得られる収音信号のものと一致するようにする。
なお、非定常性指標算出部12、定常性雑音モデル更新係数設定部13、定常性雑音モデル推定部14、及び位相差算出部32は、収音信号及び副収音信号についてそれぞれが行う処理を、収音信号の周波数スペクトル毎に行う。
非定常性指標算出部12は前述した第一の例におけるものと同一のものであり、非定常性指標の算出を行う。
位相差算出部32は、副収音信号の位相情報をFFT部31から受け取ると共に、収音信号についての位相情報をFFT部11から受け取る。位相差算出部32は、受け取った位相情報の差を算出して、収音信号と副収音信号との位相差を獲得し、得られた位相差の情報を定常性雑音モデル更新係数設定部13に送る。
定常性雑音モデル更新係数設定部13は、前述した第一の例と同様に、非定常性指標算出部12により算出される非定常性指標の値と、所定の閾値との大小比較を行う。そして、この非定常性指標の値が当該閾値よりも小さい場合には、前述した第一の例と同様に、現在収音信号に含まれる非定常性信号成分の割合は小さいとの判定を下す。従って、本実施形態においては、このように判定した場合には、前述した定常性雑音モデル更新係数γを、式[2]で定常性雑音成分の仮推定に用いた定数αと等しい値に設定する。
一方、定常性雑音モデル更新係数設定部13は、この非定常性指標の値が当該閾値以上である場合には、前述した第一の例と同様に、前述した定常性雑音モデル更新係数γを、非定常性指標の値が当該閾値よりも小さい場合に設定する値よりも小さい値に設定する。但し、この第二の例では、この定常性雑音モデル更新係数γの値を小さくする程度を、位相差算出部32から受け取った位相差情報に基づいて設定する。
位相差係数βの設定について、図8を参照しながら説明する。なお、位相差係数βは、定常性雑音モデル更新係数γの値を小さくする程度を決定する係数である。位相差係数βを設定する場合には、定常性雑音モデル更新係数γは、下記の式[4]を計算することで算出される。
γ=α×β………[4]
図8のグラフは、収音信号及び副収音信号のある周波数のスペクトルにおける位相差情報と位相差係数βとの対応関係を描いたものである。このグラフにおいて、横軸は、位相差算出部32から受け取る位相差情報であり、縦軸は位相差係数βである。
図8のグラフでは、収音信号と副収音信号との位相差が所定の範囲内である場合には、位相差係数βを、小さい値、より具体的には、「0」以上で「0」に近い値(図8のグラフでは「0.1」)としている。ここで、この範囲は、発音体である人9とマイクA5及びマイクB7との位置関係を予め定めた状態で人9の同一の発生音を両者が各々収音したときに収音信号と副収音信号との間に生じる位相差を中心とする所定の範囲とする。その一方で、この範囲から大きく外れている位相差の範囲では、位相差係数βを、大きい値、より具体的には「1」に近い値としている。そして、この両者の間を、前述の「0」に近い値から前述の「1」に近い値まで連続的に(図8のグラフでは直線的に)結んだときの値を、その間での位相差係数βの値としている。
人9の同一の発声音を収音した収音信号と副収音信号との間に生じる位相差は、マイクA5及びマイクB7の各々から人9までの距離の差によって生じるものである。この距離の差は、マイクA5(及びマイクB7)から見たときの人9の方向の違いによって増減する。つまり、この位相差は、マイクA5(及びマイクB7)から見たときの人9の発声音の到来方向に対応している。
前述したように、図8のグラフにおいては、位相差が、予め定めていた人9の発声音の到来方向から所定の範囲内を表している場合には、位相差係数βを小さい値としている。位相差がこのような範囲内を表しているときは、非定常性信号成分である人9の発声音が現在収音信号に大きな割合で含まれていると推定できるので、位相差係数βを小さい値として、定常性雑音モデル更新係数γの値を定数αから更に小さくするのである。γの値を小さくすれば、現在収音信号Si(t)を用いた更新による定常性雑音成分Ni(t)の推定結果の変化量が少なくなることは、前述したように、[1]式から明らかである。
その一方で、前述したように、図8のグラフにおいて、位相差が、この範囲から大きく外れている場合には、位相差係数βを大きい値としている。この範囲から位相差が大きく外れているときは、非定常性信号成分である人9の発声音が収音信号に含まれている割合が大きくはないと推定できる。従って、この場合には、位相差係数βを大きい値として、定常性雑音モデル更新係数γの値を定数αに近い値とする。こうすることで、現在収音信号Si(t)を用いた更新による定常性雑音成分Ni(t)の推定結果の変化量を、非定常性指標の値が前述の閾値よりも小さい場合と同等のものになる。
なお、図8のグラフはあくまでも一例に過ぎないものであり、収音信号及び副収音信号の周波数スペクトルにおける位相差情報と位相差係数βとの対応関係は、この例に限定されるものではない。
例えば、ある周波数スペクトルにおいての位相差が、人9とマイクA5及びマイクB7との位置関係を予め定めた状態で人9の同一の発生音を両者が各々収音したときの位相差に一致しているときの位相差係数βを「0」とするようにしてもよい。この場合には、定常性雑音モデル更新係数γの値が「0」となるので、現在収音信号Si(t)を用いた更新による定常性雑音成分Ni(t)の推定結果の変化量もゼロとなることは、[1]式から明らかである。また、この場合に、位相差係数βを「0」とする位相差から所定値以上外れている位相差の範囲では、位相差係数βを「1」に近い値とする。そして、この両者の間を、「0」から前述の「1」に近い値まで連続的に結んだときの値を、その間での位相差係数βの値とする。位相差情報と位相差係数βとの対応関係を、例えばこのようにしてもよい。
定常性雑音モデル推定部14は、前述した第一の例におけるものと同一のものであり、収音信号に含まれる定常性雑音成分の推定を行う。定常性雑音モデル更新係数設定部13は、以上のようにして設定した定常性雑音モデル更新係数γを定常性雑音モデル推定部14に送って前述したγ:(1−γ)の割合を変更させることで、定常性雑音モデル推定部14による定常性雑音モデルの推定を制御する。
次に図9について説明する。図9は、図4のコンピュータ20におけるMPU21により行われる雑音推定処理の第二の例の処理内容を図解したフローチャートである。この第二の例は、図7の構成を有する雑音推定装置2としてコンピュータ20を機能させるためのものである。
図9において、図7に図解した第一の例におけるものと同一の処理には同一の符号を付している。これらの処理については詳細な説明を省略する。
図9の処理が開始されると、S101のFFT処理の実行と並行して、S201においてもFFT処理が行われる。この処理は、副収音信号の所定のサンプル数分(S101のFFT処理が対象とする収音信号のサンプル数と同数)の信号波形を周波数スペクトルへと変換する高速フーリエ変換処理である。なお、この処理は、FFT部31としてMPU21が機能するための処理である。
次に、非定常性指標算出部12としてMPU21が機能するための処理である、前述したS102からS104にかけての処理の実行と並行して、S202において位相差算出処理が行われる。この処理では、まず、S201の処理により得られた副収音信号の周波数スペクトルの各々の位相情報を受け取ると共に、S101の処理により得られた収音信号の周波数スペクトルの各々の位相情報を受け取る。そして、周波数スペクトル毎に、受け取った位相情報の差を算出して収音信号と副収音信号との位相差を獲得する。なお、この位相差算出処理は、位相差算出部32としてMPU21が機能するための処理である。
以上のS101からS104にかけての処理とS201及びS202の処理との完了後に続いて行われるS105、S106、S203、及びS204の処理は、定常性雑音モデル更新係数設定部13としてMPU21が機能するための処理である。
まず、S105において、前述したように、S104の処理によって算出された非定常性指標ASIi(t)と、前述した所定の閾値との大小比較を行い、非定常性指標ASIi(t)が当該閾値よりも小さいか否かを判定する処理が行われる。ここで、非定常性指標ASIi(t)が当該閾値よりも小さいと判定されたとき(判定結果がYesのとき)にはS106に処理を進める。一方、非定常性指標ASIi(t)が当該閾値以上であると判定されたとき(判定結果がNoのとき)にはS203に処理を進める。
S106では、前述した定常性雑音モデル更新係数γの値を、S102の処理で値を設定した定数αとする処理が行われ、その後はS108に処理を進める。
一方、S203では位相差係数取得処理が行われる。この処理では、まず、ハードディスク装置24に予め記憶されている位相差係数テーブルが参照される。この位相差係数テーブルは、図8にグラフで図解したような、位相差情報と位相差係数βとの具体的な対応関係が表されているテーブルである。そして、このテーブルにおいて、S202の位相差算出処理により獲得された位相差情報に対応付けられている位相差係数βの値が取得される。
次に、S204では、S102の処理で設定されている定数αと、S203の処理で取得した位相差係数βの値とに基づき、前掲した式[4]を計算することによって、前述した定常性雑音モデル更新係数γの値を算出する処理が行われる。そして、この処理の後はS108に処理を進める。
次に、S108では、S106の処理若しくはS204の処理により設定された定常性雑音モデル更新係数γの値を用いて前掲した[1]式を計算して、現在収音信号に含まれる定常性雑音成分の推定結果Ni(t)を算出して出力する処理が行われる。こうして収音信号の周波数スペクトル毎に得られた定常性雑音成分の推定結果が、定常性雑音モデルである。
以上のS108の処理を終えると図9の雑音推定処理は完了し、以降、この雑音推定処理が繰り返し実行される。
MPU21が以上の雑音推定処理を行うことによっても、コンピュータ20が雑音推定装置2として機能し、収音信号に含まれる定常性雑音成分の推定が行われて、その推定結果である定常性雑音モデルが得られる。
以上のように動作する雑音推定装置2による定常性雑音成分の推定結果例を提示する。
図10Aは、図2の構成を備えた雑音推定装置の第一の例による定常性雑音モデルの推定結果例であり、図10Bは、図7の構成を備えた雑音推定装置の第二の例による定常性雑音モデルの推定結果例である。
図10A及び図10Bに描かれている各グラフの横軸は、時間の経過を表している。但し、この横軸は、図6A及び図6Bに描かれている各グラフの横軸とはスケールが大きく異なっており、図6A及び図6Bにおけるスケールを縮めたものとなっている。
図10Aにおいて、(A)の波形は、収音信号の波形である。なお、人9の発声音が含まれている区間を表示している。また、(B)の波形は、この収音信号の約300Hzのスペクトルの振幅成分の波形である。更に、(C)の波形は、雑音推定装置の第一の例によって得られた非定常性指標の波形である。そして、(D)の波形は、雑音推定装置の第一の例による定常性雑音成分の推定結果例である。
一方、図10Bにおいて、(A)の波形は、収音信号の約300Hzのスペクトルの振幅成分の波形であり、図10Aの(B)と同一の波形である。また、(B)の波形は、雑音推定装置の第一の例によって得られた位相差情報の波形である。更に、(C)の波形は、雑音推定装置の第二の例によって得られた非定常性指標の波形である。そして、(D)の波形は、雑音推定装置の第二の例による定常性雑音成分の推定結果例である。
図6Bの波形を図6Aの波形とを対比して前述したように、先に説明した雑音推定装置の第一の例の構成であっても、定常性雑音モデルから非定常性信号を効果的に抑制することができる。しかしながら、図10Aの(D)の波形のように時間軸のスケールを変更して定常性雑音モデルの波形を参照すると、非定常性信号である人9の発声音の成分が、依然として定常性雑音モデルに残存していることが分かる。
これに対し、図10Bの(D)の波形を図10Aの(D)の波形と対比すると明らかなように、雑音推定装置の第二の例の構成では、第一の例では残存していた人9の発声音の成分も、定常性雑音モデルから良好に抑制できていることが分かる。
次に図11について説明する。図11は雑音推定装置2の第三の例の構成図である。
この第三の例の構成を図7に図解した第二の例と比較すると、非定常性指標算出部12による非定常性指標の算出を、FFT部31によって得られる副収音信号の周波数スペクトルの位相情報にも基づいて行う点が相違している。そこで、ここでは、この非定常性指標の算出についてのみ説明する。
第一の例及び第二の例の構成を備えた雑音推定装置2では、前述したように、前掲の[2]式を用いて現在収音信号に含まれる定常性雑音成分の仮推定を行う際の定数αを、t>0の範囲で固定値としていた。これに対し、この第三の例の構成を備える雑音推定装置2では、収音信号と副収音信号との位相差を利用する。この位相差が、前述したような、予め想定した人9の発声音の到来方向の範囲内を表している場合には、非定常性信号成分である人9の発声音が現在収音信号に大きな割合で含まれていると推定できる。そこで、この場合には、その範囲外である場合よりも定数αの値を小さくする。この第三の例の構成を備える雑音推定装置2では、このようにして、前掲の[2]式によるSi(t)とNi(t−1)との加算におけるSi(t)の加算割合を少なくすることで、現在収音信号に含まれる定常性雑音成分の仮推定をより適切なものとする。すると、非定常性指標算出部12により算出される非定常性指標の確からしさも向上するので、結果として、定常性雑音モデル推定部14による定常性雑音成分の推定結果がより適切なものとなる。
次に図12について説明する。図12は、図4のコンピュータ20におけるMPU21により行われる雑音推定処理の第三の例の処理内容を図解したフローチャートである。この第三の例は、図11の構成を有する雑音推定装置2としてコンピュータ20を機能させるためのものである。
この第三の例の処理内容を図9に図解した第二の例と比較すると、S102からS104にかけての処理に、S301からS303にかけての処理が追加されている点が相違している。つまり、第二の例において非定常性指標算出部12としてMPU21が機能するための処理である、S102からS104にかけての処理に、S301からS303にかけての処理が追加されている。そこで、この第三の例では、これらの処理についてのみ説明することとし、第二の例と同一の処理については説明を省略する。
まず、S301において、S202の位相差算出処理により獲得された位相差情報が、前述したような、予め想定した人9の発声音の到来方向の範囲内を表しているか否かを判定する処理が行われる。ここで、位相差情報が当該範囲内を表していると判定されたとき(判定結果がYesのとき)には、S303に処理を進める。一方、位相差情報が当該範囲内を表していないと判定されたとき(判定結果がNoのとき)には、S302に処理を進める。
S302では、前掲した式[2]における前述した定数αを、前述したようにして定めた所定の値(図12では「0.1」)に設定する処理が行われ、その後はS103に処理を進める。
一方、S303では、この定数αを、S302の処理で設定する値よりも小さい値(図12では「0.01」)に設定して、現在収音信号に含まれる定常性雑音成分の仮推定をより適切なものとする処理が行われ、その後はS103に処理を進める。
S103では、S302若しくはS303の処理により設定された定数αの値を用いて、前掲した[2]式を計算して、現在収音信号に含まれる定常性雑音成分の仮推定値VNi(t)を算出する処理が行われる。そして、続くS104において、前掲した[3]式を計算して、非定常性指標ASIi(t)を算出する処理が行われる。このS103及びS104の処理は、前述したものと同様である。
上述した図12の雑音推定処理をMPU21が行うことによっても、コンピュータ20が雑音推定装置2として機能し、収音信号に含まれる定常性雑音成分の推定が行われて、その推定結果である定常性雑音モデルが得られる。
次に、図7に構成を図解した雑音推定装置2の第二の例における定常性雑音モデル更新係数設定部13の機能変更による、定常性雑音成分の推定結果の向上について、図13及び図14を参照しながら説明する。
まず図13について説明する。図13は、図4のコンピュータ20におけるMPU21により行われる雑音推定処理の第四の例の処理内容を図解したフローチャートである。この第四の例は、図7の構成を有する雑音推定装置2としてコンピュータ20を機能させるためのものである。
この第四の例では、位相差算出部32により算出された収音信号と副収音信号との位相差が、人9とマイクA5及びマイクB7との位置関係を予め定めた状態で人9の同一の発声音を収音したときの位相差と一致するか否かを判定する。なお、この判定は、非定常性指標が所定の閾値以上であると判定したときに行われる。そして、計数用のカウンタを用意し、この両者の位相差が、マイクA5及びマイクアンプ6で収音信号を新たに得る度に連続して一致したときの連続回数を計数する。
なお、この第四の例では、上述した両者の位相差が一致しているときには、位相差係数βを「0」とする場合を想定している。
前述したように、非定常性指標が所定の閾値以上であるときに、上述した位相差が一致している場合には、非定常性信号成分である人9の発声音が現在収音信号に大きな割合で含まれていると推定できる。但し、上述したように、この第四の例の場合には、位相差係数βが「0」となる。すると、前掲した[4]式及び[1]式により、上述した位相差が一致している場合には、現在収音信号Si(t)に含まれる定常性雑音成分の推定結果Ni(t)は、過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)のまま更新されない。従って、上述した位相差の一致が連続した場合には、その連続している間は、定常性雑音成分の推定結果Ni(t)が更新されないことになり、その推定結果の確からしさの信頼度が低下する。
そこで、この第四の例では、前述したカウンタの計数値が予め定めておいた所定に達するほどに上述した位相差の一致が連続した場合には、定常性雑音モデル更新係数γを、非定常性指標が所定の閾値よりも小さい場合のときのものと同一の値に設定する。
現在収音信号に含まれる定常性雑音成分Ni(t)の推定を、前掲した[1]式に従い、過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)に対する、現在収音信号Si(t)を用いた更新により行うことは既に説明した。従って、定常性雑音モデル更新係数設定部13の機能を変更して、γの値をこのように設定させるようにすることで、この更新による定常性雑音成分Ni(t)の推定結果の変化量が、非定常性指標が所定の閾値よりも小さい場合のときのものと同一になる。第四の例は、このようにして、前述した場合における定常性雑音成分の推定結果Ni(t)の更新を促すようにするものである。
図13に図解した第四の例の処理内容を図9に図解した第二の例と比較すると、S106の処理が削除され、その代わりに、S401からS404にかけての処理が追加されている点が相違している。つまり、第二の例においての定常性雑音モデル更新係数設定部13としての処理である、S105及びS106並びにS203及びS204の処理が、S105、S203及びS204、並びにS401からS404にかけての処理に置き換えられている。そこで、この第四の例では、これらの処理についてのみ説明することとし、第二の例と同一の処理については説明を省略する。
まず、S105において、前述したように、S104の処理によって算出された非定常性指標ASIi(t)と、前述した所定の閾値との大小比較を行い、非定常性指標ASIi(t)が当該閾値よりも小さいか否かを判定する処理が行われる。ここで、非定常性指標ASIi(t)が当該閾値よりも小さいと判定されたとき(判定結果がYesのとき)にはS404に処理を進める。一方、非定常性指標ASIi(t)が当該閾値以上であると判定されたとき(判定結果がNoのとき)にはS203に処理を進める。
S203では位相差係数取得処理が行われる。この処理では、まず、ハードディスク装置24に予め記憶されている位相差係数テーブルが参照される。この位相差係数テーブルは、位相差情報と位相差係数βとの具体的な対応関係が表されているテーブルである。但し、このテーブルにおいて、収音信号と副収音信号との位相差が、人9とマイクA5及びマイクB7との位置関係を予め定めた状態で人9の同一の発生音を両者が各々収音したときの位相差に一致しているときには、位相差係数βは「0」である。そして、このテーブルにおいて、S202の位相差算出処理により獲得された位相差情報に対応付けられている位相差係数βの値が取得される。
次に、S204では、S102の処理で設定されている定数αと、S203の処理で取得した位相差係数βの値とに基づき、前掲した式[4]を計算することによって、前述した定常性雑音モデル更新係数γの値を算出する処理が行われる。そして、この処理の後はS401に処理を進める。
S401では、位相差係数βの値が「0」であるか否かを判定する処理が行われる。この処理は、すなわち、S202の処理により算出された収音信号と副収音信号との位相差が、人9とマイクA5及びマイクB7との位置関係を予め定めた状態で人9の同一の発声音を収音したときの位相差と一致するか否かを判定する処理である。ここで、位相差係数βの値が「0」であると判定されたとき(判定結果がYesのとき)にはS402に処理を進める。一方、位相差係数βの値が「0」ではないと判定されたとき(判定結果がNoのとき)にはS108に処理を進める。
S402では、変数niの現在の値をインクリメント(1だけ加算)し、その結果を改めて変数niに代入する処理が行われる。この変数niは前述したカウンタの計数値に相当するものであり、その初期値は「0」である。
S403では、変数niの現在の値が所定値(図13では「100」)よりも小さいか否かを判定する処理が行われる。ここで、変数niの値が所定値よりも小さいと判定されたとき(判定結果がYesのとき)にはS108に処理を進める。一方、変数niの値が所定値に達したと判定されたとき(判定結果がNoのとき)にはS404に処理を進める。
S404では、定常性雑音モデル更新係数γの値を、S102の処理で値を設定した定数αとすると共に、変数niを初期化してその値を「0」とする処理が行われ、その後はS108に処理を進める。
S108では、S404の処理若しくはS204の処理により設定された定常性雑音モデル更新係数γの値を用いて前掲した[1]式を計算して、現在収音信号に含まれる定常性雑音成分の推定結果Ni(t)を算出して出力する処理が行われる。この処理は前述したものと同様である。こうして収音信号の周波数スペクトル毎に得られた定常性雑音成分の推定結果が、定常性雑音モデルである。
上述した図13の雑音推定処理をMPU21が行うことによっても、コンピュータ20が雑音推定装置2として機能し、収音信号に含まれる定常性雑音成分の推定が行われて、その推定結果である定常性雑音モデルが得られる。
次に図14について説明する。図14は、図4のコンピュータ20におけるMPU21により行われる雑音推定処理の第五の例の処理内容を図解したフローチャートである。この第五の例も、図7の構成を有する雑音推定装置2としてコンピュータ20を機能させるためのものである。
この第五の例では、収音信号のある周波数スペクトルについての非定常性指標が所定の閾値以上であると判定しても、収音信号に含まれている非定常性信号成分の割合は大きいとの判定結果を直ちには下さない。その代わりに、このときに、その他の周波数スペクトルについての非定常性指標について、所定の閾値以上であると判定されたものが多いか少ないかを調べる。ここで、非定常性指標が所定の閾値以上であると判定された周波数スペクトルが多かった場合に、初めて、収音信号には、非定常性信号成分の割合が大きく含まれているとの判定を下す。その一方、非定常性指標が所定の閾値以上であると判定された周波数スペクトルが少なかった場合には、収音信号に含まれている非定常性信号成分の割合は大きくはないとの判定を下す。定常性雑音モデル更新係数設定部13は、定常性雑音モデル推定部14が行う収音信号に含まれる定常性雑音成分の推定を、この判定結果に従って制御する。
図14に図解した第五の例の処理内容を図9に図解した第二の例と比較すると、S501及びS502の処理が追加されている点が相違している。つまり、第二の例においての定常性雑音モデル更新係数設定部13としての処理である、S105及びS106並びにS203及びS204の処理に、S501及びS502の処理が追加されている。そこで、この第四の例では、これらの処理についてのみ説明することとし、第二の例と同一の処理については説明を省略する。
まず、S105では、S104の処理によって算出された非定常性指標ASIi(t)と、前述した所定の閾値との大小比較を行い、非定常性指標ASIi(t)が当該閾値よりも小さいか否かを判定する処理が行われる。ここで、非定常性指標ASIi(t)が当該閾値よりも小さいと判定されたとき(判定結果がYesのとき)にはS106に処理を進める。一方、非定常性指標ASIi(t)が当該閾値以上であると判定されたとき(判定結果がNoのとき)にはS203に処理を進める。
S106では、前述した定常性雑音モデル更新係数γの値を、S102の処理で値を設定した定数αとする処理が行われ、その後はS108に処理を進める。
一方、S203では位相差係数取得処理が行われる。この処理では、まず、ハードディスク装置24に予め記憶されている位相差係数テーブルが参照される。この位相差係数テーブルは、図8にグラフで図解したような、位相差情報と位相差係数βとの具体的な対応関係が表されているテーブルである。そして、このテーブルにおいて、S202の位相差算出処理により獲得された位相差情報に対応付けられている位相差係数βの値が取得される。
次に、S204では、S102の処理で設定されている定数αと、S203の処理で取得した位相差係数βの値とに基づき、前掲した式[4]を計算することによって、前述した定常性雑音モデル更新係数γの値を算出する処理が行われる。そして、この処理の後はS501に処理を進める。
S501では定常性雑音変化度を算出する処理が行われる。定常性雑音変化度は、例えば、S101のFFT処理で得られる収音信号の周波数スペクトルの本数で、当該周波数スペクトルのうち非定常性指標ASIi(t)が前述の閾値以上であったものの本数を除算して算出する。なお、S101のFFT処理で得られる収音信号の周波数スペクトルの本数が固定値であれば、この除算を行わず、当該周波数スペクトルのうち非定常性指標ASIi(t)が前述の閾値以上であったものの本数を、直ちに定常性雑音変化度としてもよい。また、この代わりに、例えば、S101のFFT処理で得られる収音信号の周波数スペクトルのうち、人9による発声音が含まれ得る周波数スペクトルのみを対象として、この除算を行うようにしてもよい。
次に、S502では、S501の処理により算出された定常性雑音変化度が、予め定めておいた所定の判定基準値を超えるか否かを判定する処理が行われる。ここで、定常性雑音変化度が判定基準値を超えていると判定されたとき(判定結果がYesのとき)には、S108に処理を進める。なお、このときの定常性雑音モデル更新係数γの値は、S204の処理により設定された値である。一方、定常性雑音変化度が判定基準値以下であると判定されたとき(判定結果がNoのとき)には、前述したS106に処理を進め、定常性雑音モデル更新係数γの値を、S102の処理で値を設定した定数αとする処理が行われ、その後にS108に処理を進める。
S108では、S106の処理若しくはS204の処理により設定された定常性雑音モデル更新係数γの値を用いて前掲した[1]式を計算して、現在収音信号に含まれる定常性雑音成分の推定結果Ni(t)を算出して出力する処理が行われる。この処理は前述したものと同様である。こうして収音信号の周波数スペクトル毎に得られた定常性雑音成分の推定結果が、定常性雑音モデルである。
上述した図14の雑音推定処理をMPU21が行うことによっても、コンピュータ20が雑音推定装置2として機能し、収音信号に含まれる定常性雑音成分の推定が行われて、その推定結果である定常性雑音モデルが得られる。
なお、以上までに説明した雑音推定装置2の各構成例においては、非定常性指標算出部12による非定常性指標ASIi(t)の算出を、前掲した[3]式を計算することによって行うものとしていたが、算出法はこれに限定されるものではない。例えば、現在収音信号Si(t)を過去収音信号に基づき推定した定常性雑音成分の推定結果Ni(t−1)で除算する下記の[5]式により、非定常性指標ASIi(t)を算出するようにしてもよい。
ASIi(t)=Si(t)/Ni(t−1)…………………[5]
なお、以上までに説明した実施形態に関し、更に以下の付記を開示する。
(付記1)
発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定を行う推定手段と、
ある時刻での該収音信号である現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づいて該推定手段を制御する制御手段と、
を有しており、
該推定手段は、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、該現在収音信号に含まれる定常性雑音成分の推定を行い、
該制御手段は、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該推定手段を制御する、
ことを特徴とする雑音推定装置。
(付記2)
該発音体の発音を該収音装置とは異なる位置で収音するための装置である副収音装置により得られた収音信号である副収音信号と該収音装置により得られた該収音信号との位相差を、所定の複数の周波数の各々について求める位相差取得手段を更に有し、
該推定手段は、該現在収音信号についての該定常性雑音成分の推定を該所定の複数の周波数の各々で行い、
該制御手段は、該推定手段に対する該制御を該所定の複数の周波数の各々で行うと共に、該非定常性指標が該閾値以上である場合には、該推定手段による該更新による変化量が少なくなるようにする制御における該変化量を、該所定の複数の周波数の各々での該位相差に基づいて設定する、
ことを特徴とする付記1に記載の雑音推定装置。
(付記3)
該制御手段は、該位相差が、該発音体による同一の発音を該収音装置及び該副収音装置の各々が収音したときの該収音信号と該副収音信号との位相差に一致している場合には、該推定手段による該更新による変化量をゼロとする制御を行うことを特徴とする付記2に記載の雑音推定装置。
(付記4)
該推定手段は、該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第一の割合で加算した加算結果を、該現在収音信号に含まれる定常雑音成分の推定の結果とすることを特徴とする付記1から3のうちのいずれか一項に記載の雑音推定装置。
(付記5)
該制御手段は、該第一の割合を変更することによって該推定手段を制御することを特徴とする付記4に記載の雑音推定装置。
(付記6)
該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第二の割合で加算し、該加算の結果を、該過去収音信号に基づき推定した該定常性雑音成分の推定結果で除算した値を該非定常性指標として算出する非定常性指標算出手段を更に有しており、
該制御手段は、該非定常性指標算出手段が算出した非定常性指標に基づいて該推定手段を制御する、
ことを特徴とする付記4又は5に記載の雑音推定装置。
(付記7)
該制御手段は、該非定常性指標が該閾値よりも小さい場合には、該制御手段を制御して、該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを加算するときの該第一の割合を、該第二の割合に一致させることを特徴とする付記6に記載の雑音推定装置。
(付記8)
該推定手段は、該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第一の割合で加算した加算結果を、該現在収音信号に含まれる定常雑音成分の推定の結果とし、
該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第二の割合で加算し、該加算の結果を、該過去収音信号に基づき推定した該定常性雑音成分の推定結果で除算した値を該非定常性指標として算出する非定常性指標算出手段を更に有しており、
該非定常性指標算出手段は、該第二の割合を該位相差に基づき変更し、
該制御手段は、該第一の割合を変更することによって該推定手段を制御すると共に、該非定常性指標算出手段が算出した非定常性指標に基づいて該推定手段を制御する、
ことを特徴とする付記2又は3に記載の雑音推定装置。
(付記9)
該非定常性指標算出手段は、該位相差と、該発音体による同一の発音を該収音装置及び該副収音装置の各々が収音したときの該収音信号と該副収音信号との位相差との違いが所定の範囲内である場合には、該第二の割合を変更して、該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果との加算における該現在収音信号の加算割合を少なくすることを特徴とする付記8に記載の雑音推定装置。
(付記10)
該非定常性指標が所定の閾値以上であるときであって、且つ、該収音信号と該副収音信号との位相差と、該発音体による同一の発音を該収音装置及び該副収音装置の各々が収音したときの該収音信号と該副収音信号との位相差とが、該収音装置で該収音信号を新たに得る度に連続して一致したときの連続回数を計数するカウンタを更に有しており、
該制御手段は、該カウンタの計数値が所定値に達したときには、該推定手段による該更新による変化量を、該非定常性指標が該閾値よりも小さい場合におけるものと同一のものとする、
ことを特徴とする付記3に記載の雑音推定装置。
(付記11)
該制御手段は、該推定手段による該更新による変化量を該位相差に基づき更に少なくする制御を、該所定の複数の周波数のうちで該非定常性指標が該閾値以上である周波数の数が所定の判定基準値よりも多い場合に行うことを特徴とする付記2又は3に記載の雑音推定装置。
(付記12)
付記1から11のうちのいずれか一項に記載の雑音推定装置と、
該雑音推定装置が有している該推定手段により推定された定常性雑音成分を該収音信号から減じることによって、該収音信号に含まれる定常性雑音成分を低減させる雑音低減装置と、
を有することを特徴とする雑音低減システム。
(付記13)
発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定を行う雑音推定方法であって、
ある時刻での該収音信号である現在収音信号に含まれる定常性雑音成分の推定を、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、行い、
該現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づき、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該定常性雑音成分の推定を制御する、
ことを特徴とする雑音推定方法。
(付記14)
発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定をコンピュータに行わせるためのプログラムであって、
ある時刻での該収音信号である現在収音信号に含まれる定常性雑音成分の推定を、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、行う推定処理と、
該現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づき、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該定常性雑音成分の推定を制御する制御処理と、
を該コンピュータに行わせるためのプログラム。
1 雑音低減システム
2 雑音推定装置
3 雑音低減装置
4 IFFT装置
5 マイクA
6、8 マイクアンプ
7 マイクB
9 人
11、31 FFT部
12 非定常性指標算出部
13 定常性雑音モデル更新係数設定部
14 定常性雑音モデル推定部
20 コンピュータ
21 MPU
22 ROM
23 RAM
24 ハードディスク装置
25 入力装置
26 表示装置
27 インタフェース装置
28 記録媒体駆動装置
29 バス
30 可搬型記録媒体
32 位相差算出部

Claims (8)

  1. 発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定を行う推定手段と、
    ある時刻での該収音信号である現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づいて該推定手段を制御する制御手段と、
    を有しており、
    該推定手段は、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、該現在収音信号に含まれる定常性雑音成分の推定を行い、
    該制御手段は、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該推定手段を制御する、
    ことを特徴とする雑音推定装置。
  2. 該発音体の発音を該収音装置とは異なる位置で収音するための装置である副収音装置により得られた収音信号である副収音信号と該収音装置により得られた該収音信号との位相差を、所定の複数の周波数の各々について求める位相差取得手段を更に有し、
    該推定手段は、該現在収音信号についての該定常性雑音成分の推定を該所定の複数の周波数の各々で行い、
    該制御手段は、該推定手段に対する該制御を該所定の複数の周波数の各々で行うと共に、該非定常性指標が該閾値以上である場合には、該推定手段による該更新による変化量が少なくなるようにする制御における該変化量を、該所定の複数の周波数の各々での該位相差に基づいて設定する、
    ことを特徴とする請求項1に記載の雑音推定装置。
  3. 該推定手段は、該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第一の割合で加算した加算結果を、該現在収音信号に含まれる定常雑音成分の推定の結果とすることを特徴とする請求項1又は2に記載の雑音推定装置。
  4. 該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第二の割合で加算し、該加算の結果を、該過去収音信号に基づき推定した該定常性雑音成分の推定結果で除算した値を該非定常性指標として算出する非定常性指標算出手段を更に有しており、
    該制御手段は、該非定常性指標算出手段が算出した非定常性指標に基づいて該推定手段を制御する、
    ことを特徴とする請求項3に記載の雑音推定装置。
  5. 該推定手段は、該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第一の割合で加算した加算結果を、該現在収音信号に含まれる定常雑音成分の推定の結果とし、
    該現在収音信号と該過去収音信号に基づき推定した該定常性雑音成分の推定結果とを所定の第二の割合で加算し、該加算の結果を、該過去収音信号に基づき推定した該定常性雑音成分の推定結果で除算した値を該非定常性指標として算出する非定常性指標算出手段を更に有しており、
    該非定常性指標算出手段は、該第二の割合を該位相差に基づき変更し、
    該制御手段は、該第一の割合を変更することによって該推定手段を制御すると共に、該非定常性指標算出手段が算出した非定常性指標に基づいて該推定手段を制御する、
    ことを特徴とする請求項2に記載の雑音推定装置。
  6. 請求項1から5のうちのいずれか一項に記載の雑音推定装置と、
    該雑音推定装置が有している該推定手段により推定された定常性雑音成分を該収音信号から減じることによって、該収音信号に含まれる定常性雑音成分を低減させる雑音低減装置と、
    を有することを特徴とする雑音低減システム。
  7. 発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定を行う雑音推定方法であって、
    ある時刻での該収音信号である現在収音信号に含まれる定常性雑音成分の推定を、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、行い、
    該現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づき、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該定常性雑音成分の推定を制御する、
    ことを特徴とする雑音推定方法。
  8. 発音体の発音を収音するための収音装置により得られた収音信号に含まれる定常性雑音成分の推定をコンピュータに行わせるためのプログラムであって、
    ある時刻での該収音信号である現在収音信号に含まれる定常性雑音成分の推定を、該時刻よりも過去の該収音信号である過去収音信号に基づき推定した該定常性雑音成分の推定結果を、該現在収音信号を用いて更新することによって、行う推定処理と、
    該現在収音信号に含まれる非定常性信号成分の推定割合を数値の大きさで表す指標である非定常性指標に基づき、該非定常性指標が所定の閾値以上である場合には、該非定常性指標が該閾値よりも小さい場合よりも、該過去収音信号に基づき推定した該定常性雑音成分の推定結果に対する該更新による変化量が少なくなるように該定常性雑音成分の推定を制御する制御処理と、
    を該コンピュータに行わせるためのプログラム。
JP2010054345A 2010-03-11 2010-03-11 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム Active JP5387459B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010054345A JP5387459B2 (ja) 2010-03-11 2010-03-11 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010054345A JP5387459B2 (ja) 2010-03-11 2010-03-11 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011186384A JP2011186384A (ja) 2011-09-22
JP5387459B2 true JP5387459B2 (ja) 2014-01-15

Family

ID=44792682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010054345A Active JP5387459B2 (ja) 2010-03-11 2010-03-11 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5387459B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
CN104380378A (zh) 2012-05-31 2015-02-25 丰田自动车株式会社 声源检测装置、噪声模型生成装置、噪声抑制装置、声源方位推定装置、接近车辆检测装置以及噪声抑制方法
JP6054142B2 (ja) * 2012-10-31 2016-12-27 株式会社東芝 信号処理装置、方法およびプログラム
JP6107151B2 (ja) 2013-01-15 2017-04-05 富士通株式会社 雑音抑圧装置、方法、及びプログラム
WO2014112023A1 (ja) * 2013-01-17 2014-07-24 日本電気株式会社 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム
JP6361148B2 (ja) * 2014-01-29 2018-07-25 沖電気工業株式会社 雑音推定装置、方法及びプログラム
JP6361156B2 (ja) * 2014-02-10 2018-07-25 沖電気工業株式会社 雑音推定装置、方法及びプログラム
JP6547451B2 (ja) 2015-06-26 2019-07-24 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
JP6536322B2 (ja) * 2015-09-29 2019-07-03 沖電気工業株式会社 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP6737133B2 (ja) * 2016-10-31 2020-08-05 沖電気工業株式会社 雑音推定装置、プログラム及び方法
US10609479B2 (en) 2017-09-14 2020-03-31 Fujitsu Limited Device and method for determining a sound source direction
JP7010136B2 (ja) 2018-05-11 2022-01-26 富士通株式会社 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
JP7226107B2 (ja) * 2019-05-31 2023-02-21 富士通株式会社 話者方向判定プログラム、話者方向判定方法、及び、話者方向判定装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10319985A (ja) * 1997-03-14 1998-12-04 N T T Data:Kk ノイズレベル検出方法、システム及び記録媒体
JP3900691B2 (ja) * 1998-07-08 2007-04-04 株式会社デンソー 雑音抑圧装置及び当該装置を用いた音声認識システム
JP3812887B2 (ja) * 2001-12-21 2006-08-23 富士通株式会社 信号処理システムおよび方法
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise

Also Published As

Publication number Publication date
JP2011186384A (ja) 2011-09-22

Similar Documents

Publication Publication Date Title
JP5387459B2 (ja) 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
US8775173B2 (en) Erroneous detection determination device, erroneous detection determination method, and storage medium storing erroneous detection determination program
WO2011111091A1 (ja) 雑音抑圧装置
US10741195B2 (en) Sound signal enhancement device
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP5071346B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP2021503633A (ja) 音声ノイズ軽減方法、装置、サーバー及び記憶媒体
JP4532576B2 (ja) 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム
JP5870476B2 (ja) 雑音推定装置、雑音推定方法および雑音推定プログラム
JP6156012B2 (ja) 音声処理装置及び音声処理用コンピュータプログラム
JP2014137414A (ja) 雑音抑圧装置、方法、及びプログラム
JP2014122939A (ja) 音声処理装置および方法、並びにプログラム
JP6439682B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2013020252A (ja) 音響処理装置、音響処理方法、及び音響処理プログラム
CN112951259A (zh) 音频降噪方法、装置、电子设备及计算机可读存储介质
JP6182895B2 (ja) 処理装置、処理方法、プログラム及び処理システム
JP2005257817A (ja) 雑音除去装置、方法、及びプログラム
JP5614261B2 (ja) 雑音抑制装置、雑音抑制方法、及びプログラム
JP2007212704A (ja) 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
JP2012208177A (ja) 帯域拡張装置及び音声補正装置
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP6439174B2 (ja) 音声強調装置、および音声強調方法
JP2018205512A (ja) 電子機器及び雑音抑圧プログラム
JP5887087B2 (ja) 雑音低減処理装置および雑音低減処理方法
JP4691079B2 (ja) 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130923

R150 Certificate of patent or registration of utility model

Ref document number: 5387459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150