JP3588030B2 - 音声区間判定装置及び音声区間判定方法 - Google Patents
音声区間判定装置及び音声区間判定方法 Download PDFInfo
- Publication number
- JP3588030B2 JP3588030B2 JP2000074262A JP2000074262A JP3588030B2 JP 3588030 B2 JP3588030 B2 JP 3588030B2 JP 2000074262 A JP2000074262 A JP 2000074262A JP 2000074262 A JP2000074262 A JP 2000074262A JP 3588030 B2 JP3588030 B2 JP 3588030B2
- Authority
- JP
- Japan
- Prior art keywords
- ratio
- band
- section
- determination
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
この発明は、種々の雑音環境下で用いられる音声通信システムや音声認識システム等において、所定の区間ごとに入力される入力信号が音声区間であるか又は、雑音区間かを判別する音声区間判定装置及び音声区間判定方法に関するものである。
【0002】
【従来の技術】
雑音のある環境下において、正確に音声認識を行う必要がある場合、音声区間判定装置が用いられる。
例えば、特開昭59−99497号公報には、入力信号の直交変換を実施し、その変換値から求めたスペクトルに基づいて入力信号パワーと雑音信号パワーとの比であるS/N比を算出し、そのS/N比と固定閾値を大小比較することにより、音声区間を検出する音声区間判定装置が開示されている。
【0003】
また、背景雑音と音声信号が混在する入力信号から、音質を損なうことなく背景雑音を除去する背景雑音除去装置においては、入力信号の様態を検出する様態検出手段が用いられ、その様態検出手段は、例えば、特開平10−171497号公報に開示されている。
その様態検出手段は、文献(Steven F.Boll,“Suppression of Acoustic noise in speech using spectral subtraction”,IEEE Trans.ASSP,Vol.ASSP−27,No.2,April 1979)に示された振幅スペクトルに着目した方法、即ち、スペクトルサブトラクション(Spectral Subtraction:SS)法に基づく方法である。
【0004】
具体的には、周波数軸上において、背景雑音と音声信号を含む入力信号から、過去の背景雑音を平均して求めた背景雑音の推定値を減算することにより、入力信号中に含まれる背景雑音の定常成分を取り除き、減算後の信号と背景雑音の推定値から、全周波数帯域のS/N比(SN_all)と、全周波数帯域を複数の帯域に分割した小帯域毎のS/N比(SN_ch(i),iはチャネル番号))とを計算する。
そして、これらの差分(SN_ch(i)−SN_all)が所定値以下の帯域では、背景雑音の急峻な変化に対応する背景雑音を推定し、この推定値を用いてさらに減算処理を行うことにより、背景雑音の非定常成分を取り除くものである。
【0005】
また、音声区間の検出を実行する際に固定閾値との比較を行うのではなく、入力信号の様態に応じて、閾値を随時更新し、更新後の閾値との比較を行う手段が、例えば、特開平2−272836号公報に開示されている。
これは、入力信号のパワーを計算し、このパワー値,零交差回数,最大零交差間隔及び過去の音声区間の判定結果に基づいて閾値の更新を随時実行し、現フレームのパワー値と更新後の閾値とを比較することにより、音声区間の検出を行うものである。
【0006】
【発明が解決しようとする課題】
従来の音声区間判定装置は以上のように構成されているので、音声区間の判別精度が悪く、音声区間を雑音区間と誤判定する課題があった。
具体的には、下記に示す理由から誤判定を招いている。
【0007】
特開昭59−99497号公報に記載されている音声区間判定装置は、入力信号パワーと雑音信号パワーとの比であるS/N比(全周波数帯域のS/N比)を用いて、音声区間判定を実施している。図16は帯域別S/N比(全周波数が複数の小帯域に分割された小帯域毎のS/N比)の一例を表しており、(a)は雑音区間、(b)は音声区間である。図16において、帯域別S/N比の平均値は(a),(b)ともに等しく(μ1 =μ2 )、閾値THとの大小比較により音声区間判定を行うと、帯域別S/N比の平均値μ1 ,μ2 が閾値THよりも小さいため、どちらの場合においても「雑音区間(非音声区間)」と判定される。
【0008】
しかし、帯域別S/N比が図16(b)に示すものである場合、低域において、帯域別S/N比が平均値μ2 よりも高い帯域の数が、図16(a)に示すものよりも多く、また、これらの帯域では平均値μ2 との差が大きく、本来なら「音声区間」であると判定されるべきである。ところが、従来の音声区間判定装置では、この「音声区間」を「雑音区間」と誤判定してしまう。
【0009】
また、従来の音声区間判定装置では、入力信号が音声区間であるか否かを判定する際に使用する閾値THが固定値であるため、背景雑音の定常性を仮定して、閾値THを設定する場合が多い。このようにして、閾値THを設定すると、入力信号中の雑音レベルが急に大きく変動する場合(例えば、音声通話中に乗用車が側を通り過ぎる場合には、雑音レベルが急に大きく変動する)には、全周波数帯域のS/N比が小さくなり、閾値TH以下となることがある。この場合、音声区間であっても、雑音区間であると誤判定される。
【0010】
上記課題を解決するため、特開平2−272836号公報には、フレームパワー,零交差回数,最大零交差間隔及び有音/無音の判定結果に基づいて閾値を適応的に算出するものが開示されている。
即ち、零交差回数,最大零交差間隔及び有音/無音の判定出力の間にある条件を満足する場合に限り、過去フレームのパワーの平均値と現フレームのパワーの重み付け平均(AR平滑)を実施し、その重み付け平均を実施した値を定数倍した値を新たな閾値とすることにより、閾値の更新を行っている。
しかし、高雑音下では入力信号に占める雑音成分の割合が高いため、音声パワーとの判別が困難になり、また、零交差回数や最大零交差間隔の雑音区間での分布が音声区間での分布に類似した分布となるため、閾値の更新が適切に行われず、常に音声区間と判定されるため、雑音区間を音声区間と誤判定する課題があった。
【0011】
また、特開平10−171497号公報では、小帯域毎の帯域別S/N比と全周波数帯域のS/N比との差分値に応じて、スペクトル減算後の入力信号スペクトルに含まれる背景雑音の非定常成分を取り除いている。この方法は、帯域間の帯域別S/N比のばらつきを考慮に入れた方法であり、雑音の引き去り処理に対する効果は見られるが、音声区間の判定精度を高めることはできない。
【0012】
この発明は上記のような課題を解決するためになされたもので、入力信号のS/N比が低い場合でも、的確に音声区間を判定することができる音声区間判定装置及び音声区間判定方法を得ることを目的とする。
【0013】
【課題を解決するための手段】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比の正変動量を算出し、判定処理を実行するに際して、その正変動量を考慮するようにしたものである。
【0014】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比の負変動量を算出し、判定処理を実行するに際して、その負変動量を考慮するようにしたものである。
【0015】
この発明に係る音声区間判定装置は、入力信号の現在の区間が雑音区間であると判定する場合、入力信号の現在の区間の帯域スペクトルにより過去の雑音区間の帯域スペクトルを更新するようにしたものである。
【0016】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比の平均値を算出し、判定処理を実行するに際して、その平均値を考慮するようにしたものである。
【0017】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比のうち上位N位(Nは自然数)の帯域別S/N比を検索し、判定処理を実行するに際して、その帯域別S/N比を考慮するようにしたものである。
【0018】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比の分散値を算出し、判定処理を実行するに際して、その分散値を考慮するようにしたものである。
【0019】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比が基準値以上である帯域の個数又は割合を求め、判定処理を実行するに際して、その個数又は割合を考慮するようにしたものである。
【0020】
この発明に係る音声区間判定装置は、判定処理を実行するに際して、入力信号の現在の信号エネルギーを考慮するようにしたものである。
【0021】
この発明に係る音声区間判定装置は、判定処理を実行するに際して、入力信号の差分信号エネルギーを考慮するようにしたものである。
【0022】
この発明に係る音声区間判定装置は、S/N比算出手段により算出された帯域別S/N比にしたがって判定処理に用いる閾値を更新するようにしたものである。
【0023】
この発明に係る音声区間判定方法は、帯域別S/N比の正変動量を算出し、判定処理を実行するに際して、その正変動量を考慮するようにしたものである。
【0024】
この発明に係る音声区間判定方法は、帯域別S/N比の負変動量を算出し、判定処理を実行するに際して、その負変動量を考慮するようにしたものである。
【0025】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声区間判定装置を示す構成図であり、図において、1は例えばマイクロフォンにより取り込まれた信号(入力信号)を入力する入力端子、2は入力端子1から入力された信号を所定の周波数でサンプリングを実施し、そのサンプリング結果であるフレーム信号(所定のサンプル数毎に区切られたフレーム信号)をアナログ/ディジタル変換するA/D変換器、3はA/D変換器2が出力するフレーム信号に対して窓関数演算を実行する窓関数演算器、4は窓関数演算器3の演算結果を一次のディジタルフィルタに通すことにより高域強調処理を実施する高域強調器である。
【0026】
5は高域強調器4により高域強調されたフレーム信号を直交変換して、そのフレーム信号の周波数スペクトルを求める直交変換器(直交変換手段)、6は直交変換器5により求められた周波数スペクトルを複数の帯域に分割して、そのフレーム信号の帯域スペクトルを求める帯域分割器(帯域分割手段)、7は総合判定器13により制御される切換スイッチ、8は総合判定器13が現在の入力信号が雑音区間であると判定する場合、入力信号の帯域スペクトルにより過去の雑音区間の帯域スペクトルを更新する雑音更新器、9は過去の雑音区間の帯域スペクトルを保持する雑音保持器である。
【0027】
10は帯域分割器6により求められたフレーム信号の帯域スペクトルと過去の雑音区間の帯域スペクトルとの比である帯域別S/N比を算出する帯域別S/N比算出器(S/N比算出手段)、11は帯域別S/N比算出器10により算出された帯域別S/N比の平均値を算出する平均値算出器、12は帯域別S/N比算出器10により算出された帯域別S/N比の正変動量を算出する正変動量算出器、13は平均値算出器11により算出された帯域別S/N比の平均値と正変動量算出器12により算出された帯域別S/N比の正変動量とに基づいて現在の入力信号が音声区間又は雑音区間の何れであるかを判定する総合判定器、14は総合判定器13の判定結果を出力する出力端子である。
なお、雑音更新器8,雑音保持器9,平均値算出器11,正変動量算出器12及び総合判定器13から判定手段が構成されている。
【0028】
次に動作について説明する。
例えば、マイクロフォンにより取り込まれた信号が入力端子1から入力信号として入力されると、A/D変換器2は、その入力信号に対して所定の周波数(例えば、8kHzの周波数)でサンプリングを実施し、そのサンプリング結果であるフレーム信号をアナログ/ディジタル変換する。
【0029】
窓関数演算器3は、A/D変換器2がフレーム信号をアナログ/ディジタル変換すると、変換後のフレーム信号に対して、例えば、ハニング窓などの窓関数を乗じることにより窓関数演算を実行する。
高域強調器4は、窓関数演算器3の演算結果を下記に示すような伝達関数H(z)を有する一次のディジタルフィルタに通すことにより高域強調処理を実施する。
【0030】
H(z)=1−α・z-1
z=exp(jω)
ただし、ωは角周波数、jは虚数単位、αは高域強調係数であり、通常1に近い値(例えば、0.8)が設定される。
なお、高域強調器4を通さず、窓関数演算器3の出力を直接直交変換器5に入力してもよい。
【0031】
直交変換器5は、高域強調器4により高域強調されたフレーム信号又は窓関数演算器3により窓関数演算されたフレーム信号を入力すると、そのフレーム信号に対して、例えば、高速フーリエ変換(FFT)などの直交変換処理を実行し、時間tの関数として表される時間軸信号を周波数成分(周波数スペクトル)に変換する。
【0032】
帯域分割器6は、直交変換器5が周波数スペクトルを求めると、その周波数スペクトルを複数の帯域に分割することにより、そのフレーム信号の帯域スペクトルを求める。例えば、周波数スペクトルを16の帯域に分割し、それぞれの帯域毎にスペクトルの重み付け平均をとり、これを帯域スペクトルX(i,k)とする。ただし、kは帯域番号、iはフレーム番号とする。
この他、直交変換された周波数スペクトルに対して、「バークフィルタ」又は「メルフィルタ」等の聴覚特性を模擬するフィルタを通した後、重み付け平均をとってもよい。
【0033】
帯域別S/N比算出器10は、帯域分割器6がフレーム信号の帯域スペクトルX(i,k)を求めると、雑音保持器9に保持されている前フレームまでに推定された雑音信号の帯域スペクトルN(i−1,k)との比、即ち、帯域別S/N比を帯域毎に算出する。
【0034】
平均値算出器11は、帯域別S/N比算出器10が帯域別S/N比を出力すると、現フレームiにおける帯域別S/N比の平均値SN_mean(i)(以下、平均S/N比という)を算出する。
正変動量算出器12は、帯域別S/N比算出器10が帯域別S/N比を出力し、平均値算出器11が平均S/N比SN_mean(i)を出力すると、これらから下式にしたがって帯域別S/N比の正変動量SN_plus_variation(i)を算出する。ここで、帯域別S/N比の正変動量とは、帯域別S/N比が平均S/N比より高い帯域において、帯域別S/N比と平均S/N比の差を加算したものである。ただし、下式において、Kは帯域数、SNR(i,k)はフレーム番号i,帯域番号kにおける帯域別S/N比である。
【0035】
【数1】
【0036】
この実施の形態1では、帯域別S/N比が平均S/N比より高い帯域において、帯域別S/N比と平均S/N比の差を加算して正変動量を算出するものについて示したが、帯域別S/N比の最大値と平均S/N比の差を正変動量としてもよい。また、帯域別S/N比の上位N位までの帯域において、帯域別S/N比と平均S/N比の差を加算して正変動量を算出してもよい。
【0037】
総合判定器13は、平均値算出器11により算出された平均S/N比SN_mean(i)と、正変動量算出器12により算出された帯域別S/N比の正変動量SN_plus_variation(i)と、前フレームにおける総合判定器13の出力値(音声らしさレベルspeech_level(i−1))とを用いて、図2の条件判定式1を実行することにより、現フレームiにおける音声らしさレベルspeech_level(i)を求める。ここで、音声らしさレベルは、フレーム信号が音声区間である可能性を示す尺度であり、音声らしさレベルが高いほど、音声区間である可能性が高い。
【0038】
ただし、SN_mean_THは平均S/N比に対する固定閾値、SN_plus_variation_TH1,SN_plus_variation_TH2は帯域別S/N比の正変動量に対する固定閾値である。また、speech_tmpはフレームiにおける音声らしさレベルを求めるための一時変数である。
【0039】
なお、この実施の形態1では、閾値との大小比較により、音声らしさレベルが離散的に変化する場合について示しているが、平均S/N比及び正変動量を線形変換し、その変換値を加算した値を音声らしさレベルとすることにより、音声らしさレベルを連続的に変化させてもよい。ここで得られる音声らしさレベルの値は、とりうる値が複数であるため、音声らしさの程度を出力する場合であれば、音声らしさレベルの値をそのまま出力すればよいし、「音声区間」であるか「雑音区間」であるかを判定する場合には、音声らしさレベルの値が所定の閾値以上であれば「音声区間」、そうでなければ「雑音区間」と判定すればよい。そして、その判定結果を出力端子14から出力する。
【0040】
総合判定器13は、上記判定処理の実行後、次フレームの判定精度を高めるため、現フレームにおける入力信号が雑音区間であると判定した場合、または、音声らしさレベルが低い場合、切換スイッチ7をa側に切り換えて、雑音保持器9に保持されている雑音信号の帯域スペクトルN(i−1,k)を更新させる。
【0041】
雑音更新器8は、切換スイッチ7がa側に切り換えられると、帯域分割器6が出力する現フレームにおける入力信号の帯域スペクトルX(i,k)と、雑音保持器9に保持されている前フレームまでに推定された雑音信号の帯域スペクトルN(i−1,k)とを下式に代入して、現フレームにおける雑音信号の帯域スペクトルN(i,k)を算出し、雑音保持器9に保持されている雑音信号を更新する。即ち、雑音保持器9の保持内容を現フレームにおける雑音信号の帯域スペクトルN(i,k)に変更する。
【0042】
N(i,k)=β・N(i−1,k)+(1−β)・X(i,k)
ただし、βは雑音信号の推定速度を決定する係数であり、例えば、0.8という値をとるが、他にも帯域によって値を変えたり、音声らしさレベルが低い程、βを小さくすることにより、音声らしさレベルに応じた値をとるようにしてもよい。
【0043】
以上で明らかなように、この実施の形態1によれば、帯域分割器6により求められたフレーム信号の帯域スペクトルと過去の雑音区間の帯域スペクトルとの比である帯域別S/N比を算出し、その帯域別S/N比に基づいて現在のフレーム信号が音声区間又は雑音区間の何れであるかを判定するように構成したので、現在のフレームのS/N比が低い等の場合でも、的確に音声区間を判定することができる効果を奏する。
【0044】
即ち、帯域別S/N比の正変動量を算出する正変動量算出器12を設けることにより、平均S/N比だけではなく、帯域別S/N比の帯域毎の大きさの違いを捉えることが可能となる。具体的には、平均S/N比により音声らしさレベルの初期値を決定し(条件判定式1のア,エ)、さらに帯域別S/N比の帯域毎の大きさの違い(帯域別S/N比の正変動量)により音声らしさレベルの初期値からの変化量を決定する(条件判定式1のイ,ウ,オ,カ)。
【0045】
例えば、図16に示す二つの帯域別S/N比の平均S/N比は、両者とも閾値より小さいため、音声らしさレベルの初期値が小さくなる。そして、図16(a)の場合、正変動量が小さいので、音声らしさレベルをさらに小さくし、図16(b)の場合、正変動量が大きいので、音声らしさレベルを大きくする。これにより、帯域別S/N比の帯域毎の大きさの違いを考慮に入れた精度のよい音声区間判定を行うことができる。
【0046】
実施の形態2.
上記実施の形態1では、帯域別S/N比の平均値を用いて音声区間であるか否かを判定するものについて示したが、帯域別S/N比のうち上位N位(Nは自然数)の帯域別S/N比を検索し、判定処理を実行するに際して、その帯域別S/N比を考慮するようにしてもよい。
なお、帯域別S/N比の最大値を判定処理に用いる場合には、帯域別S/N比の最大値を正変動量とすることにより、同様の音声区間判定を実施することができる。
【0047】
実施の形態3.
上記実施の形態1,2では、帯域別S/N比の正変動量を算出し、その正変動量を用いて音声区間であるか否かを判定するものについて示したが、帯域別S/N比の負変動量を算出し(帯域別S/N比の負変動量とは、帯域別S/N比が平均S/N比より低い帯域において、帯域別S/N比と平均S/N比の差を加算したものである)、その負変動量を用いて音声区間であるか否かを判定するようにしてもよい。
なお、正変動量と負変動量は極性のみの違いである。
【0048】
実施の形態4.
図3はこの発明の実施の形態4による音声区間判定装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
15は帯域別S/N比算出器10により算出された帯域別S/N比の分散値を算出する分散算出器、16は平均値算出器11により算出された帯域別S/N比の平均値と分散算出器15により算出された帯域別S/N比の分散値とに基づいて現在の入力信号が音声区間又は雑音区間の何れであるかを判定する総合判定器である。なお、分散算出器15及び総合判定器16は判定手段を構成する。
【0049】
次に動作について説明する。
上記実施の形態1,2では、帯域別S/N比の正変動量を算出し、その正変動量を用いて音声区間であるか否かを判定するものについて示したが、帯域別S/N比の分散値を算出し、その分散値を用いて音声区間であるか否かを判定するようにしてもよい。
【0050】
具体的には、分散算出器15が帯域別S/N比の分散値SN_variance(i)を算出すると、総合判定器16が平均値算出器11により算出された平均S/N比SN_mean(i)と、分散算出器15により算出された帯域別S/N比の分散値SN_variance(i)と、前フレームにおける総合判定器16の出力値(音声らしさレベルspeech_level(i−1))とを用いて、図4の条件判定式2を実行することにより、現フレームiにおける音声らしさレベルspeech_level(i)を求める。
ここで、SN_variance_TH1,SN_variance_TH2は、帯域別S/N比の分散値に対する固定閾値である。
【0051】
この実施の形態4によれば、帯域別S/N比の平均値からの広がりを表す分散値を用いることにより、帯域別S/N比の平均値からの相対的な変動量を捉えることが可能になり、上記実施の形態1と同様の効果を奏することができる。
【0052】
実施の形態5.
図5はこの発明の実施の形態5による音声区間判定装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
17は帯域別S/N比算出器10により算出された帯域別S/N比が基準値以上である帯域の個数(高S/N比帯域数)を求める高S/N比帯域数算出器、18は平均値算出器11により算出された帯域別S/N比の平均値と高S/N比帯域数算出器17により求められた高S/N比帯域数とに基づいて現在の入力信号が音声区間又は雑音区間の何れであるかを判定する総合判定器である。なお、高S/N比帯域数算出器17及び総合判定器18は判定手段を構成する。
【0053】
次に動作について説明する。
上記実施の形態1,2では、帯域別S/N比の正変動量を算出し、その正変動量を用いて音声区間であるか否かを判定するものについて示したが、帯域別S/N比が基準値以上である帯域の個数(高S/N比帯域数)を求め、その高S/N比帯域数を用いて音声区間であるか否かを判定するようにしてもよい。
【0054】
具体的には、高S/N比帯域数算出器17は、帯域別S/N比算出器10が帯域別S/N比を出力すると、下式にしたがって高S/N比帯域数High_SNR_number(i)を求める。ただし、下式において、SNR_THは帯域別S/N比との比較に用いる固定閾値、ε(i,k)はフレーム番号i,帯域番号kにおける帯域別S/N比が閾値SNR_THより大きいか否かを示し、帯域別S/N比が閾値より大きければε(i,k)=1、そうでなければ、ε(i,k)=0である。
【0055】
【数2】
【0056】
総合判定器18が平均値算出器11により算出された平均S/N比SN_mean(i)と、高S/N比帯域数算出器17により求められた高S/N比帯域数High_SNR_number(i)と、前フレームにおける総合判定器18の出力値(音声らしさレベルspeech_level(i−1))とを用いて、図6の条件判定式3を実行することにより、現フレームiにおける音声らしさレベルspeech_level(i)を求める。
ここで、High_SNR_number_TH1,High_SNR_number_TH2は、高S/N比帯域数に対する固定閾値である。
【0057】
この実施の形態5では、高S/N比帯域数を用いて音声区間であるか否かを判定するものについて示したが、帯域当たりの高S/N比帯域数(High_SNR_number(i)/K)を算出し、帯域当たりの高S/N比帯域数を用いて音声区間であるか否かを判定するようにしてもよい。
この際、帯域当たりの高S/N比帯域数に対する閾値としては、High_SNR_number_TH1/K,High_SNR_number_TH2/Kを使用する。
【0058】
また、高S/N比帯域数の代わりに、帯域S/N比が閾値未満である帯域の数(低S/N比帯域数)を算出し、帯域数Kから低S/N比帯域数を差し引いた値や、低S/N比帯域数を帯域数Kで割った値(1−帯域当たりの低S/N比帯域数)をHigh_SNR_number(i)として、上記の条件判定式3を実行するなど、帯域別S/N比が基準値未満である帯域の数又は割合を用いて判定することも可能である。
【0059】
この実施の形態5によれば、帯域別S/N比が基準値以上である帯域の個数又は割合を用いることにより、相対的に帯域別S/N比の高い帯域を捉えることが可能になり、上記実施の形態1と同様の効果を奏することができる。
【0060】
実施の形態6.
図7はこの発明の実施の形態6による音声区間判定装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
19は現フレームにおける入力信号の信号エネルギーを算出するエネルギー算出器、20は現フレームにおける入力信号の差分信号エネルギーを算出する差分エネルギー算出器、21は入力信号の信号エネルギーと差分信号エネルギーを考慮して現在の入力信号が音声区間又は雑音区間の何れであるかを判定する総合判定器である。なお、エネルギー算出器19,差分エネルギー算出器20及び総合判定器21は判定手段を構成する。
【0061】
次に動作について説明する。
上記実施の形態1では、平均S/N比と正変動量を考慮して、現在の入力信号が音声区間又は雑音区間の何れであるかを判定するものについて示したが、さらに、入力信号の信号エネルギーと差分信号エネルギーを考慮して判定するようにしてもよい。
なお、この例では、時間信号からエネルギーを算出するものについて示しているが、これに限るものではなく、周波数スペクトルから得られるスペクトルパワーを用いてもよいし、両者を用いてもよい。
【0062】
具体的には、エネルギー算出器19は、フレーム毎に入力信号の信号エネルギーEnergy(i)を下式にしたがって算出する。
ただし、下式において、Nはフレーム長をサンプル数で表現した場合の値であり、例えば、サンプリング周波数が8kHz、フレーム長20msecの場合、N=160となる。また、X(i,n)はフレーム(フレーム番号=i)内のn番目の入力信号である。
【0063】
【数3】
【0064】
差分エネルギー算出器20は、前フレームの信号エネルギーEnergy(i−1)と現フレームの信号エネルギーEnergy(i)との差分、即ち、Energy(i)−Energy(i−1)を計算することにより、入力信号の差分信号エネルギーdelta_Energy(i)を算出する。
【0065】
総合判定器21は、平均S/N比SN_mean(i)と、帯域別S/N比の正変動量SN_plus_variation(i)と、現フレームの信号エネルギーEnergy(i)と、差分信号エネルギーdelta_Energy(i)と、前フレームにおける総合判定器21の出力値(音声らしさレベルspeech_level(i−1))とを用いて、図8の条件判定式4を実行することにより、現フレームiにおける音声らしさレベルspeech_level(i)を求める。
【0066】
ただし、Energy_THは現フレームの信号エネルギーEnergy(i)に対する固定閾値、delta_Energy_THは差分信号エネルギーdelta_Energy(i)に対する固定閾値である。
【0067】
この実施の形態6によれば、背景雑音の推定精度に依存する帯域別S/N比の平均値及び正変動量に加えて、背景雑音の推定精度に依存しない入力信号の信号エネルギー及び差分信号エネルギーを用いることにより、背景雑音の推定精度が劣化しても、精度よく音声区間を判定することができる効果を奏する。
【0068】
実施の形態7.
上記実施の形態6では、上記実施の形態1に対してエネルギー算出器19と差分エネルギー算出器20を追加することにより、入力信号の信号エネルギーと差分信号エネルギーを考慮して判定処理を実施するものについて示したが、上記実施の形態2,3に対してエネルギー算出器19と差分エネルギー算出器20を追加することにより、入力信号の信号エネルギーと差分信号エネルギーを考慮して判定処理を実施するようにしてもよく、上記実施の形態6と同様の効果を奏することができる。
【0069】
実施の形態8.
上記実施の形態6では、上記実施の形態1に対してエネルギー算出器19と差分エネルギー算出器20を追加することにより、入力信号の信号エネルギーと差分信号エネルギーを考慮して判定処理を実施するものについて示したが、図9に示すように、上記実施の形態4に対してエネルギー算出器19と差分エネルギー算出器20を追加することにより、総合判定器(判定手段)22が入力信号の信号エネルギーと差分信号エネルギーを考慮して判定処理を実施するようにしてもよく、上記実施の形態6と同様の効果を奏することができる。
この場合、総合判定器22は、図10の条件判定式5を実行することにより、現フレームiにおける音声らしさレベルspeech_level(i)を求める。
【0070】
この実施の形態8によれば、背景雑音の推定精度に依存する帯域別S/N比の平均値及び分散値に加えて、背景雑音の推定精度に依存しない入力信号の信号エネルギー及び差分信号エネルギーを用いることにより、背景雑音の推定精度が劣化しても、精度よく音声区間を判定することができる効果を奏する。
【0071】
実施の形態9.
上記実施の形態6では、上記実施の形態1に対してエネルギー算出器19と差分エネルギー算出器20を追加することにより、入力信号の信号エネルギーと差分信号エネルギーを考慮して判定処理を実施するものについて示したが、図11に示すように、上記実施の形態5に対してエネルギー算出器19と差分エネルギー算出器20を追加することにより、総合判定器(判定手段)23が入力信号の信号エネルギーと差分信号エネルギーを考慮して判定処理を実施するようにしてもよく、上記実施の形態6と同様の効果を奏することができる。
この場合、総合判定器23は、図12の条件判定式6を実行することにより、現フレームiにおける音声らしさレベルspeech_level(i)を求める。
【0072】
この実施の形態9によれば、背景雑音の推定精度に依存する帯域別S/N比の平均値及び高S/N比帯域数に加えて、背景雑音の推定精度に依存しない入力信号の信号エネルギー及び差分信号エネルギーを用いることにより、背景雑音の推定精度が劣化しても、精度よく音声区間を判定することができる効果を奏する。
【0073】
実施の形態10.
上記実施の形態1〜9では、総合判定器13等が音声区間の判定処理に用いる判定パラメータ(例えば、帯域別S/N比の平均値、上位N位の帯域別S/N比、正変動量、負変動量、分散値、高S/N比帯域数、高S/N比帯域の割合)に対する閾値が固定のものを示したが、帯域別S/N比算出部10により算出された帯域別S/N比にしたがって、これらの閾値を更新するようにしてもよい。
【0074】
以下、閾値の判定処理を具体的に説明する。
図13は総合判定器13の内部を示す構成図であり、図において、13aは帯域別S/N比の平均値を入力して判定処理を実行する個別判定器、13bは帯域別S/N比の正変動量を入力して判定処理を実行する個別判定器である。
図14は個別判定器13a,13bの内部を示す構成図であり、図において、31は比較演算器、32は閾値保持器、33は閾値更新器である。
【0075】
次に動作について説明する。
比較演算器31は、判定パラメータと閾値保持器32に保持されている閾値との大小比較を実施し、判定パラメータの値が閾値よりも大きければ音声らしさレベルを上げる一方、小さければ音声らしさレベルを下げ、この結果、得られた音声らしさレベルを出力する。
【0076】
閾値更新器33は、現フレームの判定パラメータの値と過去の判定パラメータの値を用いて閾値を更新する。以下、判定パラメータの一例として、帯域別S/N比の平均値(平均S/N比)に対する閾値の更新処理を説明する。ただし、他の閾値も同様にして更新する。
図15は平均S/N比から過去数フレーム(図では5フレーム)内における平均S/N比の最大値を求める様子を示している。
【0077】
図15の上段において、例えば、時刻t1 に着目すると、過去5フレーム(Aの範囲)の平均S/N比の最大値は、時刻t1,max のときの値であり、時刻t1,max の値を図15の下段にプロットする。時刻t1 以外の各時刻についても同様にして、図15の下段に最大値をプロットする。
そして、閾値更新器33は、図15の下段に示される平均S/N比の最大値を下式に代入して、新たな閾値を計算する。
SN_mean_TH(i) =γ・SN_mean_TH(i−1) +(1−γ)・SN_mean_max(i)
【0078】
ただし、SN_mean_TH(i)はフレームiの平均S/N比に対する更新後の閾値、SN_mean_max(i)は過去5フレーム内の平均S/N比の最大値、γは平均S/N比に対する閾値の収束速度であり、例えば、0.7という値をとるが、他にも帯域や音声らしさレベルによって値を変えたりしてもよい。
【0079】
これにより、この実施の形態10によれば、上記実施の形態1〜5の効果に加えて、例えば、雑音レベルが大きく上昇した場合、雑音レベルの上昇に追従して平均S/N比の最大値が小さくなり、これに連動して閾値も小さくなることから、固定閾値を用いる場合に比べて、追従性よく適切な閾値を設定することが可能となる。その結果、音声区間の判定精度が向上し、さらに雑音区間の帯域スペクトルの推定精度が向上する効果を奏する。
【0080】
また、閾値の更新に過去数フレーム内の最大値を用いることにより、従来から一般的に用いられているAR平滑を行う場合と比べて、閾値が過渡に変化せず、また、背景雑音レベルの変化量の大小に拘わらず、安定した音声区間の判定を実施することができる効果を奏する。なお、AR平滑を用いて、各種の閾値を更新してもよいことは言うまでもない。
【0081】
【発明の効果】
以上のように、この発明によれば、帯域分割手段により求められた入力信号の現在の区間の帯域スペクトルと雑音区間と判定された過去の区間の帯域スペクトルとの比である帯域別S/N比を算出し、その帯域別S/N比に基づいて入力信号の現在の区間が音声区間又は雑音区間の何れであるかを判定するように構成したので、現在の入力信号のS/N比が低い等の場合でも、的確に音声区間を判定することができる効果がある。
この発明によれば、S/N比算出手段により算出された帯域別S/N比の正変動量を算 出し、判定処理を実行するに際して、その正変動量を考慮するように構成したので、音声区間の判定精度を高めることができる効果がある。
【0082】
この発明によれば、S/N比算出手段により算出された帯域別S/N比の負変動量を算出し、判定処理を実行するに際して、その負変動量を考慮するように構成したので、音声区間の判定精度を高めることができる効果がある。
【0083】
この発明によれば、入力信号の現在の区間が雑音区間であると判定する場合、入力信号の帯域スペクトルにより過去の雑音区間の帯域スペクトルを更新するように構成したので、過去の雑音区間の帯域スペクトルの確度を高めることができる効果がある。
【0084】
この発明によれば、S/N比算出手段により算出された帯域別S/N比の平均値を算出し、判定処理を実行するに際して、その平均値を考慮するように構成したので、音声区間の判定精度を高めることができる効果がある。
【0085】
この発明によれば、S/N比算出手段により算出された帯域別S/N比のうち上位N位(Nは自然数)の帯域別S/N比を検索し、判定処理を実行するに際して、その帯域別S/N比を考慮するように構成したので、音声区間の判定精度を高めることができる効果がある。
【0086】
この発明によれば、S/N比算出手段により算出された帯域別S/N比の分散値を算出し、判定処理を実行するに際して、その分散値を考慮するように構成したので、音声区間の判定精度を高めることができる効果がある。
【0087】
この発明によれば、S/N比算出手段により算出された帯域別S/N比が基準値以上である帯域の個数又は割合を求め、判定処理を実行するに際して、その個数又は割合を考慮するように構成したので、音声区間の判定精度を高めることができる効果がある。
【0088】
この発明によれば、判定処理を実行するに際して、入力信号の現在の信号エネルギーを考慮するように構成したので、背景雑音の推定精度が劣化しても、精度よく音声区間を判定することができる効果がある。
【0089】
この発明によれば、判定処理を実行するに際して、入力信号の差分信号エネルギーを考慮するように構成したので、背景雑音の推定精度が劣化しても、精度よく音声区間を判定することができる効果がある。
【0090】
この発明によれば、S/N比算出手段により算出された帯域別S/N比にしたがって判定処理に用いる閾値を更新するように構成したので、音声区間の判定精度がさらに向上する効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1による音声区間判定装置を示す構成図である。
【図2】条件判定式1を示す説明図である。
【図3】この発明の実施の形態4による音声区間判定装置を示す構成図である。
【図4】条件判定式2を示す説明図である。
【図5】この発明の実施の形態5による音声区間判定装置を示す構成図である。
【図6】条件判定式3を示す説明図である。
【図7】この発明の実施の形態6による音声区間判定装置を示す構成図である。
【図8】条件判定式4を示す説明図である。
【図9】この発明の実施の形態8による音声区間判定装置を示す構成図である。
【図10】条件判定式5を示す説明図である。
【図11】この発明の実施の形態9による音声区間判定装置を示す構成図である。
【図12】条件判定式6を示す説明図である。
【図13】総合判定器13の内部を示す構成図である。
【図14】個別判定器13a,13bの内部を示す構成図である。
【図15】平均S/N比から過去数フレーム内における平均S/N比の最大値を求める様子を示す説明図である。
【図16】帯域別S/N比の一例を表す説明図である。
【符号の説明】
1 入力端子、2 A/D変換器、3 窓関数演算器、4 高域強調器、5 直交変換器(直交変換手段)、6 帯域分割器(帯域分割手段)、7 切換スイッチ、8 雑音更新器(判定手段)、9 雑音保持器(判定手段)、10 帯域別S/N比算出器(S/N比算出手段)、11 平均値算出器(判定手段)、12 正変動量算出器(判定手段)、13 総合判定器(判定手段)、13a 個別判定器、13b 個別判定器、14 出力端子、15 分散算出器(判定手段)、16 総合判定器(判定手段)、17 高S/N比帯域数算出器(判定手段)、18 総合判定器(判定手段)、19 エネルギー算出器(判定手段)、20 差分エネルギー算出器(判定手段)、21 総合判定器(判定手段)、22 総合判定器(判定手段)、23 総合判定器(判定手段)、31 比較演算器、32 閾値保持器、33 閾値更新器。
Claims (12)
- 所定の区間ごとに入力される入力信号を時間軸信号から周波数軸信号に直交変換して現在の区間の入力信号の周波数スペクトルを求める直交変換手段と、上記直交変換手段により求められた周波数スペクトルを複数の周波数帯域に分割して現在の区間の帯域スペクトルを求める帯域分割手段と、上記帯域分割手段により求められた現在の区間の帯域スペクトルと雑音区間と判定された過去の区間の帯域スペクトルとの比である帯域別S/N比を算出するS/N比算出手段と、上記S/N比算出手段により算出された帯域別S/N比に基づいて入力信号の現在の区間が音声区間又は雑音区間の何れであるかを判定する判定手段とを備えた音声区間判定装置において、上記判定手段は上記S/N比算出手段により算出された帯域別S/N比の正変動量を算出し、判定処理を実行するに際して、その正変動量を考慮することを特徴とする音声区間判定装置。
- 所定の区間ごとに入力される入力信号を時間軸信号から周波数軸信号に直交変換して現在の区間の入力信号の周波数スペクトルを求める直交変換手段と、上記直交変換手段により求められた周波数スペクトルを複数の周波数帯域に分割して現在の区間の帯域スペクトルを求める帯域分割手段と、上記帯域分割手段により求められた現在の区間の帯域スペクトルと雑音区間と判定された過去の区間の帯域スペクトルとの比である帯域別S/N比を算出するS/N比算出手段と、上記S/N比算出手段により算出された帯域別S/N比に基づいて入力信号の現在の区間が音声区間又は雑音区間の何れであるかを判定する判定手段とを備えた音声区間判定装置において、上記判定手段は上記S/N比算出手段により算出された帯域別S/N比の負変動量を算出し、判定処理を実行するに際して、その負変動量を考慮することを特徴とする音声区間判定装置。
- 判定手段は、入力信号の現在の区間が雑音区間であると判定する場合、入力信号の現在の区間の帯域スペクトルにより過去の雑音区間の帯域スペクトルを更新することを特徴とする請求項1または請求項2記載の音声区間判定装置。
- 判定手段は、S/N比算出手段により算出された帯域別S/N比の平均値を算出し、判定処理を実行するに際して、その平均値を考慮することを特徴とする請求項1から請求項3のうちのいずれか1項記載の音声区間判定装置。
- 判定手段は、S/N比算出手段により算出された帯域別S/N比のうち上位N位(Nは自然数)の帯域別S/N比を検索し、判定処理を実行するに際して、その帯域別S/N比を考慮することを特徴とする請求項1から請求項3のうちのいずれか1項記載の音声区間判定装置。
- 判定手段は、S/N比算出手段により算出された帯域別S/N比の分散値を算出し、判定処理を実行するに際して、その分散値を考慮することを特徴とする請求項1から請求項5のうちのいずれか1項記載の音声区間判定装置。
- 判定手段は、S/N比算出手段により算出された帯域別S/N比が基準値以上である帯域の個数又は割合を求め、判定処理を実行するに際して、その個数又は割合を考慮することを特徴とする請求項1から請求項5のうちのいずれか1項記載の音声区間判定装置。
- 判定手段は、判定処理を実行するに際して、入力信号の現在の区間の信号エネルギーを考慮することを特徴とする請求項1から請求項7のうちのいずれか1項記載の音声区間判定装置。
- 判定手段は、判定処理を実行するに際して、入力信号の現在の区間の差分信号エネルギーを考慮することを特徴とする請求項1から請求項8のうちのいずれか1項記載の音声区間判定装置。
- 判定手段は、S/N比算出手段により算出された帯域別S/N比にしたがって判定処理に用いる閾値を更新することを特徴とする請求項1から請求項9のうちのいずれか1項記載の音声区間判定装置。
- 所定の区間ごとに入力される入力信号を時間軸信号から周波数軸信 号に直交変換して現在の区間の入力信号の周波数スペクトルを求めると、その周波数スペクトルを複数の周波数帯域に分割して現在の区間の帯域スペクトルを求め、その現在の区間の帯域スペクトルと雑音区間と判定された過去の区間の帯域スペクトルとの比である帯域別S/N比を算出し、その帯域別S/N比に基づいて入力信号の現在の区間が音声区間又は雑音区間の何れであるかを判定する音声区間判定方法において、その帯域別S/N比の正変動量を算出し、判定処理を実行するに際して、その正変動量を考慮することを特徴とする音声区間判定方法。
- 所定の区間ごとに入力される入力信号を時間軸信号から周波数軸信号に直交変換して現在の区間の入力信号の周波数スペクトルを求めると、その周波数スペクトルを複数の周波数帯域に分割して現在の区間の帯域スペクトルを求め、その現在の区間の帯域スペクトルと雑音区間と判定された過去の区間の帯域スペクトルとの比である帯域別S/N比を算出し、その帯域別S/N比に基づいて入力信号の現在の区間が音声区間又は雑音区間の何れであるかを判定する音声区間判定方法において、その帯域別S/N比の負変動量を算出し、判定処理を実行するに際して、その負変動量を考慮することを特徴とする音声区間判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000074262A JP3588030B2 (ja) | 2000-03-16 | 2000-03-16 | 音声区間判定装置及び音声区間判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000074262A JP3588030B2 (ja) | 2000-03-16 | 2000-03-16 | 音声区間判定装置及び音声区間判定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001265367A JP2001265367A (ja) | 2001-09-28 |
JP3588030B2 true JP3588030B2 (ja) | 2004-11-10 |
Family
ID=18592349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000074262A Expired - Lifetime JP3588030B2 (ja) | 2000-03-16 | 2000-03-16 | 音声区間判定装置及び音声区間判定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3588030B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009145192A1 (ja) * | 2008-05-28 | 2009-12-03 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4798601B2 (ja) * | 2004-12-28 | 2011-10-19 | 株式会社国際電気通信基礎技術研究所 | 音声区間検出装置および音声区間検出プログラム |
US8300834B2 (en) | 2005-07-15 | 2012-10-30 | Yamaha Corporation | Audio signal processing device and audio signal processing method for specifying sound generating period |
JP4675840B2 (ja) * | 2006-06-29 | 2011-04-27 | 三菱電機株式会社 | リモートコントローラ並びに家電機器 |
JP4690973B2 (ja) * | 2006-09-05 | 2011-06-01 | 日本電信電話株式会社 | 信号区間推定装置、方法、プログラム及びその記録媒体 |
US8069039B2 (en) | 2006-12-25 | 2011-11-29 | Yamaha Corporation | Sound signal processing apparatus and program |
JP2008158315A (ja) * | 2006-12-25 | 2008-07-10 | Yamaha Corp | 音信号処理装置およびプログラム |
JP4349415B2 (ja) * | 2006-12-25 | 2009-10-21 | ヤマハ株式会社 | 音信号処理装置およびプログラム |
JP4840149B2 (ja) * | 2007-01-12 | 2011-12-21 | ヤマハ株式会社 | 発音期間を特定する音信号処理装置およびプログラム |
JP4986028B2 (ja) * | 2007-01-19 | 2012-07-25 | Kddi株式会社 | 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体 |
JP4973287B2 (ja) * | 2007-04-06 | 2012-07-11 | ヤマハ株式会社 | 音処理装置およびプログラム |
JP4327888B1 (ja) | 2008-05-30 | 2009-09-09 | 株式会社東芝 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
JP4327886B1 (ja) | 2008-05-30 | 2009-09-09 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP4506896B2 (ja) * | 2009-04-15 | 2010-07-21 | ヤマハ株式会社 | 音信号処理装置およびプログラム |
JP5874344B2 (ja) * | 2010-11-24 | 2016-03-02 | 株式会社Jvcケンウッド | 音声判定装置、音声判定方法、および音声判定プログラム |
JP5898515B2 (ja) * | 2012-02-15 | 2016-04-06 | ルネサスエレクトロニクス株式会社 | 半導体装置及び音声通信装置 |
JP5867199B2 (ja) * | 2012-03-14 | 2016-02-24 | 富士通株式会社 | 雑音推定装置、雑音推定方法及び雑音推定用コンピュータプログラム |
JP6059130B2 (ja) * | 2013-12-05 | 2017-01-11 | 日本電信電話株式会社 | 雑音抑圧方法とその装置とプログラム |
CN107293287B (zh) | 2014-03-12 | 2021-10-26 | 华为技术有限公司 | 检测音频信号的方法和装置 |
JP6394103B2 (ja) * | 2014-06-20 | 2018-09-26 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
JP6531412B2 (ja) * | 2015-02-09 | 2019-06-19 | 沖電気工業株式会社 | 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム |
JP6596833B2 (ja) * | 2015-02-09 | 2019-10-30 | 沖電気工業株式会社 | 雑音抑圧装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム |
-
2000
- 2000-03-16 JP JP2000074262A patent/JP3588030B2/ja not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009145192A1 (ja) * | 2008-05-28 | 2009-12-03 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
US8589152B2 (en) | 2008-05-28 | 2013-11-19 | Nec Corporation | Device, method and program for voice detection and recording medium |
JP5381982B2 (ja) * | 2008-05-28 | 2014-01-08 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2001265367A (ja) | 2001-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3588030B2 (ja) | 音声区間判定装置及び音声区間判定方法 | |
WO2022012367A1 (zh) | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 | |
KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
CN103109320B (zh) | 噪声抑制装置 | |
WO2006123721A1 (ja) | 雑音抑圧方法およびその装置 | |
WO2013118192A1 (ja) | 雑音抑圧装置 | |
CN104269180B (zh) | 一种用于语音质量客观评价的准干净语音构造方法 | |
CN111128215A (zh) | 一种单通道实时降噪方法及系统 | |
CN113241089B (zh) | 语音信号增强方法、装置及电子设备 | |
CN114005457A (zh) | 一种基于幅度估计与相位重构的单通道语音增强方法 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
KR101295727B1 (ko) | 적응적 잡음추정 장치 및 방법 | |
WO2017128910A1 (zh) | 一种语音出现概率的确定方法、装置及电子设备 | |
Nakatani et al. | Dominance spectrum based V/UV classification and F0 estimation | |
KR100798056B1 (ko) | 높은 비정적인 잡음 환경에서의 음질 개선을 위한 음성처리 방법 | |
KR100931487B1 (ko) | 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치 | |
Lu | Reduction of musical residual noise using block-and-directional-median filter adapted by harmonic properties | |
JP3761497B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
Zhang et al. | Speech enhancement for nonstationary noise environments | |
Islam et al. | Speech enhancement based on noise compensated magnitude spectrum | |
Ishimoto et al. | A fundamental frequency estimation method for noisy speech based on instantaneous amplitude and frequency | |
Islam et al. | Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation | |
Prodeus et al. | Objective estimation of the quality of radical noise suppression algorithms | |
Schwab et al. | Robust noise estimation applied to different speech estimators | |
Selvi et al. | A New Hybridized Speech Enhancement Technique for Stationary and Non-Stationary Noisy Environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040713 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040811 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3588030 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070820 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100820 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110820 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110820 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120820 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120820 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130820 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |