JP2001265367A - 音声区間判定装置 - Google Patents

音声区間判定装置

Info

Publication number
JP2001265367A
JP2001265367A JP2000074262A JP2000074262A JP2001265367A JP 2001265367 A JP2001265367 A JP 2001265367A JP 2000074262 A JP2000074262 A JP 2000074262A JP 2000074262 A JP2000074262 A JP 2000074262A JP 2001265367 A JP2001265367 A JP 2001265367A
Authority
JP
Japan
Prior art keywords
ratio
band
section
determination
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000074262A
Other languages
English (en)
Other versions
JP3588030B2 (ja
Inventor
Takuji Ikeda
卓史 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000074262A priority Critical patent/JP3588030B2/ja
Publication of JP2001265367A publication Critical patent/JP2001265367A/ja
Application granted granted Critical
Publication of JP3588030B2 publication Critical patent/JP3588030B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力信号のS/N比が低い等の場合には、音
声区間の判別精度が悪くなり、音声区間を雑音区間と誤
判定する課題があった。 【解決手段】 帯域分割器6により求められたフレーム
信号の帯域スペクトルと過去の雑音区間の帯域スペクト
ルとの比である帯域別S/N比を算出し、その帯域別S
/N比に基づいて現在のフレーム信号が音声区間又は雑
音区間の何れであるかを判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、種々の雑音環境
下で用いられる音声通信システムや音声認識システム等
において、所定の区間ごとに入力される入力信号が音声
区間であるか又は、雑音区間かを判別する音声区間判定
装置に関するものである。
【0002】
【従来の技術】雑音のある環境下において、正確に音声
認識を行う必要がある場合、音声区間判定装置が用いら
れる。例えば、特開昭59−99497号公報には、入
力信号の直交変換を実施し、その変換値から求めたスペ
クトルに基づいて入力信号パワーと雑音信号パワーとの
比であるS/N比を算出し、そのS/N比と固定閾値を
大小比較することにより、音声区間を検出する音声区間
判定装置が開示されている。
【0003】また、背景雑音と音声信号が混在する入力
信号から、音質を損なうことなく背景雑音を除去する背
景雑音除去装置においては、入力信号の様態を検出する
様態検出手段が用いられ、その様態検出手段は、例え
ば、特開平10−171497号公報に開示されてい
る。その様態検出手段は、文献(Steven F.B
oll,“Suppression of Acous
tic noise in speech using
spectral subtraction”,IE
EE Trans.ASSP,Vol.ASSP−2
7,No.2,April 1979)に示された振幅
スペクトルに着目した方法、即ち、スペクトルサブトラ
クション(Spectral Subtractio
n:SS)法に基づく方法である。
【0004】具体的には、周波数軸上において、背景雑
音と音声信号を含む入力信号から、過去の背景雑音を平
均して求めた背景雑音の推定値を減算することにより、
入力信号中に含まれる背景雑音の定常成分を取り除き、
減算後の信号と背景雑音の推定値から、全周波数帯域の
S/N比(SN_all)と、全周波数帯域を複数の帯
域に分割した小帯域毎のS/N比(SN_ch(i),
iはチャネル番号))とを計算する。そして、これらの
差分(SN_ch(i)−SN_all)が所定値以下
の帯域では、背景雑音の急峻な変化に対応する背景雑音
を推定し、この推定値を用いてさらに減算処理を行うこ
とにより、背景雑音の非定常成分を取り除くものであ
る。
【0005】また、音声区間の検出を実行する際に固定
閾値との比較を行うのではなく、入力信号の様態に応じ
て、閾値を随時更新し、更新後の閾値との比較を行う手
段が、例えば、特開平2−272836号公報に開示さ
れている。これは、入力信号のパワーを計算し、このパ
ワー値,零交差回数,最大零交差間隔及び過去の音声区
間の判定結果に基づいて閾値の更新を随時実行し、現フ
レームのパワー値と更新後の閾値とを比較することによ
り、音声区間の検出を行うものである。
【0006】
【発明が解決しようとする課題】従来の音声区間判定装
置は以上のように構成されているので、音声区間の判別
精度が悪く、音声区間を雑音区間と誤判定する課題があ
った。具体的には、下記に示す理由から誤判定を招いて
いる。
【0007】特開昭59−99497号公報に記載され
ている音声区間判定装置は、入力信号パワーと雑音信号
パワーとの比であるS/N比(全周波数帯域のS/N
比)を用いて、音声区間判定を実施している。図16は
帯域別S/N比(全周波数が複数の小帯域に分割された
小帯域毎のS/N比)の一例を表しており、(a)は雑
音区間、(b)は音声区間である。図16において、帯
域別S/N比の平均値は(a),(b)ともに等しく
(μ1 =μ2 )、閾値THとの大小比較により音声区間
判定を行うと、帯域別S/N比の平均値μ1 ,μ2 が閾
値THよりも小さいため、どちらの場合においても「雑
音区間(非音声区間)」と判定される。
【0008】しかし、帯域別S/N比が図16(b)に
示すものである場合、低域において、帯域別S/N比が
平均値μ2 よりも高い帯域の数が、図16(a)に示す
ものよりも多く、また、これらの帯域では平均値μ2
の差が大きく、本来なら「音声区間」であると判定され
るべきである。ところが、従来の音声区間判定装置で
は、この「音声区間」を「雑音区間」と誤判定してしま
う。
【0009】また、従来の音声区間判定装置では、入力
信号が音声区間であるか否かを判定する際に使用する閾
値THが固定値であるため、背景雑音の定常性を仮定し
て、閾値THを設定する場合が多い。このようにして、
閾値THを設定すると、入力信号中の雑音レベルが急に
大きく変動する場合(例えば、音声通話中に乗用車が側
を通り過ぎる場合には、雑音レベルが急に大きく変動す
る)には、全周波数帯域のS/N比が小さくなり、閾値
TH以下となることがある。この場合、音声区間であっ
ても、雑音区間であると誤判定される。
【0010】上記課題を解決するため、特開平2−27
2836号公報には、フレームパワー,零交差回数,最
大零交差間隔及び有音/無音の判定結果に基づいて閾値
を適応的に算出するものが開示されている。即ち、零交
差回数,最大零交差間隔及び有音/無音の判定出力の間
にある条件を満足する場合に限り、過去フレームのパワ
ーの平均値と現フレームのパワーの重み付け平均(AR
平滑)を実施し、その重み付け平均を実施した値を定数
倍した値を新たな閾値とすることにより、閾値の更新を
行っている。しかし、高雑音下では入力信号に占める雑
音成分の割合が高いため、音声パワーとの判別が困難に
なり、また、零交差回数や最大零交差間隔の雑音区間で
の分布が音声区間での分布に類似した分布となるため、
閾値の更新が適切に行われず、常に音声区間と判定され
るため、雑音区間を音声区間と誤判定する課題があっ
た。
【0011】また、特開平10−171497号公報で
は、小帯域毎の帯域別S/N比と全周波数帯域のS/N
比との差分値に応じて、スペクトル減算後の入力信号ス
ペクトルに含まれる背景雑音の非定常成分を取り除いて
いる。この方法は、帯域間の帯域別S/N比のばらつき
を考慮に入れた方法であり、雑音の引き去り処理に対す
る効果は見られるが、音声区間の判定精度を高めること
はできない。
【0012】この発明は上記のような課題を解決するた
めになされたもので、入力信号のS/N比が低い場合で
も、的確に音声区間を判定することができる音声区間判
定装置を得ることを目的とする。
【0013】
【課題を解決するための手段】この発明に係る音声区間
判定装置は、帯域分割手段により求められた入力信号の
現在の区間の帯域スペクトルと雑音区間と判定された過
去の区間の帯域スペクトルとの比である帯域別S/N比
を算出し、その帯域別S/N比に基づいて入力信号の現
在の区間が音声区間又は雑音区間の何れであるかを判定
するようにしたものである。
【0014】この発明に係る音声区間判定装置は、入力
信号の現在の区間が雑音区間であると判定する場合、入
力信号の現在の区間の帯域スペクトルにより過去の雑音
区間の帯域スペクトルを更新するようにしたものであ
る。
【0015】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比の平均値
を算出し、判定処理を実行するに際して、その平均値を
考慮するようにしたものである。
【0016】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比のうち上
位N位(Nは自然数)の帯域別S/N比を検索し、判定
処理を実行するに際して、その帯域別S/N比を考慮す
るようにしたものである。
【0017】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比の正変動
量を算出し、判定処理を実行するに際して、その正変動
量を考慮するようにしたものである。
【0018】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比の負変動
量を算出し、判定処理を実行するに際して、その負変動
量を考慮するようにしたものである。
【0019】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比の分散値
を算出し、判定処理を実行するに際して、その分散値を
考慮するようにしたものである。
【0020】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比が基準値
以上である帯域の個数又は割合を求め、判定処理を実行
するに際して、その個数又は割合を考慮するようにした
ものである。
【0021】この発明に係る音声区間判定装置は、判定
処理を実行するに際して、入力信号の現在の信号エネル
ギーを考慮するようにしたものである。
【0022】この発明に係る音声区間判定装置は、判定
処理を実行するに際して、入力信号の差分信号エネルギ
ーを考慮するようにしたものである。
【0023】この発明に係る音声区間判定装置は、S/
N比算出手段により算出された帯域別S/N比にしたが
って判定処理に用いる閾値を更新するようにしたもので
ある。
【0024】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による音
声区間判定装置を示す構成図であり、図において、1は
例えばマイクロフォンにより取り込まれた信号(入力信
号)を入力する入力端子、2は入力端子1から入力され
た信号を所定の周波数でサンプリングを実施し、そのサ
ンプリング結果であるフレーム信号(所定のサンプル数
毎に区切られたフレーム信号)をアナログ/ディジタル
変換するA/D変換器、3はA/D変換器2が出力する
フレーム信号に対して窓関数演算を実行する窓関数演算
器、4は窓関数演算器3の演算結果を一次のディジタル
フィルタに通すことにより高域強調処理を実施する高域
強調器である。
【0025】5は高域強調器4により高域強調されたフ
レーム信号を直交変換して、そのフレーム信号の周波数
スペクトルを求める直交変換器(直交変換手段)、6は
直交変換器5により求められた周波数スペクトルを複数
の帯域に分割して、そのフレーム信号の帯域スペクトル
を求める帯域分割器(帯域分割手段)、7は総合判定器
13により制御される切換スイッチ、8は総合判定器1
3が現在の入力信号が雑音区間であると判定する場合、
入力信号の帯域スペクトルにより過去の雑音区間の帯域
スペクトルを更新する雑音更新器、9は過去の雑音区間
の帯域スペクトルを保持する雑音保持器である。
【0026】10は帯域分割器6により求められたフレ
ーム信号の帯域スペクトルと過去の雑音区間の帯域スペ
クトルとの比である帯域別S/N比を算出する帯域別S
/N比算出器(S/N比算出手段)、11は帯域別S/
N比算出器10により算出された帯域別S/N比の平均
値を算出する平均値算出器、12は帯域別S/N比算出
器10により算出された帯域別S/N比の正変動量を算
出する正変動量算出器、13は平均値算出器11により
算出された帯域別S/N比の平均値と正変動量算出器1
2により算出された帯域別S/N比の正変動量とに基づ
いて現在の入力信号が音声区間又は雑音区間の何れであ
るかを判定する総合判定器、14は総合判定器13の判
定結果を出力する出力端子である。なお、雑音更新器
8,雑音保持器9,平均値算出器11,正変動量算出器
12及び総合判定器13から判定手段が構成されてい
る。
【0027】次に動作について説明する。例えば、マイ
クロフォンにより取り込まれた信号が入力端子1から入
力信号として入力されると、A/D変換器2は、その入
力信号に対して所定の周波数(例えば、8kHzの周波
数)でサンプリングを実施し、そのサンプリング結果で
あるフレーム信号をアナログ/ディジタル変換する。
【0028】窓関数演算器3は、A/D変換器2がフレ
ーム信号をアナログ/ディジタル変換すると、変換後の
フレーム信号に対して、例えば、ハニング窓などの窓関
数を乗じることにより窓関数演算を実行する。高域強調
器4は、窓関数演算器3の演算結果を下記に示すような
伝達関数H(z)を有する一次のディジタルフィルタに
通すことにより高域強調処理を実施する。
【0029】H(z)=1−α・z-1 z=exp(jω) ただし、ωは角周波数、jは虚数単位、αは高域強調係
数であり、通常1に近い値(例えば、0.8)が設定さ
れる。なお、高域強調器4を通さず、窓関数演算器3の
出力を直接直交変換器5に入力してもよい。
【0030】直交変換器5は、高域強調器4により高域
強調されたフレーム信号又は窓関数演算器3により窓関
数演算されたフレーム信号を入力すると、そのフレーム
信号に対して、例えば、高速フーリエ変換(FFT)な
どの直交変換処理を実行し、時間tの関数として表され
る時間軸信号を周波数成分(周波数スペクトル)に変換
する。
【0031】帯域分割器6は、直交変換器5が周波数ス
ペクトルを求めると、その周波数スペクトルを複数の帯
域に分割することにより、そのフレーム信号の帯域スペ
クトルを求める。例えば、周波数スペクトルを16の帯
域に分割し、それぞれの帯域毎にスペクトルの重み付け
平均をとり、これを帯域スペクトルX(i,k)とす
る。ただし、kは帯域番号、iはフレーム番号とする。
この他、直交変換された周波数スペクトルに対して、
「バークフィルタ」又は「メルフィルタ」等の聴覚特性
を模擬するフィルタを通した後、重み付け平均をとって
もよい。
【0032】帯域別S/N比算出器10は、帯域分割器
6がフレーム信号の帯域スペクトルX(i,k)を求め
ると、雑音保持器9に保持されている前フレームまでに
推定された雑音信号の帯域スペクトルN(i−1,k)
との比、即ち、帯域別S/N比を帯域毎に算出する。
【0033】平均値算出器11は、帯域別S/N比算出
器10が帯域別S/N比を出力すると、現フレームiに
おける帯域別S/N比の平均値SN_mean(i)
(以下、平均S/N比という)を算出する。正変動量算
出器12は、帯域別S/N比算出器10が帯域別S/N
比を出力し、平均値算出器11が平均S/N比SN_m
ean(i)を出力すると、これらから下式にしたがっ
て帯域別S/N比の正変動量SN_plus_vari
ation(i)を算出する。ここで、帯域別S/N比
の正変動量とは、帯域別S/N比が平均S/N比より高
い帯域において、帯域別S/N比と平均S/N比の差を
加算したものである。ただし、下式において、Kは帯域
数、SNR(i,k)はフレーム番号i,帯域番号kに
おける帯域別S/N比である。
【0034】
【数1】
【0035】この実施の形態1では、帯域別S/N比が
平均S/N比より高い帯域において、帯域別S/N比と
平均S/N比の差を加算して正変動量を算出するものに
ついて示したが、帯域別S/N比の最大値と平均S/N
比の差を正変動量としてもよい。また、帯域別S/N比
の上位N位までの帯域において、帯域別S/N比と平均
S/N比の差を加算して正変動量を算出してもよい。
【0036】総合判定器13は、平均値算出器11によ
り算出された平均S/N比SN_mean(i)と、正
変動量算出器12により算出された帯域別S/N比の正
変動量SN_plus_variation(i)と、
前フレームにおける総合判定器13の出力値(音声らし
さレベルspeech_level(i−1))とを用
いて、図2の条件判定式1を実行することにより、現フ
レームiにおける音声らしさレベルspeech_le
vel(i)を求める。ここで、音声らしさレベルは、
フレーム信号が音声区間である可能性を示す尺度であ
り、音声らしさレベルが高いほど、音声区間である可能
性が高い。
【0037】ただし、SN_mean_THは平均S/
N比に対する固定閾値、SN_plus_variat
ion_TH1,SN_plus_variation
_TH2は帯域別S/N比の正変動量に対する固定閾値
である。また、speech_tmpはフレームiにお
ける音声らしさレベルを求めるための一時変数である。
【0038】なお、この実施の形態1では、閾値との大
小比較により、音声らしさレベルが離散的に変化する場
合について示しているが、平均S/N比及び正変動量を
線形変換し、その変換値を加算した値を音声らしさレベ
ルとすることにより、音声らしさレベルを連続的に変化
させてもよい。ここで得られる音声らしさレベルの値
は、とりうる値が複数であるため、音声らしさの程度を
出力する場合であれば、音声らしさレベルの値をそのま
ま出力すればよいし、「音声区間」であるか「雑音区
間」であるかを判定する場合には、音声らしさレベルの
値が所定の閾値以上であれば「音声区間」、そうでなけ
れば「雑音区間」と判定すればよい。そして、その判定
結果を出力端子14から出力する。
【0039】総合判定器13は、上記判定処理の実行
後、次フレームの判定精度を高めるため、現フレームに
おける入力信号が雑音区間であると判定した場合、また
は、音声らしさレベルが低い場合、切換スイッチ7をa
側に切り換えて、雑音保持器9に保持されている雑音信
号の帯域スペクトルN(i−1,k)を更新させる。
【0040】雑音更新器8は、切換スイッチ7がa側に
切り換えられると、帯域分割器6が出力する現フレーム
における入力信号の帯域スペクトルX(i,k)と、雑
音保持器9に保持されている前フレームまでに推定され
た雑音信号の帯域スペクトルN(i−1,k)とを下式
に代入して、現フレームにおける雑音信号の帯域スペク
トルN(i,k)を算出し、雑音保持器9に保持されて
いる雑音信号を更新する。即ち、雑音保持器9の保持内
容を現フレームにおける雑音信号の帯域スペクトルN
(i,k)に変更する。
【0041】N(i,k)=β・N(i−1,k)+
(1−β)・X(i,k) ただし、βは雑音信号の推定速度を決定する係数であ
り、例えば、0.8という値をとるが、他にも帯域によ
って値を変えたり、音声らしさレベルが低い程、βを小
さくすることにより、音声らしさレベルに応じた値をと
るようにしてもよい。
【0042】以上で明らかなように、この実施の形態1
によれば、帯域分割器6により求められたフレーム信号
の帯域スペクトルと過去の雑音区間の帯域スペクトルと
の比である帯域別S/N比を算出し、その帯域別S/N
比に基づいて現在のフレーム信号が音声区間又は雑音区
間の何れであるかを判定するように構成したので、現在
のフレームのS/N比が低い等の場合でも、的確に音声
区間を判定することができる効果を奏する。
【0043】即ち、帯域別S/N比の正変動量を算出す
る正変動量算出器12を設けることにより、平均S/N
比だけではなく、帯域別S/N比の帯域毎の大きさの違
いを捉えることが可能となる。具体的には、平均S/N
比により音声らしさレベルの初期値を決定し(条件判定
式1のア,エ)、さらに帯域別S/N比の帯域毎の大き
さの違い(帯域別S/N比の正変動量)により音声らし
さレベルの初期値からの変化量を決定する(条件判定式
1のイ,ウ,オ,カ)。
【0044】例えば、図16に示す二つの帯域別S/N
比の平均S/N比は、両者とも閾値より小さいため、音
声らしさレベルの初期値が小さくなる。そして、図16
(a)の場合、正変動量が小さいので、音声らしさレベ
ルをさらに小さくし、図16(b)の場合、正変動量が
大きいので、音声らしさレベルを大きくする。これによ
り、帯域別S/N比の帯域毎の大きさの違いを考慮に入
れた精度のよい音声区間判定を行うことができる。
【0045】実施の形態2.上記実施の形態1では、帯
域別S/N比の平均値を用いて音声区間であるか否かを
判定するものについて示したが、帯域別S/N比のうち
上位N位(Nは自然数)の帯域別S/N比を検索し、判
定処理を実行するに際して、その帯域別S/N比を考慮
するようにしてもよい。なお、帯域別S/N比の最大値
を判定処理に用いる場合には、帯域別S/N比の最大値
を正変動量とすることにより、同様の音声区間判定を実
施することができる。
【0046】実施の形態3.上記実施の形態1,2で
は、帯域別S/N比の正変動量を算出し、その正変動量
を用いて音声区間であるか否かを判定するものについて
示したが、帯域別S/N比の負変動量を算出し(帯域別
S/N比の負変動量とは、帯域別S/N比が平均S/N
比より低い帯域において、帯域別S/N比と平均S/N
比の差を加算したものである)、その負変動量を用いて
音声区間であるか否かを判定するようにしてもよい。な
お、正変動量と負変動量は極性のみの違いである。
【0047】実施の形態4.図3はこの発明の実施の形
態4による音声区間判定装置を示す構成図であり、図に
おいて、図1と同一符号は同一または相当部分を示すの
で説明を省略する。15は帯域別S/N比算出器10に
より算出された帯域別S/N比の分散値を算出する分散
算出器、16は平均値算出器11により算出された帯域
別S/N比の平均値と分散算出器15により算出された
帯域別S/N比の分散値とに基づいて現在の入力信号が
音声区間又は雑音区間の何れであるかを判定する総合判
定器である。なお、分散算出器15及び総合判定器16
は判定手段を構成する。
【0048】次に動作について説明する。上記実施の形
態1,2では、帯域別S/N比の正変動量を算出し、そ
の正変動量を用いて音声区間であるか否かを判定するも
のについて示したが、帯域別S/N比の分散値を算出
し、その分散値を用いて音声区間であるか否かを判定す
るようにしてもよい。
【0049】具体的には、分散算出器15が帯域別S/
N比の分散値SN_variance(i)を算出する
と、総合判定器16が平均値算出器11により算出され
た平均S/N比SN_mean(i)と、分散算出器1
5により算出された帯域別S/N比の分散値SN_va
riance(i)と、前フレームにおける総合判定器
16の出力値(音声らしさレベルspeech_lev
el(i−1))とを用いて、図4の条件判定式2を実
行することにより、現フレームiにおける音声らしさレ
ベルspeech_level(i)を求める。ここ
で、SN_variance_TH1,SN_vari
ance_TH2は、帯域別S/N比の分散値に対する
固定閾値である。
【0050】この実施の形態4によれば、帯域別S/N
比の平均値からの広がりを表す分散値を用いることによ
り、帯域別S/N比の平均値からの相対的な変動量を捉
えることが可能になり、上記実施の形態1と同様の効果
を奏することができる。
【0051】実施の形態5.図5はこの発明の実施の形
態5による音声区間判定装置を示す構成図であり、図に
おいて、図1と同一符号は同一または相当部分を示すの
で説明を省略する。17は帯域別S/N比算出器10に
より算出された帯域別S/N比が基準値以上である帯域
の個数(高S/N比帯域数)を求める高S/N比帯域数
算出器、18は平均値算出器11により算出された帯域
別S/N比の平均値と高S/N比帯域数算出器17によ
り求められた高S/N比帯域数とに基づいて現在の入力
信号が音声区間又は雑音区間の何れであるかを判定する
総合判定器である。なお、高S/N比帯域数算出器17
及び総合判定器18は判定手段を構成する。
【0052】次に動作について説明する。上記実施の形
態1,2では、帯域別S/N比の正変動量を算出し、そ
の正変動量を用いて音声区間であるか否かを判定するも
のについて示したが、帯域別S/N比が基準値以上であ
る帯域の個数(高S/N比帯域数)を求め、その高S/
N比帯域数を用いて音声区間であるか否かを判定するよ
うにしてもよい。
【0053】具体的には、高S/N比帯域数算出器17
は、帯域別S/N比算出器10が帯域別S/N比を出力
すると、下式にしたがって高S/N比帯域数High_
SNR_number(i)を求める。ただし、下式に
おいて、SNR_THは帯域別S/N比との比較に用い
る固定閾値、ε(i,k)はフレーム番号i,帯域番号
kにおける帯域別S/N比が閾値SNR_THより大き
いか否かを示し、帯域別S/N比が閾値より大きければ
ε(i,k)=1、そうでなければ、ε(i,k)=0
である。
【0054】
【数2】
【0055】総合判定器18が平均値算出器11により
算出された平均S/N比SN_mean(i)と、高S
/N比帯域数算出器17により求められた高S/N比帯
域数High_SNR_number(i)と、前フレ
ームにおける総合判定器18の出力値(音声らしさレベ
ルspeech_level(i−1))とを用いて、
図6の条件判定式3を実行することにより、現フレーム
iにおける音声らしさレベルspeech_level
(i)を求める。ここで、High_SNR_numb
er_TH1,High_SNR_number_TH
2は、高S/N比帯域数に対する固定閾値である。
【0056】この実施の形態5では、高S/N比帯域数
を用いて音声区間であるか否かを判定するものについて
示したが、帯域当たりの高S/N比帯域数(High_
SNR_number(i)/K)を算出し、帯域当た
りの高S/N比帯域数を用いて音声区間であるか否かを
判定するようにしてもよい。この際、帯域当たりの高S
/N比帯域数に対する閾値としては、High_SNR
_number_TH1/K,High_SNR_nu
mber_TH2/Kを使用する。
【0057】また、高S/N比帯域数の代わりに、帯域
S/N比が閾値未満である帯域の数(低S/N比帯域
数)を算出し、帯域数Kから低S/N比帯域数を差し引
いた値や、低S/N比帯域数を帯域数Kで割った値(1
−帯域当たりの低S/N比帯域数)をHigh_SNR
_number(i)として、上記の条件判定式3を実
行するなど、帯域別S/N比が基準値未満である帯域の
数又は割合を用いて判定することも可能である。
【0058】この実施の形態5によれば、帯域別S/N
比が基準値以上である帯域の個数又は割合を用いること
により、相対的に帯域別S/N比の高い帯域を捉えるこ
とが可能になり、上記実施の形態1と同様の効果を奏す
ることができる。
【0059】実施の形態6.図7はこの発明の実施の形
態6による音声区間判定装置を示す構成図であり、図に
おいて、図1と同一符号は同一または相当部分を示すの
で説明を省略する。19は現フレームにおける入力信号
の信号エネルギーを算出するエネルギー算出器、20は
現フレームにおける入力信号の差分信号エネルギーを算
出する差分エネルギー算出器、21は入力信号の信号エ
ネルギーと差分信号エネルギーを考慮して現在の入力信
号が音声区間又は雑音区間の何れであるかを判定する総
合判定器である。なお、エネルギー算出器19,差分エ
ネルギー算出器20及び総合判定器21は判定手段を構
成する。
【0060】次に動作について説明する。上記実施の形
態1では、平均S/N比と正変動量を考慮して、現在の
入力信号が音声区間又は雑音区間の何れであるかを判定
するものについて示したが、さらに、入力信号の信号エ
ネルギーと差分信号エネルギーを考慮して判定するよう
にしてもよい。なお、この例では、時間信号からエネル
ギーを算出するものについて示しているが、これに限る
ものではなく、周波数スペクトルから得られるスペクト
ルパワーを用いてもよいし、両者を用いてもよい。
【0061】具体的には、エネルギー算出器19は、フ
レーム毎に入力信号の信号エネルギーEnergy
(i)を下式にしたがって算出する。ただし、下式にお
いて、Nはフレーム長をサンプル数で表現した場合の値
であり、例えば、サンプリング周波数が8kHz、フレ
ーム長20msecの場合、N=160となる。また、
X(i,n)はフレーム(フレーム番号=i)内のn番
目の入力信号である。
【0062】
【数3】
【0063】差分エネルギー算出器20は、前フレーム
の信号エネルギーEnergy(i−1)と現フレーム
の信号エネルギーEnergy(i)との差分、即ち、
Energy(i)−Energy(i−1)を計算す
ることにより、入力信号の差分信号エネルギーdelt
a_Energy(i)を算出する。
【0064】総合判定器21は、平均S/N比SN_m
ean(i)と、帯域別S/N比の正変動量SN_pl
us_variation(i)と、現フレームの信号
エネルギーEnergy(i)と、差分信号エネルギー
delta_Energy(i)と、前フレームにおけ
る総合判定器21の出力値(音声らしさレベルspee
ch_level(i−1))とを用いて、図8の条件
判定式4を実行することにより、現フレームiにおける
音声らしさレベルspeech_level(i)を求
める。
【0065】ただし、Energy_THは現フレーム
の信号エネルギーEnergy(i)に対する固定閾
値、delta_Energy_THは差分信号エネル
ギーdelta_Energy(i)に対する固定閾値
である。
【0066】この実施の形態6によれば、背景雑音の推
定精度に依存する帯域別S/N比の平均値及び正変動量
に加えて、背景雑音の推定精度に依存しない入力信号の
信号エネルギー及び差分信号エネルギーを用いることに
より、背景雑音の推定精度が劣化しても、精度よく音声
区間を判定することができる効果を奏する。
【0067】実施の形態7.上記実施の形態6では、上
記実施の形態1に対してエネルギー算出器19と差分エ
ネルギー算出器20を追加することにより、入力信号の
信号エネルギーと差分信号エネルギーを考慮して判定処
理を実施するものについて示したが、上記実施の形態
2,3に対してエネルギー算出器19と差分エネルギー
算出器20を追加することにより、入力信号の信号エネ
ルギーと差分信号エネルギーを考慮して判定処理を実施
するようにしてもよく、上記実施の形態6と同様の効果
を奏することができる。
【0068】実施の形態8.上記実施の形態6では、上
記実施の形態1に対してエネルギー算出器19と差分エ
ネルギー算出器20を追加することにより、入力信号の
信号エネルギーと差分信号エネルギーを考慮して判定処
理を実施するものについて示したが、図9に示すよう
に、上記実施の形態4に対してエネルギー算出器19と
差分エネルギー算出器20を追加することにより、総合
判定器(判定手段)22が入力信号の信号エネルギーと
差分信号エネルギーを考慮して判定処理を実施するよう
にしてもよく、上記実施の形態6と同様の効果を奏する
ことができる。この場合、総合判定器22は、図10の
条件判定式5を実行することにより、現フレームiにお
ける音声らしさレベルspeech_level(i)
を求める。
【0069】この実施の形態8によれば、背景雑音の推
定精度に依存する帯域別S/N比の平均値及び分散値に
加えて、背景雑音の推定精度に依存しない入力信号の信
号エネルギー及び差分信号エネルギーを用いることによ
り、背景雑音の推定精度が劣化しても、精度よく音声区
間を判定することができる効果を奏する。
【0070】実施の形態9.上記実施の形態6では、上
記実施の形態1に対してエネルギー算出器19と差分エ
ネルギー算出器20を追加することにより、入力信号の
信号エネルギーと差分信号エネルギーを考慮して判定処
理を実施するものについて示したが、図11に示すよう
に、上記実施の形態5に対してエネルギー算出器19と
差分エネルギー算出器20を追加することにより、総合
判定器(判定手段)23が入力信号の信号エネルギーと
差分信号エネルギーを考慮して判定処理を実施するよう
にしてもよく、上記実施の形態6と同様の効果を奏する
ことができる。この場合、総合判定器23は、図12の
条件判定式6を実行することにより、現フレームiにお
ける音声らしさレベルspeech_level(i)
を求める。
【0071】この実施の形態9によれば、背景雑音の推
定精度に依存する帯域別S/N比の平均値及び高S/N
比帯域数に加えて、背景雑音の推定精度に依存しない入
力信号の信号エネルギー及び差分信号エネルギーを用い
ることにより、背景雑音の推定精度が劣化しても、精度
よく音声区間を判定することができる効果を奏する。
【0072】実施の形態10.上記実施の形態1〜9で
は、総合判定器13等が音声区間の判定処理に用いる判
定パラメータ(例えば、帯域別S/N比の平均値、上位
N位の帯域別S/N比、正変動量、負変動量、分散値、
高S/N比帯域数、高S/N比帯域の割合)に対する閾
値が固定のものを示したが、帯域別S/N比算出部10
により算出された帯域別S/N比にしたがって、これら
の閾値を更新するようにしてもよい。
【0073】以下、閾値の判定処理を具体的に説明す
る。図13は総合判定器13の内部を示す構成図であ
り、図において、13aは帯域別S/N比の平均値を入
力して判定処理を実行する個別判定器、13bは帯域別
S/N比の正変動量を入力して判定処理を実行する個別
判定器である。図14は個別判定器13a,13bの内
部を示す構成図であり、図において、31は比較演算
器、32は閾値保持器、33は閾値更新器である。
【0074】次に動作について説明する。比較演算器3
1は、判定パラメータと閾値保持器32に保持されてい
る閾値との大小比較を実施し、判定パラメータの値が閾
値よりも大きければ音声らしさレベルを上げる一方、小
さければ音声らしさレベルを下げ、この結果、得られた
音声らしさレベルを出力する。
【0075】閾値更新器33は、現フレームの判定パラ
メータの値と過去の判定パラメータの値を用いて閾値を
更新する。以下、判定パラメータの一例として、帯域別
S/N比の平均値(平均S/N比)に対する閾値の更新
処理を説明する。ただし、他の閾値も同様にして更新す
る。図15は平均S/N比から過去数フレーム(図では
5フレーム)内における平均S/N比の最大値を求める
様子を示している。
【0076】図15の上段において、例えば、時刻t1
に着目すると、過去5フレーム(Aの範囲)の平均S/
N比の最大値は、時刻t1,max のときの値であり、時刻
1, max の値を図15の下段にプロットする。時刻t1
以外の各時刻についても同様にして、図15の下段に最
大値をプロットする。そして、閾値更新器33は、図1
5の下段に示される平均S/N比の最大値を下式に代入
して、新たな閾値を計算する。 SN_mean_TH(i)=γ・SN_mean_T
H(i−1)+(1−γ)・SN_mean_max
(i)
【0077】ただし、SN_mean_TH(i)はフ
レームiの平均S/N比に対する更新後の閾値、SN_
mean_max(i)は過去5フレーム内の平均S/
N比の最大値、γは平均S/N比に対する閾値の収束速
度であり、例えば、0.7という値をとるが、他にも帯
域や音声らしさレベルによって値を変えたりしてもよ
い。
【0078】これにより、この実施の形態10によれ
ば、上記実施の形態1〜5の効果に加えて、例えば、雑
音レベルが大きく上昇した場合、雑音レベルの上昇に追
従して平均S/N比の最大値が小さくなり、これに連動
して閾値も小さくなることから、固定閾値を用いる場合
に比べて、追従性よく適切な閾値を設定することが可能
となる。その結果、音声区間の判定精度が向上し、さら
に雑音区間の帯域スペクトルの推定精度が向上する効果
を奏する。
【0079】また、閾値の更新に過去数フレーム内の最
大値を用いることにより、従来から一般的に用いられて
いるAR平滑を行う場合と比べて、閾値が過渡に変化せ
ず、また、背景雑音レベルの変化量の大小に拘わらず、
安定した音声区間の判定を実施することができる効果を
奏する。なお、AR平滑を用いて、各種の閾値を更新し
てもよいことは言うまでもない。
【0080】
【発明の効果】以上のように、この発明によれば、帯域
分割手段により求められた入力信号の現在の区間の帯域
スペクトルと雑音区間と判定された過去の区間の帯域ス
ペクトルとの比である帯域別S/N比を算出し、その帯
域別S/N比に基づいて入力信号の現在の区間が音声区
間又は雑音区間の何れであるかを判定するように構成し
たので、現在の入力信号のS/N比が低い等の場合で
も、的確に音声区間を判定することができる効果があ
る。
【0081】この発明によれば、入力信号の現在の区間
が雑音区間であると判定する場合、入力信号の帯域スペ
クトルにより過去の雑音区間の帯域スペクトルを更新す
るように構成したので、過去の雑音区間の帯域スペクト
ルの確度を高めることができる効果がある。
【0082】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比の平均値を算出し、判定処
理を実行するに際して、その平均値を考慮するように構
成したので、音声区間の判定精度を高めることができる
効果がある。
【0083】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比のうち上位N位(Nは自然
数)の帯域別S/N比を検索し、判定処理を実行するに
際して、その帯域別S/N比を考慮するように構成した
ので、音声区間の判定精度を高めることができる効果が
ある。
【0084】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比の正変動量を算出し、判定
処理を実行するに際して、その正変動量を考慮するよう
に構成したので、音声区間の判定精度を高めることがで
きる効果がある。
【0085】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比の負変動量を算出し、判定
処理を実行するに際して、その負変動量を考慮するよう
に構成したので、音声区間の判定精度を高めることがで
きる効果がある。
【0086】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比の分散値を算出し、判定処
理を実行するに際して、その分散値を考慮するように構
成したので、音声区間の判定精度を高めることができる
効果がある。
【0087】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比が基準値以上である帯域の
個数又は割合を求め、判定処理を実行するに際して、そ
の個数又は割合を考慮するように構成したので、音声区
間の判定精度を高めることができる効果がある。
【0088】この発明によれば、判定処理を実行するに
際して、入力信号の現在の信号エネルギーを考慮するよ
うに構成したので、背景雑音の推定精度が劣化しても、
精度よく音声区間を判定することができる効果がある。
【0089】この発明によれば、判定処理を実行するに
際して、入力信号の差分信号エネルギーを考慮するよう
に構成したので、背景雑音の推定精度が劣化しても、精
度よく音声区間を判定することができる効果がある。
【0090】この発明によれば、S/N比算出手段によ
り算出された帯域別S/N比にしたがって判定処理に用
いる閾値を更新するように構成したので、音声区間の判
定精度がさらに向上する効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音声区間判定
装置を示す構成図である。
【図2】 条件判定式1を示す説明図である。
【図3】 この発明の実施の形態4による音声区間判定
装置を示す構成図である。
【図4】 条件判定式2を示す説明図である。
【図5】 この発明の実施の形態5による音声区間判定
装置を示す構成図である。
【図6】 条件判定式3を示す説明図である。
【図7】 この発明の実施の形態6による音声区間判定
装置を示す構成図である。
【図8】 条件判定式4を示す説明図である。
【図9】 この発明の実施の形態8による音声区間判定
装置を示す構成図である。
【図10】 条件判定式5を示す説明図である。
【図11】 この発明の実施の形態9による音声区間判
定装置を示す構成図である。
【図12】 条件判定式6を示す説明図である。
【図13】 総合判定器13の内部を示す構成図であ
る。
【図14】 個別判定器13a,13bの内部を示す構
成図である。
【図15】 平均S/N比から過去数フレーム内におけ
る平均S/N比の最大値を求める様子を示す説明図であ
る。
【図16】 帯域別S/N比の一例を表す説明図であ
る。
【符号の説明】
1 入力端子、2 A/D変換器、3 窓関数演算器、
4 高域強調器、5直交変換器(直交変換手段)、6
帯域分割器(帯域分割手段)、7 切換スイッチ、8
雑音更新器(判定手段)、9 雑音保持器(判定手
段)、10 帯域別S/N比算出器(S/N比算出手
段)、11 平均値算出器(判定手段)、12 正変動
量算出器(判定手段)、13 総合判定器(判定手
段)、13a 個別判定器、13b 個別判定器、14
出力端子、15 分散算出器(判定手段)、16 総
合判定器(判定手段)、17 高S/N比帯域数算出器
(判定手段)、18 総合判定器(判定手段)、19
エネルギー算出器(判定手段)、20 差分エネルギー
算出器(判定手段)、21 総合判定器(判定手段)、
22総合判定器(判定手段)、23 総合判定器(判定
手段)、31 比較演算器、32 閾値保持器、33
閾値更新器。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 所定の区間ごとに入力される入力信号を
    時間軸信号から周波数軸信号に直交変換して現在の区間
    の入力信号の周波数スペクトルを求める直交変換手段
    と、上記直交変換手段により求められた周波数スペクト
    ルを複数の周波数帯域に分割して現在の区間の帯域スペ
    クトルを求める帯域分割手段と、上記帯域分割手段によ
    り求められた現在の区間の帯域スペクトルと雑音区間と
    判定された過去の区間の帯域スペクトルとの比である帯
    域別S/N比を算出するS/N比算出手段と、上記S/
    N比算出手段により算出された帯域別S/N比に基づい
    て入力信号の現在の区間が音声区間又は雑音区間の何れ
    であるかを判定する判定手段とを備えた音声区間判定装
    置。
  2. 【請求項2】 判定手段は、入力信号の現在の区間が雑
    音区間であると判定する場合、入力信号の現在の区間の
    帯域スペクトルにより過去の雑音区間の帯域スペクトル
    を更新することを特徴とする請求項1記載の音声区間判
    定装置。
  3. 【請求項3】 判定手段は、S/N比算出手段により算
    出された帯域別S/N比の平均値を算出し、判定処理を
    実行するに際して、その平均値を考慮することを特徴と
    する請求項1または請求項2記載の音声区間判定装置。
  4. 【請求項4】 判定手段は、S/N比算出手段により算
    出された帯域別S/N比のうち上位N位(Nは自然数)
    の帯域別S/N比を検索し、判定処理を実行するに際し
    て、その帯域別S/N比を考慮することを特徴とする請
    求項1または請求項2記載の音声区間判定装置。
  5. 【請求項5】 判定手段は、S/N比算出手段により算
    出された帯域別S/N比の正変動量を算出し、判定処理
    を実行するに際して、その正変動量を考慮することを特
    徴とする請求項1から請求項4のうちのいずれか1項記
    載の音声区間判定装置。
  6. 【請求項6】 判定手段は、S/N比算出手段により算
    出された帯域別S/N比の負変動量を算出し、判定処理
    を実行するに際して、その負変動量を考慮することを特
    徴とする請求項1から請求項4のうちのいずれか1項記
    載の音声区間判定装置。
  7. 【請求項7】 判定手段は、S/N比算出手段により算
    出された帯域別S/N比の分散値を算出し、判定処理を
    実行するに際して、その分散値を考慮することを特徴と
    する請求項1から請求項4のうちのいずれか1項記載の
    音声区間判定装置。
  8. 【請求項8】 判定手段は、S/N比算出手段により算
    出された帯域別S/N比が基準値以上である帯域の個数
    又は割合を求め、判定処理を実行するに際して、その個
    数又は割合を考慮することを特徴とする請求項1から請
    求項4のうちのいずれか1項記載の音声区間判定装置。
  9. 【請求項9】 判定手段は、判定処理を実行するに際し
    て、入力信号の現在の区間の信号エネルギーを考慮する
    ことを特徴とする請求項1から請求項8のうちのいずれ
    か1項記載の音声区間判定装置。
  10. 【請求項10】 判定手段は、判定処理を実行するに際
    して、入力信号の現在の区間の差分信号エネルギーを考
    慮することを特徴とする請求項1から請求項9のうちの
    いずれか1項記載の音声区間判定装置。
  11. 【請求項11】 判定手段は、S/N比算出手段により
    算出された帯域別S/N比にしたがって判定処理に用い
    る閾値を更新することを特徴とする請求項1から請求項
    10のうちのいずれか1項記載の音声区間判定装置。
JP2000074262A 2000-03-16 2000-03-16 音声区間判定装置及び音声区間判定方法 Expired - Lifetime JP3588030B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000074262A JP3588030B2 (ja) 2000-03-16 2000-03-16 音声区間判定装置及び音声区間判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000074262A JP3588030B2 (ja) 2000-03-16 2000-03-16 音声区間判定装置及び音声区間判定方法

Publications (2)

Publication Number Publication Date
JP2001265367A true JP2001265367A (ja) 2001-09-28
JP3588030B2 JP3588030B2 (ja) 2004-11-10

Family

ID=18592349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000074262A Expired - Lifetime JP3588030B2 (ja) 2000-03-16 2000-03-16 音声区間判定装置及び音声区間判定方法

Country Status (1)

Country Link
JP (1) JP3588030B2 (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209069A (ja) * 2004-12-28 2006-08-10 Advanced Telecommunication Research Institute International 音声区間検出装置および音声区間検出プログラム
WO2007017993A1 (ja) * 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
JP2008009120A (ja) * 2006-06-29 2008-01-17 Mitsubishi Electric Corp リモートコントローラ並びに家電機器
JP2008064821A (ja) * 2006-09-05 2008-03-21 Nippon Telegr & Teleph Corp <Ntt> 信号区間推定装置、方法、プログラム及びその記録媒体
JP2008158316A (ja) * 2006-12-25 2008-07-10 Yamaha Corp 音信号処理装置およびプログラム
JP2008158315A (ja) * 2006-12-25 2008-07-10 Yamaha Corp 音信号処理装置およびプログラム
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
JP2008176155A (ja) * 2007-01-19 2008-07-31 Kddi Corp 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体
JP2008257048A (ja) * 2007-04-06 2008-10-23 Yamaha Corp 音処理装置およびプログラム
JP2009157406A (ja) * 2009-04-15 2009-07-16 Yamaha Corp 音信号処理装置およびプログラム
US7844452B2 (en) 2008-05-30 2010-11-30 Kabushiki Kaisha Toshiba Sound quality control apparatus, sound quality control method, and sound quality control program
US7856354B2 (en) 2008-05-30 2010-12-21 Kabushiki Kaisha Toshiba Voice/music determining apparatus, voice/music determination method, and voice/music determination program
US8069039B2 (en) 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
JP2012128411A (ja) * 2010-11-24 2012-07-05 Jvc Kenwood Corp 音声判定装置および音声判定方法
JP2013167720A (ja) * 2012-02-15 2013-08-29 Renesas Electronics Corp 半導体装置及び音声通信装置
JP2013190655A (ja) * 2012-03-14 2013-09-26 Fujitsu Ltd 雑音推定装置、雑音推定方法及び雑音推定用コンピュータプログラム
JP2015108766A (ja) * 2013-12-05 2015-06-11 日本電信電話株式会社 雑音抑圧方法とその装置とプログラム
JP2016006440A (ja) * 2014-06-20 2016-01-14 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
JP2016145940A (ja) * 2015-02-09 2016-08-12 沖電気工業株式会社 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム
JP2016145944A (ja) * 2015-02-09 2016-08-12 沖電気工業株式会社 雑音抑圧装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム
JP2017511901A (ja) * 2014-03-12 2017-04-27 華為技術有限公司Huawei Technologies Co.,Ltd. 音声信号を検出するための方法および装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8589152B2 (en) 2008-05-28 2013-11-19 Nec Corporation Device, method and program for voice detection and recording medium

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209069A (ja) * 2004-12-28 2006-08-10 Advanced Telecommunication Research Institute International 音声区間検出装置および音声区間検出プログラム
WO2007017993A1 (ja) * 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
US8300834B2 (en) 2005-07-15 2012-10-30 Yamaha Corporation Audio signal processing device and audio signal processing method for specifying sound generating period
JP4675840B2 (ja) * 2006-06-29 2011-04-27 三菱電機株式会社 リモートコントローラ並びに家電機器
JP2008009120A (ja) * 2006-06-29 2008-01-17 Mitsubishi Electric Corp リモートコントローラ並びに家電機器
JP2008064821A (ja) * 2006-09-05 2008-03-21 Nippon Telegr & Teleph Corp <Ntt> 信号区間推定装置、方法、プログラム及びその記録媒体
JP4690973B2 (ja) * 2006-09-05 2011-06-01 日本電信電話株式会社 信号区間推定装置、方法、プログラム及びその記録媒体
JP2008158316A (ja) * 2006-12-25 2008-07-10 Yamaha Corp 音信号処理装置およびプログラム
JP2008158315A (ja) * 2006-12-25 2008-07-10 Yamaha Corp 音信号処理装置およびプログラム
US8069039B2 (en) 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
JP2008176155A (ja) * 2007-01-19 2008-07-31 Kddi Corp 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体
JP2008257048A (ja) * 2007-04-06 2008-10-23 Yamaha Corp 音処理装置およびプログラム
US7856354B2 (en) 2008-05-30 2010-12-21 Kabushiki Kaisha Toshiba Voice/music determining apparatus, voice/music determination method, and voice/music determination program
US7844452B2 (en) 2008-05-30 2010-11-30 Kabushiki Kaisha Toshiba Sound quality control apparatus, sound quality control method, and sound quality control program
JP4506896B2 (ja) * 2009-04-15 2010-07-21 ヤマハ株式会社 音信号処理装置およびプログラム
JP2009157406A (ja) * 2009-04-15 2009-07-16 Yamaha Corp 音信号処理装置およびプログラム
JP2012128411A (ja) * 2010-11-24 2012-07-05 Jvc Kenwood Corp 音声判定装置および音声判定方法
US9431022B2 (en) 2012-02-15 2016-08-30 Renesas Electronics Corporation Semiconductor device and voice communication device
JP2013167720A (ja) * 2012-02-15 2013-08-29 Renesas Electronics Corp 半導体装置及び音声通信装置
JP2013190655A (ja) * 2012-03-14 2013-09-26 Fujitsu Ltd 雑音推定装置、雑音推定方法及び雑音推定用コンピュータプログラム
JP2015108766A (ja) * 2013-12-05 2015-06-11 日本電信電話株式会社 雑音抑圧方法とその装置とプログラム
JP2017511901A (ja) * 2014-03-12 2017-04-27 華為技術有限公司Huawei Technologies Co.,Ltd. 音声信号を検出するための方法および装置
US10304478B2 (en) 2014-03-12 2019-05-28 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
US10818313B2 (en) 2014-03-12 2020-10-27 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
US11417353B2 (en) 2014-03-12 2022-08-16 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
JP2016006440A (ja) * 2014-06-20 2016-01-14 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
JP2016145940A (ja) * 2015-02-09 2016-08-12 沖電気工業株式会社 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム
JP2016145944A (ja) * 2015-02-09 2016-08-12 沖電気工業株式会社 雑音抑圧装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム

Also Published As

Publication number Publication date
JP3588030B2 (ja) 2004-11-10

Similar Documents

Publication Publication Date Title
JP3588030B2 (ja) 音声区間判定装置及び音声区間判定方法
Moattar et al. A simple but efficient real-time voice activity detection algorithm
Nakatani et al. Robust and accurate fundamental frequency estimation based on dominant harmonic components
KR101120679B1 (ko) 이득-제한된 잡음 억제
EP1059628B1 (en) Noise suppression by spectral subtraction
CN109545188A (zh) 一种实时语音端点检测方法及装置
JP5875609B2 (ja) 雑音抑圧装置
RU2684194C1 (ru) Способ получения кадра модификации речевой активности, устройство и способ обнаружения речевой активности
US9454976B2 (en) Efficient discrimination of voiced and unvoiced sounds
CN111128215B (zh) 一种单通道实时降噪方法及系统
WO2006123721A1 (ja) 雑音抑圧方法およびその装置
CN104269180B (zh) 一种用于语音质量客观评价的准干净语音构造方法
JP3451146B2 (ja) スペクトルサブトラクションを用いた雑音除去システムおよび方法
JP2004341339A (ja) 雑音抑圧装置
JP2000330597A (ja) 雑音抑圧装置
KR101295727B1 (ko) 적응적 잡음추정 장치 및 방법
JP2001005486A (ja) 音声処理装置及び方法
JP2001159899A (ja) 騒音抑圧装置
WO2017128910A1 (zh) 一种语音出现概率的确定方法、装置及电子设备
Nakatani et al. Dominance spectrum based V/UV classification and F0 estimation
KR100931487B1 (ko) 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
KR100798056B1 (ko) 높은 비정적인 잡음 환경에서의 음질 개선을 위한 음성처리 방법
Lu Reduction of musical residual noise using block-and-directional-median filter adapted by harmonic properties
JP3761497B2 (ja) 音声認識装置、音声認識方法、および、音声認識プログラム
Zhang et al. Speech enhancement for nonstationary noise environments

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040811

R150 Certificate of patent or registration of utility model

Ref document number: 3588030

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term