JP2001265367A

JP2001265367A - 音声区間判定装置

Info

Publication number: JP2001265367A
Application number: JP2000074262A
Authority: JP
Inventors: Takuji Ikeda; 卓史池田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2000-03-16
Filing date: 2000-03-16
Publication date: 2001-09-28
Anticipated expiration: 2020-03-16
Also published as: JP3588030B2

Abstract

(57)【要約】【課題】入力信号のＳ／Ｎ比が低い等の場合には、音
声区間の判別精度が悪くなり、音声区間を雑音区間と誤
判定する課題があった。【解決手段】帯域分割器６により求められたフレーム
信号の帯域スペクトルと過去の雑音区間の帯域スペクト
ルとの比である帯域別Ｓ／Ｎ比を算出し、その帯域別Ｓ
／Ｎ比に基づいて現在のフレーム信号が音声区間又は雑
音区間の何れであるかを判定する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、種々の雑音環境
下で用いられる音声通信システムや音声認識システム等
において、所定の区間ごとに入力される入力信号が音声
区間であるか又は、雑音区間かを判別する音声区間判定
装置に関するものである。

【０００２】

【従来の技術】雑音のある環境下において、正確に音声
認識を行う必要がある場合、音声区間判定装置が用いら
れる。例えば、特開昭５９−９９４９７号公報には、入
力信号の直交変換を実施し、その変換値から求めたスペ
クトルに基づいて入力信号パワーと雑音信号パワーとの
比であるＳ／Ｎ比を算出し、そのＳ／Ｎ比と固定閾値を
大小比較することにより、音声区間を検出する音声区間
判定装置が開示されている。

【０００３】また、背景雑音と音声信号が混在する入力
信号から、音質を損なうことなく背景雑音を除去する背
景雑音除去装置においては、入力信号の様態を検出する
様態検出手段が用いられ、その様態検出手段は、例え
ば、特開平１０−１７１４９７号公報に開示されてい
る。その様態検出手段は、文献（ＳｔｅｖｅｎＦ．Ｂ
ｏｌｌ，“ＳｕｐｐｒｅｓｓｉｏｎｏｆＡｃｏｕｓ
ｔｉｃｎｏｉｓｅｉｎｓｐｅｅｃｈｕｓｉｎｇ
ｓｐｅｃｔｒａｌｓｕｂｔｒａｃｔｉｏｎ”，ＩＥ
ＥＥＴｒａｎｓ．ＡＳＳＰ，Ｖｏｌ．ＡＳＳＰ−２
７，Ｎｏ．２，Ａｐｒｉｌ１９７９）に示された振幅
スペクトルに着目した方法、即ち、スペクトルサブトラ
クション（ＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏ
ｎ：ＳＳ）法に基づく方法である。

【０００４】具体的には、周波数軸上において、背景雑
音と音声信号を含む入力信号から、過去の背景雑音を平
均して求めた背景雑音の推定値を減算することにより、
入力信号中に含まれる背景雑音の定常成分を取り除き、
減算後の信号と背景雑音の推定値から、全周波数帯域の
Ｓ／Ｎ比（ＳＮ＿ａｌｌ）と、全周波数帯域を複数の帯
域に分割した小帯域毎のＳ／Ｎ比（ＳＮ＿ｃｈ（ｉ），
ｉはチャネル番号））とを計算する。そして、これらの
差分（ＳＮ＿ｃｈ（ｉ）−ＳＮ＿ａｌｌ）が所定値以下
の帯域では、背景雑音の急峻な変化に対応する背景雑音
を推定し、この推定値を用いてさらに減算処理を行うこ
とにより、背景雑音の非定常成分を取り除くものであ
る。

【０００５】また、音声区間の検出を実行する際に固定
閾値との比較を行うのではなく、入力信号の様態に応じ
て、閾値を随時更新し、更新後の閾値との比較を行う手
段が、例えば、特開平２−２７２８３６号公報に開示さ
れている。これは、入力信号のパワーを計算し、このパ
ワー値，零交差回数，最大零交差間隔及び過去の音声区
間の判定結果に基づいて閾値の更新を随時実行し、現フ
レームのパワー値と更新後の閾値とを比較することによ
り、音声区間の検出を行うものである。

【０００６】

【発明が解決しようとする課題】従来の音声区間判定装
置は以上のように構成されているので、音声区間の判別
精度が悪く、音声区間を雑音区間と誤判定する課題があ
った。具体的には、下記に示す理由から誤判定を招いて
いる。

【０００７】特開昭５９−９９４９７号公報に記載され
ている音声区間判定装置は、入力信号パワーと雑音信号
パワーとの比であるＳ／Ｎ比（全周波数帯域のＳ／Ｎ
比）を用いて、音声区間判定を実施している。図1６は
帯域別Ｓ／Ｎ比（全周波数が複数の小帯域に分割された
小帯域毎のＳ／Ｎ比）の一例を表しており、（ａ）は雑
音区間、（ｂ）は音声区間である。図１６において、帯
域別Ｓ／Ｎ比の平均値は（ａ），（ｂ）ともに等しく
（μ₁ ＝μ₂ ）、閾値ＴＨとの大小比較により音声区間
判定を行うと、帯域別Ｓ／Ｎ比の平均値μ₁ ，μ₂ が閾
値ＴＨよりも小さいため、どちらの場合においても「雑
音区間（非音声区間）」と判定される。

【０００８】しかし、帯域別Ｓ／Ｎ比が図１６（ｂ）に
示すものである場合、低域において、帯域別Ｓ／Ｎ比が
平均値μ₂ よりも高い帯域の数が、図１６（ａ）に示す
ものよりも多く、また、これらの帯域では平均値μ₂ と
の差が大きく、本来なら「音声区間」であると判定され
るべきである。ところが、従来の音声区間判定装置で
は、この「音声区間」を「雑音区間」と誤判定してしま
う。

【０００９】また、従来の音声区間判定装置では、入力
信号が音声区間であるか否かを判定する際に使用する閾
値ＴＨが固定値であるため、背景雑音の定常性を仮定し
て、閾値ＴＨを設定する場合が多い。このようにして、
閾値ＴＨを設定すると、入力信号中の雑音レベルが急に
大きく変動する場合（例えば、音声通話中に乗用車が側
を通り過ぎる場合には、雑音レベルが急に大きく変動す
る）には、全周波数帯域のＳ／Ｎ比が小さくなり、閾値
ＴＨ以下となることがある。この場合、音声区間であっ
ても、雑音区間であると誤判定される。

【００１０】上記課題を解決するため、特開平２−２７
２８３６号公報には、フレームパワー，零交差回数，最
大零交差間隔及び有音／無音の判定結果に基づいて閾値
を適応的に算出するものが開示されている。即ち、零交
差回数，最大零交差間隔及び有音／無音の判定出力の間
にある条件を満足する場合に限り、過去フレームのパワ
ーの平均値と現フレームのパワーの重み付け平均（ＡＲ
平滑）を実施し、その重み付け平均を実施した値を定数
倍した値を新たな閾値とすることにより、閾値の更新を
行っている。しかし、高雑音下では入力信号に占める雑
音成分の割合が高いため、音声パワーとの判別が困難に
なり、また、零交差回数や最大零交差間隔の雑音区間で
の分布が音声区間での分布に類似した分布となるため、
閾値の更新が適切に行われず、常に音声区間と判定され
るため、雑音区間を音声区間と誤判定する課題があっ
た。

【００１１】また、特開平１０−１７１４９７号公報で
は、小帯域毎の帯域別Ｓ／Ｎ比と全周波数帯域のＳ／Ｎ
比との差分値に応じて、スペクトル減算後の入力信号ス
ペクトルに含まれる背景雑音の非定常成分を取り除いて
いる。この方法は、帯域間の帯域別Ｓ／Ｎ比のばらつき
を考慮に入れた方法であり、雑音の引き去り処理に対す
る効果は見られるが、音声区間の判定精度を高めること
はできない。

【００１２】この発明は上記のような課題を解決するた
めになされたもので、入力信号のＳ／Ｎ比が低い場合で
も、的確に音声区間を判定することができる音声区間判
定装置を得ることを目的とする。

【００１３】

【課題を解決するための手段】この発明に係る音声区間
判定装置は、帯域分割手段により求められた入力信号の
現在の区間の帯域スペクトルと雑音区間と判定された過
去の区間の帯域スペクトルとの比である帯域別Ｓ／Ｎ比
を算出し、その帯域別Ｓ／Ｎ比に基づいて入力信号の現
在の区間が音声区間又は雑音区間の何れであるかを判定
するようにしたものである。

【００１４】この発明に係る音声区間判定装置は、入力
信号の現在の区間が雑音区間であると判定する場合、入
力信号の現在の区間の帯域スペクトルにより過去の雑音
区間の帯域スペクトルを更新するようにしたものであ
る。

【００１５】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比の平均値
を算出し、判定処理を実行するに際して、その平均値を
考慮するようにしたものである。

【００１６】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比のうち上
位Ｎ位（Ｎは自然数）の帯域別Ｓ／Ｎ比を検索し、判定
処理を実行するに際して、その帯域別Ｓ／Ｎ比を考慮す
るようにしたものである。

【００１７】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比の正変動
量を算出し、判定処理を実行するに際して、その正変動
量を考慮するようにしたものである。

【００１８】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比の負変動
量を算出し、判定処理を実行するに際して、その負変動
量を考慮するようにしたものである。

【００１９】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比の分散値
を算出し、判定処理を実行するに際して、その分散値を
考慮するようにしたものである。

【００２０】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比が基準値
以上である帯域の個数又は割合を求め、判定処理を実行
するに際して、その個数又は割合を考慮するようにした
ものである。

【００２１】この発明に係る音声区間判定装置は、判定
処理を実行するに際して、入力信号の現在の信号エネル
ギーを考慮するようにしたものである。

【００２２】この発明に係る音声区間判定装置は、判定
処理を実行するに際して、入力信号の差分信号エネルギ
ーを考慮するようにしたものである。

【００２３】この発明に係る音声区間判定装置は、Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比にしたが
って判定処理に用いる閾値を更新するようにしたもので
ある。

【００２４】

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。実施の形態１．図１はこの発明の実施の形態１による音
声区間判定装置を示す構成図であり、図において、１は
例えばマイクロフォンにより取り込まれた信号（入力信
号）を入力する入力端子、２は入力端子１から入力され
た信号を所定の周波数でサンプリングを実施し、そのサ
ンプリング結果であるフレーム信号（所定のサンプル数
毎に区切られたフレーム信号）をアナログ／ディジタル
変換するＡ／Ｄ変換器、３はＡ／Ｄ変換器２が出力する
フレーム信号に対して窓関数演算を実行する窓関数演算
器、４は窓関数演算器３の演算結果を一次のディジタル
フィルタに通すことにより高域強調処理を実施する高域
強調器である。

【００２５】５は高域強調器４により高域強調されたフ
レーム信号を直交変換して、そのフレーム信号の周波数
スペクトルを求める直交変換器（直交変換手段）、６は
直交変換器５により求められた周波数スペクトルを複数
の帯域に分割して、そのフレーム信号の帯域スペクトル
を求める帯域分割器（帯域分割手段）、７は総合判定器
１３により制御される切換スイッチ、８は総合判定器１
３が現在の入力信号が雑音区間であると判定する場合、
入力信号の帯域スペクトルにより過去の雑音区間の帯域
スペクトルを更新する雑音更新器、９は過去の雑音区間
の帯域スペクトルを保持する雑音保持器である。

【００２６】１０は帯域分割器６により求められたフレ
ーム信号の帯域スペクトルと過去の雑音区間の帯域スペ
クトルとの比である帯域別Ｓ／Ｎ比を算出する帯域別Ｓ
／Ｎ比算出器（Ｓ／Ｎ比算出手段）、１１は帯域別Ｓ／
Ｎ比算出器１０により算出された帯域別Ｓ／Ｎ比の平均
値を算出する平均値算出器、１２は帯域別Ｓ／Ｎ比算出
器１０により算出された帯域別Ｓ／Ｎ比の正変動量を算
出する正変動量算出器、１３は平均値算出器１１により
算出された帯域別Ｓ／Ｎ比の平均値と正変動量算出器１
２により算出された帯域別Ｓ／Ｎ比の正変動量とに基づ
いて現在の入力信号が音声区間又は雑音区間の何れであ
るかを判定する総合判定器、１４は総合判定器１３の判
定結果を出力する出力端子である。なお、雑音更新器
８，雑音保持器９，平均値算出器１１，正変動量算出器
１２及び総合判定器１３から判定手段が構成されてい
る。

【００２７】次に動作について説明する。例えば、マイ
クロフォンにより取り込まれた信号が入力端子１から入
力信号として入力されると、Ａ／Ｄ変換器２は、その入
力信号に対して所定の周波数（例えば、８ｋＨｚの周波
数）でサンプリングを実施し、そのサンプリング結果で
あるフレーム信号をアナログ／ディジタル変換する。

【００２８】窓関数演算器３は、Ａ／Ｄ変換器２がフレ
ーム信号をアナログ／ディジタル変換すると、変換後の
フレーム信号に対して、例えば、ハニング窓などの窓関
数を乗じることにより窓関数演算を実行する。高域強調
器４は、窓関数演算器３の演算結果を下記に示すような
伝達関数Ｈ（ｚ）を有する一次のディジタルフィルタに
通すことにより高域強調処理を実施する。

【００２９】Ｈ（ｚ）＝１−α・ｚ^-1 ｚ＝ｅｘｐ（ｊω）ただし、ωは角周波数、ｊは虚数単位、αは高域強調係
数であり、通常1に近い値（例えば、０．８）が設定さ
れる。なお、高域強調器４を通さず、窓関数演算器３の
出力を直接直交変換器５に入力してもよい。

【００３０】直交変換器５は、高域強調器４により高域
強調されたフレーム信号又は窓関数演算器３により窓関
数演算されたフレーム信号を入力すると、そのフレーム
信号に対して、例えば、高速フーリエ変換（ＦＦＴ）な
どの直交変換処理を実行し、時間tの関数として表され
る時間軸信号を周波数成分（周波数スペクトル）に変換
する。

【００３１】帯域分割器６は、直交変換器５が周波数ス
ペクトルを求めると、その周波数スペクトルを複数の帯
域に分割することにより、そのフレーム信号の帯域スペ
クトルを求める。例えば、周波数スペクトルを１６の帯
域に分割し、それぞれの帯域毎にスペクトルの重み付け
平均をとり、これを帯域スペクトルＸ（ｉ，ｋ）とす
る。ただし、ｋは帯域番号、ｉはフレーム番号とする。
この他、直交変換された周波数スペクトルに対して、
「バークフィルタ」又は「メルフィルタ」等の聴覚特性
を模擬するフィルタを通した後、重み付け平均をとって
もよい。

【００３２】帯域別Ｓ／Ｎ比算出器１０は、帯域分割器
６がフレーム信号の帯域スペクトルＸ（ｉ，ｋ）を求め
ると、雑音保持器９に保持されている前フレームまでに
推定された雑音信号の帯域スペクトルＮ（ｉ−１，ｋ）
との比、即ち、帯域別Ｓ／Ｎ比を帯域毎に算出する。

【００３３】平均値算出器１１は、帯域別Ｓ／Ｎ比算出
器１０が帯域別Ｓ／Ｎ比を出力すると、現フレームｉに
おける帯域別Ｓ／Ｎ比の平均値ＳＮ＿ｍｅａｎ（ｉ）
（以下、平均Ｓ／Ｎ比という）を算出する。正変動量算
出器１２は、帯域別Ｓ／Ｎ比算出器１０が帯域別Ｓ／Ｎ
比を出力し、平均値算出器１１が平均Ｓ／Ｎ比ＳＮ＿ｍ
ｅａｎ（ｉ）を出力すると、これらから下式にしたがっ
て帯域別Ｓ／Ｎ比の正変動量ＳＮ＿ｐｌｕｓ＿ｖａｒｉ
ａｔｉｏｎ（ｉ）を算出する。ここで、帯域別Ｓ／Ｎ比
の正変動量とは、帯域別Ｓ／Ｎ比が平均Ｓ／Ｎ比より高
い帯域において、帯域別Ｓ／Ｎ比と平均Ｓ／Ｎ比の差を
加算したものである。ただし、下式において、Ｋは帯域
数、ＳＮＲ（ｉ，ｋ）はフレーム番号ｉ，帯域番号ｋに
おける帯域別Ｓ／Ｎ比である。

【００３４】

【数１】

【００３５】この実施の形態１では、帯域別Ｓ／Ｎ比が
平均Ｓ／Ｎ比より高い帯域において、帯域別Ｓ／Ｎ比と
平均Ｓ／Ｎ比の差を加算して正変動量を算出するものに
ついて示したが、帯域別Ｓ／Ｎ比の最大値と平均Ｓ／Ｎ
比の差を正変動量としてもよい。また、帯域別Ｓ／Ｎ比
の上位Ｎ位までの帯域において、帯域別Ｓ／Ｎ比と平均
Ｓ／Ｎ比の差を加算して正変動量を算出してもよい。

【００３６】総合判定器１３は、平均値算出器１１によ
り算出された平均Ｓ／Ｎ比ＳＮ＿ｍｅａｎ（ｉ）と、正
変動量算出器１２により算出された帯域別Ｓ／Ｎ比の正
変動量ＳＮ＿ｐｌｕｓ＿ｖａｒｉａｔｉｏｎ（ｉ）と、
前フレームにおける総合判定器１３の出力値（音声らし
さレベルｓｐｅｅｃｈ＿ｌｅｖｅｌ（ｉ−１））とを用
いて、図２の条件判定式１を実行することにより、現フ
レームｉにおける音声らしさレベルｓｐｅｅｃｈ＿ｌｅ
ｖｅｌ（ｉ）を求める。ここで、音声らしさレベルは、
フレーム信号が音声区間である可能性を示す尺度であ
り、音声らしさレベルが高いほど、音声区間である可能
性が高い。

【００３７】ただし、ＳＮ＿ｍｅａｎ＿ＴＨは平均Ｓ／
Ｎ比に対する固定閾値、ＳＮ＿ｐｌｕｓ＿ｖａｒｉａｔ
ｉｏｎ＿ＴＨ１，ＳＮ＿ｐｌｕｓ＿ｖａｒｉａｔｉｏｎ
＿ＴＨ２は帯域別Ｓ／Ｎ比の正変動量に対する固定閾値
である。また、ｓｐｅｅｃｈ＿ｔｍｐはフレームｉにお
ける音声らしさレベルを求めるための一時変数である。

【００３８】なお、この実施の形態１では、閾値との大
小比較により、音声らしさレベルが離散的に変化する場
合について示しているが、平均Ｓ／Ｎ比及び正変動量を
線形変換し、その変換値を加算した値を音声らしさレベ
ルとすることにより、音声らしさレベルを連続的に変化
させてもよい。ここで得られる音声らしさレベルの値
は、とりうる値が複数であるため、音声らしさの程度を
出力する場合であれば、音声らしさレベルの値をそのま
ま出力すればよいし、「音声区間」であるか「雑音区
間」であるかを判定する場合には、音声らしさレベルの
値が所定の閾値以上であれば「音声区間」、そうでなけ
れば「雑音区間」と判定すればよい。そして、その判定
結果を出力端子１４から出力する。

【００３９】総合判定器１３は、上記判定処理の実行
後、次フレームの判定精度を高めるため、現フレームに
おける入力信号が雑音区間であると判定した場合、また
は、音声らしさレベルが低い場合、切換スイッチ７をａ
側に切り換えて、雑音保持器９に保持されている雑音信
号の帯域スペクトルＮ（ｉ−１，ｋ）を更新させる。

【００４０】雑音更新器８は、切換スイッチ７がａ側に
切り換えられると、帯域分割器６が出力する現フレーム
における入力信号の帯域スペクトルＸ（ｉ，ｋ）と、雑
音保持器９に保持されている前フレームまでに推定され
た雑音信号の帯域スペクトルＮ（ｉ−１，ｋ）とを下式
に代入して、現フレームにおける雑音信号の帯域スペク
トルＮ（ｉ，ｋ）を算出し、雑音保持器９に保持されて
いる雑音信号を更新する。即ち、雑音保持器９の保持内
容を現フレームにおける雑音信号の帯域スペクトルＮ
（ｉ，ｋ）に変更する。

【００４１】Ｎ（ｉ，ｋ）＝β・Ｎ（ｉ−１，ｋ）＋
（１−β）・Ｘ（ｉ，ｋ）ただし、βは雑音信号の推定速度を決定する係数であ
り、例えば、０．８という値をとるが、他にも帯域によ
って値を変えたり、音声らしさレベルが低い程、βを小
さくすることにより、音声らしさレベルに応じた値をと
るようにしてもよい。

【００４２】以上で明らかなように、この実施の形態１
によれば、帯域分割器６により求められたフレーム信号
の帯域スペクトルと過去の雑音区間の帯域スペクトルと
の比である帯域別Ｓ／Ｎ比を算出し、その帯域別Ｓ／Ｎ
比に基づいて現在のフレーム信号が音声区間又は雑音区
間の何れであるかを判定するように構成したので、現在
のフレームのＳ／Ｎ比が低い等の場合でも、的確に音声
区間を判定することができる効果を奏する。

【００４３】即ち、帯域別Ｓ／Ｎ比の正変動量を算出す
る正変動量算出器１２を設けることにより、平均Ｓ／Ｎ
比だけではなく、帯域別Ｓ／Ｎ比の帯域毎の大きさの違
いを捉えることが可能となる。具体的には、平均Ｓ／Ｎ
比により音声らしさレベルの初期値を決定し（条件判定
式1のア，エ）、さらに帯域別Ｓ／Ｎ比の帯域毎の大き
さの違い（帯域別Ｓ／Ｎ比の正変動量）により音声らし
さレベルの初期値からの変化量を決定する（条件判定式
1のイ，ウ，オ，カ）。

【００４４】例えば、図１６に示す二つの帯域別Ｓ／Ｎ
比の平均Ｓ／Ｎ比は、両者とも閾値より小さいため、音
声らしさレベルの初期値が小さくなる。そして、図１６
（ａ）の場合、正変動量が小さいので、音声らしさレベ
ルをさらに小さくし、図１６（ｂ）の場合、正変動量が
大きいので、音声らしさレベルを大きくする。これによ
り、帯域別Ｓ／Ｎ比の帯域毎の大きさの違いを考慮に入
れた精度のよい音声区間判定を行うことができる。

【００４５】実施の形態２．上記実施の形態１では、帯
域別Ｓ／Ｎ比の平均値を用いて音声区間であるか否かを
判定するものについて示したが、帯域別Ｓ／Ｎ比のうち
上位Ｎ位（Ｎは自然数）の帯域別Ｓ／Ｎ比を検索し、判
定処理を実行するに際して、その帯域別Ｓ／Ｎ比を考慮
するようにしてもよい。なお、帯域別Ｓ／Ｎ比の最大値
を判定処理に用いる場合には、帯域別Ｓ／Ｎ比の最大値
を正変動量とすることにより、同様の音声区間判定を実
施することができる。

【００４６】実施の形態３．上記実施の形態１，２で
は、帯域別Ｓ／Ｎ比の正変動量を算出し、その正変動量
を用いて音声区間であるか否かを判定するものについて
示したが、帯域別Ｓ／Ｎ比の負変動量を算出し（帯域別
Ｓ／Ｎ比の負変動量とは、帯域別Ｓ／Ｎ比が平均Ｓ／Ｎ
比より低い帯域において、帯域別Ｓ／Ｎ比と平均Ｓ／Ｎ
比の差を加算したものである）、その負変動量を用いて
音声区間であるか否かを判定するようにしてもよい。な
お、正変動量と負変動量は極性のみの違いである。

【００４７】実施の形態４．図３はこの発明の実施の形
態４による音声区間判定装置を示す構成図であり、図に
おいて、図１と同一符号は同一または相当部分を示すの
で説明を省略する。１５は帯域別Ｓ／Ｎ比算出器１０に
より算出された帯域別Ｓ／Ｎ比の分散値を算出する分散
算出器、１６は平均値算出器１１により算出された帯域
別Ｓ／Ｎ比の平均値と分散算出器１５により算出された
帯域別Ｓ／Ｎ比の分散値とに基づいて現在の入力信号が
音声区間又は雑音区間の何れであるかを判定する総合判
定器である。なお、分散算出器１５及び総合判定器１６
は判定手段を構成する。

【００４８】次に動作について説明する。上記実施の形
態１，２では、帯域別Ｓ／Ｎ比の正変動量を算出し、そ
の正変動量を用いて音声区間であるか否かを判定するも
のについて示したが、帯域別Ｓ／Ｎ比の分散値を算出
し、その分散値を用いて音声区間であるか否かを判定す
るようにしてもよい。

【００４９】具体的には、分散算出器１５が帯域別Ｓ／
Ｎ比の分散値ＳＮ＿ｖａｒｉａｎｃｅ（ｉ）を算出する
と、総合判定器１６が平均値算出器１１により算出され
た平均Ｓ／Ｎ比ＳＮ＿ｍｅａｎ（ｉ）と、分散算出器１
５により算出された帯域別Ｓ／Ｎ比の分散値ＳＮ＿ｖａ
ｒｉａｎｃｅ（ｉ）と、前フレームにおける総合判定器
１６の出力値（音声らしさレベルｓｐｅｅｃｈ＿ｌｅｖ
ｅｌ（ｉ−１））とを用いて、図４の条件判定式２を実
行することにより、現フレームｉにおける音声らしさレ
ベルｓｐｅｅｃｈ＿ｌｅｖｅｌ（ｉ）を求める。ここ
で、ＳＮ＿ｖａｒｉａｎｃｅ＿ＴＨ１，ＳＮ＿ｖａｒｉ
ａｎｃｅ＿ＴＨ２は、帯域別Ｓ／Ｎ比の分散値に対する
固定閾値である。

【００５０】この実施の形態４によれば、帯域別Ｓ／Ｎ
比の平均値からの広がりを表す分散値を用いることによ
り、帯域別Ｓ／Ｎ比の平均値からの相対的な変動量を捉
えることが可能になり、上記実施の形態１と同様の効果
を奏することができる。

【００５１】実施の形態５．図５はこの発明の実施の形
態５による音声区間判定装置を示す構成図であり、図に
おいて、図１と同一符号は同一または相当部分を示すの
で説明を省略する。１７は帯域別Ｓ／Ｎ比算出器１０に
より算出された帯域別Ｓ／Ｎ比が基準値以上である帯域
の個数（高Ｓ／Ｎ比帯域数）を求める高Ｓ／Ｎ比帯域数
算出器、１８は平均値算出器１１により算出された帯域
別Ｓ／Ｎ比の平均値と高Ｓ／Ｎ比帯域数算出器１７によ
り求められた高Ｓ／Ｎ比帯域数とに基づいて現在の入力
信号が音声区間又は雑音区間の何れであるかを判定する
総合判定器である。なお、高Ｓ／Ｎ比帯域数算出器１７
及び総合判定器１８は判定手段を構成する。

【００５２】次に動作について説明する。上記実施の形
態１，２では、帯域別Ｓ／Ｎ比の正変動量を算出し、そ
の正変動量を用いて音声区間であるか否かを判定するも
のについて示したが、帯域別Ｓ／Ｎ比が基準値以上であ
る帯域の個数（高Ｓ／Ｎ比帯域数）を求め、その高Ｓ／
Ｎ比帯域数を用いて音声区間であるか否かを判定するよ
うにしてもよい。

【００５３】具体的には、高Ｓ／Ｎ比帯域数算出器１７
は、帯域別Ｓ／Ｎ比算出器１０が帯域別Ｓ／Ｎ比を出力
すると、下式にしたがって高Ｓ／Ｎ比帯域数Ｈｉｇｈ＿
ＳＮＲ＿ｎｕｍｂｅｒ（ｉ）を求める。ただし、下式に
おいて、ＳＮＲ＿ＴＨは帯域別Ｓ／Ｎ比との比較に用い
る固定閾値、ε（ｉ，ｋ）はフレーム番号ｉ，帯域番号
ｋにおける帯域別Ｓ／Ｎ比が閾値ＳＮＲ＿ＴＨより大き
いか否かを示し、帯域別Ｓ／Ｎ比が閾値より大きければ
ε（ｉ，ｋ）＝１、そうでなければ、ε（ｉ，ｋ）＝０
である。

【００５４】

【数２】

【００５５】総合判定器１８が平均値算出器１１により
算出された平均Ｓ／Ｎ比ＳＮ＿ｍｅａｎ（ｉ）と、高Ｓ
／Ｎ比帯域数算出器１７により求められた高Ｓ／Ｎ比帯
域数Ｈｉｇｈ＿ＳＮＲ＿ｎｕｍｂｅｒ（ｉ）と、前フレ
ームにおける総合判定器１８の出力値（音声らしさレベ
ルｓｐｅｅｃｈ＿ｌｅｖｅｌ（ｉ−１））とを用いて、
図６の条件判定式３を実行することにより、現フレーム
ｉにおける音声らしさレベルｓｐｅｅｃｈ＿ｌｅｖｅｌ
（ｉ）を求める。ここで、Ｈｉｇｈ＿ＳＮＲ＿ｎｕｍｂ
ｅｒ＿ＴＨ１，Ｈｉｇｈ＿ＳＮＲ＿ｎｕｍｂｅｒ＿ＴＨ
２は、高Ｓ／Ｎ比帯域数に対する固定閾値である。

【００５６】この実施の形態５では、高Ｓ／Ｎ比帯域数
を用いて音声区間であるか否かを判定するものについて
示したが、帯域当たりの高Ｓ／Ｎ比帯域数（Ｈｉｇｈ＿
ＳＮＲ＿ｎｕｍｂｅｒ（ｉ）／Ｋ）を算出し、帯域当た
りの高Ｓ／Ｎ比帯域数を用いて音声区間であるか否かを
判定するようにしてもよい。この際、帯域当たりの高Ｓ
／Ｎ比帯域数に対する閾値としては、Ｈｉｇｈ＿ＳＮＲ
＿ｎｕｍｂｅｒ＿ＴＨ１／Ｋ，Ｈｉｇｈ＿ＳＮＲ＿ｎｕ
ｍｂｅｒ＿ＴＨ２／Ｋを使用する。

【００５７】また、高Ｓ／Ｎ比帯域数の代わりに、帯域
Ｓ／Ｎ比が閾値未満である帯域の数（低Ｓ／Ｎ比帯域
数）を算出し、帯域数Ｋから低Ｓ／Ｎ比帯域数を差し引
いた値や、低Ｓ／Ｎ比帯域数を帯域数Ｋで割った値（１
−帯域当たりの低Ｓ／Ｎ比帯域数）をＨｉｇｈ＿ＳＮＲ
＿ｎｕｍｂｅｒ（ｉ）として、上記の条件判定式３を実
行するなど、帯域別Ｓ／Ｎ比が基準値未満である帯域の
数又は割合を用いて判定することも可能である。

【００５８】この実施の形態５によれば、帯域別Ｓ／Ｎ
比が基準値以上である帯域の個数又は割合を用いること
により、相対的に帯域別Ｓ／Ｎ比の高い帯域を捉えるこ
とが可能になり、上記実施の形態１と同様の効果を奏す
ることができる。

【００５９】実施の形態６．図７はこの発明の実施の形
態６による音声区間判定装置を示す構成図であり、図に
おいて、図１と同一符号は同一または相当部分を示すの
で説明を省略する。１９は現フレームにおける入力信号
の信号エネルギーを算出するエネルギー算出器、２０は
現フレームにおける入力信号の差分信号エネルギーを算
出する差分エネルギー算出器、２１は入力信号の信号エ
ネルギーと差分信号エネルギーを考慮して現在の入力信
号が音声区間又は雑音区間の何れであるかを判定する総
合判定器である。なお、エネルギー算出器１９，差分エ
ネルギー算出器２０及び総合判定器２１は判定手段を構
成する。

【００６０】次に動作について説明する。上記実施の形
態１では、平均Ｓ／Ｎ比と正変動量を考慮して、現在の
入力信号が音声区間又は雑音区間の何れであるかを判定
するものについて示したが、さらに、入力信号の信号エ
ネルギーと差分信号エネルギーを考慮して判定するよう
にしてもよい。なお、この例では、時間信号からエネル
ギーを算出するものについて示しているが、これに限る
ものではなく、周波数スペクトルから得られるスペクト
ルパワーを用いてもよいし、両者を用いてもよい。

【００６１】具体的には、エネルギー算出器１９は、フ
レーム毎に入力信号の信号エネルギーＥｎｅｒｇｙ
（ｉ）を下式にしたがって算出する。ただし、下式にお
いて、Ｎはフレーム長をサンプル数で表現した場合の値
であり、例えば、サンプリング周波数が８ｋＨｚ、フレ
ーム長２０ｍｓｅｃの場合、Ｎ＝１６０となる。また、
Ｘ（ｉ，ｎ）はフレーム（フレーム番号＝ｉ）内のｎ番
目の入力信号である。

【００６２】

【数３】

【００６３】差分エネルギー算出器２０は、前フレーム
の信号エネルギーＥｎｅｒｇｙ（ｉ−１）と現フレーム
の信号エネルギーＥｎｅｒｇｙ（ｉ）との差分、即ち、
Ｅｎｅｒｇｙ（ｉ）−Ｅｎｅｒｇｙ（ｉ−１）を計算す
ることにより、入力信号の差分信号エネルギーｄｅｌｔ
ａ＿Ｅｎｅｒｇｙ（ｉ）を算出する。

【００６４】総合判定器２１は、平均Ｓ／Ｎ比ＳＮ＿ｍ
ｅａｎ（ｉ）と、帯域別Ｓ／Ｎ比の正変動量ＳＮ＿ｐｌ
ｕｓ＿ｖａｒｉａｔｉｏｎ（ｉ）と、現フレームの信号
エネルギーＥｎｅｒｇｙ（ｉ）と、差分信号エネルギー
ｄｅｌｔａ＿Ｅｎｅｒｇｙ（ｉ）と、前フレームにおけ
る総合判定器２１の出力値（音声らしさレベルｓｐｅｅ
ｃｈ＿ｌｅｖｅｌ（ｉ−１））とを用いて、図８の条件
判定式４を実行することにより、現フレームｉにおける
音声らしさレベルｓｐｅｅｃｈ＿ｌｅｖｅｌ（ｉ）を求
める。

【００６５】ただし、Ｅｎｅｒｇｙ＿ＴＨは現フレーム
の信号エネルギーＥｎｅｒｇｙ（ｉ）に対する固定閾
値、ｄｅｌｔａ＿Ｅｎｅｒｇｙ＿ＴＨは差分信号エネル
ギーｄｅｌｔａ＿Ｅｎｅｒｇｙ（ｉ）に対する固定閾値
である。

【００６６】この実施の形態６によれば、背景雑音の推
定精度に依存する帯域別Ｓ／Ｎ比の平均値及び正変動量
に加えて、背景雑音の推定精度に依存しない入力信号の
信号エネルギー及び差分信号エネルギーを用いることに
より、背景雑音の推定精度が劣化しても、精度よく音声
区間を判定することができる効果を奏する。

【００６７】実施の形態７．上記実施の形態６では、上
記実施の形態１に対してエネルギー算出器１９と差分エ
ネルギー算出器２０を追加することにより、入力信号の
信号エネルギーと差分信号エネルギーを考慮して判定処
理を実施するものについて示したが、上記実施の形態
２，３に対してエネルギー算出器１９と差分エネルギー
算出器２０を追加することにより、入力信号の信号エネ
ルギーと差分信号エネルギーを考慮して判定処理を実施
するようにしてもよく、上記実施の形態６と同様の効果
を奏することができる。

【００６８】実施の形態８．上記実施の形態６では、上
記実施の形態１に対してエネルギー算出器１９と差分エ
ネルギー算出器２０を追加することにより、入力信号の
信号エネルギーと差分信号エネルギーを考慮して判定処
理を実施するものについて示したが、図９に示すよう
に、上記実施の形態４に対してエネルギー算出器１９と
差分エネルギー算出器２０を追加することにより、総合
判定器（判定手段）２２が入力信号の信号エネルギーと
差分信号エネルギーを考慮して判定処理を実施するよう
にしてもよく、上記実施の形態６と同様の効果を奏する
ことができる。この場合、総合判定器２２は、図１０の
条件判定式５を実行することにより、現フレームｉにお
ける音声らしさレベルｓｐｅｅｃｈ＿ｌｅｖｅｌ（ｉ）
を求める。

【００６９】この実施の形態８によれば、背景雑音の推
定精度に依存する帯域別Ｓ／Ｎ比の平均値及び分散値に
加えて、背景雑音の推定精度に依存しない入力信号の信
号エネルギー及び差分信号エネルギーを用いることによ
り、背景雑音の推定精度が劣化しても、精度よく音声区
間を判定することができる効果を奏する。

【００７０】実施の形態９．上記実施の形態６では、上
記実施の形態１に対してエネルギー算出器１９と差分エ
ネルギー算出器２０を追加することにより、入力信号の
信号エネルギーと差分信号エネルギーを考慮して判定処
理を実施するものについて示したが、図１１に示すよう
に、上記実施の形態５に対してエネルギー算出器１９と
差分エネルギー算出器２０を追加することにより、総合
判定器（判定手段）２３が入力信号の信号エネルギーと
差分信号エネルギーを考慮して判定処理を実施するよう
にしてもよく、上記実施の形態６と同様の効果を奏する
ことができる。この場合、総合判定器２３は、図１２の
条件判定式６を実行することにより、現フレームｉにお
ける音声らしさレベルｓｐｅｅｃｈ＿ｌｅｖｅｌ（ｉ）
を求める。

【００７１】この実施の形態９によれば、背景雑音の推
定精度に依存する帯域別Ｓ／Ｎ比の平均値及び高Ｓ／Ｎ
比帯域数に加えて、背景雑音の推定精度に依存しない入
力信号の信号エネルギー及び差分信号エネルギーを用い
ることにより、背景雑音の推定精度が劣化しても、精度
よく音声区間を判定することができる効果を奏する。

【００７２】実施の形態１０．上記実施の形態１〜９で
は、総合判定器１３等が音声区間の判定処理に用いる判
定パラメータ（例えば、帯域別Ｓ／Ｎ比の平均値、上位
Ｎ位の帯域別Ｓ／Ｎ比、正変動量、負変動量、分散値、
高Ｓ／Ｎ比帯域数、高Ｓ／Ｎ比帯域の割合）に対する閾
値が固定のものを示したが、帯域別Ｓ／Ｎ比算出部１０
により算出された帯域別Ｓ／Ｎ比にしたがって、これら
の閾値を更新するようにしてもよい。

【００７３】以下、閾値の判定処理を具体的に説明す
る。図１３は総合判定器１３の内部を示す構成図であ
り、図において、１３ａは帯域別Ｓ／Ｎ比の平均値を入
力して判定処理を実行する個別判定器、１３ｂは帯域別
Ｓ／Ｎ比の正変動量を入力して判定処理を実行する個別
判定器である。図１４は個別判定器１３ａ，１３ｂの内
部を示す構成図であり、図において、３１は比較演算
器、３２は閾値保持器、３３は閾値更新器である。

【００７４】次に動作について説明する。比較演算器３
１は、判定パラメータと閾値保持器３２に保持されてい
る閾値との大小比較を実施し、判定パラメータの値が閾
値よりも大きければ音声らしさレベルを上げる一方、小
さければ音声らしさレベルを下げ、この結果、得られた
音声らしさレベルを出力する。

【００７５】閾値更新器３３は、現フレームの判定パラ
メータの値と過去の判定パラメータの値を用いて閾値を
更新する。以下、判定パラメータの一例として、帯域別
Ｓ／Ｎ比の平均値（平均Ｓ／Ｎ比）に対する閾値の更新
処理を説明する。ただし、他の閾値も同様にして更新す
る。図１５は平均Ｓ／Ｎ比から過去数フレーム（図では
５フレーム）内における平均Ｓ／Ｎ比の最大値を求める
様子を示している。

【００７６】図１５の上段において、例えば、時刻ｔ₁
に着目すると、過去５フレーム（Ａの範囲）の平均Ｓ／
Ｎ比の最大値は、時刻ｔ_1,max のときの値であり、時刻
ｔ_1, _max の値を図１５の下段にプロットする。時刻ｔ₁
以外の各時刻についても同様にして、図１５の下段に最
大値をプロットする。そして、閾値更新器３３は、図１
５の下段に示される平均Ｓ／Ｎ比の最大値を下式に代入
して、新たな閾値を計算する。ＳＮ＿ｍｅａｎ＿ＴＨ（ｉ）＝γ・ＳＮ＿ｍｅａｎ＿Ｔ
Ｈ（ｉ−１）＋（１−γ）・ＳＮ＿ｍｅａｎ＿ｍａｘ
（ｉ）

【００７７】ただし、ＳＮ＿ｍｅａｎ＿ＴＨ（ｉ）はフ
レームｉの平均Ｓ／Ｎ比に対する更新後の閾値、ＳＮ＿
ｍｅａｎ＿ｍａｘ（ｉ）は過去５フレーム内の平均Ｓ／
Ｎ比の最大値、γは平均Ｓ／Ｎ比に対する閾値の収束速
度であり、例えば、０．７という値をとるが、他にも帯
域や音声らしさレベルによって値を変えたりしてもよ
い。

【００７８】これにより、この実施の形態１０によれ
ば、上記実施の形態１〜５の効果に加えて、例えば、雑
音レベルが大きく上昇した場合、雑音レベルの上昇に追
従して平均Ｓ／Ｎ比の最大値が小さくなり、これに連動
して閾値も小さくなることから、固定閾値を用いる場合
に比べて、追従性よく適切な閾値を設定することが可能
となる。その結果、音声区間の判定精度が向上し、さら
に雑音区間の帯域スペクトルの推定精度が向上する効果
を奏する。

【００７９】また、閾値の更新に過去数フレーム内の最
大値を用いることにより、従来から一般的に用いられて
いるＡＲ平滑を行う場合と比べて、閾値が過渡に変化せ
ず、また、背景雑音レベルの変化量の大小に拘わらず、
安定した音声区間の判定を実施することができる効果を
奏する。なお、ＡＲ平滑を用いて、各種の閾値を更新し
てもよいことは言うまでもない。

【００８０】

【発明の効果】以上のように、この発明によれば、帯域
分割手段により求められた入力信号の現在の区間の帯域
スペクトルと雑音区間と判定された過去の区間の帯域ス
ペクトルとの比である帯域別Ｓ／Ｎ比を算出し、その帯
域別Ｓ／Ｎ比に基づいて入力信号の現在の区間が音声区
間又は雑音区間の何れであるかを判定するように構成し
たので、現在の入力信号のＳ／Ｎ比が低い等の場合で
も、的確に音声区間を判定することができる効果があ
る。

【００８１】この発明によれば、入力信号の現在の区間
が雑音区間であると判定する場合、入力信号の帯域スペ
クトルにより過去の雑音区間の帯域スペクトルを更新す
るように構成したので、過去の雑音区間の帯域スペクト
ルの確度を高めることができる効果がある。

【００８２】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比の平均値を算出し、判定処
理を実行するに際して、その平均値を考慮するように構
成したので、音声区間の判定精度を高めることができる
効果がある。

【００８３】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比のうち上位Ｎ位（Ｎは自然
数）の帯域別Ｓ／Ｎ比を検索し、判定処理を実行するに
際して、その帯域別Ｓ／Ｎ比を考慮するように構成した
ので、音声区間の判定精度を高めることができる効果が
ある。

【００８４】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比の正変動量を算出し、判定
処理を実行するに際して、その正変動量を考慮するよう
に構成したので、音声区間の判定精度を高めることがで
きる効果がある。

【００８５】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比の負変動量を算出し、判定
処理を実行するに際して、その負変動量を考慮するよう
に構成したので、音声区間の判定精度を高めることがで
きる効果がある。

【００８６】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比の分散値を算出し、判定処
理を実行するに際して、その分散値を考慮するように構
成したので、音声区間の判定精度を高めることができる
効果がある。

【００８７】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比が基準値以上である帯域の
個数又は割合を求め、判定処理を実行するに際して、そ
の個数又は割合を考慮するように構成したので、音声区
間の判定精度を高めることができる効果がある。

【００８８】この発明によれば、判定処理を実行するに
際して、入力信号の現在の信号エネルギーを考慮するよ
うに構成したので、背景雑音の推定精度が劣化しても、
精度よく音声区間を判定することができる効果がある。

【００８９】この発明によれば、判定処理を実行するに
際して、入力信号の差分信号エネルギーを考慮するよう
に構成したので、背景雑音の推定精度が劣化しても、精
度よく音声区間を判定することができる効果がある。

【００９０】この発明によれば、Ｓ／Ｎ比算出手段によ
り算出された帯域別Ｓ／Ｎ比にしたがって判定処理に用
いる閾値を更新するように構成したので、音声区間の判
定精度がさらに向上する効果がある。

【図面の簡単な説明】

【図１】この発明の実施の形態１による音声区間判定
装置を示す構成図である。

【図２】条件判定式１を示す説明図である。

【図３】この発明の実施の形態４による音声区間判定
装置を示す構成図である。

【図４】条件判定式２を示す説明図である。

【図５】この発明の実施の形態５による音声区間判定
装置を示す構成図である。

【図６】条件判定式３を示す説明図である。

【図７】この発明の実施の形態６による音声区間判定
装置を示す構成図である。

【図８】条件判定式４を示す説明図である。

【図９】この発明の実施の形態８による音声区間判定
装置を示す構成図である。

【図１０】条件判定式５を示す説明図である。

【図１１】この発明の実施の形態９による音声区間判
定装置を示す構成図である。

【図１２】条件判定式６を示す説明図である。

【図１３】総合判定器１３の内部を示す構成図であ
る。

【図１４】個別判定器１３ａ，１３ｂの内部を示す構
成図である。

【図１５】平均Ｓ／Ｎ比から過去数フレーム内におけ
る平均Ｓ／Ｎ比の最大値を求める様子を示す説明図であ
る。

【図１６】帯域別Ｓ／Ｎ比の一例を表す説明図であ
る。

【符号の説明】

１入力端子、２Ａ／Ｄ変換器、３窓関数演算器、
４高域強調器、５直交変換器（直交変換手段）、６
帯域分割器（帯域分割手段）、７切換スイッチ、８
雑音更新器（判定手段）、９雑音保持器（判定手
段）、１０帯域別Ｓ／Ｎ比算出器（Ｓ／Ｎ比算出手
段）、１１平均値算出器（判定手段）、１２正変動
量算出器（判定手段）、１３総合判定器（判定手
段）、１３ａ個別判定器、１３ｂ個別判定器、１４
出力端子、１５分散算出器（判定手段）、１６総
合判定器（判定手段）、１７高Ｓ／Ｎ比帯域数算出器
（判定手段）、１８総合判定器（判定手段）、１９
エネルギー算出器（判定手段）、２０差分エネルギー
算出器（判定手段）、２１総合判定器（判定手段）、
２２総合判定器（判定手段）、２３総合判定器（判定
手段）、３１比較演算器、３２閾値保持器、３３
閾値更新器。

Claims

【特許請求の範囲】

【請求項１】所定の区間ごとに入力される入力信号を
時間軸信号から周波数軸信号に直交変換して現在の区間
の入力信号の周波数スペクトルを求める直交変換手段
と、上記直交変換手段により求められた周波数スペクト
ルを複数の周波数帯域に分割して現在の区間の帯域スペ
クトルを求める帯域分割手段と、上記帯域分割手段によ
り求められた現在の区間の帯域スペクトルと雑音区間と
判定された過去の区間の帯域スペクトルとの比である帯
域別Ｓ／Ｎ比を算出するＳ／Ｎ比算出手段と、上記Ｓ／
Ｎ比算出手段により算出された帯域別Ｓ／Ｎ比に基づい
て入力信号の現在の区間が音声区間又は雑音区間の何れ
であるかを判定する判定手段とを備えた音声区間判定装
置。
【請求項２】判定手段は、入力信号の現在の区間が雑
音区間であると判定する場合、入力信号の現在の区間の
帯域スペクトルにより過去の雑音区間の帯域スペクトル
を更新することを特徴とする請求項１記載の音声区間判
定装置。
【請求項３】判定手段は、Ｓ／Ｎ比算出手段により算
出された帯域別Ｓ／Ｎ比の平均値を算出し、判定処理を
実行するに際して、その平均値を考慮することを特徴と
する請求項１または請求項２記載の音声区間判定装置。
【請求項４】判定手段は、Ｓ／Ｎ比算出手段により算
出された帯域別Ｓ／Ｎ比のうち上位Ｎ位（Ｎは自然数）
の帯域別Ｓ／Ｎ比を検索し、判定処理を実行するに際し
て、その帯域別Ｓ／Ｎ比を考慮することを特徴とする請
求項１または請求項２記載の音声区間判定装置。
【請求項５】判定手段は、Ｓ／Ｎ比算出手段により算
出された帯域別Ｓ／Ｎ比の正変動量を算出し、判定処理
を実行するに際して、その正変動量を考慮することを特
徴とする請求項１から請求項４のうちのいずれか１項記
載の音声区間判定装置。
【請求項６】判定手段は、Ｓ／Ｎ比算出手段により算
出された帯域別Ｓ／Ｎ比の負変動量を算出し、判定処理
を実行するに際して、その負変動量を考慮することを特
徴とする請求項１から請求項４のうちのいずれか１項記
載の音声区間判定装置。
【請求項７】判定手段は、Ｓ／Ｎ比算出手段により算
出された帯域別Ｓ／Ｎ比の分散値を算出し、判定処理を
実行するに際して、その分散値を考慮することを特徴と
する請求項１から請求項４のうちのいずれか１項記載の
音声区間判定装置。
【請求項８】判定手段は、Ｓ／Ｎ比算出手段により算
出された帯域別Ｓ／Ｎ比が基準値以上である帯域の個数
又は割合を求め、判定処理を実行するに際して、その個
数又は割合を考慮することを特徴とする請求項１から請
求項４のうちのいずれか１項記載の音声区間判定装置。
【請求項９】判定手段は、判定処理を実行するに際し
て、入力信号の現在の区間の信号エネルギーを考慮する
ことを特徴とする請求項１から請求項８のうちのいずれ
か１項記載の音声区間判定装置。
【請求項１０】判定手段は、判定処理を実行するに際
して、入力信号の現在の区間の差分信号エネルギーを考
慮することを特徴とする請求項１から請求項９のうちの
いずれか１項記載の音声区間判定装置。
【請求項１１】判定手段は、Ｓ／Ｎ比算出手段により
算出された帯域別Ｓ／Ｎ比にしたがって判定処理に用い
る閾値を更新することを特徴とする請求項１から請求項
１０のうちのいずれか１項記載の音声区間判定装置。