JPH04223497A

JPH04223497A - 有音区間の検出方法

Info

Publication number: JPH04223497A
Application number: JP2413742A
Authority: JP
Inventors: Keisuke Oda; 啓介小田; Akihiko Watanabe; 彰彦渡邉; Yumi Takizawa; 滝沢　由美; Atsushi Fukazawa; 敦司深澤
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1990-12-25
Filing date: 1990-12-25
Publication date: 1992-08-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は有音区間の検出方法にか
かり、特に音声を時系列信号とみなしたときの有音区間
の検出方法に関するものである。

【０００２】

【従来技術】従来の有音区間の検出方法としては、音声
信号の音声パワ−に着目するものがあった。即ち、分析
フレ−ムの時系列パワ−に対して、あるしきい値を設定
し、該時系列パワ−がそのしきい値以上のレベルの区間
を有音区間とするものであった。例えば、図５に示すよ
うに、しきい値をＥ０と設定すると、音声パワ−のレベ
ルがＥ０を超えた区間が有音区間となる。

【０００３】

【発明が解決しようとする課題】しかしながら上記従来
の有音区間の検出方法では、音声パワ−という尺度に対
して判定を行なうため、発生環境の雑音や発音者自身の
吸気音等の背景雑音の雑音レベルに応じた可変のしきい
値の設定が必要であった。本発明は上述した実情に鑑み
てなされたもので、背景雑音の雑音レベルに依存したし
きい値を設定することの必要性を除去し、背景雑音の雑
音レベルに依存しない尺度による有音区間の検出方法を
提供することを目的とする。

【０００４】

【課題を解決するための手段】上記課題を解決するため
に本発明は有音区間の検出方法において、入力信号の平
均パワ−を求める第１の工程と、入力信号の予測誤差パ
ワ−を検出する第２の工程と、第１の工程によって算出
された平均パワ−及び第２の工程によって算出された予
測誤差パワ−に基づいて正規化エントロピ−を求める第
３の工程と、第３の工程によって求められた正規化エン
トロピ−が所定のしきい値を超えた区間を有音区間とし
て検出を行なうことを特徴とする。

【０００５】

【作用】有音区間の検出方法を上述のごとく行い、音声
信号の正規化エントロピ−が予め定められたしきい値を
超えた区間について有音区間とするため、背景雑音の雑
音レベルに依存しない有音区間の検出が可能となる。

【０００６】

【実施例】以下、本発明の一実施例を図面を用いて説明
する。

【０００７】図１は本発明にかかる有音区間の検出方法
を用いた有音区間検出装置の構成を示すブロック図であ
る。同図中、Ｉは入力信号、１０は２乗値算出手段、２
０は平均パワ−算出手段、３０は予測誤差パワ−算出手
段、４０は正規化エントロピ−算出手段、５０は有音区
間決定手段、Ｏは検出信号である。

【０００８】まず、この有音区間検出装置の動作につい
て説明する。入力信号Ｉは、例えばサンプリング周波数
８ｋＨｚでＡ／Ｄ変換された音声の時系列信号ｘ（ｎ）
　（ｎ＝０，±Δｔ，±２Δｔ，±３Δｔ，・・・・、
但しΔｔ＝１／８０００ｓｅｃ）となっているものとす
る。２乗値算出手段１０は、入力信号Ｉである時系列信
号ｘ（ｎ）を入力として２乗信号｛ｘ（ｎ）｝２を得る
。次にこの２乗信号を平均パワ−算出手段２０へ入力し
、平均パワ−Ｐ０（ｎ）を得る。ここで平均パワ−Ｐ０
（ｎ）は数１に示す（１−１）式で定義されるものであ
る。

【０００９】

【数１】

【００１０】ここで、Ｌは時系列化された区間長であっ
てこの区間長Ｌに対して平均化が行なわれる。

【００１１】入力信号Ｉは２乗化算出手段１０に入力さ
れるとともに予測誤差パワ−算出手段３０にも入力され
る。予測誤差パワ−算出手段３０は入力信号Ｉである時
系列信号ｘ（ｎ）に対して最大エントロピ−法による予
測分析を行ない、ｍ次の予測誤差パワ−Ｐｍ（ｎ）を得
るものである。この予測誤差パワ−Ｐｍ（ｎ）は、時系
列信号ｘ（ｎ）を数２に示す（１−２）式のような過去
におけるｍ個のサンプル値の線形結合を考えた場合に、
最大エントロピ−法を用いてｍ次の線形予測係数を決定
し、数３に示す（１−３）式を用いて算出されたもので
ある。

【００１２】

【数２】

【００１３】

【数３】

【００１４】（ここで、ｍ＝１，２，３，・・・Ｍ；Ｍ
は最大予測係数）

【００１５】そして、予測誤差パワ−算出手段３０は、
（１−３）式においてｍ＝１から順にＭまで増加させた
ときのＭ次の予測誤差パワ−ＰＭ（ｎ）を出力する。

【００１６】正規化エントロピ−算出手段４０は、平均
パワ−Ｐ０（ｎ）及び予測誤差パワ−ＰＭ（ｎ）を入力
として情報エントロピ−の算出を行なうものである。そ
こで、正規化エントロピ−算出手段４０における正規化
エントロピ−について、及び正規化エントロピ−の算出
に際して用いられる時系列スペクトルについて説明する
。ここで正規化エントロピ−とは音声信号にＡＲ（Ａｕ
ｔｏ　Ｒｅｇｒｅｓｓｉｖｅ；自己回帰）モデルを適用
した結果得られる予測性の善し悪しを示す評価尺度であ
る。即ち信号がランダム的な雑音である場合と、予測可
能な音声信号である場合の両者のもつエントロピ−の違
いに着目したものである。

【００１７】いま、時系列スペクトルをＳ（ｆ，ｎ）と
すると、そのエントロピ−Ｈ（ｎ）は数４に示す（１−
４）式のように表される。

【００１８】

【数４】

【００１９】上式においてｆＮはナイキスト周波数であ
り、Ｓ（ｆ，ｎ）は数５に示す（１−５）式で表される
。

【００２０】

【数５】

【００２１】次に、（１−４）式に（１−５）式を代入
すると、（１−５）式の分母の項の積分値は０となるの
で、（１−４）式は以下のように書き替えられる。

【００２２】　　　　　　　　　　　　　　　　　　　　　　　　　
　ｆＮ　Ｈ（ｎ）＝｛１／（４・ｆＮ）｝・∫　　　｛
ｌｏｇΔｔＰｍ（ｎ）｝ｄｆ＋（１／２）・ｌｏｇ（２
・ｆＮ）　　　　　　　　　　　　　　　　　　　　　
　　　　　−ｆＮ　　　　　　　　　　　　　　　　　
　　　　　　　　　　　（１−６）

【００２３】そして
、（１−６）式の積分を実行し、定数を無視することに
よって（１−７）式を得ることができる。

【００２４】Ｈ（ｎ）＝ｌｏｇＰｍ（ｎ）　　　　　　　　　　　　
　　　　　　　　（１−７）

【００２５】更に、（１−
７）式のエントロピ−Ｈ（ｎ）は（１−３）式を漸化的
に解いたものであるため、平均パワ−Ｐ０（ｎ）に依存
した値となる。そこで、平均パワ−Ｐ０　∧（ｎ）に依
存しない正規化エントロピ−をＨ（ｎ）を（１−８）式
のように定義する。

【００２６】∧ 　　Ｈ（ｎ）＝ｌｏｇ｛（Ｐｍ（ｎ））／（Ｐ０（ｎ）
）｝＝ｌｏｇＰｍ（ｎ）−ｌｏｇＰ０（ｎ）　　　　　
（１−８）

【００２７】以上説明したように、正規化エ
ントロピ−算出手段４０においては具体的には（１−８
）式による演算が行なわれる。

【００２８】そして、最後に有音区間決定手段５０は、
正規化エントロピ−算出手段４０で算出された正規化エ
ントロピ−が所定のしきい値を越える区間を検出し、該
しきい値を超えた区間を有音区間と決定し、検出信号Ｏ
を出力する。従って、図２に∧示すように正規化エント
ロピ−ＨＭ（ｎ）が算出された場合、予め定められたし
きい∧値Ｈ０以下の区間が同図に示すように有音区間と
して決定される。なお、同図において横軸は時間、縦軸
は正規化エントロピ−の値を表している。

【００２９】∧次に、所定のしきい値Ｈ０の決定につい
て説明する。図３は有音区間検出のた∧めのしきい値Ｈ
０の決定を説明するための図であり、同図（ａ）は雑音
レベルをパラメ−タとした場合の平均パワ−を表した図
、また同図（ｂ）は最大予測次数を１０次とした場合の
正規化エントロピ−を表した図である。同図（ａ）に示
すように雑音レベルを増加させた場合であっても、雑音
区間の正規化エントロピ−は同図（ｂ）に示したように
せいぜい約−３．５ｄＢ程度であることがわかる。∧従
って、有音区間検出のためのしきい値Ｈ０は、−４．０
ｄＢ程度に設定すれば良いことがわかる。

【００３０】次に、本発明にかかる有音区間の検出方法
を使用して入力信号Ｉから有音区間を検出する具体例を
説明する。図４は入力信号の具体例を表した図で、同図
（ａ）は入力信号の平均パワ−を表した図、同図（ｂ）
は正規化エントロピ−を表した図である。この具体例に
おいては入力信号Ｉとして単語「つるが」を入力してい
る。また、有音区間検出のためのしきい値Ｈ０の値は−
４．０ｄＢ、最大予測次数は１０次である。同図に示す
とおり、入力信号Ｉである単語「つるが」の有音区間が
ほぼ正確に検出されていることがわかる。

【００３１】

【発明の効果】以上詳細に説明したように、本発明によ
れば以下のような優れた効果を得ることができる。

【００３２】（１）背景雑音の雑音レベルに依存しない
尺度による有音区間の検出が可能となる。

【００３３】（２）従来の音声パワ−に着目した有音区
間の検出方法と比較して、ランダム的な背景雑音に特に
強いという特徴を有する。

【００３４】（３）さらに、本発明は情報エントロピ−
に基づいたものであるため、音声信号に限らず、例えば
エンジン音やモ−タ−音等の一般の入力信号に対しても
正規化エントロピ−を用いることによって有音区間の検
出が可能となる。

【図面の簡単な説明】

【図１】本発明にかかる有音区間の検出方法を用いた有
音区間検出装置の構成を示すブロック図である。

【図２】有音区間の検出を説明するための図である。

【図３】有音区間検出のためのしきい値の決定を説明す
るための図であり、同図（ａ）は雑音レベルをパラメ−
タとした場合の平均パワ−を表した図、また同図（ｂ）
は最大予測次数を１０次とした場合の正規化エントロピ
−を表した図である。

【図４】入力信号の具体例を表した図で、同図（ａ）は
入力信号の平均パワ−を表した図、同図（ｂ）は正規化
エントロピ−を表した図である。

【図５】従来の有音区間の検出方法を説明するための図
である。

【符号の説明】

１０　　　　　　２乗値算出手段２０　　　　　　平均パワ−算出手段３０　　　　　　予測誤差パワ−算出手段４０　　　　
　　正規化エントロピ−算出手段５０　　　　　　有音
区間決定手段

Claims

【特許請求の範囲】

【請求項１】入力信号から検出を行ないたい区間である
有音区間を検出する有音区間の検出方法において、入力
信号の平均パワ−を求める第１の工程と、前記入力信号
の予測誤差パワ−を検出する第２の工程と、前記第１の
工程によって算出された平均パワ−及び前記第２の工程
によって算出された予測誤差パワ−に基づいて正規化エ
ントロピ−を求める第３の工程と、前記第３の工程によ
って求められた正規化エントロピ−が所定のしきい値を
超えた区間を有音区間として検出を行なうことを特徴と
する有音区間の検出方法。