JP2004053626A - 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 - Google Patents
雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 Download PDFInfo
- Publication number
- JP2004053626A JP2004053626A JP2002206642A JP2002206642A JP2004053626A JP 2004053626 A JP2004053626 A JP 2004053626A JP 2002206642 A JP2002206642 A JP 2002206642A JP 2002206642 A JP2002206642 A JP 2002206642A JP 2004053626 A JP2004053626 A JP 2004053626A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- entropy
- signals
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
【課題】時々刻々変化する雑音の影響を確実に除去する雑音抑制方法を提案する。
【解決手段】1つ又は少数のピークを持つ一次元信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、雑音が多量に重畳されているか否かを各信号のエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを用いて各信号のエントロピーの重み付き平均を行うことにより雑音の影響を排除した信号を求める。
【選択図】 図1
【解決手段】1つ又は少数のピークを持つ一次元信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、雑音が多量に重畳されているか否かを各信号のエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを用いて各信号のエントロピーの重み付き平均を行うことにより雑音の影響を排除した信号を求める。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、雑音に強い音声認識、音声合成などの音声情報処理のために、音声から基本周波数などの特徴を抽出する際に、雑音の影響を低減する技術に関する。
【0002】
【従来の技術】
従来から、音声認識においては、音の特徴を表わすのに、スペクトルが用いられてきた。[例えば、古井貞煕、ディジタル音声処理、東海大出版会、1985]音声は、声帯の振動により生成されるため、音声信号では、類似した波形が繰り返される。繰り返しの影響は、音声スペクトルの上での繰り返しの形としても現れる。波形の繰り返し、スペクトルの上での繰り返しの周期から声帯振動周波数(基本周波数)を求めることができる。
【0003】
【発明が解決しようとする課題】
音声に雑音が加わった場合に、基本周波数を求める精度が劣化する。しかし、雑音が特定の時間や特定の周波数帯域のみに加わっている場合には、その時間や帯域を除外すれば雑音の影響を少なくできると考えられる。従来は、雑音の影響が特定の帯域のみに影響をもつ場合には雑音が重畳される帯域を取り除くフィルタによる方法などがあったが、雑音の影響が時間的に変化する場合には取り除く手段がなかった。
【0004】
【課題を解決するための手段】
この発明では、1つ又は少数のピークを持つ例えばケプストラムのような信号からこの信号のエントロピー値を求め、このエントロピー値により信号に重畳する雑音の量を評価する雑音重畳量評価方法を提案する。
この発明では更に、1つ又は少数のピークを持つ信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、雑音が多量に重畳されているか否かを各信号のエントロピー値により評価し、この評価結果により雑音の重畳量が少ない信号を選択して雑音の影響を排除した元信号を得る雑音抑制方法を提案する。
この発明では更に、一つ又は少数のピークを持つ信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、雑音が多量に重畳されているか否かを各信号のエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを用いて各信号のエントロピーの重み付き平均を行うことにより雑音の影響を排除した信号を求める雑音抑制方法を提案する。
【0005】
この発明では更に、元信号を複数の元信号に分割する信号分割手段と、この信号分割手段で分割された複数の元信号を少なくとも1つ又は少数のピークを持つ信号に変換する複数の信号変換手段と、この複数の信号変換手段が変換した信号から各信号のエントロピーを算出するエントロピー算出手段と、エントロピー算出手段が算出したエントロピー値に応じて信号分割手段が分割して得られる複数の信号の中から雑音の影響が少ない信号を抽出する抽出手段と、によって構成した雑音抑制装置を提案する。
この発明では更に、元信号を複数の元信号に分割する信号分割手段と、この信号分割手段で分割された複数の元信号を少なくとも1つ又は少数のピークを持つ信号に変換する複数の信号変換手段と、この複数の信号変換手段が変換した信号から各信号のエントロピーを算出するエントロピー算出手段と、エントロピー算出手段が算出したエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを算出する重み算出手段と、この重み算出手段で算出した重みを用いて複数の信号毎に求めた信号の重み付き平均を求める重み付き平均算出手段と、この重み付き平均算出手段が算出した信号により雑音の影響が少ない信号を抽出する抽出手段と、によって構成した雑音抑制装置を提案する。
【0006】
この発明では更に、前記雑音抑制装置の何れかにおいて、元信号は音声信号であり、信号分割手段は元信号の周波数帯域を複数に分割する周波数帯域分割手段又は元信号を複数の時分割信号に分割する時分割手段であり、信号変換手段は元信号のケプストラムを算出するケプストラム算出手段である雑音抑制装置を提案する。
この発明では更に、コンピュータが読み取り可能な符号によって記述され、コンピュータに前記雑音重畳量評価方法を実行させる雑音重畳量評価プログラムを提案する。
この発明では更に、コンピュータが読み取り可能な符号によって記述され、コンピュータに前記雑音抑制方法の何れか一方を実行させる雑音抑制プログラムを提案する。
この発明では更に、前記雑音重畳量評価プログラム又は前記雑音抑制プログラムの何れか一方又は双方をコンピュータが読み取り可能な記録媒体に記録した記録媒体を提案する。
【0007】
作用
周波数を横軸とする音声スペクトルにおいて、雑音の影響が現れる周波数帯域が時間的に変化する場合においても、雑音の影響が現れない周波数帯域においては、基本周波数を周期とする繰り返しの構造が見られる。従って、雑音の影響を受けて、調波構造が見られなくなっているかどうかを評価する方法があれば、雑音の影響を受けていない部分を選択的に用いて、音声波形の繰り返しの周期、すなわち、基本周波数を精度良く求めることができると考えられる。
ここでは、音声を例にとって説明しているが、一般的には、本来、ここで取り扱う信号は、元の信号から導かれる信号であって、雑音が重畳されていなければ、1つ、または、極めて少数の信号のピークがあるものを対象とする。信号としてはここではケプストラムを例示して示す。ケプストラムの他にヒストグラムがある。ケプストラムのような信号に雑音が重畳されると、複数のピークが現れたり、信号の分布の分散などの広がりが大きくなる。同一の信号を帯域分割するか或は時分割して複数個の信号を用意すると、そのうち雑音の影響を受けているものと受けていないものがあるとする。
【0008】
この発明では、信号に雑音が多量に重畳しているか否かを評価するために、関数のエントロピー値を用いる事にする。ある関数s(ω)のエントロピー値Hは以下のように与えられる。
【数1】
とする。
この値は、関数s(ω)が平坦であれば大きな値を示し、一部にピークがあると小さな値になる。例えば、平坦な分布(1/8,1/8,1/8,1/8,1/8,1/8,1/8,1/8)のエントロピー値は2.08であるが、一箇所の値だけが大きい(1/16,1/16,1/16,9/16, 1/16,1/16,1/16,1/16,)のエントロピー値は1.54である。従って、エントロピーの値により雑音の重畳量を知ることができ、雑音重畳量を評価することができる。また、この評価結果を利用してエントロピー値が大きい信号を除去するか或は重み付けにより、その影響を小さくしてケプストラムの重み付け平均を採ることにより雑音の影響を排除した信号を得ることができる。なお、s(ω)はヒストグラムでも良い。
【0009】
【発明の実施の形態】
音声の基本周波数を求める例にもどって具体的な計算の例を示す。先ず、図1のような音声波形からFFT(高速フーリエ変換)によりスペクトルを求める。スペクトルの絶対値を採り、さらにその対数を採る。この対数スペクトルを逆フーリエ変換したものはケプストラムと呼ばれる。もし、雑音が重畳していない音声であれば、ケプストラムのある次数においてピークが現れる。ケプストラムの絶対値を採ったものを図2に示す。サンプリング周波数をsf(Hz)とすると、i次のケプストラムはsf/i (Hz)の基本周波数を示す。例えば、サンプリング周波数が12kHzの場合には、120次のケプストラムにピークがあれば、基本周波数100Hzを示す。スペクトルの上には、基本周波数を周期とする繰り返し構造が現れているので、その部分からでも上記の値を求めることができる。
図3のように、雑音が音声に重畳している場合には、ケプストラムの絶対値を採ったものは図4のようになる。雑音が無い場合にみられた、ピークがはっきりしなくなっている。
【0010】
雑音が一部の周波数帯域に影響を及ぼしている場合には、スペクトルを求めた後、例えば、4kHzの帯域を4分割する。それぞれの帯域におけるスペクトルの絶対値の対数を逆フーリエ変換して各帯域毎にケプストラムを出す。各帯域のケプストラムの絶対値を採ると正値になり、ケプストラムの次数のある範囲での積分値を1にすることができ、その次数区間でのエントロピー値を計算できる。なお、ケプストラムで声道の特徴を反映した20次以下の部分は除外する。
各帯域でのケプストラムから、エントロピー値を出せば、雑音の影響を受けている帯域ではエントロピーが高く、雑音の影響を受けていない帯域では、エントロピーが低くなる。従って、エントロピー値が或る設定した値より大きい帯域の信号を除外してケプストラムを求めることにより雑音の影響を排除したケプストラムを得ることができる。このケプストラムを用いることにより雑音の影響が少ない基本周波数の推定を実現することができる。
また、他の方法として、例えばエントロピー値の逆数を重みとして各帯域毎の求めたケプストラムに重み付けを施し、この重み付けされたケプストラムの重み付き平均を採れば、雑音の影響が少ない帯域のケプストラムが強調されたケプストラムを求めることができ、雑音の影響を受けにくい、基本周波数の推定が実現できる。
【0011】
一方、雑音が時間方向に選択的に重畳する場合には、信号を時間方向に時分割して複数の信号に分割し、この複数の信号のエントロピーを算出し、このエントロピーの値に従って、雑音の重畳量の大きい信号を特定し、その信号を除去してケプストラムを算出することにより、雑音の影響が除去されたケプストラムを求めることができる。これにより雑音の影響を受けにくい基本周波数の推定が実現できる。
図5にこの発明の雑音抑制方法を実現するための雑音抑制プログラムの手順を説明するためのフローチャートの例を示す。この例では最終的に雑音に影響されない信号の基本周波数を求める場合を例示している。
【0012】
ステップ101で、音声波形を切り出す。
ステップ102で、フーリエ変換によりスペクトルに変換する。
ステップ103で、スペクトルの絶対値の対数を採る。
ステップ104で、全周波数帯域を分割する。例えば、8kHzの帯域を2kHzずつに分割する。
ステップ105で、分割したスペクトルの各々について、逆フーリエ変換を行う。
ステップ106で、帯域毎のケプストラムが求まる。
ステップ107で、ケプストラムの絶対値を採る。
ステップ108で、各帯域の信号についてエントロピー値を求める。
ステップ109で、エントロピー値の重みを用いて、ケプストラムの絶対値の重み付き平均を求める。
ステップ110で、ケプストラムの値からピーク位置の次数を求める。
ステップ111で、ピーク位置の次数から基本周波数を求める。
【0013】
図6に、この発明による雑音抑制装置の一実施例を示す。この実施例では音声波形切出手段201と、音速フーリエ変換手段202と、絶対値算出手段203と、対数算出手段204と、信号分割手段205と、信号変換手段206と、ケプストラムの絶対値を算出する絶対値算出手段207と、エントロピー算出手段208と、エントロピーの値に応じて各信号の雑音重畳量を評価して雑音の影響が小さい信号に対しては大きい値の重みを付与してケプストラムの重み付け平均を求め、雑音の影響が小さい信号のケプストラムを抽出する抽出手段209と、この抽出手段209が抽出した各信号のケプストラムからピーク位置を決定するピーク位置決定手段210と、このピーク位置決定手段210で決定したピーク位置を基本周波数に変換する変換手段211とによって構成した場合を示す。
【0014】
信号分割手段205としては音声信号のような元信号の周波数帯域を複数の帯域に分割する周波数分割手段か或は時間方向に信号を分割する時分割手段のいずれかが用いられる。
信号分割手段205で分割された複数の元信号は信号変換手段206で各信号毎にケプストラムのような信号に変換する。ケプストラムは高速フーリエ変換手段202でフーリエ変換され、そのフーリエ変換されて求められたスペクトラムを絶対値算出手段203で絶対値が採られ、更に対数算出手段204で対数に変換された値を逆フーリエ変換して求めることができる。
【0015】
従って、信号変換手段206は複数の逆フーリエ変換手段206−1,206−2,206−3,…,206−Nによって構成することができる。
抽出手段209の一例としてはエントロピー算出手段208で算出した各信号のエントロピーの値に応じてエントロピーの値が予め設定した値より大きいエントロピー値を示す信号のケプストラムを除去し、エントロピー値が設定した値より小さい値を示す信号のケプストラムを寄せ集めて平均を求め、この平均値から、ピーク位置決定手段210でピーク位置を求め、そのピーク位置から変換手段211で基本周波数に変換することができる。
【0016】
抽出手段209の他の例としてはエントロピー算出手段208で算出した各信号のエントロピー値の逆数を求め、この逆数の値で各信号に付与する重みを決定する。この重みを各信号のケプストラムに乗算してその加重平均を求めることにより、雑音を多く含む信号のケプストラムには小さい重みが付与されるから、雑音を多く含む信号のケプストラムの影響は低減され、雑音の影響が小さいケプストラムに対しては大きい値の重みが付与されて強調されるため、その加重平均して求めたケプストラムの値は雑音の影響を排除した値として抽出される。
従って、雑音の影響を排除した値のケプストラムからピーク位置決定手段210でピーク位置を決定し、そのピーク位置を変換手段211は基本周波数に変換する。
【0017】
上述したこの発明による雑音重畳量評価方法及び雑音抑制方法はコンピュータが読み取り可能な符号によって記述されたプログラムをコンピュータに実行させることにより実現される。これらのプログラムは例えば磁気ディスク或はCD−ROMのようなコンピュータが読み取り可能な記憶媒体に記憶され、記憶媒体からコンピュータにインストールするか或は通信回線を通じてインストールされて実行する。
【0018】
【発明の効果】
以上説明したように、この発明によれば音声スペクトルをいくつかの帯域に分けるか、或はわずかな時間の間を時分割して複数に分割し、複数の信号のケプストラムを求め、それぞれのエントロピー値を求めることにより、各信号に重畳している雑音量を評価することができる。
各信号に重畳している雑音量を評価することができることから、雑音量の大きい信号のケプストラムを除去してピーク位置を決定し、基本周波数を決定することにより、雑音の影響が少ない基本周波数の推定が可能になる。特に雑音による影響が時々刻々と変化してもその時点毎に雑音の影響を受けていない部分の信号のケプストラムが強調されるので雑音の影響が少ない基本周波数の推定が可能である。
【図面の簡単な説明】
【図1】この発明で対象とする信号波形の一例を説明するための波形図。
【図2】図1に示した信号波形から求めたケプストラムの一例を示すグラフ。
【図3】雑音が重畳している場合の信号波形の一例を説明するための波形図。
【図4】図3に示した信号波形から求めたケプストラムの一例を示すグラフ。
【図5】この発明の雑音抑制プログラムの手順を説明するためのフローチャート。
【図6】この発明の雑音抑制装置の一実施例を説明するためのブロック図。
【符号の説明】
201 音声波形切出手段 207 絶対値算出手段
202 高速フーリエ変換手段 208 エントロピー算出手段
203 絶対値算出手段 209 抽出手段
204 対数算出手段 210 ピーク位置決定手段
205 信号分割手段 211 変換手段
206 信号変換手段
【発明の属する技術分野】
本発明は、雑音に強い音声認識、音声合成などの音声情報処理のために、音声から基本周波数などの特徴を抽出する際に、雑音の影響を低減する技術に関する。
【0002】
【従来の技術】
従来から、音声認識においては、音の特徴を表わすのに、スペクトルが用いられてきた。[例えば、古井貞煕、ディジタル音声処理、東海大出版会、1985]音声は、声帯の振動により生成されるため、音声信号では、類似した波形が繰り返される。繰り返しの影響は、音声スペクトルの上での繰り返しの形としても現れる。波形の繰り返し、スペクトルの上での繰り返しの周期から声帯振動周波数(基本周波数)を求めることができる。
【0003】
【発明が解決しようとする課題】
音声に雑音が加わった場合に、基本周波数を求める精度が劣化する。しかし、雑音が特定の時間や特定の周波数帯域のみに加わっている場合には、その時間や帯域を除外すれば雑音の影響を少なくできると考えられる。従来は、雑音の影響が特定の帯域のみに影響をもつ場合には雑音が重畳される帯域を取り除くフィルタによる方法などがあったが、雑音の影響が時間的に変化する場合には取り除く手段がなかった。
【0004】
【課題を解決するための手段】
この発明では、1つ又は少数のピークを持つ例えばケプストラムのような信号からこの信号のエントロピー値を求め、このエントロピー値により信号に重畳する雑音の量を評価する雑音重畳量評価方法を提案する。
この発明では更に、1つ又は少数のピークを持つ信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、雑音が多量に重畳されているか否かを各信号のエントロピー値により評価し、この評価結果により雑音の重畳量が少ない信号を選択して雑音の影響を排除した元信号を得る雑音抑制方法を提案する。
この発明では更に、一つ又は少数のピークを持つ信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、雑音が多量に重畳されているか否かを各信号のエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを用いて各信号のエントロピーの重み付き平均を行うことにより雑音の影響を排除した信号を求める雑音抑制方法を提案する。
【0005】
この発明では更に、元信号を複数の元信号に分割する信号分割手段と、この信号分割手段で分割された複数の元信号を少なくとも1つ又は少数のピークを持つ信号に変換する複数の信号変換手段と、この複数の信号変換手段が変換した信号から各信号のエントロピーを算出するエントロピー算出手段と、エントロピー算出手段が算出したエントロピー値に応じて信号分割手段が分割して得られる複数の信号の中から雑音の影響が少ない信号を抽出する抽出手段と、によって構成した雑音抑制装置を提案する。
この発明では更に、元信号を複数の元信号に分割する信号分割手段と、この信号分割手段で分割された複数の元信号を少なくとも1つ又は少数のピークを持つ信号に変換する複数の信号変換手段と、この複数の信号変換手段が変換した信号から各信号のエントロピーを算出するエントロピー算出手段と、エントロピー算出手段が算出したエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを算出する重み算出手段と、この重み算出手段で算出した重みを用いて複数の信号毎に求めた信号の重み付き平均を求める重み付き平均算出手段と、この重み付き平均算出手段が算出した信号により雑音の影響が少ない信号を抽出する抽出手段と、によって構成した雑音抑制装置を提案する。
【0006】
この発明では更に、前記雑音抑制装置の何れかにおいて、元信号は音声信号であり、信号分割手段は元信号の周波数帯域を複数に分割する周波数帯域分割手段又は元信号を複数の時分割信号に分割する時分割手段であり、信号変換手段は元信号のケプストラムを算出するケプストラム算出手段である雑音抑制装置を提案する。
この発明では更に、コンピュータが読み取り可能な符号によって記述され、コンピュータに前記雑音重畳量評価方法を実行させる雑音重畳量評価プログラムを提案する。
この発明では更に、コンピュータが読み取り可能な符号によって記述され、コンピュータに前記雑音抑制方法の何れか一方を実行させる雑音抑制プログラムを提案する。
この発明では更に、前記雑音重畳量評価プログラム又は前記雑音抑制プログラムの何れか一方又は双方をコンピュータが読み取り可能な記録媒体に記録した記録媒体を提案する。
【0007】
作用
周波数を横軸とする音声スペクトルにおいて、雑音の影響が現れる周波数帯域が時間的に変化する場合においても、雑音の影響が現れない周波数帯域においては、基本周波数を周期とする繰り返しの構造が見られる。従って、雑音の影響を受けて、調波構造が見られなくなっているかどうかを評価する方法があれば、雑音の影響を受けていない部分を選択的に用いて、音声波形の繰り返しの周期、すなわち、基本周波数を精度良く求めることができると考えられる。
ここでは、音声を例にとって説明しているが、一般的には、本来、ここで取り扱う信号は、元の信号から導かれる信号であって、雑音が重畳されていなければ、1つ、または、極めて少数の信号のピークがあるものを対象とする。信号としてはここではケプストラムを例示して示す。ケプストラムの他にヒストグラムがある。ケプストラムのような信号に雑音が重畳されると、複数のピークが現れたり、信号の分布の分散などの広がりが大きくなる。同一の信号を帯域分割するか或は時分割して複数個の信号を用意すると、そのうち雑音の影響を受けているものと受けていないものがあるとする。
【0008】
この発明では、信号に雑音が多量に重畳しているか否かを評価するために、関数のエントロピー値を用いる事にする。ある関数s(ω)のエントロピー値Hは以下のように与えられる。
【数1】
とする。
この値は、関数s(ω)が平坦であれば大きな値を示し、一部にピークがあると小さな値になる。例えば、平坦な分布(1/8,1/8,1/8,1/8,1/8,1/8,1/8,1/8)のエントロピー値は2.08であるが、一箇所の値だけが大きい(1/16,1/16,1/16,9/16, 1/16,1/16,1/16,1/16,)のエントロピー値は1.54である。従って、エントロピーの値により雑音の重畳量を知ることができ、雑音重畳量を評価することができる。また、この評価結果を利用してエントロピー値が大きい信号を除去するか或は重み付けにより、その影響を小さくしてケプストラムの重み付け平均を採ることにより雑音の影響を排除した信号を得ることができる。なお、s(ω)はヒストグラムでも良い。
【0009】
【発明の実施の形態】
音声の基本周波数を求める例にもどって具体的な計算の例を示す。先ず、図1のような音声波形からFFT(高速フーリエ変換)によりスペクトルを求める。スペクトルの絶対値を採り、さらにその対数を採る。この対数スペクトルを逆フーリエ変換したものはケプストラムと呼ばれる。もし、雑音が重畳していない音声であれば、ケプストラムのある次数においてピークが現れる。ケプストラムの絶対値を採ったものを図2に示す。サンプリング周波数をsf(Hz)とすると、i次のケプストラムはsf/i (Hz)の基本周波数を示す。例えば、サンプリング周波数が12kHzの場合には、120次のケプストラムにピークがあれば、基本周波数100Hzを示す。スペクトルの上には、基本周波数を周期とする繰り返し構造が現れているので、その部分からでも上記の値を求めることができる。
図3のように、雑音が音声に重畳している場合には、ケプストラムの絶対値を採ったものは図4のようになる。雑音が無い場合にみられた、ピークがはっきりしなくなっている。
【0010】
雑音が一部の周波数帯域に影響を及ぼしている場合には、スペクトルを求めた後、例えば、4kHzの帯域を4分割する。それぞれの帯域におけるスペクトルの絶対値の対数を逆フーリエ変換して各帯域毎にケプストラムを出す。各帯域のケプストラムの絶対値を採ると正値になり、ケプストラムの次数のある範囲での積分値を1にすることができ、その次数区間でのエントロピー値を計算できる。なお、ケプストラムで声道の特徴を反映した20次以下の部分は除外する。
各帯域でのケプストラムから、エントロピー値を出せば、雑音の影響を受けている帯域ではエントロピーが高く、雑音の影響を受けていない帯域では、エントロピーが低くなる。従って、エントロピー値が或る設定した値より大きい帯域の信号を除外してケプストラムを求めることにより雑音の影響を排除したケプストラムを得ることができる。このケプストラムを用いることにより雑音の影響が少ない基本周波数の推定を実現することができる。
また、他の方法として、例えばエントロピー値の逆数を重みとして各帯域毎の求めたケプストラムに重み付けを施し、この重み付けされたケプストラムの重み付き平均を採れば、雑音の影響が少ない帯域のケプストラムが強調されたケプストラムを求めることができ、雑音の影響を受けにくい、基本周波数の推定が実現できる。
【0011】
一方、雑音が時間方向に選択的に重畳する場合には、信号を時間方向に時分割して複数の信号に分割し、この複数の信号のエントロピーを算出し、このエントロピーの値に従って、雑音の重畳量の大きい信号を特定し、その信号を除去してケプストラムを算出することにより、雑音の影響が除去されたケプストラムを求めることができる。これにより雑音の影響を受けにくい基本周波数の推定が実現できる。
図5にこの発明の雑音抑制方法を実現するための雑音抑制プログラムの手順を説明するためのフローチャートの例を示す。この例では最終的に雑音に影響されない信号の基本周波数を求める場合を例示している。
【0012】
ステップ101で、音声波形を切り出す。
ステップ102で、フーリエ変換によりスペクトルに変換する。
ステップ103で、スペクトルの絶対値の対数を採る。
ステップ104で、全周波数帯域を分割する。例えば、8kHzの帯域を2kHzずつに分割する。
ステップ105で、分割したスペクトルの各々について、逆フーリエ変換を行う。
ステップ106で、帯域毎のケプストラムが求まる。
ステップ107で、ケプストラムの絶対値を採る。
ステップ108で、各帯域の信号についてエントロピー値を求める。
ステップ109で、エントロピー値の重みを用いて、ケプストラムの絶対値の重み付き平均を求める。
ステップ110で、ケプストラムの値からピーク位置の次数を求める。
ステップ111で、ピーク位置の次数から基本周波数を求める。
【0013】
図6に、この発明による雑音抑制装置の一実施例を示す。この実施例では音声波形切出手段201と、音速フーリエ変換手段202と、絶対値算出手段203と、対数算出手段204と、信号分割手段205と、信号変換手段206と、ケプストラムの絶対値を算出する絶対値算出手段207と、エントロピー算出手段208と、エントロピーの値に応じて各信号の雑音重畳量を評価して雑音の影響が小さい信号に対しては大きい値の重みを付与してケプストラムの重み付け平均を求め、雑音の影響が小さい信号のケプストラムを抽出する抽出手段209と、この抽出手段209が抽出した各信号のケプストラムからピーク位置を決定するピーク位置決定手段210と、このピーク位置決定手段210で決定したピーク位置を基本周波数に変換する変換手段211とによって構成した場合を示す。
【0014】
信号分割手段205としては音声信号のような元信号の周波数帯域を複数の帯域に分割する周波数分割手段か或は時間方向に信号を分割する時分割手段のいずれかが用いられる。
信号分割手段205で分割された複数の元信号は信号変換手段206で各信号毎にケプストラムのような信号に変換する。ケプストラムは高速フーリエ変換手段202でフーリエ変換され、そのフーリエ変換されて求められたスペクトラムを絶対値算出手段203で絶対値が採られ、更に対数算出手段204で対数に変換された値を逆フーリエ変換して求めることができる。
【0015】
従って、信号変換手段206は複数の逆フーリエ変換手段206−1,206−2,206−3,…,206−Nによって構成することができる。
抽出手段209の一例としてはエントロピー算出手段208で算出した各信号のエントロピーの値に応じてエントロピーの値が予め設定した値より大きいエントロピー値を示す信号のケプストラムを除去し、エントロピー値が設定した値より小さい値を示す信号のケプストラムを寄せ集めて平均を求め、この平均値から、ピーク位置決定手段210でピーク位置を求め、そのピーク位置から変換手段211で基本周波数に変換することができる。
【0016】
抽出手段209の他の例としてはエントロピー算出手段208で算出した各信号のエントロピー値の逆数を求め、この逆数の値で各信号に付与する重みを決定する。この重みを各信号のケプストラムに乗算してその加重平均を求めることにより、雑音を多く含む信号のケプストラムには小さい重みが付与されるから、雑音を多く含む信号のケプストラムの影響は低減され、雑音の影響が小さいケプストラムに対しては大きい値の重みが付与されて強調されるため、その加重平均して求めたケプストラムの値は雑音の影響を排除した値として抽出される。
従って、雑音の影響を排除した値のケプストラムからピーク位置決定手段210でピーク位置を決定し、そのピーク位置を変換手段211は基本周波数に変換する。
【0017】
上述したこの発明による雑音重畳量評価方法及び雑音抑制方法はコンピュータが読み取り可能な符号によって記述されたプログラムをコンピュータに実行させることにより実現される。これらのプログラムは例えば磁気ディスク或はCD−ROMのようなコンピュータが読み取り可能な記憶媒体に記憶され、記憶媒体からコンピュータにインストールするか或は通信回線を通じてインストールされて実行する。
【0018】
【発明の効果】
以上説明したように、この発明によれば音声スペクトルをいくつかの帯域に分けるか、或はわずかな時間の間を時分割して複数に分割し、複数の信号のケプストラムを求め、それぞれのエントロピー値を求めることにより、各信号に重畳している雑音量を評価することができる。
各信号に重畳している雑音量を評価することができることから、雑音量の大きい信号のケプストラムを除去してピーク位置を決定し、基本周波数を決定することにより、雑音の影響が少ない基本周波数の推定が可能になる。特に雑音による影響が時々刻々と変化してもその時点毎に雑音の影響を受けていない部分の信号のケプストラムが強調されるので雑音の影響が少ない基本周波数の推定が可能である。
【図面の簡単な説明】
【図1】この発明で対象とする信号波形の一例を説明するための波形図。
【図2】図1に示した信号波形から求めたケプストラムの一例を示すグラフ。
【図3】雑音が重畳している場合の信号波形の一例を説明するための波形図。
【図4】図3に示した信号波形から求めたケプストラムの一例を示すグラフ。
【図5】この発明の雑音抑制プログラムの手順を説明するためのフローチャート。
【図6】この発明の雑音抑制装置の一実施例を説明するためのブロック図。
【符号の説明】
201 音声波形切出手段 207 絶対値算出手段
202 高速フーリエ変換手段 208 エントロピー算出手段
203 絶対値算出手段 209 抽出手段
204 対数算出手段 210 ピーク位置決定手段
205 信号分割手段 211 変換手段
206 信号変換手段
Claims (9)
- 1つ又は少数のピークを持つ信号からこの信号のエントロピー値を求め、このエントロピー値により上記信号に重畳する雑音の量を評価することを特徴とする雑音重畳量評価方法。
- 1つ又は少数のピークを持つ信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、
雑音が多量に重畳されているか否かを各信号のエントロピー値により評価し、この評価結果により雑音の重畳量が少ない信号を選択して雑音の影響を排除した元信号を得ることを特徴とする雑音抑制方法。 - 1つ又は少数のピークを持つ信号について、その複数個から、各信号に重畳した雑音の影響を排除した信号を求める雑音抑制方法であって、
雑音が多量に重畳されているか否かを各信号のエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを用いて各信号のエントロピーの重み付き平均を行うことにより雑音の影響を排除した信号を求めることを特徴とする雑音抑制方法。 - 元信号を複数の元信号に分割する信号分割手段と、
この信号分割手段で分割された複数の元信号を少なくとも1つ又は少数のピークを持つ信号に変換する複数の信号変換手段と、
この複数の信号変換手段が変換した信号から各信号のエントロピーを算出するエントロピー算出手段と、
エントロピー算出手段が算出したエントロピー値に応じて上記信号分割手段が分割することによって得られる複数の信号の中から雑音の影響が少ない信号を抽出する抽出手段と、
によって構成したことを特徴とする雑音抑制装置。 - 元信号を複数の元信号に分割する信号分割手段と、
この信号分割手段で分割された複数の元信号を少なくとも1つ又は少数のピークを持つ信号に変換する複数の信号変換手段と、
この複数の信号変換手段が変換した信号から各信号のエントロピーを算出するエントロピー算出手段と、
エントロピー算出手段が算出したエントロピー値から導かれるピークの数が少ないと大きな値を採る重みを算出する重み算出手段と、
この重み算出手段で算出した重みを用いて上記複数の信号毎に求めた信号の重み付き平均を求める重み付き平均算出手段と、
この重み付き平均算出手段が算出した信号により雑音の影響が少ない信号を抽出する抽出手段と、
によって構成したことを特徴とする雑音抑制装置。 - 請求項4又は5記載の雑音抑制装置の何れかにおいて、上記元信号は音声信号であり、上記信号分割手段は元信号の周波数帯域を複数に分割する周波数帯域分割手段又は元信号を複数の時分割信号に分割する時分割手段であり、上記信号変換手段は元信号のケプストラムを算出するケプストラム算出手段であることを特徴とする雑音抑制装置。
- コンピュータが読み取り可能な符号によって記述され、コンピュータに請求項1記載の雑音重畳量評価方法を実行させる雑音重畳量評価プログラム。
- コンピュータが読み取り可能な符号によって記述され、コンピュータに請求項2又は3に記載の雑音抑制方法の何れか一方を実行させる雑音抑制プログラム。
- 請求項7記載の雑音重畳量評価プログラム又は請求項8記載の雑音抑制プログラムの何れか一方又は双方をコンピュータが読み取り可能な記録媒体に記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002206642A JP2004053626A (ja) | 2002-07-16 | 2002-07-16 | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002206642A JP2004053626A (ja) | 2002-07-16 | 2002-07-16 | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004053626A true JP2004053626A (ja) | 2004-02-19 |
Family
ID=31931315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002206642A Pending JP2004053626A (ja) | 2002-07-16 | 2002-07-16 | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004053626A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006113298A (ja) * | 2004-10-14 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 |
JP2007183528A (ja) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
JP2016095434A (ja) * | 2014-11-17 | 2016-05-26 | 日本電信電話株式会社 | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム |
-
2002
- 2002-07-16 JP JP2002206642A patent/JP2004053626A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006113298A (ja) * | 2004-10-14 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 |
JP4537821B2 (ja) * | 2004-10-14 | 2010-09-08 | 日本電信電話株式会社 | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 |
JP2007183528A (ja) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
JP2016095434A (ja) * | 2014-11-17 | 2016-05-26 | 日本電信電話株式会社 | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101266894B1 (ko) | 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법 | |
JP5127754B2 (ja) | 信号処理装置 | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
CN103021420B (zh) | 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法 | |
EP1895507B1 (en) | Pitch estimation, apparatus, pitch estimation method, and program | |
JP2010055000A (ja) | 信号帯域拡張装置 | |
RU2733278C1 (ru) | Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке спектрального улучшения аудиосигнала | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5614261B2 (ja) | 雑音抑制装置、雑音抑制方法、及びプログラム | |
JP2012181561A (ja) | 信号処理装置 | |
US10297272B2 (en) | Signal processor | |
CN111755025B (zh) | 一种基于音频特征的状态检测方法、装置及设备 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP2004053626A (ja) | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 | |
JP5772723B2 (ja) | 音響処理装置および分離マスク生成装置 | |
JP6439174B2 (ja) | 音声強調装置、および音声強調方法 | |
CN113593604A (zh) | 检测音频质量方法、装置及存储介质 | |
Christian et al. | Rindik rod sound separation with spectral subtraction method | |
Rao et al. | A comparative study of various pitch detection algorithms | |
CN109346106B (zh) | 一种基于子带信噪比加权的倒谱域基音周期估计方法 | |
EP1339045A1 (en) | Method for pre-processing speech | |
JPH0844390A (ja) | 音声認識装置 | |
JP2002258893A (ja) | 雑音推定装置、雑音除去装置及び記憶媒体 |