JP3419705B2 - ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体 - Google Patents
ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体Info
- Publication number
- JP3419705B2 JP3419705B2 JP7311799A JP7311799A JP3419705B2 JP 3419705 B2 JP3419705 B2 JP 3419705B2 JP 7311799 A JP7311799 A JP 7311799A JP 7311799 A JP7311799 A JP 7311799A JP 3419705 B2 JP3419705 B2 JP 3419705B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- noise
- component
- formant
- stochastic resonance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
【0001】
【発明の属する技術分野】この発明は、ノイズに埋もれ
た音声のフォルマント成分を強調する方法、装置及びプ
ログラム記録媒体に関するものであり、信号検出などの
産業分野に利用できる。
た音声のフォルマント成分を強調する方法、装置及びプ
ログラム記録媒体に関するものであり、信号検出などの
産業分野に利用できる。
【0002】
【従来の技術】従来の音声信号のノイズ除去には、音声
信号を周波数分布に変換し、その周波数分布に対するフ
ィルタ処理が用いられていた。この方法では、除去する
周波数帯域が固定のため、入力する音声信号の種類が限
られる。
信号を周波数分布に変換し、その周波数分布に対するフ
ィルタ処理が用いられていた。この方法では、除去する
周波数帯域が固定のため、入力する音声信号の種類が限
られる。
【0003】
【発明が解決しようとする課題】上述した従来の音声信
号のノイズ除去では、一つの周波数フィルタで処理でき
る音声の種類が限られるという問題点があった。この発
明の目的は、上記従来の技術に述べた問題点の解決を狙
ったものであり、フォルマントの周波数帯域が任意の周
波数域にあっても、ノイズに埋もれた音声のフォルマン
ト成分の強調できる方法、装置及びプログラム記録媒体
を提供することにある。
号のノイズ除去では、一つの周波数フィルタで処理でき
る音声の種類が限られるという問題点があった。この発
明の目的は、上記従来の技術に述べた問題点の解決を狙
ったものであり、フォルマントの周波数帯域が任意の周
波数域にあっても、ノイズに埋もれた音声のフォルマン
ト成分の強調できる方法、装置及びプログラム記録媒体
を提供することにある。
【0004】
【課題を解決するための手段】上記目的を達成するた
め、この発明の音声のフォルマント成分の強調方法は、
ノイズに埋もれた音声の周波数分布を求め、その周波数
分布を複数の周波数帯域に分割し、その各々の周波数帯
域の信号をそれぞれ時系列に再構成し、その各々の時系
列を確率共振する系に入力し、確率共振させ、その周波
数帯域の中のフォルマントの周波数成分をノイズ成分か
ら強調させ、これら各々の確率共振する系の出力を加算
し、ノイズ成分が抑制された時系列を得て、ノイズに埋
もれた音声のフォルマント成分を強調する。
め、この発明の音声のフォルマント成分の強調方法は、
ノイズに埋もれた音声の周波数分布を求め、その周波数
分布を複数の周波数帯域に分割し、その各々の周波数帯
域の信号をそれぞれ時系列に再構成し、その各々の時系
列を確率共振する系に入力し、確率共振させ、その周波
数帯域の中のフォルマントの周波数成分をノイズ成分か
ら強調させ、これら各々の確率共振する系の出力を加算
し、ノイズ成分が抑制された時系列を得て、ノイズに埋
もれた音声のフォルマント成分を強調する。
【0005】この構成の音声のフォルマント成分の強調
方法では、ノイズに埋もれた音声をいくつかの周波数分
布に分け、その各々の信号に対して、確率共振を利用し
ているので、フォルマントの周波数帯が任意の周波数域
にあってもノイズ強度を押さえ、フォルマント成分を強
調することができる。この発明の音声のフォルマント成
分の強調装置は、ノイズに埋もれた音声の周波数分布を
求める周波数領域変換回路と、その周波数分布を複数の
周波数帯域に分割する周波数分割回路と、各々の周波数
帯域の信号を時系列に再構成する時間領域変換回路と、
各時系列がそれぞれ入力され、確率共振させ、その周波
数帯域の中のフォルマントの周波数成分をノイズ成分か
ら強調させる確率共振回路と、各々の確率共振回路の出
力を加算し、ノイズ成分が抑制された時系列を得る加算
回路とを備えている。
方法では、ノイズに埋もれた音声をいくつかの周波数分
布に分け、その各々の信号に対して、確率共振を利用し
ているので、フォルマントの周波数帯が任意の周波数域
にあってもノイズ強度を押さえ、フォルマント成分を強
調することができる。この発明の音声のフォルマント成
分の強調装置は、ノイズに埋もれた音声の周波数分布を
求める周波数領域変換回路と、その周波数分布を複数の
周波数帯域に分割する周波数分割回路と、各々の周波数
帯域の信号を時系列に再構成する時間領域変換回路と、
各時系列がそれぞれ入力され、確率共振させ、その周波
数帯域の中のフォルマントの周波数成分をノイズ成分か
ら強調させる確率共振回路と、各々の確率共振回路の出
力を加算し、ノイズ成分が抑制された時系列を得る加算
回路とを備えている。
【0006】この構成の音声のフォルマント成分の強調
装置では、周波数変換回路により、ノイズに埋もれた音
声の周波数分布を求め、周波数分割回路により、その周
波数分布を複数の周波数帯域に分割し、時間領域変換回
路により、各々の周波数帯域の信号を時系列に再構成
し、その時系列を各々確率共振回路に入力し、確率共振
回路により、確率共振させ、その周波数帯域の中のフォ
ルマントの周波数成分をノイズ成分から強調させ、加算
回路により、各々の確率共振回路の出力を加算し、ノイ
ズ成分が抑制された時系列を得ることができる。
装置では、周波数変換回路により、ノイズに埋もれた音
声の周波数分布を求め、周波数分割回路により、その周
波数分布を複数の周波数帯域に分割し、時間領域変換回
路により、各々の周波数帯域の信号を時系列に再構成
し、その時系列を各々確率共振回路に入力し、確率共振
回路により、確率共振させ、その周波数帯域の中のフォ
ルマントの周波数成分をノイズ成分から強調させ、加算
回路により、各々の確率共振回路の出力を加算し、ノイ
ズ成分が抑制された時系列を得ることができる。
【0007】また、この発明の音声のフォルマント成分
を強調するためのプログラムを記録した記録媒体は、ノ
イズに埋もれた音声を複数の周波数帯域に分割する処理
と、各々の周波数帯域の信号を時系列に再構成する処理
と、その各時系列を確率共振させ、その周波数帯域の中
のフォルマントの周波数成分をノイズ成分から強調させ
る処理と、各々の確率共振する系の出力を加算する処理
よりなるプログラムがコンピュータに読み出し可能に記
録されている。
を強調するためのプログラムを記録した記録媒体は、ノ
イズに埋もれた音声を複数の周波数帯域に分割する処理
と、各々の周波数帯域の信号を時系列に再構成する処理
と、その各時系列を確率共振させ、その周波数帯域の中
のフォルマントの周波数成分をノイズ成分から強調させ
る処理と、各々の確率共振する系の出力を加算する処理
よりなるプログラムがコンピュータに読み出し可能に記
録されている。
【0008】この発明の音声のフォルマント成分を強調
するための処理を実行するためのプログラムを記録した
記録媒体では、ノイズに埋もれた音声を複数の周波数帯
域に分割する処理と、各々の周波数帯域の信号を時系列
に再構成する処理と各々の時系列を確率共振させ、その
周波数帯域の中のフォルマントの周波数成分をノイズ成
分から強調させる処理と、各々の確率共振する系の出力
を加算する処理をコンピュータに実行させて成るノイズ
に埋もれた音声のフォルマント成分を強調することがで
きる。
するための処理を実行するためのプログラムを記録した
記録媒体では、ノイズに埋もれた音声を複数の周波数帯
域に分割する処理と、各々の周波数帯域の信号を時系列
に再構成する処理と各々の時系列を確率共振させ、その
周波数帯域の中のフォルマントの周波数成分をノイズ成
分から強調させる処理と、各々の確率共振する系の出力
を加算する処理をコンピュータに実行させて成るノイズ
に埋もれた音声のフォルマント成分を強調することがで
きる。
【0009】
【発明の実施の形態】次に、この発明の一実施例につい
て図面を参照して詳細に説明する。図1に音声のフォル
マント成分の強調方法の一実施例のフローチャート図を
示す。まず、ノイズに埋もれた音声を周波数帯域に変換
して周波数分布を求める(S1)。このときに用いる周
波数帯域への変換の方法は、通常のFFT(高速フーリ
エ変換)などであり、どの方法を用いてもよい。
て図面を参照して詳細に説明する。図1に音声のフォル
マント成分の強調方法の一実施例のフローチャート図を
示す。まず、ノイズに埋もれた音声を周波数帯域に変換
して周波数分布を求める(S1)。このときに用いる周
波数帯域への変換の方法は、通常のFFT(高速フーリ
エ変換)などであり、どの方法を用いてもよい。
【0010】この音声の周波数分布を複数の周波数帯域
に分割する(S2)。この周波数帯域の分割は、各帯域
に音声のフォルマント成分が1つ含まれる程度の帯域幅
で、その数は多くなくてよい。例えば200〜500H
z、500〜1000Hz、1000〜2000Hz、
2000〜4000Hzの4つの帯域に分割する。周波
数帯域に分割された各信号を時間領域に逆変換してそれ
ぞれ時系列にする(S3)。この時間領域への変換方法
も従来のどのような方法でもよい。
に分割する(S2)。この周波数帯域の分割は、各帯域
に音声のフォルマント成分が1つ含まれる程度の帯域幅
で、その数は多くなくてよい。例えば200〜500H
z、500〜1000Hz、1000〜2000Hz、
2000〜4000Hzの4つの帯域に分割する。周波
数帯域に分割された各信号を時間領域に逆変換してそれ
ぞれ時系列にする(S3)。この時間領域への変換方法
も従来のどのような方法でもよい。
【0011】次に、周波数帯域に分割された各々の時系
列に対して、確率共振を利用してノイズ成分に埋もれた
フォルマント成分を強調する(S4)。各々の時系列
は、確率共振を起こすことのできる非線形系に入力し、
その系を駆動する。その非線形系としては、例えば、図
2(a)に示すような双安定系でよい。その他、しきい
素子などでもよい。確率共振とは、ノイズに埋もれた周
期信号を上記のような非線形系により、周期信号だけを
増幅し、ノイズを押さえる共振現象の一種である。その
メカニズムは、例えば、図2(b),(c)のように説
明でき、式(1)で表わされる。
列に対して、確率共振を利用してノイズ成分に埋もれた
フォルマント成分を強調する(S4)。各々の時系列
は、確率共振を起こすことのできる非線形系に入力し、
その系を駆動する。その非線形系としては、例えば、図
2(a)に示すような双安定系でよい。その他、しきい
素子などでもよい。確率共振とは、ノイズに埋もれた周
期信号を上記のような非線形系により、周期信号だけを
増幅し、ノイズを押さえる共振現象の一種である。その
メカニズムは、例えば、図2(b),(c)のように説
明でき、式(1)で表わされる。
【0012】
dx/dt=−∂U/∂x+F(t)+Asinω0 t (1)
双安定のポテンシャル(エネルギー)U(x)をもつ電
気回路を弱い周期信号Asinω0 tだけで駆動する
と、もう一つのポテンシャルのくぼみに移ることはでき
ない。この状況は、測定器のしきい値で弱い周期信号を
検出できない状況と同じである。しかし、この弱い周期
信号Asinω0 tに雑音F(t)が足されていると確
率的にもう一つのポテンシャルのくぼみに移ることがあ
る。つまり、測定器のしきい値を越えるわけであるが、
この時間的なタイミングは弱い周期信号の振幅のピーク
に同期することが多い。このことにより、弱い周期信号
の周波数成分が増幅されることになる。通常、確率共振
は、図2(b)に示すように白色ノイズNに対して、単
一の周波数f0 の信号成分が強調される現象が示される
ことが多いが、周波数分布の偏ったノイズに関しても、
単一の周波数成分が強調される現象が確認されているた
め、複数の周波数帯域に分割された信号であっても、そ
の各分割された分布中に単一の周波数成分であるフォル
マント成分だけが存在すれば確率共振を利用できること
になる。しかし、分割する周波数帯域の幅が極端に狭い
場合には、確率共振は起こらない。なお、確率共振は図
2(c)にしめすように雑音強度が小さ過ぎても大き過
ぎてもSN比は悪くなり、ある程度のノイズ力にあると
フォルマント成分を検出し易い。
気回路を弱い周期信号Asinω0 tだけで駆動する
と、もう一つのポテンシャルのくぼみに移ることはでき
ない。この状況は、測定器のしきい値で弱い周期信号を
検出できない状況と同じである。しかし、この弱い周期
信号Asinω0 tに雑音F(t)が足されていると確
率的にもう一つのポテンシャルのくぼみに移ることがあ
る。つまり、測定器のしきい値を越えるわけであるが、
この時間的なタイミングは弱い周期信号の振幅のピーク
に同期することが多い。このことにより、弱い周期信号
の周波数成分が増幅されることになる。通常、確率共振
は、図2(b)に示すように白色ノイズNに対して、単
一の周波数f0 の信号成分が強調される現象が示される
ことが多いが、周波数分布の偏ったノイズに関しても、
単一の周波数成分が強調される現象が確認されているた
め、複数の周波数帯域に分割された信号であっても、そ
の各分割された分布中に単一の周波数成分であるフォル
マント成分だけが存在すれば確率共振を利用できること
になる。しかし、分割する周波数帯域の幅が極端に狭い
場合には、確率共振は起こらない。なお、確率共振は図
2(c)にしめすように雑音強度が小さ過ぎても大き過
ぎてもSN比は悪くなり、ある程度のノイズ力にあると
フォルマント成分を検出し易い。
【0013】複数の周波数帯域に分割された各々の時系
列は、確率共振により微弱な周波数成分であるフォルマ
ント成分を含むものだけが背景ノイズから図2(b)に
示すように強調される。フォルマント成分を含まない周
波数帯域の時系列は、そのような強調は起こらない。こ
れらの確率共振現象によって変化した各々の時系列を足
し合わせることにより、元のノイズに埋もれた音声のフ
ォルマント成分だけを強調した時系列を得ることができ
る(S5)。
列は、確率共振により微弱な周波数成分であるフォルマ
ント成分を含むものだけが背景ノイズから図2(b)に
示すように強調される。フォルマント成分を含まない周
波数帯域の時系列は、そのような強調は起こらない。こ
れらの確率共振現象によって変化した各々の時系列を足
し合わせることにより、元のノイズに埋もれた音声のフ
ォルマント成分だけを強調した時系列を得ることができ
る(S5)。
【0014】図3にこの発明によるノイズに埋もれた音
声のフォルマント成分の強調装置の実施例を示す。ノイ
ズに埋もれた音声は周波数領域変換回路11で例えばF
FTにより周波数領域の信号に変換される。この周波数
領域の信号は周波数分割回路12により、各帯域に2つ
以上のフォルマントが含まれないように複数の周波数帯
域の信号に分割される。これら各周波数帯域信号は時間
領域変換回路131 ,・・・,13n によりそれぞれ時
間領域の信号に戻され、これら各周波数帯域の時間領域
信号は、双安定系電気回路やしきい素子で実現される確
率共振回路14 1 ,・・・,14n に入力され、それぞ
れフォルマント成分が確率共振現象により強調される。
確率共振回路141 ,・・・,14n の出力は加算回路
15で加算合成され、元のノイズに埋もれた音声におい
てフォルマント成分だけが強調された音声が得られる。
声のフォルマント成分の強調装置の実施例を示す。ノイ
ズに埋もれた音声は周波数領域変換回路11で例えばF
FTにより周波数領域の信号に変換される。この周波数
領域の信号は周波数分割回路12により、各帯域に2つ
以上のフォルマントが含まれないように複数の周波数帯
域の信号に分割される。これら各周波数帯域信号は時間
領域変換回路131 ,・・・,13n によりそれぞれ時
間領域の信号に戻され、これら各周波数帯域の時間領域
信号は、双安定系電気回路やしきい素子で実現される確
率共振回路14 1 ,・・・,14n に入力され、それぞ
れフォルマント成分が確率共振現象により強調される。
確率共振回路141 ,・・・,14n の出力は加算回路
15で加算合成され、元のノイズに埋もれた音声におい
てフォルマント成分だけが強調された音声が得られる。
【0015】確率共振処理は、双安定系、しきい素子な
どの駆動系を数値計算アルゴリズム、例えばルンゲ・ク
ッタ法などを用いて計算により行うこともできる。
どの駆動系を数値計算アルゴリズム、例えばルンゲ・ク
ッタ法などを用いて計算により行うこともできる。
【図1】この発明のノイズに埋もれた音声のフォルマン
ト成分の強調方法の一実施例を示すフローチャート図。
ト成分の強調方法の一実施例を示すフローチャート図。
【図2】(a)は双安定系の特性を示す図、(b)及び
(c)は確率共振のメカニズムの説明図である。
(c)は確率共振のメカニズムの説明図である。
【図3】この発明のノイズに埋もれた音声のフォルマン
ト成分の強調装置の一実施例を示す機能構成図。
ト成分の強調装置の一実施例を示す機能構成図。
フロントページの続き
(72)発明者 下原 勝憲
東京都新宿区西新宿三丁目19番2号 日
本電信電話株式会社内
(56)参考文献 特開2000−3443(JP,A)
特開2000−3350(JP,A)
(58)調査した分野(Int.Cl.7,DB名)
G10L 13/00
Claims (3)
- 【請求項1】 ノイズに埋もれた音声のフォルマント成
分の強調方法であって、 ノイズに埋もれた音声の周波数分布を求め、 その周波数分布を複数の周波数帯域毎に分割し、 その各々の周波数帯域の信号をそれぞれ時系列に再構成
し、 これら時系列をそれぞれ確率共振する系に入力して確率
共振させ、その周波数帯域の中のフォルマントの周波数
成分をノイズ成分から強調させ、 各々の確率共振する系の出力を加算し、ノイズ成分が抑
制された時系列を得て、 ノイズに埋もれた音声のフォルマント成分を強調する方
法。 - 【請求項2】 周波数領域変換回路と、周波数分割回路
と、複数の時間領域変換回路と、複数の確率共振回路を
備え、 周波数変換回路は、ノイズに埋もれた音声を周波数領域
の信号に変換し、周波数分割回路は、その周波数領域信
号を複数の周波数帯域に分割し、 複数の時間領域変換回路は各々の周波数帯域の信号をそ
れぞれ時系列に再構成し、 各々確率共振回路はその各々の時系列を確率共振させ、
その周波数帯域の中のフォルマントの周波数成分をノイ
ズ成分から強調させ、 加算回路は、各々の確率共振回路の出力を加算し、ノイ
ズ成分が抑制された時系列を得ることを特徴とするノイ
ズに埋もれた音声のフォルマント成分の強調装置。 - 【請求項3】 ノイズに埋もれた音声のフォルマント成
分の強調するためのプログラムを記録した記録媒体であ
って、 ノイズに埋もれた音声を複数の周波数帯域に分割する処
理と、 その各々の周波数帯域の信号をそれぞれ時系列に再構成
する処理と、 これら時系列を各々確率共振素子に確率共振させ、その
周波数帯域の中のフォルマントの周波数成分をノイズ成
分から強調させる処理と、 それら各々の確率共振する系の出力を加算する処理とを
コンピュータに実行させるプログラムを記録した記録媒
体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7311799A JP3419705B2 (ja) | 1999-03-18 | 1999-03-18 | ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7311799A JP3419705B2 (ja) | 1999-03-18 | 1999-03-18 | ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000267684A JP2000267684A (ja) | 2000-09-29 |
JP3419705B2 true JP3419705B2 (ja) | 2003-06-23 |
Family
ID=13509000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7311799A Expired - Fee Related JP3419705B2 (ja) | 1999-03-18 | 1999-03-18 | ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3419705B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5394420B2 (ja) * | 2011-02-21 | 2014-01-22 | 日本電信電話株式会社 | 受信方法、及び受信装置 |
-
1999
- 1999-03-18 JP JP7311799A patent/JP3419705B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000267684A (ja) | 2000-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Irino et al. | An analysis/synthesis auditory filterbank based on an IIR implementation of the gammachirp | |
US20060072766A1 (en) | Reverberation removal | |
Tohyama | Waveform Analysis of Sound | |
JP2011530955A (ja) | 音場拡大及び位相無相関化システム及び方法 | |
US8295508B2 (en) | Processing an audio signal | |
US20060177074A1 (en) | Early reflection reproduction apparatus and method of sound field effect reproduction | |
CN106941006B (zh) | 用于音频信号的分离和低音增强的方法、装置和系统 | |
KR20050049549A (ko) | 신호 필터링 | |
US20060256979A1 (en) | Array speaker system | |
US6674863B2 (en) | Microphone-speaker apparatus | |
CN110267163B (zh) | 一种定向声音虚拟低频增强方法、系统、介质和设备 | |
EP2689418B1 (en) | Method and arrangement for damping of dominant frequencies in an audio signal | |
JP3419705B2 (ja) | ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体 | |
JPH09243679A (ja) | 任意区間波形を用いた非調和的周波数分析法 | |
Carini et al. | Robust room impulse response measurement using perfect sequences for Legendre nonlinear filters | |
CN101422054B (zh) | 声像定位装置 | |
US20140334639A1 (en) | Directivity control method and device | |
US20210319800A1 (en) | Frequency band expansion device, frequency band expansion method, and storage medium storing frequency band expansion program | |
JP2830276B2 (ja) | 信号処理装置 | |
US20050223050A1 (en) | Efficient method and apparatus for convolution of input signals | |
KR102721794B1 (ko) | 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법 | |
Thakur et al. | Computationally efficient sampling rate converter for audio signal application | |
Bauman et al. | Cepstral analysis of electroacoustic transducers | |
Petrović et al. | Analyses of decimation filter stopband attenuation influence on subjective quality of audio signals | |
JP3089690B2 (ja) | ディジタルデータの高能率符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090418 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090418 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100418 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |