JP2003058186A - 雑音抑圧方法および雑音抑圧装置 - Google Patents

雑音抑圧方法および雑音抑圧装置

Info

Publication number
JP2003058186A
JP2003058186A JP2001245605A JP2001245605A JP2003058186A JP 2003058186 A JP2003058186 A JP 2003058186A JP 2001245605 A JP2001245605 A JP 2001245605A JP 2001245605 A JP2001245605 A JP 2001245605A JP 2003058186 A JP2003058186 A JP 2003058186A
Authority
JP
Japan
Prior art keywords
noise
spectrum
stationary
siren sound
suppressing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001245605A
Other languages
English (en)
Inventor
Seiji Sasaki
誠司 佐々木
Teruo Fumoto
照夫 麓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YRP KOKINO IDOTAI TSUSHIN KENK
YRP Advanced Mobile Communication Systems Research Laboratories Co Ltd
Original Assignee
YRP KOKINO IDOTAI TSUSHIN KENK
YRP Advanced Mobile Communication Systems Research Laboratories Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YRP KOKINO IDOTAI TSUSHIN KENK, YRP Advanced Mobile Communication Systems Research Laboratories Co Ltd filed Critical YRP KOKINO IDOTAI TSUSHIN KENK
Priority to JP2001245605A priority Critical patent/JP2003058186A/ja
Publication of JP2003058186A publication Critical patent/JP2003058186A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Noise Elimination (AREA)

Abstract

(57)【要約】 【課題】 自動車走行音等の定常的な雑音のみでなく、
消防車、パトカー等の周期性を持つ非定常的な雑音を小
規模なメモリ量、演算量で実現する。 【解決手段】 FFT部11において周波数領域に変換され
た信号からサイレン音抑圧情報設定部12において、抑
圧対象の雑音の有無を検出し、その基本周波数を抽出し
てサイレン音抑圧部13に供給する。サイレン音抑圧部
13では、これらの情報に基づいてサイレン音雑音を抑
圧する。この場合、サイレン音抑圧情報設定部12では
予め定められたフレーム間隔毎に基本周波数を抽出する
ことにより、長期平均スペクトル振幅更新部におけるメ
モリ容量を小さくすることができる。さらに、サイレン
音抑圧部13の出力を定常雑音抑圧部100に供給し
て、定常的な雑音を抑圧する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号に重畳し
た雑音を抑圧するための雑音抑圧方法および雑音抑圧装
置に関するものである。
【0002】
【従来の技術】音声符号化の前処理として使用される代
表的な雑音抑圧方式としては、スペクトルサブストラク
ション法(例えば、STEVEN F. BOLL 氏による論文“SUP
PRESSION OF ACOUSTIC NOISE IN SPEECH USING SPECTRA
L SUBTRACTION”,IEEE TRANSACTIONS ON ACOUSTICS, S
PEECH, AND SIGNAL PROCESSING, VOL.ASSP-27, NO.2, A
PRIL 1979 参照)がある。これは、音声の無い雑音区間
で雑音のスペクトルを推定し、周波数領域で入力スペク
トルから雑音スペクトルを差し引く方式である。米国の
CDMA(Code Division Multiple Access)方式携帯電話
(TIA/EIA/IS-95)の標準音声符号化方式であるEVRC(E
nhanced Variable Rate Codec)(TIA/EIA/IS-127)で
は、前処理として、スペクトルサブストラクション法を
用いることにより、入力信号に重畳されている雑音の低
減を図っている。一方、日本のPDCハーフレート方式の
標準(RCR(ARIB) STD-27F, ”デジタル方式自動車電話
システム“ 参照)では、カルマンフィルタを用いた雑
音抑圧方式がオプションとして採用されている。これ
は、時間領域での雑音抑圧処理である。
【0003】上記した雑音抑圧方式を音声符号化の前処
理として使用した場合、音声符号化後の再生音声の自然
性および了解性・明瞭性は、雑音抑圧処理を行わない場
合に比べ改善されることが報告されている。しかし、上
記の雑音抑圧方式は、白色雑音、自動車走行音、空調機
等の定常的な雑音に対しては抑圧可能であるが、時間と
共に周波数特性、エネルギが変動する雑音である非定常
的な雑音に関しては抑圧することが出来ない。一方、業
務用移動通信では、騒音環境下において通話の明瞭性お
よび了解性の確保が必要とされるが、消防、警察で使用
される場合、サイレン音の混入により低ビットレートで
の音声符号化後の再生音声の品質は著しく影響を受ける
ため、音声符号化の前処理として雑音抑圧が必須である
といえる。しかし、サイレン音、特に、消防車、パトカ
ーのサイレン音(ウーウー音)は非定常な雑音であるた
め、上述のスペクトルサブストラクション法等を用いて
も抑圧することは出来ないという問題があった。
【0004】この場合、非定常な雑音のみをセカンドマ
イクで受信し、この受信した雑音信号を差し引くことに
より、重畳されている非定常な雑音の低減を図ることが
考えられる。しかし、この方法ではセカンドマイク等の
ハードウェアが必要になると共に、非定常な雑音のみを
受信できる位置にセカンドマイクを取り付けなければな
らず、特に携帯移動局においてはその取り付け設定が困
難になるという問題点があった。そこで、自動車走行音
等の定常的な雑音のみでなく、消防車、パトカー等のサ
イレン音(ウーウー音)、救急車のサイレン(ピーポー
音)等を、セカンドマイク等のハードウェアの追加を必
要とせずに抑圧することが出来る雑音抑圧方法および雑
音抑圧装置を本出願人は特願2001−58134にお
いて提案している。
【0005】この雑音抑圧方法および雑音抑圧装置を図
10ないし図13を参照して説明する。図10には雑音
抑圧装置の一構成例が示されており、この雑音抑圧装置
は、定常的な雑音を抑圧するための雑音抑圧器としてス
ペクトルサブストラクション(SS)法を用いている。図
10には雑音抑圧装置において、FFT部81では、音声
信号に雑音が重畳された入力信号a8を予め定められた時
間長のフレーム毎(例えば、10ms毎)に時間領域から周
波数領域に変換し、周波数領域に変換された結果である
スペクトルG0(k)が出力される(b8)。ただし、k=0,
1,...,K/2-1 であり、スペクトルG0(k)は複素数とされ
ており、K(例えば、512)はFFTポイント数である。
【0006】サイレン音抑圧情報設定部82では、入力
されたスペクトルG0(k)からサイレン音の有無が検出さ
れてサイレン音有無フラグd8を出力すると共に、サイレ
ン音の基本周波数が抽出され、抽出された基本周波数F'
1 (c8)が出力される。SS法による雑音抑圧器83では、
音声信号に雑音が重畳している信号a8から定常的な性質
を持つ雑音を周波数領域において抑圧している。さらに
サイレン音抑圧情報設定部82から雑音“有り”を示す
サイレン音有無フラグd8が供給されている場合、サイレ
ン音抑圧情報設定部82から供給されている基本周波数
F'1 (c8)に基づいて、入力信号a8から基本周波数F'1
びその第r高調波成分を周波数領域において抑圧するよ
うにしている。これにより、SS法による雑音抑圧器83
から定常的な雑音およびサイレン音が抑圧された音声信
号e8が出力されるようになる。
【0007】次に、図10におけるSS法による雑音抑圧
器83の構成例を図12に示す。図12において、FFT
部101では、音声信号に雑音が重畳されている入力信
号S(n)(a8)を予め定められた時間長のフレーム毎(10
ms毎)に時間領域から周波数領域に変換し、その結果で
あるスペクトルG0(k)が出力される(b10)。ただし、k=0,
1,...,K/2-1 であり、スペクトルG0(k)は複素数とされ
ており、K(例えば、128)はFFTポイント数である。サ
イレン音抑圧部102には、図10に示すサイレン音抑
圧情報設定部82からサイレン音有無フラグd8、及び基
本周波数F'1(c8)が入力されており、このサイレン音有
無フラグd8がサイレン音”有”を示している場合、スペ
クトルG0(k) (b10)から、次の(1)式に示すように、
基本周波数F'1 (c8)及びその第r高調波成分を抑圧す
る。
【数1】 (1)式において、fsは標本化周波数、int(x)はxに最
も近い整数である。なお、(1)式における第2行及び
第3行の式は、基本周波数F'1及びその第r高調波に隣
接するスペクトル振幅を1/2として抑圧しており、音
声信号のスペクトルにほぼ影響を与えることなく雑音を
抑制するようにしている。
【0008】その後、次に示す(2)式の通り、振幅は
偶関数に、位相は奇関数となるように折り返し、その結
果であるスペクトルG(k) (c6)を出力する。
【数2】 ここで、*は複素共役を示す。 これにより、スペクト
ルG(k)はサイレン音のスペクトル成分が抑圧されている
音声信号のスペクトルとなる。次に、スペクトルG(k)
(c6)は、16個の不均一な周波数帯域(チャネルと呼
ぶ)に分割され、チャネルゲイン計算部71により計算
された各チャネルのゲイン[γch] (l6)が、乗算器72
により各チャネルのスペクトルに乗算される。ここで、
[x]はxがチャネル数(=16チャネル)分の次元を持つ
ベクトルであることを示す。また、乗算は、正負の周波
数スペクトルについて実行される。
【0009】乗算器72から出力されるサイレン音等の
非定常な雑音成分に加えて定常的な雑音成分も抑圧され
たスペクトルH(k) (m6)は、IFFT部73により時間領域
に変換され、非定常な雑音に加えて定常的な雑音も抑圧
された音声信号S'(n) (n10)が出力される。チャネルゲ
イン[γch] (l6)は、次のように計算される。チャネル
エネルギ推定部63は、フレーム毎に各チャネルのエネ
ルギを更新して、更新されたチャネルエネルギ[Ech(m)]
(d6)を出力する。ここで、mはフレーム番号を示す。チ
ャネルSNR推定部64は、チャネルエネルギ[Ech(m)] (d
6)と背景雑音推定部68からの出力である背景雑音推定
値[En(m)] (j6)を用いて、チャネルSNR推定値[σq] (e
6)を計算する。また、ボイスメトリック計算部66は、
チャネルSNR推定値[σq] (e6)より、現フレームに音声
が存在する確率を示すパラメータであるボイスメトリッ
クV(m) (g6)を計算する。さらに、スペクトル偏差推定
部65は、入力されたチャネルエネルギ[Ech(m)] (d6)
の長期平均値を計算し、計算された長期平均値とチャネ
ルエネルギ[Ech(m)] との偏差ΔE(m)、及び全チャネル
のエネルギの総和Etot(m) (f6)を計算して出力する。
【0010】さらにまた、雑音更新決定部67は、ボイ
スメトリックV(m) (g6)と、偏差ΔE(m)及び全チャネル
のエネルギの総和Etot(m) (f6)の値に基づいて、背景雑
音推定部68において背景雑音推定値[En(m)] (j6)を更
新するかしないかを決定する。ここでは、現フレームが
雑音のみのフレームである確率が高い場合、更新と決定
される。更新と決定された場合、update_flag(h6)によ
り、背景雑音推定部68にチャネルエネルギ[Ech(m)]
(d6)が入力されるようにスイッチ69が切替えられ、背
景雑音推定部68は、背景雑音推定値[En(m)] (j6)を更
新する。チャネルSNR修正部70は、ボイスメトリックV
(m) (g6)に基づき、チャネルSNR推定値[σq] (e6)を修
正し、修正後のチャネルSNR推定値[σ"q] (k6)を出力す
る。
【0011】チャネルゲイン計算部71は、背景雑音推
定値[En(m)] (j6)と固定の雑音フロア値(=1)を用いて
最小ゲインを計算する。最小ゲインは、-13〜0dBの範囲
の値をとる。その後、修正後のチャネルSNR推定値[σ"
q] (k6)の関数として、チャネルゲイン[γch] (l6)を計
算し出力する。この計算では、修正後のチャネルSNR推
定値[σ"q] (k6)に応じた値を、上記の最小ゲイン(dB)
に加算した後(ここでの最大値は0dB)、 その結果を対
数領域(dB)から線形領域に変換したものをチャネルゲイ
ン[γch] (l6)として出力する。このようにしてチャネ
ルゲイン計算部71により計算されたチャネルゲイン
[γch] (l6)が、乗算器72によりスペクトルG(k) (c6)
に乗算される。以上説明したチャネルエネルギ推定部6
3ないしIFFT部73からなる構成は定常雑音抑圧部10
0であり、この定常雑音抑圧部100により定常的な雑
音成分が抑圧されるようになる。
【0012】次に、図10のサイレン音抑圧情報設定部
82の構成を図11に示す。図11において、長期平均
スペクトル振幅更新部91では、入力信号を周波数領域
に変換したFFT部81の出力であるスペクトルG0(k)(b8)
が入力され、次に示す(3)式により、長期平均スペク
トル振幅 |Nm modM(k)| の更新が行なわれ、更新された
長期平均スペクトル振幅b9が出力される。この長期平均
スペクトル振幅更新部91における長期平均スペクトル
振幅更新処理は、次に説明するサイレン音基本周波数抽
出が正確に実行できるようにするため、スペクトル中の
サイレン音成分を強調する処理である。
【数3】 この(3)式において、k=0,1,...,K/2-1 であり、Gmax
は現フレームにおけるスペクトルの内の最大の振幅を有
するスペクトルの振幅であり、各スペクトル振幅|G0(k)
| がスペクトル振幅Gmaxにより正規化されている。ま
た、K (例えば512)はFFTポイント数、mはフレーム番
号、Mはサイレン音吹鳴周期(基本周波数の変動周期に
対応)であり、例えば、消防車のウーウー音の場合はM=
600フレーム=6secと設定される。係数αはM<600の時
「0」、その他は「0.5」と設定される。これは、フ
レーム番号が「600」に達していない際には、1周期
を超えていないので平均化する必要がないからである。
【0013】サイレン音基本周波数抽出部92では、長
期平均スペクトル振幅更新部91から出力される更新後
の長期平均スペクトル振幅 |Nm modM(k)| (b9)を用い
て、次に示す(4)式の計算を行う。(4)式において
は、予め設定された範囲の候補周波数(ウーウー音の場
合は、例えばf=187.5〜1000Hz)のうち、それ自身及び
その第r高調波のスペクトル振幅の総和Afが最大とな
るfとして、基本周波数F 1 (c9)を抽出し、出力する。
【数4】 この(4)式において、fsは標本化周波数、int(x)は
xに最も近い整数、Lは加算される高調波スペクトル振
幅の数である。
【0014】そして、サイレン音基本周波数代表パター
ンメモリ94は、サイレン音の基本周波数の代表的な変
動軌跡の1周期分(または、数周期分)を記憶してお
り、記憶された代表パターンd9は、サイレン音基本周波
数代表パターンメモリ94から読み出されて、サイレン
音検出部93と補正部95に供給されている。サイレン
音(消防車のウーウー音)基本周波数の代表パターン
(1周期 = 6秒)の一例を図13に示す。図13に示
す1周期が6秒とされるサイレン音の代表パターンで
は、周波数が時間の経過に従って降下する休止区間が2
秒とされ、基本周波数が時間の経過に従って一定値に達
するまで上昇する発音区間が4秒とされている。
【0015】サイレン音基本周波数代表パターンメモリ
94から読み出されたサイレン音の基本パターンd9が供
給されるサイレン音検出部93では、その代表パターン
d9を巡回シフトしながら、サイレン音基本周波数抽出部
92において抽出した基本周波数F1の系列との自乗平均
誤差が計算される。そして、算出された自乗平均誤差が
予め設定された閾値より小さければ、雑音有りと判定さ
れ、算出された自乗平均誤差の最小値が予め設定された
閾値以上であれば雑音無しと判定する。この判定結果
は、サイレン音有無フラグd8として出力されると共に、
自乗平均誤差が最小になる代表パターンのシフト位置を
示す位置情報g9が出力される。また、サイレン音基本周
波数代表パターンメモリ94から読み出されたサイレン
音の基本パターンd9が供給される補正部95では、入力
された位置情報g9に応じて時間軸上の位置合わせをした
代表パターンd9における周波数と、抽出された基本周波
数F1の周波数差を検出する。そして、検出された周波数
差が所定の閾値より大きい場合には、代表パターンの周
波数で基本周波数F1を置換えて、補正した基本周波数F'
1(c8)として出力する。サイレン音有無フラグd8および
基本周波数F'1(c8)は、SS法による雑音抑圧器83に供
給される。
【0016】
【発明が解決しようとする課題】上述した雑音抑圧装置
では、自動車走行音等の定常的な雑音のみでなく、消防
車、パトカー等のサイレン音(ウーウー音)、救急車の
サイレン(ピーポー音)等を、セカンドマイク等のハー
ドウェアの追加を必要とせずに抑圧することが出来る。
しかし、図11に示すサイレン音抑圧情報設定部82の
長期平均スペクトル振幅更新部91での長期平均スペク
トル振幅 |Nm modM(k)| の更新処理において、長期平均
スペクトル振幅 |Nm modM(k)| を記憶しておくために必
要となるデータメモリ量は、M=600、K=512の場合、M(=
600)×K/2(=256)=153.6kword=614.4kbyte(1word=4b
yteとする)と膨大になり、また、Kを小さく設定しK=12
8とした場合でも、M(=600)×K/2(=64)=38.4kword=1
53.6kbyteとなる。雑音抑圧装置をDSP(デジタルシグナ
ルプロセッサ)等により実現するためには、データメモ
リ量を更に低減することが望ましい。
【0017】そこで、本発明は、より小規模なデータメ
モリ量で、定常的な雑音及びサイレン音をセカンドマイ
ク等のハードウェアの追加を必要とせずに抑圧すること
が出来る雑音抑圧方法および雑音抑圧装置を提供するこ
とを目的にしている。
【0018】
【課題を解決するための手段】上記目的を達成するため
に、本発明の雑音抑圧方法は、周波数領域変換手段にお
いて、音声信号に雑音が重畳されている入力信号を予め
定められた時間長のフレーム毎に時間領域から周波数領
域の入力信号に変換し、雑音抑圧情報設定手段におい
て、周波数領域に変換された入力信号から抑圧対象とす
る雑音の有無を検出すると共に、該雑音の基本周波数を
抽出し、該雑音抑圧情報設定手段において抑圧対象とす
る雑音が有りと判定された場合、抑圧手段において、周
波数領域に変換された入力信号から、抽出された前記基
本周波数及びその高調波成分を抑圧し、定常雑音抑圧手
段において、音声信号の無い雑音区間で定常的な性質を
持つ雑音の定常雑音スペクトルを推定し、前記抑圧手段
から出力された信号から前記定常雑音スペクトルを差し
引くことにより、定常的な性質を持つ雑音を抑圧し、時
間領域変換手段において、該定常的な性質を持つ雑音を
抑圧した結果を時間領域の信号に変換するようにした雑
音抑圧方法であって、 前記雑音抑圧情報設定手段は、
予め設定されたフレーム間隔毎に、前記周波数領域に変
換された入力信号に対し、抑圧対象として予め設定され
ている雑音における基本周波数の変動周期に対応する時
間間隔でスペクトル振幅の長期平均値を算出し、前記予
め設定されたフレーム間隔毎に、前記算出されたスペク
トル振幅の長期平均値を用いて、予め設定された範囲の
候補周波数のうち、それ自身及びその高調波のスペクト
ル振幅の総和が最大となる周波数を基本周波数として抽
出し、パターンメモリ手段に、抑圧対象とされる雑音の
基本周波数の代表的な変動軌跡の少なくとも1周期分の
代表パターンを予め記憶しておき、前記予め設定された
フレーム間隔毎に、前記パターンメモリから読み出した
代表パターンと、前記予め設定されたフレーム間隔毎に
抽出された基本周波数の系列との自乗平均誤差を、該代
表パターンを巡回シフトしながら算出し、算出された自
乗平均誤差の最小値が予め設定された閾値より小さけれ
ば、雑音有りと判定すると共に、そうでなければ、雑音
無しと判定し、さらに、自乗平均誤差が最小となる代表
パターンのシフト位置情報を出力し、前記予め設定され
たフレーム間隔毎に、該出力された代表パターンのシフ
ト位置情報に基づいて、前記代表パターンを用いて前記
抽出した基本周波数を補正し、さらに、前記予め設定さ
れたフレーム間隔で基本周波数が抽出されないフレーム
に対して、該代表パターンの値により基本周波数を補間
して出力するようにしている。この雑音抑圧方法によれ
ば、予め設定されたフレーム間隔毎にスペクトル振幅の
長期平均値を算出するため、小規模なデータメモリ量
で、例えばサイレン音のように周期性を持った雑音、及
び定常的な雑音抑圧を実現することが出来る。
【0019】また、上記目的を達成することのできる本
発明の第2の雑音抑圧方法は、周波数領域変換手段にお
いて、音声信号に雑音が重畳されている入力信号を予め
定められた時間長のフレーム毎に時間領域から周波数領
域の入力信号に変換し、サイレン音検出手段において、
周波数領域に変換された入力信号から抑圧対象とするサ
イレン音雑音の有無を検出し、該サイレン音検出手段に
おいて抑圧対象とするサイレン音雑音が有りと判定され
た場合、抑圧手段において、周波数領域に変換された入
力信号から、サイレン音に基づいて予め定められた複数
の周波数成分を抑圧し、時間領域変換手段において、前
記抑圧手段により抑圧された結果を時間領域の信号に変
換するようにしている。この第2の雑音抑圧方法によれ
ば、スペクトル振幅の長期平均値を算出する必要が無く
なるため、より小規模なデータメモリ量で救急車のサイ
レン音(ピーポー音)のように2つの特定の周波数が交
互に発生しているようなサイレン音を抑圧可能とするこ
とができる。
【0020】さらに、上記本発明の第2の雑音抑圧方法
における定常雑音抑圧手段において、前記抑圧手段から
出力された信号から音声信号の無い雑音区間で定常的な
性質を持つ雑音の定常雑音スペクトルを推定して、前記
抑圧手段から出力された信号から前記定常雑音スペクト
ルを差し引くことにより、定常的な性質を持つ雑音を抑
圧し、前記時間領域変換手段において、前記定常雑音抑
圧手段から出力された信号を時間領域の信号に変換する
ようにしてもよい。このようにすると、救急車のサイレ
ン音(ピーポー音)に加え、定常的な性質を持つ雑音を
も抑圧することが可能となる。
【0021】さらに、上記本発明の第2の雑音抑圧方法
における前記サイレン音検出手段において、サイレン音
に基づいて予め定められた2つの周波数について、それ
らの周波数でのスペクトル振幅を求め、求められた2つ
のスペクトル振幅の差の絶対値を該2つのスペクトル振
幅の和で正規化し、該正規化された2つのスペクトル振
幅の差の絶対値の移動平均値を算出し、前記予め定めら
れた2つの周波数の内一方のスペクトル振幅が他方のそ
れよりも大きければ、変数に特定の整数をセットし、そ
うでない場合には、該変数に正負の符号を逆にした該特
定の整数をセットし、該変数の移動平均値を算出し、前
記正規化された2つのスペクトル振幅の差の絶対値の移
動平均値が予め設定された第1の閾値より大きく、か
つ、前記変数の移動平均値の絶対値が予め設定された第
2の閾値より小さければ、雑音有りと判定すると共に、
そうでなければ、雑音無しと判定するようにしてもよ
い。このようにすると、小規模な処理量で救急車のサイ
レン音(ピーポー音)を検出可能とすることができる。
【0022】さらにまた、上記本発明の第2の雑音抑圧
方法における前記サイレン音検出手段において、サイレ
ン音に基づいて予め定められた2つの周波数について、
それらの周波数でのスペクトル振幅を求め、求められた
2つのスペクトル振幅の差の絶対値を該2つのスペクト
ル振幅の和で正規化し、該正規化された2つのスペクト
ル振幅の差の絶対値の移動平均値を算出し、前記予め定
められた2つの周波数の内一方のスペクトル振幅を他方
のそれで減算したスペクトル振幅の差を計算し、該スペ
クトル振幅の差を前記2つのスペクトル振幅の和で正規
化し、該正規化されたスペクトル振幅の差の移動平均値
を算出し、前記正規化された2つのスペクトル振幅の差
の絶対値の移動平均値が予め設定された第1の閾値より
大きく、かつ、前記正規化されたスペクトル振幅の差の
移動平均値の絶対値が予め設定された第3の閾値より小
さければ、雑音有りと判定すると共に、そうでなけれ
ば、雑音無しと判定してもよい。このようにしても、小
規模な処理量で救急車のサイレン音(ピーポー音)を検
出可能とすることができる。
【0023】さらにまた、上記本発明の第2の雑音抑圧
方法において、雑音抑圧情報設定手段において、前記周
波数領域に変換された入力信号から抑圧対象とする雑音
の有無を検出すると共に、該雑音の基本周波数を抽出
し、該雑音抑圧情報設定手段において抑圧対象とする雑
音が有りと判定された場合、前記抑圧手段において、周
波数領域に変換された入力信号から、抽出された前記基
本周波数及びその高調波成分をも抑圧し、定常雑音抑圧
手段において、音声信号の無い雑音区間で定常的な性質
を持つ雑音の定常雑音スペクトルを推定し、前記抑圧手
段から出力された信号から前記定常雑音スペクトルを差
し引くことにより、定常的な性質を持つ雑音を抑圧する
ようにし、前記時間領域変換手段において、前記定常雑
音抑圧手段から出力された信号を時間領域の信号に変換
するようにしてもよい。このようにすると、救急車のサ
イレン音(ピーポー音)を効率良く抑圧すると共に、他
のサイレン音および定常的な性質の雑音を抑圧すること
ができるようになる。
【0024】次に、本発明の雑音抑圧装置は、上記した
本発明の雑音抑圧方法および第2の雑音抑圧方法を具現
化した雑音抑圧装置とされており、同様の作用効果を奏
することができるようにされている。
【0025】
【発明の実施の形態】本発明の雑音抑圧方法を具現化し
た本発明にかかる雑音抑圧装置の第1の実施の形態を図
1に示す。但し、以下の説明では、抑圧対象とする雑音
として、消防車のサイレン音(ウーウー音)に限定して
説明する。他の周期性を持つ非定常的な雑音について
も、同様な方法で、いくつかの設定値を変更するのみで
抑圧可能である。図1において、FFT部11では、音声
信号に雑音が重畳した入力信号S(n) (a1)を予め定めら
れた時間長のフレーム毎(例えば、10ms毎)に時間領域
から周波数領域に変換し、その結果であるスペクトルG0
(k)が出力される(b1)。ただし、k=0,1,...,K/2-1 であ
り、スペクトルG0(k)は複素数とされており、K(例え
ば、128)はFFTポイント数である。スペクトルG0(k)
は、サイレン音抑圧情報設定部12及びサイレン音抑圧
部13に入力される。サイレン音抑圧部13においてサ
イレン音が抑圧されたスペクトルG(k)は、定常雑音抑圧
部100に供給され、さらに定常的な雑音が抑圧され
て、IFFT部73において時間領域の信号S'(n)に変換さ
れて出力される(n1)。なお、定常雑音抑圧部100の構
成は図12に示す構成と同様であるので、定常雑音抑圧
部100の説明は省略する。
【0026】次に、図1に示す本発明の雑音抑圧装置に
おける第1の実施の形態にかかるサイレン音抑圧情報設
定部12の構成を図2に示す。図2に示すサイレン音抑
圧情報設定部12において、 長期平均スペクトル振幅
更新部41では、入力信号を周波数領域に変換した結果
であるスペクトルG0(k)(a1)が入力され、前記(3)式
により、長期平均スペクトル振幅 |Nm modM(k)|の更新
が行なわれ、更新された長期平均スペクトル振幅 |N
m modM(k)| (b2)が出力される。ここで、サイレン音抑
圧情報設定部12の構成が、前記図11に示したサイレ
ン音抑圧情報設定部82の構成と異なるのは、長期平均
スペクトル振幅 |Nm modM(k)| の更新が、予め設定され
たフレーム間隔毎に行われることである。例えば、フレ
ーム間隔を5とすると、((m mod M)mod 5=0) の条件が
満たされるフレームにおいてのみ、長期平均スペクトル
振幅の更新が実行される。したがって、(m mod M)が1
/5に間引かれることになるため、長期平均スペクトル
振幅 |Nm modM(k)| を記憶しておくためのメモリ量を1
/5に低減することができるようになる。
【0027】すなわち、長期平均スペクトル振幅 |N
m modM(k)| を記憶しておくために必要となるデータメ
モリ量は、M=600、K=128の場合、M/5×K/2=7.68kword=3
0.72kbyte(1word=4byteとする)となり、メモリ量を大
幅に低減することができる。サイレン音基本周波数抽出
部42では、長期平均スペクトル振幅更新部41から出
力される更新後の長期平均スペクトル振幅 |Nm modM(k)
| (b2)を用いて、((m mod M)mod 5=0) の条件が満たさ
れるフレームにおいてのみ、前記(4)式の計算を行
い、基本周波数F1 (c2)を抽出し、出力する。ここで、
基本周波数F1 (c2)の時系列は、1/5に間引かれたも
のとなっている。
【0028】サイレン音基本周波数代表パターンメモリ
44は、サイレン音の基本周波数の代表的な変動軌跡の
1周期分(または、数周期分)を記憶している。ただ
し、このサイレン音基本周波数代表パターンメモリ44
に記憶されている代表パターンd2の基本周波数の時系列
は間引かれてはいない。記憶された代表パターンd2は、
サイレン音基本周波数代表パターンメモリ44から読み
出されて、サイレン音検出部43と補正・補間部45に
供給されている。サイレン音基本周波数代表パターンメ
モリ44から読み出されたサイレン音の基本パターンd2
が供給されるサイレン音検出部43では、その代表パタ
ーンd2を巡回シフトしながら、サイレン音基本周波数抽
出部42において抽出した基本周波数F1の系列(c2)との
自乗平均誤差が計算される。この計算においては、基本
周波数F1の系列(c2)での間引かれているフレームに対応
するサンプル点は零詰めされている。
【0029】そして、算出された自乗平均誤差の最小値
が予め設定された閾値より小さければ、雑音有りと判定
し、算出された自乗平均誤差が予め設定された閾値以上
であれば雑音無しと判定する。この判定結果は、サイレ
ン音有無フラグd1としてサイレン音抑圧部13に出力さ
れると共に、自乗平均誤差が最小になる代表パターンの
シフト位置を示す位置情報g2が出力される。上記のサイ
レン音検出部43の処理は、((m mod M)mod 5=0) の条
件が満たされるフレームにおいてのみ実行される。
【0030】また、サイレン音基本周波数代表パターン
メモリ44から読み出されたサイレン音の基本パターン
d2が供給される補正・補間部45では、((m mod M)mod
5=0)の条件が満たされるフレームでは、入力された位置
情報g2に応じて時間軸上の位置合わせをした代表パター
ンd2における周波数と、抽出された基本周波数F1の周波
数差を検出する。そして、検出された周波数差が所定の
閾値より大きい場合には、代表パターンの周波数で基本
周波数F1を置換えて、補正した基本周波数F' 1(c1)とし
てサイレン音抑圧部13に出力する。後続する((m mod
M)mod 5=0) の条件が満たされないフレーム、すなわ
ち、基本周波数F1が計算されなかったフレームに対して
は、時間軸上の位置合わせをした代表パターンd2の値で
補間し、基本周波数F'1(c1)としてサイレン音抑圧部1
3に出力する。上記の構成により、図12に示す構成の
雑音抑圧装置と同等のサイレン音の抑圧性能を保ちなが
ら、長期平均スペクトル振幅 |Nm modM(k)| を記憶して
おくためのメモリ量を1/5に低減することができるよ
うになる。
【0031】次に、本発明の雑音抑圧方法を具現化した
本発明にかかる雑音抑圧装置の第2の実施の形態を図3
に示す。この第2の実施の形態にかかる雑音抑圧装置で
は、抑圧対象とする背景雑音を、救急車のサイレン音
(ピーポー音)のような特定の複数個の周波数成分しか
持たない雑音に限定することにより、演算量、メモリ量
を低減することができるようにしている。図3に示す第
2の実施の形態にかかる雑音抑圧装置において、FFT部
21では、音声信号に雑音が重畳した入力信号S(n) (a
3)を予め定められた時間長のフレーム毎(例えば、10ms
毎)に時間領域から周波数領域に変換し、その結果であ
るスペクトルG0(k)が出力される(b3)。ただし、k=0,
1,...,K/2-1 であり、スペクトルG0(k)は複素数とされ
ており、K(例えば、128)はFFTポイント数である。ス
ペクトルG0(k)(b3)は、第2サイレン音検出部22及び
第2サイレン音抑圧部23に入力される。
【0032】第2サイレン音検出部22では、スペクト
ルG0(k)(b3)から抑圧対象とする雑音の有無を検出し、
その結果としてサイレン音有無フラグc3が出力される。
スペクトルG0(k)(b3)及びサイレン音有無フラグc3が入
力されるサイレン音抑圧部23では、サイレン音有無フ
ラグc3が雑音有りを示している場合、次に示す(5)式
を使用して予め定められた複数個(p個)の周波数成分
を抑圧する。
【数5】 ここで、fsは標本化周波数、int(x)はxに最も近い整数
である。なお、(5)式における第2行及び第3行の式
は、抑圧する周波数Fpに隣接するスペクトル振幅を1/
2として抑圧しており、音声信号のスペクトルにほぼ影
響を与えることなく雑音を抑制するようにしている。
【0033】ここで、救急車のサイレン音(ピーポー
音)を抑圧の対象とする場合には、図9に示す救急車の
サイレン音(ピーポー音)のサウンドスペクトログラム
から分かるように、ピーポー音は、基本周波数が770Hz
と960Hzの周期信号が交互に繰返している信号(繰り返
しの周期は1.3秒)であるため、p=2、F0=770Hz、F1 =96
0Hzと設定すれば良い。または、2つの基本周波数770H
z、960Hzの高調波成分をも抑圧するように設定しても良
い。その後、上記(5)式の結果に対して、前記(2)
式の通り、振幅は偶関数に、位相は奇関数となるように
折り返し、その結果であるスペクトルG(k) (d3)を出力
する。スペクトルG(k) (d3)は、IFFT部24により時間
領域に変換され、その結果として、サイレン音が抑圧さ
れた音声信号S'(n) (e3)が出力されるようになる。
【0034】次に、本発明の雑音抑圧方法を具現化した
本発明にかかる雑音抑圧装置の第3の実施の形態を図5
に示す。この第3の実施の形態にかかる雑音抑圧装置
は、前述した本発明の第2の実施の形態にかかる雑音抑
圧装置において定常的な雑音をも抑圧可能としたもので
ある。図5に示す第3の実施の形態の雑音抑圧装置にお
いて、FFT部31、第2サイレン音検出部32および第
2サイレン音抑圧部33は、それぞれ図3に示すFFT部
21、第2サイレン音検出部22および第2サイレン音
抑圧部23と同様の構成とされて、同様の動作をしてい
る。このため、第2サイレン音抑圧部33からは、例え
ば救急車のサイレン音(ピーポー音)が抑圧されたスペ
クトルG(k) (c6)が得られる。このスペクトルG(k) (c6)
は、定常雑音抑圧部100に供給され、定常的な雑音が
抑圧されて、IFFT部73において時間領域の信号S'(n)
に変換されて出力される(n4)。これにより、救急車のサ
イレン音(ピーポー音)のように特定の複数個の周波数
成分しか持たない雑音、及び定常的な性質を持つ雑音を
抑圧可能とすることができる。なお、定常雑音抑圧部1
00の構成は図12に示す構成と同様であるので、定常
雑音抑圧部100の説明は省略する。
【0035】次に、第2サイレン音検出部22,32に
おいて実行されるサイレン音検出処理について図6に示
すフローチャートを用いて以下に説明する。図6に示す
サイレン音検出処理がスタートすると、2つの予め定め
られた周波数(770Hz、及び960Hz)について、それらの
周波数を中心とした特定の狭い周波数帯域でのスペクト
ル振幅の総和を計算する(ステップS1)。その結果
を、それぞれスペクトルG770、スペクトルG960とする。
次いで、スペクトルG770とスペクトルG960の差の絶対値
をスペクトルG770とスペクトルG960との和で正規化した
値dをステップS2にて計算する。次に、 ステップS3
にて次の(6)式により、値dの移動平均値d’を計算す
る。但し、移動平均値d’の初期値は「0」とする。
【数6】 ここで、係数βは0.99231と設定した。この値は、ピー
ポー音の繰り返し周期(1.3s = 130フレーム)に対応し
ている(β=0.99231=1-1/130)。したがって、移動平均
値d’は値dについてピーポー音の繰り返し周期である1.
3秒の区間で移動平均をとった値となる。
【0036】次に、スペクトルG770が、スペクトルG960
よりも大きければ、変数devに特定の整数(例えば1.0)
をセットし、そうでない場合には、変数devに正負の符
号を逆にした該特定の整数(例えば-1.0)をセットする
(ステップS4)。さらに、次の(7)式により、変数dev
の移動平均値dev’を計算する。但し、移動平均値dev’
の初期値は「0」とする。
【数7】 ここで、係数βは上記と同じ理由で0.99231と設定し
た。
【0037】さらに、ステップS6にて移動平均値d’
が予め設定された第1の閾値(Th1:例えば0.4)より大
きく、かつ、移動平均値dev’の絶対値が予め設定され
た第2の閾値(Th2:例えば0.35)より小さければ、サ
イレン音有りと判定すると共に、そうでなければ、サイ
レン音無しと判定する。サイレン音有りと判定された場
合は、ステップS7に進んでサイレン音有無フラグが
「1」(pp_flg=1)とされて、サイレン音が検出された
ことが知らされる。また、サイレン音無しと判定された
場合は、ステップS8に進んでサイレン音有無フラグが
「0」(pp_flg=0)とされて、サイレン音が検出されな
かったことが知らされる。ステップS7あるいはステッ
プS8の処理が終了するとサイレン音検出処理は終了す
る。
【0038】また、次に、第2サイレン音検出部22,
32において実行される他のサイレン音検出処理につい
て図7に示すフローチャートを用いて以下に説明する。
図7に示すサイレン音検出処理がスタートすると、2つ
の予め定められた周波数(770Hz、及び960Hz)につい
て、それらの周波数を中心とした特定の狭い周波数帯域
でのスペクトル振幅の総和を計算する(ステップS1
0)。その結果を、それぞれスペクトルG770、スペクト
ルG960とする。次いで、スペクトルG770とスペクトルG
960の差の絶対値をスペクトルG770とスペクトルG960
の和で正規化した値dをステップS11にて計算する。
次に、 ステップS12にて前記した(6)式により、
値dの移動平均値d’を計算する。但し、移動平均値d’
の初期値は「0」とする。(6)式においては、係数β
は同様に0.99231と設定した。これにより、移動平均値
d’は値dについてピーポー音の繰り返し周期である1.3
秒の区間で移動平均をとった値となる。
【0039】次に、ステップS13にてスペクトルG770
からスペクトルG960を減算した結果を、スペクトルG770
とスペクトルG960の和で正規化した値d2を算出する。さ
らに、ステップS14にて次に示す(8)式により、値
d2の移動平均値d2’を計算する。但し、移動平均値d2’
の初期値は「0」とする。
【数8】 ここで、係数βは上記と同じ理由で0.99231と設定し
た。次いで、ステップS15にて移動平均値d’が予め
設定された第1の閾値(Th1:例えば0.4)より大きく、
かつ、移動平均値d2’の絶対値が予め設定された第3の
閾値(Th3:例えば0.4)より小さければ、サイレン音有
りと判定すると共に、そうでなければ、サイレン音無し
と判定する。サイレン音有りと判定された場合は、ステ
ップS16に進んでサイレン音有無フラグが「1」(pp
_flg=1)とされて、サイレン音が検出されたことが知ら
される。また、サイレン音無しと判定された場合は、ス
テップS17に進んでサイレン音有無フラグが「0」
(pp_flg=0)とされて、サイレン音が検出されなかった
ことが知らされる。ステップS16あるいはステップS
17の処理が終了するとサイレン音検出処理は終了す
る。
【0040】図6および図7に示すフローチャートのサ
イレン音検出処理は、同様の作用をするので、これらの
内どちらのサイレン音検出処理を用いてもよい。以下
に、図6および図7に示すサイレン音検出処理によりピ
ーポー音が検出できる理由を示す。図6および図7に示
すサイレン音検出処理で共通に使用されている移動平均
値d’については、ピーポー音では常に770Hz、960Hzの
内どちらか一方の周波数が発生しているため、移動平均
値d’の値は、ピーポー音が重畳していない入力信号に
比べ大きくなる。但し、移動平均値d’の値は、770Hz、
960Hzの内どちらか一方のみ常に発生している信号に対
しても大きくなる。そして、図6に示すサイレン音検出
処理における移動平均値dev’については、ピーポー音
の繰り返し周期である1.3秒の範囲での平均値であり、
1.3秒内に占める770Hzと960Hzの時間的割合は等しいた
め、ピーポー音に対しては移動平均値dev’は「0」に
近い値となる。また、図7に示すサイレン音検出処理に
おける移動平均値d2’についても、移動平均値dev’と
同じ理由で、ピーポー音に対しては「0」に近い値とな
る。したがって、移動平均値d’と移動平均値dev’、ま
たは、移動平均値d’と移動平均値d2’を組み合わせ、
これらを閾値と比較することによりピーポー音を検出可
能となるのである。
【0041】次に、本発明の雑音抑圧方法を具現化した
本発明にかかる雑音抑圧装置の第4の実施の形態を図8
に示す。この第4の実施の形態にかかる雑音抑圧装置
は、消防車のサイレン音のように基本周波数が変動する
非定常雑音に加えて、救急車のサイレン音(ピーポー
音)のような特定の複数個の周波数成分しか持たない非
定常雑音、および、定常的な雑音をも抑圧可能としたも
のである。図8に示す第4の実施の形態にかかる雑音抑
圧装置において、FFT部51では、音声信号に雑音が重
畳した入力信号S(n) (a5)を予め定められた時間長のフ
レーム毎(例えば、10ms毎)に時間領域から周波数領域
に変換し、その結果であるスペクトルG0(k)が出力され
る(b5)。ただし、k=0,1,...,K/2-1 であり、スペクトル
G0(k)は複素数とされており、K(例えば、128)はFFTポ
イント数である。スペクトルG0(k)(b5)は、サイレン音
抑圧情報設定部52および第2サイレン音検出部54、
および第3サイレン音抑圧部53に入力される。
【0042】サイレン音抑圧情報設定部52では、入力
されたスペクトルG0(k)からサイレン音の有無が検出さ
れてサイレン音有無フラグd5を第3サイレン音抑圧部5
3に出力すると共に、サイレン音の基本周波数が抽出さ
れ、抽出された基本周波数F' 1 (c5)が第3サイレン音抑
圧部53に出力される。また、第2サイレン音検出部5
4では、スペクトルG0(k)(b5)から抑圧対象とする雑音
の有無を検出し、その結果としてサイレン音有無フラグ
e5が第3サイレン音抑圧部53に出力される。第3サイ
レン音抑圧部53においては、サイレン音有無フラグd5
がサイレン音”有”を示している場合、スペクトルG
0(k) (b5)から、前記(1)式に示すように、基本周波
数F'1 (c5)及びその第r高調波成分を抑圧する。さら
に、第3サイレン音抑圧部53においては、サイレン音
有無フラグe5がピーポー音のサイレン音”有”を示して
いる場合、前記(5)式を使用して予め定められた複数
個(p個)の周波数成分を抑圧する。これにより、第3
サイレン音抑圧部53から出力されるウーウー音やピー
ポー音のサイレン音が抑圧されたスペクトルG(k) (c6)
は、定常雑音抑圧部100に供給され、さらに定常的な
雑音が抑圧されて、IFFT部73において時間領域の信号
S'(n)に変換されて出力される(n5)。なお、定常雑音抑
圧部100の構成は図12に示す構成と同様であるの
で、定常雑音抑圧部100の説明は省略する。
【0043】これにより、救急車のサイレン音(ピーポ
ー音)のように特定の複数個の周波数成分しか持たない
非定常雑音を効率良く抑圧することができると共に、消
防車のサイレン音(ウーウー音)のように基本周波数が
変動する非定常雑音を抑圧することができる。さらに加
えて、白色雑音、自動車走行音、空調機等の定常的な雑
音も抑圧することができるようになる。
【0044】ここで、本発明にかかる雑音抑圧方法およ
び雑音抑圧装置の作用効果を説明する。背景雑音を重畳
した音声S(n)を、図3に示す本発明にかかる第2の実施
の形態の雑音抑圧装置に入力して雑音抑圧した。この雑
音抑圧した音声S'(n)を、音声符号化処理した再生音声
の品質を評価するため、MOS(平均オピニオンスコア)
試験を行った。評価値は5段階(非常に良い=5、 良
い=4、 普通=3、 悪い=2、 非常に悪い=1)と
し、防音室内でヘッドフォンを使用した両耳受聴により
実施した。また、音声符号化器としては、特開2001
−51698号「音声符号化復号方法及び装置」で提案
されている符号化速度1.6kbit/sの方式を用いた。背景
雑音としてサイレン音(救急車のピーポー音)を用い、
音声データとしては男女各2名により発声された4文章
を用いた。また、比較用として、雑音抑圧(Noise Canc
el : NC)無し及びSS法(IS-127)のみを使用した場
合、並びに、原音、2.4kbpsの標準方式であるMELP(L.
M. Supplee et al.、”MELP: The New Federal Standar
d at 2400 bps、” Proc. ICASSP97、 pp.1591-1594、1
997.)のNC無しでの再生音声についても評価した。一般
人の被験者8名によるMOS評価結果を図9に示す。横軸
は、入力音声の信号対雑音比(SNR)を示している。こ
の結果より、本発明を使用することにより、音声符号化
器の再生音声の品質が改善され、その効果を確認するこ
とができる。
【0045】
【発明の効果】本発明は以上のように構成されているの
で、セカンドマイク等のハードウェアの追加を必要とす
ることなく、信号処理技術のみにより、自動車走行音等
の定常的な雑音のみでなく、消防車、パトカー等のサイ
レン音(ウーウー音)、救急車のサイレン音(ピーポー
音)等の周期性を持つ非定常的な雑音を抑圧可能な雑音
抑圧方法および装置を実現することができる。さらに加
えて、定常的な雑音も抑圧することができる。これによ
り、本発明を、例えば携帯電話機等における低ビットレ
ート音声コーデックの前段に組み入れることにより、再
生音声の自然性、明瞭性が改善することができるように
なる。
【図面の簡単な説明】
【図1】本発明の雑音抑圧方法を具現化した本発明の雑
音抑圧装置における第1の実施の形態の構成を示す図で
ある。
【図2】本発明にかかる第1の雑音抑圧装置におけるサ
イレン音抑圧情報設定部の詳細な構成を示す図である。
【図3】本発明の雑音抑圧方法を具現化した本発明の雑
音抑圧装置における第2の実施の形態の構成を示す図で
ある。
【図4】サイレン音(救急車のピーポー音)のサウンド
スペクトログラムを示す図である。
【図5】本発明の雑音抑圧方法を具現化した本発明の雑
音抑圧装置における第3の実施の形態の構成を示す図で
ある。
【図6】本発明にかかる第2サイレン音検出部において
実行されるサイレン音検出処理のフローチャートを示す
図である。
【図7】本発明にかかる第2サイレン音検出部において
実行される他のサイレン音検出処理のフローチャートを
示す図である。
【図8】本発明の雑音抑圧方法を具現化した本発明の雑
音抑圧装置における第4の実施の形態の構成を示す図で
ある。
【図9】背景雑音が重畳した音声を雑音抑圧後に音声符
号化処理した再生音声に対するMOS評価結果を示す図で
ある。
【図10】既に提案している雑音抑圧装置の構成を示す
図である。
【図11】図10に示す雑音抑圧装置におけるサイレン
音抑圧情報設定部の構成を示す図である。
【図12】図10に示す雑音抑圧装置におけるSS法によ
る雑音抑圧器の構成を示す図である。
【図13】サイレン音(消防車のウーウー音)基本周波
数の代表パターンを示す図である。
【符号の説明】
11 FFT部、12 サイレン音抑圧情報設定部、13
サイレン音抑圧部、21 FFT部、22 サイレン音
検出部、23 サイレン音抑圧部、24 IFFT部、31
FFT部、32 サイレン音検出部、33 サイレン音
抑圧部、41 長期平均スペクトル振幅更新部、42
サイレン音基本周波数抽出部、43 サイレン音検出
部、44 サイレン音基本周波数代表パターンメモリ、
45 補正・補間部、51 FFT部、52 サイレン音
抑圧情報設定部、53 サイレン音抑圧部、54 サイ
レン音検出部、63 チャネルエネルギ推定部、64
チャネルSNR推定部、65 スペクトル偏差推定部、6
6 ボイスメトリック計算部、67 雑音更新決定部、
68 背景雑音推定部、69 スイッチ、70 チャネ
ルSNR修正部、71 チャネルゲイン計算部、72 乗
算器、73 IFFT部、81 FFT部、82 サイレン音
抑圧情報設定部、83 SS法による雑音抑圧器、91
長期平均スペクトル振幅更新部、92 サイレン音基本
周波数抽出部、93 サイレン音検出部、94 サイレ
ン音基本周波数代表パターンメモリ、95補正部、10
0 定常雑音抑圧部、101 FFT部、102 サイレ
ン音抑圧部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 麓 照夫 神奈川県横須賀市光の丘3番2号 株式会 社ワイ・アール・ピー高機能移動体通信研 究所内 Fターム(参考) 5D015 AA06 CC13 EE05 5K052 AA01 BB35 DD01 DD31 FF32

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 周波数領域変換手段において、音声信号
    に雑音が重畳されている入力信号を予め定められた時間
    長のフレーム毎に時間領域から周波数領域の入力信号に
    変換し、 雑音抑圧情報設定手段において、周波数領域に変換され
    た入力信号から抑圧対象とする雑音の有無を検出すると
    共に、該雑音の基本周波数を抽出し、 該雑音抑圧情報設定手段において抑圧対象とする雑音が
    有りと判定された場合、抑圧手段において、周波数領域
    に変換された入力信号から、抽出された前記基本周波数
    及びその高調波成分を抑圧し、 定常雑音抑圧手段において、音声信号の無い雑音区間で
    定常的な性質を持つ雑音の定常雑音スペクトルを推定
    し、前記抑圧手段から出力された信号から前記定常雑音
    スペクトルを差し引くことにより、定常的な性質を持つ
    雑音を抑圧し、 時間領域変換手段において、該定常的な性質を持つ雑音
    を抑圧した結果を時間領域の信号に変換するようにした
    雑音抑圧方法であって、 前記雑音抑圧情報設定手段は、予め設定されたフレーム
    間隔毎に、前記周波数領域に変換された入力信号に対
    し、抑圧対象として予め設定されている雑音における基
    本周波数の変動周期に対応する時間間隔でスペクトル振
    幅の長期平均値を算出し、前記予め設定されたフレーム
    間隔毎に、前記算出されたスペクトル振幅の長期平均値
    を用いて、予め設定された範囲の候補周波数のうち、そ
    れ自身及びその高調波のスペクトル振幅の総和が最大と
    なる周波数を基本周波数として抽出し、パターンメモリ
    手段に、抑圧対象とされる雑音の基本周波数の代表的な
    変動軌跡の少なくとも1周期分の代表パターンを予め記
    憶しておき、前記予め設定されたフレーム間隔毎に、前
    記パターンメモリから読み出した代表パターンと、前記
    予め設定されたフレーム間隔毎に抽出された基本周波数
    の系列との自乗平均誤差を、該代表パターンを巡回シフ
    トしながら算出し、算出された自乗平均誤差の最小値が
    予め設定された閾値より小さければ、雑音有りと判定す
    ると共に、そうでなければ、雑音無しと判定し、さら
    に、自乗平均誤差が最小となる代表パターンのシフト位
    置情報を出力し、前記予め設定されたフレーム間隔毎
    に、該出力された代表パターンのシフト位置情報に基づ
    いて、前記代表パターンを用いて前記抽出した基本周波
    数を補正し、さらに、前記予め設定されたフレーム間隔
    で基本周波数が抽出されないフレームに対して、該代表
    パターンの値により基本周波数を補間して出力するよう
    にしていることを特徴とする雑音抑圧方法。
  2. 【請求項2】 周波数領域変換手段において、音声信号
    に雑音が重畳されている入力信号を予め定められた時間
    長のフレーム毎に時間領域から周波数領域の入力信号に
    変換し、 サイレン音検出手段において、周波数領域に変換された
    入力信号から抑圧対象とするサイレン音雑音の有無を検
    出し、 該サイレン音検出手段において抑圧対象とするサイレン
    音雑音が有りと判定された場合、抑圧手段において、周
    波数領域に変換された入力信号から、サイレン音に基づ
    いて予め定められた複数の周波数成分を抑圧し、 時間領域変換手段において、前記抑圧手段により抑圧さ
    れた結果を時間領域の信号に変換するようにしたことを
    特徴とする雑音抑圧方法。
  3. 【請求項3】 定常雑音抑圧手段において、前記抑圧手
    段から出力された信号から音声信号の無い雑音区間で定
    常的な性質を持つ雑音の定常雑音スペクトルを推定し
    て、前記抑圧手段から出力された信号から前記定常雑音
    スペクトルを差し引くことにより、定常的な性質を持つ
    雑音を抑圧し、 前記時間領域変換手段において、前記定常雑音抑圧手段
    から出力された信号を時間領域の信号に変換するように
    したことを特徴とする請求項2記載の雑音抑圧方法。
  4. 【請求項4】 前記サイレン音検出手段において、 サイレン音に基づいて予め定められた2つの周波数につ
    いて、それらの周波数でのスペクトル振幅を求め、求め
    られた2つのスペクトル振幅の差の絶対値を該2つのス
    ペクトル振幅の和で正規化し、 該正規化された2つのスペクトル振幅の差の絶対値の移
    動平均値を算出し、 前記予め定められた2つの周波数の内一方のスペクトル
    振幅が他方のそれよりも大きければ、変数に特定の整数
    をセットし、そうでない場合には、該変数に正負の符号
    を逆にした該特定の整数をセットし、 該変数の移動平均値を算出し、 前記正規化された2つのスペクトル振幅の差の絶対値の
    移動平均値が予め設定された第1の閾値より大きく、か
    つ、前記変数の移動平均値の絶対値が予め設定された第
    2の閾値より小さければ、雑音有りと判定すると共に、
    そうでなければ、雑音無しと判定しているすることを特
    徴とする請求項2記載の雑音抑圧方法。
  5. 【請求項5】 前記サイレン音検出手段において、 サイレン音に基づいて予め定められた2つの周波数につ
    いて、それらの周波数でのスペクトル振幅を求め、求め
    られた2つのスペクトル振幅の差の絶対値を該2つのス
    ペクトル振幅の和で正規化し、 該正規化された2つのスペクトル振幅の差の絶対値の移
    動平均値を算出し、 前記予め定められた2つの周波数の内一方のスペクトル
    振幅を他方のそれで減算したスペクトル振幅の差を計算
    し、該スペクトル振幅の差を前記2つのスペクトル振幅
    の和で正規化し、 該正規化されたスペクトル振幅の差の移動平均値を算出
    し、 前記正規化された2つのスペクトル振幅の差の絶対値の
    移動平均値が予め設定された第1の閾値より大きく、か
    つ、前記正規化されたスペクトル振幅の差の移動平均値
    の絶対値が予め設定された第3の閾値より小さければ、
    雑音有りと判定すると共に、そうでなければ、雑音無し
    と判定していることを特徴とする請求項2記載の雑音抑
    圧方法。
  6. 【請求項6】 雑音抑圧情報設定手段において、前記周
    波数領域に変換された入力信号から抑圧対象とする雑音
    の有無を検出すると共に、該雑音の基本周波数を抽出
    し、 該雑音抑圧情報設定手段において抑圧対象とする雑音が
    有りと判定された場合、前記抑圧手段において、周波数
    領域に変換された入力信号から、抽出された前記基本周
    波数及びその高調波成分をも抑圧し、 定常雑音抑圧手段において、音声信号の無い雑音区間で
    定常的な性質を持つ雑音の定常雑音スペクトルを推定
    し、前記抑圧手段から出力された信号から前記定常雑音
    スペクトルを差し引くことにより、定常的な性質を持つ
    雑音を抑圧するようにし、 前記時間領域変換手段において、前記定常雑音抑圧手段
    から出力された信号を時間領域の信号に変換するように
    したことを特徴とする請求項2記載の雑音抑圧方法。
  7. 【請求項7】 音声信号に雑音が重畳されている入力信
    号を予め定められた時間長のフレーム毎に時間領域から
    周波数領域の入力信号に変換する周波数領域変換手段
    と、 周波数領域に変換された入力信号から抑圧対象とする雑
    音の有無を検出すると共に、該雑音の基本周波数を抽出
    する雑音抑圧情報設定手段と、 該雑音抑圧情報設定手段において抑圧対象とする雑音が
    有りと判定された場合、周波数領域に変換された入力信
    号から、抽出された前記基本周波数及びその高調波成分
    を抑圧する抑圧手段と、 音声信号の無い雑音区間で定常的な性質を持つ雑音の定
    常雑音スペクトルを推定し、前記抑圧手段から出力され
    た信号から前記定常雑音スペクトルを差し引くことによ
    り、定常的な性質を持つ雑音を抑圧する定常雑音抑圧手
    段と、 該定常的な性質を持つ雑音を抑圧した結果を時間領域の
    信号に変換するようにした時間領域変換手段とを備え、 前記雑音抑圧情報設定手段は、予め設定されたフレーム
    間隔毎に、前記周波数領域に変換された入力信号に対
    し、抑圧対象として予め設定されている雑音における基
    本周波数の変動周期に対応する時間間隔でスペクトル振
    幅の長期平均値を算出し、前記予め設定されたフレーム
    間隔毎に、前記算出されたスペクトル振幅の長期平均値
    を用いて、予め設定された範囲の候補周波数のうち、そ
    れ自身及びその高調波のスペクトル振幅の総和が最大と
    なる周波数を基本周波数として抽出し、パターンメモリ
    手段に、抑圧対象とされる雑音の基本周波数の代表的な
    変動軌跡の少なくとも1周期分の代表パターンを予め記
    憶しておき、前記予め設定されたフレーム間隔毎に、前
    記パターンメモリから読み出した代表パターンと、前記
    予め設定されたフレーム間隔毎に抽出された基本周波数
    の系列との自乗平均誤差を、該代表パターンを巡回シフ
    トしながら算出し、算出された自乗平均誤差の最小値が
    予め設定された閾値より小さければ、雑音有りと判定す
    ると共に、そうでなければ、雑音無しと判定し、さら
    に、自乗平均誤差が最小となる代表パターンのシフト位
    置情報を出力し、前記予め設定されたフレーム間隔毎
    に、該出力された代表パターンのシフト位置情報に基づ
    いて、前記代表パターンを用いて前記抽出した基本周波
    数を補正し、さらに、前記予め設定されたフレーム間隔
    で基本周波数が抽出されないフレームに対して、該代表
    パターンの値により基本周波数を補間して出力するよう
    にしていることを特徴とする雑音抑圧装置。
  8. 【請求項8】 音声信号に雑音が重畳されている入力信
    号を予め定められた時間長のフレーム毎に時間領域から
    周波数領域の入力信号に変換する周波数領域変換手段
    と、 周波数領域に変換された入力信号から抑圧対象とするサ
    イレン音雑音の有無を検出するサイレン音検出手段と、 該サイレン音検出手段において抑圧対象とするサイレン
    音雑音が有りと判定された場合に、周波数領域に変換さ
    れた入力信号から、サイレン音に基づいて予め定められ
    た複数の周波数成分を抑圧する抑圧手段と、 前記抑圧手段により抑圧された結果を時間領域の信号に
    変換する時間領域変換手段と、 を備えることを特徴とする雑音抑圧装置。
  9. 【請求項9】 前記抑圧手段から出力された信号から音
    声信号の無い雑音区間で定常的な性質を持つ雑音の定常
    雑音スペクトルを推定して、前記抑圧手段から出力され
    た信号から前記定常雑音スペクトルを差し引くことによ
    り、定常的な性質を持つ雑音を抑圧する定常雑音抑圧手
    段を、さらに備え、前記時間領域変換手段において、前
    記定常雑音抑圧手段から出力された信号を時間領域の信
    号に変換するようにしたことを特徴とする請求項8記載
    の雑音抑圧装置。
  10. 【請求項10】 前記サイレン音検出手段において、 サイレン音に基づいて予め定められた2つの周波数につ
    いて、それらの周波数でのスペクトル振幅を求め、求め
    られた2つのスペクトル振幅の差の絶対値を該2つのス
    ペクトル振幅の和で正規化し、 該正規化された2つのスペクトル振幅の差の絶対値の移
    動平均値を算出し、 前記予め定められた2つの周波数の内一方のスペクトル
    振幅が他方のそれよりも大きければ、変数に特定の整数
    をセットし、そうでない場合には、該変数に正負の符号
    を逆にした該特定の整数をセットし、 該変数の移動平均値を算出し、 前記正規化された2つのスペクトル振幅の差の絶対値の
    移動平均値が予め設定された第1の閾値より大きく、か
    つ、前記変数の移動平均値の絶対値が予め設定された第
    2の閾値より小さければ、雑音有りと判定すると共に、
    そうでなければ、雑音無しと判定するようにしているこ
    とを特徴とする請求項8記載の雑音抑圧装置。
  11. 【請求項11】 前記サイレン音検出手段において、 サイレン音に基づいて予め定められた2つの周波数につ
    いて、それらの周波数でのスペクトル振幅を求め、求め
    られた2つのスペクトル振幅の差の絶対値を該2つのス
    ペクトル振幅の和で正規化し、 該正規化された2つのスペクトル振幅の差の絶対値の移
    動平均値を算出し、 前記予め定められた2つの周波数の内一方のスペクトル
    振幅を他方のそれで減算したスペクトル振幅の差を計算
    し、該スペクトル振幅の差を前記2つのスペクトル振幅
    の和で正規化し、 該正規化されたスペクトル振幅の差の移動平均値を算出
    し、 前記正規化された2つのスペクトル振幅の差の絶対値の
    移動平均値が予め設定された第1の閾値より大きく、か
    つ、前記正規化されたスペクトル振幅の差の移動平均値
    の絶対値が予め設定された第3の閾値より小さければ、
    雑音有りと判定すると共に、そうでなければ、雑音無し
    と判定していることを特徴とする請求項8記載の雑音抑
    圧装置。
  12. 【請求項12】 前記周波数領域に変換された入力信号
    から抑圧対象とする雑音の有無を検出すると共に、該雑
    音の基本周波数を抽出する雑音抑圧情報設定手段を備
    え、該雑音抑圧情報設定手段において抑圧対象とする雑
    音が有りと判定された場合に、前記抑圧手段において、
    周波数領域に変換された入力信号から、抽出された前記
    基本周波数及びその高調波成分をも抑圧すると共に、 音声信号の無い雑音区間で定常的な性質を持つ雑音の定
    常雑音スペクトルを推定して、前記抑圧手段から出力さ
    れた信号から前記定常雑音スペクトルを差し引くことに
    より、定常的な性質を持つ雑音を抑圧する定常雑音抑圧
    手段を備え、前記時間領域変換手段において、前記定常
    雑音抑圧手段から出力された信号を時間領域に変換する
    ようにしたことを特徴とする請求項8記載の雑音抑圧装
    置。
JP2001245605A 2001-08-13 2001-08-13 雑音抑圧方法および雑音抑圧装置 Withdrawn JP2003058186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001245605A JP2003058186A (ja) 2001-08-13 2001-08-13 雑音抑圧方法および雑音抑圧装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001245605A JP2003058186A (ja) 2001-08-13 2001-08-13 雑音抑圧方法および雑音抑圧装置

Publications (1)

Publication Number Publication Date
JP2003058186A true JP2003058186A (ja) 2003-02-28

Family

ID=19075321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001245605A Withdrawn JP2003058186A (ja) 2001-08-13 2001-08-13 雑音抑圧方法および雑音抑圧装置

Country Status (1)

Country Link
JP (1) JP2003058186A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309366A (ja) * 2004-03-25 2005-11-04 Nec Corp 信号処理方法および信号処理装置
WO2012098579A1 (ja) * 2011-01-19 2012-07-26 三菱電機株式会社 雑音抑圧装置
DE102007001255B4 (de) * 2006-09-20 2014-01-09 Fujitsu Ltd. Tonsignalverarbeitungsverfahren und -vorrichtung und Computerprogramm
JP2014041292A (ja) * 2012-08-23 2014-03-06 Daihen Corp 溶接システムおよび溶接制御装置
US8768692B2 (en) 2006-09-22 2014-07-01 Fujitsu Limited Speech recognition method, speech recognition apparatus and computer program
CN104078051A (zh) * 2013-03-29 2014-10-01 中兴通讯股份有限公司 一种人声提取方法、系统以及人声音频播放方法及装置
WO2014168021A1 (ja) * 2013-04-11 2014-10-16 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US9384756B2 (en) 2014-03-07 2016-07-05 JVC Kenwood Corporation Cyclic noise reduction for targeted frequency bands
US9911429B2 (en) 2015-08-31 2018-03-06 JVC Kenwood Corporation Noise reduction device, noise reduction method, and noise reduction program
US10020005B2 (en) 2015-06-29 2018-07-10 JVC Kenwood Corporation Noise detection device, noise detection method, and noise detection program

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309366A (ja) * 2004-03-25 2005-11-04 Nec Corp 信号処理方法および信号処理装置
JP4655572B2 (ja) * 2004-03-25 2011-03-23 日本電気株式会社 信号処理方法および信号処理装置、ならびに、ロボット
DE102007001255B4 (de) * 2006-09-20 2014-01-09 Fujitsu Ltd. Tonsignalverarbeitungsverfahren und -vorrichtung und Computerprogramm
US8768692B2 (en) 2006-09-22 2014-07-01 Fujitsu Limited Speech recognition method, speech recognition apparatus and computer program
WO2012098579A1 (ja) * 2011-01-19 2012-07-26 三菱電機株式会社 雑音抑圧装置
JP5265056B2 (ja) * 2011-01-19 2013-08-14 三菱電機株式会社 雑音抑圧装置
US8724828B2 (en) 2011-01-19 2014-05-13 Mitsubishi Electric Corporation Noise suppression device
JP2014041292A (ja) * 2012-08-23 2014-03-06 Daihen Corp 溶接システムおよび溶接制御装置
CN104078051A (zh) * 2013-03-29 2014-10-01 中兴通讯股份有限公司 一种人声提取方法、系统以及人声音频播放方法及装置
WO2014153922A1 (zh) * 2013-03-29 2014-10-02 中兴通讯股份有限公司 一种人声提取方法、系统以及人声音频播放方法及装置
WO2014168021A1 (ja) * 2013-04-11 2014-10-16 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
JPWO2014168021A1 (ja) * 2013-04-11 2017-02-16 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US10741194B2 (en) 2013-04-11 2020-08-11 Nec Corporation Signal processing apparatus, signal processing method, signal processing program
US9384756B2 (en) 2014-03-07 2016-07-05 JVC Kenwood Corporation Cyclic noise reduction for targeted frequency bands
US10020005B2 (en) 2015-06-29 2018-07-10 JVC Kenwood Corporation Noise detection device, noise detection method, and noise detection program
US9911429B2 (en) 2015-08-31 2018-03-06 JVC Kenwood Corporation Noise reduction device, noise reduction method, and noise reduction program

Similar Documents

Publication Publication Date Title
JP3963850B2 (ja) 音声区間検出装置
AU696152B2 (en) Spectral subtraction noise suppression method
JP4163267B2 (ja) 雑音抑圧器及び移動局並びに雑音抑圧方法
JP4520732B2 (ja) 雑音低減装置、および低減方法
JP4440937B2 (ja) 暗騒音存在時の音声を改善するための方法および装置
JP3591068B2 (ja) 音声信号の雑音低減方法
EP1547061B1 (en) Multichannel voice detection in adverse environments
US8655656B2 (en) Method and system for assessing intelligibility of speech represented by a speech signal
US20080235013A1 (en) Method and apparatus for estimating noise by using harmonics of voice signal
JP2002149200A (ja) 音声処理装置及び音声処理方法
JP2008065090A (ja) ノイズサプレス装置
JP4127792B2 (ja) 音声強化デバイス
JPWO2010046954A1 (ja) 雑音抑圧装置および音声復号化装置
JP2003058186A (ja) 雑音抑圧方法および雑音抑圧装置
JP2000330597A (ja) 雑音抑圧装置
CN114005457A (zh) 一种基于幅度估计与相位重构的单通道语音增强方法
JP4006770B2 (ja) ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
KR101886775B1 (ko) Ptt 기반 음성 명료성 향상 장치 및 방법
JP2002258899A (ja) 雑音抑圧方法および雑音抑圧装置
JP5377167B2 (ja) 悲鳴検出装置および悲鳴検出方法
CN111508512A (zh) 语音信号中的摩擦音检测
JP2014021307A (ja) 音声信号復元装置および音声信号復元方法
JP2006126859A (ja) 音声処理装置及び音声処理方法
JP2002341889A (ja) 予測パラメータ分析装置および予測パラメータ分析方法
KR100434538B1 (ko) 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081104