JP5887087B2 - 雑音低減処理装置および雑音低減処理方法 - Google Patents

雑音低減処理装置および雑音低減処理方法 Download PDF

Info

Publication number
JP5887087B2
JP5887087B2 JP2011194333A JP2011194333A JP5887087B2 JP 5887087 B2 JP5887087 B2 JP 5887087B2 JP 2011194333 A JP2011194333 A JP 2011194333A JP 2011194333 A JP2011194333 A JP 2011194333A JP 5887087 B2 JP5887087 B2 JP 5887087B2
Authority
JP
Japan
Prior art keywords
noise
sound
noise reduction
reduction processing
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011194333A
Other languages
English (en)
Other versions
JP2013054319A (ja
Inventor
康貴 田中
康貴 田中
田中 伸一
伸一 田中
学 川▲崎▼
学 川▲崎▼
益巳 谷本
益巳 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SOHGO SECURITY SERVICES CO.,LTD.
Original Assignee
SOHGO SECURITY SERVICES CO.,LTD.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SOHGO SECURITY SERVICES CO.,LTD. filed Critical SOHGO SECURITY SERVICES CO.,LTD.
Priority to JP2011194333A priority Critical patent/JP5887087B2/ja
Publication of JP2013054319A publication Critical patent/JP2013054319A/ja
Application granted granted Critical
Publication of JP5887087B2 publication Critical patent/JP5887087B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、雑音を低減する雑音低減処理装置および雑音低減処理方法に関する。
従来から、雑音環境下において目的の音を取得するために雑音を低減する様々な雑音処理技術が知られている。例えば、スペクトルサブトラクション法(SS法)による雑音処理技術が知られている(特許文献1、非特許文献1参照)。SS法とは、雑音のパワースペクトルを推定し、音声と雑音が混在した入力信号のパワースペクトルから、推定した雑音のパワースペクトルを差し引くことで雑音を低減する手法である。この雑音のパワースペクトルの推定には、いくつかの手法があるが、信号パワーなどを指標として音声入力区間を検出し、その音声入力の直前の信号を用いることが多い。
また、適応フィルタによる雑音処理技術も知られている(非特許文献2、3参照)。適応フィルタによる雑音低減処理とは、パラメータを逐次更新し、出力信号を目標信号に近づけていく機能を持った適応フィルタにより雑音低減を行う手法である。この適応フィルタによる雑音処理技術は、一般に、音声入力信号(音声と雑音が混在する信号)と雑音入力信号(雑音のみ存在する信号)をそれぞれ別のマイクロホン(マイク)で観測して処理を行うものである。
特開平10−97278号公報
S. F. Boll, Suppression of Acoustic Noise in Speech Using Spectral Subtraction, IEEE Trans. ASSP, 27, 2, 113‐120, 1979. B. Widrow et al., Adaptive noise cancelling: Principles and applications, Proceedings of the IEEE 63, 1692‐1716, 1975. 大賀寿郎 山崎芳男 金田豊 共著 「音響システムとディジタル処理」p.124-157 社団法人電子情報通信学会 1995年
しかしながら、上述したような従来の雑音処理技術で十分な雑音低減効果を得るためには、雑音が定常であること、音声入力マイクと雑音入力マイクの位置が既知であること、雑音の到来方向が既知であること、といった条件を満たさなければならないという問題があった。
具体的には、上述のSS法による雑音処理技術では、音声入力時の雑音と推定した雑音が同じである必要があることから、雑音が定常でなければならず、非定常な雑音には適用することができない。しかし、音声認識精度の低下を招く雑音は、常に定常とは限らず非定常であることが多く、音声認識精度を向上させる雑音低減処理には非定常な雑音に対しても適応する手法が必要である。
また、上述の適応フィルタによる雑音処理技術では、音声入力信号と雑音入力信号をそれぞれ別のマイクロホンで観測して処理を行うが、2つの入力信号の位相の同期をとる必要があることから、雑音の到来方向およびマイクロホン間の距離情報が既知でなければならない。しかし、雑音入力マイクを建物内などに設置し、音声入力マイクを発話者が装着した状態で雑音低減を行う場合には、発話者が移動することによりマイクロホン間の距離が変化してしまう。また、マイクロホンの移動や周囲の環境の変化によって雑音到来方向も変化してしまう。そうすると、音声入力信号と雑音入力信号の位相の同期をとることが困難になるため、マイクロホン間の距離や雑音到来方向の変化に依存しない手法が必要である。
本発明は、上記に鑑みてなされたものであって、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られる雑音低減処理装置および雑音低減処理方法を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、所定の範囲内に存在し、抽出対象の音である抽出音と、前記抽出音以外の音である雑音とを含む第1入力信号が入力される第1音入力部と、前記所定の範囲内に存在し、前記雑音を示す第2入力信号が入力される第2音入力部と、前記第1音入力部と前記第2音入力部との距離および音速に基づいて、前記第1音入力部への前記雑音の到達時間と、前記第2音入力部への前記雑音の到達時間との差である到達時間差が最小値から最大値となる区間を算出し、算出した前記区間における前記第2入力信号の平均スペクトルを算出する平均スペクトル算出手段と、前記第1入力信号から、算出された前記平均スペクトルの特性を差し引くことにより前記第1入力信号の前記雑音を低減するフィルタ処理手段と、を備えることを特徴とする。
また、本発明は、所定の範囲内に存在し、抽出対象の音である抽出音と、前記抽出音以外の音である雑音とを含む第1入力信号が入力される第1音入力部と、前記所定の範囲内に存在し、前記雑音を示す第2入力信号が入力される第2音入力部と、を備えた雑音低減処理装置で実行される雑音低減処理方法において、前記第1音入力部への前記雑音の到達時間と、前記第2音入力部への前記雑音の到達時間との差である到達時間差が最小値から最大値となる区間を算出し、算出した前記区間における前記第2入力信号の平均スペクトルを算出する平均スペクトル算出ステップと、前記第1入力信号から、算出された前記平均スペクトルの特性を差し引くことにより前記第1入力信号の前記雑音を低減するフィルタ処理ステップと、を含むことを特徴とする。
本発明によれば、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られるという効果を奏する。
図1は、実施の形態1にかかる雑音低減処理装置の構成を示すブロック図である。 図2は、実施の形態1の音声入力マイクと雑音参照マイクの使用環境の一例を示す説明図である。 図3は、マイク間の最大距離の一例を示す図である。 図4は、平均化区間の概要を示す説明図である。 図5は、平均LPC係数フィルタリングによる雑音低減処理の流れを示すフローチャートである。 図6は、平均LPCスペクトルによる雑音低減処理の流れを示すフローチャートである。 図7は、平均スペクトル包絡による雑音低減処理の流れを示すフローチャートである。 図8は、平均スペクトルによる雑音低減処理の流れを示すフローチャートである。 図9は、雑音低減処理装置による雑音低減処理条件を示す図である。 図10は、雑音低減処理を実施した際の結果を説明するための図である。 図11は、雑音低減処理を実施した際の結果を説明するための図である。 図12は、雑音低減処理を実施した際の結果を説明するための図である。 図13は、雑音低減処理を実施した際の結果を説明するための図である。 図14は、雑音低減処理を実施した際の結果を説明するための図である。 図15は、雑音低減処理を実施した際の結果を説明するための図である。 図16は、雑音低減処理を実施した際の結果を説明するための図である。 図17は、雑音低減処理を実施した際の結果を説明するための図である。
以下に添付図面を参照して、この発明にかかる雑音低減処理装置および雑音低減処理方法の最良な実施の形態を詳細に説明する。
(実施の形態1)
図1は、実施の形態1にかかる雑音低減処理装置の構成を示すブロック図である。図1に示すように、雑音低減処理装置100は、音声入力マイク10と、雑音参照マイク20と、受信部101と、AD変換部102と、平均スペクトルフィルタ算出部103と、フィルタ処理部104と、出力部105と、記憶部110とを主に備えている。
音声入力マイク10は、予め定められた移動範囲内を移動する発話者に装着されており、明瞭にすべき抽出対象の音である発話者の音声や雑音を集音するワイヤレスマイクロホン(無線式マイク)である。ここで、雑音とは、抽出対象の音以外の音であって、本実施の形態では、発話者の音声以外の音である。音声入力マイク10は、発話者が所定の移動範囲内を移動する場合には、常にその移動範囲内に存在し、発話者の音声と周囲の雑音とを含む音声入力信号が入力される。音声入力信号とは、発話者が音声入力を行った信号であり、周囲の雑音が混在している。
雑音参照マイク20は、上述した所定の移動範囲内における所定位置(例えば天井)に固定して設置されており、周囲の雑音や音声を集音するマイクロホン(有線式マイク)である。雑音参照マイク20は、音声に付加された雑音を含む信号である雑音参照信号が入力される。
また、音声入力マイク10は、雑音を低減して抽出する音声(発話者の音声)の強度が、雑音参照マイク20で集音される音声(雑音を除く)の強度よりも大きい強度で入力されることが、音声入力マイク10と雑音参照マイク20の設置条件となっている。すなわち、雑音参照マイク20と発話者(音声の発せられる音源)との距離が、音声入力マイク10と発話者との距離より相対的に長く(遠く)なる状況であることが好ましい。
なお、本実施の形態では、音声入力マイク10が発話者に装着されているが、これに限定されることなく、所定の移動範囲内であれば一定の位置に固定して設置されてもよい。また、本実施の形態では、雑音参照マイク20が所定位置に固定して設置されているが、これに限定されることなく、所定の移動範囲内であって、かつ発話者の音声の強度が、雑音参照マイク20で集音される音声の強度よりも大きい強度で音声入力マイク10に入力されれば、固定して設置されていなくともよい。また、本実施の形態では、音声入力マイク10を無線式とし、雑音参照マイク20を有線式としているが、これらのマイクは適用環境により有線式、無線式のいずれも使用可能である。
図2は、実施の形態1の音声入力マイクと雑音参照マイクの使用環境の一例を示す説明図である。本実施の形態の雑音低減処理装置100は、雑音の強度が高い環境下において、図2に示すように、予め設定した移動範囲A内を雑音低減処理装置100の使用者(発話者30)が移動する状態で利用する。
雑音の強度が高い環境下とは、例えば、工場やコンビニエンスストア、小売店など様々な雑音(機械音や店内BGM、屋外からの騒音など)が存在する場所である。また、移動範囲とは、例えば、工場内や小売店のカウンター内などが想定される。図2では、雑音参照マイク20を天井などの所定の場所に固定して設置する。そして、音声入力マイク10を発話者30が装着し、予め設定した移動範囲Aを発話者30が移動する環境での適用を示している。
音声入力マイク10と雑音参照マイク20の設置条件としては、上述したように、音声入力マイク10で集音される発話者30の音声の強度が、雑音参照マイク20で集音される音声の強度よりも大きい強度で入力される位置に各マイクが設置されていればよい。この設置条件を満たすためには、例えば図2のように、雑音参照マイク20を移動範囲Aの天井に固定して設置するなど、音声入力マイク10と発話者30の距離よりも雑音参照マイク20と発話者30の距離を遠くすればよい。
これら使用環境では、雑音の種類(定常的な雑音や非定常な雑音など)や到来方向が未知であり、また発話者30の移動による雑音到来方向の変化や、雑音到達時間差の変化が考えられる。本実施の形態の雑音低減処理装置100は、このような使用環境においても平均的に雑音を低減する効果が得られるものである。
図1に戻り、受信部101は、音声入力マイク10で集音された音声入力信号を受信するものである。AD変換部102は、音声入力マイク10から入力された音声入力信号および雑音参照マイク20から入力された雑音参照信号をディジタル音に変換し出力する。
平均スペクトルフィルタ算出部103は、音声入力マイク10と雑音参照マイク20との距離および音速に基づいて、音声入力マイク10への雑音の到達時間と、雑音参照マイク20への雑音の到達時間の差である到達時間差が最小値から最大値となる区間である平均化区間を算出し、算出した平均化区間における雑音参照信号の平均スペクトルを算出するものである。
以下では、平均化区間について詳細に説明する。「平均化区間」とは、雑音が音声入力マイク10へ到達する到達時間と、雑音が雑音参照マイク20へ到達する到達時間との差である到達時間差が最小値0[sec]から、最大値±dmax/c[sec]の区間のことである。「dmax[m]」とは、マイク間(雑音参照マイク20と音声入力マイク10との間)の最大距離であり、「c[m/sec]」は音速である。
ここで、マイク間の最大距離「dmax[m]」について説明する。平均化区間の算出に用いるマイク間の最大距離dmax[m]は、雑音参照マイク20を基準として、移動範囲内で発話者に装着された音声入力マイク10が最も遠くなる位置との距離である。図3は、マイク間の最大距離の一例を示す図である。
例えば、図3に示すように、雑音参照マイク20が移動範囲Aの所定位置に固定されて設置され、移動範囲A内を音声入力マイク10を装着した発話者が移動する場合、雑音参照マイク20から最も遠い位置(図3では音声入力マイク10の位置)までの距離が最大距離である。
この2つのマイク(雑音参照マイク20と音声入力マイク10)が最大距離の位置にあり、かつ2つのマイクを結んだ直線の延長線上に雑音の発生源である雑音源があるとき、雑音の到達時間差|dmax/c|[sec]は最大となる。なお、図3は、平面で説明しているが、3次元でも同様に考えることができる。
従って、音声入力マイク10を基準とした場合の雑音参照マイク20に入力される雑音参照信号の平均化区間は、−dmax/c〜dmax/c[sec]となる。なお、図3に示すように、移動範囲Aにおける最大距離dmaxに基づいて平均化区間を算出しているが、その結果、雑音参照マイク20を中心とし、雑音参照マイク20と音声入力マイク10との最大距離dmaxを半径とした円で囲まれる範囲Bが平均化区間の対象となる。そして、音声入力信号に混在している雑音は、必ずこの平均化区間内に含まれることになる。
図4は、平均化区間の概要を示す説明図である。図4に示すように、音声入力マイク10は、発話者30の音声と、例えば車40の雑音とを含む音声入力信号が入力される。また、雑音参照マイク20は、車40の雑音を含む雑音参照信号が入力される。そして、音声入力マイク10と雑音参照マイク20との距離は、0≦d≦dmaxとなる。
図4では、右側に各マイクで採取された音響信号(音声入力信号と雑音参照信号)の波形が示されている。この波形は、横軸が音響信号の検出時間、縦軸が音響信号の振幅を示し、上が音声入力信号、下が雑音参照信号を示している。音声入力マイク10に入力された音声入力信号は、音声入力マイク10を装着した発話者30の音声が入力された場合には、音声と雑音が混在しているため音声の波形が不明瞭となる(上の波形参照)。そして、この音声が入力された波形に混在する雑音は、平均化区間内における雑音参照信号の中に必ず含まれていることになる(下の波形参照)。
図1に戻り、フィルタ処理部104は、音声入力マイク10に入力された音声入力信号から、平均スペクトルフィルタ算出部103により算出された平均スペクトルの特性を差し引くことで、音声入力信号の雑音を低減した信号である音声予測信号を算出するものである。
このように、本実施の形態の雑音低減処理装置100は、平均化区間(−dmax/c〜dmax/c[sec]の区間)における雑音参照信号の平均スペクトルを求め、その特性を音声入力信号から差し引くことで雑音を低減している。具体的な雑音低減処理方法は複数あるが、本実施の形態では、平均LPC係数フィルタリングによる雑音低減処理を行っている。雑音低減処理の詳細は処理の流れに沿って後述する(図5参照)。
出力部105は、フィルタ処理部104により算出された音声予測信号を出力するものである。記憶部110は、音声入力信号、雑音参照信号等の各処理で必要な信号等のデータを保存するHDD(Hard Disk Drive)やメモリ等の記憶媒体である。
次に、雑音参照信号の平均スペクトルを求め、その特性から音声入力信号を差し引く方法(雑音低減処理方法)の具体的な説明を行う。以下では、雑音低減処理方法の一例である、平均LPC係数フィルタリングによる雑音低減処理について説明する。なお、本実施の形態で説明した方法に限定されることなく、その他の周波数特徴抽出手法やフィルタリング手法を用いてもよく、その場合でも同様の効果が得られる。
平均LPC係数フィルタリングによる雑音低減処理では、まず、雑音参照信号から平均化区間内のLPC係数を算出し、平均LPC係数を算出する。そして、音声入力信号を対象として、算出された平均LPC係数によるフィルタリングを算出することにより、音声入力信号から平均スペクトルの特性を差し引き、雑音が低減された音声予測信号を算出する。図5は、平均LPC係数フィルタリングによる雑音低減処理の流れを示すフローチャートである。
まず、平均LPC係数フィルタリングによる雑音低減処理の詳細説明の前提として、平均化区間について説明する。音声入力信号x(t)および雑音参照信号y(t)は、以下の(式1−1)(式1−2)で表される。s(t):音声信号、n(t):雑音信号、τ:雑音信号到達の遅れ(進み)とする。
ここで、雑音信号到達の遅れ(進み)τは、−dmax/c≦τ≦dmax/c[sec]を満足するものとする。そして、T=dmax/cとおくと、雑音参照信号の平均化区間は、τ±Tとなる。
図5に戻り、まず、音声入力マイク10から音声入力信号を受信し、雑音参照マイク20から雑音参照信号を受信すると(ステップS10)、AD変換部102は、それらの信号をディジタル音に変換する。
次に、平均スペクトルフィルタ算出部103は、雑音参照信号からLPC係数を算出する(ステップS11)。そして、平均スペクトルフィルタ算出部103は、平均化区間内のLPC係数を算出したか否かを判断する(ステップS12)。平均化区間内のLPC係数を算出していない場合(ステップS12:No)、ステップS11に戻って処理を繰り返す。
一方、平均化区間内のLPC係数を算出した場合(ステップS12:Yes)、平均スペクトルフィルタ算出部103は、平均LPC係数を算出する(ステップS13)。具体的には、雑音参照信号y(t)から次数PのLPC係数Cを算出するフレーム長をL、フレームシフトをmとし、平均回数をNとすると、平均化区間内におけるLPC係数の平均化演算は(式2)のように表される。従って、(式2)によって、平均LPC係数Cを算出する。
次に、フィルタ処理部104は、算出された平均LPC係数により、フィルタリング信号を算出し(ステップS14)、雑音低減処理された信号である音声予測信号を得る。具体的には、音声入力信号x(t)を対象として、求められた平均LPC係数Cによるフィルタリングにより算出される信号は、(式3)のように表され、その信号は音声予測信号となる。
そして、出力部105は、算出された音声予測信号を出力する(ステップS15)。
このように、本実施の形態の雑音低減処理装置では、音声入力マイク10と雑音参照マイク20との距離および音速に基づいて、音声入力マイク10への雑音の到達時間と、雑音参照マイク20への雑音の到達時間との差である到達時間差が最小値から最大値となる平均化区間を算出し、算出した平均化区間における雑音参照信号の平均スペクトルを求め、その特性を音声入力信号から差し引くことで音声入力信号の雑音を低減している。このため、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られる。
(実施の形態2)
実施の形態1の雑音低減処理装置では、雑音低減処理方法として、平均LPC係数フィルタリングによる雑音低減処理を用いていた。これに対し、本実施の形態では、平均LPCスペクトルによる雑音低減処理を用いた場合について説明する。
ここで、雑音低減処理装置の全体構成、使用環境、平均化区間、音声入力マイクと雑音参照マイクの最大距離については、実施の形態1と同様であるため説明を省略する。
次に、雑音参照信号の平均スペクトルを求め、その特性から音声入力信号を差し引く方法(雑音低減処理方法)の具体的な説明を行う。以下では、雑音低減処理方法の一例である、平均LPCスペクトルによる雑音低減処理について説明する。
平均LPCスペクトルによる雑音低減処理では、まず、雑音参照信号から平均化区間内のLPC係数を算出し、平均LPC係数を算出する。次に、平均LPC係数からスペクトル包絡を算出し、算出したスペクトル包絡から逆スペクトル特性を持ったフィルタを作成する。そして、このフィルタを音声入力信号に掛ける(乗ずる)ことにより、音声入力信号から平均スペクトルの特性を差し引き、音声予測信号を算出する。
図6は、平均LPCスペクトルによる雑音低減処理の流れを示すフローチャートである。なお、音声入力信号x(t)、雑音参照信号y(t)や平均化区間τ±Tについては、実施の形態1と同様であるため、説明を省略する。
まず、音声入力マイク10から音声入力信号を受信し、雑音参照マイク20から雑音参照信号を受信すると(ステップS20)、AD変換部102は、それらの信号をディジタル音に変換する。
次に、平均スペクトルフィルタ算出部103は、雑音参照信号からLPC係数を算出する(ステップS21)。そして、平均スペクトルフィルタ算出部103は、平均化区間内のLPC係数を算出したか否かを判断する(ステップS22)。平均化区間内のLPC係数を算出していない場合(ステップS22:No)、ステップS21に戻って処理を繰り返す。
一方、平均化区間内のLPC係数を算出した場合(ステップS22:Yes)、平均スペクトルフィルタ算出部103は、平均LPC係数を算出し(ステップS23)、スペクトル包絡を算出する(ステップS24)。具体的には、(式4)によって、雑音参照信号y(t)から平均LPC係数Cを算出する。
そして、算出された平均LPC係数Cから(式5)によって、スペクトル包絡Y(ω)を算出する。
次に、平均スペクトルフィルタ算出部103は、算出されたスペクトル包絡から、FFT逆変換を行い(ステップS25)、フィルタを作成する(ステップS26)。具体的には、(式5)によって求められたスペクトル包絡Y(ω)から(式6)によりFFT逆変換を行う。
そして、(式7)によって、逆スペクトル特性を持ったフィルタw(l)を作成する。
次に、フィルタ処理部104は、作成されたフィルタにより、フィルタ処理を行い(ステップS27)、雑音低減処理された信号である音声予測信号を得る。具体的には、(式8)に示すように、フィルタw(l)を音声入力信号x(t)に掛ける(乗ずる)ことによって、音声予測信号を得る。
そして、出力部105は、算出された音声予測信号を出力する(ステップS28)。
このように、本実施の形態の雑音低減処理装置では、音声入力マイク10と雑音参照マイク20との距離および音速に基づいて、音声入力マイク10への雑音の到達時間と、雑音参照マイク20への雑音の到達時間との差である到達時間差が最小値から最大値となる平均化区間を算出し、算出した平均化区間における雑音参照信号の平均スペクトルを求め、その特性を音声入力信号から差し引くことで音声入力信号の雑音を低減している。このため、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られる。
(実施の形態3)
実施の形態1の雑音低減処理装置では、雑音低減処理方法として、平均LPC係数フィルタリングによる雑音低減処理を用いていた。これに対し、本実施の形態では、平均スペクトル包絡による雑音低減処理を用いた場合について説明する。
ここで、雑音低減処理装置の全体構成、使用環境、平均化区間、音声入力マイクと雑音参照マイクの最大距離については、実施の形態1と同様であるため説明を省略する。
次に、雑音参照信号の平均スペクトルを求め、その特性から音声入力信号を差し引く方法(雑音低減処理方法)の具体的な説明を行う。以下では、雑音低減処理方法の一例である、平均スペクトル包絡による雑音低減処理について説明する。
平均スペクトル包絡による雑音低減処理では、まず、雑音参照信号からLPC係数を算出する。そして、算出されたLPC係数を元にスペクトル包絡を算出し、平均スペクトル包絡を算出する。次に、算出された平均スペクトル包絡から逆スペクトル特性を持ったフィルタを作成する。そして、このフィルタを音声入力信号に掛ける(乗ずる)ことにより、音声入力信号から平均スペクトルの特性を差し引き、音声予測信号を算出する。
図7は、平均スペクトル包絡による雑音低減処理の流れを示すフローチャートである。なお、音声入力信号x(t)、雑音参照信号y(t)や平均化区間τ±Tについては、実施の形態1と同様であるため、説明を省略する。
まず、音声入力マイク10から音声入力信号を受信し、雑音参照マイク20から雑音参照信号を受信すると(ステップS30)、AD変換部102は、それらの信号をディジタル音に変換する。
次に、平均スペクトルフィルタ算出部103は、雑音参照信号からLPC係数を算出し(ステップS31)、スペクトル包絡を算出する(ステップS32)。次に、平均スペクトルフィルタ算出部103は、平均化区間内のLPC係数を算出したか否かを判断する(ステップS33)。平均化区間内のLPC係数を算出していない場合(ステップS33:No)、ステップS31に戻って処理を繰り返す。
一方、平均化区間内のLPC係数を算出した場合(ステップS33:Yes)、平均スペクトルフィルタ算出部103は、スペクトル包絡から平均スペクトル包絡を算出する(ステップS34)。具体的には、フレーム長をL、フレームシフトをmとし、平均回数をNとすると、雑音参照信号y(t)から、次数PのLPC係数Ci,jを元にスペクトル包絡を求めることができ、平均化区間内におけるスペクトル包絡の平均化演算は(式9)のように表される。従って、(式9)によって、平均スペクトル包絡F(ω)を算出する。
次に、平均スペクトルフィルタ算出部103は、算出された平均スペクトル包絡から、FFT逆変換を行い(ステップS35)、フィルタを作成する(ステップS36)。具体的には、(式9)によって求められた平均スペクトル包絡F(ω)から、(式10)によりFFT逆変換を行う。
そして、(式11)によって、逆スペクトル特性を持ったフィルタw(l)を作成する。
次に、フィルタ処理部104は、作成されたフィルタにより、フィルタ処理を行い(ステップS37)、雑音低減処理された信号である音声予測信号を得る。具体的には、(式12)に示すように、フィルタw(l)を音声入力信号x(t)に掛ける(乗ずる)ことによって、音声予測信号を得る。
そして、出力部105は、算出された音声予測信号を出力する(ステップS38)。
このように、本実施の形態の雑音低減処理装置では、音声入力マイク10と雑音参照マイク20との距離および音速に基づいて、音声入力マイク10への雑音の到達時間と、雑音参照マイク20への雑音の到達時間との差である到達時間差が最小値から最大値となる平均化区間を算出し、算出した平均化区間における雑音参照信号の平均スペクトルを求め、その特性を音声入力信号から差し引くことで音声入力信号の雑音を低減している。このため、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られる。
(実施の形態4)
実施の形態1の雑音低減処理装置では、雑音低減処理方法として、平均LPC係数フィルタリングによる雑音低減処理を用いていた。これに対し、本実施の形態では、平均スペクトルによる雑音低減処理を用いた場合について説明する。
ここで、雑音低減処理装置の全体構成、使用環境、平均化区間、音声入力マイクと雑音参照マイクの最大距離については、実施の形態1と同様であるため説明を省略する。
次に、雑音参照信号の平均スペクトルを求め、その特性から音声入力信号を差し引く方法(雑音低減処理方法)の具体的な説明を行う。以下では、雑音低減処理方法の一例である、平均スペクトルによる雑音低減処理について説明する。
平均スペクトルによる雑音低減処理では、まず、平均化区間内についてFFT処理を行い、雑音参照信号から平均スペクトルを算出する。次に、算出した平均スペクトルから逆スペクトル特性を持ったフィルタを作成する。そして、このフィルタを音声力信号に掛ける(乗ずる)ことにより、音声入力信号から平均スペクトルの特性を差し引き、音声予測信号を算出する。
図8は、平均スペクトルによる雑音低減処理の流れを示すフローチャートである。なお、音声入力信号x(t)、雑音参照信号y(t)や平均化区間τ±Tについては、実施の形態1と同様であるため、説明を省略する。
まず、音声入力マイク10から音声入力信号を受信し、雑音参照マイク20から雑音参照信号を受信すると(ステップS40)、AD変換部102は、それらの信号をディジタル音に変換する。
次に、平均スペクトルフィルタ算出部103は、FFT処理を行う(ステップS41)。そして、平均スペクトルフィルタ算出部103は、平均化区間についてFFT処理を行ったか否かを判断する(ステップS42)。平均化区間についてFFT処理を行っていない場合(ステップS42:No)、ステップS41に戻って処理を繰り返す。
一方、平均化区間についてFFT処理を行った場合(ステップS42:Yes)、平均スペクトルフィルタ算出部103は、平均スペクトルを算出する(ステップS43)。具体的には、雑音参照信号y(t)から、ポイント数PのスペクトルY(ω)を求めるフレーム長をL、フレームシフトをmとし、平均回数をNとすると、平均化区間内におけるスペクトルの平均化演算は(式13)のように表される。従って、(式13)によって、平均スペクトルF(ω)を算出する。
次に、平均スペクトルフィルタ算出部103は、算出された平均スペクトルにより、FFT逆変換を行い(ステップS44)、フィルタを作成する(ステップS45)。具体的には、(式13)によって求められた平均スペクトルF(ω)から、(式14)によってFFT逆変換を行う。
そして、(式15)によって、逆スペクトル特性を持ったフィルタW(l)を作成する。
次に、フィルタ処理部104は、作成されたフィルタにより、フィルタ処理を行い(ステップS46)、雑音低減処理された信号である音声予測信号を得る。具体的には、(式16)に示すように、フィルタw(l)を音声入力信号x(t)に掛ける(乗ずる)ことによって、音声予測信号を得る。
そして、出力部105は、算出された音声予測信号を出力する(ステップS47)。
このように、本実施の形態の雑音低減処理装置では、音声入力マイク10と雑音参照マイク20との距離および音速に基づいて、音声入力マイク10への雑音の到達時間と、雑音参照マイク20への雑音の到達時間との差である到達時間差が最小値から最大値となる平均化区間を算出し、算出した平均化区間における雑音参照信号の平均スペクトルを求め、その特性を音声入力信号から差し引くことで音声入力信号の雑音を低減している。このため、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られる。
次に、実施の形態4の雑音低減処理装置による雑音低減処理を実施した際の結果(雑音処理実験の結果)を、図を参照して説明する。図9は、雑音低減処理装置による雑音低減処理条件を示す図である。図9では、雑音処理実験を行うためのパラメータを示している。ここでは、音声入力信号に雑音参照信号をSNR=0dBで付加して雑音処理実験を行った。また、マイク間の距離の変化による雑音低減の精度について評価するために、マイク間距離を3種類で雑音処理実験を行った。
図9に示すように、雑音低減処理条件は、まず、音声データは、女性が天気概況として「トコロニヨッテワニワカアメガフルデショー」と発声した音声である。雑音データは、マーケット内の騒音である。この雑音データの信号には、定常、非定常な騒音の他に女性客の声が含まれている。マイク(音声入力マイクと雑音参照マイク)間距離(d)は、0m、10m、−10mである。音声+雑音データのSNR(音声入力信号と雑音参照信号の比)は、0dBである。量子化精度は、16kHz、16bitである。分析窓は、ハミング窓である。平均化処理フレーム長(L)は、1024point(64msec)である。そして、平均化処理フレームシフト(m)は、512point(32msec)である。
図10〜17は、雑音低減処理を実施した際の結果を説明するための図である。各図における上図は音響信号の波形であり、下図は波形のスペクトログラム(白から黒でパワーの強さを表している)である。図10は、雑音が付加されていない音声を示している。すなわち、この場合は、女性の発した音声である。図11は、付加した雑音である雑音参照信号を示している。すなわち、この場合は、マーケット内の騒音である。
図12、14、16は、雑音参照信号を基準とした、それぞれのマイク間距離に相当する時間差で雑音を付加した音響信号の波形、およびスペクトログラムである。すなわち、図12は、2つのマイク(音声入力マイクと雑音参照マイク)間の距離が0mのときの音声入力信号を示している。図14は、マイク間の距離が10mのときの音声入力信号を示している。この場合は、雑音が雑音参照マイクより先に音声入力マイクに入力された場合である。図16は、マイク間の距離が−10mのときの音声入力信号を示している。この場合は、雑音が雑音参照マイクより後に音声入力マイクに入力された場合である。
図13、15、17は、平均スペクトルフィルタによって雑音低減処理を行った結果である。すなわち、図13は、マイク間の距離が0mのときの雑音低減処理の結果を示している。図15は、マイク間の距離が10mのときの雑音低減処理の結果を示している。図17は、マイク間の距離が−10mのときの雑音低減処理の結果を示している。
マイク間の距離が異なるそれぞれの図面において、雑音低減処理前(図12、14、16)と、雑音低減処理後(図13、15、17)の音響信号の波形およびスペクトログラムを比較すると、マイク間の距離や雑音の種類に関わらず、雑音を低減して音声を明瞭にしているという結果が示された。従って、本実施の形態の雑音低減処理装置により雑音低減処理を行った場合、非定常な雑音に対しても有効であり、かつマイクロホンの設置位置や雑音到来方向が既知でなくとも雑音低減効果が得られるということが示された。
10 音声入力マイク
20 雑音参照マイク
30 発話者
40 車
100 雑音低減処理装置
101 受信部
102 AD変換部
103 平均スペクトルフィルタ算出部
104 フィルタ処理部
105 出力部
110 記憶部

Claims (6)

  1. 所定の範囲内に存在し、抽出対象の音である抽出音と、前記抽出音以外の音である雑音とを含む第1入力信号が入力される第1音入力部と、
    前記所定の範囲内に存在し、前記雑音を示す第2入力信号が入力される第2音入力部と、
    前記第1音入力部と前記第2音入力部との距離および音速に基づいて、前記第1音入力部への前記雑音の到達時間と、前記第2音入力部への前記雑音の到達時間との差である到達時間差が最小値から最大値となる区間を算出し、算出した前記区間における前記第2入力信号の平均スペクトルを算出する平均スペクトル算出手段と、
    前記第1入力信号から、算出された前記平均スペクトルの特性を差し引くことにより前記第1入力信号の前記雑音を低減するフィルタ処理手段と、
    を備えることを特徴とする雑音低減処理装置。
  2. 前記第1音入力部は、前記抽出音の強度が、前記第2音入力部よりも大きい強度で入力されることを特徴とする請求項1に記載の雑音低減処理装置。
  3. 前記第2音入力部は、前記所定の範囲内における天井に設置されていることを特徴とする請求項1または2に記載の雑音低減処理装置。
  4. 前記第1音入力部は、前記所定の範囲内を移動する発話者に装着されていることを特徴とする請求項1〜3のいずれか一つに記載の雑音低減処理装置。
  5. 前記フィルタ処理手段は、算出された前記平均スペクトルから逆スペクトル特性を有するフィルタを作成し、作成した前記フィルタを前記第1入力信号に乗ずることにより、前記第1入力信号から前記平均スペクトルの特性を差し引くことを特徴とする請求項1〜4のいずれか一つに記載の雑音低減処理装置。
  6. 所定の範囲内に存在し、抽出対象の音である抽出音と、前記抽出音以外の音である雑音とを含む第1入力信号が入力される第1音入力部と、前記所定の範囲内に存在し、前記雑音を示す第2入力信号が入力される第2音入力部と、を備えた雑音低減処理装置で実行される雑音低減処理方法において、
    前記第1音入力部と前記第2音入力部との距離および音速に基づいて、前記第1音入力部への前記雑音の到達時間と、前記第2音入力部への前記雑音の到達時間との差である到達時間差が最小値から最大値となる区間を算出し、算出した前記区間における前記第2入力信号の平均スペクトルを算出する平均スペクトル算出ステップと、
    前記第1入力信号から、算出された前記平均スペクトルの特性を差し引くことにより前記第1入力信号の前記雑音を低減するフィルタ処理ステップと、
    を含むことを特徴とする雑音低減処理方法。
JP2011194333A 2011-09-06 2011-09-06 雑音低減処理装置および雑音低減処理方法 Active JP5887087B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011194333A JP5887087B2 (ja) 2011-09-06 2011-09-06 雑音低減処理装置および雑音低減処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011194333A JP5887087B2 (ja) 2011-09-06 2011-09-06 雑音低減処理装置および雑音低減処理方法

Publications (2)

Publication Number Publication Date
JP2013054319A JP2013054319A (ja) 2013-03-21
JP5887087B2 true JP5887087B2 (ja) 2016-03-16

Family

ID=48131328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011194333A Active JP5887087B2 (ja) 2011-09-06 2011-09-06 雑音低減処理装置および雑音低減処理方法

Country Status (1)

Country Link
JP (1) JP5887087B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022028850A1 (de) 2020-08-03 2022-02-10 Basf Se Zinkhaltiger katalysator umfassend mindestens einen aromatischen substituenten
WO2022128791A1 (en) 2020-12-14 2022-06-23 Basf Se Bismuth-containing catalyst comprising at least one aromatic substituent

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53140079A (en) * 1977-04-15 1978-12-06 Nippon Hoso Kyokai <Nhk> Automatic recognizing system for moving sound source
JP4006770B2 (ja) * 1996-11-21 2007-11-14 松下電器産業株式会社 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022028850A1 (de) 2020-08-03 2022-02-10 Basf Se Zinkhaltiger katalysator umfassend mindestens einen aromatischen substituenten
WO2022128791A1 (en) 2020-12-14 2022-06-23 Basf Se Bismuth-containing catalyst comprising at least one aromatic substituent

Also Published As

Publication number Publication date
JP2013054319A (ja) 2013-03-21

Similar Documents

Publication Publication Date Title
JP5870476B2 (ja) 雑音推定装置、雑音推定方法および雑音推定プログラム
US8775173B2 (en) Erroneous detection determination device, erroneous detection determination method, and storage medium storing erroneous detection determination program
EP2643834B1 (en) Device and method for producing an audio signal
JP4532576B2 (ja) 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム
JP5387459B2 (ja) 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
US7957964B2 (en) Apparatus and methods for noise suppression in sound signals
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP6156012B2 (ja) 音声処理装置及び音声処理用コンピュータプログラム
JP5156043B2 (ja) 音声判別装置
KR101260938B1 (ko) 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
CN103109320A (zh) 噪声抑制装置
JP2011033717A (ja) 雑音抑圧装置
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JP3909709B2 (ja) 雑音除去装置、方法、及びプログラム
KR101317813B1 (ko) 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
KR100639968B1 (ko) 음성 인식 장치 및 그 방법
JP5887087B2 (ja) 雑音低減処理装置および雑音低減処理方法
KR101335417B1 (ko) 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
Nelke Wind noise reduction: signal processing concepts
JP5982900B2 (ja) 雑音抑制装置、マイクロホンアレイ装置、雑音抑制方法、及びプログラム
JP6794887B2 (ja) 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法
WO2020110228A1 (ja) 情報処理装置、プログラム及び情報処理方法
US9875755B2 (en) Voice enhancement device and voice enhancement method
JP3310225B2 (ja) 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置
JP5327735B2 (ja) 信号再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150728

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5887087

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250