JP2016039399A

JP2016039399A - 突発音抑圧装置、方法及びプログラム

Info

Publication number: JP2016039399A
Application number: JP2014159603A
Authority: JP
Inventors: 克之高橋; Katsuyuki Takahashi
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2014-08-05
Filing date: 2014-08-05
Publication date: 2016-03-22

Abstract

【課題】入力音信号に含まれている突発音に瞬時に追従して抑圧し、音質への影響を最低限にできる突発音抑圧装置を提供する。
【解決手段】本発明の突発音抑圧装置は、例えば、車両が高速道路や橋に設けられているジョイント上を通過する際に生じる突発音成分の抑圧を意図している。そして、少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、装置正面に死角を有する周波数毎の正面抑圧信号を生成する第１処理部と、生成された正面抑圧信号のレベルの大小関係と逆の大小関係を有する抑圧係数を周波数毎に形成し、その抑圧係数を適用して、入力音信号に含まれている突発音を周波数毎に抑圧する第２処理部とを有することを特徴とする。
【選択図】図１

Description

本発明は突発音抑圧装置、方法及びプログラムに関し、例えば、携帯型音声通信端末（スマートフォンや携帯電話等）やカーナビゲーション装置等の車両内で使用可能な音声処理装置に適用し得るものである。

近年、ハンズフリー通話機能や音声認識機能を有するカーナビゲーション装置や携帯型音声通信端末の普及により、自動車や電車等の車内で通話したり音声認識機能を用いたりする機会が増えてきている。

車内での使用では、走行雑音による通話音質の低下や音声認識率の低下が課題になっている。特に、高速道路や橋に設けられているジョイントの上を通過する際に生じる突発音に対する処理が課題となっている。突発音は、突発的に発生する大振幅の雑音であり、通話音質や音声認識性能に及ぼす影響が大きいため、効果的に抑圧する方法が求められている。

従来の雑音抑圧方法として、特許文献１に記載されているウィーナーフィルタ法（以下、ＷＦと呼ぶ）がある。

特開２０１３−６１４２１号公報

ＷＦは、背景雑音が瞬間的な変動はせずに長期的には特性が一定であることを前提としているため、瞬間的に生じる突発音の抑圧は困難であった。また、自動車における突発音は、ジョイントの上を前輪が通過するときと後輪が通過するときの２回立て続けに生じており、このことも、抑圧の困難さを高めている。さらに、突発音を抑圧するとしても、強力な抑圧処理を施さなければ十分な抑圧効果が得られないため、抑圧処理後に目的音に歪みが生じ、聴感を悪化させたり、音声認識性能を低下させるという副作用が生じてしまう。

そのため、入力音信号に含まれている突発音に瞬時に追従でき、しかも、音質への影響を最低限にとどめることができる突発音抑圧装置、方法及びプログラムが望まれている。

第１の本発明の突発音抑圧装置は、（１）少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、（２）生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段とを有することを特徴とする。

第２の本発明の突発音抑圧方法は、音源方位抑圧信号生成手段及び突発音抑圧手段を備え、（１）上記音源方位抑圧信号生成手段が、少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成し、（２）上記突発音抑圧手段が、生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧することを特徴とする。

第３の本発明の突発音抑圧プログラムは、コンピュータを、（１）少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、（２）生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段として機能させることを特徴とする。

本発明によれば、入力音信号に含まれている突発音に瞬時に追従でき、しかも、音質への影響を最低限にとどめることができる突発音抑圧装置、方法及びプログラムを実現できる。

第１の実施形態に係る突発音抑圧装置の構成を示すブロック図である。第１の実施形態の突発音抑圧装置における正面抑圧信号生成部が生成する正面抑圧信号の指向性を示す説明図である。第１の実施形態の突発音抑圧装置における突発音抑圧部の詳細構成を示すブロック図である。第１の実施形態の突発音抑圧装置における正面抑圧信号生成部が生成した正面抑圧信号の挙動を示す説明図である。第２の実施形態に係る突発音抑圧装置の構成を示すブロック図である。第３の実施形態に係る突発音抑圧装置の構成を示すブロック図である。

（Ａ）第１の実施形態
以下、本発明による突発音抑圧装置、方法及びプログラムの第１の実施形態を、図面を参照しながら説明する。

（Ａ−１）第１の実施形態の構成
図１は、第１の実施形態に係る突発音抑圧装置の構成を示すブロック図である。ここで、一対のマイクロホンｍ１及びｍ２を除いた部分は、ハードウェアで構成することも可能であり、また、ＣＰＵが実行するソフトウェア（突発音抑圧プログラム）とＣＰＵとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図１で表すことができる。

図１において、第１の実施形態の突発音抑圧装置１０は、マイクロホンｍ１、マイクロホンｍ２、ＦＦＴ（高速フーリエ変換）部１１、正面抑圧信号生成部１２、突発音抑圧部１３及びＩＦＦＴ（逆高速フーリエ変換）部１４を有する。

一対のマイクロホンｍ１、ｍ２は、所定距離（若しくは任意の距離）だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクロホンｍ１、ｍ２は、無指向のもの（若しくは、正面方向にごくごく緩やかな指向性を有するもの）である。この第１の実施形態は、両マイクロホンｍ１及びｍ２から等距離にある、突発音抑圧装置を搭載した装置（例えば、音声通信端末）の正面方位（法線方向）に話者の口元（音源）があり、正面方位から目的音が到来することを想定している。各マイクロホンｍ１、ｍ２で捕捉された音信号（入力音信号）は、図示しない対応するＡ／Ｄ変換器を介してデジタル信号ｓ１（ｎ）、ｓ２（ｎ）に変換されてＦＦＴ部１１に与えられる。なお、ｎはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、ｎが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。

ＦＦＴ部１１は、マイクロホンｍ１及びｍ２から入力信号系列ｓ１（ｎ）及びｓ２（ｎ）を受け取り、その入力信号ｓ１及びｓ２に高速フーリエ変換（あるいは離散フーリエ変換）を行うものである。これにより、入力信号ｓ１及びｓ２を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号ｓ１（ｎ）及びｓ２（ｎ）から、所定のＮ個のサンプルからなる分析フレームＦＲＡＭＥ１（Ｋ）及びＦＲＡＭＥ２（Ｋ）を構成して適用する。入力信号ｓ１（ｎ）から分析フレームＦＲＡＭＥ１（Ｋ）を構成する例を以下の（１）式に示すが、分析フレームＦＲＡＭＥ２（Ｋ）も同様である。

なお、Ｋはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Ｋが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはＫであるとする。

ＦＦＴ部１１は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号Ｘ１（ｆ，Ｋ）、Ｘ２（ｆ，Ｋ）に変換し、得られた周波数領域信号Ｘ１（ｆ，Ｋ）及びＸ２（ｆ，Ｋ）を正面抑圧信号生成部１２に与える。なお、ｆは周波数を表すインデックスである。また、Ｘ１（ｆ，Ｋ）は単一の値ではなく、（２）式に示すように、複数の周波数ｆ１〜ｆｍのスペクトル成分から構成されるものである。Ｘ２（ｆ，Ｋ）や後述するＮ（ｆ，Ｋ）も同様である。
Ｘ１（ｆ，Ｋ）
＝[（ｆ１，Ｋ），（ｆ２，Ｋ），…，（ｆｍ，Ｋ）｝ …（２）

正面抑圧信号生成部１２は、周波数毎に、（３）式に示す演算を実行して正面抑圧信号Ｎ（ｆ，Ｋ）を生成し、突発音抑圧部１３に与えるものである。（３）式の演算は、一対のマイクロホンｍ１及びｍ２の捕捉信号から得られた２つのＸ１（ｆ，Ｋ）及びＸ２（ｆ，Ｋ）のいずれも遅延させることなく減算しているので、図２に示すように、正面に死角を有する指向性信号を形成する処理に相当する。
Ｎ（ｆ，Ｋ）＝Ｘ１（ｆ，Ｋ）−Ｘ２（ｆ，Ｋ） …（３）

突発音抑圧部１３は、周波数毎の正面抑圧信号Ｎ（ｆ，Ｋ）から（４）式に示すようにして抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）を形成した後、（５）式に示すように、その抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）を一方の周波数領域信号（以下、Ｘ１（ｆ，Ｋ）であるとする）に乗算し、周波数領域信号Ｘ１（ｆ，Ｋ）における突発音成分を抑圧する。突発音抑圧部１３は、得られた突発音抑圧後信号Ｙ（ｆ，Ｋ）をＩＦＦＴ部１４に与える。抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）は、正面抑圧信号Ｎ（ｆ，Ｋ）の絶対値の大小関係と逆の大小関係を有するものであれば良く、その演算式は（４）式に限定されない。
ＮＲｃｏｅｆ（ｆ，Ｋ）＝Γ（ｆ）− Ｎ（ｆ，Ｋ） …（４）
Ｙ（ｆ，Ｋ）＝ＮＲｃｏｅｆ（ｆ，Ｋ）× Ｘ１（ｆ，Ｋ） …（５）

なお、（４）式におけるΓ（ｆ）は所定の基準値であり、全ての周波数について同一の値であっても良いし、周波数毎に異なる値を設定しても良い。Γ（ｆ）は、設計者がシミュレーションなどによって最適値を決定すれば良く、例えば、１０．０を適用できる。また、（４）式では、Ｎ（ｆ，Ｋ）そのものを減算しているが、これに限定されず、絶対値、２乗値、その他の任意の演算を施したうえで減算するようにしても良い。

ＩＦＦＴ部１４は、周波数領域信号である突発音抑圧信号Ｙ（ｆ、Ｋ）を時間領域信号ｙ（ｎ）に変換するものである。後段回路が、周波数領域信号Ｙ（ｆ、Ｋ）をそのまま処理できる構成であれば、ＩＦＦＴ部１４は省略することができる。

図３は、突発音抑圧部１３の詳細構成を示すブロック図である。突発音抑圧部１３は、正面抑圧信号受信部２１、抑圧係数計算部２２、抑圧処理部２３及び抑圧後信号送信部２４を有する。

正面抑圧信号受信部２１は、正面抑圧信号生成部１２によって算出された正面抑圧信号Ｎ（ｆ，Ｋ）を取込むものである。抑圧係数計算部２２は、周波数毎の正面抑圧信号Ｎ（ｆ，Ｋ）から（４）式に従って抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）を計算するものである。抑圧処理部２３は、周波数毎の抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）を適用し、（５）式に従って、周波数領域信号Ｘ１（ｆ，Ｋ）における突発音成分を抑圧するものである。抑圧後信号送信部２４は、得られた突発音抑圧後信号Ｙ（ｆ，Ｋ）をＩＦＦＴ部１４に与えるものである。

（Ａ−２）正面抑圧信号を利用することとした理由
次に、突発音の抑圧に正面抑圧信号を利用することとした理由を説明する。図４は、車両が高速道路に設けられているジョイントの上を通過した場合（３回）を含む期間の信号を処理して得た正面抑圧信号（の絶対値）の時間変化を示す説明図である。

正面以外に指向性を有する「正面抑圧信号」は、その名の通り、マイクロホン正面以外の方位からの音を集音する特性を有する。目的音が正面から到来すると想定しているので、正面抑圧信号には目的音の成分は含まれず、正面抑圧信号は、それ以外の雑音成分が優勢な信号となっている。

上述したように、目的音は特定の方向（マイクロホン正面）から到来する。これに対して、車両が高速道路や橋に設けられているジョイントの上を通過する際に生じる突発音は、主に、車体そのものの振動によって生じるため、特定の方向から到来するわけではなく、様々な方位から到来するような特性を有する。

以上を整理すると、目的音は正面からだけ到来するのに対して突発音は様々な方位から到来するので、正面に死角を有する正面抑圧信号は、目的音の有無に拘わらず、突発音がある状況では大きく、突発音がない状況では小さな値をとる。そのため、正面抑圧信号の絶対値の大小関係と逆の大小関係を有するように抑圧係数を形成すれば、突発音がある状況では大きく抑圧でき、突発音がない状況ではほとんど抑圧しないようになる。以上のような考え方により、抑圧係数の形成に正面抑圧信号を利用することとした。

また、正面抑圧信号は、上述した（３）式に従って算出されるので、処理遅延を生じることなく形成できる。従って、正面抑圧信号は、突発音の発生に追従でき、突発音が生じたときにはリアルタイムに大きな値をとり、それ以外ではリアルタイムに小さな値をとる。すなわち、突発音をリアルタイムに抑圧できる面から考えて、抑圧係数の形成に正面抑圧信号を利用することが好ましい。

上記説明では、１０．０などの予め定めた基準値から正面抑圧信号を引いた値を抑圧係数とする例を示したが、正面抑圧信号の絶対値の逆数若しくは逆数の所定倍を抑圧係数とするようにしても良い。

このようにして形成した抑圧係数は、突発音が生じたときにだけ小さい値となるが、それ以外の場合には大きな値をとり、突発音成分のみを抑圧することができる。

なお、目的音と突発音とが重なった期間は目的音自体を認識し難い状況であるので、抑圧量が大きくなっても、そのことはほとんど問題とならない。

（Ａ−３）第１の実施形態の動作
次に、第１の実施形態の突発音抑圧装置１０の動作を、図面を参照しながら説明する。

一対のマイクロホンｍ１及びｍ２から入力された信号ｓ１（ｎ）、ｓ２（ｎ）はそれぞれ、ＦＦＴ部１１によって時間領域から周波数領域の信号Ｘ１（ｆ，Ｋ）、Ｘ２（ｆ，Ｋ）に変換されて正面抑圧信号生成部１２に与えられる。

正面抑圧信号生成部１２においては、周波数毎に、（３）式に示す演算が実行されて正面抑圧信号Ｎ（ｆ，Ｋ）が生成され、突発音抑圧部１３に与えられる。

突発音抑圧部１３においては、周波数毎の正面抑圧信号Ｎ（ｆ，Ｋ）から（４）式に従って、抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）が形成させる。さらに、（５）式に従って、一方の周波数領域信号Ｘ１（ｆ，Ｋ）に抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）が乗算されて、周波数領域信号Ｘ１（ｆ，Ｋ）における突発音成分が抑圧される。得られた突発音抑圧後の信号Ｙ（ｆ，Ｋ）はＩＦＦＴ部１４に与えられ、ＩＦＦＴ部１４において、時間領域信号ｙ（ｎ）に変換されて後段回路に出力される。

（Ａ−４）第１の実施形態の効果
以上のように、第１の実施形態によれば、正面抑圧信号を用いて抑圧係数を形成して突発音を抑圧するようにしたので、従来は困難であった突発音の抑圧を実現できる。すなわち、発生した突発音に瞬時に追従して抑圧でき、突発音の音質への影響を最低限にとどめることができる。

以上の効果により、第１の実施形態の突発音抑圧装置若しくはプログラムを適用した、ハンズフリー通話機能や音声認識機能を有するカーナビゲーション装置や携帯型音声通信端末等の性能の向上が期待できる。

（Ｂ）第２の実施形態
次に、本発明による突発音抑圧装置、方法及びプログラムの第２の実施形態を、図面を参照しながら説明する。

第１の実施形態は、話者が発声した音声が装置正面から到来することを前提として構成されたものである。しかし、スマートフォンを多少傾けて持って発声するなど、同じ発声時点の音を、一対のマイクロホンｍ１及びｍ２が捕捉するのに時間差があることもある。第２の実施形態は、音源方位を学習し、学習した音源方位の成分（目的音）を抑圧した音源方位抑圧信号を形成し、その音源方位抑圧信号に基づいて突発音を抑圧しようとしたものである。

図５は、第２の実施形態に係る突発音抑圧装置の構成を示すブロック図であり、第１の実施形態に係る図１との同一、対応部分には同一、対応符号を付して示している。

図５において、第２の実施形態の突発音抑圧装置１０Ａは、マイクロホンｍ１、マイクロホンｍ２、ＦＦＴ部１１、音源方位抑圧信号生成部１２Ａ、突発音抑圧部１３、ＩＦＦＴ部１４及び音源方位学習部１５を有する。音源方位抑圧信号生成部１２Ａ及び音源方位学習部１５だけが第１の実施形態とは異なるので、以下では、音源方位抑圧信号生成部１２Ａ及び音源方位学習部１５について説明する。

音源方位学習部１５は、例えば、学習モードにおいて音源方位を学習するものである。例えば、当該突発音抑圧装置を搭載した装置に音源方位の学習モードを持たせ、マニュアルなどで突発音が生じない環境で学習モードを起動して音声を発することを利用者に指示する。このようなときにマイクロホンｍ１及びｍ２が捕捉して得た信号ｓ１（ｎ）、ｓ２（ｎ）に基づいて音源方位を学習する。音源方位の検出方法としては、特開２００９−０４２５５２号公報（以下、参考文献１と呼ぶ）に記載のようなコヒーレンスを利用した既存の方法を適用することができる。また、信号ｓ１（ｎ）及びｓ２（ｎ）間の相関が最も大きい時間差を音源方位情報として検出するようにしても良い。

音源方位抑圧信号生成部１２Ａは、学習された音源方位に死角を有するような音源方位抑圧信号を形成して突発音抑圧部１３に与えるものである。参考文献１には、方位が分かっている非目的音の抑圧方法が記載されており、この抑圧方法を音源方位抑圧信号の形成方法として利用することができる。また、信号ｓ１（ｎ）及びｓ２（ｎ）間の相関が最も大きい時間差を音源方位情報としている場合であれば、その時間差に応じた分だけ一方の信号ｓ１（ｎ）又はｓ２（ｎ）を遅延させて信号ｓ１（ｎ）及びｓ２（ｎ）の時間差を解消した後、第１の実施形態で説明したＦＦＴ部１１と正面方位抑圧信号生成部１２を機能させることにより、音源方位抑圧信号生成部１２Ａとして機能させることができる。

以上の点を除けば、第２の実施形態も第１の実施形態と同様である。

第２の実施形態によれば、話者（音源）の方位が装置正面でない場合であっても、一対のマイクロホンが捕捉して得た音信号に含まれる突発音を抑圧することができる。

（Ｃ）第３の実施形態
次に、本発明による突発音抑圧装置、方法及びプログラムの第３の実施形態を、図面を参照しながら説明する。

第１の実施形態は、一対のマイクロホンｍ１及びｍ２が捕捉した信号だけに基づいて、突発音の抑圧を制御するものであった。第３の実施形態は、振動センサを追加し、振動センサの出力をも突発音の抑圧制御に利用しようとしたものである。車両が高速道路に設けられているジョイントの上を通過するような突発音が生じる場合には、車両自体が通常以上に振動していることを利用し、第３の実施形態では、振動センサの出力も突発音の抑圧制御に利用することとした。

図６は、第３の実施形態に係る突発音抑圧装置の構成を示すブロック図であり、第１の実施形態に係る図１との同一、対応部分には同一、対応符号を付して示している。

図６において、第３の実施形態の突発音抑圧装置１０Ｂは、マイクロホンｍ１、マイクロホンｍ２、ＦＦＴ部１１、正面抑圧信号生成部１２、突発音抑圧部１３Ｂ、ＩＦＦＴ部１４及び振動センサ１６を有する。突発音抑圧部１３Ｂ及び振動センサ１６だけが第１の実施形態とは異なるので、以下では、突発音抑圧部１３Ｂ及び振動センサ１６について説明する。

振動センサ１６は、当該突発音抑圧装置１０Ｂが搭載されている、若しくは、組み込まれている装置における振動を検出し、振動の強弱を表わす振動検出信号を突発音抑圧部１３Ｂに与えるものである。振動センサ１６は、当該突発音抑圧装置１０Ｂのために専用的に設けられたものであっても良く、当該突発音抑圧装置１０Ｂが搭載されている、若しくは、組み込まれている装置が有する振動センサや加速度センサを流用するものであっても良い。

第３の実施形態の突発音抑圧部１３Ｂは、振動センサ１６からの振動検出信号のレベルを閾値と比較し、振動検出信号のレベルが閾値以上のときに、第１の実施形態で説明したと同様な突発音の抑圧動作を実行して突発音抑圧後の信号Ｙ（ｆ，Ｋ）を形成してＩＦＦＴ部１４に与え、振動検出信号のレベルが閾値より小さいときには抑圧動作することなく、入力された周波数領域信号Ｘ１（ｆ，Ｋ）をそのまま突発音抑圧後信号Ｙ（ｆ，Ｋ）としてＩＦＦＴ部１４に与える。

以上の点を除けば、第３の実施形態も第１の実施形態と同様である。

第３の実施形態によれば、振動があることを突発音区間と認識して突発音の抑圧動作を制御するようにしたので、突発音区間でない信号区間に対して、過度に抑圧動作が実行されることを未然に防止することができる。

（Ｄ）他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。

上記各実施形態では、周波数毎の正面抑圧信号から周波数毎に異なる抑圧係数を形成するものを示したが、周波数毎の正面抑圧信号の平均値のような全周波数に共通する正面抑圧信号を形成し、共通する正面抑圧信号から、各周波数に共通的に適用する抑圧係数を形成するようにしても良い。

上記実施形態の説明においても言及したように、抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）は、「突発音発生時に小さくなり、それ以外では大きい値をとる」という大小関係が得られるように、正面抑圧信号Ｎ（ｆ，Ｋ）から形成すれば良く、その形成のための演算式は（４）式に限定されるものではない。

上記各実施形態においては、正面抑圧信号Ｎ（ｆ，Ｋ）から形成した抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）をそのまま適用して突発音を抑圧する場合を示したが、得られた抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）に対して抑圧の強弱を制御するための処理を施すようにしても良い。例えば、抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）にフロアリング処理を施して下限を制御するようにしても良い。また例えば、抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）に上限値を設定して飽和処理を施すようにしても良い。さらにまた、直前所定期間の正面抑圧信号Ｎ（ｆ，Ｋ）のピーク値（若しくはピーク値が属する範囲）の大小に応じて定まる調整用係数を、演算で得られた抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）に乗算した後、抑圧動作を実行するようにしても良い。このような調整用係数を自動的に定めるのではなく、利用者が抓み等を操作して定めるようにしても良い。

上記各実施形態においては、全ての周波数で抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）の形成方法が同じものを示したが、周波数帯によって抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）の形成方法を変えるようにしても良い。例えば、演算で得られた高域及び低域に属する周波数に対する抑圧係数ＮＲｃｏｅｆ（ｆ，Ｋ）が同じであっても、高域に属する周波数の抑圧量を大きくするように、高域と低域とで異なる調整用係数を乗算するようにしても良い。また例えば、（４）式におけるΓ（ｆ）を、高域と低域とで変えることにより、高域と低域とで抑圧の強弱が異なるようにしても良い。

上記各実施形態の説明では、車両が高速道路や橋に設けられているジョイントの上を通過することを突発音の発生原因として説明したが、突発音の発生原因は問われないものである。すなわち、マイクロホンの捕捉信号に入り込む、突発的に発生する大振幅の雑音成分である突発音があれば、本発明の技術思想を適用することができる。

上記各実施形態では、マイクロホンが２つの場合を示したが、マイクロホンは２つに限定されず、３以上あっても良い。

上記各実施形態では、一対のマイクロホンが捕捉した信号を直ちに処理する装置やプログラムを示したが、一対のマイクロホンが捕捉した信号を記録媒体に記録し、それを再生する場合にも、本発明を適用することができる。

１０、１０Ａ、１０Ｂ…突発音抑圧装置、ｍ１、ｍ２…マイクロホン、１１…ＦＦＴ（高速フーリエ変換）部、１２…正面抑圧信号生成部、１２Ａ…音源方位抑圧信号生成部、１３、１３Ｂ…突発音抑圧部、１４…ＩＦＦＴ部、１５…音源方位学習部、１６…振動センサ、２１…正面抑圧信号受信部、２２…抑圧係数計算部、２３…抑圧処理部、２４…抑圧後信号送信部。

Claims

少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、
生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段と
を有することを特徴とする突発音抑圧装置。
上記音源方位抑圧信号生成手段は、装置正面を音源方位として音源方位抑圧信号を生成することを特徴とする請求項１に記載の突発音抑圧装置。
上記目的音音源の方位を学習する学習手段をさらに備え、
上記音源方位抑圧信号生成手段は、学習された目的音音源の方位に死角を有する音源方位抑圧信号を生成する
ことを特徴とする請求項１に記載の突発音抑圧装置。
上記音源方位抑圧信号生成手段は、周波数毎の音源方位抑圧信号を生成するものであり、
上記突発音抑圧手段は、
生成された周波数毎の音源方位抑圧信号のレベルと逆の大小関係となるように周波数毎の抑圧係数を形成する抑圧係数計算部と、
上記入力音信号の周波数毎に、対応する抑圧係数を適用して突発音を抑圧する抑圧処理部とを有する
ことを特徴とする請求項１〜３のいずれかに記載の突発音抑圧装置。
上記抑圧係数計算部は、予め定められている基準値から音源方位抑圧信号を減算し、その減算値に応じて抑圧係数を形成することを特徴とする請求項４に記載の突発音抑圧装置。
上記抑圧係数計算部は、音源方位抑圧信号のレベルの逆数を計算し、その逆数に応じて抑圧係数を形成することを特徴とする請求項４に記載の突発音抑圧装置。
上記抑圧係数計算部は、一旦得られた抑圧係数に対し、フロアリング処理及び飽和処理の少なくとも一方を施すことを特徴とする請求項４〜６のいずれかに記載の突発音抑圧装置。
振動を検出する振動検出手段をさらに備え、
上記突発音抑圧手段は、検出された振動レベルが閾値以上であることを条件として突発音を抑圧する
ことを特徴とする請求項１〜７のいずれかに記載の突発音抑圧装置。
音源方位抑圧信号生成手段及び突発音抑圧手段を備え、
上記音源方位抑圧信号生成手段が、少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成し、
上記突発音抑圧手段が、生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する
ことを特徴とする突発音抑圧方法。
コンピュータを、
少なくとも２本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、
生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段と
して機能させることを特徴とする突発音抑圧プログラム。