JP2016039399A - 突発音抑圧装置、方法及びプログラム - Google Patents
突発音抑圧装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2016039399A JP2016039399A JP2014159603A JP2014159603A JP2016039399A JP 2016039399 A JP2016039399 A JP 2016039399A JP 2014159603 A JP2014159603 A JP 2014159603A JP 2014159603 A JP2014159603 A JP 2014159603A JP 2016039399 A JP2016039399 A JP 2016039399A
- Authority
- JP
- Japan
- Prior art keywords
- suppression
- sound
- sudden
- signal
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】 入力音信号に含まれている突発音に瞬時に追従して抑圧し、音質への影響を最低限にできる突発音抑圧装置を提供する。
【解決手段】 本発明の突発音抑圧装置は、例えば、車両が高速道路や橋に設けられているジョイント上を通過する際に生じる突発音成分の抑圧を意図している。そして、少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、装置正面に死角を有する周波数毎の正面抑圧信号を生成する第1処理部と、生成された正面抑圧信号のレベルの大小関係と逆の大小関係を有する抑圧係数を周波数毎に形成し、その抑圧係数を適用して、入力音信号に含まれている突発音を周波数毎に抑圧する第2処理部とを有することを特徴とする。
【選択図】 図1
【解決手段】 本発明の突発音抑圧装置は、例えば、車両が高速道路や橋に設けられているジョイント上を通過する際に生じる突発音成分の抑圧を意図している。そして、少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、装置正面に死角を有する周波数毎の正面抑圧信号を生成する第1処理部と、生成された正面抑圧信号のレベルの大小関係と逆の大小関係を有する抑圧係数を周波数毎に形成し、その抑圧係数を適用して、入力音信号に含まれている突発音を周波数毎に抑圧する第2処理部とを有することを特徴とする。
【選択図】 図1
Description
本発明は突発音抑圧装置、方法及びプログラムに関し、例えば、携帯型音声通信端末(スマートフォンや携帯電話等)やカーナビゲーション装置等の車両内で使用可能な音声処理装置に適用し得るものである。
近年、ハンズフリー通話機能や音声認識機能を有するカーナビゲーション装置や携帯型音声通信端末の普及により、自動車や電車等の車内で通話したり音声認識機能を用いたりする機会が増えてきている。
車内での使用では、走行雑音による通話音質の低下や音声認識率の低下が課題になっている。特に、高速道路や橋に設けられているジョイントの上を通過する際に生じる突発音に対する処理が課題となっている。突発音は、突発的に発生する大振幅の雑音であり、通話音質や音声認識性能に及ぼす影響が大きいため、効果的に抑圧する方法が求められている。
従来の雑音抑圧方法として、特許文献1に記載されているウィーナーフィルタ法(以下、WFと呼ぶ)がある。
WFは、背景雑音が瞬間的な変動はせずに長期的には特性が一定であることを前提としているため、瞬間的に生じる突発音の抑圧は困難であった。また、自動車における突発音は、ジョイントの上を前輪が通過するときと後輪が通過するときの2回立て続けに生じており、このことも、抑圧の困難さを高めている。さらに、突発音を抑圧するとしても、強力な抑圧処理を施さなければ十分な抑圧効果が得られないため、抑圧処理後に目的音に歪みが生じ、聴感を悪化させたり、音声認識性能を低下させるという副作用が生じてしまう。
そのため、入力音信号に含まれている突発音に瞬時に追従でき、しかも、音質への影響を最低限にとどめることができる突発音抑圧装置、方法及びプログラムが望まれている。
第1の本発明の突発音抑圧装置は、(1)少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、(2)生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段とを有することを特徴とする。
第2の本発明の突発音抑圧方法は、音源方位抑圧信号生成手段及び突発音抑圧手段を備え、(1)上記音源方位抑圧信号生成手段が、少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成し、(2)上記突発音抑圧手段が、生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧することを特徴とする。
第3の本発明の突発音抑圧プログラムは、コンピュータを、(1)少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、(2)生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段として機能させることを特徴とする。
本発明によれば、入力音信号に含まれている突発音に瞬時に追従でき、しかも、音質への影響を最低限にとどめることができる突発音抑圧装置、方法及びプログラムを実現できる。
(A)第1の実施形態
以下、本発明による突発音抑圧装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。
以下、本発明による突発音抑圧装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る突発音抑圧装置の構成を示すブロック図である。ここで、一対のマイクロホンm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(突発音抑圧プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
図1は、第1の実施形態に係る突発音抑圧装置の構成を示すブロック図である。ここで、一対のマイクロホンm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(突発音抑圧プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
図1において、第1の実施形態の突発音抑圧装置10は、マイクロホンm1、マイクロホンm2、FFT(高速フーリエ変換)部11、正面抑圧信号生成部12、突発音抑圧部13及びIFFT(逆高速フーリエ変換)部14を有する。
一対のマイクロホンm1、m2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクロホンm1、m2は、無指向のもの(若しくは、正面方向にごくごく緩やかな指向性を有するもの)である。この第1の実施形態は、両マイクロホンm1及びm2から等距離にある、突発音抑圧装置を搭載した装置(例えば、音声通信端末)の正面方位(法線方向)に話者の口元(音源)があり、正面方位から目的音が到来することを想定している。各マイクロホンm1、m2で捕捉された音信号(入力音信号)は、図示しない対応するA/D変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
FFT部11は、マイクロホンm1及びm2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部11は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)を正面抑圧信号生成部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複数の周波数f1〜fmのスペクトル成分から構成されるものである。X2(f,K)や後述するN(f,K)も同様である。
X1(f,K)
=[(f1,K),(f2,K),…,(fm,K)} …(2)
X1(f,K)
=[(f1,K),(f2,K),…,(fm,K)} …(2)
正面抑圧信号生成部12は、周波数毎に、(3)式に示す演算を実行して正面抑圧信号N(f,K)を生成し、突発音抑圧部13に与えるものである。(3)式の演算は、一対のマイクロホンm1及びm2の捕捉信号から得られた2つのX1(f,K)及びX2(f,K)のいずれも遅延させることなく減算しているので、図2に示すように、正面に死角を有する指向性信号を形成する処理に相当する。
N(f,K)=X1(f,K)−X2(f,K) …(3)
N(f,K)=X1(f,K)−X2(f,K) …(3)
突発音抑圧部13は、周波数毎の正面抑圧信号N(f,K)から(4)式に示すようにして抑圧係数NRcoef(f,K)を形成した後、(5)式に示すように、その抑圧係数NRcoef(f,K)を一方の周波数領域信号(以下、X1(f,K)であるとする)に乗算し、周波数領域信号X1(f,K)における突発音成分を抑圧する。突発音抑圧部13は、得られた突発音抑圧後信号Y(f,K)をIFFT部14に与える。抑圧係数NRcoef(f,K)は、正面抑圧信号N(f,K)の絶対値の大小関係と逆の大小関係を有するものであれば良く、その演算式は(4)式に限定されない。
NRcoef(f,K)=Γ(f)− N(f,K) …(4)
Y(f,K)=NRcoef(f,K)× X1(f,K) …(5)
NRcoef(f,K)=Γ(f)− N(f,K) …(4)
Y(f,K)=NRcoef(f,K)× X1(f,K) …(5)
なお、(4)式におけるΓ(f)は所定の基準値であり、全ての周波数について同一の値であっても良いし、周波数毎に異なる値を設定しても良い。Γ(f)は、設計者がシミュレーションなどによって最適値を決定すれば良く、例えば、10.0を適用できる。また、(4)式では、N(f,K)そのものを減算しているが、これに限定されず、絶対値、2乗値、その他の任意の演算を施したうえで減算するようにしても良い。
IFFT部14は、周波数領域信号である突発音抑圧信号Y(f、K)を時間領域信号y(n)に変換するものである。後段回路が、周波数領域信号Y(f、K)をそのまま処理できる構成であれば、IFFT部14は省略することができる。
図3は、突発音抑圧部13の詳細構成を示すブロック図である。突発音抑圧部13は、正面抑圧信号受信部21、抑圧係数計算部22、抑圧処理部23及び抑圧後信号送信部24を有する。
正面抑圧信号受信部21は、正面抑圧信号生成部12によって算出された正面抑圧信号N(f,K)を取込むものである。抑圧係数計算部22は、周波数毎の正面抑圧信号N(f,K)から(4)式に従って抑圧係数NRcoef(f,K)を計算するものである。抑圧処理部23は、周波数毎の抑圧係数NRcoef(f,K)を適用し、(5)式に従って、周波数領域信号X1(f,K)における突発音成分を抑圧するものである。抑圧後信号送信部24は、得られた突発音抑圧後信号Y(f,K)をIFFT部14に与えるものである。
(A−2)正面抑圧信号を利用することとした理由
次に、突発音の抑圧に正面抑圧信号を利用することとした理由を説明する。図4は、車両が高速道路に設けられているジョイントの上を通過した場合(3回)を含む期間の信号を処理して得た正面抑圧信号(の絶対値)の時間変化を示す説明図である。
次に、突発音の抑圧に正面抑圧信号を利用することとした理由を説明する。図4は、車両が高速道路に設けられているジョイントの上を通過した場合(3回)を含む期間の信号を処理して得た正面抑圧信号(の絶対値)の時間変化を示す説明図である。
正面以外に指向性を有する「正面抑圧信号」は、その名の通り、マイクロホン正面以外の方位からの音を集音する特性を有する。目的音が正面から到来すると想定しているので、正面抑圧信号には目的音の成分は含まれず、正面抑圧信号は、それ以外の雑音成分が優勢な信号となっている。
上述したように、目的音は特定の方向(マイクロホン正面)から到来する。これに対して、車両が高速道路や橋に設けられているジョイントの上を通過する際に生じる突発音は、主に、車体そのものの振動によって生じるため、特定の方向から到来するわけではなく、様々な方位から到来するような特性を有する。
以上を整理すると、目的音は正面からだけ到来するのに対して突発音は様々な方位から到来するので、正面に死角を有する正面抑圧信号は、目的音の有無に拘わらず、突発音がある状況では大きく、突発音がない状況では小さな値をとる。そのため、正面抑圧信号の絶対値の大小関係と逆の大小関係を有するように抑圧係数を形成すれば、突発音がある状況では大きく抑圧でき、突発音がない状況ではほとんど抑圧しないようになる。以上のような考え方により、抑圧係数の形成に正面抑圧信号を利用することとした。
また、正面抑圧信号は、上述した(3)式に従って算出されるので、処理遅延を生じることなく形成できる。従って、正面抑圧信号は、突発音の発生に追従でき、突発音が生じたときにはリアルタイムに大きな値をとり、それ以外ではリアルタイムに小さな値をとる。すなわち、突発音をリアルタイムに抑圧できる面から考えて、抑圧係数の形成に正面抑圧信号を利用することが好ましい。
上記説明では、10.0などの予め定めた基準値から正面抑圧信号を引いた値を抑圧係数とする例を示したが、正面抑圧信号の絶対値の逆数若しくは逆数の所定倍を抑圧係数とするようにしても良い。
このようにして形成した抑圧係数は、突発音が生じたときにだけ小さい値となるが、それ以外の場合には大きな値をとり、突発音成分のみを抑圧することができる。
なお、目的音と突発音とが重なった期間は目的音自体を認識し難い状況であるので、抑圧量が大きくなっても、そのことはほとんど問題とならない。
(A−3)第1の実施形態の動作
次に、第1の実施形態の突発音抑圧装置10の動作を、図面を参照しながら説明する。
次に、第1の実施形態の突発音抑圧装置10の動作を、図面を参照しながら説明する。
一対のマイクロホンm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換されて正面抑圧信号生成部12に与えられる。
正面抑圧信号生成部12においては、周波数毎に、(3)式に示す演算が実行されて正面抑圧信号N(f,K)が生成され、突発音抑圧部13に与えられる。
突発音抑圧部13においては、周波数毎の正面抑圧信号N(f,K)から(4)式に従って、抑圧係数NRcoef(f,K)が形成させる。さらに、(5)式に従って、一方の周波数領域信号X1(f,K)に抑圧係数NRcoef(f,K)が乗算されて、周波数領域信号X1(f,K)における突発音成分が抑圧される。得られた突発音抑圧後の信号Y(f,K)はIFFT部14に与えられ、IFFT部14において、時間領域信号y(n)に変換されて後段回路に出力される。
(A−4)第1の実施形態の効果
以上のように、第1の実施形態によれば、正面抑圧信号を用いて抑圧係数を形成して突発音を抑圧するようにしたので、従来は困難であった突発音の抑圧を実現できる。すなわち、発生した突発音に瞬時に追従して抑圧でき、突発音の音質への影響を最低限にとどめることができる。
以上のように、第1の実施形態によれば、正面抑圧信号を用いて抑圧係数を形成して突発音を抑圧するようにしたので、従来は困難であった突発音の抑圧を実現できる。すなわち、発生した突発音に瞬時に追従して抑圧でき、突発音の音質への影響を最低限にとどめることができる。
以上の効果により、第1の実施形態の突発音抑圧装置若しくはプログラムを適用した、ハンズフリー通話機能や音声認識機能を有するカーナビゲーション装置や携帯型音声通信端末等の性能の向上が期待できる。
(B)第2の実施形態
次に、本発明による突発音抑圧装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
次に、本発明による突発音抑圧装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
第1の実施形態は、話者が発声した音声が装置正面から到来することを前提として構成されたものである。しかし、スマートフォンを多少傾けて持って発声するなど、同じ発声時点の音を、一対のマイクロホンm1及びm2が捕捉するのに時間差があることもある。第2の実施形態は、音源方位を学習し、学習した音源方位の成分(目的音)を抑圧した音源方位抑圧信号を形成し、その音源方位抑圧信号に基づいて突発音を抑圧しようとしたものである。
図5は、第2の実施形態に係る突発音抑圧装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図5において、第2の実施形態の突発音抑圧装置10Aは、マイクロホンm1、マイクロホンm2、FFT部11、音源方位抑圧信号生成部12A、突発音抑圧部13、IFFT部14及び音源方位学習部15を有する。音源方位抑圧信号生成部12A及び音源方位学習部15だけが第1の実施形態とは異なるので、以下では、音源方位抑圧信号生成部12A及び音源方位学習部15について説明する。
音源方位学習部15は、例えば、学習モードにおいて音源方位を学習するものである。例えば、当該突発音抑圧装置を搭載した装置に音源方位の学習モードを持たせ、マニュアルなどで突発音が生じない環境で学習モードを起動して音声を発することを利用者に指示する。このようなときにマイクロホンm1及びm2が捕捉して得た信号s1(n)、s2(n)に基づいて音源方位を学習する。音源方位の検出方法としては、特開2009−042552号公報(以下、参考文献1と呼ぶ)に記載のようなコヒーレンスを利用した既存の方法を適用することができる。また、信号s1(n)及びs2(n)間の相関が最も大きい時間差を音源方位情報として検出するようにしても良い。
音源方位抑圧信号生成部12Aは、学習された音源方位に死角を有するような音源方位抑圧信号を形成して突発音抑圧部13に与えるものである。参考文献1には、方位が分かっている非目的音の抑圧方法が記載されており、この抑圧方法を音源方位抑圧信号の形成方法として利用することができる。また、信号s1(n)及びs2(n)間の相関が最も大きい時間差を音源方位情報としている場合であれば、その時間差に応じた分だけ一方の信号s1(n)又はs2(n)を遅延させて信号s1(n)及びs2(n)の時間差を解消した後、第1の実施形態で説明したFFT部11と正面方位抑圧信号生成部12を機能させることにより、音源方位抑圧信号生成部12Aとして機能させることができる。
以上の点を除けば、第2の実施形態も第1の実施形態と同様である。
第2の実施形態によれば、話者(音源)の方位が装置正面でない場合であっても、一対のマイクロホンが捕捉して得た音信号に含まれる突発音を抑圧することができる。
(C)第3の実施形態
次に、本発明による突発音抑圧装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
次に、本発明による突発音抑圧装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
第1の実施形態は、一対のマイクロホンm1及びm2が捕捉した信号だけに基づいて、突発音の抑圧を制御するものであった。第3の実施形態は、振動センサを追加し、振動センサの出力をも突発音の抑圧制御に利用しようとしたものである。車両が高速道路に設けられているジョイントの上を通過するような突発音が生じる場合には、車両自体が通常以上に振動していることを利用し、第3の実施形態では、振動センサの出力も突発音の抑圧制御に利用することとした。
図6は、第3の実施形態に係る突発音抑圧装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図6において、第3の実施形態の突発音抑圧装置10Bは、マイクロホンm1、マイクロホンm2、FFT部11、正面抑圧信号生成部12、突発音抑圧部13B、IFFT部14及び振動センサ16を有する。突発音抑圧部13B及び振動センサ16だけが第1の実施形態とは異なるので、以下では、突発音抑圧部13B及び振動センサ16について説明する。
振動センサ16は、当該突発音抑圧装置10Bが搭載されている、若しくは、組み込まれている装置における振動を検出し、振動の強弱を表わす振動検出信号を突発音抑圧部13Bに与えるものである。振動センサ16は、当該突発音抑圧装置10Bのために専用的に設けられたものであっても良く、当該突発音抑圧装置10Bが搭載されている、若しくは、組み込まれている装置が有する振動センサや加速度センサを流用するものであっても良い。
第3の実施形態の突発音抑圧部13Bは、振動センサ16からの振動検出信号のレベルを閾値と比較し、振動検出信号のレベルが閾値以上のときに、第1の実施形態で説明したと同様な突発音の抑圧動作を実行して突発音抑圧後の信号Y(f,K)を形成してIFFT部14に与え、振動検出信号のレベルが閾値より小さいときには抑圧動作することなく、入力された周波数領域信号X1(f,K)をそのまま突発音抑圧後信号Y(f,K)としてIFFT部14に与える。
以上の点を除けば、第3の実施形態も第1の実施形態と同様である。
第3の実施形態によれば、振動があることを突発音区間と認識して突発音の抑圧動作を制御するようにしたので、突発音区間でない信号区間に対して、過度に抑圧動作が実行されることを未然に防止することができる。
(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記各実施形態では、周波数毎の正面抑圧信号から周波数毎に異なる抑圧係数を形成するものを示したが、周波数毎の正面抑圧信号の平均値のような全周波数に共通する正面抑圧信号を形成し、共通する正面抑圧信号から、各周波数に共通的に適用する抑圧係数を形成するようにしても良い。
上記実施形態の説明においても言及したように、抑圧係数NRcoef(f,K)は、「突発音発生時に小さくなり、それ以外では大きい値をとる」という大小関係が得られるように、正面抑圧信号N(f,K)から形成すれば良く、その形成のための演算式は(4)式に限定されるものではない。
上記各実施形態においては、正面抑圧信号N(f,K)から形成した抑圧係数NRcoef(f,K)をそのまま適用して突発音を抑圧する場合を示したが、得られた抑圧係数NRcoef(f,K)に対して抑圧の強弱を制御するための処理を施すようにしても良い。例えば、抑圧係数NRcoef(f,K)にフロアリング処理を施して下限を制御するようにしても良い。また例えば、抑圧係数NRcoef(f,K)に上限値を設定して飽和処理を施すようにしても良い。さらにまた、直前所定期間の正面抑圧信号N(f,K)のピーク値(若しくはピーク値が属する範囲)の大小に応じて定まる調整用係数を、演算で得られた抑圧係数NRcoef(f,K)に乗算した後、抑圧動作を実行するようにしても良い。このような調整用係数を自動的に定めるのではなく、利用者が抓み等を操作して定めるようにしても良い。
上記各実施形態においては、全ての周波数で抑圧係数NRcoef(f,K)の形成方法が同じものを示したが、周波数帯によって抑圧係数NRcoef(f,K)の形成方法を変えるようにしても良い。例えば、演算で得られた高域及び低域に属する周波数に対する抑圧係数NRcoef(f,K)が同じであっても、高域に属する周波数の抑圧量を大きくするように、高域と低域とで異なる調整用係数を乗算するようにしても良い。また例えば、(4)式におけるΓ(f)を、高域と低域とで変えることにより、高域と低域とで抑圧の強弱が異なるようにしても良い。
上記各実施形態の説明では、車両が高速道路や橋に設けられているジョイントの上を通過することを突発音の発生原因として説明したが、突発音の発生原因は問われないものである。すなわち、マイクロホンの捕捉信号に入り込む、突発的に発生する大振幅の雑音成分である突発音があれば、本発明の技術思想を適用することができる。
上記各実施形態では、マイクロホンが2つの場合を示したが、マイクロホンは2つに限定されず、3以上あっても良い。
上記各実施形態では、一対のマイクロホンが捕捉した信号を直ちに処理する装置やプログラムを示したが、一対のマイクロホンが捕捉した信号を記録媒体に記録し、それを再生する場合にも、本発明を適用することができる。
10、10A、10B…突発音抑圧装置、m1、m2…マイクロホン、11…FFT(高速フーリエ変換)部、12…正面抑圧信号生成部、12A…音源方位抑圧信号生成部、13、13B…突発音抑圧部、14…IFFT部、15…音源方位学習部、16…振動センサ、21…正面抑圧信号受信部、22…抑圧係数計算部、23…抑圧処理部、24…抑圧後信号送信部。
Claims (10)
- 少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、
生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段と
を有することを特徴とする突発音抑圧装置。 - 上記音源方位抑圧信号生成手段は、装置正面を音源方位として音源方位抑圧信号を生成することを特徴とする請求項1に記載の突発音抑圧装置。
- 上記目的音音源の方位を学習する学習手段をさらに備え、
上記音源方位抑圧信号生成手段は、学習された目的音音源の方位に死角を有する音源方位抑圧信号を生成する
ことを特徴とする請求項1に記載の突発音抑圧装置。 - 上記音源方位抑圧信号生成手段は、周波数毎の音源方位抑圧信号を生成するものであり、
上記突発音抑圧手段は、
生成された周波数毎の音源方位抑圧信号のレベルと逆の大小関係となるように周波数毎の抑圧係数を形成する抑圧係数計算部と、
上記入力音信号の周波数毎に、対応する抑圧係数を適用して突発音を抑圧する抑圧処理部とを有する
ことを特徴とする請求項1〜3のいずれかに記載の突発音抑圧装置。 - 上記抑圧係数計算部は、予め定められている基準値から音源方位抑圧信号を減算し、その減算値に応じて抑圧係数を形成することを特徴とする請求項4に記載の突発音抑圧装置。
- 上記抑圧係数計算部は、音源方位抑圧信号のレベルの逆数を計算し、その逆数に応じて抑圧係数を形成することを特徴とする請求項4に記載の突発音抑圧装置。
- 上記抑圧係数計算部は、一旦得られた抑圧係数に対し、フロアリング処理及び飽和処理の少なくとも一方を施すことを特徴とする請求項4〜6のいずれかに記載の突発音抑圧装置。
- 振動を検出する振動検出手段をさらに備え、
上記突発音抑圧手段は、検出された振動レベルが閾値以上であることを条件として突発音を抑圧する
ことを特徴とする請求項1〜7のいずれかに記載の突発音抑圧装置。 - 音源方位抑圧信号生成手段及び突発音抑圧手段を備え、
上記音源方位抑圧信号生成手段が、少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成し、
上記突発音抑圧手段が、生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する
ことを特徴とする突発音抑圧方法。 - コンピュータを、
少なくとも2本のマイクロホンが周囲音を捕捉して得られた入力音信号に基づき、目的音音源の方位に死角を有する音源方位抑圧信号を生成する音源方位抑圧信号生成手段と、
生成された音源方位抑圧信号に基づいて、上記入力音信号に含まれている、突発的に発生した大振幅の雑音成分である突発音を抑圧する突発音抑圧手段と
して機能させることを特徴とする突発音抑圧プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014159603A JP2016039399A (ja) | 2014-08-05 | 2014-08-05 | 突発音抑圧装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014159603A JP2016039399A (ja) | 2014-08-05 | 2014-08-05 | 突発音抑圧装置、方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016039399A true JP2016039399A (ja) | 2016-03-22 |
Family
ID=55530184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014159603A Pending JP2016039399A (ja) | 2014-08-05 | 2014-08-05 | 突発音抑圧装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016039399A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018032931A (ja) * | 2016-08-23 | 2018-03-01 | 沖電気工業株式会社 | 音響信号処理装置、プログラム及び方法 |
-
2014
- 2014-08-05 JP JP2014159603A patent/JP2016039399A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018032931A (ja) * | 2016-08-23 | 2018-03-01 | 沖電気工業株式会社 | 音響信号処理装置、プログラム及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102512311B1 (ko) | 이어버드 스피치 추정 | |
US10535362B2 (en) | Speech enhancement for an electronic device | |
KR101116013B1 (ko) | 잡음 억압 장치, 잡음 억압 방법 및 휴대 전화기 | |
US20230352038A1 (en) | Voice activation detecting method of earphones, earphones and storage medium | |
CN108604452B (zh) | 声音信号增强装置 | |
Braun et al. | Dereverberation in noisy environments using reference signals and a maximum likelihood estimator | |
WO2016027680A1 (ja) | 音声処理装置、音声処理方法、並びにプログラム | |
GB2581596A (en) | Headset on ear state detection | |
JP2007003702A (ja) | 雑音除去装置、通信端末、及び、雑音除去方法 | |
JP6135106B2 (ja) | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
CN112019967B (zh) | 一种耳机降噪方法、装置、耳机设备及存储介质 | |
US20140244245A1 (en) | Method for soundproofing an audio signal by an algorithm with a variable spectral gain and a dynamically modulatable hardness | |
CN104505099A (zh) | 去除语音信号中已知干扰的方法和设备 | |
KR101182017B1 (ko) | 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치 | |
JP2016042613A (ja) | 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP2016039399A (ja) | 突発音抑圧装置、方法及びプログラム | |
WO2020110228A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
WO2011149969A2 (en) | Separating voice from noise using a network of proximity filters | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP2015070291A (ja) | 集音・放音装置、音源分離ユニット及び音源分離プログラム | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム |