JP5530741B2 - 残響抑圧装置及び残響抑圧方法 - Google Patents

残響抑圧装置及び残響抑圧方法 Download PDF

Info

Publication number
JP5530741B2
JP5530741B2 JP2010029501A JP2010029501A JP5530741B2 JP 5530741 B2 JP5530741 B2 JP 5530741B2 JP 2010029501 A JP2010029501 A JP 2010029501A JP 2010029501 A JP2010029501 A JP 2010029501A JP 5530741 B2 JP5530741 B2 JP 5530741B2
Authority
JP
Japan
Prior art keywords
sound source
dereverberation
delay
sound
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010029501A
Other languages
English (en)
Other versions
JP2010193451A (ja
Inventor
弘史 中島
一博 中臺
雄二 長谷川
豊 金田
徹 醍醐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of JP2010193451A publication Critical patent/JP2010193451A/ja
Application granted granted Critical
Publication of JP5530741B2 publication Critical patent/JP5530741B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/009Signal processing in [PA] systems to enhance the speech intelligibility

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、残響抑圧装置及び残響抑圧方法に関する。
残響抑圧処理は,遠隔会議通話または補聴器における明瞭度の向上およびロボットの音声認識(ロボット聴覚)に用いられる自動音声認識の認識率の向上を目的として、自動音声認識の前処理として利用されている重要な技術である(例えば、特許文献1参照)。従来、処理によって非線形歪が発生せず、理論上高精度な残響抑圧が可能な逆フィルタ理論(Multiple−input/output INverse−filtering Theorem、以下、「MINT」と称する)に基づく残響抑圧処理が提案されている(例えば、非特許文献1参照)。ロボット聴覚の自動音声認識の残響抑圧処理には、音響伝達特性の事前測定が必要なく(ブラインド)、リアルタイムの処理ができ、処理によって非線形歪が発生しないという3つの条件を満たす必要がある。
上記3つの条件を満たす手法として、MINTに基づく残響抑圧法であるセミブラインドMINT(Semi−Blind−MINT、以下、「SBM」と称する)(例えば、非特許文献2参照)と、適応無相関化逆フィルタ(Decorrelation−based Adaptive Inverse Filtering、以下、「DAIF」と称する)(例えば、非特許文献3参照)がある。
一般的な残響抑圧手法であるSBMやDAIFにおいては、初期到達チャネルが既知であるという仮定がある。この仮定を満たさない場合は、残響抑圧性能が著しく低下するという課題がある。遠隔会議通話のように、音源位置がある限られた範囲に限定できる場合には、マイクロホン位置を工夫することで初期到達チャネルを既知とすることができる。
特開平9―261133号公報
M. Miyoshi and Y. Kaneda, "Inverse filtering of room acoustics," IEEE Transactions on Speech and Audio Processing,vol.36, no.2, pp.145-152, 1988 古家賢一、片岡章俊、"チャネル間相関行列と白色化フィルタを用いたsemi−blind残響抑圧、"電子情報通信学会論文誌、vol.J88−A、no.10、pp.1089−1099、2005 中島弘史、中臺一博、長谷川雄二、辻野広司、"適応無相関化逆フィルタ処理によるブラインド残響抑圧、"日本音響学会講演論文集(秋)、pp.713−714、2008
しかしながら、ロボット聴覚のように、音源があらゆる位置に存在する可能性がある場合には、初期到達チャネルを予め想定することができないという問題がある。
そこで本発明は、上記問題に鑑みてなされたものであり、その目的は、初期到達チャネルが未知の場合においても残響抑圧することができる残響抑圧装置及び残響抑圧方法を提供することにある。
上記の課題を解決するために、請求項1に記載した発明は、複数の音響信号のうち少なくとも一つの音響信号を所定の遅延時間だけ遅らせた遅延付加済信号を生成する遅延付加手段(例えば、実施形態における遅延付加部41)と、前記遅延付加済信号を用いて残響抑圧処理を行う残響抑圧処理手段(例えば、実施形態における残響抑圧処理部23j)と、前記音響信号に基づいて音源方向を推定する音源方向推定手段(例えば、実施形態における音源方向推定部141)と、を備え、前記遅延付加手段は、前記音響信号を収集する複数の集音装置の間の距離と、前記音源方向推定手段によって推定された音源方向とに基づいて前記遅延時間を算出することを特徴とする。これにより、代表チャネル以外の入力信号に遅延を付加することにより、予め決定した代表チャネルを、音響信号が最初に到達するチャネルに設定することができる。また、音源方向の推定の精度が良くない場合でも、音源方向の推定結果とマイクロホン間の距離の両方に基づいて、信号に与える遅延時間を定めることができる。
請求項に記載した発明は、請求項1に記載の発明において、音響信号を収集する複数の集音装置(例えば、実施形態におけるマイクロホン11j)を備えることを特徴とする。これにより、代表チャネル以外の入力信号に遅延を付加することにより、予め決定した代表チャネルを、マイクロホンからの音響信号が最初に到達するチャネルに設定することができる。
請求項に記載した発明は、音響信号が入力される複数の音響信号入力手順と、前記複数の音響信号入力手順のうち少なくとも一つの前記音響信号入力手順に入力される音響信号を所定の遅延時間だけ遅らせた遅延付加済信号を生成する遅延付加手順と、前記遅延付加済信号を用いて残響抑圧処理を行う残響抑圧処理手順と、前記音響信号に基づいて音源方向を推定する音源方向推定手順と、を有し、前記遅延付加手順において、前記音響信号を収集する複数の集音装置の間の距離と、前記音源方向推定手順によって推定された音源方向とに基づいて前記遅延時間を算出することを特徴とする。
請求項1に記載した発明によれば、予め決定した代表チャネルを、音響信号が最初に到達するチャネルに設定することができるので、初期到達チャネルが未知の場合においても精度良く残響を抑圧することができる。また、音源方向の推定結果とマイクロホン間の距離の両方に基づいて信号に与える遅延時間を定めることができるので、どの方向から音が到来しても精度良く残響を抑圧することができる。
請求項に記載した発明によれば、予め決定した代表チャネルを、マイクロホンからの音響信号が最初に到達するチャネルに設定することができるので、初期到達チャネルが未知の場合においても精度良く残響を抑圧することができる。
請求項に記載した発明によれば、予め決定した代表チャネルを、音響信号が最初に到達するチャネルに設定することができるので、初期到達チャネルが未知の場合においても精度良く残響を抑圧することができる。また、音源方向の推定結果とマイクロホン間の距離の両方に基づいて信号に与える遅延時間を定めることができるので、どの方向から音が到来しても精度良く残響を抑圧することができる。
本発明の実施形態としての残響抑圧装置のブロック構成図である。 本発明の第一の実施例における残響抑圧装置の演算処理部のブロック構成図である。 チャネル選択部の処理を説明するための図である。 遅延付加部の処理を説明するための図である。 MINTによる残響抑圧処理を説明するための図である。 リアルタイムDAIFによる残響抑圧処理部のブロック構成図である。 インパルス応答の測定条件を示した表である。 マイクロホンの配置とインパルス応答波形を説明するための図である。 実験手順を説明するための図である。 実験で用いたチャネル数とその使用チャネルを示した表である。 利用チャネル数と残響抑圧量の関係を説明するための図である。 全てのチャネルの組み合わせに対する残響抑圧量を説明するための図である。 遅延を付加した時の、全てのチャネルの組み合わせに対する残響抑圧量を説明するための図である。 本発明の第二の実施例における残響抑圧装置の演算処理部のブロック構成図である。 基準マイクロホン、対象マイクロホンおよび音源の位置関係を説明するための図である。
以下、本発明を実施形態について、図面を参照して詳細に説明する。従来の残響抑圧処理では、一般的にチャネル数が多いほど残響抑圧性能が高いため、利用できる全てのチャネルを使って残響抑圧処理を行っていた。しかしマイクロホンの配置によっては、音源からマイクロホンまでの音響伝達関数(以下、インパルス応答と称する)が類似したチャネルが存在するため、必ずしも多くのチャネルを使うことで性能が向上するとは限らない。そこで、本発明の実施例1では、利用するチャネルを選択する処理(チャネル選択) を行う。
図1は、本発明の一実施形態としての残響抑圧装置のブロック構成図である。残響抑圧装置はマイクロホン11(jは1からNまでの整数)と、電子制御ユニット12とを有する。電子制御ユニット12は、ROM13と、A/D変換部14と、演算処理部15と、RAM16とから構成されている。音声が入力されたマイクロホン11は、音声を電気信号に変換し、当該変換した電気信号をA/D変換部14に出力する。A/D変換部14は、マイクロホン11から入力されたアナログの電気信号をデジタル信号に変換する。A/D変換部14は、当該デジタル信号を演算処理部15に出力する。演算処理部15は、制御プログラムをROM12から読み出し、A/D変換部14から入力されたデジタル信号に対して、残響抑圧演算を行い、残響抑圧された信号をRAM16に書き込む。
図2は、本発明の演算処理部15の処理の一実施例(実施例1)のブロック構成図である。演算処理部15は、チャネル選択部(CS)22と、残響抑圧処理部(DM)23とから構成されている。
チャネル選択部(CS)22は、A/D変換部14から入力された音声信号x(jは1からLまでの整数)から、数チャネルを選択する。各チャネル選択部22は、選択したチャネルを残響抑圧処理部(DM)23(jは1からLまでの整数)へ出力する。
残響抑圧処理部(DM)23は、入力された信号に残響抑圧処理を行い、残響抑圧された信号y(jは1からNまでの整数)をRAM16に出力し、当該残響抑圧された信号yをRAM16に保存する。
図2に示すように、各チャネル選択部22はN個の入力から、所定の個数のチャネルを選択し、選択したチャネルを残響抑圧処理部23に出力する。
従来の残響抑圧処理では、一般的にチャネル数が多いほど残響抑圧性能が高いため、利用できる全てのチャネルを使って処理を行っていた。しかし、マイクロホンの配置によっては類似したインパルス応答をもつチャネルが存在するため、必ずしも多くのチャネルを使う方が高性能とは限らない。本実施例では、残響抑圧処理部(DM)23で残響抑圧する前に、利用するチャネルを選択する処理(チャネル選択) を行う。図3を用いて、チャネル選択部の処理を説明する。チャネル選択部22は、N個の入力の内、所定の個数のチャネルのみ選択し、当該選択したチャネルを残響抑圧処理部23に出力する。この処理により、残響抑圧性能をほとんど低下させることなくチャネル数を削減することができる。チャネル数の削減は、ハードウェアのコスト削減に対して有効である。
SBMおよびDAIFでは、初期到達チャネルが既知であるという仮定があり、この条件を満たさない場合、すなわち初期到達チャネルが想定と異なる場合、残響抑圧性能は著しく低下する。初期到達チャネルは、遠隔会議通話のように音源位置がある限られた範囲に限定できる場合には、マイクロホン位置を工夫することで、既知とすることができる。しかし、ロボット聴覚のように、音源があらゆる位置に存在する可能性がある場合、初期到達チャネルを予め仮定することは困難である。本実施例では、この問題を解決するため、複数の入力チャネルのうち代表チャネル以外の入力信号に遅延を付加し、代表チャネルが必ず初期到達チャネルになるようにする。本実施例では、最も離れたマイクロホン間の距離を伝播するのに要する時間よりも長い時間を遅延時間に設定する。
図4を用いて、遅延付加部の処理を説明する。遅延付加部41は、図4に示すように、A/D変換部14から入力されたN個の信号のうち、代表チャネル(1ch)以外の選択チャネル2chからNch(Nは2以上の整数)に遅延を付加する。遅延付加部41は、遅延を付与した信号を残響抑圧処理部23に出力する。
残響抑圧処理部23は、入力された信号に残響抑圧フィルタをかけ、当該残響抑圧フィルタを掛けた信号を出力する。ここで、残響抑圧処理部23における処理の詳細について説明する。まず、SBMのフィルタ処理を説明する前に、その基礎となるMINT(例えば、非特許文献1参照)について説明する。MINTは、FIRフィルタで正確な逆フィルタを実現するための条件を明らかにした理論である。MINTによれば、M個の音源から伝播された信号をN点で観測する場合、観測信号から正確に音源信号を再現するためには、N>Mでありかつ各音源から観測点までの伝達関数に共通の零点を持たない必要がある。本実施例では、残響抑圧の対象となる音源を1つと仮定しているため、以後の定式化においても、音減数を1に限定して説明する。
図5は、N個のマイクロホン(Mic.)を用いた残響抑圧システムを説明するための図である。ここでs(k)は音源信号、kは離散時間、g(k)は音源からj番目のマイクロホンまでの長さKの室内インパルス応答(既知)、Nはマイクロホン数(N>1)、x(k)(j=1,…,N)はj番目のマイクロホンでの受音信号、h(k)はg(k)の逆フィルタを構成する長さLのFIRフィルタ(未知)、y(k)は逆フィルタ出力を示す。g(k)、h(k)のz変換をそれぞれG(z)、H(z)と表すと、正確な逆フィルタを構成するためには、下記式(01)を満たす必要がある。
(z)H(z)+G(z)H(z)+,…,+G(z)H(z) =1 ...(01)
上記式(01)はディオファンタス方程式と呼ばれ、複数の解をもつ不定方程式である。式(01) をz多項式の係数(インパルス応答の値) を用いて行列で表すと、下記式(02)のように表すことができる。
D=GH ...(02)
ここでGは下記式(03)で表す(K+L−1)×NLの行列、Hは下記式(04)で表すNL行の列ベクトル、Dは[10,…,0]の列ベクトルである。
G=[G,…,G] ...(03)
H =[h,…, h] ...(04)
ここでGはgを要素とした畳み込み行列であり、gとhは下記式(05)と(06)で表される。(参考文献)大賀種敏、山崎芳男、金田豊、音響システムとディジタル処理、コロナ社、1995
=[g(0) ,…,g(K−1)]T ...(05)
=[h(0) ,…, h(L−1)]T ...(06)
Gは測定等により既知であるとすれば、逆フィルタの係数HはGの逆行列から求めることができ、下記式(07)で表される。
H=G−1D ...(07)
ただし、Gが逆行列をもつためには、(A)K+L−1=NL、(B)|G|≠0 である必要がある。なお、MINTが示した2つの条件(1)逆フィルタの数(=マイク数)N と係数長Lの制約、(2)伝達系に共通の零点がないという条件は、上記(A)(B)に由来している。
次に、SBMについて説明する。MINTでは対象となる系の伝達関数が既知であるという制約があるため、利用の際には事前に伝達関数を測定する必要がある。しかし、伝達関数を事前に測定する事は、実際には困難な場合も多く、利用する際の課題となっていた。SBMは以下の条件(a)と(b)を仮定することで、この課題を解決した手法である。
(a)音源は白色信号(音声などの有色音源は、白色化処理を加えることで利用可能)
(b)音源から発せられた音が最初に到達するチャネル(初期到達チャネル) は既知
次に、フィルタ処理部42におけるSBMのフィルタ処理について説明する。フィルタ処理部42では、入力信号Xに逆フィルタHを掛けて、逆フィルタHを掛けた信号をRAM16に書き込む。逆フィルタHは、入力信号Xの相関行列Rから、下記式(08)で表される(非特許文献2)。
H=g(0)R−1D ...(08)
また、上式(08)の計算時には、高速フーリエ変換(FFT)と共役勾配法(Conjugate Gradient、以下、CGと称する)を用いて計算量を低減したSBM(FFT−CG−SBM)を利用する。(参考文献)古家賢一、片岡章俊、“遠方音声収音のためのリアルタイム残響抑圧処理、”電子情報通信学会技術研究報告、vol.105、no.9、pp.13−18、2005
続いて、リアルタイムDAIF(Real−time DAIF、以下、RDAIFと称する)による処理の場合、図6のブロック構成図に示すように、残響抑圧処理部(DM)23は、逆フィルタ処理部62と、逆フィルタ算出部63とを有する。
フィルタ処理部62は、入力された信号x(k)に逆フィルタH(k)をかけ、逆フィルタを掛けた信号y(k)を逆フィルタ算出部63に出力し、RAM16に書きこむ。
フィルタ算出部63は、チャネル選択部22または遅延付加部41(但し、遅延付加部41がある場合に限る)から入力された信号x(k)と、逆フィルタ処理部62から入力された信号y(k)から、次のステップの逆フィルタH(k+1)を算出し、逆フィルタ処理部62に出力する。
続いて、逆フィルタHの算出方法について説明する。DAIFは入力と出力の無相関化に基づき適応的に逆フィルタを設計する手法である。この手法はMINTの条件(A)K+L−1=NLを擬似逆行列により緩和した理論を基礎としている。そのためSBMと同様、前述(a)(b)の条件を仮定する。またフィルタ長をMINTに従って定めた場合、SBMを最急降下法で求める手法と理論的に等価である。簡略化のためスケールファクタg(0) を1とし、式(08)の誤差は、下記式(09)で表される。
E=D−RH ...(09)
DAIFでは勾配法を用いてEのフロベニウスノルムを最小化するHを下式(10)と(11)により適応的に求める。
H(k+1)=H(k)−μJ′(k) ...(10)
J′(k)=−R(k)(D−R(k)H(k)) ...(11)
ここで、μはステップサイズパラメータを表す。
RDAIF(Real−time DAIF)はDAIFに対して以下の2つの仮定を置くことで、上式(11)の行列演算をベクトル演算に変更し、使用メモリと演算量を大幅に低減した手法である。RDAIFでは、下記式(12)と(13)の仮定を設ける。
(k)R(k)≒E{x(k)x(k)x(k)x(k)} ...(12)
R(k)H(k)=E{x(k)x(k)}H(k)≒E{x(k)y(k)} ...(13)
ここで、E{x(k)}はx(k)の期待値を表している。RDAIFでは、式(11)の行列部を、下記式(14)で表されるように全てベクトルにすることにより、演算量を低減する。
J′(k)=−E{x(k)x(k)}+E{x(k)|x(k)| (k)} ...(14)
続いて、本実施例の残響抑圧の有効性を確認するために行った評価実験の結果について説明する。はじめに実験条件について説明する。残響抑圧処理部23の手法は、伝達系のインパルス応答長が長い場合でも利用可能な方法であるFFT−CG−SBMとRDAIFを用いた。(1)伝達系のインパルス応答、(2)音源信号、(3)残響抑圧性能の評価値および(4)パラメータは、以下の通りである。
(1)伝達系のインパルス応答は、実測したデータを加工して作成した。実測時の測定条件は図7の通りである。図8aは、8チャネルのマイクロホン81の設置位置を示した図である。同図中で、マイクロホン81の位置は、円で示されている。
伝達系のインパルス応答の利用時には、実測したインパルス応答を2048サンプル(667[ms])で切り出した波形を用いた。図8bは、伝達系のインパルス応答波形の初期部の拡大図である。図8bは、横軸が時間、縦軸が振幅であり、濃淡を変えて全8チャネルの波形を重ねて表示したものである。どのチャネルも500[ms]程度で収束する波形となっている。
(2)音源信号は平均値0、分散1の白色ガウス雑音とし、評価用のマイクロホンへの入力信号は、インパルス応答を畳み込むことによって作成した。評価用の信号長は、217サンプルとする。
(3)続いて、残響抑圧性能の評価値について説明する。残響は拡散性の低い初期反射音と拡散性の高い後部残響音に分けられる。本実施例で扱うSBMおよびRDAIFは、逆フィルタに基づく残響抑圧方式であるため、初期反射音の抑圧に対して効果的である。このため、本実施例では5から50[ms]の初期反射音の抑圧量を評価値とした。評価値の計算は、応答の0から5[ms]を直接音、5から50[ms]を初期反射音とみなし、50[ms]までの信号エネルギーで正規化した初期反射エネルギーLD[dB]を用いて行う。
Figure 0005530741
ここで、τ[s]は時間で、g(τ)はインパルス応答波形である。log10の中の分母は、全体のエネルギー(直接音のエネルギーと初期反射音のエネルギーの総和)を表し、log10の中の分子は、初期反射音のエネルギーを表している。
評価値は、残響抑圧処理前と処理後のLDの比を残響抑圧量(Reverberation Reduction Rate、以下、RRRと称する) [dB]として、次式で定義する。
RRR=LD5b−LD5a ...(16)
ここで、LD5bは残響抑圧処理前の初期反射エネルギーを示し、LD5aは残響抑圧処理後の初期反射エネルギーを示す。なおRRR=0[dB]とはLDにより評価した残響量が変化しないことを意味し、RRRが大きいほど残響抑圧量が大きいことを意味する。
(4)続いて、実験のパラメータに関して説明する。FFTcCG−SBMにおける逆行列算出時の正規化係数Δは、行列要素の絶対値最大値の0.01倍とし、RDAIFにおけるステップサイズμは、適応ステップサイズ法(Adaptive Step Size parameter)により得られる最適値の0.1倍とする。フィルタ長は両手法ともにMINTに従って定める。
続いて、実験手順について説明する。図9に示すように残響抑圧フィルタの設計と設計したフィルタの評価との2段階の手順の実験を行い、残響抑圧性能を評価する。まず、残響抑圧フィルタの設計として、白色信号wにインパルス応答gを畳み込み残響信号を作成する(ステップ S101)。次に、残響信号からSBMまたはDAIFにより残響抑圧フィルタhを計算する(ステップ S102)。
次に、設計した残響抑圧フィルタの評価の手順として、元のインパルス応答gに設計した残響抑圧フィルタhを畳み込む(ステップ S103)。次に、元のインパルス応答gと残響抑圧されたインパルス応答の畳み込みg*hを用いて、それぞれ正規化した初期反射エネルギーLDを算出し、残響抑圧量RRRを算出する(ステップ S104)。
続いて、実験結果について説明する。まず、マイクロホン数と抑圧性能の傾向を把握する実験を行った。実験では、はじめに代表的な2チャネルを選択し、図10に示すように、1チャネルずつ使用チャネルを加えて、2から8チャネルを使用した場合の残響抑圧量RRRを評価した。図11はその結果をチャネル数と残響抑圧量の関係を表しておる。横軸はチャネル数、縦軸は残響抑圧量RRRである。同図より、FFT−CG−SBM111ではチャネル数と性能はほぼ単調増加の傾向にあるが、4から5チャネルに増加する際には性能が低下している。またRDAIF112では8チャネルより4チャネルの方が高性能である。
以上により、残響抑圧性能をほとんど低下させることなくチャネル数を削減することができる。また、チャネル選択がハードウェアのコストを削減するだけでなく、性能も向上させることが明らかとなった。
次に、最適なチャネル選択を行う処理の評価実験を行った。選択するチャネル数はユーザが指定するものとし、本実験では3とした。ここで、最適なチャネル選択の組み合わせは、全数探索(全ての組み合わせで性能評価)し、最高性能を示したチャネルの組み合わせである。また、全ての組み合わせは、=336から、336通りである。
図12は、チャネルの組み合わせと残響抑圧量の関係を示している。横軸はマイクロホンのチャネルの組み合わせの通し番号、縦軸はRRRである。なお通し番号は,残響抑圧量(縦軸の値)が大きい順に並べている。図中の水平破線は、全8チャネルを利用した場合(従来法)の性能である。図12より、チャネルの組み合わせによって、FFT−CG−SBM121では12[dB]以上、RDAIF122では4[dB]以上の差があることがわかる。
本処理により最適な組み合わせ(最も左側)を選択した場合、3チャネルを用いたFFT−CG−SBMでは全8チャネルを利用した従来法とほぼ同程度、RDAIFでは従来法よりも約1.5[dB]高い抑圧性能が得られている。以上より、本実施例が残響抑圧性能を低下させること無く、チャネル数を削減でき、有効であることが確認された。なお図中でFFT−CG−SBM121のRRRが急峻に低下する組み合わせの境(垂直破線) は、初期到達チャネルが既知という条件を満たしている組み合わせとそうでない組み合わせの境であり、当該条件を満たさない場合に性能が著しく低下することがわかる。
次に、初期到達チャネルが既知という条件を緩和するため、遅延付加処理を行った実験結果について説明する。実験では、前記のチャネル選択処理で選択された3チャネルの信号のうち、代表信号以外の2つの信号に対して遅延を付加した。
本実施例では、最も離れたマイクロホン間の距離を伝播するのに要する時間よりも長い時間を遅延時間に設定する。遅延時間の算出方法は以下の通りである。マイクは直径0.3[m]の円状に配置されているため、最大マイク間距離は0.3[m]である。音速が約300[m/s]であることを考慮すると、最大マイク間距離を音が伝搬するのにかかる時間は、0.3[m]/300[m/s]=0.001[s]=1[ms]より、約1[ms]である。マイク間で信号の開始時刻が同時にならないようにするために、1[ms]に微小な遅延時間0.5[ms]を加えて、代表信号以外の2つの信号のうち1つの信号に与える遅延時間を1.5[ms]とする。また、残ったもう1つの信号に与える遅延時間をその2倍の3[ms]とする。なお、理論上は、初期到達チャネル以外の2つの信号に与える遅延時間は同じ遅延時間でも良い。
図13は、遅延付加による残響抑圧性能の変化を示している。縦軸および横軸は、図12と同様であり、太い線が遅延付加なし(図12と同様)、細い線が遅延付加ありの結果である。同図より、遅延付加がない場合(例えば、FFT−CG−SBM121)よりも遅延付加を行った場合(例えば、FFT−CG−SBM delay131)の方が概ね性能が高い事がわかる。特にFFT−CG−SBM121において、初期到達チャネルの条件を満たさなかった組み合わせにおいては6[dB]以上の大きな性能向上がみられる。またRDAIF delay132は、RDAIF122と比較して、約7割の組み合わせにおいて性能が向上し、逆に性能が低下した組み合わせにおいても、その低下度は少ない。
以上より、遅延を付加することにより、初期到達チャネルが既知でない場合にも、FFT−CG−SBMまたはRDAIFを用いて残響抑圧処理ができる。また、多くのチャネル組み合わせで残響抑圧処理の性能向上が可能である。
続いて、信号に与える遅延時間の算出方法の第二の実施例について、図面をもちいて説明する。図14は、本発明の第二の実施例における残響抑圧装置の演算処理部15のブロック構成図である。演算処理部15は、音源方向推定部141と、遅延付加部142と、残響抑圧処理部143とから構成されている。
音源方向推定部141は、A/D変換部14から入力された音響信号から音源方向を推定し、当該推定した音源方向を遅延付加部142に出力する。音源方向推定部141は、既知の音源推定方法(例えば、MUltiple SIgnal Classificationまたは走査ビームフォーミングを用いた音源探査)を用いて、音源を推定する。
遅延付加部142は、音源方向推定部141から入力された音源方向に基づいて、各チャネルに付加する遅延時間を算出し、当該遅延時間を音響信号に付加し、当該遅延時間を付加した遅延付加済信号を残響抑圧処理部143に出力する。
残響抑圧処理部143は、遅延付加部142から入力された遅延付加済信号に逆フィルタをかけて残響を抑圧した残響抑圧信号を算出し、当該残響抑圧信号をRAM16に出力し、当該残響抑圧信号をRAM16に保存する。
次に、遅延付加部142の処理の詳細について説明する。図15は基準マイクロホン、対象マイクロホンおよび音源の位置関係を説明するための図である。基準マイクロホン151と対象マイクロホン152を結ぶ直線と、音の到来方向を示す線のなす角度をθ(θ≧0)とする。θが0から90度の範囲にある場合、基準マイクロホンよりも先に対象マイクロホンに音が到達する。θが90度よりも大きい場合、対象マイクロホンよりも先に基準マイクロホンに音が到達するので、対象マイクロホンが受信した信号に遅延を与える必要はない。
遅延付加部142は、設定する遅延時間tを、以下の式(17)から算出する。
t=Dcos(θ)/c+a ...(17)
ここで、Dはマイク間距離、cは音速、aは微小な遅延定数である。微小な遅延定数aは、マイク間で信号の開始時刻が同時にならないようにするためである。音源153の存在範囲によって、式(17)のθを以下のように設定する。
(1)θが不明の時には、マイク間の距離が最大になるように、上式(17)のθを0度に設定する。
(2)θの範囲がθ≧θminというように限定される場合には、上式(17)のθをθminに設定する。
(3)音の到来方向を、音源方向推定部141が推定できる場合には、上式(17)のθを推定された角度θestに設定する。
以上のように、音の到来方向範囲が限定されている場合は、その範囲の中で最も遅延が大きくなる時間を基に、信号に与える遅延時間を定めることができる。
なお、音源方向の推定の精度が良くない場合、音源方向の推定結果とマイクロホン間の距離の両方に基づいて遅延時間を算出してもよい。具体的には、例えば、推定された音源方向に近い複数のマイクロホン間の距離のうち、最も距離が離れている距離を音速で割ることにより、遅延時間を算出する。これによって、音源方向の推定の精度が良くない場合でも、適切に遅延時間を算出することができる。
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
11、11、11 マイクロホン(集音装置)
12 電子制御ユニット
13 ROM
14 A/D変換部
15 演算処理部
16 RAM
22、22、22 チャネル選択部(信号選択手段)
23、23、23 残響抑圧処理部(残響抑圧処理手段)
41 遅延付加部(遅延付加手段)
62 逆フィルタ処理部
63 逆フィルタ算出部
141 音源方向推定部(音源方向推定手段)
142 遅延付加部(遅延付加手段)
143 残響抑圧処理部(残響抑圧処理手段)
151 基準マイクロホン
152 対象マイクロホン
153 音源

Claims (3)

  1. 複数の音響信号のうち少なくとも一つの音響信号を所定の遅延時間だけ遅らせた遅延付加済信号を生成する遅延付加手段と、
    前記遅延付加済信号を用いて残響抑圧処理を行う残響抑圧処理手段と、
    前記音響信号に基づいて音源方向を推定する音源方向推定手段と、
    を備え、
    前記遅延付加手段は、前記音響信号を収集する複数の集音装置の間の距離と、前記音源方向推定手段によって推定された音源方向とに基づいて前記遅延時間を算出する
    とを特徴とする残響抑圧装置。
  2. 前記音響信号を収集する複数の前記集音装置、
    を備えることを特徴とする請求項1に記載の残響抑圧装置。
  3. 音響信号が入力される複数の音響信号入力手順と、
    前記複数の音響信号入力手順のうち少なくとも一つの前記音響信号入力手順に入力される音響信号を所定の遅延時間だけ遅らせた遅延付加済信号を生成する遅延付加手順と、
    前記遅延付加済信号を用いて残響抑圧処理を行う残響フィルタ処理手順と、
    前記音響信号に基づいて音源方向を推定する音源方向推定手順と、
    を有し、
    前記遅延付加手順において、前記音響信号を収集する複数の集音装置の間の距離と、前記音源方向推定手順によって推定された音源方向とに基づいて前記遅延時間を算出する
    とを特徴とする残響抑圧方法。
JP2010029501A 2009-02-13 2010-02-12 残響抑圧装置及び残響抑圧方法 Expired - Fee Related JP5530741B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15235509P 2009-02-13 2009-02-13
US61/152,355 2009-02-13

Publications (2)

Publication Number Publication Date
JP2010193451A JP2010193451A (ja) 2010-09-02
JP5530741B2 true JP5530741B2 (ja) 2014-06-25

Family

ID=42559923

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010029501A Expired - Fee Related JP5530741B2 (ja) 2009-02-13 2010-02-12 残響抑圧装置及び残響抑圧方法
JP2010029500A Active JP5620689B2 (ja) 2009-02-13 2010-02-12 残響抑圧装置及び残響抑圧方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010029500A Active JP5620689B2 (ja) 2009-02-13 2010-02-12 残響抑圧装置及び残響抑圧方法

Country Status (2)

Country Link
US (1) US8867754B2 (ja)
JP (2) JP5530741B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10283115B2 (en) 2016-08-25 2019-05-07 Honda Motor Co., Ltd. Voice processing device, voice processing method, and voice processing program

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5550456B2 (ja) * 2009-06-04 2014-07-16 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
EP2647005B1 (en) 2010-12-03 2017-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for geometry-based spatial audio coding
US9406310B2 (en) * 2012-01-06 2016-08-02 Nissan North America, Inc. Vehicle voice interface system calibration method
BR112015020150B1 (pt) 2013-02-26 2021-08-17 Mediatek Inc. Aparelho para gerar um sinal de fala, e, método para gerar um sinal de fala
CN105122359B (zh) 2013-04-10 2019-04-23 杜比实验室特许公司 语音去混响的方法、设备和系统
JP5841986B2 (ja) * 2013-09-26 2016-01-13 本田技研工業株式会社 音声処理装置、音声処理方法、及び音声処理プログラム
US9390723B1 (en) * 2014-12-11 2016-07-12 Amazon Technologies, Inc. Efficient dereverberation in networked audio systems
US9881630B2 (en) * 2015-12-30 2018-01-30 Google Llc Acoustic keystroke transient canceler for speech communication terminals using a semi-blind adaptive filter model
JP6536550B2 (ja) * 2016-12-08 2019-07-03 トヨタ自動車株式会社 ボルト軸力測定装置及びボルト軸力測定方法
US11843910B2 (en) * 2018-11-12 2023-12-12 Nippon Telegraph And Telephone Corporation Sound-source signal estimate apparatus, sound-source signal estimate method, and program

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4087633A (en) * 1977-07-18 1978-05-02 Bell Telephone Laboratories, Incorporated Dereverberation system
US4131760A (en) * 1977-12-07 1978-12-26 Bell Telephone Laboratories, Incorporated Multiple microphone dereverberation system
JPH09140000A (ja) 1995-11-15 1997-05-27 Nippon Telegr & Teleph Corp <Ntt> 会議用拡聴器
JPH09261133A (ja) 1996-03-25 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 残響抑圧方法および装置
US5774562A (en) * 1996-03-25 1998-06-30 Nippon Telegraph And Telephone Corp. Method and apparatus for dereverberation
JP3688934B2 (ja) * 1999-04-16 2005-08-31 アルパイン株式会社 マイクロホンシステム
JP2003099100A (ja) * 2001-09-21 2003-04-04 Matsushita Electric Ind Co Ltd 音声認識装置およびその方法
JP2004133403A (ja) * 2002-09-20 2004-04-30 Kobe Steel Ltd 音声信号処理装置
JP4774100B2 (ja) * 2006-03-03 2011-09-14 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体
JP4729534B2 (ja) * 2007-05-25 2011-07-20 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム、および、その記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10283115B2 (en) 2016-08-25 2019-05-07 Honda Motor Co., Ltd. Voice processing device, voice processing method, and voice processing program

Also Published As

Publication number Publication date
JP2010191425A (ja) 2010-09-02
JP2010193451A (ja) 2010-09-02
US8867754B2 (en) 2014-10-21
JP5620689B2 (ja) 2014-11-05
US20100208904A1 (en) 2010-08-19

Similar Documents

Publication Publication Date Title
JP5530741B2 (ja) 残響抑圧装置及び残響抑圧方法
JP3940662B2 (ja) 音響信号処理方法及び音響信号処理装置及び音声認識装置
CN108141656B (zh) 用于麦克风的数字信号处理的方法和装置
DK2916321T3 (en) Processing a noisy audio signal to estimate target and noise spectral variations
KR101340215B1 (ko) 멀티채널 신호의 반향 제거를 위한 시스템, 방법, 장치 및 컴퓨터 판독가능 매체
JP6584930B2 (ja) 情報処理装置、情報処理方法およびプログラム
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP6196320B2 (ja) 複数の瞬間到来方向推定を用いるインフォ−ムド空間フィルタリングのフィルタおよび方法
JP6074263B2 (ja) 雑音抑圧装置及びその制御方法
CN110211602B (zh) 智能语音增强通信方法及装置
CN108293170B (zh) 波束成形应用中的自适应无相位失真幅度响应均衡的方法及装置
WO2013009949A1 (en) Microphone array processing system
JP5785674B2 (ja) デュアルマイクに基づく音声残響低減方法及びその装置
JP5123595B2 (ja) 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法
JP2001309483A (ja) 収音方法および収音装置
JP2007336232A (ja) 特定方向収音装置、特定方向収音プログラム、記録媒体
JP2011203414A (ja) 雑音及び残響抑圧装置及びその方法
JP4886616B2 (ja) 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体
JP4928376B2 (ja) 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体
CN113763984B (zh) 一种用于分布式多说话人的参数化噪声消除系统
Firoozabadi et al. Combination of nested microphone array and subband processing for multiple simultaneous speaker localization
Kodrasi et al. Instrumental and perceptual evaluation of dereverberation techniques based on robust acoustic multichannel equalization
JP4173469B2 (ja) 信号抽出方法、信号抽出装置、拡声装置、送話装置、受信装置、信号抽出プログラム、これを記録した記録媒体
JP4933975B2 (ja) 信号抽出装置、その方法、およびそのプログラム
KR20190013251A (ko) 원거리 음성인식을 위한 음성전력의 조기성분 추정을 이용하여 다채널 선형예측 기반의 실시간 잔향 제거 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140421

R150 Certificate of patent or registration of utility model

Ref document number: 5530741

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees