JP2010221945A - 信号処理方法、装置及びプログラム - Google Patents

信号処理方法、装置及びプログラム Download PDF

Info

Publication number
JP2010221945A
JP2010221945A JP2009073901A JP2009073901A JP2010221945A JP 2010221945 A JP2010221945 A JP 2010221945A JP 2009073901 A JP2009073901 A JP 2009073901A JP 2009073901 A JP2009073901 A JP 2009073901A JP 2010221945 A JP2010221945 A JP 2010221945A
Authority
JP
Japan
Prior art keywords
signal
filtering
sound source
sound
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009073901A
Other languages
English (en)
Other versions
JP5289128B2 (ja
Inventor
Ko Amada
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009073901A priority Critical patent/JP5289128B2/ja
Publication of JP2010221945A publication Critical patent/JP2010221945A/ja
Application granted granted Critical
Publication of JP5289128B2 publication Critical patent/JP5289128B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】音声認識やハンズフリー通話時に妨害音となるスピーカからの再生音を効果的に抑圧する。
【解決手段】マイクロホンアレーにより複数の再生チャネルの再生音を受音して得られる受音信号に対して再生音の受音方向に応じて異なる感度を持つようにアレー処理を行う信号処理装置において、複数チャネルのオーディオ信号から生成される音源信号に対して感度が相対的に低い方向に音源が定位するように事前にフィルタリングを行い、フィルタリング後の信号を再生チャネルに供給する。
【選択図】 図1

Description

本発明は、マイクロホンアレー技術を用いた信号処理方法、装置及びプログラムに関する。
配列された複数のマイクロホン、いわゆるマイクロホンアレーを用いて、特定の方向から到来する音を強調し、その他の音を抑圧する技術や、音源の方向を検出する技術の研究が盛んに行われている。例えば、自動車内で運転者(以下、ドライバという)が希望することを把握するために音声認識を行うような場合、走行雑音やカーオーディオの再生音を抑圧し、ドライバの発話だけを抽出するために、マイクロホンアレーが用いられる。
マイクロホンアレーには種々の方式があるが、代表的な方式として非特許文献1に開示された遅延和アレーがあげられる。遅延和アレーは、各マイクロホンからの信号に対して遅延を付与した後に加算処理を行うことで、事前に設定された特定の方向(例えば、自動車内であればドライバの方向)から到来した音響信号のみが同位相で足し合わされて強調されるのに対し、他の方向から到来した音響信号は位相が揃わないため弱め合う、という原理に基づいている。この原理により、特定の方向からの音響信号を強調する、すなわち特定の方向に指向性を形成することができる。
マイクロホンアレーの別の例として、非特許文献2に開示されたGriffith-Jim形アレーがあげられる。Griffith-Jim型アレーは、適応フィルタを用いて妨害音の方向が低感度の特性(以下、null(零点)ともいう)を持つ指向性を形成し、妨害音を選択的に除去する点が特徴である。除去できる妨害音の方位数は、一般的にはN−1(Nはマイクロホン数)である。
自動車内での音声認識において妨害音となるカーオーディオの再生音は、自動車の走行雑音等とは異なり、音源信号や音源位置が既知である。従って、マイクロホンアレーからの信号に対していわゆるアレー処理を行うことにより、再生音を抑圧することが可能である。例えば、アレー処理によりマイクロホンアレーの低感度方向をカーオーディオのスピーカの方向に向けることで、カーオーディオの再生音を抑圧することができる。スピーカの位置は既知であるため、音源位置が未知である周囲の妨害音よりも効果的な抑圧が可能である。
J.L. Flanagan, J.D.Johnston, R.Zahn and G.W.Elko,"Computer-steered microphone arrays for sound transduction in large rooms,"J.Acoust. Soc. Am., vol.78, no.5, pp.1508-1518, 1985 L.J. Griffiths and C.W. Jim, "An Alternative Approach to Linearly Constrained Adaptive Beamforming," IEEE Trans. Antennas & Propagation, Vol. AP-30, No. 1, Jan., 1982
カーオーディオの再生音がステレオである場合、音源によって定位する位置が異なる。例えばボーカルはセンターに定位し、伴奏は楽器ごとに左右に分散して定位するといったことが多い。この場合、全ての音源の方向にマイクロホンアレーの死角ができるように、すなわち全ての音源の方向が低感度であるようにすることが望ましいが、マイクロホン数が少ない場合にはそれが難しい。この結果、妨害音の抑圧性能が低下する。また、再生音の音源の一部が目的音と同一方向に定位する場合には、妨害音である再生音を除去することは非常に難しくなる。
本発明は、音声認識やハンズフリー通話時に妨害音となるスピーカからの再生音を効果的に抑圧するための信号処理方法、装置及びプログラムを提供することを目的とする。
本発明の一態様によると、複数のマイクロホンにより複数の再生チャネルの再生音を受音して得られる受音信号に対して、前記再生音の受音方向に応じて異なる感度を持つようにアレー処理を行うアレー処理部と、複数チャネルのオーディオ信号から少なくとも1チャネルの音源信号を生成する音源信号生成部と、前記複数の再生チャネル毎に、前記音源信号に対して前記感度が相対的に低い方向に音源が定位するようにフィルタリングを行って、前記複数の再生チャネルに供給する複数のフィルタリング信号を生成するフィルタリング部と、を具備する信号処理装置が提供される。
本発明によれば、少数のマイクロホンで構成されるマイクロホンアレーを用いた場合でも、音声認識やハンズフリー通話時に妨害音となる多チャネルのオーディオ信号による再生音を効果的に抑圧することができる。
本発明の第1の実施形態に係る信号処理装置を示すブロック図 第1の実施形態の動作を説明するための音源位置とマイクロホンの関係を示す図 本発明の第2の実施形態に係る信号処理装置を示すブロック図 本発明の第3の実施形態に係る信号処理装置を示すブロック図 本発明の第4の実施形態に係る信号処理装置を示すブロック図 本発明の第5の実施形態に係る信号処理装置を示すブロック図 本発明の第6の実施形態に係る信号処理装置を示すブロック図 本発明の第7の実施形態に係る電子機器を示すブロック図
以下、本発明の実施の形態について説明する。
(第1の実施形態)
図1に示すように、第1の実施形態に係る信号処理装置は、加算器103、フィルタリング部104−1,104−2、選択器105−1,105−2、アレー処理部108及び位相制御部109を有する。
加算器103、フィルタリング部104−1,104−2、選択器105−1,105−2は、複数チャネルのオーディオ信号をそれぞれ受けるオーディオ入力端子101−1,101−2と複数チャネルのスピーカ106−1,106−2との間に配置される。アレー処理部108は、マイクロホンアレーを形成する複数のマイクロホン107−1〜107−Nからの受音信号に対して信号処理を行うことによって所定の指向性を形成し、処理音声信号を出力する。
次に、本実施形態に係る信号処理装置の動作について説明する。
オーディオ入力端子101−1,101−2には、複数チャネル、この例ではステレオ2チャネルのオーディオ信号が入力される。選択器105−1,105−2は、例えば制御入力端子102からの制御信号により切り替わる切り替えスイッチであり、上側に切り替わっているときはオーディオ入力端子101−1,101−2からのオーディオ信号が選択され、複数の再生チャネルであるスピーカ106−1,106−2から音響として放射される。以後、スピーカ106−1,106−2から放射される音響を再生音と呼ぶ。スピーカ106−1,106−2に供給されるオーディオ信号は、実際にはオーディオ増幅器により増幅されるが、図ではオーディオ増幅器については省略している。
オーディオ入力端子101−1,101−2からのオーディオ信号は加算器103にも入力され、ここで両信号が足し合わされることにより1チャネルの信号すなわちモノラル信号とされる。以後、加算器103から出力される1チャネルの信号を音源信号という。加算器103から出力される音源信号は、複数のフィルタリング部104−1,104−2によりフィルタリングされる。フィルタリング部104−1,104−2のフィルタ特性については後述する。ここで、選択器105−1,105−2が下側に切り替わっている場合、フィルタリング部104−1,104−2からのフィルタリング信号が選択され、それぞれスピーカ106−1,106−2から再生音として放射される。
スピーカ106−1,106−2からの再生音は、複数のマイクロホン107−1〜107−Nによって受音され、受音信号と呼ばれる電気信号がマイクロホン107−1〜107−Nから出力される。マイクロホン107−1〜107−Nからの受音信号に対して、アレー処理部108によりアレー処理と呼ばれる信号処理が行われ、妨害音が除去された処理音声信号が出力される。
アレー処理部108は、本実施形態ではスピーカ106−1,106−2からの再生音に対するマイクロホン107−1〜107−Nの受音方向に応じて異なる感度を持つようなアレー処理を行う。本実施形態によると、アレー処理部108からの処理音声信号は妨害音が除去された、ドライバの発話音を主体とした音声信号である。妨害音は、例えば後述するように助手席からの発話音や、スピーカ106−1,106−2からの再生音などである。アレー処理部108からの処理音声信号は、例えば図示しない音声認識装置に入力される。
図2は、本実施形態に係る信号処理装置の具体的な使用例であり、自動車内に信号処理装置を実装した様子を示している。この例は2マイク・2スピーカであり、マイクロホン107−1,107−2は、例えばルームミラーやインパネの中央部等に設置される。スピーカ106−1,106−2は、例えば前席ドア部に配置されることが多い。また、前席ドア部に加えてさらに後部にスピーカが配置されることも多い。
音声認識技術を利用してドライバが音声でカーナビの操作等を行う場合、例えばドライバ210の方向に高感度の特性、同乗者211の方向には低感度の特性(null)の指向性を形成するようにマイクロホンアレーの特性を制御することで、ドライバの発話のみを的確に捕らえることができる。具体的には、例えば非特許文献1に記載されたような遅延和アレーを用いる場合、アレー処理部108ではマイクロホン107−1〜107−Nからの受音信号について遅延を施してから加算する。
ここで、位相制御部109によってアレー処理部108での遅延時間を適宜制御することにより、アレー処理部108で例えばドライバの方向から到来した音響信号のみを同位相で足し合わして強調し、他の方向からの音響信号については位相が揃わないため打ち消す、というアレー処理を行うことができる。すなわち、このアレー処理によりドライバの方向に指向性を形成することができる。
N本のマイクロホン107−1〜107−Nからの受音信号をXn(t)(n=1,...,N)と表すと、アレー処理部108からの処理音声信号Y(t)は、次式で表される。
Figure 2010221945
ただし、マイクロホン107−1〜107−Nは等間隔で、添字nの順で配置されているものとする。また、τはマイクロホン107−1〜107−Nからの受音信号X(t)を目的音の到来方向に同相化するための遅延時間である。
別の例として、先の非特許文献2に記載されたGriffith-Jim形アレーのように、適応フィルタを用いて妨害音の方向にnullを形成し、妨害音を選択的に除去するようにしてもよい。その場合、除去できる妨害音の方向は、一般的にはN−1(Nはマイクロホン数)である。その他にも、様々な方式が提案されているが、本実施形態はマイクロホンアレーの方式そのものには依存せず、任意の方式を用いることが可能である。
このようなマイクロホンアレーの設計方針として、ドライバの発話のみを正確に捉えるために、助手席に座っている同乗者の発話を抑圧するように設計することは自然である。この場合、妨害音が助手席からの発話音のみである場合は、効果的に妨害音を抑圧することができる。
しかし、同じく妨害音であるスピーカから再生音が同時に出力されている場合、その再生音までを抑圧することは難しい。助手席からの発話音とスピーカからの再生音の到来方向は、一般に異なるからである。特に、マイクロホン数が少ない場合は、nullを形成できる方位数も少なくなるので、例えばマイクロホン数が2の場合、助手席の方向にnullを形成すると、それ以外の方向にnullを作ることができず、スピーカからの再生音を抑圧できない。
さらに、スピーカからステレオで再生音が出力されている場合は、さまざまな音源方位が同時に存在する可能性があり、少数のマイクロホンを用いたアレー処理では限界がある。モノラル信号であっても、助手席と合わせて2方向にnullを生成する必要があり、マイクロホン数が2では困難である。
本実施形態では、スピーカ106−1,106−2からの再生音をマイクロホン107−1〜107−Nで受音するときに、感度が相対的に低い方向に音源が定位するようにフィルタリング部104−1,104−2によって事前に加算器103からの音源信号をフィルタリングして加工しておく。具体的には、例えばスピーカ106−1,106−2からの再生音があたかも助手席の方向から到来したかのように観測されるように、フィルタリング部104−1,104−2によってフィルタリングを行う。
このようにすることで、助手席からの発話音とスピーカ106−1,106−2からの再生音を同一方向の一つのnullで消すことが可能となる。すなわち、マイクロホン107−1〜107−Nの数が少ないために数多くのnullを形成できない場合でも、助手席の発話音に加えてスピーカ106−1,106−2からの再生音も同時に抑圧することができる。このように処理音声信号において助手席からの発話音のみでなく、スピーカ106−1,106−2からの再生音も抑圧することにより、音声認識を正確に行うことができる。
上記の説明では、アレー処理部108は予め定められた方向(例えば助手席の方向)に対する感度を極小値とするようにアレー処理を行い、フィルタリング部104−1,104−2ではスピーカ106−1,106−2からの再生音において当該予め定められた方向に音源が定位するようにフィルタリングを行う場合について述べた。しかし、マイクロホンアレーの方式によっては、上述のようにスピーカ106−1,106−2からの再生音が助手席からの発話音と同一方向とみなされるようにフィルタリングを行う必要は必ずしもない。
例えば、特開2007−10897号公報には、学習用の音源位置それぞれに対して所望の応答(目標信号)を生成するようにアレーの指向性を設計する方法が示されている。この場合、ドライバが存在する可能性のある方向範囲から発せられた信号を強調し、それ以外の信号を抑圧するような設計が可能である。このようなアレーでは、マイクロホンアレーの受音方向はドライバが存在する可能性のある方向範囲よりも外にあればよく、必ずしも助手席からの発話音の方向と一致している必要はない。
このようにアレー処理部108においては、予め定められた方向範囲に対する感度を該範囲外の方向に対する感度よりも高くするようにアレー処理を行い、フィルタリング部104−1,104−2では、この方向範囲外の方向に音源が定位するようにフィルタリングを行ってもよい。
ところで、フィルタリング部104−1,104−2からのフィルタリング信号がスピーカ106−1,106−2に供給される場合、スピーカ106−1,106−2からの再生音は、本来のオーディオ信号の再生時とは異なる音となり、ステレオ感も失われる。すなわち、フィルタリング信号に対応する再生音は、聞く人にとって違和感のある音となる。
そこで、本実施形態では選択器105−1,105−2によって、ドライバの発話中のみフィルタリング部104−1,104−2からのフィルタリング信号を選択してスピーカ106−1,106−2に供給し、それ以外のときはオーディオ入力端子101−1,101−2からのオーディオ信号を選択してスピーカ106−1,106−2に供給し、通常の再生を行うようにすることで、再生音のこのような違和感を最小限に押さえることができる。
次に、フィルタリング部104−1,104−2の設計方法について述べる。
スピーカ106−1,106−2に供給される音源信号は、加算器103でステレオ信号を加算して得られるモノラル信号である。この音源信号をフィルタリング部104−1,104−2によりフィルタリングした後にスピーカ106−1,106−2で再生し、その再生音を2つマイクロホン107−1,107−2により受音する場合、音源(加算器103の出力端)からマイクロホン107−1,107−2までの伝達関数(y1,y2)は、以下の式(2)で表される。
Figure 2010221945
ただし、hxyはスピーカyからマイクロホンxまでの伝達関数であり、g1,g2はフィルタリング部104−1,104−2の伝達関数である。
スピーカ106−1,106−2からの再生音が助手席の方向から到来したかのようにフィルタリング部104−1,104−2がフィルタリングを行うためには、(y1,y2)が助手席からマイクロホン107−1,107−2までの伝達関数(a1,a2)と等しくなるように、フィルタリング部104−1,104−2の伝達関数(g1,g2)を設計すればよい。このためには、式(2)の(y1,y2)に(a1,a2)を代入して、(g1,g2)について解けばよい。
2マイク・2スピーカの場合、スピーカとマイクロホン間の伝達関数を表す行列が正方行列なので、通常、逆行列を計算することができる。マイクロホン数とスピーカ数が異なる場合は、逆行列が定義できないので、一般化逆行列を用いるのが一般的である。
ところで、フィルタリング部104−1,104−2の伝達関数(g1,g2)が周波数毎に大きく異なり、フィルタリング信号に対応してスピーカ106−1,106−2から出力される再生音のスペクトルがフィルタリング前のオーディオ信号に対応する再生音のスペクトルと大きく異なる場合がある。このような場合、フィルタリング信号に対応する再生音のスペクトルがフィルタリング前のオーディオ信号に対応する再生音のスペクトルと同じになるように伝達関数(g1,g2)の大きさを調整することは可能である。なぜなら、音源定位において音の大きさは無関係であるから、例えば任意の定数Aを用いてフィルタリング部104−1,104−2の伝達関数を(A×g1,A×g2)としても、音源の定位に影響はないからである。
図1の制御入力端子102には、オーディオ入力端子101−1,101−2からのオーディオ信号をそのままスピーカ106−1,106−2で再生するか、フィルタリング部104−1,104−2でフィルタリングを行ってから再生するかを切り替え制御するための制御信号が与えられ、この制御信号によって選択器105−1,105−2が制御される。
制御信号の与え方としては、例えばドライバの発話区間(発声区間)を検出し、発話区間にのみフィルタリング部104−1,104−2からのフィルタリング信号をスピーカ106−1,106−2に供給するように選択器105−1,105−2を制御する方法が挙げられる。発話区間の検出には、例えば音声区間検出器が用いられる。音声区間検出器の方式としては、信号のパワー情報、推定雑音にもとづく信号対雑音比あるいはスペクトル情報等に基づき音声区間を判定する方法などが提案されている。また、統計的手法に基づく判別法(Sohn J., Kim N.S., and Sung W., "A statistical model-based voice activity detection", IEEE Signal Process. Lett., pp.1-3, 1999, 16, (1)参照)もよく用いられる。制御信号の別の与え方として、ドライバから明示的に音声区間を指示するようにする方法も考えられる。
音声認識を行う場合、発話開始を示すボタンを発話者が押すことがよく行われる。発話開始の情報を音声区間情報として用いることで確実に音声区間を特定することができ、これを制御信号として用いることができる。発話時に一度だけ押し、発話終了はプログラムが判定するようにしてもよい。この場合は、発話開始はボタンで、終了は音声区間検出器の情報を用いるようにすればよい。
(第2の実施形態)
図3は、第1の実施形態を変形した第2の実施形態に係る信号処理装置であり、図1の制御入力端子102と選択器105−1,105−2が除去され、常にフィルタリング部104−1〜104−Nからのフィルタリング信号がスピーカ106−1〜106−Nに供給される。このようにスピーカ106−1〜106−Nから常時フィルタリング信号を再生することが許容できる場合は、装置の簡略化という観点からも本実施形態の構成が望ましい。なお、図3ではオーディオ入力端子、フィルタリング部及びスピーカはいずれもM個となっているが、Mは2以上の複数であればよいことはこれまでの説明から明らかである。
(第3の実施形態)
図4は、第1の実施形態を変形した第3の実施形態に係る信号処理装置であり、フィルタリング部104−1,104−2からのフィルタリング信号は、蓄積部110−1,110−2に一旦蓄積され、蓄積部110−1,110−2から読み出されたフィルタリング信号がスピーカ106−1,106−2に供給される。すなわち、本実施形態ではオンラインでフィルタリングを行わず、フィルタリング部104−1,104−2で事前に音源信号をフィルタリングして得られたフィルタリング信号の波形を蓄積部110−1,110−2に蓄積しておき、それらを実使用時に適宜読み出してスピーカ106−1,106−2で再生する。
例えば、スピーカ106−1,106−2で再生すべき信号のうち、カーナビゲーションの固定メッセージのように予め決まっている信号については、再生の都度フィルタリングを行うよりも、事前にフィルタリングして蓄積部110−1,110−2に蓄積しておくことが望ましい。そして、再生時に蓄積部110−1,110−2からフィルタリング済みの信号波形を取り出してスピーカ106−1,106−2に供給すればよい。
なお、固定メッセージはモノラル音声であることも多いが、その場合は蓄積部101−1,101−2に同一のデータが入力されると考えればよく、ステレオデータと同一の構成でも問題は生じない。
(第4の実施形態)
図5は、第4の実施形態に係る信号処理装置を示している。本実施形態では、図1の加算器103に代えて相関低減部303が設けられ、この相関低減部303にオーディオ入力端子101−1,101−2からのオーディオ信号が入力される。相関低減部203では、複数チャネル(この例では2チャネル)のオーディオ信号間の相関より相関が減じられた複数チャネル(この例では2チャネル)の音源信号が生成される。相関低減部203からの2チャネルの音源信号のうち、第1チャネルの音源信号はフィルタリング部304−1,304−3に入力され、第2チャネルの音源信号はフィルタリング部304−2,304−4に入力される。
フィルタリング部304−1,304−2からのフィルタリング信号は、加算器311−1で加算された後、選択器105−1を介してスピーカ106−1に供給される。同様に、フィルタリング部304−3,304−4からのフィルタリング信号は、加算器311−2で加算された後、選択器105−2を介してスピーカ106−2に供給される。
このように再生チャネルであるスピーカ106−1,106−2毎に、相関低減部203からの2チャネルの音源信号に対してフィルタリングが行われ、各2チャネルのフィルタリング信号の加算信号がスピーカ106−1,106−2に供給される。
スピーカ106−1,106−2からの再生音を2つマイクロホン107−1,107−2によって受音する場合、音源(相関低減部303の2つの出力端)からマイクロホン107−1,107−2までの伝達関数(y1,y3)及び(y2,y4)は、以下の式(3)及び(4)で表される。
Figure 2010221945
Figure 2010221945
ただし、hxyはスピーカyからマイクロホンxまでの伝達関数であり、g1,g3はフィルタリング部304−1,304−3の伝達関数、g2,g4はフィルタリング部304−2,304−4の伝達関数である。第1の実施形態において式(2)からフィルタリング部104−1,104−2の伝達関数(g1,g2)を求めたのと同様に、(y1,y3)と(y2,y4)について異なる方向を与えることで、式(3)及び(4)から伝達関数g1,g3及びg2,g4を求めることができる。
次に、本実施形態の動作原理について説明する。
第1の実施形態では、入力された複数チャネルのオーディオ信号は加算器103で加算され、1チャネルすなわちモノラルの音源信号とされたのに対して、本実施形態では複数チャネル(第1チャネル及び第2チャネル)の音源信号が出力される。これら複数チャネルの音源信号は、前述のようにスピーカ106−1,106−2毎にフィルタリングが行われ、さらに各2チャネルのフィルタリング信号の加算信号がスピーカ106−1,106−2に供給される。このときに注意すべきことは、スピーカ106−1,106−2からの再生音同士が干渉し合い、マイクロホン107−1〜107−Nで受音したときに設計とは異なる方向に定位してしまうことである。
本実施形態では、このような弊害を避けるため相関低減部303により2チャネルの音源信号間の相関を低減する。すなわち、オーディオ入力端子101−1,101−2からのオーディオ信号はステレオ信号であるため相関が大きいが、相関低減部303から出力される2チャネルの音源信号は相関が小さい信号とされる。ここでは、入力されるオーディオ信号のチャネル数と相関を低減した音源信号のチャネル数は共に2チャネルとなっているが、これらのチャネル数は同一でなくてもよい。
具体的には、相関低減部303では例えば入力される2チャネルのオーディオ信号を加算してモノラル信号とした後、周波数帯別に分離を行い、第1チャネルの音源信号として低域信号、第2チャネルの音源信号として高域信号を出力する。また、2チャネルのオーディオ信号を加算して得たモノラル信号を多数の周波数成分に分離していわゆるサブバンド化し、各周波数成分を2チャネルの音源信号に交互に振り分けたり、ランダムに振り分けたりすることもできる。また、MIDI(Musical Instrument Digital Interface)データから生成されたオーディオ信号のように、信号を構成する個々の信号(パート)が既知の場合は、パート毎に分離して2チャネルの音源信号を生成することも考えられる。
前述したように、フィルタリング信号がスピーカ106−1,106−2に供給される場合、スピーカ106−1,106−2からの再生音のステレオ感が失われる。本実施形態によると、このような再生音のステレオ感の低減を補うことができる。すなわち、本実施形態ではアレー処理部108によってマイクロホンアレーが複数の方向に対して感度の極小値を持つ場合、生成された多チャネルの音源信号を各極小値に振り分けることでステレオ感の低減を補うことが可能となる。マイクロホンアレーが特定の方向範囲の方向に高い感度を示す場合は、生成された多チャネルの音源信号は感度の高い方向範囲以外の方向に定位させることで、ステレオ間の低減を補うことが可能となる。
(第5の実施形態)
図6に、第5の実施形態に係る信号処理装置を示す。第1の実施形態に係る信号処理装置との相違点について述べると、本実施形態ではオーディオ入力端子101−1,102−2の直後に配置された信号分離部410−1,410−2が追加され、図1の選択器105−1,105−2が加算器312−1,312−2に置き換えられ、さらに制御入力端子102からの制御信号の入力先が選択器105−1,105−2から信号分離部410−1,410−2へと変更されている。
オーディオ入力端子101−1,102からの2チャネルのオーディオ信号は、信号分離部410−1,410−2において、加算器403により加算されてモノラルの音源信号となる成分(モノラル成分という)と、ステレオ2チャネルのまま直接出力される成分(ステレオ成分という)とに分離される。
前者のモノラル成分は、第1の実施形態と同様に加算器403で加算されることによりモノラルの音源信号とされる。この音源信号はフィルタリング部304−1,304−2によりフィルタリングされ、フィルタリング信号が加算器312−1,312−2にそれぞれ入力される。後者のステレオ成分は、そのまま加算器312−1,312−2にそれぞれ入力される。加算器312−1,312−2により音源信号とステレオ成分の信号とが加算され、スピーカ106−1,106−2から再生音として出力される。
本実施形態によると、フィルタリング部304−1,304−2によりフィルタリングされる信号は、信号分離部410−1,410−2によって分離された、入力されるオーディオ信号の一部の成分である。例えば、オーディオ信号の各成分の音源方向が事前に分かっていたり、音源分離手法等を用いたりすることで各成分の分離ができている場合、フィルタリング部304−1,304−2はオーディオ信号のうち、妨害音となる発話音が到来する可能性のある、例えば助手席の方向範囲内の成分だけをフィルタリングすればよい。この方向範囲外に存在する成分については、スピーカ106−1,106−2からそのまま出力しても、アレー処理部108によって抑圧が可能である。
このように本実施形態によれば、入力されるオーディオ信号のうち、フィルタリング部304−1,304−2において妨害音となる発話音が到来する可能性のある方向範囲内の成分だけをフィルタリングすればよい。従って、入力されるオーディオ信号に基づくスピーカ106−1,106−2からの再生音において、フィルタリングに起因するステレオ感の低下を最小限に止めることができる。
なお、図6では信号分離部410−1,410−2は制御入力端子102からの制御信号によって制御されているが、制御が必要でない場合は制御信号の入力を省略することができる。
信号分離部410−1,410−2の別の具体例として、特定の周波数帯域の成分を選択することもできる。例えば、入力されるオーディオ信号の帯域が20kHzであり、アレー処理部109がアレー処理を行う帯域が8kHzの場合、オーディオ信号のうち8kHz以上の帯域の成分はアレー処理には無関係である。そこで、信号分離部410−1,410−2により加算器403により加算されてモノラルの音源信号となるモノラル成分として、アレー処理の対象となる8kHzに満たない成分のみを分離する。フィルタリング部304−1,304−2では、加算器403から出力される8kHz以下の成分のみからなる音源信号がフィルタリングされ、フィルタリング信号が加算器312−1,312−2に入力される。
一方、入力されるオーディオ信号のうち8kHz以上の帯域の成分は、信号分離部410−1,410−2においてステレオ2チャネルのまま直接出力されるステレオ成分として分離され、加算器312−1,312−2にそれぞれ入力される。加算器312−1,312−2により音源信号とステレオ成分の信号とが加算され、スピーカ106−1,106−2から再生音として出力される。このようにすることで、入力されるオーディオ信号に基づくスピーカ106−1,106−2からの再生音における、フィルタリングによるステレオ感の低下を最小限に止めることができる。
(第6の実施形態)
図7は、第6の実施形態に係る信号処理装置を示している。図5に示した第4の実施形態との相違点について説明すると、本実施形態では図5のオーディオ入力端子101−1,101−2の直後に信号分離部410−1,410−2が追加され、選択器105−1,105−2が加算器312−1,312−2に置き換えられ、さらに制御入力端子102からの制御信号の入力先が選択器105−1,105−2から信号分離部410−1,410−2に変更されている。
本実施形態では、第4の実施形態と同様に入力信号の一部の成分に対してフィルタリングが行われる。フィルタリングは第4の実施形態が第1の実施形態と同様の方法で行ったのに対し、本実施形態では第3の実施形態と同様に、相関低減部303から出力される2チャネルの音源信号に対して行われる。
よって、本実施形態によると第5の実施形態と同様に入力されるオーディオ信号に基づくスピーカ106−1,106−2からの再生音において、フィルタリングに起因するステレオ感の低下を最小限に止めることができる。なお、図7では信号分離部410−1,410−2は制御入力端子102からの制御信号によって制御されているが、制御が必要でない場合は制御信号の入力を省略することができる。
(第7の実施形態)
図8は、これまでの実施形態で説明してきたような信号処理装置を含む、本発明の第7の実施形態に係る電子機器501を示している。ここで、電子機器501は例えばパーソナルコンピュータ、携帯通信端末等であり、表示部502を有する。電子機器501の例えば表示部502の周囲にスピーカ106−1,106−2とマイクロホン107−1,107−2が設置され、電子機器501を取り扱う話者503がマイクロホン107−1,107−2に向けて音声を入力することができる。
次に、本実施形態の動作原理について説明する。
電子機器501で生成される出力信号に基づくスピーカ106−1,106−2からの再生音は、話者503に向けて放射される。この再生音は、例えば通話相手の声、あるいは音楽をはじめとするオーディオ信号等である。話者503は、電子機器501に備え付けられたマイクロホン107−1〜107−Nに向かって、例えば通話相手に対する発話や、端末に対する指示などの音声を入力する。
ところで、マイクロホン107−1,107−2がスピーカ106−1,106−2からの再生音を受音したときに観測される音源方向と、話者503の発話を受音したとき観測される音源方向が重なっていると、マイクロホン107−1,107−2から出力される受音信号において、話者503の声とスピーカ106−1,106−2からの再生音が混ざってしまう。これは通話においては相手側にエコーが発生することになり、音声認識をする場合には認識誤りを引き起こす要因になる。
第1乃至第6の実施形態で述べてきた信号処理装置を用いて、スピーカ106−1,106−2からの再生音を複数のマイクロホン07−1,107−2で受音したとき、音源方向が話者の存在する可能性のある方向範囲より外になるようにスピーカ106−1,106−2からの再生音を事前にフィルタリングしておくことにより、このような問題を回避することができる。
以上説明した本発明の実施形態に基づく信号処理は、ハードウェアでも実現可能であるが、パーソナルコンピュータのようなコンピュータを用いてソフトウェアにより実行することも可能である。従って、本発明によればコンピュータを上述した信号処理装置として機能させるためのプログラム、あるいは当該プログラムを格納したコンピュータ読み取り可能な記憶媒体を提供することができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
108・・・アレー処理部
109,109−1,109−2・・・位相制御部
110−1,110−2・・・蓄積部
303・・・相関低減部
304−1〜304−4・・・フィルタリング部
312−1,312−2,403・・・加算器
410−1,410−2・・・信号分離部
501・・・電子機器
502・・・表示部

Claims (10)

  1. 複数のマイクロホンにより複数の再生チャネルの再生音を受音して得られる受音信号に対して、前記再生音の受音方向に応じて異なる感度を持つようにアレー処理を行うアレー処理部と、
    複数チャネルのオーディオ信号から少なくとも1チャネルの音源信号を生成する音源信号生成部と、
    前記複数の再生チャネル毎に、前記音源信号に対して前記感度が相対的に低い方向に音源が定位するようにフィルタリングを行って、前記複数の再生チャネルに供給する複数のフィルタリング信号を生成するフィルタリング部と、
    を具備することを特徴とする信号処理装置。
  2. 前記音源信号生成部は、前記複数チャネルのオーディオ信号を加算して1チャネルの音源信号を生成することを特徴とする請求項1に記載の信号処理装置。
  3. 前記アレー処理部は、予め定められた方向に対する感度を極小値とするように前記アレー処理を行い、
    前記フィルタリング部は、前記予め定められた方向に音源が定位するように前記フィルタリングを行うことを特徴とする請求項1に記載の信号処理装置。
  4. 前記アレー処理部は、予め定められた方向範囲内の方向に対する感度を該方向範囲外の方向に対する感度よりも高くするように前記アレー処理を行い、
    前記フィルタリング部は、前記方向範囲外の方向に音源が定位するように前記フィルタリングを行うことを特徴とする請求項1に記載の信号処理装置。
  5. 前記音源信号生成部は、前記複数チャネルのオーディオ信号から前記複数チャネルのオーディオ信号間より相関が減じられた複数チャネルの音源信号を生成し、
    前記フィルタリング部は、前記複数の再生チャネル毎に前記複数チャネルの音源信号のそれぞれに前記フィルタリングを行うことを特徴とする請求項1に記載の信号処理装置。
  6. 前記複数チャネルのオーディオ信号と前記複数のフィルタリング信号とのいずれかを選択して前記複数の再生チャネルに供給する選択器をさらに具備することを特徴とする請求項1に記載の信号処理装置。
  7. 前記切替器は、話者の発話中に前記フィルタリング信号を選択し、非発話中に前記オーディオ信号を選択することを特徴とする請求項6に記載の信号処理装置。
  8. 前記複数チャネルのオーディオ信号のそれぞれを前記音源信号の生成に用いられる第1の信号成分とそれ以外の第2の信号成分とに分離する信号分離部と、
    前記複数の再生チャネルに供給する前記複数のフィルタリング信号に前記第2の信号成分を加算する加算器と、
    をさらに具備することを特徴とする請求項1に記載の信号処理装置。
  9. 表示部と、
    前記表示部に設けられた複数のマイクロホンと、
    前記表示部に設けられた複数のスピーカと、
    前記表示部に正対している利用者が存在する方向範囲以外の方向に前記音源が定位するように前記フィルタリング部がフィルタリングを行う請求項1乃至8のいずれか1項に記載の信号処理装置と、を具備することを特徴とする電子機器。
  10. コンピュータを、
    複数のマイクロホンにより複数の再生チャネルの再生音を受音して得られる受音信号に対して、前記再生音の受音方向に応じて異なる感度を持つようにアレー処理を行うアレー処理部、
    複数チャネルのオーディオ信号から少なくとも1チャネルの音源信号を生成する音源信号生成部、
    前記複数の再生チャネル毎に、前記音源信号に対して前記感度が相対的に低い方向に音源が定位するようにフィルタリングを行って、前記複数の再生チャネルに供給する複数のフィルタリング信号を生成するフィルタリング部、
    として機能させるための信号処理プログラム。
JP2009073901A 2009-03-25 2009-03-25 信号処理方法、装置及びプログラム Expired - Fee Related JP5289128B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009073901A JP5289128B2 (ja) 2009-03-25 2009-03-25 信号処理方法、装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009073901A JP5289128B2 (ja) 2009-03-25 2009-03-25 信号処理方法、装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010221945A true JP2010221945A (ja) 2010-10-07
JP5289128B2 JP5289128B2 (ja) 2013-09-11

Family

ID=43039595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009073901A Expired - Fee Related JP5289128B2 (ja) 2009-03-25 2009-03-25 信号処理方法、装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5289128B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8711219B2 (en) 2011-03-31 2014-04-29 Kabushiki Kaisha Toshiba Signal processor and signal processing method
JP2020022115A (ja) * 2018-08-02 2020-02-06 日本電信電話株式会社 集音装置
WO2022250387A1 (ko) * 2021-05-27 2022-12-01 주식회사 아모센스 음성을 처리하기 위한 음성 처리 장치, 음성 처리 시스템 및 음성 처리 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03203496A (ja) * 1989-12-29 1991-09-05 Nissan Motor Co Ltd 能動型騒音制御装置
JPH11164389A (ja) * 1997-11-26 1999-06-18 Matsushita Electric Ind Co Ltd 適応ノイズキャンセラ装置
JP2003099100A (ja) * 2001-09-21 2003-04-04 Matsushita Electric Ind Co Ltd 音声認識装置およびその方法
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
JP2005136701A (ja) * 2003-10-30 2005-05-26 Nippon Telegr & Teleph Corp <Ntt> エコー・雑音抑制方法および多チャネル拡声通話システム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03203496A (ja) * 1989-12-29 1991-09-05 Nissan Motor Co Ltd 能動型騒音制御装置
JPH11164389A (ja) * 1997-11-26 1999-06-18 Matsushita Electric Ind Co Ltd 適応ノイズキャンセラ装置
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
JP2003099100A (ja) * 2001-09-21 2003-04-04 Matsushita Electric Ind Co Ltd 音声認識装置およびその方法
JP2005136701A (ja) * 2003-10-30 2005-05-26 Nippon Telegr & Teleph Corp <Ntt> エコー・雑音抑制方法および多チャネル拡声通話システム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8711219B2 (en) 2011-03-31 2014-04-29 Kabushiki Kaisha Toshiba Signal processor and signal processing method
JP2020022115A (ja) * 2018-08-02 2020-02-06 日本電信電話株式会社 集音装置
US11479184B2 (en) 2018-08-02 2022-10-25 Nippon Telegraph And Telephone Corporation Sound collection apparatus
JP7210926B2 (ja) 2018-08-02 2023-01-24 日本電信電話株式会社 集音装置
WO2022250387A1 (ko) * 2021-05-27 2022-12-01 주식회사 아모센스 음성을 처리하기 위한 음성 처리 장치, 음성 처리 시스템 및 음성 처리 방법

Also Published As

Publication number Publication date
JP5289128B2 (ja) 2013-09-11

Similar Documents

Publication Publication Date Title
CN112584273B (zh) 空间上回避通过波束形成扬声器阵列产生的音频
JP5003531B2 (ja) 音声会議システム
EP1894439B1 (en) Method of and system for determining distances between loudspeakers
JP5540581B2 (ja) 音声信号処理装置および音声信号処理方法
JP4258472B2 (ja) 拡声システム
JP5060631B1 (ja) 信号処理装置及び信号処理方法
JP5259622B2 (ja) 収音装置、収音方法、収音プログラム、および集積回路
JP2009194682A (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
EP2158788A1 (en) Sound discrimination method and apparatus
JP6065028B2 (ja) 収音装置、プログラム及び方法
EP2252083B1 (en) Signal processing apparatus
JP4835151B2 (ja) オーディオシステム
US20090180626A1 (en) Signal processing apparatus, signal processing method, and storage medium
JP2008311718A (ja) 音像定位制御装置及び音像定位制御プログラム
JP2009141560A (ja) 音声信号処理装置、音声信号処理方法
JP5289128B2 (ja) 信号処理方法、装置及びプログラム
WO2020017518A1 (ja) 音声信号処理装置
JP7124506B2 (ja) 集音拡声装置、その方法、およびプログラム
WO2020027061A1 (ja) 会話サポートシステム、その方法、およびプログラム
JP5866883B2 (ja) スピーカ装置
EP3869502B1 (en) Sound signal processing method and sound signal processing device
JP5105336B2 (ja) 音源分離装置、プログラム及び方法
JP6984559B2 (ja) 集音拡声装置、その方法、およびプログラム
JP6798561B2 (ja) 信号処理装置、信号処理方法およびプログラム
JP5163685B2 (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130604

LAPS Cancellation because of no payment of annual fees