JP2010206451A5 - - Google Patents

Download PDF

Info

Publication number
JP2010206451A5
JP2010206451A5 JP2009048981A JP2009048981A JP2010206451A5 JP 2010206451 A5 JP2010206451 A5 JP 2010206451A5 JP 2009048981 A JP2009048981 A JP 2009048981A JP 2009048981 A JP2009048981 A JP 2009048981A JP 2010206451 A5 JP2010206451 A5 JP 2010206451A5
Authority
JP
Japan
Prior art keywords
speaker
listener
sound
signal processing
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009048981A
Other languages
English (en)
Other versions
JP2010206451A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2009048981A priority Critical patent/JP2010206451A/ja
Priority claimed from JP2009048981A external-priority patent/JP2010206451A/ja
Priority to PCT/JP2010/001328 priority patent/WO2010100873A1/ja
Priority to CN2010800100777A priority patent/CN102342131A/zh
Publication of JP2010206451A publication Critical patent/JP2010206451A/ja
Priority to US13/224,632 priority patent/US20110316996A1/en
Publication of JP2010206451A5 publication Critical patent/JP2010206451A5/ja
Pending legal-status Critical Current

Links

Description

信号処理装置、およびAVシステム
本発明は、AV(オーディオ・ビジュアル)システムにおいて、受聴者にとって好ましい音響再生を行うための技術に関する。
音の伝播は、音源と受聴者との位置関係や、音源と受聴者との間の環境によって異なる。このため、受聴者は、音の伝播の違いを検知して、音源の位置や環境の印象を知覚することができる。例えば、音源位置が受聴者の正面に固定してある場合、受聴者が顔を右に向ければ左の音が、左に向ければ右の音が、相対的に大きく、また,時間的に早く、外耳道に到達する(両耳間レベル差,両耳間時間差)。また、耳介はその形状から、音の到来方向に応じて,到来する音の周波数特性に異なる影響を与える。したがって、両耳で受聴する音の特性(周波数特性)や、両耳で受聴する音の変化により、受聴者はより鮮明に音源の存在を知覚することができる。
外耳道入り口と音源との間の伝達特性は、頭部伝達関数(HRTF,Head Related Transfer Function)と呼ばれ,人の音の定位(どこで音が発せられているか知覚すること)に大きな影響を与えることが分かっている。この人の音の定位能力を利用して、5.1ch,7.1chなどのマルチチャネルスピーカを用いて,より臨場感あふれる音声の再生を可能とするホームシアター機器等のAVシステムが、近年,一般家庭にも普及してきている。
このようなAVシステムでは、一般に、スピーカは受聴者を中心とした円上の所定の位置に、受聴者に向けて配置することが推奨されている。しかしながら、設置スペース等の関係により、各スピーカは必ずしも推奨位置に配置できるとは限らない。この場合には、次のような問題が生じる。
まず、コンテンツ製作者が意図したような音の再生が困難になるという問題がある。例えば、スピーカの配置位置が推奨位置と異なっている場合には、受聴者が知覚する音の到来方向が、本来想定していた方向と必ずしも一致しなくなる。このため、このスピーカから聞こえる音だけでなく、他のスピーカから発せられる音とのバランスにも影響を与えるため、受聴者が感じる音の印象は、コンテンツ制作者が意図していたものと大きく変わってしまう可能性がある。
また、スピーカが推奨位置に配置されている場合でも、受聴者が本来の推奨位置で受聴しなかったり、あるいは、推奨位置から移動してしまった場合等には、上と同様の問題が生じる。
このような問題に対して、特許文献1では、複数のスピーカと視聴者の位置をリアルタイムで検出する位置検出部と、複数のスピーカに音声信号を出力する制御部とを備えた音声再生装置を開示している。制御部は、位置検出部からの検出結果を元に、視聴者に対する各スピーカの位置関係を算出し、当該算出結果から各スピーカに対する音声信号出力タイミングを設定することによって、再生音を制御している。
また、特許文献2では、受聴者の顔向きや人数をカメラで検出し、カメラで得られた受聴者の位置に応じて、音像制御のためのフィルタ係数を切り替えることによって、再生音を制御する方法について開示している。
特開平6−311211号公報 特開2003−32776号公報
しかしながら、上述の従来技術では、次のような問題がある。
まず特許文献1では、受聴者とスピーカとの相対的な位置関係を検出し、それに基づいて音声信号の出力タイミングを制御している。すなわち、音響再生の制御のために考慮しているのは、受聴者に対するスピーカの位置のみである。また、特許文献2でも、カメラで得られた受聴者の位置に応じて、再生音を制御しているに過ぎない。
これに対して、音響再生に影響を与えるものは、受聴者とスピーカとの位置関係だけではない。例えば、受聴者に対するスピーカの向きも、音の聞こえ方に大きな影響を与える。これは、スピーカの指向特性が周波数毎に異なっていることに起因する。スピーカは本来、正面方向で聞こえる音において周波数特性のバランスがよくなるよう設計されている。ところが、スピーカの指向特性は周波数毎に異なるため、例えば、スピーカに対して横からあるいは後ろから音を聞くと、周波数特性のバランスが悪くなり、本来のスピーカの音響性能が得られなくなってしまう。
したがって、最適な音響再生を実現するためには、受聴者に対するスピーカの向きに関しても、音響再生の制御に反映させる必要がある。しかも、受聴者が受聴中に移動することも考慮すれば、動的に制御可能なように、受聴者に対するスピーカの向きに関する情報をリアルタイムで取得可能にすることが好ましい。
本発明は、AVシステムにおいて、音響再生の制御を、受聴者に対するスピーカの向きを動的に反映させつつ、実現することを目的とする。
第1の発明は、スピーカ本体と、前記スピーカ本体と一体に設置されており、当該スピーカ本体が音を出力する方向を撮影するカメラとを備えたカメラ付きスピーカ用の信号処理装置として、前記カメラから出力された画像信号を入力とし、前記画像信号から、受聴者に対する前記スピーカ本体の向きと、前記スピーカ本体から前記受聴者までの距離とを検出する認識部と、与えられた音声信号に対して、前記向きおよび前記距離のうち少なくともいずれか一方に応じて、信号処理を行い、前記スピーカ本体に音響信号として出力する音声制御部とを備えたものである。
この発明によると、カメラ付きスピーカのカメラによって撮影された画像から、認識部によって、受聴者に対するスピーカ本体の向きと、スピーカ本体から受聴者までの距離とを検出することができる。したがって、受聴者に対するスピーカの向きや距離を動的に反映させつつ、音響再生の制御を実現することが可能になる。
第2の発明は、AVシステムとして、スピーカ本体と、前記スピーカ本体と一体に設置されており、当該スピーカ本体が音を出力する方向を撮影するカメラと、前記カメラから出力された画像信号から、受聴者に対する前記スピーカ本体の向きと、前記スピーカ本体から前記受聴者までの距離とを検出する認識部と、与えられた音声信号に対して、前記向きおよび前記距離のうち少なくともいずれか一方に応じて、信号処理を行い、前記スピーカ本体に音響信号として出力する音声制御部とを備えたものである。
この発明によると、スピーカ本体と一体に設置されたカメラによって、スピーカ本体が音を出力する方向の画像を取得することができる。この画像から、認識部によって、受聴者に対するスピーカ本体の向きと、スピーカ本体から受聴者までの距離とを検出できる。したがって、受聴者に対するスピーカの向きや距離を動的に反映させつつ、音響再生の制御を実現することが可能になる。
本発明によると、カメラ付きスピーカを利用することによって、受聴者に対するスピーカの向きや距離を動的に反映させつつ、音響再生の制御を実現することが可能になるので、受聴者にとってより適切な音響再生が実現される。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
図1は実施の形態1に係るAVシステムの構成の一例を示す。図1のAVシステムでは、スピーカ本体111と、このスピーカ本体111と一体に設置されているカメラ112とを備えたカメラ付きスピーカ100を用いている。カメラ112は、スピーカ本体111が音を出力する方向を撮影する。また、このカメラ付きスピーカ100用の信号処理装置104は、音声制御部102と認識部103とを備えている。カメラ112から出力された画像信号は、信号処理装置104の認識部103に与えられる。AV再生装置101はAVコンテンツを再生し、音声信号と映像信号を出力する。音声信号は、信号処理装置104の音声制御部102に与えられる。映像信号はディスプレイ106に送られる。
信号処理装置104において、認識部103は、カメラ112から出力された画像信号が示す画像から受聴者P1の位置を認識し、認識した受聴者位置を基にして、受聴者P1に対するスピーカ本体111の向きを検出する。例えば、スピーカ本体111の正面方向(図1の一点鎖線)と、スピーカ本体111と受聴者P1とを結ぶ直線(図1の破線)とのなす角度θhを求める。音声制御部102は、与えられた音声信号に対して信号処理を行い、スピーカ本体111に音響信号として出力する。そして、その信号処理において、認識部103によって検出されたスピーカ本体111の向きに応じて、予め測定されているスピーカ本体111の指向特性に基づいた、出力信号の補正を行う。例えば、周波数毎のゲインを調整する。
なお、図1では、1個のカメラ付きスピーカ100しか図示していないが、AVシステムでは、スピーカは通常、複数個、配置される。複数のスピーカのうち、一部または全部がカメラ付きスピーカであればよい。また、各信号の伝送は、有線で行ってもよいし、無線で行ってもよい。
図2はカメラ付きスピーカ100の外観の一例である。図2の例では、カメラ112は、スピーカ本体111の上に、スピーカ本体111と同じ向きを向くように設置されている。スピーカは通常、受聴者の方を向くように設置されることが多いため、図2のような構成によりカメラ112が受聴者を撮影可能となる。
なお、カメラ付きスピーカにおけるカメラの設置形態は、図2の例に限られることはなく、受聴者の姿が撮影可能であれば、他の設置形態でもよい。例えば、スピーカ前面部分などにカメラを内蔵し、レンズ部分のみが外に露出している形態でもよい。また、画角の広いレンズ例えば魚眼レンズを用いれば、撮影範囲が広がるため、受聴者がカメラ視野に入る可能性が高くなるとともに、カメラの設置位置の選択肢を拡げることができる。例えば、スピーカ上部の角などにレンズが露出するような設置も可能である。
また、複数のカメラを設置してもよい。これにより、撮影範囲が広がるため、受聴者がカメラ視野に入る可能性が高くなる。また,複数のカメラで撮影した情報を用いることによって、受聴者の位置の検出精度の向上も期待できる。
図3を用いて、認識部103における処理について説明する。図3では、カメラ画像中に受聴者P1の顔画像IP1が含まれている。カメラ112の水平方向の画角は2γとする。認識部103は画像認識技術を用いて、カメラ画像から顔画像IP1を検出する。例えば、カメラ画像信号に信号処理を行い、エッジ検出によって輪郭を検出したり、色検出によって目や髪などの顔のパーツを検出したりすることによって、顔画像IP1を検出できる。このような顔認識技術は、近年ではディジタルカメラなどですでに応用されており、ここではその詳細な説明は省略する。
そして、検出された顔画像IP1のカメラ画像における水平方向の位置を求める。ここでは、顔画像IP1の中心位置がカメラ画像中心から左に長さaの位置にある(0<a<1、カメラ画像の水平方向の幅を2とする)ものとする。カメラ112の正面方向(図3の一点鎖線)と、カメラ112と受聴者P1とを結ぶ直線(図3の破線)とのなす角度をθhとすると、この角度θhは、上のaを用いると、
θh=γ*a
と求めることができる。この角度θhは、見方を変えれば、受聴者P1に対するスピーカ本体111の水平方向における向きを表している(スピーカ本体111の向きとカメラ112の向きとの関係は既知である)。
なお、顔画像IP1がカメラ画像の右半分に含まれている場合も、同様に角度θhを検出することができる。また、同様の方法によって、上下方向の角度θvも検出することができる。このような処理を行うことによって、認識部103は、受聴者P1に対するスピーカ本体の向きを検出することができる。
次に、スピーカと受聴者P1との距離Lを推定する方法の一例について、図4を用いて説明する。図4(a)はカメラ画像において、人の顔のサイズが距離に応じてどのように変わるかを模式的に示す図である。距離l0,l1,l2のとき、顔の幅がそれぞれm0,m1,m2になっている。図4(b)は検出された顔の幅と距離Lとの関係を示すグラフである。予め、数点の距離Lで画像上の顔幅を測定しておき、測定点間を内挿・外挿する直線または曲線を引くことによって、図4(b)のようなグラフを作成することができる。認識部103は図4(b)のような関係を例えば数式近似等を用いて記憶しておき、画像から検出した顔幅を用いて距離Lを推定する。
なお、実際のユーザは、標準的な頭の大きさを持つ人ばかりとは限らず、頭が標準より大きい人や小さい人もいる。そこで図4(b)では、頭の大きさが標準、大、小の3パタンのグラフを予め準備している。そして、受聴者の頭の大きさを測定や自己申告などによって入力し、その大きさに応じて標準、大、小のいずれかのグラフを選択するようにすればよい。もちろん、頭の大きさの分け方は3種類に限られるものではなく、例えば頭のサイズを1cm間隔でグループに分け,そのグループごとにグラフを作成しておいてもかまわない。
スピーカと受聴者P1との距離Lを推定する方法としては、ここで説明した方法以外にも、例えば、設置位置が既知の2台のカメラからの画像情報を基にして算出する方法や,カメラのオートフォーカスで受聴者を検出したピント位置から推定する方法等も、考えられる。
以上のように、認識部103は、カメラ112から出力された画像信号を用いて、受聴者P1の位置情報(角度θh,θvと距離L)を検出することができる。特に、カメラ112はスピーカ本体111と一体に設置されているため、スピーカ本体111に対する受聴者P1の位置が簡便に検出できる。このため、従来と比べて、より適切な音響再生が可能になる。
次に、音声制御部102における処理について説明する。図1に示すように、音声制御部102は、AV再生装置101からの音声信号に対して信号処理を行い、スピーカ本体111に音響信号として出力する。そして、認識部103によって検出された受聴者P1の位置情報(角度θh,θvと距離L)を受け、これに応じた信号処理を行う。
まず方向情報θh,θvの利用方法について説明する。ここでは、音声信号に対する信号処理にこの方向情報θh,θvを用いることによって、スピーカ本体111の指向特性に基づいた、出力信号の補正を行うものとする。すなわち本実施形態では、受聴者P1に対するスピーカ本体111の向きに応じて、スピーカ本体111の指向特性に基づき、出力信号が補正される。
図5はあるスピーカの指向特性を示すグラフである。図5の(a),(b)それぞれにおいて、円の中心から放射線状に広がる軸は音の強さを示しており、方向毎の音の強さすなわち指向特性が実線で描かれている。グラフの上側がスピーカの正面方向(前方向)である。指向特性は再生する音の周波数によって異なる。(a)では200Hz,500Hz,1000Hzの、(b)では2kHz,5kHz,10kHzの指向特性がそれぞれプロットされている。
図5から分かるように、スピーカの正面方向が最も音が強くなり、おおまかに言って、後方向(正面から180度反対方向)に向かうにつれて音が弱くなる。またその変化は、再生する音の周波数によって異なり、低い周波数では変化が少なく、周波数が高くなると変化が大きくなる。スピーカは一般に、正面方向で聴いたときに音のバランスが最も良くなるように音質調整されている。図5に示すような指向特性から、受聴者の位置がスピーカの正面方向からずれている場合、受聴する音の周波数特性が理想状態から大きく変わってしまい、音のバランスが悪くなってしまうことが分かる。同様の問題は、音の位相特性に関しても生じる。
そこで、スピーカの指向特性を測定し、指向特性の影響を補正するようなイコライザを予め算出しておき、検出した方向情報θh,θv、すなわち受聴者に対するスピーカ本体の向きに応じてイコライザ処理を行う。これにより、受聴者に対するスピーカの向きに依らない,バランスのよい再生を実現することが可能となる。
図6を用いて、具体的なイコライザ処理について説明する。図6はスピーカ正面からの角度毎および周波数毎の、音圧レベル(セル中の左の数字)とイコライザの補正ゲイン(セル中の右の数字)の例である。単位はそれぞれdBである。図6の例では、音圧レベルに対する補正ゲインを角度毎および周波毎に設定することによって、受聴者がどこにいてもスピーカの正面方向にいるのと同じ音を受聴可能にしている。言い換えると、図6の補正ゲインを用いることによって、各周波数における指向特性のグラフをほぼ真円にすることができる。なお、図6は一例であり、例えば、角度と周波数をより細かな設定としてもよい。また、検出された角度がデータ中にない場合は、内挿等によって補正ゲインを算出すればよい。
またここでは、水平面上の指向特性について述べたが、スピーカの指向特性はスピーカを取り囲む球上に定義される。そこで、図6を拡張し、水平方向における角度θhと垂直方向における角度θvのそれぞれについて、補正ゲインを設定すればよい。これにより、受聴者に対するスピーカの向きに応じた指向特性の補正を3次元的に行うことができる。
イコライザ処理を行うために、音声制御部102は、アナログフィルタ、IIRフィルタやFIRフィルタ等のディジタルフィルタを備えていればよい。また例えば、補正にパラメトリックイコライザを用いる場合には、補正ゲインと併せて、Q値(周波数特性のピークの鋭さをあらわす値)を設定してもかまわない。
次に、距離情報Lの利用方法について説明する。ある1点から音が発せられた場合、音は全方向に伝播し、広がった分だけ減衰していくが、この減衰量は距離の2乗に反比例する。例えば図7に示すように、音源からの距離がr1からr2(=r1×2)のように2倍になると、音圧は1/4(=(1/2))となり、r3(=r1×4)のように4倍になると、音圧は1/16(=(1/4))となる。すなわち、受聴者がスピーカから離れると、その分、受聴者に知覚される音の音圧は低くなる。この場合,他のスピーカからの音圧との関係から音量バランスが悪くなり、音の定位などが、コンテンツ製作者が意図したものとは異なる音が受聴されることになり、好ましくない。
そこで、検出した距離情報Lに応じて、スピーカから発せられる音のゲイン補正を行う。これにより、受聴者とスピーカとの距離が最適でない場合でも、バランスのよい再生を実現することが可能となる。
なお、ここで説明した距離と減衰との関係は、理想的な点音源(大きさがなく、無指向性の理論的な音源)で、かつ、理想的な自由音場で成り立つものである。実際には、音源は点音源でなく大きさをもち、指向性も有する。また、音場も様々な反射があるため自由音場ではない。このため、実際のスピーカや再生環境について、図8のような距離毎の補正ゲインを予め測定して保持しておけばよい。検出した距離Lがデータ中にない場合には、内挿近似等によって補正ゲインの近似値を算出すればよい。
またこの補正ゲインは、周波数毎に設定するようにしてもよい。高い周波数成分の音は低い周波数成分の音に比べて、距離による減衰量が大きいことが知られている。したがって、図8のようなデータテーブルを周波数毎に持つことによって、より精度の高い音圧補正を実現することできる。このような周波数ごとの音圧補正は、QMFフィルタバンク等による帯域分割とゲイン設定によって実現することが可能であり、IIRディジタルフィルタやFIRディジタルフィルタ等が一般に用いられる。
また、複数のスピーカからの音圧レベルを合わせるように補正することも可能である。例えば、受聴者までの距離が図7に示すr1,r2,r3の位置にそれぞれスピーカが配置されている場合、距離r2のスピーカの音量に合わせるように、距離r1のスピーカの音量を下げるとともに距離r3のスピーカの音量を上げる。この補正により、それぞれのスピーカから受聴者に到達する音量を合わせることができる。もちろん、他のスピーカの音量を基準に補正してもよいし、全く別の音量を基準にしてもよい。また、各スピーカの能率が違う場合には、それも考慮した音量調整を行うことも可能である。
このように、角度情報θh,θvと距離情報Lに応じて音声制御部102が補正を行うことによって、スピーカの向きが受聴者からずれている場合や、スピーカから受聴者までの距離が最適でない場合でも、より良い音の再生を実現することができる。
図9は音声制御部102内の処理ブロックの一例である。図9では、音声制御部102は、3個の処理ブロック121,122,123を備えており、処理ブロック121は上述したような、角度情報に応じた補正を行うものであり、処理ブロック122は上述したような、距離に応じたゲイン補正を行うものである。また、処理ブロック123は、複数のスピーカからの音のタイミングが受聴者位置で一致するように、検出された距離に応じて、音の出力タイミングを補正するものである。
なお、ここでは、角度毎および距離毎の補正値を全帯域または周波数毎のゲインで実現したが、それぞれを補正用FIRフィルタとして保持しておき、補正に用いることも可能である。FIRフィルタを用いることによって、位相の制御も可能となり、より精度の高い補正を行うことが可能となる。
次に、カメラ112による画像撮影、認識部103による検出処理、および音声制御部102による補正について、その動作タイミングの一例について説明する。
例えば、カメラ112は常に撮影を行い、画像信号を認識部103に出力し続ける。認識部103は常に画像信号から受聴者の位置を検出し、受聴者の位置情報を音声制御部102にリアルタイムで出力し続ける。音声制御部102はリアルタイムに出力される位置情報を受け、リアルタイムに補正処理を切り替えて音響信号を補正し続ける。これにより、受聴者の位置が動的に変化した場合であっても、それに追従した音声制御を実現することができる。
ただしこのような制御では、受聴者の微小な移動によっても補正処理が切り替わることになるが、聴感上検知できない程度の変化しか生じない場合もあり、そのような補正処理の切り替えは聴感上,意味のないものとなる。そのため例えば認識部103が、受聴者について所定の閾値以上の移動(角度または距離の変化)を検出したときにのみ、音声制御部102に受聴者の位置情報を出力するようにしてもよい。
または、カメラ112による画像撮影や認識部103による検出処理を、ある所定の時間間隔で行うようにしてもよい。これにより、システムの処理負荷を抑えることができる。あるいは、ユーザがリモコン等でトリガスイッチをONしたときに、認識部103および音声制御部102が処理を実行するようにしてもよい。これにより、システムの処理負荷をさらに抑えることが可能になる。
または、受聴者の位置情報の初期値を、例えばシステムが備えている測定モードの実行等によって予め設定しておき、その後の受聴者の移動に伴う動的補正を、カメラ112によって撮影した画像信号を用いて行うようにしてもよい。
なお、本実施形態で示したような補正用データテーブルは、例えば、音声制御部102内の不揮発メモリ等に記録されている。
また、実際のAVシステムは、複数のスピーカを備えているため、ここで説明した技術を各スピーカに適用することによって、各スピーカから再生されるそれぞれの音に対してユーザ位置に応じた制御を行うことができる。
(実施の形態2)
図10は実施の形態2に係るAVシステムの構成の一例を示す。図10において、図1と共通の構成要素には図1と同一の符号を付しており、ここではその説明を省略する。
図10の構成では、カメラ付きスピーカ200のスピーカ本体が、複数のスピーカユニットからなるアレイスピーカ113となっている。アレイスピーカは、スピーカユニットの個数を多くし、その長さを長くすることによって、鋭い指向特性を実現できる(例えば、西川他、「2次元ディジタルフィルタを用いた指向性アレースピーカ」、電子情報通信学会論文誌 A Vol.J78-A No.11 pp.1419-1428、1995年11月を参照)。この技術を音響再生に用いることによって、不要方向への音の拡散防止が期待されるが、そのためには、アレイスピーカ113の指向性のピークを受聴者の方向に向ける必要がある。
本実施形態では,このアレイスピーカ113にカメラ112を設置し、信号処理装置204において、認識部103が受聴者に対するアレイスピーカ113の向きを検出する。この検出は、実施形態1と同様に実現することができる。そして音声制御部202が、アレイスピーカ113の指向性のピークが受聴者の方向に向くよう、音声信号に対して信号処理を行い、各スピーカユニットにそれぞれ音響信号を出力する。
アレイスピーカ113の指向性のピークの向きは、例えば、各スピーカユニットへの音響信号に付加するディレイとゲインの設定によって、簡易に制御することができる。例えば、指向性のピークの向きを少し右にずらしたい場合は、左側のスピーカユニットについて、音響信号のディレイを小さくするとともにゲインを上げて、音をより早く大きく出力させればよい。
また、アレイスピーカ113の指向性のピークをより精度良く受聴者P1の方に向けるために、図11のような、各スピーカユニットの音声制御に用いるFIRフィルタ係数を角度毎に保持するデータテーブルを用いてもよい。図11(a)は角度θhとスピーカユニット毎のFIRフィルタ係数Hx_y(xは角度θh、yはスピーカユニット番号)を示している。また図11(b)は角度θh=30°のときの各スピーカユニットのFIRフィルタ係数の一例である。例えば、図11に示すようなデータテーブルを音声制御部202内の不揮発性メモリに記憶しておき、音声制御部202が、認識部103によって検出された角度情報θhに応じてデータテーブルからFIRフィルタ係数を読み出し、音声制御を実現する。
なおここでは,水平面での指向性制御について説明したが、スピーカユニットを垂直方向に配置したスピーカアレイを用いることによって、垂直方向における角度情報θvに応じた指向性制御も同様に実現可能である。
また、スピーカユニットを平面状に配置することによって、水平、垂直それぞれの角度情報に応じた指向性制御も実現可能である。
また、距離情報Lに応じた制御についても、実施形態1と同様に、距離に応じたゲイン補正を各スピーカユニットへの音響信号に実施すればよい。
また、アレイスピーカを用いた場合には、いわゆる局所再生を行うことが可能であり、本実施形態をこの局所再生の制御に適用してもかまわない。局所再生とは、ある所定範囲内でのみ音が再生され、そこから離れた位置では急激に音量が下がるような再生のことである。例えば、カメラ112によって受聴者P1の位置を検出し、想定した範囲外に受聴者P1がいた場合、音声制御部202が制御パラメタを切り替えて、局所再生の範囲を受聴者P1の位置が含まれるように制御する。
(実施の形態3)
図12は実施の形態3に係るAVシステムの構成の一例を示す。図12において、図1と共通の構成要素には図1と同一の符号を付しており、ここではその説明を省略する。
図12の構成では、カメラ付きスピーカ300が、スピーカ本体111の向きを変化させるための可動機構114を備えている。この可動機構114は、例えば電動式の回転テーブルによって実現される。そして信号処理装置304は、可動機構114を制御するための可動機構制御部301を備えている。認識部103は画像信号から検出した受聴者P1の位置情報を、音声制御部102に加えて可動機構制御部301に出力する。可動機構制御部301は受聴者P1の位置情報を受けて、スピーカ本体111が受聴者P1の方を向くように可動機構114に制御信号を送る。このような動作によって、スピーカ本体111の向きを受聴者P1の位置に動的に合わせることが可能になる。
上のようなスピーカの向きを実際に変える制御は、実施形態1で説明したスピーカの指向特性の補正処理と組み合わせて行ってもよい。具体的には例えば、受聴者P1に対するスピーカ本体111の向きを表す角度情報θh,θvが所定閾値以下である場合は、指向特性の補正処理で対応し、所定閾値を超えた場合は、可動機構114によってスピーカの向きを変える、といった制御を行ってもよい。スピーカの向きが受聴者から大きく外れた場合、指向特性の補正のためには大きな補正ゲインを与えなければならない。ところが補正ゲインを大きくすると、ディジタル信号ではオーバーフローの問題が生じ、また、スピーカ自体の再生上限ゲインによって音に歪みが生じる可能性がある。したがって、本実施形態における制御を指向特性補正と組み合わせることによって、このような問題を回避することができる。
また、本実施形態を、実施の形態2で示したアレイスピーカに適用してもよい。すなわち、アレイスピーカを可動機構に設置し、可動機構を制御してアレイスピーカの向きを変えることによって、指向性制御や局所再生向け制御を実現することが可能である。
(実施の形態4)
図13は実施の形態4に係るAVシステムの構成の一例を示す。図13において、図1と共通の構成要素には図1と同一の符号を付しており、ここではその説明を省略する。
図13の構成では、信号処理装置404において、認識部403は、カメラ112から出力された画像信号が示す画像から各受聴者P1,P2,P3の位置を認識し、受聴者の人数を検出する。そして受聴者P1,P2,P3それぞれについて、実施形態1と同様に位置情報を検出する。音声制御部402は、認識部403によって複数の受聴者P1,P2,P3が検出されたとき、スピーカ本体111の向きに加えて、受聴者P1,P2,P3同士の位置関係も用いて、信号処理を行う。例えば、複数の受聴者がスピーカ本体111からみて所定の角度の範囲内に存在する場合は、複数の受聴者の中心に対して、指向特性制御を行う。また、一人の受聴者だけ離れた位置にいる場合は、それ以外の受聴者に対する指向特性制御を行う、あるいは、補正自体を行わないようにする。このように、複数の受聴者が存在する場合、受聴者同士の位置関係に応じた信号処理を行うことによって、より適切な再生が実現される。
なお、カメラ画像から受聴者の人数を検出する場合、例えばスピーカからみて複数の受聴者が重なっている場合には、複数の受聴者を一人として認識してしまう可能性がある。しかしながら、このような場合でも、一人と認識した受聴者に向けて指向特性制御を行えば、音質上、特に問題は生じない。すなわち、複数の受聴者が重なって見える場合には、その人数を厳密に検出する必要はなく、その分処理が簡易になる。
なお、上述の各実施形態では、主として指向特性の補正について説明したが、その他にも例えば、スピーカからみた受聴者の顔向きやスピーカと受聴者間の距離を検出し、そのスピーカからの頭部伝達関数を推定して、音声制御部が制御を行うといった構成も可能である。音声制御部は予め顔向きと距離に応じた制御パラメタを保持しており、検出結果に応じて制御パラメタを切り替えて再生する。簡便な補正の例としては、スピーカから受聴者までの距離の補正がある。例えば、あるスピーカから受聴者までの距離が他のスピーカより近い場合、音を発するタイミングを遅くする。これにより、スピーカ距離を拡げたのと同じ効果が期待できる。
本発明では、AVシステムにおいて、受聴者にとってより適切な音響再生が実現されるので、例えば、ホームシアター機器などの音響品質向上などに有用である。
実施の形態1に係るAVシステムの構成の一例である。 カメラ付きスピーカの外観の一例である。 認識部における処理のうち、角度情報を検出する処理を説明するための図である。 認識部における処理のうち、距離情報を検出する処理を説明するための図である。 スピーカの指向特性の一例を示すグラフである。 イコライザ処理における補正ゲインのデータテーブルの例である。 音源からの距離と音の減衰量との関係を説明するための図である。 減衰補正のための補正ゲインのデータテーブルの例である。 音声制御部内の処理ブロックの一例である。 実施の形態2に係るAVシステムの構成の一例である。 フィルタ補正係数のデータテーブルの例である。 実施の形態3に係るAVシステムの構成の一例である。 実施の形態4に係るAVシステムの構成の一例である。
100,200,300 カメラ付きスピーカ
102,202,402 音声制御部
103,403 認識部
104,204,304,404 信号処理装置
111 スピーカ本体
112 カメラ
113 アレイスピーカ(スピーカ本体)
114 可動機構
301 可動機構制御部
P1,P2,P3 受聴者

Claims (6)

  1. スピーカ本体と、前記スピーカ本体と一体に設置されており、当該スピーカ本体が音を出力する方向を撮影するカメラとを備えたカメラ付きスピーカ用の信号処理装置であって、
    前記カメラから出力された画像信号を入力とし、前記画像信号から、受聴者に対する前記スピーカ本体の向きと、前記スピーカ本体から前記受聴者までの距離とを検出する認識部と、
    与えられた音声信号に対して、前記向きおよび前記距離のうち少なくともいずれか一方に応じて、信号処理を行い、前記スピーカ本体に音響信号として出力する音声制御部とを備えた
    ことを特徴とする信号処理装置。
  2. 請求項1記載の信号処理装置において、
    前記音声制御部は、予め測定されたスピーカの音響特性から生成された補正係数を持ち、前記信号処理として、前記補正係数を用いて、前記向きに応じ、前記スピーカ本体の指向特性に基づいた出力信号の補正、および、前記距離に応じた、音の減衰特性に基づいた出力信号の補正のうち、少なくともいずれか一方を行う
    ことを特徴とする信号処理装置。
  3. 請求項1記載の信号処理装置において、
    前記認識部は、受聴者の人数を検出可能であり、かつ、複数の受聴者検出たとき、各受聴者について、前記向きおよび前記距離を検出する
    ことを特徴とする信号処理装置。
  4. 請求項3記載の信号処理装置において、
    前記音声制御部は、前記認識部によって複数の受聴者が検出されたとき、前記複数の受聴者の中から補正対象の受聴者を特定し、この補正対象の受聴者に対して、前記信号処理を行う
    ことを特徴とする信号処理装置。
  5. 請求項3記載の信号処理装置において、
    前記音声制御部は、前記認識部によって複数の受聴者が検出されたとき、前記複数の受聴者同士の位置関係から、前記信号処理を行うか否かを判定する
    ことを特徴とする信号処理装置。
  6. スピーカ本体と、
    前記スピーカ本体と一体に設置されており、当該スピーカ本体が音を出力する方向を撮影するカメラと、
    前記カメラから出力された画像信号を入力とし、前記画像信号から、受聴者に対する前記スピーカ本体の向きと、前記スピーカ本体から前記受聴者までの距離とを検出する認識部と、
    与えられた音声信号に対して、前記向きおよび前記距離のうち少なくともいずれか一方に応じて、信号処理を行い、前記スピーカ本体に音響信号として出力する音声制御部とを備えた
    ことを特徴とするAVシステム。
JP2009048981A 2009-03-03 2009-03-03 カメラ付きスピーカ、信号処理装置、およびavシステム Pending JP2010206451A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009048981A JP2010206451A (ja) 2009-03-03 2009-03-03 カメラ付きスピーカ、信号処理装置、およびavシステム
PCT/JP2010/001328 WO2010100873A1 (ja) 2009-03-03 2010-02-26 カメラ付きスピーカ、信号処理装置、およびavシステム
CN2010800100777A CN102342131A (zh) 2009-03-03 2010-02-26 带摄像机的扬声器、信号处理装置以及av系统
US13/224,632 US20110316996A1 (en) 2009-03-03 2011-09-02 Camera-equipped loudspeaker, signal processor, and av system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009048981A JP2010206451A (ja) 2009-03-03 2009-03-03 カメラ付きスピーカ、信号処理装置、およびavシステム

Publications (2)

Publication Number Publication Date
JP2010206451A JP2010206451A (ja) 2010-09-16
JP2010206451A5 true JP2010206451A5 (ja) 2011-09-15

Family

ID=42709442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009048981A Pending JP2010206451A (ja) 2009-03-03 2009-03-03 カメラ付きスピーカ、信号処理装置、およびavシステム

Country Status (4)

Country Link
US (1) US20110316996A1 (ja)
JP (1) JP2010206451A (ja)
CN (1) CN102342131A (ja)
WO (1) WO2010100873A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5885918B2 (ja) * 2010-10-29 2016-03-16 ソニー株式会社 表示装置、音声信号処理方法およびプログラム
JP5817182B2 (ja) * 2011-03-31 2015-11-18 日本電気株式会社 スピーカ装置及び電子機器
JP5121999B1 (ja) * 2011-12-26 2013-01-16 株式会社東芝 位置座標検出装置、位置座標検出方法および電子機器
JPWO2013105413A1 (ja) 2012-01-11 2015-05-11 ソニー株式会社 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ
US9678713B2 (en) 2012-10-09 2017-06-13 At&T Intellectual Property I, L.P. Method and apparatus for processing commands directed to a media center
US9137314B2 (en) 2012-11-06 2015-09-15 At&T Intellectual Property I, L.P. Methods, systems, and products for personalized feedback
EP2955934B1 (en) * 2013-02-05 2017-09-20 Toa Corporation Amplification system
CN103491397B (zh) * 2013-09-25 2017-04-26 歌尔股份有限公司 一种实现自适应环绕声的方法和系统
CN104661159B (zh) * 2013-11-19 2017-12-15 中山市云创知识产权服务有限公司 扬声器
GB2528247A (en) * 2014-07-08 2016-01-20 Imagination Tech Ltd Soundbar
CN112929788A (zh) 2014-09-30 2021-06-08 苹果公司 确定扬声器位置变化的方法
US10362391B2 (en) * 2014-10-24 2019-07-23 Lenovo (Singapore) Pte. Ltd. Adjusting audio content based on audience
CN105827931B (zh) * 2015-06-19 2019-04-12 维沃移动通信有限公司 一种基于拍照的音频输出方法和装置
CN106331467B (zh) * 2015-06-30 2019-08-13 芋头科技(杭州)有限公司 全景照片自动拍摄系统及方法
TW201707471A (zh) * 2015-08-14 2017-02-16 Unity Opto Technology Co Ltd 自動控制指向性喇叭及其燈具
KR102423753B1 (ko) 2015-08-20 2022-07-21 삼성전자주식회사 스피커 위치 정보에 기초하여, 오디오 신호를 처리하는 방법 및 장치
US9736610B2 (en) 2015-08-21 2017-08-15 Sonos, Inc. Manipulation of playback device response using signal processing
WO2018143979A1 (en) 2017-02-01 2018-08-09 Hewlett-Packard Development Company, L.P. Adaptive speech intelligibility control for speech privacy
CN107277708A (zh) * 2017-06-06 2017-10-20 余姚德诚科技咨询有限公司 基于图像识别的电动式扬声器
CN108271098A (zh) * 2018-02-06 2018-07-10 深圳市歌美迪电子技术发展有限公司 音响机构以及音响系统
US11032508B2 (en) 2018-09-04 2021-06-08 Samsung Electronics Co., Ltd. Display apparatus and method for controlling audio and visual reproduction based on user's position
KR20200027394A (ko) * 2018-09-04 2020-03-12 삼성전자주식회사 디스플레이 장치 및 이의 제어 방법
JP7411422B2 (ja) 2019-03-27 2024-01-11 パナソニックホールディングス株式会社 音声入力方法、プログラム及び音声入力装置
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
JP6697174B1 (ja) * 2019-10-30 2020-05-20 富士通クライアントコンピューティング株式会社 情報処理装置、プログラムおよび情報処理システム
WO2021127286A1 (en) * 2019-12-18 2021-06-24 Dolby Laboratories Licensing Corporation Audio device auto-location
JP6795775B1 (ja) * 2020-02-13 2020-12-02 富士通クライアントコンピューティング株式会社 スピーカ装置、回転制御プログラム、および情報処理システム
CN113891216B (zh) * 2021-09-24 2023-08-29 深圳创维-Rgb电子有限公司 一种声音导向装置以及视听设备
GB2616073A (en) * 2022-02-28 2023-08-30 Audioscenic Ltd Loudspeaker control
CN115426589A (zh) * 2022-11-03 2022-12-02 荣耀终端有限公司 一种音频信号的调节方法及电子设备
CN115529527B (zh) * 2022-11-28 2023-04-07 东莞市云仕电子有限公司 一种挂耳式耳机

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541897A (ja) * 1991-08-07 1993-02-19 Pioneer Electron Corp スピーカ装置およびその指向性制御方法
US6914622B1 (en) * 1997-05-07 2005-07-05 Telbotics Inc. Teleconferencing robot with swiveling video monitor
US6535609B1 (en) * 1997-06-03 2003-03-18 Lear Automotive Dearborn, Inc. Cabin communication system
US6445287B1 (en) * 2000-02-28 2002-09-03 Donnelly Corporation Tire inflation assistance monitoring system
JP2000023281A (ja) * 1998-04-28 2000-01-21 Canon Inc 音声出力装置および方法
US6593956B1 (en) * 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
JP2001025084A (ja) * 1999-07-07 2001-01-26 Matsushita Electric Ind Co Ltd スピーカー装置
US6741273B1 (en) * 1999-08-04 2004-05-25 Mitsubishi Electric Research Laboratories Inc Video camera controlled surround sound
US6494363B1 (en) * 2000-01-13 2002-12-17 Ncr Corporation Self-service terminal
JP2001339703A (ja) * 2000-05-26 2001-12-07 Nec Corp テレビ会議システム及びテレビ会議システムに於けるカメラの制御装置並びにカメラの制御方法
CN101674512A (zh) * 2001-03-27 2010-03-17 1...有限公司 产生声场的方法和装置
JP2004537233A (ja) * 2001-07-20 2004-12-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ エコー抑圧回路及びラウドスピーカ・ビームフォーマを有する音響補強システム
BR0304830A (pt) * 2002-05-14 2004-08-17 Koninkl Philips Electronics Nv Dispositivo, e, método de comunicação entre um usuário e um aparelho elétrico
JP2004120459A (ja) * 2002-09-27 2004-04-15 Mitsubishi Electric Corp 音声出力装置
WO2004095878A2 (en) * 2003-04-23 2004-11-04 Rh Lyon Corp Method and apparatus for sound transduction with minimal interference from background noise and minimal local acoustic radiation
WO2006057131A1 (ja) * 2004-11-26 2006-06-01 Pioneer Corporation 音響再生装置、音響再生システム
US20070253561A1 (en) * 2006-04-27 2007-11-01 Tsp Systems, Inc. Systems and methods for audio enhancement
JP4894353B2 (ja) * 2006-05-26 2012-03-14 ヤマハ株式会社 放収音装置
JP4989934B2 (ja) * 2006-07-14 2012-08-01 パナソニック株式会社 スピーカシステム
JP4488036B2 (ja) * 2007-07-23 2010-06-23 ヤマハ株式会社 スピーカアレイ装置
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
US8620009B2 (en) * 2008-06-17 2013-12-31 Microsoft Corporation Virtual sound source positioning
US8385557B2 (en) * 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction

Similar Documents

Publication Publication Date Title
WO2010100873A1 (ja) カメラ付きスピーカ、信号処理装置、およびavシステム
JP2010206451A5 (ja)
KR102319880B1 (ko) 포커스 거리에 가까운 사운드 소스들을 강조하는 공간 오디오 처리
US9936323B2 (en) System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
US9560451B2 (en) Conversation assistance system
US8571192B2 (en) Method and apparatus for improved matching of auditory space to visual space in video teleconferencing applications using window-based displays
CN109391895B (zh) 调整固体电影屏幕上的音频图像的感知提升的系统和方法
JP4924119B2 (ja) アレイスピーカ装置
KR20170125660A (ko) 오디오 신호 처리 방법 및 장치
EP2589231A1 (en) Facilitating communications using a portable communication device and directed sound output
JP2013514696A (ja) 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
US20230096873A1 (en) Apparatus, methods and computer programs for enabling reproduction of spatial audio signals
US10652687B2 (en) Methods and devices for user detection based spatial audio playback
JP2003032776A (ja) 再生システム
US9110366B2 (en) Audiovisual apparatus
US10440495B2 (en) Virtual localization of sound
WO2013042324A1 (ja) 音響再生装置
WO2023171279A1 (ja) 音声出力装置、音声出力方法