JP5118267B2 - 音声信号再生装置、音声信号再生方法 - Google Patents

音声信号再生装置、音声信号再生方法 Download PDF

Info

Publication number
JP5118267B2
JP5118267B2 JP2012528581A JP2012528581A JP5118267B2 JP 5118267 B2 JP5118267 B2 JP 5118267B2 JP 2012528581 A JP2012528581 A JP 2012528581A JP 2012528581 A JP2012528581 A JP 2012528581A JP 5118267 B2 JP5118267 B2 JP 5118267B2
Authority
JP
Japan
Prior art keywords
sound
signal
speaker
virtual
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012528581A
Other languages
English (en)
Other versions
JPWO2012144227A1 (ja
Inventor
潤二 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2012528581A priority Critical patent/JP5118267B2/ja
Application granted granted Critical
Publication of JP5118267B2 publication Critical patent/JP5118267B2/ja
Publication of JPWO2012144227A1 publication Critical patent/JPWO2012144227A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Description

本発明は、頭部伝達関数を用いた音像定位処理を行う音響信号処理技術に関し、特に受聴位置前方に設置したスピーカ(以後、「フロントスピーカ」と呼ぶ)と耳近傍に設置したスピーカ(以後、「耳近傍スピーカ」と呼ぶ)とを用いて所望の位置に仮想音像定位を実現する機能を有する音声信号再生装置及び音声信号再生方法に関する。
仮想音像定位技術において、頭部伝達関数(HRTF:Head−Related Transfer Function)を用いて受聴者の前方及び後方の仮想音像定位を実現する手法がある。この手法では次のようにして仮想音像を生成する。
まず、仮想音像(以後、仮想音源ともいう)を定位させたい位置に測定用スピーカを設置し、この測定用スピーカから受聴者の外耳道入り口までの頭部伝達関数を測定する。こうして測定されたこの頭部伝達関数を目標特性とする。
続いて、再生音源を再生することにより、仮想音像を定位させるために用いる再生スピーカから受聴位置までの頭部伝達関数を測定する。こうして測定されたこの頭部伝達関数を再生特性とする。
ここで、仮想音像を定位させたい位置に設置した測定用スピーカは、目標特性を測定することにのみ用いられる。結果として、以後、受聴者が再生音源を再生する際には使用されない。すなわち、再生スピーカのみが再生音源を再生することで仮想音源を定位させるために用いられる。
そして、目標特性と再生特性を用いて仮想音像定位のための頭部伝達関数を算出する。算出される頭部伝達関数をフィルタ特性とする。このフィルタ特性を再生音源に畳み込むことで、仮想的なスピーカから音が出力されているように聴き取れる再生音源を生成することができる。
このように仮想音像を生成する際に、再生音源を再生するために用いる再生スピーカとしては、(1)フロントバーチャルサラウンドシステムに代表されるように受聴者前方に設置されるフロントスピーカを使用する場合、(2)ヘッドホンバーチャルサラウンドシステムに代表されるように耳近傍に設置される耳近傍スピーカを使用する場合、または、(3)これら両方を組み合わせて受聴者前方に設置されたフロントスピーカと受聴者の耳近傍に設置された耳近傍スピーカとを併用する場合がある。
フロントスピーカと耳近傍スピーカとを併用するシステムが、特許文献1及び特許文献2等に開示されている。
例えば、特許文献1には、機能拡張端子を有するゲーム機本体が記載されている。この機能拡張端子は、音声出力機能を備える。また、ゲーム機本体はスピーカを備えるテレビジョン受像機に接続される。このゲーム機本体は、テレビジョン受像機から音声を出力させるとともに、機能拡張端子に接続されるヘッドホンから音声を出力させる。
また、このゲーム機本体は、スピーカから音声を再生し、その音波が受聴者に到達するまでの時間遅延をヘッドホン再生信号に与える機能を有する。つまり、ゲーム機本体はスピーカからの音声とヘッドホンからのヘッドホン再生信号が受聴者に同時に聞こえるように調整を行う。
上記のように構成することで、ユーザはテレビジョン受像機からの音声と、ヘッドホンからの音声を同時に受聴することができるため、今まで以上の臨場感を持った音声の再現、創出ができる。さらに、ヘッドホン再生信号に時間遅延を与えることにより、音像定位位置を受聴者に近づけたり、離したりできる。
また、特許文献2では、フロントスピーカと耳近傍スピーカとを併用することにより、特に後方に定位するオーディオチャンネルの定位精度を改善する技術が示されている。
特許第4348886号公報 特開2006−345480号公報
しかしながら、従来技術においては、仮想音像が定位する位置が不明確であるという課題がある。
そこで本発明は、仮想音像をより正確な位置に定位させることが可能な音声信号再生装置を提供することを目的とする。
上記従来の課題を解決するため、本発明の一形態である音声信号再生装置は、受聴者の周囲に配置される複数のスピーカである第1スピーカ群と、当該第1スピーカ群よりも前記受聴者に近い位置に配置される複数のスピーカである第2スピーカ群とのそれぞれに対して、複数のオーディオチャンネル毎に定位すべき仮想音像位置を示す位置情報が含まれる音声信号を再生する音声信号再生装置であって、前記音声信号を取得する取得部と、前記音声信号に対して信号処理を行い、第1仮想音像位置に音が定位する前記第1スピーカ群用の第1再生信号、及び前記第1仮想音像位置と略同一の第2仮想音像位置に音が定位する前記第2スピーカ群用の第2再生信号を生成する仮想音場生成部とを備え、前記仮想音場生成部は、前記第1再生信号により示され、前記第1仮想音像位置のうち第1位置に定位する第1音と、前記第2再生信号により示され、前記第1位置と略同一位置に定位し、かつ、前記第1音と略同一の第2音とが、受聴位置において、位相及び音圧値の少なくとも一方が異なるように、前記第1再生信号および前記第2再生信号を生成する。
これによると、音声信号再生装置は、第1スピーカ群と第2スピーカ群とでそれぞれ同じ仮想音像を生成する際に生じる、両スピーカ群間におけるズレを抑制することができる。したがって、仮想音像をより正確な位置に定位させることができる。
また、前記仮想音場生成部は、前記略同一の特徴を有する2つの音の受聴時刻が所定の範囲内の時間だけ異なるように、前記第1再生信号を前記第1スピーカ群から出力する出力時刻および前記第2再生信号を前記第2スピーカ群から出力する出力時刻を調整するとしてもよい。
この構成によると、音声信号再生装置100は、第1スピーカ群から音を出力するタイミングおよび、第2スピーカ群から音を出力するタイミングを調整するころにより、事前に定められた範囲内の微少時間だけずれて再生音が受聴者に到達するように制御することができる。したがって、受聴者は、先行音効果が生じた2つの音を受聴することになる。その結果、受聴者は、受聴するタイミングがずれているにもかかわらず、後に到達した音により定位する仮想の音場が、先に到達した音により定位した仮想の音場と一致するように聞こえる。さらに、受聴者は、後に到達した音よりも先に到達した音を強く意識する。よって、フロントスピーカと耳近傍スピーカとで生成する仮想の音場において生じる、音場の分離、偏り、またはぼやけによる聴感上の違和感を抑制するとともに、フロントスピーカから音を出力する際のメリットまたは、耳近傍スピーカから音を出力する際のメリットを活用できる。
また、前記仮想音場生成部は、前記第1音が、前記第2音よりも前記所定の範囲の時間だけ先に前記受聴位置に到達するよう、前記第1再生信号および前記第2再生信号を生成するとしてもよい。
この構成によると、第1スピーカ群で再生された音が、仮想音場の定位に、より大きく寄与するようになる。その結果、音声信号再生装置100は、より優れた距離感を定位させることができる。
また、前記仮想音場生成部は、前記第2音が、前記第1音よりも前記所定の範囲の時間だけ先に前記受聴位置に到達するよう、前記第1再生信号および前記第2再生信号を生成するとしてもよい。
この構成によると、第2スピーカ群で再生された音が、仮想音場の定位に、より大きく寄与するようになる。その結果、音声信号再生装置100は、より優れた方向感を定位させることができる。
また、前記第1位置が、前記受聴者の後方である場合、前記仮想音場生成部は、前記第2音が、前記第1音よりも先に前記受聴位置に到達するよう前記第1再生信号および前記第2再生信号を生成するとしてもよい。
この構成によると、受聴者の後方に音像が定位する音であって、第1再生信号および第2再生信号のそれぞれに含まれる略同一の特徴を有する音を、第2スピーカ群から先に出力することができる。このようにすることで、受聴者は後方に音像が定位する音については、第2スピーカ群から出力される音を強く意識することになる。その結果、第1スピーカ群および第2スピーカ群から音を聞いているにもかかわらず、受聴者は後方の音については音像定位位置の方向をより明確に認識することができる。
また、前記第1位置が、前記受聴者の前方である場合、前記仮想音場生成部は、前記第1音が、前記第2音よりも先に前記受聴位置に到達するよう前記第1再生信号および前記第2再生信号を生成するとしてもよい。
この構成によると、受聴者の前方に音像が定位する音であって、第1再生信号および第2再生信号のそれぞれに含まれる略同一の特徴を有する音を、第1スピーカ群から先に出力することができる。このようにすることで、受聴者は前方に音像が定位する音については、第1スピーカ群から出力される音を強く意識することになる。その結果、第1スピーカ群および第2スピーカ群から音を聞いているにもかかわらず、受聴者は前方の音については音像定位位置の距離をより明確に認識することができる。
具体的には、前記所定の範囲は、0ミリ秒を超え、かつ、20ミリ秒未満であるとしてもよい。
また、前記仮想音場生成部は、さらに、前記複数のオーディオチャンネルの各々に、対応するゲインを乗じることにより前記音圧値を調整する音圧値調整部を有するとしてもよい。
この構成によると、仮想音場生成部は、定位する仮想音源に対応するオーディオチャンネル信号ごとにゲインを変更し、仮想音場を生成することができる。すなわち、仮想音源ごとに、仮想音源から再生される音の音圧値を変更し、仮想音場全体としてのゲインバランスを調整することが可能となる。その結果、第1スピーカ群と第2スピーカ群で生成される仮想音像による音場の偏りや分離を抑えることができる。
また、前記仮想音場生成部は、前記第1仮想音像位置に定位する音のうち、前記受聴者の前方に定位する音の音圧値が、前記受聴者の後方に定位する音の音圧値よりも大きくなるように、前記第1再生信号を生成するとしてもよい。
また、前記仮想音場生成部は、前記第2仮想音像位置に定位する音のうち、前記受聴者の後方に定位する音の音圧値が、前記受聴者の前方に定位する音の音圧値よりも大きくなるように、前記第2再生信号を生成するとしてもよい。
なお、本発明は、音声信号再生装置として実現できるだけでなく、音声信号再生装置を構成する処理手段をステップとする音声信号再生方法として実現したり、それらステップをコンピュータに実行させるプログラムとして実現したり、そのプログラムを記録したコンピュータ読み取り可能なCD−ROMなどの記録媒体として実現したり、そのプログラムを示す情報、データ又は信号として実現したりすることもできる。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよい。
さらに、本発明は、このような音声信号再生装置の機能の一部又は全てを実現する半導体集積回路(LSI)として実現したり、このような音声信号再生装置を含む音声信号再生システムとして実現したりできる。
以上より、仮想音像の位置をより正確に定位させることが可能な音声信号再生装置を提供できる。
図1は、実施の形態1及び2に係る音声信号再生装置の構成を示すブロック図である。 図2は、実施の形態1に係る音声信号再生装置の構成を示すブロック図である。 図3は、スピーカ群と受聴者との位置関係の一例を示す図である。 図4は、先行音効果を説明するための概念図である。 図5は、実施の形態に係る音声信号再生装置の動作の一例を示すフローチャートである。 図6は、実施の形態及び変形例に係る音声信号再生装置において、各スピーカで再生するあるオーディオチャンネルの信号値の遅延を表す図である。 図7は、実施の形態及び変形例に係る2つのスピーカ群からの音の到達の先後が音場定位に与える影響を示す図である。 図8は、実施の形態1及びその変形例に係る音声信号再生装置において、実現される音場を表す図である。 図9は、実施の形態1及びその変形例に係る音声信号再生装置の他の例を示す図である。 図10は、実施の形態2に係る音声信号再生装置の構成を示すブロック図である。 図11は、実施の形態2に係る音声信号再生装置の動作の一例を示すフローチャートである。 図12は、実施の形態2及びその変形例に係る音声信号再生装置において、各スピーカで再生する各オーディオチャンネル信号の信号値のゲインを表す図である。 図13は、実施の形態2及びその変形例に係る音響信号処理装置のケース(1)で実現される音場を表す図である。 図14は、実施の形態2及びその変形例に係る音響信号処理装置のケース(2)で実現される音場を表す図である。 図15は、実施の形態2及びその変形例に係る音響信号処理装置のケース(3)で実現される音場を表す図である。 図16は、実施の形態2及びその変形例に係る音響信号処理装置のケース(4)で実現される音場を表す図である。 図17は、実施の形態2に係る音声信号再生装置のより詳細な構成の一例を示す図である。 図18は、実施の形態2の変形例に係る音声信号再生装置のより詳細な構成を示す図である。 図19は、実施の形態1及び2並びに変形例にかかる音声信号再生装置を実現するコンピュータシステムのハードウェア構成を示すブロック図である。
(本発明の基礎となった知見)
本発明者は、「背景技術」の欄において記載した仮想音像定位技術に関し、以下の問題が生じることを見出した。
一般的に、フロントスピーカを用いるフロントバーチャルサラウンドシステムは、受聴者の前方に定位するオーディオチャンネル(すなわち、仮想音像)の定位精度はよいことが知られている。しかし、このサラウンドシステムの場合、受聴者の後方に定位するオーディオチャンネルは定位精度が悪い。一方、耳近傍スピーカを用いるバーチャルサラウンドシステムは、オーディオチャンネルの方向については定位精度がよいことが知られている。しかし、特に受聴者の前方に定位するオーディオチャンネルの距離感が適切に再現できない。具体的には、目標位置よりも受聴者に近い位置に定位する傾向にある。
引用文献1の場合、受聴者は、スピーカからの音声とヘッドホンからのヘッドホン再生信号を同時に聞くことになる。そのため、上記に記載したフロントスピーカにおけるメリットまたは耳近傍スピーカのメリットを活用することが難しい。その結果、仮想音像の定位位置が不正確になる。
また、フロントスピーカと耳近傍スピーカとの各々が、同じ位置に仮想音像を定位させることにより、仮想音像により形成される音場に偏りが発生して不自然な音場になってしまう。また、フロントスピーカ、もしくは耳近傍スピーカのどちらか一方の出力音圧レベルが極端に大きいと、一方のスピーカからの仮想音像が支配的になり、音場の分離が発生してしまう。その結果、やはり仮想音像の定位位置が不正確になる。
本発明は、上記課題を解決することにより、仮想音像をより正確な位置に定位させることが可能な音声信号再生装置を提供することを目的とする。
以下、図面を参照しながら、本発明の実施の形態について説明する。なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
(実施の形態1)
図1は、本実施の形態に係る音声信号再生装置100の機能ブロックを示す。
音声信号再生装置100は、受聴者10の周囲に配置される複数のスピーカである第1スピーカ群51と、当該第1スピーカ群51sよりも前記受聴者に近い位置に配置される複数のスピーカである第2スピーカ群52とのそれぞれに対して、複数のオーディオチャンネル毎に定位すべき仮想音像位置を示す位置情報が含まれる音声信号を再生する。
図1に示される様に、音声信号再生装置100は、取得部1と、仮想音場生成部80とを備える。
取得部1は、音源から音声信号を取得し、2つの音声信号に分配する。
仮想音場生成部80は、音声信号に対して信号処理を行い、第1仮想音像位置に音が定位する第1スピーカ群51用の第1再生信号、及び第1仮想音像位置と略同一の第2仮想音像位置に音が定位する第2スピーカ群52用の第2再生信号を生成する。ここで、仮想音場生成部80は、第1再生信号により示され、第1仮想音像位置のうち第1位置に定位する第1音と、第2再生信号により示され、第1位置と略同一位置に定位し、かつ、第1音と略同一の第2音とが、受聴位置において、位相及び音圧値の少なくとも一方が異なるように、第1再生信号および第2再生信号を生成する。
以下、受聴位置において、第1音と第2音との位相が異なるように、仮想音場生成部80が第1再生信号及び第2再生信号を生成する具体例を、実施の形態1としてより詳細に説明する。
図2は、本実施の形態に係る音声信号再生装置100Aの構成を示すブロック図である。
本実施の形態に係る音声信号再生装置100Aは、受聴者の周囲に配置される複数のスピーカである第1スピーカ群51と、第1スピーカ群51よりも受聴者に近い位置に配置される複数のスピーカである第2スピーカ群52とに対して音場生成処理が施された音声信号を出力する音声信号再生装置である。
図2に示されるように、音声信号再生装置100Aは、取得部1、及び仮想音場生成部80Aを備える。
取得部1は、複数のオーディオチャンネル信号を含む音声信号を取得する。本実施の形態では、5ch(チャンネル)の音声信号(すなわち、5つのオーディオチャンネル信号を含む音声信号)を例に説明するが、オーディオチャンネル信号の数はこれに限られない。例えば、2ch、4ch、又は、7chなど、任意のオーディオチャンネル信号を含む音声信号を入力とすることができる。
取得部1は、また、取得した音声信号を分配し、第1スピーカ群51で第1再生音として再生するための第1音声信号と、第2スピーカ群52で第2再生音として再生するための第2音声信号とを生成する。
仮想音場生成部80Aは、第1音声信号及び第2音声信号に対してそれぞれ信号処理を行い、第1仮想音像位置に音が定位する第1スピーカ群用の第1再生信号および第2仮想音像位置に音が定位する第2スピーカ群用の第2再生信号を生成する。ここで、仮想音場生成部80Aは、第1再生信号により示され、第1仮想音像位置のうち第1位置に定位する第1音と、第2再生信号により示され、第1位置と略同一位置に定位し、かつ、第1音と略同一の第2音とが、受聴位置において位相が異なるように、第1再生信号および第2再生信号を生成する。以後、仮想音場生成部80Aによる信号処理が施された第1音声信号を、第1再生信号ともいう。また、仮想音場生成部80Aによって信号処理が施された第2音声信号を、第2再生信号ともいう。
なお、略同一の特徴を有する2つの音とは、同一の特徴を有する2つの音を含んでもよい。また、特徴とは音の周波数及び振幅の値などを意味し、以後、略同一の特徴を有する2つの音を、「同じ音」ともいう。
具体的には、仮想音場生成部80Aは、略同一の特徴を有する2つの音の受聴時刻が所定の範囲内の時間だけ異なるように、第1再生信号を第1スピーカ群51から出力する出力時刻および第2再生信号を第2スピーカ群52から出力する出力時刻を調整する。
例えば、仮想音場生成部80Aは、第1音が、第2音よりも所定の範囲の時間だけ先に受聴者10の受聴位置に到達するよう、第1再生信号および第2再生信号を生成してもよい。
または、仮想音場生成部80Aは、第2音が、第1音よりも所定の範囲の時間だけ先に受聴者10の受聴位置に到達するよう、第1再生信号および第2再生信号を生成してもよい。
より詳細には、仮想音場生成部80Aは、出力時間差制御部3と、フィルタ処理部70とを有する。
出力時間差制御部3は、第1音と、第2音とが、事前に定められた時間だけ異なる時刻に受聴者10へ到達するように、第1再生信号と第2再生信号との出力時間の差を制御する。
なお、仮想音場生成部80Aは、第1音が第2音よりも先に受聴者10に到達するように音場生成処理を施してもよく、逆に、第2音が第1音よりも先に受聴者10に到達するように音場生成処理を施してもよい。すなわち、出力時間差制御部3は、第1音が第2音よりも先に受聴者10に到達するように出力時間の差を制御してもよく、逆に、第2音が第1音よりも先に受聴者10に到達するように出力時間の差を制御してもよい。
フィルタ処理部70は、第1再生音により定位する第3スピーカ群と、第2再生音により定位する第4スピーカ群とが、事前に定められた同じ位置に定位するように、第1音声信号及び第2音声信号にフィルタ処理を施す。
例えば、本実施の形態におけるフィルタ処理部70は、5chの第1音声信号を2chへ変換し、第1スピーカ群51へ出力する。第1スピーカ群51で再生された第1再生音を聴く受聴者10にとっては、音声信号に含まれていた5chの各々に対応づけられた位置へ、第3スピーカ群の各々が定位する。また、フィルタ処理部70は、5chの第2音声信号を2chへ変換し、第2スピーカ群52へ出力する。第2スピーカ群52で再生された第2再生音を聴く受聴者10にとっては、音声信号に含まれていた5chの各々に対応づけられた位置へ、第4スピーカ群が定位する。フィルタ処理部70の具体的な処理内容は、前述した関連技術に係る頭部伝達関数により決定されるため、詳細は省略する。
より詳細には、フィルタ処理部70は、耳近傍スピーカ用フィルタ4と、フロントスピーカ用フィルタ5とを有する。
フロントスピーカ用フィルタ5は、第1再生音により第3スピーカ群(後述する、仮想音源11〜仮想音源15)が事前に定められた位置に定位するように、第1音声信号にフィルタ処理を施す。
耳近傍スピーカ用フィルタ4は、第2再生音により第4スピーカ群(後述する、仮想音源21〜仮想音源25)が事前に定められた位置に定位するように、第2音声信号にフィルタ処理を施す。
以下、上記構成による、音声信号再生装置100Aについて、より詳細に説明する。
本実施の形態に係る第1スピーカ群51は、フロントL(Left)スピーカ6と、フロントR(Right)スピーカ7とを備える。また、第2スピーカ群52は、耳近傍Lスピーカ8と、耳近傍Rスピーカ9とを備える。
音声信号再生装置100Aは、入力信号であるマルチチャンネルの音声信号に含まれるフロントLチャンネル信号(以下、FL信号という)を1組のフロントLスピーカ6及びフロントRスピーカ7、並びに、1組の耳近傍Lスピーカ8及び耳近傍Rスピーカ9の少なくとも一方の組を用いて再生する。これにより、音声信号再生装置100Aは、FL信号を再生するための仮想音源を、仮想フロントLチャンネルスピーカ(以下、仮想FLスピーカという)として定位させる。本実施の形態ではフロントLスピーカ6及びフロントRスピーカ7の両スピーカにより再生される第1再生音により仮想FLスピーカ11が定位し、耳近傍Lスピーカ8及び耳近傍Rスピーカ9の両スピーカにより再生される第2再生音により、仮想FLスピーカ21が定位するとする。
また、音声信号再生装置100Aは、入力信号であるマルチチャンネルの音声信号に含まれるフロントRチャンネル信号(以下、FR信号という)を1組のフロントLスピーカ6及びフロントRスピーカ7、並びに、1組の耳近傍Lスピーカ8及び耳近傍Rスピーカ9の少なくとも一方の組を用いて再生する。これにより、音声信号再生装置100Aは、FR信号を再生するための仮想音源を、仮想フロントRチャンネルスピーカ(仮想FRスピーカ)として定位させる。本実施の形態ではフロントLスピーカ6及びフロントRスピーカ7の両スピーカにより再生される第1再生音により仮想FRスピーカ12が定位し、耳近傍Lスピーカ8及び耳近傍Rスピーカ9の両スピーカにより再生される第2再生音により仮想FRスピーカ22が定位する。
同様に、音声信号再生装置100Aは、入力信号であるマルチチャンネルの音声信号に含まれるサラウンドLチャンネル信号(以下、SL信号という)を1組のフロントLスピーカ6及びフロントRスピーカ7、並びに、1組の耳近傍Lスピーカ8及び耳近傍Rスピーカ9の少なくとも一方の組を用いて再生する。これにより、音声信号再生装置100Aは、SL信号を再生するための仮想音源を、仮想サラウンドLチャンネルスピーカ(仮想SLスピーカ)として定位させる。本実施の形態ではフロントLスピーカ6及びフロントRスピーカ7の両スピーカにより再生される第1再生音により仮想SLスピーカ13が定位し、耳近傍Lスピーカ8及び耳近傍Rスピーカ9の両スピーカにより再生される第2再生音により仮想SLスピーカ23が定位する。
また、音声信号再生装置100Aは、入力信号であるマルチチャンネルの音声信号に含まれるサラウンドRチャンネル信号(以下、SR信号という)を1組のフロントLスピーカ6及びフロントRスピーカ7、並びに、1組の耳近傍Lスピーカ8及び耳近傍Rスピーカ9の少なくとも一方の組を用いて再生する。これにより、音声信号再生装置100Aは、SR信号を再生するための仮想音源を、仮想サラウンドRチャンネルスピーカ(仮想SRスピーカ)として定位させる。本実施の形態では、フロントLスピーカ6及びフロントRスピーカ7の両スピーカにより再生される第1再生音により仮想SRスピーカ14が定位し、耳近傍Lスピーカ8及び耳近傍Rスピーカ9の両スピーカにより再生される第2再生音により仮想SRスピーカ24が定位する。
また、音声信号再生装置100Aは、入力信号であるマルチチャンネルの音声信号に含まれるセンターチャンネル信号(以下、C信号という)を1組のフロントLスピーカ6及びフロントRスピーカ7、並びに、1組の耳近傍Lスピーカ8及び耳近傍Rスピーカ9の少なくとも一方の組を用いて再生する。これにより、音声信号再生装置100Aは、C信号を再生するための仮想音源を、仮想センターチャンネルスピーカ(仮想Cスピーカ)として定位させる。本実施の形態では、フロントLスピーカ6及びフロントRスピーカ7の両スピーカにより再生される第1再生音により仮想Cスピーカ15が定位し、耳近傍Lスピーカ8及び耳近傍Rスピーカ9の両スピーカにより再生される第2再生音により仮想Cスピーカ25が定位する。
図2に示すように、複数のオーディオチャンネル信号(FR信号、SR信号、FL信号、SL信号、及びC信号)を含む入力信号は取得部1から入力される。ここで、各オーディオチャンネル信号は、各仮想スピーカに対応する。
出力時間差制御部3はフロントスピーカ用信号と耳近傍スピーカ用信号との位相差を制御し、後段のフロントスピーカと耳近傍スピーカとから各信号を出力するタイミングを制御する。
耳近傍スピーカ用フィルタ4は、出力時間差制御部3から出力された5chの耳近傍スピーカ用信号(すなわち、第2音声信号)に対して、耳近傍スピーカ用フィルタ係数に基づくフィルタ処理を行うことで2chの仮想音場生成信号を生成し、各々のオーディオチャンネル信号を耳近傍Lスピーカ8と耳近傍Rスピーカ9とに出力する。
耳近傍スピーカ用フィルタ4における耳近傍スピーカ用フィルタ係数に基づく処理とは、例えば、耳近傍スピーカ用信号にSL信号とSR信号とが含まれている場合を例に挙げると、以下の通りとなる。すなわち、SL信号及びSR信号に処理を施すことで耳近傍スピーカ用フィルタ4が生成した仮想音場生成信号が、耳近傍Lスピーカ8及び耳近傍Rスピーカ9の各々で再生されているとする。このとき、SL信号が、SL信号に対応した位置に定位する仮想音源である仮想SLスピーカ23から再生され、SR信号が、SR信号に対応した位置に定位する仮想音源である仮想SRスピーカ24から再生されているように、受聴者10に知覚されるような特性を、SL信号及びSR信号の各々に与える処理を耳近傍スピーカ用フィルタ係数に基づく処理という。
フロントスピーカ用フィルタ5は、出力時間差制御部3から出力された5chのフロントスピーカ用信号(すなわち、第1音声信号)に対して、フロントスピーカ用フィルタ係数に基づくフィルタ処理を行うことで2chの仮想音場生成信号を生成し、各々をフロントLスピーカ6とフロントRスピーカ7とに出力する。
フロントスピーカ用フィルタ5におけるフロントスピーカ用フィルタ係数に基づく処理とは、例えば、フロントスピーカ用信号にSL信号とSR信号とが含まれている場合を例に挙げると、以下の通りとなる。すなわち、SL信号及びSR信号に処理を施すことでフロントスピーカ用フィルタ5が生成した仮想音場生成信号が、フロントLスピーカ6及びフロントRスピーカ7の各々で再生されているとする。このとき、SL信号が、SL信号に対応した位置に定位する仮想音源である仮想SLスピーカ13から再生され、SR信号が、SR信号に対応した位置に定位する仮想音源である仮想SRスピーカ14から再生されているように、受聴者10に知覚されるような特性を、SL信号及びSR信号の各々に与える処理をフロントスピーカ用フィルタ係数に基づく処理という。
このように構成された音声信号再生装置100Aを介して、フロントLスピーカ6及びフロントRスピーカ7を含む第1スピーカ群と、耳近傍Lスピーカ8及び耳近傍Rスピーカ9を含む第2スピーカ群とからそれぞれ再生される音を聴くことにより、受聴者10には、実在しない仮想音源である、仮想FLスピーカ11及び21、仮想FRスピーカ12及び22、仮想SLスピーカ13及び23、仮想SRスピーカ14及び24、並びに仮想Cスピーカ15及び25の位置から再生音が聞こえる。
ここで前述のように、第1スピーカ群による第1再生音、及び、第2スピーカ群による第2再生音の各々を用いて各仮想音源を定位させる場合、同一の仮想音源を定位させるための同一の音が、同時に受聴者10へ到達するように再生されると、受聴者は聴感上の違和感を生じる。
本願発明は、この課題を解消するための音声信号再生装置の提供を目的としたものであるため、以下、この課題と解決方法について、より詳細に説明する。
図3は、第1スピーカ群51及び第2スピーカ群52に含まれる各スピーカと、受聴者との位置関係の一例を示す図である。ここで、フロントLスピーカ6と受聴者10との距離をl[m]とし、耳近傍Lスピーカ8と受聴者10との距離をm[m](l>>m)とする。また、音速をc[m/s]とする。このとき、フロントLスピーカ6から再生された第1再生音に含まれる第1音が受聴者10へ届くまでに要する時間Tは、T=l/c[s]となり、耳近傍Lスピーカ8から再生された第2再生音に含まれる第2音が受聴者10へ届くまでに要する時間Tは、T=m/c[s]となる。
よって、フロントLスピーカ6による第1音の再生時刻と耳近傍Lスピーカ8による第2音の再生時刻とが同時であれば、第2音の方が、T−T[s]だけ早く受聴者10へ到達する。例えば、l=5[m]、m=3[cm]、c=346[m/s]の場合、T−Tは、およそ15[ms]となる。すなわち、第1音と第2音とが同じ音である場合に、受聴者10は15[ms]ずれて、同じ音を聞くことになる。これは、受聴者10にとって不自然なエコーとなって聞こえる。
よって、従来は、耳近傍Lスピーカ8が、フロントLスピーカ6よりも、T−T[s]だけ遅く同じ音を再生することにより、同じ音が同時に受聴者10へ到達するように、再生時間が制御されることが一般的である。すなわち、想定される受聴者10と、第1スピーカ群51及び第2スピーカ群52との位置関係(前述のl、m)から、T−Tの値を事前に求めておき、同一の音を、第2スピーカ群52は、第1スピーカ群51よりもT−T[s]だけ遅れて再生するように、制御される。
しかし、前述のとおり、フロントスピーカ用フィルタ係数に基づくフィルタ処理がなされた第1スピーカ群51による再生音と、耳近傍スピーカ用フィルタ係数に基づくフィルタ処理がなされた第2スピーカ群52による再生音とが同時に受聴者10へ到達した場合であっても、受聴者10は聴感上の違和感を覚える。これは、受聴者10の耳に到達するタイミングが揃っている場合においても、第1スピーカ群51で生成する仮想の音場と、第2スピーカ群52で生成する仮想の音場とは、正確には一致せず、音場の分離、偏り、またはぼやけなどが生じるためである。
そこで本実施の形態に係る音声信号再生装置100Aは、先行音効果によって、この違和感を抑制する。
図3は、先行音効果を説明するための概念図である。ここで、波形510は時刻t1に受聴者10へ到達した第1音の波形を表し、波形512は時刻t2に受聴者10へ到達した、第1音と同じ音である第2音の波形を表すとする。
先行音効果とは、Δt=|t2−t1|が所定の範囲に含まれている場合には、後に到達した第2音の音源方向の定位が、先に到達した第1音の音源方向の定位へ偏って聞こえる現象をいう。ここで、Δtは、環境によって異なるが、およそ、0<Δt<20[ms]であることが知られている。
すなわち、音声信号再生装置100Aは、第1音が受聴者10へ到達する時刻と、第2音が受聴者10へ到達する時刻とが、先行音効果が生じるΔtだけずれるよう、第1再生信号と第2再生信号との出力時間の差を制御する。これにより、第1音と第2音のうち、先に受聴者10へ到達した先行音により定位する仮想音源の位置へ、後から到達した音により定位する仮想音源の位置を正確に一致させることができる。
次に、以上のように構成された本実施の形態に係る音声信号再生装置100Aの音像定位処理についてより詳細に説明する。
図5は、本実施の形態に係る音声信号再生装置100Aの動作の一例を示すフローチャートである。
まず、取得部1は、複数のオーディオチャンネル信号を含む音声信号を取得する(S21)。
次に、取得部1は、取得部1で取得した複数のオーディオチャンネル信号を含む音声信号を、フロントスピーカと耳近傍スピーカとでそれぞれ個別に処理して再生するために、同一音声信号からなる2系統(すなわち、第1音声信号と第2音声信号と)に分配する(S22)。
なお、必ずしも同一音声信号からなる2系統に分配する必要はなく、信号値の大きさについては、例えば受聴者とフロントスピーカ、及び受聴者と耳近傍スピーカの距離を考慮して、分配する際の信号値の比率を変更してもよいし、フロントスピーカと耳近傍スピーカの能率を考慮して、分配する際の信号値の比率を変更してもよい。
例えば、受聴者10とスピーカとの距離が遠いほど、より大きな信号値となるように比率を変更してもよい。また、スピーカの能率が悪いほど、より大きな信号値となるように比率を変更してもよい。
また、2系統の信号間における出力時間差については、例えば受聴者とフロントスピーカ、及び受聴者と耳近傍スピーカとの距離を考慮して、受聴者の位置でフロントスピーカ用信号と耳近傍スピーカ用信号の位相が揃うように出力時間差を制御してもよい。
例えば、図3を参照して、取得部1はT−T[s]だけ第2再生信号が遅れるように出力時間差を制御してもよい。
本実施の形態においてはこれ以降、取得部1が、ステップS22において、受聴者10の位置でフロントスピーカの出力(第1再生音)と耳近傍スピーカの出力(第2再生音)とが聴感上等しくなるように信号値の大きさを揃え、かつフロントスピーカの出力と耳近傍スピーカの出力の位相が受聴者10の位置で揃う(すなわち、第1音と第2音とが同時に受聴者10へ到達する)ように同一音声信号を2系統に分配するものとする。
次に、出力時間差制御部3は、フロントスピーカと耳近傍スピーカとで再生する各オーディオチャンネル信号の出力タイミングを制御する(S23)。
ステップS22及びステップS23について、図6の(a)及び図6の(b)を用いてより詳細に説明する。
図6の(a)は、第1再生信号と比較して、N[msec]の遅延を与えられた第2再生信号の波形を表し、図6の(b)は、第1再生信号の波形を表している。図6の(a)において、第2再生信号に遅延がなく、第1再生信号と第2再生信号の位相が揃っている場合(N=0)は、両信号が同時に再生されたことを表す。
また、第2再生信号がNだけ第1再生信号よりも遅延している場合(N=N)は、受聴者10が位相の等しい両信号の再生音を同時に聴くことを意味する。本実施の形態においては、前述したように取得部1が、取得した音声信号を分配後に、第2再生信号をNだけ遅延させて出力する(S22)。なお、図3を参照して、N=T−Tである。
本実施の形態に係る出力時間差制御部3は、Nを基準に考えると、これよりもΔtだけ、第2再生信号の遅延量を増減させるよう、第1再生信号及び第2再生信号の出力時間を制御する(S23)。図6は、遅延量N=N−Δtとすることで、第2再生信号が受聴者10にとって先行音となるように制御した場合を示す。
ここで、遅延量Nは、フロントスピーカ出力と耳近傍スピーカ出力によって所望の音場が形成されるように適切な値が出力時間差制御部3により設定される。適切な遅延量は、例えばあらかじめ主観評価実験を行い、フロントスピーカ出力と耳近傍スピーカ出力との間の遅延量を可変させて、先行音効果により所望の音場が得られるような遅延量を求めることで決定する。
ただし、遅延量が大きすぎると受聴者がフロントスピーカ用信号と耳近傍スピーカ用信号を別々に知覚することにより不快なエコー感が増大し、フロントスピーカによる音場と耳近傍スピーカによる音場が分離して音場の一体感が失われてしまう、という問題が発生する。よって、遅延量は、大きすぎないことが望ましい。具体的には、前述のように、0<Δt<20[msec]とすることが考えられる。なお、被験者実験の結果、より詳細には、2[msec]<Δt<8[msec]とすることが好ましい。
なお、本実施の形態においては説明のため、(1)ステップS22において、第1再生信号と第2再生信号との受聴者10への到達時間差を0にする遅延(N)を一方の音声信号に与えた後、(2)ステップS23において、先行音効果を生じさせるために、いずれかの音声信号の遅延量を増減させるという2段階の処理を行った。
しかし、必ずしも遅延処理を2段階に分割する必要はなく、1段階で行ってもよい。例えば、N及びΔtを事前に定めておき、出力時間差制御部3が、第1再生信号及び第2再生信号のうちの一方を常にΔt=N−Δtだけ遅延させるよう、出力時間の差を制御してもよい。
すなわち、本実施の形態に係る音声信号再生装置100Aは、所定の範囲として、0ミリ秒を超え、かつ、20ミリ秒未満となる時間を使用することが好ましい。
言いかえると、出力時間差制御部3は、第1音が受聴者10へ到達する第1時刻と、第2音が受聴者10へ到達する第2時刻との差の絶対値が、0ミリ秒を超え、かつ、20ミリ秒未満となるように、第1再生信号と第2再生信号との出力時間の差を制御してもよい。
より詳細には、出力時間差制御部3は、第2時刻が第1時刻よりも、0ミリ秒を超えて20ミリ秒未満の時間だけ早くなるように、第1再生信号と第2再生信号との出力時間の差を制御してもよい。また、出力時間差制御部3は、第1時刻が第2時刻よりも、0ミリ秒を超えて20ミリ秒未満の時間だけ早くなるように、第1再生信号と第2再生信号との出力時間の差を制御してもよい。
すなわち、本実施の形態に係る出力時間差制御部3は、第1再生音に含まれる音である第1音が受聴者10へ到達する第1時刻と、第2再生音に含まれる音であって、第1音と同一の音である第2音が受聴者10へ到達する第2時刻との差の絶対値が、0ミリ秒を超え、かつ、20ミリ秒未満となるように、第1再生信号と第2再生信号との出力時間の差を制御してもよい。
詳細には、出力時間差制御部3は、第1時刻と第2時刻との差の絶対値が、2ミリ秒を超えて8ミリ秒未満となるように、第1再生信号と第2再生信号との出力時間の差を制御してもよい。また、出力時間差制御部3は、第2時刻が第1時刻よりも、2ミリ秒を超えて8ミリ秒未満の時間だけ早くなるように、第1再生信号と第2再生信号との出力時間の差を制御してもよい。
なお、本実施の形態において、第1音と第2音のどちらが先に受聴者10へ到達するかによって、受聴者10にとって定位する仮想音場の特性は変化する。以下、図7を参照して、この違いを説明する。
図7は、実施の形態に係る2つのスピーカ群(第1スピーカ群51及び第2スピーカ群52)の各々からの音の到達の先後が音場定位に与える影響を示す図である。
表331は、耳近傍に設置される第2スピーカ群52から再生された第2音が、Δtだけ先に受聴者10へ到達した場合の音場定位の特性を示す。表331に示されるように、この場合に定位する仮想音場は、距離感よりも方向感の精度に優れた仮想音場となる。
また、表332は、受聴者10の前方に設置される第1スピーカ群51から再生された第1音が、Δtだけ先に受聴者10へ到達した場合の音場定位の傾向を示す。表332に示されるように、この場合に定位する仮想音場は、方向感よりも距離感の精度に優れた仮想音場となる。
これは、第1スピーカ群51の再生音により定位する仮想音場と、第2スピーカ群52の再生音により定位する仮想音場とを比較すると、第1スピーカ群51の再生音は、仮想音場の距離感の定位により優れ、一方、第2スピーカ群52sの再生音は、仮想音場の方向感(第1スピーカ群51が受聴者10の前方にある場合には、特に後方の方向感)の定位により優れるためである。
よって、本実施の形態に係る音声信号再生装置100Aは、第1スピーカ群51と第2スピーカ群52とを併用することにより生じる聴感上の違和感を、先行音効果によって抑制することに加え、仮想音場の位置に応じて、距離感と方向のいずれの定位精度を優先するかを個別に選択することで、より自然で精度の高い仮想音場を定位させることができる。
例えば、図2を参照して、受聴者10の前方に定位させる仮想音源(11、12、15)の定位を第1スピーカ群51に任せ、受聴者10の後方に定位させる仮想音源(23、24)の定位を第2スピーカ群52に任せることで、距離と方向の定位を両立させることが可能となる。
よって、音声信号再生装置100Aが備える出力時間差制御部3は、第1音声信号に含まれるオーディオチャンネル信号のうち、受聴者10の前方に定位させる仮想音源に対応するオーディオチャンネル信号に含まれる音は、第2音声信号に含まれる同じ音よりも、Δtだけ早く受聴者10へ到達するように、音声信号の出力時間の差を制御することが好ましい。同様に、出力時間差制御部3は、第2音声信号に含まれるオーディオチャンネル信号のうち、受聴者10の後方に定位させる仮想音源に対応するオーディオチャンネル信号に含まれる音は、第1音声信号に含まれる同じ音よりも、Δtだけ早く受聴者10へ到達するように、音声信号の出力時間の差を制御することが望ましい。
言いかえると、第1仮想音像位置のうち、第1位置が受聴者の後方である場合、仮想音場生成部80Aは、第2音が、第1音よりも先に受聴位置に到達するよう第1再生信号および第2再生信号を生成してもよい。また、第1位置が、受聴者の前方である場合、仮想音場生成部80Aは、第1音が、第2音よりも先に受聴位置に到達するよう第1再生信号および第2再生信号を生成してもよい。
すなわち、出力時間差制御部3は、フロントスピーカ用信号と耳近傍スピーカ用信号の各信号を構成する複数のオーディオチャンネル信号の全てを対象として出力タイミングを制御してもよいし、あるオーディオチャンネル信号だけを対象として出力タイミングを制御してもよい。また、図6においては耳近傍スピーカ用信号には遅延を与えず、フロントスピーカ用信号に遅延を与えているが、フロントスピーカ用信号には遅延を与えず、耳近傍スピーカ用信号に遅延を与えてもよい。
図8は、以上のようにして、本実施の形態に係る音声信号再生装置100Aが備える出力時間差制御部3が出力時間差を制御した第1再生信号と第2再生信号とが、第1スピーカ群51と第2スピーカ群52とから出力されることによって生成された複数の仮想音像の一例を示す。
図8は、フロントLスピーカ6とフロントRスピーカ7とによって、仮想FLスピーカ30、仮想FRスピーカ31、仮想センターチャンネルスピーカ(仮想Cスピーカ)32、仮想SLスピーカ33、及び、仮想SRスピーカ34が生成され、耳近傍Lスピーカ8と耳近傍Rスピーカ9とによって、仮想FLスピーカ35、仮想FRスピーカ36、仮想Cスピーカ37、仮想SLスピーカ38、及び、仮想SRスピーカ39が生成される様子を表している。
なお、図8では5チャンネルのオーディオチャンネル信号を音声信号再生装置100Aによる処理の対象としているが、前述のとおり、ある特定のオーディオチャンネル信号だけを対象としてもよい。
なお、図2では、仮想音場生成部80Aは、フィルタ処理部70の前段に出力時間差制御部3を備えており、出力時間差制御部3によって出力時間に差がつけられた各オーディオチャンネル信号に対して、フィルタ処理部70が音場生成処理を施す構成になっている。しかし、音声信号再生装置100Aは、必ずしもフィルタ処理部70の前段に別個の処理部として出力時間差制御部3を備えなくてもよい。
図9は、本実施の形態に係る音声信号再生装置100Aの変形例を示すブロック図である。本変形例では、出力時間差制御部3はフィルタ処理部70の中に取り込まれている。
すなわち、本変形例における出力時間差制御部3は、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5と一体となったソフトウェアとして実装される。
具体的には、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5の各々は、各オーディオチャンネル信号に対して遅延処理を施すととともに、音場生成処理を施す。より具体的には、出力時間差制御部3は、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5の各々が有するフィルタ係数を表す行列に含まれる要素のうち、各オーディオチャンネル信号の位相に該当する要素にのみ、位相を遅らせる(又は、進ませる)ことで実装される。この場合、フィルタ処理部70内部の処理において、出力時間差制御部3の処理と、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5の処理とは、順不同で実行される。
すなわち、図9に示すように、出力時間差制御部3は、フィルタ処理部70の前段にあっても、フィルタ処理部70の構成の一部として実装されても、同様の効果を奏する。
なお、第1スピーカ群は、必ずしも受聴者10の前に設置されていなくてもよい。例えば、第1スピーカ群を受聴者10の後方に設置してもよい。この場合、出力時間差制御部3が、第2音声信号の再生音よりも早く第1音声信号の再生音が受聴者10に届くよう、出力時間の差を制御すると、より後方の距離感の定位精度が向上する。
以上述べたように、本実施の形態に係る音声信号再生装置100Aによると、音声信号再生装置は、取得した音声信号を、第1スピーカ群(例えばフロントスピーカ)で再生した場合と、第2スピーカ群(例えば耳近傍スピーカ)で再生した場合とでは、事前に定められた範囲内の微少時間だけずれて再生音が受聴者に到達するように制御する。これにより受聴者は、先行音効果が生じた2つの音を受聴することになる。結果、受聴者は、受聴するタイミングがずれているにもかかわらず、後に到達した音により定位する仮想の音場が、先に到達した音により定位した仮想の音場と一致するように聞こえる。さらに、受聴者は、後に到達した音よりも先に到達した音を強く意識する。よって、フロントスピーカと耳近傍スピーカとで生成する仮想の音場において生じる、音場の分離、偏り、またはぼやけによる聴感上の違和感を抑制するとともに、フロントスピーカから音を出力する際のメリットまたは、耳近傍スピーカから音を出力する際のメリットを活用できる。
(実施の形態2)
次に、受聴位置において、第1音と第2音との音圧値が異なるように、仮想音場生成部が第1再生信号及び第2再生信号を生成する実施例を、実施の形態2として詳細に説明する。
図10は、本実施の形態に係る音声信号再生装置100Bの構成を示すブロック図である。
本実施の形態に係る音声信号再生装置100Bは、受聴者10の周囲に配置される複数のスピーカであるフロントスピーカ(以下、第1スピーカ群ともいう)51と、第1スピーカ群51よりも受聴者に近い位置に配置される複数のスピーカである耳近傍スピーカ(以下、第2スピーカ群ともいう)52とに対して、音場生成処理が施された音声信号を出力する音声信号再生装置である。
図10に示されるように、音声信号再生装置100Bは、取得部1及び仮想音場生成部80Bを備える。
取得部1は、複数のオーディオチャンネル信号を含む音声信号を取得する。本実施の形態では、5ch(チャンネル)の音声信号(すなわち、5つのオーディオチャンネル信号を含む音声信号)を例に説明するが、オーディオチャンネル信号の数はこれに限られない。例えば、2ch、4ch、又は、7chなど、任意のオーディオチャンネル信号を含む音声信号を入力とすることができる。
また、取得部1は、取得した音声信号から、第1スピーカ群51で第1再生音として再生するための第1音声信号と、第2スピーカ群52で第2再生音として再生するための第2音声信号とを生成する。すなわち、第1音声信号及び第2音声信号は、それぞれ5chのオーディオチャンネル信号を含む音声信号である。
仮想音場生成部80Bは、第1再生音により、複数のオーディオチャンネル信号の各々に対応付けられた仮想音源である第3スピーカ群が事前に定められた位置に定位し、第2再生音により、第3スピーカ群とは異なる複数の仮想音源であって、複数のオーディオチャンネル信号の各々に対応付けられた仮想音源である第4スピーカ群が事前に定められた位置に定位するように、第1音声信号及び第2音声信号に音場生成処理を施す。
具体的には、仮想音場生成部80Bは、第3スピーカ群及び第4スピーカ群に含まれる各々の仮想音源の音圧値が、当該仮想音源に対応するオーディオチャンネル信号と、当該オーディオチャンネル信号に対応するゲインとを乗じて得られる音圧値となるように、音場生成処理を施す。より具体的には、仮想音場生成部80Bは、第1再生信号により示され、第1仮想音像位置のうち第1位置に定位する第1音と、第2再生信号により示され、第1位置と略同一位置に定位し、かつ、第1音と前記第2再生信号とに含まれる音であって、略同一の特徴を有する第2音とが、受聴位置において、音圧値が異なるように、第1再生信号および第2再生信号を生成する。詳細は後述する。
また、仮想音場生成部80Bは、音圧値調整部3と、フィルタ処理部70とを有する。
音圧値調整部3は、複数のオーディオチャンネル信号の各々に、対応するゲインを乗じることにより音圧値を調整する。
フィルタ処理部70は、第1再生音により第3スピーカ群が定位するように第1音声信号にフィルタ処理を施し、第2再生音により第4スピーカ群が定位するように第2音声信号にフィルタ処理を施す。ここで、第3スピーカ群と第4スピーカ群とは同じ位置に定位する。具体的には、フィルタ処理部70は、第1音声信号及び第2音声信号を構成する複数のオーディオチャンネル信号の各々に対して、周波数振幅応答及び位相応答を変更する。フィルタ処理部70の具体的な処理内容は、前述した関連技術に係る頭部伝達関数により決定されるため、詳細は省略する。
フィルタ処理部70は、耳近傍スピーカ用フィルタ4と、フロントスピーカ用フィルタ5とを有する。
フロントスピーカ用フィルタ5は、第1再生音により第3スピーカ群(後述する、仮想音源11〜仮想音源15)が事前に定められた位置に定位するように、第1音声信号にフィルタ処理を施す。
耳近傍スピーカ用フィルタ4は、第2再生音により第4スピーカ群(後述する、仮想音源21〜仮想音源25)が事前に定められた位置に定位するように、第2音声信号にフィルタ処理を施す。
なお、図示の都合上、図10において第3スピーカ群と第4スピーカ群の位置はずれているが、実際は、それぞれオーディオチャンネル信号に対応する同じ位置に定位してもよいし、異なる位置に定位してもよい。以降の説明では、同じ位置に定位する場合について述べる。
図10に示される様に構成された音声信号再生装置100Bを介して、フロントLスピーカ6及びフロントRスピーカ7を含む第1スピーカ群と、耳近傍Lスピーカ8及び耳近傍Rスピーカ9を含む第2スピーカ群とからそれぞれ再生される音を聴くことにより、受聴者10には、実在しない仮想音源である、仮想FLスピーカ11及び21、仮想FRスピーカ12及び22、仮想SLスピーカ13及び23、仮想SRスピーカ14及び24、並びに仮想Cスピーカ15及び25の位置から再生音が聞こえる。
しかし、前述のように、第1スピーカ群による第1再生音、及び、第2スピーカ群による第2再生音の各々を用いて各仮想音源を定位させる場合、同一の仮想音源を定位させるための同一の音が、同じゲインで再生されると、受聴者は聴感上の違和感を生じる。すなわち、複数の仮想音源全体としてゲインバランスが適切でないために、仮想音源により形成される音場に偏りが発生して不自然な音場になり、また、一方のスピーカで定位する仮想音場が支配的となることで音場の分離が発生してしまう。
そこで、本実施の形態に係る音声信号再生装置100Bは、仮想音場生成部80Bにおいて、仮想音場に対応するオーディオチャンネル信号ごとにゲインを設定することにより、上記課題を解決する。
次に、以上のように構成された本実施の形態に係る音声信号再生装置100Bの音像定位処理について、より詳細に説明する。
図11は、本実施の形態に係る音声信号再生装置100Bの動作の一例を示すフローチャートである。
まず、取得部1は、複数のオーディオチャンネル信号を含む音声信号を取得する(S21)。
次に、取得部1は、取得した複数のオーディオチャンネル信号を含む音声信号をフロントスピーカ51と耳近傍スピーカ52とでそれぞれ個別に処理して再生するために、同一音声信号からなる2系統の音声信号(すなわち、第1音声信号と第2音声信号と)を生成する(S22)。
なお、必ずしも同一音声信号からなる2系統の音声信号を生成する必要はなく、例えば受聴者とフロントスピーカ51との距離、及び受聴者と耳近傍スピーカ52との距離などを考慮して、生成する際の信号値のゲインを変更しても良いし、フロントスピーカ51と耳近傍スピーカ52の能率を考慮して、生成する際の信号値のゲインを変更しても良いし、複数のオーディオチャンネル信号の各信号値のゲインを個別に変更しても良い。ここで、信号値とは、オーディオチャンネル信号毎に信号内で指定されている音圧の大きさを示す値である音圧値を意味する。
例えば、受聴者10とスピーカとの距離が遠いほど、より大きな信号値となるようにゲインを変更してもよい。また、スピーカの能率が悪いほど、より大きな信号値となるようにゲインを変更してもよい。
本実施例においては、以降、簡単のために、受聴者10の位置でフロントスピーカ51の出力と耳近傍スピーカ52の出力とが聴感上等しくなるような信号値で同一音声信号を2系統の音声信号を生成した場合について述べる。
次に、フロントスピーカ51と耳近傍スピーカ52とで再生する各オーディオチャンネル信号の音圧値を調整する(S23)。具体的な調整方法について、図12を用いて説明する。
図12は、あらかじめフロントスピーカ用及び耳近傍スピーカ用に決定され、本実施の形態に係る音圧値調整部3が記憶している、各オーディオチャンネル信号のゲインを表している。より詳細には、フロントスピーカ51へ出力される5chの音声信号(FL信号、FR信号、C信号、SL信号、及びSR信号)のゲインと、耳近傍スピーカ52へ出力される5chの音声信号(FL信号、FR信号、C信号、SL信号、及びSR信号)のゲインとを示す。
前述のとおり、ゲインとは、音圧値調整部3が取得した第1音声信号及び第2音声信号の各々に含まれている音圧値(以後、この音圧値を既定音圧値ともいう)からの増減度合いを示す。ここで、ゲインが1の場合、音圧値調整部3は、対応するオーディオチャンネル信号の音圧値をそのまま(すなわち、取得部1が取得した音声信号に含まれている音圧値のまま)出力する。また、ゲインが0の場合、音圧値調整部3は、対応するオーディオチャンネル信号を出力しない。また、ゲインが1を超える場合、音圧値調整部3は、対応するオーディオチャンネル信号の音圧値を、元々含まれている音圧値よりも大きくなるように調整して出力する。逆に、ゲインが0を超えて1未満の場合、音圧値調整部3は、対応するオーディオチャンネル信号の音圧値を、元々含まれている音圧値よりも小さくなるように調整して出力する。
なお、ゲインが2である場合であっても、音圧値調整部3は必ずしも音圧値を2倍に調整しなくてもよい。例えば、任意の実数をR、ゲインの値をGとした場合、音圧値調整部3は、音圧値をG×R倍にしてもよい。また、ゲインが2のときは、音圧値を既定音圧値のa倍に、ゲインが3のときは、音圧値を既定音圧値のb倍にしてもよい。ここで、a<bとする。
すなわち、音圧値調整部3が記憶するゲインの値は、順序尺度、間隔尺度、比例尺度のうちのいずれであってもよい。
図12の各列に対応するケース(1)〜(6)は、それぞれのゲインで各オーディオチャンネル信号の音圧値を調整し、各スピーカで再生するケースをそれぞれ表している。なお、ケース(7)は、本実施の形態における音圧値調整部3によっては設定されないゲインの組合せを示す。
以下、各ケースについて説明する。
ケース(1)の場合、第1音声信号に含まれるフロントスピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、及びC信号はゲインが1のため既定音圧値で再生され、SL信号、及びSR信号はゲインが0のために再生されず、無音となる。
同様に、第2音声信号に含まれる耳近傍スピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、及びC信号はゲインが0のために再生されず無音であり、SL信号、及びSR信号はゲインが1のため既定音圧値で再生される。つまり、フロントスピーカ用信号として、FL信号、FR信号、及びC信号がゲイン1で出力され、耳近傍スピーカ用信号として、SL信号、及びSR信号がゲイン1で出力されることとなる。
従って、フロントスピーカ用信号のFL信号、FR信号、及びC信号と、耳近傍スピーカ用信号のSL信号、及びSR信号とは共にゲインが1で等しいため、ゲインの大きさが等しい信号値として出力される。このように信号値を調整されたフロントスピーカ用信号がフロントスピーカ用フィルタ5へ出力され、信号値を調整された耳近傍スピーカ用信号が耳近傍スピーカ用フィルタ4へ出力されることにより(S24)生成される音場を図13に表す。
図13において、フロントLスピーカ6とフロントRスピーカ7とから再生される第1再生音により、仮想FLスピーカ30と仮想FRスピーカ31と仮想Cスピーカ32とが定位する。また、耳近傍Lスピーカ8と耳近傍Rスピーカ9とから再生される第2再生音により、仮想SLスピーカ33と仮想SRスピーカ34とが定位する。
このような音場を生成している現実のスピーカはフロントLスピーカ6、フロントRスピーカ7、耳近傍Lスピーカ8、及び耳近傍Rスピーカ9であるが、受聴者10は、(1)フロントLスピーカ6、及びフロントRスピーカ7により定位する、仮想FLスピーカ30、仮想FRスピーカ31、及び仮想Cスピーカ32の位置と、(2)耳近傍Lスピーカ8、及び耳近傍Rスピーカ9により定位する、仮想SLスピーカ33、及び仮想SRスピーカ34の位置とに、仮想音源をそれぞれ等しい信号値で知覚する。
次に、ケース(2)の場合、フロントスピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、C信号、SL信号、及びSR信号のゲインには全て1が指定されている。同様に、耳近傍スピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、及びC信号のゲインには1が指定され、SL信号、及びSR信号のゲインには2が指定されている。つまり、フロントスピーカ用信号として、FL信号、FR信号、C信号、SL信号、及びSR信号がゲイン1で出力される。また、耳近傍スピーカ用信号として、FL信号、FR信号、及びC信号がゲイン1で出力され、SL信号、及びSR信号がゲイン2で出力される。
このように信号値を調整されたフロントスピーカ用信号がフロントスピーカ用フィルタ5へ出力され、信号値を調整された耳近傍スピーカ用信号が耳近傍スピーカ用フィルタ4へ出力されることにより(S24)生成される音場を図14に表す。
図14において、フロントLスピーカ6とフロントRスピーカ7とから再生される第1再生音により、仮想FLスピーカ40と仮想FRスピーカ41と仮想Cスピーカ42と仮想SLスピーカ43と仮想SRスピーカ44とが定位する。また、耳近傍Lスピーカ8と耳近傍Rスピーカ9とから再生される第2再生音により、仮想FLスピーカ45と仮想FRスピーカ46と仮想Cスピーカ47と仮想SLスピーカ48と仮想SRスピーカ49とが定位する。
このような音場を生成している現実のスピーカはフロントLスピーカ6、フロントRスピーカ7、耳近傍Lスピーカ8、及び耳近傍Rスピーカ9であるが、受聴者10は、(1)フロントLスピーカ6、及びフロントRスピーカ7により定位する、仮想FLスピーカ40、仮想FRスピーカ41、仮想Cスピーカ42、仮想SLスピーカ43、及び仮想SRスピーカ44の位置と、(2)耳近傍Lスピーカ8、及び耳近傍Rスピーカ9により定位する、仮想FLスピーカ45、仮想FRスピーカ46、仮想Cスピーカ47、仮想SLスピーカ48、及び仮想SRスピーカ49の位置とに、仮想音源をそれぞれ知覚する。
ここで、耳近傍Lスピーカ8と耳近傍Rスピーカ9とにより仮想SLスピーカ48と仮想SRスピーカ49とを定位させるために用いる信号値のゲインが「2」であるために、特に耳近傍スピーカ52による後方の仮想音源の知覚を強調することができる。
次に、ケース(3)の場合、フロントスピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、及びC信号のゲインには「2」が指定されている。また、SL信号、及びSR信号のゲインには「1」が指定されている。同様に、耳近傍スピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、及びC信号のゲインには「1」が指定されている。また、SL信号、及びSR信号のゲインには「2」が指定されている。
つまり、フロントスピーカ用信号として、FL信号、FR信号、及びC信号がゲイン「2」で出力され、SL信号、及びSR信号がゲイン「1」で出力される。また、耳近傍スピーカ用信号として、FL信号、FR信号、及びC信号がゲイン「1」で出力され、SL信号、及びSR信号がゲイン「2」で出力される。
このように信号値を調整されたフロントスピーカ用信号が、フロントスピーカ用フィルタ5へ出力され、信号値を調整された耳近傍スピーカ用信号が耳近傍スピーカ用フィルタ4へ出力されることにより(S24)生成される音場を図15に表す。
図15において、フロントLスピーカ6とフロントRスピーカ7とから再生される第1再生音により、仮想FLスピーカ50と仮想FRスピーカ51と仮想Cスピーカ52と仮想SLスピーカ53と仮想SRスピーカ54とが定位する。また、耳近傍Lスピーカ8と耳近傍Rスピーカ9とから再生される第2再生音により、仮想FLスピーカ55と仮想FRスピーカ56と仮想Cスピーカ57と仮想SLスピーカ58と仮想SRスピーカ59とが定位する。
このような音場を生成している現実のスピーカはフロントLスピーカ6、フロントRスピーカ7、耳近傍Lスピーカ8、及び耳近傍Rスピーカ9であるが、受聴者10は、(1)フロントLスピーカ6、及びフロントRスピーカ7により定位する、仮想FLスピーカ50、仮想FRスピーカ51、仮想Cスピーカ52、仮想SLスピーカ53、及び仮想SRスピーカ54の位置と、(2)耳近傍Lスピーカ8、及び耳近傍Rスピーカ9により定位する、仮想FLスピーカ55、仮想FRスピーカ56、仮想Cスピーカ57、仮想SLスピーカ58、及び仮想SRスピーカ59の位置とに、仮想音源をそれぞれ知覚する。
ここで、フロントLスピーカとフロントRスピーカとにより仮想FLスピーカ50と仮想FRスピーカ51とを定位させるために用いる信号値のゲインと、耳近傍Lスピーカ8と耳近傍Rスピーカ9とにより仮想SLスピーカ58と仮想SRスピーカ59とを定位させるために用いる信号値のゲインがともに「2」である。よって、特にフロントスピーカ51により定位する、受聴者10より前方の仮想音源と、耳近傍スピーカ52により定位する、受聴者10より後方の仮想音源の知覚を強調することができる。
次に、ケース(4)の場合、フロントスピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、及びC信号のゲインには「2」が指定され、SL信号、及びSR信号のゲインには「1」が指定されている。同様に、耳近傍スピーカ用の各オーディオチャンネル信号において、FL信号、FR信号、C信号、SL信号、及びSR信号のゲインには「1」が指定されている。つまり、フロントスピーカ用信号として、FL信号、FR信号、及びC信号がゲイン「2」で出力され、SL信号、及びSR信号がゲイン「1」で出力される。また、耳近傍スピーカ用信号として、FL信号、FR信号、C信号、SL信号、及びSR信号がゲイン「1」で出力される。
このように信号値を調整されたフロントスピーカ用信号が、フロントスピーカ用フィルタ5へ出力され、信号値を調整された耳近傍スピーカ用信号が、耳近傍スピーカ用フィルタ4へ出力されることにより(S24)生成される音場を図16に表す。
図16において、フロントLスピーカ6とフロントRスピーカ7とから再生される第1再生音により、仮想FLスピーカ60と仮想FRスピーカ61と仮想Cスピーカ62と仮想SLスピーカ63と仮想SRスピーカ64とが定位する。また、耳近傍Lスピーカ8と耳近傍Rスピーカ9とから再生される第2再生音により、仮想FLスピーカ65と仮想FRスピーカ66と仮想Cスピーカ67と仮想SLスピーカ68と仮想SRスピーカ69とが定位する。
このような音場を生成している現実のスピーカはフロントLスピーカ6、フロントRスピーカ7、耳近傍Lスピーカ8、及び耳近傍Rスピーカ9であるが、受聴者10は、(1)フロントLスピーカ6、及びフロントRスピーカ7により定位する、仮想FLスピーカ60、仮想FRスピーカ61、仮想Cスピーカ62、仮想SLスピーカ63、及び仮想SRスピーカ64の位置と、(2)耳近傍Lスピーカ8、及び耳近傍Rスピーカ9により定位する、仮想FLスピーカ65、仮想FRスピーカ66、仮想Cスピーカ67、仮想SLスピーカ68、及び仮想SRスピーカ69の位置とに、仮想音源をそれぞれ知覚する。
ここで、フロントLスピーカとフロントRスピーカにより仮想FLスピーカ60と仮想FRスピーカ61とを定位させるために用いる信号値のゲインが「2」であるために、特にフロントスピーカ51による前方の仮想音源の知覚を強調することができる。
なお、図13〜図16にそれぞれ示した、ケース(1)〜(6)は本実施の形態に係る音声信号再生装置100Bにおけるゲインの一例を示しており、各スピーカ用のオーディオチャンネル信号の信号値に対するゲインは、これに限られない。
すなわち、本実施の形態に係る仮想音場生成部80Bは、(1)第3スピーカ群に含まれる少なくとも1つの仮想音源である第1仮想音源に対応するオーディオチャンネル信号のゲインと、(2)第4スピーカ群に含まれる少なくとも1つの仮想音源であって、第1仮想音源と同じ位置に定位する仮想音源に対応するオーディオチャンネル信号のゲインとが異なるように、第1音声信号及び第2音声信号に音場生成処理を施してもよい。
また、本実施の形態に係る仮想音場生成部80Bは、第3スピーカ群及び第4スピーカ群のうちの少なくとも一方のスピーカ群に含まれる、少なくとも1つの仮想音源に対応するオーディオチャンネル信号のゲインと、当該スピーカ群に含まれる他の仮想音源に対応するオーディオチャンネル信号のゲインとが異なるように、音場生成処理を施してもよい。
次に、本実施の形態に係る仮想音場生成部80Bが用いるゲインの限界事例を、図12に示されるケース(5)及び(6)を参照して説明する。
図12のケース(5)において、フロントスピーカ用の音声信号に含まれる全てのオーディオチャンネル信号には、ゲイン「1」が指定されている。また、耳近傍スピーカ用の音声信号に含まれる全てのオーディオチャンネル信号には、ゲイン「2」が指定されている。すなわち、第1音声信号内の全てのオーディオチャンネル信号のゲインは等しく、第2音声信号内の全てのオーディオチャンネル信号のゲインも等しいが、第1音声信号と第2音声信号とで、対応するオーディオチャンネル信号のゲインが異なるように、本実施の形態に係る仮想音場生成部80Bは音場生成処理を施してもよい。
また、図12のケース(6)において、フロントスピーカ用の音声信号に含まれるオーディオチャンネル信号のゲインは、C信号にはゲイン2が指定され、その他の信号にはゲイン1が指定されている。また、耳近傍スピーカ用の音声信号に含まれるオーディオチャンネル信号のゲインも、C信号にはゲイン2が指定され、その他の信号にはゲイン1が指定されている。すなわち、第1音声信号と第2音声信号とで、対応するオーディオチャンネル信号のゲインは等しいが、第1音声信号内に含まれる全てのオーディオチャンネル信号のゲインは同一ではなく、第2音声信号内に含まれる全てのオーディオチャンネル信号のゲインも同一とはならないように、本実施の形態に係る仮想音場生成部80Bは音場生成処理を施してもよい。
なお、図12のケース(7)は、関連技術に係る音声信号再生装置が使用するゲインを示す。すなわち、関連技術に係る音声信号再生装置は音圧値調整部3を備えておらず、オーディオチャンネル信号ごとにゲインを設定しないで出力する。
なお、図12に示されるケース(1)〜(7)のうち、ケース(3)が最も好ましい。
すなわち、仮想音場生成部80Bは、第3スピーカ群に含まれる複数の仮想音源のうち、受聴者10の前方に定位する仮想音源に対応するオーディオチャンネル信号のゲインが、受聴者10の後方に定位する仮想音源に対応するオーディオチャンネル信号のゲインよりも大きくなるように、前記第1音声信号へ前記音場生成処理を施すことが好ましい。言いかえると、仮想音場生成部80Bは、第1仮想音像位置に定位する音のうち、受聴者の前方に定位する音の音圧値が、受聴者の後方に定位する音の音圧値よりも大きくなるように、第1再生信号を生成することが好ましい。
受聴者10の前方に定位する仮想音源は、受聴者10の前方に設置されたスピーカである第1スピーカ群51の第1再生音で定位させる方が、より正確な音場を定位させることができるためである。
また、仮想音場生成部80Bは、第4スピーカ群に含まれる複数の仮想音源のうち、受聴者10の後方に定位する仮想音源に対応するオーディオチャンネル信号のゲインが、受聴者10の前方に定位する仮想音源に対応するオーディオチャンネル信号のゲインよりも大きくなるように、第2音声信号へ前記音場生成処理を施すことが好ましい。言いかえると、仮想音場生成部80Bは、第2仮想音像位置に定位する音のうち、受聴者の後方に定位する音の音圧値が、受聴者の前方に定位する音の音圧値よりも大きくなるように、第2再生信号を生成することが好ましい。
受聴者10の後方に定位する仮想音源は、受聴者10の耳近傍に設置されたスピーカである第2スピーカ群52の第2再生音で定位させる方が、より正確な音場を定位させることができるためである。
以上述べたように、本実施の形態において仮想音場生成部80Bは、定位する仮想音源に対応するオーディオチャンネル信号ごとにゲインを変更し、仮想音場を生成することができる。すなわち、仮想音源ごとに、仮想音源から再生される音の音圧値を変更し、仮想音場全体としてのゲインバランスを調整することが可能となる。その結果、第1スピーカ群と第2スピーカ群で生成される仮想音像による音場の偏りや分離を抑えることができる。
また、例えば図12のケース(1)又はケース(2)に示されるゲインによれば、音声信号再生装置100Bは、特に受聴者10の後方に定位させるべき仮想音源を第2スピーカ群52で定位させることができる。これにより、音声信号再生装置100Bは、後方の仮想音源の定位精度が弱いフロントスピーカだけを用いるフロントバーチャルサラウンドシステムと比較して、後方の仮想音像の定位精度を向上させることができる。
また、例えば図12のケース(3)に示されるゲインによれば、音声信号再生装置100Bは、受聴者10の前方に定位する仮想音源を受聴者10の前方に設置されたスピーカである第1スピーカ群51で定位させ、受聴者10の後方に定位する仮想音源を受聴者10の耳近傍に設置されたスピーカである第2スピーカ群52で定位させることにより、より正確な音場を定位させることができる。
なお、音圧値調整部3は、別途備えたユーザインタフェース(図示なし)を通じて取得した受聴者10からの指示により、使用するゲインを決定してもよい。例えば、図12に示されるケース(1)〜(6)のうち、どのケースを使用するかを、受聴者10からの指示により決定してもよい。また、受聴者10が、各オーディオチャンネル信号のゲインを、ユーザインタフェース(図示なし)により入力し、これを新たなケースとして、音圧値調整部3へ記憶させてもよい。
なお、図12に示されるような、各オーディオチャンネル信号に対応付けられたゲインの値は、音圧値調整部3が必ずしも記憶している必要はなく、例えば、ゲインが記憶されている外部記憶媒体から音圧値調整部3が取得してもよい。
なお、本実施の形態に係る音圧値調整部3は、複数の増幅器(いわゆるアンプ)を用いて実装することができる。
図17は、本実施の形態に係る音圧値調整部3のより詳細な構成の一例を示すブロック図である。同図に示すように、各スピーカ用のオーディオチャンネル信号のゲインに応じて信号値を可変制御できる機能を有する音圧値調整部3は、各スピーカ用のオーディオチャンネル信号のゲインに応じて信号値を可変制御できる増幅器421および増幅器422で構成されるとしてもよい。ここで増幅器421及び増幅器422は、具体的には、入力信号の電圧、電流、又は電力のいずれかを増幅させて出力する電子回路である。
なお、図17では、仮想音場生成部80Bは、フィルタ処理部70の前段に音圧値調整部3を備えており、音圧値調整部3により音圧値の調整がなされた第1音声信号及び第2音声信号の各々に対して、フィルタ処理部70が音場生成処理を施す構成になっている。しかし、音声信号再生装置100Bは、必ずしもフィルタ処理部70の前段に別個の処理部として音圧値調整部3を備えなくてもよい。
図18は、本実施の形態の変形例に係る音声信号再生装置のより詳細な構成を示すブロック図である。同図に示すように、取得部1は、複数のオーディオチャンネル信号によって構成される音声信号から、耳近傍スピーカ用信号とフロントスピーカ用信号との2系統の音声信号を生成し、フィルタ処理部70に出力する。
本変形例では、音圧値調整部3はフィルタ処理部70の中に取り込まれている。
すなわち、本変形例における音圧値調整部3は、電子回路ではなく、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5と同様に、ソフトウェアとして実装される。
具体的には、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5の各々が有する各オーディオチャンネル信号に対応するフィルタ係数そのもののゲインを、音圧値調整部3が記憶しているゲインにあわせて調整する。より具体的には、音圧値調整部3は、耳近傍スピーカ用フィルタ4及びフロントスピーカ用フィルタ5の各々が有するフィルタ係数を表す行列に含まれる要素のうち、各オーディオチャンネル信号の音圧値に該当する要素にのみ、対応するゲインの値を乗算する等の計算処理を行えばよい。
図17及び図18に示したように、音圧値調整部3は、フィルタ処理部70の前段にあっても、フィルタ処理部70の構成の一部として実装されても、同様の効果を奏する。
以上説明したように、本実施の形態に係る音声信号再生装置100Bによれば、フロントスピーカ51及び耳近傍スピーカ52の出力音圧レベルを所望の音場に応じて各々適切に制御する事により、それぞれのスピーカから生成される仮想音源の定位精度を制御することができる。その結果、音場の分離や偏りなどの聴感上の違和感を抑えるとともに、所望の方位の定位精度を強調し、例えば仮想音源による後方定位を強調した音場を生成する事ができる。その結果、音像をより正確に定位させることができる。
なお、上記実施の形態1及び実施の形態2を組み合わせてもよい。例えば、仮想音場生成部は、第1再生信号により示され、第1仮想音像位置のうち第1位置に定位する第1音と、第2再生信号により示され、第1位置と略同一位置に定位し、かつ、第1音と略同一の第2音とが、受聴位置において、位相及び音圧値の少なくとも一方が異なるように、第1再生信号および第2再生信号を生成してもよい。音圧値よりも位相を制御する方が、音像位置の定位をより正確にすることができるが、コストがより高くなる。したがって、音像の精度とコストとを考慮し、音声信号再生装置のより適切な構成を決定してもよい。
なお、ブロック図(図1、9,10、17、18)に示される各機能ブロックは典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
例えばメモリ以外の機能ブロックが1チップ化されていても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
以上、図面を参照してこの発明の実施の形態を説明したが、この発明は、図示した実施の形態のものに限定されない。図示した実施の形態に対して、この発明と同一の範囲において、あるいは均等の範囲内において、種々の修正や変形を加えることが可能である。
なお、本実施形態で説明した音声信号再生装置は、コンピュータにより実現することも可能である。図19は、音声信号再生装置を実現するコンピュータシステムのハードウェア構成を示すブロック図である。
音声信号再生装置は、コンピュータ734と、コンピュータ734に指示を与えるためのキーボード736及びマウス738と、コンピュータ734の演算結果等の情報を提示するためのディスプレイ732と、コンピュータ734で実行されるプログラムを読み取るためのCD−ROM(Compact Disc−Read Only Memory)装置740及び通信モデム752とを含む。
音声信号再生装置が行う処理であるプログラムは、コンピュータで読取可能な媒体であるCD−ROM742に記憶され、CD−ROM装置740で読み取られる。又は、コンピュータネットワークを通じて通信モデム752で読み取られる。
コンピュータ734は、CPU(Central Processing Unit)744と、ROM(Read Only Memory)746と、RAM(Random Access Memory)748と、ハードディスク750と、通信モデム752と、バス754とを含む。
CPU744は、CD−ROM装置740又は通信モデム752を介して読み取られたプログラムを実行する。ROM746は、コンピュータ734の動作に必要なプログラムやデータを記憶する。RAM748は、プログラム実行時のパラメタなどのデータを記憶する。ハードディスク750は、プログラムやデータなどを記憶する。通信モデム752は、コンピュータネットワークを介して他のコンピュータとの通信を行う。バス754は、CPU744、ROM746、RAM748、ハードディスク750、通信モデム752、ディスプレイ732、キーボード736、マウス738及びCD−ROM装置740を相互に接続する。
さらにまた、上記の各装置を構成する構成要素の一部又は全部は、各装置に脱着可能なICカード又は単体のモジュールから構成されているとしてもよい。ICカード又はモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカード又はモジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、ICカード又はモジュールは、その機能を達成する。このICカード又はこのモジュールは、耐タンパ性を有するとしてもよい。
また、本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
さらに、本発明は、上記コンピュータプログラム又は上記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc(登録商標))、USBメモリ、SDカードなどのメモリカード、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている上記デジタル信号であるとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、上記メモリは、上記コンピュータプログラムを記憶しており、上記マイクロプロセッサは、上記コンピュータプログラムに従って動作するとしてもよい。
また、上記プログラム又は上記デジタル信号を上記記録媒体に記録して移送することにより、又は上記プログラム又は上記デジタル信号を、上記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
本発明は、音楽信号が再生可能で2組以上の対となるスピーカを駆動する装置を備えた機器に適用でき、特にサラウンドシステム、TV、AVアンプ、コンポ、携帯電話機、ポータブルオーディオ機器等に適用できる。
1 取得部
3a 出力時間差制御部
音圧値調整部
4 耳近傍スピーカ用フィルタ
5 フロントスピーカ用フィルタ
6 フロントLスピーカ
7 フロントRスピーカ
8 耳近傍Lスピーカ
9 耳近傍Rスピーカ
10 受聴者
11、21、30、35、40、45、50、55、60、65 仮想FLスピーカ(仮想音源)
12、22、31、36、41、46、51、56、61、66 仮想FRスピーカ(仮想音源)
13、23、33、38、43、48、53、58、63、68 仮想SLスピーカ(仮想音源)
14、24、34、39、44、49、54、59、64、69 仮想SRスピーカ(仮想音源)
15、25、32、37、42、47、52、57、62、67 仮想Cスピーカ(仮想音源)
51 第1スピーカ群(フロントスピーカ)
52 第2スピーカ群(耳近傍スピーカ)
70 フィルタ処理部
80、80A、80B 仮想音場生成部
100、100A、100B 音声信号再生装置
421、422 増幅器
510、512 波形
732 ディスプレイ
734 コンピュータ
736 キーボード
738 マウス
740 CD−ROM装置
742 CD−ROM
744 CPU
746 ROM
748 RAM
750 ハードディスク
752 通信モデム
754 バス

Claims (11)

  1. 受聴者の周囲に配置される複数のスピーカである第1スピーカ群と、当該第1スピーカ群よりも前記受聴者に近い位置に配置される複数のスピーカである第2スピーカ群とのそれぞれに対して、複数のオーディオチャンネル毎に定位すべき仮想音像位置を示す位置情報が含まれる音声信号を再生する音声信号再生装置であって、
    前記音声信号を取得する取得部と、
    前記音声信号に対して信号処理を行い、第1仮想音像位置に音が定位する前記第1スピーカ群用の第1再生信号、及び前記第1仮想音像位置と略同一の第2仮想音像位置に音が定位する前記第2スピーカ群用の第2再生信号を生成する仮想音場生成部とを備え、
    前記仮想音場生成部は、前記第1再生信号により示され、前記第1仮想音像位置のうち第1位置に定位する第1音と、前記第2再生信号により示され、前記第1位置と略同一位置に定位し、かつ、前記第1音と略同一の第2音とが、受聴位置において、位相及び音圧値の少なくとも一方が異なるように、前記第1再生信号および前記第2再生信号を生成する
    音声信号再生装置。
  2. 前記仮想音場生成部は、前記略同一の特徴を有する2つの音の受聴時刻が所定の範囲内の時間だけ異なるように、前記第1再生信号を前記第1スピーカ群から出力する出力時刻および前記第2再生信号を前記第2スピーカ群から出力する出力時刻を調整する
    請求項1に記載の音声信号再生装置。
  3. 前記仮想音場生成部は、前記第1音が、前記第2音よりも前記所定の範囲の時間だけ先に前記受聴位置に到達するよう、前記第1再生信号および前記第2再生信号を生成する
    請求項に記載の音声信号再生装置。
  4. 前記仮想音場生成部は、前記第2音が、前記第1音よりも前記所定の範囲の時間だけ先に前記受聴位置に到達するよう、前記第1再生信号および前記第2再生信号を生成する
    請求項に記載の音声信号再生装置。
  5. 前記第1位置が、前記受聴者の後方である場合、
    前記仮想音場生成部は、前記第2音が、前記第1音よりも先に前記受聴位置に到達するよう前記第1再生信号および前記第2再生信号を生成する
    請求項1に記載の音声信号再生装置。
  6. 前記第1位置が、前記受聴者の前方である場合、
    前記仮想音場生成部は、前記第1音が、前記第2音よりも先に前記受聴位置に到達するよう前記第1再生信号および前記第2再生信号を生成する
    請求項1または請求項5に記載の音声信号再生装置。
  7. 前記所定の範囲は、0ミリ秒を超え、かつ、20ミリ秒未満である
    請求項2から請求項4のいずれか1項に記載の音声信号再生装置。
  8. 前記仮想音場生成部は、さらに、前記複数のオーディオチャンネルの各々に、対応するゲインを乗じることにより前記音圧値を調整する音圧値調整部を有する
    請求項1に記載の音声信号再生装置。
  9. 前記仮想音場生成部は、前記第1仮想音像位置に定位する音のうち、前記受聴者の前方に定位する音の音圧値が、前記受聴者の後方に定位する音の音圧値よりも大きくなるように、前記第1再生信号を生成する
    請求項1又は請求項8に記載の音声信号再生装置。
  10. 前記仮想音場生成部は、前記第2仮想音像位置に定位する音のうち、前記受聴者の後方に定位する音の音圧値が、前記受聴者の前方に定位する音の音圧値よりも大きくなるように、前記第2再生信号を生成する
    請求項1又は請求項8に記載の音声信号再生装置。
  11. 受聴者の周囲に配置される複数のスピーカである第1スピーカ群と、当該第1スピーカ群よりも前記受聴者に近い位置に配置される複数のスピーカである第2スピーカ群とのそれぞれに対して、複数のオーディオチャンネル毎に定位すべき仮想音像位置を示す位置情報が含まれる音声信号を出力する音声信号再生方法であって、
    前記音声信号を取得する取得ステップと、
    前記音声信号に対して信号処理を行い、第1仮想音像位置に音が定位する前記第1スピーカ群用の第1再生信号、及び前記第1仮想音像位置と略同一の第2仮想音像位置に音が定位する前記第2スピーカ群用の第2再生信号を生成する仮想音場生成ステップとを含み、
    前記仮想音場生成ステップにおいては、前記第1再生信号により示され、前記第1仮想音像位置のうち第1位置に定位する第1音と、前記第2再生信号により示され、前記第1位置と略同一位置に定位し、かつ、前記第1音と略同一の第2音とが、受聴位置において、位相及び音圧値の少なくとも一方が異なるように、前記第1再生信号および前記第2再生信号を生成する
    音声信号再生方法。
JP2012528581A 2011-04-22 2012-04-20 音声信号再生装置、音声信号再生方法 Active JP5118267B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012528581A JP5118267B2 (ja) 2011-04-22 2012-04-20 音声信号再生装置、音声信号再生方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2011096505 2011-04-22
JP2011096505 2011-04-22
JP2011109808 2011-05-16
JP2011109808 2011-05-16
JP2012528581A JP5118267B2 (ja) 2011-04-22 2012-04-20 音声信号再生装置、音声信号再生方法
PCT/JP2012/002740 WO2012144227A1 (ja) 2011-04-22 2012-04-20 音声信号再生装置、音声信号再生方法

Publications (2)

Publication Number Publication Date
JP5118267B2 true JP5118267B2 (ja) 2013-01-16
JPWO2012144227A1 JPWO2012144227A1 (ja) 2014-07-28

Family

ID=47041356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012528581A Active JP5118267B2 (ja) 2011-04-22 2012-04-20 音声信号再生装置、音声信号再生方法

Country Status (3)

Country Link
US (1) US9538307B2 (ja)
JP (1) JP5118267B2 (ja)
WO (1) WO2012144227A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2991383B1 (en) 2013-04-26 2021-01-27 Sony Corporation Audio processing device and audio processing system
WO2014203496A1 (ja) * 2013-06-20 2014-12-24 パナソニックIpマネジメント株式会社 音声信号処理装置、および音声信号処理方法
US20170257721A1 (en) * 2014-09-12 2017-09-07 Sony Semiconductor Solutions Corporation Audio processing device and method
EP3024253A1 (en) * 2014-11-21 2016-05-25 Harman Becker Automotive Systems GmbH Audio system and method
KR102601478B1 (ko) * 2016-02-01 2023-11-14 삼성전자주식회사 콘텐트를 제공하는 전자 장치 및 그 제어 방법
US9591427B1 (en) * 2016-02-20 2017-03-07 Philip Scott Lyren Capturing audio impulse responses of a person with a smartphone
WO2019241760A1 (en) 2018-06-14 2019-12-19 Magic Leap, Inc. Methods and systems for audio signal filtering
EP3955590A4 (en) * 2019-04-11 2022-06-08 Sony Group Corporation INFORMATION PROCESSING DEVICE AND METHOD, REPRODUCTION DEVICE AND METHOD, AND PROGRAM
CN114390402B (zh) * 2022-01-04 2024-04-26 杭州老板电器股份有限公司 一种吸油烟机的音频注入控制方法、装置及吸油烟机

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187300A (ja) * 2002-12-03 2004-07-02 Bose Corp 指向性電気音響変換
JP2008270857A (ja) * 2007-04-16 2008-11-06 Sony Corp 音響再生システム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0553832B1 (en) 1992-01-30 1998-07-08 Matsushita Electric Industrial Co., Ltd. Sound field controller
US6853732B2 (en) 1994-03-08 2005-02-08 Sonics Associates, Inc. Center channel enhancement of virtual sound images
US5870484A (en) * 1995-09-05 1999-02-09 Greenberger; Hal Loudspeaker array with signal dependent radiation pattern
KR100416757B1 (ko) * 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
EP1128706A1 (en) 1999-07-15 2001-08-29 Sony Corporation Sound adder and sound adding method
US7050596B2 (en) 2001-11-28 2006-05-23 C-Media Electronics, Inc. System and headphone-like rear channel speaker and the method of the same
US7676047B2 (en) 2002-12-03 2010-03-09 Bose Corporation Electroacoustical transducing with low frequency augmenting devices
US20040105550A1 (en) 2002-12-03 2004-06-03 Aylward J. Richard Directional electroacoustical transducing
KR100878004B1 (ko) 2003-06-02 2009-01-12 후지쓰 텐 가부시키가이샤 음장 조정 장치
US6937737B2 (en) 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
JP4273343B2 (ja) * 2005-04-18 2009-06-03 ソニー株式会社 再生装置および再生方法
JP4935091B2 (ja) 2005-05-13 2012-05-23 ソニー株式会社 音響再生方法および音響再生システム
JP4239026B2 (ja) 2005-05-13 2009-03-18 ソニー株式会社 音響再生方法および音響再生システム
JP2006324898A (ja) * 2005-05-18 2006-11-30 Sony Corp オーディオ再生装置
JP4914124B2 (ja) 2006-06-14 2012-04-11 パナソニック株式会社 音像制御装置及び音像制御方法
US7995775B2 (en) * 2006-07-14 2011-08-09 Broadcom Corporation Automatic volume control for audio signals
KR100943215B1 (ko) * 2007-11-27 2010-02-18 한국전자통신연구원 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법
KR101295848B1 (ko) * 2008-12-17 2013-08-12 삼성전자주식회사 어레이스피커 시스템에서 음향을 포커싱하는 장치 및 방법
KR101268779B1 (ko) * 2009-12-09 2013-05-29 한국전자통신연구원 라우드 스피커 어레이를 사용한 음장 재생 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187300A (ja) * 2002-12-03 2004-07-02 Bose Corp 指向性電気音響変換
JP2008270857A (ja) * 2007-04-16 2008-11-06 Sony Corp 音響再生システム

Also Published As

Publication number Publication date
WO2012144227A1 (ja) 2012-10-26
US9538307B2 (en) 2017-01-03
US20130343550A1 (en) 2013-12-26
JPWO2012144227A1 (ja) 2014-07-28

Similar Documents

Publication Publication Date Title
JP5118267B2 (ja) 音声信号再生装置、音声信号再生方法
JP4505058B2 (ja) 記録およびプレイバックにおいて使用するマルチチャンネルオーディオエンファシスシステムおよび同じものを提供する方法
KR101567461B1 (ko) 다채널 사운드 신호 생성 장치
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
US8477951B2 (en) Front surround system and method of reproducing sound using psychoacoustic models
US7440575B2 (en) Equalization of the output in a stereo widening network
KR101368859B1 (ko) 개인 청각 특성을 고려한 2채널 입체 음향 재생 방법 및장치
US9607622B2 (en) Audio-signal processing device, audio-signal processing method, program, and recording medium
WO2012042905A1 (ja) 音響再生装置および音響再生方法
US10104470B2 (en) Audio processing device, audio processing method, recording medium, and program
US11388539B2 (en) Method and device for audio signal processing for binaural virtualization
US9226091B2 (en) Acoustic surround immersion control system and method
CN104303523B (zh) 将多声道音频信号转换为双声道音频信号的方法和设备
JP4951985B2 (ja) 音声信号処理装置、音声信号処理システム、プログラム
US9794717B2 (en) Audio signal processing apparatus and audio signal processing method
JP2007336080A (ja) 音響補正装置
EP2101517B1 (en) Audio processor for converting a mono signal to a stereo signal
JP2007006432A (ja) バイノーラル再生装置
WO2020045109A1 (ja) 信号処理装置、信号処理方法、及び、プログラム
JP2012049652A (ja) マルチチャネルオーディオ再生装置およびマルチチャネルオーディオ再生方法
JP2011160179A (ja) 音声処理装置
JP2010016573A (ja) クロストークキャンセルステレオスピーカーシステム
JP7332745B2 (ja) 音声処理方法及び音声処理装置
JP2016039568A (ja) 音響処理装置および方法、並びにプログラム
JP6463955B2 (ja) 三次元音響再生装置及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250