WO2018034158A1

WO2018034158A1 - 音響信号処理装置、音響信号処理方法、および、プログラム

Info

Publication number: WO2018034158A1
Application number: PCT/JP2017/028105
Authority: WO
Inventors: 健司中野
Original assignee: ソニー株式会社
Priority date: 2016-08-16
Filing date: 2017-08-02
Publication date: 2018-02-22
Also published as: US20190174248A1; CN109644316A; EP3503593A4; JPWO2018034158A1; CN109644316B; EP3503593A1; EP3503593B1; US10681487B2; JP6922916B2

Abstract

本技術は、仮想スピーカの定位感を安定させる仮想サラウンド方式の構成のバリエーションを広げることができるようにする音響信号処理装置、音響信号処理方法、および、プログラムに関する。音源逆側HRTFに基づく第1のバイノーラル信号、音源側HRTFに基づく第2のバイノーラル信号に対してクロストーク補正処理が行われ、第1の音響信号、第2の音響信号が生成され、入力信号または第2のバイノーラル信号において、音源逆側HRTFの第1ノッチが現れる第1の帯域、第2ノッチが現れる第2の帯域の成分が減衰されることにより、第1の音響信号、第2の音響信号の第1の帯域、第2の帯域の成分が減衰される。第1の帯域、第2の帯域の成分が減衰された入力信号または第2のバイノーラル信号の第3の帯域の成分からなる補助信号が第1の音響信号に加算され、第3の音響信号が生成される。本技術は、例えば、ＡＶアンプが適用できる。

Description

音響信号処理装置、音響信号処理方法、および、プログラム

　本技術は、音響信号処理装置、音響信号処理方法、および、プログラムに関し、特に、仮想スピーカの定位感を安定させる仮想サラウンド方式の構成のバリエーションを広げるようにした音響信号処理装置、音響信号処理方法、および、プログラムに関する。

　従来、リスナーの正中面から左または右に外れた位置の音像の定位感を向上させる仮想サラウンド方式が提案されている（例えば、特許文献１参照）。

　また、従来、リスナーの正中面から左または右に外れた位置の音像の定位感を向上させる仮想サラウンド方式において、一方のスピーカの音量が他方のスピーカの音量と比較して有意に小さくなる場合でも、仮想スピーカの定位感を安定させる技術が提案されている（例えば、特許文献２参照）。

特開２０１３－１１０６８２号公報特開２０１５－２１１４１８号公報

　ところで、特許文献２に記載の技術において、回路設計等を容易にするために、構成のバリエーションを広げることが望まれている。

　そこで、本技術は、仮想スピーカの定位感を安定させる仮想サラウンド方式の構成のバリエーションを広げることができるようにするものである。

　本技術の一側面の音響信号処理装置は、所定のリスニング位置における正中面から左または右に外れた第１の仮想音源用の音響信号である第１の入力信号に対して、前記リスニング位置におけるリスナーの前記第１の仮想音源から遠い方の耳と前記第１の仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記第１の入力信号に対して、前記リスナーの前記第１の仮想音源から近い方の耳と前記第１の仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記第１の入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の第１の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させる第１のトランスオーラル処理部と、前記第１の帯域および前記第２の帯域の成分が減衰された前記第１の入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる第１の補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する第１の補助信号合成部とを含む。

　前記第１のトランスオーラル処理部に、前記第１の入力信号の前記第１の帯域および前記第２の帯域の成分を減衰させた減衰信号を生成する減衰部と、前記第１の頭部音響伝達関数を前記減衰信号に重畳した前記第１のバイノーラル信号、および、前記第２の頭部音響伝達関数を前記減衰信号に重畳した前記第２のバイノーラル信号を生成する処理、並びに、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対する前記クロストーク補正処理を一体化して行う信号処理部とを設け、前記第１の補助信号を、前記減衰信号の前記第３の帯域の成分からなるようにすることができる。

　前記第１のトランスオーラル処理部に、前記第１の頭部音響伝達関数を前記第１の入力信号に重畳した前記第１のバイノーラル信号を生成する第１のバイノーラル化処理部と、前記第２の頭部音響伝達関数を前記第１の入力信号に重畳した前記第２のバイノーラル信号を生成するとともに、前記第２の頭部音響伝達関数を重畳する前の前記第１の入力信号または前記第２の頭部音響伝達関数を重畳した後の前記第２のバイノーラル信号の前記第１の帯域および前記第２の帯域の成分を減衰させる第２のバイノーラル化処理部と、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対して前記クロストーク補正処理を行うクロストーク補正処理部とを設けることができる。

　前記第１のバイノーラル化処理部には、前記第１の頭部音響伝達関数を重畳する前の前記第１の入力信号または前記第１の頭部音響伝達関数を重畳した後の前記第１のバイノーラル信号の前記第１の帯域および前記第２の帯域の成分を減衰させることができる。

　前記第３の帯域に、前記リスニング位置に対して左右に配置された２つのスピーカのうちの一方のスピーカと前記リスナーの一方の耳との間の第３の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第２の周波数以上において最も低い帯域および２番目に低い帯域、前記２つのスピーカのうちの他方のスピーカと前記リスナーの他方の耳との間の第４の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第３の周波数以上において最も低い帯域および２番目に低い帯域、前記一方のスピーカと前記他方の耳との間の第５の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第４の周波数以上において最も低い帯域および２番目に低い帯域、並びに、前記他方のスピーカと前記一方の耳との間の第６の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第５の周波数以上において最も低い帯域および２番目に低い帯域を少なくとも含ませることができる。

　前記第１の補助信号を加算する前に前記第１の音響信号を所定の時間遅延させる第１の遅延部と、前記第２の音響信号を前記所定の時間遅延させる第２の遅延部とをさらに設けることができる。

　前記第１の補助信号合成部には、前記第１の音響信号に加算する前に前記第１の補助信号のレベルを調整させることができる。

　前記正中面から左または右に外れた第２の仮想音源用の音響信号である第２の入力信号に対して、前記リスナーの前記第２の仮想音源から遠い方の耳と前記第２の仮想音源との間の第７の頭部音響伝達関数を用いて第３のバイノーラル信号を生成し、前記第２の入力信号に対して、前記リスナーの前記第２の仮想音源から近い方の耳と前記第２の仮想音源との間の第８の頭部音響伝達関数を用いて第４のバイノーラル信号を生成し、前記第３のバイノーラル信号および前記第４のバイノーラル信号に対して前記クロストーク補正処理を行うことにより、第４の音響信号および第５の音響信号を生成するとともに、前記第２の入力信号または前記第４のバイノーラル信号において、前記第７の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第６の周波数以上において最も低い第４の帯域および２番目に低い第５の帯域の成分を減衰させることにより、前記第５の音響信号の前記第４の帯域および前記第５の帯域の成分を減衰させる第２のトランスオーラル処理部と、前記第４の帯域および前記第５の帯域の成分が減衰された前記第２の入力信号の前記第３の帯域の成分、または、前記第４の帯域および前記第５の帯域の成分が減衰された前記第４のバイノーラル信号の前記第３の帯域の成分からなる第２の補助信号を前記第４の音響信号に加算することにより第６の音響信号を生成する第２の補助信号合成部と、前記第１の仮想音源と前記第２の仮想音源が前記正中面を基準にして左右に分かれる場合、前記３の音響信号と前記第５の音響信号を加算し、前記第２の音響信号と前記第６の音響信号を加算し、前記第１の仮想音源と前記第２の仮想音源が前記正中面を基準にして同じ側にある場合、前記第３の音響信号と前記第６の音響信号を加算し、前記第２の音響信号と前記第５の音響信号を加算する加算部とをさらに設けることができる。

　前記第１の周波数を、前記第１の頭部音響伝達関数の４ｋＨｚ近傍において正のピークが現れる周波数とすることができる。

　前記クロストーク補正処理を、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対して、前記リスニング位置に対して左右に配置された２つのスピーカのうち前記正中面を基準にして前記第１の仮想音源と逆側にあるスピーカと前記リスナーの前記第１の仮想音源から遠い方の耳との間の音響伝達特性、前記２つのスピーカのうち前記正中面を基準にして前記仮想音源側にあるスピーカと前記リスナーの前記第１の仮想音源から近い方の耳との間の音響伝達特性、前記第１の仮想音源と逆側にあるスピーカから前記リスナーの前記第１の仮想音源から近い方の耳へのクロストーク、および、前記仮想音源側にあるスピーカから前記リスナーの前記第１の仮想音源から遠い方の耳へのクロストークをキャンセルする処理とすることができる。

　本技術の一側面の音響信号処理方法は、所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させるトランスオーラル処理ステップと、前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する補助信号合成ステップとを含む。

　本技術の一側面のプログラムは、所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させるトランスオーラル処理ステップと、前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する補助信号合成ステップとを含む処理をコンピュータに実行させる。

　本技術の一側面においては、所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号が生成され、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号が生成され、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理が行われることにより、第１の音響信号および第２の音響信号が生成されるとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分が減衰されることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分が減衰され、前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号が前記第１の音響信号に加算されることにより第３の音響信号が生成される。

　本技術の一側面によれば、仮想サラウンド方式において、リスナーの正中面から左または右に外れた位置に音像を定位させることができる。また、本技術の一側面によれば、仮想スピーカの定位感を安定させる仮想サラウンド方式の構成のバリエーションを広げることができる。

　なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

HRTFの一例を示すグラフである。本技術の基礎となる技術を説明するための図である。本技術を適用した音響信号処理システムの第１の実施の形態を示す図である。第１の実施の形態の音響信号処理システムにより実行される音響信号処理を説明するためのフローチャートである。本技術を適用した音響信号処理システムの第１の実施の形態の変形例を示す図である。本技術を適用した音響信号処理システムの第２の実施の形態を示す図である。第２の実施の形態の音響信号処理システムにより実行される音響信号処理を説明するためのフローチャートである。本技術を適用した音響信号処理システムの第２の実施の形態の変形例を示す図である。本技術を適用したオーディオシステムの機能の構成例を模式的に示す図である。補助信号合成部の変形例を示す図である。コンピュータの構成例を示すブロック図である。

　以下、本技術を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．本技術の基礎となる技術の説明
２．第１の実施の形態（バイノーラル化処理とクロストーク補正処理を個別に行う例）
３．第２の実施の形態（トランスオーラル処理を一体化して行う例）
４．第３の実施の形態（仮想スピーカを複数生成する例）
５．変形例

＜１．本技術の基礎となる技術の説明＞
　まず、図１および図２を参照して、本技術の基礎となる技術について説明する。

　従来、HRTF（Head-Related Transfer Function、頭部音響伝達関数）の振幅－周波数特性において高域側に現れるピークやディップが、音像の上下および前後方向の定位感に対する重要な手がかりになることが知られている（例えば、”飯田他、「空間音響学」、日本、コロナ社、2010年7月”（以下、非特許文献１と称する）の１９乃至２１ページ参照）。これらのピークやディップは、主に耳の形状による反射、回折、共鳴により形成されると考えられている。

　また、非特許文献１には、図１に示されるように、４ｋＨｚ近傍に現れる正のピークＰ１と、ピークＰ１が現れる周波数以上の帯域において最初に現れる２つのノッチＮ１，Ｎ２が、特に音像の上下前後の定位感に対する寄与率が高いことが指摘されている。

　ここで、本明細書において、ディップとは、HRTFの振幅－周波数特性などの波形図において、周囲と比較して凹んでいる状態の部分を指す。また、ノッチとは、ディップのうち、特に幅（例えば、HRTFの振幅－周波数特性では帯域）が狭く、所定の深さ以上のもの、すなわち、波形図に現れる急峻な負のピークを指す。さらに、以下、図１のノッチＮ１、ノッチＮ２を、それぞれ第１ノッチ、第２ノッチとも称する。

　ピークＰ１は、音源の方向に対する依存性が認められず、音源の方向に関わらずほぼ同じ帯域に現れる。そして、非特許文献１では、ピークＰ１は、人間の聴覚システムが第１ノッチ、第２ノッチを探索するためのリファレンス信号であり、実質的に上下前後の定位感に寄与する物理パラメータは、第１ノッチ、第２ノッチであると考えられている。

　また、上述した特許文献１には、音源の位置がリスナーの正中面から左または右に外れた場合、音源逆側HRTFに現れる第１ノッチおよび第２ノッチが、音像の上下前後の定位感に対して重要になることが示されている。また、音源逆側HRTFの第１ノッチおよび第２ノッチをリスナーの音源逆側の耳元で再現できれば、音源側の耳元における当該ノッチが現れる帯域の音の振幅は、音像の上下前後の定位感に有意な影響を与えないことが示されている。

　ここで、音源側とは、リスニング位置を基準とする左右方向のうち音源に近い方であり、音源逆側とは、音源から遠い方である。換言すれば、音源側とは、リスニング位置におけるリスナーの正中面を基準にして左右に空間を分けた場合の音源と同じ側であり、音源逆側とは、その逆側である。また、音源側HRTFとは、リスナーの音源側の耳に対応するHRTFのことであり、音源逆側HRTFとは、リスナーの音源逆側の耳に対応するHRTFのことである。なお、以下、リスナーの音源逆側の耳を影側の耳とも称する。

　特許文献１に記載の技術では、以上の理論を利用して、音源側の音響信号に仮想スピーカの音源逆側HRTFに現れる第１ノッチおよび第２ノッチと同帯域のノッチを形成した後、トランスオーラル処理を行う。これにより、音源逆側の耳元において第１ノッチおよび第２ノッチが安定して再現され、仮想スピーカの上下前後の位置が安定する。

　ここで、トランスオーラル処理について簡単に説明する。

　両耳元に配置したマイクロフォンで録音した音をヘッドフォンにより両耳元で再生する手法は、バイノーラル録音／再生方式として知られている。バイノーラル録音により録音された２チャンネルの信号はバイノーラル信号と呼ばれ、人間にとって左右だけでなく上下方向や前後方向の音源の位置に関する音響情報が含まれる。

　また、このバイノーラル信号を、ヘッドフォンではなく左右の２チャンネルのスピーカを用いて再生する手法は、トランスオーラル再生方式と呼ばれている。ただし、バイノーラル信号に基づく音をそのままスピーカから出力しただけでは、例えば、右耳用の音がリスナーの左耳にも聴こえてしまうようなクロストークが発生してしまう。さらに、例えば、右耳用の音がリスナーの右耳に到達するまでの間に、スピーカから右耳までの音響伝達特性が重畳され、波形が変形してしまう。

　そのため、トランスオーラル再生方式では、クロストークや余計な音響伝達特性をキャンセルするための事前処理が、バイノーラル信号に対して行われる。以下、この事前処理を、クロストーク補正処理と称する。

　ところで、バイノーラル信号は、耳元のマイクで録音しなくても生成することができる。具体的には、バイノーラル信号は、音響信号に対し、その音源の位置から両耳元までのHRTFを重畳したものである。従って、HRTFが分かっていれば、音響信号に対してHRTFを重畳する信号処理を施すことによりバイノーラル信号を生成することができる。以下、この処理をバイノーラル化処理と称する。

　HRTFをベースにしたフロントサラウンド方式では、以上のバイノーラル化処理およびクロストーク補正処理が行われる。ここで、フロントサラウンド方式とは、フロントスピーカだけでサラウンド音場を擬似的に作り出す仮想サラウンド方式である。そして、このバイノーラル化処理およびクロストーク補正処理を組み合わせた処理が、トランスオーラル処理である。

　しかしながら、特許文献１に記載の技術では、一方のスピーカの音量が他方のスピーカの音量と比較して有意に小さくなる場合、音像の定位感が低下する。ここで、図２を参照して、この理由について説明する。

　図２は、音像定位フィルタ１１Ｌ，１１Ｒを用いて、所定のリスニング位置にいるリスナーＰに対して、スピーカ１２Ｌ，１２Ｒから出力される音の像を、仮想スピーカ１３の位置に定位させる例を示している。なお、以下、仮想スピーカ１３の位置が、リスニング位置（リスナーＰ）の前方左斜め上に設定されている場合について説明する。

　なお、以下、仮想スピーカ１３とリスナーＰの左耳ＥＬとの間の音源側HRTFを頭部音響伝達関数ＨＬと称し、仮想スピーカ１３とリスナーＰの右耳ＥＲとの間の音源逆側HRTFを頭部音響伝達関数ＨＲと称する。また、以下、説明を簡単にするために、スピーカ１２ＬとリスナーＰの左耳ＥＬとの間のHRTFと、スピーカ１２ＲとリスナーＰの右耳ＥＲとの間のHRTFが同じであるものとし、当該HRTFを頭部音響伝達関数Ｇ１と称する。同様に、スピーカ１２ＬとリスナーＰの右耳ＥＲとの間のHRTFと、スピーカ１２ＲとリスナーＰの左耳ＥＬとの間のHRTFが同じであるものとし、当該HRTFを頭部音響伝達関数Ｇ２と称する。

　図２に示されるように、スピーカ１２Ｌからの音がリスナーＰの左耳ＥＬに到達するまでに頭部音響伝達関数Ｇ１が重畳され、スピーカ１２Ｒからの音がリスナーＰの左耳ＥＬに到達するまでに頭部音響伝達関数Ｇ２が重畳される。ここで、音像定位フィルタ１１Ｌ，１１Ｒが理想的に作用すれば、両方のスピーカからの音を左耳ＥＬにおいて合成した音の波形は、頭部音響伝達関数Ｇ１およびＧ２の影響がキャンセルされ、音響信号Ｓｉｎに頭部音響伝達関数ＨＬを重畳した波形となる。

　同様に、スピーカ１２Ｒからの音がリスナーＰの右耳ＥＲに到達するまでに頭部音響伝達関数Ｇ１が重畳され、スピーカ１２Ｌからの音がリスナーＰの右耳ＥＲに到達するまでに頭部音響伝達関数Ｇ２が重畳される。ここで、音像定位フィルタ１１Ｌ，１１Ｒが理想的に作用すれば、両方のスピーカからの音を右耳ＥＲにおいて合成した音の波形は、頭部音響伝達関数Ｇ１およびＧ２の影響がキャンセルされ、音響信号Ｓｉｎに頭部音響伝達関数ＨＲを重畳した波形となる。

　ここで、特許文献１に記載の技術を適用し、音源側の音像定位フィルタ１１Ｌに入力される音響信号Ｓｉｎに、音源逆側の頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチと同帯域のノッチを形成すると、リスナーＰの左耳ＥＬにおいて、頭部音響伝達関数ＨＬの第１ノッチおよび第２ノッチ、並びに、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチとほぼ同帯域のノッチが現れる。また、リスナーＰの右耳ＥＲにおいて、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチが現れる。これにより、リスナーＰの影側の右耳ＥＲにおいて、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチが安定して再現され、仮想スピーカ１３の上下前後の位置が安定する。

　しかしながら、これは理想的にクロストーク補正処理がなされた場合であり、実際には、音像定位フィルタ１１Ｌ，１１Ｒによりクロストークや余分な音響伝達特性を完全にキャンセルすることは困難である。これは通常、音像定位フィルタ１１Ｌ、１１Ｒを構成する場合、実用的規模にする必要性から生じるフィルタ特性誤差によるものや、通常的な試聴位置が理想的位置でないことによる空間的音響信号合成において生じる誤差によるものなどが原因である。特にこの場合、片耳にのみ再現すべき左耳ＥＬでの頭部音響伝達関数ＨＬの第１ノッチ、第２ノッチは再現が困難なものとなる。しかしながら、頭部音響伝達関数ＨＲの第１ノッチ、第２ノッチは信号全体に掛けられたものなので再現性は良いものとなる。

　では、そのような状況において、頭部音響伝達関数Ｇ１やＧ２に現れる第１ノッチ、第２ノッチの影響について以下考えてみる。

　頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチの帯域と、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチの帯域とは、一般的には一致しない。従って、スピーカ１２Ｌの音量とスピーカ１２Ｒの音量が互いに有意な大きさである場合、リスナーＰの左耳ＥＬにおいて、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチは、スピーカ１２Ｒからの音により打ち消され、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチは、スピーカ１２Ｌからの音により打ち消される。同様に、リスナーＰの右耳ＥＲにおいて、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチは、スピーカ１２Ｌからの音により打ち消され、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチは、スピーカ１２Ｒからの音により打ち消される。

　従って、リスナーＰの両耳において、頭部音響伝達関数Ｇ１およびＧ２のノッチが現れなくなり、仮想スピーカ１３の定位感に影響を及ぼすことがないため、仮想スピーカ１３の上下前後の位置が安定する。

　一方、例えば、スピーカ１２Ｒの音量がスピーカ１２Ｌの音量に対して有意に小さくなる場合、スピーカ１２Ｒからの音がリスナーＰの両耳にほとんど届かなくなる。これにより、リスナーＰの左耳ＥＬにおいて、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチが消されずにそのまま残る。また、リスナーＰの右耳ＥＲにおいて、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチが消されずにそのまま残る。

　従って、現実のクロストーク補正処理おいては、リスナーＰの左耳ＥＬにおいて、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチとほぼ同帯域のノッチに加えて、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチが現れる。すなわち、２組のノッチが同時に発生した状態となる。また、リスナーＰの右耳ＥＲにおいて、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチに加えて、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチが現れる。すなわち、２組のノッチが同時に発生した状態となる。

　このように、リスナーＰの両耳において、頭部音響伝達関数ＨＬおよびＨＲ以外のノッチが現れることにより、音像定位フィルタ１１Ｌに入力する音響信号Ｓｉｎに頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチと同帯域のノッチを形成した効果が薄れる。そして、リスナーＰは、仮想スピーカ１３の位置の識別が困難になり、仮想スピーカ１３の上下前後の位置が不安定になる。

　ここで、スピーカ１２Ｒの音量がスピーカ１２Ｌの音量に対して有意に小さくなる場合の具体例について説明する。

　例えば、スピーカ１２Ｌと仮想スピーカ１３が、リスナーＰの両耳を通る軸上の任意の点を中心とし、当該軸に対して垂直な同じ円の円周上またはその近傍に配置されている場合、以下に述べるように、音像定位フィルタ１１Ｒのゲインが、音像定位フィルタ１１Ｌのゲインと比較して有意に小さくなる。

　なお、以下、リスナーＰの両耳を通る軸を両耳間軸と称する。また、以下、両耳間軸上の任意の点を中心とし、両耳間軸に対して垂直な円を、両耳間軸周りの円と称する。なお、リスナーＰは、空間音響の分野でコーン状の混同と呼ばれる現象により、両耳間軸周りの同じ円の円周上にある音源の位置を識別することができない（例えば、非特許文献１の１６ページ参照）。

　この場合、スピーカ１２Ｌからの音のリスナーＰの両耳間のレベル差および時間差は、仮想スピーカ１３からの音のリスナーＰの両耳間のレベル差および時間差とほぼ等しくなる。従って、次の式（１）および式（１’）が成り立つ。

　G2／G1≒HR／HL　・・・（１）
　HR≒（G2＊HL）／G1　・・・（１’）

　なお、式（１’）は式（１）を変形したものである。

　一方、一般的な音像定位フィルタ１１Ｌ，１１Ｒの係数ＣＬ，ＣＲは、次の式（２－１）および式（２－２）により表される。

　CL＝（G1＊HL－G2＊HR）／（G1＊G1－G2＊G2）　・・・（２－１）
　CR＝（G1＊HR－G2＊HL）／（G1＊G1－G2＊G2）　・・・（２－２）

　従って、式（１’）並びに式（２－１）および式（２－２）により、次の式（３－１）および式（３－２）が成り立つ。

　CL≒HL／G1　・・・（３－１）
　CR≒0　・・・（３－２）

　すなわち、音像定位フィルタ１１Ｌは、ほぼ頭部音響伝達関数ＨＬと頭部音響伝達関数Ｇ１の差分となる。一方、音像定位フィルタ１１Ｒの出力は、ほぼ０となる。従って、スピーカ１２Ｒの音量がスピーカ１２Ｌの音量に対して有意に小さくなる。

　以上をまとめると、スピーカ１２Ｌと仮想スピーカ１３が、両耳間軸周りの同じ円の円周上またはその近傍に配置されている場合、音像定位フィルタ１１Ｒのゲイン（係数CR）が、音像定位フィルタ１１Ｌのゲイン（係数CL）と比較して有意に小さくなる。その結果、スピーカ１２Ｒの音量がスピーカ１２Ｌの音量に対して有意に小さくなり、仮想スピーカ１３の上下前後の位置が不安定になる。

　なお、これは、スピーカ１２Ｒと仮想スピーカ１３が、両耳間軸周りの同じ円の円周上またはその近傍に配置されている場合も同様である。

　これに対して、本技術は、一方のスピーカの音量が他方のスピーカの音量と比較して有意に小さくなる場合でも、仮想スピーカの定位感を安定させることができるようにするものである。

＜２．第１の実施の形態＞
　次に、図３乃至図５を参照して、本技術を適用した音響信号処理システムの第１の実施の形態について説明する。

｛音響信号処理システム１０１Ｌの構成例｝
　図３は、本技術の第１の実施の形態である音響信号処理システム１０１Ｌの機能の構成例を示す図である。

　音響信号処理システム１０１Ｌは、音響信号処理部１１１Ｌ、および、スピーカ１１２Ｌ，１１２Ｒを含むように構成される。スピーカ１１２Ｌ,１１２Ｒは、例えば、音響信号処理システム１０１Ｌにおいて理想的な所定のリスニング位置の前方に左右対称に配置される。

　音響信号処理システム１０１Ｌは、スピーカ１１２Ｌ，１１２Ｒを用いて、仮想の音源である仮想スピーカ１１３を実現する。すなわち、音響信号処理システム１０１Ｌは、所定のリスニング位置にいるリスナーＰに対して、スピーカ１１２Ｌ，１１２Ｒから出力される音の像を、正中面から左に外れた仮想スピーカ１１３の位置に定位させることが可能である。

　なお、以下、仮想スピーカ１１３の位置が、リスニング位置（リスナーＰ）の前方左斜め上に設定されている場合について説明する。この場合、リスナーＰの右耳ＥＲが影側となる。また、以下、スピーカ１１２Ｌと仮想スピーカ１１３が、両耳間軸周りの同じ円の円周上またはその近傍に配置されている場合について説明する。

　また、以下、図２の例と同様に、仮想スピーカ１１３とリスナーＰの左耳ＥＬとの間の音源側HRTFを頭部音響伝達関数ＨＬと称し、仮想スピーカ１１３とリスナーＰの右耳ＥＲとの間の音源逆側HRTFを頭部音響伝達関数ＨＲと称する。さらに、以下、図２の例と同様に、スピーカ１１２ＬとリスナーＰの左耳ＥＬとの間のHRTFと、スピーカ１１２ＲとリスナーＰの右耳ＥＲとの間のHRTFが同じであるものとし、当該HRTFを頭部音響伝達関数Ｇ１と称する。また、以下、図２の例と同様に、スピーカ１１２ＬとリスナーＰの右耳ＥＲとの間のHRTFと、スピーカ１１２ＲとリスナーＰの左耳ＥＬとの間のHRTFが同じであるものとし、当該HRTFを頭部音響伝達関数Ｇ２と称する。

　音響信号処理部１１１Ｌは、トランスオーラル処理部１２１Ｌおよび補助信号合成部１２２Ｌを含むように構成される。トランスオーラル処理部１２１Ｌは、バイノーラル化処理部１３１Ｌおよびクロストーク補正処理部１３２を含むように構成される。バイノーラル化処理部１３１Ｌは、ノッチ形成イコライザ１４１Ｌ，１４１Ｒ、および、バイノーラル信号生成部１４２Ｌ，１４２Ｒを含むように構成される。クロストーク補正処理部１３２は、信号処理部１５１Ｌ，１５１Ｒ、信号処理部１５２Ｌ，１５２Ｒ、および、加算部１５３Ｌ，１５３Ｒを含むように構成される。補助信号合成部１２２Ｌは、補助信号生成部１６１Ｌおよび加算部１６２Ｒを含むように構成される。

　ノッチ形成イコライザ１４１Ｌは、外部から入力される音響信号Ｓｉｎの成分のうち、音源逆側HRTF（頭部音響伝達関数ＨＲ）において第１ノッチおよび第２ノッチが現れる帯域の成分を減衰させる処理（以下、ノッチ形成処理と称する）を行う。ノッチ形成イコライザ１４１Ｌは、ノッチ形成処理の結果得られた音響信号Ｓｉｎ’をバイノーラル信号生成部１４２Ｌおよび補助信号生成部１６１Ｌに供給する。

　ノッチ形成イコライザ１４１Ｒは、ノッチ形成イコライザ１４１Ｌと同様のイコライザである。従って、ノッチ形成イコライザ１４１Ｒは、音響信号Ｓｉｎの成分のうち、音源逆側HRTF（頭部音響伝達関数ＨＲ）において第１ノッチおよび第２ノッチが現れる帯域の成分を減衰させるノッチ形成処理を行う。ノッチ形成イコライザ１４１Ｒは、ノッチ形成処理の結果得られた音響信号Ｓｉｎ’をバイノーラル信号生成部１４２Ｒに供給する。

　バイノーラル信号生成部１４２Ｌは、音響信号Ｓｉｎ’に対して頭部音響伝達関数ＨＬを重畳することにより、バイノーラル信号ＢＬを生成する。バイノーラル信号生成部１４２Ｌは、生成したバイノーラル信号ＢＬを信号処理部１５１Ｌおよび信号処理部１５２Ｌに供給する。

　バイノーラル信号生成部１４２Ｒは、音響信号Ｓｉｎ’に対して頭部音響伝達関数ＨＲを重畳することにより、バイノーラル信号ＢＲを生成する。バイノーラル信号生成部１４２Ｒは、生成したバイノーラル信号ＢＲを信号処理部１５１Ｒおよび信号処理部１５２Ｒに供給する。

　信号処理部１５１Ｌは、頭部音響伝達関数Ｇ１，Ｇ２を変数とする所定の関数ｆ１（Ｇ１，Ｇ２）をバイノーラル信号ＢＬに重畳することにより、音響信号ＳＬ１を生成する。信号処理部１５１Ｌは、生成した音響信号ＳＬ１を加算部１５３Ｌに供給する。

　同様に、信号処理部１５１Ｒは、関数ｆ１（Ｇ１，Ｇ２）をバイノーラル信号ＢＲに重畳することにより、音響信号ＳＲ１を生成する。信号処理部１５１Ｒは、生成した音響信号ＳＲ１を加算部１５３Ｒに供給する。

　なお、関数ｆ１（Ｇ１，Ｇ２）は、例えば、次式（４）により表される。

　f1(G1,G2)＝1／(G1＋G2)＋1／(G1－G2)　・・・（４）

　信号処理部１５２Ｌは、頭部音響伝達関数Ｇ１，Ｇ２を変数とする所定の関数ｆ２（Ｇ１，Ｇ２）をバイノーラル信号ＢＬに重畳することにより、音響信号ＳＬ２を生成する。信号処理部１５２Ｌは、生成した音響信号ＳＬ２を加算部１５３Ｒに供給する。

　同様に、信号処理部１５２Ｒは、関数ｆ２（Ｇ１，Ｇ２）をバイノーラル信号ＢＲに重畳することにより、音響信号ＳＲ２を生成する。信号処理部１５２Ｒは、生成した音響信号ＳＲ２を加算部１５３Ｌに供給する。

　なお、関数ｆ２（Ｇ１，Ｇ２）は、例えば、次式（５）により表される。

　f2(G1,G2)＝1／(G1＋G2)－1／(G1－G2)　・・・（５）

　加算部１５３Ｌは、音響信号ＳＬ１と音響信号ＳＲ２を加算することにより、音響信号ＳＬｏｕｔ１を生成する。加算部１５３Ｌは、音響信号ＳＬｏｕｔ１をスピーカ１１２Ｌに供給する。

　加算部１５３Ｒは、音響信号ＳＲ１と音響信号ＳＬ２を加算することにより、音響信号ＳＲｏｕｔ１を生成する。加算部１５３Ｒは、音響信号ＳＲｏｕｔ１を加算部１６２Ｒに供給する。

　補助信号生成部１６１Ｌは、例えば、所定の帯域の信号を抽出または減衰するフィルタ（例えば、ハイパスフィルタ、バンドパスフィルタ等）、並びに、信号レベルを調整するアッテネータにより構成される。補助信号生成部１６１Ｌは、ノッチ形成イコライザ１４１Ｌから供給される音響信号Ｓｉｎ’の所定の帯域の信号を抽出または減衰することにより補助信号ＳＬｓｕｂを生成し、必要に応じて補助信号ＳＬｓｕｂの信号レベルを調整する。補助信号生成部１６１Ｌは、生成した補助信号ＳＬｓｕｂを加算部１６２Ｒに供給する。

　加算部１６２Ｒは、音響信号ＳＲｏｕｔ１と補助信号ＳＬｓｕｂを加算することにより、音響信号ＳＲｏｕｔ２を生成する。加算部１６２Ｒは、音響信号ＳＲｏｕｔ２をスピーカ１１２Ｒに供給する。

　スピーカ１１２Ｌは、音響信号ＳＬｏｕｔ１に基づく音を出力し、スピーカ１１２Ｒは、音響信号ＳＲｏｕｔ２（すなわち、音響信号ＳＲｏｕｔ１と補助信号ＳＬｓｕｂを合成した信号）に基づく音を出力する。

｛音響信号処理システム１０１Ｌによる音響信号処理｝
　次に、図４のフローチャートを参照して、図３の音響信号処理システム１０１Ｌにより実行される音響信号処理について説明する。

　ステップＳ１において、ノッチ形成イコライザ１４１Ｌ，１４１Ｒは、音源側および音源逆側の音響信号Ｓｉｎに音源逆側HRTFのノッチと同帯域のノッチを形成する。すなわち、ノッチ形成イコライザ１４１Ｌは、音響信号Ｓｉｎの成分のうち、仮想スピーカ１１３の音源逆側HRTFである頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチと同じ帯域の成分を減衰させる。これにより、音響信号Ｓｉｎの成分のうち、頭部音響伝達関数ＨＲのノッチが現れる帯域のうち所定の周波数（４ｋＨｚ近傍の正のピークが現れる周波数）以上において最も低い帯域および２番目に低い帯域の成分が減衰される。そして、ノッチ形成イコライザ１４１Ｌは、その結果得られた音響信号Ｓｉｎ’をバイノーラル信号生成部１４２Ｌおよび補助信号生成部１６１Ｌに供給する。

　同様に、ノッチ形成イコライザ１４１Ｒは、音響信号Ｓｉｎの成分のうち、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチと同じ帯域の成分を減衰させる。そして、ノッチ形成イコライザ１４１Ｒは、その結果得られた音響信号Ｓｉｎ’をバイノーラル信号生成部１４２Ｒに供給する。

　ステップＳ２において、バイノーラル信号生成部１４２Ｌ，１４２Ｒは、バイノーラル化処理を行う。具体的には、バイノーラル信号生成部１４２Ｌは、音響信号Ｓｉｎ’に頭部音響伝達関数ＨＬを重畳することにより、バイノーラル信号ＢＬを生成する。バイノーラル信号生成部１４２Ｌは、生成したバイノーラル信号ＢＬを信号処理部１５１Ｌおよび信号処理部１５２Ｌに供給する。

　このバイノーラル信号ＢＬは、音源逆側HRTF（頭部音響伝達関数ＨＲ）の第１ノッチおよび第２ノッチと同帯域のノッチを音源側HRTF（頭部音響伝達関数ＨＬ）に形成したHRTFを音響信号Ｓｉｎに重畳した信号となる。換言すれば、このバイノーラル信号ＢＬは、音響信号Ｓｉｎに音源側HRTFを重畳した信号の成分のうち、音源逆側HRTFにおいて第１ノッチおよび第２ノッチが現れる帯域の成分を減衰させた信号となる。

　同様に、バイノーラル信号生成部１４２Ｒは、音響信号Ｓｉｎ’に頭部音響伝達関数ＨＲを重畳することにより、バイノーラル信号ＢＲを生成する。バイノーラル信号生成部１４２Ｒは、生成したバイノーラル信号ＢＲを信号処理部１５１Ｒおよび信号処理部１５２Ｒに供給する。

　このバイノーラル信号ＢＲは、実質的に音源逆側HRTF（頭部音響伝達関数ＨＲ）の第１ノッチおよび第２ノッチをさらに深くしたHRTFを音響信号Ｓｉｎに重畳した信号となる。従って、このバイノーラル信号ＢＲは、音源逆側HRTFにおいて第１ノッチおよび第２ノッチが現れる帯域の成分がさらに小さくなる。

　ステップＳ３において、クロストーク補正処理部１３２は、クロストーク補正処理を行う。具体的には、信号処理部１５１Ｌは、上述した関数ｆ１（Ｇ１，Ｇ２）をバイノーラル信号ＢＬに重畳することにより、音響信号ＳＬ１を生成する。信号処理部１５１Ｌは、生成した音響信号ＳＬ１を加算部１５３Ｌに供給する。

　また、信号処理部１５２Ｌは、上述した関数ｆ２（Ｇ１，Ｇ２）をバイノーラル信号ＢＬに重畳することにより、音響信号ＳＬ２を生成する。信号処理部１５２Ｌは、生成した音響信号ＳＬ２を加算部１５３Ｒに供給する。

　同様に、信号処理部１５２Ｒは、関数ｆ２（Ｇ１，Ｇ２）をバイノーラル信号ＢＲに重畳することにより、音響信号ＳＲ２を生成する。信号処理部１５２Ｒは、生成した音響信号ＳＬ２を加算部１５３Ｌに供給する。

　加算部１５３Ｌは、音響信号ＳＬ１と音響信号ＳＲ２を加算することにより音響信号ＳＬｏｕｔ１を生成する。ここで、ノッチ形成イコライザ１４１Ｌにより、音響信号Ｓｉｎ’の音源逆側HRTFにおいて第１ノッチおよび第２ノッチが現れる帯域の成分が減衰されているため、音響信号ＳＬｏｕｔ１の同帯域の成分も減衰された状態となる。加算部１５３Ｌは、生成した音響信号ＳＬｏｕｔ１をスピーカ１１２Ｌに供給する。

　同様に、加算部１５３Ｒは、音響信号ＳＲ１と音響信号ＳＬ２を加算することにより音響信号ＳＲｏｕｔ１を生成する。ここで、音響信号ＳＲｏｕｔ１において、音源逆側HRTFの第１ノッチおよび第２ノッチが現れる帯域の成分が小さくなる。さらに、ノッチ形成イコライザ１４１Ｒにより、音響信号Ｓｉｎ’の音源逆側HRTFにおいて第１ノッチおよび第２ノッチが現れる帯域の成分が減衰されているため、音響信号ＳＬｏｕｔ１の同帯域の成分がさらに小さくなる。加算部１５３Ｒは、生成した音響信号ＳＲｏｕｔ１を加算部１６２Ｒに供給する。

　ここで、上述したように、スピーカ１１２Ｌと仮想スピーカ１１３が、両耳間軸周りの同じ円の円周上またはその近傍に配置されているため、音響信号ＳＲｏｕｔ１の大きさは、音響信号ＳＬｏｕｔ１と比較して小さなものとなる。

　ステップＳ４において、補助信号合成部１２２Ｌは、補助信号合成処理を行う。具体的には、補助信号生成部１６１Ｌは、音響信号Ｓｉｎ’の所定の帯域の信号を抽出または減衰することにより、補助信号ＳＬｓｕｂを生成する。

　例えば、補助信号生成部１６１Ｌは、音響信号Ｓｉｎ’の４ｋＨｚ未満の帯域を減衰させることにより、音響信号ＳＬｏｕｔ１の４ｋＨｚ以上の帯域の成分からなる補助信号ＳＬｓｕｂを生成する。

　或いは、例えば、補助信号生成部１６１Ｌは、４ｋＨｚ以上の帯域の中から所定の帯域の成分を音響信号Ｓｉｎ’から抽出することにより補助信号ＳＬｓｕｂを生成する。ここで抽出される帯域には、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチ、並びに、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチが現れる帯域が少なくとも含まれる。

　なお、スピーカ１１２Ｌと左耳ＥＬとの間のHRTFと、スピーカ１１２Ｒと右耳ＥＲとの間のHRTFが異なり、スピーカ１１２Ｌと右耳ＥＲとの間のHRTFと、スピーカ１１２Ｒと左耳ＥＬとの間のHRTFが異なる場合、各HRTFの第１ノッチおよび第２ノッチが現れる帯域が、補助信号ＳＬｓｕｂの帯域に少なくとも含まれるようにすればよい。

　また、補助信号生成部１６１Ｌは、必要に応じて、補助信号ＳＬｓｕｂの信号レベルを調整する。そして、補助信号生成部１６１Ｌは、生成した補助信号ＳＬｓｕｂを加算部１６２Ｒに供給する。

　加算部１６２Ｒは、音響信号ＳＲｏｕｔ１に補助信号ＳＬｓｕｂを加算することにより、音響信号ＳＲｏｕｔ２を生成する。加算部１６２Ｒは、生成した音響信号ＳＲｏｕｔ２をスピーカ１１２Ｒに供給する。

　これにより、音響信号ＳＲｏｕｔ１のレベルが音響信号ＳＬｏｕｔ１と比較して小さなものであっても、少なくとも頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチ、並びに、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチが現れる帯域において、音響信号ＳＲｏｕｔ２のレベルは音響信号ＳＬｏｕｔ１に対して有意な大きさになる。一方、頭部音響伝達関数ＨＲの第１ノッチおよび第２ノッチが現れる帯域において、音響信号ＳＲｏｕｔ２のレベルは非常に小さくなる。

　ステップＳ５において、スピーカ１１２Ｌおよびスピーカ１１２Ｒから、それぞれ音響信号ＳＬｏｕｔ１または音響信号ＳＲｏｕｔ２に基づく音が出力される。

　これにより、音源逆側HRTF（頭部音響伝達関数ＨＲ）の第１ノッチおよび第２ノッチの帯域だけに注目すると、スピーカ１１２Ｌ，１１２Ｒの再生音の信号レベルが小さくなり、リスナーＰの両耳に到達する音において、当該帯域のレベルは安定して小さくなる。従って、仮にクロストークが発生したとしても、リスナーＰの影側の耳元において、音源逆側HRTFの第１ノッチおよび第２ノッチが安定して再現される。

　また、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチ、並びに、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチが現れる帯域において、スピーカ１１２Ｌから出力される音およびスピーカ１１２Ｒから出力される音のレベルが互いに有意な大きさになる。従って、リスナーＰの両耳において、頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチ、並びに、頭部音響伝達関数Ｇ２の第１ノッチおよび第２ノッチが互いに打ち消され、現れなくなる。

　従って、スピーカ１１２Ｌと仮想スピーカ１１３が、両耳間軸周りの同じ円の円周上またはその近傍に配置され、音響信号ＳＲｏｕｔ１のレベルが音響信号ＳＬｏｕｔ１と比較して有意に小さくなっても、仮想スピーカ１１３の上下前後の位置を安定させることができる。

　また、上述した特許文献２では、クロストーク補正処理部１３２から出力される音響信号ＳＬｏｕｔ１を用いて補助信号ＳＬｓｕｂが生成されるのに対し、音響信号処理システム１０１Ｌでは、ノッチ形成イコライザ１４１Ｌから出力される音響信号Ｓｉｎ’を用いて補助信号ＳＬｓｕｂが生成される。これにより、音響信号処理システム１０１の構成のバリエーションが広がり、回路設計等が容易になる。

　なお、補助信号ＳＬｓｕｂの影響により、補助信号ＳＬｓｕｂの帯域において音像の大きさが若干ふくらむことも想定される。しかし、補助信号ＳＬｓｕｂが適切なレベルであれば、基本的に音のボディは低域～中域で形成されるため、その影響は軽微である。ただし、補助信号ＳＬｓｕｂのレベルは、仮想スピーカ１１３の定位感を安定させる効果が得られる範囲で、できる限り小さく調整するようにすることが望ましい。

　また、上述したように、バイノーラル信号ＢＲにおいて、音源逆側HRTF（頭部音響伝達関数ＨＲ）において第１ノッチおよび第２ノッチが現れる帯域の成分が小さくなる。従って、最終的にスピーカ１１２Ｒに供給される音響信号ＳＲｏｕｔ２の同帯域の成分も小さくなり、スピーカ１１２Ｒから出力される音の同帯域のレベルも小さくなる。

　しかし、これは、リスナーＰの影側の耳元において、音源逆側HRTFの第１ノッチおよび第２ノッチの帯域のレベルを安定して再現するという点で、悪影響を及ぼすものではない。従って、音響信号処理システム１０１Ｌにおいて、上下前後の定位感を安定させる効果を得ることができる。

　また、リスナーＰの両耳に到達する音において、音源逆側HRTFの第１ノッチおよび第２ノッチの帯域のレベルは元々小さいため、それをさらに小さくしても音質に悪影響を及ぼすものではない。

｛第１の実施の形態の変形例｝
　以下、第１の実施の形態の変形例について説明する。

（ノッチ形成イコライザ１４１に関する変形例）
　例えば、ノッチ形成イコライザ１４１Ｌの位置を変更することが可能である。例えば、ノッチ形成イコライザ１４１Ｌを、バイノーラル信号生成部１４２Ｌと、信号処理部１５１Ｌおよび信号処理部１５２Ｌの前の分岐点との間に配置することができる。また、例えば、ノッチ形成イコライザ１４１Ｌを、信号処理部１５１Ｌと加算部１５３Ｌの間、および、信号処理部１５２Ｌと加算部１５３Ｒの間の２カ所に配置することができる。

　また、ノッチ形成イコライザ１４１Ｒの位置を変更することが可能である。例えば、ノッチ形成イコライザ１４１Ｒを、バイノーラル信号生成部１４２Ｒと、信号処理部１５１Ｒおよび信号処理部１５２Ｒの前の分岐点との間に配置することができる。また、例えば、ノッチ形成イコライザ１４１Ｒを、信号処理部１５１Ｒと加算部１５３Ｒの間、および、信号処理部１５２Ｒと加算部１５３Ｌの間の２カ所に配置することができる。

　さらに、ノッチ形成イコライザ１４１Ｒを削除することも可能である。

　また、例えば、ノッチ形成イコライザ１４１Ｌとノッチ形成イコライザ１４１Ｒを１つにまとめることも可能である。

（補助信号ＳＬｓｕｂに関する変形例）
　例えば、補助信号生成部１６１Ｌは、ノッチ形成イコライザ１４１Ｌから出力される音響信号Ｓｉｎ’以外の信号を用いて、音響信号Ｓｉｎ’を用いた場合と同様の方法により補助信号ＳＬｓｕｂの生成することが可能である。

　例えば、バイノーラル信号生成部１４２Ｌと、加算部１５３Ｌまたは加算部１５３Ｒとの間における信号（例えば、バイノーラル信号ＢＬ、音響信号ＳＬ１、音響信号ＳＬ２）を用いることが可能である。ただし、上述したように、ノッチ形成イコライザ１４１Ｌの位置が変更された場合、ノッチ形成イコライザ１４１Ｌによりノッチ形成処理を行った後の信号が用いられる。

　また、例えば、ノッチ形成イコライザ１４１Ｒから出力される音響信号Ｓｉｎ’を用いることが可能である。

　さらに、例えば、バイノーラル信号生成部１４２Ｒと、加算部１５３Ｌまたは加算部１５３Ｒとの間における信号（例えば、バイノーラル信号ＢＲ、音響信号ＳＲ１、音響信号ＳＲ２）を用いることが可能である。なお、これは、ノッチ形成イコライザ１４１Ｒを削除した場合、または、ノッチ形成イコライザ１４１Ｒの位置を変更した場合も同様である。

　以上のように、ノッチ形成イコライザ１４１Ｌ，１４１Ｒの位置等を変更したり、補助信号ＳＬｓｕｂの生成に用いる信号を変更したりすることにより、音響信号処理システム１０１Ｌの構成のバリエーションが広がり、回路設計等が容易になる。

（リスナーの正中面から右に外れた位置に仮想スピーカを定位させる場合の変形例）
　図５は、本技術の第１の実施の形態の変形例である音響信号処理システム１０１Ｒの機能の構成例を示す図である。なお、図中、図３と対応する部分には同じ符号を付してあり、処理が同じ部分については、その説明は繰り返しになるので適宜省略する。

　音響信号処理システム１０１Ｒは、図３の音響信号処理システム１０１Ｌとは逆に、所定のリスニング位置にいるリスナーＰの正中面から右に外れた位置に仮想スピーカ１１３を定位させるシステムである。この場合、リスナーＰの左耳ＥＬが影側となる。

　音響信号処理システム１０１Ｒは、音響信号処理システム１０１Ｌと比較して、音響信号処理部１１１Ｌの代わりに音響信号処理部１１１Ｒが設けられている点が異なる。音響信号処理部１１１Ｒは、音響信号処理部１１１Ｌと比較して、トランスオーラル処理部１２１Ｌおよび補助信号合成部１２２Ｌの代わりに、トランスオーラル処理部１２１Ｒおよび補助信号合成部１２２Ｒが設けられている点が異なる。トランスオーラル処理部１２１Ｒは、トランスオーラル処理部１２１Ｌと比較して、バイノーラル化処理部１３１Ｌの代わりに、バイノーラル化処理部１３１Ｒが設けられている点が異なる。

　バイノーラル化処理部１３１Ｒは、バイノーラル化処理部１３１Ｌと比較して、ノッチ形成イコライザ１４１Ｌ，１４１Ｒの代わりに、ノッチ形成イコライザ１８１Ｌ，１８１Ｒが設けられている点が異なる。

　ノッチ形成イコライザ１８１Ｌは、音響信号Ｓｉｎの成分のうち、音源逆側HRTF（頭部音響伝達関数ＨＬ）において第１ノッチおよび第２ノッチが現れる帯域の成分を減衰させる処理（ノッチ形成処理）を行う。ノッチ形成イコライザ１８１Ｌは、ノッチ形成処理の結果得られた音響信号Ｓｉｎ’をバイノーラル信号生成部１４２Ｌに供給する。

　ノッチ形成イコライザ１８１Ｒは、ノッチ形成イコライザ１８１Ｌと同様の機能を有しており、音響信号Ｓｉｎの成分のうち、音源逆側HRTF（頭部音響伝達関数ＨＬ）において第１ノッチおよび第２ノッチが現れる帯域の成分を減衰させるノッチ形成処理を行う。ノッチ形成イコライザ１８１Ｒは、その結果得られた音響信号Ｓｉｎ’をバイノーラル信号生成部１４２Ｒおよび補助信号生成部１６１Ｒに供給する。

　補助信号合成部１２２Ｒは、補助信号合成部１２２Ｌと比較して、補助信号生成部１６１Ｌおよび加算部１６２Ｒの代わりに、補助信号生成部１６１Ｒおよび加算部１６２Ｌが設けられている点が異なる。

　補助信号生成部１６１Ｒは、補助信号生成部１６１Ｌと同様の機能を有しており、ノッチ形成イコライザ１４１Ｒから供給される音響信号Ｓｉｎ’の所定の帯域の信号を抽出または減衰することにより補助信号ＳＲｓｕｂを生成し、必要に応じて補助信号ＳＲｓｕｂの信号レベルを調整する。補助信号生成部１６１Ｒは、生成した補助信号ＳＲｓｕｂを加算部１６２Ｌに供給する。

　加算部１６２Ｌは、音響信号ＳＬｏｕｔ１と補助信号ＳＲｓｕｂを加算することにより、音響信号ＳＬｏｕｔ２を生成する。加算部１６２Ｌは、音響信号ＳＬｏｕｔ２をスピーカ１１２Ｌに供給する。

　そして、スピーカ１１２Ｌは、音響信号ＳＬｏｕｔ２に基づく音を出力し、スピーカ１１２Ｒは、音響信号ＳＲｏｕｔ１に基づく音を出力する。

　これにより、音響信号処理システム１０１Ｒは、音響信号処理システム１０１Ｌと同様の方法により、所定のリスニング位置にいるリスナーＰの正中面から右に外れた位置に仮想スピーカ１１３を安定して定位させることができる。

　なお、トランスオーラル処理部１２１Ｒにおいても、図３のトランスオーラル処理部１２１Ｌと同様に、ノッチ形成イコライザ１８１Ｒおよびノッチ形成イコライザ１８１Ｒの位置を変更することが可能である。

　また、例えば、ノッチ形成イコライザ１８１Ｌを削除することも可能である。

　さらに、例えば、ノッチ形成イコライザ１８１Ｌとノッチ形成イコライザ１８１Ｒを１つにまとめることも可能である。

　また、補助信号生成部１６１Ｒも、図３の補助信号生成部１６１Ｌと同様に、補助信号ＳＲｓｕｂの生成に用いる信号を変更することが可能である。

＜３．第２の実施の形態＞
　次に、図６乃至図８を参照して、本技術を適用した音響信号処理システムの第２の実施の形態について説明する。

｛音響信号処理システム３０１Ｌの構成例｝
　図６は、本技術の第２の実施の形態である音響信号処理システム３０１Ｌの機能の構成例を示す図である。なお、図中、図３と対応する部分には、同じ符号を付してあり、処理が同じ部分については、その説明は繰り返しになるので適宜省略する。

　音響信号処理システム３０１Ｌは、図３の音響信号処理システム１０１Ｌと同様に、所定のリスニング位置にいるリスナーＰの正中面から左に外れた位置に仮想スピーカ１１３を定位させることが可能なシステムである。

　音響信号処理システム３０１Ｌは、音響信号処理システム１０１Ｌと比較して、音響信号処理部１１１Ｌの代わりに音響信号処理部３１１Ｌが設けられている点が異なる。音響信号処理部３１１Ｌは、音響信号処理部１１１Ｌと比較して、トランスオーラル処理部１２１Ｌの代わりにトランスオーラル処理部３２１Ｌが設けられている点が異なる。トランスオーラル処理部３２１Ｌは、ノッチ形成イコライザ１４１およびトランスオーラル一体化処理部３３１を含むように構成される。トランスオーラル一体化処理部３３１は、信号処理部３５１Ｌ，３５１Ｒを含むように構成される。

　ノッチ形成イコライザ１４１は、図３のノッチ形成イコライザ１４１Ｌ，１４１Ｒと同様のイコライザである。従って、ノッチ形成イコライザ１４１からは、ノッチ形成イコライザ１４１Ｌ，１４１Ｒと同様の音響信号Ｓｉｎ’が出力され、信号処理部３５１Ｌ，３５１Ｒ、および、補助信号生成部１６１Ｌに供給される。

　トランスオーラル一体化処理部３３１は、音響信号Ｓｉｎ’に対して、バイノーラル化処理およびクロストーク補正処理の一体化処理を行う。例えば、信号処理部３５１Ｌは、音響信号Ｓｉｎ’に対して次式（６）に示される処理を施し、音響信号ＳＬｏｕｔ１を生成する。

　SLout1＝{HL＊f1(G1,G2)＋HR＊f2(G1,G2)}×Sin'　・・・（６）

　この音響信号ＳＬｏｕｔ１は、音響信号処理システム１０１Ｌにおける音響信号ＳＬｏｕｔ１と同じ信号となる。

　同様に、例えば、信号処理部３５１Ｒは、音響信号Ｓｉｎ’に対して次式（７）に示される処理を施し、音響信号ＳＲｏｕｔ１を生成する。

　SRout1＝{HR＊f1(G1,G2)＋HL＊f2(G1,G2)}×Sin'　・・・（７）

　この音響信号ＳＲｏｕｔ１は、音響信号処理システム１０１Ｌにおける音響信号ＳＲｏｕｔ１と同じ信号となる。

　なお、信号処理部３５１Ｌ，３５１Ｒの外側にノッチ形成イコライザ１４１を実装する場合、音源側の音響信号Ｓｉｎだけにノッチ形成処理を行う経路は存在しない。従って、音響信号処理部３１１Ｌでは、信号処理部３５１Ｌおよび信号処理部３５１Ｒの前段にノッチ形成イコライザ１４１を設け、音源側および音源逆側の両方の音響信号Ｓｉｎに対してノッチ形成処理を行い、信号処理部３５１Ｌ，３５１Ｒに供給する。すなわち、音響信号処理システム１０１Ｌと同様に、音源逆側の音響信号Ｓｉｎに対して、実質的に音源逆側HRTFの第１ノッチおよび第２ノッチをさらに深くしたHRTFを重畳することになる。

　しかしながら、上述したように、音源逆側HRTFの第１ノッチおよび第２ノッチをさらに深くしても、上下前後の定位感および音質に悪影響は与えない。

｛音響信号処理システム３０１Ｌによる音響信号処理｝
　次に、図７のフローチャートを参照して、図６の音響信号処理システム３０１Ｌにより実行される音響信号処理について説明する。

　ステップＳ４１において、ノッチ形成イコライザ１４１は、音源側および音源逆側の音響信号Ｓｉｎに音源逆側HRTFのノッチと同帯域のノッチを形成する。すなわち、ノッチ形成イコライザ１４１は、音響信号Ｓｉｎの成分のうち、音源逆側HRTF（頭部音響伝達関数ＨＲ）の第１ノッチおよび第２ノッチと同じ帯域の成分を減衰させる。ノッチ形成イコライザ１４１は、その結果得られた音響信号Ｓｉｎ’を信号処理部３５１Ｌ，３５１Ｒ、および、補助信号生成部１６１Ｌに供給する。

　ステップＳ４２において、トランスオーラル一体化処理部３３１は、トランスオーラル一体化処理を行う。具体的には、信号処理部３５１Ｌは、音響信号Ｓｉｎ’に対して、上述した式（６）で示されるバイノーラル化処理とクロストーク補正処理の一体化処理を行い、音響信号ＳＬｏｕｔ１を生成する。ここで、ノッチ形成イコライザ１４１により、音響信号Ｓｉｎ’の音源逆側HRTFにおいて第１ノッチおよび第２ノッチが現れる帯域の成分が減衰されているため、音響信号ＳＬｏｕｔ１の同帯域の成分も減衰された状態となる。そして、信号処理部３５１Ｌは、音響信号ＳＬｏｕｔ１をスピーカ１１２Ｌに供給する。

　同様に、信号処理部３５１Ｒは、音響信号Ｓｉｎ’に対して、上述した式（７）で示されるバイノーラル化処理とクロストーク補正処理の一体処理を行い、音響信号ＳＲｏｕｔ１を生成する。ここで、音響信号ＳＲｏｕｔ１において、音源逆側HRTFの第１ノッチおよび第２ノッチが現れる帯域の成分が小さくなる。さらに、ノッチ形成イコライザ１４１により、音響信号Ｓｉｎ’の音源逆側HRTFにおいて第１ノッチおよび第２ノッチが現れる帯域の成分が減衰されているため、音響信号ＳＬｏｕｔ１の同帯域の成分がさらに小さくなる。そして、信号処理部３５１Ｒは、音響信号ＳＲｏｕｔ１を加算部１６２Ｒに供給する。

　ステップＳ４３およびＳ４４において、図４のステップＳ４およびＳ５と同様の処理が行われ、音響信号処理は終了する。

　これにより、音響信号処理システム３０１Ｌでも、音響信号処理システム１０１Ｌと同様の理由により、仮想スピーカ１１３の上下前後の定位感を安定させることができる。また、音響信号処理システム１０１Ｌと比較して、一般的に信号処理の負荷を軽減することが期待できる。

　また、上述した特許文献２では、トランスオーラル一体化処理部３３１から出力される音響信号ＳＬｏｕｔ１を用いて補助信号ＳＬｓｕｂが生成されるのに対し、音響信号処理システム３０１Ｌでは、ノッチ形成イコライザ１４１から出力される音響信号Ｓｉｎ’を用いて補助信号ＳＬｓｕｂが生成される。これにより、音響信号処理システム３０１Ｌの構成のバリエーションが広がり、回路設計等が容易になる。

＜第２の実施の形態の変形例＞
　以下、第２の実施の形態の変形例について説明する。

（ノッチ形成イコライザに関する変形例）
　例えば、ノッチ形成イコライザ１４１の位置を変更することが可能である。例えば、ノッチ形成イコライザ１４１を、信号処理部３５１Ｌの後段、および、信号処理部３５１Ｒの後段の２カ所に配置することができる。この場合、補助信号生成部１６１Ｌは、信号処理部３５１Ｌの後段のノッチ形成イコライザ１４１から出力される信号を用いて、音響信号Ｓｉｎ’を用いた場合と同様の方法により補助信号ＳＬｓｕｂを生成することができる。

　このように、ノッチ形成イコライザ１４１の位置を変更したり、補助信号ＳＬｓｕｂの生成に用いる信号を変更したりすることにより、音響信号処理システム３０１Ｌの構成のバリエーションが広がり、回路設計等が容易になる。

（リスナーの正中面から右に外れた位置に仮想スピーカを定位させる場合の変形例）
　図８は、本技術の第２の実施の形態の変形例である音響信号処理システム３０１Ｒの機能の構成例を示す図である。なお、図中、図５および図６と対応する部分には同じ符号を付してあり、処理が同じ部分については、その説明は繰り返しになるので適宜省略する。

　音響信号処理システム３０１Ｒは、図６の音響信号処理システム３０１Ｌと比較して、補助信号合成部１２２Ｌ、および、トランスオーラル処理部３２１Ｌの代わりに、図５の補助信号合成部１２２Ｒ、および、トランスオーラル処理部３２１Ｒが設けられている点が異なる。トランスオーラル処理部３２１Ｒは、トランスオーラル処理部３２１Ｌと比較して、ノッチ形成イコライザ１４１の代わりに、ノッチ形成イコライザ１８１が設けられている点が異なる。

　ノッチ形成イコライザ１８１は、図５のノッチ形成イコライザ１８１Ｌ，１８１Ｒと同様のイコライザである。従って、ノッチ形成イコライザ１８１からは、ノッチ形成イコライザ１８１Ｌ，１８１Ｒと同様の音響信号Ｓｉｎ’が出力され、信号処理部３５１Ｌ，３５１Ｒ、および、補助信号生成部１６１Ｒに供給される。

　これにより、音響信号処理システム３０１Ｒは、音響信号処理システム３０１Ｌと同様の方法により、リスナーＰの正中面から右に外れた位置に仮想スピーカ１１３を安定して定位させることができる。

　なお、トランスオーラル処理部３２１Ｒにおいても、図６のトランスオーラル処理部３２１Ｌと同様に、ノッチ形成イコライザ１８１の位置を変更することが可能である。

＜４．第３の実施の形態＞
　以上の説明では、仮想スピーカ（仮想音源）を１ヶ所のみ生成する例を示したが、２ヶ所以上生成することも可能である。

　例えば、リスナーの正中面を基準にして左右に分かれた位置に１カ所ずつ仮想スピーカを生成することが可能である。この場合、例えば、図３の音響信号処理部１１１Ｌと図５の音響信号処理部１１１Ｒ、または、図６の音響信号処理部３１１Ｌと図８の音響信号処理部３１１Ｒのいずれかの組み合わせで、各音響信号処理部を仮想スピーカ毎に並列に設けるようにすればよい。

　なお、複数の音響信号処理部を並列に設ける場合、各音響信号処理部に対して、それぞれ対応する仮想スピーカに応じた音源側HRTFおよび音源逆側HRTFが適用される。また、各音響信号処理部から出力される音響信号のうち左スピーカ用の音響信号が加算されて左スピーカに供給され、右スピーカ用の音響信号が加算されて右スピーカに供給される。

　図９は、左右のフロントスピーカを使用して所定のリスニング位置の前方左斜め上および右斜め上の２ヶ所の仮想スピーカから仮想的に音を出力できるようにしたオーディオシステム４０１の機能の構成例を模式的に示すブロック図である。

　オーディオシステム４０１は、再生装置４１１、ＡＶ（Audio/Visual）アンプリファイア４１２、フロントスピーカ４１３Ｌ，４１３Ｒ、センタスピーカ４１４、および、リアスピーカ４１５Ｌ，４１５Ｒを含むように構成される。

　再生装置４１１は、前方左、前方右、前方中央、後方左、後方右、前方左上、前方右上の少なくとも６チャンネルの音響信号を再生可能な再生装置である。例えば、再生装置４１１は、記録媒体４０２に記録されている６チャンネルの音響信号を再生することにより得られる前方左用の音響信号ＦＬ、前方右用の音響信号ＦＲ、前方中央用の音響信号Ｃ、後方左用の音響信号ＲＬ、後方右用の音響信号ＲＲ、前方左斜め上用の音響信号ＦＨＬ、および、前方右斜め上用の音響信号ＦＨＲを出力する。

　ＡＶアンプリファイア４１２は、音響信号処理部４２１Ｌ，４２１Ｒ、加算部４２２、および、増幅部４２３を含むように構成される。また、加算部４２２は、加算部４２２Ｌおよび４２２Ｒを含むように構成される。

　音響信号処理部４２１Ｌは、図３の音響信号処理部１１１Ｌ、または、図６の音響信号処理部３１１Ｌにより構成される。音響信号処理部４２１Ｌは、前方左斜め上用の仮想スピーカに対応し、当該仮想スピーカに応じた音源側HRTFおよび音源逆側HRTFが適用される。

　そして、音響信号処理部４２１Ｌは、音響信号ＦＨＬに対して、図４または図７を参照して上述した音響信号処理を行い、その結果得られた音響信号ＦＨＬＬ，ＦＨＬＲを生成する。なお、音響信号ＦＨＬＬは、図３および図６の音響信号ＳＬｏｕｔ１に対応し、音響信号ＦＨＬＲは、図３および図６の音響信号ＳＲｏｕｔ２に対応する。音響信号処理部４２１Ｌは、音響信号ＦＨＬＬを加算部４２２Ｌに供給し、音響信号ＦＨＬＲを加算部４２２Ｒに供給する。

　音響信号処理部４２１Ｒは、図５の音響信号処理部１１１Ｒ、または、図８の音響信号処理部３１１Ｒにより構成される。音響信号処理部４２１Ｒは、前方右斜め上用の仮想スピーカに対応し、当該仮想スピーカに応じた音源側HRTFおよび音源逆側HRTFが適用される。

　そして、音響信号処理部４２１Ｒは、音響信号ＦＨＲに対して、図４または図７を参照して上述した音響信号処理を行い、その結果得られた音響信号ＦＨＲＬ，ＦＨＲＲを生成する。なお、音響信号ＦＨＲＬは、図５および図８の音響信号ＳＬｏｕｔ２に対応し、音響信号ＦＨＲＲは、図５および図８の音響信号ＳＲｏｕｔ１に対応する。音響信号処理部４２１Ｌは、音響信号ＦＨＲＬを加算部４２２Ｌに供給し、音響信号ＦＨＲＲを加算部４２２Ｒに供給する。

　加算部４２２Ｌは、音響信号ＦＬ、音響信号ＦＨＬＬ、および、音響信号ＦＨＲＬを加算することにより音響信号ＦＬＭを生成し、増幅部４２３に供給する。

　加算部４２２Ｒは、音響信号ＦＲ、音響信号ＦＨＬＲ、および、音響信号ＦＨＲＲを加算することにより音響信号ＦＲＭを生成し、増幅部４２３に供給する。

　増幅部４２３は、音響信号ＦＬＭ乃至音響信号ＲＲを増幅し、フロントスピーカ４１３Ｌ乃至リアスピーカ４１５Ｒにそれぞれ供給する。

　フロントスピーカ４１３Ｌとフロントスピーカ４１３Ｒは、例えば、所定のリスニング位置の前方に左右対称に配置される。そして、フロントスピーカ４１３Ｌは、音響信号ＦＬＭに基づく音を出力し、フロントスピーカ４１３Ｒは、音響信号ＦＲＭに基づく音を出力する。これにより、リスニング位置にいるリスナーは、フロントスピーカ４１３Ｌ，４１３Ｒだけでなく、前方左斜め上および前方右斜め上の２ヶ所に仮想的に配置された仮想スピーカからも音が出力されているように感じる。

　センタスピーカ４１４は、例えば、リスニング位置の前方の中央に配置される。そして、センタスピーカ４１４は、音響信号Ｃに基づく音を出力する。

　リアスピーカ４１５Ｌとリアスピーカ４１５Ｒは、例えば、リスニング位置の後方に左右対称に配置される。そして、リアスピーカ４１５Ｌは、音響信号ＲＬに基づく音を出力し、リアスピーカ４１５Ｒは、音響信号ＲＲに基づく音を出力する。

　なお、リスナーの正中面を基準にして同じ側（左側または右側）に、仮想スピーカを２カ所以上生成することも可能である。例えば、リスナーの正中面を基準にして左側に仮想スピーカを２カ所以上生成する場合、音響信号処理部１１１Ｌまたは音響信号処理部３１１Ｌを、仮想スピーカ毎に並列に設けるようにすればよい。この場合、各音響信号処理部から出力される音響信号ＳＬｏｕｔ１が加算されて左スピーカに供給され、各音響信号処理部から出力される音響信号ＳＲｏｕｔ２が加算されて右スピーカに供給される。また、この場合、補助信号合成部１２２Ｌを共有化することが可能である。

　同様に、例えば、リスナーの正中面を基準にして右側に仮想スピーカを２カ所以上生成する場合、音響信号処理部１１１Ｒまたは音響信号処理部３１１Ｒを、仮想スピーカ毎に並列に設けるようにすればよい。この場合、各音響信号処理部から出力される音響信号ＳＬｏｕｔ２が加算されて左スピーカに供給され、各音響信号処理部から出力される音響信号ＳＲｏｕｔ１が加算されて右スピーカに供給される。また、この場合、補助信号合成部１２２Ｒを共有化することが可能である。

　また、音響信号処理部１１１Ｌまたは音響信号処理部１１１Ｒを並列に設ける場合、クロストーク補正処理部１３２を共有化することが可能である。

＜５．変形例＞
　以下、上述した本技術の実施の形態の変形例について説明する。

｛変形例１：音響信号処理部の構成の変形例｝
　例えば、図３および図６の補助信号合成部１２２Ｌの代わりに、図１０の補助信号合成部５０１Ｌを用いるようにしてもよい。なお、図中、図３と対応する部分には、同じ符号を付してあり、処理が同じ部分については、その説明は繰り返しになるので適宜省略する。

　補助信号合成部５０１Ｌは、図３の補助信号合成部１２２Ｌと比較して、遅延部５１１Ｌ，５１１Ｒが追加されている点が異なる。

　遅延部５１１Ｌは、図３のクロストーク補正処理部１３２、または、図６のトランスオーラル一体化処理部３３１から供給される音響信号ＳＬｏｕｔ１を、所定の時間だけ遅延させてからスピーカ１１２Ｌに供給する。

　遅延部５１１Ｒは、図３のクロストーク補正処理部１３２、または、図６のトランスオーラル一体化処理部３３１から供給される音響信号ＳＲｏｕｔ１を、補助信号ＳＬｓｕｂを加算する前に、遅延部５１１Ｌと同じ時間だけ遅延させてから加算部１６２Ｒに供給する。

　遅延部５１１Ｌ，５１１Ｒを設けない場合、音響信号ＳＬｏｕｔ１に基づく音（以下、左主音声と称する）、音響信号ＳＲｏｕｔ１に基づく音（以下、右主音声と称する）、および、補助信号ＳＬｓｕｂに基づく音（以下、補助音声と称する）が、ほぼ同時にスピーカ１１２Ｌ，１１２Ｒから出力される。そして、リスナーＰの左耳ＥＬには、まず左主音声が到達し、その後右主音声および補助音声がほぼ同時に到達する。また、リスナーＰの右耳ＥＲには、まず右主音声および補助音声がほぼ同時に到達し、その後左主音声が到達する。

　これに対して、遅延部５１１Ｌ，５１１Ｒは、補助音声が左主音声より所定の時間（例えば、数ミリ秒）だけ先行してリスナーＰの左耳ＥＬに到達するように調整する。これにより、仮想スピーカ１１３の定位感が向上することが実験で確認されている。これは、いわゆる経時マスキングのうちの順向マスキングにより、リスナーＰの左耳ＥＬにおいて、左主音声に現れる頭部音響伝達関数Ｇ１の第１ノッチおよび第２ノッチが、より確実に補助音声によりマスキングされるためであると考えられる。

　なお、図示は省略するが、図５または図８の補助信号合成部１２２Ｒに対して、図１０の補助信号合成部５０１Ｌと同様に、遅延部を設けることが可能である。すなわち、加算部１６２Ｌの前段に遅延部を設け、加算部１５３Ｒとスピーカ１１２Ｒとの間に遅延部を設けることが可能である。

｛変形例２：仮想スピーカの位置の変形例｝
　本技術は、リスニング位置の正中面から左右に外れた位置に仮想スピーカを配置する全ての場合に有効である。例えば、本技術は、仮想スピーカをリスニング位置の後方の左斜め上または右斜め上に配置する場合にも有効である。また、例えば、本技術は、仮想スピーカをリスニング位置の前方の左斜め下または右斜め下や、リスニング位置の後方の左斜め下または右斜め下に配置する場合にも有効である。さらに、例えば、本技術は、左または右に配置する場合も有効である。

｛変形例３：仮想スピーカの生成に用いるスピーカの配置の変形例｝
　また、以上の説明では、説明を簡単にするために、リスニング位置の前方に左右対称に配置されたスピーカを用いて仮想スピーカを生成する場合について説明した。しかし、本技術では、必ずしもスピーカをリスニング位置の前方に左右対称に配置する必要はなく、例えば、リスニング位置の前方に左右非対称にスピーカを配置することも可能である。また、本技術では、必ずしもスピーカをリスニング位置の前方に配置する必要はなく、リスニング位置の前方以外の場所（例えば、リスニング位置の後方）にスピーカを配置することも可能である。なお、スピーカを配置する場所によって、適宜クロストーク補正処理に用いる関数を変更する必要がある。

　なお、本技術は、例えば、上述したＡＶアンプリファイアなど、仮想サラウンド方式を実現するための各種の機器やシステムに適用することができる。

｛コンピュータの構成例｝
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図１１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）８０１，ROM（Read Only Memory）８０２，RAM（Random Access Memory）８０３は、バス８０４により相互に接続されている。

　バス８０４には、さらに、入出力インタフェース８０５が接続されている。入出力インタフェース８０５には、入力部８０６、出力部８０７、記憶部８０８、通信部８０９、及びドライブ８１０が接続されている。

　入力部８０６は、キーボード、マウス、マイクロフォンなどよりなる。出力部８０７は、ディスプレイ、スピーカなどよりなる。記憶部８０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部８０９は、ネットワークインタフェースなどよりなる。ドライブ８１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア８１１を駆動する。

　以上のように構成されるコンピュータでは、CPU８０１が、例えば、記憶部８０８に記憶されているプログラムを、入出力インタフェース８０５及びバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブルメディア８１１をドライブ８１０に装着することにより、入出力インタフェース８０５を介して、記憶部８０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部８０９で受信し、記憶部８０８にインストールすることができる。その他、プログラムは、ROM８０２や記憶部８０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　さらに、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　さらに、例えば、本技術は以下のような構成も取ることができる。

（１）
　所定のリスニング位置における正中面から左または右に外れた第１の仮想音源用の音響信号である第１の入力信号に対して、前記リスニング位置におけるリスナーの前記第１の仮想音源から遠い方の耳と前記第１の仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記第１の入力信号に対して、前記リスナーの前記第１の仮想音源から近い方の耳と前記第１の仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記第１の入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の第１の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させる第１のトランスオーラル処理部と、
　前記第１の帯域および前記第２の帯域の成分が減衰された前記第１の入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる第１の補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する第１の補助信号合成部と
　を含む音響信号処理装置。
（２）
　前記第１のトランスオーラル処理部は、
　　前記第１の入力信号の前記第１の帯域および前記第２の帯域の成分を減衰させた減衰信号を生成する減衰部と、
　　前記第１の頭部音響伝達関数を前記減衰信号に重畳した前記第１のバイノーラル信号、および、前記第２の頭部音響伝達関数を前記減衰信号に重畳した前記第２のバイノーラル信号を生成する処理、並びに、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対する前記クロストーク補正処理を一体化して行う信号処理部と
　を含み、
　前記第１の補助信号は、前記減衰信号の前記第３の帯域の成分からなる
　前記（１）に記載の音響信号処理装置。
（３）
　前記第１のトランスオーラル処理部は、
　　前記第１の頭部音響伝達関数を前記第１の入力信号に重畳した前記第１のバイノーラル信号を生成する第１のバイノーラル化処理部と、
　　前記第２の頭部音響伝達関数を前記第１の入力信号に重畳した前記第２のバイノーラル信号を生成するとともに、前記第２の頭部音響伝達関数を重畳する前の前記第１の入力信号または前記第２の頭部音響伝達関数を重畳した後の前記第２のバイノーラル信号の前記第１の帯域および前記第２の帯域の成分を減衰させる第２のバイノーラル化処理部と、
　　前記第１のバイノーラル信号および前記第２のバイノーラル信号に対して前記クロストーク補正処理を行うクロストーク補正処理部と
　を含む前記（１）に記載の音響信号処理装置。
（４）
　前記第１のバイノーラル化処理部は、前記第１の頭部音響伝達関数を重畳する前の前記第１の入力信号または前記第１の頭部音響伝達関数を重畳した後の前記第１のバイノーラル信号の前記第１の帯域および前記第２の帯域の成分を減衰させる
　前記（３）に記載の音響信号処理装置。
（５）
　前記第３の帯域は、前記リスニング位置に対して左右に配置された２つのスピーカのうちの一方のスピーカと前記リスナーの一方の耳との間の第３の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第２の周波数以上において最も低い帯域および２番目に低い帯域、前記２つのスピーカのうちの他方のスピーカと前記リスナーの他方の耳との間の第４の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第３の周波数以上において最も低い帯域および２番目に低い帯域、前記一方のスピーカと前記他方の耳との間の第５の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第４の周波数以上において最も低い帯域および２番目に低い帯域、並びに、前記他方のスピーカと前記一方の耳との間の第６の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第５の周波数以上において最も低い帯域および２番目に低い帯域を少なくとも含む
　前記（１）乃至（４）のいずれかに記載の音響信号処理装置。
（６）
　前記第１の補助信号を加算する前に前記第１の音響信号を所定の時間遅延させる第１の遅延部と、
　前記第２の音響信号を前記所定の時間遅延させる第２の遅延部と
　をさらに含む前記（１）乃至（５）のいずれかに記載の音響信号処理装置。
（７）
　前記第１の補助信号合成部は、前記第１の音響信号に加算する前に前記第１の補助信号のレベルを調整する
　前記（１）乃至（６）のいずれかに記載の音響信号処理装置。
（８）
　前記正中面から左または右に外れた第２の仮想音源用の音響信号である第２の入力信号に対して、前記リスナーの前記第２の仮想音源から遠い方の耳と前記第２の仮想音源との間の第７の頭部音響伝達関数を用いて第３のバイノーラル信号を生成し、前記第２の入力信号に対して、前記リスナーの前記第２の仮想音源から近い方の耳と前記第２の仮想音源との間の第８の頭部音響伝達関数を用いて第４のバイノーラル信号を生成し、前記第３のバイノーラル信号および前記第４のバイノーラル信号に対して前記クロストーク補正処理を行うことにより、第４の音響信号および第５の音響信号を生成するとともに、前記第２の入力信号または前記第４のバイノーラル信号において、前記第７の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第６の周波数以上において最も低い第４の帯域および２番目に低い第５の帯域の成分を減衰させることにより、前記第５の音響信号の前記第４の帯域および前記第５の帯域の成分を減衰させる第２のトランスオーラル処理部と、
　前記第４の帯域および前記第５の帯域の成分が減衰された前記第２の入力信号の前記第３の帯域の成分、または、前記第４の帯域および前記第５の帯域の成分が減衰された前記第４のバイノーラル信号の前記第３の帯域の成分からなる第２の補助信号を前記第４の音響信号に加算することにより第６の音響信号を生成する第２の補助信号合成部と、
　前記第１の仮想音源と前記第２の仮想音源が前記正中面を基準にして左右に分かれる場合、前記３の音響信号と前記第５の音響信号を加算し、前記第２の音響信号と前記第６の音響信号を加算し、前記第１の仮想音源と前記第２の仮想音源が前記正中面を基準にして同じ側にある場合、前記第３の音響信号と前記第６の音響信号を加算し、前記第２の音響信号と前記第５の音響信号を加算する加算部と
　をさらに含む前記（１）乃至（７）のいずれかに記載の音響信号処理装置。
（９）
　前記第１の周波数は、前記第１の頭部音響伝達関数の４ｋＨｚ近傍において正のピークが現れる周波数である
　前記（１）乃至（８）のいずれかに記載の音響信号処理装置。
（１０）
　前記クロストーク補正処理は、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対して、前記リスニング位置に対して左右に配置された２つのスピーカのうち前記正中面を基準にして前記第１の仮想音源と逆側にあるスピーカと前記リスナーの前記第１の仮想音源から遠い方の耳との間の音響伝達特性、前記２つのスピーカのうち前記正中面を基準にして前記仮想音源側にあるスピーカと前記リスナーの前記第１の仮想音源から近い方の耳との間の音響伝達特性、前記第１の仮想音源と逆側にあるスピーカから前記リスナーの前記第１の仮想音源から近い方の耳へのクロストーク、および、前記仮想音源側にあるスピーカから前記リスナーの前記第１の仮想音源から遠い方の耳へのクロストークをキャンセルする処理である
　前記（１）乃至（９）のいずれかに記載の音響信号処理装置。
（１１）
　所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させるトランスオーラル処理ステップと、
　前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する補助信号合成ステップと
　を含む音響信号処理方法。
（１２）
　所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させるトランスオーラル処理ステップと、
　前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する補助信号合成ステップと
　を含む処理をコンピュータに実行させるためのプログラム。

　１０１Ｌ，１０１Ｒ　音響信号処理システム，　１１１Ｌ，１１１Ｒ　音響信号処理部，　１１２Ｌ，１１２Ｒ　スピーカ，　１１３　仮想スピーカ，　１２１Ｌ，１２１Ｒ　トランスオーラル処理部，　１２２Ｌ，１２２Ｒ　補助信号合成部，　１３１Ｌ，１３１Ｒ　バイノーラル化処理部，　１３２　クロストーク補正処理部，　１４１，１４１Ｌ，１４１Ｒ　ノッチ形成イコライザ，　１４２Ｌ，１４２Ｒ　バイノーラル信号生成部，　１５１Ｌ乃至１５２Ｒ　信号処理部，　１５３Ｌ，１５３Ｒ　加算部，　１６１Ｌ，１６１Ｒ　補助信号生成部，　１６２Ｌ，１６２Ｒ　加算部，　１８１，１８１Ｌ，１８１Ｒ　ノッチ形成イコライザ，　３０１Ｌ，３０１Ｒ　音響信号処理システム，　３１１Ｌ，３１１Ｒ　音響信号処理部，　３２１Ｌ，３２１Ｒ　トランスオーラル処理部，　３３１　トランスオーラル一体化処理部，　３５１Ｌ，３５１Ｒ　信号処理部，　４０１　オーディオシステム，　４１２　ＡＶアンプリファイア，　４２１Ｌ，４２１Ｒ　音響信号処理部，　４２２Ｌ，４２２Ｒ　加算部，　５０１Ｌ　補助信号合成部，　５１１Ｌ，５１１Ｒ　遅延部，　ＥＬ　左耳，　ＥＲ　右耳，　Ｇ１，Ｇ２，ＨＬ，ＨＲ　頭部音響伝達関数，　Ｐ　リスナー

Claims

　所定のリスニング位置における正中面から左または右に外れた第１の仮想音源用の音響信号である第１の入力信号に対して、前記リスニング位置におけるリスナーの前記第１の仮想音源から遠い方の耳と前記第１の仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記第１の入力信号に対して、前記リスナーの前記第１の仮想音源から近い方の耳と前記第１の仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記第１の入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の第１の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させる第１のトランスオーラル処理部と、
　前記第１の帯域および前記第２の帯域の成分が減衰された前記第１の入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる第１の補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する第１の補助信号合成部と
　を含む音響信号処理装置。
　前記第１のトランスオーラル処理部は、
　　前記第１の入力信号の前記第１の帯域および前記第２の帯域の成分を減衰させた減衰信号を生成する減衰部と、
　　前記第１の頭部音響伝達関数を前記減衰信号に重畳した前記第１のバイノーラル信号、および、前記第２の頭部音響伝達関数を前記減衰信号に重畳した前記第２のバイノーラル信号を生成する処理、並びに、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対する前記クロストーク補正処理を一体化して行う信号処理部と
　を含み、
　前記第１の補助信号は、前記減衰信号の前記第３の帯域の成分からなる
　請求項１に記載の音響信号処理装置。
　前記第１のトランスオーラル処理部は、
　　前記第１の頭部音響伝達関数を前記第１の入力信号に重畳した前記第１のバイノーラル信号を生成する第１のバイノーラル化処理部と、
　　前記第２の頭部音響伝達関数を前記第１の入力信号に重畳した前記第２のバイノーラル信号を生成するとともに、前記第２の頭部音響伝達関数を重畳する前の前記第１の入力信号または前記第２の頭部音響伝達関数を重畳した後の前記第２のバイノーラル信号の前記第１の帯域および前記第２の帯域の成分を減衰させる第２のバイノーラル化処理部と、
　　前記第１のバイノーラル信号および前記第２のバイノーラル信号に対して前記クロストーク補正処理を行うクロストーク補正処理部と
　を含む請求項１に記載の音響信号処理装置。
　前記第１のバイノーラル化処理部は、前記第１の頭部音響伝達関数を重畳する前の前記第１の入力信号または前記第１の頭部音響伝達関数を重畳した後の前記第１のバイノーラル信号の前記第１の帯域および前記第２の帯域の成分を減衰させる
　請求項３に記載の音響信号処理装置。
　前記第３の帯域は、前記リスニング位置に対して左右に配置された２つのスピーカのうちの一方のスピーカと前記リスナーの一方の耳との間の第３の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第２の周波数以上において最も低い帯域および２番目に低い帯域、前記２つのスピーカのうちの他方のスピーカと前記リスナーの他方の耳との間の第４の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第３の周波数以上において最も低い帯域および２番目に低い帯域、前記一方のスピーカと前記他方の耳との間の第５の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第４の周波数以上において最も低い帯域および２番目に低い帯域、並びに、前記他方のスピーカと前記一方の耳との間の第６の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第５の周波数以上において最も低い帯域および２番目に低い帯域を少なくとも含む
　請求項１に記載の音響信号処理装置。
　前記第１の補助信号を加算する前に前記第１の音響信号を所定の時間遅延させる第１の遅延部と、
　前記第２の音響信号を前記所定の時間遅延させる第２の遅延部と
　をさらに含む請求項１に記載の音響信号処理装置。
　前記第１の補助信号合成部は、前記第１の音響信号に加算する前に前記第１の補助信号のレベルを調整する
　請求項１に記載の音響信号処理装置。
　前記正中面から左または右に外れた第２の仮想音源用の音響信号である第２の入力信号に対して、前記リスナーの前記第２の仮想音源から遠い方の耳と前記第２の仮想音源との間の第７の頭部音響伝達関数を用いて第３のバイノーラル信号を生成し、前記第２の入力信号に対して、前記リスナーの前記第２の仮想音源から近い方の耳と前記第２の仮想音源との間の第８の頭部音響伝達関数を用いて第４のバイノーラル信号を生成し、前記第３のバイノーラル信号および前記第４のバイノーラル信号に対して前記クロストーク補正処理を行うことにより、第４の音響信号および第５の音響信号を生成するとともに、前記第２の入力信号または前記第４のバイノーラル信号において、前記第７の頭部音響伝達関数において前記ノッチが現れる帯域のうち所定の第６の周波数以上において最も低い第４の帯域および２番目に低い第５の帯域の成分を減衰させることにより、前記第５の音響信号の前記第４の帯域および前記第５の帯域の成分を減衰させる第２のトランスオーラル処理部と、
　前記第４の帯域および前記第５の帯域の成分が減衰された前記第２の入力信号の前記第３の帯域の成分、または、前記第４の帯域および前記第５の帯域の成分が減衰された前記第４のバイノーラル信号の前記第３の帯域の成分からなる第２の補助信号を前記第４の音響信号に加算することにより第６の音響信号を生成する第２の補助信号合成部と、
　前記第１の仮想音源と前記第２の仮想音源が前記正中面を基準にして左右に分かれる場合、前記３の音響信号と前記第５の音響信号を加算し、前記第２の音響信号と前記第６の音響信号を加算し、前記第１の仮想音源と前記第２の仮想音源が前記正中面を基準にして同じ側にある場合、前記第３の音響信号と前記第６の音響信号を加算し、前記第２の音響信号と前記第５の音響信号を加算する加算部と
　をさらに含む請求項１に記載の音響信号処理装置。
　前記第１の周波数は、前記第１の頭部音響伝達関数の４ｋＨｚ近傍において正のピークが現れる周波数である
　請求項１に記載の音響信号処理装置。
　前記クロストーク補正処理は、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対して、前記リスニング位置に対して左右に配置された２つのスピーカのうち前記正中面を基準にして前記第１の仮想音源と逆側にあるスピーカと前記リスナーの前記第１の仮想音源から遠い方の耳との間の音響伝達特性、前記２つのスピーカのうち前記正中面を基準にして前記仮想音源側にあるスピーカと前記リスナーの前記第１の仮想音源から近い方の耳との間の音響伝達特性、前記第１の仮想音源と逆側にあるスピーカから前記リスナーの前記第１の仮想音源から近い方の耳へのクロストーク、および、前記仮想音源側にあるスピーカから前記リスナーの前記第１の仮想音源から遠い方の耳へのクロストークをキャンセルする処理である
　請求項１に記載の音響信号処理装置。
　所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させるトランスオーラル処理ステップと、
　前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する補助信号合成ステップと
　を含む音響信号処理方法。
　所定のリスニング位置における正中面から左または右に外れた仮想音源用の音響信号である入力信号に対して、前記リスニング位置におけるリスナーの前記仮想音源から遠い方の耳と前記仮想音源との間の第１の頭部音響伝達関数を用いて第１のバイノーラル信号を生成し、前記入力信号に対して、前記リスナーの前記仮想音源から近い方の耳と前記仮想音源との間の第２の頭部音響伝達関数を用いて第２のバイノーラル信号を生成し、前記第１のバイノーラル信号および前記第２のバイノーラル信号に対してクロストーク補正処理を行うことにより、第１の音響信号および第２の音響信号を生成するとともに、前記入力信号または前記第２のバイノーラル信号において、前記第１の頭部音響伝達関数において振幅が所定の深さ以上となる負のピークであるノッチが現れる帯域のうち所定の周波数以上において最も低い第１の帯域および２番目に低い第２の帯域の成分を減衰させることにより、前記第１の音響信号および前記第２の音響信号の前記第１の帯域および前記第２の帯域の成分を減衰させるトランスオーラル処理ステップと、
　前記第１の帯域および前記第２の帯域の成分が減衰された前記入力信号の所定の第３の帯域の成分、または、前記第１の帯域および前記第２の帯域の成分が減衰された前記第２のバイノーラル信号の前記第３の帯域の成分からなる補助信号を前記第１の音響信号に加算することにより第３の音響信号を生成する補助信号合成ステップと
　を含む処理をコンピュータに実行させるためのプログラム。