WO2023106070A1

WO2023106070A1 - 音響処理装置、音響処理方法、及び、プログラム

Info

Publication number: WO2023106070A1
Application number: PCT/JP2022/042915
Authority: WO
Inventors: 成悟榎本; 康太中橋; 智一石川
Original assignee: パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ
Priority date: 2021-12-09
Filing date: 2022-11-18
Publication date: 2023-06-15

Abstract

音響処理装置（１００）は、再生音を含む音情報に対して、情報に含まれる音を、所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成する第１処理部（１２１）と、音情報に対して、情報に含まれる音を、所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成する第２処理部（１３１）と、生成した第１出力音信号と第２出力音信号とを合成した出力音信号を出力するコンバイナ（１５０）と、を備える。

Description

音響処理装置、音響処理方法、及び、プログラム

　本開示は、音響処理装置、ならびに、当該音響再生装置に係る音響処理方法及びプログラムに関する。

　従来、仮想的な三次元空間内で、感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている（例えば、特許文献１参照）。

特開２０２０－１８６２０号公報

　一方で、音を三次元音場内の立体的な音としてユーザに知覚させる際に、ユーザによって知覚されにくい音が発生する場合がある。従来の音響再生装置などにおける情報処理方法では、このような知覚されにくい音に対して、適切な処理がなされていない場合があった。

　上記に鑑みて、本開示は、より適切に立体的な音をユーザに知覚させる音響処理装置等を提供することを目的とする。

　本開示の一態様に係る音響処理装置は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理装置であって、前記再生音を含む音情報に対して、情報に含まれる音を、前記所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成する第１処理部と、前記音情報に対して、情報に含まれる音を、前記所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される前記再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成する第２処理部と、生成した前記第１出力音信号と前記第２出力音信号とを合成した出力音信号を出力するコンバイナと、を備える。

　また、本開示の一態様に係る音響処理方法は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理方法であって、前記再生音を含む音情報に対して、情報に含まれる音を、前記所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成し、前記音情報に対して、情報に含まれる音を、前記所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される前記再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成し、生成した前記第１出力音信号と前記第２出力音信号とを合成した出力音信号を出力する。

　また、本開示の一態様は、上記に記載の音響処理方法をコンピュータに実行させるためのプログラムとして実現することもできる。

　なお、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。

　本開示によれば、より適切に立体的な音をユーザに知覚させることが可能となる。

図１は、実施の形態に係る音響処理装置の使用事例を示す概略図である。図２は、実施の形態に係る音響再生装置の機能構成を示すブロック図である。図３は、実施の形態に係る音響処理装置のより詳細な機能構成を示すブロック図である。図４は、実施の形態に係る音量減衰について説明する図である。図５は、実施の形態に係る音響処理装置によって出力された音の到達方向を説明する図である。図６は、実施の形態に係る音響処理装置の動作を示すフローチャートである。図７は、実施例に係る、適切な第１角度について説明する図である。図８は、実施例に係る、適切な第１遅延時間について説明する図である。図９は、実施例に係る、適切な第１音量減衰について説明する図である。図１０は、実施の形態の変形例に係る音響再生装置の機能構成を示すブロック図である。図１１は、実施の形態の変形例に係る音響処理装置の詳細な機能構成を示すブロック図である。図１２は、実施の形態の変形例に係る、音響処理装置によって出力された音の到達方向を説明する図である。図１３は、実施の形態の変形例に係る音響処理装置の動作を示すフローチャートである。

　（開示の基礎となった知見）
　従来、仮想的な三次元空間内（以下、三次元音場という場合がある）で、ユーザの感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている（例えば、特許文献１参照）。仮想的な三次元空間内における所定位置に音像を定位させることで、ユーザは、当該所定位置とユーザとを結ぶ直線に平行な方向（すなわち所定方向）から到達する音であるかのごとく、この音を知覚することができる。このように仮想的な三次元空間内の所定位置に音像を定位させるには、例えば、収音された音に対して、立体的な音として知覚されるような両耳間での音の到達時間差、及び、両耳間での音のレベル差（又は音圧差）などを生じさせる計算処理が必要となる。

　ここで、近年、通信回線を利用して映像と音声とを双方向に送受信して通信相手とコミュニケーションをとるといった、いわゆるオンライン会議システムが盛んに利用されている。このようなオンライン会議システムでは、ヘッドホンなどの頭部装着型の音響再生装置が用いられることも多い。上記のようなオンライン会議システムに代表されるように、音をヘッドホンで受聴するような場合に、当該音を三次元音場に展開してユーザに知覚させることは困難である。例えば、単に通信相手が表示されている表示装置の方向を音の到達方向として、この方向から到達するように音を知覚させる頭部伝達関数を畳み込むだけでは、十分な頭外感が得られないことが知られている。すなわち、ユーザの頭部内に音像が定位されるため、表示装置の先にいる通信相手の映像と、頭部内に定位された音とに違和感が生じる。そして、このような違和感を抱えたまま、受聴を継続すると、必要以上に疲労してしまうという場合がある。同様の課題は、ＶＲ、ＡＲ等の三次元映像空間を利用したコンテンツの音を、ヘッドホン等の音響再生装置で受聴した場合などにも生じうる。

　従来、ヘッドホンを利用しても音を三次元音場に展開することが可能な技術が知られている。例えば、疑似的な部屋を想定して、反射音がどのように発生するかをシミュレーションすることで、これらの反射音を人為的に作り出して合成し、ユーザに受聴させるという手法がある。すると、ユーザは、合成された反射音を含む音によって、本来の音が疑似的な部屋内で所定方向から到達しているかのように知覚することができる。ただし、この手法では、疑似的な部屋内で発生する反射音を複雑な計算によって算出する必要があり、また、このような反射音を作り出すために、頭部伝達関数の畳み込みを数多く行う必要がある。ある方向から到達する反射音として音を知覚させるための頭部伝達関数を目的の音の信号に対して畳み込む処理は、通常膨大な計算が必要となるため、大規模な計算装置が必要になる。

　一方で、音の信号に時間的な遅延を生じさせ、音量を減衰させるフィルタ処理などによって、反射音に似た音を作り出すことも可能である。ただし、このフィルタ処理は、音を三次元音場に展開できる効果が低く、実用性に欠ける。

　本開示では、上記に鑑みて、ヘッドホン等の音響再生装置を用いて三次元音場内の所定方向からの音として、音をユーザに知覚させる際に、１～数個程度の反射音を作り出して合成することで、大規模な計算装置を必要とせずとも、三次元音場に展開できる効果を十分に得られる音響処理装置について説明する。

　より具体的には、本開示の第１態様に係る音響処理装置は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理装置であって、再生音を含む音情報に対して、情報に含まれる音を、所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成する第１処理部と、音情報に対して、情報に含まれる音を、所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成する第２処理部と、生成した第１出力音信号と第２出力音信号とを合成した出力音信号を出力するコンバイナと、を備える。

　このような音響処理装置では、第２出力音信号が、第１方向から到達し、第１遅延時間、及び、第１音量減衰を有する音として定位されるので、疑似的な反射壁によって再生音が反射された反射音としてユーザに知覚される。このため、直接音としての再生音とともに、第１遅延時間、及び、第１音量減衰を有して反射音が知覚されて、直接音の音像が定位される位置の頭外感が向上される。特に、この処理では、第１出力音信号とともに、少なくとも第２出力音信号が合成されて出力されればよく、第２出力音信号を生成するための計算処理ができれば、直接音の頭外感の向上効果を得ることができる。よって、処理に要する計算コストを低く抑えながら、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第２態様に係る音響処理装置は、出力された出力音信号が、ユーザの頭部に装着されたヘッドホンまたはイヤホンを用いて再生される、第１態様に記載の音響処理装置である。

　これによれば、ユーザの頭部に装着されたヘッドホンまたはイヤホンを用いて、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第３態様に係る音響処理装置は、第１角度が、所定方向との角度が９０度より大きく、２７０度より小さい角度範囲内の角度である、第１又は第２態様に記載の音響処理装置である。

　これによれば、再生音が到達する所定方向がユーザの正面方向と重なるときに、所定方向との角度が９０度より大きく、２７０度より小さい角度範囲は、ユーザの後面側に対応する。したがってユーザが再生音の方向を向いているときに、反射音がユーザの後面側から到達することになる。反射音を定位させる際、反射音そのものの存在を感じにくくするために、ユーザ９９の後面側に定位することが有効であり、上記のようにすることで、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第４態様に係る音響処理装置は、さらに、音情報に対して、情報に含まれる音を、所定方向との角度が０度より大きく３６０度より小さい第２角度であって、第１角度とは異なる第２角度を有する第２方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第２遅延時間、及び、０より大きい第２音量減衰を有する音として定位させるための第３頭部伝達関数を畳み込むことで、第３出力音信号を生成する第３処理部を備え、コンバイナが、第１出力音信号と第２出力音信号と第３出力音信号とを合成した出力音信号を出力する、第１～第３態様のいずれか１態様に記載の音響処理装置である。

　これによれば、第３出力音信号が、第２方向から到達し、第２遅延時間、及び、第２音量減衰を有する音としてさらに定位されるので、疑似的な反射壁によって再生音がさらに反射された反射音としてユーザに知覚される。このため、直接音としての再生音及び第２出力音信号による反射音とともに、第２遅延時間、及び、第２音量減衰を有してさらなる反射音が知覚されて、直接音の音像が定位される位置の頭外感がさらに向上される。このように２つ以上の少ない反射音を生成して知覚させることで、比較的低い計算コストでも高い頭外感の向上効果が得られ、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第５態様に係る音響処理装置は、第２角度が、所定方向との角度が９０度より大きく、２７０度より小さい角度範囲内の角度であり、且つ、３６０度から第２角度を減じた差分角度と第１角度とが一致しない角度である、第４態様に記載の音響処理装置である。

　また、例えば、本開示の第６態様に係る音響処理装置は、第１遅延時間と第２遅延時間とはそれぞれ異なる遅延時間である、第４又は第５態様に記載の音響処理装置である。

　これによれば、第２出力音信号による反射音と、第３出力音信号による反射音とが、同じ一つの反射音として知覚される可能性を低減できるので、２つの反射音によって、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第７態様に係る音響処理装置は、第１音量減衰と第２音量減衰とはそれぞれ異なる音量減衰量である、第４～第６態様のいずれか１態様に記載の音響処理装置である。

　また、例えば、本開示の第８態様に係る音響処理装置は、さらに、情報に含まれる音に対して、当該情報に含まれる残響成分を減少させる残響抑圧処理を行う残響抑圧処理部を備え、音情報が、残響成分を含む原音情報に対して残響抑圧処理が行われることで生成され、原音情報に含まれる音のうち、減少した残響成分以外の音を再生音として含んでいる、第１～第７態様のいずれか１態様に記載の音響処理装置である。

　これによれば、原音情報に残響成分が含まれる場合に、この残響成分を減少させて音情報を生成することができる。そして、音情報から再生音と反射音とを生成して、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第９態様に係る音響処理装置は、さらに、ユーザの頭部の動きを検知するセンサから、センシング結果を取得する取得部を備え、第２処理部が、取得したセンシング結果に基づいて、第１音量減衰の音量減衰量を変化させた第２頭部伝達関数を、音情報に対して畳み込む、第１～第８態様のいずれか１態様に記載の音響処理装置である。

　これによれば、ユーザの頭部の動きに基づいて第２出力音信号における音量減衰量を変化させることができる。例えば、ユーザが頭部を動かすことで、反射音が到達する方向とユーザの正面方向とが近くなったとき、ユーザが反射音そのものの存在を意識してしまい、適切に再生音の頭外感の向上効果を得られない場合がある。この態様によれば、上記の場合に反射音の音量減衰量を増加させる（音量を減衰させる）ことで、ユーザの意識が反射音に向かう可能性を低減できる。よって、より適切に立体的な音をユーザに知覚させることが可能となる。

　また、例えば、本開示の第１０態様に係る音響処理装置は、第１頭部伝達関数が、畳み込まれることで情報に含まれる音を、所定方向から到達し、０以上の第３音量減衰を有する音として定位させ、第１処理部が、第２処理部における第１音量減衰の音量減衰量が増加した場合、第３音量減衰の音量減衰量を減少させた第１頭部伝達関数を、音情報に対して畳み込み、第２処理部における第１音量減衰の音量減衰量が減少した場合、第３音量減衰の音量減衰量を増加させた第１頭部伝達関数を、音情報に対して畳み込む、第９態様に記載の音響処理装置である。

　これによれば、反射音の音量減衰量と同期して再生音の音量減衰量を変化させることができる。具体的には、反射音の音量減衰量が増加した場合（音量が減衰した場合）、再生音の音量減衰量が減少される（音量が増幅される）。また、反射音の音量減衰量が減少した場合（音量が増加した場合）、再生音の音量減衰量が減少される（音量が減少される）。このようにして、三次元音場内における全体としての音量の合計が極端に変化しないように、再生音と反射音とで、互いの音量の補完をすることができる。

　また、例えば、本開示の第１１態様に係る音響処理装置は、さらに、ユーザの頭部の動きを検知するセンサから、センシング結果を取得する取得部を備え、第３処理部が、取得したセンシング結果に基づいて、第２音量減衰の音量減衰量を変化させた第３頭部伝達関数を、音情報に対して畳み込む、第４態様を引用する第５～第１０のいずれか１態様に記載の音響処理装置である。

　これによれば、ユーザの頭部の動きに基づいて第３出力音信号における音量減衰量を変化させることができる。例えば、ユーザが頭部を動かすことで、反射音が到達する方向とユーザの正面方向とが近くなったとき、ユーザが反射音そのものの存在を意識してしまい、適切に再生音の頭外感の向上効果を得られない場合がある。この態様によれば、上記の場合に反射音の音量減衰量を増加させる（音量を減衰させる）ことで、ユーザの意識が反射音に向かう可能性を低減できる。よって、より適切に立体的な音をユーザに知覚させることが可能となる。できる。

　また、例えば、本開示の第１２態様に係る音響処理装置は、第１角度、第１遅延時間、及び、第１音量減衰のうち、少なくとも１つが、ユーザにより調整される、第１～第１１態様のいずれか１態様に記載の音響処理装置である。

　これによれば、第１角度、第１遅延時間、及び、第１音量減衰のうち、少なくとも１つをユーザが自身の感覚に合わせて調整することができる。

　また、例えば、本開示の第１３態様に係る音響処理装置は、第２角度、第２遅延時間、及び、第２音量減衰のうち、少なくとも１つが、ユーザにより調整される、第４態様を引用する第５～第１２のいずれか１態様に記載の音響処理装置である。

　これによれば、第２角度、第２遅延時間、及び、第２音量減衰のうち、少なくとも１つをユーザが自身の感覚に合わせて調整することができる。

　また、例えば、本開示の第１４態様に係る音響処理装置は、音情報が、再生音及び残響成分を含む原音情報に基づいて生成され、第１遅延時間が、再生音に対する残響成分の遅延時間よりも小さい遅延時間である、第１～第１３態様のいずれか１態様に記載の音響処理装置である。

　これによれば、第１出力音信号によってユーザに知覚される音は、元の原音情報の収音環境で発生する残響よりも遅延時間が小さくなるので、第１出力音信号によって知覚される音を、残響のようなノイズとして知覚しにくくなる。つまり、ユーザに対して第１出力音信号によって知覚される音を、反射音として適切に知覚させることができる。

　また、例えば、本開示の第１５態様に係る音響処理装置は、音情報が、再生音及び残響成分を含む原音情報に基づいて生成され、第２遅延時間が、再生音に対する残響成分の遅延時間よりも小さい遅延時間である、第４態様を引用する第５～第１４のいずれか１態様に記載の音響処理装置である。

　これによれば、第２出力音信号によってユーザに知覚される音は、元の原音情報の収音環境で発生する残響よりも遅延時間が小さくなるので、第１出力音信号によって知覚される音を、残響のようなノイズとして知覚しにくくなる。つまり、ユーザに対して第１出力音信号によって知覚される音を、反射音として適切に知覚させることができる。

　また、本開示の第１６態様に係る音響処理方法は、再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理方法であって、再生音を含む音情報に対して、情報に含まれる音を、所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成し、音情報に対して、情報に含まれる音を、所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成し、生成した第１出力音信号と第２出力音信号とを合成した出力音信号を出力する。

　このような音響処理方法では、上記に記載の音響処理装置と同様の効果を奏することができる。

　また、本開示の第１７態様に係るプログラムは、上記に記載の音響処理方法をコンピュータに実行させるためのプログラムである。

　このようなプログラムは、コンピュータを用いて上記に記載の音響処理装置と同様の効果を奏することができる。

　（実施の形態）
　［概要］
　はじめに、実施の形態に係る音響再生装置の概要について説明する。図１は、実施の形態に係る音響再生装置の使用事例を示す概略図である。図１では、（ａ）に２つの例のうちの１つの音響再生装置１００を使用するユーザ９９を、（ｂ）に２つの例のうちの別の１つの音響再生装置１００を使用するユーザ９９を示している。

　図１に示す音響再生装置１００は、上記したように、画像を表示する表示装置や立体映像再生のための装置（いずれも不図示）と同時に使用される。

　音響再生装置１００は、ユーザ９９の頭部に装着される音提示デバイスである。したがって、音響再生装置１００は、ユーザ９９の頭部と一体的に移動する。例えば、本実施の形態における音響再生装置１００は、図１の（ａ）に示すように、いわゆるオーバーイヤーヘッドホン型のデバイスであってもよいし、図１の（ｂ）に示すように、ユーザ９９の左右の耳にそれぞれ独立して装着される２つの耳栓型のデバイス（インナーイヤーヘッドホン型デバイス）であってもよい。この２つのデバイスは、互いに通信することで、右耳用の音と左耳用の音とを同期して提示する。

　なお、本開示の音響再生装置は、オーバーイヤーヘッドホン型デバイス及びインナーイヤーヘッドホン型デバイスなどの頭部装着型の音響再生装置に限られない。例えば、ヘッドレストスピーカのようにスピーカがユーザ９９に装着されていない状態で、ユーザ９９の両耳に近接して設置される音響再生装置などにも適用可能である。

　音響再生装置１００は、ユーザ９９の頭部の動きに応じて提示する音を変化させることで、ユーザ９９が三次元音場内で頭部を動かしているようにユーザ９９に知覚させる。このため、上記したように、音響再生装置１００は、ユーザ９９の動きに対して三次元音場をユーザの動きとは逆方向に移動させる。

　［構成］
　次に、図２及び図３を参照して、本実施の形態に係る音響再生装置１００の構成について説明する。図２は、実施の形態に係る音響再生装置の機能構成を示すブロック図である。また、図３は、実施の形態に係る音響処理装置のより詳細な機能構成を示すブロック図である。

　図２に示すように、本実施の形態に係る音響再生装置１００は、音響処理装置１０１と、通信モジュール１０２と、センサ１０３と、ドライバ１０４と、を備える。

　音響処理装置１０１は、音響再生装置１００における各種の信号処理を行うための演算装置である、音響処理装置１０１は、例えば、プロセッサとメモリとを備え、メモリに記憶されたプログラムがプロセッサによって実行されることで、各種の機能を発揮する。

　音響処理装置１０１は、取得部１１１、第１処理部１２１、第２処理部１３１、及び、コンバイナ１５０を有する。取得部１１１については、通信モジュール１０２の説明と併せて、コンバイナ１５０については、ドライバ１０４の説明と併せてそれぞれ後述する。

　第１処理部１２１は、再生音の出力音信号を生成する。第１処理部１２１は、情報に含まれる音を、所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成する機能部である。第１処理部１２１では、入力された音の情報に対して、音を所定方向に定位させるための頭部伝達関数の畳み込みを行い、音量減衰α（第３音量減衰）を介して、減衰された第１出力音信号を出力する。このような、第１処理部１２１による処理を総じて、第１頭部伝達関数の畳み込みと解される。第１出力音信号は、第１ＥＱ１２２に入力されて、低域及び高域の音の調整が行われたうえでコンバイナ１５０に供される。

　第２処理部１３１は、第１の反射音の出力音信号を生成する。第２処理部１３１は、情報に含まれる音を、所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成する機能部である。第２処理部１３１では、入力された音の情報に対して、音を第１方向に定位させるための頭部伝達関数の畳み込みを行い、音量減衰β（第１音量減衰）を介して、減衰された第２出力音信号を出力する。このような、第２処理部１３１による処理を総じて、第２頭部伝達関数の畳み込みと解される。第２出力音信号は、第２ＥＱ１３２に入力されて、低域及び高域の音の調整が行われたうえでコンバイナ１５０に供される。なお、音の情報には、第２処理部１３１に入力される前に、第１角度決定部１３０によって、その後に畳み込まれる頭部伝達関数を指定する情報が付加される。

　通信モジュール１０２は、音響再生装置１００への音情報の入力を受け付けるためのインタフェース装置である。通信モジュール１０２は、例えば、アンテナと信号変換器とを備え、無線通信により外部の装置から音情報を受信する。より詳しくは、通信モジュール１０２は、無線通信のための形式に変換された音情報を示す無線信号を、アンテナを用いて受波し、信号変換器により無線信号から音情報への再変換を行う。これにより、音響再生装置１００は、外部の装置から無線通信により音情報を取得する。通信モジュール１０２によって取得された音情報は、取得部１１１によって取得される。このようにして音情報は、音響処理装置１０１に入力される。なお、音響再生装置１００と外部の装置との通信は、有線通信によって行われてもよい。

　また、音響処理装置１０１は、図３に示す残響抑圧処理部１２０を備える。反射音を生成して合成する際に、元の音に残響成分、すなわち、音の収音環境において反射などで遅れて収音器に入力された音の成分が含まれると、反射音を合成したことによる音の頭外感の向上効果が低減される。このため、音響処理装置１０１では、残響抑圧処理部１２０によって、情報に含まれる音に対して、当該情報に含まれる残響成分を減少させる残響抑圧処理を行う。再生対象の再生音と、残響成分とを含む原音情報から、残響抑圧処理を行うことで、原音情報に含まれる音のうち、減少した残響成分以外の音を再生音として含んでいる音情報を生成して、第１処理部１２１、及び、第２処理部１３１に入力することができる。残響抑圧処理部１２０は、取得部１１１の前段に挿入されていてもよいし、取得部１１１の後段に挿入されていてもよい。

　音響再生装置１００が取得する音情報は、例えば、ＭＰＥＧ－Ｈ　３Ｄ　Ａｕｄｉｏ（ＩＳＯ／ＩＥＣ　２３００８－３）等の所定の形式で符号化されている。一例として、符号化された音情報には、音響再生装置１００によって再生される再生音についての情報と、当該音の音像を三次元音場内において所定位置に定位させる（つまり所定方向から到達する音として知覚させる）際の定位位置に関する情報、すなわち所定方向に関する情報とが含まれる。例えば、音情報には第１の再生音及び第２の再生音を含む複数の音に関する情報が含まれ、それぞれの音が再生された際の音像を三次元音場内における異なる方向から到達する音として知覚させるように音像を定位させる。

　この立体的な音によって、例えば、表示装置を用いて視認される画像と併せて、視聴されるコンテンツなどの臨場感を向上することができる。なお、音情報には、再生音についての情報のみが含まれていてもよい。この場合、所定方向に関する情報を別途取得してもよい。また、上記したように、音情報は、第１の再生音に関する第１音情報、及び、第２の再生音に関する第２音情報を含むが、これらを別個に含む複数の音情報をそれぞれ取得し、同時に再生することで三次元音場内における異なる位置に音像を定位させてもよい。このように、入力される音情報の形態に特に限定はなく、音響再生装置１００（特に、音響処理装置１０１）に各種の形態の音情報に応じた取得部１１１が備えられればよい。

　本実施の形態における取得部１１１は、例えば、エンコード音情報入力部、デコード処理部、及び、センシング情報入力部を備える。

　エンコード音情報入力部は、取得部１１１が取得した、符号化された（言い換えるとエンコードされている）音情報が入力される処理部である。エンコード音情報入力部は、入力された音情報をデコード処理部へと出力する。デコード処理部は、エンコード音情報入力部から出力された音情報を復号する（言い換えるとデコードする）ことにより音情報に含まれる所定音に関する情報と、所定方向に関する情報とを、以降の処理に用いられる形式で生成する処理部である。センシング情報入力部については、センサ１０３の機能とともに、以下に説明する。

　センサ１０３は、ユーザ９９の頭部の動き速度を検知するための装置である。センサ１０３は、ジャイロセンサ、加速度センサなど動きの検知に使用される各種のセンサを組み合わせて構成される。本実施の形態では、センサ１０３は、音響再生装置１００に内蔵されているが、例えば、音響再生装置１００と同様にユーザ９９の頭部の動きに応じて動作する立体映像再生装置等、外部の装置に内蔵されていてもよい。この場合、センサ１０３は、音響再生装置１００に含まれなくてもよい。また、センサ１０３として、外部の撮像装置などを用いて、ユーザ９９の頭部の動きを撮像し、撮像された画像を処理することでユーザ９９の頭部の動きを検知してもよい。

　センサ１０３は、例えば、音響再生装置１００の筐体に一体的に固定され、筐体の動きの速度を検知する。上記の筐体を含む音響再生装置１００は、ユーザ９９が装着した後、ユーザ９９の頭部と一体的に移動するため、センサ１０３は、結果としてユーザ９９の頭部の動きの速度を検知することができる。

　センサ１０３は、例えば、ユーザ９９の頭部の動きの量として、三次元空間内で互いに直交する３軸の少なくとも一つを回転軸とする回転量を検知してもよいし、上記３軸の少なくとも一つを変位方向とする変位量を検知してもよい。また、センサ１０３は、ユーザ９９の頭部の動きの量として、回転量及び変位量の両方を検知してもよい。

　取得部１１１のセンシング情報入力部は、センサ１０３からユーザ９９の頭部の動き速度を取得する。より具体的には、センシング情報入力部は、単位時間あたりにセンサ１０３が検知したユーザ９９の頭部の動きの量を動きの速度として取得する。このようにしてセンシング情報入力部は、センサ１０３からセンシング結果として回転速度及び変位速度の少なくとも一方を取得する。ここで取得されるユーザ９９の頭部の動きの量は、三次元音場内のユーザ９９の座標及び向きを決定するために用いられる。音響再生装置１００では、決定されたユーザ９９の座標及び向きに基づいて、音像の相対的な位置を決定して音が再生される。

　さらに、本実施の形態では、取得部１１１のセンシング情報入力部がセンサ１０３から取得したセンシング結果を、音量減衰α、及び、音量減衰βの音量減衰量の制御に用いる。つまり、センシング結果に応じて、音量減衰α、及び、音量減衰βの音量減衰量が自動的に変化する。これは、ユーザ９９が反射音の方向に向いたときに、その方向からの反射音が明確に鳴っていると、ユーザ９９が違和感を抱く可能性があるためである。したがって、ユーザ９９が頭部を回転させた際に、ユーザ９９の正面方向が反射音の方向に近づくにつれて、反射音の音量を減衰させるように制御する。これと同時に、全体としての音量が変化しないように、再生音の音量を増幅させる（音量減衰量を減少させる）ことを同時に行う。つまり、第１処理部１２１は、第２処理部１３１における音量減衰βの音量減衰量が増加した場合、音量減衰αの音量減衰量を減少させ、第２処理部１３１における音量減衰βの音量減衰量が減少した場合、音量減衰αの音量減衰量を増加させる。

　図４は、実施の形態に係る音量減衰について説明する図である。図中では、ユーザ９９の頭部の上下方向に平行な軸周りにユーザ９９の頭部が回転した際の回転角（ヨー角）に対する、音量減衰αの音量減衰量（破線）、及び、音量減衰βの音量減衰量（実線）を示している。なお、ここでの第１角度は、１２０度に設定されている。ここでは、下記式（１）に基づいて、音量減衰αの音量減衰量、及び、音量減衰βの音量減衰量が算出されている。

　なお、上記式中のαは、音量減衰αの音量減衰量（ゲイン）を示し、上記式中のβは、音量減衰βの音量減衰量（ゲイン）を示している。この例では、所定方向との角度が１２０度の方向に設定された反射音に対して、ユーザ９９がその半分の６０度の方向まで頭部を回転させると反射音がなくなることが分かる。このようにして、音響処理装置１０１では、反射音そのものが違和感の要因とならないように、適宜再生音及び反射音の音量減衰量が変化される。上記式（１）を用いて説明した音量減衰α及び音量減衰βの関係は一例であり、反射音の方向に向かってユーザ９９が頭部を回転させるほど、反射音の音量減衰量が増加されれば、どのような関係が用いられてもよい。また、以上の関係は、音量減衰α及び音量減衰βの関係だけでなく、音量減衰γを有する他の反射音（変形例にて後述する）を生成する場合の音量減衰α及び音量減衰γの関係についても成立してもよい。

　コンバイナ１５０は、生成された出力音信号を合成してドライバ１０４へと出力する機能部である。コンバイナ１５０は、第１出力音信号、及び、第２出力音信号を加算することによって合成した出力音信号を出力する。コンバイナ１５０は、さらに、出力音信号に基づいてデジタル信号からアナログ信号への信号変換などを行うことで、波形信号を生成し、波形信号に基づいてドライバ１０４に音波を発生させ、ユーザ９９に音を提示する。ドライバ１０４は、例えば、振動板とマグネット及びボイスコイルなどの駆動機構とを有する。ドライバ１０４は、波形信号に応じて駆動機構を動作させ、駆動機構によって振動板を振動させる。このようにして、ドライバ１０４は、出力音信号に応じた振動板の振動により、音波を発生させ、音波が空気を伝播してユーザ９９の耳に伝達し、ユーザ９９が音を知覚する。

　以上のようにしてコンバイナ１５０から出力された出力音信号がドライバ１０４によって再生されると、図５のような音場が形成される。図５は、実施の形態に係る、音響処理装置によって出力された音の到達方向を説明する図である。図５では、ユーザ９９の頭部の上下方向に沿う方向から仮想的な三次元音場を平面視した図を示している。図５では、紙面上方向を正面とした姿勢のユーザ９９を示しており、このユーザ９９は、紙面に垂直な方向に直立の姿勢でいる。そして、ユーザ９９の正面方向に、再生音が定位される所定方向が設定されている。なお、再生音が定位されている位置Ｐ１を、黒丸印として示しており、仮想的なスピーカが併せて示されている。

　図示するように、所定方向から時計回りに第１角度を有する方向に、第１の反射音が定位されている（位置Ｐ２）。

　また、図中のユーザ９９の左右に延びる１点鎖線は、ユーザ９９の頭部を前後に分ける仮想的な境界面を示している。この境界面は、ユーザ９９の外耳道に沿う面であってもよいし、ユーザ９９の耳殻の最後端の点を通る面であってもよいし、単にユーザ９９の頭部の重心を通る面であってもよい。このような境界面の前後において、つまり、ユーザ９９の前後で音の聞き取りやすさに差があることが知られる。反射音を定位させる際、反射音そのものの存在を感じにくくするために、ユーザ９９の後面側に定位することが有効である。したがって、第１角度は、所定方向との角度が９０度より大きく、２７０度より小さい角度範囲内の角度に設定されるとよい。

　なお、以上に説明した第１角度、第１遅延時間、及び、第１音量減衰は、音響処理装置１０１によってあらかじめ設定された数値か、センサ１０３によるセンシング結果に応じて変化する数値であるとして説明したが、これらのうち、少なくとも１つは、ユーザ９９が任意に入力した数値によって調整可能に構成されてもよい。つまり、音響処理装置１０１は、第１角度、第１遅延時間、及び、第１音量減衰の少なくとも１つを調整するためのユーザ９９による入力を受け付けてもよい。

　［動作］
　次に、図６を参照して、上記に説明した音響再生装置１００の動作について説明する。図６は、実施の形態に係る音響処理装置の動作を示すフローチャートである。まず、音響再生装置１００の動作が開始されると、取得部１１１が通信モジュール１０２を介して原音情報を取得する。原音情報には、再生音の他に残響成分が含まれているため、残響抑圧処理部１２０によって残響成分が減少された再生音を含む音情報が生成される。

　第１処理部１２１は、音情報に対して、情報に含まれる音を、所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成する（Ｓ１０１）。次に、第２処理部１３１は、音情報に対して、情報に含まれる音を、第１方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成する（Ｓ１０２）。

　以上のステップＳ１０１及びステップＳ１０２は、実行される順序が入れ替えられてもよく、並列に実行されてもよい。そして、コンバイナ１５０は、生成された第１出力音信号、及び、第２出力音信号を合成し、合成した出力音信号を出力する（ステップＳ１０３）。このようにして出力された出力音信号がドライバ１０４によって再生されることで、再生音に、反射音が重畳されて三次元的な音としてユーザ９９に知覚される。特に、反射音を１つしか生成していないので、大規模な演算装置などは必要なく、効果的な立体音響をユーザ９９に知覚させることができる。

　［実施例］
　図７は、実施の形態に係る、適切な第１角度について説明する図である。図８は、実施例に係る、適切な第１遅延時間について説明する図である。図９は、実施例に係る、適切な第１音量減衰について説明する図である。

　図７では、第１角度を０度から１８０度まで振ったときの被験者によって知覚された音像位置までの距離（知覚距離）、つまり、所定方向にどの程度離れて聞こえたかを示している。知覚距離は、大きいほど、頭外感が強く、効果的に三次元的な音を知覚させることができているといえる。なお、ここでは、第１音量減衰量が－３ｄＢ、第１遅延時間が２．２ｍｓの条件に設定している。図７に示すように、１０５度又は１２０度の方向に第１方向を設定することで高い頭外感が得られている。

　また、図８では、第１遅延時間を０ｍｓから３．４ｍｓまで振ったときの被験者によって知覚された知覚距離を示している。なお、ここでは、第１音量減衰量が－３ｄＢ、第１角度が１０５度の条件に設定している。図８に示すように、２．４ｍｓから２．８ｍｓに第１遅延時間を設定することで高い頭外感が得られ、１．８ｍｓから３．０ｍｓに第１遅延時間を設定することで十分な頭外感が得られている。ただし、遅延時間の増加は、音質の劣化に繋がるため、比較的短い第１遅延時間が適切である。したがって、１．８ｍｓから２．４ｍｓ、例えば、２．２ｍｓ等に第１遅延時間を設定するとよい。

　また、図９では、第１音量減衰の音量減衰量を－３０ｄＢから０ｄＢまで振ったときの被験者によって知覚された知覚距離を示している。なお、ここでは、第１遅延時間が２．２ｍｓ、第１角度が１０５度の条件に設定している。図９に示すように、－５ｄＢ～－３ｄＢに第１音量減衰の音量減衰量を設定することで高い頭外感が得られ、－３ｄＢ以上の音量減衰量を設定してもそれ以上の頭外感の向上は見られなかった。なお、大音量の反射音は、音質の劣化の要因となるため、音量減衰量は可能な限り小さい方がよいと考えられる。

　［変形例］
　次に、以上に説明した実施の形態の変形例に係る音響処理装置について説明する。以下説明される変形例では、上記に説明した実施の形態と実質的に同一の構成について、上記の説明を参照することで、ここでの説明を省略する。図１０は、実施の形態の変形例に係る音響再生装置の機能構成を示すブロック図である。図１１は、実施の形態の変形例に係る音響処理装置の詳細な機能構成を示すブロック図である。図１０及び図１１に示すように、変形例に係る音響再生装置１００ａは、音響処理装置１０１ａを備える。また、音響処理装置１０１ａは、第３処理部１４１を有する点で上記の実施の形態に係る音響処理装置１０１の構成と異なっている。

　第３処理部１４１は、第２の反射音の出力音信号を生成する。第３処理部１４１は、情報に含まれる音を、所定方向との角度が０度より大きく３６０度より小さい第２角度であって、第１角度とは異なる第２角度を有する第２方向から到達し、第１出力音信号によって知覚される再生音に対して０より大きい第２遅延時間であって、第１遅延時間とは異なる第２遅延時間、及び、０より大きい第２音量減衰であって、第１音量減衰とは異なる第２音量減衰を有する音として定位させるための第３頭部伝達関数を畳み込むことで、第３出力音信号を生成する機能部である。第３処理部１４１では、入力された音の情報に対して、音を第２方向に定位させるための頭部伝達関数の畳み込みを行い、音量減衰γ（第３音量減衰）を介して、減衰された第３出力音信号を出力する。このような第３処理部１４１による処理を総じて、第３頭部伝達関数の畳み込みと解される。第３出力音信号は、第３ＥＱ１４２に入力されて、低域及び高域の音の調整が行われたうえでコンバイナ１５０に供される。なお、音の情報には、第３処理部１４１に入力される前に、第２角度決定部１４０によって、その後に畳み込まれる頭部伝達関数を指定する情報が付加される。

　コンバイナ１５０は、生成された出力音信号を合成してドライバ１０４へと出力する機能部である。コンバイナ１５０は、第１出力音信号、第２出力音信号、及び、第３出力音信号を加算することによって合成した出力音信号を出力する。つまり、音響処理装置１０１ａは、第２処理部１３１及び第３処理部１４１のそれぞれが異なる２つの反射音を生成し、コンバイナ１５０がこれらを再生音に重畳させる。本変形例のように、反射音を２つ生成して再生音に重畳させる場合、条件により三次元音場に展開する効果をより向上させることが可能となる。

　以上のようにしてコンバイナ１５０から出力された出力音信号がドライバ１０４によって再生されると、図１２のような音場が形成される。図１２は、実施の形態に係る、音響処理装置によって出力された音の到達方向を説明する図である。図１２では、図５と同様の視点における仮想的な三次元音場を平面視した図を示している。

　図示するように、所定方向から時計回りに第１角度を有する方向に、第１の反射音が定位されている（位置Ｐ２）。そして、所定方向から時計回りに第２角度を有する方向に、第２の反射音が定位されている（位置Ｐ３）。図中に示すように、第１角度と第２角度とは一致しておらず、また、ユーザ９９の正面奥に平行（所定方向にも平行）な２点鎖線に対して、線対称な方向になっていない。仮に、第１方向と第２方向とが線対称となる場合、条件によっては、２つの反射音が重畳されてユーザ９９の背後に１つの反射音として定位されてしまうことがある。したがって、第２角度は、３６０度から第２角度を減じた差分角度が、第１角度と一致しない角度になっている。

　また、図中に示すように、第１角度及び第２角度は、ユーザ９９の頭部を前後に分ける仮想的な境界面よりもユーザ９９の後面側に定位されている。したがって、第１角度及び第２角度は、いずれも所定方向との角度が９０度より大きく、２７０度より小さい角度範囲内の角度に設定されている。

　なお、以上に説明した第２角度、第２遅延時間、及び、第２音量減衰は、第１角度、第１遅延時間、及び、第１音量減衰と同様に音響処理装置１０１ａによってあらかじめ設定された数値か、センサ１０３によるセンシング結果に応じて変化する数値であるが、これらのうち、少なくとも１つは、ユーザ９９が任意に入力した数値によって調整可能に構成されてもよい。つまり、音響処理装置１０１ａは、第２角度、第２遅延時間、及び、第２音量減衰の少なくとも１つを調整するためのユーザ９９による入力を受け付けてもよい。

　［動作］
　次に、図１３を参照して、上記に説明した音響再生装置１００ａの動作について説明する。図１３は、実施の形態に係る音響処理装置の動作を示すフローチャートである。まず、図６を参照して説明した、音響処理装置１０１の動作と同様に、ステップＳ１０１及びステップＳ１０２が実施される。次に、第３処理部１４１は、音情報に対して、情報に含まれる音を、第２方向から到達し、第１出力音信号によって知覚される前記再生音に対して０より大きい第２遅延時間、及び、０より大きい第２音量減衰を有する音として定位させるための第３頭部伝達関数を畳み込むことで、第３出力音信号を生成する（Ｓ２０１）。

　以上のステップＳ１０１、ステップＳ１０２、及び、ステップＳ２０１は、実行される順序が入れ替えられてもよく、並列に実行されてもよい。そして、コンバイナ１５０は、生成された第１出力音信号、第２出力音信号、及び、第３出力音信号を合成し、合成した出力音信号を出力する（ステップＳ２０２）。このようにして出力された出力音信号がドライバ１０４によって再生されることで、再生音に、反射音が重畳されて三次元的な音としてユーザ９９に知覚される。特に、反射音を２つしか生成していないので、この場合も大規模な演算装置などは必要なく、効果的な立体音響をユーザ９９に知覚させることができる。

　なお、処理部をさらに増やして、３つ以上の反射音を再生音に重畳させてもよい。

　（その他の実施の形態）
　以上、実施の形態について説明したが、本開示は、上記の実施の形態に限定されるものではない。

　例えば、上記の実施の形態では、ユーザの頭部の動きに音が追従しない例を説明したが、本開示の内容は、ユーザの頭部の動きに音が追従する場合においても有効である。つまり、ユーザの頭部の動きとともに相対的に移動する第１位置から到達する音として所定音をユーザに知覚させる動作の中で、所定音の到達方向の変動量が閾値より小さい場合に、立体音響フィルタを選択して、変動が強調されるようにしてもよい。

　また、例えば、上記の実施の形態に説明した音響再生装置は、構成要素をすべて備える一つの装置として実現されてもよいし、複数の装置に各機能が割り振られ、この複数の装置が連携することで実現されてもよい。後者の場合には、処理モジュールに該当する装置として、スマートフォン、タブレット端末、又は、ＰＣなどの情報処理装置が用いられてもよい。

　上記実施の形態の説明と異なる構成として例えば、デコード処理部によって、元の音情報を補正することにより、変更された立体音響フィルタを選択させることもできる。具体的には、本例におけるデコード処理部は、音情報に含まれる所定方向に関する情報を生成するとともに、元の音情報の補正を行う処理部である。デコード処理部は、時間軸上での所定方向の変動の角度量を算出し、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、所定方向に関する情報を補正する。これにより、デコード処理部から出力された補正後の所定方向に関する情報に基づいて、所定音が到達する到達方向を規定する立体音響フィルタが選択されるだけで、上記の実施の形態における変更後の立体音響フィルタが適用されることとなる。

　このように、本願開示の情報処理方法等を、元の音情報における所定方向に関する情報を補正することによって実現してもよい。上記のようなデコード処理部は、例えば、従来の立体音響再生装置のデコード処理を行う処理部と入れ替えて挿入するだけで、本願開示と同様の効果を奏することができる音響再生装置を実現することができる。

　また、本開示の音響再生装置は、ドライバのみを備える再生装置に接続され、当該再生装置に対して、取得した音情報に基づいて選択が行われた立体音響フィルタを用いて出力音信号を出力するのみの音響処理装置として実現することもできる。この場合、音響処理装置は、専用の回路を備えるハードウェアとして実現してもよいし、汎用のプロセッサに特定の処理を実行させるためのソフトウェアとして実現してもよい。

　また、上記の実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。

　また、上記の実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵ又はプロセッサなどのプログラム実行部が、ハードディスク又は半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

　また、各構成要素は、ハードウェアによって実現されてもよい。例えば、各構成要素は、回路（又は集積回路）でもよい。これらの回路は、全体として１つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。

　また、本開示の全般的又は具体的な態様は、装置、装置、方法、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよい。また、本開示の全般的又は具体的な態様は、装置、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

　例えば、本開示は、コンピュータによって実行される音声信号再生方法として実現されてもよいし、音声信号再生方法コンピュータに実行させるためのプログラムとして実現されてもよい。本開示は、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。

　その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、又は、本開示の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本開示に含まれる。

　本開示は、立体的な音をユーザに知覚させる等の音響再生の際に有用である。

　　　９９　ユーザ
　　１００、１００ａ　音響再生装置
　　１０１、１０１ａ　音響処理装置
　　１０２　通信モジュール
　　１０３　センサ
　　１０４　ドライバ
　　１１１　取得部
　　１２０　残響抑圧処理部
　　１２１　第１処理部
　　１２２　第１ＥＱ
　　１３０　第１角度決定部
　　１３１　第２処理部
　　１３２　第２ＥＱ
　　１４０　第２角度決定部
　　１４１　第３処理部
　　１４２　第３ＥＱ
　　１５０　コンバイナ
　　２００　立体映像再生装置
　　　Ｓ１　第１位置
　　　Ｓ１ａ　第２位置
　　　Ｓ１ｂ　第３位置
　　　Ｓ１ｃ　第７位置
　　　Ｓ２　第４位置
　　　Ｓ２ａ　第５位置
　　　Ｓ２ｂ　第６位置

Claims

　再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理装置であって、
　前記再生音を含む音情報に対して、情報に含まれる音を、前記所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成する第１処理部と、
　前記音情報に対して、情報に含まれる音を、前記所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される前記再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成する第２処理部と、
　生成した前記第１出力音信号と前記第２出力音信号とを合成した出力音信号を出力するコンバイナと、を備える、
　音響処理装置。
　出力された前記出力音信号は、ユーザの頭部に装着されたヘッドホンまたはイヤホンを用いて再生される、
　請求項１に記載の音響処理装置。
　前記第１角度は、前記所定方向との角度が９０度より大きく、２７０度より小さい角度範囲内の角度である、
　請求項１に記載の音響処理装置。
　さらに、前記音情報に対して、情報に含まれる音を、前記所定方向との角度が０度より大きく３６０度より小さい第２角度であって、前記第１角度とは異なる第２角度を有する第２方向から到達し、第１出力音信号によって知覚される前記再生音に対して０より大きい第２遅延時間、及び、０より大きい第２音量減衰を有する音として定位させるための第３頭部伝達関数を畳み込むことで、第３出力音信号を生成する第３処理部を備え、
　前記コンバイナは、前記第１出力音信号と前記第２出力音信号と前記第３出力音信号とを合成した前記出力音信号を出力する、
　請求項１に記載の音響処理装置。
　前記第２角度は、前記所定方向との角度が９０度より大きく、２７０度より小さい角度範囲内の角度であり、且つ、３６０度から前記第２角度を減じた差分角度と前記第１角度とが一致しない角度である、
　請求項４に記載の音響処理装置。
　前記第１遅延時間と前記第２遅延時間とはそれぞれ異なる遅延時間である、
　請求項４に記載の音響処理装置。
　前記第１音量減衰と前記第２音量減衰とはそれぞれ異なる音量減衰量である、
　請求項４に記載の音響処理装置。
　さらに、情報に含まれる音に対して、当該情報に含まれる残響成分を減少させる残響抑圧処理を行う残響抑圧処理部を備え、
　前記音情報は、
　前記残響成分を含む原音情報に対して前記残響抑圧処理が行われることで生成され、
　前記原音情報に含まれる音のうち、減少した前記残響成分以外の音を前記再生音として含んでいる、
　請求項１に記載の音響処理装置。
　さらに、前記ユーザの頭部の動きを検知するセンサから、センシング結果を取得する取得部を備え、
　前記第２処理部は、取得した前記センシング結果に基づいて、前記第１音量減衰の音量減衰量を変化させた前記第２頭部伝達関数を、前記音情報に対して畳み込む、
　請求項１に記載の音響処理装置。
　前記第１頭部伝達関数は、畳み込まれることで情報に含まれる音を、所定方向から到達し、０以上の第３音量減衰を有する音として定位させ、
　前記第１処理部は、
　前記第２処理部における前記第１音量減衰の音量減衰量が増加した場合、前記第３音量減衰の音量減衰量を減少させた前記第１頭部伝達関数を、前記音情報に対して畳み込み、
　前記第２処理部における前記第１音量減衰の音量減衰量が減少した場合、前記第３音量減衰の音量減衰量を増加させた前記第１頭部伝達関数を、前記音情報に対して畳み込む、
　請求項９に記載の音響処理装置。
　さらに、前記ユーザの頭部の動きを検知するセンサから、センシング結果を取得する取得部を備え、
　前記第３処理部は、取得した前記センシング結果に基づいて、前記第２音量減衰の音量減衰量を変化させた前記第３頭部伝達関数を、前記音情報に対して畳み込む、
　請求項４を引用する請求項５に記載の音響処理装置。
　前記第１角度、前記第１遅延時間、及び、前記第１音量減衰のうち、少なくとも１つは、前記ユーザにより調整される、
　請求項１に記載の音響処理装置。
　前記第２角度、前記第２遅延時間、及び、前記第２音量減衰のうち、少なくとも１つは、前記ユーザにより調整される、
　請求項４を引用する請求項５に記載の音響処理装置。
　前記音情報は、前記再生音及び残響成分を含む原音情報に基づいて生成され、
　前記第１遅延時間は、前記再生音に対する前記残響成分の遅延時間よりも小さい遅延時間である、
　請求項１に記載の音響処理装置。
　前記音情報は、前記再生音及び残響成分を含む原音情報に基づいて生成され、
　前記第２遅延時間は、前記再生音に対する前記残響成分の遅延時間よりも小さい遅延時間である、
　請求項４を引用する請求項５～１４のいずれか１項に記載の音響処理装置。
　再生音を三次元音場上における所定方向から到達する音としてユーザに知覚させる音響処理方法であって、
　前記再生音を含む音情報に対して、情報に含まれる音を、前記所定方向から到達する音として定位させるための第１頭部伝達関数を畳み込むことで、第１出力音信号を生成し、
　前記音情報に対して、情報に含まれる音を、前記所定方向との角度が０度より大きく３６０度より小さい第１角度を有する第１方向から到達し、第１出力音信号によって知覚される前記再生音に対して０より大きい第１遅延時間、及び、０より大きい第１音量減衰を有する音として定位させるための第２頭部伝達関数を畳み込むことで、第２出力音信号を生成し、
　生成した前記第１出力音信号と前記第２出力音信号とを合成した出力音信号を出力する、
　音響処理方法。
　請求項１６に記載の音響処理方法をコンピュータに実行させるための
　プログラム。