WO2024014389A1

WO2024014389A1 - 音響信号処理方法、コンピュータプログラム、及び、音響信号処理装置

Info

Publication number: WO2024014389A1
Application number: PCT/JP2023/025118
Authority: WO
Inventors: 陽宇佐見; 智一石川; 成悟榎本; 康太中橋; 宏幸江原; 摩里子山田; 修二宮阪
Original assignee: パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ
Priority date: 2022-07-13
Filing date: 2023-07-06
Publication date: 2024-01-18

Abstract

音響信号処理方法は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、仮想空間における受聴者の位置を示す第２位置情報を取得する取得ステップと、取得された第１位置情報に基づいて、オブジェクトの移動速度を算出する第１算出ステップと、取得された第１位置情報及び取得された第２位置情報に基づいて、オブジェクトと受聴者との距離を算出する第２算出ステップと、算出された移動速度及び算出された距離に基づいて、オブジェクトの移動により生じる風が受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された空力音信号を出力する出力ステップと、を含む。

Description

音響信号処理方法、コンピュータプログラム、及び、音響信号処理装置

　本開示は、音響信号処理方法などに関する。

　特許文献１では、音響信号処理装置である三次元音場空間再生装置に係る技術が開示されており、この音響信号処理装置は、畳み込み演算された音響信号に、受聴者の移動速度及び音源の移動速度に基づきドップラー効果の処理を施すドップラー演算手段を備える。

特開平０７－３１２８００号公報国際公開第２０２１／１８０９３８号

　ところで、特許文献１が示す技術では、受聴者に臨場感を与えることが困難な場合がある。

　そこで、本開示は、受聴者に臨場感を与えることができる音響信号処理方法などを提供することを目的とする。

　本開示の一態様に係る音響信号処理方法は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、前記仮想空間における受聴者の位置を示す第２位置情報を取得する取得ステップと、取得された前記第１位置情報に基づいて、前記オブジェクトの移動速度を算出する第１算出ステップと、取得された前記第１位置情報及び取得された前記第２位置情報に基づいて、前記オブジェクトと前記受聴者との距離を算出する第２算出ステップと、算出された前記移動速度及び算出された前記距離に基づいて、前記オブジェクトの移動により生じる風が前記受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された前記空力音信号を出力する出力ステップと、を含む。

　また、本開示の一態様に係る音響信号処理方法は、雑音信号を複数の帯域強調フィルタのそれぞれで処理して、処理された複数の前記雑音信号の合成を行って処理することで、仮想空間における受聴者の耳に風が到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された前記空力音信号を出力する出力ステップと、を含み、前記複数の帯域強調フィルタのそれぞれは、前記受聴者の耳又は頭部の形状に起因して生じる前記空力音を模擬するためのフィルタである。

　また、本開示の一態様に係るプログラムは、上記の音響信号処理方法をコンピュータに実行させる。

　また、本開示の一態様に係る音響信号処理装置は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、前記仮想空間における受聴者の位置を示す第２位置情報を取得する取得部と、取得された前記第１位置情報に基づいて、前記オブジェクトの移動速度を算出する第１算出部と、取得された前記第１位置情報及び取得された前記第２位置情報に基づいて、前記オブジェクトと前記受聴者との距離を算出する第２算出部と、算出された前記移動速度及び算出された前記距離に基づいて、前記オブジェクトの移動により生じる風が前記受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成部と、生成された前記空力音信号を出力する出力部と、を備える。

　なお、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。

　本開示の一態様に係る音響信号処理方法によれば、受聴者に臨場感を与えることができる。

図１は、受聴者の頭部又は耳に達することで発生する空力音を説明する図の一例である。図２Ａは、受聴者の頭部又は耳に達することで発生する空力音を説明する図の他の一例である。図２Ｂは、本開示の音響処理又は復号処理が適用可能なシステムの一例である立体音響（Ｉｍｍｅｒｓｉｖｅ　Ａｕｄｉｏ）再生システムを示す図である。図２Ｃは、本開示の符号化装置の一例である符号化装置の構成を示す機能ブロック図である。図２Ｄは、本開示の復号装置の一例である復号装置の構成を示す機能ブロック図である。図２Ｅは、本開示の符号化装置の別の一例である符号化装置の構成を示す機能ブロック図である。図２Ｆは、本開示の復号装置の別の一例である復号装置の構成を示す機能ブロック図である。図２Ｇは、図２Ｄ又は図２Ｆにおけるデコーダの一例であるデコーダの構成を示す機能ブロック図である。図２Ｈは、図２Ｄ又は図２Ｆにおけるデコーダの別の一例であるデコーダの構成を示す機能ブロック図である。図２Ｉは、音響信号処理装置の物理的構成の一例を示す図である。図２Ｊは、符号化装置の物理的構成の一例を示す図である。図３Ａは、実施の形態に係る音響信号処理装置の機能構成を示すブロック図である。図３Ｂは、実施の形態に係る選択部の動作例のフローチャートである。図４は、実施の形態に係る音響信号処理装置の動作例１のフローチャートである。図５は、図４が示すステップＳ５０において生成部が空力音信号を生成する第１例の方法を示すフローチャートである。図６は、図４が示すステップＳ５０において生成部が空力音信号を生成する第１例の方法を示すフローチャートである。図７は、動作例１における第１例の方法に係る空力音データを収音するためのダミーヘッドマイクを示す模式図である。図８は、動作例１における第１例の方法に係る空力音データを収音するための他のダミーヘッドマイクを示す模式図である。図９は、図４が示すステップＳ５０において生成部が空力音信号を生成する第２例の方法を示すフローチャートである。図１０Ａは、動作例１における第２例の方法に係る生成部が空力音信号を生成する処理を説明する図である。図１０Ｂは、動作例１における第２例の方法に係る生成部が空力音信号を生成する処理を説明する他の図である。図１１は、動作例１における第２例の方法に係る４つのバンドパスフィルタの一例とその処理を示す図である。図１２は、動作例１における第２例の方法に係る生成部が処理信号を生成する処理を説明する他の図である。図１３は、動作例１における第２例の方法に係る生成部が処理信号を生成する処理を説明する他の図である。図１４は、実施の形態に係る音響信号処理装置の動作例２のフローチャートである。図１５は、実施の形態に係る音響信号処理装置の動作例３のフローチャートである。図１６は、実施の形態に係る音響信号処理装置の動作例４のフローチャートである。図１７は、実施の形態に係る音響信号処理装置の動作例４に係るオブジェクトである航空機を示す図である。図１８は、実施の形態に係る音響信号処理装置の動作例５に係るオブジェクトであるうちわを示す図である。図１９は、実施の形態に係る音響信号処理装置の動作例５のフローチャートである。図２０は、図２Ｇ及び図２Ｈのレンダリング部がパイプライン処理を行う場合を説明するための機能ブロック図及びステップの一例を示す図である。

　（本開示の基礎となった知見）
　従来、仮想空間において、ドップラー効果を発揮させるために音響信号（つまりは音信号）を処理する音響信号処理装置が知られている。

　特許文献１では、音響信号処理装置である三次元音場空間再生装置に係る技術が開示されている。この音響信号処理装置は、畳み込み演算された音響信号に、受聴者の移動速度及び音を発する音源（つまりは音を発するオブジェクト）の移動速度に基づきドップラー効果の処理を施すドップラー演算手段を備える。これにより、受聴者がドップラー効果の処理が施された音を受聴することで、受聴者は、音を発するオブジェクト（例えばサイレンを発する救急車）が移動していることを認識することができる。

　また、特許文献１には開示はないが、音を発さないオブジェクトであっても当該オブジェクトが移動することで風切り音を生じている場合、受聴者が当該風切り音を受聴することとなる。これにより、受聴者は、当該オブジェクトが移動していることをより強く認識することができる。例えば、オブジェクトが野球で用いられるバットである場合に、このオブジェクト（バット）が移動（位置の変化）したとき、つまりはバットがスイングされたときに、風切り音が生じる。受聴者は、この風切り音を受聴することで、バットがスイングされたことを認識することができる。

　このようなドップラー効果の処理が施された音及び風切り音は、仮想現実（バーチャル・リアリティ：ＶＲ（Ｖｉｒｔｕａｌ　Ｒｅａｌｉｔｙ））、又は、拡張現実（オーグメンテッド・リアリティ：ＡＲ（Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ））などの、ユーザが存在する空間において立体的な音を再生するためのアプリケーションにおいて、利用されている。

　ここで、音を発さず、かつ、風切り音が生じるほど高速に移動していないオブジェクトについて検討を行う。

　このようなオブジェクトであっても、空気中を移動することによって風を発生させ、当該風が受聴者に達する場合がある。この場合に、当該風が、例えば受聴者の頭部又は耳に達することで、空力音が発生する。空力音とは、仮想空間における受聴者の耳に風が到達することで生じる音でもあり、受聴者の耳又は頭部の形状に起因して生じる音でもある。受聴者が、当該空力音を受聴することによって、当該オブジェクトが移動していることを知覚する。この例について、図１及び図２Ａを用いて説明する。

　図１は、受聴者Ｌの頭部又は耳に達することで発生する空力音を説明する図の一例である。図１が示す車両４００は、例えばサイレンなどの音を発せず、かつ、風切り音が生じるほど高速に移動していない。

　このような車両４００であっても、車両４００が移動することによって、風Ｗが起こる。この風Ｗが受聴者Ｌに達した場合、例えば受聴者Ｌの耳の形状に応じた空力音が生じ、受聴者Ｌが、当該空力音を受聴することとなる。このため、受聴者Ｌは、車両４００が移動していることを聴覚によって知覚することができる。

　図２Ａは、受聴者Ｌの頭部又は耳に達することで発生する空力音を説明する図の他の一例である。図２Ａが示す扇風機６００は複数の大きな羽根６０１を有し、羽根６０１が回転している。

　この羽根６０１が回転しており、かつ、風切り音が生じるほど高速に回転していない場合であっても、風Ｗが起こる。この風Ｗが受聴者Ｌに達した場合、例えば受聴者Ｌの耳の形状に応じた空力音が生じ、受聴者Ｌが、当該空力音を受聴することとなる。このため、受聴者Ｌは、羽根６０１が回転（移動）していることを聴覚によって知覚することができる。

　このような空力音によって、受聴者Ｌがオブジェクト（車両４００又は羽根６０１）が移動していることを知覚できれば、受聴者Ｌは、より臨場感を得ることができる。

　このように、上記風Ｗが、受聴者Ｌの頭部又は耳などに達することで発生する空力音は、特許文献１に開示される技術では、受聴者Ｌに出力されることは明らかになっていない。すなわち、当該空力音を出力することができない従来技術（特許文献１が示す技術）では、受聴者Ｌに臨場感を与えることが困難な場合がある。

　そのため、受聴者Ｌに臨場感を与えることができる音響信号処理方法などが求められている。

　そこで、本開示の第１態様に係る音響信号処理方法は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、前記仮想空間における受聴者の位置を示す第２位置情報を取得する取得ステップと、取得された前記第１位置情報に基づいて、前記オブジェクトの移動速度を算出する第１算出ステップと、取得された前記第１位置情報及び取得された前記第２位置情報に基づいて、前記オブジェクトと前記受聴者との距離を算出する第２算出ステップと、算出された前記移動速度及び算出された前記距離に基づいて、前記オブジェクトの移動により生じる風が前記受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された前記空力音信号を出力する出力ステップと、を含む。

　これにより、音響信号処理方法は、仮想空間におけるオブジェクトの位置及び受聴者の位置に基づいて、オブジェクトの移動により生じる風が受聴者の耳に到達することで生じる空力音を示す空力音信号を生成し、生成された空力音信号を出力することができる。この空力音信号などがヘッドフォン又はスピーカなどに出力されることで、受聴者は当該空力音を受聴することができる。このため、受聴者は、当該オブジェクトが移動していることを知覚することができ、臨場感を得ることができる。つまりは、本開示の一態様に係る音響信号処理方法は、受聴者に臨場感を与えることができる。

　また、例えば、本開示の第２態様に係る音響信号処理方法は、前記生成ステップでは、算出された前記移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された前記距離が小さいほど前記空力音の音量を大きくするように前記空力音信号を生成する、第１態様に係る音響信号処理方法である。

　これにより、オブジェクトの移動速度、及び、オブジェクトと受聴者との距離に応じて、受聴者が受聴する空力音を制御することができるため、受聴者は、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第３態様に係る音響信号処理方法は、前記取得ステップでは、前記オブジェクトが前記空力音を生成するか否かを示す可否情報を取得し、前記生成ステップでは、取得された前記可否情報が、前記オブジェクトが前記空力音を生成することを示す場合に、前記空力音信号を生成する、第１又は第２態様に係る音響信号処理方法である。

　これにより、可否情報が、オブジェクトが空力音を生成することを示す場合のみに空力音信号が生成される。つまりは、音響信号処理方法は、可否情報が、オブジェクトが空力音を生成することを示さない場合には空力音信号を生成する必要がないため、音響信号処理方法において、空力音を発生させるための処理負荷を抑制することができる。

　また、例えば、本開示の第４態様に係る音響信号処理方法は、前記取得ステップでは、前記オブジェクトの形状を示す形状情報を取得し、前記生成ステップでは、取得された形状情報が示す前記形状、算出された前記移動速度及び算出された前記距離に基づいて、前記空力音信号を生成する、第１又は第２態様に係る音響信号処理方法である。

　これにより、空力音信号が、オブジェクトの形状、オブジェクトの移動速度、及び、オブジェクトと受聴者との距離に応じて生成されるため、より臨場感のある空力音を受聴者が受聴することができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第５態様に係る音響信号処理方法は、前記生成ステップでは、算出された前記移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された前記距離が小さいほど前記空力音の音量を大きくするように、かつ、取得された前記形状情報に基づいて前記オブジェクトの体積が大きいほど前記空力音の音量を大きくするように前記空力音信号を生成する、第４態様に係る音響信号処理方法である。

　これにより、オブジェクトの移動速度、オブジェクトと受聴者との距離、及び、オブジェクトの体積に応じて、受聴者が受聴する空力音を制御することができるため、受聴者は、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第６態様に係る音響信号処理方法は、算出された前記移動速度及び取得された前記形状情報に基づいて、前記オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する第３算出ステップを含み、前記生成ステップでは、算出された前記移動速度、算出された前記距離及び算出された前記風量に基づいて、前記空力音信号を生成する、第４態様に係る音響信号処理方法である。

　これにより、空力音信号が、オブジェクトの移動速度、オブジェクトと受聴者との距離、及び、上記風量に応じて生成されるため、より臨場感のある空力音を受聴者が受聴することができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第７態様に係る音響信号処理方法は、前記生成ステップでは、算出された前記移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された前記距離が小さいほど前記空力音の音量を大きくするように、かつ、算出された前記風量が大きいほど前記空力音の音量を大きくするように前記空力音信号を生成する、第６態様に係る音響信号処理方法である。

　これにより、オブジェクトの移動速度、オブジェクトと受聴者との距離、及び、上記風量に応じて、受聴者が受聴する空力音を制御することができるため、受聴者は、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第８態様に係る音響信号処理方法は、前記生成ステップでは、算出された前記移動速度、算出された前記距離及び人の耳の形状に基づいて、前記空力音信号を生成する、第１～第７態様のいずれか１つの態様に係る音響信号処理方法である。

　これにより、空力音信号が、人の耳の形状に基づく音生成モデルに応じて生成されるため、より臨場感のある空力音を受聴者が受聴することができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第９態様に係る音響信号処理方法は、人の耳又は人の耳を模したモデルに風が到達することで生じる音が収音されたデータである空力音データが記憶される記憶ステップと、前記生成ステップでは、記憶された前記空力音データ、算出された前記移動速度及び算出された前記距離に基づいて、前記空力音信号を生成する、第１～第７態様のいずれか１つの態様に係る音響信号処理方法である。

　これにより、空力音信号が、実際に生じた音が収音されたデータに応じて生成されるため、より臨場感のある空力音を受聴者が受聴することができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第１０態様に係る音響信号処理方法は、前記第３算出ステップでは、取得された前記形状情報に示される前記オブジェクトの移動方向から見た前記オブジェクトの面積、及び、算出された前記移動速度に基づいて、前記風量を算出する、第６又は第７態様に係る音響信号処理方法である。

　これにより、上記風量が、形状情報に示されるオブジェクトの移動方向から見たオブジェクトの面積、及び、移動速度に基づいて算出される。そして、空力音信号が、このような風量、オブジェクトの移動速度、及び、オブジェクトと受聴者との距離に応じて生成されるため、より臨場感のある空力音を受聴者が受聴することができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、例えば、本開示の第１１態様に係る音響信号処理方法は、前記第１算出ステップでは、取得された前記第１位置情報に基づいて、前記オブジェクトの前記移動速度及び移動方向を算出し、前記第３算出ステップでは、取得された前記形状情報、算出された前記移動方向、及び、算出された前記移動速度に基づいて、前記風量を算出する、第６又は第７態様に係る音響信号処理方法である。

　これにより、上記風量が、形状情報、移動方向及び移動速度に基づいて算出される。そして、空力音信号が、このような風量、オブジェクトの移動速度、及び、オブジェクトと受聴者との距離に応じて生成されるため、より臨場感のある空力音を受聴者が受聴することができる。つまりは、音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、本開示の第１２態様に係る音響信号処理方法は、雑音信号を複数の帯域強調フィルタのそれぞれで処理して、処理された複数の前記雑音信号の合成を行って処理することで、仮想空間における受聴者の耳に風が到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された前記空力音信号を出力する出力ステップと、を含み、前記複数の帯域強調フィルタのそれぞれは、前記受聴者の耳又は頭部の形状に起因して生じる前記空力音を模擬するためのフィルタである。

　これにより、音響信号処理方法は、仮想空間における受聴者に、仮想空間における受聴者の耳に風が到達することで生じる空力音を示す空力音信号を生成し、生成した空力音信号を出力することができる。この空力音信号などがヘッドフォン又はスピーカなどに出力されることで、受聴者は当該空力音を受聴することができる。このため、受聴者は、仮想空間において風が吹いていることを知覚することができ、臨場感を得ることができる。つまりは、本開示の一態様に係る音響信号処理方法は、受聴者に臨場感を与えることができる。

　また、本開示の第１３態様に係る音響信号処理方法は、前記複数の帯域強調フィルタは、処理された前記複数の雑音信号のうち当該帯域強調フィルタが処理した雑音信号に当該帯域強調フィルタに対応する所定の係数の乗算を行い、前記生成ステップでは、前記乗算が行われた後に、前記合成を行う、第１２態様に係る音響信号処理方法である。

　これにより、音響信号処理方法により生成される空力音が、現実空間で受聴者が受聴する空力音により似た音となる。そのため、受聴者は、より臨場感を得ることができる。つまりは、本開示の一態様に係る音響信号処理方法は、受聴者により臨場感を与えることができる。

　また、本開示の第１４態様に係る音響信号処理方法は、前記複数の帯域強調フィルタのそれぞれは、前記耳に到達する前記風の風速に応じて特性が変動する、第１２又は第１３態様に係る音響信号処理方法である。

　また、本開示の第１５態様に係る音響信号処理方法は、前記複数の帯域強調フィルタのそれぞれは、前記耳に到達する前記風の風向に応じて特性が変動する、第１２～第１４のいずれか１つの態様に係る音響信号処理方法である。

　また、本開示の第１６態様に係るコンピュータプログラムは、第１～第１６のいずれか１つの態様に係る音響信号処理方法をコンピュータに実行させるためのプログラムである。

　これにより、コンピュータが、コンピュータプログラムに従って、上記の音響信号処理方法を実行することができる。

　また、本開示の第１７態様に係る音響信号処理装置は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、前記仮想空間における受聴者の位置を示す第２位置情報を取得する取得部と、取得された前記第１位置情報に基づいて、前記オブジェクトの移動速度を算出する第１算出部と、取得された前記第１位置情報及び取得された前記第２位置情報に基づいて、前記オブジェクトと前記受聴者との距離を算出する第２算出部と、算出された前記移動速度及び算出された前記距離に基づいて、前記オブジェクトの移動により生じる風が前記受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成部と、生成された前記空力音信号を出力する出力部と、を備える。

　これにより、音響信号処理装置は、仮想空間におけるオブジェクトの位置及び受聴者の位置に基づいて、オブジェクトの移動により生じる風が受聴者の耳に到達することで生じる空力音を示す空力音信号を生成し、生成された空力音信号を出力することができる。この空力音信号などがヘッドフォン又はスピーカなどに出力されることで、受聴者は当該空力音を受聴することができる。このため、受聴者は、当該オブジェクトが移動していることを知覚することができ、臨場感を得ることができる。つまりは、本開示の一態様に係る音響信号処理装置は、受聴者に臨場感を与えることができる。

　さらに、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。

　以下、実施の形態について図面を参照しながら具体的に説明する。

　なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、請求の範囲を限定する主旨ではない。

　また、以下の説明において、第１及び第２等の序数が要素に付けられている場合がある。これらの序数は、要素を識別するため、要素に付けられており、意味のある順序に必ずしも対応しない。これらの序数は、適宜、入れ替えられてもよいし、新たに付与されてもよいし、取り除かれてもよい。

　また、各図は、模式図であり、必ずしも厳密に図示されたものではない。したがって、各図において縮尺などは必ずしも一致していない。各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略又は簡略化する。

　本明細書において、垂直などの要素間の関係性を示す用語、数値範囲は、厳格な意味のみを表す表現ではなく、実質的に同等な範囲、例えば数％程度の差異をも含むことを意味する表現である。

　（実施の形態）
　［本開示の音響処理技術又は符号化／復号技術を適用可能な装置例］
　（立体音響再生システム）
　図２Ｂは、本開示の音響処理又は復号処理が適用可能なシステムの一例である立体音響（Ｉｍｍｅｒｓｉｖｅ　Ａｕｄｉｏ）再生システムＡ００００を示す図である。立体音響再生システムＡ００００は、音響信号処理装置Ａ０００１と音声提示装置Ａ０００２とを含む。

　音響信号処理装置Ａ０００１は、仮想音源が発した音声信号に対して音響処理を施して、リスナ（つまりは受聴者）に対して提示される音響処理後の音声信号を生成する。音声信号は声に限らず可聴音であればよい。音響処理とは、例えば、音源から発生した音が、当該音が発せられてからリスナが聴くまでの間に受ける一又は複数の音に関する作用を再現するために音声信号に対して施される信号処理である。音響信号処理装置Ａ０００１は、上述した音に関する作用を引き起こす要因を記述した情報に基づいて音響処理を実施する。空間情報は、例えば、音源、リスナ、周囲のオブジェクトの位置を示す情報、空間の形状を示す情報、音の伝搬に関するパラメータなどを含む。音響信号処理装置Ａ０００１は、例えば、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）、スマートフォン、タブレット、またはゲームコンソールなどである。

　音響処理後の信号は、音声提示装置Ａ０００２からリスナ（ユーザ）に提示される。音声提示装置Ａ０００２は、無線又は有線の通信を介して音響信号処理装置Ａ０００１と接続されている。音響信号処理装置Ａ０００１で生成された音響処理後の音声信号は、無線または有線の通信を介して音声提示装置Ａ０００２に伝送される。音声提示装置Ａ０００２が、例えば、右耳用のデバイスと左耳用のデバイスなど複数のデバイスで構成されている場合、複数のデバイス間または複数のデバイスのそれぞれと音響信号処理装置Ａ０００１が通信することで、複数のデバイスは同期して音を提示する。音声提示装置Ａ０００２は、例えば、リスナの頭部に装着されるヘッドフォン、イヤホン、ヘッドマウントディスプレイ、または固定された複数のスピーカで構成されたサラウンドスピーカーなどである。

　なお、立体音響再生システムＡ００００は、視覚的にＡＲ／ＶＲを含むＥＲ（Ｅｘｔｅｎｄｅｄ　Ｒｅａｌｉｔｙ）体験を提供する画像提示装置又は立体映像提示装置と組み合わせて用いられてもよい。

　なお、図２Ｂは、音響信号処理装置Ａ０００１と音声提示装置Ａ０００２とが別々の装置であるシステム構成例を示しているが、本開示の音響信号処理方法または復号方法が適用可能な立体音響再生システムは図２Ｂの構成に限定されない。例えば、音響信号処理装置Ａ０００１が音声提示装置Ａ０００２に含まれ、音声提示装置Ａ０００２が音響処理と音の提示との両方を行ってもよい。また、音響信号処理装置Ａ０００１と音声提示装置Ａ０００２とが本開示で説明する音響処理を分担して実施してもよいし、音響信号処理装置Ａ０００１又は音声提示装置Ａ０００２とネットワークを介して接続されたサーバが本開示で説明する音響処理の一部又は全体を実施してもよい。

　なお、上記説明では、音響信号処理装置Ａ０００１と呼んでいるが、音響信号処理装置Ａ０００１が音声信号又は音響処理に用いる空間情報の少なくとも一部のデータを符号化して生成されたビットストリームを復号して音響処理を実施する場合、音響信号処理装置Ａ０００１は復号装置と呼ばれてもよい。

　（符号化装置の例）
　図２Ｃは、本開示の符号化装置の一例である符号化装置Ａ０１００の構成を示す機能ブロック図である。

　入力データＡ０１０１はエンコーダＡ０１０２に入力される空間情報及び／又は音声信号を含む符号化対象となるデータである。空間情報の詳細については後で説明する。

　エンコーダＡ０１０２は、入力データＡ０１０１を符号化して、符号化データＡ０１０３を生成する。符号化データＡ０１０３は、例えば、符号化処理によって生成されたビットストリームである。

　メモリＡ０１０４は、符号化データＡ０１０３を格納する。メモリＡ０１０４は、例えば、ハードディスク又はＳＳＤ（Ｓｏｌｉｄ－Ｓｔａｔｅ　Ｄｒｉｖｅ）であってもよいし、その他のメモリであってもよい。

　なお、上記説明ではメモリＡ０１０４に記憶される符号化データＡ０１０３の一例として符号化処理によって生成されたビットストリームを挙げたが、ビットストリーム以外のデータであってもよい。例えば、符号化装置Ａ０１００は、ビットストリームを所定のデータフォーマットに変換して生成された変換後のデータをメモリＡ０１０４に記憶してもよい。変換後のデータは、例えば、一又は複数のビットストリームを格納したファイル又は多重化ストリームであってもよい。ここで、ファイルは、例えばＩＳＯＢＭＦＦ（ＩＳＯ　Ｂａｓｅ　Ｍｅｄｉａ　Ｆｉｌｅ　Ｆｏｒｍａｔなどのファイルフォーマットを有するファイルである。また、符号化データＡ０１０３は、上記のビットストリーム又はファイルを分割して生成された複数のパケットの形式であってもよい。エンコーダＡ０１０２で生成されたビットストリームをビットストリームとは異なるデータに変換する場合、符号化装置Ａ０１００は、図示されていない変換部を備えていてもよいし、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔで変換処理を行ってもよい。

　（復号装置の例）
　図２Ｄは、本開示の復号装置の一例である復号装置Ａ０１１０の構成を示す機能ブロック図である。

　メモリＡ０１１４は、例えば、符号化装置Ａ０１００で生成された符号化データＡ０１０３と同じデータを格納している。メモリＡ０１１４は、保存されているデータを読み出し、デコーダＡ０１１２の入力データＡ０１１３として入力する。入力データＡ０１１３は、例えば、復号対象となるビットストリームである。メモリＡ０１１４は、例えば、ハードディスク又はＳＳＤであってもよいし、その他のメモリであってもよい。

　なお、復号装置Ａ０１１０は、メモリＡ０１１４が記憶しているデータをそのまま入力データＡ０１１３とするのではなく、読み出したデータを変換して生成された変換後のデータを入力データＡ０１１３としてもよい。変換前のデータは、例えば、一又は複数のビットストリームを格納した多重化データであってもよい。ここで、多重化データは、例えばＩＳＯＢＭＦＦなどのファイルフォーマットを有するファイルであってもよい。また、変換前のデータは、上記のビットストリーム又はファイルを分割して生成された複数のパケットの形式であってもよい。メモリＡ０１１４から読み出したビットストリームとは異なるデータをビットストリームに変換する場合、復号装置Ａ０１１０は、図示されていない変換部を備えていてもよいし、ＣＰＵで変換処理を行ってもよい。

　デコーダＡ０１１２は、入力データＡ０１１３を復号して、リスナに提示される音声信号Ａ０１１１を生成する。

　（符号化装置の別の例）
　図２Ｅは、本開示の符号化装置の別の一例である符号化装置Ａ０１２０の構成を示す機能ブロック図である。図２Ｅでは、図２Ｃの構成と同じ機能を有する構成に図２Ｃの構成と同じ符号を付しており、これらの構成については説明を省略する。

　符号化装置Ａ０１００は符号化データＡ０１０３をメモリＡ０１０４に記憶していたのに対し、符号化装置Ａ０１２０は符号化データＡ０１０３を外部に対して送信する送信部Ａ０１２１を備える点で符号化装置Ａ０１００と異なる。

　送信部Ａ０１２１は、符号化データＡ０１０３又は符号化データＡ０１０３を変換して生成した別のデータ形式のデータに基づいて送信信号Ａ０１２２を別の装置又はサーバに対して送信する。送信信号Ａ０１２２の生成に用いられるデータは、例えば、符号化装置Ａ０１００で説明したビットストリーム、多重化データ、ファイル、又はパケットである。

　（復号装置の別の例）
　図２Ｆは、本開示の復号装置の別の一例である復号装置Ａ０１３０の構成を示す機能ブロック図である。図２Ｆでは、図２Ｄの構成と同じ機能を有する構成に図２Ｄの構成と同じ符号を付しており、これらの構成については説明を省略する。

　復号装置Ａ０１１０は入力データＡ０１１３をメモリＡ０１１４から読み出していたのに対し、復号装置Ａ０１３０は入力データＡ０１１３を外部から受信する受信部Ａ０１３１を備える点で復号装置Ａ０１１０と異なる。

　受信部Ａ０１３１は、受信信号Ａ０１３２を受信して受信データを取得し、デコーダＡ０１１２に入力される入力データＡ０１１３を出力する。受信データは、デコーダＡ０１１２に入力される入力データＡ０１１３と同じであってもよいし、入力データＡ０１１３とは異なるデータ形式のデータであってもよい。受信データが、入力データＡ０１１３と異なるデータ形式のデータの場合、受信部Ａ０１３１が受信データを入力データＡ０１１３に変換してもよいし、復号装置Ａ０１３０が備える図示されていない変換部又はＣＰＵが受信データを入力データＡ０１１３に変換してもよい。受信データは、例えば、符号化装置Ａ０１２０で説明したビットストリーム、多重化データ、ファイル、又はパケットである。

　（デコーダの機能説明）
　図２Ｇは、図２Ｄ又は図２ＦにおけるデコーダＡ０１１２の一例であるデコーダＡ０２００の構成を示す機能ブロック図である。

　入力データＡ０１１３は符号化されたビットストリームであり、符号化された音声信号である符号化音声データと音響処理に用いるメタデータとを含んでいる。

　空間情報管理部Ａ０２０１は、入力データＡ０１１３に含まれるメタデータを取得して、メタデータを解析する。メタデータは、音空間に配置された音に作用する要素を記述した情報を含む。空間情報管理部Ａ０２０１は、メタデータを解析して得られた音響処理に必要な空間情報を管理し、レンダリング部Ａ０２０３に対して空間情報を提供する。なお、本開示では音響処理に用いる情報が空間情報と呼ばれているが、それ以外の呼び方であってもよい。当該音響処理に用いる情報は、例えば、音響処理に用いる情報を音空間情報と呼ばれてもよいし、シーン情報と呼ばれてもよい。また、音響処理に用いる情報が経時的に変化する場合、レンダリング部Ａ０２０３に入力される空間情報は、空間状態、音空間状態、シーン状態などと呼ばれてもよい。

　また、空間情報は音空間ごと又はシーンごとに管理されていてもよい。例えば、異なる部屋を仮想空間として表現する場合、それぞれの部屋が異なる音空間のシーンとして管理されてもよいし、同じ空間であっても表現する場面に応じて異なるシーンとして空間情報が管理されてもよい。空間情報の管理において、それぞれの空間情報を識別する識別子が付与されておいてもよい。空間情報のデータは、入力データの一形態であるビットストリームに含まれていてもよいし、ビットストリームが空間情報の識別子を含み、空間情報のデータはビットストリーム以外から取得してもよい。ビットストリームに空間情報の識別子のみが含まれる場合、レンダリング時に空間情報の識別子を用いて、音響信号処理装置Ａ０００１のメモリ又は外部のサーバに記憶された空間情報のデータが入力データとして取得されてもよい。

　なお、空間情報管理部Ａ０２０１が管理する情報は、ビットストリームに含まれる情報に限定されない。例えば、入力データＡ０１１３は、ビットストリームには含まれないデータとして、ＶＲ又はＡＲを提供するソフトウェアアプリケーション又はサーバから取得された空間の特性又は構造を示すデータを含んでいてもよい。また、例えば、入力データＡ０１１３は、ビットストリームには含まれないデータとして、リスナ又はオブジェクトの特性又は位置などを示すデータを含んでいてもよい。また、入力データＡ０１１３は、リスナの位置を示す情報として復号装置を含む端末が備えるセンサで取得された情報、又は、センサで取得された情報に基づいて推定された端末の位置を示す情報を含んでいてもよい。つまり、空間情報管理部Ａ０２０１は外部のシステム又はサーバと通信し、空間情報及びリスナの位置を取得してもよい。また、空間情報管理部Ａ０２０１が外部のシステムからクロック同期情報を取得し、レンダリング部Ａ０２０３のクロックと同期する処理を実行してもよい。なお、上記の説明における空間は、仮想的に形成された空間、つまりＶＲ空間であってもよいし、実空間（現実空間）又は実空間に対応する仮想空間、つまりＡＲ空間又はＭＲ（Ｍｉｘｅｄ　Ｒｅａｌｉｔｙ）空間であってもよい。また、仮想空間は音場又は音空間と呼ばれてもよい。また、上記の説明における位置を示す情報は、空間内における位置を示す座標値などの情報であってもよいし、所定の基準位置に対する相対位置を示す情報であってもよいし、空間内の位置の動き又は加速度を示す情報であってもよい。

　音声データデコーダＡ０２０２は、入力データＡ０１１３に含まれる符号化音声データを復号して、音声信号を取得する。

　立体音響再生システムＡ００００が取得する符号化音声データは、例えば、ＭＰＥＧ－Ｈ　３Ｄ　Ａｕｄｉｏ（ＩＳＯ／ＩＥＣ　２３００８－３）等の所定の形式で符号化されたビットストリームである。なお、ＭＰＥＧ－Ｈ　３Ｄ　Ａｕｄｉｏはあくまでビットストリームに含まれる符号化音声データを生成する際に利用可能な符号化方式の一例であり、他の符号化方式で符号化されたビットストリームと符号化音声データとして含んでいてもよい。例えば、用いられる符号化方式は、ＭＰ３（ＭＰＥＧ－１　Ａｕｄｉｏ　Ｌａｙｅｒ－３）、ＡＡＣ（Ａｄｖａｎｃｅｄ　Ａｕｄｉｏ　Ｃｏｄｉｎｇ）、ＷＭＡ（Ｗｉｎｄｏｗｓ　Ｍｅｄｉａ　Ａｕｄｉｏ）、ＡＣ３（Ａｕｄｉｏ　Ｃｏｄｅｃ―３）、Ｖｏｒｂｉｓなどの非可逆コーデックであってもよいし、ＡＬＡＣ（Ａｐｐｌｅ　Ｌｏｓｓｌｅｓｓ　Ａｕｄｉｏ　Ｃｏｄｅｃ）、ＦＬＡＣ（Ｆｒｅｅ　Ｌｏｓｓｌｅｓｓ　Ａｕｄｉｏ　Ｃｏｄｅｃ）などの可逆コーデックであってもよいし、上記以外の任意の符号化方式が用いられてもよい。例えば、ＰＣＭ（ｐｕｌｓｅ　ｃｏｄｅ　ｍｏｄｕｌａｔｉｏｎ）データが符号化音声データの一種であるとしてもよい。この場合、復号処理は、例えば、当該ＰＣＭデータの量子化ビット数がＮである場合、Ｎビットの二進数を、レンダリング部Ａ０２０３が処理できる数形式（例えば浮動小数点形式）に変換する処理としてもよい。

　レンダリング部Ａ０２０３は、音声信号と空間情報とを入力とし、空間情報を用いて音声信号に音響処理を施して、音響処理後の音声信号Ａ０１１１を出力する。

　空間情報管理部Ａ０２０１は、レンダリングを開始する前に、入力信号のメタデータを読み込み、空間情報で規定されたオブジェクト又は音などのレンダリングアイテムを検出し、レンダリング部Ａ０２０３に送信する。レンダリング開始後、空間情報管理部Ａ０２０１は、空間情報及びリスナの位置の経時的な変化を把握し、空間情報を更新して管理する。そして、空間情報管理部Ａ０２０１は、更新された空間情報をレンダリング部Ａ０２０３に送信する。レンダリング部Ａ０２０３は入力データに含まれる音声信号と、空間情報管理部Ａ０２０１から受信した空間情報とに基づいて音響処理を付加した音声信号を生成し出力する。

　空間情報の更新処理と、音響処理を付加した音声信号の出力処理とが同じスレッドで実行されてもよいし、空間情報管理部Ａ０２０１とレンダリング部Ａ０２０３とはそれぞれ独立したスレッドに配分してもよい。空間情報の更新処理と、音響処理を付加した音声信号の出力処理とが異なるスレッドで処理される場合、スレッドの起動頻度が個々に設定されてもよいし、平行して処理が実行されてもよい。

　空間情報管理部Ａ０２０１とレンダリング部Ａ０２０３とが異なる独立したスレッドで処理を実行することで、レンダリング部Ａ０２０３に優先的に演算資源を割り当てることができるので、僅かな遅延も許容できないような出音処理の場合、例えば、１サンプル（０．０２ｍｓｅｃ）でも遅延した場合にプチっというノイズが発生するような出音処理であっても安全に実施することができる。その際、空間情報管理部Ａ０２０１には演算資源の割り当てが制限される。しかし、空間情報の更新は、音声信号の出力処理と比較して、低頻度の処理（例えば、受聴者の顔の向きの更新のような処理）である。このため、音声信号の出力処理のように必ずしも瞬間的に応答しなければならないというものではないので、演算資源の割り当てを制限しても受聴者の与える音響的な品質に大きな影響はない。

　空間情報の更新は、予め設定された時間又は期間ごとに定期的に実行されてもよいし、予め設定された条件が満たされた場合に実行されてもよい。また、空間情報の更新は、リスナ又は音空間の管理者によって手動で実行されてもよいし、外部システムの変化をトリガとして実行されてもよい。例えば、受聴者がコントローラーを操作して、自身のアバターの立ち位置を瞬間的にワープしたり、時刻を瞬時に進めたり戻したり、或いは、仮想空間の管理者が、突如、場の環境を変更するような演出を施したりした場合、空間情報管理部Ａ０２０１が配置されたスレッドは、定期的な起動に加えて、単発的な割り込み処理として起動されてもよい。

　空間情報の更新処理を実行する情報更新スレッドが担う役割は、例えば、受聴者が装着しているＶＲゴーグルの位置又は向きに基づいて、仮想空間内に配置された受聴者のアバターの位置又は向きを更新する処理、及び、仮想空間内を移動している物体の位置の更新などであり、数１０Ｈｚ程度の比較的低頻度で起動する処理スレッド内で賄われるものである。そのような、発生頻度の低い処理スレッドで直接音の性質を反映させる処理が行われるようにしてもよい。それは、オーディオ出力のためのオーディオ処理フレームの発生頻度より直接音の性質が変動する頻度が低いためである。むしろそうすることで、当該処理の演算負荷を相対的に小さくすることができるし、不必要に速い頻度で情報を更新するとパルシブなノイズが発生するリスクが生じるので、そのリスクを回避することもできる。

　図２Ｈは、図２Ｄ又は図２ＦにおけるデコーダＡ０１１２の別の一例であるデコーダＡ０２１０の構成を示す機能ブロック図である。

　図２Ｈは、入力データＡ０１１３が、符号化音声データではなく符号化されていない音声信号を含んでいる点で図２Ｇと異なる。入力データＡ０１１３は、メタデータを含むビットストリームと音声信号を含む。

　空間情報管理部Ａ０２１１は、図２Ｇの空間情報管理部Ａ０２０１と同じであるため説明を省略する。

　レンダリング部Ａ０２１３は、図２Ｇのレンダリング部Ａ０２０３と同じであるため説明を省略する。

　なお、上記説明では図２Ｈの構成がデコーダと呼ばれているが、音響処理を実施する音響処理部と呼ばれてもよい。また、音響処理部を含む装置が復号装置ではなく音響処理装置と呼ばれてもよい。また、音響信号処理装置Ａ０００１が音響処理装置と呼ばれてもよい。

　（音響信号処理装置の物理的構成）
　図２Ｉは、音響信号処理装置の物理的構成の一例を示す図である。なお、図２Ｉの音響信号処理装置は、復号装置であってもよい。また、ここで説明する構成の一部は音声提示装置Ａ０００２に備えられていてもよい。また、図２Ｉに示される音響信号処理装置は、上記の音響信号処理装置Ａ０００１の一例である。

　図２Ｉの音響信号処理装置は、プロセッサと、メモリと、通信ＩＦと、センサと、スピーカとを備える。

　プロセッサは、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ又はＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）又はＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であり、当該ＣＰＵ又はＤＳＰ又はＧＰＵがメモリに記憶されたプログラム実行することで本開示の音響処理又はデコード処理を実施してもよい。また、プロセッサは、本開示の音響処理を含む音声信号に対する信号処理を行う専用回路であってもよい。

　メモリは、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）又はＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）で構成される。メモリは、ハードディスクなどの磁気記憶媒体又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）などの半導体メモリなどを含んでいてもよい。また、ＣＰＵ又はＧＰＵに組み込まれた内部メモリを含めてメモリと呼ばれてもよい。

　通信ＩＦ（Ｉｎｔｅｒ　Ｆａｃｅ）は、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）又はＷＩＧＩＧ（登録商標）などの通信方式に対応した通信モジュールである。図２Ｉに示される音響信号処理装置は、通信ＩＦを介して他の通信装置と通信を行う機能を有し、復号対象のビットストリームを取得する。取得したビットストリームは、例えば、メモリに格納される。

　通信モジュールは、例えば、通信方式に対応した信号処理回路とアンテナとで構成される。上記の例では、通信方式としてＢｌｕｅｔｏｏｔｈ（登録商標）又はＷＩＧＩＧ（登録商標）を例に挙げたが、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）、ＮＲ（Ｎｅｗ　Ｒａｄｉｏ）、又はＷｉ－Ｆｉ（登録商標）などの通信方式に対応していてもよい。また、通信ＩＦは、上記のような無線通信方式ではなく、Ｅｔｈｅｒｎｅｔ（登録商標）、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）、ＨＤＭＩ（登録商標）（Ｈｉｇｈ－Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）などの有線の通信方式であってもよい。

　センサは、リスナの位置又は向きを推定するためのセンシングを行う。具体的には、センサは、リスナの頭部など身体の一部又は全体の位置、向き、動き、速度、角速度、又は加速度などのうちいずれか一つ又は複数の検出結果に基づいてリスナの位置及び／又は向きを推定し、リスナの位置及び／又は向きを示す位置情報を生成する。なお、位置情報は実空間におけるリスナの位置及び／又は向きを示す情報であってもよいし、所定の時点におけるリスナの位置及び／又は向きを基準としたリスナの位置及び／又は向きの変位を示す情報であってもよい。また、位置情報は、立体音響再生システム又はセンサを備える外部装置との相対的な位置及び／又は向きを示す情報であってもよい。

　センサは、例えば、カメラなどの撮像装置又はＬｉＤＡＲ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　Ａｎｄ　Ｒａｎｇｉｎｇ）などの測距装置であってもよく、リスナの頭部の動きを撮像し、撮像された画像を処理することでリスナの頭部の動きを検知してもよい。また、センサとして例えばミリ波などの任意の周波数帯域の無線を用いて位置推定を行う装置を用いてもよい。

　なお、図２Ｉに示される音響信号処理装置は、センサを備える外部の機器から通信ＩＦを介して位置情報を取得してもよい。この場合、音響信号処理装置はセンサを含んでいなくてもよい。ここで、外部の機器とは、例えば図２Ｂで説明した音声提示装置Ａ０００２又は、リスナの頭部に装着される立体映像再生装置などである。このときセンサは、例えば、ジャイロセンサ及び加速度センサなど各種のセンサを組み合わせて構成される。

　センサは、例えば、リスナの頭部の動きの速度として、音空間内で互いに直交する３軸の少なくとも１つを回転軸とする回転の角速度を検知してもよいし、上記３軸の少なくとも１つを変位方向とする変位の加速度を検知してもよい。

　センサは、例えば、リスナの頭部の動きの量として、音空間内で互いに直交する３軸の少なくとも１つを回転軸とする回転量を検知してもよいし、上記３軸の少なくとも１つを変位方向とする変位量を検知してもよい。具体的には、センサは、リスナの位置として６ＤｏＦ（位置（ｘ、ｙ、ｚ）及び角度（ｙａｗ、ｐｉｔｃｈ、ｒｏｌｌ）を検知する。センサは、ジャイロセンサ及び加速度センサなど動きの検知に使用される各種のセンサを組み合わせて構成される。

　なお、センサは、リスナの位置を検出できればよく、カメラ又はＧＰＳ（Ｇｌｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓｙｓｔｅｍ）受信機などにより実現されてもよい。ＬｉＤＡＲ（Ｌａｓｅｒ　Ｉｍａｇｉｎｇ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｒａｎｇｉｎｇ）等を用いて自己位置推定を実施して得られた位置情報を用いてもよい。例えば、センサは、音声信号再生システムがスマートフォンにより実現される場合には、スマートフォンに内蔵される。

　また、センサには、図２Ｉに示される音響信号処理装置の温度を検出する熱電対などの温度センサ、及び、音響信号処理装置が備える、又は音響信号処理装置と接続されたバッテリの残量を検出するセンサなどが含まれていてもよい。

　スピーカは、例えば、振動板と、マグネット又はボイスコイル等の駆動機構とアンプとを有し、音響処理後の音声信号を音としてリスナに提示する。スピーカは、アンプを介して増幅させた音声信号（より具体的には、音の波形を示す波形信号）に応じて駆動機構を動作させ、駆動機構によって振動板を振動させる。このようにして、音声信号に応じて振動する振動板は、音波を発生させ、音波が空気を伝搬してリスナの耳に伝達し、リスナが音を知覚する。

　なお、ここでは図２Ｉに示される音響信号処理装置がスピーカを備え、当該スピーカを介して音響処理後の音声信号を提示する場合を例に挙げて説明したが、音声信号の提示手段は上記の構成に限定されない。例えば、通信モジュールで接続された外部の音声提示装置Ａ０００２に音響処理後の音声信号が出力されてもよい。通信モジュールで行う通信は有線でも無線でもよい。また別の例として、図２Ｉに示される音響信号処理装置が音声のアナログ信号を出力する端子を備え、端子にイヤホンなどのケーブルを接続してイヤホンなどから音声信号を提示してもよい。上記の場合、音声提示装置Ａ０００２であるリスナの頭部又は体の一部に装着されるヘッドフォン、イヤホン、ヘッドマウントディスプレイ、ネックスピーカー、ウェアラブルスピーカー、又は固定された複数のスピーカで構成されたサラウンドスピーカーなどが音声信号を再生する。

　（符号化装置の物理的構成）
　図２Ｊは、符号化装置の物理的構成の一例を示す図である。また、図２Ｊに示される符号化装置は、上記の符号化装置Ａ０１００及びＡ０１２０などの一例である。

　図２Ｊの符号化装置は、プロセッサと、メモリと、通信ＩＦとを備える。

　プロセッサは、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ又はＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）であり、当該ＣＰＵ又はＧＰＵがメモリに記憶されたプログラム実行することで本開示の符号化処理を実施してもよい。また、プロセッサは、本開示の符号化処理を含む音声信号に対する信号処理を行う専用回路であってもよい。

　通信ＩＦ（Ｉｎｔｅｒ　Ｆａｃｅ）は、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）又はＷＩＧＩＧ（登録商標）などの通信方式に対応した通信モジュールである。符号化装置は、通信ＩＦを介して他の通信装置と通信を行う機能を有し、符号化されたビットストリームを送信する。

　［構成］
　そして、実施の形態に係る音響信号処理装置１００の構成について説明する。図３Ａは、本実施の形態に係る音響信号処理装置１００の機能構成を示すブロック図である。

　本実施の形態に係る音響信号処理装置１００は、仮想空間（音再生空間）におけるオブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成して出力するための装置である。なお、空力音とは、仮想空間における受聴者Ｌの耳に風Ｗが到達することで生じる音でもあり、受聴者Ｌの耳又は頭部の形状に起因して生じる音でもある。本実施の形態に係る音響信号処理装置１００は、一例として仮想現実又は拡張現実（ＶＲ／ＡＲ）などの仮想空間における様々なアプリケーションに応用される装置である。

　仮想空間におけるオブジェクトは、当該仮想空間内で実行されるコンテンツ（ここでは一例として映像）を表示する表示部３００に表示される当該コンテンツに含まれるものであれば、特に限定されない。当該オブジェクトは、移動体であり、例えば、動植物、人工物又は自然物などを示すオブジェクトを含む。人工物を示すオブジェクトの例として、車両、自転車及び航空機などが挙げられる。また、人工物を示すオブジェクトの例として、野球用のバット及びテニス用のラケットなどのスポーツ用品と、机、椅子、扇風機及び柱時計などの家具と、集合住宅及び商業施設などの建築物と、などが挙げられる。なお、オブジェクトは、一例としては、当該コンテンツ内にて移動し得るもの、及び、移動され得るもののうち少なくとも一方であるとよいがこれに限られない。なお、図２Ａが示す扇風機６００は、天井に設置され扇風機６００自体が移動しなくても、扇風機６００の羽根６０１が移動する。このような扇風機６００も、当該オブジェクトに含まれる。

　また、本実施の形態に係る空力音とは、仮想空間内において、当該オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる音である。より具体的には、空力音とは、当該オブジェクトの移動による空気の移動によって生じる風Ｗに起因する音である。また、耳とは、耳介及び外耳の少なくとも一方を意味する。

　音響信号処理装置１００は、仮想空間における空力音を示す空力音信号を生成して、ヘッドフォン２００に出力する。

　次に、ヘッドフォン２００について説明する。

　ヘッドフォン２００は、空力音を再生する装置であり、音声出力装置である。より具体的には、ヘッドフォン２００は、音響信号処理装置１００によって出力された空力音信号に基づいて、空力音を再生する。これにより受聴者Ｌは、空力音を受聴することができる。なお、ヘッドフォン２００にかえて、スピーカなど他の出力チャンネルが用いられてもよい。

　図３Ａが示すように、ヘッドフォン２００は、頭部センサ部２０１と、出力部２０２とを備える。

　頭部センサ部２０１は、仮想空間における水平面の座標及び垂直方向の高さで定められる受聴者Ｌの位置をセンシングして、仮想空間における受聴者Ｌの位置を示す第２位置情報を音響信号処理装置１００に出力する。

　頭部センサ部２０１は、受聴者Ｌの頭部の６ＤｏＦ（Ｄｅｇｒｅｅｓ　ｏｆ　Ｆｒｅｅｄｏｍ）の情報をセンシングするとよい。例えば、頭部センサ部２０１は、慣性測定ユニット（ＩＭＵ：Ｉｎｅｒｔｉａｌ　Ｍｅａｓｕｒｅｍｅｎｔ　Ｕｎｉｔ）、加速度計、ジャイロスコープ、磁気センサ又はこれらの組合せであるとよい。

　出力部２０２は、音再生空間において受聴者Ｌに到達する音を再生する装置である。より具体的には、出力部２０２は、音響信号処理装置１００によって処理されかつ音響信号処理装置１００から出力された上記空力音を示す空力音信号に基づいて、上記空力音を再生する。

　続いて、表示部３００について説明する。

　表示部３００は、仮想空間におけるオブジェクトを含むコンテンツ（映像）を表示する表示装置である。表示部３００がコンテンツを表示するための処理については、後述する。表示部３００は、例えば、液晶パネル又は有機ＥＬ（Ｅｌｅｃｔｒｏ　Ｌｕｍｉｎｅｓｃｅｎｃｅ）パネルなどの表示パネルによって実現される。

　さらに、図３Ａが示す音響信号処理装置１００について説明する。

　図３Ａが示すように、音響信号処理装置１００は、取得部１１０と、算出部１２０と、生成部１３０と、出力部１４０と、記憶部１５０とを備える。

　取得部１１０は、例えば入力信号から第１位置情報及び第２位置情報を取得する。入力信号については、下記にて説明する。第１位置情報とは、仮想空間におけるオブジェクトの位置を示す情報である。第２位置情報とは、上記の通り、仮想空間における受聴者Ｌの位置を示す情報である。なお、取得部１１０は入力信号以外から第１位置情報及び第２位置情報を取得してもよい。

　また、取得部１１０は、さらに、可否情報を取得してもよく、形状情報を取得してもよい。可否情報とは、オブジェクトが空力音を生成するか否かを示す情報である。形状情報とは、オブジェクトの形状を示す情報である。

　本実施の形態においては、取得部１１０は、第１位置情報、可否情報及び形状情報を音響信号処理装置１００以外の装置（ここでは、例えばクラウドサーバなどのサーバ装置５００）から取得するがこれに限られない。また、取得部１１０は、第２位置情報をヘッドフォン２００（より具体的には、頭部センサ部２０１）から取得するがこれに限られない。

　入力信号は、例えば、空間情報とセンサ情報と音データ（音声信号）とで構成される。また、上記の情報と音データとは１つの入力信号に含まれていてもよいし、複数の別々の信号に上述の情報と音データとが含まれていてもよい。入力信号は、音データとメタデータ（制御情報）とで構成されるビットストリームを含んでいてもよく、その場合メタデータに空間情報及び音データを識別する情報が含まれていてもよい。

　上記で説明した、第１位置情報、第２位置情報、形状情報、可否情報は入力信号に含まれていてもよく、それ以外に含まれていてもよい。より具体的には、第１情報、形状情報、可否情報は空間情報に含まれていてもよく、第２情報はセンサ情報から取得される情報に基づいて生成されてもよい。センサ情報は、頭部センサ部２０１から取得されてもよく、他の外部装置から取得されてもよい。

　空間情報は、立体音響再生システムが作り出す音空間（三次元音場）に関する情報であって、音空間に含まれるオブジェクトに関する情報とリスナに関する情報とで構成される。オブジェクトには、音を発し音源となる音源オブジェクトと、音を発しない非発音オブジェクトとが存在する。非発音オブジェクトは、音源オブジェクトが発した音を反射する障害物オブジェクトとして機能するが、音源オブジェクトが別の音源オブジェクトが発した音を反射する障害物オブジェクトとして機能する場合もある。障害物オブジェクトは反射オブジェクトと呼ばれてもよい。

　音源オブジェクトと非発音オブジェクトとに共通して付与される情報として、位置情報、形状情報、及び、オブジェクトが音を反射する際の音量の減衰率などがある。

　位置情報は、ユークリッド空間の例えばＸ軸、Ｙ軸、Ｚ軸の３軸の座標値で表されるが、必ずしも三次元情報でなくてもよい。位置情報は、例えば、Ｘ軸、Ｙ軸の２軸の座標値で表される二次元情報であってもよい。オブジェクトの位置情報は、メッシュ又はボクセルで表現される形状の代表位置で定められる。

　形状情報は、表面の素材に関する情報を含んでいてもよい。

　減衰率は、１以下又は０以上の実数で表現してもよいし、マイナスのデシベル値で表現してもよい。実空間では反射によって音量が増幅することはないため、減衰率はマイナスのデシベル値が設定されるが、例えば、非現実空間の不気味さを演出するために、あえて１以上の減衰率、すなわち、プラスのデシベル値が設定されてもよい。また、減衰率は、複数の周波数帯域を構成する周波数帯域毎に異なる値が設定されてもよいし、周波数帯域毎に独立に値が設定されてもよい。また、減衰率がオブジェクト表面の素材の種類ごとに設定されている場合、表面の素材に関する情報に基づいて対応する減衰率の値が用いられてもよい。

　また、音源オブジェクトと非発音オブジェクトとに共通して付与される情報は、オブジェクトが生物に属するか否かを示す情報又は、オブジェクトが動体であるか否かを示す情報などを含んでいてもよい。オブジェクトが動体である場合、位置情報は時間とともに移動してもよく、変化した位置情報又は変化量がレンダリング部Ａ０２０３及びＡ０２１３に伝送される。

　音源オブジェクトに関する情報は、上述した音源オブジェクトと非発音オブジェクトとに共通して付与される情報に加えて、音データと音データを音空間内に放射するために必要な情報とを含む。音データは、音の周波数及び強弱に関する情報などを示す、リスナに知覚される音が表現されたデータである。音データは、典型的にはＰＣＭ信号であるが、ＭＰ３等の符号化方式を用いて圧縮されたデータであってもよい。その場合は、少なくとも当該信号が生成部１３０に到達するまでに復号化される必要があるため、レンダリング部Ａ０２０３及びＡ０２１３に図示しない復号部を含んでいてもよい。或いは、当該信号は、音声データデコーダＡ０２０２で復号化してもよい。

　１つの音源オブジェクトに対して少なくとも１つの音データが設定されていればよく、複数の音データが設定されていてもよい。また、それぞれの音データを識別する識別情報が付与され、音源オブジェクトに関する情報として、音データの識別情報がメタデータとして保持されてもよい。

　音データを音空間内に放射するために必要な情報として、例えば、音データを再生する際に基準となる基準音量の情報、音源オブジェクトの位置に関する情報、音源オブジェクトの向きに関する情報、及び、音源オブジェクトが発する音の指向性に関する情報などが含まれていてもよい。

　基準音量の情報は、例えば、音データを音空間に放射する際の音源位置における音データの振幅値の実効値であって、デシベル（ｄｂ）値として浮動小数点で表されてもよい。例えば基準音量が０ｄｂの場合、基準音量の情報は、音データが示す信号レベルの音量を増減させることなくそのままの音量で上記位置に関する情報が指し示す位置から音空間に対して音を放射することを示しているものとしてもよい。基準音量の情報は、－６ｄｂの場合、音データが示す信号レベルの音量を約半分にして上記位置に関する情報が指し示す位置から音空間に対して音を放射することを示しているものとしてもよい。基準音量の情報は、１つの音データに対して又は複数の音データに対してまとめて付与されてもよい。

　音データを音空間内に放射するために必要な情報に含まれる音量の情報として、例えば、音源の音量の時系列的な変動を示す情報が含まれていてもよい。例えば、音空間が仮想会議室であり、音源が話者である場合、音量は短い時間で断続的に遷移する。それをさらに単純に表現すれば、有音部分と無音部分とが交互に発生する、とも言える。また、音空間がコンサートホールであり、音源が演奏者である場合、音量は一定の時間長維持される。また、音空間が戦場であり、音源が爆発物である場合、爆発音の音量は一瞬だけ大となり以降は無音であり続ける。このように音源の音量の情報は、音の大きさの情報のみならず、音の大きさの遷移の情報を含むものであり、そのような情報を音データの性質を示す情報としてもよい。

　ここで、音の大きさの遷移の情報は、周波数特性を時系列に示したデータであってもよい。音の大きさの遷移の情報は、有音である区間の継続時間長を示したデータであってもよい。音の大きさの遷移の情報は、有音である区間の継続時間長と無音である区間の時間長との時系列を示したデータであってもよい。音の大きさの遷移の情報は、音信号の振幅が定常的であるとみなせる（概ね一定であるとみなせる）継続時間とその間の当該信号の振幅値のデータとを複数組時系列で列挙したデータなどであってもよい。音の大きさの遷移の情報は、音信号の周波数特性が定常的であるとみなせる継続時間のデータであってもよい。音の大きさの遷移の情報は、音信号の周波数特性が定常的であるとみなせる継続時間とその間の当該周波数特性のデータとを複数組時系列で列挙したデータなどであってもよい。音の大きさの遷移の情報は、データの形式として例えば、スペクトログラムの概形を示すデータであってもよい。また、上記周波数特性の基準となる音量を上記基準音量としてもよい。基準音量の情報と音データの性質とを示す情報は、リスナに知覚させる直接音又は反射音の音量を算出する他、リスナに知覚させるか否か選択をするための選択処理に用いられてもよい。

　向きに関する情報は、典型的には、ｙａｗ、ｐｉｔｃｈ、ｒｏｌｌで表現される。または、ｒｏｌｌの回転を省略し、アジマス（ｙａｗ）、エレベーション（ｐｉｔｃｈ）で表現してもよい。向き情報は時間とともに変化してもよく、変化した場合、レンダリング部Ａ０２０３及びＡ０２１３に伝送される。

　リスナに関する情報は、音空間におけるリスナの位置情報と向きとに関する情報である。位置情報はユークリッド空間のＸＹＺ軸の位置で表されるが、必ずしも三次元情報でなくてもよく、二次元情報であってもよい。向きに関する情報は、典型的には、ｙａｗ、ｐｉｔｃｈ、ｒｏｌｌで表現される。または、向きに関する情報は、ｒｏｌｌの回転を省略し、アジマス（ｙａｗ）、エレベーション（ｐｉｔｃｈ）で表現してもよい。位置情報と向き情報とは時間とともに変化してもよく、変化した場合、レンダリング部Ａ０２０３及びＡ０２１３に伝送される。

　センサ情報は、リスナが装着するセンサで検知された回転量又は変位量等とリスナの位置及び向きとを含む情報である。センサ情報はレンダリング部Ａ０２０３及びＡ０２１３に伝送され、レンダリング部Ａ０２０３及びＡ０２１３はセンサ情報に基づいてリスナの位置及び向きの情報を更新する。センサ情報は、例えば携帯端末がＧＰＳ、カメラ、又はＬｉＤＡＲ（Ｌａｓｅｒ　Ｉｍａｇｉｎｇ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｒａｎｇｉｎｇ）等を用いて自己位置推定を実施して得られた位置情報が用いられてもよい。またセンサ以外から、通信モジュールを通じて外部から取得した情報がセンサ情報として検出されてもよい。センサから、音響信号処理装置１００の温度を示す情報、及び、バッテリの残量を示す情報が、センサ情報として、取得されてもよい。音響信号処理装置１００又は音声提示装置Ａ０００２の演算資源（ＣＰＵ能力、メモリ資源、ＰＣ性能）を示す情報などがセンサ情報として、リアルタイムで取得されてもよい。

　ここで、第１位置情報、第２位置情報、可否情報及び形状情報についてさらに具体的に説明する。

　まずは、第１位置情報について説明する。

　上記の通り、仮想空間におけるオブジェクトは、表示部３００に表示されるコンテンツ（映像）に含まれるものであり、当該コンテンツ内にて移動し得るもの、及び、移動され得るもののうち少なくとも一方であるとよい。例えば、仮想空間におけるオブジェクトは、図１が示す車両４００である。

　第１位置情報は、仮想空間における車両４００が、ある時点において、仮想空間内のどの位置にあるのかを示す情報である。なお、仮想空間においては、運転手が運転することで車両４００は移動する可能性がある。このため、取得部１１０は、継続的に第１位置情報を取得する。取得部１１０は、例えば、空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに第１位置情報を取得する。

　続いて、第２位置情報について説明する。

　受聴者Ｌは、仮想空間において移動し得る。第２位置情報は、仮想空間における受聴者Ｌが、ある時点において、仮想空間内のどの位置に居るのかを示す情報である。なお、受聴者Ｌは仮想空間において移動することができるため、取得部１１０は継続的に第２位置情報を取得する。取得部１１０は、例えば、空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに第２位置情報を取得する。

　次に、形状情報について説明する。

　形状情報は、仮想空間におけるオブジェクト（例えば車両４００）の形状を示す情報である。形状情報は、オブジェクトの形状を示し、より具体的には、オブジェクトの剛体として三次元形状を示す。オブジェクトの形状は、例えば、球体、直方体、立方体、多面体、円錐、角錐、円柱、角柱など、またこれらの組み合わせなどにより示される。なお、形状情報は、例えばメッシュデータ、又は、例えばボクセル、三次元点群もしくは三次元座標を持つ頂点からなる複数の面の集合として表現されてもよい。

　さらに可否情報について説明する。

　可否情報は、オブジェクト（例えば車両４００）が空力音を生成するか否かを示す情報である。つまり、可否情報には、当該空力音を生成すること、又は、当該空力音を生成しないことが示されている。例えば、可否情報が当該空力音を生成することを示す場合にはフラグとして「１」が示され、可否情報が当該空力音を生成しないことを示す場合にはフラグとして「０」が示される。可否情報は、フラグ情報であるとも言え、オブジェクトに係るメタデータの一例である。

　可否情報は、オブジェクトが空力音を生成するか否かについては、可否情報が示すオブジェクトに応じて、予め決定されている。例えば、可否情報が真を示すか偽を示すかについては、表示部３００に示されるコンテンツ（映像）の管理者などによって、予め定められていてもよい。また、図３Ａで図示しない選択部が音響信号処理装置１００に含まれていてもよく、可否情報に基づいてオブジェクトが空力音を生成するか否かの選択（選択処理）が、選択部で実行されてもよい。また、空力音以外の、他の音の生成に係る音響信号処理装置１００全体の演算負荷を考慮して選択処理が実行されてもよい。また、空力音に予め優先順位を設定しておき優先順位の情報が可否情報に含まれてもよい。例えば、音響信号処理装置１００の処理能力又は音空間の生成に係る全体の演算負荷を考慮して優先順位が低い空力音を生成しないことが選択されてもよい。また、音響信号処理装置１００の処理能力と全体の演算負荷を比較して、音響信号処理装置１００の処理能力に余裕がない場合には、可否情報が真となっていても空力音を生成しないことを選択してもよい。また、オブジェクトに、空力音以外の音源情報と、真を示す可否情報との両方が付与されている場合、処理能力に余裕がないときは、音源の生成を優先し、空力音を生成することが選択されないようにしてもよいし、音源の生成と空力音の生成とのいずれを優先させるかを予め設定した情報が可否情報に含まれていてもよい。

　ここで選択部の処理の流れの例示（動作例）を図３Ｂに示す。図３Ｂは、本実施の形態に係る選択部の動作例のフローチャートである。まず、選択部は入力信号を解析し、入力信号に可否情報が含まれるか否かを特定する（Ｓ１００）。空力音を生成するか否かの選択に音響信号処理装置１００の処理能力又は演算負荷を考慮する場合、このステップＳ１００で、それらの情報を取得してもよい。次に、選択部は、可否情報又は音響信号処理装置の処理能力又は演算負荷に基づいて、空力音を生成する選択（空力音の選択）をするか否かを決定する（Ｓ１１０）。

　なお、選択部において、空力音の選択処理だけでなく、他の音の選択処理を実行してもよい。

　なお、第１位置情報にはオブジェクトを識別するための識別情報が含まれ、可否情報にもオブジェクトを識別するための識別情報が含まれ、形状情報にもオブジェクトを識別するための識別情報が含まれている。

　このため、取得部１１０が第１位置情報、可否情報及び形状情報を別個で取得したとしても、第１位置情報、可否情報及び形状情報のそれぞれに含まれる識別情報が参照されることで、第１位置情報、可否情報及び形状情報のそれぞれが示すオブジェクトが識別される。例えばここでは、第１位置情報、可否情報及び形状情報のそれぞれが示すオブジェクトが、同一の車両４００であることが容易に識別することができる。つまり、取得部１１０が取得した第１位置情報、可否情報及び形状情報のそれぞれは、３つの識別情報が参照されることで当該第１位置情報、当該可否情報及び当該形状情報が車両４００に係る情報であることが明らかになる。従って、当該第１位置情報、当該可否情報及び当該形状情報は車両４００について示す情報として紐づけられる。

　なお、上記の第１位置情報、可否情報及び形状情報などは、入力信号に含まれるメタデータ、制御情報又はヘッダ情報に含まれていてもよい。つまり、音響信号処理装置１００（より具体的には、取得部１１０）は、入力信号に含まれるメタデータ、制御情報又はヘッダ情報を取得し、メタデータ、制御情報又はヘッダ情報に基づいて音響処理を行ってもよい。なお、音響信号処理装置１００（より具体的には、取得部１１０）は、上記の第１位置情報、可否情報及び形状情報を取得すればよく、取得先は入力信号に限定されない。

　また、入力信号に含まれるオーディオコンテンツ情報（音声信号）は、ＭＰＥＧ－Ｈ　３Ｄ　Ａｕｄｉｏ（ＩＳＯ／ＩＥＣ　２３００８－３）（以下、ＭＰＥＧ－Ｈ　３Ｄ　Ａｕｄｉｏと記載）などの符号化処理が施されているとよい。また、符号化処理に用いる技術はＭＰＥＧ－Ｈ　３Ｄ　Ａｕｄｉｏに限られず、公知の他の技術が用いられてもよい。また、音声信号以外の第１位置情報、可否情報及び形状情報などの情報を符号化処理対象としてもよい。つまり、音響信号処理装置１００は、符号化されたビットストリームに含まれる音声信号及びメタデータを取得する。音響信号処理装置１００においては、オーディオコンテンツ情報が取得されて復号される。本実施の形態においては、音響信号処理装置１００は、復号装置が備えるデコーダとして機能し、より具体的には、当該デコーダが有するレンダリング部Ａ０２０３及びＡ０２１３として機能する。なお、本開示におけるオーディオコンテンツ情報又は音データという用語は、技術内容に即して、音声信号そのものや、形状情報又は可否情報を含む情報として読み替えて解釈するものとする。

　また、第２位置情報も符号化処理が施されているとよい。つまり、取得部１１０は、第２位置情報を取得して復号する。

　取得部１１０は、取得した第１位置情報及び第２位置情報を算出部１２０に出力する。また、取得部１１０が可否情報を取得した場合には、取得部１１０は、取得した可否情報を生成部１３０又は図示しない選択部に出力する。また、取得部１１０が形状情報を取得した場合には、取得部１１０は、取得した形状情報を算出部１２０及び生成部１３０に出力する。

　算出部１２０は、オブジェクトの移動速度、オブジェクトと受聴者Ｌとの距離、及び、オブジェクトが移動する場合に生じる単位時間当たりの風量などを算出する。算出部１２０は、第１算出部１２１、第２算出部１２２及び第３算出部１２３を有する。

　第１算出部１２１は、取得部１１０によって取得された第１位置情報に基づいて、オブジェクトの仮想空間における移動速度を算出する。上記の通り、取得部１１０は、仮想空間におけるオブジェクトの位置を示す第１位置情報を空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに取得している。第１算出部１２１は、空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに取得された第１位置情報（より具体的には、複数の第１位置情報）に基づいて、仮想空間においてオブジェクトの位置を時間で微分することにより、オブジェクトの仮想空間における移動速度を算出する。第１算出部１２１は、算出された移動速度を、生成部１３０に出力する。

　また、第２算出部１２２は、取得部１１０によって取得された第１位置情報及び第２位置情報に基づいて、オブジェクトと受聴者Ｌとの距離を算出する。上記の通り、取得部１１０は仮想空間における第１位置情報及び第２位置情報を空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに取得している。第２算出部１２２は、空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに取得された複数の第１位置情報及び複数の第２位置情報に基づいて、仮想空間においてオブジェクトと受聴者Ｌとの距離を算出する。第２算出部１２２は、算出されたオブジェクトと受聴者Ｌとの距離を、生成部１３０に出力する。

　また、取得部１１０が形状情報を取得している場合には、第３算出部１２３は、第１算出部１２１によって算出された移動速度及び取得部１１０によって取得された形状情報に基づいて、オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する。

　生成部１３０は、第１算出部１２１によって算出された移動速度、及び、第２算出部１２２によって算出された距離に基づいて、オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成する。生成部１３０は、生成した空力音信号を出力部１４０に出力する。

　出力部１４０は、生成部１３０によって生成された空力音信号を出力する。ここでは、出力部１４０は、空力音信号をヘッドフォン２００に出力する。これにより、ヘッドフォン２００は、出力された空力音信号が示す空力音を再生することができる。

　記憶部１５０は、取得部１１０、算出部１２０、生成部１３０及び出力部１４０が実行するコンピュータプログラムなどが記憶される記憶装置である。

　ここで、本実施の形態に係る形状情報について再度説明する。形状情報は、仮想空間におけるオブジェクトの映像の生成のために用いられる情報であってオブジェクト（車両４００）の形状を示す情報でもある。つまり、形状情報は、表示部３００に表示されるコンテンツ（映像）を生成するためにも用いられる情報である。

　取得部１１０は、取得した形状情報を表示部３００にも出力する。表示部３００は、取得部１１０によって出力された形状情報を取得する。表示部３００は、さらに、オブジェクト（車両４００）の仮想空間における形状以外の属性（色彩など）を示す属性情報を取得する。表示部３００は、属性情報を、音響信号処理装置１００以外の装置（サーバ装置５００）から直接取得してもよく、音響信号処理装置１００から取得してもよい。表示部３００は、取得した形状情報及び属性情報に基づいて、コンテンツ（映像）を生成して、表示する。

　以下、音響信号処理装置１００によって行われる音響信号処理方法の動作例１～動作例５について説明する。

　［動作例１］
　図４は、本実施の形態に係る音響信号処理装置１００の動作例１のフローチャートである。

　はじめに、取得部１１０は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、仮想空間における受聴者Ｌの位置を示す第２位置情報、及び、オブジェクトが空力音を生成するか否かを示す可否情報を取得する（Ｓ１０）。なお、このステップＳ１０が取得ステップに相当する。

　また、動作例１においては、形状情報が用いられないため、ステップＳ１０において取得部１１０は、形状情報を取得しない。

　また、取得部１１０は、継続的に、より具体的には空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに第１位置情報及び第２位置情報を取得する。つまり、空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに取得部１１０が第１位置情報及び第２位置情報を取得する処理が繰り返される。取得部１１０は、第１位置情報及び第２位置情報を取得するごとに当該第１位置情報及び当該第２位置情報を算出部１２０に出力、又は、一定数の第１位置情報及び第２位置情報を取得したのちに当該一定数の第１位置情報及び当該一定数の第２位置情報をまとめて算出部１２０に出力する。つまり、取得部１１０は、複数の第１位置情報及び複数の第２位置情報を算出部１２０に出力する。また、取得部１１０は、取得した可否情報を生成部１３０又は図示しない選択部に出力する。

　次に、算出部１２０（より具体的には、第１算出部１２１）は、取得部１１０によって取得された第１位置情報に基づいて、オブジェクトの仮想空間における移動速度を算出する（Ｓ２０）。なお、このステップＳ２０が第１算出ステップに相当する。第１算出部１２１は、算出された移動速度を生成部１３０に出力する。

　次に、算出部１２０（より具体的には、第２算出部１２２）は、取得部１１０によって取得された第１位置情報及び取得された第２位置情報に基づいて、オブジェクトと受聴者Ｌとの距離を算出する（Ｓ３０）。なお、このステップＳ３０が第２算出ステップに相当する第２算出部１２２は、算出された移動速度を生成部１３０に出力する。

　続いて、生成部１３０は、取得部１１０によって取得された可否情報が、オブジェクトが空力音を生成することを示すか否かを判断する（Ｓ４０）。

　可否情報が、オブジェクトが空力音を生成しないことを示す場合に（ステップＳ４０でＮｏ）、音響信号処理装置１００は、動作を終了する。また、可否情報が、オブジェクトが空力音を生成することを示す場合に（ステップＳ４０でＹｅｓ）、生成部１３０は、空力音信号を生成する（Ｓ５０）。より具体的には、生成部１３０は、第１算出部１２１によって算出された移動速度、及び、第２算出部１２２によって算出された距離に基づいて、オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成する。なお、このステップＳ５０が生成ステップに相当する。

　そして、出力部１４０は、生成部１３０によって生成された空力音信号を出力する（Ｓ６０）。なお、ステップＳ６０が出力ステップに相当する。ここでは、出力部１４０は、空力音信号をヘッドフォン２００に出力する。これにより、ヘッドフォン２００は、出力された空力音信号が示す空力音を再生することができる。

　ここで、ステップＳ５０において、生成部１３０が空力音信号を生成する方法として、以下の第１例及び第２例について説明する。

　＜第１例＞
　まずは、第１例について説明する。第１例においては、生成部１３０は、移動速度、及び、距離に加えて、空力音データに基づいて、空力音信号を生成する。

　図５及び図６は、図４が示すステップＳ５０において生成部１３０が空力音信号を生成する第１例の方法を示すフローチャートである。

　図５が示すように、生成部１３０が第１例の方法で空力音信号を生成する場合には、ステップＳ１０の前に、空力音データが記憶部１５０に記憶される（Ｓ７０）。そして、上記の通りステップＳ１０～Ｓ４０が行われた後、図６が示すように、生成部１３０は、記憶部１５０に記憶された空力音データ、第１算出部１２１によって算出された移動速度及び第２算出部１２２によって算出された距離に基づいて、空力音信号を生成する（Ｓ５１）。

　より具体的には、ステップＳ５１において、生成部１３０は、まず、記憶部１５０に記憶されている空力音データを取得する（Ｓ５１１）。

　空力音データとは、人の耳又は人の耳を模したモデルに風Ｗが到達することで生じる音が収音されたデータである。本動作例では、空力音データは、人の耳を模したモデルに風Ｗが到達することで生じる音が収音されたデータである。

　ここで空力音データについて図７及び図８を用いて説明する。図７は、動作例１における第１例の方法に係る空力音データを収音するためのダミーヘッドマイク１０を示す模式図である。図８は、動作例１における第１例の方法に係る空力音データを収音するためのダミーヘッドマイク２０を示す模式図である。

　図７が示すダミーヘッドマイク１０は、ダミーヘッド１１と、ダミーヘッド１１の両耳のそれぞれに設けられたマイクロフォン１２及び１３とを備えている。また、図８が示すダミーヘッドマイク２０は、簡易型のダミーヘッドマイクであり、人体の耳を模した模型にマイクロフォンが設けられている。このようなダミーヘッドマイク１０及び２０に、例えば扇風機５０から風Ｗが放射されることで、ダミーヘッドマイク１０及び２０は、風Ｗが受聴者Ｌの耳に到達することで生じる空力音を収音することができる。空力音データとは、この収音された空力音を示すデータ（音信号）である。

　そして、生成部１３０は、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された距離が小さいほど空力音の音量を大きくするように空力音信号を生成する（Ｓ５１２）。つまり生成された空力音信号は、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせられた信号であって、算出された距離が小さいほど空力音の音量を大きくする信号である。

　より具体的には、生成部１３０は、空力音データに基づいて、第１算出部１２１によって算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせた空力音信号を生成する。ここでは、生成部１３０は、移動速度が大きいほど、空力音データが含む周波数成分の周波数を高周波数側にシフトさせた空力音信号を生成する。例えば、生成部１３０は、ある周波数成分の周波数に、移動速度に応じた値を乗算することで、周波数を高周波数側にシフトさせる。

　また、さらに生成部１３０は、空力音データに基づいて、第２算出部１２２によって算出された距離が小さいほど空力音の音量を大きくするように空力音信号を生成する。例えば所定の距離が記憶部１５０に記憶されており、生成部１３０は、当該所定の距離より算出された距離が小さいほど空力音の音量が大きくなるように、当該所定の距離より算出された距離が大きいほど空力音の音量が小さくなるように、空力音信号を生成する。また例えば、生成部１３０は、空力音の音量が、当該距離のａ（ａは定数）乗で減衰するように空力音信号を生成する。

　第１例においては、生成部１３０は、周波数成分を高周波数側にシフトする上記処理と、空力音の音量を大きくする上記処理との両方を行うが、少なくとも一方を行ってもよい。

　また、第１例においては、空力音データは、人の耳を模したモデルに風Ｗが到達することで生じる音が収音されたデータであったが、人の耳に風Ｗが到達することで生じる音が収音されたデータであってもよい。この場合、人の両耳のそれぞれにマイクロフォンが設けられ、例えば扇風機５０から風Ｗが放射されることで、当該マイクロフォンが、風Ｗが受聴者Ｌの耳に到達することで生じる空力音を収音するとよい。空力音データとは、この収音された空力音を示すデータ（音信号）である。

　＜第２例＞
　続いて、生成部１３０が空力音信号を生成する第２例の方法について、説明する。

　図９は、図４が示すステップＳ５０において生成部１３０が空力音信号を生成する第２例の方法を示すフローチャートである。

　上記の通りステップＳ４０が行われた後、図９が示すように、生成部１３０は、空力音信号を生成する（Ｓ５２）。ここでは、生成部１３０は、第１算出部１２１によって算出された移動速度、第２算出部１２２によって算出された距離及び人の耳の形状に基づいて、空力音信号を生成する。

　より、具体的には、ステップＳ５２において、まず、生成部１３０は、第１算出部１２１によって算出された移動速度及び人の耳の形状に基づいて、処理信号を生成する（Ｓ５２１）。

　このステップＳ５２１では、以下の処理が行われる。生成部１３０は、雑音信号を複数の帯域強調フィルタのそれぞれで処理して、処理された複数の雑音信号のうち当該帯域強調フィルタが処理した雑音信号に当該帯域強調フィルタに対応する所定の係数を乗算する（Ｓ５２１ａ）。そして、生成部１３０は、所定の係数が乗算された複数の雑音信号を合成して処理信号を生成する（Ｓ５２１ｂ）。

　図１０Ａは、動作例１における第２例の方法に係る生成部１３０が空力音信号を生成する処理を説明する図である。

　上記の通り、仮想空間においてオブジェクトが移動することで、風Ｗが生じる。図１０Ａが示すように、生じた風Ｗが人の耳に到達することで、空力音が生じる。より具体的には、生じた風Ｗが人の耳に到達することで、空気の渦（カルマン渦）が発生し、このカルマン渦により空力音が生じる。ここでは、人の耳が、複数の幅（例えば第１幅ｄ１、第２幅ｄ２、第３幅ｄ３及び第４幅ｄ４）を有する窪みの集合体とみなして、キャビティ音生成モデルを当てはめることで、生成部１３０は、空力音信号を生成する。また、人の耳の例えば第１幅ｄ１に相当する箇所におけるカルマン渦周波数は、ｆ１で示され、式（１）を満たす。

　ｆ１　＝（Ｓｔ×ｖ）÷ｄ１　式（１）

　同様に、人の耳の第２幅ｄ２、第３幅ｄ３及び第４幅ｄ４に相当する箇所におけるカルマン渦周波数は、それぞれ、ｆ２、ｆ３及びｆ４で示され、式（２）、式（３）及び式（４）を満たす。

　ｆ２　＝（Ｓｔ×ｖ）÷ｄ２　式（２）
　ｆ３　＝（Ｓｔ×ｖ）÷ｄ３　式（３）
　ｆ４　＝（Ｓｔ×ｖ）÷ｄ４　式（４）

　例えば、第１～第４幅ｄ１～ｄ４のそれぞれは、平均的な人の耳の大きさが用いられるとよく、例えば０ｃｍ以上３ｃｍ以下の値が用いられるとよい。つまり、図１０Ａに示される人の耳は、また、平均的な人の耳がモデルとされている。なお、第１算出部１２１によって算出されたオブジェクトの移動速度は、オブジェクトの移動により生じた風Ｗの風速であるｖ（ｍ／ｓ）とみなすことができる。

　さらに、Ｓｔは、ストローハル数であり、キャビティ音生成モデルにおいては、一例として約０．４となる。また、カルマン渦周波数は、空力音の周波数に相当する。生成部１３０はカルマン渦周波数であるｆ１～ｆ４を式（１）～式（４）に従って算出する。生成部１３０は、このｆ１～ｆ４をそれぞれの中心周波数とする４つのバンドパスフィルタで雑音信号を処理することで、処理信号を生成する。

　また、図１０Ａに示した第１～第４幅ｄ１～ｄ４は、風Ｗが受聴者Ｌの正面から到来する場合の幅を示している。ここで、図１０Ｂを用いて、風Ｗが受聴者Ｌの正面以外から到来する場合について説明する。

　図１０Ｂは、動作例１における第２例の方法に係る生成部が空力音信号を生成する処理を説明する他の図である。より具体的には、図１０Ｂにおいては、風Ｗが受聴者Ｌの斜め上方４５度から到来する場合が示されている。この場合、図１０Ｂのように幅はその角度に応じて見かけ上変動するので、それに応じて周波数特性が変動することは自明である。

　図１１は、動作例１における第２例の方法に係る４つのバンドパスフィルタの一例とその処理を示す図である。４つのバンドパスフィルタは、それぞれｆ１～ｆ４を中心周波数とする周波数成分を通過させるフィルタであり、つまりは、受聴者Ｌの耳の形状に起因して生じる空力音を模擬するための帯域強調フィルタの一例である。

　生成部１３０は、雑音信号のうち図１１が示す４つのバンドパスフィルタの周波数成分を取り出して、合成することで、処理信号とする。なお中心周波数とは、当該バンドパスフィルタのゲインのピークとなる周波数でもある。なお、第２例においては、４つのバンドパスフィルタのそれぞれに入力される雑音信号として、白色雑音信号又はピンク雑音信号などが用いられるとよい。

　また、ここでは、４つのバンドパスフィルタから出力された出力信号に、当該中心周波数に応じた所定の係数を乗じてもよい。なお、出力信号とは、処理された雑音信号を意味する。当該所定の乗数は、中心周波数が低いほど大きな値であってもよい。典型的な空力音の周波数帯域（例えば５ｋＨｚ程度以下）では、周波数が低いほど受聴者Ｌによって知覚されるラウドネスが小さいためである。当該所定の乗数は、複数のバンドパスフィルタ（複数の帯域強調フィルタ）ごとに対応して定められた値であり、当該バンドパスフィルタによって処理された雑音信号に乗算される。

　また、４つのバンドパスフィルタ（複数の帯域強調フィルタ）のそれぞれは、受聴者Ｌの耳に到達する風Ｗの風速に応じて特性が変動してもよく、受聴者Ｌの耳に到達する風Ｗの風向に応じて特性が変動してもよい。

　さらに、図９が示すように、生成部１３０は、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された距離が小さいほど空力音の音量を大きくするように空力音信号を生成する（Ｓ５１２）。

　第２例においても、生成部１３０は、移動速度が大きいほど、合成された処理信号が含む周波数成分の周波数を高周波数側にシフトさせた空力音信号を生成する。さらに生成部１３０は、第２算出部１２２によって算出された距離が小さいほど空力音の音量を大きくするように空力音信号を生成する。つまりは、第１例で示した空力音データにかえて第２例では処理信号が用いられて処理が行われる。第２例においては、生成部１３０は、周波数成分を高周波数側にシフトする上記処理と、空力音の音量を大きくする上記処理との両方を行うが、少なくとも一方を行ってもよい。

　また、上記説明においては、人の耳についてキャビティ音生成モデルを当てはめる例について説明したが、これに限られない。図１２及び図１３は、動作例１における第２例の方法に係る生成部１３０が処理信号を生成する処理を説明する他の図である。

　生成部１３０は、図１２が示すように人の耳が１つのシリンダー形状であるとみなして、処理信号を生成してもよい。この場合、大きさｄ５である耳によって生じるカルマン渦の周波数（カルマン渦周波数）は、ｆ５で示され、式（５）を満たす。

　ｆ５　＝（Ｓｔ×ｖ）÷ｄ５　式（５）

　ストローハル数であるＳｔは、このモデルにおいては、一例として約０．２となる。そして、生成部１３０は上記と同様に、ｆ５を中心周波数とするバンドパスフィルタで雑音信号を処理することで、処理信号を生成する。

　また、生成部１３０は、図１３が示すように人の頭部が１つのシリンダー形状であるとみなして、処理信号を生成してもよい。この場合、大きさｄ６である頭部によって生じるカルマン渦の周波数（カルマン渦周波数）は、ｆ６で示され、式（６）を満たす。

　ｆ６　＝（Ｓｔ×ｖ）÷ｄ６　式（６）

　ストローハル数であるＳｔは、このモデルにおいては、一例として約０．２となる。そして、生成部１３０は上記と同様に、ｆ６を中心周波数とするバンドパスフィルタで雑音信号を処理することで、処理信号を生成する。なお、当該バンドパスフィルタは、受聴者Ｌの頭部の形状に起因して生じる空力音を模擬するためのフィルタである。

　このように、生成部１３０は、第１例及び第２例の方法で空力音信号を生成し、出力部１４０に出力する。

　そして、ステップＳ６０の処理が行われる。

　［動作例２］
　続いて、動作例２について説明する。

　図１４は、本実施の形態に係る音響信号処理装置１００の動作例２のフローチャートである。以下では、動作例１との相違点を中心に説明し、共通点の説明を省略又は簡略化する。

　はじめに、取得部１１０は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、仮想空間における受聴者Ｌの位置を示す第２位置情報、及び、オブジェクトの形状を示す形状情報を取得する（Ｓ１０ａ）。

　また、動作例２においては、可否情報が用いられないため、ステップＳ１０ａにおいて取得部１１０は、可否情報を取得しない。

　なお、動作例１と同様に、取得部１１０は、継続的に、より具体的には空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに第１位置情報及び第２位置情報を取得する。

　次に、ステップＳ２０及びＳ３０が行われる。

　続いて、生成部１３０は、取得部１１０によって取得された形状情報が示す形状、第１算出部１２１によって算出された移動速度及び第２算出部１２２によって算出された距離に基づいて、空力音信号を生成する（５０ａ）。

　ステップＳ５０ａにおいて、生成部１３０は、まず、記憶部１５０に記憶されている空力音データを取得する（Ｓ５１１）。

　次に、生成部１３０は、移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、距離が小さいほど空力音の音量を大きくするように、かつ、オブジェクトの体積が大きいほど空力音の音量を大きくするように空力音信号を生成する（Ｓ５１２ａ）。つまり生成された空力音信号は、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせられた信号であって、算出された距離が小さいほど空力音の音量を大きくする信号であって、オブジェクトの体積が大きいほど空力音の音量を大きくする信号である。なお、オブジェクトの体積は、形状情報が示す形状に基づいて、算出される。

　動作例２においては、生成部１３０は、周波数成分を高周波数側にシフトする上記処理と、距離に応じて空力音の音量を大きくする上記処理と、オブジェクトの体積に応じて空力音の音量を大きくする上記処理とを全て行うが、少なくとも１つを行ってもよい。なお、オブジェクトの体積に応じて空力音の音量を大きくする上記処理は、以下のように行われるとよい。例えば所定の体積が記憶部１５０に記憶されており、生成部１３０は、当該所定の体積よりオブジェクトの体積が大きいほど空力音の音量が大きくなるように、当該所定の体積よりオブジェクトの体積が小さいほど空力音の音量が小さくなるように、空力音信号を生成する。

　さらに、出力部１４０は、生成部１３０によって生成された空力音信号を出力する（Ｓ６０）。

　なお、図１４が示す動作例２においては、動作例１で示した第１例の方法の空力音データが用いられて、空力音信号が生成されたが、これに限られない。動作例２においては、動作例１で示した第２例の方法の処理信号が用いられて、空力音信号が生成されてもよい。

　［動作例３］
　続いて、動作例３について説明する。

　図１５は、本実施の形態に係る音響信号処理装置１００の動作例３のフローチャートである。以下では、動作例２との相違点を中心に説明し、共通点の説明を省略又は簡略化する。

　動作例３においては、動作例２と同じくステップＳ１０ａ、Ｓ２０及びＳ３０が行われる。

　次に、算出部１２０（より具体的には、第３算出部１２３）は、第１算出部１２１によって算出された移動速度及び取得部１１０によって取得された形状情報に基づいて、オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する（Ｓ３５）。

　ここで当該風量とは、オブジェクトが移動することによって、移動する空気の量を意味する。例えば記憶部１５０には、オブジェクトの移動速度とオブジェクトの形状と当該移動速度及び当該形状に対応付けられた風量とを示す風量データが記憶されている。第３算出部１２３は、移動速度及び形状に基づいて、記憶部１５０に記憶されている風量データを参照することで、風量を算出するとよい。

　続いて、生成部１３０は、第１算出部１２１によって算出された移動速度、第２算出部１２２によって算出された距離及び第３算出部１２３によって算出された風量に基づいて、空力音信号を生成する（５０ｂ）。

　ステップＳ５０ｂにおいて、生成部１３０は、まず、記憶部１５０に記憶されている空力音データを取得する（Ｓ５１１）。

　次に、生成部１３０は、移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ距離が小さいほど空力音の音量を大きくするように、かつ、風量が大きいほど空力音の音量を大きくするように空力音信号を生成する（Ｓ５１２ｂ）。つまり生成された空力音信号は、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせられた信号であって、算出された距離が小さいほど空力音の音量を大きくする信号であって、風量が大きいほど空力音の音量を大きくする信号である。

　動作例３においては、生成部１３０は、周波数成分を高周波数側にシフトする上記処理と、距離に応じて空力音の音量を大きくする上記処理と、風量に応じて空力音の音量を大きくする上記処理とを全て行うが、少なくとも１つを行ってもよい。なお、風量に応じて空力音の音量を大きくする上記処理は、以下のように行われるとよい。例えば所定の風量が記憶部１５０に記憶されており、生成部１３０は、当該所定の風量より算出された風量が大きいほど空力音の音量が大きくなるように、当該所定の風量より算出された風量が小さいほど空力音の音量が小さくなるように、空力音信号を生成する。

　［動作例４］
　続いて、動作例４について説明する。

　動作例３においては、ステップＳ３５では、風量データが用いられて、オブジェクトが移動する場合に生じる単位時間当たりの風量が算出されたがこれに限られない。

　動作例４では、仮想空間におけるオブジェクトの移動方向（進行方向）に応じた処理が行われる例について説明する。

　図１６は、本実施の形態に係る音響信号処理装置１００の動作例４のフローチャートである。以下では、動作例３との相違点を中心に説明し、共通点の説明を省略又は簡略化する。

　動作例４においては、動作例３と同じくステップＳ１０ａ、Ｓ２０及びＳ３０が行われる。

　次に、ステップＳ３５が行われる。このステップＳ３５で行われる処理について、以下より詳細に説明する。

　本動作例においては、オブジェクトは、航空機７００である。図１７は、本実施の形態に係る音響信号処理装置の動作例４に係るオブジェクトである航空機７００を示す図である。このように、オブジェクトが航空機７００である場合には、形状情報には、オブジェクトの移動方向が示されている。図１７においては、オブジェクト（航空機７００）の移動方向（進行方向）は、紙面手前方向である。

　この場合、ステップＳ３５において、より詳細な処理として、以下の処理が行われる。すなわち、第３算出部１２３は、取得部１１０によって取得された形状情報に示されるオブジェクトの移動方向から見たオブジェクトの面積、及び、第１算出部１２１によって算出された移動速度に基づいて、風量を算出する（Ｓ３５ｃ）。

　当該面積とは、オブジェクトである航空機７００の移動方向（進行方向）から、当該オブジェクトを見たときに、当該オブジェクトの輪郭で囲まれる面積である。当該面積とは、例えば、図１７が示す航空機７００が占める範囲である。

　ステップＳ３５ｃでは、第３算出部１２３は、オブジェクトの面積と、移動速度との乗算により風量を算出する。より具体的には、第３算出部１２３は、オブジェクトの面積と、移動速度と、所定の定数との乗算により風量を算出するとよい。

　そして、図１６が示すように、ステップＳ５０ｂ及びＳ６０が行われる。

　なお、本動作例においては、オブジェクトとして航空機７００が用いられたがこれに限られない。移動方向（進行方向）が自明であるオブジェクト、又は、形状情報に移動方向（進行方向）が示されているオブジェクトが用いられた場合には、本動作例の処理が適用可能である。

　［動作例５］
　続いて、動作例５について説明する。

　まずは、動作例５におけるオブジェクトについて説明する。

　図１８は、本実施の形態に係る音響信号処理装置の動作例５に係るオブジェクトであるうちわ８００を示す図である。うちわ８００は、動作例４に係る航空機７００とは異なり移動方向が自明ではなく、うちわ８００の移動方向は、例えば、図１８の紙面上下方向、紙面左右方向及び紙面手前奥方向の少なくとも１つである。

　このように、移動方向が自明でないオブジェクトが用いられる場合には、動作例４の処理を行うことは困難である。動作例５では、このような場合においても、オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する例を説明する。

　図１９は、本実施の形態に係る音響信号処理装置１００の動作例５のフローチャートである。以下では、動作例３との相違点を中心に説明し、共通点の説明を省略又は簡略化する。

　動作例５においては、動作例３と同じくステップＳ１０ａが行われる。

　次に、第１算出部１２１は、取得部１１０によって取得された第１位置情報に基づいて、オブジェクトの移動速度及び移動方向を算出する（Ｓ２０ｅ）。上記の通り、取得部１１０は仮想空間におけるオブジェクトの位置を示す第１位置情報を空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新ごとに取得している。第１算出部１２１は、１つの第１位置情報と、空間情報管理部Ａ０２０１及びＡ０２１１で実行される空間情報の更新後に取得された１つの第１位置情報との差分から、オブジェクトの仮想空間における移動方向を算出する。

　続いて、ステップＳ３０が行われる。

　次に、第３算出部１２３は、取得部１１０によって取得された形状情報、第１算出部１２１によって算出された移動方向、及び、算出された移動速度に基づいて、オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する（Ｓ３５ｅ）。

　ステップＳ３５ｅでは、まず、第３算出部１２３は、形状情報及び移動方向に基づいて、オブジェクトの移動方向から見たオブジェクトの面積を算出する。なお、オブジェクトであるうちわ８００は、持ち手８０１と扇面８０２とを有する。うちわ８００が、上下方向（以下第１方向）、左右方向（以下第２方向）及び紙面手前奥方向（以下第３方向）に移動した場合を検討する。なお、第１方向は、扇面８０２に水平な方向であって持ち手８０１が延びる方向である。第２方向は、扇面８０２に水平な方向であって第１方向に垂直な方向である。第３方向は、扇面８０２に垂直な方向である。図１８が示すように、このうちわ８００は、第３方向に厚みの薄いうちわである。

　うちわ８００の移動方向が第１方向である場合に、移動方向から見たオブジェクトの面積を以下第１面積とする。うちわ８００の移動方向が第２方向である場合に、移動方向から見たオブジェクトの面積を以下第２面積とする。うちわ８００の移動方向が第３方向である場合に、移動方向から見たオブジェクトの面積を以下第３面積とする。うちわ８００は第３方向に厚みが薄いため、第１面積及び第２面積は、第３面積に比べて非常に小さい値となる。

　さらに、ステップＳ３５ｅでは、第３算出部１２３は、オブジェクトの移動方向から見たオブジェクトの面積、及び、移動速度に基づいて風量を算出する。例えば、動作例４のステップＳ３５と同じく、第３算出部１２３は、オブジェクトの面積と、移動速度と、所定の定数との乗算により風量を算出するとよい。

　例えば本動作例においては、第１面積及び第２面積は、第３面積に比べて非常に小さい値となることから、うちわ８００の移動方向が第１方向及び第２方向である場合に比べて、うちわ８００の移動方向が第３方向である場合の風量が大きくなる。

　そして、図１９が示すように、ステップＳ５０ｂ及びＳ６０が行われる。

　続いて、パイプライン処理について説明する。

　上述の算出部１２０、生成部１３０、及び、選択部で行われる処理は、例えば特許文献２で説明されているようなパイプライン処理の一部として行われてもよい。図２０は、図２Ｇ及び図２Ｈのレンダリング部Ａ０２０３及びＡ０２１３がパイプライン処理を行う場合を説明するための機能ブロック図及びステップの一例を示す図である。図２０での説明においては、図２Ｇ及び図２Ｈのレンダリング部Ａ０２０３及びＡ０２１３の一例であるレンダリング部９００を用いて説明する。

　パイプライン処理とは、音響効果を付与するための処理を複数の処理に分割し、各処理を１つずつ順番に実行することを指す。分割された処理のそれぞれでは、例えば、音声信号に対する信号処理、又は信号処理に用いるパラメータの生成などが実行される。

　本実施の形態におけるレンダリング部９００は、パイプライン処理として、例えば残響効果、初期反射音、距離減衰効果、バイノーラル処理などを施す処理を含む。ただし、上記の処理は一例であり、それ以外の処理を含んでいてもよいし、一部の処理を含んでいなくてもよい。例えば、レンダリング部９００がパイプライン処理として、回折処理又はオクルージョン処理を含んでいてもよいし、例えば残響処理が不要な場合は省略されてもよい。また、それぞれの処理をステージと表現し、それぞれの処理の結果生成される反射音などの音声信号をレンダリングアイテムと表現してもよい。パイプライン処理における各ステージの順番と、パイプライン処理に含まれるステージとは図２０に示した例に限られない。

　なお、図２０で示すすべてのステージがレンダリング部９００に備わっていなくてもよく、一部のステージが省略されたり、レンダリング部９００以外に他のステージが存在したりしてもよい。

　パイプライン処理の一例として、残響処理、初期反射処理、距離減衰処理、選択処理、生成処理、バイノーラル処理のそれぞれで行われる処理について説明する。それぞれの処理では入力信号に含まれるメタデータを解析して、反射音の生成に必要なパラメータを算出する。

　なお、図２０においては、レンダリング部９００は、残響処理部９０１、初期反射処理部９０２、距離減衰処理部９０３、選択部９０４、算出部１２０、生成部１３０及びバイノーラル処理部９０５を備える。ここでは、残響処理部９０１が残響処理ステップを、初期反射処理部９０２が初期反射処理ステップを、距離減衰処理部９０３が距離減衰処理ステップを、選択部９０４が選択処理ステップを、バイノーラル処理部９０５がバイノーラル処理ステップを行う例について説明する。

　残響処理ステップでは、残響処理部９０１が残響音を示す音声信号又は音声信号の生成に必要なパラメータを生成する。残響音とは、直接音の後に残響としてリスナに到達する残響音を含む音である。一例として、残響音は、後述する初期反射音がリスナへ到達した後の比較的後期（例えば、直接音の到達時から百数十ｍｓ程度）の段階で、初期反射音よりも多くの回数（例えば、数十回）の反射を経てリスナへ到達する残響音である。残響処理部９０１は、入力信号に含まれる音声信号及び空間情報を参照し、事前に準備してある残響音を生成するための所定の関数を用いて計算する。

　残響処理部９０１は、当該音信号に、公知の残響生成方法を適用して、残響を生成してもよい。公知の残響生成方法とは、一例として、シュレーダー法であるが、これに限られない。また、残響処理部９０１は、公知の残響生成処理を適用する際に、空間情報が示す音再生空間の形状及び音響特性を用いる。これにより、残響処理部９０１は、残響を示す音声信号を生成するためのパラメータを算出することができる。

　初期反射処理ステップでは、初期反射処理部９０２が、空間情報に基づいて、初期反射音を生成するためのパラメータを算出する。初期反射音は、音源オブジェクトから直接音がリスナへ到達した後の比較的初期（例えば、直接音の到達時から数十ｍｓ程度）の段階で、１回以上の反射を経てリスナへ到達する反射音である。初期反射処理部９０２は、例えば音信号及びメタデータを参照し、三次元音場（空間）の形状、大きさ、構造物等のオブジェクトの位置、及びオブジェクトの反射率等を用いて、音源オブジェクトからオブジェクトで反射してリスナに到達する反射音の経路を計算する。また、初期反射処理部９０２が直接音の経路も算出してもよい。当該経路の情報が初期反射音を生成するためのパラメータとして用いられるとともに、選択部９０４における反射音の選択処理のためのパラメータとして用いられてもよい。

　距離減衰処理ステップでは、距離減衰処理部９０３が、初期反射処理部９０２が算出した直接音の経路の長さと反射音の経路の長さとの差に基づいて、リスナに到達する音量を算出する。リスナに到達する音量は、音源の音量に対して、リスナまでの距離に比例して減衰（距離に反比例）するので、直接音の音量は、音源の音量を直接音の経路の長さで除して得ることができ、反射音の音量は、音源の音量を反射音のパスの長さで除して算出することができる。

　選択処理ステップでは、選択部９０４が、生成する空力音又は反射音を選択する。それ以前のステップで算出されたパラメータに基づいて、選択処理が実行されてもよい。

　選択処理がパイプライン処理の一部で実行される場合、選択処理において選択されなかった反射音については、パイプライン処理における選択処理以降の処理を実行する対象としなくてもよい。選択されなかった反射音について選択処理以降の処理を実行しないことで、選択されなかった反射音についてバイノーラル処理のみを実行しないことを決定する場合よりも、音響信号処理装置１００の演算負荷を低減することが可能になる。

　また、本実施の形態で説明した選択処理がパイプライン処理の一部で実行される場合、選択処理の順番が、パイプライン処理における複数の処理の順番のうちより早い順番で実行されるように設定すると、より多くの選択処理以降の処理を省略できるため、より多くの演算量を削減することができる。例えば算出部１２０及び生成部１３０が処理より前の順番で選択処理が実行されると、選択しないことが決定されたオブジェクトに係る空力音についての処理を省略することができ、より音響信号処理装置１００における演算量を削減することが出来る。

　また、レンダリングアイテムを生成するパイプライン処理の一部で算出されたパラメータが、選択部９０４又は算出部１２０で用いられてもよい。

　バイノーラル処理ステップでは、バイノーラル処理部９０５が、直接音の音声信号に対して音源オブジェクトの方向からリスナに到達する音として知覚されるように、信号処理を実行する。さらにバイノーラル処理部９０５は、反射音が反射に関わる障害物オブジェクトからリスナに到達する音として知覚されるように、信号処理を実行する。音空間におけるリスナの座標及び向き（つまり、受聴点の位置及び向き）に基づいて、音源オブジェクトの位置又は障害物オブジェクトの位置から音がリスナに到達するように、ＨＲＩＲＨｅａｄ―Ｒｅｌａｔｅｄ　Ｉｍｐｕｌｓｅ　Ｒｅｓｐｏｎｓｅｓ）　ＤＢ（Ｄａｔａ　ｂａｓｅ）を適用する処理を実行する。なお、受聴点は、例えば、リスナの頭部の動きに合わせてその位置及び方向が変化されてもよい。また、リスナの位置を示す情報がセンサから取得されてもよい。

　パイプライン処理及びバイノーラル処理に用いるプログラム、音響処理に必要な空間情報、ＨＲＩＲ　ＤＢ、及び、閾値データなどその他のパラメータは、音響信号処理装置１００に備わるメモリ又は外部から取得する。ＨＲＩＲ（Ｈｅａｄ―Ｒｅｌａｔｅｄ　Ｉｍｐｕｌｓｅ　Ｒｅｓｐｏｎｓｅｓ）とは、１個のインパルスを発生させたときの応答特性である。言い換えれば、ＨＲＩＲとは、耳殻、人頭及び肩まで含めた周辺物によって生じる音の変化を伝達関数として表現した頭部伝達関数をフーリエ変換することで、周波数領域における表現から時間領域における表現に変換された応答特性である。ＨＲＩＲ　ＤＢは、このような情報を含むデータベースである。

　また、パイプライン処理の一例として、レンダリング部９００は図示していない処理部を含んでいてもよい。例えば、回折処理部又はオクルージョン処理部を含んでいてもよい。

　回折処理部は、三次元音場（空間）におけるリスナと音源オブジェクトとの間にある障害物に起因する回折音を含む音を示す音声信号を生成する処理を実行する。回折音は、音源オブジェクトとリスナとの間に障害物がある場合に、当該障害物を回り込むようにして音源オブジェクトからリスナへ到達する音である。

　回折処理部は、例えば音信号及びメタデータを参照し、三次元音場（空間）における音源オブジェクトの位置、リスナの位置、並びに障害物の位置、形状、及び大きさ等を用いて、音源オブジェクトから障害物を迂回してリスナへと到達する経路を計算し、当該経路に基づいて回折音を生成する。

　オクルージョン処理部は、いずれかのステップで取得した空間情報及び障害物オブジェクトの材質などの情報に基づいて、障害物オブジェクトの向こう側に音源オブジェクトがある場合に漏れ聞こえる音声信号を生成する。

　なお、上記実施の形態では、音源オブジェクトに付与する位置情報は、仮想空間内における「点」として定義したものであり、所謂「点音源」であるとして発明の詳細を説明した。一方で、仮想空間における音源を定義する方法として、長さ、大きさ又は形状などを有する物体として、点音源でない、空間的に拡張された音源を定義する場合もある。そのような場合は、リスナと音源との距離又は音の到来方向が確定しないので、それに起因する反射音は解析が行われるまでもなく、或いは解析結果の如何にかかわらず、上記選択部９０４で「選択する」方の処理に限定してもよい。そうすることによって、反射音を選択しないことによって生じるかもしれない音質の劣化を避けることができるからである。又は、当該物体の重心など代表点が定められて、その代表点から音が発生しているとして本開示の処理を適用してもよいが、その場合は、音源の空間的な拡張の情報に応じて閾値を調整した上で本開示の処理を適用してもよい。

　続いて、ビットストリームの構造例について説明する。

　ビットストリームには、例えば、音声信号と、メタデータと、が含まれる。音声信号は、音の周波数及び強弱に関する情報などを示す、音が表現された音データである。メタデータに含まれる空間情報は、音声信号に基づく音を聞くリスナが位置する空間に関する情報である。具体的には、空間情報は、当該音の音像を、音空間（例えば、三次元音場内）における所定の位置に定位させる際の、つまり、リスナに所定方向から到達する音として知覚させる際の当該所定の位置（定位位置）に関する情報である。空間情報には、例えば、音源オブジェクト情報と、リスナの位置を示す位置情報と、が含まれる。

　音源オブジェクト情報は、音声信号に基づく音を発生させる、つまり、音声信号を再生する物体を示すオブジェクトの情報であって、当該物体が配置される実空間に対応する仮想的な空間である音空間に配置される仮想的なオブジェクト（音源オブジェクト）に関する情報である。音源オブジェクト情報は、例えば、音空間に配置される音源オブジェクトの位置を示す情報、音源オブジェクトの向きに関する情報、音源オブジェクトが発する音の指向性に関する情報、音源オブジェクトが生物に属するか否かを示す情報、及び、音源オブジェクトが動体であるか否かを示す情報などを含む。例えば、音声信号は、音源オブジェクト情報が示す１以上の音源オブジェクトに対応している。

　ビットストリームのデータ構造の一例として、ビットストリームは、例えばメタデータ（制御情報）と音声信号とで構成される。

　音声信号とメタデータとは一つのビットストリームに格納されていてもよいし、複数のビットストリームに別々に格納されていてもよい。同様に音声信号とメタデータとは一つのファイルに格納されていてもよいし、複数のファイルに別々に格納されていてもよい。

　ビットストリームは音源ごとに存在してもよいし、再生時間ごとに存在してもよい。再生時間ごとにビットストリームが存在する場合、同時に複数のビットストリームが並列で処理されてもよい。

　メタデータは、ビットストリームごとに付与されてもよく、複数のビットストリームを制御する情報としてまとめて付与されてもよい。また、メタデータは、再生時間ごとに付与されてもよい。

　音声信号とメタデータとは、複数のビットストリーム又は複数のファイルに別々に格納されている場合、一つ又は一部のビットストリーム又はファイルに関連する他のビットストリーム又はファイルを示す情報が含まれていてもよいし、全てのビットストリーム又はファイルのそれぞれに関連する他のビットストリーム又はファイルを示す情報が含まれていてもよい。ここで、関連するビットストリーム又はファイルとは、例えば、音響処理の際に同時に用いられる可能性のあるビットストリーム又はファイルである。また、関連するビットストリーム又はファイルには、関連する他のビットストリーム又はファイルを示す情報をまとめて記述したビットストリーム又はファイルが含まれていてもよい。ここで、関連する他のビットストリーム又はファイルを示す情報とは、例えば当該他のビットストリームを示す識別子又は他のファイルを示すファイル名又はＵＲＬ（Ｕｎｉｆｏｒｍ　Ｒｅｓｏｕｒｃｅ　Ｌｏｃａｔｏｒ）又はＵＲＩ（Ｕｎｉｆｏｒｍ　Ｒｅｓｏｕｒｃｅ　Ｉｄｅｎｔｉｆｉｅｒ）などである。この場合、取得部１１０は、関連する他のビットストリーム又はファイルを示す情報に基づいてビットストリーム又はファイルを特定又は取得する。また、ビットストリーム内に関連する他のビットストリームを示す情報が含まれていると共に、ビットストリーム内に別のビットストリーム又はファイルに関連するビットストリーム又はファイルを示す情報を含めていてもよい。ここで、関連するビットストリーム又はファイルを示す情報を含むファイルとは、例えばコンテンツの配信に用いられるマニフェストファイルなどの制御ファイルであってもよい。

　なお、全てのメタデータ又は一部のメタデータは音声信号のビットストリーム以外から取得されてもよい。例えば、音響を制御するメタデータと映像を制御するメタデータとのいずれかがビットストリーム以外から取得されてもよいし、両方のメタデータがビットストリーム以外から取得されてもよい。また、映像を制御するメタデータが音声信号再生システムで取得されるビットストリームに含まれる場合は、音声信号再生システムは映像の制御に用いることができるメタデータを、画像を表示する表示装置、又は立体映像を再生する立体映像再生装置に対して出力する機能を備えていてもよい。

　さらに、メタデータに含まれる情報の例について説明する。

　メタデータは、音空間で表現されるシーンを記述するために用いられる情報であってもよい。ここでシーンとは、メタデータを用いて、音声信号再生システムでモデリングされる、音空間における三次元映像及び音響イベントを表すすべての要素の集合体を指す用語である。つまり、ここでいうメタデータとは、音響処理を制御する情報だけでなく、映像処理を制御する情報も含んでいてもよい。勿論、メタデータには、音響処理と映像処理とのいずれか一方だけを制御する情報が含まれていてもよいし、両方の制御に用いられる情報が含まれていてもよい。

　音声信号再生システムは、ビットストリームに含まれるメタデータ及び、追加で取得されるインタラクティブなリスナの位置情報などを用いて、音声信号に音響処理を行うことで、仮想的な音響効果を生成する。本実施の形態では、音響効果のうち、初期反射処理と、障害物処理と、回折処理と、遮断処理と、残響処理とを行う場合を説明するが、メタデータを用いてほかの音響処理を行ってもよい。例えば、音声信号再生システムは、距離減衰効果、ローカリゼーション、ドップラー効果などの音響効果を付加することが考えられる。また、音響効果の全て又は一部のオンオフを切り替える情報、優先度情報をメタデータとして付加してもよい。

　また、一例として、符号化されたメタデータは、音源オブジェクト及び障害物オブジェクトを含む音空間に関する情報と、当該音の音像を音空間内において所定位置に定位させる（つまり、所定方向から到達する音として知覚させる）際の定位位置に関する情報とを含む。ここで、障害物オブジェクトは、音源オブジェクトが発する音がリスナへと到達するまでの間において、例えば音を遮ったり、音を反射したりして、リスナが知覚する音に影響を及ぼし得るオブジェクトである。障害物オブジェクトは、静止物体の他に、人等の動物、又は機械等の動体を含み得る。また、音空間に複数の音源オブジェクトが存在する場合、任意の音源オブジェクトにとっては、他の音源オブジェクトは障害物オブジェクトとなり得る。建材又は無生物などの音を発しないオブジェクトである非発音オブジェクトも、音を発する音源オブジェクトも障害物オブジェクトとなり得る。

　メタデータには、音空間の形状、音空間に存在する障害物オブジェクトの形状情報及び位置情報、音空間に存在する音源オブジェクトの形状情報及び位置情報、並びに音空間におけるリスナの位置及び向きをそれぞれ表す情報のすべて又は一部が含まれる。

　音空間は、閉空間又は開空間のいずれであってもよい。また、メタデータには、例えば床、壁、又は天井等の音空間において音を反射し得る構造物の反射率、及び音空間に存在する障害物オブジェクトの反射率を表す情報が含まれる。ここで、反射率は、反射音と入射音とのエネルギーの比であって、音の周波数帯域ごとに設定されている。勿論、反射率は、音の周波数帯域に依らず、一律に設定されていてもよい。音空間が開空間の場合は、例えば一律で設定された減衰率、回折音、初期反射音などのパラメータが用いられてもよい。

　上記説明では、メタデータに含まれる障害物オブジェクト又は音源オブジェクトに関するパラメータとして、反射率を挙げたが反射率以外の情報を含んでいてもよい。例えば、反射率以外の情報は、音源オブジェクト及び非発音オブジェクトの両方に関わるメタデータとして、オブジェクトの素材に関する情報を含んでいてもよい。具体的には、反射率以外の情報は、拡散率、透過率、吸音率などのパラメータを含んでいてもよい。

　音源オブジェクトに関する情報として、音量、放射特性（指向性）、再生条件、ひとつのオブジェクトから発せられる音源の数及び種類、並びに、オブジェクトにおける音源領域を指定する情報などを含めてもよい。再生条件では例えば、継続的に流れ続ける音なのかイベント発動する音なのかが定められてもよい。オブジェクトにおける音源領域は、リスナの位置とオブジェクトの位置との相対的な関係で定めてもよいし、オブジェクトを基準として定めてもよい。オブジェクトにおける音源領域がリスナの位置とオブジェクトの位置との相対的な関係で定められる場合、リスナがオブジェクトを見ている面を基準とし、リスナから見てオブジェクトの右側からは音Ａ、左側からは音Ｂが発せられているようにリスナに知覚させることができる。オブジェクトにおける音源領域がオブジェクトを基準として定められる場合、リスナの見ている方向に関わらず、オブジェクトのどの領域からどの音を出すかは固定にすることができる。例えばオブジェクトを正面から見たときの右側からは高い音、左側からは低い音が流れているようにリスナに知覚させることができる。この場合、リスナがオブジェクトの背面に回り込んだ場合、背面から見て右側からは低い音、左側からは高い音が流れているようにリスナに知覚させることができる。

　空間に関するメタデータとして、初期反射音までの時間、残響時間、直接音と拡散音との比率などを含めることができる。直接音と拡散音との比率がゼロの場合、直接音のみをリスナに知覚させることができる。

　本実施の形態をまとめると以下の通りである。

　本実施の形態に係る音響信号処理方法は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、仮想空間における受聴者Ｌの位置を示す第２位置情報を取得する取得ステップと、取得された第１位置情報に基づいて、オブジェクトの移動速度を算出する第１算出ステップと、取得された第１位置情報及び取得された第２位置情報に基づいて、オブジェクトと受聴者Ｌとの距離を算出する第２算出ステップと、算出された移動速度及び算出された距離に基づいて、オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された空力音信号を出力する出力ステップと、を含む。

　これにより、音響信号処理方法は、仮想空間におけるオブジェクトの位置及び受聴者Ｌの位置に基づいて、オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成し、生成された空力音信号を出力することができる。この空力音信号などがヘッドフォン２００又はスピーカなどに出力されることで、受聴者Ｌは当該空力音を受聴することができる。このため、受聴者Ｌは、当該オブジェクトが移動していることを知覚することができ、臨場感を得ることができる。つまりは、本開示の一態様に係る音響信号処理方法は、受聴者Ｌに臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、生成ステップでは、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された距離が小さいほど空力音の音量を大きくするように空力音信号を生成する。

　これにより、オブジェクトの移動速度、及び、オブジェクトと受聴者Ｌとの距離に応じて、受聴者Ｌが受聴する空力音を制御することができるため、受聴者Ｌは、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、取得ステップでは、オブジェクトが空力音を生成するか否かを示す可否情報を取得し、生成ステップでは、取得された可否情報が、オブジェクトが空力音を生成することを示す場合に、空力音信号を生成する。

　さらに、第１位置情報、第２位置情報及び可否情報によって空力音信号が生成されることができる。つまりは、本実施の形態に係る音響信号処理方法においては、第１位置情報、第２位置情報及び可否情報以外の他の情報がなくても、空力音信号が生成されることができる。

　本実施の形態に係る音響信号処理方法においては、取得ステップでは、オブジェクトの形状を示す形状情報を取得し、生成ステップでは、取得された形状情報が示す形状、算出された移動速度及び算出された距離に基づいて、空力音信号を生成する。

　これにより、空力音信号が、オブジェクトの形状、オブジェクトの移動速度、及び、オブジェクトと受聴者Ｌとの距離に応じて生成されるため、より臨場感のある空力音を受聴者Ｌが受聴することができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　さらに、第１位置情報、第２位置情報及び形状情報によって空力音信号が生成されることができる。つまりは、本実施の形態に係る音響信号処理方法においては、第１位置情報、第２位置情報及び形状情報以外の他の情報がなくても、空力音信号が生成されることができる。

　本実施の形態に係る音響信号処理方法においては、生成ステップでは、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された距離が小さいほど空力音の音量を大きくするように、かつ、取得された形状情報に基づいてオブジェクトの体積が大きいほど空力音の音量を大きくするように空力音信号を生成する。

　これにより、オブジェクトの移動速度、オブジェクトと受聴者Ｌとの距離、及び、オブジェクトの体積に応じて、受聴者Ｌが受聴する空力音を制御することができるため、受聴者Ｌは、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、算出された移動速度及び取得された形状情報に基づいて、オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する第３算出ステップを含み、生成ステップでは、算出された移動速度、算出された距離及び算出された風量に基づいて、空力音信号を生成する。

　これにより、空力音信号が、オブジェクトの移動速度、オブジェクトと受聴者Ｌとの距離、及び、上記風量に応じて生成されるため、より臨場感のある空力音を受聴者Ｌが受聴することができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、生成ステップでは、算出された移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、算出された距離が小さいほど空力音の音量を大きくするように、かつ、算出された風量が大きいほど空力音の音量を大きくするように空力音信号を生成する。

　これにより、オブジェクトの移動速度、オブジェクトと受聴者Ｌとの距離、及び、上記風量に応じて、受聴者Ｌが受聴する空力音を制御することができるため、受聴者Ｌは、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、生成ステップでは、算出された移動速度、算出された距離及び人の耳の形状に基づいて、空力音信号を生成する。

　これにより、空力音信号が、人の耳の形状に基づく音生成モデルに応じて生成されるため、より臨場感のある空力音を受聴者Ｌが受聴することができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　また、平均的な人の耳をモデルとすることで、仮想空間のユーザ（例えば仮想空間内で実行されるコンテンツの提供者）が空力音を示すデータを、当該コンテンツのために準備しておく必要が省かれる。

　本実施の形態に係る音響信号処理方法においては、人の耳又は人の耳を模したモデルに風Ｗが到達することで生じる音が収音されたデータである空力音データが記憶される記憶ステップと、生成ステップでは、記憶された空力音データ、算出された移動速度及び算出された距離に基づいて、空力音信号を生成する。

　これにより、空力音信号が、実際に生じた音が収音されたデータに応じて生成されるため、より臨場感のある空力音を受聴者Ｌが受聴することができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、第３算出ステップでは、取得された形状情報に示されるオブジェクトの移動方向から見たオブジェクトの面積、及び、算出された移動速度に基づいて、風量を算出する。

　これにより、上記風量が、形状情報に示されるオブジェクトの移動方向から見たオブジェクトの面積、及び、移動速度に基づいて算出される。そして、空力音信号が、このような風量、オブジェクトの移動速度、及び、オブジェクトと受聴者Ｌとの距離に応じて生成されるため、より臨場感のある空力音を受聴者Ｌが受聴することができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、第１算出ステップでは、取得された第１位置情報に基づいて、オブジェクトの移動速度及び移動方向を算出し、第３算出ステップでは、取得された形状情報、算出された移動方向、及び、算出された移動速度に基づいて、風量を算出する。

　これにより、上記風量が、形状情報、移動方向及び移動速度に基づいて算出される。そして、空力音信号が、このような風量、オブジェクトの移動速度、及び、オブジェクトと受聴者Ｌとの距離に応じて生成されるため、より臨場感のある空力音を受聴者Ｌが受聴することができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、雑音信号を複数の帯域強調フィルタのそれぞれで処理して、処理された複数の雑音信号の合成を行って処理することで、仮想空間における受聴者Ｌの耳に風Ｗが到達することで生じる空力音を示す空力音信号を生成する生成ステップと、生成された空力音信号を出力する出力ステップと、を含み、複数の帯域強調フィルタのそれぞれは、受聴者Ｌの耳又は頭部の形状に起因して生じる空力音を模擬するためのフィルタである。

　これにより、音響信号処理方法は、仮想空間における受聴者Ｌに、仮想空間における受聴者Ｌの耳に風Ｗが到達することで生じる空力音を示す空力音信号を生成し、生成した空力音信号を出力することができる。この空力音信号などがヘッドフォン又はスピーカなどに出力されることで、受聴者Ｌは当該空力音を受聴することができる。このため、受聴者Ｌは、仮想空間において風Ｗが吹いていることを知覚することができ、臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者Ｌに臨場感を与えることができる。

　さらに、仮想空間において吹いている風Ｗは、上記のように、オブジェクトの移動により生じる風Ｗとは異なり、現実空間で自然に吹いているそよ風、又は、暴風などを模した風であってもよい。当然この場合は、風Ｗの発生源の位置は特定されないし、当該位置と受聴者との位置関係も特定されない。この場合でも、受聴者Ｌは、仮想空間において風Ｗが吹いていることを知覚することができ、臨場感を得ることができる。

　本実施の形態に係る音響信号処理方法においては、複数の帯域強調フィルタは、処理された複数の雑音信号のうち当該帯域強調フィルタが処理した雑音信号に当該帯域強調フィルタに対応する所定の係数の乗算を行い、生成ステップでは、乗算が行われた後に、合成を行う。

　これにより、音響信号処理方法により生成される空力音が、現実空間で受聴者Ｌが受聴する空力音により似た音となる。そのため、受聴者Ｌは、より臨場感を得ることができる。つまりは、音響信号処理方法は、受聴者Ｌにより臨場感を与えることができる。

　本実施の形態に係る音響信号処理方法においては、複数の帯域強調フィルタのそれぞれは、耳に到達する風Ｗの風速に応じて特性が変動する。

　本実施の形態に係る音響信号処理方法においては、複数の帯域強調フィルタのそれぞれは、耳に到達する風Ｗの風向に応じて特性が変動する。

　本実施の形態に係るコンピュータプログラムは、上記記載の音響信号処理方法をコンピュータに実行させるためのコンピュータプログラムである。

　本実施の形態に係る音響信号処理装置１００は、仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、仮想空間における受聴者Ｌの位置を示す第２位置情報を取得する取得部１１０と、取得された第１位置情報に基づいて、オブジェクトの移動速度を算出する第１算出部１２１と、取得された第１位置情報及び取得された第２位置情報に基づいて、オブジェクトと受聴者Ｌとの距離を算出する第２算出部１２２と、算出された移動速度及び算出された距離に基づいて、オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成する生成部１３０と、生成された空力音信号を出力する出力部１４０と、を備える。

　これにより、音響信号処理装置は、仮想空間におけるオブジェクトの位置及び受聴者Ｌの位置に基づいて、オブジェクトの移動により生じる風Ｗが受聴者Ｌの耳に到達することで生じる空力音を示す空力音信号を生成し、生成された空力音信号を出力することができる。この空力音信号などがヘッドフォン２００又はスピーカなどに出力されることで、受聴者Ｌは当該空力音を受聴することができる。このため、受聴者Ｌは、当該オブジェクトが移動していることを知覚することができ、臨場感を得ることができる。つまりは、本開示の一態様に係る音響信号処理装置は、受聴者Ｌに臨場感を与えることができる。

　（その他の実施の形態）
　以上、本開示の態様に係る音響信号処理方法及び音響信号処理装置１００について、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。例えば、本明細書において記載した構成要素を任意に組み合わせて、また、構成要素のいくつかを除外して実現される別の実施の形態を本開示の実施の形態としてもよい。また、上記実施の形態に対して本開示の主旨、すなわち、請求の範囲に記載される文言が示す意味を逸脱しない範囲で当業者が思いつく各種変形を施して得られる変形例も本開示に含まれる。

　また、以下に示す形態も、本開示の一つ又は複数の態様の範囲内に含まれてもよい。

　（１）上記の音響信号処理装置１００を構成する構成要素の一部は、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムであってもよい。前記ＲＡＭ又はハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

　（２）上記の音響信号処理装置１００を構成する構成要素の一部は、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。前記ＲＡＭには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

　（３）上記の音響信号処理装置１００を構成する構成要素の一部は、各装置に脱着可能なＩＣカード又は単体のモジュールから構成されているとしてもよい。前記ＩＣカード又は前記モジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。前記ＩＣカード又は前記モジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ＩＣカード又は前記モジュールは、その機能を達成する。このＩＣカード又はこのモジュールは、耐タンパ性を有するとしてもよい。

　（４）また、上記の音響信号処理装置１００を構成する構成要素の一部は、前記コンピュータプログラム又は前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、ＢＤ（Ｂｌｕ－ｒａｙ（登録商標）　Ｄｉｓｃ）、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されているデジタル信号であるとしてもよい。

　また、上記の音響信号処理装置１００を構成する構成要素の一部は、前記コンピュータプログラム又は前記デジタル信号を、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。

　（５）本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。

　（６）また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。

　（７）また、前記プログラム又は前記デジタル信号を前記記録媒体に記録して移送することにより、又は前記プログラム又は前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

　本開示は、音響信号処理方法及び音響信号処理装置に利用可能であり、特に、音響システムなどに適用可能である。

１０、２０　ダミーヘッドマイク
１１　ダミーヘッド
１２、１３　マイクロフォン
５０、６００　扇風機
１００、Ａ０００１　音響信号処理装置
１１０　取得部
１２０　算出部
１２１　第１算出部
１２２　第２算出部
１２３　第３算出部
１３０　生成部
１４０　出力部
１５０　記憶部
２００　ヘッドフォン
２０１　頭部センサ部
２０２　出力部
３００　表示部
４００　車両
５００　サーバ装置
６０１　羽根
７００　航空機
８００　うちわ
Ｌ　受聴者
Ｗ　風
Ａ００００　立体音響再生システム
Ａ０００２　音声提示装置
Ａ０１００　符号化装置
Ａ０１０１、Ａ０１１３　入力データ
Ａ０１０２　エンコーダ
Ａ０１０３　符号化データ
Ａ０１０４、Ａ０１１４　メモリ
Ａ０１１０、Ａ０１３０　復号装置
Ａ０１１１　音声信号
Ａ０１１２　デコーダ
Ａ０１２０　符号化装置
Ａ０１２１　送信部
Ａ０１２２　送信信号
Ａ０１３１　受信部
Ａ０１３２　受信信号
Ａ０２００、Ａ０２１０　デコーダ
Ａ０２０１、Ａ０２１１　空間情報管理部
Ａ０２０２　音声データデコーダ
Ａ０２０３、Ａ０２１３、９００　レンダリング部
９０１　残響処理部
９０２　初期反射処理部
９０３　距離減衰処理部
９０４　選択部
９０５　バイノーラル処理部

Claims

　仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、前記仮想空間における受聴者の位置を示す第２位置情報を取得する取得ステップと、
　取得された前記第１位置情報に基づいて、前記オブジェクトの移動速度を算出する第１算出ステップと、
　取得された前記第１位置情報及び取得された前記第２位置情報に基づいて、前記オブジェクトと前記受聴者との距離を算出する第２算出ステップと、
　算出された前記移動速度及び算出された前記距離に基づいて、前記オブジェクトの移動により生じる風が前記受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成ステップと、
　生成された前記空力音信号を出力する出力ステップと、を含む
　音響信号処理方法。
　前記生成ステップでは、
　　算出された前記移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、
　　算出された前記距離が小さいほど前記空力音の音量を大きくするように前記空力音信号を生成する
　請求項１に記載の音響信号処理方法。
　前記取得ステップでは、前記オブジェクトが前記空力音を生成するか否かを示す可否情報を取得し、
　前記生成ステップでは、取得された前記可否情報が、前記オブジェクトが前記空力音を生成することを示す場合に、前記空力音信号を生成する
　請求項１に記載の音響信号処理方法。
　前記取得ステップでは、前記オブジェクトの形状を示す形状情報を取得し、
　前記生成ステップでは、取得された形状情報が示す前記形状、算出された前記移動速度及び算出された前記距離に基づいて、前記空力音信号を生成する
　請求項１に記載の音響信号処理方法。
　前記生成ステップでは、
　　算出された前記移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、
　　算出された前記距離が小さいほど前記空力音の音量を大きくするように、かつ、
　　取得された前記形状情報に基づいて前記オブジェクトの体積が大きいほど前記空力音の音量を大きくするように前記空力音信号を生成する
　請求項４に記載の音響信号処理方法。
　算出された前記移動速度及び取得された前記形状情報に基づいて、前記オブジェクトが移動する場合に生じる単位時間当たりの風量を算出する第３算出ステップを含み、
　前記生成ステップでは、算出された前記移動速度、算出された前記距離及び算出された前記風量に基づいて、前記空力音信号を生成する
　請求項４に記載の音響信号処理方法。
　前記生成ステップでは、
　　算出された前記移動速度が大きいほど周波数成分を高周波数側にシフトさせ、かつ、
　　算出された前記距離が小さいほど前記空力音の音量を大きくするように、かつ、
　　算出された前記風量が大きいほど前記空力音の音量を大きくするように前記空力音信号を生成する
　請求項６に記載の音響信号処理方法。
　前記生成ステップでは、算出された前記移動速度、算出された前記距離及び人の耳の形状に基づいて、前記空力音信号を生成する
　請求項１に記載の音響信号処理方法。
　人の耳又は人の耳を模したモデルに風が到達することで生じる音が収音されたデータである空力音データが記憶される記憶ステップと、
　前記生成ステップでは、記憶された前記空力音データ、算出された前記移動速度及び算出された前記距離に基づいて、前記空力音信号を生成する
　請求項１に記載の音響信号処理方法。
　前記第３算出ステップでは、取得された前記形状情報に示される前記オブジェクトの移動方向から見た前記オブジェクトの面積、及び、算出された前記移動速度に基づいて、前記風量を算出する
　請求項６に記載の音響信号処理方法。
　前記第１算出ステップでは、取得された前記第１位置情報に基づいて、前記オブジェクトの前記移動速度及び移動方向を算出し、
　前記第３算出ステップでは、取得された前記形状情報、算出された前記移動方向、及び、算出された前記移動速度に基づいて、前記風量を算出する
　請求項６に記載の音響信号処理方法。
　雑音信号を複数の帯域強調フィルタのそれぞれで処理して、処理された複数の前記雑音信号の合成を行って処理することで、仮想空間における受聴者の耳に風が到達することで生じる空力音を示す空力音信号を生成する生成ステップと、
　生成された前記空力音信号を出力する出力ステップと、を含み、
　前記複数の帯域強調フィルタのそれぞれは、前記受聴者の耳又は頭部の形状に起因して生じる前記空力音を模擬するためのフィルタである
　音響信号処理方法。
　前記複数の帯域強調フィルタは、処理された前記複数の雑音信号のうち当該帯域強調フィルタが処理した雑音信号に当該帯域強調フィルタに対応する所定の係数の乗算を行い、
　前記生成ステップでは、前記乗算が行われた後に、前記合成を行う
　請求項１２に記載の音響信号処理方法。
　前記複数の帯域強調フィルタのそれぞれは、前記耳に到達する前記風の風速に応じて特性が変動する
　請求項１２に記載の音響信号処理方法。
　前記複数の帯域強調フィルタのそれぞれは、前記耳に到達する前記風の風向に応じて特性が変動する
　請求項１２に記載の音響信号処理方法。
　請求項１～１５のいずれか１項に記載の音響信号処理方法をコンピュータに実行させるためのコンピュータプログラム。
　仮想空間における移動体であるオブジェクトの位置を示す第１位置情報、及び、前記仮想空間における受聴者の位置を示す第２位置情報を取得する取得部と、
　取得された前記第１位置情報に基づいて、前記オブジェクトの移動速度を算出する第１算出部と、
　取得された前記第１位置情報及び取得された前記第２位置情報に基づいて、前記オブジェクトと前記受聴者との距離を算出する第２算出部と、
　算出された前記移動速度及び算出された前記距離に基づいて、前記オブジェクトの移動により生じる風が前記受聴者の耳に到達することで生じる空力音を示す空力音信号を生成する生成部と、
　生成された前記空力音信号を出力する出力部と、を備える
　音響信号処理装置。