JP2005080124A - リアルタイム音響再現システム - Google Patents
リアルタイム音響再現システム Download PDFInfo
- Publication number
- JP2005080124A JP2005080124A JP2003310647A JP2003310647A JP2005080124A JP 2005080124 A JP2005080124 A JP 2005080124A JP 2003310647 A JP2003310647 A JP 2003310647A JP 2003310647 A JP2003310647 A JP 2003310647A JP 2005080124 A JP2005080124 A JP 2005080124A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- transfer function
- real
- time
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】仮想空間内の音響をリアルタイムで再現すること
【解決手段】リアルタイム音響再現システムは、室内音響を再現する過程の中で大きく3段階に分けることができる。部屋の形状,環境,条件,位置など様々な情報を収集する情報入力処理、音響伝達関数を用いた音響モデリングを行う変換処理、実際の音声として再生する出力処理(可聴化処理)の3段階である。
音響モデリングを行う変換処理は、部屋210の形状に基づいて生成された反射パス226,227,228に対して、反射における吸音や減衰などの損失を含むインパルス応答231を算出し、これを伝達関数236として用い、入力音声238を変換することで音響が再現される。
【選択図】図2
【解決手段】リアルタイム音響再現システムは、室内音響を再現する過程の中で大きく3段階に分けることができる。部屋の形状,環境,条件,位置など様々な情報を収集する情報入力処理、音響伝達関数を用いた音響モデリングを行う変換処理、実際の音声として再生する出力処理(可聴化処理)の3段階である。
音響モデリングを行う変換処理は、部屋210の形状に基づいて生成された反射パス226,227,228に対して、反射における吸音や減衰などの損失を含むインパルス応答231を算出し、これを伝達関数236として用い、入力音声238を変換することで音響が再現される。
【選択図】図2
Description
本発明は、仮想空間におけるリアルタイム音響再現システムに関するものである。
現在、計算機上の仮想空間(Virtual Space) を実現するために、いかにリアルに見せることができるのかといった視覚的な面を重視する研究が多い。鏡面反射の計算,ライティング,陰影表示,テクスチャーおよび,バンプマッピングなどの技術は現実に近い空間をつくることを可能にする。しかし、人間に伝わる情報は様々であり、視覚的な情報だけでリアルな仮想空間を作ることができるとは限らない。
例えば、レンガで作られた部屋を木造に変更した場合、視覚的にそれらしいように感じるのだが、音響に変化がなければ当然我々は違和感を覚える。また、両耳に到達する音の時間的および音量的な差により我々は音の到達方向を感覚的に認知でき、音源が後方にあった場合、その位置を予測できる。
我々は、5感のうち、大きな割合で視覚に頼っている。そのため、周りの空間を認知するには視覚的な情報だけで十分であると考えがちである。しかし、全ての感覚機能は同じ神経を伝わり、最終的には唯一の情報として認知される。すなわち、これらの情報が影響し合うことで、より正確に空間を認知できる。
例えば、レンガで作られた部屋を木造に変更した場合、視覚的にそれらしいように感じるのだが、音響に変化がなければ当然我々は違和感を覚える。また、両耳に到達する音の時間的および音量的な差により我々は音の到達方向を感覚的に認知でき、音源が後方にあった場合、その位置を予測できる。
我々は、5感のうち、大きな割合で視覚に頼っている。そのため、周りの空間を認知するには視覚的な情報だけで十分であると考えがちである。しかし、全ての感覚機能は同じ神経を伝わり、最終的には唯一の情報として認知される。すなわち、これらの情報が影響し合うことで、より正確に空間を認知できる。
本発明では、グラフィックスによる情報伝達の支援として、音響をリアルタイムで再現することにより、グラフィックスだけでは表せない空間的な臨場感をユーザに伝達することを目的とする。すなわち、現実に近い音響よりも、仮想空間上での変化を対話的に再現することを重視することで、グラフィックスとの連携を図っている。
特に音響計算は非常に時間がかかり、リアルタイムで実現するのは非常に難しいとされている。そのため、本発明では、特に仮想空間における音響計算の高速化も目的としている。
特に音響計算は非常に時間がかかり、リアルタイムで実現するのは非常に難しいとされている。そのため、本発明では、特に仮想空間における音響計算の高速化も目的としている。
上記目的を達成するために、本発明は、仮想空間内におけるリアルタイム音響再現システムであって、少なくとも仮想空間の形状、壁面の材質、温度,湿度の基本情報が格納されている記憶手段と、前記記憶手段から読み出した基本情報により、仮想空間内の音源位置から動的に与えられた受音点位置までのインパルス応答をフーリエ変換した伝達関数を生成する伝達関数生成手段と、動的に与えられたデジタル音声データを一定時間切り出してフーリエ変換し、フーリエ変換された周波数帯のデータに対して前記伝達関数を適用し、逆フーリエ変換して、仮想空間内の音声再現データとして出力する可聴化手段とを備えることを特徴とする。
前記伝達関数生成手段における前記伝達関数生成は、前記仮想空間内の音源位置から受音点位置までのパスを生成し、それぞれのパスごとの室内伝達関数、頭部伝達関数を求めることで行ってもよい。
前記室内伝達関数は、統計学的な推測により求めた高次反射残響の推測値を用いて求めてもよい。
前記伝達関数生成手段における前記伝達関数生成は、前記仮想空間内の音源位置から受音点位置までのパスを生成し、それぞれのパスごとの室内伝達関数、頭部伝達関数を求めることで行ってもよい。
前記室内伝達関数は、統計学的な推測により求めた高次反射残響の推測値を用いて求めてもよい。
前記音源位置は、基本情報として与えられるとともに、前記仮想空間をグリッドに分割して、各グリッドに受音点があるとして、グリッドごとの伝達関数を予め計算して伝達関数記憶手段に格納し、受音点が動的に与えられると、該受音点位置のグリッドに対する伝達関数を前記伝達関数記憶手段から読み出し、該伝達関数を用いて音声再現データを出力してもよい。
前記グリッドを反射次数ごとに大きさを変えて、反射次数ごとの伝達関数を計算して前記伝達関数記憶手段に格納し、受音点が動的に与えられると、該受音点位置の反射次数ごとのグリッドに対する伝達関数を前記伝達関数記憶手段から読み出して合成し、合成した伝達関数を用いて音声再現データを出力してもよい。
前記グリッドを反射次数ごとに大きさを変えて、反射次数ごとの伝達関数を計算して前記伝達関数記憶手段に格納し、受音点が動的に与えられると、該受音点位置の反射次数ごとのグリッドに対する伝達関数を前記伝達関数記憶手段から読み出して合成し、合成した伝達関数を用いて音声再現データを出力してもよい。
前記音源位置は、基本情報として与えられるとともに、前記仮想空間をグリッドに分割し、各グリッドに到達するパスにIDをつけてグリッドごとにグリッドパス記憶手段に格納し、受音点位置が動的に与えられると、受音点位置のグリッド中のパスを前記グリッドパス記憶手段から読み出し、読み出したパスを用いて、受音点のパスを得てもよい。
前記グリッドは、前記インパルス応答の音圧レベルの変化に応じて、グリッドの分割サイズを変化させてもよく、又、前記インパルス応答のベクトル内積に応じて分割のサイズを変化させてもよい。
前記グリッドは、前記インパルス応答の音圧レベルの変化に応じて、グリッドの分割サイズを変化させてもよく、又、前記インパルス応答のベクトル内積に応じて分割のサイズを変化させてもよい。
前記可聴化手段は、複数のバッファを有しており、入力音声を複数のブロックに分けて前記複数のバッファに入力してフーリエ変換し、フーリエ変換された周波数帯のデータに対して、バッファごとに前記伝達関数を適用して逆フーリエ変換し、複数のバッファのデータを足し合わせて仮想空間内の音声再現データとして出力してもよい。
上記記載のリアルタイム音響再現システムをコンピュータ・システムに構築させるプログラムも本発明である。
上記記載のリアルタイム音響再現システムをコンピュータ・システムに構築させるプログラムも本発明である。
本発明では、上記構成により、音響をリアルタイムで再現することにより、グラフィックスだけでは表せない空間的な臨場感をユーザに伝達することができる。
本発明では、音響計算の高速化を図ることにより、リアルタイム性を確保できている。
本発明では、音響計算の高速化を図ることにより、リアルタイム性を確保できている。
本発明におけるリアルタイム音響再現システムは、図1及び図2に示す概要のように、室内音響を再現する過程の中で大きく3段階に分けることができる。図1において、部屋の形状,環境,条件,位置など様々な情報を収集する情報入力処理(S102)、音響伝達関数を用いた音響モデリングを行う変換処理(S104)、実際の音声として再生する出力処理(可聴化処理)(S106)の3段階である。
基本的な音響再現システムの概要は、図2に示すように、部屋210の形状に基づいて生成された反射パス226,227,228に対して、反射における吸音や減衰などの損失を含むインパルス応答231を算出し、これを伝達関数236として用い、入力音声238を変換することで音響が再現される。
(1)条件・部屋の形状情報の入力(S102)
最初にシミュレーションする部屋210の形状を入力する。この段階で3次元ポリゴンモデルおよび各反射面(周囲の壁)の材質(吸音特性)232,234を定義する。これらは音響再現に必要な基本情報として扱われる。各面の角度によって音が到達する方向が決まり、吸音率によって空間の響き、つまり残響が決まる。
上記の部屋の形状や材質などの、ほぼ固定された情報に対し、音源や受音点の位置または入力音声信号などの動的な情報がある。これらを元に音響を再現する伝達関数236を生成する。
ただし、以下の説明では、音源は固定されたものとして述べる。
最初にシミュレーションする部屋210の形状を入力する。この段階で3次元ポリゴンモデルおよび各反射面(周囲の壁)の材質(吸音特性)232,234を定義する。これらは音響再現に必要な基本情報として扱われる。各面の角度によって音が到達する方向が決まり、吸音率によって空間の響き、つまり残響が決まる。
上記の部屋の形状や材質などの、ほぼ固定された情報に対し、音源や受音点の位置または入力音声信号などの動的な情報がある。これらを元に音響を再現する伝達関数236を生成する。
ただし、以下の説明では、音源は固定されたものとして述べる。
(2)音源Sから受音点Rへの伝達関数の生成(S104)
構築された部屋の形状の中で音がどのように反射し、受音点Rまで到達するかを幾何音響解析による算出によって求める。計算は、Path Tracing(音線法)を用いて、音源S222から放出される音を線(パス)として扱い、任意の受音点R224に到達する複数の反射音(反射パス)226,227,228を求める。計算結果として、音源S222から受音点R224までの伝搬経路を線で表し、表示したものは音線図という。伝達関数計算に対する条件には、反射する回数(反射次数)や音源の指向性、受音点の大きさ、室温や湿度を設定する。
構築された部屋の形状の中で音がどのように反射し、受音点Rまで到達するかを幾何音響解析による算出によって求める。計算は、Path Tracing(音線法)を用いて、音源S222から放出される音を線(パス)として扱い、任意の受音点R224に到達する複数の反射音(反射パス)226,227,228を求める。計算結果として、音源S222から受音点R224までの伝搬経路を線で表し、表示したものは音線図という。伝達関数計算に対する条件には、反射する回数(反射次数)や音源の指向性、受音点の大きさ、室温や湿度を設定する。
音線の伝搬経路を計算することで、任意の受聴位置で最初に直接音が到達した後、設定された吸音率の反射面に反射した1次反射音,2次反射音,…,n次反射音が時間遅れで到達する様子を、時系列上で配列するエコーダイアグラム231として求めることができる。このエコーダイアグラム231に空間の様々な特性を持たせれば、インパルス応答波形が得られる。インパルス応答をフーリエ変換すれば音源S・受音点R間の伝達関数が得られ、これが音源Sから受音点Rへの伝送周波数特性を表す。
エコーダイアグラム231は、図2に示すように、音の遅れと大きさの情報だけをもつ波形であるのに対し、インパルス応答は、エネルギー的に平坦な周波数特性をもつ短音( インパルス)に対する実際の応答であるので、空間の全ての音響情報が含まれると考えられる。
エコーダイアグラム231は、図2に示すように、音の遅れと大きさの情報だけをもつ波形であるのに対し、インパルス応答は、エネルギー的に平坦な周波数特性をもつ短音( インパルス)に対する実際の応答であるので、空間の全ての音響情報が含まれると考えられる。
(3)可聴化処理(S106)
インパルス応答に無響室で録音されたデジタルデータである音源(ドライソース)238を畳み込む(237)ことにより、その空間の響きを持つ音242として変換できる。つまり、あたかもその室内で聴いたような感覚が得られる。しかし、インパルス応答の算出および畳み込みを、ユーザの操作に対して対話的に行うことは非常に困難である。本発明では、リアルタイムおよび対話性に適応するため、時間帯域での畳み込みではなく、周波数帯域で処理を行う。この理由は後で詳しく述べる。
本発明の音響再現システムでは、視覚的なグラフィックス表示とリアルタイムで組み合わせることにより、ユーザにより多くの情報を与え、さらに、これらの情報の協調により仮想空間にさらなる現実感を与えることを目指している。以下に、それぞれの処理について詳しく説明する。
インパルス応答に無響室で録音されたデジタルデータである音源(ドライソース)238を畳み込む(237)ことにより、その空間の響きを持つ音242として変換できる。つまり、あたかもその室内で聴いたような感覚が得られる。しかし、インパルス応答の算出および畳み込みを、ユーザの操作に対して対話的に行うことは非常に困難である。本発明では、リアルタイムおよび対話性に適応するため、時間帯域での畳み込みではなく、周波数帯域で処理を行う。この理由は後で詳しく述べる。
本発明の音響再現システムでは、視覚的なグラフィックス表示とリアルタイムで組み合わせることにより、ユーザにより多くの情報を与え、さらに、これらの情報の協調により仮想空間にさらなる現実感を与えることを目指している。以下に、それぞれの処理について詳しく説明する。
<空間形状の入力(基本・動的情報の入力)>
本発明の実施形態における音響再現システムでは、仮想空間の環境情報,位置,条件,および音声を入力パラメータとし、音響効果をもつ音を出力している。入力パラメータには2つの種類があり、図3に示すように、あらかじめ設定する必要のある基本情報パラメータ310とユーザの操作時にリアルタイムで更新される動的情報パラメータ330に分けられる。
基本情報パラメータ310は、部屋の3次元形状情報、これに含まれる各面の材質(吸音特性)や、温度および湿度を含む環境情報から構成される。これらの情報は、基本情報データベース320に格納され、必要なときに読み出され、これらの情報を基に、これから述べる空間分割やパス情報データベース生成などの高速化のための前処理を行う。音源の位置は本来動的な情報であるが、以下の説明では、音源の位置を固定されたものとして述べる。すなわち、音源位置も基本情報パラメータとして扱っている。
本発明の実施形態における音響再現システムでは、仮想空間の環境情報,位置,条件,および音声を入力パラメータとし、音響効果をもつ音を出力している。入力パラメータには2つの種類があり、図3に示すように、あらかじめ設定する必要のある基本情報パラメータ310とユーザの操作時にリアルタイムで更新される動的情報パラメータ330に分けられる。
基本情報パラメータ310は、部屋の3次元形状情報、これに含まれる各面の材質(吸音特性)や、温度および湿度を含む環境情報から構成される。これらの情報は、基本情報データベース320に格納され、必要なときに読み出され、これらの情報を基に、これから述べる空間分割やパス情報データベース生成などの高速化のための前処理を行う。音源の位置は本来動的な情報であるが、以下の説明では、音源の位置を固定されたものとして述べる。すなわち、音源位置も基本情報パラメータとして扱っている。
動的情報パラメータ330は、受音点の位置や入力音声(音源から発するドライソースのデジタル音声信号)からなる。仮想空間での位置を受音点として、パス情報データベースで限定された反射経路のパスをトレースし、パス総距離やパス毎の減衰率などの情報をリアルタイムで生成・更新する。このデータを基に生成される伝達関数(後で詳しく述べる)を用いて、音源から再生される音声の変換を行う。なお、前にも述べたように、動的パラメータとして、音源位置も含めることができる。
この受音点データは、例えばこのシステムをゲームに適用した場合、仮想空間で行うゲームの進行に従って、ゲーム参加者が操作しているキャラクタの仮想空間内の位置として与えられる。また、音源からの音声データは、ゲームの進行により、その場で発生する音として与えられる。また、音源の位置も動的情報として与えることもできる。
以上のデータの流れは、リアルタイム再現において重要な意味をもたらす。
この受音点データは、例えばこのシステムをゲームに適用した場合、仮想空間で行うゲームの進行に従って、ゲーム参加者が操作しているキャラクタの仮想空間内の位置として与えられる。また、音源からの音声データは、ゲームの進行により、その場で発生する音として与えられる。また、音源の位置も動的情報として与えることもできる。
以上のデータの流れは、リアルタイム再現において重要な意味をもたらす。
<音響伝達関数の生成>
システムの入力処理の段階を経て、入力された情報を元に、音源から受音点への音の伝達関数を求め、音響のモデリングを行い、最終段階である可聴化処理で実際の音として出力する。ここでは、この伝達関数の生成について述べる。
音源を出るドライソースに対する音源位置から受音点までの音響的な変化は、インパルス応答として表すことができる。これをフーリエ変換すれば周波数帯域上の伝達関数になる。これを利用して入力音声に対する音響を再現する。インパルス応答を生成する手法は様々であり、主に次のような手法が用いられる。
最も精密な方法は、測定によるインパルス応答の算出である。実際に測定を行う部屋でインパルスを発し、その応答を解析する。測定方法は、入力インパルス短音の形や長さ、応答の周波数別の測定とそのときに用いる窓関数の種類などとさまざまである。測定を用いる手法は最も正確に算出できる反面、測定を行う部屋が存在する必要がある。これに伴う、測定の手間と費用が膨大である。
システムの入力処理の段階を経て、入力された情報を元に、音源から受音点への音の伝達関数を求め、音響のモデリングを行い、最終段階である可聴化処理で実際の音として出力する。ここでは、この伝達関数の生成について述べる。
音源を出るドライソースに対する音源位置から受音点までの音響的な変化は、インパルス応答として表すことができる。これをフーリエ変換すれば周波数帯域上の伝達関数になる。これを利用して入力音声に対する音響を再現する。インパルス応答を生成する手法は様々であり、主に次のような手法が用いられる。
最も精密な方法は、測定によるインパルス応答の算出である。実際に測定を行う部屋でインパルスを発し、その応答を解析する。測定方法は、入力インパルス短音の形や長さ、応答の周波数別の測定とそのときに用いる窓関数の種類などとさまざまである。測定を用いる手法は最も正確に算出できる反面、測定を行う部屋が存在する必要がある。これに伴う、測定の手間と費用が膨大である。
測定によるインパルス応答の計算にかかる手間と費用を削減するため、音響学では計算機を用いたインパルス応答の算出法が多く研究されている。これらの手法は、大きく2種類に分けることができる。波動音響と幾何音響である。
波動音響は、差分法や有限要素法などを用いて、格子に分割された空間での音波の伝播を波動現象として捉える分野であり、測定されたインパルス応答の精度には及ばないが、詳細に求めることができる。しかし、計算する周波数は格子の大きさに依存するため、低周波数に対しては有効であるが、高周波数では、計算量が膨大になる。
幾何音響は、幾何的な計算によるインパルス応答の算出を扱う分野であり、虚像法(Image Source Method)や音線法(Ray Tracing Method)などが用いられる。これらは、上述の2つの方法に比べて圧倒的に速い計算速度をもつ。ゆえに、リアルタイム音響再現において重要な要素であるといえる。まして空間が視覚的に表現されている場合、特に仮想空間の表現に関しては、計算精度よりも計算速度(リアルタイム性)を重視する方が空間情報をユーザに伝えやすい。そのため、本システムでは幾何音響を用いてインパルス応答の計算を行う。
波動音響は、差分法や有限要素法などを用いて、格子に分割された空間での音波の伝播を波動現象として捉える分野であり、測定されたインパルス応答の精度には及ばないが、詳細に求めることができる。しかし、計算する周波数は格子の大きさに依存するため、低周波数に対しては有効であるが、高周波数では、計算量が膨大になる。
幾何音響は、幾何的な計算によるインパルス応答の算出を扱う分野であり、虚像法(Image Source Method)や音線法(Ray Tracing Method)などが用いられる。これらは、上述の2つの方法に比べて圧倒的に速い計算速度をもつ。ゆえに、リアルタイム音響再現において重要な要素であるといえる。まして空間が視覚的に表現されている場合、特に仮想空間の表現に関しては、計算精度よりも計算速度(リアルタイム性)を重視する方が空間情報をユーザに伝えやすい。そのため、本システムでは幾何音響を用いてインパルス応答の計算を行う。
音源から受音点への音響伝達関数(ATF)を求める過程を図4に示す。図4に示されるように、音響伝達関数(ATF)は、パス生成S402,損失特性の算出S404,室内伝達関数(RTF)S408,頭部伝達関数(HRTF)S406の算出などいくつかの段階に分けて行われる。
(パス生成(S402))
音源から周囲の壁に反射して受音点に到達する反射音は、波の物理的な現象によって作られ、図5に示すように、音源から円形に広がる。反射物(図5の壁A)で、波は折り返し、反転した状態でさらに広がる。反射した波形が受音点と接する点が描く音源S−受音点R間の軌跡は、幾何音響で用いられる反射パスに相当する。
壁に反射したときの円形をした音波の中心点は、音源点Sの壁Aに対する線対称点(3次元空間の場合は面対称点)SAになる。すなわち、壁Aの反射音波は、SAの地点から広がる音波に等しい( 壁Aでの吸音を除く)。したがって、すべての反射パターンにおける虚音源を求めることによって、すべての反射音を算出することができる。この方法は、幾何音響学でいう虚像法(Image Source Method)であり、SAは虚音源(Image Source) と呼ばれる。
虚像法は、虚音源をあらかじめ求めるが、反射を除く壁との衝突計算が行われないため、複雑な形をした部屋には不向きである。したがって、本システムでは音線法を用いる。
図6は、音源Sから壁A,B,Cの順に反射し、受音点Rに到達する反射パスの算出方法を示す。音源Sの壁Aに対する虚音源SAを求め、次に虚音源SAの壁Bに対する虚音源SABを求める。同様に虚音源SABCを求め、受音点Rを結ぶ線分SABCRと壁Cとの交点PCが第3反射点になる。同様にSABPCと壁Bとの交点である第2反射点PBを求め、さらに、第1反射点PAを同様に求める。音源Sとこの3つの点PA,PB,PCを介し受音点Rを結ぶパスが、反射パスPATHABCである。
図7(a)〜(f)に、直接音と、1〜5次反射パスを計算した例を示す。各図には、それぞれに対応するエコーダイヤグラムを添えている。
音源から周囲の壁に反射して受音点に到達する反射音は、波の物理的な現象によって作られ、図5に示すように、音源から円形に広がる。反射物(図5の壁A)で、波は折り返し、反転した状態でさらに広がる。反射した波形が受音点と接する点が描く音源S−受音点R間の軌跡は、幾何音響で用いられる反射パスに相当する。
壁に反射したときの円形をした音波の中心点は、音源点Sの壁Aに対する線対称点(3次元空間の場合は面対称点)SAになる。すなわち、壁Aの反射音波は、SAの地点から広がる音波に等しい( 壁Aでの吸音を除く)。したがって、すべての反射パターンにおける虚音源を求めることによって、すべての反射音を算出することができる。この方法は、幾何音響学でいう虚像法(Image Source Method)であり、SAは虚音源(Image Source) と呼ばれる。
虚像法は、虚音源をあらかじめ求めるが、反射を除く壁との衝突計算が行われないため、複雑な形をした部屋には不向きである。したがって、本システムでは音線法を用いる。
図6は、音源Sから壁A,B,Cの順に反射し、受音点Rに到達する反射パスの算出方法を示す。音源Sの壁Aに対する虚音源SAを求め、次に虚音源SAの壁Bに対する虚音源SABを求める。同様に虚音源SABCを求め、受音点Rを結ぶ線分SABCRと壁Cとの交点PCが第3反射点になる。同様にSABPCと壁Bとの交点である第2反射点PBを求め、さらに、第1反射点PAを同様に求める。音源Sとこの3つの点PA,PB,PCを介し受音点Rを結ぶパスが、反射パスPATHABCである。
図7(a)〜(f)に、直接音と、1〜5次反射パスを計算した例を示す。各図には、それぞれに対応するエコーダイヤグラムを添えている。
(大気伝播及び反射吸音の損失特性(S404))
音響の計算は、Path Tracing によって求められた反射パス別に特性を算出した後、それぞれの遅延時間に伴って推移させられ、最終的に足し合わされる。反射パスkに代表される反射音の特性は、図8に示すいくつかの要素から求められる。
・音源の指向特性関数SFθ(ω)(図8の(1))
・大気伝播による減衰特性Ak(ω)(図8の(2),(4),(6),(8))
・拡散音場による減衰率Ek(図8の(2),(4),(6),(8))
・反射吸音による損失特性Rk(ω)(図8の(3),(5),(7))
・頭部伝達関数による特性HFθ(ω)(図8の(9))
音源には指向特性が設定されており、正面からの角度によって周波数特性が異なる。すなわち、直接音に関して述べると、正面から聴いた音の方が、後方から聞いた音に比べて大きく、高周波成分が多く含まれる。音源を発する反射音(反射パス)は、音源の向きとの角度から、指向特性SFθが決まる。
また、反射音は音源と受音点間の経路でさまざまな損失が生じる。音源から受音点への距離に応じて、空気伝播中に摩擦による減衰Akおよび拡散音場による減衰Ekが生じる。反射がある場合、反射壁面の材質に伴って吸音による損失mrが生じる。音は反射を繰り返し、最終的に受音点に到達したとき、パスkの反射による損失はRk(ω)になる。SFθ(ω),Ak(ω),Rk(ω)をそれぞれフィルターとして扱い、音源S(ドライソース)に適用する。
音響の計算は、Path Tracing によって求められた反射パス別に特性を算出した後、それぞれの遅延時間に伴って推移させられ、最終的に足し合わされる。反射パスkに代表される反射音の特性は、図8に示すいくつかの要素から求められる。
・音源の指向特性関数SFθ(ω)(図8の(1))
・大気伝播による減衰特性Ak(ω)(図8の(2),(4),(6),(8))
・拡散音場による減衰率Ek(図8の(2),(4),(6),(8))
・反射吸音による損失特性Rk(ω)(図8の(3),(5),(7))
・頭部伝達関数による特性HFθ(ω)(図8の(9))
音源には指向特性が設定されており、正面からの角度によって周波数特性が異なる。すなわち、直接音に関して述べると、正面から聴いた音の方が、後方から聞いた音に比べて大きく、高周波成分が多く含まれる。音源を発する反射音(反射パス)は、音源の向きとの角度から、指向特性SFθが決まる。
また、反射音は音源と受音点間の経路でさまざまな損失が生じる。音源から受音点への距離に応じて、空気伝播中に摩擦による減衰Akおよび拡散音場による減衰Ekが生じる。反射がある場合、反射壁面の材質に伴って吸音による損失mrが生じる。音は反射を繰り返し、最終的に受音点に到達したとき、パスkの反射による損失はRk(ω)になる。SFθ(ω),Ak(ω),Rk(ω)をそれぞれフィルターとして扱い、音源S(ドライソース)に適用する。
(音源の指向性による減少)
すべての方向に対して同様な特性をもつ無指向性音源(点音源ともいう)に対して、指向性を持つ音源は方向に伴い周波数特性が異なる。実際、理想的な点音源は非現実的であり、実世界ではあり得ない存在である。すなわち、すべての音源には指向性があり、空間の状態を認知するには重要な要素である。
本システムで音源を設置する際、ユーザが音源の指向特性を設定できる。音源の指向性は、本来、発音体の形に依存する特性を持ち、すべての方向へ発する音の周波数特性は異なるが、特殊なケースを除き、本システムの対象となる音源のほとんどは前方の方が音は大きく、後方が音は小さい。これによって、リスナーは音源の向きを認知する。したがって、図9に示すように、本システムではこの性質を利用し、音源の前方を表すベクトルに対するパスの放出角度からユーザが設定した特性を用いる。
すべての方向に対して同様な特性をもつ無指向性音源(点音源ともいう)に対して、指向性を持つ音源は方向に伴い周波数特性が異なる。実際、理想的な点音源は非現実的であり、実世界ではあり得ない存在である。すなわち、すべての音源には指向性があり、空間の状態を認知するには重要な要素である。
本システムで音源を設置する際、ユーザが音源の指向特性を設定できる。音源の指向性は、本来、発音体の形に依存する特性を持ち、すべての方向へ発する音の周波数特性は異なるが、特殊なケースを除き、本システムの対象となる音源のほとんどは前方の方が音は大きく、後方が音は小さい。これによって、リスナーは音源の向きを認知する。したがって、図9に示すように、本システムではこの性質を利用し、音源の前方を表すベクトルに対するパスの放出角度からユーザが設定した特性を用いる。
図10において、音源の指向方向のベクトルをv1とし、パストレーシングにより算出された反射パスが、音源をベクトルv2方向へ出るとしたとき、ベクトルv1,v2の内積を求めることにより、ベクトル間の角度θは次のように算出できる。
この角度θ(0〜π)方向に相当する周波数特性(図11参照)は、ユーザが設定でき、再現時に生成された各反射パスの方向から、相当する周波数特性のフィルターSFθ(ω)が決まる。
(反射面の吸音特性)
反射パスkは伝播中に反射吸音による損失Rk(ω)が含まれる。音源から放出されるすべての反射音は、異なる反射経路を辿って受音点へ到達する。音が壁面に反射する際、図12に示すように、その一部が反射面に吸収され、壁の材質(および入射角)によってその吸音特性が異なる。図12(b)は、図12(a)を拡大した模式図である。反射パスが最終的に受音点に到達したときの反射吸音による減少率は、反射回数をnとして、
になる(ただし、mrk reは、n次反射パスkのr反射目での吸音特性)。これをデシベル単位に直すと、損失デシベル数MRk rは、
となる。したがって、
となる。
反射パスkは伝播中に反射吸音による損失Rk(ω)が含まれる。音源から放出されるすべての反射音は、異なる反射経路を辿って受音点へ到達する。音が壁面に反射する際、図12に示すように、その一部が反射面に吸収され、壁の材質(および入射角)によってその吸音特性が異なる。図12(b)は、図12(a)を拡大した模式図である。反射パスが最終的に受音点に到達したときの反射吸音による減少率は、反射回数をnとして、
(大気伝播による損失特性)
反射吸音による損失以外にも、大気伝播による減衰がある。大気伝播による減衰m(T,H,ω)[dB/m]は、空気に含まれる成分(窒素や酸素など)によって異なるが、成分を固定し、気温Tと湿度Hから吸音率を求めることができる。本システムでは、米国標準規格ANSI S1,26−1978で定義されている計算法を用いて、音が1m進むときの減衰率m(ω,T,H)を求め、パスの総距離lkから損失量Ak(ω)を次のように求める。
同様にデシベル単位で表すと
になる。
反射吸音による損失以外にも、大気伝播による減衰がある。大気伝播による減衰m(T,H,ω)[dB/m]は、空気に含まれる成分(窒素や酸素など)によって異なるが、成分を固定し、気温Tと湿度Hから吸音率を求めることができる。本システムでは、米国標準規格ANSI S1,26−1978で定義されている計算法を用いて、音が1m進むときの減衰率m(ω,T,H)を求め、パスの総距離lkから損失量Ak(ω)を次のように求める。
<音響伝播関数>
音響伝達関数(ATF: Acoustic Transfer Function) とは、室内における発音体から受聴者の鼓膜に到達する音の伝達関数である。すなわち、音が周囲の壁の反射及び大気伝播による減衰,または、頭部周辺での回折,透過損失,反射など、両耳の鼓膜に到達するまでの伝達特性を指す。本リアルタイム音響再現システムの生成論文では、音響伝達関数を、部屋の形状や環境による特性(反射,減衰など)と受聴者の頭部形状による特性に分け、それぞれ、室内伝達関数(RTF)と頭部伝達関数(HRTF)と呼ぶ。
音響伝達関数(ATF: Acoustic Transfer Function) とは、室内における発音体から受聴者の鼓膜に到達する音の伝達関数である。すなわち、音が周囲の壁の反射及び大気伝播による減衰,または、頭部周辺での回折,透過損失,反射など、両耳の鼓膜に到達するまでの伝達特性を指す。本リアルタイム音響再現システムの生成論文では、音響伝達関数を、部屋の形状や環境による特性(反射,減衰など)と受聴者の頭部形状による特性に分け、それぞれ、室内伝達関数(RTF)と頭部伝達関数(HRTF)と呼ぶ。
(室内伝達関数の算出)
室内伝達関数(RTF:Room Transfer Function)は、室内における音源から受音点まで、壁の反射や大気減衰などを含む伝達特性を表す。これを算出するには、反射パスの遅延時間と損失特性の2つの要素が必要になる。損失特性に関しては、前に述べた大気伝播による損失特性および反射面の吸音特性からなる。遅延時間は、反射パスの総距離から音速cを用いて算出できる。また、室内伝達関数は1つの反射音だけではなく、複数の反射音からなる。すなわち、すべてのパスの合成関数を求めることになる。
吸音や減衰などの周波数特性を考慮する場合、インパルス応答を算出する際に損失特性情報を含める必要がある。このとき、遅延時間dは時間帯域にあるのに対し、損失特性Tlは周波数帯域の関数であるので、一般に、帯域変換を行わなければならない。帯域変換には、フーリエ変換および逆変換などのアルゴリズムを要するため、計算量が多く、無数の反射パスに対して変換を行うと、膨大な時間を要する。その結果、リアルタイム性が失われる。
室内伝達関数(RTF:Room Transfer Function)は、室内における音源から受音点まで、壁の反射や大気減衰などを含む伝達特性を表す。これを算出するには、反射パスの遅延時間と損失特性の2つの要素が必要になる。損失特性に関しては、前に述べた大気伝播による損失特性および反射面の吸音特性からなる。遅延時間は、反射パスの総距離から音速cを用いて算出できる。また、室内伝達関数は1つの反射音だけではなく、複数の反射音からなる。すなわち、すべてのパスの合成関数を求めることになる。
吸音や減衰などの周波数特性を考慮する場合、インパルス応答を算出する際に損失特性情報を含める必要がある。このとき、遅延時間dは時間帯域にあるのに対し、損失特性Tlは周波数帯域の関数であるので、一般に、帯域変換を行わなければならない。帯域変換には、フーリエ変換および逆変換などのアルゴリズムを要するため、計算量が多く、無数の反射パスに対して変換を行うと、膨大な時間を要する。その結果、リアルタイム性が失われる。
本システムでは、壁の材質が持つ吸音特性などを考慮した音響再現を可能にするため、周波数帯域で再現を行なう。この手法について以下に述べる。
次に示すフーリエ変換が持つ性質を利用し、フーリエ変換回数を削減することによって、計算量の問題点を解決し、周波数特性を考慮したリアルタイム再現を実現させることができる。
時間帯域関数f(t)のフーリエ変換F{f(t)}をF(ω)としたとき、F(ω)は周波数帯域の関数となる。このとき次の性質が成り立つ。
これらの性質より、周波数帯域に変換された波形F(ω)から、
a.x秒の時間的な遅延を持つ波形F(ω)・eiωx
b.遅延時間の異なる2つ以上の波形の合成波F1(ω)+F1(ω)+・・・+F1(ω)
を求めることができる。
次に示すフーリエ変換が持つ性質を利用し、フーリエ変換回数を削減することによって、計算量の問題点を解決し、周波数特性を考慮したリアルタイム再現を実現させることができる。
時間帯域関数f(t)のフーリエ変換F{f(t)}をF(ω)としたとき、F(ω)は周波数帯域の関数となる。このとき次の性質が成り立つ。
a.x秒の時間的な遅延を持つ波形F(ω)・eiωx
b.遅延時間の異なる2つ以上の波形の合成波F1(ω)+F1(ω)+・・・+F1(ω)
を求めることができる。
また、総損失特性αωによる損失を適用した波形はαω・F(ω)となる。
したがって、音源から、直接音と反射音をまとめて周波数帯域上で計算することが可能となり、フーリエ変換のプロセスは順・逆変換を一回実行するだけで反響(全ての反射音)を再現することができる。音源波形を標本化し、入力信号列をf(t)とするとき、そのフーリエ変換F(ω)は次のようになる。
求める反響における反射音の数がn個,k番目の反射音の遅れをxk,総吸音特性をαω kとしたとき、入力信号列に対する反響F(ω)は
となる。これをまとめると
となる。
したがって、音源から、直接音と反射音をまとめて周波数帯域上で計算することが可能となり、フーリエ変換のプロセスは順・逆変換を一回実行するだけで反響(全ての反射音)を再現することができる。音源波形を標本化し、入力信号列をf(t)とするとき、そのフーリエ変換F(ω)は次のようになる。
入力信号列を除く項をRTF(ω)とすると、RTF(ω)は、入力信号列に依存しない係数になる。すなわち、任意の信号列のフーリエ変換とこの係数の積を求めることによって、時間帯域に戻したとき音響が再現される。
上記の式ではRTF(ω)は音響再現に用いられる音響伝達関数となる。音響伝達関数は入力信号に依存しないことから、あらかじめ求めることができ、再現時の負担を軽減する。つまり、リアルタイム音響再現の実現に大きく寄与する。
一般に用いられるフィードバック回路を用いたインパルス応答フィルタ(FIRフィルタ)の場合、時間帯域上の計算であり、n反射音再現にはn個の加算器,乗算器,遅延器が必要となる。よって、再現処理時間は反射音の数に依存する。
これに対して、上式の音響伝達関数RTF(ω)を用いた場合、加算,乗算,遅延とも周波数帯域で一つのマトリックスで計算されるため、反射音の数は音響伝達関数生成時のみに関係する。再現時の処理速度は反射音の数に依存しない。
これに対して、上式の音響伝達関数RTF(ω)を用いた場合、加算,乗算,遅延とも周波数帯域で一つのマトリックスで計算されるため、反射音の数は音響伝達関数生成時のみに関係する。再現時の処理速度は反射音の数に依存しない。
(頭部伝達関数の算出)
聴覚における空間情報の把握は、主に両耳受聴によって行われており、特に音の方向性の知覚は両耳の音圧レベル差,時間差によると言われている。このような音像定位を再現するには、一般に頭部伝達関数が用いられる。
頭部伝達関数(Head-Related Transfer Function:HRTF)は、反射波が全くない空間(自由空間)における、頭部や耳たぶの影響を含め、音源から聴取者の鼓膜までの音響伝達関数であり、両耳の音圧レベル差,時間差の情報を含んでいる。したがって、反射物を含む室内環境においては、虚像法の原理からそれぞれの反射音(虚音源)は独立した音像を持っていると考えられる。このことから、HRTFをRTFと分離して扱うことができる。
測定された両耳のHRTFを音声信号に畳み込むことによって、バイノーラルな信号が得られる。すなわち、立体的な音場を再現することができ、結果的に受聴者は音の方向性を知覚することが可能になる。なお、バイノーラル(binaural)とは、両耳で聴くことを意味するが、立体音響を指す。一般にバイノーラル方式といい、人間の耳の間隔にマイクをセットする録音方法で、360度の立体音場をヘッドフォンで再現する技術である。
HRTFは人の頭部やダミーヘッドによって実測することができる。しかし、HRTFは方向に依存した関数であるので、測定した音源方向に対しては忠実な立体音場を再現することができるが、その他の音源方向については再現に必要なHRTFを新たに測定する必要がある。実際には、全方位に対してHRTFを測定することは困難であり、実測値から補間を行う方法,球体・回転楕円体モデルによる合成による方法,などでHRTFを求める手法が行われている。
聴覚における空間情報の把握は、主に両耳受聴によって行われており、特に音の方向性の知覚は両耳の音圧レベル差,時間差によると言われている。このような音像定位を再現するには、一般に頭部伝達関数が用いられる。
頭部伝達関数(Head-Related Transfer Function:HRTF)は、反射波が全くない空間(自由空間)における、頭部や耳たぶの影響を含め、音源から聴取者の鼓膜までの音響伝達関数であり、両耳の音圧レベル差,時間差の情報を含んでいる。したがって、反射物を含む室内環境においては、虚像法の原理からそれぞれの反射音(虚音源)は独立した音像を持っていると考えられる。このことから、HRTFをRTFと分離して扱うことができる。
測定された両耳のHRTFを音声信号に畳み込むことによって、バイノーラルな信号が得られる。すなわち、立体的な音場を再現することができ、結果的に受聴者は音の方向性を知覚することが可能になる。なお、バイノーラル(binaural)とは、両耳で聴くことを意味するが、立体音響を指す。一般にバイノーラル方式といい、人間の耳の間隔にマイクをセットする録音方法で、360度の立体音場をヘッドフォンで再現する技術である。
HRTFは人の頭部やダミーヘッドによって実測することができる。しかし、HRTFは方向に依存した関数であるので、測定した音源方向に対しては忠実な立体音場を再現することができるが、その他の音源方向については再現に必要なHRTFを新たに測定する必要がある。実際には、全方位に対してHRTFを測定することは困難であり、実測値から補間を行う方法,球体・回転楕円体モデルによる合成による方法,などでHRTFを求める手法が行われている。
図13に示すのは、水平位置に対して0〜360度に対する周波数特性である。受音点向きに対する音源の位置を指すベクトルの角度より、該当する周波数特性を音源に畳み込むことで、音像定位を再現することができ、ユーザに音源の位置を認知させることが可能である。実際、室内において、パス生成により求められた数多くの反射音すべてに対しHRTF関数を適用することは、畳み込み演算量を考えると現実的ではない。そのため、通常、低次反射のみに対して計算する。
他の手法として、図14に示すように、受音点から角度別にエリア分割し、エリア毎に反射音を合成してから処理を行うことで、分割数の数以下の畳み込み演算が保証される。しかし、エリア分割を用いた手法の場合は、当然のことながら、頭部伝達関数は離散化されるため、補間が大きな課題になる。これに対し、後で、頭部伝達関数の単純化手法を提案し、すべての反射音に対して音像定位を再現する手法について述べる。
他の手法として、図14に示すように、受音点から角度別にエリア分割し、エリア毎に反射音を合成してから処理を行うことで、分割数の数以下の畳み込み演算が保証される。しかし、エリア分割を用いた手法の場合は、当然のことながら、頭部伝達関数は離散化されるため、補間が大きな課題になる。これに対し、後で、頭部伝達関数の単純化手法を提案し、すべての反射音に対して音像定位を再現する手法について述べる。
(後部残響音の予測)
幾何的な音響の予測によって高次反射音を計算する際、膨大な計算時間を要することから、通常、減衰して音圧レベルの低い無数の高次反射音を後部残響音(Late Reverberation)として分けて扱うことが多い。
本システムでは、同様に初期反射(Early Reflections)について、幾何的手法を用いて反射音の遅れや特性を求め、後部残響音を統計学的な予測により静的モデルとして生成する。このときの分岐点を、初期反射と後部残響音が分離しないようにするために、時間ではなく反射回数を基準に分ける。
幾何的な音響の予測によって高次反射音を計算する際、膨大な計算時間を要することから、通常、減衰して音圧レベルの低い無数の高次反射音を後部残響音(Late Reverberation)として分けて扱うことが多い。
本システムでは、同様に初期反射(Early Reflections)について、幾何的手法を用いて反射音の遅れや特性を求め、後部残響音を統計学的な予測により静的モデルとして生成する。このときの分岐点を、初期反射と後部残響音が分離しないようにするために、時間ではなく反射回数を基準に分ける。
一般に残響音の予測手法としては、次のようなものが挙げられる。
・初期反射群をフィードバックさせることによる残響生成
・残響式から残響時間を算出し、これに基づいてwhite noise を指数関数と合成することによる残響生成
・1 回反射,2 回反射,…nE 回反射の初期反射音から統計学的な手法を用いて、nE+1以降の反射を推定することによる残響生成
本システムでは、これらのうちの統計学的解法を用いた手法を利用する。
・初期反射群をフィードバックさせることによる残響生成
・残響式から残響時間を算出し、これに基づいてwhite noise を指数関数と合成することによる残響生成
・1 回反射,2 回反射,…nE 回反射の初期反射音から統計学的な手法を用いて、nE+1以降の反射を推定することによる残響生成
本システムでは、これらのうちの統計学的解法を用いた手法を利用する。
統計学的な分析を行う理由の一つは、エコーダイアグラム波形のこれから述べる特徴にある。図15に示す部屋において、1〜5次反射まで計算したときのエコーダイアグラムを図16に示す。
図16(a)の縦軸を対数表示にしたグラフを図16(b)に示す。図16(b)のグラフを反射回数別に分けると図17となる。図17のグラフから、エコーダイアグラム波形は反射次数ごとに、規則的に分かれるという特徴がみられる。したがって、本システムにおける後部残響音予測モデルは、規則性を見出し、以下の統計学に基づく手法を利用する。
・エコーダイアグラムの回帰分析
・各反射次数パスの分散
・各反射次数パスの重心
図16(a)の縦軸を対数表示にしたグラフを図16(b)に示す。図16(b)のグラフを反射回数別に分けると図17となる。図17のグラフから、エコーダイアグラム波形は反射次数ごとに、規則的に分かれるという特徴がみられる。したがって、本システムにおける後部残響音予測モデルは、規則性を見出し、以下の統計学に基づく手法を利用する。
・エコーダイアグラムの回帰分析
・各反射次数パスの分散
・各反射次数パスの重心
(反射次数パス別の回帰分析)
本手法で用いるエコーダイアグラムの回帰分析は、r次反射パスの回帰線を求めることで行う。音のインパルス応答の波形は、伝播中の損失によって、時間に伴い音圧レベルが低くなる傾向がある。すなわち、回帰線を求めることで平均的な減衰率を求めることができる。パスkの遅れをXk,音圧レベルをlogYk とし、回帰直線logY=aX+bは次のように求められる。
まず、それぞれの変数XとlogYの平均値バーXとバーlogYは、
になる。次に、XとlogYの共変動ΦXlogY を求める。
さらに、Zの変動ΦXを求める。
ここで、直線(対数表示)logY=aX+bの各定数a,bは、
になる。両辺の指数を求めることによって、次の回帰曲線を表す式になる。
本手法で用いるエコーダイアグラムの回帰分析は、r次反射パスの回帰線を求めることで行う。音のインパルス応答の波形は、伝播中の損失によって、時間に伴い音圧レベルが低くなる傾向がある。すなわち、回帰線を求めることで平均的な減衰率を求めることができる。パスkの遅れをXk,音圧レベルをlogYk とし、回帰直線logY=aX+bは次のように求められる。
まず、それぞれの変数XとlogYの平均値バーXとバーlogYは、
図17の各反射次数パスに対して回帰分析を行った結果を、図18に示す。図18において、それぞれの反射次数パス別に求められた回帰線は、同じ反射回数のパス群がもつ線形的な関係を表し、その係数から時間に対する傾きが得られる。同じ反射次数の系列であることから、この傾きは反射を除く距離に基づく大気減衰や拡散音場などの要素が含まれる。すなわち、音源の指向性,反射時の入射角による吸音率の差,壁の材質による吸音率の差などの要素を除けば、距離に比例する完全な直線(対数)上に並ぶ。いいかえると、回帰線に対するデータの縦方向の分散は、音源の指向性などを含む上記の要素のばらつきを表す指標であるといえる。
このばらつきには、壁の角度,材質のばらつきなどが含まれることで、材質の特性および部屋の形状的な特徴を表し、残響の推定のための重要な要素であると考え、反射次数別にそれぞれのパスの時間,強さに関する分散を考慮する。これに関して次に述べる。
このばらつきには、壁の角度,材質のばらつきなどが含まれることで、材質の特性および部屋の形状的な特徴を表し、残響の推定のための重要な要素であると考え、反射次数別にそれぞれのパスの時間,強さに関する分散を考慮する。これに関して次に述べる。
(反射次数パス別の時間/強さにおける分散)
データの分散を計算する際に、分析する次元を定めなければならない。例えば、平面状のデータならば、X方向やY方向の分析などの1次元的な分散と、重心から放射状の分析を行う2次元的な分散とがある。本システムでは、X方向,Y方向に分けて1次元的な分散の解析を行う。その理由は、時間的な(横方向)分散と音の強さの(縦方向)分散は独立しているからである。前述の通り、縦方向の分散は部屋のさまざまな特徴が含まれており、これを2次元的に分析すると、その情報は失われるため、縦方向,横方向に分けて分析する。なお、時間と音の強さは直線的な関係をもち、回帰分析によって求めることができる。
データの分散を計算する際に、分析する次元を定めなければならない。例えば、平面状のデータならば、X方向やY方向の分析などの1次元的な分散と、重心から放射状の分析を行う2次元的な分散とがある。本システムでは、X方向,Y方向に分けて1次元的な分散の解析を行う。その理由は、時間的な(横方向)分散と音の強さの(縦方向)分散は独立しているからである。前述の通り、縦方向の分散は部屋のさまざまな特徴が含まれており、これを2次元的に分析すると、その情報は失われるため、縦方向,横方向に分けて分析する。なお、時間と音の強さは直線的な関係をもち、回帰分析によって求めることができる。
2次元グラフにプロットされた反射パスkのデータ(Xk,Yk)に対する縦方向の分散は、以下のように求める。
まず、各測定値の平均値からのずれの総量が0にならないようにするために、平均値からの変位の二乗和をとる。要素数をK,音圧レベルをXk(k=1,2,…,K)とすると、音圧レベルの分散VYは次式で定義される。
すなわち、logYの変動ΦlogYをKで割ったものである。
しかし、上記に示す分散は平均値バーlogYからの分散であり、求めたいのは回帰線からの分散である。したがって、バーlogYに回帰線関数のXkに対するlogYを代入すればよい。よって、回帰線からの分散V’Yは次式のようになる。
通常の縦方向分散VYは重心に対する変動を元に計算する。すなわち、(対数表示の)直線logY= ̄X( ̄Xは定数)からの分散を表す。一方、V’Yは(対数表示の)直線logY=aX+bからの分散であり、前述の通り空間形状、音源の指向性、壁の材質などの特性をもっている。この分散を残響の予測に利用することで、幾何学的に求められた初期反射の上記の性質を継承させることが可能である。
まず、各測定値の平均値からのずれの総量が0にならないようにするために、平均値からの変位の二乗和をとる。要素数をK,音圧レベルをXk(k=1,2,…,K)とすると、音圧レベルの分散VYは次式で定義される。
しかし、上記に示す分散は平均値バーlogYからの分散であり、求めたいのは回帰線からの分散である。したがって、バーlogYに回帰線関数のXkに対するlogYを代入すればよい。よって、回帰線からの分散V’Yは次式のようになる。
以上、縦方向(音圧レベル)の分散について述べた。次に、時間的な分散について述べる。音は高次反射になるにつれ、その遅れ時間のばらつきも大きくなる(図17参照)、したがって横方向の分散も解析する必要がある。上述のVYの式と同様に、横方向の分散VXは次式のように求められる。
図17の各反射次数パスに対して、それぞれの縦横方向の分散VY,VX,および回帰線からの縦方向の分散V’Yを求めた結果を表1に示す。
[表1]反射パスの反射次数別音圧レベルの分散
[表1]反射パスの反射次数別音圧レベルの分散
(反射次数別パスデータ(時間/強さ)の重心)
図17のグラフを反射次数別に眺めると、データが規則的に移動していることがわかる。これは、各反射次数に対して平均的なパスの距離が著しく変化するからである。また、大気伝播による損失よりも反射時の損失が大きく、反射次数に対する音圧レベルも大きく変化する。その結果、反射次数が増加するにつれてデータはグラフの右下の方に移動する。
このデータの移動に基づいて、幾何学的に計算された1〜nE次反射パスの重心からnE+1次反射パスの重心を推定する。重心は、それぞれのデータ(Xk,logYk)の平均値である。nE+1次反射パス群の重心は、各反射次数に対する重心の近似線(つまりその回帰線)及び平均移動量を求めることによって、推定することができる(図19参照)。
図17のグラフを反射次数別に眺めると、データが規則的に移動していることがわかる。これは、各反射次数に対して平均的なパスの距離が著しく変化するからである。また、大気伝播による損失よりも反射時の損失が大きく、反射次数に対する音圧レベルも大きく変化する。その結果、反射次数が増加するにつれてデータはグラフの右下の方に移動する。
このデータの移動に基づいて、幾何学的に計算された1〜nE次反射パスの重心からnE+1次反射パスの重心を推定する。重心は、それぞれのデータ(Xk,logYk)の平均値である。nE+1次反射パス群の重心は、各反射次数に対する重心の近似線(つまりその回帰線)及び平均移動量を求めることによって、推定することができる(図19参照)。
<分散の適用>
最後に、分散の適用手法について述べる。
これまで説明した計算によって、反射次数別に求められた分散V’YとVXから、分散の比PY’,PX を算出し、これをもとに、すでに計算されたデータを移動、分散させる。なお、縦と横方向の分散を独立に適用するために次のように計算している。
まず、各データを回帰線に対して縦方向にPYだけ分散させる。次に、PY’を保存するため、回帰線方向に限定した上で重心に対する分散PXを適用する。すなわち、図19に示すとおり、点Uを縦方向に分散させた点をUY,UYを横方向に分散させた点をUYXとしたとき、UXを通る回帰線に平行な直線上の点U’YXになるように補正を行う。これによって、縦方向の分散が保存される。
これまでの計算の手順を、以下にまとめる。(nEまでのデータは幾何的に算出されたとする。)
1) 1〜nE次反射音群の重心を計算
2) nE+1次反射音群の重心を推定
3) 1〜nE次反射音群の回帰線を計算
4) nE+1次反射音群の回帰線を推定
5) 1〜nE次反射音群の分散および分散比計算
6) nE+1次反射音群の分散を推定
7) 1〜nE次反射音群の重心を移動し、分散の調整(および補正)を行う
最後に、分散の適用手法について述べる。
これまで説明した計算によって、反射次数別に求められた分散V’YとVXから、分散の比PY’,PX を算出し、これをもとに、すでに計算されたデータを移動、分散させる。なお、縦と横方向の分散を独立に適用するために次のように計算している。
まず、各データを回帰線に対して縦方向にPYだけ分散させる。次に、PY’を保存するため、回帰線方向に限定した上で重心に対する分散PXを適用する。すなわち、図19に示すとおり、点Uを縦方向に分散させた点をUY,UYを横方向に分散させた点をUYXとしたとき、UXを通る回帰線に平行な直線上の点U’YXになるように補正を行う。これによって、縦方向の分散が保存される。
これまでの計算の手順を、以下にまとめる。(nEまでのデータは幾何的に算出されたとする。)
1) 1〜nE次反射音群の重心を計算
2) nE+1次反射音群の重心を推定
3) 1〜nE次反射音群の回帰線を計算
4) nE+1次反射音群の回帰線を推定
5) 1〜nE次反射音群の分散および分散比計算
6) nE+1次反射音群の分散を推定
7) 1〜nE次反射音群の重心を移動し、分散の調整(および補正)を行う
以下に、本システムによる残響予測の実行例を示す。
図21(a)では、1〜2次反射まで計算した応答に対し、3,4次反射の応答を推定した。また、図21(b)では、1〜3次反射まで計算した応答に対し、4次反射の応答を推定する。図21(c)では、4次反射まで計算している。
結果的に、左側の3つのインパルス応答は、1〜4次反射の応答であり、推定部分を除いて述べると、上から2反射まで、3反射まで、4反射まで幾何学的に計算した結果を示す。これから、4反射までの推定による残響予測は、計算による残響結果と同様であり、推定による残響予測を用いることができる。
なお、15次反射、25次反射の推定値の計算結果から、15次反射と25次反射はほとんど変わらなく、これ以降の計算は(元になった部屋において)不必要であることを意味する。
図21(a)では、1〜2次反射まで計算した応答に対し、3,4次反射の応答を推定した。また、図21(b)では、1〜3次反射まで計算した応答に対し、4次反射の応答を推定する。図21(c)では、4次反射まで計算している。
結果的に、左側の3つのインパルス応答は、1〜4次反射の応答であり、推定部分を除いて述べると、上から2反射まで、3反射まで、4反射まで幾何学的に計算した結果を示す。これから、4反射までの推定による残響予測は、計算による残響結果と同様であり、推定による残響予測を用いることができる。
なお、15次反射、25次反射の推定値の計算結果から、15次反射と25次反射はほとんど変わらなく、これ以降の計算は(元になった部屋において)不必要であることを意味する。
<システムへの実装>
これまでに説明した原理をまとめ、音響再現システムへの実装について述べる。幾何音響に基づく室内音響の再現は、直接音及び反射音を求めることによって行われる。前述の通り、室内の音響を音響伝達関数としてあらかじめ計算しておくことで、任意の音声に畳み込むことで音響を再現できる。
室内における音響を伝達関数として表現する際、その係数を求める必要がある。すなわち、ある位置(音源および受音点)における音響伝達関数を保存することにより、任意の入力信号を幾何的な演算と切り離して、即座に変換することができる。よって、音源を固定し、室内での受音点の各位置の音響伝達関数を保存すれば、受音点の位置に相当する音響伝達関数を用いて変換ができ、移動しつつ音響の変化を再現できる。しかし、室内での全ての点における音響伝達関数を保存することはメモリ量を考えても非現実的である。ここでは、空間全体をグリッド分割し、各セルの音響伝達関数を保存することによって、移動するユーザ(受音点)の位置によって適用する伝達関数を使い分け、リアルタイム再現を行っている(図22参照)。
これまでに説明した原理をまとめ、音響再現システムへの実装について述べる。幾何音響に基づく室内音響の再現は、直接音及び反射音を求めることによって行われる。前述の通り、室内の音響を音響伝達関数としてあらかじめ計算しておくことで、任意の音声に畳み込むことで音響を再現できる。
室内における音響を伝達関数として表現する際、その係数を求める必要がある。すなわち、ある位置(音源および受音点)における音響伝達関数を保存することにより、任意の入力信号を幾何的な演算と切り離して、即座に変換することができる。よって、音源を固定し、室内での受音点の各位置の音響伝達関数を保存すれば、受音点の位置に相当する音響伝達関数を用いて変換ができ、移動しつつ音響の変化を再現できる。しかし、室内での全ての点における音響伝達関数を保存することはメモリ量を考えても非現実的である。ここでは、空間全体をグリッド分割し、各セルの音響伝達関数を保存することによって、移動するユーザ(受音点)の位置によって適用する伝達関数を使い分け、リアルタイム再現を行っている(図22参照)。
図22に示すようなグリッド分割を用いる場合、グリッドの分割サイズが大きな問題になる。また、音響伝達関数を保存する場合、グリッド内のどの点を代表点として計算するのかを考慮する必要がある。
グリッド分割の際、セルサイズが大きくなるにつれ、エッジでの変化が著しいため、本システムでは、パスの反射次数が高いほど、反射音の明瞭度が低くなる性質を利用して反射次数別に分割のサイズを変更している。図23では、左から1次反射,2次反射,3次反射パス計算に用いるグリッドを示す。図23に示すように、反射の次数が高くなるにつれて、使用するグリッドが大きくなっている。受音点位置のそれぞれの反射次数ごとのグリッドに保存されている音響伝達関数を読み出し、合成して音響伝達関数として使用する。
音響伝達関数の計算における受音点の位置に関しては、現時点ではセルの中央点を計算の対象としているが、これ以外にさまざまな方法が考えられる。その1つとしては、セル内の4点を計算し、平均を取る方法が挙げられる。この場合は周りのセルに近い点で計算するため、エッジでの急激な変化を多少抑えることができると考えられる。
グリッド分割の際、セルサイズが大きくなるにつれ、エッジでの変化が著しいため、本システムでは、パスの反射次数が高いほど、反射音の明瞭度が低くなる性質を利用して反射次数別に分割のサイズを変更している。図23では、左から1次反射,2次反射,3次反射パス計算に用いるグリッドを示す。図23に示すように、反射の次数が高くなるにつれて、使用するグリッドが大きくなっている。受音点位置のそれぞれの反射次数ごとのグリッドに保存されている音響伝達関数を読み出し、合成して音響伝達関数として使用する。
音響伝達関数の計算における受音点の位置に関しては、現時点ではセルの中央点を計算の対象としているが、これ以外にさまざまな方法が考えられる。その1つとしては、セル内の4点を計算し、平均を取る方法が挙げられる。この場合は周りのセルに近い点で計算するため、エッジでの急激な変化を多少抑えることができると考えられる。
これまで、グリッド分割による再現を行ってきたが、この際、いくつかの問題が生じる。グリッドの形状及び大きさによって不自然な音響の変化が目立つなど、グリッド間での連続性が保たれないことがしばしばある。この解決法として、セル内での伝達関数の動的化を考える。セル内での受音点の移動に伴い、パス距離を更新することにより、セルの境界部分での誤差を和らげることができ、音響の大きな変化が避けられる。これに関しては、次に詳しく述べる。
(音響伝達関数の動的化)
前述の通り、グリッド分割において各セルに音響伝達関数を保存する場合、セルのエッジ部分で不具合が生じる。これは、セルの領域内では音響が変化しないため、その分セル同士の境界で、反射音の音圧,遅延および,周波数特性の変化が大きくなる。
これを解決するため、本システムでは音響伝達関数の動的化を行った。セル内の領域を代表点(受音点)に近い領域として考え、計算された反射パスの距離は変化するものの、反射経路はさほど変わらない。これを利用して、図24に示すように、今までセルの代表点の音響伝達関数の保存を行っていたのに対し、各セル全体を受音点として、このセルに到達するすべてのパスのIDをつけ、音響伝達関数ではなくIDをつけたパスリストをディスクやメモリ等に保存する。ここで用いるIDはパスの反射経路である(1つの反射経路には唯一のパスが存在する)。これによって、使用メモリ量も抑えることができる。
なお、図24に示したIDリストの例は、各壁にA〜Mの符号をつけ、反射する壁の符号を利用して、各パスのIDとしている。例えば、ADは、音源S→壁A→壁D→受音セルのパスを示している。
前述の通り、グリッド分割において各セルに音響伝達関数を保存する場合、セルのエッジ部分で不具合が生じる。これは、セルの領域内では音響が変化しないため、その分セル同士の境界で、反射音の音圧,遅延および,周波数特性の変化が大きくなる。
これを解決するため、本システムでは音響伝達関数の動的化を行った。セル内の領域を代表点(受音点)に近い領域として考え、計算された反射パスの距離は変化するものの、反射経路はさほど変わらない。これを利用して、図24に示すように、今までセルの代表点の音響伝達関数の保存を行っていたのに対し、各セル全体を受音点として、このセルに到達するすべてのパスのIDをつけ、音響伝達関数ではなくIDをつけたパスリストをディスクやメモリ等に保存する。ここで用いるIDはパスの反射経路である(1つの反射経路には唯一のパスが存在する)。これによって、使用メモリ量も抑えることができる。
なお、図24に示したIDリストの例は、各壁にA〜Mの符号をつけ、反射する壁の符号を利用して、各パスのIDとしている。例えば、ADは、音源S→壁A→壁D→受音セルのパスを示している。
各セルのパスリストの保存後、受音点の位置から、セルのパスリストを探索し、パスと壁面の衝突判定を行いつつ、動的に音響伝達関数を求める。したがって、パスの生成/探索を前処理として行うことで、リストに含まれるパスのみに対して更新を行うことができ、無駄な処理を省くことができる。また、Beam Tracingとは異なり、領域が長方形(長方体)であるため、現在位置からセルを判定するのが容易である。音響伝達関数の動的化によって必要な情報のみを更新できるため、リアルタイム再現には欠かせない要素であるが、図25に示すような小範囲で音響が変化する部屋の形状においては、リストが大きくなるため、効率が低下する。これは、後で述べる分割法を用いることによって解決できる。
音響伝達関数を用いた再現のプロセスは3段階に分けることができる。はじめに幾何的な計算,次に音響伝達関数の算出,最後に伝達関数による再現である。上記の動的生成は、このうちの幾何的な計算を省略し、保存された幾何的な情報に基づき反射パスを更新する手法で、音響伝達関数の算出および最終的な再現は動的に行う。すなわち、反射次数が高く、パスの数が多ければ当然計算量も増加する。したがって、高次数反射に対して行うとリアルタイム性を失う恐れがある。
音響伝達関数を用いた再現のプロセスは3段階に分けることができる。はじめに幾何的な計算,次に音響伝達関数の算出,最後に伝達関数による再現である。上記の動的生成は、このうちの幾何的な計算を省略し、保存された幾何的な情報に基づき反射パスを更新する手法で、音響伝達関数の算出および最終的な再現は動的に行う。すなわち、反射次数が高く、パスの数が多ければ当然計算量も増加する。したがって、高次数反射に対して行うとリアルタイム性を失う恐れがある。
本システムでは、リアルタイム性を考慮し、音響伝達関数の算出処理をパスの反射回数に応じて、静的または動的計算に分けて処理する。反射回数が多い場合は、静的生成で音響伝達関数を保存するのに対し、反射回数が少ない場合は、動的生成でパスIDのリストを保存する。静的または動的計算から得られた音響伝達関数に対して音声信号を入力し、合成信号を求めることによって、高次数反射にも対応する。
<可聴化システム(AURALIZATION SYSTEM)>
本音響再現システムの最終段階は可聴化処理である。可聴化処理では、入力された音声に対し音響的な変換をした後、音声としての出力を行う。無限長の入力音声に対する変換処理は、ブロックに区切って行う必要がある。つまり、入力音声から一つのブロックを読み込み、変換した結果を再生バッファに送って再生する。このバッファ制御システムについて述べる。
本音響再現システムの最終段階は可聴化処理である。可聴化処理では、入力された音声に対し音響的な変換をした後、音声としての出力を行う。無限長の入力音声に対する変換処理は、ブロックに区切って行う必要がある。つまり、入力音声から一つのブロックを読み込み、変換した結果を再生バッファに送って再生する。このバッファ制御システムについて述べる。
(マルチバッファ・システム)
本システムでは、フーリエ変換による帯域変換を用いて、周波数帯域で音響伝達関数を適用している。周波数帯域で処理を行っている理由は、残響や拡散などの効果を適用しやすく、これによって、リアルタイムの自由度が向上するからである。
フーリエ変換を用いた手法のひとつの問題点として、残響時間がほぼ無限であるフィードバックを用いた手法に対して、残響時間が制限されることが挙げられる。無限長のフーリエ変換は不可能であり、入力信号を一定時間のブロックに区切って処理を行う必要がある。このブロックに対するフーリエ変換のサイズはサンプリング定理によりその2倍以上とる必要がある。図26では、音声からデータを切り取り、帯域変換及び逆変換を行った例を示す。このとき、切り取られたブロックがFFTバッファサイズの半分を超えたサイズである場合、エイリアシングが生じる。
本システムでは、フーリエ変換による帯域変換を用いて、周波数帯域で音響伝達関数を適用している。周波数帯域で処理を行っている理由は、残響や拡散などの効果を適用しやすく、これによって、リアルタイムの自由度が向上するからである。
フーリエ変換を用いた手法のひとつの問題点として、残響時間がほぼ無限であるフィードバックを用いた手法に対して、残響時間が制限されることが挙げられる。無限長のフーリエ変換は不可能であり、入力信号を一定時間のブロックに区切って処理を行う必要がある。このブロックに対するフーリエ変換のサイズはサンプリング定理によりその2倍以上とる必要がある。図26では、音声からデータを切り取り、帯域変換及び逆変換を行った例を示す。このとき、切り取られたブロックがFFTバッファサイズの半分を超えたサイズである場合、エイリアシングが生じる。
しかしながら、本システムでは音響伝達関数を用いて、特性フィルターだけではなく波形の時間的な推移を行っていることが一つの特徴でもある。すなわち、FFTバッファに格納されたデータを伝達関数によって変換を行ったとき、信号読み取りブロックサイズをFFTバッファサイズの半分に設定した場合、推移した音声はFFTバッファサイズを越える。よって、図27に示すように、エイリアシングが生じることは明らかであり、音声の復元が不可能になる。これを避けるため、最大の推移時間を考慮した上で切り取りブロックのサイズを定める必要がある。
したがって、FFTバッファにおける最大遅延時間Δtは
になる(図28参照)。残響時間を長くするためには、このΔtを大きく取る必要があり、これに比例してFFTバッファサイズも増大し、膨大な計算量になる。
本システムでは、この問題を改善するために、マルチバッファシステムを採用した。計算量を考えると、いくつかの小さいFFTバッファに分けて計算した方がよい。そこで、インパルス応答を一定時間に区切り、これらを小さいFFTバッファ複数個に設定して音響伝達関数ATFを求める。これによって、計算機の処理能力に応じた任意の残響時間を計算することができる。
したがって、FFTバッファにおける最大遅延時間Δtは
本システムでは、この問題を改善するために、マルチバッファシステムを採用した。計算量を考えると、いくつかの小さいFFTバッファに分けて計算した方がよい。そこで、インパルス応答を一定時間に区切り、これらを小さいFFTバッファ複数個に設定して音響伝達関数ATFを求める。これによって、計算機の処理能力に応じた任意の残響時間を計算することができる。
このシステムの概略を図29に示す。図29に示すシステムでは、入力信号のサンプリングレートを16384Hzであるとして述べる。4個の16384サンプルのFFTバッファ502,504,506,508を用いたシステムを表している。
まず、入力音声をブロックに区切り、それぞれの音響伝達関数ATFによって変換する。この図29の例では、ブロックサイズと遅延時間が最大となるように、ブロックサイズ(samples)=1FFTバッファの最大遅延(samples)としている。そのため、4個のFFTバッファを使った場合の最大の遅延は4096×4=16384samplesになる。最後に、4個のFFTバッファ502,504,506,508の足し合わせたデータを再生バッファ510に送り、再生処理を行う。
まず、入力音声をブロックに区切り、それぞれの音響伝達関数ATFによって変換する。この図29の例では、ブロックサイズと遅延時間が最大となるように、ブロックサイズ(samples)=1FFTバッファの最大遅延(samples)としている。そのため、4個のFFTバッファを使った場合の最大の遅延は4096×4=16384samplesになる。最後に、4個のFFTバッファ502,504,506,508の足し合わせたデータを再生バッファ510に送り、再生処理を行う。
(再生バッファシステム)
本システムの最終プロセスとして、計算された出力波形を実際の音として出力する。マルチバッファから出力された波形の管理について次に述べる。
再生バッファも複数のストリーミング・バッファから構成される。FFTバッファの数をNB,そのサイズをlBとして、再生バッファの数はNB+2,サイズはlB/4になる。図29では、1つのFFTバッファに含まれる音声のサイズはlB/2であり、このうち半分はとなりのバッファと共有するため、計算されたデータを格納するためにはNB+1個のバッファが必要となる。計算中にこれらのバッファは全てロックされるため、再生を可能にするためには、フリーとなる一つの余分なバッファが必要である。したがって、NB+2個の再生バッファが必要になる。図29のシステムの場合、4つのFFTバッファ502,504,506,508で構成されるため、図30に示すように、6つ分の再生バッファ510が必要になる。
本システムの最終プロセスとして、計算された出力波形を実際の音として出力する。マルチバッファから出力された波形の管理について次に述べる。
再生バッファも複数のストリーミング・バッファから構成される。FFTバッファの数をNB,そのサイズをlBとして、再生バッファの数はNB+2,サイズはlB/4になる。図29では、1つのFFTバッファに含まれる音声のサイズはlB/2であり、このうち半分はとなりのバッファと共有するため、計算されたデータを格納するためにはNB+1個のバッファが必要となる。計算中にこれらのバッファは全てロックされるため、再生を可能にするためには、フリーとなる一つの余分なバッファが必要である。したがって、NB+2個の再生バッファが必要になる。図29のシステムの場合、4つのFFTバッファ502,504,506,508で構成されるため、図30に示すように、6つ分の再生バッファ510が必要になる。
再生ポインタを除く残りの5つのバッファはロックされ、計算されたデータが格納される。これらのバッファはループ構造をしており、末端バッファを終了すると、再生ポインタは先頭のバッファを指す(図30参照)。これによって、無限長の波形を、バッファ格納処理(ロック)と干渉することなく再生できる。データ格納の流れを、図31に示す。この図示した処理を制御するために、再生ポインタがバッファの境界を指したとき、イベントを発生させ、計算を開始する。すなわち、リアルタイム再現を可能にするためには、バッファのサイズを時間単位で表した時間(図29の場合は1/4sec)以内に音響再現処理を終了させる必要がある。
<システムの応用>
以下に、いくつかの点で、システム全体の効率化を実現するための手法について述べる。
(時間帯域での室内伝達関数の生成)
前に述べたシステムでは、反射パス情報リストを分割されたセルに対して保存することによって、パストレース・プロセスを省略でき、動的に室内伝達関数の計算が可能になった。このとき、算出処理は周波数帯域で行われ、室内伝達関数は次の式のように表される。
(ただし、αk(ω)とxkは、それぞれk番目のパスの損失特性と遅延である。)
しかし、上述の式では、乗算回数はk×Nになる(Nはサンプル数)。ゆえに、最も計算時間を要するパストレース処理を省略したとしても、RTF生成の処理時間の問題が残る。よって、RTF算出の高速化が求められる。ここでは、RTFに関して時間帯域での算出を行うことによる高速化について述べる。
以下に、いくつかの点で、システム全体の効率化を実現するための手法について述べる。
(時間帯域での室内伝達関数の生成)
前に述べたシステムでは、反射パス情報リストを分割されたセルに対して保存することによって、パストレース・プロセスを省略でき、動的に室内伝達関数の計算が可能になった。このとき、算出処理は周波数帯域で行われ、室内伝達関数は次の式のように表される。
しかし、上述の式では、乗算回数はk×Nになる(Nはサンプル数)。ゆえに、最も計算時間を要するパストレース処理を省略したとしても、RTF生成の処理時間の問題が残る。よって、RTF算出の高速化が求められる。ここでは、RTFに関して時間帯域での算出を行うことによる高速化について述べる。
室内伝達関数の算出処理を周波数帯域で行う理由は、反射パスの損失特性(周波数特性)が周波数帯域の関数であるからである。したがって、それぞれの反射パスの損失特性αk(ω)に遅延eiωxkをかけ、全反射パスの合成関数を求めればRTF(ω)が得られる。
周波数特性は、計測データとして128Hz,256Hz,512Hz,1KHz,2KHz,4KHz,8KHzの損失率で表される。これを特性パラメータと呼ぶ。特性パラメータを線形または,スプライン関数で補間して使用する。8点を操作点として、16384点の周波数帯域上の関数として表わされ、これが損失特性として用いる。図32は、表2の材料に対する周波数ごとの吸音特性(実測データ)に基き、補間された特性関数(図32(a):線形補間,図32(b):B-Spline補間)を示している。
[表2]建築材質の吸音率(特性パラメータ)
ここで、補間された周波数特性関数を三角関数で表現することを考える。補間を行ったあと(図33の周波数特性の線形補間例参照)、生成された関数に帯域変換をかける。その結果を図34に示す。図34に示すように、周波数成分ごとの三角関数を得ることができる。フーリエ変換の可逆性より、図34の関数は時間帯域の関数であるといえる。
周波数特性は、計測データとして128Hz,256Hz,512Hz,1KHz,2KHz,4KHz,8KHzの損失率で表される。これを特性パラメータと呼ぶ。特性パラメータを線形または,スプライン関数で補間して使用する。8点を操作点として、16384点の周波数帯域上の関数として表わされ、これが損失特性として用いる。図32は、表2の材料に対する周波数ごとの吸音特性(実測データ)に基き、補間された特性関数(図32(a):線形補間,図32(b):B-Spline補間)を示している。
[表2]建築材質の吸音率(特性パラメータ)
ここで、補間された周波数特性関数を三角関数で表現することを考える。補間を行ったあと(図33の周波数特性の線形補間例参照)、生成された関数に帯域変換をかける。その結果を図34に示す。図34に示すように、周波数成分ごとの三角関数を得ることができる。フーリエ変換の可逆性より、図34の関数は時間帯域の関数であるといえる。
次に、周波数特性を表す操作点の間隔を考える。波形の特徴的な形状を崩さないためには、最低限として、100サンプル長の波長を持つ三角関数が必要である。つまり、16384/128=128Hz以下の周波数成分が必要である。したがって、帯域変換によって得られた成分のうち、1〜128Hz成分以外の成分を放棄し(ローパス・フィルタを用いる)、逆変換をかければ、形は特徴を失わずにほとんど変わらない。なお、音響的な変化として、周波数特性の詳細な精度よりも各周波数の成分比率が重要となる。
図35の周波数特性対数表示の図で示すように、128Hz以上の成分をカットした場合、元の波形と比較しても波形の特徴は変わらず、ほとんど一致する波形を生成できることが分かる。同様に、64Hz以上の成分をカットした場合、周波数成分のグラフの128Hz付近では形が崩れてきている事が分かる(図35を参照)。ゆえに、最低128Hz以下の波形が特徴的な形を復元するのに必要であると考えられる。実際に、図36の周波数特性波形を表現するのに必要となるデータの図では、128Hz以上の成分はほとんどない。
図35の周波数特性対数表示の図で示すように、128Hz以上の成分をカットした場合、元の波形と比較しても波形の特徴は変わらず、ほとんど一致する波形を生成できることが分かる。同様に、64Hz以上の成分をカットした場合、周波数成分のグラフの128Hz付近では形が崩れてきている事が分かる(図35を参照)。ゆえに、最低128Hz以下の波形が特徴的な形を復元するのに必要であると考えられる。実際に、図36の周波数特性波形を表現するのに必要となるデータの図では、128Hz以上の成分はほとんどない。
このように、周波数特性が簡略化され、時間帯域上の128サンプルサイズの波形で表現されることによって、次のことがいえる。
フーリエ変換の畳み込みの性質から、周波数帯域関数の乗算は時間帯域関数の畳み込み演算と等価である。すなわち、図36に示す128サンプルの関数に遅延関数を畳み込み、合成関数を求めれば、時間帯域上の室内伝達関数、つまり室内インパルス応答(RIR:Room Impulse Response)が得られる。
ここでいう遅延関数は、前式のeiωtを時間帯域に直したものである。これは、tだけ遅らせた単位パルスになる。したがって、上記に述べた畳み込み演算は128サンプルのシフト演算ということになる。以前のシステムでは、16384×k(kはパス数)の計算量を要するのに対し、時間帯域で計算および周波数特性の簡略化を行うことによって、128サンプルのシフト演算のみで計算でき、なおかつ、周波数特性が考慮される。ゆえに、以前より明らかに高速化されることがわかる。
フーリエ変換の畳み込みの性質から、周波数帯域関数の乗算は時間帯域関数の畳み込み演算と等価である。すなわち、図36に示す128サンプルの関数に遅延関数を畳み込み、合成関数を求めれば、時間帯域上の室内伝達関数、つまり室内インパルス応答(RIR:Room Impulse Response)が得られる。
ここでいう遅延関数は、前式のeiωtを時間帯域に直したものである。これは、tだけ遅らせた単位パルスになる。したがって、上記に述べた畳み込み演算は128サンプルのシフト演算ということになる。以前のシステムでは、16384×k(kはパス数)の計算量を要するのに対し、時間帯域で計算および周波数特性の簡略化を行うことによって、128サンプルのシフト演算のみで計算でき、なおかつ、周波数特性が考慮される。ゆえに、以前より明らかに高速化されることがわかる。
以上、時間帯域でRTFの算出を行う手法による高速化について述べてきた。上述の手法では、周波数帯域関数である損失特性を帯域変換によって時間帯域の関数に直し、後部(128サンプル以降)をカットしても周波数帯域上の関数にはさほどの影響がないことがわかった。これによって、小さいサイズの配列シフト演算でRTFを求めることができることから高速化が実現された。しかし、上記の事柄は、反射音が一つの反射経路に対し固定された特性をもつことを前提としている。すなわち、反射吸音による損失計算に対しては有効であるが、大気伝播による損失計算のような、反射パスの距離に依存した特性の適用に対しては後で述べているとおり、逆効果である。
このことから、上記の手法は一見否定されるように思えるが、周波数特性を複数の窓関数を用いて表現することにより、パスの距離に依存した特性に対しても有効となり、なおかつ、更なる高速化が可能になる。これについて次に述べる。
このことから、上記の手法は一見否定されるように思えるが、周波数特性を複数の窓関数を用いて表現することにより、パスの距離に依存した特性に対しても有効となり、なおかつ、更なる高速化が可能になる。これについて次に述べる。
(窓関数を利用した周波数特性の表現)
前述の通り、周波数特性を時間帯域で計算する場合の一つの難点として、音の大気伝播による損失を計算する際に、上述の式に示す周波数特性は距離に依存した特性になるため、前処理として計算することが難しいことが挙げられる。その理由は減衰の適用方法にある。大気伝播による損失は通常、単位距離に対する減衰率として扱われる。したがって、距離lに対する減衰率mはmlになる。ここで、大気伝播による損失は周波数特性をもっていることから、波形f(t)の減衰を求めるためには、f(t)のフーリエ変換F(ω)に周波数成分別の減衰率M(ω)のべき乗M(ω)lをかける必要がある。周波数帯域でのべき乗は時間帯域との互換性はないため、次式のように距離に比例した畳み込み演算回数を行う必要がある。
その結果、時間帯域での演算は逆に時間がかかり高速化の意味がなくなる。本システムでは、これを解決するために周波数特性曲線の制御点を独立させることで、周波数特性関数M(ω)と距離lを定数化する手法を採用する。
前述の通り、周波数特性を時間帯域で計算する場合の一つの難点として、音の大気伝播による損失を計算する際に、上述の式に示す周波数特性は距離に依存した特性になるため、前処理として計算することが難しいことが挙げられる。その理由は減衰の適用方法にある。大気伝播による損失は通常、単位距離に対する減衰率として扱われる。したがって、距離lに対する減衰率mはmlになる。ここで、大気伝播による損失は周波数特性をもっていることから、波形f(t)の減衰を求めるためには、f(t)のフーリエ変換F(ω)に周波数成分別の減衰率M(ω)のべき乗M(ω)lをかける必要がある。周波数帯域でのべき乗は時間帯域との互換性はないため、次式のように距離に比例した畳み込み演算回数を行う必要がある。
前述では、図32(a)に示すとおり、測定された吸音特性パラメータを通過点とするB-Spline補間を用いて、周波数特性関数を前処理として生成する手法について述べた。この手法を用いると、時間帯域での計算を行った場合には非常に時間がかかる。これは、曲線補間を行った時点で全ての特性パラメータが同じ関数上に配置されることが原因である。したがって、本システムでは曲線補間処理を前処理ではなく、リアルタイムで行うことで、特性パラメータ同士を反射音の再現の段階まで独立な状態に保つことを考えた。その結果、上式に示した畳み込みの問題が解決される。
しかし、B-Spline補間などの逆変換を用いた補間手法は時間がかかるという問題がある。また、周波数特性関数は時間帯域の関数ではないため、時間帯域での計算においては曲線補間を行ったあと帯域変換(逆フーリエ変換)を行う必要がある。これらの問題点を解決するため、窓関数を利用した時間帯域で周波数帯域上の曲線補間を行う手法を用いている。
曲線補間に用いられるB-Spline 曲線やBezier 曲線は重心結合(Barycentric combination)に基づいている。重心結合は複数の関数(基底関数)によって構成されており、以下の式で定義されている。
ただし、Piはベクトル、Bi(t)は基底関数、つまりスカラーである。
しかし、B-Spline補間などの逆変換を用いた補間手法は時間がかかるという問題がある。また、周波数特性関数は時間帯域の関数ではないため、時間帯域での計算においては曲線補間を行ったあと帯域変換(逆フーリエ変換)を行う必要がある。これらの問題点を解決するため、窓関数を利用した時間帯域で周波数帯域上の曲線補間を行う手法を用いている。
曲線補間に用いられるB-Spline 曲線やBezier 曲線は重心結合(Barycentric combination)に基づいている。重心結合は複数の関数(基底関数)によって構成されており、以下の式で定義されている。
基底関数の和が1であることから、周波数特性で考えれば無特性状態、すなわち、あらゆる信号にかけても変わらない状態を表せる。基底関数を高さ1の関数として、周波数特性の各特性パラメータに対し基底関数を一つ用意することで、それぞれの基底関数を定数倍することによって、周波数特性を線形結合で表すことができる。この高さ1の関数を窓関数として扱い、時間帯域で各定数値を変更することで周波数特性を操作できる。すなわち、時間帯域で周波数帯域の曲線(周波数特性)を、曲線補間手法を用いることなく自由に操作できる。
これにより、距離lは定数化し、周波数特性はlに依存しなくなる。
吸音特性の特性パラメータM1,M2,…,Mn(nは特性パラメータの数)を、前処理として補間した場合の曲線をM(ω)とすると、周波数特性U(ω)は
になる。一方、線形結合によって周波数特性パラメータを表すときの各高さ1の関数をそれぞれB1(ω),B2(ω),…,Bn(ω)としたときの周波数特性U’(ω)は
になる。
これにより、距離lは定数化し、周波数特性はlに依存しなくなる。
吸音特性の特性パラメータM1,M2,…,Mn(nは特性パラメータの数)を、前処理として補間した場合の曲線をM(ω)とすると、周波数特性U(ω)は
関数U’(ω)とU(ω)は必ずしも一致しないが、同じ特性パラメータを通る。もともとU(ω)は正しい周波数特性ではなく、補間によって生成されたものであり、点M1,M2,…,Mnを通る曲線を求めることが本来の目的である。したがって、U’(ω)は別の補間手法であると考えれば、望む結果であることがわかる。
図37では、2つの手法の比較を図示している。図37の窓関数を用いた場合、基底関数の定数倍したものをそれぞれ別々に帯域変換を行っている。フーリエ変換の線形性から、この定数の処理は時間帯域で行っても同じであるから、M1,M2,…,Mnをl乗すればそれぞれの窓関数(時間帯域上の基底関数)にかけられる定数になる。このことから、以前に述べたl乗の問題は解決されることがわかる。
図37では、2つの手法の比較を図示している。図37の窓関数を用いた場合、基底関数の定数倍したものをそれぞれ別々に帯域変換を行っている。フーリエ変換の線形性から、この定数の処理は時間帯域で行っても同じであるから、M1,M2,…,Mnをl乗すればそれぞれの窓関数(時間帯域上の基底関数)にかけられる定数になる。このことから、以前に述べたl乗の問題は解決されることがわかる。
(頭部伝達関数の単純化手法を利用した実装)
リアルタイム音響再現において、音場予測手法として幾何音響を用いる利点は、反射パス(反射音)の到来方向がわかることである。反射パスの到来角度からHRTF(頭部伝達関数)(図13)を適用することにより、反射音の音像定位まで再現することができる。すなわち、立体的な音場を再現することが可能になる。HRTFは反射物が存在しない自由空間における伝達関数を表し、音源から到来する反射音をそれぞれ独立に扱う幾何音響と合成すれば、空間形状に基づいた3次元音場情報をリアルタイムでリスナーに伝えることができ、グラフィックスだけでは表せないような臨場感をユーザに与えることができる。
本システムではHRTFを用いて音場を再現している。仮想空間でのユーザの指向方向に対する音源の位置を指すベクトルの角度および、反射パスが受音点に到来する角度から、あらかじめメモリに読み込まれたダミーヘッドの頭部伝達関数データを元に音像定位を再現できる。
さて、角度に該当する伝達関数を入力音声に畳み込むことによって音像を再現できるが、パスによって到来角度が様々である。そのため、パス数の分だけ畳み込みが必要になる。頭部伝達関数のインパルス応答は5〜6ms以内でサイズが小さいとはいえ、100〜1000本にもわたるパスに適用すれば、当然リアルタイム性が失われる恐れがある。そのため、本システムではHRTFの適用レベルを設定している。適用レベル以外の反射パスの扱いについては、以降に述べる。
リアルタイム音響再現において、音場予測手法として幾何音響を用いる利点は、反射パス(反射音)の到来方向がわかることである。反射パスの到来角度からHRTF(頭部伝達関数)(図13)を適用することにより、反射音の音像定位まで再現することができる。すなわち、立体的な音場を再現することが可能になる。HRTFは反射物が存在しない自由空間における伝達関数を表し、音源から到来する反射音をそれぞれ独立に扱う幾何音響と合成すれば、空間形状に基づいた3次元音場情報をリアルタイムでリスナーに伝えることができ、グラフィックスだけでは表せないような臨場感をユーザに与えることができる。
本システムではHRTFを用いて音場を再現している。仮想空間でのユーザの指向方向に対する音源の位置を指すベクトルの角度および、反射パスが受音点に到来する角度から、あらかじめメモリに読み込まれたダミーヘッドの頭部伝達関数データを元に音像定位を再現できる。
さて、角度に該当する伝達関数を入力音声に畳み込むことによって音像を再現できるが、パスによって到来角度が様々である。そのため、パス数の分だけ畳み込みが必要になる。頭部伝達関数のインパルス応答は5〜6ms以内でサイズが小さいとはいえ、100〜1000本にもわたるパスに適用すれば、当然リアルタイム性が失われる恐れがある。そのため、本システムではHRTFの適用レベルを設定している。適用レベル以外の反射パスの扱いについては、以降に述べる。
図38では、HRTFを適用するバイノーラル化モジュールの流れを示す。各反射音に対し、吸音・減衰・遅延等の処理よりパスの伝達関数(以降PTFと呼ぶ)を生成後(S604)、HRTF適用レベルの判定および角度の算出を行い(S608)、PTFに畳み込む(S610)。これにより、生成されたインパルス応答が定位を持った反射音の音響係数になる(S612)。最終的にすべての係数をH’1〜H’nの和を取る(S614)ことで、バイノーラルな音響伝達関数を算出できる(S616)。
HRTF適用レベルに除外されたパスは音像定位計算を省略するわけではない。本システムでは、数多くの反射パスに対してHRTFを適用するため、HRTF関数の簡略化を提案し、減衰して変化が目立たない高次反射パスに適用した。この原理について以下に述べる。
HRTF適用レベルに除外されたパスは音像定位計算を省略するわけではない。本システムでは、数多くの反射パスに対してHRTFを適用するため、HRTF関数の簡略化を提案し、減衰して変化が目立たない高次反射パスに適用した。この原理について以下に述べる。
図39に示す時間帯域の頭部伝達関数を3軸方向から眺めると、図40(a)〜(c)になる。このいくつかの特徴的な形状を次のようにまとめた。
(1)角度によって、インパルス応答の全体の遅れが三角関数的に変化している(図40(a))
(2)角度によって、全体的に音量が変化している(図40(b))
(3)角度ごとのインパルス応答が似たような形状をしている(図40(c))
音響の変化を認知するとき、遅延,音量は最も影響する要素であり、詳細な形状(特性)よりも優先すべきであると考え、図40で見られるインパルス応答の全体的な遅れと音量に着目した。
これが立体的な音場を感知するための重要な要素であり、どんな頭部伝達関数においても共通な特徴であると言える。
(1)角度によって、インパルス応答の全体の遅れが三角関数的に変化している(図40(a))
(2)角度によって、全体的に音量が変化している(図40(b))
(3)角度ごとのインパルス応答が似たような形状をしている(図40(c))
音響の変化を認知するとき、遅延,音量は最も影響する要素であり、詳細な形状(特性)よりも優先すべきであると考え、図40で見られるインパルス応答の全体的な遅れと音量に着目した。
これが立体的な音場を感知するための重要な要素であり、どんな頭部伝達関数においても共通な特徴であると言える。
HRTFの頭部形状に依存しない遅延時間である(1)に関しては、次のように解釈している。HRTFデータの測定はダミーヘッドの周囲円上に音源を配置しており、右耳に配置された受音器は円の中央にないため、当然この円上の音源からの距離が異なる(図41)。その結果、図40(a)のように到達する音の遅延にも変化が出てくる。角度に対する音源−受音点の距離を示す関数lsrは次のようになる。
音源:(cosθ, sinθ) 受音点:左(0,10) 右(0,−10)
この関数は図42のようになる。これを比較すると、測定データと同じ形であることが分かる。
この関数は図42のようになる。これを比較すると、測定データと同じ形であることが分かる。
(2)に関しては、次のように解釈できる。図41に示すとおり、真右の音源から右耳に到達する場合は頭の影響がほとんど無いのに対し、真左の音源から右耳の音に到達する音は頭を真っ向にすり抜けるため、その損失は大きい。つまり、回折を除き、透過による損失が大きく影響していることが分かる。ここで、図41のように頭を円として考え、音源から受音点(右耳の鼓膜)へ直線を引き、円内部に含む線分の距離は透過損失に比例するので、これに従って式にまとめると以下のようになる。
まず、図43に示している音源−受音点を通る直線は以下の式となる。
この直線と頭に相当する半径10の円との交点は、
である。この2点のうち、音源に近い方をq(qx,qy)として、音源−受音点を結ぶ線分から頭部(半径10の円)の内部を通る線分の長さlhは、
である。このとき、交点は必ず2つ以上存在するとしている。この結果を図44の平均的損失量として示す。
まず、図43に示している音源−受音点を通る直線は以下の式となる。
以上のことをまとめて,計算により生成されたHRTFは図45のようになる。図45(a)では、左鼓膜に到達する代表的なHRTFとして、遅延と損失の情報を表している。ここで、左鼓膜に対して頭部の影響が最も小さくなる真左の音源からのインパルス応答RIR(図45(b))を考え、これをHRTFに畳み込むことにより左鼓膜へ到達したインパルス応答が求まる(図45(c))。この計算によって求められた結果(図45(c))は、実際に測定されたHRTFに対応するインパルス応答(図45(d))と同じ形として得られている。
次に、システムへの実装について述べる。伝達関数が単純化されたとはいえ、すべてのパスに対して畳み込むことは精度が落ちるだけで、計算量的には全く無意味である。重要なのは、反射パスの到来角度から遅延時間と損失量がわかることである。これによって、前のフローチャート(図38参照)を図46のフローチャートように変更することができる。図46と図38のフローチャートを比較すると、n本の反射パスの場合、畳み込み演算の回数はn回であったのに対し、遅延・損失量の訂正と1回の畳み込みで済ますことができる。これについて以下に詳しく述べる。
すでに述べたとおり、音響伝達関数ATFが室内伝達関数RTFと頭部伝達関数HRTFによって構成されている。ここでRTFは音源から受音点へ到達する様々な反射パスの伝達関数PTFの合成関数であり、時間帯域上では単純な和として表される。一方、HRTFは、図13に示すような角度に依存する伝達関数となっており、これを時間帯域へ変換することにより、頭部インパルス応答(HRIR:Head-Related Impulse Response)が得られる。これらのことから、losskをパスkの総合的な損失,Δtkをパスkの到達遅延時間,φkをパスの到来角度,src(t)をドライソースの信号系列としたとき、鼓膜で聞き取られる音響を表すATFに対応するインパルス応答RIR(t)(室内インパルス応答)は次式のように表せる。
HRTFを単純化し、代表的なインパルス応答rIR(representative Impulse Response)とその遅延(前述の式のlsr)及び損失(前述の式のlh)で表すこととしたとき、単位振幅のインパルス応答rIRに遅延と振幅を掛け合わせることで、擬似的な頭部伝達関数が得られる。これを用いて上式を表すと、次式のようになる。
この式は図38のフローチャートに対応しており、数式上の変形によって次式のように書き直すことができる。
上式は、図46のフローチャートを表している。
HRTFのデータは個人差があり、説明した計算法は決して厳密ではない。そのため、直接音や初期反射に対して測定データの畳み込みを用い、減衰した音に対しては簡略された手法を適用している。
HRTFのデータは個人差があり、説明した計算法は決して厳密ではない。そのため、直接音や初期反射に対して測定データの畳み込みを用い、減衰した音に対しては簡略された手法を適用している。
(音響の変化に基づいた空間分割)
前述では、グリッド分割による反射パス情報リストの保存について述べた。空間分割は、通常、位置判定が容易であることから、グリッド分割が用いられることが多い。しかし、音響再現においては、受音点の場所によっては音響が激しく変化し、セルの大きさはこれに対応できない場合が発生する。この一例を図25に示した。ここでは、空間をグリッド分割したときに同じセルに到達する反射パスが大幅に変化し、セルに保存される反射パス情報リストが大きくなる例を示している。
本システムでは、この問題を解決するために音響の変化に基づく分割法を考慮する必要があると考え、コンピュータ・グラフィックスで形状表現法としてよく用いられる四分木を利用する。
音響の変化に関連する要素は様々であるが、主に反射音の遅れ,音圧レベル,周波数特性は大きく影響している。これらを考慮した上で分割を行う手法を提案する。本システムでは四分木分割を用いることによって、これらの問題を解決した。この適用方法について以下に述べる。なお、本システムに用いられる分割手法は、2次元分割を行っている。これは、ユーザは平面上にしか移動していないことを前提としているからである。3次元への拡張を行う場合、四分木は八分木(Octo-tree)になる。
前述では、グリッド分割による反射パス情報リストの保存について述べた。空間分割は、通常、位置判定が容易であることから、グリッド分割が用いられることが多い。しかし、音響再現においては、受音点の場所によっては音響が激しく変化し、セルの大きさはこれに対応できない場合が発生する。この一例を図25に示した。ここでは、空間をグリッド分割したときに同じセルに到達する反射パスが大幅に変化し、セルに保存される反射パス情報リストが大きくなる例を示している。
本システムでは、この問題を解決するために音響の変化に基づく分割法を考慮する必要があると考え、コンピュータ・グラフィックスで形状表現法としてよく用いられる四分木を利用する。
音響の変化に関連する要素は様々であるが、主に反射音の遅れ,音圧レベル,周波数特性は大きく影響している。これらを考慮した上で分割を行う手法を提案する。本システムでは四分木分割を用いることによって、これらの問題を解決した。この適用方法について以下に述べる。なお、本システムに用いられる分割手法は、2次元分割を行っている。これは、ユーザは平面上にしか移動していないことを前提としているからである。3次元への拡張を行う場合、四分木は八分木(Octo-tree)になる。
本システムでは、音響の変化が著しい場所では分割を詳細にし、変化が微小である場所では分割を粗くすることによって、メモリを効率的に使っている。これに適した分割法として、四分木分割が挙げられる。
四分木(Quad-tree)とはピクセルの集合の2次元図形を表す手法である。平面全体をそれぞれ縦横半分に分割すると4つの領域に分割される。各領域に図形がすべて占めるかあるいは全くない場合は分割を中止し、それ以外の場合は各領域をさらに4つの領域に分割していく。このような再帰的手法により全ての図形は図47のような四分木のツリー構造で表現できる。図形の形状にもよるが、四分木表現によりデータ量を縮小させることができる。
音響の比較対照はさまざまであるが、反射パス情報リストの保存が本分割の目的であることから、本システムではインパルス応答に着目する。上記に述べた分割手法の四分木の分割条件を、一定以上の音響の変化量に置き換えれば、図48に示すように空間を分割できる。
インパルス応答といっても、これ自体には音響の変化に関わる要素がたくさん含まれる。したがって、本手法で用いる比較の要素を明確にする必要がある。比較の対象とする要素としては、音圧レベルの変化,インパルス応答の多次元ベクトル内積がある。以下にそれぞれを詳しく説明する。
四分木(Quad-tree)とはピクセルの集合の2次元図形を表す手法である。平面全体をそれぞれ縦横半分に分割すると4つの領域に分割される。各領域に図形がすべて占めるかあるいは全くない場合は分割を中止し、それ以外の場合は各領域をさらに4つの領域に分割していく。このような再帰的手法により全ての図形は図47のような四分木のツリー構造で表現できる。図形の形状にもよるが、四分木表現によりデータ量を縮小させることができる。
音響の比較対照はさまざまであるが、反射パス情報リストの保存が本分割の目的であることから、本システムではインパルス応答に着目する。上記に述べた分割手法の四分木の分割条件を、一定以上の音響の変化量に置き換えれば、図48に示すように空間を分割できる。
インパルス応答といっても、これ自体には音響の変化に関わる要素がたくさん含まれる。したがって、本手法で用いる比較の要素を明確にする必要がある。比較の対象とする要素としては、音圧レベルの変化,インパルス応答の多次元ベクトル内積がある。以下にそれぞれを詳しく説明する。
(音圧レベルの解析)
インパルス応答から、パルスに対する音圧レベルを図ることができる。これはつまり単位的な指標として考えられる。高さ1のインパルスの積分(面積)は1として(一般にδ関数という)、これに対するインパルス応答を積分すれば、指定時間内(積分の範囲)のエネルギー量を図ることができる。これを正規化することで、指定時間の平均音圧レベルとして考えることができる。したがって、位置pi,jにおけるインパルス応答の系列をATFi,j(t)として、平均音圧レベルPLi,jは次のようになる。
空間を細分割し、すべての格子に対する平均音圧レベルを求めた例を、図49に示す。
ここで、空間における音圧の変化を比較する際のオペレータについて述べる。本手法では、画像処理のフィルタリングに用いられる1次微分(ソーベルオペレータ,Sobel Operator)を利用する。分割された各格子に対して平均音圧レベルを算出することで、2次元のグレースケール画像と同等に扱うことができる。
画像のおける明るさを平均音圧レベルに置き換えると、空間全体の音圧の変化量を算出できる。図49の平均音圧レベルから1次微分を求めたものを図50に示す。
差分を用いた音圧の変化の解析方法について述べてきた。この結果を空間分割のための情報として利用する。しかし、平均音圧レベルの情報だけでは音の遅れや特性等の変化が検出できない。したがって、本システムでは次に述べるアルゴリズムも用いる。
インパルス応答から、パルスに対する音圧レベルを図ることができる。これはつまり単位的な指標として考えられる。高さ1のインパルスの積分(面積)は1として(一般にδ関数という)、これに対するインパルス応答を積分すれば、指定時間内(積分の範囲)のエネルギー量を図ることができる。これを正規化することで、指定時間の平均音圧レベルとして考えることができる。したがって、位置pi,jにおけるインパルス応答の系列をATFi,j(t)として、平均音圧レベルPLi,jは次のようになる。
ここで、空間における音圧の変化を比較する際のオペレータについて述べる。本手法では、画像処理のフィルタリングに用いられる1次微分(ソーベルオペレータ,Sobel Operator)を利用する。分割された各格子に対して平均音圧レベルを算出することで、2次元のグレースケール画像と同等に扱うことができる。
画像のおける明るさを平均音圧レベルに置き換えると、空間全体の音圧の変化量を算出できる。図49の平均音圧レベルから1次微分を求めたものを図50に示す。
差分を用いた音圧の変化の解析方法について述べてきた。この結果を空間分割のための情報として利用する。しかし、平均音圧レベルの情報だけでは音の遅れや特性等の変化が検出できない。したがって、本システムでは次に述べるアルゴリズムも用いる。
(インパルス応答のベクトル内積)
インパルス応答はパルス音の集合であり、それぞれにパルス(応答)は反射パスの距離に応じた遅れ、または、伝達の経路での損失特性をもっている。したがって、音響の変化を比較する際にこの2つの要素を考慮する必要がある。例えば、図51(a)に示すような例では、比較対照の波形の1 つのパルスが微小な遅延をもつ。この場合は、我々の聴覚にはその変化はさほど分からない。一方、図51(b)のように、大幅に遅れたときは音が分離して聞こえるため、音響に大きな変化があらわれる。上記の手法(音圧レベル)の場合には、いずれも同等に扱われるため、検出することができない。逆に、線形的に比較した場合は時系列の各値は独立しているため、図51(a)の場合でも大きな変化が現れる。
上記の変化の差を考慮するために、インパルス応答を多次元ベクトルとして扱い、その内積を求めることによって、ベクトル間の角度を算出できる。n次元ベクトルの場合、同じ高さのパルス音が時系列上でシフトしたとき、このベクトルは多n次元空間上の球面上を移動する。すなわち、遅延時間差が小さければ、球面上での移動距離が小さく、結果的にベクトル同士の角度も小さくなる。
このアルゴリズムを用いて、測定地点の周囲の4点もしくは8点と比較し、平均を取ることによって空間全体の変化を解析している。図50と同じ部屋における、この手法による解析結果を図52に示す。
上記の2つのアルゴリズムに基づいて空間分割を行う。四分木の上位階層を開始し、ボクセル内に含まれる格子の上記のアルゴリズムによって算出されたデータの平均値を求める。この値が指定値(適用度)を越えた場合のみに再分割する。分割されたボクセルに対し、さらにこの処理を繰り返す。この適用度を変更して実行した分割例を図53に示す。
インパルス応答はパルス音の集合であり、それぞれにパルス(応答)は反射パスの距離に応じた遅れ、または、伝達の経路での損失特性をもっている。したがって、音響の変化を比較する際にこの2つの要素を考慮する必要がある。例えば、図51(a)に示すような例では、比較対照の波形の1 つのパルスが微小な遅延をもつ。この場合は、我々の聴覚にはその変化はさほど分からない。一方、図51(b)のように、大幅に遅れたときは音が分離して聞こえるため、音響に大きな変化があらわれる。上記の手法(音圧レベル)の場合には、いずれも同等に扱われるため、検出することができない。逆に、線形的に比較した場合は時系列の各値は独立しているため、図51(a)の場合でも大きな変化が現れる。
上記の変化の差を考慮するために、インパルス応答を多次元ベクトルとして扱い、その内積を求めることによって、ベクトル間の角度を算出できる。n次元ベクトルの場合、同じ高さのパルス音が時系列上でシフトしたとき、このベクトルは多n次元空間上の球面上を移動する。すなわち、遅延時間差が小さければ、球面上での移動距離が小さく、結果的にベクトル同士の角度も小さくなる。
このアルゴリズムを用いて、測定地点の周囲の4点もしくは8点と比較し、平均を取ることによって空間全体の変化を解析している。図50と同じ部屋における、この手法による解析結果を図52に示す。
上記の2つのアルゴリズムに基づいて空間分割を行う。四分木の上位階層を開始し、ボクセル内に含まれる格子の上記のアルゴリズムによって算出されたデータの平均値を求める。この値が指定値(適用度)を越えた場合のみに再分割する。分割されたボクセルに対し、さらにこの処理を繰り返す。この適用度を変更して実行した分割例を図53に示す。
この空間分割法を用いることによって,次の利点が得られる。
・音響の変化位置の制度が向上する
空間を移動する場合、セルの境界部分では多少の変化が生じる。この変化位置は空間の分割の詳細度に依存しており、グリッドのサイズが大きければ、その誤差も大きくなる。四分木を用いることによって、変化が著しい場所での分割が詳細になり、精度が向上する。
・ひとつのセルに保存されるパス情報リストのサイズが縮小される
本システムでは、音源からセルに到達するすべてのパスIDをリストとして保存する。受音セルのサイズが大きければ、これに伴い到達するパス数が多い。本システムでは、リストに含まれるパスの壁との衝突判定を行っており、音響の変化が著しい場所では、パスが出現と消滅が多いと考えられるため、無駄に保存されているパスが多いことになる。
したがって、変化が著しい場所での細分割によって、衝突判定の回数を減らすことができる上、メモリを効率的に使うことができる。
・静的モデルにおけるセルでの境界で起こる変化が小さくなる
残響など静的モデルとして保存している伝達関数に関して、セル内は同じ伝達関数を用いるため音響は変化しない。逆に、セル境界部分ではその分だけ変化が大きい。これはセルのサイズに伴うため、音響事態の変化が著しい場所での詳細化によって大いに向上する。
以上、音響の変化に基づく分割手法について述べた。
・音響の変化位置の制度が向上する
空間を移動する場合、セルの境界部分では多少の変化が生じる。この変化位置は空間の分割の詳細度に依存しており、グリッドのサイズが大きければ、その誤差も大きくなる。四分木を用いることによって、変化が著しい場所での分割が詳細になり、精度が向上する。
・ひとつのセルに保存されるパス情報リストのサイズが縮小される
本システムでは、音源からセルに到達するすべてのパスIDをリストとして保存する。受音セルのサイズが大きければ、これに伴い到達するパス数が多い。本システムでは、リストに含まれるパスの壁との衝突判定を行っており、音響の変化が著しい場所では、パスが出現と消滅が多いと考えられるため、無駄に保存されているパスが多いことになる。
したがって、変化が著しい場所での細分割によって、衝突判定の回数を減らすことができる上、メモリを効率的に使うことができる。
・静的モデルにおけるセルでの境界で起こる変化が小さくなる
残響など静的モデルとして保存している伝達関数に関して、セル内は同じ伝達関数を用いるため音響は変化しない。逆に、セル境界部分ではその分だけ変化が大きい。これはセルのサイズに伴うため、音響事態の変化が著しい場所での詳細化によって大いに向上する。
以上、音響の変化に基づく分割手法について述べた。
Claims (10)
- 仮想空間内におけるリアルタイム音響再現システムであって、
少なくとも仮想空間の形状、壁面の材質、温度,湿度の基本情報が格納されている記憶手段と、
前記記憶手段から読み出した基本情報により、仮想空間内の音源位置から動的に与えられた受音点位置までのインパルス応答をフーリエ変換した伝達関数を生成する伝達関数生成手段と、
動的に与えられたデジタル音声データを一定時間切り出してフーリエ変換し、フーリエ変換された周波数帯のデータに対して前記伝達関数を適用し、逆フーリエ変換して、仮想空間内の音声再現データとして出力する可聴化手段と
を備えることを特徴とするリアルタイム音響再現システム。 - 請求項1に記載のリアルタイム音響再現システムにおいて、
前記伝達関数生成手段における前記伝達関数生成は、前記仮想空間内の音源位置から受音点位置までのパスを生成し、それぞれのパスごとの室内伝達関数、頭部伝達関数を求めることで行われることを特徴とするリアルタイム音響再現システム。 - 請求項2に記載のリアルタイム音響再現システムにおいて、
前記伝達関数生成手段における前記室内伝達関数は、統計学的な推測により求めた高次反射残響の推測値を用いて求められることを特徴とするリアルタイム音響再現システム。 - 請求項2又は3に記載のリアルタイム音響再現システムにおいて、
前記音源位置は、基本情報として与えられるとともに、
前記仮想空間をグリッドに分割して、各グリッドに受音点があるとして、グリッドごとの伝達関数を予め計算して伝達関数記憶手段に格納し、
前記伝達関数生成手段は、前記受音点が動的に与えられると、該受音点位置のグリッドに対する伝達関数を前記伝達関数記憶手段から読み出す
ことを特徴とするリアルタイム音響再現システム。 - 請求項4に記載のリアルタイム音響再現システムにおいて、
前記グリッドを反射次数ごとに大きさを変えて、反射次数ごとの伝達関数を計算して前記伝達関数記憶手段に格納し、
前記伝達関数生成手段は、受音点が動的に与えられると、該受音点位置の反射次数ごとのグリッドに対する伝達関数を前記伝達関数記憶手段から読み出して合成する
ことを特徴とするリアルタイム音響再現システム。 - 請求項4に記載のリアルタイム音響再現システムにおいて、
前記音源位置は、基本情報として与えられるとともに、
前記仮想空間をグリッドに分割し、各グリッドに到達するパスにIDをつけてグリッドごとにグリッドパス記憶手段に格納し、
前記伝達関数生成手段は、受音点位置が動的に与えられると、受音点位置のグリッド中のパスを前記グリッドパス記憶手段から読み出し、読み出したパスを用いて、受音点のパスを得る
ことを特徴とするリアルタイム音響再現システム。 - 請求項4〜6のいずれかに記載のリアルタイム音響再現システムにおいて、
前記伝達関数生成手段における前記グリッドは、前記インパルス応答の音圧レベルの変化に応じて、グリッドの分割サイズを変化させることを特徴とするリアルタイム音響再現システム。 - 請求項4〜6のいずれかに記載のリアルタイム音響再現システムにおいて、
前記伝達関数生成手段における前記グリッドは、前記インパルス応答のベクトル内積に応じて分割のサイズを変化させることを特徴とするリアルタイム音響再現システム。 - 請求項1〜8のいずれかに記載のリアルタイム音響再現システムにおいて、
前記可聴化手段は、複数のバッファを有しており、
入力音声を複数のブロックに分けて前記複数のバッファに入力してフーリエ変換し、フーリエ変換された周波数帯のデータに対して、バッファごとに前記伝達関数を適用して逆フーリエ変換し、複数のバッファのデータを足し合わせて仮想空間内の音声再現データとして出力することを特徴とするリアルタイム音響再現システム。 - 請求項1〜9のいずれかに記載のリアルタイム音響再現システムをコンピュータ・システムに構築させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003310647A JP2005080124A (ja) | 2003-09-02 | 2003-09-02 | リアルタイム音響再現システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003310647A JP2005080124A (ja) | 2003-09-02 | 2003-09-02 | リアルタイム音響再現システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005080124A true JP2005080124A (ja) | 2005-03-24 |
Family
ID=34412460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003310647A Pending JP2005080124A (ja) | 2003-09-02 | 2003-09-02 | リアルタイム音響再現システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005080124A (ja) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007003989A (ja) * | 2005-06-27 | 2007-01-11 | Asahi Kasei Homes Kk | 音環境解析シミュレーションシステム |
JP2007053624A (ja) * | 2005-08-18 | 2007-03-01 | Nippon Hoso Kyokai <Nhk> | ダウンミックス装置およびダウンミックスプログラム |
JP2008541520A (ja) * | 2005-05-04 | 2008-11-20 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | グラフィック・ユーザ・インタフェースの手段により空間音響再生システムにおける音響効果を生成及び処理するための装置及び方法 |
JP2012054698A (ja) * | 2010-08-31 | 2012-03-15 | Square Enix Co Ltd | ビデオゲーム処理装置、およびビデオゲーム処理プログラム |
US20120070005A1 (en) * | 2010-09-17 | 2012-03-22 | Denso Corporation | Stereophonic sound reproduction system |
JP2012145962A (ja) * | 2006-09-20 | 2012-08-02 | Harman Internatl Industries Inc | オーディオ入力信号の反響コンテンツを抽出および変更するためのシステム |
JP2012173445A (ja) * | 2011-02-21 | 2012-09-10 | Casio Comput Co Ltd | 共鳴音付加装置および電子楽器 |
JP5031840B2 (ja) * | 2007-08-20 | 2012-09-26 | パイオニア株式会社 | 音像定位予測装置及び音像定位制御システム並びに音像定位予測方法及び音像定位制御方法 |
JP2013243572A (ja) * | 2012-05-22 | 2013-12-05 | Nippon Hoso Kyokai <Nhk> | 残響応答生成装置およびそのプログラム |
WO2014178479A1 (ko) * | 2013-04-30 | 2014-11-06 | 인텔렉추얼디스커버리 주식회사 | 헤드 마운트 디스플레이 및 이를 이용한 오디오 콘텐츠 제공 방법 |
WO2016144459A1 (en) * | 2015-03-06 | 2016-09-15 | Microsoft Technology Licensing, Llc | Real-time remodeling of user voice in an immersive visualization system |
KR20190045696A (ko) * | 2017-10-24 | 2019-05-03 | 에스케이텔레콤 주식회사 | 가상 음향 합성 장치 및 방법 |
JP2019168730A (ja) * | 2013-12-05 | 2019-10-03 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 音響エコーキャンセルのための室内インパルス応答の推定 |
JP2020018620A (ja) * | 2018-08-01 | 2020-02-06 | 株式会社カプコン | 仮想空間における音声生成プログラム、四分木の生成方法、および音声生成装置 |
JP2020095439A (ja) * | 2018-12-12 | 2020-06-18 | 株式会社カプコン | 空間情報探索プログラム、および空間情報探索装置 |
KR20200081697A (ko) * | 2018-12-28 | 2020-07-08 | 한국건설기술연구원 | 개량형 소음 시뮬레이션 방법 |
JP2020118747A (ja) * | 2019-01-21 | 2020-08-06 | 株式会社Ihi | 音波伝搬シミュレーションシステム、および、音波伝搬シミュレーション方法 |
CN112230186A (zh) * | 2020-10-12 | 2021-01-15 | 国网重庆市电力公司电力科学研究院 | 一种户内变电站噪声源等效识别方法及装置 |
JP2021076768A (ja) * | 2019-11-12 | 2021-05-20 | 株式会社カプコン | 音声再生プログラム、および音声再生装置 |
CN113239573A (zh) * | 2021-06-05 | 2021-08-10 | 西北工业大学 | 基于无网格波动建模的封闭空间声场重构方法 |
CN114945978A (zh) * | 2020-11-27 | 2022-08-26 | 雅马哈株式会社 | 现场数据传送方法、现场数据传送系统、其传送装置、现场数据播放装置及其播放方法 |
CN115278509A (zh) * | 2022-07-29 | 2022-11-01 | 歌尔科技有限公司 | Vr设备音频播放方法、电子设备及计算机可读存储介质 |
WO2023162581A1 (ja) * | 2022-02-28 | 2023-08-31 | ソニーグループ株式会社 | 音響制作装置、音響制作方法および音響制作プログラム |
WO2023199817A1 (ja) * | 2022-04-14 | 2023-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理装置、音響再生システム、及び、プログラム |
WO2023214515A1 (ja) * | 2022-05-02 | 2023-11-09 | ソニーグループ株式会社 | 音響生成制御方法、音響制作装置および音響生成制御プログラム |
CN117935781A (zh) * | 2023-12-22 | 2024-04-26 | 深圳市润东来科技有限公司 | 一种音频信号处理方法及系统 |
CN118660258A (zh) * | 2024-08-19 | 2024-09-17 | 深圳市立平科技有限公司 | 一种户外音响功耗智能控制系统 |
-
2003
- 2003-09-02 JP JP2003310647A patent/JP2005080124A/ja active Pending
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008541520A (ja) * | 2005-05-04 | 2008-11-20 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | グラフィック・ユーザ・インタフェースの手段により空間音響再生システムにおける音響効果を生成及び処理するための装置及び方法 |
JP4651710B2 (ja) * | 2005-05-04 | 2011-03-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | グラフィック・ユーザ・インタフェースの手段により空間音響再生システムにおける音響効果を生成及び処理するための装置及び方法 |
JP2007003989A (ja) * | 2005-06-27 | 2007-01-11 | Asahi Kasei Homes Kk | 音環境解析シミュレーションシステム |
JP2007053624A (ja) * | 2005-08-18 | 2007-03-01 | Nippon Hoso Kyokai <Nhk> | ダウンミックス装置およびダウンミックスプログラム |
US9264834B2 (en) | 2006-09-20 | 2016-02-16 | Harman International Industries, Incorporated | System for modifying an acoustic space with audio source content |
CN103402169B (zh) * | 2006-09-20 | 2016-02-10 | 哈曼国际工业有限公司 | 用于提取和改变音频输入信号的混响内容的方法和装置 |
JP2012145962A (ja) * | 2006-09-20 | 2012-08-02 | Harman Internatl Industries Inc | オーディオ入力信号の反響コンテンツを抽出および変更するためのシステム |
JP5031840B2 (ja) * | 2007-08-20 | 2012-09-26 | パイオニア株式会社 | 音像定位予測装置及び音像定位制御システム並びに音像定位予測方法及び音像定位制御方法 |
JP2012054698A (ja) * | 2010-08-31 | 2012-03-15 | Square Enix Co Ltd | ビデオゲーム処理装置、およびビデオゲーム処理プログラム |
JP2012065264A (ja) * | 2010-09-17 | 2012-03-29 | Denso Corp | 立体音場生成装置 |
US20120070005A1 (en) * | 2010-09-17 | 2012-03-22 | Denso Corporation | Stereophonic sound reproduction system |
JP2012173445A (ja) * | 2011-02-21 | 2012-09-10 | Casio Comput Co Ltd | 共鳴音付加装置および電子楽器 |
JP2013243572A (ja) * | 2012-05-22 | 2013-12-05 | Nippon Hoso Kyokai <Nhk> | 残響応答生成装置およびそのプログラム |
WO2014178479A1 (ko) * | 2013-04-30 | 2014-11-06 | 인텔렉추얼디스커버리 주식회사 | 헤드 마운트 디스플레이 및 이를 이용한 오디오 콘텐츠 제공 방법 |
US20160088417A1 (en) * | 2013-04-30 | 2016-03-24 | Intellectual Discovery Co., Ltd. | Head mounted display and method for providing audio content by using same |
JP2019168730A (ja) * | 2013-12-05 | 2019-10-03 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 音響エコーキャンセルのための室内インパルス応答の推定 |
WO2016144459A1 (en) * | 2015-03-06 | 2016-09-15 | Microsoft Technology Licensing, Llc | Real-time remodeling of user voice in an immersive visualization system |
US9558760B2 (en) | 2015-03-06 | 2017-01-31 | Microsoft Technology Licensing, Llc | Real-time remodeling of user voice in an immersive visualization system |
US10176820B2 (en) | 2015-03-06 | 2019-01-08 | Microsoft Technology Licensing, Llc | Real-time remodeling of user voice in an immersive visualization system |
KR20190045696A (ko) * | 2017-10-24 | 2019-05-03 | 에스케이텔레콤 주식회사 | 가상 음향 합성 장치 및 방법 |
KR101975920B1 (ko) * | 2017-10-24 | 2019-05-09 | 에스케이텔레콤 주식회사 | 가상 음향 합성 장치 및 방법 |
JP2020018620A (ja) * | 2018-08-01 | 2020-02-06 | 株式会社カプコン | 仮想空間における音声生成プログラム、四分木の生成方法、および音声生成装置 |
JP2020095439A (ja) * | 2018-12-12 | 2020-06-18 | 株式会社カプコン | 空間情報探索プログラム、および空間情報探索装置 |
KR20200081697A (ko) * | 2018-12-28 | 2020-07-08 | 한국건설기술연구원 | 개량형 소음 시뮬레이션 방법 |
KR102159401B1 (ko) * | 2018-12-28 | 2020-09-23 | 한국건설기술연구원 | 개량형 소음 시뮬레이션 방법 |
JP7318211B2 (ja) | 2019-01-21 | 2023-08-01 | 株式会社Ihi | 音波伝搬シミュレーションシステム、および、音波伝搬シミュレーション方法 |
JP2020118747A (ja) * | 2019-01-21 | 2020-08-06 | 株式会社Ihi | 音波伝搬シミュレーションシステム、および、音波伝搬シミュレーション方法 |
JP2021076768A (ja) * | 2019-11-12 | 2021-05-20 | 株式会社カプコン | 音声再生プログラム、および音声再生装置 |
JP7348505B2 (ja) | 2019-11-12 | 2023-09-21 | 株式会社カプコン | 音声再生プログラム、および音声再生装置 |
CN112230186A (zh) * | 2020-10-12 | 2021-01-15 | 国网重庆市电力公司电力科学研究院 | 一种户内变电站噪声源等效识别方法及装置 |
CN114945978A (zh) * | 2020-11-27 | 2022-08-26 | 雅马哈株式会社 | 现场数据传送方法、现场数据传送系统、其传送装置、现场数据播放装置及其播放方法 |
CN113239573A (zh) * | 2021-06-05 | 2021-08-10 | 西北工业大学 | 基于无网格波动建模的封闭空间声场重构方法 |
CN113239573B (zh) * | 2021-06-05 | 2024-05-07 | 西北工业大学 | 基于无网格波动建模的封闭空间声场重构方法 |
WO2023162581A1 (ja) * | 2022-02-28 | 2023-08-31 | ソニーグループ株式会社 | 音響制作装置、音響制作方法および音響制作プログラム |
WO2023199817A1 (ja) * | 2022-04-14 | 2023-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理装置、音響再生システム、及び、プログラム |
WO2023214515A1 (ja) * | 2022-05-02 | 2023-11-09 | ソニーグループ株式会社 | 音響生成制御方法、音響制作装置および音響生成制御プログラム |
CN115278509A (zh) * | 2022-07-29 | 2022-11-01 | 歌尔科技有限公司 | Vr设备音频播放方法、电子设备及计算机可读存储介质 |
CN117935781A (zh) * | 2023-12-22 | 2024-04-26 | 深圳市润东来科技有限公司 | 一种音频信号处理方法及系统 |
CN118660258A (zh) * | 2024-08-19 | 2024-09-17 | 深圳市立平科技有限公司 | 一种户外音响功耗智能控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005080124A (ja) | リアルタイム音響再現システム | |
Raghuvanshi et al. | Parametric directional coding for precomputed sound propagation | |
CN105323684B (zh) | 声场合成近似方法、单极贡献确定装置及声音渲染系统 | |
De Sena et al. | Efficient synthesis of room acoustics via scattering delay networks | |
CN106105269B (zh) | 音频信号处理方法和设备 | |
US6990205B1 (en) | Apparatus and method for producing virtual acoustic sound | |
WO2019221895A1 (en) | Directional propagation | |
EP1816895B1 (en) | Three-dimensional acoustic processor which uses linear predictive coefficients | |
CN116156411A (zh) | 用于交互式音频环境的空间音频 | |
KR100606734B1 (ko) | 삼차원 입체음향 구현 방법 및 그 장치 | |
EP2153695A2 (en) | Early reflection method for enhanced externalization | |
Chaitanya et al. | Directional sources and listeners in interactive sound propagation using reciprocal wave field coding | |
CN108419174B (zh) | 一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统 | |
US20240244388A1 (en) | System and method for spatial audio rendering, and electronic device | |
EP4205103B1 (en) | Method for generating a reverberation audio signal | |
Raghuvanshi et al. | Interactive and Immersive Auralization | |
Svensson | Modelling acoustic spaces for audio virtual reality | |
US20090110202A1 (en) | Method of processing a signal | |
Oldfield | The analysis and improvement of focused source reproduction with wave field synthesis | |
CN117581297A (zh) | 音频信号的渲染方法、装置和电子设备 | |
JP2023532969A (ja) | 効率的な頭部関係フィルタ生成 | |
Foale et al. | Portal-based sound propagation for first-person computer games | |
Agus et al. | Energy-Based Binaural Acoustic Modeling | |
CN113348681B (zh) | 通过时变递归滤波器结构的虚拟声学渲染的方法与系统 | |
KR20030002868A (ko) | 삼차원 입체음향 구현방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080701 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081118 |