JP2012509632A5

JP2012509632A5 - オーディオ信号を変換するためのコンバータ及び方法

Info

Publication number: JP2012509632A5
Application number: JP2011536881A
Authority: JP
Filing date: 2009-11-20
Publication date: 2013-01-17
Anticipated expiration: 2029-11-20

Description

そのようなモデルは、「録音された音楽に空間的印象を付加する一例：バイノーラル・インパルス応答との信号畳み込み」と題する非特許文献１によって知られ、この場合、音響環境がコンバータ内でオーディオ信号を伝達関数と畳み込むことによってシミュレートされ、音響環境のこのモデルが形成される。Ｎチャネルの各々に対して、一組の畳み込みが確立されてＭチャネルの各々に対する残響が計算され、その結果Ｍチャネルを通して再生される音声が、モデル化された音響環境内で録音されたかのように知覚される。
米国ニューヨークのＡｕｄｉｏＥｎｇｉｎｅｅｒｉｎｇＳｏｃｉｅｔｙのジャーナル、１９９３年１１月１日付けのＮｏ．１１、第４１巻、８９４から９０４頁のＡｈｎｅｒｔＷ氏らによる「ＥＡＲＳＡｕｒａｌｉｚａｔｉｏｎＳｏｆｔｗａｒｅ」は、技術者用の電子的-音響的シミュレータ（ＥＡＳＥ）に関連して用いるための電子的に聴覚化されたルームシミュレーション（ＥＡＲＳ）について開示している。ＥＡＳＥ２．０のルームシミュレーションから、シミュレートされたモノラルのルームインパルス応答は、指向性情報すなわち放射の方向を備えて作成されている。応答は、ＥＡＳＥポスト処理ファイルに記憶することができ、部屋の選ばれた視聴位置及びシミュレートされる視聴者の頭の方向の関数として両耳用の聴覚化を導出するように外耳伝達関数で畳み込みをすることができる。
ＡＣＭＴＵＳＬＮＫＤ−ＤＯＩ：１０．１１４５．１０１５７０６．１０１５７１０、ＡＣＭＴｒａｎｓａｃｔｉｏｎｓｏｎＧｒａｐｈｉｃｅｓ、２００４年８月１付けのＮｏ．３、第２３巻、２４９から２５８頁のＴｓｉｎｇｏｓＮ氏らによる「ＰｅｒｃｅｐｔｕａｌＡｕｄｉｏＲｅｎｄｅｒｉｎｇｏｆＣｏｍｐｌｅｘＶｉｒｔｕａｌＷｎｖｉｒｏｎｍｅｎｔｓ」は、何百もの動きのある音源を含む複雑な仮想シーンに対するリアルタイム３Ｄオーディオレンダリングパイプラインを開示している。１０倍以上の音源数がコンシューマ３Ｄオーディオハードウェアで利用可能であり、オーディオ品質の最小限の減少での聴覚の選択除去及び空間的な詳細度により処理することができる。述べられている方法は、室内及び室外環境の両方に対して良好に実現され、相互のアーキテクチャの音響シミュレーション及びビデオゲームの自動３Ｄ音声管理を含む多くのアプリケーションに対してオーディオハードウェアの制限された能力に影響を与える。聞こえない音源は、動的に排除され、残存する可聴の音源は、多くのクラスタにグループ化される。各クラスタは、１つの知覚的な基準を用いて位置決めされる１つの偽音源によって表される。空間的な音声処理は、その後、その偽音源のみに関して実行され、それによって、計算上のコストを低減する。音声品質の制限された劣化及び局所的欠陥が取得されるが、それはクラスタで大きく異なるものである。

室を特徴付けるための計測設備を有する室を示す。室内の計測位置における残響を示す、計測されたインパルス応答の強度包絡線を示す。室のモデルを用いて得られた、模擬インパルス応答の強度包絡線を示す。計測されたインパルス応答と模擬インパルス応答の両方の強度包絡線を示す。残響内の幾つかの成分をゼロに設定し、所定数の高い反響のみを残した後の模擬インパルス応答の強度包絡線を示す。室モデルを用いてＮ個のオーディオ・チャネルをＭ個のオーディオ・チャネルに変換するためのコンバータを示す。コンバータを備えたオーディオ装置を示す。計測されたインパルス応答を示す。模擬前期部分を示す。模擬後期部分を示す。櫛型フィルタ効果を回避するためのピークの選択を示す。２つのチャネル１２０、１２１を示す。

コンバータ６０は、残響の前期部分及び後期部分を別個に処理するものであり、入力信号を分割するための分割器に接続された入力チャネルを有する。プロセッサは、入力チャネル及び出力チャネルの種々の組合せに関する複数の残響を計算して出力信号の前期部分を生成することができる。後期部分は全く生成されないか、又は分割器に同様に接続された別個のプロセッサによって生成され、この場合、後期部分は、例えばアルゴリズムによる残響のような従来の方法で生成される。

出力チャネルはプロセッサによって結合器に与えられ、ここで各チャネルに関して結果として得られる前期及び後期部分が結合されて単一の出力信号になり出力に供給される。
プロセッサによって用いられる伝達関数又は伝達関数のパラメータは、パラメータ入力からのモデル即ち伝達関数に関する情報を受け取るように配置されたモデル入力ブロックを介して供給される。

図７は、コンバータを備えたオーディオ装置を示す。
オーディオ装置８０は、コンバータ６０、即ち図６のコンバータ６０を備える。オーディオ装置は、Ｎ個の入力チャネルを、例えば、光ディスク８１又は伝送チャネル（図示せず）から受け取る。Ｎ個の入力チャネルはコンバータ６０に供給されてＭ個のチャネルに変換される。このためにコンバータは用いる伝達関数に関する情報を必要とする。この情報はコンバータ６０の内部若しくはオーディオ装置８０の内部に埋込むことができ、又は外部ソースから受け取ることができる。図８には、情報が光ディスクから読み出される状況を示す。その場合には、光ディスクは入力チャネル及び室モデル情報の両方を含む。

図８は、前期部分と後期部分を含む計測されたインパルス応答を示す。図示した実施形態においては前期部分と後期部分が連続しているが、代替的実施形態においては、それらは重なっても良く又は分離してもよい。
残響の前期部分と後期部分の処理を分割して別々に取り扱うことができる。

図２の残響の強度包絡線２０を再び図８に示すが、ここでは前期部分２１、２２、２３、２４、２５と後期部分９１の間の分割点を示す垂直点線がある。分割点は時間に固定されたものではなく、音のタイプ（例えば、声、古典、ジャズ、ポップなど）又はモデル化された音響環境のタイプに基づいて決定される。図８の場合には、分割点は、比較的大きな振幅を有する明らかな主要反響から生じるピークを有する前期部分と、主要なピークがなく比較的一様な減衰包絡線形状を有する後期部分９１との間に存在するように選ばれている。本説明から明らかなように、本発明は、それらのピークを有する前期部分２１、２２、２３、２４、２５について有利に用いることができる。後期部分９１は、従来技術による既知の方法及び手段を用いて処理することができ、又はその全てを無視することができる。

図９は模擬前期部分を示す。
インパルス応答の模擬前期部分１００は、図５と等しく、本発明のモデリング方法を用いて選択された主要なピーク３１、３２、３３、３４、３５のみを含むが、後期部分は本発明の方法を適用する前に除去されている。
これは、模擬残響の後期部分１０１をゼロに設定することになる。

図１０は模擬後期部分を示す。インパルス応答のモデル化された後期部分１１０には、処理の前に前期部分が除去されるので前期部分の主要なピーク３１、３２、３３、３４、３５はないが、後期部分１１１を含む。

図１１は、モデルの簡略伝達関数に用いるピークの選択が、室内で再生したときの櫛型フィルタ効果を避けるために違うように選ばれた２つのチャネル１２０、１２１を示す。説明を簡単にするために、２つの同一のインパルス応答１２０、１２１を示すが、実際にはインパルス応答は各チャネルに対して僅かに異なることになる。
第１のモデル化されたインパルス応答１２０において第２のピーク３２が削除されており、一方第２のモデル化されたインパルス応答１２１においては第４のピーク３４が削除されている。

Claims

音響環境（１）のモデルを簡略化する方法であって、該モデルは一組の伝達関数を含み、各々の伝達関数は該音響環境（１）内の音発生位置（２）から音受信位置（３）までの音伝搬（４、５）に対応し、各々の伝達関数に関して、
前記音発生位置で発生する第１の励振の前記音受信位置で受信される模擬残響を、前記伝達関数を前記第１の励振に作用させることによって計算し、
前記模擬残響の強度包絡線（３０）内の一組の極大（３１、３２、３３、３４、３５）のサブセット（３１、３２、３５）を選択し、
前記第１の励振に作用して前記選択された極大（３１、３２、３３、３４、３５）のサブセット（３１、３２、３５）に適合する強度包絡線を有する模擬残響をもたらす簡略伝達関数を計算する、
ステップを含むことを特徴とする方法。
前記選択される極大（３１、３２、３３、３４、３５）のサブセット（３１、３２、３５）の数は所定の最大値を越えないことを特徴とする、請求項１に記載の方法。
前記選択される極大（３１、３２、３３、３４、３５）のサブセット（３１、３２、３５）は、時間強度減衰関数を越える極大の中から選択されることを特徴とする、請求項１又は請求項２のいずれか１項に記載の方法。
前記減衰関数は指数型減衰関数であることを特徴とする、請求項３に記載の方法。
前記簡略伝達関数は、前記第１の励振との畳み込みによって作用させることを特徴とする、前記請求項のいずれか１項に記載の方法。
前記簡略伝達関数は、各々の選択された極大（３１、３２、３５）に関する信号遅延及び信号減衰の組合せとして表され、時間領域操作で前記第１の励振に作用させることを特徴とする、請求項１から請求項４までのいずれか１項に記載の方法。
Ｎ個の入力チャネルを含む第１のオーディオ・ストリームを、Ｍ個の出力チャネルを含む第２のオーディオ・ストリームに変換する方法であって、各々の入力及び出力チャネルに関して、
請求項１から請求項６までのいずれか１項に記載の方法を用いて簡略化されたＭチャネル音響環境（１）のモデルにおいて、前記入力チャネル及び出力チャネルに関連する簡略伝達関数を選択し、
前記入力チャネルからの入力信号を、前記選択された簡略伝達関数を作用させることにより処理して前記出力チャネルの出力信号の少なくとも一部分を生成する、
ステップを含むことを特徴とする方法。
Ｍ＞Ｎであることを特徴とする、請求項７に記載の方法。
前記簡略伝達関数が適合する選択された極大（３１、３２、３３、３４、３５）のサブセット（３１、３２、３５）は、前記Ｍ個の出力チャネルのうちの少なくとも２個に関して異なり、好ましくはＭ個の全ての出力チャネルに関して異なることを特徴とする、請求項７又は請求項８のいずれか１項に記載の方法。
前記出力信号は前期部分（３１、３２、３３、３４、３５）と後期部分（９１）を含むことを特徴とする、請求項４から請求項８までのいずれか１項に記載の方法。
前記前期部分（９１）のみが前記簡略伝達関数を用いて生成されることを特徴とする、請求項１０に記載の方法。
前記後期部分（９１）は前記入力信号のアルゴリズムによる残響によって生成されることを特徴とする、請求項１１に記載の方法。
Ｎ個の入力チャネル（５４）を含む第１のオーディオ信号を、請求項７から請求項１２までのいずれか１項に記載の方法を用いて計算されたＭ個のチャネル（５５）を含む第２のオーディオ信号に変換するためのコンバータ（５０）であって、
Ｎ個の入力（５４）及びＭ個の出力（５５）と、
簡略伝達関数の前記セットを、入力チャネル（５４）で受け取られたオーディオ信号に作用させて、計算された出力チャネル（５５）の残響成分を得るためのプロセッサ（５１）と、
を備え、
前記プロセッサ（５１）によって用いるための、簡略伝達関数の前記セットに関連する少なくとも係数を有するデータ記憶媒体（５２）をさらに備える、
ことを特徴とするコンバータ。
前記データ記憶媒体（５２）は、前記プロセッサ（５１）に接続された非常駐コンピュタ・メモリであることを特徴とする、請求項１３に記載のコンバータ。
請求項１から請求項６までのいずれか１項に記載の方法によって得られた、音響基準室（１）の簡略化モデルを含むことを特徴とする信号。
請求項１５に記載の信号を含むことを特徴とするデータ記憶媒体（８１）。