JP5524237B2 - 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置 - Google Patents

空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置 Download PDF

Info

Publication number
JP5524237B2
JP5524237B2 JP2011541416A JP2011541416A JP5524237B2 JP 5524237 B2 JP5524237 B2 JP 5524237B2 JP 2011541416 A JP2011541416 A JP 2011541416A JP 2011541416 A JP2011541416 A JP 2011541416A JP 5524237 B2 JP5524237 B2 JP 5524237B2
Authority
JP
Japan
Prior art keywords
channel
reverberation
signal
parameter
downmix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011541416A
Other languages
English (en)
Other versions
JP2012513138A (ja
Inventor
エングデガルド,ヨナス
Original Assignee
ドルビー インターナショナル アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41796192&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5524237(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ドルビー インターナショナル アーベー filed Critical ドルビー インターナショナル アーベー
Publication of JP2012513138A publication Critical patent/JP2012513138A/ja
Application granted granted Critical
Publication of JP5524237B2 publication Critical patent/JP5524237B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space

Description

本発明は、多数の個別オーディオチャンネルを示すマルチチャンネル・ダウンミックス・オーディオ信号に反響を適用する方法とシステムに関する。ある実施形態では、これは、反響を適用する個別チャンネルの各々に異なる反響インパルス応答を適用するために、入力信号をアップミックスして、(入力信号の少なくとも1つの空間的キューを示す)少なくとも1つの空間キューパラメータに応じて個別チャンネルの少なくとも一部に反響を適用することにより行う。任意的に、反響を適用してから、個別チャンネルをダウンミックスして、反響適用済みNチャンネル出力信号を生成する。ある実施形態では、入力信号はQMF(直交ミラーフィルタ)領域MPEGサラウンド(MPS)符号化信号であり、チャンネルレベル差(CLD)、チャンネル予測係数(CPC)、及びチャンネル間相互相関(ICC)パラメータの少なくとも1つを含むMPS空間キューパラメータに応じて、アップミックスと反響適用はQMF領域で行われる。
特許請求の範囲も含む本開示では、「反響器」(または「反響器システム」)とは、オーディオ信号(例えば、マルチチャンネルオーディオ信号のすべてまたは一部のチャンネル)に反響を適用するように構成されたシステムをいう。
特許請求の範囲を含む本開示では、「システム」とは、広い意味で、デバイス、システム、またはサブシステムを意味する。例えば、反響器を実施するサブシステムを反響器システム(または反響器)という場合があり、かかる反響器サブシステム(例えば、Q+R入力に応じてX+Y出力信号を生成するデコーダシステムであって、反響器サブシステムが入力のQに応じて出力のXを生成し、その他の出力はそのデコーダシステムの他のサブシステムで生成されるもの)を含むシステムを反響器システム(または反響器)という場合がある。
特許請求の範囲を含む本開示では、スピーカによる信号の「再生」とは、その信号に応じてそのスピーカにサウンドを生成させることをいい、信号の増幅その他の処理の実行も含む。
特許請求の範囲を含む本開示では、値v、v、...、v(例えば、時刻tに発生するX個の個別オーディオチャンネル信号の一部のn個の要素。ここで、nはX以下である)の「線形結合」とは、値a+a+...+aをいう。ここで、a、a、...、aは係数である。一般的に、係数の値にはとくに制約はない(例えば、各係数は正でも負でもゼロでもよい)。ここで、式は広い意味で用い、例えば、係数の1つが1であり、その他が0である場合を含む(例えば、線形結合a+a+...+aがv(またはv、...、またはv))。
特許請求の範囲を含む本開示では、マルチチャンネルオーディオ信号の「空間キューパラメータ」は、オーディオ信号の少なくとも1つの空間的キューを示す任意のパラメータをいう。ここで、「空間的キュー」は、マルチチャンネル信号の空間的イメージを示す(例えば、既述する)。空間的キューの例としては、オーディオ信号のチャンネルのペア間のレベル(すなわち強度)差(または比率)、かかるチャンネルペア間の位相差、かかるチャンネルペア間の相関の尺度がある。空間キューパラメータの例としては、チャンネルレベル差(CLD)パラメータとチャンネル予測係数(CPC)パラメータがあり、これらは従来のMPEGサラウンド(「MPS」)ビットストリームの一部であり、MPEGサラウンドコーディングで利用されている。
周知のMPEGサラウンド(「MPS」)標準によると、複数チャンネルのオーディオデータは、少数のチャンネル(例えば、Mチャンネル。ここでMは一般的には2である)にダウンミックスすることにより符号化できる。また、かかるダウンミックスしたMチャンネルオーディオ信号は、解凍し、処理(アップミックス)することにより復号して、N個の復号オーディオチャンネル(例えば、M=2かつN=5)を生成できる。
一般的な従来のMPSデコーダは、時間領域、2チャンネルの、ダウンミックスされたオーディオ入力信号に応じて、アップミックスを実行して、N個の復号したオーディオチャンネルを生成する(MPS空間キューパラメータは、チャンネルレベル差とチャンネル予測計数パラメータを含む)。典型的な従来のMPSデコーダは、バイノーラルモードでは、時間領域、2チャンネルのダウンミックスしたオーディオ入力信号と空間キューパラメータに応じてバイノーラル信号を発生し、少なくとも他の一モードでは、アップミックスを行い、時間領域、2チャンネルのダウンミックスしたオーディオ入力信号と空間キューパラメータに応じて5.0、5.1、7.0、または7.1チャンネル(ここで、「x.y」チャンネルとは、x個の全周波数チャンネルとy個のサブウーファチャンネルを示す)の復号したオーディオチャンネルを発生する。入力信号は、時間領域から周波数領域への変換をされ、QMF(直交ミラーフィルタ)領域になり、QMF領域周波数成分の2つのチャンネルを生成する。これらの周波数成分は、QMF領域で復号され、得られた周波数成分は一般的には時間領域に変換して戻され、デコーダのオーディオ出力を生成する。
図1は、2チャンネルのダウンミックスされたオーディオ信号(L′とR′)及び(チャンネルレベル差パラメータとチャンネル予測計数パラメータを含む)MPS空間キューパラメータに応じて、N個(Nは2より大きく、一般的には5または7である)の復号されたオーディオチャンネルを生成するように構成された従来のMPSデコーダの要素を示す簡略化したブロック図である。ダウンミックスされた入力信号(L′とR′)は「X」個の個別オーディオチャンネルを示す。ここで、Xは2より大きい。ダウンミックスされた入力信号は、一般的には5つの個別チャンネル(例えば、左前、右前、中央、左サラウンド、及び右サラウンドチャンネル)を表す。
「左」入力信号L′と「右」入力信号R′は、時間領域からQMF領域への変換ステージ(図1には図示せず)において2チャンネルの時間領域MPS符号化信号(図1には図示せず)を変換することにより生成したQMF領域周波数成分のシーケンスである。
ダウンミックスされた入力信号L′とR′は、(入力信号で)図1のシステムにアサートされたMPS空間キューパラメータに応じて、図1のデコーダのN個の個別チャンネル信号S1、S2、...、SNに復号される。N個の出力QMF領域周波数成分のシーケンスS1、S2、...SNは、一般的には、QMF領域から時間領域への変換ステージ(図1は図示せず)により、時間領域に変換して戻され、後処理することなく、システムからの出力としてアサートできる。任意的に、信号S1、S2、...、SNは、ポストプロセッサ5で(QMF領域において)後処理され、チャンネルOUT1、OUT2、...OUTNを有するNチャンネルオーディオ出力信号を生成する。N個の出力QMF領域周波数成分のシーケンスOUT1、OUT2、...、OUTNは、QMF領域から時間領域への変換ステージ(図1には図示せず)により時間領域に変換して戻され、システムからの出力としてアサートされる。
バイノーラルモードで動作している図1の従来のMPSデコーダは、2チャンネルのダウンミックスされたオーディオ信号(L′とR′)及び(チャンネルレベル差パラメータとチャンネル予測計数パラメータを含む)MPS空間キューパラメータに応じて、2チャンネルバイノーラルオーディオ出力S1とS2を生成し、任意的に2チャンネルバイノーラルオーディオ出力OUT1とOUT2を生成する。ヘッドホンのペアで再生するとき、2チャンネルオーディオ出力S1とS2は、リスナの前後の位置を含む(デコーダ1の係数により決まる)いろいろな位置にあるX個(ここでX>2であり、一般的には5または7である)のスピーカからのサウンドとして、リスナーの鼓膜には聞こえる。バイノーラルモードでは、ポストプロセッサ5は、デコーダ1の2チャンネル出力(S1,S2)に反響を適用できる(この場合、ポストプロセッサ5は人工反響器となる)。図1のシステムは、ポストプロセッサ5の2チャンネル出力が、反響を適用したバイノーラルオーディオ出力となり、ヘッドホンで再生すると、リスナの前後の位置を含むいろいろな位置にあるX個(ここでX>2であり、Xは一般的には5である)のスピーカからのサウンドとしてリスナの鼓膜には聞こえるように、(以下に説明するように)実施できる。
図1のデコーダのバイノーラルモード動作中に生成された信号S1とS2(またはOUT1とOUT2)の再生は、少なくとも一部の音源は仮想的である2つより多く(例えば5つの)「サラウンド」音源から来るサウンド体験をユーザに与える。より一般的に、仮想サラウンドシステムが頭部伝達関数(HRTF)を用いてオーディオ信号(仮想サラウンドサウンド信号と呼ぶこともある)を生成することは従来からあった。これは、物理的なスピーカのペア(例えば、リスナの前に配置されたスピーカやヘッドホン)で再生されると、リスナの鼓膜には、(一般的にはリスナの後の位置を含む)いろいろな位置にある2つより多くの音源(例えばスピーカ)からのサウンドとして聞こえる。
上記の通り、バイノーラルモードで動作している図1のMPSデコーダは、ポストプロセッサ5により実施される人工的な反響器を用いて反響を適用するように構成できる。この反響器は、デコーダ1の2チャンネル出力(S1,S2)に応じて反響を生成し、信号S1とS2にこの反響を適用して、反響させた2チャンネルオーディオOUT1とOUT2を生成するように構成される。デコーダ1のバイノーラルオーディオ出力の2つのダウンミックスされたオーディオチャンネルの一方により決定されるすべての離散的チャンネルに(例えば、ダウンミックスされたチャンネルS1により決まる左前チャンネルと左サラウンドチャンネルに)、同じ反響インパルス応答を適用するように、また、バイノーラルオーディオの2つのダウンミックスされたオーディオチャンネルの他方により決定されるすべての離散的チャンネルに(例えば、ダウンミックスされたチャンネルS2により決まる右前チャンネルと右サラウンドチャンネルに)、同じ反響インパルス応答を適用するように、デコーダ1から2チャンネル信号S1、S2に後処理ステレオ対ステレオ反響として反響を適用する。
1タイプの従来の反響器は、いわゆるフィードバック遅延ネットワークベース(FDNベースの)構造を有している。動作中、かかる反響器は遅延した信号を信号にフィードバックすることにより、信号に反響を適用する。他の反響構成に対するこの構成利点は、複数の相関していない反響信号を効率的に生成して、複数の入力信号に適用することができることである。この特徴は、市販されているドルビーモバイルヘッドホンバーチャライザで利用されている。これは、FDNベースの構成を有し、(左前、右前、中央、左サラウンド、及び右サラウンドチャンネルを有する)5チャンネルオーディオ信号の各チャンネルに反響を適用し、5つの頭部伝達関数(HRTF)フィルタペアのセット中の異なるフィルタペアを用いて、各反響させたチャンネルをフィルタする反響器を含む。このバーチャライザは各オーディオチャンネルに対して一意的な反響インパルス応答を生成する。
ドルビーモバイルヘッドホンバーチャライザは、2チャンネルオーディオ入力信号に応じても動作して、2チャンネルの「反響させた」オーディオ出力(反響を適用した2チャンネル仮想サラウンドサウンド出力)を生成する。反響させたオーディオ出力をヘッドホンのペアで再生するとき、左前、右前、中央左後(サラウンド)、及び右後(サラウンド)の位置にある5つのスピーカからの、HRTFフィルタを通した反響させたサウンドとして、リスナの鼓膜に聞こえる。バーチャライザは、ダウンミックスした2チャンネルオーディオ入力を(オーディオ入力で受け取った空間キューパラメータを用いずに)アップミックスして、5つのアップミックスしたオーディオチャンネルを生成し、アップミックスしたチャンネルに反響を適用して、この5つの反響させたチャンネル信号をダウンミックスして、2チャンネルの反響させた出力を生成する。アップミックスした各チャンネルの反響は、異なるHRTFフィルタのペアでフィルタされる。
2008年3月20日公開された特許文献1は、ダウンミックスした信号の復号時に、ダウンミックスしたオーディオ入力信号に一形式の反響を適用して、個別チャンネル信号を生成する、他の従来のシステムを記載している。この文献は、時間領域でダウンミックスしたオーディオ入力をQMF領域に変換し、QMF領域において、このダウンミックスした信号M(t,f)に一形式の反響を適用し、反響の位相を調整して、ダウンミックスした信号から決まる各アップミックスチャンネルの反響パラメータを生成するデコーダを記載している。(例えば、ダウンミックスした信号M(t,f)から決まる、アップミックス左チャンネルの反響パラメータL反響(t,f)とアップミックス右チャンネルの反響パラメータR反響(t,f)を生成する。)ダウンミックスされた信号を空間キューパラメータ(ダウンミックスされた信号の左成分と右成分の間の相関を示すICCパラメータと、チャンネル間位相差パラメータIPDL及びIPDR)とともに受け取る。空間キューパラメータを用いて、反響パラメータ(例えば、L反響(t,f)とR反響(t,f))を生成する。ダウンミックスされた信号の左右チャンネル成分の間の相関が大きいことをICCキューが示す時、ダウンミックスされた信号M(t,f)から強度が低い反響を生成する。ダウンミックスされた信号の左右チャンネル成分の間の相関が小さいことをICCキューが示す時、ダウンミックスされた信号から強度が高い反響を生成する。(ブロック206または208において、)各反響パラメータの位相は、関連するIPDキューが示す位相に応じて調整する。しかし、パラメトリックステレオデコーダ(モノラルからステレオの合成)では反響は無相関化情報(decorrelator)としてのみ用いられる。(M(t,f)と直交する)無相関化された信号を用いて左右の相互相関を再構成する。引用文献は、アップミックスの離散チャンネルの各々、またはかかる線形結合の各々から、ダウンミックスされたオーディオM(t,f)から決定したアップミックスの各離散チャンネルへの適用、またはダウンミックスされたオーディオから決定した個別アップミックスチャンネルの値の線形結合のセットの各々への適用の場合に、異なる反響信号を個別に決定(または生成)することを示唆していない。
アップミックスの離散チャンネルの各々から、ダウンミックスされたオーディオから決定したアップミックスの離散チャンネルの各々に対して異なる反響信号を個別に決定すること、または、かかる離散チャンネルの値の線形結合のセットの各々に対して異なる反響信号を決定し生成することが望ましいことを、発明者は認識した。個別アップミックスチャンネル(またはかかるチャンネルの値の線形結合)に対して反響信号を個別に決定すれば、異なる反響インパルス応答を有する反響をアップミックスチャンネル(または線形結合)に適用できることに、発明者は認識した。
本発明まで、ダウンミックスされたオーディオ(例えば、ダウンミックスされたオーディオがMPS符号化オーディオのとき、QMF領域において)またはその値の線形結合から離散的アップミックスチャンネルを生成するため、及び前記アップミックスチャンネル(または線形結合)に個別に適用する、アップミックスチャンネル(または線形結合)からの反響を生成するためにも、ダウンミックスされたオーディオとともに受け取った空間キューパラメータは使われていなかった。また、このように生成された、反響されたアップミックスチャンネルは、入力されダウンミックスされたオーディオから反響されたダウンミックスされたオーディオを生成するために再合成されていない。
米国特許出願公開第2008/0071549A1
ある種の実施形態では、本発明は、X個の個別オーディオチャンネルを示すMチャンネルのダウンミックスされたオーディオ入力信号に反響を適用する方法(ここで、XはMより大きい数)である。これらの実施形態では、本方法は、次のステップを含む:(a)ダウンミックスした入力信号の空間的イメージを示す(例えば、記述する)空間キューパラメータに応じて、(例えば、直交ミラーフィルタすなわち「QMF」領域で)Y個の離散反響チャンネル信号を生成する段階であって、時刻tにおける各反響チャンネル信号は、その時刻tにおけるX個の個別オーディオチャンネルの値の少なくともサブセットの線形結合である段階と、(b)(例えば、QMF領域における)前記反響チャンネル信号のうち少なくとも2つに個別に反響を適用して、Y個の反響されたチャンネル信号を生成する段階。好ましくは、前記反響チャンネル信号の少なくとも1つに適用する反響の反響インパルス応答は、前記反響チャンネル信号の他のものに適用する反響のものとは異なる。ある実施形態では、X=Yであるが、他の実施形態ではXはYと等しくない。ある実施形態では、YはMより大きく、入力信号は、空間キューパラメータに応じてステップ(a)でアップミックスされ、Y個の反響チャンネル信号が生成される。他の実施形態では、YはMと等しいか、またはMより小さい。
例えば、M=2、X=5、及びY=4の場合、入力信号は、5つの個別チャンネル信号Lfront、Rfront、C、Lsur、Rsurを示す値L(t)とR(t)のシーケンスである。5つの個別チャンネル信号の各々は、値
[外1]
Figure 0005524237
のシーケンスである。ここで、Wは
[外2]
Figure 0005524237
の形式のMPEGサラウンドアップミックスマトリックスであり、4つの反響チャンネルは
[外3]
Figure 0005524237
である。これは
[外4]
Figure 0005524237
として表せる。
入力信号がMチャンネル、MPEGサラウンド(「MPS」)ダウンミックス信号である実施形態では、段階(a)と(b)はQMF領域で実行され、空間キューパラメータは入力信号とともに受け取られる。例えば、空間キューパラメータは、従来のMPSビットストリームをなすタイプのチャンネルレベル差(CLD)パラメータ及び/またはチャンネル予測係数(CPC)パラメータである、またはこれを含む。入力信号が時間領域、MPSダウンミックス信号であるとき、本発明は、一般的に、この時間領域信号をQMF領域に変換して、QMF領域周波数成分を生成する段階と、これらの周波数成分にQMF領域で段階(a)と(b)を実行する段階を含む。
任意的に、本方法は、例えば、反響チャンネル信号をNチャンネル、ダウンミックスMPS信号として符号化することにより、(反響を適用した各チャンネル信号と反響を適用していない各チャンネル信号を含む)Y個の反響チャンネル信号をNチャンネルダウンミックスしたものを生成する段階も含む。
本発明の方法の典型的な実施形態では、入力ダウンミックス信号は、5つの個別オーディオチャンネル(左前、右前、中央、左サラウンド、及び右サラウンドチャンネル)を示す2チャンネルダウンミックスMPEGサラウンド(「MPS」)信号であり、異なる反響インパルス応答により決まる反響をこれらの5つのチャンネルの少なくともいくつかに適用して、サラウンド音質をよくする。
好ましくは、本発明の方法は、HRTFフィルタで反響されたチャンネル信号をフィルタリングすることにより、対応する頭部伝達関数(HRTF)を、反響されたチャンネル信号に適用する段階も含む。HRTFを適用して、リスナーが、本発明により適用される反響をより自然な音声として聞こえるようにする。
本発明の他の態様は、本発明の方法の実施形態を実行するように構成(プログラム)された反響器と、かかる反響器を含むバーチャライザと、かかる反響器を含むデコーダ(例えば、MPSデコーダ)と、本発明の実施形態を実施するコードを記憶するコンピュータ読み取り可能媒体(例えば、ディスク)とを含む。
従来のMPEGサラウンドデコーダシステムを示すブロック図である。 本発明の一実施形態により実施可能な、複数入力、複数出力、FDNベースの反響器(100)を示すブロック図である。 図2の反響器100と、従来のMPSプロセッサ102と、反響器100とプロセッサ102で処理するため、マルチチャンネル入力をQMF領域に変換する時間領域からQMF領域への変換フィルタ99と、反響器100とプロセッサ102の合成出力を時間領域に変換するQMF領域から時間領域への変換フィルタ101とを含む反響器システムを示すブロック図である。
本発明の多くの実施形態は技術的に実現可能である。本技術分野の当業者には、これらの実施形態をいかに実施するかは本開示から明らかである。本発明のシステム、方法、媒体の実施形態を図2及び3を参照して説明する。
ある種の実施形態では、本発明は、X個の個別オーディオチャンネルを示すMチャンネルのダウンミックスされたオーディオ入力信号に反響を適用する方法(ここで、XはMより大きい数)と、この方法を実行するように構成されたシステムである。これらの実施形態では、本方法は、次のステップを含む:
(a)ダウンミックスした入力信号の空間的イメージを示す(例えば、記述する)空間キューパラメータに応じて、(例えば、直交ミラーフィルタすなわち「QMF」領域で)Y個の離散反響チャンネル信号を生成する段階であって、時刻tにおける各反響チャンネル信号は、その時刻tにおけるX個の個別オーディオチャンネルの値の少なくともサブセットの線形結合である段階と、
(b)(例えば、QMF領域における)前記反響チャンネル信号のうち少なくとも2つに個別に反響を適用して、Y個の反響されたチャンネル信号を生成する段階。好ましくは、前記反響チャンネル信号の少なくとも1つに適用する反響の反響インパルス応答は、前記反響チャンネル信号の他のものに適用する反響のものとは異なる。ある実施形態では、X=Yであるが、他の実施形態ではXはYと等しくない。ある実施形態では、YはMより大きく、入力信号は、空間キューパラメータに応じてステップ(a)でアップミックスされ、Y個の反響チャンネル信号が生成される。他の実施形態では、YはMと等しいか、またはMより小さい。
図2は、以下に説明するように実施され本方法を実行できる複数入力、複数出力、FDNベースの反響器100を示すブロック図である。図2の反響器100は次のものを含む:
プレミックスマトリックス30(マトリックスB)。これは、5つの(X=5)の個別アップミックスオーディオチャンネルを示す、チャンネルIN1、IN2、...、INM、よりなるMチャンネルのダウンミックスされたオーディオ入力信号を受け取り、これに応じて、4つの離散的反響チャンネル信号U1、U2、U3、及びU4(それぞれ入力ブランチ1′、2′、3′、4′に対応する)を生成するように結合かつ構成された4×Mマトリックスである。時刻tにおける各反響チャンネル信号は、時刻tにおけるX個の個別アップミックスオーディオチャンネルの値のサブセットの線形結合である。Mが4より小さい場合、マトリックスBは入力信号をアップミックスして、反響チャンネル信号を生成する。典型的な実施形態では、Mは2である。マトリックス30も、Mチャンネルのダウンミックスされた入力信号の空間的イメージを示す(例えば、記述する)空間キューパラメータを受信するように結合している。マトリックス30は、空間キューパラメータに応じて、4つ(Y=4)の離散的アップミックスチャンネル信号、すなわち離散的反響チャンネル信号U1、U2、U3、及びU4を生成するように構成されている。
加算要素40、41、42、及び43。これは、反響チャンネル信号U1、U2、U3、U4がアサートされるマトリックス30の出力に結合している。よそ40は、ゲイン要素g1の出力を反響チャンネル信号U1に加算(すなわち、ゲイン要素g1の出力からのフィードバックを適用)するように構成されている。要素41は、ゲイン要素g2の出力を反響チャンネル信号U2に加算するように構成されている。要素42は、ゲイン要素g3の出力を反響チャンネル信号U3に加算するように構成されている。要素43は、ゲイン要素g4の出力を反響チャンネル信号U4に加算するように構成されている。
スキャタリングマトリックス32(マトリックスA)。これは、加算要素40、41、42、43の出力を受け取るように結合している。マトリックス32は、好ましくは、各加算要素40、41、42、43の出力をフィルタしたものを、対応するディレイラインz−Mkにアサートするように構成された4×4ユニタリマトリックスである。ここで、0≦k−1≦3。また、好ましくは、最大限の拡散性を提供するため、全要素に値を有する(fully populated)マトリックスである。ディレイラインz−M1、z−M2、z−M3、z−M4は、図2においてディレイライン50、51、52、53としてそれぞれラベル付けした。
ゲイン要素gk。ここで、0≦k−1≦3である。これはディレイラインz−Mkの出力にゲインを適用し、各アップミックスチャンネルにおいて適用される反響の減衰時間を制御するダンピングファクタを提供する。各ゲイン要素gkは一般的にはローパスフィルタと結合している。ある実施形態では、ゲイン要素は、異なるQMF帯域に対して、所定の異なるゲインファクタを適用する。反響されたチャンネル信号R1、R2、R3、R4は、ゲイン要素g1、g2、g3、g4の出力でアサートされる。
ポストミックス行列34(マトリックスC)。これは、ゲイン要素gkの出力でアサートされる反響されたチャンネル信号R1、R2、R3、R4に結合され、これを、マトリックス30にアサートされた空間キューパラメータのサブセット(例えば、その全部または一部)に応じて、ダウンミックス及び/またはアップミックス(及び任意的にその他のフィルタリング)をして、チャンネルS1、S2、...、SNよりなるNチャンネル、QMF領域におけるダウンミックスされた反響されたオーディオ出力信号を生成するように構成されたN×4マトリックスである。図2の実施形態の変形例では、マトリックス34は係数が空間キューパラメータに応じて時間的に変化しない定数マトリックスである。
図2の実施形態の変形例では、本発明のシステムはY個の反響チャンネル(ここで、Yは4より小さい、または大きい)を有し、プレミックスマトリックス30は、ダウンミックスされたMチャンネルの入力信号と空間キューパラメータに応じてY個の離散的反響チャンネル信号を生成するように構成され、スキャタリングマトリックス32は、Y×Yマトリックスで置き換えられ、本発明のシステムはY個のディレイラインz−Mkを有する。
例えば、Y=M=2である場合、ダウンミックスされた入力信号は5つのアップミックスチャンネル(X=5):左前、右前、中央前、左サラウンド、及び右サラウンドを示す。本発明によると、ダウンミックスされた入力信号の空間的イメージを示す空間キューパラメータに応じて、プレミックスマトリックス(図2のマトリックス30の変形例)は、(例えば、直交ミラーフィルタすなわち「QMF」領域において)2つの離散的な反響チャンネル信号を生成する。一方はフロントチャンネルのミックスであり、他方はサラウンドチャンネルのミックスである。減衰応答が短い反響が一方の反響チャンネル信号から生成され(かつ適用され)、減衰応答が長い反響が他方の反響チャンネル信号から生成され(かつ適用され)る。(例えば、音響が「ライブエンド/デッドエンド」の部屋をシミュレーションする)。
再び図2を参照して、ポストプロセッサ36は任意的にマトリックス34の出力に結合し、マトリックス34のダウンミックスされ反響された出力S1、S2、...、SNに後処理を実行し、チャンネルOUT1、OUT2、...、OUTNよりなるNチャンネルの後処理されたオーディオ出力信号を生成する。典型的に、N=2であり、図2のシステムは、バイノーラルのダウンミックスされ反響されたオーディオ信号S1、S2、及び/またはバイノーラルの後処理されダウンミックスされ反響されたオーディオ出力信号OUT、OUT2を出力する。
例えば、図2のシステムのある実施形態のマトリックス34の出力は、バイノーラルの仮想的サラウンドサウンド信号である。これは、ヘッドホンで再生すると、左(L)、中央(C)、及び右(R)のフロント音源(例えば、リスナの前に配置された物理的な左、中央、及び右スピーカ)と、左サラウンド(LS)と右サラウンド(RS)のリア音源(例えば、リスナの後に配置された物理的な左及び右スピーカ)とから放射されたサウンドとしてリスナには聞こえる。
図2のシステムのある変形例では、ポストミックス行列34を無くし、本発明の反響器は、Mチャンネルのダウンミックスされたオーディオ入力に応じて、Yチャンネルの反響されたオーディオ(例えば、アップミックスされ反響されたオーディオ)を出力する。他の変形例では、マトリックス34は単位マトリックスである。他の変形例では、本システムは、Y個のアップミックスチャンネル(ここで、Yは4より大きい数)を有し、マトリックス34はN×Yマトリックス(例えば、Y=7)である。
図2のシステムは4つの反響チャンネルと4つのディレイラインz−Mkを有するが、本システムの変形例(及び本発明の反響器の他の実施形態)では、4つより多い、または少ない反響チャンネルを実装してもよい。一般的に、本発明の反響器は反響チャンネルごとに1つのディレイラインを含む。
入力信号がMチャンネルMPEGサラウンド(「MPS」)のダウンミックスされた信号である図2のシステムの実施形態では、マトリックス30の入力にアサートされる入力信号は、QMF領域信号IN1(t,f)、IN2(t,f)及びINM(t,f)よりなり、図2のシステムはそれにQMF領域において(例えば、マトリックス30における)処理と反響適用を行う。かかる実施形態では、マトリックス30にアサートされる空間キューパラメータは、典型的には、従来のMPSビットストリームの一部であるチャンネルレベル差(CLD)パラメータ、及び/またはチャンネル予測係数(CPC)パラメータ、及び/またはチャンネル間相互相関(ICC)パラメータである。
時間領域のMチャンネルMPSのダウンミックスされた信号に応じてかかるQMF領域入力をマトリックス30に供給するため、本発明の方法は、この時間領域信号をQMF領域に変換してQMF領域周波数成分を生成する予備ステップを含み、これらの周波数成分に対してQMF領域において上記のステップ(a)と(b)を実行する。
例えば、図3のシステムへの入力はMチャンネルを有する時間領域MPSダウンミックスされたオーディオ信号I1(t)、I2(t)、...、IM(t)なので、図3のシステムは時間領域信号をQMF領域に変換するフィルタ99を含む。具体的に、図3のシステムは、(図2の反響器100に対応する、または場合によっては同じ)反響器100と、従来のMPSプロセッサ102と、反響器100における処理とプロセッサ102における従来の処理を実行するため、時間領域入力チャンネルI1(t)、I2(t)、...IM(t)をQMF領域(すなわち、QMF領域周波数成分のシーケンス)に変換する時間領域からQMF領域への変換フィルタ99とを有する。 また、図3のシステムは、QMF領域から時間領域への変換フィルタ101を含む。これは、反響器100とプロセッサ102のNチャンネル合成出力に結合し、これを時間領域に変換するように構成されている。
具体的に、フィルタ99は時間領域信号I1(t)、I2(t)、...、及びIM(t)をQMF領域信号IN1(t,f)、IN2(t,f)、...、INM(t,f)にそれぞれ変換し、反響器100とプロセッサ102にアサートする。プロセッサ102からのNチャンネル出力は各々が反響器100の対応する反響チャンネル出力(図2に示したポストプロセッサ36を含むとき、図3の反響器100も図2に示したS1、S2、...、SN、または図2に示したOUT1、OUT2、...、OUTNの1つ)と(加算器で)結合される。図3のフィルタ101は、反響器100とプロセッサ102の結合(反響した)出力(QMF領域周波数成分S1′(t,f)、S2′(t,f)、...、SN′(t,f)のN個のシーケンス)を時間領域信号S1′(t)、S2′(t)、...、SN′(t)に変換する。
本発明の典型的な実施形態では、入力ダウンミックス信号は、5つの個別オーディオチャンネル(左前、右前、中央、左サラウンド、及び右サラウンドチャンネル)を示す2チャンネルダウンミックスMPS信号であり、異なる反響インパルス応答により決まる反響をこれらの5つのチャンネルに適用して、サラウンド音質をよくする。
プレミックスマトリックス30(Y×MマトリックスB、Y=4、M=2の場合、4×2マトリックスである)の係数が一定(空間キューパラメータに応じて決まる時間変化係数でない)であり、ポストミックスマトリックス34(Y=4、N=2の場合、2×4マトリックスである)の係数が一定であるとき、図2のシステムは、個別反響を生成して、それをMチャンネル、ダウンミックス、(例えば、QMF領域、MPS符号化したMチャンネルダウンミックス信号IN1(t,f)、IN2(t,f)、...、INM(t、f)に応じて)MPS符号化した反響器への入力の個別インパルス応答に適用できない。M=2、Y=4、N=2の例を考え、図2のマトリックスBとCをそれぞれ次に一定係数を有する一定のマトリックス4×2と2×4で置き換えるものとする。
Figure 0005524237
この例では、一定マトリックスBとCの係数は、ダウンミックス入力オーディオを示す空間キューパラメータに応じて時間の関数として変化せず、そのように修正した図2のシステムは従来のステレオ対ステレオ反響モードでは動作しない。かかる従来の反響モードでは、反響インパルス応答が同じ反響をダウンミックスの各個別チャンネルに適用する(すなわち、ダウンミックスの左前チャンネルコンテンツは、ダウンミックスの右前チャンネルコンテンツが受けるインパルス応答と同じインパルス応答を受ける)。
しかし、本発明によるMPSビットストリーム(及び/または他の空間キューパラメータに応じて)の一部として入手できるチャンネルレベル差(CLD)パラメータ、チャンネル予測係数(CPC)、及び/またはチャンネル間相互相関(ICC)パラメータに応じてQMF領域に反響プロセスを適用することにより、図2のシステムは、反響を生成して、各反響チャンネルに適用できる。典型的なアプリケーションでは、本発明によっては、中央チャンネルには、他の少なくとも1つの反響チャンネルよりも小さい反響を適用し、各反響チャンネルに適用される反響のインパルス応答が異なるようにする。かかるアプリケーション(及びその他のアプリケーション)では、異なる反響チャンネルに適用される反響のインパルス応答は、マトリックス30にルーティングされる異なるチャンネルに基づかず、反響チャンネルにプレミックスマトリックス30またはポストミックスマトリックス34(及び/または少なくとも1つの他のシステム要素)が適用するスケールファクタが異なるだけである。
例えば、5つのアップミックスチャンネルのQMF領域MPS符号化ステレオダウンミックスに反響を適用するように構成された図2のシステムの実施形態では、マトリックス30は、係数wij(iは1ないし3の範囲にあり、jは1ないし2の範囲にある)の現在値に応じて係数が時間変化する4×2マトリックスである。
この実施形態では、M=2、X=5、およびY=4であり、入力信号はQMF領域値ペアのシーケンスであり、IN1(t、f)=L(t)、IN2(t、f)=R(t)、5つの個別チャンネル信号Lfront、Rfront、C、Lsur、およびRsurの値のシーケンスを表す。5つの個別チャンネル信号の各々は値
[外5]
Figure 0005524237
のシーケンスであり、Wは
[外6]
Figure 0005524237
の形のMPEGサラウンドアップミックスマトリックスである。
この例では、係数wijは、従来のCPCパラメータCPC_1とCPC_2及び従来のICCパラメータICC_TTT(ダウンミックス入力信号の符号化において、2対3アップミックス器(すなわちTTTアップミックス器)のチャンネル間相互相関パラメータ)に応じて更新される:
Figure 0005524237
また、左前/サラウンドチャンネル(CLDrf_ls)と右前/サラウンドチャンネル(CLDrf_rs)の従来のCLDパラメータを用いるので、マトリックス30の時間変化する係数は次の4つの時間変化するチャンネルゲイン値にも依存する。ここで、CLDlf_lsは左前/サラウンドCLDパラメータの電流値であり、CLDrf_rsは右前/サラウンドCLDパラメータの電流値である:
Figure 0005524237
マトリックス30の時間変化する係数は:
Figure 0005524237
このように、実施形態では、マトリックス30からの4つの反響チャンネル信号出力は
[外7]
Figure 0005524237
である。このように、(式3に示した係数を有する)マトリックス30により行われるマトリックス乗算は、次のように表せる:
[外8]
Figure 0005524237
マトリックス乗算は、5つの個別チャンネル信号へのアップミックスと、その5つの信号の4つの反響チャンネル信号へのマトリックスB0によるダウンミックスと等価である。
式3に示した係数を有するマトリックス30の実施形態の変形として、マトリックス30を次の係数としてもよい:
Figure 0005524237
ここで、KLF、KRF、K、KLS、及びKRSは、異なるチャンネルの固定反響ゲイン値であり、glf、gls、grf、grs、w11乃至w32は、それぞれ式2と式1aの通りである。一般的には、4つの固定反響ゲイン値は、実質的に互いに等しく、中央チャンネル(例えば、反響の少ないスピーチや会話の場合に)KCの値が他の係数より少し小さいだけである。
マトリックス30は、式4の係数で実施され、上記のMPEGサラウンドアップミックスマトリックスWと次のダウンミックスマトリックスBの積に等しい:
[外9]
Figure 0005524237
マトリックス30を、式3(または式4)の係数で実施した場合、マトリックス34は一般的には定数マトリックスとなる。あるいは、マトリックス34の係数は時間変化してもよい。例えば、一実施形態では、その係数はC=Bであり、ここでBはマトリックス30の転置である。式3に示した係数を有するマトリックス30と、(その転置である)マトリックス34とは、式1の定数ミックスマトリックスBとCと同じ一般的形式を有するが、可変係数は式2の可変ゲイン値により決まり、式1aの上記の可変係数値wijが定数要素と置き換えられる。
式3の可変係数を有するマトリックス30の実施により、反響チャンネルU1、U2、U3、及びU4は、それぞれ、左前アップミックスチャンネル(図2のシステムの入力分岐1′)、右前アップミックスチャンネル(図2のシステムの入力分岐2′)、左サラウンドアップミックスチャンネル(図2のシステムの入力分岐3′)、及び図2のシステムの入力分岐4′の右サラウンドと中央アップミックスチャンネル(右サラウンドチャンネルと中央チャンネル)を合成したものとなる。それゆえ、図2のシステムの4つの分岐に個別に適用される反響は、個別に決定されたインパルス応答を有する。
あるいは、マトリックス30の係数は、利用可能な空間キューパラメータに応じて他の方法で決定される。例えば、ある実施形態では、マトリックス30の係数は、利用可能なMPS空間キューパラメータに応じて決定され、マトリックス30が予測モード以外のモード(例えば、中央減算がある、またはないエネルギーモード)で動作するTTTアップミックス器を実施するようにする。これは、MPEG標準(ISO/IEC23003−1:2007)に記載された関連ケースに関する周知のアップミックスの式を用いて、本開示を読んだ本技術分野の当業者には明らかな方法で行える。
4つのアップミックスチャンネルのQMF領域、MPS符号化した単一チャンネル(モノラル)ダウンミックスに反響を適用するように構成された図2のシステムでは、マトリックス30は時間変化する係数を有する4×1マトリックスである:
[外10]
Figure 0005524237
ここで、係数は、従来のMPSビットストリームの一部として利用できるCLDパラメータCLDlf_ls、CLDrf_rs、CLDc_lr、CLDl_rから求める。
図2のシステムの変形や本発明の反響器のその他の実施形態では、ダウンミックスされた入力信号から離散反響チャンネル(例えば、アップミックスチャンネル)を求め、多くの異なる方法のいずれかにより個別の反響遅延分岐に送られる。本発明の反響器の様々な実施形態では、他の空間キューパラメータを用いて、(制御チャンネル重み付けを含む)ダウンミックスされた入力信号をアップミックスする。例えば、ある実施形態では、前方−後方拡散性を記述する(従来のMPSビットストリームの一部として入手できる)ICCパラメータを用いて、プレミックスマトリックスの係数を決定し、それにより反響レベルを制御する。
好ましくは、本発明の方法は、HRTFフィルタで反響されたチャンネル信号をフィルタリングすることにより、対応する頭部伝達関数(HRTF)を、反響されたチャンネル信号に適用する段階も含む。例えば、図2のシステムのマトリックス34は、好ましくは、かかるHRTFを適用して、反響されたチャンネルR1、R2、R3、及びR4に、上記のダウンミックス操作を実行するHRTFフィルタとして実施される。かかるマトリックス34の実装により、5×4マトリックスとそれに続く2×5マトリックスと同じフィルタリングを実行することと同じである。ここで、5×4マトリックスは、ゲイン要素g1、g2、g3、g4からの4つの反響されたチャンネル信号R1−R4出力に応じて、5つの仮想的な反響ちゃん得る信号(左前、右前、中央、左サラウンド、及び右サラウンドの各チャンネル)を発生し、2×5マトリックスは適当なHRTFを仮想反響チャンネル信号の各々に適用し、その結果得られる5つのチャンネル信号をダウンミックスして、2チャンネルのダウンミックスした反響出力信号を発生する。しかし、一般的に、マトリックス34は、5×4マトリックスと2×5マトリックスの上記の機能を実行する単一の2×4マトリックスとして実施される。HRTFを適用して、リスナーが、本発明により適用される反響をより自然な音声として聞こえるようにする。HTRFフィルタは、一般的に、各個別QMF帯域に対して、複素数値を係数に有するマトリックスを乗算する。
ある実施形態では、QMF領域においてMPS符号化されたダウンミックス入力信号から生成した反響チャンネル信号は、対応するHRTFで次のようにフィルタされる。これらの実施形態では、パラメトリックQMF領域におけるHRTFは、基本的に、ダウンミックスした入力信号を特徴付ける、左右のゲインパラメータ値と、チャンネル間位相差(IPD)パラメータ値よりなる。IPDは、任意的に、複雑さを低減するため無視する。IPDを無視すると仮定すると、HRTFは定数ゲイン値(左右のチャンネルに対する4つのゲイン値)である。
[外11]
Figure 0005524237
次の係数を有するポストミックス行列34の実装により、図2の反響チャンネル信号R1、R2、R3、及びR4にHRTFを適用できる。
[外12]
Figure 0005524237
本発明の反響器の好ましい実施形態(例えば、図2のシステムの変形として実施できるもの)では、少なくとも1つの反響チャンネルに部分遅延を適用し、及び/または少なくとも1つの反響チャンネルのオーディオデータの周波数成分の周波数帯域ごとに異なる反響を生成して適用する。
本発明の反響器の好ましい実施形態のいくつかは、(少なくとも1つの反響チャンネルで)小さい遅延及び整数サンプル遅延を適用するように較正された、図2のシステムの変形例である。例えば、かかる一実施形態では、遅延線と直列の各反響チャンネルに、サンプル期間の整数と等しい整数遅延を適用する部分遅延要素を接続する(例えば、図2の遅延ライン50、51、52、及び53の1つの後に、または直列に、各部分遅延要素を配置する)。部分遅延は、サンプル期間の部分(fraction)に対応する各QMF帯域において、位相シフト(単位複素数の乗算)により近似できる:f=τ/T。ここで、fは遅延部分であり、TはQMF帯域の望ましい遅延であり、TはQMF帯域のサンプル期間である。QMF領域で反響を適用する場合に、部分遅延をいかに適用するかは周知である(例えば、ドイツ、ベルリンにおいて2004年5月8−11日に開かれた116th Convention of the Audio Engineering SocietyにおいてJ. Engdegardたちにより発表された12頁の「Synthetic Ambience in Parametric Stereo Coding」、及び2009年2月3日にJ. Engdegardたちに発行された米国特許第7,487,097号を参照)。
本発明の反響器の上記の好ましい実施形態のいくつかは、反響器の実施形態の複雑さを低減するために、少なくとも1つの反響チャンネルでオーディオデータの周波数帯域ごとに反響を適用するように構成された、図2のシステムの変形例である。例えば、オーディオ入力データIN1−INMがQMF領域のMPSデータであり、反響の適用をQMF領域で行ういくつかの実施形態では、各反響チャンネルのオーディオデータの次の4つの周波数帯域ごとに反響を適用する:
0kHz−3kHz(または0kHz−2.4kHz):この帯域では、式4の係数を有するマトリックス30で、上記の図2の実施形態のように反響を適用する;
3kHz−8kHz(または2.4kHz−8kHz):この帯域では、実数値演算のみで反響を適用する。例えば、2007年3月22日に国際公開された国際出願公開第2007/031171A1号に記載された実数値演算方法を用いて行える。この文献は、オーディオデータの8個の最低周波数帯域では複素数値を処理し、その上の56個の周波数帯域では実数値のみを処理する、64帯域QMFフィルタバンクについて説明している。かかる8個の最低周波数帯域の1つは複素QMFバッファ帯域として用いることができ、複素数値演算はその8個の最低QMF周波数帯域の7つだけに対して行われ(そのため、式4の係数を有するマトリックスで実施される、図2の実施形態のように、比較的低い周波数範囲で反響が適用され)、実数値演算はその他の56QMF周波数帯域に対して行われ、複素数値の計算と実数値の計算のクロスオーバーは(7×44.1kHz)/(64×2)の周波数(約2.4kHz)において起こる。この実施形態では、図2の実施形態のように、比較的高い周波数範囲で反響を適用するが、プレミックスマトリックス30の簡単な実施形態を用いて、実数値計算のみを行う。図2の実施形態のように、マトリックス30を式4の係数として、比較的低い周波数範囲(2.4kHzより下)で反響を適用する。
8kHz−15kHz:この帯域では簡単な遅延方法により反響を適用する。例えば、上記の図2の実施形態に適用したのと同様に反響を適用するが、2つの反響チャンネルだけで各反響チャンネルには遅延ラインとローパスフィルタを有し、マトリックス要素32と34は省略し、プレミックスマトリックス30を簡単な2×2マトリックスとし(例えば、中央チャンネルには他の各チャンネルより少ない反響を適用し)、プレミックスマトリックスの出力に対する反響チャンネルに沿ったノードからのフィードバックはしない。2つの遅延経路を単に左右の出力に入力してもよいし、左前(Lf)と左サラウンド(Ls)チャンネルからのエコーが右出力チャンネルに入り、右前(Rf)と右サラウンド(Rs)チャンネルからのエコーが左出力チャンネルに入るように切り替えてもよい。2×2プレミックスマトリックスは次の係数を有する:
[外13]
Figure 0005524237
ここで、記号は式4で定義したものである。
15−22.05kHz:この帯域では反響は適用しない。
ここに開示した実施形態(例えば、図2の実施形態)の変形例では、本発明のシステムは、空間キューパラメータには応じずに、ダウンミックス信号に応じて、Y個の離散反響チャンネル信号を生成することにより、X個の個別オーディオチャンネルを示すMチャンネルダウンミックスオーディオ入力信号に反響を適用する(ここで、XはMより大きい数である)。これらの変形例では、本システムは、ダウンミックス入力信号の空間的イメージを示す空間キューパラメータに応じて、少なくとも2つの反響チャンネル信号のそれぞれに反響を個別に適用し、Y個の反響チャンネル信号を生成する。例えば、かかる変形例のいくつかでは、プレミックスマトリックス(図2のマトリックス30の変形例)の係数は空間キューパラメータに応じては決定されない。しかし、散乱マトリックス(例えば、図2のマトリックス32の変形例)とゲイン段階(例えば、図2の要素g1−gkを有するゲイン段階の変形例)とポストミックスマトリックス(例えば、図2のマトリックス34の変形例)のうち少なくとも1つは、ダウンミックス入力信号の空間的イメージを示す空間キューパラメータにより決まる方法で、反響チャンネル信号に作用し、少なくとも2つの反響チャンネル信号のそれぞれに反響を適用する。
ある実施形態では、本発明の反響器は、汎用プロセッサであり、または汎用プロセッサを含む。該汎用プロセッサは、Mチャンネルのダウンミックスオーディオ入力信号を示す入力データを受け取り、または生成するように構成され、ソフトウェア(またはファームウェア)でプログラムされ、及び/または本発明の方法の実施形態を含む、(例えば、制御データに応じて)入力データに対して様々な操作を実行するように構成されている。かかる汎用プロセッサは、一般的に、入力装置(例えば、マウスやキーボード)、メモリ、及びディスプレイ装置に結合していてもよい。例えば、図3のシステムは、入力I1(t)、I2(t)、...IM(t)と出力S1(t)、S2(t)、...SN(t)を有する汎用プロセッサで実施してもよい。入力I1(t)、I2(t)、...IM(t)は、ダウンミックスオーディオデータのM個のチャンネルを示す入力データである。出力S1(t)、S2(t)、...SN(t)は、ダウンミックス反響オーディオのN個のチャンネルを示す出力データである。従来のデジタル・ツー・アナログ変換器(DAC)は、この出力データに作用して、スピーカ(例えば、ヘッドホンのペア)により再生するアナログの出力オーディオ信号を生成する。
本発明の具体的な実施形態と、本発明のアプリケーションとをここに説明したが、当業者には言うまでもなく、ここに説明し請求する本発明の範囲から逸脱することなく、ここに説明した実施形態とアプリケーションの多くの変形例が可能である。言うまでもなく、本発明の一定の形態を図示して説明したが、本発明は、説明しかつ図示した実施形態や、説明した具体的な方法には限定されない。

Claims (25)

  1. X個の個別オーディオチャンネルを示すMチャンネル・ダウンミックス・オーディオ入力信号(XはMより大きい数である)に反響を適用する方法であって、
    (a)ダウンミックスした入力信号の空間的イメージを示す空間キューパラメータに応じて、前記Mチャンネル・ダウンミックス・オーディオ入力信号からY個の離散反響チャンネル信号を生成する段階であって、時刻tにおける各反響チャンネル信号は、その時刻tにおけるX個の個別オーディオチャンネルの値の少なくともサブセットの線形結合であり、前記Y個の離散反響チャンネル信号は前記空間キューパラメータに応じて決定される時間変化する係数を含むプレミックス行列を用いて生成される段階と、
    (b)前記反響チャンネル信号の各々に個別に反響を適用して、Y個の反響したチャンネル信号を生成する段階であって、各反響チャンネル信号に、対応する反響チャンネル信号を遅延させたものをフィードバックすることにより、各反響チャンネル信号に個別に反響を適用する段階とを有する方法。
  2. 前記反響チャンネル信号の少なくとも1つに適用する反響の反響インパルス応答は、前記反響チャンネル信号の他のものに適用する反響のものとはことなる、請求項1に記載の方法。
  3. 前記入力信号は、Mチャンネル、MPEGサラウンド・ダウンミックス信号であり、前記空間キューパラメータは、チャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータのうち少なくとも1つを含む、請求項1に記載の方法。
  4. 前記空間キューパラメータは、チャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータを含む、請求項3に記載の方法。
  5. 前記入力信号は、QMF領域周波数成分のM個のシーケンスを含むQMF領域、MPEGサラウンドダウンミックス信号であり、前記QMF領域においてステップ(a)と(b)をそれぞれ実行する、請求項1に記載の方法。
  6. 前記空間キューパラメータは、チャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータのうち少なくとも1つを含む、請求項5に記載の方法。
  7. 前記空間キューパラメータは、チャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータを含む、請求項5に記載の方法。
  8. 前記入力信号は、時間領域、MPEGサラウンドダウンミックス信号であり、
    ステップ(a)の前に、前記時間領域、MPEGサラウンドダウンミックス信号を前記QMF領域に変換して、QMF領域周波数成分のM個のシーケンスを生成する段階も含み、ステップ(a)と(b)はQMF領域で行う、請求項1に記載の方法。
  9. 前記Y個の反響チャンネル信号をダウンミックスして、Nチャンネル、ダウンミックス、反響オーディオ信号を生成する段階も含み、NはYより小さい数である、請求項1に記載の方法。
  10. 前記ダウンミックスは前記空間キューパラメータの少なくともサブセットに応じて行われる、請求項9に記載の方法。
  11. 頭部伝達関数フィルタにおいて前記反響チャンネル信号をフィルタリングすることにより、対応する頭部伝達関数を前記反響チャンネル信号に適用する段階も含む、請求項1に記載の方法。
  12. YはMより大きい、請求項1に記載の方法。
  13. 前記反響チャンネル信号をダウンミックスして、対応する頭部伝達関数を前記反響チャンネル信号に適用する、請求項1に記載の方法。
  14. X個の個別オーディオチャンネルを示すMチャンネル・ダウンミックス・オーディオ入力信号(XはMより大きい数である)に反響を適用するように構成された反響器であって、
    前記入力信号と、前記入力信号の空間的イメージを示す空間キューパラメータとを受け取るように結合され、前記空間キューパラメータに応じて決まる係数を適用することにより、前記入力信号に応じてY個の離散的反響チャンネル信号を生成するように構成された第1のサブシステムであって、生成には、時刻tにおける前記反響チャンネル信号の各々は、前記時刻tにおける前記X個の個別オーディオチャンネルの値の少なくともサブセットの線形結合であるように、前記空間キューパラメータに応じて決定される時間変化する係数を含むプレミックス行列を適用することを含む、第1のサブシステムと、
    前記第1のサブシステムに結合した、前記反響チャンネル信号の各々に個別に反響を適用して、Y個の反響チャンネル信号のセットを生成するように構成された反響適用サブシステムであって、前記反響適用サブシステムはY個のブランチを含むフィードバック遅延ネットワークであり、各ブランチは、反響チャンネル信号ごとに個別に反響を適用するように構成されている反響適用サブシステムとを有する、反響器。
  15. 前記反響適用サブシステムは、前記反響を適用するように構成された前記反響チャンネル信号の少なくとも1つに適用された前記反響が、前記反響チャンネル信号の少なくとも他の1つに適用された前記反響とことなる反響インパルス応答を有する、請求項14に記載の反響器。
  16. 前記入力信号は、MチャンネルMPEGサラウンドダウンミックス信号であり、前記空間キューパラメータはチャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータのうち少なくともいくつかを含む、請求項14に記載の反響器。
  17. 前記空間キューパラメータは、チャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータを含む、請求項14に記載の反響器。
  18. 前記入力信号は、QMF領域周波数成分のM個のシーケンスを有するQMF領域MPEGサラウンドダウンミックス信号であり、前記空間キューパラメータはチャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータのうち少なくともいくつかを含む、請求項14に記載の反響器。
  19. 前記空間キューパラメータは、チャンネルレベル差パラメータ、チャンネル予測計数パラメータ、及びチャンネル間相互相関パラメータを含む、請求項18に記載の反響器。
  20. 前記ダウンミックスオーディオ入力信号は、M個のQMF領域周波数成分のシーケンスのセットであり、前記反響器は、
    時間領域MPEGサラウンドダウンミックス信号を受け取るように結合し、それに応じて前記M個のQMF領域周波数成分のシーケンスを生成するように構成された、時間領域からQMF領域への変換フィルタも含み、前記アップミックスサブシステムは、前記QMF領域の前記M個のQMF領域周波数成分のシーケンスをアップミックスするように構成された、請求項14に記載の反響器。
  21. 前記反響チャンネル信号に結合し、ダウンミックスし、Nチャンネルダウンミックス反響オーディオ信号を生成するように構成されたポストミックスサブシステムも含み、NはYより小さい数である、請求項14に記載の反響器。
  22. 少なくとも1つの頭部伝達関数を前記反響チャンネル信号の各々に適用するように結合し構成された頭部伝達関数フィルタも含む、請求項14に記載の反響器。
  23. 前記反響チャンネル信号に結合しダウンミックスし、前記反響チャンネル信号の各々に少なくとも1つの頭部伝達関数を適用し、Nチャンネルダウンミックス反響オーディオ信号を生成するように構成されたポストミックスサブシステムも含み、NはYより小さい数である、請求項14に記載の反響器。
  24. 前記反響適用サブシステムは、
    前記反響チャンネル信号をアサートするY個の出力と、Y個の入力とを有する、Y個の遅延及びゲイン要素のセットと、
    各々が前記フィルタの異なる出力に結合した第1の入力と、前記反響チャンネル信号の異なる1つに結合し受け取る第2の入力と、出力とを有する、Y個の付加要素のセットと、
    前記付加要素の前記出力に結合したマトリックス入力と、前記遅延及びゲイン要素の前記入力に結合したマトリックス出力と、を有する散乱マトリックスであって、前記散乱マトリックスは、前記遅延及びゲイン要素の対応するものの前記入力に、前記付加要素の各々の前記出力をフィルタしたものをアサートするように構成されている、請求項14に記載の反響器。
  25. 前記遅延及びゲイン要素の出力に結合され、前記空間キューパラメータの少なくともサブセットに結合し受け取る、前記空間キューパラメータの前記サブセットに応じて前記反響チャンネル信号をダウンミックスし、Nチャンネルダウンミックス反響オーディオ信号を生成するように構成された、ここでNはYより小さい数である、請求項24に記載の反響器。
JP2011541416A 2008-12-19 2009-12-16 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置 Active JP5524237B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE0802629 2008-12-19
SE0802629-6 2008-12-19
US17285509P 2009-04-27 2009-04-27
US61/172,855 2009-04-27
PCT/EP2009/067350 WO2010070016A1 (en) 2008-12-19 2009-12-16 Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters

Publications (2)

Publication Number Publication Date
JP2012513138A JP2012513138A (ja) 2012-06-07
JP5524237B2 true JP5524237B2 (ja) 2014-06-18

Family

ID=41796192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011541416A Active JP5524237B2 (ja) 2008-12-19 2009-12-16 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置

Country Status (8)

Country Link
US (1) US8965000B2 (ja)
EP (1) EP2377123B1 (ja)
JP (1) JP5524237B2 (ja)
KR (1) KR101342425B1 (ja)
CN (1) CN102257562B (ja)
BR (1) BRPI0923174B1 (ja)
RU (1) RU2509442C2 (ja)
WO (1) WO2010070016A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011083981A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN103210668B (zh) * 2010-09-06 2016-05-04 杜比国际公司 用于多通道音频再生的向上混合方法及系统
EP2541542A1 (en) 2011-06-27 2013-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal
WO2013064957A1 (en) * 2011-11-01 2013-05-10 Koninklijke Philips Electronics N.V. Audio object encoding and decoding
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
EP2637427A1 (en) 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
RU2625444C2 (ru) * 2013-04-05 2017-07-13 Долби Интернэшнл Аб Система обработки аудио
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
KR102150955B1 (ko) 2013-04-19 2020-09-02 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
US9674632B2 (en) 2013-05-29 2017-06-06 Qualcomm Incorporated Filtering with binaural room impulse responses
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
CN108449704B (zh) * 2013-10-22 2021-01-01 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
CN107750042B (zh) 2014-01-03 2019-12-13 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN104768121A (zh) * 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
AU2015244473B2 (en) 2014-04-11 2018-05-10 Samsung Electronics Co., Ltd. Method and apparatus for rendering sound signal, and computer-readable recording medium
HUE042058T2 (hu) * 2014-05-30 2019-06-28 Qualcomm Inc Szórványossági információ beszerzése magasabb rendû abiszonikus audio leképezõ egységekhez
US20170142178A1 (en) * 2014-07-18 2017-05-18 Sony Semiconductor Solutions Corporation Server device, information processing method for server device, and program
WO2016148553A2 (ko) * 2015-03-19 2016-09-22 (주)소닉티어랩 3차원 사운드를 편집 및 제공하는 방법 및 장치
CN108141685B (zh) 2015-08-25 2021-03-02 杜比国际公司 使用呈现变换参数的音频编码和解码
CN105916095B (zh) * 2016-05-31 2017-08-04 音曼(北京)科技有限公司 反馈延迟网络音色优化的方法
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN107231599A (zh) * 2017-06-08 2017-10-03 北京奇艺世纪科技有限公司 一种3d声场构建方法和vr装置
EP3518556A1 (en) 2018-01-24 2019-07-31 L-Acoustics UK Limited Method and system for applying time-based effects in a multi-channel audio reproduction system
US11544032B2 (en) * 2019-01-24 2023-01-03 Dolby Laboratories Licensing Corporation Audio connection and transmission device

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2038704C1 (ru) 1993-08-12 1995-06-27 Владимир Анатольевич Ефремов Пространственная звуковоспроизводящая система
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
BR0304231A (pt) 2002-04-10 2004-07-27 Koninkl Philips Electronics Nv Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
EP1775996A4 (en) 2004-06-30 2011-08-10 Pioneer Corp REVERB-SETTING DEVICE, REVERB-SETTING METHOD, REVERB-SETTING PROGRAM, RECORDING MEDIUM CONTAINING THE PROGRAM, AND SOUND FIELD CORRECTION SYSTEM
CA2572805C (en) 2004-07-02 2013-08-13 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
EP1927264B1 (en) * 2005-09-13 2016-07-20 Koninklijke Philips N.V. Method of and device for generating and processing parameters representing hrtfs
EP1927266B1 (en) 2005-09-13 2014-05-14 Koninklijke Philips N.V. Audio coding
US7917561B2 (en) 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
PL1989920T3 (pl) * 2006-02-21 2010-07-30 Koninl Philips Electronics Nv Kodowanie i dekodowanie dźwięku
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
WO2007106553A1 (en) 2006-03-15 2007-09-20 Dolby Laboratories Licensing Corporation Binaural rendering using subband filters
KR101010464B1 (ko) 2006-03-24 2011-01-21 코닌클리즈케 필립스 일렉트로닉스 엔.브이. 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
JP2007336080A (ja) * 2006-06-13 2007-12-27 Clarion Co Ltd 音響補正装置
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
JP4850628B2 (ja) * 2006-08-28 2012-01-11 キヤノン株式会社 記録装置
US8670570B2 (en) * 2006-11-07 2014-03-11 Stmicroelectronics Asia Pacific Pte., Ltd. Environmental effects generator for digital audio signals
US8363843B2 (en) * 2007-03-01 2013-01-29 Apple Inc. Methods, modules, and computer-readable recording media for providing a multi-channel convolution reverb
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JP2008301427A (ja) 2007-06-04 2008-12-11 Onkyo Corp マルチチャンネル音声再生装置

Also Published As

Publication number Publication date
KR20110122667A (ko) 2011-11-10
RU2011129154A (ru) 2013-01-27
WO2010070016A1 (en) 2010-06-24
US20110261966A1 (en) 2011-10-27
RU2509442C2 (ru) 2014-03-10
CN102257562A (zh) 2011-11-23
US8965000B2 (en) 2015-02-24
KR101342425B1 (ko) 2013-12-17
JP2012513138A (ja) 2012-06-07
BRPI0923174B1 (pt) 2020-10-06
BRPI0923174A2 (pt) 2016-02-16
EP2377123A1 (en) 2011-10-19
CN102257562B (zh) 2013-09-11
EP2377123B1 (en) 2014-10-29

Similar Documents

Publication Publication Date Title
JP5524237B2 (ja) 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
US20200335115A1 (en) Audio encoding and decoding
CA2701360C (en) Method and apparatus for generating a binaural audio signal
JP4598830B2 (ja) 非相関信号を用いた音声符号化
JP4856653B2 (ja) 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
TWI322630B (en) Device and method for generating an encoded stereo signal of an audio piece or audio datastream,and a computer program for generation an encoded stereo signal
EP3340660B1 (en) Binaural filters for monophonic compatibility and loudspeaker compatibility
JP6797187B2 (ja) オーディオ・デコーダおよびデコード方法
JP2008522244A (ja) オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
RU2427978C2 (ru) Кодирование и декодирование аудио
EP2380364B1 (en) Generating an output signal by send effect processing
JP2007104601A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための装置
JP2021015310A (ja) オーディオ・デコーダおよびデコード方法
MX2008008829A (en) Decoding of binaural audio signals

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140409

R150 Certificate of patent or registration of utility model

Ref document number: 5524237

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250