JP2016513811A5

JP2016513811A5 -

Info

Publication number: JP2016513811A5
Application number: JP2015560355A
Authority: JP
Filing date: 2014-02-28
Publication date: 2017-08-31

Claims

音場について説明する複数の階層的な要素からなるビットストリームを生成する方法であって、
デバイスに結合されたマイクロフォンを介して、前記複数の階層的な要素を表すオーディオデータを捕捉することと、
前記デバイスが、および前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行することと、
前記デバイスが、前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定することと、
前記デバイスが、前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定することと
を備える、方法。
前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
ここにおいて、前記変換情報を指定することが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定することを備える、請求項１に記載の方法。
前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を平行移動させることを備え、
ここにおいて、前記変換情報を指定することが、前記音場がどのように平行移動されたかについて説明する平行移動情報を前記ビットストリーム内で指定することを備える、請求項１に記載の方法。
前記線形可逆変換を実行することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を変換することを備える、請求項１に記載の方法。
前記線形可逆変換を実行することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
ここにおいて、前記変換情報を指定することが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定することを備える、請求項１に記載の方法。
前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
ここにおいて、前記変換情報を指定することが、回転情報としてオイラー角を前記ビットストリーム内で指定することを備える、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、請求項１に記載の方法。
前記線形可逆変換を実行することが、
第１の方位角角度と第１の仰角角度に従って前記音場を回転させるために前記音場に対して第１の回転演算を実行することと、
前記音場について説明するのに関連する情報を提供する前記第１の方位角角度と前記第１の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第１の数を決定することと、
第２の方位角角度および第２の仰角角度に従って前記音場を回転させるために前記音場に対して第２の回転演算を実行することと、
前記音場について説明するのに関連する情報を提供する前記第２の方位角角度および前記第２の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第２の数を決定することと、
前記複数の階層的な要素の前記第１の数と前記複数の階層的な要素の前記第２の数の比較に基づいて前記第１の回転演算または前記第２の回転演算を選択することと
を備える、請求項１に記載の方法。
前記線形可逆変換を実行することが、
第１の持続時間にわたって前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために、前記第１の持続時間にわたって前記音場を回転させることと、
前記ビットストリーム内で、前記第１の持続時間にわたって前記音場がどのように回転されたかについて説明する第１の回転情報を指定することと、
前記第１の回転情報に基づいて第２の持続時間の前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の前記数を減少させるために、前記第２の持続時間にわたって前記音場を回転させることと、
前記ビットストリーム内で、前記第２の持続時間にわたって前記音場がどのように回転されたかについて説明する第２の回転情報を指定することと
を備える、請求項１に記載の方法。
前記線形可逆変換を実行することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素に対してベクトルベースの分解を実行することを備え、
ここにおいて、前記変換情報を指定することが、前記ベクトルベースの分解が前記複数の球面調和係数に対して実行されたことについて説明する情報を前記ビットストリーム内で指定することを備える、請求項１に記載の方法。
前記ベクトルベースの分解を実行することが、特異値分解（ＳＶＤ）、主成分分析（ＰＣＡ）、およびカルーネン−レーベ変換（ＫＬＴ）のうち１つまたは複数を実行することを備える、請求項９に記載の方法。
前記線形可逆変換を実行することが、前記階層的な要素の前記数を減少させるように前記複数の階層的な要素を球面調和関数領域から別の領域に変換することを備え、
ここにおいて、前記変換情報を指定することが、複数の階層的な要素が前記球面調和関数領域から前記別の領域に変換されたことを示す情報を前記ビットストリーム内で指定することを備える、請求項１に記載の方法。
変換された球面調和係数の少なくとも１つのサブセットにビットレートを、前記変換された球面調和係数の前記サブセットが対応する球面基底関数の次数および副次数のうち１つまたは複数に基づいて割り当てることをさらに備え、前記変換された球面調和係数が、音場を変換する変換演算に従って変換された、請求項１に記載の方法。
前記ビットレートを割り当てることが、前記変換された球面調和係数の各々が対応する前記球面基底関数の前記次数および前記副次数のうち１つまたは複数に基づいて、前記変換された球面調和係数の異なるサブセットに異なるビットレートを窓関数に従って割り当てることを備える、請求項１２に記載の方法。
前記窓関数が、ハニング窓関数、ハミング窓関数、矩形窓関数、および三角形窓関数のうち１つまたは複数を備える、請求項１３に記載の方法。
第１のビットレートを使用する前記変換された球面調和係数の第１のサブセットと第２のビットレートを使用する前記変換された球面調和係数の第２のサブセットとを前記ビットストリーム内で指定することをさらに備える、請求項１２に記載の方法。
前記ビットレートを割り当てることが、前記変換された球面調和係数が対応する前記球面基底関数の前記副次数がゼロから遠ざかるにつれて徐々に減少するビットレートを動的に割り当てることを備える、請求項１２に記載の方法。
前記ビットレートを割り当てることが、前記変換された球面調和係数が対応する前記球面基底関数の前記次数が増加するにつれて徐々に減少するビットレートを動的に割り当てることを備える、請求項１２に記載の方法。
前記ビットレートを割り当てることが、前記変換された球面調和係数の前記サブセットが対応する前記球面基底関数の前記次数および前記副次数のうち１つまたは複数に基づいて、変換された球面調和係数の異なるサブセットに異なるビットレートを動的に割り当てることを備える、請求項１２に記載の方法。
音場について説明する複数の階層的な要素からなるビットストリームを生成するように構成されたデバイスであって、
前記複数の階層的な要素を表すオーディオデータを捕捉するように構成されたマイクロフォンと、
前記複数の階層的な要素を記憶するように構成されたメモリと、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行することに少なくとも部分的によって前記複数の階層的な要素を符号化することと、
前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定し、前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定することと
を行うように構成された１つまたは複数のプロセッサと
を備える、デバイス。
前記１つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を平行移動させるように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、前記音場がどのように平行移動されたかについて説明する平行移動情報を前記ビットストリーム内で指定するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場に対して前記線形可逆変換を実行するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、回転情報としてオイラー角を前記ビットストリーム内で指定するように構成され、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、第１の方位角角度と第１の仰角角度に従って前記音場を回転させるために前記音場に対して第１の回転演算を実行し、前記音場について説明するのに関連する情報を提供する前記第１の方位角角度と前記第１の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第１の数を決定し、第２の方位角角度および第２の仰角角度に従って前記音場を回転させるために前記音場に対して第２の回転演算を実行し、前記音場について説明するのに関連する情報を提供する前記第２の方位角角度および前記第２の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第２の数を決定し、前記複数の階層的な要素の前記第１の数と前記複数の階層的な要素の前記第２の数の比較に基づいて前記第１の回転演算または前記第２の回転演算を選択するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、第１の持続時間にわたって前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために、前記第１の持続時間にわたって前記音場を回転させ、前記ビットストリーム内で、前記第１の持続時間にわたって前記音場がどのように回転されたかについて説明する第１の回転情報を指定し、前記第１の回転情報に基づいて第２の持続時間の前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の前記数を減少させるために、前記第２の持続時間にわたって前記音場を回転させ、前記ビットストリーム内で、前記第２の持続時間にわたって前記音場がどのように回転されたかについて説明する第２の回転情報を指定するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素に対してベクトルベースの分解を実行するように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、前記ベクトルベースの分解が前記複数の球面調和係数に対して実行されたことについて説明する情報を前記ビットストリーム内で指定するように構成される、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、前記ベクトルベースの分解を実行するとき、特異値分解（ＳＶＤ）、主成分分析（ＰＣＡ）、およびカルーネン−レーベ変換（ＫＬＴ）のうち１つまたは複数を実行するように構成される、請求項２７に記載のデバイス。
前記１つまたは複数のプロセッサが、前記階層的な要素の前記数を減少させるように前記複数の階層的な要素を球面調和関数領域から別の領域に変換するように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、複数の階層的な要素が前記球面調和関数領域から前記別の領域に変換されたことを示す情報を前記ビットストリーム内で指定するように構成される、請求項２７に記載のデバイス。
前記１つまたは複数のプロセッサが、変換された球面調和係数の少なくとも１つのサブセットにビットレートを、前記変換された球面調和係数の前記サブセットが対応する球面基底関数の次数および副次数のうち１つまたは複数に基づいて割り当てるようにさらに構成され、前記変換された球面調和係数が、音場を変換する変換演算に従って変換された、請求項１９に記載のデバイス。
前記１つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数の各々が対応する前記球面基底関数の前記次数および前記副次数のうち１つまたは複数に基づいて、前記変換された球面調和係数の異なるサブセットに異なるビットレートを窓関数に従って割り当てるように構成される、請求項３０に記載のデバイス。
前記窓関数が、ハニング窓関数、ハミング窓関数、矩形窓関数、および三角形窓関数のうち１つまたは複数を備える、請求項３１に記載のデバイス。
前記１つまたは複数のプロセッサが、第１のビットレートを使用する前記変換された球面調和係数の第１のサブセットと第２のビットレートを使用する前記変換された球面調和係数の第２のサブセットとを前記ビットストリーム内で指定するようにさらに構成される、請求項３０に記載のデバイス。
前記１つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数が対応する前記球面基底関数の前記副次数がゼロから遠ざかるにつれて徐々に減少するビットレートを動的に割り当てるように構成される、請求項３０に記載のデバイス。
前記１つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数が対応する前記球面基底関数の前記次数が増加するにつれて徐々に減少するビットレートを動的に割り当てるように構成される、請求項３０に記載のデバイス。
前記１つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数の前記サブセットが対応する前記球面基底関数の前記次数および前記副次数のうち１つまたは複数に基づいて、変換された球面調和係数の異なるサブセットに異なるビットレートを動的に割り当てるように構成される、請求項３０に記載のデバイス。
音場について説明する複数の階層的な要素からなるビットストリームを生成するように構成されたデバイスであって、
前記複数の階層的な要素を表すオーディオデータを捕捉するための手段と、
前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行するための手段と、
前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定するための手段と、
前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定するための手段と
を備える、デバイス。
実行されると、１つまたは複数のプロセッサに、
音場を表す複数の階層的な要素を表すオーディオデータを捕捉するためにマイクロフォンとインターフェースを取らせ、
前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行させ、
前記音場がどのように変換されたかについて説明する変換情報をビットストリーム内で指定させ、
前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定させる命令をその上に記憶させた非一時的なコンピュータ可読記憶媒体。
音場について説明する複数の階層的な要素からなるビットストリームを処理する方法であって、
１つまたは複数のラウドスピーカーに結合されたデバイスが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析することと、前記変換が、線形可逆変換を備える、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記デバイスが、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換することと、
前記デバイスが、前記複数の階層的な要素を１つまたは複数のスピーカーフィードにレンダリングすることと、
前記デバイスが、前記１つまたは複数のラウドスピーカーを駆動するために前記１つまたは複数のスピーカーフィードを出力することと
を備える、方法。
前記変換情報を決定するために前記ビットストリームを解析することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析することを備え、
前記音場を変換することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させることを備える、請求項３９に記載の方法。
前記変換情報を決定するために前記ビットストリームを解析することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように平行移動されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記平行移動を逆にするために前記平行移動情報に基づいて前記音場を平行移動させることを備える、請求項３９に記載の方法。
前記変換情報を決定するために前記ビットストリームを解析することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析することを備え、
前記音場を変換することが、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換することを備える、請求項３９に記載の方法。
前記変換情報を決定するために前記ビットストリームを解析することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させることを備える、請求項３９に記載の方法。
変換情報を決定するために前記ビットストリームを解析することが、オイラー角を含む回転情報を決定するために前記ビットストリームを解析することを備え、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、
ここにおいて、前記音場を変換することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記オイラー角に基づいて前記音場を回転させることを備える、請求項３９に記載の方法。
前記変換情報を決定するために前記ビットストリームを解析することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素がどのようにベクトルベースの分解を使用して分解されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記ベクトルベース分解された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備える、請求項３９に記載の方法。
前記ベクトルベースの分解が、特異値分解（ＳＶＤ）、主成分分析（ＰＣＡ）、およびカルーネン−レーベ変換（ＫＬＴ）のうち１つまたは複数を備える、請求項４５に記載の方法。
前記変換情報を決定するために前記ビットストリームを解析することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素が球面調和関数領域から別の領域にどのように変換されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備える、請求項３９に記載の方法。
音場について説明する複数の階層的な要素からなるビットストリームを処理するように構成されたデバイスであって、
前記ビットストリームの少なくとも一部分を記憶するように構成されたメモリと、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析し、前記変換が、線形可逆変換を備え、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換し、前記複数の階層的な要素を１つまたは複数のスピーカーフィードにレンダリングするように構成された１つまたは複数のプロセッサと、
前記１つまたは複数のスピーカーフィードに基づいて前記音場を再現するように構成された１つまたは複数のラウドスピーカーと
を備える、デバイス。
前記１つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記１つまたは複数のプロセッサが、前記音場を変換するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させるようにさらに構成される、請求項４８に記載のデバイス。
前記１つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように平行移動されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記１つまたは複数のプロセッサが、前記音場を変換するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記平行移動を逆にするために前記平行移動情報に基づいて前記音場を平行移動させるようにさらに構成される、請求項４８に記載のデバイス。
前記１つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記１つまたは複数のプロセッサが、前記音場を変換するとき、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換するようにさらに構成される、請求項４８に記載のデバイス。
前記１つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記１つまたは複数のプロセッサが、前記音場を変換するとき、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させるようにさらに構成される、請求項４８に記載のデバイス。
前記１つまたは複数のプロセッサが、変換情報を決定するために前記ビットストリームを解析するとき、オイラー角を含む回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、
ここにおいて、前記１つまたは複数のプロセッサが、前記音場を変換するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記オイラー角に基づいて前記音場を回転させるようにさらに構成される、請求項４８に記載のデバイス。
前記１つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素がどのようにベクトルベースの分解を使用して分解されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、前記音場を変換するとき、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記ベクトルベース分解された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築するように構成される、請求項４８に記載のデバイス。
前記ベクトルベースの分解が、特異値分解（ＳＶＤ）、主成分分析（ＰＣＡ）、およびカルーネン−レーベ変換（ＫＬＴ）のうち１つまたは複数を備える、請求項５４に記載のデバイス。
前記１つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素が球面調和関数領域から他の領域にどのように変換されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するように構成され、
ここにおいて、前記１つまたは複数のプロセッサが、前記音場を変換することが備えるとき、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備えるように構成される、請求項５４に記載のデバイス。
音場について説明する複数の階層的な要素からなるビットストリームを処理するように構成されたデバイスであって、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析するための手段と、前記変換が、線形可逆変換を備える、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記複数の階層的な要素を復号するために前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換するための手段と、
前記複数の階層的な要素を１つまたは複数のスピーカーフィードにレンダリングするための手段と、
１つまたは複数のラウドスピーカーを駆動するために前記１つまたは複数のスピーカーフィードを出力するための手段と
を備える、デバイス。
実行されると、１つまたは複数のプロセッサに、
音場について説明するのに関連する情報を提供する複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するためにビットストリームを解析させ、前記変換が、線形可逆変換を備える、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換させ、
前記複数の階層的な要素を１つまたは複数のスピーカーフィードにレンダリングさせ、
１つまたは複数のラウドスピーカーを駆動するために前記１つまたは複数のスピーカーフィードを出力させる命令をその上に記憶させた非一時的なコンピュータ可読記憶媒体。
音場について説明する複数の階層的な要素からなるビットストリームを生成する方法であって、
デバイスに結合されたマイクロフォンが、前記複数の階層的な要素を表すオーディオデータを捕捉することと、
前記デバイスが、前記複数の階層的な要素の数を減少させるように前記複数の階層的な要素に対してベクトルベースの変換を実行することと、
前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定することと
を備える、方法。
前記ベクトルベースの変換を実行することが、特異値分解（ＳＶＤ）、主成分分析（ＰＣＡ）、およびカルーネン−レーベ変換（ＫＬＴ）のうち１つまたは複数を前記複数の階層的な要素に対して実行することを備える、請求項５９に記載の方法。