JP2016513811A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2016513811A5 JP2016513811A5 JP2015560355A JP2015560355A JP2016513811A5 JP 2016513811 A5 JP2016513811 A5 JP 2016513811A5 JP 2015560355 A JP2015560355 A JP 2015560355A JP 2015560355 A JP2015560355 A JP 2015560355A JP 2016513811 A5 JP2016513811 A5 JP 2016513811A5
- Authority
- JP
- Japan
- Prior art keywords
- sound field
- hierarchical elements
- bitstream
- information
- describing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001131 transforming Effects 0.000 claims 36
- 238000006243 chemical reaction Methods 0.000 claims 27
- 230000002441 reversible Effects 0.000 claims 17
- 238000000354 decomposition reaction Methods 0.000 claims 16
- 238000000513 principal component analysis Methods 0.000 claims 10
- 230000000875 corresponding Effects 0.000 claims 3
- 238000000034 method Methods 0.000 claims 2
- 238000009877 rendering Methods 0.000 claims 2
Claims (60)
- 音場について説明する複数の階層的な要素からなるビットストリームを生成する方法であって、
デバイスに結合されたマイクロフォンを介して、前記複数の階層的な要素を表すオーディオデータを捕捉することと、
前記デバイスが、および前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行することと、
前記デバイスが、前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定することと、
前記デバイスが、前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定することと
を備える、方法。 - 前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
ここにおいて、前記変換情報を指定することが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。 - 前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を平行移動させることを備え、
ここにおいて、前記変換情報を指定することが、前記音場がどのように平行移動されたかについて説明する平行移動情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。 - 前記線形可逆変換を実行することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を変換することを備える、請求項1に記載の方法。
- 前記線形可逆変換を実行することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
ここにおいて、前記変換情報を指定することが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。 - 前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
ここにおいて、前記変換情報を指定することが、回転情報としてオイラー角を前記ビットストリーム内で指定することを備える、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、請求項1に記載の方法。 - 前記線形可逆変換を実行することが、
第1の方位角角度と第1の仰角角度に従って前記音場を回転させるために前記音場に対して第1の回転演算を実行することと、
前記音場について説明するのに関連する情報を提供する前記第1の方位角角度と前記第1の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第1の数を決定することと、
第2の方位角角度および第2の仰角角度に従って前記音場を回転させるために前記音場に対して第2の回転演算を実行することと、
前記音場について説明するのに関連する情報を提供する前記第2の方位角角度および前記第2の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第2の数を決定することと、
前記複数の階層的な要素の前記第1の数と前記複数の階層的な要素の前記第2の数の比較に基づいて前記第1の回転演算または前記第2の回転演算を選択することと
を備える、請求項1に記載の方法。 - 前記線形可逆変換を実行することが、
第1の持続時間にわたって前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために、前記第1の持続時間にわたって前記音場を回転させることと、
前記ビットストリーム内で、前記第1の持続時間にわたって前記音場がどのように回転されたかについて説明する第1の回転情報を指定することと、
前記第1の回転情報に基づいて第2の持続時間の前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の前記数を減少させるために、前記第2の持続時間にわたって前記音場を回転させることと、
前記ビットストリーム内で、前記第2の持続時間にわたって前記音場がどのように回転されたかについて説明する第2の回転情報を指定することと
を備える、請求項1に記載の方法。 - 前記線形可逆変換を実行することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素に対してベクトルベースの分解を実行することを備え、
ここにおいて、前記変換情報を指定することが、前記ベクトルベースの分解が前記複数の球面調和係数に対して実行されたことについて説明する情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。 - 前記ベクトルベースの分解を実行することが、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を実行することを備える、請求項9に記載の方法。
- 前記線形可逆変換を実行することが、前記階層的な要素の前記数を減少させるように前記複数の階層的な要素を球面調和関数領域から別の領域に変換することを備え、
ここにおいて、前記変換情報を指定することが、複数の階層的な要素が前記球面調和関数領域から前記別の領域に変換されたことを示す情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。 - 変換された球面調和係数の少なくとも1つのサブセットにビットレートを、前記変換された球面調和係数の前記サブセットが対応する球面基底関数の次数および副次数のうち1つまたは複数に基づいて割り当てることをさらに備え、前記変換された球面調和係数が、音場を変換する変換演算に従って変換された、請求項1に記載の方法。
- 前記ビットレートを割り当てることが、前記変換された球面調和係数の各々が対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、前記変換された球面調和係数の異なるサブセットに異なるビットレートを窓関数に従って割り当てることを備える、請求項12に記載の方法。
- 前記窓関数が、ハニング窓関数、ハミング窓関数、矩形窓関数、および三角形窓関数のうち1つまたは複数を備える、請求項13に記載の方法。
- 第1のビットレートを使用する前記変換された球面調和係数の第1のサブセットと第2のビットレートを使用する前記変換された球面調和係数の第2のサブセットとを前記ビットストリーム内で指定することをさらに備える、請求項12に記載の方法。
- 前記ビットレートを割り当てることが、前記変換された球面調和係数が対応する前記球面基底関数の前記副次数がゼロから遠ざかるにつれて徐々に減少するビットレートを動的に割り当てることを備える、請求項12に記載の方法。
- 前記ビットレートを割り当てることが、前記変換された球面調和係数が対応する前記球面基底関数の前記次数が増加するにつれて徐々に減少するビットレートを動的に割り当てることを備える、請求項12に記載の方法。
- 前記ビットレートを割り当てることが、前記変換された球面調和係数の前記サブセットが対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、変換された球面調和係数の異なるサブセットに異なるビットレートを動的に割り当てることを備える、請求項12に記載の方法。
- 音場について説明する複数の階層的な要素からなるビットストリームを生成するように構成されたデバイスであって、
前記複数の階層的な要素を表すオーディオデータを捕捉するように構成されたマイクロフォンと、
前記複数の階層的な要素を記憶するように構成されたメモリと、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行することに少なくとも部分的によって前記複数の階層的な要素を符号化することと、
前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定し、前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定することと
を行うように構成された1つまたは複数のプロセッサと
を備える、デバイス。 - 前記1つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を平行移動させるように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、前記音場がどのように平行移動されたかについて説明する平行移動情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。 - 前記1つまたは複数のプロセッサが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場に対して前記線形可逆変換を実行するように構成される、請求項19に記載のデバイス。
- 前記1つまたは複数のプロセッサが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、回転情報としてオイラー角を前記ビットストリーム内で指定するように構成され、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、請求項19に記載のデバイス。 - 前記1つまたは複数のプロセッサが、第1の方位角角度と第1の仰角角度に従って前記音場を回転させるために前記音場に対して第1の回転演算を実行し、前記音場について説明するのに関連する情報を提供する前記第1の方位角角度と前記第1の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第1の数を決定し、第2の方位角角度および第2の仰角角度に従って前記音場を回転させるために前記音場に対して第2の回転演算を実行し、前記音場について説明するのに関連する情報を提供する前記第2の方位角角度および前記第2の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第2の数を決定し、前記複数の階層的な要素の前記第1の数と前記複数の階層的な要素の前記第2の数の比較に基づいて前記第1の回転演算または前記第2の回転演算を選択するように構成される、請求項19に記載のデバイス。
- 前記1つまたは複数のプロセッサが、第1の持続時間にわたって前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために、前記第1の持続時間にわたって前記音場を回転させ、前記ビットストリーム内で、前記第1の持続時間にわたって前記音場がどのように回転されたかについて説明する第1の回転情報を指定し、前記第1の回転情報に基づいて第2の持続時間の前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の前記数を減少させるために、前記第2の持続時間にわたって前記音場を回転させ、前記ビットストリーム内で、前記第2の持続時間にわたって前記音場がどのように回転されたかについて説明する第2の回転情報を指定するように構成される、請求項19に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素に対してベクトルベースの分解を実行するように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、前記ベクトルベースの分解が前記複数の球面調和係数に対して実行されたことについて説明する情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記ベクトルベースの分解を実行するとき、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を実行するように構成される、請求項27に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記階層的な要素の前記数を減少させるように前記複数の階層的な要素を球面調和関数領域から別の領域に変換するように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、複数の階層的な要素が前記球面調和関数領域から前記別の領域に変換されたことを示す情報を前記ビットストリーム内で指定するように構成される、請求項27に記載のデバイス。 - 前記1つまたは複数のプロセッサが、変換された球面調和係数の少なくとも1つのサブセットにビットレートを、前記変換された球面調和係数の前記サブセットが対応する球面基底関数の次数および副次数のうち1つまたは複数に基づいて割り当てるようにさらに構成され、前記変換された球面調和係数が、音場を変換する変換演算に従って変換された、請求項19に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数の各々が対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、前記変換された球面調和係数の異なるサブセットに異なるビットレートを窓関数に従って割り当てるように構成される、請求項30に記載のデバイス。
- 前記窓関数が、ハニング窓関数、ハミング窓関数、矩形窓関数、および三角形窓関数のうち1つまたは複数を備える、請求項31に記載のデバイス。
- 前記1つまたは複数のプロセッサが、第1のビットレートを使用する前記変換された球面調和係数の第1のサブセットと第2のビットレートを使用する前記変換された球面調和係数の第2のサブセットとを前記ビットストリーム内で指定するようにさらに構成される、請求項30に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数が対応する前記球面基底関数の前記副次数がゼロから遠ざかるにつれて徐々に減少するビットレートを動的に割り当てるように構成される、請求項30に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数が対応する前記球面基底関数の前記次数が増加するにつれて徐々に減少するビットレートを動的に割り当てるように構成される、請求項30に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数の前記サブセットが対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、変換された球面調和係数の異なるサブセットに異なるビットレートを動的に割り当てるように構成される、請求項30に記載のデバイス。
- 音場について説明する複数の階層的な要素からなるビットストリームを生成するように構成されたデバイスであって、
前記複数の階層的な要素を表すオーディオデータを捕捉するための手段と、
前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行するための手段と、
前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定するための手段と、
前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定するための手段と
を備える、デバイス。 - 実行されると、1つまたは複数のプロセッサに、
音場を表す複数の階層的な要素を表すオーディオデータを捕捉するためにマイクロフォンとインターフェースを取らせ、
前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行させ、
前記音場がどのように変換されたかについて説明する変換情報をビットストリーム内で指定させ、
前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定させる命令をその上に記憶させた非一時的なコンピュータ可読記憶媒体。 - 音場について説明する複数の階層的な要素からなるビットストリームを処理する方法であって、
1つまたは複数のラウドスピーカーに結合されたデバイスが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析することと、前記変換が、線形可逆変換を備える、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記デバイスが、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換することと、
前記デバイスが、前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングすることと、
前記デバイスが、前記1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のスピーカーフィードを出力することと
を備える、方法。 - 前記変換情報を決定するために前記ビットストリームを解析することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析することを備え、
前記音場を変換することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させることを備える、請求項39に記載の方法。 - 前記変換情報を決定するために前記ビットストリームを解析することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように平行移動されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記平行移動を逆にするために前記平行移動情報に基づいて前記音場を平行移動させることを備える、請求項39に記載の方法。 - 前記変換情報を決定するために前記ビットストリームを解析することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析することを備え、
前記音場を変換することが、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換することを備える、請求項39に記載の方法。 - 前記変換情報を決定するために前記ビットストリームを解析することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させることを備える、請求項39に記載の方法。 - 変換情報を決定するために前記ビットストリームを解析することが、オイラー角を含む回転情報を決定するために前記ビットストリームを解析することを備え、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、
ここにおいて、前記音場を変換することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記オイラー角に基づいて前記音場を回転させることを備える、請求項39に記載の方法。 - 前記変換情報を決定するために前記ビットストリームを解析することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素がどのようにベクトルベースの分解を使用して分解されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記ベクトルベース分解された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備える、請求項39に記載の方法。 - 前記ベクトルベースの分解が、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を備える、請求項45に記載の方法。
- 前記変換情報を決定するために前記ビットストリームを解析することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素が球面調和関数領域から別の領域にどのように変換されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
ここにおいて、前記音場を変換することが、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備える、請求項39に記載の方法。 - 音場について説明する複数の階層的な要素からなるビットストリームを処理するように構成されたデバイスであって、
前記ビットストリームの少なくとも一部分を記憶するように構成されたメモリと、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析し、前記変換が、線形可逆変換を備え、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換し、前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングするように構成された1つまたは複数のプロセッサと、
前記1つまたは複数のスピーカーフィードに基づいて前記音場を再現するように構成された1つまたは複数のラウドスピーカーと
を備える、デバイス。 - 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させるようにさらに構成される、請求項48に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように平行移動されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記平行移動を逆にするために前記平行移動情報に基づいて前記音場を平行移動させるようにさらに構成される、請求項48に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換するようにさらに構成される、請求項48に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、
前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させるようにさらに構成される、請求項48に記載のデバイス。 - 前記1つまたは複数のプロセッサが、変換情報を決定するために前記ビットストリームを解析するとき、オイラー角を含む回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、
ここにおいて、前記1つまたは複数のプロセッサが、前記音場を変換するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記オイラー角に基づいて前記音場を回転させるようにさらに構成される、請求項48に記載のデバイス。 - 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素がどのようにベクトルベースの分解を使用して分解されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記ベクトルベース分解された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築するように構成される、請求項48に記載のデバイス。 - 前記ベクトルベースの分解が、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を備える、請求項54に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素が球面調和関数領域から他の領域にどのように変換されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するように構成され、
ここにおいて、前記1つまたは複数のプロセッサが、前記音場を変換することが備えるとき、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備えるように構成される、請求項54に記載のデバイス。 - 音場について説明する複数の階層的な要素からなるビットストリームを処理するように構成されたデバイスであって、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析するための手段と、前記変換が、線形可逆変換を備える、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記複数の階層的な要素を復号するために前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換するための手段と、
前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングするための手段と、
1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のスピーカーフィードを出力するための手段と
を備える、デバイス。 - 実行されると、1つまたは複数のプロセッサに、
音場について説明するのに関連する情報を提供する複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するためにビットストリームを解析させ、前記変換が、線形可逆変換を備える、
前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換させ、
前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングさせ、
1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のスピーカーフィードを出力させる命令をその上に記憶させた非一時的なコンピュータ可読記憶媒体。 - 音場について説明する複数の階層的な要素からなるビットストリームを生成する方法であって、
デバイスに結合されたマイクロフォンが、前記複数の階層的な要素を表すオーディオデータを捕捉することと、
前記デバイスが、前記複数の階層的な要素の数を減少させるように前記複数の階層的な要素に対してベクトルベースの変換を実行することと、
前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定することと
を備える、方法。 - 前記ベクトルベースの変換を実行することが、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を前記複数の階層的な要素に対して実行することを備える、請求項59に記載の方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361771677P | 2013-03-01 | 2013-03-01 | |
US61/771,677 | 2013-03-01 | ||
US201361860201P | 2013-07-30 | 2013-07-30 | |
US61/860,201 | 2013-07-30 | ||
US14/192,829 | 2014-02-27 | ||
US14/192,829 US9685163B2 (en) | 2013-03-01 | 2014-02-27 | Transforming spherical harmonic coefficients |
PCT/US2014/019468 WO2014134472A2 (en) | 2013-03-01 | 2014-02-28 | Transforming spherical harmonic coefficients |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016513811A JP2016513811A (ja) | 2016-05-16 |
JP2016513811A5 true JP2016513811A5 (ja) | 2017-08-31 |
Family
ID=51420957
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015560355A Pending JP2016513811A (ja) | 2013-03-01 | 2014-02-28 | 変換球面調和係数 |
JP2015560352A Ceased JP2016510905A (ja) | 2013-03-01 | 2014-02-28 | ビットストリームにおける球面調和係数および/または高次アンビソニックス係数の指定 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015560352A Ceased JP2016510905A (ja) | 2013-03-01 | 2014-02-28 | ビットストリームにおける球面調和係数および/または高次アンビソニックス係数の指定 |
Country Status (10)
Country | Link |
---|---|
US (2) | US9685163B2 (ja) |
EP (2) | EP2962297B1 (ja) |
JP (2) | JP2016513811A (ja) |
KR (2) | KR20150123310A (ja) |
CN (2) | CN105027200B (ja) |
BR (1) | BR112015020892A2 (ja) |
ES (1) | ES2738490T3 (ja) |
HU (1) | HUE045446T2 (ja) |
TW (2) | TWI603631B (ja) |
WO (2) | WO2014134472A2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9685163B2 (en) | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
US9412385B2 (en) * | 2013-05-28 | 2016-08-09 | Qualcomm Incorporated | Performing spatial masking with respect to spherical harmonic coefficients |
US9854377B2 (en) | 2013-05-29 | 2017-12-26 | Qualcomm Incorporated | Interpolation for decomposed representations of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9384741B2 (en) * | 2013-05-29 | 2016-07-05 | Qualcomm Incorporated | Binauralization of rotated higher order ambisonics |
WO2014195190A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
EP2879408A1 (en) * | 2013-11-28 | 2015-06-03 | Thomson Licensing | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
CN107112024B (zh) * | 2014-10-24 | 2020-07-14 | 杜比国际公司 | 音频信号的编码和解码 |
US10452651B1 (en) | 2014-12-23 | 2019-10-22 | Palantir Technologies Inc. | Searching charts |
CN104795064B (zh) * | 2015-03-30 | 2018-04-13 | 福州大学 | 低信噪比声场景下声音事件的识别方法 |
FR3050601B1 (fr) * | 2016-04-26 | 2018-06-22 | Arkamys | Procede et systeme de diffusion d'un signal audio a 360° |
MC200186B1 (fr) * | 2016-09-30 | 2017-10-18 | Coronal Encoding | Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel |
US11252524B2 (en) * | 2017-07-05 | 2022-02-15 | Sony Corporation | Synthesizing a headphone signal using a rotating head-related transfer function |
RU2740703C1 (ru) | 2017-07-14 | 2021-01-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многослойного описания |
WO2019012131A1 (en) | 2017-07-14 | 2019-01-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | CONCEPT FOR GENERATING AN ENHANCED AUDIO FIELD DESCRIPTION OR A MODIFIED AUDIO FIELD DESCRIPTION USING A MULTIPOINT SOUND FIELD DESCRIPTION |
BR112020000779A2 (pt) | 2017-07-14 | 2020-07-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para gerar uma descrição de campo sonoro aprimorada, aparelho para gerar uma descrição de campo sonoro modificada a partir de uma descrição de campo sonoro e metadados com relação às informações espaciais da descrição de campo sonoro, método para gerar uma descrição de campo sonoro aprimorada, método para gerar uma descrição de campo sonoro modificada a partir de uma descrição de campo sonoro e metadados com relação às informações espaciais da descrição de campo sonoro, programa de computador e descrição de campo sonoro aprimorada. |
US10075802B1 (en) | 2017-08-08 | 2018-09-11 | Qualcomm Incorporated | Bitrate allocation for higher order ambisonic audio data |
US11281726B2 (en) * | 2017-12-01 | 2022-03-22 | Palantir Technologies Inc. | System and methods for faster processor comparisons of visual graph features |
US10419138B2 (en) | 2017-12-22 | 2019-09-17 | At&T Intellectual Property I, L.P. | Radio-based channel sounding using phased array antennas |
GB2572650A (en) * | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
KR20200141981A (ko) | 2018-04-16 | 2020-12-21 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 방향성 사운드 소스의 인코딩 및 디코딩을 위한 방법, 장치 및 시스템 |
WO2020008112A1 (en) * | 2018-07-03 | 2020-01-09 | Nokia Technologies Oy | Energy-ratio signalling and synthesis |
US20200402521A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Performing psychoacoustic audio coding based on operating conditions |
US11043742B2 (en) | 2019-07-31 | 2021-06-22 | At&T Intellectual Property I, L.P. | Phased array mobile channel sounding system |
WO2021091769A1 (en) * | 2019-11-04 | 2021-05-14 | Qualcomm Incorporated | Signalling of audio effect metadata in a bitstream |
WO2022096376A2 (en) * | 2020-11-03 | 2022-05-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio signal transformation |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594800A (en) | 1991-02-15 | 1997-01-14 | Trifield Productions Limited | Sound reproduction system having a matrix converter |
GB9103207D0 (en) | 1991-02-15 | 1991-04-03 | Gerzon Michael A | Stereophonic sound reproduction system |
AUPO099696A0 (en) | 1996-07-12 | 1996-08-08 | Lake Dsp Pty Limited | Methods and apparatus for processing spatialised audio |
US6021206A (en) | 1996-10-02 | 2000-02-01 | Lake Dsp Pty Ltd | Methods and apparatus for processing spatialised audio |
JPH1118199A (ja) | 1997-06-26 | 1999-01-22 | Nippon Columbia Co Ltd | 音響処理装置 |
EP1275272B1 (en) | 2000-04-19 | 2012-11-21 | SNK Tech Investment L.L.C. | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
FR2847376B1 (fr) * | 2002-11-19 | 2005-02-04 | France Telecom | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede |
US7167176B2 (en) | 2003-08-15 | 2007-01-23 | Microsoft Corporation | Clustered principal components for precomputed radiance transfer |
EP1743327A1 (en) | 2004-04-21 | 2007-01-17 | Dolby Laboratories Licensing Corporation | Audio bitstream format in which the bitstream syntax is described by an ordered transveral of a tree hierarchy data structure |
US20060247918A1 (en) | 2005-04-29 | 2006-11-02 | Microsoft Corporation | Systems and methods for 3D audio programming and processing |
FR2898725A1 (fr) | 2006-03-15 | 2007-09-21 | France Telecom | Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale |
US7589725B2 (en) | 2006-06-30 | 2009-09-15 | Microsoft Corporation | Soft shadows in dynamic scenes |
FR2916079A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
BRPI1009648B1 (pt) * | 2009-06-24 | 2020-12-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | decodificador de sinal de áudio, método para decodificador um sinal de áudio e programa de computador com o uso de etapas de processamento de objeto de áudio em cascata |
US9493834B2 (en) * | 2009-07-29 | 2016-11-15 | Pharnext | Method for detecting a panel of biomarkers |
EP2539892B1 (fr) * | 2010-02-26 | 2014-04-02 | Orange | Compression de flux audio multicanal |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
CN102333265B (zh) | 2011-05-20 | 2014-02-19 | 南京大学 | 一种基于连续声源概念的三维局部空间声场重放方法 |
EP2541547A1 (en) | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
JP5926377B2 (ja) * | 2011-07-01 | 2016-05-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サンプルレートスケーラブル可逆オーディオコーディング |
TW202339510A (zh) * | 2011-07-01 | 2023-10-01 | 美商杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
EP2898506B1 (en) | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9685163B2 (en) | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
-
2014
- 2014-02-27 US US14/192,829 patent/US9685163B2/en active Active
- 2014-02-27 US US14/192,819 patent/US9959875B2/en active Active
- 2014-02-28 EP EP14711375.7A patent/EP2962297B1/en active Active
- 2014-02-28 HU HUE14713289A patent/HUE045446T2/hu unknown
- 2014-02-28 WO PCT/US2014/019468 patent/WO2014134472A2/en active Application Filing
- 2014-02-28 BR BR112015020892A patent/BR112015020892A2/pt not_active IP Right Cessation
- 2014-02-28 CN CN201480011287.6A patent/CN105027200B/zh active Active
- 2014-02-28 KR KR1020157026859A patent/KR20150123310A/ko not_active Application Discontinuation
- 2014-02-28 WO PCT/US2014/019446 patent/WO2014134462A2/en active Application Filing
- 2014-02-28 JP JP2015560355A patent/JP2016513811A/ja active Pending
- 2014-02-28 EP EP14713289.8A patent/EP2962298B1/en active Active
- 2014-02-28 KR KR1020157026860A patent/KR101854964B1/ko active IP Right Grant
- 2014-02-28 ES ES14713289T patent/ES2738490T3/es active Active
- 2014-02-28 CN CN201480011198.1A patent/CN105027199B/zh active Active
- 2014-02-28 JP JP2015560352A patent/JP2016510905A/ja not_active Ceased
- 2014-03-03 TW TW103107128A patent/TWI603631B/zh not_active IP Right Cessation
- 2014-03-03 TW TW103107142A patent/TWI583210B/zh not_active IP Right Cessation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016513811A5 (ja) | ||
KR101854964B1 (ko) | 구면 조화 계수들의 변환 | |
US10249312B2 (en) | Quantization of spatial vectors | |
TWI612517B (zh) | 較高階立體混響聲(hoa)架構中於預測及非預測量化技術間切換 | |
JP6062544B2 (ja) | 基底関数係数を使用した3次元オーディオコード化のためのシステム、方法、装置、およびコンピュータ可読媒体 | |
JP2016523467A5 (ja) | ||
US9961475B2 (en) | Conversion from object-based audio to HOA | |
CN108780647B (zh) | 用于音频信号译码的方法和设备 | |
CN108141688B (zh) | 从以信道为基础的音频到高阶立体混响的转换 | |
JP2023551040A (ja) | オーディオの符号化及び復号方法及び装置 |