JP2016513811A5 - - Google Patents

Download PDF

Info

Publication number
JP2016513811A5
JP2016513811A5 JP2015560355A JP2015560355A JP2016513811A5 JP 2016513811 A5 JP2016513811 A5 JP 2016513811A5 JP 2015560355 A JP2015560355 A JP 2015560355A JP 2015560355 A JP2015560355 A JP 2015560355A JP 2016513811 A5 JP2016513811 A5 JP 2016513811A5
Authority
JP
Japan
Prior art keywords
sound field
hierarchical elements
bitstream
information
describing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015560355A
Other languages
English (en)
Other versions
JP2016513811A (ja
Filing date
Publication date
Priority claimed from US14/192,829 external-priority patent/US9685163B2/en
Application filed filed Critical
Publication of JP2016513811A publication Critical patent/JP2016513811A/ja
Publication of JP2016513811A5 publication Critical patent/JP2016513811A5/ja
Pending legal-status Critical Current

Links

Claims (60)

  1. 音場について説明する複数の階層的な要素からなるビットストリームを生成する方法であって、
    デバイスに結合されたマイクロフォンを介して、前記複数の階層的な要素を表すオーディオデータを捕捉することと、
    前記デバイスが、および前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行することと、
    前記デバイスが、前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定することと、
    前記デバイスが、前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定することと
    を備える、方法。
  2. 前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
    ここにおいて、前記変換情報を指定することが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。
  3. 前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を平行移動させることを備え、
    ここにおいて、前記変換情報を指定することが、前記音場がどのように平行移動されたかについて説明する平行移動情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。
  4. 前記線形可逆変換を実行することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を変換することを備える、請求項1に記載の方法。
  5. 前記線形可逆変換を実行することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
    ここにおいて、前記変換情報を指定することが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。
  6. 前記線形可逆変換を実行することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させることを備え、
    ここにおいて、前記変換情報を指定することが、回転情報としてオイラー角を前記ビットストリーム内で指定することを備える、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、請求項1に記載の方法。
  7. 前記線形可逆変換を実行することが、
    第1の方位角角度と第1の仰角角度に従って前記音場を回転させるために前記音場に対して第1の回転演算を実行することと、
    前記音場について説明するのに関連する情報を提供する前記第1の方位角角度と前記第1の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第1の数を決定することと、
    第2の方位角角度および第2の仰角角度に従って前記音場を回転させるために前記音場に対して第2の回転演算を実行することと、
    前記音場について説明するのに関連する情報を提供する前記第2の方位角角度および前記第2の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第2の数を決定することと、
    前記複数の階層的な要素の前記第1の数と前記複数の階層的な要素の前記第2の数の比較に基づいて前記第1の回転演算または前記第2の回転演算を選択することと
    を備える、請求項1に記載の方法。
  8. 前記線形可逆変換を実行することが、
    第1の持続時間にわたって前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために、前記第1の持続時間にわたって前記音場を回転させることと、
    前記ビットストリーム内で、前記第1の持続時間にわたって前記音場がどのように回転されたかについて説明する第1の回転情報を指定することと、
    前記第1の回転情報に基づいて第2の持続時間の前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の前記数を減少させるために、前記第2の持続時間にわたって前記音場を回転させることと、
    前記ビットストリーム内で、前記第2の持続時間にわたって前記音場がどのように回転されたかについて説明する第2の回転情報を指定することと
    を備える、請求項1に記載の方法。
  9. 前記線形可逆変換を実行することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素に対してベクトルベースの分解を実行することを備え、
    ここにおいて、前記変換情報を指定することが、前記ベクトルベースの分解が前記複数の球面調和係数に対して実行されたことについて説明する情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。
  10. 前記ベクトルベースの分解を実行することが、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を実行することを備える、請求項9に記載の方法。
  11. 前記線形可逆変換を実行することが、前記階層的な要素の前記数を減少させるように前記複数の階層的な要素を球面調和関数領域から別の領域に変換することを備え、
    ここにおいて、前記変換情報を指定することが、複数の階層的な要素が前記球面調和関数領域から前記別の領域に変換されたことを示す情報を前記ビットストリーム内で指定することを備える、請求項1に記載の方法。
  12. 変換された球面調和係数の少なくとも1つのサブセットにビットレートを、前記変換された球面調和係数の前記サブセットが対応する球面基底関数の次数および副次数のうち1つまたは複数に基づいて割り当てることをさらに備え、前記変換された球面調和係数が、音場を変換する変換演算に従って変換された、請求項1に記載の方法。
  13. 前記ビットレートを割り当てることが、前記変換された球面調和係数の各々が対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、前記変換された球面調和係数の異なるサブセットに異なるビットレートを窓関数に従って割り当てることを備える、請求項12に記載の方法。
  14. 前記窓関数が、ハニング窓関数、ハミング窓関数、矩形窓関数、および三角形窓関数のうち1つまたは複数を備える、請求項13に記載の方法。
  15. 第1のビットレートを使用する前記変換された球面調和係数の第1のサブセットと第2のビットレートを使用する前記変換された球面調和係数の第2のサブセットとを前記ビットストリーム内で指定することをさらに備える、請求項12に記載の方法。
  16. 前記ビットレートを割り当てることが、前記変換された球面調和係数が対応する前記球面基底関数の前記副次数がゼロから遠ざかるにつれて徐々に減少するビットレートを動的に割り当てることを備える、請求項12に記載の方法。
  17. 前記ビットレートを割り当てることが、前記変換された球面調和係数が対応する前記球面基底関数の前記次数が増加するにつれて徐々に減少するビットレートを動的に割り当てることを備える、請求項12に記載の方法。
  18. 前記ビットレートを割り当てることが、前記変換された球面調和係数の前記サブセットが対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、変換された球面調和係数の異なるサブセットに異なるビットレートを動的に割り当てることを備える、請求項12に記載の方法。
  19. 音場について説明する複数の階層的な要素からなるビットストリームを生成するように構成されたデバイスであって、
    前記複数の階層的な要素を表すオーディオデータを捕捉するように構成されたマイクロフォンと、
    前記複数の階層的な要素を記憶するように構成されたメモリと、
    前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行することに少なくとも部分的によって前記複数の階層的な要素を符号化することと
    前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定し、前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定することと
    を行うように構成された1つまたは複数のプロセッサ
    を備える、デバイス。
  20. 前記1つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。
  21. 前記1つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を平行移動させるように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、前記音場がどのように平行移動されたかについて説明する平行移動情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。
  22. 前記1つまたは複数のプロセッサが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場に対して前記線形可逆変換を実行するように構成される、請求項19に記載のデバイス。
  23. 前記1つまたは複数のプロセッサが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、前記音場がどのように回転されたかについて説明する回転情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。
  24. 前記1つまたは複数のプロセッサが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場を回転させるように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、回転情報としてオイラー角を前記ビットストリーム内で指定するように構成され、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、請求項19に記載のデバイス。
  25. 前記1つまたは複数のプロセッサが、第1の方位角角度と第1の仰角角度に従って前記音場を回転させるために前記音場に対して第1の回転演算を実行し、前記音場について説明するのに関連する情報を提供する前記第1の方位角角度と前記第1の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第1の数を決定し、第2の方位角角度および第2の仰角角度に従って前記音場を回転させるために前記音場に対して第2の回転演算を実行し、前記音場について説明するのに関連する情報を提供する前記第2の方位角角度および前記第2の仰角角度に従って回転された前記音場を表す前記複数の階層的な要素の第2の数を決定し、前記複数の階層的な要素の前記第1の数と前記複数の階層的な要素の前記第2の数の比較に基づいて前記第1の回転演算または前記第2の回転演算を選択するように構成される、請求項19に記載のデバイス。
  26. 前記1つまたは複数のプロセッサが、第1の持続時間にわたって前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために、前記第1の持続時間にわたって前記音場を回転させ、前記ビットストリーム内で、前記第1の持続時間にわたって前記音場がどのように回転されたかについて説明する第1の回転情報を指定し、前記第1の回転情報に基づいて第2の持続時間の前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の前記数を減少させるために、前記第2の持続時間にわたって前記音場を回転させ、前記ビットストリーム内で、前記第2の持続時間にわたって前記音場がどのように回転されたかについて説明する第2の回転情報を指定するように構成される、請求項19に記載のデバイス。
  27. 前記1つまたは複数のプロセッサが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素に対してベクトルベースの分解を実行するように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、前記ベクトルベースの分解が前記複数の球面調和係数に対して実行されたことについて説明する情報を前記ビットストリーム内で指定するように構成される、請求項19に記載のデバイス。
  28. 前記1つまたは複数のプロセッサが、前記ベクトルベースの分解を実行するとき、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を実行するように構成される、請求項27に記載のデバイス。
  29. 前記1つまたは複数のプロセッサが、前記階層的な要素の前記数を減少させるように前記複数の階層的な要素を球面調和関数領域から別の領域に変換するように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、複数の階層的な要素が前記球面調和関数領域から前記別の領域に変換されたことを示す情報を前記ビットストリーム内で指定するように構成される、請求項27に記載のデバイス。
  30. 前記1つまたは複数のプロセッサが、変換された球面調和係数の少なくとも1つのサブセットにビットレートを、前記変換された球面調和係数の前記サブセットが対応する球面基底関数の次数および副次数のうち1つまたは複数に基づいて割り当てるようにさらに構成され、前記変換された球面調和係数が、音場を変換する変換演算に従って変換された、請求項19に記載のデバイス。
  31. 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数の各々が対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、前記変換された球面調和係数の異なるサブセットに異なるビットレートを窓関数に従って割り当てるように構成される、請求項30に記載のデバイス。
  32. 前記窓関数が、ハニング窓関数、ハミング窓関数、矩形窓関数、および三角形窓関数のうち1つまたは複数を備える、請求項31に記載のデバイス。
  33. 前記1つまたは複数のプロセッサが、第1のビットレートを使用する前記変換された球面調和係数の第1のサブセットと第2のビットレートを使用する前記変換された球面調和係数の第2のサブセットとを前記ビットストリーム内で指定するようにさらに構成される、請求項30に記載のデバイス。
  34. 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数が対応する前記球面基底関数の前記副次数がゼロから遠ざかるにつれて徐々に減少するビットレートを動的に割り当てるように構成される、請求項30に記載のデバイス。
  35. 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数が対応する前記球面基底関数の前記次数が増加するにつれて徐々に減少するビットレートを動的に割り当てるように構成される、請求項30に記載のデバイス。
  36. 前記1つまたは複数のプロセッサが、前記ビットレートを割り当てるとき、前記変換された球面調和係数の前記サブセットが対応する前記球面基底関数の前記次数および前記副次数のうち1つまたは複数に基づいて、変換された球面調和係数の異なるサブセットに異なるビットレートを動的に割り当てるように構成される、請求項30に記載のデバイス。
  37. 音場について説明する複数の階層的な要素からなるビットストリームを生成するように構成されたデバイスであって、
    前記複数の階層的な要素を表すオーディオデータを捕捉するための手段と、
    前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行するための手段と、
    前記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定するための手段と、
    前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定するための手段と
    を備える、デバイス。
  38. 実行されると、1つまたは複数のプロセッサに、
    音場を表す複数の階層的な要素を表すオーディオデータを捕捉するためにマイクロフォンとインターフェースを取らせ、
    前記複数の階層的な要素を符号化するために、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場に対して線形可逆変換を実行させ、
    前記音場がどのように変換されたかについて説明する変換情報をビットストリーム内で指定させ、
    前記ビットストリーム内の前記複数の階層的な要素の前記減少される数を指定させる命令をその上に記憶させた非一時的なコンピュータ可読記憶媒体。
  39. 音場について説明する複数の階層的な要素からなるビットストリームを処理する方法であって、
    1つまたは複数のラウドスピーカーに結合されたデバイスが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析することと、前記変換が、線形可逆変換を備える
    前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記デバイスが、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換することと
    前記デバイスが、前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングすることと、
    前記デバイスが、前記1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のスピーカーフィードを出力することと
    を備える、方法。
  40. 前記変換情報を決定するために前記ビットストリームを解析することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析することを備え、
    前記音場を変換することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させることを備える、請求項39に記載の方法。
  41. 前記変換情報を決定するために前記ビットストリームを解析することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように平行移動されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
    ここにおいて、前記音場を変換することが、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記平行移動を逆にするために前記平行移動情報に基づいて前記音場を平行移動させることを備える、請求項39に記載の方法。
  42. 前記変換情報を決定するために前記ビットストリームを解析することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析することを備え、
    前記音場を変換することが、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換することを備える、請求項39に記載の方法。
  43. 前記変換情報を決定するために前記ビットストリームを解析することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析することを備え、
    ここにおいて、前記音場を変換することが、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させることを備える、請求項39に記載の方法。
  44. 変換情報を決定するために前記ビットストリームを解析することが、オイラー角を含む回転情報を決定するために前記ビットストリームを解析することを備え、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、
    ここにおいて、前記音場を変換することが、閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記オイラー角に基づいて前記音場を回転させることを備える、請求項39に記載の方法。
  45. 前記変換情報を決定するために前記ビットストリームを解析することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素がどのようにベクトルベースの分解を使用して分解されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
    ここにおいて、前記音場を変換することが、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記ベクトルベース分解された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備える、請求項39に記載の方法。
  46. 前記ベクトルベースの分解が、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を備える、請求項45に記載の方法。
  47. 前記変換情報を決定するために前記ビットストリームを解析することが、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素が球面調和関数領域から別の領域にどのように変換されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析することを備え、
    ここにおいて、前記音場を変換することが、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備える、請求項39に記載の方法。
  48. 音場について説明する複数の階層的な要素からなるビットストリームを処理するように構成されたデバイスであって、
    前記ビットストリームの少なくとも一部分を記憶するように構成されたメモリと、
    前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析し、前記変換が、線形可逆変換を備え、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換し、前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングするように構成された1つまたは複数のプロセッサと、
    前記1つまたは複数のスピーカーフィードに基づいて前記音場を再現するように構成された1つまたは複数のラウドスピーカーと
    を備える、デバイス。
  49. 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、
    前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させるようにさらに構成される、請求項48に記載のデバイス。
  50. 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように平行移動されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するようにさらに構成され、
    前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記平行移動を逆にするために前記平行移動情報に基づいて前記音場を平行移動させるようにさらに構成される、請求項48に記載のデバイス。
  51. 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析するようにさらに構成され、
    前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換するようにさらに構成される、請求項48に記載のデバイス。
  52. 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素の数を減少させるために前記音場がどのように回転されたかについて説明する回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、
    前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記回転を逆にするために前記回転情報に基づいて前記音場を回転させるようにさらに構成される、請求項48に記載のデバイス。
  53. 前記1つまたは複数のプロセッサが、変換情報を決定するために前記ビットストリームを解析するとき、オイラー角を含む回転情報を決定するために前記ビットストリームを解析するようにさらに構成され、ここにおいて、前記オイラー角が、前記音場がどのように回転されたかについて説明する、
    ここにおいて、前記1つまたは複数のプロセッサが、前記音場を変換するとき、閾値を上回る非ゼロ値を有する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記オイラー角に基づいて前記音場を回転させるようにさらに構成される、請求項48に記載のデバイス。
  54. 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素がどのようにベクトルベースの分解を使用して分解されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、前記音場を変換するとき、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記ベクトルベース分解された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築するように構成される、請求項48に記載のデバイス。
  55. 前記ベクトルベースの分解が、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を備える、請求項54に記載のデバイス。
  56. 前記1つまたは複数のプロセッサが、前記変換情報を決定するために前記ビットストリームを解析するとき、前記複数の階層的な要素の数を減少させるために前記複数の階層的な要素が球面調和関数領域から他の領域にどのように変換されたかについて説明する平行移動情報を決定するために前記ビットストリームを解析するように構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、前記音場を変換することが備えるとき、前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換された複数の階層的な要素に基づいて前記複数の階層的な要素を再構築することを備えるように構成される、請求項54に記載のデバイス。
  57. 音場について説明する複数の階層的な要素からなるビットストリームを処理するように構成されたデバイスであって、
    前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するために前記ビットストリームを解析するための手段と、前記変換が、線形可逆変換を備える
    前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記複数の階層的な要素を復号するために前記音場を再現するとき、前記複数の階層的な要素の前記数を減少させるように実行された前記変換を逆にするために前記変換情報に基づいて前記音場を変換するための手段と
    前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングするための手段と、
    1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のスピーカーフィードを出力するための手段と
    を備える、デバイス
  58. 実行されると、1つまたは複数のプロセッサに、
    音場について説明するのに関連する情報を提供する複数の階層的な要素の数を減少させるために前記音場がどのように変換されたかについて説明する変換情報を決定するためにビットストリームを解析させ、前記変換が、線形可逆変換を備える、
    前記音場について説明するのに関連する情報を提供する前記複数の階層的な要素のものに基づいて前記音場を再現するとき、前記変換情報に基づいて前記複数の階層的な要素を復号するために前記音場を変換させ
    前記複数の階層的な要素を1つまたは複数のスピーカーフィードにレンダリングさせ、
    1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のスピーカーフィードを出力させる命令をその上に記憶させた非一時的なコンピュータ可読記憶媒体。
  59. 音場について説明する複数の階層的な要素からなるビットストリームを生成する方法であって、
    デバイスに結合されたマイクロフォンが、前記複数の階層的な要素を表すオーディオデータを捕捉することと、
    前記デバイスが、前記複数の階層的な要素の数を減少させるように前記複数の階層的な要素に対してベクトルベースの変換を実行することと
    記音場がどのように変換されたかについて説明する変換情報を前記ビットストリーム内で指定することと
    を備える、方法。
  60. 前記ベクトルベースの変換を実行することが、特異値分解(SVD)、主成分分析(PCA)、およびカルーネン−レーベ変換(KLT)のうち1つまたは複数を前記複数の階層的な要素に対して実行することを備える、請求項59に記載の方法。
JP2015560355A 2013-03-01 2014-02-28 変換球面調和係数 Pending JP2016513811A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361771677P 2013-03-01 2013-03-01
US61/771,677 2013-03-01
US201361860201P 2013-07-30 2013-07-30
US61/860,201 2013-07-30
US14/192,829 2014-02-27
US14/192,829 US9685163B2 (en) 2013-03-01 2014-02-27 Transforming spherical harmonic coefficients
PCT/US2014/019468 WO2014134472A2 (en) 2013-03-01 2014-02-28 Transforming spherical harmonic coefficients

Publications (2)

Publication Number Publication Date
JP2016513811A JP2016513811A (ja) 2016-05-16
JP2016513811A5 true JP2016513811A5 (ja) 2017-08-31

Family

ID=51420957

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015560355A Pending JP2016513811A (ja) 2013-03-01 2014-02-28 変換球面調和係数
JP2015560352A Ceased JP2016510905A (ja) 2013-03-01 2014-02-28 ビットストリームにおける球面調和係数および/または高次アンビソニックス係数の指定

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015560352A Ceased JP2016510905A (ja) 2013-03-01 2014-02-28 ビットストリームにおける球面調和係数および/または高次アンビソニックス係数の指定

Country Status (10)

Country Link
US (2) US9685163B2 (ja)
EP (2) EP2962297B1 (ja)
JP (2) JP2016513811A (ja)
KR (2) KR20150123310A (ja)
CN (2) CN105027200B (ja)
BR (1) BR112015020892A2 (ja)
ES (1) ES2738490T3 (ja)
HU (1) HUE045446T2 (ja)
TW (2) TWI603631B (ja)
WO (2) WO2014134472A2 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9685163B2 (en) 2013-03-01 2017-06-20 Qualcomm Incorporated Transforming spherical harmonic coefficients
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
US9854377B2 (en) 2013-05-29 2017-12-26 Qualcomm Incorporated Interpolation for decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9384741B2 (en) * 2013-05-29 2016-07-05 Qualcomm Incorporated Binauralization of rotated higher order ambisonics
WO2014195190A1 (en) * 2013-06-05 2014-12-11 Thomson Licensing Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
CN107112024B (zh) * 2014-10-24 2020-07-14 杜比国际公司 音频信号的编码和解码
US10452651B1 (en) 2014-12-23 2019-10-22 Palantir Technologies Inc. Searching charts
CN104795064B (zh) * 2015-03-30 2018-04-13 福州大学 低信噪比声场景下声音事件的识别方法
FR3050601B1 (fr) * 2016-04-26 2018-06-22 Arkamys Procede et systeme de diffusion d'un signal audio a 360°
MC200186B1 (fr) * 2016-09-30 2017-10-18 Coronal Encoding Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel
US11252524B2 (en) * 2017-07-05 2022-02-15 Sony Corporation Synthesizing a headphone signal using a rotating head-related transfer function
RU2740703C1 (ru) 2017-07-14 2021-01-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многослойного описания
WO2019012131A1 (en) 2017-07-14 2019-01-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. CONCEPT FOR GENERATING AN ENHANCED AUDIO FIELD DESCRIPTION OR A MODIFIED AUDIO FIELD DESCRIPTION USING A MULTIPOINT SOUND FIELD DESCRIPTION
BR112020000779A2 (pt) 2017-07-14 2020-07-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para gerar uma descrição de campo sonoro aprimorada, aparelho para gerar uma descrição de campo sonoro modificada a partir de uma descrição de campo sonoro e metadados com relação às informações espaciais da descrição de campo sonoro, método para gerar uma descrição de campo sonoro aprimorada, método para gerar uma descrição de campo sonoro modificada a partir de uma descrição de campo sonoro e metadados com relação às informações espaciais da descrição de campo sonoro, programa de computador e descrição de campo sonoro aprimorada.
US10075802B1 (en) 2017-08-08 2018-09-11 Qualcomm Incorporated Bitrate allocation for higher order ambisonic audio data
US11281726B2 (en) * 2017-12-01 2022-03-22 Palantir Technologies Inc. System and methods for faster processor comparisons of visual graph features
US10419138B2 (en) 2017-12-22 2019-09-17 At&T Intellectual Property I, L.P. Radio-based channel sounding using phased array antennas
GB2572650A (en) * 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
KR20200141981A (ko) 2018-04-16 2020-12-21 돌비 레버러토리즈 라이쎈싱 코오포레이션 방향성 사운드 소스의 인코딩 및 디코딩을 위한 방법, 장치 및 시스템
WO2020008112A1 (en) * 2018-07-03 2020-01-09 Nokia Technologies Oy Energy-ratio signalling and synthesis
US20200402521A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Performing psychoacoustic audio coding based on operating conditions
US11043742B2 (en) 2019-07-31 2021-06-22 At&T Intellectual Property I, L.P. Phased array mobile channel sounding system
WO2021091769A1 (en) * 2019-11-04 2021-05-14 Qualcomm Incorporated Signalling of audio effect metadata in a bitstream
WO2022096376A2 (en) * 2020-11-03 2022-05-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio signal transformation

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594800A (en) 1991-02-15 1997-01-14 Trifield Productions Limited Sound reproduction system having a matrix converter
GB9103207D0 (en) 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
AUPO099696A0 (en) 1996-07-12 1996-08-08 Lake Dsp Pty Limited Methods and apparatus for processing spatialised audio
US6021206A (en) 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
JPH1118199A (ja) 1997-06-26 1999-01-22 Nippon Columbia Co Ltd 音響処理装置
EP1275272B1 (en) 2000-04-19 2012-11-21 SNK Tech Investment L.L.C. Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7167176B2 (en) 2003-08-15 2007-01-23 Microsoft Corporation Clustered principal components for precomputed radiance transfer
EP1743327A1 (en) 2004-04-21 2007-01-17 Dolby Laboratories Licensing Corporation Audio bitstream format in which the bitstream syntax is described by an ordered transveral of a tree hierarchy data structure
US20060247918A1 (en) 2005-04-29 2006-11-02 Microsoft Corporation Systems and methods for 3D audio programming and processing
FR2898725A1 (fr) 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US7589725B2 (en) 2006-06-30 2009-09-15 Microsoft Corporation Soft shadows in dynamic scenes
FR2916079A1 (fr) * 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
BRPI1009648B1 (pt) * 2009-06-24 2020-12-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V decodificador de sinal de áudio, método para decodificador um sinal de áudio e programa de computador com o uso de etapas de processamento de objeto de áudio em cascata
US9493834B2 (en) * 2009-07-29 2016-11-15 Pharnext Method for detecting a panel of biomarkers
EP2539892B1 (fr) * 2010-02-26 2014-04-02 Orange Compression de flux audio multicanal
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
EP2450880A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
CN102333265B (zh) 2011-05-20 2014-02-19 南京大学 一种基于连续声源概念的三维局部空间声场重放方法
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
JP5926377B2 (ja) * 2011-07-01 2016-05-25 ドルビー ラボラトリーズ ライセンシング コーポレイション サンプルレートスケーラブル可逆オーディオコーディング
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2898506B1 (en) 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9685163B2 (en) 2013-03-01 2017-06-20 Qualcomm Incorporated Transforming spherical harmonic coefficients

Similar Documents

Publication Publication Date Title
JP2016513811A5 (ja)
KR101854964B1 (ko) 구면 조화 계수들의 변환
US10249312B2 (en) Quantization of spatial vectors
TWI612517B (zh) 較高階立體混響聲(hoa)架構中於預測及非預測量化技術間切換
JP6062544B2 (ja) 基底関数係数を使用した3次元オーディオコード化のためのシステム、方法、装置、およびコンピュータ可読媒体
JP2016523467A5 (ja)
US9961475B2 (en) Conversion from object-based audio to HOA
CN108780647B (zh) 用于音频信号译码的方法和设备
CN108141688B (zh) 从以信道为基础的音频到高阶立体混响的转换
JP2023551040A (ja) オーディオの符号化及び復号方法及び装置