JP7229218B2 - データ・ストリームを形成するための方法、媒体、システム - Google Patents
データ・ストリームを形成するための方法、媒体、システム Download PDFInfo
- Publication number
- JP7229218B2 JP7229218B2 JP2020190599A JP2020190599A JP7229218B2 JP 7229218 B2 JP7229218 B2 JP 7229218B2 JP 2020190599 A JP2020190599 A JP 2020190599A JP 2020190599 A JP2020190599 A JP 2020190599A JP 7229218 B2 JP7229218 B2 JP 7229218B2
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- transform
- base signal
- audio
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
本願は2015年8月25日に出願された米国仮出願第62/209,742号および2015年10月8日に出願された欧州特許出願第15189008.4号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
本発明は信号処理の分野に関し、特に、空間化成分をもつオーディオ信号の効率的な伝送のためのシステムを開示する。
ステレオ、マルチチャネルまたはオブジェクト・ベースのコンテンツがヘッドフォンで再生されるとき、頭部インパルス応答(HRIR)または両耳室内インパルス応答(BRIR)によってマルチチャネル・スピーカー・セットアップまたは一組の離散的な仮想音響オブジェクトをシミュレートすることが望ましいことがしばしばある。HRIRおよびBRIRは、それぞれ(シミュレートされた)無響環境または反響環境における、各ラウドスピーカーから鼓膜までの音響経路をシミュレートする。
計算量は、コンテンツ・オーサリング、配送および再生に関わるエコシステム内でのチャネルまたはオブジェクト・ベースのコンテンツの送達のための唯一の問題ではない。多くの実際的な状況では、特にモバイル用途については、コンテンツ送達のために利用可能なデータ・レートは厳しい制約を受ける。消費者、放送局およびコンテンツ提供者は、48から192kbits/sの間の典型的なビットレートをもつ不可逆な知覚的オーディオ・コーデックを使ってステレオ(二チャネル)オーディオ・コンテンツを送達してきた。これらの通常のチャネル・ベースのオーディオ・コーデック、たとえばMPEG-1レイヤー3(非特許文献6)、MPEG AAC(非特許文献7)およびドルビー・デジタル(非特許文献8)は、チャネル数とともにほぼ線形にスケールするビットレートをもつ。結果として、何十またさらには何百ものオブジェクトの送達は、非実際的な、またさらには消費者送達目的のためには利用可能でないビットレートにつながる。
オブジェクトおよび/またはチャネル再構成30は、時間および周波数によって変化する行列演算によって達成できる。デコードされた基本信号35をzs[n]と記し、sは基本信号インデックス、nはサンプル・インデックスとすると、第一段階は典型的には、変換またはフィルタバンクによる基本信号の変換を含む。
基本信号Zs[k,b]の集合からオブジェクトまたはチャネルを再構成するためには種々の戦略および方法が存在するが、一つの具体的な方法は、しばしば最小平均平方誤差(MMSE: minimum mean square error)予測器と称される。これは、所望される信号と再構成される信号との間のL2ノルムを最小にする行列係数Mを導出するために相関および共分散行列を使う。この方法のためには、基本信号zs[n]はエンコーダのダウンミックス器24において、入力オブジェクトまたはチャネル信号xi[n]の線形結合として生成される。
ここで、εは正則化定数であり、*は複素共役転置演算子である。この演算は、各パラメータ・バンドbについて独立に実行されて、行列M[p(b)]を生じることができる。
オブジェクトおよび/またはチャネルの再構成のほか、パラメトリック技法は、ある表現を別の表現に変換するために使用できる。そのような表現変換の例は、ラウドスピーカー再生のために意図されたステレオ混合をヘッドフォンのためのバイノーラル表現に変換したり、その逆の変換をしたりするために使用できる。
Y=XH
と書く場合、行列係数Mはエンコーダ52において、
M=(G*X*XG+εI)-1G*X*XH
によって得ることができる。
用途およびオブジェクトまたはチャネルのどちらが再構成されるかに依存して、図3のフィルタバンク・ユニット41のための変換またはフィルタバンク周波数分解能に対してある種の要件が課されることがある。たいていの実際的な用途では、所与のビットレート(パラメータの数によって決まる)および計算量について最良の知覚されるオーディオ品質を与えるために、周波数分解能は人間の聴覚系の想定される分解能に合わせられる。人間の聴覚系は非線形な周波数分解能をもつフィルタバンクと考えられることがわかっている。これらのフィルタは臨界帯域と称され(非特許文献9)、ほぼ対数的な性質である。低周波数では、臨界帯域は100Hzより小さい幅であり、一方、高周波数では、臨界帯域は1kHzより広いことがある。
図4に戻ると、従来技術は、チャネル、オブジェクトまたは呈示信号〔^付きのYJ〕を基本信号Zsの集合から再構成するために、可能性としては脱相関器の使用により補強された、行列処理62の概念を利用していることがわかる。これは、従来技術を一般的な仕方で記述する次の行列定式化につながる。
図7は、ある実施形態に基づく例示的なエンコーダ・フィルタバンクおよびパラメータ・マッピング・システムを示している(90)。この例示的実施形態90では、8個のサブバンド(b=1,…,8)、たとえば91が、初期にハイブリッド(カスケード式)フィルタバンク92およびナイキスト・フィルタバンク93によって生成される。その後、畳み込み行列M[k,p=1]を計算するために、最初の四つのサブバンドが同一のパラメータ・バンド(p=1)にマッピングされる(94)。たとえば、行列は今、追加的なインデックスkをもつ。残りのサブバンド(b=5,…,8)は、ステートレスな行列M[p(b)]95、96を使うことによって、パラメータ・バンド(p=2,3)にマッピングされる。
図8は、対応する例示的デコーダ・フィルタバンクおよびパラメータ・マッピング・システム100を示している。エンコーダとは対照的に、ナイキスト・フィルタバンクは存在せず、ナイキスト・フィルタバンク遅延を補償するための遅延も全くない。デコーダ分解フィルタバンク101は5個のサブバンド(b=1,…,5)、たとえば102のみを生成する。これらは因子Qによってダウンサンプリングされる。最初のサブバンドは畳み込み行列M[k,p=1] 103によって処理され、一方、残りのバンドは従来技術に従ってステートレスな行列104、105によって処理される。
特に有用な一つの実施形態は、ラウドスピーカー呈示のバイノーラル呈示への変換におけるものである。図9は、呈示変換のための提案される方法を使うエンコーダ110を示している。入力チャネルまたはオブジェクトxi[n]の集合がまずフィルタバンク111を使って変換される。フィルタバンク111はハイブリッド複素直交ミラーバンク(HCQMF)であるが、他のフィルタバンク構造も等しく使用できる。結果として得られるサブバンド表現Xi[k,b]は二度処理される(112、113)。
M=(Z*Z+εI)-1Z*Y
によって与えられる。この定式化では、行列Zはタップのある遅延線のすべての入力を含む。
図10は、デコーダ120の実施形態を示している。入力ビットストリーム121は基本信号ビットストリーム131と変換パラメータ・データ124に分割される。その後、基本信号デコーダ123は基本信号z[n]をデコードする。それはその後、分解フィルタバンク125によって処理される。サブバンドb=1,…,5をもつ、結果として得られる周波数領域信号Z[k,b]は、行列乗算ユニット126、129および130によって処理される。具体的には、行列乗算ユニット126は複素数値の畳み込み行列M[k,p=1]を周波数領域信号Z[k,b=1]に適用する。さらに、行列乗算ユニット129は複素数値の単一タップの行列係数M[p=2]を信号Z[k,b=2]に適用する。最後に、行列乗算ユニット130は実数値の行列係数M[p=3]を周波数領域信号Z[k,b=3,…5]に適用する。行列乗算ユニット出力信号は、合成フィルタバンク127によって時間領域出力128に変換される。z[n]、Z[k]などへの言及は、いかなる特定の基本信号でもなく、基本信号の集合を指す。よって、z[n]、Z[k]などはzs[n]、Zs[k]などとして解釈されてもよい。ここで、0≦s<Nであり、Nは基本信号の数である。
本明細書を通じて「一つの実施形態」「いくつかの実施形態」または「ある実施形態」への言及は、その実施形態との関連で記述されている特定の特徴、構造または特性が本発明の少なくとも一つの実施形態に含まれることを意味する。よって、本明細書を通じた随所に「一つの実施形態では」「いくつかの実施形態では」または「ある実施形態では」という句が現われるのは、同じ実施形態を指すこともあれば、必ずしもそうでないこともある。さらに、具体的な特徴、構造または特性は、一つまたは複数の実施形態において本開示から当業者に明白であろう任意の好適な仕方で組み合わされてもよい。
〔EEE1〕
オーディオ・チャネルまたはオブジェクトの第二の呈示をデータ・ストリームとして表現するための方法であって:
(a)前記オーディオ・チャネルまたはオブジェクトの第一の呈示を表わす基本信号の集合を提供する段階と;
(b)前記第一の呈示を前記第二の呈示に変換することを意図されている変換パラメータの集合を提供する段階とを含み、前記変換パラメータはさらに、少なくとも二つの周波数帯域について指定され、前記周波数帯域のうち少なくとも一つのためのマルチタップ畳み込み行列パラメータの集合を含む、
方法。
〔EEE2〕
フィルタ係数の前記集合は、有限インパルス応答(FIR)フィルタを表わす、EEE1記載の方法。
〔EEE3〕
基本信号の前記集合は、一連の時間的セグメントに分割され、それぞれの時間的セグメントについて、変換パラメータの集合が提供される、EEE1または2記載の方法。
〔EEE4〕
前記フィルタ係数は、複素数値である少なくとも一つの係数を含む、EEE1ないし3のうちいずれか一項記載の方法。
〔EEE5〕
前記第一の呈示または前記第二の呈示は、ヘッドフォン再生のために意図される、EEE1ないし4のうちいずれか一項記載の方法。
〔EEE6〕
より高い周波数に関連付けられた変換パラメータは信号位相を修正せず、一方、より低い周波数については、前記変換パラメータは信号位相を修正する、EEE1ないし5のうちいずれか一項記載の方法。
〔EEE7〕
フィルタ係数の前記集合は、マルチタップ畳み込み行列を処理するために機能できる、EEE1ないし6のうちいずれか一項記載の方法。
〔EEE8〕
フィルタ係数の前記集合は、低周波数帯域を処理するために利用される、EEE7記載の方法。
〔EEE9〕
基本信号の前記集合および変換パラメータの前記集合は、組み合わされて前記データ・ストリームを形成する、EEE1ないし8のうちいずれか一項記載の方法。
〔EEE10〕
前記変換パラメータは、基本信号の前記集合の高周波数部分の行列操作のための高周波数オーディオ行列係数を含む、EEE1ないし9のうちいずれか一項記載の方法。
〔EEE11〕
基本信号の前記集合の前記高周波数部分のうち中間周波数部分のために、前記行列操作は複素数値の変換パラメータを含む、EEE10記載の方法。
〔EEE12〕
エンコードされたオーディオ信号をデコードするためのデコーダであって、前記エンコードされたオーディオ信号は:
第一のオーディオ呈示フォーマットにおける前記オーディオの再生のために意図されたオーディオ基本信号の集合を含む第一の呈示と;
前記第一の呈示フォーマットにおける前記オーディオ基本信号を第二の呈示フォーマットに変換するための変換パラメータの集合とを含み、前記変換パラメータは、少なくとも高周波数オーディオ変換パラメータおよび低周波数オーディオ変換パラメータを含み、前記低周波数変換パラメータはマルチタップ畳み込み行列パラメータを含み、
当該デコーダは:
オーディオ基本信号の前記集合および変換パラメータの前記集合を分離するための第一分離ユニットと;
前記マルチタップ畳み込み行列パラメータを前記オーディオ基本信号の低周波数成分に適用し;前記低周波数成分に畳み込みを適用することが畳み込みされた低周波数成分を生成する行列乗算ユニットと;
前記高周波数オーディオ変換パラメータを前記オーディオ基本信号の高周波数成分に適用してスカラー高周波数成分を生成するスカラー乗算ユニットと;
前記畳み込みされた低周波数成分および前記スカラー高周波数成分を組み合わせて前記第二の呈示フォーマットにおける時間領域出力信号を生成する出力フィルタバンクとを含む、
デコーダ。
〔EEE13〕
前記行列乗算ユニットは、前記オーディオ基本信号の前記低周波数成分の位相を修正する、EEE12記載のデコーダ。
〔EEE14〕
前記マルチタップ畳み込み行列変換パラメータは複素数値である、EEE12または13記載のデコーダ。
〔EEE15〕
前記高周波数オーディオ変換パラメータが複素数値である、EEE12ないし14のうちいずれか一項記載のデコーダ。
〔EEE16〕
変換パラメータの前記集合はさらに、実数値の、より高周波数のオーディオ変換パラメータを含む、EEE15記載のデコーダ。
〔EEE17〕
前記オーディオ基本信号を前記低周波数成分および前記高周波数成分に分離するためのフィルタをさらに有する、EEE12ないし16のうちいずれか一項記載のデコーダ。
〔EEE18〕
エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は:
第一のオーディオ呈示フォーマットにおける前記オーディオの再生のために意図されたオーディオ基本信号の集合を含む第一の呈示と;
前記第一の呈示フォーマットにおける前記オーディオ基本信号を第二の呈示フォーマットに変換するための変換パラメータの集合とを含み、前記変換パラメータは、少なくとも高周波数オーディオ変換パラメータおよび低周波数オーディオ変換パラメータを含み、前記低周波数変換パラメータはマルチタップ畳み込み行列パラメータを含み、
当該方法は:
前記オーディオ基本信号の低周波数成分を前記低周波数変換パラメータと畳み込みして、畳み込みされた低周波数成分を生成する段階と;
前記オーディオ基本信号の高周波数成分に前記高周波数変換パラメータを乗算して、乗算された高周波数成分を生成する段階と;
前記畳み込みされた低周波数成分および前記乗算された高周波数成分を組み合わせて、第二の呈示フォーマットでの再生のための出力オーディオ信号周波数成分を生成する段階とを含む、方法。
〔EEE19〕
前記エンコードされた信号は複数の時間的セグメントを含み、当該方法はさらに:
前記エンコードされた信号の複数の時間的セグメントの変換パラメータを補間して、補間された低周波数オーディオ変換パラメータを含む補間された変換パラメータを生成する段階と;
前記オーディオ基本信号の前記低周波数成分の複数の時間的セグメントを前記補間された低周波数オーディオ変換パラメータと畳み込みして、前記畳み込みされた低周波数成分の複数の時間的セグメントを生成する段階とをさらに含む、
EEE18記載の方法。
〔EEE20〕
前記エンコードされたオーディオ信号の変換パラメータの前記集合は時間変化し、当該方法はさらに:
複数の時間的セグメントについて前記低周波数成分を前記低周波数変換パラメータと畳み込みして、中間の畳み込みされた低周波数成分の複数の集合を生成する段階と;
中間の畳み込みされた低周波数成分の前記複数の集合を補間して、前記畳み込みされた低周波数成分を生成する段階とをさらに含む、
EEE18記載の方法。
〔EEE21〕
前記補間は、中間の畳み込みされた低周波数成分の前記複数の集合の重複加算方法を利用する、EEE19またはEEE20記載の方法。
〔EEE22〕
前記オーディオ基本信号をフィルタリングして前記低周波数成分および前記高周波数成分にする段階をさらに含む、EEE18ないし21のうちいずれか一項記載の方法。
〔EEE23〕
EEE1ないし11および18ないし22のうちいずれか一項記載の方法に基づくコンピュータの動作のためのプログラム命令を含むコンピュータ可読の非一時的な記憶媒体。
〔態様1〕
オーディオ・チャネルまたはオブジェクトの第二の呈示をデータ・ストリームとして表現するための方法であって:
(a)前記オーディオ・チャネルまたはオブジェクトの第一の呈示を表わす基本信号を提供する段階と;
(b)前記第一の呈示の前記基本信号を前記第二の呈示の出力信号に変換することを意図されている変換パラメータを提供する段階であって、前記変換パラメータはそれぞれ、少なくとも二つの周波数帯域について指定され、前記周波数帯域のうち少なくとも一つのためのマルチタップ畳み込み行列パラメータの集合を含み、前記第一の呈示はラウドスピーカー再生用であり前記第二の呈示はヘッドフォン再生用であるまたは前記第一の呈示はヘッドフォン再生用であり前記第二の呈示はラウドスピーカー再生用である、段階とを含む、
方法。
〔態様2〕
前記マルチタップ畳み込み行列パラメータは、有限インパルス応答(FIR)フィルタを示す、態様1記載の方法。
〔態様3〕
前記基本信号は、一連の時間的セグメントに分割され、変換パラメータは各時間的セグメントについて与えられる、態様1または2記載の方法。
〔態様4〕
前記マルチタップ畳み込み行列パラメータは、複素数値である少なくとも一つの係数を含む、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記基本信号を提供する段階は、第一のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから前記基本信号を決定することを含み;
当該方法は、第二のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから前記第二の呈示のための所望される出力信号を決定する段階を含み、
前記変換パラメータを提供する段階は、前記出力信号の前記所望される出力信号からの偏差を最小化することによって前記変換パラメータを決定することを含む、
態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記変換パラメータを提供する段階は、
エンコーダ・フィルタバンクを使って、B個の周波数帯域についてサブバンド領域基本信号を決定し;
前記エンコーダ・フィルタバンクを使って、前記B個の周波数帯域についてサブバンド領域の所望される出力信号を決定し;
前記B個の周波数帯域のうちの少なくとも二つの隣接する周波数帯域についてマルチタップ畳み込み行列パラメータの同じ集合を決定することを含む、
態様5記載の方法。
〔態様7〕
前記エンコーダ・フィルタバンクは、前記B個の周波数帯域の高周波数帯域よりも高い周波数分解能をもつ前記B個の周波数帯域の低周波数帯域を提供するハイブリッド・フィルタバンクを有し、
前記少なくとも二つの隣接する周波数帯域が低周波数帯域である、
態様6記載の方法。
〔態様8〕
前記変換パラメータを提供する段階は、少なくとも二つの隣接する高周波数帯域について同じ実数値の変換パラメータを決定することを含む、態様7記載の方法。
〔態様9〕
前記少なくとも二つの周波数帯域が、より低い周波数帯域およびより高い周波数帯域を含み、
前記より高い周波数帯域について指定される変換パラメータは前記基本信号の信号位相を修正せず、
前記より低い周波数帯域について指定される変換パラメータは前記基本信号の信号位相を修正する、
態様1ないし8のうちいずれか一項記載の方法。
〔態様10〕
前記マルチタップ畳み込み行列パラメータは、低周波数帯域を処理するために利用される、態様1ないし9のうちいずれか一項記載の方法。
〔態様11〕
前記基本信号および前記変換パラメータは、組み合わされて前記データ・ストリームを形成する、態様1ないし10のうちいずれか一項記載の方法。
〔態様12〕
前記変換パラメータは、前記基本信号の高周波数部分の行列操作のための高周波数オーディオ行列係数を含む、
態様1ないし11のうちいずれか一項記載の方法。
〔態様13〕
前記基本信号の前記高周波数部分のうち中間周波数部分のために、前記行列操作は複素数値の変換パラメータを含む、態様12記載の方法。
〔態様14〕
エンコードされたオーディオ信号をデコードするためのデコーダであって、前記エンコードされたオーディオ信号は:
第一のオーディオ呈示フォーマットにおける前記エンコードされたオーディオ信号の再生のために意図されたオーディオ基本信号を含む第一の呈示と;
前記第一の呈示フォーマットにおける前記オーディオ基本信号を第二の呈示フォーマットの出力信号に変換するための変換パラメータとを含み、前記変換パラメータは、高周波数オーディオ変換パラメータおよび低周波数オーディオ変換パラメータを含み、前記低周波数変換パラメータはマルチタップ畳み込み行列パラメータを含み、前記第一の呈示フォーマットはラウドスピーカー再生用であり前記第二の呈示フォーマットはヘッドフォン再生用であるまたは前記第一の呈示フォーマットはヘッドフォン再生用であり、前記第二の呈示フォーマットはラウドスピーカー再生用であり、
当該デコーダは:
前記オーディオ基本信号および前記変換パラメータを分離するための第一分離ユニットと;
前記マルチタップ畳み込み行列パラメータを前記オーディオ基本信号の低周波数成分に適用し;前記低周波数成分に畳み込みを適用することが畳み込みされた低周波数成分を生成する、行列乗算ユニットと;
前記高周波数オーディオ変換パラメータを前記オーディオ基本信号の高周波数成分に適用してスカラー高周波数成分を生成するスカラー乗算ユニットと;
前記畳み込みされた低周波数成分および前記スカラー高周波数成分を組み合わせて前記第二の呈示フォーマットの時間領域出力信号を生成する出力フィルタバンクとを含む、
デコーダ。
〔態様15〕
前記行列乗算ユニットは、前記オーディオ基本信号の前記低周波数成分の位相を修正する、態様14記載のデコーダ。
〔態様16〕
前記マルチタップ畳み込み行列変換パラメータは複素数値である、態様14または15記載のデコーダ。
〔態様17〕
前記高周波数オーディオ変換パラメータが複素数値である、態様14ないし16のうちいずれか一項記載のデコーダ。
〔態様18〕
前記変換パラメータはさらに、実数値の、高周波数オーディオ変換パラメータを含む、態様17記載のデコーダ。
〔態様19〕
前記オーディオ基本信号を前記低周波数成分および前記高周波数成分に分離するためのフィルタをさらに有する、態様14ないし18のうちいずれか一項記載のデコーダ。
〔態様20〕
エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は:
第一のオーディオ呈示フォーマットにおける前記エンコードされたオーディオ信号の再生のために意図されたオーディオ基本信号を含む第一の呈示と;
前記第一の呈示フォーマットにおける前記オーディオ基本信号を第二の呈示フォーマットの出力信号に変換するための変換パラメータとを含み、前記変換パラメータは、高周波数オーディオ変換パラメータおよび低周波数オーディオ変換パラメータを含み、前記低周波数変換パラメータはマルチタップ畳み込み行列パラメータを含み、前記第一の呈示フォーマットはラウドスピーカー再生用であり前記第二の呈示フォーマットはヘッドフォン再生用であるまたは前記第一の呈示フォーマットはヘッドフォン再生用であり前記第二の呈示フォーマットはラウドスピーカー再生用であり、
当該方法は:
前記オーディオ基本信号の低周波数成分を前記低周波数変換パラメータと畳み込みして、畳み込みされた低周波数成分を生成する段階と;
前記オーディオ基本信号の高周波数成分に前記高周波数変換パラメータを乗算して、乗算された高周波数成分を生成する段階と;
前記畳み込みされた低周波数成分および前記乗算された高周波数成分を組み合わせて、前記第二の呈示フォーマットのための出力オーディオ信号周波数成分を生成する段階とを含む、
方法。
〔態様21〕
前記エンコードされたオーディオ信号は複数の時間的セグメントを含み、当該方法はさらに:
前記エンコードされたオーディオ信号の複数の時間的セグメントの変換パラメータを補間して、補間された低周波数オーディオ変換パラメータを含む補間された変換パラメータを生成する段階と;
前記オーディオ基本信号の前記低周波数成分の複数の時間的セグメントを前記補間された低周波数オーディオ変換パラメータと畳み込みして、前記畳み込みされた低周波数成分の複数の時間的セグメントを生成する段階とをさらに含む、
態様20記載の方法。
〔態様22〕
前記エンコードされたオーディオ信号の前記変換パラメータは時間変化し、前記オーディオ基本信号の低周波数成分の前記畳み込みは:
複数の時間的セグメントについて前記オーディオ基本信号の前記低周波数成分を前記低周波数変換パラメータと畳み込みして、中間の畳み込みされた低周波数成分の複数の集合を生成する段階と;
中間の畳み込みされた低周波数成分の前記複数の集合を補間して、前記畳み込みされた低周波数成分を生成する段階とを含む、
態様20記載の方法。
〔態様23〕
前記補間は、中間の畳み込みされた低周波数成分の前記複数の集合の重複加算方法を利用する、態様20または態様22記載の方法。
〔態様24〕
前記オーディオ基本信号をフィルタリングして前記低周波数成分および前記高周波数成分にする段階をさらに含む、態様20ないし23のうちいずれか一項記載の方法。
〔態様25〕
態様1ないし13および20ないし24のうちいずれか一項記載の方法に基づくコンピュータの動作のためのプログラム命令を含むコンピュータ可読の非一時的な記憶媒体。
Claims (20)
- 複数のオーディオ・チャネルまたは複数のオーディオ・オブジェクトの呈示を表わす基本信号を取得する段階と;
前記呈示の基本信号をヘッドフォン再生のためのバイノーラル出力信号に変換する変換のための変換パラメータを決定する段階であって、
前記変換パラメータは、より高い周波数帯域について使用される変換のために指定される高周波数変換パラメータおよびより低い周波数帯域について使用される変換のために指定される低周波数変換パラメータを含み、
前記低周波数変換パラメータは、より低い周波数帯域について使用される前記変換のためのマルチタップ畳み込み行列パラメータを含み、より低い周波数帯域について使用される前記変換は、前記基本信号の低周波数成分を前記低周波数変換パラメータと畳み込みして畳み込みされた低周波数成分を生成するためのものであり、
前記高周波数変換パラメータは、より高い周波数帯域について使用される前記変換のためのステートレス行列のパラメータを含み、より高い周波数帯域について使用される前記変換は、前記基本信号の高周波数成分に前記高周波数変換パラメータを乗算して、乗算された高周波数成分を生成するためのものである、段階と;
前記基本信号および前記変換パラメータを組み合わせてデータ・ストリームを形成する段階とを含む、
方法。 - 前記マルチタップ畳み込み行列パラメータは、有限インパルス応答(FIR)フィルタを示す、請求項1記載の方法。
- 前記基本信号は、一連の時間的セグメントに分割され、前記変換パラメータの少なくとも一部は各時間的セグメントについて与えられる、請求項1記載の方法。
- 前記マルチタップ畳み込み行列パラメータは、複素数値である少なくとも一つの係数を含む、請求項1記載の方法。
- 前記基本信号を取得する段階は、第一のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから前記基本信号を決定することを含む、請求項1記載の方法。
- 第二のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから所望される出力信号を決定する段階をさらに含む、請求項5記載の方法。
- 前記変換パラメータを決定する段階は、前記出力信号の前記所望される出力信号からの偏差を最小化することによって前記変換パラメータを決定することを含む、請求項6記載の方法。
- 命令を記憶している非一時的なコンピュータ可読媒体であって、前記命令は、装置によって実行されたときに前記装置に:
複数のオーディオ・チャネルまたは複数のオーディオ・オブジェクトの呈示を表わす基本信号を取得する段階と;
前記呈示の基本信号をヘッドフォン再生のためのバイノーラル出力信号に変換する変換のための変換パラメータを決定する段階であって、
前記変換パラメータは、より高い周波数帯域について使用される変換のために指定される高周波数変換パラメータおよびより低い周波数帯域について使用される変換のために指定される低周波数変換パラメータを含み、
前記低周波数変換パラメータは、より低い周波数帯域について使用される前記変換のためのマルチタップ畳み込み行列パラメータを含み、より低い周波数帯域について使用される前記変換は、前記基本信号の低周波数成分を前記低周波数変換パラメータと畳み込みして畳み込みされた低周波数成分を生成するためのものであり、
前記高周波数変換パラメータは、より高い周波数帯域について使用される前記変換のためのステートレス行列のパラメータを含み、より高い周波数帯域について使用される前記変換は、前記基本信号の高周波数成分に前記高周波数変換パラメータを乗算して、乗算された高周波数成分を生成するためのものである、段階と;
前記基本信号および前記変換パラメータを組み合わせてデータ・ストリームを形成する段階とを含む、
動作を実行させるものである、
非一時的なコンピュータ可読媒体。 - 前記マルチタップ畳み込み行列パラメータは、有限インパルス応答(FIR)フィルタを示す、請求項8記載の非一時的なコンピュータ可読媒体。
- 前記基本信号は、一連の時間的セグメントに分割され、前記変換パラメータの少なくとも一部は各時間的セグメントについて与えられる、請求項8記載の非一時的なコンピュータ可読媒体。
- 前記マルチタップ畳み込み行列パラメータは、複素数値である少なくとも一つの係数を含む、請求項8記載の非一時的なコンピュータ可読媒体。
- 前記基本信号を取得する段階は、第一のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから前記基本信号を決定することを含む、請求項8記載の非一時的なコンピュータ可読媒体。
- 第二のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから所望される出力信号を決定する段階をさらに含む、請求項12記載の非一時的なコンピュータ可読媒体。
- 前記変換パラメータを決定する段階は、前記出力信号の前記所望される出力信号からの偏差を最小化することによって前記変換パラメータを決定することを含む、請求項13記載の非一時的なコンピュータ可読媒体。
- プロセッサと;
命令を記憶している非一時的なコンピュータ可読媒体とを有するシステムであって、前記命令は、前記プロセッサによって実行されたときに前記プロセッサに:
複数のオーディオ・チャネルまたは複数のオーディオ・オブジェクトの呈示を表わす基本信号を取得する段階と;
前記呈示の基本信号をヘッドフォン再生のためのバイノーラル出力信号に変換する変換のための変換パラメータを決定する段階であって、
前記変換パラメータは、より高い周波数帯域について使用される変換のために指定される高周波数変換パラメータおよびより低い周波数帯域について使用される変換のために指定される低周波数変換パラメータを含み、
前記低周波数変換パラメータは、より低い周波数帯域について使用される前記変換のためのマルチタップ畳み込み行列パラメータを含み、より低い周波数帯域について使用される前記変換は、前記基本信号の低周波数成分を前記低周波数変換パラメータと畳み込みして畳み込みされた低周波数成分を生成するためのものであり、
前記高周波数変換パラメータは、より高い周波数帯域について使用される前記変換のためのステートレス行列のパラメータを含み、より高い周波数帯域について使用される前記変換は、前記基本信号の高周波数成分に前記高周波数変換パラメータを乗算して、乗算された高周波数成分を生成するためのものである、段階と;
前記基本信号および前記変換パラメータを組み合わせてデータ・ストリームを形成する段階とを含む、
動作を実行させるものである、
システム。 - 前記マルチタップ畳み込み行列パラメータは、有限インパルス応答(FIR)フィルタを示す、請求項15記載のシステム。
- 前記基本信号は、一連の時間的セグメントに分割され、前記変換パラメータの少なくとも一部は各時間的セグメントについて与えられる、請求項15記載のシステム。
- 前記マルチタップ畳み込み行列パラメータは、複素数値である少なくとも一つの係数を含む、請求項15記載のシステム。
- 前記基本信号を取得する段階は、第一のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから前記基本信号を決定することを含む、請求項15記載のシステム。
- 第二のレンダリング・パラメータを使って、前記オーディオ・チャネルまたはオブジェクトから所望される出力信号を決定する段階をさらに含む、請求項19記載のシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023020846A JP7559106B2 (ja) | 2015-08-25 | 2023-02-14 | オーディオ・デコーダおよびデコード方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562209742P | 2015-08-25 | 2015-08-25 | |
US62/209,742 | 2015-08-25 | ||
EP15189008.4 | 2015-10-08 | ||
EP15189008 | 2015-10-08 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018509898A Division JP6797187B2 (ja) | 2015-08-25 | 2016-08-23 | オーディオ・デコーダおよびデコード方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023020846A Division JP7559106B2 (ja) | 2015-08-25 | 2023-02-14 | オーディオ・デコーダおよびデコード方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021015310A JP2021015310A (ja) | 2021-02-12 |
JP7229218B2 true JP7229218B2 (ja) | 2023-02-27 |
Family
ID=74531393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020190599A Active JP7229218B2 (ja) | 2015-08-25 | 2020-11-17 | データ・ストリームを形成するための方法、媒体、システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7229218B2 (ja) |
ES (1) | ES2818562T3 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009522894A (ja) | 2006-01-09 | 2009-06-11 | ノキア コーポレイション | バイノーラルオーディオ信号の復号 |
JP2009526258A (ja) | 2006-02-07 | 2009-07-16 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2010541510A (ja) | 2007-10-09 | 2010-12-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | バイノーラル音声信号を生成するための方法と装置 |
JP2012505575A (ja) | 2008-10-07 | 2012-03-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 多チャネルオーディオ信号のバイノーラル・レンダリング |
-
2016
- 2016-08-23 ES ES16760281T patent/ES2818562T3/es active Active
-
2020
- 2020-11-17 JP JP2020190599A patent/JP7229218B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009522894A (ja) | 2006-01-09 | 2009-06-11 | ノキア コーポレイション | バイノーラルオーディオ信号の復号 |
JP2009526258A (ja) | 2006-02-07 | 2009-07-16 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP2010541510A (ja) | 2007-10-09 | 2010-12-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | バイノーラル音声信号を生成するための方法と装置 |
JP2012505575A (ja) | 2008-10-07 | 2012-03-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 多チャネルオーディオ信号のバイノーラル・レンダリング |
Non-Patent Citations (1)
Title |
---|
Jurgen Herre et al.,MPEG Surround-The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding,Journal of Audio Engineering Society,2008年11月,Vol.56, No.11,p.932-955,https://pdfs.semanticscholar.org/62b6/54ada57c6b2115898d123cb126564c22a115.pdf |
Also Published As
Publication number | Publication date |
---|---|
JP2021015310A (ja) | 2021-02-12 |
ES2818562T3 (es) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7559106B2 (ja) | オーディオ・デコーダおよびデコード方法 | |
CA2999328C (en) | Audio encoding and decoding using presentation transform parameters | |
JP7229218B2 (ja) | データ・ストリームを形成するための方法、媒体、システム | |
EA041656B1 (ru) | Аудиодекодер и способ декодирования |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7229218 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |