JP2013511754A - 適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング - Google Patents
適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング Download PDFInfo
- Publication number
- JP2013511754A JP2013511754A JP2012541085A JP2012541085A JP2013511754A JP 2013511754 A JP2013511754 A JP 2013511754A JP 2012541085 A JP2012541085 A JP 2012541085A JP 2012541085 A JP2012541085 A JP 2012541085A JP 2013511754 A JP2013511754 A JP 2013511754A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- encoded
- channel
- block
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Abstract
【選択図】図7
Description
本出願は、2009年12月7日に出願された米国仮特許出願番号61/267,422の優先権を主張しており、これは、本明細書に参照によりそのまま組み込まれる。
図1と2は、デコーダを本発明のさまざまな態様と組み合わせることができるオーディオコーディングシステムのエンコーダおよびデコーダの典型的な実装の概略ブロック図である。これらの実装は、前述のA/52B文書で開示されている内容に準拠している。
図1の典型的な実施例を参照すると、エンコーダは、入力信号経路1からの1つまたは複数のオーディオ信号の入力チャンネルを表す一連のパルス符号変調(PCM)サンプルを受信し、解析フィルタバンク2をこの一連のサンプルに適用して、入力オーディオ信号のスペクトル構成を表すデジタル値を生成する。ATSC標準に準拠した実施形態では、解析フィルタバンクは、A/52B文書で説明される変形離散コサイン変換(MDCT)により実装される。MDCTは、オーディオ信号の各入力チャンネルで重複セグメントまたはサンプルのブロックに適用されて、その入力チャンネル信号のスペクトル構造を表す変換係数のブロックを生成する。MDCTは、時間領域エイリアシングを取り消すための特別に設計された窓関数と重複/追加処理を使用する解析/合成システムの一部である。各ブロックの変換係数は、浮動小数点指数と仮数とを備えたブロック浮動小数点(BFP)形式で表される。この説明は、浮動小数点指数と仮数として表されるオーディオデータについて述べている。この表示形式は、ATSC標準に準拠するビットストリームで使用されるためである。しかし、この具体的な表現は、桁移動子と関連する桁値を使用する数的表示の一例に過ぎない。
デコーダは、基本的に、エンコーダで実行されるコーディングアルゴリズムの逆のデコーディングアルゴリズムを実行する。図2の典型的な実施形態を参照すると、デコーダは一連のフレームを表すエンコード化ビットストリームを、入力信号経路11から受信する。エンコード化ビットストリームは、情報ストレージ媒体から取得または通信チャンネルから受信しても良い。デフォーマッタ12は、各フレームのエンコード化情報を、フレームメタデータと6つのオーディオブロックに多重分離または逆アセンブルする。オーディオブロックはそれぞれ対応するブロックメタデータ、エンコード化指数、および量子化仮数に逆アセンブルされる。エンコード化指数は、ビットアロケータ13で心理音響モデルに使用され、デジタル情報を、ビットがエンコーダで割り当てられた時と同じ方法で、量子化仮数を逆量子化するためのビットの形式に配分する。逆量子化器14は、量子化された仮数を、ビットアロケータ13から受信したビット割り当てに従って逆量子化し、逆量子化された仮数を、合成フィルタバンク15に渡す。エンコード化指数は、デコードされ、合成フィルタバンク15に渡される。
1.フレーム
ATSC標準に準拠したエンコード化ビットストリームは、「同期フレーム」と呼ばれ、より簡単にフレームと呼ばれることもある一連のエンコード化情報単位を備える。前述のように、各フレームはフレームメタデータと6つのオーディオブロックとを格納する。各オーディオブロックは、オーディオ信号の1つまたは複数のチャンネルの間隔が一致するようにするためのブロックメタデータとエンコード化BFP指数および仮数を格納する。標準ビットストリームの構造を、図3Aに概略的に示す。A/52B文書のAnnex Eで説明されているような拡張AC−3ビットストリームの構造を、図3Bに示す。各ビットストリームの、SIとCRCとの印が付いた間の部分が1つのフレームである。
各オーディオブロックは、256の変換係数用のBFP指数および量子化仮数のエンコードされた表現と、エンコード化指数と量子化仮数のデコードに必要なブロックメタデータを格納する。この構造を、図4Aに概略的に示す。A/52B文書のAnnex Eで説明されているような拡張AC−3ビットストリームのオーディオブロックの構造を、図4Bに示す。A/52B文書のAnnex Dで説明されているビットストリームの別のバージョンにおけるオーディオブロック構造は、その独自の機能が本発明には関係しないため、本明細書では説明しない。
ATSC標準は、本発明に関するビットストリームの内容にいくつかの制限を課する。本明細書では以下の2つの制限を説明する。(1)フレームの最初のオーディオブロックは、AB0と呼ばれるが、デコーディングアルゴリズムが、フレームのすべてのオーディオブロックのデコードを開始するために必要なすべての情報を格納していなければならない、(2)ビットストリームがチャンネル結合により生成されたエンコード化情報の伝送を開始したら常に、最初に使用されるチャンネル結合のオーディオブロックは、結合解除に必要なすべてのパラメータを格納していなければならない。これらの特徴について、以降で説明する。本明細書で説明していないその他の処理についての情報は、A/52B文書から取得できる。
ATSC標準は、エンコーディング処理またはエンコード化ビットストリームの生成に使用できる「コーディングツール」の観点から、ビットストリーム構文の特徴をいくつか記載している。エンコーダは、すべてのコーディングツールを採用する必要はないが、標準に準拠するデコーダは、準拠に欠かせないと判断されるコーディングツールに対応可能でなければならない。この対応は、基本的に対応するコーディングツールの逆である適切なデコーディングツールを実行することにより実装される。
すべてのデコーダはエンコード化ビットストリームの解凍または多重分離を行い、パラメータおよびエンコードされたデータを取得する必要がある。この処理は、前述のデフォーマッタ12で表される。この処理は基本的に、入力ビットストリームのデータを読み取り、ビットストリームの部分をレジスタにコピーし、この部分を記憶域にコピーし、またはバッファに保存されたビットストリームのデータへのポインタまたはその他の参照を保存するものである。メモリは、データおよびポインタの保存に必要であり、この情報を後から使用するために保存しておくことと、必要な時点で情報を取得するためビットストリームを再読み取りすることとの間でトレードオフをすることができる。
すべてのBFP指数の値は、各フレームでオーディオブロック内のデータを解凍するために必要である。これらの値は、間接的に、量子化された仮数に割り当てられたビット数を示すためである。ただし、時間と周波数との両方にわたり適用できる違うコーディング技術により、ビットストリーム中の指数値はエンコード化される。この結果、他のデコーディングプロセスで使用できるようにするには、エンコードされた指数を記述するデータがビットストリームから解凍され、デコードされる必要がある。
ビットストリームの量子化されたBFP仮数のそれぞれは、BFP指数の関数であるビットの可変の数と、場合によってはビットストリームに格納されたその他のメタデータにより表される。BFP指数は、指定されたモデルで、各仮数のビット割り当てを計算するモデルに入力される。オーディオブロックが、デルタビット割り当て(DBA)情報も格納している場合、この追加情報は、モデルにより計算されるビット割り当ての調整に使用される。
量子化されたBFP仮数は、エンコードされたビットストリームのデータの大部分を構成する。ビット割り当ては、解凍時のビットストリームの各仮数の位置の決定と、逆量子化された仮数を取得するための適切な逆量子化関数の選択との両方のために使用される。ビットストリームのデータの一部は、単一の値で複数の仮数を表すことができる。この状況では、適切な仮数の数値が、単一の値から抽出される。ゼロに相当する割り当てを有する仮数は、ゼロに相当する値または疑似乱数の数値としてのいずれかで再生成しても良い。
チャンネル結合コーディング技術で、エンコーダは複数のオーディオチャンネルを少ないデータ量で表現することができる。この技術は、結合チャンネルと呼ばれる複数の選択されたチャンネルからスペクトルコンポーネントを結合し、結合チャンネルと呼ばれる合成スペクトルコンポーネントの単一チャンネルを形成する。結合チャンネルのスペクトルコンポーネントは、BFP形式で記述される。結合チャンネルと結合されている各チャンネルとの間のエネルギーの差異を説明する桁移動子のセットは、結合座標として知られ、結合チャンネルそれぞれから抽出されて、エンコード化ビットストリームに含められる。結合は、各チャンネルの帯域の指定された部分だけに使用される。
チャンネルの再マトリックス化コーディング技術で、エンコーダは、マトリックスを使用して2つの独立したオーディオチャンネルを合計および差異チャンネルに変換することで、2チャンネル信号をより少ないデータ量で表現できる。BFP指数および仮数は通常、合計と差異チャンネルとの記述ではなく、左右のオーディオチャンネルのビットストリームに圧縮される。この技術は、2つのチャンネルの類似性が高い場合に有利に使用することができる。
A/52BのAnnex Eで、高度なコーディングツールの使用が可能な拡張AC−3ビットストリーム構文の特徴について説明している。これらのツールのいくつかと、関連プロセスを、以降で簡単に説明する。
適応型ハイブリッド変換(AHT)コーディング技術は、2つの変換をカスケード式で適用することにより信号特性を変換することに対する解析および合成フィルタバンクの時間的およびスペクトル的解像度の適用のためのブロックスイッチングに加えて、別のツールを提供する。AHT処理の詳細情報は、A/52B文書およびVinton et al.による、2009年4月7日開示の、参照により本明細書にそのまま組み込まれる米国特許第7,516,064「Adaptive Hybrid Transform for Signal Analysis and Synthesis」から取得できる。
スペクトル拡張(SPX)コーディング技術で、エンコーダは、高周波スペクトルコンポーネントをエンコード化ビットストリームから除外し、失われたスペクトルコンポーネントをエンコード化ビットストリームに格納されている低周波スペクトルコンポーネントからデコーダで合成することにより完全帯域幅のチャンネルのエンコードに必要な情報量を削減できる。
拡張AC−3ビットストリーム構文で、エンコーダは、5.1チャンネルを超える単一プログラム(チャンネル拡張)、最大5.1チャンネルの複数のプログラム(プログラム拡張)、または5.1チャンネルまでと5.1チャンネルを超えるプログラムの組み合わせを表すエンコード化ビットストリームを生成できる。プログラム拡張は、エンコード化ビットストリームの複数の独立データストリームのフレームの多重化により実施される。チャンネル拡張は、独立データストリームに関連付けられた1つまたは複数の従属データサブストリームのフレームの多重化により実施される。プログラム拡張の好ましい実施では、デコーダは、デコードするプログラムおよび、デコードされるべきではないプログラムを表すストリームおよびサブストリームをデコーディング処理で省略するかまたは基本的に無視するかを通知される。
さまざまなコーディングツールが組み合わせて使用され、エンコード化ビットストリームが生成された場合に発生するビットストリーム構造のバリエーションを処理し適切にデコードするには複雑なロジックが必要とされる。前述のように、アルゴリズム設計の詳細は、ATSC標準で指定されていないが、E−AC−3デコーダの従来の実装における汎用的な機能は別のチャンネルのデータをデコードする前に対応するチャンネルのフレームのすべてのデータをデコードするアルゴリズムである。この従来の手法は、ビットストリームのデコードに必要なオンチップメモリ量を削減するが、各フレームでフレームのオーディオブロックのすべてのデータを読み取り検証するため、複数回のデータの受け渡しが必要でもある。
本発明の高レベルな例示は、以下のプログラムの一部で示す。
スペクトル拡張(SPX)が使用されている場合、拡張処理が始まるオーディオブロックには、オーディオブロックの初めにSPXで必要な共有パラメータと、フレーム内でSPXを使用する他のオーディオブロックを格納する。共有パラメータは、処理が行われるチャンネルのID、スペクトル拡張周波数範囲、および各チャンネルのSPXスペクトル包絡が時間と周波数にわたり共有される方法を含む。これらのパラメータは、SPXの使用が開始されるオーディオブロックから解凍され、フレームの次のオーディオブロックのSPX処理に使用するためメモリまたはコンピュータレジスタに保存される。
適応型ハイブリッド変換(AHT)が使用されている場合、フレームの最初のオーディオブロックAB0はDCT−II変換で処理される各チャンネルのすべてのハイブリッド変換係数を格納する。その他すべてのチャンネルで、フレームの6つのオーディオブロックそれぞれは、MDCT解析フィルタバンクにより生成された256のスペクトル係数を格納する。
SPXおよびAHTは、同じチャンネルのエンコード化データを生成するために使用できる。スペクトル拡張とハイブリッド変換処理について個々に前述したロジックは、SPXが使用されているチャンネル、AHTが使用されているチャンネル、またはSPXとAHTの両方が使用されているチャンネルを処理するために組み合わせることができる。
チャンネル結合およびAHTは、同じチャンネルのエンコード化データを生成するために使用できる。基本的に、スペクトル拡張およびハイブリッド変換処理で説明したものと同じロジックを使用して、チャンネル結合とAHTを使用したビットストリームの処理が可能である。これは、前述のSPX処理がチャンネル結合で実行される処理に適用されるためである。
スペクトル拡張、チャンネル結合およびAHTはすべて、同じチャンネルのエンコード化データを生成するために使用できる。スペクトル拡張および結合とAHT処理との組み合わせで前述したロジックは、8つの可能性のある状況を処理するために必要な追加ロジックを組み合わせることにより、3つのコーディングツールのどの組み合わせを使用しても、チャンネルを処理するよう結合することができる。チャンネルの結合解除のための処理は、SPX処理を実行する前に実行される。
本発明のさまざまな態様を組み合わせた装置は、コンピュータまたは汎用コンピュータにあるものと同様のコンポーネントに結合されたデジタル信号プロセッサ(DSP)回路などのより特殊化したコンポーネントを含むその他の装置で実行するソフトウェアを含むさまざまな方法で実装して良い。図8は、本発明の態様の実施に使用できる装置90の概略ブロック図である。プロセッサ92は、計算リソースを提供する。RAM93は、プロセッサ92で処理のため使用されるシステムのランダムアクセスメモリ(RAM)である。ROM94は、読み取り専用メモリ(ROM)などの永続ストレージなどの形式を示す。これは、装置90の動作と、本発明のさまざまな態様の遂行を可能にするために必要なプログラムの保存に使用される。I/Oコントロール95は、通信チャンネル1、16を経由して信号を受信し送信するためのインターフェイス回路を表す。示された実施形態では、すべての主なシステムコンポーネントは複数の物理的またはロジカルバスを表すバス91に接続する。ただし、バスアーキテクチャは、本発明の実施に必須ではない。
Claims (10)
- エンコード化デジタルオーディオ信号のフレームをデコーディングするための方法で、
フレームがフレームメタデータと、最初のオーディオブロックおよびそれに続く1つまたは複数のオーディオブロックとを備え、
最初およびそれに続くオーディオブロックがそれぞれ、1つまたは複数のオーディオチャンネルのブロックメタデータとエンコード化オーディオデータとを備えており、
このエンコード化オーディオデータが、1つまたは複数のオーディオチャンネルのスペクトル内容を表す桁移動子と桁値とを備え、各桁値が桁移動子の対応する1つと関連付けられており、
ブロックメタデータが、このエンコード化オーディオデータを生成したエンコーディング処理で使用されたコーディングツールを表す制御情報を備え、このコーディングツールが、
第1の変換により実施された解析フィルタバンクを1つまたは複数のオーディオチャンネルに適用して第1の変換係数を生成することと、
第2の変換を少なくとも1つまたは複数のオーディオチャンネルの一部の第1の変換係数に適用してハイブリッド変換係数を生成すること
とを備えた適応型ハイブリッド変換処理を含む方法で、この方法が、
エンコード化デジタルオーディオ信号のフレームを受信することと、
単一の経路でフレームのエンコード化デジタルオーディオ信号を検証して、各オーディオブロックのエンコード化オーディオデータをブロック順にデコードし、この各対応するオーディオブロックのデコーディングが、
エンコーディング処理で適応型ハイブリッド変換処理を使用してエンコード化オーディオデータのいずれかをエンコードしたかどうかを判別することと、
エンコード処理が適応型ハイブリッド変換処理を使用した場合は、
フレームのすべてのオーディオブロックのすべてのハイブリッド変換係数を、最初のオーディオブロックのエンコード化オーディオデータから取得して、逆の第2の変換をハイブリッド変換係数に適用して逆の第2の変換係数を取得することと、
第1の変換係数を対応するオーディオブロックの逆の第2の変換係数から取得することとを備え、
エンコーディング処理が適応型ハイブリッド変換処理を使用しなかった場合、対応するオーディオブロックのエンコード化オーディオデータから第1の変換係数を取得することと、
逆の第1の変換が第1の変換係数に適用されて、対応するオーディオブロックで1つまたは複数のチャンネルを表す出力信号を生成すること
とを備える方法。 - 請求項1の方法で、エンコード化デジタルオーディオ信号のフレームが拡張AC−3ビットストリーム構文に準拠している方法。
- 請求項2の方法で、コーディングツールがスペクトル拡張処理を含み、対応する各オーディオブロックのデコーディングがさらに、
デコーディング処理がスペクトル拡張処理を使用して任意のエンコード化オーディオデータをデコードしなければならないかどうかを判別することと、
スペクトル拡張処理を使用しなければならない場合、逆の第2の変換係数から1つまたは複数のスペクトルコンポーネントを合成して拡張帯域幅を有する第1の変換係数を取得すること
とを備えた方法。 - 請求項2または3の方法で、コーディングツールがチャンネル結合を含み、対応する各オーディオブロックのデコーディングがさらに、
エンコーディング処理でチャンネル結合を使用してエンコード化オーディオデータのいずれかをエンコードしたかどうかを判別することと、
エンコーディング処理がチャンネル結合を使用した場合、逆の第2の変換係数からスペクトルコンポーネントを抽出して結合されたチャンネルの第1の変換係数を取得すること
とを備えた方法。 - エンコード化デジタルオーディオ信号のフレームをデコーディングするための方法で、
フレームがフレームメタデータと、最初のオーディオブロックおよびそれに続く1つまたは複数のオーディオブロックとを備え、
最初およびそれに続くオーディオブロックがそれぞれ、1つまたは複数のオーディオチャンネルのブロックメタデータとエンコード化オーディオデータとを備え、
このエンコード化オーディオデータが、1つまたは複数のオーディオチャンネルのスペクトル内容を表す桁移動子と桁値とを備え、各桁値が桁移動子の対応する1つと関連付けられており、
ブロックメタデータが、このエンコード化オーディオデータを生成したエンコーディング処理で使用されたコーディングツールを表す制御情報を備え、このコーディングツールが、
第1の変換により実施された解析フィルタバンクを1つまたは複数のオーディオチャンネルに適用して第1の変換係数を生成することと、
第2の変換を少なくとも1つまたは複数のオーディオチャンネルの一部の第1の変換係数に適用してハイブリッド変換係数を生成すること
とを備えた適応型ハイブリッド変換処理を含み、
この方法が、
(A)エンコード化デジタルオーディオ信号のフレームを受信することと、
(B)フレームのエンコード化デジタルオーディオ信号を1つの経路で検証して、各オーディオブロックのエンコード化オーディオデータをブロック順にデコードし、このそれぞれ対応するオーディオブロックのデコーディングが、
(1)1つまたは複数のチャンネルの対応する各チャンネルで、エンコーディング処理が適応型ハイブリッド変換処理を使用してエンコード化オーディオデータのいずれかをエンコードしたかどうかを判別することと、
(2)エンコーディング処理が対応するチャンネルに適応型ハイブリッド変換処理を使用した場合は、
(a)対応するオーディオブロックがフレームの最初のオーディオブロックである場合は、
(i)フレームの対応するチャンネルのすべてのハイブリッド変換係数を、最初のオーディオブロックのエンコード化オーディオデータから取得することと、
(ii)逆の第2の変換をハイブリッド変換係数に適用して逆の第2の変換係数を取得することと、
(b)第1の変換係数を対応するオーディオブロックで対応するチャンネルの逆の第2の変換係数から取得することと、
(3)エンコーディング処理が対応するチャンネルに適応型ハイブリッド変換処理を使用しなかった場合は、対応するチャンネルの第1の変換係数を、対応するオーディオブロックのエンコード化データをデコーディングすることにより取得することと、
(C)逆の第1の変換が第1の変換係数に適用されて、対応するオーディオブロックで対応するチャンネルを表す出力信号を生成すること
とを備える方法。 - 請求項5の方法で、エンコード化デジタルオーディオ信号のフレームが拡張AC−3ビットストリーム構文に準拠している方法。
- 請求項6の方法で、コーディングツールがスペクトル拡張処理を含み、対応する各オーディオブロックのデコーディングがさらに、
デコーディング処理がスペクトル拡張処理を使用して任意のエンコード化オーディオデータをデコードしなければならないかどうかを判別することと、
スペクトル拡張処理を使用する場合、逆の第2の変換係数から1つまたは複数のスペクトルコンポーネントを合成して拡張帯域幅を有する第1の変換係数を取得すること
とを備えた方法。 - 請求項6または7の方法で、コーディングツールがチャンネル結合を含み、対応する各オーディオブロックのデコーディングがさらに、
エンコーディング処理でチャンネル結合を使用してエンコード化オーディオデータのいずれかをエンコードしたかどうかを判別することと、
エンコーディング処理がチャンネル結合を使用した場合は、
(A)対応するチャンネルがフレームで結合を使用した最初のチャンネルである場合は、
(1)エンコーディング処理が適応型ハイブリッド変換処理を使用して結合チャンネルをエンコードしたかどうかを判別することと、
(2)エンコーディング処理が適応型ハイブリッド変換処理を使用して結合チャンネルをエンコードした場合、
(a)対応するオーディオブロックがフレームの最初のオーディオブロックである場合は、
(i)フレームの結合チャンネルのすべてのハイブリッド変換係数を、最初のオーディオブロックのエンコード化オーディオデータから取得することと、
(ii)逆の第2の変換をハイブリッド変換係数に適用して逆の第2の変換係数を取得することと、
(b)第1の変換係数を対応するオーディオブロックで結合チャンネルの逆の第2の変換係数から取得することとを備え、
(3)エンコーディング処理が適応型ハイブリッド変換処理を結合チャンネルをエンコードするのに使用しなかった場合は、結合チャンネルのスペクトルコンポーネントを、対応するオーディオブロックのエンコード化データをデコーディングすることにより取得することと、
(B)対応するチャンネルの第1の変換係数を、結合チャンネルのスペクトルコンポーネントの結合解除により取得すること
とを備えた方法。 - エンコード化デジタルオーディオ信号のフレームをデコーディングするための装置で、請求項1から8までのいずれか一項のすべての手順の機能を実行する手段を備えた装置。
- エンコード化デジタルオーディオ信号のフレームをデコーディングするための方法を実行するための、装置により実行可能な指示のプログラムを記録するストレージ媒体で、この方法が、請求項1から8までのいずれか一項のすべての手順を備えている、媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26742209P | 2009-12-07 | 2009-12-07 | |
US61/267,422 | 2009-12-07 | ||
PCT/US2010/054480 WO2011071610A1 (en) | 2009-12-07 | 2010-10-28 | Decoding of multichannel aufio encoded bit streams using adaptive hybrid transformation |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013237842A Division JP5607809B2 (ja) | 2009-12-07 | 2013-11-18 | 適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013511754A true JP2013511754A (ja) | 2013-04-04 |
JP5547297B2 JP5547297B2 (ja) | 2014-07-09 |
Family
ID=43334376
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012541085A Active JP5547297B2 (ja) | 2009-12-07 | 2010-10-28 | 適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング |
JP2013237842A Active JP5607809B2 (ja) | 2009-12-07 | 2013-11-18 | 適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013237842A Active JP5607809B2 (ja) | 2009-12-07 | 2013-11-18 | 適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング |
Country Status (37)
Country | Link |
---|---|
US (2) | US8891776B2 (ja) |
EP (3) | EP2801975B1 (ja) |
JP (2) | JP5547297B2 (ja) |
KR (2) | KR101629306B1 (ja) |
CN (2) | CN102687198B (ja) |
AP (1) | AP3301A (ja) |
AR (1) | AR079878A1 (ja) |
AU (1) | AU2010328635B2 (ja) |
BR (1) | BR112012013745B1 (ja) |
CA (1) | CA2779453C (ja) |
CL (1) | CL2012001493A1 (ja) |
CO (1) | CO6460719A2 (ja) |
DK (1) | DK2510515T3 (ja) |
EA (1) | EA024310B1 (ja) |
EC (1) | ECSP12012006A (ja) |
ES (1) | ES2463840T3 (ja) |
GE (1) | GEP20146081B (ja) |
GT (1) | GT201200134A (ja) |
HK (1) | HK1170058A1 (ja) |
HN (1) | HN2012000819A (ja) |
HR (1) | HRP20140400T1 (ja) |
IL (1) | IL219304A (ja) |
MA (1) | MA33775B1 (ja) |
MX (1) | MX2012005723A (ja) |
MY (1) | MY161012A (ja) |
NI (1) | NI201200063A (ja) |
NZ (1) | NZ599981A (ja) |
PE (1) | PE20130167A1 (ja) |
PL (1) | PL2510515T3 (ja) |
PT (1) | PT2510515E (ja) |
RS (1) | RS53288B (ja) |
SI (1) | SI2510515T1 (ja) |
TN (1) | TN2012000211A1 (ja) |
TW (1) | TWI498881B (ja) |
UA (1) | UA100353C2 (ja) |
WO (1) | WO2011071610A1 (ja) |
ZA (1) | ZA201203290B (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US8948406B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium |
US20120033819A1 (en) * | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium |
US9130596B2 (en) * | 2011-06-29 | 2015-09-08 | Seagate Technology Llc | Multiuse data channel |
WO2013079524A2 (en) * | 2011-11-30 | 2013-06-06 | Dolby International Ab | Enhanced chroma extraction from an audio codec |
CN107993673B (zh) * | 2012-02-23 | 2022-09-27 | 杜比国际公司 | 确定噪声混合因子的方法、系统、编码器、解码器和介质 |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
TWI618051B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
EP2956935B1 (en) | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
US9830917B2 (en) | 2013-02-14 | 2017-11-28 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
MY178342A (en) * | 2013-05-24 | 2020-10-08 | Dolby Int Ab | Coding of audio scenes |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9854377B2 (en) | 2013-05-29 | 2017-12-26 | Qualcomm Incorporated | Interpolation for decomposed representations of a sound field |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
EP3014609B1 (en) | 2013-06-27 | 2017-09-27 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
EP2830063A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for decoding an encoded audio signal |
CN117767898A (zh) | 2013-09-12 | 2024-03-26 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
JP6396452B2 (ja) | 2013-10-21 | 2018-09-26 | ドルビー・インターナショナル・アーベー | オーディオ・エンコーダおよびデコーダ |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) * | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
CN105280212A (zh) * | 2014-07-25 | 2016-01-27 | 中兴通讯股份有限公司 | 混音播放方法及装置 |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
PL3568853T3 (pl) * | 2017-01-10 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio, enkoder audio, sposób dostarczania dekodowanego sygnału audio, sposób dostarczania enkodowanego sygnału audio, strumień audio, moduł dostarczania strumienia audio i program komputerowy używający identyfikator strumienia |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
EP3895164B1 (en) * | 2018-12-13 | 2022-09-07 | Dolby Laboratories Licensing Corporation | Method of decoding audio content, decoder for decoding audio content, and corresponding computer program |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN111711493B (zh) * | 2020-06-16 | 2022-03-11 | 中国电子科技集团公司第三研究所 | 具有加密解密能力的水下通信设备及发射器和接收器 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10340099A (ja) * | 1997-04-11 | 1998-12-22 | Matsushita Electric Ind Co Ltd | オーディオデコーダ装置及び信号処理装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100228688B1 (ko) | 1991-01-08 | 1999-11-01 | 쥬더 에드 에이. | 다차원 음장용 인코우더/디코우더 |
TW405328B (en) * | 1997-04-11 | 2000-09-11 | Matsushita Electric Ind Co Ltd | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
US6246345B1 (en) | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
CN1261663C (zh) * | 2002-12-31 | 2006-06-28 | 深圳市高科智能系统有限公司 | 无线集中控制门禁/门锁的方法及系统设备 |
US7516064B2 (en) * | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
KR101325802B1 (ko) * | 2007-02-06 | 2013-11-05 | 엘지전자 주식회사 | 디지털 방송 송신기 및 디지털 방송 수신기와 그를 이용한디지털 방송 시스템 및 그 서비스 방법 |
CN101067931B (zh) | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
US8706480B2 (en) * | 2007-06-11 | 2014-04-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoding audio signal |
WO2009039897A1 (en) * | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
EP2212884B1 (en) * | 2007-11-06 | 2013-01-02 | Nokia Corporation | An encoder |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
-
2010
- 2010-10-28 MX MX2012005723A patent/MX2012005723A/es active IP Right Grant
- 2010-10-28 US US13/514,286 patent/US8891776B2/en active Active
- 2010-10-28 BR BR112012013745-0A patent/BR112012013745B1/pt active IP Right Grant
- 2010-10-28 EP EP14160585.7A patent/EP2801975B1/en active Active
- 2010-10-28 DK DK10776017.5T patent/DK2510515T3/da active
- 2010-10-28 ES ES10776017.5T patent/ES2463840T3/es active Active
- 2010-10-28 NZ NZ599981A patent/NZ599981A/en unknown
- 2010-10-28 CA CA2779453A patent/CA2779453C/en active Active
- 2010-10-28 JP JP2012541085A patent/JP5547297B2/ja active Active
- 2010-10-28 UA UAA201208193A patent/UA100353C2/uk unknown
- 2010-10-28 EA EA201270642A patent/EA024310B1/ru not_active IP Right Cessation
- 2010-10-28 AP AP2012006289A patent/AP3301A/xx active
- 2010-10-28 WO PCT/US2010/054480 patent/WO2011071610A1/en active Application Filing
- 2010-10-28 KR KR1020137026329A patent/KR101629306B1/ko active IP Right Grant
- 2010-10-28 CN CN201080051553.XA patent/CN102687198B/zh active Active
- 2010-10-28 GE GEAP201012753A patent/GEP20146081B/en unknown
- 2010-10-28 PE PE2012000561A patent/PE20130167A1/es active IP Right Grant
- 2010-10-28 AU AU2010328635A patent/AU2010328635B2/en active Active
- 2010-10-28 KR KR1020127012464A patent/KR101370522B1/ko active IP Right Grant
- 2010-10-28 EP EP10776017.5A patent/EP2510515B1/en active Active
- 2010-10-28 CN CN201410410643.3A patent/CN104217724B/zh active Active
- 2010-10-28 PL PL10776017T patent/PL2510515T3/pl unknown
- 2010-10-28 PT PT107760175T patent/PT2510515E/pt unknown
- 2010-10-28 SI SI201030604T patent/SI2510515T1/sl unknown
- 2010-10-28 EP EP13195367.1A patent/EP2706529A3/en not_active Ceased
- 2010-10-28 MY MYPI2012001912A patent/MY161012A/en unknown
- 2010-10-28 RS RS20140226A patent/RS53288B/en unknown
- 2010-11-04 TW TW099137944A patent/TWI498881B/zh active
- 2010-12-01 AR ARP100104440A patent/AR079878A1/es active IP Right Grant
-
2012
- 2012-04-19 IL IL219304A patent/IL219304A/en active IP Right Grant
- 2012-04-20 HN HN2012000819A patent/HN2012000819A/es unknown
- 2012-04-23 NI NI201200063A patent/NI201200063A/es unknown
- 2012-04-30 GT GT201200134A patent/GT201200134A/es unknown
- 2012-05-07 ZA ZA2012/03290A patent/ZA201203290B/en unknown
- 2012-05-09 TN TNP2012000211A patent/TN2012000211A1/en unknown
- 2012-05-14 CO CO12078993A patent/CO6460719A2/es active IP Right Grant
- 2012-05-31 MA MA34912A patent/MA33775B1/fr unknown
- 2012-06-07 CL CL2012001493A patent/CL2012001493A1/es unknown
- 2012-06-27 EC ECSP12012006 patent/ECSP12012006A/es unknown
- 2012-10-25 HK HK12110658.8A patent/HK1170058A1/xx unknown
-
2013
- 2013-11-18 JP JP2013237842A patent/JP5607809B2/ja active Active
-
2014
- 2014-05-05 HR HRP20140400AT patent/HRP20140400T1/hr unknown
- 2014-10-13 US US14/512,755 patent/US9620132B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10340099A (ja) * | 1997-04-11 | 1998-12-22 | Matsushita Electric Ind Co Ltd | オーディオデコーダ装置及び信号処理装置 |
Non-Patent Citations (1)
Title |
---|
JPN6013049403; Louis D. Fielder, et al.: 'Introduction to Dolby Digital Plus , an Enhancement to the Dolby Digital Coding System' Audio Engineering Society Convention Paper 6196 , 20041028, Audio Engineering Society * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5607809B2 (ja) | 適応型ハイブリッド変換を使用した、マルチチャンネルオーディオエンコード化ビットストリームのデコーディング | |
US7573912B2 (en) | Near-transparent or transparent multi-channel encoder/decoder scheme | |
KR101422745B1 (ko) | 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법 | |
KR101531239B1 (ko) | 다객체 오디오 신호의 부호화 장치 | |
TW200415922A (en) | Conversion of synthesized spectral components for encoding and low-complexity transcoding | |
JP2009513992A (ja) | オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 | |
JP2006201785A (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
IL227635A (en) | Less complicated bends for low-frequency effects channel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5547297 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |