JP2020038374A - マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ - Google Patents
マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ Download PDFInfo
- Publication number
- JP2020038374A JP2020038374A JP2019189837A JP2019189837A JP2020038374A JP 2020038374 A JP2020038374 A JP 2020038374A JP 2019189837 A JP2019189837 A JP 2019189837A JP 2019189837 A JP2019189837 A JP 2019189837A JP 2020038374 A JP2020038374 A JP 2020038374A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- encoder
- decoder
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 claims description 83
- 230000003595 spectral effect Effects 0.000 claims description 47
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 239000002131 composite material Substances 0.000 claims description 9
- 238000011049 filling Methods 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 42
- 230000006870 function Effects 0.000 description 24
- 238000012545 processing Methods 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 20
- 238000001228 spectrum Methods 0.000 description 15
- 230000007704 transition Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 238000009432 framing Methods 0.000 description 5
- 230000002194 synthesizing effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
Description
MPEG−D USACコア符号器に対して、前/後プロセッサとしてPSおよびMPS
MPEG−D USAC規格
MPEG−H 3Dオーディオ規格
−MDCTのAACに対して、IGFおよび結合ステレオ符号化
−QMFのHeAACv2に対して、SBR+PS
−QMFのUSACに対して、SBR+MPS212。
セクション5.3.2補助ペイロードのUSAC規格[1]の表23は、次の通り修正されるべきである。
詳細な復号化手続は、7.x LPDステレオ復号化セクションで説明される。
lpd_stereo_stream():LPDモードのためのステレオデータを復号化するためのデータ要素。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
LPDステレオ符号化
ツール説明
LPDステレオは離散的なM/Sステレオ符号化である。中間チャンネルはモノラルLPDコア符号器によって符号化され、サイド信号はDFTドメインの中で符号化される。復号化された中間信号は、LPDモノラルデコーダから出力されて、それから、LPDステレオモジュールによって処理される。ステレオ復号化は、LチャンネルとRチャンネルとが復号化されるDFTドメインの中でなされる。2つの復号化されたチャンネルは、時間ドメインにおいて元に変換されて、それから、このドメインにおいて、FDモードから復号化されたチャンネルと結合される。FD符号化モードは、複雑な予測によって、または、予測無しで、それ自身のステレオのツール、すなわち離散的なステレオを使っている。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
ステレオ復号化は周波数ドメインにおいて実行される。それはLPDデコーダの後処理として作動する。それはLPDデコーダからモノラル中間信号のシンセサイズを受信する。サイド信号は、その時、周波数ドメインにおいて復号化されるか、または予測される。チャンネルスペクトルは、その時、時間ドメインにおいて再シンセサイズされる前に、周波数ドメインにおいて再構成される。ステレオLPDは、LPDモードの中で使われた符号化モードと独立して、ACELPフレームのサイズと等しい固定されたフレーム長によって働く。
フレームインデックスiのDFTスペクトルは、長さMの復号化されたフレームxから計算される。
DFTスペクトルは、パラメータ帯域と呼ばれる非オーバーラップ周波数帯域の中に分割される。スペクトルの区分化は不均一で、聴覚の周波数分解に似る。スペクトルの2つの異なる分割が、等価矩形帯域幅(ERB)の約2倍または約4倍に続く帯域幅によって可能である。スペクトル区分化はデータ要素res_modにより選択され、以下の擬似符号により定義される。
funtion nbands=band_config(N,res_mod)
band_limits[0]=1;
nbands=0;
while(band_limits[nbands++]<(N/2))[
if(stereo_lpd_res==0)
band_limits[nbands]=band_limits_erb2[nbands];
else
band_limits[nbands]=band_limits_erb4[nbands];
]
nbands--;
band_limits[nbands]=N/2;
return nbands
ここで、nbandsはパラメータ帯域の総数であり、NはDFT分析ウィンドウサイズである。表band_limits_erb2とband_limits_erb4は、表7.x.2において定義される。デコーダは、すべての2つのステレオLPDフレームでスペクトルのパラメータ帯域の解像度を順応して変更できる。
ipd_max_band=max_band[res_mod][ipd_mod]
サイド信号の符号化のためのパラメータ帯域の最大数は、2ビットフィールドcod_modデータ要素内で送られる。
cod_max_band=max_band[res_mod][cod_mod]
テーブルmax_band[][]は表7.x.3において定義される。
サイド信号に対して予側するために、復号化されたラインの数は、その時、以下の式で計算される。
cod_L=2・(band_limits[cod_max_band]−1)
ステレオパラメータ相互チャンネルレベル差(ILD)、相互チャンネル位相差(IPD)および予測利得は、フラグq_modeに依存する全てのフレームまたは全ての2つのフレームに送られる。仮に、q_modeが0に等しいならば、パラメータは全てのフレームを更新する。さもなければ、パラメータ値は、USACフレーム内のステレオLPDフレームの奇数のインデックスiに対してのみ更新する。USACフレーム内のステレオLPDフレームのインデックスiは、LPDバージョン0の中で0と3の間のどちらか、およびLPDバージョン1の中で0と1の間のどちらかが可能である。
0≦b<nbandsに対して、
ILDi[b]=ild_q[ild_idx[i][b]]
低音の後処理は2つのチャンネルで別々に行われる。処理は、[1]のセクション7.17で説明したのと同じ両方のチャンネルのためのものである。
[1]ISO/IEC DIS 23003−3, Usac
[2]ISO/IEC DIS 23008−3, 3D Audio
Claims (27)
- マルチチャンネル信号を符号化するためのオーディオエンコーダ(2)であって、
線形予測ドメインエンコーダ(6)と、
周波数ドメインエンコーダ(8)と、
前記線形予測ドメインエンコーダ(6)と前記周波数ドメインエンコーダ(8)との間を切り替えるためのコントローラ(10)と、
を含み、
前記線形予測ドメインエンコーダ(6)は、マルチチャンネル信号(4)をダウンミックスしてダウンミックス信号(14)を得るためのダウンミキサ(12)、前記ダウンミックス信号(14)を符号化するための線形予測ドメインコアエンコーダ(16)、および、前記マルチチャンネル信号から第1マルチチャンネル情報(20)を生成するための第1結合マルチチャンネルエンコーダ(18)を含み、
前記周波数ドメインエンコーダ(8)は、前記マルチチャンネル信号から第2マルチチャンネル情報(24)を符号化するための第2結合マルチチャンネルエンコーダ(22)を含み、第2結合マルチチャンネルエンコーダ(22)は前記第1結合マルチチャンネルエンコーダ(18)と異なり、
前記コントローラ(10)は、前記マルチチャンネル信号の部分が、前記線形予測ドメインエンコーダの符号化されたフレーム、または、前記周波数ドメインエンコーダの符号化されたフレームのいずれかによって表現されるように構成される、オーディオエンコーダ(2)。 - 前記第1結合マルチチャンネルエンコーダ(18)は、第1の時間−周波数コンバータ(82)を含み、前記第2結合マルチチャンネルエンコーダ(22)は、第2の時間−周波数コンバータ(66)を含み、前記第1の時間−周波数コンバータと前記第2の時間−周波数コンバータとが互いに異なる、請求項1に記載のオーディオエンコーダ(2)。
- 前記第1結合マルチチャンネルエンコーダ(18)は、パラメトリック結合マルチチャンネルエンコーダであるか、または、
前記第2結合マルチチャンネルエンコーダ(22)は、波形維持結合マルチチャンネルエンコーダである、請求項1または請求項2に記載のオーディオエンコーダ(2)。 - 前記パラメトリック結合マルチチャンネルエンコーダは、ステレオ予測コーダ、パラメトリックステレオエンコーダまたは回転ベースのパラメトリックステレオエンコーダを含む、または、
前記波形維持結合マルチチャンネルエンコーダは、帯域選択的スイッチ中間/サイドまたは左/右ステレオコーダを含む、請求項3に記載のオーディオエンコーダ。 - 前記線形予測ドメインエンコーダ(6)は、ACELPプロセッサ(30)とTCXプロセッサ(32)とを含み、前記ACELPプロセッサは、ダウンサンプリングされたダウンミックス信号(34)に作用するように構成され、前記時間ドメイン帯域幅拡張プロセッサ(36)は、第3のダウンサンプリングによって前記ACELP入力信号から取り除かれた前記ダウンミックス信号の一部の帯域をパラメトリック的に符号化するように構成され、
前記TCXプロセッサ(32)は、ダウンサンプリングされていない、または前記ACELPプロセッサのためのダウンサンプリングより少ない程度でダウンサンプリングされた前記ダウンミックス信号(14)に作用するように構成され、前記TCXプロセッサが、第1の時間−周波数コンバータ(40)と、第1帯域セットのパラメトリック表現(46)を生成するための第1パラメータ生成器(42)と、第2帯域セットのための量子化されたエンコーダスペクトルライン(48)のセットを生成するための第1量子化エンコーダ(44)とを含む、請求項1ないし請求項4のいずれかに記載のオーディオエンコーダ。 - 前記周波数ドメインエンコーダ(8)は、前記マルチチャンネル信号(4)の第1チャンネル(4a)および前記マルチチャンネル信号(4)の第2チャンネル(4b)を、スペクトル表現(72a、72b)に変換するための第2の時間−周波数コンバータ(66)と、第2帯域セットのパラメトリック表現を生成するための第2パラメータ生成器(68)と、第1帯域セット(80)の量子化されて符号化された表現を生成するための第2量子化エンコーダ(70)とを含む、請求項1ないし請求項5のいずれかに記載のオーディオエンコーダ(2)。
- 前記線形予測ドメインエンコーダは、時間ドメイン帯域幅拡張を持つACELPプロセッサと、MDCT操作を持つTCXプロセッサと、インテリジェント・ギャップ・フィリング機能とを含む、または、
前記周波数ドメインエンコーダは、前記第1チャンネルおよび前記第2チャンネルのためのMDCT操作と、AAC操作と、インテリジェント・ギャップ・フィリング機能とを含む、または、
前記第1結合マルチチャンネルエンコーダは、前記マルチチャンネルオーディオ信号の全帯域幅のためのマルチチャンネル情報が導出されるような方法で動作するように構成される、請求項1ないし請求項6のいずれかに記載のオーディオエンコーダ(2)。 - 前記ダウンミックス信号(14)を復号化して、符号化されて復号化されたダウンミックス信号(54)を得るための線形予測ドメインデコーダ(50)と、
前記第1マルチチャンネル情報(20)を用いる復号化されたマルチチャンネル表現と、ダウンミックス前の前記マルチチャンネル信号との間の誤差を表現する前記符号化されて復号化されたダウンミックス信号(54)を使って、マルチチャンネル残差信号(58)を計算して符号化するためのマルチチャンネル残差コーダ(56)と、
をさらに含む、請求項1ないし請求項7のいずれかに記載のオーディオエンコーダ(2)。 - 前記ダウンミックス信号は低帯域および高帯域を持ち、前記線形予測ドメインエンコーダは、前記高帯域をパラメトリック的に符号化するために帯域幅拡張処理を適用するように構成され、前記線形予測ドメインデコーダは、前記符号化されて復号化されたダウンミックス信号(54)として、前記ダウンミックス信号の前記低帯域を表現する低帯域信号だけを得るように構成され、前記符号化されたマルチチャンネル残差信号(58)は、ダウンミックス前の前記マルチチャンネル信号の前記低帯域内の周波数しか持っていない、請求項8に記載のオーディオエンコーダ(2)。
- 前記マルチチャンネル残差コーダ(56)は、
前記第1マルチチャンネル情報(20)および前記符号化されて復号化されたダウンミックス信号(54)を使って、復号化されたマルチチャンネル信号(64)を生成するための結合マルチチャンネルデコーダ(60)と、
前記復号化されたマルチチャンネル信号とダウンミックス化前の前記マルチチャンネル信号との間の差を形成して前記マルチチャンネル残差信号を得るためのディファレンスプロセッサ(62)と、
を含む、請求項8または請求項9に記載のオーディオエンコーダ(2)。 - 前記ダウンミキサ(12)は、前記マルチチャンネル信号をスペクトル表現に変換するように構成され、前記ダウンミックスは、前記スペクトル表現を使って、または、時間ドメイン表現を使って実行され、
前記第1マルチチャンネルエンコーダは、前記スペクトル表現の個々の帯域に対して別個の第1マルチチャンネル情報を生成するために、前記スペクトル表現を使用するように構成される、請求項1ないし請求項10のいずれかに記載のオーディオエンコーダ(2)。 - 前記コントローラ(10)は、マルチチャンネルオーディオ信号の現在のフレーム(204)内で、前のフレームを符号化するための周波数ドメインエンコーダ(8)を使うことから、今後のフレームを復号化するための前記線形予測ドメインエンコーダに切り替えるように構成され、
前記第1結合マルチチャンネルエンコーダ(18)は、前記現在フレームのために前記マルチチャンネルオーディオ信号から合成マルチチャンネルパラメータ(210a,210b,212a,212b)を計算するように構成され、
第2結合マルチチャンネルエンコーダ(22)は、停止ウィンドウを使って前記第2マルチチャンネル信号を重み付けるように構成される、請求項1ないし請求項11のいずれかに記載のオーディオエンコーダ(2)。 - 符号化されたオーディオ信号(103)を復号化するためのオーディオデコーダ(102)であって、
線形予測ドメインデコーダ(104)と、
周波数ドメインデコーダ(106)と、
前記線形予測ドメインデコーダ(104)の出力と第1マルチチャンネル情報(20)とを使って第1マルチチャンネル表現(114)を生成するための第1結合マルチチャンネルデコーダ(108)と、
前記周波数ドメインデコーダ(106)の出力と第2マルチチャンネル情報(22,24)とを使って第2マルチチャンネル表現(116)を生成するための第2結合マルチチャンネルデコーダ(110)と、
前記第1マルチチャンネル表現(114)と前記第2マルチチャンネル表現(116)とを結合して復号化されたオーディオ信号(118)を得るための第1結合器(112)と、を含み、
前記第2結合マルチチャンネルデコーダは、前記第1結合マルチチャンネルデコーダと異なる、オーディオデコーダ(102)。 - 前記第1結合マルチチャンネルデコーダ(108)は、パラメトリック結合マルチチャンネルデコーダであり、前記第2結合マルチチャンネルデコーダは、波形維持結合マルチチャンネルデコーダであり、
前記第1結合マルチチャンネルデコーダは、複雑な予測、パラメトリックステレオ操作または回転操作に基づいて動作するように構成され、
前記第2結合マルチチャンネルデコーダは、帯域選択的スイッチを、中間/サイドまたは左/右のステレオ復号化アルゴリズムに適用するように構成される、請求項13に記載のオーディオデコーダ(102)。 - 前記線形予測ドメインデコーダは、
ACELPデコーダ(120)、低帯域シンセサイザ(122)、アップサンプリング器(124)、時間ドメイン帯域幅拡張プロセッサ(126)、または、アップサンプリングされた信号と帯域幅拡張された信号とを結合するための第2結合器(128)、
TCXデコーダ(130)およびインテリジェント・ギャップ・フィリングプロセッサ(132)、
前記第2結合器(128)の出力とTCXデコーダ(130)およびIGFプロセッサ(132)の出力とを結合するための完全帯域シンセサイズプロセッサ(134)を備える、または、
クロスパス(136)は、前記TCXデコーダおよび前記IGFプロセッサからの低帯域スペクトル時間変換によって導出された情報を使って前記低帯域シンセサイザを初期設定するために設けられる、請求項13または請求項14に記載のオーディオデコーダ(102)。 - 前記第1結合マルチチャンネルデコーダは、前記線形予測ドメインデコーダ(104)の前記出力をスペクトル表現(145)に変換するための時間−周波数コンバータ(138)と、
前記スペクトル表現(145)に作用する前記第1マルチチャンネル情報によってコントロールされるアップミキサと、
アップミックス結果を時間表現期間に変換するための周波数−時間コンバータ(148)とを含む、請求項13ないし請求項15のいずれかに記載のオーディオデコーダ(102)。 - 前記第2結合マルチチャンネルデコーダ(110)は、入力として、前記周波数ドメインデコーダによって得られたスペクトル表現を使うように構成され、前記スペクトル表現は、少なくとも複数の帯域について、第1チャンネル信号および第2チャンネル信号を含み、
結合マルチチャンネル操作を前記第1チャンネル信号および前記第2チャンネル信号の複数の帯域に適用し、前記結合マルチチャンネルデコーダ結合マルチチャンネル操作の結果を時間表現に変換して前記第2マルチチャンネル表現を得るように構成される、請求項13ないし請求項16のいずれかに記載のオーディオデコーダ(102)。 - 前記第2マルチチャンネル情報(22)は、個々の帯域について、左/右、または中間/サイドの結合マルチチャンネル符号化を示すマスクであり、前記結合マルチチャンネル操作は、前記マスクによって示された帯域を、前記中間/サイド表現から左/右表現に変換するための、中間/サイドから左/右への変換操作である、請求項17に記載のオーディオデコーダ(102)。
- 符号化された前記マルチチャンネルオーディオ信号は、前記線形予測ドメインデコーダの前記出力のための残差信号を含み、
前記第1結合マルチチャンネルデコーダは、前記第1マルチチャンネル表現を生成するための前記マルチチャンネル残差信号を使うように構成される、請求項13ないし請求項18のいずれかに記載のオーディオデコーダ(102)。 - 前記マルチチャンネル残差信号は、前記第1マルチチャンネル表現より低い帯域幅を持ち、前記第1結合マルチチャンネルデコーダは、前記第1結合マルチチャンネル情報を使って中間的な第1マルチチャンネル表現を再構成し、前記マルチチャンネル残差信号を前記中間的な第1マルチチャンネル表現に追加するように構成される、請求項19に記載のオーディオデコーダ(102)。
- 前記時間−周波数コンバータは、複雑な操作または過剰サンプリング操作を含み、
前記周波数ドメインデコーダは、IMDCT操作または臨界サンプリング操作を含む、請求項16に記載のオーディオデコーダ(102)。 - 前記オーディオデコーダ(102)は、マルチチャンネルオーディオ信号の現在のフレーム(204)内で、前のフレームを復号化するための前記周波数ドメインデコーダ(106)を使うことから、後のフレームを復号化するための前記線形予測ドメインデコーダ(104)に切り替えるように構成され、
前記結合器(112)は、前記現在のフレームの前記第2マルチチャンネル表現(116)から合成中間信号(226)を計算するように構成され、
前記第1結合マルチチャンネルデコーダ(108)は、前記合成中間信号(226)および第1マルチチャンネル情報(20)を使って、前記第1マルチチャンネル表現(114)を生成するように構成され、
前記結合器(112)は、前記第1マルチチャンネル表現および前記第2マルチチャンネル表現を結合して前記マルチチャンネルオーディオ信号の復号化された現在のフレームを得るするように構成される、請求項13ないし請求項21のいずれかに記載のオーディオデコーダ(102)。 - 前記オーディオデコーダ(102)は、マルチチャンネルオーディオ信号の現在のフレーム(232)内で、前のフレームを復号化するための前記線形予測ドメインデコーダ(104)を使うことから、後のフレームを復号化するための前記周波数ドメインデコーダ(106)に切り替えるように構成され、
前記ステレオデコーダ(146)は、前のフレームのマルチチャンネル情報を使って、現在のフレームについての前記線形予測ドメインデコーダの復号化されたモノラル信号から、合成マルチチャンネルオーディオ信号を計算するように構成され、
前記第2結合マルチチャンネルデコーダ(110)は、前記現在のフレームについての第2マルチチャンネル表現を計算し、スタートウィンドウを使って、前記第2マルチチャンネル表現の重み付けをするように構成され、
前記結合器(112)は、前記合成マルチチャンネルオーディオ信号と前記重み付けされた第2マルチチャンネル表現を結合して前記マルチチャンネルオーディオ信号の復号化された現在のフレームを得るためように構成される、請求項13ないし請求項22のいずれかに記載のオーディオデコーダ(102)。 - マルチチャンネルとは2つ以上のチャンネルを意味する、請求項1ないし請求項12のいずれかに記載のオーディオエンコーダ、または請求項13ないし請求項23のいずれかに記載のオーディオデコーダ。
- マルチチャンネル信号を符号化する方法(800)であって、
線形予測ドメイン符号化を実行するステップと、
周波数ドメイン符号化を実行するステップと、
前記線形予測ドメイン符号化と前記周波数ドメイン符号化との間の切り替えをするステップと、
を含み、
前記線形予測ドメイン符号化を実行するステップは、ダウンミックス信号と、前記ダウンミックス信号をコア符号化する線形予測ドメインと、前記マルチチャンネル信号から第1のマルチチャンネル情報を生成する第1の結合マルチチャンネル符号化を得るために、マルチチャンネル信号をダウンミックスするステップを含み、
前記周波数ドメイン符号化を実行するステップは、前記マルチチャンネル信号から第2マルチチャンネル情報を生成する第2結合マルチチャンネル符号化するステップを含み、前記第2結合マルチチャンネル符号化するステップは、第1マルチチャンネル符号化するステップと異なり、
前記切り替えするステップは、前記マルチチャンネル信号の部分が、前記線形予測ドメイン符号化の符号化されたフレーム、または、前記周波数ドメイン符号化の符号化されたフレームのいずれかによって表現されるように実行される、方法(800)。 - 符号化されたオーディ信号を復号化する方法(900)であって、
線形予測ドメイン復号化するステップと、
周波数ドメイン復号化するステップと、
前記線形予測ドメイン復号化の出力および第1マルチチャンネル情報を使って、第1マルチチャンネル表現を生成する第1結合マルチチャンネル復号化するステップと、
前記周波数ドメイン復号化の出力および第2マルチチャンネル情報を使って、第2マルチチャンネル表現を生成する第2結合マルチチャンネル復号化するステップと、
復号化されたオーディオ信号を得るために、前記第1マルチチャンネル表現と前記第2マルチチャンネル表現を結合するステップと、
を含み、
前記第2マルチチャンネル復号化するステップは、前記第1マルチチャンネル復号化するステップと異なる、符号化されたオーディオ信号を復号化する方法(900)。 - コンピュータ・プログラムがコンピュータまたはプロセッサ上で稼働すると、請求項25または請求項26の方法を実行するためのコンピュータ・プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022045510A JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158233.5 | 2015-03-09 | ||
EP15158233 | 2015-03-09 | ||
EP15172594.2A EP3067886A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP15172594.2 | 2015-06-17 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548014A Division JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022045510A Division JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020038374A true JP2020038374A (ja) | 2020-03-12 |
JP7077290B2 JP7077290B2 (ja) | 2022-05-30 |
Family
ID=52682621
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2019189837A Active JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Country Status (19)
Country | Link |
---|---|
US (7) | US10388287B2 (ja) |
EP (9) | EP3067887A1 (ja) |
JP (6) | JP6643352B2 (ja) |
KR (2) | KR102075361B1 (ja) |
CN (6) | CN112614497A (ja) |
AR (6) | AR103880A1 (ja) |
AU (2) | AU2016231284B2 (ja) |
BR (4) | BR112017018439B1 (ja) |
CA (2) | CA2978812C (ja) |
ES (6) | ES2959970T3 (ja) |
FI (1) | FI3958257T3 (ja) |
MX (2) | MX366860B (ja) |
MY (2) | MY194940A (ja) |
PL (6) | PL3268957T3 (ja) |
PT (3) | PT3268958T (ja) |
RU (2) | RU2680195C1 (ja) |
SG (2) | SG11201707343UA (ja) |
TW (2) | TWI613643B (ja) |
WO (2) | WO2016142336A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP3284087B1 (en) * | 2016-01-22 | 2019-03-06 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
CN110710181B (zh) | 2017-05-18 | 2022-09-23 | 弗劳恩霍夫应用研究促进协会 | 管理网络设备 |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
US10475457B2 (en) | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
CN109389987B (zh) * | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
US10535357B2 (en) | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10734001B2 (en) * | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
WO2019121982A1 (en) * | 2017-12-19 | 2019-06-27 | Dolby International Ab | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
AU2019216363B2 (en) | 2018-02-01 | 2021-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis |
EP3550561A1 (en) * | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
IL307898A (en) * | 2018-07-02 | 2023-12-01 | Dolby Laboratories Licensing Corp | Methods and devices for encoding and/or decoding embedded audio signals |
AU2019298307A1 (en) * | 2018-07-04 | 2021-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multisignal audio coding using signal whitening as preprocessing |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN110267142B (zh) * | 2019-06-25 | 2021-06-22 | 维沃移动通信有限公司 | 一种移动终端及控制方法 |
FR3101741A1 (fr) * | 2019-10-02 | 2021-04-09 | Orange | Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés |
US11432069B2 (en) * | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
CA3163373A1 (en) * | 2020-02-03 | 2021-08-12 | Vaclav Eksler | Switching between stereo coding modes in a multichannel sound codec |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
US20230360660A1 (en) * | 2020-09-25 | 2023-11-09 | Apple Inc. | Seamless scalable decoding of channels, objects, and hoa audio content |
TWI803999B (zh) * | 2020-10-09 | 2023-06-01 | 弗勞恩霍夫爾協會 | 使用頻寬擴展處理編碼音頻場景的裝置、方法或電腦程式 |
WO2022176270A1 (ja) * | 2021-02-16 | 2022-08-25 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、及び、復号方法 |
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CA3240986A1 (en) * | 2021-12-20 | 2023-06-29 | Dolby International Ab | Ivas spar filter bank in qmf domain |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09200055A (ja) * | 1996-01-12 | 1997-07-31 | Nippon Steel Corp | オーディオ復号装置 |
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
JP2007515672A (ja) * | 2003-12-04 | 2007-06-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号符号化 |
JP2008505368A (ja) * | 2004-07-09 | 2008-02-21 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を生成するための装置及び方法 |
JP2011527453A (ja) * | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム |
JP2011528129A (ja) * | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 切り換え可能なバイパスを有するオーディオ符号化/復号化方式 |
JP2012505429A (ja) * | 2008-10-10 | 2012-03-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
JP2012521012A (ja) * | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
JP2018511827A (ja) * | 2015-03-09 | 2018-04-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
DE4307688A1 (de) * | 1993-03-11 | 1994-09-15 | Daimler Benz Ag | Verfahren zur Geräuschreduktion für gestörte Sprachkanäle |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JP4907826B2 (ja) | 2000-02-29 | 2012-04-04 | クゥアルコム・インコーポレイテッド | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
SE519981C2 (sv) | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US7742912B2 (en) * | 2004-06-21 | 2010-06-22 | Koninklijke Philips Electronics N.V. | Method and apparatus to encode and decode multi-channel audio signals |
EP1818911B1 (en) * | 2004-12-27 | 2012-02-08 | Panasonic Corporation | Sound coding device and sound coding method |
US8457319B2 (en) | 2005-08-31 | 2013-06-04 | Panasonic Corporation | Stereo encoding device, stereo decoding device, and stereo encoding method |
WO2008035949A1 (en) * | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
WO2009007639A1 (fr) | 2007-07-03 | 2009-01-15 | France Telecom | Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe |
CN101373594A (zh) * | 2007-08-21 | 2009-02-25 | 华为技术有限公司 | 修正音频信号的方法及装置 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
KR101221918B1 (ko) * | 2007-11-21 | 2013-01-15 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
KR20100086000A (ko) * | 2007-12-18 | 2010-07-29 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR101162275B1 (ko) * | 2007-12-31 | 2012-07-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
WO2009131076A1 (ja) | 2008-04-25 | 2009-10-29 | 日本電気株式会社 | 無線通信装置 |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
BRPI0910784B1 (pt) | 2008-07-11 | 2022-02-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
CA2871268C (en) | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
CN102089814B (zh) * | 2008-07-11 | 2012-11-21 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
CN101809656B (zh) | 2008-07-29 | 2013-03-13 | 松下电器产业株式会社 | 音响编码装置、音响解码装置、音响编码解码装置及会议系统 |
EP2169670B1 (en) * | 2008-09-25 | 2016-07-20 | LG Electronics Inc. | An apparatus for processing an audio signal and method thereof |
TWI520128B (zh) * | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
GB2470059A (en) * | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
CN102648494B (zh) * | 2009-10-08 | 2014-07-02 | 弗兰霍菲尔运输应用研究公司 | 多模式音频信号解码器、多模式音频信号编码器、使用基于线性预测编码的噪声塑形的方法 |
ES2533098T3 (es) * | 2009-10-20 | 2015-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de señal de audio, decodificador de señal de audio, método para proveer una representación codificada de un contenido de audio, método para proveer una representación decodificada de un contenido de audio y programa de computación para su uso en aplicaciones de bajo retardo |
RU2591011C2 (ru) * | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) |
BR112012009490B1 (pt) | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
WO2011059254A2 (en) * | 2009-11-12 | 2011-05-19 | Lg Electronics Inc. | An apparatus for processing a signal and method thereof |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
US8166830B2 (en) * | 2010-07-02 | 2012-05-01 | Dresser, Inc. | Meter devices and methods |
JP5499981B2 (ja) * | 2010-08-02 | 2014-05-21 | コニカミノルタ株式会社 | 画像処理装置 |
KR101748756B1 (ko) * | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
WO2013156814A1 (en) * | 2012-04-18 | 2013-10-24 | Nokia Corporation | Stereo audio signal encoder |
JP6126006B2 (ja) * | 2012-05-11 | 2017-05-10 | パナソニック株式会社 | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 |
CN102779518B (zh) * | 2012-07-27 | 2014-08-06 | 深圳广晟信源技术有限公司 | 用于双核编码模式的编码方法和系统 |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830052A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US20150159036A1 (en) | 2013-12-11 | 2015-06-11 | Momentive Performance Materials Inc. | Stable primer formulations and coatings with nano dispersion of modified metal oxides |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
-
2015
- 2015-06-17 EP EP15172599.1A patent/EP3067887A1/en not_active Withdrawn
- 2015-06-17 EP EP15172594.2A patent/EP3067886A1/en not_active Withdrawn
-
2016
- 2016-03-02 TW TW105106306A patent/TWI613643B/zh active
- 2016-03-02 TW TW105106305A patent/TWI609364B/zh active
- 2016-03-07 PL PL16708171T patent/PL3268957T3/pl unknown
- 2016-03-07 EP EP16708172.8A patent/EP3268958B1/en active Active
- 2016-03-07 PT PT167081728T patent/PT3268958T/pt unknown
- 2016-03-07 MX MX2017011187A patent/MX366860B/es active IP Right Grant
- 2016-03-07 CN CN202110019042.XA patent/CN112614497A/zh active Pending
- 2016-03-07 RU RU2017134385A patent/RU2680195C1/ru active
- 2016-03-07 JP JP2017548000A patent/JP6643352B2/ja active Active
- 2016-03-07 ES ES21171831T patent/ES2959970T3/es active Active
- 2016-03-07 MX MX2017011493A patent/MX364618B/es active IP Right Grant
- 2016-03-07 PL PL21171826.7T patent/PL3879527T3/pl unknown
- 2016-03-07 MY MYPI2017001286A patent/MY194940A/en unknown
- 2016-03-07 ES ES16708171T patent/ES2910658T3/es active Active
- 2016-03-07 CN CN202110019014.8A patent/CN112614496B/zh active Active
- 2016-03-07 AU AU2016231284A patent/AU2016231284B2/en active Active
- 2016-03-07 WO PCT/EP2016/054775 patent/WO2016142336A1/en active Application Filing
- 2016-03-07 CN CN202110018176.XA patent/CN112634913B/zh active Active
- 2016-03-07 CN CN201680014670.6A patent/CN107408389B/zh active Active
- 2016-03-07 PL PL16708172T patent/PL3268958T3/pl unknown
- 2016-03-07 BR BR112017018439-7A patent/BR112017018439B1/pt active IP Right Grant
- 2016-03-07 ES ES21191544T patent/ES2951090T3/es active Active
- 2016-03-07 MY MYPI2017001288A patent/MY186689A/en unknown
- 2016-03-07 CA CA2978812A patent/CA2978812C/en active Active
- 2016-03-07 FI FIEP21191544.2T patent/FI3958257T3/fi active
- 2016-03-07 CN CN202110178110.7A patent/CN112951248B/zh active Active
- 2016-03-07 CA CA2978814A patent/CA2978814C/en active Active
- 2016-03-07 BR BR112017018441-9A patent/BR112017018441B1/pt active IP Right Grant
- 2016-03-07 EP EP16708171.0A patent/EP3268957B1/en active Active
- 2016-03-07 EP EP21191544.2A patent/EP3958257B1/en active Active
- 2016-03-07 JP JP2017548014A patent/JP6606190B2/ja active Active
- 2016-03-07 PT PT167081710T patent/PT3268957T/pt unknown
- 2016-03-07 ES ES21171835T patent/ES2958535T3/es active Active
- 2016-03-07 ES ES16708172T patent/ES2901109T3/es active Active
- 2016-03-07 KR KR1020177028152A patent/KR102075361B1/ko active IP Right Grant
- 2016-03-07 EP EP21171831.7A patent/EP3879528B1/en active Active
- 2016-03-07 SG SG11201707343UA patent/SG11201707343UA/en unknown
- 2016-03-07 BR BR122022025643-0A patent/BR122022025643B1/pt active IP Right Grant
- 2016-03-07 PT PT211915442T patent/PT3958257T/pt unknown
- 2016-03-07 ES ES21171826T patent/ES2959910T3/es active Active
- 2016-03-07 RU RU2017133918A patent/RU2679571C1/ru active
- 2016-03-07 KR KR1020177028167A patent/KR102151719B1/ko active IP Right Grant
- 2016-03-07 PL PL21191544.2T patent/PL3958257T3/pl unknown
- 2016-03-07 PL PL21171835.8T patent/PL3910628T3/pl unknown
- 2016-03-07 SG SG11201707335SA patent/SG11201707335SA/en unknown
- 2016-03-07 EP EP23166790.8A patent/EP4224470A1/en active Pending
- 2016-03-07 WO PCT/EP2016/054776 patent/WO2016142337A1/en active Application Filing
- 2016-03-07 BR BR122022025766-6A patent/BR122022025766B1/pt active IP Right Grant
- 2016-03-07 PL PL21171831.7T patent/PL3879528T3/pl unknown
- 2016-03-07 EP EP21171826.7A patent/EP3879527B1/en active Active
- 2016-03-07 AU AU2016231283A patent/AU2016231283C1/en active Active
- 2016-03-07 EP EP21171835.8A patent/EP3910628B1/en active Active
- 2016-03-07 CN CN201680014669.3A patent/CN107430863B/zh active Active
- 2016-03-08 AR ARP160100608A patent/AR103880A1/es active IP Right Grant
- 2016-03-08 AR ARP160100609A patent/AR103881A1/es active IP Right Grant
-
2017
- 2017-09-05 US US15/695,668 patent/US10388287B2/en active Active
- 2017-09-05 US US15/695,424 patent/US10395661B2/en active Active
-
2019
- 2019-03-22 US US16/362,462 patent/US10777208B2/en active Active
- 2019-07-09 US US16/506,767 patent/US11238874B2/en active Active
- 2019-10-17 JP JP2019189837A patent/JP7077290B2/ja active Active
-
2020
- 2020-01-06 JP JP2020000185A patent/JP7181671B2/ja active Active
- 2020-08-31 US US17/008,428 patent/US11107483B2/en active Active
-
2021
- 2021-08-24 US US17/410,033 patent/US11741973B2/en active Active
- 2021-10-18 AR ARP210102869A patent/AR123837A2/es unknown
- 2021-10-18 AR ARP210102867A patent/AR123835A2/es unknown
- 2021-10-18 AR ARP210102868A patent/AR123836A2/es unknown
- 2021-10-18 AR ARP210102866A patent/AR123834A2/es unknown
-
2022
- 2022-01-13 US US17/575,260 patent/US11881225B2/en active Active
- 2022-03-22 JP JP2022045510A patent/JP7469350B2/ja active Active
- 2022-11-17 JP JP2022183880A patent/JP2023029849A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09200055A (ja) * | 1996-01-12 | 1997-07-31 | Nippon Steel Corp | オーディオ復号装置 |
JP2007515672A (ja) * | 2003-12-04 | 2007-06-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号符号化 |
JP2008505368A (ja) * | 2004-07-09 | 2008-02-21 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を生成するための装置及び方法 |
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
JP2011527453A (ja) * | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム |
JP2011528129A (ja) * | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 切り換え可能なバイパスを有するオーディオ符号化/復号化方式 |
JP2012505429A (ja) * | 2008-10-10 | 2012-03-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
JP2012521012A (ja) * | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
JP2018511827A (ja) * | 2015-03-09 | 2018-04-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Non-Patent Citations (1)
Title |
---|
堤公孝 他: ""VoLTEのさらなる高音質化と音楽の活用を実現する3GPP標準音声符号化方式EVS"", NTT DOCOMOテクニカル・ジャーナル, vol. 22, no. 4, JPN6020048904, 1 January 2015 (2015-01-01), pages 6 - 13, ISSN: 0004666865 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7469350B2 (ja) | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7077290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |