JP7181671B2 - マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ - Google Patents
マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ Download PDFInfo
- Publication number
- JP7181671B2 JP7181671B2 JP2020000185A JP2020000185A JP7181671B2 JP 7181671 B2 JP7181671 B2 JP 7181671B2 JP 2020000185 A JP2020000185 A JP 2020000185A JP 2020000185 A JP2020000185 A JP 2020000185A JP 7181671 B2 JP7181671 B2 JP 7181671B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- band
- encoder
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 113
- 238000000034 method Methods 0.000 claims description 95
- 230000003595 spectral effect Effects 0.000 claims description 52
- 238000001228 spectrum Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 31
- 238000004458 analytical method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000011049 filling Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000002156 mixing Methods 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 42
- 230000006870 function Effects 0.000 description 25
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 238000009432 framing Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000005562 fading Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Analogue/Digital Conversion (AREA)
Description
MPEG-D USACコア符号器に対して、前/後プロセッサとしてPSおよびMPS
MPEG-D USAC規格
MPEG-H 3Dオーディオ規格
-MDCTのAACに対して、IGFおよび結合ステレオ符号化
-QMFのHeAACv2に対して、SBR+PS
-QMFのUSACに対して、SBR+MPS212。
セクション5.3.2補助ペイロードのUSAC規格[1]の表23は、次の通り修正されるべきである。
詳細な復号化手続は、7.x LPDステレオ復号化セクションで説明される。
lpd_stereo_stream():LPDモードのためのステレオデータを復号化するためのデータ要素。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
LPDステレオ符号化
ツール説明
LPDステレオは離散的なM/Sステレオ符号化である。中間チャンネルはモノラルLPDコア符号器によって符号化され、サイド信号はDFTドメインの中で符号化される。復号化された中間信号は、LPDモノラルデコーダから出力されて、それから、LPDステレオモジュールによって処理される。ステレオ復号化は、LチャンネルとRチャンネルとが復号化されるDFTドメインの中でなされる。2つの復号化されたチャンネルは、時間ドメインにおいて元に変換されて、それから、このドメインにおいて、FDモードから復号化されたチャンネルと結合される。FD符号化モードは、複雑な予測によって、または、予測無しで、それ自身のステレオのツール、すなわち離散的なステレオを使っている。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
ステレオ復号化は周波数ドメインにおいて実行される。それはLPDデコーダの後処理として作動する。それはLPDデコーダからモノラル中間信号のシンセサイズを受信する。サイド信号は、その時、周波数ドメインにおいて復号化されるか、または予測される。チャンネルスペクトルは、その時、時間ドメインにおいて再シンセサイズされる前に、周波数ドメインにおいて再構成される。ステレオLPDは、LPDモードの中で使われた符号化モードと独立して、ACELPフレームのサイズと等しい固定されたフレーム長によって働く。
フレームインデックスiのDFTスペクトルは、長さMの復号化されたフレームxから計算される。
DFTスペクトルは、パラメータ帯域と呼ばれる非オーバーラップ周波数帯域の中に分割される。スペクトルの区分化は不均一で、聴覚の周波数分解に似る。スペクトルの2つの異なる分割が、等価矩形帯域幅(ERB)の約2倍または約4倍に続く帯域幅によって可能である。スペクトル区分化はデータ要素res_modにより選択され、以下の擬似符号により定義される。
funtion nbands=band_config(N,res_mod)
band_limits[0]=1;
nbands=0;
while(band_limits[nbands++]<(N/2))[
if(stereo_lpd_res==0)
band_limits[nbands]=band_limits_erb2[nbands];
else
band_limits[nbands]=band_limits_erb4[nbands];
]
nbands--;
band_limits[nbands]=N/2;
return nbands
ここで、nbandsはパラメータ帯域の総数であり、NはDFT分析ウィンドウサイズである。表band_limits_erb2とband_limits_erb4は、表7.x.2において定義される。デコーダは、すべての2つのステレオLPDフレームでスペクトルのパラメータ帯域の解像度を順応して変更できる。
ipd_max_band=max_band[res_mod][ipd_mod]
サイド信号の符号化のためのパラメータ帯域の最大数は、2ビットフィールドcod_modデータ要素内で送られる。
cod_max_band=max_band[res_mod][cod_mod]
テーブルmax_band[][]は表7.x.3において定義される。
サイド信号に対して予側するために、復号化されたラインの数は、その時、以下の式で計算される。
cod_L=2・(band_limits[cod_max_band]-1)
ステレオパラメータ相互チャンネルレベル差(ILD)、相互チャンネル位相差(IPD)および予測利得は、フラグq_modeに依存する全てのフレームまたは全ての2つのフレームに送られる。仮に、q_modeが0に等しいならば、パラメータは全てのフレームを更新する。さもなければ、パラメータ値は、USACフレーム内のステレオLPDフレームの奇数のインデックスiに対してのみ更新する。USACフレーム内のステレオLPDフレームのインデックスiは、LPDバージョン0の中で0と3の間のどちらか、およびLPDバージョン1の中で0と1の間のどちらかが可能である。
0≦b<nbandsに対して、
ILDi[b]=ild_q[ild_idx[i][b]]
低音の後処理は2つのチャンネルで別々に行われる。処理は、[1]のセクション7.17で説明したのと同じ両方のチャンネルのためのものである。
[1]ISO/IEC DIS 23003-3, Usac
[2]ISO/IEC DIS 23008-3, 3D Audio
Claims (21)
- マルチチャンネル信号(4)を符号化するためのオーディオエンコーダ(2’’)であって、
前記マルチチャンネル信号(4)をダウンミックスしてダウンミックス信号(14)を得るためのダウンミキサ(12)と、
前記ダウンミックス信号(14)を符号化して符号化されたダウンミックス信号(26)を得るための線形予測ドメインコアエンコーダ(16)であって、前記ダウンミックス信号(14)は低帯域および高帯域を持ち、前記線形予測ドメインコアエンコーダ(16)は、前記高帯域をパラメトリック的に符号化するために帯域幅拡張処理を適用するように構成される、前記線形予測ドメインコアエンコーダ(16)と、
前記マルチチャンネル信号(4)のスペクトル表現を生成するためのフィルタバンク(82)と、
前記マルチチャンネル信号(4)の前記低帯域と前記高帯域とを含む前記スペクトル表現を処理して第1マルチチャンネル情報(20)を生成するように構成される第1結合マルチチャンネルエンコーダ(18)と、
を含む線形予測ドメインエンコーダ(6)と、
前記マルチチャンネル信号(4)からの第2マルチチャンネル情報(24)を生成するための第2結合マルチチャンネルエンコーダ(22)を含む周波数ドメインエンコーダ(8)であって、前記第2結合マルチチャンネルエンコーダ(22)は、前記第1結合マルチチャンネルエンコーダ(18)と異なる、周波数ドメインエンコーダ(8)と、
前記線形予測ドメインエンコーダ(6)と前記周波数ドメインエンコーダ(8)との間で切り替えるためのコントローラ(10)であって、前記コントローラ(10)は、前記マルチチャンネル信号(4)の一部分が、前記線形予測ドメインエンコーダ(6)から得られた符号化されたフレーム、または前記周波数ドメインエンコーダ(8)から得られた符号化されたフレームのいずれかによって表現されるように構成される、コントローラ(10)と、
を備える、オーディオエンコーダ(2’’)。 - 前記線形予測ドメインコアエンコーダ(16)は、前記符号化されたダウンミックス信号(26)を復号化して、符号化されて復号化されたダウンミックス信号(54)を得るための線形予測ドメインデコーダ(50)をさらに含み、
前記オーディオエンコーダ(2’’)は、前記符号化されて復号化されたダウンミックス信号(54)を使って、符号化されたマルチチャンネル残差信号(58)を計算するためのマルチチャンネル残差コーダ(56)をさらに含み、前記符号化されたマルチチャンネル残差信号(58)は、前記第1マルチチャンネル情報(20)を使って得られる復号化されたマルチチャンネル表現と前記ダウンミキサ(12)によるダウンミックス前の前記マルチチャンネル信号(4)との間の誤差を表現する、請求項1に記載のオーディオエンコーダ(2’’)。 - 前記線形予測ドメインデコーダ(50)は、前記符号化されて復号化されたダウンミックス信号(54)として、前記ダウンミックス信号(14)の前記低帯域を表現する低帯域信号だけを得るように構成され、前記符号化されたマルチチャンネル残差信号(58)は、前記ダウンミキサ(12)によるダウンミックス前の前記マルチチャンネル信号(4)の低帯域に相当する帯域しか持っていない、請求項2に記載のオーディオエンコーダ(2’’)。
- 前記線形予測ドメインコアエンコーダ(16)は、ACELPプロセッサ(30)を含み、前記ACELPプロセッサは、ダウンサンプラ(35)により前記ダウンミックス信号(14)から得られたダウンサンプリングされたダウンミックス信号(34)に作用するように構成され、時間ドメイン帯域幅拡張プロセッサ(36)は、前記ダウンサンプラ(35)を用いた前記ダウンサンプリングによって前記ダウンミックス信号(14)から取り除かれた前記ダウンミックス信号(14)の前記高帯域をパラメトリック的に符号化するように構成される、請求項1ないし請求項3のいずれかに記載のオーディオエンコーダ(2’’)。
- 前記線形予測ドメインコアエンコーダ(16)はTCXプロセッサ(32)を含み、前記TCXプロセッサ(32)は、ダウンサンプルされていない前記ダウンミックス信号(14)、または前記ダウンサンプラ(35)がACELPプロセッサのために行うダウンサンプリングより少ない程度でダウンサンプルされた前記ダウンミックス信号(14)に作用するように構成され、前記TCXプロセッサは、時間-周波数コンバータ(40)と、第1帯域セットのパラメトリック表現(46)を生成するためのパラメータ生成器(42)と、第2帯域セットのための量子化され符号化されたスペクトルライン(48)のセットを生成するための量子化エンコーダ(44)とを含む、請求項4に記載のオーディオエンコーダ(2’’)。
- 前記時間-周波数コンバータ(40)は、前記フィルタバンク(82)とは異なり、前記フィルタバンク(82)は、前記マルチチャンネル信号(4)のスペクトル表現を生成するために最適化されたフィルタパラメータを含むか、または、前記時間-周波数コンバータ(40)は、前記第1帯域セットのパラメトリック表現(46)を生成するために最適化されたフィルタパラメータを含む、請求項5に記載のオーディオエンコーダ(2’’)。
- 前記第1結合マルチチャンネルエンコーダ(18)は、第1フレーム生成器を含み、前記線形予測ドメインコアエンコーダ(16)は第2フレーム生成器を含み、前記第1フレーム生成器および前記第2フレーム生成器は前記マルチチャンネル信号(4)からフレームを形成するように構成され、前記第1フレーム生成器および前記第2フレーム生成器は、同等の長さのフレームを形成するように構成される、請求項1ないし請求項6のいずれかに記載のオーディオエンコーダ(2’’)。
- 前記線形予測ドメインコアエンコーダ(16)は、M/S(中間/サイド)マルチチャンネルオーディオ信号の中間信号のパラメトリック表現として、前記ダウンミックス信号(14)を計算するように構成され、
前記マルチチャンネル残差コーダ(56)は、前記M/Sマルチチャンネルオーディオ信号の前記中間信号に相当するサイド信号を計算するように構成され、前記マルチチャンネル残差コーダ(56)は、シミュレーション時間ドメイン帯域幅拡張を使って、前記中間信号の高帯域を計算するように構成される、または、前記マルチチャンネル残差コーダ(56)は、前のフレームから計算されたサイド信号と計算された全帯域中間信号との間の差を最小化する予測情報の発見を使って、前記中間信号の前記高帯域を予測するように構成される、請求項2に記載のオーディオエンコーダ(2’’)。 - コア符号化された信号、帯域幅拡張パラメータ、および第1マルチチャンネル情報(20)を含む符号化されたオーディオ信号(103)を復号化するためのオーディオデコーダ(102’’)であって、前記オーディオデコーダ(102’’)は、
前記コア符号化された信号を復号化してモノラル信号(142)を生成するための線形予測ドメインコアデコーダ(104)と、
前記モノラル信号(142)をスペクトル表現(145)に変換するための分析フィルタバンク(144)と、
前記モノラル信号(142)の前記スペクトル表現(145)および前記第1マルチチャンネル情報(20)から、第1チャンネルスペクトルおよび第2チャンネルスペクトルを生成するための第1結合マルチチャンネルデコーダ(146)と、
前記第1チャンネルスペクトルをシンセサイズフィルタリングして第1チャンネル信号を得るための、そして、前記第2チャンネルスペクトルをシンセサイズフィルタリングして第2チャンネル信号を得るためのシンセサイズフィルタバンクプロセッサ(148)と、
周波数ドメインデコーダ(106)と、
前記周波数ドメインデコーダ(106)の出力および第2マルチチャンネル情報(22,24)を使って第2マルチチャンネル表現(116)を生成するための第2結合マルチチャンネルデコーダ(110)であって、前記第2結合マルチチャンネルデコーダ(110)は前記第1結合マルチチャンネルデコーダ(146)と異なる、第2結合マルチチャンネルデコーダ(110)と、
復号化されたオーディオ信号(118)を得るために、前記第1チャンネル信号および前記第2チャンネル信号を前記第2マルチチャンネル表現(116)と結合するための結合器(112)と、
を含む、オーディオデコーダ(102’’)。 - 前記線形予測ドメインコアデコーダは、
前記帯域幅拡張パラメータおよび低帯域信号である前記モノラル信号(142)または前記コア符号化された信号から、前記オーディオ信号の復号化された高帯域(140)である帯域幅拡張高帯域信号(140)を生成するための時間ドメイン帯域幅拡張プロセッサ(126)と、
ACELPデコーダ(120)、低帯域シンセサイザ(122)、および復号化された低帯域モノラル信号であるアップサンプリングされた低帯域信号を出力するためのアップサンプラ(124)と、
前記オーディオ信号の前記復号化された低帯域モノラル信号および前記オーディオ信号の前記復号化された高帯域(140)を使って、全帯域ACELP復号化されたモノラル信号を計算するように構成される別の結合器(128)と、
全帯域TCX復号化されたモノラル信号を得るためのTCXデコーダ(130)およびインテリジェント・ギャップ・フィリング(IGF)プロセッサ(132)と、
前記全帯域ACELP復号化されたモノラル信号と前記全帯域TCX復号化されたモノラル信号とを結合するための全帯域シンセサイズプロセッサ(134)と、を含む、請求項9に記載のオーディオデコーダ(102’’)。 - 前記TCXデコーダ(130)および前記IGFプロセッサ(132)から低帯域スペクトル時間変換によって導出された情報を使って、前記低帯域シンセサイザ(122)を初期化するためのクロスパス(136)が提供される、請求項10に記載のオーディオデコーダ(102’’)。
- 前記分析フィルタバンク(144)は、前記モノラル信号(142)を前記スペクトル表現(145)に変換するためのDFTを含み、また、前記シンセサイズフィルタバンクプロセッサ(148)は、前記第1チャンネルスペクトルを前記第1チャンネル信号に変換し、前記第2チャンネルスペクトルを前記第2チャンネル信号に変換するためのIDFTを含む、請求項9ないし請求項11のいずれかに記載のオーディオデコーダ(102’’)。
- 前記分析フィルタバンク(144)は、前のフレームの前記スペクトル表現の右の部分と現在フレームの前記スペクトル表現の左の部分とがオーバーラップするように、ウィンドウを、DFT変換された前記スペクトル表現(145)に適用するように構成され、前記前のフレームと前記現在フレームは連続している、請求項12に記載のオーディオデコーダ(102’’)。
- 前記第1結合マルチチャンネルデコーダ(146)は、前記モノラル信号(142)の前記スペクトル表現(145)から前記第1チャンネルスペクトルおよび前記第2チャンネルスペクトルを得るように構成され、前記モノラル信号(142)はマルチチャンネル信号の中間信号であり、
前記第1結合マルチチャンネルデコーダ(146)は、前記第1マルチチャンネル情報(20)からM/S(中間/サイド)マルチチャンネル復号化されたオーディオ信号のサイド信号を計算するように構成される、請求項9ないし請求項13のいずれかに記載のオーディオデコーダ(102’’)。 - 前記第1結合マルチチャンネルデコーダ(146)は、
前記第1マルチチャンネル情報(20)を使って、前記M/Sマルチチャンネル復号化されたオーディオ信号の前記サイド信号から、L/R(左/右)マルチチャンネル復号化されたオーディオ信号の低帯域を計算するように構成される、または、
前記中間信号から予測されたサイド信号を計算し、前記予測されたサイド信号と前記第1マルチチャンネル情報(20)のILD(チャンネル間レベル差)値を使って、前記L/Rマルチチャンネル復号化されたオーディオ信号の高帯域を計算するように構成される、請求項14に記載のオーディオデコーダ(102’’)。 - 前記第1結合マルチチャンネルデコーダ(146)は、
前記L/Rマルチチャンネル復号化されたオーディオ信号に対して複素演算を実行して前記第1チャンネルスペクトルおよび前記第2チャンネルスペクトルを導出するようにさらに構成され、
ここで、エネルギー補償を得るために、符号化された中間信号のエネルギーと前記L/Rマルチチャンネル復号化されたオーディオ信号のエネルギーとを使って、前記複素演算のマグニチュードが計算され、
前記第1マルチチャンネル情報(20)のIPD(チャンネル間位相差)値を使って、前記複素演算の位相が計算される、請求項15に記載のオーディオデコーダ(102’’)。 - マルチチャンネル信号(4)を符号化する方法(2000)であって、前記方法は、
線形予測ドメイン符号化するステップであって、
ダウンミックス信号(14)を得るために、前記マルチチャンネル信号(4)をダウンミックスするステップと、
符号化されたダウンミックス信号(26)を得るために、前記ダウンミックス信号(14)を線形予測ドメインコア符号化するステップ(16)であって、前記ダウンミックス信号(14)は低帯域および高帯域を持ち、前記ダウンミックス信号(14)を線形予測ドメインコア符号化するステップ(16)は、前記高帯域をパラメトリック的に符号化するために帯域幅拡張処理を適用するステップを含む、前記ダウンミックス信号(14)を線形予測ドメインコア符号化するステップと、
前記マルチチャンネル信号(4)のスペクトル表現を生成するステップと、
第1マルチチャンネル情報(20)を生成するために、前記マルチチャンネル信号(4)の前記低帯域および前記高帯域を含む前記スペクトル表現を処理するステップと、
を含む、線形予測ドメイン符号化するステップと、
前記マルチチャンネル信号(4)を符号化して第2マルチチャンネル情報(24)を生成するための結合マルチチャンネル符号化するステップを含む、周波数ドメイン符号化するステップであって、ここで、前記結合マルチチャンネル符号化するステップは前記スペクトル表現を処理するステップとは異なる、周波数ドメイン符号化するステップと、
前記マルチチャンネル信号(4)の一部分が、前記線形予測ドメイン符号化するステップから得られた符号化されたフレーム、または前記周波数ドメイン符号化するステップから得られた符号化されたフレームのいずれかによって表現されるように、前記線形予測ドメイン符号化するステップと前記周波数ドメイン符号化するステップとの間で切り替えるステップと、
を含む、符号化する方法(2000)。 - 前記ダウンミックス信号(14)を符号化するステップは、符号化され復号化されたダウンミックス信号(54)を得るために前記符号化されたダウンミックス信号(26)を復号化するステップをさらに含み、前記方法(2000)はさらに、前記符号化され復号化されたダウンミックス信号(54)を用いて符号化されたマルチチャンネル残差信号(58)を計算するステップを含み、前記符号化されたマルチチャンネル残差信号(58)は、前記第1マルチチャンネル情報(20)を用いて得られた復号化されたマルチチャンネル表現と前記マルチチャンネル信号(4)をダウンミックスするステップの前の前記マルチチャンネル信号(4)との間の誤差を表わし、前記ダウンミックス信号(14)を符号化するステップは、前記高帯域をパラメトリック的に符号化するための帯域幅拡張処理を適用するステップを含み、前記符号化されたダウンミックス信号(26)を復号化するステップは、前記符号化され復号化されたダウンミックス信号(54)として、前記ダウンミックス信号(14)の前記低帯域を表わす低帯域信号のみを取得するように構成され、前記符号化されたマルチチャンネル残差信号(58)は、前記マルチチャンネル信号(4)をダウンミックスするステップの前の前記マルチチャンネル信号(4)の低帯域に相当する帯域しか有さない、または、
前記ダウンミックス信号(14)を符号化するステップはACELP処理(30)を実行するステップを含み、前記ACELP処理はダウンサンプリングされたダウンミックス信号(34)に作用するように構成され、時間ドメイン帯域幅拡張処理(36)は前記ダウンサンプリングによって前記ダウンミックス信号(14)から取り除かれた前記ダウンミックス信号(14)の前記高帯域をパラメトリック的に符号化するように構成され、前記ダウンミックス信号(14)を符号化するステップはTCX処理(32)を含み、前記TCX処理(32)はダウンサンプリングされていない前記ダウンミックス信号(14)または前記ACELP処理(30)のためのダウンサンプリングよりも少ない度合いでダウンサンプリングされている前記ダウンミックス信号(14)に対して作用するように構成され、前記TCX処理は、時間周波数変換(40)、第1の帯域セットのパラメトリック表現(46)を生成するためのパラメータ生成(42)および第2の帯域セットについて量子化され符号化されたスペクトルライン(48)のセットを生成するための量子化符号化(44)を含む、請求項17に記載の方法。 - コア符号化された信号、帯域幅拡張パラメータおよび第1マルチチャンネル情報(20)を含む、符号化されたオーディオ信号(103)を復号化する方法(2100)であって、前記方法(2100)は、
モノラル信号(142)を生成するために、前記コア符号化された信号を線形予測ドメインコア復号化するステップ(104)と、
前記モノラル信号(142)をスペクトル表現(145)に変換するステップと、
前記モノラル信号(142)の前記スペクトル表現(145)および前記第1マルチチャンネル情報(20)から、第1チャンネルスペクトルおよび第2チャンネルスペクトルを生成するステップと、
第1チャンネル信号を得るために、前記第1チャンネルスペクトルをシンセサイズフィルタリングするステップと、第2チャンネル信号を得るために、前記第2チャンネルスペクトルをシンセサイズフィルタリングするステップと、
周波数ドメイン復号化するステップ(106)と、
前記周波数ドメイン復号化するステップ(106)の出力と第2マルチチャンネル情報(22,24)を使用して第2マルチチャンネル表現(116)を生成するステップであって、前記第2マルチチャンネル表現を生成するステップは、前記第1チャンネルスペクトルおよび前記第2チャンネルスペクトルを生成するステップとは異なる、第2マルチチャンネル表現を生成するステップと、
復号化されたオーディオ信号(118)を得るために、前記第1チャンネル信号および前記第2チャンネル信号を前記第2マルチチャンネル表現(116)と結合するステップと、
を含む、復号化する方法(2100)。 - 前記第1チャンネルスペクトルおよび前記第2のチャンネルスペクトルを生成するステップは、マルチチャンネル信号の中間信号である前記モノラル信号(142)から前記第1チャンネル信号および前記第2チャンネル信号を取得するステップと、M/Sマルチチャンネル復号化されたオーディオ信号を取得するステップと、前記第1マルチチャンネル情報(20)からサイド信号を計算するステップと、前記M/Sマルチチャンネル復号化されたオーディオ信号からL/Rマルチチャンネル復号化されたオーディオ信号を計算するステップと、前記第1マルチチャンネル情報(20)および前記サイド信号を用いて低帯域のための前記L/Rマルチチャンネル復号化されたオーディオ信号を計算するステップもしくは前記中間信号から予測されたサイド信号を計算し、前記予測されたサイド信号および前記第1マルチチャンネル情報(20)のILD(チャンネル間レベル差)値を用いて、高帯域のための前記L/Rマルチチャンネル復号化されたオーディオ信号を計算するステップとを含む、または、
前記コア符号化された信号を復号化するステップは、前記オーディオ信号の復号化された高帯域(140)である帯域幅拡張高帯域信号(140)を前記帯域幅拡張パラメータおよび低帯域である前記モノラル信号(142)または前記コア符号化された信号から生成するための時間ドメイン帯域幅拡張処理するステップ(126)と、ACELP復号化するステップ(120)と、低帯域合成するステップ(122)と、復号化された低帯域モノラル信号であるアップサンプリングされた低帯域信号を生成するためのアップサンプリング処理するステップ(124)と、前記オーディオ信号の前記復号化された低帯域モノラル信号と前記復号化された高帯域(140)の結合(128)を用いて全帯域ACELP復号化されたモノラル信号を計算するステップと、全帯域TCX復号化されたモノラル信号を取得するためにTCX復号化(130)およびインテリジェント・ギャップ・フィリング処理(132)を行うステップと、前記全帯域ACELP復号化されたモノラル信号と前記全帯域TCX復号化されたモノラル信号の結合を含む全帯域合成処理するステップ(134)とを含む、請求項19に記載の方法。 - コンピュータ・プログラムがコンピュータまたはプロセッサ上で稼働すると、請求項17ないし請求項20のいずれかに記載の方法を実行するためのコンピュータ・プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022183880A JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158233.5 | 2015-03-09 | ||
EP15158233 | 2015-03-09 | ||
EP15172599.1 | 2015-06-17 | ||
EP15172599.1A EP3067887A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Division JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022183880A Division JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020074013A JP2020074013A (ja) | 2020-05-14 |
JP7181671B2 true JP7181671B2 (ja) | 2022-12-01 |
Family
ID=52682621
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2019189837A Active JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2019189837A Active JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Country Status (19)
Country | Link |
---|---|
US (7) | US10388287B2 (ja) |
EP (9) | EP3067887A1 (ja) |
JP (6) | JP6643352B2 (ja) |
KR (2) | KR102151719B1 (ja) |
CN (6) | CN112614497A (ja) |
AR (6) | AR103880A1 (ja) |
AU (2) | AU2016231283C1 (ja) |
BR (4) | BR122022025766B1 (ja) |
CA (2) | CA2978814C (ja) |
ES (6) | ES2958535T3 (ja) |
FI (1) | FI3958257T3 (ja) |
MX (2) | MX366860B (ja) |
MY (2) | MY186689A (ja) |
PL (6) | PL3910628T3 (ja) |
PT (3) | PT3958257T (ja) |
RU (2) | RU2680195C1 (ja) |
SG (2) | SG11201707343UA (ja) |
TW (2) | TWI613643B (ja) |
WO (2) | WO2016142336A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
KR102083200B1 (ko) | 2016-01-22 | 2020-04-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
US10224045B2 (en) * | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
CA3061833C (en) | 2017-05-18 | 2022-05-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Managing network device |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
US10475457B2 (en) | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
CN109389987B (zh) | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
US10734001B2 (en) | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10535357B2 (en) | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3729427A1 (en) * | 2017-12-19 | 2020-10-28 | Dolby International AB | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
RU2749349C1 (ru) * | 2018-02-01 | 2021-06-09 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер аудиосцены, декодер аудиосцены и соответствующие способы, использующие пространственный анализ с гибридным кодером/декодером |
EP3588495A1 (en) | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
CN118368577A (zh) * | 2018-07-02 | 2024-07-19 | 杜比实验室特许公司 | 用于产生或解码包括沉浸式音频信号的位流的方法及装置 |
PL3818520T3 (pl) * | 2018-07-04 | 2024-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wielo-sygnałowe enkodowanie audio z wykorzystaniem wybielania sygnału jako przetwarzania wstępnego |
WO2020094263A1 (en) * | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN110267142B (zh) * | 2019-06-25 | 2021-06-22 | 维沃移动通信有限公司 | 一种移动终端及控制方法 |
CN114270436A (zh) * | 2019-07-19 | 2022-04-01 | 英迪股份有限公司 | 无线通信系统中的自适应音频处理方法、设备、计算机程序及其记录介质 |
FR3101741A1 (fr) * | 2019-10-02 | 2021-04-09 | Orange | Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés |
US11032644B2 (en) * | 2019-10-10 | 2021-06-08 | Boomcloud 360, Inc. | Subband spatial and crosstalk processing using spectrally orthogonal audio components |
CA3163373A1 (en) * | 2020-02-03 | 2021-08-12 | Vaclav Eksler | Switching between stereo coding modes in a multichannel sound codec |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
CN116324980A (zh) * | 2020-09-25 | 2023-06-23 | 苹果公司 | 声道、对象和hoa音频内容的无缝可扩展解码 |
CA3194876A1 (en) * | 2020-10-09 | 2022-04-14 | Franz REUTELHUBER | Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension |
JPWO2022176270A1 (ja) * | 2021-02-16 | 2022-08-25 | ||
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CN118414661A (zh) * | 2021-12-20 | 2024-07-30 | 杜比国际公司 | Qmf域中的ivas spar滤波器组 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090210234A1 (en) | 2008-02-19 | 2009-08-20 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding and decoding signals |
JP2011507050A (ja) | 2007-12-18 | 2011-03-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
JP2012505429A (ja) | 2008-10-10 | 2012-03-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
DE4307688A1 (de) * | 1993-03-11 | 1994-09-15 | Daimler Benz Ag | Verfahren zur Geräuschreduktion für gestörte Sprachkanäle |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3593201B2 (ja) * | 1996-01-12 | 2004-11-24 | ユナイテッド・モジュール・コーポレーション | オーディオ復号装置 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
CN1266674C (zh) * | 2000-02-29 | 2006-07-26 | 高通股份有限公司 | 闭环多模混合域线性预测语音编解码器和处理帧的方法 |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
CN1890712A (zh) * | 2003-12-04 | 2007-01-03 | 皇家飞利浦电子股份有限公司 | 音频信号编码 |
WO2006000952A1 (en) * | 2004-06-21 | 2006-01-05 | Koninklijke Philips Electronics N.V. | Method and apparatus to encode and decode multi-channel audio signals |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
CN101010985A (zh) * | 2004-08-31 | 2007-08-01 | 松下电器产业株式会社 | 立体声信号生成装置及立体声信号生成方法 |
ATE545131T1 (de) * | 2004-12-27 | 2012-02-15 | Panasonic Corp | Tonkodierungsvorrichtung und tonkodierungsmethode |
JP5171256B2 (ja) | 2005-08-31 | 2013-03-27 | パナソニック株式会社 | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 |
WO2008035949A1 (en) * | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
US8612220B2 (en) * | 2007-07-03 | 2013-12-17 | France Telecom | Quantization after linear transformation combining the audio signals of a sound scene, and related coder |
CN101373594A (zh) * | 2007-08-21 | 2009-02-25 | 华为技术有限公司 | 修正音频信号的方法及装置 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
WO2009066960A1 (en) * | 2007-11-21 | 2009-05-28 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
WO2009084918A1 (en) * | 2007-12-31 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
ATE518224T1 (de) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
WO2009131076A1 (ja) | 2008-04-25 | 2009-10-29 | 日本電気株式会社 | 無線通信装置 |
EP2346030B1 (en) * | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
CA2730232C (en) * | 2008-07-11 | 2015-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | An apparatus and a method for decoding an encoded audio signal |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2558229T3 (es) | 2008-07-11 | 2016-02-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas |
PL3002750T3 (pl) | 2008-07-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder i dekoder audio do kodowania i dekodowania próbek audio |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
RU2495503C2 (ru) * | 2008-07-29 | 2013-10-10 | Панасоник Корпорэйшн | Устройство кодирования звука, устройство декодирования звука, устройство кодирования и декодирования звука и система проведения телеконференций |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
EP3640941A1 (en) * | 2008-10-08 | 2020-04-22 | Fraunhofer Gesellschaft zur Förderung der Angewand | Multi-resolution switched audio encoding/decoding scheme |
CA2949616C (en) * | 2009-03-17 | 2019-11-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
GB2470059A (en) | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
KR101425290B1 (ko) | 2009-10-08 | 2014-08-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 멀티-모드 오디오 신호 디코더, 멀티-모드 오디오 신호 인코더 및 선형-예측-코딩 기반의 노이즈 성형을 사용하는 방법 및 컴퓨터 프로그램 |
EP2491555B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec |
AU2010309838B2 (en) * | 2009-10-20 | 2014-05-08 | Dolby International Ab | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
BR122020024243B1 (pt) * | 2009-10-20 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio. |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
US9613630B2 (en) | 2009-11-12 | 2017-04-04 | Lg Electronics Inc. | Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
US8166830B2 (en) * | 2010-07-02 | 2012-05-01 | Dresser, Inc. | Meter devices and methods |
JP5499981B2 (ja) * | 2010-08-02 | 2014-05-21 | コニカミノルタ株式会社 | 画像処理装置 |
CN103703511B (zh) * | 2011-03-18 | 2017-08-22 | 弗劳恩霍夫应用研究促进协会 | 定位在表示音频内容的比特流的帧中的帧元素 |
WO2013156814A1 (en) * | 2012-04-18 | 2013-10-24 | Nokia Corporation | Stereo audio signal encoder |
EP2849180B1 (en) * | 2012-05-11 | 2020-01-01 | Panasonic Corporation | Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal |
CN102779518B (zh) * | 2012-07-27 | 2014-08-06 | 深圳广晟信源技术有限公司 | 用于双核编码模式的编码方法和系统 |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US20150159036A1 (en) | 2013-12-11 | 2015-06-11 | Momentive Performance Materials Inc. | Stable primer formulations and coatings with nano dispersion of modified metal oxides |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
-
2015
- 2015-06-17 EP EP15172599.1A patent/EP3067887A1/en not_active Withdrawn
- 2015-06-17 EP EP15172594.2A patent/EP3067886A1/en not_active Withdrawn
-
2016
- 2016-03-02 TW TW105106306A patent/TWI613643B/zh active
- 2016-03-02 TW TW105106305A patent/TWI609364B/zh active
- 2016-03-07 BR BR122022025766-6A patent/BR122022025766B1/pt active IP Right Grant
- 2016-03-07 RU RU2017134385A patent/RU2680195C1/ru active
- 2016-03-07 CN CN202110019042.XA patent/CN112614497A/zh active Pending
- 2016-03-07 PL PL21171835.8T patent/PL3910628T3/pl unknown
- 2016-03-07 WO PCT/EP2016/054775 patent/WO2016142336A1/en active Application Filing
- 2016-03-07 PL PL16708171T patent/PL3268957T3/pl unknown
- 2016-03-07 CN CN202110019014.8A patent/CN112614496B/zh active Active
- 2016-03-07 BR BR112017018439-7A patent/BR112017018439B1/pt active IP Right Grant
- 2016-03-07 ES ES21171835T patent/ES2958535T3/es active Active
- 2016-03-07 EP EP16708172.8A patent/EP3268958B1/en active Active
- 2016-03-07 CN CN202110178110.7A patent/CN112951248B/zh active Active
- 2016-03-07 EP EP23166790.8A patent/EP4224470A1/en active Pending
- 2016-03-07 PT PT211915442T patent/PT3958257T/pt unknown
- 2016-03-07 FI FIEP21191544.2T patent/FI3958257T3/fi active
- 2016-03-07 ES ES16708171T patent/ES2910658T3/es active Active
- 2016-03-07 KR KR1020177028167A patent/KR102151719B1/ko active IP Right Grant
- 2016-03-07 ES ES21191544T patent/ES2951090T3/es active Active
- 2016-03-07 CN CN202110018176.XA patent/CN112634913B/zh active Active
- 2016-03-07 MX MX2017011187A patent/MX366860B/es active IP Right Grant
- 2016-03-07 PT PT167081710T patent/PT3268957T/pt unknown
- 2016-03-07 KR KR1020177028152A patent/KR102075361B1/ko active IP Right Grant
- 2016-03-07 ES ES21171831T patent/ES2959970T3/es active Active
- 2016-03-07 AU AU2016231283A patent/AU2016231283C1/en active Active
- 2016-03-07 PT PT167081728T patent/PT3268958T/pt unknown
- 2016-03-07 EP EP21171826.7A patent/EP3879527B1/en active Active
- 2016-03-07 MY MYPI2017001288A patent/MY186689A/en unknown
- 2016-03-07 BR BR122022025643-0A patent/BR122022025643B1/pt active IP Right Grant
- 2016-03-07 SG SG11201707343UA patent/SG11201707343UA/en unknown
- 2016-03-07 PL PL21171826.7T patent/PL3879527T3/pl unknown
- 2016-03-07 EP EP21191544.2A patent/EP3958257B1/en active Active
- 2016-03-07 RU RU2017133918A patent/RU2679571C1/ru active
- 2016-03-07 PL PL21191544.2T patent/PL3958257T3/pl unknown
- 2016-03-07 CA CA2978814A patent/CA2978814C/en active Active
- 2016-03-07 JP JP2017548000A patent/JP6643352B2/ja active Active
- 2016-03-07 ES ES21171826T patent/ES2959910T3/es active Active
- 2016-03-07 EP EP21171835.8A patent/EP3910628B1/en active Active
- 2016-03-07 ES ES16708172T patent/ES2901109T3/es active Active
- 2016-03-07 JP JP2017548014A patent/JP6606190B2/ja active Active
- 2016-03-07 BR BR112017018441-9A patent/BR112017018441B1/pt active IP Right Grant
- 2016-03-07 CA CA2978812A patent/CA2978812C/en active Active
- 2016-03-07 MX MX2017011493A patent/MX364618B/es active IP Right Grant
- 2016-03-07 WO PCT/EP2016/054776 patent/WO2016142337A1/en active Application Filing
- 2016-03-07 AU AU2016231284A patent/AU2016231284B2/en active Active
- 2016-03-07 EP EP16708171.0A patent/EP3268957B1/en active Active
- 2016-03-07 CN CN201680014670.6A patent/CN107408389B/zh active Active
- 2016-03-07 SG SG11201707335SA patent/SG11201707335SA/en unknown
- 2016-03-07 PL PL21171831.7T patent/PL3879528T3/pl unknown
- 2016-03-07 CN CN201680014669.3A patent/CN107430863B/zh active Active
- 2016-03-07 PL PL16708172T patent/PL3268958T3/pl unknown
- 2016-03-07 MY MYPI2017001286A patent/MY194940A/en unknown
- 2016-03-07 EP EP21171831.7A patent/EP3879528B1/en active Active
- 2016-03-08 AR ARP160100608A patent/AR103880A1/es active IP Right Grant
- 2016-03-08 AR ARP160100609A patent/AR103881A1/es active IP Right Grant
-
2017
- 2017-09-05 US US15/695,668 patent/US10388287B2/en active Active
- 2017-09-05 US US15/695,424 patent/US10395661B2/en active Active
-
2019
- 2019-03-22 US US16/362,462 patent/US10777208B2/en active Active
- 2019-07-09 US US16/506,767 patent/US11238874B2/en active Active
- 2019-10-17 JP JP2019189837A patent/JP7077290B2/ja active Active
-
2020
- 2020-01-06 JP JP2020000185A patent/JP7181671B2/ja active Active
- 2020-08-31 US US17/008,428 patent/US11107483B2/en active Active
-
2021
- 2021-08-24 US US17/410,033 patent/US11741973B2/en active Active
- 2021-10-18 AR ARP210102866A patent/AR123834A2/es unknown
- 2021-10-18 AR ARP210102869A patent/AR123837A2/es unknown
- 2021-10-18 AR ARP210102867A patent/AR123835A2/es unknown
- 2021-10-18 AR ARP210102868A patent/AR123836A2/es unknown
-
2022
- 2022-01-13 US US17/575,260 patent/US11881225B2/en active Active
- 2022-03-22 JP JP2022045510A patent/JP7469350B2/ja active Active
- 2022-11-17 JP JP2022183880A patent/JP2023029849A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011507050A (ja) | 2007-12-18 | 2011-03-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
US20090210234A1 (en) | 2008-02-19 | 2009-08-20 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding and decoding signals |
JP2012505429A (ja) | 2008-10-10 | 2012-03-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
Non-Patent Citations (1)
Title |
---|
DEMING ZHANG,HIGH-LEVEL DESCRIPTION OF THE HUAWEI/ETRI CANDIDATE FOR THE SUPER-WIDEBAND AND STEREO 以下備考,TELECOMMUNICATION STANDARDIZATION SECTOR DOCUMENT AC-0809-Q23-14,2008年09月18日,VOL:23,PAGE(S):1 - 14,EXTENSIONS OF ITU-T G.729.1 AND G.718. |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7181671B2 (ja) | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210209 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7181671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |