JP2017501430A - オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 - Google Patents
オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 Download PDFInfo
- Publication number
- JP2017501430A JP2017501430A JP2016526934A JP2016526934A JP2017501430A JP 2017501430 A JP2017501430 A JP 2017501430A JP 2016526934 A JP2016526934 A JP 2016526934A JP 2016526934 A JP2016526934 A JP 2016526934A JP 2017501430 A JP2017501430 A JP 2017501430A
- Authority
- JP
- Japan
- Prior art keywords
- weighting
- coefficient
- audio signal
- encoder
- prediction coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
ITU勧告G.718[3]は、いくつかの音響心理学的な考慮事項を追加することでガードナーの手法を拡張している。行列RAを考慮する代わりに、知覚的に重み付けられた合成フィルタW(z)のインパルス応答を考慮する。
したがって、符号化方式を改善する必要がある。
i=0..Mであり、16個の予測係数がオーディオ信号から導出された場合、Mは16であってもよい。
order=LPCの次数、lsfの長さ
parcorr[0]=−1番目の反射係数
parcorr[1]=−14番目の反射係数
smooth_flag=重み付け量を平滑化するフラグ
w_past=過去の重み付け量
出力
weights=計算された重み付け量
(数19)
/*Compute IHM weights*/
weights[0] = 1.f/( lsf[0] - 0 ) + 1.f/( lsf[1] - lsf[0] );
for(i=1; i<order-1; i++)
weights[i] = 1.f/( lsf[i] - lsf[i-1] ) + 1.f/( lsf[i+1] - lsf[i] );
weights[order-1] = 1.f/( lsf[order-1] - lsf[order-2] ) + 1.f/( 8000 - lsf[order-1] );
/* Fitting model*/
for(i=0; i<order; i++)
{
weights[i] *= (8000/ PI);
weights[i] = ((float)(lsf_fit_model[0][i])/(1<<12))
+ weights[i]*((float)(lsf_fit_model[1][i])/(1<<14))
+ weights[i]*weights[i]*((float)(lsf_fit_model[2][i])/(1<<19))
+ parcorr[0]* ((float)(lsf_fit_model[3][i])/(1<<13))
+ parcorr[1] * ((float)(lsf_fit_model[4][i])/(1<<10));
/* avoid too low weights and negative weights*/
if(weights[i] < 1.f/(i+1))
weights[i] = 1.f/(i+1);
}
(式中、「parcorr」は行列EIの拡張を示し、
(数20)
if(smooth_flag){
for(i=0; i<order; i++) {
tmp = 0.75f*weights[i] * 0.25f*w_past[i];
w_past[i]=weights[i];
weights[i]=tmp;
}
}
行列EIは、上述の平滑化を示し、現在の重み付け量が0.75の係数で重み付けされ、過去の重み付け量が0.25の係数で重み付けされる。)
lsf_fit_model[5][16] = {
{679 , 10921 , 10643 , 4998 , 11223 , 6847 , 6637 , 5200 , 3347 , 3423 , 3208 , 3329 , 2785 , 2295 , 2287 , 1743},
{23735 , 14092 , 9659 , 7977 , 4125 , 3600 , 3099 , 2572 , 2695 , 2208 , 1759 , 1474 , 1262 , 1219 , 931 , 1139},
{-6548 , -2496 , -2002 , -1675 , -565 , -529 , -469 , -395 , -477 , -423 , -297 , -248 , -209 , -160 , -125 , -217},
{-10830 , 10563 , 17248 , 19032 , 11645 , 9608 , 7454 , 5045 , 5270 , 3712 , 3567 , 2433 , 2380 , 1895 , 1962 , 1801},
{-17553 , 12265 , -758 , -1524 , 3435 , -2644 , 2013 , -616 , -25 , 651 , -826 , 973 , -379 , 301 , 281 , -165}};
order=LPCの次数、lsfの長さ
parcorr[0]=−1番目の反射係数
parcorr[1]=−14番目の反射係数
smooth_flag=重み付け量を平滑化するフラグ
w_past=過去の重み付け量
出力
weights=計算された重み付け量
(数22)
/*Compute IHM weights*/
weights[0] = 1.f/( lsf[0] - 0 ) + 1.f/( lsf[1] - lsf[0] );
for(i=1; i<order-2; i++)
weights[i] = 1.f/( lsf[i] - lsf[i-1] ) + 1.f/( lsf[i+1] - lsf[i] );
weights[order-2] = 1.f/( lsf[order-2] - lsf[order-3] ) + 1.f/( 6400 - lsf[order-2] );
/* Fitting model*/
for(i=0; i<order-1; i++)
{
weights[i] *= (6400/PI);
weights[i] = ((float)(isf_fit_model[0][i])/(1<<12))
+ weights[i]*((float)(isf_fit_model[1][i])/(1<<14))
+ weights[i]*weights[i]*((float)(isf_fit_model[2][i])/(1<<19))
+ parcorr[0]* ((float)(isf_fit_model[3][i])/(1<<13))
+ parcorr[1] * ((float)(isf_fit_model[4][i])/(1<<10));
/* avoid too low weights and negative weights*/
if(weights[i] < 1.f/(i+1))
weights[i] = 1.f/(i+1);
}
if(smooth_flag){
for(i=0; i<order-1; i++) {
tmp = 0.75f*weights[i] * 0.25f*w_past[i];
w_past[i]=weights[i];
weights[i]=tmp;
}
}
weights[order-1]=1;
式中、周波数成分を有する入力信号のためのフィッティングモデル係数は6.4kHzまで上昇する。
isf_fit_model[5][15] = {
{8112 , 7326 , 12119 , 6264 , 6398 , 7690 , 5676 , 4712 , 4776 , 3789 , 3059 , 2908 , 2862 , 3266 , 2740},
{16517 , 13269 , 7121 , 7291 , 4981 , 3107 , 3031 , 2493 , 2000 , 1815 , 1747 , 1477 , 1152 , 761 , 728},
{-4481 , -2819 , -1509 , -1578 , -1065 , -378 , -519 , -416 , -300 , -288 , -323 , -242 , -187 , -7 , -45},
{-7787 , 5365 , 12879 , 14908 , 12116 , 8166 , 7215 , 6354 , 4981 , 5116 , 4734 , 4435 , 4901 , 4433 , 5088},
{-11794 , 9971 , -3548 , 1408 , 1108 , -2119 , 2616 , -1814 , 1607 , -714 , 855 , 279 , 52 , 972 , -416}};
式中、周波数成分を有する入力信号のためのフィッティングモデル係数は、4kHzまで上昇し、4kHzから6.4kHzまで上昇する周波数成分に対してエネルギーがゼロである。
isf_fit_model [5][15] = {
{21229 , -746 , 11940 , 205 , 3352 , 5645 , 3765 , 3275 , 3513 , 2982 , 4812 , 4410 , 1036 , -6623 , 6103},
{15704 , 12323 , 7411 , 7416 , 5391 , 3658 , 3578 , 3027 , 2624 , 2086 , 1686 , 1501 , 2294 , 9648 , -6401},
{-4198 , -2228 , -1598 , -1481 , -917 , -538 , -659 , -529 , -486 , -295 , -221 , -174 , -84 , -11874 , 27397},
{-29198 , 25427 , 13679 , 26389 , 16548 , 9738 , 8116 , 6058 , 3812 , 4181 , 2296 , 2357 , 4220 , 2977 , -71},
{-16320 , 15452 , -5600 , 3390 , 589 , -2398 , 2453 , -1999 , 1351 , -1853 , 1628 , -1404 , 113 , -765 , -359}};
[1]Laroia,R.、Phamdo,N.、Farvardin,N.著、「Robust and efficient quantization of speech LSP parameters using structured vector quantizers」、1991年音響・音声・信号処理に関する国際会議、1991.ICASSP−91、1991年4月14日〜17日、第1巻、p.641−644
Claims (15)
- オーディオ信号(102)を符号化するエンコーダ(100)であって、前記エンコーダ(100)は、
前記オーディオ信号(102)を分析して、前記オーディオ信号(102)から分析予測係数(112)を判定するように構成されたアナライザ(100)と、
前記分析予測係数(112)から変換後の予測係数(122;122’)を導出するように構成されたコンバータ(120)と、
多数の補正値(162)を記憶するように構成されたメモリ(160)と、
計算器(130;130’)とを備え、前記計算器(130;130’)は、
スペクトル重み付け係数(142;142’)を取得するために、前記変換後の予測係数(122;122’)を処理するように構成されたプロセッサ(140;140’)と、
補正後の重み付け係数(152;152’)を取得するために、前記スペクトル重み付け係数(142;142’)と前記多数の補正値(162;a,b,c)とを結合するように構成された結合器(150;150’)と、
前記変換後の予測係数(122;122’)の量子化表現(172)を取得するために、前記補正後の重み付け係数(152;152’)を使用して前記変換後の予測係数(122;122’)を量子化するように構成された量子化器(170)とを備え、
前記エンコーダ(100)は、
前記変換後の予測係数(122)の前記量子化表現(172)と、前記オーディオ信号(102)とに基づいて、出力信号(182)を形成するように構成されたビットストリーム形成器(180)を備える、エンコーダ。 - 前記結合器(150’)は、前記補正後の重み付け係数(152’)を取得するために、前記スペクトル重み付け係数(142;142’)と、前記多数の補正値(162;a,b,c)と、前記入力信号(102)に関連するさらなる情報(114)とを結合するように構成される、請求項1に記載のエンコーダ。
- 前記入力信号(102)に関連する前記さらなる情報(114)は、前記アナライザ(110)によって取得された反射係数を含むか、あるいは、前記オーディオ信号(102)のパワースペクトルに関連する情報を含む、請求項2に記載のエンコーダ。
- 前記アナライザ(110)は、線形予測係数(LPC)を判定するように構成され、前記コンバータ(120)は、前記線形予測係数(LPC)から線スペクトル周波数(LSF;122’)またはイミタンススペクトル周波数(ISF)を導出するように構成される、請求項1〜3のいずれか1項に記載のエンコーダ。
- 前記結合器(150;150’)は、前記補正後の重み付け係数(152;152’)を周期的に、1周期ごとに取得するように構成され、
前記計算器(130’)は、前回の周期に対して取得された第1の量子化後の重み付け係数(152’’’)と、前記前回の周期に続く周期に対して取得された第2の量子化後の重み付け係数(152’)とを重み付け結合して、前記第1(152’’’)および前記第2(152’)の量子化後の重み付け係数の値の間の値を含む、平滑化された補正後の重み付け係数(152’’)を取得するように構成された平滑器(155)をさらに備える、請求項1〜4のいずれか1項に記載のエンコーダ。 - 前記結合器(150;150’)は、以下の数式
(数1)
w=a+bx+cx2
(式中、wは取得された補正後の重み付け係数を示し、xは前記スペクトル重み付け係数を示し、a、bおよびcは補正値を示す)
に基づく多項式を適用するように構成される、請求項1〜5のいずれか1項に記載のエンコーダ。 - 前記多数の補正値(162;a,b,c)は、事前計算後の重み付け量(LSF;142’’)から導出され、前記事前計算後の重み付け量(LSF;142’’)を判定するための計算量は、前記スペクトル重み付け係数(142;142’)を判定するための計算量よりも多い、請求項1〜6のいずれか1項に記載のエンコーダ。
- 前記プロセッサ(140;140’)は、逆調和平均によって前記スペクトル重み付け係数(142;142’)を取得するように構成される、請求項1〜7のいずれか1項に記載のエンコーダ。
- オーディオ伝送システム(600)であって、
請求項1〜9のいずれか1項に記載のエンコーダ(100)と、
前記エンコーダの前記出力信号(182)または導出された信号を受信し、かつ、合成後のオーディオ信号(102’)を供給するために前記受信信号(182)を復号化するように構成されたデコーダ(602)とを備え、
前記エンコーダ(100)は、伝送媒体(604)にアクセスして、前記伝送媒体(604)を介して前記出力信号(182)を伝送するように構成される、オーディオ伝送システム。 - 各重み付け係数がオーディオ信号(102)の一部(LSF;ISF)を重み付けするのに適した第1の多数の(IHM)第1重み付け係数(142;142’)に対する補正値(162;a,b,c)を判定する方法であって、前記方法(700)は、
1組のオーディオ信号のオーディオ信号ごとに、第1判定ルールに基づいて前記第1の多数の(IHM)第1重み付け係数(142;142’)を算出するステップと、
前記1組のオーディオ信号のオーディオ信号ごとに、第2判定ルールに基づいて第2の多数の第2重み付け係数(142’’)を算出するステップであって、前記第2の多数の重み付け係数(142’’)の各々は、第1重み付け係数(142;142’)に関連している、算出するステップと、
各距離値(di)が、前記オーディオ信号(102)の一部に関連する第1重み付け係数(142;142’)と第2重み付け係数(142’’)との間の距離に関連した値を有する、第3の多数の距離値(di)を算出するステップと、
前記第1重み付け係数(142;142’)と結合された場合に、前記距離値(di)を低減するのに適した第4の多数の補正値を算出するステップとを含む、方法。 - 前記第4の多数の補正値は、多項式フィッティングに基づいて判定され、
前記第1重み付け係数(142;142’)の値を、前記多項式の項を適合させるための少なくとも1つの変数を含む多項式(y=a+bx+cx2)で乗算するステップと、
前記第3の多数の距離値(di)が以下の式
(式中、diは、前記オーディオ信号のi番目の部分の距離値を示し、Piは、以下の式
に基づく数式を含むベクトルを示し、EIiは、以下の式
に基づく行列を示し、
Ix,iは、前記オーディオ信号(102)のx番目の部分について前記第1判定ルール(IHM)に基づいて判定されるi番目の重み付け係数(142;142’)を示す)に基づく閾値を下回る値を含むように、前記変数に対する値を算出するステップとを含む、請求項11に記載の方法。 - オーディオ信号を符号化する方法(800)であって、前記方法は、
前記オーディオ信号(102)を分析(802)して、前記オーディオ信号(102)から分析予測係数(112)を判定するステップと、
前記分析予測係数(112)から変換後の予測係数(122;122’)を導出するステップ(804)と、
多数の補正値(162;a〜d)を記憶するステップ(806)と、
補正後の重み付け係数(152;152’)を取得するために、前記変換後の予測係数(122;122’)と前記多数の補正値(162;a〜d)とを結合するステップ(808)と、
前記変換後の予測係数(122;122’)の量子化表現(172)を取得するために、前記補正後の重み付け係数(152;152’)を使用して前記変換後の予測係数(122;122’)を量子化するステップ(812)と、
前記変換後の予測係数(122)の表現(172)と、前記オーディオ信号(102)とに基づいて、出力信号(182)を形成するステップ(814)とを含む、方法。 - コンピュータ上で動作している場合に、請求項11〜14のいずれか1項に記載の方法を行うためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP13192735.2 | 2013-11-13 | ||
| EP13192735 | 2013-11-13 | ||
| EP14178815 | 2014-07-28 | ||
| EP14178815.8 | 2014-07-28 | ||
| PCT/EP2014/073960 WO2015071173A1 (en) | 2013-11-13 | 2014-11-06 | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017501430A true JP2017501430A (ja) | 2017-01-12 |
| JP6272619B2 JP6272619B2 (ja) | 2018-01-31 |
Family
ID=51903884
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016526934A Active JP6272619B2 (ja) | 2013-11-13 | 2014-11-06 | オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 |
Country Status (16)
| Country | Link |
|---|---|
| US (4) | US9818420B2 (ja) |
| EP (3) | EP3069338B1 (ja) |
| JP (1) | JP6272619B2 (ja) |
| KR (1) | KR101831088B1 (ja) |
| CN (2) | CN105723455B (ja) |
| AU (1) | AU2014350366B2 (ja) |
| BR (1) | BR112016010197B1 (ja) |
| CA (1) | CA2928882C (ja) |
| ES (2) | ES2991546T3 (ja) |
| MX (1) | MX356164B (ja) |
| PL (2) | PL3483881T3 (ja) |
| PT (1) | PT3069338T (ja) |
| RU (1) | RU2643646C2 (ja) |
| TW (1) | TWI571867B (ja) |
| WO (1) | WO2015071173A1 (ja) |
| ZA (1) | ZA201603823B (ja) |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102623012B (zh) * | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
| PT3069338T (pt) * | 2013-11-13 | 2019-03-26 | Fraunhofer Ges Forschung | Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar valores de correção |
| US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
| EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
| EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
| KR20190069192A (ko) | 2017-12-11 | 2019-06-19 | 한국전자통신연구원 | 오디오 신호의 채널 파라미터 예측 방법 및 장치 |
| JP7596146B2 (ja) * | 2017-12-19 | 2024-12-09 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化の改良のための方法、機器、およびシステム |
| CN114734436B (zh) * | 2022-03-24 | 2023-12-22 | 苏州艾利特机器人有限公司 | 一种机器人的编码器校准方法、装置及机器人 |
| JP2026504684A (ja) * | 2023-02-09 | 2026-02-06 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | オーディオ信号コーディング方法及びそれを行う装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0764599A (ja) * | 1993-08-24 | 1995-03-10 | Hitachi Ltd | 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 |
| US20120095756A1 (en) * | 2010-10-18 | 2012-04-19 | Samsung Electronics Co., Ltd. | Apparatus and method for determining weighting function having low complexity for linear predictive coding (LPC) coefficients quantization |
Family Cites Families (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SE467806B (sv) | 1991-01-14 | 1992-09-14 | Ericsson Telefon Ab L M | Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare |
| JP3273455B2 (ja) | 1994-10-07 | 2002-04-08 | 日本電信電話株式会社 | ベクトル量子化方法及びその復号化器 |
| US6098037A (en) * | 1998-05-19 | 2000-08-01 | Texas Instruments Incorporated | Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes |
| DE19947877C2 (de) | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
| AU2002218501A1 (en) * | 2000-11-30 | 2002-06-11 | Matsushita Electric Industrial Co., Ltd. | Vector quantizing device for lpc parameters |
| WO2007096550A2 (fr) | 2006-02-22 | 2007-08-30 | France Telecom | Codage/decodage perfectionnes d'un signal audionumerique, en technique celp |
| DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
| KR101412255B1 (ko) | 2006-12-13 | 2014-08-14 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치 및 이들의 방법 |
| RU2464650C2 (ru) * | 2006-12-13 | 2012-10-20 | Панасоник Корпорэйшн | Устройство и способ кодирования, устройство и способ декодирования |
| DE602008005250D1 (de) * | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
| US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
| EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
| US8023660B2 (en) | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
| MX2011002626A (es) * | 2008-09-11 | 2011-04-07 | Fraunhofer Ges Forschung | Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales. |
| US20100191534A1 (en) * | 2009-01-23 | 2010-07-29 | Qualcomm Incorporated | Method and apparatus for compression or decompression of digital signals |
| US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
| KR100963219B1 (ko) | 2009-09-09 | 2010-06-10 | 민 우 전 | 연결부재를 이용한 관 연결공법 |
| BR112012007803B1 (pt) * | 2009-10-08 | 2022-03-15 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear |
| EP4571739A1 (en) * | 2009-10-20 | 2025-06-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
| MY164399A (en) * | 2009-10-20 | 2017-12-15 | Fraunhofer Ges Forschung | Multi-mode audio codec and celp coding adapted therefore |
| US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
| FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
| EP4398248B1 (en) * | 2010-07-08 | 2025-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
| MY159444A (en) * | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
| MX2013009303A (es) * | 2011-02-14 | 2013-09-13 | Fraunhofer Ges Forschung | Codec de audio utilizando sintesis de ruido durante fases inactivas. |
| AU2012246799B2 (en) * | 2011-04-21 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
| US9115883B1 (en) | 2012-07-18 | 2015-08-25 | C-M Glo, Llc | Variable length lamp |
| SG11201505893TA (en) * | 2013-01-29 | 2015-08-28 | Fraunhofer Ges Forschung | Noise filling concept |
| CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
| PT3069338T (pt) * | 2013-11-13 | 2019-03-26 | Fraunhofer Ges Forschung | Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar valores de correção |
-
2014
- 2014-11-06 PT PT14799376T patent/PT3069338T/pt unknown
- 2014-11-06 ES ES18211437T patent/ES2991546T3/es active Active
- 2014-11-06 AU AU2014350366A patent/AU2014350366B2/en active Active
- 2014-11-06 CA CA2928882A patent/CA2928882C/en active Active
- 2014-11-06 KR KR1020167015045A patent/KR101831088B1/ko active Active
- 2014-11-06 RU RU2016122865A patent/RU2643646C2/ru active
- 2014-11-06 ES ES14799376T patent/ES2716652T3/es active Active
- 2014-11-06 WO PCT/EP2014/073960 patent/WO2015071173A1/en not_active Ceased
- 2014-11-06 CN CN201480061940.XA patent/CN105723455B/zh active Active
- 2014-11-06 PL PL18211437.1T patent/PL3483881T3/pl unknown
- 2014-11-06 EP EP14799376.0A patent/EP3069338B1/en active Active
- 2014-11-06 BR BR112016010197-9A patent/BR112016010197B1/pt active IP Right Grant
- 2014-11-06 CN CN201911425860.9A patent/CN111179953B/zh active Active
- 2014-11-06 EP EP24203977.4A patent/EP4475123A3/en active Pending
- 2014-11-06 JP JP2016526934A patent/JP6272619B2/ja active Active
- 2014-11-06 MX MX2016006208A patent/MX356164B/es active IP Right Grant
- 2014-11-06 PL PL14799376T patent/PL3069338T3/pl unknown
- 2014-11-06 EP EP18211437.1A patent/EP3483881B1/en active Active
- 2014-11-11 TW TW103139048A patent/TWI571867B/zh active
-
2016
- 2016-05-05 US US15/147,844 patent/US9818420B2/en active Active
- 2016-06-06 ZA ZA2016/03823A patent/ZA201603823B/en unknown
-
2017
- 2017-07-07 US US15/644,308 patent/US10354666B2/en active Active
- 2017-10-13 US US15/783,966 patent/US10229693B2/en active Active
-
2019
- 2019-02-07 US US16/270,429 patent/US10720172B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0764599A (ja) * | 1993-08-24 | 1995-03-10 | Hitachi Ltd | 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 |
| US20120095756A1 (en) * | 2010-10-18 | 2012-04-19 | Samsung Electronics Co., Ltd. | Apparatus and method for determining weighting function having low complexity for linear predictive coding (LPC) coefficients quantization |
Non-Patent Citations (2)
| Title |
|---|
| 大室仲 間野一則 守谷健弘: "LSPパラメータのベクトル・マトリクス量子化", 電子情報通信学会技術研究報告 SP91−70, JPN6017026395, 25 October 1991 (1991-10-25), pages 29 - 36, ISSN: 0003600518 * |
| 淺川吉章 石川敦義 関根英敏: "LSP係数のベクトル量子化における率距離尺度の検討", 日本音響学会研究発表会議講演論文集 秋I, JPN6017026394, 5 October 1993 (1993-10-05), pages 305 - 306, ISSN: 0003600517 * |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6272619B2 (ja) | オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 | |
| JP5356406B2 (ja) | オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 | |
| US8670981B2 (en) | Speech encoding and decoding utilizing line spectral frequency interpolation | |
| US11011181B2 (en) | Audio encoding/decoding based on an efficient representation of auto-regressive coefficients | |
| JPH11143498A (ja) | Lpc係数のベクトル量子化方法 | |
| HK40008109A (en) | Encoder for encoding an audio signal, audio transmission system and method for determining correction values | |
| HK40008109B (en) | Encoder for encoding an audio signal, audio transmission system and method for determining correction values | |
| HK1228089B (en) | Encoder for encoding an audio signal, audio transmission system and method for determining correction values | |
| HK1228089A1 (en) | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160610 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160610 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170706 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170718 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171017 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171207 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171229 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6272619 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
