JP6272619B2 - オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 - Google Patents
オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 Download PDFInfo
- Publication number
- JP6272619B2 JP6272619B2 JP2016526934A JP2016526934A JP6272619B2 JP 6272619 B2 JP6272619 B2 JP 6272619B2 JP 2016526934 A JP2016526934 A JP 2016526934A JP 2016526934 A JP2016526934 A JP 2016526934A JP 6272619 B2 JP6272619 B2 JP 6272619B2
- Authority
- JP
- Japan
- Prior art keywords
- weighting
- coefficient
- audio signal
- encoder
- lsf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 74
- 238000012937 correction Methods 0.000 title claims description 63
- 238000000034 method Methods 0.000 title claims description 62
- 230000005540 biological transmission Effects 0.000 title claims description 17
- 239000013598 vector Substances 0.000 claims description 60
- 230000003595 spectral effect Effects 0.000 claims description 43
- 238000001228 spectrum Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 9
- 238000013139 quantization Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 10
- 238000009795 derivation Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
ITU勧告G.718[3]は、いくつかの音響心理学的な考慮事項を追加することでガードナーの手法を拡張している。行列RAを考慮する代わりに、知覚的に重み付けられた合成フィルタW(z)のインパルス応答を考慮する。
したがって、符号化方式を改善する必要がある。
i=0..Mであり、16個の予測係数がオーディオ信号から導出された場合、Mは16であってもよい。
order=LPCの次数、lsfの長さ
parcorr[0]=−1番目の反射係数
parcorr[1]=−14番目の反射係数
smooth_flag=重み付け量を平滑化するフラグ
w_past=過去の重み付け量
出力
weights=計算された重み付け量
(数19)
/*Compute IHM weights*/
weights[0] = 1.f/( lsf[0] - 0 ) + 1.f/( lsf[1] - lsf[0] );
for(i=1; i<order-1; i++)
weights[i] = 1.f/( lsf[i] - lsf[i-1] ) + 1.f/( lsf[i+1] - lsf[i] );
weights[order-1] = 1.f/( lsf[order-1] - lsf[order-2] ) + 1.f/( 8000 - lsf[order-1] );
/* Fitting model*/
for(i=0; i<order; i++)
{
weights[i] *= (8000/ PI);
weights[i] = ((float)(lsf_fit_model[0][i])/(1<<12))
+ weights[i]*((float)(lsf_fit_model[1][i])/(1<<14))
+ weights[i]*weights[i]*((float)(lsf_fit_model[2][i])/(1<<19))
+ parcorr[0]* ((float)(lsf_fit_model[3][i])/(1<<13))
+ parcorr[1] * ((float)(lsf_fit_model[4][i])/(1<<10));
/* avoid too low weights and negative weights*/
if(weights[i] < 1.f/(i+1))
weights[i] = 1.f/(i+1);
}
(式中、「parcorr」は行列EIの拡張を示し、
(数20)
if(smooth_flag){
for(i=0; i<order; i++) {
tmp = 0.75f*weights[i] * 0.25f*w_past[i];
w_past[i]=weights[i];
weights[i]=tmp;
}
}
行列EIは、上述の平滑化を示し、現在の重み付け量が0.75の係数で重み付けされ、過去の重み付け量が0.25の係数で重み付けされる。)
lsf_fit_model[5][16] = {
{679 , 10921 , 10643 , 4998 , 11223 , 6847 , 6637 , 5200 , 3347 , 3423 , 3208 , 3329 , 2785 , 2295 , 2287 , 1743},
{23735 , 14092 , 9659 , 7977 , 4125 , 3600 , 3099 , 2572 , 2695 , 2208 , 1759 , 1474 , 1262 , 1219 , 931 , 1139},
{-6548 , -2496 , -2002 , -1675 , -565 , -529 , -469 , -395 , -477 , -423 , -297 , -248 , -209 , -160 , -125 , -217},
{-10830 , 10563 , 17248 , 19032 , 11645 , 9608 , 7454 , 5045 , 5270 , 3712 , 3567 , 2433 , 2380 , 1895 , 1962 , 1801},
{-17553 , 12265 , -758 , -1524 , 3435 , -2644 , 2013 , -616 , -25 , 651 , -826 , 973 , -379 , 301 , 281 , -165}};
order=LPCの次数、lsfの長さ
parcorr[0]=−1番目の反射係数
parcorr[1]=−14番目の反射係数
smooth_flag=重み付け量を平滑化するフラグ
w_past=過去の重み付け量
出力
weights=計算された重み付け量
(数22)
/*Compute IHM weights*/
weights[0] = 1.f/( lsf[0] - 0 ) + 1.f/( lsf[1] - lsf[0] );
for(i=1; i<order-2; i++)
weights[i] = 1.f/( lsf[i] - lsf[i-1] ) + 1.f/( lsf[i+1] - lsf[i] );
weights[order-2] = 1.f/( lsf[order-2] - lsf[order-3] ) + 1.f/( 6400 - lsf[order-2] );
/* Fitting model*/
for(i=0; i<order-1; i++)
{
weights[i] *= (6400/PI);
weights[i] = ((float)(isf_fit_model[0][i])/(1<<12))
+ weights[i]*((float)(isf_fit_model[1][i])/(1<<14))
+ weights[i]*weights[i]*((float)(isf_fit_model[2][i])/(1<<19))
+ parcorr[0]* ((float)(isf_fit_model[3][i])/(1<<13))
+ parcorr[1] * ((float)(isf_fit_model[4][i])/(1<<10));
/* avoid too low weights and negative weights*/
if(weights[i] < 1.f/(i+1))
weights[i] = 1.f/(i+1);
}
if(smooth_flag){
for(i=0; i<order-1; i++) {
tmp = 0.75f*weights[i] * 0.25f*w_past[i];
w_past[i]=weights[i];
weights[i]=tmp;
}
}
weights[order-1]=1;
式中、周波数成分を有する入力信号のためのフィッティングモデル係数は6.4kHzまで上昇する。
isf_fit_model[5][15] = {
{8112 , 7326 , 12119 , 6264 , 6398 , 7690 , 5676 , 4712 , 4776 , 3789 , 3059 , 2908 , 2862 , 3266 , 2740},
{16517 , 13269 , 7121 , 7291 , 4981 , 3107 , 3031 , 2493 , 2000 , 1815 , 1747 , 1477 , 1152 , 761 , 728},
{-4481 , -2819 , -1509 , -1578 , -1065 , -378 , -519 , -416 , -300 , -288 , -323 , -242 , -187 , -7 , -45},
{-7787 , 5365 , 12879 , 14908 , 12116 , 8166 , 7215 , 6354 , 4981 , 5116 , 4734 , 4435 , 4901 , 4433 , 5088},
{-11794 , 9971 , -3548 , 1408 , 1108 , -2119 , 2616 , -1814 , 1607 , -714 , 855 , 279 , 52 , 972 , -416}};
式中、周波数成分を有する入力信号のためのフィッティングモデル係数は、4kHzまで上昇し、4kHzから6.4kHzまで上昇する周波数成分に対してエネルギーがゼロである。
isf_fit_model [5][15] = {
{21229 , -746 , 11940 , 205 , 3352 , 5645 , 3765 , 3275 , 3513 , 2982 , 4812 , 4410 , 1036 , -6623 , 6103},
{15704 , 12323 , 7411 , 7416 , 5391 , 3658 , 3578 , 3027 , 2624 , 2086 , 1686 , 1501 , 2294 , 9648 , -6401},
{-4198 , -2228 , -1598 , -1481 , -917 , -538 , -659 , -529 , -486 , -295 , -221 , -174 , -84 , -11874 , 27397},
{-29198 , 25427 , 13679 , 26389 , 16548 , 9738 , 8116 , 6058 , 3812 , 4181 , 2296 , 2357 , 4220 , 2977 , -71},
{-16320 , 15452 , -5600 , 3390 , 589 , -2398 , 2453 , -1999 , 1351 , -1853 , 1628 , -1404 , 113 , -765 , -359}};
[1]Laroia,R.、Phamdo,N.、Farvardin,N.著、「Robust and efficient quantization of speech LSP parameters using structured vector quantizers」、1991年音響・音声・信号処理に関する国際会議、1991.ICASSP−91、1991年4月14日〜17日、第1巻、p.641−644
Claims (14)
- オーディオ信号(102)を符号化するエンコーダ(100)であって、前記エンコーダ(100)は、
前記オーディオ信号(102)を分析して、前記オーディオ信号(102)から分析予測係数(112)を判定するように構成されたアナライザ(100)と、
前記分析予測係数(112)から変換後の予測係数(122;122’)を導出するように構成されたコンバータ(120)と、
多数の補正値(162)を記憶するように構成されたメモリ(160)と、
計算器(130;130’)とを備え、前記計算器(130;130’)は、
スペクトル重み付け係数(142;142’)を取得するために、前記変換後の予測係数(122;122’)を処理するように構成されたプロセッサ(140;140’)と、
補正後の重み付け係数(152;152’)を取得するために、前記スペクトル重み付け係数(142;142’)と前記多数の補正値(162;a,b,c)とを結合するように構成された結合器(150;150’)と、
前記変換後の予測係数(122;122’)の量子化表現(172)を取得するために、前記補正後の重み付け係数(152;152’)を使用して前記変換後の予測係数(122;122’)を量子化するように構成された量子化器(170)とを備え、
前記エンコーダ(100)は、
前記変換後の予測係数(122)の前記量子化表現(172)と、前記オーディオ信号(102)とに基づいて、出力信号(182)を形成するように構成されたビットストリーム形成器(180)を備え、
前記結合器(150;150’)は、以下の数式
(数1)
w=a+bx+cx2
(式中、wは取得された補正後の重み付け係数を示し、xは前記スペクトル重み付け係数を示し、a、bおよびcは補正値を示す)
に基づく多項式を適用するように構成される、エンコーダ。 - 前記結合器(150’)は、前記補正後の重み付け係数(152’)を取得するために、前記スペクトル重み付け係数(142;142’)と、前記多数の補正値(162;a,b,c)と、前記オーディオ信号(102)に関連するさらなる情報(114)とを結合するように構成される、請求項1に記載のエンコーダ。
- 前記オーディオ信号(102)に関連する前記さらなる情報(114)は、前記アナライザ(110)によって取得された反射係数を含むか、あるいは、前記オーディオ信号(102)のパワースペクトルに関連する情報を含む、請求項2に記載のエンコーダ。
- 前記アナライザ(110)は、線形予測係数(LPC)を判定するように構成され、前記コンバータ(120)は、前記線形予測係数(LPC)から線スペクトル周波数(LSF;122’)またはイミタンススペクトル周波数(ISF)を導出するように構成される、請求項1〜3のいずれか1項に記載のエンコーダ。
- 前記結合器(150;150’)は、前記補正後の重み付け係数(152;152’)を周期的に、1周期ごとに取得するように構成され、
前記計算器(130’)は、前回の周期に対して取得された第1の量子化後の重み付け係数(152’’’)と、前記前回の周期に続く周期に対して取得された第2の量子化後の重み付け係数(152’)とを重み付け結合して、前記第1(152’’’)および前記第2(152’)の量子化後の重み付け係数の値の間の値を含む、平滑化された補正後の重み付け係数(152’’)を取得するように構成された平滑器(155)をさらに備える、請求項1〜4のいずれか1項に記載のエンコーダ。 - 前記多数の補正値(162;a,b,c)は、事前計算後の重み付け量(LSF;142’’)から導出され、前記事前計算後の重み付け量(LSF;142’’)を判定するための計算量は、前記スペクトル重み付け係数(142;142’)を判定するための計算量よりも多い、請求項1〜5のいずれか1項に記載のエンコーダ。
- 前記プロセッサ(140;140’)は、逆調和平均によって前記スペクトル重み付け係数(142;142’)を取得するように構成される、請求項1〜6のいずれか1項に記載のエンコーダ。
- オーディオ伝送システム(600)であって、
請求項1〜8のいずれか1項に記載のエンコーダ(100)と、
前記エンコーダの前記出力信号(182)または導出された信号を受信し、かつ、合成後のオーディオ信号(102’)を供給するために前記出力信号(182)または導出された信号の受信信号を復号化するように構成されたデコーダ(602)とを備え、
前記エンコーダ(100)は、伝送媒体(604)にアクセスして、前記伝送媒体(604)を介して前記出力信号(182)を伝送するように構成される、オーディオ伝送システム。 - 各重み付け係数がオーディオ信号(102)の一部(LSF;ISF)を重み付けするのに適した第1の多数の(IHM)第1重み付け係数(142;142’)に対する補正値(162;a,b,c)を判定する方法であって、前記方法(700)は、
1組のオーディオ信号のオーディオ信号ごとに、第1判定ルールに基づいて前記第1の多数の(IHM)第1重み付け係数(142;142’)を算出するステップと、
前記1組のオーディオ信号のオーディオ信号ごとに、第2判定ルールに基づいて第2の多数の第2重み付け係数(142’’)を算出するステップであって、前記第2の多数の重み付け係数(142’’)の各々は、第1重み付け係数(142;142’)に関連している、算出するステップと、
各距離値(di)が、前記オーディオ信号(102)の一部に関連する第1重み付け係数(142;142’)と第2重み付け係数(142’’)との間の距離に関連した値を有する、第3の多数の距離値(di)を算出するステップと、
前記第1重み付け係数(142;142’)と結合された場合に、前記距離値(di)を低減するのに適した第4の多数の補正値を算出するステップであって、
前記第4の多数の補正値は、前記第1重み付け係数(142;142’)の値を、多項式の項を適合させるための少なくとも1つの変数を含む多項式(y=a+bx+cx2)で乗算するステップを含む多項式フィッティングに基づいて判定される、算出するステップとを含む、方法。 - 前記第4の多数の補正値は、多項式フィッティングに基づいて判定され、
前記第1重み付け係数(142;142’)の値を、前記多項式の項を適合させるための少なくとも1つの変数を含む多項式(y=a+bx+cx2)で乗算するステップと、
前記第3の多数の距離値(di)が以下の式
Ix,iは、前記オーディオ信号(102)のx番目の部分について前記第1判定ルール(IHM)に基づいて判定されるi番目の重み付け係数(142;142’)を示す)に基づく閾値を下回る値を含むように、前記変数に対する値を算出するステップとを含む、請求項10に記載の方法。 - オーディオ信号を符号化する方法(800)であって、前記方法は、
前記オーディオ信号(102)を分析(802)して、前記オーディオ信号(102)から分析予測係数(112)を判定するステップと、
前記分析予測係数(112)から変換後の予測係数(122;122’)を導出するステップ(804)と、
多数の補正値(162;a〜d)を記憶すること(806)と、
補正後の重み付け係数(152;152’)を取得するために、前記変換後の予測係数(122;122’)と前記多数の補正値(162;a〜d)とを結合するステップ(808)であって、
以下の数式
(数8)
w=a+bx+cx2
(式中、wは取得された補正後の重み付け係数を示し、xはスペクトル重み付け係数を示し、a、bおよびcは補正値を示す)に基づく多項式を適用するステップを含む、結合するステップ(808)と、
前記変換後の予測係数(122;122’)の量子化表現(172)を取得するために、前記補正後の重み付け係数(152;152’)を使用して前記変換後の予測係数(122;122’)を量子化するステップ(812)と、
前記変換後の予測係数(122)の表現(172)と、前記オーディオ信号(102)とに基づいて、出力信号(182)を形成するステップ(814)とを含む、方法。 - コンピュータ上で動作している場合に、請求項10〜13のいずれか1項に記載の方法を行うためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13192735 | 2013-11-13 | ||
EP13192735.2 | 2013-11-13 | ||
EP14178815 | 2014-07-28 | ||
EP14178815.8 | 2014-07-28 | ||
PCT/EP2014/073960 WO2015071173A1 (en) | 2013-11-13 | 2014-11-06 | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017501430A JP2017501430A (ja) | 2017-01-12 |
JP6272619B2 true JP6272619B2 (ja) | 2018-01-31 |
Family
ID=51903884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016526934A Active JP6272619B2 (ja) | 2013-11-13 | 2014-11-06 | オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 |
Country Status (16)
Country | Link |
---|---|
US (4) | US9818420B2 (ja) |
EP (2) | EP3483881B1 (ja) |
JP (1) | JP6272619B2 (ja) |
KR (1) | KR101831088B1 (ja) |
CN (2) | CN111179953B (ja) |
AU (1) | AU2014350366B2 (ja) |
BR (1) | BR112016010197B1 (ja) |
CA (1) | CA2928882C (ja) |
ES (1) | ES2716652T3 (ja) |
MX (1) | MX356164B (ja) |
PL (1) | PL3069338T3 (ja) |
PT (1) | PT3069338T (ja) |
RU (1) | RU2643646C2 (ja) |
TW (1) | TWI571867B (ja) |
WO (1) | WO2015071173A1 (ja) |
ZA (1) | ZA201603823B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7049234B2 (ja) | 2018-11-15 | 2022-04-06 | 本田技研工業株式会社 | ハイブリッド飛行体 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102623012B (zh) | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
PL3069338T3 (pl) * | 2013-11-13 | 2019-06-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder do kodowania sygnału audio, system przesyłania audio i sposób określania wartości korekcji |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
KR20190069192A (ko) | 2017-12-11 | 2019-06-19 | 한국전자통신연구원 | 오디오 신호의 채널 파라미터 예측 방법 및 장치 |
US11532316B2 (en) * | 2017-12-19 | 2022-12-20 | Dolby International Ab | Methods and apparatus systems for unified speech and audio decoding improvements |
CN114734436B (zh) * | 2022-03-24 | 2023-12-22 | 苏州艾利特机器人有限公司 | 一种机器人的编码器校准方法、装置及机器人 |
WO2024167252A1 (ko) * | 2023-02-09 | 2024-08-15 | 한국전자통신연구원 | 오디오 신호 코딩 방법 및 이를 수행하는 장치 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE467806B (sv) | 1991-01-14 | 1992-09-14 | Ericsson Telefon Ab L M | Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare |
JPH0764599A (ja) * | 1993-08-24 | 1995-03-10 | Hitachi Ltd | 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 |
JP3273455B2 (ja) | 1994-10-07 | 2002-04-08 | 日本電信電話株式会社 | ベクトル量子化方法及びその復号化器 |
US6098037A (en) * | 1998-05-19 | 2000-08-01 | Texas Instruments Incorporated | Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes |
DE19947877C2 (de) | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
CA2429832C (en) * | 2000-11-30 | 2011-05-17 | Matsushita Electric Industrial Co., Ltd. | Lpc vector quantization apparatus |
ATE520121T1 (de) | 2006-02-22 | 2011-08-15 | France Telecom | Verbesserte celp kodierung oder dekodierung eines digitalen audiosignals |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
KR101412255B1 (ko) | 2006-12-13 | 2014-08-14 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치 및 이들의 방법 |
RU2464650C2 (ru) * | 2006-12-13 | 2012-10-20 | Панасоник Корпорэйшн | Устройство и способ кодирования, устройство и способ декодирования |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
KR101392546B1 (ko) | 2008-09-11 | 2014-05-08 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치 |
US8023660B2 (en) | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
US20100191534A1 (en) * | 2009-01-23 | 2010-07-29 | Qualcomm Incorporated | Method and apparatus for compression or decompression of digital signals |
US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
KR100963219B1 (ko) | 2009-09-09 | 2010-06-10 | 민 우 전 | 연결부재를 이용한 관 연결공법 |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
BR112012009490B1 (pt) * | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
WO2011048117A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
WO2012004349A1 (en) * | 2010-07-08 | 2012-01-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coder using forward aliasing cancellation |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
TWI488176B (zh) * | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
PL2676264T3 (pl) * | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
MY185091A (en) * | 2011-04-21 | 2021-04-30 | Samsung Electronics Co Ltd | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
US9115883B1 (en) | 2012-07-18 | 2015-08-25 | C-M Glo, Llc | Variable length lamp |
ES2714289T3 (es) * | 2013-01-29 | 2019-05-28 | Fraunhofer Ges Forschung | Llenado con ruido en la codificación de audio por transformada perceptual |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
PL3069338T3 (pl) * | 2013-11-13 | 2019-06-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder do kodowania sygnału audio, system przesyłania audio i sposób określania wartości korekcji |
-
2014
- 2014-11-06 PL PL14799376T patent/PL3069338T3/pl unknown
- 2014-11-06 CA CA2928882A patent/CA2928882C/en active Active
- 2014-11-06 CN CN201911425860.9A patent/CN111179953B/zh active Active
- 2014-11-06 KR KR1020167015045A patent/KR101831088B1/ko active IP Right Grant
- 2014-11-06 EP EP18211437.1A patent/EP3483881B1/en active Active
- 2014-11-06 ES ES14799376T patent/ES2716652T3/es active Active
- 2014-11-06 PT PT14799376T patent/PT3069338T/pt unknown
- 2014-11-06 WO PCT/EP2014/073960 patent/WO2015071173A1/en active Application Filing
- 2014-11-06 AU AU2014350366A patent/AU2014350366B2/en active Active
- 2014-11-06 JP JP2016526934A patent/JP6272619B2/ja active Active
- 2014-11-06 BR BR112016010197-9A patent/BR112016010197B1/pt active IP Right Grant
- 2014-11-06 EP EP14799376.0A patent/EP3069338B1/en active Active
- 2014-11-06 RU RU2016122865A patent/RU2643646C2/ru active
- 2014-11-06 MX MX2016006208A patent/MX356164B/es active IP Right Grant
- 2014-11-06 CN CN201480061940.XA patent/CN105723455B/zh active Active
- 2014-11-11 TW TW103139048A patent/TWI571867B/zh active
-
2016
- 2016-05-05 US US15/147,844 patent/US9818420B2/en active Active
- 2016-06-06 ZA ZA2016/03823A patent/ZA201603823B/en unknown
-
2017
- 2017-07-07 US US15/644,308 patent/US10354666B2/en active Active
- 2017-10-13 US US15/783,966 patent/US10229693B2/en active Active
-
2019
- 2019-02-07 US US16/270,429 patent/US10720172B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7049234B2 (ja) | 2018-11-15 | 2022-04-06 | 本田技研工業株式会社 | ハイブリッド飛行体 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6272619B2 (ja) | オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 | |
JP5356406B2 (ja) | オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 | |
US8670981B2 (en) | Speech encoding and decoding utilizing line spectral frequency interpolation | |
US11011181B2 (en) | Audio encoding/decoding based on an efficient representation of auto-regressive coefficients | |
AU2014336357B2 (en) | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information | |
JPH11143498A (ja) | Lpc係数のベクトル量子化方法 | |
WO2014198726A1 (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171229 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6272619 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |