CN101556799A - 一种音频解码方法和音频解码器 - Google Patents

一种音频解码方法和音频解码器 Download PDF

Info

Publication number
CN101556799A
CN101556799A CNA2009101375653A CN200910137565A CN101556799A CN 101556799 A CN101556799 A CN 101556799A CN A2009101375653 A CNA2009101375653 A CN A2009101375653A CN 200910137565 A CN200910137565 A CN 200910137565A CN 101556799 A CN101556799 A CN 101556799A
Authority
CN
China
Prior art keywords
frequency
region signal
decoding
monophony
acoustic channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009101375653A
Other languages
English (en)
Other versions
CN101556799B (zh
Inventor
张琦
张立斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2009101375653A priority Critical patent/CN101556799B/zh
Publication of CN101556799A publication Critical patent/CN101556799A/zh
Priority to PCT/CN2010/072781 priority patent/WO2010130225A1/zh
Priority to EP10774566.3A priority patent/EP2431971B1/en
Priority to JP2012510106A priority patent/JP5418930B2/ja
Priority to KR1020117028589A priority patent/KR101343898B1/ko
Priority to US13/296,001 priority patent/US8620673B2/en
Application granted granted Critical
Publication of CN101556799B publication Critical patent/CN101556799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/95Arrangements characterised by the broadcast information itself characterised by a specific format, e.g. an encoded audio stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • H04H40/36Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例公开了一种音频解码方法,该方法包括:确定待解码的码流为单声道编码层和立体声第一增强层码流;对所述单声道编码层进行解码,获得单声道解码频域信号;在第一子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。本发明实施例还提供相应的解码器。本发明实施例所述解码方法和解码器可以使解码端与编码端信号保持一致,从而可以提高解码立体声信号质量。

Description

一种音频解码方法和音频解码器
技术领域
本发明涉及多声道音频编解码技术领域,具体涉及一种音频解码方法和音频解码器。
背景技术
目前,多声道音频信号有着广泛的应用场景,如电话会议、游戏等,因此多声道音频信号的编解码也越来越受到重视。基于波形编码的传统编码器如MPEG-II(Moving Pictures Experts Group II,动态图像专家组标准第二版)、MP3(Moving Picture Experts Group Audio Layer III,动态图像专家组音频第三层)和AAC(Advanced Audio Coding,高级音频编码)在对多声道信号进行编码时,都是对每一个声道进行独立编码。这种方法虽然能够较好地恢复出多声道信号,但是需要的带宽、编码码率是单声道信号的数倍。
目前较为流行的立体声或多声道编码技术是参数立体声编码,其利用很少的带宽就可以重建出听觉感受和原始信号完全相同的多声道信号。其基本方法是:在编码端,将多声道信号下混成一个单声道信号,并对此信号进行独立编码,同时提取各声道间的声道参数,并对这些参数进行编码。在解码端,首先解码出下混后的单声道信号,然后解码出各声道间的声道参数,最后利用这些声道参数与下混后的单声道信号一起合成出各多声道信号。典型的参数立体声编码技术,如PS(变量立体声)等都有着广泛的应用。
在参数立体声编码中通常用来描述各声道间相互关系的声道参数有ITD(Inter-channel Time Difference,声道间时间差)、ILD(Inter-channel LevelDifference,声道间幅度差)及ICC(Inter-Channel Coherence,声道间相关性)等。这些参数可以表征立体声声像信息,如声源发声方向、位置等。在编码端对这些参数进行编码传输,并且对由多声道得到的下混信号进行编码传输,就可以在解码端较好地重构出立体声信号,而且占用带宽小,编码码率低。
但是,在对现有技术的研究和实践过程中,本发明的发明人发现,采用现有的参数立体声编解码方法,存在编解码端处理信号不一致的问题,这种编解码信号的不一致会使解码得到的信号质量下降。
发明内容
本发明实施例提供一种音频解码方法和音频解码器,能够使编解码端处理信号一致,提高解码立体声信号的质量。
本发明实施例包括以下技术方案:
一种音频解码方法,包括:
确定待解码的码流为单声道编码层和立体声第一增强层码流;
对所述单声道编码层进行解码,获得单声道解码频域信号;
在第一子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构;
在第二子带区域采用未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
一种音频解码器,包括:判断单元、处理单元和第一重构单元,其中:
所述判断单元,用于判断待解码的码流是否为单声道编码层和立体声第一增强层码流,如果是,则触发第一重构单元;
所述处理单元,用于对所述单声道编码层进行解码,获得单声道解码频域信号;
所述第一重构单元,用于在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用所述处理单元解码得到的未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
本发明实施例根据待解码的码流状态决定解码过程中在对单声道信号进行重构时所采用的单声道信号类型,其中在确定待解码的码流为单声道编码层和立体声第一增强层码流时,在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用未经能量调整的单声道解码频域解码信号对左右声道频域信号进行重构,由于待解码的码流只包含单声道编码层和立体声第一增强层码流,而不包含残差第二子带区域的参数,所以在第二子带区域采用未经能量调整的解码频域解码信号对左右声道频域信号进行重构,从而使得解码端与编码端信号保持一致,因此可以提高解码立体声信号质量。
附图说明
图1是参数立体声音频编码方法流程图;
图2是本发明实施例中一种音频解码方法流程图;
图3是本发明实施例中另一种音频解码方法流程图;
图4是本发明实施例中音频解码器一结构示意图;
图5是本发明实施例中音频解码器二结构示意图。
具体实施方式
本发明的发明人发现,现有音频解码方法所重构的立体声信号质量取决于两方面:重构的单声道信号质量和立体声参数提取的准确性。其中,在解码端重构的单声道信号质量对最终输出的重构立体声信号质量起着非常重要的作用。因此在解码端需要尽可能高质量地重构出单声道信号,在此基础上才能重构出高质量的立体声信号。
本发明实施例提供一种音频解码方法,能够使编解码端的处理信号一致,从而可以提高解码立体声信号的质量。本发明实施例还提供相应的音频解码器。
为使本领域技术人员更好地理解和实现本发明实施例,以下首先对参数立体声编码在编码端所执行的操作进行详细说明,参照图1,为参数立体声音频编码方法流程图,具体步骤如下:
S11、根据原始左右声道信号提取声道参数ITD,根据ITD参数对左右声道信号进行声道延时调整,对调整后的左右声道信号进行下混处理,得到单声道信号(也可称为和信号即M信号)和边信号(S信号)。
M信号和S信号在[0~7khz]频带内的频域信号分别为:M{m(0),m(1),…,m(N-1)},S{s(0),s(1),…,s(N-1)}。根据式(1)得到左右声道在[0~7khz]频带内的频域信号L{l(0),l(1),…,l(N-1)},R{r(0),r(1),…,r(N-1)}。
l(i)=m(i)+s(i)
                    ..........................................(1)
r(i)=m(i)-s(i)
S12、将左右声道的频域信号划分为8个子带,按子带提取左右声道参数ILD:W[band][l],W[band][r],并进行量化编码得到量化后的声道参数ILD:Wq[band][l],Wq[band][r],其中band∈(0,1,2,3,4,5,6,7),1表示左声道参数ILD,r标识为右声道参数ILD。
S13、对M信号进行编码,并且进行本地解码得到本地解码频域信号M1{m1(0),m1(1),…,m1(N-1)}。
S14、将S13得到的M1频域信号划分为和左右声道相同的8个子带,按照式(2)计算5,6,7子带的能量补偿参数ecomp[band]。对能量补偿参数进行量化编码,得到量化后的能量补偿参数ecompq[band]。
ecomp [ band ] = 10 lg ( C [ band ] [ l ] [ l ] Wq [ band ] [ l ] × Wq [ band ] [ l ] × Unmofiyenergy [ band ] ) , Wq [ band ] [ l ] > 1 10 lg ( C [ band ] [ r ] [ r ] Wq [ band ] [ r ] × Wq [ band ] [ r ] × Unmofiyenergy [ band ] ) , Wq [ band ] [ l ] ≤ 1 . . . ( 2 )
其中: C [ band ] [ l ] [ l ] = Σ i ∈ [ start band , end band ] l ( i ) × l ( i ) , C [ band ] [ r ] [ r ] = Σ i ∈ [ start band , end band ] l ( i ) × l ( i ) , Unmofiyenergy [ band ] = Σ i ∈ [ start band , end band ] m 1 ( i ) × m 1 ( i ) 分别表示在当前子带原始左声道能量、原始右声道能量、本地解码单声道能量,[startband,endband]表示当前子带频率点的起始位置和结束位置。
S15、对本地解码频域信号M1进行频谱峰值分析,得到频谱分析结果MASK{mask(0),mask(1),…,mask(N-1)},其中mask(i)∈{0,1}。当M1在i处的频谱信号m1为峰值时,mask(i)=1,否则mask(i)=0。
S16、选择最佳能量调整因子multiplier,按照式(3)对解码频域信号M1进行能量调整,得到能量调整后的频域信号M2{m2(0),m2(1),…,m2(N-1)},对能量调整因子multiplier进行量化编码。
m 2 ( i ) = m 1 ( i ) × multiplier , mask ( i ) = 0 m 1 ( i ) , mask ( i ) = 1 . . . ( 3 )
S17、利用能量调整后的频域信号M2、左右声道频域信号L、R以及左右声道量化后的声道参数ILD:Wq,按照式(4)计算左右声道残差信息resleft{eleft(0),eleft(1),…,eleft(N-1),以及resright{eright(0),eright(1),…,eright(N-1)}。
eleft(i)=l(i)-Wq[band][l]×m2(i)
                                 ,i∈[startband,endband],band=0,1,2,3,…7
eright(i)=r(i)-Wq[band][r]×m2(i)
................................................................(4)
S18、对左右声道残差进行K-L(Karhunen-Loeve)变换,对变换核H进行量化编码,对变换后得到的残差主元EU{eu(0),eu(1),…,eu(N-1)}、残差次元ED{ed(0),ed(1),…,ed(N-1)}进行分层多次量化编码。
S19、对编码端提取的各种编码信息按照重要程度进行分层封装码流,将编码码流传输。
其中,M信号的编码信息最重要,首先作为单声道编码层进行封装;声道参数ILD、声道参数ITD、能量调整因子、能量补偿参数、K-L变换核和残差主元0~4子带第一次量化编码结果作为立体声第一增强层进行封装;其他信息也按重要性进行分层封装。
由于码流的传输网络环境时刻在变化,当网络资源不足时,在解码端不能接收到所有的编码信息。例如只接收到单声道编码层和立体声第一增强层码流,其他层码流没有接收到。
本发明的发明人在对现有技术的研究和实践过程中发现:对于解码端只接收到单声道编码层和立体声第一增强层码流的情况下,即待解码的码流只有单声道编码层和立体声第一增强层码流,现有技术中对解码端的能量补偿是基于能量调整后的单声道解码频域信号进行的,而在编码端步骤S14中提取5,6,7子带的能量补偿参数是基于未经能量调整的单声道解码频域信号进行的,此时,编解码段的处理信号不一致,这种编解码端信号的不一致会使解码输出信号的质量出现下降。
而本发明实施例在解码端根据待解码的码流状态决定解码过程中采用的单声道解码频域信号类型,当解码端只接收到单声道编码层和立体声第一增强层码流时,在重构5,6,7子带的立体声信号时采用未经能量调整的单声道解码频域信号进行重构;在重构0~4子带的立体声信号时采用经过能量调整后的单声道解码频域信号进行重构。
参照图2,为本发明实施例中一种音频解码方法流程图,包括:
S21、确定待解码的码流为单声道编码层和立体声第一增强层码流;
S22、对所述单声道编码层进行解码,获得单声道解码频域信号;
S23、在第一子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构;
S24、在第二子带区域采用未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
本发明实施例提供了一种音频解码方法,根据接收到的码流状态决定解码过程中在对单声道信号进行重构时所采用的单声道信号类型,在确定接收到的码流为单声道编码层和立体声第一增强层码流时,在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用未经能量调整的单声道解码频域信号对左右声道频域信号进行重构,由于待解码的码流只有单声道编码层和立体声第一增强层码流,解码端没有接收到残差第二子带区域的参数,所以在第二子带区域采用未经能量调整的单声道解码频域信号对左右声道频域信号进行重构,从而使得解码端与编码端信号的处理信号保持一致,从而可以提高解码立体声信号质量。
参照图3,为本发明实施例中另一种音频解码方法流程图,以下通过具体步骤详细说明在解码端确定只接收到单声道编码层和立体声第一增强层码流的情况下,本发明实施例在解码端所采用的解码方法:
S31、判断接收到的码流是否只包含单声道编码层和立体声第一增强层码流,如果是,则执行步骤S32;
S32、对接收到的单声道编码层码流可以采用与编码端使用的音频/语音编码器对应的任意一种音频/语音解码器进行解码操作,进行得到单声道解码频域信号:M1{m1(0),m1(1),…,m1(N-1)},该信号即为编码端步骤S13得到的信号。从立体声第一增强层码流中读取各个参数对应的码字,对各参数进行解码得到声道参数ILD:Wq[band][l],Wq[band][r]、声道参数ITD、能量调整因子multiplier、量化后能量补偿参数ecompq[band]、K-L变换核H和残差主元0~4子带第一次量化结果EUq1{euq1(0),euq1(1),…,euq1(end4),0,0…,0}。
S33、对单声道解码频域信号M1进行频谱峰值分析,即在频域中搜索频谱极大值,得到频谱分析结果:MASK{mask(0),mask(1),…,mask(N-1)},其中mask(i)∈{0,1}。当M1在i处的频谱信号m1(i)为峰值,即极大值时,mask(i)=1,否则mask(i)=0。
S34、根据解码得到的能量调整因子multiplier和频谱分析结果对单声道解码频域信号采用式(5)进行能量调整:
m 2 ( i ) = m 1 ( i ) × multiplier , mask ( i ) = 0 m 1 ( i ) , mask ( i ) = 1 . . . ( 5 )
从而得到能量调整后的单声道解码频域信号M2{m2(0),m2(1),…,m2(N-1)}。
S35、根据K-L变换核H和残差主元0~4子带第一次量化结果EUq1{euq1(0),euq1(1),…,euq1(end4),0,0…,0}按式(6)进行反K-L变换,得到左右声道在0~4子带的第一次量化残差信息resleftq1{eleftq1(0),eleftq1(1),…,eleftq1(end4),0,0…,0},resrightq1{erightq1(0),erightq1(1),…,erightq1(end4),0,0…,0}。
resleft q 1 resright q 1 = H - 1 eu q 1 0 . . . ( 6 )
S36、在0~4子带采用经过能量调整后的单声道解码频域信号M2,根据式(7)重构左右声道频域信号,在5,6,7子带采用未经能量调整的单声道解码频域信号M1根据式(8)重构左右声道频域信号。
l′(i)=eleftq1(i)+Wq[band][l]×m2(i)
                                    ,i∈[startband,endband],band=0,1,2,3,4
r′(i)=erightq1(i)+Wq[band][r]×m2(i)
................................................................(7)
l′(i)=eleftq1(i)+Wq[band][l]×m1(i)
                                    ,i∈[startband,endband],band=5,6,7
r′(i)=erightq1(i)+Wq[band][r]×m1(i)
................................................................(8)
由于在解码端接收到了立体声第一增强层码流,其中包含0-4子带的左右声道残差信息,因此在重构0~4子带的立体声信号时采用能量调整后的单声道解码频域信号M2对左右声道频域信号进行重构。而除了单声道编码层和立体声第一增强层之外的码流,解码端没有接收到其他的增强层码流,从而无法获得5,6,7子带的左右声道残差信息,且在编码端的步骤S14中,是按照式(2)提取5,6,7子带的能量补偿参数的,从S14可以看出,所述能量补偿参数是基于单声道解码频域信号M1进行的,因此本步骤中在重构5,6,7子带的立体声信号时采用未经能量调整的单声道解码频域信号M1进行重构,而在0~4子带的立体声信号采用经过能量调整后的单声道解码频域信号M2进行重构,从而使得编解码端的信号保持一致。
S37、按照式(9)对重构后的左右声道频域信号的5,6,7子带进行能量补偿调整。
l ′ ( i ) = l ′ ( i ) × 10 ecomp q [ band ] / 20 ,i∈[startband,endband],band=5,6,7   .........(9)
r ′ ( i ) = r ′ ( i ) × 10 ecomp q [ band ] / 20
S38、对左右声道频域信号进行处理,得到最终的左右声道输出信号。
以上以参数立体声音频编码过程中将频域信号划分为8个子带,且主元参数的0~4子带封装在立体声第一增强层,有关残差的其他参数封装在其他立体声增强层进行说明,需要说明的是,此时,0~4子带称为第一子带区域,5~7子带称为第二子带区域。可以理解的是,在具体实施中,参数立体声音频编码过程中也可以将频域信号划分为其他数目的多个子带。即使对于划分为8个子带,也可以将8个子带划分为其他不同的两个子带区域。例如,将主元参数的0~3子带封装在立体声第一增强层,有关残差的其他参数封装在其他立体声增强层,此时,0~3子带称为第一子带区域,4~7子带称为第二子带区域,相应的,对于待解码的码流只有单声道编码层和立体声第一增强层码流的情况,本发明实施例在解码端在0~3子带(第一子带区域)采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在4~7子带(第二子带区域)采用未经能量调整的单声道解码频域信号对左右声道频域信号进行重构。
从本实施例可以看出,根据接收到的码流状态决定解码过程中在对单声道信号进行重构时所采用的单声道信号类型,其中在确定接收到的码流为单声道编码层和立体声第一增强层码流时,在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用未经能量调整的单声道解码频域信号对左右声道频域信号进行重构,由于待解码的码流只有单声道编码层和立体声第一增强层码流,解码端没有接收到残差第二子带区域的参数,所以在第二子带区域采用未经能量调整的单声道解码频域信号对左右声道频域信号进行重构,从而使得解码端与编码端信号的处理信号保持一致,从而可以提高解码立体声信号质量。
对于解码端接收到的码流除了单声道编码层和立体声第一增强层码流外,还包含其他立体声增强层码流(例如,单声道编码层和所有立体声增强层码流完全接收)时,解码过程与上述过程有所不同。不同之处在于,此时可以解码得到残差在所有子带区域的信息,因此在对左右声道频域信号(包括第一子带区域的立体声信号和第二子带区域的立体声信号)进行重构时采用能量调整后的单声道解码频域信号。并且,由于能够完整得到残差在所有子带区域的信息,因此不需要对第一子带或第二子带的左右声道频域信号进行能量补偿。从而使得编解码端处理信号一致。
以上对本发明实施例所采用的音频解码方法进行了详细说明,以下对使用上述音频解码方法的解码器进行对应介绍。
参照图4,为本发明实施例中音频解码器一结构示意图,音频解码器一包括:判断单元41、处理单元42和第一重构单元43,其中:
判断单元41,用于判断待解码的码流是否为单声道编码层和立体声第一增强层码流,如果是,则触发第一重构单元43;
处理单元42,用于对所述单声道编码层进行解码,获得单声道解码频域信号;
第一重构单元43,用于在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用所述处理单元42解码得到的未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
所述处理单元42还用于对所述立体声第一增强层码流进行解码,获得能量调整因子,对所述单声道解码频域信号进行频谱峰值分析,获得频谱分析结果,根据所述频谱分析结果和所述能量调整因子对所述单声道解码频域信号进行能量调整。
如果参数立体声音频编码过程中将频域信号划分为8个子带,且主元参数的0~4子带封装在立体声第一增强层,有关残差的其他参数封装在其他立体声增强层,则第一重构单元43具体用于在0~4子带采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构,在5,6,7子带采用处理单元42解码得到的未经能量调整的单声道解码频域信号对左右声道频域信号进行重构。
当第一重构单元43获得重构后的左右声道频域信号后,所述处理单元42还用于对重构后的左右声道频域信号的5,6,7子带进行能量补偿调整。
可见,本实施例所介绍的音频解码器在确定只接收到单声道编码层和立体声第一增强层码流时,在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用未经能量调整的单声道频域信号对左右声道频域信号进行重构,由于只接收到单声道编码层和立体声第一增强层码流,因此残差第二子带区域的参数没有接收到,所以在第二子带区域采用未经能量调整的单声道解码频域信号对左右声道频域信号进行重构,从而使得解码端与编码端处理信号保持一致,因此可以提高解码立体声信号质量。
参照图4,为本发明实施例中音频解码器二结构示意图,与音频解码器一的不同之处在于,音频解码器二中还包括第二重构单元51,其中:
当所述判断单元41的判断结果为待解码的码流除了单声道编码层和立体声第一增强层码流外,还包含其他立体声增强层码流时,所述第二重构单元51用于在所有子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构。
可以理解的是,在具体实施中,第一重构单元43与第二重构单元51可以集成在一起,作为一个重构单元。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的音频解码方法和音频解码器进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1、一种音频解码方法,其特征在于,包括:
确定待解码的码流为单声道编码层和立体声第一增强层码流;
对所述单声道编码层进行解码,获得单声道解码频域信号;
在第一子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构;
在第二子带区域采用未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
2、如权利要求1所述的方法,其特征在于,还包括:
对所述单声道解码频域信号进行能量调整。
3、如权利要求2所述的方法,其特征在于,所述对所述单声道解码频域信号进行能量调整包括:
对所述立体声第一增强层码流进行解码,获得能量调整因子;
对所述单声道解码频域信号进行频谱峰值分析,获得频谱分析结果;
根据所述频谱分析结果和所述能量调整因子对所述单声道解码频域信号进行能量调整。
4、如权利要求1-3任一所述的方法,其特征在于,所述在第一子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构具体为:
在0~4子带采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构;在5,6,7子带采用未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
5、如权利要求4所述的方法,其特征在于,对左右声道频域信号重构后还包括:
对重构后的左右声道频域信号的5,6,7子带进行能量补偿调整。
6、一种音频解码器,其特征在于,包括:判断单元、处理单元和第一重构单元,其中:
所述判断单元,用于判断待解码的码流是否为单声道编码层和立体声第一增强层码流,如果是,则触发第一重构单元;
所述处理单元,用于对所述单声道编码层进行解码,获得单声道解码频域信号;
所述第一重构单元,用于在第一子带区域采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在第二子带区域采用所述处理单元解码得到的未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
7、如权利要求6所述的音频解码器,其特征在于,所述处理单元还用于对所述立体声第一增强层码流进行解码,获得能量调整因子,对所述单声道解码频域信号进行频谱峰值分析,获得频谱分析结果,根据所述频谱分析结果和所述能量调整因子对所述单声道解码频域信号进行能量调整。
8、如权利要求7所述的音频解码器,其特征在于,所述第一重构单元具体用于在0~4子带采用能量调整后的单声道解码频域信号对左右声道频域信号进行重构;在5,6,7子带采用所述处理单元解码得到的未经能量调整的所述单声道解码频域信号对左右声道频域信号进行重构。
9、如权利要求8所述的音频解码器,其特征在于,当第一重构单元获得重构后的左右声道频域信号后,所述处理单元还用于对重构后的左右声道频域信号的5,6,7子带进行能量补偿调整。
10、如权利要求6所述的音频解码器,其特征在于,还包括:第二重构单元,
当所述判断单元的判断结果为待解码的码流除了单声道编码层和立体声第一增强层码流外,还包含其他立体声增强层码流时,所述第二重构单元用于在所有子带区域采用能量调整后的所述单声道解码频域信号对左右声道频域信号进行重构。
CN2009101375653A 2009-05-14 2009-05-14 一种音频解码方法和音频解码器 Active CN101556799B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2009101375653A CN101556799B (zh) 2009-05-14 2009-05-14 一种音频解码方法和音频解码器
PCT/CN2010/072781 WO2010130225A1 (zh) 2009-05-14 2010-05-14 一种音频解码方法和音频解码器
EP10774566.3A EP2431971B1 (en) 2009-05-14 2010-05-14 Audio decoding method and audio decoder
JP2012510106A JP5418930B2 (ja) 2009-05-14 2010-05-14 音声復号化方法および音声復号化器
KR1020117028589A KR101343898B1 (ko) 2009-05-14 2010-05-14 오디오 디코딩 방법 및 오디오 디코더
US13/296,001 US8620673B2 (en) 2009-05-14 2011-11-14 Audio decoding method and audio decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101375653A CN101556799B (zh) 2009-05-14 2009-05-14 一种音频解码方法和音频解码器

Publications (2)

Publication Number Publication Date
CN101556799A true CN101556799A (zh) 2009-10-14
CN101556799B CN101556799B (zh) 2013-08-28

Family

ID=41174887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101375653A Active CN101556799B (zh) 2009-05-14 2009-05-14 一种音频解码方法和音频解码器

Country Status (6)

Country Link
US (1) US8620673B2 (zh)
EP (1) EP2431971B1 (zh)
JP (1) JP5418930B2 (zh)
KR (1) KR101343898B1 (zh)
CN (1) CN101556799B (zh)
WO (1) WO2010130225A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106205626A (zh) * 2015-05-06 2016-12-07 南京青衿信息科技有限公司 一种针对被舍弃的子空间分量的补偿编解码装置及方法
WO2017193550A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
WO2017193549A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
WO2018058379A1 (zh) * 2016-09-28 2018-04-05 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
CN109478406A (zh) * 2016-06-30 2019-03-15 杜塞尔多夫华为技术有限公司 一种用于对多声道音频信号进行编解码的装置及方法
CN112270934A (zh) * 2020-09-29 2021-01-26 天津联声软件开发有限公司 一种nvoc低速窄带声码器的语音数据处理方法
CN115116232A (zh) * 2022-08-29 2022-09-27 深圳市微纳感知计算技术有限公司 汽车鸣笛的声纹比较方法、装置、设备及存储介质
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102292769B (zh) * 2009-02-13 2012-12-19 华为技术有限公司 一种立体声编码方法和装置
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01118199A (ja) 1988-04-28 1989-05-10 Kawai Musical Instr Mfg Co Ltd 電子楽器の電源投入時処理方式
JPH06289900A (ja) 1993-04-01 1994-10-18 Mitsubishi Electric Corp オーディオ符号化装置
KR0174084B1 (ko) * 1995-09-25 1999-04-01 이준 Mpeg-2 다채널 오디오 복호화기의 역변환기
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JPH1118199A (ja) * 1997-06-26 1999-01-22 Nippon Columbia Co Ltd 音響処理装置
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
FR2824432B1 (fr) * 2001-05-07 2005-04-08 France Telecom Procede d'extraction de parametres d'un signal audio, et codeur mettant en oeuvre un tel procede
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2268340T3 (es) 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
TWI288915B (en) 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
CA3035175C (en) * 2004-03-01 2020-02-25 Mark Franklin Davis Reconstructing audio signals with multiple decorrelation techniques
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
EP1969901A2 (en) * 2006-01-05 2008-09-17 Telefonaktiebolaget LM Ericsson (publ) Personalized decoding of multi-channel surround sound
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
EP2048658B1 (en) * 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
JP2008164823A (ja) 2006-12-27 2008-07-17 Toshiba Corp オーディオデータ処理装置
EP2201566B1 (en) * 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
JP5404412B2 (ja) * 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
EP2215629A1 (en) * 2007-11-27 2010-08-11 Nokia Corporation Multichannel audio coding
CN101727906B (zh) 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHANG CHIA-MING ET AL: "Design of HE-AAC Version 2 Encoder", 《AES CONVENTION 121;OCTOBER 2006,AES,60 EAST 42ND STREET,ROOM 2520 NEW YORK 10165-2520,USA》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106205626B (zh) * 2015-05-06 2019-09-24 南京青衿信息科技有限公司 一种针对被舍弃的子空间分量的补偿编解码装置及方法
CN106205626A (zh) * 2015-05-06 2016-12-07 南京青衿信息科技有限公司 一种针对被舍弃的子空间分量的补偿编解码装置及方法
WO2017193550A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
WO2017193549A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
CN109478406B (zh) * 2016-06-30 2023-06-27 杜塞尔多夫华为技术有限公司 一种用于对多声道音频信号进行编解码的装置及方法
CN109478406A (zh) * 2016-06-30 2019-03-15 杜塞尔多夫华为技术有限公司 一种用于对多声道音频信号进行编解码的装置及方法
WO2018058379A1 (zh) * 2016-09-28 2018-04-05 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
CN108140393A (zh) * 2016-09-28 2018-06-08 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
US10593339B2 (en) 2016-09-28 2020-03-17 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
US10984807B2 (en) 2016-09-28 2021-04-20 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
US11922954B2 (en) 2016-09-28 2024-03-05 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
CN108140393B (zh) * 2016-09-28 2023-10-20 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
CN112270934A (zh) * 2020-09-29 2021-01-26 天津联声软件开发有限公司 一种nvoc低速窄带声码器的语音数据处理方法
CN112270934B (zh) * 2020-09-29 2023-03-28 天津联声软件开发有限公司 一种nvoc低速窄带声码器的语音数据处理方法
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置
CN115116232B (zh) * 2022-08-29 2022-12-09 深圳市微纳感知计算技术有限公司 汽车鸣笛的声纹比较方法、装置、设备及存储介质
CN115116232A (zh) * 2022-08-29 2022-09-27 深圳市微纳感知计算技术有限公司 汽车鸣笛的声纹比较方法、装置、设备及存储介质

Also Published As

Publication number Publication date
EP2431971A1 (en) 2012-03-21
JP5418930B2 (ja) 2014-02-19
KR101343898B1 (ko) 2013-12-20
WO2010130225A1 (zh) 2010-11-18
US8620673B2 (en) 2013-12-31
EP2431971A4 (en) 2012-03-21
CN101556799B (zh) 2013-08-28
JP2012527001A (ja) 2012-11-01
KR20120016115A (ko) 2012-02-22
US20120095769A1 (en) 2012-04-19
EP2431971B1 (en) 2019-01-09

Similar Documents

Publication Publication Date Title
CN101556799B (zh) 一种音频解码方法和音频解码器
KR101056325B1 (ko) 복수의 파라미터적으로 코딩된 오디오 소스들을 결합하는 장치 및 방법
TWI550598B (zh) 使用聯合編碼殘餘信號之音訊編碼器、音訊解碼器、方法及電腦程式
AU682926B2 (en) Process for coding a plurality of audio signals
US11170791B2 (en) Systems and methods for implementing efficient cross-fading between compressed audio streams
CN101996634B (zh) 用于低比特率音频编码应用的高效可标度参数立体声编码
JP4794448B2 (ja) オーディオエンコーダ
RU2197776C2 (ru) Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты)
US7751572B2 (en) Adaptive residual audio coding
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
CN1981326B (zh) 音频信号解码装置和方法及音频信号编码装置和方法
CN112400204A (zh) 使增强型音频传输与向后兼容音频传输同步
MXPA06009931A (es) Codificacion, basada en la frecuencia, de canales en sistemas de codificacion parametricos de multiples canales.
RU2007139922A (ru) Кодирование и декодирование аудио
TW202347316A (zh) 用以編碼音訊信號或用以解碼經編碼音訊場景之設備、方法及電腦程式
JP2021513108A (ja) ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法
CN101572088A (zh) 立体声编解码方法、编解码器及编解码系统
CN101506875B (zh) 用于组合多个参数编码的音频源的设备和方法
CN112424862A (zh) 在向后兼容音频比特流中嵌入增强的音频传输
Hilpert et al. The MPEG Surround audio coding standard [Standards in a nutshell]
US11961538B2 (en) Systems and methods for implementing efficient cross-fading between compressed audio streams
Noll Digital audio for multimedia
Bang et al. Audio Transcoding Algorithm for Mobile Multimedia Application

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210422

Address after: Unit 3401, unit a, building 6, Shenye Zhongcheng, No. 8089, Hongli West Road, Donghai community, Xiangmihu street, Futian District, Shenzhen, Guangdong 518040

Patentee after: Honor Device Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right