CN101989425B - 多描述音频编解码的方法、装置及系统 - Google Patents

多描述音频编解码的方法、装置及系统 Download PDF

Info

Publication number
CN101989425B
CN101989425B CN2009100899577A CN200910089957A CN101989425B CN 101989425 B CN101989425 B CN 101989425B CN 2009100899577 A CN2009100899577 A CN 2009100899577A CN 200910089957 A CN200910089957 A CN 200910089957A CN 101989425 B CN101989425 B CN 101989425B
Authority
CN
China
Prior art keywords
frequency
description
signal
many
frequency range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100899577A
Other languages
English (en)
Other versions
CN101989425A (zh
Inventor
詹五洲
杨智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Innovation Polymerization LLC
Tanous Co
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN2009100899577A priority Critical patent/CN101989425B/zh
Priority to PCT/CN2010/074052 priority patent/WO2011012029A1/zh
Priority to EP10803862A priority patent/EP2450882A4/en
Publication of CN101989425A publication Critical patent/CN101989425A/zh
Priority to US13/361,580 priority patent/US8510121B2/en
Application granted granted Critical
Publication of CN101989425B publication Critical patent/CN101989425B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例提供了一种多描述音频编解码的方法、装置及系统。所述音频编码方法具体包括:首先将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分;再对所划分出的多个频段部分分别采用不同音质的多描述编码方法;然后再将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成多描述比特流。这样就可以针对不同的频段采用不同音质的多描述编解码方法,从而有效降低了多描述编解码的码率,提高了多描述编解码的效果,进而提升了音频传输的质量。

Description

多描述音频编解码的方法、装置及系统
技术领域
本发明涉及网络通信领域,尤其涉及一种多描述音频编解码的方法、装置及系统。
背景技术
目前,随着现代IP网络和移动网络技术的迅猛发展,以及音频编解码技术在编码质量和编码效率上的提高,高质量的音频业务迅速地向各种现代通信系统融合。然而,以包交换为基础的通信网络,由于网络拥塞、信道干扰和噪声等原因,都不可避免的面临丢包和较长迟延的问题,而通过IP(InternetProtocol)网络和移动通信系统传输的音频信息质量都无疑会受到丢包和迟延的严重影响。
多描述编码(MDC,Multiple Description Coding)技术是一种在不可靠网络中传输信息的信源编码技术,它可以在不增加迟延的情况下,通过生成多个传输比特流,并在各比特流中引入多余度的方法,提供一种稳健的抗丢包的信源编码算法。基于多描述编码的总体思路是在原始音频信号处理的层面上进行多描述的分析与合成:首先,将原始音频信号分解为互不相关的掩蔽门限信号和剩余信号两类;然后将表征原始音频信号信息的剩余信号和掩蔽门限送给多描述编码器进行多描述编码,得到两个可以进行单独或联合处理的多描述解码或描述;然后在量化和编码的层面上分别对掩蔽门限和剩余信号进行双描述三解码器的多描述编解码处理。在信道丢包严重时,还可以根据不同描述的历史记录对丢包进行差错隐藏,利用这种技术方案就可以有效地解决音频编码传输丢包所导致的质量下降问题。
如图1所示为现有技术中多描述编码器的编码过程示意图,图中:对掩蔽门限和剩余信号分别进行多描述编码,并分别得到两个描述。上述的多描述编码算法可以采用现有的多描述标量量化算法(MDSQ,Multiple DescriptionScalar quantization)或多描述变换编码算法(MDTC,Multiple DescriptionTransform Coding)等,当然也可以采用多描述矢量量化(VQ,VectorQuantization)等方法。其中,由于剩余信号占了码率的大部分,约为80%,而掩蔽门限相对于剩余信号来说数据量较小,所以掩蔽门限的多描述编码还可以采用直接拷贝的形式来完成,即图1中掩蔽门限描述1和掩蔽门限描述2完全相同。在掩蔽门限和剩余信号分别进行多描述编码之后,掩蔽门限描述1和剩余信号描述1在合路器1中组合形成描述1;掩蔽门限描述2和剩余信号描述2在合路器2中组合形成描述2。
在上述现有技术的方案中,由于存在多路描述码流,而每路码流都会增加一些冗余信息,这就会造成码率的冗余度过高,例如在采用二描述编码时,和没有采用多描述的编码器相比,增加了百分五十的码率,这样就影响了多描述编解码的效果,降低了音频传输的性能。
发明内容
本发明实施例提供了一种多描述音频编解码的方法、装置及系统,能够降低多描述编解码的码率,提高多描述编解码的效果,进而提升音频传输质量。
本发明实施例提供了一种多描述音频编码的方法,包括:
将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分;
对所划分出的多个频段部分分别采用不同音质的多描述编码方法;
将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成多描述比特流。
本发明实施例还提供了一种多描述音频解码的方法,所述方法包括:
将所接收到的多描述比特流划分成频率不同的多个描述信号部分;
对各频率不同的多个描述信号部分分别进行多描述解码,得到频率不同的各剩余信号部分;
将所得到的频率不同的各剩余信号部分进行组合,重构得到表征音频信号信息的剩余信号。
本发明实施例还提供了一种多描述音频编码的装置,包括:
频段划分单元,用于将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分;
多描述编码单元,用于对所述频段划分单元所划分出的多个频段部分分别采用不同音质的多描述编码方法;
比特流组合单元,用于将所述多描述编码单元采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成多描述比特流。
本发明实施例还提供了一种多描述音频解码的装置,包括:
频率信号划分单元,用于将所接收到的多描述比特流划分成频率不同的多个描述信号部分;
多描述解码单元,用于对各频率不同的多个描述信号部分分别进行多描述解码,得到频率不同的剩余信号部分;
信号组合单元,用于将所得到的频率不同的剩余信号部分进行组合,重构得到表征音频信号信息的剩余信号。
本发明实施例还提供了一种多描述音频编解码系统,所述系统包括上述的多描述音频编码装置和上述的多描述音频解码装置。
由上述所提供的技术方案可以看出,所述编码方法首先将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分;再对所划分出的多个频段部分分别采用不同音质的多描述编码方法;然后再将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成多描述比特流。这样就可以针对不同的频段采用不同音质的多描述编解码方法,从而有效降低了多描述编解码的码率,提高了多描述编解码的效果,进而提升了音频传输的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中多描述编码器的编码过程示意图;
图2a为本发明实施例1所提供的多描述音频编码方法的流程示意图;
图2b为本发明实施例1中所举出的一种高低频划分的示意图;
图3为本发明实施例1所举出的对剩余信号进行二描述编码的结构示意图;
图4为本发明实施例2所提供的音频解码方法的流程示意图;
图5为本发明实施例2所举出的二描述比特流进行解码的结构示意图;
图6为本发明实施例2所举出的二描述比特流进行解码的另一结构示意图;
图7为本发明实施例3所提供的音频编码装置的结构示意图;
图8为本发明实施例4所提供的音频解码装置的结构示意图;
图9为本发明实施例5所提供音频编解码系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种多描述音频编码的方法、装置及系统。能够针对不同的频段采用不同音质的多描述编码方法,从而有效降低了多描述编码的码率,提高了多描述编码的效果,进而提升了音频传输的质量。
实施例1:
本发明实施例1提供了一种多描述音频编码的方法,如图2a所示为本发明实施例1所提供方法的流程示意图,所述方法包括:
步骤21:将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分。
在该步骤21中,首先将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分。在具体实现过程中,可以根据实际需求由操作人员自主设定,也可以预先设定频率门限值来进行划分。
预先设定频率门限值来进行划分的具体过程可以是:先根据实际需求设置多个频率门限值,例如可以由小至大的设置2个或3个频率门限值;然后再按照所设置的多个频率门限值将所述剩余信号划分成多个频段部分。
举例来说,若设置有2个频率门限值,则可以将剩余信号划分成3部分;若设置有3个频率门限值,则可以将剩余信号划分成4部分。具体设置多少频率门限值,并将剩余信号划分成多少个频段部分可以根据实际的使用需求来进行设定。
步骤22:对所划分出的多个频段部分分别采用不同音质的多描述编码方法。
在该步骤22中,在划分出多个频段部分之后,就可以针对所划分出的各个频段部分,采用不同音质的多描述编码方法。在具体实现过程中,由于人耳的听觉感知对低频比较敏感,而对高频相对弱一些,因此为了兼顾音质和码率冗余度,可以对剩余信号所划分出的频率低的频段部分采用音质好的多描述方法进行编码;并对所划分出的频率高的频段部分采用音质差的多描述方法进行编码。或者,直接按照人耳的敏感程度,确定各个频段部分的多描述方法的音质,人耳越敏感的频段部分采用音质越高的多描述方法,人耳越不敏感的频段部分采用音质越差的多描述方法。
其中,这里的低频和高频,可以是相对而言的,例如:在根据n个频率门限值,将剩余信号划分成(n+1)个频段部分之后,可以按照频率的高低,将频率较高的一个或多个频段部分作为高频,剩余的频率较低的一个或多个频段部分作为低频,具体可以参考附图2b中所示,对高频的频段部分可以采用一种音质差的多描述方法进行编码,对低频的频段部分可以采用一种音质好的多描述方法进行编码。
当然,也可以直接将每个划分出的频段作为一个频段部分,按照频率由高到低的顺序,逐渐提高多描述方法的音质,即最高频的频段部分采用音质最差的多描述方法;然后按照频率的升高逐级提高多描述方法的音质,最低频的频段部分采用音质最好的多描述方法。
另外,上述音质好的多描述方法可以是标量量化多描述方法、向量量化多描述方法或矩阵变换多描述方法等;音质差的多描述方法可以是奇偶分离多描述方法,或对量化表进行配置后的标量量化多描述方法。
这里,表征多描述方法音质好坏的因素主要为:在通常情况下,采用某一多描述方法编码后的冗余信息越多,那么在丢掉部分描述时解码出来的音质就越好。
步骤23:将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成多描述比特流。
在该步骤23中,在经过之前步骤进行编码后,可以将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成剩余信号的多描述比特流。在具体实现过程中,可以将掩蔽门限信号按照现有技术的方式进行处理生成门限信号的多描述比特流,之后,将门限信号的多描述比特流与所形成的剩余信号的多描述比特流进行组合后,形成总的多描述比特流。
此时,在解码端也可以采用现有技术的方式将总的多描述比特流划分为掩蔽门限信号的多描述比特流和剩余信号的多描述比特流,并对剩余信号的多描述比特流进行本发明实施例的进一步处理。
上述,将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成剩余信号的多描述比特流的方式,在具体实现过程中可以是:对频率低的部分采用音质好的多描述方法进行编码后,生成多个低频描述信号部分;而对频率高的部分采用音质差的多描述方法进行编码后,生成多个高频描述信号部分;然后将所生成的多个低频描述信号部分和多个高频描述信号部分分别进行组合后,形成多描述比特流。
举例来说,以二描述方法进行编码为例,如图3所示为本实施例1所举出的对剩余信号进行二描述编码的结构示意图,图3中:剩余信号首先分成两个频段部分(剩余信号低频部分和剩余信号高频部分);然后对剩余信号低频部分采用音质好的标量量化描述方法进行编码,生成两个低频描述信号部分(低频描述1信号和低频描述2信号),并对剩余信号高频部分采用音质差的奇偶分离描述方法进行编码,生成两个高频描述信号部分(高频描述1信号和高频描述2信号);然后再对所生成的四个描述信号部分进行熵编码,并将熵编码后的低频描述1信号和高频描述1信号组合成剩余信号的描述1比特流,将熵编码后的低频描述2信号和高频描述2信号组合成剩余信号的描述2比特流。
值的注意的是,上述是以二描述方法进行编码为例的说明,在具体实现过程中,还可以根据实际需求采用更多描述的方法进行编码,例如三描述或四描述方法等,其采用多描述方法进行编码后所生成的多个低频描述信号和多个高频描述信号分别进行组合形成多描述比特流的过程与上述所举例子类似。
通过以上实施例1技术方案的实施,就可以针对不同的频段采用不同音质的多描述编码方法,从而有效降低了多描述编码的码率,提高了多描述编码的效果,进而提升了音频传输的质量。
实施例2:
本发明实施例2提供了一种多描述音频解码的方法,如图4所示为本实施例音频解码方法的流程示意图,所述方法包括:
步骤41:将所接收到的多描述比特流划分成频率不同的多个描述信号部分。
在具体实现过程中,可以首先对所收到的多描述比特流进行频段划分,划分成多个低频描述信号部分和多个高频描述信号部分。解码端采用与编码端对应的划分方式进行频段划分,具体可以参考实施例1的相关内容。
步骤42:对各频率不同的多个描述信号部分分别进行多描述解码,得到频率不同的各剩余信号部分。
在具体实现过程中,可以对上述多个低频描述信号部分进行多描述解码,得到剩余信号低频部分;并对上述多个高频描述信号部分进行多描述解码,得到剩余信号高频部分。解码端采用与编码端对应的多描述解码方式进行多描述解码,具体可以参考实施例1的相关内容。
步骤43:将所得到的频率不同的各剩余信号部分进行组合,重构得到表征音频信号信息的剩余信号。
在具体实现过程中,可以将上述所得到的剩余信号低频部分和剩余信号高频部分进行组合,重构得到表征音频信号信息的剩余信号。
举例来说,还是以二描述方法进行编码和解码为例,如图5所示为本实施例2所举出的二描述比特流进行解码的结构示意图,图5中:首先对所接收的描述1比特流和描述2比特流分别进行熵解码,并各自划分出描述信号高低频部分;然后对所划分出的两个低频描述信号部分(描述1低频部分和描述2低频部分)进行标量逆量化的解码过程,生成剩余信号低频部分,并对所划分出的两个高频描述信号部分(描述1高频部分和描述2高频部分)进行奇偶合成的解码过程,生成剩余信号高频部分;然后将所生成的剩余信号低频部分和剩余信号高频部分信号组合在一起,输出重构得到表征音频信号信息的剩余信号。
上述的解码过程是以二描述方法为例进行的说明,在具体实现过程中,可以根据编码端所采用的多描述数量来相应的进行解码,例如若编码端采用三描述或四描述方法进行编码,则在解码端就相应的采用三描述或四描述方法进行解码。
另外,在本发明实施例2中,若所接收到的多描述比特流有丢失,则就只需要对所接收到的部分多描述比特流进行解码。
举例来说,还是以二描述方法进行编码和解码为例,如图6所示为本实施例2所举出的二描述比特流进行解码的另一结构示意图,图中:在解码端只接收到描述1比特流,而描述2比特流在传输过程中丢失了,这样就只需要对描述1比特流进行熵解码,并划分成高低频部分;然后对描述1低频部分进行标量逆量化解码过程,生成剩余信号低频部分,对描述1高频部分进行奇偶合成解码过程,生成剩余信号高频部分;然后将所生成的低频部分和高频部分信号组合在一起,输出重构得到表征音频信号信息的剩余信号。
通过以上实施例2技术方案的实施,同样可以针对不同的频段采用不同音质的多描述解码方法,从而有效降低了多描述解码的码率,提高了多描述解码的效果,进而提升了音频传输的质量。
实施例3:
本发明实施例3提供了一种多描述音频编码的装置,如图7所示为本实施例3所提供的音频编码装置的结构示意图,所述音频编码装置包括频段划分单元71、多描述编码单元72和比特流组合单元73,其中:
所述频段划分单元71,用于将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分。具体进行划分的方式见以上方法实施例1中所述。
所述多描述编码单元72,用于对所述频段划分单元所划分出的多个频段部分分别采用不同音质的多描述编码方法。具体进行编码的方式见以上方法实施例1中所述。
所述比特流组合单元73,用于将所述多描述编码单元采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成多描述比特流。具体进行组合的方式见以上方法实施例1中所述。
其中,多描述编码单元72对多个频段部分进行多描述编码后,每个频段部分均相应的编码得到多个描述信号部分;之后,比特流组合单元73将各个频段部分对应的多个描述信号部分分别进行组合,以形成多个多描述比特流。
另外,在上述频段划分单元71中还可以包括门限值设置模块711,该门限值设置模块711用于根据实际需求设置多个频率门限值,按照所设置的多个频率门限值对所述剩余信号进行划分。
另外,在所述多描述编码单元72中还可包括第一编码模块721和第二编码模块722,其中:所述第一编码模块721用于对所划分出的多个频段部分中频率低的部分采用音质好的多描述方法进行编码;所述第二编码模块722用于对所划分出的多个频段部分中频率高的部分采用音质差的多描述方法进行编码。
在所述多描述编码单元72中还可包括第三编码模块723和第四编码模块724,其中:所述第三编码模块723用于对所划分出的多个频段部分中人耳敏感的频段部分采用音质好的多描述方法进行编码;所述第四编码模块724用于对所划分出的多个频段部分中人耳不敏感的频段部分采用音质差的多描述方法进行编码。
另外,上述比特流组合单元73中可以包括有两个以上的比特流组合子单元731,该两个以上的比特流组合子单元731用于将采用不同的多描述编码方法进行编码后的各描述信号部分分别进行组合,形成两个以上的多描述比特流;其中,每个比特流组合子单元731将编码后的每个频段部分的一个描述信号部分进行组合,输出形成一个多描述比特流。具体可以参考方法实施例中的相关描述。
通过以上实施例3技术方案的实施,就可以针对不同的频段采用不同音质的多描述编码方法,从而有效降低了多描述编码的码率,提高了多描述编码的效果,进而提升了音频传输的质量。
实施例4:
本发明实施例4提供了一种多描述音频解码的装置,如图8所示为本实施例所提供音频解码装置的结构示意图,所述音频解码装置包括频率信号划分单元81、多描述解码单元82和信号组合单元83,其中:
所述频率信号划分单元81,用于将所接收到的多描述比特流划分成频率不同的多个描述信号部分。
所述多描述解码单元82,用于对各频率不同的多个描述信号部分分别进行多描述解码,得到频率不同的各剩余信号部分。
所述信号组合单元83,用于将所得到的频率不同的各剩余信号部分进行组合,重构得到表征音频信号信息的剩余信号。
其中,频率信号划分单元81将接收到的多个多描述比特流分别进行划分,每个多描述比特流相应的划分为不同频率的多个描述信号部分;之后,各个多描述比特流对应的相同频率的描述信号部分被组合起来输入至多描述解码单元82;多描述解码单元82对相同频率的各描述信号部分进行多描述解码得到剩余信号的一个频段部分(即具有一定频率的一个剩余信号部分),多描述解码单元82对各个频率的描述信号部分分别进行多描述解码就可以得到剩余信号的各个频段部分(即频率不同的各剩余信号部分);最后,信号组合单元83将剩余信号的各个频段部分进行组合重构得到剩余信号。
另外,上述频率信号划分单元81可以包括有两个以上的频率信号划分子单元811,该两个以上的频率信号划分子单元811用于将接收到的多个多描述比特流分别划分成频率不同的描述信号部分;其中,每个频率信号划分子单元811将一个多描述比特流划分成频率不同的多个描述信号部分。具体可以参考方法实施例中的相关描述。
同样的,通过以上实施例4技术方案的实施,就可以针对不同的频段采用不同音质的多描述解码方法,从而有效降低了多描述解码的码率,提高了多描述解码的效果,进而提升了音频传输的质量。
实施例5:
本发明实施例5提供了一种多描述音频编解码系统,如图9所示为本实施例所提供音频编解码系统的结构示意图,所述音频编解码系统包括上述实施例3所描述的多描述音频编码装置和上述实施例4所描述的多描述音频解码装置。
值的注意的是,上述装置和系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述所提到的存储介质可以是只读存储器,磁盘或光盘等。
综上所述,本发明实施例能够针对不同的频段采用不同音质的多描述编解码方法,从而有效降低了多描述编解码的码率,提高了多描述编解码的效果,进而提升了音频传输的质量。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (16)

1.一种多描述音频编码的方法,其特征在于,
将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分;
对所划分出的多个频段部分分别采用不同音质的多描述编码方法;
将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成剩余信号的多描述比特流。
2.如权利要求1所述的方法,其特征在于,所述将表征当前音频信号信息的剩余信号划分成多个频段部分,包括:
根据实际需求设置多个频率门限值;
按照所设置的多个频率门限值将所述剩余信号划分成多个频段部分。
3.如权利要求1所述的方法,其特征在于,对所划分出的多个频段部分分别采用不同音质的多描述编码方法,包括:
在所划分出的多个频段部分中,对频率低的频段部分采用音质好的多描述方法进行编码,对频率高的频段部分采用音质差的多描述方法进行编码;
或者,在所划分出的多个频段部分中,对人耳敏感的频段部分采用音质好的多描述方法进行编码,对人耳不敏感的频段部分采用音质差的多描述方法进行编码。
4.如权利要求3所述的方法,其特征在于,
所述音质好的多描述方法包括:标量量化多描述方法、向量量化多描述方法或矩阵变换多描述方法;
所述音质差的多描述方法包括:奇偶分离多描述方法。
5.如权利要求1所述的方法,其特征在于,所述将采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成剩余信号的多描述比特流,包括:
对频率低的频段部分采用音质好的多描述方法进行编码后,生成多个低频描述信号部分;对频率高的频段部分采用音质差的多描述方法进行编码后,生成多个高频描述信号部分;
将所生成的多个低频描述信号部分和多个高频描述信号部分分别进行组合后,形成剩余信号的多描述比特流。
6.一种多描述音频解码的方法,其特征在于,所述方法包括:
将所接收到的多描述比特流划分成频率不同的多个描述信号部分;
对各频率不同的多个描述信号部分分别进行多描述解码,得到频率不同的各剩余信号部分;
将所得到的频率不同的各剩余信号部分进行组合,重构得到表征音频信号信息的剩余信号。
7.如权利要求6所述的方法,其特征在于,所述方法具体包括:
将所接收到的多描述比特流划分成多个低频描述信号部分和多个高频描述信号部分;
对所述多个低频描述信号部分进行多描述解码,得到剩余信号低频部分;并对所述多个高频描述信号部分进行多描述解码,得到剩余信号高频部分;
将所得到的剩余信号低频部分和剩余信号高频部分进行组合,重构得到表征音频信号信息的剩余信号。
8.如权利要求6或7所述的方法,其特征在于,所述方法还包括:
若多描述比特流有丢失,则对所接收到的部分多描述比特流进行解码。
9.一种多描述音频编码的装置,其特征在于,包括:
频段划分单元,用于将表征当前音频信号信息的剩余信号划分成频率不同的多个频段部分;
多描述编码单元,用于对所述频段划分单元所划分出的多个频段部分分别采用不同音质的多描述编码方法;
比特流组合单元,用于将所述多描述编码单元采用不同的多描述编码方法进行编码后生成的各描述信号部分进行组合,形成剩余信号的多描述比特流。
10.如权利要求9所述的装置,其特征在于,所述频段划分单元包括:
门限值设置模块,用于根据实际需求设置多个频率门限值,按照所设置的多个频率门限值对所述剩余信号进行划分。
11.如权利要求9所述的装置,其特征在于,所述多描述编码单元包括:
第一编码模块,用于对所划分出的多个频段部分中频率低的部分采用音质好的多描述方法进行编码;
第二编码模块,用于对所划分出的多个频段部分中频率高的部分采用音质差的多描述方法进行编码。
12.如权利要求9所述的装置,其特征在于,所述多描述编码单元还包括:
第三编码模块,用于对所划分出的多个频段部分中人耳敏感的频段部分采用音质好的多描述方法进行编码;
第四编码模块,用于对所划分出的多个频段部分中人耳不敏感的频段部分采用音质差的多描述方法进行编码。
13.如权利要求9所述的装置,其特征在于,所述比特流组合单元包括:
两个以上的比特流组合子单元,用于将采用不同的多描述编码方法进行编码后的各描述信号部分分别进行组合,形成两个以上的剩余信号的多描述比特流;
其中,每个比特流组合子单元将编码后的每个频段部分的一个描述信号部分进行组合,输出形成一个剩余信号的多描述比特流。
14.一种多描述音频解码的装置,其特征在于,包括:
频率信号划分单元,用于将所接收到的多描述比特流划分成频率不同的多个描述信号部分;
多描述解码单元,用于对各频率不同的多个描述信号部分分别进行多描述解码,得到频率不同的剩余信号部分;
信号组合单元,用于将所得到的频率不同的剩余信号部分进行组合,重构得到表征音频信号信息的剩余信号。
15.如权利要求14所述的装置,其特征在于,所述频率信号划分单元包括:
两个以上的频率信号划分子单元,用于将接收到的多个多描述比特流分别划分成频率不同的描述信号部分;
其中,每个频率信号划分子单元将一个多描述比特流划分成频率不同的多个描述信号部分。
16.一种多描述音频编解码系统,其特征在于,所述系统包括权利要求9至13任一项所述的多描述音频编码装置和权利要求14或15所述的多描述音频解码装置。
CN2009100899577A 2009-07-30 2009-07-30 多描述音频编解码的方法、装置及系统 Expired - Fee Related CN101989425B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2009100899577A CN101989425B (zh) 2009-07-30 2009-07-30 多描述音频编解码的方法、装置及系统
PCT/CN2010/074052 WO2011012029A1 (zh) 2009-07-30 2010-06-18 多描述音频编解码的方法、装置及系统
EP10803862A EP2450882A4 (en) 2009-07-30 2010-06-18 METHOD, DEVICE AND SYSTEM FOR AUDIO ENCODING AND DECODING BY MULTIPLE DESCRIPTIONS
US13/361,580 US8510121B2 (en) 2009-07-30 2012-01-30 Multiple description audio coding and decoding method, apparatus, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100899577A CN101989425B (zh) 2009-07-30 2009-07-30 多描述音频编解码的方法、装置及系统

Publications (2)

Publication Number Publication Date
CN101989425A CN101989425A (zh) 2011-03-23
CN101989425B true CN101989425B (zh) 2012-05-23

Family

ID=43528750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100899577A Expired - Fee Related CN101989425B (zh) 2009-07-30 2009-07-30 多描述音频编解码的方法、装置及系统

Country Status (4)

Country Link
US (1) US8510121B2 (zh)
EP (1) EP2450882A4 (zh)
CN (1) CN101989425B (zh)
WO (1) WO2011012029A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN108109629A (zh) * 2016-11-18 2018-06-01 南京大学 一种基于线性预测残差分类量化的多描述语音编解码方法和系统
CN117831546A (zh) * 2022-09-29 2024-04-05 抖音视界有限公司 编码、解码方法、编码器、解码器、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1041756A2 (en) * 1999-03-29 2000-10-04 Lucent Technologies Inc. Multistream-in-band-on-channel transmission system
EP1158494A1 (en) * 2000-05-26 2001-11-28 Lucent Technologies Inc. Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies
WO2005051001A2 (fr) * 2003-11-17 2005-06-02 Get - Enst Procede de codage video par descriptions multiples
CN101115051A (zh) * 2006-07-25 2008-01-30 华为技术有限公司 音频信号处理方法、系统以及音频信号收发装置
CN101340261A (zh) * 2007-07-05 2009-01-07 华为技术有限公司 多描述编码和多描述解码的方法、装置及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6253185B1 (en) * 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
EP1578133B1 (en) * 2004-03-18 2007-08-15 STMicroelectronics S.r.l. Methods and systems for encoding/decoding signals, and computer program product therefor
US7536299B2 (en) * 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1041756A2 (en) * 1999-03-29 2000-10-04 Lucent Technologies Inc. Multistream-in-band-on-channel transmission system
EP1158494A1 (en) * 2000-05-26 2001-11-28 Lucent Technologies Inc. Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies
WO2005051001A2 (fr) * 2003-11-17 2005-06-02 Get - Enst Procede de codage video par descriptions multiples
CN101115051A (zh) * 2006-07-25 2008-01-30 华为技术有限公司 音频信号处理方法、系统以及音频信号收发装置
CN101340261A (zh) * 2007-07-05 2009-01-07 华为技术有限公司 多描述编码和多描述解码的方法、装置及系统

Also Published As

Publication number Publication date
CN101989425A (zh) 2011-03-23
EP2450882A4 (en) 2012-06-13
EP2450882A1 (en) 2012-05-09
WO2011012029A1 (zh) 2011-02-03
US8510121B2 (en) 2013-08-13
US20120130722A1 (en) 2012-05-24

Similar Documents

Publication Publication Date Title
US7110941B2 (en) System and method for embedded audio coding with implicit auditory masking
US9269372B2 (en) Adaptive transition frequency between noise fill and bandwidth extension
CN101636951B (zh) 产生要传输的信号或要解码的信号的设备和方法
CN1647156B (zh) 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
KR100369687B1 (ko) 오디오 정보 처리에 이용하기 위한 장치, 오디오 정보 디코딩에 이용하기 위한 장치, 오디오 정보 비트 스트림 처리 방법
KR101959698B1 (ko) 허프만 부호화를 실행하기 위한 장치 및 방법
CN103050124B (zh) 混音方法、装置及系统
WO2008000901A1 (en) Scalable audio coding
KR20090001370A (ko) 코덱의 구성 설정 방법 및 이를 적용한 코덱
US20080136686A1 (en) Method for the scalable coding of stereo-signals
CN101989425B (zh) 多描述音频编解码的方法、装置及系统
CN101292428A (zh) 用于编码/解码的方法和装置
IL290796B2 (en) Layered coding and data structure for compressed high-order sound or surround sound field representations
WO2021213128A1 (zh) 音频信号编码方法和装置
CN102369573A (zh) 嵌入和提取辅助数据
CN102142924B (zh) 一种多用途语音频编码传输方法和装置
Chou et al. High capacity audio data hiding for noisy channels
CN103165135B (zh) 一种数字音频粗分层编码方法和装置
KR101904422B1 (ko) 코덱의 구성 설정 방법 및 이를 적용한 코덱
CN105261373A (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
CN101833953B (zh) 降低多描述编解码冗余度的方法和装置
CN202454261U (zh) 一种音频混合设备
Korhonen et al. Toward bandwidth-efficient and error-robust audio streaming over lossy packet networks
KR101814607B1 (ko) 코덱의 구성 설정 방법 및 이를 적용한 코덱
Kunz SBR explained: White paper

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180211

Address after: California, USA

Patentee after: Global innovation polymerization LLC

Address before: California, USA

Patentee before: Tanous Co.

Effective date of registration: 20180211

Address after: California, USA

Patentee after: Tanous Co.

Address before: 518129 Longgang District, Guangdong, Bantian HUAWEI base B District, building 2, building No.

Patentee before: HUAWEI DEVICE Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523