CN1787078A - 一种基于量化信号域的立体声及多声道编解码方法与系统 - Google Patents

一种基于量化信号域的立体声及多声道编解码方法与系统 Download PDF

Info

Publication number
CN1787078A
CN1787078A CNA2005101141987A CN200510114198A CN1787078A CN 1787078 A CN1787078 A CN 1787078A CN A2005101141987 A CNA2005101141987 A CN A2005101141987A CN 200510114198 A CN200510114198 A CN 200510114198A CN 1787078 A CN1787078 A CN 1787078A
Authority
CN
China
Prior art keywords
module
signal
sound channel
coupling
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101141987A
Other languages
English (en)
Other versions
CN100561576C (zh
Inventor
李迅
陈水仙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor technology (Shanghai) Co., Ltd.
Original Assignee
Xincheng (beijing) Sci & Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xincheng (beijing) Sci & Tech Co Ltd filed Critical Xincheng (beijing) Sci & Tech Co Ltd
Priority to CNB2005101141987A priority Critical patent/CN100561576C/zh
Publication of CN1787078A publication Critical patent/CN1787078A/zh
Application granted granted Critical
Publication of CN100561576C publication Critical patent/CN100561576C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明是一种基于量化信号域的立体声及多声道编解码方法与系统。量化模块输入端连接频域处理模块,输出端与声道耦合模块和无损编码模块连接,声道耦合模块一端连接量化模块,另一端连接无损编码模块,用于对声道对进行变换耦合。将音频信号送入进行预处理并将按照频带对时域信号进行划分;将经过频带划分的频域信号进行频域处理;量化经频域处理的信号;去除声道对信号间的相关性冗余;对去除了相关性冗余的信号进行无损编码并将编码结果输出。本发明将声道耦合模块移动到量化模块后面来实现,不需重新计算声学模型参数,解决了量化噪声在声道间交织、声道泄漏和耦合后声学模型设计困难等问题,利于优化分析,设计复杂度低,灵活性高。

Description

一种基于量化信号域的立体声及多声道编解码方法与系统
技术领域
本发明属于立体声/多声道编码技术领域,具体地说是一种基于量化信号域的立体声及多声道编解码方法与系统。
技术背景
与单声道编码不同,立体声及多声道编码除了可以利用声道信号本身的冗余和声学掩蔽特性来达到压缩目的外,往往还可以利用声道间的相关性冗余和互掩蔽效应来进一步压缩,因此立体声及多声道编码往往能够以比独立声道编码更低的编码速率达到相同的编码质量。这种技术一般称为声道耦合技术,在立体声环境也被称为立体声编码技术。
目前常用的声道耦合技术可以分为两大类。一类是在输入信号的变换域上实现声道耦合,去除声道间冗余;另一类是在墒编码过程中,通过联合墒编码的方式来实现去除声道间冗余。这两类又可以分别分为有损耦合和无损耦合。
第一类声道耦合技术如图1所示。这类声道耦合技术是目前应用最广泛的立体声及多声道编码技术。其中以和/差(M/S)联合立体声编码技术为代表,约翰斯顿(Johnston,J.D.)和费里拉(Ferreira,A.J.)1992年在音频、语音和信号处理国际会议(ICASSP)上发表的《和/差立体声变换编码》一文中研究了这种联合立体声编码技术;属于开源计划的音频编码器Ogg Vorbis中采用的方极坐标映射也属于其中的一种之一。这种声道耦合技术是在原始信号的变换域上实现声道耦合,其优点是参与耦合的值没有经过缩放,耦合精度较高。但是,由于耦合是在量化前做的,这就改变了量化模块的输入信号,因此需要对将用于量化模块的声学掩蔽参数进行重新计算和调整。这就带来了几个问题:1、对于耦合后的声道需要重新设计声学模型,而目前对自然声音的声学模型内在机理尚且未被完全认识,对这类人为耦合的声音更只能通过试验的方法进行逼近。对于一些如方极坐标映射之类的非线性变换,耦合后声学模型的设计就更加麻烦。2、在解码端,声道解耦合将导致量化误差在声道间交叉分布,导致声道泄漏和合成质量下降。3、由于耦合的声道值没有经过缩放,因此声道间的强度差异往往直接影响耦合去相关性的效果。
另一类声道耦合技术是通过联合墒编码的方式去除相关性冗余,如采用多维联合码本技术。此类声道耦合技术将声道耦合和墒编码联系在一起,虽然和本专利中的方案一样,回避了上述所述的问题,但一方面声道耦合方式受制于墒编码形式,约束了去声道间冗余的技术选择,另一方面也增加了墒编码的设计复杂度,码本的存储空间以及实现的硬件代价。此外这类声道耦合技术和传统的声道耦合方案之间也存在着兼容性的问题。
发明内容
为了克服现有技术中的不足,本发明的目的在于提供一种基于量化信号域的立体声及多声道编解码方法与系统,以解决量化噪声在声道间交织和声道泄漏问题。
本发明的再一个目的在于提供一种基于量化信号域的立体声及多声道编解码方法与系统,以避免耦合后声学模型的重新设计。
本发明的第三个目的在于提供一种基于量化信号域的立体声及多声道编解码方法与系统,进一步提高多声道及立体声编码的压缩效率。
为完成上述发明目的,本发明提供一种基于量化信号域的立体声及多声道编码方法,该方法包括以下步骤:
1)将经采样的音频信号送入时域预处理模块进行高通滤波、采样率转换、比特深度转换和声道转换等预处理,将经过预处理的音频信号按照频带对时域信号进行划分;
2)将经过频带划分的频域信号进行频域处理;
3)利用声学模型模块输出的声学掩蔽参数对经频域处理的信号进行量化;
4)对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
5)对去除了相关性冗余的信号进行无损编码,并将编码结果输出。
为完成上述发明目的,本发明还提供一种基于量化信号域的立体声及多声解码方法,该方法包括以下步骤:
1).将接收到的编码信号在无损编码模块中进行传输格式的解封装,并对解封装后的信号进行无损解码;
2).将上述无损解码后的信号在声道解耦合模块中进行声道解耦合;
3).对解耦合后的信号在解量化模块中利用编码端传输的量化步长进行反量化;
4).块根据编码端的处理在频域反处理模中进行与编码端相应的逆向操作,并将得到的信号送入滤波器组/时频反变换模块;
5).对从频域反处理模块输出的信号在滤波器组/时频变换模块中进行反变换;
6).将从滤波器组/时频变换模块输出的时域信号在时域后处理模块中进行后处理,并将处理后的信号送入到音频发生器。
为完成上述发明目的,本发明还提供一种基于量化信号域的立体声及多声道编码系统,包括音频信号采样器、声学模型模块、时域预处理模块、滤波器组/时频变换模块、频域处理模块、量化模块,声道耦合模块和无损编码模块,其特征在于,
所述音频信号采样器,用于将经采样的音频信号送入所述时域预处理模块;
所述时域预处理模块,对输入的采样信号进行高通滤波、采样率转换、比特深度转换和声道转换等预处理;
所述滤波器组/时频变换模块,将经过预处理的音频信号按照频带对时域信号进行划分;
所述频域处理模块,将经过频带划分的频域信号进行频域处理;
所述量化模块,其输入端连接频域处理模块,输出端与声道耦合模块连接,用于利用声学模型模块输出的声学掩蔽参数对经频域处理的音频信号进行量化;
所述声道耦合模块,一端连接量化模块,另一端连接无损编码模块,对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
所述无损编码模块,对去除了相关性冗余的信号进行无损编码,并将编码结果输出。
为完成上述发明目的,本发明还提供一种基于量化信号域的立体声及多声道解码系统,包括无损解码模块、声道解耦合模块、解量化模块、频域反处理模块、滤波器组/时频变换模块、时域后处理模块,其特征在于:
所述无损解码模块,用于将接收到的编码信号进行传输格式的解封装,并对解封装后的信号进行无损解码;
所述声道解耦合模块,其一端连接无损解码模块,另一端连接解量化模块,用于将上述无损解码后的信号在声道解耦合模块中进行声道解耦合;
所述解量化模块,其输入端分别与声道解耦合模块和无损解码模块连接,输出端连接频域处理模块,用于对解耦合后的信号在解量化模块中利用编码端传输的量化步长进行反量化;
所述频域反处理模块,根据编码端的处理进行与编码端相应的逆向操作,并将得到的信号送入滤波器组/时频反变换模块;
所述滤波器组/时频变换模块,对从频域反处理模块输出的信号进行反变换;
所述时域后处理模块,将从滤波器组/时频变换模块输出的时域信号在时域后处理模块中进行后处理,并将处理后的信号送入到音频发生器;
所述音频发生器,将从时域后处理模块输出的处理后的信号由作为音频信号输出。
本发明具有明显的优点和积极效果。与传统的声道耦合技术相比,本发明将声道耦合模块移动到量化模块后面来实现,即在量化信号域上进行声道耦合。1、由于这种耦合方式没有改变量化模块的输入,因此不需要对量化模块中所用到的声学模型参数进行重新计算。目前人们对于声学掩蔽模型的内在机理认识还不是非常充分,对于耦合后的这种人为信号的掩蔽模型认识就更不清楚。不用对耦合信号更新声学掩蔽参数可以有效地回避由不准确的参数估计所带来的编码增益降低。2、在解码端,由于声道解耦合也是在量化信号域上进行的,不引入量化噪声,因此有效地解决了量化噪声在声道间交织和声道泄漏等问题。3、由于在量化过程中一般都会通过提取比例因子之类的信息对信号进行归一化处理,因此在量化信号域上进行声道耦合处理可以有效回避由于左右声道强度差异而导致的耦合效果降低问题。4、本发明将去声道相关性冗余和立体声及多声道声学模型设计分离开来,有利于分别对其进行优化分析,降低了设计复杂度,提供了更强的灵活性。在对立体声及多声道声学模型机理和设计充分认识的前提下,引入声道间互掩蔽效还可以进一步提高压缩效率。与联合墒编码技术相比,本发明实现去声道间冗余的技术手段仍然是现有技术中的变换耦合,去声道相关性冗余的效果取决于变换的正交性,而不是联合墒编码的方式。差分编码是其中的一个特例,它既可以被认为是墒编码的一种,同时也是正交变换的一种,但是本发明的基本原理与联合墒编码技术是不同的,两者有交集,但都不能被对方所包括。其次,从结构上来说,本发明的声道耦合模块与无损墒编码是两个独立的模块,本发明中的声道耦合模块可以是有损的,也可以是无损的,这大大提高了灵活性。再次,由于本发明仍然通过变换耦合的方式去除声道间的相关性冗余,因此本发明完全兼容现有的立体声及多声道耦合技术,传统声道耦合技术中采用的声道耦合映射算法可以直接应用于本发明中。
本发明具体实施方式中提供了一种基于量化信号域(PQCC)的改进方极坐标耦合方法,该方法能有效去除声道间的相关性冗余,且其实现也较简单。而原来的方极坐标(SPSC)的性能与立体声声学模型的设计存在较大关系,当立体声声学模型设计合理时,PQCC和SPSC的编码性能相当,PQCC同样也可以利用立体声声学模型中的左右声道互掩蔽效应,但PQCC将去除声道相关性冗余和立体声声学模型分开,具有更好的灵活性。采用该方法可以有效地解决现有技术中存在的耦合声道声学模型设计困难、声道间存在泄漏和量化噪声交织的问题以及声道间强度差异对声道耦合效果的影响问题,此外,本发明的方法将去声道间相关性冗余和立体声及多声道声学模型分离开来,降低了设计复杂度,灵活性强。
附图说明
图1为传统声道耦合技术的实现结构示意图;
图2为本发明系统原理构成图;
图3为根据本发明的基于量化信号域的立体声及多声道编码方法的流程图;
图4为根据本发明的基于量化信号域的立体声及多声道解码方法的流程图;
图5为根据本发明最佳实施例的基于量化信号域的方极坐标编码方法流程图;
图6为启用声道耦合的判决框图;
图7为PQCC、SPSC和独立双声道编码的ODG得分示意图。
图8为图7所示的来源于MPEG组织的标准测试序列的12个测试序列。
具体实施方式
下面结合说明书附图来说明本发明的具体实施方式。
图2是本发明的系统构成图,参见图2,本发明的系统构成包括编码系统和解码系统两部分。根据本发明的基于量化信号域的立体声及多声道编码系统包括以下装置:
音频信号采样器,其输出端与预处理模块和声学模型模块相连,用于采集声音信号,并送入时域预处理模块和声学模型模块。
时域预处理模块,其输入端连接音频信号采样器,输出端与滤波器组/时频变换模块相连,用于将音频信号进行预处理,如高通滤波、采样率转换、比特深度转换和声道转换等。高通滤波是将低频滤去的一种滤波技术。采样率转换的作用是将一种采样率转换为另一种采样率。比特深度转换是将不同的输入比特深度转换为编码器要求的比特深度。声道转换是将输入的声道数转换为编码器所要求的声道数。
滤波器组/时频变换模块,其输入端连接时域预处理模块,输出端与频域处理模块连接,用于按照频带对时域信号进行划分。主要方法是将经过预处理的音频信号变换到频域上或者进行带通滤波。滤波器组和时频变换是并列的两种技术,可以单独使用也可以联合使用,这两种技术的目的都是将时域信号按照频带划分,滤波器组是利用一系列互相相邻的带通滤波器来实现其功能的,时频变换是利用正交变换来实现的。
频域处理模块,其输入端连接滤波器组/时频变换模块,输出端与量化模块相连,用于将经过带通滤波或者时频变换的频域信号进行频域处理,如噪声整形和频域预测等。噪声整形的目的是使噪声主要集中到掩蔽能力强的信号位置,在信号掩蔽能力弱的位置减少噪声的生成,频域预测是通过线性预测去掉信号间的相关性。
量化模块,其输入端连接频域处理模块,输出端分别与声道耦合模块和无损编码模块连接,用于利用声学模型模块输出的声学掩蔽参数对经频域处理的信号进行量化,并送入声道耦合模块和无损编码模块。不考虑速率控制的量化模块是一个量化器,用预定的步长对其进行量化。
声道耦合模块,其输入端连接量化模块,输出端连接无损编码模块,用于去除声道对信号之间的相关性冗余。其主要方法是通过变换耦合去除相关性冗余,优选的耦合方式为正交变换耦合。通过变换耦合可以将原来在多个声道中重复存在的冗余信息映射到同一个域上,从而减少了信号间的相关性,变换的正交性决定了这种去除相关性冗余的效果。
无损编码模块,其输入端连接声道耦合模块,用于对去除了声道间相关性冗余的信号进行无损编码,并将编码结果按传输所需要的格式进行封装输出。最简单的无损编码模块的功能就是查表操作。
参见图2,根据本发明的一种基于量化信号域的立体声及多声道解码系统,包括以下装置:无损解码模块、声道解耦合模块、解量化模块、频域反处理模块、滤波器组/时频反变换模块、时域后处理模块和音频信号发生器。
无损解码模块执行编码端无损编码模块的逆处理,其输出端与声道解耦合模块连接,用于将传输格式解封装,并对解封装后信号进行无损解码。
声道解耦合模块执行编码端声道耦合模块的逆处理,其输入端连接无损解码模块,输出端连接解量化模块,用于对无损解码后的信号进行解耦合。
解量化模块执行编码端量化模块的逆处理,其输入端与声道解耦合模块连接,输出端连接频域反处理模块,用于将解耦合后的信号进行反量化。
频域反处理模块执行编码端频域处理模块的逆处理,其输入端连接解量化模块,输出端连接滤波器组/时频反变换模块,用于将解量化的信号按照编码端的处理进行与其相应的逆向操作,并将得到的信号送往滤波器组/时频反变换模块。
滤波器组/时频反变换模块执行编码端滤波器组/时频变换模块的逆处理,其输入端与频域反处理模块连接,输出端与时域后处理模块连接。用于对频域反处理模块输出的经过频域反处理的信号进行逆滤波或者时频反变换,并将输出的时域信号送往时域后处理模块。
时域后处理模块,其输入端与滤波器组/时频反变换模块连接,输出端直接与音频信号发生器连接,用于按照输出设备和应用环境的需要对时域信号进行各种转换或者增强处理,最后将符合要求的音频信号送往音频信号发生器。
音频信号发生器代表了音频信号的播放或者存储操作,其输入端与时域后处理模块连接。
图3为根据本发明的基于量化信号域的立体声及多声道编码方法的流程图。下文将参考图3,对本发明的立体声及多声道编码方法进行详细描述。
首先,在步骤301,对输入的音频信号进行采样,并将采样所得的音频信号送入时域预处理模块和声学模型模块。
在步骤302,时域预处理模块对采样后的音频信号进行预处理,预处理包括高通滤波、采样率转换、比特深度转换和声道转换等。并将经过预处理的信号送入声学模型模块。
然后,在步骤303,滤波器组/时频变换模块将在步骤302中经过预处理的音频信号变换到频域上或进行带通滤波,按照频带对时域信号进行划分。
在步骤304,频域处理模块将经过频带划分的频域信号进行频域处理。之后,流程进入到步骤305。
在步骤305,量化模块利用声学模型模块输出的声学掩蔽参数对经频域处理的信号进行量化,并送入声道耦合模块和无损编码模块。掩蔽参数为声学模型根据输入信号计算所得的人耳在当前信号下对噪声的敏感程度,量化模块根据该参数并结合输出速率的要求确定当前的量化精度。量化过程中包括通过提取比例因子信息对信号进行归一化处理的步骤。归一化过程可描述为:假设比例因子为SF,归一化前信号为x,则归一化后信号为x/f(SF),其中f(SF)为变量SF的函数。
在步骤306,声道耦合模块去除声道对信号间的相关性冗余,其常用正交变换耦合技术。最后,在步骤307,无损编码模块对声道耦合后的信号进行无损编码,并将编码结果按所需的传输格式进行封装输出。
图4为根据本发明的基于量化信号域的立体声及多声道解码方法的流程图。下面将参考图4,对本发明的立体声及多声道解编码方法进行详细描述。
首先,在步骤401,无损解码模块对传输格式进行解封装,并对解封装后的信号进行无损解码,分别提取出量化频谱、耦合标志信息、量化步长信息以及其他辅助信息。
然后,在步骤402,声道解耦合模块根据耦合标志信息,对从无损解码模块输出的无损解码后的信号进行声道解耦合,当耦合标志信息指示启用声道耦合时,对其进行解耦合处理,否则直接将信号传递到解量化模块。
在步骤403,解量化模块根据量化步长信息,对解耦合后的信号进行反量化,解量化后,流程进入到步骤404。
接下来,在步骤404,频域反处理模块根据辅助信息,按照编码端的处理进行与编码端相应的逆向操作,并将得到的信号送入滤波器组/时频反变换模块;
在步骤405,滤波器组/时频变换模块对从频域反处理模块输出的信号进行反变换。
在步骤406,时域后处理模块将从滤波器组/时频变换模块输出的时域信号进行后处理,并将处理后的信号送入到音频发生器。
最后,在步骤407,音频发生器将从时域后处理模块输出的处理后的信号作为音频信号输出。
图5为根据本发明实施例的基于量化信号域的方极坐标编码系统框图。参见图5,其中示出了根据本发明最佳实施例的采用改进的方极坐标立体声编码技术而实现的基于量化信号域的立体声及多声道编码系统。
方极坐标映射如下所示,式(1)为编码端的耦合公式,式(2)为解码端的解耦合公式。
m a = l abs ( l - r ) , abs ( l ) > abs ( r ) r - abs ( l - r ) , else - - - ( 1 )
l r = m m - sign ( m ) * a , a > 0 m + sign ( m ) * a m , else - - - ( 2 )
由上述两式可以看出,这种变换映射与和/差(M/S)映射不同,是一种非革命线性的映射关系,并且存在着声道间的混叠,因此,传统声道耦合框架中存在的问题对其影响将更加严重,从而降低去相关性冗余所带来的编码增益。采用本发明的基于量化信号域的立体声及多声道编码方法可以有效避免这些问题,并且便于实现和优化。
下面参照图5描述本实施例的改进的方极坐标立体声编解码系统:
如图5所示,改进的方极坐标立体声编解码系统主要包括:时域预处理模块,时域后处理模块,滤波器组/时频变换模块,滤波器组/时频反变换模块,声学模型模块,频域处理模块,频域反处理模块,量化模块,反量化模块,声道耦合模块,无损编码模块,无损解码模块等。
时域预处理模块,该模块将输入音频信号进行高通滤波,采样率转换、比特深度转换,声道转换等预处理操作。位于本系统解码端的时域后处理模块,它是上述时域预处理模块在解码端的对应模块,但并不一定完全为其逆操作。时域后处理模块除了执行时域预处理模块中必要的逆操作以外,还根据输出音频设备的要求,对其输入信号进行相应的格式转换以及增强处理。
经过预处理的音频信号由滤波器组/时频变换模块变换到频域上或进行带通滤波,划分信号的频带。位于该系统解码端的滤波器组/时频反变换模块执行上述滤波器组/时频变换模块的逆操作。
声学模型模块利用输入音频信号根据音频的声学机理和试验模型提取声学掩蔽参数,该掩蔽参数将作为指导信息,用于量化模块的量化过程。
经过带通滤波或者时频变换的频域信号利用频域处理模块进行噪声整形、频域预测等频域处理。位于该系统解码端的频域反处理模块为其逆模块。
量化模块利用声学模型模块输出的声学掩蔽参数对频域处理模块的输出信号进行量化。解码端的反量化模块为其逆模块。
声道耦合模块包括两部分,分别执行声道耦合判决操作和声道之间的变换耦合。当判决模块经判决后启用变换耦合时(下文将详细描述该操作过程),声道耦合模块进行变换耦合,并输出耦合后信号,否则直接输出输入信号。解码端的声道解耦合模块为其逆模块,负责声道之间的解耦合。在改进的方极坐标立体声编解码方案中,此处采用方极坐标映射方式,但这只是一个示例,其他变换同样适用于声道耦合模块。当编码为多声道编码时,所需变动只是变换维数的增加而已。
无损编码模块负责将信号进行无损编码压缩,并将编码结果封装成传输所需要的格式。解码端的无损解码模块为其逆模块。
是否启用声道耦合的判决过程可以根据图6所示的声道耦合模块中声道耦合判决的流程图来决定。将未耦合的信号送入声道耦合模块进行耦合,并将该信号送到无损编码模块进行无损编码;无损编码模块对声道耦合模块输出的耦合后信号进行无损编码;比较耦合信号的编码比特数与未耦合信号的编码比特数;判断耦合后编码比特数是否减少,减少则采用声道耦合编码方式,否则不采用声道耦合编码。
在本发明的无损编码模块中,当采用声道耦合编码模式时,为了进一步提高编码效率,对量化模块中提取的归一化因子采取声道间差分编码的方案。
假设声道0的第m个归一化因子为N(0,m),声道1的第m个归一化因子为N(1,m),则差分编码后的归一化因子为
N ′ ( 0 , m ) = N ( 0 , m ) - N ( 0 , m - 1 ) N ′ ( 1 , m ) = N ( 1 , m ) - N ( 0 , m )
即主声道的归一化因子按照常规的差分编码进行,耦合声道的归一化因子在声道间进行差分编码。
图7给出了改进的基于量化信号域的立体声及多声道编码方法(PQCC,Post-quantization coupling coding)、方极坐标立体声编码(SPSC,Square-polar stereo coding)和独立双声道编码(dual-channelcoding)的客观损伤等级(ODG,objective degradation grade)示意图。参见图7,比较的双方都是基于相同的声学模型即国际标准化组织ISO声学模型II,所不同的只在于声道耦合模块的处理过程。本发明采用评估方式得出的客观损伤等级(ODG)对编码结果进行比较。PQCC方法、SPSC方法的平均ODG得分分别为-1.16,-1.53。本发明的方案要明显优于原来的SPSC方法,其关键之处在于原来方极坐标映射的声学模型设计困难,部分序列采用SPSC耦合后编码质量反而不如采用独立双声道的编码结果,参见图8中的sc01,sc03,sm01,sm02,sm03序列(序列所对应的音频内容见图8的附表)。
试验结果证明,声道间的相关性在量化信号域上仍能得到有效的保持,本发明的基于量化信号域的声道耦合方法是可行的。在理论上,当SPSC的耦合信号声学模型设计合理时,SPSC的编码质量与本发明中的编码方案的编码质量是相当的,而且本发明中的PQCC方案同样可以利用立体声声学模型中的左右声道互掩蔽效应,只需在设计声学模型时将其考虑在内即可。但是由于本发明中将去除声道间相关性冗余和立体声及多声道声学模型分离开来,降低了设计复杂度,其实现要更简单灵活,且易于实施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (24)

1、一种基于量化信号域的立体声及多声道编码方法,该方法包括以下步骤:
1)将经采样的音频信号送入时域预处理模块进行高通滤波、采样率转换、比特深度转换和声道转换等预处理;
2)将经过预处理的音频信号按照频带对时域信号进行划分;
3)将经过频带划分的频域信号进行频域处理;
4)利用声学模型模块输出的声学掩蔽参数对经频域处理的信号进行量化;
5)对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
6)对去除了相关性冗余的信号进行无损编码,并将编码结果输出。
2、根据权利要求1所述的基于量化信号域的立体声及多声道编码方法,其中,所述步骤5中的去除声道对信号间的相关性冗余采用变换耦合方法。
3、根据权利要求2所述的基于量化信号域的立体声及多声道编码方法,其特征在于,所述步骤5中的声道耦合是采用方极坐标映射来耦合。
4、根据权利要求2所述的基于量化信号域的立体声及多声道编码方法,其中所述步骤5中的变换为整数变换。
5、根据权利要求1所述的基于量化信号域的立体声及多声道编码方法,其中,所述步骤4的量化步骤还包括通过提取比例因子信息对信号进行归一化处理的步骤,所述比例因子在步骤5中采用声道间差分编码方式进行编码。
6、根据权利要求1所述的基于量化信号域的立体声及多声道编码方法,其特征在于,所述步骤6进一步包括以下步骤:
6.1)、将未经声道耦合的信号送入声道耦合模块进行耦合,并将该信号送到无损编码模块进行无损编码;
6.2)、无损编码模块对声道耦合模块输出的经过变换耦合的信号进行无损编码;
6.3)、比较耦合后信号的无损编码比特数与未进行声道耦合信号的无损编码比特数;
6.4)、判断耦合后编码比特数相对于未耦合的编码比特数是否减少,减少则采用声道耦合编码方式,否则不采用声道耦合编码。
7、一种基于量化信号域的立体声及多声解码方法,该方法包括以下步骤:
1).将接收到的编码信号在无损编码模块中进行传输格式的解封装,并对解封装后的信号进行无损解码;
2).将上述无损解码后的信号在声道解耦合模块中进行声道解耦合;
3).对解耦合后的信号在解量化模块中利用编码端传输的量化步长进行解量化;
4).根据编码端的处理在频域反处理模中进行与编码端相应的逆向操作,并将得到的信号送入滤波器组/时频反变换模块;
5).对从频域反处理模块输出的信号在滤波器组/时频变换模块中进行反变换;
6).将从滤波器组/时频变换模块输出的时域信号在时域后处理模块中进行后处理,并将处理后的信号送入到音频发生器。
8、根据权利要求7所述的基于量化信号域的立体声及多声道解码方法,其中,所述步骤2中的解耦合是采用变换耦合来进行。
9、根据权利要求8所述的基于量化信号域的立体声及多声道解码方法,其特征在于,所述步骤2中的声道解耦合是采用方极坐标映射来进行。
10、根据权利要求8所述的基于量化信号域的立体声及多声道解码方法,其中所述步骤2中所采用的变换为整数变换。
11、根据权利要求7所述的基于量化信号域的立体声及多声道解码方法,其中,所述步骤3的解量化步骤还包括通过提取比例因子信息对信号进行反归一化处理的步骤,所述比例因子在步骤2中采用声道间差分编码方式进行编码。
12、根据权利要求7所述的基于量化信号域的立体声及多声道解码方法,其特征在于,所述步骤2进一步包括以下步骤:
2.1)、声道解耦合模块根据耦合标志信息,对从无损解码模块输出的无损解码后的信号进行声道解耦合,当耦合标志信息指示启用声道耦合时,对其进行解耦合处理,否则直接将信号传递到解量化模块。
13、一种基于量化信号域的立体声及多声道编码系统,包括音频信号采样器、声学模型模块、时域预处理模块、滤波器组/时频变换模块、频域处理模块、量化模块,声道耦合模块和无损编码模块,其特征在于,
所述音频信号采样器,用于将经采样的音频信号送入所述时域预处理模块;
所述时域预处理模块,对输入的采样信号进行高通滤波、采样率转换、比特深度转换和声道转换等预处理;
所述滤波器组/时频变换模块,将经过预处理的音频信号按照频带对时域信号进行划分;
所述频域处理模块,将经过频带划分的频域信号进行频域处理;
所述量化模块,其输入端连接频域处理模块,输出端与声道耦合模块连接,用于利用声学模型模块输出的声学掩蔽参数对经频域处理的音频信号进行量化;
所述声道耦合模块,一端连接量化模块,另一端连接无损编码模块,对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
所述无损编码模块,对去除了相关性冗余的信号进行无损编码,并将编码结果输出。
14、根据权利要求13所述的基于量化信号域的立体声及多声道编码系统,其中,所述声道耦合模块采用变换耦合来去除声道对信号间的相关性冗余。
15、根据权利要求14所述的基于量化信号域的立体声及多声道编码方法,其特征在于,所述声道耦合模块采用方极坐标映射来进行声道耦合。
16、根据权利要求14所述的基于量化信号域的立体声及多声道编码系统,其中所述声道耦合模块采用的变换为整数变换。
17、根据权利要求13所述的基于量化信号域的立体声及多声道编码系统,其中,
所述量化模块,还包括通过提取比例因子信息对信号进行归一化处理,所述比例因子在所述无损编码模块中采用声道间差分编码方式进行编码。
18、根据权利要求13所述的基于量化信号域的立体声及多声道编码系统,其特征在于,
所述声道耦合模块,将未经声道耦合的信号在声道耦合模块中进行耦合,还将该未经声道耦合的信号送到无损编码模块进行无损编码;
所述无损编码模块,对声道耦合模块输出的经过变换耦合的信号进行无损编码;比较耦合后信号的无损编码比特数与未进行声道耦合信号的无损编码比特数;判断耦合后编码比特数相对于未耦合的编码比特数是否减少,减少则采用声道耦合编码方式,否则不采用声道耦合编码。
19、一种基于量化信号域的立体声及多声道解码系统,包括无损解码模块、声道解耦合模块、解量化模块、频域反处理模块、滤波器组/时频变换模块、时域后处理模块,其特征在于,
所述无损解码模块,用于将接收到的编码信号进行传输格式的解封装,并对解封装后的信号进行无损解码;
所述声道解耦合模块,其一端连接无损解码模块,另一端连接解量化模块,用于将上述无损解码后的信号在声道解耦合模块中进行声道解耦合;
所述解量化模块,其输入端分别与声道解耦合模块和无损解码模块连接,输出端连接频域处理模块,用于对解耦合后的信号在解量化模块中利用编码端传输的量化步长进行反量化;
所述频域反处理模块,根据编码端的处理进行与编码端相应的逆向操作,并将得到的信号送入滤波器组/时频反变换模块;
所述滤波器组/时频变换模块,对从频域反处理模块输出的信号进行反变换;
所述时域后处理模块,将从滤波器组/时频变换模块输出的时域信号在时域后处理模块中进行后处理,并将处理后的信号送入到音频发生器;
所述音频发生器,将从时域后处理模块输出的处理后的信号由作为音频信号输出。
20、根据权利要求19所述的基于量化信号域的立体声及多声道解码系统,其中,所述声道解耦合模块中的解耦合是采用变换耦合来进行。
21、根据权利要求20所述的基于量化信号域的立体声及多声道解码系统,其特征在于,所述声道解耦合模块中的声道解耦合是采用方极坐标映射来进行。
22、根据权利要求20所述的基于量化信号域的立体声及多声道解码系统,其中所述声道解耦合模块中所采用的变换为整数变换。
23、根据权利要求19所述的基于量化信号域的立体声及多声道解码系统,其中,所述解量化模块中进行的解量化包括通过提取比例因子信息对信号进行反归一化处理,所述比例因子在声道解耦合模块中采用声道间差分编码方式进行编码。
24、根据权利要求19所述的基于量化信号域的立体声及多声道解码系统,其特征在于:
所述声道解耦合模块,根据耦合标志信息,对从无损解码模块输出的无损解码后的信号进行声道解耦合,当耦合标志信息指示启用声道耦合时,对其进行解耦合处理,否则直接将信号传递到解量化模块。
CNB2005101141987A 2005-10-25 2005-10-25 一种基于量化信号域的立体声及多声道编解码方法与系统 Expired - Fee Related CN100561576C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005101141987A CN100561576C (zh) 2005-10-25 2005-10-25 一种基于量化信号域的立体声及多声道编解码方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005101141987A CN100561576C (zh) 2005-10-25 2005-10-25 一种基于量化信号域的立体声及多声道编解码方法与系统

Publications (2)

Publication Number Publication Date
CN1787078A true CN1787078A (zh) 2006-06-14
CN100561576C CN100561576C (zh) 2009-11-18

Family

ID=36784496

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101141987A Expired - Fee Related CN100561576C (zh) 2005-10-25 2005-10-25 一种基于量化信号域的立体声及多声道编解码方法与系统

Country Status (1)

Country Link
CN (1) CN100561576C (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008009175A1 (fr) * 2006-07-14 2008-01-24 Anyka (Guangzhou) Software Technologiy Co., Ltd. Rocédé et un système de codage et décodage audio canal à rétrocompatibilité d'après la règle d'entropie maximale
EP1926082A1 (de) * 2006-11-25 2008-05-28 Deutsche Telekom AG Verfahren zur skalierbaren Codierung von Stereo-Signalen
CN102150202A (zh) * 2008-07-14 2011-08-10 三星电子株式会社 对音频/语音信号进行编码和解码的方法和设备
CN101115051B (zh) * 2006-07-25 2011-08-10 华为技术有限公司 音频信号处理方法、系统以及音频信号收发装置
CN101594123B (zh) * 2009-06-26 2012-05-30 中国人民解放军信息工程大学 建立等效并联滤波器的方法、话音传输方法、装置及系统
CN101617360B (zh) * 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
CN102105930B (zh) * 2008-07-11 2012-10-03 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
CN101611441B (zh) * 2007-02-13 2012-12-26 诺基亚公司 音频信号编码
WO2013097407A1 (zh) * 2011-12-31 2013-07-04 中国科学技术大学 一种基于周期图的无线信号检测方法
US8582785B2 (en) 2007-01-02 2013-11-12 Samsung Electronics Co., Ltd. Method and apparatus to enhance low frequency components and medium frequency components of audio signal
CN103680506A (zh) * 2012-09-13 2014-03-26 Nxp股份有限公司 数字音频处理系统和方法
WO2015100999A1 (zh) * 2013-12-31 2015-07-09 华为技术有限公司 语音频码流的解码方法及装置
US10269357B2 (en) 2014-03-21 2019-04-23 Huawei Technologies Co., Ltd. Speech/audio bitstream decoding method and apparatus

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008009175A1 (fr) * 2006-07-14 2008-01-24 Anyka (Guangzhou) Software Technologiy Co., Ltd. Rocédé et un système de codage et décodage audio canal à rétrocompatibilité d'après la règle d'entropie maximale
CN101485094B (zh) * 2006-07-14 2012-05-30 安凯(广州)软件技术有限公司 最大熵意义下后向兼容多通道音频编码与解码方法和系统
CN101115051B (zh) * 2006-07-25 2011-08-10 华为技术有限公司 音频信号处理方法、系统以及音频信号收发装置
US9311919B2 (en) 2006-09-29 2016-04-12 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
CN101617360B (zh) * 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
US8364497B2 (en) 2006-09-29 2013-01-29 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
US9257124B2 (en) 2006-09-29 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
US8670989B2 (en) 2006-09-29 2014-03-11 Electronics And Telecommunications Research Institute Appartus and method for coding and decoding multi-object audio signal with various channel
EP1926082A1 (de) * 2006-11-25 2008-05-28 Deutsche Telekom AG Verfahren zur skalierbaren Codierung von Stereo-Signalen
US8582785B2 (en) 2007-01-02 2013-11-12 Samsung Electronics Co., Ltd. Method and apparatus to enhance low frequency components and medium frequency components of audio signal
CN101611441B (zh) * 2007-02-13 2012-12-26 诺基亚公司 音频信号编码
CN102105930B (zh) * 2008-07-11 2012-10-03 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
CN105913851A (zh) * 2008-07-14 2016-08-31 三星电子株式会社 对音频/语音信号进行编码和解码的方法和设备
US9355646B2 (en) 2008-07-14 2016-05-31 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode an audio/speech signal
CN105913851B (zh) * 2008-07-14 2019-12-24 三星电子株式会社 对音频/语音信号进行编码和解码的方法和设备
US9728196B2 (en) 2008-07-14 2017-08-08 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode an audio/speech signal
CN102150202A (zh) * 2008-07-14 2011-08-10 三星电子株式会社 对音频/语音信号进行编码和解码的方法和设备
US8532982B2 (en) 2008-07-14 2013-09-10 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode an audio/speech signal
CN102150202B (zh) * 2008-07-14 2016-08-03 三星电子株式会社 对音频/语音信号进行编码和解码的方法和设备
CN101594123B (zh) * 2009-06-26 2012-05-30 中国人民解放军信息工程大学 建立等效并联滤波器的方法、话音传输方法、装置及系统
WO2013097407A1 (zh) * 2011-12-31 2013-07-04 中国科学技术大学 一种基于周期图的无线信号检测方法
US9462400B2 (en) 2011-12-31 2016-10-04 University Of Science And Technology Of China Periodogram-based wireless signal detection method
CN103680506B (zh) * 2012-09-13 2016-05-04 Nxp股份有限公司 数字音频处理系统和方法
CN103680506A (zh) * 2012-09-13 2014-03-26 Nxp股份有限公司 数字音频处理系统和方法
WO2015100999A1 (zh) * 2013-12-31 2015-07-09 华为技术有限公司 语音频码流的解码方法及装置
US9734836B2 (en) 2013-12-31 2017-08-15 Huawei Technologies Co., Ltd. Method and apparatus for decoding speech/audio bitstream
US10121484B2 (en) 2013-12-31 2018-11-06 Huawei Technologies Co., Ltd. Method and apparatus for decoding speech/audio bitstream
US10269357B2 (en) 2014-03-21 2019-04-23 Huawei Technologies Co., Ltd. Speech/audio bitstream decoding method and apparatus
US11031020B2 (en) 2014-03-21 2021-06-08 Huawei Technologies Co., Ltd. Speech/audio bitstream decoding method and apparatus

Also Published As

Publication number Publication date
CN100561576C (zh) 2009-11-18

Similar Documents

Publication Publication Date Title
CN1787078A (zh) 一种基于量化信号域的立体声及多声道编解码方法与系统
CN1181467C (zh) 利用自适应噪声本底相加和噪声替换限制,增强信源编码和解码的方法和系统
CN1217502C (zh) 音频信号的编码装置、解码装置及编码方法和解码方法
CN1144179C (zh) 声音信号解码方法和装置、声音信号编码方法和装置
JP5277350B2 (ja) 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
CN101030377A (zh) 提高声码器基音周期参数量化精度的方法
EP1575032A3 (en) Lossless audio coding/decoding method and apparatus
CN1756086A (zh) 多通道音频数据编码/解码方法和设备
CN1596434A (zh) 信号编码
CN1922658A (zh) 音频信号的分类
CN1926610A (zh) 基于编码的多声道音频信号合成单声道音频信号
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
CN1193344C (zh) 语音解码器和一种语音解码方法
CN1905373A (zh) 一种音频编解码器的实现方法
CN106373583A (zh) 基于理想软阈值掩模irm的多音频对象编、解码方法
CN103098130B (zh) 编码装置、解码装置、编码方法以及解码方法
CN1114274C (zh) 数字数据编码/解码方法及设备
CN1524348A (zh) 编码方法和装置以及解码方法和装置
CN1154084C (zh) 一种基于伪小波滤波的音频编/解码方法
CN1460992A (zh) 用于感知音频编/解码的低延时、自适应的多分辨率滤波器组
CN1375817A (zh) 一种基于小波变换的音频信号压缩编/解码方法
CN1625681A (zh) 产生lsf矢量
CN1273955C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
CN1992703A (zh) 编码数据的方法、解码方法、发射机和接收机
CN1815894A (zh) 一种音频信号编码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: KAIWEI SEMICONDUCTOR TECHNOLOGY (SHANGHAI) CO., LT

Free format text: FORMER OWNER: XINCHENG (BEIJING) TECHNOLOGY CO., LTD.

Effective date: 20110701

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100083 21/F, LIANGZIXIN TOWER, NO. 27, ZHICHUN ROAD, HAIDIAN DISTRICT, BEIJING TO: 200120 TOWER G, 20/F, NO. 360, SOUTH ROAD, PUDONG NEW DISTRICT, SHANGHAI

TR01 Transfer of patent right

Effective date of registration: 20110701

Address after: 200120 G block, 20 floor, No. 360 South Pudong New Area Road, Shanghai

Patentee after: Semiconductor technology (Shanghai) Co., Ltd.

Address before: 100083, Beijing, Zhichun Road, Haidian District 27, quantum core 21 layer

Patentee before: Xincheng (Beijing) Sci. & Tech. Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091118

Termination date: 20191025

CF01 Termination of patent right due to non-payment of annual fee