CN103295577B - 用于音频信号编码的分析窗切换方法和装置 - Google Patents

用于音频信号编码的分析窗切换方法和装置 Download PDF

Info

Publication number
CN103295577B
CN103295577B CN201310202032.5A CN201310202032A CN103295577B CN 103295577 B CN103295577 B CN 103295577B CN 201310202032 A CN201310202032 A CN 201310202032A CN 103295577 B CN103295577 B CN 103295577B
Authority
CN
China
Prior art keywords
frame signal
short
signal
adopted
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310202032.5A
Other languages
English (en)
Other versions
CN103295577A (zh
Inventor
王磊
闫建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Guangsheng Research And Development Institute Co ltd
Original Assignee
Shenzhen Rising Source Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Rising Source Technology Co ltd filed Critical Shenzhen Rising Source Technology Co ltd
Priority to CN201310202032.5A priority Critical patent/CN103295577B/zh
Publication of CN103295577A publication Critical patent/CN103295577A/zh
Application granted granted Critical
Publication of CN103295577B publication Critical patent/CN103295577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种用于音频信号编码的分析窗切换方法和装置。所述方法包括如下步骤:S1、判断输入的帧信号是语音信号还是非语音信号;S2、在该帧信号为非语音信号时,进一步判断该帧信号是稳态信号还是暂态信号,对于稳态信号,采用长分析窗进行处理,对于暂态信号,采用短分析窗进行处理;S3、在该帧信号为语音信号时,进一步对该帧信号进行清浊音分析,并基于该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理。本发明对于语音信号,根据该帧信号的清浊音块的不同位置以及前帧信号的清浊音情况选择采用相应的分析窗型,在使编码效率略微下降的同时防止了前回声的产生。

Description

用于音频信号编码的分析窗切换方法和装置
技术领域
本发明涉及音频信号编解码技术,更具体地说,涉及一种用于音频信号编码的分析窗切换方法和装置。
背景技术
目前的音频编解码技术中,一般用感知编码器对音频信息进行编码压缩。传统的感知编码器中通常有一个心理声学模块,该心理声学模块的作用是分析音频信号中的“不相关成分”,在获得这些“不相关成分”后,再通过量化模块去处理这些“不相关成分”,从而使音频信号达到“感知透明”,即对人的感觉没有影响或影响在可接受的范围内。在分析“不相关成分”时,主要利用人耳具有的掩蔽现象。所谓“掩蔽现象”,如图1所示,就是在一个声音存在的情况下,另一个声音在人耳中不能被感知的现象,这种声音就是遮蔽信号3。掩蔽又分为同时掩蔽1(simultaneous masking)、向前掩蔽2(pre-masking)和向后掩蔽4(post-masking)。其中,向前掩蔽2和向后掩蔽4是表现在时域上的,因此对感知编码器时域特性有额外的要求,即:要做到感知透明的编码质量,量化噪声也必须具有一个与时域相关的掩蔽阈值。但这个要求对实际的感知编码器来说并不容易实现。由时频的测不准原理可知,用块变换方法将音频时域信号变换到频域,然后对变换后的谱系数做量化和编码引起的量化误差,在用合成滤波器重构后,会在时域发生扩散。对常用的滤波器设计,如用窗长为2048个样本点的修正离散余弦变换(简称MDCT)滤波器对采样频率为48000赫兹的信号做变换,在用合成滤波器重构后,所引起的量化误差的扩散约为42.7ms。如果在分析窗内信号较强的能量主要只集中在很小一部分,那么量化噪声就会扩散到信号出现之前。在极端情况下,在某些时间段中,量化噪声甚至会高于原始信号的能量级,这就是所谓的“前回声(pre-echo)”现象,如图2和图3所示。其中,图2为未编码的音频信号,图3为编码重构后的信号,图3中用椭圆圈出的部分就是前回声5。根据人耳的特性,如果编码噪声在信号突变点前持续时间较短的话,可以利用向前掩蔽将前回声掩蔽掉,否则编码噪声会被人耳感知到。为了避免这种现象,设计编码器时就要考虑量化噪声的时域特性,以保证满足时域掩蔽条件,而前回声现象一直是快变类型信号(如响板信号)等无法做到较低码率的一个主要困难。
在编解码音频信号中,为解决前回声现象,当前主流编码器,比如AAC、MP3等都采用自适应窗切换技术。这种方法能根据输入信号的特性,自适应地调整滤波器组窗的大小,稳态部分或缓变部分采用长分析窗,快变信号部分采用短分析窗进行编码。在长分析窗和短分析窗过渡时使用长到短转换的长过渡窗(开始窗)和短到长转换的长过渡窗(结束窗)。其中AAC所使用的长分析窗11、短分析窗12、开始窗13和结束窗14分别如图4a、4b、4c和4d所示。
为了解决前回声现象而使用短分析窗是一把双刃剑。如果是很强的快变信号(比如响板信号),使用短分析窗是很好的选择;如果是语音信号,在清音和浊音之间用短分析窗,则会带来使时间分辨率降低而编码效率大大下降的缺点。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种用于音频信号编码的分析窗切换方法和装置,能够在使编码效率略微下降的同时防止前回声的产生。
本发明解决其技术问题所采用的技术方案是:提出一种用于音频信号编码的分析窗切换方法,包括如下步骤:
S1、判断输入的帧信号是语音信号还是非语音信号;
S2、在该帧信号为非语音信号时,进一步判断该帧信号是稳态信号还是暂态信号,对于稳态信号,采用长分析窗进行处理,对于暂态信号,采用短分析窗进行处理;
S3、在该帧信号为语音信号时,进一步对该帧信号进行清浊音分析,并基于该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理。
一个实施例中,所述步骤S3进一步包括:
S31、将该帧信号分成多个大小相等的块;
S32、判断该多个大小相等的块中每一块的清浊音情况;
S33、根据该帧信号中清音块的位置、浊音块的位置以及前帧信号的清浊音情况选择相应的分析窗。
一个实施例中,所述步骤S33进一步包括:
如果前帧信号为浊音帧而该帧信号的所有块都为浊音块,对前帧信号采用长分析窗,对该帧信号采用长分析窗;
如果前帧信号为浊音帧而该帧信号的前面为浊音块后面为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为浊音帧而该帧信号的所有块都为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为清音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到长转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的前面为清音块后面为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为混合帧且前帧信号的后面为清音块而该帧信号的所有块都为清音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为混合帧且前帧信号的后面为浊音块而该帧信号的所有块都为浊音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到长转换的长过渡窗;
如果对前帧信号的每一块采用短分析窗而该帧信号为混合帧,则对该帧信号的每一块采用短分析窗。
一个实施例中,对前帧信号采用的分析窗和对该帧信号采用的分析窗以满足完全重构条件的方式相互交叠。
一个实施例中,所述长分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 2048 ;
所述短分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 256 ] , 0 &le; n < 256 ;
所述长到短转换的长过渡窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 1024 ; 1 , 1024 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到短转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到长转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1024 ; sin [ &pi; ( n + 1 / 2 ) 2048 ] , 1024 &le; n < 2048 .
本发明为解决其技术问题,还提出一种用于音频信号编码的分析窗切换装置,包括:
信号类型判断模块,用于判断输入的帧信号是语音信号还是非语音信号;
快变信号分析模块,用于在该帧信号为非语音信号时,进一步判断该帧信号是稳态信号还是暂态信号;
清浊音分析模块,用于在该帧信号为语音信号时,进一步对该帧信号进行清浊音分析;
窗型判决模块,用于对稳态信号选择采用长分析窗进行处理,对暂态信号选择采用短分析窗进行处理,对语音信号基于该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理。
一个实施例中,所述清浊音分析模块进一步将该帧信号分成多个大小相等的块,并判断该多个大小相等的块中每一;块的清浊音情况;所述窗型判决模块根据该帧信号中清音块的位置、浊音块的位置以及前帧信号的清浊音情况选择相应的分析窗。
一个实施例中,所述窗型判决模块进一步基于以下选择相应的分析窗:
如果前帧信号为浊音帧而该帧信号的所有块都为浊音块,对前帧信号采用长分析窗,对该帧信号采用长分析窗;
如果前帧信号为浊音帧而该帧信号的前面为浊音块后面为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为浊音帧而该帧信号的所有块都为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为清音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到长转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的前面为清音块后面为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为混合帧且前帧信号的后面为清音块而该帧信号的所有块都为清音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为混合帧且前帧信号的后面为浊音块而该帧信号的所有块都为浊音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到长转换的长过渡窗;
如果对前帧信号的每一块采用短分析窗而该帧信号为混合帧,则对该帧信号的每一块采用短分析窗。
一个实施例中,所述窗型判决模块对前帧信号采用的分析窗和对该帧信号采用的分析窗以满足完全重构条件的方式相互交叠。
一个实施例中,所述长分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 2048 ;
所述短分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 256 ] , 0 &le; n < 256 ;
所述长到短转换的长过渡窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 1024 ; 1 , 1024 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到短转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到长转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1024 ; sin [ &pi; ( n + 1 / 2 ) 2048 ] , 1024 &le; n < 2048 .
本发明的用于音频信号编码的分析窗切换方法和装置,基于音频信号的不同类型选择不同的分析窗进行处理,对于非语音稳态信号,采用长分析窗以提高编码效率;对于非语音暂态信号,采用短分析窗以控制前回声;对于语音信号,根据该帧信号的清浊音块的不同位置以及前帧信号的清浊音情况选择采用相应的分析窗型,在使编码效率略微下降的同时防止了前回声的产生。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是感知编码器中遮蔽信号的示意图;
图2是未编码的音频信号的示意图;
图3是图2所示的音频信号经过编码重构之后的信号的示意图;
图4a是AAC所采用的长分析窗的示意图;
图4b是AAC所采用的短分析窗的示意图;
图4c是AAC所采用的长到短转换的长过渡窗的示意图;
图4d是AAC所采用的短到长转换的长过渡窗的示意图;
图5是DRA音频编码技术的框架示意图;
图6是本发明一个实施例的用于音频信号编码的分析窗切换装置的逻辑框图;
图7是本发明一个实施例的用于音频信号编码的分析窗切换方法的流程图;
图8是DRA音频标准所采用的短到短转换的长过渡窗的示意图;
图9a-图9h分别是根据本发明实施例的分析窗切换示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
DRA(Digital Rise Audio)音频标准的全称为《多声道数字音频编解码技术规范》(以下简称“DRA音频标准”),于2007年1月被批准成为中国电子行业标准(标准号SJ/T11368-2006),并在2009年4月升级为国家标准(标准号GB/T22726-2008)。DRA音频标准可应用于数字电视、数字音频广播、数字电影院、激光视盘机、网络流媒体、IPTV及移动多媒体等领域。
DRA音频标准的编码框架如图5所示。输入的PCM样本一路输入到暂态分析模块501,判断出该帧信号是稳态信号还是暂态信号,得到的结果输入到多分辨率滤波器组模块502,如果该帧是稳态信号,多分辨率滤波器组模块502采用较长的块长进行时频分析以提高编码效率;如果该帧是暂态信号,多分辨率滤波器组模块502采用八个较短的块长进行时频分析以控制前回声。为了提高暂态信号的编码效率,由交叉重组模块503对多分辨率滤波器组模块502输出的频域数据进行交叉重组,如果该帧是稳态信号,则多分辨率滤波器组模块502输出的频域数据不被改变的通过交叉重组模块503。为了消除声道间的冗余,和差编码模块504利用声道对中两个声道之间的相关性以达到减少码率和提高编码效率的效果。联合强度编码模块505用于对信号进行联合强度编码,由于对于高频段(大于2kHz)的信号,听觉的方向感与有关信号强度的变化(信号包络)有关,而与信号的波形无关,即恒包络信号对听觉方向感无影响,因此可利用这一特点以及多声道间的相关信息,将若干声道合成一个共同声道进行编码,从而大大提高多声道的编码效率。输入的PCM样本另一路通过人耳听觉模型模块508进行心理声学分析。人耳听觉模型模块508根据人耳听觉特性计算当前帧信号的掩蔽曲线,根据掩蔽曲线计算特定时频区域的掩蔽阈值以及感知熵,用于指导对当前帧信号的量化。全局比特分配模块509根据掩蔽阈值对联合强度编码模块505输出的频域数据通过线性标量量化模块506进行线性标量量化。量化指数编码模块507对指数进行霍夫曼编码,尾数通过码书选择模块510选择合适的霍夫曼码书进行编码,最后将所有的边信息以及量化后的频域数据通过多路复用模块511形成DRA码流。
以上是DRA实现的一般流程。本发明对其中的暂态分析模块501的功能做出改进,提出一种用于音频信号编码的分析窗切换方法和装置,基于音频信号的不同类型选择不同的分析窗进行处理,并利用DRA特有的分析窗对语音信号特殊处理,在使编码效率略微下降的同时防止了前回声的产生。
DRA音频标准与AAC标准相比有13个分析窗,如下表所示:
分析窗函数 长度(样本数)
WIN_LONG_LONG2LONG 2048
WIN_LONG_LONG2SHORT 2048
WIN_LONG_SHORT2LONG 2048
WIN_LONG_SHORT2SHORT 2048
WIN_LONG_LONG2BRIEF 2048
WIN_LONG_BRIEF2LONG 2048
WIN_LONG_BRIEF2BRIEF 2048
WIN_LONG_SHORT2BRIEF 2048
WIN_LONG_BRIEF2SHORT 2048
WIN_SHORT_SHORT2SHORT 256
WIN_SHORT_SHORT2BRIEF 256
WIN_SHORT_BRIEF2BRIEF 256
WIN_SHORT_BRIEF2SHORT 256
其中,除了长分析窗(WIN_LONG_LONG2LONG,图4a所示)、短分析窗(WIN_SHORT_SHORT2SHORT,图4b所示)、长到短转换的长过渡窗(WIN_LONG_LONG2SHORT,图4c所示)和短到长转换的长过渡窗(WIN_LONG_SHORT2LONG,图4d所示)这4个与AAC标准一样外,DRA音频标准还有9个独有的分析窗,而本发明正是利用那9个不一样的分析窗中的短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT,窗型如图8所示)来实现语音信号的特殊处理,以下将给出本发明窗切换技术的详细描述。
图6是本发明一个实施例的用于音频信号编码的分析窗切换装置60的逻辑框图。如图6所示,该分析窗切换装置60包括信号类型判断模块61、快变信号分析模块62、清浊音分析模块63和窗型判决模块64。其中,信号类型判断模块61判断输入的帧信号是语音信号还是非语音信号。如果信号类型判断模块61判断该帧信号是非语音信号,则进入快变信号分析模块62进一步判断该帧信号是稳态信号还是暂态信号。如果该帧信号是稳态信号,则窗型判决模块64决定采用长分析窗11(如图4a所示)以提高编码效率;如果该帧信号是暂态信号,则窗型判决模块64决定采用短分析窗12(如图4b所示)以控制前回声。如果信号类型判断模块61判断该帧信号是语音信号,则由清浊音分析模块63进一步对该帧信号进行清浊音分析,窗型判决模块64基于清浊音分析模块63分析得到的该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理。一个具体实施例中,清浊音分析模块63将输入的帧信号分成多个大小相等的块,例如,将输入的1024个样本点数据分成8块,每块256个样本点。清浊音分析模块63进一步判断该多个大小相等的块中每一块的清浊音情况,即判断出哪个是清音块,哪个是浊音块(清浊音判决算法可以采用现有的任意方法,比如过零率等)。窗型判决模块64根据该帧信号中清音块的位置、浊音块的位置以及前帧信号的清浊音情况决定采用哪种分析窗窗型。
为了清晰明了,特定义如下:
清音块:如果由256个样本点组成的块经判断是清音,则这块定义为清音块;
浊音块:如果由256个样本点组成的块经判断是浊音,则这块定义为浊音块;
清音帧:如果组成一帧数据的所有块都是清音块,则这帧定义为清音帧;
浊音帧:如果组成一帧数据的所有块都是浊音块,则这帧定义为浊音帧;
混合帧:如果组成一帧数据的所有块有的是清音块,有的是浊音块,则这帧定义为混合帧。
具体实施例中,窗型判决模块64基于以下窗切换方式来选择语音信号的分析窗:
如果前帧信号为浊音帧而该帧信号的所有块都为浊音块,对前帧信号采用长分析窗(WIN_LONG_LONG2LONG)11,则对该帧信号亦采用长分析窗(WIN_LONG_LONG2LONG)11,如图9a所示;
如果前帧信号为浊音帧而该帧信号的前面为浊音块后面为清音块,对前帧信号采用长到短转换的长过渡窗(WIN_LONG_LONG2SHORT)13,则对该帧信号的每一块采用短分析窗(WIN_SHORT_SHORT2SHORT)12,如图9b所示;
如果前帧信号为浊音帧而该帧信号的所有块都为清音块,对前帧信号采用长到短转换的长过渡窗(WIN_LONG_LONG2SHORT)13,则对该帧信号采用短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT)15,如图9c所示;
如果前帧信号为清音帧而该帧信号的所有块都为清音块,对前帧信号采用短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT)15,则对该帧信号亦采用短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT)15,如图9d所示;
如果前帧信号为清音帧而该帧信号的所有块都为浊音块,对前帧信号采用短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT)15,则对该帧信号采用短到长转换的长过渡窗(WIN_LONG_SHORT2LONG)14,如图9e所示;
如果前帧信号为清音帧而该帧信号的前面为清音块后面为浊音块,对前帧信号采用短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT)15,则对该帧信号的每一块采用短分析窗(WIN_SHORT_SHORT2SHORT)12,如图9f所示;
如果前帧信号为混合帧且前帧信号的后面为清音块而该帧信号的所有块都为清音块,对前帧信号的每一块采用短分析窗(WIN_SHORT_SHORT2SHORT)12,则对该帧信号采用短到短转换的长过渡窗(WIN_LONG_SHORT2SHORT)15,如图9g所示;
如果前帧信号为混合帧且前帧信号的后面为浊音块而该帧信号的所有块都为浊音块,对前帧信号的每一块采用短分析窗(WIN_SHORT_SHORT2SHORT)12,则对该帧信号采用短到长转换的长过渡窗(WIN_LONG_SHORT2LONG)14,如图9h所示;
如果对前帧信号的每一块采用短分析窗(WIN_SHORT_SHORT2SHORT)而该帧信号为混合帧,则对该帧信号的每一块亦采用短分析窗(WIN_SHORT_SHORT2SHORT)。
其中,长分析窗函数(WIN_LONG_LONG2LONG)定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 2048 ;
短分析窗函数(WIN_SHORT_SHORT2SHORT)定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 256 ] , 0 &le; n < 256 ;
长到短转换的长过渡窗函数(WIN_LONG_LONG2SHORT)定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 1024 ; 1 , 1024 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
短到短转换的长过渡窗函数(WIN_LONG_SHORT2SHORT)定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
短到长转换的长过渡窗函数(WIN_LONG_SHORT2LONG)定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1024 ; sin [ &pi; ( n + 1 / 2 ) 2048 ] , 1024 &le; n < 2048 .
图7示出了基于以上窗切换技术的窗切换方法70的流程图。如图7所示,根据本发明的一个实施例中,用于音频信号编码的窗切换方法70包括如下步骤:
步骤71中,判断输入的帧信号是语音信号还是非语音信号。如果该帧信号为非语音信号,进入步骤72;如果该针信号为语音信号,进入步骤75。
步骤72中,进一步判断该帧信号是稳态信号还是暂态信号。如果该帧信号为稳态信号,进入步骤73;如果该帧信号为暂态信号,进入步骤74。
步骤73中,选择采用长分析窗(WIN_LONG_LONG2LONG)对稳态信号进行处理。
步骤74中,选择采用短分析窗(WIN_SHORT_SHORT2SHORT)对暂态信号进行处理。
步骤75中,对该帧语音信号进行清浊音分析。一个具体实施例中,本发明将输入的帧信号分成多个大小相等的块,例如,将输入的1024个样本点数据分成8块,每块256个样本点,并判断该多个大小相等的块中每一块的清浊音情况,即判断出哪个是清音块,哪个是浊音块(清浊音判决算法可以采用现有的任意方法,比如过零率等)。
然后步骤76中,基于该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理。例如,可根据该帧信号中清音块的位置、浊音块的位置以及前帧信号的清浊音情况选择相应的分析窗。有关窗型选择和窗切换的具体实现方式,可参见前面对窗切换装置60的相关描述,在此便不再赘述。
本发明的用于音频信号编码的分析窗切换方法和装置,基于音频信号的不同类型选择不同的分析窗进行处理,对于非语音稳态信号,采用长分析窗以提高编码效率;对于非语音暂态信号,采用短分析窗以控制前回声;对于语音信号,根据该帧信号的清浊音块的不同位置以及前帧信号的清浊音情况选择采用相应的分析窗型,在使编码效率略微下降的同时防止了前回声的产生。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种用于音频信号编码的分析窗切换方法,其特征在于,包括如下步骤:
S1、判断输入的帧信号是语音信号还是非语音信号;
S2、在该帧信号为非语音信号时,进一步判断该帧信号是稳态信号还是暂态信号,对于稳态信号,采用长分析窗进行处理,对于暂态信号,采用短分析窗进行处理;
S3、在该帧信号为语音信号时,进一步对该帧信号进行清浊音分析,并基于该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理;
其中,所述步骤S3进一步包括:
S31、将该帧信号分成多个大小相等的块;
S32、判断该多个大小相等的块中每一块的清浊音情况;
S33、根据该帧信号中清音块的位置、浊音块的位置以及前帧信号的清浊音情况选择相应的分析窗,包括:
如果前帧信号为浊音帧而该帧信号的所有块都为浊音块,对前帧信号采用长分析窗,对该帧信号采用长分析窗;
如果前帧信号为浊音帧而该帧信号的前面为浊音块后面为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为浊音帧而该帧信号的所有块都为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为清音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到长转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的前面为清音块后面为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为混合帧且前帧信号的后面为清音块而该帧信号的所有块都为清音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为混合帧且前帧信号的后面为浊音块而该帧信号的所有块都为浊音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到长转换的长过渡窗;
如果对前帧信号的每一块采用短分析窗而该帧信号为混合帧,则对该帧信号的每一块采用短分析窗。
2.根据权利要求1所述的方法,其特征在于,对前帧信号采用的分析窗和对该帧信号采用的分析窗以满足完全重构条件的方式相互交叠。
3.根据权利要求2所述的方法,其特征在于,
所述长分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 2048 ;
所述短分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 256 ] , 0 &le; n < 256 ;
所述长到短转换的长过渡窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 1024 ; 1 , 1024 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到短转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到长转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1024 ; sin [ &pi; ( n + 1 / 2 ) 2048 ] , 1024 &le; n < 2048 .
4.一种用于音频信号编码的分析窗切换装置,其特征在于,包括:
信号类型判断模块,用于判断输入的帧信号是语音信号还是非语音信号;
快变信号分析模块,用于在该帧信号为非语音信号时,进一步判断该帧信号是稳态信号还是暂态信号;
清浊音分析模块,用于在该帧信号为语音信号时,进一步对该帧信号进行清浊音分析;
窗型判决模块,用于对稳态信号选择采用长分析窗进行处理,对暂态信号选择采用短分析窗进行处理,对语音信号基于该帧信号的清浊音情况以及前帧信号的清浊音情况选择相应的不同分析窗来进行处理;
其中,所述清浊音分析模块进一步将该帧信号分成多个大小相等的块,并判断该多个大小相等的块中每一块的清浊音情况;所述窗型判决模块根据该帧信号中清音块的位置、浊音块的位置以及前帧信号的清浊音情况选择相应的分析窗,包括:
如果前帧信号为浊音帧而该帧信号的所有块都为浊音块,对前帧信号采用长分析窗,对该帧信号采用长分析窗;
如果前帧信号为浊音帧而该帧信号的前面为浊音块后面为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为浊音帧而该帧信号的所有块都为清音块,对前帧信号采用长到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为清音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的所有块都为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号采用短到长转换的长过渡窗;
如果前帧信号为清音帧而该帧信号的前面为清音块后面为浊音块,对前帧信号采用短到短转换的长过渡窗,则对该帧信号的每一块采用短分析窗;
如果前帧信号为混合帧且前帧信号的后面为清音块而该帧信号的所有块都为清音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到短转换的长过渡窗;
如果前帧信号为混合帧且前帧信号的后面为浊音块而该帧信号的所有块都为浊音块,对前帧信号的每一块采用短分析窗,则对该帧信号采用短到长转换的长过渡窗;
如果对前帧信号的每一块采用短分析窗而该帧信号为混合帧,则对该帧信号的每一块采用短分析窗。
5.根据权利要求4所述的装置,其特征在于,所述窗型判决模块对前帧信号采用的分析窗和对该帧信号采用的分析窗以满足完全重构条件的方式相互交叠。
6.根据权利要求5所述的装置,其特征在于,
所述长分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 2048 ;
所述短分析窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 256 ] , 0 &le; n < 256 ;
所述长到短转换的长过渡窗函数定义为:
w ( n ) = sin [ &pi; ( n + 1 / 2 ) 2048 ] , 0 &le; n < 1024 ; 1 , 1024 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到短转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1472 ; sin [ &pi; ( ( n - 1344 ) + 1 / 2 ) 256 ] , 1472 &le; n < 1600 ; 0 , 1600 &le; n < 2048 ;
所述短到长转换的长过渡窗函数定义为:
w ( n ) = 0 , 0 &le; n < 448 ; sin [ &pi; ( ( n - 448 ) + 1 / 2 ) 256 ] , 448 &le; n < 576 ; 1 , 576 &le; n < 1024 ; sin [ &pi; ( n + 1 / 2 ) 2048 ] , 1024 &le; n < 2048 .
CN201310202032.5A 2013-05-27 2013-05-27 用于音频信号编码的分析窗切换方法和装置 Active CN103295577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310202032.5A CN103295577B (zh) 2013-05-27 2013-05-27 用于音频信号编码的分析窗切换方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310202032.5A CN103295577B (zh) 2013-05-27 2013-05-27 用于音频信号编码的分析窗切换方法和装置

Publications (2)

Publication Number Publication Date
CN103295577A CN103295577A (zh) 2013-09-11
CN103295577B true CN103295577B (zh) 2015-09-02

Family

ID=49096335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310202032.5A Active CN103295577B (zh) 2013-05-27 2013-05-27 用于音频信号编码的分析窗切换方法和装置

Country Status (1)

Country Link
CN (1) CN103295577B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358959B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN109427337B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号编码时重建信号的方法和装置
CN113129922B (zh) * 2021-04-21 2022-11-08 维沃移动通信有限公司 语音信号的处理方法和装置
CN115691514A (zh) * 2021-07-29 2023-02-03 华为技术有限公司 一种多声道信号的编解码方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
CN1682278A (zh) * 2002-09-17 2005-10-12 皇家飞利浦电子股份有限公司 用于稳定音信号合成的方法
CN1708787A (zh) * 2002-10-30 2005-12-14 三星电子株式会社 用于使用高级心理声学模型来对数字音频编码的方法及其设备
CN1954365A (zh) * 2004-05-17 2007-04-25 诺基亚公司 使用不同编码模型的音频编码
CN101136901A (zh) * 2006-08-18 2008-03-05 广州广晟数码技术有限公司 基于帧的数据的可变分辨率处理
CN101308656A (zh) * 2007-05-17 2008-11-19 展讯通信(上海)有限公司 音频暂态信号的编解码方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
CN1682278A (zh) * 2002-09-17 2005-10-12 皇家飞利浦电子股份有限公司 用于稳定音信号合成的方法
CN1708787A (zh) * 2002-10-30 2005-12-14 三星电子株式会社 用于使用高级心理声学模型来对数字音频编码的方法及其设备
CN1954365A (zh) * 2004-05-17 2007-04-25 诺基亚公司 使用不同编码模型的音频编码
CN101136901A (zh) * 2006-08-18 2008-03-05 广州广晟数码技术有限公司 基于帧的数据的可变分辨率处理
CN101308656A (zh) * 2007-05-17 2008-11-19 展讯通信(上海)有限公司 音频暂态信号的编解码方法

Also Published As

Publication number Publication date
CN103295577A (zh) 2013-09-11

Similar Documents

Publication Publication Date Title
CN101939782B (zh) 噪声填充与带宽扩展之间的自适应过渡频率
ES2658824T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
CN100559465C (zh) 保真度优化的可变帧长编码
CA2705968C (en) A method and an apparatus for processing a signal
CN104995680B (zh) 使用高级频谱延拓降低量化噪声的压扩装置和方法
CN102272832B (zh) 基于峰值检测的选择性缩放掩码计算
CN105164749B (zh) 多声道音频的混合编码
CN106373583B (zh) 基于理想软阈值掩模irm的多音频对象编、解码方法
CN105493182A (zh) 混合波形编码和参数编码语音增强
CN102737647A (zh) 双声道音频音质增强编解码方法及装置
JP2013156667A (ja) 過渡信号符号化方法、復号化方法、及びコンピュータ読取可能媒体
CN103295577B (zh) 用于音频信号编码的分析窗切换方法和装置
CN102063905A (zh) 一种用于音频解码的盲噪声填充方法及其装置
CN101243488B (zh) 用于编码和解码音频信号的装置及其方法
CN101228574A (zh) 一种控制前回声的编码和解码装置及方法
EP3664089A1 (en) Encoding method and encoding apparatus for stereo signal
EP2447943A1 (en) Coding method, decoding method, and device and program using the methods
CN105261373B (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
CN108463850B (zh) 用于音频变换编码中重叠率的信号自适应切换的编码器、解码器以及方法
KR101786863B1 (ko) 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계
CN104485109A (zh) 一种基于索引值的压缩域音频数字提取方法
CN101609679B (zh) 嵌入式编解码方法和装置
Qian et al. Objective audio quality evaluation methon based on compressed domain
CN101833953B (zh) 降低多描述编解码冗余度的方法和装置
CN101504835B (zh) 声场中空间感知信息量的度量方法及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220526

Address after: 510530 No. 10, Nanxiang 2nd Road, Science City, Luogang District, Guangzhou, Guangdong

Patentee after: Guangdong Guangsheng research and Development Institute Co.,Ltd.

Address before: 518057 6th floor, software building, No. 9, Gaoxin Zhongyi Road, high tech Zone, Nanshan District, Shenzhen, Guangdong Province

Patentee before: SHENZHEN RISING SOURCE TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right