CN101894559A - 音频处理方法及其装置 - Google Patents

音频处理方法及其装置 Download PDF

Info

Publication number
CN101894559A
CN101894559A CN2010102456186A CN201010245618A CN101894559A CN 101894559 A CN101894559 A CN 101894559A CN 2010102456186 A CN2010102456186 A CN 2010102456186A CN 201010245618 A CN201010245618 A CN 201010245618A CN 101894559 A CN101894559 A CN 101894559A
Authority
CN
China
Prior art keywords
energy
frequency spectrum
diff
sum
max
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102456186A
Other languages
English (en)
Other versions
CN101894559B (zh
Inventor
吴晟
林福辉
张本好
李昙
徐晶明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN2010102456186A priority Critical patent/CN101894559B/zh
Publication of CN101894559A publication Critical patent/CN101894559A/zh
Application granted granted Critical
Publication of CN101894559B publication Critical patent/CN101894559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及多媒体技术,公开了一种音频处理方法及其装置。本发明中,通过对左右声道间的频谱进行差异性分析,获得左右声道频谱的归一化能量差异比,根据该归一化能量差异比和用于整形的序列得到增强滤波器系数,根据得到的增强滤波器系数对立体声信号的频谱进行增强滤波。由于在通过合成滤波器将频域信号转换为音频信号之前,先利用增强滤波器在频域完成增强滤波,可大大提高音频处理效果,使得最终输出的音频具有更好的立体声增强或者去除人声的效果。

Description

音频处理方法及其装置
技术领域
本发明涉及多媒体技术,特别涉及多媒体技术中的音频处理技术。
背景技术
多媒体技术应用是当今信息技术领域发展最快、最活跃的技术,是新一代电子技术发展和竞争的焦点。多媒体技术融计算机、声音、文本、图像、动画、视频和通信等多种功能于一体。而声音是人类传播信息和感情交流的重要媒体。在多媒体技术中,音频信号的数字处理是其主要的组成部分。
由于在多媒体技术中各种媒体信息均采用数字信号进行处理,因而在多媒体技术中对音频信号的处理,首要问题就是将模拟音频信号进行数字化处理的问题。它主要包括音频信号的模数、数模转换及数字音频信号的压缩编码、解码等问题。考虑到数字音频通常经过感知音频压缩算法进行压缩后保存的。感知音频压缩算法将时域的数字音频通过各类分析滤波器获得频域信号,对频域信号进行重量化,编码和存储。音频解码器在恢复压缩数字音频时,先得到还原的频域信号,然后通过合成滤波器获得还原的时域数字音频。数字音频均衡器(即用于调整音频音色和效果的滤波器)可以嵌入在合成滤波器之前,对数字音频的频域信号进行滤波,高效地完成处理过程。
在各种多媒体应用中,重放录制好的立体声数字音频,常常要求能够扩大其声场,增强其立体感。这种处理不同于虚拟环绕声,它属于立体声增强。在已有技术中,常常通过算法或模拟电路,对左声道加上一些差声道(即左右声道之差)的成分,对右声道减去一些差声道的成分,从而达到立体声增强的目的(可参见中国专利96190643.x,93116902.x)。
除立体声增强以外,卡拉OK的流行,也存在着将带有人声的歌曲去除人声转换成伴奏的需求。由于立体声歌曲的录制中,歌唱者的人声部分集中在中间通道,因此在现有技术中,采用立体声混缩的方法,通过算法或模拟电路,分别对左右通道减去中间声道(即左右声道之和),以达到去人声的目的。
然而,本发明的发明人发现,在现有技术中,立体声增强的方法在实现上虽然较为简单,但效果差强人意,立体感的提升更多地依赖于音量的提高;去人声的方法则完全破坏了歌曲的立体感,并且去人声的效果也差强人意。
发明内容
本发明的目的在于提供一种音频处理方法及其装置,提高音频处理效果,使得最终输出的音频具有更好的立体声增强或者去除人声的效果。
为解决上述技术问题,本发明的实施方式提供了一种音频处理方法,包含以下步骤:
在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,XL、XR和Denergy均为包含N点的序列,N为左声道频谱和右声道频谱分别包含的谱线数;
将Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将Sfilter作为增强滤波器的系数,其中,αreshape根据人声所占的频率带宽和音频处理的目的进行设置;
利用增强滤波器对XL和XR分别进行增强滤波。
本发明的实施方式还提供了一种音频处理装置,包含:
差异分析单元,用于在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,XL、XR和Denergy均为包含N点的序列,N为左声道频谱和右声道频谱分别包含的谱线数;
系数计算单元,用于将差异分析单元得到Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将Sfilter作为增强滤波的系数,其中,αreshape根据人声所占的频率带宽和音频处理的目的进行设置;
增强滤波单元,用于根据系数计算单元得到的增强滤波的系数,对XL和XR分别进行增强滤波。
本发明实施方式与现有技术相比,主要区别及其效果在于:
通过对左右声道间的频谱进行差异性分析,获得左右声道频谱的归一化能量差异比,根据该归一化能量差异比和用于整形的序列得到增强滤波器系数,根据得到的增强滤波器系数对立体声信号的频谱进行增强滤波。由于用于整形的序列Sfilter可依据不同的音乐(声乐或者器乐)和不同的用途(立体声增强或者去人声)进行设置,可生成不同的增强滤波器,因此在通过合成滤波器将频域信号转换为音频信号之前,先利用增强滤波器在频域完成增强滤波,可大大提高音频处理效果。比如说,如果是需要进行立体声增强处理,则终输出的音频可保持原有的音量,提供更好的立体声增强感;如果是需要进行去除人声处理,则终输出的音频中人声的残留更少,音乐的音色,节奏和立体感相对原始音频能基本保持,具有更好的去除人声的效果。
进一步地,当音频处理的目的为去人声处理时(人声所占的频率带宽正常约为100Hz至8kHz),αreshape为以下曲线:
&alpha; reshape ( k ) = cos ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz sin ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。为本发明提供了一种去人声处理的具体实现方式。
进一步地,当音频处理的目的为立体声增强处理时(人声所占的频率带宽正常为100Hz至8kHz),αreshape为以下曲线:
&alpha; reshape ( k ) = sin ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz cos ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。为本发明提供了一种立体声增强处理的具体实现方式。
进一步地,可以将总和能量E’sum与总差能量E’diff的比值作为归一化因子,也可以在定点计算条件下,根据总和能量E’sum和用于表示总差能量E’diff的值所消耗的最少二进制位数得到归一化因子,使得本发明的实施方式能灵活实现,并且,在定点计算条件下对归一化因子以及归一化能量差异比Denergy的计算,在实现上更为简单,可有效提高处理效率。
附图说明
图1是根据本发明第一实施方式的音频处理方法的流程图;
图2是根据本发明第一实施方式的音频处理方法的示意图;
图3是根据本发明第一实施方式的音频处理方法集成在音频解码器中的流程简化示意图;
图4是根据本发明第一实施方式的音频处理方法效果测试中的原始立体声音频波形及其声相图;
图5是根据本发明第一实施方式的音频处理方法效果测试中处理后的立体声音频波形及其声相图;
图6是原始立体声声乐波形、传统立体声混缩去人声处理后的波形、根据本发明第一实施方式进行去人声处理后的波形对比示意图;
图7是根据本发明第三实施方式的音频处理装置结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。
本发明第一实施方式涉及一种音频处理方法。图1是该音频处理方法的流程图。
在步骤110中,将原始立体声的音频信号转换为立体声的频域信号。具体地说,可通过分析滤波器将原始立体声音频信号转换为立体声信号频谱。本领域技术人员可以理解,利用分析滤波器组可实现立体声音频的时频转换。时域的立体声音频信号通过分析滤波器组得到左右声道频谱XL和XR。分析滤波可以是加窗离散傅立叶变换(Discrete Fourier Transform,简称“DFT”),也可以是子带分析滤波器组或是改进型离散余弦变换(Modified Discrete Cosine Transform,简称“MDCT”)滤波器组。其中子带分析滤波器组是使用在MPEG1(运动图像专家小组1)layer3(层3)等音频编码标准中的频域变换方法,而MDCT滤波器组则是使用在先进音频编码(AAC)等音频编码标准中的频域变换方法。原始立体声的音频信号到频域信号的转换,在现有的音频解码器中已是公开和成熟的技术,因此在本实施方式中不再赘述。
接着,在步骤120中,通过分析频谱能量的差异,获得经过能量归一化的增强滤波器系数,如图2所示。下面对本步骤进行详细说明。
在获取到立体声的频域信号后,首先对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,XL、XR和Denergy均为包含N点的序列,N为左声道频谱和右声道频谱分别包含的谱线数。具体可通过以下4个子步骤实现:
(1)通过以下公式分别计算XL和XR的差频谱能量Ediff与和频谱能量Esum(Esum和Ediff同样均为包含N点的序列):
Ediff[k]=|XL[k]-XR[k]|2     (1)
Esum[k]=|XL[k]|2+|XR[k]|2   (2)
其中,k表示频谱的序号,从1到N,即k=1,2,......N,也就是说,在本实施方式中,黑体表示向量,它由一组变量构成;单个变量将通过斜体表示;k用作表示向量的序号,[k]表示向量中第k个元素(或者第k个点)。
(2)根据计算到的Esum和Ediff分别计算频谱信号的总差能量E’diff与总和能量E’sum,即:
E diff &prime; = &Sigma; k = 1 N E diff [ k ] 2 - - - ( 3 )
E sum &prime; = &Sigma; k = 1 N E sum [ k ] 2 - - - ( 4 )
(3)进一步计算获得的总和能量E’sum与总差能量E’diff的比值,即:
&lambda; = E &prime; sum E &prime; diff - - - ( 5 )
(4)通过以下公式之一,计算归一化的能量差异比述Denergy
D energy [ k ] = max [ d min , min ( d max , &lambda; E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N - - - ( 6 )
D energy [ k ] = max [ d min , &lambda; min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N - - - ( 7 )
D energy [ k ] = &lambda; max [ d min , min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N - - - ( 8 )
其中,dmax和dmin是用于约束能量差异比Denergy上下限的,dmax为上限门限值,1≤dmax≤2;dmin为下限门限值,0≤dmin≤1。由于可通过公式(6)、(7)、(8)中的任何一个公式计算出Denergy,不难发现,利用dmax和dmin对Denergy的归一化计算所进行的约束,既可以在归一化操作后进行(如公式6),也可以在归一化操作的过程中进行(如公式7),还可以在归一化操作前进行(如公式8)。
需要说明的是,对于不同的音乐,通过设置dmax和dmin可以获得不同用途的确定。一般而言,对于人声歌唱占主导的题材的立体声增强处理,需要更多地保留主声道信息,那么dmax可以设小一些,dmin可以设大一些,典型值为dmax=1.0,dmin=0.6;对于器乐占主导的题材的立体声增强处理,可以更多地提高声道间的差异,以增强立体感和环绕感,那么dmax可以设大一些,dmin可以设小一些,典型值为dmax=1.2,dmin=0.3;对于声乐题材的去声人处理,则可将dmax设得更大一些,dmin设得更小一些,典型值为dmax=1.5,dmin=0。
得到左右声道频谱的归一化能量差异比Denergy后,再将Denergy通过N点的序列αreshape进行整形,αreshape取值在0到1之间,得到整形后的序列Sfilter,并将Sfilter作为增强滤波器的系数。具体地,根据以下公式进行整形:
Sfilter[k]=αreshape[k]+(1-αreshape[k])Denergy[k],k=1,…,N    (9)
其中,αreshape根据人声所占的频率带宽和音频处理的目的进行设置。比如说,人的声音一般从100Hz开始,上潜到8kHz,那么对于声乐题材的立体声增强处理,αreshape的设置原则是在100Hz到8kHz这一大致频率范围内很小或直接为0,来削弱对这一频段的操作;而对于去人声处理,αreshape的设置原则是在100Hz到8kHz这一大致频率范围内很大或直接为1,来增强对这一频段的操作;在频段的边缘,使用曲线平滑过渡。使用三角函数作为平滑过渡,一个可行的用于声乐题材去人声处理的αreshape曲线实例为:
&alpha; reshape ( k ) = cos ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz sin ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2 - - - ( 10 )
一个可行的用于声乐题材立体声增强处理的αreshape曲线实例为:
&alpha; reshape ( k ) = sin ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz cos ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2 - - - ( 11 )
当然,其他类似的曲线或者分段折线,只要满足人语音频率范围的约束(即人的声音一般从100Hz开始,上潜到8kHz),都可以用作整形序列αreshape
接着,在步骤130中,利用增强滤波器对XL和XR分别进行增强滤波,如图2所示。由于在步骤120中,已得到了增强滤波器的系数Sfilter,因此在本步骤中,可通过将增强滤波器的系数Sfilter分别和左右声道频域谱XL、XR点乘,得到增强处理后的左右声道频谱,即:
X′L[k]=XL[k]Sfilter[k],k=1,…,N    (12)
X′R[k]=XR[k]Sfilter[k],k=1,…,N    (13)
其中,X’L为经增强滤波后的包含N点的左声道频谱;X’R为经增强滤波后的包含N点的右声道频谱。
接着,在步骤140中,通过合成滤波器对经增强滤波后的左声道频谱和右声道频谱进行重建,获得处理后的立体声的时域音频信号,如图2所示。本领域技术人员可以理解,利用合成滤波器组可实现立体声音频的时频转换。合成滤波器组可以是加窗离散傅立叶逆变换(Inverse Discrete Fourier Transform,简称“IDFT”),也可以是子带综合滤波器组或是改进型离散余弦反变换(Inverse Modified Discrete Cosine Transform,简称“IMDCT”)滤波器组,从频域信号到音频信号的转换,在现有的音频解码器中已是公开和成熟的技术,因此在本实施方式中不再赘述。本步骤中的合成滤波器组与步骤110中的分析滤波器组一般能实现信号的完美分析和重构,即输入到分析滤波器组的信号,和经合成滤波器组重建的信号能达到完全或基本一致(允许存在信号延迟)。
值得一提的是,当本实施方式中的音频处理方法集成在音频解码器中时,由于音频解码器本身就需要从音频码流中解码重建获得信号频谱,并且也具备实现立体声音频时频转换的合成滤波器组,因此可省略本实施方式中的步骤110与步骤140,如图3所示。
不难发现,由于用于整形的序列Sfilter可依据不同的音乐(声乐或者器乐)和不同的用途(立体声增强或者去人声)进行设置,可生成不同的增强滤波器,因此在通过合成滤波器将频域信号转换为音频信号之前,先利用增强滤波器在频域完成增强滤波,可大大提高音频处理效果。比如说,如果是需要进行立体声增强处理,则终输出的音频可保持原有的音量,提供更好的立体声增强感。如果是需要进行去除人声处理,则终输出的音频中人声的残留更少,音乐的音色,节奏和立体感相对原始音频能基本保持,具有更好的去除人声的效果。
具体地说,目前的音频特效处理效果虽然尚无统一的客观指标,但立体声声场的扩展和去声人处理后是否能够保持原有声音特性还是可以通过声像图和频谱图看出来的,通过主观试听感受音质变换,也可以体会到本实施方式提供的效果。在本实施方式的效果测试中,分析与合成滤波器组采用N=1024的MDCT和IMDCT滤波器组,这是AAC中使用的滤波器组,测试音源选用了王菲的歌曲《南海姑娘》,如图4所示,图的左侧上下分别是乐曲的左声道和右声道,右侧是音乐的声相图。图5则是经本实施方式处理后的音乐的波形和声相图。在图5中可以看到,经本实施方式处理后的音乐(测试参数dmax=1.0,dmin=0.6,αreshape由公式(11)获得),波形和幅度与原声音基本一致,但声相图明显扩展许多。主观试听显示,处理后的音乐音量和原始音乐基本一致,但声场明显开阔,立体感更强。
图6依次显示了原始的立体声声乐波形的左右声道(从上到下的第1,2条波形),传统立体声混缩去人声处理后的左右声道(从上到下的第3,4条波形)和经本实施方式的去人声处理后的左右声道(从上到下的第5,6条波形,测试参数dmax=1.5,dmin=0,αreshape由公式(10)获得)。可以看到传统立体声混缩去人声处理后的波形相对原始波形变化较大,并且完全失去了立体声信息,而经本实施方式处理后的音乐依旧保持了原有声音的幅度和声道波形包络的差别,保持了较多的立体声信息。主观试听显示,本发明处理后的音频中,人声成分的残留更少,音乐的节奏和立体感依然保持,而传统立体声混缩去人声处理后,人声残留依然较多,音色却大大改变,且完全丧失了立体感。
本发明第二实施方式涉及一种音频处理方法。第二实施方式在第一实施方式的基础上进行了改进,主要改进之处在于:在本实施方式中,进一步提供了在定点计算条件下,对归一化能量差异比Denergy以及增强滤波器系数Sfilter的计算实现方式,使得Denergy以及Sfilter的计算在实现上更为简单,避免除法计算,从而可有效提高处理效率。
具体地说,首先获得用于表示序列Esum中每个元素的值所消耗的最少二进制位数Bsum,正如在第一实施方式中所述,Esum为包含N点的序列,表示XL和XR的和频谱能量,具体计算方法可参见第一实施方式,因此Bsum也为包含N点的序列,具体可通过以下公式获取Bsum
Bsum[k]=int[log2(Esum[k])+0.5],k=1,…,N    (14)
当然,在实际应用中,也可以用较少甚至一条简单计算指令获得Bsum(例如ARM处理器的指令CLZ),而不需要采用式(14)所表述的复杂函数计算。类似地,用于表示E’diff的值所消耗的最少二进制位数B’diff也可以得到,其中,E’diff为频谱信号的总差能量,具体计算方法可参见第一实施方式,即:
B′diff=int[log2(E′diff)+0.5]   (15)
在本实施方式中,归一化因子具有p1比特精度(即归一化因子的值在小数点后可使用的比特数为p1,p1可根据需要预先设定),则可通过以下公式获取归一化因子λ:
&lambda; = ( 2 p 1 E &prime; sum ) > > B &prime; diff - - - ( 16 )
其中,E’sum为所述XL和所述XR的总和能量(其具体计算方式参见第一实施方式)。
归一化能量差异比Denergy则可通过以下公式获取:
D energy [ k ] = max [ 2 p 2 d min , min ( 2 p 2 d max , ( &lambda; E diff [ k ] ) > > ( p 1 - p 2 + B sum [ k ] ) ) ] , k = 1 , . . . , N
(17)
其中,p2为表示增强滤波器系数Sfilter的比特精度(即序列Sfilter中每个元素的值在小数点后可使用的比特数为p2,p2可根据需要预先设定),Ediff为包含N点的序列,表示XL和XR的差频谱能量(具体计算方法参见第一实施方式),dmax与dmin分别为上、下限门限值,用于对Denergy进行约束,其取值与第一实施方式相同。
接着,可通过以下公式将能量差异比Denergy通过p1位精度的N点的序列αreshape进行整形,得到整形后的序列Sfilter(即增强滤波器的系数):
S filter [ k ] = &alpha; reshape [ k ] + ( ( 2 p 1 - &alpha; reshape [ k ] ) &CenterDot; D energy [ k ] ) > > p 1 , k = 1 , . . . , N - - - ( 18 )
其中,αreshape的设置原则与第一实施方式相同。
增强滤波器Sfilter将和左右声道频域谱XL和XR点乘,得到增强处理后的左右声道频谱:
X′L[k]=(XL[k]Sfilter[k])>>p2,k=1,…,N    (19)
X′R[k]=(XR[k]Sfilter[k])>>p2,k=1,…,N    (20)
其中,X’L为经增强滤波后的包含N点的左声道频谱;X’R为经增强滤波后的包含N点的右声道频谱。
不难发现,本实施方式与第一实施方式的区别在于归一化因子、归一化能量差异比以及增强滤波器的系数Sfilter的计算有所不同,其他步骤仍与第一实施方式相同,在此不再赘述。
需要说明的是,本发明的各方法实施方式均可以以软件、硬件、固件等方式实现。不管本发明是以软件、硬件、还是固件方式实现,指令代码都可以存储在任何类型的计算机可访问的存储器中(例如永久的或者可修改的,易失性的或者非易失性的,固态的或者非固态的,固定的或者可更换的介质等等)。同样,存储器可以例如是可编程阵列逻辑(Programmable Array Logic,简称“PAL”)、随机存取存储器(Random Access Memory,简称“RAM”)、可编程只读存储器(Programmable Read Only Memory,简称“PROM”)、只读存储器(Read-Only Memory,简称“ROM”)、电可擦除可编程只读存储器(Electrically Erasable Programmable ROM,简称“EEPROM”)、磁盘、光盘、数字通用光盘(Digital Versatile Disc,简称“DVD”)等等。
本发明第三实施方式涉及一种音频处理装置。图7是该音频处理装置的结构示意图。该音频处理装置包含:
差异分析单元,用于在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,XL、XR和Denergy均为包含N点的序列,N为左声道频谱和右声道频谱分别包含的谱线数。
系数计算单元,用于将差异分析单元得到的Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将Sfilter作为增强滤波的系数,其中,αreshape根据人声所占的频率带宽和音频处理的目的进行设置。
增强滤波单元,用于根据系数计算单元得到的增强滤波的系数,对XL和XR分别进行增强滤波。
合成滤波单元,用于对经增强滤波单元滤波后的左声道频谱和右声道频谱进行重建,获得处理后的立体声音频信号。
具体地说,当人声所占的频率带宽约为100Hz至8kHz,音频处理的目的为去人声处理时,αreshape可以为以下曲线:
&alpha; reshape ( k ) = cos ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz sin ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。
当人声所占的频率带宽约为100Hz至8kHz,音频处理的目的为声乐题材立体声增强处理时,αreshape可以为以下曲线:
&alpha; reshape ( k ) = sin ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz cos ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。
差异分析单元可通过以下公式之一计算Denergy
D energy [ k ] = max [ d min , min ( d max , &lambda; E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
D energy [ k ] = max [ d min , &lambda; min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
D energy [ k ] = &lambda; max [ d min , min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
其中,k为频谱的序号,λ为归一化因子,λ为XL和XR的总和能量E’sum与总差能量E’diff的比值。dmax为上限门限值,1≤dmax≤2,dmin为下限门限值,0≤dmin≤1,Esum和Ediff均为包含N点的序列,Esum为XL和XR的和频谱能量,Ediff为XL和XR的差频谱能量。
系数计算单元可根据以下公式进行整形,得到整形后的序列Sfilter
Sfilter[k]=αreshape[k]+(1-αreshape[k])Denergy[k],k=1,…,N
增强滤波单元可通过以下公式,对XL和XR分别进行增强滤波:
X′L[k]=XL[k]Sfilter[k],k=1,…,N
X′R[k]=XR[k]Sfilter[k],k=1,…,N
其中,X’L为经增强滤波后的包含N点的左声道频谱。X’R为经增强滤波后的包含N点的右声道频谱。
不难发现,第一实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
本发明第四实施方式涉及一种音频处理装置。第四实施方式在第三实施方式的基础上进行了改进,主要改进之处在于:在本实施方式中,进一步提供了在定点计算条件下,对归一化能量差异比Denergy以及增强滤波器系数Sfilter的计算实现方式,使得Denergy以及Sfilter的计算在实现上更为简单,避免除法计算,从而可有效提高处理效率。
具体地说,差异分析单元可通过以下公式计算Denergy
D energy [ k ] = max [ 2 p 2 d min , min ( 2 p 2 d max , ( &lambda; E diff [ k ] ) > > ( p 1 - p 2 + B sum [ k ] ) ) ] , k = 1 , . . . , N
其中,k为频谱的序号,dmax为上限门限值,1≤dmax≤2,dmin为下限门限值,0≤dmin≤1,λ为归一化因子,p1为表示归一化因子具有的比特精度(小数点后可使用的比特数),p2为表示Sfilter具有的比特精度(小数点后可使用的比特数),Ediff和Bsum均为包含N点的序列,Ediff为XL和XR的差频谱能量,Bsum为用于表示XL和XR的和频谱能量Esum中每个元素的值所消耗的最少二进制位数,Esum为包含N点的序列;λ通过以下公式获取:
&lambda; = ( 2 p 1 E &prime; sum ) > > B &prime; diff
其中,E’sum为XL和XR的总和能量,B’diff为用于表示E’diff的值所消耗的最少二进制位数,E’diff为XL和XR的总差能量。
系数计算单元可根据以下公式进行整形,得到整形后的序列Sfilter
S filter [ k ] = &alpha; reshape [ k ] + ( ( 2 p 1 - &alpha; reshape [ k ] ) &CenterDot; D energy [ k ] ) > > p 1 , k = 1 , . . . , N
不难发现,第二实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第二实施方式中。
需要说明的是,本发明各设备实施方式中提到的各单元都是逻辑单元,在物理上,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现,这些逻辑单元本身的物理实现方式并不是最重要的,这些逻辑单元所实现的功能的组合是才解决本发明所提出的技术问题的关键。此外,为了突出本发明的创新部分,本发明上述各设备实施方式并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,这并不表明上述设备实施方式并不存在其它的单元。
虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (14)

1.一种音频处理方法,其特征在于,包含以下步骤:
在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,所述XL、XR和Denergy均为包含N点的序列,N为所述左声道频谱和右声道频谱分别包含的谱线数;
将所述Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将所述Sfilter作为增强滤波器的系数,其中,所述αreshape根据人声所占的频率带宽和音频处理的目的进行设置;
利用所述增强滤波器对所述XL和XR分别进行增强滤波。
2.根据权利要求1所述的音频处理方法,其特征在于,所述人声所占的频率带宽为100Hz至8kHz,所述音频处理的目的为去人声处理,所述αreshape为以下曲线:
&alpha; reshape ( k ) = cos ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz sin ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。
3.根据权利要求1所述的音频处理方法,其特征在于,所述人声所占的频率带宽为100Hz至8kHz,所述音频处理的目的为声乐题材立体声增强处理,所述αreshape为以下曲线:
&alpha; reshape ( k ) = sin ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz cos ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。
4.根据权利要求1所述的音频处理方法,其特征在于,所述对左声道频谱和右声道频谱进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy的步骤中,包含以下子步骤:
通过以下公式之一计算所述Denergy
D energy [ k ] = max [ d min , min ( d max , &lambda; E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
D energy [ k ] = max [ d min , &lambda; min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
D energy [ k ] = &lambda; max [ d min , min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
其中,k为频谱的序号,所述λ为归一化因子,所述λ为所述XL和所述XR的总和能量E’sum与总差能量E’diff的比值;所述dmax为上限门限值,1≤dmax≤2,所述dmin为下限门限值,0≤dmin≤1,所述Esum和所述Ediff均为包含N点的序列,所述Esum为所述XL和XR的和频谱能量,所述Ediff为所述XL和XR的差频谱能量;
将所述Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter的步骤中,根据以下公式进行所述整形:
Sfilter[k]=αreshape[k]+(1-αreshape[k])Denergy[k],k=1,…,N
5.根据权利要求1所述的音频处理方法,其特征在于,所述对左声道频谱和右声道频谱进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy的步骤中,包含以下子步骤:
通过以下公式计算所述Denergy
D energy [ k ] = max [ 2 p 2 d min , min ( 2 p 2 d max , ( &lambda; E diff [ k ] ) > > ( p 1 - p 2 + B sum [ k ] ) ) ] , k = 1 , . . . , N
其中,k为频谱的序号,dmax为上限门限值,1≤dmax≤2,dmin为下限门限值,0≤dmin≤1,所述λ为归一化因子,所述p1为表示归一化因子具有的比特精度,所述p2为表示所述Sfilter具有的比特精度,所述Ediff和所述Bsum均为包含N点的序列,所述Ediff为所述XL和XR的差频谱能量,所述Bsum为用于表示所述XL和XR的和频谱能量Esum中每个元素的值所消耗的最少二进制位数,所述Esum为包含N点的序列;所述λ通过以下公式获取:
&lambda; = ( 2 p 1 E &prime; sum ) > > B &prime; diff
其中,所述E’sum为所述XL和所述XR的总和能量,所述B’diff为用于表示E’diff的值所消耗的最少二进制位数,所述E’diff为所述XL和所述XR的总差能量;
将所述Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter的步骤中,根据以下公式进行所述整形:
S filter [ k ] = &alpha; reshape [ k ] + ( ( 2 p 1 - &alpha; reshape [ k ] ) &CenterDot; D energy [ k ] ) > > p 1 , k = 1 , . . . , N
6.根据权利要求1至5中任一项所述的音频处理方法,其特征在于,通过以下公式,利用所述增强滤波器对所述XL和XR分别进行增强滤波:
X′L[k]=XL[k]Sfilter[k],k=1,…,N
X′R[k]=XR[k]Sfilter[k],k=1,…,N
其中,X’L为经增强滤波后的包含N点的左声道频谱;X’R为经增强滤波后的包含N点的右声道频谱。
7.根据权利要求1至5中任一项所述的音频处理方法,其特征在于,在利用所述增强滤波器对所述XL和XR分别进行增强滤波后,还包含以下步骤:
通过合成滤波器对经增强滤波后的左声道频谱和右声道频谱进行重建,获得处理后的立体声音频信号。
8.一种音频处理装置,其特征在于,包含:
差异分析单元,用于在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,所述XL、XR和Denergy均为包含N点的序列,N为所述左声道频谱和右声道频谱分别包含的谱线数;
系数计算单元,用于将所述差异分析单元得到的所述Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将所述Sfilter作为增强滤波的系数,其中,所述αreshape根据人声所占的频率带宽和音频处理的目的进行设置;
增强滤波单元,用于根据所述系数计算单元得到的所述增强滤波的系数,对所述XL和XR分别进行增强滤波。
9.根据权利要求8所述的音频处理装置,其特征在于,所述人声所占的频率带宽为100Hz至8kHz,所述音频处理的目的为去人声处理,所述αreshape为以下曲线:
&alpha; reshape ( k ) = cos ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz sin ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。
10.根据权利要求8所述的音频处理装置,其特征在于,所述人声所占的频率带宽为100Hz至8kHz,所述音频处理的目的为声乐题材立体声增强处理,所述αreshape为以下曲线:
&alpha; reshape ( k ) = sin ( &pi; 2 ( k F S / 2 N ) - 40 80 ) , 40 < ( k F S / 2 N ) < 120 Hz 0 , 100 Hz &le; ( k F S / 2 N ) < 7000 Hz cos ( &pi; 2 ( k F S / 2 N ) - 7000 4000 ) , 7000 Hz &le; ( k F S / 2 N ) < 11000 Hz 1 , 11000 Hz &le; ( k F S / 2 N ) < F S / 2
其中,k为频谱的序号,1≤k≤N。
11.根据权利要求8所述的音频处理装置,其特征在于,所述差异分析单元通过以下公式之一计算所述Denergy
D energy [ k ] = max [ d min , min ( d max , &lambda; E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
D energy [ k ] = max [ d min , &lambda; min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
D energy [ k ] = &lambda; max [ d min , min ( d max , E diff [ k ] E sum [ k ] ) ] , k = 1 , . . . , N
其中,k为频谱的序号,所述λ为归一化因子,所述λ为所述XL和所述XR的总和能量E’sum与总差能量E’diff的比值;所述dmax为上限门限值,1≤dmax≤2,所述dmin为下限门限值,0≤dmin≤1,所述Esum和所述Ediff均为包含N点的序列,所述Esum为所述XL和XR的和频谱能量,所述Ediff为所述XL和XR的差频谱能量;
所述系数计算单元根据以下公式进行所述整形,得到整形后的序列Sfilter
Sfilter[k]=αreshape[k]+(1-αreshape[k])Denergy[k],k=1,…,N
12.根据权利要求8所述的音频处理装置,其特征在于,所述差异分析单元通过以下公式计算所述Denergy
D energy [ k ] = max [ 2 p 2 d min , min ( 2 p 2 d max , ( &lambda; E diff [ k ] ) > > ( p 1 - p 2 + B sum [ k ] ) ) ] , k = 1 , . . . , N
其中,k为频谱的序号,dmax为上限门限值,1≤dmax≤2,dmin为下限门限值,0≤dmin≤1,所述λ为归一化因子,所述p1为表示归一化因子具有的比特精度,所述p2为表示所述Sfilter具有的比特精度,所述Ediff和所述Bsum均为包含N点的序列,所述Ediff为所述XL和XR的差频谱能量,所述Bsum为用于表示所述XL和XR的和频谱能量Esum中每个元素的值所消耗的最少二进制位数,所述Esum为包含N点的序列;所述λ通过以下公式获取:
&lambda; = ( 2 p 1 E &prime; sum ) > > B &prime; diff
其中,所述E’sum为所述XL和所述XR的总和能量,所述B’diff为用于表示E’diff的值所消耗的最少二进制位数,所述E’diff为所述XL和所述XR的总差能量;
所述系数计算单元根据以下公式进行所述整形,得到整形后的序列Sfilter
S filter [ k ] = &alpha; reshape [ k ] + ( ( 2 p 1 - &alpha; reshape [ k ] ) &CenterDot; D energy [ k ] ) > > p 1 , k = 1 , . . . , N
13.根据权利要求8至12中任一项所述的音频处理装置,其特征在于,所述增强滤波单元通过以下公式,对所述XL和XR分别进行增强滤波;
X′L[k]=XL[k]Sfilter[k],k=1,…,N
X′R[k]=XR[k]Sfilter[k],k=1,…,N
其中,X’L为经增强滤波后的包含N点的左声道频谱;X’R为经增强滤波后的包含N点的右声道频谱。
14.根据权利要求8至12中任一项所述的音频处理装置,其特征在于,所述音频处理装置还包含合成滤波单元,用于对经所述增强滤波单元滤波后的左声道频谱和右声道频谱进行重建,获得处理后的立体声音频信号。
CN2010102456186A 2010-08-05 2010-08-05 音频处理方法及其装置 Active CN101894559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102456186A CN101894559B (zh) 2010-08-05 2010-08-05 音频处理方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102456186A CN101894559B (zh) 2010-08-05 2010-08-05 音频处理方法及其装置

Publications (2)

Publication Number Publication Date
CN101894559A true CN101894559A (zh) 2010-11-24
CN101894559B CN101894559B (zh) 2012-06-06

Family

ID=43103730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102456186A Active CN101894559B (zh) 2010-08-05 2010-08-05 音频处理方法及其装置

Country Status (1)

Country Link
CN (1) CN101894559B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329571A (zh) * 2011-01-04 2013-09-25 Dts有限责任公司 沉浸式音频呈现系统
CN104053120A (zh) * 2014-06-13 2014-09-17 福建星网视易信息系统有限公司 一种立体声音频的处理方法和装置
CN105741835A (zh) * 2016-03-18 2016-07-06 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端
CN107004427A (zh) * 2014-12-12 2017-08-01 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CN107134280A (zh) * 2013-09-12 2017-09-05 杜比国际公司 多声道音频内容的编码
CN109036455A (zh) * 2018-09-17 2018-12-18 中科上声(苏州)电子有限公司 直达声与背景声提取方法、扬声器系统及其声重放方法
CN109194307A (zh) * 2018-08-01 2019-01-11 南京中感微电子有限公司 数据处理方法及系统
CN110139206A (zh) * 2019-04-28 2019-08-16 北京雷石天地电子技术有限公司 一种立体声音频的处理方法及系统
CN111261175A (zh) * 2020-01-17 2020-06-09 北京塞宾科技有限公司 一种蓝牙音频信号传输方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761313A (en) * 1995-06-30 1998-06-02 Philips Electronics North America Corp. Circuit for improving the stereo image separation of a stereo signal
CN1329810A (zh) * 1998-10-13 2002-01-02 Srs实验室公司 通过单声道输入合成伪立体声输出的设备和方法
US20020118839A1 (en) * 2000-12-27 2002-08-29 Philips Electronics North America Corporation Circuit for providing a widened stereo image
CN1592499A (zh) * 2003-09-01 2005-03-09 扬智科技股份有限公司 立体声之人声消除方法及相关装置
CN1945689A (zh) * 2006-10-24 2007-04-11 北京中星微电子有限公司 一种从歌曲中提取伴奏乐的方法及其装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761313A (en) * 1995-06-30 1998-06-02 Philips Electronics North America Corp. Circuit for improving the stereo image separation of a stereo signal
CN1329810A (zh) * 1998-10-13 2002-01-02 Srs实验室公司 通过单声道输入合成伪立体声输出的设备和方法
US20020118839A1 (en) * 2000-12-27 2002-08-29 Philips Electronics North America Corporation Circuit for providing a widened stereo image
CN1592499A (zh) * 2003-09-01 2005-03-09 扬智科技股份有限公司 立体声之人声消除方法及相关装置
CN1945689A (zh) * 2006-10-24 2007-04-11 北京中星微电子有限公司 一种从歌曲中提取伴奏乐的方法及其装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329571A (zh) * 2011-01-04 2013-09-25 Dts有限责任公司 沉浸式音频呈现系统
US11776552B2 (en) 2013-09-12 2023-10-03 Dolby International Ab Methods and apparatus for decoding encoded audio signal(s)
US11410665B2 (en) 2013-09-12 2022-08-09 Dolby International Ab Methods and apparatus for decoding encoded audio signal(s)
CN107134280A (zh) * 2013-09-12 2017-09-05 杜比国际公司 多声道音频内容的编码
CN107134280B (zh) * 2013-09-12 2020-10-23 杜比国际公司 多声道音频内容的编码
CN104053120A (zh) * 2014-06-13 2014-09-17 福建星网视易信息系统有限公司 一种立体声音频的处理方法和装置
CN104053120B (zh) * 2014-06-13 2016-03-02 福建星网视易信息系统有限公司 一种立体声音频的处理方法和装置
CN107004427B (zh) * 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CN107004427A (zh) * 2014-12-12 2017-08-01 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CN105741835B (zh) * 2016-03-18 2019-04-16 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端
US10410615B2 (en) 2016-03-18 2019-09-10 Tencent Technology (Shenzhen) Company Limited Audio information processing method and apparatus
WO2017157319A1 (zh) * 2016-03-18 2017-09-21 腾讯科技(深圳)有限公司 音频信息处理方法及装置
CN105741835A (zh) * 2016-03-18 2016-07-06 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端
CN109194307A (zh) * 2018-08-01 2019-01-11 南京中感微电子有限公司 数据处理方法及系统
CN109194307B (zh) * 2018-08-01 2022-05-27 南京中感微电子有限公司 数据处理方法及系统
CN109036455A (zh) * 2018-09-17 2018-12-18 中科上声(苏州)电子有限公司 直达声与背景声提取方法、扬声器系统及其声重放方法
CN110139206A (zh) * 2019-04-28 2019-08-16 北京雷石天地电子技术有限公司 一种立体声音频的处理方法及系统
CN110139206B (zh) * 2019-04-28 2020-11-27 北京雷石天地电子技术有限公司 一种立体声音频的处理方法及系统
CN111261175A (zh) * 2020-01-17 2020-06-09 北京塞宾科技有限公司 一种蓝牙音频信号传输方法和装置

Also Published As

Publication number Publication date
CN101894559B (zh) 2012-06-06

Similar Documents

Publication Publication Date Title
CN101894559B (zh) 音频处理方法及其装置
US11935551B2 (en) Cross product enhanced harmonic transposition
US10373623B2 (en) Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope
CN103959375B (zh) 增强的从音频编解码器的色度提取
EP3296992B1 (en) Apparatus and method for modifying a parameterized representation
CN102934163B (zh) 用于宽带语音编码的系统、方法、设备
TWI545558B (zh) 使用重構頻帶之能量資訊值之音頻訊號之編碼或解碼裝置與方法
RU2491659C2 (ru) Системы, способы и устройства для высокополосного предыскажения шкалы времени
CN103477386B (zh) 音频编解码器中的噪声产生
Li et al. Robust speaker identification using an auditory-based feature
CN102915739A (zh) 用于对高频信号进行编码和解码的方法和设备
US7921007B2 (en) Scalable audio coding
CN103262161A (zh) 确定用于线性预测编码(lpc)系数量化的具有低复杂度的加权函数的设备和方法
TW200931397A (en) An encoder
CN102257567A (zh) 音响信号处理装置、音响编码装置及音响解码装置
CN103548080A (zh) 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CA2944927A1 (en) Apparatus and method for generating a plurality of spectral patterns
CN103403799A (zh) 用于针对合成统一语音和音频编解码器(usac)处理音频信号和提供较高时间粒度的设备和方法
CN104969291A (zh) 执行用于增益确定的滤波的系统及方法
JPH10149199A (ja) 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
Wang et al. Detection of speech tampering using sparse representations and spectral manipulations based information hiding
CN102460574A (zh) 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
Bhatt Simulation and overall comparative evaluation of performance between different techniques for high band feature extraction based on artificial bandwidth extension of speech over proposed global system for mobile full rate narrow band coder
CN100343895C (zh) 音频编码方法和装置,音频解码方法和装置
BRPI0906247B1 (pt) Equipamento e método para converter um sinal de áudio em uma representação parametrizada, equipamento e método para modificar uma representação parametrizada, equipamento e método para sintetizar uma representação parametrizada de um sinal de áudio

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180416

Address after: The 300456 Tianjin FTA test area (Dongjiang Bonded Port) No. 6865 North Road, 1-1-1802-7 financial and trade center of Asia

Patentee after: Xinji Lease (Tianjin) Co.,Ltd.

Address before: 201203 Shanghai city Zuchongzhi road Pudong New Area Zhangjiang hi tech park, Spreadtrum Center Building 1, Lane 2288

Patentee before: SPREADTRUM COMMUNICATIONS (SHANGHAI) Co.,Ltd.

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20101124

Assignee: SPREADTRUM COMMUNICATIONS (SHANGHAI) Co.,Ltd.

Assignor: Xinji Lease (Tianjin) Co.,Ltd.

Contract record no.: 2018990000196

Denomination of invention: Audio processing method and device thereof

Granted publication date: 20120606

License type: Exclusive License

Record date: 20180801

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221101

Address after: 201203 Shanghai city Zuchongzhi road Pudong New Area Zhangjiang hi tech park, Spreadtrum Center Building 1, Lane 2288

Patentee after: SPREADTRUM COMMUNICATIONS (SHANGHAI) Co.,Ltd.

Address before: 300456 1-1-1802-7, north area of financial and Trade Center, No. 6865, Asia Road, Tianjin pilot free trade zone (Dongjiang Bonded Port Area)

Patentee before: Xinji Lease (Tianjin) Co.,Ltd.