CN103165133A - 一种最大相关系数的优化方法及其装置 - Google Patents

一种最大相关系数的优化方法及其装置 Download PDF

Info

Publication number
CN103165133A
CN103165133A CN2011104153445A CN201110415344A CN103165133A CN 103165133 A CN103165133 A CN 103165133A CN 2011104153445 A CN2011104153445 A CN 2011104153445A CN 201110415344 A CN201110415344 A CN 201110415344A CN 103165133 A CN103165133 A CN 103165133A
Authority
CN
China
Prior art keywords
sampled point
product
current subframe
sampling points
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104153445A
Other languages
English (en)
Inventor
付宝玲
高超
李桂满
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leadcore Technology Co Ltd
Original Assignee
Leadcore Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leadcore Technology Co Ltd filed Critical Leadcore Technology Co Ltd
Priority to CN2011104153445A priority Critical patent/CN103165133A/zh
Publication of CN103165133A publication Critical patent/CN103165133A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例提供了一种最大相关系数的优化方法及其装置,针对语音压缩中相关系数计算的逐点进行乘累加的过程,本发明的方法包括:将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。本发明实施例是通过降低第一级粗化搜索的每次相关性计算过程中的求值点个数来降低N个采样点范围内的乘累加次数,从而降低运算量,达到性能优化的目的,即在语音质量允许的范围内通过损失一定的粗化搜索的精确度换取运算量较大的下降。

Description

一种最大相关系数的优化方法及其装置
技术领域
本发明涉及语音编解码领域,尤其涉及一种最大相关系数的优化方法及装置。
背景技术
码激励线性预测(CELP)由于其高效的编码效率和其较好的编码质量在窄带语音编码中得到了广泛应用,它利用线性预测提取声道参数,用一个包含许多典型激励矢量的码书作为激励参数,每次编码时都在这个码书中搜索一个矢量作为激励矢量,上述激励矢量包括两部分:一部分来自于过去的激励,即自适应码本;另一部分来自于更新的矢量,即固定码本,将上述激励矢量在码书中的序号编码传到解码端,解码端查表得到上述激励矢量然后通过合成滤波器合成语音。
通过对一些编码算法如增强型全速率(EFR)、自适应多速率(AMR)、国际电信联盟远程通信标准化组织(ITU-T)G729、ITU-T G723.1的研究和计算量统计,发现这些基于码激励线性预测编码(CELP)技术的编码器的运算量主要集中在LP系数到线谱对参数(LSP)系数的转换、自适应码本搜索和固定码本搜索三部分,而仅自适应码本搜索部分计算量就占了整个编码算法的约30%。通过对自适应码本搜索部分的算法进行分析,该部分中常采用了多级查询的方法,如:自适应码本搜索中基音延时搜索过程中应用该方法的基本原理是:首先按照一定的算法或者原则将查询的范围缩小到某一较小的区域内;然后再提高精度,缩小到更小的范围,在这个范围内再确定最终的值。
因为上述多级查询方法采用逐点计算,其运算量较大,这种音频处理的多级查询过程中的逐点计算的较大运算量影响了编解码的效率。
发明内容
本发明实施例提供了一种最大相关系数的优化方法及其装置,可以提高码激励线性预测编码技术的编码器的运算的效率。
本发明实施例提供了一种最大相关系数的优化方法,包括:
将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。
本发明实施例还提供了一种最大相关系数的优化装置,包括:
采样点获取单元,用于获取当前帧和前一帧的采样点;
计算单元,用于将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。
本发明实施例是通过降低第一级粗化搜索的每次相关性计算过程中的求值点个数来降低N个采样点范围内的乘累加次数,从而降低运算量,达到性能优化的目的,即在语音质量允许的范围内通过损失一定的粗化搜索的精确度换取运算量较大的下降。
附图说明
图1为本发明实施例中所提供方法的流程图;
图2为本发明实施例中算法修改前解码输出重构语音信号的时域仿真图;
图3为本发明实施例中算法修改后解码输出重构语音信号的时域仿真图;
图4为本发明实施例中算法修改前解码输出重构语音信号的频域仿真图;
图5为本发明实施例中算法修改后解码输出重构语音信号的频域仿真图。
具体实施方式
下面结合附图,对本发明实施例所提供的一种最大相关系数的优化方法进行详细的介绍。
现有的CELP过程中存在的自适应码本搜索算法的开环基音搜索过程中的第一级的算法公式为(以子帧长度N=80为例进行说明):
R ( k ) = Σ n = 0 n = 79 S w ( n ) S w ( n - k ) , k=18,......143;(公式一)
将上述公式分解如下:
R(18)=Sw(0)Sw(-18)+Sw(1)Sw(-17)+......+Sw(79)Sw(61)
R(19)=Sw(0)Sw(-19)+Sw(1)Sw(-18)+......+Sw(79)Sw(60)
……
R(143)=Sw(0)Sw(-143)+Sw(1)Sw(-142)+......+Sw(79)Sw(-64)
由公式(一)可见,每次相关性计算为当前子帧的80个采样点与前一帧或当前子帧的80个采样点逐点进行乘积,并将乘积的结果累加,每次计算进行80次乘和79次累加,因此完成全部的相关性计算总运算量为10080次乘和9954次累加。以8k采样率,20ms一帧为例,每帧分为两个子帧,因此每一帧乘累加过程需要加倍,因此现有的算法计算量较大,严重影响了音频编码的速率。
如图1所示,本发明实施例提供的一种最大相关系数的优化方法,包括:
102、将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,
104、并将乘积的结果进行求和,其中N为自然数。
在本发明的一个实施例中,所述N以取80为例进行说明。
其中,前一帧和当前帧的N个采样点是指在前一帧和当前帧中总共提取N个采样点。
在本发明的一个实施例中,如果N取80,则可以将累加次数从80次降低到40次,即每次相关性计算采用隔点乘累加代替原方案中的逐点乘累加的过程,改进后的粗化搜索计算表达式如下:
R ( k ) = Σ n = 0 n = 39 S w ( 2 n ) S w ( 2 n - k ) , k=18,......143;(公式2)
上述公式可以分解如下:
R(18)=Sw(0)Sw(-18)+Sw(2)Sw(-16)+......+Sw(78)Sw(60)
R(19)=Sw(0)Sw(-19)+Sw(2)Sw(-17)+......+Sw(78)Sw(59)
……
R(143)=Sw(0)Sw(-143)+Sw(2)Sw(-141)+......+Sw(78)Sw(-65)
在上述分解式中,Sw后面括号内是正数,表示是当前子帧的采样点,如果是负数,则表示当前子帧之前的子帧的采样点。也就是说,在公式(2)中,Sw(2n)Sw(2n-k)表示采样点的乘积,如果Sw(2n-k)中的2n-k小于0,则Sw(2n)Sw(2n-k)为当前子帧与当前子帧之前的子帧的采样点的乘积,其中,当前子帧之前的子帧既可能也在当前帧中,也可能在前一帧中(由2n-k的具体数值及子帧长度决定),如果Sw(2n-k)中的2n-k大于或等于0,则Sw(2n)Sw(2n-k)为当前子帧与当前子帧的采样点的乘积。
由公式(2)可见,每次相关性计算为当前子帧的80个采样点与当前子帧之前的子帧或当前子帧的80个采样点隔点进行乘积,并将乘积的结果累加,因此每次相关性计算为40次乘和39次累加,一个子帧的相关性计算完成需要进行5040次乘和4914次累加,较之原算法计算量下降约一半。
本发明实施例提供的方案和现有的方案相比,通过对上述改进前后开环基音搜索算法进行周期(cycles)数测试,结果显示,该段搜索算法运算量减少约50%,编码一帧运算量降低约7%。其仿真效果模拟图如图2至5所示,其中:
图2为本发明实施例中算法修改前解码输出重构语音信号的时域仿真图;图3为本发明实施例中算法修改后解码输出重构语音信号的时域仿真图;图4本发明实施例中算法修改前解码输出重构语音信号的频域仿真图;图5为本发明实施例中算法修改后解码输出重构语音信号的频域仿真图。
由上述解码输出重构语音信号的时域和频域对比上来看,可见,优化前后解码输出语音信号具有极其相似的语音特性。经主观视听,解码重构语音输出质量在优化前后无明显改变,均达到长话质量。
本发明实施例是通过降低第一级粗化搜索的每次相关性计算过程中的求值点个数来降低N个采样点范围内的乘累加次数,从而降低运算量,达到性能优化的目的,即在语音质量允许的范围内通过损失一定的粗化搜索的精确度换取运算量较大的下降。
本发明实施例还提供了一种最大相关系数的优化装置,包括:
采样点获取单元,用于获取当前帧和前一帧的采样点;
计算单元,用于将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。
其中,所述N的取值可以为80。
其中,所述计算单元根据公式k=18,......143,进行隔点乘积,并将乘积的结果进行求和;其中,R(k)表示乘积求和的结果,Sw(2n)Sw(2n-k)表示采样点的乘积。
本发明实施例所提供的装置实施例是和方法完全对应的,在本装置实施例中未详细描述的部分,可以参照装置实施例中的描述。
以上是本发明实施例一个较佳的实施方式而已,任何人在熟悉本领域技术的前提下,在不背离本发明的精神和不超出本发明涉及的技术范围的前提下,可以对本发明描述的细节作各种补充和修改。本发明的保护范围不限于实施例所列举的范围,本发明的保护范围以权利要求为准。

Claims (6)

1.一种最大相关系数的优化方法,其特征在于,包括:
将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。
2.如权利要求1所述的方法,其特征在于,所述N的取值为80。
3.如权利要求2所述的方法,其特征在于,所述采用隔点进行乘积,并将乘积的结果进行求和的步骤通过以下公式实现:
R ( k ) = Σ n = 0 n = 39 S w ( 2 n ) S w ( 2 n - k ) , k=18,......143,
其中R(k)表示乘积求和的结果,Sw(2n)Sw(2n-k)表示采样点的乘积。
4.一种最大相关系数的优化装置,其特征在于,包括:
采样点获取单元,用于获取当前帧和前一帧的采样点;
计算单元,用于将当前子帧的N个采样点与前一帧的N个采样点,或将当前子帧的N个采样点与前一帧和当前帧的N个采样点,或将当前子帧的N个采样点与当前帧的N个采样点,采用隔点进行乘积,并将乘积的结果进行求和,其中N为自然数。
5.如权利要求4所述的装置,其特征在于,所述N的取值为80。
6.如权利要求5所述的装置,其特征在于,所述计算单元根据公式
Figure FDA0000119510730000012
k=18,......143,进行隔点乘积,并将乘积的结果进行求和;其中,R(k)表示乘积求和的结果,Sw(2n)Sw(2n-k)表示采样点的乘积。
CN2011104153445A 2011-12-13 2011-12-13 一种最大相关系数的优化方法及其装置 Pending CN103165133A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104153445A CN103165133A (zh) 2011-12-13 2011-12-13 一种最大相关系数的优化方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104153445A CN103165133A (zh) 2011-12-13 2011-12-13 一种最大相关系数的优化方法及其装置

Publications (1)

Publication Number Publication Date
CN103165133A true CN103165133A (zh) 2013-06-19

Family

ID=48588157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104153445A Pending CN103165133A (zh) 2011-12-13 2011-12-13 一种最大相关系数的优化方法及其装置

Country Status (1)

Country Link
CN (1) CN103165133A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1165365A (zh) * 1996-02-01 1997-11-19 索尼公司 音调提取方法和装置
US20050015244A1 (en) * 2003-07-14 2005-01-20 Hideki Kitao Speech section detection apparatus
US20070174048A1 (en) * 2006-01-26 2007-07-26 Samsung Electronics Co., Ltd. Method and apparatus for detecting pitch by using spectral auto-correlation
CN101183526A (zh) * 2006-11-14 2008-05-21 中兴通讯股份有限公司 一种检测语音信号基音周期的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1165365A (zh) * 1996-02-01 1997-11-19 索尼公司 音调提取方法和装置
US20050015244A1 (en) * 2003-07-14 2005-01-20 Hideki Kitao Speech section detection apparatus
US20070174048A1 (en) * 2006-01-26 2007-07-26 Samsung Electronics Co., Ltd. Method and apparatus for detecting pitch by using spectral auto-correlation
CN101183526A (zh) * 2006-11-14 2008-05-21 中兴通讯股份有限公司 一种检测语音信号基音周期的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵萍: "语音信号的自相关基音周期检测", 《上海电力学院学报》 *

Similar Documents

Publication Publication Date Title
JP7160790B2 (ja) ハーモニックフィルタツールのハーモニック依存制御
EP2676264B1 (en) Audio encoder estimating background noise during active phases
US6182030B1 (en) Enhanced coding to improve coded communication signals
CA2556797C (en) Methods and devices for low-frequency emphasis during audio compression based on acelp/tcx
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
CN102341850B (zh) 语音编码
EP3373296A1 (en) Noise generation in audio codecs
GB2466673A (en) Manipulating signal spectrum and coding noise spectrums separately with different coefficients pre and post quantization
Valin et al. Improved noise weighting in CELP coding of speech-applying the Vorbis psychoacoustic model to Speex
KR101849613B1 (ko) 스피치 관련 스펙트럼 정형 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
KR101931273B1 (ko) 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
US20100332223A1 (en) Audio decoding device and power adjusting method
EP4276821A2 (en) Phase reconstruction in a speech decoder
CN103137133A (zh) 非激活音信号参数估计方法及舒适噪声产生方法及系统
AU669788B2 (en) Method for generating a spectral noise weighting filter for use in a speech coder
CN103918028A (zh) 基于自回归系数的有效表示的音频编码/解码
EP2866228B1 (en) Audio decoder comprising a background noise estimator
JP3558031B2 (ja) 音声復号化装置
CN104517614A (zh) 基于各子带特征参数值的清浊音判决装置及其判决方法
CN102812512B (zh) 处理音频信号的方法和装置
EP4273859A2 (en) Phase quantization in a speech encoder
CN103165133A (zh) 一种最大相关系数的优化方法及其装置
CN106935243A (zh) 一种基于melp的低比特数字语音矢量量化方法和系统
KR102008488B1 (ko) 편안한 잡음 생성 모드 선택을 위한 장치 및 방법
Stefanovic et al. A 2.4/1.2 kb/s speech coder with noise pre-processor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130619