CN104637486A - 一种数据帧的内插方法及装置 - Google Patents

一种数据帧的内插方法及装置 Download PDF

Info

Publication number
CN104637486A
CN104637486A CN201310552242.7A CN201310552242A CN104637486A CN 104637486 A CN104637486 A CN 104637486A CN 201310552242 A CN201310552242 A CN 201310552242A CN 104637486 A CN104637486 A CN 104637486A
Authority
CN
China
Prior art keywords
present frame
described present
subframe
spectral pair
pair parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310552242.7A
Other languages
English (en)
Other versions
CN104637486B (zh
Inventor
齐峰岩
苗磊
刘泽新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310552242.7A priority Critical patent/CN104637486B/zh
Publication of CN104637486A publication Critical patent/CN104637486A/zh
Application granted granted Critical
Publication of CN104637486B publication Critical patent/CN104637486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例提供的一种数据帧的内插方法及装置,涉及信号处理领域,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,提高编码质量及用户听觉感受。该方法包括:获取当前帧的谱倾斜因子;获取当前帧的第四子帧的频谱对参数;根据当前帧的谱倾斜因子以及当前帧的第四子帧的频谱对参数,获取当前帧的频谱对参数的内插系数;根据当前帧的频谱对参数的内插系数,当前帧的第四子帧的频谱对参数,以及存储的当前帧的前一帧的第四子帧的频谱对参数,内插出当前帧除第四子帧以外的各个子帧的频谱对参数。

Description

一种数据帧的内插方法及装置
技术领域
本发明涉及信号处理领域,尤其涉及一种数据帧的内插方法及装置。
背景技术
随着通信技术的日益发展,人们在采用宽带语音技术进行相互通信时,越来越关注宽带语音的质量,运营商们在近年来也在逐步推广宽带高清语音的相关应用。AMR-WB(Adaptive Multi-Rate Wideband,自适应多速率宽带编码)算法是宽带语音编码标准中的主要代表,该算法采用了ACELP(Algebraic Code Excited Linear Prediction,代数码激励线性预测)算法来编码宽带语音。
然而,在宽带语音编码器工作在低速率时,由于通信过程中所产生的宽带语音信息量较大,在对宽带语音信息中的摩擦音到浊音的过渡进行编码的过程中,经常会产生不连续的噪音,语音质量无法得到充分保障,严重影响了用户的听觉感受,现有技术并没有很好的解决方法。
发明内容
本发明的实施例提供一种数据帧的内插方法及装置,能够提高编码质量,提高用户的听觉感受。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种数据帧的内插方法,包括:
获取当前帧的谱倾斜因子;
获取当前帧的第四子帧的频谱对参数;
根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数;
根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
在第一方面的第一种可能的实现方式中,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
计算所述当前帧的谱倾斜因子的差分值;
使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数。
在第一方面的第二种可能的实现方式中,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
计算所述当前帧的第四子帧的频谱对参数的差分值;
使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
在第一方面的第三种可能的实现方式中,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
计算所述当前帧的第四子帧的频谱对参数的差分值;
计算所述当前帧的谱倾斜因子的差分值;
使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
结合前述的第一方面以及第一方面的第一种至第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述获取所述当前帧的频谱对参数的内插系数之前进一步包括:
计算所述当前帧的第四子帧的频谱对参数的差分和;
所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述当前帧的第四子帧的频谱对参数的差分和,获取所述当前帧的频谱对参数的内插系数。
结合前述的第一方面以及第一方面的第一种至第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述获取所述当前帧的频谱对参数的内插系数前进一步包括:
计算所述当前帧的谱倾斜因子的差分和;
所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述当前帧的谱倾斜因子的差分和,获取所述当前帧的频谱对参数的内插系数。
结合前述的第一方面以及第一方面的第一种至第五种可能的实现方式,在第一方面的第六种可能的实现方式中,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数前进一步包括:
获取所述当前帧的属性参数;
判断所述当前帧的属性参数是否满足预设条件;
若所述当前帧的属性参数满足预设条件时,则根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
在第一方面的第六种可能的实现方式中,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数;
其中,所述判断所述当前帧的属性参数是否满足预设条件具体为:
判断所述当前帧的编码速率是否小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值。
结合前述的第一方面以及第一方面的第一种至第六种可能的实现方式,在第一方面的第七种可能的实现方式中,所述获取当前帧的第四子帧的频谱对参数包括:
获取所述当前帧的线性预测参数;
将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
在第一方面的第七种可能的实现方式中,所述获取所述当前帧的线性预测参数具体为:
获取经过去噪滤波处理的当前帧的线性预测参数。
结合前述的第一方面以及第一方面的第一种至第七种可能的实现方式,在第一方面的第八种可能的实现方式中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数之前进一步包括:
对所述当前帧的第四子帧的频谱对参数进行量化;
其中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数具体为:
根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
结合前述的第一方面以及第一方面的第一种至第八种可能的实现方式,在第一方面的九种可能的实现方式中,所述获取当前帧的第四子帧的频谱对参数之后进一步包括:
存储所述当前帧的第四子帧的频谱对参数。
第二方面,本发明实施例提供一种数据帧的内插装置,包括:
第一获取单元,用于获取当前帧的谱倾斜因子;
第二获取单元,用于获取当前帧的第四子帧的频谱对参数;
处理单元,用于根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数;
内插单元,用于根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
在第二方面的第一种可能的实现方式中,所述处理单元包括:
第一计算单元,用于计算所述当前帧的谱倾斜因子的差分值;
第一执行单元,用于使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数。
在第二方面的第二种可能的实现方式中,所述处理单元包括:
第二计算单元,用于计算所述当前帧的第四子帧的频谱对参数的差分值;
第二执行单元,用于使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
在第二方面的第三种可能的实现方式中,所述处理单元包括:
第三计算单元,用于计算所述当前帧的第四子帧的频谱对参数的差分值,以及计算所述当前帧的谱倾斜因子的差分值;
第三执行单元,用于使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
结合前述的第二方面以及第二方面的第一种至第三种可能的实现方式,在第二方面的四种可能的实现方式中,所述装置还包括:
第四计算单元,用于计算所述当前帧的第四子帧的频谱对参数的差分和;
所述处理单元,具体用于根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述第四计算单元计算获得的当前帧的第四子帧的频谱对参数的差分和,获取所述当前帧的频谱对参数的内插系数。
结合前述的第二方面以及第二方面的第一种至第四种可能的实现方式,在第二方面的五种可能的实现方式中,所述装置还包括:
第五计算单元,用于计算所述当前帧的谱倾斜因子的差分和;
所述处理单元,具体用于根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述第五计算单元计算获得的当前帧的谱倾斜因子的差分和,获取所述当前帧的频谱对参数的内插系数。
结合前述的第二方面以及第二方面的第一种至第五种可能的实现方式,在第二方面的六种可能的实现方式中,所述装置还包括:
第三获取单元,用于获取所述当前帧的属性参数;
判断单元,用于判断所述当前帧的属性参数是否满足预设条件;若所述当前帧的属性参数满足预设条件时,则根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
在第二方面的六种可能的实现方式中,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数;
其中,所述判断所述当前帧的属性参数是否满足预设条件具体为:
判断所述当前帧的编码速率是否小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值。
结合前述的第二方面以及第二方面的第一种至第六种可能的实现方式,在第二方面的七种可能的实现方式中,所述第二获取单元包括:
第四获取单元,用于获取所述当前帧的线性预测参数;
转换单元,用于将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
在第二方面的七种可能的实现方式中,所述获取所述当前帧的线性预测参数具体为:
获取经过去噪滤波处理的当前帧的线性预测参数。
结合前述的第二方面以及第二方面的第一种至第七种可能的实现方式,在第二方面的八种可能的实现方式中,所述装置还包括:
量化单元,用于对所述当前帧的第四子帧的频谱对参数进行量化;
其中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数具体为:
根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
结合前述的第二方面以及第二方面的第一种至第八种可能的实现方式,在第二方面的九种可能的实现方式中,所述装置还包括:
存储单元,用于存储所述当前帧的第四子帧的频谱对参数。
本发明实施例提供的一种数据帧的内插方法及装置,通过获取当前帧的谱倾斜因子,以及当前帧的第四子帧的频谱对参数,得到所述当前帧的频谱对参数的内插系数,进一步根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。通过该方案,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,这样,在当某一帧内包括清浊过渡时,得到与实际原始谱较为匹配的频谱,减少了现有技术在编码过程中造成信号失真的情况,进而提高语音通话质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一的数据帧的内插方法流程示意图一;
图2为本发明实施例一的数据帧及数据子帧的划分示意图;
图3为本发明实施例二的数据帧的内插方法流程示意图二;
图4为本发明实施例二中线性预测合成滤波器的原理示意图;
图5为本发明实施例二中线性预测分析滤波器的原理示意图;
图6为现有技术的内插方法流程示意图;
图7为本发明实施例三的数据帧的内插方法流程示意图三;
图8为本发明实施例的数据帧的内插装置示意图一;
图9为本发明实施例的数据帧的内插装置示意图二;
图10为本发明实施例的数据帧的内插装置示意图三;
图11为本发明实施例的数据帧的内插装置示意图四;
图12为本发明实施例的数据帧的内插装置示意图五;
图13为本发明实施例的数据帧的内插装置示意图六;
图14为本发明实施例的数据帧的内插装置示意图七;
图15为本发明实施例的数据帧的内插装置示意图八;
图16为本发明实施例的数据帧的内插装置示意图九;
图17为本发明实施例的数据帧的内插装置示意图十;
图18为本发明实施例的数据帧的内插装置的硬件示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
实施例一
本发明实施例提供一种数据帧的内插方法,如图1所示,包括:
101、数据帧的内插装置获取当前帧的谱倾斜因子。
其中,上述的数据帧的内插装置可以通过硬件实现,也可以通过软件实现。在数据帧的内插装置通过硬件实现时,可以包括至少一个处理器,该数据帧的内插装置在该至少一个处理器的控制下工作。
进一步地,谱倾斜因子是表示信号频谱从低频到高频能量变化趋势的一个参数。另外,谱倾斜因子的个数是根据当前帧的子帧的个数而定的,本发明优选的方案是求得当前帧的四个子帧的四个谱倾斜因子,显然此处谱倾斜因子的个数可以为一个、两个、三个或任意个。
其中,谱倾斜因子的计算方法有很多种,而且不同的计算方法得到的取值范围不尽相同,这里我们列出两种计算谱倾斜因子的方法,应该指出的是其他类似算法应该包含在本方案中,不限于此。
第一种方法为:
计算 γ = E a - E c E a + E c ,
其中,Ea为子帧内的自适应码书贡献的能量,Ec为子帧内的代数码书贡献的能量。
具体的:
E a = Σ i = 0 L ( g a * exc [ i ] ) * ( g a * exc [ i ] ) , E c = Σ i = 0 L ( g c * code [ i ] ) * ( g c * code [ i ] )
谱倾斜因子为:tilt=0.25*(1+γ),此时,0表示清音,0.5表示浊音。
第二种方法为:
计算 r 0 = Σ i = 0 L ( sp [ i ] ) * ( sp [ i ] )
r 1 = &Sigma; i = 2 L | sp [ i ] - sp [ i - 1 ] | ( sp [ i ] - sp [ i - 1 ] ) * ( sp [ i - 1 ] - sp [ i - 2 ] ) < 0
其中,L表示帧长,sp[i]表示输入信号。
谱倾斜因子为:此时,值越大表示信号越具有清音特性,值越小表示信号浊音特性越强。
至此,数据帧的内插装置采用上述公式,获取当前帧的谱倾斜因子。
102、数据帧的内插装置获取当前帧的第四子帧的频谱对参数。
其中,所述当前帧的第四子帧的频谱对参数可以为当前帧的第四子帧的ISP(Immittance Spectral Pairs,导抗频谱对)参数或者当前帧的第四子帧的LSP(Linear Spectral Pairs,线谱对)参数。
为了方便理解,在此对数据帧的内插过程中关于当前帧以及当前帧的子帧做简要介绍,如图2所示,在分析当前数据帧时,首先选取一个规定时间单位长度(例如30ms)的非对称分析窗,然后在该分析窗内获得当前数据帧,并且将当前数据帧划分为几个数据子帧,本发明的实施例中假设当前数据帧包括4个子帧,接着通过对当前数据帧的进行线性预测分析,获取所述当前帧的一组线性预测LP(Linerprediction,线性预测)系数,将这一组LP系数进行转换后得到的参数默认为所述当前帧的第四子帧的频谱对参数,进而根据预先存储的前一帧的第四子帧的频谱对参数以及所述当前帧的第四子帧的频谱对参数,利用内插公式进行内插得到当前帧除第四子帧以外的各个子帧的频谱对参数。至此,数据帧的内插装置得到了包括当前帧的第四子帧的频谱对参数在内的当前帧的各个子帧的频谱对参数,完成了数据帧的内插任务。
具体的,获取当前帧的第四子帧的频谱对参数的具体方法和步骤将在下面的实施例中详细阐述,故此处不再赘述。
需要说明的是,步骤101与步骤102是并列关系,不存在时间上的逻辑关系。
103、数据帧的内插装置根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
进一步的,数据帧的内插装置获取所述当前帧的频谱对参数的内插系数之前,根据已经获得的所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,分别计算得到所述当前帧的谱倾斜因子的差分和以及所述当前帧的第四子帧的频谱对参数的差分和,以使得数据帧的内插装置在获取所述当前帧的频谱对参数的内插系数时,进一步根据上述条件获得所述当前帧的频谱对参数的内插系数。
具体的,数据帧的内插装置根据所述当前帧的谱倾斜因子及谱倾斜因子的差分值及所述当前帧的第四子帧的ISP参数或LSP参数的差分值中的任意一个或几个的组合自适应获取所述当前帧的频谱对参数的内插系数。例如,数据帧的内插装置使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数;或者,使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数;或者,使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
其中,关于数据帧的内插装置根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数的具体步骤,在后面实施例中有详细阐述,故此处不再赘述。
104、数据帧的内插装置根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
其中,现有技术在内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数时采用的是固定系数,内插公式如下:
q ^ 1 ( n ) = 0.55 q ^ 4 ( n - 1 ) + 0.45 q ^ 4 ( n )
q ^ 2 ( n ) = 0 . 2 q ^ 4 ( n - 1 ) + 0 . 8 q ^ 4 ( n )
q ^ 3 ( n ) = 0.04 q ^ 4 ( n - 1 ) + 0.96 q ^ 4 ( n )
在上述内插公式中,0.55、0.45、0.2、0.8、0.04、0.96即为固定的内插系数。
为当前帧内插出的前三个子帧的频谱对参数,分别为前一帧和当前帧计算出的频谱对参数,作为前一帧和当前帧的第四子帧的频谱对参数,由此可以看出四个子帧的线性固定内插系数分别为:0.45,0.8,0.96和1,对于大多数情况(都是浊音或都是清音),共振峰频谱缓慢线性渐变,所以这种线性内插是比较合理的。
然而,在一帧内包括清浊过渡时,内插出的结果和原始的就会有较大出入,利用固定的内插系数得到的是一种平缓渐变过渡的内插结果,但实际上这种过渡是在某一时刻发生突变的,所以在过渡帧的某些子帧内插得到的结果与实际原始谱并不匹配,在比特率比较低时编码就会严重失真,产生不连续的噪声。
进而,采用本发明实施例所提出的数据帧的内插方法,可以精细判断清浊音过渡位置,自适应求得相应内插系数,使得内插得到的每个子帧的频谱对参数更加匹配原始频谱,可以提高ACELP后续相关算法的准确性,从而消除噪声,提高最终的编码质量。
本发明实施例提供的一种数据帧的内插方法,通过获取当前帧的谱倾斜因子,以及当前帧的第四子帧的频谱对参数,得到所述当前帧的频谱对参数的内插系数,进一步根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。通过该方案,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,这样,在当某一帧内包括清浊过渡时,得到与实际原始谱较为匹配的频谱,减少了现有技术在编码过程中造成信号失真的情况,进而提高语音通话质量。
实施例二
本发明实施例提供一种数据帧的内插方法,如图3所示,包括:
201、数据帧的内插装置对当前帧进行去噪和滤波操作。
202、数据帧的内插装置获取所述当前帧的线性预测参数。
具体的,在获得去噪滤波后的当前帧后,数据帧的内插装置对当前帧进行线性预测分析,获取所述当前帧的一组线性预测LP(Linerprediction,线性预测)系数,用于计算获得所述当前帧的第四子帧的频谱对参数。
其中,线性预测分析是是主要用于音频信号处理与语音处理中根据线性预测模型的信息用压缩形式表示数字语音信号谱包络的工具。它是最有效的语音分析技术之一,也是低位速下编码方法高质量语音最有用的方法之一,它能够提供非常精确的语音参数预测。
线性预测分析获取LP系数的基本思想是:一个语音取样的现在值可以用若干个语音取样过去值的加权线性组合来逼近。在线性组合中的加权系数称为预测器系数。通过使实际语音抽样和线性预测抽样之间差值的平方和达到最小值,能够决定唯一的一组预测器系数。
示例性的,下面我们给出具体获取所述当前帧的一组线性预测LP(Liner prediction,线性预测)系数的原理:
首先,语音信号的产生过程可以看成是声门激励信号激励声道模型的过程,如图4所示,该过程在线性预测分析中可以等效为线性预测残差信号激励时变线性滤波器的过程。
其中是一个p阶的全极点滤波器,因为用来合成语音,通常被称为线性预测合成滤波器,其系数{ai}i=1,2,...,p即为LP系数。如果阶数p的值足够大,线性预测合成滤波器可以以任意小的误差逼近声道模型,其幅频响应能很好地匹配输入语音信号的幅度谱包络,即滤波器的谐振频率与语音信号共振峰的位置相匹配。
在上述原理的基础上,本发明实施例中所述的线性预测分析过程为线性预测合成滤波器的逆过程,如图5所示,它将输入语音信号转换为LP系数与残差信号。
从图4与图5中可以看出输入语音s(n)与残差信号e(n)之间有如下关系:
e ( n ) = s ( n ) - &Sigma; i = 1 p a i s ( n - i ) - - - ( 2 - 1 )
s ( n ) = &Sigma; i = 1 p a i s ( n - i ) + e ( n ) - - - ( 2 - 2 )
若令则式(2-1)可以写成
e ( n ) = s ( n ) - s ~ ( n ) = s ( n ) - &Sigma; i = 1 p a i s ( n - i ) - - - ( 2 - 3 )
可见,是由与s(n)邻近的过去p个值线性组合得到的,即由s(n)过去的值来预测或估计当前值,故称之为线性预测值。残差信号e(n)就是原始信号s(n)和预测信号之差。
进一步地,线性预测分析实质上就是设计一个线性预测分析滤波器A(z),即求解{ai}i=1,2,...,p使得残差信号e(n)在某个预定的准则下最小。这个准则通常采用最小均方误差准则,即使E[e2(n)]最小。根据式(2-3)可以得到
E [ e 2 ( n ) ] = E [ [ s ( n ) - &Sigma; i = 1 p a i s ( n - i ) ] 2 ] - - - ( 2 - 4 )
为使E[e2(n)]最小,各系数aj应满足E[e2(n)]对aj的偏微分为0,即 &PartialD; E [ e 2 ( n ) ] &PartialD; a j = 0 , ( 1 &le; j &le; p ) - - - ( 2 - 5 )
进而得到 &PartialD; E [ e 2 ( n ) ] &PartialD; a j = - 2 E [ e ( n ) s ( n - j ) ] = 0 - - - ( 2 - 6 )
将e(n)代入上式可得
E [ s ( n ) s ( n - j ) - &Sigma; i = 1 p a i s ( n - i ) s ( n - j ) ] = r ( j ) - &Sigma; i = 1 p a i r ( j - i ) = 0 , ( 1 &le; j &le; p ) - - - ( 2 - 7 )
其中,r(j)=E[s(n)s(n-j)]是s(n)的自相关序列。将式(2-7)写成矩阵形式为:
r-Ra=0               (2-8)
这里自相关矢量r、自相关矩阵R和参数矢量a分别为:
r ( 1 ) r ( 2 ) &CenterDot; &CenterDot; &CenterDot; r ( p ) , R = r ( 0 ) r ( 1 ) &CenterDot; &CenterDot; &CenterDot; r ( p - 1 ) r ( 1 ) r ( 0 ) &CenterDot; &CenterDot; &CenterDot; r ( p - 2 ) &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; r ( p - 1 ) r ( p - 2 ) &CenterDot; &CenterDot; &CenterDot; r ( 0 ) . a = a 1 a 2 &CenterDot; &CenterDot; &CenterDot; a p
式(2-8)称为Yule-Walker方程,求解该方程可以得到p个LP系数aj
至此,数据帧的内插装置采用上述原理及公式,对当前帧进行线性预测分析,获取所述当前帧的一组线性预测系数即LP系数。
203、数据帧的内插装置将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
具体的,数据帧的内插装置将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数,即将数据帧的内插装置获取所述当前帧的线性预测参数(LP系数)转换为所述当前帧的第四子帧的频谱对参数,其中,所述当前帧的第四子帧的频谱对参数可以为当前帧的第四子帧的ISP参数或者当前帧的第四子帧的LSP参数。示例性的,以LP系数转换为当前帧的第四子帧的ISP参数为例,具体的算法如下:
以16阶线性预测器为例,ISP参数就是下面这组多项式的根:
f′1(z)=A(z)+z-16A(z-1)
f′2(z)=A(z)-z-16A(z-1)
多项式f′1(z)和f′2(z)分别为对称和反对称多项式。可以证明,它们的根在单位圆上,而且相互交替出现。其中f′2(z)一定有两个根分别为z=1(ω=0)和z=-1(ω=π)。为了消除这两个根,我们定义了两个新的多项式记作f1(z)和f2(z):
f1(z)=f′1(z)
f2(z)=f′2(z)/(1-z-2).
多项式f1(z)和f2(z)分别有8和7个共轭复根在单位圆上 ( e &PlusMinus; j&omega; i ) .
可以由下面的式子表示:
F 1 ( z ) = ( 1 + a [ 16 ] ) &Pi; i = 0,2 , . . . , 14 ( 1 - 2 q i z - 1 + z - 2 )
F 2 ( z ) = ( 1 + a [ 16 ] ) &Pi; i = 1 , 3 , . . . , 13 ( 1 - 2 q i z - 1 + z - 2 )
其中,qi=cos(ωi),ωi就是电导频率参数(ISF),a[16]是最后一阶线性预测系数。ISF参数满足顺序特性,即0<ω12<…<ω16<π。而qi是ISF参数在余弦域的表示。
由于多项式f1(z)和f2(z)均为对称多项式,分别有8个和7个系数。另外需要计算最后一阶线性预测系数。
要想求解ISP系数,先由下列递推关系得到:
for i=0to7
f1(i)=ai+am-i
f2(i)=ai-am-i+f2(i-2)
f1(8)=2a8
其中m=16为预测器阶数,f2(-2)=f2(-1)=0。
ISP系数的求解过程是将0-π之间均分为100个点,以这100个点的频率值代入f1(i)和f2(i),检查它们的符号变化。如果有符号变化,表示在这两点之间有根。然后在符号变化的两点之间再均分2份,将这三个点的频率值代入F1(z)和F2(z),符号变化的点即为所求的解。用Chebyshev(切比雪夫)多项式来估计F1(z)和F2(z)的值。用这种方法可以直接找到余弦域的根{qi}。当z=e时,多项式F1(z)和F2(z)可以写成:
F1(ω)=2e-j8ωC1(x)和F2(ω)=2e-j7ωC2(x)
其中,
C 1 ( x ) = &Sigma; i = 0 7 f 1 ( i ) T 8 - i ( x ) + f 1 ( 8 ) / 2 , C 2 ( x ) = &Sigma; i = 0 6 f 2 ( i ) T 8 - i ( x ) + f 2 ( 7 ) / 2
这里,Tm(ω)=cos(mω)是m阶Chebyshev多项式,f(i)为多项式F1(z)或F2(z)的系数,由上述递推关系得到。当x=cos(ω)时,多项式C(x)的递推关系如下:
fork=nf-1downto1
bk=2xbk+1-bk+2+f(nf-k)
end
C(x)=xb1-b2+f(nf)/2
其中,在C1(x)中nf=8,在C2(x)中nf=7。初始值bnf=f(0),bnf+1=0。其中,Chebyshev多项式的值在-2.0与2.0之间。
至此,数据帧的内插装置采用上述原理及公式,将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
204、数据帧的内插装置存储所述当前帧的第四子帧的频谱对参数。
具体的,在获取当前帧的第四子帧的频谱对参数之后,数据帧的内插装置存储所述当前帧的第四子帧的频谱对参数,用于获取下一帧的频谱对参数的内插系数。
在本发明实施例中,所述的存储的所述当前帧的前一帧的第四子帧的频谱对参数即为在上一数据帧的内插操作中数据帧的内插装置所存储的第四子帧的频谱对参数。
205、数据帧的内插装置获取所述当前帧的属性参数。
其中,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数。
具体的,所述话音激活检测标记的获得是由话音激活检测标记算法实现的。本领域技术人员可知的,话音激活检测标记算法是用部分语音编码参数和/或子带电平等估计得到的信息,来检测当前帧帧是语音还是非语音,进而得到话音激活检测标记,从而标识当前帧是语音帧或非语音帧。
所述当前帧的预测残差能量的获得是通过计算自相关参数后进行预测,或通过计算残差信号的均方和得到的,预测残差能量用于表示残差信号的能量大小。
所述摩擦音的帧数就是判断该数据帧是不是摩擦音,如果是则摩擦音帧数就加1,否则就减1。
具体的,摩擦音帧数的获得是通过已经获得的每帧四个子帧的倾斜因子(tilt_factor)求得它们的和(frame_tilt_sun)。其中,具体公式可以为:
frame _ tilt _ sum = &Sigma; i = 0 3 tilt _ factor [ i ]
进一步地,根据已经获得的每帧四个子帧的倾斜因子的和(frame_tilt_sum),判断此帧是否为摩擦音,若frame_tilt_sum大于给定的阈值,则该数据帧为摩擦音,摩擦音帧数就加1,若frame_tilt_sum小于给定的阈值,则该数据帧不是摩擦音,摩擦音帧数就减1。
206、数据帧的内插装置判断所述当前帧的属性参数是否满足预设条件。
其中,数据帧的内插装置判断所述当前帧的属性参数是否满足预设条件,即是在判断是否需要对内插系数进行调整。
具体地,所述判断当前帧的话音激活检测标记、预测残差能量以及摩擦音个数满足预设条件,具体可以包括:
若所述当前帧的编码速率小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值时,才调整内插系数,否则采用初始设定的内插系数。
示例性的,若所述当前帧的编码速率为5.0,所述预设编码速率阈值为8.2,所述当前帧的话音激活检测标记指示所述当前帧为语音帧,所述当前帧的预测残存能量为10.3并且大于预设残差能量阈值8.0,并且且所述当前帧的摩擦音帧数5.0大于预设摩擦音帧数阈值4.0时,可以判断当前帧的属性参数满足预设条件,即说明当前数据帧在进行内插时需要改变内插系数,进而获得更加匹配的所述当前帧除第四子帧以外的各个子帧的频谱对参数,减少在编码过程中造成的信号失真问题。
207、数据帧的内插装置获取所述当前帧的第四子帧的频谱对参数的差分值以及所述谱倾斜因子的差分值,并分别计算得到所述当前帧的第四子帧的频谱对参数的差分和以及所述谱倾斜因子的差分和。
具体地,计算所述谱倾斜因子的差分值(tilt_factor_diff)的方法为:
tilt_factor_diff[i]=tilt_factor[i+1]-tilt_factor[i],i=0,1,2
计算所述当前帧的第四子帧的频谱对参数的差分值(isp_diff)的方法为:
isp_diff[i]=isp_new[i]-isp_old[i],i=0,1,2...P
其中isp_new[i]为所述当前帧第四子帧的ISP参数或LSP参数,isp_old[i]为预先存储的所述当前帧的前一帧的第四子帧的ISP参数或LSP参数,P为ISP参数或LSP参数的阶数。
进一步地,根据所述谱倾斜因子的差分值计算所述谱倾斜因子的差分和(tilt_diff_sum)的具体方法为:
tilt _ diff _ sum = &Sigma; i = 0 2 fabs ( tilt _ factor [ i ] - tilt _ factor [ i + 1 ] )
进一步地,根据所述当前帧的第四子帧的频谱对参数的差分值计算所述当前帧的第四子帧的频谱对参数的差分和(isp_diff_sum)的具体方法为:
isp _ diff _ sum = &Sigma; i = 0 P fabs ( isp _ new [ i ] - isp _ old [ i ] )
其中,isp_new为所述当前帧的第四子帧的ISP参数或LSP参数,isp_old为所述预先存储的当前帧的前一帧的第四子帧的ISP参数或LSP参数,P为频谱对参数的阶数。
208、数据帧的内插装置根据所述当前帧的第四子帧的频谱对参数的差分值、所述谱倾斜因子的差分值、所述当前帧的第四子帧的频谱对参数的差分和以及所述谱倾斜因子的差分和,自适应获取所述当前帧的频谱对参数的内插系数。
具体的,数据帧的内插装置根据所述当前帧的谱倾斜因子及谱倾斜因子的差分值及所述当前帧的第四子帧的ISP参数或LSP参数的差分值中的任意一个或几个的组合自适应获取所述当前帧的频谱对参数的内插系数。例如,数据帧的内插装置使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数;或者,使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数;或者,使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
209、数据帧的内插装置根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
其中,现有技术在内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数时采用的是固定系数,内插公式如下:
q ^ 1 ( n ) = 0.55 q ^ 4 ( n - 1 ) + 0.45 q ^ 4 ( n )
q ^ 2 ( n ) = 0 . 2 q ^ 4 ( n - 1 ) + 0 . 8 q ^ 4 ( n )
q ^ 3 ( n ) = 0.04 q ^ 4 ( n - 1 ) + 0.96 q ^ 4 ( n )
在上述内插公式中,0.55、0.45、0.2、0.8、0.04、0.96即为固定的内插系数。
为当前帧内插出的前三个子帧的频谱对参数,分别为前一帧和当前帧计算出的频谱对参数,作为前一帧和当前帧的第四子帧的频谱对参数,由此可以看出四个子帧的线性固定内插系数分别为:0.45,0.8,0.96和1,对于大多数情况(都是浊音或都是清音),共振峰频谱缓慢线性渐变,所以这种线性内插是比较合理的。
然而,在一帧内包括清浊过渡时,内插出的结果和原始的就会有较大出入,利用固定的内插系数得到的是一种平缓渐变过渡的内插结果,但实际上这种过渡是在某一时刻发生突变的,所以在过渡帧的某些子帧内插得到的结果与实际原始谱并不匹配,在比特率比较低时编码就会严重失真,产生不连续的噪声。
进而,采用本发明实施例所提出的数据帧的内插方法,可以精细判断清浊音过渡位置,自适应求得相应内插系数,使得内插得到的每个子帧的频谱对参数更加匹配原始频谱,可以提高ACELP后续相关算法的准确性,从而消除噪声,提高最终的编码质量。
如图6所示,若本发明实施例的数据帧的内插方法还需为ACELP后续算法提供相关参数,则所述方法还可以包括步骤301-303:
301、数据帧的内插装置量化所述当前帧的第四子帧的频谱对参数。
302、数据帧的内插装置根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
303、数据帧的内插装置将所述当前帧的线性预测参数以及两次内插出的所述当前帧除第四子帧以外的各个子帧的频谱对参数送入ACELP后续算法模块进行后续计算。
本发明实施例提供的一种数据帧的内插方法,通过获取当前帧的谱倾斜因子,以及当前帧的第四子帧的频谱对参数,得到所述当前帧的频谱对参数的内插系数,进一步根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。通过该方案,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,这样,在当某一帧内包括清浊过渡时,得到与实际原始谱较为匹配的频谱,减少了现有技术在编码过程中造成信号失真的情况,进而提高语音通话质量。
实施例三
本发明实施例提供一种数据帧的内插方法,如图7所示,包括:
401、数据帧的内插装置获取当前帧的谱倾斜因子。
其中,上述的数据帧的内插装置可以通过硬件实现,也可以通过软件实现。在数据帧的内插装置通过硬件实现时,可以包括至少一个处理器,该数据帧的内插装置在该至少一个处理器的控制下工作。
进一步地,谱倾斜因子是表示信号频谱从低频到高频能量变化趋势的一个参数。另外,谱倾斜因子的个数是根据当前帧的子帧的个数而定的,本发明优选的方案是求得当前帧的四个子帧的四个谱倾斜因子,显然此处谱倾斜因子的个数可以为一个、两个、三个或任意个。
其中,谱倾斜因子的计算方法有很多种,而且不同的计算方法得到的取值范围不尽相同,这里我们列出两种计算谱倾斜因子的方法,应该指出的是其他类似算法应该包含在本方案中,不限于此。
第一种方法为:
计算 &gamma; = E a - E c E a + E c ,
其中,Ea为子帧内的自适应码书贡献的能量,Ec为子帧内的代数码书贡献的能量。
具体的:
E a = &Sigma; i = 0 L ( g a * exc [ i ] ) * ( g a * exc [ i ] ) , E c = &Sigma; i = 0 L ( g c * code [ i ] ) * ( g c * code [ i ] )
谱倾斜因子为:tilt=0.25*(1+γ),此时,0表示清音,0.5表示浊音。
第二种方法为:
计算 r 0 = &Sigma; i = 0 L ( sp [ i ] ) * ( sp [ i ] )
r 1 = &Sigma; i = 2 L | sp [ i ] - sp [ i - 1 ] | ( sp [ i ] - sp [ i - 1 ] ) * ( sp [ i - 1 ] - sp [ i - 2 ] ) < 0
其中,L表示帧长,sp[i]表示输入信号。
谱倾斜因子为:此时,值越大表示信号越具有清音特性,值越小表示信号浊音特性越强。
至此,数据帧的内插装置采用上述公式,获取当前帧的谱倾斜因子。
402、数据帧的内插装置获取当前帧的第四子帧的频谱对参数。
其中,所述当前帧的第四子帧的频谱对参数可以为当前帧的第四子帧的ISP(Immittance Spectral Pairs,导抗频谱对)参数或者当前帧的第四子帧的LSP(Linear Spectral Pairs,线谱对)参数。
具体的,数据帧的内插装置首先获取所述当前帧的线性预测参数。进一步地,数据帧的内插装置将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
其中,获取所述当前帧的线性预测参数的具体方法,以及将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数的具体方法,已经在上述实施例中详细阐述,故此处不再赘述。
需要说明的是,步骤401与步骤402是并列关系,不存在时间上的逻辑关系。
403、数据帧的内插装置获取当前帧的频谱对参数的内插系数。
具体的,在本发明的一个实施例中,数据帧的内插装置在获取当前帧的频谱对参数的内插系数时,可以直接根据当前帧的第四子帧的频谱对参数获取当前帧的频谱对参数的内插系数。
进一步可选的,在本发明的另一个实施例中,数据帧的内插装置可以先根据当前帧的第四子帧的频谱对参数获取当前帧的第四子帧的频谱对参数的差分值,再根据当前帧的第四子帧的频谱对参数的差分值获取当前帧的频谱对参数的内插系数。
进一步可选的,在本发明的另一个实施例中,数据帧的内插装置可以先获取当前帧的谱倾斜因子,再根据当前帧的谱倾斜因子获取当前帧的频谱对参数的内插系数。
进一步可选的,在本发明的另一个实施例中,数据帧的内插装置可以先根据当前帧的谱倾斜因子获取当前帧的谱倾斜因子的差分值,再根据当前帧的谱倾斜因子的差分值获取当前帧的频谱对参数的内插系数。
进一步可选的,在本发明的另一个实施例中,数据帧的内插装置可以先根据已经获取的当前帧的谱倾斜因子的差分值以及当前帧的第四子帧的频谱对参数的差分值,分别计算得到当前帧的谱倾斜因子的差分和以及当前帧的第四子帧的频谱对参数的差分和,进而在获取当前帧的频谱对参数的内插系数时,可以根据当前帧的谱倾斜因子的差分和以及当前帧的第四子帧的频谱对参数的差分和确定当前帧的频谱对参数的内插系数。
因此,在本发明的实施例中,可以根据当前帧的第四子帧的频谱对参数,当前帧的第四子帧的频谱对参数的差分值,当前帧的谱倾斜因子和当前帧的谱倾斜因子中的一个或任意组合来获取当前帧的频谱对参数的内插系数。
为了更加清楚的阐述本发明的步骤方法,下面我们示例性的列出获得当前帧的频谱对参数的内插系数的部分程序段:
if(话音激活检测标记==1&&预测残差能量>2000000&&摩擦音帧数>=2)
{
计算lp_diff_sum;(线谱频率参数IPS的差分和)
计算tilt_factor[];(谱倾斜因子(有4个,每个子帧一个))
计算tilt_factor_diff[]和tilt_diff_sum(谱倾斜因子的差分及差分);
//interpol_isp_amr_wb_opt(这个参数就是一个存放内插系数的表格,不同的条件选择不同的表中的值);
从上述节选的关于获取所述当前帧的频谱对参数的内插系数的程序段可以看出,计算当前帧的频谱对参数的内插系数是根据由一个或者多个判断参数的阈值判断完成的,本发明所提出的技术方法,并不限制判断参数的类型,可以是当前帧的第四子帧的频谱对参数、或者当前帧的第四子帧的频谱对参数的差分值、或者当前帧的谱倾斜因子、或者当前帧的谱倾斜因子的差分值、或者上述参数类型的任意组合来获取当前帧的频谱对参数的内插系数。
进一步地,本发明所提出的技术方法,并不限制获取当前帧的频谱对参数的内插系数时所用的具体阈值,例如,上述程序中“tilt_factor[0]>tilt_factor[3]&&lp_diff_sum>1.62”可以为“tilt_factor[0]>tilt_factor[3]&&lp_diff_sum>2.08”等等,具体的阈值选择由本领域的技术人员根据具体运用场景进行设定。
至此,数据帧的内插装置采用上述原理以及公式,获取当前帧的频谱对参数的内插系数。
404、数据帧的内插装置根据当前帧的频谱对参数的内插系数,当前帧的第四子帧的频谱对参数,以及存储的当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
其中,现有技术在内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数时采用的是固定系数,内插公式如下:
q ^ 1 ( n ) = 0 . 2 q ^ 4 ( n - 1 ) + 0 . 8 q ^ 4 ( n )
q ^ 2 ( n ) = 0 . 2 q ^ 4 ( n - 1 ) + 0 . 8 q ^ 4 ( n )
q ^ 3 ( n ) = 0.04 q ^ 4 ( n - 1 ) + 0.96 q ^ 4 ( n )
在上述内插公式中,0.55、0.45、0.2、0.8、0.04、0.96即为固定的内插系数。
为当前帧内插出的前三个子帧的频谱对参数,分别为前一帧和当前帧计算出的频谱对参数,作为前一帧和当前帧的第四子帧的频谱对参数,由此可以看出四个子帧的线性固定内插系数分别为:0.45,0.8,0.96和1,对于大多数情况(都是浊音或都是清音),共振峰频谱缓慢线性渐变,所以这种线性内插是比较合理的。
然而,在一帧内包括清浊过渡时,内插出的结果和原始的就会有较大出入,利用固定的内插系数得到的是一种平缓渐变过渡的内插结果,但实际上这种过渡是在某一时刻发生突变的,所以在过渡帧的某些子帧内插得到的结果与实际原始谱并不匹配,在比特率比较低时编码就会严重失真,产生不连续的噪声。
进而,采用本发明实施例所提出的数据帧的内插方法,可以精细判断清浊音过渡位置,自适应求得相应内插系数,使得内插得到的每个子帧的频谱对参数更加匹配原始频谱,可以提高ACELP后续相关算法的准确性,从而消除噪声,提高最终的编码质量。
本发明实施例提供的一种数据帧的内插方法,通过获取当前帧的谱倾斜因子,以及当前帧的第四子帧的频谱对参数,得到所述当前帧的频谱对参数的内插系数,进一步根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。通过该方案,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,这样,在当某一帧内包括清浊过渡时,得到与实际原始谱较为匹配的频谱,减少了现有技术在编码过程中造成信号失真的情况,进而提高语音通话质量。
实施例四
本发明实施例提供一种数据帧的内插装置,如图8所示,包括:
第一获取单元01,用于获取当前帧的谱倾斜因子;
第二获取单元02,用于获取当前帧的第四子帧的频谱对参数;
处理单元03,用于根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数;
内插单元04,用于根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
进一步地,如图9所示,所述处理单元03包括:
第一计算单元05,用于计算所述当前帧的谱倾斜因子的差分值;
第一执行单元06,用于使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数。
进一步地,如图10所示,所述处理单元03包括:
第二计算单元07,用于计算所述当前帧的第四子帧的频谱对参数的差分值;
第二执行单元08,用于使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
进一步地,如图11所示,所述处理单元03包括:
第三计算单元09,用于计算所述当前帧的第四子帧的频谱对参数的差分值,以及计算所述当前帧的谱倾斜因子的差分值;
第三执行单元10,用于使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
进一步地,如图12所示,所述装置还包括:
第四计算单元11,用于计算所述当前帧的第四子帧的频谱对参数的差分和;
此时,处理单元03,具体可以用于根据当前帧的谱倾斜因子,当前帧的第四子帧的频谱对参数以及第四计算单元11计算获得的当前帧的第四子帧的频谱对参数的差分和,获取当前帧的频谱对参数的内插系数。
进一步地,如图13所示,所述装置还包括:
第五计算单元12,用于计算所述当前帧的谱倾斜因子的差分和;
此时,处理单元03,具体可以用于根据当前帧的谱倾斜因子,当前帧的第四子帧的频谱对参数以及第五计算单元13计算获得的当前帧的谱倾斜因子的差分和,获取所述当前帧的频谱对参数的内插系数。
进一步地,如图14所示,所述装置还包括:
第三获取单元13,用于获取所述当前帧的属性参数;
判断单元14,用于判断所述当前帧的属性参数是否满足预设条件;若所述当前帧的属性参数满足预设条件时,则根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
进一步地,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数;
其中,所述判断所述当前帧的属性参数是否满足预设条件具体为:
判断所述当前帧的编码速率是否小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值。
进一步地,如图15所示,所述第二获取单元02包括:
第四获取单元15,用于获取所述当前帧的线性预测参数;
转换单元16,用于将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
进一步地,所述获取所述当前帧的线性预测参数具体为:
获取经过去噪滤波处理的当前帧的线性预测参数。
进一步地,如图16所示,所述装置还包括:
量化单元17,用于对所述当前帧的第四子帧的频谱对参数进行量化;
其中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数具体为:
根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
进一步地,如图17所示,所述装置还包括:
存储单元18,用于存储所述当前帧的第四子帧的频谱对参数。
本发明实施例提供的一种数据帧的内插装置,通过获取当前帧的谱倾斜因子,以及当前帧的第四子帧的频谱对参数,得到所述当前帧的频谱对参数的内插系数,进一步根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。通过该方案,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,这样,在当某一帧内包括清浊过渡时,得到与实际原始谱较为匹配的频谱,减少了现有技术在编码过程中造成信号失真的情况,进而提高语音通话质量。
实施例五
如图18所示,为本发明的数据帧的内插装置的硬件示意图:
所述数据帧的内插装置可以服务器设备,下面以服务器设备为例对所述数据帧的内插装置进行举例说明:
如图18所示,服务器101包括:处理器102、存储器103、收发器104、输入设备105、显示设备106。
其中,处理器102为所述服务器101的控制中心,通过运行或执行存储在存储器103内的软件程序和/或模块,以及调用存储在存储器103内的数据,完成执行指令或者任务。
收发器104可以用于收发信息或通话过程中,信号的接收和发送。
存储器103可以用于存储软件程序以及模块,处理器102通过运行存储在存储器103的软件程序以及模块,从而执行内插过程中的各种功能应用以及数据处理。
输入设备105可以用于接收输入的数字或字符信息,获取执行指令或者数据信息。具体地,输入设备105可包括触控面板以及其他输入设备。触控面板,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。
显示设备106可用于显示由用户输入的信息。显示设备106可包括显示面板,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器102以确定触摸事件的类型,随后处理器102根据触摸事件的类型在显示面板上提供相应的视觉输出。
在本发明实施例中,收发器104用于获取当前帧的谱倾斜因子以及获取当前帧的第四子帧的频谱对参数并发送至处理单元102,处理单元102根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数,进而根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
进一步地,在所述步骤获取所述当前帧的频谱对参数的内插系数时,所述处理器102还用于计算所述当前帧的谱倾斜因子的差分值,以及使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数。
又或者,在所述步骤获取所述当前帧的频谱对参数的内插系数时,所述处理器102还用于计算所述当前帧的第四子帧的频谱对参数的差分值,以及使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
又或者,在所述步骤获取所述当前帧的频谱对参数的内插系数时,所述处理器102还用于计算所述当前帧的第四子帧的频谱对参数的差分值,以及计算所述当前帧的谱倾斜因子的差分值,以及使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
进一步地,所述处理器102还用于计算所述当前帧的第四子帧的频谱对参数的差分和,以及根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述当前帧的第四子帧的频谱对参数的差分和,获取所述当前帧的频谱对参数的内插系数。
进一步地,所述处理器102还用于计算所述当前帧的谱倾斜因子的差分和,以及根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述当前帧的谱倾斜因子的差分和,获取所述当前帧的频谱对参数的内插系数。
进一步地,所述收发器104还用于获取所述当前帧的属性参数,并发送至处理器102。所述处理器还用于判断所述当前帧的属性参数是否满足预设条件;若所述当前帧的属性参数满足预设条件时,则根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
其中,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数;
其中,所述判断所述当前帧的属性参数是否满足预设条件具体为:
判断所述当前帧的编码速率是否小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值。
进一步地,所述收发器104还用于获取所述当前帧的线性预测参数,并发送至处理器102,所述处理器102还用于将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
进一步地,在所述步骤获取所述当前帧的频谱对参数的内插系数时,所述处理器102还用于对所述当前帧的第四子帧的频谱对参数进行量化;
其中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数具体为:
根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
进一步的,在所述步骤获取当前帧的第四子帧的频谱对参数之后,收发器104将所述当前帧的第四子帧的频谱对参数发送至存储器103,所述存储器103用于存储所述当前帧的第四子帧的频谱对参数。
本发明实施例提供的一种数据帧的内插装置,通过获取当前帧的谱倾斜因子,以及当前帧的第四子帧的频谱对参数,得到所述当前帧的频谱对参数的内插系数,进一步根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。通过该方案,将原本现有技术中固定不变的线性内差插系数修改为自适应的可变的内插系数,这样,在当某一帧内包括清浊过渡时,得到与实际原始谱较为匹配的频谱,减少了现有技术在编码过程中造成信号失真的情况,进而提高语音通话质量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (24)

1.一种数据帧的内插方法,其特征在于,包括:
获取当前帧的谱倾斜因子;
获取当前帧的第四子帧的频谱对参数;
根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数;
根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
2.根据权利要求1所述的数据帧的内插方法,其特征在于,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
计算所述当前帧的谱倾斜因子的差分值;
使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数。
3.根据权利要求1所述的数据帧的内插方法,其特征在于,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
计算所述当前帧的第四子帧的频谱对参数的差分值;
使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
4.根据权利要求1所述的数据帧的内插方法,其特征在于,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
计算所述当前帧的第四子帧的频谱对参数的差分值;
计算所述当前帧的谱倾斜因子的差分值;
使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
5.根据权利要求1至4任一所述的数据帧的内插方法,其特征在于,所述获取所述当前帧的频谱对参数的内插系数之前进一步包括:
计算所述当前帧的第四子帧的频谱对参数的差分和;
所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述当前帧的第四子帧的频谱对参数的差分和,获取所述当前帧的频谱对参数的内插系数。
6.根据权利要求1至5任一所述的数据帧的内插方法,其特征在于,所述获取所述当前帧的频谱对参数的内插系数前进一步包括:
计算所述当前帧的谱倾斜因子的差分和;
所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数包括:
根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述当前帧的谱倾斜因子的差分和,获取所述当前帧的频谱对参数的内插系数。
7.根据权利要求1至6任一所述的数据帧的内插方法,其特征在于,所述根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数前进一步包括:
获取所述当前帧的属性参数;
判断所述当前帧的属性参数是否满足预设条件;
若所述当前帧的属性参数满足预设条件时,则根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
8.根据权利要求7所述的数据帧的内插方法,其特征在于,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数;
其中,所述判断所述当前帧的属性参数是否满足预设条件具体为:
判断所述当前帧的编码速率是否小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值。
9.根据权利要求1至8任一所述的数据帧的内插方法,其特征在于,所述获取当前帧的第四子帧的频谱对参数包括:
获取所述当前帧的线性预测参数;
将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
10.根据权利要求9所述的数据帧的内插方法,其特征在于,所述获取所述当前帧的线性预测参数具体为:
获取经过去噪滤波处理的当前帧的线性预测参数。
11.根据权利要求1至10任一所述的数据帧的内插方法,其特征在于,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数之前进一步包括:
对所述当前帧的第四子帧的频谱对参数进行量化;
其中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数具体为:
根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
12.根据权利要求1至11任一所述的数据帧的内插方法,其特征在于,所述获取当前帧的第四子帧的频谱对参数之后进一步包括:
存储所述当前帧的第四子帧的频谱对参数。
13.一种数据帧的内插装置,其特征在于,包括:
第一获取单元,用于获取当前帧的谱倾斜因子;
第二获取单元,用于获取当前帧的第四子帧的频谱对参数;
处理单元,用于根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数;
内插单元,用于根据所述当前帧的频谱对参数的内插系数,所述当前帧的第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
14.根据权利要求13所述的数据帧的内插装置,其特征在于,所述处理单元包括:
第一计算单元,用于计算所述当前帧的谱倾斜因子的差分值;
第一执行单元,用于使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数,确定所述当前帧的频谱对参数的内插系数。
15.根据权利要求13所述的数据帧的内插装置,其特征在于,所述处理单元包括:
第二计算单元,用于计算所述当前帧的第四子帧的频谱对参数的差分值;
第二执行单元,用于使用所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
16.根据权利要求13所述的数据帧的内插装置,其特征在于,所述处理单元包括:
第三计算单元,用于计算所述当前帧的第四子帧的频谱对参数的差分值,以及计算所述当前帧的谱倾斜因子的差分值;
第三执行单元,用于使用所述当前帧的谱倾斜因子的差分值以及所述当前帧的第四子帧的频谱对参数的差分值,确定所述当前帧的频谱对参数的内插系数。
17.根据权利要求13至16任一所述的数据帧的内插装置,其特征在于,所述装置还包括:
第四计算单元,用于计算所述当前帧的第四子帧的频谱对参数的差分和;
所述处理单元,具体用于根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述第四计算单元计算获得的当前帧的第四子帧的频谱对参数的差分和,获取所述当前帧的频谱对参数的内插系数。
18.根据权利要求13至17任一所述的数据帧的内插装置,其特征在于,所述装置还包括:
第五计算单元,用于计算所述当前帧的谱倾斜因子的差分和;
所述处理单元,具体用于根据所述当前帧的谱倾斜因子,所述当前帧的第四子帧的频谱对参数以及所述第五计算单元计算获得的当前帧的谱倾斜因子的差分和,获取所述当前帧的频谱对参数的内插系数。
19.根据权利要求13至18任一所述的数据帧的内插装置,其特征在于,所述装置还包括:
第三获取单元,用于获取所述当前帧的属性参数;
判断单元,用于判断所述当前帧的属性参数是否满足预设条件;若所述当前帧的属性参数满足预设条件时,则根据所述当前帧的谱倾斜因子以及所述当前帧的第四子帧的频谱对参数,获取所述当前帧的频谱对参数的内插系数。
20.根据权利要求19所述的数据帧的内插装置,其特征在于,所述当前帧的属性参数包括:当前帧的编码速率、当前帧的话音激活检测标记、当前帧的预测残差能量以及当前帧的摩擦音帧数;
其中,所述判断所述当前帧的属性参数是否满足预设条件具体为:
判断所述当前帧的编码速率是否小于或等于预设编码速率阈值,且所述当前帧的话音激活检测标记指示所述当前帧为语音帧,且所述当前帧的预测残存能量大于预设残差能量阈值,且所述当前帧的摩擦音帧数大于预设摩擦音帧数阈值。
21.根据权利要求13至20任一所述的数据帧的内插装置,其特征在于,所述第二获取单元包括:
第四获取单元,用于获取所述当前帧的线性预测参数;
转换单元,用于将所述当前帧的线性预测参数转化为所述当前帧的第四子帧的频谱对参数。
22.根据权利要求21所述的数据帧的内插装置,其特征在于,所述获取所述当前帧的线性预测参数具体为:
获取经过去噪滤波处理的当前帧的线性预测参数。
23.根据权利要求13至22任一所述的数据帧的内插装置,其特征在于,所述装置还包括:
量化单元,用于对所述当前帧的第四子帧的频谱对参数进行量化;
其中,所述根据所述当前帧的频谱对参数的内插系数,所述第四子帧的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数具体为:
根据所述当前帧的频谱对参数的内插系数,所述第四子帧的量化后的频谱对参数,以及存储的所述当前帧的前一帧的第四子帧的频谱对参数,内插出所述当前帧除第四子帧以外的各个子帧的频谱对参数。
24.根据权利要求13至23任一所述的数据帧的内插装置,其特征在于,所述装置还包括:
存储单元,用于存储所述当前帧的第四子帧的频谱对参数。
CN201310552242.7A 2013-11-07 2013-11-07 一种数据帧的内插方法及装置 Active CN104637486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310552242.7A CN104637486B (zh) 2013-11-07 2013-11-07 一种数据帧的内插方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310552242.7A CN104637486B (zh) 2013-11-07 2013-11-07 一种数据帧的内插方法及装置

Publications (2)

Publication Number Publication Date
CN104637486A true CN104637486A (zh) 2015-05-20
CN104637486B CN104637486B (zh) 2017-12-29

Family

ID=53216157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310552242.7A Active CN104637486B (zh) 2013-11-07 2013-11-07 一种数据帧的内插方法及装置

Country Status (1)

Country Link
CN (1) CN104637486B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111602196A (zh) * 2018-01-17 2020-08-28 日本电信电话株式会社 编码装置、解码装置、摩擦音判定装置、它们的方法以及程序

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1424712A (zh) * 2002-12-19 2003-06-18 北京工业大学 2.3kb/s谐波激励线性预测语音编码方法
CN1468427A (zh) * 2000-05-19 2004-01-14 �����ɭ��ϵͳ��˾ 一种码激励线性预测语音编码器的增益量化
CN1757060A (zh) * 2003-03-15 2006-04-05 曼德斯必德技术公司 Celp语音编码的话音指数控制
CN101578508A (zh) * 2006-10-24 2009-11-11 沃伊斯亚吉公司 用于对语音信号中的过渡帧进行编码的方法和设备
US20120116769A1 (en) * 2001-10-04 2012-05-10 At&T Intellectual Property Ii, L.P. System for bandwidth extension of narrow-band speech

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1468427A (zh) * 2000-05-19 2004-01-14 �����ɭ��ϵͳ��˾ 一种码激励线性预测语音编码器的增益量化
US20120116769A1 (en) * 2001-10-04 2012-05-10 At&T Intellectual Property Ii, L.P. System for bandwidth extension of narrow-band speech
CN1424712A (zh) * 2002-12-19 2003-06-18 北京工业大学 2.3kb/s谐波激励线性预测语音编码方法
CN1757060A (zh) * 2003-03-15 2006-04-05 曼德斯必德技术公司 Celp语音编码的话音指数控制
CN101578508A (zh) * 2006-10-24 2009-11-11 沃伊斯亚吉公司 用于对语音信号中的过渡帧进行编码的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111602196A (zh) * 2018-01-17 2020-08-28 日本电信电话株式会社 编码装置、解码装置、摩擦音判定装置、它们的方法以及程序
CN111602196B (zh) * 2018-01-17 2023-08-04 日本电信电话株式会社 编码装置、解码装置、它们的方法及计算机可读记录介质

Also Published As

Publication number Publication date
CN104637486B (zh) 2017-12-29

Similar Documents

Publication Publication Date Title
CN103503061B (zh) 在一频谱域中用以处理已解码音频信号的装置及方法
US11721349B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
CN104517610B (zh) 频带扩展的方法及装置
CN101548319B (zh) 后置滤波器以及滤波方法
CN103688306B (zh) 对被编码为连续帧序列的音频信号进行解码的方法和装置
US20130144614A1 (en) Bandwidth Extender
CA2864247C (en) System and method for mixed codebook excitation for speech coding
CN103493129B (zh) 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
JP2000357999A (ja) 復号装置及び方法、並びにプログラム提供媒体
CN104021796A (zh) 语音增强处理方法和装置
CN1074846C (zh) 产生用于话音编码器的频谱噪音加权滤波器的方法
JPH1055199A (ja) 音声符号化並びに復号化方法及びその装置
CN106031038A (zh) 根据帧对由可变采样频率中断的音频信号进行重采样
JP6270992B2 (ja) 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体
CN105393303B (zh) 音频信号处理装置、音频信号处理方法及音频信号处理程序
CN106228991B (zh) 编解码方法、装置及系统
CN104637486A (zh) 一种数据帧的内插方法及装置
CN106935243A (zh) 一种基于melp的低比特数字语音矢量量化方法和系统
CN105122358A (zh) 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法
JP3749838B2 (ja) 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体
JP6859379B2 (ja) 快適雑音生成モード選択のための装置および方法
Backstrom et al. Minimum separation of line spectral frequencies
JPH11119798A (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
JP2002244700A (ja) 音声符号化装置、音声符号化方法および記憶素子

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210427

Address after: Unit 3401, unit a, building 6, Shenye Zhongcheng, No. 8089, Hongli West Road, Donghai community, Xiangmihu street, Futian District, Shenzhen, Guangdong 518040

Patentee after: Honor Device Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.