CN103413557B - 语音信号带宽扩展的方法和装置 - Google Patents
语音信号带宽扩展的方法和装置 Download PDFInfo
- Publication number
- CN103413557B CN103413557B CN201310284770.9A CN201310284770A CN103413557B CN 103413557 B CN103413557 B CN 103413557B CN 201310284770 A CN201310284770 A CN 201310284770A CN 103413557 B CN103413557 B CN 103413557B
- Authority
- CN
- China
- Prior art keywords
- frequency signal
- signal
- arrowband
- broadband
- codebook vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种语音信号带宽扩展的方法和装置,其方法包括:将语音信号采样率转换处理,经滤波后得到高频信号和低频信号;对高频信号能量估计,获得高频信号能量值;当高频信号能量值大于预设能量阈值时,判定语音信号为宽带语音信号,对高频信号增益或衰减调整,将低频信号与调整后的高频信号叠加并输出;当高频信号能量值小于或等于预设能量阈值时,判定语音信号为窄带语音信号,对低频信号带宽扩展,获得带宽扩展高频分量,将低频信号与带宽扩展高频分量叠加并输出。本发明自适应的调整带宽扩展处理方式,对窄带语音信号进行带宽扩展处理,提高语音质量,对宽带语音信号直接输出,避免对宽带语音信号的错误扩展,进一步保证语音质量。
Description
技术领域
本发明涉及到信号处理技术领域,特别涉及到语音信号带宽扩展的方法和装置。
背景技术
人类语音信号的频带带宽主要分布在50Hz~8kHz范围之间,但是在语音通信传输过程中,由于模拟信号传输的限制,语音带宽被限制在300Hz~3400Hz之间,被称为窄带语音信号。窄带语音信号由于缺少高频信息,语音的清晰度受到了一定的影响。随着语音通信技术的不断发展,宽带语音通信终端出现,可支持频率范围在50Hz~7000Hz的宽带语音信号,能输出更优质的通话质量。但由于传统的窄带语音信号仍然占主导地位,目前的通信网络是窄带语音信号与宽带语音信号共存的语音通信网络,当支持宽带语音信号的宽带语音通信终端接收到窄带语音信号时,无法输出宽带语音信号,起不到提高通话质量的作用。为了使宽带语音通信终端能够输出宽带语音信号,目前采用的语音带宽扩展方式是,由宽带语音通信终端根据输入的窄带语音信号来估计丢失的高频信号,再将估计的高频信号与窄带信号相加,得到宽带语音信号。但如果宽带语音通信终端接收到的是输入宽带语音信号时,终端不能根据信号特征进行自适应处理,仍然会对宽带语音信号进行语音带宽扩展处理,人工扩展带宽得到的高频信息在逼真度上不可能超过原始信号,既浪费计算能力,又会降低语音质量。
发明内容
本发明的主要目的为提供一种语音信号带宽扩展的方法和装置,可自适应的对语音带宽扩展处理进行调整。
本发明提出一种语音信号带宽扩展的方法,包括步骤:
将接收到的语音信号进行采样率转换处理,并经滤波后得到高频信号和低频信号;
对所述高频信号进行能量估计,获得所述高频信号的能量值;
当所述高频信号的能量值大于预设的能量阈值时,判定所述语音信号为宽带语音信号,对所述高频信号进行增益或衰减调整,并将所述低频信号与调整后的高频信号叠加,输出叠加后的语音信号;
当所述高频信号的能量值小于或等于预设的能量阈值时,判定所述语音信号为窄带语音信号,对所述低频信号进行带宽扩展,获得带宽扩展高频分量,并将所述低频信号与带宽扩展高频分量叠加,输出叠加后的语音信号。
优选地,所述对低频信号进行带宽扩展,获得带宽扩展高频分量的步骤具体包括:
对所述低频信号进行线性预测编码和线谱对计算,获得窄带特征矢量;
对所述窄带特征矢量进行码本映射处理,获得宽带特征矢量;
对所述宽带信号特征矢量进行谱包络估计,获得宽带谱包络;
对所述低频信号进行宽带激励估计,获得宽带激励信号;
将所述宽带谱包络合成到所述宽带激励信号中,生成带宽扩展信号;
对所述带宽扩展信号进行高通滤波处理,获得所述带宽扩展高频分量。
优选地,所述对窄带特征矢量进行码本映射处理,获得宽带特征矢量的步骤具体包括:
在预先训练好的窄带码本中查找与所述窄带特征矢量之间误差距离最小的窄带码本矢量;
判断所述误差距离最小的窄带码本矢量与所述窄带特征矢量之间误差距离是否小于预设的误差阈值;
如果是,则将所述误差距离最小的窄带码本矢量映射到预先训练好的宽带码本中,获得宽带码本矢量,作为所述宽带特征矢量;
如果否,则对所述窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量。
优选地,所述对窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量的步骤具体包括:
从所述窄带码本中获取N+1个窄带码本矢量a0、a1、a2、…、aN,每个所述窄带码本矢量的长度均为N,与所述窄带特征矢量x=[x1,x2,…,xN]共同组成矩阵方程组:
;
当所述矩阵方程组有解时,获得所述矩阵方程组的解z1、z2、z3、……、zN;
当所述矩阵方程组无解时,从所述窄带码本中获取一个新的窄带码本矢量,替换所述N+1个窄带码本矢量中的一个窄带码本矢量,重新组成新的矩阵方程组;
根据所述矩阵方程组的解,确定加权系数:
;
将获取的所述窄带码本矢量a0、a1、a2、…、aN映射到预先训练好的宽带码本中,获得宽带码本矢量b0、b1、b2、…、bN,每个所述宽带码本矢量的长度均为L;
根据所述加权系数和宽带码本矢量,确定所述宽带特征矢量:
。
优选地,所述对高频信号进行能量估计,获得所述高频信号的能量值的步骤具体包括:
获取所述高频信号中各采样点的峰值;
确定所述高频信号的能量值或,其中fk为所述高频信号中第k个采样点的峰值,M为所述高频信号中采样点的总个数。
本发明还提出一种语音信号带宽扩展的装置,包括:
采样率转换模块,用于将接收到的语音信号进行采样率转换处理;
滤波模块,用于对采样率转换处理后的语音信号进行滤波处理,得到高频信号和低频信号;
能量估计模块,用于对所述高频信号进行能量估计,获得所述高频信号的能量值;
判断模块,用于判断所述高频信号的能量值是否大于预设的能量阈值;如果是,则判定所述语音信号为宽带语音信号;如果否,则判定所述语音信号为窄带语音信号;
均衡器模块,用于当所述判断模块判定所述高频信号的能量值大于预设的能量阈值时,对所述高频信号进行增益或衰减调整;
宽带扩展模块,用于当所述判断模块判定所述高频信号的能量值小于或等于预设的能量阈值时,对所述低频信号进行带宽扩展,获得带宽扩展高频分量;
叠加模块,用于当所述判断模块判定所述高频信号的能量值大于预设的能量阈值时,将所述低频信号与调整后的高频信号叠加,输出叠加后的语音信号;用于当所述判断模块判定所述高频信号的能量值小于或等于预设的能量阈值时,将所述低频信号与带宽扩展高频分量叠加,输出叠加后的语音信号。
优选地,所述宽带扩展模块具体包括:
矢量量化单元,用于对所述低频信号进行线性预测编码和线谱对计算,获得窄带特征矢量;
码本映射单元,用于对所述窄带特征矢量进行码本映射处理,获得宽带特征矢量;
谱包络估计单元,对所述宽带信号特征矢量进行谱包络估计,获得宽带谱包络;
激励估计单元,用于对所述低频信号进行宽带激励估计,获得宽带激励信号;
合成单元,用于将所述宽带谱包络合成到所述宽带激励信号中,生成带宽扩展信号;
高通滤波单元,用于对所述带宽扩展信号进行高通滤波处理,获得所述带宽扩展高频分量。
优选地,所述码本映射单元具体用于:
在预先训练好的窄带码本中查找与所述窄带特征矢量之间误差距离最小的窄带码本矢量;
判断所述误差距离最小的窄带码本矢量与所述窄带特征矢量之间误差距离是否小于预设的误差阈值;
如果是,则将所述误差距离最小的窄带码本矢量映射到预先训练好的宽带码本中,获得宽带码本矢量,作为所述宽带特征矢量;
如果否,则对所述窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量。
优选地,所述码本映射单元具体还用于:
从所述窄带码本中获取N+1个窄带码本矢量a0、a1、a2、…、aN,每个所述窄带码本矢量的长度均为N,与所述窄带特征矢量x=[x1,x2,…,xN]共同组成矩阵方程组:
;
当所述矩阵方程组有解时,获得所述矩阵方程组的解z1、z2、z3、……、zN;
当所述矩阵方程组无解时,从所述窄带码本中获取一个新的窄带码本矢量,替换所述N+1个窄带码本矢量中的一个窄带码本矢量,重新组成新的矩阵方程组;
根据所述矩阵方程组的解,确定加权系数:
;
将获取的所述窄带码本矢量a0、a1、a2、…、aN映射到预先训练好的宽带码本中,获得宽带码本矢量b0、b1、b2、…、bN,每个所述宽带码本矢量的长度均为L;
根据所述加权系数和宽带码本矢量,确定所述宽带特征矢量:
。
优选地,所述能量估计模块具体用于:
获取所述高频信号中各采样点的峰值;
确定所述高频信号的能量值或,其中fk为所述高频信号中第k个采样点的峰值,M为所述高频信号中采样点的总个数。
本发明根据语音信号的高频能量特征,来判断当前接收到的语音信号的带宽范围,根据不同类别的语音信号采用不同的处理方式,对窄带语音信号进行带宽扩展处理,提高输出的语音质量,对宽带语音信号直接输出,避免了对宽带语音信号的错误扩展,进一步保证了输出的语音信号质量,实现了带宽扩展处理的自适应调整。
附图说明
图1为本发明语音信号带宽扩展的方法的第一实施例的流程图;
图2为本发明语音信号带宽扩展的方法的第二实施例的流程图;
图3为本发明语音信号带宽扩展的方法的第三实施例的流程图;
图4为本发明语音信号带宽扩展的方法的第四实施例的流程图;
图5为本发明语音信号带宽扩展的方法的第五实施例的流程图;
图6为本发明语音信号带宽扩展的装置的第一实施例的结构示意图;
图7为本发明语音信号带宽扩展的装置的第一实施例中各模块的结构连接图;
图8为本发明语音信号带宽扩展的装置的第二实施例的结构示意图;
图9为本发明语音信号带宽扩展的装置的第二实施例中宽带扩展模块的结构连接图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1为本发明语音信号带宽扩展的方法的第一实施例的流程图。本实施例提到的语音信号带宽扩展的方法,包括:
步骤S10,将接收到的语音信号进行采样率转换处理,并经滤波后得到高频信号和低频信号;
本实施例中,语音信号按帧输入,一帧的时间间隔在5毫秒至几十毫秒之间,可根据采样率和系统延迟要求来设定帧输入的时间间隔。将输入的语音信号进行采样率转换,以便于后续对语音信号进行能量估计,通常是将其采样率转换为16k Hz。为了对语音信号进行带宽扩展,可采用高通滤波器和低通滤波器,分别对采样率转换处理后的语音信号进行滤波处理,获得高频信号和低频信号。
步骤S20,对高频信号进行能量估计,获得高频信号的能量值;
本实施例还对语音信号的高频能量特性进行分析,可采用峰值计算或均方根计算高频信号的能量大小。根据高频信号的能量值,判断出语音信号是属于窄带语音信号还是属于宽带语音信号,只对窄带语音信号进行带宽扩展处理,对于宽带语音信号则直接输出,实现了带宽扩展处理的自适应调整。此外,还可以分别对高频信号进行音色调整和对低频信号进行带宽扩展之后,再对高频信号能量值进行判断,根据判断结果直接选择需要与低频信号进行叠加的一路输出,同样可以实现对带宽扩展处理的自适应调整。
步骤S30,当高频信号的能量值大于预设的能量阈值时,判定语音信号为宽带语音信号;
由于宽带语音信号的高频能量较大,当高频信号的能量值大于预设的能量阈值时,则说明该语音信号为宽带语音信号,则无需进行宽带扩展处理,可直接输出优质的语音信号。
步骤S40,对高频信号进行增益或衰减调整;
为了进一步提高语音效果,可采用均衡器对宽带语音信号的高频部分进行音色调整,以突出高频部分与其他频段的对比度,达到提高音效的目的。
步骤S50,将低频信号与调整后的高频信号叠加,输出叠加后的语音信号;
将低频信号与调整后的高频信号叠加,形成完整的宽带语音信号,由于输出的语音信号保留了原始输入的宽带语音信号中的高频信号,即保留了原始输入的宽带语音信号的优质音效,避免了因盲目扩展带宽而造成语音信号的质量和逼真度下降,且省略了宽带扩展的处理过程,提高了语音信号处理效率。
步骤S60,当高频信号的能量值小于或等于预设的能量阈值时,判定语音信号为窄带语音信号;
由于窄带语音信号的高频能量较小,当高频信号的能量值小于或等于预设的能量阈值时,则说明该语音信号为窄带语音信号,则可对其进行宽带扩展处理,使输出的语音信号为宽带语音信号,提高语音质量。
步骤S70,对低频信号进行带宽扩展,获得带宽扩展高频分量;
从窄带语音信号的低频部分估计丢失的高频部分,带宽扩展的方法有多种,传统的宽带扩展方法均可应用于本实施例中,在此不作赘述。
步骤S80,将低频信号与带宽扩展高频分量叠加,输出叠加后的语音信号。
将低频信号与扩展带宽后的高频分量叠加,合成为完整的宽带语音信号,输出的语音信号质量得到了明显提高。
本实施例根据语音信号的高频能量特征,来判断当前接收到的语音信号的带宽范围,根据不同类别的语音信号采用不同的处理方式,对窄带语音信号进行带宽扩展处理,提高输出的语音质量,对宽带语音信号直接输出,避免了对宽带语音信号的错误扩展,进一步保证了输出的语音信号质量,实现了带宽扩展处理的自适应调整。
如图2所示,图2为本发明语音信号带宽扩展的方法的第二实施例的流程图。本实施例以图1所示实施例为基础,步骤S20具体包括:
步骤S21,获取高频信号中各采样点的峰值;
步骤S22,确定高频信号的能量值或,其中fk为高频信号中第k个采样点的峰值,M为高频信号中采样点的总个数。
本实施例采用峰值计算方法或均方根计算方法获得高频信号的能量值,根据获得的高频能量特性,来判断输入的语音信号的带宽范围,并根据带宽类型自适应的调整叠加到低频信号上的高频部分的处理方式,避免在输入的语音信号为宽带语音信号时盲目的进行带宽扩展处理而造成输出语音信号的失真,确保输出语音质量。
如图3所示,图3为本发明语音信号带宽扩展的方法的第三实施例的流程图。本实施例以图1所示实施例为基础,步骤S70具体包括:
步骤S71,对低频信号进行线性预测编码和线谱对计算,获得窄带特征矢量;
步骤S72,对窄带特征矢量进行码本映射处理,获得宽带特征矢量;
步骤S73,对宽带信号特征矢量进行谱包络估计,获得宽带谱包络;
步骤S74,对低频信号进行宽带激励估计,获得宽带激励信号;
步骤S75,将宽带谱包络合成到宽带激励信号中,生成带宽扩展信号;
步骤S76,对带宽扩展信号进行高通滤波处理,获得带宽扩展高频分量。
本实施例在判定输入的语音信号为窄带语音信号时,通过码本来完成从窄带语音信号到宽带语音信号高频分量的非线性映射,可采用传统的带宽扩展方式进行处理,以提高输出语音质量。码本映射的具体实施例将在后续实施例中详细说明。
如图4所示,图4为本发明语音信号带宽扩展的方法的第四实施例的流程图。本实施例以图3所示实施例为基础,步骤S72具体包括:
步骤S721,在预先训练好的窄带码本中查找与窄带特征矢量之间误差距离最小的窄带码本矢量;
步骤S722,判断误差距离最小的窄带码本矢量与窄带特征矢量之间误差距离是否小于预设的误差阈值;如果是,则执行步骤S723;如果否,则执行步骤S724;
步骤S723,将误差距离最小的窄带码本矢量映射到预先训练好的宽带码本中,获得宽带码本矢量,作为宽带特征矢量;
步骤S724,对窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量。
本实施例考虑到加权的码本映射处理中,加权系数的选择是随机的,在某些情况下,产生的误差距离可能比直接选择距离最小的码本矢量所产生的误差距离还要大,这时就会导致更大的运算误差,引入杂音。为了避免上述情况,本实施例预设了误差阈值,在预先训练好的窄带码本中如果找到误差距离小于误差阈值的窄带码本矢量,则该窄带码本矢量即为最佳的窄带码本矢量,将其映射到预先训练好的宽带码本中,即可获得所需的宽带特征矢量。否则,采用加权的码本映射处理方式对窄带特征矢量进行处理。上述方式可以有效提高获得的宽带特征矢量的准确性,进而改善码本映射处理结果的准确性,提高输出的语音质量。
如图5所示,图5为本发明语音信号带宽扩展的方法的第五实施例的流程图。本实施例以图4所示实施例为基础,步骤S724具体包括:
步骤S7241,从窄带码本中获取N+1个窄带码本矢量a0、a1、a2、…、aN,每个窄带码本矢量的长度均为N,与窄带特征矢量x=[x1,x2,…,xN]共同组成矩阵方程组:
;
步骤S7242,判断矩阵方程组是否有解;如果是,则执行步骤S7243;如果否,则执行步骤S7244;
步骤S7243,当矩阵方程组有解时,获得矩阵方程组的解z1、z2、z3、……、zN;
步骤S7244,当矩阵方程组无解时,从窄带码本中获取一个新的窄带码本矢量,替换N+1个窄带码本矢量中的一个窄带码本矢量,重新组成新的矩阵方程组,返回步骤S7242;
步骤S7245,根据矩阵方程组的解,确定加权系数:
;
步骤S7246,将获取的窄带码本矢量a0、a1、a2、…、aN映射到预先训练好的宽带码本中,获得宽带码本矢量b0、b1、b2、…、bN,每个宽带码本矢量的长度均为L;
步骤S7247,根据加权系数和宽带码本矢量,确定宽带特征矢量:
。
本实施例根据窄带特征矢量和窄带码本矢量,获得加权系数,该加权系数不再是随机选择的加权系数,在精确度上得到了大大提高,获得的宽带特征矢量的误差也得到了改善,有利于获得更加接近真实信号的宽带谱包络和带宽扩展高频分量,进而降低了输出的语音信号的失真率,提高了语音信号质量。
如图6所示,图6为本发明语音信号带宽扩展的装置的第一实施例的结构示意图。请一并参照图7,图7为本发明语音信号带宽扩展的装置的第一实施例中各模块的结构连接图。本实施例提到的语音信号带宽扩展的装置,包括:
采样率转换模块10,用于将接收到的语音信号进行采样率转换处理;
滤波模块20,用于对采样率转换处理后的语音信号进行滤波处理,得到高频信号和低频信号;
能量估计模块30,用于对高频信号进行能量估计,获得高频信号的能量值;
判断模块40,用于判断高频信号的能量值是否大于预设的能量阈值;如果是,则判定语音信号为宽带语音信号;如果否,则判定语音信号为窄带语音信号;
均衡器模块50,用于当判断模块40判定高频信号的能量值大于预设的能量阈值时,对高频信号进行增益或衰减调整;
宽带扩展模块60,用于当判断模块40判定高频信号的能量值小于或等于预设的能量阈值时,对低频信号进行带宽扩展,获得带宽扩展高频分量;
叠加模块70,用于当判断模块40判定高频信号的能量值大于预设的能量阈值时,将低频信号与调整后的高频信号叠加,输出叠加后的语音信号;用于当判断模块40判定高频信号的能量值小于或等于预设的能量阈值时,将低频信号与带宽扩展高频分量叠加,输出叠加后的语音信号。
本实施例中,各模块连接可参照图7。语音信号按帧输入,一帧的时间间隔在5毫秒至几十毫秒之间,可根据采样率和系统延迟要求来设定帧输入的时间间隔。将输入的语音信号进行采样率转换,以便于后续对语音信号进行能量估计,通常是将其采样率转换为16kHz。为了对语音信号进行带宽扩展,可采用高通滤波器21和低通滤波器22,分别对采样率转换处理后的语音信号进行滤波处理,获得高频信号和低频信号。本实施例还对语音信号的高频能量特性进行分析,可采用峰值计算或均方根计算高频信号的能量大小。根据高频信号的能量值,判断出语音信号是属于窄带语音信号还是属于宽带语音信号,只对窄带语音信号进行带宽扩展处理,对于宽带语音信号则直接输出,实现了带宽扩展处理的自适应调整。此外,还可以分别对高频信号进行音色调整和对低频信号进行带宽扩展之后,再对高频信号能量值进行判断,根据判断结果直接选择需要与低频信号进行叠加的一路输出,同样可以实现对带宽扩展处理的自适应调整。由于宽带语音信号的高频能量较大,当高频信号的能量值大于预设的能量阈值时,则说明该语音信号为宽带语音信号,则无需进行宽带扩展处理,可直接输出优质的语音信号。为了进一步提高语音效果,可采用均衡器对宽带语音信号的高频部分进行音色调整,以突出高频部分与其他频段的对比度,达到提高音效的目的。将低频信号与调整后的高频信号叠加,形成完整的宽带语音信号,由于输出的语音信号保留了原始输入的宽带语音信号中的高频信号,即保留了原始输入的宽带语音信号的优质音效,避免了因盲目扩展带宽而造成语音信号的质量和逼真度下降,且省略了宽带扩展的处理过程,提高了语音信号处理效率。由于窄带语音信号的高频能量较小,当高频信号的能量值小于或等于预设的能量阈值时,则说明该语音信号为窄带语音信号,则可对其进行宽带扩展处理,使输出的语音信号为宽带语音信号,提高语音质量。从窄带语音信号的低频部分估计丢失的高频部分,带宽扩展的方法有多种,传统的宽带扩展方法均可应用于本实施例中,在此不作赘述。将低频信号与扩展带宽后的高频分量叠加,合成为完整的宽带语音信号,输出的语音信号质量得到了明显提高。
本实施例根据语音信号的高频能量特征,来判断当前接收到的语音信号的带宽范围,根据不同类别的语音信号采用不同的处理方式,对窄带语音信号进行带宽扩展处理,提高输出的语音质量,对宽带语音信号直接输出,避免了对宽带语音信号的错误扩展,进一步保证了输出的语音信号质量,实现了带宽扩展处理的自适应调整。
本发明实施例中,能量估计模块30具体用于:
获取高频信号中各采样点的峰值;
确定高频信号的能量值或,其中fk为高频信号中第k个采样点的峰值,M为高频信号中采样点的总个数。
本实施例采用峰值计算方法或均方根计算方法获得高频信号的能量值,根据获得的高频能量特性,来判断输入的语音信号的带宽范围,并根据带宽类型自适应的调整叠加到低频信号上的高频部分的处理方式,避免在输入的语音信号为宽带语音信号时盲目的进行带宽扩展处理而造成输出语音信号的失真,确保输出语音质量。
如图8所示,图8为本发明语音信号带宽扩展的装置的第二实施例的结构示意图。请一并参照图9,图9为本发明语音信号带宽扩展的装置的第二实施例中宽带扩展模块的结构连接图。本实施例以图6所示实施例为基础,宽带扩展模块60具体包括:
矢量量化单元61,用于对低频信号进行线性预测编码和线谱对计算,获得窄带特征矢量;
码本映射单元62,用于对窄带特征矢量进行码本映射处理,获得宽带特征矢量;
谱包络估计单元63,对宽带信号特征矢量进行谱包络估计,获得宽带谱包络;
激励估计单元64,用于对低频信号进行宽带激励估计,获得宽带激励信号;
合成单元65,用于将宽带谱包络合成到宽带激励信号中,生成带宽扩展信号;
高通滤波单元66,用于对带宽扩展信号进行高通滤波处理,获得带宽扩展高频分量。
本实施例在判定输入的语音信号为窄带语音信号时,通过码本来完成从窄带语音信号到宽带语音信号高频分量的非线性映射,可采用传统的带宽扩展方式进行处理,以提高输出语音质量。码本映射的具体实施例将在后续实施例中详细说明。
本发明实施例中,码本映射单元62具体用于:
在预先训练好的窄带码本中查找与窄带特征矢量之间误差距离最小的窄带码本矢量;
判断误差距离最小的窄带码本矢量与窄带特征矢量之间误差距离是否小于预设的误差阈值;
如果是,则将误差距离最小的窄带码本矢量映射到预先训练好的宽带码本中,获得宽带码本矢量,作为宽带特征矢量;
如果否,则对窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量。
本实施例考虑到加权的码本映射处理中,加权系数的选择是随机的,在某些情况下,产生的误差距离可能比直接选择距离最小的码本矢量所产生的误差距离还要大,这时就会导致更大的运算误差,引入杂音。为了避免上述情况,本实施例预设了误差阈值,在预先训练好的窄带码本中如果找到误差距离小于误差阈值的窄带码本矢量,则该窄带码本矢量即为最佳的窄带码本矢量,将其映射到预先训练好的宽带码本中,即可获得所需的宽带特征矢量。否则,采用加权的码本映射处理方式对窄带特征矢量进行处理。上述方式可以有效提高获得的宽带特征矢量的准确性,进而改善码本映射处理结果的准确性,提高输出的语音质量。
本发明实施例中,码本映射单元62具体还用于:
从窄带码本中获取N+1个窄带码本矢量a0、a1、a2、…、aN,每个窄带码本矢量的长度均为N,与窄带特征矢量x=[x1,x2,…,xN]共同组成矩阵方程组:
;
当矩阵方程组有解时,获得矩阵方程组的解z1、z2、z3、……、zN;
当矩阵方程组无解时,从窄带码本中获取一个新的窄带码本矢量,替换N+1个窄带码本矢量中的一个窄带码本矢量,重新组成新的矩阵方程组;
根据矩阵方程组的解,确定加权系数:
;
将获取的窄带码本矢量a0、a1、a2、…、aN映射到预先训练好的宽带码本中,获得宽带码本矢量b0、b1、b2、…、bN,每个宽带码本矢量的长度均为L;
根据加权系数和宽带码本矢量,确定宽带特征矢量:
。
本实施例根据窄带特征矢量和窄带码本矢量,获得加权系数,该加权系数不再是随机选择的加权系数,在精确度上得到了大大提高,获得的宽带特征矢量的误差也得到了改善,有利于获得更加接近真实信号的宽带谱包络和带宽扩展高频分量,进而降低了输出的语音信号的失真率,提高了语音信号质量。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种语音信号带宽扩展的方法,其特征在于,包括步骤:
将接收到的语音信号进行采样率转换处理,并经滤波后得到高频信号和低频信号;
对所述高频信号进行能量估计,获得所述高频信号的能量值;
当所述高频信号的能量值大于预设的能量阈值时,判定所述语音信号为宽带语音信号,对所述高频信号进行增益或衰减调整,并将所述低频信号与调整后的高频信号叠加,输出叠加后的语音信号;
当所述高频信号的能量值小于或等于预设的能量阈值时,判定所述语音信号为窄带语音信号,对所述低频信号进行带宽扩展,获得带宽扩展高频分量,并将所述低频信号与带宽扩展高频分量叠加,输出叠加后的语音信号。
2.根据权利要求1所述的语音信号带宽扩展的方法,其特征在于,所述对低频信号进行带宽扩展,获得带宽扩展高频分量的步骤具体包括:
对所述低频信号进行线性预测编码和线谱对计算,获得窄带特征矢量;
对所述窄带特征矢量进行码本映射处理,获得宽带特征矢量;
对所述宽带特征矢量进行谱包络估计,获得宽带谱包络;
对所述低频信号进行宽带激励估计,获得宽带激励信号;
将所述宽带谱包络合成到所述宽带激励信号中,生成带宽扩展信号;
对所述带宽扩展信号进行高通滤波处理,获得所述带宽扩展高频分量。
3.根据权利要求2所述的语音信号带宽扩展的方法,其特征在于,所述对窄带特征矢量进行码本映射处理,获得宽带特征矢量的步骤具体包括:
在预先训练好的窄带码本中查找与所述窄带特征矢量之间误差距离最小的窄带码本矢量;
判断所述误差距离最小的窄带码本矢量与所述窄带特征矢量之间误差距离是否小于预设的误差阈值;
如果是,则将所述误差距离最小的窄带码本矢量映射到预先训练好的宽带码本中,获得宽带码本矢量,作为所述宽带特征矢量;
如果否,则对所述窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量。
4.根据权利要求3所述的语音信号带宽扩展的方法,其特征在于,所述对窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量的步骤具体包括:
从所述窄带码本中获取N+1个窄带码本矢量a0、a1、a2、…、aN,每个所述窄带码本矢量的长度均为N,与所述窄带特征矢量x=[x1,x2,…,xN]共同组成矩阵方程组:
当所述矩阵方程组有解时,获得所述矩阵方程组的解z1、z2、z3、……、zN;
当所述矩阵方程组无解时,从所述窄带码本中获取一个新的窄带码本矢量,替换所述N+1个窄带码本矢量中的一个窄带码本矢量,重新组成新的矩阵方程组;
根据所述矩阵方程组的解,确定加权系数:
将获取的所述窄带码本矢量a0、a1、a2、…、aN映射到预先训练好的宽带码本中,获得宽带码本矢量b0、b1、b2、…、bN,每个所述宽带码本矢量的长度均为L;
根据所述加权系数和宽带码本矢量,确定所述宽带特征矢量:
5.根据权利要求1至4任一项所述的语音信号带宽扩展的方法,其特征在于,所述对高频信号进行能量估计,获得所述高频信号的能量值的步骤具体包括:
获取所述高频信号中各采样点的峰值;
确定所述高频信号的能量值或其中fk为所述高频信号中第k个采样点的峰值,M为所述高频信号中采样点的总个数。
6.一种语音信号带宽扩展的装置,其特征在于,包括:
采样率转换模块,用于将接收到的语音信号进行采样率转换处理;
滤波模块,用于对采样率转换处理后的语音信号进行滤波处理,得到高频信号和低频信号;
能量估计模块,用于对所述高频信号进行能量估计,获得所述高频信号的能量值;
判断模块,用于判断所述高频信号的能量值是否大于预设的能量阈值;如果是,则判定所述语音信号为宽带语音信号;如果否,则判定所述语音信号为窄带语音信号;
均衡器模块,用于当所述判断模块判定所述高频信号的能量值大于预设的能量阈值时,对所述高频信号进行增益或衰减调整;
宽带扩展模块,用于当所述判断模块判定所述高频信号的能量值小于或等于预设的能量阈值时,对所述低频信号进行带宽扩展,获得带宽扩展高频分量;
叠加模块,用于当所述判断模块判定所述高频信号的能量值大于预设的能量阈值时,将所述低频信号与调整后的高频信号叠加,输出叠加后的语音信号;用于当所述判断模块判定所述高频信号的能量值小于或等于预设的能量阈值时,将所述低频信号与带宽扩展高频分量叠加,输出叠加后的语音信号。
7.根据权利要求6所述的语音信号带宽扩展的装置,其特征在于,所述宽带扩展模块具体包括:
矢量量化单元,用于对所述低频信号进行线性预测编码和线谱对计算,获得窄带特征矢量;
码本映射单元,用于对所述窄带特征矢量进行码本映射处理,获得宽带特征矢量;
谱包络估计单元,对所述宽带特征矢量进行谱包络估计,获得宽带谱包络;
激励估计单元,用于对所述低频信号进行宽带激励估计,获得宽带激励信号;
合成单元,用于将所述宽带谱包络合成到所述宽带激励信号中,生成带宽扩展信号;
高通滤波单元,用于对所述带宽扩展信号进行高通滤波处理,获得所述带宽扩展高频分量。
8.根据权利要求7所述的语音信号带宽扩展的装置,其特征在于,所述码本映射单元具体用于:
在预先训练好的窄带码本中查找与所述窄带特征矢量之间误差距离最小的窄带码本矢量;
判断所述误差距离最小的窄带码本矢量与所述窄带特征矢量之间误差距离是否小于预设的误差阈值;
如果是,则将所述误差距离最小的窄带码本矢量映射到预先训练好的宽带码本中,获得宽带码本矢量,作为所述宽带特征矢量;
如果否,则对所述窄带特征矢量进行加权的码本映射处理,获得宽带特征矢量。
9.根据权利要求8所述的语音信号带宽扩展的装置,其特征在于,所述码本映射单元具体还用于:
从所述窄带码本中获取N+1个窄带码本矢量a0、a1、a2、…、aN,每个所述窄带码本矢量的长度均为N,与所述窄带特征矢量x=[x1,x2,…,xN]共同组成矩阵方程组:
当所述矩阵方程组有解时,获得所述矩阵方程组的解z1、z2、z3、……、zN;
当所述矩阵方程组无解时,从所述窄带码本中获取一个新的窄带码本矢量,替换所述N+1个窄带码本矢量中的一个窄带码本矢量,重新组成新的矩阵方程组;
根据所述矩阵方程组的解,确定加权系数:
将获取的所述窄带码本矢量a0、a1、a2、…、aN映射到预先训练好的宽带码本中,获得宽带码本矢量b0、b1、b2、…、bN,每个所述宽带码本矢量的长度均为L;
根据所述加权系数和宽带码本矢量,确定所述宽带特征矢量:
10.根据权利要求6至9任一项所述的语音信号带宽扩展的装置,其特征在于,所述能量估计模块具体用于:
获取所述高频信号中各采样点的峰值;
确定所述高频信号的能量值或其中fk为所述高频信号中第k个采样点的峰值,M为所述高频信号中采样点的总个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310284770.9A CN103413557B (zh) | 2013-07-08 | 2013-07-08 | 语音信号带宽扩展的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310284770.9A CN103413557B (zh) | 2013-07-08 | 2013-07-08 | 语音信号带宽扩展的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103413557A CN103413557A (zh) | 2013-11-27 |
CN103413557B true CN103413557B (zh) | 2017-03-15 |
Family
ID=49606560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310284770.9A Active CN103413557B (zh) | 2013-07-08 | 2013-07-08 | 语音信号带宽扩展的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103413557B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103700370B (zh) * | 2013-12-04 | 2016-08-17 | 北京中科模识科技有限公司 | 一种广播电视语音识别系统方法及系统 |
CN108156307B (zh) * | 2016-12-02 | 2020-09-08 | 塞舌尔商元鼎音讯股份有限公司 | 语音处理的方法以及语音通讯装置 |
TWI684368B (zh) * | 2017-10-18 | 2020-02-01 | 宏達國際電子股份有限公司 | 獲取高音質音訊轉換資訊的方法、電子裝置及記錄媒體 |
CN107886966A (zh) * | 2017-10-30 | 2018-04-06 | 捷开通讯(深圳)有限公司 | 终端及其优化语音命令的方法、存储装置 |
CN108198571B (zh) * | 2017-12-21 | 2021-07-30 | 中国科学院声学研究所 | 一种基于自适应带宽判断的带宽扩展方法及系统 |
CN109147807B (zh) * | 2018-06-05 | 2023-06-23 | 安克创新科技股份有限公司 | 一种基于深度学习的音域平衡方法、装置及系统 |
CN110556122B (zh) | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
CN112530454B (zh) * | 2020-11-30 | 2024-07-23 | 厦门亿联网络技术股份有限公司 | 一种窄带语音信号检测方法、装置、系统和可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101221757A (zh) * | 2008-01-24 | 2008-07-16 | 中兴通讯股份有限公司 | 高频杂音处理方法及分析方法 |
CN101527138A (zh) * | 2008-03-05 | 2009-09-09 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
CN102543089A (zh) * | 2012-01-17 | 2012-07-04 | 大连理工大学 | 一种窄带码流转换为宽带码流的转换装置及其转换方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
KR20070115637A (ko) * | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
EP2502230B1 (en) * | 2009-11-19 | 2014-05-21 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved excitation signal bandwidth extension |
ES2719102T3 (es) * | 2010-04-16 | 2019-07-08 | Fraunhofer Ges Forschung | Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega |
-
2013
- 2013-07-08 CN CN201310284770.9A patent/CN103413557B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101221757A (zh) * | 2008-01-24 | 2008-07-16 | 中兴通讯股份有限公司 | 高频杂音处理方法及分析方法 |
CN101527138A (zh) * | 2008-03-05 | 2009-09-09 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
CN102543089A (zh) * | 2012-01-17 | 2012-07-04 | 大连理工大学 | 一种窄带码流转换为宽带码流的转换装置及其转换方法 |
Non-Patent Citations (4)
Title |
---|
Artificial bandwidth extension of narrow-band speech signals via high-band energy estimation;Tenkasi Ramabadran et al.;《Signal Processing Conference, 2008 16th European》;20080829;第1-5页 * |
Artificial Bandwidth Extension of Telephony Speech by Data Hiding;Siyue Chen et al.;《2005 IEEE International Symposium on Circuits and Systems》;20051231;第3151-3154页 * |
基于码本映射的语音带宽扩展算法研究;薛梅 等;《电子设计工程》;20101130;第18卷(第11期);第75-77页、第81页 * |
电话语音的频带扩展;唐金峰;《中国优秀硕士学位论文全文数据库 信息科技辑》;20090915(第09期);第7-36页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103413557A (zh) | 2013-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103413557B (zh) | 语音信号带宽扩展的方法和装置 | |
CN104157293B (zh) | 一种增强声环境中目标语音信号拾取的信号处理方法 | |
CN107845389A (zh) | 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法 | |
CN105741849B (zh) | 数字助听器中融合相位估计与人耳听觉特性的语音增强方法 | |
AU2010227994B2 (en) | Method and device for audio signal classifacation | |
CN101685638B (zh) | 一种语音信号增强方法及装置 | |
CN101154384B (zh) | 声音信号纠正方法、声音信号纠正设备以及计算机程序 | |
CN110867181A (zh) | 基于scnn和tcnn联合估计的多目标语音增强方法 | |
CN109643554A (zh) | 自适应语音增强方法和电子设备 | |
CN112581973B (zh) | 一种语音增强方法及系统 | |
CN101976566A (zh) | 语音增强方法及应用该方法的装置 | |
CN105957537A (zh) | 一种基于l1/2稀疏约束卷积非负矩阵分解的语音去噪方法和系统 | |
CN110444224B (zh) | 一种基于生成式对抗网络的语音处理方法及装置 | |
CN105070296A (zh) | 一种活性因子集员成比例子带自适应回声消除方法 | |
CN108198571A (zh) | 一种基于自适应带宽判断的带宽扩展方法及系统 | |
CN104217730A (zh) | 一种基于k-svd的人工语音带宽扩展方法及装置 | |
CN110010144A (zh) | 语音信号增强方法及装置 | |
CN115273884A (zh) | 基于频谱压缩和神经网络的多阶段全频带语音增强方法 | |
CN108010321B (zh) | 一种交通流预测方法 | |
CN112634927B (zh) | 一种短波信道语音增强方法 | |
US8064699B2 (en) | Method and device for ascertaining feature vectors from a signal | |
CN105654959A (zh) | 一种自适应滤波的系数更新方法及装置 | |
CN101320565B (zh) | 感知加权滤波方法及感知加权滤波器 | |
CN112562702B (zh) | 基于循环帧序列门控循环单元网络的语音超分辨率方法 | |
Seidel et al. | Efficient deep acoustic echo suppression with condition-aware training |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |