CN104143336B - 一种获取语音信号的平滑谱的方法和装置 - Google Patents

一种获取语音信号的平滑谱的方法和装置 Download PDF

Info

Publication number
CN104143336B
CN104143336B CN201310207404.3A CN201310207404A CN104143336B CN 104143336 B CN104143336 B CN 104143336B CN 201310207404 A CN201310207404 A CN 201310207404A CN 104143336 B CN104143336 B CN 104143336B
Authority
CN
China
Prior art keywords
mrow
msup
omega
cos
line spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310207404.3A
Other languages
English (en)
Other versions
CN104143336A (zh
Inventor
吴小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310207404.3A priority Critical patent/CN104143336B/zh
Priority to PCT/CN2013/087674 priority patent/WO2014190691A1/en
Priority to US14/165,764 priority patent/US20140358529A1/en
Publication of CN104143336A publication Critical patent/CN104143336A/zh
Application granted granted Critical
Publication of CN104143336B publication Critical patent/CN104143336B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种获取语音信号的平滑谱的方法和装置:获取待处理的语音信号的各线谱对参数;分别计算各线谱对参数的余弦值;针对各预定频率点,分别计算该预定频率点的余弦值,并根据计算出的该预定频率点的余弦值以及各线谱对参数的余弦值,计算出该预定频率点的平滑谱值;根据计算出的各预定频率点的平滑谱值生成该语音信号的平滑谱。应用本发明所述方案,能够减少计算量和时耗。

Description

一种获取语音信号的平滑谱的方法和装置
技术领域
本发明涉及语音信号处理技术,特别涉及一种获取语音信号的平滑谱的方法和装置。
背景技术
在语音信号处理技术中,针对接收到的语音信号,可能需要进一步获取其平滑谱,以便更好地对语音信号的特征进行分析等,平滑谱是指去除语音信号中的基频效应后的对数幅度谱。
现有技术中,通常采用以下方式来获取语音信号的平滑谱:首先,获取语音信号的线谱对(LSP,LinearSpectrumPairs)参数;之后,将LSP参数转换为线性预测编码(LPC,LinearPredictionCoding)参数;之后,对LPC参数作快速傅立叶变换(FFT,FastFourierTransform)处理等,从而得到语音信号的平滑谱。
但是,上述方式在实际应用中会存在一定的问题,如:将LSP参数转换为LPC参数需要很大的计算量,相应地,也会非常耗时。
发明内容
有鉴于此,本发明提供了一种获取语音信号的平滑谱的方法和装置,能够减少计算量和时耗。
本发明的技术方案是这样实现的:
一种获取语音信号的平滑谱的方法,包括:
获取待处理的语音信号的各LSP参数;
分别计算各LSP参数的余弦值;
针对各预定频率点,分别计算该预定频率点的余弦值,并根据计算出的该预定频率点的余弦值以及各LSP参数的余弦值,计算出该预定频率点的平滑谱值;
根据计算出的各预定频率点的平滑谱值生成所述语音信号的平滑谱。
一种获取语音信号的平滑谱的装置,包括:
第一处理模块,用于获取待处理的语音信号的各LSP参数,并发送给第二处理模块;
所述第二处理模块,用于分别计算各LSP参数的余弦值;并针对各预定频率点,分别计算该预定频率点的余弦值,根据计算出的该预定频率点的余弦值以及各LSP参数的余弦值,计算出该预定频率点的平滑谱值,发送给第三处理模块;
所述第三处理模块,用于根据计算出的各预定频率点的平滑谱值生成所述语音信号的平滑谱。
可见,采用本发明所述方案,只需根据各预定频率点的余弦值以及各LSP参数的余弦值,即可计算出各预定频率点的平滑谱值,并进而根据各预定频率点的平滑谱值生成语音信号的平滑谱,也就是说,相比于现有技术,本发明所述方案中无需将LSP参数转换为LPC参数,从而减少了计算量,相应地,也减少了时耗。
附图说明
图1为本发明获取语音信号的平滑谱的方法实施例的流程图。
图2为本发明获取语音信号的平滑谱的装置实施例的组成结构示意图。
具体实施方式
针对现有技术中存在的问题,本发明中提出一种获取语音信号的平滑谱的方案,能够减少计算量和时耗。
本发明所述方案的实现思想如下一)~五)部分所示。
一)
对于语音信号来说,任一频率点的平滑谱值的计算公式为:
d(ω)=-10lg|A(ω)|2;(1)
其中, A ( ω ) = Σ i = 0 p a i e - jωi ( a 0 = 1 ) ; - - - ( 2 )
式(2)中的ai(i≠0)为语音信号的LPC参数,p表示LPC参数的个数,LPC参数的个数等于LSP参数的个数,||表示求模运算,ω表示任一频率点,j为虚数单位。
LPC参数为语音信号使用线性预测编码得到的参数,LSP参数为描述语音信号的另一种参数,LSP参数和LPC参数之间可以相互转换,LSP参数的取值介于0到π(圆周率)之间。
二)
根据LPC参数转LSP参数的原理,LSP参数是由以下两式等于0的根得到的:
P(ω)=A(ω)+e-jω(p+1)A(-ω);(3)
Q(ω)=A(ω)-e-jω(p+1)A(-ω);(4)
P(ω)=0和Q(ω)=0均有互为相反数的根。
具体来说,当p为偶数时,π为P(ω)=0的一个根,0为Q(ω)=0的一个根,用±ωi来表示P(ω)=0的其它根,用±θi来表示Q(ω)=0的其它根,则有:
0<ω1122<…<ωp/2p/2<π;(5)
当p为奇数时,0和π均为Q(ω)=0的根,用±ωi来表示P(ω)=0的根,用±θi来表示Q(ω)=0的其它根,则有:
0<ω11<…<θ(p-1)/2(p+1)/2<π;(6)
由于LSP参数的取值需要介于0到π之间,因此,0、π以及-ωi和-θi均不能作为LSP参数,也就是说,只有+ωi和+θi可以作为LSP参数,两者通常交替出现,即:(ω1122,…)为语音信号的LSP参数。
三)
依据式(3)和(4)可以推导出:
|P(ω)+Q(ω)|=2|A(ω)|;(7)
|P(ω)-Q(ω)|=2|A(ω)|;(8)
由于P(ω)和Q(ω)满足式(7)和(8)所示关系,因此可知,P(ω)与Q(ω)正交,那么,根据勾股定理,即可推导出:
|A(ω)|2=[|P(ω)|2+|Q(ω)|2]/4。(9)
四)
依据之前的介绍可知,当p为偶数时,P(ω)=0共有p+1个根,分别为:π(一个)、+ωi(p/2个)和-ωi(p/2个),那么,根据根与系数的关系,则可将P(ω)表示为:
P ( &omega; ) = ( 1 - e j ( &omega; - &pi; ) ) &Pi; i = 1 p / 2 [ ( 1 - e j ( &omega; - &omega; i ) ) ( 1 - e j ( &omega; + &omega; i ) ) ] ; - - - ( 10 )
相应地,则有:
| P ( &omega; ) | 2 = 2 p + 1 [ 1 + cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 . - - - ( 11 )
类似地,
当p为偶数时,Q(ω)=0共有p+1个根,分别为:0(一个)、+θi(p/2个)和-θi(p/2个),那么,根据根与系数的关系,则可将Q(ω)表示为:
Q ( &omega; ) = ( 1 - e j&omega; ) &Pi; i = 1 p / 2 [ ( 1 - e j ( &omega; - &theta; i ) ) ( 1 - e j ( &omega; + &theta; i ) ) ] ; - - - ( 12 )
相应地,则有:
| Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 . - - - ( 13 )
类似地,
当p为奇数时,P(ω)=0共有p+1个根,分别为:+ωi((p+1)/2个)和-ωi((p+1)/2个),那么,根据根与系数的关系,则可将P(ω)表示为:
P ( &omega; ) = &Pi; i = 1 ( p + 1 ) / 2 [ ( 1 - e j ( &omega; - &omega; i ) ) ( 1 - e j ( &omega; + &omega; i ) ) ] ; - - - ( 14 )
相应地,则有:
| P ( &omega; ) | 2 = 2 p + 1 { &Pi; i = 1 ( p + 1 ) / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 . - - - ( 15 )
类似地,
当p为奇数时,Q(ω)=0共有p+1个根,分别为:0(一个)、π(一个)、+θi((p-1)/2个)和-θi((p-1)/2个),那么,根据根与系数的关系,则可将Q(ω)表示为:
Q ( &omega; ) = ( 1 - e j&omega; ) ( 1 - e j ( &omega; - &pi; ) ) &Pi; i = 1 ( p - 1 ) / 2 [ ( 1 - e j ( &omega; - &theta; i ) ) ( 1 - e j ( &omega; + &theta; i ) ) ] ; - - - ( 16 )
相应地,则有:
| Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos 2 ( &omega; ) ] { &Pi; i = 1 ( p - 1 ) / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 . - - - ( 17 )
五)
结合式(1)、(9)、(11)、(13)、(15)和(17)可以看出,针对任一频率点,只需计算出该频率点的余弦值,并分别计算出各LSP参数(如前所述,(ω1122,…)即为LSP参数)的余弦值,然后,将该频率点的余弦值以及各LSP参数的余弦值分别代入到式(11)和(13)或式(15)和(17)中,即可得到该频率点的|P(ω)|2和|Q(ω)|2,之后,通过式(9),即可计算出该频率点的|A(ω)|2,再之后,通过式(1),即可最终计算出该频率点的平滑谱值d(ω)。
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步的详细说明。
图1为本发明获取语音信号的平滑谱的方法实施例的流程图。如图1所示,包括:
步骤11:获取待处理的语音信号的各LSP参数。
如何获取为现有技术。
步骤12:分别计算各LSP参数的余弦值。
本步骤中,可首先将步骤11中获取到的各LSP参数按照预定规则划分为两组,之后,分别计算每组中的各LSP参数的余弦值。
从式(11)和(15)可以看出,在计算|P(ω)|2时,会用到cos(ωi),而不会用到cos(θi),从式(13)和(17)可以看出,在计算|Q(ω)|2时,会用到cos(θi),而不会用到cos(ωi),因此,可针对步骤11中获取到的各LSP参数,将为P(ω)=0的根的各LSP参数划分为一组,为便于表述,将其称之为第一组,将为Q(ω)=0的根的各LSP参数划分为另一组,为便于表述,将其称之为第二组,并且,分别计算第一组和第二组中的各LSP参数的余弦值。
步骤13:针对各预定频率点,分别计算该预定频率点的余弦值,并根据计算出的该预定频率点的余弦值以及各LSP参数的余弦值,计算出该预定频率点的平滑谱值。
对应于步骤12,本步骤中,对于任一预定频率点,可根据第一组中的各LSP参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第一中间量|P(ω)|2,根据第二组中的各LSP参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第二中间量|Q(ω)|2
具体来说,当p为偶数时,即步骤11中获取到的LSP参数的个数为偶数时,
| P ( &omega; ) | 2 = 2 p + 1 [ 1 + cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ; - - - ( 11 )
| Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ; - - - ( 13 )
其中,cos(ωi)表示第一组中的各LSP参数的余弦值,cos(θi)表示第二组中的各LSP参数的余弦值,cos(ω)表示该预定频率点的余弦值,||表示求模运算。
当p为奇数时,
| P ( &omega; ) | 2 = 2 p + 1 { &Pi; i = 1 ( p + 1 ) / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ; - - - ( 15 )
| Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos 2 ( &omega; ) ] { &Pi; i = 1 ( p - 1 ) / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 . - - - ( 17 )
对于任一预定频率点,在得到该预定频率点的|P(ω)|2和|Q(ω)|2之后,即可根据|P(ω)|2和|Q(ω)|2进一步计算出该预定频率点的平滑谱值d(ω),计算方式为:
首先,计算|A(ω)|2=[|P(ω)|2+|Q(ω)|2]/4;(9)
之后,计算d(ω)=-10lg|A(ω)|2。(1)
步骤14:根据计算出的各预定频率点的平滑谱值生成该语音信号的平滑谱。
本步骤中,根据计算出的各预定频率点的平滑谱值绘制生成该语音信号的平滑谱,如何生成为现有技术。
基于上述介绍,图2为本发明获取语音信号的平滑谱的装置实施例的组成结构示意图。如图2所示,包括:
第一处理模块21,用于获取待处理的语音信号的各LSP参数,并发送给第二处理模块22;
第二处理模块22,用于分别计算各LSP参数的余弦值;并针对各预定频率点,分别计算该预定频率点的余弦值,根据计算出的该预定频率点的余弦值以及各LSP参数的余弦值,计算出该预定频率点的平滑谱值,发送给第三处理模块23;
第三处理模块23,用于根据计算出的各预定频率点的平滑谱值生成所述语音信号的平滑谱。
其中,第二处理模块22中可具体包括:
第一处理单元221,用于按照预定规则将各LSP参数划分为两组,分别计算每组中的各LSP参数的余弦值,并发送给第二处理单元222;
第二处理单元222,用于针对各预定频率点,分别根据其中一组中的各LSP参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第一中间量|P(ω)|2,根据另外一组中的各LSP参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第二中间量|Q(ω)|2,并根据|P(ω)|2和|Q(ω)|2计算出该预定频率点的平滑谱值,发送给第三处理模块23。
具体地,
第一处理单元221可将为P(ω)=0的根的各LSP参数划分为第一组,将为Q(ω)=0的根的各LSP参数划分为第二组;
相应地,
| P ( &omega; ) | 2 = 2 p + 1 [ 1 + cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ; - - - ( 11 )
| Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ; - - - ( 13 )
其中,cos(ωi)表示第一组中的各LSP参数的余弦值,cos(θi)表示第二组中的各LSP参数的余弦值,p表示第一组和第二组中的LSP参数的总个数,p为偶数,cos(ω)表示该预定频率点的余弦值,||表示求模运算;
或者,
| P ( &omega; ) | 2 = 2 p + 1 { &Pi; i = 1 ( p + 1 ) / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ; - - - ( 15 )
| Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos 2 ( &omega; ) ] { &Pi; i = 1 ( p - 1 ) / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ; - - - ( 17 )
其中,cos(ωi)表示第一组中的各LSP参数的余弦值,cos(θi)表示第二组中的各LSP参数的余弦值,p表示第一组和第二组中的LSP参数的总个数,p为奇数,cos(ω)表示该预定频率点的余弦值,||表示求模运算。
另外,
第二处理单元222计算|A(ω)|2=[|P(ω)|2+|Q(ω)|2]/4;(9)
并计算d(ω)=-10lg|A(ω)|2;(1)
将计算出的d(ω)作为该预定频率点的平滑谱值。
图2所示装置实施例的具体工作流程请参照前述方法实施例中的相应说明,此处不再赘述。
总之,采用本发明所述方案,只需根据各预定频率点的余弦值以及各LSP参数的余弦值,即可计算出各预定频率点的平滑谱值,并进而根据各预定频率点的平滑谱值生成语音信号的平滑谱,也就是说,相比于现有技术,本发明所述方案中无需将LSP参数转换为LPC参数,从而减少了计算量,相应地,也减少了时耗。
而且,本发明所述方案中,可根据需要灵活设置各预定频率点的取值以及预定频率点的个数,比如,如果比较关心某一频率范围,则可在该频率范围内多设置一些频率点,从而使得该频率范围对应的平滑谱更为精确,反之,如果不太关心某一频率范围,则可在该频率范围内少设置一些频率点,而现有技术中,由于采用了FFT技术,因此只能全频段均匀的设置频率点,显然,相比于现有技术,本发明所述方案实现起来更为灵活方便。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种获取语音信号的平滑谱的方法,其特征在于,包括:
获取待处理的语音信号的各线谱对参数;
分别计算各线谱对参数的余弦值;
针对各预定频率点,分别计算该预定频率点的余弦值,并根据计算出的该预定频率点的余弦值以及各线谱对参数的余弦值,计算出该预定频率点的平滑谱值;
根据计算出的各预定频率点的平滑谱值生成所述语音信号的平滑谱。
2.根据权利要求1所述的方法,其特征在于,
所述分别计算各线谱对参数的余弦值包括:按照预定规则将各线谱对参数划分为两组,分别计算每组中的各线谱对参数的余弦值;
所述计算出该预定频率点的平滑谱值包括:根据其中一组中的各线谱对参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第一中间量|P(ω)|2,根据另外一组中的各线谱对参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第二中间量|Q(ω)|2;根据所述|P(ω)|2和所述|Q(ω)|2计算出该预定频率点的平滑谱值。
3.根据权利要求2所述的方法,其特征在于,
所述按照预定规则将各线谱对参数划分为两组包括:将为P(ω)=0的根的各线谱对参数划分为第一组,将为Q(ω)=0的根的各线谱对参数划分为第二组;
所述 | P ( &omega; ) | 2 = 2 p + 1 [ 1 + cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ;
所述 | Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ;
其中,所述cos(ωi)表示所述第一组中的各线谱对参数的余弦值,所述cos(θi)表示所述第二组中的各线谱对参数的余弦值,所述p表示所述第一组和所述第二组中的线谱对参数的总个数,所述p为偶数,所述cos(ω)表示该预定频率点的余弦值,所述||表示求模运算。
4.根据权利要求2所述的方法,其特征在于,
所述按照预定规则将各线谱对参数划分为两组包括:将为P(ω)=0的根的各线谱对参数划分为第一组,将为Q(ω)=0的根的各线谱对参数划分为第二组;
所述 | P ( &omega; ) | 2 = 2 p + 1 { &Pi; i = 1 ( p + 1 ) / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ;
所述 | Q ( &omega; ) | 2 = 2 p + 1 [ 1 - co s 2 ( &omega; ) ] { &Pi; i = 1 ( p - 1 ) / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ;
其中,所述cos(ωi)表示所述第一组中的各线谱对参数的余弦值,所述cos(θi)表示所述第二组中的各线谱对参数的余弦值,所述p表示所述第一组和所述第二组中的线谱对参数的总个数,所述p为奇数,所述cos(ω)表示该预定频率点的余弦值,所述||表示求模运算。
5.根据权利要求2、3或4所述的方法,其特征在于,所述根据所述|P(ω)|2和所述|Q(ω)|2计算出该预定频率点的平滑谱值包括:
计算|A(ω)|2=[|P(ω)|2+|Q(ω)|2]/4;
计算d(ω)=-10lg|A(ω)|2,将计算出的d(ω)作为该预定频率点的平滑谱值。
6.一种获取语音信号的平滑谱的装置,其特征在于,包括:
第一处理模块,用于获取待处理的语音信号的各线谱对参数,并发送给第二处理模块;
所述第二处理模块,用于分别计算各线谱对参数的余弦值;并针对各预定频率点,分别计算该预定频率点的余弦值,根据计算出的该预定频率点的余弦值以及各线谱对参数的余弦值,计算出该预定频率点的平滑谱值,发送给第三处理模块;
所述第三处理模块,用于根据计算出的各预定频率点的平滑谱值生成所述语音信号的平滑谱。
7.根据权利要求6所述的装置,其特征在于,所述第二处理模块中包括:
第一处理单元,用于按照预定规则将各线谱对参数划分为两组,分别计算每组中的各线谱对参数的余弦值,并发送给第二处理单元;
所述第二处理单元,用于针对各预定频率点,分别根据其中一组中的各线谱对参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第一中间量|P(ω)|2,根据另外一组中的各线谱对参数的余弦值以及该预定频率点的余弦值,计算出该预定频率点的第二中间量|Q(ω)|2,并根据所述|P(ω)|2和所述|Q(ω)|2计算出该预定频率点的平滑谱值,发送给所述第三处理模块。
8.根据权利要求7所述的装置,其特征在于,
所述第一处理单元将为P(ω)=0的根的各线谱对参数划分为第一组,将为Q(ω)=0的根的各线谱对参数划分为第二组;
所述 | P ( &omega; ) | 2 = 2 p + 1 [ 1 + cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ;
所述 | Q ( &omega; ) | 2 = 2 p + 1 [ 1 - cos ( &omega; ) ] { &Pi; i = 1 p / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ;
其中,所述cos(ωi)表示所述第一组中的各线谱对参数的余弦值,所述cos(θi)表示所述第二组中的各线谱对参数的余弦值,所述p表示所述第一组和所述第二组中的线谱对参数的总个数,所述p为偶数,所述cos(ω)表示该预定频率点的余弦值,所述||表示求模运算。
9.根据权利要求7所述的装置,其特征在于,
所述第一处理单元将为P(ω)=0的根的各线谱对参数划分为第一组,将为Q(ω)=0的根的各线谱对参数划分为第二组;
所述 | P ( &omega; ) | 2 = 2 p + 1 { &Pi; i = 1 ( p + 1 ) / 2 [ cos ( &omega; ) - cos ( &omega; i ) ] } 2 ;
所述 | Q ( &omega; ) | 2 = 2 p + 1 [ 1 - co s 2 ( &omega; ) ] { &Pi; i = 1 ( p - 1 ) / 2 [ cos ( &omega; ) - cos ( &theta; i ) ] } 2 ;
其中,所述cos(ωi)表示所述第一组中的各线谱对参数的余弦值,所述cos(θi)表示所述第二组中的各线谱对参数的余弦值,所述p表示所述第一组和所述第二组中的线谱对参数的总个数,所述p为奇数,所述cos(ω)表示该预定频率点的余弦值,所述||表示求模运算。
10.根据权利要求7、8或9所述的装置,其特征在于,
所述第二处理单元计算|A(ω)|2=[|P(ω)|2+|Q(ω)|2]/4,并计算d(ω)=-10lg|A(ω)|2,将计算出的d(ω)作为该预定频率点的平滑谱值。
CN201310207404.3A 2013-05-29 2013-05-29 一种获取语音信号的平滑谱的方法和装置 Active CN104143336B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310207404.3A CN104143336B (zh) 2013-05-29 2013-05-29 一种获取语音信号的平滑谱的方法和装置
PCT/CN2013/087674 WO2014190691A1 (en) 2013-05-29 2013-11-22 Systems, devices and methods for processing speech signals
US14/165,764 US20140358529A1 (en) 2013-05-29 2014-01-28 Systems, Devices and Methods for Processing Speech Signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310207404.3A CN104143336B (zh) 2013-05-29 2013-05-29 一种获取语音信号的平滑谱的方法和装置

Publications (2)

Publication Number Publication Date
CN104143336A CN104143336A (zh) 2014-11-12
CN104143336B true CN104143336B (zh) 2015-12-02

Family

ID=51852494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310207404.3A Active CN104143336B (zh) 2013-05-29 2013-05-29 一种获取语音信号的平滑谱的方法和装置

Country Status (2)

Country Link
CN (1) CN104143336B (zh)
WO (1) WO2014190691A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1632863A (zh) * 2004-12-03 2005-06-29 清华大学 一种超帧声道参数平滑和抽取矢量量化的方法
CN1947174A (zh) * 2004-04-27 2007-04-11 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863199A (ja) * 1994-08-24 1996-03-08 Matsushita Electric Ind Co Ltd ベクトル量子化装置
WO2001033548A1 (fr) * 1999-10-29 2001-05-10 Fujitsu Limited Dispositif et procede de reglage du debit dans un systeme de codage de la parole a debit variable
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1947174A (zh) * 2004-04-27 2007-04-11 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
CN1632863A (zh) * 2004-12-03 2005-06-29 清华大学 一种超帧声道参数平滑和抽取矢量量化的方法

Also Published As

Publication number Publication date
WO2014190691A1 (en) 2014-12-04
CN104143336A (zh) 2014-11-12

Similar Documents

Publication Publication Date Title
US20140211947A1 (en) Method and apparatus for generating and restoring downmixed signal
CA2656867A1 (en) Apparatus and method for combining multiple parametrically coded audio sources
JP2014197850A5 (zh)
EP4346175A3 (en) Reference signal transmission method, device, and system
CN109074814B (zh) 一种噪声检测方法及终端设备
RU2017134071A (ru) Предсказание на основе модели в наборе фильтров с критической дискретизацией
KR20160077201A (ko) 스테레오 위상 파라미터 인코딩 방법 및 장치
CN110031083A (zh) 一种噪音总声压级测量方法、系统及计算机可读存储介质
CN104502675B (zh) 电力信号的基波幅值测量方法和系统
JP2016529801A5 (zh)
CN104502701A (zh) 基于相位调制检测电力信号频率的方法和系统
CN109285553A (zh) 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN104143336B (zh) 一种获取语音信号的平滑谱的方法和装置
CN109743269A (zh) 一种基于数据拟合的水声ofdm信道重构方法
CN104143337A (zh) 一种提高音频信号音质的方法和装置
CN104483545B (zh) 电力系统的谐波测量方法及系统
US20160183023A1 (en) Audio file playing method and apparatus
CN102543091A (zh) 一种模拟音效的生成系统及方法
CN104849551B (zh) 一种谐相角分析方法
CN110221125B (zh) 一种采用直流分量恢复的直流系统谐波分析方法
CN103929143A (zh) 一种获取滤波器幅频响应特性的方法
JP6052998B2 (ja) 聴覚の時間分解能測定装置とその方法
US20140358529A1 (en) Systems, Devices and Methods for Processing Speech Signals
CN104459316B (zh) 电力系统的分次谐波测量方法及系统
RU2015156490A (ru) Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200825

Address after: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Co-patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.