CN203038659U - 一种可任意调节的语音自然变声装置 - Google Patents

一种可任意调节的语音自然变声装置 Download PDF

Info

Publication number
CN203038659U
CN203038659U CN 201220055999 CN201220055999U CN203038659U CN 203038659 U CN203038659 U CN 203038659U CN 201220055999 CN201220055999 CN 201220055999 CN 201220055999 U CN201220055999 U CN 201220055999U CN 203038659 U CN203038659 U CN 203038659U
Authority
CN
China
Prior art keywords
voice
input
module
signal
processing module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201220055999
Other languages
English (en)
Inventor
宁更新
刘元庆
韦岗
杨萃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN 201220055999 priority Critical patent/CN203038659U/zh
Application granted granted Critical
Publication of CN203038659U publication Critical patent/CN203038659U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

本实用新型公开一种可任意调节的语音自然变声装置,装置包括电源模块、输入输出模块、控制模块和处理模块,控制模块将参数送至处理模块并控制系统运行的起止。由输入输出模块输入声音信号,并转化为数字信号,送入处理模块中,处理模块根据输入的参数对信号进行处理,形成变声信号后送入输入输出模块,再转化为模拟信号,并由音箱输出。本实用新型使变声后的信号可以有很自然的声音效果,且可任意调节。本实用新型中装置简单,容易实现,且设备成本低廉,使用方便。

Description

一种可任意调节的语音自然变声装置
技术领域
本实用新型涉及语音信号处理技术,具体涉及一种将语音信号在声道中进行建模,再改变声道的模型,获得变声信号的装置。
背景技术
利用信号处理的方法改变语音信号的音调和音色,实现语音变声,甚至男女声的互相变换,既是语音信号处理的重要理论研究内容,同时也具有很强的应用价值。男女声频率的范围存在很大差异,男声频率范围大约在80—7000HZ,而女声的频率范围大约在150—11000HZ,比男声高了几乎一倍。如果要实现男女声的互相变换,那么就一定要改变语音信号的频率,使之提高或降低一个水平,这样就可以达到变声的目的。目前已有不少的方法应用于语音变声,最常用的大概是基于以下两种思想,以将男声变为女声为例,第一种方法是将语音信号在时域进行处理,通过缩短时域长度来提高信号的频率,使之变为女声,再通过插值使新信号与原信号保持一致(CN03137014.4);第二种方法是在频域进行处理,主要就是对频谱搬移,即将语音信号先进行插值或抽检,再对其作傅里叶变换,在频域上使其频谱整体向高频率范围移动一段距离,最后再将其变换回时域,通过这种方法也可以达到使语音信号频率提高的效果,最终实现变声的目的(CN200410062337.1)。
由此可以看到,目前的语音变声方法都是将信号在频域或时域进行直接处理,使之频率改变,从而达到变声的效果。但是这些方法都没从发音系统角度出发设计,使得变声后语音的谐波关系保持的不佳,造成了语音的不自然。此外,现有的方法只能在几种特定的声音模式之间进行切换,无法做到根据要求快速地随意进行变声。
本实用新型从声音的产生过程出发,提出了一种在系统域进行变换来实现变声的装置,可以有效解决上述方法中的不足,在实现语音变声的同时,保证了声音的质量。
实用新型内容
本实用新型的目的在于克服现有变声方法存在的声音不自然、有机器味、不能随意变成任何人声音等不足,提供一种可任意调节的语音自然变声装置,具体技术方案如下。
本实用新型还提供实现所述语音自然变声方法的装置,其包括电源模块、输入输出模块、控制模块和处理模块,其中,所述控制模块与处理模块及输入输出模块相连接,用于向处理模块输入变声参数及控制整个装置开始及结束工作;所述输入输出模块与处理模块相连接,用于向处理模块输入激励信号及输出变声后声音信号,并在输入输出前进行数字/模拟信号的互相转化;处理模块用于根据输入的变声参数,对输入信号进行变声,并将变声后的信号送入输入输出模块。上述装置还可包括接口模块,接口模块与处理模块和电源模块相连。如果输出信号需要在某些系统中进行使用,则由接口模块完成传送。所述接口模块可以是USB接口。
上述装置中,所述输入输出模块包括麦克风、音箱及A/D转换器和D/A转换器,麦克风的输出端通过A/D转换器与处理模块的输入端连接,音箱的输入端通过D/A转换器与处理模块的输出端连接。由操作者输入参数至控制模块,控制模块将参数送至处理模块并控制系统运行的起止。由输入输出模块的麦克风输入声音信号,并转化为数字信号,送入处理模块中,处理模块根据输入的参数对信号进行处理,形成变声信号后送入输入输出模块,再转化为模拟信号,并由音箱输出。
上述装置中,处理模块用于根据输入的变声参数,对输入信号进行变声,包括如下步骤:
步骤一、建立通过声道后的语音信号的声道模型:声带振动产生一个激励,通过口腔后形成一个语音信号G[n],使G[n]通过一个声道,输出一个信号y[n],该信号的声道模型为:
y [ n ] = G [ n ] + Σ i = 1 N a i y [ n - i ]      (公式1),
公式1中,系数ai即为声道模型的参数,G[n]表示为:
G [ n ] = Σ i = 0 N a i y [ n - i ]          (公式2);
步骤二、求出声道的系统传递函数:对语音信号G[n]进行Z变换,对上式两边同时进行Z变换,得到如下结果:
G ( z ) = Σ i = 0 N a i Y ( z ) z - i          (公式3),
将公式3作变换,将等号左边写为输出与输入函数的比值形式,即得到下式
Y ( z ) G ( z ) = 1 Σ i = 0 N a i z - i               (公式4),
公式4即为该声道系统函数H(z)
H ( z ) = 1 Σ i = 0 N a i z - i                   (公式5);
步骤三、求出声道的系统函数的极点:根据上面的表达式,求H(z)的极点即为求下面方程的根,
Σ i = 0 N a i z - i = 0               (公式6)
Σ i = 0 N a i z - i = Π i = 0 N ( 1 - ϵ i z - 1 ) = 0       (公式7)
解该方程,可以得到一组复数根
Figure GDA0000215055368
,即为系统函数H(z)的极点;
步骤四、根据输入的变声参数,对原声道系统的极点进行移位,在极点移位后,仍保持各次谐波的关系,故而在进行极点移位时,针对不同的极点要附加不同的移动距离,移位的过程如下,首先利用数字信号处理的估算方法算出基波的频率ω0,之后按照如下的方法将极点进行移位:
ϵ k ^ = λ r k e j ω k ( 1 + ω k ω 0 ) k = 1,2 . . . N  (公式8)
Figure GDA00002150553610
即为系统的新极点,N为正整数,其中,Δ为输入的语音变声参数,λ为音量调节参数,这样,在移位的过程中既调整了语音频率,又调整了音量大小;
步骤五、利用移位后的极点
Figure GDA00002150553611
重新恢复出新的
Figure GDA00002150553612
Figure GDA00002150553613
为新的语音声道的系数,这样,新的声道模型得以建立,由于各新极点即是方程
Figure GDA00002150553614
的根,则得到下式:
Π i = 0 N ( 1 - ϵ i ^ z - 1 ) = Σ i = 0 N a i ^ z - i       (公式10)
从而得到新声道的系统函数
H ( z ) ^ = 1 Σ i = 0 N a i ^ z - i              (公式11);
步骤六、将激励即语音信号G[n]输入新声道,得到新的语音信号模型,即为变声后的语音信号,最终得到变声后的语音信号为:
y [ n ] ^ = G [ n ] + Σ i = 0 N a i ^ y [ n - i ]       (公式12)。
本实用新型的优点有:
1.变声自然。由于本实用新型是从声音的产生过程出发,在系统域进行变换,没有进行插值或者抽值,故而可以完整地保留原语音信号的信息,使变声后的信号可以有很自然的声音效果。
2.可任意调节。本实用新型中,基频移位距离Δ及附加倍数λ都是可根据要求进行输入的参数,故而声音的音调及音量可以很方便地通过改变参数进行自由调节。
3.装置简单,容易实现,且设备成本低廉。
4.可适用范围广,使用方便,即插即用。本实用新型可以用在多种需变声的情况及系统中。
附图说明
图1为具体实施方式中装置的结构框图。
图2为本实用新型方法的原理框图。
图3为实施方式中可任意调节的语音自然变声方法的流程示意图。
图4为实施方式中声道输出频域图。
图5为实施方式中声道输出极点图。
图6为实施方式中极点移位后声道频域图。
图7为实施方式中移位后极点图。
具体实施方式
下文结合附图对本实用新型的具体实施方式(装置具体构成以及本实用新型装置的工作步骤)作进一步的说明,但本实用新型的实施不限于此。
本实施方式中的装置如图1所示,分为电源模块,输入输出模块,接口模块,控制模块和处理模块几个部分。其中,控制模块与处理模块及输入输出模块相连接,主要负责向处理模块输入外部参数及控制装置开始及结束工作。输入输出模块与处理模块相连接,其功能为向处理模块输入激励信号及输出变声后声音信号,另外在输入输出前进行数字/模拟信号的互相转化。处理模块为本装置核心部分,具体由一数字信号处理芯片构成,负责本装置的主要功能,即根据输入的参数,对输入信号进行变声。
装置主要的工作流程如下:
由操作者输入参数至控制模块,控制模块将参数送至处理模块并控制系统运行的起止。由输入输出模块的麦克风输入声音信号,并转化为数字信号,送入处理模块中,处理模块根据输入的参数对信号进行处理,形成变声信号后送入输入输出模块,再转化为模拟信号,并由音箱输出。如果输出信号需要在某些系统中进行使用,则由接口模块完成传送。
本实施方式的变声方法如附图3所示,是将语音信号在声道中进行建模,随后求出发音的系统模型,即声道的模型,之后再改变声道的模型,最后在新的声道模型中还原出语音信号,这个新输出的语音信号即为变声后的信号。
变声方法的步骤分为为以下几点,下面分别对每一步骤进行详细说明。
步骤一,建立通过声道后的语音信号的声道模型。
如图2所述,语音信号如人的声音,其发声原理为声带振动产生一个激励,通过口腔后形成一个声音信号G[n]。现在使G[n]通过一个声道,就会输出一个信号y[n],该信号的声道模型为:
y [ n ] = G [ n ] + Σ i = 1 N a i y [ n - i ]      (公式1)
公式1中,系数ai即为声道模型的参数。下面可以通过一些信号处理的方法检测出这个信号y[n]。同时,还可以根据一些数字信号处理的估计算法(如杜宾算法等)提取出该声道模型中的各项系数ai。这样,通过目前已知的y[n]和ai就可以得到系统的输入信号G[n]。G[n]可表示为:
G [ n ] = Σ i = 0 N a i y [ n - i ]          (公式2)
步骤二,求出发音系统的传递函数。
对语音信号G[n]进行Z变换。对上式两边同时进行Z变换,可以得到如下结果:
G ( z ) = Σ i = 0 N a i Y ( z ) z - i          (公式3)
将上式稍作变换,将等号左边写为输出与输入函数的比值形式,即可得到下式
Y ( z ) G ( z ) = 1 Σ i = 0 N a i z - i               (公式4)
公式4即为该声道的系统函数H[z]
H ( z ) = 1 Σ i = 0 N a i z - i                   (公式5)
第三,求出原发音系统H(z)的极点。根据上面的表达式,可以看到,求H(z)的极点即为求下面方程的根。
Σ i = 0 N a i z - i = 0               (公式6)
Σ i = 0 N a i z - i = Π i = 0 N ( 1 - ϵ i z - 1 ) = 0       (公式7)
解该方程,可以得到一组复数根
Figure GDA00002150553625
,即为系统函数H(z)的极点,如图4所示。这组极点对应系统频域的共振峰,即如图5所示语音频谱图中极大值点,εk对应第k个极大值点。
注意到,这组点是信号频谱图包络的极大值点,每个共振峰均为信号的某谐波次点,这些峰值点对应的频率为基频频率的某整数倍数。
步骤四,根据输入的变声参数,对原发音系统的极点进行移位。目前现有的频域移位的方法,其缺点即在于未能保证各谐波对应频率移位后仍保持谐波关系,故而造成声音的不自然。在极点移位后,必须仍保持各次谐波的关系才能达到良好的变声效果。故而在进行极点移位时,针对不同的极点要附加不同的移动距离。移位的过程如下,首先利用数字信号处理的方法(如自相关法)估算出基波的频率ω0。之后按照如下的方法将极点进行移位:
ϵ k ^ = λ r k e j ω k ( 1 + ω k ω 0 ) k = 1,2 . . . N  (公式8)
Figure GDA00002150553627
即为系统的新极点,N为正整数。如图6所示。其中,Δ为输入的语音变声参数,λ为音量调节参数。这样,在移位的过程中既调整了语音频率,又调整了音量大小,使声道能更加灵活和适应信号变声的需求。这组新极点对应于移位后的共振峰,如图7所示。
步骤五,利用移位后的极点
Figure GDA00002150553628
重新恢复出新的
Figure GDA00002150553629
Figure GDA00002150553630
为新的语音声道的系数,这样,新的声道模型得以建立。由于各新极点即是方程
Figure GDA00002150553631
的根,则我们据此即可得到下式:
Π i = 0 N ( 1 - ϵ i ^ z - 1 ) = Σ i = 0 N a i ^ z - i       (公式10)
从而可以得到新声道的系统函数
H ( z ) ^ = 1 Σ i = 0 N a i ^ z - i              (公式11)
步骤六,将激励G[n]输入新声道,得到新的语音信号模型,即为变声后的语音信号。最终得到变声后的语音信号为:
y [ n ] ^ = G [ n ] + Σ i = 0 N a i ^ y [ n - i ]       (公式12)
通过上述步骤,本实用新型实现了通过改变声道实现变声,克服了现有方法的缺点。
作为实例,本实施方式中的接口模块可以是USB接口。输入输出模块包括麦克风、音箱及A/D、D/A转换器。处理模块中的数字处理器可以用DSP芯片或者ARM等实现(如:TI公司TMS320C2812的DSP芯片)。
该实例装置的变声方法的主要步骤如下:
步骤一:输入操作参数,由控制模块接受操作模块信息,并把操作信息交给处理模块,操作参数信息包括语音变声参数Δ,音量调节参数λ以及数模转换器采样频率。现例如输入参数谐波次数N=5,Δ=10%,λ=0.8,则输入男声激励信号经过处理模块后,即可输出为新的女声语音信号
Figure GDA00002150553636
,从而实现了男女声的变换。
步骤二:由麦克风接受声音激励信号,并将信号传给处理模块中的A/D转换器采样,变为数字信号,输入数字处理器中。采样频率由步骤一输入。
步骤三:数字处理器中的处理步骤可参照图2,具体如下:
1.检测信号,得到一帧语音y[n]: y [ n ] = Σ i = 1 N a i y [ n - i ] + G [ n ]
2.提取声道参数ai,这时,可利用如下的算法:
首先,求出模型的自相关函数:
R y ( m ) = E [ y ( n ) y ( n - m ) ] = Σ i = 1 N a i y ( m + i ) + E [ G ( n ) y ( n - m ) ]
根据Yule-Walker方程,可把自相关函数表示如下:
R y ( m ) = Σ i = 1 N a i y ( m - i )
在上式中,取m=1,2…N,利用自相关函数的一个性质Rx(m)=Rx(-m),可得,
Rx(1)=a1Rx(0)+ a2Rx(1) +…+aNRx(N-1)
Rx(2)=a1Rx(1)+ a2Rx(0) +…+aNRx(N-2)
Rx(N)=a1Rx(N-1)+ a2Rx(N-2) +…+aNRx(0)
取m=0,1,2…N,将上式写为矩阵形式,可得
解此方程,就可以提取出ai
3. 通过目前已知的y[n]和ai得到系统的输入信号G[n]。将G[n]进行Z变换,求出H(z)的极点。 H ( z ) = Y ( z ) H ( z ) = 1 Σ i = 0 N a i z - i
4,估计出信号基频ω0,进行极点移位,得到新的极点 ϵ k ^ = λ r k e j ω k ( 1 + ω k ω 0 Δ )
5,将移位后的极点利用公式
Figure GDA00002150553643
重新恢复出新的
Figure GDA00002150553644
,从而建立新的声道模型其传递函数为
Figure GDA00002150553645
6,将输入信号G[n]输入新声道,得到新的语音信号模型,即为变声后的语音信号。之后再循环回第一步,处理下一帧语音信号。
步骤四:将变声后的声音信号经D/A转换器变为模拟信号后,通过输如输出模块的音箱输出,完成整个变声过程。之后再循环回第一步,处理下一帧语音信号。

Claims (5)

1.一种可任意调节的语音自然变声装置,其特征在于包括电源模块、输入输出模块、控制模块和处理模块,其中,所述控制模块与处理模块及输入输出模块相连接,用于向处理模块输入变声参数及控制整个装置开始及结束工作;所述输入输出模块与处理模块相连接,用于向处理模块输入激励信号及输出变声后声音信号,并在输入输出前进行数字/模拟信号的互相转化;处理模块用于根据输入的变声参数,对输入信号进行变声,并将变声后的信号送入输入输出模块。
2.根据权利要求1所述的可任意调节的语音自然变声装置,其特征在于,其特征在于所述处理模块包括数字信号处理芯片。
3.根据权利要求1所述的可任意调节的语音自然变声装置,其特征在于还包括接口模块,接口模块与处理模块和电源模块相连。
4.根据权利要求3所述的可任意调节的语音自然变声装置,其特征在于所述接口模块为USB接口。
5.根据权利要求1~4任一项所述的可任意调节的语音自然变声装置,其特征在于,所述输入输出模块包括麦克风、音箱及A/D转换器和D/A转换器,麦克风的输出端通过A/D转换器与处理模块的输入端连接,音箱的输入端通过D/A转换器与处理模块的输出端连接。 
CN 201220055999 2012-02-21 2012-02-21 一种可任意调节的语音自然变声装置 Expired - Fee Related CN203038659U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201220055999 CN203038659U (zh) 2012-02-21 2012-02-21 一种可任意调节的语音自然变声装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201220055999 CN203038659U (zh) 2012-02-21 2012-02-21 一种可任意调节的语音自然变声装置

Publications (1)

Publication Number Publication Date
CN203038659U true CN203038659U (zh) 2013-07-03

Family

ID=48690757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201220055999 Expired - Fee Related CN203038659U (zh) 2012-02-21 2012-02-21 一种可任意调节的语音自然变声装置

Country Status (1)

Country Link
CN (1) CN203038659U (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616651A (zh) * 2014-12-24 2015-05-13 张云霞 一种变声装置
CN108882074A (zh) * 2018-07-05 2018-11-23 浙江山诺智能科技有限公司 一种多功能智能话筒
CN109003621A (zh) * 2018-09-06 2018-12-14 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109065068A (zh) * 2018-08-17 2018-12-21 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质
CN109285555A (zh) * 2017-07-20 2019-01-29 北京唱吧科技股份有限公司 一种变声方法、装置及移动终端

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616651A (zh) * 2014-12-24 2015-05-13 张云霞 一种变声装置
CN109285555A (zh) * 2017-07-20 2019-01-29 北京唱吧科技股份有限公司 一种变声方法、装置及移动终端
CN108882074A (zh) * 2018-07-05 2018-11-23 浙江山诺智能科技有限公司 一种多功能智能话筒
CN108882074B (zh) * 2018-07-05 2019-10-25 浙江山诺智能科技有限公司 一种多功能智能话筒
CN109065068A (zh) * 2018-08-17 2018-12-21 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质
CN109065068B (zh) * 2018-08-17 2021-03-30 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质
CN109003621A (zh) * 2018-09-06 2018-12-14 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN102592590B (zh) 一种可任意调节的语音自然变声方法及装置
CN203038659U (zh) 一种可任意调节的语音自然变声装置
CN101527141B (zh) 基于径向基神经网络的耳语音转换为正常语音的方法
CN102881289B (zh) 一种基于听觉感知特性的语音质量客观评价方法
CN103531205A (zh) 基于深层神经网络特征映射的非对称语音转换方法
CN102857852B (zh) 一种声场定量重现控制系统的扬声器回放阵列控制信号的处理方法
CN101426169B (zh) 一种快速检测发声体声响应参数的时域跟踪滤波器及系统
CN101599271A (zh) 一种数字音乐情感的识别方法
CN102520245A (zh) 基于三次样条插值波形重构的微网谐波及间谐波分析方法
CN104282316A (zh) 一种基于语音匹配的k歌计分方法和装置
CN103892939B (zh) 提高汉语声调识别率的人工耳蜗言语处理器和方法
CN106255027A (zh) 一种非线性音频系统的音质可听化评估方法及系统
CN102592589A (zh) 一种动态归一化数字特征的语音评分方法与装置
CN103559893B (zh) 一种水下目标gammachirp倒谱系数听觉特征提取方法
CN113823275A (zh) 一种用于电网调度的语音识别方法及系统
CN101727905A (zh) 一种得到具有精细时频结构的声纹图的方法
CN104217730A (zh) 一种基于k-svd的人工语音带宽扩展方法及装置
CN103557925B (zh) 水下目标gammatone离散小波系数听觉特征提取方法
CN102930863A (zh) 一种基于简化自适应内插加权谱模型的语音转换及重构方法
CN105654941A (zh) 一种基于指向目标人变声比例参数的语音变声方法及装置
CN107895580A (zh) 一种音频信号的重建方法和装置
CN101449321B (zh) 频带外信号生成装置和频带扩展装置
CN106777518B (zh) 一种针对姿轨控发动机推力的激励源辨识方法
CN104658547A (zh) 一种人工语音带宽扩展的方法
CN202454260U (zh) 一种动态归一化数字特征的语音评分装置

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130703

Termination date: 20160221

CF01 Termination of patent right due to non-payment of annual fee