CN104835492A - 一种电子喉擦音重建方法 - Google Patents

一种电子喉擦音重建方法 Download PDF

Info

Publication number
CN104835492A
CN104835492A CN201510158837.3A CN201510158837A CN104835492A CN 104835492 A CN104835492 A CN 104835492A CN 201510158837 A CN201510158837 A CN 201510158837A CN 104835492 A CN104835492 A CN 104835492A
Authority
CN
China
Prior art keywords
fricative
voice source
frequency
electronic larynx
pass filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510158837.3A
Other languages
English (en)
Inventor
万明习
肖科
吴亮
王素品
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201510158837.3A priority Critical patent/CN104835492A/zh
Publication of CN104835492A publication Critical patent/CN104835492A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种电子喉擦音重建方法,本发明在综合了异位点施加嗓音源的声道结构差异以及颈部组织影响的基础上,通过频域滤波方法合成满足电子喉擦音重建的嗓音源,然后将该擦音嗓音源加载于线性电子喉系统,通过颈部外侧传入声道而重建出高质量电子喉擦音。本发明只使用一个单嗓音源,克服了正常擦音产生过程中的多源特性,降低了嗓音源的合成难度,同时保证重建擦音质量;通过异位点施加嗓音源的声道传递函数反向补偿嗓音源,有效补偿异位施加嗓音源造成的能量缺失区;通过颈部组织的传递函数反向补偿嗓音源,有效补偿颈外施加嗓音源的颈部滤波作用;通过线性振动器克服现有电子喉只能提供周期性振动信号的缺点,重建出高可懂度的擦音。

Description

一种电子喉擦音重建方法
【技术领域】
本发明属于语音重建、替代及语音通讯技术领域,特别涉及一种电子喉擦音源的合成方法,利用该嗓音源能够重建高可懂度的汉语擦音。
【背景技术】
我国每年都有大量患者因全喉切除手术而失去正常发声能力,语音康复对喉切除病人来说具有极其重要的意义。现有的语音康复技术中,电子喉以其操作简单,可持续发声等优势在全切除患者中得到了广泛的应用。但目前商业电子喉语音因为存在严重的辅音混淆导致了电子喉语音的可懂度比较低,使电子喉的应用受到了较大的限制。
现有电子喉的发声原理是将电机撞击膜片产生的周期性振动信号通过颈外侧传递进入声道作为嗓音源,然后嗓音源通过上声道共振调制产生语音。辅音是气管气流通过声道中的阻碍区形成的冲击气流撞击声道壁产生的噪声嗓音源经过口腔共振调制产生的。因此,现有商业电子喉以周期性振动信号作为嗓音源并不符合辅音的发声方式,导致电子喉辅音混淆程度较高,电子喉语音的可懂度较低。而根据相关研究,在所有的汉语电子喉辅音中,擦音是混淆程度最高的一类辅音,对电子喉语音的可懂度起着至关重要的作用。
通过改善电子喉嗓音源来提高电子喉语音质量是目前电子喉研究领域的热点之一。目前,有研究提出利用自然语音反滤波得到的正常人声门嗓音源作为电子喉嗓音源,也有专利(ZL 201010222878.1)提出具有声道补偿的电子喉嗓音源来改善电子喉语音。然而,这些方法仍然以周期信号作为嗓音源,因此只能提高元音的重建质量而无法有效改善电子喉辅音的重建质量。
随着经济的快速发展,人们对生活品质的追求越来越高,提高电子喉语音的可懂度对提高喉切除患者的生活质量具有重要意义。然而面对电子喉语音中混淆程度极高的擦音,目前仍旧没有提出合理的擦音嗓音源来改善电子喉擦音的重建质量。
【发明内容】
针对上述现有商业电子喉因嗓音源与电子喉辅音重建不相符而造成的电子喉擦音混淆度较高的问题,本发明提供了一种基于擦音嗓音源合成的电子喉擦音重建方法。能够有效提高电子喉重建擦音的质量。
本发明所采用的技术方案为:
一种电子喉擦音重建方法,包括以下步骤:
一、确定电子喉擦音源的合成参数
S11:根据正常汉语擦音的嗓音源确定汉语擦音嗓音源的合成参数;S12:通过声道传递函数修正步骤S1中确定的汉语擦音嗓音源的合成参数;S13:根据使用者的颈部频率响应函数调整步骤S2得到的汉语擦音嗓音源合成参数;
二、合成嗓音源信号:
以白噪声为激励源,以线性振动器为振动源,通过嗓音源合成滤波器后得到各个擦音的嗓音源,合成嗓音源信号。
利用一个低通滤波器和一个高通滤波器合成步骤S11的电子喉擦音嗓音源。
所述低通滤波器的截止频率WL和滤波器阶数NL以及高通滤波器的截止频率WH和滤波器阶数NH的确定方法为:低通滤波器和高通滤波器的截止频率是一样的,即WL=WH;低通滤波器阶数NL由高频衰减度THF来确定,高通滤波器阶数NH由低频衰减度TLF来确定,斜率增加6dB/oct则滤波器阶数增加一阶。
步骤S12中声道传递函数的确定方法为:通过波导模型计算出电子喉重建擦音的声道结构的输入输出,根据输入输出计算出声道结构的传递函数。
步骤S12的具体方法为:通过传递函数和自然擦音频域信息计算出频域差异,确定频域差异区域的频率范围,将差异区域的高频截止频率作为低通滤波器的截止频率,而滤波器阶数保持不变。
步骤S13的具体方法为:通过无反射声管测出电子喉使用者的颈部传递函数,然后通过颈部传递函数确定出高频相对衰减幅度;通过高频相对衰减幅度值的大小调整嗓音源合成中高通滤波器的阶数,滤波器阶数的调整力度根据滤波器的频率衰减斜率6dB/oct进行调整,由此将颈部传递函数的低通作用通过提高高通滤波器阶数整合于滤波器合成参数中。
步骤二中的线性振动器通过功率放大器对其幅度进行控制。
步骤S12的具体方法为:
S121:将各个擦音的声道结构分为若干段,每一段近似为一个圆柱体,根据每段声道的面积通过以下公式计算出每段声道之间的反射系数:
r i = A i - A i + 1 A i + A i + 1
其中Ai表示第i段的横截面面积,ri表示第i个界面的反射系数;
S122:根据波导模型计算输入经过声道系统后的输出结果,波导模型如下所示:
在声管界面处的传播方程:
u i + 1 + = ( 1 - r i ) u i + - r i u i + 1 - = u i + - r i ( u i + + u i + 1 - ) u i - = ( 1 + r i ) u i + 1 - + r i u i + 1 - = u i + 1 - + r i ( u i + + u i + 1 - )
在声道边界处(嘴唇以及声门)的传播方程:
glottis : u 1 + = 1 - r g 2 u g - r g u 1 - = 1 2 u g - r g ( 1 2 u g + u 1 - ) lips : u out = ( 1 + r N ) u N + = u N + - u N -
其中,声门端的反射系数rg≈+1;唇端的反射系数rN取0.99;分别为第i个声管中的正向声压和反向声压,通过这个模型,利用迭代算法计算出声道中每个声管中的声压;
S123:假设朝唇端的传播方向为正向,朝声门的传播方向为反向,在第i个结点处嗓音源传播入声道,在此节点处的传播方程:
u i + 1 + = u i + 1 - ( - r i ) + ( 1 - r i ) u i + ( 1 + r i ) x ( t ) = u i + x ( t ) - r i ( u i + 1 - + u i + x ( t ) ) u i - = u i + 1 - ( 1 + r i ) + r i u i + ( 1 - r i ) x ( t ) = u i + 1 - + x ( t ) + r i ( u i + 1 - + u i + x ( t ) )
其中,x(t)为嗓音源的输入信号。通过起始节点处的传播方程,输入的嗓音源信号朝着正反向传播,同时计算正反向的传播过程,最后从唇端得到输出声压信号;
S124:通过得到的输出信号y(t)=uout以及嗓音源的输入信号x(t)计算出整个声道的传递函数,其计算方法如下所示:
T xy = P xy P xx
其中,Txy为声道的传递函数,Pxy是输入输出的互功率谱密度,Pxx是输入的功率谱密度;
S125:计算出异位点施加嗓音源的声道传递函数,通过传递函数对嗓音源合成参数进行调整。
步骤S12的调整修正过程中,低通滤波器的截止频率修正到补偿频率Frevison=10KHz,将上述低通滤波器的截止频率修正为Frevison,保证高频能量完整保留,低频能量被抑制。
步骤S13的调整修正过程中,嗓音源的低频区域修正,高频区域保留。
与现有技术相比,本发明的主要特点:1)重建擦音只使用一个单嗓音源,克服了正常擦音产生过程中的多源特性,降低了嗓音源的合成难度,同时保证重建擦音质量;2)通过异位点施加嗓音源的声道传递函数反向补偿嗓音源,有效补偿异位施加嗓音源造成的能量缺失区;3)通过颈部组织的传递函数反向补偿嗓音源,有效补偿颈外施加嗓音源的颈部滤波作用;4)通过线性振动器克服现有电子喉只能提供周期性振动信号的缺点,重建出高可懂度的擦音。本发明大幅度改善了电子喉语音的可懂度并且提高了电子喉的市场应用潜力和价值。
附图说明
图1为电子喉擦音重建方法的示意图
图2为电子喉擦音嗓音源合成模型示意图
图3为电子喉擦音重建的声道传递函数计算方法
图4为颈部传递函数的测量方法
图5颈部传递函数
图6为电子喉擦音嗓音源合成方法及谱估计
【具体实施方式】
本发明在综合了异位点施加嗓音源的声道结构差异以及颈部组织影响的基础上,通过频域滤波方法合成满足电子喉擦音重建的嗓音源,然后将该擦音嗓音源加载于线性电子喉系统,通过颈部外侧传入声道而重建出高质量电子喉擦音。
本发明所涉及的擦音嗓音源合成方法如下:
1)确定汉语擦音嗓音源的合成参数。正常汉语擦音的嗓音源由多源复合而成,为克服擦音重建的多源性,本发明用一个低通滤波器和一个高通滤波器来合成电子喉擦音嗓音源。合成嗓音源的两个滤波器参数有:低通滤波器的截止频率WL以及滤波器阶数NL;高通滤波器的截止频率WH以及滤波器参数NH。其确定方法主要是分析擦音的双极源的频率衰减斜率,一般每6dB/oct增加滤波器阶数增加一阶,不同的擦音具有不同的滤波器参数。
2)通过声道传递函数修正嗓音源合成参数。为了补偿异位点施加嗓音源的声道结构对擦音重建的影响,本发明通过反向补偿来调整电子喉擦音嗓音源的合成参数。首先,本发明通过波导模型计算出电子喉重建擦音的声道结构的输入输出,根据输入输出计算出声道结构的传递函数,通过传递函数和自然擦音频域信息计算出频域差异部分,确定频域差异区域的频率范围,将差异区域的高频截止频率作为低通滤波器的截止频率,而滤波器阶数保持不变。由此,将频域差异整合于滤波器合成参数中,进一步调整擦音嗓音源合成参数,获得符合电子喉施加位置的滤波器参数。
3)根据使用者的颈部频率响应函数调整嗓音源合成参数。电子喉重建擦音的时候,电子喉的振动信号必须经过人体颈部组织,而人体的颈部组织对信号的传导并不是线性传导,对嗓音源影响较大。通过无反射声管测出电子喉使用者的颈部传递函数,然后通过颈部传递函数确定出高频相对衰减幅度。其后通过高频相对衰减幅度值的大小调整嗓音源合成中高通滤波器的阶数,滤波器阶数的调整力度根据滤波器的频率衰减斜率6dB/oct进行调整,由此将颈部传递函数的低通作用通过提高高通滤波器阶数整合于滤波器合成参数中。通过此方法对擦音嗓音源滤波器参数的调整可以有效消除颈部组织对擦音重建的影响。由此,得到最终的能够重建出高可懂度的电子喉擦音的嗓音源。
通过上面的方法确定各个擦音的电子喉擦音源合成参数后,将白噪声作为激励源,通过滤波器后得到各个擦音的嗓音源。在合成嗓音源之后,并不能用传统的撞击型电子喉,本发明采用了一个线性振动器作为振动源,其能够线性输出我们合成的嗓音源信号。在使用过程中,可以采用一个功率放大器对线性振动器进行幅度的控制,使用者可以根据自己的习惯调节。
本发明以线性电子喉系统为硬件平台,主要是合成适用于电子喉发声的擦音嗓音源,用以激励电子喉系统,重建高可懂度的电子喉擦音。汉语中,擦音主要有五个:/x/、/s/、/sh/、/f/以及/h/。每个擦音都具有不同的嗓音源,所以针对每个擦音都要设计相应的嗓音源。
请参阅图1所述,在确定正常的擦音的嗓音源之后,得到合成自然语音中擦音的合成参数。然后使用波导模型计算出在异位点施加嗓音源的声道传递函数,通过异位点施加嗓音源的声道传递函数、嗓音源以及自然擦音的功率谱相互之间的差异,对嗓音源的合成参数进行调整,在合成的嗓音源上面补偿异位点施加嗓音源而造成的能量分布异常,使其适合于电子喉语音重建方法;其次通过声道的传递函数,对合成参数进行进一步的调整,使其能够有效补偿颈部组织对电子喉擦音重建中的影响。通过上述的步骤,最后得到合成电子喉擦音嗓音源的合成参数。图2为电子喉擦音嗓音源合成模型示意图。
由上述可知,电子喉擦音嗓音源的设计方法主要分为三个步骤:一、根据自然语音擦音嗓音源来确定初步合成参数;二、通过异位点施加嗓音源的声道传递函数调整合成参数;三、通过声道传递函数进一步调整合成参数。通过上面三个步骤就能够有效确定重建高可懂度电子喉擦音的嗓音源的合成参数。
首先确定电子喉擦音嗓音源的初步合成参数。这是通过对正常擦音的嗓音源进行分析得到的。目前已有不少对正常语音擦音的研究,擦音的嗓音源主要有两种,单极源以及双极源。而双极源在擦音的形成中起着主要的作用,所以本发明电子喉擦音嗓音源主要是基于双极源进行设计。擦音在时域上呈现出噪声信号的特点,所以本发明主要是从频域上面进行分析合成。自然擦音的双极源在频谱上呈现出一个宽峰的结构。峰顶点对应的频率峰被定义为峰频率(FPEAK),而对于角的两条边,左边的斜率为低频衰减度(TLF),右边的斜率为高频衰减度(THF)。根据这三个参数来确定合成电子喉擦音嗓音源的初步合成参数。
对正常语音中的擦音进行频域分析,汉语擦音的能量主要集中在4KHz~10KHz之间,在合成擦音嗓音源的时候,两个滤波器的截止频率选择为正常擦音频域上5KHz左右的主峰的频率。然后根据主峰左右衰减斜率来确定滤波器的阶数。口腔较大的擦音,如/h/、/sh/、/f/,其低频的频率衰减较小,高频较高,而对于口腔较小的/x/、/s/,其低频衰减斜率较高频的衰减斜率高。
在合成电子喉擦音嗓音源中,本发明使用了两个滤波器进行滤波合成,一个高通滤波器以及一个低通滤波器。因为擦音属于噪声信号,所以滤波器对信号相位的改变在语音信号的声学参数以及听觉感知中并不重要。而在设计滤波器的时候,主要是通过上述定义的三个参数进行滤波器参数的设定。滤波器参数一共具有四个:低通滤波器截止频率WL,低通滤波器阶数NL,高通滤波器截止频率WH,高通滤波器阶数NH。在设计电子喉擦音嗓音源初步合成参数时,低通滤波器和高通滤波器的截止频率是一样的,即WL=WH;而低通滤波器阶数NL则由高频衰减度THF来确定,高通滤波器阶数NH则由低频衰减度TLF来确定,斜率增加6dB/oct则滤波器阶数增加一阶。不同的擦音具有不同的参数,通过对自然擦音嗓音源的分析,可以得到相对应的合成每个擦音嗓音源的滤波器参数。
参阅图3所述,本发明的第二部分为初步修正合成参数。根据正常发声时声道传递函数以及嗓音源的频域特征,对嗓音源合成参数进行初步调节。
在人正常发声过程中,正常擦音的嗓音源的位置在咽腔以上,而在使用电子喉发声的过程中,电子喉贴放位置在声门以上咽腔以下的位置。嗓音源的施加位置与正常擦音的嗓音源差异较大,尤其是在口腔中还存在一个成阻部位,因此异位点施加嗓音源对电子喉擦音重建具有一定的影响。本发明采用波导模型计算出声道输出结果,然后计算出异位点施加嗓音源时的声道传递函数,通过声道传递函数与正常擦音的功率谱的能量分布之间的差异对嗓音源的合成参数进行调整。
计算方法如下:
1)将各个擦音的声道结构分为44段,每一段近似为一个圆柱体。然后根据每段声道的面积计算出每段声道之间的反射系数。
r i = A i - A i + 1 A i + A i + 1
其中Ai表示第i段的横截面面积,ri表示第i个界面的反射系数。
2)使用波导模型计算输入经过声道系统后的输出结果,其模型如下所示:
在声管界面处的传播方程:
u i + 1 + = ( 1 - r i ) u i + - r i u i + 1 - = u i + - r i ( u i + + u i + 1 - ) u i - = ( 1 + r i ) u i + 1 - + r i u i + 1 - = u i + 1 - + r i ( u i + + u i + 1 - )
在声道边界处(嘴唇以及声门)的传播方程:
glottis : u 1 + = 1 - r g 2 u g - r g u 1 - = 1 2 u g - r g ( 1 2 u g + u 1 - ) lips : u out = ( 1 + r N ) u N + = u N + - u N -
其中,声门端的反射系数rg≈+1;唇端的反射系数rN≈-1,取0.99。分别为第i个声管中的正向声压和反向声压,通过这个模型,可以通过迭代算法计算出声道中每个声管中的声压。
而在擦音形成过程中,因为施加位置在声道中间,并不是在声门处开始,所以擦音的形成过程分为正向传播和反向传播,假设朝唇端的传播方向为正向,朝声门的传播方向为反向,在第i个结点处嗓音源传播入声道,在此节点处的传播方程:
u i + 1 + = u i + 1 - ( - r i ) + ( 1 - r i ) u i + ( 1 + r i ) x ( t ) = u i + x ( t ) - r i ( u i + 1 - + u i + x ( t ) ) u i - = u i + 1 - ( 1 + r i ) + r i u i + ( 1 - r i ) x ( t ) = u i + 1 - + x ( t ) + r i ( u i + 1 - + u i + x ( t ) )
其中x(t)为嗓音源的输入信号。通过起始节点处的传播方程,输入的嗓音源信号朝着正反向传播,同时计算正反向的传播过程,最后从唇端得到输出声压信号。
3)通过得到的输出信号y(t)=uout以及x(t)计算出整个声道的传递函数,其计算方法如下所示:
T xy = P xy P xx
其中Txy即为声道的传递函数,Pxy是输入输出的互功率谱密度,Pxx是输入的功率谱密度。
计算出异位点施加嗓音源的声道传递函数,通过传递函数对嗓音源合成参数进行调整。
下面请参阅附图3所示,为异位点施加嗓音源的声道传递函数。通过传递函数与功率谱估计的比较可以知道,在擦音的重建过程中,异位点施加嗓音源的声道结构对高频信号不敏感,具有抑制作用。所以在合成嗓音源的时候需要加上高频信号,这样子才能重建出高质量的擦音。
通过谱图分析以及实验结果,在嗓音源设计中,将高频信号补偿到10KHz为最佳。所以在合成嗓音源的时候,其低通滤波器的截止频率修正到10KHz,这个频率被定义为补偿频率(Frevison)。将上述滤波器中的低通滤波器的截止频率修正为Frevison,因此,高频能量能够完整保留,而低频能量被抑制,起到了高频信号补偿的作用。
本发明的第三部分是通过颈部传递函数对电子喉擦音嗓音源进行补偿调整。因为电子喉贴放于颈部外侧,嗓音源信号通过颈部组织传入声道,颈部的传递函数对嗓音源的传递也显得尤为重要。
人的颈部传递函数(NFRF)可以通过无反射声管测量,测量方式请参阅图4所示。在颈部外侧施加一个输入信号,通过颈部组织传入声道。被试者对准一个无反射声管发元音/a/,这样子的声道结构比较一致,反射较小,可以近似认为无反射。在无反射声管末端为吸声材料,而在无反射声管中放置一个麦克风采集输出结果,通过输出以及输入计算出颈部的传递函数。
颈部的传递函数计算方法如下:
NFRF = Spectrum ( output signal ) Spectrum ( input signal )
而颈部外施加的嗓音源的计算方法如下:
Pxx=NFRF×Pxy
如图5所示,通过对平均颈部传递函数的分析,可以得知:颈部的作用主要是起着一个低通滤波器的作用,而且其低通的频率也在2000Hz以下。所以在设计电子喉擦音嗓音源的时候,只需要针对嗓音源的低频区域修正,而高频区域可以保留。
请参阅图5所示,首先,确定颈部传递函数确定高频衰减幅度和低频衰减幅度之间的差值,此差值定义为高频相对衰减幅度。为弥补高频相对衰减幅度,本发明采用低频能量削减的方法,此方法在具体实现上是通过提高高通滤波器的阶数来实现。高通滤波器阶数调整方法仍旧是根据滤波器的频率衰减斜率6dB/oct进行调整。在大量的实验基础上,发现将高通滤波器的阶数提高2阶能够有效克服颈部的低通滤波作用。通过这样的调整,颈部传递函数的影响就能整合于擦音源的合成参数中,有效克服颈部组织的低通滤波作用。
通过上面所述的步骤,就能确定电子喉擦音嗓音源的最终合成参数,也就是低通滤波器和高通滤波器的截止频率以及阶数。因为汉语辅音都属于噪声信号,所以合成擦音的嗓音源的时候,采用高斯白噪声作为激励源。
请参阅附图6所述,首先生成一个高斯白噪声,幅度大小可根据每个发声者的习惯进行自由调整。擦音嗓音源的合成中,每一个擦音嗓音源都使用高斯白噪声作为激励源。然后使白噪声通过高通滤波器以及低通滤波器,最后得到各个擦音的电子喉嗓音源。
在实际的重建过程中,因为传统的商业电子喉主要是通过撞击产生类似声带振动信号传入声道,这种方法符合元音的重建,而在辅音重建中,尤其是擦音的重建,这种电子喉无法线性输入噪声信号。本发明采用一个线性振动器来替代传统电子喉振动模式。此线性振动器能够将电压信号线性转换成机械振动信号,因此可以按照合成的嗓音源输出振动,对擦音的重建具有极大的优势。将合成的嗓音源信号输入到功率放大器中,通过功率放大器后驱动线性振动器振动输出嗓音源振动信号,置于颈部外侧常用电子喉的位置,重建高质量的电子喉擦音。

Claims (10)

1.一种电子喉擦音重建方法,其特征在于:包括以下步骤:
一、确定电子喉擦音源合成参数
S11:根据正常汉语擦音的嗓音源确定汉语擦音嗓音源的合成参数;
S12:通过声道传递函数修正步骤S11中确定的汉语擦音嗓音源的合成参数;
S13:根据使用者的颈部频率响应函数调整步骤S12得到的汉语擦音嗓音源合成参数;
二、合成嗓音源信号
以白噪声为激励源,以线性振动器为振动源,通过嗓音源合成滤波器后得到各个擦音的嗓音源,合成嗓音源信号。
2.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:利用一个低通滤波器和一个高通滤波器合成步骤S11的电子喉擦音嗓音源。
3.根据权利要求2所述的一种电子喉擦音重建方法,其特征在于:所述低通滤波器的截止频率WL和滤波器阶数NL以及高通滤波器的截止频率WH和滤波器阶数NH的确定方法为:低通滤波器和高通滤波器的截止频率是一样的,即WL=WH;低通滤波器阶数NL由高频衰减度THF来确定,高通滤波器阶数NH由低频衰减度TLF来确定,斜率增加6dB/oct则滤波器阶数增加一阶。
4.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:步骤S12中声道传递函数的确定方法为:通过波导模型计算出电子喉重建擦音的声道结构的输入输出,根据输入输出计算出声道结构的传递函数。
5.根据权利要求1或4所述的一种电子喉擦音重建方法,其特征在于:步骤S12的具体方法为:通过传递函数和自然擦音频域信息计算出频域差异,确定频域差异区域的频率范围,将差异区域的高频截止频率作为低通滤波器的截止频率,而滤波器阶数保持不变。
6.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:步骤S13的具体方法为:通过无反射声管测出电子喉使用者的颈部传递函数,然后通过颈部传递函数确定出高频相对衰减幅度;通过高频相对衰减幅度值的大小调整嗓音源合成中高通滤波器的阶数,滤波器阶数的调整力度根据滤波器的频率衰减斜率6dB/oct进行调整,由此将颈部传递函数的低通作用通过提高高通滤波器阶数整合于滤波器合成参数中。
7.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:步骤二中的线性振动器通过功率放大器对其幅度进行控制。
8.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:步骤S12的具体方法为:
S121:将各个擦音的声道结构分为若干段,每一段近似为一个圆柱体,根据每段声道的面积通过以下公式计算出每段声道之间的反射系数:
r i = A i - A i + 1 A i + A i + 1
其中Ai表示第i段的横截面面积,ri表示第i个界面的反射系数;
S122:根据波导模型计算输入经过声道系统后的输出结果,波导模型如下所示:
在声管界面处的传播方程:
u i + 1 + = ( 1 - r i ) u i + - r i u i + 1 - = u i + - r i ( u i + + u i + 1 - ) u i - = ( 1 + r i ) u i + 1 - + r i u i + 1 - = u i + 1 - + r i ( u i + + u i + 1 - )
在声道边界处(嘴唇以及声门)的传播方程:
glottis : u 1 + = 1 - r g 2 u g - r g u 1 - = 1 2 u g - r g ( 1 2 u g + u 1 - ) lips : u out = ( 1 + r N ) u N + = u N + - u N -
其中,声门端的反射系数rg≈+1;唇端的反射系数rN取0.99;分别为第i个声管中的正向声压和反向声压,通过这个模型,利用迭代算法计算出声道中每个声管中的声压;
S123:假设朝唇端的传播方向为正向,朝声门的传播方向为反向,在第i个结点处嗓音源传播入声道,在此节点处的传播方程:
u i + 1 + = u i + 1 - ( - r i ) + ( 1 - r i ) u i + ( 1 + r i ) x ( t ) = u i + x ( t ) - r i ( u i + 1 - + u i + x ( t ) ) u i - = u i + 1 - ( 1 + r i ) + r i u i + ( 1 - r i ) x ( t ) = u i + 1 - + x ( t ) + r i ( u i + 1 - + u i + x ( t ) )
其中,x(t)为嗓音源的输入信号;通过起始节点处的传播方程,输入的嗓音源信号朝着正反向传播,同时计算正反向的传播过程,最后从唇端得到输出声压信号;
S124:通过得到的输出信号y(t)=uout以及嗓音源的输入信号x(t)计算出整个声道的传递函数,其计算方法如下所示:
T xy = P xy P xx
其中,Txy为声道的传递函数,Pxy是输入输出的互功率谱密度,Pxx是输入的功率谱密度;
S125:计算出异位点施加嗓音源的声道传递函数,通过传递函数对嗓音源合成参数进行调整。
9.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:步骤S12的调整修正过程中,低通滤波器的截止频率修正到补偿频率Frevison=10KHz,将上述低通滤波器的截止频率修正为Frevison,保证高频能量完整保留,低频能量被抑制。
10.根据权利要求1所述的一种电子喉擦音重建方法,其特征在于:步骤S13的调整修正过程中,嗓音源的低频区域修正,高频区域保留。
CN201510158837.3A 2015-04-03 2015-04-03 一种电子喉擦音重建方法 Pending CN104835492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510158837.3A CN104835492A (zh) 2015-04-03 2015-04-03 一种电子喉擦音重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510158837.3A CN104835492A (zh) 2015-04-03 2015-04-03 一种电子喉擦音重建方法

Publications (1)

Publication Number Publication Date
CN104835492A true CN104835492A (zh) 2015-08-12

Family

ID=53813334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510158837.3A Pending CN104835492A (zh) 2015-04-03 2015-04-03 一种电子喉擦音重建方法

Country Status (1)

Country Link
CN (1) CN104835492A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106448673A (zh) * 2016-09-18 2017-02-22 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种汉语电子喉语音转换方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916566A (zh) * 2010-07-09 2010-12-15 西安交通大学 一种电子喉语音重建方法及其系统
US20130035940A1 (en) * 2010-07-09 2013-02-07 Xi'an Jiaotong Univerity Electrolaryngeal speech reconstruction method and system thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916566A (zh) * 2010-07-09 2010-12-15 西安交通大学 一种电子喉语音重建方法及其系统
US20130035940A1 (en) * 2010-07-09 2013-02-07 Xi'an Jiaotong Univerity Electrolaryngeal speech reconstruction method and system thereof

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIANG WU ET AL.: "《Improvement of Electrolaryngeal Speech Quality Using a Supraglottal Voice Source With Compensation of Vocal Tract Characteristics》", 《IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING》 *
LIANG WU ET AL.: "《Measurement of the sound transmission characteristics of normal neck tissue using a reflectionless uniform tube》", 《THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA》 *
纪宗南: "《消费电子的DSP处理技术及应用实例》", 29 February 2008, 中国电力出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106448673A (zh) * 2016-09-18 2017-02-22 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种汉语电子喉语音转换方法
CN106448673B (zh) * 2016-09-18 2019-12-10 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种汉语电子喉语音转换方法

Similar Documents

Publication Publication Date Title
CN103778920B (zh) 数字助听器中语音增强和频响补偿相融合方法
ES2582475T3 (es) Generación de una extensión de banda ancha de una señal de audio de ancho de banda extendido
Takemoto et al. Acoustic analysis of the vocal tract during vowel production by finite-difference time-domain method
KR101168645B1 (ko) 과도 신호 부호화 방법 및 장치, 과도 신호 복호화 방법 및 장치, 및 과도 신호 처리 시스템
JP2787179B2 (ja) 音声合成システムの音声合成方法
Story Comparison of magnetic resonance imaging-based vocal tract area functions obtained from the same speaker in 1994 and 2002
KR20220028159A (ko) 다중 채널 신호 인코딩 방법 및 인코더
CN105741849A (zh) 数字助听器中融合相位估计与人耳听觉特性的语音增强方法
JP2010237703A (ja) 音信号加工装置及び音信号加工方法
CN101635873B (zh) 用于自适应白化的自适应长时预测滤波器
CN109767778A (zh) 一种融合Bi-LSTM和WaveNet的语音转换方法
CN109473115A (zh) 数字音频信号音量等响度调节方法
CN110648684B (zh) 一种基于WaveNet的骨导语音增强波形生成方法
Mullen et al. Waveguide physical modeling of vocal tract acoustics: flexible formant bandwidth control from increased model dimensionality
Alku et al. An amplitude quotient based method to analyze changes in the shape of the glottal pulse in the regulation of vocal intensity
Nercessian Differentiable world synthesizer-based neural vocoder with application to end-to-end audio style transfer
JP4230414B2 (ja) 音信号加工方法及び音信号加工装置
CN104835492A (zh) 一种电子喉擦音重建方法
CN109671422B (zh) 一种获取纯净语音的录音方法
CN100589783C (zh) 具有s参数控制的基于汉语特征的电子耳蜗语音处理方法
Story Vowel acoustics for speaking and singing
Kitamura et al. Cyclicity of laryngeal cavity resonance due to vocal fold vibration
CN115966218A (zh) 一种骨导辅助的气导语音处理方法、装置、介质及设备
Rong et al. The effect of oral articulation on the acoustic characteristics of nasalized vowels
Farouk et al. Speech production and perception

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150812