CN105310806B - 具有语音转换功能的电子人工喉系统及其语音转换方法 - Google Patents

具有语音转换功能的电子人工喉系统及其语音转换方法 Download PDF

Info

Publication number
CN105310806B
CN105310806B CN201410377514.9A CN201410377514A CN105310806B CN 105310806 B CN105310806 B CN 105310806B CN 201410377514 A CN201410377514 A CN 201410377514A CN 105310806 B CN105310806 B CN 105310806B
Authority
CN
China
Prior art keywords
voice
larynx
artificial
conversion
fundamental frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410377514.9A
Other languages
English (en)
Other versions
CN105310806A (zh
Inventor
牛海军
王立
李立峰
樊瑜波
李阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201410377514.9A priority Critical patent/CN105310806B/zh
Publication of CN105310806A publication Critical patent/CN105310806A/zh
Application granted granted Critical
Publication of CN105310806B publication Critical patent/CN105310806B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Prostheses (AREA)

Abstract

本发明提出一种具有语音转换功能的电子人工喉系统及语音转换方法。通过对电子人工喉使用者发出的人工喉语音通过麦克风采集,转化为数字信号;语音转换模块可将数字信号按照本发明的电子人工喉系统的语音转换方法进行语音转换,并通过放大电路模块放大,最后由扬声器播出,得到清晰易懂的语音。该方法可以有效降低电子人工喉语音的辐射噪声,特别是该方法可以改变电子喉语音的单一频率,使其具有声调变化,提高电子人工喉语音的可懂度。

Description

具有语音转换功能的电子人工喉系统及其语音转换方法
技术领域
本发明属于语音缺失患者的语音康复领域,并涉及一种具有语音转换功能的电子人工喉人工喉及其语音转换方法。
背景技术
语音是人类最重要、最有效、最常用和最方便的交换信息的形式,承担着社会成员间沟通思想,传达感情的任务,在推进人类文明的进程中发挥重要作用。但在现实生活中,由于疾病或意外事故等原因,许多患者不得不接受喉头切除手术,丧失了语音功能,无法与外界进行沟通交流,这不仅大大降低患者的工作能力和生活质量,还会造成患者较大的心理压力,甚至导致自闭、抑郁等心理疾病,给患病者带来更大的痛苦。
电子人工喉是目前使用最为普遍的一种语音发声康复辅具,是喉头切除患者的普遍选择,但由于其存在明显的语音缺陷,振频单一、语音机械、噪音较大,不适用于办公室、图书馆、咖啡厅等较为安静的场所,对使用者造成了极大的不便。如何改善电子人工喉系统的发声效果,提高电子人工喉语音的语音质量,确保喉头切除患者沟通顺畅,是目前国际上一项亟待解决的难题,具有重要的研究价值和应用前景。目前,基于语音转换技术的电子人工喉语音改进方法还处于探索起步阶段,现有算法复杂,难以移植,尚停留在实验阶段。
发明内容
本发明要解决的技术问题是提供一种具有语音转换功能的电子人工喉系统,解决电子人工喉语音频率单一、语音机械、辐射噪声大等问题。
为解决现有技术的上述技术问题,本发明提供了一种具有语音转换功能的电子人工喉,包括电子人工喉,麦克风,语音转换及放大系统。
电子人工喉可以是市场上传统的电子人工喉,也可以是本申请人提交的“指压式基频调节电子人工喉”中国专利申请第200910090549.3号、“具有个人特征的声门波模拟式电子人工喉”中国专利申请第200910089700.1号、“遥控开关型电子人工喉”中国专利申请第200910090588.3号、“气压式基频调节电子人工喉”中国专利申请第200910090589.8号中公开的电子人工喉。
语音转换及放大系统包括数模转换模块,语音转换模块,放大电路模块及扬声器模块。其中,数模转换模块可将麦克风采集到的电子人工喉语音模拟信号转化为数字信号;语音转换模块可将数字信号按照本发明的电子人工喉语音转换方法进行语音转换,并输出转换后的模拟语音信号;放大电路模块可将转换后的语音信号进行放大,并通过扬声器播出,形成最终清晰可懂的语音。
另外,本发明提供一种具有语音转换功能的电子人工喉语音转换方法,包括如下步骤:
步骤一:使用麦克风采集电子人工喉使用者发出的电子喉语音,提取其中的基频与发声声道参数;
步骤二:利用转换规则对采集到语音的个性特征参数进行转换;
步骤三:通过语音合成算法合成转换后的基频和发声声道参数,得到最终的转换语音;
步骤四:将转换后的语音通过扬声器放出。
本发明的优点在于:
(1)本发明使用的语音转换技术可以有效降低电子人工喉语音的辐射噪声,特别是该方法可以改变电子喉语音的单一频率,使其具有声调变化,提高电子人工喉语音的可懂度。
(2)本发明的转换算法是通过标准语料库与电子喉使用人电子喉语音训练得到,可以保留电子喉语音使用人的语音特征。
附图说明
图1为根据本发明的系统原理图。
图2为根据本发明的语音转换及放大系统的配置图。
图3为根据本发明的一个实施例的一种具有语音转换功能的电子人工喉佩戴部分示意图。
图4为根据本发明的一个实施例的一种具有语音转换功能的电子人工喉整体使用效果示意图。
图5为本发明的一种具有语音转换功能的电子人工喉语音转换方法流程图。
图6为本发明的一种具有语音转换功能的电子人工喉语音转换方法训练阶段流程图。
附图标记:
1—电子人工喉 2—麦克风 7—放大电路
8—扬声器 9—外壳 10—数据线
11—束带 12—数字信号处理电路 13—电池盒
具体实施方式
下面结合附图详细描述本发明的实施例。
图1为根据本发明的一个实施例的具有语音转换功能的电子人工喉系统的原理图,该电子人工喉系统包括电子人工喉1,麦克风2,语音转换及放大系统3。使用者使用电子人工喉1在口内产生人工喉语音,该语音被麦克风2采集并转化为模拟电信号,该模拟电信号通过数据线传送给语音转换及放大系统3,在其中进行模数(A/D)转换、语音转换、数模(D/A)转换、信号放大,并被输出,在扬声器形成最终的语音。
图2为根据本发明的一个实施例的语音转换及放大系统的配置图,其包括模数转换模块4,语音转换模块5,数模转换模块6,放大电路7和扬声器8。模数转换模块4将麦克风2采集到的人工喉语音模拟信号转换为数字信号,供语音转换模块5进行信号处理;语音转换模块5将人工喉语音的数字信号进行语音转换,修改基频和发声声道参数,合成转换语音;数模转换模块6将合成后的转换语音转换成模拟输出信号,放大电路7将转换后的语音进行信号放大,供扬声器8输出;扬声器8将放大后的转换语音信号输出,形成清晰、可懂的语音。
根据本发明的一个实施例,采用基于自适应内插平滑(Speech TransformationAnd Representation and Interpolation Using Weighted Spectrogram,STRAIGHT)语音合成算法(例如参见:Hideki Kawahara,Ikuyo Masuda-Katsuse,Alain deCheveigne.Restructuring speech representations using a pitch-adaptive time-frequency smoothing and an instantaneous-frequency-based F0 extraction:Possible role of a repetitive structure in sounds[J].SpeechConmunication.1999,27:187–207)的混合高斯模型(Gaussian Mixed Model,GMM)语音转换方法(例如参见:Keigo Nakamura,Tomoki Toda,Hiroshi Saruwatari,KiyohiroShikano.Speaking-aid systems using GMM-based voice conversion forelectrolaryngeal speech[J].Speech Conmunication.2012,54:134–146)。首先运用训练获得的发声声道参数转换函数和基频转换函数,对待转换语料的个性特征参数进行转换;然后通过STRAIGHT合成模型合成转换后的发声声道参数和基频,获得最终的转换语音。
在训练阶段,首先基于STRAIGHT分析模型分别提取源和目标语音个性特征参数,包括谱参数(0到24阶梅尔倒谱系数)和基频轨迹;其次通过动态时间对齐(Dynamic TimeWarping,DTW)技术对特征参数序列进行时间对齐,求出联合特征矢量;最后基于GMM对联合特征矢量进行建模,得到相应的发声声道参数和基频的转换函数。
图3为根据本发明的一个实施例的一种具有语音转换功能的电子人工喉系统佩戴部分示意图。包括外壳9,数据线10,束带11,数字信号处理电路12,放大电路8,电池盒13,扬声器8。
根据本发明的一种具体实施方式,佩戴者将外壳9通过束带11佩戴于接近口唇的脖颈处。数字信号处理电路12包括DSP数字信号处理芯片及外围电路,在功能上包括了图2所示的数模转换模块4和语音转换模块5,用于接收数据线9传来的模拟信号并将其转换为数字信号;同时,DSP芯片可实现语音转换的主要功能,输出转换后的语音信号。放大电路7将数字信号处理电路12输出的转换语音进行放大输出,通过扬声器8形成最终的语音。在一个优选实施例中,使用锂电池供电,电池放置在电池盒13中。
图4为根据本发明的一个实施例的一种具有语音转换功能的电子人工喉整体使用效果示意图。包括外壳9,束带11,麦克风2,电子喉1。
使用者使用束带111将语音转换及放大系统3佩戴于脖颈处,通过麦克风2采集使用电子人工喉1发出的语音。语音转换及放大系统3将采集到的语音进行语音转换,并通过扬声器8放出,形成清晰易懂的语音。
图5为本发明的一种具有语音转换功能的电子人工喉系统语音转换方法流程图,具体包括以下几个步骤:
步骤一:使用麦克风采集电子人工喉使用者发出的电子喉语音,提取其中的基频与发声声道参数;
步骤二:利用转换规则对采集到语音的个性特征参数进行转换;
步骤三:通过STRAIGHT语音合成算法合成转换后的基频和发声声道参数,得到最终的转换语音;
步骤四:将转换后的语音通过扬声器放出。
其中,步骤二所述的转换规则由前期训练得到。
图6为本发明的一种具有语音转换功能的电子人工喉语音转换方法训练阶段流程图,具体包括如下训练步骤:
步骤一:使用麦克风采集电子人工喉系统的使用者发出的电子喉语音与相同语句正常人发出的正常语音;
步骤二:基于STRAIGHT分析模型分别提取源和目标语音个性特征参数,包括谱参数(0到24阶梅尔倒谱系数)和基频轨迹;
步骤三:去除语音信号中的清音段;
步骤四:对两段语音中的频谱非周期参数进行降维处理;
步骤五:通过DTW技术对特征参数序列进行时间对齐,求出联合特征矢量;
步骤六:基于GMM对联合特征矢量进行建模,得到相应的发声声道参数和基频的转换函数。
需要指出的是,训练阶段在装载了相关应用的计算机上完成。
应当理解的是,以上结合附图和实施例对本发明所进行的描述只是说明而非限定性的,且在不脱离如所附权利要求书所限定的本发明的前提下,可以对上述实施例进行各种改变、变形、和/或修正。

Claims (5)

1.一种具有语音转换功能的电子人工喉系统,其特征在于包括:
电子人工喉(1),用于在使用者的口内产生人工喉语音,
麦克风(2),用于采集所述人工喉并将采集到的人工喉语音转化为模拟电信号,
语音转换及放大系统(3),用于对所述模拟电信号进行语音转换和放大,形成放大后的转换语音信号,
扬声器(8),用于在放大后的转换语音信号的驱动下,形成清晰的语音,
其中:
语音转换及放大系统(3)包括:
模数转换模块(4),用于将麦克风(2)采集到的模拟电信号转换为数字信号,
语音转换模块(5),用于将所述数字信号进行语音转换,修改基频和发声声道参数,合成转换语音,
数模转换模块(6),用于将合成后的转换语音转换成模拟输出信号,
放大电路(7),用于放大所述模拟输出信号,并提供给扬声器(8),
其中所述语音转换模块(5)所进行的所述语音转换包括采用基于自适应内插平滑语音合成算法的混合高斯模型的语音转换,
所述语音转换包括:
运用训练获得的发声声道参数转换函数和基频转换函数,对采集到的人工喉语音的发声声道参数和基频进行转换;
通过STRAIGHT合成模型,合成转换后的发声声道参数和基频,获得最终的转换语音,
所述训练包括:
基于STRAIGHT分析模型分别提取源和目标语音的个性特征参数,该个性特征参数包括谱参数和基频轨迹;
通过动态时间对齐技术对所述个性特征参数的序列进行时间对齐,得到联合特征矢量;
基于混合高斯模型对联合特征矢量进行建模,得到相应的发声声道参数和基频的转换函数。
2.根据权利要求1的电子人工喉系统,其特征在于所述训练包括:
用麦克风采集电子人工喉系统的使用者发出的电子喉语音和正常人发出的相同语句的语音;
基于STRAIGHT分析模型分别提取使用者发出的电子喉语音和正常人发出的相同语句语音的个性特征参数,包括谱参数和基频轨迹;
去除所有需要训练的语音信号中的清音段;
对使用者发出的电子喉语音和正常人发出的相同语句的语音中的频谱非周期参数进行降维处理;
通过动态时间对齐技术对特征参数序列进行时间对齐,求出联合特征矢量;
基于混合高斯模型对联合特征矢量进行建模,得到相应的发声声道参数和基频的转换函数。
3.根据权利要求1-2之一的电子人工喉系统,其特征在于进一步包括:
外壳(9),
数据线(10),
束带(11),用于将外壳(9)佩戴于使用者的接近口唇的脖颈处,
电池盒(13),用于放置作为电子人工喉系统的电源的电池,
数字信号处理电路(12),其包括DSP数字信号处理芯片及外围电路,用于实现所述模数转换模块(4)和语音转换模块(5)。
4.基于权利要求1-2之一所述的电子人工喉系统的电子人工喉语音转换方法,其特征在于包括如下步骤:
A)用麦克风(2)采集电子人工喉使用者发出的电子喉语音,提取其中的基频与发声声道参数;
B)对采集到电子喉语音的基频与发声声道参数进行转换;
C)通过语音合成算法合成转换后的基频和发声声道参数,得到最终的转换语音。
5.根据权利要求4的方法,其特征在于:
所述步骤B)包括运用训练获得的发声声道参数转换函数和基频转换函数,对采集到的人工喉语音的基频与发声声道参数进行转换,
所述步骤C)包括通过STRAIGHT合成模型,合成转换后的发声声道参数和基频,得到最终的转换语音。
CN201410377514.9A 2014-08-01 2014-08-01 具有语音转换功能的电子人工喉系统及其语音转换方法 Expired - Fee Related CN105310806B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410377514.9A CN105310806B (zh) 2014-08-01 2014-08-01 具有语音转换功能的电子人工喉系统及其语音转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410377514.9A CN105310806B (zh) 2014-08-01 2014-08-01 具有语音转换功能的电子人工喉系统及其语音转换方法

Publications (2)

Publication Number Publication Date
CN105310806A CN105310806A (zh) 2016-02-10
CN105310806B true CN105310806B (zh) 2017-08-25

Family

ID=55239790

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410377514.9A Expired - Fee Related CN105310806B (zh) 2014-08-01 2014-08-01 具有语音转换功能的电子人工喉系统及其语音转换方法

Country Status (1)

Country Link
CN (1) CN105310806B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107411847B (zh) * 2016-11-11 2020-04-14 清华大学 一种人工喉及其声音转换方法
CN108836574A (zh) * 2018-06-20 2018-11-20 广州智能装备研究院有限公司 一种利用颈部振动的人工智能发声系统及其发声方法
CN109300484B (zh) * 2018-09-13 2021-07-02 广州酷狗计算机科技有限公司 音频对齐方法、装置、计算机设备以及可读存储介质
CN110890149A (zh) * 2019-10-14 2020-03-17 北京航空航天大学 使用触摸板控制的有声调电子人工喉及声调调节方法
CN113317909B (zh) * 2021-06-11 2022-04-22 清华大学 一种多维度智能人工喉

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030384A (zh) * 2007-03-27 2007-09-05 西安交通大学 一种自动电子喉的电子喉语音增强系统与控制方法
CN101474104A (zh) * 2009-01-14 2009-07-08 西安交通大学 一种自动调节的咽腔电子喉语音通讯系统及方法
CN101916566A (zh) * 2010-07-09 2010-12-15 西安交通大学 一种电子喉语音重建方法及其系统
CN101966106A (zh) * 2009-07-27 2011-02-09 北京航空航天大学 具有个人特征的声门波模拟式电子人工喉
CN101991474A (zh) * 2009-08-31 2011-03-30 北京航空航天大学 遥控开关型电子人工喉
CN101991473A (zh) * 2009-08-20 2011-03-30 北京航空航天大学 指压式基频调节电子人工喉
CN102341853A (zh) * 2009-02-04 2012-02-01 海莫梅德海因泽有限及两合公司 用于分离信号路径的方法及用于改善电子喉语音的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004604A1 (en) * 1999-03-23 2005-01-06 Jerry Liebler Artificial larynx using coherent processing to remove stimulus artifacts
JP2013142905A (ja) * 2012-01-12 2013-07-22 Inha-Industry Partnership Inst 音声補完用装置及びそれを用いた音声制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030384A (zh) * 2007-03-27 2007-09-05 西安交通大学 一种自动电子喉的电子喉语音增强系统与控制方法
CN101474104A (zh) * 2009-01-14 2009-07-08 西安交通大学 一种自动调节的咽腔电子喉语音通讯系统及方法
CN102341853A (zh) * 2009-02-04 2012-02-01 海莫梅德海因泽有限及两合公司 用于分离信号路径的方法及用于改善电子喉语音的应用
CN101966106A (zh) * 2009-07-27 2011-02-09 北京航空航天大学 具有个人特征的声门波模拟式电子人工喉
CN101991473A (zh) * 2009-08-20 2011-03-30 北京航空航天大学 指压式基频调节电子人工喉
CN101991474A (zh) * 2009-08-31 2011-03-30 北京航空航天大学 遥控开关型电子人工喉
CN101916566A (zh) * 2010-07-09 2010-12-15 西安交通大学 一种电子喉语音重建方法及其系统

Also Published As

Publication number Publication date
CN105310806A (zh) 2016-02-10

Similar Documents

Publication Publication Date Title
CN105310806B (zh) 具有语音转换功能的电子人工喉系统及其语音转换方法
US6795807B1 (en) Method and means for creating prosody in speech regeneration for laryngectomees
Liu et al. Electrolarynx in voice rehabilitation
Patil et al. The physiological microphone (PMIC): A competitive alternative for speaker assessment in stress detection and speaker verification
CN106205623B (zh) 一种声音转换方法及装置
CN101930747A (zh) 一种将语音转换成口型图像的方法和装置
Fuchs et al. The new bionic electro-larynx speech system
CN110992932A (zh) 一种自学习的语音控制方法、系统及存储介质
CN100563608C (zh) 电子耳蜗汉语固定电刺激幅度变化模式体外语音处理装置
CN102610236A (zh) 一种改善喉振话筒语音音质的方法
CN102473416A (zh) 音质变换装置及其方法、元音信息制作装置及音质变换系统
CN107039033A (zh) 一种语音合成装置
TWI749663B (zh) 發聲監控之方法及系統
CN109616131A (zh) 一种数字实时语音变音方法
CN110349565B (zh) 一种面向听障人士的辅助发音学习方法及其系统
CN101966106B (zh) 具有个人特征的声门波模拟式电子人工喉
CN105326580B (zh) 口内微音器型电子人工喉
CN107393539A (zh) 一种声音密码控制方法
Malathi et al. Enhancement of electrolaryngeal speech using Frequency Auditory Masking and GMM based voice conversion
EP4120265A3 (en) Method and apparatus of processing audio data, electronic device, storage medium and program product
CN101288614A (zh) 基于谱扩展技术的电子耳蜗电话适配装置及方法
TWI780738B (zh) 構音異常語料擴增方法及系統、語音辨識平台,及構音異常輔助裝置
Gonzalez et al. A real-time silent speech system for voice restoration after total laryngectomy
CN106255026A (zh) 基于语音模式识别和振动反馈的助残装置及交互方法
CN115429487A (zh) 一种采用基于面部肌电信号的控制的电子人工喉

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170825

Termination date: 20180801