CN113724684A - 一种空中交通管制指令的语音合成方法及系统 - Google Patents
一种空中交通管制指令的语音合成方法及系统 Download PDFInfo
- Publication number
- CN113724684A CN113724684A CN202111213753.7A CN202111213753A CN113724684A CN 113724684 A CN113724684 A CN 113724684A CN 202111213753 A CN202111213753 A CN 202111213753A CN 113724684 A CN113724684 A CN 113724684A
- Authority
- CN
- China
- Prior art keywords
- reference audio
- voice
- air traffic
- traffic control
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001308 synthesis method Methods 0.000 title abstract description 10
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 93
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 93
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000013459 approach Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开一种空中交通管制指令的语音合成方法及系统,涉及语音合成技术领域,方法包括:获取训练数据集;训练数据集包括多种空中交通管制指令的文本样本以及与文本样本对应的语音样本;利用训练数据集对语音合成模型进行训练和优化;获取参考音频;参考音频包括默认参考音频和自定义参考音频;默认参考音频为任意一个语音样本;自定义参考音频的特征与语音样本的特征相同;特征包括声音、语速、语调和背景音;将参考音频和待生成空中交通管制指令的语音对应的文本均输入优化后的语音合成模型中,生成具有参考音频的特征的空中交通管制指令的语音。本发明能够使生成的空中交通管制指令的语音更接近于真实的空中交通管制员的录音。
Description
技术领域
本发明涉及语音合成技术领域,特别是涉及一种空中交通管制指令的语音合成方法及系统。
背景技术
近年来,人工智能技术的发展,语音识别技术也更多的利用到了航空运输领域。目前的语音识别研究中,在语料充足的情况下,构建出一个指定语言的声学模型是容易的。但是由于空中交通管制员与飞行员的对话语料稀缺,而且标注会带来较高的人力及时间成本,目前空中交通管制指令的语音存在数据量不足的问题,如何收集到大量的空中交通管制指令的语音成为了一个难题。
空中交通管制员发出的空中交通管制指令的语音,具有极强的专业性,与其他普通语音存在很大的不同,采用通用语音合成技术生成的空中交通管制指令的语音,在声音、语速、语调和背景音等方面均与真实的空中交通管制员的录音有一定的差距,对语音识别的训练起不到很大的作用。基于此,如何使生成的空中交通管制指令的语音在语速、语调和背景音等方面都更接近于真实的空中交通管制员的录音,成为本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种空中交通管制指令的语音合成方法及系统,能够使生成的空中交通管制指令的语音更接近于真实的空中交通管制员的录音。
为实现上述目的,本发明提供了如下方案:
一种空中交通管制指令的语音合成方法,所述方法包括:
获取训练数据集;所述训练数据集包括多种空中交通管制指令的文本样本以及与所述文本样本对应的语音样本;
利用所述训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型;
获取参考音频;所述参考音频包括默认参考音频和自定义参考音频;所述默认参考音频为任意一个所述语音样本;所述自定义参考音频的特征与所述语音样本的特征相同;所述特征包括声音、语速、语调和背景音;
将所述参考音频和待生成空中交通管制指令的语音对应的文本均输入所述优化后的语音合成模型中,生成具有所述参考音频的特征的空中交通管制指令的语音。
可选地,所述利用所述训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型,具体包括:
将所述空中交通管制指令的文本样本输入文本编码器中,并将所述文本样本对应的语音样本分别输入参考编码器和声码器中进行训练和优化,得到优化后的语音合成模型;所述语音合成模型包括文本编码器、参考编码器和声码器。
可选地,所述获取参考音频,之前还包括:
获取待生成空中交通管制指令的语音所属的场景;所述场景包括放行、塔台和进近;
利用空管语法生成所述场景对应的空中交通管制指令的文本。
可选地,所述获取参考音频,之前还包括:
获取合成模式;所述合成模式包括默认模式和自定义模式;
当所述合成模式为默认模式时,获取所述默认参考音频,将所述默认参考音频作为所述参考音频;
当所述合成模式为自定义模式时,获取所述自定义参考音频,将所述自定义参考音频作为所述参考音频。
本发明还提供了如下方案:
一种空中交通管制指令的语音合成系统,所述系统包括:
训练数据集获取模块,用于获取训练数据集;所述训练数据集包括多种空中交通管制指令的文本样本以及与所述文本样本对应的语音样本;
模型训练和优化模块,用于利用所述训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型;
参考音频获取模块,用于获取参考音频;所述参考音频包括默认参考音频和自定义参考音频;所述默认参考音频为任意一个所述语音样本;所述自定义参考音频的特征与所述语音样本的特征相同;所述特征包括声音、语速、语调和背景音;
语音生成模块,用于将所述参考音频和待生成空中交通管制指令的语音对应的文本均输入所述优化后的语音合成模型中,生成具有所述参考音频的特征的空中交通管制指令的语音。
可选地,所述模型训练和优化模块具体包括:
模型训练和优化单元,用于将所述空中交通管制指令的文本样本输入文本编码器中,并将所述文本样本对应的语音样本分别输入参考编码器和声码器中进行训练和优化,得到优化后的语音合成模型;所述语音合成模型包括文本编码器、参考编码器和声码器。
可选地,所述参考音频获取模块之前还包括:
场景获取模块,用于获取待生成空中交通管制指令的语音所属的场景;所述场景包括放行、塔台和进近;
指令文本生成模块,用于利用空管语法生成所述场景对应的空中交通管制指令的文本。
可选地,所述参考音频获取模块之前还包括:
合成模式获取模块,用于获取合成模式;所述合成模式包括默认模式和自定义模式;
默认参考音频获取模块,用于当所述合成模式为默认模式时,获取所述默认参考音频,将所述默认参考音频作为所述参考音频;
自定义参考音频获取模块,用于当所述合成模式为自定义模式时,获取所述自定义参考音频,将所述自定义参考音频作为所述参考音频。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开的空中交通管制指令的语音合成方法及系统,利用空中交通管制指令的语音样本对语音合成模型进行训练和优化,采用优化后的语音合成模型生成具有参考音频的声音、语速、语调和背景音等特征的空中交通管制指令的语音,从而使生成的空中交通管制指令的语音更接近于真实的空中交通管制员的录音。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明空中交通管制指令的语音合成方法实施例的流程图;
图2为本发明空中交通管制指令的语音合成系统实施例的结构图;
图3为本发明空中交通管制指令的语音合成系统原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种空中交通管制指令的语音合成方法及系统,能够使生成的空中交通管制指令的语音更接近于真实的空中交通管制员的录音。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明空中交通管制指令的语音合成方法实施例的流程图。参见图1,该空中交通管制指令的语音合成方法包括:
步骤101:获取训练数据集;训练数据集包括多种空中交通管制指令的文本样本以及与文本样本对应的语音样本。
步骤102:利用训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型。
步骤103:获取参考音频;参考音频包括默认参考音频和自定义参考音频;默认参考音频为任意一个语音样本;自定义参考音频的特征与语音样本的特征相同;特征包括声音、语速、语调和背景音。
步骤104:将参考音频和待生成空中交通管制指令的语音对应的文本均输入优化后的语音合成模型中,生成具有参考音频的特征的空中交通管制指令的语音。
具体的,步骤102具体包括:
将空中交通管制指令的文本样本输入文本编码器中,并将文本样本对应的语音样本分别输入参考编码器和声码器中进行训练和优化,得到优化后的语音合成模型;语音合成模型包括文本编码器、参考编码器和声码器。
步骤103之前还包括:
获取待生成空中交通管制指令的语音所属的场景;场景包括放行、塔台和进近。
利用空管语法生成场景对应的空中交通管制指令的文本。
获取合成模式;合成模式包括默认模式和自定义模式。
当合成模式为默认模式时,获取默认参考音频,将默认参考音频作为参考音频。
当合成模式为自定义模式时,获取自定义参考音频,将自定义参考音频作为参考音频。
其中,获取待生成空中交通管制指令的语音所属的场景时,还可以同时获取待生成空中交通管制指令的语音的数量,即用户可以选择所要合成空中交通管制指令所属的场景、合成的数量,并选择合成模式。
空管语法包括各场景下的空管命令语法规则,即各场景对应的空中交通管制指令,根据各场景下的空管命令语法规则生成相应数量的空管命令文本,即空中交通管制指令的文本。
用户选择合成语音的模型(语音合成模型)后,用户可以选择默认模式或自定义模式,当用户选择默认模式时,会将存储的默认参考音频输入合成模型,当用户选择自定义模式时,则还需将带有想要合成空中交通管制风格的音频作为参考音频输入到语音合成模型中,语音合成模型的输出结果则是模拟用户参考音频中的管制员的声音、语速和语调等特征。
语音合成模型包括编码器、解码器和声码器,编码器包括文本编码器和参考音频编码器。语音合成模型在训练阶段需要使用至少20小时的真实空中交通管制的语音进行训练。编码器接收用户输入的数据后,文本编码器将输入文本序列转换为相应的潜在表示,参考编码器对参考音频中空中交通管制员的声音、语速、语调及环境背景(背景音)等特征进行提取,并将其转换为相应的潜在表示。编码器输出的潜在表示输入到解码器,解码器根据上采样后的潜在表示进行频谱预测。解码器生成的频谱序列输入声码器进行声音合成,使用声码器从预测的频谱图合成波形。
本发明提供一种基于管制员风格,即空中交通管制风格的语音合成方法和系统,用户选择所要合成空中交通管制命令(空中交通管制指令的语音)所属场景、合成数量,并选择合成模式。若用户选择自定义模式,需要将带有所需合成风格的参考音频输入模型,否则模型将使用默认参考音频。根据用户选择场景生成相应数量的该场景下的标准空中交通管制命令。将生成的空中交通管制命令文本输入语音合成模型,语音合成模型输出所预测的合成语音的频谱图,并将频谱图输入到声码器。声码器根据输入合成语音,输出合成语音的音频wav文件。
本发明利用空管语法生成场景对应的空中交通管制指令的文本,会根据用户选择的场景生成该场景下的标准空中交通管制命令,并且一次可合成数量不同的音频,用户不用手动输入命令文本给语音合成模型。本发明和目前通用语音合成技术相比,因为添加了参考音频编码器,对带有空中交通管制风格的语音音频进行风格特征提取,使合成语音在声音、语速、语调和背景音等方面都更接近于真实的空中管制场景下的语音。
图2为本发明空中交通管制指令的语音合成系统实施例的结构图,图3为本发明空中交通管制指令的语音合成系统原理图,参见图2和图3,该空中交通管制指令的语音合成系统包括:
训练数据集获取模块201,用于获取训练数据集;训练数据集包括多种空中交通管制指令的文本样本以及与文本样本对应的语音样本。
模型训练和优化模块202,用于利用训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型。
参考音频获取模块203,用于获取参考音频;参考音频包括默认参考音频和自定义参考音频;默认参考音频为任意一个语音样本;自定义参考音频的特征与语音样本的特征相同;特征包括声音、语速、语调和背景音。
语音生成模块204,用于将参考音频和待生成空中交通管制指令的语音对应的文本均输入优化后的语音合成模型中,生成具有参考音频的特征的空中交通管制指令的语音。
具体的,模型训练和优化模块202具体包括:
模型训练和优化单元,用于将空中交通管制指令的文本样本输入文本编码器中,并将文本样本对应的语音样本分别输入参考编码器和声码器中进行训练和优化,得到优化后的语音合成模型;语音合成模型包括文本编码器、参考编码器和声码器。
参考音频获取模块203之前还包括:
场景获取模块,用于获取待生成空中交通管制指令的语音所属的场景;场景包括放行、塔台和进近。
指令文本生成模块,用于利用空管语法生成场景对应的空中交通管制指令的文本。
合成模式获取模块,用于获取合成模式;合成模式包括默认模式和自定义模式。
默认参考音频获取模块,用于当合成模式为默认模式时,获取默认参考音频,将默认参考音频作为参考音频;即当用户选择默认模式时,系统会将系统内的默认参考音频输入语音合成模型。
自定义参考音频获取模块,用于当合成模式为自定义模式时,获取自定义参考音频,将自定义参考音频作为参考音频。
本发明空中交通管制指令的语音合成系统添加了命令生成模型,即指令文本生成模块,用户不用手动输入命令文本,系统会根据用户选择的场景生成该场景下的标准空中管制命令,并且一次可合成数量不同的音频。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种空中交通管制指令的语音合成方法,其特征在于,所述方法包括:
获取训练数据集;所述训练数据集包括多种空中交通管制指令的文本样本以及与所述文本样本对应的语音样本;
利用所述训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型;
获取参考音频;所述参考音频包括默认参考音频和自定义参考音频;所述默认参考音频为任意一个所述语音样本;所述自定义参考音频的特征与所述语音样本的特征相同;所述特征包括声音、语速、语调和背景音;
将所述参考音频和待生成空中交通管制指令的语音对应的文本均输入所述优化后的语音合成模型中,生成具有所述参考音频的特征的空中交通管制指令的语音。
2.根据权利要求1所述的空中交通管制指令的语音合成方法,其特征在于,所述利用所述训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型,具体包括:
将所述空中交通管制指令的文本样本输入文本编码器中,并将所述文本样本对应的语音样本分别输入参考编码器和声码器中进行训练和优化,得到优化后的语音合成模型;所述语音合成模型包括文本编码器、参考编码器和声码器。
3.根据权利要求1所述的空中交通管制指令的语音合成方法,其特征在于,所述获取参考音频,之前还包括:
获取待生成空中交通管制指令的语音所属的场景;所述场景包括放行、塔台和进近;
利用空管语法生成所述场景对应的空中交通管制指令的文本。
4.根据权利要求1所述的空中交通管制指令的语音合成方法,其特征在于,所述获取参考音频,之前还包括:
获取合成模式;所述合成模式包括默认模式和自定义模式;
当所述合成模式为默认模式时,获取所述默认参考音频,将所述默认参考音频作为所述参考音频;
当所述合成模式为自定义模式时,获取所述自定义参考音频,将所述自定义参考音频作为所述参考音频。
5.一种空中交通管制指令的语音合成系统,其特征在于,所述系统包括:
训练数据集获取模块,用于获取训练数据集;所述训练数据集包括多种空中交通管制指令的文本样本以及与所述文本样本对应的语音样本;
模型训练和优化模块,用于利用所述训练数据集对语音合成模型进行训练和优化,得到优化后的语音合成模型;
参考音频获取模块,用于获取参考音频;所述参考音频包括默认参考音频和自定义参考音频;所述默认参考音频为任意一个所述语音样本;所述自定义参考音频的特征与所述语音样本的特征相同;所述特征包括声音、语速、语调和背景音;
语音生成模块,用于将所述参考音频和待生成空中交通管制指令的语音对应的文本均输入所述优化后的语音合成模型中,生成具有所述参考音频的特征的空中交通管制指令的语音。
6.根据权利要求5所述的空中交通管制指令的语音合成系统,其特征在于,所述模型训练和优化模块具体包括:
模型训练和优化单元,用于将所述空中交通管制指令的文本样本输入文本编码器中,并将所述文本样本对应的语音样本分别输入参考编码器和声码器中进行训练和优化,得到优化后的语音合成模型;所述语音合成模型包括文本编码器、参考编码器和声码器。
7.根据权利要求5所述的空中交通管制指令的语音合成系统,其特征在于,所述参考音频获取模块之前还包括:
场景获取模块,用于获取待生成空中交通管制指令的语音所属的场景;所述场景包括放行、塔台和进近;
指令文本生成模块,用于利用空管语法生成所述场景对应的空中交通管制指令的文本。
8.根据权利要求5所述的空中交通管制指令的语音合成系统,其特征在于,所述参考音频获取模块之前还包括:
合成模式获取模块,用于获取合成模式;所述合成模式包括默认模式和自定义模式;
默认参考音频获取模块,用于当所述合成模式为默认模式时,获取所述默认参考音频,将所述默认参考音频作为所述参考音频;
自定义参考音频获取模块,用于当所述合成模式为自定义模式时,获取所述自定义参考音频,将所述自定义参考音频作为所述参考音频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111213753.7A CN113724684B (zh) | 2021-10-19 | 2021-10-19 | 一种空中交通管制指令的语音合成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111213753.7A CN113724684B (zh) | 2021-10-19 | 2021-10-19 | 一种空中交通管制指令的语音合成方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113724684A true CN113724684A (zh) | 2021-11-30 |
CN113724684B CN113724684B (zh) | 2024-06-14 |
Family
ID=78686164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111213753.7A Active CN113724684B (zh) | 2021-10-19 | 2021-10-19 | 一种空中交通管制指令的语音合成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113724684B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223537A (zh) * | 2022-09-20 | 2022-10-21 | 四川大学 | 一种面向空管培训场景的语音合成方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6950037B1 (en) * | 2003-05-06 | 2005-09-27 | Sensis Corporation | Smart airport automation system |
CN109448493A (zh) * | 2018-12-27 | 2019-03-08 | 中国电子科技集团公司第十五研究所 | 塔台管制模拟训练系统、语音管制指令识别及报读方法 |
CN111105647A (zh) * | 2019-12-16 | 2020-05-05 | 四川大学 | 一种基于空管语音识别与合成的管制指令发布系统及方法 |
CN111179905A (zh) * | 2020-01-10 | 2020-05-19 | 北京中科深智科技有限公司 | 一种快速配音生成方法及装置 |
CN112133280A (zh) * | 2020-09-11 | 2020-12-25 | 璞洛泰珂(上海)智能科技有限公司 | 飞行员语音合成方法 |
CN112365877A (zh) * | 2020-11-27 | 2021-02-12 | 北京百度网讯科技有限公司 | 语音合成方法、装置、电子设备和存储介质 |
CN112786004A (zh) * | 2020-12-30 | 2021-05-11 | 科大讯飞股份有限公司 | 语音合成方法以及电子设备、存储装置 |
CN112786008A (zh) * | 2021-01-20 | 2021-05-11 | 北京有竹居网络技术有限公司 | 语音合成方法、装置、可读介质及电子设备 |
CN113096638A (zh) * | 2021-06-09 | 2021-07-09 | 北京世纪好未来教育科技有限公司 | 语音合成模型训练方法、语音合成方法及装置 |
US20210217404A1 (en) * | 2018-05-17 | 2021-07-15 | Google Llc | Synthesis of Speech from Text in a Voice of a Target Speaker Using Neural Networks |
CN113257220A (zh) * | 2021-06-28 | 2021-08-13 | 北京世纪好未来教育科技有限公司 | 语音合成模型的训练方法、装置、电子设备及存储介质 |
-
2021
- 2021-10-19 CN CN202111213753.7A patent/CN113724684B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6950037B1 (en) * | 2003-05-06 | 2005-09-27 | Sensis Corporation | Smart airport automation system |
US20210217404A1 (en) * | 2018-05-17 | 2021-07-15 | Google Llc | Synthesis of Speech from Text in a Voice of a Target Speaker Using Neural Networks |
CN109448493A (zh) * | 2018-12-27 | 2019-03-08 | 中国电子科技集团公司第十五研究所 | 塔台管制模拟训练系统、语音管制指令识别及报读方法 |
CN111105647A (zh) * | 2019-12-16 | 2020-05-05 | 四川大学 | 一种基于空管语音识别与合成的管制指令发布系统及方法 |
CN111179905A (zh) * | 2020-01-10 | 2020-05-19 | 北京中科深智科技有限公司 | 一种快速配音生成方法及装置 |
CN112133280A (zh) * | 2020-09-11 | 2020-12-25 | 璞洛泰珂(上海)智能科技有限公司 | 飞行员语音合成方法 |
CN112365877A (zh) * | 2020-11-27 | 2021-02-12 | 北京百度网讯科技有限公司 | 语音合成方法、装置、电子设备和存储介质 |
CN112786004A (zh) * | 2020-12-30 | 2021-05-11 | 科大讯飞股份有限公司 | 语音合成方法以及电子设备、存储装置 |
CN112786008A (zh) * | 2021-01-20 | 2021-05-11 | 北京有竹居网络技术有限公司 | 语音合成方法、装置、可读介质及电子设备 |
CN113096638A (zh) * | 2021-06-09 | 2021-07-09 | 北京世纪好未来教育科技有限公司 | 语音合成模型训练方法、语音合成方法及装置 |
CN113257220A (zh) * | 2021-06-28 | 2021-08-13 | 北京世纪好未来教育科技有限公司 | 语音合成模型的训练方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223537A (zh) * | 2022-09-20 | 2022-10-21 | 四川大学 | 一种面向空管培训场景的语音合成方法及装置 |
CN115223537B (zh) * | 2022-09-20 | 2022-12-02 | 四川大学 | 一种面向空管培训场景的语音合成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113724684B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9368104B2 (en) | System and method for synthesizing human speech using multiple speakers and context | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
US20030154080A1 (en) | Method and apparatus for modification of audio input to a data processing system | |
WO2010025460A1 (en) | System and method for speech-to-speech translation | |
CN101901598A (zh) | 一种哼唱合成方法和系统 | |
KR20230133362A (ko) | 다양하고 자연스러운 텍스트 스피치 변환 샘플들 생성 | |
CN112102811A (zh) | 一种合成语音的优化方法、装置及电子设备 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
Onaolapo et al. | A simplified overview of text-to-speech synthesis | |
CN113724684A (zh) | 一种空中交通管制指令的语音合成方法及系统 | |
CN113470622A (zh) | 一种可将任意语音转换成多个语音的转换方法及装置 | |
JP6330069B2 (ja) | 統計的パラメトリック音声合成のためのマルチストリームスペクトル表現 | |
CN113870833A (zh) | 语音合成相关系统、方法、装置及设备 | |
CN113851140A (zh) | 语音转换相关方法、系统及装置 | |
CN113948062B (zh) | 数据转换方法及计算机存储介质 | |
CN112242134A (zh) | 语音合成方法及装置 | |
CN115762471A (zh) | 一种语音合成方法、装置、设备及存储介质 | |
JP2021148942A (ja) | 声質変換システムおよび声質変換方法 | |
Pitrelli et al. | Expressive speech synthesis using American English ToBI: questions and contrastive emphasis | |
Li et al. | A lyrics to singing voice synthesis system with variable timbre | |
Charfuelan et al. | MARY TTS unit selection and HMM-based voices for the Blizzard Challenge 2013 | |
JP2536169B2 (ja) | 規則型音声合成装置 | |
CN117636842B (zh) | 基于韵律情感迁移的语音合成系统及方法 | |
Xian-Yi et al. | Review of modern speech synthesis | |
KR101095867B1 (ko) | 음성합성장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |