CN106652995A - 文本语音播报方法及系统 - Google Patents
文本语音播报方法及系统 Download PDFInfo
- Publication number
- CN106652995A CN106652995A CN201611266121.6A CN201611266121A CN106652995A CN 106652995 A CN106652995 A CN 106652995A CN 201611266121 A CN201611266121 A CN 201611266121A CN 106652995 A CN106652995 A CN 106652995A
- Authority
- CN
- China
- Prior art keywords
- text
- word
- voice broadcasting
- module
- text message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 19
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 19
- 230000033764 rhythmic process Effects 0.000 claims description 25
- 230000007935 neutral effect Effects 0.000 claims description 17
- 238000005520 cutting process Methods 0.000 claims description 16
- 239000000463 material Substances 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000003062 neural network model Methods 0.000 claims description 6
- 238000005303 weighing Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 abstract 1
- 230000007547 defect Effects 0.000 abstract 1
- 230000001755 vocal effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 239000003086 colorant Substances 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000011430 maximum method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了文本语音播报方法,包括:采集文本信息;分析所述文本信息,并提取出文本特征;基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数;根据所述韵律特征参数进行语音合成并播放。本发明提供的语音播报方法及系统,克服了市面上类似产品播报语音生硬不自然,音色单一的不足,让文本的语音播报自然流畅,有更多不同的音色选择,更大程度上接近于人的语言沟通。
Description
技术领域
本发明涉及人工智能语音领域,尤其涉及文本语音播报方法及系统。
背景技术
文本语音播报应用于电信、银行、交通运输及智能机器人等,主要是对给定的文本进行语言学分析,逐句进行词汇的、语法的和语义的分析,以确定句子的低层结构和每个字的音素的组成,包括文本的断句、字词切分、多音字的处理、数字的处理、缩略语的处理等,把文本所对应的单字或短语从语音合成库中提取,把语言学描述转化成言语波形。目前市面上有不少类似的功能,但大多效果不佳,主要表现为播出的语音吐字生硬,音色单一。
发明内容
为了克服现有技术的不足,本发明的目的在于提供文本语音播报方法及系统,其能对任意文本进行流畅圆润的播报。
本发明的目的采用以下技术方案实现:
文本语音播报方法,包括:
采集文本信息;
分析所述文本信息,并提取出文本特征;
基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数;
根据所述韵律特征参数进行语音合成并播放。
优选的,所述分析文本信息,具体为:
根据预先添加的添加语法知识库和语法词典,利用最大匹配算法对文本信息进行切分。
优选的,所述提取出文本特征,具体为:
根据词语的属性计算词语权重,提取出文本关键词;将切分得到的字和/或词对应的词性以及关键词及关键词对应的词性作为文本信息对应的文本特征。
优选的,所述神经网络韵律模型是预先通过对语音材料库基于神经网络模型进行训练得到的。
优选的,所述语音材料库包括:用于语调短语修正的韵律词汇库以及用于参数解码音变规则的编码数据库和音变规则库。
本发明还涉及文本语音播报系统,包括:采集模块、分析模块、预测模块和合成模块;
所述采集模块,用于采集文本信息;
所述分析模块,用于分析所述文本信息,并提取出文本特征;
所述预测模块,用于基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数;
所述合成模块,用于根据所述韵律特征参数进行语音合成并播放。
优选的,还包括:切分模块;
所述切分模块,根据预先添加的添加语法知识库和语法词典,利用最大匹配算法对文本信息进行切分。
优选的,还包括:提取模块;
所述提取模块,用于根据词语的属性计算词语权重,提取出文本关键词;将切分得到的字和/或词对应的词性以及关键词及关键词对应的词性作为文本信息对应的文本特征。
优选的,所述神经网络韵律模型是预先通过对语音材料库基于神经网络模型进行训练得到的。
优选的,所述语音材料库包括:用于语调短语修正的韵律词汇库以及用于参数解码音变规则的编码数据库和音变规则库。
相比现有技术,本发明的有益效果在于:根据神经网络韵律模型预测所述文本信息对应的韵律特征参数进行语音合成,文本语音播报自然流畅。
附图说明
图1为本发明一实施例提供的文本语音播报方法流程示意图;
图2为本发明一实施例提供的文本语音播报系统结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明一实施例提供的文本语音播报方法,包括以下步骤:
步骤S101:采集文本信息。
具体的,智能设备上的应用程序与文本播放模块接口连接,应用程序采集文本信息通过文本播放模块接口将采集到的文本信息发送给对应的文本播放模块。文本播放模块对文本进行分析处理、特征提取已经合成。
步骤S102:分析所述文本信息,并提取出文本特征。
具体的,文本播放模块预先添加语法知识库和语法词典,本发明实施例中根据最大匹配算法确定分词,并滤除不能反映主题的功能词。
对采集到的文本信息,按照正向最大匹配算法,从左边开始取出等于预设最大词长数量的词语,查找语法知识库和语法词典中是否有所述词语,若没有查找到,则去掉右边第一个字继续查找,依次循环,直到从语法知识库和语法词典中查找到相应的词语,则输出词语,完成分词过程。
能标识文本特性的一般为文本中的名词、动词、形容词等,文本中的虚词如感叹词、介词、连词等对标识文本特性往往没有贡献,不能反映主题,在提取文本特征前去掉不能反映主题的功能词,提高文本特征提取的效率和准确率。完成文本切分后,得到对应的字和/或词,将对应的字和/或词与其词性关联。
同时,本发明实施例还根据词语的属性计算词语权重,提取出文本关键词。
词语的词性、词语的长度、词语在文中出现的位置和频率等多个因素影响词语的权重,根据文本特征提取算法,将多种词语影响因素引入评价函数计算词语的权重提取出文本关键词。
将得到的字和/或词对应的词性以及关键词及关键词对应的词性作为文本信息对应的文本特征。
步骤S103:基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数。
具体的,本发明实施例中文本播放模块包括预先建立的神经网络韵律模型。该神经网络韵律模型是通过对语音材料库基于神经网络模型训练得到的,可以是基于现有的深度神经网络和双向LSTM神经网络进行训练得到。语音材料库中的语句涵盖了汉语中常见的句型、汉语中所有的语音、文字上下文的特性、声调、重音等信息,使用语音材料库中的句子对神经网络模型进行训练和测试,合成的语音能体现不同的韵律特征,增加了系统的灵活性和风格的多样性。当然具体的韵律模型也可以采用其他模型,比如隐马克科夫韵律模型等。
在分析得到文本特征后,将对应的文本特征输入到神经网络韵律模型进行预测,得到对应的字、词的韵律特征参数。韵律特征参数包括谱参数以及基频参数等。
优选的,所述语音材料库还包括:用于语调短语修正的韵律词汇库以及用于参数解码音变规则的编码数据库和音变规则库。用户可以根据需要设置不同的音色,语音播报更多样化。
步骤S104:根据所述韵律特征参数进行语音合成并播放。
具体的,本发明实施例中,文本播报模块的语音合成模块,将韵律特征参数发送到声码器进行语音合成,输出音频文件并发送到文本播报模块的音频播放器,完成语音播报的过程。
优选的,步骤S104之前即在韵律特征参数发送给声码器进行语音合成之前,还可以对神经网络韵律模型预测的韵律特征参数进行优化,比如对基频参数进行基频重构,或者对谱参数以及重构后的基频参数进行平滑处理。然后再将优化后的韵律特征参数发送给声码器进行语音合成。
本实施例提供的语音播报方法,克服了市面上类似产品播报语音生硬不自然,音色单一的不足,让文本的语音播报自然流畅,有更多不同的音色选择,更大程度上接近于人的语言沟通。
本发明实施例还提供文本语音播报系统,如图2所示,包括:采集模块11、分析模块14、预测模块15和合成模块16;
所述采集模块11,用于采集文本信息;
所述分析模块14,用于分析所述文本信息,并提取出文本特征;
所述预测模块15,用于基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数;
所述合成模块16,用于根据所述韵律特征参数进行语音合成并播放。
优选的,还包括:切分模块12;
所述切分模块12,根据预先添加的添加语法知识库和语法词典,利用最大匹配算法对文本信息进行切分。
优选的,还包括:提取模块13;
所述提取模块13,用于根据词语的属性计算词语权重,提取出文本关键词;将切分得到的字和/或词对应的词性以及关键词及关键词对应的词性作为文本信息对应的文本特征。
优选的,所述神经网络韵律模型是预先通过对语音材料库进行训练得到的。
优选的,所述语音材料库包括:用于语调短语修正的韵律词汇库以及用于参数解码音变规则的编码数据库和音变规则库。
本实施例中的系统与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施例中的系统的结构及实施过程,为了说明书的简洁,在此就不再赘述。
为了描述的方便,描述以上系统时以功能分为各种模块分别描述。当然,在实施本发明时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明提供的语音播报方法及系统,克服了市面上类似产品播报语音生硬不自然,音色单一的不足,让文本的语音播报自然流畅,有更多不同的音色选择,更大程度上接近于人的语言沟通。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
Claims (10)
1.文本语音播报方法,其特征在于,包括:
采集文本信息;
分析所述文本信息,并提取出文本特征;
基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数;
根据所述韵律特征参数进行语音合成并播放。
2.根据权利要求1所述的文本语音播报方法,其特征在于,所述分析文本信息,具体为:
根据预先添加的添加语法知识库和语法词典,利用最大匹配算法对文本信息进行切分。
3.根据权利要求2所述的文本语音播报方法,其特征在于,所述提取出文本特征,具体为:
根据词语的属性计算词语权重,提取出文本关键词;将切分得到的字和/或词对应的词性以及关键词及关键词对应的词性作为文本信息对应的文本特征。
4.根据权利要求1至3任一所述的文本语音播报方法,其特征在于,所述神经网络韵律模型是预先通过对语音材料库基于神经网络模型进行训练得到的。
5.根据权利要求4所述的文本语音播报方法,其特征在于,所述语音材料库包括:用于语调短语修正的韵律词汇库以及用于参数解码音变规则的编码数据库和音变规则库。
6.文本语音播报系统,其特征在于,包括:采集模块、分析模块、预测模块和合成模块;
所述采集模块,用于采集文本信息;
所述分析模块,用于分析所述文本信息,并提取出文本特征;
所述预测模块,用于基于所述文本特征以及神经网络韵律模型预测所述文本信息对应的韵律特征参数;
所述合成模块,用于根据所述韵律特征参数进行语音合成并播放。
7.根据权利要求6所述的文本语音播报系统,其特征在于,还包括:切分模块;
所述切分模块,根据预先添加的添加语法知识库和语法词典,利用最大匹配算法对文本信息进行切分。
8.根据权利要求6所述的文本语音播报系统,其特征在于,还包括:提取模块;
所述提取模块,用于根据词语的属性计算词语权重,提取出文本关键词;将切分得到的字和/或词对应的词性以及关键词及关键词对应的词性作为文本信息对应的文本特征。
9.根据权利要求6至8任一所述的文本语音播报系统,其特征在于,所述神经网络韵律模型是预先通过对语音材料库基于神经网络模型进行训练得到的。
10.根据权利要求9所述的文本语音播报系统,其特征在于,所述语音材料库包括:用于语调短语修正的韵律词汇库以及用于参数解码音变规则的编码数据库和音变规则库。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611266121.6A CN106652995A (zh) | 2016-12-31 | 2016-12-31 | 文本语音播报方法及系统 |
PCT/CN2017/119976 WO2018121757A1 (zh) | 2016-12-31 | 2017-12-29 | 文本语音播报方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611266121.6A CN106652995A (zh) | 2016-12-31 | 2016-12-31 | 文本语音播报方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106652995A true CN106652995A (zh) | 2017-05-10 |
Family
ID=58838814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611266121.6A Pending CN106652995A (zh) | 2016-12-31 | 2016-12-31 | 文本语音播报方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106652995A (zh) |
WO (1) | WO2018121757A1 (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107134276A (zh) * | 2017-07-06 | 2017-09-05 | 大连华锐重工集团股份有限公司 | 一种可编程式智能语音播报系统及方法 |
CN107437413A (zh) * | 2017-07-05 | 2017-12-05 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
CN107452400A (zh) * | 2017-07-24 | 2017-12-08 | 珠海市魅族科技有限公司 | 语音播报方法及装置、计算机装置和计算机可读存储介质 |
WO2018121757A1 (zh) * | 2016-12-31 | 2018-07-05 | 深圳市优必选科技有限公司 | 文本语音播报方法及系统 |
CN109215629A (zh) * | 2018-11-22 | 2019-01-15 | Oppo广东移动通信有限公司 | 语音处理方法、装置及终端 |
CN109801618A (zh) * | 2017-11-16 | 2019-05-24 | 深圳市腾讯计算机系统有限公司 | 一种音频信息的生成方法和装置 |
CN109801608A (zh) * | 2018-12-18 | 2019-05-24 | 武汉西山艺创文化有限公司 | 一种基于神经网络的歌曲生成方法和系统 |
CN109920509A (zh) * | 2019-01-17 | 2019-06-21 | 平安科技(深圳)有限公司 | 药品信息识别方法、装置、计算机设备和存储介质 |
CN110556092A (zh) * | 2018-05-15 | 2019-12-10 | 中兴通讯股份有限公司 | 语音的合成方法及装置、存储介质、电子装置 |
CN110599998A (zh) * | 2018-05-25 | 2019-12-20 | 阿里巴巴集团控股有限公司 | 一种语音数据生成方法及装置 |
CN111133506A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市优必选科技股份有限公司 | 语音合成模型的训练方法、装置、计算机设备及存储介质 |
CN111276123A (zh) * | 2018-11-16 | 2020-06-12 | 阿拉的(深圳)人工智能有限公司 | 一种语音播报留言的方法、装置、计算机设备及存储介质 |
CN111292719A (zh) * | 2020-02-07 | 2020-06-16 | 北京字节跳动网络技术有限公司 | 语音合成方法、装置、计算机可读介质及电子设备 |
CN111856997A (zh) * | 2020-07-09 | 2020-10-30 | 中车青岛四方机车车辆股份有限公司 | 轨道车辆智能控制系统及轨道车辆 |
CN112133279A (zh) * | 2019-06-06 | 2020-12-25 | Tcl集团股份有限公司 | 车载信息播报方法、装置及终端设备 |
CN112270917A (zh) * | 2020-10-20 | 2021-01-26 | 网易(杭州)网络有限公司 | 一种语音合成方法、装置、电子设备及可读存储介质 |
CN112802480A (zh) * | 2021-04-15 | 2021-05-14 | 广东际洲科技股份有限公司 | 基于多方交流的语音数据文字转化方法 |
CN113382123A (zh) * | 2020-03-10 | 2021-09-10 | 精工爱普生株式会社 | 扫描系统、存储介质以及扫描系统的扫描数据生成方法 |
CN113628609A (zh) * | 2020-05-09 | 2021-11-09 | 微软技术许可有限责任公司 | 自动音频内容生成 |
CN112270917B (zh) * | 2020-10-20 | 2024-06-04 | 网易(杭州)网络有限公司 | 一种语音合成方法、装置、电子设备及可读存储介质 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111435597B (zh) * | 2019-01-15 | 2023-01-10 | 珠海格力电器股份有限公司 | 语音信息的处理方法和装置 |
CN111754977A (zh) * | 2020-06-16 | 2020-10-09 | 普强信息技术(北京)有限公司 | 一种基于互联网的语音实时合成系统 |
CN112164403A (zh) * | 2020-09-27 | 2021-01-01 | 江苏四象软件有限公司 | 一种基于人工智能的自然语言处理系统 |
CN112086086A (zh) * | 2020-10-22 | 2020-12-15 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及计算机可读存储介质 |
CN116186325B (zh) * | 2023-04-26 | 2023-06-30 | 深圳市小彼恩文教科技有限公司 | 一种基于数据处理的点读笔信息识别与管理方法及系统 |
CN116524910B (zh) * | 2023-06-25 | 2023-09-08 | 安徽声讯信息技术有限公司 | 一种基于麦克风的文稿预制方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007025338A (ja) * | 2005-07-19 | 2007-02-01 | Oki Electric Ind Co Ltd | 音声合成方法,音声合成装置,およびコンピュータプログラム |
CN103165126A (zh) * | 2011-12-15 | 2013-06-19 | 无锡中星微电子有限公司 | 一种手机文本短信的语音播放的方法 |
CN105551481A (zh) * | 2015-12-21 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 语音数据的韵律标注方法及装置 |
CN106227721A (zh) * | 2016-08-08 | 2016-12-14 | 中国科学院自动化研究所 | 汉语韵律层级结构预测系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427855A (zh) * | 2015-11-09 | 2016-03-23 | 上海语知义信息技术有限公司 | 一种智能软件的语音播报系统及语音播报方法 |
CN106652995A (zh) * | 2016-12-31 | 2017-05-10 | 深圳市优必选科技有限公司 | 文本语音播报方法及系统 |
-
2016
- 2016-12-31 CN CN201611266121.6A patent/CN106652995A/zh active Pending
-
2017
- 2017-12-29 WO PCT/CN2017/119976 patent/WO2018121757A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007025338A (ja) * | 2005-07-19 | 2007-02-01 | Oki Electric Ind Co Ltd | 音声合成方法,音声合成装置,およびコンピュータプログラム |
CN103165126A (zh) * | 2011-12-15 | 2013-06-19 | 无锡中星微电子有限公司 | 一种手机文本短信的语音播放的方法 |
CN105551481A (zh) * | 2015-12-21 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 语音数据的韵律标注方法及装置 |
CN106227721A (zh) * | 2016-08-08 | 2016-12-14 | 中国科学院自动化研究所 | 汉语韵律层级结构预测系统 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018121757A1 (zh) * | 2016-12-31 | 2018-07-05 | 深圳市优必选科技有限公司 | 文本语音播报方法及系统 |
CN107437413A (zh) * | 2017-07-05 | 2017-12-05 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
WO2019007308A1 (zh) * | 2017-07-05 | 2019-01-10 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
CN107134276A (zh) * | 2017-07-06 | 2017-09-05 | 大连华锐重工集团股份有限公司 | 一种可编程式智能语音播报系统及方法 |
CN107452400A (zh) * | 2017-07-24 | 2017-12-08 | 珠海市魅族科技有限公司 | 语音播报方法及装置、计算机装置和计算机可读存储介质 |
CN109801618A (zh) * | 2017-11-16 | 2019-05-24 | 深圳市腾讯计算机系统有限公司 | 一种音频信息的生成方法和装置 |
CN110556092A (zh) * | 2018-05-15 | 2019-12-10 | 中兴通讯股份有限公司 | 语音的合成方法及装置、存储介质、电子装置 |
CN110599998B (zh) * | 2018-05-25 | 2023-08-18 | 阿里巴巴集团控股有限公司 | 一种语音数据生成方法及装置 |
CN110599998A (zh) * | 2018-05-25 | 2019-12-20 | 阿里巴巴集团控股有限公司 | 一种语音数据生成方法及装置 |
CN111276123A (zh) * | 2018-11-16 | 2020-06-12 | 阿拉的(深圳)人工智能有限公司 | 一种语音播报留言的方法、装置、计算机设备及存储介质 |
CN109215629A (zh) * | 2018-11-22 | 2019-01-15 | Oppo广东移动通信有限公司 | 语音处理方法、装置及终端 |
CN109215629B (zh) * | 2018-11-22 | 2021-01-01 | Oppo广东移动通信有限公司 | 语音处理方法、装置及终端 |
CN109801608A (zh) * | 2018-12-18 | 2019-05-24 | 武汉西山艺创文化有限公司 | 一种基于神经网络的歌曲生成方法和系统 |
CN109920509A (zh) * | 2019-01-17 | 2019-06-21 | 平安科技(深圳)有限公司 | 药品信息识别方法、装置、计算机设备和存储介质 |
CN109920509B (zh) * | 2019-01-17 | 2024-05-14 | 平安科技(深圳)有限公司 | 药品信息识别方法、装置、计算机设备和存储介质 |
CN112133279A (zh) * | 2019-06-06 | 2020-12-25 | Tcl集团股份有限公司 | 车载信息播报方法、装置及终端设备 |
CN111133506A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市优必选科技股份有限公司 | 语音合成模型的训练方法、装置、计算机设备及存储介质 |
CN111292719A (zh) * | 2020-02-07 | 2020-06-16 | 北京字节跳动网络技术有限公司 | 语音合成方法、装置、计算机可读介质及电子设备 |
CN113382123A (zh) * | 2020-03-10 | 2021-09-10 | 精工爱普生株式会社 | 扫描系统、存储介质以及扫描系统的扫描数据生成方法 |
CN113628609A (zh) * | 2020-05-09 | 2021-11-09 | 微软技术许可有限责任公司 | 自动音频内容生成 |
CN111856997A (zh) * | 2020-07-09 | 2020-10-30 | 中车青岛四方机车车辆股份有限公司 | 轨道车辆智能控制系统及轨道车辆 |
CN112270917A (zh) * | 2020-10-20 | 2021-01-26 | 网易(杭州)网络有限公司 | 一种语音合成方法、装置、电子设备及可读存储介质 |
CN112270917B (zh) * | 2020-10-20 | 2024-06-04 | 网易(杭州)网络有限公司 | 一种语音合成方法、装置、电子设备及可读存储介质 |
CN112802480A (zh) * | 2021-04-15 | 2021-05-14 | 广东际洲科技股份有限公司 | 基于多方交流的语音数据文字转化方法 |
CN112802480B (zh) * | 2021-04-15 | 2021-07-13 | 广东际洲科技股份有限公司 | 基于多方交流的语音数据文字转化方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2018121757A1 (zh) | 2018-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106652995A (zh) | 文本语音播报方法及系统 | |
CN110491382B (zh) | 基于人工智能的语音识别方法、装置及语音交互设备 | |
Pitrelli et al. | The IBM expressive text-to-speech synthesis system for American English | |
CN103928023B (zh) | 一种语音评分方法及系统 | |
CN102176310B (zh) | 具有巨大词汇量的语音识别系统 | |
CN112767958A (zh) | 一种基于零次学习的跨语种音色转换系统及方法 | |
CN108364632A (zh) | 一种具备情感的中文文本人声合成方法 | |
CN109036371A (zh) | 用于语音合成的音频数据生成方法及系统 | |
CN106803422A (zh) | 一种基于长短时记忆网络的语言模型重估方法 | |
CN109326280B (zh) | 一种歌唱合成方法及装置、电子设备 | |
CN109102796A (zh) | 一种语音合成方法及装置 | |
CN102945673A (zh) | 一种语音指令范围动态变化的连续语音识别方法 | |
CN106653002A (zh) | 一种文字直播方法及平台 | |
CN109300339A (zh) | 一种英语口语的练习方法及系统 | |
CN110459202A (zh) | 一种韵律标注方法、装置、设备、介质 | |
CN103035244B (zh) | 一种可实时反馈用户朗读进度的语音跟踪方法 | |
CN114125506B (zh) | 语音审核方法及装置 | |
US20140074478A1 (en) | System and method for digitally replicating speech | |
CN116129868A (zh) | 一种结构化画本的生成方法和生成系统 | |
CN116386594A (zh) | 语音合成方法、语音合成装置、电子设备及存储介质 | |
CN113539239B (zh) | 语音转换方法、装置、存储介质及电子设备 | |
CN111402887A (zh) | 一种语音转义文字的方法及装置 | |
CN114974218A (zh) | 语音转换模型训练方法及装置、语音转换方法及装置 | |
Ekpenyong et al. | Unsupervised visualization of Under-resourced speech prosody | |
CN115457931B (zh) | 一种语音的合成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170510 |