CN101308652A - 一种个性化歌唱语音的合成方法 - Google Patents

一种个性化歌唱语音的合成方法 Download PDF

Info

Publication number
CN101308652A
CN101308652A CNA2008101071140A CN200810107114A CN101308652A CN 101308652 A CN101308652 A CN 101308652A CN A2008101071140 A CNA2008101071140 A CN A2008101071140A CN 200810107114 A CN200810107114 A CN 200810107114A CN 101308652 A CN101308652 A CN 101308652A
Authority
CN
China
Prior art keywords
model
duration
singing voice
personalized
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101071140A
Other languages
English (en)
Other versions
CN101308652B (zh
Inventor
王玉平
江源
凌震华
胡国平
胡郁
刘庆峰
王仁华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN2008101071140A priority Critical patent/CN101308652B/zh
Publication of CN101308652A publication Critical patent/CN101308652A/zh
Application granted granted Critical
Publication of CN101308652B publication Critical patent/CN101308652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及一种个性化歌唱语音的合成方法,包括以下步骤:对语音的线谱频率系数进行建模,并训练得到相关的决策树模型;录制特定用户的朗读风格语音,得到该用户的线谱频率系数模型;得到简谱中的歌词上下文相关的属性集,根据决策树模型和个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;根据简谱约定生成基频信息,并与生成的时长、频谱参数合并后,得到所有的合成参数,将这些参数输入参数化语音合成声码器,可合成出个性化的歌唱语音。本发明提供了只要对少数的韵律参数进行调整,就能合成出歌唱风格的合成语音,只要能录制一个少量的朗读风格库,就能合成出歌唱风格语音的合成方法。

Description

一种个性化歌唱语音的合成方法
技术领域
本发明涉及一种语音合成方法,具体涉及一种在只有少量朗读风格训练数据的情况下,合成出目标发音人歌唱风格语音的合成方法。
背景技术
近年来,语音合成技术获得了很大的发展,由于现在合成语音的音质和自然度都不错,大家对合成系统提出了更多的需求,比如多样化的语音合成,包括多个发音人、多种发音风格、多语种等,所以在可训练语音合成技术基础上发展起来的模型自适应技术得到了越来越广泛的应用,模型自适应技术在合成朗读风格语音的时候可以取得很好的效果,但是在针对歌唱风格的语音合成时缺乏足够的应用研究。
此外,为了合成出具有歌唱风格的合成语音,有关研究机构也进行了相关研究,主要方法是借鉴朗读风格的语音合成方法,首先录制一个规模较大的歌唱风格库,然后根据可训练语音合成方法来合成出歌唱风格的语音,这种方法可以合成比较自然真实的合成语音,但是由于歌唱时的控制很难,所以歌唱风格库的录制难度要远高于朗读风格库的录制,而且,如果要合成另外一个发音人的歌唱语音时,需要对这个发音人再录制一个歌唱风格库,对于大多数普通人来说,录制这样一个规模的歌唱风格库基本上是不可能的。
发明内容
本发明针对现有技术的不足,提供了只要对少数的韵律参数进行调整,就能合成出歌唱风格的合成语音,只要能录制一个少量的朗读风格库,就能合成出歌唱风格语音的合成方法。
本发明是通过以下技术方案实现的:
一种个性化歌唱语音的合成方法,包括以下步骤实现:
(1)在大规模标准语音数据库上,用隐马尔科夫模型对语音的线谱频率系数进行建模,并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型;
(2)录制特定用户的少量朗读风格语音,并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应,得到该用户的个性化的线谱频率系数模型;
(3)对文本化的简谱中的歌词,经过文本处理分析后,得到上下文相关的属性集,然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;
(4)根据简谱对于唱歌的音调、节拍的约定,生成基频信息,并对(3)中预测得到的时长信息进行调整;
(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后,就生成了最后的参数,这些参数是既具有目标说话人特征,又具有歌唱特征的基频、时长和线谱频率参数。将这些参数输入参数化语音合成声码器,即可合成出个性化的歌唱语音。
一种个性化歌唱语音的合成方法,所述的个性化的线谱频率系数模型,通过标准线谱频率系数模型自适应训练得到,而标准线谱频率系数通过在一个或多个大规模的标准语音库上训练得到。
一种个性化歌唱语音的合成方法,所述的用于线谱频率系数模型自适应的语音录音所对应的文本是经过音素覆盖率搜索设计的文本。
一种个性化歌唱语音的合成方法,所述的步骤(2)中自适应方法是基于最大似然的线性回归的模型自适应方法。
一种个性化歌唱语音的合成方法,所述的基于最大似然的线性回归的模型自适应方法是根据最大似然准则估计一系列的线性变换,让这些变换抓住当前模型与目标模型之间的差异,对模型中所有的分布作调整。
一种个性化歌唱语音的合成方法,所述的步骤(4)中对所述基频参数的预测为由曲谱信息直接赋值。
一种个性化歌唱语音的合成方法,所述的步骤(4)中所述时长信息的调整是按照曲谱给定的信息来进行时长调整。
一种个性化歌唱语音的合成方法,所述的时长信息的调整是采用按比例分配来对时长进行调整。
本发明在可训练语音合成系统的基础上,将模型自适应和歌唱语音合成相结合,在Trainable TTS中将模型自适应方法和歌唱语音合成方法有机结合起来,使得在只有少量训练数据的前提下,合成的语音既具有目标说话人的特征,又具有歌唱风格,这样就不需要录制大量的各种发音人风格的歌曲风格库,使具有发音人个性化风格歌唱语音的合成成为现实,并极大的提高了合成系统的可扩展性和娱乐性。
附图说明
图1为个性化歌唱语音的合成方法的流程图。
图2为本发明模型自适应方法流程图。
具体实施方式
参见附图1、2所示。
1、可训练语音合成,此发明基于可训练的语音合成方法。此方法在训练阶段运用隐马尔科夫模型(HMM)对语音信号三个方面的参数进行建模,这三个方面的参数分别是:基频、时长和线谱频率系数LSF;所有模型都在一个语音库上用隐马尔科夫模型进行模型的训练;语音库的规模一般在1000句话左右(1.5~2小时的录音量),训练得到三个参数的隐马尔科夫模型;而在合成阶段,根据输入的文本进行文本分析得到的上下文相关属性,根据这些属性分别对时长、基频和谱参数的聚类决策树进行决策,并得到相应的模型序列,最后根据模型基于参数生成算法来生成基频和谱参数,并通过合成器合成出最终的语音。
2、模型自适应:现在对于多样化语音合成有比较大的需求,需要可训练语音合成在少量目标数据的基础上,通过模型自适应的方法快速形成一个目标合成系统。这里采用的模型自适应方法是基于最大似然的线性回归(MLLR)的模型自适应方法,根据最大似然准则估计一系列的线性变换,让这些变换抓住当前模型与目标模型之间的差异,用来对模型中所有的分布作调整,可以用相对较少的数据取得较好的效果。
3、歌唱合成:以上步骤1、2都在训练阶段完成,得到时长、基频和频谱参数的HMM模型,在合成阶段,利用这些资源,根据输入的歌词和曲谱,合成出具有歌唱风格的语音。首先,由文本化的简谱,经过前端分析歌词后,得到上下文相关的属性集,然后根据时长、基频和频谱模型分别预测出对应的参数,由于朗读风格与歌唱风格在韵律方面存在很大的差异,所以为了在朗读库的基础上合成出歌唱风格的语音,需要对韵律参数进行调整,调整主要是以下几个方面:
1)基频参数的调整,舍弃决策得到的基频参数,直接由曲谱信息赋值;
2)时长参数的调整,由于曲谱中的音阶是带有时长信息的(比如四分音符,八分之一拍等),所以按照曲谱给定的信息来进行时长调整,但是存在两个问题,首先曲谱时长是相对的,所以无法确定一拍是多长,另外曲谱时长是音节层的,而建模的基本单位是音素,所以此时的时长怎么分配。针对问题一,我们由用户确定一拍唱多长,也就是说用户可以根据自己的喜好来确定;而对于问题二,一般采用比例分配,做一些特殊的调整,一是限制声母时长,使得声母发音短促一些,此时可使吐字清脆饱满,更符合歌唱风格,另外,对超长的音素采用非比例分配五个状态,扩大中间状态的时长,缩小边界状态的时长分配,令发声更稳定协调。

Claims (8)

1、一种个性化歌唱语音的合成方法,其特征在于包括以下步骤实现:
(1)在大规模标准语音数据库上,用隐马尔科夫模型对语音的线谱频率系数进行建模,并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型;
(2)录制特定用户的少量朗读风格语音,并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应,得到该用户的个性化的线谱频率系数模型;
(3)对文本化的简谱中的歌词,经过文本处理分析后,得到上下文相关的属性集,然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;
(4)根据简谱对于唱歌的音调、节拍的约定,生成基频信息,并对(3)中预测得到的时长信息进行调整;
(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后,就生成了最后的参数。这些参数是既具有目标说话人特征,又具有歌唱特征的基频、时长和线谱频率参数,将这些参数输入参数化语音合成声码器,即可合成出个性化的歌唱语音。
2、根据权利要求1所述的一种个性化歌唱语音的合成方法,其特征在于所述的个性化的线谱频率系数模型,通过标准线谱频率系数模型自适应训练得到,而标准线谱频率系数通过在一个或多个大规模的标准语音库上训练得到。
3、根据权利要求1所述的一种个性化歌唱语音的合成方法,其特征在于所述的用于线谱频率系数模型自适应的语音录音所对应的文本是经过音素覆盖率搜索设计的文本。
4、根据权利要求1所述的一种个性化歌唱语音的合成方法,其特征在于所述的步骤(2)中自适应方法是基于最大似然的线性回归的模型自适应方法。
5、根据权利要求4所述的一种个性化歌唱语音的合成方法,其特征在于所述的基于最大似然的线性回归的模型自适应方法是根据最大似然准则估计一系列的线性变换,让这些变换抓住当前模型与目标模型之间的差异,对模型中所有的分布作调整。
6、根据权利要求1所述的一种个性化歌唱语音的合成方法,其特征在于所述的步骤(4)中对所述基频参数的预测为由曲谱信息直接赋值。
7、根据权利要求1所述的一种个性化歌唱语音的合成方法,其特征在于所述步骤(4)中时长信息的调整是按照曲谱给定的信息来进行时长调整。
8、根据权利要求1所述的一种个性化歌唱语音的合成方法,其特征在于所述时长信息的调整是采用按比例分配来对时长进行调整。
CN2008101071140A 2008-07-17 2008-07-17 一种个性化歌唱语音的合成方法 Active CN101308652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101071140A CN101308652B (zh) 2008-07-17 2008-07-17 一种个性化歌唱语音的合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101071140A CN101308652B (zh) 2008-07-17 2008-07-17 一种个性化歌唱语音的合成方法

Publications (2)

Publication Number Publication Date
CN101308652A true CN101308652A (zh) 2008-11-19
CN101308652B CN101308652B (zh) 2011-06-29

Family

ID=40125068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101071140A Active CN101308652B (zh) 2008-07-17 2008-07-17 一种个性化歌唱语音的合成方法

Country Status (1)

Country Link
CN (1) CN101308652B (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901598A (zh) * 2010-06-30 2010-12-01 北京捷通华声语音技术有限公司 一种哼唱合成方法和系统
CN101814288B (zh) * 2009-02-20 2012-10-03 富士通株式会社 使语音合成时长模型自适应的方法和设备
CN102752239A (zh) * 2012-06-28 2012-10-24 北京捷通华声语音技术有限公司 一种提供音库混合训练模型的方法和系统
CN103065620A (zh) * 2012-12-27 2013-04-24 安徽科大讯飞信息科技股份有限公司 在手机上或网页上接收用户输入的文字并实时合成为个性化声音的方法
CN103295574A (zh) * 2012-03-02 2013-09-11 盛乐信息技术(上海)有限公司 唱歌语音转换设备及其方法
CN103456295A (zh) * 2013-08-05 2013-12-18 安徽科大讯飞信息科技股份有限公司 歌唱合成中基频参数生成方法及系统
WO2014101168A1 (zh) * 2012-12-31 2014-07-03 安徽科大讯飞信息科技股份有限公司 一种实现语音歌唱化的方法和装置
CN104272382A (zh) * 2012-03-06 2015-01-07 新加坡科技研究局 基于模板的个性化歌唱合成的方法和系统
CN104766603A (zh) * 2014-01-06 2015-07-08 安徽科大讯飞信息科技股份有限公司 构建个性化歌唱风格频谱合成模型的方法及装置
CN105118498A (zh) * 2015-09-06 2015-12-02 百度在线网络技术(北京)有限公司 语音合成模型的训练方法及装置
CN105185372A (zh) * 2015-10-20 2015-12-23 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
CN105206258A (zh) * 2015-10-19 2015-12-30 百度在线网络技术(北京)有限公司 声学模型的生成方法和装置及语音合成方法和装置
CN105304080A (zh) * 2015-09-22 2016-02-03 科大讯飞股份有限公司 语音合成装置及方法
CN105355193A (zh) * 2015-10-30 2016-02-24 百度在线网络技术(北京)有限公司 语音合成方法和装置
CN105529023A (zh) * 2016-01-25 2016-04-27 百度在线网络技术(北京)有限公司 语音合成方法和装置
CN106373580A (zh) * 2016-09-05 2017-02-01 北京百度网讯科技有限公司 基于人工智能的合成歌声的方法和装置
CN106531150A (zh) * 2016-12-23 2017-03-22 上海语知义信息技术有限公司 一种基于深度神经网络模型的情感合成方法
CN108766409A (zh) * 2018-05-25 2018-11-06 中国传媒大学 一种戏曲合成方法、装置和计算机可读存储介质
CN109102796A (zh) * 2018-08-31 2018-12-28 北京未来媒体科技股份有限公司 一种语音合成方法及装置
CN109326280A (zh) * 2017-07-31 2019-02-12 科大讯飞股份有限公司 一种歌唱合成方法及装置、电子设备
CN109599092A (zh) * 2018-12-21 2019-04-09 秒针信息技术有限公司 一种音频合成方法及装置
CN109935225A (zh) * 2017-12-15 2019-06-25 富泰华工业(深圳)有限公司 文字信息处理装置及方法、计算机存储介质及移动终端
CN109979422A (zh) * 2019-02-21 2019-07-05 百度在线网络技术(北京)有限公司 基频处理方法、装置、设备及计算机可读存储介质
CN110136689A (zh) * 2019-04-02 2019-08-16 平安科技(深圳)有限公司 基于迁移学习的歌声合成方法、装置及存储介质
CN110838286A (zh) * 2019-11-19 2020-02-25 腾讯科技(深圳)有限公司 一种模型训练的方法、语种识别的方法、装置及设备
CN111179905A (zh) * 2020-01-10 2020-05-19 北京中科深智科技有限公司 一种快速配音生成方法及装置
CN111192566A (zh) * 2020-03-03 2020-05-22 云知声智能科技股份有限公司 英文语音合成方法及装置
CN111292720A (zh) * 2020-02-07 2020-06-16 北京字节跳动网络技术有限公司 语音合成方法、装置、计算机可读介质及电子设备
CN111429877A (zh) * 2020-03-03 2020-07-17 云知声智能科技股份有限公司 歌曲处理方法及装置
CN111930900A (zh) * 2020-09-28 2020-11-13 北京世纪好未来教育科技有限公司 标准发音生成方法及相关装置
CN112185343A (zh) * 2020-09-24 2021-01-05 长春迪声软件有限公司 一种合成歌声音频的方法以及装置
CN113053355A (zh) * 2021-03-17 2021-06-29 平安科技(深圳)有限公司 佛乐的人声合成方法、装置、设备及存储介质
CN110838286B (zh) * 2019-11-19 2024-05-03 腾讯科技(深圳)有限公司 一种模型训练的方法、语种识别的方法、装置及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5029509A (en) * 1989-05-10 1991-07-09 Board Of Trustees Of The Leland Stanford Junior University Musical synthesizer combining deterministic and stochastic waveforms
CN100524456C (zh) * 2003-08-06 2009-08-05 雅马哈株式会社 歌唱声音合成方法和装置

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814288B (zh) * 2009-02-20 2012-10-03 富士通株式会社 使语音合成时长模型自适应的方法和设备
CN101901598A (zh) * 2010-06-30 2010-12-01 北京捷通华声语音技术有限公司 一种哼唱合成方法和系统
CN103295574A (zh) * 2012-03-02 2013-09-11 盛乐信息技术(上海)有限公司 唱歌语音转换设备及其方法
CN103295574B (zh) * 2012-03-02 2018-09-18 上海果壳电子有限公司 唱歌语音转换设备及其方法
CN104272382A (zh) * 2012-03-06 2015-01-07 新加坡科技研究局 基于模板的个性化歌唱合成的方法和系统
CN102752239A (zh) * 2012-06-28 2012-10-24 北京捷通华声语音技术有限公司 一种提供音库混合训练模型的方法和系统
CN102752239B (zh) * 2012-06-28 2015-08-12 北京捷通华声语音技术有限公司 一种提供音库混合训练模型的方法和系统
CN103065620A (zh) * 2012-12-27 2013-04-24 安徽科大讯飞信息科技股份有限公司 在手机上或网页上接收用户输入的文字并实时合成为个性化声音的方法
WO2014101168A1 (zh) * 2012-12-31 2014-07-03 安徽科大讯飞信息科技股份有限公司 一种实现语音歌唱化的方法和装置
CN103915093A (zh) * 2012-12-31 2014-07-09 安徽科大讯飞信息科技股份有限公司 一种实现语音歌唱化的方法和装置
CN103915093B (zh) * 2012-12-31 2019-07-30 科大讯飞股份有限公司 一种实现语音歌唱化的方法和装置
CN103456295B (zh) * 2013-08-05 2016-05-18 科大讯飞股份有限公司 歌唱合成中基频参数生成方法及系统
CN103456295A (zh) * 2013-08-05 2013-12-18 安徽科大讯飞信息科技股份有限公司 歌唱合成中基频参数生成方法及系统
CN104766603A (zh) * 2014-01-06 2015-07-08 安徽科大讯飞信息科技股份有限公司 构建个性化歌唱风格频谱合成模型的方法及装置
CN104766603B (zh) * 2014-01-06 2019-03-19 科大讯飞股份有限公司 构建个性化歌唱风格频谱合成模型的方法及装置
CN105118498B (zh) * 2015-09-06 2018-07-31 百度在线网络技术(北京)有限公司 语音合成模型的训练方法及装置
CN105118498A (zh) * 2015-09-06 2015-12-02 百度在线网络技术(北京)有限公司 语音合成模型的训练方法及装置
CN105304080B (zh) * 2015-09-22 2019-09-03 科大讯飞股份有限公司 语音合成装置及方法
CN105304080A (zh) * 2015-09-22 2016-02-03 科大讯飞股份有限公司 语音合成装置及方法
CN105206258B (zh) * 2015-10-19 2018-05-04 百度在线网络技术(北京)有限公司 声学模型的生成方法和装置及语音合成方法和装置
CN105206258A (zh) * 2015-10-19 2015-12-30 百度在线网络技术(北京)有限公司 声学模型的生成方法和装置及语音合成方法和装置
US10614795B2 (en) 2015-10-19 2020-04-07 Baidu Online Network Technology (Beijing) Co., Ltd. Acoustic model generation method and device, and speech synthesis method
WO2017067246A1 (zh) * 2015-10-19 2017-04-27 百度在线网络技术(北京)有限公司 声学模型的生成方法和装置及语音合成方法和装置
CN105185372B (zh) * 2015-10-20 2017-03-22 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
WO2017067206A1 (zh) * 2015-10-20 2017-04-27 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
CN105185372A (zh) * 2015-10-20 2015-12-23 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
US10410621B2 (en) 2015-10-20 2019-09-10 Baidu Online Network Technology (Beijing) Co., Ltd. Training method for multiple personalized acoustic models, and voice synthesis method and device
CN105355193B (zh) * 2015-10-30 2020-09-25 百度在线网络技术(北京)有限公司 语音合成方法和装置
CN105355193A (zh) * 2015-10-30 2016-02-24 百度在线网络技术(北京)有限公司 语音合成方法和装置
CN105529023B (zh) * 2016-01-25 2019-09-03 百度在线网络技术(北京)有限公司 语音合成方法和装置
CN105529023A (zh) * 2016-01-25 2016-04-27 百度在线网络技术(北京)有限公司 语音合成方法和装置
CN106373580B (zh) * 2016-09-05 2019-10-15 北京百度网讯科技有限公司 基于人工智能的合成歌声的方法和装置
CN106373580A (zh) * 2016-09-05 2017-02-01 北京百度网讯科技有限公司 基于人工智能的合成歌声的方法和装置
CN106531150A (zh) * 2016-12-23 2017-03-22 上海语知义信息技术有限公司 一种基于深度神经网络模型的情感合成方法
CN109326280A (zh) * 2017-07-31 2019-02-12 科大讯飞股份有限公司 一种歌唱合成方法及装置、电子设备
CN109326280B (zh) * 2017-07-31 2022-10-04 科大讯飞股份有限公司 一种歌唱合成方法及装置、电子设备
CN109935225A (zh) * 2017-12-15 2019-06-25 富泰华工业(深圳)有限公司 文字信息处理装置及方法、计算机存储介质及移动终端
CN108766409A (zh) * 2018-05-25 2018-11-06 中国传媒大学 一种戏曲合成方法、装置和计算机可读存储介质
CN109102796A (zh) * 2018-08-31 2018-12-28 北京未来媒体科技股份有限公司 一种语音合成方法及装置
CN109599092A (zh) * 2018-12-21 2019-04-09 秒针信息技术有限公司 一种音频合成方法及装置
CN109599092B (zh) * 2018-12-21 2022-06-10 秒针信息技术有限公司 一种音频合成方法及装置
CN109979422B (zh) * 2019-02-21 2021-09-28 百度在线网络技术(北京)有限公司 基频处理方法、装置、设备及计算机可读存储介质
CN109979422A (zh) * 2019-02-21 2019-07-05 百度在线网络技术(北京)有限公司 基频处理方法、装置、设备及计算机可读存储介质
CN110136689A (zh) * 2019-04-02 2019-08-16 平安科技(深圳)有限公司 基于迁移学习的歌声合成方法、装置及存储介质
CN110136689B (zh) * 2019-04-02 2022-04-22 平安科技(深圳)有限公司 基于迁移学习的歌声合成方法、装置及存储介质
CN110838286B (zh) * 2019-11-19 2024-05-03 腾讯科技(深圳)有限公司 一种模型训练的方法、语种识别的方法、装置及设备
CN110838286A (zh) * 2019-11-19 2020-02-25 腾讯科技(深圳)有限公司 一种模型训练的方法、语种识别的方法、装置及设备
CN111179905A (zh) * 2020-01-10 2020-05-19 北京中科深智科技有限公司 一种快速配音生成方法及装置
CN111292720A (zh) * 2020-02-07 2020-06-16 北京字节跳动网络技术有限公司 语音合成方法、装置、计算机可读介质及电子设备
CN111292720B (zh) * 2020-02-07 2024-01-23 北京字节跳动网络技术有限公司 语音合成方法、装置、计算机可读介质及电子设备
CN111192566B (zh) * 2020-03-03 2022-06-24 云知声智能科技股份有限公司 英文语音合成方法及装置
CN111429877A (zh) * 2020-03-03 2020-07-17 云知声智能科技股份有限公司 歌曲处理方法及装置
CN111192566A (zh) * 2020-03-03 2020-05-22 云知声智能科技股份有限公司 英文语音合成方法及装置
CN112185343A (zh) * 2020-09-24 2021-01-05 长春迪声软件有限公司 一种合成歌声音频的方法以及装置
CN112185343B (zh) * 2020-09-24 2022-07-22 长春迪声软件有限公司 一种合成歌声音频的方法以及装置
CN111930900B (zh) * 2020-09-28 2021-09-21 北京世纪好未来教育科技有限公司 标准发音生成方法及相关装置
CN111930900A (zh) * 2020-09-28 2020-11-13 北京世纪好未来教育科技有限公司 标准发音生成方法及相关装置
CN113053355A (zh) * 2021-03-17 2021-06-29 平安科技(深圳)有限公司 佛乐的人声合成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN101308652B (zh) 2011-06-29

Similar Documents

Publication Publication Date Title
CN101308652B (zh) 一种个性化歌唱语音的合成方法
US10629179B2 (en) Electronic musical instrument, electronic musical instrument control method, and storage medium
US11854518B2 (en) Electronic musical instrument, electronic musical instrument control method, and storage medium
Oura et al. Recent development of the HMM-based singing voice synthesis system—Sinsy
JP5293460B2 (ja) 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
Saino et al. An HMM-based singing voice synthesis system
CN104766603B (zh) 构建个性化歌唱风格频谱合成模型的方法及装置
JP5665780B2 (ja) 音声合成装置、方法およびプログラム
JP5471858B2 (ja) 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
US9818396B2 (en) Method and device for editing singing voice synthesis data, and method for analyzing singing
CN106971703A (zh) 一种基于hmm的歌曲合成方法及装置
Qian et al. Improved prosody generation by maximizing joint probability of state and longer units
JP4829477B2 (ja) 声質変換装置および声質変換方法ならびに声質変換プログラム
CN103915093A (zh) 一种实现语音歌唱化的方法和装置
Lee et al. A comparative study of spectral transformation techniques for singing voice synthesis
Mase et al. HMM-based singing voice synthesis system using pitch-shifted pseudo training data.
JP2013164609A (ja) 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
JP2017027021A (ja) 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法
Narendra et al. Time-domain deterministic plus noise model based hybrid source modeling for statistical parametric speech synthesis
JP2001117598A (ja) 音声変換装置及び方法
JP5699496B2 (ja) 音合成用確率モデル生成装置、特徴量軌跡生成装置およびプログラム
Gu et al. Singing-voice synthesis using demi-syllable unit selection
Khan et al. Singing Voice Synthesis Using HMM Based TTS and MusicXML
JP6191094B2 (ja) 音声素片切出装置
JP5810947B2 (ja) 発声区間特定装置、音声パラメータ生成装置、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: IFLYTEK CO., LTD.

Free format text: FORMER NAME: ANHUI USTC IFLYTEK CO., LTD.

CP03 Change of name, title or address

Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666

Patentee after: Iflytek Co., Ltd.

Address before: 230088 information industry base, No. 616, Mount Huangshan Road, hi tech Zone, Anhui, Hefei

Patentee before: Anhui USTC iFLYTEK Co., Ltd.