CN103117057A - 一种特定人语音合成技术在手机漫画配音中的应用方法 - Google Patents

一种特定人语音合成技术在手机漫画配音中的应用方法 Download PDF

Info

Publication number
CN103117057A
CN103117057A CN2012105793142A CN201210579314A CN103117057A CN 103117057 A CN103117057 A CN 103117057A CN 2012105793142 A CN2012105793142 A CN 2012105793142A CN 201210579314 A CN201210579314 A CN 201210579314A CN 103117057 A CN103117057 A CN 103117057A
Authority
CN
China
Prior art keywords
user
virtual image
mobile phone
sound
parrot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105793142A
Other languages
English (en)
Other versions
CN103117057B (zh
Inventor
唐义平
江源
孙见青
江涛
聂小林
徐佳佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201210579314.2A priority Critical patent/CN103117057B/zh
Publication of CN103117057A publication Critical patent/CN103117057A/zh
Application granted granted Critical
Publication of CN103117057B publication Critical patent/CN103117057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种特定人语音合成技术在手机漫画配音中的应用方法,该方法在手机上接收用户输入的文字,通过特定人语音合成技术,生成模拟多种不同发音人音调和音色的音频数据,对图片或漫画进行配音;接收用户在手机上输入的文字,将文字通过特定人语音合成技术,并设置合成模版参数,实现各种模拟男女对话、老少对话等的合成音频,实现手机图片、漫画的配音。本发明将用户输入的文字,转化为指定人的声音甚至是自己亲属的声音,实现对手机图片、漫画的配音,增加了趣味性,提升了用户交互体验。

Description

一种特定人语音合成技术在手机漫画配音中的应用方法
技术领域
本发明涉及语音变声技术领域,公开了一种特定人语音合成技术在手机漫画配音中的应用方法,该方法在手机上接收用户输入的文字,通过特定人语音合成技术,生成模拟多种不同发音人音调和音色的音频数据,对图片或漫画进行配音的方法和系统,该方法包括:1)通过收集目标发音人的少量语音数据(50-100句),实现具有其发音特点的语音合成系统的快速构建;2)接收用户在手机上输入的文字,将文字通过个性化合成技术,并设置合成模版参数,实现各种模拟男女对话、老少对话等的合成音频,实现手机图片、漫画的配音。
利用本发明,可以将用户输入的文字,转化为指定人的声音甚至是自己亲属的声音实现对手机图片、漫画的配音,增加了趣味性,提升了用户交互体验。
背景技术
现有一些应用“对图片配音”的解决方案主要是采用人工录音的方式对图片进行配音,配音效果单一,不能实现将声音转变成不同目标人、甚至是自己亲属声音的等有趣效果。
现有技术的缺点为:现有图片漫画配音大多采用人工录音的方案,配音效果单一,很难满足用户对有趣好玩等的应用需求。
发明内容
本发明要解决以下几个问题:1、从声音模拟目标人角度来看,需要解决只采集目标人少量语音数据的情况下模拟合成的发音人声音的相似度问题。2、从业务的角度来看,模拟发音人声音需要采集发音人一定量的语料,如果让用户在采集语料时不感到厌烦,同时不需要花费大量的时间成本。
本发明采用的技术方案为:一种特定人语音合成技术在手机漫画配音中的应用方法,该方法包括如下步骤:
步骤1)、模型训练步骤:
a)、特定语料库准备
需要根据用户日常用语、生日祝福、励志语录、网络流行语的分类构建语料库,每个分类至少收集百句以上的典型语料;
b)、用户个人虚拟形象设定
用户可以通过手机端程序可以新建自己的虚拟形象,也可以创建给自己的亲属各创建一个虚拟形象;
c)、虚拟形象驯养
程序模拟养鹦鹉的场景,需要每天不定时对鹦鹉的虚拟形象说话,鹦鹉重复一句,用户说话的内容由程序随机从第a)步系统准备的语料库里面随机选取,采用这种方式利用用户的零碎时间采集用户的声音数据,并上传到后台系统;
d)、声学模型训练
后台系统将根据第c)步骤收集过来的用户声音数据,进行声学模型训练,生成用户个人虚拟形象音库资源,给出用户的虚拟形象模拟用户声音的当前相似度,在客户端虚拟形象上可以采用鹦鹉从幼鸟生长为成鸟或者鹦鹉的人气值不断升高等设计来模拟虚拟形象的成长过程;
e)、系统预置个性化音库资源
后台系统在用户的个人虚拟形象未训练完成或者希望更多个性化声音效果时,可以选用系统预置的一些特色的方言、明星音库;
步骤2)、文字配音流程:
用户在手机客户端程序上,选择有趣的漫画或图片,输入适合漫画的文字,输入完成后用户可以选择自己驯养的虚拟形象,也可以以道具的方式购买选用系统预置的虚拟形象,客户端程序将使用用户选择的虚拟形象对应的后台音库资源合成出音频文件,在客户端合成为MV等视频文件,生成有声漫画,供用户进行娱乐和分享给好友欣赏;
在选择虚拟形象的过程中,用户可以根据漫画上下文需要,给不同的文字选择不同的虚拟形象如男女,或者自己的亲属虚拟形象,系统将合成出生动的对话效果,增强漫画的趣味性。
本发明与现有技术相比的技术优点为:
1、采用特定语音合成技术的技术方案,替换人工录音,解决了配音单调问题,增强了趣味性。
2、用户可以通过在手机上输入文本便捷地制作个性化手机有声图片或漫画。
3、采用特定人语音合成技术,只需采集少量目标的人声音数据,即可达到基本相像的效果。
附图说明
图1为用户训练个性化音库配音系统构建流程框图;
图2为声学模型训练框图的示意图。
具体实施方式
下面结合附图及具体实施例进一步说明本发明。
1、技术及业务流程,如图1所示。
1)、模型训练流程
a)、特定语料库准备
需要根据用户日常用语、生日祝福、励志语录、网络流行语等分类构建语料库,每个分类至少收集百句以上的典型语料。
b)、用户个人虚拟形象设定
用户可以通过手机端程序可以新建自己的虚拟形象,也可以创建给自己的亲属各创建一个虚拟形象。
c)、虚拟形象驯养
程序模拟养鹦鹉的场景,需要每天不定时对鹦鹉(虚拟形象)说话,鹦鹉重复一句,用户说话的内容由程序随机从第a)步系统准备的语料库里面随机选取,采用这种方式利用用户的零碎时间通过移动手机网络远程采集用户的声音数据,同时不让用户感到厌烦,并上传到后台系统。
d)、声学模型训练
后台系统将根据第c)步骤收集过来的用户声音数据,进行声学模型训练,生成用户个人虚拟形象音库资源,给出用户的虚拟形象模拟用户声音的当前相似度。在客户端虚拟形象上可以采用鹦鹉从幼鸟生长为成鸟或者鹦鹉的人气值不断升高等设计来模拟虚拟形象的成长过程。具体技术实现算法参考下面介绍的声学模型训练方法。
e)、系统预置个性化音库资源
后台系统在用户的个人虚拟形象未训练完成或者希望更多个性化声音效果时,可以选用系统预置的一些特色的方言、明星音库等。
2)、文字配音流程
用户在手机客户端程序上,选择有趣的漫画(图片),输入适合漫画的文字。输入完成后用户可以选择自己驯养的虚拟形象,也可以以道具的方式购买选用系统预置的虚拟形象。客户端程序将使用用户选择的虚拟形象对应的后台音库资源合成出音频文件,在客户端合成为MV等视频文件,生成有声漫画,供用户进行娱乐和分享给好友欣赏。
在选择虚拟形象的过程中,用户可以根据漫画上下文需要,给不同的文字选择不同的虚拟形象如男女,或者自己的亲属虚拟形象,系统将合成出生动的对话效果,增强漫画的趣味性。
2、系统关键模块的详细说明
1)用户个人虚拟形象音库资源构建
可以模拟成养鹦鹉场景,每天对鹦鹉说一句特定预定的语料,鹦鹉同样跟学一句,手机程序自动将用户录音上传到系统后台,进行声学模型训练。用户根据预定的语料和鹦鹉说的越多,系统收集用户的特定语料就越多,训练出来的声学模型对用户声音的模拟就越相似。目前实验结果表明,只要100句以上就能达到基本相像的效果。
2)声学模型训练算法
根据用户输入的少量录音进行声学模型训练。具体实现技术除利用科大讯飞专利《一种结合高层描述信息和模型自适应的说话人转换方法》(专利号200610039680.3)外,还增加了模型自适应算法处理。具体如图2所示框图的加粗虚线框图部分。
该算法为最小生成误差线性回归模型自适应方法:
①、利用自适应数据,由最大似然线性回归模型自适应算法,计算源说话人到目标说话人的转换矩阵M;
②、根据源说话人的声学模型λ和源说话人模型到目标说话人模型的转换矩阵M,得到目标说话人模型,通过传统的基于最大似然的参数生成方法,估计与自适应数据的声学参数C各帧相对应的生成声学参数
Figure BDA00002665974300041
其中:
C=[c1,c2,...,cT]          (1)
C ~ ( λ , M ) = [ c ~ 1 , c ~ 2 , . . . , c ~ T ] - - - ( 2 )
T为总帧数,c1,c2到Ct定义如下公式(3),这里采用的声学参数为线谱频率参数(lsf),即:
ct=[lsft.l,...,lsft,N]          (3)
c ~ t = [ ls f ~ t , 1 , . . . , ls f ~ t , N ] - - - ( 4 )
其中N为线谱频率参数的阶数,这里取40;由以下公式计算自适应数据声学参数C与生成参数之间的听感误差:
D ( C , C ~ ( λ , M ) ) =
Σ t = 1 T Σ p = 1 N ( lsf t , p - ls f ~ t , p ) 2 / min ( lsf t , p - lsf t , p - 1 , lsf t , p + 1 - lsf t , p ) - - - ( 5 )
③、以最小化听感误差为目标,调整源说话人模型到目标说话人模型的转换矩阵M。为了求解听感误差最小时,所对应的源说话人模型到目标说话人模型的转换矩阵M,可以
采用梯度下降法对转换矩阵中的各参数进行逐步调整,即:
M ( n + 1 ) = M ( n ) - e n ∂ D ( C , C ~ ( λ , M ) ) ∂ M | M = M ( n ) - - - ( 6 )
其中n为迭代次数,εn为每一步的迭代步长,M(n)表示第n次迭代后的转换矩阵参数。
④、对步骤②和③进行反复迭代,直至生成参数听感误差收敛,则完成了源说话人模型到目标说话人模型转换矩阵的更新。
⑤、使用源说话人声学模型λ和经过迭代更新的源说话人模型到目标说话人模型的转换矩阵M,计算得到目标说话人声学模型λ′,则最终完成了基于生成参数听感误差最小化的模型自适应过程。
最小生成误差线性回归模型自适应方法,相对传统MLLR方法,提升合成语音相似度约0.2MOS分。具体实验数据如下表1所示。
表1
Figure BDA00002665974300052
3)模版合成
用户输入文字,可以设置不同段的文字对应不同发音人的格式模版,后台根据模版进行合成,以形成实际的漫画或图片的对话效果,增强趣味性。
模版内容使用CSSML(Chinese Speech Synthesis Markup Language)标记语言表示。传入符合规范的CSSML文本即可实现模板合成功能。
表2元素列表
Speaker元素:
用法:
<speak xml:lang=″string"></speak>
属性:
xml:lang指定根文档使用的语言类型。可选。
注意:
有效的CSSML文档必须包含根元素"speak",而且该元素只能有一个。
voice元素:
用法:
<voice variant=″string″></voice>
属性:
vaiant指明发音人代号。只可取值整数。
audio元素:
用法:
<audio src=″string″></audio>
属性:
src音频文件本地或url地址。
alt为音频描述。
例如:
展堂,额最大方咧,听说现在结婚很便宜,民政局9块钱搞定.今儿我佟湘玉豁出去了,额请你吧!不准不去!
Figure BDA00002665974300061

Claims (1)

1.一种特定人语音合成技术在手机漫画配音中的应用方法,其特征在于:该方法包括如下步骤:
步骤1)、模型训练步骤:
a)、特定语料库准备
需要根据用户日常用语、生日祝福、励志语录、网络流行语的分类构建语料库,每个分类至少收集百句以上的典型语料;
b)、用户个人虚拟形象设定
用户可以通过手机端程序可以新建自己的虚拟形象,也可以给自己的亲属各创建一个鹦鹉虚拟形象;
c)、虚拟形象驯养
程序模拟驯养鹦鹉的场景,需要每天不定时对鹦鹉的虚拟形象说话,鹦鹉重复一遍,用户说话的内容由程序随机从第a)步系统准备的语料库里面随机选取,采用这种方式利用用户的零碎时间采集用户的声音数据,并上传到后台系统;
d)、声学模型训练
后台系统将根据第c)步骤收集过来的用户声音数据,进行声学模型训练,生成用户个人虚拟形象音库资源,给出用户的虚拟形象模拟用户声音的当前相似度,在客户端虚拟形象上可以采用鹦鹉从幼鸟生长为成鸟或者鹦鹉的人气值不断升高等设计来模拟虚拟形象的成长过程;
e)、系统预置个性化音库资源
后台系统在用户的个人虚拟形象未训练完成或者希望更多个性化声音效果时,可以选用系统预置的一些特色的方言、明星音库;
步骤2)、文字配音流程:
用户在手机客户端程序上,选择有趣的漫画或图片,输入适合漫画的文字,输入完成后用户选择自己驯养的虚拟形象,或者以道具的方式购买选用系统预置的虚拟形象,客户端程序将使用用户选择的虚拟形象对应的后台音库资源合成出音频文件,在客户端合成为MV等视频文件,生成有声漫画,供用户进行娱乐和分享给好友欣赏;还可以将合成出的音频文件设置成用户彩铃和来电铃声;
在选择虚拟形象的过程中,用户可以根据漫画上下文需要,给不同的文字选择不同的虚拟形象如男女,或者自己的亲属虚拟形象,系统将合成出生动的对话效果,增强漫画的趣味性。
CN201210579314.2A 2012-12-27 2012-12-27 一种特定人语音合成技术在手机漫画配音中的应用方法 Active CN103117057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210579314.2A CN103117057B (zh) 2012-12-27 2012-12-27 一种特定人语音合成技术在手机漫画配音中的应用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210579314.2A CN103117057B (zh) 2012-12-27 2012-12-27 一种特定人语音合成技术在手机漫画配音中的应用方法

Publications (2)

Publication Number Publication Date
CN103117057A true CN103117057A (zh) 2013-05-22
CN103117057B CN103117057B (zh) 2015-10-21

Family

ID=48415415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210579314.2A Active CN103117057B (zh) 2012-12-27 2012-12-27 一种特定人语音合成技术在手机漫画配音中的应用方法

Country Status (1)

Country Link
CN (1) CN103117057B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794206A (zh) * 2014-02-24 2014-05-14 联想(北京)有限公司 将文本数据转换为语音数据的方法以及终端设备
CN104347065A (zh) * 2013-07-26 2015-02-11 英业达科技有限公司 依据使用者语音产生合适语音信号的装置及其方法
CN104464716A (zh) * 2014-11-20 2015-03-25 北京云知声信息技术有限公司 一种语音播报系统和方法
CN104536570A (zh) * 2014-12-29 2015-04-22 广东小天才科技有限公司 智能手表的信息处理方法及装置
CN104809923A (zh) * 2015-05-13 2015-07-29 苏州清睿信息技术有限公司 可自编自导的智能语音对话生成方法和系统
CN105047193A (zh) * 2015-08-27 2015-11-11 百度在线网络技术(北京)有限公司 语音播报方法和装置
CN105096932A (zh) * 2015-07-14 2015-11-25 百度在线网络技术(北京)有限公司 有声读物的语音合成方法和装置
CN105185372A (zh) * 2015-10-20 2015-12-23 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
CN105425953A (zh) * 2015-11-02 2016-03-23 小天才科技有限公司 一种人机交互的方法及系统
CN105609096A (zh) * 2015-12-30 2016-05-25 小米科技有限责任公司 文本数据输出方法和装置
CN106531148A (zh) * 2016-10-24 2017-03-22 咪咕数字传媒有限公司 一种基于语音合成的漫画配音方法和装置
US9715873B2 (en) 2014-08-26 2017-07-25 Clearone, Inc. Method for adding realism to synthetic speech
CN107039033A (zh) * 2017-04-17 2017-08-11 海南职业技术学院 一种语音合成装置
CN107172449A (zh) * 2017-06-19 2017-09-15 微鲸科技有限公司 多媒体播放方法、装置及多媒体存储方法
CN107886938A (zh) * 2016-09-29 2018-04-06 中国科学院深圳先进技术研究院 虚拟现实引导催眠语音处理方法及装置
WO2018090356A1 (en) * 2016-11-21 2018-05-24 Microsoft Technology Licensing, Llc Automatic dubbing method and apparatus
CN108847214A (zh) * 2018-06-27 2018-11-20 北京微播视界科技有限公司 语音处理方法、客户端、装置、终端、服务器和存储介质
CN109119063A (zh) * 2018-08-31 2019-01-01 腾讯科技(深圳)有限公司 视频配音生成方法、装置、设备及存储介质
CN109377797A (zh) * 2018-11-08 2019-02-22 北京葡萄智学科技有限公司 虚拟人物教学方法及装置
CN109493888A (zh) * 2018-10-26 2019-03-19 腾讯科技(武汉)有限公司 漫画配音方法及装置、计算机可读存储介质、电子设备
CN109936766A (zh) * 2019-01-30 2019-06-25 天津大学 一种基于端到端的水场景音频的生成方法
WO2020007148A1 (zh) * 2018-07-05 2020-01-09 腾讯科技(深圳)有限公司 音频合成方法、存储介质和计算机设备
CN111259181A (zh) * 2018-12-03 2020-06-09 连尚(新昌)网络科技有限公司 用于展示信息、提供信息的方法和设备
CN112185187A (zh) * 2019-07-02 2021-01-05 广东小天才科技有限公司 一种社交语言的学习方法及智能装置
CN112289303A (zh) * 2019-07-09 2021-01-29 北京京东振世信息技术有限公司 合成语音数据的方法和装置
WO2023116243A1 (zh) * 2021-12-20 2023-06-29 阿里巴巴达摩院(杭州)科技有限公司 数据转换方法及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195386A1 (en) * 2005-05-31 2008-08-14 Koninklijke Philips Electronics, N.V. Method and a Device For Performing an Automatic Dubbing on a Multimedia Signal
CN101359473A (zh) * 2007-07-30 2009-02-04 国际商业机器公司 自动进行语音转换的方法和装置
CN102324231A (zh) * 2011-08-29 2012-01-18 北京捷通华声语音技术有限公司 一种游戏对话声音合成方法和系统
CN102479506A (zh) * 2010-11-23 2012-05-30 盛乐信息技术(上海)有限公司 用于网络游戏的语音合成系统及其实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195386A1 (en) * 2005-05-31 2008-08-14 Koninklijke Philips Electronics, N.V. Method and a Device For Performing an Automatic Dubbing on a Multimedia Signal
CN101359473A (zh) * 2007-07-30 2009-02-04 国际商业机器公司 自动进行语音转换的方法和装置
CN102479506A (zh) * 2010-11-23 2012-05-30 盛乐信息技术(上海)有限公司 用于网络游戏的语音合成系统及其实现方法
CN102324231A (zh) * 2011-08-29 2012-01-18 北京捷通华声语音技术有限公司 一种游戏对话声音合成方法和系统

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104347065A (zh) * 2013-07-26 2015-02-11 英业达科技有限公司 依据使用者语音产生合适语音信号的装置及其方法
CN103794206A (zh) * 2014-02-24 2014-05-14 联想(北京)有限公司 将文本数据转换为语音数据的方法以及终端设备
CN103794206B (zh) * 2014-02-24 2017-04-19 联想(北京)有限公司 将文本数据转换为语音数据的方法以及终端设备
US9715873B2 (en) 2014-08-26 2017-07-25 Clearone, Inc. Method for adding realism to synthetic speech
CN104464716A (zh) * 2014-11-20 2015-03-25 北京云知声信息技术有限公司 一种语音播报系统和方法
CN104464716B (zh) * 2014-11-20 2018-01-12 北京云知声信息技术有限公司 一种语音播报系统和方法
CN104536570A (zh) * 2014-12-29 2015-04-22 广东小天才科技有限公司 智能手表的信息处理方法及装置
CN104809923A (zh) * 2015-05-13 2015-07-29 苏州清睿信息技术有限公司 可自编自导的智能语音对话生成方法和系统
CN105096932A (zh) * 2015-07-14 2015-11-25 百度在线网络技术(北京)有限公司 有声读物的语音合成方法和装置
CN105047193A (zh) * 2015-08-27 2015-11-11 百度在线网络技术(北京)有限公司 语音播报方法和装置
CN105047193B (zh) * 2015-08-27 2019-02-22 百度在线网络技术(北京)有限公司 语音播报方法和装置
CN105185372A (zh) * 2015-10-20 2015-12-23 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
US10410621B2 (en) 2015-10-20 2019-09-10 Baidu Online Network Technology (Beijing) Co., Ltd. Training method for multiple personalized acoustic models, and voice synthesis method and device
CN105185372B (zh) * 2015-10-20 2017-03-22 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
WO2017067206A1 (zh) * 2015-10-20 2017-04-27 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
CN105425953A (zh) * 2015-11-02 2016-03-23 小天才科技有限公司 一种人机交互的方法及系统
CN105425953B (zh) * 2015-11-02 2018-07-17 小天才科技有限公司 一种人机交互的方法及系统
CN105609096A (zh) * 2015-12-30 2016-05-25 小米科技有限责任公司 文本数据输出方法和装置
CN107886938A (zh) * 2016-09-29 2018-04-06 中国科学院深圳先进技术研究院 虚拟现实引导催眠语音处理方法及装置
CN107886938B (zh) * 2016-09-29 2020-11-17 中国科学院深圳先进技术研究院 虚拟现实引导催眠语音处理方法及装置
CN106531148A (zh) * 2016-10-24 2017-03-22 咪咕数字传媒有限公司 一种基于语音合成的漫画配音方法和装置
WO2018090356A1 (en) * 2016-11-21 2018-05-24 Microsoft Technology Licensing, Llc Automatic dubbing method and apparatus
US11514885B2 (en) 2016-11-21 2022-11-29 Microsoft Technology Licensing, Llc Automatic dubbing method and apparatus
CN107039033A (zh) * 2017-04-17 2017-08-11 海南职业技术学院 一种语音合成装置
CN107172449A (zh) * 2017-06-19 2017-09-15 微鲸科技有限公司 多媒体播放方法、装置及多媒体存储方法
CN108847214A (zh) * 2018-06-27 2018-11-20 北京微播视界科技有限公司 语音处理方法、客户端、装置、终端、服务器和存储介质
WO2020007148A1 (zh) * 2018-07-05 2020-01-09 腾讯科技(深圳)有限公司 音频合成方法、存储介质和计算机设备
CN109119063A (zh) * 2018-08-31 2019-01-01 腾讯科技(深圳)有限公司 视频配音生成方法、装置、设备及存储介质
CN109493888B (zh) * 2018-10-26 2020-07-10 腾讯科技(武汉)有限公司 漫画配音方法及装置、计算机可读存储介质、电子设备
CN109493888A (zh) * 2018-10-26 2019-03-19 腾讯科技(武汉)有限公司 漫画配音方法及装置、计算机可读存储介质、电子设备
CN109377797A (zh) * 2018-11-08 2019-02-22 北京葡萄智学科技有限公司 虚拟人物教学方法及装置
CN111259181A (zh) * 2018-12-03 2020-06-09 连尚(新昌)网络科技有限公司 用于展示信息、提供信息的方法和设备
CN111259181B (zh) * 2018-12-03 2024-04-12 连尚(新昌)网络科技有限公司 用于展示信息、提供信息的方法和设备
CN109936766B (zh) * 2019-01-30 2021-04-13 天津大学 一种基于端到端的水场景音频的生成方法
CN109936766A (zh) * 2019-01-30 2019-06-25 天津大学 一种基于端到端的水场景音频的生成方法
CN112185187A (zh) * 2019-07-02 2021-01-05 广东小天才科技有限公司 一种社交语言的学习方法及智能装置
CN112289303A (zh) * 2019-07-09 2021-01-29 北京京东振世信息技术有限公司 合成语音数据的方法和装置
CN112289303B (zh) * 2019-07-09 2024-04-16 北京京东振世信息技术有限公司 合成语音数据的方法和装置
WO2023116243A1 (zh) * 2021-12-20 2023-06-29 阿里巴巴达摩院(杭州)科技有限公司 数据转换方法及计算机存储介质

Also Published As

Publication number Publication date
CN103117057B (zh) 2015-10-21

Similar Documents

Publication Publication Date Title
CN103117057B (zh) 一种特定人语音合成技术在手机漫画配音中的应用方法
US11159597B2 (en) Systems and methods for artificial dubbing
US20210224319A1 (en) Artificially generating audio data from textual information and rhythm information
CN106251859B (zh) 语音识别处理方法和装置
CN108922538A (zh) 会议信息记录方法、装置、计算机设备及存储介质
JPWO2017168870A1 (ja) 情報処理装置及び情報処理方法
CN110136698A (zh) 用于确定嘴型的方法、装置、设备和存储介质
CN103546623B (zh) 用于发送语音信息及其文本描述信息的方法、装置与设备
US20200166670A1 (en) Personalizing weather forecast
CN111508470B (zh) 一种语音合成模型的训练方法及装置
CN105244042B (zh) 一种基于有限状态自动机的语音情感交互装置与方法
JP2003521750A (ja) スピーチシステム
CN111210803B (zh) 一种基于Bottle neck特征训练克隆音色及韵律的系统及方法
CN102324231A (zh) 一种游戏对话声音合成方法和系统
CN106792013A (zh) 一种用于电视节目声音互动的方法、电视
JPWO2020145353A1 (ja) コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法
CN110070855A (zh) 一种基于迁移神经网络声学模型的语音识别系统及方法
CN108053814A (zh) 一种模拟用户歌声的语音合成系统及方法
CN111986661A (zh) 复杂环境下基于语音增强的深度神经网络语音识别方法
GB2516942A (en) Text to Speech Conversion
CN102257566A (zh) 用于适配通信的方法和系统
CN102857650B (zh) 动态调整语音的方法
CN110491367A (zh) 智能电视的语音转换方法及设备
CN113470622A (zh) 一种可将任意语音转换成多个语音的转换方法及装置
CN110851564B (zh) 一种语音数据处理方法和相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666

Patentee after: Iflytek Co., Ltd.

Address before: 230088 Mount Huangshan Road, hi tech Development Zone, Anhui, Hefei 616

Patentee before: Anhui USTC iFLYTEK Co., Ltd.