CN107564510A - 一种语音虚拟角色管理方法、装置、服务器和存储介质 - Google Patents

一种语音虚拟角色管理方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN107564510A
CN107564510A CN201710729387.8A CN201710729387A CN107564510A CN 107564510 A CN107564510 A CN 107564510A CN 201710729387 A CN201710729387 A CN 201710729387A CN 107564510 A CN107564510 A CN 107564510A
Authority
CN
China
Prior art keywords
virtual role
response
role
user
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710729387.8A
Other languages
English (en)
Inventor
邓丽萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710729387.8A priority Critical patent/CN107564510A/zh
Publication of CN107564510A publication Critical patent/CN107564510A/zh
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种语音虚拟角色管理方法、装置、服务器和存储介质。其中,语音虚拟角色管理方法包括:从预先创建的至少两个虚拟角色中选择目标虚拟角色,依据用户语音信息确定包含应答信息和应答辅助词的应答内容,采用目标虚拟角色的声学参数生成应答内容对应的应答语音。本发明实施例通过在语音对话系统中预设的多个虚拟角色中选择目标虚拟角色,并利用预设的目标虚拟角色的声学参数,生成与用户语音信息相对应的应答语音,能够为用户提供多种发声人选择,使合成声音不再单调。

Description

一种语音虚拟角色管理方法、装置、服务器和存储介质
技术领域
本发明实施例涉及人机交互技术,尤其涉及一种语音虚拟角色管理方法、装置、服务器和存储介质。
背景技术
随着智能设备的快速发展,人机交互逐渐成为研究重点,与人机交互相关的人机语音对话系统也得到了广泛的关注。
现有的人机语音对话系统中,通常只提供一种固定的机器合成声音,即现有人机语音对话系统与用户的交互方式单一,无法满足用户的个性化需求。
发明内容
本发明实施例提供一种语音虚拟角色管理方法、装置、服务器和存储介质,为用户提供多种发声人选择,使合成声音不再单调。
第一方面,本发明实施例提供了一种语音虚拟角色管理方法,该方法包括:
从预先创建的至少两个虚拟角色中选择目标虚拟角色;
依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
采用所述目标虚拟角色的声学参数生成所述应答内容对应的应答语音。
第二方面,本发明实施例还提供了一种语音虚拟角色管理装置,该装置包括:
目标虚拟角色选择模块,用于从预先创建的至少两个虚拟角色中选择目标虚拟角色;
应答内容确定模块,用于依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
应答语音生成模块,用于采用所述目标虚拟角色的声学参数生成所述应答内容对应的应答语音。
第三方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的语音虚拟角色管理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的语音虚拟角色管理方法。
本发明实施例通过在语音对话系统中预设的多个虚拟角色中选择目标虚拟角色,并利用预设的目标虚拟角色的声学参数,生成与用户语音信息相对应的应答语音,能够为用户提供多种发声人选择,使合成声音不再单调。
附图说明
图1是本发明实施例一中的语音虚拟角色管理方法的流程图;
图2是本发明实施例二中的语音虚拟角色管理方法的流程图;
图3是本发明实施例三中的语音虚拟角色管理方法的流程图;
图4是本发明实施例四中的语音虚拟角色管理装置的结构示意图;
图5是本发明实施例五中的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的语音虚拟角色管理方法的流程图,本实施例可适用于语音对话系统,该方法可以由语音虚拟角色管理装置来执行,该装置可以采用软件/硬件的方式实现。如图1所示,该方法具体包括:
S110、从预先创建的至少两个虚拟角色中选择目标虚拟角色。
本实施例中,在语音对话系统中,预先在角色库中设置了多个虚拟角色,用户可以根据个人意愿,从多个虚拟角色中选择合适的虚拟角色进行对话,其中,每个虚拟角色可以包括虚拟角色标识信息,如虚拟角色名称和/或虚拟角色的序号,以及虚拟角色对应的声音特征。
示例性的,在语音对话系统中,预设有三个虚拟角色,对应的虚拟角色名称分别可以是度小佳、度兰特和熊孩子,对应的声音特征分别是女声、男声和童声。用户在与语音对话系统进行对话时,如果想和女声进行对话,则可以从预设的三个虚拟角色中选择度小佳,;如果想和男声或者童声进行对话,则可以从预设的三个虚拟角色中分别选择度兰特或熊孩子。
S120、依据用户语音信息确定包含应答信息和应答辅助词的应答内容。
本实施例中,语音对话系统可以根据用户输入的语音信息,确定接下来的应答内容,其中,应答内容可以包括与用户输入的语音信息相对应的应答信息和用于确认的应答辅助词。
示例性的,语音对话系统可以帮助用户查询当前天气,例如用户输入的语音信息为“查询天气”,语音系统接收并判断出用户所要表达的意图是查询天气,但是其并不清楚用户所要查询的是当前的天气还是未来几天的天气,因此,语音对话系统的应答内容可以是“查询今日天气还是查询未来几天天气,请确认”,以便用户根据此应答内容做出选择,其中,“查询今日天气还是查询未来几天天气”为应答信息,“请确认”则为应答辅助词。
S130、采用目标虚拟角色的声学参数生成应答内容对应的应答语音。
本实施例中,目标虚拟角色的声学参数可以包括音调、音色、音量和语速等,用户选定目标虚拟角色后,相应的声学参数也随之确定。当确定与用户输入的语音信息对应的应答内容后,语音对话系统即可利用目标虚拟角色的声学参数生成与应答内容相对应的应答语音,并输出给用户。
示例性的,用户选择上述预设虚拟角色中的度小佳,则与目标虚拟角色度小佳相对应的音调、音色、音量和语速等声学参数随之确定。用户输入语音信息“查询天气”,语音对话系统接收该语音信息并确定应答内容为“查询今日天气还是查询未来几天天气,请确认”后,利用与度小佳相对应的各声学参数生成与上述应答内容相对应的应答语音。
本实施例提供的语音虚拟角色管理方法,通过在语音对话系统中预设的多个虚拟角色中选择目标虚拟角色,并利用预设的目标虚拟角色的声学参数,生成与用户语音信息相对应的应答语音,能够为用户提供多种发声人选择,使合成声音不再单调。
实施例二
本实施例在实施例一的基础上,提供了S110的具体实施方式。图2是本发明实施例二提供的语音虚拟角色管理方法的流程图,如图2所示,该方法具体包括:
S210、获取用户从音库中选择的原始发声人。
本实施例中,用户除了可以直接在预设的虚拟角色中选择目标虚拟角色,还可以根据个人意愿,自行创建新的虚拟角色,以满足用户的多样化需求。具体的,用户可以从音库中选择预存的原始发声人,以进行后续处理。其中,用户选择原始发声人的方式,可以是逐个点击音库中保存的与原始发声人相对应的音频信息,并且进行试听,以选择合适的原始发声人;也可以通过设定原始发声人的特征信息,直接锁定目标原始发声人。
示例性的,语音对话系统的音库中预先设置的原始发声人可以是虚拟角色度小佳、度兰特和熊孩子分别对应的原始发声人,其对应发出的语音分别是女声、男声和童声,并且每个原始发声人分别有其固有的语音特征。
S220、依据用户设置的语音特征调整指令,对原始发声人的语音特征进行调整得到目标语音特征,其中语音特征调整指令包括音调调整指令和/或音色调整指令。
本实施例中,用户可以根据个人喜好等对选择的原始发声人进行语音特征调整,具体的,用户可以通过设置语音特征调整指令来调整原始发声人的语音特征,以获得满足用户需求的目标语音特征,其中,用户设置的语音特征调整指令可以是音调调整指令、音色调整指令、音量调整指令和/或语速调整指令等。
示例性的,在语音对话系统中,上述各语音调整指令均可以用可拖动的进度条来表示,如果用户想要得到相对较轻、较细的声音,则可以将音调调整指令对应的进度条拖动至音调相对较高的位置;如果用户想要得到相对较缓慢的语速,则可以将语速调整指令对应的进度条拖动至语速相对较慢的位置。
S230、创建新的虚拟角色,并将目标语音特征赋予新的虚拟角色。
本实施例中,用户通过调整原始发声人的语音特征得到目标语音特征后,可以将目标语音特征赋予新的虚拟角色,以创建满足用户需求的新的虚拟角色并保存至音库中。
以用户选定的原始发声人是虚拟角色度小佳对应的原始发声人为例,用户设置的语音特征调整指令是音调调整指令和语速调整指令,其中音调调整指令可以是将音调调高,语速调整指令可以是将语速调慢,这样就可以在原始发声人的基础上,将音调调高,语速调慢,进而得到相对较轻、较细且语速减慢的目标语音特征。系统在得到目标语音特征后,将目标语音特征赋予新的虚拟角色,以创建新的虚拟角色,例如可以是度佳佳等。
S240、若接收到包含虚拟角色特征的角色设置指令,则将与虚拟角色特征匹配的虚拟角色确定为目标虚拟角色,其中虚拟角色特征包括虚拟角色标识和/或虚拟角色性别。
本实施例中,音库中保存的每个虚拟角色均具有各自的特征,其中,虚拟角色特征可以包括虚拟角色标识、虚拟角色性别、虚拟角色对应发声人ID和虚拟角色出场话术,其中,虚拟角色标识可以为虚拟角色的名称,如度小佳、度兰特、度佳佳等。在语音对话系统中,如果接收到用户发送的且包含虚拟角色特征的角色设置指令,则将虚拟角色特征与音库中保存的虚拟角色进行匹配,并将匹配成功的虚拟角色作为最终于用户进行对话的目标虚拟角色。
示例性的,在语音对话系统中,如果用户输入的角色设置指令中包含的虚拟角色特征为虚拟角色的名称度佳佳,系统接收到该特征后与音库中保存的各虚拟角色进行匹配,并成功将音库中保存的虚拟角色度佳佳选择出来作为目标虚拟角色与用户进行对话。
S250、依据用户语音信息确定包含应答信息和应答辅助词的应答内容。
S260、采用目标虚拟角色的声学参数生成应答内容对应的应答语音。
本实施例提供的语音虚拟角色管理方法,在语音对话系统中,用户不仅可以在预设的多个虚拟角色中选择目标虚拟角色,还可以根据个人意愿设置新的虚拟角色以供多样化选择,同时利用选定的目标虚拟角色的声学参数,生成与用户语音信息相对应的应答语音,能够为用户提供多种发声人选择,使合成声音不再单调。
在上述各实施例的基础上,进一步的,依据用户语音信息确定包含应答信息和应答辅助词的应答内容,包括:
A、依据用户语音信息确定应答信息。
本实施例中,语音对话系统可以根据用户输入的语音信息确定相应的应答信息。示例性的,如果用户输入的语音信息为“查询今日天气”,语音系统接收并判断出用户的意图是获取今日天气状况,系统查询到当前天气状况并通过语音播报给用户;如果用户输入的语音信息为“查询天气”,语音系统接收并判断出用户所要表达的意图是查询天气,可以生成应答信息“查询今日天气还是查询未来几天天气”。
B、确定用户语音信息是否属于预设的服务领域,若属于,则将预设的查询辅助词确定为应答辅助词;否则,将预设的闲聊辅助词确定为应答辅助词。
本实施例中,语音对话系统可以包括天气、歌曲、音乐、笑话和故事等预设服务领域,系统通过判断用户输入的语音信息是否属于预设的服务领域来确定相应的应答辅助词。如果用户输入的语音信息属于预设的服务领域,则将预设的查询辅助词设置为相应的应答辅助词,其中,查询辅助词可以是请确认、请复核等,如果用户输入的语音信息不属于预设的服务领域,则将预设的闲聊辅助词设置为相应的应答辅助词,其中,闲聊辅助词可以是亲、主人等。
示例性的,如果用户输入的语音信息为“查询天气”,语音系统接收并判断出用户的语音信息属于预设的服务领域天气,则可以相应生成查询辅助词“请确认”等;如果用户输入的语音信息为“今天很开心”,语音系统接收并判断出用户的语音信息不属于预设的服务领域,则可以相应生成闲聊辅助词“主人”等。
C、依据应答信息和应答辅助词确定应答内容。
其中,应答辅助词的位置可以是句首位置,也可以是句尾位置。
示例性的,如果用户输入的语音信息为“查询天气”,则系统生成的应答内容可以是“查询今日天气还是查询未来几天天气,请确认”;如果用户输入的语音信息为“今天很开心”则系统生成的应答内容可以是“主人,我也为您感到开心”。
实施例三
本实施例在上述各实施例的基础上,提供了S210的具体实施方式。图3是本发明实施例三提供的语音虚拟角色管理方法的流程图,如图3所示,该方法具体包括:
S310、获取用户输入的目标角色的性别和/或年龄。
本实施例中,系统可以将用户输入的性别和/或年龄,确定为目标角色的性别和/或年龄。
S320、从音库中选择与角色的性别和/或年龄匹配的发声人作为用户选择的原始发声人。
本实施例中,在语音对话系统的音库中,除了可以保存与每个原始发声人相对应的音频信息,还可以保存与每个原始发声人相对应的性别和年龄等信息。系统获取到用户输入的目标角色的性别/或年龄后,可以从音库中选择与目标角色的性别和/或年龄相匹配的发声人作为用户选择的原始发声人。
S330、依据用户设置的语音特征调整指令,对原始发声人的语音特征进行调整得到目标语音特征,其中语音特征调整指令包括音调调整指令和/或音色调整指令。
S340、创建新的虚拟角色,并将目标语音特征赋予新的虚拟角色。
S350、若接收到包含虚拟角色特征的角色设置指令,则将与虚拟角色特征匹配的虚拟角色确定为目标虚拟角色,其中虚拟角色特征包括虚拟角色标识和/或虚拟角色性别。
S360、依据用户语音信息确定包含应答信息和应答辅助词的应答内容。
S370、采用目标虚拟角色的声学参数生成应答内容对应的应答语音。
本实施例提供的语音虚拟角色管理方法,在语音对话系统中,用户除了可以直接选择原始发声人,还可以利用其感兴趣的目标角色间接的选择原始发声人,不仅可以在预设的多个虚拟角色中选择目标虚拟角色,还可以根据个人意愿利用原始发声人,设置新的虚拟角色以供多样化选择,同时利用选定的目标虚拟角色的声学参数,生成与用户语音信息相对应的应答语音,能够为用户提供多种发声人选择,使合成声音不再单调。
在上述各实施例的基础上,进一步的,语音虚拟角色管理方法还可以包括:
若接收到用户输入的角色切换指令,则依据角色切换指令重新确定目标虚拟角色,并采用重新确定的目标虚拟角色的声学参数与用户进行语音对话交互,其中角色切换指令为随机切换型指令,指定性别切换型指令或历史切换型指令。
本实施例中,语音对话系统还可以包括角色切换指令,利用该指令可以重新确定与用户进行对话的目标虚拟角色,其中,角色切换指令可以包括随机切换型指令,指定性别切换型指令或历史切换型指令。
示例性的,语音对话系统中包含原始的虚拟角色度小佳、度兰特和熊孩子以及用户新创建的虚拟角色度佳佳。假设当前与用户进行对话的虚拟角色是度佳佳,如果用户输入随机切换指令,如“换个声音”,系统检测到当前进行对话的虚拟角色是度佳佳,则从角色库中舍弃掉度佳佳,并在剩余的三个虚拟角色中随机选择一个作为最终与用户进行对话的虚拟角色。如果用户输入指定性别切换型指令,如“换成男声”,系统则从角色库中选择性别为男性的虚拟角色度兰特作为最终与用户进行对话的虚拟角色。如果用户输入历史切换指令,如“换成上一个声音”,系统则对历史信息进行查询,如果历史信息为空,则输出声音切换失败的信息;如果历史信息非空,则从历史信息中选择当前虚拟角色的前一虚拟角色作为最终与用户进行对话的虚拟角色,例如,在度佳佳之前是度小佳与用户进行对话,则用户输入历史切换指令后,系统识别出度佳佳的上一个声音是度小佳,则将度小佳设置为最终于用户进行对话的虚拟角色。
实施例四
图4是本发明实施例四提供的的语音虚拟角色管理装置的结构示意图。如图4所示,语音虚拟角色管理装置包括:
目标虚拟角色选择模块410,用于从预先创建的至少两个虚拟角色中选择目标虚拟角色;
应答内容确定模块420,用于依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
应答语音生成模块430,用于采用目标虚拟角色的声学参数生成应答内容对应的应答语音。
本发明实施例提供的语音虚拟角色管理装置,通过在语音对话系统中预设的多个虚拟角色中选择目标虚拟角色,并利用预设的目标虚拟角色的声学参数,生成与用户语音信息相对应的应答语音,能够为用户提供多种发声人选择,使合成声音不再单调。
进一步的,该装置还可以包括虚拟角色创建模块,虚拟角色创建模块具体可以包括:
原始发声人获取子模块,用于获取用户从音库中选择的原始发声人;
语音特征调整子模块,用于依据用户设置的语音特征调整指令,对原始发声人的语音特征进行调整得到目标语音特征,其中语音特征调整指令包括音调调整指令和/或音色调整指令;
虚拟角色创建子模块,用于创建新的虚拟角色,并将目标语音特征赋予新的虚拟角色。
进一步的,原始发声人获取子模块具体可以包括:
目标角色特征获取单元,用于获取用户输入的目标角色的性别和/或年龄;
目标角色特征匹配单元,用于从音库中选择与角色的性别和/或年龄匹配的发声人作为用户选择的原始发声人。
进一步的,应答内容确定模块420具体可以包括:
应答信息确定子模块,用于依据用户语音信息确定应答信息;
应答辅助词确定子模块,用于确定用户语音信息是否属于预设的服务领域,若属于,则将预设的查询辅助词确定为应答辅助词;否则,将预设的闲聊辅助词确定为应答辅助词;
应答内容确定子模块,用于依据应答信息和应答辅助词确定应答内容。
进一步的,目标虚拟角色选择模块410具体可以用于:
若接收到包含虚拟角色特征的角色设置指令,则将与虚拟角色特征匹配的虚拟角色确定为目标虚拟角色,其中虚拟角色特征包括虚拟角色标识和/或虚拟角色性别。
进一步的,该装置还可以包括:
角色切换模块,用于若接收到用户输入的角色切换指令,则依据角色切换指令重新确定目标虚拟角色,并采用重新确定的目标虚拟角色的声学参数与用户进行语音对话交互,其中角色切换指令为随机切换型指令,指定性别切换型指令或历史切换型指令。
本实施例提供的语音虚拟角色管理装置,与本发明任意实施例所提供的语音虚拟角色管理方法属于同一发明构思,可执行本发明任意实施例所提供的语音虚拟角色管理方法,具备执行语音虚拟角色管理方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的语音虚拟角色管理方法。
实施例五
图5为本发明实施例五提供的一种服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例性服务器设备512的框图。图5显示的服务器512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器512以通用计算设备的形式表现。服务器512的组件可以包括但不限于:一个或者多个处理器516,系统存储器528,连接不同系统组件(包括系统存储器528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)530和/或高速缓存存储器532。服务器512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
服务器512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该计算机设备512交互的设备通信,和/或与使得该服务器512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,计算机设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与计算机设备512的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储装置等。
处理器516通过运行存储在系统存储器528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的语音虚拟角色管理方法,包括:
从预先创建的至少两个虚拟角色中选择目标虚拟角色;
依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
采用目标虚拟角色的声学参数生成应答内容对应的应答语音。
实施例六
本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的语音虚拟角色管理方法,包括:
从预先创建的至少两个虚拟角色中选择目标虚拟角色;
依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
采用目标虚拟角色的声学参数生成应答内容对应的应答语音。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (14)

1.一种语音虚拟角色管理方法,其特征在于,包括:
从预先创建的至少两个虚拟角色中选择目标虚拟角色;
依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
采用所述目标虚拟角色的声学参数生成所述应答内容对应的应答语音。
2.根据权利要求1所述的方法,其特征在于,虚拟角色的创建包括:
获取用户从音库中选择的原始发声人;
依据用户设置的语音特征调整指令,对所述原始发声人的语音特征进行调整得到目标语音特征,其中语音特征调整指令包括音调调整指令和/或音色调整指令;
创建新的虚拟角色,并将所述目标语音特征赋予新的虚拟角色。
3.根据权利要求2所述的方法,其特征在于,获取用户从音库中选择的原始发声人,包括:
获取用户输入的目标角色的性别和/或年龄;
从所述音库中选择与所述角色的性别和/或年龄匹配的发声人作为用户选择的原始发声人。
4.根据权利要求1所述的方法,其特征在于,依据用户语音信息确定包含应答信息和应答辅助词的应答内容,包括:
依据用户语音信息确定所述应答信息;
确定所述用户语音信息是否属于预设的服务领域,若属于,则将预设的查询辅助词确定为所述应答辅助词;否则,将预设的闲聊辅助词确定为所述应答辅助词;
依据所述应答信息和所述应答辅助词确定所述应答内容。
5.根据权利要求1所述的方法,其特征在于,从至少两个虚拟角色中选择目标虚拟角色,包括:
若接收到包含虚拟角色特征的角色设置指令,则将与所述虚拟角色特征匹配的虚拟角色确定为目标虚拟角色,其中虚拟角色特征包括虚拟角色标识和/或虚拟角色性别。
6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
若接收到用户输入的角色切换指令,则依据角色切换指令重新确定目标虚拟角色,并采用重新确定的目标虚拟角色的声学参数与用户进行语音对话交互,其中所述角色切换指令为随机切换型指令,指定性别切换型指令或历史切换型指令。
7.一种语音虚拟角色管理装置,其特征在于,包括:
目标虚拟角色选择模块,用于从预先创建的至少两个虚拟角色中选择目标虚拟角色;
应答内容确定模块,用于依据用户语音信息确定包含应答信息和应答辅助词的应答内容;
应答语音生成模块,用于采用所述目标虚拟角色的声学参数生成所述应答内容对应的应答语音。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括虚拟角色创建模块,所述虚拟角色创建模块,包括:
原始发声人获取子模块,用于获取用户从音库中选择的原始发声人;
语音特征调整子模块,用于依据用户设置的语音特征调整指令,对所述原始发声人的语音特征进行调整得到目标语音特征,其中语音特征调整指令包括音调调整指令和/或音色调整指令;
虚拟角色创建子模块,用于创建新的虚拟角色,并将所述目标语音特征赋予新的虚拟角色。
9.根据权利要求8所述的装置,其特征在于,所述原始发声人获取子模块,包括:
目标角色特征获取单元,用于获取用户输入的目标角色的性别和/或年龄;
目标角色特征匹配单元,用于从所述音库中选择与所述角色的性别和/或年龄匹配的发声人作为用户选择的原始发声人。
10.根据权利要求7所述的装置,其特征在于,所述应答内容确定模块,包括:
应答信息确定子模块,用于依据用户语音信息确定所述应答信息;
应答辅助词确定子模块,用于确定所述用户语音信息是否属于预设的服务领域,若属于,则将预设的查询辅助词确定为所述应答辅助词;否则,将预设的闲聊辅助词确定为所述应答辅助词;
应答内容确定子模块,用于依据所述应答信息和所述应答辅助词确定所述应答内容。
11.根据权利要求7所述的装置,其特征在于,所述目标虚拟角色选择模块具体用于:
若接收到包含虚拟角色特征的角色设置指令,则将与所述虚拟角色特征匹配的虚拟角色确定为目标虚拟角色,其中虚拟角色特征包括虚拟角色标识和/或虚拟角色性别。
12.根据权利要求7-11任一项所述的装置,其特征在于,所述装置还包括:
角色切换模块,用于若接收到用户输入的角色切换指令,则依据角色切换指令重新确定目标虚拟角色,并采用重新确定的目标虚拟角色的声学参数与用户进行语音对话交互,其中所述角色切换指令为随机切换型指令,指定性别切换型指令或历史切换型指令。
13.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的语音虚拟角色管理方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的语音虚拟角色管理方法。
CN201710729387.8A 2017-08-23 2017-08-23 一种语音虚拟角色管理方法、装置、服务器和存储介质 Pending CN107564510A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710729387.8A CN107564510A (zh) 2017-08-23 2017-08-23 一种语音虚拟角色管理方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710729387.8A CN107564510A (zh) 2017-08-23 2017-08-23 一种语音虚拟角色管理方法、装置、服务器和存储介质

Publications (1)

Publication Number Publication Date
CN107564510A true CN107564510A (zh) 2018-01-09

Family

ID=60976778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710729387.8A Pending CN107564510A (zh) 2017-08-23 2017-08-23 一种语音虚拟角色管理方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN107564510A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108429953A (zh) * 2018-04-11 2018-08-21 四川斐讯信息技术有限公司 一种外语口语练习用智能耳机及其人机交互方法
CN108668024A (zh) * 2018-05-07 2018-10-16 维沃移动通信有限公司 一种语音处理方法及终端
CN108735211A (zh) * 2018-05-16 2018-11-02 智车优行科技(北京)有限公司 语音处理方法、装置、车辆、电子设备、程序及介质
CN109272984A (zh) * 2018-10-17 2019-01-25 百度在线网络技术(北京)有限公司 用于语音交互的方法和装置
CN109346083A (zh) * 2018-11-28 2019-02-15 北京猎户星空科技有限公司 一种智能语音交互方法及装置、相关设备及存储介质
CN109350961A (zh) * 2018-10-26 2019-02-19 努比亚技术有限公司 一种内容处理方法、终端及计算机可读存储介质
CN109448737A (zh) * 2018-08-30 2019-03-08 百度在线网络技术(北京)有限公司 虚拟形象的创建方法、装置、电子设备与存储介质
CN111105776A (zh) * 2018-10-26 2020-05-05 财团法人资讯工业策进会 有声播放装置及其播放方法
CN111290729A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 人机交互方法、装置与系统
CN111639222A (zh) * 2020-05-20 2020-09-08 广东小天才科技有限公司 一种口语训练方法及电子设备
CN111639218A (zh) * 2020-05-12 2020-09-08 广东小天才科技有限公司 一种口语训练的交互方法及终端设备
CN111739507A (zh) * 2020-05-07 2020-10-02 广东康云科技有限公司 一种基于ai的语音合成方法、系统、装置和存储介质
CN111785246A (zh) * 2020-06-30 2020-10-16 联想(北京)有限公司 虚拟角色语音处理方法、装置及计算机设备
CN111930333A (zh) * 2019-05-13 2020-11-13 国际商业机器公司 语音变换允许确定和表示
CN111968632A (zh) * 2020-07-14 2020-11-20 招联消费金融有限公司 通话语音获取方法、装置、计算机设备和存储介质
CN112100352A (zh) * 2020-09-14 2020-12-18 北京百度网讯科技有限公司 与虚拟对象的对话方法、装置、客户端及存储介质
CN112364144A (zh) * 2020-11-26 2021-02-12 北京沃东天骏信息技术有限公司 交互方法、装置、设备和计算机可读介质
CN112652292A (zh) * 2020-11-13 2021-04-13 北京有竹居网络技术有限公司 用于生成音频的方法、装置、设备和介质
CN113325951A (zh) * 2021-05-27 2021-08-31 百度在线网络技术(北京)有限公司 基于虚拟角色的操作控制方法、装置、设备以及存储介质
CN113382831A (zh) * 2019-01-28 2021-09-10 索尼集团公司 用于选择响应代理的信息处理器
CN113900751A (zh) * 2021-09-29 2022-01-07 平安普惠企业管理有限公司 一种合成虚拟形象的方法、装置、服务器和存储介质
CN111968632B (zh) * 2020-07-14 2024-05-10 招联消费金融股份有限公司 通话语音获取方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1573924A (zh) * 2003-06-20 2005-02-02 PtoPA株式会社 语音识别设备、语音识别方法、会话控制设备以及会话控制方法
US20150220231A1 (en) * 2012-05-16 2015-08-06 Brian E. Keane Synchronizing virtual actor's performances to a speaker's voice
CN104915117A (zh) * 2015-06-16 2015-09-16 深圳市腾讯计算机系统有限公司 控制与虚拟目标进行交互的方法和装置
CN105144286A (zh) * 2013-03-14 2015-12-09 托伊托克有限公司 用于交互的虚拟人物对话的系统和方法
CN105425953A (zh) * 2015-11-02 2016-03-23 小天才科技有限公司 一种人机交互的方法及系统
CN106294582A (zh) * 2016-07-28 2017-01-04 上海未来伙伴机器人有限公司 基于自然语言的人机交互方法及系统
CN106528137A (zh) * 2016-10-11 2017-03-22 深圳市天易联科技有限公司 与虚拟角色对话的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1573924A (zh) * 2003-06-20 2005-02-02 PtoPA株式会社 语音识别设备、语音识别方法、会话控制设备以及会话控制方法
US20150220231A1 (en) * 2012-05-16 2015-08-06 Brian E. Keane Synchronizing virtual actor's performances to a speaker's voice
CN105144286A (zh) * 2013-03-14 2015-12-09 托伊托克有限公司 用于交互的虚拟人物对话的系统和方法
CN104915117A (zh) * 2015-06-16 2015-09-16 深圳市腾讯计算机系统有限公司 控制与虚拟目标进行交互的方法和装置
CN105425953A (zh) * 2015-11-02 2016-03-23 小天才科技有限公司 一种人机交互的方法及系统
CN106294582A (zh) * 2016-07-28 2017-01-04 上海未来伙伴机器人有限公司 基于自然语言的人机交互方法及系统
CN106528137A (zh) * 2016-10-11 2017-03-22 深圳市天易联科技有限公司 与虚拟角色对话的方法及装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108429953A (zh) * 2018-04-11 2018-08-21 四川斐讯信息技术有限公司 一种外语口语练习用智能耳机及其人机交互方法
CN108668024A (zh) * 2018-05-07 2018-10-16 维沃移动通信有限公司 一种语音处理方法及终端
CN108735211A (zh) * 2018-05-16 2018-11-02 智车优行科技(北京)有限公司 语音处理方法、装置、车辆、电子设备、程序及介质
CN109448737A (zh) * 2018-08-30 2019-03-08 百度在线网络技术(北京)有限公司 虚拟形象的创建方法、装置、电子设备与存储介质
CN109448737B (zh) * 2018-08-30 2020-09-01 百度在线网络技术(北京)有限公司 虚拟形象的创建方法、装置、电子设备与存储介质
CN109272984A (zh) * 2018-10-17 2019-01-25 百度在线网络技术(北京)有限公司 用于语音交互的方法和装置
CN109350961A (zh) * 2018-10-26 2019-02-19 努比亚技术有限公司 一种内容处理方法、终端及计算机可读存储介质
CN111105776A (zh) * 2018-10-26 2020-05-05 财团法人资讯工业策进会 有声播放装置及其播放方法
CN109346083A (zh) * 2018-11-28 2019-02-15 北京猎户星空科技有限公司 一种智能语音交互方法及装置、相关设备及存储介质
CN111290729A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 人机交互方法、装置与系统
CN113382831A (zh) * 2019-01-28 2021-09-10 索尼集团公司 用于选择响应代理的信息处理器
CN111930333A (zh) * 2019-05-13 2020-11-13 国际商业机器公司 语音变换允许确定和表示
CN111739507A (zh) * 2020-05-07 2020-10-02 广东康云科技有限公司 一种基于ai的语音合成方法、系统、装置和存储介质
CN111639218A (zh) * 2020-05-12 2020-09-08 广东小天才科技有限公司 一种口语训练的交互方法及终端设备
CN111639222A (zh) * 2020-05-20 2020-09-08 广东小天才科技有限公司 一种口语训练方法及电子设备
CN111785246A (zh) * 2020-06-30 2020-10-16 联想(北京)有限公司 虚拟角色语音处理方法、装置及计算机设备
CN111968632A (zh) * 2020-07-14 2020-11-20 招联消费金融有限公司 通话语音获取方法、装置、计算机设备和存储介质
CN111968632B (zh) * 2020-07-14 2024-05-10 招联消费金融股份有限公司 通话语音获取方法、装置、计算机设备和存储介质
CN112100352A (zh) * 2020-09-14 2020-12-18 北京百度网讯科技有限公司 与虚拟对象的对话方法、装置、客户端及存储介质
CN112652292A (zh) * 2020-11-13 2021-04-13 北京有竹居网络技术有限公司 用于生成音频的方法、装置、设备和介质
CN112364144A (zh) * 2020-11-26 2021-02-12 北京沃东天骏信息技术有限公司 交互方法、装置、设备和计算机可读介质
CN112364144B (zh) * 2020-11-26 2024-03-01 北京汇钧科技有限公司 交互方法、装置、设备和计算机可读介质
CN113325951A (zh) * 2021-05-27 2021-08-31 百度在线网络技术(北京)有限公司 基于虚拟角色的操作控制方法、装置、设备以及存储介质
CN113325951B (zh) * 2021-05-27 2024-03-29 百度在线网络技术(北京)有限公司 基于虚拟角色的操作控制方法、装置、设备以及存储介质
CN113900751A (zh) * 2021-09-29 2022-01-07 平安普惠企业管理有限公司 一种合成虚拟形象的方法、装置、服务器和存储介质

Similar Documents

Publication Publication Date Title
CN107564510A (zh) 一种语音虚拟角色管理方法、装置、服务器和存储介质
JP7297836B2 (ja) アシスタントアプリケーションのための音声ユーザインタフェースショートカット
KR102543693B1 (ko) 전자 장치 및 그의 동작 방법
US9953648B2 (en) Electronic device and method for controlling the same
JP6335139B2 (ja) 手動始点/終点指定及びトリガフレーズの必要性の低減
CN107340991A (zh) 语音角色的切换方法、装置、设备以及存储介质
CN107134279A (zh) 一种语音唤醒方法、装置、终端和存储介质
WO2018213740A1 (en) Action recipes for a crowdsourced digital assistant system
CN108597509A (zh) 智能语音交互实现方法、装置、计算机设备及存储介质
JP4942970B2 (ja) 音声認識における動詞誤りの回復
KR20180115628A (ko) 복수의 지능형 개인 비서 서비스를 위한 관리 계층
CN110459222A (zh) 语音控制方法、语音控制装置及终端设备
CN107507615A (zh) 界面智能交互控制方法、装置、系统及存储介质
US20190333513A1 (en) Voice interaction method, device and computer readable storage medium
CN108470034A (zh) 一种智能设备服务提供方法及系统
CN102160043A (zh) 针对集成多语气多装置自然语言语音服务环境的系统和方法
JP2020079921A (ja) 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム
CN108133707A (zh) 一种内容分享方法及系统
JP2019533212A (ja) 音声放送方法及び装置
JP7170739B2 (ja) リモートに生成された自動化アシスタントコンテンツのレンダリングにおけるクライアントデバイスレイテンシの軽減
CN110248021A (zh) 一种智能设备音量控制方法及系统
CN108055617A (zh) 一种麦克风的唤醒方法、装置、终端设备及存储介质
JP2022101663A (ja) ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN105100672A (zh) 显示装置及其视频通话执行方法
CN103973542B (zh) 一种语音信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109

RJ01 Rejection of invention patent application after publication