CN107340991A - 语音角色的切换方法、装置、设备以及存储介质 - Google Patents

语音角色的切换方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN107340991A
CN107340991A CN201710585065.0A CN201710585065A CN107340991A CN 107340991 A CN107340991 A CN 107340991A CN 201710585065 A CN201710585065 A CN 201710585065A CN 107340991 A CN107340991 A CN 107340991A
Authority
CN
China
Prior art keywords
target
role
speech
roles
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710585065.0A
Other languages
English (en)
Other versions
CN107340991B (zh
Inventor
王禹
谢波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710585065.0A priority Critical patent/CN107340991B/zh
Publication of CN107340991A publication Critical patent/CN107340991A/zh
Priority to US16/038,861 priority patent/US11302302B2/en
Application granted granted Critical
Publication of CN107340991B publication Critical patent/CN107340991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • G10L13/0335Pitch control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种语音角色的切换方法、装置、设备及存储介质。所述方法包括:识别语音角色的切换指令,并确定与语音角色的切换指令对应的目标切换语音角色;将智能终端的当前语音角色的切换至目标切换语音角色,不同语音角色具有不同的角色属性,角色属性包括角色话术属性;根据用户输入的交互语音以及目标切换语音角色的角色话术属性,生成与交互语音对应的交互响应信息;将与交互响应信息对应的响应语音提供给用户,本发明实施例实现了让不同的语音角色具有不同的角色话术属性,使得语音角色具有了角色感,让用户能在交流中感受到语音角色是一个特定的人,一个个性的人。

Description

语音角色的切换方法、装置、设备以及存储介质
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种语音角色的切换方法、装置、设备以及存储介质。
背景技术
随着科技的不断发展,各种智能设备,例如:智能机器人,智能音响等,营运而生。智能设备需要以虚拟的语音角色(也可称为语音助手)的TTS(Text To Speech,从文本到语音)来和用户对话。
发明在在实现本发明的过程中,发现:在现有技术中,智能设备的语音角色往往以一个角色身份出现,而单一角色在风格上为了保持同一性,只能以一种风格来呈现给用户,如“女性助手”角色。这样留给用户的选择空间无疑是非常小的,而用户的需求往往是多样的:比如小孩子可能喜欢小孩子的声音,男性喜欢女性的声音,女性喜欢男性的声音等。
此外,即使有智能设备可以切换语音角色,切换结果仅仅是TTS发音人的变化,也就是说只是在让同一句话换不同的人来说,而没有深入到虚拟的语音角色自身带有的性格形象,因此未能真正做到角色感。如果一个声音和角色感不匹配,那将造成认知混乱,阻碍用户与这个语音角色产生亲密感与认同感,进而也会影响用户对智能设备的使用体验。
发明内容
本发明实施例提供了一种语音角色的切换方法、装置、设备以及存储介质,以增强语音角色的角色感,满足人们对智能终端中的语音角色不断增长的个性化需求。
第一方面,本发明实施例提供了一种语音角色的切换方法,包括:
识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;
将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;
根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;
将与所述交互响应信息对应的响应语音提供给所述用户。
第二方面,本发明实施例还提供了一种语音角色的切换方法,包括:
目标切换语音角色确定模块,用于识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;
目标切换语音角色的切换模块,用于将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;
交互响应信息生成模块,用于根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;
响应语音提供模块,用于将与所述交互响应信息对应的响应语音提供给所述用户。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本发明实施例中任一所述的语音角色的切换方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的语音角色的切换方法。
本发明实施例提供了一种语音角色的切换方法、装置、设备以及存储介质,通过确定与用户输入的语音角色的切换指令对应的目标切换语音角色;将智能终端的当前语音角色的切换至所述目标切换语音角色;根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;将与所述交互响应信息对应的响应语音提供给所述用户的技术手段,实现了让不同的语音角色具有不同的角色话术属性,具有一贯的性格体验,使得语音角色具有了角色感,让用户能在交流中感受到语音角色是一个特定的人,一个个性的人。
附图说明
图1是本发明实施例一中的一种语音角色的切换方法的流程图;
图2是本发明实施例二中的一种语音角色的切换方法的流程图;
图3是本发明实施例三中的一种语音角色的切换方法的流程图;
图4是本发明实施例四中的一种语音角色的切换装置的结构图;
图5是本发明实施例五中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种语音角色的切换方法的流程图,本实施例可适用于根据用户输入的语音角色的切换指令,切换智能设备中不同角色话术属性的语音角色的情况,该方法可以由本发明实施例提供的语音角色的切换装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在各种智能设备中,例如,智能机器人或者智能音箱等。如图1所示,本实施例的方法具体包括:
S110、识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色。
在本实施例中,智能设备中内置有至少两种不同角色感的语音角色,例如:“邻家女孩”、“智能AI(Artificial Intelligence,人工智能)”以及“熊孩子”等。不同的语音角色具有不同的性格特征。例如:“邻家女孩”温柔热情、“智能AI”可靠冷静以及“熊孩子”童真。
其中,所述语音角色的切换指令,具体是指用于切换不同语音角色的切换指令。其中,所述语音角色的切换指令可以为用户通过与所述智能设备相连的移动终端(例如,手机或者平板电脑)上的安装APP(应用程序),发送的切换指令;也可以为用户通过纯语音方式,发送的切换指令;还可以为用户通过选中所述智能设备中的设定按钮或者设定触摸区域,发送的切换指令,本实施例对此并不进行限制
可选的,所述语音角色的切换指令可以具体为语音控制指令。这样设置原因在于:现有的智能设备的语音角色切换或者设置方法均需要依赖移动终端中安装的APP,这需要首先建立移动终端与智能设备的通信连接。因此,当网络质量不佳时,无法实现基于APP的语音角色切换。但是,如果使用纯语音的语音角色的切换指令,则可以不依赖APP的控制,使得本发明实施例的语音角色的切换方法的通用性更强。
在本实施例的一个可选的实施方式中,识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色,可以包括:
如果根据用户输入的语音角色的切换指令,识别出唯一语音角色,则将所述唯一语音角色作为所述目标切换语音角色;
如果根据用户输入的语音角色的切换指令,识别出至少两个备选语音角色,则使用设定筛选算法从所述至少两个备选语音角色中选取目标切换语音角色。
例如:如果用户输入的语音角色的切换指令为:“切换至邻家女孩”,则可以唯一确定所述目标切换语音角色为“邻家女孩”;如果用户输入的语音角色的切换指令为“请换个语音角色”,而当前的语音角色为“邻家女孩”,则可以确定对应的备选语音角色为“智能AI”以及“熊孩子”。
其中,使用设定筛选算法从所述至少两个备选语音角色中选取目标切换语音角色可以包括:通过随机选择的方式,从所述至少两个备选语音角色中选取目标切换语音角色;或者通过在所述至少两个备选语音角色中选择历史使用频率最高的语音角色作为所述目标切换语音角色等,本实施例对此并不进行限制。
S120、将智能终端的当前语音角色的切换至所述目标切换语音角色。
在本实施例中,不同的语音角色对应不同的角色属性,其中,所述角色属性包括角色话术属性。所谓角色话术属性具体是指一个语音角色的说话方式或者口头语等可以用来反映说话者性格特征(或者说角色感)的语言表达方式。所述角色话术属性可以通过多个响应模板体现。
通过为不同的语音角色设置不同角色话术属性,可以使得用户更明确的区分不同语音角色的性格特征,进而可以帮助用户与这个语音角色建立亲密感与认同感,大大提高用户的使用体验。
S130、根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息。
其中,用户输入的交互语音可以为用户输入的问题或者简单的聊天内容等,所述交互响应信息具体是指语音角色针对用户输入的交互语音,反馈给用户的响应信息,例如:用户输入的问题的答案,以及用户聊天内容的反馈内容等。
举个简单的例子:针对用户输入的同一个问题(或者说交互语音)“北京今天的天气怎么样”,“邻家女孩”的语音角色会回答:“北京今天天气不错呢,是个晴天,白天高温31度,夜间低温15度,这个天气适合出去走走哦”;“智能AI”的语音角色会回答:“北京今天天气晴朗,白天高温31度,夜间低温15度,天气非常不错”;而“熊孩子”的语音角色会回答:“主人,北京今天天气不错呢,是个晴天,白天高温31度,夜间低温15度,这个天气适合出去走走。”
典型的,可以针对不同的语音角色构造不同的响应模板,构造的响应模板能够反映不同语音角色的性格特征,以实现针对用户的同一交互语音,针对不同的角色话术属性,选择不同的响应模板生成交互响应信息,使得不同的语音角色可以给出不同角色感的交互响应信息。
典型的,可以在所述智能设备的激活状态下,获取用户输入的交互语音,并生成相应的交互响应信息。在所述智能设备的休眠状态下,首先识别用户输入的激活语音“例如:小度,小度”,在识别出上述激活语音并成功激活后,获取用户输入的交互语音,并生成相应的交互响应信息。
S140、将与所述交互响应信息对应的响应语音提供给所述用户。
在获取文本形式的交互响应信息后,通过TTS技术,可以进而将该交互响应信息转换成对应的响应语音提供给所述用户。
其中,一个语音角色的角色感,除了可以通过角色话术属性来体现之外,还可以进一步通过角色语音属性来体现。
典型的,所述角色语音属性可以包括下述至少一项:TTS发音人库、自定义的音色、自定义的语速以及自定义的音量。
相应的,用户可以自定义为不同的语音角色设置对应的角色语音属性,或者从服务器中下载预先自定义设置的角色语音属性等。
进一步的,不同语音角色可以对应不同的角色话术属性以及角色语音属性,上述参数能够构成支撑一个语音角色。典型的,可以将与不同语音角色对应的角色属性存储于不同的存储空间中,当用户选择切换至一个语音角色后,相应将与该语音角色对应的角色属性加载至内存中。
可选的,将与所述交互响应信息对应的响应语音提供给所述用户,可以包括:根据所述目标切换语音角色的角色语音属性,将与所述交互响应信息对应的响应语音提供给所述用户。
本发明实施例提供了一种语音角色的切换方法,通过确定与用户输入的语音角色的切换指令对应的目标切换语音角色;将智能终端的当前语音角色的切换至所述目标切换语音角色;根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;将与所述交互响应信息对应的响应语音提供给所述用户的技术手段,实现了让不同的语音角色具有不同的角色话术属性,具有一贯的性格体验,使得语音角色具有了角色感,让用户能在交流中感受到语音角色是一个特定的人,一个个性的人。
实施例二
图2为本发明实施例二提供的一种语音角色的切换方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,将根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息,具体为:对用户输入的交互语音进行识别;根据识别结果确定目标响应类型,并确定与所述交互语音匹配的目标关键响应信息;根据所述目标响应类型以及所述目标切换语音角色的角色话术属性,确定匹配的目标响应模板,其中,所述目标响应模板中包括角色感背景信息以及用于填充关键响应信息的空白槽位;将所述目标关键响应信息填充于所述目标响应模板的空白槽位中,得到与所述交互语音对应的交互响应信息。相应的,本实施例的方法可以包括:
S210、识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色。
S220、将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性以及角色语音属性。
S230、对用户输入的交互语音进行识别。
S240、根据识别结果确定目标响应类型,并确定与所述交互语音匹配的目标关键响应信息。
其中,所述响应类型可以包括:“播放音乐”、“查询天气”、“普通聊天”或者“美食查询”等针对用户不同需求的特定的响应类型。
所述关键响应信息具体是指针对用户输入的交互语音进行反馈时,必不可少的响应信息。例如:如果根据用户输入的交互语音确定的目标响应类型为“查询天气”,则所述目标关键响应信息为对应的天气查询结果。
典型的,可以通过将用户输入的交互语音输入至预先训练好的响应类型分类模型中,以确定对应的目标响应类型;也可以通过对用户输入的交互语音进行关键词识别的方式,确定对应的目标响应类型。例如:如果识别到关键词“播放”,则确定对应的目标响应类型为“播放音乐”,如果识别到关键词“天气”则确定对应的目标响应类型为“查询天气”等。
在确定出与用户输入的交互语音对应的目标响应类型后,进而可以确定出与所述交互语音匹配的目标关键响应信息。例如:用户输入的交互语音为:“北京今天天气怎么样”,则进而确定出的目标关键响应信息为:“晴,高温31度,低温15度”。
S250、根据所述目标响应类型以及所述目标切换语音角色的角色话术属性,确定匹配的目标响应模板。
其中,所述目标响应模板中包括角色感背景信息以及用于填充关键响应信息的空白槽位。
在一个具体的例子中,针对不同的响应类型,不同的语音角色对应不同的角色话术属性,不同的角色话术属性对应不同的响应模板(其中,同一响应类型可以对应同一角色话术属性中的一个或者多个响应模板)。例如:针对“天气查询”这一响应类型,在确定关键响应信息中包括“晴”时,语音角色“邻家女孩”对应的响应模板为:“北京今天天气不错呢,是个晴天,白天XX,夜间XX,这个天气适合出去走走哦”;语音角色“智能AI”对应的响应模板为:“北京今天天气晴朗,白天XX,夜间XX,天气非常不错;”语音角色“熊孩子”对应的响应模板为:“主人,北京今天天气不错呢,是个晴天,白天XX,夜间XX,这个天气适合出去走走”。其中,“XX”代表用于填充关键响应信息的空白槽位。
当然,可以理解的是:针对“天气查询”这一响应类型,在确定关键响应信息中包括“晴”时,不同的语音角色的角色话术属性还可以具有其他类型的响应模板,本实施例对此并不进行限制。
S260、将所述目标关键响应信息填充于所述目标响应模板的空白槽位中,得到与所述交互语音对应的交互响应信息。
S270、根据所述目标切换语音角色的角色语音属性,将与所述交互响应信息对应的响应语音提供给所述用户。
本发明实施例的技术方案通过为不同的语音角色设计不同角色话术属性的响应模板,可以实现针对用户输入的同一交互语音,可以给出不同角色感的响应语音,可以解决现有技术中在切换语音角色时,仅是在让同一句话换不同的人来说,而没有深入到虚拟的语音角色自身带有的性格形象,因此未能真正做到角色感的技术问题,大大提高了用户的使用体验,以及智能设备的交互性。
实施例三
图3为本发明实施例三提供的一种语音角色的切换方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,在将智能终端的当前语音角色的切换至所述目标切换语音角色之后,还具体包括:获取与所述目标切换语音角色对应的目标打招呼语音,其中,不同语音角色对应不同的打招呼语音;根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户;
以及,在根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户之前,还具体包括:获取与所述目标切换语音角色对应的目标打招呼背景音乐,其中,不同语音角色对应不同的打招呼背景音乐;
相应的,将根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户,具体为:在播放设定时长的所述目标打招呼背景音乐后,根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给用户。
以及,在将智能终端的当前语音角色的切换至所述目标切换语音角色之后,还具体包括:如果确定所述智能终端在休眠状态下识别出用户输入的唤醒语音,则获取与所述目标切换语音角色对应的目标唤醒响应音,其中,不同语音角色对应不同的唤醒响应音;根据所述目标切换语音角色的角色语音属性,将所述目标唤醒响应音提供给所述用户。
相应的,本实施例的方法具体包括:
S310、识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色。
S320、将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性以及角色语音属性。
S330、获取与所述目标切换语音角色对应的目标打招呼语音,其中,不同语音角色对应不同的打招呼语音。
在本实施例中,发明人创造性的提出:在用户成功切换了一个语音角色后,新切换的语音角色会与用户打招呼(也即:发送目标打招呼语音)。这样设置的好处是:可以在语音角色切换时,有明显的角色感变更,突出了不同语音角色之间的差异,并匹配各个发音人的角色感。
S340、获取与所述目标切换语音角色对应的目标打招呼背景音乐,其中,不同语音角色对应不同的打招呼背景音乐。
发明人为了进一步体现不同语音角色之间差异,在进行语音角色切换时,可以为不同的语音角色设置不同的打招呼背景音乐。让用户更加直观的感受到语音角色切换时的变更感。
S350、在播放设定时长的所述目标打招呼背景音乐后,根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给用户。
其中,所述设定时长可以为1s、2s或者3s等,本实施例对此并不进行限制。可以理解的是,除了可以先播放目标打招呼背景音乐,后播放所述目标打招呼语音;还可以同时播放所述目标打招呼背景音乐以及所述目标打招呼语音等。
在本实施例的一个可选的实施方式中,在智能设备切换语音角色后,当前的语音角色会用自己独特的特征来与用户打招呼与自我介绍(发送目标打招呼语音),并配有专属的出场音乐(典型的,可以控制在5s内,最佳为1~3秒),实现与用户的初次照面。
表1
切换 打招呼语音 打招呼背景音乐 先后顺序
切换到邻家女孩 你好,我是度小佳 甜美风格 先音乐再语音
切换到智能AI 你好,我是度兰特 智能电子感 先音乐再语音
切换到熊孩子 你好,我叫熊孩子 童趣动漫风 先音乐再语音
其中,在表1中示出了一种可选的与不同语音角色对应的打招呼语音以及打招呼背景音乐的音乐类型。
S360、根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息。
S370、根据所述目标切换语音角色的角色语音属性,将与所述交互响应信息对应的响应语音提供给所述用户。
S380、如果确定所述智能终端在休眠状态下识别出用户输入的唤醒语音,则获取与所述目标切换语音角色对应的目标唤醒响应音,其中,不同语音角色对应不同的唤醒响应音。
目前,现有的智能设备在休眠后,一旦被唤醒语音唤醒,都会向用户反馈一个比较单一的、系统默认的唤醒响应音,例如,“滴”一声。这个唤醒响应音与当前使用的语音角色无关,非常的机械,缺乏对话感。
有鉴于此,发明人创造性的提出了针对不同的语音角色设置不同的响应唤醒音,以进一步加强不同语音角色的差异性,增加了不同语音角色的角色感。
表2
相应的,发明人针对不同角色感的语音角色,设置不同类型的唤醒响应音,其中,在表2中示出了一种可选的针对不同语音角色的唤醒响应音。
S390、根据所述目标切换语音角色的角色语音属性,将所述目标唤醒响应音提供给所述用户。
本发明实施例的技术方案通过针对不同的语音角色设置不同的打招呼语音、打招呼背景音乐,可以实现语音角色切换后有明显的角色更替的感知,让用户直接感受到角色的变更;此外,通过为不同的语音角色设置不同的唤醒响应音,可以进一步加强不同语音角色的差异性,增加了不同语音角色的角色感,以进而提高用户对智能设备的使用体验。
实施例四
图4为本发明实施例四提供的一种语音角色的切换装置的结构示意图。如图4所示,所述装置包括:目标切换语音角色确定模块410、目标切换语音角色的切换模块420、交互响应信息生成模块430以及响应语音提供模块440,其中:
目标切换语音角色确定模块410,用于识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;
目标切换语音角色的切换模块420,用于将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;
交互响应信息生成模块430,用于根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;
响应语音提供模块440,用于将与所述交互响应信息对应的响应语音提供给所述用户。
本发明实施例提供了一种语音角色的切换装置,通过确定与用户输入的语音角色的切换指令对应的目标切换语音角色;将智能终端的当前语音角色的切换至所述目标切换语音角色;根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;将与所述交互响应信息对应的响应语音提供给所述用户的技术手段,实现了让不同的语音角色具有不同的角色话术属性,具有一贯的性格体验,使得语音角色具有了角色感,让用户能在交流中感受到语音角色是一个特定的人,一个个性的人。
在上述各实施例的基础上,所述角色属性还可以包括:角色语音属性;
所述响应语音提供模块,具体用于:根据所述目标切换语音角色的角色语音属性,将与所述交互响应信息对应的响应语音提供给所述用户。
在上述各实施例的基础上,所述角色语音属性可以包括下述至少一项:
TTS发音人库、自定义的音色、自定义的语速以及自定义的音量。
在上述各实施例的基础上,所述交互响应信息生成模块,具体可以用于:
对用户输入的交互语音进行识别;
根据识别结果确定目标响应类型,并确定与所述交互语音匹配的目标关键响应信息;
根据所述目标响应类型以及所述目标切换语音角色的角色话术属性,确定匹配的目标响应模板,其中,所述目标响应模板中包括角色感背景信息以及用于填充关键响应信息的空白槽位;
将所述目标关键响应信息填充于所述目标响应模板的空白槽位中,得到与所述交互语音对应的交互响应信息。
在上述各实施例的基础上,还可以包括,目标打招呼语音提供模块,
所述打招呼语音提供模块具体包括:
目标打招呼语音获取单元,用于在将智能终端的当前语音角色的切换至所述目标切换语音角色之后,获取与所述目标切换语音角色对应的目标打招呼语音,其中,不同语音角色对应不同的打招呼语音;
目标打招呼语音提供单元,用于根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户。
在上述各实施例的基础上,还可以包括:目标打招呼背景音乐获取模块,用于:在根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户之前,获取与所述目标切换语音角色对应的目标打招呼背景音乐,其中,不同语音角色对应不同的打招呼背景音乐;
相应的,目标打招呼语音提供单元,具体可以用于:在播放设定时长的所述目标打招呼背景音乐后,根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给用户。
在上述各实施例的基础上,还可以包括:唤醒响应模块,用于在将智能终端的当前语音角色的切换至所述目标切换语音角色之后,如果确定所述智能终端在休眠状态下识别出用户输入的唤醒语音,则获取与所述目标切换语音角色对应的目标唤醒响应音,其中,不同语音角色对应不同的唤醒响应音;
根据所述目标切换语音角色的角色语音属性,将所述目标唤醒响应音提供给所述用户。
在上述各实施例的基础上,所述目标切换语音角色确定模块,具体用于:
如果根据用户输入的语音角色的切换指令,识别出唯一语音角色,则将所述唯一语音角色作为所述目标切换语音角色;
如果根据用户输入的语音角色的切换指令,识别出至少两个备选语音角色,则使用设定筛选算法从所述至少两个备选语音角色中选取目标切换语音角色。
在上述各实施例的基础上,所述语音角色的切换指令可以为语音控制指令。
上述语音角色的切换装置可执行本发明任意实施例所提供的语音角色的切换方法,具备执行的语音角色的切换方法相应的功能模块和有益效果。
实施例五
图5为本发明实施例五提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图5显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图5中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种语音角色的切换方法。
也即,所述处理单元执行所述程序时实现:识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;将与所述交互响应信息对应的响应语音提供给所述用户。
实施例六
本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的语音角色的切换方法:
也即,该程序被处理器执行时实现:识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;将与所述交互响应信息对应的响应语音提供给所述用户。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种语音角色的切换方法,其特征在于,包括:
识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;
将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;
根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;
将与所述交互响应信息对应的响应语音提供给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述角色属性还包括:角色语音属性;
将与所述交互响应信息对应的响应语音提供给所述用户,包括:
根据所述目标切换语音角色的角色语音属性,将与所述交互响应信息对应的响应语音提供给所述用户。
3.根据权利要求2所述的方法,其特征在于,所述角色语音属性包括下述至少一项:
TTS发音人库、自定义的音色、自定义的语速以及自定义的音量。
4.根据权利要求1-3任一项所述的方法,其特征在于,根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息,包括:
对用户输入的交互语音进行识别;
根据识别结果确定目标响应类型,并确定与所述交互语音匹配的目标关键响应信息;
根据所述目标响应类型以及所述目标切换语音角色的角色话术属性,确定匹配的目标响应模板,其中,所述目标响应模板中包括角色感背景信息以及用于填充关键响应信息的空白槽位;
将所述目标关键响应信息填充于所述目标响应模板的空白槽位中,得到与所述交互语音对应的交互响应信息。
5.根据权利要求2或3所述的方法,其特征在于,在将智能终端的当前语音角色的切换至所述目标切换语音角色之后,还包括:
获取与所述目标切换语音角色对应的目标打招呼语音,其中,不同语音角色对应不同的打招呼语音;
根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户。
6.根据权利要求5所述的方法,其特征在于,在根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户之前,还包括:
获取与所述目标切换语音角色对应的目标打招呼背景音乐,其中,不同语音角色对应不同的打招呼背景音乐;
根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给所述用户,具体包括:
在播放设定时长的所述目标打招呼背景音乐后,根据所述目标切换语音角色的角色语音属性,将所述目标打招呼语音提供给用户。
7.根据权利要求2或3所述的方法,其特征在于,在将智能终端的当前语音角色的切换至所述目标切换语音角色之后,还包括:
如果确定所述智能终端在休眠状态下识别出用户输入的唤醒语音,则获取与所述目标切换语音角色对应的目标唤醒响应音,其中,不同语音角色对应不同的唤醒响应音;
根据所述目标切换语音角色的角色语音属性,将所述目标唤醒响应音提供给所述用户。
8.根据权利要求1-3任一项所述的方法,其特征在于,识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色,包括:
如果根据用户输入的语音角色的切换指令,识别出唯一语音角色,则将所述唯一语音角色作为所述目标切换语音角色;
如果根据用户输入的语音角色的切换指令,识别出至少两个备选语音角色,则使用设定筛选算法从所述至少两个备选语音角色中选取目标切换语音角色。
9.根据权利要求1所述的方法,其特征在于,所述语音角色的切换指令为语音控制指令。
10.一种语音角色的切换装置,其特征在于,包括:
目标切换语音角色确定模块,用于识别用户输入的语音角色的切换指令,并确定与所述语音角色的切换指令对应的目标切换语音角色;
目标切换语音角色的切换模块,用于将智能终端的当前语音角色的切换至所述目标切换语音角色,其中,不同语音角色具有不同的角色属性,所述角色属性包括角色话术属性;
交互响应信息生成模块,用于根据用户输入的交互语音以及所述目标切换语音角色的角色话术属性,生成与所述交互语音对应的交互响应信息;
响应语音提供模块,用于将与所述交互响应信息对应的响应语音提供给所述用户。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-9中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法。
CN201710585065.0A 2017-07-18 2017-07-18 语音角色的切换方法、装置、设备以及存储介质 Active CN107340991B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710585065.0A CN107340991B (zh) 2017-07-18 2017-07-18 语音角色的切换方法、装置、设备以及存储介质
US16/038,861 US11302302B2 (en) 2017-07-18 2018-07-18 Method, apparatus, device and storage medium for switching voice role

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710585065.0A CN107340991B (zh) 2017-07-18 2017-07-18 语音角色的切换方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN107340991A true CN107340991A (zh) 2017-11-10
CN107340991B CN107340991B (zh) 2020-08-25

Family

ID=60219119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710585065.0A Active CN107340991B (zh) 2017-07-18 2017-07-18 语音角色的切换方法、装置、设备以及存储介质

Country Status (2)

Country Link
US (1) US11302302B2 (zh)
CN (1) CN107340991B (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107733722A (zh) * 2017-11-16 2018-02-23 百度在线网络技术(北京)有限公司 用于配置语音服务的方法和装置
CN107943771A (zh) * 2017-11-15 2018-04-20 百度在线网络技术(北京)有限公司 响应文本的生成方法、装置、处理器、及计算机可读介质
CN108073112A (zh) * 2018-01-19 2018-05-25 福建捷联电子有限公司 一种具有角色扮演的智能服务型机器人
CN108182942A (zh) * 2017-12-28 2018-06-19 福州瑞芯微电子股份有限公司 一种支持不同虚拟角色交互的方法和装置
CN108231059A (zh) * 2017-11-27 2018-06-29 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
CN108510989A (zh) * 2018-03-20 2018-09-07 杭州声讯网络科技有限公司 一种在电话通话过程中的智能语音交互方式
CN108538297A (zh) * 2018-03-12 2018-09-14 恒玄科技(上海)有限公司 一种基于无线麦克风阵列的智能语音交互方法及交互系统
CN108877800A (zh) * 2018-08-30 2018-11-23 出门问问信息科技有限公司 语音交互方法、装置、电子设备及可读存储介质
CN108922531A (zh) * 2018-07-26 2018-11-30 腾讯科技(深圳)有限公司 槽位识别方法、装置、电子设备及存储介质
CN109215629A (zh) * 2018-11-22 2019-01-15 Oppo广东移动通信有限公司 语音处理方法、装置及终端
CN109256128A (zh) * 2018-11-19 2019-01-22 广东小天才科技有限公司 一种根据用户语料自动判定用户角色的方法及系统
CN109272984A (zh) * 2018-10-17 2019-01-25 百度在线网络技术(北京)有限公司 用于语音交互的方法和装置
CN109346083A (zh) * 2018-11-28 2019-02-15 北京猎户星空科技有限公司 一种智能语音交互方法及装置、相关设备及存储介质
CN109448737A (zh) * 2018-08-30 2019-03-08 百度在线网络技术(北京)有限公司 虚拟形象的创建方法、装置、电子设备与存储介质
CN109725798A (zh) * 2017-10-25 2019-05-07 腾讯科技(北京)有限公司 智能角色的切换方法及相关装置
CN109986569A (zh) * 2017-12-29 2019-07-09 微软技术许可有限责任公司 具有角色化和性格化的聊天机器人
CN110085225A (zh) * 2019-04-24 2019-08-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN110134360A (zh) * 2018-02-09 2019-08-16 阿拉的(深圳)人工智能有限公司 智能语音播报方法、播报装置、存储介质及智能音箱
CN110287299A (zh) * 2019-06-17 2019-09-27 浙江百应科技有限公司 一种通话中多话术语句智能切换方法
CN110349563A (zh) * 2019-07-04 2019-10-18 苏州思必驰信息科技有限公司 用于语音对话平台的对话人设配置方法及系统
CN110929078A (zh) * 2019-11-08 2020-03-27 中国第一汽车股份有限公司 一种汽车语音形象换装方法、装置、设备及存储介质
WO2020083305A1 (zh) * 2018-10-26 2020-04-30 腾讯科技(深圳)有限公司 音箱系统、音箱以及音箱底座
CN111105776A (zh) * 2018-10-26 2020-05-05 财团法人资讯工业策进会 有声播放装置及其播放方法
CN111128121A (zh) * 2019-12-20 2020-05-08 贝壳技术有限公司 语音信息生成方法和装置、电子设备和存储介质
CN111290729A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 人机交互方法、装置与系统
CN111639223A (zh) * 2020-05-26 2020-09-08 广东小天才科技有限公司 一种用于口语练习的虚拟对象的音频生成方法及电子设备
CN111639218A (zh) * 2020-05-12 2020-09-08 广东小天才科技有限公司 一种口语训练的交互方法及终端设备
CN111639227A (zh) * 2020-05-26 2020-09-08 广东小天才科技有限公司 一种虚拟角色的口语控制方法、电子设备及存储介质
CN111724789A (zh) * 2019-03-19 2020-09-29 华为终端有限公司 语音交互的方法和终端设备
CN111816189A (zh) * 2020-07-03 2020-10-23 斑马网络技术有限公司 一种车辆用多音区语音交互方法及电子设备
CN112016285A (zh) * 2019-05-31 2020-12-01 北京京东尚科信息技术有限公司 物流信息的处理方法和处理系统
CN112035714A (zh) * 2019-06-03 2020-12-04 鲨鱼快游网络技术(北京)有限公司 一种基于角色陪伴的人机对话方法
CN112309379A (zh) * 2019-07-26 2021-02-02 北京地平线机器人技术研发有限公司 实现语音交互的方法、装置、介质以及电子设备
WO2021068467A1 (zh) * 2019-10-12 2021-04-15 百度在线网络技术(北京)有限公司 语音包的推荐方法、装置、电子设备和存储介质
CN112765971A (zh) * 2019-11-05 2021-05-07 北京火山引擎科技有限公司 文本语音的转换方法、装置、电子设备及存储介质
CN112836098A (zh) * 2021-02-01 2021-05-25 三星电子(中国)研发中心 基于多角色的对话辅助方法和装置
CN113531809A (zh) * 2021-07-05 2021-10-22 青岛海尔空调器有限总公司 用于切换空调音色的方法及系统、装置、电子设备、存储介质
CN114187429A (zh) * 2021-11-09 2022-03-15 北京百度网讯科技有限公司 虚拟形象切换方法、装置、电子设备及存储介质
CN117316143A (zh) * 2023-11-30 2023-12-29 深圳市金大智能创新科技有限公司 一种基于虚拟人进行人机交互的方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11417236B2 (en) * 2018-12-28 2022-08-16 Intel Corporation Real-time language learning within a smart space
CN112187837B (zh) * 2019-07-02 2023-01-17 腾讯科技(深圳)有限公司 基于多角色的通讯方法、装置及电子设备
CN112530418B (zh) * 2019-08-28 2024-07-19 北京声智科技有限公司 一种语音唤醒方法、装置及相关设备
CN111312280B (zh) * 2020-01-16 2023-11-07 北京百度网讯科技有限公司 用于控制语音的方法和装置
CN112734889A (zh) * 2021-02-19 2021-04-30 北京中科深智科技有限公司 一种2d角色的口型动画实时驱动方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103236259A (zh) * 2013-03-22 2013-08-07 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法
US20150326719A1 (en) * 2014-05-07 2015-11-12 International Business Machines Corporation Using an isdn message header to support time zone identification
CN105224278A (zh) * 2015-08-21 2016-01-06 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
CN105709416A (zh) * 2016-03-14 2016-06-29 上海科睿展览展示工程科技有限公司 对多用户操作游戏的个性化配音方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8024194B2 (en) * 2004-12-08 2011-09-20 Nuance Communications, Inc. Dynamic switching between local and remote speech rendering
US20120005602A1 (en) * 2010-07-02 2012-01-05 Nokia Corporation Methods and apparatuses for facilitating task switching
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
CN113470641B (zh) * 2013-02-07 2023-12-15 苹果公司 数字助理的语音触发器
US10192552B2 (en) * 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10217453B2 (en) * 2016-10-14 2019-02-26 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103236259A (zh) * 2013-03-22 2013-08-07 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法
US20150326719A1 (en) * 2014-05-07 2015-11-12 International Business Machines Corporation Using an isdn message header to support time zone identification
CN105224278A (zh) * 2015-08-21 2016-01-06 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
CN105709416A (zh) * 2016-03-14 2016-06-29 上海科睿展览展示工程科技有限公司 对多用户操作游戏的个性化配音方法及系统

Cited By (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109725798B (zh) * 2017-10-25 2021-07-27 腾讯科技(北京)有限公司 智能角色的切换方法及相关装置
CN109725798A (zh) * 2017-10-25 2019-05-07 腾讯科技(北京)有限公司 智能角色的切换方法及相关装置
CN107943771A (zh) * 2017-11-15 2018-04-20 百度在线网络技术(北京)有限公司 响应文本的生成方法、装置、处理器、及计算机可读介质
CN107943771B (zh) * 2017-11-15 2021-05-07 百度在线网络技术(北京)有限公司 响应文本的生成方法、装置、服务器、及计算机可读介质
CN107733722A (zh) * 2017-11-16 2018-02-23 百度在线网络技术(北京)有限公司 用于配置语音服务的方法和装置
CN107733722B (zh) * 2017-11-16 2021-07-20 百度在线网络技术(北京)有限公司 用于配置语音服务的方法和装置
CN108231059B (zh) * 2017-11-27 2021-06-22 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
CN108231059A (zh) * 2017-11-27 2018-06-29 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
CN108182942A (zh) * 2017-12-28 2018-06-19 福州瑞芯微电子股份有限公司 一种支持不同虚拟角色交互的方法和装置
CN109986569B (zh) * 2017-12-29 2022-08-23 微软技术许可有限责任公司 具有角色化和性格化的聊天机器人
US11361166B2 (en) 2017-12-29 2022-06-14 Microsoft Technology Licensing, Llc Characterized chatbot with personality
CN109986569A (zh) * 2017-12-29 2019-07-09 微软技术许可有限责任公司 具有角色化和性格化的聊天机器人
CN108073112B (zh) * 2018-01-19 2024-02-20 冠捷电子科技(福建)有限公司 一种具有角色扮演的智能服务型机器人
CN108073112A (zh) * 2018-01-19 2018-05-25 福建捷联电子有限公司 一种具有角色扮演的智能服务型机器人
CN110134360A (zh) * 2018-02-09 2019-08-16 阿拉的(深圳)人工智能有限公司 智能语音播报方法、播报装置、存储介质及智能音箱
CN108538297A (zh) * 2018-03-12 2018-09-14 恒玄科技(上海)有限公司 一种基于无线麦克风阵列的智能语音交互方法及交互系统
CN108538297B (zh) * 2018-03-12 2020-12-04 恒玄科技(上海)股份有限公司 一种基于无线麦克风阵列的智能语音交互方法及交互系统
CN108510989A (zh) * 2018-03-20 2018-09-07 杭州声讯网络科技有限公司 一种在电话通话过程中的智能语音交互方式
CN108922531B (zh) * 2018-07-26 2020-10-27 腾讯科技(北京)有限公司 槽位识别方法、装置、电子设备及存储介质
CN108922531A (zh) * 2018-07-26 2018-11-30 腾讯科技(深圳)有限公司 槽位识别方法、装置、电子设备及存储介质
CN109448737B (zh) * 2018-08-30 2020-09-01 百度在线网络技术(北京)有限公司 虚拟形象的创建方法、装置、电子设备与存储介质
CN109448737A (zh) * 2018-08-30 2019-03-08 百度在线网络技术(北京)有限公司 虚拟形象的创建方法、装置、电子设备与存储介质
CN108877800A (zh) * 2018-08-30 2018-11-23 出门问问信息科技有限公司 语音交互方法、装置、电子设备及可读存储介质
CN109272984A (zh) * 2018-10-17 2019-01-25 百度在线网络技术(北京)有限公司 用于语音交互的方法和装置
CN111105776A (zh) * 2018-10-26 2020-05-05 财团法人资讯工业策进会 有声播放装置及其播放方法
US11638090B2 (en) 2018-10-26 2023-04-25 Tencent Technology (Shenzhen) Company Limited Loudspeaker system, loudspeaker, and loudspeaker base
WO2020083305A1 (zh) * 2018-10-26 2020-04-30 腾讯科技(深圳)有限公司 音箱系统、音箱以及音箱底座
US11317198B2 (en) 2018-10-26 2022-04-26 Tencent Technology (Shenzhen) Company Limited Loudspeaker system, loudspeaker, and loudspeaker base
CN109256128A (zh) * 2018-11-19 2019-01-22 广东小天才科技有限公司 一种根据用户语料自动判定用户角色的方法及系统
CN109215629B (zh) * 2018-11-22 2021-01-01 Oppo广东移动通信有限公司 语音处理方法、装置及终端
CN109215629A (zh) * 2018-11-22 2019-01-15 Oppo广东移动通信有限公司 语音处理方法、装置及终端
CN109346083A (zh) * 2018-11-28 2019-02-15 北京猎户星空科技有限公司 一种智能语音交互方法及装置、相关设备及存储介质
CN111290729A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 人机交互方法、装置与系统
CN111724789A (zh) * 2019-03-19 2020-09-29 华为终端有限公司 语音交互的方法和终端设备
CN110085225B (zh) * 2019-04-24 2024-01-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN110085225A (zh) * 2019-04-24 2019-08-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN112016285A (zh) * 2019-05-31 2020-12-01 北京京东尚科信息技术有限公司 物流信息的处理方法和处理系统
CN112016285B (zh) * 2019-05-31 2023-11-07 北京京东振世信息技术有限公司 物流信息的处理方法和处理系统
CN112035714A (zh) * 2019-06-03 2020-12-04 鲨鱼快游网络技术(北京)有限公司 一种基于角色陪伴的人机对话方法
CN112035714B (zh) * 2019-06-03 2024-06-14 鲨鱼快游网络技术(北京)有限公司 一种基于角色陪伴的人机对话方法
CN110287299A (zh) * 2019-06-17 2019-09-27 浙江百应科技有限公司 一种通话中多话术语句智能切换方法
CN110349563B (zh) * 2019-07-04 2021-11-16 思必驰科技股份有限公司 用于语音对话平台的对话人设配置方法及系统
CN110349563A (zh) * 2019-07-04 2019-10-18 苏州思必驰信息科技有限公司 用于语音对话平台的对话人设配置方法及系统
CN112309379A (zh) * 2019-07-26 2021-02-02 北京地平线机器人技术研发有限公司 实现语音交互的方法、装置、介质以及电子设备
CN112309379B (zh) * 2019-07-26 2024-05-31 北京地平线机器人技术研发有限公司 实现语音交互的方法、装置、介质以及电子设备
WO2021068467A1 (zh) * 2019-10-12 2021-04-15 百度在线网络技术(北京)有限公司 语音包的推荐方法、装置、电子设备和存储介质
JP2022504002A (ja) * 2019-10-12 2022-01-13 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 音声パッケージの推薦方法、装置、電子機器および記憶媒体
JP7146961B2 (ja) 2019-10-12 2022-10-04 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 音声パッケージの推薦方法、装置、電子機器および記憶媒体
CN112765971A (zh) * 2019-11-05 2021-05-07 北京火山引擎科技有限公司 文本语音的转换方法、装置、电子设备及存储介质
CN112765971B (zh) * 2019-11-05 2023-11-17 北京火山引擎科技有限公司 文本语音的转换方法、装置、电子设备及存储介质
CN110929078A (zh) * 2019-11-08 2020-03-27 中国第一汽车股份有限公司 一种汽车语音形象换装方法、装置、设备及存储介质
CN111128121B (zh) * 2019-12-20 2021-04-30 贝壳找房(北京)科技有限公司 语音信息生成方法和装置、电子设备和存储介质
CN111128121A (zh) * 2019-12-20 2020-05-08 贝壳技术有限公司 语音信息生成方法和装置、电子设备和存储介质
CN111639218A (zh) * 2020-05-12 2020-09-08 广东小天才科技有限公司 一种口语训练的交互方法及终端设备
CN111639223B (zh) * 2020-05-26 2024-04-19 广东小天才科技有限公司 一种用于口语练习的虚拟对象的音频生成方法及电子设备
CN111639227A (zh) * 2020-05-26 2020-09-08 广东小天才科技有限公司 一种虚拟角色的口语控制方法、电子设备及存储介质
CN111639223A (zh) * 2020-05-26 2020-09-08 广东小天才科技有限公司 一种用于口语练习的虚拟对象的音频生成方法及电子设备
CN111639227B (zh) * 2020-05-26 2023-09-22 广东小天才科技有限公司 一种虚拟角色的口语控制方法、电子设备及存储介质
CN111816189A (zh) * 2020-07-03 2020-10-23 斑马网络技术有限公司 一种车辆用多音区语音交互方法及电子设备
CN111816189B (zh) * 2020-07-03 2023-12-26 斑马网络技术有限公司 一种车辆用多音区语音交互方法及电子设备
CN112836098A (zh) * 2021-02-01 2021-05-25 三星电子(中国)研发中心 基于多角色的对话辅助方法和装置
CN113531809A (zh) * 2021-07-05 2021-10-22 青岛海尔空调器有限总公司 用于切换空调音色的方法及系统、装置、电子设备、存储介质
CN114187429B (zh) * 2021-11-09 2023-03-24 北京百度网讯科技有限公司 虚拟形象切换方法、装置、电子设备及存储介质
CN114187429A (zh) * 2021-11-09 2022-03-15 北京百度网讯科技有限公司 虚拟形象切换方法、装置、电子设备及存储介质
CN117316143A (zh) * 2023-11-30 2023-12-29 深圳市金大智能创新科技有限公司 一种基于虚拟人进行人机交互的方法

Also Published As

Publication number Publication date
US11302302B2 (en) 2022-04-12
US20190027129A1 (en) 2019-01-24
CN107340991B (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN107340991A (zh) 语音角色的切换方法、装置、设备以及存储介质
WO2021036644A1 (zh) 一种基于人工智能的语音驱动动画方法和装置
WO2022052481A1 (zh) 基于人工智能的vr互动方法、装置、计算机设备及介质
WO2020024582A1 (zh) 语音合成方法及相关设备
CN111124123A (zh) 基于虚拟机器人形象的语音交互方法及装置、车载设备智能控制系统
CN107564510A (zh) 一种语音虚拟角色管理方法、装置、服务器和存储介质
CN110286756A (zh) 视频处理方法、装置、系统、终端设备及存储介质
WO2020048222A1 (zh) 音效调整方法、装置、电子设备以及存储介质
CN108597509A (zh) 智能语音交互实现方法、装置、计算机设备及存储介质
CN106804076B (zh) 一种智能家居的照明系统
CN107340865A (zh) 多模态虚拟机器人交互方法和系统
CN110400251A (zh) 视频处理方法、装置、终端设备及存储介质
CN107294837A (zh) 采用虚拟机器人进行对话交互的方法和系统
WO2021196614A1 (zh) 一种信息的交互方法、交互装置、电子设备及存储介质
CN108133707A (zh) 一种内容分享方法及系统
CN109410297A (zh) 一种用于生成虚拟化身形象的方法与装置
CN111290682A (zh) 交互方法、装置及计算机设备
KR102669100B1 (ko) 전자 장치 및 그 제어 방법
CN108882101A (zh) 一种智能音箱的播放控制方法、装置、设备及存储介质
CN108416420A (zh) 基于虚拟人的肢体交互方法及系统
CN109324688A (zh) 基于虚拟人行为标准的交互方法及系统
JP2020197695A (ja) 電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体
WO2018053918A1 (zh) 一种儿童虚拟智能设备及其操作方法
CN117370605A (zh) 一种虚拟数字人驱动方法、装置、设备和介质
CN112348932B (zh) 口型动画录制方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant