CN106710590A - 基于虚拟现实环境的具有情感功能的语音交互系统及方法 - Google Patents

基于虚拟现实环境的具有情感功能的语音交互系统及方法 Download PDF

Info

Publication number
CN106710590A
CN106710590A CN201710101294.0A CN201710101294A CN106710590A CN 106710590 A CN106710590 A CN 106710590A CN 201710101294 A CN201710101294 A CN 201710101294A CN 106710590 A CN106710590 A CN 106710590A
Authority
CN
China
Prior art keywords
voice
module
speech
unit
emotional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710101294.0A
Other languages
English (en)
Other versions
CN106710590B (zh
Inventor
黄昌正
林正才
冀鸣
刘晓悦
叶永权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fantasy Zhuhai Technology Co ltd
Guangzhou Huantek Co ltd
Original Assignee
Guangzhou Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Science And Technology Co Ltd filed Critical Guangzhou Science And Technology Co Ltd
Priority to CN201710101294.0A priority Critical patent/CN106710590B/zh
Publication of CN106710590A publication Critical patent/CN106710590A/zh
Application granted granted Critical
Publication of CN106710590B publication Critical patent/CN106710590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种基于虚拟现实环境的具有情感功能的语音交互系统及方法,包括语音移动终端、虚拟环境终端、外部服务器,通过语音移动终端采集用户语音并进行处理,从而得到用户语音信息是控制命令或者语音交流信息,并发送至虚拟环境终端,进行相应的控制操作以及相应的情感、动作显示和语音播放,从而虚拟用户的在现实环境中的多人交流,本发明的功能脱离了对手柄的依赖,而且操控功能数量不受按键影响,操作简单,并且通过用户语音控制系统的操作,另外,通过从用户语音信息中提取用户出用户的情绪、动作信息,从而虚拟用户在现实环境中多人游戏或应用中相互交流和表达自己情感,真正实现情感交流,进一步提高了用户在虚拟环境中的体验效果。

Description

基于虚拟现实环境的具有情感功能的语音交互系统及方法
技术领域
本发明涉及一种虚拟现实环境的技术领域,尤其是一种基于虚拟现实环境的具有情感功能的语音交互系统及方法。
背景技术
虚拟现实(Virtual Reality,简称“VR”)是近年来出现的高新技术,其原理是利用电脑模拟产生一个三维空间的虚拟世界,向使用者提供关于视觉、听觉、触觉等感官的模拟,让使用者如同身临其境一般,可以及时、没有限制地观察三维空间内的事物。而交互控制领域是虚拟现实技术的重要应用方向之一,也为虚拟现实技术的快速发展起了巨大的需求牵引作用。
目前,一些科技企业已经推出了相应的虚拟现实控制设备,例如,美国Oculus公司推出的Oculus Rift、韩国三星公司推出的Gear、HTC公司推出的HTC Vive等。然而,这些虚拟现实设备的控制系统仍停留在手柄的控制方法。
中国专利201610869534.7的一种用于虚拟现实控制的交互手柄,公开一种用于虚拟现实环境的操作手柄,实现方法复杂、控制不精准、控制指令数量受限于按键个数。而且这些控制方式对于手部行动不便的人来说却无法操控;对于普通用户来说手柄控制流程也是比较复杂的,需要了解每个按键的功能才能操作。
中国专利为201610270381.4的一种基于虚拟现实VR场景的多用户语音交互方法以及装置;只是简单实现在虚拟环境的多人游戏中的语音通话交流的功能,但并不能在虚拟环境的游戏中看到游戏人物角色的表情、情态、动作等;看到游戏中的人物只是单纯固定的表情、嘴型动作在说话,在语音交流中毫无情感。
发明内容
针对现有技术的不足,本发明提供基于虚拟现实环境的具有情感功能的语音交互系统及方法,从而避免了虚拟环境中依赖于按键、传感设备而导致的操作复杂,功能受按键数量限制等问题。
本发明的技术方案为:一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:包括语音移动终端、虚拟环境终端、外部服务器,所述外部服务器分别与语音移动终端、虚拟环境终端通讯连接,所述语音移动终端与虚拟环境终端通讯连接;
所述语音移动终端包括
语音采集模块,用于采集用户的语音信号,并对采的集语音信号进行预处理;
语音识别模块,用于将预处理的语音信号转化为文本信息,并将文本信息生成相应的控制命令和参数;
语音情感特征参数提取模块,用于提取预处理后的语音信号中具有情感特征的参数;
存储模块,用于存储从外部服务器加载更新的语音识别数据、语音控制命令数据库和语音情感数据库;
无线通信模块,用于将识别出的控制命令和参数或者语音文本信息和对应的语音情感发送至虚拟环境终端,以及用于与外部服务器通讯连接,从而将外部服务器中相应的数据包加载更新到存储模块中;
处理器,用于处理采集的用户语音信息、或者发送更新命令至外部服务器加载更新存储模块储存的数据库;
所述处理器分别与语音采集模块、语音识别模块、语音情感特征参数提取模块、存储模块、无线通信模块连接;
所述语音采集模块与语音识别模块连接,所述语音采集模块还与语音情感特征参数提取模块连接,语音情感特征参数提取模块提取出来的情感特征分别与对应的语音识别模块识别出来的语音文本信息相映射;
所述存储模块分别与语音识别模块和语音情感特征参数提取模块连接;
所述虚拟环境终端包括
存储单元,用于存储从外部服务器加载更新的虚拟人物情感表情和动作的模型库、语音情感对应的语调和语速数据库;
语音播放模块,用于播放接收到的语音文本信息;
显示模块,用于展示虚拟人物语音表达的情感表情和动作;
通信模块,用来与语音移动终端通信,以及与外部服务器通讯连接,从而将外部服务器中相应的数据包加载更新到存储单元中;
所述存储单元分别与语音播放模块、显示模块连接。
所述的语音采集模块主要为麦克风。
所述的处理器为STM32F407芯片
所述的语音识别模块包括语音特征提取单元、语音特征比较单元、比较结果输出单元,所述语音特征提取单元与语音特征比较单元连接,所述语音特征比较单元与比较结果输出单元连接。
所述语音情感特征参数提取模块包括情感特征提取单元、情感特征比较单元、情感特征输出单元,所述情感特征提取单元与情感特征比较单元连接,所述情感特征比较单元与情感特征输出单元连接。
所述语音播放模块包括语调匹配单元、语音播放单元,所述语调匹配单元与语音播放单元连接。
所述显示模块包括动作匹配单元、显示单元,所述动作匹配单元与显示单元连接。
一种基于虚拟现实环境的具有情感功能的语音交互方法,包括以下步骤:
语音移动终端与虚拟环境终端进行连接,连接成功后,语音移动终端的处理器、虚拟环境终端分别发送数据库版本查询命令至外部服务器,查询语音移动终端的存储模块中存储的语音识别数据、语音控制命令数据库和语音情感数据库的版本、以及虚拟环境终端的存储单元中存储的虚拟人物情感表情和动作的模型库、语音情感对应的语调和语速数据库的版本是否与外部服务器中的一致,若不一致则从外部服务器加载更新相应最新版本的数据到相应的存储模块、存储单元中,从而使存储模块与存储单元中的数据为最新状态;
语音采集模块采集用户的语音信号,并将采集的语音信号进行滤波、量化等预处理后发送至语音识别模块与语音情感特征参数提取模块;
语音识别模块结合存储模块中存储的语音识别数据将语音信号转换为文本信息形式,将文本信息与语音控制命令数据库中的命令数据进行匹配是否为控制命令;如果是控制命令则生成相应的控制命令和参数,并输出至虚拟环境终端进行相应的控制操作;
如果不是控制命令,则为语音交流信息,则通过语音情感特征参数提取模块分析预处理后的语音信号的波形,并提取具有情感特征的参数,将提取出来的具有情感特征的参数与语音情感数据库的情绪数据进行匹配,从而得出相应的情感特征,然后将该情感特征信息映射对应词语或语句,并将情感特征、以及该情感特征信息映射对应词语或语句输送至虚拟环境终端,
虚拟环境终端的动作匹配单元将接收到的情感特征与存储单元中的虚拟人物情感表情和动作的模型库进行匹配,得到该情感特征所对应的情感表情和动作,通过显示单元显示相应的情感表情和动作;语调匹配单元将情感特征对应的词语或语句与语音情感对应的语调和语速数据库中的数据进行匹配,从而得到该词语或语句对应的语调和语速,通过语音播放单元播放相对应的具有语调和语速的语音交流信息,通过语音播放模块与显示模块同步播放,从而虚拟用户的在现实环境中的多人交流。
本发明的有益效果为:系统功能脱离了对手柄的依赖,而且数量不受按键影响,操作简单,并且通过用户语音控制系统的操作,另外,通过从用户语音信息中提取用户出用户的情绪、动作信息,并通过相应的通过语音播放模块与显示模块同步播放,从而虚拟用户在现实环境中多人游戏或应用中相互交流和表达自己情感,真正实现情感交流,进一步提高了用户在虚拟环境中的体验效果。
附图说明
图1为本发明系统框架图;
图2为本发明的流程图;
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
如图1和图2所示,一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:包括语音移动终端、虚拟环境终端、外部服务器,所述外部服务器分别与语音移动终端、虚拟环境终端通讯连接,所述语音移动终端与虚拟环境终端通讯连接;
所述语音移动终端包括
语音采集模块,用于采集用户的语音信号,并对采集语音信号进行预处理;
语音识别模块,用于将预处理的语音信号转化为文本信息,并将文本信息生成相应的控制命令和参数;
语音情感特征参数提取模块,用于提取预处理后的语音信号中具有情感特征的参数;
存储模块,用于存储从外部服务器加载更新的语音识别数据、语音控制命令数据库和语音情感数据库;
无线通信模块,用于将识别出的控制命令和参数或者语音文本信息和对应的语音情感发送至虚拟环境终端,以及用于与外部服务器通讯连接,从而将外部服务器中相应的数据包加载更新到存储模块中;
处理器,用于处理采集的用户语音信息、或者发送更新命令至外部服务器加载更新存储模块储存的数据库;
所述处理器分别与语音采集模块、语音识别模块、语音情感特征参数提取模块、存储模块、无线通信模块连接;
所述语音采集模块与语音识别模块连接,所述语音采集模块还与语音情感特征参数提取模块连接,语音情感特征参数提取模块提取出来的情感特征分别与对应的语音识别模块识别出来的语音文本信息相映射;
所述存储模块分别与语音识别模块和语音情感特征参数提取模块连接;
所述虚拟环境终端包括
存储单元,用于存储从外部服务器加载更新的虚拟人物情感表情和动作的模型库、语音情感对应的语调和语速数据库;
语音播放模块,用于播放接收到的语音文本信息;
显示模块,用于展示虚拟人物语音表达的情感表情和动作;
通信模块,用来与语音移动终端通信,以及与外部服务器通讯连接,从而将外部服务器中相应的数据包加载更新到存储单元中;
所述存储单元分别与语音播放模块、显示模块连接。
所述的语音采集模块主要为麦克风。
所述的处理器为STM32F407芯片。
所述的语音识别模块包括语音特征提取单元、语音特征比较单元、比较结果输出单元,所述语音特征提取单元与语音特征比较单元连接,所述语音特征比较单元与比较结果输出单元连接。
所述语音情感特征参数提取模块包括情感特征提取单元、情感特征比较单元、情感特征输出单元,所述情感特征提取单元与情感特征比较单元连接,所述情感特征比较单元与情感特征输出单元连接。
所述语音播放模块包括语调匹配单元、语音播放单元,所述语调匹配单元与语音播放单元连接。
所述显示模块包括动作匹配单元、显示单元,所述动作匹配单元与显示单元连接。
一种基于虚拟现实环境的具有情感功能的语音交互方法,包括以下步骤:
语音移动终端与虚拟环境终端进行连接,连接成功后,语音移动终端的处理器、虚拟环境终端分别发送数据库版本查询命令至外部服务器,查询语音移动终端的存储模块中存储的语音识别数据、语音控制命令数据库和语音情感数据库的版本、以及虚拟环境终端的存储单元中存储的虚拟人物情感表情和动作的模型库、语音情感对应的语调和语速数据库的版本是否与外部服务器中的一致,若不一致则从外部服务器加载更新相应最新版本的数据到相应的存储模块、存储单元中,从而使存储模块与存储单元中的数据为最新状态;
语音采集模块采集用户的语音信号,并将采集的语音信号进行滤波、量化等预处理后发送至语音识别模块、语音情感特征参数提取模块;
语音识别模块结合存储模块中存储的语音识别数据将语音信号转换为文本信息形式,将文本信息与语音控制命令数据库中的命令数据进行匹配是否为控制命令;如果是控制命令则生成相应的控制命令和参数,并输出至虚拟环境终端进行相应的控制操作,具体的控制操作可以为系统菜单相关操作,例如“菜单”,“返回”,“退出”,“开始”,“确定”,“取消”等等;还可以为人机交互操作,例如在游戏中的相关操空,“前进50米”,“向左转60度”,“以10米每秒的速度向右移动30秒”等操作;
如果不是控制命令,则为语音交流信息,则通过语音情感特征参数提取模块分析预处理后的语音信号的波形,并提取具有情感特征的参数,将提取出来的具有情感特征的参数与语音情感数据库的情绪数据进行匹配,从而得出相应的情感特征,然后将该情感特征信息映射对应词语或语句,并将情感特征、以及该情感特征信息映射对应词语或语句输送至虚拟环境终端,
虚拟环境终端的动作匹配单元将接收到的情感特征与存储单元中的虚拟人物情感表情和动作的模型库进行匹配,得到该情感特征所对应的情感表情和动作,通过显示单元显示相应的情感表情和动作;语调匹配单元将情感特征对应的词语或语句与语音情感对应的语调和语速数据库中的数据进行匹配,从而得到该词语或语句对应的语调和语速,通过语音播放单元播放相对应的具有语调和语速的语音交流信息,通过语音播放模块与显示模块同步播放,从而虚拟用户的在现实环境中的多人交流。
所述语音情感数据库中的语音情感数据主要是利用现有技术中的分类器训练输出的,通过先收集情感声音数据作为训练样本;然后对其提取MFCC参数、共振峰以及过零率三个特征参数并进行特征组合,建立高斯混合模型;对高斯混合模型按情感类别分类,形成各个情感类别的声学模型数据库;当收到具有情感化的语音数据时,对其提取特征参数,然后与各个情绪类别下的声学模型相匹配,最后得到该语音的情感信息。
所述虚拟人物情感表情、动作模型库主要是通过3D建模软件建立各类情感对应的表情和一些夸张的情绪习惯性作出的动作的3D人物模型。
所述语音情感数据库中的语音情感数据主要是利用现有技术中的分类器训练输出的,通过先收集情感声音数据作为训练样本;然后对其提取MFCC参数、共振峰以及过零率三个特征参数并进行特征组合,建立高斯混合模型;对高斯混合模型按情感类别分类,形成各个情感类别的声学模型数据库;当收到具有情感化的语音数据时,对其提取特征参数,然后与各个情绪类别下的声学模型相匹配,最后得到该语音的情感信息。
所述虚拟人物情感表情、动作模型库主要是通过3D建模软件建立各类情感对应的表情和一些夸张的情绪习惯性作出的动作的3D人物模型。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (8)

1.一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:包括语音移动终端、虚拟环境终端、外部服务器,所述外部服务器分别与语音移动终端、虚拟环境终端通讯连接,所述语音移动终端与虚拟环境终端通讯连接;
所述语音移动终端包括
语音采集模块,用于采集用户的语音信号,并对采集的语音信号进行预处理;
语音识别模块,用于将预处理的语音信号转化为文本信息,并将文本信息生成相应的控制命令和参数;
语音情感特征参数提取模块,用于提取语音采集模块预处理后的语音信号中具有情感特征的参数;
存储模块,用于存储从外部服务器加载更新的语音识别数据、语音控制命令数据库和语音情感数据库;
无线通信模块,用于将识别出的控制命令和参数或者语音文本信息和对应的语音情感发送至虚拟环境终端,以及用于与外部服务器通讯连接,从而将外部服务器中相应的数据包加载更新到存储模块中;
处理器,用于处理采集的用户语音信息、或者发送更新命令至外部服务器加载更新存储模块储存的数据;
所述处理器分别与语音采集模块、语音识别模块、语音情感特征参数提取模块、存储模块、无线通信模块连接;
所述语音采集模块分别与语音识别模块、语音情感特征参数提取模块连接,语音情感特征参数提取模块提取出来的情感特征分别与对应的语音识别模块识别出来的语音文本信息相映射;
所述存储模块分别与语音识别模块和语音情感特征参数提取模块连接;
所述虚拟环境终端包括
存储单元,用于存储从外部服务器加载更新的虚拟人物情感表情和动作的模型库、语音情感对应的语调和语速数据库;
语音播放模块,用于播放接收到的语音文本信息;
显示模块,用于展示虚拟人物语音表达的情感表情和动作;
通信模块,用来与语音移动终端通信,以及与外部服务器通讯连接,从而将外部服务器中相应的数据包加载更新到存储单元中;
所述存储单元分别与语音播放模块、显示模块连接。
2.根据权利要求1所述的一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:所述的语音采集模块主要为麦克风。
3.根据权利要求1所述的一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:所述的处理器为STM32F407芯片。
4.根据权利要求1所述的一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:所述的语音识别模块包括语音特征提取单元、语音特征比较单元、比较结果输出单元,所述语音特征提取单元与语音特征比较单元连接,所述语音特征比较单元与比较结果输出单元连接。
5.根据权利要求1所述的一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:所述语音情感特征参数提取模块包括情感特征提取单元、情感特征比较单元、情感特征输出单元,所述情感特征提取单元与情感特征比较单元连接,所述情感特征比较单元与情感特征输出单元连接。
6.根据权利要求1所述的一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:所述语音播放模块包括语调匹配单元、语音播放单元,所述语调匹配单元与语音播放单元连接。
7.根据权利要求1所述的一种基于虚拟现实环境的具有情感功能的语音交互系统,其特征在于:所述显示模块包括动作匹配单元、显示单元,所述动作匹配单元与显示单元连接。
8.根据权利要求1-7中任一项所述的基于虚拟现实环境的具有情感功能的语音交互方法,其特征在于:包括以下步骤:
语音移动终端与虚拟环境终端进行连接,连接成功后,语音移动终端的处理器、虚拟环境终端分别发送数据库版本查询命令至外部服务器,查询语音移动终端的存储模块中存储的语音识别数据、语音控制命令数据库和语音情感数据库的版本、以及虚拟环境终端的存储单元中存储的虚拟人物情感表情和动作的模型库、语音情感对应的语调和语速数据库的版本是否与外部服务器中的一致,若不一致则从外部服务器加载更新相应最新版本的数据到相应的存储模块、存储单元中,从而使存储模块与存储单元中的数据为最新状态;
语音采集模块采集用户的语音信号,并将采集的语音信号进行滤波、量化等预处理后发送至语音识别模块与语音情感特征参数提取模块;
语音识别模块结合存储模块中存储的语音识别数据将预处理后的语音信号转换为文本信息形式,并将文本信息与语音控制命令数据库中的命令数据进行匹配是否为控制命令;如果是控制命令则生成相应的控制命令和参数并输出至虚拟环境终端进行相应的控制操作;
如果不是控制命令,则为语音交流信息,语音情感特征参数提取模块分析预处理后的语音信号的波形,并提取具有情感特征的参数,将提取出来的具有情感特征的参数与语音情感数据库的情绪数据进行匹配,从而得出相应的情感特征,然后将该情感特征信息映射对应词语或语句,并将情感特征、以及该情感特征信息映射对应词语或语句输送至虚拟环境终端,
虚拟环境终端的动作匹配单元将接收到的情感特征与存储单元中的虚拟人物情感表情和动作的模型库进行匹配,得到该情感特征所对应的情感表情和动作,通过显示单元显示相应的情感表情和动作;语调匹配单元将情感特征对应的词语或语句与语音情感对应的语调和语速数据库中的数据进行匹配,从而得到该词语或语句对应的语调和语速,通过语音播放单元播放相对应的具有语调和语速的语音交流信息,通过语音播放模块与显示模块同步播放,从而虚拟用户的在现实环境中的多人交流。
CN201710101294.0A 2017-02-24 2017-02-24 基于虚拟现实环境的具有情感功能的语音交互系统及方法 Active CN106710590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710101294.0A CN106710590B (zh) 2017-02-24 2017-02-24 基于虚拟现实环境的具有情感功能的语音交互系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710101294.0A CN106710590B (zh) 2017-02-24 2017-02-24 基于虚拟现实环境的具有情感功能的语音交互系统及方法

Publications (2)

Publication Number Publication Date
CN106710590A true CN106710590A (zh) 2017-05-24
CN106710590B CN106710590B (zh) 2023-05-30

Family

ID=58917109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710101294.0A Active CN106710590B (zh) 2017-02-24 2017-02-24 基于虚拟现实环境的具有情感功能的语音交互系统及方法

Country Status (1)

Country Link
CN (1) CN106710590B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106992004A (zh) * 2017-03-06 2017-07-28 华为技术有限公司 一种调整视频的方法及终端
CN107577661A (zh) * 2017-08-07 2018-01-12 北京光年无限科技有限公司 一种针对虚拟机器人的交互输出方法以及系统
CN107998658A (zh) * 2017-12-01 2018-05-08 苏州蜗牛数字科技股份有限公司 Vr游戏中实现3d角色口型语音聊天系统及方法
CN108846887A (zh) * 2018-06-20 2018-11-20 首都师范大学 Vr视频的生成方法及装置
CN108961431A (zh) * 2018-07-03 2018-12-07 百度在线网络技术(北京)有限公司 人物表情的生成方法、装置及终端设备
CN108986191A (zh) * 2018-07-03 2018-12-11 百度在线网络技术(北京)有限公司 人物动作的生成方法、装置及终端设备
CN108986804A (zh) * 2018-06-29 2018-12-11 北京百度网讯科技有限公司 人机交互处理方法、装置、用户终端、处理服务器及系统
CN109087644A (zh) * 2018-10-22 2018-12-25 奇酷互联网络科技(深圳)有限公司 电子设备及其语音助手的交互方法、具有存储功能的装置
CN109460148A (zh) * 2018-10-24 2019-03-12 北京实境智慧科技有限公司 一种vr语音交互系统及其交互方法
CN109701281A (zh) * 2018-12-10 2019-05-03 广州玖的数码科技有限公司 多人vr游戏成员之间的选择和信息提示装置及方法
CN109712627A (zh) * 2019-03-07 2019-05-03 深圳欧博思智能科技有限公司 一种使用语音触发虚拟人物表情及口型动画的语音系统
CN109840009A (zh) * 2017-11-28 2019-06-04 浙江思考者科技有限公司 一种智能真人广告屏交互系统及实现方法
CN109847348A (zh) * 2018-12-27 2019-06-07 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
CN109961152A (zh) * 2019-03-14 2019-07-02 广州多益网络股份有限公司 虚拟偶像的个性化互动方法、系统、终端设备及存储介质
CN110070879A (zh) * 2019-05-13 2019-07-30 吴小军 一种基于变声技术制作智能表情及声感游戏的方法
CN110488973A (zh) * 2019-07-23 2019-11-22 清华大学 一种虚拟互动留言系统及方法
CN111091810A (zh) * 2019-12-19 2020-05-01 佛山科学技术学院 基于语音信息的vr游戏人物表情控制方法及存储介质
CN111199732A (zh) * 2018-11-16 2020-05-26 深圳Tcl新技术有限公司 一种基于情感的语音交互方法、存储介质及终端设备
CN111292737A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN111339442A (zh) * 2020-02-25 2020-06-26 北京声智科技有限公司 线上好友互动方法及装置
CN111475023A (zh) * 2020-04-07 2020-07-31 四川虹美智能科技有限公司 基于语音情绪识别的冰箱控制方法及装置
CN111939558A (zh) * 2020-08-19 2020-11-17 北京中科深智科技有限公司 一种实时语音驱动虚拟人物动作的方法和系统
CN112221162A (zh) * 2020-10-15 2021-01-15 蒋海斌 基于人工智能识别的网络游戏交互方法及智能游戏平台
CN113253836A (zh) * 2021-03-22 2021-08-13 联通沃悦读科技文化有限公司 一种基于人工智能与虚拟现实的教学方法及系统
CN114356068A (zh) * 2020-09-28 2022-04-15 北京搜狗智能科技有限公司 一种数据处理方法、装置和电子设备
CN117219046A (zh) * 2023-10-24 2023-12-12 广东广信通信服务有限公司 一种交互语音情感控制方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981614A (zh) * 2008-04-08 2011-02-23 株式会社Ntt都科摩 媒体处理服务器设备及其媒体处理方法
CN103414720A (zh) * 2013-08-19 2013-11-27 苏州跨界软件科技有限公司 交互式3d语音服务方法
CN103428293A (zh) * 2013-08-19 2013-12-04 苏州跨界软件科技有限公司 交互式3d语音服务系统
CN104102346A (zh) * 2014-07-01 2014-10-15 华中科技大学 一种家用信息采集和用户情感识别设备及其工作方法
CN104538043A (zh) * 2015-01-16 2015-04-22 北京邮电大学 一种通话中实时情感提示装置
CN105632251A (zh) * 2016-01-20 2016-06-01 华中师范大学 具有语音功能的3d虚拟教师系统及其方法
CN105895101A (zh) * 2016-06-08 2016-08-24 国网上海市电力公司 用于电力智能辅助服务系统的语音处理设备及处理方法
CN106354472A (zh) * 2016-11-02 2017-01-25 广州幻境科技有限公司 一种用于虚拟现实环境中声音的控制方法及其系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981614A (zh) * 2008-04-08 2011-02-23 株式会社Ntt都科摩 媒体处理服务器设备及其媒体处理方法
CN103414720A (zh) * 2013-08-19 2013-11-27 苏州跨界软件科技有限公司 交互式3d语音服务方法
CN103428293A (zh) * 2013-08-19 2013-12-04 苏州跨界软件科技有限公司 交互式3d语音服务系统
CN104102346A (zh) * 2014-07-01 2014-10-15 华中科技大学 一种家用信息采集和用户情感识别设备及其工作方法
CN104538043A (zh) * 2015-01-16 2015-04-22 北京邮电大学 一种通话中实时情感提示装置
CN105632251A (zh) * 2016-01-20 2016-06-01 华中师范大学 具有语音功能的3d虚拟教师系统及其方法
CN105895101A (zh) * 2016-06-08 2016-08-24 国网上海市电力公司 用于电力智能辅助服务系统的语音处理设备及处理方法
CN106354472A (zh) * 2016-11-02 2017-01-25 广州幻境科技有限公司 一种用于虚拟现实环境中声音的控制方法及其系统

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106992004A (zh) * 2017-03-06 2017-07-28 华为技术有限公司 一种调整视频的方法及终端
CN106992004B (zh) * 2017-03-06 2020-06-26 华为技术有限公司 一种调整视频的方法及终端
CN107577661B (zh) * 2017-08-07 2020-12-11 北京光年无限科技有限公司 一种针对虚拟机器人的交互输出方法以及系统
CN107577661A (zh) * 2017-08-07 2018-01-12 北京光年无限科技有限公司 一种针对虚拟机器人的交互输出方法以及系统
CN109840009A (zh) * 2017-11-28 2019-06-04 浙江思考者科技有限公司 一种智能真人广告屏交互系统及实现方法
CN107998658A (zh) * 2017-12-01 2018-05-08 苏州蜗牛数字科技股份有限公司 Vr游戏中实现3d角色口型语音聊天系统及方法
CN108846887A (zh) * 2018-06-20 2018-11-20 首都师范大学 Vr视频的生成方法及装置
CN108986804A (zh) * 2018-06-29 2018-12-11 北京百度网讯科技有限公司 人机交互处理方法、装置、用户终端、处理服务器及系统
CN108986191A (zh) * 2018-07-03 2018-12-11 百度在线网络技术(北京)有限公司 人物动作的生成方法、装置及终端设备
CN108961431A (zh) * 2018-07-03 2018-12-07 百度在线网络技术(北京)有限公司 人物表情的生成方法、装置及终端设备
CN108986191B (zh) * 2018-07-03 2023-06-27 百度在线网络技术(北京)有限公司 人物动作的生成方法、装置及终端设备
CN109087644A (zh) * 2018-10-22 2018-12-25 奇酷互联网络科技(深圳)有限公司 电子设备及其语音助手的交互方法、具有存储功能的装置
CN109087644B (zh) * 2018-10-22 2021-06-25 奇酷互联网络科技(深圳)有限公司 电子设备及其语音助手的交互方法、具有存储功能的装置
CN109460148A (zh) * 2018-10-24 2019-03-12 北京实境智慧科技有限公司 一种vr语音交互系统及其交互方法
CN111199732A (zh) * 2018-11-16 2020-05-26 深圳Tcl新技术有限公司 一种基于情感的语音交互方法、存储介质及终端设备
CN111292737A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN109701281A (zh) * 2018-12-10 2019-05-03 广州玖的数码科技有限公司 多人vr游戏成员之间的选择和信息提示装置及方法
CN109847348A (zh) * 2018-12-27 2019-06-07 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
CN109847348B (zh) * 2018-12-27 2022-09-27 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
CN109712627A (zh) * 2019-03-07 2019-05-03 深圳欧博思智能科技有限公司 一种使用语音触发虚拟人物表情及口型动画的语音系统
CN109961152B (zh) * 2019-03-14 2021-03-02 广州多益网络股份有限公司 虚拟偶像的个性化互动方法、系统、终端设备及存储介质
CN109961152A (zh) * 2019-03-14 2019-07-02 广州多益网络股份有限公司 虚拟偶像的个性化互动方法、系统、终端设备及存储介质
CN110070879A (zh) * 2019-05-13 2019-07-30 吴小军 一种基于变声技术制作智能表情及声感游戏的方法
CN110488973A (zh) * 2019-07-23 2019-11-22 清华大学 一种虚拟互动留言系统及方法
CN111091810A (zh) * 2019-12-19 2020-05-01 佛山科学技术学院 基于语音信息的vr游戏人物表情控制方法及存储介质
CN111339442A (zh) * 2020-02-25 2020-06-26 北京声智科技有限公司 线上好友互动方法及装置
CN111475023A (zh) * 2020-04-07 2020-07-31 四川虹美智能科技有限公司 基于语音情绪识别的冰箱控制方法及装置
CN111939558A (zh) * 2020-08-19 2020-11-17 北京中科深智科技有限公司 一种实时语音驱动虚拟人物动作的方法和系统
CN114356068A (zh) * 2020-09-28 2022-04-15 北京搜狗智能科技有限公司 一种数据处理方法、装置和电子设备
CN114356068B (zh) * 2020-09-28 2023-08-25 北京搜狗智能科技有限公司 一种数据处理方法、装置和电子设备
CN112221162A (zh) * 2020-10-15 2021-01-15 蒋海斌 基于人工智能识别的网络游戏交互方法及智能游戏平台
CN112221162B (zh) * 2020-10-15 2021-05-14 武汉卧友网络科技有限公司 基于人工智能识别的网络游戏交互方法及智能游戏平台
CN113253836A (zh) * 2021-03-22 2021-08-13 联通沃悦读科技文化有限公司 一种基于人工智能与虚拟现实的教学方法及系统
CN117219046A (zh) * 2023-10-24 2023-12-12 广东广信通信服务有限公司 一种交互语音情感控制方法及系统

Also Published As

Publication number Publication date
CN106710590B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN106710590A (zh) 基于虚拟现实环境的具有情感功能的语音交互系统及方法
CN206711600U (zh) 基于虚拟现实环境的具有情感功能的语音交互系统
CN110427472A (zh) 智能客服匹配的方法、装置、终端设备及存储介质
CN110531860B (zh) 一种基于人工智能的动画形象驱动方法和装置
CN110288077B (zh) 一种基于人工智能的合成说话表情的方法和相关装置
CN107203953B (zh) 一种基于互联网、表情识别和语音识别的教学系统及其实现方法
CN111833418B (zh) 动画交互方法、装置、设备以及存储介质
CN104461525B (zh) 一种可自定义的智能咨询平台生成系统
CN108231070A (zh) 语音对话装置、语音对话方法、语音对话程序以及机器人
CN107797663A (zh) 基于虚拟人的多模态交互处理方法及系统
CN109271018A (zh) 基于虚拟人行为标准的交互方法及系统
CN106200886A (zh) 一种基于语言交互操控的移动智能玩具及玩具使用方法
CN108345385A (zh) 虚拟陪跑人物建立与交互的方法及装置
CN110413841A (zh) 多态交互方法、装置、系统、电子设备及存储介质
CN108492817A (zh) 一种基于虚拟偶像的歌曲数据处理方法及演唱交互系统
CN107831905A (zh) 一种基于全息投影设备的虚拟形象交互方法及系统
CN109324688A (zh) 基于虚拟人行为标准的交互方法及系统
CN204650422U (zh) 一种基于语言交互操控的移动智能玩具
CN103611294B (zh) 一种棋牌类游戏语音控制装置及其控制方法
CN108052250A (zh) 基于多模态交互的虚拟偶像演绎数据处理方法及系统
CN108942919A (zh) 一种基于虚拟人的交互方法及系统
CN112837401B (zh) 一种信息处理方法、装置、计算机设备及存储介质
CN109343695A (zh) 基于虚拟人行为标准的交互方法及系统
CN108416420A (zh) 基于虚拟人的肢体交互方法及系统
US20230047858A1 (en) Method, apparatus, electronic device, computer-readable storage medium, and computer program product for video communication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230619

Address after: 510635 self made room 01-011, third floor, No. 721, Tianhe North Road, Tianhe District, Guangzhou City, Guangdong Province (office only)

Patentee after: GUANGZHOU HUANTEK Co.,Ltd.

Patentee after: Fantasy (Zhuhai) Technology Co.,Ltd.

Address before: Room 01, 17 / F, Xingguang Yingjing, 119 Shuiyin Road, Yuexiu District, Guangzhou City, Guangdong Province 510075

Patentee before: GUANGZHOU HUANTEK Co.,Ltd.

TR01 Transfer of patent right