CN111627440A

CN111627440A - 一种基于三维虚拟人物和语音识别实现交互的学习系统

Info

Publication number: CN111627440A
Application number: CN202010449154.4A
Authority: CN
Inventors: 王旭; 宋日辉; 张雷; 廖庆春; 曲乐; 张旭东; 汪广龙; 杨曦; 岳毅然; 谭震超
Original assignee: Red Ship Technology Guangzhou Co ltd
Current assignee: Red Ship Technology Guangzhou Co ltd
Priority date: 2020-05-25
Filing date: 2020-05-25
Publication date: 2020-09-04

Abstract

本发明涉及一种基于三维虚拟人物和语音识别实现交互的学习系统，包括语音识别模块、三维动画模块、终端交互模块和云存储平台模块；终端交互模块分别与三维动画模块、语音识别模块电连接；语音识别模块分别与三维动画模块、云存储平台模块电连接；语音识别模块将终端交互模块输入的指令均转换为文字信号发送至云存储平台模块，云存储平台模块将文字信号对应的反馈信息发送至语音识别模块后转换为语音信号，并通过三维动画模块反馈至终端交互模块。系统能够根据用户的提问匹配反馈信息，并通过三维人像对反馈信息进行播放，使得交互更加接近真实的面对面交互，相比机器人交互更加人性化，交互体验的感觉更好，更能刺激用户对反馈信息的学习。

Description

一种基于三维虚拟人物和语音识别实现交互的学习系统

技术领域

本发明涉及信息分类领域，更具体地，涉及一种基于三维虚拟人物和语音识别实现交互的学习系统。

背景技术

传统上智能学习系统中，一般只会简单地提供学习材料如文字资料、音频或视频供学员阅读，而缺乏交互学习的问题，导致学员通过智能学习系统进行学习的积极性不高。

一方面，语音识别已经被运用到智能客服，导航，新闻播报，智能翻译等领域。另一方面，三维动画技术也逐渐被应用至新闻播报，公共服务等领域中。现阶段通过语音识别或三维建模实现的人机交互已经在某些领域得到应用，但在学习系统中应用的语音识别和三维建模只能实现简单的语音反馈，整体交互体验差。

发明内容

本发明为克服上述现有技术中学习系统的角度体验差的问题，提供一种基于三维虚拟人物和语音识别实现交互的学习系统，通过三维虚拟人与用户进行交流，体验感更好。

为解决上述技术问题，本发明采用的技术方案是：提供一种基于三维虚拟人物和语音识别实现交互的学习系统，包括语音识别模块、三维动画模块、终端交互模块和云存储平台模块；所述终端交互模块分别与所述三维动画模块、所述语音识别模块电连接；所述语音识别模块分别与所述三维动画模块、所述云存储平台模块电连接；所述语音识别模块将所述终端交互模块输入的指令均转换为文字信号发送至所述云存储平台模块，所述云存储平台模块将文字信号对应的反馈信息发送至所述语音识别模块后转换为语音信号，并通过所述三维动画模块反馈至所述终端交互模块。

面向用户的终端交互模块向语音识别等模块提供语音指令等输入，语音识别模块向三维动画模块提供算法反馈，三维动画模块向终端交互模块反馈交互信息，实现用户与系统之间的交互学习。

优选的，所述终端交互模块包括输入单元和输出单元；所述输入单元包括音频输入单元、触控输入单元、键盘鼠标输入单元；所述输出单元包括屏幕显示单元、播放器单元。屏幕显示单元可以为液晶的显示屏，播放器单元可以为扬声器。用户通过输入单元输入指令。反馈信息转换的语音信号通过输出单元进行播放。

优选的，所述语音识别模块通过深度神经网络结合word2vec模型，实现模糊匹配。实现多种不同提问方法的模糊匹配，即使同一问题用不同的提问方式提出，也能够得到准确的答案。

优选的，所述语音识别模块通过网络通讯访问输入的语音数据，并通过API将语音数据转化为文本数据。利用人工智能的数据分析服务或其他智能化服务，通过自然语言处理的手段挖掘文本信息，通过与云存储平台模块的交互匹配最佳反馈信息。通过算法达到自学习的效果，通过长时间多次的交互，丰富扩充语料库，提升反馈的准确率。学习具体而言意为可以设定一个模型的更新周期，在一个周期内经过多次交互积累足够多的数据，结合当前语音识别模型以更新下一代模型，如现有的循环神经网络。与此同时，云存储平台的语料库也能得以丰富

优选的，所述三维动画模块结合人脸建模和关键骨骼点捕捉建立三维人像。三维动画模块将语音识别模块发来的语音结合三维人像的口型，且口型能够与声音匹配，具体的方法可见于申请号为CN201810199537.3的“一种虚拟人物语音与口型同步的建模与控制方法”。通过结合该专利所提及的方法，三维任务的语音和口型能够同步，提升交互的良好体验感。

优选的，所述云存储平台模块是一种DaaS的云交付模型，用于存储终端产生的交互相关数据。不同租户的云信任边界互不相交，且云访问权限机制受限，保证每个数据的安全性。此外，交互终端产生的大数据将会被保存在云数据库并为更精准的交互反馈提供数据支持。

优选的，所述终端交互模块与所述云存储平台模块电连接，所述云存储平台获取终端交互模块的用户个人数据和使用数据，并在云服务器端进行统计分析生成用户画像，用户画像可以反馈到终端设备，使得用户能够在平台的帮助下充分了解自身的情况，调动主观能动性，更好地进行交互过程，提高学习效果。

与现有技术相比，有益效果是：系统能够根据用户的提问匹配反馈信息，并通过三维人像对反馈信息进行播放，使得交互更加接近真实的面对面交互，相比机器人交互更加人性化，交互体验的感觉更好，更能刺激用户对反馈信息的学习。

附图说明

图1是本发明一种基于三维虚拟人物和语音识别实现交互的学习系统的模块图；

图2是本发明一种基于三维虚拟人物和语音识别实现交互的学习系统的信息传递图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明，不能理解为对本专利的限制。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”“长”“短”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

下面通过具体实施例，并结合附图，对本发明的技术方案作进一步的具体描述：

实施例

如图1-2所示为一种基于三维虚拟人物和语音识别实现交互的学习系统的是实施例，包括语音识别模块、三维动画模块、终端交互模块和云存储平台模块；终端交互模块分别与三维动画模块、语音识别模块电连接；语音识别模块分别与三维动画模块、云存储平台模块电连接；语音识别模块将终端交互模块输入的指令均转换为文字信号发送至云存储平台模块，云存储平台模块将文字信号对应的反馈信息发送至语音识别模块后转换为语音信号，并通过三维动画模块反馈至终端交互模块。

具体的，终端交互模块包括输入单元和输出单元；输入单元包括音频输入单元、触控输入单元、键盘鼠标输入单元；输出单元包括屏幕显示单元、播放器单元。屏幕显示单元可以为液晶的显示屏，播放器单元可以为扬声器。

其中，语音识别模块通过深度神经网络结合word2vec模型，实现多种不同提问方法的模糊匹配，即使同一问题用不同的提问方式提出，也能够得到准确的答案。语音识别模块通过网络通讯访问输入的语音数据，并通过API将语音数据转化为文本数据。

具体的，三维动画模块结合人脸建模和关键骨骼点捕捉建立三维人像。三维动画模块将语音识别模块发来的语音结合三维人像的口型，且口型能够与声音匹配，具体的方法可见于申请号为CN201810199537.3的“一种虚拟人物语音与口型同步的建模与控制方法”。通过结合该专利所提及的方法，三维任务的语音和口型能够同步，提升交互的良好体验感。

另外的，云存储平台模块是一种DaaS的云交付模型，用于存储终端产生的交互相关数据。不同租户的云信任边界互不相交，且云访问权限机制受限，保证每个数据的安全性。此外，交互终端产生的大数据将会被保存在云数据库并为更精准的交互反馈提供数据支持。

终端交互模块与所述云存储平台模块电连接，云存储平台获取终端交互模块的用户个人数据和使用数据，并在云服务器端进行统计分析生成用户画像，用户画像可以反馈到终端设备。

本实施例的工作原理：面向用户的终端交互模块向语音识别等模块提供语音指令等输入，语音识别模块向三维动画模块提供算法反馈，三维动画模块向终端交互模块反馈交互信息，实现用户与系统之间的交互学习。

本实施例的有益效果：系统能够根据用户的提问匹配反馈信息，并通过三维人像对反馈信息进行播放，使得交互更加接近真实的面对面交互，相比机器人交互更加人性化，交互体验的感觉更好，通过科技带来的的交互体验变化和新鲜感，更能刺激用户对反馈信息进行学习。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于三维虚拟人物和语音识别实现交互的学习系统，包括语音识别模块、三维动画模块、终端交互模块和云存储平台模块；所述终端交互模块分别与所述三维动画模块、所述语音识别模块电连接；所述语音识别模块分别与所述三维动画模块、所述云存储平台模块电连接；所述语音识别模块将所述终端交互模块输入的指令均转换为文字信号发送至所述云存储平台模块，所述云存储平台模块将文字信号对应的反馈信息发送至所述语音识别模块后转换为语音信号，并通过所述三维动画模块反馈至所述终端交互模块。

2.根据权利要求1所述的一种基于三维虚拟人物和语音识别实现交互的学习系统，其特征在于，所述终端交互模块包括输入单元和输出单元；所述输入单元包括音频输入单元、触控输入单元、键盘鼠标输入单元；所述输出单元包括屏幕显示单元、播放器单元。

3.根据权利要求1所述的一种基于三维虚拟人物和语音识别实现交互的学习系统，其特征在于，所述语音识别模块通过深度神经网络结合word2vec模型，实现模糊匹配。

4.根据权利要求3所述的一种基于三维虚拟人物和语音识别实现交互的学习系统，其特征在于，所述语音识别模块通过网络通讯访问输入的语音数据，并通过API将语音数据转化为文本数据。

5.根据权利要求1所述的一种基于三维虚拟人物和语音识别实现交互的学习系统，其特征在于，所述三维动画模块结合人脸建模和关键骨骼点捕捉建立三维人像。

6.根据权利要求1所述的一种基于三维虚拟人物和语音识别实现交互的学习系统，其特征在于，所述云存储平台模块是一种DaaS的云交付模型，用于存储终端产生的交互相关数据。

7.根据权利要求1-6任一所述的一种基于三维虚拟人物和语音识别实现交互的学习系统，其特征在于，所述终端交互模块与所述云存储平台模块电连接，所述云存储平台获取终端交互模块的用户个人数据和使用数据，并在云服务器端进行统计分析生成用户画像。