CN113783771A

CN113783771A - 一种基于微信的ai虚拟人交互方法和系统

Info

Publication number: CN113783771A
Application number: CN202111092006.2A
Authority: CN
Inventors: 孙国洋; 李一夫; 陈哲乾
Original assignee: Hangzhou Yizhi Intelligent Technology Co ltd
Current assignee: Hangzhou Yizhi Intelligent Technology Co ltd
Priority date: 2021-09-17
Filing date: 2021-09-17
Publication date: 2021-12-10

Abstract

本发明提出了一种基于微信的AI虚拟人交互系统和方法，属于AI虚拟人交互技术领域。包括企业微信PC端，其用于建立与用户微信端的语音和视频通讯；RPA控制器，其用于控制企业微信PC端的接听与结束；AI对话机器人，其用于接收并解析用户微信端的音频流，并生成虚拟语音和虚拟交互动画视频；第一虚拟声卡，其用于将企业微信PC端获取的音频流传输至AI对话机器人；第二虚拟声卡，其用于将AI对话机器人生成的音频流传输至企业微信PC端；虚拟摄像头，其用于将AI对话机器人生成的视频流传输至企业微信PC端。本发明利用微信现有的基础功能实现AI虚拟人交互，满足交互私密性，且不需要通过电话线路，降低了通话费用，可拓展性强。

Description

一种基于微信的AI虚拟人交互方法和系统

技术领域

本发明涉及AI虚拟人交互技术领域，具体涉及一种基于微信的AI虚拟人交互方法和系统。

背景技术

现有的AI虚拟人交互，基本逻辑是加载AI话术来对话，通过运营商线路进行。这种方式会受到运营商的管控，而且也会产生话费成本。

随着社会的发展，人们越来越依赖于微信进行沟通，微信自带了“视频通话”功能，可以直接通过网络流量来进行通话，不需要使用运营商线路，因此，如何基于微信自身的通话功能实现AI虚拟人交互，避开运营商线路的问题，是一种新的可发展方向。

发明内容

为了解决上述技术问题，本发明提出了一种基于微信的AI虚拟人交互方法和系统，利用微信现有的基础功能实现AI虚拟人交互，满足交互的私密性，且不需要通过电话线路，降低了通话费用，应用范围广，可拓展性强。

本发明采用以下技术方案实现：

本发明的其中一个目的在于提供一种基于微信的AI虚拟人交互系统，包括：

企业微信PC端，其安装在电脑或服务器上，用于建立与用户微信端的语音和视频通讯；

RPA控制器，其用于控制企业微信PC端的接听与结束；

AI对话机器人，其用于接收并解析用户微信端的音频流，并生成虚拟语音和虚拟交互动画视频；

第一虚拟声卡，其用于将企业微信PC端获取的音频流传输至AI对话机器人；

第二虚拟声卡，其用于将AI对话机器人生成的音频流传输至企业微信PC 端；

虚拟摄像头，其用于将AI对话机器人生成的视频流传输至企业微信PC端。

本发明的第二个目的在于提供一种上述的基于微信的AI虚拟人交互系统的交互方法，包括：

用户微信端与企业微信PC端建立好友关系；

用户通过自身的微信端发起对企业微信PC端的呼叫请求，若企业微信PC 端处于空闲状态，则RPA控制器控制企业微信PC端接听用户呼叫，由用户微信端提问的语音音频经第一虚拟声卡传输至AI对话机器人；所述的AI对话机器人生成虚拟语音和虚拟交互动画视频，分别经第二虚拟声卡和虚拟摄像头传输至企业微信PC端，实现与用户微信端的语音和视频通讯；

若企业微信PC端处于忙碌状态，则RPA控制器控制企业微信PC端发送预计等待人数信息至用户微信端；

用户微信端结束呼叫后，RPA控制器控制企业微信PC端接听下一个呼叫请求。

与现有技术相比，本发明具备的有益效果是：本发明的AI虚拟人交互基于微信的基础功能实现，由于微信的对话前提是互加好友，通话双方是可信的，不存在骚扰问题，私密性较强；交互过程使用的是网络流量，不产生话费，使用成本较低，对用户友好。本发明利用微信中基础的“视频通话”功能，投放AI虚拟人二次元动画视频实现了AI虚拟人交互，交互体验更加丰富，通用性好，易于扩展。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据一示例性实施例示出的基于微信的AI虚拟人交互系统示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本发明提出了一种基于微信的AI虚拟人交互方法和系统，一是基于微信的对话，前提是互加好友，通话双方是可信的，不存在骚扰问题。二是基于微信的对话，使用的是网络流量，不产生话费，使用成本较低，对用户比较友好。三是基于微信的“视频通话”，可以投放AI虚拟人的二次元动画视频，交互体验更加丰富。

本发明描述了如何借助于微信现有的功能，实现AI虚拟人交互。

如图1所示的基于微信的AI虚拟人交互系统，包括：

RPA控制器，其用于控制企业微信PC端的接听与结束；

虚拟摄像头，其用于将AI对话机器人生成的视频流传输至企业微信PC端。本实施例中，虚拟摄像头是一类软件的名称，可以实现视频重定向的功能，从而完成一些特殊逻辑的操作，比如对具有录像功能的软件播放特定视频等。

微信(WeChat)是腾讯公司推出的一个为智能终端提供即时通讯服务的免费应用程序，支持跨通信运营商、跨操作系统平台通过网络快速发送免费(需消耗少量网络流量)语音短信、视频、图片和文字，支持移动端和PC端。微信还推出了企业版，也就是企业微信。本发明利用了微信的基础功能实现虚拟人交互。

所述的RPA控制器，全称机器人流程自动化(Robot Process Automation)系统，它通过模仿用户在电脑的手动操作方式，实现了手动操作流程自动化。

AI对话机器人用于模仿真人一样和用户进行语音对话，对话机器人一般需要语音识别、语义理解、对话逻辑控制、语音合成等模块来工作。本实施例中，所述的AI对话机器人包括：

语音收集模块，其用于获取用户微信端提问的语音音频；

文本转换模块，其用于将用户的语音音频转换为文字语句；

意图识别模块，其用于根据意图识别模型获取文字语句所对应的意图；

对话知识库，其存储有不同意图的问题所对应的答案，用于接收识别到的意图并输出最佳答案；

TTS模块，其用于将对话知识库输出的答案转换为音频；

虚拟人动作合成模块，其用于根据答案对应的音频数据拟合虚拟人的肢体动作和五官动作，生成与音频内容相匹配的虚拟人形象视频。

本实施例中，AI对话机器人生成音频的语速、停顿、声音、模板等均可调控，不受人员、发音性别、发音人本身情绪等状态影响。

在进行交互的过程中，所述的用户微信端提问的语音音频通过用户用户端上的麦克风收集，AI对话机器人反馈的结果通过企业微信PC端发送至用户微信端。

以上所描述的系统实施例仅仅是示意性的，其中所述作为AI对话机器人说明的模块可以是或者也可以不是物理上分开的，其属于为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的模块间的相互之间的通信连接可以是通过一些接口，可以是电性或其它的形式，有特殊说明的除外。本领域技术人员也可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。

利用基于微信的AI虚拟人交互系统进行交互时，需要确定所述的企业微信 PC端与待交互的用户微信端互为好友关系。

在本发明的一项具体实施中，AI对话机器人的工作方式为：用户微信端提问的语音音频传输至语音收集模块，再经文本转换模块得到用户提问的文字语句；将文字语句作为意图识别模块的输入，根据意图识别结果从对话知识库中检索到最佳答案，并获取最佳答案对应的图表和/或文字数据；之后，利用TTS模块实现文字到语音的转换，以及利用虚拟人动作合成模块拟合虚拟人的肢体动作和五官动作，生成与音频内容相匹配的虚拟人形象视频。

本发明通过利用两个声卡实现声音重定向，分别用于将用户声音传输至AI 对话机器人，以及将AI对话机器人合成的音频传输给用户；利用虚拟摄像头实现视频重定向，将AI对话机器人合成的视频传输给用户。

为了优化资源利用，当企业微信PC端与用户微信端建立通讯后，超过预设时长未接收到用户新的互动请求时，则RPA控制器控制企业微信PC端自动结束通讯，继续接听下一个呼叫请求。

关于上述实施例中的方法，其中各个模块的布置和连接方式已经在有关该系统的实施例中进行了详细描述，此处将不做详细阐述说明。由于其基本对应于系统实施例，所以相关之处参见系统实施例的部分说明即可。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，也可通过其它的方式实现。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于微信的AI虚拟人交互系统，其特征在于，包括：

RPA控制器，其用于控制企业微信PC端的接听与结束；

第二虚拟声卡，其用于将AI对话机器人生成的音频流传输至企业微信PC端；

2.根据权利要求1所述的基于微信的AI虚拟人交互系统，其特征在于，所述的企业微信PC端与待交互的用户微信端互为好友关系。

3.根据权利要求1所述的基于微信的AI虚拟人交互系统，其特征在于，所述的AI对话机器人包括：

语音收集模块，其用于获取用户微信端提问的语音音频；

文本转换模块，其用于将用户的语音音频转换为文字语句；

TTS模块，其用于将对话知识库输出的答案转换为音频；

4.根据权利要求1所述的基于微信的AI虚拟人交互系统，其特征在于，所述的用户微信端提问的语音音频通过用户用户端上的麦克风收集。

5.一种权利要求1所述的基于微信的AI虚拟人交互系统的交互方法，其特征在于，包括：

用户微信端与企业微信PC端建立好友关系；

用户通过自身的微信端发起对企业微信PC端的呼叫请求，若企业微信PC端处于空闲状态，则RPA控制器控制企业微信PC端接听用户呼叫，由用户微信端提问的语音音频经第一虚拟声卡传输至AI对话机器人；所述的AI对话机器人生成虚拟语音和虚拟交互动画视频，分别经第二虚拟声卡和虚拟摄像头传输至企业微信PC端，实现与用户微信端的语音和视频通讯；

6.根据权利要求5所述的基于微信的AI虚拟人交互系统的交互方法，其特征在于，当企业微信PC端与用户微信端建立通讯后，超过预设时长未接收到用户新的互动请求，则RPA控制器控制企业微信PC端结束通讯。

7.根据权利要求5所述的基于微信的AI虚拟人交互系统的交互方法，其特征在于，AI对话机器人的工作方式为：用户微信端提问的语音音频传输至语音收集模块，再经文本转换模块得到用户提问的文字语句；将文字语句作为意图识别模块的输入，根据意图识别结果从对话知识库中检索到最佳答案，并获取最佳答案对应的图表和/或文字数据；之后，利用TTS模块实现文字到语音的转换，以及利用虚拟人动作合成模块拟合虚拟人的肢体动作和五官动作，生成与音频内容相匹配的虚拟人形象视频。