CN113783771A - 一种基于微信的ai虚拟人交互方法和系统 - Google Patents

一种基于微信的ai虚拟人交互方法和系统 Download PDF

Info

Publication number
CN113783771A
CN113783771A CN202111092006.2A CN202111092006A CN113783771A CN 113783771 A CN113783771 A CN 113783771A CN 202111092006 A CN202111092006 A CN 202111092006A CN 113783771 A CN113783771 A CN 113783771A
Authority
CN
China
Prior art keywords
wechat
virtual
user
terminal
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111092006.2A
Other languages
English (en)
Inventor
孙国洋
李一夫
陈哲乾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yizhi Intelligent Technology Co ltd
Original Assignee
Hangzhou Yizhi Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yizhi Intelligent Technology Co ltd filed Critical Hangzhou Yizhi Intelligent Technology Co ltd
Priority to CN202111092006.2A priority Critical patent/CN113783771A/zh
Publication of CN113783771A publication Critical patent/CN113783771A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]

Abstract

本发明提出了一种基于微信的AI虚拟人交互系统和方法,属于AI虚拟人交互技术领域。包括企业微信PC端,其用于建立与用户微信端的语音和视频通讯;RPA控制器,其用于控制企业微信PC端的接听与结束;AI对话机器人,其用于接收并解析用户微信端的音频流,并生成虚拟语音和虚拟交互动画视频;第一虚拟声卡,其用于将企业微信PC端获取的音频流传输至AI对话机器人;第二虚拟声卡,其用于将AI对话机器人生成的音频流传输至企业微信PC端;虚拟摄像头,其用于将AI对话机器人生成的视频流传输至企业微信PC端。本发明利用微信现有的基础功能实现AI虚拟人交互,满足交互私密性,且不需要通过电话线路,降低了通话费用,可拓展性强。

Description

一种基于微信的AI虚拟人交互方法和系统
技术领域
本发明涉及AI虚拟人交互技术领域,具体涉及一种基于微信的AI虚拟人交互方法和系统。
背景技术
现有的AI虚拟人交互,基本逻辑是加载AI话术来对话,通过运营商线路进行。这种方式会受到运营商的管控,而且也会产生话费成本。
随着社会的发展,人们越来越依赖于微信进行沟通,微信自带了“视频通话”功能,可以直接通过网络流量来进行通话,不需要使用运营商线路,因此,如何基于微信自身的通话功能实现AI虚拟人交互,避开运营商线路的问题,是一种新的可发展方向。
发明内容
为了解决上述技术问题,本发明提出了一种基于微信的AI虚拟人交互方法和系统,利用微信现有的基础功能实现AI虚拟人交互,满足交互的私密性,且不需要通过电话线路,降低了通话费用,应用范围广,可拓展性强。
本发明采用以下技术方案实现:
本发明的其中一个目的在于提供一种基于微信的AI虚拟人交互系统,包括:
企业微信PC端,其安装在电脑或服务器上,用于建立与用户微信端的语音和视频通讯;
RPA控制器,其用于控制企业微信PC端的接听与结束;
AI对话机器人,其用于接收并解析用户微信端的音频流,并生成虚拟语音和虚拟交互动画视频;
第一虚拟声卡,其用于将企业微信PC端获取的音频流传输至AI对话机器人;
第二虚拟声卡,其用于将AI对话机器人生成的音频流传输至企业微信PC 端;
虚拟摄像头,其用于将AI对话机器人生成的视频流传输至企业微信PC端。
本发明的第二个目的在于提供一种上述的基于微信的AI虚拟人交互系统的交互方法,包括:
用户微信端与企业微信PC端建立好友关系;
用户通过自身的微信端发起对企业微信PC端的呼叫请求,若企业微信PC 端处于空闲状态,则RPA控制器控制企业微信PC端接听用户呼叫,由用户微信端提问的语音音频经第一虚拟声卡传输至AI对话机器人;所述的AI对话机器人生成虚拟语音和虚拟交互动画视频,分别经第二虚拟声卡和虚拟摄像头传输至企业微信PC端,实现与用户微信端的语音和视频通讯;
若企业微信PC端处于忙碌状态,则RPA控制器控制企业微信PC端发送预计等待人数信息至用户微信端;
用户微信端结束呼叫后,RPA控制器控制企业微信PC端接听下一个呼叫请求。
与现有技术相比,本发明具备的有益效果是:本发明的AI虚拟人交互基于微信的基础功能实现,由于微信的对话前提是互加好友,通话双方是可信的,不存在骚扰问题,私密性较强;交互过程使用的是网络流量,不产生话费,使用成本较低,对用户友好。本发明利用微信中基础的“视频通话”功能,投放AI虚拟人二次元动画视频实现了AI虚拟人交互,交互体验更加丰富,通用性好,易于扩展。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据一示例性实施例示出的基于微信的AI虚拟人交互系统示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明提出了一种基于微信的AI虚拟人交互方法和系统,一是基于微信的对话,前提是互加好友,通话双方是可信的,不存在骚扰问题。二是基于微信的对话,使用的是网络流量,不产生话费,使用成本较低,对用户比较友好。三是基于微信的“视频通话”,可以投放AI虚拟人的二次元动画视频,交互体验更加丰富。
本发明描述了如何借助于微信现有的功能,实现AI虚拟人交互。
如图1所示的基于微信的AI虚拟人交互系统,包括:
企业微信PC端,其安装在电脑或服务器上,用于建立与用户微信端的语音和视频通讯;
RPA控制器,其用于控制企业微信PC端的接听与结束;
AI对话机器人,其用于接收并解析用户微信端的音频流,并生成虚拟语音和虚拟交互动画视频;
第一虚拟声卡,其用于将企业微信PC端获取的音频流传输至AI对话机器人;
第二虚拟声卡,其用于将AI对话机器人生成的音频流传输至企业微信PC 端;
虚拟摄像头,其用于将AI对话机器人生成的视频流传输至企业微信PC端。本实施例中,虚拟摄像头是一类软件的名称,可以实现视频重定向的功能,从而完成一些特殊逻辑的操作,比如对具有录像功能的软件播放特定视频等。
微信(WeChat)是腾讯公司推出的一个为智能终端提供即时通讯服务的免费应用程序,支持跨通信运营商、跨操作系统平台通过网络快速发送免费(需消耗少量网络流量)语音短信、视频、图片和文字,支持移动端和PC端。微信还推出了企业版,也就是企业微信。本发明利用了微信的基础功能实现虚拟人交互。
所述的RPA控制器,全称机器人流程自动化(Robot Process Automation)系统,它通过模仿用户在电脑的手动操作方式,实现了手动操作流程自动化。
AI对话机器人用于模仿真人一样和用户进行语音对话,对话机器人一般需要语音识别、语义理解、对话逻辑控制、语音合成等模块来工作。本实施例中,所述的AI对话机器人包括:
语音收集模块,其用于获取用户微信端提问的语音音频;
文本转换模块,其用于将用户的语音音频转换为文字语句;
意图识别模块,其用于根据意图识别模型获取文字语句所对应的意图;
对话知识库,其存储有不同意图的问题所对应的答案,用于接收识别到的意图并输出最佳答案;
TTS模块,其用于将对话知识库输出的答案转换为音频;
虚拟人动作合成模块,其用于根据答案对应的音频数据拟合虚拟人的肢体动作和五官动作,生成与音频内容相匹配的虚拟人形象视频。
本实施例中,AI对话机器人生成音频的语速、停顿、声音、模板等均可调控,不受人员、发音性别、发音人本身情绪等状态影响。
在进行交互的过程中,所述的用户微信端提问的语音音频通过用户用户端上的麦克风收集,AI对话机器人反馈的结果通过企业微信PC端发送至用户微信端。
以上所描述的系统实施例仅仅是示意性的,其中所述作为AI对话机器人说明的模块可以是或者也可以不是物理上分开的,其属于为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的模块间的相互之间的通信连接可以是通过一些接口,可以是电性或其它的形式,有特殊说明的除外。本领域技术人员也可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。
利用基于微信的AI虚拟人交互系统进行交互时,需要确定所述的企业微信 PC端与待交互的用户微信端互为好友关系。
用户通过自身的微信端发起对企业微信PC端的呼叫请求,若企业微信PC 端处于空闲状态,则RPA控制器控制企业微信PC端接听用户呼叫,由用户微信端提问的语音音频经第一虚拟声卡传输至AI对话机器人;所述的AI对话机器人生成虚拟语音和虚拟交互动画视频,分别经第二虚拟声卡和虚拟摄像头传输至企业微信PC端,实现与用户微信端的语音和视频通讯;
若企业微信PC端处于忙碌状态,则RPA控制器控制企业微信PC端发送预计等待人数信息至用户微信端;
用户微信端结束呼叫后,RPA控制器控制企业微信PC端接听下一个呼叫请求。
在本发明的一项具体实施中,AI对话机器人的工作方式为:用户微信端提问的语音音频传输至语音收集模块,再经文本转换模块得到用户提问的文字语句;将文字语句作为意图识别模块的输入,根据意图识别结果从对话知识库中检索到最佳答案,并获取最佳答案对应的图表和/或文字数据;之后,利用TTS模块实现文字到语音的转换,以及利用虚拟人动作合成模块拟合虚拟人的肢体动作和五官动作,生成与音频内容相匹配的虚拟人形象视频。
本发明通过利用两个声卡实现声音重定向,分别用于将用户声音传输至AI 对话机器人,以及将AI对话机器人合成的音频传输给用户;利用虚拟摄像头实现视频重定向,将AI对话机器人合成的视频传输给用户。
为了优化资源利用,当企业微信PC端与用户微信端建立通讯后,超过预设时长未接收到用户新的互动请求时,则RPA控制器控制企业微信PC端自动结束通讯,继续接听下一个呼叫请求。
关于上述实施例中的方法,其中各个模块的布置和连接方式已经在有关该系统的实施例中进行了详细描述,此处将不做详细阐述说明。由于其基本对应于系统实施例,所以相关之处参见系统实施例的部分说明即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,也可通过其它的方式实现。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于微信的AI虚拟人交互系统,其特征在于,包括:
企业微信PC端,其安装在电脑或服务器上,用于建立与用户微信端的语音和视频通讯;
RPA控制器,其用于控制企业微信PC端的接听与结束;
AI对话机器人,其用于接收并解析用户微信端的音频流,并生成虚拟语音和虚拟交互动画视频;
第一虚拟声卡,其用于将企业微信PC端获取的音频流传输至AI对话机器人;
第二虚拟声卡,其用于将AI对话机器人生成的音频流传输至企业微信PC端;
虚拟摄像头,其用于将AI对话机器人生成的视频流传输至企业微信PC端。
2.根据权利要求1所述的基于微信的AI虚拟人交互系统,其特征在于,所述的企业微信PC端与待交互的用户微信端互为好友关系。
3.根据权利要求1所述的基于微信的AI虚拟人交互系统,其特征在于,所述的AI对话机器人包括:
语音收集模块,其用于获取用户微信端提问的语音音频;
文本转换模块,其用于将用户的语音音频转换为文字语句;
意图识别模块,其用于根据意图识别模型获取文字语句所对应的意图;
对话知识库,其存储有不同意图的问题所对应的答案,用于接收识别到的意图并输出最佳答案;
TTS模块,其用于将对话知识库输出的答案转换为音频;
虚拟人动作合成模块,其用于根据答案对应的音频数据拟合虚拟人的肢体动作和五官动作,生成与音频内容相匹配的虚拟人形象视频。
4.根据权利要求1所述的基于微信的AI虚拟人交互系统,其特征在于,所述的用户微信端提问的语音音频通过用户用户端上的麦克风收集。
5.一种权利要求1所述的基于微信的AI虚拟人交互系统的交互方法,其特征在于,包括:
用户微信端与企业微信PC端建立好友关系;
用户通过自身的微信端发起对企业微信PC端的呼叫请求,若企业微信PC端处于空闲状态,则RPA控制器控制企业微信PC端接听用户呼叫,由用户微信端提问的语音音频经第一虚拟声卡传输至AI对话机器人;所述的AI对话机器人生成虚拟语音和虚拟交互动画视频,分别经第二虚拟声卡和虚拟摄像头传输至企业微信PC端,实现与用户微信端的语音和视频通讯;
若企业微信PC端处于忙碌状态,则RPA控制器控制企业微信PC端发送预计等待人数信息至用户微信端;
用户微信端结束呼叫后,RPA控制器控制企业微信PC端接听下一个呼叫请求。
6.根据权利要求5所述的基于微信的AI虚拟人交互系统的交互方法,其特征在于,当企业微信PC端与用户微信端建立通讯后,超过预设时长未接收到用户新的互动请求,则RPA控制器控制企业微信PC端结束通讯。
7.根据权利要求5所述的基于微信的AI虚拟人交互系统的交互方法,其特征在于,AI对话机器人的工作方式为:用户微信端提问的语音音频传输至语音收集模块,再经文本转换模块得到用户提问的文字语句;将文字语句作为意图识别模块的输入,根据意图识别结果从对话知识库中检索到最佳答案,并获取最佳答案对应的图表和/或文字数据;之后,利用TTS模块实现文字到语音的转换,以及利用虚拟人动作合成模块拟合虚拟人的肢体动作和五官动作,生成与音频内容相匹配的虚拟人形象视频。
CN202111092006.2A 2021-09-17 2021-09-17 一种基于微信的ai虚拟人交互方法和系统 Pending CN113783771A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111092006.2A CN113783771A (zh) 2021-09-17 2021-09-17 一种基于微信的ai虚拟人交互方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111092006.2A CN113783771A (zh) 2021-09-17 2021-09-17 一种基于微信的ai虚拟人交互方法和系统

Publications (1)

Publication Number Publication Date
CN113783771A true CN113783771A (zh) 2021-12-10

Family

ID=78851839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111092006.2A Pending CN113783771A (zh) 2021-09-17 2021-09-17 一种基于微信的ai虚拟人交互方法和系统

Country Status (1)

Country Link
CN (1) CN113783771A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115941782A (zh) * 2023-01-09 2023-04-07 杭州实在智能科技有限公司 基于rpa与聊天机器人的消息推送方法及系统
WO2023184714A1 (zh) * 2022-03-29 2023-10-05 华为技术有限公司 驱动虚拟人说话和模型训练方法、装置、计算设备及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107294837A (zh) * 2017-05-22 2017-10-24 北京光年无限科技有限公司 采用虚拟机器人进行对话交互的方法和系统
CN109739971A (zh) * 2019-01-03 2019-05-10 浙江百应科技有限公司 一种基于微信小程序实现全双工智能语音对话的方法
CN111294463A (zh) * 2020-02-06 2020-06-16 广州市讯飞樽鸿信息技术有限公司 一种智能应答方法、系统及装置
KR20210070645A (ko) * 2019-12-05 2021-06-15 순천향대학교 산학협력단 음성을 기반으로 기기의 제어가 가능한 대화시스템 및 제어 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107294837A (zh) * 2017-05-22 2017-10-24 北京光年无限科技有限公司 采用虚拟机器人进行对话交互的方法和系统
CN109739971A (zh) * 2019-01-03 2019-05-10 浙江百应科技有限公司 一种基于微信小程序实现全双工智能语音对话的方法
KR20210070645A (ko) * 2019-12-05 2021-06-15 순천향대학교 산학협력단 음성을 기반으로 기기의 제어가 가능한 대화시스템 및 제어 방법
CN111294463A (zh) * 2020-02-06 2020-06-16 广州市讯飞樽鸿信息技术有限公司 一种智能应答方法、系统及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023184714A1 (zh) * 2022-03-29 2023-10-05 华为技术有限公司 驱动虚拟人说话和模型训练方法、装置、计算设备及系统
CN115941782A (zh) * 2023-01-09 2023-04-07 杭州实在智能科技有限公司 基于rpa与聊天机器人的消息推送方法及系统

Similar Documents

Publication Publication Date Title
CN110891124B (zh) 一种人工智能代接来电的系统
CN102017513B (zh) 用于实时网络通信的方法、实时多语种通信的方法及系统
CN112838978B (zh) 支持人机协作的实时简讯机器人的系统及方法
CN108846127A (zh) 一种语音交互方法、装置、电子设备和存储介质
CN104010267A (zh) 支持基于翻译的通信服务方法和系统和支持该服务的终端
CN109739971A (zh) 一种基于微信小程序实现全双工智能语音对话的方法
CN103081004A (zh) 用于向语音使能应用程序提供输入的方法和装置
CN109005190B (zh) 一种在网页上实现全双工语音对话和页面控制的方法
CN1954566A (zh) 用于从发送者向接收者传输消息的方法,消息系统和消息转换装置
CN113783771A (zh) 一种基于微信的ai虚拟人交互方法和系统
CN109728994B (zh) 通话方法、装置及计算机可读存储介质
CN111263014A (zh) 用于聊天机器人与人类通话的可编程智能代理机
CN112887194B (zh) 实现听障人士通话的交互方法、装置、终端及存储介质
CN111881280A (zh) 一种用于电力行业的智能人机交互系统及方法
WO2017172655A1 (en) Analysis of a facial image to extract physical and emotional characteristics of a user
CN111554280A (zh) 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务系统
KR20220109373A (ko) 발화 영상 제공 방법
CN114500757A (zh) 语音交互方法、装置、计算机设备及存储介质
CN109830232A (zh) 人机交互方法、装置和存储介质
CN111835923B (zh) 一种基于人工智能的移动式语音交互对话系统
WO2015023138A1 (ko) 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법
CN100484175C (zh) 一种会场当前说话者上报的实现方法及系统
EP1643725A1 (en) Method to manage media resources providing services to be used by an application requesting a particular set of services
CN111787169B (zh) 一种用于移动式人机协作呼叫机器人的三方通话终端
CN113691686A (zh) 一种基于微信的智能语音外呼系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211210