CN111930907A

CN111930907A - 一种通过仿真模拟人类沟通的智能互动对话引擎

Info

Publication number: CN111930907A
Application number: CN202010780948.9A
Authority: CN
Inventors: 梁宇淇; 付姝娟; 胡一博; 刘成飞; 郭昱彤; 彭成; 王蓉
Original assignee: Beijing Aia Intelligent Technology Co ltd
Current assignee: Beijing zhipai Technology Co.,Ltd.
Priority date: 2020-08-06
Filing date: 2020-08-06
Publication date: 2020-11-13

Abstract

《一种通过仿真模拟人类沟通的智能互动对话引擎》发明主要通过仿真、模拟和学习人类真实的沟通与互动，大幅提升智能对话系统的效率和质量，解决传统的对话机器人的“人工智障”问题。其核心特征在于：1、通过角色设定及大数据分析，打造具有各种鲜明个性特点的人物形象；2、通过3D建模、Unity渲染、TTS语音技术等处理智能对话系统的人物形象、表情、嘴型及动作，创造逼真的用户与真人互动对话的效果；3、通过仿真技术模拟人类的真实沟通，在对话流中引入现实生活或工作场景，大幅提升对用户意图识别的能力，准确率高达99.5％以上，让智能对话过程顺畅自然；4、使用神经网络与深度学习，不断提升智能互动对话引擎的仿真和模拟的能力。

Description

一种通过仿真模拟人类沟通的智能互动对话引擎

一、技术领域

本技术发明涉及3D建模、Unity渲染、仿真学、神经网络与深度学习，以及NLP智能对话系统等多个领域，具体为通过仿真、模拟和学习真实人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)。

二、背景技术

当前的通用智能对话系统(俗称“对话机器人”或“聊天机器人”)，主要用于智能客服、自动驾驶、无接触式服务等领域。但存在以下问题：

1、缺乏直观的人物形象，在与人的互动过程中缺乏代入感，不够亲切，难以被人们广泛接受；

2、无法准确判断人们的真实意图，经常会出现“人工智障”现象，无法满足高质量的使用体验；

3、部分使用3D人物形象的智能对话系统，缺乏实时渲染和响应能力，视觉及互动效果很差。

三、发明内容

本技术发明旨在提供一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)，具备：1)千人千面的人物角色设定；2)真实的视觉与互动体验；3)沟通与对话顺畅自然；以及4)学习和进化能力等特点，以解决上述背景技术中存在的问题。

为实现上述目的，本技术发明提供如下技术方案：一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)，具体如下：

3.1人物角色设定

首先根据原型，创建3D人物或角色的基本性格设定；其次通过分析与人的真实对话与互动过程中产生的大数据，形成脸谱化的标签云；然后借助不断丰富的标签完善和修正3D人物或角色的个性特征。

3.2视觉、听觉及互动

首先使用3D建模技术，根据人物角色设定，创建符合其个性特征的3D人物形象；其次使用Unity在云端渲染刻画3D人物角色在真实光影效果下的面部表情、嘴型及肢体动作，打造互动对话的视觉效果；第三创建和训练专属的TTS语音模型，使其具有原型人物或特有的个性化音色，打造互动对话的音频效果；然后通过推广直播推流的方式，将视觉、听觉及互动效果实时推送到各种终端设备上。

3.3沟通与对话

首先在对话流中引入真实的生活或工作场景，达成现实到数字世界的映射；其次通过仿真技术(Simulation Technology)模拟人类之间的真实沟通，大幅提升自然语义处理(NLP)时对人类意图的识别能力，目前的准确率可以高达99.5％以上。人类在与3D人物角色沟通或对话时，不会再出现像微软小冰或苹果Siri等“聊天机器人”那样的“人工智障”。

3.4学习和进化

首先对3D人物角色与人互动对话过程中的数据进行系统的分析；其次使用人工神经网络(Artifical Neural Network)与深度学习(Deep Learning)，不断提升智能互动对话引擎(Intelligent Interactive Dialogue Engine)的仿真和模拟能力，使其可以不断地学习和进化。

四、附图说明

图1：智能互动对话引擎的构成

图2：3D人物角色设定

图3：仿真互动与对话

五、具体实施方式

下面将结合本技术发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实例仅仅是本发明一部分而不是全部。基于本技术发明中的实例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例，都属于本发明保护的范围。

请参阅图1-2-3，一种通过仿真模拟人类沟通的智能互动对话引擎(IntelligentInteractive Dialogue Engine)，具体包括：

5.1人物角色设定

5.2视觉、听觉及互动

5.3沟通与对话

首先在对话流中引入真实的生活或工作场景，达成现实到数字世界的映射；其次通过仿真技术(Simulation Technology)模拟人类之间的真实沟通，大幅提升自然语义处理(NLP)时对人类意图的识别能力，目前的准确率可以高达99.5％以上。人类在与3D人物角色互动对话时，不会再出现像微软小冰或苹果Siri等“聊天机器人”那样的“人工智障”。

5.4学习和进化

该已在中国工商银行的3D数字虚拟人软件服务、成都偶邦智能科技有限公司的秒追应用等项目中得以有效的验证，取得了客户满意的效果。且可广泛应用于：1)银行、保险或证券；2)汽车与自动驾驶；3)公共出行；4)电视媒体节目互动；4)客户服务等对智能对话系统(俗称“对话机器人”或“聊天机器人”)，以满足各种无接触式服务的应用需求。

尽管已经给出和描述了本技术发明的若干实例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本技术发明的范围由所附权利要求及其等同物限定。

Claims

1.一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent InteractiveDialogue Engine)其特征在于，包含以下步骤：

A、千人千面的人物角色设定

通过角色设定及大数据分析打造具有各种鲜明个性特点的人物形象，给用户创造千人千面的沟通体验。

B、真实的视觉、听觉及互动体验

通过3D建模、Unity渲染技术及TTS(Text-To-Speech)语音技术等，处理智能对话系统的人物形象、表情、嘴型及肢体动作，创造逼真的用户与真人沟通互动对话的效果。

C、沟通与对话顺畅自然

通过仿真技术(Simulation Technology)模拟人类之间的真实沟通，在对话流之中引入现实生活或工作场景，大幅提升对用户意图识别的能力，准确率高达99.5％以上，让智能对话过程顺畅自然，彻底解决“人工智障”问题。

D、学习与进化能力

使用人工神经网络(Artifical Neural Network)与深度学习(Deep Learning)，不断提升智能互动对话引擎(Intelligent Interactive Dialogue Engine)的仿真和模拟的能力。

2.根据权利要求1所述的一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)其特征在于，所述步骤A的具体流程如下：

3.根据权利要求1所述的一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)其特征在于，所述步骤B的具体流程如下：

首先使用3D建模技术，根据人物角色设定，创建符合其个性特征的3D人物形象；其次使用Unity在云端渲染刻画3D人物角色在真实光影效果下的面部表情、嘴型及肢体动作，打造逼真的互动对话视觉效果；第三制作和训练角色专属的TTS语音模型，使其具有原型人物或特有的个性化音色，打造互动对话的音频效果；然后通过推广直播推流的方式，将视觉、听觉及互动效果实时推送到各种终端设备上。

4.根据权利要求1所述的一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)其特征在于，所述步骤C的具体流程如下：

5.根据权利要求1所述的一种通过仿真模拟人类沟通的智能互动对话引擎(Intelligent Interactive Dialogue Engine)其特征在于，所述步骤D的具体流程如下：