CN109388694A

CN109388694A - 一种用于对话系统的富文本存储及展示方法

Info

Publication number: CN109388694A
Application number: CN201811107221.3A
Authority: CN
Inventors: 张传锋; 井焜; 朱锦雷; 张汉同; 李明; 祖丕国
Original assignee: Synthesis Electronic Technology Co Ltd
Current assignee: Synthesis Electronic Technology Co Ltd
Priority date: 2018-09-21
Filing date: 2018-09-21
Publication date: 2019-02-26

Abstract

本发明公开一种用于对话系统的富文本存储及展示方法，兼顾展现内容的全面性和展现形式的美观性，通过多种知识展现形式呈现用户所需的业务知识，有效避免了单一的语音播报带来的弊端，最大限度的为客户提供了多维度的业务内容，提升了人机交互的体验效果，具有较强的实用价值和商用价值。

Description

一种用于对话系统的富文本存储及展示方法

技术领域

本发明涉及人工智能领域，尤其涉及人工智能机器人对话领域，是一种用于对话系统的富文本存储及展示方法。

背景技术

随着人工智能技术的不断成熟与国家战略的不断推进，行业服务机器人在金融、医疗、政务、税务等各个领域逐步落地应用。行业服务器机器人主要功能之一是向用户解答业务问题。多数应用过程中，机器人经过语音识别、语义理解、答案抽取等过程后，通过语音合成技术向客户播报业务答案，此过程存在诸多体验性和实用性缺陷。首先，可能周围存在嘈杂噪声，听不清语音信息播报的情况；其次，可能存在答案过长，用户无法记忆地点、电话等关键信息的情况；再次，对于可能需要扫描二维码、打开对应网站的情况无法进行操作；最后，对于无法回答的问题，无法给出相似问题的列表。

发明内容

本发明要解决的技术问题是提供一种用于对话系统的富文本存储及展示方法，通过多种知识展现形式呈现用户所需的业务知识，有效避免了单一的语音播报带来的弊端，最大限度的为客户提供了多维度的业务内容，提升了人机交互的体验效果。

为了解决所述技术问题，本发明采用的技术方案是：一种用于对话系统的富文本存储及显示方法，包括以下步骤：S01）、利用富文本采编平台录入富文本答案原始素材库，录入时，为每个知识库中的每条答案知识信息生成唯一的id标识，形成子知识条目id；S02）、利用富文本采编平台录入用户业务问题，录入时，为每个业务问题生成一个唯一ID标识；S03）、利用富文本采编平台实现用户业务问题与富文本原始素材的关联，对于每一个业务问题ID，将与其相关的子知识条目id进行关联，基于子知识条目id的集合，生成对应此业务问题的整体富文本答案ID，通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射；S04）、利用页面自适应解析模块实现富文本知识的重构与解析，对话系统在经过问题语义理解、答案抽取过程后，选取最匹配的富文本答案ID，基于富文本答案ID，将富文本答案解析为树形结构，确定每种子答案类型的数量及答案属性，通过页面自适应解析模块，自动的查找树形答案结构最匹配的页面模板，并结合答案属性局部微调整，组装为最佳模板样式；S05）、利用页面渲染模块将富文本知识展示，终端设备接收到最佳模板样式ID和富文本内容后，首先对富文本进行解析，然后将解析出的对应的子知识条目填充到模板的对应位置，并根据终端设备的尺寸做自适应调整，经过渲染流程后做最终的展示。

进一步的，所述富文本答案原始素材库包括省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库和相似问题列表。

进一步的，用户业务问题包括业务标准问句和业务相似问句。

进一步的，用户业务问题的ID标识是每个业务问题的标准问题或者通过某种方法生成的序列号。

进一步的，业务相似问句由业务工作人员在初始录入时根据业务经验录入，或者由人机交互机器人在运行过程中收集用户问句。

进一步的，每一个业务问题ID对应的各个富文本知识库的各条答案id为零个或者多个。

本发明的有益效果：本发明兼顾展现内容的全面性和展现形式的美观性，通过多种知识展现形式呈现用户所需的业务知识，有效避免了单一的语音播报带来的弊端，最大限度的为客户提供了多维度的业务内容，提升了人机交互的体验效果，具有较强的实用价值和商用价值。

附图说明

图1为富文本存储及展示的流程图；

图2为富文本在终端展示的示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种用于对话系统的富文本存储及展示，如图1所示，首先，通过富文本采编平台录入富文本知识，并实现业务问题与富文本知识的映射。其次，通过页面自适应解析模块，将答案的文本信息、超链接信息、图片信息、表格信息、flash动画信息、相似问题列表等富文本重构为指定格式，满足页面布局美观性、信息传达准确性。最后，通过页面渲染模块，借助平板、显示屏等终端，将富文本信息按照指定的格式做最终的展示。

本发明的具体步骤如下：S01）、利用富文本采编平台录入富文本答案原始素材库，录入时，为每个知识库中的每条答案知识信息生成唯一的id标识，形成子知识条目id。

本实施例中，富文本答案原始素材库包括但不限于省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库、相似问题列表。其中，省略文本库主要用于语音播报，此内容一般不宜过长；详尽文本知识库用于在界面显示，供用户了解详情，并可提供业务办理时间、地点、联系方式等不太容易长时间记忆的内容；图片库包括但不限于产品形态展示、二维码信息等；表格库包括但不限于地点列表、产品列表、联系人员列表等；超链接库包括但不限于业务办理入口及业务信息答案入口等；flash动画库包括但不限于复杂业务流程解答等；相似问题列表包括但不限于与当前问题相关的业务问题。

S02）、利用富文本采编平台录入用户业务问题，录入时，为每个业务问题生成一个唯一ID标识。

本实施例中，用户业务问题包括但不限于业务标准问句和业务相似问句。业务标准问句主要为书面表述形式，例如“办理信用卡的流程”，业务相似问句主要为口语表述形式，比如“怎么办信用卡，办信用卡得经过哪几步”。针对每个业务问题生成的ID标识可以是每个业务问题的标准问题，也可以是通过某种方法生成的序列号。对于业务相似问句，可以是在初始录入知识时业务工作人员根据业务经验录入，也可以是在机器人运行过程收集到的用户问句。

S03）、利用富文本采编平台实现用户业务问题与富文本原始素材的关联，对于每一个业务问题ID，将与其相关的的省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库、相似问题列表等子知识条目id进行关联，基于子知识条目id的集合，生成对应此业务问题的整体富文本答案ID，通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射。

本实施例中，每一个业务问题ID对应的各个富文本知识库的各条答案id为零个或者多个。

S04）、利用页面自适应解析模块实现富文本知识的重构与解析，对话系统在经过问题语义理解、答案抽取过程后，选取最匹配的富文本答案ID，基于富文本答案ID，将富文本答案解析为树形结构，确定每种子答案类型的数量及图片尺寸、超连接格式等答案属性，通过页面自适应解析模块，自动的查找树形答案结构最匹配的页面模板，并结合答案属性局部微调整，组装为最佳模板样式。

如果最后的富文本答案中包含两幅图片，一段文本，则通过自适应解析模块匹配到如图2所示形式的模板，最终将模板ID与富文本内容发送至终端。

S05）、利用页面渲染模块将富文本知识展示，平板等终端设备接收到最佳模板样式ID和富文本内容后，首先对富文本进行解析，然后将解析出的对应的子知识条目填充到模板的对应位置，并根据终端设备的尺寸做自适应调整，经过渲染流程后做最终的展示。

由以上步骤可知，本发明实现了业务问题知识与富文本答案知识的录入解耦与动态关联。同时可实现业务问题和富文本答案知识的单向增删改查，同时自适应调整映射关系。

本方法可广泛的应用于银行、医院、税务、电力、政务等大厅的行业服务机器人的业务问答展示中去，可将行业服务机器人的作用最大化、最优化。最大限度的提升客户体验，避免机器人成为摆设，切实为用户提供有价值的业务咨询服务。

对于银行大堂经理机器人，一种实施方案的具体步骤如下：

1）利用富文本采编平台录入银行高频业务富文本答案原始素材。结合大堂经理部分职责，录入的典型的银行大堂业务知识主要包括业务办理类、常规咨询类两大类问题。例如：当前在售理财产品、银行卡办理流程、银行服务公众号名称、营业网点信息等。对于在售理财产品，录入的主要知识为理财产品整体介绍信息、理财产品表格清单、理财产品经理联系方式、理财产品官网页面等。对于信用卡办理流程，主要是信用卡的办理详细流程及注意事项。对于银行服务公众号，主要涉及公众号名称及二维码信息。对于营业网点信息，主要涉及周末是否营业、地图展现详细地址等。

2）利用富文本采编平台录入银行用户常见业务问句。

对于涉及理财信息、信用卡办理办理信息、公众号信息、营业网点信息的用户问句，首先设计多个标准问句，在此基础上最大限度的整理收集相似问句。形成丰富的问句知识库。对于银行业务相似问句，在初始录入时银行工作人员根据业务经验录入一部分，也可以在机器人运行过程不断收集丰富。

3) 利用富文本采编平台实现用户业务问题与富文本原始素材的关联。

对于每一个银行业务问题ID，将与其相关的省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库等子知识条目id进行关联，同时生成对应此业务问题的整体富文本答案ID。通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射。对于理财产品，生成的答案可能只是一条热门理财信息的详细文本信息，也可以是当前全部理财信息的表格，也可以是理财信息购买的二维码信息。

4）利用页面自适应解析模块实现富文本知识的重构与解析

对话系统在经过银行业务问题的语义理解、答案抽取过程后，选取最匹配的富文本答案ID。根据富文本答案是否包含表格、是否包含图片等信息，通过页面自适应解析模块，自动的查找最匹配的页面模板，组装为模板样式，输出至终端用于最终展示。

5)利用页面渲染模块将银行业务知识富文本最终展示。

平板等终端设备接收到模板ID和富文本内容后，首先对富文本进行解析，并将对应的知识条目填充到模板的对应位置，并根据终端设备的尺寸做自适应调整，经过渲染等流程后做最终的展示。通过此种方式的展示，可最大限度的满足用户的不同信息获取需求。例如某个营业网点的地址，可根据地址信息将其在地图上展示出来，并提取必要的导航信息等。

本发明兼顾展现内容的全面性和展现形式的美观性，通过多种知识展现形式呈现用户所需的业务知识，有效避免了单一的语音播报带来的弊端，最大限度的为客户提供了多维度的业务内容，提升了人机交互的体验效果，具有较强的实用价值和商用价值。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

Claims

1.一种用于对话系统的富文本存储及显示方法，其特征在于：包括以下步骤：S01）、利用富文本采编平台录入富文本答案原始素材库，录入时，为每个知识库中的每条答案知识信息生成唯一的id标识，形成子知识条目id；S02）、利用富文本采编平台录入用户业务问题，录入时，为每个业务问题生成一个唯一ID标识；S03）、利用富文本采编平台实现用户业务问题与富文本原始素材的关联，对于每一个业务问题ID，将与其相关的子知识条目id进行关联，基于子知识条目id的集合，生成对应此业务问题的整体富文本答案ID，通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射；S04）、利用页面自适应解析模块实现富文本知识的重构与解析，对话系统在经过问题语义理解、答案抽取过程后，选取最匹配的富文本答案ID，基于富文本答案ID，将富文本答案解析为树形结构，确定每种子答案类型的数量及答案属性，通过页面自适应解析模块，自动的查找树形答案结构最匹配的页面模板，并结合答案属性局部微调整，组装为最佳模板样式；S05）、利用页面渲染模块将富文本知识展示，终端设备接收到最佳模板样式ID和富文本内容后，首先对富文本进行解析，然后将解析出的对应的子知识条目填充到模板的对应位置，并根据终端设备的尺寸做自适应调整，经过渲染流程后做最终的展示。

2.根据权利要求1所述的用于对话系统的富文本存储及显示方法，其特征在于：所述富文本答案原始素材库包括省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库和相似问题列表。

3.根据权利要求1所述的用于对话系统的富文本存储及显示方法，其特征在于：用户业务问题包括业务标准问句和业务相似问句。

4.根据权利要求1或3所述的用于对话系统的富文本存储及显示方法，其特征在于：用户业务问题的ID标识是每个业务问题的标准问题或者通过某种方法生成的序列号。

5.根据权利要求3所述的用于对话系统的富文本存储及显示方法，其特征在于：业务相似问句由业务工作人员在初始录入时根据业务经验录入，或者由人机交互机器人在运行过程中收集用户问句。

6.根据权利要求1所述的用于对话系统的富文本存储及显示方法，其特征在于：每一个业务问题ID对应的各个富文本知识库的各条答案id为零个或者多个。