CN109388694A - 一种用于对话系统的富文本存储及展示方法 - Google Patents
一种用于对话系统的富文本存储及展示方法 Download PDFInfo
- Publication number
- CN109388694A CN109388694A CN201811107221.3A CN201811107221A CN109388694A CN 109388694 A CN109388694 A CN 109388694A CN 201811107221 A CN201811107221 A CN 201811107221A CN 109388694 A CN109388694 A CN 109388694A
- Authority
- CN
- China
- Prior art keywords
- rich text
- answer
- knowledge
- text
- conversational system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种用于对话系统的富文本存储及展示方法,兼顾展现内容的全面性和展现形式的美观性,通过多种知识展现形式呈现用户所需的业务知识,有效避免了单一的语音播报带来的弊端,最大限度的为客户提供了多维度的业务内容,提升了人机交互的体验效果,具有较强的实用价值和商用价值。
Description
技术领域
本发明涉及人工智能领域,尤其涉及人工智能机器人对话领域,是一种用于对话系统的富文本存储及展示方法。
背景技术
随着人工智能技术的不断成熟与国家战略的不断推进,行业服务机器人在金融、医疗、政务、税务等各个领域逐步落地应用。行业服务器机器人主要功能之一是向用户解答业务问题。多数应用过程中,机器人经过语音识别、语义理解、答案抽取等过程后,通过语音合成技术向客户播报业务答案,此过程存在诸多体验性和实用性缺陷。首先,可能周围存在嘈杂噪声,听不清语音信息播报的情况;其次,可能存在答案过长,用户无法记忆地点、电话等关键信息的情况;再次,对于可能需要扫描二维码、打开对应网站的情况无法进行操作;最后,对于无法回答的问题,无法给出相似问题的列表。
发明内容
本发明要解决的技术问题是提供一种用于对话系统的富文本存储及展示方法,通过多种知识展现形式呈现用户所需的业务知识,有效避免了单一的语音播报带来的弊端,最大限度的为客户提供了多维度的业务内容,提升了人机交互的体验效果。
为了解决所述技术问题,本发明采用的技术方案是:一种用于对话系统的富文本存储及显示方法,包括以下步骤:S01)、利用富文本采编平台录入富文本答案原始素材库,录入时,为每个知识库中的每条答案知识信息生成唯一的id标识,形成子知识条目id;S02)、利用富文本采编平台录入用户业务问题,录入时,为每个业务问题生成一个唯一ID标识;S03)、利用富文本采编平台实现用户业务问题与富文本原始素材的关联,对于每一个业务问题ID,将与其相关的子知识条目id进行关联,基于子知识条目id的集合,生成对应此业务问题的整体富文本答案ID,通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射;S04)、利用页面自适应解析模块实现富文本知识的重构与解析,对话系统在经过问题语义理解、答案抽取过程后,选取最匹配的富文本答案ID,基于富文本答案ID,将富文本答案解析为树形结构,确定每种子答案类型的数量及答案属性,通过页面自适应解析模块,自动的查找树形答案结构最匹配的页面模板,并结合答案属性局部微调整,组装为最佳模板样式;S05)、利用页面渲染模块将富文本知识展示,终端设备接收到最佳模板样式ID和富文本内容后,首先对富文本进行解析,然后将解析出的对应的子知识条目填充到模板的对应位置,并根据终端设备的尺寸做自适应调整,经过渲染流程后做最终的展示。
进一步的,所述富文本答案原始素材库包括省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库和相似问题列表。
进一步的,用户业务问题包括业务标准问句和业务相似问句。
进一步的,用户业务问题的ID标识是每个业务问题的标准问题或者通过某种方法生成的序列号。
进一步的,业务相似问句由业务工作人员在初始录入时根据业务经验录入,或者由人机交互机器人在运行过程中收集用户问句。
进一步的,每一个业务问题ID对应的各个富文本知识库的各条答案id为零个或者多个。
本发明的有益效果:本发明兼顾展现内容的全面性和展现形式的美观性,通过多种知识展现形式呈现用户所需的业务知识,有效避免了单一的语音播报带来的弊端,最大限度的为客户提供了多维度的业务内容,提升了人机交互的体验效果,具有较强的实用价值和商用价值。
附图说明
图1为富文本存储及展示的流程图;
图2为富文本在终端展示的示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
实施例1
本实施例公开一种用于对话系统的富文本存储及展示,如图1所示,首先,通过富文本采编平台录入富文本知识,并实现业务问题与富文本知识的映射。其次,通过页面自适应解析模块,将答案的文本信息、超链接信息、图片信息、表格信息、flash动画信息、相似问题列表等富文本重构为指定格式,满足页面布局美观性、信息传达准确性。最后,通过页面渲染模块,借助平板、显示屏等终端,将富文本信息按照指定的格式做最终的展示。
本发明的具体步骤如下:S01)、利用富文本采编平台录入富文本答案原始素材库,录入时,为每个知识库中的每条答案知识信息生成唯一的id标识,形成子知识条目id。
本实施例中,富文本答案原始素材库包括但不限于省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库、相似问题列表。其中,省略文本库主要用于语音播报,此内容一般不宜过长;详尽文本知识库用于在界面显示,供用户了解详情,并可提供业务办理时间、地点、联系方式等不太容易长时间记忆的内容;图片库包括但不限于产品形态展示、二维码信息等;表格库包括但不限于地点列表、产品列表、联系人员列表等;超链接库包括但不限于业务办理入口及业务信息答案入口等;flash动画库包括但不限于复杂业务流程解答等;相似问题列表包括但不限于与当前问题相关的业务问题。
S02)、利用富文本采编平台录入用户业务问题,录入时,为每个业务问题生成一个唯一ID标识。
本实施例中,用户业务问题包括但不限于业务标准问句和业务相似问句。业务标准问句主要为书面表述形式,例如“办理信用卡的流程”,业务相似问句主要为口语表述形式,比如“怎么办信用卡,办信用卡得经过哪几步”。针对每个业务问题生成的ID标识可以是每个业务问题的标准问题,也可以是通过某种方法生成的序列号。对于业务相似问句,可以是在初始录入知识时业务工作人员根据业务经验录入,也可以是在机器人运行过程收集到的用户问句。
S03)、利用富文本采编平台实现用户业务问题与富文本原始素材的关联,对于每一个业务问题ID,将与其相关的的省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库、相似问题列表等子知识条目id进行关联,基于子知识条目id的集合,生成对应此业务问题的整体富文本答案ID,通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射。
本实施例中,每一个业务问题ID对应的各个富文本知识库的各条答案id为零个或者多个。
S04)、利用页面自适应解析模块实现富文本知识的重构与解析,对话系统在经过问题语义理解、答案抽取过程后,选取最匹配的富文本答案ID,基于富文本答案ID,将富文本答案解析为树形结构,确定每种子答案类型的数量及图片尺寸、超连接格式等答案属性,通过页面自适应解析模块,自动的查找树形答案结构最匹配的页面模板,并结合答案属性局部微调整,组装为最佳模板样式。
如果最后的富文本答案中包含两幅图片,一段文本,则通过自适应解析模块匹配到如图2所示形式的模板,最终将模板ID与富文本内容发送至终端。
S05)、利用页面渲染模块将富文本知识展示,平板等终端设备接收到最佳模板样式ID和富文本内容后,首先对富文本进行解析,然后将解析出的对应的子知识条目填充到模板的对应位置,并根据终端设备的尺寸做自适应调整,经过渲染流程后做最终的展示。
由以上步骤可知,本发明实现了业务问题知识与富文本答案知识的录入解耦与动态关联。同时可实现业务问题和富文本答案知识的单向增删改查,同时自适应调整映射关系。
本方法可广泛的应用于银行、医院、税务、电力、政务等大厅的行业服务机器人的业务问答展示中去,可将行业服务机器人的作用最大化、最优化。最大限度的提升客户体验,避免机器人成为摆设,切实为用户提供有价值的业务咨询服务。
对于银行大堂经理机器人,一种实施方案的具体步骤如下:
1)利用富文本采编平台录入银行高频业务富文本答案原始素材。结合大堂经理部分职责,录入的典型的银行大堂业务知识主要包括业务办理类、常规咨询类两大类问题。例如:当前在售理财产品、银行卡办理流程、银行服务公众号名称、营业网点信息等。对于在售理财产品,录入的主要知识为理财产品整体介绍信息、理财产品表格清单、理财产品经理联系方式、理财产品官网页面等。对于信用卡办理流程,主要是信用卡的办理详细流程及注意事项。对于银行服务公众号,主要涉及公众号名称及二维码信息。对于营业网点信息,主要涉及周末是否营业、地图展现详细地址等。
2)利用富文本采编平台录入银行用户常见业务问句。
对于涉及理财信息、信用卡办理办理信息、公众号信息、营业网点信息的用户问句,首先设计多个标准问句,在此基础上最大限度的整理收集相似问句。形成丰富的问句知识库。对于银行业务相似问句,在初始录入时银行工作人员根据业务经验录入一部分,也可以在机器人运行过程不断收集丰富。
3) 利用富文本采编平台实现用户业务问题与富文本原始素材的关联。
对于每一个银行业务问题ID,将与其相关的省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库等子知识条目id进行关联,同时生成对应此业务问题的整体富文本答案ID。通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射。对于理财产品,生成的答案可能只是一条热门理财信息的详细文本信息,也可以是当前全部理财信息的表格,也可以是理财信息购买的二维码信息。
4)利用页面自适应解析模块实现富文本知识的重构与解析
对话系统在经过银行业务问题的语义理解、答案抽取过程后,选取最匹配的富文本答案ID。根据富文本答案是否包含表格、是否包含图片等信息,通过页面自适应解析模块,自动的查找最匹配的页面模板,组装为模板样式,输出至终端用于最终展示。
5)利用页面渲染模块将银行业务知识富文本最终展示。
平板等终端设备接收到模板ID和富文本内容后,首先对富文本进行解析,并将对应的知识条目填充到模板的对应位置,并根据终端设备的尺寸做自适应调整,经过渲染等流程后做最终的展示。通过此种方式的展示,可最大限度的满足用户的不同信息获取需求。例如某个营业网点的地址,可根据地址信息将其在地图上展示出来,并提取必要的导航信息等。
本发明兼顾展现内容的全面性和展现形式的美观性,通过多种知识展现形式呈现用户所需的业务知识,有效避免了单一的语音播报带来的弊端,最大限度的为客户提供了多维度的业务内容,提升了人机交互的体验效果,具有较强的实用价值和商用价值。
以上描述的仅是本发明的基本原理和优选实施例,本领域技术人员根据本发明做出的改进和替换,属于本发明的保护范围。
Claims (6)
1.一种用于对话系统的富文本存储及显示方法,其特征在于:包括以下步骤:S01)、利用富文本采编平台录入富文本答案原始素材库,录入时,为每个知识库中的每条答案知识信息生成唯一的id标识,形成子知识条目id;S02)、利用富文本采编平台录入用户业务问题,录入时,为每个业务问题生成一个唯一ID标识;S03)、利用富文本采编平台实现用户业务问题与富文本原始素材的关联,对于每一个业务问题ID,将与其相关的子知识条目id进行关联,基于子知识条目id的集合,生成对应此业务问题的整体富文本答案ID,通过关联业务问题ID与对应的富文本答案ID实现业务问题与富文本答案的映射;S04)、利用页面自适应解析模块实现富文本知识的重构与解析,对话系统在经过问题语义理解、答案抽取过程后,选取最匹配的富文本答案ID,基于富文本答案ID,将富文本答案解析为树形结构,确定每种子答案类型的数量及答案属性,通过页面自适应解析模块,自动的查找树形答案结构最匹配的页面模板,并结合答案属性局部微调整,组装为最佳模板样式;S05)、利用页面渲染模块将富文本知识展示,终端设备接收到最佳模板样式ID和富文本内容后,首先对富文本进行解析,然后将解析出的对应的子知识条目填充到模板的对应位置,并根据终端设备的尺寸做自适应调整,经过渲染流程后做最终的展示。
2.根据权利要求1所述的用于对话系统的富文本存储及显示方法,其特征在于:所述富文本答案原始素材库包括省略文本知识库、详尽文本知识库、图片库、表格库、超链接库、flash动画库和相似问题列表。
3.根据权利要求1所述的用于对话系统的富文本存储及显示方法,其特征在于:用户业务问题包括业务标准问句和业务相似问句。
4.根据权利要求1或3所述的用于对话系统的富文本存储及显示方法,其特征在于:用户业务问题的ID标识是每个业务问题的标准问题或者通过某种方法生成的序列号。
5.根据权利要求3所述的用于对话系统的富文本存储及显示方法,其特征在于:业务相似问句由业务工作人员在初始录入时根据业务经验录入,或者由人机交互机器人在运行过程中收集用户问句。
6.根据权利要求1所述的用于对话系统的富文本存储及显示方法,其特征在于:每一个业务问题ID对应的各个富文本知识库的各条答案id为零个或者多个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811107221.3A CN109388694A (zh) | 2018-09-21 | 2018-09-21 | 一种用于对话系统的富文本存储及展示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811107221.3A CN109388694A (zh) | 2018-09-21 | 2018-09-21 | 一种用于对话系统的富文本存储及展示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109388694A true CN109388694A (zh) | 2019-02-26 |
Family
ID=65418993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811107221.3A Pending CN109388694A (zh) | 2018-09-21 | 2018-09-21 | 一种用于对话系统的富文本存储及展示方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109388694A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309509A (zh) * | 2019-06-28 | 2019-10-08 | 神思电子技术股份有限公司 | 一种语义知识库构建方法 |
CN110990581A (zh) * | 2019-11-20 | 2020-04-10 | 神思电子技术股份有限公司 | 一种用于知识库构建的动态数据采编方法 |
CN111666742A (zh) * | 2019-03-07 | 2020-09-15 | 阿里巴巴集团控股有限公司 | 一种富文本处理方法及装置、一种电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102457528A (zh) * | 2010-10-19 | 2012-05-16 | 北京邮电大学 | 面向手机终端的自适应发布Web内容的方法与系统 |
CN103425640A (zh) * | 2012-05-14 | 2013-12-04 | 华为技术有限公司 | 一种多媒体问答系统及方法 |
CN106897251A (zh) * | 2016-07-01 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 富文本展示方法及装置 |
CN107247726A (zh) * | 2017-04-28 | 2017-10-13 | 北京神州泰岳软件股份有限公司 | 适用于多业务场景的智能机器人的实现方法及装置 |
CN107451113A (zh) * | 2017-07-06 | 2017-12-08 | 广东小天才科技有限公司 | 一种演示文档自动排版方法及系统 |
CN108509617A (zh) * | 2018-04-04 | 2018-09-07 | 上海智臻智能网络科技股份有限公司 | 知识库构建、基于知识库的智能问答方法及装置、存储介质、终端 |
-
2018
- 2018-09-21 CN CN201811107221.3A patent/CN109388694A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102457528A (zh) * | 2010-10-19 | 2012-05-16 | 北京邮电大学 | 面向手机终端的自适应发布Web内容的方法与系统 |
CN103425640A (zh) * | 2012-05-14 | 2013-12-04 | 华为技术有限公司 | 一种多媒体问答系统及方法 |
CN106897251A (zh) * | 2016-07-01 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 富文本展示方法及装置 |
CN107247726A (zh) * | 2017-04-28 | 2017-10-13 | 北京神州泰岳软件股份有限公司 | 适用于多业务场景的智能机器人的实现方法及装置 |
CN107451113A (zh) * | 2017-07-06 | 2017-12-08 | 广东小天才科技有限公司 | 一种演示文档自动排版方法及系统 |
CN108509617A (zh) * | 2018-04-04 | 2018-09-07 | 上海智臻智能网络科技股份有限公司 | 知识库构建、基于知识库的智能问答方法及装置、存储介质、终端 |
Non-Patent Citations (1)
Title |
---|
范军 等: "数字内容跨终端自适应发布的趋势", 《创新 融合 转型 数字出版专题研究论集》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666742A (zh) * | 2019-03-07 | 2020-09-15 | 阿里巴巴集团控股有限公司 | 一种富文本处理方法及装置、一种电子设备及存储介质 |
CN111666742B (zh) * | 2019-03-07 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 一种富文本处理方法及装置、一种电子设备及存储介质 |
CN110309509A (zh) * | 2019-06-28 | 2019-10-08 | 神思电子技术股份有限公司 | 一种语义知识库构建方法 |
CN110990581A (zh) * | 2019-11-20 | 2020-04-10 | 神思电子技术股份有限公司 | 一种用于知识库构建的动态数据采编方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mittal et al. | Describing complex charts in natural language: A caption generation system | |
KR102119868B1 (ko) | 홍보용 미디어 콘텐츠 제작 시스템 및 그 방법 | |
CN110472017A (zh) | 一种话术分析和话题点识别匹配的方法及系统 | |
CN107832382A (zh) | 基于文字生成视频的方法、装置、设备及存储介质 | |
CN106055662A (zh) | 基于情感的智能对话方法及系统 | |
CN106777331A (zh) | 知识图谱生成方法及装置 | |
CN106570106A (zh) | 一种输入过程中将语音信息转化为表情的方法和装置 | |
US20100161604A1 (en) | Apparatus and method for multimedia content based manipulation | |
CN102651719B (zh) | 用于在消息交互环境中跟踪消息话题的方法和设备 | |
KR20220000046A (ko) | 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법 | |
CN107301170A (zh) | 基于人工智能的切分语句的方法和装置 | |
CN101840414A (zh) | 从网络文本创建动画的设备和方法 | |
CN112182252A (zh) | 基于药品知识图谱的智能用药问答方法及其设备 | |
CN109388694A (zh) | 一种用于对话系统的富文本存储及展示方法 | |
KR101955318B1 (ko) | 화장품 정보 제공 모바일 애플리케이션을 통해 리뷰 빅데이터를 시각화하는 방법 | |
CN103544321A (zh) | 用于微博情感信息的数据处理方法和装置 | |
Krstajić et al. | Story tracker: Incremental visual text analytics of news story development | |
CN110110039A (zh) | 一种智能语音机器人可视化搭建的方法 | |
JP6994289B2 (ja) | キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法 | |
KR20180131146A (ko) | 사용자 리뷰의 평가기준별 이슈 식별 장치 및 방법 | |
Gerzymisch-Arbogast | Introducing multidimensional translation | |
JP4613346B2 (ja) | キーワード抽出方法、キーワード抽出プログラムおよびキーワード抽出装置、並びにメタデータ作成方法、メタデータ作成プログラムおよびメタデータ作成装置 | |
John et al. | A visual approach for the comparative analysis of character networks in narrative texts | |
Qudeisat et al. | A Linguistic Landscape Study Of Shop Signs In The Northern Part Of Jordan | |
CN109683727A (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190226 |
|
RJ01 | Rejection of invention patent application after publication |