CN112035638B - 信息处理方法、装置、存储介质及设备 - Google Patents

信息处理方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN112035638B
CN112035638B CN202010886865.8A CN202010886865A CN112035638B CN 112035638 B CN112035638 B CN 112035638B CN 202010886865 A CN202010886865 A CN 202010886865A CN 112035638 B CN112035638 B CN 112035638B
Authority
CN
China
Prior art keywords
information
target
question
answer
question information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010886865.8A
Other languages
English (en)
Other versions
CN112035638A (zh
Inventor
曹智颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010886865.8A priority Critical patent/CN112035638B/zh
Publication of CN112035638A publication Critical patent/CN112035638A/zh
Application granted granted Critical
Publication of CN112035638B publication Critical patent/CN112035638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种信息处理方法、装置、存储介质以及设备,涉及人工智能技术领域,其中,该方法包括:响应于针对目标问题信息的检索请求,输出与所述目标问题信息关联的候选问题信息列表;响应于针对所述候选问题信息列表中的目标候选问题信息的选择操作,输出所述目标候选问题信息对应的答案信息;响应于针对目标答案信息的确认操作,建立所述目标问题信息与所述目标答案信息之间的问答对应关系;所述目标答案信息为所述目标候选问题信息对应的答案信息,所述问答对应关系用于当再次响应针对所述目标问题信息的检索请求时触发输出所述目标答案信息。本申请可以提高标注问题信息的答案信息的效率以及智能问答的准确度。

Description

信息处理方法、装置、存储介质及设备
技术领域
本申请涉及人工智能技术领域,尤其涉及一种信息处理方法、装置、存储介质及设备。
背景技术
人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习等几大方向。其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法;被广泛应用于智能问答、机器翻译以及建立知识图谱等领域。
智能问答领域中,主要是利于自然语言技术对问题信息进行分析,以搜索问题信息对应的答案信息;例如,在医疗场景中,用户可以向线上的机器人咨询医疗问题,机器人搜索合适的答案以返回给用户。目前,主要是通过人工标注的方法标注问题信息对应的答案信息,即需要用户手动编辑每个问题信息对应的答案信息,以供用户进行智能问答;但是这种方式的效率比较低,难以满足数据快速更新的需求,容易出现答非所问的情况,导致智能问答的准确度比较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种信息处理方法、装置、存储介质及设备,可提高标注问题信息的答案信息的效率以及智能问答的准确度。
本申请实施例一方面提供一种信息处理方法,包括:
响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表;
响应于针对上述候选问题信息列表中的目标候选问题信息的选择操作,输出上述目标候选问题信息对应的答案信息;
响应于针对目标答案信息的确认操作,建立上述目标问题信息与上述目标答案信息之间的问答对应关系;上述目标答案信息为上述目标候选问题信息对应的答案信息,上述问答对应关系用于当再次响应针对上述目标问题信息的检索请求时触发输出上述目标答案信息。
本申请实施例一方面提供一种信息处理装置,包括:
第一输出模块,用于响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表;
第二输出模块,用于响应于针对上述候选问题信息列表中的目标候选问题信息的选择操作,输出上述目标候选问题信息对应的答案信息;
建立模块,用于响应于针对目标答案信息的确认操作,建立上述目标问题信息与上述目标答案信息之间的问答对应关系;上述目标答案信息为上述目标候选问题信息对应的答案信息,上述问答对应关系用于当再次响应针对上述目标问题信息的检索请求时触发输出上述目标答案信息。
可选的,上述第一输出模块响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表,包括:
响应于针对上述目标问题信息的检索请求,获取问答知识库,上述问答知识库中包括待选问题信息,以及上述待选问题信息对应的答案信息;
获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度;
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表。
可选的,上述第一输出模块若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表,包括:
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息;
获取上述问答知识库中与上述目标问答信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;上述第二匹配度阈值小于上述第一匹配度阈值;
将上述候选问题信息添加至上述候选问题信息列表,输出上述候选问题信息列表。
可选的,上述第一输出模块获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度,包括:
获取上述目标问题信息的语义向量,以及上述问答知识库中的待选问题信息的语义向量;
获取上述目标问题信息的语义向量与上述待选问题信息的语义向量之间的向量距离;
根据上述向量距离确定上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度。
可选的,上述建立模块建立上述目标问题信息与上述目标候选问题信息对应的答案信息之间的问答对应关系,包括:
获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数;
根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中。
可选的,上述建立模块获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;
获取上述历史时间与当前时间之间的时间间隔;
若上述时间间隔小于第一时间间隔阈值,则累计在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述建立模块获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到至少两个用户针对上述目标答案信息的确认操作的总次数,作为第二次数;
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到目标用户针对上述目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数;上述目标用户属于上述至少两个用户;
若上述第三次数大于次数阈值,则获取上述第二次数与上述第三次数之间的差值;
将上述差值确定为在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述建立模块根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中,包括:
根据上述第一次数确定上述目标问题信息与上述目标答案信息之间的关联度;
将上述关联度、上述目标问题信息以及上述目标答案信息缓存至缓存数据库中;
若上述关联度大于第一关联度阈值,则建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系从上述缓存数据库中同步上述目标问题信息至上述问答知识库中。
可选的,上述装置还包括:
获取模块,用于获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;获取上述历史时间与当前时间之间的时间间隔,根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度;
解除模块,用于若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
删除模块,用于从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
可选的,上述获取模块根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度,包括:
若上述时间间隔大于第二时间间隔阈值,则根据上述时间间隔确定关联度步长;
按照上述关联度步长对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到上述更新后的关联度。
可选的,上述装置还包括:
处理模块,用于若针对上述目标问题信息进行检索的过程中,未接收针对上述目标答案信息的确认操作,则对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到更新后的关联度;
解除模块,还用于若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
删除模块,还用于从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
本申请一方面提供了一种计算机设备,包括:处理器及存储器;
其中,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以执行如下步骤:
响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表;
响应于针对上述候选问题信息列表中的目标候选问题信息的选择操作,输出上述目标候选问题信息对应的答案信息;
响应于针对目标答案信息的确认操作,建立上述目标问题信息与上述目标答案信息之间的问答对应关系;上述目标答案信息为上述目标候选问题信息对应的答案信息,上述问答对应关系用于当再次响应针对上述目标问题信息的检索请求时触发输出上述目标答案信息。
可选的,上述处理器用于调用上述计算机程序,以执行响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表,包括:
响应于针对上述目标问题信息的检索请求,获取问答知识库,上述问答知识库中包括待选问题信息,以及上述待选问题信息对应的答案信息;
获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度;
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表。
可选的,上述处理器用于调用上述计算机程序,以执行若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表,包括:
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息;
获取上述问答知识库中与上述目标问答信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;上述第二匹配度阈值小于上述第一匹配度阈值;
将上述候选问题信息添加至上述候选问题信息列表,输出上述候选问题信息列表。
可选的,上述处理器用于调用上述计算机程序,以执行获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度,包括:
获取上述目标问题信息的语义向量,以及上述问答知识库中的待选问题信息的语义向量;
获取上述目标问题信息的语义向量与上述待选问题信息的语义向量之间的向量距离;
根据上述向量距离确定上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度。
可选的,上述处理器用于调用上述计算机程序,以执行建立上述目标问题信息与上述目标候选问题信息对应的答案信息之间的问答对应关系,包括:
获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数;
根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中。
可选的,上述处理器用于调用上述计算机程序,以执行获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;
获取上述历史时间与当前时间之间的时间间隔;
若上述时间间隔小于第一时间间隔阈值,则累计在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述处理器用于调用上述计算机程序,以执行获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到至少两个用户针对上述目标答案信息的确认操作的总次数,作为第二次数;
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到目标用户针对上述目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数;上述目标用户属于上述至少两个用户;
若上述第三次数大于次数阈值,则获取上述第二次数与上述第三次数之间的差值;
将上述差值确定为在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述处理器用于调用上述计算机程序,以执行根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中,包括:
根据上述第一次数确定上述目标问题信息与上述目标答案信息之间的关联度;
将上述关联度、上述目标问题信息以及上述目标答案信息缓存至缓存数据库中;
若上述关联度大于第一关联度阈值,则建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系从上述缓存数据库中同步上述目标问题信息至上述问答知识库中。
可选的,上述处理器用于调用上述计算机程序,以执行如下步骤:
获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;
获取上述历史时间与当前时间之间的时间间隔,根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度;
若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
可选的,上述处理器用于调用上述计算机程序,以执行根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度,包括:
若上述时间间隔大于第二时间间隔阈值,则根据上述时间间隔确定关联度步长;
按照上述关联度步长对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到上述更新后的关联度。
可选的,上述处理器用于调用上述计算机程序,以执行如下步骤:
若针对上述目标问题信息进行检索的过程中,未接收针对上述目标答案信息的确认操作,则对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到更新后的关联度;
若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如下步骤:
响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表;
响应于针对上述候选问题信息列表中的目标候选问题信息的选择操作,输出上述目标候选问题信息对应的答案信息;
响应于针对目标答案信息的确认操作,建立上述目标问题信息与上述目标答案信息之间的问答对应关系;上述目标答案信息为上述目标候选问题信息对应的答案信息,上述问答对应关系用于当再次响应针对上述目标问题信息的检索请求时触发输出上述目标答案信息。
本申请中,通过计算机设备在接收到针对目标问题信息的检索请求时,输出与该目标问题信息关联的候选问题信息列表,有利于用户从候选问题信息列表中选择想问的候选问题信息;通过响应于针对该候选问题信息列表中的目标候选问题信息的选择操作,输出该目标候选问题信息对应的答案信息,有利于用户对目标候选问题信息对应的答案信息进行确认。通过响应于针对目标答案信息的确认操作,建立该目标问题信息与该目标答案信息之间的问答对应关系,可实现自动标注问题信息对应的答案信息,提高标注答案信息的效率。该问答对应关系用于当再次响应针对该目标问题信息的检索请求时触发输出目标答案信息,可避免出现答非所问的情况,提高智能问答的准确度,使智能问答更智能化、自动化。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种信息处理系统的架构示意图;
图2a是本申请提供的一种数据交互的场景示意图;
图2b是本申请提供的一种数据交互的场景示意图;
图3是本申请提供的一种信息处理方法的流程示意图;
图4是本申请提供的一种服务器中的组件与终端进行数据交互的场景示意图;
图5是本申请提供的一种服务器中的组件与终端进行数据交互的场景示意图;
图6是本申请提供的一种建立目标问题信息与目标答案信息之间问答对应关系的场景示意图;
图7是本申请提供的一种更新目标问题信息与目标答案信息之间的关联度的场景示意图;
图8是本申请提供的一种更新标注问答知识库的场景示意图;
图9是本申请实施例提供的一种信息处理装置的结构示意图;
图10是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大信息处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
本申请实施例提供的信息处理方法主要涉及人工智能的自然语言处理技术,具体的,利用自然语言处理技术自动标注问题信息对应的答案信息,可提高智能问答的准确度。
首先介绍用于实现本申请的信息处理方法的信息处理系统,如图1所示,该信息处理系统中包括服务器10以及至少一个终端11。
其中,服务器10可以是指用于提供智能问答服务的后端设备,例如,服务器10可以用于检索问题信息对应的答案信息。终端11可以是指面向用户的前端设备,具体的,终端11可以是指用户用于向服务器10发起针对问题信息的检索请求的设备。
其中,本申请中的信息处理系统可以用于包括但不限于:医疗智能问答、应用程序(如购物应用程序、行政机构的办事应用程序、支付应用程序、社交应用程序)的智能客服以及智能教学等场景中。因此,在医疗智能问答场景中,问题信息可以是指问诊信息,答案信息可以是指针对问诊信息对应就诊信息等等;如问诊信息为感冒了怎么办?就诊信息为吃xx感冒药。或者,在应用程序的智能客服场景中,问题信息可以是用户在使用应用程序的过程中所遇到的问题,答案信息可以是指所遇到的问题对应的解决方法等等,如该应用程序为购物应用程序,问题信息可以是指如何退货,答案信息可以是指退货流程。或者,在智能教学场景中,问题信息可以是指用户咨询的某个知识点,答案信息可以是指关于该知识点的解释信息;如问题信息可以是指:怎么理解人工智能,答案信息可以是指:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
其中,服务器10可以是独立的一个物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端11可以是智能机器人(如智能问答机器人)、智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。各个终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
为便于理解,进一步的,请参见图2a和图2b,是本申请实施例提供的一种数据交互的场景示意图。图2a和图2b中以应用程序的智能客服场景为例,对该数据交互过程进行说明,如图2a所示,用户可以通过内容交互平台12的输入问题信息,终端11可将所输入的问题信息作为目标问题信息;内容交互平台可以包括但不限于:网页页面、公众号、小程序、论坛、贴吧以及虚拟社区等等。相应地,终端11接收用户输入的目标问题信息13,确定接收到针对目标问题信息的检索请求,终端11可以将该检索请求发送至服务器10。服务器10可以根据检索请求检索是否存在与该目标问题信息具有问答对应关系的答案信息,如果服务器10检索到与该目标问题信息具有问答对应关系的答案信息,表明服务器10已标注目标问题信息的答案信息,可以向终端11返回与该目标问题信息具有问答对应关系的答案信息,由终端11输出与该目标问题信息具有问答对应关系的答案信息。如果服务器10未检索到与该目标问题信息具有问答对应关系的答案信息,表明服务器10未标注目标问题信息的答案信息,则可以向终端11返回与该目标问题信息关联的候选问题信息列表14。该候选问题信息列表14包括多个与目标问题信息关联的候选问题信息,即该候选问题信息为与目标问题信息关联,且已被标注答案信息的问题信息;如图2a中用户输入的目标问题信息为:A应用程序怎么打开;候选问题信息可包括A应用程序如何使用、A应用程序是指什么、A应用程序的如何测试以及A应用程序如何收费等等。
如果终端11接收到候选问题信息列表14,可以在内容交互平台上输出该候选问题信息列表14,这时用户可以查看候选问题信息列表14中的候选问题信息,并对候选问题信息列表14中的任一候选问题信息执行选择操作;此处选择操作可包括但不限于:触摸操作、光标操作、按键操作或者语音操作等。其中,触摸操作可以是触摸点击操作、触摸按压操作或者触摸滑动操作,触摸操作可以是单点触摸操作或者多点触摸操作;光标操作可以是控制光标进行点击的操作或者控制光标进行按压的操作;按键操作可以是虚拟按键操作或者实体按键操作等。如果终端11检测到用户针对该候选问题信息列表14中的候选问题信息的选择操作,则将所选择的候选问题信息作为目标候选问题信息,输出该目标候选问题信息对应的答案信息,将该目标候选问题对应的答案信息作为目标答案信息15。如图2a中,终端11检测到针对A应用程序如何使用的选择操作,则可以输出A应用程序如何使用对应的答案信息,即目标答案信息为:A应用程序目前处于内测阶段,请填写使用申请,我们将尽快与您取得联系,在需求沟通、应用场景沟通等完成后,我们将为您开通内测资格。
终端11输出该目标答案信息后,用户可以对该目标答案信息进行确认,即确认该目标答案信息是否为有效答案信息。如果未检测到针对该目标答案信息的确认操作,或检测到针对该目标答案信息的否定操作;表明该用户确定该目标答案信息为无效答案信息,即目标答案信息不是目标问题信息对应的答案,则终端11可更新候选问题信息列表,输出更新后的候选问题信息列表,以便重新获取该目标问题信息对应的答案信息。如果检测到针对该目标答案信息的确认操作,表明该用户确定该目标答案信息为有效答案信息,即目标答案信息为目标问题信息对应的答案,则终端11可建立该目标问题信息与该目标答案信息之间的问答对应关系。可选的,如图2a中内容交互平台上可以包括该针对该目标答案信息的确认选项16以及否定选项17,该确认选项16用于用户确定该目标答案信息为有效答案,即该目标答案信息与目标问题信息匹配;否定选项17用于用户确定该目标答案信息为无效答案,即该目标答案信息与目标问题信息不匹配。如果检测到针对否定选项17的选择操作,则终端11可确定该目标答案信息为无效答案信息,则终端11可更新候选问题信息列表,输出更新后的候选问题信息列表,以便重新获取该目标问题信息对应的答案信息。如果检测到针对确认选项16的选择操作,则终端11可确定该目标答案信息为有效答案信息,建立该目标问题信息与该目标答案信息之间的问答对应关系。该问答对应关系用于指示该目标问题信息与目标答案信息匹配,即建立该目标问题信息与该目标答案信息之间的问答对应关系是指:将目标答案信息标注为目标问题信息的答案信息;通过建立该目标问题信息与该目标答案信息之间的问答对应关系,可实现自动标注问题信息对应的答案信息,提高标注答案信息的效率。
在终端11建立该目标问题信息与该目标答案信息之间的问答对应关系之后,将该目标问题信息与该目标答案信息之间的问答对应关系发送至服务器。图2a中,假设终端11建立目标答案信息与目标问题信息之间问答对应关系的时间为T时刻,如图2b中,如果T+n(n为大于零的数)时刻再次接收到针对该目标问题信息的检索请求,终端11可以再次将该检索请求发送至服务器10,服务器10可根据该问答对应关系向终端11返回该目标答案信息。通过问答对应关系可用于当再次响应针对该目标问题信息的检索请求时触发输出目标答案信息,可避免出现答非所问的情况,提高智能问答的准确度。
需要说明的是,上述检索目标问题对应的答案信息的过程,以及标注目标问题信息对应的答案信息的过程,可以由终端独立来执行,也可以由服务器来独立执行,也可以由终端与服务器之间协助来执行,本申请对此不做限定。
基于上述的描述,请参见图3,是本申请实施例提供的一种信息处理方法的流程示意图。该方法可由计算机设备来执行,该计算机设备可以是指图1中的终端11或服务器10,如图3所示,该信息处理方法可以包括如下步骤S101~S104。
S101、响应于针对目标问题信息的检索请求,输出与该目标问题信息关联的候选问题信息列表。
当用户需要检索某个问题信息对应的答案信息时,可以在内容交互平台中输入问题信息,如果计算机设备接收到在内容交互平台中输入的问题信息,将输入的问题信息作为目标问题信息。计算机设备接收到目标问题信息之后,可以响应针对该目标问题信息的检索请求,根据该检索请求检索是否存在与该目标问题信息具有问答对应关系的答案信息;如果检索到与该目标问题信息对应的答案信息,表明该目标问题信息的答案信息已被标注,则可以输出与该目标问题信息对应的答案信息。如果未检索到与该目标问题信息对应的答案信息,表明该目标问题信息的答案信息未被标注,则可以输出与该目标问题信息关联的候选问题信息列表。候选问题信息列表包括多个与目标问题信息关联的候选问题信息,与目标问题信息关联的候选问题信息可以是指:与目标问题信息具有相同关键词的问题信息;如,目标问题信息为A应用程序如何打开,候选问题信息为A应用程序如何使用,即目标问题信息与候选问题信息中均包括关键词A应用程序。或者,与目标问题信息关联的候选问题信息可以是指:与目标问题信息所描述的对象相同的问题信息,如,目标问题信息为AI是指什么,候选问题信息为人工智能是什么意思,即目标问题信息与候选问题信息中所描述的对象均是人工智能。
S102、响应于针对该候选问题信息列表中的目标候选问题信息的选择操作,输出该目标候选问题信息对应的答案信息。
计算机设备在输出该候选问题信息列表后,该候选问题信息列表中的任一候选问题信息允许用户对其执行选择操作。相应地,计算机设备检测到针对该候选问题信息列表中的候选问题信息的选择操作,可以将所选择的候选问题信息作为目标候选问题信息,检索该目标候选问题信息对应的答案信息,并输出该目标候选问题信息对应的答案信息。
S103、响应于针对目标答案信息的确认操作,建立该目标问题信息与该目标答案信息之间的问答对应关系;该目标答案信息为该目标候选问题信息对应的答案信息,该问答对应关系用于当再次响应针对该目标问题信息的检索请求时触发输出该目标答案信息。
计算机设备输出该目标候选问题信息对应的答案信息后,可将该目标候选问题信息对应的答案信息作为目标答案信息,由用户对该目标答案信息进行确认,即用户确认该目标答案信息是否为有效答案信息。具体的,如果计算机设备未检测到针对该目标答案信息的确认操作,或,检测到针对该目标答案信息的否定操作,表明用户确认该目标答案信息为无效答案信息,即该目标答案信息与目标问题信息不匹配,则可以更新候选问题信息列表,并重复上述步骤S101-S103。如果计算机设备检测到针对该目标答案信息的确认操作,表明用户确认该目标答案信息为有效答案信息,即该目标答案信息与目标问题信息匹配,则可以建立该目标问题信息与该目标答案信息之间的问答对应关系,即将目标答案信息标注为目标问题信息的答案信息。
本申请中,通过计算机设备在接收到针对目标问题信息的检索请求时,输出与该目标问题信息关联的候选问题信息列表,有利于用户从候选问题信息列表中选择想问的候选问题信息;通过响应于针对该候选问题信息列表中的目标候选问题信息的选择操作,输出该目标候选问题信息对应的答案信息,有利于用户对目标候选问题信息对应的答案信息进行确认。通过响应于针对目标答案信息的确认操作,建立该目标问题信息与该目标答案信息之间的问答对应关系,可实现自动标注问题信息对应的答案信息,提高标注答案信息的效率。该问答对应关系用于当再次响应针对该目标问题信息的检索请求时触发输出目标答案信息,可避免出现答非所问的情况,提高智能问答的准确度。
可选的,步骤S101可包括如下步骤s11~s13。
s11、响应于针对该目标问题信息的检索请求,获取问答知识库,该问答知识库中包括待选问题信息,以及该待选问题信息对应的答案信息。
s12、获取该目标问题信息与该问答知识库中的待选问题信息之间的匹配度。
s13、若该目标问答信息与该问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到该目标问题信息对应的答案信息,输出与该目标问题信息关联的候选问题信息列表。
在步骤s11~s13中,由于两个匹配度高的问题信息之间对应的答案信息的相似度比较高,因此,计算机设备可以根据目标问题信息与待选问题信息之间的匹配,来检索目标问题信息对应的答案信息。具体的,计算机设备在接收到该目标问题信息的检索请求时,可以获取问答知识库,该问答知识库可以包括待选问题信息,以及待选问题信息对应的答案信息。可以将目标问题信息与问答知识库中的待选问题信息进行比对,以获取该目标问题信息与该问答知识库中的待选问题信息之间的匹配度。若该目标问答信息与该问答知识库中的待选问题信息之间的匹配度均大于或等于第一匹配度阈值,表明目标问题信息与问答知识库中的待选问题信息之间的相似度比较高,即目标问题信息对应的答案信息与待选问题信息对应的答案信息之间相似度比较高;因此,输出目标候选问题信息对应的答案信息,可以将目标候选问题信息对应的答案信息作为目标问题信息对应的答案信息。若该目标问答信息与该问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,表明目标问题信息与问答知识库中的待选问题信息之间的相似度比较低,即目标问题信息对应的答案信息与待选问题信息对应的答案信息之间的相似度比较低;因此,确定未检索到该目标问题信息对应的答案信息,输出与该目标问题信息关联的候选问题信息列表。
例如,如图4所示,该计算机设备为服务器,该服务器包括交互组件;服务器可以调用交互组件从终端获取针对目标问题信息的检索请求,从问答知识库中检索是否存在与目标答案信息具有问答对应关系的答案信息,即获取目标答题信息与问答知识库中的待选问题信息之间的匹配度。此问答知识库包括机器人问答知识库以及标注问答知识库,机器人问答知识库可以包括多个待选问题信息,以及每个待选问题信息对应的答案信息,每个待选问题信息对应的答案信息是由管理者(如研发人员)对待选问题信息进行标注得到的;标注问答知识库可包括多个待选问题信息,以及每个待选问题信息对应的答案信息,每个待选问题信息对应的答案信息是由服务器对待选问题信息进行自动标注得到的;机器人问答知识库以及标注问答知识库所包括的待选问题信息可以不相同。如果该目标问答信息与该问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到目标问题信息对应的答案信息。进一步,可以从问答知识库中获取与目标问答信息关联的待选问题信息,作为候选问题信息,将候选问题信息添加至候选问题信息列表中,并向终端返回候选问题信息列表。
可选的,如图4所示,服务器还包括数据库管理组件、自动标注组件、缓存组件等等,其中,数据库管理组件可用于将管理者所标注的问题信息的答案信息存储至机器人问答知识库中,并用于对机器人问答知识库进行更新等(如删除某个问题信息的答案信息)。自动标注组件用于从消息队列组件中获取用户针对问题信息对应答案信息的用户反馈信息,该用户反馈信息包括对答案信息的确认信息以及对答案信息的否定信息,并根据用户反馈信息自动标注答案信息与问题信息之间问答对应关系,将具有问答对应关系的答案信息和问题信息存储至标注问答知识库中。缓存组件可用于从自动标注组件中获取用户反馈信息,将用户反馈信息缓存至缓存数据库中。
可选的,步骤s12可包括如下步骤s21~s23。
s21、获取该目标问题信息的语义向量,以及该问答知识库中的待选问题信息的语义向量。
s22、获取该目标问题信息的语义向量与该待选问题信息的语义向量之间的向量距离。
s23、根据该向量距离确定该目标问题信息与该问答知识库中的待选问题信息之间的匹配度。
在步骤s21~s23中,计算机设备可以对目标问题信息进行语义分析,得到目标问题信息的语义向量,对问答知识库中的待选问题信息进行语义分析,得到待选问题信息的语义向量。采用距离算法获取该目标问题信息的语义向量与该待选问题信息的语义向量之间的向量距离,此处距离算法包括曼哈顿距离算法、欧几里得距离算法以及切比雪夫距离算法等等。进一步,可根据该向量距离确定该目标问题信息与问答知识库中的待选问题信息之间的匹配度,即向量距离越大,该目标问题信息与待选问题信息差异比较大,即该目标问题信息与待选问题信息之间的匹配度越低;相反,向量距离越小,该目标问题信息与待选问题信息差异比较小,即该目标问题信息与待选问题信息之间的匹配度越高。
在此实施例中,步骤s13可包括如下步骤s31~s33。
s31、若该目标问答信息与该问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到该目标问题信息对应的答案信息。
s32、获取该问答知识库中与该目标问答信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;该第二匹配度阈值小于该第一匹配度阈值。
s33、将该候选问题信息添加至该候选问题信息列表,输出该候选问题信息列表。
在步骤s31~s33中,在未检索到该目标问题信息对应的答案信息时,可以获取该问答知识库中与该目标问答信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;此处第二匹配度阈值小于第一匹配度阈值,如第一匹配度阈值为0.9,第二匹配度阈值为0.8。进一步,将该候选问题信息添加至该候选问题信息列表,输出该候选问题信息列表。通过输出候选问题信息列表,有利于用户从候选问题信息列表中选择想要问的候选问题信息,即从候选问题信息列表中选择与目标问题信息最接近的候选问题信息。
例如,如图5中该获取候选问题信息列表的过程18,包括:对问答知识库中的待选问题信息进行检索,以获取待选问题信息与目标问题信息之间的匹配度,根据匹配度对问答知识库中的待选问题信息进行重新排序,即按照匹配度由高到底的顺序,对问答知识库中待选问题信息进行排序。如果排序第一的待选问题信息与目标问题信息的匹配度大于或等于第一匹配度阈值,则确定检索到目标问题信息对应的答案信息,将排序第一的候选问题信息对应答案信息作为目标问题信息的答案信息,并将排序第一的待选问题信息对应的答案信息返回至终端。如果排序第一的待选问题信息与目标问题信息的匹配度小于第一匹配度阈值,则确定未检索到目标问题信息对应的答案信息,可以将排序前N个待选问题信息,作为候选问题信息;N为大于1且小于K的整数,K为问答知识库中的待选问题信息的数量。进一步,可将候选问题信息添加至候选问题信息列表,将候选问题信息列表返回至终端。
可选的,步骤S103可包括如下步骤s41~s42。
s41、获取在单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数,作为第一次数。
s42、根据该第一次数建立该目标问题信息与该目标答案信息之间的问答对应关系,根据该问答对应关系将该目标问题信息添加至该问答知识库中。
在步骤s41~s42中,计算机设备可以获取在单位时间段内针对目标问题信息的检索过程中,所接收到针对该目标答案信息的确认操作的次数,作为第一次数,即统计在单位时间段内针对目标问题信息的检索过程中,用户确认该目标答案信息为有效答案信息的次数,作为第一次数。此处单位时间段内可以是指24小时内、一周之内或一个月内。根据第一次数建立目标问题信息与目标答案信息之间的问答对应关系,具体的,当第一次数大于次数阈值时,可以将建立目标问题信息与目标答案信息之间的问答对应关系;或者,可以根据第一次数确定目标问题信息与目标答案信息之间的关联度,根据该关联度建立目标问题信息与目标答案信息之间的问答对应关系。在建立问答对应关系后,根据该问答对应关系将该目标问题信息添加至该问答知识库中,即将目标问题信息与目标答案信息进行关联存储至问答知识库中。通过根据用户对目标答案信息的确认次数,建立目标问题信息与目标答案信息之间的问答对应关系;即目标答案信息经过被多次确认后,才将目标答案信息标注为目标问题信息的答案,可提高标注问题信息的答案信息的准确度。
例如,如图5所示,建立该目标问题信息与该目标答案信息之间的问答对应关系的过程19,可包括:若接收到针对目标答案信息的否定操作,则可以判断目标候选问题信息是否为标注的关联问题,即判断该目标候选问题信息是否属于标注问答知识库;如果属于标注问答知识库,表明用户不赞同标注问答知识库中的目标答案信息,生成答案命中失败的消息,将答案命中失败的消息添加至服务器的消息队列组件中。若接收到针对目标答案信息的确认操作,可以判断目标候选问题信息是否为标注的关联问题,即判断该目标候选问题信息是否属于标注问答知识库;如果属于标注问答知识库,表明目标候选问题信息被多次检索到,且该目标候选问题信息对应答案信息再次被确认,可生成答案再次命中的消息,将答案再次命中的消息添加至服务器的消息队列组件中,并对在单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数增加1,作为第一次数。若接收到针对目标答案信息的确认操作,且目标候选问题信息不属于标注问答知识库,表明目标候选问题信息被首次检索到,可生成答案首次命中的消息,将答案首次命中的消息添加至服务器的消息队列组件中,并对在单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数设置为1,作为第一次数。进一步,根据该第一次数建立该目标问题信息与该目标答案信息之间的问答对应关系,根据该问答对应关系将该目标问题信息添加至该问答知识库中。
在此实施例中,步骤s41可包括如下步骤s51~s53。
s51、获取上一次针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的历史时间。
s52、获取该历史时间与当前时间之间的时间间隔。
s53、若该时间间隔小于第一时间间隔阈值,则累计在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数,作为该第一次数。
在步骤s51~s53中,计算机设备可以采用累计的方式统计单位时间段针对目答案信息的确认操作的次数。具体的,计算机设备可以获取上一次针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的历史时间,获取该历史时间与当前时间之间的时间间隔;当前时间可以是指本次接收到确认操作的时间。如果时间间隔大于或等于第一时间间隔阈值,表明本次所接收到的确认操作的时间超过该单位时间段内,不需要累计本次所接收到的确认操作。如果时间间隔小于第一时间间隔阈值,表明本次所接收到的确认操作的时间位于单位时间段内。因此,累计在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数,作为该第一次数,即对在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数增加1,得到第一次数。
可选的,步骤s41可包括如下步骤s61~s64。
s61、获取在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到至少两个用户针对该目标答案信息的确认操作的总次数,作为第二次数。
s62、获取在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到目标用户针对该目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数;该目标用户属于该至少两个用户。
s63、若该第三次数大于次数阈值,则获取该第二次数与该第三次数之间的差值。
s64、将该差值确定为在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数,作为该第一次数。
在步骤s61~s64中,计算机设备可以周期性地统计单位时间段内针对目答案信息的确认操作的次数。具体的,计算机设备可以获取在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到至少两个用户针对该目标答案信息的确认操作的总次数,作为第二次数;获取在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到目标用户针对该目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数。若该第三次数大于次数阈值,表明目标用户存在恶意刷确认操作的次数的行为,因此,可以获取该第二次数与该第三次数之间的差值,即从第二次数中过滤到恶意刷确认操作次数。可以将该差值确定为在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数,作为该第一次数。通过根据第二次数与第三次数之间的差值,确定在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数,可有效避免通过恶意刷确认操作次数,来提高目标答案信息的曝光率的行为,可提高获取在该单位时间段内针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的次数的准确度,进而提高标注目标问题信息的答案信息的准确度。
可选的,步骤s42可包括如下步骤s71~s73。
s71、根据该第一次数确定该目标问题信息与该目标答案信息之间的关联度。
s72、将该关联度、该目标问题信息以及该目标答案信息缓存至缓存数据库中。
s73、若该关联度大于第一关联度阈值,则建立该目标问题信息与该目标答案信息之间的问答对应关系,根据该问答对应关系从该缓存数据库中同步该目标问题信息至该问答知识库中。
在步骤s71~s73中,如图6所示,计算机设备可以根据第一次数确定该目标问题信息与目标答案信息之间的关联度,如果第一次数越大,表明用户认可目标答案信息为目标问题信息的答案信息的认可度越高,即该目标问题信息与目标答案信息之间的关联度越高,也即目标答案信息越接近目标问题信息的答案信息;相反,如果第一次数越小,表明用户认可目标答案信息为目标问题信息的答案信息的认可度越低,即该目标问题信息与目标答案信息之间的关联度越低,也即目标答案信息与目标问题信息的答案信息的差异较大。计算机设备获取到关联度后,可以将关联度、该目标问题信息以及目标答案信息缓存至缓存数据库中,若该关联度大于第一关联度阈值,则建立该目标问题信息与该目标答案信息之间的问答对应关系,根据该问答对应关系从该缓存数据库中同步该目标问题信息至该问答知识库中。通过将该关联度、该目标问题信息以及该目标答案信息缓存至缓存数据库中,将关联度大于第一关联度阈值的问题信息以及答案信息存储至问答知识库中,可实现信息的分布式存储,可缓解问答知识库中数据存储的压力。通过在问题信息与答案信息之间的关联度大于第一关联度阈值时,才将问题信息以及答案信息存储至问答知识库中,可提高标注目标问题信息的答案信息的准确度,进而提高问题信息检索的准确度。
可选的,图7所示,可以根据消息类型生成(或更新)目标答案信息与目标问题信息中之间的关联度,具体包括如下步骤s115~s120。
s115、从服务器的消息队列组件中获取目标问题信息对应的消息。
s116、判断消息类型;如果消息类型为答案首次命中的消息,则执行步骤s117;如果消息类型为答案再次命中的消息,则执行步骤s118;如果消息类型为答案命中失败的消息,则执行步骤s119。
s117、将目标问题信息与目标答案信息存储至缓存数据库中,生成目标问题信息与目标答案信息之间的关联度的初始值,将该初始值存储至缓存数据库中。
s118、将缓存数据库中目标问题信息与目标答案信息之间的关联度增加1。
s119、将缓存数据库中目标问题信息与目标答案信息之间的关联度减去1。
s120、更新标注时间。
在步骤s115~s120中,可以从服务器的消息队列中获取与目标问题信息对应消息,确定消息的类型,如果消息类型为答案命中失败的消息,将缓存数据库中目标答案信息与目标问题信息中之间的关联度进行衰减处理,如对缓存数据库中目标答案信息与目标问题信息中之间的关联度减去1,得到更新后的关联度。此处的缓存数据库可以被存储至服务器的缓存组件中。如果消息类型为答案首次命中的消息,生成目标问题信息与目标答案信息之间的关联度的初始值,如该初始值可以为1,将该初始值存储至缓存数据库中。如果消息类型为答案再次命中的消息,将缓存数据库中目标答案信息与目标问题信息中之间的关联度进行增加处理,如对缓存数据库中目标答案信息与目标问题信息中之间的关联度增加1,得到更新后的关联度。进一步,若该关联度(初始值或更新后的关联度)大于第一关联度阈值,则建立该目标问题信息与该目标答案信息之间的问答对应关系,根据该问答对应关系从该缓存数据库中同步该目标问题信息至该问答知识库中,并更新标注时间,即更新后的标注时间为本次获取目标答案信息与目标问题信息之间的关联度的时间,该更新后的标注时间可用于后续更新关联度。
可选的,该方法可包括如下步骤s81~s84。
s81、获取上一次针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的历史时间。
s82、获取该历史时间与当前时间之间的时间间隔,根据该时间间隔更新该目标问题信息与该目标答案信息之间的关联度,得到更新后的关联度。
s83、若该更新后的关联度小于第二关联度阈值,则解除该目标问题信息与该目标答案信息之间的问答对应关系;该第二关联度阈值小于该第一关联度阈值。
s84、从该缓存数据库中删除该关联度、该目标问题信息以及该目标答案信息,从该问答知识库中删除该目标问题信息。
在步骤s81~s84中,由于问题信息具有时效性以及计算机设备的存储空间有限,需要对问答知识库进行中的问题信息以及答案信息进行更新;问题信息的时效性是指:问题信息与答案信息之间的问答对应关系仅在某个时间段具有有效性,超过该时间段问题信息与答案信息之间的问答对应关系就失效。例如,某些问题信息通常会在某一个时间点爆发,在这个时间点会出现大量与该问题信息相似的问题信息,比如商场服务宕机了,商场的智能客服就会收到大量“为什么XXX不行了/不能用了/无法下单”之类的问题,这时用户期待的回答肯定是服务宕机的公告或者提醒。那么,如果商场的服务器修复后,如果商场的智能客服再次收到大量“为什么XXX不行了/不能用了/无法下单”之类的问题,服务宕机的公告或者提醒的答案信息对此类问题信息就失效了。因此,计算机设备可以根据接收到针对目标答案信息的确认操作的时间,对目标答案信息与目标问题信息之间的关联度进行更新。具体的,计算机设备可以获取上一次针对该目标问题信息进行检索的过程中,所接收到针对该目标答案信息的确认操作的历史时间,获取该历史时间与当前时间之间的时间间隔,根据该时间间隔更新该目标问题信息与该目标答案信息之间的关联度,得到更新后的关联度。例如,如果该时间间隔大于第二时间间隔阈值,表明该目标问题信息较长时间未被检索,或者,用户对目标答案信息的认可度比较低,也即该目标问题信息热度或重要性比较低。因此,可以根据该时间间隔对该目标问题信息与该目标答案信息之间的关联度进行衰减处理,得到更新后的关联度,即降低该目标问题信息与该目标答案信息之间的关联度。如果该时间间隔小于或等于第二时间间隔阈值,表明该目标问题信息被频繁检索,即该目标问题信息热度或重要性比较高。因此,可以根据该时间间隔对该目标问题信息与该目标答案信息之间的关联度进行增加处理,得到更新后的关联度,即增加该目标问题信息与该目标答案信息之间的关联度。若该更新后的关联度小于第二关联度阈值,则解除该目标问题信息与该目标答案信息之间的问答对应关系,从该缓存数据库中删除该关联度、该目标问题信息以及该目标答案信息,从该问答知识库中删除该目标问题信息。通过根据接收到针对目标答案信息的确认操作的时间,对目标答案信息与目标问题信息之间的关联度进行更新,这样有利于删除热度或重要性比较低的问题信息,可有效避免长时间存储问答对应关系失效的问题信息以及答案信息,可节省计算机设备的存储空间。
可选的,步骤s82可包括如下步骤s91~s92。
s91、若该时间间隔大于第二时间间隔阈值,则根据该时间间隔确定关联度步长。
s92、按照该关联度步长对该目标问题信息与该目标答案信息之间的关联度进行衰减处理,得到该更新后的关联度。
在步骤s91~s92中,如果该时间间隔大于第二时间间隔阈值,表明该目标问题信息较长时间未被检索,或者,用户对目标答案信息的认可度比较低,也即该目标问题信息热度或重要性比较低。因此,计算机设备可根据该时间间隔确定关联度步长,按照该关联度步长对该目标问题信息与该目标答案信息之间的关联度进行衰减处理,得到该更新后的关联度。即时间间隔越大,关联度步长越大,即该目标问题信息与该目标答案信息之间的关联度被降低更多;时间间隔越小,关联度步长越小,即该目标问题信息与该目标答案信息之间的关联度被降低更少。通过根据时间间隔对该目标问题信息与该目标答案信息之间的关联度进行衰减处理,这样有利于删除热度或重要性比较低的问题信息,节省计算机设备的存储空间。
可选的,该方法可包括如下步骤s111~s113。
s111、若针对该目标问题信息进行检索的过程中,未接收针对该目标答案信息的确认操作,则对该目标问题信息与该目标答案信息之间的关联度进行衰减处理,得到更新后的关联度。
s112、若该更新后的关联度小于第二关联度阈值,则解除该目标问题信息与该目标答案信息之间的问答对应关系;该第二关联度阈值小于该第一关联度阈值。
s113、从该缓存数据库中删除该关联度、该目标问题信息以及该目标答案信息,从该问答知识库中删除该目标问题信息。
在步骤s111~s113中,若针对该目标问题信息进行检索的过程中,未接收针对该目标答案信息的确认操作,表明该目标答案信息不被用户认可,则对该目标问题信息与该目标答案信息之间的关联度进行衰减处理,得到更新后的关联度。若该更新后的关联度小于第二关联度阈值,则解除该目标问题信息与该目标答案信息之间的问答对应关系;从该缓存数据库中删除该关联度、该目标问题信息以及该目标答案信息,从该问答知识库中删除该目标问题信息。通过根据用户对目标答案信息的确认与否,来更新目标答案信息与目标问题信息之间的关联度,可有利于删除不被用户认可的答案信息对应问题信息,提高答案信息的有效性,可节省计算机设备的存储空间。
可选的,如图5所示,更新标注问答知识库的过程20,包括:服务器可以自定义更新目标问题信息与目标答案信息之间的关联度的关联策略,如该关联策略包括更新关联度的时间周期、更新关联度的条件,如何更新关联度等等。当时间到达更新关联度的时间周期,则可以从消息队列组件中获取关于目标问题信息的消息,根据消息以及关联策略更新目标问题信息与目标答案信息之间的关联度,根据更新后的关联度更新标注问答知识库。具体的,如图8所示,更新标注问答知识库的过程可包括如下步骤s121~s129。
s121、当时间到达更新标注问答知识库的时间,可扫描目标问题信息。
s122、从缓存数据库中获取与目标问题信息对应目标答案信息。
s123、判断目标问题信息对应的标注时间是否超过衰减时间,如果超过衰减时间,则执行步骤s124;如果未超过衰减时间,则执行s125。
s124、将目标问题信息与目标答案信息的关联度减去1。
s125、判断关联度是否大于第一关联度阈值,若关联度大于第一关联度阈值,则执行步骤s126,若关联度小于或等于第一关联度阈值,则执行步骤s127。
s126、将缓存数据库中目标问题信息同步至标注问答知识库中。
s127、判断关联度是否小于第二关联度阈值,若关联度小于第二关联度阈值,则执行步骤s128,若关联度大于或等于第一关联度阈值,则执行步骤s129。
s128、从缓存数据库中删除目标问题信息、目标答案信息、以及关联度。
s129、判断缓存数据中是否存在与目标问题信息关联的下一个目标答案信息,若存在,则重复执行上述步骤s121~s128;若不存在,则等待下一次更新标注问答知识库的时间。
在步骤s121~s129中,当时间到达更新标注问答知识库的时间,可以对缓存数据库进行扫描,以获取与目标问题信息对应目标答案信息,判断目标问题信息对应的标注时间是否超过衰减时间,即获取目标问题信息对应的标注时间与当前时间之间的时间间隔,如果时间间隔大于第二时间间隔,确定超过衰减时间,则可以将目标答案信息与目标问题信息之间的关联度减少1;如果时间间隔小于第二时间间隔,确定未超过衰减时间,则可以判断目标答案信息与目标问题信息之间的关联度是否大于第一关联度阈值。如果目标答案信息与目标问题信息之间的关联度大于第一关联度阈值,将缓存数据库中的目标问题信息同步至标注问答知识库中;如果目标答案信息与目标问题信息之间的关联度小于或等于第一关联度阈值,则判断目标答案信息与目标问题信息之间的关联度小于第二关联度阈值,如果目标答案信息与目标问题信息之间的关联度小于第二关联度阈值,则从缓存数据中删除目标问题信息、目标答案信息以及目标答案信息与目标问题信息之间的关联度;如果目标答案信息与目标问题信息之间的关联度大于第二关联度阈值,且小于第一关联度阈值,则判断缓存数据库中是否存在与目标问题信息关联的下一个目标答案信息。则重复执行上述步骤s121~s128;若不存在,则等待下一次更新标注问答知识库的时间。
请参见图9,是本申请实施例提供的一种信息处理装置的结构示意图。上述信息处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该信息处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图9所示,该信息处理装置可以包括:第一输出模块901、第二输出模块902、建立模块903、获取模块904、解除模块905、删除模块906以及处理模块907。
第一输出模块901,用于响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表;
第二输出模块902,用于响应于针对上述候选问题信息列表中的目标候选问题信息的选择操作,输出上述目标候选问题信息对应的答案信息;
建立模块903,用于响应于针对目标答案信息的确认操作,建立上述目标问题信息与上述目标答案信息之间的问答对应关系;上述目标答案信息为上述目标候选问题信息对应的答案信息,上述问答对应关系用于当再次响应针对上述目标问题信息的检索请求时触发输出上述目标答案信息。
可选的,上述第一输出模块901响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表,包括:
响应于针对上述目标问题信息的检索请求,获取问答知识库,上述问答知识库中包括待选问题信息,以及上述待选问题信息对应的答案信息;
获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度;
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表。
可选的,上述第一输出模块901若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表,包括:
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息;
获取上述问答知识库中与上述目标问答信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;上述第二匹配度阈值小于上述第一匹配度阈值;
将上述候选问题信息添加至上述候选问题信息列表,输出上述候选问题信息列表。
可选的,上述第一输出模块901获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度,包括:
获取上述目标问题信息的语义向量,以及上述问答知识库中的待选问题信息的语义向量;
获取上述目标问题信息的语义向量与上述待选问题信息的语义向量之间的向量距离;
根据上述向量距离确定上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度。
可选的,上述建立模块903建立上述目标问题信息与上述目标候选问题信息对应的答案信息之间的问答对应关系,包括:
获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数;
根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中。
可选的,上述建立模块903获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;
获取上述历史时间与当前时间之间的时间间隔;
若上述时间间隔小于第一时间间隔阈值,则累计在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述建立模块903获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到至少两个用户针对上述目标答案信息的确认操作的总次数,作为第二次数;
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到目标用户针对上述目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数;上述目标用户属于上述至少两个用户;
若上述第三次数大于次数阈值,则获取上述第二次数与上述第三次数之间的差值;
将上述差值确定为在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述建立模块903根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中,包括:
根据上述第一次数确定上述目标问题信息与上述目标答案信息之间的关联度;
将上述关联度、上述目标问题信息以及上述目标答案信息缓存至缓存数据库中;
若上述关联度大于第一关联度阈值,则建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系从上述缓存数据库中同步上述目标问题信息至上述问答知识库中。
可选的,上述装置还包括:
获取模块904,用于获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;获取上述历史时间与当前时间之间的时间间隔,根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度;
解除模块905,用于若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
删除模块906,用于从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
可选的,上述获取模块904根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度,包括:
若上述时间间隔大于第二时间间隔阈值,则根据上述时间间隔确定关联度步长;
按照上述关联度步长对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到上述更新后的关联度。
可选的,上述装置还包括:
处理模块907,用于若针对上述目标问题信息进行检索的过程中,未接收针对上述目标答案信息的确认操作,则对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到更新后的关联度;
解除模块905,还用于若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
删除模块906,还用于从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
根据本申请的一个实施例,图3所示的信息处理方法所涉及的步骤可由图9所示的信息处理装置中的各个模块来执行。例如,图3中所示的步骤S101可由图9中的第一输出模块901来执行,图3中所示的步骤S102可由图9中的第二输出模块902来执行;图3中所示的步骤S103可由图9中的建立模块903来执行。
根据本申请的一个实施例,图9所示的信息处理装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,信息处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图9中所示的信息处理装置,以及来实现本申请实施例的信息处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
本申请中,通过计算机设备在接收到针对目标问题信息的检索请求时,输出与该目标问题信息关联的候选问题信息列表,有利于用户从候选问题信息列表中选择想问的候选问题信息;通过响应于针对该候选问题信息列表中的目标候选问题信息的选择操作,输出该目标候选问题信息对应的答案信息,有利于用户对目标候选问题信息对应的答案信息进行确认。通过响应于针对目标答案信息的确认操作,建立该目标问题信息与该目标答案信息之间的问答对应关系,可实现自动标注问题信息对应的答案信息,提高标注答案信息的效率。该问答对应关系用于当再次响应针对该目标问题信息的检索请求时触发输出目标答案信息,可避免出现答非所问的情况,提高智能问答的准确度,使智能问答更智能化、自动化。
请参见图10,是本申请实施例提供的一种计算机设备的结构示意图。如图10所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图10所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表;
响应于针对上述候选问题信息列表中的目标候选问题信息的选择操作,输出上述目标候选问题信息对应的答案信息;
响应于针对目标答案信息的确认操作,建立上述目标问题信息与上述目标答案信息之间的问答对应关系;上述目标答案信息为上述目标候选问题信息对应的答案信息,上述问答对应关系用于当再次响应针对上述目标问题信息的检索请求时触发输出上述目标答案信息。
可选的,上述处理器用于调用上述计算机程序,以执行响应于针对目标问题信息的检索请求,输出与上述目标问题信息关联的候选问题信息列表,包括:
响应于针对上述目标问题信息的检索请求,获取问答知识库,上述问答知识库中包括待选问题信息,以及上述待选问题信息对应的答案信息;
获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度;
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表。
可选的,上述处理器用于调用上述计算机程序,以执行若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息,输出与上述目标问题信息关联的候选问题信息列表,包括:
若上述目标问答信息与上述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到上述目标问题信息对应的答案信息;
获取上述问答知识库中与上述目标问答信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;上述第二匹配度阈值小于上述第一匹配度阈值;
将上述候选问题信息添加至上述候选问题信息列表,输出上述候选问题信息列表。
可选的,上述处理器用于调用上述计算机程序,以执行获取上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度,包括:
获取上述目标问题信息的语义向量,以及上述问答知识库中的待选问题信息的语义向量;
获取上述目标问题信息的语义向量与上述待选问题信息的语义向量之间的向量距离;
根据上述向量距离确定上述目标问题信息与上述问答知识库中的待选问题信息之间的匹配度。
可选的,上述处理器用于调用上述计算机程序,以执行建立上述目标问题信息与上述目标候选问题信息对应的答案信息之间的问答对应关系,包括:
获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数;
根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中。
可选的,上述处理器用于调用上述计算机程序,以执行获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;
获取上述历史时间与当前时间之间的时间间隔;
若上述时间间隔小于第一时间间隔阈值,则累计在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述处理器用于调用上述计算机程序,以执行获取在单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为第一次数,包括:
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到至少两个用户针对上述目标答案信息的确认操作的总次数,作为第二次数;
获取在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到目标用户针对上述目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数;上述目标用户属于上述至少两个用户;
若上述第三次数大于次数阈值,则获取上述第二次数与上述第三次数之间的差值;
将上述差值确定为在上述单位时间段内针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的次数,作为上述第一次数。
可选的,上述处理器用于调用上述计算机程序,以执行根据上述第一次数建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系将上述目标问题信息添加至上述问答知识库中,包括:
根据上述第一次数确定上述目标问题信息与上述目标答案信息之间的关联度;
将上述关联度、上述目标问题信息以及上述目标答案信息缓存至缓存数据库中;
若上述关联度大于第一关联度阈值,则建立上述目标问题信息与上述目标答案信息之间的问答对应关系,根据上述问答对应关系从上述缓存数据库中同步上述目标问题信息至上述问答知识库中。
可选的,上述处理器用于调用上述计算机程序,以执行如下步骤:
获取上一次针对上述目标问题信息进行检索的过程中,所接收到针对上述目标答案信息的确认操作的历史时间;
获取上述历史时间与当前时间之间的时间间隔,根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度;
若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
可选的,上述处理器用于调用上述计算机程序,以执行根据上述时间间隔更新上述目标问题信息与上述目标答案信息之间的关联度,得到更新后的关联度,包括:
若上述时间间隔大于第二时间间隔阈值,则根据上述时间间隔确定关联度步长;
按照上述关联度步长对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到上述更新后的关联度。
可选的,上述处理器用于调用上述计算机程序,以执行如下步骤:
若针对上述目标问题信息进行检索的过程中,未接收针对上述目标答案信息的确认操作,则对上述目标问题信息与上述目标答案信息之间的关联度进行衰减处理,得到更新后的关联度;
若上述更新后的关联度小于第二关联度阈值,则解除上述目标问题信息与上述目标答案信息之间的问答对应关系;上述第二关联度阈值小于上述第一关联度阈值;
从上述缓存数据库中删除上述关联度、上述目标问题信息以及上述目标答案信息,从上述问答知识库中删除上述目标问题信息。
本申请中,通过计算机设备在接收到针对目标问题信息的检索请求时,输出与该目标问题信息关联的候选问题信息列表,有利于用户从候选问题信息列表中选择想问的候选问题信息;通过响应于针对该候选问题信息列表中的目标候选问题信息的选择操作,输出该目标候选问题信息对应的答案信息,有利于用户对目标候选问题信息对应的答案信息进行确认。通过响应于针对目标答案信息的确认操作,建立该目标问题信息与该目标答案信息之间的问答对应关系,可实现自动标注问题信息对应的答案信息,提高标注答案信息的效率。该问答对应关系用于当再次响应针对该目标问题信息的检索请求时触发输出目标答案信息,可避免出现答非所问的情况,提高智能问答的准确度,使智能问答更智能化、自动化。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3所对应实施例中对上述信息处理方法的描述,也可执行前文图9所对应实施例中对上述信息处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
本身请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前文图3对应实施例中对上述信息处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
作为示例,上述程序指令可被部署在一个计算机设备上执行,或者被部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁盘、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (14)

1.一种信息处理方法,其特征在于,包括:
响应于针对目标问题信息的检索请求,输出与所述目标问题信息关联的候选问题信息列表;
响应于针对所述候选问题信息列表中的目标候选问题信息的选择操作,输出所述目标候选问题信息对应的答案信息;
若检测到针对目标答案信息的否定操作,则输出更新后的所述候选问题信息列表;
若检测到针对目标答案信息的确认操作,则建立所述目标问题信息与所述目标答案信息之间的问答对应关系;所述目标答案信息为所述目标候选问题信息对应的答案信息,所述问答对应关系用于当再次响应针对所述目标问题信息的检索请求时触发输出所述目标答案信息;获取上一次针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的历史时间;获取所述历史时间与当前时间之间的时间间隔,根据所述时间间隔更新所述目标问题信息与所述目标答案信息之间的关联度,得到更新后的关联度;若所述更新后的关联度小于第二关联度阈值,则解除所述目标问题信息与所述目标答案信息之间的问答对应关系;所述目标问题信息与所述目标答案信息之间的关联度是根据针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数确定的。
2.如权利要求1所述的方法,其特征在于,所述响应于针对目标问题信息的检索请求,输出与所述目标问题信息关联的候选问题信息列表,包括:
响应于针对所述目标问题信息的检索请求,获取问答知识库,所述问答知识库中包括待选问题信息,以及所述待选问题信息对应的答案信息;
获取所述目标问题信息与所述问答知识库中的待选问题信息之间的匹配度;
若所述目标问题 信息与所述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到所述目标问题信息对应的答案信息,输出与所述目标问题信息关联的候选问题信息列表。
3.如权利要求2所述的方法,其特征在于,所述若所述目标问题 信息与所述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到所述目标问题信息对应的答案信息,输出与所述目标问题信息关联的候选问题信息列表,包括:
若所述目标问题 信息与所述问答知识库中的待选问题信息之间的匹配度均小于第一匹配度阈值,则确定未检索到所述目标问题信息对应的答案信息;
获取所述问答知识库中与所述目标问题 信息之间的匹配度大于第二匹配度阈值的待选问题信息,作为候选问题信息;所述第二匹配度阈值小于所述第一匹配度阈值;
将所述候选问题信息添加至所述候选问题信息列表,输出所述候选问题信息列表。
4.如权利要求2或3所述的方法,其特征在于,所述获取所述目标问题信息与所述问答知识库中的待选问题信息之间的匹配度,包括:
获取所述目标问题信息的语义向量,以及所述问答知识库中的待选问题信息的语义向量;
获取所述目标问题信息的语义向量与所述待选问题信息的语义向量之间的向量距离;
根据所述向量距离确定所述目标问题信息与所述问答知识库中的待选问题信息之间的匹配度。
5.如权利要求2所述的方法,其特征在于,所述建立所述目标问题信息与所述目标候选问题信息对应的答案信息之间的问答对应关系,包括:
获取在单位时间段内针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数,作为第一次数;
根据所述第一次数建立所述目标问题信息与所述目标答案信息之间的问答对应关系,根据所述问答对应关系将所述目标问题信息添加至所述问答知识库中。
6.如权利要求5所述的方法,其特征在于,所述获取在单位时间段内针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数,作为第一次数,包括:
获取上一次针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的历史时间;
获取所述历史时间与当前时间之间的时间间隔;
若所述时间间隔小于第一时间间隔阈值,则累计在所述单位时间段内针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数,作为所述第一次数。
7.如权利要求5所述的方法,其特征在于,所述获取在单位时间段内针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数,作为第一次数,包括:
获取在所述单位时间段内针对所述目标问题信息进行检索的过程中,所接收到至少两个用户针对所述目标答案信息的确认操作的总次数,作为第二次数;
获取在所述单位时间段内针对所述目标问题信息进行检索的过程中,所接收到目标用户针对所述目标候选问题信息对应的答案信息的确认操作的次数,作为第三次数;所述目标用户属于所述至少两个用户;
若所述第三次数大于次数阈值,则获取所述第二次数与所述第三次数之间的差值;
将所述差值确定为在所述单位时间段内针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数,作为所述第一次数。
8.如权利要求5-7任一项所述的方法,其特征在于,所述根据所述第一次数建立所述目标问题信息与所述目标答案信息之间的问答对应关系,根据所述问答对应关系将所述目标问题信息添加至所述问答知识库中,包括:
根据所述第一次数确定所述目标问题信息与所述目标答案信息之间的关联度;
将所述关联度、所述目标问题信息以及所述目标答案信息缓存至缓存数据库中;
若所述关联度大于第一关联度阈值,则建立所述目标问题信息与所述目标答案信息之间的问答对应关系,根据所述问答对应关系从所述缓存数据库中同步所述目标问题信息至所述问答知识库中。
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
若所述更新后的关联度小于第二关联度阈值,则从所述缓存数据库中删除所述关联度、所述目标问题信息以及所述目标答案信息,从所述问答知识库中删除所述目标问题信息;所述第二关联度阈值小于所述第一关联度阈值。
10.如权利要求9所述的方法,其特征在于,所述根据所述时间间隔更新所述目标问题信息与所述目标答案信息之间的关联度,得到更新后的关联度,包括:
若所述时间间隔大于第二时间间隔阈值,则根据所述时间间隔确定关联度步长;
按照所述关联度步长对所述目标问题信息与所述目标答案信息之间的关联度进行衰减处理,得到所述更新后的关联度。
11.如权利要求8所述的方法,其特征在于,所述方法还包括:
若针对所述目标问题信息进行检索的过程中,未接收针对所述目标答案信息的确认操作,则对所述目标问题信息与所述目标答案信息之间的关联度进行衰减处理,得到更新后的关联度;
若所述更新后的关联度小于第二关联度阈值,则解除所述目标问题信息与所述目标答案信息之间的问答对应关系;所述第二关联度阈值小于所述第一关联度阈值;
从所述缓存数据库中删除所述关联度、所述目标问题信息以及所述目标答案信息,从所述问答知识库中删除所述目标问题信息。
12.一种信息处理装置,其特征在于,包括:
第一输出模块,用于响应于针对目标问题信息的检索请求,输出与所述目标问题信息关联的候选问题信息列表;
第二输出模块,用于响应于针对所述候选问题信息列表中的目标候选问题信息的选择操作,输出所述目标候选问题信息对应的答案信息;若检测到针对目标答案信息的否定操作,则输出更新后的所述候选问题信息列表;
建立模块,用于若检测到针对目标答案信息的确认操作,则建立所述目标问题信息与所述目标答案信息之间的问答对应关系;所述目标答案信息为所述目标候选问题信息对应的答案信息,所述问答对应关系用于当再次响应针对所述目标问题信息的检索请求时触发输出所述目标答案信息;获取上一次针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的历史时间;获取所述历史时间与当前时间之间的时间间隔,根据所述时间间隔更新所述目标问题信息与所述目标答案信息之间的关联度,得到更新后的关联度;若所述更新后的关联度小于第二关联度阈值,则解除所述目标问题信息与所述目标答案信息之间的问答对应关系;所述目标问题信息与所述目标答案信息之间的关联度是根据针对所述目标问题信息进行检索的过程中,所接收到针对所述目标答案信息的确认操作的次数确定的。
13.一种计算机设备,其特征在于,包括:
处理器以及存储器;
所述处理器与所述存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-11任一项所述的方法。
CN202010886865.8A 2020-08-28 2020-08-28 信息处理方法、装置、存储介质及设备 Active CN112035638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010886865.8A CN112035638B (zh) 2020-08-28 2020-08-28 信息处理方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010886865.8A CN112035638B (zh) 2020-08-28 2020-08-28 信息处理方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN112035638A CN112035638A (zh) 2020-12-04
CN112035638B true CN112035638B (zh) 2021-08-24

Family

ID=73587626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010886865.8A Active CN112035638B (zh) 2020-08-28 2020-08-28 信息处理方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN112035638B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905878B (zh) * 2021-01-25 2023-03-10 长沙市到家悠享网络科技有限公司 对应关系配置方法、装置、设备和存储介质
CN113127517A (zh) * 2021-04-22 2021-07-16 云上青海大数据产业有限公司 一种基于区块链大数据的存储系统
CN113468294A (zh) * 2021-07-20 2021-10-01 上海明略人工智能(集团)有限公司 用于古诗词问答的方法、装置、电子设备及存储介质
CN116701579A (zh) * 2023-02-21 2023-09-05 中国人民解放军海军工程大学 信息答复系统、方法及计算机可读取存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002183373A (ja) * 2000-12-15 2002-06-28 Osaka Gas Co Ltd 設問管理方法、設問管理システム、管理装置、設問作成装置、及び記録媒体
CN107025297A (zh) * 2017-04-18 2017-08-08 上海斐讯数据通信技术有限公司 一种聊天机器人及其自动聊天方法
CN107220380A (zh) * 2017-06-27 2017-09-29 北京百度网讯科技有限公司 基于人工智能的问答推荐方法、装置和计算机设备
CN108717433A (zh) * 2018-05-14 2018-10-30 南京邮电大学 一种面向程序设计领域问答系统的知识库构建方法及装置

Also Published As

Publication number Publication date
CN112035638A (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN112035638B (zh) 信息处理方法、装置、存储介质及设备
KR102592268B1 (ko) 상호 작용 메시지 처리 방법 및 장치, 컴퓨터 디바이스 그리고 저장 매체
US9305050B2 (en) Aggregator, filter and delivery system for online context dependent interaction, systems and methods
US11176453B2 (en) System and method for detangling of interleaved conversations in communication platforms
CN110837550A (zh) 基于知识图谱的问答方法、装置、电子设备及存储介质
CN108090351B (zh) 用于处理请求消息的方法和装置
AU2017415315B2 (en) Integrating virtual and human agents in a multi-channel support system for complex software applications
CN114787814B (zh) 指代解析
CN111917878A (zh) 消息处理方法、装置、设备及存储介质
US20200285636A1 (en) Context-sensitive cross-lingual searches
CN107807935B (zh) 应用推荐方法及装置
CN112165639B (zh) 内容分发方法、装置、电子设备以及存储介质
CN110807044A (zh) 一种基于人工智能技术的模型维度管理方法
CN114357278A (zh) 一种话题推荐方法、装置及设备
CN111078855A (zh) 信息处理方法、装置、电子设备及存储介质
CN111611369B (zh) 基于人工智能的交互方法和相关装置
US20230274161A1 (en) Entity linking method, electronic device, and storage medium
US20220414095A1 (en) Method of processing event data, electronic device, and medium
CN115964384A (zh) 一种数据查询方法、装置、电子设备及计算机可读介质
CN111897884B (zh) 数据关系信息显示方法、终端设备
CN117473070B (zh) 智能机器人的多渠道应用方法、智能机器人和存储介质
US11799734B1 (en) Determining future user actions using time-based featurization of clickstream data
CN116821295A (zh) 智能问答方法、装置、计算机设备及介质
CN114138958A (zh) 信息交互方法、装置、设备及存储介质
CN116680389A (zh) 会话处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40034953

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant