信息处理方法以及装置
技术领域
本说明书涉及计算机技术领域,特别涉及一种信息处理方法。本说明书同时涉及一种信息处理装置,一种电子设备,以及一种计算机可读存储介质。
背景技术
随着现代科学和技术的快速发展,在线社交网络服务已经成为互联网上发展最快的应用。而人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。
现有技术中,智能问答系统中预存有一套知识库,其中存储有大量的问题和与每个问题相对应的答案。智能问答系统识别用户所提出的问题后,即从知识库中查找与该问题所对应的问题,然后根据对应的问题给出与该问题相匹配的答案。
但是,现有技术中的智能问答系统还存在一定的缺陷,在给出的答案的准确度方面还有待提高。
发明内容
有鉴于此,本说明书实施例提供了一种信息处理方法。本说明书同时涉及一种信息处理装置,一种电子设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种信息处理方法,包括:
获取用户问句及与所述用户问句相关的属性信息,所述用户问句包括用户的当前会话中的当前问句以及历史问句;
根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;
计算所述当前问句与所述至少一条召回信息间的目标关联特征值;
根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回。
可选地,所述计算所述当前问句与所述至少一条召回信息间的目标关联特征值包括:
计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
计算所述当前问句与根据所述当前问句进行信息召回所接收的至少一条召回信息间的当前问句特征值;
将所述当前问句特征集与所述历史问句特征集进行合并生成目标关联特征值。
可选地,所述根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息包括:
判断所述历史问句中是否包含有效问句;
若是,则根据所述当前问句、所述有效问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;
若否,则根据所述当前问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,所述计算所述当前问句与所述至少一条召回信息间的目标关联特征值包括:
获取预设周期内提问频率高于预设频率阈值的问句;
获取所述用户的业务状态信息以及所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据;
根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值。
可选地,所述根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值包括:
提取所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据中的至少一个关键词;
在所述当前问句以及所述至少一条召回信息中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则将所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据输入已采用机器学习方法训练的第一算法模型计算所述目标关联特征值。
可选地,所述计算所述当前问句与所述至少一条召回信息间的目标关联特征值包括:
获取所述当前问句与所述有效问句的提问时间;
将所述当前问句与提问时间和所述当前问句的提问时间间隔最短的有效问句进行拼接生成第一拼接问句;
计算所述第一拼接问句与所述至少一条召回信息间的目标关联特征值。
可选地,所述根据所述当前问句、历史问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息包括:
判断所述用户问句中是否含有有效问句;
若是,则提取所述用户问句中的有效问句并将所述有效问句合并为第二拼接问句,根据语义分析算法对所述第二拼接问句进行语义分析并根据语义分析结果生成新问句;
根据所述新问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,所述计算所述当前问句与所述至少一条召回信息间的目标关联特征值包括:
计算所述新问句与所述至少一条召回信息间的目标关联特征值。
可选地,所述判断所述历史问句中是否包含有效问句包括:
提取所述历史问句中的至少一个关键词;
在数据库中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则通过已采用机器学习方法训练的算法模型确定所述历史问句与标准问题间的语义相似度;
将所述历史问句中与所述标准问句间的语义相似度大于预设相似度阈值的问句确定为有效问句。
可选地,所述计算所述当前问句与根据所述历史问句进行召回所接收的至少一条召回信息间的历史问句特征值之前,还包括:
判断所述历史问句是否含有有效问句;
若是,则执行步骤计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
若否,则将所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值置为预设特征值。
根据本说明书实施例的另一方面,提供了一种信息处理装置,包括:
属性信息获取模块,被配置为获取用户问句及与所述用户问句相关的属性信息,所述用户问句包括用户的当前会话中的当前问句以及历史问句;
信息召回模块,被配置为根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;
计算模块,被配置为计算所述当前问句与所述至少一条召回信息间的目标关联特征值;
信息排序模块,被配置为根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回。
可选地,所述计算模块包括:
历史问句特征值计算子模块,被配置为计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
当前问句特征值计算子模块,被配置为计算所述当前问句与根据所述当前问句进行信息召回所接收的至少一条召回信息间的当前问句特征值;
合并子模块,被配置为将所述当前问句特征集与所述历史问句特征集进行合并生成目标关联特征值。
可选地,所述信息召回模块包括:
第一问句判断子模块,被配置为判断所述历史问句中是否包含有效问句;
若是,则运行第一信息召回子模块;
所述第一信息召回子模块,被配置为根据所述当前问句、所述有效问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;
若否,则运行第二信息召回子模块;
所述第二信息召回子模块,被配置为根据所述当前问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,所述计算模块还包括:
第一获取子模块,被配置为获取预设周期内提问频率高于预设频率阈值的问句;
第二获取子模块,被配置为获取所述用户的业务状态信息以及所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据;
第一计算子模块,被配置为根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值。
可选地,所述第一计算子模块,还被配置为:
提取所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据中的至少一个关键词;
在所述当前问句以及所述至少一条召回信息中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则将所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据输入已采用机器学习方法训练的第一算法模型计算所述目标关联特征值。
可选地,所述计算模块还包括:
提问时间获取子模块,被配置为获取所述当前问句与所述有效问句的提问时间;
问句拼接子模块,被配置为将所述当前问句与提问时间和所述当前问句的提问时间间隔最短的有效问句进行拼接生成第一拼接问句;
第二计算子模块,被配置为计算所述第一拼接问句与所述至少一条召回信息间的目标关联特征值。
可选地,所述信息召回模块包括:
第二问句判断子模块,被配置为判断所述用户问句中是否含有有效问句;
若是,则运行语义分析子模块;
所述语义分析子模块,被配置为提取所述用户问句中的有效问句并将所述有效问句合并为第二拼接问句,根据语义分析算法对所述第二拼接问句进行语义分析并根据语义分析结果生成新问句;
第三信息召回子模块,被配置为根据所述新问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,所述计算模块,还被配置为:
计算所述新问句与所述至少一条召回信息间的目标关联特征值。
可选地,所述第一问句判断子模块,还被配置为:
提取所述历史问句中的至少一个关键词;
在数据库中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则通过已采用机器学习方法训练的算法模型确定所述历史问句与标准问题间的语义相似度;
将所述历史问句中与所述标准问句间的语义相似度大于预设相似度阈值的问句确定为有效问句。
可选地,所述计算模块还包括:
有效问句判断子模块,被配置为判断所述历史问句是否含有有效问句;
若是,则运行所述历史问句特征值计算子模块;
若否,则运行特征值设置子模块;
所述特征值设置子模块,被配置为将所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值置为预设特征值。
根据本说明书实施例的另一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述信息处理方法的步骤。
根据本说明书实施例的另一方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述信息处理方法的步骤。
本说明书实施例中,通过获取用户问句及与所述用户问句相关的属性信息,所述用户问句包括用户的当前会话中的当前问句以及历史问句;根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;计算所述当前问句与所述至少一条召回信息间的目标关联特征值;根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回。
本说明书实施例中,通过获取当前会话中的当前问句以及历史问句,根据当前问句以及历史问句和其他相关信息进行信息召回,然后计算会话中当前问句与召回信息间的关联度,将关联度大于预设阈值的问题对应的答案向用户返回,有利于提高所返回答案的准确度。
附图说明
图1是本申请实施例提供的信息处理方法的流程图;
图2是本申请实施例提供的信息处理方法应用于实际场景的示意图;
图3是本申请实施例提供的信息处理装置的结构示意图;
图4是本申请实施例提供的电子设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
召回:一个信息检索中的重要词汇,指将需要寻找的目标纳入到候选集中。
排序:本文中指在所有召回引擎的召回结果基础上,运用排序算法,对召回结果进行排序,指标是与用户问询的相关程度。
标准问题:针对用户的高频提问总结的标准问题,以下简称标问。
会话:在智能客服机器人的应用中,用户与机器人的一通完整的对话可以包含任意数量的问答对,所有的这些问答对组成了一个完整的“会话”。
当前问句特征集:当前问句与召回的标准问题之间计算出的一组特征,用以表示当前问句与此标准问题之间的关联度。
历史问句特征集:历史问句与召回的标准问题之间计算出的一组特征,用以表示历史问句与此标准问题之间的关联度。
本说明书实施例提供了一种信息处理方法。本说明书同时涉及一种信息处理装置,一种电子设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一实施例的信息处理方法的流程图,包括步骤102至步骤108。
步骤102:获取用户问句及与所述用户问句相关的属性信息,所述用户问句包括用户的当前会话中的当前问句以及历史问句。
本说明书提供的一个实施例中,所述信息处理方法可以应用于智能问答,用户与智能机器人的一通完整的对话可以包含任意数量的问答对,所有的这些问答对组成了一个完整的会话。
以某电商业务为例,在检测到用户在聊天窗口提交问句后,获取用户问句及与所述用户问句相关的属性信息,若所述用户问句的数量大于1,则所述用户问句会分为当前问句以及历史问句。其中,所述当前问句为获取用户问句时聊天窗口显示的最后一个问句,即当前问句的发送时间与获取用户问句的时间最为接近,除最后一个问句外且问句发送时间在预设时长阈值内的其他问句均为历史问句;除此之外,与所述用户问句相关的属性信息包括:提问时间、提问场景、提问意图以及所述用户问句所涉及的业务类型等信息。
具体的,所述用户问句所涉及的业务类型可以通过获取用户问句的关键词来确定,例如,假设获取到的用户问句为“可以发A快递吗?”,则根据该用户问句可获取的关键词为“快递”,因此可确定所述用户问句所涉及的业务类型为快递业务,根据所述用户问句进行信息召回时,可能召回结果中包含的与快递业务相关的标准问题占比会偏大。
实际应用中,与所述用户问句相关的属性信息可根据具体需求来确定,在此不做限制。
步骤104:根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
本说明书提供的一个实施例中,在进行信息召回之前,还需判断历史问句中是否包含有效问句,具体的判断方法可通过以下步骤实现:
提取所述历史问句中的至少一个关键词;
在数据库中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则通过已采用机器学习方法训练的算法模型确定所述历史问句与标准问题间的语义相似度;
将所述历史问句中与所述标准问句间的语义相似度大于预设相似度阈值的问句确定为有效问句。
仍以电商业务为例,假设获取的历史问句为“你好”和“什么时候可以发货?”,对以上历史问句提取的关键词分别为“你好”和“发货”,假设数据库中存储的业务目标特征词为“快递”、“发货”、“退款”等,则在数据库中查找是否存在与“你好”和“发货”一致的业务目标特征词的查找结果为存在与关键词“发货”一致的业务目标特征词“发货”,则通过已采用机器学习方法训练的算法模型确定关键词“发货”所在的历史问句“什么时候可以发货?”与标准问题“发货时间?”间的语义相似度,假设计算得语义相似度为90%,大于预设相似度阈值80%,则可将历史问句“什么时候发货”确定为有效问句。
确定有效问句后,根据当前问句、有效问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。本说明书实施例中,数据库中预先存储有标准问题以及对应的答案,进行信息召回时,结合当前问句、有效问句以及用户问句的提问时间、提问场景、提问意图以及与用户问句所涉及的业务类型进行信息召回可以有效提高信息召回的效率以及召回信息的准确度。
除此之外,若在数据库中未查找到与上述关键词“你好”和“发货”一致的业务目标特征词,或在数据库中查找到与上述关键词一致的业务目标特征词,但通过已采用机器学习方法训练的算法模型计算所述历史问句与标准问题间的语义相似度的计算结果小于预设相似度阈值80%,则可确定所述历史问句中不包含有效问句,因此需根据所述当前问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,根据所述当前问句、历史问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息还可通过以下步骤实现:
判断所述用户问句中是否含有有效问句;
若是,则提取所述用户问句中的有效问句并将所述有效问句合并为第二拼接问句,根据语义分析算法对所述第二拼接问句进行语义分析并根据语义分析结果生成新问句;
若否,则不做处理即可;
根据所述新问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
具体的,仍以电商业务为例,假设用户在客服聊天窗口发送的用户问句为“你好”、“我在新疆”、“我想问一下我这边可以发什么快递”。首先判断所述用户问句是否含有有效问句,具体的判断步骤与前述判断步骤一致,即首先对以上用户问句提取关键词,假设提取的关键词分别为“你好”、“新疆”和“快递”,然后在数据库中查找是否存在与“你好”、“新疆”和“快递”一致的业务目标特征词;假设数据库中存储的业务目标特征词为“快递”、“发货”、“地名”等,则上述查找步骤的查找结果为存在与关键词“新疆”和“快递”一致的业务目标特征词“地名”和“快递”;然后通过已采用机器学习方法训练的算法模型确定关键词“新疆”所在的用户问句“我在新疆”与标准问题“收货地址为+地名”间的语义相似度以及关键词“快递”所在的用户问句“我想问一下我这边可以发什么快递”与标准问句“发什么快递”间的语义相似度;假设计算得到的语义相似度结果分别为85%和90%,二者的值均大于预设相似度阈值80%,则将用户问句“我在新疆”和“我想问一下我这边可以发什么快递?”确定为有效问句。
确定有效问句后,将所述有效问句合并为第二拼接问句,即将“我在新疆”和“我想问一下我这边可以发什么快递?”合并为“我在新疆,我想问一下我这边可以发什么快递?”,然后根据语义分析算法对所述第二拼接问句进行语义分析,根据语义分析结果生成新问句“新疆可以发什么快递?”,根据所述新问句及于所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
步骤106:计算所述当前问句与所述至少一条召回信息间的目标关联特征值。
本说明书提供的一个实施例中,根据当前问句以及用户问句的相关属性信息进行信息召回得到第一召回集合,根据有效问句以及用户问句的相关属性信息进行信息召回得到第二召回集合,将所述第一召回集合与第二召回集合中的召回信息取并集即得到所述至少一条召回信息。
具体的,计算所述当前问句与所述至少一条召回信息间的目标关联特征值可通过以下步骤实现:
计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
计算所述当前问句与根据所述当前问句进行信息召回所接收的至少一条召回信息间的当前问句特征值;
将所述当前问句特征集与所述历史问句特征集进行合并生成目标关联特征值。
本说明书提供的一个实施例中,计算所述当前问句与根据所述历史问句进行召回所接收的至少一条召回信息间的历史问句特征值之前,还需判断所述历史问句是否含有有效问句,具体的判断方法在上述描述内容中已详细说明,在此不再赘述。
若所述历史问句中含有有效问句,则执行步骤计算所述当前问句与根据所述有效问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
若所述历史问句中不含有有效问句,则将所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值置为预设特征值。
具体的,所述历史问句特征值和所述当前问句特征值均表示用户问句与召回信息间的关联度,若所述历史问句中不包含有效问句,则将所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值置为预设特征值。实际应用中,预设特征阈值可以设置为-1,即有效问句与当前问句间的关联度为-1,表示有效问句与当前问句间没有关联。具体的预设特征阈值可根据实际需要来确定,在此不做限制。
本说明书提供的一个实施例中,通过当前问句、召回信息以及与用户问句相关的属性信息计算所述目标关联特征值,具体可通过以下步骤实现:
获取预设周期内提问频率高于预设频率阈值的问句;
获取所述用户的业务状态信息以及所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据;
根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值。
具体的,问句的提问频率可以反映一定时间周期内该问句的热度,仍以电商业务为例,如果预设周期为10天,则获取2019年1月21日至2019年1月31日这段时间内提问频率高于预设频率阈值的问句,由于上述时间段距离除夕较近,因此这段时间提问频率较高的问句可能为“快递什么时候停运?”。
除此之外,仍以电商业务为例,获取所述用户的业务状态信息即获取用户商品购买状态信息,所述商品购买状态信息包括:浏览、收藏、加入购物车、已付款、已发货、已签收等等。所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据包括用户发起当前会话之前是否点击、浏览、收藏或购买过商品,同样,用户在会话过程中是否点击、浏览、收藏或购买过商品。
具体的,根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值可通过以下步骤实现:
提取所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据中的至少一个关键词;
在所述当前问句以及所述至少一条召回信息中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则将所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据输入已采用机器学习方法训练的第一算法模型计算所述目标关联特征值;
若否,则不做处理即可。
本说明书提供的一个实施例中,计算所述当前问句与所述至少一条召回信息间的目标关联特征值还可通过以下步骤实现:
获取所述当前问句与所述有效问句的提问时间;
将所述当前问句与提问时间和所述当前问句的提问时间间隔最短的有效问句进行拼接生成第一拼接问句;
计算所述第一拼接问句与所述至少一条召回信息间的目标关联特征值。
具体的,所述拼接及计算过程可参考以上步骤中的实现方法,在此不再赘述。除此之外,还可有其他的拼接方式,如将当前问句与任意一个有效问句进行拼接,或将当前问句与一个或多个有效问句进行拼接,本说明书只以第一拼接问句这种拼接方式为例进行说明,其他拼接方式的具体实施过程可参考前述的实现方法,在此不再赘述,实际应用中,根据实际需要选择拼接方式,在此不做限制。
步骤108:根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回。
本说明书提供的一个实施例中,假设获取的有效问句为A和B,当前问句为C,根据有效问句A进行信息召回得到的召回结果为a1和a2,根据有效问句B进行信息召回得到的召回结果为b1、b2和b3,根据当前问句C进行信息召回得到的召回结果为c1和c2;计算当前问句C与根据有效问句A进行信息召回得到的召回结果a1、a2间的历史问句特征集的计算结果为{Ca1,Ca2},计算当前问句C与根据有效问句B进行信息召回得到的召回结果b1、b2、b3间的历史问句特征集的计算结果为{Cb1,Cb2,Cb3},计算当前问句C与根据当前问句C进行信息召回得到的召回结果c1、c2间的当前问句特征集的计算结果为{Cc1,Cc2};
将当前问句特征集与历史问句特征集中的特征值根据大小进行排序,假设排序结果如表1所示。
表1
序号 |
问句 |
特征值 |
1 |
c1 |
Cc1(90%) |
2 |
a2 |
Ca2(89%) |
3 |
b2 |
Cb2(83%) |
4 |
a1 |
Ca1(80%) |
5 |
b1 |
Cb1(76%) |
6 |
c2 |
Cc2(75%) |
7 |
b3 |
Cb3(70%) |
根据排序结果将序号为1、2、3的3个标准问题对应的答案返回,即将问句c1、a2、b2对应的答案返回即可。
可选地,假设计算当前问句C与根据有效问句A、B和当前问句C进行信息召回得到的召回结果间的特征值的计算结果如表2所示。
表2
问句 |
特征值 |
a1 |
Ca1(80%) |
a2 |
Ca2(89%) |
b1 |
Cb1(76%) |
b2 |
Cb2(83%) |
b3 |
Cb3(70%) |
c1 |
Cc1(90%) |
c2 |
Cc2(75%) |
根据计算结果将与当前问句间的特征值大于预设特征阈值80%的问句对应的答案返回,即将问句c1、a2、b2对应的答案返回即可。
本说明书提供的一个实施例中,通过获取用户的当前会话中的当前问句以及历史问句,根据所述当前问句、历史问句中的有效问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息,有利于提高信息召回的效率;除此之外,计算所述当前问句与所述至少一条召回信息间的目标关联特征值,根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回,有效的保证了返回信息与用户问句间的关联度,从而可以保证返回信息的准确度。
图2示出了本说明书一实施例的信息处理方法应用于实际场景的示意图,该信息处理方法以对信用卡业务的客服问答应用场景为例进行描述,包括步骤202至步骤216。
步骤202:获取用户问句及与所述用户问句相关的属性信息,所述用户问句包括用户的当前会话中的当前问句以及历史问句。
本说明书提供的一个实施例中,在检测到用户在聊天窗口提交问句后,获取用户问句及与所述用户问句相关的属性信息,其中,用户问句包括当前问句和历史问句,与所述用户问句相关的属性信息包括:提问时间、提问场景、提问意图以及所述用户问句所涉及的业务类型等信息。
具体的,所述用户问句所涉及的业务类型可以通过获取用户问句的关键词来确定,例如,假设获取到的用户问句为“我想问关于信用卡的事”,则根据该用户问句可获取的关键词为“信用卡”,因此可确定所述用户问句所涉及的业务类型为信用卡业务,根据所述用户问句进行信息召回时,可能召回结果中包含的与信用卡业务相关的标准问题占比会偏大。
实际应用中,与所述用户问句相关的属性信息可根据具体需要来确定,在此不做限制。
步骤204:判断历史问句中是否包含有效问句,若是,则执行步骤206;若否,则执行步骤208。
本说明书提供的一个实施例中,具体的判断方法可通过以下步骤实现:
提取所述历史问句中的至少一个关键词;
在数据库中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则通过已采用机器学习方法训练的算法模型确定所述历史问句与标准问题间的语义相似度;
将所述历史问句中与所述标准问句间的语义相似度大于预设相似度阈值的问句确定为有效问句。
若获取的历史问句为“你好”和“我想问关于信用卡的事”,对以上历史问句提取的关键词分别为“你好”和“信用卡”,假设数据库中存储的业务目标特征词为“信用卡”、“还款”等,则步骤在数据库中查找是否存在与“你好”和“信用卡”一致的业务目标特征词的查找结果为存在与关键词“信用卡”一致的业务目标特征词,则通过已采用机器学习方法训练的算法模型确定关键词“信用卡”所在的历史问句“我想问关于信用卡的事”与标准问题“信用卡使用问题”间的语义相似度,假设计算得语义相似度为90%,大于预设相似度阈值80%,则可将历史问句“我想问关于信用卡的事”确定为有效问句。
步骤206:根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
本说明书提供的一个实施例中,确定有效问句后,根据当前问句、有效问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。本说明书实施例中,数据库中预先存储有标准问题以及对应的答案,进行信息召回时,结合当前问句、有效问句以及用户问句的提问时间、提问场景、提问意图以及与用户问句所涉及的业务类型进行信息召回可以有效提高信息召回的效率以及召回信息的准确度。
步骤208:根据所述当前问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
本说明书提供的一个实施例中,若在数据库中未查找到与上述关键词“你好”和“信用卡”一致的业务目标特征词,或在数据库中查找到与上述关键词一致的业务目标特征词,但通过已采用机器学习方法训练的算法模型计算所述历史问句与标准问题间的语义相似度的计算结果小于预设相似度阈值80%,则可确定所述历史问句中不包含有效问句,因此需根据所述当前问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
信息召回完成后,继续执行步骤212。
步骤210:计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值。
步骤212:计算所述当前问句与根据所述当前问句进行信息召回所接收的至少一条召回信息间的当前问句特征值。
步骤214:将所述当前问句特征集与所述历史问句特征集进行合并生成目标关联特征值。
本说明书提供的一个实施例中,根据当前问句以及用户问句的相关属性信息进行信息召回得到第一召回集合,根据有效问句以及用户问句的相关属性信息进行信息召回得到第二召回集合,将所述第一召回集合与第二召回集合中的召回信息取并集即得到所述至少一条召回信息。
计算当前问句与所述至少一条召回信息间的目标关联特征值即计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值以及所述当前问句与根据所述当前问句进行信息召回所接收的至少一条召回信息间的当前问句特征值;将所述当前问句特征集与所述历史问句特征集进行合并生成目标关联特征值。
本说明书提供的一个实施例中,计算所述当前问句与根据所述历史问句进行召回所接收的至少一条召回信息间的历史问句特征值之前,还需判断所述历史问句是否含有有效问句,具体的判断方法在步骤104中已详细说明,在此不再赘述。
若所述历史问句中含有有效问句,则执行步骤计算所述当前问句与根据所述有效问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
若所述历史问句中不含有有效问句,则将所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值置为-1。
本说明书提供的一个实施例中,通过当前问句、召回信息以及与用户问句相关的属性信息计算所述目标关联特征值,具体可通过以下步骤实现:
获取预设周期内提问频率高于预设频率阈值的问句;获取所述用户的业务状态信息以及所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据;根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值。
具体的,问句的提问频率可以反映一定时间周期内该问句的热度,如果预设周期为5天,则获取2019年5月25日至2019年5月30日这段时间内提问频率高于预设频率阈值的问句,由于上述时间段为月末,因此这段时间提问频率较高的问句可能为“信用卡逾期未还款怎么办”。
除此之外,获取所述用户的业务状态信息即获取用户的信用卡状态信息,所述信用卡状态信息包括:待还款、已还款、逾期未还等等。所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据包括用户发起当前会话之前是否点击、浏览过信用卡信息,同样,用户在会话过程中是否点击、浏览过信用卡信息。
具体的,根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值可通过以下步骤实现:
提取所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据中的至少一个关键词;
在所述当前问句以及所述至少一条召回信息中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则将所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据输入已采用机器学习方法训练的第一算法模型计算所述目标关联特征值。
步骤216:根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回。
本说明书提供的一个实施例中,假设获取的有效问句为D,当前问句为E,根据有效问句D进行信息召回得到的召回结果为d1和d2,根据当前问句E进行信息召回得到的召回结果为e1和e2;计算当前问句E与根据有效问句D进行信息召回得到的召回结果d1、d2间的历史问句特征集的计算结果为{Ed1,Ed2},计算当前问句E与根据当前问句E进行信息召回得到的召回结果e1、e2间的当前问句特征集的计算结果为{Ee1,Ee2};
将当前问句特征集与历史问句特征集中的特征值根据大小进行排序,假设排序结果如表3所示。
表3
序号 |
问句 |
特征值 |
1 |
e1 |
Ee1(85%) |
2 |
d2 |
Ed2(82%) |
3 |
e2 |
Ee2(78%) |
4 |
d1 |
Ed1(75%) |
根据排序结果将序号为1、2的2个标准问题对应的答案返回,即将问句e1、d2对应的答案返回即可。
本说明书提供的一个实施例中,在进行信息召回时,结合当前问句、有效问句以及用户问句的提问时间、提问场景、提问意图以及与用户问句所涉及的业务类型进行信息召回可以有效提高信息召回的效率以及召回信息的准确度。
与上述方法实施例相对应,本说明书还提供了信息处理装置实施例,图3示出了本说明书一个实施例的信息处理装置的结构示意图。如图3所示,该装置包括:
属性信息获取模块302,被配置为获取用户问句及与所述用户问句相关的属性信息,所述用户问句包括用户的当前会话中的当前问句以及历史问句;
信息召回模块304,被配置为根据所述当前问句、历史问句以及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;
计算模块306,被配置为计算所述当前问句与所述至少一条召回信息间的目标关联特征值;
信息排序模块308,被配置为根据所述目标关联特征值对所述至少一条召回信息进行排序并根据排序结果将目标关联特征值大于预设特征阈值的召回信息返回。
可选地,所述计算模块包括:
历史问句特征值计算子模块,被配置为计算所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值;
当前问句特征值计算子模块,被配置为计算所述当前问句与根据所述当前问句进行信息召回所接收的至少一条召回信息间的当前问句特征值;
合并子模块,被配置为将所述当前问句特征集与所述历史问句特征集进行合并生成目标关联特征值。
可选地,所述信息召回模块包括:
第一问句判断子模块,被配置为判断所述历史问句中是否包含有效问句;
若是,则运行第一信息召回子模块;
所述第一信息召回子模块,被配置为根据所述当前问句、所述有效问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息;
若否,则运行第二信息召回子模块;
所述第二信息召回子模块,被配置为根据所述当前问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,所述计算模块还包括:
第一获取子模块,被配置为获取预设周期内提问频率高于预设频率阈值的问句;
第二获取子模块,被配置为获取所述用户的业务状态信息以及所述用户发起所述当前会话前和/或会话过程中用户的行为属性数据;
第一计算子模块,被配置为根据所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据计算所述目标关联特征值。
可选地,所述第一计算子模块,还被配置为:
提取所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据中的至少一个关键词;
在所述当前问句以及所述至少一条召回信息中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则将所述当前问句、所述至少一条召回信息、所述用户的业务状态信息、所述用户发起当前会话前和/或会话过程中用户的行为属性数据输入已采用机器学习方法训练的第一算法模型计算所述目标关联特征值。
可选地,所述计算模块还包括:
提问时间获取子模块,被配置为获取所述当前问句与所述有效问句的提问时间;
问句拼接子模块,被配置为将所述当前问句与提问时间和所述当前问句的提问时间间隔最短的有效问句进行拼接生成第一拼接问句;
第二计算子模块,被配置为计算所述第一拼接问句与所述至少一条召回信息间的目标关联特征值。
可选地,所述信息召回模块包括:
第二问句判断子模块,被配置为判断所述用户问句中是否含有有效问句;
若是,则运行语义分析子模块;
所述语义分析子模块,被配置为提取所述用户问句中的有效问句并将所述有效问句合并为第二拼接问句,根据语义分析算法对所述第二拼接问句进行语义分析并根据语义分析结果生成新问句;
第三信息召回子模块,被配置为根据所述新问句及与所述用户问句相关的属性信息触发信息召回指令进行信息召回并接收至少一条召回信息。
可选地,所述计算模块,还被配置为:
计算所述新问句与所述至少一条召回信息间的目标关联特征值。
可选地,所述第一问句判断子模块,还被配置为:
提取所述历史问句中的至少一个关键词;
在数据库中查找是否存在与所述至少一个关键词一致的业务目标特征词;
若是,则通过已采用机器学习方法训练的算法模型确定所述历史问句与标准问题间的语义相似度;
将所述历史问句中与所述标准问句间的语义相似度大于预设相似度阈值的问句确定为有效问句。
可选地,所述计算模块还包括:
有效问句判断子模块,被配置为判断所述历史问句是否含有有效问句;
若是,则运行所述历史问句特征值计算子模块;
若否,则运行特征值设置子模块;
所述特征值设置子模块,被配置为将所述当前问句与根据所述历史问句进行信息召回所接收的至少一条召回信息间的历史问句特征值置为预设特征值。
图4示出了根据本说明书一实施例的电子设备400的结构框图。该电子设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
电子设备400还包括接入设备440,接入设备440使得电子设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,电子设备400的上述部件以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的电子设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
电子设备400可以是任何类型的静止或移动电子设备,包括移动计算机或移动电子设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的电子设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止电子设备。电子设备400还可以是移动式或静止式的服务器。
其中,处理器420执行所述指令时实现如前所述信息处理方法的步骤。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述信息处理方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的信息处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述信息处理方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。