CN111782774A - 一种问题推荐的方法及装置 - Google Patents

一种问题推荐的方法及装置 Download PDF

Info

Publication number
CN111782774A
CN111782774A CN201910268019.7A CN201910268019A CN111782774A CN 111782774 A CN111782774 A CN 111782774A CN 201910268019 A CN201910268019 A CN 201910268019A CN 111782774 A CN111782774 A CN 111782774A
Authority
CN
China
Prior art keywords
feature
historical
feature vector
determining
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910268019.7A
Other languages
English (en)
Other versions
CN111782774B (zh
Inventor
吴康康
徐江
冯浩
王鹏
李奘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201910268019.7A priority Critical patent/CN111782774B/zh
Publication of CN111782774A publication Critical patent/CN111782774A/zh
Application granted granted Critical
Publication of CN111782774B publication Critical patent/CN111782774B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种问题推荐的方法及装置,包括在检测到客户端请求进行问题咨询后,获取客户端的特征信息集合和历史咨询记录集合;基于特征信息集合以及预先训练好的第一特征提取模型,确定特征信息集合中与问题咨询关联的有效特征信息,并确定有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与历史咨询记录集合中每种历史问题匹配的第二特征向量;基于有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合;向客户端发送推荐问题集合。通过这种方法,可以提高问题推荐的准确率,提高在线咨询的处理效率。

Description

一种问题推荐的方法及装置
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种问题推荐的方法及装置。
背景技术
目前,很多服务平台都具备在线客服系统,用户可以通过接入在线客服系统进行问题咨询。其中,在线客服系统中一般配置有机器人客服和人工客服两个咨询入口。例如,用户在登入在线客服系统之后,机器人客服可以首先为用户推荐一些可供选择的问题列表,用户可以在推荐的问题列表中选中所要咨询的问题,机器人客服便可提供与选中的问题对应的说明或解释。若用户与机器人客服交流时无法解决所要咨询的问题,则用户还可以进一步与人工客服之间进行问题咨询。
由于机器人客服推荐的问题列表的准确率直接影响了在线咨询的处理效率,而当前主流的推荐算法中,机器人客服通常根据相似用户的历史咨询情况来进行个性化推荐,但是这种推荐方式很难准确反映用户当前的咨询需求,进一步导致在线咨询的处理效率较低。
发明内容
有鉴于此,本申请的目的在于提供一种问题推荐的方法及装置,以提高在线咨询的处理效率。
第一方面,本申请实施例提供了一种问题推荐的方法,包括:
在检测到客户端请求进行问题咨询后,获取所述客户端的特征信息集合和历史咨询记录集合;
基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,并确定所述有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与所述历史咨询记录集合中每种历史问题匹配的第二特征向量;
基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合;
向所述客户端发送所述推荐问题集合。
一种可能的实施方式中,所述分类模型包括第一特征提取层、第二特征提取层、全连接层、以及分类器;
所述基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合,包括:
将所述有效特征信息的第一特征向量输入至所述第一特征提取层,得到所述有效特征信息的第一目标特征向量;以及,将每种历史问题匹配的第二特征向量输入至所述第二特征提取层,得到每种历史问题匹配的第二目标特征向量;
分别将每种历史问题匹配的第二目标特征向量与所述第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量;
将每种历史问题对应的第三目标特征向量输入至所述全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量;
利用所述分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率;
基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合。
一种可能的实施方式中,所述基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合,包括:
将被推荐概率的取值排列在前N位的历史问题,确定为所述推荐问题集合中的问题,N为正整数。
一种可能的实施方式中,所述特征信息集合中包括所述客户端的使用方的属性信息、以及所述客户端的服务状态信息。
一种可能的实施方式中,根据以下方式训练得到所述第一特征提取模型:
获取第一训练样本集合,所述第一训练样本集合中包括历史时间段内不同使用方的特征信息样本子集、以及每个特征信息样本子集对应的历史问题标签;每个特征信息样本子集中包括至少一个特征信息样本;
利用所述第一训练样本集合对第一基础特征提取模型进行第一训练过程;其中,所述第一训练过程包括:
从所述第一训练样本集合中选取预设数量的特征信息样本子集,输入至所述第一基础特征提取模型中,确定每个特征信息样本子集对应的预测问题;
基于每个特征信息样本子集对应的预测问题和历史问题标签,确定本轮训练过程的第一损失值;
若所述第一损失值不满足第一预设条件,则调整所述第一基础特征提取模型的第一模型参数,并利用调整后的第一基础特征提取模型,重复执行所述第一训练过程,直至确定所述第一损失值满足所述第一预设条件;其中,所述第一模型参数包括表征每个特征信息样本与问题咨询之间的关联程度的权重;
若所述第一损失值满足所述第一预设条件,则将当前得到的第一基础特征提取模型确定为所述第一特征提取模型。
一种可能的实施方式中,所述基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,包括:
将所述特征信息集合输入至所述第一特征提取模型中,通过将所述特征信息集合中每个特征信息与对应的权重进行相乘,确定每个特征信息与问题咨询之间的关联程度;
将关联程度满足第二预设条件的特征信息作为有效特征信息。
一种可能的实施方式中,所述第一特征提取模型为梯度提升树模型。
一种可能的实施方式中,根据以下方式构建所述候选特征向量集合:
基于每个参考客户端的历史咨询集合中的参考历史问题、参考历史问题对应的参考特征信息集合、以及预先训练好的第二特征提取模型,确定每个参考历史问题对应的参考特征向量并添加至所述候选特征向量集合中。
一种可能的实施方式中,根据以下方式训练得到所述第二特征提取模型:
获取第二训练样本集合,所述第二训练样本集合中包括多对关联历史问题、每对关联历史问题中每个历史问题对应的历史特征信息集合、以及每对关联历史问题对应的预测问题标签;
利用所述第二训练样本集合对第二基础特征提取模型进行第二训练过程;其中,所述第二训练过程包括:
基于每对关联历史问题中每个历史问题对应的历史特征信息集合、以及第二基础特征提取模型,确定每对关联历史问题对应的关联特征向量;
利用每对关联历史问题对应的关联特征向量,预测每对关联问题对应的候选关联问题;
基于每对关联问题对应的候选关联问题和预测问题标签,确定本轮训练过程的第二损失值;
若所述第二损失值不满足第三预设条件,则调整所述第二基础特征提取模型的第二模型参数,并利用调整后的第二基础特征提取模型,重复执行所述第二训练过程,直至确定所述第二损失值满足所述第三预设条件;其中,所述第二模型参数包括用于确定所述关联特征向量的权重矩阵;
若所述第二损失值满足所述第三预设条件,则将当前得到的第二基础特征提取模型确定为所述第二特征提取模型。
一种可能的实施方式中,所述第二特征提取模型为快速文本模型。
一种可能的实施方式中,根据以下方式训练得到所述分类模型:
获取第三训练样本集合,所述第三训练样本集合中包括多个样本子集,每个样本子集中包括有效特征信息样本对应的第一样本特征向量、参考历史咨询记录中参考历史问题对应的第二样本特征向量、以及该样本子集对应的推荐问题标签;
利用所述第三训练样本集合对基础分类模型进行第三训练过程;其中,所述第三训练过程包括:
基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题;
基于每个样本子集对应的被推荐问题和推荐问题标签,确定本轮训练过程的第三损失值;
若所述第三损失值不满足第四预设条件,则调整所述基础分类模型的第三模型参数,并利用调整后的基础分类模型,重复执行所述第三训练过程,直至确定所述第三损失值满足所述第四预设条件;
若所述第三损失值满足所述第四预设条件,则将当前得到的基础分类模型确定为所述分类模型。
第二方面,本申请实施例提供了一种问题推荐的装置,包括:
获取模块,用于在检测到客户端请求进行问题咨询后,获取所述客户端的特征信息集合和历史咨询记录集合;
第一确定模块,用于基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,并确定所述有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与所述历史咨询记录集合中每种历史问题匹配的第二特征向量;
第二确定模块,用于基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合;
发送模块,用于向所述客户端发送所述推荐问题集合。
一种可能的设计中,所述分类模型包括第一特征提取层、第二特征提取层、全连接层、以及分类器;
所述第二确定模块,在基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合时,具体用于:
将所述有效特征信息的第一特征向量输入至所述第一特征提取层,得到所述有效特征信息的第一目标特征向量;以及,将每种历史问题匹配的第二特征向量输入至所述第二特征提取层,得到每种历史问题匹配的第二目标特征向量;
分别将每种历史问题匹配的第二目标特征向量与所述第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量;
将每种历史问题对应的第三目标特征向量输入至所述全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量;
利用所述分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率;
基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合。
一种可能的设计中,所述第二确定模块,在基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合时,具体用于:
将被推荐概率的取值排列在前N位的历史问题,确定为所述推荐问题集合中的问题,N为正整数。
一种可能的设计中,所述特征信息集合中包括所述客户端的使用方的属性信息、以及所述客户端的服务状态信息。
一种可能的设计中,所述装置还包括:
第一训练模块,用于执行以下方式训练得到所述第一特征提取模型:
获取第一训练样本集合,所述第一训练样本集合中包括历史时间段内不同使用方的特征信息样本子集、以及每个特征信息样本子集对应的历史问题标签;每个特征信息样本子集中包括至少一个特征信息样本;
利用所述第一训练样本集合对第一基础特征提取模型进行第一训练过程;其中,所述第一训练过程包括:
从所述第一训练样本集合中选取预设数量的特征信息样本子集,输入至所述第一基础特征提取模型中,确定每个特征信息样本子集对应的预测问题;
基于每个特征信息样本子集对应的预测问题和历史问题标签,确定本轮训练过程的第一损失值;
若所述第一损失值不满足第一预设条件,则调整所述第一基础特征提取模型的第一模型参数,并利用调整后的第一基础特征提取模型,重复执行所述第一训练过程,直至确定所述第一损失值满足所述第一预设条件;其中,所述第一模型参数包括表征每个特征信息样本与问题咨询之间的关联程度的权重;
若所述第一损失值满足所述第一预设条件,则将当前得到的第一基础特征提取模型确定为所述第一特征提取模型。
一种可能的设计中,所述第一确定模块,在基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息时,具体用于:
将所述特征信息集合输入至所述第一特征提取模型中,通过将所述特征信息集合中每个特征信息与对应的权重进行相乘,确定每个特征信息与问题咨询之间的关联程度;
将关联程度满足第二预设条件的特征信息作为有效特征信息。
一种可能的设计中,所述第一特征提取模型为梯度提升树模型。
一种可能的设计中,所述装置还包括:
构建模块,用于根据以下方式构建所述候选特征向量集合:
基于每个参考客户端的历史咨询集合中的参考历史问题、参考历史问题对应的参考特征信息集合、以及预先训练好的第二特征提取模型,确定每个参考历史问题对应的参考特征向量并添加至所述候选特征向量集合中。
一种可能的设计中,所述装置还包括:
第二训练模块,用于根据以下方式训练得到所述第二特征提取模型:
获取第二训练样本集合,所述第二训练样本集合中包括多对关联历史问题、每对关联历史问题中每个历史问题对应的历史特征信息集合、以及每对关联历史问题对应的预测问题标签;
利用所述第二训练样本集合对第二基础特征提取模型进行第二训练过程;其中,所述第二训练过程包括:
基于每对关联历史问题中每个历史问题对应的历史特征信息集合、以及第二基础特征提取模型,确定每对关联历史问题对应的关联特征向量;
利用每对关联历史问题对应的关联特征向量,预测每对关联问题对应的候选关联问题;
基于每对关联问题对应的候选关联问题和预测问题标签,确定本轮训练过程的第二损失值;
若所述第二损失值不满足第三预设条件,则调整所述第二基础特征提取模型的第二模型参数,并利用调整后的第二基础特征提取模型,重复执行所述第二训练过程,直至确定所述第二损失值满足所述第三预设条件;其中,所述第二模型参数包括用于确定所述关联特征向量的权重矩阵;
若所述第二损失值满足所述第三预设条件,则将当前得到的第二基础特征提取模型确定为所述第二特征提取模型。
一种可能的设计中,所述第二特征提取模型为快速文本模型。
一种可能的设计中,所述装置还包括:
第三训练模块,用于根据以下方式训练得到所述分类模型:
获取第三训练样本集合,所述第三训练样本集合中包括多个样本子集,每个样本子集中包括有效特征信息样本对应的第一样本特征向量、参考历史咨询记录中参考历史问题对应的第二样本特征向量、以及该样本子集对应的推荐问题标签;
利用所述第三训练样本集合对基础分类模型进行第三训练过程;其中,所述第三训练过程包括:
基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题;
基于每个样本子集对应的被推荐问题和推荐问题标签,确定本轮训练过程的第三损失值;
若所述第三损失值不满足第四预设条件,则调整所述基础分类模型的第三模型参数,并利用调整后的基础分类模型,重复执行所述第三训练过程,直至确定所述第三损失值满足所述第四预设条件;
若所述第三损失值满足所述第四预设条件,则将当前得到的基础分类模型确定为所述分类模型。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面的任一种可能的实施方式中所述的问题推荐的方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的任一种可能的实施方式中所述的问题推荐的方法的步骤。
本申请实施例提供的问题推荐的方法,在检测到客户端请求进行问题咨询后,通过第一特征提取模型,确定客户端的信息集合中有效特征信息的第一特征向量,然后从预先构建的候选特征向量集合中,筛选出与客户端的历史咨询记录集合中的每种历史问题匹配的第二特征向量,再基于有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合,并向客户端发送确定出的推荐问题集合。
本申请所提供的方法,并未根据相似用户的历史咨询情况来进行问题推荐,而是基于客户端的特征信息集合和历史咨询记录集合,对可能推荐的问题进行预测,与现有的根据相似用户的历史咨询情况来进行问题推荐的方法相比,本申请所提供的方法能够准确反映用户当前的咨询需求,提高了推荐的问题列表的准确率,进而提高了在线咨询的处理效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种问题推荐的方法的流程示意图;
图2示出了本申请实施例提供的一种推荐问题集合确定方法的流程示意图;
图3示出了本申请实施例提供的一种第一特征提取模型的训练过程的流程示意图;
图4示出了本申请实施例提供的一种第二特征提取模型的训练过程的流程示意图;
图5示出了本申请实施例提供的一种分类模型的训练过程的流程示意图;
图6示出了本申请实施例提供的一种模型交互示意图;
图7示出了本申请实施例提供的一种问题推荐的装置的架构示意图;
图8示出了本申请实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景做出说明。本申请可适用于服务平台的在线客服系统。
现有技术中,在线客服系统包含有人工客服和机器人客服两种,机器人客服解决问题能力的大小直接影响人工客服的工作量。机器人客服在为用户提供服务时,一般是为用户推荐一些可以供用户选择的问题列表,用户可以根据推荐的问题列表,选择想要咨询的问题,其中,机器人客服所推荐的问题列表是否与用户想要咨询的问题相匹配将直接影响到机器人客服的处理效率。
在本申请所提供的方法中,是基于客户端的特征信息集合和历史咨询记录集合,对推荐问题进行预测,提高了问题推荐的准确率和在线咨询的处理效率。下面,将结合具体实施例,对本申请所提供的问题推荐的方法展开介绍。
实施例一
参见图1所示,为本申请实施例所提供的一种问题推荐的方法的流程示意图,包括以下步骤:
步骤101、在检测到客户端请求进行问题咨询后,获取客户端的特征信息集合和历史咨询记录集合。
步骤102、基于特征信息集合以及预先训练好的第一特征提取模型,确定特征信息集合中与问题咨询关联的有效特征信息,并确定有效特征信息的第一特征向量。
其中,第一特征提取模型的训练过程将在实施例二中详细介绍,在此暂不展开说明。
步骤103、从预先构建的候选特征向量集合中,筛选出与历史咨询记录集合中每种历史问题匹配的第二特征向量。
需要说明的是,步骤102和步骤103的执行不分先后顺序。
步骤104、基于有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合。
其中,分类模型的训练方法将在实施例二中详细介绍,在此暂不展开说明。
步骤105、向客户端发送推荐问题集合。
以下是对上述步骤的具体说明:
针对步骤101,检测客户端是否请求进行问题咨询的方式可以是:检测用户是否通过客户端触发在线客服功能对应的图标,或者检测客户端是否处于在线客服功能的应用界面。当检测到用户通过客户端触发在线客服功能对应的图标或者检测到客户端处于在线客服功能的应用界面时,则确定客户端进行问题咨询。
进一步地,服务器在检测到客户端请求进行问题咨询后,可以获取客户端的特征信息集合和历史咨询记录集合,然后基于获取的特征信息集合和历史咨询记录集合对于要推荐的问题作出预测,并向客户端发送预测的推荐问题。
本申请一示例中,客户端的特征信息集合包括客户端的使用方的属性信息、以及客户端的服务状态信息。
其中,客户端的使用方的属性信息可以是使用方短时间内并不会改变的属性信息,例如使用方的年龄、性别、注册到服务平台的注册时间、身份证号、手机号码等;客户端的服务状态信息可以是使用方在最近时间段内的一些更新周期较短的服务状态信息,例如可以是提供服务时周围可分配的服务订单数量、当前执行的服务订单状态、服务提供方的服务评分等。
针对步骤102,在获取到客户端的特征信息集合后,可以先将客户端的特征信息集合中的特征信息转换为特征向量后,再输入至第一特征提取模型中进行预测。
示例性的,将客户端的特征信息转换为特征向量的方式,可以采用独热编码的方式。参照表1所示,为一种可能的编码方式。
表1
Figure BDA0002017470090000091
Figure BDA0002017470090000101
由上表可知,用户A为男性,年龄在30岁以上,用户A的特征向量可以表示为{1,0,1,0};用户B为男性,年龄小于30岁,用户B的特征向量可以表示为{1,0,0,1};用户C为女性,年龄在30岁以上,用户C的特征向量可以表示为{0,1,1,0};用户D为女性,年龄小于30岁,用户D的特征向量可以表示为{0,1,0,1}。
考虑到并不是所有的特征信息对于预测推荐问题都是有用的,或者,考虑到不同特征信息对于预测推荐问题的重要性不同,为提高运算效率,可以先从特征信息中筛选出有效特征信息,然后基于有效特征信息进行推荐问题的预测过程。
示例性的,筛选有效特征信息的具体实施方式包括:
一种可能的实施方式中,可以基于预先训练好的第一特征提取模型对特征信息集合中的特征信息进行筛选,确定出有效特征信息。
其中,在基于特征信息集合以及预先训练好的第一特征提取模型,确定特征信息集合中与问题咨询关联的有效特征信息时,可以将特征信息集合中所包含的每一个特征信息的特征向量输入至预先训练好的第一特征提取模型中,得到每一个特征信息的权重,然后根据得到的特征信息的权重,确定有效特征信息。
其中,在根据特征信息的权重,确定有效特征信息时,可以通过以下三种方式中的任意一种方式:
方式一、将所有特征信息的权重按照从大到小的顺序进行排列,将前M个权重所对应的特征信息确定为有效特征信息,其中,M为正整数。
方式二、将权重大于预设权重的特征信息确定有效特征信息。
方式三、将所有特征信息的权重按照从大到小的顺序进行排列,然后计算前P个权重之和与所有特征信息权重之和的比值,当比值大于预设比值时,将前P个权重所对应的特征信息确定为有效特征信息,其中,P为正整数。
另外一种实施方式中,还可以将特征信息集合输入至第一特征提取模型中,然后通过将特征信息集合中每个特征信息与对应的权重进行相乘,确定每个特征信息与问题咨询之间的关联程度,并将关联程度满足第二预设条件的特征信息作为有效特征信息。
示例性地,可以将关联程度大于预设关联程度的特征信息作为有效特征信息。
在一种可能的应用场景中,第一特征提取模型可以是梯度提升树模型。
进一步地,筛选出有效特征信息后,可以将有效特征信息对应的特征向量确定为第一特征向量。
本申请一示例中,除通过第一特征提取模型进行有效特征信息的筛选外,还可以通过计算各个特征信息的方差,然后将方差大于预设方差的特征信息确定为有效特征信息,具体的计算特征信息的方差在此将不再展开说明。
针对步骤103,考虑到现有技术中,在进行问题预测时,是根据用户的问题咨询,从数据库中存储的推荐问题中选择出最可能的推荐问题,并推荐给用户,而当推荐问题较多时,选择过程可能会耗费较多的资源,且选择的准确率并无法得到保障。
而本申请所提供的方法中,在获取到客户端的历史咨询记录集合后,可以从预先构建的候选特征向量集合中筛选出与历史咨询记录集合中每种历史问题匹配的第二特征向量,其中,筛选出的第二特征向量为与历史咨询记录相关的历史问题的特征向量。
由于本申请所提供的方法中,并不是从所有的问题中直接选择推荐给用户的问题,而是先筛选出与客户端的使用方的历史咨询记录相关的问题,然后从相关的问题中,选择推荐给用户的问题,因此,通过上述方法,能够提高问题筛选的效率和准确率。
其中,在构建候选特征向量集合时,可以基于每个参考客户端的历史咨询集合中的参考历史问题、参考历史问题对应的参考特征信息集合、以及预先训练好的第二特征提取模型,确定每个参考历史问题对应的参考特征向量,并添加至候选特征向量集合中。在一种可能的实施方式中,第二特征提取模型可以是快速文本模型。关于第二特征模型的具体训练过程将在下文实施例中进行说明。
针对步骤104,在通过第一特征提取模型确定有效特征信息的第一特征向量、通过第二特征提取模型,确定每种历史问题匹配的第二特征向量之后,可以基于有效特征信息的第一特征向量和每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合。
例如,特征信息集合包括m个特征信息,经过第一特征提取模型筛选之后,将m个特征信息中的n个特征信息作为有效特征信息,历史问题共有4个,基于第二特征提取模型,确定4个历史问题分别匹配的第二特征向量,则将n个特征信息和4个历史问题分别匹配的第二特征向量输入至预先训练好的分类模型中,确定客户端的推荐问题集合。
其中,分类模型可以包括第一特征提取层、第二特征提取层、全连接层以及分类器。
实际应用中,在基于有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合时,可以参照图2所示的推荐问题集合确定方法,包括以下步骤:
步骤201、将有效特征信息的第一特征向量输入至第一特征提取层,得到有效特征信息的第一目标特征向量。
在从客户端获取的特征信息集合中筛选出有效特征信息之后,有效特征信息的第一特征向量可以表达有效特征信息的基础特征,但无法表达有效特征信息深层次的特征,因此,可以通过第一特征提取层进一步提取有效特征信息的特征,此时提取的有效信息的特征为考虑到有效特征信息之间的关联关系后所提取的特征。
本申请一示例中,第一特征提取层可以为交叉网络。
具体实施中,首先,可以按照以下公式计算客户端的使用方的历史咨询记录所对应的历史咨询向量:
Figure BDA0002017470090000121
其中,Fh表示客户端的使用方的历史咨询记录所对应的历史咨询向量,Li表示客户端的使用方的历史咨询记录中所包含的历史问题的个数,qi表示第i个历史问题所对应的特征向量。
然后,将客户端的使用方的历史咨询记录所对应的历史咨询向量和有效特征信息所对应的第一特征向量作为交叉网络的一种模型参数,即x0=[Fsd,Fss,Fh]T,其中,Fsd为客户端的使用方的属性信息所对应的特征向量,Fss为客户端的服务状态信息所对应的特征向量。
其中,在交叉网络中,第k层的特征向量的计算方法可以参照以下公式所示:
Figure BDA0002017470090000122
其中,xc,k表示第k层的特征向量,xc,k-1表示第k-1层的特征向量,x0、wk和bk均表示模型参数,
Figure BDA0002017470090000123
表示第k-1层的特征向量的转置。
通过上述交叉网络可以提取到能够体现特征信息之间联系的第一目标特征向量。
步骤202、将每种历史问题匹配的第二特征向量输入至第二特征提取层,得到每种历史问题匹配的第二目标特征向量。
需要说明的是,步骤201和步骤202的执行不分先后顺序。
在本步骤中,可以将每种历史问题匹配的第二特征向量输入至第二特征提取层,提取用于表示每种历史问题的深层次特征信息的第二目标特征向量。本申请一示例中,第二特征提取模型可以是深度网络。
实际应用中,深度网络中第m层的特征向量的计算可以参照以下公式:
xd,m=Relu(wmxd,m-1+bm)
其中,wm和bm均表示模型参数,xd,m表示第m层的特征向量,xd,m-1表示第m-1层的特征向量,Relu为激活函数,具体激活函数的计算过程在此将不再展开说明。
步骤203、分别将每种历史问题匹配的第二目标特征向量与第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量。
具体的,通过交叉网络得到的第一目标特征向量为xc,k,通过深度网络得到的第二目标特征向量为xd,m-1,将xc,k和xd,m-1进行拼接,然后得到每种历史问题对应的第三目标特征向量。
示例性的,若第一目标特征向量的{1,2,3,4},第二目标特征向量为{5,6,7,8},则将第一目标特征向量和第二目标特征向量进行拼接后得到的第三目标特征向量可以为{1,2,3,4,5,6,7,8}。
步骤204、将每种历史问题对应的第三目标特征向量输入至全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量。
步骤205、利用分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率。
具体的,在确定每种历史问题的被推荐概率时,可以按照如下公式进行计算:
y=tanh(wfx+bf)
其中,wf和bf均表示模型参数,x表示历史问题对应的第四目标特征向量。
步骤206、基于每种历史问题的被推荐概率,确定客户端的推荐问题集合。
其中,在基于每种历史问题的被推荐概率,确定客户端的推荐问题集合时,可以参照以下方式中的任何一种方式:
方式一、将每种历史问题的被推荐概率按照从大到小的顺序进行排列,将被推荐概率的取值排列在前N位的历史问题,确定为推荐问题集合中的问题,N为正整数。
方式二、将被推荐概率的取值超过预设概率的历史问题,确定为推荐问题集合中的问题。
本申请实施例提供的问题推荐的方法,在检测到客户端请求进行问题咨询后,通过第一特征提取模型,确定客户端的信息集合中有效特征信息的第一特征向量,然后从预先构建的候选特征向量集合中,筛选出与客户端的历史咨询记录集合中的每种历史问题匹配的第二特征向量,再基于有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合,并向客户端发送确定出的推荐问题集合。
本实施例所提供的方法,并未根据相似用户的历史咨询情况来进行问题推荐,而是基于客户端的特征信息集合和历史咨询记录集合,对可能推荐的问题进行预测,与现有的根据相似用户的历史咨询情况来进行问题推荐的方法相比,本申请所提供的方法能够准确反映用户当前的咨询需求,提高了推荐的问题列表的准确率,进而提高了在线咨询的处理效率。
实施例二
本申请实施例中,将对实施例一中所用到的第一特征提取模型、第二特征提取模型以及分类模型的训练过程展开说明。
需要说明的是,第一特征提取模型的训练过程和第二特征提取模型的训练过程在执行时可以不分先后顺序,分类模型的训练过程可以在第一特征提取模型和第二特征提取模型训练完成之后执行。
一、第一特征提取模型的训练过程。
参见图3所示,为本申请实施例提供的一种第一特征提取模型的训练过程的流程示意图,包括以下步骤:
步骤301、获取第一训练样本集合。
其中,第一训练样本集合中包括历史时间段内不同使用方的特征信息样本子集、以及每个特征信息样本子集对应的历史问题标签;每个特征信息样本子集中包括至少一个特征信息样本。
考虑到时间跨度较大时,同一使用方的特征信息可能会发生较大变化,因此,在获取第一训练样本集合中所包含的使用方的特征信息时,应获取距离当前时刻在预设时长之内的特征信息。
步骤302、利用第一训练样本集合对第一基础特征提取模型进行第一训练过程。
其中,第一训练过程包括:
步骤3021、从第一训练样本集合中选取预设数量的特征信息样本子集,输入至第一基础特征提取模型中,确定每个特征信息样本子集对应的预测问题。
步骤3022、基于每个特征信息样本子集对应的预测问题和历史问题标签,确定本轮训练过程的第一损失值。
步骤3023、判断第一损失值是否满足第一预设条件。
示例性的,在判断第一损失值是否满足第一预设条件时,可以是判断第一损失值的取值是否小于第一预设损失值。
若判断结果为是,则执行步骤3024;
若判断结果为否,则执行步骤3025。
步骤3024、将当前得到的第一基础特征提取模型确定为第一特征提取模型。
步骤3025、调整第一基础特征提取模型的第一模型参数,并返回执行步骤3021。
其中,第一模型参数包括表征每个特征信息样本与问题咨询之间的关联程度的权重,若某一特征信息样本与问题咨询之间的关联程度越高,则该特征信息样本的权重应该越大。
实际的训练过程中,可以先随机给各个特征信息样本赋予权重,然后在训练第一基础特征提取模型的过程中不断调整每个特征信息样本所对应的权重,最终,在确定第一损失值满足第一预设条件时,将此时每个特征信息样本所对应的权重确定为特征信息样本最终的权重。
示例性地,在对第一特征提取模型进行训练时,可以先获取历史问题,以及每个历史问题对应的特征信息样本集合,在对第一基础特征提取模型进行训练时,可以将所有的特征信息样本集合输入至第一基础特征提取模型中,第一基础特征提取模型可以基于每一个特征信息集合,预测每一个特征信息集合所对应的历史问题,然后根据预测的历史问题与每个特征集合所对应的历史问题标签,确定本次训练的第一损失值,当确定的第一损失值不满足第一预设条件时,调整第一基础特征提取模型的第一模型参数,并利用调整后的模型,重新进行训练,直至确定出的第一损失值满足第一预设条件,并在确定出的第一损失值满足第一预设条件时的第一基础特征提取模型确定为第一特征提取模型。
需要说明的是,在第一特征提取模型训练过程中,需要根据预测出的历史问题,确定本次训练的准确率,而当第一特征提取模型训练好之后,并不需要根据第一特征提取模型预测历史问题,而是需要根据第一特征提取模型确定所输入的特征信息的权重,并根据所确定的特征信息的权重,筛选出有效特征信息。
二、第二特征提取模型的训练过程。
参见图4所示,为本申请实施例提供的一种第二特征提取模型的训练过程的流程示意图,包括以下步骤:
步骤401、获取第二训练样本集合。
其中,第二训练样本集合中包括多对关联历史问题、每对关联历史问题中每个历史问题对应的历史特征信息集合、以及每对关联历史问题对应的预测问题标签。
一种可能的应用场景中,历史问题的关联关系可以是通过人工进行判定的。在实际应用中,可以先确定一组相关问题,其中每一组相关问题可以包含三个历史问题,然后从一组相关问题中任意选择两个历史问题作为关联历史问题,然后将同一组相关问题中的另外一个历史问题作为预测问题问题标签,通过两个关联历史问题分别对应的历史特征信息集合来进行问题预测。
步骤402、利用所述第二训练样本集合对第二基础特征提取模型进行第二训练过程。
其中,第二训练过程包括:
步骤4021、基于每对关联历史问题中每个历史问题对应的历史特征信息集合、以及第二基础特征提取模型,确定每对关联历史问题对应的关联特征向量。
步骤4022、利用每对关联历史问题对应的关联特征向量,预测每对关联问题对应的候选关联问题。
步骤4023、基于每对关联问题对应的候选关联问题和预测问题标签,确定本轮训练过程的第二损失值。
步骤4024、判断第二损失值是否满足第三预设条件。
其中,在判断第二损失值是否满足第三预设条件时,可以判断第二损失值是否小于第二预设损失值。
若判断结果为是,则执行步骤4025;
若判断结果为否,则执行步骤4026。
步骤4025、将当前得到的第二基础特征提取模型确定为第二特征提取模型。
步骤4026、调整第二基础特征提取模型的第二模型参数,并返回执行步骤4021。
其中,第二模型参数包括用于确定所述关联特征向量的权重矩阵。
三、分类模型的训练过程。
在将第一特征提取模型和第二特征提取模型训练好之后,可以利用第一特征提取模型和第二特征提取模型的输出对分类模型进行训练。
参见图5所示,为本申请实施例提供的一种分类模型的训练过程的流程示意图,包括以下步骤:
步骤501、获取第三训练样本集合。
其中,第三训练样本集合中包括多个样本子集,每个样本子集中包括有效特征信息样本对应的第一样本特征向量、参考历史咨询记录中参考历史问题对应的第二样本特征向量、以及该样本子集对应的推荐问题标签。
具体的,有效特征信息样本对应的第一样本特征向量可以是将特征信息输入至预先训练好的第一特征提取模型得到的,参考历史咨询记录中参考历史问题对应的第二样本特征向量可以是将参考问题、参考问题对应的参考特征信息集合输入至预先训练好的第二特征提取模型得到的。
步骤502、利用所述第三训练样本集合对基础分类模型进行第三训练过程。
其中,第三训练过程包括:
步骤5021、基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题。
其中,在基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题时,可以是确定每个样本子集对应的被推荐问题是该样本子集对应的推荐问题的概率。
示例性的,可以按照如下公式进行计算:
yj=tanh(wfx+bf)
其中,yj表示第j个被推荐问题与第j个推荐问题标签一致的概率,wf和bf表示基础分类模型的第三模型参数,x表示分类模型的输入分别经过第一特征提取层和第二特征提取层的输出,在全连接层经过特征融合之后所得到的第四目标特征向量。
步骤5022、基于每个样本子集对应的被推荐问题和推荐问题标签,确定本轮训练过程的第三损失值。
其中,在确定第三损失值时,可以按照如下公式进行计算:
Figure BDA0002017470090000171
其中,u为模型训练过程中所用到的样本子集总数,yj表示第j个被推荐问题与第j个推荐问题标签一致的概率,y′j表示推荐问题标签的真实取值,一示例中,y′j的取值为1。
步骤5023、判断第三损失值是否满足第四预设条件。
若判断结果为是,则顺序执行步骤5024;
若判断结果为否,则执行步骤5025。
步骤5024、将当前得到的基础分类模型确定为分类模型。
步骤5025、调整基础分类模型的第三模型参数,并返回执行步骤5021。
其中,所述第三模型参数包括第一特征提取层、第二特征提取层、全连接层以及分类器的模型参数。
参见图6所示,为本申请实施例所提供的一种模型交互示意图,包括第一特征提取模型、第二特征提取模型、以及分类模型。
首先,将特征信息集合输入至第一特征提取模型后,得到第一特征向量,历史咨询记录集合和预先构建的候选特征向量集合输入至第二特征提取模型后,得到第二特征向量,然后将第一特征向量和第二特征向量分别输入至分类模型中。
具体的,将第一特征向量输入至第一特征提取层,得到第一目标特征向量,将第二特征向量输入至第二特征提取层,得到第二目标特征向量,然后将第一目标特征向量和第二目标特征向量进行拼接,得到第三目标特征向量,再将第三目标特征向量输入至全连接层,得到第四目标特征向量,再将第四目标特征向量输入至分类器,输出得到每种问题的被推荐概率。
通过本实施例提供的方法,可以训练得到第一特征提取模型、第二特征提取模型、以及分类模型,并将训练得到的模型应用到实施例一中所提供的问题推荐的方法中,提高问题推荐的准确率,进而提高在线客服的处理效率。
实施例三
本实施例提供了一种问题推荐的装置,参见图7所示,为本申请实施例提供的一种问题推荐的装置700的架构示意图,包括获取模块701、第一确定模块702、第二确定模块703、以及发送模块704,具体的:
获取模块701,用于在检测到客户端请求进行问题咨询后,获取所述客户端的特征信息集合和历史咨询记录集合;
第一确定模块702,用于基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,并确定所述有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与所述历史咨询记录集合中每种历史问题匹配的第二特征向量;
第二确定模块703,用于基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合;
发送模块704,用于向所述客户端发送所述推荐问题集合。
一种可能的设计中,所述分类模型包括第一特征提取层、第二特征提取层、全连接层、以及分类器;
所述第二确定模块703,在基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合时,具体用于:
将所述有效特征信息的第一特征向量输入至所述第一特征提取层,得到所述有效特征信息的第一目标特征向量;以及,将每种历史问题匹配的第二特征向量输入至所述第二特征提取层,得到每种历史问题匹配的第二目标特征向量;
分别将每种历史问题匹配的第二目标特征向量与所述第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量;
将每种历史问题对应的第三目标特征向量输入至所述全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量;
利用所述分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率;
基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合。
一种可能的设计中,所述第二确定模块703,在基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合时,具体用于:
将被推荐概率的取值排列在前N位的历史问题,确定为所述推荐问题集合中的问题,N为正整数。
一种可能的设计中,所述特征信息集合中包括所述客户端的使用方的属性信息、以及所述客户端的服务状态信息。
一种可能的设计中,所述装置还包括:
第一训练模块705,用于执行以下方式训练得到所述第一特征提取模型:
获取第一训练样本集合,所述第一训练样本集合中包括历史时间段内不同使用方的特征信息样本子集、以及每个特征信息样本子集对应的历史问题标签;每个特征信息样本子集中包括至少一个特征信息样本;
利用所述第一训练样本集合对第一基础特征提取模型进行第一训练过程;其中,所述第一训练过程包括:
从所述第一训练样本集合中选取预设数量的特征信息样本子集,输入至所述第一基础特征提取模型中,确定每个特征信息样本子集对应的预测问题;
基于每个特征信息样本子集对应的预测问题和历史问题标签,确定本轮训练过程的第一损失值;
若所述第一损失值不满足第一预设条件,则调整所述第一基础特征提取模型的第一模型参数,并利用调整后的第一基础特征提取模型,重复执行所述第一训练过程,直至确定所述第一损失值满足所述第一预设条件;其中,所述第一模型参数包括表征每个特征信息样本与问题咨询之间的关联程度的权重;
若所述第一损失值满足所述第一预设条件,则将当前得到的第一基础特征提取模型确定为所述第一特征提取模型。
一种可能的设计中,所述第一确定模块702,在基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息时,具体用于:
将所述特征信息集合输入至所述第一特征提取模型中,通过将所述特征信息集合中每个特征信息与对应的权重进行相乘,确定每个特征信息与问题咨询之间的关联程度;
将关联程度满足第二预设条件的特征信息作为有效特征信息。
一种可能的设计中,所述第一特征提取模型为梯度提升树模型。
一种可能的设计中,所述装置还包括:
构建模块706,用于根据以下方式构建所述候选特征向量集合:
基于每个参考客户端的历史咨询集合中的参考历史问题、参考历史问题对应的参考特征信息集合、以及预先训练好的第二特征提取模型,确定每个参考历史问题对应的参考特征向量并添加至所述候选特征向量集合中。
一种可能的设计中,所述装置还包括:
第二训练模块707,用于根据以下方式训练得到所述第二特征提取模型:
获取第二训练样本集合,所述第二训练样本集合中包括多对关联历史问题、每对关联历史问题中每个历史问题对应的历史特征信息集合、以及每对关联历史问题对应的预测问题标签;
利用所述第二训练样本集合对第二基础特征提取模型进行第二训练过程;其中,所述第二训练过程包括:
基于每对关联历史问题中每个历史问题对应的历史特征信息集合、以及第二基础特征提取模型,确定每对关联历史问题对应的关联特征向量;
利用每对关联历史问题对应的关联特征向量,预测每对关联问题对应的候选关联问题;
基于每对关联问题对应的候选关联问题和预测问题标签,确定本轮训练过程的第二损失值;
若所述第二损失值不满足第三预设条件,则调整所述第二基础特征提取模型的第二模型参数,并利用调整后的第二基础特征提取模型,重复执行所述第二训练过程,直至确定所述第二损失值满足所述第三预设条件;其中,所述第二模型参数包括用于确定所述关联特征向量的权重矩阵;
若所述第二损失值满足所述第三预设条件,则将当前得到的第二基础特征提取模型确定为所述第二特征提取模型。
一种可能的设计中,所述第二特征提取模型为快速文本模型。
一种可能的设计中,所述装置还包括:
第三训练模块708,用于根据以下方式训练得到所述分类模型:
获取第三训练样本集合,所述第三训练样本集合中包括多个样本子集,每个样本子集中包括有效特征信息样本对应的第一样本特征向量、参考历史咨询记录中参考历史问题对应的第二样本特征向量、以及该样本子集对应的推荐问题标签;
利用所述第三训练样本集合对基础分类模型进行第三训练过程;其中,所述第三训练过程包括:
基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题;
基于每个样本子集对应的被推荐问题和推荐问题标签,确定本轮训练过程的第三损失值;
若所述第三损失值不满足第四预设条件,则调整所述基础分类模型的第三模型参数,并利用调整后的基础分类模型,重复执行所述第三训练过程,直至确定所述第三损失值满足所述第四预设条件;
若所述第三损失值满足所述第四预设条件,则将当前得到的基础分类模型确定为所述分类模型。
本实施例提供的问题推荐的装置,在检测到客户端请求进行问题咨询后,通过第一特征提取模型,确定客户端的信息集合中有效特征信息的第一特征向量,然后从预先构建的候选特征向量集合中,筛选出与客户端的历史咨询记录集合中的每种历史问题匹配的第二特征向量,再基于有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定客户端的推荐问题集合,并向客户端发送确定出的推荐问题集合。
本实施例所提供的装置,并未根据相似用户的历史咨询情况来进行问题推荐,而是基于客户端的特征信息集合和历史咨询记录集合,对可能推荐的问题进行预测,与现有的根据相似用户的历史咨询情况来进行问题推荐的方法相比,本申请所提供的方法能够准确反映用户当前的咨询需求,提高了推荐的问题列表的准确率,进而提高了在线咨询的处理效率。
实施例四
基于相同的技术构思,本申请实施例还提供了一种电子设备。参照图8所示,为本申请实施例提供的电子设备800的结构示意图,包括处理器801、存储器802、和总线803。其中,存储器802用于存储执行指令,包括内存8021和外部存储器8022;这里的内存8021也称内存储器,用于暂时存放处理器801中的运算数据,以及与硬盘等外部存储器8022交换的数据,处理器801通过内存8021与外部存储器8022进行数据交换,当电子设备800运行时,处理器801与存储器802之间通过总线803通信,使得处理器801在执行以下指令:
在检测到客户端请求进行问题咨询后,获取所述客户端的特征信息集合和历史咨询记录集合;
基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,并确定所述有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与所述历史咨询记录集合中每种历史问题匹配的第二特征向量;
基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合;
向所述客户端发送所述推荐问题集合。
一种可能的设计中,处理器801执行的处理中,所述分类模型包括第一特征提取层、第二特征提取层、全连接层、以及分类器;
所述基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合,包括:
将所述有效特征信息的第一特征向量输入至所述第一特征提取层,得到所述有效特征信息的第一目标特征向量;以及,将每种历史问题匹配的第二特征向量输入至所述第二特征提取层,得到每种历史问题匹配的第二目标特征向量;
分别将每种历史问题匹配的第二目标特征向量与所述第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量;
将每种历史问题对应的第三目标特征向量输入至所述全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量;
利用所述分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率;
基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合。
一种可能的设计中,处理器801执行的处理中,所述基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合,包括:
将被推荐概率的取值排列在前N位的历史问题,确定为所述推荐问题集合中的问题,N为正整数。
一种可能的设计中,处理器801执行的处理中,所述特征信息集合中包括所述客户端的使用方的属性信息、以及所述客户端的服务状态信息。
一种可能的设计中,处理器801执行的处理中,根据以下方式训练得到所述第一特征提取模型:
获取第一训练样本集合,所述第一训练样本集合中包括历史时间段内不同使用方的特征信息样本子集、以及每个特征信息样本子集对应的历史问题标签;每个特征信息样本子集中包括至少一个特征信息样本;
利用所述第一训练样本集合对第一基础特征提取模型进行第一训练过程;其中,所述第一训练过程包括:
从所述第一训练样本集合中选取预设数量的特征信息样本子集,输入至所述第一基础特征提取模型中,确定每个特征信息样本子集对应的预测问题;
基于每个特征信息样本子集对应的预测问题和历史问题标签,确定本轮训练过程的第一损失值;
若所述第一损失值不满足第一预设条件,则调整所述第一基础特征提取模型的第一模型参数,并利用调整后的第一基础特征提取模型,重复执行所述第一训练过程,直至确定所述第一损失值满足所述第一预设条件;其中,所述第一模型参数包括表征每个特征信息样本与问题咨询之间的关联程度的权重;
若所述第一损失值满足所述第一预设条件,则将当前得到的第一基础特征提取模型确定为所述第一特征提取模型。
一种可能的设计中,处理器801执行的处理中,所述基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,包括:
将所述特征信息集合输入至所述第一特征提取模型中,通过将所述特征信息集合中每个特征信息与对应的权重进行相乘,确定每个特征信息与问题咨询之间的关联程度;
将关联程度满足第二预设条件的特征信息作为有效特征信息。
一种可能的设计中,处理器801执行的处理中,所述第一特征提取模型为梯度提升树模型。
一种可能的设计中,处理器801执行的处理中,根据以下方式构建所述候选特征向量集合:
基于每个参考客户端的历史咨询集合中的参考历史问题、参考历史问题对应的参考特征信息集合、以及预先训练好的第二特征提取模型,确定每个参考历史问题对应的参考特征向量并添加至所述候选特征向量集合中。
一种可能的设计中,处理器801执行的处理中,根据以下方式训练得到所述第二特征提取模型:
获取第二训练样本集合,所述第二训练样本集合中包括多对关联历史问题、每对关联历史问题中每个历史问题对应的历史特征信息集合、以及每对关联历史问题对应的预测问题标签;
利用所述第二训练样本集合对第二基础特征提取模型进行第二训练过程;其中,所述第二训练过程包括:
基于每对关联历史问题中每个历史问题对应的历史特征信息集合、以及第二基础特征提取模型,确定每对关联历史问题对应的关联特征向量;
利用每对关联历史问题对应的关联特征向量,预测每对关联问题对应的候选关联问题;
基于每对关联问题对应的候选关联问题和预测问题标签,确定本轮训练过程的第二损失值;
若所述第二损失值不满足第三预设条件,则调整所述第二基础特征提取模型的第二模型参数,并利用调整后的第二基础特征提取模型,重复执行所述第二训练过程,直至确定所述第二损失值满足所述第三预设条件;其中,所述第二模型参数包括用于确定所述关联特征向量的权重矩阵;
若所述第二损失值满足所述第三预设条件,则将当前得到的第二基础特征提取模型确定为所述第二特征提取模型。
一种可能的设计中,处理器801执行的处理中,所述第二特征提取模型为快速文本模型。
一种可能的设计中,处理器801执行的处理中,根据以下方式训练得到所述分类模型:
获取第三训练样本集合,所述第三训练样本集合中包括多个样本子集,每个样本子集中包括有效特征信息样本对应的第一样本特征向量、参考历史咨询记录中参考历史问题对应的第二样本特征向量、以及该样本子集对应的推荐问题标签;
利用所述第三训练样本集合对基础分类模型进行第三训练过程;其中,所述第三训练过程包括:
基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题;
基于每个样本子集对应的被推荐问题和推荐问题标签,确定本轮训练过程的第三损失值;
若所述第三损失值不满足第四预设条件,则调整所述基础分类模型的第三模型参数,并利用调整后的基础分类模型,重复执行所述第三训练过程,直至确定所述第三损失值满足所述第四预设条件;
若所述第三损失值满足所述第四预设条件,则将当前得到的基础分类模型确定为所述分类模型。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行问题推荐的方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述问题推荐的方法,从而提高问题推荐的准确率,进而提高在线咨询的处理效率。
本申请实施例所提供的问题推荐的方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种问题推荐的方法,其特征在于,包括:
在检测到客户端请求进行问题咨询后,获取所述客户端的特征信息集合和历史咨询记录集合;
基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,并确定所述有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与所述历史咨询记录集合中每种历史问题匹配的第二特征向量;
基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合;
向所述客户端发送所述推荐问题集合。
2.如权利要求1所述的方法,其特征在于,所述分类模型包括第一特征提取层、第二特征提取层、全连接层、以及分类器;
所述基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合,包括:
将所述有效特征信息的第一特征向量输入至所述第一特征提取层,得到所述有效特征信息的第一目标特征向量;以及,将每种历史问题匹配的第二特征向量输入至所述第二特征提取层,得到每种历史问题匹配的第二目标特征向量;
分别将每种历史问题匹配的第二目标特征向量与所述第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量;
将每种历史问题对应的第三目标特征向量输入至所述全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量;
利用所述分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率;
基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合。
3.如权利要求1或2所述的方法,其特征在于,所述特征信息集合中包括所述客户端的使用方的属性信息、以及所述客户端的服务状态信息。
4.如权利要求1所述的方法,其特征在于,根据以下方式训练得到所述第一特征提取模型:
获取第一训练样本集合,所述第一训练样本集合中包括历史时间段内不同使用方的特征信息样本子集、以及每个特征信息样本子集对应的历史问题标签;每个特征信息样本子集中包括至少一个特征信息样本;
利用所述第一训练样本集合对第一基础特征提取模型进行第一训练过程;其中,所述第一训练过程包括:
从所述第一训练样本集合中选取预设数量的特征信息样本子集,输入至所述第一基础特征提取模型中,确定每个特征信息样本子集对应的预测问题;
基于每个特征信息样本子集对应的预测问题和历史问题标签,确定本轮训练过程的第一损失值;
若所述第一损失值不满足第一预设条件,则调整所述第一基础特征提取模型的第一模型参数,并利用调整后的第一基础特征提取模型,重复执行所述第一训练过程,直至确定所述第一损失值满足所述第一预设条件;其中,所述第一模型参数包括表征每个特征信息样本与问题咨询之间的关联程度的权重;
若所述第一损失值满足所述第一预设条件,则将当前得到的第一基础特征提取模型确定为所述第一特征提取模型。
5.如权利要求4所述的方法,其特征在于,所述基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,包括:
将所述特征信息集合输入至所述第一特征提取模型中,通过将所述特征信息集合中每个特征信息与对应的权重进行相乘,确定每个特征信息与问题咨询之间的关联程度;
将关联程度满足第二预设条件的特征信息作为有效特征信息。
6.如权利要求1所述的方法,其特征在于,根据以下方式构建所述候选特征向量集合:
基于每个参考客户端的历史咨询集合中的参考历史问题、参考历史问题对应的参考特征信息集合、以及预先训练好的第二特征提取模型,确定每个参考历史问题对应的参考特征向量并添加至所述候选特征向量集合中。
7.如权利要求6所述的方法,其特征在于,根据以下方式训练得到所述第二特征提取模型:
获取第二训练样本集合,所述第二训练样本集合中包括多对关联历史问题、每对关联历史问题中每个历史问题对应的历史特征信息集合、以及每对关联历史问题对应的预测问题标签;
利用所述第二训练样本集合对第二基础特征提取模型进行第二训练过程;其中,所述第二训练过程包括:
基于每对关联历史问题中每个历史问题对应的历史特征信息集合、以及第二基础特征提取模型,确定每对关联历史问题对应的关联特征向量;
利用每对关联历史问题对应的关联特征向量,预测每对关联问题对应的候选关联问题;
基于每对关联问题对应的候选关联问题和预测问题标签,确定本轮训练过程的第二损失值;
若所述第二损失值不满足第三预设条件,则调整所述第二基础特征提取模型的第二模型参数,并利用调整后的第二基础特征提取模型,重复执行所述第二训练过程,直至确定所述第二损失值满足所述第三预设条件;其中,所述第二模型参数包括用于确定所述关联特征向量的权重矩阵;
若所述第二损失值满足所述第三预设条件,则将当前得到的第二基础特征提取模型确定为所述第二特征提取模型。
8.如权利要求1或2所述的方法,其特征在于,根据以下方式训练得到所述分类模型:
获取第三训练样本集合,所述第三训练样本集合中包括多个样本子集,每个样本子集中包括有效特征信息样本对应的第一样本特征向量、参考历史咨询记录中参考历史问题对应的第二样本特征向量、以及该样本子集对应的推荐问题标签;
利用所述第三训练样本集合对基础分类模型进行第三训练过程;其中,所述第三训练过程包括:
基于每个样本子集中的第一样本特征向量、第二样本特征向量、以及基础分类模型,确定每个样本子集对应的被推荐问题;
基于每个样本子集对应的被推荐问题和推荐问题标签,确定本轮训练过程的第三损失值;
若所述第三损失值不满足第四预设条件,则调整所述基础分类模型的第三模型参数,并利用调整后的基础分类模型,重复执行所述第三训练过程,直至确定所述第三损失值满足所述第四预设条件;
若所述第三损失值满足所述第四预设条件,则将当前得到的基础分类模型确定为所述分类模型。
9.一种问题推荐的装置,其特征在于,包括:
获取模块,用于在检测到客户端请求进行问题咨询后,获取所述客户端的特征信息集合和历史咨询记录集合;
第一确定模块,用于基于所述特征信息集合以及预先训练好的第一特征提取模型,确定所述特征信息集合中与问题咨询关联的有效特征信息,并确定所述有效特征信息的第一特征向量;以及,从预先构建的候选特征向量集合中,筛选出与所述历史咨询记录集合中每种历史问题匹配的第二特征向量;
第二确定模块,用于基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合;
发送模块,用于向所述客户端发送所述推荐问题集合。
10.如权利要求9所述的装置,其特征在于,所述分类模型包括第一特征提取层、第二特征提取层、全连接层、以及分类器;
所述第二确定模块,在基于所述有效特征信息的第一特征向量、每种历史问题匹配的第二特征向量以及预先训练好的分类模型,确定所述客户端的推荐问题集合时,具体用于:
将所述有效特征信息的第一特征向量输入至所述第一特征提取层,得到所述有效特征信息的第一目标特征向量;以及,将每种历史问题匹配的第二特征向量输入至所述第二特征提取层,得到每种历史问题匹配的第二目标特征向量;
分别将每种历史问题匹配的第二目标特征向量与所述第一目标特征向量进行拼接后,得到每种历史问题对应的第三目标特征向量;
将每种历史问题对应的第三目标特征向量输入至所述全连接层进行特征融合之后,得到每种历史问题对应的第四目标特征向量;
利用所述分类器对每种历史问题对应的第四目标特征向量进行分类处理,输出每种历史问题的被推荐概率;
基于每种历史问题的被推荐概率,确定所述客户端的推荐问题集合。
CN201910268019.7A 2019-04-03 2019-04-03 一种问题推荐的方法及装置 Active CN111782774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910268019.7A CN111782774B (zh) 2019-04-03 2019-04-03 一种问题推荐的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910268019.7A CN111782774B (zh) 2019-04-03 2019-04-03 一种问题推荐的方法及装置

Publications (2)

Publication Number Publication Date
CN111782774A true CN111782774A (zh) 2020-10-16
CN111782774B CN111782774B (zh) 2024-04-19

Family

ID=72755534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910268019.7A Active CN111782774B (zh) 2019-04-03 2019-04-03 一种问题推荐的方法及装置

Country Status (1)

Country Link
CN (1) CN111782774B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287232A (zh) * 2020-11-09 2021-01-29 北京京东拓先科技有限公司 生成推荐信息的方法、装置
CN112434140A (zh) * 2020-11-10 2021-03-02 杭州博联智能科技股份有限公司 一种答复信息处理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722532A (zh) * 2012-05-18 2012-10-10 山东大学 一种基于内容和用户历史的音乐推荐算法
CN104991887A (zh) * 2015-06-18 2015-10-21 北京京东尚科信息技术有限公司 提供信息的方法及装置
CN105335519A (zh) * 2015-11-18 2016-02-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN108874998A (zh) * 2018-06-14 2018-11-23 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN108874823A (zh) * 2017-05-12 2018-11-23 阿里巴巴集团控股有限公司 智能客服的实现方法和装置
CN108984655A (zh) * 2018-06-28 2018-12-11 厦门快商通信息技术有限公司 一种客服机器人智能客服引导方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722532A (zh) * 2012-05-18 2012-10-10 山东大学 一种基于内容和用户历史的音乐推荐算法
CN104991887A (zh) * 2015-06-18 2015-10-21 北京京东尚科信息技术有限公司 提供信息的方法及装置
CN105335519A (zh) * 2015-11-18 2016-02-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN108874823A (zh) * 2017-05-12 2018-11-23 阿里巴巴集团控股有限公司 智能客服的实现方法和装置
CN108874998A (zh) * 2018-06-14 2018-11-23 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN108984655A (zh) * 2018-06-28 2018-12-11 厦门快商通信息技术有限公司 一种客服机器人智能客服引导方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QIKA LIN 等: "Heterogeneous knowledge-based attentive neural networks for short-term music recommendations", 《IEEE ACCESS》, vol. 6, pages 1 - 2 *
黄立威 等: "基于深度学习的推荐系统研究综述", 《计算机学报》, vol. 41, no. 7, pages 1619 - 1647 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287232A (zh) * 2020-11-09 2021-01-29 北京京东拓先科技有限公司 生成推荐信息的方法、装置
WO2022095893A1 (zh) * 2020-11-09 2022-05-12 北京京东拓先科技有限公司 生成推荐信息的方法、装置
CN112287232B (zh) * 2020-11-09 2024-04-16 北京京东拓先科技有限公司 生成推荐信息的方法、装置
CN112434140A (zh) * 2020-11-10 2021-03-02 杭州博联智能科技股份有限公司 一种答复信息处理方法及系统
CN112434140B (zh) * 2020-11-10 2024-02-09 杭州博联智能科技股份有限公司 一种答复信息处理方法及系统

Also Published As

Publication number Publication date
CN111782774B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
CN104346372B (zh) 用于评估预测模型的方法和装置
CN110060090A (zh) 推荐商品组合的方法、装置、电子设备及可读存储介质
CN109145245A (zh) 预测点击率的方法、装置、计算机设备及存储介质
CN103473291A (zh) 一种基于隐语义概率模型的个性化服务推荐系统及方法
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
CN110362663B (zh) 自适应多感知相似度检测和解析
CN103761254A (zh) 多领域服务主题匹配推荐方法
CN109934646B (zh) 预测新商品关联购买行为的方法及装置
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
US10678821B2 (en) Evaluating theses using tree structures
CN110245310B (zh) 一种对象的行为分析方法、装置及存储介质
CN111815169A (zh) 业务审批参数配置方法及装置
CN111782774A (zh) 一种问题推荐的方法及装置
CN107798125B (zh) 基于亲密度模型的准入判定方法、系统、设备及存储介质
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN111680213A (zh) 信息推荐方法、数据处理方法及装置
CN111611353B (zh) 筛选方法、装置、电子设备及计算机可读存储介质
CN115600818A (zh) 多维评分方法、装置、电子设备和存储介质
CN115618079A (zh) 会话推荐方法、装置、电子设备及存储介质
CN111027999B (zh) 一种拼租用户推荐方法、装置、电子设备和存储介质
US11587041B2 (en) Guidance based on biometrics
CN113516398A (zh) 基于分层抽样的风险设备识别方法、装置及电子设备
CN112328769A (zh) 自动客服的应答方法、装置和计算机可读存储介质
CN114418752B (zh) 无类型标签用户数据的处理方法、装置、电子设备和介质
CN113487316B (zh) 分布式支付系统安全处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant