CN113779414B

CN113779414B - 基于机器学习模型的数据推荐方法、装置、设备及介质

Info

Publication number: CN113779414B
Application number: CN202111218459.5A
Authority: CN
Inventors: 覃德
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-10-19
Filing date: 2021-10-19
Publication date: 2024-02-09
Anticipated expiration: 2041-10-19
Also published as: CN113779414A

Abstract

本申请涉及人工智能领域，公开了一种基于机器学习模型的数据推荐方法、装置、设备及介质，包括：获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；根据历史访问轨迹数据和历史沟通轨迹数据对机器学习模型进行模型训练，得到意图识别模型；当获取到问答机器人上用户推荐界面的显示信息时，获取目标用户在目标应用程序上的目标历史访问轨迹数据，调用意图识别模型对目标历史访问轨迹数据进行意图识别，得到意图类型；向问答机器人发送数据推荐通知信息，以指示在用户推荐界面上输出与意图类型相关联的待推荐数据。可以提升数据推荐的准确性。本申请涉及区块链技术，如可将上述数据写入区块链中，以用于数据推荐等场景。

Description

基于机器学习模型的数据推荐方法、装置、设备及介质

技术领域

本申请涉及人工智能领域，尤其涉及一种基于机器学习模型的数据推荐方法、装置、设备及介质。

背景技术

随着计算机技术和人工智能的快速发展，客服机器人广泛应用在各种领域中。通常，客服机器人可以提供猜你想问的功能。目前，当客户第一次进入和智能客服机器人的交互界面时，客服机器人一般可以根据当前大部分用户的共同的热点问题的统计数据，提供几个热点问题给用户。但是通过统计产生的热点问题具有滞后性和大众化，不能为用户适配合适的问题，无法满足用户的个性化需求，因此，如何提高客服机器人问题推荐的准确性成为了亟需解决的问题。

发明内容

本申请实施例提供了一种基于机器学习模型的数据推荐方法、装置、设备及介质，可以为用户匹配合适的数据，提升数据推荐的准确性，还可以提高问答机器人的智能化水平。

第一方面，本申请实施例公开了一种基于机器学习模型的数据推荐方法，所述方法包括：

获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；

根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；

当获取到所述问答机器人上目标用户触发的用户推荐界面的显示信息时，获取所述目标用户在所述目标应用程序上的目标历史访问轨迹数据，并调用所述意图识别模型对所述目标历史访问轨迹数据进行意图识别，得到所述目标用户对应的意图类型；

向所述问答机器人发送数据推荐通知信息，所述数据推荐通知信息用于指示所述问答机器人在所述用户推荐界面上输出与所述意图类型相关联的待推荐数据。

第二方面，本申请实施例公开了一种基于机器学习模型的数据推荐装置，所述装置包括：

获取单元，用于获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；

训练单元，用于根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；

识别单元，用于当获取到所述问答机器人上目标用户触发的用户推荐界面的显示信息时，获取所述目标用户在所述目标应用程序上的目标历史访问轨迹数据，并调用所述意图识别模型对所述目标历史访问轨迹数据进行意图识别，得到所述目标用户对应的意图类型；

发送单元，用于向所述问答机器人发送数据推荐通知信息，所述数据推荐通知信息用于指示所述问答机器人在所述用户推荐界面上输出与所述意图类型相关联的待推荐数据。

第三方面，本申请实施例公开了一种数据推荐设备，包括处理器、存储器，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述第一方面的方法。

第四方面，本申请实施例公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

本申请实施例中，可以获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据，并根据历史访问轨迹数据和历史沟通轨迹数据对预设的机器学习模型进行模型训练，以得到意图识别模型。而当获取到问答机器人上目标用户触发的用户推荐界面的显示信息时，可以获取目标用户在目标应用程序上的目标历史访问轨迹数据，并调用意图识别模型对目标历史访问轨迹数据进行意图识别，从而得到目标用户对应的意图类型，并向问答机器人发送数据推荐通知信息，该数据推荐通知信息可以用于指示问答机器人在用户推荐界面上输出与意图类型相关联的待推荐数据。通过实施上述方法，可以利用用户在应用程序上的历史访问数据产生的意图偏好，以及用户与问答机器人之间的历史沟通数据产生的意图倾向的意图的双重结合，提升用户意图预测的准确性，为用户匹配合适的数据，从而可以提高数据推荐的准确性，如可以提高问答机器人的猜你想问的能力；并且，可以让用户进入客服机器人的交互界面时，就能获取到想咨询的问题以及问题的答案，省去了输入问题这个环节，有效的提高了问答机器人的智能化水平，也提升用户体验。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种基于机器学习模型的数据推荐方法的流程示意图；

图2是本申请实施例提供的一种知识图谱的结构示意图；

图3是本申请实施例提供的另一种知识图谱的结构示意图；

图4是本申请实施例提供的另一种基于机器学习模型的数据推荐方法的流程示意图；

图5是本申请实施例提供的一种基于机器学习模型的数据推荐装置的结构示意图；

图6是本申请实施例提供的一种数据推荐设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的方案涉及人工智能的机器学习等技术，具体通过如下实施例进行说明：

请参阅图1，图1是本申请实施例提供的一种基于机器学习模型的数据推荐方法的流程示意图。本实施例中所描述的基于机器学习模型的数据推荐方法，应用于数据推荐设备，可由数据推荐设备执行，其中，该数据推荐设备可以是服务器，也可以是终端。如图1所示，该基于机器学习模型的数据推荐方法包括以下步骤：

S101：获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据。

在一种实现方式中，问答机器人可以是客服机器人，例如可以是使用应用在各种领域中的客服机器人，如在金融领域中的客服机器人，在医疗领域中的客服机器人等等。目标应用程序是与问答机器人具有关联关系的应用程序，如目标应用程序可以是指与目标领域相关联的应用程序，该目标领域和问答机器人所应用的领域可以是一致的。例如，假设问答机器人是应用在金融领域的客服机器人，则目标应用程序可以是与金融相关的应用程序，如问答机器人是在A银行中所使用的客服机器人，则目标应用程序可以是该A银行对应的应用程序，又如问答机器人是在A医院中所使用的客服机器人，则目标应用程序可以是该A医院对应的应用程序。

在一种实现方式中，需要说明的是，终端设备上的应用程序都具备埋点采集技术，该埋点采集技术是指在应用程序中或页面中进行数据收集的技术，如可以用来跟踪用户在应用程序中或页面中的使用情况，例如用户在应用程序或页面上所访问的数据、用户在某一页面的停留时长、用户针对页面的浏览情况、用户操作(例如点击、分享)情况等。可以理解的是，当用户使用某一应用程序时，可以通过埋点采集技术采集用户在该应用程序中的行为数据，并将该行为数据发送给后台服务器，以使得后台服务器根据接收到的数据进行相关的数据分析。通过埋点采集技术还可以获取用户所使用的设备标识以及用户的用户标识。其中，设备标识可以用于唯一标识某一设备，用户标识也可以用于唯一标识某一用户。即可以通过埋点采集技术可以确定每个用户在应用程序或页面上的行为数据。

通过上述可知，通过埋点采集技术可以对用户的历史访问数据进行采集，以得到用户的历史访问数据。例如，该历史访问数据可以是针对历史时间段内的访问数据，例如，该历史时间段可以是在当前时间之前的前6个月、或3个月等等。考虑到获取到的历史访问数据包括各个方面的数据(如用户访问数据、用户停留时长、用户页面浏览情况、用户操作(例如点击、分享)情况等)，而为了获取到本申请所需要的数据，可以对获取到的历史访问数据进行预处理，以得到所需要的数据，该所需要的数据可以是历史访问轨迹数据，其中，历史访问轨迹数据中可以包括一条或多条历史访问轨迹，任一历史访问轨迹可以表征具有时间顺序的页面访问情况。例如，某一历史访问轨迹可以是：登录页->账户页->单品页->购买页，而该历史访问轨迹也反映了用户页面访问的先后顺序。

在一种实现方式中，对获取到的历史访问数据进行预处理得到历史访问轨迹数据的具体实施方式可以为：首先，在采集用户在目标应用程序上的历史访问数据之后，可以基于该历史访问数据确定历史访问数据中的各个访问页面以及各个访问页面的时间，然后可以根据每个页面访问的时间的先后顺序构建历史访问轨迹数据。例如，某一用户访问了登录页，并进入了账户页，然后在账户页打开了某一单品页，并点击了购买按钮，进入了购买页，则针对该用户的历史访问轨迹可以是：登录页->账户页->单品页->购买页。

在一种实现方式中，可以获取用户与问答机器人的历史沟通数据，以根据历史沟通数据确定用户的历史沟通轨迹数据。例如用户与问答机器人的历史沟通数据可以是在问答机器人的用户交互界面(也可以理解为下述的用户推荐界面)上，用户与问答机器人之间的交互信息，该交互信息可以包括用户的咨询问题以及问答机器人针对咨询问题的解答。又如该历史沟通数据还可以是指用户的咨询问题。如果历史沟通数据为交互信息，则可以对该交互信息进行信息筛选，以从交互信息中确定用户的咨询问题。

历史沟通轨迹数据中可以包括一条或多条历史沟通轨迹，每一条历史沟通轨迹可以指具有时间先后顺序的用户咨询问题的组合，例如，例如某一历史沟通轨迹可以是咨询产品问题->咨询产品风险->咨询如何充值。通过上述可知，在获取到用户与问答机器人的历史沟通数据之后，可以基于历史沟通数据中用户的咨询问题以及各个咨询问题的咨询时间，构建历史沟通轨迹数据。例如，用户先后在问答机器人的用户界面上输入咨询产品的相关问题，咨询产品的相关风险咨询，如何充值的相关问题，则对应的历史沟通轨迹为咨询产品问题->咨询产品风险->咨询如何充值。

在一种实现方式中，针对历史沟通轨迹数据，可以利用知识图谱来对历史沟通轨迹数据中各个历史沟通轨迹的进行存储。以便于后续可以基于该知识图谱获取历史沟通轨迹，从而实现随取随用。知识图谱(Knowledge Graph)是显示知识发展进程与结构关系的一系列各种不同的图形，用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱可以理解成多关系图，例如图2所示的多关系图一般包含多种类型的节点和多种类型的边。在知识图谱里，用“实体(Entity)”来表达图里的节点、用“关系(Relation)”来表达图里的“边”。实体指的是现实世界中的事物比如人、地名、概念、药物、公司等，关系则用来表达不同实体之间的某种联系。例如，某一历史沟通轨迹可以是咨询产品问题->咨询产品风险->咨询如何充值，则可以根据咨询问题的先后顺序将咨询问题存储在知识图谱中，例如该历史沟通轨迹在知识图谱中的显示可以如图3所示，如果历史沟通轨迹还包括咨询产品问题->咨询如何充值，则也可以在该图3中显示该轨迹。

在一种实现方式中，上述获取的目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据可以是针对后续中所涉及的目标用户的数据，也可以是其他用户的数据，或者是目标用户的数据和其他用户的数据，在本申请不做限定。

需要说明的是，本申请中所涉及的要获取的数据是具有获取权限的。

S102：根据历史访问轨迹数据和历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型。

在一种实现方式中，机器学习模型可以是：序列标注模型(如BERT模型)、支持向量机(Support Vector Machine，SVM)模型、随机森林(Random Forest，RF)模型、逻辑回归(Logistic Regression，LR)模型等等。也可以包括其他可用于意图识别的机器学习模型，在申请中对具体模型不做限定。

在一种实现方式中，可以先根据历史访问轨迹数据和历史沟通轨迹数据确定训练轨迹样本集。以便于后续可以利用该训练轨迹样本集对预设的机器学习模型进行模型训练。其中，训练轨迹样本集中可以包括一个或多个训练轨迹样本对，而每一个训练轨迹样本对包括可以训练轨迹样本以及训练轨迹样本的训练意图类型，训练意图类型的数量包括一个或多个。在一种实现中，可以预先标注每一个训练轨迹样本对应的训练意图类型。在得到训练轨迹样本集之后，即可以利用训练轨迹样本集对预设的机器学习模型进行模型训练，以得到意图识别模型。

S103：当获取到问答机器人上目标用户触发的用户推荐界面的显示信息时，获取目标用户在目标应用程序上的目标历史访问轨迹数据，并调用意图识别模型对目标历史访问轨迹数据进行意图识别，得到目标用户对应的意图类型。

在一种实现方式中，当获取到问答机器人上目标用户触发的用户推荐界面的显示信息时，则可以根据该目标用户的意图类型在问答机器人的用户推荐界面上自动输出意图类型对应的待推荐数据，该待推荐数据可以是指目标用户要向问答机器人询问的问题。那么，在目标用户进入到客服机器人的用户推荐界面时，即可以获取到想咨询的问题，省去了目标用户需在用户推荐界面上输入问题这个环节。在一种可能的实施例中，在用户推荐界面上显示问题时，还可以显示问题所对应的答案。在一种实现方式中，当检测到目标用户触发用户推荐界面显示在问答机器人的屏幕上时，可以获取到问答机器人上目标用户触发的用户推荐界面的显示信息。上述可知，通过自动预测用户所需的咨询问题，可以有效的提高问答速度，也可以有效提高问答机器人的智能化水平，并提升用户体验。

需要注意的是，本申请考虑的场景是目标用户进入问答机器人的用户推荐界面时的情况，即在当前时间，不存在目标用户在问答机器人上的历史沟通轨迹数据。目标历史访问轨迹数据可以是指离当前时间最近的一个在目标应用程序上的目标历史访问轨迹。例如该目标历史访问轨迹可以是登录页->账户页->单品页->购买页。

在一种实现方式中，在获取到目标历史访问轨迹数据之后，可以调用意图识别模型，以得到目标用户对应的意图类型。可选的，可以将目标历史访问轨迹数据输入意图识别模型，从而可以得到一个或多个候选意图类型以及每个候选意图类型对应的意图概率。可以理解的是，在模型的应用中，例如在进行预测时，通常会存在预测结果的概率分布，该概率分布可以是本申请中所涉及到的每个候选意图类型对应的意图概率。然后，可以根据每个候选意图类型对应的意图概率确定目标用户对应的意图类型。在候选意图类型存在多个时，可以从该多个候选意图类型中选择一个作为目标用户的意图类型，也可以从该多个候选意图类型中选择至少两个作为目标用户的意图类型。例如，以选择一个候选意图类型作为目标用户的意图类型为例进行说明，在候选意图类型存在多个时，可以先确定每个候选意图类型对应的意图概率中的最大意图概率对应的候选意图类型，并将最大意图概率对应的候选意图类型确定为目标用户对应的意图类型。又如，以选择至少两个候选意图类型作为目标用户的意图类型为例进行说明，在候选意图类型存在多个时，可以将每个候选意图类型对应的意图概率进行降序排序，以得到意图概率排序结果，而在得到意图概率排序之后，可以将意图概率排序结果中前L个意图概率对应的候选意图类型均作为目标用户对应的意图类型，该L为正整数，例如，L可以为2、3等数值。

举例来说，例如，通过意图识别模型可以得到的候选意图类型以及对应的意图概率包括：产品风险咨询(70％)、产品购买路径咨询(20％)、充值路径咨询(10％)，则可以把产品风险咨询作为目标用户标识对应的意图类型，也可以将产品风险咨询、产品购买路径咨询、充值路径咨询均作为目标用户标识对应的意图类型。

S104：向问答机器人发送数据推荐通知信息，数据推荐通知信息用于指示问答机器人在所用户推荐界面上输出与意图类型相关联的待推荐数据。

在一种实现方式中，在得到目标用户对应的意图类型之后，即可以向问答机器人发送数据推荐通知信息，以在问答机器人的用户推荐界面上输出与该意图类型相关联的待推荐数据。

在一种实现方式中，待推荐数据可以是预先设置的，该待推荐数据可以是意图类型对应的话术，例如，当意图类型为“咨询如何进行充值”，则可以输出与“咨询如何让进行充值”对应的话术，如该话术可以是“产品如何进行充值”，又如，当意图类型为“咨询产品的风险”，则可以输出与“咨询产品风险”的相关话术，如该话术可以是“咨询产品的风险”。在具体实现中，可以预先建立参考意图类型与参考推荐数据之间的映射关系。当确定了目标用户的意图类型之后，可以获取该参考意图类型与参考推荐数据之间的映射关系，以根据该映射关系和目标用户的意图类型，确定目标用户的意图类型对应的参考推荐数据，而所确定的参考推荐数据即可以作为待推荐数据。可选的，在建立参考意图类型与参考推荐数据之间的映射关系时，每一个参考意图类型对应的参考推荐数据的数量可以为一个也可以为多个。在每一个参考意图类型对应的参考推荐数据的数量为一个的情况下，可以直接将意图类型对应的参考推荐数据作为待推荐数据。在每一个参考意图类型对应的参考推荐数据的数量为多个的情况下，可以从意图类型对应的多个参考推荐数据中随机选择一个参考推荐数据作为待推荐数据。

在一种实现方式中，意图类型的数量可以包括一个或多个，在意图类型的数量为一个的情况下，根据参考意图类型与参考推荐数据之间的映射关系，获取意图类型对应的参考推荐数据作为待推荐数据即可。在意图类型的数量为多个的情况下，考虑到一种意图类型可以对应一个待推荐数据，则待推荐数据的数量也可以为多个，其中，每一种意图类型对应的待推荐数据的确定方式可以参考上述描述，在此处不在赘述。可选的，在待推荐数据的数量为多个时，可以考虑每个待推荐数据在用户推荐界面上显示的顺序，以提高用户体验。例如，可以获取多个意图类型中一个意图类型分别对应的待推荐数据，并根据每个意图类型的意图概率从大到小的顺序，确定针对多个待推荐数据的推荐顺序。其中，该推荐顺序可以用来确定待推荐数据在用户推荐界面上显示的排列顺序。该推荐顺序可以与意图类型的意图概率呈正相关，即若意图类型的意图概率越大，则该意图类型对应的待推荐数据在用户推荐界面上显示的排列顺序越靠前，对应的，若意图类型的意图概率越小，则该意图类型对应的待推荐数据在用户推荐界面上显示的排列顺序越靠后，如果在用户推荐界面上显示多个待推荐数据时，是在用户推荐界面上从上到下的排列方式来显示，则可以按照推荐顺序从前到后的顺序依次在用户推荐界面上从上到下显示多个待推荐数据。那么，在确定针对多个待推荐数据的推荐顺序之后，则可以根据多个待推荐数据和多个待推荐数据的推荐顺序，在问答机器人的用户推荐界面上输出多个待推荐数据。

举例来说，假设意图类型的数量为2，则可以获取这两个意图类型分别对应的待推荐数据1和待推荐数据2。其中，待推荐数据1对应的意图类型的推荐意图概率为70％、待推荐数据2对应的意图类型的意图概率为30％，则根据这两个意图概率的大小关系，可知待推荐数据1与待推荐数据2的推荐顺序为待推荐数据1在前，待推荐数据2在后。即在问答机器人的用户推荐界面上输出这两个待推荐数据时，待推荐数据1显示在待推荐数据2的前面。

在一种实现方式中，在用户推荐界面上进行数据推荐时，可以在用户推荐界面上以文字输出待推荐数据，还可以以语音播报形式输出待推荐数据，也可以在文字输出待推荐数据的同时，对待推荐数据进行语音播报，以提高用户体验。可选的，在对待推荐数据进行语音播报时，可以针对不同的用户利用不同的音色来对待推荐数据进行播报，从而可以实现个性化的数据推荐，例如，可以获取参考用户类型与参考推荐音色之间对应关系，然后可以根据参考用户类型与参考推荐音色之间的对应关系，以及目标用户的目标用户类型从该对应关系中确定目标用户类型对应的参考推荐音色，则可以将该目标用户类型对应的参考推荐音色确定为待推荐数据的推荐音色，从而可以根据待推荐数据和推荐音色在用户推荐界面上输出该待推荐数据。也就是在用户推荐界面上以推荐音色对该待推荐数据进行语音播报。

其中，目标用户的目标用户类型可以在数据推荐设备可获取用户的基本信息(例如，年龄、性别、爱好等)的前提下获取。参考用户类型与参考推荐音色之间对应关系可以预先设置，参考用户类型可以以用户的年龄来进行划分，例如，可以将年龄超过年龄阈值的用户所对应的参考用户类型确定为第一用户类型，将年龄不超过年龄阈值的用户所对应的参考用户类型确定为第二用户类型。而第一用户类型对应的参考推荐音色可以是较为严肃的，第二用户类型对应的参考推荐音色可以是较为活波的。则可以根据目标用户的年龄来确定目标用户对应的目标用户类型，如果目标用户的年龄超过上述年龄阈值，则目标用户对应的目标用户类型为第一用户类型，则可以将第一用户类型对应的参考推荐音色确定为待推荐数据的推荐音色。可选的，参考用户类型也可以以性别来进行划分，也可以以其他方式来进行划分，在本申请不做限定。

本申请实施例中，可以获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据，并根据历史访问轨迹数据和历史沟通轨迹数据对预设的机器学习模型进行模型训练，以得到意图识别模型。而当获取到问答机器人上目标用户触发的用户推荐界面的显示信息时，可以获取目标用户在目标应用程序上的目标历史访问轨迹数据，并调用意图识别模型对目标历史访问轨迹数据进行意图识别，从而得到目标用户对应的意图类型，并向问答机器人发送数据推荐通知信息，该数据推荐通知信息可以用于指示问答机器人在用户推荐界面上输出与意图类型相关联的待推荐数据。通过实施上述方法，可以利用用户在应用程序上的历史访问数据产生的意图偏好，以及用户与问答机器人之间的历史沟通数据产生的意图倾向的意图的双重结合，提升用户意图预测的准确性，从而可以提高数据推荐的准确性，如可以提高问答机器人的猜你想问的能力；并且，可以让用户进入客服机器人的交互界面时，就能获取到想咨询的问题以及问题的答案，省去了输入问题这个环节，有效的提高了问答机器人的智能化水平，也提升用户体验。

请参阅图4，图4是本申请实施例提供的另一种基于机器学习模型的数据推荐方法的流程示意图。本实施例中所描述的基于机器学习模型的数据推荐方法，应用于数据推荐设备，可由数据推荐设备执行，其中，该数据推荐设备可以是服务器，也可以是终端。如图4所示，该基于机器学习模型的数据推荐方法包括以下步骤：

S401：获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据。

S402：根据历史访问轨迹数据和历史沟通轨迹数据确定训练轨迹样本集。

在一种实现方式中，假设训练轨迹样本集中可以包括第一训练轨迹样本对，则确定该第一训练轨迹样本对的具体实施方式可以为如下描述。通过上述的描述可知，历史访问轨迹数据中可以包括一个或多个历史访问轨迹，任一历史访问轨迹可以表征具有时间顺序的页面访问情况。例如，某一历史访问轨迹可以是：登录页->账户页->单品页->购买页；历史沟通轨迹数据中可以包括一个或多个历史沟通轨迹，任一历史沟通轨迹可以指具有时间先后顺序的用户咨询问题的组合，例如，例如某一历史沟通轨迹可以是咨询产品问题->咨询产品风险->咨询如何充值。可选的，可以将历史访问轨迹数据中的一个历史访问轨迹和历史沟通轨迹数据中的一个历史沟通轨迹作为一个训练轨迹样本。例如，历史访问轨迹数据中可以包括第一历史访问轨迹(该第一历史访问轨迹可以是历史访问轨迹数据中的任一历史访问轨迹)，则可以将第一历史访问轨迹、以及历史沟通轨迹数据中与第一历史访问轨迹相关联的关联历史沟通轨迹，确定为第一训练轨迹样本对中的第一训练轨迹样本。其中，可以将轨迹时间与第一历史访问轨迹对应的轨迹时间最为接近的历史沟通轨迹，确定为该第一历史访问轨迹的关联历史沟通轨迹。第一历史访问轨迹对应的轨迹时间可以理解为该第一历史访问轨迹中最后一个页面的页面时间，历史沟通轨迹的轨迹时间可以理解为历史沟通轨迹中第一个咨询问题的咨询时间。通常，在用户与问答机器人进行沟通前，用户可能在与该问答机器人相关联的目标应用程序中进行了相关搜索，即用户在目标应用程序上的搜索可能与用户在问答机器人上所咨询的问题相关，则可以考虑将一个历史访问轨迹和一个历史沟通轨迹组合为一个训练轨迹样本对中的训练轨迹样本。

可选的，也可以将历史访问轨迹数据中的每一个历史访问轨迹作为一个训练轨迹样本对中的训练轨迹样本，也将历史沟通轨迹数据中的每一个历史沟通轨迹作为一个训练轨迹样本对中的训练轨迹样本。

在确定第一第训练轨迹样本对中的第一训练轨迹样本之后，即可以添加该第一训练轨迹样本对应的标签信息，该标签信息可以用于指示第一训练轨迹样本对应的第一训练意图类型。可选的，可以通过参考意图类型集合中所包括的多个参考意图类型，来确定第一训练轨迹样本对应的第一训练意图类型。例如，可以获取预设的参考意图类型集合，该参考意图类型集合中包括多种参考意图类型，该参考意图类型可以从问答机器人的历史交互信息中获取，可以理解的是，问答机器人可以与大量的用户进行信息的交互，则可以将收集这些交互信息中用户的咨询问题，并可以将收集到咨询问题作为参考意图类型集合中的参考意图类型。例如，参考意图类型可以是产品风险咨询、产品购买路径咨询、充值路径咨询等等。而在获取到参考意图类型集合之后，可以从该参考意图类型集合中查找与第一训练轨迹样本相关联的参考意图类型，并将查找到的参考意图类型确定为所第一训练轨迹样本对应的第一训练意图类型。其中，参考意图类型的数量可以是一个或多个。

在一种实现方式中，可以将将第一训练轨迹样本中的数据与参考意图类型集合中的参考意图类型进行匹配，将可以匹配到的参考意图类型确定为第一训练意图类型。例如。匹配方式可以是关键词匹配，语义匹配等等，在本申请不做限定。也可以将第一训练轨迹样本的关联历史沟通轨迹中的数据作为第一训练意图类型。例如，第一训练轨迹样本的关联历史沟通轨迹为：咨询产品问题->咨询产品风险->咨询如何充值，则可以将咨询产品问题、咨询产品风险、咨询如何充值中的一种或多种确定为训练意图类型。

那么，通过上述确定第一训练轨迹样本对的方式，可以确定用于训练预设的机器学习模型的训练轨迹样本集。

S403：利用训练轨迹样本集对预设的机器学习模型进行模型训练，得到意图识别模型。

在一种实现方式中，在得到该训练轨迹样本集之后，即可以对预设的机器学习模型进行模型训练。可选的，针对训练轨迹样本集中的任一训练轨迹样本对，可以将该训练轨迹样本对输入预设的机器学习模型中，以得到训练轨迹样本对中训练轨迹样本对应的预测意图类型。而在得到预测意图类型之后，可以根据训练轨迹样本对应的预测意图类型，和该训练轨迹样本对应的训练意图类型对预设的机器学习模型进行模型训练，也就是对模型参数进行更新，而模型参数更新后所得到机器学习模型即可以是意图识别模型。例如，可以根据预测意图类型和预测意图类型计算机器学习模型的模型损失值，并按照减少该模型损失值的方向，优化机器学习模型的模型参数。其中，本申请对机器学习模型中的损失函数不做限定。在一种实现中，在按照减少该模型损失值的方向，优化机器学习模型的模型参数时，可以检测模型损失值是否满足预设收敛条件，当检测到模型损失值满足预设收敛条件时，则可以停止模型参数的参数更新，从而可以得到意图识别模型。其中，该预设收敛条件可以是指模型损失值小于预先设置的一个阈值。或者是在机器学习模型的两次迭代训练之间权值(即模型参数)变化已经很小，且小于预先设置的一个阈值。或者机器学习模型的迭代次数达到了预先设置的最大迭代次数，在满足上述任一条件时，可以停止对预设的机器学习模型的训练。

S404：当获取到问答机器人上目标用户触发的用户推荐界面的显示信息时，获取目标用户在所述目标应用程序上的目标历史访问轨迹数据，并调用意图识别模型对目标历史访问轨迹数据进行意图识别，得到目标用户对应的意图类型。

S405：向问答机器人发送数据推荐通知信息，数据推荐通知信息用于指示问答机器人在用户推荐界面上输出与意图类型相关联的待推荐数据。

其中，步骤S401、S404、S405的具体实施方式可以参见上述实施例步骤S101、S103、S104的具体描述，此处不再赘述。

本申请实施例中，可以获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据，并根据历史访问轨迹数据和历史沟通轨迹数据确定训练轨迹样本集，以利用该训练轨迹样本集对预设的机器学习模型进行模型训练，从而得到意图识别模型。而当获取到问答机器人上目标用户触发的用户推荐界面的显示信息时，可以获取目标用户在目标应用程序上的目标历史访问轨迹数据，并调用意图识别模型对目标历史访问轨迹数据进行意图识别，从而得到目标用户对应的意图类型，并向问答机器人发送数据推荐通知信息，该数据推荐通知信息可以用于指示问答机器人在用户推荐界面上输出与意图类型相关联的待推荐数据。可以利用用户在APP应用程序上的历史访问数据，以及用户与问答机器人之间的历史沟通数据，共同对机器学习模型进行模型训练，以得到意图识别模型，可以有效提升用户意图预测的准确性，从而可以提高数据推荐的准确性，基于意图识别的自动预测，也可以有效提高问答机器人的智能化水平。

请参阅图5，图5是本申请实施例提供的一种基于机器学习模型的数据推荐装置的结构示意图。所述基于机器学习模型的数据推荐装置包括：

获取单元501，用于获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；

训练单元502，用于根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；

识别单元503，用于当获取到所述问答机器人上目标用户触发的用户推荐界面的显示信息时，获取所述目标用户在所述目标应用程序上的目标历史访问轨迹数据，并调用所述意图识别模型对所述目标历史访问轨迹数据进行意图识别，得到所述目标用户对应的意图类型；

发送单元504，用于向所述问答机器人发送数据推荐通知信息，所述数据推荐通知信息用于指示所述问答机器人在所述用户推荐界面上输出与所述意图类型相关联的待推荐数据。

在一种实现方式中，所述训练单元502，具体用于：

根据所述历史访问轨迹数据和所述历史沟通轨迹数据确定训练轨迹样本集；所述训练轨迹样本集包括训练轨迹样本对，所述训练轨迹样本对包括训练轨迹样本以及所述训练轨迹样本的训练意图类型，所述训练意图类型的数量包括一个或多个。

利用所述训练轨迹样本集对预设的机器学习模型进行模型训练，得到所述意图识别模型。

在一种实现方式中，所述训练轨迹样本集包括第一训练轨迹样本对，所述历史访问轨迹数据包括第一历史访问轨迹；所述训练单元502，具体用于：

将所述第一历史访问轨迹、以及所述历史沟通轨迹数据中与所述第一历史访问轨迹相关联的关联历史沟通轨迹，确定为所述第一训练轨迹样本对中的第一训练轨迹样本；

获取参考意图类型集合，从所述参考意图类型集合中查找与所述第一训练轨迹样本相关联的参考意图类型，根据查找到的参考意图类型确定所述第一训练轨迹样本对应的第一训练意图类型；

将所述第一训练轨迹样本和所述第一训练轨迹样本对应的第一训练意图类型作为所述第一训练轨迹样本对。

在一种实现方式中，所述识别单元503，具体用于：

将所述目标历史访问轨迹数据输入所述意图识别模型，得到一个或多个候选意图类型以及每个候选意图类型对应的意图概率；

根据所述每个候选意图类型对应的意图概率确定所述目标用户对应的意图类型。

在一种实现方式中，所述识别单元503，具体用于：

将所述每个候选意图类型对应的意图概率进行降序排序，得到意图概率排序结果；

将所述意图概率排序结果中前L个意图概率对应的候选意图类型作为所述目标用户对应的意图类型，L为正整数。

在一种实现方式中，所述意图类型的数量包括多个，所述待推荐数据的数量包括多个；所述装置还包括输出单元505，具体用于：

获取多个意图类型中每个意图类型分别对应的待推荐数据；

根据所述每个意图类型的意图概率从大到小的顺序，确定针对多个待推荐数据的推荐顺序；

根据所述多个待推荐数据和所述多个待推荐数据的推荐顺序，在所述用户推荐界面上输出所述多个待推荐数据。

在一种实现方式中，所述获取单元501，具体用于：

采集所述目标用户在目标应用程序上的历史访问数据，以及所述目标用户与问答机器人的历史沟通数据；

获取历史访问数据中的各个访问页面以及所述各个访问页面的访问时间，并基于所述各个访问页面和所述各个访问页面的访问时间构建历史访问轨迹数据；

获取历史沟通数据中的各个咨询问题以及所述各个咨询问题的咨询时间，并基于所述各个咨询问题以及所述各个咨询问题的咨询时间构建历史沟通轨迹数据。

可以理解的是，本申请实施例所描述的基于机器学习模型的数据推荐装置的各功能单元的功能可根据图1或者图2所述的方法实施例中的方法具体实现，其具体实现过程可以参照图1或者图2的方法实施例的相关描述，此处不再赘述。

本申请实施例中，获取单元501获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；训练单元502根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；识别单元503当获取到所述问答机器人上目标用户触发的用户推荐界面的显示信息时，获取所述目标用户在所述目标应用程序上的目标历史访问轨迹数据，并调用所述意图识别模型对所述目标历史访问轨迹数据进行意图识别，得到所述目标用户对应的意图类型；发送单元504向所述问答机器人发送数据推荐通知信息，所述数据推荐通知信息用于指示所述问答机器人在所述用户推荐界面上输出与所述意图类型相关联的待推荐数据。通过实施上述方法，可以提升数据推荐的准确性，提高问答机器人的智能化水平。

请参阅图6，图6是本申请实施例提供的一种数据推荐设备的结构示意图。该数据推荐设备包括：处理器601、存储器602以及网络接口603。上述处理器601、存储器602以及网络接口603之间可以交互数据。

上述处理器601可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

上述存储器602可以包括只读存储器和随机存取存储器，并向处理器601提供程序指令和数据。存储器602的一部分还可以包括随机存取存储器。其中，所述处理器601调用所述程序指令时用于执行：

在一种实现方式中，所述处理器601，具体用于：

在一种实现方式中，所述训练轨迹样本集包括第一训练轨迹样本对，所述历史访问轨迹数据包括第一历史访问轨迹；所述处理器601，具体用于：

在一种实现方式中，所述处理器601，具体用于：

在一种实现方式中，所述意图类型的数量包括多个，所述待推荐数据的数量包括多个；所述处理器601，还用于：

获取多个意图类型中每个意图类型分别对应的待推荐数据；

在一种实现方式中，所述处理器601，具体用于：

具体实现中，本申请实施例中所描述的处理器601和存储器602可执行本申请实施例图1或者图2提供的基于机器学习模型的数据推荐方法中所描述的实现方式，也可执行本申请实施例图5所描述的基于机器学习模型的数据推荐装置的实现方式，在此不再赘述。

本申请实施例中，处理器601可以获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；当获取到所述问答机器人上目标用户触发的用户推荐界面的显示信息时，获取所述目标用户在所述目标应用程序上的目标历史访问轨迹数据，并调用所述意图识别模型对所述目标历史访问轨迹数据进行意图识别，得到所述目标用户对应的意图类型；向所述问答机器人发送数据推荐通知信息，所述数据推荐通知信息用于指示所述问答机器人在所述用户推荐界面上输出与所述意图类型相关联的待推荐数据。通过实施上述方法，可以提升数据推荐的准确性，提高问答机器人的智能化水平。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有程序指令，所述程序执行时可包括如图1或者图2对应实施例中的基于机器学习模型的数据推荐方法的部分或全部步骤。

需要说明的是，对于前述的各个方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某一些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random AccessMemory，RAM)、磁盘或光盘等。

需要强调的是，为进一步保证上述数据的私密和安全性，上述数据还可以存储于一区块链的节点中。其中，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上对本申请实施例所提供的一种基于机器学习模型的数据推荐方法、装置、设备及介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种基于机器学习模型的数据推荐方法，其特征在于，包括：

获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；所述目标应用程序是与所述问答机器人具有关联关系的应用程序，所述目标应用程序是指与目标领域相关联的应用程序，且所述目标领域和问答机器人所应用的领域一致；

根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；所述根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型，包括：根据所述历史访问轨迹数据和所述历史沟通轨迹数据确定训练轨迹样本集；所述训练轨迹样本集包括训练轨迹样本对，所述训练轨迹样本对包括训练轨迹样本以及所述训练轨迹样本的训练意图类型，所述训练意图类型的数量包括一个或多个；训练轨迹样本由一条历史访问轨迹和与该历史访问轨迹相关的关联历史沟通轨迹构成，所述关联历史沟通轨迹是基于该历史访问轨迹的轨迹时间以及关联历史沟通轨迹的轨迹时间确定的，训练意图类型用于指示在该训练轨迹样本下的咨询问题；利用所述训练轨迹样本集对预设的机器学习模型进行模型训练，得到所述意图识别模型；

2.根据权利要求1所述的方法，其特征在于，所述训练轨迹样本集包括第一训练轨迹样本对，所述历史访问轨迹数据包括第一历史访问轨迹；所述根据所述历史访问轨迹数据和所述历史沟通轨迹数据确定训练轨迹样本集，包括：

3.根据权利要求1所述的方法，其特征在于，所述调用所述意图识别模型对所述目标历史访问轨迹数据进行意图识别，得到所述目标用户对应的意图类型，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述每个候选意图类型对应的意图概率确定所述目标用户对应的意图类型，包括：

5.根据权利要求1所述的方法，其特征在于，所述意图类型的数量包括多个，所述待推荐数据的数量包括多个；所述方法还包括：

获取多个意图类型中每个意图类型分别对应的待推荐数据；

6.根据权利要求1所述的方法，其特征在于，所述获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据，包括：

7.一种基于机器学习模型的数据推荐装置，其特征在于，包括：

获取单元，用于获取目标应用程序上的历史访问轨迹数据和问答机器人上的历史沟通轨迹数据；所述目标应用程序是与所述问答机器人具有关联关系的应用程序，所述目标应用程序是指与目标领域相关联的应用程序，且所述目标领域和问答机器人所应用的领域一致；

训练单元，用于根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型；所述根据所述历史访问轨迹数据和所述历史沟通轨迹数据对预设的机器学习模型进行模型训练，得到意图识别模型，包括：根据所述历史访问轨迹数据和所述历史沟通轨迹数据确定训练轨迹样本集；所述训练轨迹样本集包括训练轨迹样本对，所述训练轨迹样本对包括训练轨迹样本以及所述训练轨迹样本的训练意图类型，所述训练意图类型的数量包括一个或多个；训练轨迹样本由一条历史访问轨迹和与该历史访问轨迹相关的关联历史沟通轨迹构成，所述关联历史沟通轨迹是基于该历史访问轨迹的轨迹时间以及关联历史沟通轨迹的轨迹时间确定的，训练意图类型用于指示在该训练轨迹样本下的咨询问题；利用所述训练轨迹样本集对预设的机器学习模型进行模型训练，得到所述意图识别模型；

8.一种数据推荐设备，其特征在于，包括处理器、存储器，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-6任一项所述的方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-6任一项所述的方法。