CN111274473B

CN111274473B - 基于人工智能的推荐模型的训练方法、装置及存储介质

Info

Publication number: CN111274473B
Application number: CN202010033695.9A
Authority: CN
Inventors: 魏望; 彭顺风; 徐澜
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-01-13
Filing date: 2020-01-13
Publication date: 2021-03-12
Anticipated expiration: 2040-01-13
Also published as: CN111274473A

Abstract

本发明提供了一种基于人工智能的推荐模型的训练方法、装置、电子设备及存储介质；方法包括：通过特征提取模型，分别对媒体信息样本的用户数据、内容数据及推广对象样本的对象数据进行特征提取，得到用户特征、内容特征及对象特征；基于用户特征及内容特征，通过预测模型进行点击数据预测，得到对应媒体信息样本的第一预测点击数据；并基于用户特征、内容特征及对象特征，通过预测模型进行点击数据预测，得到对应推广对象样本的第二预测点击数据；基于第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异，更新推荐模型的模型参数；通过本发明，能够提高推荐模型的推荐准确性，提升用户体验。

Description

基于人工智能的推荐模型的训练方法、装置及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于人工智能的推荐模型的训练方法、基于人工智能的内容推荐方法、装置、电子设备及存储介质。

背景技术

人工智能(AI，Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

推荐系统是人工智能的重要应用分支，其中在对推广对象(商品、APP等)进行推荐时，通常将推广对象嵌入到软文、资讯等媒体信息中进行推荐，以提高用户的接受度与好感度，从而引导用户对推广对象进行购买或者下载。

相关技术中，通常采用单任务学习的方式，针对媒体信息、和推广对象分别构建推荐模型并训练，得到两个推荐模型。但是，由于推广对象是植入在媒体信息中的，用户针对媒体信息、及推广对象的两次点击行为并不是完全不相关的，由此所训练得到的两个推荐模型的推荐准确性较低，推荐效果较差。

发明内容

本发明实施例提供一种基于人工智能的推荐模型的训练方法、装置、电子设备及存储介质，能够提高推荐模型的推荐准确性，提升用户体验。

本发明实施例的技术方案是这样实现的：

本发明实施例提供一种基于人工智能的推荐模型的训练方法，所述推荐模型包括：特征提取模型及预测模型，所述方法包括：

获取媒体信息样本的用户数据、内容数据、及所述媒体信息样本中植入的推广对象样本的对象数据；

其中，所述媒体信息样本标注有第一目标点击数据，所述推广对象样本标注有第二目标点击数据；

通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述媒体信息样本的用户特征、内容特征、及所述推广对象样本的对象特征；

基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据；并

基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述推广对象样本的第二预测点击数据；

其中，所述第二预测点击数据，用于供结合所述第一预测点击数据对所述媒体信息样本或所述推广对象样本进行推荐；

获取所述第一目标点击数据与所述第一预测点击数据之间的第一差异，及所述第二目标点击数据与所述第二预测点击数据之间的第二差异；

基于所述第一差异及所述第二差异，更新所述推荐模型的模型参数。

本发明实施例提供一种基于人工智能的内容推荐方法，所述方法应用于推荐模型，所述推荐模型包括：特征提取模型及预测模型，所述方法包括：

获取待推荐媒体信息的用户数据、内容数据、及所述待推荐媒体信息中植入的待推广对象的对象数据；

通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述待推荐媒体信息的用户特征、内容特征、及所述待推广对象的对象特征；

基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述待推荐媒体信息的第一预测点击数据；并

基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述待推广对象的第二预测点击数据；

结合所述第一预测点击数据、及所述第二预测点击数据，对所述待推荐媒体信息或所述待推广对象进行推荐；

其中，所述推荐模型基于上述推荐模型的训练方法训练得到。

本发明实施例还提供一种基于人工智能的推荐模型的训练装置，所述推荐模型包括：特征提取模型及预测模型，所述装置包括：

第一获取模块，用于获取媒体信息样本的用户数据、内容数据、及所述媒体信息样本中植入的推广对象样本的对象数据；其中，所述媒体信息样本标注有第一目标点击数据，所述推广对象样本标注有第二目标点击数据；

第一特征提取模块，用于通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述媒体信息样本的用户特征、内容特征、及所述推广对象样本的对象特征；

第一预测模块，用于基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据；并基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述推广对象样本的第二预测点击数据；其中，所述第二预测点击数据，用于供结合所述第一预测点击数据对所述媒体信息样本或所述推广对象样本进行推荐；

第二获取模块，用于获取所述第一目标点击数据与所述第一预测点击数据之间的第一差异，及所述第二目标点击数据与所述第二预测点击数据之间的第二差异；

更新模块，用于基于所述第一差异及所述第二差异，更新所述推荐模型的模型参数。

上述方案中，所述特征提取模型包括：用户特征子模型、内容特征子模型及对象特征子模型；所述第一特征提取模块，还用于通过所述用户特征子模型，对所述用户数据进行特征提取，得到所述媒体信息样本的用户特征；

通过所述内容特征子模型，对所述内容数据进行特征提取，得到所述媒体信息样本的内容特征；

通过所述对象特征子模型，对所述对象数据进行特征提取，得到所述推广对象样本的对象特征。

上述方案中，所述用户特征子模型、内容特征子模型及对象特征子模型的模型结构相同；所述用户特征子模型包括：特征映射层、特征拼接层、标准化处理层及特征提取层；所述第一特征提取模块，还用于当所述用户数据包括离散型数据、连续型数据及文本型数据中至少两种类型的数据时，通过所述特征映射层，分别对所述至少两种类型的数据进行映射处理，得到对应每种类型数据的向量；

通过所述特征拼接层，对所述对应每种类型数据的向量进行向量拼接，得到拼接向量；

通过所述标准化处理层，对所述拼接向量进行标准化处理，得到目标维度的标准化向量；

通过所述特征提取层，对所述标准化向量进行特征提取，得到所述媒体信息样本的用户特征。

上述方案中，所述第一预测模块，还用于通过所述预测模型，分别对所述用户特征及内容特征进行映射处理，得到对应所述用户特征的第一向量及对应所述内容特征的第二向量，所述第一向量与所述第二向量的向量维度相同；

基于所述第一向量及所述第二向量，通过所述预测模型，调用激活函数进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据。

上述方案中，所述第一预测模块，还用于对所述第一向量及所述第二向量进行内积处理，得到内积处理结果；

基于所述内积处理结果，调用第一激活函数进行点击概率预测，得到对应所述媒体信息样本的点击概率。

基于所述内积处理结果，调用第二激活函数进行分类预测，得到用于表征是否点击所述媒体信息样本的分类结果。

上述方案中，所述推荐模型还包括权重获取模型；所述装置还包括：

权重获取模块，用于将所述用户特征、内容特征及所述对象特征输入所述权重获取模型，通过所述权重获取模型确定所述用户特征对应的第一权重、所述内容特征对应的第二权重、及所述对象特征对应的第三权重，以结合所述第一权重、所述第二权重及所述第三权重中至少两个进行点击数据预测。

上述方案中，所述权重获取模型包括用户特征权重子模型、内容特征权重子模型及对象特征权重子模型；所述权重获取模块，还用于将所述用户特征、内容特征及所述对象特征输入所述用户特征权重子模型，通过所述用户特征权重子模型确定所述用户特征对应的第一权重；

将所述用户特征、内容特征及所述对象特征输入所述内容特征权重子模型，通过所述内容特征权重子模型确定所述内容特征对应的第二权重；

将所述用户特征、内容特征及所述对象特征输入所述对象特征权重子模型，通过所述对象特征权重子模型确定所述对象特征对应的第三权重。

上述方案中，所述第一预测模块，还用于基于所述第一权重对所述用户特征进行加权处理，得到目标用户特征，并基于所述第二权重对所述内容特征进行加权处理，得到目标内容特征；

基于所述目标用户特征及目标内容特征，通过所述预测模型进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据。

上述方案中，所述第二预测模块，还用于基于所述第一权重对所述用户特征进行加权处理，得到目标用户特征，并基于所述第二权重对所述内容特征进行加权处理，得到目标内容特征，并基于所述第三权重对所述对象特征进行加权处理，得到目标对象特征；

基于所述目标用户特征、目标内容特征及所述目标对象特征，通过所述预测模型进行点击数据预测，得到对应所述推广对象样本的第二预测点击数据。

上述方案中，所述装置还包括：

推荐模块，用于当所述第一预测点击数据为所述媒体信息样本的点击概率、所述第二预测点击数据为所述推广对象样本的点击概率时，确定所述第一预测点击数据与所述第二预测点击数据的乘积；

基于所述乘积的大小，确定所述媒体信息样本在多个待推荐媒体信息中的排序，以基于所述排序对所述媒体信息样本或所述推广对象样本进行推荐。

上述方案中，所述更新模块，还用于基于所述第一差异及所述第二差异，确定所述推荐模型的损失函数的值；

当所述损失函数的值超出预设阈值时，基于所述损失函数确定所述推荐模型的误差信号；

将所述误差信号在所述推荐模型中反向传播，并在传播的过程中更新各个层的模型参数。

本发明实施例还提供一种基于人工智能的内容推荐装置，所述装置应用于推荐模型，所述推荐模型包括：特征提取模型及预测模型，所述装置包括：

第三获取模块，用于获取待推荐媒体信息的用户数据、内容数据、及所述待推荐媒体信息中植入的待推广对象的对象数据；

第二特征提取模块，用于通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述待推荐媒体信息的用户特征、内容特征、及所述待推广对象的对象特征；

第一预测模块，用于基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述待推荐媒体信息的第一预测点击数据；并基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述待推广对象的第二预测点击数据；结合所述第一预测点击数据、及所述第二预测点击数据，对所述待推荐媒体信息或所述待推广对象进行推荐；

本发明实施例还提供一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的方法。

本发明实施例还提供一种存储介质，存储有可执行指令，所述可执行指令被处理器执行时，实现本发明实施例提供的方法。

本发明实施例具有以下有益效果：

首先通过推荐模型包括的特征提取模型，对获取的媒体信息样本的用户数据、内容数据、及媒体信息样本中植入的推广对象样本的对象数据进行特征提取，得到媒体信息样本的用户特征、内容特征、及推广对象样本的对象特征；然后基于用户特征及内容特征，通过推荐模型包括的预测模型，预测媒体信息样本的第一预测点击数据，并基于用户特征、内容特征及对象特征，通过推荐模型包括的预测模型，预测推广对象样本的第二预测点击数据；这里，媒体信息样本标注有第一目标点击数据，推广对象样本标注有第二目标点击数据，从而基于第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异，更新推荐模型的模型参数；如此，针对媒体信息和推广对象，构建一个推荐模型，并基于媒体信息样本的用户数据、内容数据、及推广对象样本的对象数据，对构建的推荐模型进行训练，从而使训练完成的推荐模型可以同时预测得到媒体信息的第一预测点击数据、及推广对象的第二预测点击数据；进而在结合第一预测点击数据、及第二预测点击数据进行媒体信息或者推广对象的推荐时，使得推荐效果更加良好，提高了推荐的准确度。

附图说明

图1是相关技术中提供的推荐模型的训练方法示意图；

图2是本发明实施例提供的基于人工智能的推荐模型的实施场景示意图；

图3是本发明实施例提供的电子设备的结构示意图；

图4是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图一；

图5是本发明实施例提供的推荐模型的结构示意图一；

图6是本发明实施例提供的用户特征子模型的结构示意图；

图7是本发明实施例提供的预测模型的结构示意图；

图8是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图二；

图9是本发明实施例提供的推荐模型的结构示意图二；

图10是本发明实施例提供的用户特征权重子模型的结构示意图；

图11是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图；

图12是本发明实施例提供的媒体信息样本及推广对象样本的示意图；

图13A-B是本发明实施例提供的基于人工智能的内容推荐方法的数据流走向图；

图14-图15是本发明实施例提供的基于人工智能的内容推荐方法的流程示意图；

图16是本发明实施例提供的多任务学习模型的结构示意图；

图17是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图；

图18是本发明实施例提供的基于人工智能的推荐模型的训练装置355的结构示意图；

图19为本发明实施例提供的基于人工智能的内容推荐装置190的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的，不是旨在限制本发明。

对本发明实施例进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)媒体信息：针对推广对象进行宣传的适用于在互联网进行传播的各种类型的信息，可以是软文、视频、资讯等。

2)推广对象：植入在上述媒体信息中的、需要宣传的对象，例如商品、广告等。

3)预测点击数据：当推荐媒体信息或者推广对象发布之前，对用户针对荐媒体信息或者推广对象的点击情况作出预测，包括是否被用户点击、及被用户点击的概率。

在对推广对象(商品、APP等)进行推荐时，通常将推广对象植入媒体信息中进行推荐，这里，媒体信息可以是软文、资讯、视频等形式，将待推广对象植入相应的媒体信息中，以提高用户的接受度与好感度，从而引导用户对推广对象进行购买或者下载等。当前的推荐系统中，通常预测媒体信息或者推广对象的点击数据，从而根据预测点击数据对媒体信息或者推广对象进行推荐。

相关技术中，在构建预测点击数据的推荐模型时，通常采用单任务学习的方式，针对媒体信息、和推广对象分别构建推荐模型并训练，如图1所示，图1是相关技术中提供的推荐模型的训练方法示意图，将采集的对应媒体信息的用户数据、内容数据输入至媒体信息推荐模型，以对该媒体信息推荐模型进行训练；将采集的对应推广对象的对象数据输入至推广对象推荐模型中，以对该推广对象推荐模型进行训练；从而得到两个推荐模型。但是，由于推广对象是植入在媒体信息中的，用户针对媒体信息、及推广对象的两次点击行为并不是完全不相关的；同时针对媒体信息中植入的推广对象，用户在点击媒体信息的情况下，并不一定会点击推广对象，导致推广对象的相关对象数据较少；由此所训练得到的两个推荐模型的点击数据预测准确性较低，所进行的推荐行为的效果较差。

基于此，本发明实施例提供一种基于人工智能的推荐模型的训练方法、装置、电子设备及存储介质，并基于训练好的推荐模型对待推荐媒体信息或者待推广对象进行推荐，提高了推荐准确度。

下面对本发明实施例提供的基于人工智能的推荐模型的实施场景进行说明，参见图2，图2是本发明实施例提供基于人工智能的推荐模型的实施场景示意图，为实现支撑一个示例性应用，终端200(包括终端200-1和终端200-2)上设置有应用客户端，如新闻应用客户端、视频播放客户端；其中，终端200-1位于推荐媒体信息或者推广对象的发布侧，终端200-2位于推荐媒体信息或者推广对象的接收侧，终端200通过网络300连接服务器100，网络300可以是广域网或者局域网，又或者是二者的组合，使用无线或有线链路实现数据传输。

服务器100，用于获取媒体信息样本的用户数据、内容数据、及媒体信息样本中植入的推广对象样本的对象数据；通过特征提取模型，分别对用户数据、内容数据及对象数据进行特征提取，得到媒体信息样本的用户特征、内容特征、及推广对象样本的对象特征；基于用户特征及内容特征，通过预测模型进行点击数据预测，得到对应媒体信息样本的第一预测点击数据；并基于用户特征、内容特征及对象特征，通过预测模型进行点击数据预测，得到对应推广对象样本的第二预测点击数据；获取第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异；基于第一差异及第二差异，更新推荐模型的模型参数；如此，实现对推荐模型的训练。

用户打开用户终端200-1的客户端，发布一条待推荐媒体信息，其中植入了待推广对象，如终端200-1用于生成并发送携带待推荐媒体信息的用户数据、内容数据、及待推广对象的对象数据的点击数据预测请求给服务器100；

服务器100，用于获取待推荐媒体信息的用户数据、内容数据及待推广对象的对象数据；采用训练完成的推荐模型对待推荐媒体信息和待推广对象进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据、及对应待推广对象的第二预测点击数据；基于第一预测点击数据及第二预测点击数据，确定用于推荐的推荐媒体信息或推广对象，并返回给终端200-2。

终端(如终端200-2)，用于通过显示界面呈现推荐媒体信息或推广对象。

在实际应用中，服务器100既可以为单独配置的支持各种业务的一个服务器，亦可以配置为一个服务器集群；终端(如终端200-1)可以为智能手机、平板电脑、笔记本电脑等各种类型的用户终端，还可以为可穿戴计算设备、个人数字助理(PDA)、台式计算机、蜂窝电话、媒体播放器、导航设备、游戏机、电视机、或者这些数据处理设备或其他数据处理设备中任意两个或多个的组合。

下面对本发明实施例提供的基于人工智能的推荐模型的训练方法的电子设备的硬件结构做详细说明。参见图3，图3是本发明实施例提供的电子设备的结构示意图，图3所示的电子设备300包括：至少一个处理器310、存储器350、至少一个网络接口320和用户接口330。电子设备300中的各个组件通过总线系统340耦合在一起。可理解，总线系统340用于实现这些组件之间的连接通信。总线系统340除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线系统340。

处理器310可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口330包括使得能够呈现媒体内容的一个或多个输出装置331，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口330还包括一个或多个输入装置332，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

存储器350可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器350可选地包括在物理位置上远离处理器310的一个或多个存储设备。

存储器350包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Me mory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memor y)。本发明实施例描述的存储器350旨在包括任意适合类型的存储器。

在一些实施例中，存储器350能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统351，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块352，用于经由一个或多个(有线或无线)网络接口330到达其他计算设备，示例性的网络接口320包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

呈现模块353，用于经由一个或多个与用户接口330相关联的输出装置331(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；

输入处理模块354，用于对一个或多个来自一个或多个输入装置332之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本发明实施例提供的基于人工智能的推荐模型的训练装置可以采用软件方式实现，图3示出了存储在存储器350中的基于人工智能的推荐模型的训练装置355，其可以是程序和插件等形式的软件，包括以下软件模块：第一获取模块3551、第一特征提取模块3552、第一预测模块3553、第二获取模块3554和更新模块3555，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分，将在下文中说明各个模块的功能。

在另一些实施例中，本发明实施例提供的基于人工智能的推荐模型的训练装置可以采用软硬件结合的方式实现，作为示例，本发明实施例提供的基于人工智能的推荐模型的训练装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本发明实施例提供的***方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable LogicDevice)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

可以理解的是，本发明实施例提供的基于人工智能的推荐模型的训练方法可以由电子设备执行，电子设备包括但不限于服务器或终端。下面将结合本发明实施例提供的基于人工智能的推荐模型的训练方法实施为服务器的示例性应用，说明本发明实施例提供的基于人工智能的推荐模型的训练方法。参见图4-图5，图4是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图一，图5是本发明实施例提供的推荐模型的结构示意图一，如图5所示，本发明实施例提供的推荐模型包括特征提取模型51、及预测模型52；下面结合图5对图4所示出的步骤进行说明。

步骤401：服务器获取媒体信息样本的用户数据、内容数据、及媒体信息样本中植入的推广对象样本的对象数据。

这里，媒体信息样本标注有第一目标点击数据，推广对象样本标注有第二目标点击数据。在实际实施时，媒体信息样本中植入了推广对象样本，示例性地，媒体信息样本可以是软文、资讯、视频等，其中植入了购买商品、APP下载链接等推广对象样本，该媒体信息样本可用来引导用户对推广对象进行下载或购买。

在实际应用中，服务器采集媒体信息样本的用户数据、内容数据、以及媒体信息样本中植入的推广对象样本的对象数据；这里，媒体信息样本的用户数据可以是用户标识、用户年龄、用户在某时间段内点击广告的次数等；内容数据可以是软文文本、资讯内容等；对象数据可以是商品价格、商品曝光次数等。

服务器在采集用户数据、内容数据及对象数据的同时，还分别采集了媒体信息样本对应的第一目标点击数据、推广对象样本对应的第二目标点击数据并进行了标注。这里目标点击数据即为实际点击数据，可以是针对媒体信息样本或者推广对象样本的点击率，也可以是针对媒体信息样本或者推广对象样本记录的是否被点击的状态。

步骤402：通过特征提取模型，分别对用户数据、内容数据及对象数据进行特征提取，得到媒体信息样本的用户特征、内容特征、及推广对象样本的对象特征。

服务器在获取到用户数据、内容数据及对象数据之后，通过预先构建的特征提取模型，分别对用户数据、内容数据及对象数据进行特征提取，从而得到媒体信息样本的用户特征、内容特征、及推广对象样本的对象特征。

在一些实施例中，特征提取模型包括用户特征子模型、内容特征子模型及对象特征子模型，从而可通过如下方式，分别对用户数据、内容数据及对象数据进行特征提取：通过用户特征子模型，对用户数据进行特征提取，得到媒体信息样本的用户特征；通过内容特征子模型，对内容数据进行特征提取，得到媒体信息样本的内容特征；通过对象特征子模型，对对象数据进行特征提取，得到推广对象样本的对象特征。

这里，如图5所示，特征提取模型51包括用户特征子模型511、内容特征子模型512及对象特征子模型513。将用户数据、内容数据及对象数据分别输入到相应的子模型中：即将用户数据输入用户特征子模型511中、将内容数据输入内容特征子模型512中、将对象数据输入对象特征子模型513中，从而分别通过用户特征子模型511输出媒体信息样本的用户特征、通过内容特征子模型512输出媒体信息样本的内容特征、通过对象特征子模型513输出推广对象样本的对象特征。

在实际应用中，用户特征子模型、内容特征子模型及对象特征子模型的模型结构相同，具体每个子模型可分别包括特征映射层、特征拼接层、标准化处理层及特征提取层。

下面以用户特征子模型为示例，对特征提取模型包含的各特征子模型提取数据特征进行说明。在一些实施例中，可通过如下方式，采用上述用户特征子模型511对用户数据进行特征提取，以得到媒体信息样本的用户特征：当用户数据包括离散型数据、连续型数据及文本型数据中至少两种类型的数据时，通过特征映射层，分别对至少两种类型的数据进行映射处理，得到对应每种类型数据的向量；通过特征拼接层，对对应每种类型数据的向量进行向量拼接，得到拼接向量；通过标准化处理层，对拼接向量进行标准化处理，得到目标维度的标准化向量；通过特征提取层，对标准化向量进行特征提取，得到媒体信息样本的用户特征。

在实际应用中，参见图6，图6是本发明实施例提供的用户特征子模型的结构示意图。这里，用户特征子模型511包括：特征映射层610、特征拼接层620、标准化处理层630及特征提取层640；进一步地，考虑到用户数据包括不同类型的数据(比如离散型数据、连续型数据等)，为提高向量映射的精确性，特征映射层610还包括离散特征映射层610-1、连续特征映射层610-2、文本特征映射层610-3。

当对用户数据进行特征映射时，首先，根据数据类型的不同，对用户数据进行划分，可包括离散型数据、连续型数据及文本型数据，进而基于不同的特征映射层，对相应类型的用户数据进行特征映射。具体地：通过离散特征映射层610-1对划分得到的离散型数据进行映射处理，比如独热编码的映射处理方式，得到离散型向量；通过连续特征映射层610-2对划分得到的连续型数据进行映射处理，得到连续型向量；通过文本特征映射层610-3对划分得到的文本型数据进行映射处理，比如通过预先训练好的TextCNN模型，得到文本型向量。

其次，在通过特征映射层对用户数据进行映射处理后，将得到的对应每种数据类型的向量输入至特征拼接层，通过特征拼接层，对对应每种类型数据的向量进行向量拼接，得到拼接向量。具体地：将离散型数据对应的向量进行向量拼接，得到离散型拼接向量；对连续型数据对应的向量进行向量拼接，得到连续型拼接向量；对文本型数据对应的向量进行向量拼接，得到文本型拼接向量。

然后，通过标准化处理层对拼接向量进行标准化处理，得到目标维度的标准化向量，这里，目标维度可根据需要自行设置，只需要对拼接向量进行标准化处理后，得到统一维度的标准化向量即可。

最后，通过特征提取层对得到的标准化向量进行特征提取，得到媒体信息样本的用户特征。

内容特征子模型及对象特征子模型的结构与上述用户特征子模型的结构相同，当通过内容特征子模型对内容数据进行特征提取、及通过对象特征子模型对对象数据进行特征提取时，可采用与上述通过用户特征子模型相同的特征提取方式，在本发明实施例中不再赘述。

在一些实施例中，为使特征提取模型的提取效果更好，特征提取模型可同时包含多个特征提取层，每个特征提取层都采用与特征提取模型同样的模型结构；在进行基于多个特征提取层进行数据特征提取时，可以将每个特征提取层，分别设置为不同的特征提取角度，进而通过多个特征提取层，采用不同的特征提取角度对获取的数据进行特征提取。示例性地，比如针对用户数据，可以设置的不同特征提取角度包括不同的特征组合角度；再比如针对文本型数据，可以设置的不同特征提取角度包括文本的词义、词频、语义等。

步骤403：基于用户特征及内容特征，通过预测模型进行点击数据预测，得到对应媒体信息样本的第一预测点击数据。

在经过特征提取模型的特征提取之后，将得到的用户特征及内容特征输入至预测模型，对媒体信息样本的点击数据进行预测。

在一些实施例中，基于用户特征及内容特征，可通过如下方式，得到对应媒体信息样本的第一预测点击数据：通过预测模型，分别对用户特征及内容特征进行映射处理，得到对应用户特征的第一向量及对应内容特征的第二向量，第一向量与第二向量的向量维度相同；基于第一向量及第二向量，通过预测模型，调用激活函数进行点击数据预测，得到对应媒体信息样本的第一预测点击数据。

在实际应用中，参见图7，图7是本发明实施例提供的预测模型的结构示意图，这里，预测模型52包括隐藏层710、线性映射层720及内积处理层730。将特征提取模型输出的用户特征、内容特征输入至预测模型中，通过预测模型的线性映射层720，分别对用户特征及内容特征进行映射处理，使映射得到的向量维度都相同，即对应用户特征的第一向量、及对应内容特征的第二向量。从而基于第一向量及第二向量，通过预测模型调用激活函数进行点击数据预测，得到对应媒体信息样本的第一预测点击数据。

在实际应用中，预测模型可用于预测对应媒体信息样本的点击概率，此种情况是回归任务，预测模型归属于回归模型；或可用于预测媒体信息样本是否被用户所点击，如是否被用户点击，此种情况则是分类任务，预测模型归属于分类模型。

在一些实施例中，当预测模型归属于回归模型时，服务器可通过如下方式，基于第一向量及第二向量，得到对应媒体信息样本的第一预测点击数据：对第一向量及第二向量进行内积处理，得到内积处理结果；基于内积处理结果，调用第一激活函数进行点击概率预测，得到对应媒体信息样本的点击概率。

这里，预测模型用于对媒体信息样本是否被用户点击的连续变量预测，通过预测模型的内积处理层730，对第一向量及第二向量进行内积处理，得到内积处理结果；进而通过预测模型，调用第一激活函数进行回归处理，比如回归函数，预测得到对应媒体信息样本的点击概率。

在一些实施例中，当预测模型归属于回归模型时，服务器可通过如下方式，基于第一向量及第二向量，得到对应媒体信息样本的第一预测点击数据：对第一向量及第二向量进行内积处理，得到内积处理结果；基于内积处理结果，调用第二激活函数进行分类预测，得到用于表征是否点击媒体信息样本的分类结果。

这里，预测模型用于对媒体信息样本是否被用户点击的离散变量预测，通过预测模型的内积处理层730，对第一向量及第二向量进行内积处理，得到内积处理结果；进而通过预测模型，调用第二激活函数进行分类预测，比如soft max分类函数，得到用于表征媒体信息样本是否被用户点击的分类结果。

步骤404：基于用户特征、内容特征及对象特征，通过预测模型进行点击数据预测，得到对应推广对象样本的第二预测点击数据。

这里，在对推广对象样本的点击数据进行预测时，同样通过预测模型进行预测，与上述对媒体信息样本的点击数据进行预测的方式相同。不过由于推广对象样本为植入于媒体信息样本中的，所以在进行推广对象样本的点击数据预测时，不仅需要对象特征，还需要媒体信息对应的用户特征及内容特征。即将用户特征、内容特征及对象特征均输入预测模型中，以得到对应推广对象样本的第二预测点击数据。

在实际实施时，通过预测模型分别对用户特征、内容特征及对象特征进行映射处理，得到对应用户特征的第一向量、对应内容特征的第二向量及对应对象特征的第三向量；对第一向量、第二向量及第三向量进行内积处理，得到内积处理结果；基于内积处理结果，调用激活函数进行点击数据预测，得到对应推广对象样本的第二预测点击数据。这里，预测模型可用于预测对应推广对象样本的点击概率，此种情况是回归任务，预测模型归属于回归模型，在进行点击数据预测时调用第一激活函数，即回归函数；或可用于预测对于推广对象样本是否被用户所点击，如是否被用户点击，此种情况则是分类任务，预测模型归属于分类模型，在进行点击数据预测时调用第二激活函数，即分类函数。

其中，第二预测点击数据，用于供结合第一预测点击数据对媒体信息样本或推广对象样本进行推荐。在一些实施例中，可通过如下方式对媒体信息样本或推广对象样本进行推荐：当第一预测点击数据为媒体信息样本的点击概率、第二预测点击数据为推广对象样本的点击概率时，确定第一预测点击数据与第二预测点击数据的乘积；基于乘积的大小，确定媒体信息样本在多个待推荐媒体信息中的排序，以基于排序对媒体信息样本或推广对象样本进行推荐。

在实际应用中，如果预测模型输出的第一预测点击数据为媒体信息样本的点击概率、第二预测点击数据为推广对象样本的点击概率时，则可以确定第一预测点击数据与第二预测点击数据的乘积，进而基于乘积的大小，对多个待推荐媒体信息进行排序；将排序靠前的设定数量的待推荐媒体信息推荐给用户，这里待推荐媒体信息中植入有对应的推广对象。

步骤405：获取第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异。

步骤406：基于第一差异及第二差异，更新推荐模型的模型参数。

在一些实施例中，服务器可通过如下方式，基于第一差异及第二差异，更新推荐模型的模型参数：基于第一差异及第二差异，确定推荐模型的损失函数的值；当损失函数的值超出预设阈值时，基于损失函数确定推荐模型的误差信号；将误差信号在推荐模型中反向传播，并在传播的过程中更新各个层的模型参数。

在实际应用中，损失函数可以根据需要确定，比如交叉熵损失函数、指数损失函数、铰链损失函数等。服务器基于第一目标点击数据与第一预测点击数据之间的第一差异、及第二目标点击数据与第二预测点击数据之间的第二差异，确定损失函数的值；当损失函数的值超过阈值时，确定推荐模型的误差信号，从而基于误差信号在推荐模型中反向传播的过程中，更新推荐模型各个层的模型参数。

下面继续说明本发明实施例提供的基于人工智能的推荐模型的训练方法。参见图8-图9，图8是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图二，图9是本发明实施例提供的推荐模型的结构示意图二，如图9所示，本发明实施例提供的推荐模型包括特征提取模型、权重获取模型91及预测模型；下面结合图9对图8所示出的步骤进行说明。

步骤801：服务器获取媒体信息样本的用户数据、内容数据、及媒体信息样本中植入的推广对象样本的对象数据。

步骤802：通过特征提取模型，分别对用户数据、内容数据及对象数据进行特征提取，得到媒体信息样本的用户特征、内容特征、及推广对象样本的对象特征。

步骤803：将用户特征、内容特征及对象特征输入权重获取模型，通过权重获取模型确定用户特征对应的第一权重、内容特征对应的第二权重、及对象特征对应的第三权重。

在一些实施例中，如图9所示，权重获取模型91包括用户特征权重子模型911、内容特征权重子模型912及对象特征权重子模型913；服务器可通过如下方式，确定用户特征对应的第一权重、内容特征对应的第二权重、及对象特征对应的第三权重：将用户特征、内容特征及对象特征输入用户特征权重子模型，通过用户特征权重子模型确定用户特征对应的第一权重；将用户特征、内容特征及对象特征输入内容特征权重子模型，通过内容特征权重子模型确定内容特征对应的第二权重；将用户特征、内容特征及对象特征输入对象特征权重子模型，通过对象特征权重子模型确定对象特征对应的第三权重。

在实际应用中，用户特征权重子模型、内容特征权重子模型及对象特征权重子模型的模型结构相同，为针对不同的数据可以提取出不同的特征，该用户特征权重子模型、内容特征权重子模型及对象特征权重子模型的模型参数不同。具体的，每个权重子模型可分别包括特征映射层、特征拼接及标准化处理层、线性特征映射层及权重计算层。

下面以用户特征权重子模型为例，对权重获取模型包含的各权重子模型进行说明，参见图10，图10是本发明实施例提供的用户特征权重子模型的结构示意图。这里，用户特征权重子模型911包括：特征映射层1010、特征拼接及标准化处理层1020、线性特征映射层1030及权重获取层1040。进一步地，考虑到用户数据、内容数据及对象数据中，包括不同类型的数据(比如离散型数据、连续型数据等)，为提高向量映射的精确性，特征映射层1010还包括离散特征映射层1010-1、连续特征映射层1010-2、文本特征映射层1010-3。

当获取用户特征的第一权重时，将用户特征、内容特征及对象特征输入用户特征权重子模型，通过特征映射层1010，对相应类型的数据进行映射处理。然后通过特征拼接及标准化处理层1020对对应每种类型数据的向量进行向量拼接，得到拼接向量，并进一步执行标准化处理，从而得到目标维度的标准化向量；最后通过线性特征映射层1030对标准化向量进行进一步映射，得到预设维度的向量。从而通过权重获取层1040采用预设激活函数，比如softmax函数，对预设维度的向量进行处理，得到用户特征对应的第一权重。

在实际应用中，通过内容特征权重子模型、及对象特征权重子模型确定内容特征的第二权重、及对象特征的第三权重时，同上述通过用户特征权重子模型确定用户特征的第一权重的过程，在此不再赘述。

步骤804：基于用户特征及内容特征，结合第一权重及第二权重，通过预测模型进行点击数据预测，得到对应媒体信息样本的第一预测点击数据。

在一些实施例中，服务器可通过如下方式，基于用户特征及内容特征，得到对应媒体信息样本的第一预测点击数据：基于第一权重对用户特征进行加权处理，得到目标用户特征，并基于第二权重对内容特征进行加权处理，得到目标内容特征；基于目标用户特征及目标内容特征，通过预测模型进行点击数据预测，得到对应媒体信息样本的第一预测点击数据。

在实际应用中，这里的权重表示特征提取模型所提取的特征有多少比例可以用于点击数据的预测。在权重获取模型输出各特征对应的权重之后，分别通过第一权重及第二权重对用户特征、内容特征进行加权处理，即得到用于最后预测点击数据的目标特征，即用户特征对应的目标用户特征、及内容特征对应的目标内容特征；进而基于目标用户特征及目标内容特征，通过预测模型进行点击数据的预测。具体通过预测模型进行点击数据的预测的过程，与上述预测模型基于用户特征及内容特征进行的点击数据预测的过程相同，在此处不再赘述。

步骤805：基于用户特征、内容特征及对象特征，结合第一权重、第二权重及第三权重，通过预测模型进行点击数据预测，得到对应推广对象样本的第二预测点击数据。

在一些实施例中，服务器可通过如下方式，基于用户特征、内容特征及对象特征，得到对应推广对象样本的第二预测点击数据：基于第一权重对用户特征进行加权处理，得到目标用户特征，并基于第二权重对内容特征进行加权处理，得到目标内容特征，并基于第三权重对对象特征进行加权处理，得到目标对象特征；基于目标用户特征、目标内容特征及目标对象特征，通过预测模型进行点击数据预测，得到对应推广对象样本的第二预测点击数据。

步骤806：获取第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异。

步骤807：基于第一差异及第二差异，更新推荐模型的模型参数。

应用本发明上述实施例，首先通过推荐模型包括的特征提取模型，对获取的媒体信息样本的用户数据、内容数据、及媒体信息样本中植入的推广对象样本的对象数据进行特征提取，得到媒体信息样本的用户特征、内容特征、及推广对象样本的对象特征；然后基于用户特征及内容特征，通过推荐模型包括的预测模型，预测媒体信息样本的第一预测点击数据，并基于用户特征、内容特征及对象特征，通过推荐模型包括的预测模型，预测推广对象样本的第二预测点击数据；这里，媒体信息样本标注有第一目标点击数据，推广对象样本标注有第二目标点击数据，从而基于第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异，更新推荐模型的模型参数；如此，针对媒体信息和推广对象，构建一个推荐模型，并基于媒体信息样本的用户数据、内容数据、及推广对象样本的对象数据，对构建的推荐模型进行训练，从而使训练完成的推荐模型可以同时预测得到媒体信息的第一预测点击数据、及推广对象的第二预测点击数据；进而在结合第一预测点击数据、及第二预测点击数据进行媒体信息或者推广对象的推荐时，使得推荐效果更加良好，提高了推荐的准确度。

下面以媒体信息样本为软文为例，继续对本发明实施例提供的基于人工智能的推荐模型的训练方法进行说明；参见图11，图11是本发明实施例提供的基于人工智能的推荐模型的训练方法的流程示意图，本发明实施例提供的基于人工智能的推荐模型的训练方法由应用客户端、服务器协同实施。本发明实施例提供的推荐模型包括：特征提取模型、权重获取模型和预测模型，其中特征提取模型包括用户特征子模型、内容特征子模型及对象特征子模型，权重获取模型包括用户特征权重子模型、内容特征权重子模型及对象特征权重子模型。

步骤1101：服务器获取媒体信息样本的用户数据、内容数据、及推广对象样本的对象数据。

这里，媒体信息样本为软文，参见图12，图12是本发明实施例提供的媒体信息样本及推广对象样本的示意图；如图12所示，媒体信息样本1200为一则“大饼传达札记”的推送消息，1210即为软文的正文内容，可用于获取内容数据，其中植入了推广对象样本1220“高跟鞋”。用户数据是采集的点击该软文的用户的相关信息，比如用户标识、用户年龄等；对象数据可以是推广对象1220“高跟鞋”的价格等。

步骤1102：通过用户特征子模型，对用户数据进行特征提取，得到媒体信息样本的用户特征。

步骤1103：通过内容特征子模型，对内容数据进行特征提取，得到媒体信息样本的内容特征。

步骤1104：通过对象特征子模型，对对象数据进行特征提取，得到推广对象样本的对象特征。

步骤1105：基于目标用户特征及目标内容特征，通过预测模型，预测得到对应媒体信息样本的第一预测点击数据。

步骤1106：基于目标用户特征、目标内容特征及目标对象特征，通过预测模型，预测得到对应推广对象样本的第二预测点击数据。

步骤1107：获取第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异。

步骤1108：基于第一差异及第二差异，更新推荐模型的模型参数。

步骤1109：应用客户端发送点击数据预测请求。

步骤1110：通过推荐模型，对待推荐媒体信息和待推广对象进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据、及对应待推广对象的第二预测点击数据。

步骤1111：基于第一预测点击数据及第二预测点击数据，确定用于推荐的推荐媒体信息或推广对象。

步骤1112：将确定的推荐媒体信息或推广对象发送给应用客户端。

步骤1113：应用客户端呈现推荐媒体信息或推广对象。

在对待推荐媒体信息或者待推广对象进行推荐时，服务器获取待推荐媒体信息的用户数据、内容数据及待推广对象的对象数据；采用训练完成的推荐模型对待推荐媒体信息和待推广对象进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据、及对应待推广对象的第二预测点击数据；基于第一预测点击数据及第二预测点击数据，确定用于推荐的推荐媒体信息或推广对象，并将确定的推荐媒体信息或推广对象发送给终端。

接下来对本发明实施例提供的基于人工智能的内容推荐方法进行说明，参见图13A-B、图14及图15，图13A-B是本发明实施例提供的基于人工智能的内容推荐方法的数据流走向图，图14-图15是本发明实施例提供的基于人工智能的内容推荐方法的流程示意图，该点击数据预测方法应用于推荐模型。可以理解的是，本发明实施例提供的基于人工智能的内容推荐方法可以由电子设备执行，电子设备包括但不限于服务器或终端。下面将结合本发明实施例提供的基于人工智能的内容推荐方法实施为服务器的示例性应用，说明本发明实施例提供的基于人工智能的内容推荐方法。

在一些实施例中，如图13A所示，推荐模型包括特征提取层和预测模型。下面将结合图13A和图14对本发明实施例提供的基于人工智能的内容推荐方法进行说明，包括：

步骤1401：服务器获取待推荐媒体信息的用户数据、内容数据、及待推荐媒体信息中植入的待推广对象的对象数据。

步骤1402：通过特征提取模型，分别对用户数据、内容数据及对象数据进行特征提取，得到待推荐媒体信息的用户特征、内容特征、及待推广对象的对象特征。

步骤1403：基于用户特征及内容特征，通过预测模型进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据。

步骤1404：基于用户特征、内容特征及对象特征，通过预测模型进行点击数据预测，得到对应待推广对象的第二预测点击数据。

其中，第二预测点击数据，用于供结合第一预测点击数据对待推荐媒体信息或待推广对象进行推荐。

步骤1405：结合第一预测点击数据、及第二预测点击数据，对待推荐媒体信息或待推广对象进行推荐。

在另外一些实施例中，如图13B所示，上述推荐模型除了包括特征提取模型、预测模型之外，还包括权重获取模型。下面将结合图13B和图15对本发明实施例提供的基于人工智能的内容推荐方法进行说明，包括：

步骤1501：服务器获取待推荐媒体信息的用户数据、内容数据、及待推荐媒体信息中植入的待推广对象的对象数据。

步骤1502：通过特征提取模型，分别对用户数据、内容数据及对象数据进行特征提取，得到待推荐媒体信息的用户特征、内容特征、及待推广对象的对象特征。

步骤1503：将用户特征、内容特征及对象特征输入权重获取模型，通过权重获取模型确定用户特征对应的第一权重、内容特征对应的第二权重、及对象特征对应的第三权重。

步骤1504：基于第一权重对用户特征进行加权处理，得到目标用户特征；基于第二权重对内容特征进行加权处理，得到目标内容特征；基于第三权重对对象特征进行加权处理，得到目标对象特征。

步骤1505：基于目标用户特征及目标内容特征，通过预测模型进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据。

步骤1506：基于目标用户特征、目标内容特征及目标对象特征，通过预测模型进行点击数据预测，得到对应待推广对象的第二预测点击数据。

步骤1507：结合第一预测点击数据、及第二预测点击数据，对待推荐媒体信息或待推广对象进行推荐。

这里，在实际应用中，在对待推荐媒体信息或者待推广对象进行推荐时，服务器获取待推荐媒体信息的用户数据、内容数据及待推广对象的对象数据；采用训练完成的推荐模型对待推荐媒体信息和待推广对象进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据、及对应待推广对象的第二预测点击数据；基于第一预测点击数据及第二预测点击数据，确定用于推荐的推荐媒体信息或推广对象，并将确定的推荐媒体信息或推广对象发送给终端。其中，第二预测点击数据，用于供结合第一预测点击数据对待推荐媒体信息或待推广对象进行推荐，进而提高了推荐的准确度。

下面将说明本发明实施例在一个实际的应用场景中的示例性应用。在实际应用中，在对推广对象(商品、APP等)进行推荐时，通常将推广对象植入媒体信息中进行推荐，这里，媒体信息可以是软文、资讯、视频等形式，将待推广对象植入相应的媒体信息中，以提高用户的接受度与好感度，从而引导用户对推广对象进行购买或者下载等。当前的推荐系统中，通常预测媒体信息或者推广对象的点击数据，从而根据预测点击数据对媒体信息或者推广对象进行推荐。

相关技术中，在构建预测点击数据的推荐模型时，通常采用单任务学习的方式，针对媒体信息、和推广对象分别构建推荐模型并训练，如图1所示，将采集的对应媒体信息的用户数据、内容数据输入至媒体信息推荐模型，以对该媒体信息推荐模型进行训练；将采集的对应推广对象的对象数据输入至推广对象推荐模型中，以对该推广对象推荐模型进行训练；从而得到两个推荐模型。但是，由于推广对象是植入在媒体信息中的，用户针对媒体信息、及推广对象的两次点击行为并不是完全不相关的；同时针对媒体信息中植入的推广对象，用户在点击媒体信息的情况下，并不一定会点击推广对象，导致推广对象的相关对象数据较少；由此所训练得到的两个推荐模型的点击数据预测准确性较低，所进行的推荐行为的效果较差。

基于此，本发明实施例提供一种基于人工智能的推荐模型的训练方法，结合多任务学习的方式，将用户对媒体信息的点击行为、及用户对推广对象的点击行为关联到一起，基于媒体信息的用户数据、内容数据、及推广对象的对象数据共同对构建的推荐模型进行训练。参见图16，图16是本发明实施例提供的多任务学习模型的结构示意图，包括：多任务学习的算法结构示意图，如图16中(1)所示；采用相同输入层、相同模型参数的硬参数共享模型的结构示意图，如图16中(2)图所示；及采用不同输入层、不同模型参数的软参数共享模型的结构示意图，如图16中(3)图所示。在本发明实施例中，为使推荐模型的点击数据预测效果更好，采用如图16中(3)图所示的软参数共享模型。

继续参见图9，本发明实施例提供的推荐模型包括特征提取模型、权重获取模型91及预测模型，接下来对本发明实施例提供的推荐模型的训练过程进行说明，如图17所示，包括：

步骤1701：服务器获取媒体信息样本的用户数据、内容数据、及推广对象样本的对象数据。

这里，推广对象样本植入在媒体信息样本中；并且媒体信息样本标注有第一目标点击数据，推广对象样本标注有第二目标点击数据。

步骤1702：通过用户特征子模型，对用户数据进行特征提取，得到媒体信息样本的用户特征。

这里，如图5所示，特征提取模型包括用户特征子模型511、内容特征子模型512及对象特征子模型513；其中各特征子模型的结构相同。

以用户特征子模型为例，参见图6，用户特征子模型511包括特征映射层610、特征拼接层620、标准化处理层630及特征提取层640；进一步地，考虑到用户数据包括不同类型的数据(比如离散型数据、连续型数据等)，为提高向量映射的精确性，特征映射层610还包括离散特征映射层610-1、连续特征映射层610-2、文本特征映射层610-3。

在实际实施时，首先，通过离散特征映射层610-1对划分得到的离散型数据进行映射处理，比如独热编码的映射处理方式，得到离散型向量；通过连续特征映射层610-2对划分得到的连续型数据进行映射处理，得到连续型向量；通过文本特征映射层610-3对划分得到的文本型数据进行映射处理，比如通过预先训练好的TextCNN模型，得到文本型向量。

其次，在通过特征映射层对用户数据进行映射处理后，将得到的对应每种数据类型的向量输入至特征拼接层，通过特征拼接层，对对应每种类型数据的向量进行向量拼接，得到拼接向量。

为使特征提取模型的提取效果更好，特征提取模型可同时包含多个特征提取层，每个特征提取层都采用与特征提取模型同样的模型结构；在进行基于多个特征提取层进行数据特征提取时，可以将每个特征提取层，分别设置为不同的特征提取角度，进而通过多个特征提取层，采用不同的特征提取角度对获取的数据进行特征提取。如图9所示的特征提取模型，包括N个特征提取层。

步骤1703：通过内容特征子模型，对内容数据进行特征提取，得到媒体信息样本的内容特征。

这里，具体通过内容特征子模型对内容数据进行特征提取时，与上述通过用户特征子模型对用户数据进行提取的过程是相同的，在此不再赘述。

步骤1704：通过对象特征子模型，对对象数据进行特征提取，得到推广对象样本的对象特征。

这里，具体通过对象特征子模型对对象数据进行特征提取时，也与上述通过用户特征子模型对用户数据进行提取的过程是相同的，在此不再赘述。

步骤1705：将用户特征、内容特征及对象特征输入用户特征权重子模型，通过用户特征权重子模型确定用户特征对应的第一权重。

这里，用户特征权重子模型的结构如图10所示。

步骤1706：将用户特征、内容特征及对象特征输入内容特征权重子模型，通过内容特征权重子模型确定内容特征对应的第二权重。

步骤1707：将用户特征、内容特征及对象特征输入对象特征权重子模型，通过对象特征权重子模型确定对象特征对应的第三权重。

步骤1708：基于各权重对用户特征、内容特征及对象特征分别进行加权处理，得到目标用户特征、目标内容特征及目标对象特征。

这里，基于第一权重对用户特征进行加权处理，得到目标用户特征，并基于第二权重对内容特征进行加权处理，得到目标内容特征，并基于第三权重对对象特征进行加权处理，得到目标对象特征。

步骤1709：基于目标用户特征及目标内容特征，通过预测模型，预测得到对应媒体信息样本的第一预测点击数据。

步骤1710：基于目标用户特征、目标内容特征及目标对象特征，通过预测模型，预测得到对应推广对象样本的第二预测点击数据。

步骤1711：获取第一目标点击数据与第一预测点击数据之间的第一差异，及第二目标点击数据与第二预测点击数据之间的第二差异。

步骤1712：基于第一差异及第二差异，更新推荐模型的模型参数。

步骤1713：应用客户端发送点击数据预测请求。

步骤1714：通过推荐模型，对待推荐媒体信息和待推广对象进行点击数据预测，得到对应待推荐媒体信息的第一预测点击数据、及对应待推广对象的第二预测点击数据。

步骤1715：基于第一预测点击数据及第二预测点击数据，确定用于推荐的推荐媒体信息或推广对象。

步骤1716：将确定的推荐媒体信息或推广对象发送给应用客户端。

步骤1717：应用客户端呈现推荐媒体信息或推广对象。

下面继续说明本发明实施例提供的基于人工智能的推荐模型的训练装置355，在一些实施例中，基于人工智能的推荐模型的训练装置可采用软件模块的方式实现。参见图18，图18是本发明实施例提供的基于人工智能的推荐模型的训练装置355的结构示意图，存储在存储器350中的基于人工智能的推荐模型的训练装置355，其中，推荐模型包括特征提取模型及预测模型，其可以是程序和插件等形式的软件；本发明实施例提供的基于人工智能的推荐模型的训练装置355包括：

第一获取模块3551，用于获取媒体信息样本的用户数据、内容数据、及所述媒体信息样本中植入的推广对象样本的对象数据；其中，所述媒体信息样本标注有第一目标点击数据，所述推广对象样本标注有第二目标点击数据；

第一特征提取模块3552，用于通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述媒体信息样本的用户特征、内容特征、及所述推广对象样本的对象特征；

第一预测模块3553，用于基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据；并基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述推广对象样本的第二预测点击数据；其中，所述第二预测点击数据，用于供结合所述第一预测点击数据对所述媒体信息样本或所述推广对象样本进行推荐；

第二获取模块3554，用于获取所述第一目标点击数据与所述第一预测点击数据之间的第一差异，及所述第二目标点击数据与所述第二预测点击数据之间的第二差异；

更新模块3555，用于基于所述第一差异及所述第二差异，更新所述推荐模型的模型参数。

在一些实施例中，所述特征提取模型包括：用户特征子模型、内容特征子模型及对象特征子模型；所述第一特征提取模块3552，还用于通过所述用户特征子模型，对所述用户数据进行特征提取，得到所述媒体信息样本的用户特征；

在一些实施例中，所述用户特征子模型、内容特征子模型及对象特征子模型的模型结构相同；所述用户特征子模型包括：特征映射层、特征拼接层、标准化处理层及特征提取层；所述第一特征提取模块3552，还用于当所述用户数据包括离散型数据、连续型数据及文本型数据中至少两种类型的数据时，通过所述特征映射层，分别对所述至少两种类型的数据进行映射处理，得到对应每种类型数据的向量；

在一些实施例中，所述第一预测模块3553，还用于通过所述预测模型，分别对所述用户特征及内容特征进行映射处理，得到对应所述用户特征的第一向量及对应所述内容特征的第二向量，所述第一向量与所述第二向量的向量维度相同；

在一些实施例中，所述第一预测模块3553，还用于对所述第一向量及所述第二向量进行内积处理，得到内积处理结果；

在一些实施例中，所述推荐模型还包括权重获取模型；所述装置还包括：

在一些实施例中，所述权重获取模型包括用户特征权重子模型、内容特征权重子模型及对象特征权重子模型；所述权重获取模块，还用于将所述用户特征、内容特征及所述对象特征输入所述用户特征权重子模型，通过所述用户特征权重子模型确定所述用户特征对应的第一权重；

在一些实施例中，所述第一预测模块3553，还用于基于所述第一权重对所述用户特征进行加权处理，得到目标用户特征，并基于所述第二权重对所述内容特征进行加权处理，得到目标内容特征；

在一些实施例中，所述第一预测模块3553，还用于基于所述第一权重对所述用户特征进行加权处理，得到目标用户特征，并基于所述第二权重对所述内容特征进行加权处理，得到目标内容特征，并基于所述第三权重对所述对象特征进行加权处理，得到目标对象特征；

在一些实施例中，所述装置还包括：

在一些实施例中，所述更新模块3555，还用于基于所述第一差异及所述第二差异，确定所述推荐模型的损失函数的值；

本发明实施例还提供一种基于人工智能的内容推荐装置，所述装置应用于推荐模型，参见图19，图19为本发明实施例提供的基于人工智能的内容推荐装置190的结构示意图，所述推荐模型包括特征提取模型及预测模型，本发明实施例提供的基于人工智能的内容推荐装置包括：

第三获取模块1901，用于获取待推荐媒体信息的用户数据、内容数据、及所述待推荐媒体信息中植入的待推广对象的对象数据；

第二特征提取模块1902，用于通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述待推荐媒体信息的用户特征、内容特征、及所述待推广对象的对象特征；

第二预测模块1903，用于基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述待推荐媒体信息的第一预测点击数据；并基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述待推广对象的第二预测点击数据；结合所述第一预测点击数据、及所述第二预测点击数据，对所述待推荐媒体信息或所述待推广对象进行推荐；

本发明实施例还提供一种电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

在一些实施例中，存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行，分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链网络。

以上所述，仅为本发明的实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的推荐模型的训练方法，其特征在于，所述推荐模型包括：特征提取模型及预测模型，所述方法包括：

其中，所述第二预测点击数据，用于结合所述第一预测点击数据对所述媒体信息样本或所述推广对象样本进行推荐；

基于所述第一差异及所述第二差异，确定所述推荐模型的损失函数的值；

2.如权利要求1所述的方法，其特征在于，所述特征提取模型包括：用户特征子模型、内容特征子模型及对象特征子模型；

所述通过所述特征提取模型，分别对所述用户数据、内容数据及所述对象数据进行特征提取，得到所述媒体信息样本的用户特征、内容特征、及所述推广对象样本的对象特征，包括：

通过所述用户特征子模型，对所述用户数据进行特征提取，得到所述媒体信息样本的用户特征；

3.如权利要求2所述的方法，其特征在于，所述用户特征子模型、内容特征子模型及对象特征子模型的模型结构相同；

所述用户特征子模型包括：特征映射层、特征拼接层、标准化处理层及特征提取层；

所述通过所述用户特征子模型，对所述用户数据进行特征提取，得到所述媒体信息样本的用户特征，包括：

当所述用户数据包括离散型数据、连续型数据及文本型数据中至少两种类型的数据时，通过所述特征映射层，分别对所述至少两种类型的数据进行映射处理，得到对应每种类型数据的向量；

4.如权利要求1所述的方法，其特征在于，所述基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据，包括：

通过所述预测模型，分别对所述用户特征及内容特征进行映射处理，得到对应所述用户特征的第一向量及对应所述内容特征的第二向量，所述第一向量与所述第二向量的向量维度相同；

5.如权利要求4所述的方法，其特征在于，所述基于所述第一向量及所述第二向量，通过所述预测模型，调用激活函数进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据，包括：

对所述第一向量及所述第二向量进行内积处理，得到内积处理结果；

6.如权利要求4所述的方法，其特征在于，所述基于所述第一向量及所述第二向量，通过所述预测模型，调用激活函数进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据，包括：

7.如权利要求1所述的方法，其特征在于，所述推荐模型还包括权重获取模型；所述方法还包括：

将所述用户特征、内容特征及所述对象特征输入所述权重获取模型，通过所述权重获取模型确定所述用户特征对应的第一权重、所述内容特征对应的第二权重、及所述对象特征对应的第三权重，以结合所述第一权重、所述第二权重及所述第三权重中至少两个进行点击数据预测。

8.如权利要求7所述的方法，其特征在于，所述权重获取模型包括用户特征权重子模型、内容特征权重子模型及对象特征权重子模型；

所述将所述用户特征、内容特征及所述对象特征输入所述权重获取模型，通过所述权重获取模型确定所述用户特征对应的第一权重、所述内容特征对应的第二权重、及所述对象特征对应的第三权重，包括：

将所述用户特征、内容特征及所述对象特征输入所述用户特征权重子模型，通过所述用户特征权重子模型确定所述用户特征对应的第一权重；

9.如权利要求1所述的方法，其特征在于，所述方法还包括：

当所述第一预测点击数据为所述媒体信息样本的点击概率、所述第二预测点击数据为所述推广对象样本的点击概率时，确定所述第一预测点击数据与所述第二预测点击数据的乘积；

10.一种基于人工智能的内容推荐方法，其特征在于，所述方法应用于推荐模型，所述推荐模型包括：特征提取模型及预测模型，所述方法包括：

其中，所述推荐模型基于权利要求1-9任一项所述的训练方法训练得到。

11.一种基于人工智能的推荐模型的训练装置，其特征在于，所述推荐模型包括：特征提取模型及预测模型，所述装置包括：

第一预测模块，用于基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述媒体信息样本的第一预测点击数据；并基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述推广对象样本的第二预测点击数据；其中，所述第二预测点击数据，用于结合所述第一预测点击数据对所述媒体信息样本或所述推广对象样本进行推荐；

更新模块，用于基于所述第一差异及所述第二差异，确定所述推荐模型的损失函数的值；

12.一种基于人工智能的内容推荐装置，其特征在于，所述装置应用于推荐模型，所述推荐模型包括：特征提取模型及预测模型，所述装置包括：

第二预测模块，用于基于所述用户特征及内容特征，通过所述预测模型进行点击数据预测，得到对应所述待推荐媒体信息的第一预测点击数据；并基于所述用户特征、内容特征及所述对象特征，通过所述预测模型进行点击数据预测，得到对应所述待推广对象的第二预测点击数据；结合所述第一预测点击数据、及所述第二预测点击数据，对所述待推荐媒体信息或所述待推广对象进行推荐；

13.一种电子设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1-10中任一项所述的方法。

14.一种存储介质，其特征在于，所述存储介质存储有可执行指令，用于引起处理器执行时，实现权利要求1-10中任一项所述的方法。