CN111160638B

CN111160638B - 一种转化预估方法及装置

Info

Publication number: CN111160638B
Application number: CN201911331015.5A
Authority: CN
Inventors: 刘博�; 郑文琛
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2022-09-02
Anticipated expiration: 2039-12-20
Also published as: CN111160638A

Abstract

本发明公开了一种转化预估方法及装置，其中方法为：获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息；将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率；将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率；至少根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。上述方法应用于金融科技(Fintech)时，能够提升预估转化率的准确性。

Description

一种转化预估方法及装置

技术领域

本发明涉及金融科技(Fintech)领域和人工智能领域，尤其涉及一种转化预估方法及装置。

背景技术

随着计算机技术的发展，越来越多的技术(大数据、分布式、区块链(Blockchain)、人工智能等)应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变。目前，金融科技领域中，越来越多的资源提供端对信息推荐效果重视起来，如何预估信息推荐效果尤为重要。

目前方法中，将用户的转化行为一概而论，但实际上用户的转化行为又分为多种。现有技术中，直接将用户发生某一类转化行为的预估转化率，作为最终的转化率。显然，这种方式得到对用户转化行为的转化率进行预估的准确率较低，这是一个亟待解决的问题。

发明内容

本申请提供一种转化预估方法及装置，解决了现有技术中转化率预估的准确率较低的问题。

第一方面，本申请提供一种转化预估方法，包括：获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息；将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率；所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的；将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率；所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的；至少根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。

可选地，所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前，还包括：获取所述点击数据、所述前端转化数据和所述后端转化数据；将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型，确定所述第一样本数据的预估前端转化率，并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值；将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型，确定所述第二样本数据的预估后端转化率，并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值；至少根据所述第一差异评估值和\或所述第二差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练；将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型。

可选地，所述第一样本数据包括所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率，所述确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值，包括：将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数，计算得出第一损失函数的第一函数值，并将所述第一函数值作为所述第一差异评估值；所述第二样本数据包括所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率，所述确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值：将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数，计算得出第二损失函数的第二函数值，并将所述第二函数值作为所述第二差异评估值；所述至少根据所述第一差异评估值和\或所述第二差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练，包括：通过减小所述第一函数值和\或所述第二函数值，调整所述参考前端转化率预估模型的参数，以更新所述参考前端转化率预估模型；通过减小所述第一函数值和\或所述第二函数值，调整所述参考后端转化率预估模型的参数，以更新所述参考后端转化率预估模型。

可选地，所述第一差异评估值为所述第一样本数据的预估前端转化率和真实前端转化率之间的差值；所述第二差异评估值为所述第二样本数据的预估后端转化率和真实后端转化率之间的差值。

可选地，所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前，还包括：获取所述点击数据、所述前端转化数据和所述后端转化数据；将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第四虚拟样本数据；将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第五虚拟样本数据；将所述第四虚拟样本数据输入至参考前端转化率预估模型，确定所述第四虚拟样本数据的预估前端转化率，并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值；将所述第五虚拟样本数据输入至参考后端转化率预估模型，确定所述第五虚拟样本数据的预估后端转化率，并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值；至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练；将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型；将训练结束时的所述参考特征扩展空间，作为所述特定特征扩展空间。

可选地，所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值，所述确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值，包括：将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数，计算得出所述第四损失函数的第四函数值，并将所述第四函数值作为所述第四差异评估值；所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值，所述确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值：将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数，计算得出所述第五损失函数的第五函数值，并将所述第五函数值作为所述第五差异评估值；所述至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练，包括：通过减小所述第四函数值和\或所述第五函数值，调整所述参考前端转化率预估模型的参数，从而更新所述参考前端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考后端转化率预估模型的参数，从而更新所述参考后端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考特征扩展空间的参数，从而更新所述参考特征扩展空间的参数。

可选地，所述第四差异评估值为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值；所述第五差异评估值为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值。

可选地，所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前，还包括：获取所述点击数据和曝光数据：将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第六虚拟样本数据；将所述第六虚拟样本数据输入参考点击率预估模型，确定所述第六虚拟样本数据的预估点击率，并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值；至少根据所述第六差异评估值，对所述参考点击率预估模型进行迭代机器训练；将训练结束时的所述参考点击率预估模型，作为特定点击率预估模型。

可选地，将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型，以预估所述用户被所述资源曝光且发生点击的点击率；所述特定点击率预估模型为根据所述资源推荐平台积累的曝光数据和所述点击数据训练得到的；所述至少根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率，包括：根据所述点击率、所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。

第二方面，本申请提供一种转化预估装置，包括：获取模块，用于获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息；处理模块，用于将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率；所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的；将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率；所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的；至少根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。

可选地，所述获取模块还用于：获取所述点击数据、所述前端转化数据和所述后端转化数据；所述处理模块还用于：将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型，确定所述第一样本数据的预估前端转化率，并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值；将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型，确定所述第二样本数据的预估后端转化率，并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值；至少根据所述第一差异评估值和\或所述第二差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练；将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型。

可选地，所述第一样本数据包括所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率，所述处理模块具体用于：将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数，计算得出第一损失函数的第一函数值，并将所述第一函数值作为所述第一差异评估值；所述第二样本数据包括所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率，所述确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值：将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数，计算得出第二损失函数的第二函数值，并将所述第二函数值作为所述第二差异评估值；通过减小所述第一函数值和\或所述第二函数值，调整所述参考前端转化率预估模型的参数，以更新所述参考前端转化率预估模型；通过减小所述第一函数值和\或所述第二函数值，调整所述参考后端转化率预估模型的参数，以更新所述参考后端转化率预估模型。

可选地，所述获取模块还用于：获取所述点击数据、所述前端转化数据和所述后端转化数据；所述处理模块还用于：将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第四虚拟样本数据；将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第五虚拟样本数据；将所述第四虚拟样本数据输入至参考前端转化率预估模型，确定所述第四虚拟样本数据的预估前端转化率，并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值；将所述第五虚拟样本数据输入至参考后端转化率预估模型，确定所述第五虚拟样本数据的预估后端转化率，并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值；至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练；将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型；将训练结束时的所述参考特征扩展空间，作为所述特定特征扩展空间。

可选地，所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值，所述处理模块具体用于：将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数，计算得出所述第四损失函数的第四函数值，并将所述第四函数值作为所述第四差异评估值；所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值，所述处理模块具体用于：将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数，计算得出所述第五损失函数的第五函数值，并将所述第五函数值作为所述第五差异评估值；通过减小所述第四函数值和\或所述第五函数值，调整所述参考前端转化率预估模型的参数，从而更新所述参考前端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考后端转化率预估模型的参数，从而更新所述参考后端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考特征扩展空间的参数，从而更新所述参考特征扩展空间的参数。

可选地，所述获取模块还用于：获取所述点击数据和曝光数据；所述处理模块具体用于：将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第六虚拟样本数据；将所述第六虚拟样本数据输入参考点击率预估模型，确定所述第六虚拟样本数据的预估点击率，并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值；至少根据所述第六差异评估值，对所述参考点击率预估模型进行迭代机器训练；将训练结束时的所述参考点击率预估模型，作为特定点击率预估模型。

上述第二方面及第二方面各个实施方式的有益效果，可以参考上述第一方面及第一方面各个实施方式的有益效果，这里不再赘述。

第三方面，本申请提供一种计算机设备，包括程序或指令，当所述程序或指令被执行时，用以执行上述第一方面及第一方面各个实施方式的方法。

第四方面，本申请提供一种存储介质，包括程序或指令，当所述程序或指令被执行时，用以执行上述第一方面及第一方面各个实施方式的方法。

本申请提供一种转化预估方法及装置中，与现有技术的转化预估方法相比，由于所述特定前端转化率预估模型是根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的，所述特定前端转化率预估模型会学习到点击数据和点击且发生前端转化的前端转化数据的知识，另外，所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的，特定前端转化率预估模型会学习到前端转化数据和发生前端转化且发生后端转化的后端转化数据的知识，从而在获取了待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息后，特定前端转化率预估模型可以结合学习到的知识预估所述用户点击所述资源且发生前端转化的前端转化率，特定后端转化率预估模型可以结合学习到的知识预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率，从而通过对用户的转化行为进行前端转化后端转化区分，能够分别预估前端转化率和后端转化率，进一步地根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率，从而能够提升转化预估的准确率。

附图说明

图1为本申请实施例提供的一种转化预估方法的步骤流程示意图；

图2为本申请实施例提供的一种转化预估方法可应用的架构示意图；

图3为本申请实施例提供的一种转化预估装置的结构示意图。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明，应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明，而不是对本申请技术方案的限定，在不冲突的情况下，本申请实施例以及实施例中的技术特征可以相互结合。

在金融机构(银行机构、保险机构或证券机构)在进行业务(如银行的贷款业务、存款业务等)运转过程中，越来越多的资源提供端对信息推荐效果重视起来，如何预估信息推荐效果尤为重要。目前方法中，将用户的转化行为一概而论，但实际上用户的转化行为又分为多种。现有技术中，直接将用户发生某一类转化行为的预估转化率，作为最终的转化率，显然，这种方式对用户转化行为的转化率并不准确，这不符合银行等金融机构的需求，无法保证金融机构各项业务的高效运转。

为此，如图1所示，本申请实施例提供一种转化预估方法。

步骤101：获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息。

步骤102：将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率。

步骤103：将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率。

步骤104：至少根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。

需要说明的是，前端转化行为是事先定义的一类用户转化行为，用第一类型的转化行为表示，如使用资源提供端的免费服务，如注册；后端转化行为是事先定义的另一类用户转化行为，用第二类型的转化行为表示，后端转化行为需要建立在前端转化行为的基础上，如使用资源提供端的付费服务，如注册后购买虚拟道具，付费服务必然建立在免费服务的基础上。举例来说，用户在某场景点击一个游戏的推荐信息，该用户便为点击用户。而后用户点击该推荐信息后下载注册该游戏，便称为用户发生了前端转化行为。最后，用户在游戏内发生购买行为，便称为用户发生了后端转化行为。显然，而用户发生购买行为时才是该推荐信息为该游戏产生了真正价值。区分前端转化行为和后端转化行为能够有效地提升转化率的准确率。

需要说明的是，步骤101～步骤104的执行主体可以为资源推荐平台，本申请中的资源提供端为推荐信息的源提供者，需要将推荐信息推送给用户，从而有一部分用户后端转化为资源提供端的后端转化用户，资源推荐平台为推荐信息推送的具体执行者。在资源推荐平台对用户进行信息推荐的过程中，用户按照行为的时间顺序可分为三类：曝光用户、点击用户、前端转化用户和后端转化用户。曝光用户为资源推荐平台推荐了资源的用户；点击用户为点击了资源推荐平台推荐的资源的用户，显然，点击用户必然为曝光用户；前端转化用户为点击了资源推荐平台推荐的资源后在资源提供端发生前端转化行为(如注册行为)的用户，显然，前端转化用户必为点击用户；后端转化用户为发生了前端转化行为后发生后端转化行为的用户。曝光数据至少包括综合特征信息和曝光标签值(如曝光标签值用y₀＝0表示)。点击数据至少包括综合特征信息和点击标签值(如点击标签值用y₀＝1，和\或y₁＝0表示)。前端转化数据至少包括综合特征信息和前端转化标签值(如前端转化标签值用y₁＝1和\或y₂＝0表表示)，后端转化数据至少包括综合特征信息和后端转化标签值(如后端转化标签值用y₂＝1表示)。需要说明的是，曝光标签值、点击标签值、转化标签值和真实概率值有映射关系，如点击标签值y₁＝0对应的真实概率即点击率为0％。综合特征信息可以包括多种类型的特征信息，如用户特性信息、资源特征信息和场景特征信息。用户特性信息指用户的基础属性，如年龄、性别等。资源特征信息指推荐资源的基础属性，如推荐资源的格式、布局。场景特征信息指将推荐资源推荐给用户的场景，如推荐的地点、触发推荐的用户操作。另外，用户是否点击、点击后是否发生前端转化、前端转化后是否发生后端转化是独立的，显然，有如下关系：

步骤102中，所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的。步骤103中，所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的。由此可知，特定前端转化率预估模型学习到了点击数据和点击且发生前端转化的前端转化数据的知识，特定后端转化率预估模型学习到了所述前端转化数据和发生前端转化且发生后端转化的后端转化数据的知识；因此，更细化地预估点击数据在前端转化和后端转化过程中的转化率，得到所述前端转化率和所述后端转化率，并进一步确定所述用户点击所述资源发生前端转化且发生后端转化的转化率，从而提升了转化率预估的准确率。

步骤101～步骤104中特定前端转化率预估模型和特定后端转化率预估模型的训练方式有多种，只要所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的均可，特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的均可，在此不做限定。

下面以两类实施方式来说明所述特定前端转化率预估模型和所述特定后端转化率预估模型的具体训练过程：

第一类，不进行相似性特征扩展的模型训练方法，具体为：

第(1-1)步：获取所述点击数据、所述前端转化数据和所述后端转化数据。

第(1-2)步：将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型，确定所述第一样本数据的预估前端转化率，并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值。

第(1-3)步：将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型，确定所述第二样本数据的预估后端转化率，并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值。

第(1-4)步：至少根据所述第一差异评估值和\或所述第二差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练。

第(1-5)步：将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型。

需要说明的是，第(1-2)步～第(1-3)步并不是先后约束的关系，第(1-2)步～第(1-3)步可以并行执行。第(1-2)步～第(1-3)步的过程中，选择性地将第一样本数据和第二样本数据输入到各参考训练模型中，从而得到评估各预估率和真实率的差异评估值，从而能有效表征训练过程中的预估准确性，并进行迭代机器训练，并最终得到特定的模型，从而提供一种同时训练得到所述特定点击率预估模型、所述特定转化率预估模型的方法。

具体地，第(1-1)步～第(1-5)步的过程中：

第(1-4)步中的第一差异评估值可以为所述第一样本数据的预估前端转化率和所述第一样本数据的真实前端转化率之间的差值，这种方式可以最直观地表示所述第一样本数据的预估前端转化率和所述第一样本数据的真实前端转化率的差距。也可以为损失函数值，具体损失函数值的求解方式可以为：

将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数，计算得出第一损失函数的第一函数值，并将所述第一函数值作为所述第一差异评估值。举例来说，输入的数据含有特征信息x和标签值y₀和\或y₁和\或y₂，标签值和真实概率值有映射关系，如前端转化标签值y₁＝0对应前端转化的真实概率为0％。前端转化率预估模型的训练函数为f₁(x|W₁)；前端转化率预估模型的损失函数为L(y₁,p₀p₁)，根据输入的点击标签值所对应的真实点击率和\或前端转化标签值所对应的真实前端转化率和f₁(x|W₁)输出的预估前端转化率，可以得到L(y₁,p₀p₁)的值，即第一函数值为L(y₁,p₀p₁)的值。

第(1-5)步中的第二差异评估值可以为所述第二样本数据的预估后端转化率和所述第二样本数据的真实后端转化率之间的差值，这种方式可以最直观地表示所述第二样本数据的预估后端转化率和所述第二样本数据的真实后端转化率的差距。也可以为损失函数值，具体损失函数值的求解方式可以为：

将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数，计算得出第二损失函数的第二函数值，并将所述第二函数值作为所述第二差异评估值。后端转化率预估模型的训练函数为f₂(x|W₂)；后端转化率预估模型的损失函数为L(y₂,p₀p₁p₂)，根据输入的前端转化标签值所对应的真实前端转化率和\或后端转化标签值所对应的真实后端转化率和f₂(x|W₂)输出的预估后端转化率，可以得到L(y₂,p₀p₁p₂)的值，即第二函数值为L(y₂,p₀p₁p₂)的值。

第(1-6)步具体可以为：

通过减小所述第一函数值和\或所述第二函数值，调整所述参考前端转化率预估模型的参数，以更新所述参考前端转化率预估模型；通过减小所述第一函数值和\或所述第二函数值，调整所述参考后端转化率预估模型的参数，以更新所述参考后端转化率预估模型。

举例来说，通过L(y₁,p₀p₁)和L(y₂,p₀p₁p₂)来调整W₁；通过L(y₁,p₀p₁)和L(y₂,p₀p₁p₂)来调整W₂，即联合损失函数为：L＝L(y₁,p₀p₁)+L(y₂,p₀p₁p₂)，也可以为L＝L(y₁,p₀p₁)+L(y₂,p₀p₁p₂)+R；R表示为了避免过拟合的正则项。

需要说明的是，结合图2来说，在第一类模型训练方法中，还可以加入点击预估模型，具体来说：获取曝光数据和所述点击数据；将所述曝光数据和\或所述点击数据作为第三样本数据输入至参考点击率预估模型，确定所述第三样本数据的预估点击率，并确定所述第三样本数据的预估点击率和真实点击率之间的第三差异评估值；至少根据所述第三差异评估值，对所述参考点击率预估模型进行迭代机器训练；将训练结束时的所述参考点击率预估模型，作为所述特定点击率预估模型。

举例来说，点击率预估模型的训练函数为f₀(x|W₀)，根据输入的曝光标签值所对应的真实曝光率和\或点击标签值所对应的真实点击率和f₀(x|W₀)输出的预估点击率，可以得到L(y₀,p₀)的值，即第三函数值为L(y₀,p₀)的值。那么可以在上述联合损失函数中加入点击率预估模型的损失函数L(y₀,p₀)。即L＝L(y₀,p₀)+L(y₁,p₀p₁)+L(y₂,p₀p₁p₂)。

第二类，进行相似性特征扩展的模型训练方法，具体为：

第(2-1)步：获取所述点击数据、所述前端转化数据和所述后端转化数据。

第(2-2)步：将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第四虚拟样本数据。

第(2-3)步：将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第五虚拟样本数据。

第(2-4)步：将所述第四虚拟样本数据输入至参考前端转化率预估模型，确定所述第四虚拟样本数据的预估前端转化率，并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值。

第(2-5)步：将所述第五虚拟样本数据输入至参考后端转化率预估模型，确定所述第五虚拟样本数据的预估后端转化率，并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值。

第(2-6)步：至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练。

第(2-7)步：将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型；将训练结束时的所述参考特征扩展空间，作为所述特定特征扩展空间。

需要说明的是，第(2-2)步～第(2-3)步并不是先后约束的关系，第(2-2)步～第(2-3)步可以并行执行；第(2-4)步～第(2-5)步并不是先后约束的关系，第(2-4)步～第(2-5)步可以并行执行。第(2-2)步～第(2-5)步的过程中，选择性地将第一样本数据和第二样本数据输入参考特征扩展空间，在参考特征扩展空间根据不同的数据类型将第一样本数据、第二样本数据进行转换，得到第一虚拟样本数据、第二虚拟样本数据，从而得到评估各预估率和真实率的差异评估值，从而能有效表征训练过程中的预估准确性，并进行迭代机器训练，并最终得到特定的模型，从而提供一种同时训练得到所述特定点击率预估模型、所述特定转化率预估模型的方法。

具体地，第(2-1)步～第(2-7)步的过程中：

第(2-4)步中的第四差异评估值可以为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值，这种方式可以最直观地表示所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率的差距。也可以为损失函数值，具体损失函数值的求解方式可以为：

将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数，计算得出第四损失函数的第四函数值，并将所述第四函数值作为所述第四差异评估值。

举例来说，输入的数据含有特征信息x和标签值y₀和\或y₁和\或y₂，标签值和真实概率值有映射关系，如前端转化标签值y₁＝0对应前端转化的真实概率为0％。参考特征扩展空间的对输入数据的训练函数为f_e(x|W_e)，输入的数据为x，参考特征扩展空间的参数为W_e，x可以为第一样本数据、第二样本数据任一种数据，输出e为第一虚拟样本数据、第二虚拟样本数据。结合参考特定特征扩展空间，可以学习参考前端转化率预估模型的训练函数f₁(x|W₁,W_e)和参考后端转化率预估模型的训练函数f₂(x|W₂,W_e)。前端转化率预估模型的损失函数为L(y₁,p₀p₁)，根据输入的点击标签值所对应的真实点击率和\或前端转化标签值所对应的真实前端转化率和f₁(x|W₁,W_e)输出的预估前端转化率，可以得到L(y₁,p₀p₁)的值，即第四函数值为L(y₁,p₀p₁)的值。

第(2-5)步中的第五差异评估值可以为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值，这种方式可以最直观地表示所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率的差距。也可以为损失函数值，具体损失函数值的求解方式可以为：

将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数，计算得出第五损失函数的第五函数值，并将所述第五函数值作为所述第五差异评估值。

举例来说，后端转化率预估模型的训练函数为f₂(x|W₂,W_e)；后端转化率预估模型的损失函数为L(y₂,p₀p₁p₂)，根据输入的前端转化标签值所对应的真实前端转化率和\或后端转化标签值所对应的真实后端转化率和f₂(x|W₂,W_e)输出的预估后端转化率，可以得到L(y₂,p₀p₁p₂)的值，即第五函数值为L(y₂,p₀p₁p₂)的值。

第(2-6)步具体可以为：

通过减小所述第四函数值和\或所述第五函数值，调整所述参考前端转化率预估模型的参数，从而更新所述参考前端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考后端转化率预估模型的参数，从而更新所述参考后端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考特征扩展空间的参数，从而更新所述参考特征扩展空间的参数。

举例来说，通过L(y₁,p₀p₁)和L(y₂,p₀p₁p₂)来调整W₁；通过L(y₁,p₀p₁)和L(y₂,p₀p₁p₂)来调整W₂，通过L(y₁,p₀p₁)和L(y₂,p₀p₁p₂)来调整W_e，即联合损失函数为：

L＝L(y₁,p₀p₁)+L(y₂,p₀p₁p₂)，变形也可以为L＝L(y₁,p₀p₁)+L(y₂,p₀p₁p₂)+R；R表示为了避免过拟合的正则项。

需要说明的是，结合图2来说，在第二类模型训练方法中，还可以加入点击预估模型，具体来说：获取所述点击数据和曝光数据；将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第六虚拟样本数据；将所述第六虚拟样本数据输入参考点击率预估模型，确定所述第六虚拟样本数据的预估点击率，并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值；至少根据所述第六差异评估值，对所述参考点击率预估模型进行迭代机器训练；

将训练结束时的所述参考点击率预估模型，作为特定点击率预估模型。

举例来说，点击率预估模型的训练函数为f₀(x|W₀,W_e)，根据输入的曝光标签值所对应的真实曝光率和\或点击标签值所对应的真实点击率和f₀(x|W₀,W_e)输出的预估点击率，可以得到L(y₀,p₀)的值，即第六函数值为L(y₀,p₀)的值。那么可以在上述联合损失函数中加入点击率预估模型的损失函数L(y₀,p₀)。即L＝L(y₀,p₀)+L(y₁,p₀p₁)+L(y₂,p₀p₁p₂)，也可以加上R。

步骤101～步骤104之外的一种可选实施方式为：

将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型，以预估所述用户被所述资源曝光且发生点击的点击率；所述特定点击率预估模型为根据所述资源推荐平台积累的曝光数据和所述点击数据训练得到的；根据所述点击率、所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。

举例来说，前端转化率为0.8和所述后端转化率为0.6，可以用前端转化率和所述后端转化率的乘积0.48来作为所述用户点击所述资源发生前端转化且发生后端转化的转化率。

如图3所示，本申请提供一种转化预估装置，包括：获取模块301，用于获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息；处理模块302，用于将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率；所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的；将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率；所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的；至少根据所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。

可选地，所述获取模块301还用于：获取所述点击数据、所述前端转化数据和所述后端转化数据；所述处理模块302还用于：将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型，确定所述第一样本数据的预估前端转化率，并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值；将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型，确定所述第二样本数据的预估后端转化率，并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值；至少根据所述第一差异评估值和\或所述第二差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练；将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型。

可选地，所述第一样本数据包括所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率，所述处理模块302具体用于：将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数，计算得出第一损失函数的第一函数值，并将所述第一函数值作为所述第一差异评估值；所述第二样本数据包括所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率，所述确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值：将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数，计算得出第二损失函数的第二函数值，并将所述第二函数值作为所述第二差异评估值；通过减小所述第一函数值和\或所述第二函数值，调整所述参考前端转化率预估模型的参数，以更新所述参考前端转化率预估模型；通过减小所述第一函数值和\或所述第二函数值，调整所述参考后端转化率预估模型的参数，以更新所述参考后端转化率预估模型。

可选地，所述获取模块301还用于：获取所述点击数据、所述前端转化数据和所述后端转化数据；所述处理模块302还用于：将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第四虚拟样本数据；将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第五虚拟样本数据；将所述第四虚拟样本数据输入至参考前端转化率预估模型，确定所述第四虚拟样本数据的预估前端转化率，并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值；将所述第五虚拟样本数据输入至参考后端转化率预估模型，确定所述第五虚拟样本数据的预估后端转化率，并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值；至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练；将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型；将训练结束时的所述参考特征扩展空间，作为所述特定特征扩展空间。

可选地，所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值，所述处理模块302具体用于：将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数，计算得出所述第四损失函数的第四函数值，并将所述第四函数值作为所述第四差异评估值；所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值，所述处理模块302具体用于：将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数，计算得出所述第五损失函数的第五函数值，并将所述第五函数值作为所述第五差异评估值；通过减小所述第四函数值和\或所述第五函数值，调整所述参考前端转化率预估模型的参数，从而更新所述参考前端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考后端转化率预估模型的参数，从而更新所述参考后端转化率预估模型的参数；和\或通过减小所述第四函数值和\或所述第五函数值，调整所述参考特征扩展空间的参数，从而更新所述参考特征扩展空间的参数。

可选地，所述获取模块301还用于：获取所述点击数据和曝光数据；所述处理模块302具体用于：将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第六虚拟样本数据；将所述第六虚拟样本数据输入参考点击率预估模型，确定所述第六虚拟样本数据的预估点击率，并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值；至少根据所述第六差异评估值，对所述参考点击率预估模型进行迭代机器训练；将训练结束时的所述参考点击率预估模型，作为特定点击率预估模型。

本申请实施例提供一种计算机设备，包括程序或指令，当所述程序或指令被执行时，用以执行本申请实施例提供的一种转化预估方法及任一可选方法。

本申请实施例提供一种存储介质，包括程序或指令，当所述程序或指令被执行时，用以执行本申请实施例提供的一种转化预估方法及任一可选方法。

最后应说明的是：本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种转化预估方法，其特征在于，包括：

获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息，所述资源特征信息包括推荐资源的格式、布局；

获取资源推荐平台积累的曝光数据、点击数据、点击且发生前端转化的前端转化数据以及发生前端转化且发生后端转化的后端转化数据；

将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型，以预估所述用户被所述资源曝光且发生点击的点击率；

将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率；将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率；

根据所述点击率、所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率；

其中，所述特定点击率预估模型为根据所述曝光数据和所述点击数据经特征扩展空间进行相似性扩展后训练得到的；

所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据经所述特征扩展空间进行相似性扩展后训练得到的；

所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据经所述特征扩展空间进行相似性扩展后训练得到的；

所述特征扩展空间为根据所述曝光数据、所述点击数据、所述前端转化数据和所述后端转化数据训练得到的。

2.如权利要求1所述的方法，其特征在于，所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前，还包括：

将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第四虚拟样本数据；

将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第五虚拟样本数据；

将所述第四虚拟样本数据输入至参考前端转化率预估模型，确定所述第四虚拟样本数据的预估前端转化率，并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值；

将所述第五虚拟样本数据输入至参考后端转化率预估模型，确定所述第五虚拟样本数据的预估后端转化率，并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值；至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练；

将训练结束时的所述参考前端转化率预估模型，作为所述特定前端转化率预估模型；

将训练结束时的所述参考后端转化率预估模型，作为所述特定后端转化率预估模型；

将训练结束时的所述参考特征扩展空间，作为所述特征扩展空间。

3.如权利要求2所述的方法，其特征在于，所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值，所述确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值，包括：

将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数，计算得出所述第四损失函数的第四函数值，并将所述第四函数值作为所述第四差异评估值；

所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值，所述确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值，包括：

将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数，计算得出所述第五损失函数的第五函数值，并将所述第五函数值作为所述第五差异评估值；

所述至少根据所述第四差异评估值和\或所述第五差异评估值，对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练，包括：

4.如权利要求2所述的方法，其特征在于，所述第四差异评估值为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值；所述第五差异评估值为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值。

5.如权利要求2所述的方法，其特征在于，所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前，还包括：

将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展，获得经所述参考特征扩展空间转化得到的第六虚拟样本数据；

将所述第六虚拟样本数据输入参考点击率预估模型，确定所述第六虚拟样本数据的预估点击率，并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值；

至少根据所述第六差异评估值，对所述参考点击率预估模型进行迭代机器训练；

6.一种转化预估装置，其特征在于，包括：

获取模块，用于获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息，以及获取资源推荐平台积累的曝光数据、点击数据、点击且发生前端转化的前端转化数据以及发生前端转化且发生后端转化的后端转化数据，所述资源特征信息包括推荐资源的格式、布局；

处理模块，用于将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型，以预估所述用户被所述资源曝光且发生点击的点击率；将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型，以预估所述用户点击所述资源且发生前端转化的前端转化率；将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型，以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率；至少根据所述点击率、所述前端转化率和所述后端转化率，确定所述用户点击所述资源发生前端转化且发生后端转化的转化率；

其中，所述特定点击率预估模型为根据所述曝光数据和所述点击数据经特征扩展空间进行相似性扩展后训练得到的；所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据经所述特征扩展空间进行相似性扩展后训练得到的；所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据经所述特征扩展空间进行相似性扩展后训练得到的；所述特征扩展空间为根据所述曝光数据、所述点击数据、所述前端转化数据和所述后端转化数据训练得到的。

7.一种计算机设备，其特征在于，包括程序或指令，当所述程序或指令被执行时，如权利要求1至5中任意一项所述的方法被执行。

8.一种存储介质，其特征在于，包括程序或指令，当所述程序或指令被执行时，如权利要求1至5中任意一项所述的方法被执行。