CN111160638B - 一种转化预估方法及装置 - Google Patents

一种转化预估方法及装置 Download PDF

Info

Publication number
CN111160638B
CN111160638B CN201911331015.5A CN201911331015A CN111160638B CN 111160638 B CN111160638 B CN 111160638B CN 201911331015 A CN201911331015 A CN 201911331015A CN 111160638 B CN111160638 B CN 111160638B
Authority
CN
China
Prior art keywords
end conversion
conversion rate
data
sample data
estimation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911331015.5A
Other languages
English (en)
Other versions
CN111160638A (zh
Inventor
刘博�
郑文琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201911331015.5A priority Critical patent/CN111160638B/zh
Publication of CN111160638A publication Critical patent/CN111160638A/zh
Application granted granted Critical
Publication of CN111160638B publication Critical patent/CN111160638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种转化预估方法及装置,其中方法为:获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息;将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率;将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率;至少根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。上述方法应用于金融科技(Fintech)时,能够提升预估转化率的准确性。

Description

一种转化预估方法及装置
技术领域
本发明涉及金融科技(Fintech)领域和人工智能领域,尤其涉及一种转化预估方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链(Blockchain)、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变。目前,金融科技领域中,越来越多的资源提供端对信息推荐效果重视起来,如何预估信息推荐效果尤为重要。
目前方法中,将用户的转化行为一概而论,但实际上用户的转化行为又分为多种。现有技术中,直接将用户发生某一类转化行为的预估转化率,作为最终的转化率。显然,这种方式得到对用户转化行为的转化率进行预估的准确率较低,这是一个亟待解决的问题。
发明内容
本申请提供一种转化预估方法及装置,解决了现有技术中转化率预估的准确率较低的问题。
第一方面,本申请提供一种转化预估方法,包括:获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息;将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率;所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的;将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率;所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的;至少根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。
可选地,所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前,还包括:获取所述点击数据、所述前端转化数据和所述后端转化数据;将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型,确定所述第一样本数据的预估前端转化率,并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值;将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型,确定所述第二样本数据的预估后端转化率,并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值;至少根据所述第一差异评估值和\或所述第二差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练;将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型。
可选地,所述第一样本数据包括所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率,所述确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值,包括:将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数,计算得出第一损失函数的第一函数值,并将所述第一函数值作为所述第一差异评估值;所述第二样本数据包括所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率,所述确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值:将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数,计算得出第二损失函数的第二函数值,并将所述第二函数值作为所述第二差异评估值;所述至少根据所述第一差异评估值和\或所述第二差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练,包括:通过减小所述第一函数值和\或所述第二函数值,调整所述参考前端转化率预估模型的参数,以更新所述参考前端转化率预估模型;通过减小所述第一函数值和\或所述第二函数值,调整所述参考后端转化率预估模型的参数,以更新所述参考后端转化率预估模型。
可选地,所述第一差异评估值为所述第一样本数据的预估前端转化率和真实前端转化率之间的差值;所述第二差异评估值为所述第二样本数据的预估后端转化率和真实后端转化率之间的差值。
可选地,所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前,还包括:获取所述点击数据、所述前端转化数据和所述后端转化数据;将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第四虚拟样本数据;将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第五虚拟样本数据;将所述第四虚拟样本数据输入至参考前端转化率预估模型,确定所述第四虚拟样本数据的预估前端转化率,并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值;将所述第五虚拟样本数据输入至参考后端转化率预估模型,确定所述第五虚拟样本数据的预估后端转化率,并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值;至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练;将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型;将训练结束时的所述参考特征扩展空间,作为所述特定特征扩展空间。
可选地,所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值,所述确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值,包括:将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数,计算得出所述第四损失函数的第四函数值,并将所述第四函数值作为所述第四差异评估值;所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值,所述确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值:将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数,计算得出所述第五损失函数的第五函数值,并将所述第五函数值作为所述第五差异评估值;所述至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练,包括:通过减小所述第四函数值和\或所述第五函数值,调整所述参考前端转化率预估模型的参数,从而更新所述参考前端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考后端转化率预估模型的参数,从而更新所述参考后端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考特征扩展空间的参数,从而更新所述参考特征扩展空间的参数。
可选地,所述第四差异评估值为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值;所述第五差异评估值为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值。
可选地,所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前,还包括:获取所述点击数据和曝光数据:将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第六虚拟样本数据;将所述第六虚拟样本数据输入参考点击率预估模型,确定所述第六虚拟样本数据的预估点击率,并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值;至少根据所述第六差异评估值,对所述参考点击率预估模型进行迭代机器训练;将训练结束时的所述参考点击率预估模型,作为特定点击率预估模型。
可选地,将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型,以预估所述用户被所述资源曝光且发生点击的点击率;所述特定点击率预估模型为根据所述资源推荐平台积累的曝光数据和所述点击数据训练得到的;所述至少根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率,包括:根据所述点击率、所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。
第二方面,本申请提供一种转化预估装置,包括:获取模块,用于获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息;处理模块,用于将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率;所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的;将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率;所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的;至少根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。
可选地,所述获取模块还用于:获取所述点击数据、所述前端转化数据和所述后端转化数据;所述处理模块还用于:将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型,确定所述第一样本数据的预估前端转化率,并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值;将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型,确定所述第二样本数据的预估后端转化率,并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值;至少根据所述第一差异评估值和\或所述第二差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练;将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型。
可选地,所述第一样本数据包括所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率,所述处理模块具体用于:将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数,计算得出第一损失函数的第一函数值,并将所述第一函数值作为所述第一差异评估值;所述第二样本数据包括所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率,所述确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值:将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数,计算得出第二损失函数的第二函数值,并将所述第二函数值作为所述第二差异评估值;通过减小所述第一函数值和\或所述第二函数值,调整所述参考前端转化率预估模型的参数,以更新所述参考前端转化率预估模型;通过减小所述第一函数值和\或所述第二函数值,调整所述参考后端转化率预估模型的参数,以更新所述参考后端转化率预估模型。
可选地,所述第一差异评估值为所述第一样本数据的预估前端转化率和真实前端转化率之间的差值;所述第二差异评估值为所述第二样本数据的预估后端转化率和真实后端转化率之间的差值。
可选地,所述获取模块还用于:获取所述点击数据、所述前端转化数据和所述后端转化数据;所述处理模块还用于:将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第四虚拟样本数据;将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第五虚拟样本数据;将所述第四虚拟样本数据输入至参考前端转化率预估模型,确定所述第四虚拟样本数据的预估前端转化率,并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值;将所述第五虚拟样本数据输入至参考后端转化率预估模型,确定所述第五虚拟样本数据的预估后端转化率,并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值;至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练;将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型;将训练结束时的所述参考特征扩展空间,作为所述特定特征扩展空间。
可选地,所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值,所述处理模块具体用于:将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数,计算得出所述第四损失函数的第四函数值,并将所述第四函数值作为所述第四差异评估值;所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值,所述处理模块具体用于:将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数,计算得出所述第五损失函数的第五函数值,并将所述第五函数值作为所述第五差异评估值;通过减小所述第四函数值和\或所述第五函数值,调整所述参考前端转化率预估模型的参数,从而更新所述参考前端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考后端转化率预估模型的参数,从而更新所述参考后端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考特征扩展空间的参数,从而更新所述参考特征扩展空间的参数。
可选地,所述第四差异评估值为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值;所述第五差异评估值为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值。
可选地,所述获取模块还用于:获取所述点击数据和曝光数据;所述处理模块具体用于:将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第六虚拟样本数据;将所述第六虚拟样本数据输入参考点击率预估模型,确定所述第六虚拟样本数据的预估点击率,并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值;至少根据所述第六差异评估值,对所述参考点击率预估模型进行迭代机器训练;将训练结束时的所述参考点击率预估模型,作为特定点击率预估模型。
上述第二方面及第二方面各个实施方式的有益效果,可以参考上述第一方面及第一方面各个实施方式的有益效果,这里不再赘述。
第三方面,本申请提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施方式的方法。
第四方面,本申请提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施方式的方法。
本申请提供一种转化预估方法及装置中,与现有技术的转化预估方法相比,由于所述特定前端转化率预估模型是根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的,所述特定前端转化率预估模型会学习到点击数据和点击且发生前端转化的前端转化数据的知识,另外,所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的,特定前端转化率预估模型会学习到前端转化数据和发生前端转化且发生后端转化的后端转化数据的知识,从而在获取了待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息后,特定前端转化率预估模型可以结合学习到的知识预估所述用户点击所述资源且发生前端转化的前端转化率,特定后端转化率预估模型可以结合学习到的知识预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率,从而通过对用户的转化行为进行前端转化后端转化区分,能够分别预估前端转化率和后端转化率,进一步地根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率,从而能够提升转化预估的准确率。
附图说明
图1为本申请实施例提供的一种转化预估方法的步骤流程示意图;
图2为本申请实施例提供的一种转化预估方法可应用的架构示意图;
图3为本申请实施例提供的一种转化预估装置的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互结合。
在金融机构(银行机构、保险机构或证券机构)在进行业务(如银行的贷款业务、存款业务等)运转过程中,越来越多的资源提供端对信息推荐效果重视起来,如何预估信息推荐效果尤为重要。目前方法中,将用户的转化行为一概而论,但实际上用户的转化行为又分为多种。现有技术中,直接将用户发生某一类转化行为的预估转化率,作为最终的转化率,显然,这种方式对用户转化行为的转化率并不准确,这不符合银行等金融机构的需求,无法保证金融机构各项业务的高效运转。
为此,如图1所示,本申请实施例提供一种转化预估方法。
步骤101:获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息。
步骤102:将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率。
步骤103:将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率。
步骤104:至少根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。
需要说明的是,前端转化行为是事先定义的一类用户转化行为,用第一类型的转化行为表示,如使用资源提供端的免费服务,如注册;后端转化行为是事先定义的另一类用户转化行为,用第二类型的转化行为表示,后端转化行为需要建立在前端转化行为的基础上,如使用资源提供端的付费服务,如注册后购买虚拟道具,付费服务必然建立在免费服务的基础上。举例来说,用户在某场景点击一个游戏的推荐信息,该用户便为点击用户。而后用户点击该推荐信息后下载注册该游戏,便称为用户发生了前端转化行为。最后,用户在游戏内发生购买行为,便称为用户发生了后端转化行为。显然,而用户发生购买行为时才是该推荐信息为该游戏产生了真正价值。区分前端转化行为和后端转化行为能够有效地提升转化率的准确率。
需要说明的是,步骤101~步骤104的执行主体可以为资源推荐平台,本申请中的资源提供端为推荐信息的源提供者,需要将推荐信息推送给用户,从而有一部分用户后端转化为资源提供端的后端转化用户,资源推荐平台为推荐信息推送的具体执行者。在资源推荐平台对用户进行信息推荐的过程中,用户按照行为的时间顺序可分为三类:曝光用户、点击用户、前端转化用户和后端转化用户。曝光用户为资源推荐平台推荐了资源的用户;点击用户为点击了资源推荐平台推荐的资源的用户,显然,点击用户必然为曝光用户;前端转化用户为点击了资源推荐平台推荐的资源后在资源提供端发生前端转化行为(如注册行为)的用户,显然,前端转化用户必为点击用户;后端转化用户为发生了前端转化行为后发生后端转化行为的用户。曝光数据至少包括综合特征信息和曝光标签值(如曝光标签值用y0=0表示)。点击数据至少包括综合特征信息和点击标签值(如点击标签值用y0=1,和\或y1=0表示)。前端转化数据至少包括综合特征信息和前端转化标签值(如前端转化标签值用y1=1和\或y2=0表表示),后端转化数据至少包括综合特征信息和后端转化标签值(如后端转化标签值用y2=1表示)。需要说明的是,曝光标签值、点击标签值、转化标签值和真实概率值有映射关系,如点击标签值y1=0对应的真实概率即点击率为0%。综合特征信息可以包括多种类型的特征信息,如用户特性信息、资源特征信息和场景特征信息。用户特性信息指用户的基础属性,如年龄、性别等。资源特征信息指推荐资源的基础属性,如推荐资源的格式、布局。场景特征信息指将推荐资源推荐给用户的场景,如推荐的地点、触发推荐的用户操作。另外,用户是否点击、点击后是否发生前端转化、前端转化后是否发生后端转化是独立的,显然,有如下关系:
P(y2=1,y1=1,y0=1|x)=P(y0=1|x)P(y1=1|y0=1,x)P(y2=1|y1=1,x)。其中P(y0=1|x),P(y1=1|y0=1,x),P(y2=1|y1=1,x)分别表示用户曝光后点击的概率(用CTR表示),点击后前端转化的概率(用CVRF表示),前端转化发生后端转化的概率即(用CVRE表示)。
步骤102中,所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的。步骤103中,所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的。由此可知,特定前端转化率预估模型学习到了点击数据和点击且发生前端转化的前端转化数据的知识,特定后端转化率预估模型学习到了所述前端转化数据和发生前端转化且发生后端转化的后端转化数据的知识;因此,更细化地预估点击数据在前端转化和后端转化过程中的转化率,得到所述前端转化率和所述后端转化率,并进一步确定所述用户点击所述资源发生前端转化且发生后端转化的转化率,从而提升了转化率预估的准确率。
步骤101~步骤104中特定前端转化率预估模型和特定后端转化率预估模型的训练方式有多种,只要所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的均可,特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的均可,在此不做限定。
下面以两类实施方式来说明所述特定前端转化率预估模型和所述特定后端转化率预估模型的具体训练过程:
第一类,不进行相似性特征扩展的模型训练方法,具体为:
第(1-1)步:获取所述点击数据、所述前端转化数据和所述后端转化数据。
第(1-2)步:将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型,确定所述第一样本数据的预估前端转化率,并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值。
第(1-3)步:将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型,确定所述第二样本数据的预估后端转化率,并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值。
第(1-4)步:至少根据所述第一差异评估值和\或所述第二差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练。
第(1-5)步:将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型。
需要说明的是,第(1-2)步~第(1-3)步并不是先后约束的关系,第(1-2)步~第(1-3)步可以并行执行。第(1-2)步~第(1-3)步的过程中,选择性地将第一样本数据和第二样本数据输入到各参考训练模型中,从而得到评估各预估率和真实率的差异评估值,从而能有效表征训练过程中的预估准确性,并进行迭代机器训练,并最终得到特定的模型,从而提供一种同时训练得到所述特定点击率预估模型、所述特定转化率预估模型的方法。
具体地,第(1-1)步~第(1-5)步的过程中:
第(1-4)步中的第一差异评估值可以为所述第一样本数据的预估前端转化率和所述第一样本数据的真实前端转化率之间的差值,这种方式可以最直观地表示所述第一样本数据的预估前端转化率和所述第一样本数据的真实前端转化率的差距。也可以为损失函数值,具体损失函数值的求解方式可以为:
将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数,计算得出第一损失函数的第一函数值,并将所述第一函数值作为所述第一差异评估值。举例来说,输入的数据含有特征信息x和标签值y0和\或y1和\或y2,标签值和真实概率值有映射关系,如前端转化标签值y1=0对应前端转化的真实概率为0%。前端转化率预估模型的训练函数为f1(x|W1);前端转化率预估模型的损失函数为L(y1,p0p1),根据输入的点击标签值所对应的真实点击率和\或前端转化标签值所对应的真实前端转化率和f1(x|W1)输出的预估前端转化率,可以得到L(y1,p0p1)的值,即第一函数值为L(y1,p0p1)的值。
第(1-5)步中的第二差异评估值可以为所述第二样本数据的预估后端转化率和所述第二样本数据的真实后端转化率之间的差值,这种方式可以最直观地表示所述第二样本数据的预估后端转化率和所述第二样本数据的真实后端转化率的差距。也可以为损失函数值,具体损失函数值的求解方式可以为:
将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数,计算得出第二损失函数的第二函数值,并将所述第二函数值作为所述第二差异评估值。后端转化率预估模型的训练函数为f2(x|W2);后端转化率预估模型的损失函数为L(y2,p0p1p2),根据输入的前端转化标签值所对应的真实前端转化率和\或后端转化标签值所对应的真实后端转化率和f2(x|W2)输出的预估后端转化率,可以得到L(y2,p0p1p2)的值,即第二函数值为L(y2,p0p1p2)的值。
第(1-6)步具体可以为:
通过减小所述第一函数值和\或所述第二函数值,调整所述参考前端转化率预估模型的参数,以更新所述参考前端转化率预估模型;通过减小所述第一函数值和\或所述第二函数值,调整所述参考后端转化率预估模型的参数,以更新所述参考后端转化率预估模型。
举例来说,通过L(y1,p0p1)和L(y2,p0p1p2)来调整W1;通过L(y1,p0p1)和L(y2,p0p1p2)来调整W2,即联合损失函数为:L=L(y1,p0p1)+L(y2,p0p1p2),也可以为L=L(y1,p0p1)+L(y2,p0p1p2)+R;R表示为了避免过拟合的正则项。
需要说明的是,结合图2来说,在第一类模型训练方法中,还可以加入点击预估模型,具体来说:获取曝光数据和所述点击数据;将所述曝光数据和\或所述点击数据作为第三样本数据输入至参考点击率预估模型,确定所述第三样本数据的预估点击率,并确定所述第三样本数据的预估点击率和真实点击率之间的第三差异评估值;至少根据所述第三差异评估值,对所述参考点击率预估模型进行迭代机器训练;将训练结束时的所述参考点击率预估模型,作为所述特定点击率预估模型。
举例来说,点击率预估模型的训练函数为f0(x|W0),根据输入的曝光标签值所对应的真实曝光率和\或点击标签值所对应的真实点击率和f0(x|W0)输出的预估点击率,可以得到L(y0,p0)的值,即第三函数值为L(y0,p0)的值。那么可以在上述联合损失函数中加入点击率预估模型的损失函数L(y0,p0)。即L=L(y0,p0)+L(y1,p0p1)+L(y2,p0p1p2)。
第二类,进行相似性特征扩展的模型训练方法,具体为:
第(2-1)步:获取所述点击数据、所述前端转化数据和所述后端转化数据。
第(2-2)步:将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第四虚拟样本数据。
第(2-3)步:将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第五虚拟样本数据。
第(2-4)步:将所述第四虚拟样本数据输入至参考前端转化率预估模型,确定所述第四虚拟样本数据的预估前端转化率,并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值。
第(2-5)步:将所述第五虚拟样本数据输入至参考后端转化率预估模型,确定所述第五虚拟样本数据的预估后端转化率,并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值。
第(2-6)步:至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练。
第(2-7)步:将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型;将训练结束时的所述参考特征扩展空间,作为所述特定特征扩展空间。
需要说明的是,第(2-2)步~第(2-3)步并不是先后约束的关系,第(2-2)步~第(2-3)步可以并行执行;第(2-4)步~第(2-5)步并不是先后约束的关系,第(2-4)步~第(2-5)步可以并行执行。第(2-2)步~第(2-5)步的过程中,选择性地将第一样本数据和第二样本数据输入参考特征扩展空间,在参考特征扩展空间根据不同的数据类型将第一样本数据、第二样本数据进行转换,得到第一虚拟样本数据、第二虚拟样本数据,从而得到评估各预估率和真实率的差异评估值,从而能有效表征训练过程中的预估准确性,并进行迭代机器训练,并最终得到特定的模型,从而提供一种同时训练得到所述特定点击率预估模型、所述特定转化率预估模型的方法。
具体地,第(2-1)步~第(2-7)步的过程中:
第(2-4)步中的第四差异评估值可以为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值,这种方式可以最直观地表示所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率的差距。也可以为损失函数值,具体损失函数值的求解方式可以为:
将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数,计算得出第四损失函数的第四函数值,并将所述第四函数值作为所述第四差异评估值。
举例来说,输入的数据含有特征信息x和标签值y0和\或y1和\或y2,标签值和真实概率值有映射关系,如前端转化标签值y1=0对应前端转化的真实概率为0%。参考特征扩展空间的对输入数据的训练函数为fe(x|We),输入的数据为x,参考特征扩展空间的参数为We,x可以为第一样本数据、第二样本数据任一种数据,输出e为第一虚拟样本数据、第二虚拟样本数据。结合参考特定特征扩展空间,可以学习参考前端转化率预估模型的训练函数f1(x|W1,We)和参考后端转化率预估模型的训练函数f2(x|W2,We)。前端转化率预估模型的损失函数为L(y1,p0p1),根据输入的点击标签值所对应的真实点击率和\或前端转化标签值所对应的真实前端转化率和f1(x|W1,We)输出的预估前端转化率,可以得到L(y1,p0p1)的值,即第四函数值为L(y1,p0p1)的值。
第(2-5)步中的第五差异评估值可以为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值,这种方式可以最直观地表示所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率的差距。也可以为损失函数值,具体损失函数值的求解方式可以为:
将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数,计算得出第五损失函数的第五函数值,并将所述第五函数值作为所述第五差异评估值。
举例来说,后端转化率预估模型的训练函数为f2(x|W2,We);后端转化率预估模型的损失函数为L(y2,p0p1p2),根据输入的前端转化标签值所对应的真实前端转化率和\或后端转化标签值所对应的真实后端转化率和f2(x|W2,We)输出的预估后端转化率,可以得到L(y2,p0p1p2)的值,即第五函数值为L(y2,p0p1p2)的值。
第(2-6)步具体可以为:
通过减小所述第四函数值和\或所述第五函数值,调整所述参考前端转化率预估模型的参数,从而更新所述参考前端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考后端转化率预估模型的参数,从而更新所述参考后端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考特征扩展空间的参数,从而更新所述参考特征扩展空间的参数。
举例来说,通过L(y1,p0p1)和L(y2,p0p1p2)来调整W1;通过L(y1,p0p1)和L(y2,p0p1p2)来调整W2,通过L(y1,p0p1)和L(y2,p0p1p2)来调整We,即联合损失函数为:
L=L(y1,p0p1)+L(y2,p0p1p2),变形也可以为L=L(y1,p0p1)+L(y2,p0p1p2)+R;R表示为了避免过拟合的正则项。
需要说明的是,结合图2来说,在第二类模型训练方法中,还可以加入点击预估模型,具体来说:获取所述点击数据和曝光数据;将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第六虚拟样本数据;将所述第六虚拟样本数据输入参考点击率预估模型,确定所述第六虚拟样本数据的预估点击率,并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值;至少根据所述第六差异评估值,对所述参考点击率预估模型进行迭代机器训练;
将训练结束时的所述参考点击率预估模型,作为特定点击率预估模型。
举例来说,点击率预估模型的训练函数为f0(x|W0,We),根据输入的曝光标签值所对应的真实曝光率和\或点击标签值所对应的真实点击率和f0(x|W0,We)输出的预估点击率,可以得到L(y0,p0)的值,即第六函数值为L(y0,p0)的值。那么可以在上述联合损失函数中加入点击率预估模型的损失函数L(y0,p0)。即L=L(y0,p0)+L(y1,p0p1)+L(y2,p0p1p2),也可以加上R。
步骤101~步骤104之外的一种可选实施方式为:
将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型,以预估所述用户被所述资源曝光且发生点击的点击率;所述特定点击率预估模型为根据所述资源推荐平台积累的曝光数据和所述点击数据训练得到的;根据所述点击率、所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。
举例来说,前端转化率为0.8和所述后端转化率为0.6,可以用前端转化率和所述后端转化率的乘积0.48来作为所述用户点击所述资源发生前端转化且发生后端转化的转化率。
如图3所示,本申请提供一种转化预估装置,包括:获取模块301,用于获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息;处理模块302,用于将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率;所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据训练得到的;将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率;所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据训练得到的;至少根据所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率。
可选地,所述获取模块301还用于:获取所述点击数据、所述前端转化数据和所述后端转化数据;所述处理模块302还用于:将所述点击数据和\或所述前端转化数据作为第一样本数据输入至参考前端转化率预估模型,确定所述第一样本数据的预估前端转化率,并确定所述第一样本数据的预估前端转化率和真实前端转化率之间的第一差异评估值;将所述前端转化数据和\或所述后端转化数据作为第二样本数据输入至参考后端转化率预估模型,确定所述第二样本数据的预估后端转化率,并确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值;至少根据所述第一差异评估值和\或所述第二差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型进行迭代机器训练;将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型。
可选地,所述第一样本数据包括所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率,所述处理模块302具体用于:将所述第一样本数据的各特征值和所述第一样本数据的真实前端转化率代入所述参考前端转化率预估模型的第一损失函数,计算得出第一损失函数的第一函数值,并将所述第一函数值作为所述第一差异评估值;所述第二样本数据包括所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率,所述确定所述第二样本数据的预估后端转化率和真实后端转化率之间的第二差异评估值:将所述第二样本数据的各特征值和所述第二样本数据的真实后端转化率代入所述参考后端转化率预估模型的第二损失函数,计算得出第二损失函数的第二函数值,并将所述第二函数值作为所述第二差异评估值;通过减小所述第一函数值和\或所述第二函数值,调整所述参考前端转化率预估模型的参数,以更新所述参考前端转化率预估模型;通过减小所述第一函数值和\或所述第二函数值,调整所述参考后端转化率预估模型的参数,以更新所述参考后端转化率预估模型。
可选地,所述第一差异评估值为所述第一样本数据的预估前端转化率和真实前端转化率之间的差值;所述第二差异评估值为所述第二样本数据的预估后端转化率和真实后端转化率之间的差值。
可选地,所述获取模块301还用于:获取所述点击数据、所述前端转化数据和所述后端转化数据;所述处理模块302还用于:将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第四虚拟样本数据;将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第五虚拟样本数据;将所述第四虚拟样本数据输入至参考前端转化率预估模型,确定所述第四虚拟样本数据的预估前端转化率,并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值;将所述第五虚拟样本数据输入至参考后端转化率预估模型,确定所述第五虚拟样本数据的预估后端转化率,并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值;至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练;将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型;将训练结束时的所述参考特征扩展空间,作为所述特定特征扩展空间。
可选地,所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值,所述处理模块302具体用于:将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数,计算得出所述第四损失函数的第四函数值,并将所述第四函数值作为所述第四差异评估值;所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值,所述处理模块302具体用于:将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数,计算得出所述第五损失函数的第五函数值,并将所述第五函数值作为所述第五差异评估值;通过减小所述第四函数值和\或所述第五函数值,调整所述参考前端转化率预估模型的参数,从而更新所述参考前端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考后端转化率预估模型的参数,从而更新所述参考后端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考特征扩展空间的参数,从而更新所述参考特征扩展空间的参数。
可选地,所述第四差异评估值为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值;所述第五差异评估值为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值。
可选地,所述获取模块301还用于:获取所述点击数据和曝光数据;所述处理模块302具体用于:将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第六虚拟样本数据;将所述第六虚拟样本数据输入参考点击率预估模型,确定所述第六虚拟样本数据的预估点击率,并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值;至少根据所述第六差异评估值,对所述参考点击率预估模型进行迭代机器训练;将训练结束时的所述参考点击率预估模型,作为特定点击率预估模型。
本申请实施例提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种转化预估方法及任一可选方法。
本申请实施例提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种转化预估方法及任一可选方法。
最后应说明的是:本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种转化预估方法,其特征在于,包括:
获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息,所述资源特征信息包括推荐资源的格式、布局;
获取资源推荐平台积累的曝光数据、点击数据、点击且发生前端转化的前端转化数据以及发生前端转化且发生后端转化的后端转化数据;
将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型,以预估所述用户被所述资源曝光且发生点击的点击率;
将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率;将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率;
根据所述点击率、所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率;
其中,所述特定点击率预估模型为根据所述曝光数据和所述点击数据经特征扩展空间进行相似性扩展后训练得到的;
所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据经所述特征扩展空间进行相似性扩展后训练得到的;
所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据经所述特征扩展空间进行相似性扩展后训练得到的;
所述特征扩展空间为根据所述曝光数据、所述点击数据、所述前端转化数据和所述后端转化数据训练得到的。
2.如权利要求1所述的方法,其特征在于,所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前,还包括:
将所述点击数据和\或所述前端转化数据作为第四样本数据输入至参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第四虚拟样本数据;
将所述前端转化数据和\或所述后端转化数据作为第五样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第五虚拟样本数据;
将所述第四虚拟样本数据输入至参考前端转化率预估模型,确定所述第四虚拟样本数据的预估前端转化率,并确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值;
将所述第五虚拟样本数据输入至参考后端转化率预估模型,确定所述第五虚拟样本数据的预估后端转化率,并确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值;至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练;
将训练结束时的所述参考前端转化率预估模型,作为所述特定前端转化率预估模型;
将训练结束时的所述参考后端转化率预估模型,作为所述特定后端转化率预估模型;
将训练结束时的所述参考特征扩展空间,作为所述特征扩展空间。
3.如权利要求2所述的方法,其特征在于,所述第四虚拟样本数据包括所述第四虚拟样本数据的各特征值,所述确定所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的第四差异评估值,包括:
将所述第四虚拟样本数据的各特征值和所述第四样本数据的真实前端转化率代入所述参考前端转化率预估模型的第四损失函数,计算得出所述第四损失函数的第四函数值,并将所述第四函数值作为所述第四差异评估值;
所述第五虚拟样本数据包括所述第五虚拟样本数据的各特征值,所述确定所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的第五差异评估值,包括:
将所述第五虚拟样本数据的各特征值和所述第五样本数据的真实后端转化率代入所述参考后端转化率预估模型的第五损失函数,计算得出所述第五损失函数的第五函数值,并将所述第五函数值作为所述第五差异评估值;
所述至少根据所述第四差异评估值和\或所述第五差异评估值,对所述参考前端转化率预估模型和\或所述参考后端转化率预估模型和\或所述参考特征扩展空间进行迭代机器训练,包括:
通过减小所述第四函数值和\或所述第五函数值,调整所述参考前端转化率预估模型的参数,从而更新所述参考前端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考后端转化率预估模型的参数,从而更新所述参考后端转化率预估模型的参数;和\或通过减小所述第四函数值和\或所述第五函数值,调整所述参考特征扩展空间的参数,从而更新所述参考特征扩展空间的参数。
4.如权利要求2所述的方法,其特征在于,所述第四差异评估值为所述第四虚拟样本数据的预估前端转化率和所述第四样本数据的真实前端转化率之间的差值;所述第五差异评估值为所述第五虚拟样本数据的预估后端转化率和所述第五样本数据的真实后端转化率之间的差值。
5.如权利要求2所述的方法,其特征在于,所述获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息之前,还包括:
将所述曝光数据和\或所述点击数据作为第六样本数据输入至所述参考特征扩展空间进行相似性扩展,获得经所述参考特征扩展空间转化得到的第六虚拟样本数据;
将所述第六虚拟样本数据输入参考点击率预估模型,确定所述第六虚拟样本数据的预估点击率,并确定所述第六虚拟样本数据的预估点击率和第六样本数据的真实点击率之间的第六差异评估值;
至少根据所述第六差异评估值,对所述参考点击率预估模型进行迭代机器训练;
将训练结束时的所述参考点击率预估模型,作为特定点击率预估模型。
6.一种转化预估装置,其特征在于,包括:
获取模块,用于获取待评估用户的用户特性信息和所述用户待被曝光资源的资源特征信息,以及获取资源推荐平台积累的曝光数据、点击数据、点击且发生前端转化的前端转化数据以及发生前端转化且发生后端转化的后端转化数据,所述资源特征信息包括推荐资源的格式、布局;
处理模块,用于将所述用户特性信息和所述资源特征信息输入到特定点击率预估模型,以预估所述用户被所述资源曝光且发生点击的点击率;将所述用户特性信息和所述资源特征信息输入到特定前端转化率预估模型,以预估所述用户点击所述资源且发生前端转化的前端转化率;将所述用户特性信息和所述资源特征信息输入到特定后端转化率预估模型,以预估针对所述资源所述用户发生前端转化且发生后端转化的后端转化率;至少根据所述点击率、所述前端转化率和所述后端转化率,确定所述用户点击所述资源发生前端转化且发生后端转化的转化率;
其中,所述特定点击率预估模型为根据所述曝光数据和所述点击数据经特征扩展空间进行相似性扩展后训练得到的;所述特定前端转化率预估模型为根据资源推荐平台积累的点击数据和点击且发生前端转化的前端转化数据经所述特征扩展空间进行相似性扩展后训练得到的;所述特定后端转化率预估模型为根据所述前端转化数据和发生前端转化且发生后端转化的后端转化数据经所述特征扩展空间进行相似性扩展后训练得到的;所述特征扩展空间为根据所述曝光数据、所述点击数据、所述前端转化数据和所述后端转化数据训练得到的。
7.一种计算机设备,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至5中任意一项所述的方法被执行。
8.一种存储介质,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至5中任意一项所述的方法被执行。
CN201911331015.5A 2019-12-20 2019-12-20 一种转化预估方法及装置 Active CN111160638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911331015.5A CN111160638B (zh) 2019-12-20 2019-12-20 一种转化预估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911331015.5A CN111160638B (zh) 2019-12-20 2019-12-20 一种转化预估方法及装置

Publications (2)

Publication Number Publication Date
CN111160638A CN111160638A (zh) 2020-05-15
CN111160638B true CN111160638B (zh) 2022-09-02

Family

ID=70557657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911331015.5A Active CN111160638B (zh) 2019-12-20 2019-12-20 一种转化预估方法及装置

Country Status (1)

Country Link
CN (1) CN111160638B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667311B (zh) * 2020-06-08 2023-12-12 腾讯科技(深圳)有限公司 一种广告投放的方法、相关装置、设备以及存储介质
CN111798280B (zh) * 2020-09-08 2020-12-15 腾讯科技(深圳)有限公司 多媒体信息推荐方法、装置和设备及存储介质
CN112905897B (zh) * 2021-03-30 2022-09-09 杭州网易云音乐科技有限公司 相似用户确定方法、向量转化模型、装置、介质及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301247A (zh) * 2017-07-14 2017-10-27 广州优视网络科技有限公司 建立点击率预估模型的方法及装置、终端、存储介质
CN109670940A (zh) * 2018-11-12 2019-04-23 深圳壹账通智能科技有限公司 基于机器学习的信用风险评估模型生成方法及相关设备
CN110415032A (zh) * 2019-07-24 2019-11-05 深圳乐信软件技术有限公司 一种曝光转化率预估方法、装置、设备以及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120030011A1 (en) * 2010-07-30 2012-02-02 Yahoo! Inc. Systems and Methods for Estimating a Conversion Rate for a Digital Advertisement Based on Dwell Times Associated with the Digital Advertisement

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301247A (zh) * 2017-07-14 2017-10-27 广州优视网络科技有限公司 建立点击率预估模型的方法及装置、终端、存储介质
CN109670940A (zh) * 2018-11-12 2019-04-23 深圳壹账通智能科技有限公司 基于机器学习的信用风险评估模型生成方法及相关设备
CN110415032A (zh) * 2019-07-24 2019-11-05 深圳乐信软件技术有限公司 一种曝光转化率预估方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN111160638A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
JP7127120B2 (ja) ビデオ分類の方法、情報処理の方法及びサーバー、並びにコンピュータ可読記憶媒体及びコンピュータプログラム
CN111160638B (zh) 一种转化预估方法及装置
CN110363213B (zh) 服装图像的认知分析和分类的方法和系统
US20190272553A1 (en) Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks
US11551123B2 (en) Automatic visualization and explanation of feature learning output from a relational database for predictive modelling
CN109948710B (zh) 基于api相似度的微服务识别方法
JP2023501469A (ja) リカレント・ニューラル・ネットワークを用いたマルチモーダル・データの融合
CN110472154B (zh) 一种资源推送方法、装置、电子设备及可读存储介质
US11373117B1 (en) Artificial intelligence service for scalable classification using features of unlabeled data and class descriptors
CN116127020A (zh) 生成式大语言模型训练方法以及基于模型的搜索方法
CN111159241B (zh) 一种点击转化预估方法及装置
CN111814487A (zh) 一种语义理解方法、装置、设备及存储介质
CN111291936B (zh) 产品生命周期预估模型生成方法、装置及电子设备
CN116245097A (zh) 训练实体识别模型的方法、实体识别方法及对应装置
CN116910567B (zh) 推荐业务的在线训练样本构建方法及相关装置
CN112582073B (zh) 医疗信息获取方法、装置、电子设备和介质
CN110413307A (zh) 代码功能的关联方法、装置及电子设备
CN110717537B (zh) 训练用户分类模型、执行用户分类预测的方法及装置
CN112330426A (zh) 一种产品推荐方法、装置及存储介质
JP7211103B2 (ja) 系列ラベリング装置、系列ラベリング方法、およびプログラム
CN115345600B (zh) 一种rpa流程的生成方法和装置
US20210110287A1 (en) Causal Reasoning and Counterfactual Probabilistic Programming Framework Using Approximate Inference
WO2021120226A1 (zh) 一种转化预估方法及装置
CN113139751A (zh) 基于大数据的微服务用户业务类型确定方法
CN113391795A (zh) 一种应用场景和软件开发包自适应映射的实现方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant