CN114596109A - 推荐信息的确定方法、装置、电子设备及存储介质 - Google Patents

推荐信息的确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114596109A
CN114596109A CN202011414380.5A CN202011414380A CN114596109A CN 114596109 A CN114596109 A CN 114596109A CN 202011414380 A CN202011414380 A CN 202011414380A CN 114596109 A CN114596109 A CN 114596109A
Authority
CN
China
Prior art keywords
recommendation information
conversion rate
target user
user
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011414380.5A
Other languages
English (en)
Inventor
胡乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011414380.5A priority Critical patent/CN114596109A/zh
Publication of CN114596109A publication Critical patent/CN114596109A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种推荐信息的确定方法,涉及信息推荐技术领域。该方法包括:获取目标用户的至少一个目标用户特征;对于任意一个目标用户特征,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,获得目标用户点击候选推荐信息的纠偏后的转化率的;根据纠偏后的转化率对候选推荐信息进行排序,根据排序结果从候选推荐信息中确定向目标用户推荐的至少一个推荐信息。本申请实施例能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。

Description

推荐信息的确定方法、装置、电子设备及存储介质
技术领域
本申请涉及信息推荐技术领域,具体而言,本申请涉及一种推荐信息的确定方法、装置、电子设备及存储介质。
背景技术
转化率(Conversion Rate),是指通过点击推荐信息进入推广网站的网民形成转化的比例,计算公式为总转化数/总点击数,具体的转化行为可以由广告主自主定义,例如注册、购买等行为都可以作为转化行为。
转化率预估模型是广告推荐系统重要的一个环节。转化率预估模型即用于预估转化率的模型,能够在输入用户的特征和广告特征后,输出该用户在对该广告点击的前提下,产生转化行为的概率。
转化率预估模型的预估结果可以直接影响广告的转化成本、起量率等参数。但是由于模型预估受严格的时间限制和计算力的限制,因此不能只考虑模型的准确率,而忽略计算效率。现实中的广告推荐系统往往取的是折中方案,在性能耗时满足的前提下,尽量保证模型的复杂度,因此转化率预估模型的复杂度往往做不到最大,准确性也做不到最高,进而影响广告的准确投放。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的推荐信息的确定方法、装置、电子设备及存储介质。
第一方面,提供了一种推荐信息的确定方法,该方法包括:
获取目标用户的至少一个目标用户特征;
对于任意一个目标用户特征,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为与任意一个目标用户特征对应的候选推荐信息;
获取候选推荐信息的推荐信息特征,结合至少一个目标用户特征,获得目标用户点击候选推荐信息后的转化率;
根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,获得目标用户点击候选推荐信息的纠偏后的转化率,转化率偏差是由具有任意一个目标用户特征的样本用户点击候选推荐信息后的实际转化率和预估转化率获得的;
根据纠偏后的转化率对候选推荐信息进行排序,根据排序结果从候选推荐信息中确定向目标用户推荐的至少一个推荐信息。
在一个可能的实现方式中,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为候选推荐信息,之前还包括:
获取至少一个样本用户的历史行为日志,根据至少一个样本用户的历史行为日志构建倒排链,历史行为日志包括样本用户点击推荐信息后的实际转化行为,倒排链以从历史行为日志中确定的、样本用户的一个用户特征为左键,倒排链中的节点用于表征从历史行为日志中确定的、与倒排链的左键相关性最高的推荐信息;
确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为候选推荐信息,包括:
查找左键为任意一个目标用户特征的倒排链,作为目标倒排链;
将目标倒排链上的节点表征的推荐信息作为候选推荐信息。
在一个可能的实现方式中,历史行为日志中还包括样本用户点击推荐信息后的预估转化率;
对目标用户点击候选推荐信息后的转化率进行纠偏,之前还包括:
根据样本用户的任意一个样本用户特征、样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差;
确定以任意一个样本用户特征为左键的倒排链中节点表征的推荐信息,将具有任意一个样本用户特征的样本用户点击节点表征的推荐信息后的转化率偏差,保存至对应节点中;
对目标用户点击候选推荐信息后的转化率进行纠偏,之前还包括:
从目标倒排链上的节点中获得具有目标用户特征的用户点击候选推荐信息后的转化率偏差。
在一个可能的实现方式中,根据至少一个样本用户的历史行为日志构建倒排链,包括:
对至少一个样本用户的历史行为日志进行特征挖掘,获得至少一个样本用户的样本用户特征;
将样本用户特征输入至预先训练的推荐模型,获得推荐模型输出的与样本用户特征相关性最高的至少一个推荐信息的信息;
构建以样本用户特征为左键的倒排链,根据与样本用户特征相关性最高的至少一个推荐信息的数量在倒排链中创建相应数量的节点,每个节点用于表征与样本用户特征相关性最高的一个推荐信息。
在一个可能的实现方式中,根据样本用户的任意一个样本用户特征、样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差,包括:
根据样本用户的历史行为日志和任意一个样本用户特征,建立样本用户的任意一个样本用户特征、点击的推荐信息、点击数、转化数以及预估转化率间的对应关系信息;
对于历史行为日志涉及的任意一个推荐信息,根据对应关系信息,确定具有任意一个样本用户特征的所有样本用户点击推荐信息后的点击总数、转化总数以及预估转化率均值;
根据具有任意一个样本用户特征的所有样本用户点击推荐信息时的点击总数和转化总数,获得具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率;
根据具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值,获得具有样本用户特征的样本用户点击推荐信息后的转化率偏差。
在一个可能的实现方式中,根据具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值,获得具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差,包括:
将具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值的商,作为具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差。
在一个可能的实现方式中,根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,包括:
获取与目标用户的所有目标用户特征相关的、具有任意一个目标用户特征的用户点击候选推荐信息后的转化率偏差,作为待处理转化率偏差;
确定待处理转化率偏差进行加权平均值,作为目标用户点击候选推荐信息后的转化率偏差;
根据目标用户点击候选推荐信息后的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏。
在一个可能的实现方式中,根据目标用户点击候选推荐信息后的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,包括:
根据目标用户点击候选推荐信息后的转化率偏差与目标用户点击候选推荐信息后的转化率的乘积,获得目标用户点击候选推荐信息的纠偏后的转化率。
第二方面,提供了一种推荐信息的确定装置,包括:
目标用户特征获取模块,用于获取目标用户的至少一个目标用户特征;
候选推荐信息获取模块,用于对于任意一个目标用户特征,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为与任意一个目标用户特征对应的候选推荐信息;
转化率获取模块,用于获取候选推荐信息的推荐信息特征,结合至少一个目标用户特征,获得目标用户点击候选推荐信息后的转化率;
转化率纠偏模块,用于根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,获得目标用户点击候选推荐信息的纠偏后的转化率,转化率偏差是由具有任意一个目标用户特征的样本用户点击候选推荐信息后的实际转化率和预估转化率获得的;
推荐模块,用于根据纠偏后的转化率对候选推荐信息进行排序,根据排序结果从候选推荐信息中确定向目标用户推荐的至少一个推荐信息。
在一个可能的实现方式中,推荐信息的确定装置还包括:
倒排链构建模块,用于获取至少一个样本用户的历史行为日志,根据至少一个样本用户的历史行为日志构建倒排链,历史行为日志包括样本用户点击推荐信息后的实际转化行为,倒排链以从历史行为日志中确定的、样本用户的一个用户特征为左键,倒排链中的节点用于表征从历史行为日志中确定的、与倒排链的左键相关性最高的推荐信息;
候选推荐信息获取模块包括:
目标倒排链获取子模块,用于查找左键为任意一个目标用户特征的倒排链,作为目标倒排链;
节点信息获取模块,用于将目标倒排链上的节点表征的推荐信息作为候选推荐信息。
在一个可能的实现方式中,历史行为日志中还包括样本用户点击推荐信息后的预估转化率;
推荐信息的确定装置还包括:
转化率偏差确定模块,用于根据样本用户的任意一个样本用户特征、样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差;
转化偏差保存模块,用于确定以任意一个样本用户特征为左键的倒排链中节点表征的推荐信息,将具有任意一个样本用户特征的样本用户点击节点表征的推荐信息后的转化率偏差,保存至对应节点中;
转化率偏差获取模块,用于从目标倒排链上的节点中获得具有目标用户特征的用户点击候选推荐信息后的转化率偏差。
在一个可能的实现方式中,倒排链构建模块包括:
特征挖掘子模块,用于对至少一个样本用户的历史行为日志进行特征挖掘,获得至少一个样本用户的样本用户特征;
推荐信息输出子模块,用于将样本用户特征输入至预先训练的推荐模型,获得推荐模型输出的与样本用户特征相关性最高的至少一个推荐信息的信息;
倒排链构建子模块,用于构建以样本用户特征为左键的倒排链,根据与样本用户特征相关性最高的至少一个推荐信息的数量在倒排链中创建相应数量的节点,每个节点用于表征与样本用户特征相关性最高的一个推荐信息。
在一个可能的实现方式中,转化率偏差确定模块包括:
对应关系确定子模块,用于根据样本用户的历史行为日志和任意一个样本用户特征,建立样本用户的任意一个样本用户特征、点击的推荐信息、点击数、转化数以及预估转化率间的对应关系信息;
交叉信息获取子模块,用于对于历史行为日志涉及的任意一个推荐信息,根据对应关系信息,确定具有任意一个样本用户特征的所有样本用户点击推荐信息后的点击总数、转化总数以及预估转化率均值;
实际转化率获取子模块,用于根据具有任意一个样本用户特征的所有样本用户点击推荐信息时的点击总数和转化总数,获得具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率;
转化率偏差获取子模块,用于根据具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值,获得具有样本用户特征的样本用户点击推荐信息后的转化率偏差。
在一个可能的实现方式中,转化率偏差获取子模块具体用于:将具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值的商,作为具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差。
在一个可能的实现方式中,转化率纠偏模块包括:
待处理偏差获取子模块,用于获取与目标用户的所有目标用户特征相关的、具有任意一个目标用户特征的用户点击候选推荐信息后的转化率偏差,作为待处理转化率偏差;
加权平均值计算子模块,用于确定待处理转化率偏差进行加权平均值,作为目标用户点击候选推荐信息后的转化率偏差;
纠偏子模块,用于根据目标用户点击候选推荐信息后的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏。
在一个可能的实现方式中,纠偏子模块具体用于根据目标用户点击候选推荐信息后的转化率偏差与目标用户点击候选推荐信息后的转化率的乘积,获得目标用户点击候选推荐信息的纠偏后的转化率。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
第五方面,本发明实施例提供一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行实现如第一方面所提供的方法的步骤。
本发明实施例提供的推荐信息的确定方法、装置、电子设备及存储介质,通过获取目标用户的目标用户特征,确定与每个目标用户特征相关性最高的推荐信息,作为候选推荐信息,进一步根据候选推荐信息的推荐信息特征,结合目标用户特征获得目标用户点击候选推荐信息后的转化率,通过已获取的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差对目标用户点击候选推荐信息后的转化率进行纠偏,即可获得纠偏后的转化率,由于转化率偏差同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为现有转化率预估模型的预测逻辑图;
图2示例性地示出了本申请实施例提供的一种推荐信息的确定系统的结构图;
图3示例性地示出了本申请实施例的推荐信息的确定方法的流程示意图;
图4示例性地示出了本申请实施例的一个倒排链的结构示意图;
图5示例性地示出了本申请实施例确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差的流程示意图;
图6示例性地示出了本申请实施例的保存转化率偏差的倒排链的结构示意图;
图7示例性地示出了本申请实施例对转化率进行纠偏的流程示意图;
图8为本申请实施例提供的一种推荐信息的确定装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为了便于对本申请实施例提供的方法的理解,首先对本申请实施例中涉及的名词进行介绍:
广告联盟通指网络广告联盟,指集合中小网络媒体资源(又称联盟会员,如中小网站、个人网站、WAP站点等)组成联盟,通过联盟帮助广告主实现广告投放,并进行广告投放数据监测统计,广告主则按照网络广告的实际效果向联盟会员支付广告费用的网络广告组织投放形式。
广告主(advertisers):指想为自己的品牌或者产品做推荐的人或者单位,例如宝马、Intel、蒙牛,腾讯等等。
推荐信息,即向社会广大公众告知某件事物,推荐信息既可以是不以营利为目的的公告、声明等等、也可以是以营利为目的的商业广告,对于商业广告而言,推荐信息中都含有待推荐的商品的信息,这些信息可以进一步包含类别、价格、名称等要素。
大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
转化率(CVR,Conversion Rate),是一个衡量CPA广告效果的指标,简言之就是用户点击广告后发生转化行为的转化率。CVR=(转化行为发生量/点击量)*100%。
pCVR:预估在向受众曝光一个广告后,在发生点击的前提下,产生转化行为的概率即为预估转化率。
eCPM(effective cost per mile):每一千次展示可以获得的广告收入。
pCTR(Predict Click-Through Rate):预估点击率。
oCPA(OptimizedCost Per Action):优化后的每次行动成本。
转化率预估模型,用于根据用户的特征以及商品的特征预估转化率。在粗排阶段,由于需要排序的广告众多,对时间的要求更加严格,因此业界普遍采用的双塔模型进行转化率预估。但这种双塔模型存在天然的缺陷,其忽略了人、广告之间的交叉关系,从而对模型的预估效果有一定的损失。
请参阅图1,图1为现有转化率预估模型的预测逻辑图,在粗排阶段整个模型分为两侧(下文将每一侧成为一个塔)。左侧的塔代表的是与用户相关的子模型,塔的最下层是用户的特征信息(如性别、年龄、城市、购买过的商品等),经过embedding层(向量层)之后,每个特征信息变为一个向量;将所有的特征向量拼接在一起,然后通过多层全连接层将用户的所有向量转化为一个32维的向量。右塔则代表的是商品的信息,最下层是商品的特征(如商品的商家、类别、名称、品牌等),同样,商品也会经过一系列转化变为一个32维的向量。用户的向量和商品的向量计算内积,得到的值即可表征用户在点击商品广告后的预估转化率,数值越大表示商品的推荐度越高。
现有的转化率预估模型虽然保证了模型预估的性能耗时,但由于在模型的最低端用户的特征和商品特征是完全分离的,只在最上层计算内机是才汇聚在一起,经过分析发现,这种预估方式丢失了大量交叉维度的信息,不利于保证预估的准确性。
本申请提供的推荐信息的确定方法、装置、电子设备及存储介质,旨在解决现有技术的如上技术问题。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图2示例性地示出了本申请实施例提供的一种推荐信息的确定系统的结构图,如图2所示,广告联盟11是集合多个流量媒体平台组成的联盟,图中的广告联盟具有三个流量媒体平台,需要注意的是,在对本申请实施例进行实际应用时,流量媒体平台的个数不作具体限制,这里仅为叙述方便设置为3个流量媒体平台111,流量媒体平台111的后台服务器为流量媒体平台服务器112。当终端21访问流量媒体平台服务器112时,流量媒体平台服务器112提供流量服务,可以理解的是,流量服务可以是向终端展示网页。流量媒体平台服务器通过网络连接广告投放服务器31,广告投放服务器31用于执行如下述各实施例的推荐信息的确定方法,并将最终确定的推荐信息发送至流量媒体平台服务器112,由流量媒体平台服务器112将带有推荐信息的网页返回终端。
流量媒体平台服务器和广告投放服务器均可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。
本申请实施例的服务器的执行方法可以以云计算(cloud computing)的形式完成,云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
按照逻辑功能划分,在IaaS(Infrastructure as a Service,基础设施即服务)层上可以部署PaaS(Platform as a Service,平台即服务)层,PaaS层之上再部署SaaS(Software as a Service,软件即服务)层,也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台,如数据库、web容器等。SaaS为各式各样的业务软件,如web门户网站、短信群发器等。一般来说,SaaS和PaaS相对于IaaS是上层。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图3示例性地示出了本申请实施例的推荐信息的确定方法的流程示意图,如图3所示,包括:
S101、获取目标用户的至少一个目标用户特征。
当用户在使用终端获取流量服务的过程中,流量媒体平台服务器会不断收集用户的信息和行为,然后对这些信息进行聚类分析,而找出其中的规律,利用这些规律来识别用户的年龄、性别、喜欢的商品、终端的唯一标识等信息,并作为用户的特征。可以理解的是,目标用户特征即对目标用户识别出的用户特征,本申请实施例对于目标用户特征的个数和类型不作具体限定。
S102、对于任意一个目标用户特征,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为与任意一个目标用户特征对应的候选推荐信息。
在目前的推荐信息确定系统中,通常会利用大数据训练得到推荐模型,推荐模型通过分析大数据中每个用户的用户特征以及与每个用户相关性高的推荐信息,即可确定每一种用户特征对应的推荐信息,常见地,如果大数据中显示年龄超过60岁的用户往往乐于购买保健品,那么对于用户特征为大于60岁而言,其相关性高的推荐信息就可以包括保健品。应当理解的是,相关性能够表征购买意愿,相关性越大,则购买意愿越大。
因此,对于每个目标用户特征,都可以获得至少一个相关性最高的推荐信息,例如,若目标用户具有三个目标用户特征,分别用A1、A2和A3,那么分别针对3个目标用户特征分别确定至少一个推荐信息,比如,与A1相关性最高的推荐信息为B1和B2,与A2相关性最高的推荐信息为B3和B4,与A3相关性最高的推荐信息为B5,那么针对目标用户可以获得5个推荐信息。本申请实施例对每个目标用户特征相关性高的推荐信息的数量不作限定。
S103、获取候选推荐信息的推荐信息特征,结合至少一个目标用户特征,获得目标用户点击候选推荐信息后的转化率。
可以理解的是,与用户类似,推荐信息也具有表征自身特点的特征,称之为推荐信息特征,对于一个推荐信息而言,其推荐信息特征的数量往往也是大于一个的。以推荐信息奶瓶为例,其推荐信息特征可以包括:母婴产品、材质、具体的价格区间等等。
在获取候选推荐信息的推荐信息特征后,即可利用图1所示的双塔模型,根据目标用户的目标用户特征以及候选推荐信息的推荐信息特征,获得目标用户点击候选推荐信息后的转化率。
S104、根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,获得目标用户点击候选推荐信息的纠偏后的转化率。
本申请实施例的转化率偏差是由具有任意一个目标用户特征的样本用户点击候选推荐信息后的实际转化率和预估转化率预先获取的,其中,具有任意一个目标用户特征的样本用户点击候选推荐信息后的实际转化率可以统计具有任意一个目标用户特征的样本用户点击候选推荐信息的点击数以及具有任意一个目标用户特征的样本用户点击候选推荐信息后发送转化行为数来获得。
例如,若目标用户的其中一个目标用户特征为“20~25岁年龄段”,其中一个候选推荐信息为“iPhone”,通过搜集海量的样本用户的历史行为日志,筛选出同时具备“20~25岁年龄段”和“iPhone”的历史行为日志进行转化行为统计,若具有“20~25岁年龄段”的样本用户点击候选推荐信息“iPhone”的点击数为10000,而具有“20~25岁年龄段”的样本用户点击候选推荐信息“iPhone”的转化数为20,那么具有“20~25岁年龄段”的样本用户点击候选推荐信息“iPhone”的实际转化率为20/10000,为0.2%。
同样地,在搜集样本用户的历史行为日志时,可以对每次样本用户点击推荐信息后的转化率进行预估,进而可以根据具备同一样本用户特征的不同样本用户点击推荐信息后的预估转化率取均值,即可获得具备同一样本用户特征的样本用户点击推荐信息后的预估转化率。
本申请在计算转化率偏差时,通过同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度。
由于步骤S103获得的转化率属于预估转化率,因此结合转化率偏差的定义可知纠偏后的转化率是更贴近实际的转化率,进一步利用更贴近实际的转化率确定推荐信息时,能够更符合目标用户的需求。
S105、根据纠偏后的转化率对候选推荐信息进行排序,根据排序结果从候选推荐信息中确定向目标用户推荐的至少一个推荐信息。
流量价格(即eCPM)通常包括CPM计费模式、CPC计费模式、CPA计费模式以及oCPA计费模式,其中CPA计费模式与oCPA计费模式均与转化率相关,所以本申请实施例在获得纠偏后的转化率后,通过将纠偏后的转化率以及其他参数(例如广告主的出价等等)带入计费模式的计算公式,即可获得不同候选推荐信息对广告联盟的收益大小的排序结果,基于该结果,即可从中获得对广告联盟收益符合预期的至少一个候选推荐信息,作为向目标用户推荐的推荐信息。
下面以CPA计费模式为例说明本申请实施例在获得纠偏后的转化率,对候选推荐信息的排序的过程。
CPA计费模式的eCPM计算公式可表达为:
eCPM=bid×pCTR×pCVR
其中,bid表示广告主的出价,pCTR表示预估点击率,pCVR表示预估转化率,在本申请实施例为纠偏后的转化率。
若候选推荐信息的个数为3个,分别为候选推荐信息1、候选推荐信息2和候选推荐信息3,具体的:
候选推荐信息1的bid为200元/千次展示、预估点击率为20%、纠偏后的转化率为4%;
候选推荐信息2的bid为240元/千次展示、预估点击率为18%、纠偏后的转化率为3.8%;
候选推荐信息3的bid为210元/千次展示、预估点击率为17%、纠偏后的转化率为4.2%;
通过将3个候选推荐信息的bid、pCTR和pCVR带入上述计算公式,可得对于候选推荐信息1的eCPM为1.6、候选推荐信息2的eCPM为1.64、候选推荐信息3的eCPM为1.49。
根据三个候选推荐信息的eCPM从大到小进行排序,排序结果为候选推荐信息2、候选推荐信息1和候选推荐信息3。若只向目标用户推荐一个推荐信息,那么就将推荐信息2推荐给目标用户。
本申请实施例的推荐信息的确定方法,通过获取目标用户的目标用户特征,确定与每个目标用户特征相关性最高的推荐信息,作为候选推荐信息,进一步根据候选推荐信息的推荐信息特征,结合目标用户特征获得目标用户点击候选推荐信息后的转化率,通过已获取的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差对目标用户点击候选推荐信息后的转化率进行纠偏,即可获得纠偏后的转化率,由于转化率偏差同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。
在上述各实施例的基础上,本申请在确定与目标用户特征相关性最高的推荐信息时,可以采用倒排链的方式快速获得。
倒排链常用于文本分析领域,用来记录有哪些文档包含了某个单词。一般在文档集合里会有很多文档包含某个单词,每个文档会记录文档编号(DocID),单词在文档中出现的次数(TF)及单词在文档中哪些位置出现过等信息,这样与一个文档相关的信息被称为倒排索引项(Posting),包含这个单词的一系列倒排索引项形成了链结构,这就是某个单词对应的倒排链,倒排链的左键即为该单词,倒排链的节点即为该单词在文档中的信息。本申请实施例借鉴了现有倒排链的概念,以用户特征作为左键,以与用户特征相关性最高的推荐信息作为节点。
图4示例性地示出了本申请实施例的一个倒排链的结构示意图,如图4所示,倒排链的左键为用户特征“IT男”,倒排链的节点有4个,分别对应商品“iPhone”、“机械键盘”、“智能手表”和“衬衫”。通过构建存储倒排链的索引系统,在搜索时,只需要确定目标用户特征“IT男”,然后在索引系统中查询以目标用户特征为左键的倒排链,即可定向将对应的倒排链拉取出来,效率非常高。
具体的,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为候选推荐信息,之前还包括:
获取至少一个样本用户的历史行为日志,根据至少一个样本用户的历史行为日志构建倒排链。
由上述实施例可知,历史行为日志包括样本用户点击推荐信息后的实际转化行为,实际转化行为可以是用户并没有转化行为,也可以是用户产生了转化行为。可以理解的是,本申请实施例获取的历史行为日志涉及到商品和样本用户越丰富,则对准确获得推荐信息越有利。
通过对样本用户的历史行为日志进行分析,即可确定样本用户的用户特征、商品特征、用户特征和不同商品间的相关性等等信息,进一步可利用上述信息建立倒排链。倒排链以从历史行为日志中确定的、样本用户的一个用户特征为左键,倒排链中的节点用于表征从历史行为日志中确定的、与倒排链的左键相关性最高的推荐信息。本申请实施例对倒排链中记录的推荐信息的个数不作具体的限定,例如可以为5、10、甚至20个。
例如,若通过分析对于具有“母亲”用户特征的用户相关性最高的商品为“奶瓶”、“尿布”和“玩具”,则可以生成一个左键为“母亲”,3个节点分别为“奶瓶”、“尿布”和“玩具”的倒排链。
相应的,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为候选推荐信息,包括:
查找左键为任意一个目标用户特征的倒排链,作为目标倒排链;
将目标倒排链上的节点表征的推荐信息作为候选推荐信息。
通过构建以用户特征为左键,以与用户特征相关性最高的推荐信息作为节点的倒排链,考虑到本申请需要针对目标用户点击候选推荐信息的转化率进行纠偏,而目标用户点击候选推荐信息的转化率与目标用户的每个目标用户特征对候选推荐信息的转化率都会产生影响,因此本申请实施例可以预先将具有目标用户特征对候选推荐信息的转化率偏差预先设置在倒排链中,这样在获得目标用户特征为左键的倒排链后,同时可以从倒排链中查询到相应的转化率偏差,由于查询转化率偏差的操作是直接取值的操作,时间复杂度为0(1),几乎不影响耗时和性能,相当于在一个时间同时执行了获取候选推荐信息和获取具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差两个信息,大幅提高了推荐信息的确定效率。
基于上述构思,本申请实施例的历史行为日志中还包括样本用户点击推荐信息后的预估转化率。
进一步地,对目标用户点击候选推荐信息后的转化率进行纠偏,之前还包括:
S201、根据样本用户的任意一个样本用户特征、样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差。
请参阅图5,其示例性地示出了本申请实施例确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差的流程示意图,如图5所示,
S2011、根据样本用户的历史行为日志和任意一个样本用户特征,建立样本用户的任意一个样本用户特征、点击的推荐信息、点击数、转化数以及预估转化率间的对应关系信息。
应当理解的是,一个具有至少一个样本用户特征的样本用户,在点击一次商品后,要么发生转化行为要么不发生转化行为,转化行为是否发生都会统计在历史行为日志中,同时,在该样本用户点击商品后,还会根据样本用户的样本用户特征和该商品的商品特征预测出预估转化率,也就是说,对于一次点击行为的历史行为日志,会生成多条对应关系信息,而这多条对应关系信息的区别仅在于样本用户特征不同。
具体的,一个历史行为日志中记录了这样的信息:用户张三点击iPhone的推荐信息后并没有发生转化行为,同时张三点击iPhone的推荐信息后发送转化行为的预估转化率为3%。进一步,张三的用户特征包括:20~25岁、中等收入群体、宅男。那么可以获得3条对应关系信息:
对应关系信息1:用户特征:20~25岁—推荐信息:iPhone—点击数:1—转化数:0—预估转化率3%
对应关系信息2:用户特征:中等收入群体—推荐信息:iPhone—点击数:1—转化数:0—预估转化率3%
对应关系信息3:用户特征:宅男—推荐信息:iPhone—点击数:1—转化数:0—预估转化率3%。
S2012、对于历史行为日志涉及的任意一个推荐信息,根据对应关系信息,确定具有任意一个样本用户特征的所有样本用户点击推荐信息后的点击总数、转化总数以及预估转化率均值。
由上述对应关系信息的实例可知,通过汇总具有相同用户特征和相同推荐信息的对应关系信息,即可获得具有该相同用户特征的所有样本用户点击该相同推荐信息后的点击总数、转化总数和预估转化率均值。其中,预估转化率均值,即具有相同用户特征和相同推荐信息的对应关系信息中包括的预估转化率的均值。
例如,若统计发现包括用户特征“宅男”以及推荐信息“焊接技术指南”共有3条,分别为:
对应关系信息a:用户特征:宅男—推荐信息:焊接技术指南—点击数:1—转化数:0—预估转化率1%
对应关系信息b:用户特征:宅男—推荐信息:焊接技术指南—点击数:1—转化数:0—预估转化率0.7%
对应关系信息c:用户特征:宅男—推荐信息:焊接技术指南—点击数:1—转化数:1—预估转化率0.1%。
通过上述三条对应关系信息,可以确定具有用户特征“宅男”的所有样本用户点击推荐信息“焊接技术指南”后的点击总数为3、转化总数1以及预估转化率均值为0.6%(1%、0.7%和0.1%的平均值)。
S2013、根据具有任意一个样本用户特征的所有样本用户点击推荐信息时的点击总数和转化总数,获得具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率。
通过将转化总数与点击总数相除,即可获得实际转化率。继续以上述对应关系信息a~c为例,由于点击总数为3,而转化总数为1,因此实际转化率为33%。
S2014、根据具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值,获得具有样本用户特征的样本用户点击推荐信息后的转化率偏差。
具体地,将向具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值的商,作为具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差。
继续以上述对应关系信息a~c为例,具有用户特征“宅男”的所有样本用户点击推荐信息“焊接技术指南”后转化率偏差为0.6%÷33%=0.018。
S202、确定以任意一个样本用户特征为左键的倒排链中节点表征的推荐信息,将具有任意一个样本用户特征的样本用户点击节点表征的推荐信息后的转化率偏差,保存至对应节点中。
在图4所示倒排链的基础上,若进一步确定具有用户特征“IT男”的样本用户点击“iPhone”、“机械键盘”、“智能手表”和“衬衫”表征的推荐信息后的转化率偏差分别为1.2、0.9、1.1、1.0,那么将转化率偏差保持至相应节点后的倒排链如图6所示。
在上述各实施例的基础上,作为一种可选实施例,获取具有任意一个目标用户特征的用户点击候选推荐信息后的转化率偏差,包括:
从目标倒排链上的节点中获得向具有目标用户特征的用户点击候选推荐信息后的转化率偏差。
以图6为例,通过查询左键为“IT男”的倒排链,根据倒排链的节点确定与“IT男”相关性最高的几个推荐信息“iPhone”、“机械键盘”、“智能手表”和“衬衫”,之后从4个节点中分别获取转化率偏差,获取到的转化率偏差,即为具有用户特征“IT男”的用户在点击推荐信息“iPhone”、“机械键盘”、“智能手表”和“衬衫”后的转化率偏差。
现有系统的商品召回,即通过建立用户的定向(把user_tag转化成hash后的id),再通过检索系统预先建立好的索引系统,通过定向把商品的倒排链拉取出来。图7示例性地示出了本申请实施例对转化率进行纠偏的流程示意图,如图7所示:
通过建立用户的定向搜索,拉取以用户的用户特征user_tag为左键的倒排链,通过倒排链,不仅可以获取与该用户特征相关性最大的若干个商品(推荐信息),同时,还可以将具有该用户特征的用户点击商品(推荐信息)后的转化率偏差pcvr_bias。
通过将用户的用户特征和倒排链中的商品的特征输入至转化率模型,获得转化率模型输出的转化率。
最后利用转化率偏差对转化率进行消偏,即可获得消偏后的转化率。
在上述各实施例的基础上,作为一种可选实施例,根据至少一个样本用户的历史行为日志构建倒排链,包括:
S301、对至少一个样本用户的历史行为日志进行特征挖掘,获得至少一个样本用户的样本用户特征;
在进行用户特征挖掘时,历史行为日志还可以记录更多与用户相关的信息,例如用户的年龄、兴趣爱好、注册时间、登录频率、使用项目、累计消费额等等,此外,在LBS(Location Based Service,基于位置的服务)广告中,用户与推荐信息(广告)所在的距离远近,也可以作为用户特征之一,进而修正转化率预估模型。
S302、将样本用户特征输入至预先训练的推荐模型,获得推荐模型输出的与样本用户特征相关性最高的至少一个推荐信息的信息。
应当理解的是,在步骤S302之前,还可以预先训练推荐模型,具体可以通过以下方式训练得到推荐模型:
首先,收集一定数量的样本用户的历史推荐日志,历史推荐日志中包括用户对推荐信息的行为记录,行为可以包括正面的行为,例如点击、购买、收藏等等,还可以包括负面的行为,例如拒绝推荐、取消关注等等,通过对不同的行为进行量化,获得样本用户与推荐信息的相关性结果,随即,基于已获取的样本用户的用户特征以及样本用户与推荐信息的相关性结果对初始模型进行训练,其中,以样本用户的用户特征迈训练样本,以样本用户于推荐信息的相关性结果作为样本标签,从而得到推荐模型。
其中,初始模型可以是单一神经网络模型,也可以是多个神经网络模型的组合。
S303、构建以样本用户特征为左键的倒排链,根据与样本用户特征相关性最高的至少一个推荐信息的数量在倒排链中创建相应数量的节点,每个节点用于表征与样本用户特征相关性最高的一个推荐信息。
在上述各实施例的基础上,作为一种可选实施例,根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,包括:
S401、获取与目标用户的所有目标用户特征相关的、具有任意一个目标用户特征的用户点击候选推荐信息后的转化率偏差,作为待处理转化率偏差。
由于目标用户具有至少一个目标用户特征,而每个目标用户特征与每个候选推荐信息之间都存在一个转化率偏差,因此,本申请实施例手续需要获取与目标用户的所有目标用户特征相关的、具有任意一个目标用户特征的用户点击候选推荐信息后的转化率偏差。
例如,若目标用户具有N个目标用户特征信息,分别为T1、T2、…、TN,则对于候选推荐信息X1,待处理转化率偏差包括:
具有目标用户特征T1的用户点击候选推荐信息X1后的转化率偏差P1
具有目标用户特征T2的用户点击候选推荐信息X1后的转化率偏差P2
具有目标用户特征TN的用户点击候选推荐信息X1后的转化率偏差PN
S402、确定待处理转化率偏差进行加权平均值,作为目标用户点击候选推荐信息的转化率偏差。
加权平均值即将各待处理转化率偏差乘以相应的权重,然后加总求和得到总体值,再除以待处理转化率偏差的总数。本申请实施例对于待处理转化率偏差的权重不作具体的限定,可以设置统一的权重,也可以根据实际情况对不同的目标用户特征设置不同的权重,例如,若某用户具有两个目标用户特征,分别为目标用户特征1和目标用户特征2,其中目标用户特征1相比目标用户特征2对于用户接受推荐信息影响更大,则可以设置目标用户特征1对应的转化率偏差的权重高于目标用户2对应的转化率偏差的权重。
S403、根据目标用户点击候选推荐信息后的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏。
具体地,根据目标用户点击候选推荐信息后的转化率偏差与目标用户点击候选推荐信息后的转化率的乘积,获得目标用户点击候选推荐信息的纠偏后的转化率。
本申请实施例提供了一种推荐信息的确定装置,如图8所示,该装置可以包括:目标用户特征获取模块101、候选推荐信息获取模块102、转化率获取模块103、转化率纠偏模块104,推荐模块105,具体地:
目标用户特征获取模块101,用于获取目标用户的至少一个目标用户特征;
候选推荐信息获取模块102,用于对于任意一个目标用户特征,确定与任意一个目标用户特征相关性最高的至少一个推荐信息,作为与任意一个目标用户特征对应的候选推荐信息;
转化率获取模块103,用于获取候选推荐信息的推荐信息特征,结合至少一个目标用户特征,获得目标用户点击候选推荐信息后的转化率;
转化率纠偏模块104,用于根据已获取到的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏,获得目标用户点击候选推荐信息的纠偏后的转化率,转化率偏差是由具有任意一个目标用户特征的样本用户点击候选推荐信息后的实际转化率和预估转化率获得的;
推荐模块105,用于根据纠偏后的转化率对候选推荐信息进行排序,根据排序结果从候选推荐信息中确定向目标用户推荐的至少一个推荐信息。
本发明实施例提供的推荐信息的确定装置,具体执行上述方法实施例流程,具体请详见上述推荐信息的确定方法实施例的内容,在此不再赘述。本发明实施例提供的推荐信息的确定装置,通过获取目标用户的目标用户特征,确定与每个目标用户特征相关性最高的推荐信息,作为候选推荐信息,进一步根据候选推荐信息的推荐信息特征,结合目标用户特征获得目标用户点击候选推荐信息后的转化率,通过已获取的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差对目标用户点击候选推荐信息后的转化率进行纠偏,即可获得纠偏后的转化率,由于转化率偏差同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。
在一个可能的实现方式中,推荐信息的确定装置还包括:
倒排链构建模块,用于获取至少一个样本用户的历史行为日志,根据至少一个样本用户的历史行为日志构建倒排链,历史行为日志包括样本用户点击推荐信息后的实际转化行为,倒排链以从历史行为日志中确定的、样本用户的一个用户特征为左键,倒排链中的节点用于表征从历史行为日志中确定的、与倒排链的左键相关性最高的推荐信息;
候选推荐信息获取模块包括:
目标倒排链获取子模块,用于查找左键为任意一个目标用户特征的倒排链,作为目标倒排链;
节点信息获取模块,用于将目标倒排链上的节点表征的推荐信息作为候选推荐信息。
在一个可能的实现方式中,历史行为日志中还包括样本用户点击推荐信息后的预估转化率;
推荐信息的确定装置还包括:
转化率偏差确定模块,用于根据样本用户的任意一个样本用户特征、样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差;
转化偏差保存模块,用于确定以任意一个样本用户特征为左键的倒排链中节点表征的推荐信息,将具有任意一个样本用户特征的样本用户点击节点表征的推荐信息后的转化率偏差,保存至对应节点中;
转化率偏差获取模块,用于从目标倒排链上的节点中获得具有目标用户特征的用户点击候选推荐信息后的转化率偏差。
在一个可能的实现方式中,倒排链构建模块包括:
特征挖掘子模块,用于对至少一个样本用户的历史行为日志进行特征挖掘,获得至少一个样本用户的样本用户特征;
推荐信息输出子模块,用于将样本用户特征输入至预先训练的推荐模型,获得推荐模型输出的与样本用户特征相关性最高的至少一个推荐信息的信息;
倒排链构建子模块,用于构建以样本用户特征为左键的倒排链,根据与样本用户特征相关性最高的至少一个推荐信息的数量在倒排链中创建相应数量的节点,每个节点用于表征与样本用户特征相关性最高的一个推荐信息。
在一个可能的实现方式中,转化率偏差确定模块包括:
对应关系确定子模块,用于根据样本用户的历史行为日志和任意一个样本用户特征,建立样本用户的任意一个样本用户特征、点击的推荐信息、点击数、转化数以及预估转化率间的对应关系信息;
交叉信息获取子模块,用于对于历史行为日志涉及的任意一个推荐信息,根据对应关系信息,确定具有任意一个样本用户特征的所有样本用户点击推荐信息后的点击总数、转化总数以及预估转化率均值;
实际转化率获取子模块,用于根据具有任意一个样本用户特征的所有样本用户点击推荐信息时的点击总数和转化总数,获得具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率;
转化率偏差获取子模块,用于根据具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值,获得具有样本用户特征的样本用户点击推荐信息后的转化率偏差。
在一个可能的实现方式中,转化率偏差获取子模块具体用于:将具有任意一个样本用户特征的所有样本用户点击推荐信息后的实际转化率以及预估转化率均值的商,作为具有任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差。
在一个可能的实现方式中,转化率纠偏模块包括:
待处理偏差获取子模块,用于获取与目标用户的所有目标用户特征相关的、具有任意一个目标用户特征的用户点击候选推荐信息后的转化率偏差,作为待处理转化率偏差;
加权平均值计算子模块,用于确定待处理转化率偏差进行加权平均值,作为目标用户点击候选推荐信息后的转化率偏差;
纠偏子模块,用于根据目标用户点击候选推荐信息后的转化率偏差,对目标用户点击候选推荐信息后的转化率进行纠偏。
在一个可能的实现方式中,纠偏子模块具体用于根据目标用户点击候选推荐信息后的转化率偏差与目标用户点击候选推荐信息后的转化率的乘积,获得目标用户点击候选推荐信息的纠偏后的转化率。
本申请实施例中提供了一种电子设备,该电子设备包括:存储器和处理器;至少一个程序,存储于存储器中,用于被处理器执行时,与现有技术相比可实现:通过获取目标用户的目标用户特征,确定与每个目标用户特征相关性最高的推荐信息,作为候选推荐信息,进一步根据候选推荐信息的推荐信息特征,结合目标用户特征获得目标用户点击候选推荐信息后的转化率,通过已获取的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差对目标用户点击候选推荐信息后的转化率进行纠偏,即可获得纠偏后的转化率,由于转化率偏差同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。
在一个可选实施例中提供了一种电子设备,如图9所示,图9所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(FieldProgrammable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscReadOnly Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003用于存储执行本申请方案的应用程序代码,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述方法实施例所示的内容。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与现有技术相比,通过获取目标用户的目标用户特征,确定与每个目标用户特征相关性最高的推荐信息,作为候选推荐信息,进一步根据候选推荐信息的推荐信息特征,结合目标用户特征获得目标用户点击候选推荐信息后的转化率,通过已获取的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差对目标用户点击候选推荐信息后的转化率进行纠偏,即可获得纠偏后的转化率,由于转化率偏差同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。
本申请实施例提供了一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如前述方法实施例所示的内容。与现有技术相比,通过获取目标用户的目标用户特征,确定与每个目标用户特征相关性最高的推荐信息,作为候选推荐信息,进一步根据候选推荐信息的推荐信息特征,结合目标用户特征获得目标用户点击候选推荐信息后的转化率,通过已获取的具有任意一个目标用户特征的用户点击候选推荐信息的转化率偏差对目标用户点击候选推荐信息后的转化率进行纠偏,即可获得纠偏后的转化率,由于转化率偏差同时考虑用户特征和商品两个维度的信息,将实际转化率和预估转化率均同时与用户特征和商品相关联,相比双塔模型忽略了人与推荐信息间的交叉关系的缺陷,能够有效提高转化率的预估精度,从而更精准地向目标用户推荐至少一个推荐信息。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种推荐信息的确定方法,其特征在于,包括:
获取目标用户的至少一个目标用户特征;
对于任意一个目标用户特征,确定与所述任意一个目标用户特征相关性最高的至少一个推荐信息,作为与所述任意一个目标用户特征对应的候选推荐信息;
获取所述候选推荐信息的推荐信息特征,结合所述至少一个目标用户特征,获得所述目标用户点击所述候选推荐信息后的转化率;
根据已获取到的具有所述任意一个目标用户特征的用户点击所述候选推荐信息的转化率偏差,对所述目标用户点击所述候选推荐信息后的转化率进行纠偏,获得所述目标用户点击所述候选推荐信息的纠偏后的转化率,所述转化率偏差是由具有所述任意一个目标用户特征的样本用户点击所述候选推荐信息后的实际转化率和预估转化率获得的;
根据所述纠偏后的转化率对所述候选推荐信息进行排序,根据排序结果从所述候选推荐信息中确定向所述目标用户推荐的至少一个推荐信息。
2.根据权利要求1所述的推荐信息的确定方法,其特征在于,所述确定与所述任意一个目标用户特征相关性最高的至少一个推荐信息,作为候选推荐信息,之前还包括:
获取至少一个样本用户的历史行为日志,根据至少一个样本用户的历史行为日志构建倒排链,所述历史行为日志包括样本用户点击推荐信息后的实际转化行为,所述倒排链以从所述历史行为日志中确定的、所述样本用户的一个用户特征为左键,所述倒排链中的节点用于表征从历史行为日志中确定的、与所述倒排链的左键相关性最高的推荐信息;
所述确定与所述任意一个目标用户特征相关性最高的至少一个推荐信息,作为候选推荐信息,包括:
查找左键为所述任意一个目标用户特征的倒排链,作为目标倒排链;
将所述目标倒排链上的节点表征的推荐信息作为所述候选推荐信息。
3.根据权利要求2所述的推荐信息的确定方法,其特征在于,所述历史行为日志中还包括所述样本用户点击推荐信息后的预估转化率;
所述对所述目标用户点击所述候选推荐信息后的转化率进行纠偏,之前还包括:
根据所述样本用户的任意一个样本用户特征、所述样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有所述任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差;
确定所述以所述任意一个样本用户特征为左键的倒排链中节点表征的推荐信息,将具有所述任意一个样本用户特征的样本用户点击所述节点表征的推荐信息后的转化率偏差,保存至对应节点中;
所述对所述目标用户点击所述候选推荐信息后的转化率进行纠偏,之前还包括:
从所述目标倒排链上的节点中获得具有所述目标用户特征的用户点击所述候选推荐信息后的转化率偏差。
4.根据权利要求2所述的推荐信息的确定方法,其特征在于,所述根据至少一个样本用户的历史行为日志构建倒排链,包括:
对所述至少一个样本用户的历史行为日志进行特征挖掘,获得所述至少一个样本用户的样本用户特征;
将所述样本用户特征输入至预先训练的推荐模型,获得所述推荐模型输出的与所述样本用户特征相关性最高的至少一个推荐信息的信息;
构建以所述样本用户特征为左键的倒排链,根据与所述样本用户特征相关性最高的至少一个推荐信息的数量在所述倒排链中创建相应数量的节点,每个所述节点用于表征与所述样本用户特征相关性最高的一个推荐信息。
5.根据权利要求3所述的推荐信息的确定方法,其特征在于,所述根据所述样本用户的任意一个样本用户特征、所述样本用户点击推荐信息后的预估转化率和实际转化行为,确定具有所述任意一个样本用户特征的样本用户点击推荐信息后的转化率偏差,包括:
根据所述样本用户的历史行为日志和所述任意一个样本用户特征,建立所述样本用户的所述任意一个样本用户特征、点击的推荐信息、点击数、转化数以及预估转化率间的对应关系信息;
对于所述历史行为日志涉及的任意一个推荐信息,根据所述对应关系信息,确定具有所述任意一个样本用户特征的所有样本用户点击所述推荐信息后的点击总数、转化总数以及预估转化率均值;
根据所述具有所述任意一个样本用户特征的所有样本用户点击所述推荐信息时的点击总数和转化总数,获得具有所述任意一个样本用户特征的所有样本用户点击所述推荐信息后的实际转化率;
根据所述具有所述任意一个样本用户特征的所有样本用户点击所述推荐信息后的实际转化率以及预估转化率均值,获得具有所述样本用户特征的样本用户点击所述推荐信息后的转化率偏差。
6.根据权利要求5所述的推荐信息的确定方法,其特征在于,所述根据所述具有所述任意一个样本用户特征的所有样本用户点击所述推荐信息后的实际转化率以及预估转化率均值,获得具有所述任意一个样本用户特征的样本用户点击所述推荐信息后的转化率偏差,包括:
将所述具有所述任意一个样本用户特征的所有样本用户点击所述推荐信息后的实际转化率以及预估转化率均值的商,作为具有所述任意一个样本用户特征的样本用户点击所述推荐信息后的转化率偏差。
7.根据权利要求3所述的推荐信息的确定方法,其特征在于,所述根据已获取到的具有所述任意一个目标用户特征的用户点击所述候选推荐信息的转化率偏差,对所述目标用户点击所述候选推荐信息后的转化率进行纠偏,包括:
获取与所述目标用户的所有目标用户特征相关的、具有所述任意一个目标用户特征的用户点击所述候选推荐信息后的转化率偏差,作为待处理转化率偏差;
确定所述待处理转化率偏差进行加权平均值,作为所述目标用户点击所述候选推荐信息后的转化率偏差;
根据所述目标用户点击所述候选推荐信息后的转化率偏差,对所述目标用户点击所述候选推荐信息后的转化率进行纠偏。
8.根据权利要求7所述的推荐信息的确定方法,其特征在于,所述根据所述目标用户点击所述候选推荐信息后的转化率偏差,对所述目标用户点击所述候选推荐信息后的转化率进行纠偏,包括:
根据所述目标用户点击所述候选推荐信息后的转化率偏差与所述目标用户点击所述候选推荐信息后的转化率的乘积,获得所述目标用户点击所述候选推荐信息的纠偏后的转化率。
9.一种推荐信息的确定装置,其特征在于,包括:
目标用户特征获取模块,用于获取目标用户的至少一个目标用户特征;
候选推荐信息获取模块,用于对于任意一个目标用户特征,确定与所述任意一个目标用户特征相关性最高的至少一个推荐信息,作为与所述任意一个目标用户特征对应的候选推荐信息;
转化率获取模块,用于获取所述候选推荐信息的推荐信息特征,结合所述至少一个目标用户特征,获得所述目标用户点击所述候选推荐信息后的转化率;
转化率纠偏模块,用于根据已获取到的具有所述任意一个目标用户特征的用户点击所述候选推荐信息的转化率偏差,对所述目标用户点击所述候选推荐信息后的转化率进行纠偏,获得所述目标用户点击所述候选推荐信息的纠偏后的转化率,所述转化率偏差是由具有所述任意一个目标用户特征的样本用户点击所述候选推荐信息后的实际转化率和预估转化率获得的;
推荐模块,用于根据所述纠偏后的转化率对所述候选推荐信息进行排序,根据排序结果从所述候选推荐信息中确定向所述目标用户推荐的至少一个推荐信息。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述推荐信息的确定方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至8中任意一项所述推荐信息的确定方法的步骤。
12.一种计算机程序,其特征在于,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如权利要求1-8任一项所述推荐信息的确定方法的步骤。
CN202011414380.5A 2020-12-04 2020-12-04 推荐信息的确定方法、装置、电子设备及存储介质 Pending CN114596109A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011414380.5A CN114596109A (zh) 2020-12-04 2020-12-04 推荐信息的确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011414380.5A CN114596109A (zh) 2020-12-04 2020-12-04 推荐信息的确定方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114596109A true CN114596109A (zh) 2022-06-07

Family

ID=81812230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011414380.5A Pending CN114596109A (zh) 2020-12-04 2020-12-04 推荐信息的确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114596109A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117273821A (zh) * 2023-11-20 2023-12-22 阿里健康科技(杭州)有限公司 电子权益凭证的发放方法、训练方法以及相关装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117273821A (zh) * 2023-11-20 2023-12-22 阿里健康科技(杭州)有限公司 电子权益凭证的发放方法、训练方法以及相关装置
CN117273821B (zh) * 2023-11-20 2024-03-01 阿里健康科技(杭州)有限公司 电子权益凭证的发放方法、训练方法以及相关装置

Similar Documents

Publication Publication Date Title
US11711447B2 (en) Method and apparatus for real-time personalization
US10037543B2 (en) Estimating conversion rate in display advertising from past performance data
US8655695B1 (en) Systems and methods for generating expanded user segments
US8732015B1 (en) Social media pricing engine
US20160188734A1 (en) Method and apparatus for programmatically synthesizing multiple sources of data for providing a recommendation
US20160253325A1 (en) Method and apparatus for programmatically adjusting the relative importance of content data as behavioral data changes
US20180285957A1 (en) Recommendation system associated with an online marketplace
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
US20160285672A1 (en) Method and system for processing network media information
US20080256034A1 (en) System and method for understanding relationships between keywords and advertisements
US11321724B1 (en) Product evaluation system and method of use
CN109299356B (zh) 基于大数据的活动推荐方法、装置、电子设备及存储介质
US10264082B2 (en) Method of producing browsing attributes of users, and non-transitory computer-readable storage medium
US20200098031A1 (en) Product recommending apparatus and non-transitory computer readable medium
CN111798280A (zh) 多媒体信息推荐方法、装置和设备及存储介质
US20140257972A1 (en) Method, computer readable medium and system for determining true scores for a plurality of touchpoint encounters
CN111612560A (zh) 用于促销对象的推荐方法、系统、存储介质及电子设备
US20240177184A1 (en) Self-learning valuation and access to digital content
TWI657395B (zh) 意見領袖之網路交易管理方法、系統以及儲存媒體
Zheng et al. Incorporating price into recommendation with graph convolutional networks
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN114596109A (zh) 推荐信息的确定方法、装置、电子设备及存储介质
US20120265588A1 (en) System and method for recommending new connections in an advertising exchange
CN115204943A (zh) 一种广告召回方法、装置、设备以及存储介质
US20110208738A1 (en) Method for Determining an Enhanced Value to Keywords Having Sparse Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination