CN107424016B - 一种在线招聘广告推荐的实时竞价方法及其系统 - Google Patents

一种在线招聘广告推荐的实时竞价方法及其系统 Download PDF

Info

Publication number
CN107424016B
CN107424016B CN201710678426.6A CN201710678426A CN107424016B CN 107424016 B CN107424016 B CN 107424016B CN 201710678426 A CN201710678426 A CN 201710678426A CN 107424016 B CN107424016 B CN 107424016B
Authority
CN
China
Prior art keywords
advertisement
information
model
job seeker
bidding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710678426.6A
Other languages
English (en)
Other versions
CN107424016A (zh
Inventor
谢莹
汪欣梅
杨培全
苏延森
张磊
程凡
邱剑锋
许荣斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN201710678426.6A priority Critical patent/CN107424016B/zh
Publication of CN107424016A publication Critical patent/CN107424016A/zh
Application granted granted Critical
Publication of CN107424016B publication Critical patent/CN107424016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0273Determination of fees for advertising
    • G06Q30/0275Auctions

Abstract

本发明公开了一种在线招聘广告推荐的实时竞价方法及其系统。所述方法提出了一个基于多目标优化参数更新的自动编码器(AutoEncoder)集成技术来设计实时竞价广告推荐策略。由此形成的系统为在线求职人员提供更方便、更快捷、更精确的职位广告推荐。同时,系统可以在多平台(手机、电脑、iPad)上提供同样水准的优质服务。系统在职位广告推荐精确度和平台多样性上有较好的效果,求职人员可以得到更精准的职位选择,广告主可以寻找到符合公司需求的员工,本系统可以获得更多广告主投资,最终实现多方利益最大化。

Description

一种在线招聘广告推荐的实时竞价方法及其系统
技术领域
本发明涉及神经网络深度学习领域中的一种实时竞价系统,尤其涉及一种在线招聘广告推荐的实时竞价方法及其系统。
背景技术
随着经济的快速发展,社会就业竞争越来越激烈。很多求职人员通过人才市场的招聘,以及各媒体广告的宣传等方式找到适合自己的工作岗位。虽然这些方式在一些岗位上可以取得好的效果,但是很难适应社会大量求职人员的需求。如今,随着互联网应用以及大数据技术的快速发展,广告经常出现在多种网站或移动设备上,使得当今的广告推广方式比传统的广告推广方式更方便、更快捷。实时竞价在线广告在互联网广告推广中占据越来越大的比重,大幅度提高了广告营销的实际效果。
传统的互联网广告生态链一般最多只有三方,分别是广告主、广告代理商以及互联网媒体。而在实时竞价广告交易模式中,原有的广告生态链发生了变化,整个生态链包括广告主、广告需求平台、广告交易平台以及互联网媒体四个主体。广告主将自己的广告需求投放到广告需求平台上,互联网媒体将自己的广告流量资源放到广告交易平台,广告需求平台通过与广告交易平台的技术对接完成竞价购买。
现有广告推荐技术中大多使用聚类、协同过滤等方法对模型进行训练,例如基于层次聚类的方法需要存储相似度矩阵,不适合处理较大规模的数据;基于密度的聚类算法对簇群密度相差较大的数据聚类效果不佳;基于协同过滤方法难以对稀疏广告数据进行精确的匹配推荐,并且对于新加的广告数据,系统计算负荷量将增大。
中国专利说明书CN-104063801公开了一种基于聚类的移动广告推荐方法,根据用户簇群的特征在移动广告投放平台中进行查询,找出与用户簇群相匹配的广告类别并将其加入到该用户广告推荐序列中。由于用户簇群密度的不一致性,该聚类方法不能取得较好的效果。
中国专利说明书CN-106095841公开了一种基于协同过滤的移动互联网广告推荐方法,通过用户兴趣相似度和用户行为轨迹相似度进行广告推荐。考虑到网上用户数据的稀疏性,协同过滤方法难以实现用户和广告之间的精确匹配。
发明内容
针对现有技术中的一些不足,本发明提供了一种在线招聘广告推荐的实时竞价方法及其系统,其属于一个利用多目标优化算法进行参数更新的自动编码器(AutoEncoder)集成策略,通过特征选择方法和多目标优化算法对自动编码器参数进行更新,学习求职人员和广告信息特征,实现求职人员信息和广告信息的精确匹配;具体地说是一个基于多目标优化参数更新的自动编码器集成技术来设计实时竞价广告推荐策略,训练多个自动编码器,从而实现在线广告推荐系统拥有更高的精确度和更好的多平台适应性。
本发明的解决方案是:一种在线招聘广告推荐的实时竞价方法;其包括以下步骤:
步骤1、求职人员登录网页,广告供应平台通过求职人员ID在与所述广告供应平台相对应的求职人员信息数据库中搜索并获取求职人员信息特征集合;
步骤2、广告供应平台将求职人员的信息特征集合传送到广告交易平台,广告交易平台发送包含求职人员信息特征集合的竞价请求信号到广告需求平台;
步骤3、广告需求平台根据竞价请求信号搜索匹配的广告信息特征集合;
步骤4、广告交易平台对求职人员信息特征集合和广告信息特征集合进行匹配竞价:将参与竞价的广告主的广告信息特征集合与求职人员信息特征集合结合生成广告点击记录,将广告点击记录分别存储到线下广告点击记录数据库和在线广告点击记录数据库;
步骤5、数据处理模型:将线下广告点击记录数据库的广告点击记录输入到数据处理模型中进行数据处理并更新,将在线广告点击记录数据库中广告点击记录输入数据处理模型进行数据处理;
步骤6、基于多目标优化参数更新自动编码器集成模型MO-AE,将所有经过数据处理模型处理的带有标签的线下广告点击记录输入到MO-AE模型,更新MO-AE模型,将经过数据处理模型处理的线上广告点击记录输入MO-AE模型中,进行对应广告点击记录标签预测;
步骤7、广告供应平台根据MO-AE模型对线上广告点击记录标签预测为1的广告点击记录,得到对应广告信息特征,进行网页广告投放和求职人员在线广告推荐。
作为上述方案的进一步改进,在步骤1中,包括以下步骤:
步骤1.1:通过新求职人员注册ID,形成相应求职人员信息特征集合,将新求职人员注册的ID和新求职人员的信息特征集合存储到求职人员信息数据库中;
步骤1.2:已注册求职人员登录网页,已注册求职人员的ID被传递给广告供应平台;
步骤1.3:广告供应平台根据已注册求职人员的ID,从求职人员信息数据库中搜索并获取求职人员信息特征。
作为上述方案的进一步改进,在步骤3中,包括以下步骤:
步骤3.1:新的广告主投放广告,其广告的信息特征集合存储到与广告需求平台相对应的广告主信息数据库中;
步骤3.2:广告需求平台收到广告交易平台的竞价请求信号时,向广告主信息数据库发送广告搜索信号:根据求职人员信息特征集合在广告主信息数据库中寻找匹配的广告信息特征集合;
步骤3.3:广告主信息数据库将匹配到的广告信息特征集合传递到广告需求平台;
步骤3.4:广告需求平台将匹配到的广告信息特征集合传送到广告交易平台。
作为上述方案的进一步改进,在步骤4中,包括以下步骤:
步骤4.1:广告交易平台将求职人员信息特征集合和广告信息特征集合传递到广告交易平台内部的竞价引擎;
步骤4.2:竞价引擎根据广告主需求对求职人员信息特征集合和广告信息特征集合进行匹配,并将匹配信息传送给广告主服务器;
步骤4.3:广告主通过广告主服务器根据匹配结果参与竞价,然后将竞价结果返回到广告交易平台;
步骤4.4:广告交易平台将参与竞价的广告主的广告信息特征集合与求职人员信息特征集合结合生成广告点击记录,将广告点击记录分别存储到线下广告点击记录数据库和在线广告点击记录数据库,并传递到数据处理模型中。
作为上述方案的进一步改进,在步骤5中,包括以下步骤:
步骤5.1:将线下广告点击记录数据库的广告点击记录输入到数据处理模型中进行独热编码和特征选择,更新数据处理模型;
步骤5.2:将在线广告点击记录数据库中所有广告点击记录输入到数据处理模型中进行独热编码,选取与线下广告点击记录选取的D个特征对应的D个特征,生成线上广告点击记录;
步骤5.3:数据处理模型将经过数据模型处理的线上广告点击记录和带有标签的线下广告点击记录输入到MO-AE模型。
作为上述方案的进一步改进,广告点击记录数据经过独热编码处理后,数据变得稀疏,通过特征选择的方法过滤,降低数据冗余。
作为上述方案的进一步改进,定义求职人员信息特征集合
Figure BDA0001374884340000041
其中μ,c∈N+
Figure BDA0001374884340000042
表示第μ个求职人员的第c个信息特征;n为求职人员的信息特征的总数;定义广告信息特征集合
Figure BDA0001374884340000043
其中d,e∈N+
Figure BDA0001374884340000044
表示第d个广告的第e个信息特征,m为广告的信息特征的总数;考虑到求职人员存在对多个广告进行点击可能性,将第μ个求职人员的信息特征和第d个广告的信息特征合并形成一条点击记录,且定义广告点击记录Xi={xi1,xi2,…xiq,…xiM},其中1≤i≤E,xiq表示第i个广告点击记录的第q个信息特征,E表示广告点击记录的样本总数,M表示一条广告点击记录的信息特征总数;定义yi为第i个广告点击记录的标签,当yi=1时表示相应广告被点击,yi=0表示相应广告没有被点击;定义广告主竞价信息按降序排列形成R={r1,r2,…rP,…ru},rP表示第P个广告主竞价金额,u表示参与竞价的广告主总数目;在步骤6中,包括以下步骤:
步骤6.1:将所有经过数据模型处理的带有标签的线下广告点击记录输入到MO-AE模型并更新MO-AE模型;
步骤6.2:初始化种群及MO-AE模型中各参数值;
步骤6.3:为H个自动编码器产生均匀分布的随机权重向量{w1,w2,…,wh…,wH},其中h∈{1,2,…,H},
Figure BDA0001374884340000051
表示第h个自动编码器的权重,对于任意一个wh,有L个比较相近的数值(L≤H);
步骤6.4:进化算法
在第g(g=1,2,3...,G)次迭代中随机从L中随机抽取两个权重wj,wk及其对应的候选集
Figure BDA0001374884340000052
经过交叉变异得到:
Figure BDA0001374884340000053
其中F为缩放因子,一般在[0,2]之间选择,rndg(0,1)表示第g代时,在[0,1]之间服从均匀分布随机数;
初始化V*=V(v1)
Figure BDA0001374884340000054
Figure BDA0001374884340000055
替代
Figure BDA0001374884340000056
其中
Figure BDA0001374884340000057
步骤6.4.1交叉变异后第g+1代候选集个数为H;
步骤6.5:更新种群;
若V(vg)>V(vg+1),则V*=V(vg+1),vg+1替代vg,其中vg,vg+1分别表示第g代和第g+1代种群;
步骤6.5.1:到达第G代时,记录V*值,以及种群vG
步骤6.6:将种群vG中候选集输入集成自动编码器,计算ave(i);
步骤6.6.1:将在线广告点击记录输入MO-AE模型中,如果ave(i)>0.5,则第i个在线广告点击记录经过MO-AE模型后,输出预测广告点击记录标签值为yi=1的广告信息特征;
步骤6.7:MO-AE模型将输出为1所对应的广告信息特征传送到广告供应平台。
进一步地,在步骤7中,包括以下步骤:
步骤7.1:广告供应平台接受到MO-AE模型传送来的广告信息特征;
步骤7.1.1:广告供应平台将广告信息传送到网页播放;
步骤7.2:广告播放;
设置播放周期为Z,考虑到竞价金额对广告播放时间的调控,则第一个广告投放在页面的时间为
Figure BDA0001374884340000061
以此类推可得t2,t3,…tQ
步骤7.2.1:网页按照t1,t2,t3,…tQ时间轮流播放广告;
步骤7.3:投放到页面的广告,根据求职人员是否点击生成对应的真实标签,存储到线下广告点击记录数据库中。
本发明还提供一种在线招聘广告推荐的实时竞价系统,其采用上述任意在线招聘广告推荐的实时竞价方法,所述实时竞价系统包括:
求职人员信息特征集合模块,其用于在求职人员登录网页时,广告供应平台通过求职人员ID在与所述广告供应平台相对应的求职人员信息数据库中搜索并获取求职人员信息特征集合;
竞价请求信号模块,其用于在广告供应平台将求职人员的信息特征集合传送到广告交易平台时,广告交易平台发送包含求职人员信息特征集合的竞价请求信号到广告需求平台;
搜索匹配模块,其用于广告需求平台根据竞价请求信号搜索匹配的广告信息特征集合;
广告点击记录模块,其用于使广告交易平台对求职人员信息特征集合和广告信息特征集合进行匹配竞价:将参与竞价的广告主的广告信息特征集合与求职人员信息特征集合结合生成广告点击记录,将广告点击记录存储到线下广告点击记录数据库;
数据处理模块,其用于将线下广告点击记录数据库的广告点击记录输入到数据处理模型中,对广告点击记录进行数据处理并对数据处理模型进行更新。将在线广告点击记录数据库中广告点击记录输入数据处理模型进行数据处理;
自动编码器集成模块,其用于将所有经过数据处理模型处理的带有标签的线下广告点击记录输入到MO-AE模型并更新MO-AE模型,将经过数据处理模型处理的线上广告点击记录输入MO-AE模型,进行对应广告点击记录标签预测;
推荐及投放模块,其用于广告供应平台根据MO-AE模型对线上广告点击记录标签预测为1的广告点击记录,得到对应广告信息特征,进行网页广告投放和求职人员在线广告推荐。
本发明还提供一种存储介质,其存储有与上述任意在线招聘广告推荐的实时竞价方法相对应的指令。
本发明提出的在线招聘广告推荐是利用实时竞价广告的特点,运用第三方技术在大量的网站上针对每一个求职人员登陆网页行为进行评估以及出价的实时竞价系统。一般的广告竞价技术采用大量购买投放频次的方式,而本发明系统规避了与求职人员需求不匹配的招聘广告,可以为求职人员提供合适的广告推荐,缩短求职人员寻找工作的时间以及有针对性地找到合适岗位,广告主可以寻找到符合公司需求的员工。对于本发明系统来说,有效的求职人员广告推荐为本发明系统吸引更多的广告主进行投资,最终会获得更多广告投放所带来的流量变现等收益。
与现有技术相比,本发明有益效果体现在:
1、本发明运用自动编码器训练模型,有较强的非线性映射能力。多层自动编码器可以以高精度逼近非线性连续函数,有较强处理复杂问题的能力。在本发明中能够很好地处理求职人员和广告主之间的映射关系。
2、本发明使用了一种特征选择方法,根据每条广告点击记录的特征,对每条广告点击记录中各特征的数值进行加权赋值。然后,分别求得广告点击记录标签为1和0的广告点击记录中同一特征的数值之和。最终,选出两类标签同一特征的数值之和差值的绝对值较大(即影响力较大)的前D个特征。该方法降低了数据冗余和MO-AE模型的复杂度。
3、本发明通过集成的方法对多个自动编码器进行集成,再利用多目标进化算法对自动编码器参数进行优化更新,使得MO-AE模型的精确度更优于单个自动编码器,并且增加模型的泛化能力,使其更加适应在线广告推荐的多平台性。
附图说明
图1是本发明的方法所采用的MO-AE流程图。
图2是本发明的方法所采用的数据处理模型流程图。
图3是本发明的方法所采用的整体流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在实施例中,一种基于多目标优化参数更新的自动编码器(AutoEncoder)集成技术将实时竞价广告推荐问题转化成多目标形式,提升了广告推荐的精确度、实现最大程度的流量变现,从而实现现实生活中本发明系统对求职人员的精准广告投放,实现求职人员、本发明系统、广告主三方利益最大化。
请结合图1、图2、图3,定义求职人员信息特征(如:性别、爱好、求职岗位、年龄、薪资等)
Figure BDA0001374884340000091
其中μ,c∈N+(正整数),
Figure BDA0001374884340000092
表示第μ个求职人员的第c个特征;n为求职人员信息特征的总数;定义广告信息特征
Figure BDA0001374884340000093
其中d,e∈N+(正整数),
Figure BDA0001374884340000094
表示第d个广告的第e个特征,m为广告信息特征的总数;考虑到求职人员可能对多个广告进行点击,本发明系统将第μ个求职人员信息特征和第d个广告信息特征合并形成一条点击记录。定义广告点击记录Xi={xi1,xi2,…xiq,…xiM},其中1≤i≤E,xiq表示第i个广告点击记录的第q个特征,E表示广告点击记录样本总数,M表示一条广告点击记录的信息特征总数。定义yi为第i个广告点击记录标签,当yi=1时表示广告被点击,yi=0表示广告没有被点击。举例而言,有求职人员信息特征p1,p2和广告信息特征A1,A2,A3,求职人员信息特征p1和广告信息特征A2结合可以生成一条广告点击记录。
本发明的在线招聘广告推荐的实时竞价方法,包括以下步骤。
步骤1、求职人员登录网页,广告供应平台通过求职人员ID(如:账号、身份识别码等)搜索求职人员数据库获得求职人员信息特征。
定义求职人员信息特征
Figure BDA0001374884340000095
其中μ,c∈N+(正整数),
Figure BDA0001374884340000096
表示第μ个求职人员的第c个特征;n为求职人员信息特征的总数。
步骤1.1:新求职人员注册ID,录入其信息特征,将其ID和求职人员信息特征存储到求职人员信息数据库。
步骤1.2:已注册求职人员登录网页,其ID被传递给广告供应平台。
步骤1.3:广告供应平台根据求职人员ID,从求职人员信息数据库搜索到对应求职人员信息特征。
步骤2、广告供应平台将求职人员信息特征传送到广告交易平台。
步骤2.1广告交易平台收到求职人员信息特征,发送竞价请求信号到广告需求平台。
步骤3、广告需求平台搜索广告信息特征。
定义广告信息特征
Figure BDA0001374884340000101
其中d,e∈N+(正整数),
Figure BDA0001374884340000102
表示第d个广告的第e个特征,m为广告信息特征的总数。
步骤3.1:新的广告主投放广告,其广告信息特征存储到广告主信息数据库。
步骤3.2:广告需求平台收到广告交易平台的竞价请求信号时,向广告主信息数据库发送广告搜索信号。
步骤3.3:广告主信息数据库将广告信息特征传递到广告需求平台。
步骤3.4:广告需求平台将广告信息特征传送到广告交易平台。
步骤4、广告交易平台对求职人员信息特征和广告信息特征进行匹配竞价。
定义广告主竞价信息按降序排列形成R={r1,r2,…rp,…ru},rp表示第p个广告主竞价金额,u表示参与竞价的广告主总数目。
步骤4.1:广告交易平台将求职人员信息特征和广告信息特征传递到广告交易平台内部的竞价引擎。
步骤4.2:竞价引擎根据广告主需求对求职人员信息特征和广告信息特征进行匹配,并将匹配信息传送给广告主服务器。
步骤4.3:广告主通过广告主服务器根据匹配结果参与竞价,然后将竞价结果返回到广告交易平台。
步骤4.4:广告交易平台将参与竞价的广告主的广告信息与求职人员信息特征结合生成广告点击记录,将线上广告点击记录存储到线下广告点击记录数据库和在线广告点击记录数据库,并传递到数据处理模型中。
步骤5、数据处理模型。
定义:Xi={xi1,xi2,…xiq,…xiM},其中1≤i≤E,xiq表示第i个点击记录的第q个特征,E表示广告点击记录样本总数,M表示一条广告点击记录的信息特征总数。定义yi为第i个广告点击记录标签,当yi=1时表示广告被点击,yi=0表示广告没有被点击。将线下广告数据库和线下广告数据库的广告点击记录输入到数据处理模型中。
步骤5.1:将线下广告点击记录数据库中所有带标签的广告点击记录输入到数据处理模型对数据处理模型更新。
步骤5.2:对广告点击记录进行独热编码(One-Hot Encoding)
目前常见的分类器模型(如:SVM(支持向量机)、Softmax分类器等)往往默认数据是连续并且有序的。但在本发明中涉及到的求职人员信息特征及广告信息特征均是离散型的。为了解决这一问题,本发明采用了独热编码(One-Hot Encoding)。独热编码又称一位有效编码,其方法是使用K维状态寄存器来对K个状态进行编码,每个状态都有它的独立寄存器,且任意时候只有一位有效。对于任一个特征,如果有Π个可能值,那么经过独热编码以后,就变成了Π个二元特征,且这些特征互斥,每次只能激活一个。
步骤5.2.1举例
如果Xi={xi1,xi2,…xiq,…xiM}中,xi1表示性别{男,女},xi2表示学历{小学,中学,高中,大学,研究生,博士}。
对于xi1特征有两个可能值,分别是男,女,有两个不同分类值(即,2个二元特征),经过第一维状态寄存器对xi1特征进行独热编码,男性用{10}表示,则女性用{01}表示。
对于xi2特征有六个可能值,分别是小学,中学,高中,大学,研究生,博士,有六个不同分类值(即,6个二元特征),经过第二维状态寄存器对xi2特征进行独热编码:
小学{000001}
中学{000010}
高中{000100}
大学{001000}
研究生{010000}
博士{100000}
假如一条广告记录X2,x21,x22分别是男性,研究生,那么两特征结合为{10010000},以此类推可对x23,x24,…x2M进行编码。最终使用M维状态寄存器来对M个特征进行编码,结合生成一条经过独热编码的广告点击记录。
步骤5.3:对广告点击记录进行特征选择。
广告点击记录数据经过独热编码处理后,数据变得稀疏。通过特征选择的方法过滤一些影响力较小的特征,降低数据冗余。
输入:全部的广告点击记录X,期望取得D个特征,其中D≤M。
所有广告点击记录写成
Figure BDA0001374884340000121
其中,E表示广告点击记录样本总数。
步骤5.3.1X行求和
Figure BDA0001374884340000122
步骤5.3.2通过遍历找出sum中元素最大值
count=0,1≤i≤E
如果sum(i)>count那么count=sum(i)
得最终count
步骤5.3.3每条广告点击记录产生一个随机数1≤i≤E
如果
Figure BDA0001374884340000123
如果
Figure BDA0001374884340000124
Ti表示第i个加入随机数的广告点击记录Ti=σ{xi1,xi2,…xiq,…xiM},其中1≤q≤M,1≤i≤E,xiq表示第i个点击记录的第q个特征,rnd(0,0.5)表示在[0,0.5]之间服从均匀分布随机数。
步骤5.3.4选取D(D<M)个特征,1≤i≤E。
Figure BDA0001374884340000125
Figure BDA0001374884340000126
Figure BDA0001374884340000131
表示被点击的所有广告点击记录Ti的第q个特征的数值之和,Y表示广告被点击。
Figure BDA0001374884340000132
Figure BDA0001374884340000133
Figure BDA0001374884340000134
表示没被点击的所有广告点击记录Ti的第q个特征的数值之和,U表示广告没有被点击。
Figure BDA0001374884340000135
按J从大到小降序排列,提取前D个特征,得:
Xi′={x1,x2,…xD}
步骤5.4:将线上广告点击记录数据库中广告点击记录输入到数据处理模型,经过独热编码,选取与线下广告点击记录选取的D个特征对应的D个特征,生成线上广告点击记录。
步骤5.5:数据处理模型将经过数据模型处理的线上广告点击记录和带有标签的线下广告点击记录输入到MO-AE模型。
步骤6、基于多目标优化(Multi-objective Optimization)参数更新的自动编码器(AutoEncoder)集成模型。
定义:MO-AE模型,是一个基于多目标优化(Multi-objective Optimization)参数更新的自动编码器(AutoEncoder)集成模型。
定义:设置多层自动编码器,分别是输入层、多层隐藏层、输出层。
定义:H为自动编码器个数
定义:Minimize:
Figure BDA0001374884340000136
其中,h表示集成模型中第h个自动编码器,
Figure BDA0001374884340000137
表示第h个自动编码器的第i个广告点击记录的真实输出值,Errh表示第h个自动编码器的误差函数,E表示广告点击记录总体样本,yi表示第i个广告点击记录标签。
定义:
Figure BDA0001374884340000138
其中ave(i)表示所有自动编码器第i个广告点击记录真实输出的平均值。
Figure BDA0001374884340000141
定义:
Figure BDA0001374884340000142
其中V(v)表示MO-AE模型的目标函数,
Figure BDA0001374884340000143
表示第g代种群的第h个候选集,
Figure BDA0001374884340000144
分别表示两个函数Err(v)、Div(v)的权重值。
步骤6.1:将所有经过数据模型处理的带有标签的线下广告点击记录输入到MO-AE模型对模型进行更新。
步骤6.2:初始化种群及MO-AE模型中各参数值;
定义:L:领域大小
G:最大迭代次数
通过随机抽样产生第一代初始化种群
Figure BDA0001374884340000145
其中
Figure BDA0001374884340000146
表示第一代中第h个自编码器的候选集。
Figure BDA0001374884340000147
包含第h个自编码器中所有参数,包括隐藏层数ηh、第t个隐藏层神经元个数
Figure BDA0001374884340000148
权重
Figure BDA0001374884340000149
偏置项
Figure BDA00013748843400001410
学习速率αh,即
Figure BDA00013748843400001411
步骤6.3:为H个自动编码器产生均匀分布的随机权重向量{w1,w2,…,wh…,wH},其中h∈{1,2,…,H},
Figure BDA00013748843400001412
表示第h个自动编码器的权重,对于任意一个wh,有L个比较相近的数值(L≤H)。
步骤6.4:进化算法
在第g(g=1,2,3...,G)次迭代中随机从L中随机抽取两个权重wj,wk及其对应的候选集
Figure BDA00013748843400001413
经过交叉变异得到:
Figure BDA00013748843400001414
其中F为缩放因子,一般在[0,2]之间选择,rndg(0,1)表示第g代时,在[0,1]之间服从均匀分布随机数。
初始化V*=V(v1)
Figure BDA0001374884340000151
Figure BDA0001374884340000152
替代
Figure BDA0001374884340000153
其中
Figure BDA0001374884340000154
步骤6.4.1交叉变异后第g+1代候选集个数为H。
步骤6.5:更新种群;
若V(vg)>V(vg+1),则V*=V(vg+1),vg+1替代vg,其中vg,vg+1分别表示第g代和第g+1代种群。
步骤6.5.1:到达第G代时,记录V*值,以及种群vG
步骤6.6:将种群vG中候选集输入集成自动编码器,计算ave(i)。
步骤6.6.1:将在线广告点击记录输入MO-AE模型中,如果ave(i)>0.5,则第i个在线广告点击记录经过MO-AE模型后,输出预测广告点击记录标签值为yi=1的广告信息特征。
步骤6.7:MO-AE模型将输出为1所对应的广告信息特征传送到广告供应平台。
步骤7、广告供应平台在线广告推荐以及广告投放:
当在线求职人员登录时,经广告交易平台将求职人员信息特征和广告信息特征合并成广告点击记录并且按照广告主竞价高低降序排列。再经过数据处理模型形成Xi′={x1,x2,…,xD},其中i∈{1,2,…,u},u表示参与广告竞价的广告主总数。将数据处理模型处理后的在线广告点击记录输入MO-AE模型,经MO-AE模型推荐Q个广告(即,Q个预测标签输出为1的广告点击记录)以供求职人员点击。
步骤7.1:广告供应平台接受到MO-AE模型传送来的广告信息特征。
步骤7.1.1:广告供应平台将广告信息传送到网页播放。
步骤7.2:广告播放
设置播放周期为Z,考虑到竞价金额对广告播放时间的调控,则第一个广告投放在页面的时间为
Figure BDA0001374884340000155
以此类推可得t2,t3,…tQ
步骤7.2.1:网页按照t1,t2,t3,…tQ时间轮流播放广告。
步骤7.3:投放到页面的广告,根据求职人员是否点击生成对应的真实标签,存储到线下广告点击记录数据库中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种在线招聘广告推荐的实时竞价方法;其特征在于;其包括以下步骤:
步骤1、求职人员登录网页,广告供应平台通过求职人员ID在与所述广告供应平台相对应的求职人员信息数据库中搜索并获取求职人员信息特征集合;
步骤2、广告供应平台将求职人员的信息特征集合传送到广告交易平台,广告交易平台发送包含求职人员信息特征集合的竞价请求信号到广告需求平台;
步骤3、广告需求平台根据竞价请求信号搜索匹配的广告信息特征集合;
步骤4、广告交易平台对求职人员信息特征集合和广告信息特征集合进行匹配竞价:将参与竞价的广告主的广告信息特征集合与求职人员信息特征集合结合生成广告点击记录,将广告点击记录分别存储到线下广告点击记录数据库和在线广告点击记录数据库;
步骤5、数据处理模型:将线下广告点击记录数据库的广告点击记录输入到数据处理模型中进行数据处理并更新,将在线广告点击记录数据库中广告点击记录输入数据处理模型进行数据处理;
步骤6、基于多目标优化参数更新自动编码器集成模型MO-AE,将所有经过数据处理模型处理的带有标签的线下广告点击记录输入到MO-AE模型,更新MO-AE模型,将经过数据处理模型处理的线上广告点击记录输入MO-AE模型中,进行对应广告点击记录标签预测,具体步骤为:
定义:MO-AE模型,是一个基于多目标优化(Multi-objective Optimization)参数更新的自动编码器(AutoEncoder)集成模型;
定义:设置多层自动编码器,分别是输入层、多层隐藏层、输出层;
定义:H为自动编码器个数
定义:Minimize:
Figure FDA0002659609700000011
其中,h表示集成模型中第h个自动编码器,
Figure FDA0002659609700000012
表示第h个自动编码器的第i个广告点击记录的真实输出值,Errh表示第h个自动编码器的误差函数,E表示广告点击记录总体样本,yi表示第i个广告点击记录标签;
定义:Minimize:
Figure FDA0002659609700000021
其中ave(j)表示所有自动编码器第i个广告点击记录真实输出的平均值;
Figure FDA0002659609700000022
定义:Minimize:
Figure FDA0002659609700000023
其中V(v)表示MO-AE模型的目标函数,
Figure FDA0002659609700000024
表示第g代种群的第h个候选集,
Figure FDA0002659609700000025
分别表示两个函数Err(v)、Div(v)的权重值;
步骤6.1:将所有经过数据模型处理的带有标签的线下广告点击记录输入到MO-AE模型对模型进行更新;
步骤6.2:初始化种群及MO-AE模型中各参数值;
定义:L:领域大小
G:最大迭代次数
通过随机抽样产生第一代初始化种群
Figure FDA0002659609700000026
其中
Figure FDA0002659609700000027
表示第一代中第h个自编码器的候选集,
Figure FDA0002659609700000028
包含第h个自编码器中所有参数,包括隐藏层数ηh、第t个隐藏层神经元个数
Figure FDA0002659609700000029
权重
Figure FDA00026596097000000210
偏置项
Figure FDA00026596097000000211
学习速率αh,即
Figure FDA00026596097000000212
步骤6.3:为H个自动编码器产生均匀分布的随机权重向量{w1,w2,…,wh…,wH},其中h∈{1,2,…,H},
Figure FDA00026596097000000213
表示第h个自动编码器的权重,对于任意一个wh,有L个比较相近的数值(L≤H);
步骤6.4:进化算法
在第g(g=1,2,3...,G)次迭代中随机从L中随机抽取两个权重wj,wk及其对应的候选集
Figure FDA00026596097000000214
经过交叉变异得到:
Figure FDA00026596097000000215
其中F为缩放因子,在[0,2]之间选择,rndg(0,1)表示第g代时,在[0,1]之间服从均匀分布随机数;
初始化V*=V(v1)
Figure FDA0002659609700000031
Figure FDA0002659609700000032
替代
Figure FDA0002659609700000033
其中
Figure FDA0002659609700000034
步骤6.4.1交叉变异后第g+1代候选集个数为H;
步骤6.5:更新种群;
若V(vg)>V(vg+1),则V*=V(vg+1),vg+1替代vg,其中vg,vg+1分别表示第g代和第g+1代种群;
步骤6.5.1:到达第G代时,记录V*值,以及种群vG
步骤6.6:将种群vG中候选集输入集成自动编码器,计算ave(i);
步骤6.6.1:将在线广告点击记录输入MO-AE模型中,如果ave(i)>0.5,则第i个在线广告点击记录经过MO-AE模型后,输出预测广告点击记录标签值为yi=1的广告信息特征;
步骤6.7:MO-AE模型将输出为1所对应的广告信息特征传送到广告供应平台;
步骤7、广告供应平台根据MO-AE模型对线上广告点击记录标签预测为1的广告点击记录,得到对应广告信息特征,进行网页广告投放和求职人员在线广告推荐。
2.如权利要求1所述的在线招聘广告推荐的实时竞价方法,其特征在于:在步骤1中,包括以下步骤:
步骤1.1:通过新求职人员注册ID,形成相应求职人员信息特征集合,将新求职人员注册的ID和新求职人员的信息特征集合存储到求职人员信息数据库中;
步骤1.2:已注册求职人员登录网页,已注册求职人员的ID被传递给广告供应平台;
步骤1.3:广告供应平台根据已注册求职人员的ID,从求职人员信息数据库中搜索并获取求职人员信息特征。
3.如权利要求1所述的在线招聘广告推荐的实时竞价方法,其特征在于:在步骤3中,包括以下步骤:
步骤3.1:新的广告主投放广告,其广告的信息特征集合存储到与广告需求平台相对应的广告主信息数据库中;
步骤3.2:广告需求平台收到广告交易平台的竞价请求信号时,向广告主信息数据库发送广告搜索信号:根据求职人员信息特征集合在广告主信息数据库中寻找匹配的广告信息特征集合;
步骤3.3:广告主信息数据库将匹配到的广告信息特征集合传递到广告需求平台;
步骤3.4:广告需求平台将匹配到的广告信息特征集合传送到广告交易平台。
4.如权利要求1所述的在线招聘广告推荐的实时竞价方法,其特征在于:在步骤4中,包括以下步骤:
步骤4.1:广告交易平台将求职人员信息特征集合和广告信息特征集合传递到广告交易平台内部的竞价引擎;
步骤4.2:竞价引擎根据广告主需求对求职人员信息特征集合和广告信息特征集合进行匹配,并将匹配信息传送给广告主服务器;
步骤4.3:广告主通过广告主服务器根据匹配结果参与竞价,然后将竞价结果返回到广告交易平台;
步骤4.4:广告交易平台将参与竞价的广告主的广告信息特征集合与求职人员信息特征集合结合生成广告点击记录,将广告点击记录分别存储到线下广告点击记录数据库和在线广告点击记录数据库,并传递到数据处理模型中。
5.如权利要求1所述的在线招聘广告推荐的实时竞价方法,其特征在于:在步骤5中,包括以下步骤:
步骤5.1:将线下广告点击记录数据库的广告点击记录输入到数据处理模型中进行独热编码和特征选择,更新数据处理模型;
步骤5.2:将在线广告点击记录数据库中所有广告点击记录输入到数据处理模型中进行独热编码,选取与线下广告点击记录选取的D个特征对应的D个特征,生成线上广告点击记录;
步骤5.3:数据处理模型将经过数据模型处理的线上广告点击记录和带有标签的线下广告点击记录输入到MO-AE模型。
6.如权利要求1所述的在线招聘广告推荐的实时竞价方法,其特征在于:广告点击记录数据经过独热编码处理后,数据变得稀疏,通过特征选择的方法过滤,降低数据冗余。
7.如权利要求1所述的在线招聘广告推荐的实时竞价方法,其特征在于:定义求职人员信息特征集合
Figure FDA0002659609700000051
其中μ,c∈N+
Figure FDA0002659609700000052
表示第μ个求职人员的第c个信息特征;n为求职人员的信息特征的总数;定义广告信息特征集合
Figure FDA0002659609700000053
其中d,e∈N+
Figure FDA0002659609700000054
表示第d个广告的第e个信息特征,m为广告的信息特征的总数;考虑到求职人员存在对多个广告进行点击可能性,将第μ个求职人员的信息特征和第d个广告的信息特征合并形成一条点击记录,且定义广告点击记录Xi={xi1,xi2,…xiq,…xiM},其中1≤i≤E,xiq表示第i个广告点击记录的第q个信息特征,E表示广告点击记录的样本总数,M表示一条广告点击记录的信息特征总数;定义yi为第i个广告点击记录的标签,当yi=1时表示相应广告被点击,yi=0表示相应广告没有被点击;定义广告主竞价信息按降序排列形成R={r1,r2,…rP,…ru},rP表示第P个广告主竞价金额,u表示参与竞价的广告主总数目。
8.如权利要求7所述的在线招聘广告推荐的实时竞价方法,其特征在于:在步骤7中,包括以下步骤:
步骤7.1:广告供应平台接受到MO-AE模型传送来的广告信息特征;
步骤7.1.1:广告供应平台将广告信息传送到网页播放;
步骤7.2:广告播放;
设置播放周期为Z,考虑到竞价金额对广告播放时间的调控,则第一个广告投放在页面的时间为
Figure FDA0002659609700000061
以此类推可得t2,t3,…tQ
步骤7.2.1:网页按照t1,t2,t3,…tQ时间轮流播放广告;
步骤7.3:投放到页面的广告,根据求职人员是否点击生成对应的真实标签,存储到线下广告点击记录数据库中。
9.一种在线招聘广告推荐的实时竞价系统,其采用如权利要求1至8中任意一项所述的在线招聘广告推荐的实时竞价方法,其特征在于:所述实时竞价系统包括:
求职人员信息特征集合模块,其用于在求职人员登录网页时,广告供应平台通过求职人员ID在与所述广告供应平台相对应的求职人员信息数据库中搜索并获取求职人员信息特征集合;
竞价请求信号模块,其用于在广告供应平台将求职人员的信息特征集合传送到广告交易平台时,广告交易平台发送包含求职人员信息特征集合的竞价请求信号到广告需求平台;
搜索匹配模块,其用于广告需求平台根据竞价请求信号搜索匹配的广告信息特征集合;
广告点击记录模块,其用于使广告交易平台对求职人员信息特征集合和广告信息特征集合进行匹配竞价:将参与竞价的广告主的广告信息特征集合与求职人员信息特征集合结合生成广告点击记录,将广告点击记录存储到线下广告点击记录数据库;
数据处理模块,其用于将线下广告点击记录数据库的广告点击记录输入到数据处理模型中,对广告点击记录进行数据处理并对数据处理模型进行更新;将在线广告点击记录数据库中广告点击记录输入数据处理模型进行数据处理;
自动编码器集成模块,其用于将所有经过数据处理模型处理的带有标签的线下广告点击记录输入到MO-AE模型并更新MO-AE模型,将经过数据处理模型处理的线上广告点击记录输入MO-AE模型,进行对应广告点击记录标签预测;
推荐及投放模块,其用于广告供应平台根据MO-AE模型对线上广告点击记录标签预测为1的广告点击记录,得到对应广告信息特征,进行网页广告投放和求职人员在线广告推荐。
10.一种存储介质,其特征在于:其存储有与如权利要求1至8中任意一项所述的在线招聘广告推荐的实时竞价方法相对应的指令。
CN201710678426.6A 2017-08-10 2017-08-10 一种在线招聘广告推荐的实时竞价方法及其系统 Active CN107424016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710678426.6A CN107424016B (zh) 2017-08-10 2017-08-10 一种在线招聘广告推荐的实时竞价方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710678426.6A CN107424016B (zh) 2017-08-10 2017-08-10 一种在线招聘广告推荐的实时竞价方法及其系统

Publications (2)

Publication Number Publication Date
CN107424016A CN107424016A (zh) 2017-12-01
CN107424016B true CN107424016B (zh) 2020-10-23

Family

ID=60437708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710678426.6A Active CN107424016B (zh) 2017-08-10 2017-08-10 一种在线招聘广告推荐的实时竞价方法及其系统

Country Status (1)

Country Link
CN (1) CN107424016B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934340B (zh) * 2017-12-19 2021-11-23 郑州芯兰德网络科技有限公司 一种深度学习系统及模型参数调整方法
CN108647226B (zh) * 2018-03-26 2021-11-02 浙江大学 一种基于变分自动编码器的混合推荐方法
CN110689364B (zh) * 2018-07-06 2023-05-12 阿里巴巴集团控股有限公司 针对业务对象及广告业务的收益确定方法、装置及设备
CN111369281A (zh) * 2020-02-28 2020-07-03 深圳前海微众银行股份有限公司 线上消息处理方法、装置、设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090919A (zh) * 2014-06-16 2014-10-08 华为技术有限公司 推荐广告的方法及广告推荐服务器
CN106447371A (zh) * 2015-08-10 2017-02-22 北京奇虎科技有限公司 一种网页广告的推荐方法和装置
CN106803190A (zh) * 2017-01-03 2017-06-06 北京掌阔移动传媒科技有限公司 一种广告个性化推送系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050144064A1 (en) * 2003-12-19 2005-06-30 Palo Alto Research Center Incorporated Keyword advertisement management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090919A (zh) * 2014-06-16 2014-10-08 华为技术有限公司 推荐广告的方法及广告推荐服务器
CN106447371A (zh) * 2015-08-10 2017-02-22 北京奇虎科技有限公司 一种网页广告的推荐方法和装置
CN106803190A (zh) * 2017-01-03 2017-06-06 北京掌阔移动传媒科技有限公司 一种广告个性化推送系统及方法

Also Published As

Publication number Publication date
CN107424016A (zh) 2017-12-01

Similar Documents

Publication Publication Date Title
CN108629630B (zh) 一种基于特征交叉联合深度神经网络的广告推荐方法
CN110555112B (zh) 一种基于用户正负偏好学习的兴趣点推荐方法
CN107424016B (zh) 一种在线招聘广告推荐的实时竞价方法及其系统
CN111680217A (zh) 内容推荐方法、装置、设备及存储介质
Zhou et al. Understanding consumer journey using attention based recurrent neural networks
CN110728541A (zh) 信息流媒体广告创意推荐方法及装置
Böhm et al. The business model DNA: Towards an approach for predicting business model success
Yang et al. Triplet Enhanced AutoEncoder: Model-free Discriminative Network Embedding.
He et al. A general cross-domain recommendation framework via Bayesian neural network
CN113343125B (zh) 一种面向学术精准推荐的异质科研信息集成方法及系统
CN110619540A (zh) 一种神经网络的点击流预估方法
Yang et al. Adasparse: Learning adaptively sparse structures for multi-domain click-through rate prediction
Mbunge et al. Deep learning and machine learning techniques for analyzing travelers' online reviews: a review
CN115080868A (zh) 产品推送方法、装置、计算机设备、存储介质和程序产品
He et al. Dadnn: multi-scene ctr prediction via domain-aware deep neural network
Kao et al. Prediction of remaining time on site for e‐commerce users: A SOM and long short‐term memory study
Kuo et al. An application of differential evolution algorithm-based restricted Boltzmann machine to recommendation systems
Daneshmandi et al. A hybrid data mining model to improve customer response modeling in direct marketing
Kuo et al. Integration of particle swarm optimization and immune genetic algorithm-based dynamic clustering for customer clustering
Su et al. Lightweight deep learning model for marketing strategy optimization and characteristic analysis
Li et al. Deep convolutional neural network and multi-view stacking ensemble in ali mobile recommendation algorithm competition: The solution to the winning of ali mobile recommendation algorithm
Kao et al. Inter-purchase time prediction based on deep learning.
Dong et al. Prediction of Online Consumers’ Repeat Purchase Behavior via BERT-MLP Model
Chen et al. Transfer learning and LSTM to predict stock price
Wen et al. Pairwise multi-layer nets for learning distributed representation of multi-field categorical data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant