CN110097395A - 定向广告投放方法、装置及计算机可读存储介质 - Google Patents

定向广告投放方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110097395A
CN110097395A CN201910238703.0A CN201910238703A CN110097395A CN 110097395 A CN110097395 A CN 110097395A CN 201910238703 A CN201910238703 A CN 201910238703A CN 110097395 A CN110097395 A CN 110097395A
Authority
CN
China
Prior art keywords
user
vector
similarity
advertisement
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910238703.0A
Other languages
English (en)
Other versions
CN110097395B (zh
Inventor
刘继宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910238703.0A priority Critical patent/CN110097395B/zh
Publication of CN110097395A publication Critical patent/CN110097395A/zh
Priority to PCT/CN2019/103608 priority patent/WO2020192013A1/zh
Application granted granted Critical
Publication of CN110097395B publication Critical patent/CN110097395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0261Targeted advertisements based on user location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本方案涉及人工智能,提供一种定向广告投放方法、装置及计算机可读存储介质,方法包括:计算两个用户的标签向量的相似度,获得分值1;计算两个用户行为向量的相似度,得到分值2;利用交替最小二乘算法对用户向量建模,并通过随机梯度下降优化算法,得到用户向量和广告向量,并计算两个用户的用户向量的相似度,得到分值3,对分值1至分值3线性加权得到分值4。将用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,得到分值5,再对分值4和分值5进行加权组合,输出最终的用户相似度,将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。

Description

定向广告投放方法、装置及计算机可读存储介质
技术领域
本发明涉及人工智能,具体地说,涉及一种定向广告投放方法、装置及计算机可读存储介质。
背景技术
随着网络技术的发展,社交网络成为了重要的交流平台之一。消息推送得到了越来越多的应用。推送技术是指根据一定的发送规则,依据相关的标准和协议通过互联网向用户发送信息的技术。电子商务厂商纷纷向用户的智能移动终端上推送各类信息。然而目前定向广告基本上是根据用户的兴趣或者标签来进行人群定向;而目标客群是属于群体中绝大部分人都具备的行为,这会使得目标客群的覆盖率非常低。由于金融产品用户相对互联网用户,用户行为数据丰富度较低,从而导致挖掘用户的兴趣和标签的方法存在一定的挑战性。真实场景下,目标客群往往没有非常清晰的界限和区分性,很难利用用户的单个兴趣和标签圈定目标客群。
发明内容
为解决以上技术问题,本发明提供一种定向广告投放方法,应用于电子装置,包括:
(1)根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score(分值)1;
(2)根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
(3)利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3;
(4)对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
(5)将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
优选地,
其中,userAi表示得到用户A的用户向量的第i个分量;userBi表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
优选地,欧几里得距离计算公式如下:
其中,userA表示用户A的用户向量;
userB表示用户B的用户向量;
n表示用户向量的维度;
i表示第i个维度;
d(userA,userB)表示用户A与用户B之间的距离。
优选地,还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
优选地,还设置有修正系数,所述修正系数根据用户点击广告后是否转发,
是否删除来确定,其中,用户转发广告则加1分,用户删除广告则减1分。
优选地,还检测用户的位置坐标,根据广告委托者所在的位置坐标与用户的位置坐标的距离远近来推送广告,以距离用户的广告委托者的距离由近及远的方式向用户推送广告。
优选地,采用GPS的方式来定位用户的位置坐标,并与标记有广告委托者的位置坐标的电子地图进行比较,来确定广告委托者所在的位置坐标与用户的位置坐标的距离。
本发明还提供一种电子装置,该电子装置包括:存储器和处理器,所述存储器中存储有定向广告投放程序,所述定向广告投放程序被所述处理器执行时实现如下步骤:
(1)根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
(2)根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
(3)利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3;
(4)对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
(5)将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
优选地,还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,实现以上所述的定向广告投放方法。
本发明的定向广告投放方法、装置及计算机可读存储介质提升了目标客群的覆盖率,能带来更多有价值的目标客群。本发明不仅利用用户兴趣标签数据和用户行为数据,还能够挖掘用户和广告潜在的关联关系,从而提升了金融用户数据的丰富度,提高算法的精确度。采用多模型融合更加具有通用性。
附图说明
通过结合下面附图对其实施例进行描述,本发明的上述特征和技术优点将会变得更加清楚和容易理解。
图1是本发明实施例的定向广告投放方法的流程示意图;
图2是本发明实施例的电子装置的硬件架构示意图;
图3是本发明实施例的定向广告投放程序的模块构成图。
具体实施方式
下面将参考附图来描述本发明所述的定向广告投放方法、装置及计算机可读存储介质的实施例。本领域的普通技术人员可以认识到,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式或其组合对所描述的实施例进行修正。因此,附图和描述在本质上是说明性的,而不是用于限制权利要求的保护范围。此外,在本说明书中,附图未按比例画出,并且相同的附图标记表示相同的部分。
图1为本发明实施例提供的定向广告投放方法的流程示意图。该方法包括以下步骤:
步骤S10,根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量。其中用户兴趣可以是基于用户的基本信息获得的用户兴趣,例如根据用户注册时填写的职业、爱好、居住地等信息推算出的用户兴趣,当然还可以包括是针对用户历史浏览、点击等行为获得的用户兴趣。而针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量。例如,定投、保底、货币型基金对应的标签是稳健型。股票、外汇、期货对应着高风险型。那么针对每个用户,都可以根据用户兴趣和对应的标签数据,得到用户标签向量。
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1。
步骤S20,根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光。所述偏好就是指用户喜不喜欢该广告(即点击或不点击),并根据点击情况给出分值,通过这样评分得到用户对所有广告的评分矩阵。然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
步骤S30,利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,从而挖掘用户、广告及其之间的潜在关联关系。大大提升了刻画用户和广告数据维度的丰富度。并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
其中,userAi表示得到用户A的用户向量的第i个分量;userBi表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
步骤S40,对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
步骤S50,将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST(极端梯度上升)、SVM(支持向量机)、GBDT(梯度提升树)得到相应的分数作为FM(因式分解机)的输入。其中,将GBDT的叶子节点,并作多项式变换之后,同样也作为FM的输入,FM输出score5,从而提升模型的精度,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
进一步地,欧几里得距离计算公式如下:
其中,userA表示用户A的用户向量;
userB表示用户B的用户向量;
n表示用户向量的维度;
i表示第i个维度;
d(userA,userB)表示用户A与用户B之间的距离。
在一个可选实施例中,还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
在一个可选实施例中,还设置有修正系数,所述修正系数根据用户点击广告后是否转发,是否删除来确定,其中,用户转发广告则加1分,用户删除广告则减1分。
在一个可选实施例中,还检测用户的位置坐标,根据广告委托者所在的位置坐标与用户的位置坐标的距离远近来推送广告,以距离用户的广告委托者的距离由近及远的方式向用户推送广告。这里的广告委托者是指所有能够提供产品展示的供应商。例如,商场,虽然商场不生成沙发,但是商场却会做广告推销沙发,所以商场就是以上所述的广告委托者,当然沙发的生产商如果也提供产品展示,那么其也可以添加到广告委托者中。当然,具体说,广告可能涉及一些虚拟产品,例如理财基金、股票推荐等,也可能是一些实体产品,例如沙发、电视等。以商场为例,商场会通过推送平台向用户推送广告,然而,有些用户可能距离较远,并不会特意去这个商场。而用户却有可能经过这个商场并不知道商场的推荐广告。而通过定位捕捉到用户的位置坐标,并与电子地图中的各个商场、工厂等广告所关联的广告委托者的坐标进行比较,并依据距离用户的位置坐标由近及远的距离来推送广告,这使得用户能够更快的阅读到距离其最近的生产商的广告。由此,可以使得用户无论走到哪里,都有对应的最近的产品的广告推送。甚至在商场中也可以及时推送,例如,用户经常可能在商场中查找某些品牌的位置,而通过以上的推送方式,则可以在用户行走的过程中,不断的推送给距离其最近的产品。
更进一步地,还可以设置距离阈值,当距离超过距离阈值,则不再推送超出该距离阈值的产品广告信息。例如,距离阈值为20米,则在20米内的广告推广按照距离远近逐个推送,20米外的则不推送。随着人员的行走,距离远近在变动,则推送的广告信息也逐渐变化。
进一步地,采用GPS的方式来定位用户的位置坐标,并与标记有广告委托者的位置坐标的电子地图进行比较,来确定广告委托者所在的位置坐标与用户的位置坐标的距离。
参阅图2所示,是本发明电子装置的实施例的硬件架构示意图。本实施例中,所述电子装置2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。例如,可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图2所示,所述电子装置2至少包括,但不限于,可通过系统总线相互通信连接的存储器21、处理器22、网络接口23。其中:所述存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器21可以是所述电子装置2的内部存储单元,例如该电子装置2的硬盘或内存。在另一些实施例中,所述存储器21也可以是所述电子装置2的外部存储设备,例如该电子装置2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括所述电子装置2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器21通常用于存储安装于所述电子装置2的操作系统和各类应用软件,例如所述定向广告投放程序代码等。此外,所述存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制所述电子装置2的总体操作,例如执行与所述电子装置2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器22用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的定向广告投放程序等。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述电子装置2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述电子装置2与推送平台相连,在所述电子装置2与推送平台之间建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCodeDivision Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
可选地,该电子装置2还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)显示器等。显示器用于显示在电子装置2中处理的信息以及用于显示可视化的用户界面。
需要指出的是,图2仅示出了具有组件21-23的电子装置2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
包含可读存储介质的存储器21中可以包括操作系统、定向广告投放程序50等。处理器22执行存储器21中定向广告投放程序50时实现如下步骤:
步骤S10,根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
步骤S20,根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
步骤S30,利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
其中,userAi表示得到用户A的用户向量的第i个分量;userBi表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
步骤S40,对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
步骤S50,将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
在本实施例中,存储于存储器21中的所述定向广告投放程序可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并可由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。例如,图3示出了所述定向广告投放程序的程序模块示意图,该实施例中,所述定向广告投放程序50可以被分割为用户兴趣相似度获取模块501、用户行为向量相似度获取模块502、用户向量的相似度获取模块503、用户相似度获取模块504、相似度阈值比较模块505。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述定向广告投放程序在所述电子装置2中的执行过程。以下描述将具体介绍所述程序模块的具体功能。
其中,用户兴趣相似度获取模块501用于根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
用户行为向量相似度获取模块502用于根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
用户向量的相似度获取模块503用于利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
其中,userAi表示得到用户A的用户向量的第i个分量;userBi表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
用户相似度获取模块504用于对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
用户相似度获取模块504还将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
相似度阈值比较模块505用于将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括定向广告投放程序等,所述定向广告投放程序50被处理器22执行时实现如下操作:
步骤S10,根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
步骤S20,根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
步骤S30,利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3,其公式如下:
其中,userAi表示得到用户A的用户向量的第i个分量;userBi表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
步骤S40,对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
步骤S50,将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
本发明之计算机可读存储介质的具体实施方式与上述定向广告投放方法以及电子装置2的具体实施方式大致相同,在此不再赘述。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种定向广告投放方法,应用于电子装置,其特征在于,包括:
(1)根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
(2)根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
(3)利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3;
(4)对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
(5)将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
2.根据权利要求1所述的定向广告投放方法,其特征在于:
其中,userAi表示得到用户A的用户向量的第i个分量;userBi表示算法求解得到用户B的用户向量的第i个分量;n是用户向量的维度。
3.根据权利要求1所述的定向广告投放方法,其特征在于:
欧几里得距离计算公式如下:
其中,userA表示用户A的用户向量;
userB表示用户B的用户向量;
n表示用户向量的维度;
i表示第i个维度;
d(userA,userB)表示用户A与用户B之间的距离。
4.根据权利要求1所述的定向广告投放方法,其特征在于:
还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
5.根据权利要求4所述的定向广告投放方法,其特征在于:还设置有修正系数,所述修正系数根据用户点击广告后是否转发,是否删除来确定,其中,用户转发广告则加1分,用户删除广告则减1分。
6.根据权利要求4所述的定向广告投放方法,其特征在于:
还检测用户的位置坐标,根据广告委托者所在的位置坐标与用户的位置坐标的距离远近来推送广告,以距离用户的所述广告委托者的距离由近及远的方式向用户推送广告。
7.根据权利要求6所述的定向广告投放方法,其特征在于:
采用GPS的方式来定位用户的位置坐标,并与标记有广告委托者的位置坐标的电子地图进行比较,来确定广告委托者所在的位置坐标与用户的位置坐标的距离。
8.一种电子装置,其特征在于,该电子装置包括:存储器和处理器,所述存储器中存储有定向广告投放程序,所述定向广告投放程序被所述处理器执行时实现如下步骤:
(1)根据用户兴趣和标签数据,针对用户兴趣所属的标签,把用户兴趣归类到对应的标签中,得到用户标签向量,
利用余弦相似度和欧几里得距离来计算任意两个用户标签向量的相似度,获得余弦兴趣相似度和距离兴趣相似度,并利用线性加权来计算score1;
(2)根据用户曝光和点击行为评分得到用户对广告偏好的评分矩阵,形成用户行为向量,其中,用户曝光是指当前某个广告展示给用户看称之为曝光,然后利用余弦相似度和欧几里得距离来计算任意两个用户行为向量的相似度,获得余弦行为相似度和距离行为相似度,利用线性加权来计算score2;
(3)利用交替最小二乘算法对用户行为向量建模,并通过随机梯度下降优化算法,求解用户行为向量得到用户向量和广告向量,并利用余弦相似度计算任意两个用户的用户向量的相似度,得到score3;
(4)对score1、score2、score3线性加权得到用户相似度score4,
score4=W1*score1+W2*score2+W3*score3
其中,W1、W2、W3是权重系数;
(5)将得到的用户行为向量、用户兴趣标签向量、用户向量分别经过XGBOOST、SVM、GBDT得到相应的分数作为FM的输入,其中,将GBDT的叶子节点作多项式变换之后,同样也作为FM的输入,从而提升模型的精度,得到score5,计算公式如下:
score5=T(V1*X+Vij*Xi*Xj+Vijk*Xi*Xj*XK+Vijkl*Xi*Xj*XK*Xl)
其中,T是激活函数;
X是特征;
Xi*Xj是二阶的特征交互;
Xi*Xj*XK是三阶的特征交互;
Xi*Xj*XK*Xl是四阶的特征交互;
V1,Vij,Vijk,Vijkl是权重系数;
最后经过score4和score5进行加权组合,输出最终的用户相似度,
score6=M1*score4+M2*score5
其中,M1、M2是系数;
将最终的用户相似度与相似度阈值比较,选择高于相似度阈值的用户作为目标客群。
9.根据权利要求8所述的电子装置,其特征在于:
还根据用户点击广告后浏览时间来确定用户对广告偏好的评分矩阵,形成用户行为向量,其中,先设定分值区间,所述分值区间包括0至分值上限,用户没有点击为0分,还结合用户点开页面以及用户浏览页面时间的长短区分出直至分值上限的分值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,实现权利要求1至7中任一项所述的定向广告投放方法。
CN201910238703.0A 2019-03-27 2019-03-27 定向广告投放方法、装置及计算机可读存储介质 Active CN110097395B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910238703.0A CN110097395B (zh) 2019-03-27 2019-03-27 定向广告投放方法、装置及计算机可读存储介质
PCT/CN2019/103608 WO2020192013A1 (zh) 2019-03-27 2019-08-30 定向广告投放方法和装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910238703.0A CN110097395B (zh) 2019-03-27 2019-03-27 定向广告投放方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110097395A true CN110097395A (zh) 2019-08-06
CN110097395B CN110097395B (zh) 2023-05-26

Family

ID=67443029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910238703.0A Active CN110097395B (zh) 2019-03-27 2019-03-27 定向广告投放方法、装置及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN110097395B (zh)
WO (1) WO2020192013A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889045A (zh) * 2019-10-12 2020-03-17 平安科技(深圳)有限公司 标签分析方法、装置及计算机可读存储介质
CN111210274A (zh) * 2020-01-06 2020-05-29 北京搜狐新媒体信息技术有限公司 一种广告推荐方法及系统
CN111325582A (zh) * 2020-03-18 2020-06-23 深圳市卡牛科技有限公司 一种广告召回方法、装置、服务器及存储介质
CN111598644A (zh) * 2020-04-01 2020-08-28 华瑞新智科技(北京)有限公司 一种物品推荐方法、装置以及介质
WO2020192013A1 (zh) * 2019-03-27 2020-10-01 平安科技(深圳)有限公司 定向广告投放方法和装置、设备及存储介质
CN111899049A (zh) * 2020-07-23 2020-11-06 广州视源电子科技股份有限公司 广告投放方法、装置及设备
CN112200215A (zh) * 2020-08-24 2021-01-08 深圳市欢太科技有限公司 标签特征提取方法、装置、存储介质与电子设备
CN112989213A (zh) * 2021-05-19 2021-06-18 腾讯科技(深圳)有限公司 内容推荐方法、装置、系统、电子设备及存储介质
CN113034168A (zh) * 2019-12-25 2021-06-25 北京达佳互联信息技术有限公司 内容项投放方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546768A (zh) * 2012-07-16 2014-01-29 航天信息股份有限公司 定向广告的投放方法和装置
CN105447730A (zh) * 2015-12-25 2016-03-30 腾讯科技(深圳)有限公司 目标用户定向方法及装置
US20170206549A1 (en) * 2016-01-18 2017-07-20 Adobe Systems Incorporated Recommending Advertisements Using Ranking Functions
CN108846694A (zh) * 2018-06-06 2018-11-20 厦门集微科技有限公司 一种电梯广告投放方法和装置、计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101095069B1 (ko) * 2010-02-03 2011-12-20 고려대학교 산학협력단 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법
CN103778145A (zh) * 2012-10-22 2014-05-07 中国移动通信集团广东有限公司 一种信息推荐方法和系统
CN108415913A (zh) * 2017-02-09 2018-08-17 周孟 基于不确定邻居的人群定向方法
CN110097395B (zh) * 2019-03-27 2023-05-26 平安科技(深圳)有限公司 定向广告投放方法、装置及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546768A (zh) * 2012-07-16 2014-01-29 航天信息股份有限公司 定向广告的投放方法和装置
CN105447730A (zh) * 2015-12-25 2016-03-30 腾讯科技(深圳)有限公司 目标用户定向方法及装置
US20170206549A1 (en) * 2016-01-18 2017-07-20 Adobe Systems Incorporated Recommending Advertisements Using Ranking Functions
CN108846694A (zh) * 2018-06-06 2018-11-20 厦门集微科技有限公司 一种电梯广告投放方法和装置、计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
侯继昌;陈家琪;: "基于标签和评分差值信息熵的协同过滤算法", 电子科技 *
朱雨晗;: "基于用户兴趣标签的混合推荐方法", 电子制作 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020192013A1 (zh) * 2019-03-27 2020-10-01 平安科技(深圳)有限公司 定向广告投放方法和装置、设备及存储介质
CN110889045A (zh) * 2019-10-12 2020-03-17 平安科技(深圳)有限公司 标签分析方法、装置及计算机可读存储介质
CN110889045B (zh) * 2019-10-12 2024-04-23 平安科技(深圳)有限公司 标签分析方法、装置及计算机可读存储介质
WO2021068681A1 (zh) * 2019-10-12 2021-04-15 平安科技(深圳)有限公司 标签分析方法、装置及计算机可读存储介质
CN113034168A (zh) * 2019-12-25 2021-06-25 北京达佳互联信息技术有限公司 内容项投放方法、装置、计算机设备及存储介质
CN111210274A (zh) * 2020-01-06 2020-05-29 北京搜狐新媒体信息技术有限公司 一种广告推荐方法及系统
CN111325582A (zh) * 2020-03-18 2020-06-23 深圳市卡牛科技有限公司 一种广告召回方法、装置、服务器及存储介质
CN111325582B (zh) * 2020-03-18 2023-08-29 深圳市卡牛科技有限公司 一种广告召回方法、装置、服务器及存储介质
CN111598644A (zh) * 2020-04-01 2020-08-28 华瑞新智科技(北京)有限公司 一种物品推荐方法、装置以及介质
CN111598644B (zh) * 2020-04-01 2023-05-02 华瑞新智科技(北京)有限公司 一种物品推荐方法、装置以及介质
CN111899049A (zh) * 2020-07-23 2020-11-06 广州视源电子科技股份有限公司 广告投放方法、装置及设备
CN112200215A (zh) * 2020-08-24 2021-01-08 深圳市欢太科技有限公司 标签特征提取方法、装置、存储介质与电子设备
CN112200215B (zh) * 2020-08-24 2023-11-14 深圳市欢太科技有限公司 标签特征提取方法、装置、存储介质与电子设备
CN112989213A (zh) * 2021-05-19 2021-06-18 腾讯科技(深圳)有限公司 内容推荐方法、装置、系统、电子设备及存储介质

Also Published As

Publication number Publication date
CN110097395B (zh) 2023-05-26
WO2020192013A1 (zh) 2020-10-01

Similar Documents

Publication Publication Date Title
CN110097395A (zh) 定向广告投放方法、装置及计算机可读存储介质
CN109902849B (zh) 用户行为预测方法及装置、行为预测模型训练方法及装置
WO2018188576A1 (zh) 资源推送方法及装置
CN108985823B (zh) 一种信息投放方法、装置、服务器及存储介质
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
CN109155136A (zh) 从视频自动检测和渲染精彩场面的计算机化系统和方法
CN109471978B (zh) 一种电子资源推荐方法及装置
CN107688987A (zh) 电子装置、保险推荐方法、及计算机可读存储介质
CN107895277A (zh) 在应用程序中推送贷款广告的方法、电子装置及介质
CN109146539A (zh) 用户画像的更新方法及装置
CN110020175B (zh) 一种搜索处理方法、处理设备和系统
CN108132963A (zh) 资源推荐方法和装置、计算设备和存储介质
CN111242748A (zh) 用于向用户推荐项目的方法、装置和存储介质
CN106489165A (zh) 将来自应用的转化与所选内容项目匹配
CN107256275A (zh) 路由查询结果
CN107609907A (zh) 广告位的调控方法及装置
CN111008335A (zh) 一种信息处理方法、装置、设备及存储介质
CN107438857A (zh) 利用自动生成的标签对评论进行结构化的系统和方法
CN104809627A (zh) 一种信息处理方法及其设备
CN109447687A (zh) 基于大数据分析的用户挖掘方法及装置
CN112818224A (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN111144936B (zh) 基于用户标签的相似人群扩展方法及装置
CN105868279B (zh) 一种应用推荐方法及服务器
US20160217490A1 (en) Automatic Computation of Keyword Bids For Pay-Per-Click Advertising Campaigns and Methods and Systems Incorporating The Same
CN115204971B (zh) 产品推荐方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant