CN110070397A - 广告定向方法及电子设备 - Google Patents

广告定向方法及电子设备 Download PDF

Info

Publication number
CN110070397A
CN110070397A CN201910334834.9A CN201910334834A CN110070397A CN 110070397 A CN110070397 A CN 110070397A CN 201910334834 A CN201910334834 A CN 201910334834A CN 110070397 A CN110070397 A CN 110070397A
Authority
CN
China
Prior art keywords
control
target data
data
behavioral data
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910334834.9A
Other languages
English (en)
Other versions
CN110070397B (zh
Inventor
张盈
康乐
李�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN201910334834.9A priority Critical patent/CN110070397B/zh
Publication of CN110070397A publication Critical patent/CN110070397A/zh
Application granted granted Critical
Publication of CN110070397B publication Critical patent/CN110070397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供的广告定向方法及电子设备,涉及广告定向技术领域。该广告定向方法包括:获取目标页面中各个目标功能按键的点击控件的行为数据,其中,所述行为数据包括各所述点击控件的使用次数和使用各所述点击控件的设备的设备数量;通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的的权重矩阵,其中,每个所述权重矩阵中包含各设备对应的权重系数;根据各所述权重系数对对应的设备进行广告定向处理。通过上述方法,可以提高广告定向的有效性。

Description

广告定向方法及电子设备
技术领域
本发明涉及广告定向技术领域,具体而言,涉及一种广告定向方法及电子设备。
背景技术
传统定向标签训练过程是无监督的,其产生的行为分类结果很难进行人为描述。但由于广告的售卖特点,定向内容需要是(对于需求方具有)强可解释性的,尤其是在供给方需要为定向服务要求更高溢价的情况下,有时候甚至是根据需求方的逻辑而制定的。
但是,经发明人研究发现,在现有技术中,一般人为关联行为和已有定向标签的映射,无法保证广告定向的有效性。
发明内容
有鉴于此,本发明的目的在于提供一种广告定向方法及电子设备,以改善现有技术中存在的问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种广告定向方法,该广告定向方法包括:
获取目标页面中各个目标功能按键的点击控件的行为数据,其中,所述行为数据包括各所述点击控件的使用次数和使用各所述点击控件的设备的设备数量;
通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的权重矩阵,其中,每个所述权重矩阵中包含各设备对应的权重系数;
根据各所述权重系数对对应的设备进行广告定向处理。
在本发明实施例较佳的选择中,所述通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算的步骤,包括:
基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据;
通过预先构建的权重计算模型分别对每一组所述目标数据进行权重计算。
在本发明实施例较佳的选择中,所述基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据的步骤,包括:
根据各所述点击控件对应的使用次数和设备数量计算该点击控件的热度阈值;
将大于第一预设值的热度阈值对应的点击控件的行为数据,作为目标数据。
在本发明实施例较佳的选择中,所述基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据的步骤,还包括:
在大于第一预设值的热度阈值对应的点击控件为多个时,获取各点击控件之间的关联度;
将关联度大于第二预设值的两个点击控件作为虚拟控件,并将该虚拟控件的行为数据作为目标数据。
在本发明实施例较佳的选择中,所述获取各点击控件之间的关联度的步骤,具体为:
基于各点击控件被点击时的点击时间计算得到各点击控件之间的关联度。
在本发明实施例较佳的选择中,在执行所述通过预先构建的权重计算模型分别对每一组所述目标数据进行权重计算的步骤之前,所述通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算的步骤,还包括:
对每一组所述目标数据分别进行训练,得到训练后的目标数据。
在本发明实施例较佳的选择中,所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤,具体为:
获取每一组目标数据的时间信息,得到至少一组时间信息;
根据每组时间信息分别对对应的目标数据进行时间衰减计算,并进行归一化处理,得到训练后的目标数据。
在本发明实施例较佳的选择中,在执行所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤之前,所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤,还包括:
判断所述目标数据的组数是否大于第三预设值;
若否,获取目标页面中各个非目标功能按键的点击控件的行为数据,并计算各个非目标功能按键的点击控件的行为数据与每一组所述目标数据进行相似度计算;
将相似度大于第四预设值的非目标功能按键的点击控件的行为数据,作为目标数据。
在本发明实施例较佳的选择中,所述基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据的步骤,还包括:
判断小于第一预设值的热度阈值对应的点击控件的使用频次是否大于第五预设值;
将大于第五预设值的使用频率对应的点击控件的行为数据,作为目标数据。
本发明实施例还提供了一种电子设备,包括存储器和处理器,所述处理器用于执行所述存储器中存储的可执行的计算机程序,以实现上述的广告定向方法的步骤。
本发明实施例提供的广告定向方法及电子设备,通过获取目标页面中各个目标功能按键的点击控件的行为数据,通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的权重矩阵,以根据各所述权重矩阵对对应的设备进行广告定向处理,从而提高广告定向的有效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的电子设备的结构框图。
图2为本发明实施例提供的广告定向方法的流程示意图。
图3为本发明实施例提供的步骤S200的流程示意图。
图4为本发明实施例提供的步骤S210的流程示意图。
图5为本发明实施例提供的步骤S210的另一流程示意图。
图标:10-电子设备;12-存储器;14-处理器;100-广告定向装置。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
如图1所示,本发明实施例提供了一种电子设备10。该电子设备10可以包括存储器12、处理器14及广告定向装置100。所述存储器12和处理器14之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述广告定向装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器12中的软件功能模块。所述处理器14用于执行所述存储器12中存储的可执行的计算机程序,例如,所述广告定向装置100所包括的软件功能模块及计算机程序等,以实现广告定向方法。
其中,所述存储器12可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
所述处理器14可能是一种集成电路芯片,具有信号的处理能力。上述的处理器14可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等。
可以理解,图1所示的结构仅为示意,所述电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
结合图2,本发明实施例还提供一种可应用于上述电子设备10的广告定向方法。其中,所述广告定向方法有关的流程所定义的方法步骤可以由所述电子设备10实现。下面将对图2所示的具体流程进行详细阐述。
步骤S100,获取目标页面中各个目标功能按键的点击控件的行为数据。
其中,所述行为数据包括各所述点击控件的使用次数和使用各所述点击控件的设备的设备数量。在本实施例中,用户触发对第i个功能按键的点击控件计为buttoni,cnt表示使用次数,buttoni:cnti表示功能按键buttoni被使用cnti次,功能按键的点击控件与使用次数的对应关系可以表示为:
T1={button1:cnt1,button2:cnt2,button3:cnt3,…,buttonN:cntN}。
并且,device_cnt表示使用点击控件的设备的设备数量,buttoni:device_cnti表示功能按键buttoni的点击控件一共被device_cnti个设备使用,功能按键的点击控件与设备数量的对应关系可以表示为:
T2={button1:device_cnt1,button2:device_cnt2,…,buttonN:device_cntN}。
例如,设备A上点击“开始”按键1次,设备B上点击“开始”按键2次,那么,对应地,“开始”按键的使用次数为3,设备数量为2。
详细地,所述目标页面的具体类型不受限制,可以根据实际应用需求进行设置,只要使需要进行广告投放的页面即可。例如,在一种实施例中,所述目标页面可以是包括多个功能按键的网页页面(也就是通过浏览器访问的页面);在另一实施例中,所述目标页面可以是包括多个功能按键的应用页面(也就是通过应用软件开启的页面)。
步骤S200,通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的权重矩阵。
其中,每个所述权重矩阵中包含各设备对应的权重系数。
步骤S300,根据各所述权重系数对对应的设备进行广告定向处理。
详细地,根据各设备对应的权重系数不同,可以确定各个设备对定向内容的权重,不同的设备代表不同的用户,因此可以确定广告的目标用户。例如,设备A对应的权重系数为0.5,设备B对应的权重系数为0.9,设备C对应的权重系数为0.7,因此,可以认为将广告投放给设备B的用户的效果最好。
通过上述方法,可以基于点击控件的行为数据对对应的设备进行广告定向处理,由于行为数据包括使用次数和设备数量,具有多重维度,相较于使用单维度数据或人为操作,可以使得计算得到的结果更为准确,从而提高广告定向的有效性。
结合图3,所述步骤S200可以包括步骤S210和步骤S220。
步骤S210,基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据。
步骤S220,通过预先构建的权重计算模型分别对每一组所述目标数据进行权重计算。
详细地,通过上述方法,可以降低进行权重计算时的计算量。例如,当所述行为数据的数据量过多时,可以对所述行为数据进行筛选以降低计算量。
具体地,结合图4,所述步骤可以包括步骤S211和步骤S212。
步骤S211,根据各所述点击控件对应的使用次数和设备数量计算该点击控件的热度阈值。
详细地,热度阈值的计算公式为:
功能按键的点击控件与热度阈值的对应关系可以表示为:
Freq={button1:freq_thres1,button2:freq_thres2,…,buttonn:freq_thresn}。
步骤S212,将大于第一预设值的热度阈值对应的点击控件的行为数据,作为目标数据。
可选地,所述第一预设值的具体设置不受限制,可以根据实际应用需求进行设置。例如,在本实施例中,所述第一预设值可以是所有热度阈值中按照由大到小的顺序排列最后5%的热度阈值。也就是说,可以去掉最后5%的热度阈值对应的低频点击控件的行为数据,以增强估计的稳健性,减少数据稀疏和计算成本。
例如,行为数据A的热度阈值为10,行为数据B的热度阈值为9,行为数据C的热度阈值为8,行为数据D的热度阈值为7,行为数据E的热度阈值为2,因此,第一预设值为2.4,可以将行为数据A、行为数据B、行为数据C及行为数据D作为目标数据。
进一步地,当去除低频点击控件后的点击控件的数量仍然大于1000时,可以进一步地进行筛选:
tfX=FreqX
tfidfX=tfX·idfX
其中,tfX即点击控件X出现的频率,idfX即记录总数除以包含该点击控件的记录条数,用以表征功能按键点击控件的区分能力,可以取tfidfX值前1000的点击控件X,以保证较合适的计算个数。
进一步地,可以用bhv_devicei:(d1,d2,…,dN)i表示第i个功能按键的点击控件bhvi被(d1,d2,…,dN)i集合内的每个设备触发,可以用T3表示功能按键的点击控件和设备的对应关系:
其中,假设所有广告投放厂商的所有定向内容决策均是已知的。那么对于某一确定定向内容targeti,其对应的广告投放厂商是一个有限可测集合:
ci=(customer1,customer2,…customern)i
关于这一定向内容的可测受众即发生在有限可测集合ci中所有customer的所有点击对应的设备上的点击控件,即某一确定定向内容targeti的可测部分受众可表示为:
target_mi=(device1,device2,…)i
进一步地,我们可以用T4表示功能按键行为和点击设备的对应关系:
这样可以获得一个基于T3的一个子矩阵T4,进一步地降低了数据计算的规模。
结合图5,所述步骤S210还可以包括步骤S213和步骤S214。
步骤S213,在大于第一预设值的热度阈值对应的点击控件为多个时,获取各点击控件之间的关联度。
其中,大于第一预设值的热度阈值对应的点击控件,即为所有热度阈值中按照由大到小的顺序排列前95%的热度阈值对应的点击控件。
例如,点击控件A对应的热度阈值为10,点击控件B对应的热度阈值为9,点击控件C对应的热度阈值为8,点击控件D对应的热度阈值为7,点击控件E对应的热度阈值为2,第一预设值为2.4,此时,需要获取点击控件A、点击控件B、点击控件C及点击控件D之间的关联度。
步骤S214,将关联度大于第二预设值的两个点击控件作为虚拟控件,并将该虚拟控件的行为数据作为目标数据。
详细地,在高频点击控件中可能存在关联度较高的点击控件,通过构建虚拟控件,并将该虚拟控件的行为数据作为目标数据以增加点击控件的关联特征,从而增加基础数据覆盖面,提高广告定向的有效性。
例如,点击控件A和点击控件B之间的关联度为10,第二预设值为5,那么,可以将点击控件A和点击控件B作为一个虚拟控件;相反地,若点击控件C和点击控件D之间的关联度为2,第二预设值为5,那么,不能讲点击控件C点击控件D作为一个虚拟控件。
其中,所述获取各点击控件之间的关联度的步骤,具体为:
基于各点击控件被点击时的点击时间计算得到各点击控件之间的关联度。
详细地,当同一个设备发出的功能按键的点击控件buttoni,buttonj的时间差timespanij<60秒时,表示这两个点击控件的关联度高,构建虚拟控件buttonij,并将该虚拟控件的行为数据作为目标数据。
例如,在设备A上,点击控件A的被点击时间为2019年3月20日19时3分13秒,点击控件B的被点击时间为2019年3月20日19时3分53秒,由于时间差小于60秒,可以认为点击控件A和点击控件B的关联度较高,因而,可以作为一个虚拟控件;相反地,在设备A上,点击控件C的被点击时间为2019年3月20日19时4分13秒,点击控件D的被点击时间为2019年3月20日19时5分53秒,由于时间差大于60秒,可以认为点击控件C和点击控件D的关联度较低,因而,不可以作为一个虚拟控件。
其中,在执行步骤S220之前,所述步骤S200还可以包括:
对每一组所述目标数据分别进行训练,得到训练后的目标数据。
详细地,可以对每一组所述目标数据分别进行训练,以增加每一组目标数据的时间维度信息,从而提高权重计算的精确性。
进一步地,所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤,具体为:
获取每一组目标数据的时间信息,得到至少一组时间信息;
根据每组时间信息分别对对应的目标数据进行时间衰减计算,并进行归一化处理,得到训练后的目标数据。
其中,由于点击控件的总量不可测且取值离散,作为一般情况下的计数数据的自然统计最优模型,可以用泊松分布对单个点击进行刻画,其概率密度函数:
其中,λ=ωTX。由于柏松分布的均值和方差均为参数λ,即λ刻画了分布走向。控制其他变量下,可以认为单位时间内点击控件分布的差异由定向内容差异刻画,进而由λ刻画,即λ为模型的定向特征参数。当放宽“单位时间限制”时,可以认为y是所有用户在该定向λt下发生的点击量,而单个用户的在该定向λt下发生的点击为yi,X即功能按键的点击控件的特征向量,ωT即特征向量对应的权重。
进一步地,获取含时间标志的特定定向内容λt上发生点击的设备集合对所有点击控件的功能特征的使用情况:
deviceusage={day1week1_usetime,
day2week1_usetime,…,day8week2_usetime,…daydweekw_usetime}。
首先对λt中每个功能特征在每台设备上的使用情况进行时间维度的处理。设对某个确定的设备l,其统计时间长度上某功能特征数据取值bhv_k的时间衰减系数为:
time_decayij=ta(i-1)*tb(j-1)
devicelk_use=∑i,jtime_decayij*cntij
其中,time_decay为时间衰减系数,i为当天数据和数据统计时间内最晚日期的天数差值,j分别为当天数据和数据统计时间内最晚日期的周数差值,α为天级时间衰减系数,β为周级时间衰减系数。
可选地,所述天级时间衰减系数和周级时间衰减系数的具体数值不受限制,可以根据实际应用需求进行设置。例如,在本实施例中,所述天级时间衰减系数和周级时间衰减系数可以分别是0.95和0.8。
详细地,设统计时间内最后一天为本周二,则上周五的使用数据的时间衰减系数为0.95(4)*0.85(1),本周一的时间衰减系数为0.95(1)*0.85(0)
并且,进行归一化处理的计算公式可以是:
其中,xlk为设备devicel对于第k个功能按键点击控件特征bhvk的取值,devicelk_usetime即该设备devicel对于bhvk的使用行为(在时间上的累积)计数,mean(devicek_usetime)、max(devicek_usetime)及min(devicek_usetime)分别为所有待选设备在该点击控件特征bhvk上取值的均值、最大值及最小值。通过上述的归一化处理,这样能够使得所有的xlk统一到[0,1]的区间里,以便于计算。
进一步地,在执行所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤之前,所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤,还包括:判断所述目标数据的组数是否大于第三预设值;若否,获取目标页面中各个非目标功能按键的点击控件的行为数据,并计算各个非目标功能按键的点击控件的行为数据与每一组所述目标数据进行相似度计算;将相似度大于第四预设值的非目标功能按键的点击控件的行为数据,作为目标数据。
详细地,在对每一组所述目标数据分别进行训练之前,可以判断目标数据的组数是否符合需要,当目标数据的组数不足时,可以通过计算潜在数据与目标数据的样本相似度的方式将满足相似度阈值的潜在数据加入到目标数据中扩容后进行训练,以扩大计算的数据量,从而提高广告定向的有效性。
并且,在整体数据来源于多个应用的情况下,设来源的应用A的集合为:
Applications={A1,A2,A3,…,An};
可以根据各组目标数据的数据来源增设区分应用的系数以对各组目标数据做出区分。
进一步地,在步骤S210中小于第一预设值的热度阈值对应的点击控件虽然使用频率低,但是可能存在使用频率高的点击控件,因此,可以将该点击控件的行为数据进行权重计算,以满足一些细分定向的精度要求。
也就是说,所述步骤S210还可以包括:
判断小于第一预设值的热度阈值对应的点击控件的使用频次是否大于第五预设值;将大于第五预设值的使用频率对应的点击控件的行为数据,作为目标数据。
详细地,可以用均值和保留一位小数下的众数进行加权,计算出所有功能按键点击控件的整体使用频次:
freq_thres=a*mean(freq_thres)+b*Mode(round(freq_thres,1));
a+b=1。
考虑到数据的具体分布差别较大,设置a、b参数分别为频数中位数和频数均值的系数,可通过多次计算得到a、b较合理的一个经验取值或取值范围。
可选地,所述第五预设值具体数量不受限制,可以根据实际应用需求进行设置,例如,在本实施例中,所述第五预设值可以是1.5*freq_thres。
进一步地,设第i个功能按键点击控件bhvi被(d1,d2,…,dn)i集合内的每个设备触发,可以用线性模型表示点击控件集合bhvi和指定定向内容λt的关系:
这表示指定定向内容λt是由各个点击控件集合bhvi通过不同的设备的点击刻画的。
进一步地,我们使用GLM(generalized linear model,广义线性)模型通过将点击控件bhv和定向标签λt的线性连接:
λt=∑nwlkxlk
对于已知的定向内容λt和对应的设备行为观测样本数据xlk,问题被进一步为归纳为求解极大似然下的权重系数wlk
whereλ=ωTX中,y是点击总数,即第λt个定向标签对应的点击,yi=1,y=∑iyi
因此,入模的训练数据可以表示为:
Train1={(x1,y1),(x2,y2),…(xk,yk),…(xN,yN)};
其中,xl为对应的观测特征取值构成的向量。
假设通过正交变换后的训练数据Train2压缩到如下规模:
Train2={(A1,b1),(A2,b2),…(Ak,bk),…(Aq,bq)};
其中,初始非0特征个数为Q维,各个点击控件x均能由独立的Q维向量A表示,各个定向点击yk也可以由Ak线性表示。
进一步地,构造对数最大似然值函数:
l1=∑iilog(γTXi)-γTXi-log(Xi!))。
由于各个功能点击事件x均能由独立的Q维向量A线性表示,将l1中Xi用Ai表征,我们得到如下的函数:
l1=∑i(bilog(ωTAi)-ωTAi-log(bi!))。
因此,可以通过计算目标数据的对数最大似然值最大的参数向量ωT以计算各组目标数据对应的权重。
进一步地,对对数最大似然值l1求偏导,得到:
压缩后的独立非0特征个数为P,则w=(w1,w2,…,wp),wp即第p个Ai向量的权重矩阵,以使得迭代后的得值最小的ω向量。
进一步地,可以设置迭代次数上限Times,当迭代到第m(m<Times)次时,设权重迭代阈值为δ。
可选地,所述权重迭代阈值的具体数值不受限制,可以根据实际应用需求进行设置,例如,在本实施例中,所述阈值可以是0.0001。
进一步地,第m次迭代得到权重的和第m-1次的差值小于这个权重迭代阈值,则认为得到了ω的一个可靠估计ωm
即当或达到迭代次数上限时,停止权重迭代,获得权重矩阵ωm。当ω矩阵计算量仍然超出限制时,回到λt=∑nwlkxlk步骤控制数据数量以满足处理的高效性。
进一步地,计算得到权重矩阵之后,可以通过ABtest的方式对结果进行评估。具体地,设置实验组和对照组。对一半的数据使用上述的广告定向方法,用这一系统得到的某个定向的评测得分对另一半的数据使用现有定向方法,同样得到评测得分CG.Score。当T.Score≥CG.Score时,认为该广告定向方法有效。否则调整参数,重新进行ABtest,直到获取稳定理想的效果。
进一步地,需要强调的是,在现有技术中,权重系数ω非负,即认为某一点击控件的行为对广告定向的影响要么是正向的,要么无影响。对权重系数的这一非负限制一方面增加了筛选行为特征的效率,降低了模型的复杂度,增加了计算效率,但同时也一定程度牺牲了精度,因为某些设备的行为/定向间其实是存在负向关系的。比如汽车、极限运动、领带等人群往往被认为和母婴、居家等人群有较为明显的互斥关系。所说本方法中的权重系数可以为负,在母婴、居家定向相关行为上权重系数为负,能更好定向到极限运动、领带等标签。
进一步地,本发明实施例还提供了一种广告定向装置100,可以应用于所述电子设备10。其中,该广告定向装置可以包括行为数据获取模块、权重计算模块及广告定向模块。
行为数据获取模块,用于获取目标页面中各个目标功能按键的点击控件的行为数据。在本实施例中,所述行为数据获取模块可以用于执行图2所示的步骤S100,关于所述行为数据获取模块的相关内容可以参照前文对步骤S100的描述。
权重计算模块,用于通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的权重矩阵。在本实施例中,所述权重计算模块可以用于执行图2所示的步骤S200,关于所述权重计算模块的相关内容可以参照前文对步骤S200的描述。
广告定向模块,用于根据各所述权重系数对对应的设备进行广告定向处理。在本实施例中,所述广告定向模块可以用于执行图2所示的步骤S300,关于所述广告定向模块的相关内容可以参照前文对步骤S300的描述。
综上所述,本发明实施例提供的广告定向方法及电子设备10过获取目标页面中各个目标功能按键的点击控件的行为数据,通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的权重矩阵,以根据各所述权重系数对对应的设备进行广告定向处理,从而提高广告定向的有效性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种广告定向方法,其特征在于,该广告定向方法包括:
获取目标页面中各个目标功能按键的点击控件的行为数据,其中,所述行为数据包括各所述点击控件的使用次数和使用各所述点击控件的设备的设备数量;
通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算,得到各所述行为数据对应的权重矩阵,其中,每个所述权重矩阵中包含各设备对应的权重系数;
根据各所述权重系数对对应的设备进行广告定向处理。
2.如权利要求1所述的广告定向方法,其特征在于,所述通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算的步骤,包括:
基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据;
通过预先构建的权重计算模型分别对每一组所述目标数据进行权重计算。
3.如权利要求2所述的广告定向方法,其特征在于,所述基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据的步骤,包括:
根据各所述点击控件对应的使用次数和设备数量计算该点击控件的热度阈值;
将大于第一预设值的热度阈值对应的点击控件的行为数据,作为目标数据。
4.如权利要求2所述的广告定向方法,其特征在于,所述基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据的步骤,还包括:
在大于第一预设值的热度阈值对应的点击控件为多个时,获取各点击控件之间的关联度;
将关联度大于第二预设值的两个点击控件作为虚拟控件,并将该虚拟控件的行为数据作为目标数据。
5.如权利要求4所述的广告定向方法,其特征在于,所述获取各点击控件之间的关联度的步骤,具体为:
基于各点击控件被点击时的点击时间计算得到各点击控件之间的关联度。
6.如权利要求2所述的广告定向方法,其特征在于,在执行所述通过预先构建的权重计算模型分别对每一组所述目标数据进行权重计算的步骤之前,所述通过预先构建的权重计算模型分别对各所述点击控件的行为数据进行权重计算的步骤,还包括:
对每一组所述目标数据分别进行训练,得到训练后的目标数据。
7.如权利要求6所述的广告定向方法,其特征在于,所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤,具体为:
获取每一组目标数据的时间信息,得到至少一组时间信息;
根据每组时间信息分别对对应的目标数据进行时间衰减计算,并进行归一化处理,得到训练后的目标数据。
8.如权利要求6所述的广告定向方法,其特征在于,在执行所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤之前,所述对每一组所述目标数据分别进行训练,得到训练后的目标数据的步骤,还包括:
判断所述目标数据的组数是否大于第三预设值;
若否,获取目标页面中各个非目标功能按键的点击控件的行为数据,并计算各个非目标功能按键的点击控件的行为数据与每一组所述目标数据进行相似度计算;
将相似度大于第四预设值的非目标功能按键的点击控件的行为数据,作为目标数据。
9.如权利要求3所述的广告定向方法,其特征在于,所述基于所述使用次数和设备数量对各所述点击控件的行为数据进行筛选,得到至少一组目标数据的步骤,还包括:
判断小于第一预设值的热度阈值对应的点击控件的使用频次是否大于第五预设值;
将大于第五预设值的使用频率对应的点击控件的行为数据,作为目标数据。
10.一种电子设备,其特征在于,包括存储器和处理器,所述处理器用于执行所述存储器中存储的可执行的计算机程序,以实现权利要求1-9任意一项所述的广告定向方法的步骤。
CN201910334834.9A 2019-04-24 2019-04-24 广告定向方法及电子设备 Active CN110070397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910334834.9A CN110070397B (zh) 2019-04-24 2019-04-24 广告定向方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910334834.9A CN110070397B (zh) 2019-04-24 2019-04-24 广告定向方法及电子设备

Publications (2)

Publication Number Publication Date
CN110070397A true CN110070397A (zh) 2019-07-30
CN110070397B CN110070397B (zh) 2021-08-20

Family

ID=67368767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910334834.9A Active CN110070397B (zh) 2019-04-24 2019-04-24 广告定向方法及电子设备

Country Status (1)

Country Link
CN (1) CN110070397B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112770003A (zh) * 2021-01-26 2021-05-07 北京字节跳动网络技术有限公司 控制电子设备的方法、装置、终端和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置
CN103839171A (zh) * 2012-11-23 2014-06-04 腾讯科技(深圳)有限公司 一种网络广告的定向条件展示方法和装置
CN106682925A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 广告内容的推荐方法及装置
CN106709739A (zh) * 2015-07-13 2017-05-24 银橙(上海)信息技术有限公司 一种定向广告投放方法及系统
CN107977859A (zh) * 2017-11-14 2018-05-01 广州优视网络科技有限公司 广告投放方法、装置、计算设备及存储介质
CN108733706A (zh) * 2017-04-20 2018-11-02 腾讯科技(深圳)有限公司 热度信息的生成方法和装置
CN108776907A (zh) * 2018-05-31 2018-11-09 康键信息技术(深圳)有限公司 广告智能推荐方法、服务器及存储介质
CN109064230A (zh) * 2018-08-14 2018-12-21 微梦创科网络科技(中国)有限公司 一种广告重定向的方法、终端设备及服务器
CN109191240A (zh) * 2018-08-14 2019-01-11 北京九狐时代智能科技有限公司 一种进行商品推荐的方法和装置
CN109598526A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 媒体贡献的分析方法及装置
CN110415054A (zh) * 2019-09-05 2019-11-05 上海博泰悦臻网络技术服务有限公司 基于用户行为数据的广告投放方法、系统、介质及服务端
CN111127101A (zh) * 2019-12-24 2020-05-08 北京汇牛科技有限公司 广告定向投放方法、装置及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置
CN103839171A (zh) * 2012-11-23 2014-06-04 腾讯科技(深圳)有限公司 一种网络广告的定向条件展示方法和装置
CN106709739A (zh) * 2015-07-13 2017-05-24 银橙(上海)信息技术有限公司 一种定向广告投放方法及系统
CN106682925A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 广告内容的推荐方法及装置
CN108733706A (zh) * 2017-04-20 2018-11-02 腾讯科技(深圳)有限公司 热度信息的生成方法和装置
CN109598526A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 媒体贡献的分析方法及装置
CN107977859A (zh) * 2017-11-14 2018-05-01 广州优视网络科技有限公司 广告投放方法、装置、计算设备及存储介质
CN108776907A (zh) * 2018-05-31 2018-11-09 康键信息技术(深圳)有限公司 广告智能推荐方法、服务器及存储介质
CN109064230A (zh) * 2018-08-14 2018-12-21 微梦创科网络科技(中国)有限公司 一种广告重定向的方法、终端设备及服务器
CN109191240A (zh) * 2018-08-14 2019-01-11 北京九狐时代智能科技有限公司 一种进行商品推荐的方法和装置
CN110415054A (zh) * 2019-09-05 2019-11-05 上海博泰悦臻网络技术服务有限公司 基于用户行为数据的广告投放方法、系统、介质及服务端
CN111127101A (zh) * 2019-12-24 2020-05-08 北京汇牛科技有限公司 广告定向投放方法、装置及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112770003A (zh) * 2021-01-26 2021-05-07 北京字节跳动网络技术有限公司 控制电子设备的方法、装置、终端和存储介质

Also Published As

Publication number Publication date
CN110070397B (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
Wu et al. Session-based recommendation with graph neural networks
CN109952583A (zh) 神经网络的半监督训练
CN113254549B (zh) 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN109903086A (zh) 一种相似人群扩展方法、装置及电子设备
CN110020128A (zh) 一种搜索结果排序方法及装置
Wilks The minimum spanning tree histogram as a verification tool for multidimensional ensemble forecasts
CN108461111A (zh) 中文医疗文本查重方法及装置、电子设备、计算机可读取存储介质
CN111210111B (zh) 一种基于在线学习与众包数据分析的城市环境评估方法和系统
CN108572984A (zh) 一种实时用户兴趣识别方法及装置
CN112884529B (zh) 一种广告竞价方法、装置、设备及介质
CN114240555A (zh) 训练点击率预测模型和预测点击率的方法和装置
Zhou House price prediction using polynomial regression with Particle Swarm Optimization
CN110070397A (zh) 广告定向方法及电子设备
Huang et al. A global network alignment method using discrete particle swarm optimization
Rossberg et al. An explanatory model for food-web structure and evolution
CN106126681B (zh) 一种增量式流式数据聚类方法及系统
CN108770002A (zh) 基站流量分析方法、装置、设备及存储介质
CN111445280A (zh) 模型生成方法、餐馆排序方法、系统、设备和介质
CN112765367B (zh) 一种主题知识图谱构建方法及装置
CN110851708B (zh) 负样本的抽取方法、装置、计算机设备和存储介质
CN110442674B (zh) 标签传播的聚类方法、终端设备、存储介质及装置
CN107463486A (zh) 系统性能分析方法、装置及服务器
Rowe et al. The essential properties of evolutionary stability
Sheldon Manipulation of PageRank and Collective Hidden Markov Models
CN112989801B (zh) 一种序列标注方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant