CN115796959A - 基于数据采集和分析的广告投放效果检测方法 - Google Patents

基于数据采集和分析的广告投放效果检测方法 Download PDF

Info

Publication number
CN115796959A
CN115796959A CN202211539361.4A CN202211539361A CN115796959A CN 115796959 A CN115796959 A CN 115796959A CN 202211539361 A CN202211539361 A CN 202211539361A CN 115796959 A CN115796959 A CN 115796959A
Authority
CN
China
Prior art keywords
value
parameter value
parameter
influence
contribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211539361.4A
Other languages
English (en)
Other versions
CN115796959B (zh
Inventor
何亚杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiaxing Lingju Network Technology Co ltd
Original Assignee
Jiaxing Lingju Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiaxing Lingju Network Technology Co ltd filed Critical Jiaxing Lingju Network Technology Co ltd
Priority to CN202211539361.4A priority Critical patent/CN115796959B/zh
Publication of CN115796959A publication Critical patent/CN115796959A/zh
Application granted granted Critical
Publication of CN115796959B publication Critical patent/CN115796959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及广告数据研究技术领域,具体涉及基于数据采集和分析的广告投放效果检测方法。该方法首先根据各影响因素的参数值的大小,对影响因素的参数值分类;根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子;根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵;获取正相关类别,计算对应的正相关贡献熵;以权重因子作为权重,对各影响因素的正相关贡献熵加权求和得到正相关影响值;根据正相关贡献熵和正相关影响值得到影响检测值;基于影响检测值得到投放效果等级。本发明实现了对广告投放效果进行检测的目的。

Description

基于数据采集和分析的广告投放效果检测方法
技术领域
本发明涉及广告数据研究技术领域,具体涉及基于数据采集和分析的广告投放效果检测方法。
背景技术
广告是生活中随处可见的宣传方式,无论是实体门店的宣传海报还是手机、电视上的植入广告,多种多样的宣传对象设计的广告也各不相同。广告投放的目的包含两种:一是商家为了推广产品的营销活动;二是为了提升用户对品牌和产品的认识度。在互联网阶段,信息流广告是主要的宣传方式。广告投放是否产生了预期的有益效果需要利用统计数据进行分析,广告投放效果分为短期效果和长期效果,短期效果就是产品盈利额度的变化,长期效果是指用户或者消费者的间接倾向,具体到不同广告投放者,对广告效果的定义也有所不同,例如,对于商家而言,广告效果就是实际销量的增涨,对于游戏推广而言,下载量和注册量就是广告效果。
目前常见的对广告效果检测的方法为:将投放广告输入到用户属性预测模型中进行预测,输出待投放广告对应的目标用户属性,根据目标用户属性选择与其相匹配的用户集,使待投放广告投放给选择出的用户集。该方法得到了适合投放广告的用户,却并未通过投放广告后用户的数据对广告投放的效果进行检测。
发明内容
为了解决未对广告投放的效果进行检测的技术问题,本发明的目的在于提供基于数据采集和分析的广告投放效果检测方法,所采用的技术方案具体如下:
获取广告浏览用户的用户数据,从用户的用户数据中选取影响广告投放效果的影响因素;根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别;
根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子;根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵;对每个影响因素的参数值的贡献熵进行分类,得到正相关类别;
计算正相关类别内所有贡献熵之和作为初始贡献熵;以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵;以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值;根据影响因素的正相关贡献熵和正相关影响值得到影响检测值;基于影响检测值判断投放效果等级。
优选的,所述根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子,包括:
选取任意影响因素作为目标影响因素,目标影响因素对应的任意参数值类别作为目标类别,目标类别中任意参数值作为目标参数值;获取所述目标参数值下对应的用户数量;所述用户数量和广告的总曝光量的比值为目标参数值的初始占比频率;目标参数值的初始占比频率和目标类别中所有参数值的初始占比频率和的比值,作为目标参数值的占比频率;
以目标类别中各参数值对应的占比频率作为参数值对应的第一频率值,获取目标类别的信息熵;
计算一和所述信息熵的差值作为目标类别的调节因子,计算目标影响因素中各参数值类别的调节因子之和;目标类别的调节因子和所述调节因子之和的比值,为目标类别中各参数值的权重因子。
优选的,所述根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵,包括:
对于影响因素对应的任意参数值类别中的参数值,计算参数值所属参数值类别中的参数值最大值和参数值的差值,作为最大差值;计算参数值和所属参数值类别中的参数值最小值的差值,作为最小差值;计算参数值的所属参数值类别中的参数值最大值和参数值最小值的差值作为最大极差;
所述最大差值和所述最大极差的比值作为第一比值;所述最小差值和所述最大极差的比值作为第二比值;选取所述第一比值和所述第二比值中较大的数值作为参数值的参数贡献值;计算参数值所属参数值类别内所有参数值的参数贡献值之和,参数贡献值和所述参数贡献值之和的比值为贡献概率;
以参数值类别中各参数值对应的贡献概率作为参数值对应的第二频率值,获取参数值类别的信息熵,作为参数值类别对应的第一贡献熵;
计算一和所述第一贡献熵的差值作为参数值类别的调节熵值,计算影响因素中各参数值类别的调节熵值之和;参数值类别的调节熵值和所述调节熵值之和的比值作为第二贡献熵;获取参数值的占比作为调节占比,所述调节占比和所述第二贡献熵的乘积作为参数值类别中各参数值的贡献熵。
优选的,所述对每个影响因素的参数值的贡献熵进行分类,得到正相关类别,包括:
比较参数值对应的所述第一比值和所述第二比值的大小,当所述第一比值较大时,将对应的参数值的贡献熵划分至正相关类别。
优选的,所述以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵,包括:
以正相关类别内所有参数值的权重因子的均值作为权重,对初始贡献熵进行加权,得到正相关贡献熵。
优选的,所述以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值,包括:
以各影响因素对应的参数值的权重因子的均值作为加权权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值。
优选的,所述根据影响因素的正相关贡献熵和正相关影响值得到影响检测值,包括:
对于任意影响因素,正相关贡献熵和正相关影响值的比值为影响因素的初始影响检测值,各影响因素的初始影响检测值的均值作为广告投放的影响检测值。
优选的,所述基于影响检测值判断投放效果等级,包括:
获取广告投放的所有广告平台的影响检测值之和,根据影响检测值之和所属的最终检测值范围判断广告投放效果的投放效果等级;其中,每个投放效果等级对应一个最终检测值范围。
优选的,所述根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别,包括:
将位于同一年龄段范围内的年龄划分至同一类;将点击次数大于等于预设点击次数阈值的参数值划分至一类,将点击次数小于预设点击次数阈值的参数值划分至另一类;将浏览时长大于等于预设浏览时长阈值的参数值划分至一类,将浏览时长小于预设浏览时长阈值的参数值划分至另一类;将属于同一年龄段范围内的曝光量划分至同一类;获取广告投放产品的单价将消费额低于单价的参数值划分至一类,将消费额大于等于单价的参数值划分至另一类。
优选的,所述各影响因素对应的参数值的获取方法为:
所述影响因素包括:年龄、点击次数、浏览时长、曝光量和消费;年龄对应的参数值即为用户的年龄;点击次数对应的参数值即为用户对广告的点击次数;浏览时长对应的参数值为用户浏览广告的秒数;曝光量对应的参数值为广告对于各个年龄的用户的广告投放次数;消费对应的参数值为用户对广告产品的消费额。
本发明实施例至少具有如下有益效果:
本发明实施例涉及广告数据研究技术领域。该方法首先根据参数值的大小对影响因素的参数值进行分类,因为不同的参数值其对应的贡献程度不同,为了在后续步骤中分析计算影响因素中各参数值的权重因子和贡献熵时计算的更准确,故对其进行分类别计算;当参数值类别中参数值对应的用户占比越稳定且越大,其对应的参数值的稳定性更高,可靠性更高,故根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子,以提高后续影响检测值的准确性;影响因素对应的参数值的贡献程度也是广告投放效果的影响因子之一,当同一参数值类别内参数值的贡献程度越稳定且越大,则该影响参数对整体广告投放效果的影响越大,故根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵,将贡献熵作为后续检测结果的影响指标之一,进而得到最终的检测值的准确性;对每个影响因素的参数值的贡献熵分类得到正相关类别,该正相关类别内的贡献熵为与广告效益呈正相关的贡献熵,故仅对呈正相关的贡献熵进行后续分析,以得到最终的广告投放效果的检测值,避免加上与广告效益呈负相关的贡献熵导致影响检测值的计算产生偏差;计算正相关贡献熵,以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值。根据影响因素的正相关贡献熵和正相关影响值得到影响检测值;基于影响检测值得到投放效果等级。本发明根据每种影响因素下参数值的权重因子和参数值对广告投放效果的信息的贡献程度得到每个参数值的权重因子和贡献熵,最终获得每个影响因素的影响检测值,基于影响检测值判断投放效果等级,实现了对广告投放效果进行检测的目的,以便于后续根据广告投放效果进行后续的广告投放,且提高了广告投放数据的可利用性,避免了简单指标的检测效果差的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的基于数据采集和分析的广告投放效果检测方法的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于数据采集和分析的广告投放效果检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明实施例提供了基于数据采集和分析的广告投放效果检测方法的具体实施方法,该方法适用于广告投放效果检测场景。该场景下一个广告可以对应多个广告投放平台,也可以对应一个广告投放平台。为了解决未通过投放广告后用户的数据对广告投放的效果进行检测的问题。本发明根据每种影响因素下参数值的权重因子和参数值对广告投放效果的信息的贡献程度得到每个参数值的权重因子和贡献熵,最终获得每个影响因素的影响检测值,基于影响检测值判断投放效果等级,实现了广告投放效果进行检测的目的,以便于后续根据广告投放效果进行后续的广告投放,且提高了广告投放数据的可利用性,避免了简单指标的检测效果差的问题。
下面结合附图具体的说明本发明所提供的基于数据采集和分析的广告投放效果检测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于数据采集和分析的广告投放效果检测方法的步骤流程图,该方法包括以下步骤:
步骤S100,获取广告浏览用户的用户数据,从用户的用户数据中选取影响广告投放效果的影响因素;根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别。
信息流广告是移动互联网时期产生的宣传方式,信息流广告是指穿插在网页内容中的广告,信息流广告的形式包括图文、图片、短视频等多种形式,经常出现在朋友圈、今日头条以及各种短视频平台,信息流广告的特点在于能够通过算法实现一个广告面向不同人群呈现不同内容的广告方式。本发明以信息流广告中的图文广告为例,进行广告数据的采集。图文广告是以图片为整体,在图片中添加与内容有关的文字描述,因此图片中的目标和文字是图文广告的内容数据,广告的投放次数、投放时长等是图文广告的投入数据,例如一个汽车的宣传广告中,图中的汽车、汽车的名字都是内容数据,厂家要求的投放次数、宣传时长都是需要采集的投入数据。对于面向个人的部分采集数据如下所示,另一方面,投放广告的总投入T可以从广告方收集。浏览对象的数据可以利用爬虫技术进行大量的采集,爬虫技术获取数据为公知技术,具体过程不再详细赘述。用户数据包括:性别、年龄、点击次数、浏览时长、曝光量和消费。用户数据中影响广告投放效果的影响因素包括:年龄、点击次数、浏览时长、曝光量和消费。其中各影响因素对应的参数值,具体的:年龄对应的参数值即为用户的年龄;点击次数对应的参数值即为用户对广告的点击次数;浏览时长对应的参数值为用户浏览广告的秒数;曝光量对应的参数值为广告对于各个年龄的用户的广告投放次数;消费对应的参数值为用户对广告产品的消费额。需要说明的是,为了减小后续的计算量,将各影响因素的参数值进行归一化处理,各影响因素的参数值更新为归一化后的参数值。
根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别,具体的:将位于同一年龄段范围内的年龄划分至同一类。在本发明实施例中第一预设年龄段范围为20-35、第二预设年龄段范围为35-45,对于其他年龄的用户暂不考虑,在其他实施例中实施者可根据实际情况调整该范围。将点击次数大于等于预设点击次数阈值的参数值划分至一类,将点击次数小于预设点击次数阈值的参数值划分至另一类。在本发明实施例中预设点击次数阈值的取值为2,在其他实施例中实施者可根据实际情况调整该取值。将浏览时长大于等于预设浏览时长阈值的参数值划分至一类,将浏览时长小于预设浏览时长阈值的参数值划分至另一类。在本发明实施例中预设浏览时长阈值的取值为5,在其他实施例中实施者可根据实际情况调整该取值。由于曝光量是对于各个年龄的用户的广告投放次数,故曝光量根据年龄段范围进行分类,将属于同一年龄段范围内的曝光量划分至同一类。获取广告投放产品的单价,将消费额低于单价的参数值划分至一类,将消费额大于等于单价的参数值划分至另一类。需要说明的是,由于广告投放产品的单价为消费的最低额度,故要么用户的消费额为零,要么消费额大于等于单价。
至此,即可根据爬虫技术等方法获取浏览广告用户的用户数据,用于后续广告投放效果的检测。
步骤S200,根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子;根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵;对每个影响因素的参数值的贡献熵进行分类,得到正相关类别。
本发明的检测对象是广告投放效果,通过采集广告投放的相关数据,获取每个用户的用户数据中的影响因素,统计所有影响因素指标下的每个参数值后,将参数值作为本发明中检测广告投放效果的参考数据,在广告效益的检测中,简单的计算指标不能反映短期的广告效益,基于收集数据检测广告的投放效果时,无论是短期效果还是长期效果都需要影响因素,通过计算不同影响因素对广告效果期限的影响不同,计算不同的权重值,获取每个影响因素下参数值对广告投放效果的影响,进一步的,通过优化广告投放方向,计算主要投放方向和次要投放方向的数据重要性,检测不同指标下采集数据对短期效果和长期效果的影响。
首先,根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子。
影响广告投放效果的影响因素有很多,包括广告投放的定向人群的范围、广告创意是否足够吸引广告浏览对象点击或者观看、年龄、点击次数、浏览时长、曝光量和消费等等。对于步骤S100中选取出的影响因素年龄、点击次数、浏览时长、曝光量和消费进行后续的数据分析,从所有的浏览对象的用户数据中筛选出影响因素,获取广告投放效益在不同浏览对象的具体效果。
将上述采集的数据进行数值化处理,对于每个广告浏览对象获取单独的数据,也即对每个用户获取单独的数据,需要说明的是在本发明实施例中的用户即为广告浏览对象,也即广告浏览用户。
在本发明中,确定广告投放效果的影响因素是集合Y={浏览时长,点击次数,年龄,曝光量,消费},根据不同影响因素对广告投放效果的影响程度不同,获取每个影响因素对广告投放效果的重要程度。其影响因素对应的各参数值类别中参数值对应的用户数量和广告被投放的总曝光量的比值可以反映出影响因素重要程度,当影响因素的参数值对应的用户数量越多,则反映对于影响因素对后续的广告投放效果的影响越大,故根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子。此处构建权重因子Q,用于表征每个影响因素对某类广告投放效果的重要程度。
获取权重因子的步骤,具体的:选取任意影响因素作为目标影响因素,目标影响因素对应的任意参数值类别作为目标类别,目标类别中任意参数值作为目标参数值;获取所述目标参数值下对应的用户数量;所述用户数量和广告的总曝光量的比值为目标参数值的初始占比频率;目标参数值的初始占比频率和目标类别中所有参数值的初始占比频率和的比值,作为目标参数值的占比频率;其中,所有参数值的初始占比频率和即为所有参数值对应的初始占比频率之和。以目标类别中各参数值对应的占比频率作为参数值对应的第一频率值,获取目标类别的信息熵;计算一和所述信息熵的差值作为目标类别的调节因子,计算目标影响因素中各参数值类别的调节因子之和;目标类别的调节因子和所述调节因子之和的比值,为目标类别中各参数值的权重因子。需要说明的是,该权重因子即为目标类别对应的权重因子,也为目标类别中各参数值对应的权重因子,属于同一参数值类别的参数值对应同一个权重因子。
其中,该占比频率的计算公式为:
Figure BDA0003976533080000071
其中,Pijk为第i个影响因素的第j个参数值类别内第k个参数值的占比频率;Nijk为第i个影响因素的第j个参数值类别内第k个参数值对应的用户数量;n1为第一预设年龄段范围内的曝光量;m1为第二预设年龄段范围内的曝光量;n1+m1为广告的总曝光量;K为第i个影响因素的第j个参数值类别内的参数值数量;
Figure BDA0003976533080000081
为第i个影响因素的第j个参数值类别内第k个参数值的初始占比频率;
Figure BDA0003976533080000082
为第i个影响因素的第j个参数值类别内所有参数值的初始占比频率和。
占比频率反映了每个影响因素的参数值对应的初始占比频率的占比,参数值对应的初始占比频率反映了该参数值对应的用户数量在总曝光量下的所占比例,对于预处理后的参数数据,同一参数值的出现次数越多,其对应的用户越大,则参数值对应的初始占比频率越大搜,对应的该参数值的占比频率越大,对广告投放效果的影响越大。
以目标类别中各参数值对应的占比频率作为参数值对应的第一频率值,获取目标类别的信息熵。该信息熵的计算公式为:
Figure BDA0003976533080000083
其中,Hij为第i个影响因素的第j个参数值类别对应的信息熵;Pijk为第i个影响因素的第j个参数值类别内第k个参数值的占比频率,也即为第i个影响因素的第j个参数值类别内第k个参数值的第一频率值;log为对数函数;K为第i个影响因素的第j个参数值类别内的参数值数量。该信息熵的计算公式为本领域技术人员的公知技术,在此不再赘述。
其中,权重因子的计算公式为:
Figure BDA0003976533080000084
其中,Qij为第i个影响因素的第j个参数值类别对应的权重因子;Hij为第i个影响因素的第j个参数值类别对应的信息熵;1-Hij为第i个影响因素的第j个参数值类别对应的调节因子;
Figure BDA0003976533080000085
为第i个影响因素中各参数值类别的调节因子之和;J为第i个影响因素对应的参数值类别的数量。
如以浏览时长为例,对于浏览时长的参数值q,无论年龄和点击次数等的参数值q的数量即为参数值q对应的用户数量。当同一类参数值类别中参数值的占比频率越稳定,也就是同一类参数值类别中参数值的占比频率的混乱程度越小,则参数值类别对应的信息熵越小,则参数值就越稳定,该参数值类别在所有类数据中的分布越稳定,则对应的该参数值类比对应的权重因子越大;影响因素对应的参数值类别的权重因子越大,在曝光量不变的前提条件下,影响因素对广告效果的影响也越稳定。
至此,通过对不同广告投放效果的影响因素对应的不同参数值类别内的参数值的处理,得到每个影响因素各参数值类别对应的权重因子。
在对广告投放效果进行检测的过程中,利用爬虫获取了大量投放平台的用户数据,筛选出多个影响因素,但是对于广告效益来说,并不是所有数据都是越稳定越好,也不是所有数据越多越好,例如,对于影响因素中的消费,消费数据越大说明广告投放产生的效益越高,消费数据越大且越稳定越好,而对点击次数仅有1次,且浏览时间小于5s的数据,也即点击次数对应的参数值为1,浏览时长对应的参数值小于预设浏览时长阈值的数据,这些数据的数量越小越好,因为对于一个具有一定时长的宣传广告,一次很短的浏览时长很可能是误触造成的,并不会产生实际收益,甚至可能引起人们的反感,造成相反的广告效益。故进一步,结合不同影响因素的参数值,计算不同参数值对影响因素的贡献熵G。
根据影响因素对应的各参数值类别中参数值和参数值最值的差异计算影响因素对应的各参数值类别中各参数值的贡献熵。具体的:对于影响因素对应的任意参数值类别中的参数值,计算参数值所属参数值类别中的参数值最大值和参数值的差值,作为最大差值;计算参数值和所属参数值类别中的参数值最小值的差值,作为最小差值;计算参数值的所属参数值类别中的参数值最大值和参数值最小值的差值作为最大极差;所述最大差值和所述最大极差的比值作为第一比值;所述最小差值和所述最大极差的比值作为第二比值;选取所述第一比值和所述第二比值中较大的数值作为参数值的参数贡献值;计算参数值所属参数值类别内所有参数值的参数贡献值之和,参数贡献值和所述参数贡献值之和的比值为贡献概率;以参数值类别中各参数值对应的贡献概率作为参数值对应的第二频率值,获取参数值类别的信息熵,作为参数值类别对应的第一贡献熵;计算一和所述第一贡献熵的差值作为参数值类别的调节熵值,计算影响因素中各参数值类别的调节熵值之和;参数值类别的调节熵值和所述调节熵值之和的比值作为第二贡献熵;获取参数值的占比作为调节占比,所述调节占比和所述第二贡献熵的乘积作为参数值类别中各参数值的贡献熵。基于上述广告效益的特点,此处构建贡献系数G,用于表征每个影响因素的参数值对广告投放效果的贡献程度。
影响因素对应的参数值类别中参数值的参数贡献值的计算公式为:
Figure BDA0003976533080000091
其中,ax为参数值cx的参数贡献值;max()为最大值函数;cx为参数值;cmin为参数值cx对应的参数值类别中的参数值最小值;cmax为参数值cx对应的参数值类别中的参数值最大值;cx-cmin为参数值cx对应的最小差值;cmax-cx为参数值cx对应的最大差值;cmax-cmin为参数值cx对应的最大极差;
Figure BDA0003976533080000101
为参数值cx对应的第一比值;
Figure BDA0003976533080000102
为参数值cx对应的第二比值。
Figure BDA0003976533080000103
的作用是用于表征参数值cx在所有用户参数值的正向指标,分母是固定不变的值,也就是说对应的浏览时间越长,cx-cmin越大,
Figure BDA0003976533080000104
就越大,购买的可能就越大,这个参数值cx在所有数据中呈现正向关系,对广告效益的贡献也越大;相反的,
Figure BDA0003976533080000105
越大,说明购买的可能性越小,这个参数值cx在所有数据中呈现负向关系,对广告收益的贡献越小,甚至可能是相反的贡献作用,也即为参数贡献值ax是参数值cx对应的关系指标。
进一步的,计算参数值所属参数值类别内所有参数值的参数贡献值之和,参数贡献值和所述参数贡献值之和的比值为贡献概率,以参数值类别中各参数值对应的贡献概率作为参数值对应的第二频率值,获取参数值类别的信息熵,作为参数值类别对应的第一贡献熵。
该第一贡献熵的计算公式为:
Figure BDA00039765330800001010
其中,gx为参数值cx所属参数值类别的第一贡献熵;M为参数值cx所属的参数值类别内的参数值数量;ax为参数值cx的参数贡献值;
Figure BDA0003976533080000106
为参数值cx所属参数值类别内所有参数值的参数贡献值之和;log为对数函数;
Figure BDA0003976533080000107
为参数值cx的贡献概率。需要说明的是信息熵的计算公式为本领域技术人员的公知技术,由于参数值类别对应的信息熵即为第一贡献熵,在此不再对第一贡献熵的计算公式进行赘述。
进一步的,计算参数值类别中各参数值的贡献熵,该贡献熵的计算公式为:
Figure BDA0003976533080000108
其中,Gx为参数值cx所属的参数值类别对应的贡献熵;gx为参数值cx的第一贡献熵;X为影响因素对应的参数值类别的数量;M为参数值cx所属的参数值类别内的参数值数量;m(ax)为参数值cx出现的次数;1-gx为参数值cx所属的参数值类别的调节熵值;
Figure BDA0003976533080000109
为参数值cx所属的影响因素对应的各参数值类别的调节熵值之和;
Figure BDA0003976533080000111
为参数值cx所属的参数值类别的第二贡献熵;
Figure BDA0003976533080000112
为参数值cx的调节占比。
其中,gx反映的是采集数据对应关系指标参数贡献值ax的贡献程度,gx的大小反映了参数贡献值ax在参数值cx的所属参数值类别内各参数贡献值ax的分布复杂度,贡献熵Gx反映了参数值cx对广告效益的具体贡献程度,第一贡献熵gx越大,说明参数值cx对应的正向关系在所有数据中的分布越复杂。
Figure BDA0003976533080000113
的大小反映了参数值cx出现的概率,参数值ax出现的概率越高,对应的分布复杂度越低,因为第一贡献熵gx的计算公式不难看出第一贡献熵gx是个负值,故1-gx就越大,对应的贡献熵Gx就越大,其对广告投放效益的贡献度越高。
贡献熵反映了每个影响因素下,每个参数值对广告投放效果的检测结果的贡献程度也就是说,贡献熵与采集的参数值的信息是正相关的,参数贡献值ax作为方向指标,反映参数值cx在影响因素的所有采集数据中的正相关性,
Figure BDA0003976533080000114
较大时,说明参数值cx符合影响因素的所有采集数据的影响方向,
Figure BDA0003976533080000115
较大时,说明参数值cx并不符合影响因素的所有采集数据的影响方向,参数贡献值ax越大,参数值cx包含的信息越多,出现的频率越高,参数值cx对应的贡献熵的值越大,这是因为一般情况下,对于广告效益的检测需要参考多数人的意见,也就是说贡献熵Gx越大,对应的参数值类别内的参数值对广告效益的检测结果的贡献程度越高。需要说明的是,该贡献熵即为参数值类别对应的贡献熵,也为参数值类别中各参数值对应的贡献熵,属于同一参数值类别的参数值对应同一个贡献熵。
至此,通过对每个影响因素下采集到的参数值数据得到处理,得到影响因素下每个参数值对检测结果的贡献熵。
在得到不同影响因素各参数值的权重因子和贡献熵之后,根据不同影响因素各参数值的权重因子Q和其对应参数值的贡献熵G获取当前投放平台下广告效果的影响检测值。
先对每个影响因素的参数值的贡献熵进行分类,得到正相关类别,具体的:比较参数值对应的所述第一比值和所述第二比值的大小,当所述第一比值较大时,将对应的参数值的贡献熵划分至正相关类别。也即根据每个影响因素下的参数值的方向指标,将采集数据的贡献熵进行分类,得到对应的正相关类别。
步骤S300,计算正相关类别内所有贡献熵之和作为初始贡献熵;以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵;以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值;根据影响因素的正相关贡献熵和正相关影响值得到影响检测值;基于影响检测值判断投放效果等级。
基于每个影响因素的权重因子Q和贡献熵G得到当前采集数据的投放平台的各影响因素的影响检测值。首先,计算正相关类别内贡献熵之和作为初始贡献熵。进一步的,以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵,具体的:以正相关类别内所有参数值的权重因子的均值作为权重,对初始贡献熵进行加权,得到正相关贡献熵。然后以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值,具体的:以各影响因素对应的参数值的权重因子的均值作为加权权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值。
根据影响因素的正相关贡献熵和正相关影响值得到影响检测值,具体的:对于任意影响因素,正相关贡献熵和正相关影响值的比值为影响因素的初始影响检测值,各影响因素的初始影响检测值的均值作为广告投放的影响检测值。
该初始影响检测值的计算公式为:
Figure BDA0003976533080000121
其中,Si为第i个影响因素的初始影响检测值;Gi(y1)为第i个影响因素对应的正相关类别对应的初始贡献熵;Q'i为第i个影响因素对应的正相关类别内所有参数值的权重因子的均值;T为影响因素的数量;Gi(y1)·Q'i为第i个影响因素对应的正相关贡献熵;
Figure BDA0003976533080000122
为第i个影响因素对应的正相关影响值。在本发明实施例中选取出的影响因素有5个,故对应的T的取值为5,在其他实施例中可根据实际情况调整该取值。
该初始影响检测值也即为通过权重因子调节初始贡献熵,得到正相关贡献熵的占比;当影响因素对应的正相关影响值越大,则该影响因素对广告投放效果的正向影响较大,对应的初始影响检测值越大。
对于一个广告平台,遍历所有广告投放效果的所有影响因素,计算每一个影响因素中与广告效益正相关的初始影响检测值,并求得初始影响检测值的均值作为广告投放效果的影响检测值。
对于广告投放的任意一个平台,该平台的用户数据的影响因素对应的影响检测值即为该平台的最终检测值;获取广告投放的所有平台的影响检测值之和,根据影响检测值之和判断广告投放效果的投放效果等级,具体的:设定5种投放效果等级,5种投放效果等级分别为较差,一般,预期,良好,优秀。每个投放效果等级对应一个最终检测值范围,当得到的影响检测值之和属于较差等级对应的最终检测值范围内,则广告投放效果的等级为较差;当得到的影响检测值之和属于一般等级对应的最终检测值范围内,则广告投放效果的投放效果等级为一般;当得到的影响检测值之和属于预期等级对应的最终检测值范围内,则广告投放效果的投放效果等级为预期;当得到的影响检测值之和属于良好等级对应的最终检测值范围内,则广告投放效果的投放效果等级为良好;当得到的影响检测值之和属于优秀等级对应的最终检测值范围内,则广告投放效果的投放效果等级为优秀。需要说明的是每个投放效果等级对应的最终检测值范围由广告商的预期需求设定,在不同的实施例中每个投放效果等级对应的最终检测值范围是不同。
综上所述,本发明实施例涉及广告数据研究技术领域。该方法首先获取影响广告投放效果的影响因素;根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别;根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子;根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵;对每个影响因素的参数值的贡献熵分类得到正相关类别;计算正相关类别内所有贡献熵之和作为初始贡献熵;以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵;以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值;根据影响因素的正相关贡献熵和正相关影响值得到影响检测值;基于影响检测值得到投放效果等级。本发明根据每种影响因素下参数值的权重因子和参数值对广告投放效果的信息的贡献程度得到每个参数值的权重因子和贡献熵,最终获得每个影响因素的影响检测值,基于影响检测值判断投放效果等级,提高了广告投放数据的可利用性,避免了简单指标的检测效果差的问题。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。

Claims (10)

1.基于数据采集和分析的广告投放效果检测方法,其特征在于,该方法包括以下步骤:
获取广告浏览用户的用户数据,从用户的用户数据中选取影响广告投放效果的影响因素;根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别;
根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子;根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵;对每个影响因素的参数值的贡献熵进行分类,得到正相关类别;
计算正相关类别内所有贡献熵之和作为初始贡献熵;以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵;以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值;根据影响因素的正相关贡献熵和正相关影响值得到影响检测值;基于影响检测值判断投放效果等级。
2.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述根据各影响因素对应的各参数值类别中参数值对应的用户数量和广告的曝光量获取各参数值类别中参数值的权重因子,包括:
选取任意影响因素作为目标影响因素,目标影响因素对应的任意参数值类别作为目标类别,目标类别中任意参数值作为目标参数值;获取所述目标参数值下对应的用户数量;所述用户数量和广告的总曝光量的比值为目标参数值的初始占比频率;目标参数值的初始占比频率和目标类别中所有参数值的初始占比频率和的比值,作为目标参数值的占比频率;
以目标类别中各参数值对应的占比频率作为参数值对应的第一频率值,获取目标类别的信息熵;
计算一和所述信息熵的差值作为目标类别的调节因子,计算目标影响因素中各参数值类别的调节因子之和;目标类别的调节因子和所述调节因子之和的比值,为目标类别中各参数值的权重因子。
3.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述根据影响因素对应的各参数值类别中参数值和参数值最值的差异,计算影响因素对应的各参数值类别中各参数值的贡献熵,包括:
对于影响因素对应的任意参数值类别中的参数值,计算参数值所属参数值类别中的参数值最大值和参数值的差值,作为最大差值;计算参数值和所属参数值类别中的参数值最小值的差值,作为最小差值;计算参数值的所属参数值类别中的参数值最大值和参数值最小值的差值作为最大极差;
所述最大差值和所述最大极差的比值作为第一比值;所述最小差值和所述最大极差的比值作为第二比值;选取所述第一比值和所述第二比值中较大的数值作为参数值的参数贡献值;计算参数值所属参数值类别内所有参数值的参数贡献值之和,参数贡献值和所述参数贡献值之和的比值为贡献概率;
以参数值类别中各参数值对应的贡献概率作为参数值对应的第二频率值,获取参数值类别的信息熵,作为参数值类别对应的第一贡献熵;
计算一和所述第一贡献熵的差值作为参数值类别的调节熵值,计算影响因素中各参数值类别的调节熵值之和;参数值类别的调节熵值和所述调节熵值之和的比值作为第二贡献熵;获取参数值的占比作为调节占比,所述调节占比和所述第二贡献熵的乘积作为参数值类别中各参数值的贡献熵。
4.根据权利要求3所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述对每个影响因素的参数值的贡献熵进行分类,得到正相关类别,包括:
比较参数值对应的所述第一比值和所述第二比值的大小,当所述第一比值较大时,将对应的参数值的贡献熵划分至正相关类别。
5.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述以权重因子作为权重,对初始贡献熵进行加权,得到正相关贡献熵,包括:
以正相关类别内所有参数值的权重因子的均值作为权重,对初始贡献熵进行加权,得到正相关贡献熵。
6.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述以权重因子作为权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值,包括:
以各影响因素对应的参数值的权重因子的均值作为加权权重,对各影响因素的正相关贡献熵进行加权求和,得到正相关影响值。
7.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述根据影响因素的正相关贡献熵和正相关影响值得到影响检测值,包括:
对于任意影响因素,正相关贡献熵和正相关影响值的比值为影响因素的初始影响检测值,各影响因素的初始影响检测值的均值作为广告投放的影响检测值。
8.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述基于影响检测值判断投放效果等级,包括:
获取广告投放的所有广告平台的影响检测值之和,根据影响检测值之和所属的最终检测值范围判断广告投放效果的投放效果等级;其中,每个投放效果等级对应一个最终检测值范围。
9.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述根据各影响因素的参数值的大小,对影响因素的参数值进行分类,每个影响因素对应至少两个参数值类别,包括:
将位于同一年龄段范围内的年龄划分至同一类;将点击次数大于等于预设点击次数阈值的参数值划分至一类,将点击次数小于预设点击次数阈值的参数值划分至另一类;将浏览时长大于等于预设浏览时长阈值的参数值划分至一类,将浏览时长小于预设浏览时长阈值的参数值划分至另一类;将属于同一年龄段范围内的曝光量划分至同一类;获取广告投放产品的单价将消费额低于单价的参数值划分至一类,将消费额大于等于单价的参数值划分至另一类。
10.根据权利要求1所述的基于数据采集和分析的广告投放效果检测方法,其特征在于,所述各影响因素对应的参数值的获取方法为:
所述影响因素包括:年龄、点击次数、浏览时长、曝光量和消费;年龄对应的参数值即为用户的年龄;点击次数对应的参数值即为用户对广告的点击次数;浏览时长对应的参数值为用户浏览广告的秒数;曝光量对应的参数值为广告对于各个年龄的用户的广告投放次数;消费对应的参数值为用户对广告产品的消费额。
CN202211539361.4A 2022-12-02 2022-12-02 基于数据采集和分析的广告投放效果检测方法 Active CN115796959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211539361.4A CN115796959B (zh) 2022-12-02 2022-12-02 基于数据采集和分析的广告投放效果检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211539361.4A CN115796959B (zh) 2022-12-02 2022-12-02 基于数据采集和分析的广告投放效果检测方法

Publications (2)

Publication Number Publication Date
CN115796959A true CN115796959A (zh) 2023-03-14
CN115796959B CN115796959B (zh) 2023-07-04

Family

ID=85445055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211539361.4A Active CN115796959B (zh) 2022-12-02 2022-12-02 基于数据采集和分析的广告投放效果检测方法

Country Status (1)

Country Link
CN (1) CN115796959B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150110956A (ko) * 2014-03-21 2015-10-05 에스케이플래닛 주식회사 인터넷 광고 제공 방법 및 이를 위한 장치
CN106204113A (zh) * 2016-06-29 2016-12-07 北京小米移动软件有限公司 广告投放方法及装置
CN107784519A (zh) * 2017-10-13 2018-03-09 厦门集微科技有限公司 一种广告效果评估方法及服务器
CN109711885A (zh) * 2018-12-27 2019-05-03 上海旺翔文化传媒股份有限公司 激励视频广告智能投放方法
US20200202383A1 (en) * 2018-12-21 2020-06-25 The Nielsen Company (Us), Llc Methods, systems, articles of manufacture and apparatus to determine advertisement campaign effectiveness using covariate matching
CN111737646A (zh) * 2020-05-15 2020-10-02 广州小迈网络科技有限公司 广告推广的效果评估数据处理方法、系统和存储介质
CN113256335A (zh) * 2021-05-27 2021-08-13 腾讯科技(深圳)有限公司 数据筛选方法、多媒体数据的投放效果预测方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150110956A (ko) * 2014-03-21 2015-10-05 에스케이플래닛 주식회사 인터넷 광고 제공 방법 및 이를 위한 장치
CN106204113A (zh) * 2016-06-29 2016-12-07 北京小米移动软件有限公司 广告投放方法及装置
CN107784519A (zh) * 2017-10-13 2018-03-09 厦门集微科技有限公司 一种广告效果评估方法及服务器
US20200202383A1 (en) * 2018-12-21 2020-06-25 The Nielsen Company (Us), Llc Methods, systems, articles of manufacture and apparatus to determine advertisement campaign effectiveness using covariate matching
CN109711885A (zh) * 2018-12-27 2019-05-03 上海旺翔文化传媒股份有限公司 激励视频广告智能投放方法
CN111737646A (zh) * 2020-05-15 2020-10-02 广州小迈网络科技有限公司 广告推广的效果评估数据处理方法、系统和存储介质
CN113256335A (zh) * 2021-05-27 2021-08-13 腾讯科技(深圳)有限公司 数据筛选方法、多媒体数据的投放效果预测方法及装置

Also Published As

Publication number Publication date
CN115796959B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
CN108335137B (zh) 排序方法及装置、电子设备、计算机可读介质
US8620746B2 (en) Scoring quality of traffic to network sites
US8615434B2 (en) Systems and methods for automatically generating campaigns using advertising targeting information based upon affinity information obtained from an online social network
US10037543B2 (en) Estimating conversion rate in display advertising from past performance data
AU2009291539B2 (en) Associating an entity with a category
CN108921398B (zh) 店铺质量评价方法及装置
US20110035273A1 (en) Profile recommendations for advertisement campaign performance improvement
US20080103887A1 (en) Selecting advertisements based on consumer transactions
US20110035272A1 (en) Feature-value recommendations for advertisement campaign performance improvement
CN101385018A (zh) 使用估计的广告质量来进行广告过滤、排名和提升
US20140365314A1 (en) Machine learning system to optimize targeting campaigns in on-line banking environment
CN116385048B (zh) 一种农产品智慧营销方法和系统
WO2015124024A1 (zh) 一种提升信息的曝光率的方法和装置、确定搜索词的价值的方法和装置
CN115496566B (zh) 基于大数据的地区特产推荐方法及系统
CN108171545A (zh) 一种基于层次等级数据的转化率预估方法
CN111091409B (zh) 客户标签的确定方法、装置和服务器
US20240112210A1 (en) Self-learning valuation
CN112200215A (zh) 标签特征提取方法、装置、存储介质与电子设备
CN115796959B (zh) 基于数据采集和分析的广告投放效果检测方法
CN112015970A (zh) 产品推荐方法、相关设备及计算机存储介质
CN114925261A (zh) 关键词确定方法、装置、设备、存储介质及程序产品
CN111178934B (zh) 获取目标对象的方法及装置
CN110992091A (zh) 一种基于分类模型评估投放权益的方法和装置
WO2001006405A2 (en) Cross-selling in database mining
CN118229362A (zh) 一种基于互联网大数据的广告精准投放方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant