CN116012066A - 广告转化率的预测方法、装置、可读存储介质 - Google Patents
广告转化率的预测方法、装置、可读存储介质 Download PDFInfo
- Publication number
- CN116012066A CN116012066A CN202310308634.2A CN202310308634A CN116012066A CN 116012066 A CN116012066 A CN 116012066A CN 202310308634 A CN202310308634 A CN 202310308634A CN 116012066 A CN116012066 A CN 116012066A
- Authority
- CN
- China
- Prior art keywords
- data
- advertisement
- model
- prediction
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012360 testing method Methods 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013075 data extraction Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 53
- 239000013598 vector Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种广告转化率的预测方法、装置、可读存储介质,该方法包括:在基于用户特征获取的预测窗口周期内获取所有的广告数据,对广告数据进行数据预处理得到待预测数据;基于转化率预测模型计算出的预测参数分别构建待预测数据的成份参数模型及性质参数模型,并将待预测数据划分为训练数据和测试数据;利用训练数据对成份参数模型和性质参数模型进行优化得到集成模型,并利用集成模型、待预测数据的成份参数以及性质参数的预测函数及转化概率计算出待预测数据的转化预测值。本发明通过集成模型、预测函数以及转化概率计算出待预测数据的转化预测值,对数据划分、模型预测进行优化,以提升模型预测的整体效率。
Description
技术领域
本发明涉及视频数据处理技术领域,特别涉及一种广告转化率的预测方法、装置、可读存储介质。
背景技术
随着科技的飞速发展和人们生活水平的提高,广告已经作为目前最流行的宣传手段之一,企业根据自身服务内容或产品特性,确定相关的广告关键词,编排广告内容进行自主投放。
广告的转化是由广告的投放对象(用户)完成了一次广告商指定或期望的行动,例如注册用户、购买商品、下载应用等。然而,现有的转化率预测模型是利用层级贝叶斯模型来探究影响广告转化率的关键因素,从而实现广告的转化率预测,但是,采用该方式在算法上十分复杂,计算耗时较长,随着网络购物的兴起,大多数模型在处理广告数据的稀疏性与高纬性都存在缺陷,因此,如何实现广告转化率的精准预测已经成为研究重点。
发明内容
基于此,本发明的目的是提供一种广告转化率的预测方法、装置、可读存储介质,以至少解决上述技术中的不足。
本发明提出一种广告转化率的预测方法,包括:
基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据,对所述广告数据进行数据预处理,以得到对应的待预测数据;
构建转化率预测模型,并根据所述转化率预测模型计算出所述待预测数据的预测参数;
获取所述待预测数据的成份参数以及性质参数,并利用所述转化率预测模型计算出所述成份参数以及所述性质参数的预测函数以及所述待预测数据对应的转化概率;
基于所述预测参数分别构建所述待预测数据的成份参数模型以及性质参数模型,并将所述待预测数据划分为训练数据和测试数据;
利用所述训练数据对所述成份参数模型和所述性质参数模型进行优化,以得到对应的集成模型,并利用所述集成模型、所述预测函数以及所述转化概率计算出所述待预测数据的转化预测值。
进一步的,基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据的步骤包括:
基于用户特征建立预测条件,并获取所述预测条件所对应的预测窗口周期,其中,所述用户特征包括年龄、性别、消费能力以及兴趣类目;
根据所述预测窗口周期在广告数据库中提取对应的广告数据。
进一步的,对所述广告数据进行数据预处理,以得到对应的待预测数据的步骤包括:
对所述广告数据进行缺失值补全,以得到对应的完整广告数据,并判断所述完整广告数据中的数据类型;
将所述完整广告数据中数据类型为连续型的完整广告数据进行连续特征归一化处理,从而得到一类广告数据;
将所述完整广告数据中数据类型为离散型的完整广告数据进行离散特征数字化处理,从而得到二类广告数据;
将所述一类广告数据和所述二类广告数据进行特征组合,以得到对应的待预测数据。
进一步的,构建转化率预测模型的步骤包括:
定义转化模型参数,并根据所述转化模型参数构建广告转化模型;
获取若干广告测试数据,并解析出所述广告测试数据中的曝光数据以及点击数据,根据所述曝光数据以及所述点击数据构建广告成分模型;
获取所述广告测试数据中的产品特征,并根据所述产品特征构建广告性质模型,将所述广告转化模型、所述广告成分模型以及所述广告性质模型进行模型组合,以得到对应的转化率预测模型。
进一步的,所述广告转化模型的表达式为:
;
式中,表示广告产生转化。
进一步的,所述广告成分模型的表达式为:
;
式中,表示广告测试数据中的曝光数据的回归系数,表示广告测试数据中的点击数据的回归系数,表示广告测试数据中的曝光数据,表示广告测试数据中的点击数据,表示广告成分模型的误差值。
进一步的,所述广告性质模型的表达式为:
;
式中,表示广告测试数据中的关键词长度的回归系数,表示广告测试数据中的产品价格的回归系数,表示广告测试数据中的区域数据的回归系数,表示广告测试数据中的关键词长度,表示广告测试数据中的产品价格,表示广告测试数据中的区域数据,表示广告性质模型的误差值。
本发明还提出一种广告转化率的预测系统,包括:
数据预处理模块,用于基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据,对所述广告数据进行数据预处理,以得到对应的待预测数据;
预测模型构建模块,用于构建转化率预测模型,并根据所述转化率预测模型计算出所述待预测数据的预测参数;
数据处理模块,用于获取所述待预测数据的成份参数以及性质参数,并利用所述转化率预测模型计算出所述成份参数以及所述性质参数的预测函数以及所述待预测数据对应的转化概率;
数据划分模块,用于基于所述预测参数分别构建所述待预测数据的成份参数模型以及性质参数模型,并将所述待预测数据划分为训练数据和测试数据;
数据预测模块,用于利用所述训练数据对所述成份参数模型和所述性质参数模型进行优化,以得到对应的集成模型,并利用所述集成模型、所述预测函数以及所述转化概率计算出所述待预测数据的转化预测值。
进一步的,所述数据预处理模块包括:
周期获取单元,用于基于用户特征建立预测条件,并获取所述预测条件所对应的预测窗口周期,其中,所述用户特征包括年龄、性别、消费能力以及兴趣类目;
数据提取单元,用于根据所述预测窗口周期在广告数据库中提取对应的广告数据。
进一步的,所述数据预处理模块还包括:
缺失值处理单元,用于对所述广告数据进行缺失值补全,以得到对应的完整广告数据,并判断所述完整广告数据中的数据类型;
归一化处理单元,用于将所述完整广告数据中数据类型为连续型的完整广告数据进行连续特征归一化处理,从而得到一类广告数据;
特征处理单元,用于将所述完整广告数据中数据类型为离散型的完整广告数据进行离散特征数字化处理,从而得到二类广告数据;
特征组合单元,用于将所述一类广告数据和所述二类广告数据进行特征组合,以得到对应的待预测数据。
进一步的,所述预测模型构建模块包括:
参数定义单元,用于定义转化模型参数,并根据所述转化模型参数构建广告转化模型;
数据解析单元,用于获取若干广告测试数据,并解析出所述广告测试数据中的曝光数据以及点击数据,根据所述曝光数据以及所述点击数据构建广告成分模型;
预测模型构建单元,用于获取所述广告测试数据中的产品特征,并根据所述产品特征构建广告性质模型,将所述广告转化模型、所述广告成分模型以及所述广告性质模型进行模型组合,以得到对应的转化率预测模型。
本发明还提出一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的广告转化率的预测方法。
本发明当中的广告转化率的预测方法、装置、可读存储介质,通过用户特征获取对应的预测窗口周期,以快速确认广告数据所在的预测范围,具体的,对广告数据进行预处理,从而得到待预测数据,并利用转化率预测模型计算待预测数据的预测参数,利用转化率预测模型计算出待预测数据的成份参数和性质参数的预测函数以及待预测数据的转化概率;根据预测参数分别构建成份参数模型以及性质参数模型,利用待预测数据划分的训练数据进行优化得到集成模型,通过集成模型、预测函数以及转化概率计算出待预测数据的转化预测值,对数据划分、模型预测进行优化,进一步保证预测的高效性和准确性,利用多模型进行融合,以提升模型预测的整体效率。
附图说明
图1为本发明第一实施例中的广告转化率的预测方法的流程图;
图2为图1中步骤S101的详细流程图;
图3为图1中步骤S102的详细流程图;
图4为本发明第二实施例中的广告转化率的预测系统的结构框图;
图5为本发明第三实施例中的计算机的结构框图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,所示为本发明第一实施例中的广告转化率的预测方法,所述方法具体包括步骤S101至S105:
S101,基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据,对所述广告数据进行数据预处理,以得到对应的待预测数据;
进一步的,请参阅图2,所述步骤S101具体包括步骤S1011~S1016:
S1011,基于用户特征建立预测条件,并获取所述预测条件所对应的预测窗口周期,其中,所述用户特征包括年龄、性别、消费能力以及兴趣类目;
S1012,根据所述预测窗口周期在广告数据库中提取对应的广告数据。
S1013,对所述广告数据进行缺失值补全,以得到对应的完整广告数据,并判断所述完整广告数据中的数据类型;
S1014,将所述完整广告数据中数据类型为连续型的完整广告数据进行连续特征归一化处理,从而得到一类广告数据;
S1015,将所述完整广告数据中数据类型为离散型的完整广告数据进行离散特征数字化处理,从而得到二类广告数据;
S1016,将所述一类广告数据和所述二类广告数据进行特征组合,以得到对应的待预测数据。
在具体实施时,当用户在使用通信终端进行媒体社交时(例如:微信朋友圈),广告放会将相关的应用广告推送给该用户,用户在浏览过程中会注意到该应用广告,这一过程即为广告曝光,假设该用户对该应用广告的内容感兴趣,并点击该应用广告,并通过应用下载获得该应用,这一过程即为广告转化。
具体的,通常用户包含有多个用户特征,其中,用户特征包括该用户的年龄、性别、消费能力以及兴趣类目,可以理解的,只有当用户对该广告感兴趣时,才可能存在广告转化,因此,不同的用户特征所对应的广告转化的条件也不相同,将上述的用户特征创建该广告进行转化所需要的条件,并将该条件标记为预测条件,利用预测条件在整个广告的播放周期内找到对应的预测窗口周期,获取该预测窗口周期内的广告数据,其中,该广告数据即为原始数据,为该广告在推广时间内所有相关的数据集,海量的原始数据中会存在不完整、重复、有异常的数据,这些脏数据不但会影响模型的执行效率,还会导致结果的偏差。本实施例中利用随机森林回归方法对该广告数据中缺失值进行预测,对缺失值的补充更准确,由于个体间不同特征数据的差异较大,单纯使用均值或者中位数填补缺失值并不准确,利用机器学习模型对数据进行拟合然后对缺失值进行预测能够更加准确的补充缺失值。
进一步的,对完整广告数据进行数据类型判断,其中,数据类型包括连续型以及离散型,为了消除连续型数据的量纲影响,对该连续型数据进行连续特征归一化处理,以使该连续型数据的各特征处于同一数值量级,在本实施例中,将该完整广告数据映射至均值为0、标准差为1的分布上,从而得到一类广告数据,连续特征归一化的计算公式为:
;
式中,表示完整广告数据,表示一类广告数据,表示完整广告数据的均值,表示完整广告数据的标准差。
具体的,将完整广告数据中数据类型为离散型的完整广告数据进行离散特征数字化处理,本实施例中采用特征嵌入编码表示法处理该离散型特征,可以实现特征降维,从而避免特征过于稀疏导致维度爆炸的问题,提高模型计算速度。
为了提高模型的拟合能力,将上述的一类广告数据和二类广告数据进行特征组合,例如:在某产品推荐场景中,一类广告数据中存在包含性别特征的数据,二类广告数据中存在包含时间或者兴趣特征的数据,当两广告数据中特征为(女生、化妆品、双十一)时,广告的转化率会相对提升,因此,将特征进行融合从而得到新的数据,即待预测数据,该数据能够有效的提升广告转化率的精度。
进一步的,由于一类广告数据和二类广告数据存在数据不平衡的现象,因此,在一些可选实施例中,在进行特征组合前,会统计一类广告数据和二类广告数据的数据量,当数据量处于不平衡状态时,利用过采样算法对数据量较少的广告数据进行过采样,并利用两广告数据之间的比例差异来调整数据量较少的广告数据的数据量,直到两广告数据之间的数据量处于平衡状态。
S102,构建转化率预测模型,并根据所述转化率预测模型计算出所述待预测数据的预测参数;
进一步的,请参阅图3,所述步骤S102具体包括步骤S1021~S1023:
S1021,定义转化模型参数,并根据所述转化模型参数构建广告转化模型;
S1022,获取若干广告测试数据,并解析出所述广告测试数据中的曝光数据以及点击数据,根据所述曝光数据以及所述点击数据构建广告成分模型;
S1023,获取所述广告测试数据中的产品特征,并根据所述产品特征构建广告性质模型,将所述广告转化模型、所述广告成分模型以及所述广告性质模型进行模型组合,以得到对应的转化率预测模型。
在具体实施时,将表示广告是否转化,表示转化,表示未转化,定义转化模型参数(即广告的成份参数和性质参数),并利用S型函数表示该广告的转化率:
;
式中,表示广告产生转化,表示该广告的成份参数和性质参数对转化率的综合影响大小,越大表示转化的可能性就越大。
具体的,获取多个广告测试数据,该广告测试数据可以为广告日志中的数据,解析出该广告测试数据中的曝光数据以及点击数据,并按照下式构建对应的广告成分模型:
;
式中,表示广告测试数据中的曝光数据的回归系数,表示广告测试数据中的点击数据的回归系数,表示广告测试数据中的曝光数据,表示广告测试数据中的点击数据,表示广告成分模型的误差值。
进一步的,获取上述的广告测试数据中的产品特征,其中,该产品特征包括关键词长度、产品价格以及区域数据,并按照下式构建对应的广告性质模型:
;
式中,表示广告测试数据中的关键词长度的回归系数,表示广告测试数据中的产品价格的回归系数,表示广告测试数据中的区域数据的回归系数,表示广告测试数据中的关键词长度,表示广告测试数据中的产品价格,表示广告测试数据中的区域数据,表示广告性质模型的误差值。
需要说明的是,上述各回归系数均通过回归数据库进行回归系数标准化,并在该回归数据库进行回归系数计算得到,其中,回归系数越大意味着该数据对广告测试数据的影响越大。
具体的,在得到广告转化模型、广告成分模型以及广告性质模型后,将各模型按照预设的框架进行结合,单独将各模型的学习器进行分类或回归学习,待各模型的学习器单独学习完成后,将各模型学习后的学习器进行结合,从而得到一个新的学习器,并利用新的学习器构建新的模型,即转化率预测模型;在得到对应的转化率预测模型后,将上述得到的待预测数据输入至所述转化率预测模型中,以得到对应的预测参数。
S103,获取所述待预测数据的成份参数以及性质参数,并利用所述转化率预测模型计算出所述成份参数以及所述性质参数的预测函数以及所述待预测数据对应的转化概率;
在具体实施时,获取上述的待预测数据的成份参数和性质参数,并利用所得到的转化率预测模型计算出该成份参数和性质参数的预测函数以及该待预测数据所对应的转化概率:
由于表示待预测广告的成份参数和性质参数对转化率的综合影响大小,将该转化率进行正态分布表示:
;
式中,表示权重向量,表示成份参数的权重向量,表示性质参数的权重向量,表示精度控制参数,当获取该待预测数据的成份参数和性质参数后,通过以下公式计算出对应的转化概率:
。
S104,基于所述预测参数分别构建所述待预测数据的成份参数模型以及性质参数模型,并将所述待预测数据划分为训练数据和测试数据;
在具体实施时,将上述得到的预测参数中的成份参数因素进行提取,由于成份参数属于正态随机变量,当给定成份参数因素时,利用预设算法即可得到该预测参数的成份参数因素与其对应的三维权重向量的联合概率,根据该联合概率即可构建对应的成份参数模型;
具体的,将上述得到的预测参数中的性质参数因素进行提取,由于性质参数属于正态随机变量,当给定性质参数因素时,利用预设算法即可得到该预测参数的性质参数因素与其对应的三维权重向量的联合概率,根据该联合概率即可构建对应的性质参数模型;
进一步的,将上述得到的待预测数据划分为训练数据和测试数据,其中,训练数据用于对后续模型组合的优化,测试数据用于对模型组合所产生的新模型进行测试,以确保模型的准确性。
S105,利用所述训练数据对所述成份参数模型和所述性质参数模型进行优化,以得到对应的集成模型,并利用所述集成模型、所述预测函数以及所述转化概率计算出所述待预测数据的转化预测值。
在具体实施时,将上述的成份参数模型和性质参数模型进行同组份子模型分割,并将成份参数模型和性质参数模型中同组份的子模型进行融合,并利用训练数据在子模型融合过程中进行优化,在子模型融合完成后,即可得到新的模型,即集成模型。
具体的,在得到集成模型后,利用上述的测试数据对该模型进行模型测试,当模型测试通过后,利用集成模型、预测函数以及转化概率计算出待预测数据的转化预测值。
综上,本发明上述实施例当中的广告转化率的预测方法,通过用户特征获取对应的预测窗口周期,以快速确认广告数据所在的预测范围,具体的,对广告数据进行预处理,从而得到待预测数据,并利用转化率预测模型计算待预测数据的预测参数,利用转化率预测模型计算出待预测数据的成份参数和性质参数的预测函数以及待预测数据的转化概率;根据预测参数分别构建成份参数模型以及性质参数模型,利用待预测数据划分的训练数据进行优化得到集成模型,通过集成模型、预测函数以及转化概率计算出待预测数据的转化预测值,对数据划分、模型预测进行优化,进一步保证预测的高效性和准确性,利用多模型进行融合,以提升模型预测的整体效率。
实施例二
本发明另一方面还提出一种广告转化率的预测系统,请查阅图4,所示为本发明第二实施例中的广告转化率的预测系统,所述系统包括:
数据预处理模块11,用于基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据,对所述广告数据进行数据预处理,以得到对应的待预测数据;
进一步的,所述数据预处理模块11包括:
周期获取单元,用于基于用户特征建立预测条件,并获取所述预测条件所对应的预测窗口周期,其中,所述用户特征包括年龄、性别、消费能力以及兴趣类目;
数据提取单元,用于根据所述预测窗口周期在广告数据库中提取对应的广告数据。
进一步的,所述数据预处理模块11还包括:
缺失值处理单元,用于对所述广告数据进行缺失值补全,以得到对应的完整广告数据,并判断所述完整广告数据中的数据类型;
归一化处理单元,用于将所述完整广告数据中数据类型为连续型的完整广告数据进行连续特征归一化处理,从而得到一类广告数据;
特征处理单元,用于将所述完整广告数据中数据类型为离散型的完整广告数据进行离散特征数字化处理,从而得到二类广告数据;
特征组合单元,用于将所述一类广告数据和所述二类广告数据进行特征组合,以得到对应的待预测数据。
预测模型构建模块12,用于构建转化率预测模型,并根据所述转化率预测模型计算出所述待预测数据的预测参数;
进一步的,所述预测模型构建模块12包括:
参数定义单元,用于定义转化模型参数,并根据所述转化模型参数构建广告转化模型;
数据解析单元,用于获取若干广告测试数据,并解析出所述广告测试数据中的曝光数据以及点击数据,根据所述曝光数据以及所述点击数据构建广告成分模型;
预测模型构建单元,用于获取所述广告测试数据中的产品特征,并根据所述产品特征构建广告性质模型,将所述广告转化模型、所述广告成分模型以及所述广告性质模型进行模型组合,以得到对应的转化率预测模型。
数据处理模块13,用于获取所述待预测数据的成份参数以及性质参数,并利用所述转化率预测模型计算出所述成份参数以及所述性质参数的预测函数以及所述待预测数据对应的转化概率;
数据划分模块14,用于基于所述预测参数分别构建所述待预测数据的成份参数模型以及性质参数模型,并将所述待预测数据划分为训练数据和测试数据;
数据预测模块15,用于利用所述训练数据对所述成份参数模型和所述性质参数模型进行优化,以得到对应的集成模型,并利用所述集成模型、所述预测函数以及所述转化概率计算出所述待预测数据的转化预测值。
上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
本发明实施例所提供的广告转化率的预测系统,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,系统实施例部分未提及之处,可参考前述方法实施例中相应内容。
实施例三
本发明还提出一种计算机,请参阅图5,所示为本发明第三实施例中的计算机,包括存储器10、处理器20以及存储在所述存储器10上并可在所述处理器20上运行的计算机程序30,所述处理器20执行所述计算机程序30时实现上述的广告转化率的预测方法。
其中,存储器10至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器10在一些实施例中可以是计算机的内部存储单元,例如该计算机的硬盘。存储器10在另一些实施例中也可以是外部存储装置,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器10还可以既包括计算机的内部存储单元也包括外部存储装置。存储器10不仅可以用于存储安装于计算机的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
其中,处理器20在一些实施例中可以是电子控制单元 (Electronic ControlUnit,简称ECU,又称行车电脑)、中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器10中存储的程序代码或处理数据,例如执行访问限制程序等。
需要指出的是,图5示出的结构并不构成对计算机的限定,在其它实施例当中,该计算机可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的广告转化率的预测方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种广告转化率的预测方法,其特征在于,包括:
基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据,对所述广告数据进行数据预处理,以得到对应的待预测数据;
构建转化率预测模型,并根据所述转化率预测模型计算出所述待预测数据的预测参数;
获取所述待预测数据的成份参数以及性质参数,并利用所述转化率预测模型计算出所述成份参数以及所述性质参数的预测函数以及所述待预测数据对应的转化概率;
基于所述预测参数分别构建所述待预测数据的成份参数模型以及性质参数模型,并将所述待预测数据划分为训练数据和测试数据;
利用所述训练数据对所述成份参数模型和所述性质参数模型进行优化,以得到对应的集成模型,并利用所述集成模型、所述预测函数以及所述转化概率计算出所述待预测数据的转化预测值。
2.根据权利要求1所述的广告转化率的预测方法,其特征在于,基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据的步骤包括:
基于用户特征建立预测条件,并获取所述预测条件所对应的预测窗口周期,其中,所述用户特征包括年龄、性别、消费能力以及兴趣类目;
根据所述预测窗口周期在广告数据库中提取对应的广告数据。
3.根据权利要求1所述的广告转化率的预测方法,其特征在于,对所述广告数据进行数据预处理,以得到对应的待预测数据的步骤包括:
对所述广告数据进行缺失值补全,以得到对应的完整广告数据,并判断所述完整广告数据中的数据类型;
将所述完整广告数据中数据类型为连续型的完整广告数据进行连续特征归一化处理,从而得到一类广告数据;
将所述完整广告数据中数据类型为离散型的完整广告数据进行离散特征数字化处理,从而得到二类广告数据;
将所述一类广告数据和所述二类广告数据进行特征组合,以得到对应的待预测数据。
4.根据权利要求1所述的广告转化率的预测方法,其特征在于,构建转化率预测模型的步骤包括:
定义转化模型参数,并根据所述转化模型参数构建广告转化模型;
获取若干广告测试数据,并解析出所述广告测试数据中的曝光数据以及点击数据,根据所述曝光数据以及所述点击数据构建广告成分模型;
获取所述广告测试数据中的产品特征,并根据所述产品特征构建广告性质模型,将所述广告转化模型、所述广告成分模型以及所述广告性质模型进行模型组合,以得到对应的转化率预测模型。
5.根据权利要求4所述的广告转化率的预测方法,其特征在于,所述广告转化模型的表达式为:
;
式中,表示广告产生转化。
6.根据权利要求4所述的广告转化率的预测方法,其特征在于,所述广告成分模型的表达式为:
;
式中,表示广告测试数据中的曝光数据的回归系数,表示广告测试数据中的点击数据的回归系数,表示广告测试数据中的曝光数据,表示广告测试数据中的点击数据,表示广告成分模型的误差值。
7.根据权利要求4所述的广告转化率的预测方法,其特征在于,所述广告性质模型的表达式为:
;
式中,表示广告测试数据中的关键词长度的回归系数,表示广告测试数据中的产品价格的回归系数,表示广告测试数据中的区域数据的回归系数,表示广告测试数据中的关键词长度,表示广告测试数据中的产品价格,表示广告测试数据中的区域数据,表示广告性质模型的误差值。
8.一种广告转化率的预测系统,其特征在于,包括:
数据预处理模块,用于基于用户特征获取对应的预测窗口周期,并在所述预测窗口周期内获取所有的广告数据,对所述广告数据进行数据预处理,以得到对应的待预测数据;
预测模型构建模块,用于构建转化率预测模型,并根据所述转化率预测模型计算出所述待预测数据的预测参数;
数据处理模块,用于获取所述待预测数据的成份参数以及性质参数,并利用所述转化率预测模型计算出所述成份参数以及所述性质参数的预测函数以及所述待预测数据对应的转化概率;
数据划分模块,用于基于所述预测参数分别构建所述待预测数据的成份参数模型以及性质参数模型,并将所述待预测数据划分为训练数据和测试数据;
数据预测模块,用于利用所述训练数据对所述成份参数模型和所述性质参数模型进行优化,以得到对应的集成模型,并利用所述集成模型、所述预测函数以及所述转化概率计算出所述待预测数据的转化预测值。
9.根据权利要求8所述的广告转化率的预测系统,其特征在于,所述数据预处理模块包括:
周期获取单元,用于基于用户特征建立预测条件,并获取所述预测条件所对应的预测窗口周期,其中,所述用户特征包括年龄、性别、消费能力以及兴趣类目;
数据提取单元,用于根据所述预测窗口周期在广告数据库中提取对应的广告数据。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7任一所述的广告转化率的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310308634.2A CN116012066A (zh) | 2023-03-28 | 2023-03-28 | 广告转化率的预测方法、装置、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310308634.2A CN116012066A (zh) | 2023-03-28 | 2023-03-28 | 广告转化率的预测方法、装置、可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116012066A true CN116012066A (zh) | 2023-04-25 |
Family
ID=86021426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310308634.2A Pending CN116012066A (zh) | 2023-03-28 | 2023-03-28 | 广告转化率的预测方法、装置、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116012066A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402553A (zh) * | 2023-06-07 | 2023-07-07 | 江西时刻互动科技股份有限公司 | 广告效果评估方法、装置及可读存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809144A (zh) * | 2014-01-28 | 2015-07-29 | 祁勇 | 一种基于辅助关键词的个性化广告投放方法 |
US20180232660A1 (en) * | 2017-02-15 | 2018-08-16 | Yahoo Holdings, Inc. | Method and system for adaptive online updating of ad related models |
CN110991490A (zh) * | 2019-11-11 | 2020-04-10 | 广州荔支网络技术有限公司 | 一种智能音频平台广告投放方法 |
CN111242700A (zh) * | 2020-02-15 | 2020-06-05 | 晓推(武汉)信息科技有限公司 | 广告的预测点击率获取方法、装置、电子设备和存储介质 |
WO2021039797A1 (ja) * | 2019-08-30 | 2021-03-04 | 株式会社Nttドコモ | クリック率予測モデル構築装置 |
CN112446738A (zh) * | 2020-12-03 | 2021-03-05 | 腾讯科技(深圳)有限公司 | 广告数据处理方法、装置、介质以及电子设备 |
CN113409090A (zh) * | 2021-07-05 | 2021-09-17 | 中国工商银行股份有限公司 | 广告点击率预测模型的训练方法、预测方法及装置 |
CN113516496A (zh) * | 2020-09-30 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 广告转化率预估模型构建方法、装置、设备及其介质 |
WO2022116431A1 (zh) * | 2020-12-02 | 2022-06-09 | 平安科技(深圳)有限公司 | 一种点击通过率ctr预测方法及装置 |
CN114612139A (zh) * | 2022-03-04 | 2022-06-10 | 广州起祥科技有限公司 | 一种广告方案处理方法、装置和电子设备 |
CN114862431A (zh) * | 2021-02-04 | 2022-08-05 | 腾讯科技(深圳)有限公司 | 广告转化特征的预测方法、装置 |
-
2023
- 2023-03-28 CN CN202310308634.2A patent/CN116012066A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809144A (zh) * | 2014-01-28 | 2015-07-29 | 祁勇 | 一种基于辅助关键词的个性化广告投放方法 |
US20180232660A1 (en) * | 2017-02-15 | 2018-08-16 | Yahoo Holdings, Inc. | Method and system for adaptive online updating of ad related models |
WO2021039797A1 (ja) * | 2019-08-30 | 2021-03-04 | 株式会社Nttドコモ | クリック率予測モデル構築装置 |
CN110991490A (zh) * | 2019-11-11 | 2020-04-10 | 广州荔支网络技术有限公司 | 一种智能音频平台广告投放方法 |
CN111242700A (zh) * | 2020-02-15 | 2020-06-05 | 晓推(武汉)信息科技有限公司 | 广告的预测点击率获取方法、装置、电子设备和存储介质 |
CN113516496A (zh) * | 2020-09-30 | 2021-10-19 | 腾讯科技(深圳)有限公司 | 广告转化率预估模型构建方法、装置、设备及其介质 |
WO2022116431A1 (zh) * | 2020-12-02 | 2022-06-09 | 平安科技(深圳)有限公司 | 一种点击通过率ctr预测方法及装置 |
CN112446738A (zh) * | 2020-12-03 | 2021-03-05 | 腾讯科技(深圳)有限公司 | 广告数据处理方法、装置、介质以及电子设备 |
CN114862431A (zh) * | 2021-02-04 | 2022-08-05 | 腾讯科技(深圳)有限公司 | 广告转化特征的预测方法、装置 |
CN113409090A (zh) * | 2021-07-05 | 2021-09-17 | 中国工商银行股份有限公司 | 广告点击率预测模型的训练方法、预测方法及装置 |
CN114612139A (zh) * | 2022-03-04 | 2022-06-10 | 广州起祥科技有限公司 | 一种广告方案处理方法、装置和电子设备 |
Non-Patent Citations (3)
Title |
---|
YANWU YANG 等: "Click-through rate prediction in online advertising: A literature review", 《INFORMATION PROCESSING & MANAGEMENT》, vol. 59, no. 2, pages 1 - 35 * |
汪宏基: "基于深度学习的广告点击率预估研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, vol. 2022, no. 2, pages 140 - 62 * |
邓秀勤 等: "基于特征工程的广告点击转化率预测模型", 《数据采集与处理》, vol. 35, no. 5, pages 842 - 849 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402553A (zh) * | 2023-06-07 | 2023-07-07 | 江西时刻互动科技股份有限公司 | 广告效果评估方法、装置及可读存储介质 |
CN116402553B (zh) * | 2023-06-07 | 2023-08-18 | 江西时刻互动科技股份有限公司 | 广告效果评估方法、装置及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111553759A (zh) | 一种产品信息推送方法、装置、设备及存储介质 | |
EP4322031A1 (en) | Recommendation method, recommendation model training method, and related product | |
CN112085565A (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN116012066A (zh) | 广告转化率的预测方法、装置、可读存储介质 | |
CN115935185A (zh) | 一种推荐模型的训练方法及装置 | |
CN113592593A (zh) | 序列推荐模型的训练及应用方法、装置、设备及存储介质 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN116739653A (zh) | 销售数据采集分析系统及其方法 | |
CN117437019A (zh) | 信用卡逾期风险预测方法、装置、设备、介质和程序产品 | |
CN116186541A (zh) | 一种推荐模型的训练方法及装置 | |
CN114897607A (zh) | 产品资源的数据处理方法及装置、电子设备、存储介质 | |
CN115222112A (zh) | 一种行为预测方法、行为预测模型的生成方法及电子设备 | |
CN110322150B (zh) | 一种信息审核方法、装置及服务器 | |
CN113553501A (zh) | 一种基于人工智能的用户画像预测的方法及装置 | |
CN116402553B (zh) | 广告效果评估方法、装置及可读存储介质 | |
CN115689648B (zh) | 应用于定向投放的用户信息处理方法及系统 | |
CN116977021B (zh) | 基于大数据的系统对接自动推单方法 | |
CN114219084B (zh) | 一种快消行业的访销陈列造假识别方法及装置 | |
CN114581249B (zh) | 基于投资风险承受能力评估的金融产品推荐方法及系统 | |
KR102653483B1 (ko) | 인공지능에 기반하여 미술품의 가격을 예측하는 방법 | |
CN113919893B (zh) | 信息推送方法、装置、电子设备和可读介质 | |
US20240013562A1 (en) | Methods, systems, articles of manufacture, and apparatus to determine related content in a document | |
CN117556822A (zh) | 基于文本的智能研判方法及装置、设备、存储介质 | |
CN116452333A (zh) | 异常交易检测模型的构建方法、异常交易检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230425 |