CN107665444B - 一种基于用户在线行为的网络广告即时效应评价方法及系统 - Google Patents
一种基于用户在线行为的网络广告即时效应评价方法及系统 Download PDFInfo
- Publication number
- CN107665444B CN107665444B CN201710355401.2A CN201710355401A CN107665444B CN 107665444 B CN107665444 B CN 107665444B CN 201710355401 A CN201710355401 A CN 201710355401A CN 107665444 B CN107665444 B CN 107665444B
- Authority
- CN
- China
- Prior art keywords
- user
- behavior
- advertisement
- network
- influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0245—Surveys
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0276—Advertisement creation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种基于用户在线行为的网络广告即时效应评价体系的构建方法,包括:获取网络用户广告点击行为之后的后继网站访问行为数据,分析网络用户的线上行为特征;结合网站内容特征和上述用户线上行为特征建立用户行为模型;并基于用户行为模型构建网络广告即时效应(是否购买)的评估模型;本发明在评估网络广告即时效应时不仅考虑网络用户点击广告之后的购买行为信息,更考虑了网络用户具体的页面访问信息,能够更加准确的分析不同网络广告形式对用户访问和购买行为的真实影响力,为投放网络广告的企业更好地制定广告策略提供决策支持。
Description
技术领域
本发明涉及互联网技术领域,特别涉及一种基于用户在线行为的网络广告即时效应评价方法及系统。
背景技术
目前,网络广告已经成为市场营销的重要方式,受到了越来越多企业的关注。网络广告的选择不当或是投入不当都将导致企业广告费用的浪费和企业经济利益的下滑,为此网络广告的效应评估成为业界和学术界所共同关心的话题。区别于传统广告形式的是,网络广告从投放到用户浏览、用户点击至用户最后的购买行为均被服务器所记录,为更加准确的鉴定网络广告效应提供数据基础,即可以通过服务器记录的各种用户行为数据,建立分析模型对不同类型网络广告的各自效应进行评价,从而为企业选择更加有效的网络广告形式,制定更加准确的广告策略、提高广告费用效率提供决策支持。
现有的针对网络广告的评估方法(申请专利号:CN103605763A,CN105005918,CN104252679)中一般是获取用户广告浏览与响应数据,分析用户的行为偏好得出线上用户行为模型,根据用户行为模型通过主成分分析、概率主题模型和隐马尔科夫模型等数据挖掘方式分析各个网络广告渠道对用户行为影响的重要性程度,从而对网络广告效应进行评价。然而,在上述过程中,用户数据均采用的是用户广告点击行为之前的线上访问数据,尚未出现基于用户广告点击行为之后的访问行为的网络广告效应评价。用户广告点击之后的站点访问行为由企业服务器记录,相较于之前研究中的爬虫抓取方式,数据更加全面、完整;相较于用户在不同网站间的浏览数据,用户在网络广告点击之后进入某个站点的访问行为数据更贴近企业自身属性,所获得的网络广告效应评价也更贴近企业的现实情况;最后,企业广告投放的最终目的是促进用户购买,相较于广告点击行为这一评价指标,将用户的购买行为作为网络广告即时效应的评价指标更加符合企业现实需求。
发明内容
本发明的目的主要是为投放网络广告的企业制定相关广告策略建立决策支持,提供一种基于用户在线行为的网络广告即时效应评价方法和系统,其中即时效应通过用户购买行为转化率进行描述。
为实现上述目的,本发明的技术方案如下:
一种基于用户在线行为的网络广告即时效应评价体系的构建方法,包括以下步骤:
A.获取一段时间(一季度到一年不等)内,投放网络广告的企业在WEB服务器上记录的用户站点访问日志信息;
B.在所有用户站点访问信息中根据预设的无效访问条件对日志数据中不影响用户行为建模的无效访问数据进行清洗,生成基础用户行为数据集;
C.根据业务流程对用户站点访问行为建模,结合网站内容特征,以单cookies用户的一次会话(session)为单位提取用户广告点击行为之后的站点访问特征并剔除非网络广告引致的站点访问会话,构建用户行为特征数据集,即以每一个用户单次会话为单位对象,通过用户特征提取函数获得一条用户特征数据,从而构建用户行为特征数据集;
D.根据C提取的用户行为特征数据集,运用Relief-F特征选择算法对用户特征属性进行特征选择,筛选出对建模结果满足一定影响程度的用户特征,获得最终用户行为特征数据集作为建模阶段输入数据;
E.根据D中所获得的最终用户行为特征数据集,采用逻辑回归数据集进行建模,在一定的迭代次数下,得到多种网络广告的整体用户购买转化模型和单一网络广告影响下的包含浏览、收藏、购买等多种用户在线行为的转化模型;
F.根据E中所获得的用户模型,解释各个参数的实际管理含义,分析不同网络广告对购买转化率的影响、对后续站点访问行为转化的影响,构建网络广告即时效应评价体系。
其中,所述的网络广告即时效应评价体系包括:用户行为评价维度,具体包括广告行为、浏览行为、搜索行为、兴趣特征和购买行为;以及,所述评价维度对应的评估指标。
所述步骤B中的不同网络广告类型包括但不限于:展示广告(banneradvertising)、付费搜索广告(paid search advertising)、电子邮件广告(e-mailadvertising)等。
所述步骤B中涉及的无效访问包括加载页面、爬虫访问、url识别异常等等;其中加载页面是指短信验证、图形访问等请求;url识别即结合企业站点给出的url规则对访问url记录进行识别,url识别异常即未能有效解析和识别为url异常的记录,对这部分记录进行删减。
所述步骤C中的方法包括将用户行为数据依据cookies和IP区别为不同访问用户,将前后浏览记录时间间隔大于30分钟的两次访问分割为不同的访问session,即两个会话。
所述步骤D中的特征选择方法是但不限于Relief-F,还包括随机森林、深度学习等其他方法。
所述步骤E中的用户行为建模包含两个部分:多种网络广告的整体建模和单一类型的不同网络广告方式的具体即时效应评价建模,方式是但不限于逻辑回归,还可以是多元回归、随机森林等方法,本发明采用的是逻辑回归。
所述步骤F的参数分析是解释逻辑回归建模之后,所得各个模型参数的数值含义,如不同网络广告对用户行为的影响形式(正面影响、负面影响)和影响大小、不同网络广告对后续用户站点访问行为的影响以及这种影响对最终购买行为的转化关系等,为企业制定广告投放策略提供决策依据。
其中,所述网络广告即时效应评价指标具体为:
所述用户广告行为对应的评价指标包括但不限于是否来自展示广告、是否来自付费搜索广告、是否来自电子邮件广告等;
所述用户浏览行为对应的评价指标包括但不限于访问页面总数、浏览时长、浏览商品详情页数、浏览商品详情页时长、网站回访次数等;
所述用户搜索行为对应的评价指标包括但不限于搜索次数、搜索关键词、搜索行为比例等;
所述用户兴趣特征对应的评价指标包括但不限于是否参与话题讨论、参与话题讨论次数、商品收藏次数等;
所述用户购买行为对应的评价指标包括但不限于是否加入购物车、是否查看购物车、最终是否购买等。
所述网络广告即时效应评估体系的构建系统包括:
用户行为数据分析子系统,用于获取企业站点用户的线上行为数据,进行数据清洗、用户行为属性计算和分析用户行为特征;
模型建立子系统,根据分析所得用户行为特征,基于权利要求6-7中所述方法,建立用户行为模型,从而构建多种网络广告的整体购买转化模型和单一类型的不同网络广告的具体即时效应评价模型;
模型评估子系统,根据所得模型的参数估计结合参数的具体管理含义,生成网络广告即时效应分析报告并按照一定周期进行更新,为投放网络广告的企业管理层制定合理的广告投资策略提供科学依据。
本发明的有益效果:与现有技术相比,本发明至少具有以下优点:
在本发明中,能够基于用户网络广告点击行为之后的后续访问数据和购买数据,对不同形式的网络广告的即时效应进行评价,并有效识别效益最高的网络广告类型;更进一步,本发明将网络广告即时效应评价方法写入系统,定期自动生成一段时间内不同形式的网络广告的即时效应报告,为企业制定广告策略提供决策支持;此外,本发明还可以更深层次的挖掘出用户网络购买行为规律和广告点击规律,并结合相关用户属性如页面浏览时长、页面跳转次数等优化网站建设。本发明在评估网络广告即时效应时不仅考虑网络用户点击广告之后的购买行为信息,更考虑了网络用户具体的页面访问信息,能够更加准确的分析不同网络广告形式对用户访问和购买行为的真实影响力,为投放网络广告的企业更好地制定广告策略提供决策支持。在随后的附图说明和具体实施方式进一步详细阐述本发明的优点和特征。
附图说明
图1为根据本发明实现的一种基于用户在线行为的网络广告即时效应评价方法的流程图;
图2为根据本发明的基于用户在线行为模型构建网络广告即时效应评估体系的示意图;
图3为根据本发明实现数据预处理的流程图。
图4为根据本发明实现的网络广告即时效应评价系统的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细描述。
图1描述了如何基于用户在线行为来实现网络广告即时效应评价的整个流程,具体实现如下:
步骤101:获取一段时间内(一季度到一年不等)的某家投放网络广告的企业的用户站点访问数据。具体地,用户指企业站点的消费者,本发明特指通过网络广告点击进入站点的用户。这里网络广告包含展示广告(banner advertising)、付费搜索广告(paidsearch advertising)、电子邮件广告(e-mail advertising)等。这部分用户的站点访问行为一般包括:通过网络广告进入站点,浏览页面相关内容;对站点产品产生兴趣,收藏某样或多样产品;想要了解更多相关产品信息,在站点搜索相关产品;对产品产生购买倾向,加入购物车或直接购买。特别地,本发明采用的数据是企业日常网络运行中服务器所记录的用户数据信息,无需借助外部爬虫直接采自企业数据库,所获取的用户数据更加完全、准确。
步骤102:经过数据清洗,筛选由网络广告点击进入站点的用户访问数据,并删除爬虫等无效访问数据,得到基础数据集。具体地,无效访问数据可能产生的原因有:①处理过程页面、跳转页面和提示页面(成功或错误)等;②用户在提出访问请求时,自动产生的附属文件的下载信息;③企业内部测试人员的访问信息,企业内部人员由于对站点的熟悉度高、使用频率高等特性,对网站的访问行为不具有代表性,也当剔除;④网站爬虫抓取站点信息时产生的访问记录等等。上述访问记录无关研究主题,反而增加所需处理的数据量,增大时间耗费甚至导致错误的分析结果,因此在用户行为建模之前,需将这部分数据全部删除。
步骤103:根据业务流程对用户站点访问行为建模,结合网站内容特征,以单cookies用户会话为单位提取用户特征构建用户行为特征数据集。
具体的,用户行为特征数据集即网络广告即时效应评价的指标主要包含五个方面,具体构建方式如图2表示。
其中,用户广告行为表示用户的广告接触方式和点击偏好,标志用户来源广告渠道,为进一步用户行为分析奠定基础;用户浏览行为表示用户站点的一般访问行为,如页面浏览数等;用户搜索行为表示用户在企业站点内部发出的搜索请求;用户兴趣特征是用户在积累一定的站点经验之后,根据自身需求和兴趣收藏商品或参与互动等,与浏览行为、搜索行为一起用于描述网站粘度;用户购买行为表示用户的购买倾向性或是购买行为,也是网络广告即时效应的最终评价标志。前四个方面的用户行为来自web日志数据库,最后一个方面的用户行为则来自站点交易数据库。
进一步地,用户行为特征计算过程具体如图3所示,其过程包括:
首先是用户识别。用户识别是将服务器记录的访问数据按照单一用户进行划分,得出同一用户的所有访问记录。现有的用户识别方法常用的是基于IP地址或是cookies的单一识别方式。IP识别方式较为简单,但随着动态IP和子网的出现导致同一个IP的请求行为实际上可能是多个用户共同请求的结果;cookies相对而言能更加准确地识别用户,但也存在着“一个用户使用多个浏览器”或是“一个浏览器被多个用户所使用”的情况。因此本发明提出了一种结合cookies和IP识别方式的用户识别方法,其基本原理是优先以cookies识别用户,当出现用户禁用cookies时,采用IP地址联合用户代理的方式识别用户,具体为:
第一步,根据是否采集到用户的Cookie信息,为属于同一天的所有有Cookie的用户按照其Cookie为其添加唯一识别的ID。
第二步,将所有没有Cookie的用户取出,以IP地址分组。
第三步,在每一个IP分组内找到其用户代理Agent,其用户代理可以表示其所用设备类型,操作系统和浏览器类型。为某一个IP地址内的用某一个代理发出请求的用户添加唯一识别的ID。
第四步,最终用户识别的映射为:
其次是会话(session)识别。会话识别是将用户的多次访问进行划分,常见的会话识别方式有设置会话时间上界、按照时间阈值划分和参引页划分三种方式,本发明采用的是时间阈值划分方式,即按照一定的时间阈值,将超过该阈值的两次访问记录划分为两个会话。这里的时间阈值可按照站点自身属性进行设置,本发明采用的30分钟。需要特殊说明的是,进行会话识别后,需要剔除非广告点击进入的站点访问数据,因为本发明研究的是网络广告的即时效应,通过网络广告点击行为之后的在线访问行为对网络广告即时效应进行评价,因此直接进入站点的访问行为如输入站点地址、网页收藏夹点击进入等记录不再此次研究之列。所以在用户特征计算之前删除这部分用户会话。
接着是用户行为特征计算。用户行为特征已在图2中详细介绍,这里不再赘述。通过R语言等统计程序,计算每一个用户每一个回话相应的属性特征数据,每一个会话对应一条特征数据,合并特征数据获得用户特征数据集。
步骤104:根据提取的用户行为特征数据集,运用Relief-F进行特征选择,并采用逻辑回归算法训练特征选择后的数据集,获取每个网络广告类型的特征大小。
本发明采用Relief-F算法进行用户特征选择,其根据各个特征和类别的相关性赋予特征不同的权重,并移除权重小于某个阈值的特征,特征选择的具体过程包括:
第一步,以D表示用户特征数据集,Ai(i=1,2,…,n)表示用户的n个特征。T为希望获得的各个特征的权重并将所有特征权重设初始值0,令样本抽样次数为m。
第二步,每次从用户特征数据集中随机取出一个样本R,然后从和R同类的样本集中找出R的k个近邻样本(Near Hits),记为Hj(j=1,2,…,k);从每个R的不同类的样本集中均找出k个近邻样本(Near Misses),记为Mj(C)表示类C中的第j个最近邻样本
第三步,更新每个特征的权重,其计算公式如下:,
从而计算得各个用户行为特征的权重,排序删选后获得更为合理的用户行为属性集。
步骤105:本发明通过逻辑回归方式对用户行为属性集进行建模。逻辑回归模型以购买行为特征为因变量,描述广告来源客户行为特征的特征变量为自变量。其主要方法包括:
经过前期特征提取和选择获得的数据集包括网络广告来源(广告行为)和用户行为特征数据(浏览行为、搜索行为和兴趣特征)(X,Y)=(x1,x2,…,xm,y1,y2,…,yn),记xi为消费者广告来源的类型特征(展示广告、搜索广告、电子邮件广告等),记yj为第j个用户行为特征(三种行为特征的具体用户属性,如浏览时长、搜索次数等)。
则构建的逻辑回归模型如下:
hα,β(x,y)=p(purchase|X,Y)=Logit(αX+βY+ε)
=[1+exp(α1x1+α2x2+…+θmxm+β1y1+β2y2+…+βnyn+ε)]-1
其中hα,β(x,y)为用户购买行为特征变量(网络广告即时效应),(α,β)分别为网络广告来源特征和用户行为特征的影响系数,如αi表示第i个网络广告来源特征的影响系数。
最后,根据用户行为特征数据估计各个影响系数α1,α2,…,αm和β1,β2,…,βn,获得网络广告即时效应评价模型。
需要说明的是,在这个步骤中包含两个建模过程,首先是结合用户广告行为和购买行为的网络广告整体即时效应模型,即这里的模型输入参数仅为X(用户的广告行为:是否来自展示广告、是否来自付费搜索广告及是否来自电子邮件广告等),每一个具体行为参数均为(0/1)变量,此时逻辑回归模型转化为:
hα(x)=p(purchase|X)=Logit(αX+ε)
=[1+exp(α1x1+α2x2+…+θmxm+ε)]-1
该模型获得的是三种网络广告类型对用户购买转化的影响,α1,α2,…,αm分别表示不同网络广告来兴对用户转化的影响方向(正面影响或负面影响)和影响程度大小。
其次是结合用户广告行为、浏览行为、搜索行为、兴趣特征和购买行为的单一的不同广告形式的即时效应评价模型。这里每一个(y1,y2,…,yn)表示的是具有q个元素的向量(q为分析的广告种类数),y1,y2,…,yn表示用户行为属性向量,相应的参数变化为
βi(βi1,βi2,…,βin),βij表示示第i种网络广告来源的第j个用户行为特征,此时逻辑回归模型转化为:
hβ(y)=p(purchase|Y)=Logit(βY+ε)
第二个模型获得是不同网络广告形式进入站点的用户的不同在线行为模式,参数结果表示不同网络广告类型对用户后继站点访问行为的影响类型和影响大小,并通过这种影响方式构建单一网络广告类型下的即时效应(是否购买)评价模型。步骤106:通过估计所得的模型各个参数,判别各种网络广告形式及用户行为对最终购买行为(即时效应)的影响类型(正面影响或是负面影响)和影响程度大小,探究各种网络广告对用户在线行为的影响机制,从而分析网络广告即时效应的形成机理。
本发明还提供了一种网络广告即时效应评价系统,具体子系统和模块如图4所示,包括:
用户行为数据分析子系统,这部分主要用于获取用户信息并处理,获得用户特征行为数据集,该子系统包括:用户行为数据获取模块,用于抓取企业站点一段时间内的用户访问数据;数据预处理模块,用户数据预处理具体过程如图3所示,主要包含数据清洗和用户特征计算,具体内容已在前文详述,这里不再赘述。
模型建立子系统,这部分主要用于用户属性选择和用户模型建立,用户模型包含多种网络广告的整体购买转化模型和单一类型的不同网络广告的具体即时效应评价模型两大部分,该子系统包括:用户属性选择模块和用户行为建模模块,对数据处理模块获得的用户行为特征数据进行逻辑回归建模,获得网络广告即时效应评价模型。
模型评估子系统,包含网络广告即时效应的评价分析和报告的定时更新,评价分析是对建模结果进行模型解释,根据模型参数数值及其管理含义,生成不同网络广告即时效应的评价报告和网络广告影响下用户在线行为转化的分析报告;更新模块是按照一定时间周期,如一季度或是半年等对网络广告即时效应评价模型和评价报告进行更新,为企业决策者提供最新的网络广告有效性分析。
以上显示和描述了本发明的基本原理、主要方法和自身优点,本发明通过用户广告点击行为之后的站点访问行为研究网络广告即时效应,服务的是投放网络广告的各类企业的广告投资决策和其他营销决策,方法不受行业、领域限制。
Claims (7)
1.一种基于用户在线行为的网络广告即时效应评价体系的构建方法,其特征是,该方法步骤包括:获取网络用户广告点击行为之后的后继网站访问行为数据,分析网络用户的线上行为特征;结合网站内容特征和上述网络用户行为特征建立用户行为模型;并基于用户行为模型构建网络广告即时效应的评估模型;即时效应即是否购买;
A.获取一段时间长度内投放网络广告的企业在WEB服务器上记录的用户站点访问日志信息;一段时间长度指一季度到一年不等;
B.在所有用户站点访问日志信息中根据预设的无效访问条件对日志信息中不影响用户行为建模的无效访问数据进行清洗,生成基础用户行为数据集;用户站点访问日志信息包括用户对不同网络广告类型的访问信息;
C.根据业务流程对用户站点访问的行为建模,结合网站内容特征,以单cookies用户的一次会话session为单位提取用户广告点击行为之后的站点访问特征并剔除非网络广告导致的站点访问会话,构建用户行为特征数据集,即以每一个用户单次会话为单位对象,通过用户特征数据提取函数获得一条用户特征数据,从而构建用户行为特征数据集;
D.根据C提取的用户行为特征数据集,运用Relief-F特征选择算法对用户行为特征选择,筛选出对建模结果满足一定影响程度的用户行为特征,获得最终用户行为特征数据集作为建模阶段输入数据;具体为:
首先是用户识别:用户识别是将服务器记录的访问数据按照单一用户进行划分,得出同一用户的所有访问记录:以cookies识别用户,当出现用户禁用cookies时,采用IP地址联合用户代理的方式识别用户,具体为:
第一步,根据是否采集到用户的Cookie信息,为属于同一天的所有有Cookie的用户按照其Cookie为其添加唯一识别的ID;
第二步,将所有没有Cookie的用户取出,以IP地址分组;
第三步,在每一个IP地址分组内找到用户代理Agent,用户代理表示其所用设备类型,操作系统和浏览器类型;一个IP地址内的用户代理为使用该用户代理发出请求的用户添加唯一识别的ID;
第四步,最终用户识别的映射为:
其次是会话session识别;会话识别是将用户的多次访问进行划分,常见的会话识别方式有设置会话时间上界、按照时间阈值划分和参引页划分三种方式;采用时间阈值划分方式,即按照30分钟时间阈值,将超过该阈值的两次访问记录划分为两个会话;
用户行为特征计算,通过R语言统计程序,计算每一个用户每一个会话相应的用户行为特征数据,每一个会话对应一条用户行为特征数据,合并用户行为特征数据获得用户行为特征数据集;
根据提取的用户行为特征数据集,采用Relief-F算法进行用户行为特征选择,根据各个特征和类别的相关性赋予特征不同的权重,并移除权重小于设定阈值的特征,特征选择的具体过程包括:
第一步,以D表示用户行为特征数据集,Ai(i=1,2,…,n)表示用户的n个特征;T为希望获得的各个特征的权重并将所有特征权重设初始值0,令样本抽样次数为m;
第二步,每次从用户行为特征数据集中随机取出一个样本R,然后从和R同类的样本集中找出R的k个近邻样本Near Hits,记为Hj(j=1,2,3);从每个R的不同类的样本集中均找出k个近邻样本Near Misses,记为Mj(C),表示类C中的第j个最近邻样本
第三步,更新每个特征的权重,其计算公式如下:
在上式中,P(C)表示第C类出现的概率,从而计算获得各个用户行为特征的权重,排序删选后获得更为合理的用户行为特征数据集;
E.根据D中所获得的最终用户行为特征数据集,采用逻辑回归方法进行用户行为特征数据建模,在一定的迭代次数下,得到多种网络广告的整体用户购买转化模型和单一网络广告类型影响下的用户在线行为的转化模型,即整体用户购买转化模型和用户在线行为的转化模型,用户在线行为包含浏览、收藏、购买多种用户在线行为;
所述步骤E中的用户行为建模包含所述整体用户购买转化模型和用户在线行为的转化模型建模两个部分:
逻辑回归方法以购买行为特征为因变量,描述广告来源用户行为特征的特征变量为自变量;
逻辑回归方法具体包括:经过前期特征提取和选择获得的用户行为特征数据集包括网络广告来源即广告行为数据和用户行为特征数据,用户行为特征数据包括浏览行为、搜索行为和兴趣特征:(X,Y)=(x1,x2,…,xm,y1,y2,…,yn),记xi为用户广告来源的类型特征,记yj为第j个用户行为特征;则构建的逻辑回归模型如下:
hα,β(x,y)=p(purchase|X,Y)=Logit(αX+βY+ε)
=[1+exp(α1x1+α2x2+...+θmxm+β1y1+β2y2+...+βnyn+ε)]-1
其中{hα,β(x,y)}为用户购买行为特征变量、即网络广告即时效应;α,β分别为网络广告来源特征和用户行为特征的影响系数,αi表示第i个网络广告来源特征的影响系数;
最后,根据用户行为特征数据估计各个影响系数α1,α2,…,αm和β1,β2,…,βn,获得网络广告即时效应评价模型;i=3,j=3;
在这个步骤中包含两个建模过程:
1)首先是结合用户广告行为和购买行为的网络广告整体即时效应的整体用户购买转化模型,这里的模型输入参数仅为X,即用户的广告行为,用户的广告行为包括:是否来自展示广告、是否来自付费搜索广告及是否来自电子邮件广告,每一个具体行为参数均为0/1变量,此时逻辑回归模型转化为:
hα(x)=p(purchase|X)=Logit(αX+ε)
=[1+exp(α1x1+α2x2+...+θmxm+ε)]-1
该模型获得的是三种网络广告类型对用户购买转化的影响,α1,α2,…,αm分别表示不同网络广告类型对用户转化的影响方向和影响程度大小,m=3;
2)其次是结合用户广告行为、浏览行为、搜索行为、兴趣特征和购买行为的单一网络广告类型影响下的用户在线行为的转化模型;这里每一个(y1,y2,…,yn)表示的是具有n个元素的向量、n为分析的广告种类数,n=3;(y1,y2,…,yn)表示用户行为属性向量,相应的参数变化为
βi(βi1,βi2,…,βin),βij表示第i种网络广告来源的第j个用户行为特征,此时逻辑回归模型转化为:
hβ(y)=p(purchase|Y)=Logit(βY+ε)
该模型获得是不同网络广告类型进入站点的用户的不同在线行为模式,参数结果表示不同网络广告类型对用户后继站点访问行为的影响类型和影响大小,并通过这种影响方式构建单一网络广告类型下的是否购买即时效应评价模型;
F.根据E中所获得的用户购买转化模型和用户在线行为的转化模型,进行所述转化模型的参数分析,解释各个参数的实际管理含义,分析不同网络广告类型对购买转化率的影响、对后续站点访问行为转化的影响,构建网络广告即时效应评价体系。
2.根据权利要求1所述的方法,其特征在于:其中,所述的网络广告即时效应评价体系包括:用户行为评价维度,具体包括广告行为、浏览行为、搜索行为、兴趣特征和购买行为;以及所述评价维度对应的评价指标。
3.根据权利要求1所述的方法,其特征在于:所述步骤B中的不同网络广告类型包括:展示广告、付费搜索广告和电子邮件广告。
4.根据权利要求1所述的方法,其特征在于:所述步骤B中涉及的无效访问包括加载页面、爬虫访问、url识别异常;其中加载页面是指短信验证、图形访问请求;url识别即结合企业站点给出的url规则对访问url记录进行识别,url识别异常即未能有效解析和识别为url的异常记录,对这部分记录进行删减。
5.根据权利要求1所述的方法,其特征在于:所述步骤C中的方法包括将用户行为数据依据cookies和IP区别为不同用户,将前后访问记录时间间隔大于30分钟的两次访问分割为不同的访问session,即两个会话。
6.根据权利要求1中所述的方法,其特征在于:所述步骤F的参数分析是解释逻辑回归建模之后,所得各个模型参数的数值含义,包括不同网络广告对用户行为的影响形式和影响大小、不同网络广告对后续用户站点访问行为的影响以及这种影响对最终购买行为的转化关系,为企业制定广告投放策略提供决策依据;通过估计所得的模型各个参数,判别各种网络广告类型及用户行为对最终购买行为即时效应的影响类型和影响程度大小,影响类型包括正面影响和负面影响,探究各种网络广告对用户在线行为的影响机制,从而分析网络广告即时效应的形成机理。
7.根据权利要求2所描述的方法,其特征在于:其中,所述评价指标具体为:所述用户广告行为对应的评价指标包括但不限于是否来自展示广告、是否来自付费搜索广告、是否来自电子邮件广告;所述用户浏览行为对应的评价指标包括访问页面总数、浏览时长、浏览商品详情页数、浏览商品详情页时长、网站回访次数;所述用户搜索行为对应的评价指标包括搜索次数、搜索关键词、搜索行为比例;所述用户兴趣特征对应的评价指标包括是否参与话题讨论、参与话题讨论次数、商品收藏次数;所述用户购买行为对应的评价指标包括但不限于是否加入购物车、是否查看购物车、最终是否购买。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710355401.2A CN107665444B (zh) | 2017-05-19 | 2017-05-19 | 一种基于用户在线行为的网络广告即时效应评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710355401.2A CN107665444B (zh) | 2017-05-19 | 2017-05-19 | 一种基于用户在线行为的网络广告即时效应评价方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107665444A CN107665444A (zh) | 2018-02-06 |
CN107665444B true CN107665444B (zh) | 2021-05-18 |
Family
ID=61122314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710355401.2A Active CN107665444B (zh) | 2017-05-19 | 2017-05-19 | 一种基于用户在线行为的网络广告即时效应评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107665444B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003114A (zh) * | 2018-06-01 | 2018-12-14 | 四川斐讯信息技术有限公司 | 一种营销策略预测方法、系统、计算机设备和存储介质 |
CN109447695A (zh) * | 2018-10-16 | 2019-03-08 | 翟红鹰 | 基于区块链的广告效果评估方法、终端及存储介质 |
CN111353795B (zh) * | 2018-12-20 | 2024-06-21 | 北京沃东天骏信息技术有限公司 | 广告效果的衡量方法、装置、介质及设备 |
CN109816436A (zh) * | 2019-01-09 | 2019-05-28 | 珠海天燕科技有限公司 | 一种多媒体资源的投放方法和装置 |
CN109919677A (zh) * | 2019-03-06 | 2019-06-21 | 厦门清谷信息技术有限公司 | 广告策略优化迭代的方法、装置及智能终端 |
CN110232595A (zh) * | 2019-06-13 | 2019-09-13 | 武汉十点半文化传播有限公司 | 一种基于网络广告的制作方法 |
CN110489525B (zh) * | 2019-08-09 | 2022-02-25 | 腾讯科技(深圳)有限公司 | 搜索结果的获取方法和装置、存储介质及电子装置 |
CN112446720B (zh) * | 2019-08-29 | 2024-05-14 | 北京搜狗科技发展有限公司 | 一种广告显示方法及装置 |
CN111221953B (zh) * | 2020-01-08 | 2024-03-08 | 南京新贝金服科技有限公司 | 一种在线售前客服效果评价方法 |
CN111563772B (zh) * | 2020-04-30 | 2023-07-25 | 北京百度网讯科技有限公司 | 广告信息访问质量确定方法、装置、电子设备及存储介质 |
CN113723982B (zh) * | 2020-05-26 | 2024-04-16 | 北京达佳互联信息技术有限公司 | 广告对用户体验影响评估方法、装置、服务器及存储介质 |
CN112001758B (zh) * | 2020-08-26 | 2024-01-30 | 豆盟(北京)科技股份有限公司 | 一种广告互动页的状态异常监测方法、装置 |
CN112732874A (zh) * | 2021-01-15 | 2021-04-30 | 北京明略昭辉科技有限公司 | 一种用户标识打通模型的训练方法及装置 |
CN112950273B (zh) * | 2021-03-09 | 2024-04-09 | 加和(北京)信息科技有限公司 | 广告投放策略的处理方法和装置 |
CN113781093A (zh) * | 2021-04-27 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 数据分析方法及装置、系统、存储介质、电子设备 |
CN113610564A (zh) * | 2021-07-19 | 2021-11-05 | 上海浦东发展银行股份有限公司 | 展示信息的数据处理方法、设备及存储介质 |
CN114549071A (zh) * | 2022-02-18 | 2022-05-27 | 上海钧正网络科技有限公司 | 一种营销策略的确定方法、装置、计算机设备及存储介质 |
CN115147156B (zh) * | 2022-07-07 | 2023-04-07 | 浙江出海云技术有限公司 | 一种基于神经网络的广告精准投放方法 |
CN115049445B (zh) * | 2022-08-17 | 2022-11-08 | 铅笔头(深圳)科技有限公司 | 一种基于影响力指标的广告制作评价系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110102560A (ko) * | 2010-03-11 | 2011-09-19 | 박희섭 | 콘텐츠 가변형 위젯을 이용한 즉석 온라인 광고 방법 |
CN102663616A (zh) * | 2012-03-19 | 2012-09-12 | 北京国双科技有限公司 | 一种基于多触点归因模型的网络广告效果衡量方法和系统 |
CN104252679A (zh) * | 2013-06-30 | 2014-12-31 | 北京百度网讯科技有限公司 | 一种品牌广告评估体系的构建方法及系统 |
CN105069654A (zh) * | 2015-08-07 | 2015-11-18 | 新一站保险代理有限公司 | 一种基于用户识别的网站实时/非实时营销投放方法及系统 |
CN106355432A (zh) * | 2016-08-19 | 2017-01-25 | 焦点科技股份有限公司 | 一种付费广告效果监测调控的方法 |
-
2017
- 2017-05-19 CN CN201710355401.2A patent/CN107665444B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110102560A (ko) * | 2010-03-11 | 2011-09-19 | 박희섭 | 콘텐츠 가변형 위젯을 이용한 즉석 온라인 광고 방법 |
CN102663616A (zh) * | 2012-03-19 | 2012-09-12 | 北京国双科技有限公司 | 一种基于多触点归因模型的网络广告效果衡量方法和系统 |
CN104252679A (zh) * | 2013-06-30 | 2014-12-31 | 北京百度网讯科技有限公司 | 一种品牌广告评估体系的构建方法及系统 |
CN105069654A (zh) * | 2015-08-07 | 2015-11-18 | 新一站保险代理有限公司 | 一种基于用户识别的网站实时/非实时营销投放方法及系统 |
CN106355432A (zh) * | 2016-08-19 | 2017-01-25 | 焦点科技股份有限公司 | 一种付费广告效果监测调控的方法 |
Non-Patent Citations (1)
Title |
---|
"B2C网上购物商城网络广告效果评价指标体系分析及构建";洪西文;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;20150715(第07期);参见正文第一到第五章 * |
Also Published As
Publication number | Publication date |
---|---|
CN107665444A (zh) | 2018-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107665444B (zh) | 一种基于用户在线行为的网络广告即时效应评价方法及系统 | |
White et al. | Assessing the scenic route: measuring the value of search trails in web logs | |
KR101104539B1 (ko) | 행위 타겟팅 시스템 | |
KR101044683B1 (ko) | 광고 품질을 예측하는 방법 및 시스템 | |
US7594189B1 (en) | Systems and methods for statistically selecting content items to be used in a dynamically-generated display | |
US8515937B1 (en) | Automated identification and assessment of keywords capable of driving traffic to particular sites | |
JP5078910B2 (ja) | 観察したユーザの行動からの広告品質の推定 | |
CN102289447B (zh) | 一种基于通讯网络报文的网站网页评价系统 | |
US8682723B2 (en) | Social analytics system and method for analyzing conversations in social media | |
US20090222557A1 (en) | Analysis system, information processing apparatus, activity analysis method and program product | |
JP5438087B2 (ja) | 広告配信装置 | |
US8504558B2 (en) | Framework to evaluate content display policies | |
CN106227832A (zh) | 互联网大数据技术架构在企业内业务分析中的应用方法 | |
CN102033883A (zh) | 一种提高网站数据传输速度的方法、装置及系统 | |
CN102254265A (zh) | 一种富媒体互联网广告内容匹配、效果评估方法 | |
CN117689426B (zh) | 一种多通路广告效果评估方法及系统 | |
Chen et al. | The best answers? think twice: online detection of commercial campaigns in the CQA forums | |
Dennis et al. | Data mining approach for user profile generation on advertisement serving | |
Nemeslaki et al. | Supporting e-business research with web crawler methodology | |
DINUCĂ | An application for data preprocessing and models extractions in web usage mining | |
US11727434B2 (en) | Management of cannibalistic ads to improve internet advertising efficiency | |
CN117114740B (zh) | 一种基于互联网的营销信息采集方法及装置 | |
Huang et al. | Predicting purchase proneness of anonymous user in mobile commerce | |
Sun et al. | Design and Implementation of an E-learning Model based on WUM Techniques | |
CA2665588C (en) | Method and system for determining on-line influence in social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210430 Address after: 210000 5th floor, East Tower, focus science and technology building, No.7 Lijing Road, Jiangbei new district, Nanjing City, Jiangsu Province Applicant after: NANJING XINBEI JINFU TECHNOLOGY Co.,Ltd. Address before: 210061 2F, block A, software building, Spark Road, Nanjing high tech Zone, Jiangsu Applicant before: XINYIZHAN INSURANCE AGENCY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |