CN110992104A - 一种基于用户画像的异常广告流量检测方法 - Google Patents
一种基于用户画像的异常广告流量检测方法 Download PDFInfo
- Publication number
- CN110992104A CN110992104A CN201911263227.4A CN201911263227A CN110992104A CN 110992104 A CN110992104 A CN 110992104A CN 201911263227 A CN201911263227 A CN 201911263227A CN 110992104 A CN110992104 A CN 110992104A
- Authority
- CN
- China
- Prior art keywords
- user
- time
- advertisement
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Abstract
本发明公开了一种基于用户画像的异常广告流量检测方法,通过网页操作数据收集用户属性,追踪用户行为信息,并通过特征模型针对用户的属性以及行为分析进行特征识别,依据特征勾画出用户画像,即通过特征可以实现用户标签化,最后通过聚类分析,识别出是否为有效用户。本发明结合用户历史数据,能够准确地识别出异常流量,同时该方案结合实时分析技术能够加快异常流量监测速度,提高了时效性。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种基于用户画像的异常广告流量检测方法。
背景技术
随着互联网技术的发展,人们的生活方式也发生了变化,在线广告业务需求在不断增长,越来越的广告主选择在线投放广告,面对巨大市场利润,在线广告业务恶意作弊现象日趋严重,对在线广告行业以及广告主带来了巨大损失。
发明内容
本发明的目的是针对现有技术的缺陷,提供了了一种有效鉴别异常广告流量方法,主要用于解决在信息有限的web端环境下如何有效地鉴别异常流量,确保广告主的利益。
为了实现以上目的,本发明采用以下技术方案:
一种基于用户画像的异常广告流量检测方法,包括以下步骤:
步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;
步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;
步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;
步骤四、对步骤三得到用户特征信息,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。
进一步的,步骤一中,用户属性信息包括户标识符、IP地址、请求时间、点击时间、广告主题。
进一步的,步骤一中,用户行为信息包括页面操作数据、在线停留时间信息。
进一步的,步骤四中,按时间维度、地域维度辅助分析用户流量,具体步骤如下:
(1)按时间、地域、广告类型维度统计数据,时间维度分为,时、天、月,地域维度按照实际地理位置进行划分,广告类型按照用户浏览的广告类型数据进行划分;
(2)在步骤(1)的基础上分析用户历史数据,计算流量趋势,按照趋势数据预测时间广告异常状况。
进一步的,步骤二中,用户标签包括以下信息:
用户标识符,是用户唯一性标识信息,用于连接用户的行文以及属性;IP地址,用于标识出用户的地址位置信息;广告主题,用于表示出用户兴趣点;请求时间,按照小时进行分片,标注用户当前浏览时间;点击时间,按照小时进行分片,标注用户当前浏览点击广告时间;在线停留时间,按照秒单位进行统计,注明用户页面停留时间;页面操作数据,按照操作类型进行统计,包括点击次数、点击位置、页面移动。
进一步的,步骤三中,调整用户特征信息具体包括:
IP地址、请求时间统计:通过分析地理纬度变化情况以及联合请求时间纬度,标识出用户地理位置变动幅度数据;通过广告主题统计,分析历史广告主题浏览记录统计出用户广告主题浏览类型数据;请求时间,通过请求时间统计出用户请求频率数据;点击时间,通过请求时间以及点击时间统计出用户操作频率数据;在线停留时间,通过分析在线停留时间统计出用户浏览页面频率;页面操作数据,通过页面操作数据统计出用户平均浏览有效操作数据。
采用本发明技术方案,本发明的有益效果为:与现有技术相比,本发明通过一系列用户行为进行分析,同时结合用户历史数据,能够准确地识别出异常流量,同时该方案结合实时分析技术能够加快异常流量监测速度,增加时效性。
附图说明
图1是现有技术流程图一种基于用户画像的异常广告流量检测方法。
具体实施方式
结合附图对本发明具体方案具体实施例作进一步的阐述。
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
本发明方法通过网页操作数据收集用户属性,追踪用户行为信息,通过特征模型针对用户的属性以及行为分析进行特征识别,依据特征勾画出用户画像,通过特征可以实现用户标签化,最后通过聚类分析,识别出是否为有效用户。其中有效流量代表有效用户的行为,有效用户代表有效流量,其它类型用户表示异常流量。
实施例一、
具体如图所示,一种基于用户画像的异常广告流量检测方法,包括以下步骤:
步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;
步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;
步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;这一步骤针对用户历史上下文数据进行分析,即单次用户行为无法准确勾画出用户画像信息,结合历史数据进行分析能够更加精准地勾画出用户的画像信息。
步骤四、对步骤三得到用户特征信息,即用户画像,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。
步骤一中,用户属性信息包括户标识符、IP地址、请求时间、点击时间、广告主题。用户行为信息包括页面操作数据、在线停留时间信息。
实施例二、
为了更加精准预测异常流量,在实施例一的基础上,步骤四中,可进一步的按时间维度、地域维度辅助分析用户流量,具体步骤如下:
(1)按时间、地域、广告类型维度统计数据,时间维度分为,时、天、月,地域维度按照实际地理位置进行划分,广告类型按照用户浏览的广告类型数据进行划分;
(2)在步骤(1)的基础上分析用户历史数据,计算流量趋势,按照趋势数据预测时间广告异常状况。
本发明步骤二中,用户标签包括以下信息:
用户标识符,是用户唯一性标识信息,用于连接用户的行文以及属性;IP地址,用于标识出用户的地址位置信息;广告主题,用于表示出用户兴趣点;请求时间,按照小时进行分片,标注用户当前浏览时间;点击时间,按照小时进行分片,标注用户当前浏览点击广告时间;在线停留时间,按照秒单位进行统计,注明用户页面停留时间;页面操作数据,按照操作类型进行统计,包括点击次数、点击位置、页面移动。
本发明步骤三中,调整用户特征信息具体包括:
IP地址、请求时间统计:通过分析地理纬度变化情况以及联合请求时间纬度,标识出用户地理位置变动幅度数据;通过广告主题统计,分析历史广告主题浏览记录统计出用户广告主题浏览类型数据;请求时间,通过请求时间统计出用户请求频率数据;点击时间,通过请求时间以及点击时间统计出用户操作频率数据;在线停留时间,通过分析在线停留时间统计出用户浏览页面频率;页面操作数据,通过页面操作数据统计出用户平均浏览有效操作数据。
本发明采用实时数据分析+历史数据预测方式从系统层面和用户层面两个方面进行流量异常分析,提高检测准确度。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (6)
1.一种基于用户画像的异常广告流量检测方法,其特征在于,包括以下步骤:
步骤一、对用户浏览的广告进行用户行为追踪:收集用户属性信息及用户行为信息,并通过浏览器中的Cookie信息定位用户,同时通过IP信息二次定位用户;
步骤二、对用户属性进行特征化分析:针对单次用户分析收集到的用户属性以、行为信息及时间段内整体流量情况,每一个属性以及行为都会生成一个用户标签;
步骤三、在步骤二的基础上对单个用户进行画像分析:通过聚合分析多个用户标签的历史数据,进一步调整用户特征信息;
步骤四、对步骤三得到用户特征信息,通过使用k-means聚类算法,针对上述特征进行聚类分析,得到用户类型,判断是否为有效用户,据此判断出该用户流量是否为有效流量。
2.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤一中,用户属性信息包括户标识符、IP地址、请求时间、点击时间、广告主题。
3.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤一中,用户行为信息包括页面操作数据、在线停留时间信息。
4.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤四中,按时间维度、地域维度辅助分析用户流量,具体步骤如下:
(1)按时间、地域、广告类型维度统计数据,时间维度分为,时、天、月,地域维度按照实际地理位置进行划分,广告类型按照用户浏览的广告类型数据进行划分;
(2)在步骤(1)的基础上分析用户历史数据,计算流量趋势,按照趋势数据预测时间广告异常状况。
5.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤二中,用户标签包括以下信息:
用户标识符,是用户唯一性标识信息,用于连接用户的行文以及属性;IP地址,用于标识出用户的地址位置信息;广告主题,用于表示出用户兴趣点;请求时间,按照小时进行分片,标注用户当前浏览时间;点击时间,按照小时进行分片,标注用户当前浏览点击广告时间;在线停留时间,按照秒单位进行统计,注明用户页面停留时间;页面操作数据,按照操作类型进行统计,包括点击次数、点击位置、页面移动。
6.如权利要求1所述的一种基于用户画像的异常广告流量检测方法,其特征在于,步骤三中,调整用户特征信息具体包括:
IP地址、请求时间统计:通过分析地理纬度变化情况以及联合请求时间纬度,标识出用户地理位置变动幅度数据;通过广告主题统计,分析历史广告主题浏览记录统计出用户广告主题浏览类型数据;请求时间,通过请求时间统计出用户请求频率数据;点击时间,通过请求时间以及点击时间统计出用户操作频率数据;在线停留时间,通过分析在线停留时间统计出用户浏览页面频率;页面操作数据,通过页面操作数据统计出用户平均浏览有效操作数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911263227.4A CN110992104A (zh) | 2019-12-11 | 2019-12-11 | 一种基于用户画像的异常广告流量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911263227.4A CN110992104A (zh) | 2019-12-11 | 2019-12-11 | 一种基于用户画像的异常广告流量检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110992104A true CN110992104A (zh) | 2020-04-10 |
Family
ID=70092195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911263227.4A Pending CN110992104A (zh) | 2019-12-11 | 2019-12-11 | 一种基于用户画像的异常广告流量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110992104A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738770A (zh) * | 2020-06-28 | 2020-10-02 | 北京达佳互联信息技术有限公司 | 广告异常流量检测方法及装置 |
CN112073393A (zh) * | 2020-08-27 | 2020-12-11 | 黄天红 | 基于云计算和用户行为分析的流量检测方法及大数据中心 |
CN113343791A (zh) * | 2021-05-21 | 2021-09-03 | 浙江邦业科技股份有限公司 | 基于卷积神经网络的窑头看火视频亮度识别方法及装置 |
CN114155027A (zh) * | 2021-12-01 | 2022-03-08 | 广州智会云科技发展有限公司 | 一种企业获客管理系统 |
CN115423536A (zh) * | 2022-10-31 | 2022-12-02 | 北京学橙归来科技有限公司 | 一种在用户管理系统中发布广告信息的控制方法 |
CN116150541A (zh) * | 2023-04-19 | 2023-05-23 | 中国信息通信研究院 | 后台系统的识别方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447383A (zh) * | 2016-08-30 | 2017-02-22 | 杭州启冠网络技术有限公司 | 跨时间、多维度异常数据监测的方法和系统 |
CN109711885A (zh) * | 2018-12-27 | 2019-05-03 | 上海旺翔文化传媒股份有限公司 | 激励视频广告智能投放方法 |
CN110097389A (zh) * | 2018-01-31 | 2019-08-06 | 上海甚术网络科技有限公司 | 一种广告流量反作弊方法 |
CN110198310A (zh) * | 2019-05-20 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 一种网络行为反作弊方法、装置及存储介质 |
CN110300084A (zh) * | 2018-03-22 | 2019-10-01 | 北京京东尚科信息技术有限公司 | 一种基于ip地址的画像方法和装置 |
-
2019
- 2019-12-11 CN CN201911263227.4A patent/CN110992104A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447383A (zh) * | 2016-08-30 | 2017-02-22 | 杭州启冠网络技术有限公司 | 跨时间、多维度异常数据监测的方法和系统 |
CN110097389A (zh) * | 2018-01-31 | 2019-08-06 | 上海甚术网络科技有限公司 | 一种广告流量反作弊方法 |
CN110300084A (zh) * | 2018-03-22 | 2019-10-01 | 北京京东尚科信息技术有限公司 | 一种基于ip地址的画像方法和装置 |
CN109711885A (zh) * | 2018-12-27 | 2019-05-03 | 上海旺翔文化传媒股份有限公司 | 激励视频广告智能投放方法 |
CN110198310A (zh) * | 2019-05-20 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 一种网络行为反作弊方法、装置及存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738770A (zh) * | 2020-06-28 | 2020-10-02 | 北京达佳互联信息技术有限公司 | 广告异常流量检测方法及装置 |
CN111738770B (zh) * | 2020-06-28 | 2023-09-26 | 北京达佳互联信息技术有限公司 | 广告异常流量检测方法及装置 |
CN112073393A (zh) * | 2020-08-27 | 2020-12-11 | 黄天红 | 基于云计算和用户行为分析的流量检测方法及大数据中心 |
CN113343791A (zh) * | 2021-05-21 | 2021-09-03 | 浙江邦业科技股份有限公司 | 基于卷积神经网络的窑头看火视频亮度识别方法及装置 |
CN113343791B (zh) * | 2021-05-21 | 2023-06-16 | 浙江邦业科技股份有限公司 | 基于卷积神经网络的窑头看火视频亮度识别方法及装置 |
CN114155027A (zh) * | 2021-12-01 | 2022-03-08 | 广州智会云科技发展有限公司 | 一种企业获客管理系统 |
CN115423536A (zh) * | 2022-10-31 | 2022-12-02 | 北京学橙归来科技有限公司 | 一种在用户管理系统中发布广告信息的控制方法 |
CN115423536B (zh) * | 2022-10-31 | 2023-01-17 | 北京学橙归来科技有限公司 | 一种在用户管理系统中发布广告信息的控制方法 |
CN116150541A (zh) * | 2023-04-19 | 2023-05-23 | 中国信息通信研究院 | 后台系统的识别方法、装置、设备及存储介质 |
CN116150541B (zh) * | 2023-04-19 | 2023-06-23 | 中国信息通信研究院 | 后台系统的识别方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110992104A (zh) | 一种基于用户画像的异常广告流量检测方法 | |
US20210287250A1 (en) | Providing data and analysis for advertising on networked devices | |
US20230316333A1 (en) | Determining targeting information based on a predictive targeting model | |
JP6226846B2 (ja) | 情報分析装置、情報分析方法および情報分析プログラム | |
WO2019095417A1 (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
US20120123993A1 (en) | Action Prediction and Identification Temporal User Behavior | |
US20140351046A1 (en) | System and Method for Predicting an Outcome By a User in a Single Score | |
CN104834641B (zh) | 网络媒介信息的处理方法和相关系统 | |
JP2014531649A (ja) | ソーシャル・ネットワーキング・システムを通じて伝搬される通信の効果の理解 | |
US20110119267A1 (en) | Method and system for processing web activity data | |
CN105224623A (zh) | 数据模型的训练方法及装置 | |
CN103345512A (zh) | 一种基于用户属性的网络广告点击率预测方法和装置 | |
CN103136695A (zh) | 媒体投放价值分析方法及其系统 | |
JP7271529B2 (ja) | 自動化されたアトリビューションモデリングおよび測定 | |
CN107657048A (zh) | 用户识别方法及装置 | |
WO2013019324A1 (en) | Deriving ads ranking of local advertisers based on distance and aggregate user activities | |
CN110310163A (zh) | 一种精准制定营销策略的方法、设备及可读介质 | |
US8099322B2 (en) | Time factor feature generation system, time factor feature generation method and time factor feature generation program | |
CN106611353B (zh) | 一种获取受众的方法和服务器设备 | |
JP7285521B2 (ja) | 類似のモバイル装置を予測するためのシステムと方法 | |
CN104574146A (zh) | 一种业务推荐的方法和系统 | |
CN104881803A (zh) | 一种分析广告点击链接的方法及装置 | |
US20120084142A1 (en) | Bid landscape forecasting in online advertising | |
Wang et al. | Probabilistic models for ad viewability prediction on the web | |
CN103617146B (zh) | 一种基于硬件资源消耗的机器学习方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |