CN103853839A - 一种评测广告页面恶意点击疑似度的方法及装置 - Google Patents
一种评测广告页面恶意点击疑似度的方法及装置 Download PDFInfo
- Publication number
- CN103853839A CN103853839A CN201410101365.3A CN201410101365A CN103853839A CN 103853839 A CN103853839 A CN 103853839A CN 201410101365 A CN201410101365 A CN 201410101365A CN 103853839 A CN103853839 A CN 103853839A
- Authority
- CN
- China
- Prior art keywords
- visit information
- information set
- evaluation metrics
- evaluation
- advertisement page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0248—Avoiding fraud
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了一种评测广告页面恶意点击疑似度的方法及装置,方法包括:记录各IP地址各次访问所述广告页面的访问信息;从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合;分别对所筛选的两集合中的访问信息分别按照各评测指标进行统计;分别将所述两集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重;根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。本发明实施例的技术方案能全面准确地评测用户对广告页面的恶意点击疑似度。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种评测广告页面恶意点击疑似度的方法及装置。
背景技术
互联网广告主在搜索引擎投放推广的广告后,搜索引擎会根据网民的点击行为对广告主进行收费。这种计费方法在搜索引擎广告推广中普遍使用,但是对于网民恶意地进行广告点击,会造成广告主支付大量的无效广告费用的问题。
针对这种情况,目前互联网业界推出了防御恶意点击广告页面的系统,普遍工作原理是对互联网访问进行监控统计,人工设置规则对各IP进行过滤,在检测到某个IP的访问次数超过指定阈值时将该IP拉入推广广告忽略点击计费黑名单,或者通过代码屏蔽该IP实现阻击的目的和效果。
上述系统由于人工设置的规则主要依赖人的主观判断,而且所参考的数据较为片面且分析不够,很难针对全部访问来源的数据和全部访问时间的数据去分析用户的访问行为,这使得对恶意点击的识别不够准确、考虑因素不够全面。
发明内容
有鉴于此,本发明实施例提供一种评测广告页面恶意点击疑似度的方法及装置,以实现全面准确地识别出用户对广告页面的恶意点击。
本发明实施例采用以下技术方案:
第一方面,本发明实施例提供了一种评测广告页面恶意点击疑似度的方法,包括:
记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标;
从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合;
分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计;
分别将所述第一访问信息集合的各评测指标统计信息与所述第二访问信息集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重;
根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。
第二方面,本发明实施例还提供了一种评测广告页面恶意点击疑似度的装置,包括:
信息记录单元,用于记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标;
信息筛选单元,用于从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合;
评测指标统计单元,用于分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计;
评测指标筛选与权重获取单元,用于分别将所述第一访问信息集合的各评测指标统计信息与所述第二访问信息集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重;
疑似度评测单元,用于根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。
本发明实施例提出的技术方案的有益技术效果是:
本发明实施例的技术方案通过记录各IP地址各次访问所述广告页面的访问信息,从所记录的访问信息中筛选出第一访问信息集合和第二访问信息集合,分别将所述两集合的对应的评测指标统计信息进行对比,筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重,根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测,以全面准确地评测用户对广告页面的恶意点击疑似度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明具体实施例一所述的评测广告页面恶意点击疑似度的方法流程图;
图2是本发明具体实施例二所述的评测广告页面恶意点击疑似度的方法流程图;
图3是本发明具体实施例三所述的评测广告页面恶意点击疑似度的装置的结构框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
实施例一
图1是本实施例所述的评测广告页面恶意点击疑似度的方法流程图,本实施例可适用于搜索引擎服务方所服务的广告主的广告页面的恶意点击进行防御的情况,该方法可以由第三方软件公司的服务器来执行,也可由各广告页面的广告主方面的服务器执行,如图1所示,本实施例所述的评测广告页面恶意点击疑似度的方法包括:
S101、记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标。
所述访问信息包括但不限于各IP地址各次访问所述广告页面的时间、层级数、停留时间和/或COOKIE信息。所述评测指标包括但不限于访问所述广告页面的时间、层级数、停留时间等信息中的至少一种。
本实施例中,对所述访问信息进行记录可为多种方式,包括但不限于在广告页面植入程序代码来获取或直接从广告页面对应的搜索引擎方提供。
S102、从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合。
按照用户访问方式来说,所述访问信息包括但不限于用户通过付费搜索广告进入所述广告页面的访问信息、通过搜索引擎自然搜索进入所述广告页面的访问信息、通过直接输入URL(统一资源定位符)进入所述广告页面的访问信息、通过其他网页中所提供的链接进入所述广告页面的访问信息等。
按照用户访问时间来说,所述访问信息包括近期访问信息和历史访问信息。例如,可获取近一小时内通过所述付费搜索广告进入所述广告页面的访问信息,也可获取近一日、一周、一月和一年内通过所述付费搜索广告进入所述广告页面的访问信息。
本实施例的目的是在评测各IP地址的恶意点击疑似度时,尽量使参考的数据更加全面,因此,本步骤目的在于会尽可能地将时间最近的通过付费搜索广告进入所述广告页面的访问信息与针对全部访问来源的数据或全部访问时间的数据进行比较,以使评测更加全面和准确。因此,从所记录的访问信息中筛选出最能反应当前的通过付费搜索广告进入所述广告页面的第一访问信息集合和对于为第一访问信息集合的评测提供参考的第二访问信息集合。
所述第二访问信息集合可以是所记录的访问信息中除第一访问信息集合中的访问信息以外的访问信息,或者是从所记录的访问信息中按照其他算法筛选出的访问信息,或者是所记录的访问信息的全部,例如所记录的全部访问信息中删除按某项指标排序后前预设数目或比例的访问信息。
S103、分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计。
例如:对第一访问信息集合中的访问信息,分别按照访问层级数、停留时间、访问页面顺序等进行统计;对第二访问信息集合中的访问信息,也分别按照访问层级数、停留时间、访问页面顺序等进行统计。
其中,进行统计的方式有多种,包括但不限于求平均、求算术平均、求几何平均、求方差等。
S104、分别将所述第一访问信息集合的各评测指标统计信息与所述第二访问信息集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重。
例如,若第一访问信息集合中,停留时间平均值为30秒;访问顺序为1-3-2占60%,1-2-3占15%,1-2占15%,1-3占5%,1占5%;访问层级数平均值为3*(60%+15%)+2*(15%+5%)+1*5%=2.7。
若第二访问信息集合中,停留时间平均值为5秒;访问顺序为1-3-2占30%,1-2-3占45%,1-2占5%,1-3占5%,1占15%;访问层级数平均值为3*(30%+45%)+2*(5%+5%)+1*15%=2.6。
若预先设置访问顺序的百分比阈值为15%,分别将两个访问信息集合的访问顺序进行对比,存在访问顺序为1-3-2的比例之差为30%,超过了预先设置的访问顺序的百分比阈值,则将访问顺序作为所筛选出的反应对所述广告页面恶意点击倾向的评测指标。
若预先设置停留时间阈值为5秒,分别将两个访问信息集合的停留时间平均值进行对比,两个集息集合中停留时间平均值差值为25秒,超过了预先设置停留时间阈值,则将停留时间也作为所筛选出的著反应对所述广告页面恶意点击倾向的评测指标。
若预先设置访问层级数阈值为0.3,则分别将两个访问信息集合的访问层级数平均值进行对比,未超过预先设置的访问层级数阈值,则不将访问层级数作为所筛选出的反应对所述广告页面恶意点击倾向的评测指标。
至此,筛选出了访问顺序和停留时间作为所筛选出的反应对所述广告页面恶意点击倾向的评测指标。
若预先设置访问顺序对应的权重为:两个访问信息集合的访问顺序比例之差中的最大比例之差,与预先设置访问顺序的百分比阈值为之间的比值;预先设置停留时间对应的权重为:两个访问信息集合的停留时间差值与预先设置停留时间阈值之间的比值;预先设置访问层级数对应的权重为:两个访问信息集合的平均访问层级数与预先设置访问层级数阈值之间的比值,则很容易计算所筛选的评测指标所对应的权重。
例如,访问顺序对应的权重为:(60%-30%)/15%=2;
停留时间对应的权重为:两个集息集合中停留时间平均值差值/预先设置停留时间阈值=25/5=5。
当然,上述示例所使用算法比较简单,具体地计算所筛选的评测指标所对应的权重的算法可根据数值特点预先设置更加科学的算法。S105、根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。
本实施例中,本步骤中进行评测时所依据的访问信息包括但不限于当前获取的访问信息、也可以是第一访问信息集合和第二访问信息集合。
本实施例的技术方案通过记录各IP地址各次访问所述广告页面的访问信息,从所记录的访问信息中筛选出第一访问信息集合和第二访问信息集合,分别将所述两集合的对应的评测指标统计信息进行对比,筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重,根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测,以全面准确地评测用户对广告页面的恶意点击疑似度。
实施例二
图2是本实施例所述的评测广告页面恶意点击疑似度的方法流程图,如图2所示,本实施例所述的评测广告页面恶意点击疑似度的方法包括:
S201、数据收集与整理。
记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标;
从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合。包括但不限于以下三种方式:
方式一、从所记录的访问信息中根据是否是通过付费搜索广告访问所述广告页面来筛选出第一访问信息集合和第二访问信息集合。
方式二、从所记录的访问信息中根据访问时间是否距当前时间在预设时长阈值之内来筛选出第一访问信息集合和第二访问信息集合。
方式三、从所记录的访问信息中筛选出距当前时间在预设时长阈值之内,且通过付费搜索广告访问所述广告页面的访问信息作为第一访问信息集合,将所记录的访问信息中除第一访问信息集合中的访问信息作为第二访问信息集合。
本实施例以横向数据收集与整理和纵向数据收集与整理为例,说明一种数据收集与整理的方法。
横向数据收集与整理:包含通过付费搜索广告访问的访问信息、未通过付费搜索广告访问的访问信息,其中付费搜索广告访问的访问信息为主要分析数据,未通过付费搜索广告访问的访问信息为对比分析数据。
纵向数据收集与整理:在时间维度上,收集近一周的访问信息作为对比分析数据,以近一小时内的访问信息作为主要分析数据;
数据记录方式:尽量详细的记录访问信息,按访问对数据进行记录,每条数据记录应包含但不限本次访问IP地址、访问cookie、访问方式、访问页面、停留时间、进入页面及访问次序、触发关键词等。
S202、横向对比分析。
本步骤用于分别对所述第一访问信息集合和所述第二访问信息集合中各评测指标求取平均值、算术平均值、几何平均值或方差值。
本实施例中,本步骤具体用于对步骤S201所收集整理的通过付费搜索广告访问的访问信息和未通过付费搜索广告访问的访问信息进行数据分析,找出恶意访问规律和对访问情况进行分类的评测指标。
将每个付费搜索广告访问的访问信息各个评测指标与其他过其他方式访问的访问信息的总体指评测标进行对比,查看单个付费搜索广告访问的IP地址反映出来的恶意点击倾向是否明显,根据不同评测指标反应出了的恶意点击倾向对单个IP地址进行疑似度评分,本领域的技术人员需要明确的是,此处针对不同的评测指标预先设置有不同的评分函数。
S203、纵向对比分析。
将对步骤S201所收集整理的近一小时内的每个付费搜索广告访问的访问信息各个评测指标与近一周内的付费搜索广告访问的访问信息的总体评测指标。本领域的技术人员需要明确的是,此处可排除掉已经指定为恶意点击的访问信息或在S202步中疑似度评分较高的访问信息进行对比,查看单个付费搜索广告访问的IP地址反映出来的恶意点击倾向是否明显,根据不同评测指标反应出了的恶意点击倾向对单个IP地址进行疑似度评分,本领域的技术人员需要明确的是,此处针对不同的评测指标预先设置有不同的评分函数。
S204、筛选显著性评测指标。
本步骤用于根据各评测指标所对应的预设阈值,将所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值与对应的评测指标的预设阈值进行比较,将超过阈值的评测指标作为所筛选的反应对所述广告页面恶意点击倾向的评测指标,根据所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值按照预设算法获取所筛选的评测指标所对应的权重。
根据S202和S203两步得到的结果筛选出能够反应恶意点击倾向的评测指标,并对不同的评测指标根据其重要性给予不同的权重。
S205、计算恶意点击疑似度。
为了提高计算效率,根据不同广告商的要求和广告页面的情况可以在期初进行适当的人工介入,挑选出一些明显为恶意点击的访问信息予以标注,这样可以使得系统能够在期初更准确的锁定恶意点击,帮助系统更快速的学习成长。
针对不同的IP地址,在疑似度评分过程予以不同的加成。对于以前出现过且疑似度评分较高的IP地址在疑似度评分过程给予向上加成,疑似度评分较高出现的次数越多,该IP地址的疑似度评分结果就会越高;相反,对于以前出现过且疑似度评分较低的IP地址在疑似度评分过程给予向下加成,疑似度评分较低出现的次数越多,该IP地址的疑似度评分结果就会越低。
本实施例所述的评测指标学习机制,是根据系统运行的历史情况中不同评测指标在反应恶意点击疑似度倾向上的不同对不同评测指标的重要性给予一定的加成。
本实施例中,整体疑似度计算,是根据不同评测指标计算出来的恶意点击疑似度评分根据不同评测指标的权重值予以平均(算术平均或几何平均),结果即为整体的恶意点击疑似度。
相较于现有的人工方式处理关键词过程,本实施例的方案有以下优点:
第一、利用机器自动进行恶意点击疑似度评估,根据评估结果进行过滤,可以同时对大量数据进行监控,同时对大量的账户和访问IP地址的恶意点击疑似度进行评估,解决了人工操作力不从心的问题;
第二、考虑全部访问来源的数据,利用各种数据的横向、纵向的对比分析,使得对恶意点击疑似度的评估更加全面、更加客观,解决了主观评估恶意点击疑似度时考虑不足不能全面分析的问题,消除了不同人员因各种原因对恶意点击疑似度评估不相一致的情况;
第三、机器学习过程会针对不同的客户存在不同的处理方式,例如各个评测指标和访问IP地址的加成不同、恶意点击疑似度评估函数的参数不同等,这些不同的处理使得恶意点击疑似度的评估更加具有针对性、更加切合该账户的情况,能够根据全部访问来源数据进行实时调整恶意点击疑似度的评估规则,大幅提升对恶意点击行为的统一管理和应变能力,更加准确的找到恶意点击的访问IP地址,及时反应,从而将恶意访问带来的影响降到最低;
最后、利用机器学习机制和数据的对比,从而实现对恶意点击的行为进行自动化的识别和防御,大幅度降低了在对恶意点击发生时需要人为参与,人为鉴别的投入,也降低了搜索引擎广告主在实施对恶意点击进行防御时需要的知识门槛,而且,自动进行有效防御大幅提升了防御行为的实时性和快捷性,大幅降低搜索引擎广告主因恶意点击引起的无效花费。
实施例三
图3是本实施例所述的评测广告页面恶意点击疑似度的装置的结构框图,如图3所示,本实施例所述的评测广告页面恶意点击疑似度的装置包括:
信息记录单元301,用于记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标;
信息筛选单元302,用于从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合;
评测指标统计单元303,用于分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计;
评测指标筛选与权重获取单元304,用于分别将所述第一访问信息集合的各评测指标统计信息与所述第二访问信息集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重;
疑似度评测单元305,用于根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。
进一步地,所述信息筛选单元302具体用于:从所记录的访问信息中根据是否是通过付费搜索广告访问所述广告页面来筛选出第一访问信息集合和第二访问信息集合。
或者,所述信息筛选单元302具体用于:从所记录的访问信息中根据访问时间是否距当前时间在预设时长阈值之内来筛选出第一访问信息集合和第二访问信息集合。
或者,所述信息筛选单元302中筛选出第一访问信息集合具体包括:从所记录的访问信息中筛选出距当前时间在预设时长阈值之内,且通过付费搜索广告访问所述广告页面的访问信息作为第一访问信息集合。
进一步地,所述评测指标统计单元303具体用于:分别对所述第一访问信息集合和所述第二访问信息集合中各评测指标求取平均值、算术平均值、几何平均值或方差值。
进一步地,其特征在于,所述评测指标筛选与权重获取单元304具体用于:根据各评测指标所对应的预设阈值,将所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值与对应的评测指标的预设阈值进行比较,将超过阈值的评测指标作为所筛选的反应对所述广告页面恶意点击倾向的评测指标,根据所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值按照预设算法获取所筛选的评测指标所对应的权重。
本实施例的技术方案通过记录各IP地址各次访问所述广告页面的访问信息,从所记录的访问信息中筛选出第一访问信息集合和第二访问信息集合,分别将所述两集合的对应的评测指标统计信息进行对比,筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重,根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测,以全面准确地评测用户对广告页面的恶意点击疑似度。
以上实施例提供的技术方案中的全部或部分内容可以通过软件编程实现,其软件程序存储在可读取的存储介质中,存储介质例如:计算机中的硬盘、光盘或软盘。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (12)
1.一种评测广告页面恶意点击疑似度的方法,其特征在于,包括:
记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标;
从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合;
分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计;
分别将所述第一访问信息集合的各评测指标统计信息与所述第二访问信息集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重;
根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。
2.如权利要求1所述的评测广告页面恶意点击疑似度的方法,其特征在于,所述从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合的步骤具体包括:从所记录的访问信息中根据是否是通过付费搜索广告访问所述广告页面来筛选出第一访问信息集合和第二访问信息集合,或从所记录的访问信息中根据访问时间是否距当前时间在预设时长阈值之内来筛选出第一访问信息集合和第二访问信息集合。
3.如权利要求1所述的评测广告页面恶意点击疑似度的方法,其特征在于,所述从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合的步骤具体包括:从所记录的访问信息中筛选出距当前时间在预设时长阈值之内,且通过付费搜索广告访问所述广告页面的访问信息作为第一访问信息集合,将所记录的访问信息中剩余的访问信息作为第二访问信息集合。
4.如权利要求1所述的评测广告页面恶意点击疑似度的方法,其特征在于,分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计的步骤具体包括:分别对所述第一访问信息集合和所述第二访问信息集合中各评测指标求取平均值、算术平均值、几何平均值或方差值。
5.如权利要求1或4所述的评测广告页面恶意点击疑似度的方法,其特征在于,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重的步骤具体包括:根据各评测指标所对应的预设阈值,将所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值与对应的评测指标的预设阈值进行比较,将超过阈值的评测指标作为所筛选的反应对所述广告页面恶意点击倾向的评测指标,根据所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值按照第二预设算法获取所筛选的评测指标所对应的权重。
6.如权利要求5所述的评测广告页面恶意点击疑似度的方法,其特征在于,所述根据所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值按照第二预设算法获取所筛选的评测指标所对应的权重的步骤具体包括:分别将所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值与对应的评测指标所对应的预设阈值之间的比值作为各评测指标所对应的权重。
7.一种评测广告页面恶意点击疑似度的装置,其特征在于,包括:
信息记录单元,用于记录各IP地址各次访问所述广告页面的访问信息,所述访问信息包括至少一种评测指标;
信息筛选单元,用于从所记录的访问信息中按照第一预设算法筛选出第一访问信息集合和第二访问信息集合;
评测指标统计单元,用于分别对所筛选的所述第一访问信息集合和所述第二访问信息集合中的访问信息分别按照各评测指标进行统计;
评测指标筛选与权重获取单元,用于分别将所述第一访问信息集合的各评测指标统计信息与所述第二访问信息集合的对应的评测指标统计信息进行对比,按照第二预设算法筛选出反应对所述广告页面恶意点击倾向的至少一种评测指标并获取所筛选的评测指标所对应的权重;
疑似度评测单元,用于根据所筛选的评测指标和所筛选的评测指标所对应的权重分别对各IP地址的恶意点击疑似度进行评测。
8.如权利要求7所述的评测广告页面恶意点击疑似度的装置,其特征在于,所述信息筛选单元具体用于:从所记录的访问信息中根据是否是通过付费搜索广告访问所述广告页面来筛选出第一访问信息集合和第二访问信息集合,或从所记录的访问信息中根据访问时间是否距当前时间在预设时长阈值之内来筛选出第一访问信息集合和第二访问信息集合。
9.如权利要求7所述的评测广告页面恶意点击疑似度的装置,其特征在于,所述信息筛选单元中筛选出第一访问信息集合具体包括:从所记录的访问信息中筛选出距当前时间在预设时长阈值之内,且通过付费搜索广告访问所述广告页面的访问信息作为第一访问信息集合,将所记录的访问信息中剩余的访问信息作为第二访问信息集合。
10.如权利要求7所述的评测广告页面恶意点击疑似度的装置,其特征在于,所述评测指标统计单元具体用于:分别对所述第一访问信息集合和所述第二访问信息集合中各评测指标求取平均值、算术平均值、几何平均值或方差值。
11.如权利要求7或11所述的评测广告页面恶意点击疑似度的装置,其特征在于,所述评测指标筛选与权重获取单元具体用于:根据各评测指标所对应的预设阈值,将所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值与对应的评测指标的预设阈值进行比较,将超过阈值的评测指标作为所筛选的反应对所述广告页面恶意点击倾向的评测指标,根据所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值按照预设算法获取所筛选的评测指标所对应的权重。
12.如权利要求11所述的评测广告页面恶意点击疑似度的装置,其特征在于,所述根据所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值按照第二预设算法获取所筛选的评测指标所对应的权重具体包括:分别将所述第一访问信息集合与所述第二访问信息集合中各评测指标的统计结果的差值与对应的评测指标所对应的预设阈值之间的比值作为各评测指标所对应的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410101365.3A CN103853839A (zh) | 2014-03-18 | 2014-03-18 | 一种评测广告页面恶意点击疑似度的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410101365.3A CN103853839A (zh) | 2014-03-18 | 2014-03-18 | 一种评测广告页面恶意点击疑似度的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103853839A true CN103853839A (zh) | 2014-06-11 |
Family
ID=50861494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410101365.3A Pending CN103853839A (zh) | 2014-03-18 | 2014-03-18 | 一种评测广告页面恶意点击疑似度的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103853839A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765874A (zh) * | 2015-04-24 | 2015-07-08 | 百度在线网络技术(北京)有限公司 | 用于检测点击作弊的方法及装置 |
CN106301979A (zh) * | 2015-05-27 | 2017-01-04 | 腾讯科技(北京)有限公司 | 检测异常渠道的方法和系统 |
CN106612202A (zh) * | 2015-10-27 | 2017-05-03 | 网易(杭州)网络有限公司 | 一种网游渠道刷量的预估判别方法及系统 |
CN107229557A (zh) * | 2017-06-26 | 2017-10-03 | 微鲸科技有限公司 | 异常点击检测方法及装置、点击量统计方法及装置 |
CN107483443A (zh) * | 2017-08-22 | 2017-12-15 | 北京京东尚科信息技术有限公司 | 广告信息处理方法、客户端、存储介质和电子设备 |
CN107578263A (zh) * | 2017-07-21 | 2018-01-12 | 北京奇艺世纪科技有限公司 | 一种广告异常访问的检测方法、装置和电子设备 |
CN108234413A (zh) * | 2016-12-15 | 2018-06-29 | 北京奇虎科技有限公司 | 广告流量质量的确定方法、装置及广告平台 |
CN109213651A (zh) * | 2017-06-29 | 2019-01-15 | 北京三快在线科技有限公司 | 一种对象监控方法及装置、电子设备 |
CN110209561A (zh) * | 2019-05-09 | 2019-09-06 | 北京百度网讯科技有限公司 | 用于对话平台的评测方法和评测装置 |
CN111461545A (zh) * | 2020-03-31 | 2020-07-28 | 北京深演智能科技股份有限公司 | 机器访问数据的确定方法及装置 |
CN111723119A (zh) * | 2019-03-18 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 一种筛选方法及装置、存储介质 |
CN112597531A (zh) * | 2020-12-04 | 2021-04-02 | 光大科技有限公司 | 一种数据产品管理方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101882278A (zh) * | 2009-05-06 | 2010-11-10 | 李先进 | 一种阻止网页广告被恶意点击的方法与系统 |
CN102340514A (zh) * | 2010-07-15 | 2012-02-01 | 腾讯科技(北京)有限公司 | 网络信息推送方法及系统 |
CN102594771A (zh) * | 2011-01-07 | 2012-07-18 | 北京开心人信息技术有限公司 | 一种过滤非正常点击广告的方法及系统 |
US20130080248A1 (en) * | 2004-10-26 | 2013-03-28 | John Linden | Method for performing real-time click fraud detection, prevention and reporting for online advertising |
-
2014
- 2014-03-18 CN CN201410101365.3A patent/CN103853839A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130080248A1 (en) * | 2004-10-26 | 2013-03-28 | John Linden | Method for performing real-time click fraud detection, prevention and reporting for online advertising |
CN101882278A (zh) * | 2009-05-06 | 2010-11-10 | 李先进 | 一种阻止网页广告被恶意点击的方法与系统 |
CN102340514A (zh) * | 2010-07-15 | 2012-02-01 | 腾讯科技(北京)有限公司 | 网络信息推送方法及系统 |
CN102594771A (zh) * | 2011-01-07 | 2012-07-18 | 北京开心人信息技术有限公司 | 一种过滤非正常点击广告的方法及系统 |
Non-Patent Citations (2)
Title |
---|
王彦平等: "《网站分析实战 如何以数据驱动策略,提升网站价值》", 31 January 2013 * |
蓝鲸: "使用Google Analytics辨别虚假流量(三)", 《HTTP://BLUEWHALE.CC/2013-02-01/GOOGLE-ANALYTICS-IDENTIFY-FALSE-TRAFFIC-3.HTML》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765874A (zh) * | 2015-04-24 | 2015-07-08 | 百度在线网络技术(北京)有限公司 | 用于检测点击作弊的方法及装置 |
CN104765874B (zh) * | 2015-04-24 | 2019-03-26 | 百度在线网络技术(北京)有限公司 | 用于检测点击作弊的方法及装置 |
CN106301979A (zh) * | 2015-05-27 | 2017-01-04 | 腾讯科技(北京)有限公司 | 检测异常渠道的方法和系统 |
CN106301979B (zh) * | 2015-05-27 | 2020-04-28 | 腾讯科技(北京)有限公司 | 检测异常渠道的方法和系统 |
CN106612202A (zh) * | 2015-10-27 | 2017-05-03 | 网易(杭州)网络有限公司 | 一种网游渠道刷量的预估判别方法及系统 |
CN108234413A (zh) * | 2016-12-15 | 2018-06-29 | 北京奇虎科技有限公司 | 广告流量质量的确定方法、装置及广告平台 |
CN107229557B (zh) * | 2017-06-26 | 2020-10-20 | 微鲸科技有限公司 | 异常点击检测方法及装置、点击量统计方法及装置 |
CN107229557A (zh) * | 2017-06-26 | 2017-10-03 | 微鲸科技有限公司 | 异常点击检测方法及装置、点击量统计方法及装置 |
CN109213651A (zh) * | 2017-06-29 | 2019-01-15 | 北京三快在线科技有限公司 | 一种对象监控方法及装置、电子设备 |
CN107578263A (zh) * | 2017-07-21 | 2018-01-12 | 北京奇艺世纪科技有限公司 | 一种广告异常访问的检测方法、装置和电子设备 |
CN107578263B (zh) * | 2017-07-21 | 2021-01-05 | 北京奇艺世纪科技有限公司 | 一种广告异常访问的检测方法、装置和电子设备 |
CN107483443A (zh) * | 2017-08-22 | 2017-12-15 | 北京京东尚科信息技术有限公司 | 广告信息处理方法、客户端、存储介质和电子设备 |
CN107483443B (zh) * | 2017-08-22 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 广告信息处理方法、客户端、存储介质和电子设备 |
CN111723119A (zh) * | 2019-03-18 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 一种筛选方法及装置、存储介质 |
CN110209561A (zh) * | 2019-05-09 | 2019-09-06 | 北京百度网讯科技有限公司 | 用于对话平台的评测方法和评测装置 |
CN110209561B (zh) * | 2019-05-09 | 2024-02-09 | 北京百度网讯科技有限公司 | 用于对话平台的评测方法和评测装置 |
CN111461545A (zh) * | 2020-03-31 | 2020-07-28 | 北京深演智能科技股份有限公司 | 机器访问数据的确定方法及装置 |
CN111461545B (zh) * | 2020-03-31 | 2023-11-10 | 北京深演智能科技股份有限公司 | 机器访问数据的确定方法及装置 |
CN112597531A (zh) * | 2020-12-04 | 2021-04-02 | 光大科技有限公司 | 一种数据产品管理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103853839A (zh) | 一种评测广告页面恶意点击疑似度的方法及装置 | |
CN106022834B (zh) | 广告反作弊方法及装置 | |
WO2020248508A1 (zh) | 广告渠道的评估方法、装置、设备和存储介质 | |
Song et al. | Crowdtarget: Target-based detection of crowdturfing in online social networks | |
US20150379266A1 (en) | System And Method For Identification Of Non-Human Users Accessing Content | |
Yang et al. | Bot electioneering volume: Visualizing social bot activity during elections | |
CN109873832B (zh) | 流量识别方法、装置、电子设备和存储介质 | |
Chen et al. | Toward detecting collusive ranking manipulation attackers in mobile app markets | |
CN104050178A (zh) | 一种互联网监测反作弊方法和装置 | |
CN110706030B (zh) | 一种广告投放方法、装置、系统及存储介质 | |
CN103870572B (zh) | 一种防御恶意点击广告页面的方法及装置 | |
CN106355431A (zh) | 作弊流量检测方法、装置及终端 | |
CN109191191B (zh) | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 | |
CN102117466A (zh) | 一种定向投放网络广告的方法及系统 | |
US9245035B2 (en) | Information processing system, information processing method, program, and non-transitory information storage medium | |
KR20060028463A (ko) | 온라인 광고 시스템에서의 이용자 부정 클릭 추적과 방지시스템 및 그 방법 | |
CN103731284A (zh) | 关联多个网络帐号的方法和系统 | |
CN107578263A (zh) | 一种广告异常访问的检测方法、装置和电子设备 | |
CN107797894A (zh) | App用户行为分析方法和装置 | |
CN103605714A (zh) | 网站异常数据的识别方法及装置 | |
CN107888602A (zh) | 一种检测异常用户的方法及装置 | |
CN115408586B (zh) | 一种智能渠道运营数据分析方法、系统、设备及存储介质 | |
CN106327230A (zh) | 一种异常用户检测方法及设备 | |
CN106021552A (zh) | 基于人群行为模拟的互联网爬虫并发数据采集方法及系统 | |
JP2007286803A (ja) | 広告配信管理装置、広告配信管理方法、広告配信管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140611 |
|
RJ01 | Rejection of invention patent application after publication |