CN109586990A - 一种识别作弊流量的方法及装置 - Google Patents

一种识别作弊流量的方法及装置 Download PDF

Info

Publication number
CN109586990A
CN109586990A CN201710907062.4A CN201710907062A CN109586990A CN 109586990 A CN109586990 A CN 109586990A CN 201710907062 A CN201710907062 A CN 201710907062A CN 109586990 A CN109586990 A CN 109586990A
Authority
CN
China
Prior art keywords
page
access
stay time
flowing
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710907062.4A
Other languages
English (en)
Other versions
CN109586990B (zh
Inventor
刘振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710907062.4A priority Critical patent/CN109586990B/zh
Publication of CN109586990A publication Critical patent/CN109586990A/zh
Application granted granted Critical
Publication of CN109586990B publication Critical patent/CN109586990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/067Generation of reports using time frame reporting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种识别作弊流量的方法及装置,可以获取来自设定渠道的设定时长内的访问流量的页面停留时长分布,并将该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布进行对比。如果该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布不同,并且其页面停留时长分布呈现作弊流量典型的页面停留时长U型分布,则可以判断该访问流量为作弊流量。本发明技术方案从访问流量的页面停留时长分布入手判断其是否为作弊流量,具备更高的判断准确性。

Description

一种识别作弊流量的方法及装置
技术领域
本发明涉及流量监控技术领域,尤其涉及一种识别作弊流量的方法及装置。
背景技术
互联网广告引流是各大网站获取新流量的重要方式之一。在互联网广告引流方案中,广告主通过广告售卖方(广告渠道)展示广告链接,用户在广告售卖方网站点击广告主的广告链接,访问广告主网站,即完成了广告引流的目的。
而部分广告售卖方经常利用机器(计算机)模拟用户点击广告主的广告链接,以流量作弊的方法欺骗广告主,以损害广告主的利益而获取收益。因此,对于广告主来说,识别作弊流量,是提高广告效益的重要手段。常用的识别作弊流量的方法是,计算多个指标维度(广告来源、浏览器版本、操作系统等)下页面访问的平均停留时间和停留页面,作为识别作弊流量的判断指标。这些指标虽然易于计算和展示,但是也容易被机器模仿,由此导致,以页面访问的平均停留时间和停留页面为依据,并不能准确地识别作弊流量。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的识别作弊流量的方法及装置。具体方案如下:
一种识别作弊流量的方法,包括:
获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;
如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
可选的,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:
分别统计所述访问流量中的各个页面访问的页面停留时长;
根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
可选的,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
可选的,该方法还包括:
预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
可选的,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:
分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
一种识别作弊流量的装置,包括:
流量获取单元,用于获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
分析处理单元,用于根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
对比处理单元,用于将所述分析处理单元分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
判断处理单元,用于当所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同时,判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
可选的,所述分析处理单元,包括:
第一统计单元,用于分别统计所述访问流量中的各个页面访问的页面停留时长;
第二统计单元,用于根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
计算单元,用于分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
汇总处理单元,用于根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
可选的,所述判断处理单元判断所述访问流量的页面停留时长分布是否呈U型分布时,具体用于:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
可选的,该装置还包括:
预处理单元,用于预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
可选的,所述预处理单元,包括:
第一计算单元,用于分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
第二计算单元,用于根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
第三计算单元,用于分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
整合处理单元,用于根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
借由上述技术方案,本发明提供的识别作弊流量的方法及装置,分析来自设定渠道的设定时长内的访问流量的页面停留时长分布,并将该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布进行对比。如果该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布不同,并且其页面停留时长分布呈现作弊流量典型的页面停留时长U型分布,则可以判断该访问流量为作弊流量。由于用户页面访问的页面停留时长分布不能轻易地被机器模仿,并且作弊流量的页面停留时长分布具有典型的U型分布特性,因此,本发明技术方案从访问流量的页面停留时长分布入手判断其是否为作弊流量,具备更高的判断准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种识别作弊流量的方法的流程示意图;
图2示出了本发明实施例提供的采集访问流量并存储的示意图;
图3示出了本发明实施例提供的作弊流量的页面停留时长分布的示意图;
图4示出了本发明实施例提供的另一种识别作弊流量的方法的流程示意图;
图5示出了本发明实施例提供的正常用户页面访问的页面停留时长分布的示意图;
图6示出了本发明实施例提供的一种识别作弊流量的装置的结构示意图;
图7示出了本发明实施例提供的另一种识别作弊流量的装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例公开了一种识别作弊流量的方法,参见图1所示,该方法包括:
S101、获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
具体的,本发明实施例需要在广告主网站前端部署用于获取页面访问数据的相关代码。该代码能够准确记录每一次页面访问的访问时长、访问的页面信息等数据,这些信息构成访问流量。如图2所示,在采集到页面访问相关数据后,该代码进一步地将这些数据信息存储到后台数据仓库,作为分析准备。
对于一个广告主网站来说,可以通过多种渠道进行页面访问,相应的,用于采集页面访问数据的相关代码,可以采集到来自多种渠道的访问流量。本发明实施例仅对来自某一设定渠道的访问流量进行分析,显而易见的,本发明实施例技术方案可以应用到对来自任意渠道的访问流量的分析处理,其具体处理过程与本发明实施例处理过程相同。
另一方面,对于广告主网站的页面访问是持续的,正常情况下,任意时间段都存在对广告主网站的页面访问,即存在访问流量。本发明实施例仅对某一设定时长内的访问流量进行分析。上述设定时长,具体可以是某一设定时间段构成的时长,例如对2017年6月1日12时0分到2017年6月1日12时30分内的访问流量进行分析,实际上是对30分钟时长内的访问流量进行分析。需要说明的是,上述设定时长,可以根据需求,灵活选取设定时间段构成。对不同时间段,以及不同时长内的访问流量的分析方法,都与本发明实施例技术方案所公开的分析方法相同。
S102、根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
具体的,基于用户对页面信息的需求的多样化,不同用户在不同页面的停留时长,呈现多样化形式。从常见的用户访问页面的习惯可以发现,用户在大部分页面的停留时长较短,只在感兴趣的少数页面停留时长较长。因此,从统计学角度考虑,大量的页面访问的页面停留时长,会呈现某一种分布形式。直观地考虑,该形式应该是随着页面停留时长的增加,其页面访问数量呈现逐步较少的趋势。
基于上述分析,本发明实施例采用统计学的方法,统计分析上述访问流量所包含的所有页面访问的页面停留时长分布。具体分析方法是,分别统计上述访问流量中的各个页面访问的页面停留时长,然后对各个页面访问的页面停留时长进行汇总统计,得到上述访问流量中的所有页面访问的页面停留时长分布。
S103、将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
具体的,通过大数据分析,我们发现大多数用户网页停留行为是:大量页面访问的页面停留时间很短,随着停留时间的增加,相关页面访问的数量呈快速衰减趋势;同时,存在部分页面访问的页面停留时间相对较长。对于来自某一渠道的,某一设定时间段所表征的设定时长内的正常的用户页面访问来说,其页面访问停留时长分布应当呈现上述分布趋势。也就是说,呈现上述趋势的页面访问,可以被认为是正常的页面访问。
基于上述理论,在通过步骤S102分析得到来自上述某一设定渠道的,某一设定时长内的访问流量的页面停留时长分布后,本发明实施例进一步的将上述访问流量的页面停留时长分布,与对应上述设定渠道的,设定时长内的正常的用户页面停留时长分布进行对比。如果上述访问流量的页面停留时长分布与上述正常的用户页面停留时长分布相同,则可以确认上述访问流量即为正常的用户页面访问,不是作弊流量;相反的,如果上述访问流量的页面停留时长分布与上述正常的用户页面停留时长分布不同,则上述访问流量很可能不是正常的用户页面访问,甚至是作弊流量。
需要说明的是,本发明实施例将同一设定时长内的访问流量的页面停留时长分布和正常的用户页面访问的页面停留时长分布进行对比。例如,将30分钟内的访问流量的页面停留时长分布,与30分钟内的正常的用户页面访问的页面停留时长分布进行对比。进一步的,为了保证对比的客观性,本发明实施例将同一时间段所构成的时长内的访问流量的页面停留时长分布和正常的用户访问的页面停留时长分布进行对比。例如,将2017年6月1日12时0分到2017年6月1日12时30分内的访问流量的页面停留时长分布,和2017年6月1日12时0分到2017年6月1日12时30分内正常的页面停留时长分布进行对比。
或者,在误差允许范围内,还可以将历史统计中的,某一天的上述时间段内的典型的正常用户页面访问的页面停留时长分布作为基准。后期在获取某一天的上述时间段内的访问流量后,都将访问流量的页面停留时长分布与上述基准进行对比。例如,将2017年3月1日12时0分到2017年3月1日12时30分所构成的30分钟内的正常的用户页面访问的页面停留时长分布,作为每一天的12时0分到12时30分所构成的30分钟内的页面访问的页面停留时长分布的基准。后期采用本发明实施例技术方案分析某一天的12时0分到12时30分所构成的30分钟内的访问流量时,都将访问流量的页面停留时长分布与该基准进行对比。
或者,可以根据对大数据的分析,设置对应上述设定时长的,统一的对比基准。例如,对任意时间段构成的上述设定时长内的正常的用户页面访问的页面停留时长分布进行统计处理,得到一个用户页面停留时长分布。当采用本发明实施例技术方案,对任意时间段构成的上述设定时长内的访问流量进行分析时,都将访问流量的页面停留时长分布,与上述作为基准的,正常用户页面访问的页面停留时长分布进行对比。例如,通过历史统计,得到30分钟内正常用户页面访问的页面停留时长分布,并作为对比基准。当需要对任意时间段(例如2017年3月1日12时0分到2017年3月1日12时30分)所构成的30分钟内的访问流量进行分析时,将访问流量的页面停留时长分布与上述对比基准进行对比。
更进一步的,作为本发明实施例技术方案的准备工作,可以事先对各个时间段构成的上述设定时长内的,正常的用户页面访问的页面停留时长分布进行统计并存储。当具体执行本发明实施例技术方案时,直接将获取的设定时间段所构成的时长内的访问流量的页面停留时长分布与实现存储的,相应时间段内的正常用户页面访问的页面停留时长分布进行对比即可。
如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则执行步骤S104、判断所述访问流量的页面停留时长分布是否呈U型分布;
如果所述访问流量的页面停留时长分布呈U型分布,则执行步骤S105、确认所述访问流量为作弊流量。
具体的,通常情况下,机器作弊的页面访问构成的访问流量的页面停留时长分布,不会呈现与正常自然人访问页面的页面停留时长分布相同的分布形式。进一步的,通过大数据统计发现,作弊流量的页面访问,随着页面停留时长的增加,页面访问数量不是呈现递减趋势,而是呈现典型的U型趋势,具体类似于图3所示的分布形式。
基于上述理论,本发明实施例在对比确认上述访问流量的页面停留时长分布与正常的用户页面停留时长分布不同时,进一步分析上述访问流量的页面停留时长分布是否呈作弊流量典型的U型分布。如果上述访问流量的页面停留时长分布呈U型分布,则可以确认上述访问流量为作弊流量。
进一步的,如果上述访问流量的页面停留时长分布不是呈U型分布,则暂时不判定上述访问流量一定是作弊流量,需要做更进一步的,更具体的分析,来识别上述访问流量是否为作弊流量。
本发明实施例提供的识别作弊流量的方法,分析来自设定渠道的设定时长内的访问流量的页面停留时长分布,并将该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布进行对比。如果该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布不同,并且其页面停留时长分布呈现作弊流量典型的页面停留时长U型分布,则可以判断该访问流量为作弊流量。由于用户页面访问的页面停留时长分布不能轻易地被机器模仿,并且作弊流量的页面停留时长分布具有典型的U型分布特性,因此,本发明实施例技术方案从访问流量的页面停留时长分布入手判断其是否为作弊流量,具备更高的判断准确性。
可选的,在本发明的另一个实施例中,参见图4所示,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:
S402、分别统计所述访问流量中的各个页面访问的页面停留时长;
S403、根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
具体的,在分别统计确认上述访问流量中的各个页面访问的页面停留时长后,本发明实施例进一步根据各个页面访问的页面停留时长对各个页面访问进行归类统计处理,将属于同一页面停留时长区间的页面访问归集到一起。例如,将页面停留时长为0~3秒的页面访问归集到一起,将页面停留时长为3~6秒的页面访问归集到一起……
需要说明的是,上述页面停留时长区间,根据分析处理需求而事先灵活设定。为了保证后期与正常用户页面访问的页面停留时长分布对比,需要保证所设置的页面停留时长区间,与用于对比的正常用户页面访问的页面停留时长分布的页面停留时长区间大小相同。
S404、分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
具体的,对于每一个页面停留时长区间所含的页面访问的数量,将其除以上述访问流量中的总的页面访问数量,得到各个页面停留时长区间内的页面访问数量,与上述访问流量中的总页面访问数量的比值。
S405、根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
具体的,在计算得到各个页面停留时长区间内的页面访问数量,与上述访问流量中的总页面访问数量的比值后,按照页面停留时长区间所表征的页面停留时长从小到大的顺序,将各个页面停留时长区间内的页面访问数量,与上述访问流量中的总页面访问数量的比值进行汇总排列,得到各个页面访问时长区间的页面访问数量分布,作为上述访问流量的页面停留时长分布。
例如,按照上述步骤S401~S405的处理过程,以6秒作为一个页面停留时长区间,对每一页面停留时长区间内的页面访问数量进行计算及汇总处理,得到3分钟内正常用户页面访问的页面停留时长分布如图5所示。其中,图中横坐标表示各个页面停留时长区间,纵轴表示该区间内的页面访问数量占总页面访问数量的比值。需要说明的是,页面停留时长为0~3秒的页面访问数量明显较多且分布分散,因此将页面停留时长为0~3秒的页面访问单独统计;类似的,页面停留时长大于3分钟的页面访问数量很少,并且分布分散,因此将页面停留时长大于3分钟的页面访问全部汇总。
本实施例中的步骤S401、S406~S408分别对应图1所示的方法实施例中的步骤S101、S103~S105,其具体内容请参见对应的方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
具体的,常见的机器作弊流量,为了保证在设定时间段内,作弊页面访问的平均停留时长与正常的用户页面访问的平均停留时长相近,只保证在设定时间段内,作弊页面访问数量与正常的用于页面访问数量相近。但是,机器作弊无法保证作弊页面访问的页面停留时长分布与正常的用户页面访问的页面停留时长分布相同。
通过大量数据分析发现,机器作弊流量的页面停留时长分布,呈现如图3所示典型的分布形式。观察图3可见,对于机器作弊流量,其页面停留时长分布随着页面停留时长区间所表征的页面停留时长的增加,先呈现逐渐减小的趋势,然后到达某一个页面停留时长区间时,其值急剧增大,然后随着页面停留时长区间所表征的页面停留时长的增加,又呈现逐渐减小的趋势。参照图3,整体上可以看出,机器作弊流量的页面停留时长分布,呈现先减小后增大的“U”形,因此可以认为机器作弊流量的页面停留时长分布具有典型的U型分布特性。
相应的,判断上述访问流量的页面停留时长分布是否呈U型分布时,具体判断该访问流量的各个页面停留时长区间内的页面访问数量,与总的页面访问数量的比值,即各个页面访问停留时长区间的值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式。如果呈现先减小后增大的变化形式,则可以认为该访问流量的页面停留时长分布呈U型分布;否则不是呈U型分布。
另一种可选的判断方法是,将各个页面停留时长区间按照所表征的页面停留时长从小到大的顺序排列后,依次判断后一个页面停留时长区间的值与前一个页面停留时长区间的值的比值,是否不大于1。如果是,则说明不是呈U型分布;如果不是,那就是说存在后一个页面停留时长区间的值大于前一个页面停留时长区间的值的情况,则认为是呈U型分布的。
可选的,在本发明的另一个实施例中,该方法还包括:
预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
具体的,虽然从直观思考可以理解,正常的用户页面访问的页面停留时长规律是,大部分页面访问的页面停留时长是短暂的,随着停留时长的增加,页面访问数量(相关页面数量)显著降低。但是,在某一具体时刻,或者在某一个设定时间段构成的设定时长内,用户页面访问的页面停留时长分布,还是会在上述大体趋势的基础上,呈现特有的分布特性。
因此,为了更准确地判断上述设定时长内的访问流量的页面停留时长分布是否符合该设定时长内的正常用户页面访问的页面停留时长分布,本发明实施例中,根据需要分析的访问流量的渠道来源,以及来源时长,预先获取来自上述同一渠道的,上述同一时长内的正常用户页面访问的页面停留时长分布。
需要说明的是,上述设定时长,具体为某一设定时间段构成的时长。
可选的,在本发明的另一个实施例中,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:
分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
具体的,在分别统计来自上述设定渠道的,设定时长内的正常用户页面访问的页面停留时长后,进一步根据各个正常用户页面访问的页面停留时长对各个正常用户页面访问进行归类统计处理,将属于同一页面停留时长区间的正常用户页面访问归集到一起。例如,将页面停留时长为0~3秒的正常用户页面访问归集到一起,将页面停留时长为3~6秒的正常用户页面访问归集到一起……
需要说明的是,上述页面停留时长区间,根据分析处理需求而事先灵活设定。为了保证后期与待分析的访问流量页面停留时长分布对比,需要保证所设置的页面停留时长区间,与待分析访问流量的页面访问的页面停留时长分布的页面停留时长区间大小相同。
分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
具体的,对于每一个页面停留时长区间所含的正常用户页面访问的数量,将其除以上述设定时长内的总的正常用户页面访问数量,得到各个页面停留时长区间内的正常用户页面访问数量,与来自上述设定渠道的,设定时长内的总的正常用户页面访问数量的比值。
根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
具体的,按照页面停留时长区间所表征的页面停留时长从小到大的顺序,将各个页面停留时长区间内的正常用户页面访问数量,与来自上述设定渠道的,设定时长内的总页面访问数量的比值进行汇总排列,得到各个页面访问时长区间的正常用户页面访问数量分布,作为对应上述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
与上述方法实施例相对应的,本发明实施例还公开了一种识别作弊流量的装置,参见图6所示,该装置包括:
流量获取单元601,用于获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
分析处理单元602,用于根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
对比处理单元603,用于将所述分析处理单元分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
判断处理单元604,用于当所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同时,判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
具体的,本实施例中的各个单元的具体工作内容,请参见上述对应的方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,参见图7所示,分析处理单元602,包括:
第一统计单元6021,用于分别统计所述访问流量中的各个页面访问的页面停留时长;
第二统计单元6022,用于根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
计算单元6023,用于分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
汇总处理单元6024,用于根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
具体的,本实施例中的各个单元的具体工作内容,请参见上述对应的方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,判断处理单元604判断所述访问流量的页面停留时长分布是否呈U型分布时,具体用于:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
具体的,本实施例中的判断处理单元604的具体工作内容,请参见上述对应的方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,该装置还包括:
预处理单元,用于预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
具体的,本实施例中的预处理单元的具体工作内容,请参见上述对应的方法实施例的内容,此处不再赘述。
可选的,在本发明的另一个实施例中,预处理单元,包括:
第一计算单元,用于分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
第二计算单元,用于根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
第三计算单元,用于分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
整合处理单元,用于根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
具体的,本实施例中的各个单元的具体工作内容,请参见上述对应的方法实施例的内容,此处不再赘述。
所述识别作弊流量的装置包括处理器和存储器,上述流量获取单元、分析处理单元、对比处理单元和判断处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现对作弊流量的识别。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述识别作弊流量的方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述识别作弊流量的方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
一种识别作弊流量的方法,包括:
获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;
如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
可选的,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:
分别统计所述访问流量中的各个页面访问的页面停留时长;
根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
可选的,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
可选的,该方法还包括:
预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
可选的,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:
分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
一种识别作弊流量的方法,包括:
获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;
如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
可选的,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:
分别统计所述访问流量中的各个页面访问的页面停留时长;
根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
可选的,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
可选的,该方法还包括:
预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
可选的,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:
分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种识别作弊流量的方法,其特征在于,包括:
获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;
如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:
分别统计所述访问流量中的各个页面访问的页面停留时长;
根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
3.根据权利要求2所述的方法,其特征在于,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
5.根据权利要求4所述的方法,其特征在于,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:
分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;
根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;
分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;
根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。
6.一种识别作弊流量的装置,其特征在于,包括:
流量获取单元,用于获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;
分析处理单元,用于根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;
对比处理单元,用于将所述分析处理单元分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;
判断处理单元,用于当所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同时,判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。
7.根据权利要求6所述的装置,其特征在于,所述分析处理单元,包括:
第一统计单元,用于分别统计所述访问流量中的各个页面访问的页面停留时长;
第二统计单元,用于根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;
计算单元,用于分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;
汇总处理单元,用于根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。
8.根据权利要求7所述的装置,其特征在于,所述判断处理单元判断所述访问流量的页面停留时长分布是否呈U型分布时,具体用于:
判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;
如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至5中任意一项所述的识别作弊流量的方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的识别作弊流量的方法。
CN201710907062.4A 2017-09-29 2017-09-29 一种识别作弊流量的方法及装置 Active CN109586990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710907062.4A CN109586990B (zh) 2017-09-29 2017-09-29 一种识别作弊流量的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710907062.4A CN109586990B (zh) 2017-09-29 2017-09-29 一种识别作弊流量的方法及装置

Publications (2)

Publication Number Publication Date
CN109586990A true CN109586990A (zh) 2019-04-05
CN109586990B CN109586990B (zh) 2021-11-02

Family

ID=65914333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710907062.4A Active CN109586990B (zh) 2017-09-29 2017-09-29 一种识别作弊流量的方法及装置

Country Status (1)

Country Link
CN (1) CN109586990B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111155A (zh) * 2019-05-14 2019-08-09 重庆天蓬网络有限公司 广告反作弊处理方法、系统、介质和电子设备
CN111127070A (zh) * 2019-11-08 2020-05-08 广州坚和网络科技有限公司 一种发现渠道作弊的方法
CN112182504A (zh) * 2020-09-09 2021-01-05 远光软件股份有限公司 一种基于考试系统的作弊判断方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150369A (zh) * 2013-03-07 2013-06-12 人民搜索网络股份公司 作弊网页识别方法及装置
CN103593415A (zh) * 2013-10-29 2014-02-19 北京国双科技有限公司 网页访问量作弊的检测方法和装置
CN103605714A (zh) * 2013-11-14 2014-02-26 北京国双科技有限公司 网站异常数据的识别方法及装置
CN106372959A (zh) * 2016-08-22 2017-02-01 广州图灵科技有限公司 一种基于互联网的用户访问行为数字营销系统及方法
CN107168854A (zh) * 2017-06-01 2017-09-15 北京京东尚科信息技术有限公司 互联网广告异常点击检测方法、装置、设备及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150369A (zh) * 2013-03-07 2013-06-12 人民搜索网络股份公司 作弊网页识别方法及装置
CN103593415A (zh) * 2013-10-29 2014-02-19 北京国双科技有限公司 网页访问量作弊的检测方法和装置
CN103605714A (zh) * 2013-11-14 2014-02-26 北京国双科技有限公司 网站异常数据的识别方法及装置
CN106372959A (zh) * 2016-08-22 2017-02-01 广州图灵科技有限公司 一种基于互联网的用户访问行为数字营销系统及方法
CN107168854A (zh) * 2017-06-01 2017-09-15 北京京东尚科信息技术有限公司 互联网广告异常点击检测方法、装置、设备及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111155A (zh) * 2019-05-14 2019-08-09 重庆天蓬网络有限公司 广告反作弊处理方法、系统、介质和电子设备
CN111127070A (zh) * 2019-11-08 2020-05-08 广州坚和网络科技有限公司 一种发现渠道作弊的方法
CN111127070B (zh) * 2019-11-08 2023-08-11 广州坚和网络科技有限公司 一种发现渠道作弊的方法
CN112182504A (zh) * 2020-09-09 2021-01-05 远光软件股份有限公司 一种基于考试系统的作弊判断方法、装置及电子设备

Also Published As

Publication number Publication date
CN109586990B (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN105550184B (zh) 一种信息获取方法及装置
US11240125B2 (en) System and method for predicting and reducing subscriber churn
CN106651416A (zh) 应用程序推广信息的分析方法及装置
CN109561052B (zh) 网站异常流量的检测方法及装置
CN104426713B (zh) 网络站点访问效果数据的监测方法和装置
CN109586990A (zh) 一种识别作弊流量的方法及装置
US8949315B2 (en) System and method for generating web analytic reports
CN109858957A (zh) 理财产品推荐方法、装置、计算机设备及存储介质
CN106959925A (zh) 一种版本测试方法及装置
CN107578263A (zh) 一种广告异常访问的检测方法、装置和电子设备
CN102831218A (zh) 热力图中的数据确定方法及装置
CN106611023B (zh) 网站访问异常的检测方法及装置
CN103729446A (zh) 一种用户操作数据的处理方法、处理装置及服务器
WO2014127051A1 (en) Churn prediction in a broadband network
CN109428776B (zh) 一种网站流量的监控方法及装置
CN110059952A (zh) 车险风险评估方法、装置、设备和存储介质
CN107566148B (zh) 终端应用操作数据的分析方法、系统、装置及终端
CN107678932A (zh) 一种应用性能分析方法及装置
CN108073597A (zh) 页面点击行为展示方法、装置和系统
CN103049456B (zh) 一种筛选网页的方法及装置
CN109600272A (zh) 爬虫检测的方法及装置
CN105429792B (zh) 用户行为流量获取方法及装置、用户行为分析方法及系统
CN109582548A (zh) 一种基于无埋点的页面元素圈选方法及装置
Chen et al. Dynamic pricing with stochastic reference price effect
CN110110219B (zh) 根据网络行为确定用户偏好的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant