CN113225325A - 一种ip黑名单确定方法、装置、设备及存储介质 - Google Patents

一种ip黑名单确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113225325A
CN113225325A CN202110463225.0A CN202110463225A CN113225325A CN 113225325 A CN113225325 A CN 113225325A CN 202110463225 A CN202110463225 A CN 202110463225A CN 113225325 A CN113225325 A CN 113225325A
Authority
CN
China
Prior art keywords
blacklist
fluctuation
preset period
determining
ips
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110463225.0A
Other languages
English (en)
Other versions
CN113225325B (zh
Inventor
刘洋
田丹丹
卫海天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Minglue Zhaohui Technology Co Ltd
Original Assignee
Beijing Minglue Zhaohui Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Minglue Zhaohui Technology Co Ltd filed Critical Beijing Minglue Zhaohui Technology Co Ltd
Priority to CN202110463225.0A priority Critical patent/CN113225325B/zh
Publication of CN113225325A publication Critical patent/CN113225325A/zh
Application granted granted Critical
Publication of CN113225325B publication Critical patent/CN113225325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection

Abstract

本申请实施例公开了一种IP黑名单确定方法、装置、设备及存储介质,所述方法包括:确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。在本申请的实施例中,基于波动系数确定IP黑名单,可以在不搜集用户信息的情况下,从IP波动情况的角度对异常IP进行综合分析,提升IP黑名单确定的准确性。

Description

一种IP黑名单确定方法、装置、设备及存储介质
技术领域
本申请实施例涉及网络异常流量识别技术领域,例如涉及一种IP黑名单确定方法、装置、设备及存储介质。
背景技术
随着智能手机、平板电脑等移动终端设备的普及,第三方应用程序客户端逐渐成为广告主投放广告的主要载体,第三方应用程序(Application,APP)厂商将APP中广告位托管给广告网络(Advertisement Network,ADN),借助AND的销售和代理团队进行变现。但是部分群体通过伪造广告的浏览和点击流量攫取巨额利益,严重损害了广告主的利益,这种伪造的浏览称之为“异常流量”。为了维护广告主的合法权益,需要对产生异常流量的IP进行识别,快速确定IP黑名单,是监测并控制异常流量的重要手段。但是相关技术中在生成可疑IP黑名单时,使用的方法大多是在某一个预置的时间段内,根据用户的信息,统计访问次数超过预设阈值的IP确定为可疑IP。但是在相邻两个预置的时间段内,实际访问情况可能会有较大的差异,即IP流量可能存在波动,上一个预置时间段内确定的可疑IP名单与下一个预置时间段内确定的可疑IP名单也会有较大的出入,从而无法准确确定可疑IP名单。
为解决上述技术问题,本申请提出一种IP黑名单确定方法、装置、设备及存储介质。
发明内容
本申请实施例提供一种IP黑名单确定方法方法,基于波动系数确定IP黑名单,可以在不搜集用户信息的情况下,从IP波动情况的角度对异常IP进行综合分析,提升IP黑名单确定的准确性。
第一方面,本申请实施例提供了一种IP黑名单确定方法,包括:
确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
第二方面,本申请实施例还提供了一种IP黑名单确定装置,包括:
第一IP黑名单确定模块,设置为确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
第二IP黑名单确定模块,设置为根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
目标IP黑名单确定模块,设置为根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
第三方面,本申请实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请任意实施例所提供的IP黑名单确定方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请任意实施例所提供的IP黑名单确定方法。
本申请实施例确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。基于波动系数确定IP黑名单,可以在不搜集用户信息的情况下,从IP波动情况的角度对异常IP进行综合分析,提升IP黑名单确定的准确性。
附图说明
图1为本申请实施例提供的一种IP黑名单确定方法的流程图;
图2为本申请实施例提供的另一种IP黑名单确定方法中步骤S110的流程图;
图3为本申请实施例提供的另一种IP黑名单确定方法中步骤S120的流程图;
图4为本申请实施例提供的一种IP黑名单确定装置的结构示意图;
图5为本申请实施例提供的另一种IP黑名单确定装置的结构示意图;
图6为本申请实施例提供的一种IP黑名单确定设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
在进行详细说明之前,先对本申请中涉及到的相关内容作出解释,本申请中涉及的相关术语均为本领域技术人员知晓和理解的内容。
IP(Internet Protocol,网络协议)是为计算机网络相互连接进行通信而设计的协议,是为了使连接到因特网上的所有计算机实现相互通信的一套规则。每个连接在因特网上的设备都会被分配一个或多个IP地址用于在网络上进行通讯。
在互联网广告领域,通常需要区分活动和点位。一个广告主通常会安排若干波活动,每个活动达成不一样的目的,例如建立品牌认知、促进特定品牌提升销量等等;每个活动里通常包括若干个点位,每个点位通常安排一种广告投放方式,例如新浪首页通投是一个点位、优酷视频前贴定向母婴人群是另一个点位等等。
曝光量统计的是在预设周期内某一广告或某些广告曝光的总次数。例如对于某一个汽车广告主来说,在投放汽车广告时,可能会在多种点位进行投放,假如广告主选择在两个点位投放开屏广告,预设周期为T天,则本申请中所说的曝光量指的是,统计T天之内汽车广告在这两个点位中所产生的总曝光次数。
点击量统计的是在预设周期内某一广告或某些广告被点击的总次数。例如对于某一个汽车广告主来说,在投放汽车广告时,可能会在多种点位进行投放,假如广告主选择在两个点位投放开屏广告,预设周期为T天,则本申请中所说的点击量指的是,统计T天之内汽车广告在这两个点位中被点击的总次数。
在预设周期内广告点位的曝光量和点击量会随着时间的变化而产生波动,而IP流量的波动情况可以在一定程度上反映IP流量的异常程度。
在本申请实施例中,以预设周期为T天,某汽车广告主在两个点位,例如新浪APP和优酷APP投放开屏汽车广告为例进行说明。
实施例一
在本申请实施例中,预设周期为T天。
图1是本申请实施例提供的一种IP黑名单确定方法的流程图。本实施例可适用于需要确定异常流量的情形,尤其适用于在不同时间段,异常流量可能存在波动的情形。该方法可以由IP黑名单确定装置执行,该IP黑名单确定装置可以采用软件和/或硬件的方式实现,例如,该IP黑名单确定装置可配置于计算机设备中。如图1所示,该方法包括:
S110、确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单。
在一个实施例中,统计T天中汽车广告在新浪APP和优酷APP中投放的开屏广告的曝光量。
分别抽取新浪APP和优酷APP上传到服务器中的日志,根据日志统计在这T天中访问新浪APP和优酷APP的所有IP地址,并统计每个IP地址在T天中的曝光量,根据每个IP在这T天之内的曝光量确定每个IP在T天之内的曝光量波动情况,从而确定第一IP黑名单。
曝光量指的是每个IP在这T天之内的曝光累加次数。假如某一用户使用一部手机(此时对应一个访问ID)通过一个IP地址访问新浪APP,在新浪APP开启时,开屏汽车广告产生一次曝光;用户在这部手机上关闭新浪APP之后,紧接着第二次打开新浪APP,又会产生一次新的曝光,每个IP的曝光量包括是T天之内通过这一IP地址产生的所有曝光次数,与访问ID的数量无关。通过统计新浪APP和优酷APP这两个点位的总曝光量,确定第一IP黑名单。
需要说明的是,对于开屏汽车广告,可以对新浪APP和优酷APP这两个点位的IP曝光量合并进行统计,通过两个点位的日志统计一个综合的第一IP黑名单,也可以根据实际需要,单独确定某一个点位的第一IP黑名单,本申请对此不做限定。
S120、根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单。
分别抽取新浪APP和优酷APP上传到服务器中的日志,根据日志统计在这T天中访问新浪APP和优酷APP的所有IP地址,并统计每个IP地址在T天中的点击量,根据每个IP在这T天之内的点击量确定每个IP在T天之内的点击量波动情况,从而确定第二IP黑名单。
点击量指的是每个IP在这T天之内的点击累加次数。假如某一用户使用一部手机(此时对应一个访问ID)通过一个IP地址访问新浪APP,在新浪APP开启时,用户点击开屏汽车广告产生一次点击量;用户在这部手机上关闭新浪APP之后,紧接着第二次打开新浪APP,又会产生一次新的点击量,每个IP的点击量包括是T天之内通过这一IP地址产生的所有点击次数,与访问ID的数量无关。通过统计新浪APP和优酷APP这两个点位的总点击量,确定第二IP黑名单。
需要说明的是,对于开屏汽车广告,可以对新浪APP和优酷APP这两个点位的IP点击量合并进行统计,通过两个点位的日志统计一个综合的第二IP黑名单,也可以根据实际需要,单独确定某一个点位的第二IP黑名单,本申请对此不做限定。
T天之内开屏汽车广告在产生曝光的同时,用户可能会继续对曝光的广告进行点击,访问广告的具体内容,因此在这T天之内同样会产生点击量的波动,但点击波动情况与曝光波动情况可能会出现差异。
T天之内开屏汽车广告的曝光量会随着时间的变化产生曝光量的波动。第一IP黑名单是根据曝光量的波动情况确定的,第二IP黑名单是根据点击量的波动情况确定的。
S130、根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
第一IP黑名单与曝光量波动情况有关,第二IP黑名单与点击量波动情况有关。在T天之内统计出来的第一IP黑名单中的可疑IP和第二IP黑名单中的可疑IP可能会出现重复,因此最终确定的目标IP黑名单可以为第一IP黑名单和第二IP黑名单的交集。
统计T天之内所有IP的波动情况,从曝光量和点击量两个角度综合对某一个IP的异常程度进行判断,从而构建目标IP黑名单,这样构建出来的IP黑名单可以更加全面准确。
图2为本申请实施例提供的另一种IP黑名单确定方法中步骤S110的流程图。在上述方案的基础上,S110、根据每个IP在预设周期内的曝光量确定第一IP黑名单,包括:
S111、将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的曝光量eachHourimp
S112、根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率;
S113、对所述多个IP的所述逐小时的曝光量eachHourimp进行聚类,确定符合第一预设条件的第一IP集合;
S114、从所述第一IP集合中选取所述第一波动概率大于第一预设阈值的IP,并将选取出的IP作为第一IP黑名单。
在一个实施例中,可以将这T天按小时划分,计算每个IP在这T*24个小时内的曝光数量,分别得到一个长度为T*24的时间序列向量eachHourimp。其中,eachHourimp代表该逐小时的曝光量。
对T天之内的所有IP的逐小时曝光量进行聚类时,可以采用DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)密度聚类算法进行聚类,聚类之后得到多个聚类类别(多个聚类类别也可以称为多个簇)。每个簇中散落分布有一定数量IP的逐小时曝光量,计算每个簇中的一定数量IP的逐小时曝光量的均值。每个IP的逐小时曝光量分别对应一个IP。每个簇分别对应一个曝光量均值,确定符合第一预设条件的第一IP集合指的就是,将聚类后获得的多个簇按照它们各自的曝光量均值进行排序,选出曝光量均值最大的簇,将曝光量均值最大的簇中对应的多个IP,确定为第一IP集合。
根据第一IP集合中的多个IP的第一波动概率,再次进行筛选,选出第一波动概率大于第一预设阈值的IP,将其作为第一IP黑名单。
需要说明的是,IP的曝光波动概率大于预先设置的第一预设阈值时,就将其认定为异常IP,第一预设阈值与实际情况有关,针对不同场景可以进行调整,其具体数值在本申请中不做限定。
通过统计T天内广告点位的每个IP的曝光量,即确定长度为T*24的时间序列向量eachHourimp,计算每个IP的曝光量波动概率,最终确定出波动概率大于第一预设阈值的IP,从IP曝光量波动的角度,对T天之内出现的所有IP进行了流量波动的检测,基于曝光量的波动情况,不需要用户信息即可确定第一IP黑名单,可以更加准确的对异常流量进行监控,确定可疑IP黑名单。
图3为本申请实施例提供的另一种IP黑名单确定方法中步骤S120的流程图。在上述方案的基础上,S120、根据每个IP在预设周期内的点击量确定第二IP黑名单,包括:
S121、将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的点击量eachHourclick
S123、根据每个IP在所述预设周期内所述逐小时的点击量eachHourclick,计算每个IP的第二波动概率;
S123、对所述多个IP的所述逐小时的点击量eachHourclick进行聚类,确定符合第二预设条件的第二IP集合;
S124、从所述第二IP集合中选取所述第二波动概率大于第二预设阈值的IP,并将选取出的IP作为第二IP黑名单。
在一个实施例中,可以将这T天按小时划分,计算每个IP在这T*24个小时内的点击量,分别得到一个长度为T*24的时间序列向量eachHourclick。其中,eachHourclick代表该逐小时的点击量。
步骤S123以及步骤S124分别与步骤S113和步骤S114类似,可参考之前步骤S113和步骤S114的说明,在此不再赘述。
需要说明的是,IP的点击波动概率大于预先设置的第二预设阈值时,就将其认定为异常IP,第二预设阈值与实际情况有关,针对不同场景可以进行调整,其具体数值在本申请中不做限定。
通过统计T天内广告点位的每个IP的点击量,即确定长度为T*24的时间序列向量eachHourimp,计算每个IP的点击量波动概率,最终确定出波动概率大于第二预设阈值的IP,从IP点击量波动的角度,对T天之内出现的所有IP进行了流量波动的检测,基于点击量的波动情况,不需要用户信息即可确定第二IP黑名单,可以更加准确的对异常流量进行监控,确定可疑IP黑名单。
在上述方案的基础上,根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率,包括:根据
Figure BDA0003034733880000101
计算每个IP的第一波动系数;根据
Figure BDA0003034733880000102
计算每个IP的所述第一波动概率;其中,cv1表示每个IP的所述第一波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p1表示每个IP的所述第一波动概率,μ1表示所述多个IP的所述第一波动系数的均值,σ1表示所述多个IP的所述第一波动系数的标准差。
在一个实施例中,计算每个IP的第一波动概率p1需要首先计算每个IP的第一波动系数cv1。通过计算每个IP的逐小时曝光量的均值,以及逐小时曝光量的标准差确定每个IP的第一波动系数,可通过相关技术中的Mean函数和Std函数计算,具体不再介绍。确定每个IP的第一波动系数cv1之后,计算T天之内所有IP的第一波动系数cv1的均值μ1和标准差σ1
在上述方案的技术上,根据每个IP在所述预设周期内所述逐小时的点击量eachHourclick,计算每个IP的第二波动概率,包括:根据
Figure BDA0003034733880000103
计算每个IP的第二波动系数;根据
Figure BDA0003034733880000104
计算每个IP的所述第二波动概率;其中,cv2表示每个IP的所述第二波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p2表示每个IP的所述第二波动概率,μ2表示所述多个IP的所述第二波动系数的均值,σ2表示所述多个IP的所述第二波动系数的标准差。
确定第二IP集合以及第二IP黑名单的步骤与确定第一IP集合的步骤类似,可参考之前的说明,在此不再赘述。
通过计算每个IP的曝光量波动系数,进而确定每个IP的曝光量波动概率,可以在不需要用户信息的情况下,基于IP曝光量的情况构建IP黑名单,通过计算每个IP的点击量波动系数,进而确定每个IP的点击量波动概率,可以在不需要用户信息的情况下,基于IP点击量的情况构建IP黑名单。
本申请实施例通过确定预设周期内出现的多个IP地址,以及每个IP地址在所述预设周期内的曝光量确定第一IP黑名单;根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。基于波动系数确定IP黑名单,可以不需要搜集用户信息就可以从IP曝光量波动情况和IP点击量波动情况的角度对异常IP进行综合分析,提升IP黑名单确定的准确性。
实施例二
图4是本申请实施例二所提供的一种IP黑名单确定装置的结构示意图。该IP黑名单确定装置以采用软件和/或硬件的方式实现,例如该IP黑名单确定装置可以配置于计算机设备中。如图4所示,该装置包括,其中:
第一IP黑名单确定模块310,设置为确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
第二IP黑名单确定模块320,设置为根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
目标IP黑名单确定模块330,设置为根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
本申请实施例通过第一IP黑名单确定模块确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;第二IP黑名单确定模块根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;目标IP黑名单确定模块,根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。基于波动系数确定IP黑名单,可以在不搜集用户信息的情况下,从IP波动情况的角度对异常IP进行综合分析,提升IP黑名单确定的准确性。
图5为本申请实施例提供的另一种IP黑名单确定装置的结构示意图。
在上述方案的基础上,第一IP黑名单确定模块310,包括:
第一波动概率确定单元,设置为将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的曝光量eachHourimp;根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率;
第一IP集合确定单元,设置为对所述多个IP的所述逐小时的曝光量eachHourimp进行聚类,确定符合第一预设条件的第一IP集合;
第一IP黑名单确定单元,设置为从所述第一IP集合中选取所述第一波动概率大于第一预设阈值的IP,并将选取出的IP作为第一IP黑名单。
在上述方案的基础上,第二IP黑名单确定模块320,包括:第二波动概率确定单元,设置为将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的点击量eachHourclick;根据每个IP在所述预设周期内所述逐小时点击量eachHourclick,计算每个IP的第二波动概率;
第二IP集合确定单元,设置为对所述多个IP的所述逐小时的点击量eachHourclick进行聚类,确定符合第二预设条件的第二IP集合;
第二IP黑名单确定单元,设置为从所述第二IP集合中选取所述第二波动概率大于第二预设阈值的IP,并将选取出的IP作为第二IP黑名单。
在上述方案的基础上,第一波动概率确定单元包括:第一波动系数确定子单元,设置为根据
Figure BDA0003034733880000121
计算每个IP的第一波动系数;
第一波动概率确定子单元,设置为根据
Figure BDA0003034733880000122
计算每个IP的所述第一波动概率。
其中,cv1表示每个IP的所述第一波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p1表示每个IP的所述第一波动概率,μ1表示所述多个IP的所述第一波动系数的均值,σ1表示所述多个IP的所述第一波动系数的标准差。
在上述方案的基础上,第二波动概率确定单元包括:第二波动系数确定子单元,设置为根据根据
Figure BDA0003034733880000131
计算每个IP的第二波动系数;
第二波动概率确定子单元,设置为根据
Figure BDA0003034733880000132
计算每个IP的所述第二波动概率。
其中,cv2表示每个IP的所述第二波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p2表示每个IP的所述第二波动概率,μ2表示所述多个IP的所述第二波动系数的均值,σ2表示所述多个IP的所述第二波动系数的标准差。
本申请实施例所提供的IP黑名单确定装置可执行本申请任意实施例所提供的IP黑名单确定方法,具备执行方法相应的功能模块和有益效果。
实施例三
图6是本申请实施例三所提供的一种计算机设备的结构示意图。图6是本申请实施例所提供的计算机设备的结构示意图。图6示出了适于用来实现本申请实施方式的示例性计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于:一个或者多个处理器614,系统存储器628,连接不同系统组件(包括系统存储器628和处理器614)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器614或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储器628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块642的程序/实用工具640,可以存储在例如存储器628中,这样的程序模块642包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块642通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器614通过运行存储在系统存储器628中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的IP黑名单确定方法,该方法包括:
确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
当然,本领域技术人员可以理解,处理器还可以实现本申请任意实施例所提供的IP黑名单的确定方法的技术方案。
实施例四
本申请实施例四还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请实施例所提供的IP黑名单确定方法,该方法包括:
确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
当然,本申请实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法操作,还可以执行本申请任意实施例所提供的IP黑名单确定方法的相关操作。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.一种IP黑名单确定方法,其特征在于,所述方法包括:
确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
2.根据权利要求1所述的方法,其特征在于,所述根据每个IP在预设周期内的曝光量确定第一IP黑名单,包括:
将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的曝光量eachHourimp
根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率;
对所述多个IP的所述逐小时的曝光量eachHourimp进行聚类,确定符合第一预设条件的第一IP集合;
从所述第一IP集合中选取所述第一波动概率大于第一预设阈值的IP,并将选取出的IP作为第一IP黑名单。
3.根据权利要求1所述的方法,其特征在于,所述根据每个IP在预设周期内的点击量确定第二IP黑名单,包括:
将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的点击量eachHourclick
根据每个IP在所述预设周期内所述逐小时的点击量eachHourclick,计算每个IP的第二波动概率;
对所述多个IP的所述逐小时的点击量eachHourclick进行聚类,确定符合第二预设条件的第二IP集合;
从所述第二IP集合中选取所述第二波动概率大于第二预设阈值的IP,并将选取出的IP作为第二IP黑名单。
4.根据权利要求2所述的方法,其特征在于,根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率,包括:
根据
Figure FDA0003034733870000021
计算每个IP的第一波动系数;
根据
Figure FDA0003034733870000022
计算每个IP的所述第一波动概率;
其中,cv1表示每个IP的所述第一波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p1表示每个IP的所述第一波动概率,μ1表示所述多个IP的所述第一波动系数的均值,σ1表示所述多个IP的所述第一波动系数的标准差。
5.根据权利要求3所述的方法,其特征在于,根据每个IP在所述预设周期内所述逐小时的点击量eachHourclick,计算每个IP的第二波动概率,包括:
根据
Figure FDA0003034733870000023
计算每个IP的第二波动系数;
根据
Figure FDA0003034733870000024
计算每个IP的所述第二波动概率;
其中,cv2表示每个IP的所述第二波动系数,Mean函数是取均值的函数,Std函数取标准差的函数,p2表示每个IP的所述第二波动概率,μ2表示所述多个IP的所述第二波动系数的均值,σ2表示所述多个IP的所述第二波动系数的标准差。
6.一种IP黑名单确定装置,其特征在于,包括:
第一IP黑名单确定模块,设置为确定预设周期内出现的多个IP,根据每个IP在所述预设周期内的曝光量确定第一IP黑名单;
第二IP黑名单确定模块,设置为根据所述多个IP中的每个IP在所述预设周期内的点击量确定第二IP黑名单;
目标IP黑名单确定模块,设置为根据所述第一IP黑名单和所述第二IP黑名单确定目标IP黑名单。
7.根据权利要求6所述的装置,其特征在于,所述第一IP黑名单确定模块,包括:
第一波动概率确定单元,设置为将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的曝光量eachHourimp;根据每个IP在所述预设周期内所述逐小时的曝光量eachHourimp,计算每个IP的第一波动概率;
第一IP集合确定单元,设置为对所述多个IP的所述逐小时的曝光量eachHourimp进行聚类,确定符合第一预设条件的第一IP集合;
第一IP黑名单确定单元,设置为从所述第一IP集合中选取所述第一波动概率大于第一预设阈值的IP,并将选取出的IP作为第一IP黑名单。
8.根据权利要求6所述的装置,其特征在于,所述第二IP黑名单确定模块,包括:
第二波动概率确定单元,设置为将所述预设周期按小时划分,计算每个IP在所述预设周期内逐小时的点击量eachHourclick;根据每个IP在所述预设周期内所述逐小时点击量eachHourclick,计算每个IP的第二波动概率;
第二IP集合确定单元,设置为对所述多个IP的所述逐小时的点击量eachHourclick进行聚类,确定符合第二预设条件的第二IP集合;
第二IP黑名单确定单元,设置为从所述第二IP集合中选取所述第二波动概率大于第二预设阈值的IP,并将选取出的IP作为第二IP黑名单。
9.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的IP黑名单确定方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的IP黑名单确定方法。
CN202110463225.0A 2021-04-23 2021-04-23 一种ip黑名单确定方法、装置、设备及存储介质 Active CN113225325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110463225.0A CN113225325B (zh) 2021-04-23 2021-04-23 一种ip黑名单确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110463225.0A CN113225325B (zh) 2021-04-23 2021-04-23 一种ip黑名单确定方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113225325A true CN113225325A (zh) 2021-08-06
CN113225325B CN113225325B (zh) 2022-09-13

Family

ID=77089328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110463225.0A Active CN113225325B (zh) 2021-04-23 2021-04-23 一种ip黑名单确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113225325B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726783A (zh) * 2021-08-31 2021-11-30 北京知道创宇信息技术股份有限公司 异常ip地址识别方法、装置、电子设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190057009A1 (en) * 2017-08-15 2019-02-21 Cognant Llc System and method for detecting fraudulent activity on client devices
CN109831454A (zh) * 2019-03-13 2019-05-31 北京品友互动信息技术股份公司 虚假流量的识别方法和装置
CN110545292A (zh) * 2019-09-29 2019-12-06 秒针信息技术有限公司 一种异常流量监测的方法及装置
CN111641629A (zh) * 2020-05-28 2020-09-08 腾讯科技(深圳)有限公司 一种异常行为检测方法、装置、设备及存储介质
CN111882349A (zh) * 2020-07-14 2020-11-03 腾讯科技(深圳)有限公司 一种数据处理方法、装置及存储介质
CN112488754A (zh) * 2020-11-30 2021-03-12 上海酷量信息技术有限公司 一种广告点击的反作弊系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190057009A1 (en) * 2017-08-15 2019-02-21 Cognant Llc System and method for detecting fraudulent activity on client devices
CN109831454A (zh) * 2019-03-13 2019-05-31 北京品友互动信息技术股份公司 虚假流量的识别方法和装置
CN110545292A (zh) * 2019-09-29 2019-12-06 秒针信息技术有限公司 一种异常流量监测的方法及装置
CN111641629A (zh) * 2020-05-28 2020-09-08 腾讯科技(深圳)有限公司 一种异常行为检测方法、装置、设备及存储介质
CN111882349A (zh) * 2020-07-14 2020-11-03 腾讯科技(深圳)有限公司 一种数据处理方法、装置及存储介质
CN112488754A (zh) * 2020-11-30 2021-03-12 上海酷量信息技术有限公司 一种广告点击的反作弊系统和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726783A (zh) * 2021-08-31 2021-11-30 北京知道创宇信息技术股份有限公司 异常ip地址识别方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN113225325B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN108737535B (zh) 一种消息推送方法、存储介质和服务器
CN107391359B (zh) 一种业务测试方法及装置
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN109714636B (zh) 一种用户识别方法、装置、设备及介质
CN110135912B (zh) 一种信息推送方法、装置、服务器和存储介质
CN107784205B (zh) 一种用户产品审核的方法、装置、服务器和存储介质
CN111400600A (zh) 一种消息推送方法、装置、设备和存储介质
CN108234472A (zh) 挑战黑洞攻击的检测方法及装置、计算机设备及可读介质
CN113162923B (zh) 基于用户行为的用户可信度评估方法、装置及存储介质
CN110991903A (zh) 一种服务人员的分配方法、装置、设备和存储介质
WO2020232902A1 (zh) 异常对象识别方法、装置、计算设备和存储介质
CN113076416A (zh) 信息热度评估方法、装置和电子设备
CN113225325B (zh) 一种ip黑名单确定方法、装置、设备及存储介质
CN109561212B (zh) 一种发布信息的合并方法、装置、设备和存储介质
CN110955890B (zh) 恶意批量访问行为的检测方法、装置和计算机存储介质
CN107729944B (zh) 一种低俗图片的识别方法、装置、服务器及存储介质
CN113746790B (zh) 一种异常流量管理方法、电子设备及存储介质
CN110969479B (zh) 一种展示推广资源的方法、设备和计算机存储介质
CN113379469A (zh) 一种异常流量检测方法、装置、设备及存储介质
CN108052568B (zh) 一种特征筛选方法、装置、终端和介质
CN111402034A (zh) 一种信用审核方法、装置、设备及存储介质
WO2023138923A1 (en) Failure prediction using informational logs and golden signals
CN111741046B (zh) 数据上报方法、获取方法、装置、设备及介质
CN115795100A (zh) 用户事件处理方法、装置、电子设备及可读存储介质
CN109922359B (zh) 一种用户处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant