CN111199417A - 虚假设备id的识别方法及装置 - Google Patents
虚假设备id的识别方法及装置 Download PDFInfo
- Publication number
- CN111199417A CN111199417A CN201911204484.0A CN201911204484A CN111199417A CN 111199417 A CN111199417 A CN 111199417A CN 201911204484 A CN201911204484 A CN 201911204484A CN 111199417 A CN111199417 A CN 111199417A
- Authority
- CN
- China
- Prior art keywords
- data
- speed
- equipment
- determining
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 241000272808 Anser Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000272814 Anser sp. Species 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0248—Avoiding fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Abstract
本发明公开了一种虚假设备ID的识别方法及装置。其中,该方法包括:获取待识别的设备ID在预设时间段的历史操作数据,其中,历史操作数据包括设备ID进行操作的多个时间点,以及在时间点的设备ID的位置数据;根据历史操作数据确定设备ID对应的速度数据;根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID。本发明解决了相关技术中虚假设备流量识别方法,无法有效识别新方式的虚假设备ID,导致无法有效识别虚假流量的技术问题。
Description
技术领域
本发明涉及虚假ID识别领域,具体而言,涉及一种虚假设备ID的识别方法及装置。
背景技术
广告投放中有很多的作弊流量,不法分子利用虚假的设备来制造作弊流量,这些虚假的流量会降低利用广告投放的效果。在广告投放中,识别并过滤虚假的设备才能使广告真正的起作用。
传统的虚假设备ID的识别方式有:单个设备短时间内频繁请求,频繁曝光,频繁点击等。由于技术的升级,现在的作弊团伙为了使虚假流量更逼真,已经不会在短时间内发送大量的请求,导致新方式的虚假设备ID通过以前的方法无法有效识别,从而导致传统的方式已经不能很好的识别作弊流量的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种虚假设备ID的识别方法及装置,以至少解决相关技术中虚假设备流量识别方法,无法有效识别新方式的虚假设备ID,导致无法有效识别虚假流量的技术问题。
根据本发明实施例的一个方面,提供了一种虚假设备的识别方法,包括:获取待识别的设备ID在预设时间段的历史操作数据,其中,所述历史操作数据包括所述设备ID进行操作的多个时间点,以及在所述时间点的所述设备ID的位置数据;根据所述历史操作数据确定所述设备ID对应的速度数据;根据所述速度数据与预设速度的比较结果,确定所述设备ID是否为虚假设备ID。
可选的,根据所述历史操作数据确定所述设备ID对应的速度数据包括:按照时间点的先后顺序,将所述设备ID在多个时间点的位置数据进行排序,得到所述设备ID的行为轨迹;根据所述行为轨迹确定所述设备ID对应的速度数据。
可选的,根据所述行为轨迹确定所述设备ID对应的速度数据包括:所述行为轨迹的长度为N,N≥2,在所述行为轨迹中根据任意相邻2个时间点的位置数据,计算所述行为轨迹中的所述设备ID的多个第一速度,获得第一速度序列;判断是否满足N≥m,m为大于2的正整数,在满足N≥m的情况下,在所述行为轨迹中根据任意相邻m个时间点的位置数据,计算所述行为轨迹中的所述设备ID的多个第m-1速度,获得第m-1速度序列,继续判断是否满足N≥m+1;在N<m的情况下,将m=2对应的第一速度序列,至m-1对应的第m-2速度序列中的所有速度数据放在同一速度集合中,确定所述设备ID对应的速度数据。
可选的,根据所述速度数据与预设速度的比较,确定所述待识别设备是否为虚假设备包括:将所述速度集合中的所有速度数据与第一预设速度进行比较,其中,所述第一预设速度为真实的设备移动的最大速度;在所述速度数据小于所述预设速度数据的情况下,确定所述速度数据为正常数据;在所述速度数据大于等于所述第一预设速度的情况下,确定所述速度数据为高速数据;确定所述速度数据为高速数据之后,将所述高速数据与第二预设速度进行比较,其中,所述第二预设速度为所述第一预设速度在合理波动范围内的最大速度,所述第二预设速度大于所述第一预设速度;在所述高速数据大于等于所述第二预设速度的情况下,确定所述速度数据为伪造数据;根据所述正常数据,高速数据和伪造数据的比例确定所述设备是否为虚假设备。
可选的,根据所述正常数据,高速数据和伪造数据确定所述待识别设备是否为虚假设备包括:在伪造数据在所述速度集合中的占比,大于等于第一预设比例的情况下,确定所述待识别设备为虚假设备;或者,在伪造数据和高速数据的总和在所述速度集合中的占比,大于等于第二预设比例的情况下,确定所述待识别设备为虚假设备。
可选的,获取待识别设备在预设时间段的历史操作数据包括:获取所述预设时间段内的流量数据;通过所述流量数据确定历史日志;根据所述历史日志确定所述历史操作数据。
可选的,根据所述历史操作数据确定所述设备ID对应的速度数据之前包括:对所述历史操作数据进行清洗,去除所述历史操作数据中不正确的时间点,和/或不正确的位置数据对应的历史数据。
根据本发明实施例的另一方面,还提供了一种虚假设备的识别装置,包括:获取模块,用于获取待识别的设备ID在预设时间段的历史操作数据,其中,所述历史操作数据包括所述设备ID进行操作的多个时间点,以及在所述时间点的所述设备ID的位置数据;确定模块,用于根据所述历史操作数据确定所述设备ID对应的速度数据;比较模块,用于根据所述速度数据与预设速度的比较结果,确定所述设备ID是否为虚假设备ID。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的虚假设备的识别方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的虚假设备的识别方法。
在本发明实施例中,采用获取待识别的设备ID在预设时间段的历史操作数据,历史操作数据包括设备ID进行操作的多个时间点,以及在时间点的设备ID的位置数据;根据历史操作数据确定设备ID对应的速度数据;根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID的方式,通过对设备ID对应的设备的移动速度进行确定,并通过真实的设备移动的最大速度与上述确定的速度进行比较,确定多个速度数据为正常数据,高速数据或伪造数据,通过该设备ID的正常数据,高速数据和伪造数据的比例确定的该设备ID是否虚假,达到了确定设备ID是否虚假的目的,从而实现了有效识别虚假设备ID的技术效果,进而解决了相关技术中虚假设备流量识别方法,无法有效识别新方式的虚假设备ID,导致无法有效识别虚假流量的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种虚假设备的识别方法的流程图;
图2是根据本发明实施例的一种虚假设备的识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种虚假设备的识别方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种虚假设备的识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待识别的设备ID在预设时间段的历史操作数据,其中,历史操作数据包括设备ID进行操作的多个时间点,以及在时间点的设备ID的位置数据;
步骤S104,根据历史操作数据确定设备ID对应的速度数据;
步骤S106,根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID。
通过上述步骤,采用获取待识别的设备ID在预设时间段的历史操作数据,历史操作数据包括设备ID进行操作的多个时间点,以及在时间点的设备ID的位置数据;根据历史操作数据确定设备ID对应的速度数据;根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID的方式,通过对设备ID对应的设备的移动速度进行确定,并通过真实的设备移动的最大速度与上述确定的速度进行比较,确定多个速度数据为正常数据,高速数据或伪造数据,通过该设备ID的正常数据,高速数据和伪造数据的比例确定的该设备ID是否虚假,达到了确定设备ID是否虚假的目的,从而实现了有效识别虚假设备ID的技术效果,进而解决了相关技术中虚假设备流量识别方法,无法有效识别新方式的虚假设备ID,导致无法有效识别虚假流量的技术问题。
上述步骤可以应用在虚假流量的识别中,在大量的设备ID的流量中,由于设备ID的虚假性,造成流量的虚假,从而在根据流量进行统计或运算时,就会导致进一步的错误和误差,从而由于虚假流量造成其他的问题。因此可以对流量中的流量数据和对应的设备ID进行识别,从而确定设备ID是否为虚假设备ID,并将虚假设备ID的乱量数据进行剔除,从而有效实现了通过虚假设备ID的识别,实现虚假流量的识别。
上述历史操作数据可以是上述设备ID的历史操作数据,例如,设备ID在2019年11月11日与北京市海淀区知春路地铁站进行了对商品A的浏览并收藏。该历史操作数据中需要包括执行历史操作的设备ID,以及设备ID在执行该历史操作的时间点,位置数据等。上述位置数据可以表示为地址,也可以通过建立坐标系,对上述位置数据进行描述,还可以通过经纬对上述位置数据进行表示。
上述根据历史操作数据确定设备ID对应的速度数据。可以根据至少上述设备ID的两组历史操作数据,每组历史操作数据都包括该设备ID在不同时间点进行历史操作的位置数据。例如,设备ID在2019年11月11日14:00于北京市海淀区知春路地铁站进行了对商品A的浏览并收藏。该设备在2019年11月11日20:00于西安市雁塔区大雁塔北广场对上述商品A进行了下单。上述两组历史操作数据的时间点分别为2019年11月11日14:00和2019年11月11日20:00,位置数据分别为北京市海淀区知春路地铁站和西安市雁塔区大雁塔北广场。
根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID,仍以上述两组历史操作数据为例,上述两组历史操作数据中的位置数据之间在现实中,距离约为1100Km,时间间隔为6h,当前复兴号高铁的时速可以达到500Km/h,因此,该设备ID完全有可能在6h内从知春路地铁站移动到大雁塔北广场的,因此上述设备ID可能为真。
若设备ID在大雁塔北广场的时间点为16:05,当前现实世界中,最快的交通工具是飞机,飞机中最快的波音系列,平均时速为1050Km/h,也就是意味着,通过最快的交通工具,也无法达到该设备ID在真实世界中的移动速度,那就只能说明该设备ID为假,其对应的信息也为假。
可选的,根据历史操作数据确定设备ID对应的速度数据包括:按照时间点的先后顺序,将设备ID在多个时间点的位置数据进行排序,得到设备ID的行为轨迹;根据行为轨迹确定设备ID对应的速度数据。
上述设备ID的行为轨迹可以为多个,可以对设备ID的历史操作数据进行分组,例如,境外数据和境内数据,不同的分组可以进行不同的行为轨迹统计,上述行为轨迹就是多个时间点和对应的位置数据的集合,但是,在上述行为轨迹中多个时间点按照时间先后的顺序排列,以便后续进行运算确定速度数据。
可选的,根据行为轨迹确定设备ID对应的速度数据包括:行为轨迹的长度为N,N≥2,在行为轨迹中根据任意相邻2个时间点的位置数据,计算行为轨迹中的设备ID的多个第一速度,获得第一速度序列;判断是否满足N≥m,m为大于2的正整数,在满足N≥m的情况下,在行为轨迹中根据任意相邻m个时间点的位置数据,计算行为轨迹中的设备ID的多个第m-1速度,获得第m-1速度序列,继续判断是否满足N≥m+1;在N<m的情况下,将m=2对应的第一速度序列,至m-1对应的第m-2速度序列中的所有速度数据放在同一速度集合中,确定设备ID对应的速度数据。
上述行为轨迹中包括多个时间点,也即是上述行为轨迹中的历史操作数的数量为多个,上述行为轨迹的长度为上述行为轨迹中历史操作数据的数量。因此,上述行为轨迹的长度N至少为2,在上述行为轨迹的长度为2的情况下,通过两个时间点可以确定一个速度数据。
在上述行为轨迹的长度N大于等于3的情况下,在行为轨迹中先以2为单位逐个遍历相邻的两个历史操作数据的速度数据,例如,在上述行为轨迹的长度N=3的情况下,行为轨迹包括第一历史操作数据,第二历史操作数据,第三历史操作数据,先以2为单位进行计算,也即是通过第一历史操作数据和第二历史操作数计算第一速度数据,通过第二历史操作数据和第三历史操作数据计算第二速度数据,上述第一速度数据和第二速度数据组成第一速度序列,然后通过3为单位进行计算,也即是通过第一历史操作数据和第二历史操作数据以及第三历史数据计算,具体的,从第一历史操作数据到第三历史数据的速度为第三速度数据,该第三速度数据作为第二速度序列。
若上述行为轨迹的长度N为4,则需要先后按照2,3,4为单位分别进行速度数据的确定,在上述行为轨迹的长度N=m,则需要先后按照,2,3,4…,m-1,m对速度数据进行确定。
可选的,根据速度数据与预设速度的比较,确定待识别设备是否为虚假设备包括:将速度集合中的所有速度数据与第一预设速度进行比较,其中,第一预设速度为真实的设备移动的最大速度;在速度数据小于预设速度数据的情况下,确定速度数据为正常数据;在速度数据大于等于第一预设速度的情况下,确定速度数据为高速数据;确定速度数据为高速数据之后,将高速数据与第二预设速度进行比较,其中,第二预设速度为第一预设速度在合理波动范围内的最大速度,第二预设速度大于第一预设速度;在高速数据大于等于第二预设速度的情况下,确定速度数据为伪造数据;根据正常数据,高速数据和伪造数据的比例确定设备是否为虚假设备。
上述第一预设速度可以为上述民航飞机的最大速度,波音7E7的1050Km/h。第一预设速度为真实的设备移动的最大速度,在上述速度数据超过第一预设速度的情况下就很有可能为假数据,反映该设备ID很可能为虚假设备ID。在本实施例中将其确定为高速数据。
上述第二预设速度可以是1500Km/h,远远超过上述第一预设速度。上述第二预设速度为上述第一预设速度合理波动范围的最大速度,也即是上述民航飞机可以通过开发新型,提速等方式,合理的有可能达到上述1500km/h,速度再高就不合理了。也即是速度数据大于上述第二预设速度,可以认定该速度数据为假,该速度数据为伪造数据。
可选的,根据正常数据,高速数据和伪造数据确定待识别设备是否为虚假设备包括:在伪造数据在速度集合中的占比,大于等于第一预设比例的情况下,确定待识别设备为虚假设备;或者,在伪造数据和高速数据的总和在速度集合中的占比,大于等于第二预设比例的情况下,确定待识别设备为虚假设备。
上述第一预设比例小于上述第二预设比例,上述第一预设比例和第二预设可以根据经验进行设定,每次结果都可以进行修正。本实施例中,上述第一预设比例为50%,第二预设比例为70%,也即是,如果伪造数据的占比大于等于50%,或者高速数据和伪造数据的总量的占比大于等于70%,则判段这个设备ID为虚假设备ID。
可选的,获取待识别设备在预设时间段的历史操作数据包括:获取预设时间段内的流量数据;通过流量数据确定历史日志;根据历史日志确定历史操作数据。
上述流量数据中的历史日志可以包括请求日志,曝光日志,点击日志等。
可选的,根据历史操作数据确定设备ID对应的速度数据之前包括:对历史操作数据进行清洗,去除历史操作数据中不正确的时间点,和/或不正确的位置数据对应的历史数据。
对上述历史操作数据进行清洗,可以去掉包含不正确的时间,和/或不正确的位置数据对应的日志数据。从而给人提高历史操作数据的准确性和有效性,从而进一步提高虚假设备ID识别的准确性。
需要说明的是,本实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
本发明具体应用在广告投放中,由于广告投放中虚假设备ID特别多,广告投放到这些虚假设备ID中完全没有意义,识别并过滤掉虚假设备ID是广告投放的第一步。
具体步骤如下:
本专利是基于设备ID的地理位置来判断设备ID是否为虚假设备ID
(1)获取1个月已有的广告投放过程中的流量数据:请求日志,曝光日志,点击日志。每种日志数据应包括:时间,手机的标识:设备ID,gps的数据,进行初步的清洗,去掉包含不正确的时间,或者不正确gps的日志。
(2)合并所有清洗过的日志,按设备ID分组,对每组数据按时间排序,得到每个设备ID的所有行为轨迹List=((t1,gps1),(t2,gps2)…(t2,gpsn))。去掉list长度为1的数据。
(3)对于每组的数据,即每个设备ID的行为轨迹,因为已经对时间排序了,且其长度大于等于2,计算所有相邻两个点即n到n+1时刻的速度得到一组速度数据:List_1=[v1,v2,v3,…]。
(4)如果行为轨迹List的长度大于等3,计算n到n+2时刻的速度List_2=[v1,v2,v3,…];否则List_2为空。
(5)如果行为轨迹List的长度大于等4,计算n到n+3时刻的速度List_3=[v1,v2,v3,…];否则List_3为空。
(6)合并List_1,List_2,List_3,得到最终的所有速度v的集合List_all。因为目前民航飞机的最大速度为波音7E7的1050km/h,所以对List_all进行分组,分为Normal,High,Fake,如果速度v≥1500km/h,则为Fake,否则如果v≥1050km/h,则为High,否则为normal。最后得到Normal,High,Fake的占比。
(7)如果Fake的占比大于等于50%,或者Fake+high大于等于70%,则判段这个设备ID为虚假设备ID。
(8)对于最终得到的所有的虚假设备ID,输入到广告投放系统中,用于广告投放时的过滤。
图2是根据本发明实施例的一种虚假设备的识别装置的示意图,如图2所示,根据本发明实施例的另一方面,还提供了一种虚假设备的识别装置,包括:获取模块22,确定模块24和比较模块26,下面对该装置进行详细说明。
获取模块22,用于获取待识别的设备ID在预设时间段的历史操作数据,历史操作数据包括设备ID进行操作的多个时间点,以及在时间点的设备ID的位置数据;确定模块24,与上述获取模块22相连,用于根据历史操作数据确定设备ID对应的速度数据;比较模块26,与上述确定模块24相连,用于根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID。
通过上述装置,采用获取模块22获取待识别的设备ID在预设时间段的历史操作数据,历史操作数据包括设备ID进行操作的多个时间点,以及在时间点的设备ID的位置数据;确定模块24根据历史操作数据确定设备ID对应的速度数据;比较模块26根据速度数据与预设速度的比较结果,确定设备ID是否为虚假设备ID的方式,通过对设备ID对应的设备的移动速度进行确定,并通过真实的设备移动的最大速度与上述确定的速度进行比较,确定多个速度数据为正常数据,高速数据或伪造数据,通过该设备ID的正常数据,高速数据和伪造数据的比例确定的该设备ID是否虚假,达到了确定设备ID是否虚假的目的,从而实现了有效识别虚假设备ID的技术效果,进而解决了相关技术中虚假设备流量识别方法,无法有效识别新方式的虚假设备ID,导致无法有效识别虚假流量的技术问题。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述中任意一项的虚假设备的识别方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项的虚假设备的识别方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种虚假设备ID的识别方法,其特征在于,包括:
获取待识别的设备ID在预设时间段的历史操作数据,其中,所述历史操作数据包括所述设备ID进行操作的多个时间点,以及在所述时间点的所述设备ID的位置数据;
根据所述历史操作数据确定所述设备ID对应的速度数据;
根据所述速度数据与预设速度的比较结果,确定所述设备ID是否为虚假设备ID。
2.根据权利要求1所述的方法,其特征在于,根据所述历史操作数据确定所述设备ID对应的速度数据包括:
按照时间点的先后顺序,将所述设备ID在多个时间点的位置数据进行排序,得到所述设备ID的行为轨迹;
根据所述行为轨迹确定所述设备ID对应的速度数据。
3.根据权利要求2所述的方法,其特征在于,根据所述行为轨迹确定所述设备ID对应的速度数据包括:
所述行为轨迹的长度为N,N≥2,在所述行为轨迹中根据任意相邻2个时间点的位置数据,计算所述行为轨迹中的所述设备ID的多个第一速度,获得第一速度序列;
判断是否满足N≥m,m为大于2的正整数,在满足N≥m的情况下,在所述行为轨迹中根据任意相邻m个时间点的位置数据,计算所述行为轨迹中的所述设备ID的多个第m-1速度,获得第m-1速度序列,继续判断是否满足N≥m+1;
在N<m的情况下,将m=2对应的第一速度序列,至m-1对应的第m-2速度序列中的所有速度数据放在同一速度集合中,确定所述设备ID对应的速度数据。
4.根据权利要求3所述的方法,其特征在于,根据所述速度数据与预设速度的比较,确定所述待识别设备是否为虚假设备包括:
将所述速度集合中的所有速度数据与第一预设速度进行比较,其中,所述第一预设速度为真实的设备移动的最大速度;
在所述速度数据小于所述预设速度数据的情况下,确定所述速度数据为正常数据;
在所述速度数据大于等于所述第一预设速度的情况下,确定所述速度数据为高速数据;
确定所述速度数据为高速数据之后,将所述高速数据与第二预设速度进行比较,其中,所述第二预设速度为所述第一预设速度在合理波动范围内的最大速度,所述第二预设速度大于所述第一预设速度;
在所述高速数据大于等于所述第二预设速度的情况下,确定所述速度数据为伪造数据;
根据所述正常数据,高速数据和伪造数据的比例确定所述设备是否为虚假设备。
5.根据权利要求4所述的方法,其特征在于,根据所述正常数据,高速数据和伪造数据确定所述待识别设备是否为虚假设备包括:
在伪造数据在所述速度集合中的占比,大于等于第一预设比例的情况下,确定所述待识别设备为虚假设备;
或者,
在伪造数据和高速数据的总和在所述速度集合中的占比,大于等于第二预设比例的情况下,确定所述待识别设备为虚假设备。
6.根据权利要求1所述的方法,其特征在于,获取待识别设备在预设时间段的历史操作数据包括:
获取所述预设时间段内的流量数据;
通过所述流量数据确定历史日志;
根据所述历史日志确定所述历史操作数据。
7.根据权利要求6所述的方法,其特征在于,根据所述历史操作数据确定所述设备ID对应的速度数据之前包括:
对所述历史操作数据进行清洗,去除所述历史操作数据中不正确的时间点,和/或不正确的位置数据对应的历史数据。
8.一种虚假设备ID的识别装置,其特征在于,包括:
获取模块,用于获取待识别的设备ID在预设时间段的历史操作数据,其中,所述历史操作数据包括所述设备ID进行操作的多个时间点,以及在所述时间点的所述设备ID的位置数据;
确定模块,用于根据所述历史操作数据确定所述设备ID对应的速度数据;
比较模块,用于根据所述速度数据与预设速度的比较结果,确定所述设备ID是否为虚假设备ID。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的虚假设备的识别方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的虚假设备的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911204484.0A CN111199417A (zh) | 2019-11-29 | 2019-11-29 | 虚假设备id的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911204484.0A CN111199417A (zh) | 2019-11-29 | 2019-11-29 | 虚假设备id的识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111199417A true CN111199417A (zh) | 2020-05-26 |
Family
ID=70746880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911204484.0A Pending CN111199417A (zh) | 2019-11-29 | 2019-11-29 | 虚假设备id的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111199417A (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016188380A1 (zh) * | 2015-05-28 | 2016-12-01 | 中兴通讯股份有限公司 | 用户设备的确定方法及装置 |
US20160377441A1 (en) * | 2015-06-23 | 2016-12-29 | International Business Machines Corporation | Quantifying anomalous behavior by identifying anomalies at subtrajectories |
CN106790765A (zh) * | 2017-02-14 | 2017-05-31 | 北京三快在线科技有限公司 | 不可信mac地址的识别方法及装置,移动终端定位方法 |
CN107395608A (zh) * | 2017-08-03 | 2017-11-24 | 北京奇安信科技有限公司 | 一种网络访问异常检测方法及装置 |
CN108109011A (zh) * | 2017-12-28 | 2018-06-01 | 北京皮尔布莱尼软件有限公司 | 一种广告反作弊方法及计算设备 |
CN108449342A (zh) * | 2018-03-20 | 2018-08-24 | 北京搜狐互联网信息服务有限公司 | 恶意请求检测方法及装置 |
CN108881326A (zh) * | 2018-09-27 | 2018-11-23 | 深圳市联软科技股份有限公司 | 确定网络流量异常行为的方法、系统、介质及设备 |
CN108965360A (zh) * | 2017-05-19 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 一种推荐数据处理方法及服务器、计算机存储介质 |
CN109787961A (zh) * | 2018-12-24 | 2019-05-21 | 上海晶赞融宣科技有限公司 | 虚假流量的识别方法及装置、存储介质、服务器 |
CN109831454A (zh) * | 2019-03-13 | 2019-05-31 | 北京品友互动信息技术股份公司 | 虚假流量的识别方法和装置 |
CN110209551A (zh) * | 2019-05-24 | 2019-09-06 | 北京奇艺世纪科技有限公司 | 一种异常设备的识别方法、装置、电子设备及存储介质 |
CN110300123A (zh) * | 2019-07-26 | 2019-10-01 | 秒针信息技术有限公司 | 异常流量识别方法、装置、电子设备及存储介质 |
CN110347767A (zh) * | 2019-06-28 | 2019-10-18 | 浙江吉利控股集团有限公司 | 一种虚拟定位车辆的识别方法、装置及服务器 |
CN110519290A (zh) * | 2019-09-03 | 2019-11-29 | 南京中孚信息技术有限公司 | 异常流量检测方法、装置及电子设备 |
-
2019
- 2019-11-29 CN CN201911204484.0A patent/CN111199417A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016188380A1 (zh) * | 2015-05-28 | 2016-12-01 | 中兴通讯股份有限公司 | 用户设备的确定方法及装置 |
US20160377441A1 (en) * | 2015-06-23 | 2016-12-29 | International Business Machines Corporation | Quantifying anomalous behavior by identifying anomalies at subtrajectories |
CN106790765A (zh) * | 2017-02-14 | 2017-05-31 | 北京三快在线科技有限公司 | 不可信mac地址的识别方法及装置,移动终端定位方法 |
CN108965360A (zh) * | 2017-05-19 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 一种推荐数据处理方法及服务器、计算机存储介质 |
CN107395608A (zh) * | 2017-08-03 | 2017-11-24 | 北京奇安信科技有限公司 | 一种网络访问异常检测方法及装置 |
CN108109011A (zh) * | 2017-12-28 | 2018-06-01 | 北京皮尔布莱尼软件有限公司 | 一种广告反作弊方法及计算设备 |
CN108449342A (zh) * | 2018-03-20 | 2018-08-24 | 北京搜狐互联网信息服务有限公司 | 恶意请求检测方法及装置 |
CN108881326A (zh) * | 2018-09-27 | 2018-11-23 | 深圳市联软科技股份有限公司 | 确定网络流量异常行为的方法、系统、介质及设备 |
CN109787961A (zh) * | 2018-12-24 | 2019-05-21 | 上海晶赞融宣科技有限公司 | 虚假流量的识别方法及装置、存储介质、服务器 |
CN109831454A (zh) * | 2019-03-13 | 2019-05-31 | 北京品友互动信息技术股份公司 | 虚假流量的识别方法和装置 |
CN110209551A (zh) * | 2019-05-24 | 2019-09-06 | 北京奇艺世纪科技有限公司 | 一种异常设备的识别方法、装置、电子设备及存储介质 |
CN110347767A (zh) * | 2019-06-28 | 2019-10-18 | 浙江吉利控股集团有限公司 | 一种虚拟定位车辆的识别方法、装置及服务器 |
CN110300123A (zh) * | 2019-07-26 | 2019-10-01 | 秒针信息技术有限公司 | 异常流量识别方法、装置、电子设备及存储介质 |
CN110519290A (zh) * | 2019-09-03 | 2019-11-29 | 南京中孚信息技术有限公司 | 异常流量检测方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
王小红;: "大数据下虚假无效数据优化识别仿真", no. 11 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107040894A (zh) | 一种基于手机信令数据的居民出行od获取方法 | |
CN106571036A (zh) | 公共交通站点确定方法和装置 | |
CN107038620A (zh) | 基于用户打车偏好的信息推送及装置 | |
CN110472154A (zh) | 一种资源推送方法、装置、电子设备及可读存储介质 | |
CN106789292A (zh) | 一种异常行为监控方法和装置 | |
ATE370481T1 (de) | System um fussgängerverkehr zu indizieren | |
CN108269107A (zh) | 用户信息处理方法及装置 | |
CN104965876A (zh) | 一种基于位置信息进行用户工作单位挖掘的方法及装置 | |
CN110674879B (zh) | 一种标识匹配方法、装置、电子设备及可读存储介质 | |
CN107835486A (zh) | 交通出行量计算方法及装置 | |
CN113899355A (zh) | 地图更新方法、装置、云端服务器和共享骑行设备 | |
CN111241402A (zh) | 一种信息推送方法、装置、电子设备及可读存储介质 | |
CN112465558B (zh) | 用于预测区域广告触达率的方法、装置及设备 | |
CN111199417A (zh) | 虚假设备id的识别方法及装置 | |
CN105959306A (zh) | Ip地址的识别方法及装置 | |
CN106022839A (zh) | 一种特定群体的识别方法、系统及终端 | |
CN114817328A (zh) | 一种水域数据处理方法、装置及系统 | |
CN110830314B (zh) | 一种异常流量的确定方法及装置 | |
CN114373321A (zh) | 一种用于个人单次出行的路径优化方法和系统及设备和介质 | |
CN113313307A (zh) | 基于信令大数据的旅游路线挖掘方法 | |
CN109769202A (zh) | 流量数据的定位方法及装置、存储介质、服务器 | |
CN113344642A (zh) | 用于预测广告投资回报率的方法、装置、电子设备及可读存储介质 | |
CN112612934A (zh) | 用户充电行为画像处理方法和装置 | |
CN105722048A (zh) | 一种在在线计费系统中用于计费的方法与设备 | |
CN110288000B (zh) | 活动范围的检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |