CN107341668A - 一种判断真实数据的方法以及装置 - Google Patents

一种判断真实数据的方法以及装置 Download PDF

Info

Publication number
CN107341668A
CN107341668A CN201610287116.7A CN201610287116A CN107341668A CN 107341668 A CN107341668 A CN 107341668A CN 201610287116 A CN201610287116 A CN 201610287116A CN 107341668 A CN107341668 A CN 107341668A
Authority
CN
China
Prior art keywords
data
driving
client
driving trace
track mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610287116.7A
Other languages
English (en)
Other versions
CN107341668B (zh
Inventor
戚立才
张怡菲
董琦
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Didi (china) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Didi (china) Technology Co Ltd filed Critical Didi (china) Technology Co Ltd
Priority to CN201610287116.7A priority Critical patent/CN107341668B/zh
Publication of CN107341668A publication Critical patent/CN107341668A/zh
Application granted granted Critical
Publication of CN107341668B publication Critical patent/CN107341668B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud

Abstract

本发明公开一种判断真实数据的方法以及装置。其中,所述方法包括:获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;根据第一行驶轨迹数据和第二行驶轨迹数据计算得到第一行驶轨迹数据所对应的第一行驶轨迹与第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;将相似性数值与预设阈值进行比较,得到比较结果;在根据比较结果得到相似性数值大于预设阈值的情况下,判断第一客户端的第一用户与第二客户端的第二用户为同一用户,从而实现反作弊。本发明通过利用司机用户的行驶轨迹来判断两个司机用户是否为同一司机用户,从而避免了司机用户骗取平台的司机补贴,实现了反作弊。

Description

一种判断真实数据的方法以及装置
技术领域
本发明涉及数据处理领域,具体地,涉及一种判断真实数据的方法以及装置。
背景技术
为了获取滴滴打车平台的司机补贴,司机用户通过真正做单来模拟真实做单场景。这样,也躲避了滴滴打车平台现有的反作弊策略。为了减少真正做单的成本,司机用户通常使用多部手机,在每部手机的司机客户端上注册一个司机账号。这样,该司机用户可以同时模拟多个订单。常见的场景是,一个司机用户的背包中装有多部安装有司机客户端的手机,通过坐公交车来模拟做单,骗取平台的司机补贴。
现有技术中反作弊的方式有很多种,比如说通过同一平台账号、同一手机号码、同一手机设备或同一身份证号来进行反作弊。举例来说,一个手机设备的客户端上连续登录了多个不同的司机账号,那么打车平台就会限制该手机设备的客户端的登录,或者需要验证才能登录。
然而,由于这些订单是司机用户通过模拟真实的做单场景得到的,并且这些订单的司机账号、用户设备以及打车客户都不一样,因此,返回的订单与正常的订单没有区别。现有技术很难针对这种作弊模式进行反作弊。
发明内容
针对现有技术的缺陷,本发明提供一种判断真实数据的方法,通过利用司机用户的行驶轨迹来判断两个司机用户是否为同一司机用户,从而避免了司机用户骗取平台的司机补贴,实现了反作弊。
依据本发明的第一方面,提出了一种判断真实数据的方法,所述方法包括:
获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;
根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;
将所述相似性数值与预设阈值进行比较,得到比较结果;
在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
可选地,所述方法还包括:
在根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为不同的用户。
可选地,所述获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据,包括:
将所述预设时间段划分为多个时间段;
每隔一个时间段分别获取所述第一客户端所属UE的第一位置数据和所述第二客户端所属UE的第二位置数据;
根据所述第一位置数据和所述第二位置数据分别得到所述第一客户端所属UE的第一行驶轨迹数据和所述第二客户端所属UE的第二行驶轨迹数据。
可选地,所述第一位置数据和所述第二位置数据均包括用户账号、时间、经纬度以及用户状态。
可选地,所述根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值之前,所述方法还包括:
分别剔除所述第一行驶轨迹数据和所述第二行驶轨迹数据中的异常数据。
可选地,所述根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,包括:
分别统计所述第一行驶轨迹数据中第一位置数据的个数和所述第二行驶轨迹数据中第二位置数据的个数;
采用GeoHash算法计算得到与每一第一位置数据对应的第一字符串数据及与每一第二位置数据对应的第二字符串数据;
根据所述第一字符串数据和所述第二字符串数据统计得到所述第一字符串数据与所述第二字符串数据相同的个数;
根据以下公式计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值:
p=k/min{n1,n2}*100%
其中,n1表示所述第一行驶轨迹数据中第一位置数据的个数,n2表示所述第二行驶轨迹数据中第二位置数据的个数,k表示所述第一字符串数据与所述第二字符串数据相同的个数,p表示所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,min{n1,n2}表示求取n1和n2中较小的一者。
依据本发明的第二方面,提出了一种判断真实数据的装置,所述装置包括:
获取单元,用于获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;
计算单元,用于根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;
比较单元,用于将所述相似性数值与预设阈值进行比较,得到比较结果;
判断单元,用于在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
可选地,所述判断单元,还用于:
在根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为不同的用户。
可选地,所述获取单元,具体用于:
将所述预设时间段划分为多个时间段;
每隔一个时间段分别获取所述第一客户端所属UE的第一位置数据和所述第二客户端所属UE的第二位置数据;
根据所述第一位置数据和所述第二位置数据分别得到所述第一客户端所属UE的第一行驶轨迹数据和所述第二客户端所属UE的第二行驶轨迹数据。
可选地,所述第一位置数据和所述第二位置数据均包括用户账号、时间、经纬度以及用户状态。
可选地,所述装置还包括:
剔除单元,用于分别剔除所述第一行驶轨迹数据和所述第二行驶轨迹数据中的异常数据。
可选地,所述计算单元,具体用于:
分别统计所述第一行驶轨迹数据中第一位置数据的个数和所述第二行驶轨迹数据中第二位置数据的个数;
采用GeoHash算法计算得到与每一第一位置数据对应的第一字符串数据及与每一第二位置数据对应的第二字符串数据;
根据所述第一字符串数据和所述第二字符串数据统计得到所述第一字符串数据与所述第二字符串数据相同的个数;
根据以下公式计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值:
p=k/min{n1,n2}*100%
其中,n1表示所述第一行驶轨迹数据中第一位置数据的个数,n2表示所述第二行驶轨迹数据中第二位置数据的个数,k表示所述第一字符串数据与所述第二字符串数据相同的个数,p表示所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,min{n1,n2}表示求取n1和n2中较小的一者。
通过上述技术方案,获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;并根据第一行驶轨迹数据和第二行驶轨迹数据计算得到第一行驶轨迹数据所对应的第一行驶轨迹与第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;及将相似性数值与预设阈值进行比较,得到比较结果;在根据比较结果得到相似性数值大于所述预设阈值的情况下,则判断第一客户端的第一用户与第二客户端的第二用户为同一用户,从而避免了司机用户骗取平台的司机补贴,实现了反作弊。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1是本公开一实施例提供的判断真实数据的方法的流程图;
图2是本公开一实施例提供的判断真实数据的方法的流程图;
图3是本公开一实施例提供的判断真实数据的装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
以下对本公开实施例中提及的部分词语进行举例说明。
本公开实施例中提及的用户设备(User Equipment,简称UE)是所使用的移动终端或个人计算机(Personal Computer,简称PC)等设备。例如智能手机、个人数码助理(PDA)、平板电脑、笔记本电脑、车载电脑(carputer)、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
图1是本公开一实施例提供的判断真实数据的方法的流程图。如图1所示,本公开一实施例提供的判断真实数据的方法包括:
在步骤S101中,获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据。
其中,UE可为移动终端或PC端等,终端为所持的用于提供运营服务的移动终端或PA端等设备,所述预设时间段为一个小时或一天,所述第一客户端和所述第二客户端均为打车平台的司机客户端,所述第一行驶轨迹数据也可指携带所述第一客户端所属UE的司机用户的行驶轨迹数据,所述第二行驶轨迹数据也可指携带所述第二客户端所属UE的司机用户的行驶轨迹数据。需要说明的是,预设时间段的选择会影响判断真实数据的方法的准确性,需要在实际应用中采用迭代法不断验证和调节。
具体地,该步骤包括:将所述预设时间段划分为多个时间段;每隔一个时间段分别获取所述第一客户端所属UE的第一位置数据和所述第二客户端所属UE的第二位置数据;根据所述第一位置数据和所述第二位置数据分别得到所述第一客户端所属UE的第一行驶轨迹数据和所述第二客户端所属UE的第二行驶轨迹数据。
其中,所述第一位置数据和所述第二位置数据均包括用户账号、时间、经纬度以及用户状态。用户账号指的是司机用户的用户账号,经纬度指的是行驶轨迹的轨迹点的位置经纬度,用户状态指的是司机用户处于上班状态还是处于下班状态。
举例来说,在一个小时内,每隔10秒钟获取司机客户端所属UE的行驶轨迹的轨迹点的位置数据,那么在一个小时内可以获取360个轨迹点的位置数据,将这360个位置数据按照获取的先后顺序进行排列便可得到司机客户端所属UE的行驶轨迹数据,将这360个位置数据所对应的轨迹点按照位置数据获取的先后顺序串接起来便可得到司机客户端所属UE的行驶轨迹。
接着,在步骤S102中,根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值。
具体地,该步骤包括:分别统计所述第一行驶轨迹数据中第一位置数据的个数和所述第二行驶轨迹数据中第二位置数据的个数;采用GeoHash算法计算得到与每一第一位置数据对应的第一字符串数据及与每一第二位置数据对应的第二字符串数据;根据所述第一字符串数据和所述第二字符串数据统计得到所述第一字符串数据与所述第二字符串数据相同的个数;根据以下公式计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值:
p=k/min{n1,n2}*100%
其中,n1表示所述第一行驶轨迹数据中第一位置数据的个数,n2表示所述第二行驶轨迹数据中第二位置数据的个数,k表示所述第一字符串数据与所述第二字符串数据相同的个数,p表示所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,min{n1,n2}表示求取n1和n2中较小的一者。
更为具体地,GeoHash算法是将二维的经纬度转换成字符串,不同位数的字符串数据对应的区域大小不同,字符串数据的位数越多,区域越小,如7位的字符串数据对应的区域是150米*150米。由于GeoHash算法为现有技术,在此不再赘述。需要说明的是,字符串数据位数的选择会影响判断真实数据的方法的准确性,需要在实际应用中采用迭代法不断验证和调节。
紧接着,在步骤S103中,将所述相似性数值与预设阈值进行比较,得到比较结果。
需要说明的是,预设阈值的选择会影响判断真实数据的方法的准确性,需要在实际应用中采用迭代法不断验证和调节。具体地,阈值的设定是一个不断迭代的过程。迭代过程如下:首先给定一个阈值,判定阈值的准确性。如果准确性较低,那么增大阈值,继续判定阈值的准确性,直到阈值的准确性符合要求。
然后,在步骤S104中,根据所述比较结果判断所述相似性数值是否大于所述预设阈值。
最后,在步骤S105中,在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
其中,虽然所述第一客户端和所述第二客户端的司机账号不同,但是所述第一客户端的司机用户和所述第二客户端的司机用户是相同的。
具体地,在根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为不同的用户。
其中,根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,不仅所述第一客户端和所述第二客户端的司机账号不同,而且所述第一客户端的司机用户和所述第二客户端的司机用户也是不同的。
本实施例通过获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;并根据第一行驶轨迹数据和第二行驶轨迹数据计算得到第一行驶轨迹数据所对应的第一行驶轨迹与第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;及将相似性数值与预设阈值进行比较,得到比较结果;在根据比较结果得到相似性数值大于所述预设阈值的情况下,则判断第一客户端的第一用户与第二客户端的第二用户为同一用户,从而避免了司机用户骗取平台的司机补贴,实现了反作弊。
图2是本公开一实施例提供的判断真实数据的方法的流程图。如图2所示,本公开一实施例提供的判断真实数据的方法包括:
在步骤S201中,获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据。
由于步骤S201与图1所示的实施例的步骤S101相同,在此不再赘述。
接着,在步骤S202中,分别剔除所述第一行驶轨迹数据和所述第二行驶轨迹数据中的异常数据。
其中,由于gps漂移,客户端所属UE的行驶轨迹的轨迹点会出现一些异常偏离点,需要将该轨迹点的位置数据进行剔除。藉此,可保证判断真实数据的方法的准确性。
紧接着,在步骤S203中,根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值。
然后,在步骤S204中,将所述相似性数值与预设阈值进行比较,得到比较结果。
接着,在步骤S205中,根据所述比较结果判断所述相似性数值是否大于所述预设阈值。
最后,在步骤S206中,在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
由于步骤S203-S206分别与图1所示的实施例的步骤S102-S105相同,在此不再赘述。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开实施例并不受所描述的动作顺序的限制,因为依据本公开实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开实施例所必须的。
图3是本公开一实施例提供的判断真实数据的装置的结构示意图。如图3所示,本公开一实施例提供的判断真实数据的装置包括:
获取单元301,用于获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;
计算单元303,用于根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;
比较单元304,用于将所述相似性数值与预设阈值进行比较,得到比较结果;
判断单元305,用于在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
在本公开的一种可选实施例中,所述判断单元305,还用于:
在根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为不同的用户。
在本公开的一种可选实施例中,所述获取单元301,具体用于:
将所述预设时间段划分为多个时间段;
每隔一个时间段分别获取所述第一客户端所属UE的第一位置数据和所述第二客户端所属UE的第二位置数据;
根据所述第一位置数据和所述第二位置数据分别得到所述第一客户端所属UE的第一行驶轨迹数据和所述第二客户端所属UE的第二行驶轨迹数据。
在本公开的一种可选实施例中,所述第一位置数据和所述第二位置数据均包括用户账号、时间、经纬度以及用户状态。
在本公开的一种可选实施例中,所述装置还包括:
剔除单元302,用于分别剔除所述第一行驶轨迹数据和所述第二行驶轨迹数据中的异常数据。
在本公开的一种可选实施例中,所述计算单元303,具体用于:
分别统计所述第一行驶轨迹数据中第一位置数据的个数和所述第二行驶轨迹数据中第二位置数据的个数;
采用GeoHash算法计算得到与每一第一位置数据对应的第一字符串数据及与每一第二位置数据对应的第二字符串数据;
根据所述第一字符串数据和所述第二字符串数据统计得到所述第一字符串数据与所述第二字符串数据相同的个数;
根据以下公式计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值:
p=k/min{n1,n2}*100%
其中,n1表示所述第一行驶轨迹数据中第一位置数据的个数,n2表示所述第二行驶轨迹数据中第二位置数据的个数,k表示所述第一字符串数据与所述第二字符串数据相同的个数,p表示所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,min{n1,n2}表示求取n1和n2中较小的一者。
需要说明的是,对于本公开提供的判断真实数据的装置还涉及的具体细节已在本公开提供的判断真实数据的方法中作了详细的说明,在此不在赘述。
应当注意的是,在本公开的系统的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本公开不受限于此,可以根据需要对各个部件进行重新划分或者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的子部件。
本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的系统中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上实施方式仅适于说明本公开,而并非对本公开的限制,有关技术领域的普通技术人员,在不脱离本公开的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本公开的范畴,本公开的专利保护范围应由权利要求限定。

Claims (12)

1.一种判断真实数据的方法,其特征在于,所述方法包括:
获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;
根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;
将所述相似性数值与预设阈值进行比较,得到比较结果;
在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
2.根据权利要求1所述的判断真实数据的方法,其特征在于,所述方法还包括:
在根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为不同的用户。
3.根据权利要求1所述的判断真实数据的方法,其特征在于,所述获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据,包括:
将所述预设时间段划分为多个时间段;
每隔一个时间段分别获取所述第一客户端所属UE的第一位置数据和所述第二客户端所属UE的第二位置数据;
根据所述第一位置数据和所述第二位置数据分别得到所述第一客户端所属UE的第一行驶轨迹数据和所述第二客户端所属UE的第二行驶轨迹数据。
4.根据权利要求3所述的判断真实数据的方法,其特征在于,所述第一位置数据和所述第二位置数据均包括用户账号、时间、经纬度以及用户状态。
5.根据权利要求1所述的判断真实数据的方法,其特征在于,所述根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值之前,所述方法还包括:
分别剔除所述第一行驶轨迹数据和所述第二行驶轨迹数据中的异常数据。
6.根据权利要求1所述的判断真实数据的方法,其特征在于,所述根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,包括:
分别统计所述第一行驶轨迹数据中第一位置数据的个数和所述第二行驶轨迹数据中第二位置数据的个数;
采用GeoHash算法计算得到与每一第一位置数据对应的第一字符串数据及与每一第二位置数据对应的第二字符串数据;
根据所述第一字符串数据和所述第二字符串数据统计得到所述第一字符串数据与所述第二字符串数据相同的个数;
根据以下公式计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值:
p=k/min{n1,n2}*100%
其中,n1表示所述第一行驶轨迹数据中第一位置数据的个数,n2表示所述第二行驶轨迹数据中第二位置数据的个数,k表示所述第一字符串数据与所述第二字符串数据相同的个数,p表示所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,min{n1,n2}表示求取n1和n2中较小的一者。
7.一种判断真实数据的装置,其特征在于,所述装置包括:
获取单元,用于获取预设时间段内第一客户端所属UE的第一行驶轨迹数据和第二客户端所属UE的第二行驶轨迹数据;
计算单元,用于根据所述第一行驶轨迹数据和所述第二行驶轨迹数据计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值;
比较单元,用于将所述相似性数值与预设阈值进行比较,得到比较结果;
判断单元,用于在根据所述比较结果得到所述相似性数值大于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为同一用户,从而实现反作弊。
8.根据权利要求7所述的判断真实数据的装置,其特征在于,所述判断单元,还用于:
在根据所述比较结果得到所述相似性数值小于或等于所述预设阈值的情况下,则判断所述第一客户端的第一用户与所述第二客户端的第二用户为不同的用户。
9.根据权利要求7所述的判断真实数据的装置,其特征在于,所述获取单元,具体用于:
将所述预设时间段划分为多个时间段;
每隔一个时间段分别获取所述第一客户端所属UE的第一位置数据和所述第二客户端所属UE的第二位置数据;
根据所述第一位置数据和所述第二位置数据分别得到所述第一客户端所属UE的第一行驶轨迹数据和所述第二客户端所属UE的第二行驶轨迹数据。
10.根据权利要求9所述的判断真实数据的装置,其特征在于,所述第一位置数据和所述第二位置数据均包括用户账号、时间、经纬度以及用户状态。
11.根据权利要求7所述的判断真实数据的装置,其特征在于,所述装置还包括:
剔除单元,用于分别剔除所述第一行驶轨迹数据和所述第二行驶轨迹数据中的异常数据。
12.根据权利要求7所述的判断真实数据的装置,其特征在于,所述计算单元,具体用于:
分别统计所述第一行驶轨迹数据中第一位置数据的个数和所述第二行驶轨迹数据中第二位置数据的个数;
采用GeoHash算法计算得到与每一第一位置数据对应的第一字符串数据及与每一第二位置数据对应的第二字符串数据;
根据所述第一字符串数据和所述第二字符串数据统计得到所述第一字符串数据与所述第二字符串数据相同的个数;
根据以下公式计算得到所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值:
p=k/min{n1,n2}*100%
其中,n1表示所述第一行驶轨迹数据中第一位置数据的个数,n2表示所述第二行驶轨迹数据中第二位置数据的个数,k表示所述第一字符串数据与所述第二字符串数据相同的个数,p表示所述第一行驶轨迹数据所对应的第一行驶轨迹与所述第二行驶轨迹数据所对应的第二行驶轨迹的相似性数值,min{n1,n2}表示求取n1和n2中较小的一者。
CN201610287116.7A 2016-04-29 2016-04-29 一种判断真实数据的方法以及装置 Active CN107341668B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610287116.7A CN107341668B (zh) 2016-04-29 2016-04-29 一种判断真实数据的方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610287116.7A CN107341668B (zh) 2016-04-29 2016-04-29 一种判断真实数据的方法以及装置

Publications (2)

Publication Number Publication Date
CN107341668A true CN107341668A (zh) 2017-11-10
CN107341668B CN107341668B (zh) 2021-03-16

Family

ID=60222154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610287116.7A Active CN107341668B (zh) 2016-04-29 2016-04-29 一种判断真实数据的方法以及装置

Country Status (1)

Country Link
CN (1) CN107341668B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146617A (zh) * 2018-07-27 2019-01-04 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器、客户端及存储介质
CN109165906A (zh) * 2018-06-29 2019-01-08 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器及客户端
CN109165816A (zh) * 2018-07-27 2019-01-08 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器、客户端及存储介质
CN109255624A (zh) * 2018-07-27 2019-01-22 重庆小雨点小额贷款有限公司 一种业务审批方法、装置、服务器及存储介质
CN109961200A (zh) * 2017-12-25 2019-07-02 北京嘀嘀无限科技发展有限公司 监控提醒方法、监控提醒系统、计算机设备和存储介质
CN110197378A (zh) * 2018-02-27 2019-09-03 北京嘀嘀无限科技发展有限公司 网络约车场景中作弊司乘的识别方法和装置
CN111417077A (zh) * 2020-04-16 2020-07-14 刘丽容 移动广告基于微型sdk的流量防作弊方法及系统
WO2020155135A1 (en) * 2019-01-30 2020-08-06 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for identifying similar trajectories
CN112153091A (zh) * 2019-06-27 2020-12-29 北京百度网讯科技有限公司 用于确定设备的相关性的方法及装置
US11017340B2 (en) 2017-12-05 2021-05-25 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for cheat examination
CN114331662A (zh) * 2022-03-11 2022-04-12 支付宝(杭州)信息技术有限公司 识别相同业务主体的方法及装置
CN115049344A (zh) * 2022-08-15 2022-09-13 深圳依时货拉拉科技有限公司 货运订单补贴方法及装置、计算机设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110187515A1 (en) * 2008-09-19 2011-08-04 Hitachi Automotive Systems, Ltd. Vehicle Control Apparatus
CN103246679A (zh) * 2012-02-13 2013-08-14 刘龙 一种实现基于位置的搜索的系统和方法
CN103366566A (zh) * 2013-06-25 2013-10-23 中国科学院信息工程研究所 一种针对特定车辆潜在群体的行驶轨迹预测方法
CN103927795A (zh) * 2013-01-14 2014-07-16 北京中交兴路信息科技有限公司 一种车辆历史行驶轨迹的回放方法和系统
CN104392239A (zh) * 2014-09-25 2015-03-04 深圳市捷顺科技实业股份有限公司 一种车牌识别方法及系统
US20150254276A1 (en) * 2014-03-06 2015-09-10 International Business Machines Corporation Indexing geographic data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110187515A1 (en) * 2008-09-19 2011-08-04 Hitachi Automotive Systems, Ltd. Vehicle Control Apparatus
CN103246679A (zh) * 2012-02-13 2013-08-14 刘龙 一种实现基于位置的搜索的系统和方法
CN103927795A (zh) * 2013-01-14 2014-07-16 北京中交兴路信息科技有限公司 一种车辆历史行驶轨迹的回放方法和系统
CN103366566A (zh) * 2013-06-25 2013-10-23 中国科学院信息工程研究所 一种针对特定车辆潜在群体的行驶轨迹预测方法
US20150254276A1 (en) * 2014-03-06 2015-09-10 International Business Machines Corporation Indexing geographic data
CN104392239A (zh) * 2014-09-25 2015-03-04 深圳市捷顺科技实业股份有限公司 一种车牌识别方法及系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11017340B2 (en) 2017-12-05 2021-05-25 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for cheat examination
CN109961200A (zh) * 2017-12-25 2019-07-02 北京嘀嘀无限科技发展有限公司 监控提醒方法、监控提醒系统、计算机设备和存储介质
CN110197378A (zh) * 2018-02-27 2019-09-03 北京嘀嘀无限科技发展有限公司 网络约车场景中作弊司乘的识别方法和装置
CN109165906A (zh) * 2018-06-29 2019-01-08 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器及客户端
CN109165906B (zh) * 2018-06-29 2021-07-09 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器及客户端
CN109146617A (zh) * 2018-07-27 2019-01-04 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器、客户端及存储介质
CN109165816A (zh) * 2018-07-27 2019-01-08 重庆小雨点小额贷款有限公司 一种业务审批方法、服务器、客户端及存储介质
CN109255624A (zh) * 2018-07-27 2019-01-22 重庆小雨点小额贷款有限公司 一种业务审批方法、装置、服务器及存储介质
WO2020155135A1 (en) * 2019-01-30 2020-08-06 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for identifying similar trajectories
CN112153091A (zh) * 2019-06-27 2020-12-29 北京百度网讯科技有限公司 用于确定设备的相关性的方法及装置
CN112153091B (zh) * 2019-06-27 2022-05-13 北京百度网讯科技有限公司 用于确定设备的相关性的方法及装置
CN111417077B (zh) * 2020-04-16 2020-12-08 刘丽容 移动广告基于微型sdk的流量防作弊方法及系统
CN111417077A (zh) * 2020-04-16 2020-07-14 刘丽容 移动广告基于微型sdk的流量防作弊方法及系统
CN114331662A (zh) * 2022-03-11 2022-04-12 支付宝(杭州)信息技术有限公司 识别相同业务主体的方法及装置
CN115049344A (zh) * 2022-08-15 2022-09-13 深圳依时货拉拉科技有限公司 货运订单补贴方法及装置、计算机设备及可读存储介质

Also Published As

Publication number Publication date
CN107341668B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN107341668A (zh) 一种判断真实数据的方法以及装置
CN107038478B (zh) 路况预测方法及装置、计算机设备与可读介质
US10810870B2 (en) Method of processing passage record and device
CN112446025A (zh) 联邦学习防御方法、装置、电子设备及存储介质
CN106127505A (zh) 一种刷单识别方法及装置
CN110610412A (zh) 信用风险评估方法和装置、存储介质和电子设备
CN110132293B (zh) 一种路线推荐方法及装置
CN108876349B (zh) 电子装置、支付通道确定方法及存储介质
CN109002820A (zh) 一种车牌识别方法、装置及相关设备
US20220383168A1 (en) Method and system for reducing risk values discrepancies between categories
CN107026845A (zh) 任务作弊行为识别方法及装置
CN106648664A (zh) 自助终端业务流程的更新方法及装置
CN113064994A (zh) 会议质量评估方法、装置、设备及存储介质
CN110784435B (zh) 一种异常服务识别方法、装置、电子设备及存储介质
CN107944374A (zh) 视频数据中特定对象检测方法及装置、计算设备
CN111104585B (zh) 一种问题推荐方法及装置
CN110378389A (zh) 一种Adaboost分类器计算机创建装置
CN110782232A (zh) 业务流程可视化配置方法、装置、电子设备及存储介质
CN111612183A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN111523766B (zh) 驾驶风险评估方法、装置、电子设备及可读存储介质
CN111182354B (zh) 视频评分推荐方法、装置、设备及计算机可读存储介质
CN108572948A (zh) 门牌信息的处理方法及装置
CN112561893A (zh) 图片匹配方法、装置、电子设备及存储介质
CN107203579A (zh) 基于用户打车数据的休息日分类方法及装置
CN111860661A (zh) 基于用户行为的数据分析方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201214

Address after: Building 34, yard 8, Dongbei Wangxi Road, Haidian District, Beijing 100193

Applicant after: BEIJING DIDI INFINITY TECHNOLOGY AND DEVELOPMENT Co.,Ltd.

Address before: Room 219-23, 2 / F, block D, comprehensive service area, Nangang Industrial Zone, Tianjin Economic and Technological Development Zone, Binhai New Area, Tianjin 300480

Applicant before: Didi (China) Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant