CN107622406A

CN107622406A - 识别虚拟设备的方法及系统

Info

Publication number: CN107622406A
Application number: CN201610556213.1A
Authority: CN
Inventors: 龚如
Original assignee: Jing Shuo Technology (beijing) Ltd By Share Ltd
Current assignee: Jing Shuo Technology (beijing) Ltd By Share Ltd
Priority date: 2016-07-14
Filing date: 2016-07-14
Publication date: 2018-01-23

Abstract

本发明涉及一种识别虚拟设备的方法，所述方法包括：将获得的设备信息与真实设备信息进行比对并评判虚拟程度；将获得的设备信息与作弊框架进行比对并评判虚拟程度；和综合前述评判的虚拟程度的得分，当综合虚拟程度的得分大于阈值时，判断该设备为虚拟设备。本发明还涉及一种识别虚拟设备的系统。

Description

识别虚拟设备的方法及系统

技术领域

本发明涉及通讯领域，特别是识别虚拟设备的方法。本发明还涉及用于识别虚拟设备的系统。

背景技术

长久以来，稳定而且可信赖的用户设备标识，是诸多行业最为基础的数据支持。目前，有很多方法来帮助系统生产不同的ID用以标识用户。最基础的方法，就通过生产随机数，分配给不同的用户，这种常用于含有账户体系的业务场景。例如腾讯QQ，给每一个用户都分配一个不重复的QQ号码，作为其系统服务的ID。除此以外，也有通过采集设备使用者的信息来生产ID，例如通过采集音频数据、加速传感器数据或者生物指纹传感器的数据，这种可以服务于跨设备的用户标识。

但是如上两种方法，很难满足于移动广告行业反作弊的需求。原因主要有以下两点：

1.移动广告交易主要是以设备为单元进行消耗的计费，例如CPC(按照点击设备数计费)、CPM(按照曝光设备数计费)、CPA(按照激活设备数计费)，那么针对持有多设备的用户以及不具有账户体系的广告平台，随机数的方法是不适用的。

2.广告作弊者主要是通过变换较为常见的设备标识进行伪装，例如利用虚拟设备伪装点击、曝光或激活行为，从广告主那里获取额外的收入，使广告主的利益蒙受损失。然而，通过采集使用者信息标识设备会有较多局限：第一是采集方法都是基于特质的传感器，不适用于大部分移动设备；第二是用户识别的方法复杂并且精准度有限。

随着广告支出越来越向移动端倾斜，市场上虚拟设备的拟真程度越来越高，亟需一种有效的识别虚拟设备的方案，以减少无谓的广告支出，保护广告主的利益。

发明内容

有鉴于此，本发明提供一种识别虚拟设备的技术方案，该方案能够综合性地识别虚拟设备，帮助广告主排除由这些虚拟设备产生的广告支出(广告流量)。当然，如果需要，本发明的方法也可用在需要识别移动终端是否为虚拟设备的其他领域。

根据本发明的第一方面，本发明提供了一种识别虚拟设备的方法，所述方法包括：

将获得的设备信息与真实设备信息进行比对并评判虚拟程度；

将获得的设备信息与作弊框架进行比对并评判虚拟程度；和

综合前述评判的虚拟程度的得分，根据阈值和综合虚拟程度的得分判断待识别的设备是否为虚拟设备。

在本发明的一些实施方式中，所述真实设备信息包括：设备参数、感应器参数、用户参数、和系统参数中的一种或多种。

优选地，所述真实设备信息包括硬件品牌、硬件型号、序列号、和加速度传感器角速度变化值中的多种。

优选地，所述真实设备信息包括IMSI国际移动用户识别码、IMEI国际移动设备识别码、ESN电子序列号、MEID中的一种或多种。

优选地，所述真实设备信息为移动设备的设备信息；更优选地，所述真实设备信息为手机、平板电脑、或可穿戴设备的设备信息。

在本发明的一些实施方式中，将获得的设备信息与真实设备信息分别对比并各自评判虚拟程度。

例如设备信息中芯片品牌为高通，判断为非虚拟设备；加速度传感器的角速度变化值为0，判断为虚拟设备。

在本发明的一些实施方式中，将获得的设备信息与作弊框架进行比对，当符合作弊框架的信息时，判断为虚拟设备。

可选地，各项信息虚拟程度的得分是有权重的。

可选地，各项信息虚拟程度的得分是有优先级的。

根据本发明的第二方面，本发明提供了一种识别虚拟设备的系统，所述系统包括

数据接收模块，用于接收待识别的设备信息；

信息库模块，存储作为虚拟设备判断标准的信息；

设备信息评判模块，将接收到的设备信息与信息库中的信息做比对，然后根据比对结果分别评判虚拟程度；

确定模块，综合设备信息评判模块做出评判，根据阈值和综合虚拟程度的得分判断待识别的设备是否为虚拟设备。

优选地，所述作为虚拟设备判断标准的信息包括真实设备信息和作弊框架信息。

优选地，所述信息库模块包括设备信息库模块和作弊框架库模块。

在本发明的一些实施方式中，加速度传感器的角速度变化值为0，判断为虚拟设备。

在本发明的一些实施方式中，待识别的设备信息中不包含信息库中的真实设备信息中的一种或多种时，判断为虚拟设备。

在本发明的一些实施方式中，待识别的设备信息包含作弊框架信息时，判断为虚拟设备。

可选地，各项信息虚拟程度的得分是有权重的。

可选地，各项信息虚拟程度的得分是有优先级的。

附图说明

下面将通过参照附图详细描述本发明的优选实施例，使本领域的普通技术人员更清楚本发明的所述及其它特征和优点，附图中：

图1示出了根据本发明一些实施方式的方法流程图。

图2示出了根据本发明另一些实施方式的方法流程图。

图3示出了根据本发明一些实施方式的系统的示意图。

图4示出了根据本发明另一些实施方式的方法流程图。

具体实施方式

在下文的描述中，给出了大量具体的细节以便提供对本发明更为彻底的理解。然而，对于本领域技术人员来说显而易见的是，本发明可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本发明发生混淆，对于本领域公知的一些技术特征未进行描述。

在本发明中，术语“作弊框架”是指作弊时常用的手段。所述作弊框架涉及的对象包括但不限于IP、Cookie、Browser、和Click，因为作弊手段常从这几个方面入手。在本发明中，作弊框架通常是从论坛上和工作中总结出的作弊形式，这些固定形式会被收集在信息库中作为判断标准之一。随着时间推移和技术发展，作弊框架的具体形式和种类会不断变化和增加，本发明人率先将“作弊框架”作为一个机器判断的标准引入识别系统，极大的增加了识别系统的准确度和效率。

例如常见的作弊手段中，会出现同一IP地址换不同的Cookie来点击广告。由于目前的广告监测是多数基于Cookie的，因此这样产生的流量很难被排除，从而给广告主造成经济损失。通常，这是通过作弊程序反复删除Cookie实现的。从数据采集的角度考虑，一般的想法是寻找比Cookie更稳定的监测基准。但本发明的发明人另辟蹊径，想到：这些作弊程序是有标准特征(作弊框架，例如程序代码)的，如果在采集的数据中检测到这样的特征，那么所得数据是由虚拟设备发出的可能性就会很大。对于大数据处理，利用作弊框架识别虚拟设备相比其他方法要简单、迅速得多。且作弊框架的库可以不断更新，以适应技术的发展，而无需对采集系统和采集模式做大规模的修改，有利于提供长期稳定、可持续的服务。

在本发明中，术语“虚拟程度”是指在具体评判的设备信息中，该信息(特征)与虚拟设备的关联性。例如，“1”可以代表是虚拟设备，“0”可以代表非虚拟设备，亦可反之。综合虚拟程度得分，即为各项虚拟程度得分之和，可以加权。例如，选取10项设备信息特征(如品牌，加速度传感器角速度等)作为评判特征，得分为“0011100100”，即得分为4，当阈值为5时，该设备判断为非虚拟设备。再如，可以设当设备信息中存在作弊框架特征，得分为6，则当阈值为5时，该设备判断为虚拟设备。有关具体虚拟程度的设置可以根据需要和历史统计的结果而设定，设置的方法也不限于前文列举的几种，只要能够对是否为虚拟设备做出评判即可。

本发明中所使用的术语仅仅是为了描述具体实施例而非意图限制示例性实施例。除非上下文明确地另有所指，否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是，这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在，而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。

如图1所示，在本发明的一些实施方式中，本发明的方法作为识别虚拟设备的一个环节可以与其他识别虚拟设备的方法组合使用。

所述设备信息包括但不限于所述用户设备的任意可直接获取的信息，如所述用户设备的IP地址、所述用户设备的实时网速或某一时间段内的平均网速、所述用户设备的操作系统名称、所述用户设备的操作系统版本号、所述用户设备的开发框架名称、所述用户设备的开发框架版本号、所述用户设备的系统配置等。特别的，所述设备信息还包括设备的硬件信息，包括但不限于整机的品牌、型号、序列号；芯片品牌、型号、序列号；传感器品牌、型号、序列号；传感器参数值、角速度、加速度；主板品牌、型号、序列号等。

所述设备信息还可以包括所述用户设备的可直接获取的设备特征信息；或是通过对所述设备信息的分析或统计，以获取的设备特征信息。优选地，所述设备特征信息包括以下至少任一项：

所述用户设备所对应的地域信息：其中，所述地域信息如国家、省、市、自治区、县、乡等行政区域或具体的经纬度等，所述地域信息可通过对所述用户设备的IP、GPS等信息进行分析后获取，或是直接根据所述用户设备的注册地等进行获取；

所述用户设备所对应的运营商信息：其中，所述运营商信息可根据对所述用户设备的IP、手机号等信息进行分析后获取；

所述用户设备所对应的网速：在此，所述网速包括但不限于实时网速或平均网速等，所述网速可以由所述用户设备自身统计，也可以借由第三方测试工具进行统计；

所述用户设备所对应的系统环境：在此，所述系统环境包括但不限于操作系统名称、版本号，开发框架的名称、版本号，系统配置等；

所述用户设备的在线状态/离线状态：即所述用户设备当前是否在线和/或一般在线时间与时长等信息。

在此，本领域技术人员应能理解，所述用户设备可以将可直接获取的所述设备相关信息发送至所述服务设备，由所述服务设备根据所述设备信息，进行所述设备特征信息的确定；此外，所述用户设备也可以根据所述设备信息，进行所述设备特征信息的确定，从而直接将所述设备特征信息发送至所述服务设备。

本发明的方法既可以作为识别虚拟设备的一个环节，也可以单独用于识别虚拟设备。

如图2所示，在本发明的另一些实施方式中，本发明方法的结论可用作数据的特征标识。在如图4所示的系统中，通过数据采集模块511采集用户终端的数据，其中包括设备信息。经过步骤S210、步骤S220、和步骤S230之后，在步骤S240，所述结果被返回该条数据作为特征标识。

实施例1

通过数据采集模块511采集用户终端的数据，获取两条原始日志，数据接收模块111从原始日志中截取用于判断的信息段发送到设备信息评判模块311：

设备信息评判模块311将信息段发送到信息库模块210做比对：

1.在设备信息库211中比对，发现brand不同，但是具有相同的model值：“emu02”,这是不正常的，有可能是虚拟设备批量仿造真实设备厂商和品牌名称。返回设备信息评判模块311，对此环节的虚拟程度进行打分。

2.通过探测设备已经root，继而在作弊框架库212中查找是否有已知的作弊框架，发现两条数据都存在“Xposed”这种HOOK机制的框架。返回设备信息评判模块311，对此环节的虚拟程度进行打分。

3.在设备信息库211中比对，发现不具有“环境光线传感器”和“震动传感器”，再次加深虚拟设备的可能性。返回设备信息评判模块311，对此环节的虚拟程度进行打分。

综合作弊特征序列计算出的虚拟设备程度分值，将结果发送到确定模块411，可以确定这两条激活数据包是通过虚拟设备产生的。

确定模块411将结论返回数据接收模块111，在原始日志中追加数据标签，标定为虚拟设备。

实施例2

与实施例1的情况和步骤基本相同，不同在于：结果发送到确定模块411后，当确定这两条激活数据包是通过虚拟设备产生的，则将结论返回数据接收模块111，做出丢弃该两条原始日志的指令。

实施例3

设备信息评判模块311将信息段发送到信息库模块210做比对：

3.在设备信息库211中比对，发现“Xiaomi”具有“环境光线传感器”和“震动传感器”，而“Huawei”不具有“环境光线传感器”和“震动传感器”。返回设备信息评判模块311，对此环节的虚拟程度进行打分。

综合作弊特征序列计算出的虚拟设备程度分值，“Xiaomi”综合得分判断为非虚拟设备，“Huawei”综合得分判断为虚拟设备。

将结果发送到确定模块411，确定模块411将结论返回数据接收模块111，在原始日志中追加数据标签，标定“Huawei”为虚拟设备。

在本实施例中，如果提高“作弊框架”的权重，“Xiaomi”也有可能被判断为虚拟设备。所述各个判断指标的权重是根据实际情况长期归纳总结而来，也可以通过机器学习而调整。判断出的虚拟设备的结论可以理解为虚拟设备的可能性。

在实际应用中，从原始日志中可以截取更多的信息段进行组合判断。最终对各个环节分别打分、计算权重，得到综合的判断结果。通过与实际结果的比对，不断修正权重、增加信息库的内容、调整判断策略，利用机器自学习不断提高系统的准确度。本发明人提供的这套识别虚拟设备的系统和方法可以适应网络环境下快速的变化，比现有技术提供更多维度的判断标准，更加准确地得到判断的结果。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。

本发明已经通过所述实施例进行了说明，但应当理解的是，所述实施例只是用于举例和说明的目的，而非意在将本发明限制于所描述的实施例范围内。此外本领域技术人员可以理解的是，本发明并不局限于所述实施例，根据本发明的教导还可以做出更多种的变型和修改，这些变型和修改均落在本发明所要求保护的范围以内。本发明的保护范围由附属的权利要求书及其等效范围所界定。

Claims

1.一种识别虚拟设备的方法，所述方法包括：

将获得的设备信息与作弊框架进行比对并评判虚拟程度；和

2.根据权利要求1所述的方法，其中所述真实设备信息包括：设备参数、感应器参数、用户参数、和系统参数中的一种或多种。

3.根据权利要求1所述的方法，其中所述真实设备信息包括硬件品牌、硬件型号、序列号、和加速度传感器角速度变化值中的一种或多种。

4.根据权利要求1所述的方法，其中将获得的设备信息与真实设备信息分别对比并各自评判虚拟程度。

5.根据权利要求4所述的方法，其中各项信息虚拟程度的得分有权重的和/或优先级。

6.根据权利要求3所述的方法，其中当加速度传感器的角速度变化值为0，判断为虚拟设备。

7.根据权利要求1所述的方法，其中将获得的设备信息与作弊框架进行比对，当符合作弊框架的信息时，判断为虚拟设备。

8.一种识别虚拟设备的系统，所述系统包括

数据接收模块，用于接收待识别的设备信息；

信息库模块，存储作为虚拟设备判断标准的信息；

9.根据权利要求8所述的系统，其中所述作为虚拟设备判断标准的信息包括真实设备信息和作弊框架信息。

10.根据权利要求8所述的系统，其中所述信息库模块包括设备信息库模块和作弊框架库模块。