CN108985048A - 模拟器识别方法及相关装置 - Google Patents

模拟器识别方法及相关装置 Download PDF

Info

Publication number
CN108985048A
CN108985048A CN201710398631.7A CN201710398631A CN108985048A CN 108985048 A CN108985048 A CN 108985048A CN 201710398631 A CN201710398631 A CN 201710398631A CN 108985048 A CN108985048 A CN 108985048A
Authority
CN
China
Prior art keywords
simulator
attribute
device attribute
equipment
associate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710398631.7A
Other languages
English (en)
Other versions
CN108985048B (zh
Inventor
尤飞
杨勇
陈远斌
陈梦
宗旋
刘飞飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710398631.7A priority Critical patent/CN108985048B/zh
Publication of CN108985048A publication Critical patent/CN108985048A/zh
Application granted granted Critical
Publication of CN108985048B publication Critical patent/CN108985048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators

Abstract

本发明提供了模拟器识别方法及相关装置,以识别出模拟器设备。在该识别方法中,获取第一业务的业务数据;业务数据至少包括关联设备的设备属性组,设备属性组包括关联设备多维度的设备属性;第一业务具有的业务权限能够获取多维度的设备属性;提取各业务数据的关联设备的设备属性组,得到各关联设备的设备属性组;根据提取出的各关联设备的设备属性组,从各关联设备中筛选出模拟器设备。在本申请提供的技术方案中,在获取业务数据后,提取出关联设备的设备属性组,并通过全面的设备属性维度甄别模拟器设备。也即,将设备信息层面与业务相结合,利用了具有设备属性信息的业务数据进行模拟器设备识别,为模拟器设备识别提供了准确的识别方案。

Description

模拟器识别方法及相关装置
技术领域
本发明涉及计算机技术领域,更具体的说是涉及模拟器识别方法及相关装置。
背景技术
模拟器(Emulator,EMU)是一种程序,也译作仿真器。通过模拟器可使得一台计算机系统(称作主系统)在行为上模拟另一台计算机系统(称作客户系统),并一般可允许在主系统上运行为客户系统设计的软件或者外设。例如,可在PC(个人电脑)上运行虚拟机执行其他操作系统、电视游戏、街机等。
不当使用模拟器的行为会严重影响业务的开展。随着互联网业务的发展,越来越多的软件服务需要对模拟器设备进行识别。例如,电商在提供促销等活动时,可能存在利用模拟器设备进行恶意刷单抢优惠的情况,这就需要识别出模拟器设备;再例如,一般情况下移动端游戏(手游)不支持多开(也即在一个移动设备上登陆多个游戏帐号进行游戏操作),而代练为了提高效率,在PC上安装模拟器模仿移动设备,以实现在一个PC设备上运行多个游戏帐号进行游戏操作。这种情况下,也需要识别出模拟器设备。
而如何识别出模拟器设备,是目前研发的热门。
发明内容
有鉴于此,本发明实施例提供模拟器识别方法及相关装置,以识别出模拟器设备。
为实现上述目的,本发明实施例提供如下技术方案:
一种模拟器识别方法,包括:
获取第一业务的业务数据;
所述业务数据至少包括关联设备的设备属性组,所述设备属性组包括所述关联设备多维度的设备属性;所述第一业务具有的业务权限能够获取多维度的设备属性;
提取各业务数据的关联设备的设备属性组,得到各关联设备的设备属性组;
根据提取出的各关联设备的设备属性组,从所述各关联设备中筛选出模拟器设备。
一种模拟器识别装置,包括:
获取单元,用于获取第一业务的业务数据;所述业务数据至少包括关联设备的设备属性组,所述设备属性组包括所述关联设备多维度的设备属性;所述第一业务具有的业务权限能够获取多维度的设备属性;
处理单元,用于:
提取各业务数据的关联设备的设备属性组,得到各关联设备的设备属性组;
根据提取出的各关联设备的设备属性组,从所述各关联设备中筛选出模拟器设备。
一种模拟器识别服务器,其特征在于,至少包括处理器和存储器;所述处理器通过执行所述存储器中存放的程序以及调用其他设备,执行上述的模拟器识别方法。
一种模拟器识别集群,包括多个模拟器识别服务器,所述模拟器识别服务器包括上述的模拟器识别装置。
可见,在本申请实施例中,在获取业务数据后,提取出关联设备的设备属性组,并通过全面的设备属性维度甄别模拟器设备。也即,在本申请所提供的技术方案中,将设备信息层面与业务相结合,利用了具有设备属性信息的业务数据进行模拟器设备识别,为模拟器设备识别提供了准确的识别方案。
附图说明
图1为本发明实施例提供的应用场景示例图;
图2a为本发明实施例提供的模拟器识别服务器的计算机架构示例图;
图2b为本发明实施例提供的模拟器识别装置的示例性结构图;
图3、图5a、图5b、图5c、图7为本发明实施例提供的模拟器识别方法的示例性流程图;
图4为本发明实施例提供的设备信息库的示意图;
图6为本发明实施例提供的模拟器分类器的示例性训练流程。
具体实施方式
本发明提供模拟器识别方法及相关装置(例如模拟器识别装置、模拟器识别服务器,模拟器识别集群)。
多个模拟器识别服务器可构成上述模拟器识别集群。
图1示出了上述模拟器识别集群的一种示例性应用场景:模拟器识别集群可为多个业务提供模拟器识别服务,不同业务的业务数据可通过web服务器101提供给模拟器识别集群中的模拟器识别服务器102。
当然,上述业务数据可来自模拟器设备或非模拟器设备。
图2a示出了上述模拟器识别服务器的一种通用计算机系统结构。
上述计算机系统可包括总线、处理器1、存储器2、通信接口3、输入设备4和输出设备5。处理器1、存储器2、通信接口3、输入设备4和输出设备5通过总线相互连接。其中:
总线可包括一通路,在计算机系统各个挂件之间传送信息。
处理器1可以是通用处理器,例如通用中央处理器(CPU)、网络处理器(NetworkProcessor,简称NP)、微处理器等,也可以是特定应用集成电路(application-specificintegrated circuit,ASIC),或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(DSP)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
处理器1可包括主处理器(CPU),还可包括显卡中的图形处理器(GPU)等。
处理器1的个数可为一个或多个。
存储器2中保存有执行本发明技术方案的程序,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,存储器2可以包括只读存储器(read-only memory,ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory,RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。
输入设备4可包括接收用户输入的数据和信息的装置,例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。
输出设备5可包括允许输出信息给用户的装置,例如显示屏、打印机、扬声器等。
通信接口3可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(WLAN)等。
处理器1通过执行存储器2中所存放的程序以及调用其他设备,可实现下述实施例提供的模拟器识别方法。
模拟器识别装置可以软件的形式应用于上述模拟器识别服务器中,当以软件形式存在时,上述模拟器识别装置具体可为一进程,也可作为某应用程序或操作系统的组件。
或者,上述模拟器识别装置以硬件的形式(例如具体可为模拟器识别服务器的控制器/处理器),作为模拟器识别服务器的组成部分。
图2b示出了模拟器识别装置的一种示例结构,可包括获取单元201和处理单元202。此外,在本申请其他实施例中,上述模拟器识别装置还可包括共享单元203。
本文后续将结合模拟器识别方法,对上述获取单元201、处理单元202和共享单元203的功能进行介绍。
图3示出了模拟器识别方法的一种示例性流程。图3所示的方法应用于上述提及的领域或应用场景(例如图1)中。
上述示例性流程包括:
在301部分:获取第一业务的业务数据。
请参见图1,上述业务数据可由模拟器设备或非模拟器设备(也可称为正常设备)发送至web服务器101,web服务器101再将业务数据提供给模拟器识别集群中的服务器。
在一个示例中,可由获取单元201执行上述301部分。
业务数据至少可包括业务账号,与业务帐号相关联的设备可称为关联设备,业务账号使用关联设备执行登录、发送业务数据等操作。
以游戏为例,假定用户使用游戏账号A在移动终端B上登录玩游戏,那么游戏账号A即为业务账号,移动终端B即为游戏账号A的关联设备,移动终端B会产生业务数据,发送至web服务器201,然后再由web服务器201发送给模拟器识别集群中的服务器。
同理,假定用户使用电商平台账号C在手机D上登录、采购产品,那么电商平台账号C也为业务账号,手机D则为电商平台账号C的关联设备。
需要说明的是,不同的业务可能具有不同的业务权限。有些业务的业务权限低,只能获取关联设备的设备码,而有些业务的业务权限高,可以获取多维度的设备属性。
因此,从业务权限角度,可将业务分为第一业务和第二业务,其中:
第一业务具有的业务权限能够获取多维度的设备属性,相应的,第一业务的业务数据除包含业务账号外,还包括关联设备的设备属性组,其中,设备属性组包括该关联设备多维度的设备属性(多维度包括设备信息维度、配置信息维度和运行信息维度);
而第二业务则不具有能够获取全面的设备属性的业务权限。
为了进行模拟器识别,需要借助第一业务的业务数据。
在具体实现时,可由web服务器201从业务数据中提取出第一业务的业务数据,再将第一业务的业务数据提供给模拟器识别集群;或者,web服务器201也可将所有的业务数据均提供给模拟器识别集群,由模拟器识别集群中的服务器从中提取出第一业务的业务数据。
在302部分:提取各业务数据的关联设备的设备属性组,得到各关联设备的设备属性组。
在一个示例中,可由前述的处理单元202执行302部分。
由于同时可能有多个业务账号活跃,因此,可获取到同一业务下不同业务账号的业务数据,进而提取多个关联设备的设备属性组。
其中,设备属性组包括关联设备多维度的设备属性,例如设备品牌标识、设备码标识和电池运行信息。此外,还可包括其他多个维度的设备属性。
在一个示例中,设备属性组中的设备属性可划分为两大类:设备信息类和运行信息类。
其中,设备信息类至少可包括前述的设备品牌标识和设备码标识。设备码可唯一标识一个设备,举例来讲,若设备为移动设备,其设备码为国际移动设备识别码(IMEI);若设备为PC机,其设备码可为MAC地址。
此外,设备信息类还可进一步包括设备型号、设备类型、设备商标、屏幕长宽像素、CPU型号、内存容量大小、加速度传感器名称、加速度传感器供应商、重力传感器名称、重力传感器供应商、是否支持加速感应器、是否支持低能耗蓝牙、是否支持蓝牙、是否支持红外、是否支持重力感应器、是否支持陀螺仪、是否支持NFC近场通信、是否支持移动通讯等;
而运行信息类可至少包括上述的电池运行信息(例如电量、电压)。为后续准确识别模拟器设备,可获取预设时长内的电池运行信息,例如,获取几天、一周、一个月内的电量值和电压值。
此外,也可包括其他硬件的运行信息,例如CPU占用率等。
在303部分:根据提取出的各关联设备的设备属性组,从各关联设备中筛选出模拟器设备。
可由前述的处理单元202执行303部分。
更具体的,可通过如下步骤从各关联设备中筛选出模拟器设备:
步骤一,从提取的各设备属性组中,确定出设备属性不匹配的设备属性组;
本文后续还将详细介绍如何确定出设备属性不匹配的设备属性组。
为后续方便称呼,可将上述“设备属性不匹配的设备属性组”称为候选设备属性组,相应的,候选设备属性组对应的关联设备可称为候选设备。
步骤二,综合分析各候选设备的多维度的设备属性,从中确定出模拟器设备。
综合分析的方式有多种,例如,在一个示例中,可为候选设备各维度的设备属性分配权重值,基于多维度的权重值确定出模拟器设备。
在另一个示例中,也可将候选设备的多维度的设备属性作为数据样本进行聚类分析,得到模拟器设备类,将模拟器设备类中的设备确定为模拟器设备。
可见,在本申请实施例中,在获取业务数据后,提取出关联设备的设备属性组,并通过全面的设备属性维度甄别模拟器设备。也即,在本申请所提供的技术方案中,将设备信息层面与业务相结合,利用了具有设备属性信息的业务数据进行模拟器设备识别,为模拟器设备识别提供了准确的识别方案。
图5a示出了模拟器识别方法的另一种示例性流程。图5a所示的方法应用于上述提及的领域或应用场景(例如图1)中。
上述示例性流程包括:
501部分-502部分,分别与前述301-302部分相同,在此不作赘述。
在503部分:从提取的各设备属性组中,确定出设备属性不匹配的设备属性组。
在一个示例中,可由前述的处理单元202执行503部分。
更具体的,可基于设备信息库确定出设备属性不匹配的设备属性组。
设备信息库是通过收集用户大量的设备信息而建立起来的。请参见图4,设备信息库存储有至少一个参考设备属性组,每一参考设备属性组包含多维度的设备属性(一般包括设备信息类下的设备属性)。
例如:某参考设备属性组包括如下维度的设备属性:设备品牌标识,CPU型号、CPU厂商、加速度传感器名称、加速度传感器供应商、重力传感器名称、重力传感器供应商、屏幕长宽像素、内存容量大小等。
需要说明的是,参考设备属性组中的各设备属性是相匹配的。
在一个示例中,可将提取出的设备属性组与设备信息库中的参考设备属性组进行匹配;若某提取出的设备属性组与设备信息库中的全部参考设备属性组均不匹配,则判定该设备属性组中的设备属性不匹配。
在具体实现时,在比较提取出的任一设备属性组与任一参考设备属性组时,可在两者至少存在N个不匹配的设备属性时,判断两属性组不匹配。N的取值可为1、2、3等等。
以N=1为例,假定设备信息库中某参考设备属性组包括:华为(设备品牌),P10(设备型号),海思CPU(CPU厂商);
而某提取出的设备属性组包括:华为(设备品牌),P10(设备型号),联发科CPU(CPU厂商)。
通过比较,两属性组的CPU厂商不同。由于N=1,则可判定两属性组不匹配。
当然,一般情况下,并不需要将提取出的设备属性组与设备信息库中全部的参考设备属性组均匹配一遍,只需要将提取出的设备属性组与设备品牌(和设备型号)相同的参考设备属性组相匹配即可。例如,若提取出的某设备属性组的设备品牌为华为,只需要将它与设备品牌为华为的各参考属性组相匹配即可。或者,若提取出的某设备属性组的设备品牌为华为、设备型号为P10,只需要将它与设备品牌为华为、设备型号为P10的各参考属性组相匹配即可。
为后续方便称呼,可将上述“设备属性不匹配的设备属性组”称为候选设备属性组,相应的,候选设备属性组对应的关联设备可称为候选设备。
在504部分:分析候选设备各设备属性是否符合模拟器设备的设备属性特征。
可由前述的处理单元202执行504部分。
以设备品牌标识、设备码标识和电池运行信息三个维度为例,以第i个候选设备表示任一候选设备,504部分可示例性得具体包括如下操作:
A:若第i个候选设备的设备品牌标识与模拟器品牌标识相符,确定第i个候选设备的设备品牌标识符合模拟器设备的设备属性特征;
更具体的,若第i个候选设备的设备品牌标识为特定的模拟器品牌,则确定其设备品牌标识符合模拟器设备的设备属性特征。
举例来讲,若第i个候选设备的设备品牌标识为tencent,而并没有品牌为tencent品牌的移动设备,所以可确定第i个候选设备属于明显的模拟器。
B:若第i个候选设备的设备码标识不符合设备码标识编码标准,确定第i个候选设备的设备码标识符合模拟器设备的设备属性特征;
前已述及,设备码可为IMEI或MAC地址等。若IMEI不符合国际IMEI编码规范或MAC地址错误,则可确定第i个候选设备的设备码标识符合模拟器设备的设备属性特征。
C:若第i个候选设备的电池运行信息不符合预设运行规律,确定第i个候选设备的电池运行信息符合模拟器设备的设备属性特征。
前已述及,电池运行信息可包括电压和电量。
若将电压表示为y,电量表示为x,则上述预设运行规律可表示为:y=f(x)。也即,x和y之间的函数关系表征了预设运行规律。
在一个示例中,x和y之间的函数关系可表征电池运行物理学规律(或者说上述预设运行规律可为电池运行物理学规律):真实设备的电池在运行时,其电量值与电压值正相关——电量值越高,越接近100%,其电压值相应也越高,反之,电量值越低,越接近0,其电压值相应也越低。
而若在某一时间段内,电量值减少但电压值几乎不变或者升高,或者,电量值增加但电压值不变或降低,则不符合电池运行物理学规律。
当预设运行规律为电池运行物理学规律时,x和y之间的函数关系可为简单的线性关系、指数关系等,当然,也可用其他的函数关系来表征电池运行物理学规律。本领域技术人员可灵活设计表征电池运行物理学规律的函数关系。
在另一个示例中,x和y之间的函数关系(预设运行规律)可满足隐马尔可夫链模型,滑动平均等。
本领域技术人员可灵活设计x和y之间的函数关系,在此不作赘述。
可将符合模拟器设备的设备属性特征的设备属性称为目标设备属性,将不符合模拟器设备的设备属性特征的设备属性称为正常设备属性。
在505部分:更新目标设备属性的权重值。
可由前述的处理单元202执行505部分。
可为第i个候选设备的各设备属性分配初始的权重值,例如,可令各设备属性初始的权重值为0、1、2等。
对于在504部分确定出的目标设备属性,可在其初始的权重值的基础上,提升(增加)权重值,提升的步长可为Δa。Δa可根据实际情况进行灵活设置,例如,可设置Δa为0.5、1、2等等。
此外,对于正常设备属性,可保持其初始的权重值不变,或在初始的权重值的基础上,降低(减少)权重值。降低的步长可为Δb。Δb可根据实际情况进行灵活设置,例如,可设置Δb为0.5、1、2等等。
以第i个候选设备的设备品牌标识、设备码标识和电池运行信息三个维度为例,假定设备品牌标识初始的权重值为a0,设备码标识初始的权重值为b0,电池运行信息初始的权重值为c0
经分析,第i个候选设备的设备品牌标识和电池运行信息均符合模拟器设备的设备属性特征,设备码标识为正常设备属性。则可将第i个候选设备各设备属性的权重值更新为a,b和c。其中,a=a0+Δa,b=b0-Δb。
此外,前述提及了,可获取预设时长内的电池运行信息,例如,获取一个月内的电量值和电压值。此时,可将预设时长划分为多个时间窗,每一时间窗长度为N天或M小时。
在一个示例中,可分析各时间窗内的电池运行信息是否符合电池运行物理学规律,统计电池运行信息不符合电池运行物理学规律的时间窗个数(以m表示)。若m大于时间窗个数阈值,则令c=c0+Δa,否则令c=c0或令c=c0-Δb。
在另一个示例中,还可统计电池运行信息符合电池运行物理学规律的时间窗个数(以n表示),若m≥n(或m/n≥预设阈值,或m/(m+n)m/n),令c=c0+Δa,否则令c=c0或令c=c0-Δb。
在又一个示例中,可逐个确定时间窗内的电池运行信息是否符合预设运行规律,若不符合,令权重值增长Δa,若符合令权重值减少Δb。
当然,也可分别统计电池运行信息符合预设运行规律的时间窗个数(以n表示)和不符合预设运行规律的时间窗个数(以m表示)后,令c=c0+mΔa-nΔb。
本领域技术人员可以理解的是,可以根据实际需要灵活设计权重的更新方式。
在506部分:根据上述第i个候选设备各设备属性的权重值,计算上述第i个候选设备的模拟器评分。
以第i个候选设备各设备属性的权重值更新为a,b和c为例,以rank表示模拟器评分,则rank可用公式表示为:rank=f(a,b,c)。其中,f(a,b,c)表示自变量为a、b、c的函数。当然,如果不止三个权重值的话,假定共n个权重值,则rank可表示为rank=f(w0,w1,……,wn-1)。其中,w0,w1,……,wn-1表示n个权重值。
以a、b、c三个权重值为例,在一个示例中,f(a,b,c)可表示为:f(a,b,c)=a+b+c;在另一个示例中,f(a,b,c)可表示为:
本领域技术人员可灵活设计权重值与rank之间的函数关系,在此不作赘述。
可由前述的处理单元202执行506部分。
在507部分:若上述模拟器评分高于阈值,确定上述第i个候选设备为模拟器设备。
上述阈值可根据覆盖率与误杀率综合确定,并可以根据实际需要灵活更改。
假定阈值为100,若第i个候选设备的rank大于100,则确定该候选设备为模拟器设备。
可由前述的处理单元202执行507部分。
在本申请其他实施例,请参见图5b,在507部分之后,还可包括:
508部分:将确定出的模拟器设备的设备属性组作为模拟器数据样本,放入第一训练集;
上述第一训练集还包括非模拟器数据样本,第一训练集中的数据样本用于进行训练学习,得到模拟器分类器。
举例来讲,假定确定了10个设备为模拟器设备,则可从设备库中抽取10组或更多组参考属性组作为非模拟器数据样本。
在509部分:使用第一训练集进行训练学习,得到模拟器分类器。
可由前述的处理单元202执行509部分。
模拟器分类器可用于在下一次提取出各关联设备的设备属性组(图5b所示的510-511)后,根据下一次提取出的各关联设备的设备属性组筛选出模拟器设备(图5b所示的512)。510-512部分可由前述的处理单元202。
在一个示例中,在得到模拟器分类器后,后续可使用提取的各关联设备的设备属性训练模拟器分类器,来实现模拟器分类器的动态更新。
因此,在得到模拟分类器后,后续可不再执行503-509部分或504-509部分,而是在从业务数据中提取出关联设备的设备属性后,将提取出关联设备的设备属性输入模拟分类器中,得到模拟器设备。
并且,使用提取的各关联设备的设备属性训练模拟器分类器,来实现模拟器分类器的动态更新。
在另一个示例中,可每隔预设时间或预设次数,或在模拟器分类器性能变坏时,执行503-509部分或504-509部分,以重新生成模拟器分类器。
下面将介绍如何进行训练学习,得到模拟器分类器。
在一个示例中,可对第一训练集中的数据样本进行聚类分析(例如使用k-means聚类算法进行聚类),聚类分析后,第一训练集中的数据样本被划归为两类:模拟器设备类和非模拟器设备类。为与后续描述相区分,将对第一训练集进行聚类分析得到的模拟器设备类和非模拟器设备类,分别称为第一模拟器设备类和第一非模拟器类。
第一模拟器设备类中的设备属性组即可作为模拟器分类器,在下一轮新数据样本到来后(也即下一次提取出的各关联设备的设备属性组后),可将作为模拟器分类器的设备属性组与新数据样本进行聚类,重新得到模拟器设备类和非模拟器设备类。为与前述描述相区分,可将重新得到的模拟器设备类和非模拟器设备类,分别称为第二模拟器设备类和第二非模拟器类。
第二模拟器设备类中的各设备属性组所对应的设备会被确定为模拟器设备。而第二模拟器设备类中的设备属性组会取代第一模拟器设备类中的设备属性组,作为模拟器分类器。
之后,当再有新数据样本到来后,可将作为模拟器分类器的设备属性组与新数据样本进行聚类,重新得到第二模拟器设备类和第二非模拟器设备类。
而重新得到的第二模拟器设备类中的设备属性组将作为新的模拟器分类器。
这样,就实现了对模拟器分类器持续的训练学习,动态更新模拟器分类器。
模拟器分类器的训练流程可参见图6。
当然,在其他实施例中,也可将第一模拟器设备类中的设备属性特征作为模拟器分类器,在下一轮新数据样本到来后(也即下一次提取出的各关联设备的设备属性组后),可使用模拟器分类器筛选出模拟器设备。
之后,提取筛选出的模拟器设备的设备属性特征作为新的模拟器分类器。
之后,当再有新数据样本到来后,可使用新的模拟器分类器筛选出模拟器设备。再提取筛选出的模拟器设备的设备属性特征作为新的模拟器分类器。以此类推,也同样可实现对模拟器分类器持续的训练学习,动态更新模拟器分类器。
在本申请其他实施例,请参见图5c,在确定出模拟器设备(507或512)之后,还可包括:
513部分:通知各业务模拟器设备相关信息。
可由前述的共享单元203执行513部分。
模拟器设备相关信息可包括指示业务的关联设备为模拟器设备的信息。
当然,在其他示例中,也可由各业务来主动查询某设备是否为模拟器设备。
需要说明的是,本申请所提供的模拟器识别方法或模拟器识别集群,可独立于各业务,为各业务提供模拟器识别服务;当然,也可作为某一业务的内嵌服务。
前已述及,第二业务不具有能够获取全面的设备属性的业务权限,在通过第一业务提供的业务数据筛选出的模拟器设备后,还可向第二业务提供模拟器设备相关信息,与第二业务进行模拟器设备相关信息的数据共享。这样,即使第二业务无法获取全面的设备属性,但也可获知其关联设备是否为模拟器设备。
举例来讲,假定某第一业务和某第二业务均运行在设备A上,当设备A被确定为模拟器设备,那么就会通知第一业务和第二业务设备A是模拟器设备。第一业务和第二业务可根据自身的处理策略进行相应处理,例如,对设备A上的业务账号执行非正常用户访问策略。而若设备A为正常设备,则可对设备A上的业务账号执行正常用户访问策略。
在本申请其他实施例,仍请参见图5c,在确定出模拟器设备(507或512)之后,还可包括:
514部分:进行数据累积(更新设备信息库)。
更具体的,可将正常设备的设备属性组存储至上述设备信息库,以完善设备信息库。
需要说明的是,现有的模拟器识别技术,是基于业务帐号行为判断模拟器设备,或是根据业务账户的等级来予以限制(例如:电商举办促销活动,要求金牌会员以上才可以参与)。其缺点包括:
容易过滤掉一部分真实用户,在将模拟器设备阻挡在外的同时将部分真实用户也阻挡在外;无法精准的实施模拟器设备判定。
而本申请实施例将设备信息层面与业务相结合,利用了具有设备属性信息的业务数据进行模拟器设备识别。设备属性信息是客观的数据信息,通过业务侧使用可以准确识别出模拟器设备。此外,本申请实施例还可将不同业务间的模拟器设备相关信息分享给信息不互通的其他业务,打通信息壁垒。
图7示出了模拟器识别方法的另一种示例性流程。图7所示的方法应用于上述提及的领域或应用场景(例如图1)中。
上述示例性流程包括:
701-706部分与前述的501-506部分相同,在此不作赘述。
在707部分:若模拟器评分高于阈值,将第i个候选设备的设备属性组作为模拟器数据样本放入第二训练集。
除模拟器数据样本,第二训练集还包括非模拟器数据样本。在一个示例中,可从设备库中获取部分或全部参考属性组,作为非模拟器数据样本(也可称为正常设备的数据样本)。
需要说明的是,第一训练集和第二训练集中的第一、第二用于区分两训练集,不作为时间先后的标识。
在708部分:对第二训练集中的数据样本进行聚类分析,得到模拟器设备类和非模拟器设备类,并确定模拟器设备类中的设备为模拟器设备。
本实施例与前一实施例不同的是,在模拟器评分高于阈值时,并没有直接将模拟器评分高于阈值的设备确定为模拟器设备,而是又进行了聚类分析。
而在其他实施例中,可在提取出各关联设备的设备属性组后,直接将其与设备信息库中的参考设备属性组进行聚类分析,得到模拟器设备类和非模拟器设备类,并确定模拟器设备类中的设备为模拟器设备。
专业人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、WD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种模拟器识别方法,其特征在于,包括:
获取第一业务的业务数据;所述业务数据至少包括关联设备的设备属性组,所述设备属性组包括所述关联设备多维度的设备属性;所述第一业务具有的业务权限能够获取多维度的设备属性;
提取各业务数据的关联设备的设备属性组,得到各关联设备的设备属性组;
根据提取出的各关联设备的设备属性组,从所述各关联设备中筛选出模拟器设备。
2.如权利要求1所述的方法,其特征在于,所述根据提取出的各关联设备的设备属性组,从所述各关联设备中筛选出模拟器设备具体包括:
从提取出的各设备属性组中,确定出设备属性不匹配的设备属性组;所述设备属性不匹配的设备属性组为候选设备属性组;所述候选设备属性组对应的关联设备为候选设备;
综合分析各候选设备的多维度的设备属性,从中确定出模拟器设备。
3.如权利要求2所述的方法,其特征在于,对于提取出的任一设备属性组,所述确定出设备属性不匹配的设备属性组具体包括:
将所述任一设备属性组与设备信息库中的参考设备属性组进行匹配;所述设备信息库存储有至少一个参考设备属性组,每一参考设备属性组包含相匹配的多维度的设备属性;
若所述任一设备属性组与所述设备信息库中的全部参考设备属性组均不匹配,判定所述任一设备属性组中的设备属性不匹配。
4.如权利要求2或3所述的方法,其特征在于,
所述综合分析各候选设备的多维度的设备属性,从中确定出模拟器设备包括:
分析第i个候选设备的各设备属性是否符合模拟器设备的设备属性特征;所述第i个候选设备为任一候选设备;所述第i个候选设备的设备属性具有初始的权重值;
更新所述第i个候选设备的目标设备属性的权重值;所述目标设备属性包括符合模拟器设备的设备属性特征的设备属性;
根据所述第i个候选设备的各设备属性的权重值,计算所述第i个候选设备的模拟器评分。
5.如权利要求4所述的方法,其特征在于,所述第i个候选设备的多维度的设备属性至少包括:设备品牌标识、设备码标识和电池运行信息。
6.如权利要求5所述的方法,其特征在于,所述分析第i个候选设备的各设备属性是否符合模拟器设备的设备属性特征具体包括:
若所述第i个候选设备的设备品牌标识与模拟器品牌标识相符,确定所述第i个候选设备的设备品牌标识符合模拟器设备的设备属性特征;
若所述第i个候选设备的设备码标识不符合设备码标识编码标准,确定所述第i个候选设备的设备码标识符合模拟器设备的设备属性特征;
若所述第i个候选设备的电池运行信息不符合预设运行规律,确定所述第i个候选设备的电池运行信息符合模拟器设备的设备属性特征。
7.如权利要求4所述的方法,其特征在于,所述综合分析各候选设备的多维度的设备属性,从中确定出模拟器设备还包括:
若所述模拟器评分高于阈值,确定所述第i个候选设备为模拟器设备。
8.如权利要求7所述的方法,其特征在于,所述综合分析各候选设备的多维度的设备属性,从中确定出模拟器设备还包括:
将确定出的模拟器设备的设备属性组作为模拟器数据样本,放入训练集;所述训练集还包括非模拟器数据样本;
使用所述训练集进行训练学习,得到模拟器分类器;其中,所述模拟器分类器用于在下一次提取出各关联设备的设备属性组后,根据下一次提取出的各关联设备的设备属性组筛选出模拟器设备。
9.如权利要求8所述的方法,其特征在于,所述使用所述训练集进行训练学习具体包括:
对所述第一训练集中的数据样本进行聚类分析,得到第一模拟器设备类和第一非模拟器设备类;
所述模拟器分类器包括所述第一模拟器设备类的设备属性特征,或者,所述模拟器分类器包括所述第一模拟器设备类中各设备的设备属性组。
10.如权利要求9所述的方法,其特征在于,在所述模拟器分类器包括所述第一模拟器设备类中各设备的设备属性组的情况下,所述根据下一次提取出的各关联设备的设备属性组筛选出模拟器设备包括:
将所述下一次提取出的各关联设备的设备属性组与所述第一模拟器设备类中各设备的设备属性组进行聚类分析,得到第二模拟器设备类和第二非模拟器设备类;
确定所述第二模拟器设备类中的设备为模拟器设备。
11.如权利要求4所述的方法,其特征在于,所述综合分析各候选设备的多维度的设备属性,从中确定出模拟器设备还包括:
若所述模拟器评分高于阈值,将所述第i个候选设备的设备属性组作为模拟器数据样本放入第二训练集;所述第二训练集还包括非模拟器数据样本;
对所述第二训练集中的数据样本进行聚类分析,得到模拟器设备类和非模拟器设备类;
确定所述模拟器设备类中的设备为模拟器设备。
12.如权利要求1所述的方法,其特征在于,还包括:
与第二业务进行模拟器设备相关信息的数据共享;所述第二业务不具有能够获取多维度的设备属性的业务权限。
13.一种模拟器识别装置,其特征在于,包括:
获取单元,用于获取第一业务的业务数据;所述业务数据至少包括关联设备的设备属性组,所述设备属性组包括所述关联设备多维度的设备属性;所述第一业务具有的业务权限能够获取多维度的设备属性;
处理单元,用于:
提取各业务数据的关联设备的设备属性组,得到各关联设备的设备属性组;
根据提取出的各关联设备的设备属性组,从所述各关联设备中筛选出模拟器设备。
14.如权利要求13所述的查询装置,其特征在于,还包括:
共享单元,用于与第二业务进行模拟器设备相关信息的数据共享;所述第二业务不具有能够获取多维度的设备属性的业务权限。
15.一种模拟器识别服务器,其特征在于,至少包括处理器和存储器;所述处理器通过执行所述存储器中存放的程序以及调用其他设备,执行如权利要求1-12所述的模拟器识别方法。
CN201710398631.7A 2017-05-31 2017-05-31 模拟器识别方法及相关装置 Active CN108985048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710398631.7A CN108985048B (zh) 2017-05-31 2017-05-31 模拟器识别方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710398631.7A CN108985048B (zh) 2017-05-31 2017-05-31 模拟器识别方法及相关装置

Publications (2)

Publication Number Publication Date
CN108985048A true CN108985048A (zh) 2018-12-11
CN108985048B CN108985048B (zh) 2022-11-18

Family

ID=64502019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710398631.7A Active CN108985048B (zh) 2017-05-31 2017-05-31 模拟器识别方法及相关装置

Country Status (1)

Country Link
CN (1) CN108985048B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110673901A (zh) * 2019-09-23 2020-01-10 郑州阿帕斯科技有限公司 一种虚拟设备的识别方法、装置及其设备
CN112150261A (zh) * 2020-09-23 2020-12-29 上海维信荟智金融科技有限公司 基于用户通信行为的金融反欺诈方法及系统
WO2020258673A1 (zh) * 2019-06-28 2020-12-30 平安科技(深圳)有限公司 网络访问的异常判定方法、装置、服务器及其存储介质
CN113722197A (zh) * 2021-08-31 2021-11-30 上海观安信息技术股份有限公司 移动终端异常识别方法、系统
CN116777473A (zh) * 2023-05-04 2023-09-19 北京数美时代科技有限公司 一种黑灰产设备识别方法、系统、存储介质和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140167953A1 (en) * 2012-12-17 2014-06-19 Lawrence Livermore National Security, Llc Emergency response scenario simulators and simulation techniques
CN104134041A (zh) * 2014-07-31 2014-11-05 北京奇虎科技有限公司 终端模拟器系统的反检测方法和反检测装置
US20150148966A1 (en) * 2012-03-30 2015-05-28 Mitsubishi Electric Corporation Air conditioner testing system, air-conditioning system simulator, and program
CN106709318A (zh) * 2017-01-24 2017-05-24 腾云天宇科技(北京)有限公司 一种用户设备唯一性的识别方法、装置和计算设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150148966A1 (en) * 2012-03-30 2015-05-28 Mitsubishi Electric Corporation Air conditioner testing system, air-conditioning system simulator, and program
US20140167953A1 (en) * 2012-12-17 2014-06-19 Lawrence Livermore National Security, Llc Emergency response scenario simulators and simulation techniques
CN104134041A (zh) * 2014-07-31 2014-11-05 北京奇虎科技有限公司 终端模拟器系统的反检测方法和反检测装置
CN106709318A (zh) * 2017-01-24 2017-05-24 腾云天宇科技(北京)有限公司 一种用户设备唯一性的识别方法、装置和计算设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020258673A1 (zh) * 2019-06-28 2020-12-30 平安科技(深圳)有限公司 网络访问的异常判定方法、装置、服务器及其存储介质
CN110673901A (zh) * 2019-09-23 2020-01-10 郑州阿帕斯科技有限公司 一种虚拟设备的识别方法、装置及其设备
CN110673901B (zh) * 2019-09-23 2022-11-04 郑州阿帕斯科技有限公司 一种虚拟设备的识别方法、装置及其设备
CN112150261A (zh) * 2020-09-23 2020-12-29 上海维信荟智金融科技有限公司 基于用户通信行为的金融反欺诈方法及系统
CN113722197A (zh) * 2021-08-31 2021-11-30 上海观安信息技术股份有限公司 移动终端异常识别方法、系统
CN113722197B (zh) * 2021-08-31 2023-10-17 上海观安信息技术股份有限公司 移动终端异常识别方法、系统
CN116777473A (zh) * 2023-05-04 2023-09-19 北京数美时代科技有限公司 一种黑灰产设备识别方法、系统、存储介质和电子设备

Also Published As

Publication number Publication date
CN108985048B (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
CN108985048A (zh) 模拟器识别方法及相关装置
CN109450771B (zh) 添加好友的方法、装置、计算机设备及存储介质
CN109598509A (zh) 风险团伙的识别方法和装置
CN107404481B (zh) 用户信息识别方法及装置
CN106530015A (zh) 信息投放控制方法及装置
CN107947951A (zh) 用户群组推荐方法、装置及存储介质和服务器
CN109509021A (zh) 基于行为轨迹的异常识别方法、装置、服务器及存储介质
CN105491444B (zh) 一种数据识别处理方法以及装置
CN108280104A (zh) 目标对象的特征信息提取方法及装置
CN111339436A (zh) 一种数据识别方法、装置、设备以及可读存储介质
CN109194689A (zh) 异常行为识别方法、装置、服务器及存储介质
CN108804908A (zh) 一种设备指纹生成方法、装置及计算设备
CN110732139A (zh) 检测模型的训练方法和用户数据的检测方法、装置
CN106790727A (zh) 消息推送方法及装置
CN108304853A (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN109600344A (zh) 识别风险群体的方法、装置及电子设备
CN109688183A (zh) 群控设备识别方法、装置、设备及计算机可读存储介质
CN106910135A (zh) 用户推荐方法及装置
CN108053247A (zh) 一种假量识别模型生成方法、假量识别方法及计算设备
CN109191167A (zh) 一种目标用户的挖掘方法和装置
CN106998336B (zh) 渠道中的用户检测方法和装置
CN106390451B (zh) 对游戏服务器的容量进行测试的方法及装置
CN110196805B (zh) 数据处理方法、装置、存储介质和电子装置
CN107728772B (zh) 应用程序的处理方法、装置、存储介质及电子设备
CN110210884B (zh) 确定用户特征数据的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant