CN112118551B - 设备风险识别方法及相关设备 - Google Patents
设备风险识别方法及相关设备 Download PDFInfo
- Publication number
- CN112118551B CN112118551B CN202011111069.3A CN202011111069A CN112118551B CN 112118551 B CN112118551 B CN 112118551B CN 202011111069 A CN202011111069 A CN 202011111069A CN 112118551 B CN112118551 B CN 112118551B
- Authority
- CN
- China
- Prior art keywords
- data
- risk
- equipment
- risk identification
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/38—Services specially adapted for particular environments, situations or purposes for collecting sensor information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
Abstract
本公开实施例提供了一种设备风险识别方法及相关设备;涉及大数据处理技术领域。该设备风险识别方法包括:生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据;计算所述设备使用数据的维度特征,从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据,确定所述标记数据的标签;结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果;将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
Description
技术领域
本公开涉及大数据处理技术领域,具体而言,涉及一种设备风险识别方法、风险决策引擎、设备风险识别装置、电子设备和计算机可读介质。
背景技术
随着互联网技术的发展,网络欺诈行为也日益猖獗,对于移动设备风险的识别已经是对抗网络欺诈现象必不可少风控环节。
目前对于移动设备的风险的识别主要通过采集设备数据,然后由业务专家配置规则,从而通过配置的规则识别出具有欺诈风险的设备。但该方法主要依赖专家经验,主观性较强,对于设备的欺诈风险无法进行量化;而且人为配置的规则也有限,在规则或设备数据发生变化时维护成本较高。在实际应用中,也有通过模型对设备数据进行识别,从而识别出设备的风险,但训练模型时需要人工检验大量的设备数据做出标注,仍然需要耗费较高的人力和时间成本;并且设备数据仅包含设备的基本信息,例如设备的网络信息、设备上安装的应用的信息等,信息的维度较少,导致模型的识别准确性也不高。由于模型所占用的资源空间较大,应用模型对服务配置要求较高,因此复用性较差。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
基于上述一个或多个问题,本公开实施例的目的在于提供一种设备风险识别方法、风险决策引擎、设备风险识别装置、电子设备和计算机可读介质,能够根据计算得到的设备使用数据的维度特征来确定标记数据的标签,从而避免人工对数据进行标注而耗费的成本,能够降低设备风险识别的成本,提高效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供了一种设备风险识别方法,包括:生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据;计算所述设备使用数据的维度特征,从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据,确定所述标记数据的标签;结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果;将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
在本公开的示例性实施方式中,所述设备使用数据的维度特征至少包括:登录特征、违规识别特征、网络特征以及传感器特征。
在本公开的示例性实施方式中,从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据包括:通过所述设备使用数据构建设备网络图,所述设备网络图中各节点对应各终端设备,所述设备网络图中的边表征所述设备使用数据的相似度;通过全局模块度对所述设备网络图进行划分,以获得划分后的多个区块;将包含目标终端设备的区块作为所述符合预设条件的标记数据。
在本公开的示例性实施方式中,所述从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据,确定所述标记数据的标签包括:获取多个维度特征分别对应的欺诈特征值;从所述设备使用数据中提取出所有的维度特征均超过对应的欺诈特征值的标记数据,并将所述标记数据标记为有风险。
在本公开的示例性实施方式中,所述结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果包括:基于所述包含标签的标记数据对半监督分类模型进行训练,以获得所述风险识别模型;将提取出所述标记数据之后的设备使用数据作为样本数据,利用所述风险识别模型对所述样本数据进行识别,得到风险识别结果。
在本公开的示例性实施方式中,所述利用所述风险识别模型对所述样本数据进行识别,得到风险识别结果包括:利用所述风险识别模型得到所述样本数据的第一识别结果;将大于预设阈值的第一识别结果作为对应的样本数据的标签,以利用包含标签的样本数据对所述风险识别模型进行更新;通过更新后的风险识别模型,获取不包含标签的样本数据的第二识别结果;将大于所述预设阈值的第二识别结果作为对应的样本数据的标签,对所述风险识别模型进行迭代更新,直到所述样本数据全部具有标签。
在本公开的示例性实施方式中,所述计算所述设备使用数据的维度特征包括:获取在预设时间周期内所述唯一标识对应的多条设备使用数据;提取所述多条设备使用数据中的位移传感器数据以及屏幕亮度传感器数据;利用所述位移传感器数据以及所述屏幕亮度传感器数据,计算所述终端设备的位移变化特征以及屏幕亮度变化特征,以得到所述传感器特征。
在本公开的示例性实施方式中,所述计算所述设备使用数据的维度特征包括:基于所述唯一标识确定所述设备使用数据的数据采集频率、数据采集时间以及关联用户账户;通过所述数据采集频率、数据采集时间以及关联用户账户计算所述终端设备的登录特征。
在本公开的示例性实施方式中,所述计算所述设备使用数据的维度特征包括:利用所述设备使用数据确定所述终端设备上安装的风险应用,以获得所述违规识别特征。
在本公开的示例性实施方式中,所述计算所述设备使用数据的维度特征包括:利用所述设备使用数据获取所述终端设备的基站信息,以获得所述网络特征。
根据本公开实施例的第二方面,提供了一种风险决策引擎,可以包括:识别结果更新模块,用于按照目标时间周期更新终端设备的风险识别结果;数据请求模块,用于接收待识别设备的数据请求时,确定所述待识别设备的唯一标识;风险识别模块,用于根据所述唯一标识从所述风险识别结果中获取所述待识别设备的欺诈风险;数据发送模块,用于在所述欺诈风险符合预设条件时,将所述待识别设备的数据请求转发至第三方应用;以及在所述欺诈风险不符合预设条件时,向所述第三方应用发送风险预警。
根据本公开实施例的第三方面,提供了一种设备风险识别装置,可以包括:设备标识模块、特征计算模块、特征识别模块以及数据更新模块。
其中,设备标识模块,用于生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据。
特征计算模块,用于计算所述设备使用数据的维度特征,从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据,确定所述标记数据的风险标签。
特征识别模块,用于结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果。
数据更新模块,用于将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
在本公开的示例性实施方式中,所述设备使用数据的维度特征至少包括:登录特征、违规识别特征、网络特征以及传感器特征。
在本公开的示例性实施方式中,特征计算模块可以包括网络图构建单元、区块划分单元、数据获取单元。
其中,网络图构建单元,用于通过所述设备使用数据构建设备网络图,所述设备网络图中各节点对应各终端设备,所述设备网络图中的边表征所述设备使用数据的相似度。区块划分单元,用于通过全局模块度对所述设备网络图进行划分,以获得划分后的多个区块。数据获取单元,用于将包含目标终端设备的区块作为所述符合预设条件的标记数据。
在本公开的示例性实施方式中,特征计算模块可以包括特征值获取单元、数据提取单元。其中,特征值获取单元,应用于获取多个维度特征分别对应的欺诈特征值;数据提取单元,用于从所述设备使用数据中提取出所有的维度特征均超过对应的欺诈特征值的标记数据,并将所述标记数据标记为有风险。
在本公开的示例性实施方式中,特征识别模块可以包括模型训练单元以及模型应用单元。其中:模型训练单元,用于基于所述包含标签的标记数据对半监督分类模型进行训练,以获得所述风险识别模型;模型应用单元,用于将提取出所述标记数据之后的设备使用数据作为样本数据,利用所述风险识别模型对所述样本数据进行识别,得到风险识别结果。
在本公开的示例性实施方式中,模型应用单元可以包括第一识别单元、模型更新单元、第二识别单元、识别结果确定单元。其中:第一识别单元,用于利用所述风险识别模型得到所述样本数据的第一识别结果;模型更新单元,用于将大于预设阈值的第一识别结果作为对应的样本数据的标签,以利用包含标签的样本数据对所述风险识别模型进行更新;第二识别单元,用于通过更新后的风险识别模型,获取不包含标签的样本数据的第二识别结果;识别结果确定单元,用于将大于所述预设阈值的第二识别结果作为对应的样本数据的标签,对所述风险识别模型进行迭代更新,直到所述样本数据全部具有标签。
在本公开的示例性实施方式中,特征计算模块可以包括数据筛选单元、传感器数据获取单元、传感器特征确定单元。其中:数据筛选单元,用于获取在预设时间周期内所述唯一标识对应的多条设备使用数据;传感器数据获取单元,用于提取所述多条设备使用数据中的位移传感器数据以及屏幕亮度传感器数据;传感器特征确定单元,用于利用所述位移传感器数据以及所述屏幕亮度传感器数据,计算所述终端设备的位移变化特征以及屏幕亮度变化特征,以得到所述传感器特征。
在本公开的示例性实施方式中,特征计算模块可以包括账户获取单元以及登录特征确定单元。其中:账户获取单元,用于基于所述唯一标识确定所述设备使用数据的数据采集频率、数据采集时间以及关联用户账户;登录特征确定单元,用于通过所述数据采集频率、数据采集时间以及关联用户账户计算所述终端设备的登录特征。
在本公开的示例性实施方式中,特征计算模块可被配置为:利用所述设备使用数据确定所述终端设备上安装的风险应用,以获得所述违规识别特征。
在本公开的示例性实施方式中,特征计算模块可被配置为:利用所述设备使用数据获取所述终端设备的基站信息,以获得所述网络特征。
根据本公开实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的设备风险识别方法。
根据本公开实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的设备风险识别方法。
在本公开实施例所提供的设备风险识别方法、设备风险识别装置、电子设备和计算机可读介质,通过对各个终端设备进行唯一标识,利用该唯一标识计算终端设备的设备使用数据的维度特征,从而提取出维度特征符合预设条件的标记数据,得到标记数据的标签,无需人工对所有的设备使用数据进行标注,能够降低人工标注所耗费的人力时间成本,还能够减少由于人工主观性造成的标记错误,提高风险识别的效率;并且直接将风险识别结果更新至风险决策引擎中,通过该风险决策引擎获取设备的欺诈风险,可以避免在线运行模型,进而减少资源占用;同时,该风险决策引擎自身所需的空间较小,易于部署和迁移,可以提高复用性;与在线运行模型相比也可以快速输出设备的欺诈风险,提高识别的速率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了应用于本公开实施例的设备风险识别方法或设备风险识别装置的示例性系统架构示意图;
图2示意性示出了根据本公开的一实施例的设备风险识别方法的流程图;
图3示意性示出了根据本公开的另一实施例的设备风险识别方法的流程图;
图4示意性示出了根据本公开的一实施例中设备网络图的示意结构图;
图5示意性示出了根据本公开的一实施例中设备风险识别方法的流程图;
图6示意性示出了根据本公开的一实施例的风险决策引擎的结构示意图;
图7示意性示出了根据本公开的一实施例的设备风险识别装置的框图;
图8示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本说明书中,用语“一个”、“一”、“该”、“所述”和“至少一个”用以表示存在一个或多个要素/组成部分/等;用语“包含”、“包括”和“具有”用以表示开放式的包括在内的意思,并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”、“第二”、“第三”等仅作为标记使用,不是对其对象的数量限制。
下面结合附图对本公开示例实施方式进行详细说明。
图1示出了可以应用于本公开实施例的设备风险识别方法或设备风险识别装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。其中,终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑、可穿戴设备、虚拟现实设备、智能家居等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
举例而言,服务器105可例如生成各个终端设备的唯一标识,通过唯一标识采集终端设备的设备使用数据;计算设备使用数据的维度特征,从设备使用数据中提取出维度特征符合预设条件的标记数据,确定标记数据的标签;结合包含标签的标记数据以及风险识别模型对设备使用数据进行风险识别,得到设备使用数据的风险识别结果;将风险识别结果更新至风险决策引擎中,以使风险决策引擎在接收到待识别设备的数据请求时,利用该风险识别结果输出待识别设备的欺诈风险。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的设备风险识别方法一般由服务器105执行,相应地,设备风险识别装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的设备风险识别方法也可以由终端设备101、102、103执行,相应的,设备风险识别装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。
基于此,本公开实施例提供一种设备风险识别方法,可以通过计算设备使用数据的维度特征,从而提取出维度特征符合预设条件的标记数据,得到标记数据的标签,可以避免人工对所有的设备使用数据进行标注所耗费的时间成本,能够降低成本,提高风险识别的效率;并且通过直接将风险识别结果更新至风险决策引擎中,输出设备的欺诈风险,可以避免在线运行模型,进而能够减少资源占用,提高识别的速率。
如图2所示,本公开实施例提供的设备风险识别方法可以包括步骤S21、步骤S22、步骤S23以及步骤S24。
在步骤S21中,生成各个终端设备的唯一标识,通过该唯一标识采集终端设备的设备使用数据。
终端设备上通常安装了各种各样的应用程序,通过调用应用程序提供的SDK(Software Development Kit,软件开发工具包)为用户提供各种服务。预先可以将采集设备使用数据的代码编写在对应的SDK中,在服务端响应终端设备对SDK的调用时,能够在终端设备上运行该SDK中的应用程序,从而可以触发终端设备上传设备使用数据。设备使用数据可以包括终端设备上用户操作的记录,例如用户每进行一次操作采集一条设备使用数据;还可以包括终端设备本地保存的信息,例如设备的日志、历史数据等。本实施方式中,通过多个预先设定的维度可以采集多个维度的设备使用数据,具体来说,当终端设备上产生特定的用户操作时,数据采集可以由该用户操作触发,从而采集到与该用户操作相关的数据,作为设备使用数据。示例性的,设备使用数据具体可以包括终端设备上传感器的数据,例如屏幕亮度传感器的数据、温度传感器数据、位移传感器数据等、终端设备的网络连接数据,例如网络类型、IP地址等、终端设备上安装的应用程序的信息等。在其他实施方式中,利用数据采集组件可以对终端设备上的设备使用数据进行采集,例如agent组件等。采集到的数据可以存储在数据库中,例如分布式数据库等。
该唯一标识可以作为终端设备的设备指纹,与人的指纹类似,设备指纹可以用于唯一标识出该终端设备的其他相关数据,即终端设备的设备使用数据。在采集到终端设备的设备使用数据后可以通过该唯一标识将数据进行保存,以便于通过唯一标识对保存的设备使用数据进行读取。在服务端接收到终端设备对SDK的调用时,可以根据终端设备的调用请求生成终端设备的唯一标识。终端设备的调用请求中可以包括设备的名称、设备型号等基础信息,将得到的多个基础信息结合起来可以生成一个唯一编号,作为该终端设备的唯一标识。示例性的,通过终端设备的基础信息进行哈希运算,可以为该终端设备生成一个具有唯一性的唯一标识。或者,通过随机数算法为每个终端设备生成一个具有唯一性的随机数作为唯一标识,与对应的终端设备进行关联。此外,在其他实施方式中,生成唯一标识可以通过设备指纹技术,例如在终端设备调用SDK时获取终端设备的Mac地址,根据该Mac地址为终端设备分配唯一标识。
需要理解的是,采集终端设备的设备使用数据时可以按照特定的时间段进行采集,例如采集终端设备过去一个月的设备使用数据、一年的设备使用数据、一周的设备使用数据等等。与仅根据设备当前的数据来识别设备风险的方式相比,通过一定时间段内积累的设备使用数据可以更加充分地分析设备的变化情况,从而合理地识别设备的风险。设备使用数据的时间跨度越小,对于设备风险识别的时效性越高,因此在实际应用中可以根据实际需求来确定设备使用数据的采集时间,本实施方式对此不做特殊限定。
在步骤S22中,计算设备使用数据的维度特征,从设备使用数据中提取出维度特征符合预设条件的标记数据,确定该标记数据的标签。
在示例性实施方式中,设备使用数据的维度特征至少可以包括终端设备的登录特征、违规识别特征、网络特征以及传感器特征。相比于只获取设备的基本信息而言,本实施方式获取的设备特征更加多维全面,能够从多个角度对设备风险进行计算,有利于提高风险识别的准确性。
其中,登录特征可以指与终端设备上的用户登录操作相关的数据,例如终端设备的开机时间、登录软件平台的时间等,以及设备关联的用户账户标识,例如设备识别码、登录账户信息等;登录特征还可以包括终端设备登录时本身的基础属性数据,例如,设备的内存占用、可用内存占比、容量等。由于用户在终端设备上进行特定操作时会触发数据采集,因此数据采集的时间、采集的频次也可以表征登录特征。
计算设备使用数据的登录特征可以通过包括以下步骤:基于所述唯一标识确定所述设备使用数据的数据采集频率、数据采集时间以及关联用户账户;通过所述数据采集频率、数据采集时间以及关联用户账户计算所述终端设备的登录特征。
示例性实施方式中,可以先从设备使用数据中提取出与登录特征相关的数据,例如数据采集时间、关联用户账户、数据采集频率,然后确定在一定时间段内数据采集时间的时间变化率,数据采集频率的变化率、以及关联用户账户的数量,从而得到登录特征。例如,采集终端设备一个月的设备使用数据,以一周为固定时间段,计算每一周内的数据采集时间的时间变化率、数据采集评论的变化率、以及关联用户账户的数量,从而可以获得终端设备一个月内的登录特征。
违规识别特征可以指终端设备上的非法权限操作数据,例如设备越狱操作、root操作、系统参数篡改等,以及具有作弊高风险的应用软件信息,例如模拟器、改机工具等。
在示例性实施方式中,利用设备使用数据可以确定出终端设备上安装的风险应用,从而获得违规识别特征。具体的,从终端使用数据中提取出终端设备上安装的应用的信息,例如终端设备上安装包列表,将安装的所有应用与高风险应用进行对比,确定其中包含的高风险应用和高风险应用的总数量,作为违规识别特征。
网络特征包括但不限于终端设备的上网类型、网络运营商信息、基站信息、IP地址、网关信息等。
示例性的,利用唯一标识可以筛选出每一终端设备的设备使用数据,进而可以从该设备使用数据中提取出一定时间内终端设备的基站信息,利用基站信息确定出终端设备连接网络时所在的位置,从而可以得到一定时间段内的终端设备上网位置的变化,例如不同的城市的数量、不同省份的数量等,将变动的位置作为网络特征。在其他实施方式中,利用设备使用数据还可以确定例如是否使用代理IP、是否伪造基站信息等特征,作为网络特征。
使用数据的传感器特征可以包括终端设备上传感器上传的数据,例如温度传感器的数据、位移传感器的数据、屏幕亮度传感器的数据等。在其他实施方式中,传感器特征还可以包括其他传感器的数据,例如激光雷达数据、射频传感器数据等等。
示例性的,计算传感器特征可以包括:获取在预设时间周期内所述唯一标识对应的多条设备使用数据;提取所述多条设备使用数据中的位移传感器数据以及屏幕亮度传感器数据;利用所述位移传感器数据以及所述屏幕亮度传感器数据,计算所述终端设备的位移变化特征以及屏幕亮度变化特征,以得到所述传感器特征。具体的,对于一终端设备,可以利用该终端设备的唯一标识从存储区提取该终端设备的所有设备使用数据,并根据每一条数据的采集时间对数据进行筛选,筛选出在预设时间周期内的多条设备使用数据。设备使用数据中可以包括多种维度多种类型的数据,因而可以从设备使用数据中提取出位移传感器数据以及屏幕亮度传感器数据。然后根据该预设时间周期内的位移传感器数据计算位移变化特征,例如一天内位移变化量,一周内位移变化量等;根据屏幕亮度传感器数据可以计算屏幕亮度变化特征,例如24小时内屏幕亮度最大值、最小值、变化程度等。
在示例性实施方式中,为了衍生出更多维度的维度特征,可以通过特征工程以及数据增强技术来进行特征挖掘。例如,按照不同时间段对设备使用数据进行时域变换,从而得到不同时域的维度特征。再例如,按照时间将设备使用数据按周划分,得到采集周期内每周的维度特征,将设备使用数据按月划分,计算出每月的维度特征等。此外,对于设备使用数据还可以进行频域上的变换,从而得到不同频域的维度特征,例如计算每一维度特征的最大值、计算每一维度特征的最小值等等。通过特征工程以及数据增强技术可以对维度特征进行挖掘,而无需人工配置维度,效率更高。
计算出设备使用数据的维度特征之后,可以从中提取出符合预设条件的数据作为标记数据,确定标记数据的标签。例如,提取出登录特征超过预设值的设备使用数据、提取出违规识别特征超过阈值的设备使用数据等。由于终端设备的数量过多,无法对其一一进行标注,即使至标注其中一小部分,人工需要检验的数据量也是非常巨大的,因此在计算出每一个终端设备的维度特征之后,可以直接从中筛选出符合预设条件的标记数据,该标记数据可以指存在欺诈风险的终端设备对应的数据,因此,得到标记数据之后可以直接对其添加标签,该标签可以表征设备存在风险,例如该标签可以为“存在风险”、“有风险”、“高风险”等等。
在示例性实施方式中,得到设备使用数据对应的多个维度的维度特征之后,可以按照维度特征的大小对数据进行排序,进而只需要确定排在第一位或最后一位的数据的风险情况,例如通过专家对排在第一位的设备使用数据进行分析,确定其是否为欺诈设备等;或者获取出每一维度上维度特征最大或最小的设备使用数据,确定该最大或最小的设备使用数据是否具有风险等。可选的,根据实际积累的欺诈设备的数据可以预先定义各个维度特征对应的欺诈特征值,例如,对于10个维度上的维度特征,可以分别确定每一个维度上的欺诈特征值,该欺诈特征值可以作为阈值,从而将每个维度特征均超过阈值的设备使用数据提取出来作为标记数据,并将标记数据标记为有风险。在其他实施方式中,还可以通过分类算法对设备使用数据进行分类,从而确定标记数据对应的类型,例如利用无监督的聚类算法,通过聚类将设备使用数据划分为多个类,然后从划分后得到的多个类别中选取出目标类别作为标记数据。可以理解的是,该标记数据的标签可以为有风险,但根据维度特征的计算结果也可以确定出无风险的设备使用数据作为标记数据,从而确定标记数据的标签为无风险。因此,在确定有风险的数据满足的预设条件之外,也可以预先确定无风险的数据满足的另一预设条件,从而通过无风险数据的预设条件来筛选出无风险的标记数据。
如图3所示,从设备使用数据中提取出符合预设条件的标记数据可以包括步骤S31至步骤S33。
在步骤S31中,通过所述设备使用数据构建设备网络图,所述设备网络图中各节点对应各终端设备,所述设备网络图中的边表征所述设备使用数据的相似度。举例而言,该设备网络图可以例如图4所示,其中每个节点对应一个终端设备,若终端设备的设备使用数据之间的相似度超过预设值则可以确定终端设备之间连通,从而得到终端设备之间互相连通的设备网络图。其中设备使用数据之间的相似度可以通过各种相似度算法来计算,例如余弦相似度、欧氏距离等等,本实施方式对此不做特殊限制。
在步骤S32中,通过全局模块度对所述设备网络图进行划分,以获得划分后的多个连通子图。可以通过邻接矩阵对上述步骤S31中的设备网络图进行表示。例如,邻接矩阵可以为:
其中,v和w为节点的编号;且Avv=0。
以图4中的网络设备图为例,则可以表示为:A1,1=0,A1,2=1,A1,3=0,…,A9,7=0,A9,8=1,A9,9=0。在该方法中可以将该9个节点可以初始化为9个区块。
全局模块度的大小定义为区块内部的总边数和设备网络图中总边数的比例减去一个期望值。区块内部的总边数和设备网络图中总边数的比例可以通过下式表示:
其中,cv表示节点v所在区块,cw表示节点w所在区块;函数δ(cv,cw)的取值定义为:如果节点v和节点w在一个区块,即cv=cw,则为1,否则为0;m为设备网络图中的总边数。
上述期望值是将设备网络图设定为随机网络时,同样的区块划分所形成的区块内部的总边数和设备网络图中总边数的比例的大小。结合期望值,可以得到全局模块度Q:
其中,kv为节点v的节点度(即所有与节点v相连的边的数量),kw为节点w的节点度。
按照上述模块度计算方法计算将节点划分到另一区块后的全局模块度Q,Q取值最大时则是比较理想的划分,Q的值越大则划分的准确度越高。对设备网络图进行多次划分之后可以取最大Q值对应的划分作为最终的分类结果。以图4所示的设备网络图为例,在多次划分之后可以将设备网络图划分为两个区块A和B。
在步骤S33中,将包含目标终端设备的区块作为符合预设条件的标记数据。目标终端设备可以为有风险的设备,即欺诈设备,在实际业务中可以根据沉淀的欺诈案例获取欺诈设备,以及欺诈设备的设备使用数据。在构建设备网络图时,可以将历史确定的一个或多个欺诈设备加入该设备网络图中,或者在设备使用数据中标记出一个或多个有风险的设备使用数据,从而在得到划分结果后将包含该欺诈设备的区块作为标记数据。标记数据的标签可以确定为有风险。此外,在其他实施方式中,通过局部模块度计算方法也可以对设备网络图进行划分,从而得到包含目标终端设备的区块。
在本实施方式中,通过计算各个终端设备的维度特征,利用各维度特征对终端设备进行分类,可以从设备使用数据中直接提取出标记数据,从而为标记数据打上预定的标签,无需人工对数据进行一一标注,可以大大降低人力和时间成本。
在步骤S23中,结合包含标签的标记数据以及风险识别模型对设备使用数据进行风险识别,以获取设备使用数据的风险识别结果。
将包含标签的标记数据可以作为样本数据来对半监督分类模型进行训练得到风险识别模型,进而将设备使用数据中不包含标签的数据输入该风险识别模型中,得到风险识别结果。为了方便表述,将设备使用数据中不包含标签的数据记为样本数据,即,设备使用数据中包含两类数据,一类是包含标签的标记数据,一类是不包含标签的样本数据。其中,包含标签的标记数据的数量级小于样本数据的数量级,也就是说,只对设备使用数据中一小部分进行了标记。在示例性的实施方式中,通过标记数据可以对半监督分类模型进行训练,即,将标记数据作为半监督分类模型的输入,输出则为标记数据的标签,通过学习输入到输出的映射来预测不包含标签的样本数据的输出值,从而得到风险识别模型,并利用该风险识别模型预测样本数据的风险识别结果。在标记样本较少的情况下,采用半监督分类算法与有监督的分类相比,能够有效地增强模型的识别能力,从而提高风险识别模型的准确率。示例实施方式中,风险识别模型的训练过程具体可以包括如图5所示的步骤。
其中,在步骤S51中,利用所述风险识别模型得到所述样本数据的第一识别结果。该风险识别模型为利用包含标签的标记数据对半监督分类模型进行训练后得到的模型。训练的具体算法可以为线性回归算法、感知器、决策树等等。对标记数据训练完成得到该风险识别模型后,可以将样本数据输入该风险识别模型,得到预测的识别结果。以标记数据的标签为有风险为例,该第一识别结果可以指样本数据有风险的概率,例如对于样本数据A,该风险识别模型输出的识别结果为0.7,则可以确定该样本数据A有风险的概率为0.7。
在步骤S52中,将大于预设阈值的第一识别结果作为对应的样本数据的标签,以利用包含标签的样本数据对所述风险识别模型进行更新。由于步骤S51中的风险识别模型的训练集有限,即标记数据的数量较少,因此得到的风险识别模型还有待优化。对每一样本数据进行识别后,超过预设阈值的第一识别结果的置信度较高,因此根据第一识别结果,可以从样本数据中提取出第一识别结果超过预设阈值的样本数据,并将该置信度较高的第一识别结果作为该样本数据的标签,从而实现对数据的标注。该样本数据的标签可以为模型输出的具有风险的概率值,也可以根据概率值确定风险级别,例如高风险、低风险、中高风险等等,将风险级别作为标签等。例如,样本数据B的第一识别结果为:有风险的概率为0.8,预设阈值为0.7,则可以将“有风险”作为样本数据B的标签,也可以将“0.7”作为样本数据B的标签。
在该步骤中,利用标注后的数据则可以继续对步骤S51中得到的风险识别模型进行训练。将包含标签的样本数据作为该风险识别模型的输入,继续学习数据与标签之间的映射,可以得到二次训练后的风险识别模型。其中,预设阈值可以根据实际需求设置,例如为0.6、0.7、0.77、0.8等,也可以包括其他数值,例如0.82、0.9、0.97等等,识别结果越高则识别结果的置信度则越高,因此为了保证较高的置信度,可以设置较高的预设阈值。
在步骤S53中,通过更新后的风险识别模型,获取不包含标签的样本数据的第二识别结果。本步骤中的识别过程与步骤S51中类似,将包含标签的样本数据输入更新后的风险识别模型,可以得到不包含标签的样本数据的第二识别结果。例如,对于样本数据C输入更新后的风险识别模型后得到输出的识别结果为:有风险的概率为0.5,对于样本数据D的识别结果可以为:有风险的概率为0.2。
在步骤S54中,将大于预设阈值的第二识别结果作为对应的样本数据的标签,再次对该风险识别模型进行迭代更新。例如,预设阈值为0.8,样本数据E的识别结果为有风险概率0.2,而样本数据F的识别结果为有风险概率0.81,则可以将“有风险”作为样本数据F的标签,从而对样本数据F进行标注。利用标注后包含标签的样本数据可以对步骤S53中的风险识别模型进行迭代更新。
需要理解的是,上述步骤S53至步骤S54为循环迭代步骤,即在步骤S54中对风险识别模型进行迭代更新之后,需要重新转至步骤S53中,利用更新后的风险识别模型再次对样本数据中不包含标签的样本数据进行识别,得到第三识别结果,反复迭代,不断更新风险识别模型,并更新不包含标签的样本数据的识别结果。每次更新模型之后可以判断样本数据中是否还存在不包含标签的数据,由于每更新一次模型可以从样本数据中提取出一部分能够确定标签的数据,因而导致样本数据中剩余的不包含标签的数据越来越少,如果样本数据中仍然存在不包含标签的数据,则再次进行下一次循环,直到样本数据中不存在不包含标签的数据。迭代结束之后,可以得到每一样本数据的标签,与包含标签的标记数据进行合并,可以得到所有设备使用数据的最终的风险识别结果。本实施方式中,风险识别结果可以与终端设备的唯一标识进行关联保存,从而利用唯一标识可以索引到对应的风险识别结果。
继续参考图2,在步骤S24中,将风险识别结果更新至风险决策引擎中,以使风险决策引擎在接收到待识别设备的数据请求时,利用风险识别结果输出待识别设备的欺诈风险。
其中,风险决策引擎指的是互联网产品中配置的用于进行风险控制的组件,例如金融类互联网应用、电子商务类应用等多种互联网场景中均需要配置相关的风险决策引擎。得到风险识别结果后,可以将风险识别结果推送至风险决策引擎对应的数据库中,作为风险决策引擎的数据支持。例如,风险识别结果可以以表格、列表、配置文件等各种形式表示,以表格为例,将该表格可以发送至风险决策引擎对应的服务端上,在风险决策引擎中配置有各种规则,用于对不同的风险场景进行决策和控制。举例而言,对于待识别设备R,在该设备R触发对平台S的数据请求时,平台S中的风险决策引擎组件可以根据该数据请求确定该待识别设备R的唯一标识,进而通过唯一标识从风险识别结果中查询出该设备R对应的欺诈风险,进而根据该欺诈风险决策是否对于该数据请求进行响应。
对于本实施方式的风险决策引擎来说,无需在线运行风险识别模型,而是根据保存的风险识别结果直接查询待识别设备对应的欺诈风险,能够避免运行模型占用过多资源,从而减小资源占用,提高风险决策引擎的运行速率,更加快速地得到设备的欺诈风险。尤其对于多次出现的设备,无需重复进行识别就可以直接输出结果,能够避免重复识别造成的资源浪费,复用性较高。
本实施方式中还提供一种风险决策引擎,如图6所示。该风险决策引擎60可以包括识别结果更新模块61、数据请求模块62、风险识别模块63以及数据发送模块64。
其中,识别结果更新模块61,用于按照目标时间周期更新终端设备的风险识别结果。目标时间周期可以为一天、三天、1周、15天等,也可以包括其他时间段,例如20天、一个月等等,本实施方式对此不做特殊限定。可以根据该目标时间周期对终端设备的设备使用数据进行更新,利用更新的设备使用数据则可以重新确定各个终端设备的风险识别结果。
数据请求模块62,用于接收待识别设备的数据请求时,确定所述待识别设备的唯一标识。该数据请求可以为接口请求,待识别设备需要通过接口来请求平台提供的服务。
风险识别模块63,用于根据所述唯一标识从所述风险识别结果中获取所述待识别设备的欺诈风险。
数据发送模块64,用于在所述欺诈风险符合预设条件时,将所述待识别设备的数据请求转发至第三方应用;以及在所述欺诈风险不符合预设条件时,向所述第三方应用发送风险预警。第三方应用指的是具备风险决策引擎的组件的应用,通常终端设备上大多数的应用均会配置风险决策引擎,例如金融类APP、通讯类APP等。根据待识别设备的欺诈风险,风险决策引擎可以根据规则对待识别设备的数据请求进行处理,例如,在待识别设备的欺诈风险较高时,可以向第三方应用发送风险预警,或者根据规则拦截待识别设备的数据请求等,在待识别设备的欺诈风险较低,或者无风险时可以将数据请求转发至第三方应用,从而为用户提供所请求的第三方应用的服务。
本实施方式提供的风险决策引擎无需包含风险识别模型,可以避免风险识别模型占用过多资源,所需的空间小,更易于部署、迁移,复用性较强,并且在更新迭代时只需要更新风险识别结果,可以提高维护效率。
以下介绍本公开的装置实施例,可以用于执行本公开上述的设备风险识别方法。参考图7,本公开实施例提供的设备风险识别装置70可以包括:设备标识模块71、特征计算模块72、特征识别模块73以及数据更新模块74。
其中,设备标识模块71,用于生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据。
特征计算模块72,用于计算所述设备使用数据的维度特征,从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据,确定所述标记数据的风险标签。
特征识别模块73,用于结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果。
数据更新模块74,用于将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
在本公开的示例性实施方式中,所述设备使用数据的维度特征至少包括:登录特征、违规识别特征、网络特征以及传感器特征。
在本公开的示例性实施方式中,特征计算模块72可以包括网络图构建单元、区块划分单元、数据获取单元。
其中,网络图构建单元,用于通过所述设备使用数据构建设备网络图,所述设备网络图中各节点对应各终端设备,所述设备网络图中的边表征所述设备使用数据的相似度。
区块划分单元,用于通过全局模块度对所述设备网络图进行划分,以获得划分后的多个区块。
数据获取单元,用于将包含目标终端设备的区块作为所述符合预设条件的标记数据。
在本公开的示例性实施方式中,特征计算模块72可以包括特征值获取单元、数据提取单元。其中,特征值获取单元,应用于获取多个维度特征分别对应的欺诈特征值;数据提取单元,用于从所述设备使用数据中提取出所有的维度特征均超过对应的欺诈特征值的标记数据,并将所述标记数据标记为有风险。
在本公开的示例性实施方式中,特征识别模块73可以包括模型训练单元以及模型应用单元。其中:模型训练单元,用于基于所述包含标签的标记数据对半监督分类模型进行训练,以获得所述风险识别模型;模型应用单元,用于将提取出所述标记数据之后的设备使用数据作为样本数据,利用所述风险识别模型对所述样本数据进行识别,得到风险识别结果。
在本公开的示例性实施方式中,模型应用单元可以包括第一识别单元、模型更新单元、第二识别单元、识别结果确定单元。其中:第一识别单元,用于利用所述风险识别模型得到所述样本数据的第一识别结果;模型更新单元,用于将大于预设阈值的第一识别结果作为对应的样本数据的标签,以利用包含标签的样本数据对所述风险识别模型进行更新;第二识别单元,用于通过更新后的风险识别模型,获取不包含标签的样本数据的第二识别结果;识别结果确定单元,用于将大于所述预设阈值的第二识别结果作为对应的样本数据的标签,对所述风险识别模型进行迭代更新,直到所述样本数据全部具有标签。
在本公开的示例性实施方式中,特征计算模块72可以包括数据筛选单元、传感器数据获取单元、传感器特征确定单元。其中:数据筛选单元,用于获取在预设时间周期内所述唯一标识对应的多条设备使用数据;传感器数据获取单元,用于提取所述多条设备使用数据中的位移传感器数据以及屏幕亮度传感器数据;传感器特征确定单元,用于利用所述位移传感器数据以及所述屏幕亮度传感器数据,计算所述终端设备的位移变化特征以及屏幕亮度变化特征,以得到所述传感器特征。
在本公开的示例性实施方式中,特征计算模块72可以包括账户获取单元以及登录特征确定单元。其中:账户获取单元,用于基于所述唯一标识确定所述设备使用数据的数据采集频率、数据采集时间以及关联用户账户;登录特征确定单元,用于通过所述数据采集频率、数据采集时间以及关联用户账户计算所述终端设备的登录特征。
在本公开的示例性实施方式中,特征计算模块72可被配置为:利用所述设备使用数据确定所述终端设备上安装的风险应用,以获得所述违规识别特征。
在本公开的示例性实施方式中,特征计算模块72可被配置为:利用所述设备使用数据获取所述终端设备的基站信息,以获得所述网络特征。
由于本公开的示例实施例的设备风险决策装置的各个功能模块与上述设备风险决策方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的设备风险决策方法的实施例。
下面参考图8,其示出了适于用来实现本公开实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备的计算机系统800仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统操作所需的各种程序和数据。CPU1201、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的疫情防控有效性确定方法。
例如,所述的电子设备可以实现如图2中所示的:步骤S21,生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据;步骤S22,计算所述设备使用数据的维度特征,从所述设备使用数据中提取出所述维度特征符合预设条件的标记数据,确定所述标记数据的标签;步骤S23,结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果;步骤S24,将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
又如,所述的电子设备可以实现如图3-5所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (12)
1.一种设备风险识别方法,其特征在于,包括:
生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据;
通过所述设备使用数据构建设备网络图,所述设备网络图中各节点对应各终端设备,所述设备网络图中的边表征所述设备使用数据的相似度;
通过全局模块度对所述设备网络图进行划分,以获得划分后的多个区块;
将包含目标终端设备的区块作为符合预设条件的标记数据;
计算所述设备使用数据的维度特征,获取多个维度特征分别对应的欺诈特征值;
从所述设备使用数据中提取出所有的维度特征均超过对应的欺诈特征值的所述标记数据,并将所述标记数据标记为有风险,以确定所述标记数据的标签;
结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果;
将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
2.根据权利要求1所述的方法,其特征在于,所述设备使用数据的维度特征至少包括:登录特征、违规识别特征、网络特征以及传感器特征。
3.根据权利要求1所述的方法,其特征在于,所述结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果包括:
基于所述包含标签的标记数据对半监督分类模型进行训练,以获得所述风险识别模型;
将提取出所述标记数据之后的设备使用数据作为样本数据,利用所述风险识别模型对所述样本数据进行识别,得到风险识别结果。
4.根据权利要求3所述的方法,其特征在于,所述利用所述风险识别模型对所述样本数据进行识别,得到风险识别结果包括:
利用所述风险识别模型得到所述样本数据的第一识别结果;
将大于预设阈值的第一识别结果作为对应的样本数据的标签,以利用包含标签的样本数据对所述风险识别模型进行更新;
通过更新后的风险识别模型,获取不包含标签的样本数据的第二识别结果;
将大于所述预设阈值的第二识别结果作为对应的样本数据的标签,对所述风险识别模型进行迭代更新,直到所述样本数据全部具有标签。
5.根据权利要求2所述的方法,其特征在于,所述计算所述设备使用数据的维度特征包括:
获取在预设时间周期内所述唯一标识对应的多条设备使用数据;
提取所述多条设备使用数据中的位移传感器数据以及屏幕亮度传感器数据;
利用所述位移传感器数据以及所述屏幕亮度传感器数据,计算所述终端设备的位移变化特征以及屏幕亮度变化特征,以得到所述传感器特征。
6.根据权利要求2所述的方法,其特征在于,所述计算所述设备使用数据的维度特征包括:
基于所述唯一标识确定所述设备使用数据的数据采集频率、数据采集时间以及关联用户账户;
通过所述数据采集频率、数据采集时间以及关联用户账户计算所述终端设备的登录特征。
7.根据权利要求2所述的方法,其特征在于,所述计算所述设备使用数据的维度特征包括:
利用所述设备使用数据确定所述终端设备上安装的风险应用,以获得所述违规识别特征。
8.根据权利要求2所述的方法,其特征在于,所述计算所述设备使用数据的维度特征包括:
利用所述设备使用数据获取所述终端设备的基站信息,以获得所述网络特征。
9.一种应用权利要求1所述的设备风险识别方法的风险决策引擎,其特征在于,包括:
识别结果更新模块,用于按照目标时间周期更新终端设备的风险识别结果;
数据请求模块,用于接收待识别设备的数据请求时,确定所述待识别设备的唯一标识;
风险识别模块,用于根据所述唯一标识从所述风险识别结果中获取所述待识别设备的欺诈风险;
数据发送模块,用于在所述欺诈风险符合预设条件时,将所述待识别设备的数据请求转发至第三方应用;以及
在所述欺诈风险不符合预设条件时,向所述第三方应用发送风险预警。
10.一种设备风险识别装置,其特征在于,包括:
设备标识模块,用于生成各个终端设备的唯一标识,通过所述唯一标识采集所述终端设备的设备使用数据;
设备网络图构建模块,用于通过所述设备使用数据构建设备网络图,所述设备网络图中各节点对应各终端设备,所述设备网络图中的边表征所述设备使用数据的相似度;
区块划分模块,用于通过全局模块度对所述设备网络图进行划分,以获得划分后的多个区块;
标记数据获取模块,用于将包含目标终端设备的区块作为符合预设条件的标记数据;
特征计算模块,用于计算所述设备使用数据的维度特征,获取多个维度特征分别对应的欺诈特征值;
标记数据的标签确定模块,用于从所述设备使用数据中提取出所有的维度特征均超过对应的欺诈特征值的所述标记数据,并将所述标记数据标记为有风险,以确定所述标记数据的标签;
特征识别模块,用于结合包含标签的所述标记数据以及风险识别模型对所述设备使用数据进行风险识别,以获取所述设备使用数据的风险识别结果;
数据更新模块,用于将所述风险识别结果更新至风险决策引擎中,以使所述风险决策引擎在接收到待识别设备的数据请求时,利用所述风险识别结果输出所述待识别设备的欺诈风险。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的设备风险识别方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至8中任一项所述的设备风险识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011111069.3A CN112118551B (zh) | 2020-10-16 | 2020-10-16 | 设备风险识别方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011111069.3A CN112118551B (zh) | 2020-10-16 | 2020-10-16 | 设备风险识别方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112118551A CN112118551A (zh) | 2020-12-22 |
CN112118551B true CN112118551B (zh) | 2022-09-09 |
Family
ID=73794713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011111069.3A Active CN112118551B (zh) | 2020-10-16 | 2020-10-16 | 设备风险识别方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112118551B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282304B (zh) * | 2021-05-14 | 2022-04-29 | 杭州云深科技有限公司 | 基于app安装列表识别虚拟机的系统 |
CN113254919B (zh) * | 2021-07-14 | 2021-10-12 | 杭州云信智策科技有限公司 | 异常设备识别方法、电子设备和计算机可读存储介质 |
CN113254918B (zh) * | 2021-07-14 | 2021-10-12 | 杭州云信智策科技有限公司 | 信息处理方法、电子设备和计算机可读存储介质 |
CN113610132A (zh) * | 2021-07-29 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN116578877B (zh) * | 2023-07-14 | 2023-12-26 | 之江实验室 | 一种模型训练及二次优化打标的风险识别的方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287864A (zh) * | 2017-12-06 | 2018-07-17 | 深圳市腾讯计算机系统有限公司 | 一种兴趣群组划分方法、装置、介质及计算设备 |
CN109214428A (zh) * | 2018-08-13 | 2019-01-15 | 平安科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及计算机存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10290053B2 (en) * | 2009-06-12 | 2019-05-14 | Guardian Analytics, Inc. | Fraud detection and analysis |
CN108520343B (zh) * | 2018-03-26 | 2022-07-19 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN108717602B (zh) * | 2018-05-15 | 2021-09-28 | 创新先进技术有限公司 | 一种交易行为异常的识别方法、装置及设备 |
CN110290522B (zh) * | 2019-07-17 | 2023-02-21 | 中国工商银行股份有限公司 | 用于移动设备的风险识别方法、装置和计算机系统 |
CN110399925B (zh) * | 2019-07-26 | 2023-09-19 | 腾讯科技(武汉)有限公司 | 账号的风险识别方法、装置及存储介质 |
CN110782333B (zh) * | 2019-08-26 | 2023-10-17 | 腾讯科技(深圳)有限公司 | 一种设备风险控制方法、装置、设备及介质 |
CN111275546B (zh) * | 2020-02-24 | 2023-08-18 | 中国工商银行股份有限公司 | 金融客户欺诈风险识别方法及装置 |
-
2020
- 2020-10-16 CN CN202011111069.3A patent/CN112118551B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287864A (zh) * | 2017-12-06 | 2018-07-17 | 深圳市腾讯计算机系统有限公司 | 一种兴趣群组划分方法、装置、介质及计算设备 |
CN109214428A (zh) * | 2018-08-13 | 2019-01-15 | 平安科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112118551A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112118551B (zh) | 设备风险识别方法及相关设备 | |
CN110399550B (zh) | 一种信息推荐方法及装置 | |
CN112148987B (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
CN110266510B (zh) | 网络控制策略生成方法及装置、网络控制方法、存储介质 | |
CN110147389B (zh) | 帐号处理方法和装置、存储介质及电子装置 | |
CN110674360B (zh) | 一种用于数据的溯源方法和系统 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN115511501A (zh) | 一种数据处理方法、计算机设备以及可读存储介质 | |
Ahrabian et al. | Data analysis as a web service: A case study using IoT sensor data | |
CN110197426B (zh) | 一种信用评分模型的建立方法、装置及可读存储介质 | |
CN112394908A (zh) | 埋点页面自动生成的方法、装置、计算机设备及存储介质 | |
CN112351088A (zh) | 一种cdn缓存方法、装置、计算机设备及存储介质 | |
CN115936895A (zh) | 基于人工智能的风险评估方法、装置、设备及存储介质 | |
CN115941322A (zh) | 基于人工智能的攻击检测方法、装置、设备及存储介质 | |
EP4002905A1 (en) | 5g-iot intelligent trust enabler system | |
CN110737820B (zh) | 用于生成事件信息的方法和装置 | |
CN110674208A (zh) | 用于确定用户的职住地信息的方法和装置 | |
US20210065031A1 (en) | Network optimization | |
CN113051911B (zh) | 提取敏感词的方法、装置、设备、介质及程序产品 | |
CN113128773B (zh) | 地址预测模型的训练方法、地址预测方法及装置 | |
CN112330332B (zh) | 识别关于节点任务的欺诈风险的方法、计算设备和介质 | |
CN114067149A (zh) | 互联网服务提供方法、装置和计算机设备 | |
CN114356712A (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN114638308A (zh) | 一种获取对象关系的方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |