CN113115311B

CN113115311B - 一种基于支持向量机模型的欺诈行为的识别方法及系统

Info

Publication number: CN113115311B
Application number: CN202110390533.5A
Authority: CN
Inventors: 李栋; 汪德嘉; 许贺; 唐冬宇
Original assignee: Jiangsu Pay Egis Technology Co ltd
Current assignee: Jiangsu Pay Egis Technology Co ltd
Priority date: 2021-04-12
Filing date: 2021-04-12
Publication date: 2022-12-06
Anticipated expiration: 2041-04-12
Also published as: CN113115311A

Abstract

本申请提供了一种基于支持向量机模型的欺诈行为的识别方法及系统，所述方法包括以下步骤：获取用户设备的特征参数，对所述特征参数进行预处理，得到预处理特征参数，将所述预处理特征参数输入机器学习模型，得到欺诈行为识别结果。本申请通过对用户设备的特征参数进行多维度进行分析，以判断出当前系列行为的制造者是否存在欺诈行为，解决了现有欺诈行为识别方法准确率较差以及风险较高的问题，实现了欺诈行为的有效防控。减少欺诈设备和用户的接入，减少企业损失。可以真实反映出推广运营效果，为后续的推广运营提供参照。

Description

一种基于支持向量机模型的欺诈行为的识别方法及系统

技术领域

本申请涉及网络安全防护技术领域，尤其涉及一种基于支持向量机模型的欺诈行为的识别方法及系统。

背景技术

随着互联网和移动智能终端的普及，移动环境下人们的生活需求不断被挖掘。与此同时，移动环境下的黑产活动愈发猖獗，支付漏洞和隐私威胁不断曝出。身份欺诈成为在线欺诈的顽疾，欺诈者以移动设备为掩体发动攻击。如，以猫池设备为代表的模拟器欺诈，以薅羊毛为代表的群控欺诈，以反复点击为代表的程序欺诈等。不法分子通过这些欺诈手段获取大规模盈利。这些行为紧紧依附互联网行业，其技术与互联网行业以等同的速度发展，向反欺诈风控业务提出了强有力的挑战。

现有的欺诈行为识别方法均是通过IP信息和位置信息进行判断，但具有容易误判、不能准确识别的缺点，例如，随着IP代理技术的不断发展，移动终端可以非常简单和低成本的更换IP信息和位置信息，这就使得以IP信息和位置信息为基础的欺诈行为识别技术，已经无法正确的检测识别大部分的欺诈行为。从而难以实现对欺诈行为的有效防控。

发明内容

本申请提供了一种基于支持向量机模型的欺诈行为的识别方法及系统，以解决现有欺诈行为识别方法，无法实现对欺诈行为的有效防控的问题。

一方面，本申请提供了一种基于支持向量机模型的欺诈行为的识别方法，具体包括以下步骤：

获取用户设备的特征参数；

对所述特征参数进行预处理，得到预处理特征参数；

将所述预处理特征参数输入机器学习模型，得到欺诈行为识别结果。

所述特征参数包括同一IP地址的注册次数、同一IP地址的签到次数、同一移动终端的注册次数、同一移动终端的签到次数、是否为模拟器、是否为群控平台、同一sessionID的出现次数、移动终端的设备ID、注册时间与购买时间的差值、是否使用代理、同一移动终端的关联用户数量、同一设备的注册时间间隔、同一ID地址的注册时间间隔、同一IP地址的关联用户数量、同一IP地址的关联设备数量、同一用户账号的关联设备数量以及同一用户账号关联的IP地址数量。

对所述特征参数进行预处理，具体包括以下步骤：

对所述特征参数进行格式转换；

对所述特征参数进行缺失值处理；

对所述特征参数进行归一化处理。

还包括机器学习模型进行训练,具体以下步骤：

获取特征参数数据；

对特征参数数据进行预处理；

通过所述预处理参数数据训练机器学习模型；

得到模型训练结果，所述模型训练结果为识别准确率，所述机器学习模型为支持向量机模型。

还包括以下步骤：

通过人工调参方式对所述机器学习模型进行优化。

第二方面，本申请提供了一种基于支持向量机模型的欺诈行为的识别系统，包括：

参数获取模块，用于获取用户设备的特征参数；

参数预处理模块，用于对所述特征参数进行预处理，得到预处理特征参数；

机器学习训练模块，用于将所述预处理特征参数输入机器学习模型，得到欺诈行为识别结果。

所述参数预处理模块包括：

格式转换模块，用于对所述特征参数进行格式转换；

缺失值处理模块，用于对所述特征参数进行缺失值处理；

归一化处理模块，用于对所述特征参数进行归一化处理。

还包括：

模型优化模块，用于通过人工调参方式对所述机器学习模型进行优化。

第三方面，本申请提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行，以实现任一项所述基于支持向量机模型的欺诈行为的识别方法。

第四方面，本申请提供了一种基于支持向量机模型的欺诈行为的识别装置，包括：处理器和存储器；所述存储器用于存储计算机程序；所述处理器与所述存储器相连，用于执行所述存储器存储的计算机程序，以使所述基于支持向量机模型的欺诈行为的识别装置执行任一项所述的基于支持向量机模型的欺诈行为的识别方法。

由以上技术方案可知，本申请提供了一种基于支持向量机模型的欺诈行为的识别方法及系统，所述方法包括以下步骤：获取用户设备的特征参数，对所述特征参数进行预处理，得到预处理特征参数，将所述预处理特征参数输入机器学习模型，得到欺诈行为识别结果。本申请通过对用户设备的特征参数进行多维度进行分析，以判断出当前系列行为的制造者是否存在欺诈行为，解决了现有欺诈行为识别方法准确率较差的问题，实现了欺诈行为的有效防控。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请的一种基于支持向量机模型的欺诈行为的识别方法的工作流程图；

图2为本申请的所述识别方法的一种实施例的工作流程图。

具体实施方式

下面将详细地对实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。

参见图1，一方面，本申请提供了一种基于支持向量机模型的欺诈行为的识别方法，具体包括以下步骤：

S110：获取用户设备的特征参数；

S120：对所述特征参数进行预处理，得到预处理特征参数；

S130：将所述预处理特征参数输入机器学习模型，得到欺诈行为识别结果。

更为具体的是，在一些实施例中，参见图2，对所述特征参数进行预处理，具体包括以下步骤：

S121：对所述特征参数进行格式转换；

更为具体的是，将所述特征参数由字符型特征参数转换成数值型特征参数，便于后续输入机器学习模型进行处理，节约处理时间，提升处理效率。

S122：对所述特征参数进行缺失值处理；

更为具体的是，获取存在缺失值的特征参数，若存在缺失值的特征参数数量较少，将存在缺失值的特征参数的整行数据进行删除，若特征参数中存在过多的缺失值，那么不能直接将数据整行删除，否则会丢弃潜在的有用信息，则对特征参数进行填充操作。常见的填充操作有：均值/中位数/众数插补、使用固定值插补、最近邻插补，用户可根据实际情况选择合适的方法。如果存在缺失值的样本属于小部分，并且不包含大量潜在的有用的信息，那么我们可以通过删除小部分样本达到既定的要求，在这种情况下删除含有缺失值数据的方法是最简单且高效的。然而，这种方法却有很大的局限性。如果缺失值所在的数据存在大量隐藏的信息，我们随意删除就会造成数据的不完整性。

S123：对所述特征参数进行归一化处理。

更为具体的是，由于数据每个特征的量级不统一，有的特征量级很大，有的特征的量级却很小，所以要进行归一化处理。归一化处理的主要思想是把数据的量级变成(0，1)之间的小数，这样更有利于数据的处理，把有量纲表达式变成无量纲表达式，有利于不同量级或者单位的指标能够进行加权和比较。

更为具体的是，还包括机器学习模型进行训练，具体以下步骤：

获取特征参数数据；

对特征参数数据进行预处理；

通过所述预处理参数数据训练机器学习模型；

得到模型训练结果，所述模型训练结果为识别准确率，所述机器学习模型为支持向量机模型。更为具体的是，欺诈行为识别是一个典型的二分类问题，支持向量机是我们用于分类的一种算法。在我们所有的机器学习算法中，支持向量机模型表现出显著的效果，具有准确，健壮的优点，属于典型的二分类算法，并且可以支持线性和非线性的分类。对于模型的选择我们首先观察数据的分布情况，然后进行模型对比选择最终的模型。

更为具体的是，还包括以下步骤：

S140：通过人工调参方式对所述机器学习模型进行优化。

更为具体的是，通过对所述机器学习模型进行优化，能够不断提升欺诈行为识别的准确性，提升用户体验。

参数获取模块，用于获取用户设备的特征参数；

所述参数预处理模块包括：

格式转换模块，用于对所述特征参数进行格式转换；

缺失值处理模块，用于对所述特征参数进行缺失值处理；

归一化处理模块，用于对所述特征参数进行归一化处理。

更为具体的是，在一些实施例中，还包括：

由以上技术方案可知，本申请提供了一种基于支持向量机模型的欺诈行为的识别方法及系统，所述方法包括以下步骤：获取用户设备的特征参数，对所述特征参数进行预处理，得到预处理特征参数，将所述预处理特征参数输入机器学习模型，得到欺诈行为识别结果。本申请通过对用户设备的特征参数进行多维度进行分析，以判断出当前系列行为的制造者是否存在欺诈行为，解决了现有欺诈行为识别方法准确率较差的问题，实现了欺诈行为的有效防控。减少欺诈设备和用户的接入，减少企业损失。可以真实反映出推广运营效果，为后续的推广运营提供参照。

本申请提供的实施例之间的相似部分相互参见即可，以上提供的具体实施方式只是本申请总的构思下的几个示例，并不构成本申请保护范围的限定。对于本领域的技术人员而言，在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。

Claims

1.一种基于支持向量机模型的欺诈行为的识别方法，其特征在于，具体包括以下步骤：

获取用户设备的特征参数；所述特征参数包括：同一IP地址的注册次数、同一IP地址的签到次数、同一移动终端的注册次数、同一移动终端的签到次数、是否为模拟器、是否为群控平台、同一session ID的出现次数、移动终端的设备ID、注册时间与购买时间的差值、是否使用代理、同一移动终端的关联用户数量、同一设备的注册时间间隔、同一ID地址的注册时间间隔、同一IP地址的关联用户数量、同一IP地址的关联设备数量、同一用户账号的关联设备数量以及同一用户账号关联的IP地址数量；

对所述特征参数进行预处理，得到预处理特征参数；

2.根据权利要求1所述的基于支持向量机模型的欺诈行为的识别方法，其特征在于，对所述特征参数进行预处理，具体包括以下步骤：

对所述特征参数进行格式转换；

对所述特征参数进行缺失值处理；

对所述特征参数进行归一化处理。

3.根据权利要求1所述的基于支持向量机模型的欺诈行为的识别方法，其特征在于，还包括机器学习模型进行训练，具体以下步骤：

获取特征参数数据；

对特征参数数据进行预处理；

通过预处理参数数据训练机器学习模型；

4.根据权利要求1所述的基于支持向量机模型的欺诈行为的识别方法，其特征在于，还包括以下步骤：

通过人工调参方式对所述机器学习模型进行优化。

5.一种基于支持向量机模型的欺诈行为的识别系统，其特征在于，包括：

参数获取模块，用于获取用户设备的特征参数；所述特征参数包括：同一IP地址的注册次数、同一IP地址的签到次数、同一移动终端的注册次数、同一移动终端的签到次数、是否为模拟器、是否为群控平台、同一session ID的出现次数、移动终端的设备ID、注册时间与购买时间的差值、是否使用代理、同一移动终端的关联用户数量、同一设备的注册时间间隔、同一ID地址的注册时间间隔、同一IP地址的关联用户数量、同一IP地址的关联设备数量、同一用户账号的关联设备数量以及同一用户账号关联的IP地址数量；

6.根据权利要求5所述的基于支持向量机模型的欺诈行为的识别系统，其特征在于，所述参数预处理模块包括：

格式转换模块，用于对所述特征参数进行格式转换；

缺失值处理模块，用于对所述特征参数进行缺失值处理；

归一化处理模块，用于对所述特征参数进行归一化处理。

7.根据权利要求5所述的基于支持向量机模型的欺诈行为的识别系统，其特征在于，还包括：

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行，以实现权利要求1至4中任一项所述基于支持向量机模型的欺诈行为的识别方法。

9.一种基于支持向量机模型的欺诈行为的识别装置，其特征在于，包括：处理器和存储器；所述存储器用于存储计算机程序；所述处理器与所述存储器相连，用于执行所述存储器存储的计算机程序，以使所述基于支持向量机模型的欺诈行为的识别装置执行权利要求1至4中任一项所述的基于支持向量机模型的欺诈行为的识别方法。