CN118096165A

CN118096165A - 一种欺诈检测方法、装置、设备及可读存储介质

Info

Publication number: CN118096165A
Application number: CN202410226428.1A
Authority: CN
Inventors: 黄柳婷
Original assignee: Agricultural Bank of China
Current assignee: Agricultural Bank of China
Priority date: 2024-02-29
Filing date: 2024-02-29
Publication date: 2024-05-28

Abstract

本申请公开了一种欺诈检测方法、装置、设备及可读存储介质，涉及数据处理领域，包括：获取待测用户的历史消费数据和待测消费数据；对历史消费数据进行特征压缩，得到降维数据；根据降维数据对残差网络模型进行训练，得到欺诈检测模型；将待测消费数据输入欺诈检测模型中，得到待测用户的欺诈检测结果。可见，本申请由于在训练出欺诈检测模型时先将对历史消费数据进行特征压缩后得到的降维数据作为训练数据，可以避免历史消费数据中的不相关数据造成的干扰，并且通过对残差网络模型进行训练来得到欺诈检测模型，可以深度挖掘出数据内部信息量更大的隐藏特征，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

Description

一种欺诈检测方法、装置、设备及可读存储介质

技术领域

本申请涉及数据处理领域，更具体地说，涉及一种欺诈检测方法、装置、设备及可读存储介质。

背景技术

信用卡交易伴随着现代信息技术和全球化的发展变得越来越多。迄今为止，最常见的金融欺诈类型是信用卡欺诈。信用卡欺诈是指在未经持卡人许可或发卡机构不知情的情况下使用信用卡进行购物的情况。当卡丢失、被盗或以其他方式受损时，可能会导致国际信用卡欺诈。由于欺诈会造成金钱和声誉损失，金融机构一直在寻找新的策略来打击欺诈。为了解决信用诈骗问题主要有两种方法：一是预防欺诈，二是欺诈检测。分析持卡人的消费习惯和之前的交易及其描述是目前检测信用卡欺诈的方法之一。由于交易量巨大，信用卡发卡机构无法人工验证每笔交易以识别出欺诈性使用。因此，开发出一种高效且有效的算法来检测信用卡欺诈至关重要。

目前通常是基于深度学习的方法来实现信用卡欺诈检测，然而该方法通常是仅采用卷积层或全连接层进行简单级联来提取特征，导致无法发现数据内部的深层特征，最终导致信用卡欺诈检测的准确性较低。

发明内容

本申请实施例提供了一种欺诈检测方法、装置、设备及可读存储介质，能够提高信用卡欺诈检测的准确性。

有鉴于此，本申请实施例提供了一种欺诈检测方法，所述方法包括：

获取待测用户的历史消费数据和待测消费数据；

对所述历史消费数据进行特征压缩，得到降维数据；

根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型；

将所述待测消费数据输入所述欺诈检测模型中，得到所述待测用户的欺诈检测结果。

可选地，所述对所述历史消费数据进行特征压缩，得到降维数据，包括：

根据所述历史消费数据计算得到协方差矩阵；

根据所述协方差矩阵计算得到特征值和所述特征值对应的特征向量；

从所述特征值中选取目标特征值；

根据所述目标特征值对应的特征向量将所述历史消费数据进行降维转换，得到降维数据。

可选地，所述残差网络模型包括残差块、平均池化层和全连接层，所述根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型，包括：

将所述降维数据输入所述残差块中进行特征提取，得到特征向量，所述残差块包括残差单元、注意力分支和残差连接；

将所述特征向量输入所述平均池化层中进行特征压缩，得到降维特征向量；

将所述降维特征向量输入全连接层进行分类，得到分类结果；

根据所述分类结果训练得到欺诈检测模型。

可选地，所述获取待测用户的历史消费数据和待测消费数据，包括：

获取所述待测用户的原始历史消费数据和原始待测消费数据；

对所述原始历史消费数据和原始待测消费数据进行预处理，得到所述待测用户的历史消费数据和待测消费数据，所述预处理包括数据清洗、数据填充和数据归一化。

可选地，在对所述历史消费数据进行特征压缩，得到降维数据之后，所述方法还包括：

确定所述降维数据中的少数样本；

计算所述少数样本到降维数据中所有样本的欧式距离；

根据所述欧式距离确定所述少数样本的近邻样本；

根据所述近邻样本和所述少数样本生成合成样本；

将所述合成样本加入所述降维数据中。

本申请实施例还提供了一种欺诈检测装置，所述装置包括：

获取单元，用于获取待测用户的历史消费数据和待测消费数据；

特征压缩单元，用于对所述历史消费数据进行特征压缩，得到降维数据；

训练单元，用于根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型；

检测单元，用于将所述待测消费数据输入所述欺诈检测模型中，得到所述待测用户的欺诈检测结果。

可选地，所述特征压缩单元，具体用于：

根据所述历史消费数据计算得到协方差矩阵；

从所述特征值中选取目标特征值；

可选地，所述残差网络模型包括残差块、平均池化层和全连接层，所述训练单元，具体用于：

根据所述分类结果训练得到欺诈检测模型。

本申请实施例还提供了一种计算机设备，包括：存储器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，以实现上述所述的任意一种欺诈检测方法；

所述总线系统用于连接所述存储器以及所述处理器，以使所述存储器以及所述处理器进行通信。

本申请实施例还提供了一种计算机可读存储介质，存储有指令，当其在计算机上运行时，使得计算机执行如上述所述的任意一种欺诈检测方法。

本申请实施例提供了一种欺诈检测方法，包括：获取待测用户的历史消费数据和待测消费数据；对所述历史消费数据进行特征压缩，得到降维数据；根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型；将所述待测消费数据输入所述欺诈检测模型中，得到所述待测用户的欺诈检测结果。可见，本申请由于在训练出欺诈检测模型时先将对历史消费数据进行特征压缩后得到的降维数据作为训练数据，可以避免历史消费数据中的不相关数据造成的干扰，并且通过对残差网络模型进行训练来得到欺诈检测模型，可以深度挖掘出数据内部信息量更大的隐藏特征，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种欺诈检测方法的流程示意图；

图2为本申请实施例提供的一种残差网络模型的结构示意图；

图3为本申请实施例提供的一种残差块的结构示意图；

图4为本申请实施例提供的一种欺诈检测装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

因此，针对上述问题，本申请实施例提供了一种欺诈检测方法、装置、设备及可读存储介质，能够提高信用卡欺诈检测的准确性。

请参阅图1，本申请实施例所提供的一种欺诈检测方法包括以下步骤。

S101、获取待测用户的历史消费数据和待测消费数据。

本实施例中，可以先获取待测用户的历史消费数据和待测消费数据。可以理解的是，为了实现对待测用户的信用卡欺诈检测，可以先从数据库中获取待测用户的历史消费数据和待测消费数据，其中历史消费数据中可以为消费者的历史信用卡消费数据，如交易记录、用户行为日志、登录日志、交易金额、交易时间、商户信息、地理位置等，其中可以包括不存在欺诈行为时的消费数据，还可以包括存在欺诈行为时的消费数据。待测消费数据可以为待测用户可能存在异常的历史信用卡消费数据。

在一种可能实现的方式中，可以获取所述待测用户的原始历史消费数据和原始待测消费数据；对所述原始历史消费数据和原始待测消费数据进行预处理，得到所述待测用户的历史消费数据和待测消费数据，所述预处理包括数据清洗、数据填充和数据归一化。可以理解的是，由于直接从数据库中获取的原始历史消费数据和原始待测消费数据可能存在异常值、重复记录和缺失值等，且可能存在数据格式或量纲不一致的问题，所以此时可以对原始历史消费数据和原始待测消费数据进行数据预处理。对于原始历史消费数据和原始待测消费数据中存在异常值和重复记录的数据，进行直接数据清洗；对于原始历史消费数据和原始待测消费数据中存在缺失值的数据，则需要采用数据填充的方法来填补，分别对数值型和非数值型两种属性数据进行处理。若缺失值值为数值型，则根据该属性在其他所有对象的取值的平均值来填充该缺失值；若缺失值为非数值型，可以用该属性在其他所有对象的取值次数最多的值，也即出现频率最高的值，来补齐该缺失的属性值。最后，由于在量纲不同的情况下不能反映样本中每一个特征的重要程度，因此可以对数据清洗和数据填充完的数据采用均值方差归一化法进行处理，以便于能够获取更多有效的数据作为训练数据，从而进一步提高信用卡欺诈检测的准确性。

S102、对所述历史消费数据进行特征压缩，得到降维数据。

本实施例中，在获取待测用户的历史消费数据后，可以对历史消费数据进行特征压缩，得到降维数据。可以理解的是，由于获取的待测用户的历史消费数据的数据量可能较为庞大，所以可以对历史消费数据进行特征压缩，具体可以为主成分分析(PrincipalComponent Analysis,PCA)，将历史消费数据的原始特征空间降低至较低维度，也即将历史消费数据转化为一个更为简洁的降维数据，该降维数据代表了历史消费数据的显著特征，根据该降维数据进行模型训练，可以大大减少欺诈检测模型的训练时间，并且可以提高欺诈检测模型训练效果，进一步提高信用卡欺诈检测的准确性。

在一种可能实现的方式中，根据所述历史消费数据计算得到协方差矩阵；根据所述协方差矩阵计算得到特征值和所述特征值对应的特征向量；从所述特征值中选取目标特征值；根据所述目标特征值对应的特征向量将所述历史消费数据进行降维转换，得到降维数据。

可以理解的是，在对历史消费数据进行特征压缩的过程中，首先可以根据历史消费数据进行协方差矩阵计算，具体可以如以下公式：

其中，z_k和x_i代表单个对象值，和/>代表平均值，n代表样本总数。协方差矩阵描述了数据中各个特征之间的关系，有利于分析出哪些特征具有较高的方差，即具有更多的有利信息。

接着可以根据协方差矩阵计算得到特征值和所述特征值对应的特征向量。这些特征值和特征向量为协方差矩阵的特征值和特征向量。特征向量表示主成分的方向，而特征值表示该方向的重要性或方差。

然后可以从特征值中选取出目标特征值，也即可以选择出主成分。具体地，根据特征值的大小对特征向量进行排序，然后选择前m个最大的特征值对应的特征向量，其中m是新数据集的维度数。

最后可以根据所述目标特征值对应的特征向量将所述历史消费数据进行降维转换，得到降维数据。具体地，使用选定的目标特征值对应的特征向量将历史消费数据转换到新的空间中，从而得到降维后的数据。

通过对历史消费数据进行特征压缩，可以对重要特征进行提取，去除不相关特征，大大减少了分类模型的训练时间，加速和改进了模型分类过程。

在一种可能实现的方式中，在得到降维数据之后，可以确定所述降维数据中的少数样本；计算所述少数样本到降维数据中所有样本的欧式距离；根据所述欧式距离确定所述少数样本的近邻样本；根据所述近邻样本和所述少数样本生成合成样本；将所述合成样本加入所述降维数据中。

可以理解的是，由于降维数据中正样本和负样本的数量可能存在高度不平衡的情况，也即不存在欺诈行为时的消费数据的数量与存在欺诈行为时的消费数据的数量存在较大差异，若采取随机过采样直接复制样本策略来增加少数类样本量，这容易导致模型出现过拟合现象。此时在得到降维数据之后，可以先确定所述降维数据中的少数样本，也即确定出数据量较少的是不存在欺诈行为时的消费数据还是存在欺诈行为时的消费数据。然后可以计算少数样本到降维数据中所有样本的欧式距离，再基于欧式距离确定出少数样本的近邻样本，近邻样本的数量可以为k个，k是预先设定的参数。再根据确定出的近邻样本和少数样本生成合成样本，具体可以为：

可以通过以上公式来合成新样本其过程可具体描述为：

从k个近邻中随机选择一个近邻x_i；对于当前样本x和近邻x_i之间的每个特征差异，计算其与一个在[0,1]范围内的随机数的乘积。将计算得到的值加到当前样本上，从而得到一个新的合成样本直至得到预设数量的合成样本。最后再将将原始的少数类样本和生成的合成样本合并，得到一个新的、平衡的降维数据，从而解决降维数据中正样本和负样本的数量可能存在高度不平衡的问题，提高降维数据的有效性，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

S103、根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型。

本实施例中，在得到降维数据后，可以根据降维数据对残差网络模型进行训练，得到欺诈检测模型。可以理解的是，残差网络模型可以由残差网络对卷积网络模型改造得到，也即残差网络模型中可以包括残差网络。具体地，如图2所示，残差网络模型可以包括残差块、平均池化层和全连接层，其中残差块可以为多个残差块。残差网络沿用卷积层堆叠的思想，主体网络以小尺寸卷积核的卷积层构建，且主体网络分为四个层级，每一层级由特定数量的残差块构成。平均池化层可以降低卷积层输出的特征向量实现特征压缩，还能起到一定程度上的平移不变性作用，实现特征融合。全连接层采用了全局连接的形式，即将该层中的每一个神经元与前一层中的所有神经元都进行连接，其作用在于通过整合这些局部特征来进一步提升神经网络的性能。可以先将降维数据输入由多个残差块组成的残差网络中进行特征提取，然后通过均池化层和全连接层输出信用卡欺诈分类结果。通过将降维数据输入到包括残差网络的残差网络模型中进行训练，可以深度挖掘出数据内部信息量更大的隐藏特征，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

在一种可能实现的方式中，可以将所述降维数据输入所述残差块中进行特征提取，得到特征向量；将所述特征向量输入所述平均池化层中进行特征压缩，得到降维特征向量；将所述降维特征向量输入全连接层进行分类，得到分类结果；根据所述分类结果训练得到欺诈检测模型。

可以理解的是，组成残差网络的残差块可以包括残差单元、注意力分支和残差，残差块具体可以表示为：

y＝F(x,W)+A(x)+h(x)；

其中，x表示残差块的输入特征，W为残差单元的权重矩阵，F(x,W)表示W和激活函数ReLU等非线性操作的输出，A(x)表示注意力分支的输出结果，h(x)表示残差连接。

残差单元由若干个权重层组成，如图3所示，权重层由卷积核大小固定的卷积层组成；并利用批量归一化(Batch Normalization，BN)操作加速网络的收敛速度以及ReLU激活函数加强网络的非线性和表征能力。

注意力分支主要通过压缩和激励完成，具体流程图如图4所示，其核心思想是通过显式地建模卷积特征的通道间依赖关系来增强特征的表示能力。

具体过程如下：

输入：为残差单元的输出，其尺度为H×W×C；

压缩(Squeeze)：将特征图进行全局平均池化,生成一个1×1×C的向量，这样其每个通道均只用一个数值表示。

激励(Excitation)：先将Squeeze得到的输出通过一个全连接层进行降维，然后通过一个ReLU激活函数。接着，将上一步的输出通过另一个全连接层(升维)并使用sigmoid激活函数，从而得到每个通道的权重。该权重可通过学习得到，用来显示建模所需要的特征相关性。

重新加权特征图：使用激励操作得到的通道权重乘以原始特征图，从而得到重新加权的特征图。

在残差网络中，层级内部的残差连接采用恒等残差连接，对于跨层级之间的残差连接需要采用投影残差连接来调整输入输出的各维度统一。

在通过降维数据输入所述残差块中进行特征提取，得到特征向量后，可以将特征向量输入平均池化层中进行特征压缩，得到降维特征向量，然后将降维特征向量输入全连接层中进行分类，得到分类结果。最后可以根据分类结果训练得到欺诈检测模型，具体可以通过构建损失函数的方式使得最后训练出的欺诈检测模型符合预设要求，以便于可以深度挖掘出数据内部信息量更大的隐藏特征，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

S104、将所述待测消费数据输入所述欺诈检测模型中，得到所述待测用户的欺诈检测结果。

本实施例中，在训练得到欺诈检测模型后，可以将待测消费数据输入欺诈检测模型中，得到待测用户的欺诈检测结果。可以理解的是，在根据待测用户的历史消费数据训练出欺诈检测模型后，可以将待测用户的待测消费数据输入到欺诈检测模型中，来得到待测用户的欺诈检测结果，其中欺诈检测结果可以包括存在欺诈行为或不存在欺诈行为。

由此可知，本申请实施例提供了一种欺诈检测方法，由于在训练出欺诈检测模型时先将对历史消费数据进行特征压缩后得到的降维数据作为训练数据，可以避免历史消费数据中的不相关数据造成的干扰，并且通过对残差网络模型进行训练来得到欺诈检测模型，可以深度挖掘出数据内部信息量更大的隐藏特征，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

请参阅图4，本申请实施例还提供了一种欺诈检测装置，所述装置包括：

获取单元401，用于获取待测用户的历史消费数据和待测消费数据；

特征压缩单元402，用于对所述历史消费数据进行特征压缩，得到降维数据；

训练单元403，用于根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型；

检测单元404，用于将所述待测消费数据输入所述欺诈检测模型中，得到所述待测用户的欺诈检测结果。

可选地，所述特征压缩单元402，具体用于：

根据所述历史消费数据计算得到协方差矩阵；

从所述特征值中选取目标特征值；

可选地，所述残差网络模型包括残差块、平均池化层和全连接层，所述训练单元403，具体用于：

根据所述分类结果训练得到欺诈检测模型。

可选地，所述获取单元401，具体用于：

可选地，所述装置还包括数据扩展单元，用于：

确定所述降维数据中的少数样本；

计算所述少数样本到降维数据中所有样本的欧式距离；

根据所述欧式距离确定所述少数样本的近邻样本；

根据所述近邻样本和所述少数样本生成合成样本；

将所述合成样本加入所述降维数据中。

由此可知，本申请实施例提供了一种欺诈检测装置，由于在训练出欺诈检测模型时先将对历史消费数据进行特征压缩后得到的降维数据作为训练数据，可以避免历史消费数据中的不相关数据造成的干扰，并且通过对残差网络模型进行训练来得到欺诈检测模型，可以深度挖掘出数据内部信息量更大的隐藏特征，使得最终训练出的欺诈检测模型具有更准确的分类性能，从而提高信用卡欺诈检测的准确性。

其中，所述存储器用于存储程序；

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种欺诈检测方法，其特征在于，所述方法包括：

获取待测用户的历史消费数据和待测消费数据；

对所述历史消费数据进行特征压缩，得到降维数据；

2.根据权利要求1所述的方法，其特征在于，所述对所述历史消费数据进行特征压缩，得到降维数据，包括：

根据所述历史消费数据计算得到协方差矩阵；

从所述特征值中选取目标特征值；

3.根据权利要求1所述的方法，其特征在于，所述残差网络模型包括残差块、平均池化层和全连接层，所述根据所述降维数据对残差网络模型进行训练，得到欺诈检测模型，包括：

根据所述分类结果训练得到欺诈检测模型。

4.根据权利要求1所述的方法，其特征在于，所述获取待测用户的历史消费数据和待测消费数据，包括：

5.根据权利要求1所述的方法，其特征在于，在对所述历史消费数据进行特征压缩，得到降维数据之后，所述方法还包括：

确定所述降维数据中的少数样本；

计算所述少数样本到降维数据中所有样本的欧式距离；

根据所述欧式距离确定所述少数样本的近邻样本；

根据所述近邻样本和所述少数样本生成合成样本；

将所述合成样本加入所述降维数据中。

6.一种欺诈检测装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述特征压缩单元，具体用于：

根据所述历史消费数据计算得到协方差矩阵；

从所述特征值中选取目标特征值；

8.根据权利要求6所述的装置，其特征在于，所述残差网络模型包括残差块、平均池化层和全连接层，所述训练单元，具体用于：

根据所述分类结果训练得到欺诈检测模型。

9.一种计算机设备，其特征在于，包括：存储器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，以实现权利要求1至5中任一项所述的方法；

10.一种计算机可读存储介质，其特征在于，存储有指令，当其在计算机上运行时，使得计算机执行如权利要求1至5中任一项所述的方法。