CN115618238A

CN115618238A - 基于参数偏移修正集成学习的信用卡欺诈检测方法

Info

Publication number: CN115618238A
Application number: CN202211602393.4A
Authority: CN
Inventors: 张震; 张金传; 刘利枚; 徐雪松; 杨俊丰; 刘星宝
Original assignee: Hunan University of Technology
Current assignee: Hunan University of Technology
Priority date: 2022-12-14
Filing date: 2022-12-14
Publication date: 2023-01-17
Anticipated expiration: 2042-12-14
Also published as: CN115618238B

Abstract

本申请适用于金融服务技术领域，提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法，包括：基于待标记信用卡交易数据的特征取值，计算信用卡交易训练数据中每个训练样本的初始权重；构造信用卡交易子分类器，基于该信用卡交易子分类器、训练样本的权重及给定的误分类代价，迭代更新样本权重和误分类代价，并计算子分类器的权重；迭代调整子分类器的权重，并利用信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据对应的交易中有无欺诈行为。本申请能提高欺诈检测性能。

Description

基于参数偏移修正集成学习的信用卡欺诈检测方法

技术领域

本申请属于金融服务技术领域，尤其涉及一种基于参数偏移修正集成学习的信用卡欺诈检测方法。

背景技术

信用卡欺诈检测技术基于机器学习方法标记存在欺诈风险的交易，在金融监管领域发挥重要作用。由于欺诈交易在信用卡交易中的占比较小，信用卡交易数据存在明显的类不平衡问题。传统的集成学习方法基于样本集合的总体分类精度评估分类器性能，在信用卡欺诈检测任务中倾向于将样本标记为非欺诈类别，无法有效识别欺诈交易。人们针对这一问题提出了代价敏感集成学习方法和重采样集成学习方法等能够准确识别欺诈交易的信用卡交易数据集成学习方法。这些方法通过构造并结合多个子分类器完成信用卡交易分类任务，其中：代价敏感集成学习方法通过最小化信用卡交易的误分类代价之和训练子分类器，并为欺诈交易分配更高的误分类代价以提高对这些交易的分类精度；重采样集成学习方法在训练每个子分类器时，采用扩大欺诈交易集合规模的过采样技术或减小非欺诈交易集合规模的欠采样技术，以使得信用卡交易数据的类别分布达到平衡。

在基于集成学习方法构造信用卡欺诈检测模型时，子分类器的性能对误分类代价和采样率等学习参数较为敏感。例如：在利用代价敏感方法处理学习任务时，无法基于不合理的误分类代价构造有效的子分类器；在基于重采样方法调整样本集合时，只有选取符合信用卡交易类别分布的采样率才能达到平衡样本集合的效果。现有的信用卡交易数据集成学习方法无法在有限时间内为每个子分类器计算合理的误分类代价和采样率。这些方法通常基于一组相同的误分类代价或采样率训练每个子分类器，这使得某些子分类器无法得到合理的学习参数，严重影响信用卡交易数据集成学习性能，造成欺诈检测性能低。

发明内容

本申请实施例提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法，可以解决欺诈检测性能低的问题。

本申请实施例提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法，包括：

基于待标记信用卡交易数据的特征取值，计算信用卡交易训练数据中每个训练样本的初始权重；

使用支持向量机算法构建信用卡交易子分类器，并将信用卡交易子分类器迭代预设迭代次数；其中，在每迭代得到一代信用卡交易子分类器时，利用该信用卡交易子分类器对训练样本的标记结果，确定该信用卡交易子分类器对欺诈交易数据的偏置程度，并根据偏置程度修正训练样本的误分类代价；基于训练样本的误分类代价以及该信用卡交易子分类器对训练样本的标记结果，更新训练样本的权重，并根据该信用卡交易子分类器对训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和训练样本的权重，计算该信用卡交易子分类器的权重；

对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数，并利用每代信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据的欺诈检测结果；欺诈检测结果用于指示待标记信用卡交易数据对应的交易中有欺诈行为或者无欺诈行为。

可选的，基于待标记信用卡交易数据的特征取值，计算信用卡交易训练数据中每个训练样本的初始权重，包括：

通过公式

计算信用卡交易训练数据中第

个训练样本的初始权重

；

其中，

表示信用卡交易训练数据中第

个训练样本

的第

个特征取值，

，

表示信用卡交易训练数据中训练样本的数量，

，

表示待标记信用卡交易数据中特征的数量，

，

表示待标记信用卡交易数据的第

个特征取值的范围，

表示待标记信用卡交易数据中第

条待标记信用卡交易

的第

个特征取值，

，

表示待标记信用卡交易数据中待标记信用卡交易的数量，

表示连续型特征的索引集合，

，

表示离散型特征的索引集合，

。

可选的，利用信用卡交易子分类器对训练样本的标记结果，确定信用卡交易子分类器对欺诈交易数据的偏置程度，包括：

通过公式

计算第

次迭代得到的信用卡交易子分类器

对欺诈交易的训练准确率

；

；

通过公式

计算第

次迭代得到的信用卡交易子分类器

对非欺诈交易的训练准确率

；

通过公式

计算第

次迭代得到的信用卡交易子分类器

对欺诈交易数据的偏置程度

；

其中，

表示第

个训练样本对应的交易类型标签，

表示交易中有欺诈行为，

表示交易中无欺诈行为，

表示

对第

个训练样本的标记结果，

表示训练样本的数量，

表示第

次迭代中第

个训练样本的权重，

表示第

个训练样本的初始权重，

表示第

次迭代中第

个训练样本的误分类代价，

。

可选的，根据偏置程度修正训练样本的误分类代价，包括：

通过公式

修正第

次迭代中第

个训练样本的误分类代价

，得到第

次迭代中第

个训练样本的误分类代价

；其中，

表示

内的学习参数。

可选的，基于训练样本的误分类代价以及信用卡交易子分类器对训练样本的标记结果，更新训练样本的权重，包括：

通过公式

更新第

个训练样本的权重，得到第

次迭代中第

个训练样本的权重

；

其中，

表示第

次迭代中的归一化因子，

，

表示第

次迭代中第

个训练样本的权重，

表示第

次迭代中第

个训练样本的误分类代价，

表示

的权重。

可选的，根据信用卡交易子分类器对训练样本的标记结果、信用卡交易子分类器对应的误分类代价和训练样本的权重，计算信用卡交易子分类器的权重，包括：

通过公式

得到信用卡交易子分类器

的权重

。

可选的，对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数，包括：

对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票，得到待标记信用卡交易数据的加权集成预测结果；

根据加权集成预测结果估计信用卡交易子分类器

在

的第

次迭代中的预测精度

；

，

表示预设迭代次数，

，

表示预设的最大更新次数；

根据信用卡交易子分类器

在

的第

次迭代中的预测精度

，更新信用卡交易子分类器

的权重；

返回对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票，得到待标记信用卡交易数据的加权集成预测结果的步骤，直至信用卡交易子分类器

的权重的迭代更新次数达到预设的最大更新次数。

可选的，对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票，得到待标记信用卡交易数据的加权集成预测结果，包括：

通过公式

对每代信用卡交易子分类器对待标记信用卡交易数据的第

条待标记信用卡交易

的标记结果，进行加权投票，得到在

的第

次迭代中第

条待标记信用卡交易

的加权集成预测结果

；

其中，

，

表示预设的最大更新次数，

表示信用卡交易子分类器

对待标记信用卡交易数据的第

条待标记信用卡交易

的标记结果，

表示

对

的标记结果为

中有欺诈行为，

表示

对

的标记结果为

中无欺诈行为，

表示在

的第

次迭代中的权重，

。

可选的，根据加权集成预测结果估计信用卡交易子分类器

在

的第

次迭代中的预测精度

，包括：

通过公式

估计信用卡交易子分类器

在

的第

次迭代中的预测精度

；

根据信用卡交易子分类器

在

的第

次迭代中的预测精度

，更新信用卡交易子分类器

的权重，包括：

通过公式

更新信用卡交易子分类器

的权重，得到

在第

次迭代中的权重

。

可选的，利用每代信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据的欺诈检测结果，包括：

若

，则确定待标记信用卡交易数据的第

条待标记信用卡交易

中有欺诈行为；

若

，则确定待标记信用卡交易数据的第

条待标记信用卡交易

中无欺诈行为。

本申请的上述方案有如下的有益效果：

在本申请的实施例中，通过利用信用卡交易子分类器对训练样本的标记结果，确定信用卡交易子分类器对欺诈交易数据的偏置程度，并根据该偏置程度自适应地修正训练样本的误分类代价，克服了现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题，同时基于修正的误分类代价计算信用卡交易子分类器的权重，并通过调整信用卡交易子分类器的权重迭代优化子分类器对待标记信用卡交易数据的欺诈检测结果，使其更加接近于待标记信用卡交易数据的真实类别标签，从而提高欺诈检测性能。

本申请的其它有益效果将在随后的具体实施方式部分予以详细说明。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的基于参数偏移修正集成学习的信用卡欺诈检测方法的流程图；

图2为本申请一实验中Kaggle信用卡交易数据集上DCBoost、AdaC2、RUSBoost和SMOTEBoost的实验结果对比图一；

图3为本申请一实验中Kaggle信用卡交易数据集上DCBoost、AdaC2、RUSBoost和SMOTEBoost的实验结果对比图二；

图4为本申请一实验中Kaggle信用卡交易数据集上DCBoost、AdaC2、RUSBoost和SMOTEBoost的实验结果对比图三。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

针对目前欺诈检测性能低的问题，本申请提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法，该方法通过利用信用卡交易子分类器对训练样本的标记结果，确定信用卡交易子分类器对欺诈交易数据的偏置程度，并根据该偏置程度自适应地修正训练样本的误分类代价，避免了现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题，同时基于修正的误分类代价计算信用卡交易子分类器的权重，并通过调整信用卡交易子分类器的权重迭代优化子分类器对待标记信用卡交易数据的欺诈检测结果，使其更加接近于待标记信用卡交易数据的真实类别标签，从而提高欺诈检测性能。

下面结合具体实施例对上述基于参数偏移修正集成学习的信用卡欺诈检测方法进行说明。

如图1所示，本申请提供的基于参数偏移修正集成学习的信用卡欺诈检测方法包括如下步骤：

步骤11，基于待标记信用卡交易数据的特征取值，计算信用卡交易训练数据中每个训练样本的初始权重。

上述待标记信用卡交易数据包括

条待标记信用卡交易，在一些场景中，待标记信用卡交易可以记为交易特征向量，待标记信用卡交易数据中的第

条待标记信用卡交易可以记为交易特征向量

，

。上述特征取值可以为时间、金额、账户类别、交易类型等特征取值。

上述信用卡交易训练数据包括

个训练样本，每个训练样本为一条信用卡交易，在一些场景中，训练样本可以记为交易特征向量，信用卡交易训练数据中的第

个训练样本可以记为交易特征向量

或训练样本

，

。

在本申请的一些实施例中，可基于时间、金额、账户类别、交易类型等特征取值估计训练样本与待标记信用卡交易的相似度，并基于该相似度计算训练样本初始权重, 使得每个训练样本的初始权重与该样本同待标记信用卡交易数据的相似度正相关，以提高欺诈检测性能。

步骤12，使用支持向量机算法构建信用卡交易子分类器，并将信用卡交易子分类器迭代预设迭代次数。其中，在每迭代得到一代信用卡交易子分类器时，利用该信用卡交易子分类器对训练样本的标记结果，确定该信用卡交易子分类器对欺诈交易数据的偏置程度，并根据偏置程度修正训练样本的误分类代价；基于训练样本的误分类代价以及该信用卡交易子分类器对训练样本的标记结果，更新训练样本的权重，并根据该信用卡交易子分类器对训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和训练样本的权重，计算该信用卡交易子分类器的权重。

在本申请的一些实施例中，具体可使用支持向量机工具包（LIBSVM）中实现的支持向量机算法（支持向量机算法为一种子分类器构造算法）构建信用卡交易子分类器（该子分类器可理解为初始信用卡交易子分类器），并将信用卡交易子分类器迭代预设迭代次数。

其中，上述预设迭代次数可根据实际情况进行设定，例如设定为40次。

在本申请的一些实施例中，为克服现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题，需针对每轮迭代得到的每代信用卡交易子分类器，基于该信用卡交易子分类器对训练样本的标记结果，确定信用卡交易子分类器对欺诈交易数据的偏置程度，并基于该偏置程度修正训练样本的误分类代价、更新训练样本的权重，计算该信用卡交易子分类器的权重。

值得一提的是，为提高欺诈检测性能，在对信用卡交易子分类器进行迭代时，基于加权训练样本构造下一代信用卡交易子分类器。

步骤13，对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数，并利用每代信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据的欺诈检测结果。

上述欺诈检测结果用于指示待标记信用卡交易数据对应的交易中有欺诈行为或者无欺诈行为。

需要说明的是，对于待标记信用卡交易数据中的每条待标记信用卡交易，均需利用每代信用卡交易子分类器的权重的最终更新值确定该条待标记信用卡交易中有无欺诈行为。

值得一提的是，本申请的上述信用卡欺诈检测方法通过利用信用卡交易子分类器对训练样本的标记结果，确定信用卡交易子分类器对欺诈交易数据的偏置程度，并根据该偏置程度自适应地修正训练样本的误分类代价，避免了现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题，同时基于修正的误分类代价计算信用卡交易子分类器的权重，并通过调整信用卡交易子分类器的权重迭代优化子分类器对待标记信用卡交易数据的欺诈检测结果，使其更加接近于待标记信用卡交易数据的真实类别标签，从而提高欺诈检测性能。

下面结合具体实施例对训练样本的初始权重的计算过程进行示例性说明。

在本申请的一些实施例中，可令

表示规模为

的训练样本集合，

表示上述信用卡交易训练数据，

表示规模为

的待标记交易集合（即上述待标记信用卡交易数据），其中，

和

均表示交易特征向量，

表示交易类型标签（

，

表示交易中有欺诈行为，

表示交易中无欺诈行为）。

在本申请的一些实施例中，上述步骤11，基于待标记信用卡交易数据的特征取值，计算信用卡交易训练数据中每个训练样本的初始权重的具体实现方式可以为：

通过公式

计算信用卡交易训练数据中第

个训练样本的初始权重

。

其中，

表示信用卡交易训练数据中第

个训练样本

的第

个特征取值，

，

表示信用卡交易训练数据中训练样本的数量，

，

表示待标记信用卡交易数据中特征的数量，

，

表示待标记信用卡交易数据的第

个特征取值的范围，

表示待标记信用卡交易数据中第

条待标记信用卡交易

的第

个特征取值，

，

表示待标记信用卡交易数据中待标记信用卡交易的数量，

表示连续型特征的索引集合，

，

表示离散型特征的索引集合，

。

下面结合具体实施例对偏置程度的计算过程、误分类代价的修正过程、信用卡交易子分类器的权重的计算过程进行示例性说明。

在本申请的一些实施例中，对于每代信用卡交易子分类器，确定该信用卡交易子分类器对欺诈交易数据的偏置程度的具体实现方式包括如下步骤：

步骤1.1，通过公式

计算第

次迭代得到的信用卡交易子分类器

对欺诈交易的训练准确率

；

，

，

表示预设迭代次数。

步骤1.2，通过公式

计算第

次迭代得到的信用卡交易子分类器

对非欺诈交易的训练准确率

。

步骤1.3，通过公式

计算第

次迭代得到的信用卡交易子分类器

对欺诈交易数据的偏置程度

。

其中，

表示第

个训练样本对应的交易类型标签，

表示交易中有欺诈行为，

表示交易中无欺诈行为，

表示

对第

个训练样本的标记结果，

表示训练样本的数量，

表示第

次迭代中第

个训练样本的权重，

表示第

个训练样本的初始权重，

表示第

次迭代中第

个训练样本的误分类代价，

。

在本申请的一些实施例中，对于每代信用卡交易子分类器，根据该信用卡交易子分类器对应的偏置程度修正训练样本的误分类代价的具体实现方式为：

通过公式

修正第

次迭代中第

个训练样本的误分类代价

，得到第

次迭代中第

个训练样本的误分类代价

；其中，

表示

内的学习参数。

在本申请的一些实施例中，对于每代信用卡交易子分类器，基于该信用卡交易子分类器对应的训练样本的误分类代价以及该信用卡交易子分类器对训练样本的标记结果，更新训练样本的权重的具体实现方式为：

通过公式

更新第

个训练样本的权重，得到第

次迭代中第

个训练样本的权重

。

其中

表示第

次迭代中的归一化因子，

，

表示第

次迭代中第

个训练样本的权重，

表示第

次迭代中第

个训练样本的误分类代价，

表示

的权重。

在本申请的一些实施例中，对于每代信用卡交易子分类器，根据该信用卡交易子分类器对训练样本的标记结果、信用卡交易子分类器对应的误分类代价和训练样本的权重，计算信用卡交易子分类器的权重的具体实现方式为：通过公式

得到信用卡交易子分类器

的权重

，

。

下面结合具体实施例对信用卡交易子分类器的权重进行迭代更新过程进行示例性说明。

在本申请的一些实施例中，对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数的具体实现方式包括如下步骤：

步骤2.1，对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票，得到待标记信用卡交易数据的加权集成预测结果。

在本申请的一些实施例中，通过公式

对每代信用卡交易子分类器对待标记信用卡交易数据的第

条待标记信用卡交易

的标记结果，进行加权投票，得到在

的第

次迭代中第

条待标记信用卡交易

的加权集成预测结果

。

其中，

，

，

表示预设的最大更新次数（

的取值可根据实际情况进行设定，例如设为20），

表示信用卡交易子分类器

对待标记信用卡交易数据的第

条待标记信用卡交易

的标记结果，

表示

对

的标记结果为

中有欺诈行为，

表示

对

的标记结果为

中无欺诈行为，

表示在

的第

次迭代中的权重，

，

。

步骤2.2，根据加权集成预测结果估计信用卡交易子分类器

在

的第

次迭代中的预测精度

；

，

表示预设迭代次数，

，

表示预设的最大更新次数。

在本申请的一些实施例中，可通过公式

估计信用卡交易子分类器

在

的第

次迭代中的预测精度

，

。

步骤2.3，根据信用卡交易子分类器

在

的第

次迭代中的预测精度

，更新信用卡交易子分类器

的权重。

在本申请的一些实施例中，可通过公式

更新信用卡交易子分类器

的权重，得到

在第

次迭代中的权重

，

。

步骤2.4，返回步骤2.1，直至信用卡交易子分类器

的权重的迭代更新次数达到预设的最大更新次数，

。

在本申请的一些实施例中，在每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数后，若

，则确定待标记信用卡交易数据的第

条待标记信用卡交易

中有欺诈行为；而若

，则确定待标记信用卡交易数据的第

条待标记信用卡交易

中无欺诈行为。

为便于理解上述信用卡欺诈检测方法，在此以一具体实验数据对上述信用卡欺诈检测方法的效果进行说明。

在该实验中，

设为40，

设为20，在Kaggle信用卡交易数据集上进行了10次十折交叉验证，实验结果如图2至图4所示。该结果表明，从如图2所示的准确率（Precision）对比图、如图3所示的召回率（Recall）对比图以及如图4所示的综合评价指标（F-Measure）对比图来看，本申请提供的信用卡欺诈检测方法（简称DCBoost）与2型代价敏感集成学习（AdaC2）、随机欠采样集成学习（RUSBoost）、合成过采样集成学习（SMOTEBoost）等现有的集成学习方法相比，具有更好的信用卡欺诈交易识别性能。

以上所述是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种基于参数偏移修正集成学习的信用卡欺诈检测方法，其特征在于，包括：

使用支持向量机算法构建信用卡交易子分类器，并将所述信用卡交易子分类器迭代预设迭代次数；其中，在每迭代得到一代信用卡交易子分类器时，利用该信用卡交易子分类器对所述训练样本的标记结果，确定该信用卡交易子分类器对欺诈交易数据的偏置程度，并根据所述偏置程度修正所述训练样本的误分类代价；基于所述训练样本的误分类代价以及该信用卡交易子分类器对所述训练样本的标记结果，更新所述训练样本的权重，并根据该信用卡交易子分类器对所述训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和所述训练样本的权重，计算该信用卡交易子分类器的权重；

对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数，并利用每代信用卡交易子分类器的权重的最终更新值确定所述待标记信用卡交易数据的欺诈检测结果；所述欺诈检测结果用于指示所述待标记信用卡交易数据对应的交易中有欺诈行为或者无欺诈行为。

2.根据权利要求1所述的方法，其特征在于，所述基于待标记信用卡交易数据的特征取值，计算信用卡交易训练数据中每个训练样本的初始权重，包括：

通过公式

计算信用卡交易训练数据中第

个训练样本的初始权重

；

其中，

表示信用卡交易训练数据中第

个训练样本

的第

个特征取值，

，

表示信用卡交易训练数据中训练样本的数量，

，

表示待标记信用卡交易数据中特征的数量，

，

表示待标记信用卡交易数据的第

个特征取值的范围，

表示待标记信用卡交易数据中第

条待标记信用卡交易

的第

个特征取值，

，

表示待标记信用卡交易数据中待标记信用卡交易的数量，

表示连续型特征的索引集合，

，

表示离散型特征的索引集合，

。

3.根据权利要求2所述的方法，其特征在于，所述利用该信用卡交易子分类器对所述训练样本的标记结果，确定该信用卡交易子分类器对欺诈交易数据的偏置程度，包括：

通过公式

计算第

次迭代得到的信用卡交易子分类器

对欺诈交易的训练准确率

；

；

通过公式

计算第

次迭代得到的信用卡交易子分类器

对非欺诈交易的训练准确率

；

通过公式

计算第

次迭代得到的信用卡交易子分类器

对欺诈交易数据的偏置程度

；

其中，

表示第

个训练样本对应的交易类型标签，

表示交易中有欺诈行为，

表示交易中无欺诈行为，

表示

对第

个训练样本的标记结果，

表示训练样本的数量，

表示第

次迭代中第

个训练样本的权重，

表示第

个训练样本的初始权重，

表示第

次迭代中第

个训练样本的误分类代价，

。

4.根据权利要求3所述的方法，其特征在于，所述根据所述偏置程度修正所述训练样本的误分类代价，包括：

通过公式

修正第

次迭代中第

个训练样本的误分类代价

，得到第

次迭代中第

个训练样本的误分类代价

；其中，

表示

内的学习参数。

5.根据权利要求4所述的方法，其特征在于，所述基于所述训练样本的误分类代价以及该信用卡交易子分类器对所述训练样本的标记结果，更新所述训练样本的权重，包括：

通过公式

更新第

个训练样本的权重，得到第

次迭代中第

个训练样本的权重

；

其中，

表示第

次迭代中的归一化因子，

，

表示第

次迭代中第

个训练样本的权重，

表示第

次迭代中第

个训练样本的误分类代价，

表示

的权重。

6.根据权利要求5所述的方法，其特征在于，所述根据该信用卡交易子分类器对所述训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和所述训练样本的权重，计算该信用卡交易子分类器的权重，包括：

通过公式

得到信用卡交易子分类器

的权重

。

7.根据权利要求6所述的方法，其特征在于，所述对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数，包括：

对每代信用卡交易子分类器对所述待标记信用卡交易数据的标记结果进行加权投票，得到所述待标记信用卡交易数据的加权集成预测结果；

根据所述加权集成预测结果估计信用卡交易子分类器

在

的第

次迭代中的预测精度

；

，

表示预设迭代次数，

，

表示预设的最大更新次数；

根据信用卡交易子分类器

在

的第

次迭代中的预测精度

，更新信用卡交易子分类器

的权重；

返回所述对每代信用卡交易子分类器对所述待标记信用卡交易数据的标记结果进行加权投票，得到所述待标记信用卡交易数据的加权集成预测结果的步骤，直至信用卡交易子分类器

的权重的迭代更新次数达到预设的最大更新次数。

8.根据权利要求7所述的方法，其特征在于，所述对每代信用卡交易子分类器对所述待标记信用卡交易数据的标记结果进行加权投票，得到所述待标记信用卡交易数据的加权集成预测结果，包括：

通过公式

对每代信用卡交易子分类器对待标记信用卡交易数据的第

条待标记信用卡交易

的标记结果，进行加权投票，得到在

的第

次迭代中第

条待标记信用卡交易

的加权集成预测结果

；

其中，

，

表示预设的最大更新次数，

表示信用卡交易子分类器

对待标记信用卡交易数据的第

条待标记信用卡交易

的标记结果，

表示

对

的标记结果为

中有欺诈行为，

表示

对

的标记结果为

中无欺诈行为，

表示在

的第

次迭代中的权重，

。

9.根据权利要求8所述的方法，其特征在于，所述根据所述加权集成预测结果估计信用卡交易子分类器

在

的第

次迭代中的预测精度

，包括：

通过公式

估计信用卡交易子分类器

在

的第

次迭代中的预测精度

；

根据信用卡交易子分类器

在

的第

次迭代中的预测精度

，更新信用卡交易子分类器

的权重，包括：

通过公式

更新信用卡交易子分类器

的权重，得到

在第

次迭代中的权重

。

10.根据权利要求9所述的方法，其特征在于，所述利用每代信用卡交易子分类器的权重的最终更新值确定所述待标记信用卡交易数据的欺诈检测结果，包括：

若

，则确定待标记信用卡交易数据的第

条待标记信用卡交易

中有欺诈行为；

若

，则确定待标记信用卡交易数据的第

条待标记信用卡交易

中无欺诈行为。