CN115618238A - 基于参数偏移修正集成学习的信用卡欺诈检测方法 - Google Patents

基于参数偏移修正集成学习的信用卡欺诈检测方法 Download PDF

Info

Publication number
CN115618238A
CN115618238A CN202211602393.4A CN202211602393A CN115618238A CN 115618238 A CN115618238 A CN 115618238A CN 202211602393 A CN202211602393 A CN 202211602393A CN 115618238 A CN115618238 A CN 115618238A
Authority
CN
China
Prior art keywords
credit card
card transaction
sub
classifiers
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211602393.4A
Other languages
English (en)
Other versions
CN115618238B (zh
Inventor
张震
张金传
刘利枚
徐雪松
杨俊丰
刘星宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN202211602393.4A priority Critical patent/CN115618238B/zh
Publication of CN115618238A publication Critical patent/CN115618238A/zh
Application granted granted Critical
Publication of CN115618238B publication Critical patent/CN115618238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请适用于金融服务技术领域,提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法,包括:基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重;构造信用卡交易子分类器,基于该信用卡交易子分类器、训练样本的权重及给定的误分类代价,迭代更新样本权重和误分类代价,并计算子分类器的权重;迭代调整子分类器的权重,并利用信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据对应的交易中有无欺诈行为。本申请能提高欺诈检测性能。

Description

基于参数偏移修正集成学习的信用卡欺诈检测方法
技术领域
本申请属于金融服务技术领域,尤其涉及一种基于参数偏移修正集成学习的信用卡欺诈检测方法。
背景技术
信用卡欺诈检测技术基于机器学习方法标记存在欺诈风险的交易,在金融监管领域发挥重要作用。由于欺诈交易在信用卡交易中的占比较小,信用卡交易数据存在明显的类不平衡问题。传统的集成学习方法基于样本集合的总体分类精度评估分类器性能,在信用卡欺诈检测任务中倾向于将样本标记为非欺诈类别,无法有效识别欺诈交易。人们针对这一问题提出了代价敏感集成学习方法和重采样集成学习方法等能够准确识别欺诈交易的信用卡交易数据集成学习方法。这些方法通过构造并结合多个子分类器完成信用卡交易分类任务,其中:代价敏感集成学习方法通过最小化信用卡交易的误分类代价之和训练子分类器,并为欺诈交易分配更高的误分类代价以提高对这些交易的分类精度;重采样集成学习方法在训练每个子分类器时,采用扩大欺诈交易集合规模的过采样技术或减小非欺诈交易集合规模的欠采样技术,以使得信用卡交易数据的类别分布达到平衡。
在基于集成学习方法构造信用卡欺诈检测模型时,子分类器的性能对误分类代价和采样率等学习参数较为敏感。例如:在利用代价敏感方法处理学习任务时,无法基于不合理的误分类代价构造有效的子分类器;在基于重采样方法调整样本集合时,只有选取符合信用卡交易类别分布的采样率才能达到平衡样本集合的效果。现有的信用卡交易数据集成学习方法无法在有限时间内为每个子分类器计算合理的误分类代价和采样率。这些方法通常基于一组相同的误分类代价或采样率训练每个子分类器,这使得某些子分类器无法得到合理的学习参数,严重影响信用卡交易数据集成学习性能,造成欺诈检测性能低。
发明内容
本申请实施例提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法,可以解决欺诈检测性能低的问题。
本申请实施例提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法,包括:
基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重;
使用支持向量机算法构建信用卡交易子分类器,并将信用卡交易子分类器迭代预设迭代次数;其中,在每迭代得到一代信用卡交易子分类器时,利用该信用卡交易子分类器对训练样本的标记结果,确定该信用卡交易子分类器对欺诈交易数据的偏置程度,并根据偏置程度修正训练样本的误分类代价;基于训练样本的误分类代价以及该信用卡交易子分类器对训练样本的标记结果,更新训练样本的权重,并根据该信用卡交易子分类器对训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和训练样本的权重,计算该信用卡交易子分类器的权重;
对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数,并利用每代信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据的欺诈检测结果;欺诈检测结果用于指示待标记信用卡交易数据对应的交易中有欺诈行为或者无欺诈行为。
可选的,基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重,包括:
通过公式
Figure 112990DEST_PATH_IMAGE002
计算信用卡交易训练数据中第
Figure DEST_PATH_IMAGE003
个训练样本的初始权重
Figure DEST_PATH_IMAGE005
其中,
Figure 457122DEST_PATH_IMAGE006
表示信用卡交易训练数据中第
Figure 874328DEST_PATH_IMAGE003
个训练样本
Figure DEST_PATH_IMAGE007
的第
Figure 45546DEST_PATH_IMAGE008
个特征取值,
Figure DEST_PATH_IMAGE009
Figure 813782DEST_PATH_IMAGE010
表示信用卡交易训练数据中训练样本的数量,
Figure 790965DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
表示待标记信用卡交易数据中特征的数量,
Figure 357951DEST_PATH_IMAGE014
Figure 903333DEST_PATH_IMAGE016
表示待标记信用卡交易数据的第
Figure 17919DEST_PATH_IMAGE008
个特征取值的范围,
Figure DEST_PATH_IMAGE017
表示待标记信用卡交易数据中第
Figure 470897DEST_PATH_IMAGE018
条待标记信用卡交易
Figure DEST_PATH_IMAGE019
的第
Figure 128275DEST_PATH_IMAGE008
个特征取值,
Figure DEST_PATH_IMAGE021
Figure 874251DEST_PATH_IMAGE022
表示待标记信用卡交易数据中待标记信用卡交易的数量,
Figure DEST_PATH_IMAGE023
表示连续型特征的索引集合,
Figure 882659DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
表示离散型特征的索引集合,
Figure DEST_PATH_IMAGE027
可选的,利用信用卡交易子分类器对训练样本的标记结果,确定信用卡交易子分类器对欺诈交易数据的偏置程度,包括:
通过公式
Figure DEST_PATH_IMAGE029
计算第
Figure 280273DEST_PATH_IMAGE030
次迭代得到的信用卡交易子分类器
Figure DEST_PATH_IMAGE031
对欺诈交易的训练准确率
Figure DEST_PATH_IMAGE033
Figure DEST_PATH_IMAGE035
通过公式
Figure 765393DEST_PATH_IMAGE036
计算第
Figure 777212DEST_PATH_IMAGE030
次迭代得到的信用卡交易子分类器
Figure 476177DEST_PATH_IMAGE031
对非欺诈交易的训练准确率
Figure DEST_PATH_IMAGE037
通过公式
Figure 5379DEST_PATH_IMAGE038
计算第
Figure 230824DEST_PATH_IMAGE030
次迭代得到的信用卡交易子分类器
Figure 787445DEST_PATH_IMAGE031
对欺诈交易数据的偏置程度
Figure DEST_PATH_IMAGE039
其中,
Figure 301603DEST_PATH_IMAGE040
表示第
Figure 103337DEST_PATH_IMAGE003
个训练样本对应的交易类型标签,
Figure DEST_PATH_IMAGE041
表示交易中有欺诈行为,
Figure 589813DEST_PATH_IMAGE042
表示交易中无欺诈行为,
Figure DEST_PATH_IMAGE043
表示
Figure 114073DEST_PATH_IMAGE031
对第
Figure 177844DEST_PATH_IMAGE003
个训练样本的标记结果,
Figure 517689DEST_PATH_IMAGE010
表示训练样本的数量,
Figure 717726DEST_PATH_IMAGE044
表示第
Figure 383194DEST_PATH_IMAGE030
次迭代中第
Figure 403103DEST_PATH_IMAGE003
个训练样本的权重,
Figure DEST_PATH_IMAGE045
表示第
Figure 546639DEST_PATH_IMAGE003
个训练样本的初始权重,
Figure 601183DEST_PATH_IMAGE046
表示第
Figure 670508DEST_PATH_IMAGE030
次迭代中第
Figure 443292DEST_PATH_IMAGE003
个训练样本的误分类代价,
Figure DEST_PATH_IMAGE047
可选的,根据偏置程度修正训练样本的误分类代价,包括:
通过公式
Figure 921678DEST_PATH_IMAGE048
修正第
Figure 971673DEST_PATH_IMAGE030
次迭代中第
Figure 103577DEST_PATH_IMAGE003
个训练样本的误分类代价
Figure 630503DEST_PATH_IMAGE046
,得到第
Figure DEST_PATH_IMAGE049
次迭代中第
Figure 912580DEST_PATH_IMAGE003
个训练样本的误分类代价
Figure 817082DEST_PATH_IMAGE050
;其中,
Figure DEST_PATH_IMAGE051
表示
Figure 493789DEST_PATH_IMAGE052
内的学习参数。
可选的,基于训练样本的误分类代价以及信用卡交易子分类器对训练样本的标记结果,更新训练样本的权重,包括:
通过公式
Figure DEST_PATH_IMAGE053
更新第
Figure 647689DEST_PATH_IMAGE003
个训练样本的权重,得到第
Figure 107358DEST_PATH_IMAGE049
次迭代中第
Figure 991001DEST_PATH_IMAGE003
个训练样本的权重
Figure 605653DEST_PATH_IMAGE054
其中,
Figure DEST_PATH_IMAGE055
表示第
Figure 918954DEST_PATH_IMAGE030
次迭代中的归一化因子,
Figure 510210DEST_PATH_IMAGE056
Figure 248359DEST_PATH_IMAGE044
表示第
Figure 768333DEST_PATH_IMAGE030
次迭代中第
Figure 224722DEST_PATH_IMAGE003
个训练样本的权重,
Figure 855555DEST_PATH_IMAGE046
表示第
Figure 979368DEST_PATH_IMAGE030
次迭代中第
Figure 670244DEST_PATH_IMAGE003
个训练样本的误分类代价,
Figure DEST_PATH_IMAGE057
表示
Figure 259269DEST_PATH_IMAGE031
的权重。
可选的,根据信用卡交易子分类器对训练样本的标记结果、信用卡交易子分类器对应的误分类代价和训练样本的权重,计算信用卡交易子分类器的权重,包括:
通过公式
Figure 818426DEST_PATH_IMAGE058
得到信用卡交易子分类器
Figure 734430DEST_PATH_IMAGE031
的权重
Figure 127365DEST_PATH_IMAGE057
可选的,对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数,包括:
对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票,得到待标记信用卡交易数据的加权集成预测结果;
根据加权集成预测结果估计信用卡交易子分类器
Figure 699292DEST_PATH_IMAGE031
Figure 796561DEST_PATH_IMAGE057
的第
Figure DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 973595DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
Figure 35967DEST_PATH_IMAGE062
表示预设迭代次数,
Figure DEST_PATH_IMAGE063
Figure 360769DEST_PATH_IMAGE064
表示预设的最大更新次数;
根据信用卡交易子分类器
Figure 261729DEST_PATH_IMAGE031
Figure 824428DEST_PATH_IMAGE057
的第
Figure 152642DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 168002DEST_PATH_IMAGE060
,更新信用卡交易子分类器
Figure 810336DEST_PATH_IMAGE031
的权重;
返回对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票,得到待标记信用卡交易数据的加权集成预测结果的步骤,直至信用卡交易子分类器
Figure 352176DEST_PATH_IMAGE031
的权重的迭代更新次数达到预设的最大更新次数。
可选的,对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票,得到待标记信用卡交易数据的加权集成预测结果,包括:
通过公式
Figure DEST_PATH_IMAGE065
对每代信用卡交易子分类器对待标记信用卡交易数据的第
Figure 756350DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 524586DEST_PATH_IMAGE066
的标记结果,进行加权投票,得到在
Figure 767349DEST_PATH_IMAGE057
的第
Figure 304640DEST_PATH_IMAGE059
次迭代中第
Figure 974656DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 26926DEST_PATH_IMAGE066
的加权集成预测结果
Figure DEST_PATH_IMAGE067
其中,
Figure 479904DEST_PATH_IMAGE068
Figure 370237DEST_PATH_IMAGE064
表示预设的最大更新次数,
Figure DEST_PATH_IMAGE069
表示信用卡交易子分类器
Figure 883258DEST_PATH_IMAGE031
对待标记信用卡交易数据的第
Figure 219561DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 679493DEST_PATH_IMAGE066
的标记结果,
Figure 50431DEST_PATH_IMAGE070
表示
Figure 265512DEST_PATH_IMAGE031
Figure 230057DEST_PATH_IMAGE066
的标记结果为
Figure 618313DEST_PATH_IMAGE066
中有欺诈行为,
Figure DEST_PATH_IMAGE071
表示
Figure 8537DEST_PATH_IMAGE031
Figure 66623DEST_PATH_IMAGE066
的标记结果为
Figure 580781DEST_PATH_IMAGE066
中无欺诈行为,
Figure 507149DEST_PATH_IMAGE072
表示在
Figure 728046DEST_PATH_IMAGE057
的第
Figure 81667DEST_PATH_IMAGE059
次迭代中的权重,
Figure DEST_PATH_IMAGE073
可选的,根据加权集成预测结果估计信用卡交易子分类器
Figure 286383DEST_PATH_IMAGE031
Figure 390343DEST_PATH_IMAGE057
的第
Figure 855960DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 255848DEST_PATH_IMAGE074
,包括:
通过公式
Figure DEST_PATH_IMAGE075
估计信用卡交易子分类器
Figure 947861DEST_PATH_IMAGE031
Figure 684872DEST_PATH_IMAGE057
的第
Figure 739416DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 310206DEST_PATH_IMAGE060
根据信用卡交易子分类器
Figure 348569DEST_PATH_IMAGE031
Figure 794332DEST_PATH_IMAGE057
的第
Figure 703382DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 710652DEST_PATH_IMAGE060
,更新信用卡交易子分类器
Figure 908415DEST_PATH_IMAGE031
的权重,包括:
通过公式
Figure 783967DEST_PATH_IMAGE076
更新信用卡交易子分类器
Figure 422890DEST_PATH_IMAGE031
的权重,得到
Figure 991275DEST_PATH_IMAGE057
在第
Figure DEST_PATH_IMAGE077
次迭代中的权重
Figure 879596DEST_PATH_IMAGE078
可选的,利用每代信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据的欺诈检测结果,包括:
Figure DEST_PATH_IMAGE079
,则确定待标记信用卡交易数据的第
Figure 198320DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 957328DEST_PATH_IMAGE066
中有欺诈行为;
Figure 431035DEST_PATH_IMAGE080
,则确定待标记信用卡交易数据的第
Figure 9915DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 227270DEST_PATH_IMAGE066
中无欺诈行为。
本申请的上述方案有如下的有益效果:
在本申请的实施例中,通过利用信用卡交易子分类器对训练样本的标记结果,确定信用卡交易子分类器对欺诈交易数据的偏置程度,并根据该偏置程度自适应地修正训练样本的误分类代价,克服了现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题,同时基于修正的误分类代价计算信用卡交易子分类器的权重,并通过调整信用卡交易子分类器的权重迭代优化子分类器对待标记信用卡交易数据的欺诈检测结果,使其更加接近于待标记信用卡交易数据的真实类别标签,从而提高欺诈检测性能。
本申请的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的基于参数偏移修正集成学习的信用卡欺诈检测方法的流程图;
图2为本申请一实验中Kaggle信用卡交易数据集上DCBoost、AdaC2、RUSBoost和SMOTEBoost的实验结果对比图一;
图3为本申请一实验中Kaggle信用卡交易数据集上DCBoost、AdaC2、RUSBoost和SMOTEBoost的实验结果对比图二;
图4为本申请一实验中Kaggle信用卡交易数据集上DCBoost、AdaC2、RUSBoost和SMOTEBoost的实验结果对比图三。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
针对目前欺诈检测性能低的问题,本申请提供了一种基于参数偏移修正集成学习的信用卡欺诈检测方法,该方法通过利用信用卡交易子分类器对训练样本的标记结果,确定信用卡交易子分类器对欺诈交易数据的偏置程度,并根据该偏置程度自适应地修正训练样本的误分类代价,避免了现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题,同时基于修正的误分类代价计算信用卡交易子分类器的权重,并通过调整信用卡交易子分类器的权重迭代优化子分类器对待标记信用卡交易数据的欺诈检测结果,使其更加接近于待标记信用卡交易数据的真实类别标签,从而提高欺诈检测性能。
下面结合具体实施例对上述基于参数偏移修正集成学习的信用卡欺诈检测方法进行说明。
如图1所示,本申请提供的基于参数偏移修正集成学习的信用卡欺诈检测方法包括如下步骤:
步骤11,基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重。
上述待标记信用卡交易数据包括
Figure 840785DEST_PATH_IMAGE022
条待标记信用卡交易,在一些场景中,待标记信用卡交易可以记为交易特征向量,待标记信用卡交易数据中的第
Figure 485393DEST_PATH_IMAGE018
条待标记信用卡交易可以记为交易特征向量
Figure 321543DEST_PATH_IMAGE066
Figure DEST_PATH_IMAGE081
。上述特征取值可以为时间、金额、账户类别、交易类型等特征取值。
上述信用卡交易训练数据包括
Figure 483534DEST_PATH_IMAGE010
个训练样本,每个训练样本为一条信用卡交易,在一些场景中,训练样本可以记为交易特征向量,信用卡交易训练数据中的第
Figure 341768DEST_PATH_IMAGE003
个训练样本可以记为交易特征向量
Figure 32644DEST_PATH_IMAGE082
或训练样本
Figure 976329DEST_PATH_IMAGE082
Figure DEST_PATH_IMAGE083
在本申请的一些实施例中,可基于时间、金额、账户类别、交易类型等特征取值估计训练样本与待标记信用卡交易的相似度,并基于该相似度计算训练样本初始权重, 使得每个训练样本的初始权重与该样本同待标记信用卡交易数据的相似度正相关,以提高欺诈检测性能。
步骤12,使用支持向量机算法构建信用卡交易子分类器,并将信用卡交易子分类器迭代预设迭代次数。其中,在每迭代得到一代信用卡交易子分类器时,利用该信用卡交易子分类器对训练样本的标记结果,确定该信用卡交易子分类器对欺诈交易数据的偏置程度,并根据偏置程度修正训练样本的误分类代价;基于训练样本的误分类代价以及该信用卡交易子分类器对训练样本的标记结果,更新训练样本的权重,并根据该信用卡交易子分类器对训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和训练样本的权重,计算该信用卡交易子分类器的权重。
在本申请的一些实施例中,具体可使用支持向量机工具包(LIBSVM)中实现的支持向量机算法(支持向量机算法为一种子分类器构造算法)构建信用卡交易子分类器(该子分类器可理解为初始信用卡交易子分类器),并将信用卡交易子分类器迭代预设迭代次数。
其中,上述预设迭代次数可根据实际情况进行设定,例如设定为40次。
在本申请的一些实施例中,为克服现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题,需针对每轮迭代得到的每代信用卡交易子分类器,基于该信用卡交易子分类器对训练样本的标记结果,确定信用卡交易子分类器对欺诈交易数据的偏置程度,并基于该偏置程度修正训练样本的误分类代价、更新训练样本的权重,计算该信用卡交易子分类器的权重。
值得一提的是,为提高欺诈检测性能,在对信用卡交易子分类器进行迭代时,基于加权训练样本构造下一代信用卡交易子分类器。
步骤13,对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数,并利用每代信用卡交易子分类器的权重的最终更新值确定待标记信用卡交易数据的欺诈检测结果。
上述欺诈检测结果用于指示待标记信用卡交易数据对应的交易中有欺诈行为或者无欺诈行为。
需要说明的是,对于待标记信用卡交易数据中的每条待标记信用卡交易,均需利用每代信用卡交易子分类器的权重的最终更新值确定该条待标记信用卡交易中有无欺诈行为。
值得一提的是,本申请的上述信用卡欺诈检测方法通过利用信用卡交易子分类器对训练样本的标记结果,确定信用卡交易子分类器对欺诈交易数据的偏置程度,并根据该偏置程度自适应地修正训练样本的误分类代价,避免了现有的信用卡交易数据集成学习方法难以基于合理的学习参数构造子分类器的问题,同时基于修正的误分类代价计算信用卡交易子分类器的权重,并通过调整信用卡交易子分类器的权重迭代优化子分类器对待标记信用卡交易数据的欺诈检测结果,使其更加接近于待标记信用卡交易数据的真实类别标签,从而提高欺诈检测性能。
下面结合具体实施例对训练样本的初始权重的计算过程进行示例性说明。
在本申请的一些实施例中,可令
Figure DEST_PATH_IMAGE085
表示规模为
Figure 581492DEST_PATH_IMAGE010
的训练样本集合,
Figure 294233DEST_PATH_IMAGE087
表示上述信用卡交易训练数据,
Figure 156010DEST_PATH_IMAGE089
表示规模为
Figure 321412DEST_PATH_IMAGE022
的待标记交易集合(即上述待标记信用卡交易数据),其中,
Figure 90785DEST_PATH_IMAGE090
Figure 798978DEST_PATH_IMAGE091
均表示交易特征向量,
Figure 956289DEST_PATH_IMAGE092
表示交易类型标签(
Figure 812250DEST_PATH_IMAGE093
Figure 87111DEST_PATH_IMAGE094
表示交易中有欺诈行为,
Figure 774445DEST_PATH_IMAGE095
表示交易中无欺诈行为)。
在本申请的一些实施例中,上述步骤11,基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重的具体实现方式可以为:
通过公式
Figure DEST_PATH_IMAGE001
计算信用卡交易训练数据中第
Figure 774762DEST_PATH_IMAGE003
个训练样本的初始权重
Figure 790122DEST_PATH_IMAGE004
其中,
Figure 229194DEST_PATH_IMAGE006
表示信用卡交易训练数据中第
Figure 646400DEST_PATH_IMAGE003
个训练样本
Figure 145514DEST_PATH_IMAGE007
的第
Figure 976067DEST_PATH_IMAGE008
个特征取值,
Figure 592731DEST_PATH_IMAGE009
Figure 989077DEST_PATH_IMAGE010
表示信用卡交易训练数据中训练样本的数量,
Figure DEST_PATH_IMAGE011
Figure 65617DEST_PATH_IMAGE013
表示待标记信用卡交易数据中特征的数量,
Figure 321149DEST_PATH_IMAGE096
Figure DEST_PATH_IMAGE015
表示待标记信用卡交易数据的第
Figure 774127DEST_PATH_IMAGE008
个特征取值的范围,
Figure 24980DEST_PATH_IMAGE017
表示待标记信用卡交易数据中第
Figure 257377DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 859259DEST_PATH_IMAGE019
的第
Figure 319191DEST_PATH_IMAGE008
个特征取值,
Figure 893392DEST_PATH_IMAGE020
Figure 905210DEST_PATH_IMAGE022
表示待标记信用卡交易数据中待标记信用卡交易的数量,
Figure 869755DEST_PATH_IMAGE023
表示连续型特征的索引集合,
Figure 258011DEST_PATH_IMAGE024
Figure 358822DEST_PATH_IMAGE025
表示离散型特征的索引集合,
Figure 807121DEST_PATH_IMAGE026
下面结合具体实施例对偏置程度的计算过程、误分类代价的修正过程、信用卡交易子分类器的权重的计算过程进行示例性说明。
在本申请的一些实施例中,对于每代信用卡交易子分类器,确定该信用卡交易子分类器对欺诈交易数据的偏置程度的具体实现方式包括如下步骤:
步骤1.1,通过公式
Figure 491918DEST_PATH_IMAGE098
计算第
Figure 418286DEST_PATH_IMAGE030
次迭代得到的信用卡交易子分类器
Figure 967079DEST_PATH_IMAGE031
对欺诈交易的训练准确率
Figure 196066DEST_PATH_IMAGE099
Figure 994258DEST_PATH_IMAGE100
Figure 599682DEST_PATH_IMAGE101
Figure 65299DEST_PATH_IMAGE102
表示预设迭代次数。
步骤1.2,通过公式
Figure 465187DEST_PATH_IMAGE036
计算第
Figure 750675DEST_PATH_IMAGE030
次迭代得到的信用卡交易子分类器
Figure 392747DEST_PATH_IMAGE031
对非欺诈交易的训练准确率
Figure 650553DEST_PATH_IMAGE037
步骤1.3,通过公式
Figure 611555DEST_PATH_IMAGE038
计算第
Figure 259706DEST_PATH_IMAGE030
次迭代得到的信用卡交易子分类器
Figure 331567DEST_PATH_IMAGE031
对欺诈交易数据的偏置程度
Figure 115983DEST_PATH_IMAGE103
其中,
Figure 247887DEST_PATH_IMAGE040
表示第
Figure 383334DEST_PATH_IMAGE003
个训练样本对应的交易类型标签,
Figure 993306DEST_PATH_IMAGE041
表示交易中有欺诈行为,
Figure 396344DEST_PATH_IMAGE042
表示交易中无欺诈行为,
Figure 699149DEST_PATH_IMAGE043
表示
Figure 56312DEST_PATH_IMAGE031
对第
Figure 469976DEST_PATH_IMAGE003
个训练样本的标记结果,
Figure 494564DEST_PATH_IMAGE010
表示训练样本的数量,
Figure 109216DEST_PATH_IMAGE044
表示第
Figure 78309DEST_PATH_IMAGE030
次迭代中第
Figure 409845DEST_PATH_IMAGE003
个训练样本的权重,
Figure 413573DEST_PATH_IMAGE045
表示第
Figure 933547DEST_PATH_IMAGE003
个训练样本的初始权重,
Figure 593199DEST_PATH_IMAGE046
表示第
Figure 348665DEST_PATH_IMAGE030
次迭代中第
Figure 816687DEST_PATH_IMAGE003
个训练样本的误分类代价,
Figure 897775DEST_PATH_IMAGE104
在本申请的一些实施例中,对于每代信用卡交易子分类器,根据该信用卡交易子分类器对应的偏置程度修正训练样本的误分类代价的具体实现方式为:
通过公式
Figure 716827DEST_PATH_IMAGE105
修正第
Figure 275984DEST_PATH_IMAGE030
次迭代中第
Figure 362626DEST_PATH_IMAGE003
个训练样本的误分类代价
Figure 286720DEST_PATH_IMAGE046
,得到第
Figure 717701DEST_PATH_IMAGE049
次迭代中第
Figure 690337DEST_PATH_IMAGE003
个训练样本的误分类代价
Figure 523163DEST_PATH_IMAGE050
;其中,
Figure 555842DEST_PATH_IMAGE051
表示
Figure 474119DEST_PATH_IMAGE052
内的学习参数。
在本申请的一些实施例中,对于每代信用卡交易子分类器,基于该信用卡交易子分类器对应的训练样本的误分类代价以及该信用卡交易子分类器对训练样本的标记结果,更新训练样本的权重的具体实现方式为:
通过公式
Figure 250445DEST_PATH_IMAGE053
更新第
Figure 672199DEST_PATH_IMAGE003
个训练样本的权重,得到第
Figure 374314DEST_PATH_IMAGE049
次迭代中第
Figure 514308DEST_PATH_IMAGE003
个训练样本的权重
Figure 422221DEST_PATH_IMAGE054
其中
Figure 839427DEST_PATH_IMAGE055
表示第
Figure 338542DEST_PATH_IMAGE030
次迭代中的归一化因子,
Figure 841198DEST_PATH_IMAGE106
Figure 349540DEST_PATH_IMAGE044
表示第
Figure 621252DEST_PATH_IMAGE030
次迭代中第
Figure 291268DEST_PATH_IMAGE003
个训练样本的权重,
Figure 779756DEST_PATH_IMAGE046
表示第
Figure 763893DEST_PATH_IMAGE030
次迭代中第
Figure 280325DEST_PATH_IMAGE003
个训练样本的误分类代价,
Figure 996608DEST_PATH_IMAGE057
表示
Figure 864070DEST_PATH_IMAGE031
的权重。
在本申请的一些实施例中,对于每代信用卡交易子分类器,根据该信用卡交易子分类器对训练样本的标记结果、信用卡交易子分类器对应的误分类代价和训练样本的权重,计算信用卡交易子分类器的权重的具体实现方式为:通过公式
Figure 324001DEST_PATH_IMAGE107
得到信用卡交易子分类器
Figure 694940DEST_PATH_IMAGE031
的权重
Figure 582124DEST_PATH_IMAGE057
Figure 608986DEST_PATH_IMAGE108
下面结合具体实施例对信用卡交易子分类器的权重进行迭代更新过程进行示例性说明。
在本申请的一些实施例中,对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数的具体实现方式包括如下步骤:
步骤2.1,对每代信用卡交易子分类器对待标记信用卡交易数据的标记结果进行加权投票,得到待标记信用卡交易数据的加权集成预测结果。
在本申请的一些实施例中,通过公式
Figure 997242DEST_PATH_IMAGE065
对每代信用卡交易子分类器对待标记信用卡交易数据的第
Figure 590729DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 773449DEST_PATH_IMAGE066
的标记结果,进行加权投票,得到在
Figure 490869DEST_PATH_IMAGE057
的第
Figure 417237DEST_PATH_IMAGE059
次迭代中第
Figure 903713DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 398279DEST_PATH_IMAGE066
的加权集成预测结果
Figure 196471DEST_PATH_IMAGE067
其中,
Figure 300431DEST_PATH_IMAGE109
Figure 234889DEST_PATH_IMAGE068
Figure 900356DEST_PATH_IMAGE064
表示预设的最大更新次数(
Figure 185844DEST_PATH_IMAGE064
的取值可根据实际情况进行设定,例如设为20),
Figure 657277DEST_PATH_IMAGE069
表示信用卡交易子分类器
Figure 587187DEST_PATH_IMAGE031
对待标记信用卡交易数据的第
Figure 220293DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 727498DEST_PATH_IMAGE066
的标记结果,
Figure 173261DEST_PATH_IMAGE070
表示
Figure 347890DEST_PATH_IMAGE031
Figure 417477DEST_PATH_IMAGE066
的标记结果为
Figure 552924DEST_PATH_IMAGE066
中有欺诈行为,
Figure 162896DEST_PATH_IMAGE071
表示
Figure 67398DEST_PATH_IMAGE031
Figure 370204DEST_PATH_IMAGE066
的标记结果为
Figure 992946DEST_PATH_IMAGE066
中无欺诈行为,
Figure 406610DEST_PATH_IMAGE072
表示在
Figure 664154DEST_PATH_IMAGE057
的第
Figure 341123DEST_PATH_IMAGE059
次迭代中的权重,
Figure 310216DEST_PATH_IMAGE108
Figure 934095DEST_PATH_IMAGE073
步骤2.2,根据加权集成预测结果估计信用卡交易子分类器
Figure 141086DEST_PATH_IMAGE031
Figure 395481DEST_PATH_IMAGE057
的第
Figure 851870DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 748281DEST_PATH_IMAGE060
Figure 340937DEST_PATH_IMAGE101
Figure 536207DEST_PATH_IMAGE062
表示预设迭代次数,
Figure 479892DEST_PATH_IMAGE063
Figure 648836DEST_PATH_IMAGE064
表示预设的最大更新次数。
在本申请的一些实施例中,可通过公式
Figure 361577DEST_PATH_IMAGE110
估计信用卡交易子分类器
Figure 488933DEST_PATH_IMAGE031
Figure 919915DEST_PATH_IMAGE057
的第
Figure 892550DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 459798DEST_PATH_IMAGE060
Figure 991011DEST_PATH_IMAGE101
步骤2.3,根据信用卡交易子分类器
Figure 909288DEST_PATH_IMAGE031
Figure 747931DEST_PATH_IMAGE057
的第
Figure 310631DEST_PATH_IMAGE059
次迭代中的预测精度
Figure 638844DEST_PATH_IMAGE060
,更新信用卡交易子分类器
Figure 654204DEST_PATH_IMAGE031
的权重。
在本申请的一些实施例中,可通过公式
Figure 624434DEST_PATH_IMAGE111
更新信用卡交易子分类器
Figure 41640DEST_PATH_IMAGE031
的权重,得到
Figure 540755DEST_PATH_IMAGE057
在第
Figure 371308DEST_PATH_IMAGE077
次迭代中的权重
Figure 722392DEST_PATH_IMAGE078
Figure 384318DEST_PATH_IMAGE101
步骤2.4,返回步骤2.1,直至信用卡交易子分类器
Figure 929700DEST_PATH_IMAGE031
的权重的迭代更新次数达到预设的最大更新次数,
Figure 309866DEST_PATH_IMAGE101
在本申请的一些实施例中,在每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数后,若
Figure 966106DEST_PATH_IMAGE079
,则确定待标记信用卡交易数据的第
Figure 482538DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 526717DEST_PATH_IMAGE066
中有欺诈行为;而若
Figure 3966DEST_PATH_IMAGE080
,则确定待标记信用卡交易数据的第
Figure 588531DEST_PATH_IMAGE018
条待标记信用卡交易
Figure 333371DEST_PATH_IMAGE066
中无欺诈行为。
为便于理解上述信用卡欺诈检测方法,在此以一具体实验数据对上述信用卡欺诈检测方法的效果进行说明。
在该实验中,
Figure 610769DEST_PATH_IMAGE062
设为40,
Figure 309734DEST_PATH_IMAGE112
设为20,在Kaggle信用卡交易数据集上进行了10次十折交叉验证,实验结果如图2至图4所示。该结果表明,从如图2所示的准确率(Precision)对比图、如图3所示的召回率(Recall)对比图以及如图4所示的综合评价指标(F-Measure)对比图来看,本申请提供的信用卡欺诈检测方法(简称DCBoost)与2型代价敏感集成学习(AdaC2)、随机欠采样集成学习(RUSBoost)、合成过采样集成学习(SMOTEBoost)等现有的集成学习方法相比,具有更好的信用卡欺诈交易识别性能。
以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种基于参数偏移修正集成学习的信用卡欺诈检测方法,其特征在于,包括:
基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重;
使用支持向量机算法构建信用卡交易子分类器,并将所述信用卡交易子分类器迭代预设迭代次数;其中,在每迭代得到一代信用卡交易子分类器时,利用该信用卡交易子分类器对所述训练样本的标记结果,确定该信用卡交易子分类器对欺诈交易数据的偏置程度,并根据所述偏置程度修正所述训练样本的误分类代价;基于所述训练样本的误分类代价以及该信用卡交易子分类器对所述训练样本的标记结果,更新所述训练样本的权重,并根据该信用卡交易子分类器对所述训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和所述训练样本的权重,计算该信用卡交易子分类器的权重;
对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数,并利用每代信用卡交易子分类器的权重的最终更新值确定所述待标记信用卡交易数据的欺诈检测结果;所述欺诈检测结果用于指示所述待标记信用卡交易数据对应的交易中有欺诈行为或者无欺诈行为。
2.根据权利要求1所述的方法,其特征在于,所述基于待标记信用卡交易数据的特征取值,计算信用卡交易训练数据中每个训练样本的初始权重,包括:
通过公式
Figure 677986DEST_PATH_IMAGE001
计算信用卡交易训练数据中第
Figure 903431DEST_PATH_IMAGE002
个训练样本的初始权重
Figure 465912DEST_PATH_IMAGE003
其中,
Figure 42386DEST_PATH_IMAGE004
表示信用卡交易训练数据中第
Figure 844120DEST_PATH_IMAGE002
个训练样本
Figure 189651DEST_PATH_IMAGE005
的第
Figure 684217DEST_PATH_IMAGE006
个特征取值,
Figure 482409DEST_PATH_IMAGE007
Figure 556675DEST_PATH_IMAGE008
表示信用卡交易训练数据中训练样本的数量,
Figure 756713DEST_PATH_IMAGE009
Figure 186295DEST_PATH_IMAGE010
表示待标记信用卡交易数据中特征的数量,
Figure 206203DEST_PATH_IMAGE011
Figure 615319DEST_PATH_IMAGE012
表示待标记信用卡交易数据的第
Figure 669863DEST_PATH_IMAGE006
个特征取值的范围,
Figure 240652DEST_PATH_IMAGE013
表示待标记信用卡交易数据中第
Figure 13436DEST_PATH_IMAGE014
条待标记信用卡交易
Figure 960664DEST_PATH_IMAGE015
的第
Figure 869714DEST_PATH_IMAGE006
个特征取值,
Figure 375519DEST_PATH_IMAGE016
Figure 370020DEST_PATH_IMAGE017
表示待标记信用卡交易数据中待标记信用卡交易的数量,
Figure 448835DEST_PATH_IMAGE018
表示连续型特征的索引集合,
Figure 353337DEST_PATH_IMAGE019
Figure 390563DEST_PATH_IMAGE020
表示离散型特征的索引集合,
Figure 13305DEST_PATH_IMAGE021
3.根据权利要求2所述的方法,其特征在于,所述利用该信用卡交易子分类器对所述训练样本的标记结果,确定该信用卡交易子分类器对欺诈交易数据的偏置程度,包括:
通过公式
Figure 692548DEST_PATH_IMAGE022
计算第
Figure 451557DEST_PATH_IMAGE023
次迭代得到的信用卡交易子分类器
Figure 659684DEST_PATH_IMAGE024
对欺诈交易的训练准确率
Figure 2679DEST_PATH_IMAGE025
Figure 220033DEST_PATH_IMAGE026
通过公式
Figure 833548DEST_PATH_IMAGE027
计算第
Figure 478156DEST_PATH_IMAGE023
次迭代得到的信用卡交易子分类器
Figure 341070DEST_PATH_IMAGE024
对非欺诈交易的训练准确率
Figure 971903DEST_PATH_IMAGE028
通过公式
Figure 33400DEST_PATH_IMAGE029
计算第
Figure 13689DEST_PATH_IMAGE023
次迭代得到的信用卡交易子分类器
Figure 691795DEST_PATH_IMAGE024
对欺诈交易数据的偏置程度
Figure 454214DEST_PATH_IMAGE030
其中,
Figure 42322DEST_PATH_IMAGE031
表示第
Figure 28732DEST_PATH_IMAGE002
个训练样本对应的交易类型标签,
Figure 335080DEST_PATH_IMAGE032
表示交易中有欺诈行为,
Figure 697928DEST_PATH_IMAGE033
表示交易中无欺诈行为,
Figure 140542DEST_PATH_IMAGE034
表示
Figure 297854DEST_PATH_IMAGE024
对第
Figure 324453DEST_PATH_IMAGE002
个训练样本的标记结果,
Figure 428675DEST_PATH_IMAGE008
表示训练样本的数量,
Figure 116009DEST_PATH_IMAGE035
表示第
Figure 319588DEST_PATH_IMAGE023
次迭代中第
Figure 459582DEST_PATH_IMAGE002
个训练样本的权重,
Figure 774020DEST_PATH_IMAGE036
表示第
Figure 315860DEST_PATH_IMAGE002
个训练样本的初始权重,
Figure 690341DEST_PATH_IMAGE037
表示第
Figure 317631DEST_PATH_IMAGE023
次迭代中第
Figure 199874DEST_PATH_IMAGE002
个训练样本的误分类代价,
Figure 861800DEST_PATH_IMAGE038
4.根据权利要求3所述的方法,其特征在于,所述根据所述偏置程度修正所述训练样本的误分类代价,包括:
通过公式
Figure 407182DEST_PATH_IMAGE039
修正第
Figure 256189DEST_PATH_IMAGE023
次迭代中第
Figure 505905DEST_PATH_IMAGE002
个训练样本的误分类代价
Figure 897703DEST_PATH_IMAGE037
,得到第
Figure 738620DEST_PATH_IMAGE040
次迭代中第
Figure 950290DEST_PATH_IMAGE002
个训练样本的误分类代价
Figure 534855DEST_PATH_IMAGE041
;其中,
Figure 545274DEST_PATH_IMAGE042
表示
Figure 557092DEST_PATH_IMAGE043
内的学习参数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述训练样本的误分类代价以及该信用卡交易子分类器对所述训练样本的标记结果,更新所述训练样本的权重,包括:
通过公式
Figure 521637DEST_PATH_IMAGE044
更新第
Figure 644314DEST_PATH_IMAGE002
个训练样本的权重,得到第
Figure 10704DEST_PATH_IMAGE040
次迭代中第
Figure 193424DEST_PATH_IMAGE002
个训练样本的权重
Figure 707582DEST_PATH_IMAGE045
其中,
Figure 509316DEST_PATH_IMAGE046
表示第
Figure 854846DEST_PATH_IMAGE023
次迭代中的归一化因子,
Figure 588228DEST_PATH_IMAGE047
Figure 386420DEST_PATH_IMAGE035
表示第
Figure 257424DEST_PATH_IMAGE023
次迭代中第
Figure 457461DEST_PATH_IMAGE002
个训练样本的权重,
Figure 857350DEST_PATH_IMAGE037
表示第
Figure 142837DEST_PATH_IMAGE023
次迭代中第
Figure 551953DEST_PATH_IMAGE002
个训练样本的误分类代价,
Figure 606497DEST_PATH_IMAGE048
表示
Figure 505183DEST_PATH_IMAGE024
的权重。
6.根据权利要求5所述的方法,其特征在于,所述根据该信用卡交易子分类器对所述训练样本的标记结果、该信用卡交易子分类器对应的误分类代价和所述训练样本的权重,计算该信用卡交易子分类器的权重,包括:
通过公式
Figure 589551DEST_PATH_IMAGE049
得到信用卡交易子分类器
Figure 661412DEST_PATH_IMAGE024
的权重
Figure 445829DEST_PATH_IMAGE048
7.根据权利要求6所述的方法,其特征在于,所述对每代信用卡交易子分类器的权重进行迭代更新直至每代信用卡交易子分类器的权重的更新次数均达到预设的最大更新次数,包括:
对每代信用卡交易子分类器对所述待标记信用卡交易数据的标记结果进行加权投票,得到所述待标记信用卡交易数据的加权集成预测结果;
根据所述加权集成预测结果估计信用卡交易子分类器
Figure 577733DEST_PATH_IMAGE024
Figure 713179DEST_PATH_IMAGE048
的第
Figure 588731DEST_PATH_IMAGE050
次迭代中的预测精度
Figure 726189DEST_PATH_IMAGE051
Figure 28994DEST_PATH_IMAGE052
Figure 386158DEST_PATH_IMAGE053
表示预设迭代次数,
Figure 3084DEST_PATH_IMAGE054
Figure 558830DEST_PATH_IMAGE055
表示预设的最大更新次数;
根据信用卡交易子分类器
Figure 235799DEST_PATH_IMAGE024
Figure 876996DEST_PATH_IMAGE048
的第
Figure 297613DEST_PATH_IMAGE050
次迭代中的预测精度
Figure 35762DEST_PATH_IMAGE051
,更新信用卡交易子分类器
Figure 54271DEST_PATH_IMAGE024
的权重;
返回所述对每代信用卡交易子分类器对所述待标记信用卡交易数据的标记结果进行加权投票,得到所述待标记信用卡交易数据的加权集成预测结果的步骤,直至信用卡交易子分类器
Figure 776239DEST_PATH_IMAGE024
的权重的迭代更新次数达到预设的最大更新次数。
8.根据权利要求7所述的方法,其特征在于,所述对每代信用卡交易子分类器对所述待标记信用卡交易数据的标记结果进行加权投票,得到所述待标记信用卡交易数据的加权集成预测结果,包括:
通过公式
Figure 407072DEST_PATH_IMAGE057
对每代信用卡交易子分类器对待标记信用卡交易数据的第
Figure 265307DEST_PATH_IMAGE014
条待标记信用卡交易
Figure 690603DEST_PATH_IMAGE058
的标记结果,进行加权投票,得到在
Figure 634288DEST_PATH_IMAGE048
的第
Figure 68812DEST_PATH_IMAGE050
次迭代中第
Figure 781553DEST_PATH_IMAGE014
条待标记信用卡交易
Figure 971226DEST_PATH_IMAGE058
的加权集成预测结果
Figure 528107DEST_PATH_IMAGE060
其中,
Figure 625376DEST_PATH_IMAGE061
Figure 333569DEST_PATH_IMAGE055
表示预设的最大更新次数,
Figure 490881DEST_PATH_IMAGE062
表示信用卡交易子分类器
Figure 284525DEST_PATH_IMAGE024
对待标记信用卡交易数据的第
Figure 185485DEST_PATH_IMAGE014
条待标记信用卡交易
Figure 748184DEST_PATH_IMAGE058
的标记结果,
Figure 76397DEST_PATH_IMAGE063
表示
Figure 590293DEST_PATH_IMAGE024
Figure 29365DEST_PATH_IMAGE058
的标记结果为
Figure 774467DEST_PATH_IMAGE058
中有欺诈行为,
Figure 148947DEST_PATH_IMAGE064
表示
Figure 776238DEST_PATH_IMAGE024
Figure 894367DEST_PATH_IMAGE058
的标记结果为
Figure 290713DEST_PATH_IMAGE058
中无欺诈行为,
Figure 836095DEST_PATH_IMAGE065
表示在
Figure 950681DEST_PATH_IMAGE048
的第
Figure 371036DEST_PATH_IMAGE050
次迭代中的权重,
Figure 621889DEST_PATH_IMAGE066
9.根据权利要求8所述的方法,其特征在于,所述根据所述加权集成预测结果估计信用卡交易子分类器
Figure 338172DEST_PATH_IMAGE024
Figure 612159DEST_PATH_IMAGE048
的第
Figure 196724DEST_PATH_IMAGE050
次迭代中的预测精度
Figure 443028DEST_PATH_IMAGE051
,包括:
通过公式
Figure 454847DEST_PATH_IMAGE067
估计信用卡交易子分类器
Figure 917927DEST_PATH_IMAGE024
Figure 40604DEST_PATH_IMAGE048
的第
Figure 141415DEST_PATH_IMAGE050
次迭代中的预测精度
Figure 589714DEST_PATH_IMAGE051
根据信用卡交易子分类器
Figure 775976DEST_PATH_IMAGE024
Figure 702343DEST_PATH_IMAGE048
的第
Figure 923240DEST_PATH_IMAGE050
次迭代中的预测精度
Figure 276861DEST_PATH_IMAGE051
,更新信用卡交易子分类器
Figure 454814DEST_PATH_IMAGE024
的权重,包括:
通过公式
Figure 184872DEST_PATH_IMAGE068
更新信用卡交易子分类器
Figure 260276DEST_PATH_IMAGE024
的权重,得到
Figure 784798DEST_PATH_IMAGE048
在第
Figure 273548DEST_PATH_IMAGE069
次迭代中的权重
Figure 417084DEST_PATH_IMAGE070
10.根据权利要求9所述的方法,其特征在于,所述利用每代信用卡交易子分类器的权重的最终更新值确定所述待标记信用卡交易数据的欺诈检测结果,包括:
Figure 471628DEST_PATH_IMAGE071
,则确定待标记信用卡交易数据的第
Figure 307997DEST_PATH_IMAGE014
条待标记信用卡交易
Figure 80781DEST_PATH_IMAGE058
中有欺诈行为;
Figure DEST_PATH_IMAGE072
,则确定待标记信用卡交易数据的第
Figure 792123DEST_PATH_IMAGE014
条待标记信用卡交易
Figure 107698DEST_PATH_IMAGE058
中无欺诈行为。
CN202211602393.4A 2022-12-14 2022-12-14 基于参数偏移修正集成学习的信用卡欺诈检测方法 Active CN115618238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211602393.4A CN115618238B (zh) 2022-12-14 2022-12-14 基于参数偏移修正集成学习的信用卡欺诈检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211602393.4A CN115618238B (zh) 2022-12-14 2022-12-14 基于参数偏移修正集成学习的信用卡欺诈检测方法

Publications (2)

Publication Number Publication Date
CN115618238A true CN115618238A (zh) 2023-01-17
CN115618238B CN115618238B (zh) 2023-03-14

Family

ID=84880904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211602393.4A Active CN115618238B (zh) 2022-12-14 2022-12-14 基于参数偏移修正集成学习的信用卡欺诈检测方法

Country Status (1)

Country Link
CN (1) CN115618238B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116843341A (zh) * 2023-06-27 2023-10-03 湖南工程学院 信用卡异常数据检测方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951809A (zh) * 2015-07-14 2015-09-30 西安电子科技大学 基于不平衡分类指标与集成学习的不平衡数据分类方法
CN110490582A (zh) * 2019-07-18 2019-11-22 同济大学 一种信用卡交易异常检测方法及装置
CN111461855A (zh) * 2019-01-18 2020-07-28 同济大学 基于欠采样的信用卡欺诈检测方法及系统、介质、设备
CN111985924A (zh) * 2020-05-22 2020-11-24 徽商银行股份有限公司 一种基于深度学习的信用卡异常交易行为判定方法及系统
CN112581265A (zh) * 2020-12-23 2021-03-30 百维金科(上海)信息科技有限公司 一种基于AdaBoost的互联网金融客户申请欺诈检测方法
WO2022039673A1 (en) * 2020-08-18 2022-02-24 Lyte Ventures Pte. Ltd. System and method for implementing payment service platform
CN114298176A (zh) * 2021-12-16 2022-04-08 重庆大学 一种欺诈用户检测方法、装置、介质及电子设备
CN115204901A (zh) * 2022-09-09 2022-10-18 中国人民解放军国防科技大学 基于多特征融合的信用卡欺诈检测方法、装置及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239907A (zh) * 2014-07-16 2014-12-24 华南理工大学 面向变化场景的远红外行人检测方法
CN106611189A (zh) * 2016-06-28 2017-05-03 四川用联信息技术有限公司 标准化多维代价敏感决策树的集成分类器构建方法
CN111582365B (zh) * 2020-05-06 2022-07-22 吉林大学 一种基于样本难度的垃圾邮件分类方法
US10970650B1 (en) * 2020-05-18 2021-04-06 King Abdulaziz University AUC-maximized high-accuracy classifier for imbalanced datasets
CN114548227A (zh) * 2022-01-24 2022-05-27 杭州趣链科技有限公司 一种基于混合重采样技术的信用卡欺诈行为识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951809A (zh) * 2015-07-14 2015-09-30 西安电子科技大学 基于不平衡分类指标与集成学习的不平衡数据分类方法
CN111461855A (zh) * 2019-01-18 2020-07-28 同济大学 基于欠采样的信用卡欺诈检测方法及系统、介质、设备
CN110490582A (zh) * 2019-07-18 2019-11-22 同济大学 一种信用卡交易异常检测方法及装置
CN111985924A (zh) * 2020-05-22 2020-11-24 徽商银行股份有限公司 一种基于深度学习的信用卡异常交易行为判定方法及系统
WO2022039673A1 (en) * 2020-08-18 2022-02-24 Lyte Ventures Pte. Ltd. System and method for implementing payment service platform
CN112581265A (zh) * 2020-12-23 2021-03-30 百维金科(上海)信息科技有限公司 一种基于AdaBoost的互联网金融客户申请欺诈检测方法
CN114298176A (zh) * 2021-12-16 2022-04-08 重庆大学 一种欺诈用户检测方法、装置、介质及电子设备
CN115204901A (zh) * 2022-09-09 2022-10-18 中国人民解放军国防科技大学 基于多特征融合的信用卡欺诈检测方法、装置及介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIANMING ZHENG等: "A Novel Imbalanced Ensemble Learning in Software Defect Predication" *
吴雨茜等: "代价敏感深度学习方法研究综述" *
张金传等: "基于代价敏感学习的半监督软件缺陷预测方法" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116843341A (zh) * 2023-06-27 2023-10-03 湖南工程学院 信用卡异常数据检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115618238B (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
AU2019278845B2 (en) Post-filtering of named entities with machine learning
CN108062674B (zh) 基于gps的订单欺诈识别方法、系统、存储介质和电子设备
CN109903774A (zh) 一种基于角度间隔损失函数的声纹识别方法
US20050273430A1 (en) Systems and methods for scoring bank customers direct deposit account transaction activity to match financial behavior to specific acqusition, performance and risk events defined by the bank using a decision tree and stochastic process
WO2018228427A1 (zh) 待处理业务的风险识别方法及装置、电子设备
CN115618238B (zh) 基于参数偏移修正集成学习的信用卡欺诈检测方法
CN111539733B (zh) 基于全中心损失函数的欺诈交易识别方法、系统、装置
CN111046184B (zh) 文本的风险识别方法、装置、服务器和存储介质
CN109767225B (zh) 一种基于自学习滑动时间窗口的网络支付欺诈检测方法
CN105184574A (zh) 一种套用商户类别码欺诈行为的检测方法
CN112990294B (zh) 行为判别模型的训练方法、装置、电子设备及存储介质
CN112581265A (zh) 一种基于AdaBoost的互联网金融客户申请欺诈检测方法
CN111260189B (zh) 一种风险控制方法、装置、计算机系统及可读存储介质
CN110263157A (zh) 一种数据风险预测方法、装置及设备
CN104463673A (zh) 一种基于支持向量机的p2p网络贷款风险评估模型
CN115527246A (zh) 信息处理方法、信息处理装置和存储介质
Ying et al. Label errors in BANKING77
CN115641202A (zh) 基于知识图谱和图计算的小贷行业团体借贷风险测度方法
CN111160695A (zh) 计算机运行的风险账户的识别方法、系统、装置及存储介质
CN112365352B (zh) 一种基于图神经网络的反套现方法及装置
CN114328808A (zh) 地址模糊匹配方法、地址处理方法、装置和电子设备
CN116503872B (zh) 一种基于机器学习的授信客户挖掘方法
CN113159874A (zh) 增值税发票的检测方法、装置和可读存储介质
CN116962089A (zh) 一种针对信息安全的网络监测方法及系统
Jourani et al. Large margin Gaussian mixture models for speaker identification.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant