CN115796884A - 信用卡套现行为的识别方法和识别装置 - Google Patents
信用卡套现行为的识别方法和识别装置 Download PDFInfo
- Publication number
- CN115796884A CN115796884A CN202211505197.5A CN202211505197A CN115796884A CN 115796884 A CN115796884 A CN 115796884A CN 202211505197 A CN202211505197 A CN 202211505197A CN 115796884 A CN115796884 A CN 115796884A
- Authority
- CN
- China
- Prior art keywords
- merchant
- billing
- latest
- credit card
- transaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种信用卡套现行为的识别方法和识别装置。所述识别方法包括:获取目标信用卡的交易数据;从所述交易数据中提取预定的多组特征对应的信息;将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;以及根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为。本发明可以应用于金融领域或其他领域,通过本发明实施例,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。
Description
技术领域
本发明涉及金融领域,尤其涉及一种信用卡套现行为的识别方法和识别装置。
需要说明的是,本发明信用卡套现行为的识别方法和识别装置可用于金融领域在信用卡的风险控制领域,也可用于除金融领域之外的任意领域,本发明信用卡套现行为的识别方法和识别装置的应用领域不做限定
背景技术
信用卡是商业银行或者信用卡公司对信用合格的消费者发行的信用凭证。但是由于信用卡消费有免息期并且取现的费率相比同期的银行贷款利率较低,因此常常有团伙或者个人使用多张信用卡进行套现,从而在低成本下获取到较大的现金流。这种套现行为给商业银行带来了较大的损失。因此商业银行常常进行套现行为的识别,
目前针对信用卡套现行为的识别方法中,套现模型常常是基于规则匹配的方式实现的,当数据结构或者数据来源发生变化时,还需要将规则进行更改,浪费人力物力。此外,由于需要基于业务人员的经验制定规则,对人员的依赖较大,当人员发生变动时,识别的正确率会随之发生波动。
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
发明内容
本发明实施例提供一种信用卡套现行为的识别方法,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。所述识别方法包括:
获取目标信用卡的交易数据;
从所述交易数据中提取预定的多组特征对应的信息;
将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;以及
根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为;
其中,每组特征包括以下特征中的至少一个:客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征。
本发明实施例提供一种信用卡套现行为的识别装置,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。所述识别装置包括:
数据获取单元,其获取目标信用卡的交易数据;
信息提取单元,其从所述交易数据中提取预定的多组特征对应的信息,其中,每组特征包括以下特征中的至少一个:客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征;
计算单元,其将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;以及
判断单元,其根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述识别方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述识别方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述识别方法。
本发明实施例中,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例的信用卡套现行为的识别方法的一个示意图。
图2是本发明实施例的模型训练的一个示意图。
图3是本发明实施例的信用卡套现行为的识别方法中的投票策略的一个示意图。
图4是本发明实施例的信用卡套现行为的识别装置的一个示意图。
图5是本发明实施例的信用卡套现行为的识别装置的另一个示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本发明实施例提供一种信用卡套现行为的识别方法,图1是本发明实施例的信用卡套现行为的识别方法的一个示意图。如图1所示,识别方法100可以包括:
步骤101:获取目标信用卡的交易数据;
步骤102:从所述交易数据中提取预定的多组特征对应的信息;
步骤103:将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;
步骤104:根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为;
其中,每组特征包括以下特征中的至少一个:客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征。
由此,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。
在至少一个实施例中,对获取的所述交易数据进行数据归一化处理。例如,对获取的交易数据进行离散数据数字化,然后将数字化后的数据进行归一化处理。
在至少一个实施例中,经过所述数字归一化处理后的交易数据呈均值为0,方差为1的正态分布。
在至少一个实施例中,所述识别模型是基于XGBOOST模型建立的机器学习模型。但发明实施例不限于此,还可以基于其他决策树模型得到识别模型。
例如,在对模型进行训练阶段,对获得的大量交易数据进行数据预处理。例如,进行缺失数据填充处理:在收集的数据中,常常会存在某些部分缺失的情况,数据的缺失不利于模型的收敛与准确度的提升,因此本发明实施例对数据进行填充处理。对于离散型数据,例如使用该特征的众数进行填充,对于连续型特征,例如使用该特征的均值进行填充,但本发明实施例不限于此,还可以使用其他的数据进行填充,具体可以参考相关技术、
此外,还可以对离散数据数字化,例如,以表1至表3的形式对离散特征赋值、分桶、编码或计算,
表1:
针对分桶处理,例如,年龄的分桶处理:
表2:
年龄(年) | 取值 |
18-25 | 4 |
26-35 | 8 |
35-45 | 12 |
45-60 | 10 |
>60 | 5 |
学历分桶处理:
表3:
以上以表1至表3为例对离散数据数字化进行了说明,但本发明实施例不限于此,还可以根据其他方式进行离散数据数字化处理,本发明实施例对具体方式不作限定。
套现交易在实际操作中有一些特点,比如持卡人利用私自购买安装的POS机进行交易,例如频繁的在很短的时间内距离相据很远的两个商户进行消费、或者在手续费率低的几个商户进行频繁的消费;或者利用账单周期的空档进行套现,例如在账单周期免息日快要临近时还款,并在还款后很短的时间内或者在下个账单周期刚开始就开始大额消费;或者商户法人利用自己的商户进行套现,例如在多个账单周期中,在自家商户进行大额高频的消费等等。
因此,可以从信用卡交易数据中提取客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征等信息,将具有套现交易的特征的数据提取出来,利用机器学习模型进行模型训练,从而识别用户的交易行为是否为套现交易。
在至少一个实施例中,所述客户静态信息包括年龄、性别、学历、开户时间、开卡时间、持卡数量、居住地中的至少一个;
所述客户动态信息包括客户的最新授信额度限额;
所述账单特征包括以下数据中的至少一个:交易时间、最新账单周期额度使用率、最近预定数量的账单周期额度使用率、最近预定期间内的账单周期使用率、最新账单周期在折扣率低于第一阈值的商户交易金额占比、最近预定数量的账单周期在折扣率低于第一阈值的商户交易金额占比、最新账单周期内交易额度大于第二阈值的商家总数、最近连续预定数量的账单周期内交易额度大于第二阈值的商家总数、最近预定数量的账单周期内交易额度大于第二阈值的商家总数、最新预定数量的账单周期在免息期最后预定时间内进行还款并在下一个账单周期达到额度的第三阈值以上的平均天数、最近预定数量的账单周期消费总笔数、在最近预定数量的账单周期内消费金额占授信额度的第一比例以上且还款额度占消费额度的第一比例以上的天数、最近预定数量的账单周期平均每笔消费金额、最近预定期间内消费时间在预定时间段在预定商店的消费金额、最近预定期间内消费时间在预定时间段在预定商店的消费笔数、最近预定期间内消费时间在预定时间段在预定商店的消费金额占比、最近预定期间内连续在同一家商店消费的最大总金额、最近预定期间内连续在同一家商店消费的总次数、最近预定期间内连续在同一家商店消费的预定周期内的额度占比;
所述静态商户信息包括是否为高风险商户、商户的类型、商户成立的时间、商户地址中的至少一个;
所述动态商户信息包括以下数据中的至少一个:最近预定数量的账单周期商户法人在本人商户下交易金额总和、最近预定期间内商户法人在本人商户下交易金额总和、最近预定数量的账单周期内商户法人在本人商户下消费额度占总额度的百分比;
其中,例如账单特征可以包括最近预定数量的账单周期额度使用率,例如最近3个账单周期额度使用率、最近5个账单周期额度使用率、最近7个月的账单周期使用率等,本发明实施例对预定数量不作限制;
例如账单特征可以包括最新账单周期在折扣率低于第一阈值的商户交易金额占比,例如最新账单周期在折扣率低于30%的商户交易金额占比,本发明实施例对第一阈值不做限制;
例如账单特征可以包括最近预定数量的账单周期在折扣率低于第一阈值的商户交易金额占比,例如,最近2个账单周期在学校、医院等折扣率低于30%的商户交易金额占比、最近3个账单周期在学校、医院等低折扣率的商户交易金额占比、最近5个账单周期在低折扣率的商户交易金额占比等,本发明实施例对预定数量和第一阈值不作限制;
例如账单特征可以包括最新账单周期内交易额度大于第二阈值的商家总数,例如,最新账单周期内交易额度大于80%的商家总数,本发明实施例对第二阈值不作限制;
例如账单特征可以包括最近连续预定数量的账单周期内交易额度大于第二阈值的商家总数,例如,最近连续2个账单周期内交易额度大于80%的商家总数等,本发明实施例对预定数量和第二阈值不作限制;
例如账单特征可以包括最近预定数量的账单周期内交易额度大于第二阈值的商家总数,例如,最近3个账单周期内交易额度大于80%的商家总数、最近5个账单周期内交易额度大于80%的商家总数等;
例如账单特征可以包括最新预定数量的账单周期在免息期最后预定时间内进行还款并在下一个账单周期达到额度的第三阈值以上的平均天数,例如,最新1个账单周期在免息期最后6天内进行还款并在下一个账单周期达到额度85%的平均天数、最近3个账单周期在免息期最后6天内进行还款并在下一个账单周期达到额度85%的平均天数、最近5个账单周期在免息期最后6天内进行还款并在下一个账单周期达到额度85%的平均天数、最近7个账单周期在免息期最后6天内进行还款并在下一个账单周期达到额度85%的平均天数等,本发明实施例对预定数量、预定时间和第三阈值不作限制;
例如账单特征可以包括最近预定数量的账单周期消费总笔数,例如最新账单周期消费笔数、最近3个账单周期消费总笔数、最近5个账单周期消费总笔数等,本发明实施例对预定数量不作限制;
例如账单特征可以包括在最近预定数量的账单周期内消费金额占授信额度的第一比例以上且还款额度占消费额度的第一比例以上的天数,例如在最近一个账单周期内消费金额占授信额度的50%且还款额度占消费额度50%以上的天数、在最近连续3个账单周期内消费金额占授信额度的50%且还款额度占消费额度50%以上的天数、在最近连续5个账单周期内消费金额占授信额度的50%且还款额度占消费额度50%以上的天数等,本发明实施例对预定数量和第一比例不作限制;
例如账单特征可以包括最近预定数量的账单周期平均每笔消费金额,例如最近1个账单周期平均每笔消费金额、最近3个账单周期平均每笔消费金额等,本发明实施例对预定数量不作限制;
例如账单特征可以包括最近预定期间内消费时间在预定时间段在预定商店的消费金额、消费笔数、消费金额占比,例如,最近1个月消费时间在00:00-3:00在包含“珠宝”“家具”等商店消费金额、消费笔数、消费金额占比,最近3个月消费时间在00:00-3:00在包含“珠宝”“家具”等大额消费商店的消费金额、消费笔数、消费金额占比,最近5个月消费时间在00:00-3:00在包含“珠宝”“家具”等大额消费商店的消费金额、消费笔数、消费金额占比等,本发明实施例对预定期间、预定时间段、预定商店不作限制;
例如账单特征可以包括最近预定期间内连续在同一家商店消费的最大总金额、总次数以及预定周期内的额度占比,例如,最近1-5个月连续在一家商店消费的最大总金额、总次数以及每月在该商家消费的额度占比等,本发明实施例对预定期间不作限制。
例如,账单特征还可以包括最近一个账单周期。
此外,例如动态商户信息可以包括最近预定数量的账单周期商户法人在本人商户下交易金额总和,例如,最近1-5个账单周期商户法人在本人商户下交易金额总和等,本发明实施例对预定数量不作限制;
例如动态商户信息可以包括最近预定期间内商户法人在本人商户下交易金额总和,例如,最近5天内商户法人在本人商户下交易金额总和、最近10天内商户法人在本人商户下交易金额总和等,本发明实施例对预定期间不作限制;
例如动态商户信息还可以包括最近预定数量的账单周期内商户法人在本人商户下消费额度占总额度的百分比,例如,最近1-5个账单周期内商户法人在本人商户消费额度占总额度的百分比等,本发明实施例对预定数量不作限制。
在选择上述特征构造模型以及利用训练好的模型进行识别时,可以选取相互独立的多个特征作为一组特征,也可以选取相互关联的多个特征作为一组特征,例如,可以选取客户静态信息、客户动态信息、账单特征中的一个或多个特征作为一组特征,也可以选取账单特征、静态商户信息和动态商户信息中的一个或多个特征作为一组特征。
此外,在对模型进行训练时,将采集到的数据按照历史上是否认定为套现案例进行打标签,例如套现客户标签为“1”,非套现客户为“0”。随机选取例如75%的数据作为训练集,剩余25%数据作为验证集。搭建XGBOOST模型,完成模型调试和训练。
图2是本发明实施例的模型训练的一个示意图。
如图2所示,在经过了预处理的交易数据中提取客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征等特征,随机选取一部分数据作为训练数据201,将剩余的数据作为验证数据202,从训练数据201中选择上述特征中的一个或多个作为一组特征组,选择m组特征组,m为3以上的自然数,这m组特征组中包含的特征不完全相同;针对m组特征组分别使用XGBOOST模型构建与之对应的m个模型,使用训练数据201对该m个模型进行训练,得到对应的m个识别模型,使用验证数据202中的对应的特征组的数据对该m个识别模型进行验证,得到m个识别结果;再次随机选取一部分数据作为训练数据201,将剩余的数据作为验证数据202,进行模型训练,在经过了预定次数的训练后,选择识别结果较准确的n个模型作为最终的识别模型,n为小于等于m的自然数,例如,可以将m个识别模型的识别结果的准确率从高到低排列,选择最前面的3个准确率对应的识别模型作为最终的识别模型。
此外,可以使用混淆矩阵、查准率、查全率、F1-score等对训练结果进行评价,并采用交叉验证的方式进行模型验证。
混淆矩阵
例如混淆矩阵以表格的形式将训练结果简单明了的表示出来,例如,以表4的形式表示混淆矩阵。
表4:
查准率、查全率和准确率
查准率(Precision)针对预测结果而言,其含义是在预测为正的样本中有多大把握可以预测正确,公式如下:
查准率:P=TP/(TP+FP)。
查全率(Recall),又称召回率,针对原样本而言,其含义在是在实际为正的样本中被预测为正样本的概率,公式如下:
查全率:R=TP/(TP+FN)。
准确率:Acc=(TP+TN)/(TP+TN+FP+FN)。
此外,为了减少单一模型准确率低,稳定性差的问题,本发明实施例采用多参数XGBOOST模型投票策略。
在至少一个实施例中,所述投票策略为选择所述多个识别结果中位于判定阈值一侧的识别结果数量多的识别结果作为判断所述目标信用卡是否存在信用卡套现行为的依据。
图3是本发明实施例的信用卡套现行为的识别方法中的投票策略的一个示意图。
例如,如图3所示,假设在图2中选择了识别模型1、识别模型2和识别模型3为最终的识别模型,针对某个客户使用信用卡行为进行识别,获取目标信用卡的交易数据301,对交易数据301进行预处理后,与识别模型1对应的提取特征组1的各特征的数据,输入识别模型1,得到识别结果1;与识别模型2对应的提取特征组2的各特征的数据,输入识别模型2,得到识别结果2;与识别模型3对应的提取特征组3的各特征的数据,输入识别模型3,得到识别结果3;对识别结果1、2、3进行投票,得到最终的识别结果,根据最终的识别结果判断目标信用卡数据是否存在信用卡套现行为。例如,“识别结果”表示是套现行为的概率,假设概率大于或等于50%即判断为属于套现行为,概率小于50%即判断为不属于套现行为。假设“识别结果1”为80%,“识别结果2”为60%,“识别结果3”为40%,那么按照投票策略,应该判断为最终的识别结果为目标信用卡存在套现行为。
此外,在实际应用中,可以将识别出的套现名单实施推送到后台,供业务人员查看,为进一步对套现用户降额处理等提供依据,同时对于识别出来的套现交易进行时时阻断处理,减少银行相关损失。
根据本发明实施例,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。
本发明实施例提供一种信用卡套现行为的识别装置,本发明实施例的信用卡套现行为的识别装置解决问题的原理与上述信用卡套现行为的识别方法相似,因此该信用卡套现行为的识别装置的实施可以参见上述信用卡套现行为的识别方法的实施,重复之处不再赘述。
图4是本发明实施例的信用卡套现行为的识别装置的一个示意图。
如图4所示,识别装置400可以包括数据获取单元401、信息提取单元402、计算单元403和判断单元404。
数据获取单元401获取目标信用卡的交易数据;
信息提取单元402从所述交易数据中提取预定的多组特征对应的信息,其中,每组特征包括以下特征中的至少一个:客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征;
计算单元403将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;
判断单元404根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为。
在至少一个实施例中,识别装置400还包括归一化处理单元405,归一化处理单元405对获取的所述交易数据进行数据归一化处理。
在至少一个实施例中,经过所述数字归一化处理后的交易数据呈均值为0,方差为1的正态分布。
在至少一个实施例中,所述识别模型是基于XGBOOST模型建立的机器学习模型。
在至少一个实施例中,所述投票策略为选择所述多个识别结果中位于判定阈值一侧的识别结果数量多的识别结果作为判断所述目标信用卡是否存在信用卡套现行为的依据。
在至少一个实施例中,所述客户静态信息包括年龄、性别、学历、开户时间、开卡时间、持卡数量、居住地中的至少一个;
所述客户动态信息包括客户的最新授信额度限额;
所述账单特征包括以下数据中的至少一个:交易时间、最新账单周期额度使用率、最近预定数量的账单周期额度使用率、最近预定期间内的账单周期使用率、最新账单周期在折扣率低于第一阈值的商户交易金额占比、最近预定数量的账单周期在折扣率低于第一阈值的商户交易金额占比、最新账单周期内交易额度大于第二阈值的商家总数、最近连续预定数量的账单周期内交易额度大于第二阈值的商家总数、最近预定数量的账单周期内交易额度大于第二阈值的商家总数、最新预定数量的账单周期在免息期最后预定时间内进行还款并在下一个账单周期达到额度的第三阈值以上的平均天数、最近预定数量的账单周期消费总笔数、在最近预定数量的账单周期内消费金额占授信额度的第一比例以上且还款额度占消费额度的第一比例以上的天数、最近预定数量的账单周期平均每笔消费金额、最近预定期间内消费时间在预定时间段在预定商店的消费金额、最近预定期间内消费时间在预定时间段在预定商店的消费笔数、最近预定期间内消费时间在预定时间段在预定商店的消费金额占比、最近预定期间内连续在同一家商店消费的最大总金额、最近预定期间内连续在同一家商店消费的总次数、最近预定期间内连续在同一家商店消费的预定周期内的额度占比;
所述静态商户信息包括是否为高风险商户、商户的类型、商户成立的时间、商户地址中的至少一个;
所述动态商户信息包括以下数据中的至少一个:最近预定数量的账单周期商户法人在本人商户下交易金额总和、最近预定期间内商户法人在本人商户下交易金额总和、最近预定数量的账单周期内商户法人在本人商户下消费额度占总额度的百分比。
图5是本发明实施例的信用卡套现行为的识别装置的另一个示意图。
如图5所示,识别装置500可以包括数据提取与预处理模块501、特征提取模块502、模型搭建模块503、模型训练模块504、识别模块505、推送模块506。
数据提取与预处理模块501获取原始数据,进行数据预处理,为特征提取做准备;
特征提取模块502根据获得的数据、结合套现的业务背景提取有效的套现特征,为下一步模型训练做准备;
模型搭建模块503根据提取的特征的形式,搭建机器学习模型,例如XGBOOST模型;
模型训练模块504将数据输入到搭建好的模型,进行训练,并选取训练最好的n个模型,例如选取训练最好的3个模型;
识别模块505利用模型训练模块504选取的多个模型进行模型投票,获得最终结果;
推送模块506将被识别为套现的名单推送到后台为进一步对套现用户降额处理等提供依据,同时对于识别出来的套现交易进行时时阻断处理,减少银行相关损失。
根据本发明实施例,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信用卡套现行为的识别方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信用卡套现行为的识别方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述信用卡套现行为的识别方法。
本发明实施例中,通过多个训练好的识别模型得出的识别结果共同判断客户的行为,从而能够实时识别信用卡的交易行为,提升识别正确率以及识别效率,从而减少银行相关损失,降低银行金融风险。
需要说明的是,本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置、系统、和计算机程序产品的示意图和/或流程图和/或方框图来描述的。应理解示意图一个步骤或多个步骤和/或流程图一个流程或多个流程和/或方框图一个方框或多个方框的顺序可以不按照图中所示的顺序执行,可以根据实际需要选择适当的顺序。应理解可由计算机程序指令实现示意图和/或流程图和/或方框图中的每一步骤和/或操作和/或流程和/或方框、以及示意图和/或流程图和/或方框图中的步骤和/或操作和/或流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在示意图一个步骤或多个步骤和/或流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在示意图一个步骤或多个步骤和/或流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在示意图一个步骤或多个步骤和/或流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种信用卡套现行为的识别方法,其特征在于,所述识别方法包括:
获取目标信用卡的交易数据;
从所述交易数据中提取预定的多组特征对应的信息;
将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;以及
根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为;
其中,每组特征包括以下特征中的至少一个:客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征。
2.根据权利要求1所述的识别方法,其中,所述识别方法还包括:
对获取的所述交易数据进行数据归一化处理。
3.根据权利要求2所述的识别方法,其中,
经过所述数据归一化处理后的交易数据呈均值为0,方差为1的正态分布。
4.根据权利要求1所述的识别方法,其中,所述识别模型是基于XGBOOST模型建立的机器学习模型。
5.根据权利要求1所述的识别方法,其中,所述投票策略为选择所述多个识别结果中位于判定阈值一侧的识别结果数量多的识别结果作为判断所述目标信用卡是否存在信用卡套现行为的依据。
6.根据权利要求1至5中的任意一项所述的识别方法,其中,
所述客户静态信息包括年龄、性别、学历、开户时间、开卡时间、持卡数量、居住地中的至少一个;
所述客户动态信息包括客户的最新授信额度限额;
所述账单特征包括以下数据中的至少一个:交易时间、最新账单周期额度使用率、最近预定数量的账单周期额度使用率、最近预定期间内的账单周期使用率、最新账单周期在折扣率低于第一阈值的商户交易金额占比、最近预定数量的账单周期在折扣率低于第一阈值的商户交易金额占比、最新账单周期内交易额度大于第二阈值的商家总数、最近连续预定数量的账单周期内交易额度大于第二阈值的商家总数、最近预定数量的账单周期内交易额度大于第二阈值的商家总数、最新预定数量的账单周期在免息期最后预定时间内进行还款并在下一个账单周期达到额度的第三阈值以上的平均天数、最近预定数量的账单周期消费总笔数、在最近预定数量的账单周期内消费金额占授信额度的第一比例以上且还款额度占消费额度的第一比例以上的天数、最近预定数量的账单周期平均每笔消费金额、最近预定期间内消费时间在预定时间段在预定商店的消费金额、最近预定期间内消费时间在预定时间段在预定商店的消费笔数、最近预定期间内消费时间在预定时间段在预定商店的消费金额占比、最近预定期间内连续在同一家商店消费的最大总金额、最近预定期间内连续在同一家商店消费的总次数、最近预定期间内连续在同一家商店消费的预定周期内的额度占比;
所述静态商户信息包括是否为高风险商户、商户的类型、商户成立的时间、商户地址中的至少一个;
所述动态商户信息包括以下数据中的至少一个:最近预定数量的账单周期商户法人在本人商户下交易金额总和、最近预定期间内商户法人在本人商户下交易金额总和、最近预定数量的账单周期内商户法人在本人商户下消费额度占总额度的百分比。
7.一种信用卡套现行为的识别装置,其特征在于,所述装置方法包括:
数据获取单元,其获取目标信用卡的交易数据;
信息提取单元,其从所述交易数据中提取预定的多组特征对应的信息,其中,每组特征包括以下特征中的至少一个:客户静态信息、客户动态信息、账单特征、静态商户信息、动态商户信息、账单与商户关联特征;
计算单元,其将每组特征对应的信息分别输入到对应的预先建立的识别模型,计算每组特征对应的识别结果;
判断单元,其根据多组特征对应的多个识别结果采用投票策略判断所述目标信用卡是否存在信用卡套现行为。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的识别方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的识别方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211505197.5A CN115796884A (zh) | 2022-11-28 | 2022-11-28 | 信用卡套现行为的识别方法和识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211505197.5A CN115796884A (zh) | 2022-11-28 | 2022-11-28 | 信用卡套现行为的识别方法和识别装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115796884A true CN115796884A (zh) | 2023-03-14 |
Family
ID=85442502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211505197.5A Pending CN115796884A (zh) | 2022-11-28 | 2022-11-28 | 信用卡套现行为的识别方法和识别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115796884A (zh) |
-
2022
- 2022-11-28 CN CN202211505197.5A patent/CN115796884A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108846520B (zh) | 贷款逾期预测方法、装置以及计算机可读存储介质 | |
CN110648214B (zh) | 一种确定异常账户的方法及装置 | |
Bravo et al. | Granting and managing loans for micro-entrepreneurs: New developments and practical experiences | |
CN112926699A (zh) | 异常对象识别方法、装置、设备及存储介质 | |
CN110895758B (zh) | 存在作弊交易的信用卡账户的筛选方法、装置及系统 | |
CN109583966A (zh) | 一种高价值客户识别方法、系统、设备及存储介质 | |
CN112184025B (zh) | 外币预约的智能配钞方法及装置 | |
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN106530074A (zh) | 大金额出账控制方法、系统以及头寸管理信息系统 | |
CN106780008A (zh) | 一种积分管理方法和装置 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
WO2023204288A1 (ja) | 情報処理装置およびプログラム | |
US20090192810A1 (en) | Fraud detection system & method | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN110991650A (zh) | 训练养卡识别模型、识别养卡行为的方法及装置 | |
CN113807943A (zh) | 一种不良资产的多因子估值方法及系统、介质、设备 | |
CN111652716A (zh) | 首贷户标签确定方法及装置 | |
CN117094764A (zh) | 银行积分处理方法及装置 | |
CN107305662A (zh) | 识别违规账户的方法及装置 | |
CN115796884A (zh) | 信用卡套现行为的识别方法和识别装置 | |
CN113870010A (zh) | 基于机器学习的数据处理方法、装置、设备及存储介质 | |
CN113987351A (zh) | 基于人工智能的智能推荐方法、装置、电子设备及介质 | |
CN113222742B (zh) | 基于区块链的货币基金快速赎回份额共享方法及装置 | |
US12045261B2 (en) | Method and apparatus for measuring material risk in a data set | |
CN111696248B (zh) | 钞票兑换方法及装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |