CN113487320A - 欺诈交易检测方法、装置、计算机设备和存储介质 - Google Patents

欺诈交易检测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113487320A
CN113487320A CN202110720322.3A CN202110720322A CN113487320A CN 113487320 A CN113487320 A CN 113487320A CN 202110720322 A CN202110720322 A CN 202110720322A CN 113487320 A CN113487320 A CN 113487320A
Authority
CN
China
Prior art keywords
transaction
data
sample
detection model
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110720322.3A
Other languages
English (en)
Inventor
路林林
周炬
邵俊
洪城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Suoxinda Data Technology Co ltd
Original Assignee
Shenzhen Suoxinda Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Suoxinda Data Technology Co ltd filed Critical Shenzhen Suoxinda Data Technology Co ltd
Priority to CN202110720322.3A priority Critical patent/CN113487320A/zh
Publication of CN113487320A publication Critical patent/CN113487320A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种欺诈交易检测方法、装置、计算机设备和存储介质。所述方法包括:获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。采用本方法能够提高对欺诈交易的检测精度。

Description

欺诈交易检测方法、装置、计算机设备和存储介质
技术领域
本申请涉及欺诈检测技术领域,特别是涉及一种欺诈交易检测方法、装置、计算机设备和存储介质。
背景技术
随着近几十年经济全球化的迅速发展,信用卡在商业交易中越来越流行。相应地信用卡欺诈问题也随之涌现,检测信用卡欺诈交易成为了银行业面临的挑战之一。互联网技术的普及,传统金融领域迎来了创新,信用卡欺诈检测系统是互联网金融科技的一个重要研究领域,信用卡欺诈检测系统利用用户的用户信息和信用卡交易事务数据,通过其核心算法,检测用户是否为欺诈用户,从而帮助银行或金融公司降低风险,提高利润。
现有技术中,对于信用卡欺诈交易的检测算法是基于二分类检测模型生成的,二分类检测模型中简单地将交易行为分为正常交易和欺诈交易,没有对正常交易的类型进行细分,在欺诈交易的实际检测中,导致了对于欺诈交易检测精度低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高欺诈检测精度的欺诈交易检测方法、装置、计算机设备和存储介质。
一种欺诈交易检测方法,所述方法包括:
获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
在其中一个实施例中,还包括:对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;
在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;
将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;
重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;
将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
在其中一个实施例中,还包括:分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;
根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;
基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
在其中一个实施例中,还包括:为所述欺诈交易样本数据设置对应的标签为欺诈交易;
为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
在其中一个实施例中,还包括:以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;
基于所述多分类检测模型参数,获取训练后的多分类检测模型。
在其中一个实施例中,还包括:获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;
对所述待检测交易信息进行特征提取,获取待检测交易数据;
将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
在其中一个实施例中,还包括:将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;
若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
一种欺诈交易检测装置,所述装置包括:
信息获取模块,用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
聚类处理模块,用于基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
模型训练模块,用于建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
欺诈检测模块,用于基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
上述欺诈交易检测方法、装置、计算机设备和存储介质,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
附图说明
图1为一个实施例中欺诈交易检测方法的应用环境图;
图2为一个实施例中欺诈交易检测方法的流程示意图;
图3为一个实施例中对正常交易样本数据进行聚类处理的流程示意图;
图4为一个实施例中欺诈交易检测装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的欺诈交易检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102和服务器104可分别单独用于执行本申请提供的欺诈交易检测方法。终端102和服务器104也可用于协同执行本申请提供的欺诈交易检测方法。例如,服务器104用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
其中,终端102可以但不限于能够生成交易信息的金融服交易终端,如ATM机、POS机等,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种欺诈交易检测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据。
其中,样本交易信息是用于训练检测欺诈交易的检测模型的交易信息;样本交易信息包括正常交易样本数据和欺诈交易样本数据;其中,正常交易样本数据是样本交易信息中正常交易的交易数据;欺诈交易样本数据是样本交易信息中欺诈交易的交易数据;正常交易样本数据包括正常交易的交易信息,包括但不限于交易用户的姓名、性别、年龄、身份证号码、交易类型、交易地点、交易时间和交易金额等;欺诈交易样本数据包括欺诈交易的交易信息,包括但不限于交易用户的姓名、性别、年龄、身份证号码、交易类型、交易地点、交易时间和交易金额等。
具体地,样本交易信息通常是选取的某时间范围内某交易终端进行的部分或全部信用卡交易的信息,通常保存于交易终端的后台数据库。获取数据库中样本交易信息,通过样本交易信息中的交易类型将样本交易信息分为正常交易样本数据和欺诈交易样本数据。
步骤204,基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。
具体地,通过k均值聚类算法对正常交易样本数据进行聚类处理,通过聚类处理将正常交易样本数据分为k个聚类,每个聚类的数据构成一个正常交易样本簇数据;其中k是大于1的整数,k的取值可根据应用需求进行测试选取出最优k值,如通过间隙统计的方法对k进行取值。
步骤206,建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
具体地,建立多分类检测模型时,多分类检测模型的类型可以是任意的多分类模型,如多标签决策树等,但不是二分类模型;建立好多分类检测模型以后,多分类检测模型以后会生成初始的多分类模型参数。根据欺诈交易样本数据和正常交易样本簇数据对建立的初始的多分类检测模型进行训练,训练完成后生成训练后的多分类检测模型。
步骤208,基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
其中,待检测交易信息是待检测交易的交易信息,待检测交易的交易信息内包含的交易信息类型与样本交易信息中的正常交易样本数据的信息类型和欺诈交易样本数据的信息类型是相同的,包括但不限于交易用户的姓名、性别、年龄、身份证号码、交易类型、交易地点、交易时间和交易金额等。
具体地,多分类检测模型训练完成以后,将待检测交易信息输入训练完成的多分类检测模型,根据多分类检测模型的输出结果,对待检测交易信息对应的交易行为的交易类型作出判定,进而实现识别待检测交易行为是否为欺诈交易的目的。
上述欺诈交易检测方法中,获取样本交易信息,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
在一个实施例中,如图3所示,所述基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据包括:
步骤301,对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;
步骤302,在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;
具体地,对正常交易样本数据进行聚类处理的目的是将正常交易样本数据划分为不同个正常交易样本簇数据,以保证每个正常交易样本簇数据中的数据是最相似的。进行k均值聚类处理时,首先对正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;归一化的作用是使正常交易样本数据中的各数据处于同一数量级,保证能够适合进行综合对比评价。归一化处理完成后,在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;k是大于1的整数,k的取值可根据应用需求进行测试选取出最优k值,如通过间隙统计的方法对k进行取值。
步骤303,将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;
步骤304,重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;
步骤305,将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
具体地,每次聚类处理完成以后,将正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点,并重复上述计算正常交易样本数据中的各数据点与各质心点的欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与最后一次聚类处理完成以后前一次获取的质心点之间的欧氏距离达到预设的收敛阈值,通常是小于等于收敛阈值时,将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
本实施例中,对正常交易样本数据进行归一化处理,在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算正常交易样本数据中的各数据点与各质心点的欧氏距离,并将正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类重新计算新的聚类的质心点,重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至符合预设目标时,将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。通过正常交易样本簇数据的获取,提高了对于正常交易样本数据的分类精度。
在一个实施例中,所述建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型包括:
分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;
根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;
基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
具体地,对多分类检测模型进行训练时,首先分别为欺诈交易样本数据和正常交易样本簇数据设置对应的不同的标签。其中,由于正常交易样本簇数据中包含不同的簇数据,为每簇数据分别设置对应的标签,正常交易样本簇数据中各簇数据的标签不同于欺诈交易样本数据的标签。标签设置好以后,根据欺诈交易样本数据及其对应的标签,和正常交易样本簇数据及其对应的标签,生成样本训练集;最后,基于样本训练集对多分类检测模型进行训练,获取训练后的多分类检测模型。
本实施例中,通过分别为欺诈交易样本数据和正常交易样本簇数据设置对应的不同的标签,并根据设置好标签的欺诈交易样本数据和正常交易样本簇数据生成样本训练集,最后根据样本训练集对多分类检测模型进行训练,实现了多分类检测模型的生成,提高了多分类检测模型的检测精度。
在一个实施例中,所述分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签包括:
为所述欺诈交易样本数据设置对应的标签为欺诈交易;
为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
具体地,为欺诈交易样本数据和正常交易样本簇数据设置对应的标签时,分别为欺诈交易样本数据和正常交易样本簇数据设置对应的不同的标签。欺诈交易样本数据设置对应的标签为欺诈交易;正常交易样本簇数据中各簇数据的标签不同于欺诈交易样本数据的标签,各簇数据的标签可以相同也可以不同,标签的类型可根据需要进行对应选择。如需要通过多分类检测模型检测出待检测交易的交易类型时,可以将各簇数据的标签设置为对应的交易类型。若只需要简单的判断待检测交易是否属于欺诈交易,可简单将各簇数据的标签设置为简单的数字,如0、1、2、3、4、5等。
本实施例中,通过为欺诈交易样本数据和正常交易样本簇数据分别设置对应的标签,提高了多分类检测模型的训练精度,同时提高了多分类检测模型的检测精度。
在一个实施例中,所述基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型包括:
以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;
基于所述多分类检测模型参数,获取训练后的多分类检测模型。
具体地,训练后的多分类检测模型时,以样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以样本训练集中的各标签作为输出,对多分类检测模型进行训练,当训练达到预期的要求时,生成训练后的多分类检测模型参数。根据多分类检测模型参数,能够确定训练后的多分类检测模型的模型参数,并确定训练后的多分类检测模型。
本实施例中,通过以样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以样本训练集中的各标签作为输出,对多分类检测模型进行训练,生成多分类检测模型参数,并基于多分类检测模型参数,获取训练后的多分类检测模型,提高了对多分类检测模型的训练精度。
在一个实施例中,所述基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易包括:
获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;
对所述待检测交易信息进行特征提取,获取待检测交易数据;
将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
具体地,基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易时,首先获取待检测交易信息,并对待检测交易信息信息进行特征提取,获取待检测交易数据;待检测交易数据中数据类型和对多分类检测模型进行训练时输入的数据类型是一致的。获取待检测交易数据以后,将待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
本实施例中,通过获取待检测交易信息,并对待检测交易信息进行特征提取,获取待检测交易数据,最后将待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易,实现了对待检查交易行为是否为欺诈交易的判定,提高了对欺诈交易的检测精度。
在一个实施例中,所述将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易包括:
将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;
若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
具体地,基于训练后的多分类检测模型对待检测交易数据进行处理时,将将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签。根据待检测交易数据对应的标签能够获取待检测交易行为是否为欺诈交易。若待检测交易数据的标签是欺诈交易,能够确定待检测交易行为为欺诈交易。若待检测交易数据的标签不是欺诈交易,能够确定待检测交易行为为正常交易,根据待检测交易数据的标签的不同类型还能够进一步确定待检测交易的其他标签信息,例如当待检测交易行为不是欺诈交易时,还可根据获取的标签信息确定交易类型,如0、1、2、3和4等。
本实施例中,通过将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签,并进一步根据待检测交易数据对应的标签判断出待检测交易行为是否是欺诈交易,提高了通过多分类检测模型对欺诈交易的检测精度。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种欺诈交易检测装置,包括:信息获取模块401、聚类处理模块402、模型训练模块403和欺诈检测模块404,其中:
信息获取模块401,用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据。
聚类处理模块402,用于基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。
模型训练模块403,用于建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
欺诈检测模块404,用于基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
在其中一个实施例中,聚类处理模块402,还用于对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
在其中一个实施例中,模型训练模块403,还用于分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
在其中一个实施例中,模型训练模块403,还用于为所述欺诈交易样本数据设置对应的标签为欺诈交易;为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
在其中一个实施例中,模型训练模块403,还用于以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;基于所述多分类检测模型参数,获取训练后的多分类检测模型。
在其中一个实施例中,欺诈检测模块404,还用于获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;对所述待检测交易信息进行特征提取,获取待检测交易数据;将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
在其中一个实施例中,欺诈检测模块404,还用于将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
上述欺诈交易检测装置,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
关于欺诈交易检测装置的具体限定可以参见上文中对于欺诈交易检测方法的限定,在此不再赘述。上述欺诈交易检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种欺诈交易检测方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:为所述欺诈交易样本数据设置对应的标签为欺诈交易;为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;基于所述多分类检测模型参数,获取训练后的多分类检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;对所述待检测交易信息进行特征提取,获取待检测交易数据;将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
上述计算机设备,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:为所述欺诈交易样本数据设置对应的标签为欺诈交易;为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;基于所述多分类检测模型参数,获取训练后的多分类检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;对所述待检测交易信息进行特征提取,获取待检测交易数据;将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
上述存储介质,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种欺诈交易检测方法,其特征在于,所述方法包括:
获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
2.根据权利要求1所述的方法,其特征在于,所述基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据包括:
对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;
在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;
将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;
重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;
将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
3.根据权利要求1所述的方法,其特征在于,所述建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型包括:
分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;
根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;
基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
4.根据权利要求3所述的方法,其特征在于,所述分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签包括:
为所述欺诈交易样本数据设置对应的标签为欺诈交易;
为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
5.根据权利要求3所述的方法,其特征在于,所述基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型包括:
以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;
基于所述多分类检测模型参数,获取训练后的多分类检测模型。
6.根据权利要求1所述的方法,其特征在于,所述基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易包括:
获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;
对所述待检测交易信息进行特征提取,获取待检测交易数据;
将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
7.根据权利要求6所述的方法,其特征在于,所述将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易包括:
将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;
若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
8.一种欺诈交易检测装置,其特征在于,所述装置包括:
信息获取模块,用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
聚类处理模块,用于基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
模型训练模块,用于建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
欺诈检测模块,用于基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110720322.3A 2021-06-28 2021-06-28 欺诈交易检测方法、装置、计算机设备和存储介质 Pending CN113487320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110720322.3A CN113487320A (zh) 2021-06-28 2021-06-28 欺诈交易检测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110720322.3A CN113487320A (zh) 2021-06-28 2021-06-28 欺诈交易检测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113487320A true CN113487320A (zh) 2021-10-08

Family

ID=77937751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110720322.3A Pending CN113487320A (zh) 2021-06-28 2021-06-28 欺诈交易检测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113487320A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117455497A (zh) * 2023-11-12 2024-01-26 北京营加品牌管理有限公司 一种交易风险检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651373A (zh) * 2016-12-02 2017-05-10 中国银联股份有限公司 一种混合欺诈交易检测分类器建立方法及装置
CN108304427A (zh) * 2017-04-28 2018-07-20 腾讯科技(深圳)有限公司 一种用户客群分类方法和装置
CN109145937A (zh) * 2018-06-25 2019-01-04 北京达佳互联信息技术有限公司 一种模型训练的方法及装置
CN110427958A (zh) * 2019-06-13 2019-11-08 浙江师范大学 一种融合无监督学习和监督学习的反馈式分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651373A (zh) * 2016-12-02 2017-05-10 中国银联股份有限公司 一种混合欺诈交易检测分类器建立方法及装置
CN108304427A (zh) * 2017-04-28 2018-07-20 腾讯科技(深圳)有限公司 一种用户客群分类方法和装置
CN109145937A (zh) * 2018-06-25 2019-01-04 北京达佳互联信息技术有限公司 一种模型训练的方法及装置
CN110427958A (zh) * 2019-06-13 2019-11-08 浙江师范大学 一种融合无监督学习和监督学习的反馈式分类方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117455497A (zh) * 2023-11-12 2024-01-26 北京营加品牌管理有限公司 一种交易风险检测方法及装置

Similar Documents

Publication Publication Date Title
CN108876133B (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
CN109729383B (zh) 双录视频质量检测方法、装置、计算机设备和存储介质
CN106709800B (zh) 一种基于特征匹配网络的社团划分方法和装置
CN110033170B (zh) 识别风险商家的方法及装置
CN112837069B (zh) 基于区块链与大数据的安全支付方法及云平台系统
CN110570312B (zh) 样本数据获取方法、装置、计算机设备和可读存储介质
US11062120B2 (en) High speed reference point independent database filtering for fingerprint identification
US10685347B1 (en) Activating a transaction card
US20190347472A1 (en) Method and system for image identification
CN109740040B (zh) 验证码识别方法、装置、存储介质和计算机设备
CN113468520A (zh) 应用于区块链业务的数据入侵检测方法及大数据服务器
CN112487284A (zh) 银行客户画像生成方法、设备、存储介质及装置
CN112950347B (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN113487320A (zh) 欺诈交易检测方法、装置、计算机设备和存储介质
US10410095B2 (en) Method and system for identifying a payment card design
CN111429289B (zh) 单病种识别方法、装置、计算机设备和存储介质
CN110717817A (zh) 贷前审核方法及装置、电子设备和计算机可读存储介质
CN114066564A (zh) 服务推荐时间确定方法、装置、计算机设备、存储介质
CN114154556A (zh) 样本预测模型的训练方法、装置、电子设备及存储介质
CN107025547A (zh) 支付通道检测方法、装置及终端
CN110716930A (zh) 数值转移方法、装置、计算机设备和存储介质
CN111967541B (zh) 基于多平台样本的数据分类方法及装置
CN112949752B (zh) 业务预测系统的训练方法及装置
CN110245302B (zh) 用于识别欺诈案件的策略生成方法及装置和电子设备
CN113239233A (zh) 个性化图像推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211008

RJ01 Rejection of invention patent application after publication