CN115187266B - 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 - Google Patents
基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 Download PDFInfo
- Publication number
- CN115187266B CN115187266B CN202210751373.7A CN202210751373A CN115187266B CN 115187266 B CN115187266 B CN 115187266B CN 202210751373 A CN202210751373 A CN 202210751373A CN 115187266 B CN115187266 B CN 115187266B
- Authority
- CN
- China
- Prior art keywords
- memory
- credit card
- transaction data
- normal distribution
- variation self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明属于异常检测领域,提供了基于记忆力变分自编码模型的信用卡欺诈检测方法及系统,包括获取待检测信用卡交易数据;基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。于编码和解码的过程中加入记忆力模块,有效地抑制了神经网络的泛化能力,从而提高了模型检测的准确度。
Description
技术领域
本发明属于异常检测领域,尤其涉及基于记忆力变分自编码模型的信用卡欺诈检测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
大数据和人工智能等技术推动了金融支付的极大发展,信用卡由于其具有为持卡人提供支付便利、暂时缓解经济压力等优势,逐渐占领市场。
与此同时,信用卡欺诈的方式也因此增多,比如信用卡因遗失或被盗而被他人冒刷;申请人以虚假的身份信息及资信证明进行信用卡申请,并进行欺诈性消费;伪造者窃取信用卡用户的真实资料,根据该资料进行信用卡诈骗等,严重阻碍了金融行业的长久发展。
如何有效的侦测和防范交易欺诈行为不仅成为各个银行机构关注的重点,也成为诸多学者的主要研究目标。在欺诈风险评估领域,国外最早采用的是经验判别分析法,主要依靠专业评估人员的经验和能力进行主观性分析;随着计算机计算速度的提升,以Logistic回归为基础建立的分类模型逐渐代替经验判别分析法,成为欺诈风险评估的主流建模方法;2014年,Dash使用决策树进行信用卡欺诈检测,挖掘出正常交易与欺诈交易之间的区别,以此识别新加入的用户交易是否正常;除此之外,还有学者将自动编码器和随机森林进行组合来检测欺诈风险。
通过欺诈模型的发展历程,可以发现,模型所使用的方法越来越依赖于合适的算法。
在传统的机器学习领域,机器学习方法可以分为有监督学习和无监督学习两类。有监督学习是指利用给定的有类别标号的数据样本进行学习,建立描述数据分类或概念集的分类器或模型,对给定的未标注样本类别进行预测的学习方法;无监督学习不需要事先给定已标记数据,而仅仅根据数据的总体信息进行学习建模,并描述其数据划分或聚类形式。传统的有监督机器学习方法往往需要构建一个类别平衡的数据集来训练模型,而在现实生活中,信用卡欺诈交易发生的频率远远低于正常交易发生的频率,因此在训练集中很难获得足够多的欺诈交易样本,无法满足有监督机器学习模型的训练要求。此外,构建一个类别平衡、数据量充足的数据集还需要耗费大量的时间与资源。而无监督学习尽管不需要构建数据集,但与此同时也无法很好地利用已有数据的标签信息,模型效果往往不尽人意。
自编码器是深度学习领域中一类重要的神经网络模型。自编码器包含两个部分,分别为编码器和解码器。输入数据先经过编码器进行编码从而得到一个隐变量,然后解码器借助该隐变量对输入数据进行重建。如果重建数据和输入数据非常接近,那么就表明隐变量和输入数据存在关联或者某种映射关系,中间结果就可以作为输入数据的一个特征向量表示。自编码器以及其相关扩展模型被应用于许多领域,特别是数据降维、特征表示、信息检索、分类任务等。然而标准的自编码器将输入转换为隐空间中的表达不是连续的,这使得其中的插值和扰动难以完成,从而导致解码器生成非真实的输出。
随着神经网络的深度和复杂性增加,深度学习模型展现出很强的泛化能力。也就是说,即使训练中没有异常交易数据,测试时将异常交易数据输入编码器,由于神经网络的强泛化能力,解码器也能重建出异常交易数据,这就导致无论输入正常交易数据还是异常交易数据,重建前后的重构概率都很大,从而降低了模型检测的准确度。
发明内容
为了解决上述背景技术中存在的至少一项技术问题,本发明提供基于记忆力变分自编码模型的信用卡欺诈检测方法及系统,其在使用半监督学习的前提下,于编码和解码的过程中加入记忆力模块,由于只使用正常交易数据训练记忆力变分自编码模型,所以记忆力模块所记录的均为正常交易数据的隐变量概率分布特征,即便将异常交易数据输入编码器,经过记忆力模块运算后,解码器也只能重建出正常交易数据;输入正常交易数据时,重建前后的重构概率很大,而输入异常交易数据时,重建前后的重构概率很小,有效地抑制了神经网络的泛化能力,从而提高了模型检测的准确度。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供基于记忆力变分自编码模型的信用卡欺诈检测方法,包括如下步骤:
获取待检测信用卡交易数据;
基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;
所述记忆力变分自编码模型的构建过程包括:
基于编码器,对待检测信用卡交易数据进行编码得到隐变量的正态分布参数;
结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数;
对新的正态分布参数使用重参数化技巧,经过解码器解码后得到重建后的交易数据;
基于待检测信用卡交易数据和重建后的交易数据得到重构概率;
将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。
本发明的第二个方面提供基于记忆力变分自编码模型的信用卡欺诈检测系统,包括:
数据获取模块,用于获取待检测信用卡交易数据;
记忆力变分自编码模型构建模块,用于基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;
所述记忆力变分自编码模型的构建过程包括:
基于编码器,对待检测信用卡交易数据进行编码得到隐变量的正态分布参数;
结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数;
对新的正态分布参数使用重参数化技巧,经过解码器解码后得到重建后的交易数据;
基于待检测信用卡交易数据和重建后的交易数据得到重构概率;
信用卡欺诈检测模块,用于将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于记忆力变分自编码模型的信用卡欺诈检测方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于记忆力变分自编码模型的信用卡欺诈检测方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明在使用半监督学习的前提下,于编码和解码的过程中加入记忆力模块;由于只使用正常交易数据训练记忆力变分自编码模型,所以记忆力模块所记录的均为正常交易数据的隐变量概率分布特征,即便将异常交易数据输入编码器,经过记忆力模块运算后,解码器也只能重建出正常交易数据;在输入正常交易数据时,重建前后的重构概率很大,而输入异常交易数据时,重建前后的重构概率很小;这有效地抑制了神经网络的泛化能力,从而提高了模型检测的准确度。
本发明考虑到信用卡欺诈交易发生的频率远远低于正常交易发生的频率,因此在训练集中很难获得足够多的异常交易样本,本发明采取半监督学习的方法解决上述数据集不平衡的问题;不同于标准的自编码器,本发明使用变分自编码器,避免了隐空间中表达不连续的缺陷,以便进行随机采样和插值,使得解码器能够对噪声具有鲁棒性,增加模型的有效性。
本发明因此在异常检测任务中,我们采用了半监督学习方法,只使用正样本作为训练集,这样既大大减小了构建数据集的成本,又可以很好地适应信用卡欺诈异常检测任务中类别极不平衡的问题。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明的架构示意图;
图2为本发明中记忆力变分自编码模型的原理示意图;
图3为本发明中记忆力变分自编码模型的编码器结构示意图;
图4为本发明中记忆力变分自编码模型的的记忆力模块原理示意图;
图5为本发明中记忆力变分自编码模型的解码器结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
如图1-图2所示,本实施例提供了基于记忆力变分自编码模型的信用卡欺诈检测方法,包括如下步骤:
获取待检测信用卡交易数据;
基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;
所述记忆力变分自编码模型的构建过程包括:
基于编码器,对待检测信用卡交易数据进行编码得到隐变量的正态分布参数;
结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数;
对新的正态分布参数使用重参数化技巧,经过解码器解码后得到重建后的交易数据;
基于待检测信用卡交易数据和重建后的交易数据得到重构概率;
将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。
为了更清楚地说明本发明的技术方案,下面以实施例的方式进一步说明。
S101:获取历史信用卡交易数据,进行预处理和数据划分;
作为一种或多种实施例,S101中,信用卡交易原始数据为信用卡交易记录,包含每次交易的时间、地点、额度等信息。
所述对数据进行预处理的过程包括:数据清洗、数据降维以及关键特征提取等。
具体为:首先清洗数据,如剔除脏数据、用0或平均值填补缺失数据、修正错误数据等;然后进行PCA降维,提取数据中的关键特征,同时隐去部分交易信息来保护用户隐私,得到可以应用于模型的数据集。
预处理后的数据集中每条数据均为N维的向量,采用分层抽样的方法,按照8:2的比例将其划分为训练集和测试集。
本实施例中,采用了半监督学习方法,只使用正样本作为训练集,这样既大大减小了构建数据集的成本,又可以很好地适应信用卡欺诈异常检测任务中类别极不平衡的问题。
S102:将历史信用卡交易数据输入编码器,得到隐变量的正态分布参数;
参见图3,将经过S101处理后的训练集中的数据向量x输入编码器,得到隐变量的正态分布参数μ和σ;
其中,μ是隐变量的均值,σ是隐变量的均方差。
作为一种或多种实施例,S102中,所述编码器使用深度神经网络,采用输入层-隐藏层-输出层的结构,每一层网络的输出都将作为下一层网络的输入。每层神经网络均由数个神经元组成,神经元的参数包括连接权重ω、偏置b和激活函数λ(·);
本实施例中,所述激活函数可以为ReLU、Sigmoid等。
神经元的输出z和输入x的关系如公式(1)所示。
z=λ(wx+b) (1)
编码器的输入层神经元个数与原始交易数据的维度相匹配,隐藏层与输出层的维度可以根据实际情况进行调整,其中输出层的维度即为隐变量与记忆力向量的维度,且编码器拥有两个维度相同的独立的输出层,分别输出μ和σ。
若假设该过程中编码器的参数为则正态分布参数的计算公式如(2)所示:
其中,函数表示编码器的编码过程,即将数据向量x输入编码器,经过编码后输出μ和σ。
S103:将隐变量的正态分布参数输入记忆力模块,得到新的正态分布参数;
具体包括:
S301:将隐变量的正态分布参数分别输入结构相同的记忆力模块;
S302:求正态分布参数与记忆力模块中的每个记忆力向量的余弦相似度;
S303:根据余弦相似度,通过softmax得到每个记忆力向量的权重;
S304:对记忆力向量求加权平均得到输出向量,即新的正态分布参数。
下面结合公式进一步进行说明:
参见图4,记忆力模块是由K个c维记忆力向量组成的矩阵,表示为M={mj},mj∈Rc,j=1,2,…,K。
以将隐变量的均值μ输入记忆力模块为例进行说明,具体算法实现过程如下:
针对输入向量μ,首先求μ与记忆力模块中的每个向量mj的余弦相似度d(μ,mj),如(3)所示。
然后通过softmax得到每个记忆力向量的权重ωj,j=1,2,…,K,如(4)所示。
最后对记忆力向量加权求平均即得到输出如(5)所示。
若假设该过程中记忆力模块的参数为m1,则经过记忆力模块映射后的隐变量均值为μ′,计算过程如(6)所示。
σ′=m2(σ) (6)
同时使用相同的计算方法将隐变量的均方差σ输入另一个结构相同的记忆力模块中,若假设该过程中记忆力模块的参数为m2,则得到经过记忆力模块映射后的隐变量均方差为σ′,计算过程如(7)所示。
σ′=m2(σ) (7)
μ′和σ′即为新的正态分布参数。
S104:对新的正态分布参数使用重参数化技巧,将结果输入解码器,得到重建交易数据。
将正态分布参数输入解码器前,为了避免采样操作不可导,首先对μ′和σ′使用重参数化技巧,进行如(8)所示的计算,
y=μ′+σ′×ε (8)
其中,ε是从标准正态分布中采样得到的向量,所得的y为待解码向量。
参见图5,将y输入解码器中,经过解码得到重建后的交易数据向量
其中,解码器与编码器类似,使用深度神经网络,采用输入层-隐藏层-输出层的结构,只是解码器的输入层仅有一个,其余各部分结构与编码器完全对称,以此保证重建后的交易数据与原始交易数据的维度一致。
若假设该过程中解码器的参数为θ,则重建后的向量计算公式如(9)所示,
其中,函数fθ(·)表示解码器的解码过程,即将数据向量y输入解码器,经过解码后得到输出
S105:使用训练数据集训练模型,对模型的参数进行调整。
对模型的训练过程就是使用损失函数更新模型参数的过程,模型的参数包括神经网络中层与层之间所有神经元的连接权重、所有隐藏层神经元和输出神经元的偏置、每层神经元的个数、记忆力向量等。依据梯度下降的原则,对每个参数进行更新,直至损失函数逐渐收敛,以此得到优化的模型。
其中,记忆力变分自编码器的损失函数由变分自编码器损失函数和记忆力模块损失函数两部分组成。
变分自编码器损失函数的推导形式如(10)所示,
其中,Lrecon为重构概率损失函数,表示原始数据与重建数据的重构损失,可以用均方误差或交叉熵来衡量;LKL为正则化项,用编码器所得到的隐变量后验分布与隐变量的先验分布p(y)之间的KL散度来衡量。
假设模型中隐变量的先验分布为标准正态分布,因此LKL即为编码器所得的正态分布与标准正态分布的KL散度,假设μ和σ为分量为μi和σi的K维向量,i=1,…,K,那么N(μ,σ2)和N(0,1)的KL散度计算公式如(11)所示。
记忆力模块损失函数通过类间散度矩阵的迹和类内散度矩阵的迹来刻画。以将隐变量的均值μ输入记忆力模块为例进行说明,具体算法实现过程如下:
以每个记忆力向量mj为聚类中心对输入向量进行聚类,首先计算所有记忆力向量的中心向量如(12)所示。
然后计算类间散度矩阵Sb,如(13)所示,
其中,nj为距离聚类中心mj最近的向量个数。
Sj为以mj为聚类中心的类内散度矩阵,计算公式如(14)所示。
其中,为距离mj最近的向量集合,则类内散度矩阵Sw的计算公式如(15)所示。
记忆力模块的损失函数如(16)所示。
记忆力变分自编码器的损失函数如(17)所示。
Ltotal=LVAE+Lmem (17)
得到模型的损失函数Ltotal后,根据损失更新参数,依据梯度下降的原则,以目标负梯度方向调整参数的速度最快,如对连接权重ω的更新公式如(18)所示,用来决定更新的快慢,
其中,η为学习率,Ltotal为公式(17)计算出的损失。
类似地也可以得到其他参数的更新公式,便可将整个模型更新,更新全部完成后则该算法训练结束。
S106:将测试数据集输入训练好的模型,通过计算重构概率对欺诈行为进行检测,并计算模型的各项性能指标,从而进一步调整模型的参数。
S106的具体实现过程为:
S601:将测试数据集输入训练好的记忆力变分自编码模型;
S602:通过计算重构概率进行欺诈行为检测;
S603:计算评价模型性能的指标;
S604:根据模型性能好坏,进一步调整参数。
将测试数据输入训练好的记忆力变分自编码模型,其中,测试数据集含有正常交易数据和异常交易数据。
对每个数据样本进行重建并计算重构概率,重构概率的计算方法与损失函数中的重构概率损失函数相同,可以选择均方误差或交叉熵的方式,均方误差Εmse或交叉熵Εcrossentropy越小则说明重构概率越大,计算方式如(19)所示。
然后按照重构概率的大小进行排序。由于在划分训练集和测试集时已经提前知道异常交易数据在测试集中所占比例,因此将重构概率最小的相同比例的数据判定为异常交易数据,将其他数据判定为正常交易数据。
依据检测结果求出模型的准确率、召回率、ROC曲线等,作为评价模型性能的指标,以此检测模型性能的好坏,从而进一步调整模型参数;其中,模型的参数包括神经网络中层与层之间所有神经元的连接权重、所有隐藏层神经元和输出神经元的偏置、每层神经元的个数、记忆力向量等。
然后重复步骤S102~S106,该重复过程可以根据模型的性能与任务的需求多次进行或不进行。
S107:将信用卡交易数据输入调整好的模型,以此进行欺诈行为检测。
在对应用于真实情景下的信用卡交易数据进行异常检测时,如果根据先前经验,可以估算出异常交易数据所占比例,那么可以使用S106中的方法来判断交易数据是否异常。如果不知道异常交易数据所占比例,那么可以参考先前每次测试时正常交易数据与异常交易数据分界处的重构概率,选取一个合适的阈值,将重构概率高于该阈值的判定为正常交易数据,将重构概率低于该阈值的判定为异常交易数据。阈值的选取亦可根据真实任务的需求进行适当调整。
S108:若经过一段时间出现了新数据需要重新训练,则返回步骤S101。
上述技术方案的优点在于,在使用半监督学习的前提下,在编码和解码的过程中加入记忆力模块;由于只使用正常交易数据训练记忆力变分自编码模型,所以记忆力模块所记录的均为正常交易数据的隐变量概率分布特征,即便将异常交易数据输入编码器,经过记忆力模块运算后,解码器也只能重建出正常交易数据;于是输入正常交易数据时,重建前后的重构概率很大,而输入异常交易数据时,重建前后的重构概率很小;这有效地抑制了神经网络的泛化能力,从而提高了模型检测的准确度。
实施例二
本实施例提供基于记忆力变分自编码模型的信用卡欺诈检测系统,包括:
数据获取模块,用于获取待检测信用卡交易数据;
记忆力变分自编码模型构建模块,用于基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;
所述记忆力变分自编码模型的构建过程包括:
基于编码器,对待检测信用卡交易数据进行编码得到隐变量的正态分布参数;
结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数;
对新的正态分布参数使用重参数化技巧,经过解码器解码后得到重建后的交易数据;
基于待检测信用卡交易数据和重建后的交易数据得到重构概率;
信用卡欺诈检测模块,用于将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于记忆力变分自编码模型的信用卡欺诈检测方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于记忆力变分自编码模型的信用卡欺诈检测方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于记忆力变分自编码模型的信用卡欺诈检测方法,其特征在于,包括如下步骤:
获取待检测信用卡交易数据;
基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;
所述记忆力变分自编码模型的构建过程包括:
基于编码器,对待检测信用卡交易数据进行编码得到隐变量的正态分布参数;
结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数;
对新的正态分布参数使用重参数化技巧,经过解码器解码后得到重建后的交易数据;
基于待检测信用卡交易数据和重建后的交易数据得到重构概率;
记忆力变分自编码模型的训练使用损失函数更新模型参数,依据梯度下降的原则,对每个参数进行更新,直至损失逐渐收敛;
所述损失函数包括变分自编码器损失函数和记忆力模块损失函数;
其中,变分自编码器损失函数包括重构概率损失函数和正则化项,所述重构概率损失函数采用均方误差或交叉熵来衡量,所述正则化项采用编码器所得到的隐变量后验分布与隐变量的先验分布之间的KL散度来衡量;
记忆力模块损失函数通过类间散度矩阵的迹和类内散度矩阵的迹来刻画,包括:
以每个记忆力向量为聚类中心对隐变量正态参数分布进行聚类,计算所有记忆力向量的中心向量;
基于所有记忆力向量的中心向量和每个记忆力向量得到类间散度矩阵;
采用距离每个记忆力向量最近的向量集合和每个记忆力向量得到类内散度矩阵;
基于类间散度矩阵的迹和类内散度矩阵的迹得到记忆力模块损失函数;
将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。
2.如权利要求1所述的基于记忆力变分自编码模型的信用卡欺诈检测方法,其特征在于,所述结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数,包括:
将隐变量的所有正态分布参数分别输入结构相同的记忆力模块;
求正态分布参数与记忆力模块中的每个记忆力向量的余弦相似度;
根据余弦相似度,通过softmax得到每个记忆力向量的权重;
对记忆力向量求加权平均得到输出向量,即新的正态分布参数。
3.如权利要求1所述的基于记忆力变分自编码模型的信用卡欺诈检测方法,其特征在于,所述对新的正态分布参数使用重参数化技巧,包括:
基于新的正态分布参数与标准正态分布中采样的向量进行计算,得到可导的向量;将得到的可导向量输入解码器得到重建的向量。
4.如权利要求1所述的基于记忆力变分自编码模型的信用卡欺诈检测方法,其特征在于,所述编码器使用深度神经网络,采用输入层-隐藏层-输出层的结构,每一层网络的输出都将作为下一层网络的输入,每层神经网络均由数个神经元组成,神经元的参数包括连接权重、偏置和激活函数。
5.如权利要求1所述的基于记忆力变分自编码模型的信用卡欺诈检测方法,其特征在于,所述隐变量的正态分布参数包括隐变量的均值和均方差。
6.一种基于记忆力变分自编码模型的信用卡欺诈检测系统,其特征在于,包括:
数据获取模块,用于获取待检测信用卡交易数据;
记忆力变分自编码模型构建模块,用于基于待检测信用卡交易数据和训练好的记忆力变分自编码模型,进行欺诈行为检测,得到重构概率;
所述记忆力变分自编码模型的构建过程包括:
基于编码器,对待检测信用卡交易数据进行编码得到隐变量的正态分布参数;
结合隐变量的正态分布参数和记忆力模块,得到新的正态分布参数;
对新的正态分布参数使用重参数化技巧,经过解码器解码后得到重建后的交易数据;
基于待检测信用卡交易数据和重建后的交易数据得到重构概率;
记忆力变分自编码模型的训练使用损失函数更新模型参数,依据梯度下降的原则,对每个参数进行更新,直至损失逐渐收敛;
所述损失函数包括变分自编码器损失函数和记忆力模块损失函数;
其中,变分自编码器损失函数包括重构概率损失函数和正则化项,所述重构概率损失函数采用均方误差或交叉熵来衡量,所述正则化项采用编码器所得到的隐变量后验分布与隐变量的先验分布之间的KL散度来衡量;
记忆力模块损失函数通过类间散度矩阵的迹和类内散度矩阵的迹来刻画,包括:
以每个记忆力向量为聚类中心对隐变量正态参数分布进行聚类,计算所有记忆力向量的中心向量;
基于所有记忆力向量的中心向量和每个记忆力向量得到类间散度矩阵;
采用距离每个记忆力向量最近的向量集合和每个记忆力向量得到类内散度矩阵;
基于类间散度矩阵的迹和类内散度矩阵的迹得到记忆力模块损失函数;
信用卡欺诈检测模块,用于将重构概率和阈值进行比较,若重构概率高于该阈值判定为正常交易数据,否则判定为异常交易数据。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的基于记忆力变分自编码模型的信用卡欺诈检测方法中的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的基于记忆力变分自编码模型的信用卡欺诈检测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210751373.7A CN115187266B (zh) | 2022-06-29 | 2022-06-29 | 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210751373.7A CN115187266B (zh) | 2022-06-29 | 2022-06-29 | 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115187266A CN115187266A (zh) | 2022-10-14 |
CN115187266B true CN115187266B (zh) | 2023-08-25 |
Family
ID=83516093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210751373.7A Active CN115187266B (zh) | 2022-06-29 | 2022-06-29 | 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115187266B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117195130B (zh) * | 2023-09-19 | 2024-05-10 | 深圳市东陆高新实业有限公司 | 一种智能一卡通管理系统及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650485A (zh) * | 2016-09-18 | 2017-05-10 | 山东大学 | 基于Android 的个性化环境感知隐私保护方法 |
CN107679859A (zh) * | 2017-07-18 | 2018-02-09 | 中国银联股份有限公司 | 一种基于迁移深度学习的风险识别方法以及系统 |
CN110020623A (zh) * | 2019-04-04 | 2019-07-16 | 中山大学 | 基于条件变分自编码器的人体活动识别系统及方法 |
CN111950722A (zh) * | 2019-05-15 | 2020-11-17 | 天津科技大学 | 一种基于环境预测模型的强化学习方法 |
CN113065684A (zh) * | 2021-02-23 | 2021-07-02 | 北京航空航天大学 | 基于vae和深度学习组合模型的高速公路旅行时间预测方法 |
CN113449660A (zh) * | 2021-07-05 | 2021-09-28 | 西安交通大学 | 基于自注意增强的时空变分自编码网络的异常事件检测方法 |
CN113838041A (zh) * | 2021-09-29 | 2021-12-24 | 西安工程大学 | 一种基于自编码器的彩色纹理织物缺陷区域的检测方法 |
CN114037478A (zh) * | 2021-11-18 | 2022-02-11 | 北京明略软件系统有限公司 | 广告异常流量检测方法、系统、电子设备及可读存储介质 |
CN114297936A (zh) * | 2021-12-31 | 2022-04-08 | 深圳前海微众银行股份有限公司 | 一种数据异常检测方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112789625A (zh) * | 2018-09-27 | 2021-05-11 | 渊慧科技有限公司 | 承诺信息速率变分自编码器 |
US10685252B2 (en) * | 2018-10-30 | 2020-06-16 | Here Global B.V. | Method and apparatus for predicting feature space decay using variational auto-encoder networks |
-
2022
- 2022-06-29 CN CN202210751373.7A patent/CN115187266B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650485A (zh) * | 2016-09-18 | 2017-05-10 | 山东大学 | 基于Android 的个性化环境感知隐私保护方法 |
CN107679859A (zh) * | 2017-07-18 | 2018-02-09 | 中国银联股份有限公司 | 一种基于迁移深度学习的风险识别方法以及系统 |
CN110020623A (zh) * | 2019-04-04 | 2019-07-16 | 中山大学 | 基于条件变分自编码器的人体活动识别系统及方法 |
CN111950722A (zh) * | 2019-05-15 | 2020-11-17 | 天津科技大学 | 一种基于环境预测模型的强化学习方法 |
CN113065684A (zh) * | 2021-02-23 | 2021-07-02 | 北京航空航天大学 | 基于vae和深度学习组合模型的高速公路旅行时间预测方法 |
CN113449660A (zh) * | 2021-07-05 | 2021-09-28 | 西安交通大学 | 基于自注意增强的时空变分自编码网络的异常事件检测方法 |
CN113838041A (zh) * | 2021-09-29 | 2021-12-24 | 西安工程大学 | 一种基于自编码器的彩色纹理织物缺陷区域的检测方法 |
CN114037478A (zh) * | 2021-11-18 | 2022-02-11 | 北京明略软件系统有限公司 | 广告异常流量检测方法、系统、电子设备及可读存储介质 |
CN114297936A (zh) * | 2021-12-31 | 2022-04-08 | 深圳前海微众银行股份有限公司 | 一种数据异常检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115187266A (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pumsirirat et al. | Credit card fraud detection using deep learning based on auto-encoder and restricted boltzmann machine | |
CN109657547B (zh) | 一种基于伴随模型的异常轨迹分析方法 | |
Paula et al. | Deep learning anomaly detection as support fraud investigation in brazilian exports and anti-money laundering | |
Benchaji et al. | Using genetic algorithm to improve classification of imbalanced datasets for credit card fraud detection | |
Fan et al. | Robust deep auto-encoding Gaussian process regression for unsupervised anomaly detection | |
Chen | A hybrid ANFIS model for business failure prediction utilizing particle swarm optimization and subtractive clustering | |
CN110751557B (zh) | 一种基于序列模型的异常资金交易行为分析方法及系统 | |
CN106960358A (zh) | 一种基于农村电子商务大数据深度学习的金融欺诈行为量化检测系统 | |
CN112819604A (zh) | 基于融合神经网络特征挖掘的个人信用评估方法与系统 | |
CN111881722B (zh) | 一种跨年龄人脸识别方法、系统、装置及存储介质 | |
US20230061517A1 (en) | Verification of the Authenticity of Images Using a Decoding Neural Network | |
CN111652290A (zh) | 一种对抗样本的检测方法及装置 | |
Wu et al. | Optimized deep learning framework for water distribution data-driven modeling | |
CN111275098A (zh) | 应用于信用卡欺诈检测的Encoder-LSTM深度学习模型及其方法 | |
CN115187266B (zh) | 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 | |
Medel | Anomaly detection using predictive convolutional long short-term memory units | |
CN113240506A (zh) | 一种基于无监督领域自适应的金融风控冷启动建模方法 | |
Wang et al. | Reliable identification of redundant kernels for convolutional neural network compression | |
Triepels et al. | Anomaly detection in real-time gross settlement systems | |
CN112232948A (zh) | 一种流量数据的异常检测方法及装置 | |
CN116955947A (zh) | 一种降雨诱发的输电线路边坡位移非线性预测方法及系统 | |
CN111369339A (zh) | 一种基于过采样改进svdd的银行客户交易行为异常识别方法 | |
Menshchikov et al. | Comparative analysis of machine learning methods application for financial fraud detection | |
CN112889075B (zh) | 使用非对称双曲正切激活函数改进预测性能 | |
Li | Credit card fraud identification based on unbalanced data set based on fusion model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |