CN116485406A - 账户的检测方法及装置、存储介质和电子设备 - Google Patents
账户的检测方法及装置、存储介质和电子设备 Download PDFInfo
- Publication number
- CN116485406A CN116485406A CN202310451409.4A CN202310451409A CN116485406A CN 116485406 A CN116485406 A CN 116485406A CN 202310451409 A CN202310451409 A CN 202310451409A CN 116485406 A CN116485406 A CN 116485406A
- Authority
- CN
- China
- Prior art keywords
- target
- matrix
- account
- accounts
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 255
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 260
- 230000006399 behavior Effects 0.000 claims abstract description 125
- 238000000034 method Methods 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims abstract description 77
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 41
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 35
- 238000012502 risk assessment Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 238000013145 classification model Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012261 overproduction Methods 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种账户的检测方法及装置、存储介质和电子设备,涉及人工智能技术领域。该方法包括:获取第一矩阵和第二矩阵,其中,第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,目标行为表示目标账户登陆目标设备的行为,第二矩阵用于表示M个目标账户的属性信息,M个目标账户为待检测的账户;将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,其中,目标检测模型是基于图神经网络和聚类算法构建的模型,检测结果表示M个目标账户中是否存在第一账户,第一账户为存在非法的资金提取行为的账户。通过本申请,解决了相关技术中检测套现账户的效果较差的问题。
Description
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种账户的检测方法及装置、存储介质和电子设备。
背景技术
相关技术中,针对金融机构信用卡套现的行为,学术界和工业界提出了许多反套现方法,其中主流包括三大类:基于规则的方法、基于无监督学习的方法和基于有监督学习的方法。
基于规则的方法通过套现案例分析,挖掘套现账户的行为模式,从而建立一套识别信用卡套现行为的规则体系。当金融机构账户的交易行为与规则匹配,则会被系统检测出。
基于无监督学习的方法通过对无监督学习分类模型进行训练,例如HBOS(一种快速无监督异常检测算法)、LOF(局部异常因子算法)、随机森林、聚类等,进而识别出套现账户。首先,构建信用卡交易的特征工程,包括用户属性、商户属性、金额属性、时间戳属性等。然后,在特征工程的基础上添加历史交易流水数据。最后,在该数据集上对无监督学习分类模型进行训练,可有效检测出套现账户。
基于有监督学习的方法通过对有监督学习分类模型进行训练,例如决策树、SVM(支持向量机,一种二分类的模型)等,进而识别出套现账户。首先,构建信用卡交易的特征工程,包括账户属性、商户属性、金额属性、时间戳属性等。然后,在特征工程的基础上添加历史交易流水数据以及正负标签。最后,在该数据集上对有监督学习分类模型进行训练,可有效检测出套现账户。
但是,相关技术存在以下缺点:
基于规则的方法虽然得到了有效的应用,但是由于金融机构信用卡的套现行为变得逐渐隐蔽和复杂,并不能及时有效的更新和维护规则体系,所以基于规则的方法并不能较好的适应现有的应用场景。
基于无监督学习的方法主要具有两个缺陷,第一,如果训练模型的数据为正常交易数据,那么一些有别于大多交易记录的数据则会被视为套现行为,这是不准确的。第二,该方法在一些复杂的套现场景中如果不能得到标签的指导,并不能得到较好的结果。
基于有监督学习的方法需要对历史流水交易数据进行加标记,一定程度上耗费了人力和时间。此外,该类方法主要用于已知的套现账户的行为模式,对于一些新的行为模式是无法进行有效识别的。
针对相关技术中检测套现账户的效果较差的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种账户的检测方法及装置、存储介质和电子设备,以解决相关技术中检测套现账户的效果较差的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种账户的检测方法。该方法包括:获取第一矩阵和第二矩阵,其中,所述第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,所述目标行为表示目标账户登陆目标设备的行为,所述第二矩阵用于表示M个所述目标账户的属性信息,M个所述目标账户为待检测的账户,所述目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果,其中,所述目标检测模型是基于图神经网络和聚类算法构建的模型,所述检测结果表示M个所述目标账户中是否存在第一账户,所述第一账户为存在非法的资金提取行为的账户。
进一步地,获取第一矩阵和第二矩阵包括:获取二部图,其中,所述二部图中至少包括:M个所述目标账户、N个所述目标设备和所述目标账户登陆所述目标设备的行为信息,N为正整数;依据所述二部图,确定所述Y个目标行为中每两个目标行为之间的相似度;基于所述Y个目标行为中每两个目标行为之间的相似度,得到所述第一矩阵;依据所述二部图,确定M个所述目标账户中每个目标账户的属性信息;基于M个所述目标账户中每个目标账户的属性信息,得到所述第二矩阵。
进一步地,获取二部图包括:获取T个历史交易流水数据,其中,T为正整数;确定所述T个历史交易流水数据中的第一交易流水数据,其中,所述第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;从所述T个历史交易流水数据中去除所述第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;依据所述K个目标交易流水数据,得到所述二部图。
进一步地,所述目标检测模型通过以下方式得到:获取所述第一矩阵和所述第二矩阵;基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型;对所述第一检测模型进行迭代训练,得到所述目标检测模型。
进一步地,基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型包括:基于所述第一矩阵和所述第二矩阵,结合所述图神经网络,确定编码器和解码器;利用所述编码器和所述解码器对矩阵集合进行目标处理,得到第三矩阵,其中,所述矩阵集合中至少包括:所述第一矩阵和所述第二矩阵,所述目标处理至少包括:编码处理和解码处理;基于所述第三矩阵,结合所述聚类算法,确定检测器;依据所述编码器、所述解码器和所述检测器构建所述第一检测模型。
进一步地,对所述第一检测模型进行迭代训练,得到所述目标检测模型包括:确定对所述第一检测模型进行迭代训练的迭代次数;确定所述第一检测模型的初始参数和损失函数;通过所述损失函数对所述初始参数进行更新处理,并获取通过所述损失函数对所述初始参数进行更新处理的目标次数;当所述目标次数与所述迭代次数相同时,获取通过所述损失函数对所述初始参数进行更新处理得到的目标参数;将所述第一检测模型中的初始参数替换为所述目标参数,得到所述目标检测模型。
进一步地,在将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果之后,所述方法还包括:若所述检测结果表示M个所述目标账户中存在所述第一账户,则确定M个所述目标账户中的所述第一账户;对所述第一账户进行风险评估,得到评估结果,其中,所述评估结果用于表示所述第一账户是否存在风险;若所述评估结果表示所述第一账户存在风险,则向目标对象发送报警信息,其中,所述报警信息用于提示所述目标对象将所述第一账户的状态设置为冻结状态。
为了实现上述目的,根据本申请的另一方面,提供了一种账户的检测装置。该装置包括:第一获取单元,用于获取第一矩阵和第二矩阵,其中,所述第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,所述目标行为表示目标账户登陆目标设备的行为,所述第二矩阵用于表示M个所述目标账户的属性信息,M个所述目标账户为待检测的账户,所述目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;第一处理单元,用于将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果,其中,所述目标检测模型是基于图神经网络和聚类算法构建的模型,所述检测结果表示M个所述目标账户中是否存在第一账户,所述第一账户为存在非法的资金提取行为的账户。
进一步地,所述第一获取单元包括:第一获取模块,用于获取二部图,其中,所述二部图中至少包括:M个所述目标账户、N个所述目标设备和所述目标账户登陆所述目标设备的行为信息,N为正整数;第一确定模块,用于依据所述二部图,确定所述Y个目标行为中每两个目标行为之间的相似度;第二确定模块,用于基于所述Y个目标行为中每两个目标行为之间的相似度,得到所述第一矩阵;第三确定模块,用于依据所述二部图,确定M个所述目标账户中每个目标账户的属性信息;第四确定模块,用于基于M个所述目标账户中每个目标账户的属性信息,得到所述第二矩阵。
进一步地,所述第一获取模块包括:第一获取子模块,用于获取T个历史交易流水数据,其中,T为正整数;第一确定子模块,用于确定所述T个历史交易流水数据中的第一交易流水数据,其中,所述第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;第一去除子模块,用于从所述T个历史交易流水数据中去除所述第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;第二确定子模块,用于依据所述K个目标交易流水数据,得到所述二部图。
进一步地,所述目标检测模型通过以下方式得到:第二获取单元,用于获取所述第一矩阵和所述第二矩阵;第一构建单元,用于基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型;第一训练单元,用于对所述第一检测模型进行迭代训练,得到所述目标检测模型。
进一步地,所述第一构建单元包括:第五确定模块,用于基于所述第一矩阵和所述第二矩阵,结合所述图神经网络,确定编码器和解码器;第一处理模块,用于利用所述编码器和所述解码器对矩阵集合进行目标处理,得到第三矩阵,其中,所述矩阵集合中至少包括:所述第一矩阵和所述第二矩阵,所述目标处理至少包括:编码处理和解码处理;第六确定模块,用于基于所述第三矩阵,结合所述聚类算法,确定检测器;第一构建模块,用于依据所述编码器、所述解码器和所述检测器构建所述第一检测模型。
进一步地,所述第一训练单元包括:第七确定模块,用于确定对所述第一检测模型进行迭代训练的迭代次数;第八确定模块,用于确定所述第一检测模型的初始参数和损失函数;第二处理模块,用于通过所述损失函数对所述初始参数进行更新处理,并获取通过所述损失函数对所述初始参数进行更新处理的目标次数;第二获取模块,用于当所述目标次数与所述迭代次数相同时,获取通过所述损失函数对所述初始参数进行更新处理得到的目标参数;第一替换模块,用于将所述第一检测模型中的初始参数替换为所述目标参数,得到所述目标检测模型。
进一步地,所述装置还包括:第一确定单元,用于在将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果之后,若所述检测结果表示M个所述目标账户中存在所述第一账户,则确定M个所述目标账户中的所述第一账户;第二确定单元,用于对所述第一账户进行风险评估,得到评估结果,其中,所述评估结果用于表示所述第一账户是否存在风险;第一发送单元,用于若所述评估结果表示所述第一账户存在风险,则向目标对象发送报警信息,其中,所述报警信息用于提示所述目标对象将所述第一账户的状态设置为冻结状态。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质存储程序,其中,所述程序执行上述的任意一项所述的账户的检测方法。
为了实现上述目的,根据本申请的另一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的任意一项所述的账户的检测方法。
通过本申请,采用以下步骤:获取第一矩阵和第二矩阵,其中,第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,目标行为表示目标账户登陆目标设备的行为,第二矩阵用于表示M个目标账户的属性信息,M个目标账户为待检测的账户,目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,其中,目标检测模型是基于图神经网络和聚类算法构建的模型,检测结果表示M个目标账户中是否存在第一账户,第一账户为存在非法的资金提取行为的账户,解决了相关技术中检测套现账户的效果较差的问题。通过获取用于表示Y个目标行为中每两个目标行为之间的相似度的第一矩阵和用于表示M个目标账户的属性信息的第二矩阵,并将第一矩阵和第二矩阵输入基于图神经网络和聚类算法构建的目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,进而提升了检测套现账户的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的账户的检测方法的流程图;
图2是根据本申请实施例提供的金融机构信用卡套现账户检测模型的框架结构的示意图;
图3是根据本申请实施例提供的可选的账户的检测方法的流程图;
图4是根据本申请实施例提供的账户的检测装置的示意图;
图5是根据本申请实施例提供的电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据、交易流水数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
金融机构信用卡套现:金融机构信用卡套现是指持卡人不是通过正常合法手续提取现金,而是通过其他手段将卡中信用额度内的资金以现金的方式套取,同时又不支付金融机构提现费用的行为。该类行为极大的影响了金融机构的正常运营秩序,此外,也会破坏社会的诚信环境,阻碍金融机构信用卡业务的健康发展。
套现账户检测:针对现有的金融机构信用卡套现的行为,学术界和工业界提出了许多套现账户检测方法,其中,传统方法包括三大类:基于规则的方法、基于无监督学习的方法和基于有监督学习的方法。近年来,围绕图和深度学习的研究领域,研究者们提出了一种深度检测方法,即通过深度学习模型学习数据中结构和特征,进而用于无监督学习分类方法中。该方法在不同场景中均获得了较优越的效果。
图神经网络:图神经网络是指使用神经网络来学习图结构数据,提取和发掘图结构数据中的特征和模式,满足聚类、分类、预测、分割、生成等图学习任务需求的算法总称,其中应用较广泛的模型有图卷积网络、图自编码器、图注意力网络等。在本实施例中,采用了图自编码器用于学习账户-POS机二部图中的结构和特征。
DBSCAN:DBSCAN是一种基于密度的聚类算法,该方法属于无监督学习方法,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的特征空间中发现任意形状的聚类。在本实施例中,该方法用于检测套现账户。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的账户的检测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S001,获取第一矩阵和第二矩阵,其中,第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,目标行为表示目标账户登陆目标设备的行为,第二矩阵用于表示M个目标账户的属性信息,M个目标账户为待检测的账户,目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M。
例如,上述的目标设备可以为POS机(销售点情报管理系统,用于现金或易货额度出纳)。通过计算账户(上述的目标账户)在不同POS机上交易行为(上述的目标行为)的相似度,构建账户邻接矩阵(上述的第一矩阵),并构建账户特征矩阵(上述的第二矩阵),且账户特征矩阵中可以包括多个账户节点(上述的M个目标账户)的属性信息。
步骤S002,将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,其中,目标检测模型是基于图神经网络和聚类算法构建的模型,检测结果表示M个目标账户中是否存在第一账户,第一账户为存在非法的资金提取行为的账户。
例如,基于获得的账户邻接矩阵(上述的第一矩阵)和账户特征矩阵(上述的第二矩阵),利用图自编码器(上述的图神经网络)和DBSCAN(上述的聚类算法)构建金融机构信用卡套现账户检测模型(上述的目标检测模型)。然后可以将获得的账户邻接矩阵(上述的第一矩阵)和账户特征矩阵(上述的第二矩阵)输入构建的金融机构信用卡套现账户检测模型(上述的目标检测模型)中的编码器进行编码处理、解码器进行解码处理和检测器进行检测,识别出M个目标账户中的套现账户(上述的第一账户)。
通过上述的步骤S001至S002,通过获取用于表示Y个目标行为中每两个目标行为之间的相似度的第一矩阵和用于表示M个目标账户的属性信息的第二矩阵,并将第一矩阵和第二矩阵输入基于图神经网络和聚类算法构建的目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,进而提升了检测套现账户的效果。
可选地,在本申请实施例提供的账户的检测方法中,获取二部图包括:获取T个历史交易流水数据,其中,T为正整数;确定T个历史交易流水数据中的第一交易流水数据,其中,第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;从T个历史交易流水数据中去除第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;依据K个目标交易流水数据,得到二部图。
例如,可以先对历史交易流水数据进行预处理,且预处理的具体过程可以为,先获取多个历史交易流水数据(上述的T个历史交易流水数据),并清理多个历史交易流水数据中具有缺失值的样本;再对清理后的样本进行矫正,降低由于噪声数据对检测结果可能造成的影响。另外,上述的噪声数据可以为重复的样本数据、无法进行处理的样本数据、有问题的样本数据和过期的交易数据等,故在对清理后的样本进行矫正时,可以从清理后的样本中去除上述的这些噪声数据(上述的第一交易流水数据)。
然后将预处理的历史交易流水数据进行空间结构信息的抽取,构建账户-POS机二部图G={X,Y,E},X={X1,X2,...,XM}表示M个账户构成的集合,其中Xm表示第m个账户,m∈[1,M],Y={Y1,Y2,...,YN}表示N个POS机构成的集合,其中Yn表示第n个POS机,n∈[1,N],E={emn}m=1,2,...M,n=1,2,...N表示账户在不同POS机上交易行为的集合,emn表示账户Xm登录POS机Yn的行为,如果账户Xm在POS机Yn上进行登录,则emn=1,否则,emn=0。
通过上述的方案,可以降低噪声数据对检测结果的影响。同时根据获取到的交易流水数据,可以快速准确的构建账户-POS机二部图。
可选地,在本申请实施例提供的账户的检测方法中,获取第一矩阵和第二矩阵包括:获取二部图,其中,二部图中至少包括:M个目标账户、N个目标设备和目标账户登陆目标设备的行为信息,N为正整数;依据二部图,确定Y个目标行为中每两个目标行为之间的相似度;基于Y个目标行为中每两个目标行为之间的相似度,得到第一矩阵;依据二部图,确定M个目标账户中每个目标账户的属性信息;基于M个目标账户中每个目标账户的属性信息,得到第二矩阵。
例如,构建账户-POS机二部图结构,并表示为S=[S1,S2,...,SM]T,其中,Sm=[em1,em2,...,emN],m∈[1,M];然后可以通过余弦相似度计算账户间的交易行为相似度,即计算Si和Sj的相似度simij,相似度计算如式(1)所示:
然后再根据账户间的交易行为相似度构建账户邻接矩阵,且账户邻接矩阵如式(2)所示:
再根据构建的账户-POS机二部图结构来构建账户特征矩阵B,且账户特征矩阵B可以包括账户节点的属性信息。另外,上述的账户节点的属性信息可以为账户的名称等属性信息。
通过上述的方案,根据构建的账户-POS机二部图,可以快速准确的构建账户邻接矩阵和账户特征矩阵。
可选地,在本申请实施例提供的账户的检测方法中,目标检测模型通过以下方式得到:获取第一矩阵和第二矩阵;基于第一矩阵和第二矩阵,结合图神经网络和聚类算法,构建第一检测模型;对第一检测模型进行迭代训练,得到目标检测模型。
例如,可以基于构建的账户邻接矩阵和账户特征矩阵,并利用图自编码器(上述的图神经网络)和DBSCAN(上述的聚类算法)构建金融机构信用卡套现账户检测模型(上述的第一检测模型);再对构建的金融机构信用卡套现账户检测模型(上述的第一检测模型)进行训练,得到最终训练好的金融机构信用卡套现账户检测模型(上述的目标检测模型)。
通过上述的方案,可以对金融机构信用卡套现账户检测模型进行训练,从而可以使模型输出的套现账户检测结果更准确。
可选地,在本申请实施例提供的账户的检测方法中,基于第一矩阵和第二矩阵,结合图神经网络和聚类算法,构建第一检测模型包括:基于第一矩阵和第二矩阵,结合图神经网络,确定编码器和解码器;利用编码器和解码器对矩阵集合进行目标处理,得到第三矩阵,其中,矩阵集合中至少包括:第一矩阵和第二矩阵,目标处理至少包括:编码处理和解码处理;基于第三矩阵,结合聚类算法,确定检测器;依据编码器、解码器和检测器构建第一检测模型。
例如,构建的金融机构信用卡套现账户检测模型可以包含编码器、解码器和检测器三个部分。具体可以为:
1、将账户特征矩阵B和账户邻接矩阵A作为编码器的输入,通过编码器编码获取账户低维表示集合Z,编码过程的形式化表示如式(3)所示:
其中,GCN代表图卷积层,ReLU表示激活函数,W0和W1均为待学习的权重,且D为度矩阵;
2、解码过程的形式化表示如式(4)所示:
3、检测器采用DBSCAN对账户低维表示集合Z进行检测,进而识别套现账户。
通过上述的方案,可以快速准确的构建未经过训练的初始的金融机构信用卡套现账户检测模型。另外,通过采用图自编码器对数据的特征和结构进行学习,一定程度上较完整的保留了信用卡套现账户的行为信息,有助于获得鲁棒性和可解释性更强的套现账户检测结果。
可选地,在本申请实施例提供的账户的检测方法中,对第一检测模型进行迭代训练,得到目标检测模型包括:确定对第一检测模型进行迭代训练的迭代次数;确定第一检测模型的初始参数和损失函数;通过损失函数对初始参数进行更新处理,并获取通过损失函数对初始参数进行更新处理的目标次数;当目标次数与迭代次数相同时,获取通过损失函数对初始参数进行更新处理得到的目标参数;将第一检测模型中的初始参数替换为目标参数,得到目标检测模型。
例如,可以先为构建的未经过训练的初始的金融机构信用卡套现账户检测模型(上述的第一检测模型)建立式(5)所示的目标函数:
其中,N为账户数,y代表邻接矩阵A中某个元素的值,代表重构邻接矩阵/>中相应元素的值。
再对构建的未经过训练的初始的金融机构信用卡套现账户检测模型(上述的第一检测模型)进行初始化,初始化图自编码器参数W0和W1,并给定迭代次数、批大小和学习率;
然后迭代执行下面步骤(a)、(b)、(c)和(d),直到达到迭代次数,完成对金融机构信用卡套现账户检测模型的训练,获得模型的最优参数:
(a)将获取的账户特征矩阵B和账户邻接矩阵A作为编码器的输入,按式(3)编码器编码获取账户低维表示集合Z;
(b)按式(4)解码器解码得到完成正向传播;
(c)采用随机梯度下降法,通过优化式(5)中的目标函数L,完成反向传播,实现对图自编码器中权重W0和W1的更新;
(d)利用检测器对账户低维表示集合Z进行检测。
通过上述的方案,可以方便的完成对未经过训练的初始的金融机构信用卡套现账户检测模型的训练。
可选地,在本申请实施例提供的账户的检测方法中,在将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果之后,该方法还包括:若检测结果表示M个目标账户中存在第一账户,则确定M个目标账户中的第一账户;对第一账户进行风险评估,得到评估结果,其中,评估结果用于表示第一账户是否存在风险;若评估结果表示第一账户存在风险,则向目标对象发送报警信息,其中,报警信息用于提示目标对象将第一账户的状态设置为冻结状态。
例如,在获得检测结果之后,可以将检测结果输出至负责金融机构安全管理的相关人员(上述的目标对象),并对套现账号进行风险性评估以及进一步的针对性处理。而且,上述的进一步的针对性处理可以为将套现账号(上述的第一账户)进行冻结。
通过上述的方案,可以维护金融机构正常运营的秩序,同时可以促进金融机构的信用卡业务的发展。
另外,信用卡套现是指持卡人不是通过正常合法手续提取现金,而是通过其他手段将卡中信用额度内的资金以现金的方式套取,同时又不支付金融机构提现费用的行为。金融机构信用卡以免息周期长、利息成本低等特点成为最佳的套现对象。信用卡套现行为普遍存在且快速发展、呈现集团化、专业化、平台化发展趋势,其套现手法具有多样、隐蔽等特点,这些使得侦测和打击套现的难度非常大。
由于信用卡套现手段层出不穷,套现场景愈加复杂。目前,有大量套现人员通过注册有公司名字,但没有经营业务的公司来从金融机构或者第三方平台上购买POS机,然后这些人员通过帮大量客户套现赚取手续费或者采用以卡养卡的方式达到免息套现的目的。
现有的技术很少针对特定套现场景来解决问题,这使得一些技术并不适用于现有的套现场景中。本实施例克服了现有技术实用性不足的问题,通过分析POS机套现的问题场景和套现账户的行为模式,提出了一种基于图神经网络的金融机构信用卡套现账户检测方法,能够有效准确的检测出套现账户并对其进行处理。
通过本实施例提供的一种基于图神经网络的金融机构信用卡套现账户检测方法,能够对套现账户进行有效可靠的检测。
而且本实施例采用了下列技术方案:
本实施例通过分析金融机构信用卡套现账户的产生机制,重点关注账户在不同POS机上的交易活动,并据此提出了一种行为模式:交易聚集性。出于成本考虑,套现人员通常会向金融机构或者第三方平台采购一定量的POS机,然后刷取大量的金融机构信用卡进行套现。显而易见,套现账户将会与这些固定的POS机的ID(Identity Document,身份标识号)之间存在交易关系,而套现账户之间的交易关系是相似的。根据该行为模式,本实施例提供一种基于图神经网络的金融机构信用卡套现账户检测方法,该方法包含三个主要环节,S10为历史交易流水数据预处理环节,步骤S20-S40为金融机构信用卡套现账户检测模型构建及优化环节,步骤S50为套现账户检测结果输出及处理环节。
例如,图2是根据本申请实施例提供的金融机构信用卡套现账户检测模型的框架结构的示意图,图3是根据本申请实施例提供的可选的账户的检测方法的流程图,如图2和图3所示,可选的账户的检测方法(一种基于图神经网络的金融机构信用卡套现账户检测方法),具体步骤如下:
S10、对历史交易流水数据进行预处理,降低噪声数据对检测结果的影响;
S20、对步骤S10预处理后获得的历史交易流水数据进行空间结构信息的抽取,构建账户-POS机二部图,并获取账户邻接矩阵和账户特征矩阵;
S30、基于步骤S20获得的账户邻接矩阵和账户特征矩阵,利用图自编码器和DBSCAN构建金融机构信用卡套现账户检测模型;
S40、对于步骤S30构建的金融机构信用卡套现账户检测模型,通过迭代计算方式对模型进行训练,确定模型的最优参数;
S50、利用S30构建的金融机构信用卡套现账户检测模型,以及步骤S40确定的模型最优参数,将套现账户检测结果进行输出并对套现账户进行处理。
进一步,所述步骤S10中对历史交易流水数据进行预处理具体包含以下步骤:
S11、清理历史交易流水数据中具有缺失值的样本;
S12、对样本进行矫正,降低由于噪声数据对检测结果可能造成的影响。
进一步,所述步骤S20具体包含以下步骤:
S21、将步骤S10预处理的历史交易流水数据进行空间结构信息的抽取,构建账户-POS机二部图G={X,Y,E},X={X1,X2,...,XM}表示M个账户构成的集合,其中Xm表示第m个账户,m∈[1,M],Y={Y1,Y2,...,YN}表示N个POS机构成的集合,其中Yn表示第n个POS机,n∈[1,N],E={emn}m=1,2,...M,n=1,2,...N表示账户在不同POS机上交易行为的集合,emn表示账户Xm登录POS机Yn的行为,如果账户Xm在POS机Yn上进行登录,则emn=1,否则,emn=0;
S22、构建账户-POS机二部图结构,并表示为S=[S1,S2,...,SM]T,其中,Sm=[em1,em2,...,emN],m∈[1,M];
S23、通过余弦相似度计算账户间的交易行为相似度,即计算Si和Sj的相似度simij,相似度计算如式(1)所示:
S24、账户邻接矩阵如式(2)所示:
S25、根据步骤S22获得的账户-POS机二部图来构建账户特征矩阵B,包括账户节点的属性信息。
进一步,所述步骤S30中构建的金融机构信用卡套现账户检测模型包含编码器、解码器和检测器三个部分。
所述步骤S30具体包含以下步骤:
S31、将账户特征矩阵B和账户邻接矩阵A作为编码器的输入,通过编码器编码获取账户低维表示集合Z,编码过程的形式化表示如式(3)所示:
其中,GCN代表图卷积层,ReLU表示激活函数,W0和W1均为待学习的权重,且D为度矩阵;
S32、解码过程的形式化表示如式(4)所示:
S33、检测器采用DBSCAN对账户低维表示集合Z进行检测,进而识别套现账户。
该方法所述步骤S40包含以下具体步骤:
S41、为S30建立的金融机构信用卡套现账户检测模型建立式(5)所示的目标函数:
其中,N为账户数,y代表邻接矩阵A中某个元素的值,代表重构邻接矩阵/>中相应元素的值。
S42、对步骤S30中的金融机构信用卡套现账户检测模型进行初始化,初始化图自编码器参数W0和W1,并给定迭代次数、批大小和学习率;
迭代执行S43-S46,直到达到迭代次数,完成对金融机构信用卡套现账户检测模型的训练,获得模型的最优参数;
S43、将S24和S25获取的账户特征矩阵B和账户邻接矩阵A作为编码器的输入,按式(3)编码器编码获取账户低维表示集合Z;
S44、按式(4)解码器解码得到完成正向传播;
S45、采用随机梯度下降法,通过优化式(5)中的目标函数L,完成反向传播,实现对图自编码器中权重W0和W1的更新;
S46、按步骤S33,检测器对账户低维表示集合Z进行检测。
该方法所述步骤S50包含以下具体步骤:
S51、通过迭代执行步骤S43-S46的训练过程获得金融机构信用卡套现账户检测模型的最优参数后,将最后一次训练中获取的结果作为最后的检测结果。
S52、将检测结果输出至负责金融机构安全管理的相关人员,并对套现账号进行风险性评估以及进一步的针对性处理。
而且,本实施例通过对金融机构信用卡套现用户的套现行为模式分析,提出了一种基于图神经网络的金融机构信用卡套现账户检测方法,增强了金融机构信用卡反套现的实用性。另外,本实施例提出了一种基于图神经网络的金融机构信用卡套现账户检测方法,该方法不同于传统的套现账户检测方法,它采用了图自编码器对数据的特征和结构进行学习,一定程度上较完整的保留了信用卡套现账户的行为信息,有助于获得鲁棒性和可解释性更强的套现账户检测结果。
综上,本申请实施例提供的账户的检测方法,通过获取第一矩阵和第二矩阵,其中,第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,目标行为表示目标账户登陆目标设备的行为,第二矩阵用于表示M个目标账户的属性信息,M个目标账户为待检测的账户,目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,其中,目标检测模型是基于图神经网络和聚类算法构建的模型,检测结果表示M个目标账户中是否存在第一账户,第一账户为存在非法的资金提取行为的账户,解决了相关技术中检测套现账户的效果较差的问题。通过获取用于表示Y个目标行为中每两个目标行为之间的相似度的第一矩阵和用于表示M个目标账户的属性信息的第二矩阵,并将第一矩阵和第二矩阵输入基于图神经网络和聚类算法构建的目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,进而提升了检测套现账户的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种账户的检测装置,需要说明的是,本申请实施例的账户的检测装置可以用于执行本申请实施例所提供的用于账户的检测方法。以下对本申请实施例提供的账户的检测装置进行介绍。
图4是根据本申请实施例的账户的检测装置的示意图。如图4所示,该装置包括:第一获取单元401和第一处理单元402。
具体地,第一获取单元401,用于获取第一矩阵和第二矩阵,其中,第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,目标行为表示目标账户登陆目标设备的行为,第二矩阵用于表示M个目标账户的属性信息,M个目标账户为待检测的账户,目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;
第一处理单元402,用于将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,其中,目标检测模型是基于图神经网络和聚类算法构建的模型,检测结果表示M个目标账户中是否存在第一账户,第一账户为存在非法的资金提取行为的账户。
综上,本申请实施例提供的账户的检测装置,通过第一获取单元401获取第一矩阵和第二矩阵,其中,第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,目标行为表示目标账户登陆目标设备的行为,第二矩阵用于表示M个目标账户的属性信息,M个目标账户为待检测的账户,目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;第一处理单元402将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,其中,目标检测模型是基于图神经网络和聚类算法构建的模型,检测结果表示M个目标账户中是否存在第一账户,第一账户为存在非法的资金提取行为的账户,解决了相关技术中检测套现账户的效果较差的问题。通过获取用于表示Y个目标行为中每两个目标行为之间的相似度的第一矩阵和用于表示M个目标账户的属性信息的第二矩阵,并将第一矩阵和第二矩阵输入基于图神经网络和聚类算法构建的目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果,进而提升了检测套现账户的效果。
可选地,在本申请实施例提供的账户的检测装置中,第一获取单元包括:第一获取模块,用于获取二部图,其中,二部图中至少包括:M个目标账户、N个目标设备和目标账户登陆目标设备的行为信息,N为正整数;第一确定模块,用于依据二部图,确定Y个目标行为中每两个目标行为之间的相似度;第二确定模块,用于基于Y个目标行为中每两个目标行为之间的相似度,得到第一矩阵;第三确定模块,用于依据二部图,确定M个目标账户中每个目标账户的属性信息;第四确定模块,用于基于M个目标账户中每个目标账户的属性信息,得到第二矩阵。
可选地,在本申请实施例提供的账户的检测装置中,第一获取模块包括:第一获取子模块,用于获取T个历史交易流水数据,其中,T为正整数;第一确定子模块,用于确定T个历史交易流水数据中的第一交易流水数据,其中,第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;第一去除子模块,用于从T个历史交易流水数据中去除第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;第二确定子模块,用于依据K个目标交易流水数据,得到二部图。
可选地,在本申请实施例提供的账户的检测装置中,目标检测模型通过以下方式得到:第二获取单元,用于获取第一矩阵和第二矩阵;第一构建单元,用于基于第一矩阵和第二矩阵,结合图神经网络和聚类算法,构建第一检测模型;第一训练单元,用于对第一检测模型进行迭代训练,得到目标检测模型。
可选地,在本申请实施例提供的账户的检测装置中,第一构建单元包括:第五确定模块,用于基于第一矩阵和第二矩阵,结合图神经网络,确定编码器和解码器;第一处理模块,用于利用编码器和解码器对矩阵集合进行目标处理,得到第三矩阵,其中,矩阵集合中至少包括:第一矩阵和第二矩阵,目标处理至少包括:编码处理和解码处理;第六确定模块,用于基于第三矩阵,结合聚类算法,确定检测器;第一构建模块,用于依据编码器、解码器和检测器构建第一检测模型。
可选地,在本申请实施例提供的账户的检测装置中,第一训练单元包括:第七确定模块,用于确定对第一检测模型进行迭代训练的迭代次数;第八确定模块,用于确定第一检测模型的初始参数和损失函数;第二处理模块,用于通过损失函数对初始参数进行更新处理,并获取通过损失函数对初始参数进行更新处理的目标次数;第二获取模块,用于当目标次数与迭代次数相同时,获取通过损失函数对初始参数进行更新处理得到的目标参数;第一替换模块,用于将第一检测模型中的初始参数替换为目标参数,得到目标检测模型。
可选地,在本申请实施例提供的账户的检测装置中,该装置还包括:第一确定单元,用于在将第一矩阵和第二矩阵输入目标检测模型进行检测处理,得到对M个目标账户进行检测的检测结果之后,若检测结果表示M个目标账户中存在第一账户,则确定M个目标账户中的第一账户;第二确定单元,用于对第一账户进行风险评估,得到评估结果,其中,评估结果用于表示第一账户是否存在风险;第一发送单元,用于若评估结果表示第一账户存在风险,则向目标对象发送报警信息,其中,报警信息用于提示目标对象将第一账户的状态设置为冻结状态。
账户的检测装置包括处理器和存储器,上述第一获取单元401和第一处理单元402等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提升检测套现账户的效果。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述账户的检测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述账户的检测方法。
如图5所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取第一矩阵和第二矩阵,其中,所述第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,所述目标行为表示目标账户登陆目标设备的行为,所述第二矩阵用于表示M个所述目标账户的属性信息,M个所述目标账户为待检测的账户,所述目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果,其中,所述目标检测模型是基于图神经网络和聚类算法构建的模型,所述检测结果表示M个所述目标账户中是否存在第一账户,所述第一账户为存在非法的资金提取行为的账户。
处理器执行程序时还实现以下步骤:获取第一矩阵和第二矩阵包括:获取二部图,其中,所述二部图中至少包括:M个所述目标账户、N个所述目标设备和所述目标账户登陆所述目标设备的行为信息,N为正整数;依据所述二部图,确定所述Y个目标行为中每两个目标行为之间的相似度;基于所述Y个目标行为中每两个目标行为之间的相似度,得到所述第一矩阵;依据所述二部图,确定M个所述目标账户中每个目标账户的属性信息;基于M个所述目标账户中每个目标账户的属性信息,得到所述第二矩阵。
处理器执行程序时还实现以下步骤:获取二部图包括:获取T个历史交易流水数据,其中,T为正整数;确定所述T个历史交易流水数据中的第一交易流水数据,其中,所述第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;从所述T个历史交易流水数据中去除所述第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;依据所述K个目标交易流水数据,得到所述二部图。
处理器执行程序时还实现以下步骤:所述目标检测模型通过以下方式得到:获取所述第一矩阵和所述第二矩阵;基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型;对所述第一检测模型进行迭代训练,得到所述目标检测模型。
处理器执行程序时还实现以下步骤:基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型包括:基于所述第一矩阵和所述第二矩阵,结合所述图神经网络,确定编码器和解码器;利用所述编码器和所述解码器对矩阵集合进行目标处理,得到第三矩阵,其中,所述矩阵集合中至少包括:所述第一矩阵和所述第二矩阵,所述目标处理至少包括:编码处理和解码处理;基于所述第三矩阵,结合所述聚类算法,确定检测器;依据所述编码器、所述解码器和所述检测器构建所述第一检测模型。
处理器执行程序时还实现以下步骤:对所述第一检测模型进行迭代训练,得到所述目标检测模型包括:确定对所述第一检测模型进行迭代训练的迭代次数;确定所述第一检测模型的初始参数和损失函数;通过所述损失函数对所述初始参数进行更新处理,并获取通过所述损失函数对所述初始参数进行更新处理的目标次数;当所述目标次数与所述迭代次数相同时,获取通过所述损失函数对所述初始参数进行更新处理得到的目标参数;将所述第一检测模型中的初始参数替换为所述目标参数,得到所述目标检测模型。
处理器执行程序时还实现以下步骤:在将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果之后,所述方法还包括:若所述检测结果表示M个所述目标账户中存在所述第一账户,则确定M个所述目标账户中的所述第一账户;对所述第一账户进行风险评估,得到评估结果,其中,所述评估结果用于表示所述第一账户是否存在风险;若所述评估结果表示所述第一账户存在风险,则向目标对象发送报警信息,其中,所述报警信息用于提示所述目标对象将所述第一账户的状态设置为冻结状态。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取第一矩阵和第二矩阵,其中,所述第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,所述目标行为表示目标账户登陆目标设备的行为,所述第二矩阵用于表示M个所述目标账户的属性信息,M个所述目标账户为待检测的账户,所述目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果,其中,所述目标检测模型是基于图神经网络和聚类算法构建的模型,所述检测结果表示M个所述目标账户中是否存在第一账户,所述第一账户为存在非法的资金提取行为的账户。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:获取第一矩阵和第二矩阵包括:获取二部图,其中,所述二部图中至少包括:M个所述目标账户、N个所述目标设备和所述目标账户登陆所述目标设备的行为信息,N为正整数;依据所述二部图,确定所述Y个目标行为中每两个目标行为之间的相似度;基于所述Y个目标行为中每两个目标行为之间的相似度,得到所述第一矩阵;依据所述二部图,确定M个所述目标账户中每个目标账户的属性信息;基于M个所述目标账户中每个目标账户的属性信息,得到所述第二矩阵。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:获取二部图包括:获取T个历史交易流水数据,其中,T为正整数;确定所述T个历史交易流水数据中的第一交易流水数据,其中,所述第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;从所述T个历史交易流水数据中去除所述第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;依据所述K个目标交易流水数据,得到所述二部图。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:所述目标检测模型通过以下方式得到:获取所述第一矩阵和所述第二矩阵;基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型;对所述第一检测模型进行迭代训练,得到所述目标检测模型。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型包括:基于所述第一矩阵和所述第二矩阵,结合所述图神经网络,确定编码器和解码器;利用所述编码器和所述解码器对矩阵集合进行目标处理,得到第三矩阵,其中,所述矩阵集合中至少包括:所述第一矩阵和所述第二矩阵,所述目标处理至少包括:编码处理和解码处理;基于所述第三矩阵,结合所述聚类算法,确定检测器;依据所述编码器、所述解码器和所述检测器构建所述第一检测模型。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:对所述第一检测模型进行迭代训练,得到所述目标检测模型包括:确定对所述第一检测模型进行迭代训练的迭代次数;确定所述第一检测模型的初始参数和损失函数;通过所述损失函数对所述初始参数进行更新处理,并获取通过所述损失函数对所述初始参数进行更新处理的目标次数;当所述目标次数与所述迭代次数相同时,获取通过所述损失函数对所述初始参数进行更新处理得到的目标参数;将所述第一检测模型中的初始参数替换为所述目标参数,得到所述目标检测模型。
当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:在将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果之后,所述方法还包括:若所述检测结果表示M个所述目标账户中存在所述第一账户,则确定M个所述目标账户中的所述第一账户;对所述第一账户进行风险评估,得到评估结果,其中,所述评估结果用于表示所述第一账户是否存在风险;若所述评估结果表示所述第一账户存在风险,则向目标对象发送报警信息,其中,所述报警信息用于提示所述目标对象将所述第一账户的状态设置为冻结状态。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种账户的检测方法,其特征在于,包括:
获取第一矩阵和第二矩阵,其中,所述第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,所述目标行为表示目标账户登陆目标设备的行为,所述第二矩阵用于表示M个所述目标账户的属性信息,M个所述目标账户为待检测的账户,所述目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;
将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果,其中,所述目标检测模型是基于图神经网络和聚类算法构建的模型,所述检测结果表示M个所述目标账户中是否存在第一账户,所述第一账户为存在非法的资金提取行为的账户。
2.根据权利要求1所述的方法,其特征在于,获取第一矩阵和第二矩阵包括:
获取二部图,其中,所述二部图中至少包括:M个所述目标账户、N个所述目标设备和所述目标账户登陆所述目标设备的行为信息,N为正整数;
依据所述二部图,确定所述Y个目标行为中每两个目标行为之间的相似度;
基于所述Y个目标行为中每两个目标行为之间的相似度,得到所述第一矩阵;
依据所述二部图,确定M个所述目标账户中每个目标账户的属性信息;
基于M个所述目标账户中每个目标账户的属性信息,得到所述第二矩阵。
3.根据权利要求2所述的方法,其特征在于,获取二部图包括:
获取T个历史交易流水数据,其中,T为正整数;
确定所述T个历史交易流水数据中的第一交易流水数据,其中,所述第一交易流水数据为以下至少之一:过期的交易流水数据、缺失数值的交易流水数据;
从所述T个历史交易流水数据中去除所述第一交易流水数据,得到K个目标交易流水数据,其中,K为正整数,T大于K;
依据所述K个目标交易流水数据,得到所述二部图。
4.根据权利要求1所述的方法,其特征在于,所述目标检测模型通过以下方式得到:
获取所述第一矩阵和所述第二矩阵;
基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型;
对所述第一检测模型进行迭代训练,得到所述目标检测模型。
5.根据权利要求4所述的方法,其特征在于,基于所述第一矩阵和所述第二矩阵,结合所述图神经网络和所述聚类算法,构建第一检测模型包括:
基于所述第一矩阵和所述第二矩阵,结合所述图神经网络,确定编码器和解码器;
利用所述编码器和所述解码器对矩阵集合进行目标处理,得到第三矩阵,其中,所述矩阵集合中至少包括:所述第一矩阵和所述第二矩阵,所述目标处理至少包括:编码处理和解码处理;
基于所述第三矩阵,结合所述聚类算法,确定检测器;
依据所述编码器、所述解码器和所述检测器构建所述第一检测模型。
6.根据权利要求4所述的方法,其特征在于,对所述第一检测模型进行迭代训练,得到所述目标检测模型包括:
确定对所述第一检测模型进行迭代训练的迭代次数;
确定所述第一检测模型的初始参数和损失函数;
通过所述损失函数对所述初始参数进行更新处理,并获取通过所述损失函数对所述初始参数进行更新处理的目标次数;
当所述目标次数与所述迭代次数相同时,获取通过所述损失函数对所述初始参数进行更新处理得到的目标参数;
将所述第一检测模型中的初始参数替换为所述目标参数,得到所述目标检测模型。
7.根据权利要求1所述的方法,其特征在于,在将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果之后,所述方法还包括:
若所述检测结果表示M个所述目标账户中存在所述第一账户,则确定M个所述目标账户中的所述第一账户;
对所述第一账户进行风险评估,得到评估结果,其中,所述评估结果用于表示所述第一账户是否存在风险;
若所述评估结果表示所述第一账户存在风险,则向目标对象发送报警信息,其中,所述报警信息用于提示所述目标对象将所述第一账户的状态设置为冻结状态。
8.一种账户的检测装置,其特征在于,包括:
第一获取单元,用于获取第一矩阵和第二矩阵,其中,所述第一矩阵用于表示Y个目标行为中每两个目标行为之间的相似度,所述目标行为表示目标账户登陆目标设备的行为,所述第二矩阵用于表示M个所述目标账户的属性信息,M个所述目标账户为待检测的账户,所述目标设备为用于进行资金交易的设备,Y、M均为正整数,Y大于等于M;
第一处理单元,用于将所述第一矩阵和所述第二矩阵输入目标检测模型进行检测处理,得到对M个所述目标账户进行检测的检测结果,其中,所述目标检测模型是基于图神经网络和聚类算法构建的模型,所述检测结果表示M个所述目标账户中是否存在第一账户,所述第一账户为存在非法的资金提取行为的账户。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储程序,其中,所述程序执行权利要求1至7中任意一项所述的账户的检测方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的账户的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310451409.4A CN116485406A (zh) | 2023-04-24 | 2023-04-24 | 账户的检测方法及装置、存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310451409.4A CN116485406A (zh) | 2023-04-24 | 2023-04-24 | 账户的检测方法及装置、存储介质和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116485406A true CN116485406A (zh) | 2023-07-25 |
Family
ID=87226440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310451409.4A Pending CN116485406A (zh) | 2023-04-24 | 2023-04-24 | 账户的检测方法及装置、存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116485406A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117057929A (zh) * | 2023-10-11 | 2023-11-14 | 中邮消费金融有限公司 | 异常用户行为检测方法、装置、设备及存储介质 |
-
2023
- 2023-04-24 CN CN202310451409.4A patent/CN116485406A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117057929A (zh) * | 2023-10-11 | 2023-11-14 | 中邮消费金融有限公司 | 异常用户行为检测方法、装置、设备及存储介质 |
CN117057929B (zh) * | 2023-10-11 | 2024-01-26 | 中邮消费金融有限公司 | 异常用户行为检测方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009174B (zh) | 风险识别模型训练方法、装置及服务器 | |
Ostapowicz et al. | Detecting fraudulent accounts on blockchain: A supervised approach | |
Benchaji et al. | Using genetic algorithm to improve classification of imbalanced datasets for credit card fraud detection | |
CN110084609B (zh) | 一种基于表征学习的交易欺诈行为深度检测方法 | |
CN112801773A (zh) | 企业风险预警方法、装置、设备及存储介质 | |
Sina Mirabdolbaghi et al. | Model optimization analysis of customer churn prediction using machine learning algorithms with focus on feature reductions | |
CN114202336A (zh) | 一种金融场景下的风险行为监测方法及系统 | |
CN111179089A (zh) | 洗钱交易识别方法、装置和设备 | |
CN114140007A (zh) | 一种风险企业的识别方法、装置及存储介质 | |
CN116485406A (zh) | 账户的检测方法及装置、存储介质和电子设备 | |
CN116307671A (zh) | 风险预警方法、装置、计算机设备、存储介质 | |
CN112966728A (zh) | 一种交易监测的方法及装置 | |
CN115760127A (zh) | 一种基于规则注意力机制的交易欺诈检测方法及系统 | |
Mukherjee et al. | Detection of defaulters in P2P lending platforms using unsupervised learning | |
Kansal et al. | A Comparative Study of Machine Learning Models for House Price Prediction and Analysis in Smart Cities | |
CN114818999B (zh) | 基于自编码器和生成对抗网络的账户识别方法及系统 | |
US20230095834A1 (en) | Methods and systems for identifying a re-routed transaction | |
CN115496571A (zh) | 一种基于介科学的可解释性发票虚开检测方法 | |
CN115187266A (zh) | 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统 | |
CN110990164B (zh) | 账户检测方法和装置、账户检测模型的训练方法和装置 | |
Pulkkinen et al. | A multi-objective rule optimizer with an application to risk management | |
CN117009883B (zh) | 对象分类模型构建方法、对象分类方法、装置和设备 | |
Belsare et al. | A Novel Model for House Price Prediction with Machine Learning Techniques | |
US20230186311A1 (en) | Fraud Detection Methods and Systems Based on Evolution-Based Black-Box Attack Models | |
CN112837144A (zh) | 信贷产品的利润估计方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |