CN116977069A - 数据处理方法、装置、设备、介质及产品 - Google Patents
数据处理方法、装置、设备、介质及产品 Download PDFInfo
- Publication number
- CN116977069A CN116977069A CN202310147551.XA CN202310147551A CN116977069A CN 116977069 A CN116977069 A CN 116977069A CN 202310147551 A CN202310147551 A CN 202310147551A CN 116977069 A CN116977069 A CN 116977069A
- Authority
- CN
- China
- Prior art keywords
- transaction
- sequence
- sample
- feature
- illegal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 97
- 238000012545 processing Methods 0.000 claims abstract description 81
- 230000000977 initiatory effect Effects 0.000 claims description 86
- 239000013598 vector Substances 0.000 claims description 81
- 238000012549 training Methods 0.000 claims description 45
- 238000001514 detection method Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 15
- 238000007499 fusion processing Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 39
- 230000008569 process Effects 0.000 description 37
- 238000005516 engineering process Methods 0.000 description 16
- 238000009792 diffusion process Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000007726 management method Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请实施例公开了数据处理方法、装置、设备、介质及产品,可应用于数据处理技术领域。其中方法包括:在第一业务交易的类型识别结果指示第一业务交易为第一交易类型时,将第一业务交易确定为第一待验证交易;获取参考检查交易序列,确定交易参考特征和第一待识别交易特征;将第一待识别交易特征和交易参考特征输入目标交易序列识别模型,得到第一序列特征识别结果;在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征时,将第一待验证交易更新为第二交易类型,将第一待验证交易添加至参考检查交易序列。采用本申请实施例,能够结合包含非法交易的交易序列对业务交易进行非法交易识别,提升非法交易识别的准确性。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及数据处理方法、装置、设备、介质及产品。
背景技术
目前,一些从事非法活动的非法人员通常会引导用户发起非法交易,以通过该非法交易恶意获取用户的资金,进而造成用户资金的损失,因此,对于一些支付平台来说,通过交易识别策略来准确识别某个用户所发起的这笔交易,是否为由非法人员所引导而发起的非法交易,将有助于提升用户对于支付平台的信赖度。
然而,发明人在实践过程中发现,现有的交易识别策略是基于单笔业务交易基本交易信息来进行非法交易识别,由于单笔业务交易的基本交易信息的所考虑到的信息维度较为简单,容易被非法人员试探出该现有的交易识别策略所指示的识别规则,以至于存在非法人员在绕过该现有的交易识别策略的识别规则的情况下,仍能够继续非法引导用户进行支付的现象。这意味着一旦非法人员通过绕过该现有的交易识别策略的方式,来引导用户切换交易接收方、修改订单金额、延长交易时间间隔等等,势必将难以通过该现有的交易识别策略准确识别出非法交易,进而降低了非法交易识别的准确率低。
发明内容
本申请实施例提供了一种数据处理方法、装置、设备、介质及产品,能够结合包含非法交易的交易序列对业务交易进行非法交易识别,提升非法交易识别的准确性。
本申请实施例一方面提供了一种数据处理方法,方法包括:
在获取到目标交易发起对象发起的待处理的第一业务交易时,识别第一业务交易的交易类型,得到第一业务交易的类型识别结果;
在第一业务交易的类型识别结果指示第一业务交易的交易类型为第一交易类型时,将第一业务交易确定为第一待验证交易;
获取用于对第一待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征;N为正整数;每个非法交易的交易时间戳均早于第一待验证交易的交易时间戳,且每个非法交易的交易类型均为第二交易类型,每个非法交易的交易发起对象均为目标交易发起对象;第二交易类型不同于第一交易类型;
将第一待验证交易在K个特征维度上的特征作为第一待识别交易特征,将第一待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果;
在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型由第一交易类型更新为第二交易类型,将第一待验证交易作为第二交易类型所指示的第一非法交易添加至参考检查交易序列,得到第一目标非法交易序列;第一目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理;第二业务交易为第一业务交易的下一业务交易。
本申请实施例一方面提供了一种数据处理装置,装置包括:
交易获取模块,用于在获取到目标交易发起对象发起的待处理的第一业务交易时,识别第一业务交易的交易类型,得到第一业务交易的类型识别结果;
第一识别模块,用于在第一业务交易的类型识别结果指示第一业务交易的交易类型为第一交易类型时,将第一业务交易确定为第一待验证交易;
序列获取模块,用于获取用于对第一待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征;N为正整数;每个非法交易的交易时间戳均早于第一待验证交易的交易时间戳,且每个非法交易的交易类型均为第二交易类型,每个非法交易的交易发起对象均为目标交易发起对象;第二交易类型不同于第一交易类型;
第二识别模块,用于将第一待验证交易在K个特征维度上的特征作为第一待识别交易特征,将第一待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果;
处理模块,用于在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型由第一交易类型更新为第二交易类型,将第一待验证交易作为第二交易类型所指示的第一非法交易添加至参考检查交易序列,得到第一目标非法交易序列;第一目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理;第二业务交易为第一业务交易的下一业务交易。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的方法。
采用本申请实施例,能够在初步识别到当前这笔交易(如第一业务交易)的交易类型为第一交易类型(即初步识别到为合法交易或者不为非法交易)时,将该笔交易(即第一业务交易)作为待验证交易(即疑似非法交易),以进一步结合包含非法交易的参考检查交易序列,对该待验证交易的交易类型进行二次识别,以便于后续能够结合该参考检查交易序列中的非法交易,在挖掘或者识别出某些疑似非法交易的交易(即当前这笔看起来交易疑似非法交易的待验证交易)确实为非法交易时,将该待验证交易的交易类型由上述第一交易类型(即合法类型)更新为第二交易类型(即非法类型),进而可以确保非法交易识别的准确性;其中,在结合参考检查交易序列对待验证交易进行二次识别时,是通过目标交易序列识别模型对参考检查交易序列中的非法交易的特征与业务交易的特征进行特性识别,进而可以通过特征识别的方式进一步判断出当前这笔交易是否是针对同一恶意活动的一系列非法交易,这意味着通过该目标交易序列识别模型进行特征提取以及特征匹配的方式,可以充分挖掘出针对同一恶意活动的一系列非法交易,从而可以提升非法交易识别的准确性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理系统的结构示意图;
图2是本申请实施例提供的一种数据处理方法的流程示意图;
图3是本申请实施例提供的一种确定交易序列识别结果的流程示意图;
图4是本申请实施例提供的一种数据处理方法的流程示意图;
图5是本申请实施例提供的一种非法交易识别流程的效果示意图;
图6是本申请实施例提供的一种数据处理流程的效果示意图;
图7是本申请实施例提供的一种数据处理方法的流程示意图;
图8是本申请实施例提供的一种样本数据构建过程的流程示意图;
图9是本申请实施例提供的一种数据处理装置的结构示意图;
图10是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种数据处理方案,本申请发明点在于可以在初步识别到当前这笔交易(即第一业务交易)的交易类型为第一交易类型(即初步识别到为合法交易或者不为非法交易)时,将该笔交易(即第一业务交易)作为待验证交易(即疑似非法交易),以进一步结合包含非法交易的参考检查交易序列,对该待验证交易的交易类型进行二次识别,以便于后续能够结合该参考检查交易序列中的非法交易,在挖掘或者识别出某些疑似非法交易的交易(即当前这笔看起来交易疑似非法交易的待验证交易)确实为非法交易时,将该待验证交易的交易类型由上述第一交易类型(即合法类型)更新为第二交易类型(即非法类型),进而可以确保非法交易识别的准确性;其中,在结合参考检查交易序列对待验证交易进行二次识别时,是通过目标交易序列识别模型对参考检查交易序列中的非法交易的特征与业务交易的特征进行特性识别,进而可以通过特征识别的方式进一步判断出当前这笔交易是否是针对同一恶意活动的一系列非法交易,这意味着通过该目标交易序列识别模型进行特征提取以及特征匹配的方式,可以充分挖掘出针对同一恶意活动的一系列非法交易,从而可以提升非法交易识别的准确性。
在一个实施例中,上述数据处理方案可以应用于一种数据处理系统中,请参见图1,图1是本申请实施例提供的一种数据处理系统的结构示意图。该数据处理系统可以包括终端设备11a和服务器12a。其中,该终端设备11a可以运行有支付平台为用户提供支付服务的程序。终端设备可以包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器、智能音箱、智能家电等,此处不做限制。该支付平台是属于第三方的服务中介机构,完成第三方担保支付的功能。
服务器12a可以为支付平台对应的的服务器,用于为用户提供支付服务。例如,在一些场景中,用户在购买商品时,可以选择基于支付平台A进行支付,从而用户A对应的终端可以向支付平台发起一笔业务交易,从而支付凭条对应的服务器可以获取到该业务交易,然后对业务交易进行支付处理。可以理解的是,服务器可以对获取到的业务交易进行非法交易识别,目前,对业务交易进行非法交易识别,可以为基于单笔业务进行识别,基于单笔业务交易的特征进行非法交易识别的所考虑到的特征维度较为简单,容易被恶意人员试探出识别策略所指示的识别规则,从而恶意人员可以引导用户绕过该识别策略的识别规则进行支付,如引导用户切换交易接收方、修改订单金额、延长交易时间间隔等等,造成非法交易识别的准确率低。另外,对业务交易进行非法交易识别,可以为基于一段时间内的全部业务交易进行非法交易识别,采用这样方式时,若用户在被恶意引导发起非法交易的过程中,可能会发起已经存在一些非法交易,则基于一段时间内的全部业务交易进行识别,有可能把之前执行的同为非法交易的业务交易也作为对比参考的交易,从而造成非法交易识别准确率低。又如,非法人员(也称恶意人员)可以通过利用正常的交易接收对象,如正常的商户(一些正常的电子购物平台等等)引导用户进行支付,并通过其他渠道获取资金,例如,通过电商接单代充油卡,然后非法人员欺骗用户在购物平台上向指定账户充值油卡,非法人员将通过获取充值的油卡的账号和密码来获取用户资金,因此,简单的基于交易接收对象是否为疑似的非法商户不能很准确地确定业务交易是否为非法交易。因此,本申请实施例可以提出上述数据处理方案,从而可以能够结合包含非法交易的交易序列对业务交易进行非法交易识别,充分考虑到同一恶意活动的活动全过程的潜在规律,提升非法交易识别的准确性。
需要进行说明的是,本申请在收集用户的相关数据(如交易发起对象的特征)之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的,且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在一个实施例中,本申请实施例可以应用于人工智能技术领域,如基于人工智能技术训练目标交易序列识别模型进行非法交易识别,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
在一个实施例中,本申请实施例可以应用于区块链技术领域中,如可以将参考检查交易序列上链至区块链中。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。区块链底层平台可以包括用户管理、基础服务、智能合约以及运营管理等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,管理和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营管理模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、管理网络情况、管理节点设备健康状态等。平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
可以理解的是,本申请实施例可以应用于计算机设备中,如上述的服务器12a。该计算机设备可以是服务器、终端设备或者是其他用于进行数据处理的设备。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器、智能音箱、智能家电等。
可以理解,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
进一步地,请参见图2,图2是本申请实施例提供的一种数据处理方法的流程示意图。该方法可由上述计算机设备来执行,如上述的服务器12a。该方法至少可以包括以下步骤S201-步骤S205。
S201、在获取到目标交易发起对象发起的待处理的第一业务交易时,识别第一业务交易的交易类型,得到第一业务交易的类型识别结果。
其中,该待处理的第一业务交易可以为需要进行非法交易识别的任一业务交易。该目标交易发起对象可以为发起第一业务交易的对象。例如在一些场景中,对象A发起业务交易a,则支付平台对应的服务器可以对该业务交易进行非法交易识别以检测该业务交易a是否非法交易(即检测业务交易a是否为第二交易类型的交易),也就是可以将业务交易a作为待处理的业务交易,进而识别业务交易a的交易类型,该对象A也就是目标交易发起对象。
可以理解的是,业务交易的交易类型可以包括第一交易类型和第二交易类型,该第一交易类型可以为用于指示业务交易为合法交易(也称正常交易)的交易类型,也称合法类型,第二交易类型可以为用于指示业务交易为非法交易(也称风险交易)的交易类型,也称为非法类型。
该类型识别结果可以用于表示识别到的第一业务交易的交易类型,第一业务交易的类型识别结果可以用于指示第一业务交易的交易类型为第一交易类型,或者,用于指示第一业务交易的交易类型为第二交易类型。可选的,可以调用第一识别策略识别业务交易的交易类型,得到对应的类型识别结果。
具体的,识别第一业务交易的交易类型,得到第一业务交易的类型识别结果,可以包括以下步骤:获取第一业务交易的基础交易信息,基础交易信息包括以下一项或多项:业务交易的交易时间戳、业务交易对应的交易资源的资源数量、业务交易的交易发起对象对应的历史交易信息;获取第一识别策略,并基于第一识别策略与基础交易信息识别第一业务交易的交易类型,得到第一业务交易的类型识别结果。
其中,该基础交易信息可以用于指示业务交易本身的一些基础信息。业务交易的交易时间戳可以用于指示交易发起对象发起业务交易的时间;业务交易对应的交易资源的资源数量用于指示业务交易用于转移的交易资源的资源数量,也可以称为交易金额。交易发起对象对应的历史交易信息可以包括交易发起对象在发起该待处理的业务交易之前的一定时间范围内发起的历史交易(如待处理的业务交易前5小时内发起的业务交易,与待处理的业务交易属于同一天的业务交易等等历史交易)的信息,如该历史交易的信息可以为历史交易的交易金额的平均值、最大值、最小值等等,还可以包括最近一笔业务交易的交易时间戳,从而可以确定待处理的业务交易的交易时间戳与该待处理的业务交易的前最近一笔业务交易的交易时间戳之间的时间差作为一个历史交易信息。可选的,该业务基础交易信息还可以包括其他的一些信息,如待处理的业务交易的交易接收方与前一笔业务交易的交易接收方是否为同一业务接收方,等等,此处不做限制。
该第一识别策略可以用于指示针对基础交易信息的一些判断规则,在基础交易信息中的每个维度的信息均满足一定的非法交易判断条件时,将待处理的业务交易确定为非法交易,即确定类型识别结果用于指示业务交易的交易类型为第二交易类型,反之,将待处理的业务交易确定为合法交易,确定类型识别结果用于指示业务交易的交易类型为第一交易类型。
可选的,该第一识别策略也可以用于指示针对基础交易信息中每个维度的信息确定对应的参考值的规则,进而基于针对基础交易信息中多个维度的信息对应的参考值的参考值总和确定类型识别结果,在参考值总和大于一定阈值时,将待处理的业务交易确定为非法交易,即确定类型识别结果用于指示业务交易的交易类型为第二交易类型,反之,将待处理的业务交易确定为合法交易,确定类型识别结果用于指示业务交易的交易类型为第一交易类型。
S202、在第一业务交易的类型识别结果指示第一业务交易的交易类型为第一交易类型时,将第一业务交易确定为第一待验证交易。
其中,该第一待验证交易可以为基于第一识别策略识别到为合法交易的业务交易,进而可以结合第一业务交易的目标交易发起对象对应的包含非法交易的交易序列对第一业务交易是否为非法交易进行进一步的验证。
S203、获取用于对第一待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征,N为正整数;每个非法交易的交易时间戳均早于第一待验证交易的交易时间戳,且每个非法交易的交易类型均为第二交易类型,每个非法交易的交易发起对象均为目标交易发起对象;第二交易类型不同于第一交易类型。
其中,该参考检查交易序列可以为用于对第一待验证交易是否为非法交易进行检测的序列。可以理解的是,该参考检查交易序列中每个非法交易的交易时间戳均早于第一待验证交易的交易时间戳,可以表示该N个非法交易的发起时间均早于第一待验证交易,即早于第一业务交易。每个非法交易的交易发起对象均为目标交易发起对象,也就是说每个非法交易的交易发起对象均与第一待验证交易的交易发起对象相同,针对一个交易发起对象来说可以有与其对应的参考检查序列,从而在检测到交易发起对象发起一笔交易后,可以获取用于对该交易发起对象发起的待处理的业务交易进行交易检测的参考检查序列。可选的,该参考检查交易序列中的非法交易存储于关系型数据库中,如在需要将一个非法交易添加至参考检查交易序列中时,可以将该非法交易存入对应的CKV变量(一种关系型数据库)中,进而在需要获取参考检查交易序列时,可以从关系型数据库中获取参考检查交易序列。
可以理解的是,该参考检查交易序列可以为在第一待验证交易之前由目标交易发起对象所发起的业务交易进行非法交易识别得到的,其中,对业务交易进行非法交易识别可以为基于上述第一识别策略进行识别,或者结合参考检查序列进行交易检测,此处不做限制。可以理解的是,该参考检查序列中的业务交易可以为在第一待验证交易之前识别到的非法交易,且该参考检查序列中的非法交易为针对同一恶意活动发起的非法交易。例如,在一些场景中,恶意人员b引导对象a发起一笔非法交易1,然后恶意人员b引导对象a发起一笔非法交易2,非法交易1和非法交易2均为恶意人员b所引导对象a发起的交易,即非法交易1与非法交易2为针对同一恶意活动发起的非法交易,本申请实施例就是通过业务交易与当前已经识别到为针对同一恶意活动发起的非法交易的序列进行匹配,确定待处理的业务交易是否也为针对该恶意活动发起的非法交易。
可以理解的是,N个非法交易中每个非法交易均可以有在K个特征维度上的特征,该交易参考特征可以为N非法交易在K个特征维度上的特征的集合,也就是说,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征,可以为将各个非法交易在K个特征维度上的特征的整体作为交易参考特征。例如,N个非法交易中包括非法交易a,和非法交易b,非法交易a有在K个特征维度上的特征,非法交易b有在K个特征维度上的特征,则可以将非法交易a有在K个特征维度上的特征和非法交易b有在K个特征维度上的特征确定为交易参考特征。
具体的,K个特征维度包括以下一项或多项:交易发起对象的对象基础特征、交易发起对象的历史交易特征、交易接收对象的对象基础特征、交易发起对象与交易接收对象之间的历史交易关联特征、参考检查交易序列的序列特征。
其中,交易发起对象的对象基础特征,可以为交易发起对象的社交活跃度、所在地址等关于该交易发起对象本身的基础信息。该社交活跃度可以用于指示业务交易的交易发起对象在一定时间范围内(如发起业务交易前2天)基于关联的社交应用与其他对象进行互动的活跃度,如交易发起对象在一定时间范围内与其他对象的聊天次数越多,频次越大,则社交活跃度越高。
该交易发起对象的历史交易特征,可以包括交易发起对象的在一个长线时间范围内(如发起业务交易前1个月内)历史交易的交易金额、交易发起对象的在一个短期时间范围内(如发起业务交易前1天内)历史交易的交易金额,交易发起对象的在一个短期时间范围内(如发起交易前1天)历史交易的交易次数等等,此处不做限制。
该交易接收对象可以为一些提供电子商务服务的平台,一些个人账户等等,此处不做限制。交易接收对象的对象基础特征可以包括交易接收对象的名称、地址、经营范围等等,此处不做限制。交易发起对象与交易接收对象之间的历史交易关联特征,可以为交易发起对象在一个长线时间范围内(如发起业务交易前1个月)针对该交易接收对象发起的历史交易的交易金额、交易次数等,也可以为交易发起对象在一个短期时间范围内(如发起业务交易前1天内)针对该交易接收对象发起的历史交易的交易金额、交易次数等,此处不做限制。例如,在确定业务交易1的K个特征维度的特征时,确定该业务交易1的交易发起对象为对象B,交易接收对象为对象C,则针对历史交易关联特征这一对象特征来说,是指对象B在一定时间范围内针对对象C发起的历史交易的交易金额、交易次数等等,此处不做限制。
参考检查交易序列的序列特征,可以为在对一业务交易进行交易检测时,所获取的参考检查交易序列的特征。该序列特征可以为参考检测交易序列的序列长度,即参考检查交易序列中的非法交易的数量,参考检查交易序列中的非法交易的交易金额总数,参考检查交易序列中被拦截的交易的金额等等,此处不做限制。
可以理解的是,在确定一个业务交易在K个特征维度上的特征时,都是基于该业务交易本身或者业务交易之前发起的业务交易的情况进行确定。
例如,在对第一待验证交易A1进行交易检测时,所获取的参考检查交易序列a中包括非法交易1、非法交易2、非法交易3,在确定参考检查交易序列中的任一在K个特征维度上的特征时,确定交易发起对象的对象基础特征、历史交易特征、交易接收对象的对象基础特征、历史交易关联特征、序列特征等均是基于截止于发起该任一非法交易时交易发起对象、交易接收对象、以及参考检查交易序列的数据进行确定。比如,非法交易1为一个序列中的第一笔交易,则在确定非法交易1的序列特征时是基于为空的参考检查交易序列进行确定的,在确定非法交易1的历史交易特征时,是基于截止该非法交易1前交易发起对象所发起的业务交易进行确定的;在确定非法交易2的序列特征时,是基于包含非法交易1的参考检查交易序列进行确定的,在确定非法交易2的历史交易特征时,是基于截止该非法交易2前交易发起对象所发起的业务交易进行确定的;在确定非法交易3的序列特征时是基于包含非法交易1和非法交易2的参考检查交易序列进行确定的,在确定非法交易3的历史交易特征时,是基于截止该非法交易3前交易发起对象所发起的业务交易进行确定的。
S204、将第一待验证交易在K个特征维度上的特征作为第一待识别交易特征,将第一待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果。
其中,该第一待识别交易特征可以为第一待验证交易对应的特征,包括第一待验证交易在K个特征维度的特征。可以理解的是,在确定第一待验证交易在K个维度的特征,可以是基于该第一待验证交易本身或者第一待验证交易之前发起的业务交易的情况进行确定,针对K个特征维度的相关描述可以参照上述描述,此处不做赘述。
其中,该目标交易识序列识别模型可以为用于检测待验证交易与参考检查交易序列是否匹配的模型,也可以说是用于检测待验证交易与参考检查交易序列中的非法交易是否匹配的模型。可以理解的是,若检测到待验证交易与参考检查交易序列匹配,则可以表示该待验证交易与参考检查交易序列中的非法交易均为针对同一恶意活动发起的非法交易。可以理解的是,检测待验证交易是否与参考检查交易序列匹配,可以基于第一待验证交易的第一待识别交易特征与交易参考特征进行匹配检测(也称特性识别)得到,若识别到第一待识别交易特征与交易参考特征相匹配,则可以确定待验证交与参考检查交易序列相匹配,反之,若识别到第一待识别交易特征与交易参考特征不匹配,则可以确定待验证交与参考检查交易序列不匹配。为了便于描述,可以将通过目标交易序列识别模型得到序列特征识别结果的方法称为第二识别策略。
可以理解的是,该目标交易序列识别模型可以基于大量样本数据进行训练得到,样本数据包括样本识别交易、样本交易序列和样本标签,样本标签为用于指示样本识别交易与样本交易序列相匹配的第一样本标签,或者为用于指示样本识别交易与样本交易序列不匹配的第二样本标签。也就是说,在对目标交易序列识别模型进行训练时,可以基于使得目标序列识别模型能够学习到判断样本识别交易与样本交易序列之间是否匹配的潜在规律,从而在训练得到目标交易序列识别模型后,能够基于目标交易序列识别模型准确识别到待验证交易与参考检查交易序列是否匹配,也就是可以识别到第一待识别交易特征与交易参考特征是否匹配。可选的,该目标交易序列识别模型可以为LightGBM模型(一种决策树模型),该目标交易序列识别模型还可以用深度学习的LSTM模型(一种深度学习模型)和attention网络模型(一种神经网络模型)等复杂的深度学习框架,此处不做限制。可以理解的是,在一些场景中,本申请实施例可以用于在线上实时对用户发起的业务交易进行非法交易识别,则故在识别业务交易是否与参考检查交易序列匹配时需要保证整体计算的时效性和准确率,且面向大的支付平台需要有强解释性和稳定性,因此可以使用一些相对简单的模型进行识别,如采用LightGBM(一种决策树模型)作为目标交易序列识别模型。
可以理解的是,该第一序列特征识别结果可以为在基于第一识别策略识别到待处理的业务交易为合法交易(即交易类型为第已交易类型的交易)时,基于目标交易序列识别模型对第一待验证交易进行特征识别得到的结果,即基于第二识别策略识别得到对应的结果。该第一序列特征识别结果可以用于指示交易参考特征中存在与第一待识别交易特征相匹配的特征,或者用于指示交易参考特征中不存在与第一待识别交易特征相匹配的特征。其中,交易参考特征中存在与第一待识别交易特征相匹配的特征,也就是说,交易参考特征与第一待识别交易特征相匹配,进而第一待验证交易与参考交易检查序列相匹配;交易参考特征中不存在与第一待识别交易特征相匹配的特征,也就是说,交易参考特征与第一待识别交易特征不匹配,进而第一待验证交易与参考交易检查序列不匹配。
可以理解的是,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果,可以包括:通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到序列特征识别概率,该序列特征识别概率用于指示交易参考特征中存在与第一待识别交易特征相匹配的特征的概率;基于序列特征确定第一序列特征识别结果。具体的,若序列识别概率的概率值大于或等于序列识别概率阈值,则可以确定第一序列特征识别结果用于指示交易参考特征中存在与第一待识别交易特征相匹配的特征,即交易参考特征与第一待识别交易特征相匹配;反之,若序列识别概率的概率值小于序列识别概率阈值,则可以确定第一序列特征识别结果用于指示交易参考特征中不存在与第一待识别交易特征相匹配的特征,即交易参考特征与第一待识别交易特征不匹配。
具体的,将第一待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,可以包括以下步骤:基于第一待识别交易特征中在K个特征维度上的特征,构建针对第一待验证交易的第一交易向量;第一交易向量的向量维度为K;基于交易参考特征中每个非法交易在K个特征维度上的特征,分别构建每个非法交易对应的第二交易向量,并基于每个非法交易的第二交易向量进行向量融合处理,得到参考交易向量;第二交易向量的向量维度和参考交易向量的向量维度均为K;对第一交易向量和参考交易向量进行向量组合,得到目标特征向量;将目标特征向量输入与参考检查交易序列相关联的目标交易序列识别模型。
其中,该第一交易向量可以为由第一待验证交易在K个特征维度上特征组成的向量。例如,第一待验证交易在K个特征维度上的特征量化为特征值时,可以为c1、c2.....ck,则第一交易向量可以为(c1,c2.....ck)。
该第二交易向量可以为由一个非法交易在K个特征维度上特征组成的向量。具体确定方式参照上述的第一交易向量的相关描述,此处不做赘述。
可以理解的是,该参考交易向量可以为融合了每个非法交易的第二交易向量得到的向量。基于每个非法交易的第二交易向量进行向量融合处理,得到参考交易向量,可以为对每个非法交易的第二交易向量中针对同一特征维度的值进行求平均、加权平均等操作得到的,也可以为基于预训练的特征提取模型进行提取得到的,此处不做限制。可以理解的是,该参考交易向量的特征维度也可以为K。进一步可以理解的是,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,也就相当于是基于第一交易向量和参考交易向量进行比对,从而确定出交易序列识别结果。
例如,请参见图3,图3是本申请实施例提供的一种确定交易序列识别结果的流程示意图。如图3所示,首先可以获取到待验证交易的第一交易向量(如图3中的S301所示),例如(c1、c2…ck),并且可以获取到参考检查交易序列中每个非法交易的第二交易向量(如图3中的S302所示),如图的S302中的第二交易向量1(b1、b2…bk)1、第二交易向量2(b1、b2…bk)2、第二交易向量3(b1、b2…bk)3等等,此处仅为一个示例,不对非法交易对应的第二交易向量的数量进行限制。然后可以基于各个非法交易的第二交易向量进行向量融合处理,得到参考交易向量(如图3中的S303所示),例如(d1、d2…dk)。进而可以对第一交易向量和参考交易向量进行组合得到目标特征向量(如图3中的S304所示),例如组合得到(c1、c2…ck、d1、d2…dk)。然后将目标特征向量输入目标交易序列识别模型,得到交易序列识别结果(如图3中的S305所示)。
S205、在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型由第一交易类型更新为第二交易类型,将第一待验证交易作为第二交易类型所指示的第一非法交易添加至参考检查交易序列,得到第一目标非法交易序列;第一目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理;第二业务交易为第一业务交易的下一业务交易。
可以理解的是,在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征,则表示第一待验证交易与参考检查交易序列相匹配,也就是说,该第一待验证交易为该参考检查交易序列匹配的非法交易,即该第一待验证交易可以为与参考检查交易序列中的非法交易属于同一恶意活动的非法交易(即交易类型为第二交易类型的交易),进而可以将基于第一识别策略识别到的第一业务交易的交易类型(即第一交易类型)更新为第二交易类型,即在基于第二识别策略识别到业务交易为非法交易时,不采用第一识别策略的识别结果,而是采用第二识别策略的识别结果以将业务交易确定为非法交易。
其中,该第一目标非法交易序列,可以为将第一待验证交易作为非法交易添加至参考检查交易序列中得到的交易序列。可以理解的是,在确定第一待验证交易的交易类型为第二交易类型时,也就是说第一待验证交易为非法交易,则可以称第一待验证交易为第一非法交易。
可以理解的是,在将第一待验证交易的交易类型由第一交易类型更新为第二交易类型时,即识别到第一待验证交易的交易类型为第二交易类型(即非法交易)时,可以对为非法交易的第一待验证交易(即为非法交易的第一业务交易)进行拦截,从而避免目标交易发起对象在资金上的损失。例如,在序列识别概率的概率值大于0.7时,确定交易参考特征中存在与第一待识别交易特征相匹配的特征,即相当于在序列识别概率的概率值大于0.7时,对第一待验证交易进行支付拦截处理,由此可以通过两次的识别来检测业务交易是否为非法交易,对于非法交易的拦截准确率和覆盖率大大提升。
具体的,在将第一待验证交易的交易类型确定为第二交易类型时,对确定为第二交易类型的第一待验证交易进行支付拦截处理。
可以理解的是,该支付拦截处理可以为暂停或停止对业务交易的支付流程的处理方式。可选的,对业务交易进行支付拦截处理可以为停止对业务交易的支付流程,即在对业务交易进行支付拦截处理时,确定对业务交易支付失败,并返回提示信息以提示对业务交易失败,因为识别到其为非法交易。可选的,对业务交易进行支付拦截处理可以为暂停对业务交易的支付流程,即可以为在对业务交易进行拦截时,将被拦截的业务交易转化为一笔待支付交易,进一步的,可以返回提示信息以提示目标交易发起对象该第一业务交易识别为非法交易,可能造成资金损失,并让目标交易发起对象选择是否继续进行支付,如果目标交易发起对象选择继续支付,则可以对继续支付的第一业务交易进行支付处理。或者,还可以基于识别到业务交易为非法交易的概率(如上述序列识别概率)确定对应的支付拦截策略,然后基于对应的支付拦截策略进行支付拦截处理,如在序列识别概率较大(如大于阈值a且小于1)时,确定的支付拦截策略可以为停止对业务交易的支付流程的支付拦截方式,在序列识别概率相对较小但是满足业务交易为非法交易的条件(如小于或等于阈值a但大于阈值b)时,确定的支付拦截策略可以为暂停对业务交易的支付流程的支付拦截方式,
可选的,在第一序列特征识别结果指示交易参考特征中不存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型确定为第一交易类型,确定对交易类型为第一交易类型的第一待验证交易进行常规支付处理。
可以理解的是,在第一序列特征识别结果指示交易参考特征中不存在与第一待识别交易特征相匹配的特征,则表示第一待验证交易与参考检查交易序列不匹配,也就是说,该第一待验证交易不为与参考检查交易序列中的非法交易属于同一恶意活动的非法交易(即交易类型为第二交易类型的交易),即为合法交易。
该常规支付处理也就是基于常规的支付逻辑进行支付处理,不对该业务交易进行拦截并返回提示信息等等处理。对第一待验证交易进行常规支付处理对于目标交易发起对象来说,就是可以正常对该第一待验证交易进行支付。
可以理解的是,在确定第一待验证交易的交易类型为第一交易类型时,可以不对参考检查交易序列进行调整,从而在下一次接收到业务交易时,仍是基于与第一业务交易对应的参考检查交易序列相同的参考检查交易序列进行交易检测。
可以理解的是,该第一待验证交易可以为基于上述第一识别策略识别到为合法交易(即交易类型为第一交易类型)的业务交易,也就是说,在基于第一识别策略检测到第一业务交易为合法交易时,还需要对第一业务交易作为第一待验证交易,并基于目标交易序列识别模型进行进一步的特性识别,且在只有基于两次识别均指示业务交易为合法交易时,才能执行常规支付处理,由此以提升对合法交易的判定的准确性,避免一些恶意人员绕过第一识别策略。
可以理解的是,目标交易对象在发起第一业务交易后,还可能会发起下一笔业务交易,即第二业务交易,进而在获取到目标交易对象发起的第二业务交易时,可以重复上述步骤,即先识别第二业务交易的交易类型,得到第二业务交易的类型识别结果,然后在第二业务交易的类型识别结果指示第二业务交易的交易类型为第二交易类型时,将第二业务交易确定为第一待验证交易,进而在获取参考检查交易序列时,可以基于第一目标非法交易序列对参考检查交易序列进行更新处理,然后再基于更新后的参考检查交易序列对为第二业务交易的第一待验证交易进行进一步的交易检测,以得到对应的第一序列特征识别结果,从而确定第一业务交易是否为非法交易。以此类推,在获取到第二业务交易的下一次业务交易时,可以重复上述过程,从而实现对参考检查交易序列的不断更新,在持续检测非法交易的同时,还可以持续检测属于同一恶意活动的非法交易,避免恶意人员通过一些方法规避非法交易检测的规则。
例如,在对业务交易c进行交易检测时,所获取的参考检查交易序列为{非法交易a、非法交易b},在基于第一识别策略识别到业务交易c为合法交易,且基于目标交易序列识别模型识别到业务交易c为该参考检查交易序列匹配的非法交易时,可以将业务交易c加入参考检查交易序列中,得到新的交易序列可以包括{非法交易a、非法交易b、非法交易c},进而在对业务交易c的下一业务交易(业务交易d)进行交易检测时,所获取的参考检查交易序列为{非法交易a、非法交易b、非法交易c}。在基于第一识别策略识别到业务交易c为合法交易,且基于目标交易序列识别模型识别到业务交易c不为该参考检查交易序列匹配的非法交易时,可以不对参考检查交易序列进行调整,进而在对业务交易c的下一业务交易(业务交易d)进行交易检测时,所获取的参考检查交易序列仍为{非法交易a、非法交易b}。
可选的,在确定对交易类型为第一交易类型的第一待验证交易进行常规支付处理时,记录交易类型为第一交易类型的第一待验证交易的交易数量;在连续记录到交易类型为第一交易类型的第一待验证交易的交易数量累计到目标交易数量时,对参考检查交易序列中的N个非法交易进行置空处理,将置空处理后的第一交易序列作为置空交易序列。
可以理解的是,在第一业务交易之后,可以继续检测每个获取到的业务交易的交易类型,若基于第一识别策略和目标交易序列识别模型检测后,确定业务交易的交易类型为第一交易类型,则可以对业务交易进行一次计数操作,即记录交易类型为第一交易类型的第一待验证交易的交易数量。可以理解的是,在连续记录到交易类型为第一交易类型的第一待验证交易的交易数量累计到目标交易数量时,也就是在连续目标交易数量个业务交易的交易类型为第一交易类型(即业务交易为合法交易)时,可以表示针对当前参考检查交易序列所对应的恶意活动可能已经停止,因此可以对参考检查交易序列进行置空处理(也称重置处理),得到置空交易序列,该置空交易序列可以为不包含非法交易的空序列。
可选的,也可以在检测到超过一定时间未对参考检查交易序列进行更新时,对参考检查交易序列进行置空处理,得到置空交易序列。
进一步的,在得到置空交易序列后,下一次接收到业务交易时,可以仅基于第一识别策略进行识别,若基于第一识别策略识别到业务交易为非法交易时,就可以直接将该非法交易添加至参考检查交易序列。若基于第一识别策略识别到业务交易为合法交易时,就可以直接对该合法交易进行常规支付处理。
具体的,在获取到目标交易发起对象发起的第三业务交易时,识别第三业务交易的交易类型,得到第三业务交易的类型识别结果;第三业务交易为在连续记录到交易类型为第一交易类型的第一待验证交易的交易数量累计到目标交易数量时的业务交易的下一业务交易;在第三业务交易的类型识别结果为指示第三业务交易的交易类型为第二交易类型时,将第二交易类型的第三业务交易作为置空交易序列的第一个非法交易添加至置空交易序列,得到第三目标非法交易序列,第三目标非法交易序列用于在获取到第三业务交易的下一业务交易时,对参考检查交易序列进行更新处理。
其中,该目标交易数量可以为对参考检查交易序列进行置空处理所需要满足的连续检测到合法交易的交易数量所需满足的数值。该目标交易数量的取值可以根据实际需求进行预设。
该第三业务交易也就是在对参考检查交易序列进行置空处理后的获取到的第一笔业务交易。例如,若连续的合法交易的交易数量累计达到目标交易数量时的业务交易为业务交易a,则业务交易a的下一次业务交易为第三业务交易。
例如,目标交易数量可以为10,那么,在通过上述第一识别策略和第二识别策略均识别到业务交易1为合法交易时,可以对该业务交易1进行一次计数操作,并确定连续为合法交易的交易数量累计为1;然后获取业务交易1的下一次业务交易(业务交易2),若在通过上述第一识别策略和第二识别策略均识别到业务交易2为合法交易时,可以对该业务交易2进行一次计数操作,并确定连续为合法交易的交易数量累计为2,以此类推,在连续10次检测到为合法交易的业务交易(即业务交易10)时,即连续为合法交易的交易数量累计为10,则可以对参考检查交易序列进行置空处理。进而,在获取到业务交易10的下一个业务交易(业务交易11)时,该业务交易11即可以为上述第三业务交易,若通过第一识别策略检测到业务交易11为非法交易,则可以将业务交易11作为的参考检查交易序列的第一笔非法交易添加至参考检查交易序列中,进而在获取到业务交易11的下一个业务交易(业务交易12)时,所获取的用于对业务交易12进行交易检测的参考检查交易序列中仅包括业务交易11。可选的,在获取到业务交易10的下一个业务交易(业务交易11)时,若通过第一识别策略检测到业务交易11为合法交易,则可以直接对业务交易11进行常规支付处理。
进一步地,请参见图4,图4是本申请实施例提供的一种数据处理方法的流程示意图。该方法可由上述计算机设备来执行。该方法至少可以包括以下步骤S401-步骤S405。
S401、在获取到目标交易发起对象发起的待处理的第一业务交易时,识别所述第一业务交易的交易类型,得到所述第一业务交易的类型识别结果。
S402、在第一业务交易的类型识别结果指示第一业务交易的交易类型为第二交易类型时,将第一业务交易确定为第二待验证交易。
其中,该第二待验证交易可以为基于第一识别策略识别到为非法交易的业务交易,进而可以确定第二待验证交易与当前的参考检查交易序列是否匹配进行进一步检查。
可以理解的是,在第一业务交易的类型识别结果指示第一业务交易的交易类型为第二交易类型时,可以对交易类型为第二交易类型的第一业务交易进行支付拦截处理,即可以对为非法交易的第一业务交易进行交易拦截处理。可以理解的是,对第一业务交易进行交易拦截处理可以参照上述相关描述,此处不做赘述。
S403、获取用于对第二待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征,N为正整数。
可以理解的是,用于对第二待验证交易进行交易检测的参考检查交易序列与上述用于对第一待验证交易进行交易检测的参考检查交易序列相同。
可以理解的是,基于每个非法交易在K个特征维度上的特征确定交易参考特征的相关描述,可以参照上述步骤S203中的相关描述,此处不做赘述。
S404、将第二待验证交易在K个特征维度上的特征作为第二待识别交易特征,将第二待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第二待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第二序列特征识别结果。
其中,可以理解的是,该第二待识别交易特征可以为第二待验证交易对应的特征,包括第二待验证交易在K个特征维度的特征。可以理解的是,确定第二待识别交易特征的方法可以参照上述确定第一待识别交易特征的相关描述,此处不做赘述。
其中,该第二序列特征识别结果可以为在基于第一识别策略识别到待处理的业务交易为非法交易(即交易类型为第二交易类型的交易)时,基于目标交易序列识别模型对第二待验证交易进行特征识别得到的结果。可以理解的是,该第二序列特征识别结果可以用于指示交易参考特征中存在与第二待识别交易特征相匹配的特征,或者用于指示交易参考特征中不存在与第二待识别交易特征相匹配的特。其中,交易参考特征中存在与第二待识别交易特征相匹配的特征,也就是说,交易参考特征与第二待识别交易特征相匹配;交易参考特征中不存在与第二待识别交易特征相匹配的特征,也就是说,交易参考特征与第二待识别交易特征不匹配。
可以理解的是,通过目标交易序列识别模型对第二待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第二序列特征识别结果的方法,可以参照上述通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果的相关描述,此处不做赘述。
S405、在第二序列特征识别结果指示交易参考特征中存在与第二待识别交易特征相匹配的特征时,将第二待验证交易作为第二交易类型所指示的第二非法交易添加至参考检查交易序列,得到第二目标非法交易序列;第二目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理。
可以理解的是,在第二序列特征识别结果指示交易参考特征中存在与第二待识别交易特征相匹配的特征,则表示第二待验证交易与参考检查交易序列相匹配,也就是说,该第二待验证交易为该参考检查交易序列匹配的非法交易,即该第二待验证交易可以为与参考检查交易序列中的非法交易属于同一恶意活动的非法交易(即交易类型为第二交易类型的交易)。
其中,该第二目标非法交易序列,可以为将第二待验证交易作为非法交易添加至参考检查交易序列中得到的交易序列。可以理解的是,在确定第二待验证交易的交易类型为第二交易类型时,也就是说第二待验证交易为非法交易,则可以称第二待验证交易为第二非法交易。可以理解的是,由此可以将通过第一识别策略识别到的非法交易,且与当前的参考检查交易序列属于同一恶意活动的非法交易添加至参考检查交易序列中,以便于后续可以基于包含从多方面检测到为非法交易的参考检查交易序列进行交易检测,避免恶意人绕过非法交易识别的策略。
可选的,在第二序列特征识别结果指示交易参考特征中不存在与第二待识别交易特征相匹配的特征时,对参考检查交易序列中的N个非法交易进行置空处理,并将第二交易类型的第二待验证交易作为进行置空处理后的参考检查序列的第一个非法交易,得到第四目标非法交易序列;第四目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理。
其中,可以理解的是,也就是说,可以在基于第一识别策略识别到的非法交易与当前的参考检查交易序列不匹配时,对参考检查交易序列进行置空处理,并把基于第一识别策略识别到的非法交易作为参考检查序列的第一个非法交易。这是由于,在基于第一识别策略识别到的非法交易与当前的参考检查交易序列不匹配,通常可以表示该非法交易可能为另一个恶意活动所对应的业务交易,即目标交易对象可能已经脱离了被原本的恶意人员进行恶意引导的可能,而是进入了新的恶意活动,因此可以对参考检查交易序列进行置空处理,以便于后续可以针对新的恶意活动检测非法交易。
可以理解的是,为了防范可能针对目标交易对象有同时多个恶意活动在进行,则在对参考检查交易序列进行置空时,可以保留原本的参考检查交易序列,然后新建一个空序列。从而可以在获取到下一次业务交易时,可以并行对两个参考检查交易序列进行检测。可以理解的是,可以对超多一定时间未添加新的业务交易的参考检查交易序列(即超过一定时间未进行更新的参考检查交易序列)进行删除,即后续可以不再基于超过一定时间未添加新的业务交易的参考检查交易序列进行交易检测。
可以理解的是,在每个对参考检查交易序列进行置空时,可以先对参考检查交易序列进行记录,然后再对参考检查交易序列进行置空。所记录的参考检查交易序列可以用于进行其他相关的非法交易识别策略进行训练,或者作为其他非法交易识别策略的输入特征,从而可以扩展更丰富的非法交易识别的策略。综上,此处结合图示对业务交易进行非法交易识别的整个过程进行阐述。请参见图5,图5是本申请实施例提供的一种非法交易识别流程的效果示意图。如图5所示,首先服务器可以获取第一业务交易(如步骤S501所示),然后基于第一识别策略确定第一业务交易是否为非法交易(如步骤S502所示)。若基于第一识别策略确定第一业务交易不为非法交易,则将第一业务交易作为第一待验证交易,并获取参考检查交易序列(如步骤S503所示),进而检测第一待验证交易与参考检查交易序列是否匹配(如步骤S504所示)。若第一待验证交易与参考检查交易序列不匹配,则对第一待验证交易进行常规支付处理(如步骤S505所示);若第一待验证交易与参考检查交易序列相匹配,则将第一待验证交易加入参考检查交易序列(如步骤S506所示)。
若基于第一识别策略确定第一业务交易为非法交易,则将第一业务交易作为第二待验证交易,并获取参考检查交易序列(如步骤S507所示),并检测第二待验证交易与参考检查交易序列是否匹配(如步骤S508所示)。若第二待验证交易与参考检查交易序列不匹配,则对参考检查交易序列进行置空处理,并将第二待验证交易加入置空后的参考检查交易序列(如步骤S509所示);若第二待验证交易与参考检查交易序列相匹配,则将第二待验证交易加入参考检查交易序列(如步骤S510所示)。
进一步的,此处结合图示,对整个数据处理过程进行阐述。请参见图6,图6是本申请实施例提供的一种数据处理流程的效果示意图。首先可以获取第一业务交易(如步骤S601所示),然后获取第一识别策略识别(如步骤S602所示),从而基于第一识别策略识别第一业务交易是否为非法交易(如步骤S603所示)。若是第一业务交易为非法交易,则可以对第一业务交易进行支付拦截处理(如步骤S604所示).若是第一业务交易不为非法交易,则可以将第一业务交易作为待验证交易,并获取参考检查交易序列(如步骤S605所示),进而检测待验证交易与参考检查交易序列是否匹配(如步骤S606所示)。若检测到待验证交易与参考检查交易序列不匹配,则对待验证交易进行常规支付处理(如步骤S607所示)。若检测到待验证交易与参考检查交易序列相匹配,则将第一待验证交易加入参考检查交易序列(如步骤S608所示)。
进一步的,还可以获取交易序列重置规则(如步骤S609所示),例如,该重置交易序列规则可以为连续目标交易数量的业务交易进行常规支付处理,或者参考检查交易序列达到一定时间未进行更新。进而可以基于重置交易序列规则检测是否重置参考检查交易序列(如步骤S610所示),若检测到是,则可以对参考检查交易序列进行重置处理,若检测到否,则可以继续按照原本的参考检查交易序列去检测下一业务交易是否为非法交易。
进一步地,请参见图7,图7是本申请实施例提供的一种数据处理方法的流程示意图。该方法可由上述计算机设备来执行。该方法至少可以包括以下步骤S701-步骤S708。
S701、获取至少一个投诉对象对应的对象投诉交易集合,并获取每个对象投诉交易集合关联的至少一个投诉关联交易,任一对象投诉交易集合中的对象投诉交易的交易投诉时间的时间差异小于时间阈值,任一投诉关联交易的交易时间戳处于关联的对象投诉交易集中的对象投诉交易的交易时间戳对应的目标时间戳范围内。
其中,可以理解的是,通常来说,任一对象在认识到自己被恶意人员引导发起业务交易而造成资金损失后,对象可以对造成资金损失的一个或多个业务交易进行投诉,则可以将对象投诉造成资金损失的一个或多个业务交易均确定为对象投诉交易,并且可能用户在意识到资金受损时,可能会在短时间内之前的一个或多个交易进行投诉,因此可以将短时间内投诉的对象投诉交易确定为针对同一恶意活动的对象投诉交易集合,即所确定的对象投诉交易集合中的对象投诉交易的交易投诉时间的时间差异小于时间阈值。该时间阈值可以为将对象投诉交易确定为同一个对象投诉交易集合时交易投诉时间的时间差异所需要满足的条件,一笔对象投诉交易的交易投诉时间的时间差异可以为该对象投诉交易的交易投诉时间与前一笔对象投诉交易的交易投诉时间之间的时间差。例如,该时间阈值可以为10分钟,则在对象a在T1时刻投诉非法交易1,然后在T2时刻投诉非法交易2,若T2-T1小于10分钟,则可以将非法交易1和非法交易2确定为同一对象投诉交易集合中的对象投诉交易;对象a在投诉非法交易2后又在T3时刻投诉了非法交易3,若T3-T2小于10分钟,则可以将非法交易1、非法交易2和非法交易3均确定为同一对象投诉交易集合中的对象投诉交易。以便于后续可以基于对象投诉交易集合构建用于训练目标交易序列识别模型的样本数据。可以理解的是,一个对象投诉交易集合中的对象投诉交易可以有一个或多个,此处不做限制。
可以理解的是,通常来说,对象在对造成资金损失的业务交易进行投诉时,可能不会投诉属于同一恶意活动的全部业务交易,例如,恶意人员会通过返利的名义,引导用户先小额支付几笔交易,并给与返利以获取用户的信任,后续引导用户发起大额交易,以恶意获取用户的资金,此时用户往往只会投诉未返利的业务交易,但整个恶意活动的交易序列是从小额交易开始的。因此,未投诉交易判定需要资深的风险分析员进行判断,又因为因支付平台所涉及的业务交易的交易量级十分庞大,对业务交易进行人工标注耗费巨大人力。在此处,本方案可以通过获取与对象投诉相关联的至少一个投诉关联交易,进而通过比对投诉关联交易与对象投诉交易之间的差异来判断出与对象投诉交易属于同一恶意活动的业务交易。
其中,任一对象投诉交易集合关联的投诉关联交易可以为与对象投诉交易集合中的对象投诉交易在交易时间戳上有联系(如属于每个对象投诉交易的交易时间戳关联的目标时间戳范围)的业务交易。该目标时间戳范围内可以包含对象投诉交易的交易时间戳的前后一定时间段,例如,投诉关联交易可以为与对象投诉交易集合中的任一对象投诉交易的交易时间戳处于同一天的业务交易。例如,对象a的对象投诉交易集合中的对象投诉交易1的交易时间戳属于xx年xx月xx日,则可以获取对象a在xx年xx月xx日内除该对象投诉交易1外的所有业务交易,作为该对象投诉交易集合的投诉关联交易。
S702、获取任一对象投诉交易集合与关联的任一投诉关联交易之间的相似性信息,在相似性信息满足相似性条件时,确定任一对象投诉交易集合与关联的任一投诉关联交易相匹配。
可以理解的,任一对象投诉交易集合与关联的任一投诉关联交易之间的相似性信息,可以为基于对象投诉交易集合中的对象投诉交易和投诉关联交易在金额、时间、交易接收对象等各个方面上的特征的相似性。该相似性条件可以表示在确定对象投诉交易集合与投诉关联交易相匹配的时相似性信息所需要满足的条件,如该对象投诉交易集合与投诉关联交易之间的相似性大于一定阈值。可以理解的是,若对象投诉交易集合与投诉关联交易之间的相似性信息越大,则投诉关联交易集合与对象投诉交易匹配的可能性越大,进而投诉关联交易为非法交易的可能性越大,反之,若对象投诉交易集合与投诉关联交易之间的相似性越小,则投诉关联交易集合与对象投诉交易匹配的可能性越小,进而投诉关联交易为合法交易的可能性越高。
可以理解的是,获取任一对象投诉交易集合与任一对象投诉交易关联的任一投诉关联交易之间的相似性信息,可以为基于交易扩散模型对对象投诉交易集合中的对象投诉交易的特征和投诉关联交易的特征进行交易匹配得到的,如可以基于交易扩散模型确定用于指示对象投诉交易集合与投诉关联交易之间的相似概率,相似概率越大,则相似性信息越大,相似概率越小,则相似性信息越小。可以理解的是,该交易扩散模型可以识别到每个投诉关联交易与对象投诉交易集合是否匹配,若交易扩散模型识别到投诉关联交易与对象投诉交易集合相匹配,则可以表示该投诉关联交易为非法交易且极有可能与对象投诉交易集合中对象投诉交易属于同一恶意活动的交易。
可以理解的是,在对交易扩散模型进行初始化时,可以采用一定量的人工标注的对象投诉交易集合和投诉关联交易进行,如标注投诉关联交易是否为非法交易,后续采用半监督学习自迭代的方式对交易扩散模型进行进一步训练。可选的,该交易扩散模型可以为LightGBM模型(一种决策树模型),该目标交易序列识别模型还可以用深度学习的LSTM模型(一种深度学习模型)和attention网络模型(一种神经网络模型)等复杂的深度学习框架等等,此处不做限制
此处结合图示对构建样本数据的过程进行阐述,请参见图8,图8是本申请实施例提供的一种样本数据构建过程的流程示意图。如图8所示,首先可以获取至少一个投诉对象对应的对象投诉交易集合(如步骤S801所示),然后获取每个对象投诉交易集合关联的至少一个投诉关联交易(如步骤S802所示),进而可以获取交易扩散模型(如步骤S803所示),该交易扩散模型可以为基于人为标注的训练数据进行初始化的,人为标注的训练数据可以包括投诉关联交易、关联的对象投诉交易集合以及标注了投诉关联交易是否非法交易的标签,进而可以基于训练数据对初始的交易扩散模型进行初步的训练。然后调用交易扩散模型对任一对象投诉交易集合和投诉关联交易进行处理,以确定投诉关联交易是否为非法交易(如步骤S804所示)。其中,若识别到投诉关联交易以高概率为非法交易,在可以识别得到每个对象投诉交易集合匹配的投诉关联交易,并构建样本数据(如步骤S805所示),具体构建过程可以参照上述描述,此处不做赘述。若识别到投诉关联交易以低概率为非法交易,则可以对投诉关联交易进行人工标注(如步骤S806所示),以标注其是否为非法交易,进而可以基于人工标注后的投诉关联交易和关联的对象投诉交易集合对交易扩散模型进行训练,从而实现对交易扩散模型的半监督训练。
可以理解的是,基于上述过程,可以快速识别出用户未投诉的非法交易,减少对用户为投诉的非法交易,并且可以获取到完整的恶意活动的过程中所涉及的多个非法交易构建样本数据,还原更完整的恶意活动过程,使得后续训练得到的目标交易序列识别模型能够挖掘到恶意活动过程的潜在规律,提升交易识别准确性更高。
S703、基于每个对象投诉交易集合和与每个对象投诉交易集合相匹配的投诉关联交易构建样本数据,并基于样本数据训练得到目标交易序列识别模型。
可以理解的是,与每个对象投诉交易集合相匹配的投诉关联交易的数量可以为一个或多个,此处不做限制。该样本数据可以为用于对目标交易序列识别模型进行训练的样本数据。可以理解的是,基于每个对象投诉交易集合和与每个对象投诉交易集合相匹配的投诉关联交易构建样本数据,可以包括基于任一对象投诉交易集合和与任一对象投诉交易集合相匹配的投诉关联交易确定对应的样本识别交易、样本交易序列和样本标签,进而基于样本识别交易、样本交易序列和样本标签构建样本数据。
具体的,样本数据可以包括第一样本数据和第二样本数据,那么,基于每个对象投诉交易集合和与每个对象投诉交易集合相匹配的投诉关联交易构建样本数据,可以包括以下步骤:将任一对象投诉交易集合和与任一对象投诉交易集合相匹配的投诉关联交易确定为初始样本交易集合;从初始样本交易集合中确定第一样本识别交易,并确定针对第一样本识别交易的第一样本标签;将初始样本交易集合中交易时间戳在第一样本识别交易的交易时间戳之前的业务交易确定为第一样本交易序列,基于第一样本识别交易、第一样本交易序列和第一样本标签构建第一样本数据,第一样本标签用于指示第一样本识别交易与第一样本交易序列相匹配;或者,将初始样本交易集合中交易时间戳最晚的业务交易后进行常规支付处理的业务交易确定为第二样本识别交易,并确定针对第二样本识别交易的第二样本标签;将初始样本交易集合确定为第二样本交易序列,基于第二样本识别交易、第二样本交易序列和第二样本标签构建第二样本数据,第二样本标签用于指示第二样本识别交易与第二样本交易序列不匹配。
其中,可以理解的是,第一样本数据可以为样本标签指示样本识别交易和样本交易序列相匹配的样本数据,也可以称为黑样本数据。第二样本数据可以为样本标签指示样本识别交易和样本交易序列不匹配的样本数据,也可以称为白样本数据。可以理解的是,若样本标签为用于指示样本识别交易与样本交易序列相匹配的第一样本标签,则可以确定第一样本标签的标签值可以为1,可以用于指示第一样本识别交易与第一样本交易序列相匹配的概率为1;若样本标签为用于指示样本识别交易与样本交易序列不匹配的第二样本标签,则可以确定第二样本标签的标签值可以为0,可以用于指示第一样本识别交易与第一样本交易序列相匹配的概率为0。
可以理解的是,从所述初始样本交易集合中确定的第一样本识别交易可以为初始样本交易集合中除交易时间戳最早的业务交易外的任一业务交易。进行常规支付处理的业务交易可以参考上述描述,如可以为没有被进行拦截从而导致支付操作停止或者暂停的业务交易。可以理解的是,上述第一样本标签和第二样本标签可以统称为样本标签,第一样本识别交易和第二样本识别交易可以统称为样本识别交易,第一样本交易序列和第二样本交易序列可以统称为样本交易序列。
此处以初始样本交易集合R1可以包括{交易1、交易2、交易3、交易4、交易5}为例对如何确定样本数据进行介绍,其中每个交易按照时间先后顺序进行排序。例如,若将初始样本交易集合中的交易3确定为第一样本识别交易,则可以将交易时间戳在交易3之前的业务交易确定为第一样本交易序列,即第一样本交易序列可以包括{交易1、交易2},并且确定针对第一样本识别交易(交易3)的样本标签用于指示第一样本识别交易(交易3)与第一样本交易序列{交易1、交易2}相匹配,从而可以基于第一样本识别交易(交易3)、第一样本交易序列和对应的样本标签确定第一样本数据。
又如,若将初始样本交易集合中的交易4确定为第一样本识别交易,则可以将交易时间戳在交易4之前的业务交易确定为第一样本交易序列,即第一样本交易序列可以包括{交易1、交易2、交易3},并且确定针对第一样本识别交易(交易4)的样本标签用于指示第一样本识别交易(交易4)与第一样本交易序列{交易1、交易2、交易3}相匹配,从而可以基于第一样本识别交易(交易4)、第一样本交易序列和对应的样本标签确定第一样本数据。
又如,可以将初始样本集合中交易时间戳最晚的业务交易(即交易5)之后的业务交易之后进行常规支付处理的业务交易确定为第二样本识别交易(如交易6),则可以将初始样本集合中的业务交易确定为第二样本交易序列,即第二样本交易序列可以为{交易1、交易2、交易3、交易4、交易5},针对交易6的的样本标签可以用于指示第二样本识别交易(交易6)与第二样本交易序列{交易1、交易2、交易3、交易4、交易5}不匹配,从而可以基于第二样本识别交易(交易6)、第二样本交易序列和对应的样本标签确定第二样本数据。
进一步的,基于上述方法可以确定出丰富的样本数据,且可以提升确定样本数据的样本标签的效率,减少人工的浪费,从而可以基于该丰富的样本数据对目标交易序列识别模型进行训练。
具体的,样本数据包括样本识别交易、样本交易序列和样本标签,样本标签为用于指示样本识别交易与样本交易序列相匹配的第一样本标签,或者为用于指示样本识别交易与样本交易序列不匹配的第二样本标签;那么基于样本数据训练得到目标交易序列识别模型,可以包括:将样本交易序列中的每个业务交易在K个特征维度上的特征作为样本参考特征,并将样本识别交易在K个特征维度上的特征作为样本识别交易特征;进一步的,将样本参考特征和样本识别交易特征输入初始交易序列识别模型,通过初始交易序列识别模型对样本参考特征和样本识别交易特征进行特性识别,得到样本序列特征识别概率;样本序列特征识别概率用于指示样本参考特征中存在与样本识别交易特征相匹配的特征的概率;进一步的,基于样本序列特征识别概率和样本标签确定训练参考信息,基于训练参考信息对初始交易序列识别模型进行迭代训练,将迭代训练后的初始交易序列识别模型作为目标交易序列识别模型。
其中,将样本交易序列中的每个业务交易在K个特征维度上的特征作为样本参考特征,可以参照上述将参考检查交易序列中的每个非法交易在K个特征维度上的特征作为交易参考特征的相关描述,将样本识别交易在K个特征维度上的特征作为样本识别交易特征,可以参照上述将第一待验证交易在K个特征维度上的特征作为第一待识别交易特征的相关描述,确定样本序列特征识别概率的相关描述可以参照上述第一序列特征识别结果的相关描述。
其中,该训练参考信息可以为对初始交易序列识别模型进行训练的过程中引导优化初始交易序列识别模型的参考信息,例如,该训练参考信息可以为调用损失函数基于样本数据的样本序列特征识别概率和样本标签所指示的标签值确定的损失值。从而基于计算得到损失值对初始交易序列识别模型进行迭代训练,随着迭代训练的进行,计算得到的损失值逐渐减少,当损失值收敛时,可以将此时的初始交易序列识别模型作为目标交易序列识别模型。可以理解的是,若将一批次输入初始交易序列识别模型的样本数据为多个,可以基于各个样本数据的样本序列特征识别概率和对应的样本标签计算得到训练参考信息。可以理解的是,随着对初始交易序列识别模型的模型参数的训练的推进,样本数据的样本序列特征识别概率,与样本标签所指示的标签值越来越相近,则表示初始交易序列识别模型能够越来越准确地识别样本参考特征中是否存在与样本识别交易特征相匹配的特征。
可以理解的是,可以将上述得到的大量样本数据进行样本划分,如将基于上述过程得到的样本数据划分为训练集、验证集、和测试集。进而可以基于训练集中的样本数据基于上述过程对初始交易序列识别模型进行迭代训练。并且,还可以基于验证集对基于训练集评估迭代训练得到的交易序列识别模型,并调整交易序列识别模型的超参数,然后再基于训练集中的样本数据基于上述过程对初始交易序列识别模型进行迭代训练。然后可以基于测试集对经过迭代训练得到的交易序列识别模型进行测试,若测试结果指示目标序列识别模型的模型效果达到预期,则可以将训练后的初始交易序列识别模型作为目标交易序列识别模型。
可以理解的是,在基于测试集对迭代训练后的初始交易序列识别模型进行训练时,可以基于训练后的初始交易序列识别模型对测试集中样本数据处理得到的样本序列特征识别概率确定IV值(信息量或信息值,Information Value),以评估训练后的初始交易序列识别模型的模型效果。IV值主要用来对输入变量(如此处的样本序列特征识别概率这一变量)进行预测能力的评估。基于样本序列特征识别概率确定的IV值(也称测试概率信息量)越大,则表示迭代训练后的初始交易序列识别模型的模型效果越好,反之,基于样本序列特征识别概率确定的IV值(也称测试概率信息量)越小,则表示迭代训练后的初始交易序列识别模型的模型效果越差。可以理解的是,若检测到测试概率信息量大于或等于一定阈值,则可以将训练后的初始交易序列识别模型作为目标交易序列识别模型;反之,若检测到测试概率信息量小于一定阈值,则可以将训练后的初始交易序列识别模型作为目标交易序列识别模型。
S704、在获取到目标交易发起对象发起的待处理的第一业务交易时,识别第一业务交易的交易类型,得到第一业务交易的类型识别结果。
S705、在第一业务交易的类型识别结果指示第一业务交易的交易类型为第一交易类型时,将第一业务交易确定为第一待验证交易。
S706、获取用于对第一待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征,N为正整数;每个非法交易的交易时间戳均早于第一待验证交易的交易时间戳,且每个非法交易的交易类型均为第二交易类型,每个非法交易的交易发起对象均为目标交易发起对象;第二交易类型不同于第一交易类型。
可以理解的是,该K个特征维度可以为从基于一些经验数据等衍生出的初始特征维度中筛选得到的一些预测能力强的特征维度。可以理解的是,一个特征维度的预测能力可以基于IV值(信息量或信息值,Information Value)进行表征,即可以选取一些对应的IV值满足一定条件的初始特征维度作为上述的K个特征维度。
具体的,确定K个维度的方法可以包括:获取M个初始特征维度,以及M个初始特征维度中每个初始特征维度对应的多个分组范围;基于每个样本数据的样本识别交易在任一初始特征维度的特征和每个样本数据的样本交易序列中的每个业务交易在任一初始特征维度的特征,确定每个样本数据在任一初始特征维度的综合特征;进一步的,基于任一初始特征维度的每个分组范围与每个样本数据在任一初始特征维度的综合特征,确定属于任一初始特征维度的每个分组范围的样本数据,得到任一初始特征维度的每个分组范围对应的样本数据分组,并确定任一初始特征维度的每个样本数据分组对应的第一样本数量和第二样本数量,第一样本数量用于指示样本标签为第一样本标签的样本数据的数量,第二样本数量用于指示样本标签为第二样本标签的样本数据的数量;进一步的,基于任一初始特征维度的每个样本数据分组对应的第一样本数量和第二样本数量的比值,以及任一初始特征维度的多个样本数据分组对应的第一样本数量的总数量和第二样本数量的总数量的比值,确定任一初始特征维度的特征参考值;进一步的,基于每个初始特征维度的特征参考值从M个初始特征维度中筛选得到K个特征维度。
可以理解的是,该M个初始特征维度可以为上述的基于一些经验数据等衍生出的未经过预测能力评估的特征维度。可以理解的是,M应大于或等于K。该分组范围可以为将该初始特征维度上可取值的所划分为每个分组的范围。例如,针对交易发起对象的历史交易的平均金额这一特征维度的可取值范围可以为0到正无穷,则可以确定该特征维度对应的分组范围为[0,100),[100,500),[500,1000),[1000,3000),[3000,+∞)。
可以理解的是,一个样本数据在一个初始特征维度的综合特征,可以为该样本数据中的样本识别交易在该初始特征维度的特征,和该样本数据中的样本交易序列中的业务交易在该初始特征维度的特征之间的差值、平均值、比例值等等,此处不做限制。
可以理解的是,针对一个特征维度W1来说,每个样本数据在该特征维度W可以有对应的一个综合特征的特征值,则可以基于该综合特征的特征值确定样本数据属于特征维度W1的哪个分组范围,从而可以将综合特征属于同一分组范围的样本数据确定为一个样本数据分组,并统计每个样本数据分组对应的第一样本数量和第二样本数量。例如,在特征维度W1的分组范围y1所对应的样本数据分组中,样本标签为第一样本标签的样本数据的数量为50,样本标签为第二样本标签的样本数据的数量为100,则特征维度W1的分组范围y1所对应的样本数据分组中的第一样本数量为50,第二样本数量为100.
该特征参考值可以为用于衡量一个特征维度的预测能力的值,如可以为在一个特征维度对应的IV值,例如,可以参照以下公式(公式1和公式2)确定特征参考值。
其中,可以理解的是,IVi可以为一个特征维度的第i个样本数据分组的IV值,该特征维度一共有n个样本数据分组。从公式来看,相当于是自变量WOE(证据权重,Weight ofEvidence)值的一个加权求和。可以理解的是,Pyi表示第i个样本数据分组中样本标签为第一样本标签的样本数据占所有样本数据中样本标签为第一样本标签的样本数据的比例,Pni表示第i个样本数据分组中样本标签为第二样本标签的样本数据占所有样本数据中样本标签为第二样本标签的样本数据的比例。yi为第i个样本数据分组对应的第一样本数量,ys为第i个样本数据分组对应的第二样本数量。ni为全部样本数据中多个样本数据分组对应的第一样本数量的总和,即全部样本数据中样本标签为第一样本标签的样本数据的数量,ns全部样本数据中多个样本数据分组对应的第二样本数量的总和,即全部样本数据中样本标签为第二样本标签的样本数据的数量。
其中,IV表示一个特征维度的IV值,n表示一个特征维度一共有n个样本数据分组,即各个样本数据分组的IV值求和可以得到对应的特征维度的IV值,即参考特征值。
可以理解的是,基于参考特征值从M个初始特征维度中筛选K个特征维度,可以为将参考特征值大于或等于一定阈值的初始特征维度作为上述K个特征维度中的特征维度。也可以为按照参考特征值对M个初始特征维度进行排序,将排序处于前K个的初始特征维度确定为上述K个特征维度。
S707、将第一待验证交易在K个特征维度上的特征作为第一待识别交易特征,将第一待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果。
可以理解的是,该目标交易序列识别模型可以基于上述的相关描述进行训练得到。
S708、在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型由第一交易类型更新为第二交易类型,将第一待验证交易作为第二交易类型所指示的第一非法交易添加至参考检查交易序列,得到第一目标非法交易序列;第一目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理;第二业务交易为第一业务交易的下一业务交易。
请参见图9,图9是本申请实施例提供的一种数据处理装置的结构示意图。如图9所示,数据处理装置1可以是运行于支持第一通信协议的外围设备(例如,上述外围设备10c)的一个计算机程序(包括程序代码),例如该数据处理装置1为一个应用软件;可以理解的是,该数据处理装置1可以用于执行本申请实施例提供的数据处理方法中的相应步骤。如图9所示,该数据处理装置1可以包括:交易获取模块11、第一识别模块12、序列获取模块13、第二识别模块14、处理模块15;
交易获取模块11,用于在获取到目标交易发起对象发起的待处理的第一业务交易时,识别第一业务交易的交易类型,得到第一业务交易的类型识别结果;
第一识别模块12,用于在第一业务交易的类型识别结果指示第一业务交易的交易类型为第一交易类型时,将第一业务交易确定为第一待验证交易;
序列获取模块13,用于获取用于对第一待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征;N为正整数;每个非法交易的交易时间戳均早于第一待验证交易的交易时间戳,且每个非法交易的交易类型均为第二交易类型,每个非法交易的交易发起对象均为目标交易发起对象;第二交易类型不同于第一交易类型;
第二识别模块14,用于将第一待验证交易在K个特征维度上的特征作为第一待识别交易特征,将第一待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第一待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第一序列特征识别结果;
处理模块15,用于在第一序列特征识别结果指示交易参考特征中存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型由第一交易类型更新为第二交易类型,将第一待验证交易作为第二交易类型所指示的第一非法交易添加至参考检查交易序列,得到第一目标非法交易序列;第一目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理;第二业务交易为第一业务交易的下一业务交易。
其中,处理模块15,还用于在第一序列特征识别结果指示交易参考特征中不存在与第一待识别交易特征相匹配的特征时,将第一待验证交易的交易类型确定为第一交易类型,确定对交易类型为第一交易类型的第一待验证交易进行常规支付处理。
其中,处理模块15,还用于在确定对交易类型为第一交易类型的第一待验证交易进行常规支付处理时,记录交易类型为第一交易类型的第一待验证交易的交易数量;
处理模块15,还用于在连续记录到交易类型为第一交易类型的第一待验证交易的交易数量累计到目标交易数量时,对参考检查交易序列中的N个非法交易进行置空处理,将置空处理后的第一交易序列作为置空交易序列。
其中,第一识别模块12还用于在获取到目标交易发起对象发起的第三业务交易时,识别第三业务交易的交易类型,得到第三业务交易的类型识别结果;第三业务交易为在连续记录到交易类型为第一交易类型的第一待验证交易的交易数量累计到目标交易数量时的业务交易的下一业务交易;
处理模块15,还用于在第三业务交易的类型识别结果为指示第三业务交易的交易类型为第二交易类型时,将第二交易类型的第三业务交易作为置空交易序列的第一个非法交易添加至置空交易序列,得到第三目标非法交易序列,第三目标非法交易序列用于在获取到第三业务交易的下一业务交易时,对参考检查交易序列进行更新处理。
其中,第一识别模块12,还用于在第一业务交易的类型识别结果指示第一业务交易的交易类型为第二交易类型时,将第一业务交易确定为第二待验证交易;
序列获取模块13,还用于获取用于对第二待验证交易进行交易检测的参考检查交易序列,在参考检查交易序列包含N个非法交易时,基于N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征,N为正整数;
第二识别模块14,还用于将第二待验证交易在K个特征维度上的特征作为第二待识别交易特征,将第二待识别交易特征和交易参考特征输入与参考检查交易序列相关联的目标交易序列识别模型,通过目标交易序列识别模型对第二待识别交易特征和交易参考特征进行特性识别,得到与参考检查交易序列相关联的第二序列特征识别结果;
处理模块15,还用于在第二序列特征识别结果指示交易参考特征中存在与第二待识别交易特征相匹配的特征时,将第二待验证交易作为第二交易类型所指示的第二非法交易添加至参考检查交易序列,得到第二目标非法交易序列;第二目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理。
其中,处理模块15,还用于在第二序列特征识别结果指示交易参考特征中不存在与第二待识别交易特征相匹配的特征时,对参考检查交易序列中的N个非法交易进行置空处理,并将第二交易类型的第二待验证交易作为进行置空处理后的参考检查序列的第一个非法交易,得到第四目标非法交易序列;第四目标非法交易序列用于在获取到第二业务交易时,对参考检查交易序列进行更新处理。
其中,处理模块15,包括拦截单元151;
拦截单元151,用于在将第一待验证交易的交易类型确定为第二交易类型时,对确定为第二交易类型的第一待验证交易进行支付拦截处理。
其中,第一识别模块12包括:信息获取单元121、策略获取单元122;
信息获取单元121,用于获取第一业务交易的基础交易信息,基础交易信息包括以下一项或多项:业务交易的交易时间戳、业务交易对应的交易资源的资源数量、业务交易的交易发起对象对应的历史交易信息;
策略获取单元122,用于获取第一识别策略,并基于第一识别策略与基础交易信息识别第一业务交易的交易类型,得到第一业务交易的类型识别结果。
其中,K个特征维度包括以下一项或多项:交易发起对象的对象基础特征、交易发起对象的历史交易特征、交易接收对象的对象基础特征、交易发起对象与交易接收对象之间的历史交易关联特征、参考检查交易序列的序列特征。
其中,第二识别模块14包括
向量确定单元141,用于基于第一待识别交易特征中在K个特征维度上的特征,构建针对第一待验证交易的第一交易向量;第一交易向量的向量维度为K;
向量确定单元141,还用于基于交易参考特征中每个非法交易在K个特征维度上的特征,分别构建每个非法交易对应的第二交易向量,并基于每个非法交易的第二交易向量进行向量融合处理,得到参考交易向量;第二交易向量的向量维度和参考交易向量的向量维度均为K;
向量组合单元142,用于对第一交易向量和参考交易向量进行向量组合,得到目标特征向量;
向量输入单元143,将目标特征向量输入与参考检查交易序列相关联的目标交易序列识别模型。
其中,第二识别模块14还包括:数据获取单元144、模型训练单元145;
数据获取单元144,用于获取至少一个投诉对象对应的对象投诉交易集合,并获取每个对象投诉交易集合关联的至少一个投诉关联交易,任一对象投诉交易集合中的对象投诉交易的交易投诉时间的时间差异小于时间阈值,任一投诉关联交易的交易时间戳处于关联的对象投诉交易集中的对象投诉交易的交易时间戳对应的目标时间戳范围内;
数据获取单元144,用于获取任一对象投诉交易集合与关联的任一投诉关联交易之间的相似性信息,在相似性信息满足相似性条件时,确定任一对象投诉交易集合与关联的任一投诉关联交易相匹配;
模型训练单元145,用于基于每个对象投诉交易集合和与每个对象投诉交易集合相匹配的投诉关联交易构建样本数据,并基于样本数据训练得到目标交易序列识别模型。
其中,样本数据包括第一样本数据和第二样本数据;
数据获取单元144,还用于将任一对象投诉交易集合和与任一对象投诉交易集合相匹配的投诉关联交易确定为初始样本交易集合;
数据获取单元144,还用于从初始样本交易集合中确定第一样本识别交易,并确定针对第一样本识别交易的第一样本标签;将初始样本交易集合中交易时间戳在第一样本识别交易的交易时间戳之前的业务交易确定为第一样本交易序列,基于第一样本识别交易、第一样本交易序列和第一样本标签构建第一样本数据,第一样本标签用于指示第一样本识别交易与第一样本交易序列相匹配;或者,
数据获取单元144,还用于将初始样本交易集合中交易时间戳最晚的业务交易后进行常规支付处理的业务交易确定为第二样本识别交易,并确定针对第二样本识别交易的第二样本标签;将初始样本交易集合确定为第二样本交易序列,基于第二样本识别交易、第二样本交易序列和第二样本标签构建第二样本数据,第二样本标签用于指示第二样本识别交易与第二样本交易序列不匹配。
其中,样本数据包括样本识别交易、样本交易序列和样本标签,样本标签为用于指示样本识别交易与样本交易序列相匹配的第一样本标签,或者为用于指示样本识别交易与样本交易序列不匹配的第二样本标签;
模型训练单元145,还用于将样本交易序列中的每个业务交易在K个特征维度上的特征作为样本参考特征,并将样本识别交易在K个特征维度上的特征作为样本识别交易特征;
模型训练单元145,还用于将样本参考特征和样本识别交易特征输入初始交易序列识别模型,通过初始交易序列识别模型对样本参考特征和样本识别交易特征进行特性识别,得到样本序列特征识别概率;样本序列特征识别概率用于指示样本参考特征中存在与样本识别交易特征相匹配的特征的概率;
模型训练单元145,还用于基于样本序列特征识别概率和样本标签确定训练参考信息,基于训练参考信息对初始交易序列识别模型进行迭代训练,将迭代训练后的初始交易序列识别模型作为目标交易序列识别模型。
其中,第二识别模块14还包括特征维度获取单元146、特征维度评估单元147、特征维度筛选单元148;
特征维度获取单元146,用于获取M个初始特征维度,以及M个初始特征维度中每个初始特征维度对应的多个分组范围;
特征维度评估单元147,用于基于每个样本数据的样本识别交易在任一初始特征维度的特征和每个样本数据的样本交易序列中的每个业务交易在任一初始特征维度的特征,确定每个样本数据在任一初始特征维度的综合特征;
特征维度评估单元147,用于基于任一初始特征维度的每个分组范围与每个样本数据在任一初始特征维度的综合特征,确定属于任一初始特征维度的每个分组范围的样本数据,得到任一初始特征维度的每个分组范围对应的样本数据分组,并确定任一初始特征维度的每个样本数据分组对应的第一样本数量和第二样本数量,第一样本数量用于指示样本标签为第一样本标签的样本数据的数量,第二样本数量用于指示样本标签为第二样本标签的样本数据的数量;
特征维度评估单元147,用于基于任一初始特征维度的每个样本数据分组对应的第一样本数量和第二样本数量的比值,以及任一初始特征维度的多个样本数据分组对应的第一样本数量的总数量和第二样本数量的总数量的比值,确定任一初始特征维度的特征参考值;
特征维度筛选单元148,用于基于每个初始特征维度的特征参考值从M个初始特征维度中筛选得到K个特征维度。
请参见图10,图10是本申请实施例提供的一种计算机设备的结构示意图。如图10所示,该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图10所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以执行前文任一个所对应实施例中对该数据处理方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
上述计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
此外,这里需要指出的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前文任一个所对应实施例提供的方法。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (18)
1.一种数据处理方法,其特征在于,所述方法包括:
在获取到目标交易发起对象发起的待处理的第一业务交易时,识别所述第一业务交易的交易类型,得到所述第一业务交易的类型识别结果;
在所述第一业务交易的类型识别结果指示所述第一业务交易的交易类型为第一交易类型时,将所述第一业务交易确定为第一待验证交易;
获取用于对所述第一待验证交易进行交易检测的参考检查交易序列,在所述参考检查交易序列包含N个非法交易时,基于所述N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征;N为正整数;所述每个非法交易的交易时间戳均早于所述第一待验证交易的交易时间戳,且所述每个非法交易的交易类型均为第二交易类型,所述每个非法交易的交易发起对象均为所述目标交易发起对象;所述第二交易类型不同于所述第一交易类型;
将所述第一待验证交易在所述K个特征维度上的特征作为第一待识别交易特征,将所述第一待识别交易特征和所述交易参考特征输入与所述参考检查交易序列相关联的目标交易序列识别模型,通过所述目标交易序列识别模型对所述第一待识别交易特征和所述交易参考特征进行特性识别,得到与所述参考检查交易序列相关联的第一序列特征识别结果;
在所述第一序列特征识别结果指示所述交易参考特征中存在与所述第一待识别交易特征相匹配的特征时,将所述第一待验证交易的交易类型由所述第一交易类型更新为所述第二交易类型,将所述第一待验证交易作为所述第二交易类型所指示的第一非法交易添加至所述参考检查交易序列,得到第一目标非法交易序列;所述第一目标非法交易序列用于在获取到第二业务交易时,对所述参考检查交易序列进行更新处理;所述第二业务交易为所述第一业务交易的下一业务交易。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第一序列特征识别结果指示所述交易参考特征中不存在与所述第一待识别交易特征相匹配的特征时,将所述第一待验证交易的交易类型确定为所述第一交易类型,确定对交易类型为所述第一交易类型的第一待验证交易进行常规支付处理。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在确定对交易类型为所述第一交易类型的第一待验证交易进行常规支付处理时,记录交易类型为所述第一交易类型的第一待验证交易的交易数量;
在连续记录到交易类型为所述第一交易类型的第一待验证交易的交易数量累计到目标交易数量时,对所述参考检查交易序列中的所述N个非法交易进行置空处理,将置空处理后的第一交易序列作为置空交易序列。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在获取到所述目标交易发起对象发起的第三业务交易时,识别所述第三业务交易的交易类型,得到所述第三业务交易的类型识别结果;所述第三业务交易为在连续记录到交易类型为所述第一交易类型的第一待验证交易的交易数量累计到目标交易数量时的业务交易的下一业务交易;
在所述第三业务交易的类型识别结果为指示所述第三业务交易的交易类型为所述第二交易类型时,将所述第二交易类型的第三业务交易作为所述置空交易序列的第一个非法交易添加至所述置空交易序列,得到第三目标非法交易序列,所述第三目标非法交易序列用于在获取到所述第三业务交易的下一业务交易时,对所述参考检查交易序列进行更新处理。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第一业务交易的类型识别结果指示所述第一业务交易的交易类型为第二交易类型时,将所述第一业务交易确定为第二待验证交易;
获取用于对所述第二待验证交易进行交易检测的参考检查交易序列,在所述参考检查交易序列包含N个非法交易时,基于所述N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征,N为正整数;
将所述第二待验证交易在所述K个特征维度上的特征作为第二待识别交易特征,将所述第二待识别交易特征和所述交易参考特征输入与所述参考检查交易序列相关联的目标交易序列识别模型,通过所述目标交易序列识别模型对所述第二待识别交易特征和所述交易参考特征进行特性识别,得到与所述参考检查交易序列相关联的第二序列特征识别结果;
在所述第二序列特征识别结果指示所述交易参考特征中存在与所述第二待识别交易特征相匹配的特征时,将所述第二待验证交易作为所述第二交易类型所指示的第二非法交易添加至所述参考检查交易序列,得到第二目标非法交易序列;所述第二目标非法交易序列用于在获取到所述第二业务交易时,对所述参考检查交易序列进行更新处理。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在所述第二序列特征识别结果指示所述交易参考特征中不存在与所述第二待识别交易特征相匹配的特征时,对所述参考检查交易序列中的所述N个非法交易进行置空处理,并将所述第二交易类型的第二待验证交易作为进行置空处理后的参考检查序列的第一个非法交易,得到第四目标非法交易序列;所述第四目标非法交易序列用于在获取到第二业务交易时,对所述参考检查交易序列进行更新处理。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在将所述第一待验证交易的交易类型确定为所述第二交易类型时,对确定为所述第二交易类型的所述第一待验证交易进行支付拦截处理。
8.根据权利要求1所述的方法,其特征在于,所述识别所述第一业务交易的交易类型,得到所述第一业务交易的类型识别结果,包括:
获取所述第一业务交易的基础交易信息,所述基础交易信息包括以下一项或多项:业务交易的交易时间戳、业务交易对应的交易资源的资源数量、业务交易的交易发起对象对应的历史交易信息;
获取第一识别策略,并基于所述第一识别策略与所述基础交易信息识别所述第一业务交易的交易类型,得到所述第一业务交易的类型识别结果。
9.根据权利要求1所述的方法,其特征在于,所述K个特征维度包括以下一项或多项:交易发起对象的对象基础特征、交易发起对象的历史交易特征、交易接收对象的对象基础特征、交易发起对象与交易接收对象之间的历史交易关联特征、所述参考检查交易序列的序列特征。
10.根据权利要求1所述的方法,其特征在于,所述将所述第一待识别交易特征和所述交易参考特征输入与所述参考检查交易序列相关联的目标交易序列识别模型,包括:
基于所述第一待识别交易特征中在所述K个特征维度上的特征,构建针对所述第一待验证交易的第一交易向量;所述第一交易向量的向量维度为K;
基于所述交易参考特征中所述每个非法交易在所述K个特征维度上的特征,分别构建所述每个非法交易对应的第二交易向量,并基于所述每个非法交易的第二交易向量进行向量融合处理,得到参考交易向量;所述第二交易向量的向量维度和所述参考交易向量的向量维度均为K;
对所述第一交易向量和所述参考交易向量进行向量组合,得到目标特征向量;
将所述目标特征向量输入与所述参考检查交易序列相关联的目标交易序列识别模型。
11.根据权利要求1所述的方法,其特征在于,在将所述第一待识别交易特征和所述交易参考特征输入与所述参考检查交易序列相关联的目标交易序列识别模型之前,所述方法还包括:
获取至少一个投诉对象对应的对象投诉交易集合,并获取每个对象投诉交易集合关联的至少一个投诉关联交易,任一对象投诉交易集合中的对象投诉交易的交易投诉时间的时间差异小于时间阈值,任一投诉关联交易的交易时间戳处于关联的对象投诉交易集中的对象投诉交易的交易时间戳对应的目标时间戳范围内;
获取任一对象投诉交易集合与关联的任一投诉关联交易之间的相似性信息,在所述相似性信息满足相似性条件时,确定所述任一对象投诉交易集合与关联的所述任一投诉关联交易相匹配;
基于所述每个对象投诉交易集合和与所述每个对象投诉交易集合相匹配的投诉关联交易构建样本数据,并基于所述样本数据训练得到所述目标交易序列识别模型。
12.根据权利要求11所述的方法,其特征在于,所述样本数据包括第一样本数据和第二样本数据;所述基于所述每个对象投诉交易集合和与所述每个对象投诉交易集合相匹配的投诉关联交易构建样本数据,包括:
将所述任一对象投诉交易集合和与所述任一对象投诉交易集合相匹配的投诉关联交易确定为初始样本交易集合;
从所述初始样本交易集合中确定第一样本识别交易,并确定针对所述第一样本识别交易的第一样本标签;将所述初始样本交易集合中交易时间戳在所述第一样本识别交易的交易时间戳之前的业务交易确定为第一样本交易序列,基于所述第一样本识别交易、所述第一样本交易序列和所述第一样本标签构建第一样本数据,所述第一样本标签用于指示所述第一样本识别交易与所述第一样本交易序列相匹配;或者,
将所述初始样本交易集合中交易时间戳最晚的业务交易后进行常规支付处理的业务交易确定为第二样本识别交易,并确定针对所述第二样本识别交易的第二样本标签;将所述初始样本交易集合确定为第二样本交易序列,基于所述第二样本识别交易、所述第二样本交易序列和所述第二样本标签构建第二样本数据,所述第二样本标签用于指示所述第二样本识别交易与所述第二样本交易序列不匹配。
13.根据权利要求11所述的方法,其特征在于,所述样本数据包括样本识别交易、样本交易序列和样本标签,所述样本标签为用于指示所述样本识别交易与所述样本交易序列相匹配的第一样本标签,或者为用于指示所述样本识别交易与所述样本交易序列不匹配的第二样本标签;
所述基于所述样本数据训练得到所述目标交易序列识别模型,包括:
将所述样本交易序列中的每个业务交易在K个特征维度上的特征作为样本参考特征,并将所述样本识别交易在所述K个特征维度上的特征作为样本识别交易特征;
将所述样本参考特征和所述样本识别交易特征输入初始交易序列识别模型,通过所述初始交易序列识别模型对所述样本参考特征和所述样本识别交易特征进行特性识别,得到样本序列特征识别概率;所述样本序列特征识别概率用于指示所述样本参考特征中存在与所述样本识别交易特征相匹配的特征的概率;
基于所述样本序列特征识别概率和所述样本标签确定训练参考信息,基于所述训练参考信息对所述初始交易序列识别模型进行迭代训练,将迭代训练后的初始交易序列识别模型作为所述目标交易序列识别模型。
14.根据权利要求11所述的方法,其特征在于,所述样本数据的数量为多个,任一样本数据包括样本识别交易、样本交易序列和样本标签,所述样本标签为用于指示所述样本识别交易与所述样本交易序列相匹配的第一样本标签,或者为用于指示所述样本识别交易与所述样本交易序列不匹配的第二样本标签;所述方法还包括:
获取M个初始特征维度,以及所述M个初始特征维度中每个初始特征维度对应的多个分组范围;
基于每个样本数据的样本识别交易在任一初始特征维度的特征和所述每个样本数据的样本交易序列中的每个业务交易在所述任一初始特征维度的特征,确定所述每个样本数据在所述任一初始特征维度的综合特征;
基于所述任一初始特征维度的每个分组范围与每个样本数据在所述任一初始特征维度的综合特征,确定属于所述任一初始特征维度的每个分组范围的样本数据,得到所述任一初始特征维度的每个分组范围对应的样本数据分组,并确定所述任一初始特征维度的每个样本数据分组对应的第一样本数量和第二样本数量,所述第一样本数量用于指示样本标签为第一样本标签的样本数据的数量,所述第二样本数量用于指示样本标签为第二样本标签的样本数据的数量;
基于所述任一初始特征维度的每个样本数据分组对应的第一样本数量和第二样本数量的比值,以及所述任一初始特征维度的多个样本数据分组对应的第一样本数量的总数量和第二样本数量的总数量的比值,确定所述任一初始特征维度的特征参考值;
基于所述每个初始特征维度的特征参考值从所述M个初始特征维度中筛选得到所述K个特征维度。
15.一种数据处理装置,其特征在于,所述装置包括:
交易获取模块,用于在获取到目标交易发起对象发起的待处理的第一业务交易时,识别所述第一业务交易的交易类型,得到所述第一业务交易的类型识别结果;
第一识别模块,用于在所述第一业务交易的类型识别结果指示所述第一业务交易的交易类型为第一交易类型时,将所述第一业务交易确定为第一待验证交易;
序列获取模块,用于获取用于对所述第一待验证交易进行交易检测的参考检查交易序列,在所述参考检查交易序列包含N个非法交易时,基于所述N个非法交易中的每个非法交易在K个特征维度上的特征确定交易参考特征;N为正整数;所述每个非法交易的交易时间戳均早于所述第一待验证交易的交易时间戳,且所述每个非法交易的交易类型均为第二交易类型,所述每个非法交易的交易发起对象均为所述目标交易发起对象;所述第二交易类型不同于所述第一交易类型;
第二识别模块,用于将所述第一待验证交易在所述K个特征维度上的特征作为第一待识别交易特征,将所述第一待识别交易特征和所述交易参考特征输入与所述参考检查交易序列相关联的目标交易序列识别模型,通过所述目标交易序列识别模型对所述第一待识别交易特征和所述交易参考特征进行特性识别,得到与所述参考检查交易序列相关联的第一序列特征识别结果;
处理模块,用于在所述第一序列特征识别结果指示所述交易参考特征中存在与所述第一待识别交易特征相匹配的特征时,将所述第一待验证交易的交易类型由所述第一交易类型更新为所述第二交易类型,将所述第一待验证交易作为所述第二交易类型所指示的第一非法交易添加至所述参考检查交易序列,得到第一目标非法交易序列;所述第一目标非法交易序列用于在获取到第二业务交易时,对所述参考检查交易序列进行更新处理;所述第二业务交易为所述第一业务交易的下一业务交易。
16.一种计算机设备,其特征在于,包括:处理器和存储器;
所述处理器与所述存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使所述计算机设备执行权利要求1-14任一项所述的方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使具有所述处理器的计算机设备执行权利要求1-14任一项所述的方法。
18.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,该计算机指令适于由处理器读取并执行,以使具有所述处理器的计算机设备执行权利要求1-14任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310147551.XA CN116977069A (zh) | 2023-02-13 | 2023-02-13 | 数据处理方法、装置、设备、介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310147551.XA CN116977069A (zh) | 2023-02-13 | 2023-02-13 | 数据处理方法、装置、设备、介质及产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116977069A true CN116977069A (zh) | 2023-10-31 |
Family
ID=88470139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310147551.XA Pending CN116977069A (zh) | 2023-02-13 | 2023-02-13 | 数据处理方法、装置、设备、介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116977069A (zh) |
-
2023
- 2023-02-13 CN CN202310147551.XA patent/CN116977069A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399925B (zh) | 账号的风险识别方法、装置及存储介质 | |
CN112465411B (zh) | 一种风险预测方法、装置及设备 | |
CN109886290B (zh) | 用户请求的检测方法、装置、计算机设备及存储介质 | |
CN103338188B (zh) | 一种适用于移动云的客户端动态认证方法 | |
US10063579B1 (en) | Embedding the capability to track user interactions with an application and analyzing user behavior to detect and prevent fraud | |
CN112837069B (zh) | 基于区块链与大数据的安全支付方法及云平台系统 | |
CN108989150A (zh) | 一种登录异常检测方法及装置 | |
CN111709603B (zh) | 基于风控的服务请求处理方法、装置及系统 | |
CN107169499A (zh) | 一种风险识别方法及装置 | |
KR102259838B1 (ko) | 암호화폐 블랙리스트 구축 장치 및 방법 | |
CN110162958B (zh) | 用于计算设备的综合信用分的方法、装置和记录介质 | |
CN113468520A (zh) | 应用于区块链业务的数据入侵检测方法及大数据服务器 | |
CN112685774B (zh) | 基于大数据和区块链金融的支付数据处理方法及云服务器 | |
CN111931189A (zh) | Api接口转用风险检测方法、装置和api服务系统 | |
EP4060539A1 (en) | Real-time malicious activity detection using non-transaction data | |
CN110825776A (zh) | 空气质量检测报告处理方法、装置及计算设备、存储介质 | |
CN112702410B (zh) | 一种基于区块链网络的评估系统、方法及相关设备 | |
US11539730B2 (en) | Method, device, and computer program product for abnormality detection | |
CN111105064A (zh) | 确定欺诈事件的嫌疑信息的方法及装置 | |
KR20220101952A (ko) | 비트코인 불법거래 탐지 장치 및 방법 | |
CN117951341A (zh) | 基于区块链的业务处理方法、装置、设备、介质及产品 | |
Hu et al. | Method of informational and psychological influence evaluation in social networks based on fuzzy logic | |
CN116977069A (zh) | 数据处理方法、装置、设备、介质及产品 | |
CN110020239A (zh) | 恶意资源转移网页识别方法及装置 | |
CN116070191A (zh) | 信息处理方法及其装置、存储介质、程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |