CN108053318B - 一种对异常交易进行识别的方法及装置 - Google Patents

一种对异常交易进行识别的方法及装置 Download PDF

Info

Publication number
CN108053318B
CN108053318B CN201711385681.8A CN201711385681A CN108053318B CN 108053318 B CN108053318 B CN 108053318B CN 201711385681 A CN201711385681 A CN 201711385681A CN 108053318 B CN108053318 B CN 108053318B
Authority
CN
China
Prior art keywords
transaction
abnormal
target
data
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711385681.8A
Other languages
English (en)
Other versions
CN108053318A (zh
Inventor
滕鹏举
王占一
卢维清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qianxin Technology Group Co Ltd
Original Assignee
Qianxin Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qianxin Technology Group Co Ltd filed Critical Qianxin Technology Group Co Ltd
Priority to CN201711385681.8A priority Critical patent/CN108053318B/zh
Publication of CN108053318A publication Critical patent/CN108053318A/zh
Application granted granted Critical
Publication of CN108053318B publication Critical patent/CN108053318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本发明的实施例公开了一种对异常交易进行识别的方法及装置,该方法在接收到某一目标交易的目标交易数据后,通过强规则模型对该目标交易是否为异常交易进行识别,当识别出该目标交易为异常交易后,通过交易上下文模型判断该目标交易是否为异常交易。该方法在通过强规则模型识别为异常交易后,通过交易上下文模型对该交易进行进一步识别,考虑了目标交易和历史交易之间的关联性,提高了对异常交易进行识别的准确性。另一方面,本实施例中的强规则模型结合人工经验生成,使得在对交易是否为异常交易的判断过程中充分考虑机器经验和人工经验,提高了对异常交易进行识别的准确性。

Description

一种对异常交易进行识别的方法及装置
技术领域
本发明涉及金融机构交易识别技术领域,尤其是涉及一种对异常交易进行识别的方法及装置。
背景技术
伴随着网上金融业务的迅速发展,相关交易量迅速增长的同时,异常交易也出现的越来越多。异常交易不仅给用户自身造成巨大损失的,并且严重破坏金融秩序,伤害金融机构信誉,在社会造成了极坏的影响。目前,常见的异常交易主要类型为非本人交易、洗钱交易、诈骗交易等。通常非本人交易的作案手法为通过木马、病毒等手段,获取用户交易权限,借助于网上银行等新型线上支付手段,将用户资金迅速转移至犯罪分子账户,实现非法盈利。
异常交易的识别问题,随新型支付出现而诞生,发展历程较短,各方面发展目前还较不完善。异常交易在整体交易中占比极少,异常交易识别问题属于机器学习领域严重样本不均衡问题,也一直以来为机器学习领域的难点问题。如何能低误判、高并发的识别异常交易一直以来都是金融界研究的重难点。
目前,针对于异常交易这一网络金融交易类型,当前各金融机构识别时,主要根据业务人员基于异常交易理解,通过人工手动设定规则的方法进行识别。如,对于一类异常交易识别规则为:如果用户在特定时间如凌晨,进行了金额大于x的交易,则规则系统即认为该笔交易为异常交易,进行交易验证或阻断。传统基于规则的方法存在以下缺点:局限于单笔交易或邻近几条交易的异常识别,对于交易上下文交易行为考虑较少;通过人工设定组合规则,不同规则权重一致,无法突出有效特征规则;相关规则阈值的设定,由业务人员凭经验设定,难以精确定位,导致大量误判;对于复杂情况,单纯依赖人工规则难以判别,大量判别结果仍需人工介入。
在实现本发明实施例的过程中,发明人发现现有的对异常交易进行识别的方法中,单纯依靠人工或者机器进行识别,且识别过程中未考虑相关交易,局限性较大,容易导致误判。
另一方面,机器学习的样本通常基于历史交易数据,历史交易数据中正负样本的不均衡也导致通过机器学习对异常交易进行识别的准确率较低。
发明内容
本发明所要解决的技术问题是如何解决现有的对异常交易进行识别的方法中,单纯依靠人工或者机器进行识别,且识别过程中未考虑相关交易,局限性较大,容易导致误判的问题。
针对以上技术问题,本发明的实施例提供了一种对异常交易进行识别的方法,包括:
接收目标交易生成的交易数据,作为目标交易数据;
根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;
若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;
其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
可选地,还包括:
若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易;
其中,所述复杂模型为以第一样本中的交易数据和每一交易数据对应的交易是否为异常交易作为输入参数,通过机器学习得到的模型;所述第一样本为通过所述强规则模型判断为异常交易,且通过所述交易上下文模型判断为异常交易的交易所对应的交易数据组成的样本。
可选地,所述强规则模型的生成方法包括:
获取由交易数据组成的第二样本,将所述第二样本中的每一交易数据按照预设格式映射至预设特征空间中;
针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数;
获取区分力系数大于预设系数的至少一个特征类别,作为有效特征类别,将所述有效特征类别对应的特征规则作为所述强规则模型中用于识别交易是否为异常交易的特征规则;
其中,所述第二样本中的交易数据包括通过人工识别是否为异常交易的交易数据和通过机器识别是否为异常交易的交易数据。
可选地,所述针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数,包括:
计算所述第二样本中交易数据对应的交易不是异常交易的正样本的第一数量、以及交易数据对应的交易是异常交易的负样本的第二数量;
针对所述预设特征空间中的每一特征类别,计算在所述特征类别下,具有同一特征规则的交易数据的数量,作为特征规则数量,通过公式
Figure GDA0002594093400000041
计算所述特征类别的信息增益;
根据所述特征类别与判断交易是否为异常交易的相关程度,确定所述特征类别对应的相关系数;
根据所述信息增益和所述相关系数计算表征所述特征类别对判断交易是否为异常交易贡献大小的参数,作为所述区分力系数;
其中,Gain(S,A)表示在第二样本S中,特征类别A的信息增益,Entropy(S)为第二样本的熵,Sv为第二样本的交易数据中满足特征规则ν的交易数据,|Sv|表示Sv的数目,|S|表示S的数目,V(A)表示特征类别A下的所有特征规则组成的集合;Entropy(S)=-plog2p-nlog2n,p为所述第一数量,n为所述第二数量。
可选地,所述根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易,包括:
将所述目标交易数据按照所述预设格式映射至所述预设特征空间中,并获取所述目标交易数据映射在每一所述有效特征类别下的数据,得到目标特征数据;
针对每一目标特征数据,获取所述目标特征数据对应的特征类别下,交易不为异常交易对应的特征规则,判断所述目标特征数据是否符合交易不为异常交易所对应的特征规则,若是,将所述目标特征数据标记为符合所述强规则模型的特征数据;
若在目标特征数据中存在标记为符合所述强规则模型的特征数据,则所述目标交易不为异常交易,否则,所述目标交易为异常交易。
可选地,所述若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易,包括:
若通过所述强规则模型判断所述目标交易为异常交易,则获取与所述目标交易数据中转出账户相同的交易对应的交易数据,作为待分析交易数据;
判断所述待分析交易数据中是否存在与所述目标交易数据形成连续交易序列的交易数据,若不存在,判断所述目标交易为异常交易;
若存在形成所述连续交易序列的待分析交易数据,则获取形成的所述连续交易序列中与所述目标交易的交易时间差最小的待分析交易数据,作为连续交易数据;
从所述连续交易数据中,获取所述连续交易数据对应的交易发生地的第一地点,并从所述目标交易数据中获取所述目标交易的发生地的第二地点,判断所述第一地点和所述第二地点之间的距离差是否小于预设距离差,若是,判断所述目标交易不为异常交易,否则,判断所述目标交易为异常交易;
其中,所述连续交易序列由至少两个交易对应的交易数据组成,且时间上相邻的交易之间的交易时间差小于或等于预设时间差。
可选地,所述若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易,包括:
若通过所述交易上下文模型判断所述目标交易为异常交易,则将所述目标交易数据作为所述复杂模型的输入参数,判断所述目标交易是否为异常交易;
若所述目标交易为异常交易,则对所述目标交易进行人工验证。
可选地,还包括:
若通过所述强规则模型或所述目标交易上下文模型判断所述目标交易不为异常交易,则控制所述交易正常执行;
若通过所述复杂模型判断所述目标交易不为异常交易,则对所述目标交易进行机器验证。
第二方面,本发明的实施例还提供了一种对异常交易进行识别的装置,包括:
接收模块,用于接收目标交易生成的交易数据,作为目标交易数据;
第一判断模块,用于根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;
第二判断模块,用于若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;
其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
可选地,还包括第三判断模块,所述第三判断模块用于若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易;
其中,所述复杂模型为以第一样本中的交易数据和每一交易数据对应的交易是否为异常交易作为输入参数,通过机器学习得到的模型;所述第一样本为通过所述强规则模型判断为异常交易,且通过所述交易上下文模型判断为异常交易的交易所对应的交易数据组成的样本。
可选地,所述第一判断模块还用于获取由交易数据组成的第二样本,将所述第二样本中的每一交易数据按照预设格式映射至预设特征空间中;针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数;获取区分力系数大于预设系数的至少一个特征类别,作为有效特征类别,将所述有效特征类别对应的特征规则作为所述强规则模型中用于识别交易是否为异常交易的特征规则;
其中,所述第二样本中的交易数据包括通过人工识别是否为异常交易的交易数据和通过机器识别是否为异常交易的交易数据。
可选地,所述第一判断模块还用于计算所述第二样本中交易数据对应的交易不是异常交易的正样本的第一数量、以及交易数据对应的交易是异常交易的负样本的第二数量;
针对所述预设特征空间中的每一特征类别,计算在所述特征类别下,具有同一特征规则的交易数据的数量,作为特征规则数量,通过公式
Figure GDA0002594093400000071
计算所述特征类别的信息增益;根据所述特征类别与判断交易是否为异常交易的相关程度,确定所述特征类别对应的相关系数;根据所述信息增益和所述相关系数计算表征所述特征类别对判断交易是否为异常交易贡献大小的参数,作为所述区分力系数;
其中,Gain(S,A)表示在第二样本S中,特征类别A的信息增益,Entropy(S)为第二样本的熵,Sv为第二样本的交易数据中满足特征规则ν的交易数据,|Sv|表示Sv的数目,|S|表示S的数目,V(A)表示特征类别A下的所有特征规则组成的集合;Entropy(S)=-plog2p-nlog2n,p为所述第一数量,n为所述第二数量。
可选地,所述第一判断模块还用于将所述目标交易数据按照所述预设格式映射至所述预设特征空间中,并获取所述目标交易数据映射在每一所述有效特征类别下的数据,得到目标特征数据;针对每一目标特征数据,获取所述目标特征数据对应的特征类别下,交易不为异常交易对应的特征规则,判断所述目标特征数据是否符合交易不为异常交易所对应的特征规则,若是,将所述目标特征数据标记为符合所述强规则模型的特征数据;若在目标特征数据中存在标记为符合所述强规则模型的特征数据,则所述目标交易不为异常交易,否则,所述目标交易为异常交易。
可选地,所述第二判断模块还用于若通过所述强规则模型判断所述目标交易为异常交易,则获取与所述目标交易数据中转出账户相同的交易对应的交易数据,作为待分析交易数据;判断所述待分析交易数据中是否存在与所述目标交易数据形成连续交易序列的交易数据,若不存在,判断所述目标交易为异常交易;若存在形成所述连续交易序列的待分析交易数据,则获取形成的所述连续交易序列中与所述目标交易的交易时间差最小的待分析交易数据,作为连续交易数据;从所述连续交易数据中,获取所述连续交易数据对应的交易发生地的第一地点,并从所述目标交易数据中获取所述目标交易的发生地的第二地点,判断所述第一地点和所述第二地点之间的距离差是否小于预设距离差,若是,判断所述目标交易不为异常交易,否则,判断所述目标交易为异常交易;
其中,所述连续交易序列由至少两个交易对应的交易数据组成,且时间上相邻的交易之间的交易时间差小于或等于预设时间差。
可选地,所述第三判断模块还用于若通过所述交易上下文模型判断所述目标交易为异常交易,则将所述目标交易数据作为所述复杂模型的输入参数,判断所述目标交易是否为异常交易;若所述目标交易为异常交易,则对所述目标交易进行人工验证。
可选地,所述第三判断模块还用于若通过所述强规则模型或所述目标交易上下文模型判断所述目标交易不为异常交易,则控制所述交易正常执行;若通过所述复杂模型判断所述目标交易不为异常交易,则对所述目标交易进行机器验证。
第三方面,本发明的实施例还提供了一种电子设备,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该电子设备和服务器的通信设备或者终端的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行以上所述的方法。
第四方面,本发明的实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行以上所述的方法。
本发明的实施例提供了一种对异常交易进行识别的方法及装置,该方法在接收到某一目标交易的目标交易数据后,通过强规则模型对该目标交易是否为异常交易进行识别,当识别出该目标交易为异常交易后,通过交易上下文模型判断该目标交易是否为异常交易。该方法在通过强规则模型识别为异常交易后,通过交易上下文模型对该交易进行进一步识别,考虑了目标交易和历史交易之间的关联性,提高了对异常交易进行识别的准确性。另一方面,本实施例中的强规则模型结合人工经验生成,使得在对交易是否为异常交易的判断过程中充分考虑机器经验和人工经验,提高了对异常交易进行识别的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的对异常交易进行识别的方法的流程示意图;
图2是本发明另一个实施例提供的异常交易识别过程和用于识别异常交易模型生成过程的整体流程示意图;
图3是本发明另一个实施例提供的交易上下文模型的识别过程示意图;
图4是本发明另一个实施例提供的用于训练复杂模型的第一样本中的交易数据的数据结构示意图;
图5是本发明另一个实施例提供的对异常交易进行识别的方法的流程示意图;
图6是本发明另一个实施例提供的对异常交易进行识别的装置的结构框图;
图7是本发明另一个实施例提供的电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本实施例提供的一种对异常交易进行识别的方法的流程示意图,参见图1,该方法包括:
101:接收目标交易生成的交易数据,作为目标交易数据;
102:根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;
103:若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;
其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
需要说明的是,本实施例提供的方法由能够执行步骤101至步骤103的设备执行,例如,计算机或者服务器,本实施例对此不做具体限制。目标交易即为当前发生的,诸如转账、付款等交易,目标交易数据中包含了目标交易的交易时间,与目标交易有关的账户信息(转账用户和收账用户)、交易发生的地点、交易金额和发生交易的设备信息等。
强规则模型为根据机器识别的交易和人工识别的交易作为样本,训练得到的模型。在进行强规则模型训练的过程中,除了将机器识别的交易作为样本外,还可以将已经发生的犯罪案例视为根据人工经验判断的交易,也作为训练该模型的一个样本。例如,强规则模型中包括:若某一交易的交易时间的A时间段,且交易地点为A地点,那么只要目标交易对应的交易时间为A时间段且交易地点为A地点,则判断该目标交易不是异常交易。
交易上下文模型即为根据目标交易与历史交易的相关性判断交易是否为异常交易的模型。强规则模型和上下文交易模型的结合,避免了强规则模型的误判,提高了对异常交易进行识别的准确性。
本实施例提供了一种对异常交易进行识别的方法及装置,该方法在接收到某一目标交易的目标交易数据后,通过强规则模型对该目标交易是否为异常交易进行识别,当识别出该目标交易为异常交易后,通过交易上下文模型判断该目标交易是否为异常交易。该方法在通过强规则模型识别为异常交易后,通过交易上下文模型对该交易进行进一步识别,考虑了目标交易和历史交易之间的关联性,提高了对异常交易进行识别的准确性。另一方面,本实施例中的强规则模型结合人工经验生成,使得在对交易是否为异常交易的判断过程中充分考虑机器经验和人工经验,提高了对异常交易进行识别的准确性。
本实施例提供了一种对异常交易进行识别的方法,该方法在接收到某一目标交易的目标交易数据后,通过强规则模型对该目标交易是否为异常交易进行识别,当识别出该目标交易为异常交易后,通过交易上下文模型判断该目标交易是否为异常交易。该方法在通过强规则模型识别为异常交易后,通过交易上下文模型对该交易进行进一步识别,考虑了目标交易和历史交易之间的关联性,提高了对异常交易进行识别的准确性。另一方面,本实施例中的强规则模型结合人工经验生成,使得在对交易是否为异常交易的判断过程中充分考虑机器经验和人工经验,提高了对异常交易进行识别的准确性。
更进一步地,在上述实施例的基础上,还包括:
若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易;
其中,所述复杂模型为以第一样本中的交易数据和每一交易数据对应的交易是否为异常交易作为输入参数,通过机器学习得到的模型;所述第一样本为通过所述强规则模型判断为异常交易,且通过所述交易上下文模型判断为异常交易的交易所对应的交易数据组成的样本。
需要说明的是,本实施例中用于训练复杂模型的第一样本中的交易数据指的是,通过所述强规则模型判断为异常交易,且通过所述交易上下文模型判断为异常交易的交易所对应的交易数据。可见,第一样本为经过强规则模型和交易上下文模型过滤后所得的交易数据组成的样本。第一样本中包括未经强规则模型和交易上下文模型识别出的异常交易数据(负样本)和未经强规则模型和交易上下文模型识别出的正常交易数据(正样本)。强规则模型和交易上下文模型的过滤保证了第一样本中正负样本的均衡性,提高了复杂模型识别异常交易的准确性。
本实施例提供了一种对异常交易进行识别的方法,该方法在强规则模型和交易上下文模型均识别为异常交易的情况下,通过复杂模型对交易是否为异常交易进行进一步的判断。由于复杂模型是通过强规则模型和交易上下文模型过滤后的交易数据组成的样本训练得到的模型,正负样本数据相对均衡,对异常交易的识别准确率较高。同时,复杂模型的引入,对通过强规则模型和交易上下文模型判断为异常交易的交易进行再次判断,提高了对异常交易进行识别的准确性。
图2为本实施例提供了一种异常交易识别过程和用于识别异常交易模型生成过程的整体流程示意图,参见图2,该异常交易识别方法包括的模型有强规则模型、交易上下文模型和复杂模型。这些模型均由交易的历史交易数据生成。如图2所示,对历史交易数据进行特征处理(将历史交易数据映射至预设特征空间),然后根据进行特征处理后的历史交易数据进行规则计算,得到用于判别交易是否为异常交易的强规则模型。其中,规则计算根据历史交易数据映射的特征数据,找到至少一个特征类别下正常交易所具有的特征规则,将这至少一个特征类别下正常交易对应的特征规则作为识别交易中的正常交易的特征规则。
交易上下文行为模型即交易上下文模型,其是根据目标交易相关的历史交易数据对目标交易是否是异常交易进行识别的模型。例如,当强规则模型判断某一交易为异常交易后,交易上下文模型通过历史交易数据找到该目标交易的连续交易序列,通过连续交易序列对该目标交易是否为异常交易进行识别。
复杂模型生成,即将通过强规则模型和交易上下文模型均判断为异常交易的交易作为输入参数,进行机器学习得到的模型。
强规则模型、交易上下文模型和复杂模型生成后,针对任一实时的交易流数据,通过特征映射,用强规则模型进行强规则异常判断,若通过(即识别为正常交易),则输出交易识别结果。若未通过(即识别为异常交易),则由交易上下文模型进行交易上下文异常判断,若通过(即识别为正常交易),则输出交易识别结果。若未通过(即识别为异常交易),则由复杂模型进行判断,若未通过,则通过人工进行验证,并输出交易识别结果。
更进一步地,在上述各实施例的基础上,所述强规则模型的生成方法包括:
获取由交易数据组成的第二样本,将所述第二样本中的每一交易数据按照预设格式映射至预设特征空间中;
针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数;
获取区分力系数大于预设系数的至少一个特征类别,作为有效特征类别,将所述有效特征类别对应的特征规则作为所述强规则模型中用于识别交易是否为异常交易的特征规则;
其中,所述第二样本中的交易数据包括通过人工识别是否为异常交易的交易数据和通过机器识别是否为异常交易的交易数据。
更进一步地,在上述各实施例的基础上,所述针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数,包括:
计算所述第二样本中交易数据对应的交易不是异常交易的正样本的第一数量、以及交易数据对应的交易是异常交易的负样本的第二数量;
针对所述预设特征空间中的每一特征类别,计算在所述特征类别下,具有同一特征规则的交易数据的数量,作为特征规则数量,通过公式
Figure GDA0002594093400000141
计算所述特征类别的信息增益;
根据所述特征类别与判断交易是否为异常交易的相关程度,确定所述特征类别对应的相关系数;
根据所述信息增益和所述相关系数计算表征所述特征类别对判断交易是否为异常交易贡献大小的参数,作为所述区分力系数;
其中,Gain(S,A)表示在第二样本S中,特征类别A的信息增益,Entropy(S)为第二样本的熵,Sv为第二样本的交易数据中满足特征规则ν的交易数据,|Sv|表示Sv的数目,|S|表示S的数目,V(A)表示特征类别A下的所有特征规则组成的集合;Entropy(S)=-plog2p-nlog2n,p为所述第一数量,n为所述第二数量。
需要说明的是,第二样本中的交易数据为历史的交易数据。在强规则模型的生成过程中,将第二样本中的数据按照预设格式映射至预设特征空间。
具体地,图2中所示的过程中,主要步骤包括(1)特征处理、(2)规则计算、(3)上下文交易模型、(4)复杂模型生成(5)交易数据判别(6)识别结果后处理。
(1)特征处理
对第二样本的交易数据进行特征处理阶段,主要目的为基于特征工程将原有历史交易数据映射至预设特征空间,以预设特征空间的数据为基础产生强弱规则以及交易上下文模型。
其中,第二样本中的交易数据组成为:历史的正常交易数据与极少量的异常交易数据。历史交易主要输入数据格式(预设格式)为:交易信息、地理信息、交易方信息、设备信息、网络信息。交易数据映射至预设特征空间后的样例如表一所示。表一中诸如“交易时间”、“交易金额”、“交易渠道”等为特征类别,每一特征类别下的映射的交易数据的表现形式即为该交易数据在该特征类别下的特征规则。若该交易数据在该特征类别下的表现形式符合正常交易在该特征类别下的特征规则,则表明该交易数据对应的交易为正常交易。
其中,在特征处理阶段,核心工作为应用特征工程相关算法,将所得到的交易数据映射至预设特征空间中,便于进行特征规则的抽取以及后续的交易上下文模型的建模。将交易数据映射至预设特征空间的算法包括:特征映射算法(如将交易时间映射至星期、早中晚时段等;one-hot编码将交易渠道采取0-1编码形式,将交易渠道映射为0或1编码)或者FM特征生成算法(即将原有各独立特征组合,如将地理信息与付款行信息进行组合等)。
在此阶段,映射的特征除来源于特征组合算法外,同时引入业务人员长期的业务经验如是否在凌晨交易、是否在高危地点发生的交易等,进一步增强了模型的可解释性与业务实用性。
表一、交易数据在预设特征空间的映射
Figure GDA0002594093400000151
Figure GDA0002594093400000161
(2)规则计算
在特征规则计算阶段,输入为经过特征处理的交易数据(即经过特征映射的交易数据),输出为各特征对应的区分力强弱(区分力系数)。所谓特征区分力即各特征在区分正常交易与异常交易上能力的强弱。
在规则计算阶段,区分力来源于多种特征权重指标的混合,主要权重指标为信息增益、回归加权权重、相关系数等。
其中,信息增益来源于信息论,其由熵引申而来。熵在信息论中,用于评估集合的纯度。该社给定某一集合S,集合中正样本为p、负样本为n,则此集合的熵为:
Entropy(S)=-plog2p-nlog2n
例如:样本S为正负样本集合,样本包含6个反例与8个正例,则集合S的熵为:
Figure GDA0002594093400000162
对于样本集合S,属性A的信息增益为(此处的属性即为特征类别):
Figure GDA0002594093400000171
其中Sv为集合S在属性A上值为v的样本集合。
例如:集合S在性别属性上,异常交易与正常交易占比为3:11。集合S的性别属性上的子集女SM、子集男性SF,异常交易与正常交易占比分别为为1:5与2:6。则集合S在性别属性上的信息增益为:
Figure GDA0002594093400000172
回归加权权重,来源于回归模型,原理为在回归模型中,越重要特征在模型中对应的系数绝对值就越大,同时越不相关的特征,其系数越靠近0。根据此原理,可有效的查找出对于最终结构具有重要影响的特征。
通过此上特征评估算法结果的综合汇总,即可有效的评估在特征处理阶段获取的特征的区分力,并以此结果作为最终规则的强弱效果以及规则组合的依据。
本实施例提供了一种对异常交易进行识别的方法,该方法对交易数据进行特征映射,并根据映射到预设特征空间中的每一特征类别下的特征规则生成强规则模型,通过强规则模型实现对交易是否为异常交易的识别。
更进一步地,在上述各实施例的基础上,所述根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易,包括:
将所述目标交易数据按照所述预设格式映射至所述预设特征空间中,并获取所述目标交易数据映射在每一所述有效特征类别下的数据,得到目标特征数据;
针对每一目标特征数据,获取所述目标特征数据对应的特征类别下,交易不为异常交易对应的特征规则,判断所述目标特征数据是否符合交易不为异常交易所对应的特征规则,若是,将所述目标特征数据标记为符合所述强规则模型的特征数据;
若在目标特征数据中存在标记为符合所述强规则模型的特征数据,则所述目标交易不为异常交易,否则,所述目标交易为异常交易。
需要说明的是,目标交易数据映射至预设特征空间真空对应于有效特征类别下的交易数据中,只要有一个特征类别下的交易数据符合正常交易的特征规则,则判断该目标交易为正常交易。
本实施例提供了一种对异常交易进行识别的方法,该方法提供了通过强规则模型判断目标交易是否为正常交易的方法,通过该方法可以对目标交易是否为异常交易进行快速判断。
更进一步地,在上述各实施例的基础上,所述若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易,包括:
若通过所述强规则模型判断所述目标交易为异常交易,则获取与所述目标交易数据中转出账户相同的交易对应的交易数据,作为待分析交易数据;
判断所述待分析交易数据中是否存在与所述目标交易数据形成连续交易序列的交易数据,若不存在,判断所述目标交易为异常交易;
若存在形成所述连续交易序列的待分析交易数据,则获取形成的所述连续交易序列中与所述目标交易的交易时间差最小的待分析交易数据,作为连续交易数据;
从所述连续交易数据中,获取所述连续交易数据对应的交易发生地的第一地点,并从所述目标交易数据中获取所述目标交易的发生地的第二地点,判断所述第一地点和所述第二地点之间的距离差是否小于预设距离差,若是,判断所述目标交易不为异常交易,否则,判断所述目标交易为异常交易。
其中,所述连续交易序列由至少两个交易对应的交易数据组成,且时间上相邻的交易之间的交易时间差小于或等于预设时间差。
(3)上下文交易模型
在传统基于规则的异常交易识别系统中,往往将大部分精力集中于单条交易,对每一笔交易逐条判别识别,异常交易的识别对象为单笔用户交易。在实际中,绝大部分误判来源于对于连续多笔交易的判断。如在传统强规则模型,常会出现相邻极短的两笔交易,一笔被判别为正常、一笔被判别为异常。
本实施例提供了交易上下文模型,用于识别的对象为连续交易,实现了对于强规则判别为异常交易的情况下,通过交易上下文模型对交易是否异常进行判断,增强模型了的鲁棒性,降低了模型误判。
具体地,图3示出了本实施例提供的交易上下文模型的识别过程示意图,参见图3,该过程包括:
将用户实时交易数据(目标交易数据)进行连续交易判断切分;连续交易判断切分即从用户连续交易数据存储池中得到与目标交易组成连续交易序列的交易数据。连续交易数据存储池中存储有历史的交易数据。
当从连续交易数据存储池中能够进行连续交易环境判别切分,则可通过切分的连续交易对目标交易进行连续交易异常的判断。即若形成连续交易序列,则通过连续交易序列对目标交易是否为异常交易进行判断。
具体来说,交易上下文模型的主要包括两方面内容:识别连续交易是否来源于同一真实用户;基于上下文交易行为,完成来源于同一真实用户的连续交易识别。
要以上两方面内容,首先要识别连续交易序列。连续交易序列定义为用户a,在t时间内,完成的多笔金融交易。
依据全局大盘流量的统计,可设置连续交易时间间隔t(交易时间差)为5~6分钟,对于识别连续交易是否来源于同一真实用户,判别对象为用户连续交易序列。在此阶段,进行的工作为针对连续交易的概念进行更进一步的强化,切分、提取连续交易中为同一真实用户连续交易的序列。
例如,同一真实用户连续,定义为:一组交易环境未发生显著变化。其中,相邻连续交易序列交易环境是否发生显著变化的判断,主要为结合相邻交易时间间隔、相邻交易设备指纹比对、交易网络信息等特征。
对于连续交易异常判断,在同一真实用户连续交易识别的基础上,则可将连续交易作为一整体进行交易判断。结合提取的连续交易序列中,各子交易在强规则过滤结果、各子交易弱交易特征、子交易间特征,完成对于连续交易中强规则过滤未通过交易的二次判断。处理过程样例示例如表二所示。
如表二所示,在连续交易识别阶段,连续交易序列为表二中交易ID为1、2和3的交易,交易4不为连续交易。
在同一真实用户连续交易识别阶段,因交易3的交易环境变动显著,故交易序列进一步切分为交易ID为1和2的交易。
在最终的连续交易异常判断中,输入数据即为交易ID为1和2的交易。根据交易ID为1和2的交易在交易时间间隔、交易强规则判断结果、交易环境变化上等特征的表现,可对于强规则模型判断的交易ID为2的判断结果修正为通过,从而通过交易上下文模型判断交易ID为2的交易为正常操作。
表二、连续交易序列样例
Figure GDA0002594093400000201
(4)复杂模型生成
在金融领域的绝大部分交易为正常交易,故在强规则模型与交易上下文模型中,应用结合的模型一般为决策树、线性回归等简单的模型。基于强规则模型与交易上下文模型可以有效的识别出占交易绝大数的正常交易,降低交易判别时间,提升用户体验,同时减轻系统压力。对于未通过强规则与交易上下文模型的交易,此部分交易属于与异常交易极为相似的交易,应用简单模型已难以进行判断,在此本实施例引入复杂模型完成最终判断。
图4示出了本实施例提供的用于训练复杂模型的第一样本中的交易数据的数据结构示意图,参见图4,用于进行模型训练的历史交易数据,经过强规则模型的过滤后包括实际为异常交易对应的异常交易数据和实际为正常交易数据而被强规则模型识别为异常交易的嫌疑交易数据。
嫌疑交易数据和异常交易数据经过特征映射和交易上下文模型进行上下文交易特征的识别后,将经交易上下文模型进一步过滤后的交易数据作为训练复杂模型的第一样本。
基于前面流程的过滤结果,在复杂模型建模阶段正样本为未通过前面流程判断的正常交易,负样本为异常交易数据,以此较好的解决了正常交易数据与异常交易数据的正负样本极不均衡问题。将模型的解决的问题从区分正常交易与异常交易上,转移至区分正常交易中的嫌疑交易与异常交易上。在复杂模型识别上,主要应用复杂模型,挖掘弱规则与交易识别的关联关系。结合数据特点,主要应用结合的模型为XGBOOST、SVM等具有较高判别准确性、需求样本数据较少的复杂模型。
进一步地,在上述各实施例的基础上,所述若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易,包括:
若通过所述交易上下文模型判断所述目标交易为异常交易,则将所述目标交易数据作为所述复杂模型的输入参数,判断所述目标交易是否为异常交易;
若所述目标交易为异常交易,则对所述目标交易进行人工验证。
进一步地,在上述各实施例的基础上,还包括:
若通过所述强规则模型或所述目标交易上下文模型判断所述目标交易不为异常交易,则控制所述交易正常执行;
若通过所述复杂模型判断所述目标交易不为异常交易,则对所述目标交易进行机器验证。
需要说明的是,人工验证例如可以是银行工作人员通过电话对该交易是否为异常交易进行的识别。机器验证,例如可以是通过发送短信的方式判断该交易是否为异常交易的判断方法。
本实施例提供了一种对异常交易进行识别的方法,该方法在三种模型均判断目标交易为异常交易的情况下,通过人工验证的方式对该交易进行验证,对复杂模型判断为正常交易的交易通过机器验证进行验证,进一步提高了该异常交易识别的方法的准确性。
(5)交易数据判别
本实施例提供的对异常交易进行识别的方法对应的功能模块,可以集成部署于金融机构风控系统或交易系统中,所应用的模型及数据分为线上识别与离线准备两部分。线上识别模块主要功能为:基于单笔交易特点与交易发起用户历史累计数据在线实时完成异常交易判断。离线训练模块主要功能为:存储用户历史交易特征,实现相应特征字段的增量累积。系统输入数据为:待识别交易流数据、历史用户累积特征数据。
图5为本实施例提供的对异常交易进行识别的方法的流程示意图,参见图5,该方法包括:
输入在线的交易流数据(目标交易数据),将该交易流数据进行特征映射,通过强规则模型根据映射的特征对该交易流数据对应的交易是否为异常交易进行验证。
判断强规则模型对该交易流数据的验证是否通过,若是,则交易正常进行,否则,根据历史交易特征(历史交易数据),判断该交易流数据是否为连续交易,若是,通过交易上下文模型进行验证,否则,通过复杂模型进行验证。
判断交易上下文模型对该交易流数据的验证是否通过,若是,交易正常进行,否则,通过复杂模型进行验证。判断复杂模型对该交易流数据的验证是否通过,若是,对该交易流数据对应的交易进行机器验证,否则,对该交易流数据对应的交易进行人工验证。
(6)识别结果后处理
在最终识别结果中,可发现系统产出状态为两类即交易正常进行与人工处理。其中交易正常进行,即意味着此笔交易通过系统检验为正常交易,系统对于此交易进行不进行干涉。
一般而言,针对于进入复杂模型验证环节的交易,均会采用机器与人工介入的方式进行查验,而采取何种方式验证,则取决于设定的异常交易风险阈值。机器验证主要手段为:短信再确认、人脸识别、指纹识别。人工查验的手段主要有电话确认、交易阻隔等,所采取的手段主要,依赖于复杂模型最终所输出的异常风险指数。
识别为异常交易的异常风险指数阈值可人为根据经验设定,如大于0.4认为是异常交易概率高,判断为异常交易;小于0.4认为是异常交易概率低,采取较低级验证等。
本实施例提供的对异常交易进行识别的方法,强规则模型可实现,大盘流量的有效过滤,有效减少判别时长。连续交易模型,可基于强规则模型基础上,高准确率识别正常交易,降低正常交易误判率,为复杂模型判断准备。基于复杂模型的判断,可实现最终正常与异常交易的判别发现,最终判别结果输出至人工客服或其他验证方式,完成判别验证。
结合实际案例,在传统强规则可过滤90%正常流量的前提下,结合连续交易判别模型,可实现过滤95%以上的效果,在结合复杂模型判断,可将正常流量过滤比控制为98%以上。
本实施例提供的对异常交易进行识别的方法,相比于传统方法,结合机器学习与业务经验,有效提取已发生犯罪案例特征规则,并对于生成规则进行评分组合;将强弱规则与上下文交易模型以及复杂模型相结合,实现流量过滤,在保证模型可解释性的情况下,一定程度上减轻了样本不均衡问题,降低系统误判率。
图6示出了本发明的实施例提供的一种对异常交易进行识别的装置的结构框图,参见图6,本实施例提供的对异常交易进行识别的装置,包括接收模块601、第一判断模块602和第二判断模块603,其中,
接收模块601,用于接收目标交易生成的交易数据,作为目标交易数据;
第一判断模块602,用于根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;
第二判断模块603,用于若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;
其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
本实施例提供的对异常交易进行识别的装置适用于上述实施例中提供的对异常交易进行识别的方法,在此不再赘述。
本实施例提供了一种对异常交易进行识别的装置,该装置在接收到某一目标交易的目标交易数据后,通过强规则模型对该目标交易是否为异常交易进行识别,当识别出该目标交易为异常交易后,通过交易上下文模型判断该目标交易是否为异常交易。该方法在通过强规则模型识别为异常交易后,通过交易上下文模型对该交易进行进一步识别,考虑了目标交易和历史交易之间的关联性,提高了对异常交易进行识别的准确性。另一方面,本实施例中的强规则模型结合人工经验生成,使得在对交易是否为异常交易的判断过程中充分考虑机器经验和人工经验,提高了对异常交易进行识别的准确性。
第三方面,图7是示出本实施例提供的电子设备的结构框图。
参照图7,所述电子设备包括:处理器(processor)701、存储器(memory)702、通信接口(Communications Interface)703和总线704;
其中,
所述处理器701、存储器702、通信接口703通过所述总线704完成相互间的通信;
所述通信接口703用于该电子设备和服务器的通信设备或者终端的通信设备之间的信息传输;
所述处理器701用于调用所述存储器702中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:接收目标交易生成的交易数据,作为目标交易数据;根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
第四方面,本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:接收目标交易生成的交易数据,作为目标交易数据;根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如,包括:接收目标交易生成的交易数据,作为目标交易数据;根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的实施例各实施例技术方案的范围。

Claims (10)

1.一种对异常交易进行识别的方法,其特征在于,包括:
接收目标交易生成的交易数据,作为目标交易数据;所述目标交易数据中包含了目标交易的交易时间,与目标交易有关的账户信息、交易发生的地点、交易金额和发生交易的设备信息;
根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;
若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;
其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型;
所述强规则模型的生成方法包括:
获取由交易数据组成的第二样本,将所述第二样本中的每一交易数据按照预设格式映射至预设特征空间中;
针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数;
获取区分力系数大于预设系数的至少一个特征类别,作为有效特征类别,将所述有效特征类别对应的特征规则作为所述强规则模型中用于识别交易是否为异常交易的特征规则;
其中,所述第二样本中的交易数据包括通过人工识别是否为异常交易的交易数据和通过机器识别是否为异常交易的交易数据;
所述针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数,包括:
计算所述第二样本中交易数据对应的交易不是异常交易的正样本的第一数量、以及交易数据对应的交易是异常交易的负样本的第二数量;
针对所述预设特征空间中的每一特征类别,计算在所述特征类别下,具有同一特征规则的交易数据的数量,作为特征规则数量,通过公式
Figure FDA0003028678900000021
计算所述特征类别的信息增益;
根据所述特征类别与判断交易是否为异常交易的相关程度,确定所述特征类别对应的相关系数;
根据所述信息增益和所述相关系数计算表征所述特征类别对判断交易是否为异常交易贡献大小的参数,作为所述区分力系数;
其中,Gain(S,A)表示在第二样本S中,特征类别A的信息增益,Entropy(S)为第二样本的熵,Sv为第二样本的交易数据中满足特征规则ν的交易数据,|Sv|表示Sv的数目,|S|表示S的数目,V(A)表示特征类别A下的所有特征规则组成的集合;Entropy(S)=-p log2p-nlog2n,p为所述第一数量,n为所述第二数量;
所述根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易,包括:
将所述目标交易数据按照所述预设格式映射至所述预设特征空间中,并获取所述目标交易数据映射在每一所述有效特征类别下的数据,得到目标特征数据;
针对每一目标特征数据,获取所述目标特征数据对应的特征类别下,交易不为异常交易对应的特征规则,判断所述目标特征数据是否符合交易不为异常交易所对应的特征规则,若是,将所述目标特征数据标记为符合所述强规则模型的特征数据;
若在目标特征数据中存在标记为符合所述强规则模型的特征数据,则所述目标交易不为异常交易,否则,所述目标交易为异常交易;
其中,所述方法还包括:
若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易;
其中,所述复杂模型为以第一样本中的交易数据和每一交易数据对应的交易是否为异常交易作为输入参数,通过机器学习得到的模型;所述第一样本为通过所述强规则模型判断为异常交易,且通过所述交易上下文模型判断为异常交易的交易所对应的交易数据组成的样本。
2.根据权利要求1所述的方法,其特征在于,所述若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易,包括:
若通过所述强规则模型判断所述目标交易为异常交易,则获取与所述目标交易数据中转出账户相同的交易对应的交易数据,作为待分析交易数据;
判断所述待分析交易数据中是否存在与所述目标交易数据形成连续交易序列的交易数据,若不存在,判断所述目标交易为异常交易;
若存在形成所述连续交易序列的待分析交易数据,则获取形成的所述连续交易序列中与所述目标交易的交易时间差最小的待分析交易数据,作为连续交易数据;
从所述连续交易数据中,获取所述连续交易数据对应的交易发生地的第一地点,并从所述目标交易数据中获取所述目标交易的发生地的第二地点,判断所述第一地点和所述第二地点之间的距离差是否小于预设距离差,若是,判断所述目标交易不为异常交易,否则,判断所述目标交易为异常交易;
其中,所述连续交易序列由至少两个交易对应的交易数据组成,且时间上相邻的交易之间的交易时间差小于或等于预设时间差。
3.根据权利要求1所述的方法,其特征在于,所述若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易,包括:
若通过所述交易上下文模型判断所述目标交易为异常交易,则将所述目标交易数据作为所述复杂模型的输入参数,判断所述目标交易是否为异常交易;
若所述目标交易为异常交易,则对所述目标交易进行人工验证。
4.根据权利要求1所述的方法,其特征在于,还包括:
若通过所述强规则模型或所述目标交易上下文模型判断所述目标交易不为异常交易,则控制所述交易正常执行;
若通过所述复杂模型判断所述目标交易不为异常交易,则对所述目标交易进行机器验证。
5.一种对异常交易进行识别的装置,其特征在于,包括:
接收模块,用于接收目标交易生成的交易数据,作为目标交易数据;所述目标交易数据中包含了目标交易的交易时间,与目标交易有关的账户信息、交易发生的地点、交易金额和发生交易的设备信息;
第一判断模块,用于根据所述目标交易数据,通过强规则模型判断所述目标交易是否为异常交易;
第二判断模块,用于若通过所述强规则模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过交易上下文模型判断所述目标交易是否为异常交易;
其中,所述强规则模型为结合人工经验生成的判断交易是否为异常交易的模型;所述交易上下文模型为根据与交易相关的历史交易判断交易是否为异常交易的模型;
所述第一判断模块还用于获取由交易数据组成的第二样本,将所述第二样本中的每一交易数据按照预设格式映射至预设特征空间中;针对所述预设特征空间中的每一特征类别,根据映射至所述特征类别下的每一交易数据的特征规则和每一交易数据对应的交易是否为异常交易,确定所述特征类别用于区分交易是否为异常交易的区分力系数;获取区分力系数大于预设系数的至少一个特征类别,作为有效特征类别,将所述有效特征类别对应的特征规则作为所述强规则模型中用于识别交易是否为异常交易的特征规则;
其中,所述第二样本中的交易数据包括通过人工识别是否为异常交易的交易数据和通过机器识别是否为异常交易的交易数据;
所述第一判断模块还用于计算所述第二样本中交易数据对应的交易不是异常交易的正样本的第一数量、以及交易数据对应的交易是异常交易的负样本的第二数量;
针对所述预设特征空间中的每一特征类别,计算在所述特征类别下,具有同一特征规则的交易数据的数量,作为特征规则数量,通过公式
Figure FDA0003028678900000051
计算所述特征类别的信息增益;根据所述特征类别与判断交易是否为异常交易的相关程度,确定所述特征类别对应的相关系数;根据所述信息增益和所述相关系数计算表征所述特征类别对判断交易是否为异常交易贡献大小的参数,作为所述区分力系数;
其中,Gain(S,A)表示在第二样本S中,特征类别A的信息增益,Entropy(S)为第二样本的熵,Sv为第二样本的交易数据中满足特征规则ν的交易数据,|Sv|表示Sv的数目,|S|表示S的数目,V(A)表示特征类别A下的所有特征规则组成的集合;Entropy(S)=-p log2p-nlog2n,p为所述第一数量,n为所述第二数量;
所述第一判断模块还用于将所述目标交易数据按照所述预设格式映射至所述预设特征空间中,并获取所述目标交易数据映射在每一所述有效特征类别下的数据,得到目标特征数据;针对每一目标特征数据,获取所述目标特征数据对应的特征类别下,交易不为异常交易对应的特征规则,判断所述目标特征数据是否符合交易不为异常交易所对应的特征规则,若是,将所述目标特征数据标记为符合所述强规则模型的特征数据;若在目标特征数据中存在标记为符合所述强规则模型的特征数据,则所述目标交易不为异常交易,否则,所述目标交易为异常交易;
其中,所述装置还包括第三判断模块,所述第三判断模块用于若通过所述交易上下文模型判断所述目标交易为异常交易,则根据所述目标交易数据,通过复杂模型判断所述目标交易是否为异常交易;
其中,所述复杂模型为以第一样本中的交易数据和每一交易数据对应的交易是否为异常交易作为输入参数,通过机器学习得到的模型;所述第一样本为通过所述强规则模型判断为异常交易,且通过所述交易上下文模型判断为异常交易的交易所对应的交易数据组成的样本。
6.根据权利要求5所述的装置,其特征在于,所述第二判断模块还用于若通过所述强规则模型判断所述目标交易为异常交易,则获取与所述目标交易数据中转出账户相同的交易对应的交易数据,作为待分析交易数据;判断所述待分析交易数据中是否存在与所述目标交易数据形成连续交易序列的交易数据,若不存在,判断所述目标交易为异常交易;若存在形成所述连续交易序列的待分析交易数据,则获取形成的所述连续交易序列中与所述目标交易的交易时间差最小的待分析交易数据,作为连续交易数据;从所述连续交易数据中,获取所述连续交易数据对应的交易发生地的第一地点,并从所述目标交易数据中获取所述目标交易的发生地的第二地点,判断所述第一地点和所述第二地点之间的距离差是否小于预设距离差,若是,判断所述目标交易不为异常交易,否则,判断所述目标交易为异常交易;
其中,所述连续交易序列由至少两个交易对应的交易数据组成,且时间上相邻的交易之间的交易时间差小于或等于预设时间差。
7.根据权利要求5所述的装置,其特征在于,所述第三判断模块还用于若通过所述交易上下文模型判断所述目标交易为异常交易,则将所述目标交易数据作为所述复杂模型的输入参数,判断所述目标交易是否为异常交易;若所述目标交易为异常交易,则对所述目标交易进行人工验证。
8.根据权利要求5所述的装置,其特征在于,所述第三判断模块还用于若通过所述强规则模型或所述目标交易上下文模型判断所述目标交易不为异常交易,则控制所述交易正常执行;若通过所述复杂模型判断所述目标交易不为异常交易,则对所述目标交易进行机器验证。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该电子设备和服务器的通信设备或者终端的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至4任一项所述的方法。
CN201711385681.8A 2017-12-20 2017-12-20 一种对异常交易进行识别的方法及装置 Active CN108053318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711385681.8A CN108053318B (zh) 2017-12-20 2017-12-20 一种对异常交易进行识别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711385681.8A CN108053318B (zh) 2017-12-20 2017-12-20 一种对异常交易进行识别的方法及装置

Publications (2)

Publication Number Publication Date
CN108053318A CN108053318A (zh) 2018-05-18
CN108053318B true CN108053318B (zh) 2021-09-03

Family

ID=62130250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711385681.8A Active CN108053318B (zh) 2017-12-20 2017-12-20 一种对异常交易进行识别的方法及装置

Country Status (1)

Country Link
CN (1) CN108053318B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985583A (zh) * 2018-06-27 2018-12-11 中国银行股份有限公司 基于人工智能的金融数据风险控制方法及装置
CN108876166A (zh) * 2018-06-27 2018-11-23 平安科技(深圳)有限公司 财务风险验证处理方法、装置、计算机设备及存储介质
CN109474756B (zh) * 2018-11-16 2020-09-22 国家计算机网络与信息安全管理中心 一种基于协同网络表示学习的电信异常检测方法
CN110009371B (zh) * 2018-12-27 2023-06-20 创新先进技术有限公司 异常行为确定方法、装置、设备及计算机可读存储介质
CN110363534B (zh) * 2019-06-28 2023-11-17 创新先进技术有限公司 用于识别异常交易的方法及装置
US11423405B2 (en) * 2019-09-10 2022-08-23 International Business Machines Corporation Peer validation for unauthorized transactions
CN110717758B (zh) * 2019-10-10 2021-04-13 支付宝(杭州)信息技术有限公司 异常交易识别方法和装置
CN110705995B (zh) * 2019-10-10 2022-08-30 支付宝(杭州)信息技术有限公司 数据标签化方法和装置
CN111277465A (zh) * 2020-01-20 2020-06-12 支付宝(杭州)信息技术有限公司 一种异常数据报文检测方法、装置及电子设备
CN111681010A (zh) * 2020-06-11 2020-09-18 中国银行股份有限公司 一种交易验证方法及装置
CN111768305A (zh) * 2020-06-24 2020-10-13 中国工商银行股份有限公司 反洗钱识别方法及装置
CN115115456A (zh) * 2022-08-29 2022-09-27 太极计算机股份有限公司 高速公路门架交易的汇总方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8386623B2 (en) * 2009-12-17 2013-02-26 American Express Travel Related Services Company, Inc. System and method for enabling channel relevancy and rating in an IP marketplace
CN103049851A (zh) * 2012-12-27 2013-04-17 中国建设银行股份有限公司 一种基于交易数据的反欺诈监控方法和装置
CN106447333A (zh) * 2016-11-29 2017-02-22 中国银联股份有限公司 一种欺诈交易侦测方法及服务器
CN106506454A (zh) * 2016-10-10 2017-03-15 江苏通付盾科技有限公司 欺诈业务识别方法及装置
CN106611316A (zh) * 2015-10-16 2017-05-03 阿里巴巴集团控股有限公司 异常交易的提供方法和装置
CN106682067A (zh) * 2016-11-08 2017-05-17 浙江邦盛科技有限公司 一种基于交易数据的机器学习反欺诈监测系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8386623B2 (en) * 2009-12-17 2013-02-26 American Express Travel Related Services Company, Inc. System and method for enabling channel relevancy and rating in an IP marketplace
CN103049851A (zh) * 2012-12-27 2013-04-17 中国建设银行股份有限公司 一种基于交易数据的反欺诈监控方法和装置
CN106611316A (zh) * 2015-10-16 2017-05-03 阿里巴巴集团控股有限公司 异常交易的提供方法和装置
CN106506454A (zh) * 2016-10-10 2017-03-15 江苏通付盾科技有限公司 欺诈业务识别方法及装置
CN106682067A (zh) * 2016-11-08 2017-05-17 浙江邦盛科技有限公司 一种基于交易数据的机器学习反欺诈监测系统
CN106447333A (zh) * 2016-11-29 2017-02-22 中国银联股份有限公司 一种欺诈交易侦测方法及服务器

Also Published As

Publication number Publication date
CN108053318A (zh) 2018-05-18

Similar Documents

Publication Publication Date Title
CN108053318B (zh) 一种对异常交易进行识别的方法及装置
CN107316198B (zh) 账户风险识别方法及装置
KR101364763B1 (ko) 금융거래패턴분석을 이용한 금융사기 경보 시스템 및 방법
US20060202012A1 (en) Secure data processing system, such as a system for detecting fraud and expediting note processing
CN109509093B (zh) 一种基于主体画像的交易安全控制方法及系统
CN106789844B (zh) 一种恶意用户识别方法及装置
CN111049659B (zh) 基于手写签名识别的业务验证方法、装置及系统
CN106548342A (zh) 一种可信设备确定方法及装置
CN112837069A (zh) 基于区块链与大数据的安全支付方法及云平台系统
CN114186626A (zh) 一种异常检测方法、装置、电子设备及计算机可读介质
CN110335144B (zh) 个人电子银行账户安全检测方法及装置
CN109242658B (zh) 可疑交易报告生成方法、系统、计算机设备和存储介质
CN111915312A (zh) 风险识别方法及装置和电子设备
CN112750038A (zh) 交易风险的确定方法、装置和服务器
CN114742655B (zh) 基于机器学习的反洗钱行为识别系统
CN114841705B (zh) 一种基于场景识别的反欺诈监测方法
CN109871514B (zh) 一种数据处理方法、装置及存储介质
CN110245879A (zh) 一种风险评级方法及装置
CN108446907B (zh) 安全校验方法及装置
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN114708090A (zh) 基于大数据的银行支付业务风险识别装置
CN110990810B (zh) 一种用户操作数据处理方法、装置、设备及存储介质
Lawrencia et al. Fraud detection decision support system for Indonesian financial institution
CN117952619A (zh) 基于数字人民币钱包账户关联性的风险行为分析方法、系统及计算机可读介质
CN117670503A (zh) 业务申请数据处理方法、装置和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 332, 3 / F, Building 102, 28 xinjiekouwei street, Xicheng District, Beijing 100088

Applicant after: Qianxin Technology Group Co.,Ltd.

Address before: 100015 15, 17 floor 1701-26, 3 building, 10 Jiuxianqiao Road, Chaoyang District, Beijing.

Applicant before: Beijing Qi'anxin Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant