CN110363534B - 用于识别异常交易的方法及装置 - Google Patents

用于识别异常交易的方法及装置 Download PDF

Info

Publication number
CN110363534B
CN110363534B CN201910579410.9A CN201910579410A CN110363534B CN 110363534 B CN110363534 B CN 110363534B CN 201910579410 A CN201910579410 A CN 201910579410A CN 110363534 B CN110363534 B CN 110363534B
Authority
CN
China
Prior art keywords
abnormal transaction
transaction
abnormal
sample
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910579410.9A
Other languages
English (en)
Other versions
CN110363534A (zh
Inventor
解承莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910579410.9A priority Critical patent/CN110363534B/zh
Publication of CN110363534A publication Critical patent/CN110363534A/zh
Application granted granted Critical
Publication of CN110363534B publication Critical patent/CN110363534B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供用于识别异常交易的方法,包括:基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度,所述各个异常交易类别的第一异常交易识别模型是利用相应异常交易类别的第一异常交易样本集训练得到的;以及基于确定出的各个第一关联度,利用第二异常交易识别模型确定所述待识别交易是否为异常交易,所述第二异常交易识别模型是利用第二异常交易样本集中的各个第二异常交易样本与所述各个异常交易类别中的至少一个异常交易类别的第二关联度训练得到的,所述第二关联度利用所述第一异常交易模型确定。

Description

用于识别异常交易的方法及装置
技术领域
本公开涉及计算机技术领域,具体地,涉及用于识别异常交易的方法及装置。
背景技术
在互联网商务中,欺诈性交易等异常交易会给交易方带来损失。通过对异常交易进行识别,能够采取措施以减少损失。目前,主要采用人为筛选黑白名单、配置异常决策规则等方法来进行异常交易识别。黑白名单、决策规则依赖人为经验,存在人为主观因素干扰,因而对异常交易的识别准确度难以提高。
发明内容
鉴于上述,本公开提供了一种用于识别异常交易的方法及装置。利用该方法和装置,利用针对各个异常交易类别的第一异常交易识别模型确定待识别交易与各个异常交易类别之间的各个第一关联度,然后利用第二异常交易模型基于所获得的各个第一关联度来确定待识别交易是否为异常交易,能够提高异常交易识别的准确性。
根据本公开的一个方面,提供了一种用于识别异常交易的方法,包括:基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度,所述各个异常交易类别的第一异常交易识别模型是利用相应异常交易类别的第一异常交易样本集训练得到的;以及基于确定出的各个第一关联度,利用第二异常交易识别模型确定所述待识别交易是否为异常交易,所述第二异常交易识别模型是利用第二异常交易样本集中的各个第二异常交易样本与所述各个异常交易类别中的至少一个异常交易类别的第二关联度训练得到的,所述第二关联度利用所述第一异常交易模型确定。
可选的,在一个示例中,基于确定出的各个第一关联度,利用第二异常交易识别模型确定所述待识别交易是否为异常交易可以包括:基于确定出的各个第一关联度,确定所述待识别交易的对应异常交易类别;以及利用所述对应异常交易类别的第二异常交易识别模型,基于对应异常交易类别所对应的第一关联度,识别所述待识别交易是否为异常交易。其中,所述第二异常交易识别模型是在基于所述各个第二异常交易样本与所述各个异常交易类别的第二关联度,确定出所述各个第二异常交易样本所对应的异常交易类别之后,利用所述各个第二异常交易样本所对应的异常交易类别的第二关联度训练得到的。
可选的,在一个示例中,基于确定出的各个第一关联度,利用第二异常交易识别模型识别所述待识别交易是否为异常交易可以包括:将确定出的各个第一关联度作为所述第二异常交易识别模型的输入,以确定所述待识别交易是否为异常交易。其中,所述第二异常交易识别模型是利用所述各个第二异常交易样本与所述各个异常交易类别的第二关联度训练得到的。
可选的,在一个示例中,所述各个异常交易类别和相应异常交易类别的第一异常交易样本集可以是对原始异常交易样本集进行聚类而得到的。
可选的,在一个示例中,所述原始异常交易样本集中的各个原始异常交易样本为经过特征筛选处理的异常交易样本,所述特征筛选处理可以基于以下规则中的任一项来执行:针对所述初始异常交易样本集中的各个原始异常交易样本:选取该原始交易样本中的各个样本特征中,两两之间的第一相关度小于第一相关度阈值的样本特征;选取所述各个样本特征中,与异常交易标记之间的第二相关度大于第二相关度阈值的样本特征;选取所述各个样本特征中,至少一个两两之间的相关特性为线性相关的样本特征和至少一个两两之间的相关特性为非线性相关的样本特征;和/或选取所述各个样本特征中,至少一个与异常交易标记之间的相关特性为线性相关的样本特征和至少一个与异常交易标记之间的相关特性为非线性相关的样本特征。
可选的,在一个示例中,所述各个第一异常交易样本集中的各个第一异常交易样本可以基于相应异常交易类别的选定特征而生成,所述选定特征可以是利用相应异常交易类别的特征选择模型基于对应于各个异常交易类别的原始交易样本得到的。
可选的,在一个示例中,基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度可以包括:基于各个异常交易类别的选定特征和所述待识别交易样本,生成对应于各个异常交易类别的各个待识别交易子样本;以及基于所述各个待识别交易子样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度。
可选的,在一个示例中,所述聚类可以基于层次聚类实现。
根据本公开的另一方面,还提供一种用于识别异常交易的装置,包括:第一关联度确定单元,被配置为基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度,所述各个异常交易类别的第一异常交易识别模型是利用相应异常交易类别的第一异常交易样本集训练得到的;以及异常交易识别单元,被配置为基于确定出的各个第一关联度,利用第二异常交易识别模型确定所述待识别交易是否为异常交易,所述第二异常交易识别模型是利用第二异常交易样本中的各个第二异常交易样本与所述各个异常交易类别中的至少一个异常交易类别的第二关联度训练得到的,所述第二关联度利用所述第一异常交易模型确定。
可选的,在一个示例中,所述异常交易识别单元可以包括:对应异常交易类别确定模块,被配置为基于确定出的各个第一关联度,确定所述待识别交易的对应异常交易类别;以及异常交易识别模块,被配置为利用所述对应异常交易类别的第二异常交易识别模型,基于对应异常交易类别所对应的第一关联度,识别所述待识别交易是否为异常交易。其中,所述第二异常交易识别模型是在基于所述各个第二异常交易样本与所述各个异常交易类别的第二关联度,确定出所述各个第二异常交易样本所对应的异常交易类别之后,利用所述各个第二异常交易样本所对应的异常交易类别的第二关联度训练得到的。
可选的,在一个示例中,所述异常交易识别单元可以被配置为:将确定出的各个第一关联度作为所述第二异常交易识别模型的输入,以确定所述待识别交易是否为异常交易。其中,所述第二异常交易识别模型是利用所述各个第二异常交易样本与所述各个异常交易类别的第二关联度训练得到的。
可选的,在一个示例中,所述各个异常交易类别和相应异常交易类别的第一异常交易样本集可以是对原始异常交易样本集进行聚类而得到的。
可选的,在一个示例中,所述各个第一异常交易样本集中的各个第一异常交易样本可以基于相应异常交易类别的选定特征而生成,所述选定特征可以是利用相应异常交易类别的特征选择模型基于对应于各个异常交易类别的原始交易样本得到的。
可选的,在一个示例中,所述第一关联度确定单元可以包括:交易子样本生成模块,被配置为基于各个异常交易类别的选定特征和所述待识别交易样本,生成对应于各个异常交易类别的各个待识别交易子样本;以及第一关联度确定模块,被配置为基于所述各个待识别交易子样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度。
根据本公开的另一方面,还提供一种计算设备,包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的方法。
根据本公开的另一方面,还提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的方法。
利用本公开的方法及装置,通过利用第一异常交易识别模型确定待识别交易与各个异常交易类别之间的各个第一关联度,然后利用第二异常交易模型基于所获得的各个第一关联度来确定待识别交易是否为异常交易,从而能够利用异常交易识别模型来根据待识别交易的与各个异常交易类别的关联度来确定是否是异常交易,能够减少人为经验干预,以提高识别准确性。
利用本公开的装置和系统,利用各个第二异常交易样本所对应的异常交易类别的第二关联度训练得到第二异常交易识别模型,并基于待识别交易与对应异常交易类别的第一关联度来确定待识别交易是否为异常交易,能够在对待识别交易进行分类之后再确定其是否为异常交易,从而避免因第二异常交易识别模型对类别不敏感而带来的识别误差。
利用本公开的装置和系统,利用各个第二异常交易样本与各个异常交易类别的第二关联度训练得到第二异常交易识别模型,并利用第二异常交易识别模型基于待识别交易与各个交易类别的第一关联度,来确定待识别交易是否为异常交易,能够综合各个异常交易类别的特征来识别异常交易。
利用本公开的装置和系统,通过对原始异常交易样本集进行聚类而得到各个异常交易类别和相应异常交易类别的第一异常交易样本集,在划分异常交易类别时能避免人为干扰因素。
利用本公开的装置和系统,通过基于层次聚类来得到各个异常交易类别和各个异常交易类别的各个第一异常交易样本,能够通过调节层次聚类的参数来根据实际情况调节异常交易类别的划分粒度。
附图说明
通过参照下面的附图,可以实现对于本公开内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开的实施例,但并不构成对本公开的实施例的限制。在附图中:
图1是根据本公开的一个实施例的异常交易识别方法的流程图;
图2是根据本公开的一个实施例的异常交易识别方法中使用的第一异常交易识别模型的训练过程的一个示例的流程图;
图3是利用互信息来表征各个样本特征之间的两两相关度的示例性示意图;
图4是根据本公开的一个实施例的异常交易识别方法中的第一关联度确定过程的一个示例的流程图;
图5是根据本公开的一个实施例的异常交易识别方法中使用的第二异常交易识别模型训练过程的一个示例的流程图;
图6是根据本公开的一个实施例的异常交易识别方法中使用的第二异常交易识别模型训练过程的另一个示例的流程图;
图7是根据本公开的一个实施例的异常交易识别方法中的异常交易确定过程的一个示例的流程图;
图8是根据本公开的一个实施例的异常交易识别装置的结构框图;
图9是图8所示的异常交易识别装置中的第一关联度确定单元的一个示例的结构框图;
图10是图8所示的异常交易识别装置中的异常交易确定单元的一个示例的结构框图;
图11是根据本公开的一个实施例的用于实现异常交易识别方法的计算设备的结构框图。
具体实施方式
以下将参考示例实施方式讨论本文描述的主题。应该理解,对这些实施方式的描述只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
现在结合附图来描述本公开的异常交易识别方法及装置。
图1是根据本公开的一个实施例的异常交易识别方法的流程图。
如图1所示,在块120中,基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与各个异常交易类别的各个第一关联度。各个第一关联度表征待识别交易与各个异常交易类别的相似度。第一异常交易模型的输出例如可以是概率值,各个第一关联度可以表示待识别交易属于各个异常交易类别的概率。
各个异常交易类别可以根据经验确定,可以根据经验对原始异常交易样本进行标注,以得出对应于各个异常交易类别的各个第一异常交易样本集。然后,可以利用各个第一异常交易样本集来训练出对应于各个异常交易类别的各个第一异常交易识别模型。
在另一示例中,还可以对原始异常交易样本进行聚类而得出各个异常交易类别及相应异常交易类别的第一异常交易样本集,然后训练出对应于各个异常交易类别的第一异常交易识别模型。
图2是根据本公开的一个实施例的异常交易识别方法中使用的第一异常交易识别模型的训练过程的一个示例的流程图。
如图2所示,在块202,对原始异常交易样本集中的各个原始异常交易样本进行特征筛选处理。在本公开中,原始异常交易样本并不是指未对异常交易样本进行任何数据处理,其仅仅是指未经过本公开实施例中所提及的聚类等处理的异常交易样本。在一个示例中,可以针对各个原始异常交易样本,确定该原始异常交易样本中的各个样本特征两两之间的第一相关度,然后选取第一相关度低于第一相关度阈值的样本特征。通过该处理,能够使各个原始异常交易样本中的各个样本特征相关度较小,以使得筛选出的各个样本特征具有代表性。由此,能够在充分反映异常交易样本的各项特征的前替下,减少样本特征的数量,从而能提高第一异常交易识别模型的训练效率。
还可以针对各个原始异常交易样本,确定该异常交易样本中的各个样本特征与异常交易之间的第二相关度,然后选取第二相关度大于第二相关度阈值的样本特征。样本特征与异常交易之间的第二相关度能够表征该样本特征与异常交易的关联程度。第二相关度越大,则表明包括该样本特征的交易为异常交易的可能性越大。第二相关度大的样本特征更有助于识别异常交易。在一个示例中,可以基于相应样本特征的取值在异常交易样本中的分布情况来确定样本特征与异常交易之间的第二相关度。
此外,在进行特征筛选处理时,可以选取特征间相关特性为线性相关的样本特征和特征间相关特性为非线性相关的特征。还可以选取与异常交易标记之间的相关特性为线性相关的特征以及与异常交易标记之间的相关特性为非线性相关的样本特征。在一个示例中,可以在所选取的样本特征中,线性相关的样本特征与非线性相关的样本特征数量相同。
第一相关度和第二相关度例如可以用欧氏距离来表征。特征与特征之间、特征与异常交易之间的欧氏距离越大表明相关度越低,欧氏距离越小表明相关度越高。在一个示例中,每一笔交易的交易样本可以包括商户特征和交易对象特征、交易特征等。商户特征例如可以包括商户名、商户经营范围、经常与该商户发生交易的交易对象等,交易对象特征例如可以包括交易对象(用户)的账号名、银行卡号、身份证号、IP地址等,交易特征例如可以包括交易金额、给定时间段内的交易笔数、交易频率、交易金额最大值、交易金额最小值等。可以基于与各个样本特征有关的信息来确定欧氏距离,例如,对于银行卡号,可以基于该银行卡在给定时间内的交易频率、交易总额生成特征向量,对交易对象的账号可以基于该账号在给定时间段内的使用频率、使用时长等生成特征向量,进而可基于特征向量来确定欧氏距离。
此外,第一相关度和第二相关度还可以用互信息来表征。图3是利用互信息来表征各个样本特征之间的两两相关度的示例性示意图。从图3中可以看出,样本特征X1和X2与X4之间具有相关性,而X3与X4不相关。其中,X1与X4的相关特性为线性相关,X2与X4之间的相关特性为非线性相关。各个样本特征与异常交易标记之间的第二相关度也可以采用类似方法确定,此时异常交易标记的取值可以为0或1,或者也可以是概率值。
在进行特征筛选处理之后,在块204,对经过特征筛选之后的原始异常交易样本集进行聚类,以得到各个异常交易类别和相应异常交易类别的第一异常交易样本集。在一个示例中,可以采用层次聚类来对原始异常交易样本集进行聚类。例如,可以将特征筛选之后的各个原始异常交易样本作为输入,采用平均距离聚类法,基于层次聚类产生的层次数和每个层次的P值来确获取聚类的数量,从而确定异常交易类别的数量。采用层次聚类时,能够通过层次数、P值来确定异常交易类别的粒度,以使异常交易类别适应实际需要。
在一个示例中,在聚类得到多个异常交易类别之后,可以利用特征选择模型对各个聚类对应的原始异常交易样本进行特征选择处理,以得到对应于各个异常交易类别的选定特征。在所有样本特征中,有些样本特征对于异常交易识别的重要性较高,而有些样本特征对异常交易识别的重要性较低。因此,可以针对每个异常交易类别,选取重要性较高的样本特征作为选定特征来进行模型训练,以减少训练过程占用的运算资源,并提高模型性能。特征选择模型例如可以基于SVM、随机森林、逻辑回归算法等实现。在进行特征选择处理之前,还可以对交易样本特征集中的各个交易样本特征进行归一化处理。对于连续型样本特征可以采用数值归一化的方式进行归一化处理,对于离散型样本特征可以采用独热编码(One-Hot编码)方式进行编码。
在一个示例中,可以针对每个异常交易类别建立多个特征选择模型,并利用多个特征选择模型来进行对样本特征进行投票,然后选择投票数不低于预定数量的样本特征作为该异常交易类别对应的选定特征。例如,假设某异常交易类别有100个样本特征,分别选择用LR、随机森林、SVM建立多个特征选择模型,其中LR、随机森林和SVM分别认为有55个、45个、64个样本特征为重要特征,而其中有25个被两个及以上特征选择模型认为重要,则选择这25个样本特征作为相应异常交易类别的选定特征。
在选择出各个异常交易类别的选定特征之后,可以基于所选择出的选定特征和对应于各个异常交易类别的原始异常交易样本,生成对应异常交易类别的第一异常交易样本集。例如,如果对于某异常交易类别,所选择出的选定特征包括商户经营范围、商户在给定时间段内的交易总额、交易对象的身份证号、交易对象的银行卡号、交易对象的账户名时,则该异常交易类别的第一异常交易样本中可以只保留这些选定特征,而去除其它特征。
在得到各个异常交易类别和每个异常交易类别的第一异常交易样本集之后,在块206,针对各个异常交易类别,利用该异常交易类别的第一异常交易样本集来训练该异常交易类别的第一异常交易识别模型。由此,可以针对每个异常交易类别分别建立第一异常交易识别模型。
在对待识别交易进行识别时,利用每个异常交易类别的第一异常交易识别模型来基于待识别交易的待识别交易样本来确定与各个异常交易类别的各个第一关联度。
在确定出各个异常交易类别的选定特征时,可以采用图4所示的示例来确定第一关联度。图4是根据本公开的一个实施例的异常交易识别方法中的确定各个第一关联度的一个示例的流程图。
如图4所示,在块402,基于各个异常交易类别的选定特征和待识别交易样本,生成对应于各个异常交易类别的各个待识别交易子样本。
然后,在块404,基于各个待识别交易子样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与各个异常交易类别的各个第一关联度。
在确定出待识别交易与各个异常交易类别的各个第一关联度之后,在块140中,基于确定出的各个第一关联度,利用第二异常交易识别模型确定待识别交易是否为异常交易。第二异常交易识别模型可以利用各个第二异常交易样本与各个异常交易类别中的至少一个异常交易类别的第二关联度训练得到。第二关联度表征第二异常交易样本与各个异常交易类别的相似度。每个第二异常交易样本与各个异常交易类别的第二关联度可以利用第一异常交易模型确定。第二异常交易模型例如可以采用逻辑回归模型等二分类模型来实现。
各个第二异常交易样本可以是各个第一异常交易样本集中的异常交易样本。在异常交易样本数据足够多的情况下,第二异常交易样本也可以未被包含在各个第一异常交易样本集中。
图5是根据本公开的一个实施例的异常交易识别方法中使用的第二异常交易识别模型的训练过程的一个示例的流程图。
如图5所示,在块502,针对各个第二异常交易样本,基于各个异常交易类别的选定特征,生成该第二异常交易样本对应于各个异常交易类别的各个第二异常交易子样本。例如,假设某异常交易类别的选定特征为A、B、C、D,则保留第二异常交易样本中的特征A、B、C、D,而去除其它特征以作为该异常交易类别的第二异常交易子样本。而如果另一异常交易类别的选定特征为A、C、E、F,则保留第二异常交易样本中的特征A、C、E、F,而去除其它特征以作为该异常交易类别的第二异常交易子样本。
在块504,利用各个异常交易类别的第一异常交易识别模型,基于各个第二异常交易子样本,确定该第二异常交易样本与各个异常交易类别的各个第二关联度。可以将各个第二异常交易子样本作为第一异常交易识别模型的预测样本,以得出对应第二异常交易样本的各个第二关联度。
在块506,利用第二异常交易样本中的各个第二异常交易样本与各个异常交易类别中的至少一个异常交易类别的第二关联度训练第二异常交易模型。
在一个示例中,可以将每个第二异常交易样本与各个异常交易类别的各个第二关联度作为第二异常交易识别模型的训练样本,以对第二异常交易识别模型进行训练。例如,对于某第二异常交易样本,如果其与各个异常交易类别的第二关联度分别是X1~Xn,则可以对应地生成用于训练第二异常交易识别模型的训练样本[X1,X2……Xn]。在对待识别交易进行识别时,可以将待识别交易与各个异常交易类别的各个第一关联度作为第二异常交易识别模型的输入,以确定待识别交易是否为异常交易。
图6是第二异常交易识别模型的训练过程的另一示例的流程图。
如图6所示,在块602,针对各个第二异常交易样本,基于该第二异常交易样本的各个第二关联度,确定该第二异常交易样本对应的异常交易类别。可以将第二关联度最大的异常交易类别确定为该第二异常交易样本对应的异常交异类别。
在块604,利用各个第二异常交易样本对应的异常交易类别的第二关联度来训练第二异常交易识别模型。
在采用图6所示训练过程时,可以利用图7所示的异常交易确定过程来确定待识别交易是否为异常交易。图7是根据本公开的一个实施例的异常交易识别方法中的异常交易确定过程的一个示例的流程图。
如图7所示,在块702,基于确定出的各个第一关联度,确定待识别交易的对应异常交易类别。可以将第一关联度的最大值的异常交易类别确定为对应异常交易类别
在确定出待识别交易的对应异常交易类别之后,在块704,利用对应异常交易类别的第二异常交易识别模型,基于对应异常交易类别所对应的第一关联度,识别待识别交易是否为异常交易。
图8是根据本公开的一个实施例的异常交易识别装置的结构框图。如图8所示,异常交易识别装置800包括第一关联度确定单元810和异常交易识别单元820。
第一关联度确定单元810被配置为基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与各个异常交易类别的各个第一关联度,各个异常交易类别的第一异常交易识别模型是利用相应异常交易类别的第一异常交易样本集训练得到的。各个异常交易类别和相应异常交易类别的第一异常交易样本集可以通过对原始异常交易样本集进行聚类而得到。在一个示例中,各个第一异常交易样本集中的各个第一异常交易样本可以基于相应异常交易类别的选定特征而生成,选定特征是利用相应异常交易类别的特征选择模型基于对应于各个异常交易类别的原始交易样本得到的。
异常交易识别单元820被配置为基于确定出的各个第一关联度,利用第二异常交易识别模型确定待识别交易是否为异常交易,第二异常交易识别模型是利用第二异常交易样本中的各个第二异常交易样本与各个异常交易类别中的至少一个异常交易类别的第二关联度训练得到的,第二关联度利用第一异常交易模型确定。
在一个示例中,可以利用各个第二异常交易样本与各个异常交易类别的第二关联度训练得到第二异常交易识别模型。此时,异常交易识别单元820可以被配置为将确定出的各个第一关联度作为第二异常交易识别模型的输入,以确定待识别交易是否为异常交易。
图9是图8所示的异常交易识别装置中的第一关联度确定单元的一个示例的结构框图。如图9所示,第一关联度确定单元810包括交易子样本生成模块811和第一关联度确定模块812。
交易子样本生成模块811被配置为基于各个异常交易类别的选定特征和待识别交易样本,生成对应于各个异常交易类别的各个待识别交易子样本。在生成各个待识别交易子样本之后,第一关联度确定模块812基于各个待识别交易子样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与各个异常交易类别的各个第一关联度。
图10是图8所示的异常交易识别装置中的异常交易确定单元的一个示例的结构框图。如图10所示,异常交易确定单元820包括对应异常交易类别确定模块821和异常交易确定模块822。
对应异常交易类别确定模块821被配置为基于确定出的各个第一关联度,确定所述待识别交易的对应异常交易类别。异常交易识别模块822被配置为利用对应异常交易类别的第二异常交易识别模型,基于对应异常交易类别所对应的第一关联度,识别待识别交易是否为异常交易。其中,第二异常交易识别模型是在基于各个第二异常交易样本与各个异常交易类别的第二关联度,确定出各个第二异常交易样本所对应的异常交易类别之后,利用各个第二异常交易样本所对应的异常交易类别的第二关联度训练得到的。
以上参照图1到图10,对根据本公开的用于识别异常交易的方法及装置的实施例进行了描述。在以上对方法实施例的描述中所提及的细节,同样适用于本公开的装置的实施例。
本公开的用于识别异常交易的装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见。
本公开的用于识别异常交易的装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将存储器中对应的计算机程序指令读取到内存中运行形成的。在本公开中,用于识别异常交易的装置例如可以利用计算设备实现。
图11是根据本公开的一个实施例的用于实现异常交易识别方法的计算设备的结构框图。如图11所示,计算设备1100包括处理器1110、存储器1120、内存1130、通信接口1140和内部总线1150,并且处理器1110、存储器1120、内存1130、通信接口1140经由总线1150连接在一起。根据一个实施例,计算设备1100可以包括至少一个处理器1110,该至少一个处理器1110执行在计算机可读存储介质(即,存储器1120)中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器1120中存储计算机可执行指令,其当执行时使得至少一个处理器1110:基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别的各个第一关联度;以及基于确定出的各个第一关联度,利用第二异常交易识别模型确定所述待识别交易是否为异常交易。
应该理解,在存储器1120中存储的计算机可执行指令当执行时使得至少一个处理器1110进行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。
根据一个实施例,提供了一种例如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。
具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
以上结合附图详细描述了本公开的实施例的可选实施方式,但是,本公开的实施例并不限于上述实施方式中的具体细节,在本公开的实施例的技术构思范围内,可以对本公开的实施例的技术方案进行多种简单变型,这些简单变型均属于本公开的实施例的保护范围。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (14)

1.一种用于识别异常交易的方法,包括:
基于待识别交易,利用各个异常交易类别所对应的第一异常交易识别模型,确定所述待识别交易与所述各个异常交易类别之间的各个第一关联度,所述各个异常交易类别的第一异常交易识别模型利用该异常交易类别的第一异常交易样本集训练出,所述各个第一关联度用于表征待识别交易与各个异常交易类别之间的相似度;以及
将所确定出的各个第一关联度作为第二异常交易识别模型的输入,以确定所述待识别交易是否为异常交易,所述第二异常交易识别模型利用第二异常交易样本集中的各个第二异常交易样本与所述各个异常交易类别中的至少一个异常交易类别之间的第二关联度训练出,所述各个第二异常交易样本与异常交易类别之间的第二关联度通过将该第二异常交易样本提供给该异常交易类别所对应的第一异常交易模型确定,所述各个第二异常交易样本的第二关联度用于表征该第二异常交易样本与异常交易类别之间的相似度。
2.如权利要求1所述的方法,其中,将所确定出的各个第一关联度作为第二异常交易识别模型的输入,以确定所述待识别交易是否为异常交易包括:
基于所确定出的各个第一关联度,确定所述待识别交易的对应异常交易类别;以及
将所述待识别交易与所确定出的异常交易类别之间的第一关联度作为所确定出的异常交易类别所对应的第二异常交易识别模型的输入,以识别所述待识别交易是否为异常交易,
其中,各个异常交易类别所对应的第二异常交易识别模型是在基于利用各个第一异常交易识别模型确定出的各个第二异常交易样本的与该异常交易类别之间的第二关联度,确定出该第二异常交易样本所对应的异常交易类别之后,利用该异常交易类别所对应的第二异常交易样本与该异常交易类别之间的第二关联度训练出。
3.如权利要求1或2所述的方法,其中,所述各个异常交易类别和相应异常交易类别的第一异常交易样本集通过对原始异常交易样本集进行聚类得到。
4.如权利要求3所述的方法,其中,所述原始异常交易样本集中的各个原始异常交易样本为经过特征筛选处理的异常交易样本,所述特征筛选处理基于以下规则中的任一项来执行:
针对所述原始异常交易样本集中的各个原始异常交易样本:
从该原始异常交易样本中的各个样本特征中选取两两之间的第一相关度小于第一相关度阈值的样本特征;
从所述各个样本特征中选取与异常交易标记之间的第二相关度大于第二相关度阈值的样本特征;
从所述各个样本特征中选取至少一个两两之间的相关特性为线性相关的样本特征和至少一个两两之间的相关特性为非线性相关的样本特征;和/或
从所述各个样本特征中选取至少一个与异常交易标记之间的相关特性为线性相关的样本特征和至少一个与异常交易标记之间的相关特性为非线性相关的样本特征。
5.如权利要求1或2所述的方法,其中,所述第一异常交易样本集中的各个第一异常交易样本基于相应异常交易类别的选定特征而生成,各个异常交易类别的选定特征通过将各个异常交易类别的原始交易样本提供给该异常交易类别的特征选择模型来进行特征选择得到。
6.如权利要求5所述的方法,其中,基于待识别交易样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别之间的各个第一关联度包括:
基于各个异常交易类别的选定特征和所述待识别交易样本,生成对应于各个异常交易类别的各个待识别交易子样本;以及
基于所述各个待识别交易子样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别之间的各个第一关联度。
7.如权利要求3所述的方法,其中,所述聚类基于层次聚类实现。
8.一种用于识别异常交易的装置,包括:
第一关联度确定单元,被配置为基于待识别交易,利用各个异常交易类别所对应的第一异常交易识别模型,确定所述待识别交易与所述各个异常交易类别之间的各个第一关联度,所述各个异常交易类别的第一异常交易识别模型利用该异常交易类别的第一异常交易样本集训练出,所述各个第一关联度用于表征待识别交易与各个异常交易类别之间的相似度;以及
异常交易识别单元,被配置为将所确定出的各个第一关联度作为第二异常交易识别模型的输入,以确定所述待识别交易是否为异常交易,所述第二异常交易识别模型利用第二异常交易样本中的各个第二异常交易样本与所述各个异常交易类别中的至少一个异常交易类别之间的第二关联度训练出,所述各个第二异常交易样本与异常交易类别之间的第二关联度通过将该第二异常交易样本提供给该异常交易类别所对应的第一异常交易模型确定,所述各个第二异常交易样本的第二关联度用于表征该第二异常交易样本与异常交易类别之间的相似度。
9.如权利要求8所述的装置,其中,所述异常交易识别单元包括:
对应异常交易类别确定模块,被配置为基于所确定出的各个第一关联度,确定所述待识别交易的对应异常交易类别;以及
异常交易识别模块,被配置为将所述待识别交易与所确定出的异常交易类别之间的第一关联度作为所确定出的异常交易类别所对应的第二异常交易识别模型的输入,以识别所述待识别交易是否为异常交易,
其中,各个异常交易类别所对应的第二异常交易识别模型是在基于利用各个第一异常交易模型确定出的各个第二异常交易样本与该异常交易类别之间的第二关联度,确定出该第二异常交易样本所对应的异常交易类别之后,利用该异常交易类别所对应的第二异常交易样本与该异常交易类别之间的第二关联度训练出。
10.如权利要求8或9所述的装置,其中,所述各个异常交易类别和相应异常交易类别的第一异常交易样本集通过对原始异常交易样本集进行聚类得到。
11.如权利要求8或9所述的装置,其中,所述第一异常交易样本集中的各个第一异常交易样本基于相应异常交易类别的选定特征而生成,各个异常交易类别的选定特征通过将各个异常交易类别的原始交易样本提供给该异常交易类别的特征选择模型进行特征选择得到。
12.如权利要求8所述的装置,其中,所述第一关联度确定单元包括:
交易子样本生成模块,被配置为基于各个异常交易类别的选定特征和所述待识别交易样本,生成对应于各个异常交易类别的各个待识别交易子样本;以及
第一关联度确定模块,被配置为基于所述各个待识别交易子样本,利用各个异常交易类别的第一异常交易识别模型,确定待识别交易与所述各个异常交易类别之间的各个第一关联度。
13.一种计算设备,包括:
至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1到7中任一所述的方法。
14.一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求1到7中任一所述的方法。
CN201910579410.9A 2019-06-28 2019-06-28 用于识别异常交易的方法及装置 Active CN110363534B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910579410.9A CN110363534B (zh) 2019-06-28 2019-06-28 用于识别异常交易的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910579410.9A CN110363534B (zh) 2019-06-28 2019-06-28 用于识别异常交易的方法及装置

Publications (2)

Publication Number Publication Date
CN110363534A CN110363534A (zh) 2019-10-22
CN110363534B true CN110363534B (zh) 2023-11-17

Family

ID=68217241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910579410.9A Active CN110363534B (zh) 2019-06-28 2019-06-28 用于识别异常交易的方法及装置

Country Status (1)

Country Link
CN (1) CN110363534B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113034123B (zh) * 2021-02-19 2024-03-12 腾讯科技(深圳)有限公司 异常资源转移识别方法、装置、电子设备及可读存储介质
CN114186646A (zh) * 2022-02-15 2022-03-15 国网区块链科技(北京)有限公司 区块链异常交易识别方法及装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529960A (zh) * 2016-11-07 2017-03-22 中国银联股份有限公司 电子交易中的欺诈交易检测方法
CN106651373A (zh) * 2016-12-02 2017-05-10 中国银联股份有限公司 一种混合欺诈交易检测分类器建立方法及装置
CN108717638A (zh) * 2018-05-18 2018-10-30 深圳壹账通智能科技有限公司 欺诈交易判断方法、装置、计算机设备和存储介质
CN109559218A (zh) * 2018-11-07 2019-04-02 北京先进数通信息技术股份公司 一种异常交易的确定方法、装置及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120284188A1 (en) * 2011-05-02 2012-11-08 Vasquez Margaret C Interchange reporting manager
CN107133628A (zh) * 2016-02-26 2017-09-05 阿里巴巴集团控股有限公司 一种建立数据识别模型的方法及装置
CN107391569B (zh) * 2017-06-16 2020-09-15 阿里巴巴集团控股有限公司 数据类型的识别、模型训练、风险识别方法、装置及设备
CN108053318B (zh) * 2017-12-20 2021-09-03 奇安信科技集团股份有限公司 一种对异常交易进行识别的方法及装置
CN109087106B (zh) * 2018-07-03 2020-12-08 创新先进技术有限公司 识别二次放号账户盗用的风控模型训练、风控方法、装置以及设备
CN109615020A (zh) * 2018-12-25 2019-04-12 深圳前海微众银行股份有限公司 基于机器学习模型的特征分析方法、装置、设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529960A (zh) * 2016-11-07 2017-03-22 中国银联股份有限公司 电子交易中的欺诈交易检测方法
CN106651373A (zh) * 2016-12-02 2017-05-10 中国银联股份有限公司 一种混合欺诈交易检测分类器建立方法及装置
CN108717638A (zh) * 2018-05-18 2018-10-30 深圳壹账通智能科技有限公司 欺诈交易判断方法、装置、计算机设备和存储介质
CN109559218A (zh) * 2018-11-07 2019-04-02 北京先进数通信息技术股份公司 一种异常交易的确定方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multiple instance learning for credit risk assessment with transaction data;Tao ZHANG等;Knowledge-Based Systems;全文 *
基于大数据的电商异常交易风险评估仿真;王颖 等;计算机仿真;全文 *

Also Published As

Publication number Publication date
CN110363534A (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
CN111783875B (zh) 基于聚类分析的异常用户检测方法、装置、设备及介质
CN109583468B (zh) 训练样本获取方法,样本预测方法及对应装置
CN105590055B (zh) 用于在网络交互系统中识别用户可信行为的方法及装置
CN110929525B (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
Zhou et al. Fraud detection within bankcard enrollment on mobile device based payment using machine learning
CN109214904B (zh) 财务造假线索的获取方法、装置、计算机设备和存储介质
CN111985921B (zh) 基于区块链离线支付的验证处理方法及数字金融服务平台
CN114298176A (zh) 一种欺诈用户检测方法、装置、介质及电子设备
CN111783126B (zh) 一种隐私数据识别方法、装置、设备和可读介质
CN111401483B (zh) 样本数据处理方法、装置及多方模型训练系统
CN110363534B (zh) 用于识别异常交易的方法及装置
CN112435137A (zh) 一种基于社团挖掘的欺诈信息检测方法及系统
CN117271713A (zh) 关联对象识别方法、装置、电子设备及存储介质
US20240154975A1 (en) Systems and methods for accelerating a disposition of digital dispute events in a machine learning-based digital threat mitigation platform
CN116881687B (zh) 一种基于特征提取的电网敏感数据识别方法及装置
CN116151965B (zh) 一种风险特征提取方法、装置、电子设备及存储介质
CN114723554B (zh) 异常账户识别方法及装置
CN116805039A (zh) 特征筛选方法、装置、计算机设备和数据扰动方法
CN116805245A (zh) 基于图神经网络与解耦表示学习的欺诈检测方法及系统
KR102409019B1 (ko) 금융 거래 위험 평가 시스템과 방법 및 이를 위한 컴퓨터 프로그램
CN115482084A (zh) 用于生成风控规则集的方法及装置
CN118509845B (zh) 一种基于5g网络的数据加密传输方法及系统
CN113919447B (zh) 基于DNA分子加密和LightGBM算法的数字资产交易管理方法及系统
CN113723522B (zh) 异常用户的识别方法、装置、电子设备以及存储介质
Singh et al. Heterogeneous Graph Auto-Encoder for CreditCard Fraud Detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201010

Address after: English genus

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: English genus

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201010

Address after: English genus

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant