CN110033276A - 一种针对转账的安全策略生成方法、装置及设备 - Google Patents

一种针对转账的安全策略生成方法、装置及设备 Download PDF

Info

Publication number
CN110033276A
CN110033276A CN201910176973.3A CN201910176973A CN110033276A CN 110033276 A CN110033276 A CN 110033276A CN 201910176973 A CN201910176973 A CN 201910176973A CN 110033276 A CN110033276 A CN 110033276A
Authority
CN
China
Prior art keywords
sample
transferred
security strategy
sub
transferring accounts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910176973.3A
Other languages
English (en)
Inventor
徐若凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910176973.3A priority Critical patent/CN110033276A/zh
Publication of CN110033276A publication Critical patent/CN110033276A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/10Payment architectures specially adapted for electronic funds transfer [EFT] systems; specially adapted for home banking systems
    • G06Q20/108Remote banking, e.g. home banking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了一种针对转账的安全策略生成方法、装置及设备。通过对全场景进行子类细分,刻画出具有一定规律性的子场景,进而分别在子场景下进行进行模型训练,从而可以得到针对该子场景的安全策略,避免了模型对训练样本过拟合的现象;在对线上的转账事件进行评估时,首先确定出该转账事件所符合的子场景,从而可以有针对性的使用该子场景所对应的安全策略对该转账事件进行评估。

Description

一种针对转账的安全策略生成方法、装置及设备
技术领域
本说明书实施例涉及信息技术领域,尤其涉及一种针对转账的安全策略生成方法、装置及设备。
背景技术
近年来,欺诈案件呈现出“跨平台、套路化”等特点,针对欺诈的安全策略推荐是风控中不可或缺的一部分。
一般安全策略生成时,采用的是欺诈场景下的一段时间窗内的全量案件(黑样本)+随机抽样的非案件(白样本)作为训练样本,用于防控未来新的案件事件。而由于欺诈领域的案件在不同时段具有不同的特点,且全量案件并没有明显的批量性和集中性。如果照搬上述常规方式,会导致推荐的策略严重过拟合,针对样本的分类效果还可以,但线上实际运行表现难以覆盖新的案件或打扰率远高于预期。
基于此,需要一种更准确的针对转账的安全策略生成方法。
发明内容
针对现有安全策略生成中容易过拟合的问题,为得到更准确的安全策略方案,本说明书实施例提供针对转账的安全策略生成方法、装置及设备,具体包括:
根据本申请的第一方面,提供一种针对转账的安全策略生成方法,包括:
获取针对用户间转账事件的黑样本的集合和白样本的集合,其中,任一样本中包含转入方和转出方,所述样本包括多个样本特征;
统计黑样本的转入方和转出方的转账属性,其中,所述转账属性包括转入方的收款次数,转入方和转出方的用户标识属性,转入方的收款金额,或者,转入方的注册时间与转账时间的时间间隔;所述用户标识属性包括高频收款方或者高频汇款方;
筛选出转入方和转出方的转账属性符合预设的子场景筛选条件的黑样本,生成黑样本子集;
生成包含所述黑样本子集和所述白样本集合的训练样本的集合;
根据训练样本的样本特征的取值,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,其中,所述安全策略为样本特征的取值的组合。
根据本申请的第二方面,提供一种基于如前述安全策略的使用方法,包括:
获取转账事件,其中,所述转账事件中包含转入方和转出方;
确定转入方和转出方的转账属性;
确定所述转入方和转出方的转账属性所符合的子场景筛选条件;
采用所述子场景筛选条件所对应的安全策略对所述转账事件进行安全评估。
与第一方面对应的,本说明书实施例还提供一种针对转账的安全策略生成装置,包括:
获取模块,获取针对用户间转账事件的黑样本的集合和白样本的集合,其中,任一样本中包含转入方和转出方,所述样本包括多个样本特征;
统计模块,统计黑样本的转入方和转出方的转账属性,其中,所述转账属性包括转入方的收款次数,转入方和转出方的用户标识属性,转入方的收款金额,或者,转入方的注册时间与转账时间的时间间隔;所述用户标识属性包括高频收款方或者高频汇款方;
筛选模块,筛选出转入方和转出方的转账属性符合预设的子场景筛选条件的黑样本,生成黑样本子集;
生成模块,生成包含所述黑样本子集和所述白样本集合的训练样本的集合;
确定模块,根据训练样本的样本特征的取值,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,其中,所述安全策略为样本特征的取值的组合。
与第二方面对应的,本说明书实施例还提供一种基于如前述安全策略的使用装置,包括:
转账事件获取模块,获取转账事件,其中,所述转账事件中包含转入方和转出方;
转账属性确定模块,确定转入方和转出方的转账属性;
子场景确定模块,确定所述转入方和转出方的转账属性所符合的子场景筛选条件;
安全评估模块,采用所述子场景筛选条件所对应的安全策略对所述转账事件进行安全评估。
本申请所提供的技术方案,通过对全场景进行子类细分,刻画出具有一定规律性的子场景,进而分别在各子场景下进行进行模型训练,从而可以得到针对于该子场景的安全策略,避免了模型对训练样本过拟合的现象;在对线上的转账事件进行评估时,首先确定出该转账事件所符合的子场景,从而可以有针对性的使用该子场景所对应的安全策略对该转账事件进行评估,评估结果更为准确。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本说明书实施例所涉及的系统架构的示意图;
图2为本说明书实施例提供的一种针对转账的安全策略生成方法的流程示意图;
图3为本说明书实施例提供的一种针对转账的安全策略使用方法的流程示意图;
图4为本说明书实施例提供的一种针对转账的安全策略生成装置的结构示意图;
图5为本说明书实施例提供的一种针对转账的安全策略使用装置的结构示意图;
图6是用于配置本说明书实施例方法的一种设备的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
在当前的欺诈领域进行策略推荐的过程中,常用的方法是采用一段时间窗内的全量案件(黑样本)+随机抽样的非案件(白样本)作为训练样本集合,对训练样本集合进行分类,得到一个较好的分类策略,并上线运行,用于防控未来新的案件事件。
这种方式下最常见的问题是推荐的安全策略严重过拟合,离线评估效果没有问题,但线上实际试运行表现难以覆盖新的案件或打扰率远高于预期。其原因在于,欺诈案件在不同时段具有不同的特点,全量案件并没有明显的批量性和集中性,基于此,本说明书实施例提供一种安全策略生成方案,对于全量案件进行特定属性的划分,选出具有一定代表性的事件构成子场景后,再针对子场景下的训练样本进行策略推荐,避免过拟合的现象。如图1所示,图1为本说明书实施例所涉及的系统架构的示意图。在该示意图中,示例性的给出了两个子场景,在实际应用中,对于子场景的个数并不需要进行限定,每一个子场景下都可以得到至少一个对应于该子场景的安全策略。
以下结合附图,详细说明本说明书各实施例提供的技术方案。如图2所示,图2是本说明书实施例提供的一种针对转账的安全策略生成方法的流程示意图,该流程具体包括如下步骤:
S201,获取针对用户间转账事件的黑样本的集合和白样本的集合,其中,任一样本中包含转入方和转出方,所述样本包括多个样本特征;
转账事件的黑样本的集合可以是一段时间窗内(例如1个月内)的全量案件(即已经被确定为欺诈的转账事件)。白样本则实时随机进行抽取即可,黑白样本的比例可以根据实际需要进行选择,此处不做限定。
在一个转账事件所对应的样本中,总是包含有资金的转入方和转出方,以及转账时间、转账金额等等。进一步地,样本中还可以包括诸如转账地点、收款地点、转入方和转出方的信用程度、被举报次数等等与欺诈领域相关的样本特征,每一个样本特征有一个具体的取值。
S203,统计黑样本的转入方和转出方的转账属性,其中,所述转账属性包括转入方的收款次数,转入方和转出方的用户标识属性,转入方的收款金额,或者,转入方的注册时间与转账时间的时间间隔;所述用户标识属性包括高频收款方或者高频汇款方。
针对黑样本中的转入方和转出方,可以从其相关的注册信息以及历史数据中对其分别进行统计,统计的时段可以是前述的时间窗内。即所述的收款次数可以是在该时间窗内的收款次数总计,收款金额也可以是在该时间窗内的收款金额统计。此外,也可以采用诸如日均收款次数或者日均收款金额等方式进行统计,进而,可以确定一名用户是高频收款方或者高频汇款方,例如,日均收款次数在20个以上即为高频收款方。黑样本中的用户的转账属性可以用于进一步的对所有的黑样本进行分类。
此外,需要说明的是,用户标识属性的作用是:在欺诈领域这个环境中,标识用户是受益方还是被害方。因此,用户标识属性也可以是其它自定义的与安全风险相关的类型。例如,基于已经确定的其它领域的黑样本情形标识用户是“庄家”或者“散户”,或者是“黑客”与“常规人员”等等。在模型训练中可以通过对用户标识属性进行特征二值化来实现即可。
S205,筛选出转入方和转出方的转账属性符合预设的子场景筛选条件的黑样本,生成黑样本子集。
子场景筛选条件一般而言是根据实际经验预先给定,与欺诈领域密切相关,子场景筛选条件可以是多个,一个子场景筛选条件通常是包含多个转账属性的符复合条件。具体而言,复合条件中应该至少包括转入方(即欺诈场景下的受益方),也可以同时包括转出方和转入方。
基于不同的子场景筛选条件,即可以筛选得到多个不同的子场景下的黑样本子集。例如,一种子场景筛选条件可以是(转入方地点=北京)&(转入方=高频收款方);同时,还存在另一个子场景筛选条件(转入方地点=杭州)&(转入方日均收款金额>5万元)等等。显然,子场景筛选条件和黑样本子集存在一一对应的关系。
为了避免一个黑样本被同时划入不同的黑样本子集,一种可选的方式为不同的子场景筛选条件是互斥的,以使得不同的子场景多对应的黑样本子集没有交集,从而可以保证各子场景的训练互不干扰,并且避免生成的安全策略在线上评估时发生冲突。在本说明书实施例中,筛选得到的黑样本子集无需覆盖全量的黑样本集合。
S207,生成包含所述黑样本子集和所述白样本集合的训练样本的集合;
如前所述,对于一个子场景而言,其对应于一个黑样本子集。因此,此时混合之前得到的白样本集合即可组成一个对应于该子场景的训练样本的集合。
在一种具体的实施方式中,生成训练样本的集合时,还同样可以采取同样的子场景筛选条件对于白样本的集合进行筛选,得到符合子场景筛选条件的白样本子集,从而可以保证训练样本的集合中黑白样本的选择口径一致,更具有针对性,训练得到的安全策略在该子场景下的分类效果更准确。
S209,根据训练样本的样本特征的取值,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,其中,所述安全策略为样本特征的取值的组合。
决策树的根节点对应所述训练样本的集合。由于每个训练样本包含多个样本特征,在不同的样本中,样本特征的取值常常不同,即每个样本特征可能会有多个取值。因此,可以基于某个样本特征的取值对所有的训练样本进行分类,最终将所有的训练样本都分类完毕,得到一颗决策树。表现在决策树上即为,从根节点开始进行了分裂,得到多个子节点,子节点也可以继续分裂,直至满足某种分裂截止条件,得到叶子节点。每个子节点均对应于一个训练样本子集。
在构建决策树的过程中,可以基于所有样本特征的取值进行分类,直至用尽所有的样本特征。但也可以采用一些方式,提前终止对于子节点的分裂,直接生成叶子节点,以提高构建速度和提高决策树的泛化能力。
例如,若一个节点中样本样本的标签相同,确定该节点为叶子节点。即在一个子节点中的训练样本都是黑样本或者都是白样本的情形下,无需对该节点进行进一步的划分。
例如,若一个节点中黑样本占比超过阈值,确定该节点为黑叶子节点。即在一个节点中已经显著的体现了,包含该节点的路径可能对于黑样本有较好的分类性时,确定该节点为叶子节点。
构建出来的决策树是一个对于训练样本集合有着最佳分类效果的决策树。换言之,决策树中的每个叶子节点此时已经可以被明确的被确认为是白叶子节点还是黑叶子节点。此时,即可以从黑叶子节点开始回溯分类路径直至根节点,得到对于该子场景下的安全策略。
例如,假设得到的决策树有两个黑叶子节点。那么可以从这两个黑叶子节点开始进行路径回溯,得到对于黑样本有着较好分类效果的两个安全策略。显然,决策树中的路径表征一种样本特征的取值的组合,因此,得到的安全策略同样也是样本特征的取值的组合。
可以看到,在上述方案中,一个子场景是可能得到多个对应的安全策略的。在实际应用中,一般而言可以同时采纳上述得到的多个安全策略,也可以进一步对多个安全策略进行再一次的线上评估,选择出较优的一个或几个安全策略进行使用。
本申请所提供的技术方案,通过对全场景进行子类细分,刻画出具有一定规律性的子场景,进而分别在子场景下进行进行模型训练,从而可以得到针对与该子场景的安全策略,避免了模型对训练样本过拟合的现象。
在一种具体的实施方式中,从黑样本中进行子场景筛选时,选取在转账到账户场景下,有一定重复性的资金转入方,即显示出与全量样本不一样的特点的转账事件。因此所述预设的子场景筛选条件,可以包括:转入方的收款次数超过次数阈值,和,转入方的用户标识属性为高频收款方,和,转出方的用户标识属性不是高频汇款方;或者,转入方的注册时间与转账时间的时间间隔不超过时间阈值(例如,注册时间不超过90天),和,转入方的收款金额超过金额阈值。以及,还可以有其它一些条件,例如,子场景筛选条件中还可以包括诸如被动方连续多天(例如,10天)日均转入资金均在5万以上等等。以及,在实际应用中,随着欺诈手段的改变,还可以根据实际情形对于子场景筛选条件进行配置,更符合实际需要。
在一种具体的实施方式中,使用决策树对训练样本的集合进行分类时,可以以训练样本的样本特征的取值为边进行分裂,且,在每个非叶子节点上分裂时信息增益参数最大,所述信息增益参数包括信息增益量或者信息增益比,用于表示在决策树以样本特征的取值进行分裂时的信息增加程度。
具体而言,即为首先确定待分裂的节点的信息量,对于其中的任一样本特征,根据该样本特征的取值进行分裂,根据子节点计算此时分裂后的信息量(即第二信息量),然后确定出一个信息增益参数。进而遍历该节点中所包含的样本特征,从所有的信息增益参数中选出一个最大值,即该样本特征对于待分裂的节点有最好的分类效果,可以作为分裂样本特征。并对于分裂以后得到的子节点,从样本特征中去掉该分裂样本特征。即对于子节点再次进行分裂时不再考虑已经使用过的分裂样本特征。
对于信息增益参数的计算方法,可以采用多种形式。例如,对于训练样本集合D,其信息量的定义如下:其中,其中pi表示第i个样本特征在该训练样本集合中出现的概率,可以用包含该样本特征的训练样本数量除以该集合中训练样本的总数量作为估计。如果将训练样本集合D按属性A进行划分,则依据A对D进行划分后的信息为:Dj即为根据样本特征A的j个取值所得到的j个训练样本子集。信息增益参数即为两者的差值:gain(A)=info(D)-infoA(D)。决策树在每次需要分裂时,计算每个样本特征的的信息增益,然后选择信息增益最大的样本特征进行分裂。
又例如,还可以使用信息增益比作为信息增益参数进行分类。采用另一个方式定义信息量,对于信息量的定义如下:那么对于信息增益比率定义即首先根据分裂前的信息量和分裂后的信息量确定样本特征的信息增益量,然后将信息增益量和分裂信息量的比值确定为信息增益比。以及,对于分裂后的信息量还可以加入一些平滑,例如,对信息增益比率的分母中,加入一个表示子节点的信息量平均值的平滑项Ave(split_info(A)),使得分母成为split_info(A)+Ave(split_info(A))。
基于训练样本的特征取值,采用信息增益参数的方式对训练样本进行分类,可以得到一颗在训练样本上分类效果最佳的决策树。决策树中的路径表征一种样本特征值的组合,对应于一个最佳分类策略,此时,只需如前述一样,从黑叶子节点开始进行路径回溯,基于任一路径表征一种样本特征的取值的组合,即可以得到一条针对所述子场景的安全策略。
此时训练得到的安全策略已经对于训练样本的集合有着较好的分类效果。但是直接将其上线进行在线评估,则需要进行上线部署,如果不成功还需要撤销部署,这需要占用业务运营方的很多资源。此外,在线评估时由于实时的转账事件往往是没有标签的,此时,对于安全策略的准确性往往还需要一段时间才能知道。
基于此,本说明书实施例还提供一种对安全策略进行离线评估的方案。即,基于每天实时发生的转账事件以及报案事件,对每个样本特征的取值生成一张对应的分值对应表,分值对应表用于确定每一个特征的取值应该被确定为多少评分,例如,对于样本特征日均转账金额,可以划分一个取值区间,每一个训练样本可以根据日均转账金额所落入的区间确定该样本特征的评分。如表1所示。
表1
这样,可以将每个训练样本根据其取值转换为一个对应的分值向量。而同样的,由于安全策略也是一系列样本特征的分值的组合,因此,安全策略也可以转换为相应的一个分值向量。
由于分值对应表是根据每天的事件进行浮动变化的,因此,可以认为此时的训练样本所对应的分值向量已经相当于当前的实时转账事件。采用安全策略所对应的分值向量对训练样本的集合所对应的分值向量进行分类时,已经相当于在线进行转账事件的分类,并且由于训练样本都是有标签的。那么,此时就可以快速的知道在该子场景下的安全策略是不是能到达到预期。
当一个子场景下的安全策略达到预期时,则可以将其部署上线至服务端中。服务端此时可以采用该安全策略对转账事件进行风险评估。在实际应用中,一种具体的实施方式是在服务单中已经部署了多条安全策略,每一天安全策略对应于不同的子场景。那么此时,服务端在进行风险评估时,首先应当对接收到的转账事件进行分类,判断出该转账事件是符合哪个子场景的,并采用该子场景下的安全策略来进行评估。
参见图3所示,图3是本说明书实施例提供的基于上述安全策略的使用方法的流程示意图,包括如下步骤:
S301,获取转账事件,其中,所述转账事件中包含转入方和转出方;
S303,确定转入方和转出方的转账属性;
S305,确定所述转入方和转出方的转账属性所符合的子场景筛选条件;
S307,采用所述子场景筛选条件所对应的安全策略对所述转账事件进行安全评估。
容易理解,在上述安全策略的使用方法中,转账属性的确认方式以及子场景筛选条件,与安全策略的生成方法中的转账属性的确认方式和子场景筛选条件应当相同。在对线上的转账事件进行评估时,首先确定出该转账事件所符合的子场景,从而可以有针对性的使用该子场景所对应的安全策略对该转账事件进行评估,评估结果更为准确。
当然,在上述方式中,也有可能存在一些转账事件不属于任何一个子场景,则此时可以认为该转账事件为安全事件,或者,不给与风险评估。
与第一方面对应的,本说明书实施例还提供一种针对转账的安全策略生成装置,如图4所示,图4是本说明书实施例提供的一种针对转账的安全策略生成装置的结构示意图,包括:
S401,获取模块,获取针对用户间转账事件的黑样本的集合和白样本的集合,其中,任一样本中包含转入方和转出方,所述样本包括多个样本特征;
S403,统计模块,统计黑样本的转入方和转出方的转账属性,其中,所述转账属性包括转入方的收款次数,转入方和转出方的用户标识属性,转入方的收款金额,或者,转入方的注册时间与转账时间的时间间隔;所述用户标识属性包括高频收款方或者高频汇款方;
S405,筛选模块,筛选出转入方和转出方的转账属性符合预设的子场景筛选条件的黑样本,生成黑样本子集;
S407,生成模块,生成包含所述黑样本子集和所述白样本集合的训练样本的集合;
S409,确定模块,根据训练样本的样本特征的取值,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,其中,所述安全策略为样本特征的取值的组合。
进一步地,在所述的装置中,所述预设的子场景筛选条件,包括:转入方的收款次数超过次数阈值,和,转入方的用户标识属性为高频收款方,和,转出方的用户标识属性不是高频汇款方;或者,转入方的注册时间与转账时间的时间间隔不超过时间阈值,和,转入方的收款金额超过金额阈值。
进一步地,所述确定模块409,在所述决策树中,每个节点表示一个训练样本子集,决策树中根节点对应所述训练样本的集合,以训练样本的样本特征的取值为边进行分裂,且,在每个非叶子节点上分裂时信息增益参数最大,所述信息增益参数包括信息增益量或者信息增益比,用于表示在决策树以样本特征的取值进行分裂时的信息增加程度;确定出所述决策树中表征黑样本的黑叶子节点,确定各黑叶子节点至根节点的路径,其中,任一路径表征一种样本特征的取值的组合;将所述路径所对应的样本特征的取值的组合确定为针对所述子场景的安全策略。
进一步地,所述装置还包括评估模块411,根据预设的样本特征的取值的分值对应表,确定出每个训练样本的样本特征的分值,和,确定出所述安全策略所对应的样本特征的分值的组合;根据每个训练样本的样本特征的分值和样本特征的分值的组合对训练样本进行分类,以便评估所述安全策略。
与第二方面对应的,本说明书实施例还提供一种基于前述安全策略的使用装置,如图5所示,图5为本说明书实施例所提供的一种针对转账的安全策略使用装置的结构示意图,包括:
转账事件获取模块501,获取转账事件,其中,所述转账事件中包含转入方和转出方;
转账属性确定模块503,确定转入方和转出方的转账属性;
子场景确定模块505,确定所述转入方和转出方的转账属性所符合的子场景筛选条件;
安全评估模块507,采用所述子场景筛选条件所对应的安全策略对所述转账事件进行安全评估。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现图2所示的针对转账的安全策略生成方法。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现图3所示的针对转账的安全策略使用方法。
图6示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图2所示的针对转账的安全策略生成方法。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图3所示的针对转账的安全策略使用方法。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的系统、方法、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于方法实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的方法实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。

Claims (11)

1.一种针对转账的安全策略生成方法,包括:
获取针对用户间转账事件的黑样本的集合和白样本的集合,其中,任一样本中包含转入方和转出方,所述样本包括多个样本特征;
统计黑样本的转入方和转出方的转账属性,其中,所述转账属性包括转入方的收款次数,转入方和转出方的用户标识属性,转入方的收款金额,或者,转入方的注册时间与转账时间的时间间隔;所述用户标识属性包括高频收款方或者高频汇款方;
筛选出转入方和转出方的转账属性符合预设的子场景筛选条件的黑样本,生成黑样本子集;
生成包含所述黑样本子集和所述白样本集合的训练样本的集合;
根据训练样本的样本特征的取值,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,其中,所述安全策略为样本特征的取值的组合。
2.如权利要求1所述的方法,所述预设的子场景筛选条件,包括:
转入方的收款次数超过次数阈值,和,转入方的用户标识属性为高频收款方,和,转出方的用户标识属性不是高频汇款方;或者,
转入方的注册时间与转账时间的时间间隔不超过时间阈值,和,转入方的收款金额超过金额阈值。
3.如权利要求1所述的方法,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,包括:
在所述决策树中,每个节点表示一个训练样本子集,决策树中根节点对应所述训练样本的集合,以训练样本的样本特征的取值为边进行分裂,且,在每个非叶子节点上分裂时信息增益参数最大,所述信息增益参数包括信息增益量或者信息增益比,用于表示在决策树以样本特征的取值进行分裂时的信息增加程度;
确定出所述决策树中表征黑样本的黑叶子节点,确定各黑叶子节点至根节点的路径,其中,任一路径表征一种样本特征的取值的组合;
将所述路径所对应的样本特征的取值的组合确定为针对所述子场景的安全策略。
4.如权利要求1所述的方法,还包括:
根据预设的样本特征的取值的分值对应表,确定出每个训练样本的样本特征的分值,和,确定出所述安全策略所对应的样本特征的分值的组合;
根据每个训练样本的样本特征的分值和样本特征的分值的组合对训练样本进行分类,以便评估所述安全策略。
5.一种基于如权利要求1至4任一所述安全策略的使用方法,包括:
获取转账事件,其中,所述转账事件中包含转入方和转出方;
确定转入方和转出方的转账属性;
确定所述转入方和转出方的转账属性所符合的子场景筛选条件;
采用所述子场景筛选条件所对应的安全策略对所述转账事件进行安全评估。
6.一种针对转账的安全策略生成装置,包括:
获取模块,获取针对用户间转账事件的黑样本的集合和白样本的集合,其中,任一样本中包含转入方和转出方,所述样本包括多个样本特征;
统计模块,统计黑样本的转入方和转出方的转账属性,其中,所述转账属性包括转入方的收款次数,转入方和转出方的用户标识属性,转入方的收款金额,或者,转入方的注册时间与转账时间的时间间隔;所述用户标识属性包括高频收款方或者高频汇款方;
筛选模块,筛选出转入方和转出方的转账属性符合预设的子场景筛选条件的黑样本,生成黑样本子集;
生成模块,生成包含所述黑样本子集和所述白样本集合的训练样本的集合;
确定模块,根据训练样本的样本特征的取值,构建决策树对所述训练样本的集合进行分类,从决策树的路径中确定出对应于所述子场景的安全策略,其中,所述安全策略为样本特征的取值的组合。
7.如权利要求6所述的装置,所述预设的子场景筛选条件,包括:
转入方的收款次数超过次数阈值,和,转入方的用户标识属性为高频收款方,和,转出方的用户标识属性不是高频汇款方;或者,
转入方的注册时间与转账时间的时间间隔不超过时间阈值,和,转入方的收款金额超过金额阈值。
8.如权利要求6所述的装置,所述确定模块,在所述决策树中,每个节点表示一个训练样本子集,决策树中根节点对应所述训练样本的集合,以训练样本的样本特征的取值为边进行分裂,且,在每个非叶子节点上分裂时信息增益参数最大,所述信息增益参数包括信息增益量或者信息增益比,用于表示在决策树以样本特征的取值进行分裂时的信息增加程度;确定出所述决策树中表征黑样本的黑叶子节点,确定各黑叶子节点至根节点的路径,其中,任一路径表征一种样本特征的取值的组合;将所述路径所对应的样本特征的取值的组合确定为针对所述子场景的安全策略。
9.如权利要求6所述的装置,还包括评估模块,根据预设的样本特征的取值的分值对应表,确定出每个训练样本的样本特征的分值,和,确定出所述安全策略所对应的样本特征的分值的组合;根据每个训练样本的样本特征的分值和样本特征的分值的组合对训练样本进行分类,以便评估所述安全策略。
10.一种基于如权利要求6至9任一所述安全策略的使用装置,包括:
转账事件获取模块,获取转账事件,其中,所述转账事件中包含转入方和转出方;
转账属性确定模块,确定转入方和转出方的转账属性;
子场景确定模块,确定所述转入方和转出方的转账属性所符合的子场景筛选条件;
安全评估模块,采用所述子场景筛选条件所对应的安全策略对所述转账事件进行安全评估。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至5任一项所述的方法。
CN201910176973.3A 2019-03-08 2019-03-08 一种针对转账的安全策略生成方法、装置及设备 Pending CN110033276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910176973.3A CN110033276A (zh) 2019-03-08 2019-03-08 一种针对转账的安全策略生成方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910176973.3A CN110033276A (zh) 2019-03-08 2019-03-08 一种针对转账的安全策略生成方法、装置及设备

Publications (1)

Publication Number Publication Date
CN110033276A true CN110033276A (zh) 2019-07-19

Family

ID=67235867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910176973.3A Pending CN110033276A (zh) 2019-03-08 2019-03-08 一种针对转账的安全策略生成方法、装置及设备

Country Status (1)

Country Link
CN (1) CN110033276A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179085A (zh) * 2019-12-31 2020-05-19 中国银行股份有限公司 一种账户数据处理方法、装置及系统
CN111598186A (zh) * 2020-06-05 2020-08-28 腾讯科技(深圳)有限公司 基于纵向联邦学习的决策模型训练方法、预测方法及装置
CN113888153A (zh) * 2021-11-10 2022-01-04 建信金融科技有限责任公司 一种转账异常预测方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718490A (zh) * 2014-12-04 2016-06-29 阿里巴巴集团控股有限公司 一种用于更新分类模型的方法及装置
CN107203774A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 对数据的归属类别进行预测的方法及装置
CN107679686A (zh) * 2017-08-28 2018-02-09 阿里巴巴集团控股有限公司 一种业务执行方法及装置
CN109359793A (zh) * 2018-08-03 2019-02-19 阿里巴巴集团控股有限公司 一种针对新场景的预测模型训练方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718490A (zh) * 2014-12-04 2016-06-29 阿里巴巴集团控股有限公司 一种用于更新分类模型的方法及装置
CN107203774A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 对数据的归属类别进行预测的方法及装置
CN107679686A (zh) * 2017-08-28 2018-02-09 阿里巴巴集团控股有限公司 一种业务执行方法及装置
CN109359793A (zh) * 2018-08-03 2019-02-19 阿里巴巴集团控股有限公司 一种针对新场景的预测模型训练方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179085A (zh) * 2019-12-31 2020-05-19 中国银行股份有限公司 一种账户数据处理方法、装置及系统
CN111179085B (zh) * 2019-12-31 2023-06-20 中国银行股份有限公司 一种账户数据处理方法、装置及系统
CN111598186A (zh) * 2020-06-05 2020-08-28 腾讯科技(深圳)有限公司 基于纵向联邦学习的决策模型训练方法、预测方法及装置
CN113888153A (zh) * 2021-11-10 2022-01-04 建信金融科技有限责任公司 一种转账异常预测方法、装置、设备及可读存储介质
CN113888153B (zh) * 2021-11-10 2022-11-29 建信金融科技有限责任公司 一种转账异常预测方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
TWI698770B (zh) 資源轉移監測方法、裝置、監測設備及儲存媒體
CN110147823B (zh) 一种风控模型训练方法、装置及设备
CN109213857A (zh) 一种欺诈行为识别方法和装置
EP3678072A1 (en) Model integration method and device
CN110033276A (zh) 一种针对转账的安全策略生成方法、装置及设备
CN110311902A (zh) 一种异常行为的识别方法、装置及电子设备
CN110177108A (zh) 一种异常行为检测方法、装置及验证系统
CN109063966A (zh) 风险账户的识别方法和装置
CN107784312A (zh) 机器学习模型训练方法及装置
WO2016168037A1 (en) Nexus determination in a computing device
CN108647997A (zh) 一种检测异常数据的方法及装置
CN110362999A (zh) 用于检测账户使用异常的方法及装置
CN110458686A (zh) 用于确定借贷风险的方法及装置
CN106033510A (zh) 一种用户设备识别方法及系统
CN109325232A (zh) 一种基于lda的用户行为异常分析方法、系统及存储介质
CN110046994A (zh) 一种受理区块链存证交易的方法及系统
CN110349013A (zh) 风险控制方法及装置
CN109598414A (zh) 风险评估模型训练、风险评估方法、装置及电子设备
CN109636081A (zh) 一种用户安全意识检测方法和装置
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
CN110046179A (zh) 一种报警维度的挖掘方法、装置及设备
CN110516713A (zh) 一种目标群体识别方法、装置及设备
US20170186009A1 (en) Systems and methods to identify illegitimate online accounts
CN109885485A (zh) 交易冲突检测方法和装置
CN109191140B (zh) 一种评分卡模型整合方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201019

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201019

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190719

RJ01 Rejection of invention patent application after publication