CN110633989B - 一种风险行为生成模型的确定方法及装置 - Google Patents

一种风险行为生成模型的确定方法及装置 Download PDF

Info

Publication number
CN110633989B
CN110633989B CN201910758439.3A CN201910758439A CN110633989B CN 110633989 B CN110633989 B CN 110633989B CN 201910758439 A CN201910758439 A CN 201910758439A CN 110633989 B CN110633989 B CN 110633989B
Authority
CN
China
Prior art keywords
data
risk
generator
real
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910758439.3A
Other languages
English (en)
Other versions
CN110633989A (zh
Inventor
管楚
潘健民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910758439.3A priority Critical patent/CN110633989B/zh
Publication of CN110633989A publication Critical patent/CN110633989A/zh
Application granted granted Critical
Publication of CN110633989B publication Critical patent/CN110633989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书一个或多个实施例提供了一种风险行为生成模型的确定方法及装置,其中,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。

Description

一种风险行为生成模型的确定方法及装置
技术领域
本文件涉及计算机技术领域,尤其涉及一种风险行为生成模型的确定方法及装置。
背景技术
目前,随着互联网技术的快速发展,线上交易的应用场景越来越多,其中,线上交易给用户带来便利性的同时,还存在一定资产安全性问题,例如,犯罪分子采用一定的犯罪手段来骗取用户的资金,给正常用户的资产安全带来了极大威胁,对应的,需要通过预先设置包含应对犯罪手段的风险防控策略的风控系统,来实现对线上用户行为数据进行风险识别,进而对线上风险行为进行风险管控,以提高用户的资产安全性。
当前,相关技术中风控系统中用于识别风险行为的风控策略的更新补充过程,主要是相关的风控专家通过对黑产的犯罪手法进行调查,再根据自身经验手段完善风控策略;其中,由于对黑产犯罪手段的调查需要一段时间,导致风控策略具有一定滞后性,同时,犯罪用户不断变化犯罪手段,黑产的犯罪手法的预测受限于风控专家的专业能力,无法及时、准确地预测出黑产未来可能采用的犯罪手法,进而无法及时给出匹配的风控策略对变化后的犯罪手段进行快速、精准应对。
由此可知,需要提供一种时效性好、准确度高的风险行为预测的技术方案。
发明内容
本说明书一个或多个实施例的目的是提供一种风险行为生成模型的确定方法及装置,利用确定出的风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供了一种风险行为生成模型的确定方法,包括:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
本说明书一个或多个实施例提供了一种风险行为生成模型的确定装置,包括:
信息维度划分模块,用于按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理;
真实样本生成模块,用于根据维度划分后的所述真实行为数据生成真实样本数据;
仿真样本生成模块,用于利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
识别结果确定模块,用于利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
对抗结果确定模块,用于根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
对抗网络优化模块,用于若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络;
生成模型确定模块,用于若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型。
本说明书一个或多个实施例提供了一种风险行为生成模型的确定设备,包括:
处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下方法:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
本说明书一个或多个实施例中的风险行为生成模型的确定方法及装置,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。本说明书一个或多个实施例实现了利用确定出的风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的风险行为生成模型的确定方法的第一种流程示意图;
图2为本说明书一个或多个实施例提供的风险行为生成模型的确定方法的第二种流程示意图;
图3为本说明书一个或多个实施例提供的风险行为生成模型的确定方法的第三种流程示意图;
图4为本说明书一个或多个实施例提供的风险行为生成模型的确定方法的第四种流程示意图;
图5为本说明书一个或多个实施例提供的风险行为生成模型的确定方法的第五种流程示意图;
图6为本说明书一个或多个实施例提供的风险行为生成模型的确定装置的第一种模块组成示意图;
图7为本说明书一个或多个实施例提供的风险行为生成模型的确定装置的第二种模块组成示意图;
图8为本说明书一个或多个实施例提供的风险行为生成模型的确定设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一个或多个一部分实施例,而不是全部的实施例。基于本说明书一个或多个中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本本文件的保护范围。
本说明书一个或多个实施例提供了一种风险行为生成模型的确定方法及装置,通过目标对抗神经网络中的生成器与判别器之间不断对抗优化,使得生成器所生成的数据不断逼近犯罪用户未来可能使用的犯罪手段,促使生成器能够对犯罪用户未来可能采用的犯罪手段进行提前预知,得到预测未来风险行为准确度高的风险行为生成模型,进而利用该风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
图1为本说明书一个或多个实施例提供的风险行为生成模型的确定方法的第一种流程示意图,图1中的方法能够由后台服务器执行,该后台服务器可以是与用于风险防控的服务器为同一服务器,也可以是不同服务器,如图1所示,该方法至少包括以下步骤:
S102,按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,得到维度划分后的真实行为数据;
其中,为了确保生成器所生成的犯罪用户的仿真样本数据更加接近于真实风险行为数据,上述真实行为数据包括:在目标资金转移业务中正常用户的历史行为数据和犯罪用户的历史行为数据;例如,以目标资金转移业务包括:贷款业务场景或线上消费支付场景为例,针对贷款业务场景,上述真实行为数据包括:正常用户的贷款申请数据和骗贷用户的贷款申请数据,该骗贷用户可以是无法正常偿还贷款的用户;又如,针对线上消费支付场景,上述真实行为数据包括:正常用户的交易行为数据和欺诈用户的交易行为数据,该欺诈用户可以是骗收货款而不发货的用户、或者骗收商品而不支付货款的用户;
具体的,针对目标资金转移业务,获取与该目标资金转移业务相关的预设历史时间段内用户的真实行为数据,再对获取到的真实行为数据进行信息维度划分处理,得到划分后的真实行为数据;其中,在获取到真实行为数据后,先按照预设的多个信息维度对每一条真实行为数据进行信息维度划分处理,再输入至目标对抗神经网络,以便后续以区分信息维度的方式,对识别效果最差的信息维度进行单独优化,从而达到有针对性的提高最终的目标对抗神经网络的模型精度;
其中,上述预设的信息维度可以包括:个人属性信息、资金转移明细数据、用户关系信息、风险命中信息、资金转移统计数据中至少一项,在具体实施时,信息维度的划分可以根据实际需求进行设定;具体的,每一条真实行为数据可以包括多个信息维度的数据项,对真实行为数据中的每个数据项进行信息维度类型的标记,这样目标对抗神经网络在进行信息数据时能够进行信息维度区分;
S104,根据维度划分后的真实行为数据,生成真实样本数据,其中,该真实样本数据即为目标对抗神经网络的输入数据;
其中,可以直接将维度划分后的真实行为数据确定为输入目标对抗神经网络中的生成器的真实样本数据;考虑到目标对抗神经网络对数值型数据的处理准确度比较高,因此,也可以先将维度划分后的真实行为数据中的非数值型数据进行类型转换,得到数值型的真实样本数据;
S106,利用目标对抗神经网络中的生成器并基于得到的真实样本数据,生成多个仿真样本数据;
其中,上述目标对抗神经网络包括:用于生成仿真数据的生成器和用于对样本数据分类的判别器,该生成器可以是LSTM、RNN、LDA模型中任一种,该判别器可以是线性回归模型、SVM、神经网络中任一种,上述仿真样本数据为生成器从真实用户角度出发模拟得到的;具体的,将标记有不同维度信息的真实样本数据作为生成器的输入,该生成器的输出即为模拟得到的多个仿真样本数据,该仿真样本数据包括:模拟正常用户的仿真行为数据和模拟犯罪用户的仿真行为数据;
具体的,目标对抗神经网络中的生成器基于真实样本数据生成仿真样本数据的实现过程,可以采用如下公式表示:
X=g(z,θ(g))
其中,z表示输入至生成器的真实样本数据,θ(g)表示生成器g()的模型参数,X表示生成器所生成的仿真样本数据;
S108,利用目标对抗神经网络中的判别器对得到的仿真样本数据和真实样本数据进行风险识别,得到风险识别结果;
其中,不仅将生成器生成的仿真样本数据输入至判别器进行数据判别,还将真实样本数据输入至判别器进行数据判别,由于输入至判别器的真实样本数据和仿真样本数据均具有双重标签,即标记真实-仿真的标签信息和标记正常-犯罪的标签信息,因此,判别器针对每个待判别样本数据均要进行数据真假以及数据正常与否的识别,对应的,上述风险识别结果包括:数据的真假(真实数据、仿真数据)识别结果、数据的正常与否(正常用户、犯罪用户)识别结果;
在具体实施时,由于对抗目标是使得生成器所生成的数据更加接近真实的犯罪用户的风险行为数据;对应的,判别器可以是二分类模型,将识别出的真实的犯罪用户的样本数据标记为1,将其他样本数据标记为0;
S110,根据判别器输出的风险识别结果,确定生成器的样本生成水平和判别器的样本判别水平;
其中,每个真实样本数据和仿真样本数据均具有双重标签,即标记真实-仿真的标签信息和标记正常-犯罪的标签信息,因此,将判别器生成的风险识别结果与真实样本数据的标签信息和仿真样本数据的标签信息进行比对,即可得到用于表征判别器的识别正确程度的第一概率和用于表征生成器所生成的仿真样本数据被识别出的第二概率,进而能够确定样本生成水平和样本判别水平;
S112,判断确定出的样本生成水平和样本判别水平是否满足预设对抗终止条件;
其中,预设对抗终止条件可以是利用博弈论中的纳什均衡给出的,达到博弈的平衡点即为生成器与判别器均不再进化,进而终止二者之间的对抗;即对抗终止条件可以采用如下公式表示:
其中,G表示目标对抗神经网络中的生成器(generation model),D表示目标对抗神经网络中的判别器(discriminative model),V(G,D)表示生成器与判别器的对抗结果,对抗的最终目标是:最大化判别器的识别正常的概率,最小化生成器被识别出的概率;
具体的,针对每一轮对抗之后,判断生成器和判别器之间是否达到博弈的平衡点,进而通过生成器和判别器的多轮对抗,不断优化生成器的模型参数和判别器的模型参数,使得生成器能够生成更接近真实的风险行为数据的仿真数据,以及使得判别器尽可能准确地识别出数据的真假和是否存在犯罪行为,当对抗结果满足预设条件后,停止生成器与判别器之间的优化对抗;
若判断结果为是,则执行S114,将上述生成器确定为风险行为生成模型;
其中,当生成器与判别器之间达到博弈的平衡点时,生成器所生成的仿真样本数据在一定程度上可以达到以假乱真的目的,即生成器所生成的仿真样本数据比较接近真实的犯罪手段,即生成器所生成的数据与犯罪用户未来可能采用的犯罪手段比较接近,因此,可以将目标对抗神经网络中的生成器确定为风险行为生成模型,以便后续利用该风险行为生成模型预测犯罪用户未来可能使用的风险行为手段;
若判断结果为否,则执行S116,基于判别器输出的风险识别结果对目标对抗神经网络中的生成器和判别器进行参数优化,得到下一轮的目标对抗神经网络,以及继续执行上述步骤S106;
其中,若成器与判别器之间未达到博弈的平衡点,则继续进入下一轮对抗,基于对抗神经网络,通过生成器模拟犯罪用户的犯罪手段,以及通过判别器模拟防控系统的风险识别,多次进行生成器与判别器的对抗,以便不断对生成器的样本生成能力和判别器的样本判别能力进行优化提升;具体的,先根据本轮对抗的判别器的风险识别结果对生成器和判别器的参数进行优化,然后,继续执行上述步骤S106至S112,直到确定出样本生成水平和样本判别水平满足预设对抗终止条件,即生成器与判别器之间达到博弈的平衡点。
本说明书一个或多个实施例中,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。
本说明书一个或多个实施例实现了:通过目标对抗神经网络中的生成器与判别器之间不断对抗优化,使得生成器所生成的数据不断逼近犯罪用户未来可能使用的犯罪手段,促使生成器能够对犯罪用户未来可能采用的犯罪手段进行提前预知,得到预测未来风险行为准确度高的风险行为生成模型,这样利用该风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时基于预测出的风险行为对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,以实现自动及时对风控系统的漏洞加以补充,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
另外,本说明书一个或多个实施例中提供的风险行为生成模型的确定方法适用于任何风控的业务场景,上述风险行为生成模型的确定方法具有普适性,实现更加全面、广泛的风险防控。
其中,在确定生成器与判别器之间未达到博弈的平衡点时,需要结合判别器输出的风险识别结果对模型参数进行优化,针对基于每一轮的对抗结果对生成器和判别器进行参数优化的过程,具体的,上述S116,基于判别器输出的风险识别结果对目标对抗神经网络中的生成器和判别器进行参数优化,得到下一轮的目标对抗神经网络,具体包括:
采用梯度下降方法并基于判别器输出的风险识别结果,对目标对抗神经网络中的生成器和判别器进行参数优化,得到优化后的生成器和优化后的判别器;
具体的,以生成器的优化过程为例,由于可以将判别器输出的风险识别结果反馈给生成器,以便生成器获知哪些仿真样本数据被判别器所识别出来,进而采用梯度下降方法根据对应的损失函数,优化生成器的样本生成能力,得到优化后的生成器;对应的,损失函数可以采用如下公式表示:
loss=log(1-D(G(z)))
其中,G(z)表示生成器生成的仿真样本数据,D()表示判别器针对仿真样本数据的风险识别结果;
将优化后的生成器和上述优化后的判别器的组合,确定为下一轮的目标对抗神经网络,即结合判别器输出的风险识别结果对生成器和判别器进行优化后,进行进入下一轮生成器与判别器的对抗。
具体的,由于上述风险识别结果包括:数据的真假(真实数据、仿真数据)识别结果、数据的正常与否(正常用户、犯罪用户)识别结果,并且输入至判别器的真实样本数据和仿真样本数据均具有双重标签,即标记真实-仿真的标签信息和标记正常-犯罪的标签信息,因此,可知生成器生成的哪些仿真样本数据被判别器识别出来,以及判别器对哪些真实样本数据和哪些仿真样本数据未准确地识别出来,即判别器误判、漏判的样本数据,对应的,即可确定被判别器识别出来的仿真样本数据,以及确定判别器识别错误的真实样本数据和仿真样本数据,进而根据风险识别结果促使生成器和判别器不断进化,使得生成器所生成的数据更加接近真实的犯罪手段,同时,对抗神经网络的复杂度不是无限增加的,因此,当生成器和判别器进化到一定程度将会逐渐变缓慢,当满足一定条件时,可以停止生成器与判别器的对抗优化。
其中,考虑到真实行为数据的数据类型可能包括数值型数据,也可能包括非数值型数据,并且对抗神经网络对数值型数据能够准确地识别并处理,基于此,如图2所示,上述S104,根据维度划分后的真实行为数据,生成真实样本数据,具体包括:
S1041,针对每个信息维度,判断该信息维度对应的真实行为数据的数据类型是否为数值型;
其中,不同信息维度对应的数据类型可以是数值型,也可以是非数值型,针对非数值型数据需要进行类型转换处理,例如,针对文本类型、ip类型、交易类型的数据转换为数值型数据;
若否,则执行S1042,对上述信息维度对应的非数值型的真实行为数据进行类型转换,得到该信息维度对应的数值型行为数据;
具体的,针对文本类型的数据(如,交易附言、昵称等),可以采用Doc2Vec的方法转换为数值型数据;
若是,则执行S1043,将上述信息维度对应的真实行为数据确定为该信息维度对应的数值型行为数据;
S1044,将各信息维度对应的数值型行为数据的集合确定为最终的真实样本数据。
具体的,在信息维度划分后的真实行为数据输入对抗神经网络之前,先将维度划分后的真实行为数据中的非数值型数据进行类型转换,得到数值型的真实样本数据;再将类型转换后的真实样本数据输入至目标对抗神经网络中的生成器,以便生成器生成相应的多个仿真样本数据;
其中,信息维度划分后的真实行为数据包括的多个信息维度可以是:{个人属性信息、资金转移明细数据、用户关系信息、风险命中信息、资金转移统计数据};
其中,个人属性信息可以包括:用户IP、性别、账户数、加入的群组信息、是否历史被上报等;资金转移明细数据可以包括:最近N个月的充值金额、提现金额、交易对手数、夜间交易、红包交易等;用户关系信息可以包括:与被上报客户的资金关系或者非资金关系;风险命中信息可以包括:用户风险昵称、交易附言涉及风险关键词、加入群名称命中风险关键词、交易金额是否为风险数字等;资金转移统计数据可以包括:频繁交易占比、红包交易占比、整百交易占比等,其中,交易类型的数据可以使用不同窗口的累计统计方法,例如,统计近1天的交易额、近7天的交易额、近30天的交易额等。
其中,为了进一步提高生成器的风险行为预测准确度,在确定对抗结果满足预设对抗终止条件之后,在利用生成器进行未来风险行为预测之前,还需要根据判别器识别为非真实数据的仿真样本数据对应的出现概率最大的目标信息维度,对生成器中与目标信息维度对应的参数进行修正,将修正后的生成器确定为最终的风险行为生成模型,基于此,如图3所示,上述S114,将上述生成器确定为风险行为生成模型,具体包括:
S1141,根据判别器输出的风险识别结果,确定该判别器识别为非真实数据的仿真样本数据;
其中,由于生成器的优化目标是生成更接近真实的风险行为数据的仿真数据,使得判别器无法识别出数据的真伪,达到以假乱真的目的,这样说明生成器生成的数据越接近于犯罪用户未来采用的犯罪手段,也就是说明,此时生成器能够更加准确地预测犯罪用户未来可能使用的风险行为手段,因此,可以通过对被判别器识别出来的仿真样本数据进行分析,再对生成器进行进一步优化,进而进一步提高生成器预测风险行为的准确度;
S1142,根据确定出的各仿真样本数据对应的信息维度的所属类型,确定出现概率最大的目标信息维度;
其中,由于输入至生成器的数据为信息维度划分后的真实行为数据,对应的,可以确定生成器生成的仿真样本数据与哪些信息维度有关,能够直观地分析不同信息维度的数据变化,以及判别器针对不同信息维度的仿真样本数据的识别准确度,因此,可以通过分析哪个信息维度的仿真样本数据被判别器识别出来的概率最大,从而有针对性地对生成器的参数进行进一步优化,以便进一步提高生成器的样本生成水平;
S1143,对上述生成器中与目标信息维度对应的模型参数进行修正,得到修正后的生成器;
具体的,有针对性地对出现概率最大的目标信息维度对应的模型参数进行优化,能够进一步提高生成器的样本生成水平,进而进一步提高生成器预测风险行为的准确度;
S1144,将修正后的生成器确定为最终的用于预测未来时间段风险用户行为的风险行为生成模型。
本说明书一个或多个实施例中,由于在真实行为数据输入至生成器之前进行了信息维度的划分处理,因此,可以通过判别器输出的风险识别结果,确定哪些信息维度以假乱真能力比较强,哪些信息维度需要进一步优化,通过信息维度划分使得生成器针对不同信息维度的样本生成水平具有很好的可解释性;对应的,在生成器与判别器之间经过多轮对抗达到博弈的平衡点之后,并不是直接将目标对抗神经网络中的生成器应用于线上进行风险行为预测,而是根据判别器识别为非真实数据的仿真样本数据,确定出现概率最大的目标信息维度;并对生成器中与目标信息维度对应的参数进行修正,将修正后的生成器确定为最终的风险行为生成模型,这样能够进一步提高生成器的样本生成水平,进而进一步提高生成器预测风险行为的准确度。
其中,为了使得仿真样本数据更接近真实行为数据,以增加目标对抗神经网络的可优化性和稳定性,可以通过在生成仿真样本数据时增加一定限制条件,来约束生成的仿真样本数据的属性信息的取值,基于此,如图4所示,上述S106,利用目标对抗神经网络中的生成器并基于得到的真实样本数据,生成多个仿真样本数据,具体包括:
S1061,利用目标对抗神经网络中的生成器并基于得到的真实样本数据,生成多个初始仿真样本数据;
S1062,在多个初始仿真样本数据中,将满足预设约束条件的初始仿真样本数据确定为最终的多个仿真样本数据;
具体的,最终输入至判别器的仿真样本数据需要满足预设约束条件,例如,该预设约束条件可以是总交易金额大于预设金额阈值,总交易对手数大于预设对手数阈值,该预设约束条件还可以是对其他数据项的限制。
其中,针对每一轮的对抗结果的确定过程,即生成器的样本生成水平和判别器的样本判别水平的确定过程,由于输入至判别器的真实样本数据和仿真样本数据均具有双重标签,再结合该双重标签,根据风险识别结果即可确定对抗结果,基于此,上述S110,根据判别器输出的风险识别结果,确定生成器的样本生成水平和判别器的样本判别水平,具体包括:
步骤一,获取各仿真样本数据的第一标签信息和各真实行为数据的第二标签信息;
其中,上述第一标签信息包括:标记仿真数据的标签信息和标记正常或犯罪的标签信息;上述第二标信息包括:标记真实数据的标签信息和标记正常或犯罪的标签信息;
步骤二,根据上述第一标签信息上述第二标签信息、和判别器输出的风险识别结果,确定用于表征判别器的识别正确程度的第一概率和用于表征生成器所生成的仿真样本数据被识别出的第二概率;
其中,上述判别器的识别正确程度可以是根据判别器区分真实数据和仿真数据的正确概率确定的;
步骤三,根据上述第二概率确定生成器的样本生成水平,以及根据上述第一概率确定判别器的样本判别水平。
其中,考虑到随着时间的变化,犯罪用户所采用的犯罪手段也将不断变化,为了能够确保及时应对犯罪用户多变的犯罪手段,因此,可以定期对风险行为生成模型进行更新,以便能够该风险行为生成模型能够应对犯罪用户多变的犯罪手段,基于此,在上述S102,按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,得到维度划分后的真实行为数据之前,还包括:
针对目标风控系统,判断当前使用场景信息是否满足该目标风控系统对应的预设对抗神经网络训练条件;
其中,以目标资金转移业务包括:贷款业务场景或线上消费支付场景为例,上述目标风控系统可以是应用于贷款业务场景的风控系统,也可以是应用于线上消费支付场景的风控系统;
其中,上述当前使用场景信息可以是自前一次对抗优化结束至当前的时间间隔,对应的,预设对抗神经网络训练条件可以预设时间间隔阈值,即按照预设时间间隔进行对抗神经网络训练;
上述当前使用场景信息也可以是当前使用时间信息,对应的,预设对抗神经网络训练条件可以预设对抗神经网络训练时间节点,即按照预设直到时间节点进行对抗神经网络训练;
上述当前使用场景信息还可以是自前一次对抗优化至当前的历史行为数据数量,对应的,预设对抗神经网络训练条件可以预设数据增量阈值,即按照预设历史行为数据增加条数进行对抗神经网络训练;
若判断结果为是,则获取与目标风控系统对应的预设历史时间段内用户的真实行为数据;
其中,上述预设历史时间段可以是距当前某一时间间隔的时间段,例如,该某一时间间隔为一周,则需要获取距离当前一周之间的历史行为数据;
具体的,在获取到预设历史时间段内用户的真实行为数据之后,继续执行上述步骤S102至S116,即执行下一次目标对抗神经网络训练,确定新的风险行为生成模型。
本说明书一个或多个实施例实现了:通过按照预设约定条件自动对目标对抗神经网络进行训练优化,即由目标对抗神经网络中的生成器自动生成仿真样本数据,再由判别器对仿真样本数据和真实样本数据进行风险识别,得到相应的风险识别结果,并根据风险识别结果对模型参数进行多轮迭代优化,使得生成器和判别器的对抗结果满足预设对抗终止条件,得到最新的风险行为识别模型,以实现及时基于最新的真实行为数据对风险行为生成模型进行迭代更新,以便及时应对犯罪用户不断变换的犯罪手段。
其中,在基于最终确定的风险行为生成模型模拟犯罪用户未来可能采用的犯罪手段,即预测未来预设时间段内的可能出现的风险行为数据,再基于预测得到的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。基于此,如图5所示,在上述S114,将上述生成器确定为风险行为生成模型之后,还包括:
S118,利用确定出的风险行为生成模型,预测未来预设时间段内的线上风险行为数据;
具体的,可以将最近预设时间段内的犯罪用户的真实行为数据作为风险行为生成模型的输入,然后,利用该风险行为生成模型模拟未来预设时间段内的可能出现的风险行为数据;
具体的,在进行风险行为数据预测时,也可以先对最近预设时间段内的真实风险行为数据进行信息维度划分处理,将维度划分处理后的真实风险行为数据输入至确定出的风险行为生成模型,利用该风险行为生成模型进行风险行为预测,得到未来预设时间段内犯罪用户可能使用的风险行为;
S120,基于预测得到的线上风险行为数据,对用于线上风险识别的风控策略集合进行更新处理,得到更新后的风控策略集合;
具体的,针对预测得到的每个线上风险行为数据,利用用于线上风险识别的风控策略集合,对该线上风险行为数据进行风险识别;
若识别结果表征该线上风险行为数据不存在风险,则判断是否存在与该线上风险行为数据对应的目标风控策略,其中,该目标风控策略是指通过参数阈值调整能够将该线上风险行为数据识别为存在风险的风险防控策略;
若存在对应的目标风控策略,则将风控策略集合中该目标风控策略更新为参数阈值调整后的风险防控策略;
若不存在对应的目标风控策略,则新增一条用于识别该线上风险行为数据的风险防控策略,并将该风险防控策略添加至风控策略集合中;
其中,上述新增的风险防控策略和参数阈值调整后的风险防控策略的打扰率小于预设阈值;
S122,基于更新后的风控策略集合,对线上用户的行为数据进行风险防控,生成相应的风险防控结果;
具体的,若识别出线上用户的行为数据存在风险,则对该线上用户的业务请求进行拦截处理,以达到对线上风险行为进行及时且精准地进行风控。
本说明书一个或多个实施例中的风险行为生成模型的确定方法,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。本说明书一个或多个实施例实现了利用确定出的风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
对应上述图1至图5描述的风险行为生成模型的确定方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种风险行为生成模型的确定装置,图6为本说明书一个或多个实施例提供的风险行为生成模型的确定装置的第一种模块组成示意图,该装置用于执行图1至图5描述的风险行为生成模型的确定方法,如图6所示,该装置包括:
信息维度划分模块601,用于按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理;
真实样本生成模块602,用于根据维度划分后的所述真实行为数据生成真实样本数据;
仿真样本生成模块603,用于利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
识别结果确定模块604,用于利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
对抗结果确定模块605,用于根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
对抗网络优化模块606,用于若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络;
生成模型确定模块607,用于若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型。
本说明书一个或多个实施例实现了:通过生成器与判别器之间不断对抗优化,使得生成器所生成的数据不断逼近犯罪用户未来可能使用的犯罪手段,促使生成器能够对犯罪用户未来可能采用的犯罪手段进行提前预知,得到预测未来风险行为准确度高的风险行为生成模型,这样利用该风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时基于预测出的风险行为对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,以实现自动及时对风控系统的漏洞加以补充,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
可选地,所述对抗网络优化模块606,具体用于:
采用梯度下降方法并基于所述风险识别结果,对所述生成器和所述判别器进行参数优化,得到优化后的生成器和优化后的判别器;
将所述优化后的生成器和所述优化后的判别器的组合,确定为下一轮的目标对抗神经网络。
可选地,所述真实样本生成模块602,具体用于:
针对每个信息维度,判断该信息维度对应的真实行为数据的数据类型是否为数值型;
若否,则对所述信息维度对应的所述真实行为数据进行类型转换,得到所述信息维度对应的数值型行为数据;
将各所述信息维度对应的数值型行为数据的集合确定为最终的真实样本数据。
可选地,所述生成模型确定模块607,具体用于:
根据所述风险识别结果,确定所述判别器识别为非真实数据的仿真样本数据;
根据确定出的各所述仿真样本数据对应的信息维度的所属类型,确定出现概率最大的目标信息维度;
对所述生成器中与所述目标信息维度对应的模型参数进行修正,得到修正后的生成器;
将所述修正后的生成器确定为最终的用于预测未来时间段风险用户行为的风险行为生成模型。
可选地,所述仿真样本生成模块603,具体用于:
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个初始仿真样本数据;
在所述多个初始仿真样本数据中,将满足预设约束条件的初始仿真样本数据确定为最终的多个仿真样本数据。
可选地,所述对抗结果确定模块605,具体用于:
获取各所述仿真样本数据的第一标签信息和各所述真实行为数据的第二标签信息;
根据所述风险识别结果、所述第一标签信息和所述第二标签信息,确定用于表征所述判别器的识别正确程度的第一概率和用于表征所述生成器所生成的所述仿真样本数据被识别出的第二概率;
根据所述第二概率确定所述生成器的样本生成水平,以及根据所述第一概率确定所述判别器的样本判别水平。
可选地,如图7所示,上述装置还包括:历史数据获取模块608,用于:
针对目标风控系统,判断当前使用场景信息是否满足该目标风控系统对应的预设对抗神经网络训练条件;
若是,则获取与所述目标风控系统对应的预设历史时间段内用户的真实行为数据。
可选地,上述装置还包括:线上行为风控模块609,用于:
利用所述风险行为生成模型,预测未来预设时间段内的线上风险行为数据;
基于所述线上风险行为数据,对用于线上风险识别的风控策略集合进行更新处理,得到更新后的风控策略集合;
基于所述更新后的风控策略集合,对线上用户的行为数据进行风险防控,生成相应的风险防控结果。
本说明书一个或多个实施例中的风险行为生成模型的确定装置,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。本说明书一个或多个实施例实现了利用确定出的风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
需要说明的是,本说明书中关于风险行为生成模型的确定装置的实施例与本说明书中关于风险行为生成模型的确定方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险行为生成模型的确定方法的实施,重复之处不再赘述。
进一步地,对应上述图1至图5所示的方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种风险行为生成模型的确定设备,该设备用于执行上述的风险行为生成模型的确定方法,如图8所示。
风险行为生成模型的确定设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对风险行为生成模型的确定设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在风险行为生成模型的确定设备上执行存储器802中的一系列计算机可执行指令。风险行为生成模型的确定设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806等。
在一个具体的实施例中,风险行为生成模型的确定设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对风险行为生成模型的确定设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
本说明书一个或多个实施例实现了:通过生成器与判别器之间不断对抗优化,使得生成器所生成的数据不断逼近犯罪用户未来可能使用的犯罪手段,促使生成器能够对犯罪用户未来可能采用的犯罪手段进行提前预知,得到预测未来风险行为准确度高的风险行为生成模型,这样利用该风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时基于预测出的风险行为对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,以实现自动及时对风控系统的漏洞加以补充,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
可选地,计算机可执行指令在被执行时,所述基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络,包括:
采用梯度下降方法并基于所述风险识别结果,对所述生成器和所述判别器进行参数优化,得到优化后的生成器和优化后的判别器;
将所述优化后的生成器和所述优化后的判别器的组合,确定为下一轮的目标对抗神经网络。
可选地,计算机可执行指令在被执行时,所述根据维度划分后的所述真实行为数据生成真实样本数据,包括:
针对每个信息维度,判断该信息维度对应的真实行为数据的数据类型是否为数值型;
若否,则对所述信息维度对应的所述真实行为数据进行类型转换,得到所述信息维度对应的数值型行为数据;
将各所述信息维度对应的数值型行为数据的集合确定为最终的真实样本数据。
可选地,计算机可执行指令在被执行时,所述将所述生成器确定为风险行为生成模型,包括:
根据所述风险识别结果,确定所述判别器识别为非真实数据的仿真样本数据;
根据确定出的各所述仿真样本数据对应的信息维度的所属类型,确定出现概率最大的目标信息维度;
对所述生成器中与所述目标信息维度对应的模型参数进行修正,得到修正后的生成器;
将所述修正后的生成器确定为最终的用于预测未来时间段风险用户行为的风险行为生成模型。
可选地,计算机可执行指令在被执行时,所述利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据,包括:
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个初始仿真样本数据;
在所述多个初始仿真样本数据中,将满足预设约束条件的初始仿真样本数据确定为最终的多个仿真样本数据。
可选地,计算机可执行指令在被执行时,所述根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平,包括:
获取各所述仿真样本数据的第一标签信息和各所述真实行为数据的第二标签信息;
根据所述风险识别结果、所述第一标签信息和所述第二标签信息,确定用于表征所述判别器的识别正确程度的第一概率和用于表征所述生成器所生成的所述仿真样本数据被识别出的第二概率;
根据所述第二概率确定所述生成器的样本生成水平,以及根据所述第一概率确定所述判别器的样本判别水平。
可选地,计算机可执行指令在被执行时,在按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理之前,还包括:
针对目标风控系统,判断当前使用场景信息是否满足该目标风控系统对应的预设对抗神经网络训练条件;
若是,则获取与所述目标风控系统对应的预设历史时间段内用户的真实行为数据。
可选地,计算机可执行指令在被执行时,在将所述生成器确定为风险行为生成模型之后,还包括:
利用所述风险行为生成模型,预测未来预设时间段内的线上风险行为数据;
基于所述线上风险行为数据,对用于线上风险识别的风控策略集合进行更新处理,得到更新后的风控策略集合;
基于所述更新后的风控策略集合,对线上用户的行为数据进行风险防控,生成相应的风险防控结果。
本说明书一个或多个实施例中的风险行为生成模型的确定设备,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。本说明书一个或多个实施例实现了利用确定出的风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
需要说明的是,本说明书中关于风险行为生成模型的确定设备的实施例与本说明书中关于风险行为生成模型的确定方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险行为生成模型的确定方法的实施,重复之处不再赘述。
进一步地,对应上述图1至图5所示的方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则将所述生成器确定为风险行为生成模型;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
本说明书一个或多个实施例实现了:通过生成器与判别器之间不断对抗优化,使得生成器所生成的数据不断逼近犯罪用户未来可能使用的犯罪手段,促使生成器能够对犯罪用户未来可能采用的犯罪手段进行提前预知,得到预测未来风险行为准确度高的风险行为生成模型,这样利用该风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时基于预测出的风险行为对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,以实现自动及时对风控系统的漏洞加以补充,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络,包括:
采用梯度下降方法并基于所述风险识别结果,对所述生成器和所述判别器进行参数优化,得到优化后的生成器和优化后的判别器;
将所述优化后的生成器和所述优化后的判别器的组合,确定为下一轮的目标对抗神经网络。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据维度划分后的所述真实行为数据生成真实样本数据,包括:
针对每个信息维度,判断该信息维度对应的真实行为数据的数据类型是否为数值型;
若否,则对所述信息维度对应的所述真实行为数据进行类型转换,得到所述信息维度对应的数值型行为数据;
将各所述信息维度对应的数值型行为数据的集合确定为最终的真实样本数据。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述将所述生成器确定为风险行为生成模型,包括:
根据所述风险识别结果,确定所述判别器识别为非真实数据的仿真样本数据;
根据确定出的各所述仿真样本数据对应的信息维度的所属类型,确定出现概率最大的目标信息维度;
对所述生成器中与所述目标信息维度对应的模型参数进行修正,得到修正后的生成器;
将所述修正后的生成器确定为最终的用于预测未来时间段风险用户行为的风险行为生成模型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据,包括:
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个初始仿真样本数据;
在所述多个初始仿真样本数据中,将满足预设约束条件的初始仿真样本数据确定为最终的多个仿真样本数据。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平,包括:
获取各所述仿真样本数据的第一标签信息和各所述真实行为数据的第二标签信息;
根据所述风险识别结果、所述第一标签信息和所述第二标签信息,确定用于表征所述判别器的识别正确程度的第一概率和用于表征所述生成器所生成的所述仿真样本数据被识别出的第二概率;
根据所述第二概率确定所述生成器的样本生成水平,以及根据所述第一概率确定所述判别器的样本判别水平。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,在按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理之前,还包括:
针对目标风控系统,判断当前使用场景信息是否满足该目标风控系统对应的预设对抗神经网络训练条件;
若是,则获取与所述目标风控系统对应的预设历史时间段内用户的真实行为数据。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,在将所述生成器确定为风险行为生成模型之后,还包括:
利用所述风险行为生成模型,预测未来预设时间段内的线上风险行为数据;
基于所述线上风险行为数据,对用于线上风险识别的风控策略集合进行更新处理,得到更新后的风控策略集合;
基于所述更新后的风控策略集合,对线上用户的行为数据进行风险防控,生成相应的风险防控结果。
本说明书一个或多个实施例中的存储介质存储的计算机可执行指令在被处理器执行时,按照预设的多个信息维度对历史用户的真实行为数据进行维度划分处理;再利用目标对抗神经网络中的生成器基于维度划分得到的真实样本数据自动生成多个仿真样本数据,以及利用目标对抗神经网络中的判别器对仿真样本数据和真实样本数据进行风险识别;再根据风险识别结果,判断生成器的样本生成水平和判别器的样本判别水平是否满足预设对抗终止条件,若是,则将最终的生成器确定为风险行为生成模型,以便基于该风险行为生成模型所生成的风险行为数据对线上风控策略进行更新,再基于更新后的风控策略对线上用户的行为数据进行风险防控。本说明书一个或多个实施例实现了利用确定出的风险行为生成模型能够快速、准确地提前预知犯罪用户未来可能使用的风险行为,以便及时对线上风控策略进行更新、补充,进而能够确保线上风控策略的更新时效性,从而提高对线上用户行为数据的风险识别的及时性和准确度,以达到对线上风险行为进行及时且精准地拦截处理。
需要说明的是,本说明书中关于存储介质的实施例与本说明书中关于风险行为生成模型的确定方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的风险行为生成模型的确定方法的实施,重复之处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HD Cal、JHDL(Java Hardware Description Language)、Lava、Lola、My HDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个是参照根据本说明书一个或多个实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书一个或多个的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个的实施例而已,并不用于限制本说明书一个或多个。对于本领域技术人员来说,本说明书一个或多个可以有各种更改和变化。凡在本说明书一个或多个的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个的权利要求范围之内。

Claims (18)

1.一种风险行为生成模型的确定方法,包括:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;其中,所述维度划分处理包括对所述真实行为数据的每个数据项进行信息维度类型的标记,每条所述真实行为数据包括多个信息维度的数据项;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则根据所述判别器识别为非真实数据的仿真样本数据对应的出现概率最大的目标信息维度,对生成器中与所述目标信息维度对应的参数进行修正,将修正后的所述生成器确定为风险行为生成模型;其中,所述风险行为生成模型用于预测未来时间段的风险行为数据以对线上风控策略进行更新;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
2.根据权利要求1所述的方法,其中,所述基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络,包括:
采用梯度下降方法并基于所述风险识别结果,对所述生成器和所述判别器进行参数优化,得到优化后的生成器和优化后的判别器;
将所述优化后的生成器和所述优化后的判别器的组合,确定为下一轮的目标对抗神经网络。
3.根据权利要求1所述的方法,其中,所述根据维度划分后的所述真实行为数据生成真实样本数据,包括:
针对每个信息维度,判断该信息维度对应的真实行为数据的数据类型是否为数值型;
若否,则对所述信息维度对应的所述真实行为数据进行类型转换,得到所述信息维度对应的数值型行为数据;
将各所述信息维度对应的数值型行为数据的集合确定为最终的真实样本数据。
4.根据权利要求1所述的方法,其中,所述根据所述判别器识别为非真实数据的仿真样本数据对应的出现概率最大的目标信息维度,对生成器中与所述目标信息维度对应的参数进行修正,将修正后的所述生成器确定为风险行为生成模型,包括:
根据所述风险识别结果,确定所述判别器识别为非真实数据的仿真样本数据;
根据确定出的各所述仿真样本数据对应的信息维度的所属类型,确定出现概率最大的目标信息维度;
对所述生成器中与所述目标信息维度对应的模型参数进行修正,得到修正后的生成器;
将所述修正后的生成器确定为最终的用于预测未来时间段风险用户行为的风险行为生成模型。
5.根据权利要求1所述的方法,其中,所述利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据,包括:
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个初始仿真样本数据;
在所述多个初始仿真样本数据中,将满足预设约束条件的初始仿真样本数据确定为最终的多个仿真样本数据。
6.根据权利要求1所述的方法,其中,所述根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平,包括:
获取各所述仿真样本数据的第一标签信息和各所述真实行为数据的第二标签信息;
根据所述风险识别结果、所述第一标签信息和所述第二标签信息,确定用于表征所述判别器的识别正确程度的第一概率和用于表征所述生成器所生成的所述仿真样本数据被识别出的第二概率;
根据所述第二概率确定所述生成器的样本生成水平,以及根据所述第一概率确定所述判别器的样本判别水平。
7.根据权利要求1所述的方法,其中,在按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理之前,还包括:
针对目标风控系统,判断当前使用场景信息是否满足该目标风控系统对应的预设对抗神经网络训练条件;
若是,则获取与所述目标风控系统对应的预设历史时间段内用户的真实行为数据。
8.根据权利要求1至7任一项所述的方法,其中,在根据所述信息维度对所述生成器中的模型参数进行对应修正,将修正后的所述生成器确定为风险行为生成模型之后,还包括:
利用所述风险行为生成模型,预测未来预设时间段内的线上风险行为数据;
基于所述线上风险行为数据,对用于线上风险识别的风控策略集合进行更新处理,得到更新后的风控策略集合;
基于所述更新后的风控策略集合,对线上用户的行为数据进行风险防控,生成相应的风险防控结果。
9.一种风险行为生成模型的确定装置,包括:
信息维度划分模块,用于按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理;其中,所述维度划分处理包括对所述真实行为数据的每个数据项进行信息维度类型的标记,每条所述真实行为数据包括多个信息维度的数据项;
真实样本生成模块,用于根据维度划分后的所述真实行为数据生成真实样本数据;
仿真样本生成模块,用于利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
识别结果确定模块,用于利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
对抗结果确定模块,用于根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
对抗网络优化模块,用于若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络;
生成模型确定模块,用于若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则根据所述判别器识别为非真实数据的仿真样本数据对应的出现概率最大的目标信息维度,对生成器中与所述目标信息维度对应的参数进行修正,将修正后的所述生成器确定为风险行为生成模型;其中,所述风险行为生成模型用于预测未来时间段的风险行为数据以对线上风控策略进行更新。
10.根据权利要求9所述的装置,其中,所述对抗网络优化模块,具体用于:
采用梯度下降方法并基于所述风险识别结果,对所述生成器和所述判别器进行参数优化,得到优化后的生成器和优化后的判别器;
将所述优化后的生成器和所述优化后的判别器的组合,确定为下一轮的目标对抗神经网络。
11.根据权利要求9所述的装置,其中,所述真实样本生成模块,具体用于:
针对每个信息维度,判断该信息维度对应的真实行为数据的数据类型是否为数值型;
若否,则对所述信息维度对应的所述真实行为数据进行类型转换,得到所述信息维度对应的数值型行为数据;
将各所述信息维度对应的数值型行为数据的集合确定为最终的真实样本数据。
12.根据权利要求9所述的装置,其中,所述生成模型确定模块,具体用于:
根据所述风险识别结果,确定所述判别器识别为非真实数据的仿真样本数据;
根据确定出的各所述仿真样本数据对应的信息维度的所属类型,确定出现概率最大的目标信息维度;
对所述生成器中与所述目标信息维度对应的模型参数进行修正,得到修正后的生成器;
将所述修正后的生成器确定为最终的用于预测未来时间段风险用户行为的风险行为生成模型。
13.根据权利要求9所述的装置,其中,所述仿真样本生成模块,具体用于:
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个初始仿真样本数据;
在所述多个初始仿真样本数据中,将满足预设约束条件的初始仿真样本数据确定为最终的多个仿真样本数据。
14.根据权利要求9所述的装置,其中,所述对抗结果确定模块,具体用于:
获取各所述仿真样本数据的第一标签信息和各所述真实行为数据的第二标签信息;
根据所述风险识别结果、所述第一标签信息和所述第二标签信息,确定用于表征所述判别器的识别正确程度的第一概率和用于表征所述生成器所生成的所述仿真样本数据被识别出的第二概率;
根据所述第二概率确定所述生成器的样本生成水平,以及根据所述第一概率确定所述判别器的样本判别水平。
15.根据权利要求9所述的装置,其中,还包括:历史数据获取模块,用于:
针对目标风控系统,判断当前使用场景信息是否满足该目标风控系统对应的预设对抗神经网络训练条件;
若是,则获取与所述目标风控系统对应的预设历史时间段内用户的真实行为数据。
16.根据权利要求9至15任一项所述的装置,其中,还包括:线上行为风控模块,用于:
利用所述风险行为生成模型,预测未来预设时间段内的线上风险行为数据;
基于所述线上风险行为数据,对用于线上风险识别的风控策略集合进行更新处理,得到更新后的风控策略集合;
基于所述更新后的风控策略集合,对线上用户的行为数据进行风险防控,生成相应的风险防控结果。
17.一种风险行为生成模型的确定设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;其中,所述维度划分处理包括对所述真实行为数据的每个数据项进行信息维度类型的标记,每条所述真实行为数据包括多个信息维度的数据项;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则根据所述判别器识别为非真实数据的仿真样本数据对应的出现概率最大的目标信息维度,对生成器中与所述目标信息维度对应的参数进行修正,将修正后的所述生成器确定为风险行为生成模型;其中,所述风险行为生成模型用于预测未来时间段的风险行为数据以对线上风控策略进行更新;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
18.一种存储介质,用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下方法:
按照预设的多个信息维度,对预设历史时间段内用户的真实行为数据进行维度划分处理,并根据维度划分后的所述真实行为数据生成真实样本数据;其中,所述维度划分处理包括对所述真实行为数据的每个数据项进行信息维度类型的标记,每条所述真实行为数据包括多个信息维度的数据项;
利用目标对抗神经网络中的生成器并基于所述真实样本数据,生成多个仿真样本数据;
利用所述目标对抗神经网络中的判别器对所述仿真样本数据和所述真实样本数据进行风险识别,得到风险识别结果;
根据所述风险识别结果,确定所述生成器的样本生成水平和所述判别器的样本判别水平;
若所述样本生成水平和所述样本判别水平满足预设对抗终止条件,则根据所述判别器识别为非真实数据的仿真样本数据对应的出现概率最大的目标信息维度,对生成器中与所述目标信息维度对应的参数进行修正,将修正后的所述生成器确定为风险行为生成模型;其中,所述风险行为生成模型用于预测未来时间段的风险行为数据以对线上风控策略进行更新;
若所述样本生成水平和所述样本判别水平不满足预设对抗终止条件,则基于所述风险识别结果对所述生成器和所述判别器进行参数优化,得到下一轮的目标对抗神经网络。
CN201910758439.3A 2019-08-16 2019-08-16 一种风险行为生成模型的确定方法及装置 Active CN110633989B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910758439.3A CN110633989B (zh) 2019-08-16 2019-08-16 一种风险行为生成模型的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910758439.3A CN110633989B (zh) 2019-08-16 2019-08-16 一种风险行为生成模型的确定方法及装置

Publications (2)

Publication Number Publication Date
CN110633989A CN110633989A (zh) 2019-12-31
CN110633989B true CN110633989B (zh) 2023-08-29

Family

ID=68970346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910758439.3A Active CN110633989B (zh) 2019-08-16 2019-08-16 一种风险行为生成模型的确定方法及装置

Country Status (1)

Country Link
CN (1) CN110633989B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036572B (zh) * 2020-08-28 2024-03-12 上海冰鉴信息科技有限公司 基于文本列表的用户特征提取方法及装置
CN112036955B (zh) * 2020-09-07 2021-09-24 贝壳找房(北京)科技有限公司 用户识别方法和装置、计算机可读存储介质、电子设备
CN112529689B (zh) * 2020-12-16 2024-04-26 北京逸风金科软件有限公司 银行风险定价策略的仿真方法和装置
CN112561389B (zh) * 2020-12-23 2023-11-10 北京元心科技有限公司 确定设备检测结果的方法、装置以及电子设备
CN112784420B (zh) * 2021-01-26 2022-09-02 支付宝(杭州)信息技术有限公司 一种风控策略的仿真评估方法、装置及设备
CN113159773B (zh) * 2021-04-28 2024-03-22 中国工商银行股份有限公司 一种量化交易回测数据生成方法及装置
CN113313575B (zh) * 2021-06-08 2022-06-03 支付宝(杭州)信息技术有限公司 一种风险识别模型的确定方法及装置
CN113888181A (zh) * 2021-10-25 2022-01-04 支付宝(杭州)信息技术有限公司 业务处理及其风险检测策略体系的构建方法、装置及设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011014037A (ja) * 2009-07-03 2011-01-20 Fuji Heavy Ind Ltd リスク予測システム
CN107180392A (zh) * 2017-05-18 2017-09-19 北京科技大学 一种电力企业电费回收数据模拟方法
CN107563355A (zh) * 2017-09-28 2018-01-09 哈尔滨工程大学 基于生成对抗网络的高光谱异常检测方法
CN107808098A (zh) * 2017-09-07 2018-03-16 阿里巴巴集团控股有限公司 一种模型安全检测方法、装置以及电子设备
CN107993140A (zh) * 2017-11-22 2018-05-04 深圳市耐飞科技有限公司 一种个人信贷风险评估方法及系统
CN108388925A (zh) * 2018-03-06 2018-08-10 天津工业大学 基于新型条件对抗生成网络的抗模式崩溃鲁棒图像生成方法
CN108629680A (zh) * 2018-04-03 2018-10-09 中国农业银行股份有限公司 一种风险识别方法及系统
CN108985583A (zh) * 2018-06-27 2018-12-11 中国银行股份有限公司 基于人工智能的金融数据风险控制方法及装置
WO2019003234A1 (en) * 2017-06-26 2019-01-03 Telefonaktiebolaget Lm Ericsson (Publ) NETWORK NODE AND METHOD IMPLEMENTED THEREFOR FOR GENERATING A MISSING DATA VALUE OF A DATA SET FROM ONE OR MORE DEVICES
CN109145938A (zh) * 2018-06-26 2019-01-04 阿里巴巴集团控股有限公司 一种使用分类器进行分类的方法和装置
CN109948660A (zh) * 2019-02-26 2019-06-28 长沙理工大学 一种改进辅助分类器gan的图像分类方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011014037A (ja) * 2009-07-03 2011-01-20 Fuji Heavy Ind Ltd リスク予測システム
CN107180392A (zh) * 2017-05-18 2017-09-19 北京科技大学 一种电力企业电费回收数据模拟方法
WO2019003234A1 (en) * 2017-06-26 2019-01-03 Telefonaktiebolaget Lm Ericsson (Publ) NETWORK NODE AND METHOD IMPLEMENTED THEREFOR FOR GENERATING A MISSING DATA VALUE OF A DATA SET FROM ONE OR MORE DEVICES
CN107808098A (zh) * 2017-09-07 2018-03-16 阿里巴巴集团控股有限公司 一种模型安全检测方法、装置以及电子设备
CN107563355A (zh) * 2017-09-28 2018-01-09 哈尔滨工程大学 基于生成对抗网络的高光谱异常检测方法
CN107993140A (zh) * 2017-11-22 2018-05-04 深圳市耐飞科技有限公司 一种个人信贷风险评估方法及系统
CN108388925A (zh) * 2018-03-06 2018-08-10 天津工业大学 基于新型条件对抗生成网络的抗模式崩溃鲁棒图像生成方法
CN108629680A (zh) * 2018-04-03 2018-10-09 中国农业银行股份有限公司 一种风险识别方法及系统
CN109145938A (zh) * 2018-06-26 2019-01-04 阿里巴巴集团控股有限公司 一种使用分类器进行分类的方法和装置
CN108985583A (zh) * 2018-06-27 2018-12-11 中国银行股份有限公司 基于人工智能的金融数据风险控制方法及装置
CN109948660A (zh) * 2019-02-26 2019-06-28 长沙理工大学 一种改进辅助分类器gan的图像分类方法

Also Published As

Publication number Publication date
CN110633989A (zh) 2019-12-31

Similar Documents

Publication Publication Date Title
CN110633989B (zh) 一种风险行为生成模型的确定方法及装置
US20200211106A1 (en) Method, apparatus, and device for training risk management models
CN113313575B (zh) 一种风险识别模型的确定方法及装置
CN110020938B (zh) 交易信息处理方法、装置、设备及存储介质
EP3754571A1 (en) Risk control rule generation method and apparatus
CN110263821B (zh) 交易特征生成模型的训练、交易特征的生成方法和装置
TW201935387A (zh) 反洗錢方法、裝置及設備
TW201905773A (zh) 車險風險預測方法、裝置及伺服器
CN111639687B (zh) 一种模型训练以及异常账号识别方法及装置
CN108596410B (zh) 一种风控事件自动处理方法及装置
CN111539811B (zh) 风险账户的识别方法及装置
CN108764915B (zh) 模型训练方法、数据类型识别方法和计算机设备
CN107622326B (zh) 用户分类、可用资源预测方法、装置及设备
CN109003091A (zh) 一种风险防控处理方法、装置及设备
CN113849848B (zh) 一种数据权限配置方法及系统
CN113516480A (zh) 一种支付风险识别方法、装置及设备
CN110634030A (zh) 应用的业务指标挖掘方法、装置及设备
CN109426912A (zh) 风控系统优化方法、系统、装置以及电子设备
CN112966113A (zh) 一种数据的风险防控方法、装置及设备
CN111047220A (zh) 一种风控阈值条件确定方法、装置、设备和可读介质
TWI713019B (zh) 資料標籤產生、模型訓練、事件識別方法和裝置
CN115712866A (zh) 数据处理方法、装置及设备
US20200311472A1 (en) Comprehensive Data Science Solution for Segmentation Analysis
CN112967044B (zh) 一种支付业务的处理方法及装置
CN111242195B (zh) 模型、保险风控模型训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant