CN112784420A - 一种风控策略的仿真评估方法、装置及设备 - Google Patents

一种风控策略的仿真评估方法、装置及设备 Download PDF

Info

Publication number
CN112784420A
CN112784420A CN202110102404.1A CN202110102404A CN112784420A CN 112784420 A CN112784420 A CN 112784420A CN 202110102404 A CN202110102404 A CN 202110102404A CN 112784420 A CN112784420 A CN 112784420A
Authority
CN
China
Prior art keywords
wind control
sample data
historical sample
preset
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110102404.1A
Other languages
English (en)
Other versions
CN112784420B (zh
Inventor
钱晓毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110102404.1A priority Critical patent/CN112784420B/zh
Publication of CN112784420A publication Critical patent/CN112784420A/zh
Application granted granted Critical
Publication of CN112784420B publication Critical patent/CN112784420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例公开了一种风控策略的仿真评估方法、装置及设备,该方法包括从事件数据库中获取用于评估预设的风控策略的历史样本数据;基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。

Description

一种风控策略的仿真评估方法、装置及设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种风控策略的仿真评估方法、装置及设备。
背景技术
当前,风控策略上线运行前的分析工作,主要依赖人工经验,并通过简单数据筛选的方式进行,但当遇到复杂运算逻辑时,该风控策略难以进行全局效果评估。另外,单次进行风控策略的调整和试运行,往往需要耗时月1~3天,而且,如果需要对量化模型中的参数进行反复调优,则需要消耗的时间将会进一步增加。而且,风控策略的试运行仅能评估极短时长内(即从风控策略的试运行的开始时间到指定时间的时间段内)采样下的风控策略,对于试运行阶段之前积累的样本数据无法有效利用。为此,需要提供一种能够提高风控策略的评估效率,并能够充分有效的利用各种历史样本数据的风控策略的评估机制。
发明内容
本说明书实施例的目的是提供一种能够提高风控策略的评估效率,并能够充分有效的利用各种历史样本数据的风控策略的评估机制。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种风控策略的仿真评估方法,所述方法包括:从事件数据库中获取用于评估预设的风控策略的历史样本数据。基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应。基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
本说明书实施例提供的一种风控策略的仿真评估装置,所述装置包括:历史样本获取模块,从事件数据库中获取用于评估预设的风控策略的历史样本数据。特征生成模块,基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应。模拟仿真模块,基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。仿真评估模块,基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
本说明书实施例提供的一种风控策略的仿真评估设备,所述风控策略的仿真评估设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:从事件数据库中获取用于评估预设的风控策略的历史样本数据。基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应。基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
本说明书实施例提供的一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:从事件数据库中获取用于评估预设的风控策略的历史样本数据。基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应。基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一种风控策略的仿真评估方法实施例;
图2为本说明书另一种风控策略的仿真评估方法实施例;
图3为本说明书一种风控策略的仿真评估处理的示意图;
图4为本说明书一种风控策略的仿真评估装置的结构示意图;
图5为本说明书一种风控策略的仿真评估设备实施例。
具体实施方式
本说明书实施例提供一种风控策略的仿真评估方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1所示,本说明书实施例提供一种风控策略的仿真评估方法,该方法的执行主体可以为服务器,其中的该服务器可以是为某项业务(如进行交易的业务或金融业务等)提供风控策略的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。该方法具体可以包括以下步骤:
在步骤S102中,从事件数据库中获取用于评估预设的风控策略的历史样本数据。
其中,事件数据库可以是用于记录和存储发生的指定事件的相关数据的数据库,事件数据库中可以存储一种类型的事件或多种不同类型的事件的相关数据,其中的事件可以包括如支付事件、即时通讯事件、登录事件、数据更新事件等,相应的,上述的事件的类型可以基于上述事件进行相应分类,如支付类、即时通讯类等,具体可以根据实际情况设定,本说明书实施例对此不做限定。风控策略可以是用于对某种风险进行防控的策略,风控策略的内容可以根据实际情况设定,例如可以基于专家经验设置相应的风控策略,或者,可以基于历史数据和预设的算法(或模型)进行计算,最终可以得到相应的风控策略等。历史样本数据可以是指定时间段内的样本数据,例如,当前时间之前的1个月内的数据作为历史样本数据,或者,当前时间之前的某一时间点作为起点,该起点之前的1年内的数据作为历史样本数据等,具体可以根据实际情况设定。需要说明的是,上述指定时间段可以不限于风控策略试运行阶段的时间段,还可以是该风控策略运行阶段之前的指定时间段的数据,这样可以充分利用历史数据,提高风控策略的仿真评估结果的准确性。
在实施中,当前,风控策略上线运行前的分析工作,主要依赖人工经验,并通过简单数据筛选的方式进行,但当遇到复杂运算逻辑时,该风控策略难以进行全局效果评估。另外,单次进行风控策略的调整和试运行,往往需要耗时月1~3天,而且,如果需要对量化模型中的参数进行反复调优,则需要消耗的时间将会进一步增加。而且,风控策略的试运行仅能评估极短时长内(即从风控策略的试运行的开始时间到指定时间的时间段内)采样下的风控策略,对于试运行阶段之前积累的样本数据无法有效利用。为此,需要提供一种能够提高风控策略的评估效率,并能够充分有效的利用各种历史样本数据的风控策略的评估机制。本说明书实施例提供一种风控策略的仿真评估机制,具体可以包括以下内容:
考虑到相关技术中使用实时风控稽核平台对风控策略进行试运行时,风控策略调整流程冗长,且该风控策略的评估依赖于实时流量数据的随机抽样,并且长周期的统计数据需要额外导入,为此,本说明书实施例提供一种轻量化的仿真框架,并且,可以将整体的业务处理过程拆解为事件在时间轴上的风控数据特征生成和模拟稽核操作等两个阶段,对于事件在时间轴上的风控数据特征生成阶段,其本质是时序事件在时间轴上的特征构造行为,构造特征的时序事件总线可以保障事件的时间升序性后通过调度事件驱动框架完成仿真处理,具体可以通过步骤S102和步骤S104的处理完成,对于模拟稽核操作阶段,其本质是多个相互独立的向量运算,具体可以通过步骤S106和步骤S108的处理完成。
具体地,可以预先设定事件数据库,每当某事件被触发后,可以将与该事件相关的数据存储于事件数据库中,例如,对于支付事件,当用户触发支付机制时,用户使用的终端设备可以获取用户支付相关的数据,如支付账户的信息、收款账户的信息、购买的商品的信息、当前时间、当前所处的位置、支付金额、支付方式等,终端设备可以基于上述数据生成支付请求发送给服务器,该服务器可以对该支付事件进行验证和风险评估等处理,如果均通过上述处理,则可以将上述相关数据存储于事件数据库中,同时,可以对该支付请求进行响应,并可以将响应的相关数据存储于事件数据库中,直到支付事件完成,从而事件数据库中可以存储有上述支付事件的相关数据。对于事件数据库中存储的各个事件的相关数据,可以通过下述表1的方式存储。
表1
Figure BDA0002916135550000051
对于事件在时间轴上的风控数据特征生成阶段,可以获取待评估的风控策略,可以基于该风控策略进行试运行,可以获取该试运行期间的事件产生的相关数据,此外,还可以从上述事件数据库中获取用于评估该风控策略的预定事件的相关数据,其中的预定事件的选取可以根据实际情况设定或者可以针对该风控策略所适用的事件确定等。可以将上述获取的数据作为用于评估该风控策略的历史样本数据。
在步骤S104中,基于历史样本数据对应的产生时间、历史样本数据对应的业务属性信息和历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应。
其中,业务属性信息可以是历史样本数据对应的业务的属性相关的信息,例如支付业务的历史样本数据,则其对应的业务属性信息可以包括如支付终端信息、支付通道相关信息、交易主体的信息、支付距离相关的信息、支付时间、资源存储方式信息等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,通过上述方式获取到历史样本数据后,可以对每个历史样本数据进行分析,确定该历史样本数据对应的业务,并可以获取该历史样本数据对应的业务属性信息,以及确定各个历史样本数据的产生时间(如可以通过该历史样本数据对应的事件的发生时间戳(如表1所示)确定),然后,服务器可以基于时序事件总线保障各个事件在时间轴上升序排列,同时针对时间轴上各个事件的发生顺序,依次通过上述分析结果和各个历史样本数据的内容,并使用预设的特征提取算法或特征生成算法,生成每个历史样本数据对应的风控数据特征。此外,由于每个历史样本数据均对应有产生时间,因此,生成的每个历史样本数据对应的风控数据特征也可以与历史样本数据的产生时间相对应,从而在时间轴上每个历史样本数据对应的风控数据特征也可以升序排列,基于此,可以实现时序事件在时间轴上的特征构造行为。
需要说明的是,预设的特征提取算法或特征生成算法可以用于将原始数据或原始特征转换为一组具有预定物理意义(Gabor、几何特征、纹理)或统计意义等的特征,预设的特征提取算法或特征生成算法可以包括多种,例如主成分分析算法、流形学习ManifoldLearning、黑名单或白名单等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S106中,基于历史样本数据对应的产生时间和历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
在实施中,通过上述方式得到历史样本数据对应的风控数据特征后,可以将每个风控数据特征进行向量化处理,从而将每个风控数据特征转换为相应的特征向量,然后,可以对得到的风控数据特征进行合并处理,以将同类型或指定时间段的风控数据特征进行多特征合并,得到合并后的风控数据特征以及相应的特征向量,之后,还可以对合并后的风控数据特征进行分类,基于每个类别的风控数据特征,可以使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的处理结果,由于某特征向量之间的运算与其他特征向量之间的运算是相互独立的,因此,在进行特征向量计算时,可以采用并行计算的方式,这样可以提高运算效率。通过上述处理,最终可以得到相应的风控决策结果,该风控决策结果即可以作为仿真风控处理结果。
在步骤S108中,基于预设的风控评估策略对上述仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果。
在实施中,可以根据实际情况,预选设定评估机制,可以通过该评估机制对上述仿真风控处理结果进行评估处理,例如可以对满足预设条件的仿真风控处理结果进行统计,得到相应的统计结果。可以基于该统计结果确定预设的风控策略的仿真评估结果,例如,某类型的风控数据特征的主动风险率等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
本说明书实施例提供一种风控策略的仿真评估方法,通过从事件数据库中获取用于评估预设的风控策略的历史样本数据对应的产生时间、该历史样本数据对应的业务属性信息和该历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应,并基于历史样本数据对应的产生时间和历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,这样,将整体的业务处理过程拆解为事件在时间轴上的风控数据特征生成和模拟稽核操作等两个阶段,既满足了风控数据特征仿真需要保障严格时序性的特点,又利用并行计算的方式提高了运算效率,而且,基于预设的风控评估策略对该仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果,从而通过模拟仿真并进行评估的方式提高了单机计算的效率,并解决了容量瓶颈问题。
实施例二
如图2所示,本说明书实施例提供一种风控策略的仿真评估方法,该方法的执行主体可以为服务器,其中的该服务器可以是为某项业务(如进行交易的业务或金融业务等)提供风控策略的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。该方法具体可以包括以下步骤:
在步骤S202中,从事件数据库中获取用于评估预设的风控策略的历史样本数据。
上述步骤S202的处理可以参见上述实施例一中步骤S102的相关内容,在此不再赘述。
在步骤S204中,基于历史样本数据对应的产生时间、历史样本数据对应的业务属性信息和历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应。
其中,历史样本数据对应的风控数据特征可以包括以下中的一种或多种:表征对历史样本数据中的预设类型的数据进行统计的统计类特征、表征检测历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征、表征通过预先训练的预设模型而生成的量化模型类特征。其中的类型可以根据实际情况设定,具体如支付类、即时通讯类等,该类型可以包括一种或多种。风控主体可以是用户(具体可以基于用户的标识等信息确定)、用户的账户等,此外,还可以将其它相关信息作为风控主体,具体可以根据实际情况设定。
在实施中,如图3所示,可以预先设定参数服务器,该参数服务器可以存储有或用于设定不同处理机制或模型中的指定参数。通过上述方式获取到历史样本数据后,可以对每个历史样本数据进行分析,确定该历史样本数据对应的业务属性信息,以及确定各个历史样本数据的产生时间,然后,服务器可以从参数服务器中获取用于进行数据统计机制(可以记为velocity机制,可如图3所示)的相关参数,之后,服务器可以基于时序事件总线保障各个事件在时间轴上升序排列,同时针对时间轴上各个事件的发生顺序,依次通过上述分析结果和各个历史样本数据的内容,对历史样本数据中的预设类型的数据进行统计,得到统计后的每个预设类型的历史样本数据(即可以记为velocity计算结果),可以基于上述统计后的相关数据确定表征对历史样本数据中的预设类型的数据进行统计的统计类特征。
如图3所示,服务器可以从参数服务器中获取黑名单和/或白名单中的相关参数,生成相应的黑名单和/或白名单,之后,可以通过上述分析结果和各个历史样本数据的内容,以及上述黑名单和/或白名单,判断每个历史样本数据对应的风控主体(如支付账户等)是否满足预设的黑名单中的设定条件或判断每个历史样本数据对应的风控主体是否满足预设的白名单中的设定条件等,最终可以得到每个历史样本数据对应的判断结果,可以基于每个历史样本数据对应的判断结果确定表征检测历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征。
如图3所示,还可以预先训练用于获取数据特征的模型(可以记为量化模型),该模型可以包括多种,本说明书实施例中上述预先训练的模型可以包括一个,也可以包括多个,具体可以根据实际情况设定。此外,服务器也可以从参数服务器中获取各个量化模型的相关参数,生成相应的量化模型,之后,可以将上述分析结果和/或各个历史样本数据的内容输入到上述训练的模型或上述生成的量化模型中,通过上述模型可以得到历史样本数据对应的输出结果,可以基于历史样本数据对应的输出结果确定表征通过预先训练的预设模型而生成的量化模型类特征。
通过上述处理可以分别得到velocity计算结果、黑名单和/或白名单的命中结果和量化模型计算结果,可以将上述得到的结果作为风控数据特征,则上述表1所示的对应关系可以变为如表2所示的对应关系。
表2
Figure BDA0002916135550000091
需要说明的是,在实际应用中还可以包括多种不同类型的特征,相应类型的特征的获取方式可以针对不同的特征设定,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S206中,对上述历史样本数据对应的风控数据特征进行分类,并使用特征向量计算的方式对每个类别中的风控数据特征进行合并处理,得到多个不同类别的风控数据特征。
在实施中,对上述历史样本数据对应的风控数据特征进行分类可以包括多种不同的实现方式,例如基于风控数据特征和相应的历史样本数据的内容进行分析(具体如通过其内容中包含的关键词进行分类等),或者,可以通过指定算法进行分类等,具体可以根据实际情况设定。如图3所示,服务器也可以从参数服务器中获取预先设定的profile机制的相关参数,生成相应的预先设定的profile机制,之后,可以基于预先设定的profile机制中的多特征合并运算逻辑对每个类别中的风控数据特征进行合并处理,以将同一类别的风控数据特征存储在一个集合中,并可以对每个集合中的风控数据特征,使用特征向量计算的方式进行特征合并,最终可以得到多个不同类别的风控数据特征。
在实际应用中,对历史样本数据对应的风控数据特征进行分类可以包括多种实现方式,以下提供一种可选的实现方式,具体可以包括以下内容:基于预设的分类模型对历史样本数据对应的风控数据特征进行分类。
其中,分类模型可以包括多种,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S208中,基于预设的决策树模型,并使用特征向量计算的方式对多个不同类别的风控数据特征进行合并处理,得到相应的决策树处理结果。
其中,决策树模型可以包括多种,例如二分类决策树或多分类决策树等。
在实施中,服务器也可以从参数服务器中获取预设的决策树模型的相关参数,生成相应的决策树模型,之后,可以基于预设的决策树模型,并使用特征向量计算的方式对多个不同类别的风控数据特征进行合并处理,以实现对多类风险的合并,最终可以得到相应的决策树处理结果。
在步骤S210中,基于上述历史样本数据对应的产生时间和决策树处理结果,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
在步骤S212中,基于预设的风控评估策略对上述仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果。
在实施中,服务器也可以从参数服务器中获取预设的评估机制的相关参数,生成相应的评估机制,之后,可以通过该评估机制对上述仿真风控处理结果进行全局统计评估,得到预设的风控策略的仿真评估结果。
在步骤S214中,基于预设的风控策略的仿真评估结果,生成该风控策略的性能报告。
其中,风控策略的性能报告中可以包括以下信息中的一项或多项:模拟预设的风控策略进行仿真风控处理的时间区间、历史样本数据对应的风控数据特征的类型、主动风险率、稽核增量、模拟预设的风控策略进行仿真风控处理的过程中涉及的参数信息。其中的模拟预设的风控策略进行仿真风控处理的时间区间可以由历史样本数据对应的产生时间确定。
在步骤S216中,基于上述风控策略的性能报告,对预设的风控策略中的第一预设参数进行调整。
其中,第一预设参数可以为任意参数,具体可以根据实际情况设定,本说明书实施例对此不做限定。
针对上述步骤S216的处理,以及上述决策树模型和分类模型的相关内容,上述步骤S216的处理还可以包括:基于上述风控策略的性能报告,对决策树模型中的第二预设参数进行调整;和/或,基于上述风控策略的性能报告,对上述分类模型中的第三预设参数进行调整。在实际应用中,还可以通过上述风控策略的性能报告对参数服务器中存储的其它参数进行调整,具体可以根据实际情况设定,本说明书实施例对此不做限定。
基于上述处理过程,在实际应用中,读取历史积累的全量历史样本数据,在python3且单机1core-1.8GHz环境下,每秒可以完成2万笔流量的仿真稽核处理,基于线上正式运行时得到的结果数据,进行了“仿真-真实”稽核结果比对,仿真稽核处理得到的结果的总体偏离率低于万分之一,且在小时内完成了200组风控参数/风控数据特征组合的风控性能测算,相比试运行模式下,模拟评估方案提效两个数量级以上。
本说明书实施例提供一种风控策略的仿真评估方法,通过从事件数据库中获取用于评估预设的风控策略的历史样本数据对应的产生时间、该历史样本数据对应的业务属性信息和该历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应,并基于历史样本数据对应的产生时间和历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,这样,将整体的业务处理过程拆解为事件在时间轴上的风控数据特征生成和模拟稽核操作等两个阶段,既满足了风控数据特征仿真需要保障严格时序性的特点,又利用并行计算的方式提高了运算效率,而且,基于预设的风控评估策略对该仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果,从而通过模拟仿真并进行评估的方式提高了单机计算的效率,并解决了容量瓶颈问题。
此外,通过构建风控策略离线仿真方案,通过模拟velocity机制、黑名单和/或白名单、量化模型等元算子在风控事件流上的行为,使得风控策略上线前可全方位评估风险增量,并可以优化参数组合。
实施例三
以上为本说明书实施例提供的风控策略的仿真评估方法,基于同样的思路,本说明书实施例还提供一种风控策略的仿真评估装置,如图4所示。
该风控策略的仿真评估装置包括:历史样本获取模块401、特征生成模块402、模拟仿真模块403和仿真评估模块404,其中:
历史样本获取模块401,从事件数据库中获取用于评估预设的风控策略的历史样本数据;
特征生成模块402,基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
模拟仿真模块403,基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
仿真评估模块404,基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
本说明书实施例中,所述历史样本数据对应的风控数据特征包括以下中的一种或多种:表征对所述历史样本数据中的预设类型的数据进行统计的统计类特征、表征检测所述历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征、表征通过预先训练的预设模型而生成的量化模型类特征。
本说明书实施例中,所述模拟仿真模块403,包括:
分类单元,对所述历史样本数据对应的风控数据特征进行分类,并使用特征向量计算的方式对每个类别中的所述风控数据特征进行合并处理,得到多个不同类别的风控数据特征;
决策树单元,基于预设的决策树模型,并使用特征向量计算的方式对所述多个不同类别的风控数据特征进行合并处理,得到相应的决策树处理结果;
模拟仿真单元,基于所述历史样本数据对应的产生时间和所述决策树处理结果,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
本说明书实施例中,所述装置还包括:
性能分析模块,基于所述预设的风控策略的仿真评估结果,生成所述风控策略的性能报告。
本说明书实施例中,所述风控策略的性能报告中包括以下信息中的一项或多项:模拟预设的风控策略进行仿真风控处理的时间区间、所述历史样本数据对应的风控数据特征的类型、主动风险率、稽核增量、模拟预设的风控策略进行仿真风控处理的过程中涉及的参数信息。
本说明书实施例中,所述模拟预设的风控策略进行仿真风控处理的时间区间由所述历史样本数据对应的产生时间确定。
本说明书实施例中,所述装置还包括:
第一参数调整模块,基于所述风控策略的性能报告,对所述预设的风控策略中的第一预设参数进行调整。
本说明书实施例中,所述分类单元,基于预设的分类模型对所述历史样本数据对应的风控数据特征进行分类;
所述装置还包括:
第二参数调整模块,基于所述风控策略的性能报告,对所述决策树模型中的第二预设参数进行调整;和/或,
第三参数调整模块,基于所述风控策略的性能报告,对所述分类模型中的第三预设参数进行调整。
本说明书实施例提供一种风控策略的仿真评估装置,通过从事件数据库中获取用于评估预设的风控策略的历史样本数据对应的产生时间、该历史样本数据对应的业务属性信息和该历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应,并基于历史样本数据对应的产生时间和历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,这样,将整体的业务处理过程拆解为事件在时间轴上的风控数据特征生成和模拟稽核操作等两个阶段,既满足了风控数据特征仿真需要保障严格时序性的特点,又利用并行计算的方式提高了运算效率,而且,基于预设的风控评估策略对该仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果,从而通过模拟仿真并进行评估的方式提高了单机计算的效率,并解决了容量瓶颈问题。
此外,通过构建风控策略离线仿真方案,通过模拟velocity机制、黑名单和/或白名单、量化模型等元算子在风控事件流上的行为,使得风控策略上线前可全方位评估风险增量,并可以优化参数组合。
实施例四
以上为本说明书实施例提供的风控策略的仿真评估装置,基于同样的思路,本说明书实施例还提供一种风控策略的仿真评估设备,如图5所示。
风控策略的仿真评估设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对风控策略的仿真评估设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在风控策略的仿真评估设备上执行存储器502中的一系列计算机可执行指令。风控策略的仿真评估设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506。
具体在本实施例中,风控策略的仿真评估设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对风控策略的仿真评估设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
从事件数据库中获取用于评估预设的风控策略的历史样本数据;
基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
本说明书实施例中,所述历史样本数据对应的风控数据特征包括以下中的一种或多种:表征对所述历史样本数据中的预设类型的数据进行统计的统计类特征、表征检测所述历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征、表征通过预先训练的预设模型而生成的量化模型类特征。
本说明书实施例中,所述基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,包括:
对所述历史样本数据对应的风控数据特征进行分类,并使用特征向量计算的方式对每个类别中的所述风控数据特征进行合并处理,得到多个不同类别的风控数据特征;
基于预设的决策树模型,并使用特征向量计算的方式对所述多个不同类别的风控数据特征进行合并处理,得到相应的决策树处理结果;
基于所述历史样本数据对应的产生时间和所述决策树处理结果,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
本说明书实施例中,还包括:
基于所述预设的风控策略的仿真评估结果,生成所述风控策略的性能报告。
本说明书实施例中,所述风控策略的性能报告中包括以下信息中的一项或多项:模拟预设的风控策略进行仿真风控处理的时间区间、所述历史样本数据对应的风控数据特征的类型、主动风险率、稽核增量、模拟预设的风控策略进行仿真风控处理的过程中涉及的参数信息。
本说明书实施例中,所述模拟预设的风控策略进行仿真风控处理的时间区间由所述历史样本数据对应的产生时间确定。
本说明书实施例中,还包括:
基于所述风控策略的性能报告,对所述预设的风控策略中的第一预设参数进行调整。
本说明书实施例中,所述对所述历史样本数据对应的风控数据特征进行分类,包括:
基于预设的分类模型对所述历史样本数据对应的风控数据特征进行分类;
还包括:
基于所述风控策略的性能报告,对所述决策树模型中的第二预设参数进行调整;和/或,
基于所述风控策略的性能报告,对所述分类模型中的第三预设参数进行调整。
本说明书实施例提供一种风控策略的仿真评估设备,通过从事件数据库中获取用于评估预设的风控策略的历史样本数据对应的产生时间、该历史样本数据对应的业务属性信息和该历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应,并基于历史样本数据对应的产生时间和历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,这样,将整体的业务处理过程拆解为事件在时间轴上的风控数据特征生成和模拟稽核操作等两个阶段,既满足了风控数据特征仿真需要保障严格时序性的特点,又利用并行计算的方式提高了运算效率,而且,基于预设的风控评估策略对该仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果,从而通过模拟仿真并进行评估的方式提高了单机计算的效率,并解决了容量瓶颈问题。
此外,通过构建风控策略离线仿真方案,通过模拟velocity机制、黑名单和/或白名单、量化模型等元算子在风控事件流上的行为,使得风控策略上线前可全方位评估风险增量,并可以优化参数组合。
实施例五
进一步地,基于上述图1或2所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
从事件数据库中获取用于评估预设的风控策略的历史样本数据;
基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
本说明书实施例中,所述历史样本数据对应的风控数据特征包括以下中的一种或多种:表征对所述历史样本数据中的预设类型的数据进行统计的统计类特征、表征检测所述历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征、表征通过预先训练的预设模型而生成的量化模型类特征。
本说明书实施例中,所述基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,包括:
对所述历史样本数据对应的风控数据特征进行分类,并使用特征向量计算的方式对每个类别中的所述风控数据特征进行合并处理,得到多个不同类别的风控数据特征;
基于预设的决策树模型,并使用特征向量计算的方式对所述多个不同类别的风控数据特征进行合并处理,得到相应的决策树处理结果;
基于所述历史样本数据对应的产生时间和所述决策树处理结果,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
本说明书实施例中,还包括:
基于所述预设的风控策略的仿真评估结果,生成所述风控策略的性能报告。
本说明书实施例中,所述风控策略的性能报告中包括以下信息中的一项或多项:模拟预设的风控策略进行仿真风控处理的时间区间、所述历史样本数据对应的风控数据特征的类型、主动风险率、稽核增量、模拟预设的风控策略进行仿真风控处理的过程中涉及的参数信息。
本说明书实施例中,所述模拟预设的风控策略进行仿真风控处理的时间区间由所述历史样本数据对应的产生时间确定。
本说明书实施例中,还包括:
基于所述风控策略的性能报告,对所述预设的风控策略中的第一预设参数进行调整。
本说明书实施例中,所述对所述历史样本数据对应的风控数据特征进行分类,包括:
基于预设的分类模型对所述历史样本数据对应的风控数据特征进行分类;
还包括:
基于所述风控策略的性能报告,对所述决策树模型中的第二预设参数进行调整;和/或,
基于所述风控策略的性能报告,对所述分类模型中的第三预设参数进行调整。
本说明书实施例提供一种存储介质,通过从事件数据库中获取用于评估预设的风控策略的历史样本数据对应的产生时间、该历史样本数据对应的业务属性信息和该历史样本数据的内容,生成历史样本数据对应的风控数据特征,且该风控数据特征与历史样本数据对应的产生时间相对应,并基于历史样本数据对应的产生时间和历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,这样,将整体的业务处理过程拆解为事件在时间轴上的风控数据特征生成和模拟稽核操作等两个阶段,既满足了风控数据特征仿真需要保障严格时序性的特点,又利用并行计算的方式提高了运算效率,而且,基于预设的风控评估策略对该仿真风控处理结果进行评估处理,得到预设的风控策略的仿真评估结果,从而通过模拟仿真并进行评估的方式提高了单机计算的效率,并解决了容量瓶颈问题。
此外,通过构建风控策略离线仿真方案,通过模拟velocity机制、黑名单和/或白名单、量化模型等元算子在风控事件流上的行为,使得风控策略上线前可全方位评估风险增量,并可以优化参数组合。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (15)

1.一种风控策略的仿真评估方法,所述方法包括:
从事件数据库中获取用于评估预设的风控策略的历史样本数据;
基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
2.根据权利要求1所述的方法,所述历史样本数据对应的风控数据特征包括以下中的一种或多种:表征对所述历史样本数据中的预设类型的数据进行统计的统计类特征、表征检测所述历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征、表征通过预先训练的预设模型而生成的量化模型类特征。
3.根据权利要求1所述的方法,所述基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果,包括:
对所述历史样本数据对应的风控数据特征进行分类,并使用特征向量计算的方式对每个类别中的所述风控数据特征进行合并处理,得到多个不同类别的风控数据特征;
基于预设的决策树模型,并使用特征向量计算的方式对所述多个不同类别的风控数据特征进行合并处理,得到相应的决策树处理结果;
基于所述历史样本数据对应的产生时间和所述决策树处理结果,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
4.根据权利要求3所述的方法,所述方法还包括:
基于所述预设的风控策略的仿真评估结果,生成所述风控策略的性能报告。
5.根据权利要求4所述的方法,所述风控策略的性能报告中包括以下信息中的一项或多项:模拟预设的风控策略进行仿真风控处理的时间区间、所述历史样本数据对应的风控数据特征的类型、主动风险率、稽核增量、模拟预设的风控策略进行仿真风控处理的过程中涉及的参数信息。
6.根据权利要求5所述的方法,所述模拟预设的风控策略进行仿真风控处理的时间区间由所述历史样本数据对应的产生时间确定。
7.根据权利要求4所述的方法,所述方法还包括:
基于所述风控策略的性能报告,对所述预设的风控策略中的第一预设参数进行调整。
8.根据权利要求4所述的方法,所述对所述历史样本数据对应的风控数据特征进行分类,包括:
基于预设的分类模型对所述历史样本数据对应的风控数据特征进行分类;
所述方法还包括:
基于所述风控策略的性能报告,对所述决策树模型中的第二预设参数进行调整;和/或,
基于所述风控策略的性能报告,对所述分类模型中的第三预设参数进行调整。
9.一种风控策略的仿真评估装置,所述装置包括:
历史样本获取模块,从事件数据库中获取用于评估预设的风控策略的历史样本数据;
特征生成模块,基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
模拟仿真模块,基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
仿真评估模块,基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
10.根据权利要求9所述的装置,所述历史样本数据对应的风控数据特征包括以下中的一种或多种:表征对所述历史样本数据中的预设类型的数据进行统计的统计类特征、表征检测所述历史样本数据对应的风控主体是否满足预设条件的黑白名单类特征、表征通过预先训练的预设模型而生成的量化模型类特征。
11.根据权利要求9所述的装置,所述模拟仿真模块,包括:
分类单元,对所述历史样本数据对应的风控数据特征进行分类,并使用特征向量计算的方式对每个类别中的所述风控数据特征进行合并处理,得到多个不同类别的风控数据特征;
决策树单元,基于预设的决策树模型,并使用特征向量计算的方式对所述多个不同类别的风控数据特征进行合并处理,得到相应的决策树处理结果;
模拟仿真单元,基于所述历史样本数据对应的产生时间和所述决策树处理结果,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果。
12.根据权利要求11所述的装置,所述装置还包括:
性能分析模块,基于所述预设的风控策略的仿真评估结果,生成所述风控策略的性能报告。
13.根据权利要求12所述的装置,所述风控策略的性能报告中包括以下信息中的一项或多项:模拟预设的风控策略进行仿真风控处理的时间区间、所述历史样本数据对应的风控数据特征的类型、主动风险率、稽核增量、模拟预设的风控策略进行仿真风控处理的过程中涉及的参数信息。
14.一种风控策略的仿真评估设备,所述风控策略的仿真评估设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
从事件数据库中获取用于评估预设的风控策略的历史样本数据;
基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
15.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
从事件数据库中获取用于评估预设的风控策略的历史样本数据;
基于所述历史样本数据对应的产生时间、所述历史样本数据对应的业务属性信息和所述历史样本数据的内容,生成所述历史样本数据对应的风控数据特征,且所述风控数据特征与所述历史样本数据对应的产生时间相对应;
基于所述历史样本数据对应的产生时间和所述历史样本数据对应的风控数据特征,使用特征向量计算的方式,并模拟预设的风控策略进行仿真风控处理,得到相应的仿真风控处理结果;
基于预设的风控评估策略对所述仿真风控处理结果进行评估处理,得到所述预设的风控策略的仿真评估结果。
CN202110102404.1A 2021-01-26 2021-01-26 一种风控策略的仿真评估方法、装置及设备 Active CN112784420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110102404.1A CN112784420B (zh) 2021-01-26 2021-01-26 一种风控策略的仿真评估方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110102404.1A CN112784420B (zh) 2021-01-26 2021-01-26 一种风控策略的仿真评估方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112784420A true CN112784420A (zh) 2021-05-11
CN112784420B CN112784420B (zh) 2022-09-02

Family

ID=75757751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110102404.1A Active CN112784420B (zh) 2021-01-26 2021-01-26 一种风控策略的仿真评估方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112784420B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114612011A (zh) * 2022-04-20 2022-06-10 京东科技控股股份有限公司 一种风险防控决策方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305158A (zh) * 2017-12-27 2018-07-20 阿里巴巴集团控股有限公司 一种训练风控模型和风控的方法、装置及设备
CN109767110A (zh) * 2019-01-04 2019-05-17 中国银行股份有限公司 一种风险控制系统优化方法、装置、设备及存储介质
WO2019143542A1 (en) * 2018-01-21 2019-07-25 Microsoft Technology Licensing, Llc Time-weighted risky code prediction
CN110443618A (zh) * 2019-07-10 2019-11-12 阿里巴巴集团控股有限公司 风控策略的生成方法及装置
CN110633989A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种风险行为生成模型的确定方法及装置
CN110728458A (zh) * 2019-10-18 2020-01-24 支付宝(杭州)信息技术有限公司 一种目标对象的风险监测方法、装置及电子设备
CN111782637A (zh) * 2020-07-03 2020-10-16 支付宝(杭州)信息技术有限公司 一种模型构建方法、装置及设备
CN112016788A (zh) * 2020-07-14 2020-12-01 北京淇瑀信息科技有限公司 风险控制策略生成及风险控制方法、装置和电子设备
CN112101520A (zh) * 2020-08-10 2020-12-18 中国平安人寿保险股份有限公司 风险评估模型训练方法、业务风险评估方法及其他设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305158A (zh) * 2017-12-27 2018-07-20 阿里巴巴集团控股有限公司 一种训练风控模型和风控的方法、装置及设备
US20200211106A1 (en) * 2017-12-27 2020-07-02 Alibaba Group Holding Limited Method, apparatus, and device for training risk management models
WO2019143542A1 (en) * 2018-01-21 2019-07-25 Microsoft Technology Licensing, Llc Time-weighted risky code prediction
CN109767110A (zh) * 2019-01-04 2019-05-17 中国银行股份有限公司 一种风险控制系统优化方法、装置、设备及存储介质
CN110443618A (zh) * 2019-07-10 2019-11-12 阿里巴巴集团控股有限公司 风控策略的生成方法及装置
CN110633989A (zh) * 2019-08-16 2019-12-31 阿里巴巴集团控股有限公司 一种风险行为生成模型的确定方法及装置
CN110728458A (zh) * 2019-10-18 2020-01-24 支付宝(杭州)信息技术有限公司 一种目标对象的风险监测方法、装置及电子设备
CN111782637A (zh) * 2020-07-03 2020-10-16 支付宝(杭州)信息技术有限公司 一种模型构建方法、装置及设备
CN112016788A (zh) * 2020-07-14 2020-12-01 北京淇瑀信息科技有限公司 风险控制策略生成及风险控制方法、装置和电子设备
CN112101520A (zh) * 2020-08-10 2020-12-18 中国平安人寿保险股份有限公司 风险评估模型训练方法、业务风险评估方法及其他设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114612011A (zh) * 2022-04-20 2022-06-10 京东科技控股股份有限公司 一种风险防控决策方法及装置

Also Published As

Publication number Publication date
CN112784420B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN108629687B (zh) 一种反洗钱方法、装置及设备
US10649882B2 (en) Automated log analysis and problem solving using intelligent operation and deep learning
US11132624B2 (en) Model integration method and device
CN110472802B (zh) 一种数据特征评估方法、装置及设备
CN110674188A (zh) 一种特征提取方法、装置及设备
CN110069545B (zh) 一种行为数据评估方法及装置
CN110633989A (zh) 一种风险行为生成模型的确定方法及装置
CN109003091A (zh) 一种风险防控处理方法、装置及设备
CN111782637A (zh) 一种模型构建方法、装置及设备
CN110634030A (zh) 应用的业务指标挖掘方法、装置及设备
CN111967940B (zh) 一种订单量异常检测方法及装置
CN112966113A (zh) 一种数据的风险防控方法、装置及设备
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN114240101A (zh) 一种风险识别模型的验证方法、装置以及设备
CN112199416A (zh) 数据规则生成方法及装置
CN108229564B (zh) 一种数据的处理方法、装置及设备
CN112784420B (zh) 一种风控策略的仿真评估方法、装置及设备
CN110263817B (zh) 一种基于用户账号的风险等级划分方法及装置
CN110033092B (zh) 数据标签生成、模型训练、事件识别方法和装置
CN113379528A (zh) 风控模型建立方法、装置和风险控制方法
CN111259975B (zh) 分类器的生成方法及装置、文本的分类方法及装置
CN113761193A (zh) 日志分类方法、装置、计算机设备和存储介质
CN108446738A (zh) 一种聚类方法、装置及电子设备
CN115408449B (zh) 一种用户行为的处理方法、装置及设备
CN115456801A (zh) 个人信用的人工智能大数据风控系统、方法和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant