发明内容
本说明书提供了一种风险控制方法及其系统,可以兼顾风险覆盖的全面性和风险业务的前瞻性。
本申请公开了一种风险控制方法,包括:
选取风险特征并相互组合形成风险特征网格;
计算所述风险特征网格中各个单元格的非风险行为概率和初始风险行为概率,结合从输入装置得到的输入信息和计算所得的初始风险概率,计算所述各个单元格的修正后风险行为概率;
根据所述非风险行为概率和所述修正后风险行为概率计算所述各个单元格的风险控制等级。
在一个优选例中,所述计算所述各个单元格的风险控制等级之后,还包括:
根据所述风险控制等级确定对应的风险控制操作。
在一个优选例中,所述选取风险特征并相互组合形成风险特征网格,进一步包括:
选取风险控制的至少一个风险特征;
对每个风险特征进行离散化处理得到多个枚举值,其中每个所述枚举值对风险具备区分能力;
对各个风险特征的各个枚举值进行组合,得到所述风险特征网格,其中每一种组合作为所述风险特征网格的一个单元格。
在一个优选例中,所述计算所述风险特征网格中各个单元格的非风险行为概率和初始风险行为概率,进一步包括:
选取当前时间点之前的一段时间,根据是否发生风险确定该时间段的风险样本和非风险样本;
根据所述时间段的风险特征网格,统计得到该风险特征网格的各单元格的风险样本数量和非风险样本数量;
对于每个所述单元格,将该单元格的非风险样本数量除以全部样本数量,得到该单元格的非风险行为概率,将该单元格的风险样本数量除以全部样本数量,得到该单元格的初始风险行为概率。
在一个优选例中,所述结合从输入装置得到的输入信息和计算所得的初始风险概率,计算所述各个单元格的修正后风险行为概率,进一步包括:
基于所述时间段中的数据,统计同一个主体在任意两个单元格之间的转移概率;
根据从所述输入装置得到的输入对所述转移概率进行修正,得到修正后的转移概率;
对于每一个单元格,分别将每一个其他单元格的初始风险概率乘以该其他单元格转移到该单元格的转移概率,在所得的各个乘积和该单元格的初始风险概率中取最大值,作为该单元格的修正后风险行为概率。
在一个优选例中,所述主体包括账号或银行卡号。
在一个优选例中,所述根据所述非风险行为概率和所述修正后风险行为概率计算所述各个单元格的风险控制等级,进一步包括:
对于每一个所述单元格,使用非风险行为概率除以非风险行为概率与修正后风险行为概率的和,得到该单元格的风险概率;
根据每一个所述单元格的风险概率,得到该单元格的风险等级。
本申请还公开了一种风险控制系统包括:
网络形成模块,用于选取风险特征并相互组合形成风险特征网格;
输入装置,用于从外部获得输入信息;
概率计算模块,用于计算所述风险特征网格中各个单元格的非风险行为概率和初始风险行为概率;
修正模块,用于结合从所述输入模块得到的输入信息和所述概率计算模块计算所得的初始风险概率,计算所述各个单元格的修正后风险行为概率;
等级确定模块,根据所述非风险行为概率和所述修正后风险行为概率计算所述各个单元格的风险控制等级。
在一个优选例中,还包括:
操作确定模块,用于根据所述风险控制等级确定对应的风险控制操作。
在一个优选例中,所述网络形成模块进一步包括:
特征选取子模块,用于选取风险控制的至少一个风险特征;
离散化子模块,用于对每个风险特征进行离散化处理得到多个枚举值,其中每个所述枚举值对风险具备区分能力;
组合子模块,用于对各个风险特征的各个枚举值进行组合,得到所述风险特征网格,其中每一种组合作为所述风险特征网格的一个单元格。
在一个优选例中,所述概率计算模块进一步包括:
样本确定子模块,用于选取当前时间点之前的一段时间,根据是否发生风险确定该时间段的风险样本和非风险样本;
样本数量统计模块,用于根据所述时间段的风险特征网格,统计得到该风险特征网格的各单元格的风险样本数量和非风险样本数量;
初始风险计算子模块,用于对于每个所述单元格,将该单元格的非风险样本数量除以全部样本数量,得到该单元格的非风险行为概率,将该单元格的风险样本数量除以全部样本数量,得到该单元格的初始风险行为概率。
在一个优选例中,所述修正模块进一步包括:
转移概率计算子模块,用于基于所述时间段中的数据,统计同一个主体在任意两个单元格之间的转移概率;
转移概率修正子模块,根据从所述输入装置得到的输入对所述转移概率进行修正,得到修正后的转移概率;
风险行为概率修正子模块,用于对于每一个单元格,分别将每一个其他单元格的初始风险概率乘以该其他单元格转移到该单元格的转移概率,在该单元格的初始风险概率和所得的各个乘积中取最大值,作为该单元格的修正后风险行为概率。
在一个优选例中,所述主体包括账号或银行卡号。
在一个优选例中,所述等级确定模块进一步包括:
风险概率计算子模块,用于对于每一个所述单元格,使用非风险行为概率除以非风险行为概率与修正后风险行为概率的和,得到该单元格的风险概率;
等级划分子模块,用于根据每一个所述单元格的风险概率,得到该单元格的风险等级。
本申请还公开了一种风险控制系统包括:
存储器,用于存储计算机可执行指令;以及,
处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本说明书实施方式中,将非风险行为概率和风险行为概率拆分开,通过数据自动计算非风险行为概率,然后结合风险形势和人工经验计算风险行为概率,结合非风险行为概率和风险行为概率计算得到风险等级,最后基于风险等级执行后续的风险控制操作,从而能够达到以下技术效果:
(1)保障准确率:非风险行为概率和风险行为概率计算中都使用到了大数据行为数据,更加客观准确;
(2)保障前瞻性:基于风险分析师的经验对风险行为概率进行修正,对风险转移和新的风险手法有较好的适应性;
(3)运营方便:基于大数据的模块都可以自动迭代更新,只需要风险分析师维护更新风险行为概率模块即可。
本说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本说明书上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
下面将结合附图对本说明书的实施方式作进一步地详细描述。
本说明书的第一实施方式涉及一种风险控制方法,其流程如图1所示,该方法包括以下步骤:
在步骤102中,选取风险特征并相互组合形成风险特征网格。
在一个实施例中,步骤102可以进一步包括:选取风险控制的至少一个风险特征。对每个风险特征进行离散化处理得到多个枚举值,其中每个枚举值对风险具备区分能力。对各个风险特征的各个枚举值进行组合,得到风险特征网格,其中每一种组合作为风险特征网格的一个单元格。
此后进入步骤104,计算风险特征网格中各个单元格的非风险行为概率和初始风险行为概率,结合从输入装置得到的输入信息和计算所得的初始风险概率,计算各个单元格的修正后风险行为概率。其中,输入装置可以是键盘、鼠标、轨迹球、触摸屏、语音输入装置等等。在一个实施例中,输入信息的代表含义可以是:风险分析师基于对业务的理解,判断风险行为转移的成本,而对转移概率进行的修正。
此后进入步骤106,根据非风险行为概率和修正后风险行为概率计算各个单元格的风险控制等级。在一个实施例中,对于每一个单元格,计算非风险行为概率与修正后风险行为概率的和值,使用非风险行为概率除以该和值,得到该单元格的风险概率。根据每一个单元格的风险概率,得到该单元格的风险等级,例如可以设置多个阈值,根据这些阈值确定不同的风险等级。
可选地,在步骤106之后,还可以根据风险控制等级确定对应的风险控制操作。风险控制操作可以是多种多样的。可选地,风险控制操作可以是停止账户的支付。可选地,风险控制操作可以是发送短信通知账户的用户。可选地,风险控制操作可以是触发身份核实操作,例如人脸认证、指纹认证、电话号码认证等。
在一个实施例中,可以通过以下方式实现步骤104中计算风险特征网格中各个单元格的非风险行为概率和初始风险行为概率。具体地说:
选取当前时间点之前的一段时间,根据是否发生风险确定该时间段的风险样本和非风险样本。
根据时间段的风险特征网格,统计得到该风险特征网格的各单元格的风险样本数量和非风险样本数量。
对于每个单元格,将该单元格的非风险样本数量除以全部样本数量,得到该单元格的非风险行为概率,将该单元格的风险样本数量除以全部样本数量,得到该单元格的初始风险行为概率。
在一个实施例中,可以通过以下方式实现步骤104中结合从输入装置得到的输入信息和计算所得的初始风险概率,计算各个单元格的修正后风险行为概率。具体地说:
基于时间段中的数据,计算同一个主体在任意两个单元格之间转移的转移概率(或者说从一个单元格转移到另一个单元格的转移概率)。主体是风险发生的对象,可以是账号或银行卡号等等。
根据从输入装置得到的输入对转移概率进行修正,得到修正后的转移概率。
对于每一个单元格,分别将每一个其他单元格的初始风险概率乘以该其他单元格转移到该单元格的转移概率,在所得的各个乘积和该单元格的初始风险概率中取最大值,作为该单元格的修正后风险行为概率。例如,如果总共有N个单元格,N为大于1的整数,那么对于任意一个单元格X,可以将某一个其他单元格Y的初始风险概率乘以单元格Y到单元格X的转移概率,得到一个乘积。因为其他单元格有N-1个,所以总共可以得到N-1个乘积,在这N-1个乘积和单元格X的初始风险概率(总共N个值)中取最大值,该最大值就是单元格X的修正后风险行为概率。分别对每一个单元格都进行与单元格X一样的操作,可以得到每一个单元格的修正后风险行为概率。
本领域的技术人员可以知道,对于非风险行为概率、转移概率、风险行为概率的计算具体执行上可以采用不同的计算函数。
为了能够更好地理解本说明书的技术方案,下面结合一个具体的例子来进行说明,该例子中罗列的细节主要是为了便于理解,不作为对本申请保护范围的限制。
步骤一、选取关键风险特征,并相互组合形成风险特征网格。其中具体包括:
1.选取风险控制的若干个关键风险特征。关键风险特征就是对风险控制起到显著作用的特征,可以根据经验或历史数据的统计结果得到。
2.结合风险分析,对每个关键风险特征进行离散化处理,每个枚举值对风险具备一定的区分能力。
3.对每个风险特征的每个枚举值进行组合,得到风险特征网格,每种组合称作一个单元格。
步骤二、通过数据自动计算各单元格的非风险行为概率。其中具体包括:
1.选取在当前时间点之前的一段时间,根据是否发生风险确定这段时间的风险样本和非风险样本。
2.根据这段时间的风险特征网格,计算得到每个单元格的风险样本数量和非风险样本数量。
3.第i个单元格的非风险行为概率ai=第i个单元格的非风险样本数量/全部样本数量。
步骤三、结合风险形势和人工经验计算各单元格的风险行为概率。其中具体包括:
1.第i个单元格的风险行为初始概率bi=第i个单元格的风险样本数量/全部样本数量。
2.基于选取的这段时间的数据(包含风险和非风险),计算同一个主体从第j个单元格转移到第i个单元格的转移概率cji。
3.风险分析师基于业务理解,判断风险行为转移的成本,对于转移概率进行修正,得到修正后的转移概率tji。
4.计算第i个单元格的修正后风险行为概率pi=max(bi,max(bj·tji))。该公式的含义是对将bj和tji相乘,得到若干个乘积,分别代表其他单元格的风险转移到第i个单元格的风险行为概率,在这些乘积中取最大值,将这个最大值和bi比较,取两者中的最大值作为修正后风险行为概率。
步骤四、结合非风险行为概率和风险行为概率计算得到各单元格的风险等级。其中具体包括:计算第i个单元格的风险概率ri=pi/(ai+pi),然后基于风险概率切分阈值确定风险等级,输出对应不同的风险控制动作。
其他可用的风险概率公式包括ri=pi 2/(ai 2+pi 2);ri=1/(1+exp(-pi/(ai+pi))),其中exp表示以e为底的指数等。
本说明书的第二实施方式涉及一种风险控制系统,其结构如图2所示,该风险控制系统包括:
网络形成模块,用于选取风险特征并相互组合形成风险特征网格。
输入装置,用于从外部获得输入信息。其中,输入装置可以是键盘、鼠标、轨迹球、触摸屏、语音输入装置等等。
概率计算模块,用于计算风险特征网格中各个单元格的非风险行为概率和初始风险行为概率。
修正模块,用于结合从输入模块得到的输入信息和概率计算模块计算所得的初始风险概率,计算各个单元格的修正后风险行为概率。
等级确定模块,根据非风险行为概率和修正后风险行为概率计算各个单元格的风险控制等级。
操作确定模块,用于根据风险控制等级确定对应的风险控制操作。该模块是可选的。
在一个实施例中,网络形成模块可以进一步包括:特征选取子模块,用于选取风险控制的至少一个风险特征。离散化子模块,用于对每个风险特征进行离散化处理得到多个枚举值,其中每个枚举值对风险具备区分能力。组合子模块,用于对各个风险特征的各个枚举值进行组合,得到风险特征网格,其中每一种组合作为风险特征网格的一个单元格。
在一个实施例中,概率计算模块可以进一步包括:样本确定子模块,用于选取当前时间点之前的一段时间,根据是否发生风险确定该时间段的风险样本和非风险样本。样本数量统计模块,用于根据时间段的风险特征网格,统计得到该风险特征网格的各单元格的风险样本数量和非风险样本数量。初始风险计算子模块,用于对于每个单元格,将该单元格的非风险样本数量除以全部样本数量,得到该单元格的非风险行为概率,将该单元格的风险样本数量除以全部样本数量,得到该单元格的初始风险行为概率。
在一个实施例中,修正模块可以进一步包括:转移概率计算子模块,用于基于时间段中的数据,统计同一个主体在任意两个单元格之间的转移概率。转移概率修正子模块,根据从输入装置得到的输入对转移概率进行修正,得到修正后的转移概率。风险行为概率修正子模块,用于对于每一个单元格,分别将每一个其他单元格的初始风险概率乘以该其他单元格转移到该单元格的转移概率,在所得的各个乘积和该单元格的初始风险概率中取最大值,作为该单元格的修正后风险行为概率。主体可以是账号或银行卡号等。
在一个实施例中,等级确定模块可以进一步包括:风险概率计算子模块,用于对于每一个单元格,使用非风险行为概率除以非风险行为概率与修正后风险行为概率的和,得到该单元格的风险概率。等级划分子模块,用于根据每一个单元格的风险概率,得到该单元格的风险等级。
第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。
需要说明的是,本领域技术人员应当理解,上述风险控制系统的实施方式中所示的各模块的实现功能可参照前述风险控制方法的相关描述而理解。上述风险控制系统的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本说明书实施例上述风险控制系统如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本说明书各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本说明书实施例不限制于任何特定的硬件和软件结合。
相应地,本说明书实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本说明书的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
此外,本说明书实施方式还提供一种风险控制系统,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。
在一个实施例中,该处理器可以是中央处理单元(Central Processing Unit,简称“CPU”),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称“DSP”)、专用集成电路(Application Specific Integrated Circuit,简称“ASIC”)等。前述的存储器可以是只读存储器(read-only memory,简称“ROM”)、随机存取存储器(randomaccess memory,简称“RAM”)、快闪存储器(Flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。在一个实施例中,该风险控制系统还包括总线和通信接口。处理器、存储器和通信接口都通过总线相互连接。通信接口可以是无线通信接口也可以是有线通信接口,用于使得处理器能够与其他的装置通信。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本说明书提及的所有文献都被认为是整体性地包括在本说明书的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。例如,计算风险特征网格中各个单元格的非风险行为概率和初始风险行为概率时,可以先计算各个单元格的非风险行为概率,再计算各个单元格的风险行为概率;也可以反过来,先计算各个单元格的风险行为概率,再计算各个单元格的非风险行为概率;还可以并行地计算各个单元格的非风险行为概率和初始风险行为概率。另外,在附图中描述的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。