CN106779271A - 确定风险特征的方法及装置和账户风险评分方法及装置 - Google Patents

确定风险特征的方法及装置和账户风险评分方法及装置 Download PDF

Info

Publication number
CN106779271A
CN106779271A CN201510816006.0A CN201510816006A CN106779271A CN 106779271 A CN106779271 A CN 106779271A CN 201510816006 A CN201510816006 A CN 201510816006A CN 106779271 A CN106779271 A CN 106779271A
Authority
CN
China
Prior art keywords
risk
feature
account
sample
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510816006.0A
Other languages
English (en)
Inventor
陈弢
陈继东
林述民
向东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510816006.0A priority Critical patent/CN106779271A/zh
Publication of CN106779271A publication Critical patent/CN106779271A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种确定风险特征的方法及装置和账户风险评分方法及装置,其中,确定风险特征的方法包括:计算账户样本中特征每个取值的风险倍数;计算风险倍数的波动率,根据波动率确定特征是否为风险特征。账户风险评分方法包括,利用确定风险特征的方法确定评分所需的风险特征;计算风险特征每个取值的证据权重WOE,根据所述WOE得到风险评分模型。本申请能够从数据的角度有预测性的对账户进行风险评估,根据各风险特征取值的WOE综合评价了账户的风险情况,使得账户风险评价更为准确,减少了风险评估中对人为理解的依赖,克服了人为理解影响风险评估结果或评估不全面的缺陷。

Description

确定风险特征的方法及装置和账户风险评分方法及装置
技术领域
本申请属于账户风险评估领域,特别涉及一种确定风险特征的方法及装置和账户风险评分方法及装置。
背景技术
一个账户的风险判断主要是基于账户已有历史上的事实类信息,比如:CTU策略灰名单;审理中心处罚名单;作弊案件入库名单;其他模型产出,比如高度确信的批量注册,批量转账,批量登陆名单;已有系统拦截账户,比如RDS人机识别拦截账户等等。目前,现有技术中账户风险判定方法主要有两类:
(1)基于黑名单的方法:即通过历史上案件中的名单累积沉淀得到的坏账户名单,这些案件包括欺诈类案件,盗用类案件,作弊类案件等等;
黑名单的方法强烈依赖已知名单数据,如果没有案件名单,或者案件名单质量有问题,将会影响最终的风险评分;且黑名单的方法评分覆盖率低,最终评分对于非名单类的账户无法输出有效的得分,评分的覆盖率非常低。
(2)基于规则的方法:基于业务理解给出的一些风险判定规则,只要满足其中一条即被判定为有风险。
基于规则的方法强烈依赖人的业务理解,在海量数据下,很可能出现片面的理解,没有考虑业务的动态变化,将会漏掉一些可能的风险,从而导致评分结果不准确。
发明内容
现有技术中对账户进行风险判断的方法缺少泛化能力,仅对与历史黑名单相同的账户或满足风险规则的账户具有风险判断能力,并不能对具有相似特性和行为的其他账户进行预测性判断。本申请提供的确定风险特征的方法及装置和账户风险评分方法及装置能够综合评价账户的风险情况,使得账户风险评价更为准确,减少了风险评估中对人为理解的依赖,克服了人为理解影响风险评估结果或评估不全面的缺陷。
本申请提供的一种确定风险特征的方法,包括,
计算账户样本中特征每个取值的风险倍数;
计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征。
本申请提供的一种账户风险评分方法,包括,
通过本申请所述的确定风险特征的方法确定评分所需的风险特征;
计算所述风险特征每个取值的证据权重(Weight of evidence,WOE),根据所述WOE得到风险评分模型;
将待分析账户信息输入风险评分模型得到风险评分结果。
本申请提供一种确定风险特征的装置,包括,
风险倍数计算模块,用于计算账户样本中特征每个取值的风险倍数;
风险特征确定模块,用于计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征。
本申请提供一种账户风险评分装置,其特征在于包括:
风险特征判断模块,用于通过前述的确定风险特征的装置确定评分所需的风险特征;
风险评分模型生成模块,用于计算所述风险特征每个取值的证据权重WOE,根据所述WOE得到风险评分模型;
风险评分计算模块,用于将待分析账户信息输入风险评分模型得到风险评分结果。
本申请提供的确定风险特征的方法及装置通过对账户特征进行分析,能够得出账户的风险特征。账户风险评分方法及装置分别利用确定风险特征的方法及装置,确定了风险特征集,根据风险特征取值的WOE建立了风险评分模型。从数据的角度有预测性的对账户进行风险评估,根据各风险特征的WOE综合评价了账户的风险情况,使得账户风险评价更为准确,减少了风险评估中对人为理解的依赖,克服了人为理解影响风险评估结果或评估不全面的缺陷。
当然实施本申请的任一产品或者方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例的样本特征体系构成图;
图2为本申请一实施例的确定风险特征方法的流程图;
图3为本申请一实施例的风险倍数计算方法的流程图;
图4为本申请一实施例的账户风险评分方法的流程图;
图5为本申请一实施例的确定风险特征的装置的结构图;
图6为本申请一实施例的账户风险评分装置的结构图;
图7为本申请一实施例的账户风险评分方法具体流程图;
图8为本申请一实施例的样本示意图;
图9为本申请一实施例的风险评分模型线上评分示意图。
具体实施方式
本申请实施例提供了一种确定风险特征的方法及装置和账户风险评分方法及装置。
为了使本申请的技术特点及效果更加明显,下面结合附图对本申请的技术方案做进一步说明,本申请也可有其他不同的具体实例来加以说明或实施,任何本领域技术人员在权利要求范围内做的等同变换均属于本申请的保护范畴。
首先,需要说明的是,本申请所述的特征为与账户相关的信息,如账户、性别、人名、电话号码等,特征取值为一特征下包括的数据,以性别为例,性别特征下的取值为男、女。
为了便于对特征进行分析,本申请实施例建立了全面的账户特征体系,该账户特征体系按照一个主体的账户基本信息(Identity)、账户行为(Activity)及账户关系(Network)维度(第一维度)进行设计,同时采用层次化的设计方式。
如图1所示,图1为本申请实施例的样本特征体系构成图。本实施例中,账户基本信息又细分为名单类账户已知风险、账户完整性、账户真实性、账户价值、账户成熟度及外部风险等第二维度;每个第二维度,如账户完整性又分为信息完整性、功能完整性及安全完整性等第三维度;每个第三维度下被细分为多个特征。账户行为及账户关系对特征的划分与账户基本信息类似,此处不在展开说明,具体内容参见图1。
本申请提供的特征分类方法能够反应一个账户主体的各类可能出现风险。以上所述仅为示例性的说明本申请特征体系包括的内容,本申请并不限制特征系统具体包含的特征,本申请在具体实施时,可根据实际情况对账户特征进行更详细的划分。
如图2所示,图2为本申请实施例的确定风险特征的方法的流程图。本实施例对账户特征进行分析,能够有效的确定风险特征,该方法包括:
步骤201:计算账户样本中特征每个取值的风险倍数;
其中,账户样本包括正常样本及风险样本,正常样本可从正常样本数据库获取,风险样本可以选择反作弊案例,正常样本与风险样本可根据历史数据分析出的正常账户与风险账户的比例选取。
进一步的,为了保证获取样本的有效性,还要将样本中的商户账户及沉睡账户剔除。
步骤202:计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征。
作为本申请一实施例,可通过如下公式计算账户样本中特征每个取值的风险倍数:
风险倍数(x)=风险浓度(x)/账户样本总体浓度,
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(X=x)AND(bad)为坏账户样本中特征X取值x的个数,#(X=x)为账户样本中特征X取值x的个数,x为特征X的一个取值。
作为本申请一实施例,如图3所示,图3为风险倍数计算方法的流程图,包括:
步骤2011:当特征为连续取值时,对特征的取值划分区间。
本申请所述的特征为连续取值指的是特征取值按照从大到小或从小到大排列,相邻两个取值之间的差值不是很大的情况,如支付宝一天登录终端设备个数、账户最近一个月领取红包的总金额等。
步骤2012:计算各区间的风险倍数;具体的,可通过如下公式计算各区间的风险倍数,
风险倍数(x1<X<x2)=风险浓度(x1<X<x2)/账户样本总体浓度;
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(x1<X<x2)AND(bad)为坏账户样本中特征X取值在区间[x1,x2]的个数,#(x1<X<x2)为账户样本中特征X取值在区间[x1,x2]的个数,x1、x2为区间的端点值。
步骤2013:根据相邻区间的风险倍数的差异,对区间进行合并或拆分处理,计算重新划分的区间的风险倍数(重复步骤2011及步骤2012),直到相邻区间的风险倍数的差异在预定范围内时停止合并或拆分处理。
具体实施时,首次划分区间可按尽量细或尽量粗的原则进行区域划分,后续拆分或合并的原则为:当相邻区间的风险倍数差异超出预定范围的最大值时,进行拆分处理;当相邻区间的风险倍数差异超出预定范围的最小值时,进行合并处理;当相邻区间的风险倍数差异在预定范围内时,不再对该相邻区间进行拆分或合并处理。
本实施例所述的预定范围可根据实际情况灵活设定,本申请对预定范围的具体取值不做限制。
本实施例中,通过合并没有区分和差别的相邻区间,可以减少区域划分的数量。通过拆分可以把粗糙的区域划分的更细,更加准确的确定风险区间。
作为本申请一实施例,步骤202进一步包括,
计算所述风险倍数的方差,若所述方差大于第一预定阈值,则所述特征为风险特征。第一预定阈值可根据实际情况灵活设定,本申请对其具体取值不做限制。
风险倍数的方差能够反映其波动率,风险倍数的方差越大,风险倍数的波动率越大,对应特征出现风险的概率越大,因此,设定方差大于预定阈值的特征为风险特征。
作为本申请一实施例,确定一特征为风险特征之后进一步包括,
计算该风险特征与另一特征的相关度,若该风险特征与另一特征的相关度大于第二预定阈值,则确定所述另一特征为风险特征。第二预定阈值可根据实际情况灵活设定,本申请对其具体取值不做限制。
具体的,风险特征与另一特征的相关度可通过如下公式进行计算:
其中,X为风险特征,Y为另一待分析的特征,I(X;Y)表示风险特征X与另一特征Y的互信息,Sx和Sy为风险特征X及特征Y的取值空间。
X与Y之间的互信息越大,说明X和Y之间的相关性越高,也就是说风险特征X是能预测特征Y的风险状态的一个有用的风险特征。
如图4所示,图4为本申请实施例的账户风险评分方法流程图。本实施例对样本信息进行分析,确定了风险特征,根据风险特征取值的WOE建立了风险评分模型,从数据的角度有预测性的对账户进行风险评估,该方法包括:
步骤401:通过前述实施例所述的确定风险特征的方法确定评分所需的风险特征;
步骤402:计算所述风险特征每个取值的证据权重WOE,根据所述WOE得到风险评分模型;风险评分模型可以为一列表,由各风险特征的每个取值的WOE组成。
具体实施时,证据权重WOE可通过如下公式计算得到:
其中,ai为特征A的第i个取值,b表示样本中总的坏样本数,g表示样本中总的好样本数,表示取值ai下的坏样本数,表示取值ai下的好样本数。
步骤403:将待分析账户信息输入风险评分模型得到风险评分结果。
得到风险评分结果后,可根据线上风险评分结果确定账户信息是否存在风险及其风险程度,根据风险评分结果做出不同的建议,如风险报警,进一步验证提示,拒绝账户等。对风险评分结果的应用为多样化的,本申请对此不做限制。
作为本申请一实施例,步骤403进一步包括:
在风险评分模型中匹配待分析账户信息的特征取值的WOE;
对匹配出的WOE做运算处理(如各WOE求和处理或加权求和处理),得到风险评分结果。
作为本申请一实施例,为了使得到的风险评分模型能够准确的反映近期的交易情况,本申请所述的账户风险评分方法还包括:在得到风险评分模型一段时间后,重新建立新的风险评分模型。
上述实施例的账户风险评分方法采用客观的评分方法,能够对样本信息进行分析,确定风险特征,根据风险特征取值的WOE建立了风险评分模型,从数据的角度有预测性的对账户进行风险评估,根据各特征的WOE综合评价了账户的风险情况,使得账户风险评价更为准确,减少了风险评估中对人为理解的依赖,克服了人为理解影响风险评估结果或评估不全面的缺陷。
如图5所示,图5为本申请一实施例的确定风险特征的装置的结构图。该装置可以通过逻辑电路或者芯片实现,或者安装于现有的高性能计算终端,例如手机、平板电脑、计算机等设备中,或者以功能模块的方式由软件实现各部件的功能。该确定风险特征的装置包括:
风险倍数计算模块501,用于计算账户样本中特征每个取值的风险倍数;
风险特征确定模块502,用于计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征。
作为本申请一实施例,风险倍数计算模块501通过如下公式计算账户样本中特征每个取值的风险倍数,
风险倍数(x)=风险浓度(x)/账户样本总体浓度;
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(X=x)AND(bad)为坏账户样本中特征X取值x的个数,#(X=x)为账户样本中特征X取值x的个数,x为特征X的一个取值。
作为本申请一实施例,风险倍数计算模块501进一步用于,
当特征为连续取值时,对特征的取值划分区间;
计算各区间的风险倍数;
根据相邻区间的风险倍数的差异,对区间进行合并或拆分处理,计算重新划分的区间的风险倍数,直到相邻区间的风险倍数的差异在预定范围时停止合并或拆分处理。
作为本申请一实施例,风险倍数计算模块501通过如下公式计算各区间的风险倍数,
风险倍数(x1<X<x2)=风险浓度(x1<X<x2)/账户样本总体浓度;
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(x1<X<x2)AND(bad)为坏账户样本中特征X取值在区间[x1,x2]的个数,#(x1<X<x2)为账户样本中特征X取值在区间[x1,x2]的个数,x1、x2为区间的端点值。
作为本申请一实施例,风险特征确定模块502具体用于:计算所述风险倍数的方差,若所述方差大于第一预定阈值,则所述特征为风险特征。
作为本申请一实施例,风险特征确定模块502进一步用于:确定一特征为风险特征之后,计算该风险特征与另一特征的相关度,若该风险特征与另一特征的相关度大于第二预定阈值,则确定所述另一特征为风险特征。
如图6所示,图6为本申请一实施例的账户风险评分装置结构图。该装置可以通过逻辑电路或者芯片实现,或者安装于现有的高性能计算终端,例如手机、平板电脑、计算机等设备中,或者以功能模块的方式由软件实现各部件的功能。该账户风险评分装置包括:
风险特征判断模块601,用于通过前述实施例所述的确定风险特征的装置确定评分所需的风险特征;
风险评分模型生成模块602,用于计算所述风险特征每个取值的证据权重WOE,根据所述WOE得到风险评分模型;
风险评分计算模块603,用于将待分析账户信息输入风险评分模型得到风险评分结果。
作为本申请一实施例,风险评分计算模块603进一步用于:
在风险评分模型中匹配待分析账户信息的特征取值的WOE;
对匹配出的WOE做运算处理,得到风险评分结果。
本申请提供的账户风险评分装置确定了风险特征集,根据风险特征取值的WOE建立了风险评分模型。从数据的角度有预测性的对账户进行风险评估,根据各风险特征的WOE综合评价了账户的风险情况,使得账户风险评价更为准确,减少了风险评估中对人为理解的依赖,克服了人为理解影响风险评估结果或评估不全面的缺陷。
如图7所示,图7为本申请一实施例账户风险评分方法具体流程图。本实施例的一个应用场合为支付宝等账户的风险评估,将用户账户相关信息输入至本申请提供的账户风险评分模型中,返回评分结果,其中,评分结果可包括风险评分及风险等级,如风险等级低(0-50分),风险较高(60-80分),风险超高(90-100);根据评分结果,对订单状态进行建议,如Accept、Reject和需要验证。
根据实际需要,本申请提供的账户风险评分方法还可应用于其他需评定用户账户风险的场合,如微博(包括陌陌)的新春红包中,Uber打车刷单的风险预测中,本申请对此并不做限制。
图7所示实施例能够对账户是否存在风险进行准确预测,其具体流程为:
步骤701,根据正常账户数据库与风险账户数据库中的数据量比例获得好样本及坏样本。本实施例中,获取的样本总量为74万,其中,正常账户与风险账户总量为5.0亿。
步骤702,按本申请上述实施例所述的特征体系对样本数据进行分类,计算样本各特征的每个取值的风险倍数。
风险倍数可通过如下公式计算得到:
风险倍数=风险浓度/样本总体浓度。
其中,样本的总体浓度=74万/5.0亿=0.146%,对于特征X,取值x下的风险浓度为:
其中,bad表示坏样本,#(X=x)AND(bad)为坏样本中变量X取值为x的个数,#(X=x)为样本中变量X取值x的个数。
步骤703,计算特征X风险倍数的方差,若得到的方差大于预定的阀值,则判定特征X为风险特征,为风险评分模型中需要的特征。
步骤704,计算风险特征每个取值的WOE,其中,WOE通过如下公式计算得到,
其中,ai为特征A的第i个取值,b表示样本中总的坏样本数,g表示样本中总的好样本数,表示取值ai下的坏样本数,表示取值ai下的好样本数。
风险特征每个取值的WOE能够直接反应账户的风险程度,当WOE取负值时,说明该特征的该取值不具有风险,当WOE取正值时,说明该特征的该取值具备风险,且WOE越大,风险也就越大。
假设样本中包括5个账户信息,其中包括3个好样本,2个坏样本,账户信息包括特征A,特征A的取值为a1及a2,具体如图8所示,通过WOE计算公式计算可得,
(负值-偏好证据);
(正值-偏坏证据)。
步骤705,根据风险特征的WOE值得到风险评分模型,其中,该风险评分模型为一列表,由各风险特征的每个取值的WOE组成,如图9中的风险评分模型901所示。
步骤706,将待分析账户信息输入风险评分模型,匹配出待分析账户特征取值对应的WOE。
步骤707,将WOE做相加处理,得到账户风险评分。
步骤706及步骤707的详细过程可参见图9所示,图9为本申请一实施例的风险评分模型线上评分示意图。
图9中,待分析账户信息为特征A、B…、N,对应的取值为A=a2、B=b3…N=n1。将待分析账户信息输入风险评分模型901后,匹配出WOE(a2)=-0.1,WOE(b3)=0.3…WOE(n1)=0.3,则评分结果score=WOE(a2)+WOE(b3)+…+WOE(n1)=(-0.1)+(0.3)+…+(0.3),从而得到账户信息的风险评分。
本申请提供的账户风险评分方法及装置,能够对单个支付宝账户风险进行评判,并不对自然人的风险进行评判。也就是说,如果一自然人注册多个支付宝账户,其中一个账户为其正常使用的“好”账户,而其余账户皆出现刷单、作弊及欺诈等场景的“坏”账户。使用本申请的账户风险评分方法及装置能够给这两批账户相应的好和坏的评价,而并不给该自然人打上坏(或者好)的标签,本申请提供的账户风险评分方法及装置能够给用户更多的灵活性,不会限制自然人的正常账户的正常交易。
本申请提供的确定风险特征的方法及装置通过对账户特征进行分析,能够得出账户的风险特征。账户风险评分方法及装置分别利用确定风险特征的方法及装置,确定了风险特征集,根据风险特征取值的WOE建立了风险评分模型。从数据的角度有预测性的对账户进行风险评估,根据各风险特征的WOE综合评价了账户的风险情况,使得账户风险评价更为准确,减少了风险评估中对人为理解的依赖,克服了人为理解影响风险评估结果或评估不全面的缺陷。
对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(FieldProgrammable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced BooleanExpression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java HardwareDescription Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby HardwareDescription Language)等,目前最普遍使用的是VHDL(Very-High-Speed IntegratedCircuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone LabsC8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅用于说明本申请的技术方案,任何本领域普通技术人员均可在不违背本申请的精神及范畴下,对上述实施例进行修饰与改变。因此,本申请的权利保护范围应视权利要求范围为准。

Claims (16)

1.一种确定风险特征的方法,其特征在于包括,
计算账户样本中特征每个取值的风险倍数;
计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征。
2.如权利要求1所述的确定风险特征的方法,其特征在于,通过如下公式计算账户样本中特征每个取值的风险倍数,
风险倍数(x)=风险浓度(x)/账户样本总体浓度,
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(X=x)AND(bad)为坏账户样本中特征X取值x的个数,#(X=x)为账户样本中特征X取值x的个数,x为特征X的一个取值。
3.如权利要求1所述的确定风险特征的方法,其特征在于,所述计算账户样本中特征每个取值的风险倍数进一步包括,
当特征为连续取值时,对特征的取值划分区间;
计算各区间的风险倍数;
根据相邻区间的风险倍数的差异,对区间进行合并或拆分处理,计算重新划分的区间的风险倍数,直到相邻区间的风险倍数的差异在预定范围内时停止合并或拆分处理。
4.如权利要求3所述的确定风险特征的方法,其特征在于,通过如下公式计算各区间的风险倍数,
风险倍数(x1<X<x2)=风险浓度(x1<X<x2)/账户样本总体浓度;
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(x1<X<x2)AND(bad)为坏账户样本中特征X取值在区间[x1,x2]的个数,#(x1<X<x2)为账户样本中特征X取值在区间[x1,x2]的个数,x1、x2为区间的端点值。
5.如权利要求1所述的确定风险特征的方法,其特征在于,计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征进一步包括,
计算所述风险倍数的方差,若所述方差大于第一预定阈值,则所述特征为风险特征。
6.如权利要求5所述的确定风险特征的方法,其特征在于,确定一特征为风险特征之后进一步包括,
计算该风险特征与另一特征的相关度,若该风险特征与另一特征的相关度大于第二预定阈值,则确定所述另一特征为风险特征。
7.一种账户风险评分方法,其特征在于包括,
通过如权利要求1-6任一项所述的方法确定评分所需的风险特征;
计算所述风险特征每个取值的证据权重WOE,根据所述WOE得到风险评分模型;
将待分析账户信息输入风险评分模型得到风险评分结果。
8.如权利要求7所述的账户风险评分方法,其特征在于,将待分析账户信息输入风险评分模型得到风险评分结果进一步包括,
在风险评分模型中匹配待分析账户信息的特征取值的WOE;
对匹配出的WOE做运算处理,得到风险评分结果。
9.一种确定风险特征的装置,其特征在于包括,
风险倍数计算模块,用于计算账户样本中特征每个取值的风险倍数;
风险特征确定模块,用于计算所述风险倍数的波动率,根据所述波动率确定所述特征是否为风险特征。
10.如权利要求9所述的确定风险特征的装置,其特征在于,所述风险倍数计算模块通过如下公式计算账户样本中特征每个取值的风险倍数,
风险倍数(x)=风险浓度(x)/账户样本总体浓度;
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(X=x)AND(bad)为坏账户样本中特征X取值x的个数,#(X=x)为账户样本中特征X取值x的个数,x为特征X的一个取值。
11.如权利要求9所述的确定风险特征的装置,其特征在于,所述风险倍数计算模块进一步用于,
当特征为连续取值时,对特征的取值划分区间;
计算各区间的风险倍数;
根据相邻区间的风险倍数的差异,对区间进行合并或拆分处理,计算重新划分的区间的风险倍数,直到相邻区间的风险倍数的差异在预定范围时停止合并或拆分处理。
12.如权利要求11所述的确定风险特征的装置,其特征在于,所述风险倍数计算模块通过如下公式计算各区间的风险倍数,
风险倍数(x1<X<x2)=风险浓度(x1<X<x2)/账户样本总体浓度;
账户样本总体浓度=获取的账户样本数/账户总数,
其中,bad表示坏账户样本,#(x1<X<x2)AND(bad)为坏账户样本中特征X取值在区间[x1,x2]的个数,#(x1<X<x2)为账户样本中特征X取值在区间[x1,x2]的个数,x1、x2为区间的端点值。
13.如权利要求9所述的确定风险特征的装置,其特征在于,所述风险特征确定模块具体用于,
计算所述风险倍数的方差,若所述方差大于第一预定阈值,则所述特征为风险特征。
14.如权利要求13所述的确定风险特征的装置,其特征在于,所述风险特征确定模块进一步用于,
确定一特征为风险特征之后,计算该风险特征与另一特征的相关度,若该风险特征与另一特征的相关度大于第二预定阈值,则确定所述另一特征为风险特征。
15.一种账户风险评分装置,其特征在于包括:
风险特征判断模块,用于通过如权利要求9-14任一项所述的确定风险特征的装置确定评分所需的风险特征;
风险评分模型生成模块,用于计算所述风险特征每个取值的证据权重WOE,根据所述WOE得到风险评分模型;
风险评分计算模块,用于将待分析账户信息输入风险评分模型得到风险评分结果。
16.如权利要求15所述的账户风险评分装置,其特征在于,所述风险评分计算模块进一步用于,
在风险评分模型中匹配待分析账户信息的特征取值的WOE;
对匹配出的WOE做运算处理,得到风险评分结果。
CN201510816006.0A 2015-11-23 2015-11-23 确定风险特征的方法及装置和账户风险评分方法及装置 Pending CN106779271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510816006.0A CN106779271A (zh) 2015-11-23 2015-11-23 确定风险特征的方法及装置和账户风险评分方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510816006.0A CN106779271A (zh) 2015-11-23 2015-11-23 确定风险特征的方法及装置和账户风险评分方法及装置

Publications (1)

Publication Number Publication Date
CN106779271A true CN106779271A (zh) 2017-05-31

Family

ID=58886249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510816006.0A Pending CN106779271A (zh) 2015-11-23 2015-11-23 确定风险特征的方法及装置和账户风险评分方法及装置

Country Status (1)

Country Link
CN (1) CN106779271A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063920A (zh) * 2018-08-20 2018-12-21 阿里巴巴集团控股有限公司 一种交易风险识别方法、装置、及计算机设备
CN109191140A (zh) * 2018-07-05 2019-01-11 阿里巴巴集团控股有限公司 一种评分卡模型整合方法及装置
CN109191096A (zh) * 2018-08-22 2019-01-11 阿里巴巴集团控股有限公司 一种签约风险量化方法、代扣风险量化方法、装置及设备
CN109583773A (zh) * 2018-12-04 2019-04-05 税友软件集团股份有限公司 一种纳税信用积分确定的方法、系统及相关装置
CN109903165A (zh) * 2018-12-14 2019-06-18 阿里巴巴集团控股有限公司 一种模型合并方法和装置
CN110992043A (zh) * 2019-11-05 2020-04-10 支付宝(杭州)信息技术有限公司 一种风险实体挖掘的方法和装置
CN112580917A (zh) * 2019-09-30 2021-03-30 深圳无域科技技术有限公司 一种客户特征的评估方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191140A (zh) * 2018-07-05 2019-01-11 阿里巴巴集团控股有限公司 一种评分卡模型整合方法及装置
CN109063920A (zh) * 2018-08-20 2018-12-21 阿里巴巴集团控股有限公司 一种交易风险识别方法、装置、及计算机设备
CN109063920B (zh) * 2018-08-20 2022-05-27 创新先进技术有限公司 一种交易风险识别方法、装置、及计算机设备
TWI707287B (zh) * 2018-08-22 2020-10-11 香港商阿里巴巴集團服務有限公司 簽約風險量化方法、代扣風險量化方法、裝置及設備
CN109191096A (zh) * 2018-08-22 2019-01-11 阿里巴巴集团控股有限公司 一种签约风险量化方法、代扣风险量化方法、装置及设备
CN109583773A (zh) * 2018-12-04 2019-04-05 税友软件集团股份有限公司 一种纳税信用积分确定的方法、系统及相关装置
CN109903165B (zh) * 2018-12-14 2020-10-16 阿里巴巴集团控股有限公司 一种模型合并方法和装置
TWI718690B (zh) * 2018-12-14 2021-02-11 開曼群島商創新先進技術有限公司 模型合併方法和裝置
CN109903165A (zh) * 2018-12-14 2019-06-18 阿里巴巴集团控股有限公司 一种模型合并方法和装置
CN112580917A (zh) * 2019-09-30 2021-03-30 深圳无域科技技术有限公司 一种客户特征的评估方法及装置
CN112580917B (zh) * 2019-09-30 2024-04-05 深圳无域科技技术有限公司 一种客户特征的评估方法及装置
CN110992043A (zh) * 2019-11-05 2020-04-10 支付宝(杭州)信息技术有限公司 一种风险实体挖掘的方法和装置
CN110992043B (zh) * 2019-11-05 2022-08-05 支付宝(杭州)信息技术有限公司 一种风险实体挖掘的方法和装置

Similar Documents

Publication Publication Date Title
CN106779271A (zh) 确定风险特征的方法及装置和账户风险评分方法及装置
WO2019196552A1 (zh) 保险欺诈识别的数据处理方法、装置、设备及服务器
CN109461070A (zh) 一种风险审批方法、装置、存储介质和服务器
CN108492104A (zh) 一种资源转移监测方法及装置
CN107622432A (zh) 商户评价方法及系统
CN110443618B (zh) 风控策略的生成方法及装置
CN110246031A (zh) 企业信用的评估方法、系统、设备及存储介质
CN107436875A (zh) 文本分类方法及装置
CN110263157A (zh) 一种数据风险预测方法、装置及设备
CN110009297A (zh) 一种基于信用的资质信息审核方法、装置及设备
CN107644098A (zh) 一种欺诈行为识别方法、装置、设备及存储介质
CN109214915A (zh) 贷中风险评分方法、系统及计算机可读存储介质
TW201833851A (zh) 風控事件自動處理方法及裝置
CN111341041B (zh) 一种支付方式确定方法、装置、系统及设备
CN109274639A (zh) 开放平台异常数据访问的识别方法和装置
CN108989581A (zh) 一种用户风险识别方法、装置及系统
CN107622413A (zh) 一种价格敏感度计算方法、装置及其设备
CN109308667A (zh) 一种基于大数据的投资风险预估系统
CN110059293A (zh) 基金估值数据的数据质量的确定方法、装置和服务器
CN111062808B (zh) 信用卡额度评估方法、装置、计算机设备及存储介质
CN105740434B (zh) 网络信息评分方法及装置
CN110458571A (zh) 一种信息泄露的风险识别方法、装置及设备
CN110516713A (zh) 一种目标群体识别方法、装置及设备
CN112750038B (zh) 交易风险的确定方法、装置和服务器
CN110288488A (zh) 医疗险欺诈预测方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200921

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200921

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: Greater Cayman, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531