CN115456801B - 个人信用的人工智能大数据风控系统、方法和存储介质 - Google Patents
个人信用的人工智能大数据风控系统、方法和存储介质 Download PDFInfo
- Publication number
- CN115456801B CN115456801B CN202211132949.8A CN202211132949A CN115456801B CN 115456801 B CN115456801 B CN 115456801B CN 202211132949 A CN202211132949 A CN 202211132949A CN 115456801 B CN115456801 B CN 115456801B
- Authority
- CN
- China
- Prior art keywords
- data processing
- model
- processing model
- determining
- evaluated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本说明书实施例提供了一种个人信用的人工智能大数据风控系统、方法和存储介质,所述系统包括:采集模块、分类模块、云平台和评价模块;所述采集模块用于采集待评价对象的个人信息;所述分类模块用于基于预设分类树和所述个人信息,确定所述待评价对象的种类;所述云平台用于根据所述确定的分类,确定所述待评价对象的信用评价模型;所述评价模块用于基于所述信用评价模型对所述待评价对象的信用等级进行评估。本申请提供的技术方案用以解决随着人类的活动越来越多元化和复杂化,现有的模型的适用性不断降低的问题。
Description
技术领域
本文件涉及个大数据领域,尤其涉及一种个人信用的人工智能大数据风控系统、方法和存储介质。
背景技术
信用评价是综合一个人多方面信息去做分析评估,并不是简单几个因素决定的。一般会运用统计学和数据挖掘等手段找出对信用有影响的因子,比如人U统计学信息、经济水平、违约记录等建立起综合信用评价模型。
现有的信用评价基于信用评价模型,而信用评价模型的构建主要有两个方式,基于统计学构建模型和基于人工智能构建模型。
然而,随着人类的活动越来越多元化和复杂化,现有的模型的适用性不断降低,亟需开发新的个人信用评价模型。
发明内容
鉴于上述的分析,本申请旨在提出了一种个人信用的人工智能大数据风控系统、方法和存储介质,以提高个人信用评价模型的适用性。
第一方面,本说明书一个或多个实施例提供了一种个人信用的人工智能大数据风控系统,包括:采集模块、分类模块、云平台和评价模块;
所述采集模块用于采集待评价对象的个人信息;
所述分类模块用于基于预设分类树和所述个人信息,确定所述待评价对象的种类;
所述云平台用于根据所述确定的分类,确定所述待评价对象的信用评价模型;
所述评价模块用于基于所述信用评价模型对所述待评价对象的信用等级进行评估。
进一步地,所述系统还包括:分类树训练模块;
所述分类树训练模块用于分别采集训练样本和测试样本;利用所述训练样本得到多个第一分类树;利用所述测试样本确定各所述第一分类树的平均误差代价;根据各所述平均误差代价,确定各所述第一分类树分类时的权重;根据所述权重,确定第二分类树,并将所述第二分类树作为所述预设分类树。
进一步地,所述分类模块用于基于所述第二分类树的子节点和所述个人信息,确定所述待评价对象的种类。
进一步地,所述云平台用于根据预先存储的关联关系,确定所述信用评价模型,所述关联关系为所述信用评价模型和所述待评价对象的种类之间的对应关系。
进一步地,所述云平台包括:模型训练单元;
所述模型训练单元用于根据所述待评价对象的种类,采集训练样本;确定主要数据处理模型;基于所述训练样本,确定所述主要数据处理模型;基于所述主要数据处理模型和所述训练样本,得到至少一个辅助数据处理模型;利用所述主要数据处理模型和所述辅助数据处理模型,构建所述信用评价模型。
进一步地,所述模型训练单元用于从所述模型库中,确定第一数据处理模型;利用所述主要数据处理模型和所述第一数据处理模型,构建第二数据处理模型;利用所述训练样本训练所述第二数据处理模型,得到混淆矩阵;确定混淆矩阵中主对角线元素中的最小值是否为所述最小值对应的元素所在行中的最小值;如果是,确定所述第一数据处理模型为所述辅助数据处理模型。
第二方面,本说明书一个或多个实施例提供了一种个人信用的人工智能大数据风控方法,包括:
采集待评价对象的个人信息;
基于预设分类树和所述个人信息,确定所述待评价对象的种类;
根据所述待评价对象分类,确定所述待评价对象的信用评价模型;
基于所述信用评价模型对所述待评价对象的信用等级进行评估。
进一步地,所述根据所述待评价对象分类,确定所述待评价对象的信用评价模型,包括:
根据所述待评价对象分类,采集训练样本;
确定主要数据处理模型;
基于所述训练样本,训练所述主要数据处理模型;
基于所述主要数据处理模型和所述训练样本,得到至少一个辅助数据处理模型;
利用所述主要数据处理模型和所述辅助数据处理模型,构建所述信用评价模型。
进一步地,所述基于所述主要数据处理模型和所述训练样本,得到辅助数据处理模型,包括:
从所述模型库中,确定第一数据处理模型;
利用所述主要数据处理模型和所述第一数据处理模型,构建第二数据处理模型;
利用所述训练样本训练所述第二数据处理模型,得到混淆矩阵;
确定混淆矩阵中主对角线元素中的最小值是否为所述最小值对应的元素所在行中的最小值;
如果是,确定所述第一数据处理模型为所述辅助数据处理模型。
第三方面,本说明书一个或多个实施例提供了一种存储介质,包括:
用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现权利要求第一方面任一项所述的方法。
与现有技术相比,本申请至少能实现以下技术效果:
1、根据待评价对象的个人信息的对象,利用预设的分类树,得到待评价对象的种类,再根据相应的种类选取相应的信用评价模型。通过上述方式,可以提高信用评价的针对性,从而提高信用等级评价的准确性和适用性。
2、基于平均误差代价,确定各分类树的权重,以便于让平均误差代价小的分类树具有更大权重,从而提高分类的准确性,为后续选择相应模型奠定基础。
3、采用多模型组合的方式构建信用评价模型,并针对构建的信用评价模型精准性进行评价,选用准确性较好的模型用于信用等级,从而进一步提高了评价结果的准确性。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种个人信用的人工智能大数据风控系统的结构示意图;
图2为本说明书一个或多个实施例提供一种个人信用的人工智能大数据风控方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
随着科技的发展,互联网征信越来越重要。互联网征信是在对互联网上的电商平台、交易平台等存储的海量大数据信息进行提取和处理的基础上,对用户信用水平、风险特点、行为预测以及信用轨迹等方面进行综合描述。
然而现有技术只是笼统地考虑行为预测对信用的影响,例如,普遍认为:交友数量、社交活跃度、消费频次、消费品牌和消费品类会影响一个人的信用等级。因此,现有技术会依据现有的理论和模型加入上述参数,以提高模型精确度。然而,现实情况是,随着通信方式和购物渠道越来越多,意味着个人可选的生活方式越来越多,因此很难界定上述参数的数值。例如,有些人可能只在一个平台上活跃,有些人可能会同时使用多个平台,但平均下来每个平台都不够活跃,那么在计算活跃度时该如何。
此外,由于职业、人生经历会对人的行为习惯产生极大的影响,导致很难确定各参数与信用等级的关系。
例如,微商每天会在朋友圈中发大量的信息,该信息跟个人信用等级没有必然联系。大品牌为了市场需求也会发售性价比高的产品,这样的产品通常都是人人抢购的产品,而这类产品的消费频次、消费品牌和消费品类与个人信用等级没有必然联系。年龄较大的人不习惯用网络,导致其交友数量、社交活跃度、消费频次、消费品牌和消费品等数据收集不到,或者收集到的数据并不能真实反应其交友数量、社交活跃度、消费频次、消费品牌和消费品。很多人保持着低调和节俭的生活方式,这也会影响采集到的数据真实性。
基于上述事实,现有技术很难精确地确定交友数量、社交活跃度、消费频次、消费品牌和消费品类值,以及很难确定上述参数与个人信用的关联强度,从而导致信任等级的评价准确度较低。
因此本申请实施例提出了一种个人信用的人工智能大数据风控系统,如图1所示,包括:采集模块、分类模块、云平台、分类树训练模块和评价模块。
采集模块用于采集待评价对象的个人信息。其中,个人信息包括:性别、年龄、地域、职业、好友数量、好友信用情况、社交活跃度、社交影响力、支付总金额、余额、信用卡数量、信用卡开户时长、信用卡额度、品牌、品类、交易场景、价格层次、是否评价商品中的一个或多个。
分类模块用于基于预设分类树和个人信息,确定适用于待评价对象的种类。
在本申请实施例中,个人信息由基础信息和衍生信息构成。其中,基础信息如性别、年龄、地域、职业。衍生信息如好友数量、社交活跃度、社交影响力、支付总金额、余额、信用卡数量、信用卡开户时长、信用卡额度、品牌、价格层次。
有一部分衍生信息是受基础信息影响的。例如,对于职业,微商的社交活跃度必然高,商务人员的差旅费通常由公司报销,因此其住宿和饮食的消费也会相对较高。对于年龄,年龄大的人其与网络相关的数据相对较少。对于地域,一般在产品原产地,产品的价格通常会比较低,且产品种类经常会与外地的不同。对于性别,通常男生对化妆品的品牌、品牌类别了解较少,因此很少产生相关数据。由此可知,受基础信息影响的这部分衍生信息无法真实反应其与个人信用的关联程度。
因此,在本申请实施例中,待评价对象的种类是针对基础信息和衍生信息的一个综合分类。得到该综合分类通过预设分类树各子节点表征。预设分类树中的子节点包括:完整的基础信息和部分衍生信息,当个人信息包括预设分类树中全部子节点时,说明该分类树中各子节点对应的分类适用于待评价对象。
得到预设分类树的具体过程如下:
首先,分类树训练模块分别采集训练样本和测试样本。
训练样本中各数据的基础信息是相同或相近,例如设定年龄范围,对职业字段进行语义识别。将同一年龄段,职业相同,相同地域的人的数据放入同一训练样本。
然后,分类树训练模块利用训练样本得到多个第一分类树。此时,每一个分类树对一个分类维度,每一个分类维度包括至少一个参数。例如,有些分类树主要基于职业、好友数量分类,有的分类树主要基于年龄、地域分类,还有的主要基于好友数量、社交活跃度分类。
之后,利用测试样本确定各第一分类树的平均误差代价。
信贷数据是典型的非平衡样本,也就是指在数据样本中某些类的样本数量要远远少于其他类,正如信贷样本中未违约用户的数量是远远多于违约用户的数量。因此本申请采用平均误差代价来表征各第一分类树的分类方式是否合适。
具体地,在二分类问题中,正类样本预测为正类称为真正例(True Positive,TP,也称真阳),反类样本预测为反类称为真反例(True Negative,TN,也称真阴),相应地,另外两种情况分别称为伪反例(False Negative,FN,也称假阴)和伪正例(False Positive,FP,也称假阳)。错误分类代价所用的代价矩阵可以设置为如表1所示:
表1代价矩阵
其中,表示将样本i类预测为j类产生的代价,i和j代表P或N。
平均错误差代价(Average Costs,AC)为:
根据上述公式计算各第一分类树的平均误差代价。
得到平均误差代价后,根据各平均误差代价,确定各第一分类树分类时的权重。具体地,将平均误差代价越小,相应分类树的权重越大。即平均误差代价越小,相应参数与个人信用的关系越紧密。其中,权重为单个分类树的平均误差代价与所有分类树的平均误差代价总和的比值。
最后,根据权重,确定第二分类树,并将第二分类树作为所述预设分类树。具体地,利用权重得到各参数的权重,以表征各参数对个人信用的真实影响。优选地,预设参数权重阈值,将权重低于预设值的参数删除。或者,预设分类树权重阈值,利用权重高于预设值的分类树构建新的分类树,并得到各参数的权重值;之后删除低于预设参数权重阈值的参数。其中,各参数的比重为:
其中,S为参数比重,si为参数所属分类树的权重,n为分类树数量
云平台用于根据待评价对象的种类,确定待评价对象的信用评价模型。
确定信用评价模型有两种方式:
第一种方式,实时生成。
本申请的方案基于大数据技术,因此在云平台中设置模型训练单元,模型训练单元可以实时根据待评价对象的种类,从数据库中调取采集训练样本,训练样本的种类与待评价对象相同。
之后,基于训练样本,确定主要数据处理模型。
在本申请实施例中,主要数据处理模型可以根据经验进行选择,主要数据处理模型可以为BP神经网络、Elman神经网络、LVQ神经网络、多元线性回归、Logistic回归、Probit回归中的任一个。选择的依据主要是当前种类适用于线性模型还是非线性模型。如果适用于非线性模型,从神经网络中选取主要数据处理模型;如果适用于线性模型,从回归类模型中选取主要数据处理模型。
基于主要数据处理模型和训练样本,得到至少一个辅助数据处理模型。
在本申请实施例中,为了保证信用评价模型的准确性,要检测辅助数据处理模型是否与主要数据处理模型相匹配。
具体地,模型训练单元用于从模型库中,确定第一数据处理模型。利用主要数据处理模型和第一数据处理模型,构建第二数据处理模型。利用训练样本训练第二数据处理模型,得到混淆矩阵。其中,混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。
确定混淆矩阵中主对角线元素中的最小值是否为最小值对应的元素所在行中的最小值。如果是,确定第一数据处理模型为辅助数据处理模型。
混淆矩阵中主对角线元素中的最小值为最小值对应的元素所在行中的最小值时,说明该种组合预测模型的预测误差平方和小于参加组合的各种模型的预测误差平方和中的最小者。即两个模型结合后,精度提高了,因此可以结合两个模型得到信用评价模型。如果不满足上述条件,说明两个模型结合后,不能提高评价精度,因此相应的模型的不会作为辅助模型。
优选地,在得到辅助模型后,可以将主要数据处理模型和辅助模型合成一个新的主要数据处理模型,之后以同样的方法,基于新的主要数据处理模型,确定新的辅助模型,进一步优化信用评价模型。基于这种方式,进行多次迭代可以得到更优的信用评价模型。
第二种方式,采用第一种方式的方法预先生成信用评价模型,并存储信用评价模型和待评价对象的种类之间的对应关系,得到关联关系。使用时,云平台用于根据预先存储的关联关系,以便于确定信用评价模型。
在本申请实施例中,评价模块用于基于信用评价模型对待评价对象的信用等级进行评估。
综上所述,本申请提供的风控系统基于个人信息与个人信用的关联度,确定待评价对象的种类,再根据待评价对象的种类的特点,选择最优信用评价模型,从而提高信用评价的准确性。
本申请实施例还提供了一种个人信用的人工智能大数据风控方法,如图2所示,包括以下步骤:
步骤1、采集待评价对象的个人信息。
步骤2、基于预设分类树和个人信息,确定待评价对象的种类。
步骤3、根据待评价对象分类,确定待评价对象的信用评价模型。
步骤4、基于信用评价模型对待评价对象的信用等级进行评估。
在本申请实施例中,步骤3具体为:
根据所述待评价对象分类,采集训练样本;
确定主要数据处理模型;
基于所述训练样本,训练所述主要数据处理模型;
基于所述主要数据处理模型和所述训练样本,得到至少一个辅助数据处理模型;
利用所述主要数据处理模型和所述辅助数据处理模型,构建所述信用评价模型。
在本申请实施例中,得到辅助数据处理模型的具体过程为:
从所述模型库中,确定第一数据处理模型;
利用所述主要数据处理模型和所述第一数据处理模型,构建第二数据处理模型;
利用所述训练样本训练所述第二数据处理模型,得到混淆矩阵;
确定混淆矩阵中主对角线元素中的最小值是否为所述最小值对应的元素所在行中的最小值;
如果是,确定所述第一数据处理模型为所述辅助数据处理模型。
本申请实施例提供了一种存储介质,包括:
用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现上述实施例中所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪30年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。
Claims (6)
1.一种个人信用的人工智能大数据风控系统,其特征在于,包括:采集模块、分类模块、云平台和评价模块;
所述采集模块用于采集待评价对象的个人信息;
所述分类模块用于基于预设分类树和所述个人信息,确定所述待评价对象的种类;
所述云平台用于根据所述确定的分类,确定所述待评价对象的信用评价模型;所述云平台用于根据预先存储的关联关系,确定所述信用评价模型,所述关联关系为所述信用评价模型和所述待评价对象的种类之间的对应关系;
所述云平台包括:模型训练单元;
所述模型训练单元用于根据所述待评价对象的种类,采集训练样本;确定主要数据处理模型;基于所述训练样本,确定所述主要数据处理模型;基于所述主要数据处理模型和所述训练样本,得到至少一个辅助数据处理模型;利用所述主要数据处理模型和各所述辅助数据处理模型,构建所述信用评价模型;
所述模型训练单元用于从模型库中,确定第一数据处理模型;利用所述主要数据处理模型和所述第一数据处理模型,构建第二数据处理模型;利用所述训练样本训练所述第二数据处理模型,得到混淆矩阵;确定混淆矩阵中主对角线元素中的最小值是否为所述最小值对应的元素所在行中的最小值;如果是,确定所述第一数据处理模型为所述辅助数据处理模型;
其中,混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目;
所述评价模块用于基于所述信用评价模型对所述待评价对象的信用等级进行评估。
2.根据权利要求1所述的系统,其特征在于,所述系统还包括:分类树训练模块;
所述分类树训练模块用于分别采集训练样本和测试样本;利用所述训练样本得到多个第一分类树;利用所述测试样本确定各所述第一分类树的平均误差代价;根据各所述平均误差代价,确定各所述第一分类树分类时的权重;根据所述权重,确定第二分类树,并将所述第二分类树作为所述预设分类树;
其中,平均误差代价计算公式为:
AC为平均误差代价,TP表征真正例,TN表征真反例,FN表征伪反例,FP表征伪正例,P表征正类样本,N表征负类样本。
3.根据权利要求2所述的系统,其特征在于,
所述分类模块用于基于所述第二分类树的子节点和所述个人信息,确定所述待评价对象的种类。
4.根据权利要求1所述的系统,其特征在于,
所述云平台用于根据预先存储的关联关系,确定所述信用评价模型,所述关联关系为所述信用评价模型和所述待评价对象的种类之间的对应关系。
5.一种个人信用的人工智能大数据风控方法,其特征在于,包括:
采集待评价对象的个人信息;
基于预设分类树和所述个人信息,确定所述待评价对象的种类;
根据所述待评价对象分类,确定所述待评价对象的信用评价模型;
基于所述信用评价模型对所述待评价对象的信用等级进行评估;
所述根据所述待评价对象分类,确定所述待评价对象的信用评价模型,包括:
根据所述待评价对象分类,采集训练样本;
确定主要数据处理模型;
基于所述训练样本,训练所述主要数据处理模型;
基于所述主要数据处理模型和所述训练样本,得到至少一个辅助数据处理模型;
利用所述主要数据处理模型和各所述辅助数据处理模型,构建所述信用评价模型;
所述基于所述主要数据处理模型和所述训练样本,得到辅助数据处理模型,包括:
从模型库中,确定第一数据处理模型;
利用所述主要数据处理模型和所述第一数据处理模型,构建第二数据处理模型;利用所述训练样本训练所述第二数据处理模型,得到混淆矩阵;
确定混淆矩阵中主对角线元素中的最小值是否为所述最小值对应的元素所在行中的最小值;
如果是,确定所述第一数据处理模型为所述辅助数据处理模型。
6.一种存储介质,其特征于,包括:
用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现权利要求1-4任一项所述的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211132949.8A CN115456801B (zh) | 2022-09-16 | 2022-09-16 | 个人信用的人工智能大数据风控系统、方法和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211132949.8A CN115456801B (zh) | 2022-09-16 | 2022-09-16 | 个人信用的人工智能大数据风控系统、方法和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115456801A CN115456801A (zh) | 2022-12-09 |
CN115456801B true CN115456801B (zh) | 2023-04-28 |
Family
ID=84305537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211132949.8A Active CN115456801B (zh) | 2022-09-16 | 2022-09-16 | 个人信用的人工智能大数据风控系统、方法和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115456801B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115759876B (zh) * | 2022-12-14 | 2023-09-29 | 简易治慧(上海)智能科技发展有限公司 | 数字孪生几何模型成熟度评估方法、装置和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097450A (zh) * | 2019-03-26 | 2019-08-06 | 中国人民财产保险股份有限公司 | 车贷风险评估方法、装置、设备和存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898476A (zh) * | 2018-06-14 | 2018-11-27 | 中国银行股份有限公司 | 一种贷款客户信用评分方法和装置 |
CN110544155B (zh) * | 2019-09-02 | 2023-05-19 | 中诚信征信有限公司 | 用户信用评分的获取方法、获取装置、服务器及存储介质 |
CN113793210A (zh) * | 2021-09-17 | 2021-12-14 | 吉林亿联银行股份有限公司 | 网络借贷信用的评价方法、相关装置及计算机存储介质 |
CN113920374A (zh) * | 2021-10-29 | 2022-01-11 | 平安银行股份有限公司 | 基于随机森林的用户分类方法、装置、设备及存储介质 |
CN114493853A (zh) * | 2022-02-16 | 2022-05-13 | 中国工商银行股份有限公司 | 信用等级评价方法、装置、电子设备及存储介质 |
CN114822835A (zh) * | 2022-02-24 | 2022-07-29 | 岭南师范学院 | 一种糖尿病关键特征参数获取方法 |
-
2022
- 2022-09-16 CN CN202211132949.8A patent/CN115456801B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097450A (zh) * | 2019-03-26 | 2019-08-06 | 中国人民财产保险股份有限公司 | 车贷风险评估方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115456801A (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063886B (zh) | 一种异常检测方法、装置以及设备 | |
CN110245935B (zh) | 支付渠道推荐方法、装置及设备 | |
CN108596410B (zh) | 一种风控事件自动处理方法及装置 | |
CN110163417B (zh) | 一种业务量的预测方法、装置及设备 | |
CN110032698B (zh) | 信息显示方法和装置、信息处理方法和装置 | |
CN110443618B (zh) | 风控策略的生成方法及装置 | |
CN109508879B (zh) | 一种风险的识别方法、装置及设备 | |
CN110020427B (zh) | 策略确定方法和装置 | |
CN110069545B (zh) | 一种行为数据评估方法及装置 | |
CN108108866A (zh) | 一种风险控制的方法及装置 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN108921693B (zh) | 一种数据的衍生方法、装置及设备 | |
CN110634030A (zh) | 应用的业务指标挖掘方法、装置及设备 | |
CN113849166B (zh) | 智慧水环境积木式零代码开发平台 | |
CN115456801B (zh) | 个人信用的人工智能大数据风控系统、方法和存储介质 | |
CN110263817B (zh) | 一种基于用户账号的风险等级划分方法及装置 | |
CN111784384B (zh) | 支付业务数据处理方法、装置、设备及系统 | |
CN114490786A (zh) | 数据排序方法及装置 | |
CN111177562B (zh) | 一种目标对象的推荐排序处理方法、装置及服务器 | |
CN116029556B (zh) | 一种业务风险的评估方法、装置、设备及可读存储介质 | |
KR102296420B1 (ko) | 개인정보보호 정책서 분석 기반 개인정보 수집/활용자의 신뢰도 평가 방법 및 장치 | |
CN114756731A (zh) | 广告渠道数据的处理方法及装置、存储介质、电子设备 | |
CN112784420B (zh) | 一种风控策略的仿真评估方法、装置及设备 | |
CN108733696B (zh) | 一种征信表单的生成方法及装置 | |
CN111461352B (zh) | 模型训练、业务节点识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |