CN114611892A - 一种应用于金融行业的智能风控规则推荐方法及系统 - Google Patents
一种应用于金融行业的智能风控规则推荐方法及系统 Download PDFInfo
- Publication number
- CN114611892A CN114611892A CN202210185054.4A CN202210185054A CN114611892A CN 114611892 A CN114611892 A CN 114611892A CN 202210185054 A CN202210185054 A CN 202210185054A CN 114611892 A CN114611892 A CN 114611892A
- Authority
- CN
- China
- Prior art keywords
- rule
- characteristic
- data
- recommendation
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000004140 cleaning Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000004458 analytical method Methods 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000007405 data analysis Methods 0.000 claims description 21
- 238000009826 distribution Methods 0.000 claims description 21
- 230000001419 dependent effect Effects 0.000 claims description 15
- 238000000926 separation method Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 3
- 238000012954 risk control Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 101100355584 Mus musculus Rad51 gene Proteins 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013515 script Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000013215 result calculation Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种应用于金融行业的智能风控规则推荐方法及系统,属于智能风险控制领域,解决了传统技术中存在的策略人员线下手工处理效率低下的问题,其包括数据来源模块、数据清洗模块、特征加工模块和结果推荐模块,所述各个模块依次连接,实现了提供一种高效、灵活的风控规则推荐系统。
Description
技术领域
本发明属于智能风险控制领域,具体涉及一种应用于金融行业的智能风控规则推荐方法及系统。
背景技术
随着金融科技和互联网技术的发展,越来越多的投资者倾向于借助于互联网来搜集宏观经济政策、企业经营状况、股票市场走势等信息,同时也借助于互联网来表达自身对金融投资的看法和情绪。考虑到金融行业对于国家的经济安全具有极其重要的影响,为此,监管部门需要对金融行业进行多个维度的监管。但是由于舆情信息通常难以搜集,且多为文字信息,因此很难自动地根据舆情确定金融风险状况。
在传统技术中,往往通过人工处理的方法对金融风险进行管控,这种人工处理方案的原理分别是:获取离线业务数据,需要专业人员使用python语言加工脚本,调用python算法包,计算特征变量的(IV,KS,AUC..)值,根据特征结果值,筛选出满足条件的特征变量,根据特征分布图对应的cut-off点,遍历所有的cut-off点,计算对应的LI FT值,最终得到所需规则,该种人工处理的方法往往存在以下缺陷:1.非专业研发、开发测试成本高;2.无法适配复杂灵活的表达式解析;3.基础数据,脚本,结果数据无法成体系管理;4、人工处理效率低下,相同数据源,无法复用之前操作。均需要人工处理。耗时耗力。
发明内容
针对现有技术中开发成本搞、无法适配复杂灵活的表达式解析、人工处理效率低下的问题,本发明提供一种应用于金融行业的智能风控规则推荐方法及系统,其目的在于:提供一种高效、灵活的风控规则推荐系统,并改良传动技术中效率地下的风控规则推荐方法。
本发明采用的技术方案如下:
一种应用于金融行业的智能风控规则推荐方法,包括以下步骤:
步骤A:通过数据来源模块获取原始数据信息,系统化管理数据源,动态创建数据库表,并将数据库表中的原始字段信息传入数据清洗模块;
步骤B:数据清洗模块将数据库表中的原始字段信息进行特征加工,得到数据分析矩阵,并将数据分析矩阵传入特征加工模块;
步骤C:特征加工模块根据数据分析矩阵,根据特征计算方法,得到特征对应的分布图和特征值之间的相关性矩阵,进而得到特征变量X,并且生成相应的文件格式、且与特征X变量对应的分箱结果文件,将所述特征变量X和文件格式的分箱结果文件传入结果推荐模块;
步骤D:根据特征变量X和其对应的分箱结果文件计算对应规则的LI FT值,并将所有规则的LI FT值的结果和规则配置阈值对比,输出所有大于规则阈值的规则,并形成推荐规则排行榜和推荐规则相关性矩阵。
采用上述方案,克服了前述的现有技术中存在的策略人员线下手工处理效率低下的问题,和数据安全的缺陷,且公共逻辑没有组件化,无法复用,均需要人工处理。基础数据和结果数据无法成体系管理,数据混乱,且数据结果需要手工汇总,且只能对原始数据进行分析加工,不支持复杂表达式加工;对策略人员要求较高,且开发成本更高,通过配置驱动的方式,将策略人员线下处理的方式进行系统封装,实现了通过人工智能对金融风险管控的技术效果,且提供了多个维度的数据结果显示,降低了容错率,提高了策略推荐的效率。
所述步骤A的具体步骤为:
步骤A1:选择数据来源,并进行判断,判断结果为本地文件上传或其他业务系统;
步骤A2:判断结果为其他业务系统,通过rabbitMQ+KS3进行信息交互,并传入文件于KS3上面存储的文件I D,通过文件I D下载对应文件,解析得到分析数据;
步骤A3:判断结果为本地文件上传,根据上传提示界面,输入对应数据,本地文件上传到KS3,解析本地文件,得到分析数据;
步骤A4:提供界面对数据来源进行管理,对数据来源对应的数据进行修改、删除、复制操作。
采用上述方案,本系统同时支持本地文件上传的方式进行数据挖掘和分析;同时,支持多种文件(txt,csv,exce l)的解析,实现了数据源的多元化,同时对上传文件的类型和长度进行动态计算,减少了人员配置的时间。
所述步骤B的具体步骤为:
步骤B1:根据数据库中对应的字段类型,进行常用表达式加工,指定因变量Y1、Y2.....,并解析加工完成后的字段名称、类型,描述得到衍生字段;
步骤B2:根据步骤B1中指定的因变量Y1、Y2.....,目标变量Y1对应的特征变量字段X1、X2.....,Y2对应的特征变量字段X1、X2.....,如果不指定则默认剩余所有字段作为X,并得到数据分析矩阵,并将数据分析矩阵传入特征加工模块。
采用上述方案,业务分析数据经过特征加工处理后,保存到HDFS,保存多个副本,提供容错机制,降低了数据存储成本且提供了流式数据访问,提高吞吐量,同时处理大量数据,降低了特征、规则结果计算时间。
所述步骤C的具体步骤为:
步骤C1:步骤B中得到的数据分析矩阵后,再根据因变量Y,进行特征推荐方法和分箱方法的配置,同时指定分箱个数,同时设定特征配置阈值;
步骤C2,根据因变量Y的配置,计算对应的特征值,系统显示特征值大于特征配置阈值的特征变量X1,X3,X5…,以及X1,X3,X5…的明细和X1,X3,X5..特征之间的相关性矩阵,将其计算结果传入规则计算。
所述步骤C2中的IV分布图中包括变量名、分组、总人数、坏人数、坏占比、区间占比和WOE和IV、KS分布图中包括变量名、分组、总人数、坏人数、好人数、累计坏总人数、累计好总人数、累计坏占比和累计好占比。
采用上述方案,根据不同的数据类型,提供了对原始变量或者衍生变量以及目标变量的动态分布计算。并且提供了图形化的显示界面,更加生动的查看变量分布情况,有利于业务人员更加快捷、方便、准确的进行变量表达式的配置。
所述步骤D的具体步骤为:
步骤D1:规则计算配置中指定特征推荐的名称,系统自动带入大于特征阈值的特征变量和目标变量对应的分析矩阵,以及获得其特征变量对应的分箱结果文件;
步骤D2:、根据特征变量X的分箱结果文件,获取特征变量对应的cut_off点;
步骤D3:配置单规则、双规则、三规则的规则计算方法,和规则计算阈值;
步骤D4:根据步骤D1中的分析矩阵,和步骤D2中的特征变量对应的cut_off点,再根据步骤D3中配置的规则计算方法。计算所有分析矩阵中特征变量X对应的LI FT值;
步骤D5:根据步骤D3中指定的规则计算阈值,筛选出LI FT值大于规则推荐阈值的规则,生成推荐规则排行榜和推荐规则相关性矩阵。
采用上述方案,对特征、规则结果相关性系数计算,且提供了图形化的显示界面,更加有效的帮助业务人员对数据结果进行分析。
所述步骤D4中的推荐规则排行榜包括推荐规则、规则含义、命中人数、命中率、坏占比、reca l l和l ift和分布图。
所述推荐规则相关性矩阵进行归一化处理。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.克服了前述的现有技术中存在的策略人员线下手工处理效率低下的问题,和数据安全的缺陷,且公共逻辑没有组件化,无法复用,均需要人工处理。基础数据和结果数据无法成体系管理,数据混乱,且数据结果需要手工汇总,且只能对原始数据进行分析加工,不支持复杂表达式加工;对策略人员要求较高,且开发成本更高,通过配置驱动的方式,将策略人员线下处理的方式进行系统封装,实现了通过人工智能对金融风险管控的技术效果,且提供了多个维度的数据结果显示,降低了容错率,提高了策略推荐的效率。
2.本系统同时支持本地文件上传的方式进行数据挖掘和分析;同时,支持多种文件(txt,csv,exce l)的解析,实现了数据源的多元化,同时对上传文件的类型和长度进行动态计算,减少了人员配置的时间。
3.业务分析数据经过特征加工处理后,保存到HDFS,保存多个副本,提供容错机制,降低了数据存储成本且提供了流式数据访问,提高吞吐量,同时处理大量数据,降低了特征、规则结果计算时间。
4.对特征、规则结果相关性系数计算,且提供了图形化的显示界面,更加有效的帮助业务人员对数据结果进行分析。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明的系统结构示意图;
图2是本发明的数据集上传页面;
图3是本发明的数据清洗模块;
图4是本发明的字段明细信息修改页面。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面结合图1对本发明作详细说明。
一种应用于金融行业的智能风控规则推荐系统,包括数据来源模块、数据清洗模块、特征加工模块和结果推荐模块,所述各个模块依次连接。
一种应用于金融行业的智能风控规则的推荐方法,包括以下步骤:
步骤A:通过数据来源模块获取原始数据信息,系统化管理数据源,动态创建数据库表,并将数据库表中的原始信息传入数据清洗模块;
步骤B:数据清洗模块将数据库表中的原始字段进行类型和描述的编辑修改、在原始字段基础上进行各种表达式加工,得到新的衍生变量。原始字段加上衍生变量统称为特征变量X。在特征变量的基础上进行条件赋值表达式加工得到目标变量Y,并且选择Y对应的X(1个Y对应多个X),得到数据分析矩阵,并将数据分析矩阵传入特征加工模块;
步骤C:特征加工模块根据数据分析矩阵,特征计算方法(IV/KS)、分箱方法(单独分箱/最优分箱)、特征配置阈值。根据相应公式计算,得到X的分箱结果和对应的特征值,根据特征计算方法得到特征对应的分布图(IV/KS)和特征值之间的相关性矩阵。根据特征配置阈值筛选出特征值大于阈值的特征变量X,以及X变量对应的文件格式的分箱结果文件传入结果推荐模块;
步骤D:将大于特征阈值的特征变量X,和其对应的分箱结果文件。根据规则计算方法和规则配置阈值,计算对应的规则(单规则、双规则、三规则)的LI FT值(坏占比),并将所有规则的LI FT值的结果和规则配置阈值对比。输出所有大于规则阈值的规则,并形成推荐规则排行榜和推荐规则相关性矩阵。
所述步骤A的具体步骤为:
步骤A1:选择数据来源,并进行判断,判断结果为本地文件上传或其他业务系统;
步骤A2:判断结果为其他业务系统,则通过rabbitMQ+KS3进行信息交互,并传入文件于KS3上面存储的文件I D,通过文件I D下载对应文件,解析得到分析数据,且创建人为”BDC”;
步骤A3:判断结果为本地文件上传,根据上传提示界面,输入对应数据,本地文件上传到KS3,解析本地文件,得到分析数据,且创建人为系统登陆人员;
步骤A4:提供界面对数据来源进行管理,可以对数据来源对应的数据进行修改、删除、复制等操作。
所述步骤A2的具体步骤为:输入大数据中心任务配置I D,再选择业务日期和任务名称,完成跑批数据集的指定。
所述步骤B的具体步骤为:
步骤B1:根据数据库中对应的字段类型,:如json解析、条件赋值、字符串截取、字符串切割、字符串合并、变量类型转换和时间间隔、四则运算等解析,并指定解析完成后的字段名称、类型、描述得到一个新的字段,即:衍生字段,原始字段+衍生字段统成为:特征变量X;
步骤B2:X变量在进行条件赋值,即可得到目标变量Y1、Y2.....(因变量),根据步骤B1中指定的因变量Y1、Y2.....,目标变量Y1对应的特征变量字段X1、X2.....,Y2对应的特征变量字段X1、X2.....,如果不指定则默认剩余所有字段作为X,并得到数据分析矩阵,并将数据分析矩阵传入特征加工模块。
所述步骤C的具体步骤为:
步骤C1:根据步骤B中得到的数据分析矩阵后,再根据因变量Y,进行特征推荐方法(IV\KS)和分箱方法(单调分箱、最优分箱)的配置,同时指定分箱个数。再进行特征配置阈值的设定。
步骤C2,根据因变量Y的配置,计算对应的特征值,系统显示特征值大于特征配置阈值的特征变量X1,X3,X5…。以及X1,X3,X5…的明细(IV分布图\KS分布图)和X1,X3,X5..特征之间的相关性矩阵,将其计算结果传入规则计算;
所述步骤C2中的IV分布图中包括变量名、分组、总人数、坏人数、坏占比、区间占比和WOE和IV,ks分布图中包括变量名、分组、总人数、坏人数、好人数、累计坏总人数、累计好总人数、累计坏占比和累计好占比和ks。
所述步骤D的具体步骤为:
步骤D1:根据步骤C中的特征推荐相关性矩阵生成规则推荐配置和推荐模型;
步骤D2:在步骤D1中的规则推荐配置分为单规则推荐与组合推荐;
步骤D3:如果为单规则推荐,则自定义因变量Y和自变量X,并选择特征推荐方法;
步骤D4:根据步骤D3中的特征推荐方法生成推荐规则排行榜和推荐规则相关性矩阵;
所述步骤D4中的推荐规则排行榜包括推荐规则、规则含义、命中人数、命中率、坏占比、reca l l和l ift和分布图。
所述推荐规则相关性矩阵进行归一化处理。
在上述实施例中,底层采用spark基于内存中进行数据计算,计算速度更快,且支持80种高级算法,同时支持多种语言的API,更加容易使用,且更加方便的和其他产品进行融合,更大程度上提升了应用的健壮性,在步骤D中对特征、规则结果相关性系数计算,且提供了图形化的显示界面,更加有效的帮助业务人员对数据结果进行分析,在步骤A中,支持多种文件,如txt、csv、exce l文件格式的解析,能够实现数据源的多元化,同时对上传文件的类型和长度进行动态计算,减少人员配置的时间。
在本实施例中,分析数据进行分箱配置,包括单调分箱和最优分箱,通过上述两种分箱方式进行动态分箱,根据分箱结果对特征(IV、KS)计算,根据阈值过滤满足条件的特征变量;对过滤后的特征进行规则计算,同时满足条件的特征和规则的相关性。在上述步骤B中,得到的数据分析矩阵通过java实现算法逻辑直接调用到列出系统现有特征推荐算法中,步骤C中的推荐算法配置,同时进行算法上传和列出系统现有特征推荐算法,其中算法上传的内容包括算法名称、算法描述、语言选择(R或python),并选择本地脚本上传算法。
在本实施例的步骤D中,推荐规则排行榜内包括推荐规则、规则含义、命中人数、命中率、坏占比、reca l l和l ift和分布图,且在步骤D中的推荐规则相关性矩阵和步骤C中的特征推荐相关性矩阵进行归一化处理,通过该种处理方法,能够使数据处理更加便捷高效。
在本实施例中,数据来源主要包含2个。第一个数据来源:其他业务系统或者数据仓库等,为降低系统之间耦合,采用rabbitMQ进行消息对接,策略推荐系统为MQ中的消费者,提供数据分析的系统为MQ中的生产者。消息主要是告诉策略推荐系统有一个新的数据源,并且在消息中传入需要处理的文件的fi leI D,通过fi leI D策略推荐系统可以在对象存储KS3上面获取到需要分析的具体分析数据的文件。策略推荐系统接收到消息后,自动在数据源信息表中插入一条状态为:初始的数据。第二个数据来源为系统操作用户本地分析文件上传。用户本地文件上传支持txt,exce l,csv文件的数据。操作用户需要按照指定的格式和文件内容上传本地分析文件,其数据集上传页面如图2所示。
在数据清洗模块中,策略推荐管理子系统接收到MQ消息后,或者用户本地文件上传成功后,计算子系统会解析文件内容,将本次分析文件的字段名称、字段描述、字段类型存入数据集字段明细表,其中操作用户可以对原始数据中的字段明细信息进行修改,其中数据清洗模块如图3所示,字段明细信息修改页面如图4所示。
在本实施例中,操作用户可以点击“衍生变量编辑”链接,在系统右边的衍生变量定义区域进行数据加工。用户可以根据对原始数据集中字段进行各种表达式加工、四则运算,json解析、条件赋值、字符串切割、字符串拼接、时间间隔、或者一些常用函数等等。在原始数据集明细字段的基础上,衍生出一些新的字段变量。用于后续的数据分析和特征、规则计算。
在本实施例中,用户在衍生变量配置完毕后,点击界面上右上角“开始计算”按钮,系统会根据文件中的内容以及用户界面上的衍生变量配置,将数据解析,保存到mongoDB。同时、根据不同的字段的数据类型,进行不同字段的分布计算。可以让风险策略人员更加直观的查看数据的情况。
在本实施例中,在目标变量加工、特征、规则阈值配置中,一个数据集下面用户可以新增很多个任务,一个任务下面对应多个目标变量、多个特征推荐、规则推荐配置。用户在使用条件赋值表达式,对目标变量进行配置加工,得到目标变量Y,用户在特征变量区选择区域,选择定义的目标变量对应的特征变量X,得到一个目标变量和多个特征变量的分析矩阵。目标变量配置完毕后,且对应的分析矩阵指定完毕后,用户可以对刚刚配置的分析矩阵进行对应的特征计算配置。下拉选择特征推荐方法(IV\KS\AUC)分箱方法(单调分箱、最优分箱);特征配置完毕后,用户可以根据刚刚的分析矩阵,进行单规则、组合、三规则进行配置。
在本实施例中,用户所有配置完毕后,点击开始计算按钮。系统首先根据用户配置的目标变量、分析矩阵、特征计算方法,计算所有的特征变量的对应的值。同时、系统列出多个特征变量直接的相关性系数,然后筛选出大于用户配置的阈值的特征变量,再进行规则计算。最后显示出规则对应的l ift值大于用户配置阈值的规则,同时、系统会列出规则直接的相关性系数,并且系统可以下载对应的结果数据。
需要注意的是,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (9)
1.一种应用于金融行业的智能风控规则推荐方法,其特征在于,包括以下步骤:
步骤A:通过数据来源模块获取原始数据信息,系统化管理数据源,动态创建数据库表,并将数据库表中的原始字段信息传入数据清洗模块;
步骤B:数据清洗模块将数据库表中的原始字段信息进行特征加工,得到数据分析矩阵,并将数据分析矩阵传入特征加工模块;
步骤C:特征加工模块根据数据分析矩阵,根据特征计算方法,得到特征对应的分布图和特征值之间的相关性矩阵,进而得到特征变量X,并且生成相应的文件格式、且与特征X变量对应的分箱结果文件,将所述特征变量X和文件格式的分箱结果文件传入结果推荐模块;
步骤D:根据特征变量X和其对应的分箱结果文件计算对应规则的LIFT值,并将所有规则的LIFT值的结果和规则配置阈值对比,输出所有大于规则阈值的规则,并形成推荐规则排行榜和推荐规则相关性矩阵。
2.根据权利要求1所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,所述步骤A的具体步骤为:
步骤A1:选择数据来源,并进行判断,判断结果为本地文件上传或其他业务系统;
步骤A2:判断结果为其他业务系统,通过rabbitMQ+KS3进行信息交互,并传入文件于KS3上面存储的文件ID,通过文件ID下载对应文件,解析得到分析数据;
步骤A3:判断结果为本地文件上传,根据上传提示界面,输入对应数据,本地文件上传到KS3,解析本地文件,得到分析数据;
步骤A4:提供界面对数据来源进行管理,对数据来源对应的数据进行修改、删除、复制操作。
3.根据权利要求2所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,所述步骤B的具体步骤为:
步骤B1:根据数据库中对应的字段类型,进行常用表达式加工,指定因变量Y1、Y2.....,并解析加工完成后的字段名称、类型,描述得到衍生字段;
步骤B2:根据步骤B1中指定的因变量Y1、Y2.....,目标变量Y1对应的特征变量字段X1、X2.....,Y2对应的特征变量字段X1、X2.....,如果不指定则默认剩余所有字段作为X,并得到数据分析矩阵,并将数据分析矩阵传入特征加工模块。
4.根据权利要求1所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,所述步骤C的具体步骤为:
步骤C1:步骤B中得到的数据分析矩阵后,再根据因变量Y,进行特征推荐方法和分箱方法的配置,同时指定分箱个数,同时设定特征配置阈值;
步骤C2,根据因变量Y的配置,计算对应的特征值,系统显示特征值大于特征配置阈值的特征变量X1,X3,X5…,以及X1,X3,X5…的明细和X1,X3,X5..特征之间的相关性矩阵,将其计算结果传入规则计算。
5.根据权利要求4所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,所述步骤C2中的IV分布图中包括变量名、分组、总人数、坏人数、坏占比、区间占比和WOE和IV、KS分布图中包括变量名、分组、总人数、坏人数、好人数、累计坏总人数、累计好总人数、累计坏占比和累计好占比。
6.根据权利要求1所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,所述步骤D的具体步骤为:
步骤D1:规则计算配置中指定特征推荐的名称,系统自动带入大于特征阈值的特征变量和目标变量对应的分析矩阵,以及获得其特征变量对应的分箱结果文件;
步骤D2:、根据特征变量X的分箱结果文件,获取特征变量对应的cut_off点;
步骤D3:配置单规则、双规则、三规则的规则计算方法,和规则计算阈值;
步骤D4:根据步骤D1中的分析矩阵,和步骤D2中的特征变量对应的cut_off点,再根据步骤D3中配置的规则计算方法。计算所有分析矩阵中特征变量X对应的LIFT值;
步骤D5:根据步骤D3中指定的规则计算阈值,筛选出LIFT值大于规则推荐阈值的规则,生成推荐规则排行榜和推荐规则相关性矩阵。
7.根据权利要求6所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,所述步骤D5中的推荐规则排行榜包括推荐规则、规则含义、命中人数、命中率、坏占比、recall和lift和分布图。
8.根据权利要求6所述的一种应用于金融行业的智能风控规则推荐方法,其特征在于,对所述推荐规则相关性矩阵进行归一化处理。
9.一种应用权利要求1所述的应用于金融行业的智能风控规则推荐方法的系统,其特征在于,包括数据来源模块、数据清洗模块、特征加工模块和结果推荐模块,所述各个模块依次连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210185054.4A CN114611892B (zh) | 2022-02-28 | 2022-02-28 | 一种应用于金融行业的智能风控规则推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210185054.4A CN114611892B (zh) | 2022-02-28 | 2022-02-28 | 一种应用于金融行业的智能风控规则推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114611892A true CN114611892A (zh) | 2022-06-10 |
CN114611892B CN114611892B (zh) | 2024-07-16 |
Family
ID=81859535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210185054.4A Active CN114611892B (zh) | 2022-02-28 | 2022-02-28 | 一种应用于金融行业的智能风控规则推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611892B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117196823A (zh) * | 2023-09-08 | 2023-12-08 | 厦门国际银行股份有限公司 | 一种风控规则生成方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615503A (zh) * | 2018-10-26 | 2019-04-12 | 深圳市元征科技股份有限公司 | 一种信用风险的预测方法及相关设备 |
CN112330048A (zh) * | 2020-11-18 | 2021-02-05 | 中国光大银行股份有限公司 | 评分卡模型训练方法、装置、存储介质及电子装置 |
CN113821542A (zh) * | 2021-11-23 | 2021-12-21 | 四川新网银行股份有限公司 | 一种显著特征自动推荐系统及方法 |
CN113961774A (zh) * | 2021-12-22 | 2022-01-21 | 四川新网银行股份有限公司 | 一种多特征组合策略的推荐方法 |
-
2022
- 2022-02-28 CN CN202210185054.4A patent/CN114611892B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615503A (zh) * | 2018-10-26 | 2019-04-12 | 深圳市元征科技股份有限公司 | 一种信用风险的预测方法及相关设备 |
CN112330048A (zh) * | 2020-11-18 | 2021-02-05 | 中国光大银行股份有限公司 | 评分卡模型训练方法、装置、存储介质及电子装置 |
CN113821542A (zh) * | 2021-11-23 | 2021-12-21 | 四川新网银行股份有限公司 | 一种显著特征自动推荐系统及方法 |
CN113961774A (zh) * | 2021-12-22 | 2022-01-21 | 四川新网银行股份有限公司 | 一种多特征组合策略的推荐方法 |
Non-Patent Citations (1)
Title |
---|
赵鹏程: "基于特征选择的多维度数据预测与分类方法研究", 《中国优秀硕士学位论文全文数据库》, no. 7, 15 July 2021 (2021-07-15), pages 138 - 157 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117196823A (zh) * | 2023-09-08 | 2023-12-08 | 厦门国际银行股份有限公司 | 一种风控规则生成方法、系统及存储介质 |
CN117196823B (zh) * | 2023-09-08 | 2024-03-19 | 厦门国际银行股份有限公司 | 一种风控规则生成方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114611892B (zh) | 2024-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10963294B2 (en) | Cognitive cloud migration optimizer | |
CN110287019B (zh) | 用于云计算资源控制的多域表示的基于资源控制栈的系统 | |
US11481209B2 (en) | Intelligent software agent to facilitate software development and operations | |
CN107959640A (zh) | 网络业务调度方法及装置 | |
US11487584B2 (en) | Rule generation and tasking resources and attributes to objects system and method | |
WO2019060912A1 (en) | SYSTEMS AND METHODS FOR ANALYZING AUTONOMOUS DATA | |
US11915166B2 (en) | Method for facilitating network external computing assistance | |
US11750688B2 (en) | Cost-aware integration process modeling in multi-cloud computing environment | |
CN113052696B (zh) | 金融业务任务处理方法、装置、计算机设备和存储介质 | |
US20230022064A1 (en) | Contextual modeling using application metadata | |
CN111126621A (zh) | 在线模型训练方法及装置 | |
CN115170048B (zh) | 基于模型和规则的工作流实现方法、系统和介质 | |
CN109144562B (zh) | 一种基于zookeeper的智能代码发布告警方法 | |
CN114611892A (zh) | 一种应用于金融行业的智能风控规则推荐方法及系统 | |
CN115794106A (zh) | 一种轨道交通二进制协议数据配置式解析的方法及系统 | |
CN113448947B (zh) | 一种mongo数据库分布式部署运维的方法和装置 | |
JP2002149959A (ja) | 複数のビジネスプロセスに渡るコミュニケーションおよび意志決定のためのフレキシブルなシステムおよび方法 | |
CN117390109A (zh) | 一种基于人工智能的数据化可视决策辅助信息系统 | |
CN117408561A (zh) | 一种住宅工程建设监理方法、装置及电子设备 | |
US20210081250A1 (en) | Intelligent resource allocation agent for cluster computing | |
CN115964021A (zh) | 一种需求发布方法、装置、电子设备及存储介质 | |
CN110187936A (zh) | 数据回流平台、系统及方法 | |
US11106699B2 (en) | Computer system and method to update data aggregation configurations and control data aggregation | |
CN114579332A (zh) | 可动态配置算子的文本处理系统、方法、设备 | |
CN114443293A (zh) | 一种大数据平台的部署系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |