CN112907371A - 一种风控模型的训练方法 - Google Patents
一种风控模型的训练方法 Download PDFInfo
- Publication number
- CN112907371A CN112907371A CN202110203315.6A CN202110203315A CN112907371A CN 112907371 A CN112907371 A CN 112907371A CN 202110203315 A CN202110203315 A CN 202110203315A CN 112907371 A CN112907371 A CN 112907371A
- Authority
- CN
- China
- Prior art keywords
- data
- control model
- wind control
- storage module
- data storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000013500 data storage Methods 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000007689 inspection Methods 0.000 claims abstract description 7
- 230000005540 biological transmission Effects 0.000 claims description 9
- 230000010365 information processing Effects 0.000 claims description 3
- 238000007726 management method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000003245 working effect Effects 0.000 claims description 3
- 238000012797 qualification Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种风控模型的训练方法,其特征在于:所述金融领域的行为特征基于电脑的输入端进行执行,且模拟申请人的相关特征可通过电脑的输入端进行输入;所述训练样本集合的数据与数据存储模块相连,且数据存储模块可分为不同的储存空间进行汇总和分类,所述数据特征分类过后可以通过提取模块进行具体特征的提取,所述风控模型评分结束后,检查系统将会得出不合格信息特征的原因。该风控模型的训练方法数据处理器可以将输入的模拟申请人的相关特征中与金融领域的行为特征的重复项数据内容进行提取,然后通过与风控模型的具体项进行对比评分,使得评分更加精准,评分项可以得到分类,提高了系统的精准性。
Description
技术领域
本发明涉及风控模型技术领域,具体为一种风控模型的训练方法。
背景技术
风控模型,计算最高能够承受什么样的高风险客户,同时该如何把这些资产证券化并分散点风险给投行对自己是最有利的。强大的高频交易和程序化交易要求更快速的交易通道和更高效的策略模型;另一方面,快速交易导致投资面临的风险呈指数级增长,从而市场和投资者需要更全面的策略组合和更精准的风控模型进行风险对冲,在高度精细化的风险控制模型中,很重要的一个环节就是用先进的统计计量模型来更加准确的描述多种金融资产价格波动的关联性,这种高度量化的风控模型,将无时无刻不为交易所、清算所和各大券商经纪公司,实时计算未来各种资产组合的风险度,从而始终将各种金融交易的市场风险控制在合理的范围内,使衍生品市场交易能够稳定运行,最大可能的减少巨大价格波动给市场带来的危机。
但是风控模型缺乏一种其训练方法,一般的风控模型不能够将评分过后的不合格具体特征信息进行滤出,然后进行反复的处理,使得风控模型容易受到其他具体特征信息的影响导致评分结果不准确,而且不能够对最终评分的具体特征信息的不合格原因进行检查。
所以我们提出了一种风控模型的训练方法,以便于解决上述中提出的问题。
发明内容
本发明的目的在于提供一种风控模型的训练方法,以解决上述背景技术提出风控模型的评分不准确,容易受到其他数据的影响的问题。
为实现上述目的,本发明提供如下技术方案:一种风控模型的训练方法,所述金融领域的行为特征基于电脑的输入端进行执行,且模拟申请人的相关特征可通过电脑的输入端进行输入;
所述训练样本集合的数据与数据存储模块相连,且数据存储模块可分为不同的储存空间进行汇总和分类;
所述数据特征分类过后可以通过提取模块进行具体特征的提取,且提取到的数据可以有效的输入到电脑输入端的数据对比平台;
所述风控模型与数据处理的接收端相连,且风控模型内部将原有的数据标准与接收到的数据进行对比,并且风控模型可以将对比产生的结果进行风险的评分;
所述风控模型得出的评分可以被导出,且信息处理模块可以将低于标准数据特征要求的具体特征信息进行滤出;
所述低于标准数据特征要求的具体特征信息在滤出过后可以通过第二数据储存模块储存形成新的集合;
所述第二数据储存模块在储存结束后可以通过一个判断系统进行判断,从而判断是否能够再次回到风控模型对第二数据储存模块中的数据信息进行风险的评分;
所述风控模型评分结束后,检查系统将会得出不合格信息特征的原因。
优选的,所述储存在数据处理器内部的金融领域的行为特征包括:申请人年龄、收入。工作性质、家庭存款情况、家庭人口数,其中规则特征包括:申请人是不是第一次借款、和朋友之前有没有逾期过、直系亲属有无进入黑名单历史,其中直接提取的特征包括:申请人的二度关系中有多少个节点触碰了黑名单、工作收入和日常开销的比例,数据处理器可以将输入的模拟申请人的相关特征中与金融领域的行为特征的重复项数据内容进行提取。
优选的,所述提取的数据内容组成一个训练样本的集合,且组成的训练样本的集合可以进过储存器的管理模块进行整理分类和汇总。
优选的,所述提取模块提取到的数据通过在输送模块的输送下可以直接将数据传送至风控模型中。
优选的,所述风控模型内部的对比系统通过将组成的训练样本的集合中的数据与风控模型中已存在的标准数据进行对比,从而对训练样本的集合中的数据进行合格性的判定和整体的评分。
优选的,所述根据具体特征信息的评分判定是否需要将其滤出,评分低于标准的具体特征信息将会被滤出进入到第二数据储存模块中。
优选的,所述不合格的具体特征信息可以在第二数据储存模块中进行汇总和整理。
优选的,所述第二数据储存模块中的数据组成的新的训练集合将经过判断系统的判断,如果不超过两次,则信息传输模块将第二数据储存模块中的数据传输到风控模型中进行再一次的风险评分,如果判断出评分次数超过两次,则检查系统可以自动检查出新的训练集合中具体特征信息的不合格原因。
与现有技术相比,本发明的有益效果是:该风控模型的训练方法;
1、数据处理器可以将输入的模拟申请人的相关特征中与金融领域的行为特征的重复项数据内容进行提取,然后通过与风控模型的具体项进行对比评分,使得评分更加精准,评分项可以得到分类,提高了系统的精准性;
2、第二数据储存模块中的数据组成的新的训练集合将经过判断系统的判断,如果不超过两次,则信息传输模块将第二数据储存模块中的数据传输到风控模型中进行再一次的风险评分,使得多次评分降低了错误率,提高了系统方法的精准性;
3、不合格特征信息的数据可以自动进入到另一个数据储存模块中,然后检查系统可以将不合格特征信息的数据与标准信息进行对比,从而可以得出不合格具体特征的原因。
附图说明
图1为本发明总流程示意图;
图2为本发明样本集合路径示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供一种技术方案:一种风控模型的训练方法,所 述金融领域的行为特征基于电脑的输入端进行执行,且模拟申请人的相关特 征可通过电脑的输入端进行输入;
所述训练样本集合的数据与数据存储模块相连,且数据存储模块可分为 不同的储存空间进行汇总和分类;
所述数据特征分类过后可以通过提取模块进行具体特征的提取,且提取 到的数据可以有效的输入到电脑输入端的数据对比平台;
所述风控模型与数据处理的接收端相连,且风控模型内部将原有的数据 标准与接收到的数据进行对比,并且风控模型可以将对比产生的结果进行风 险的评分;
所述风控模型得出的评分可以被导出,且信息处理模块可以将低于标准 数据特征要求的具体特征信息进行滤出;
所述低于标准数据特征要求的具体特征信息在滤出过后可以通过第二数 据储存模块储存形成新的集合;
所述第二数据储存模块在储存结束后可以通过一个判断系统进行判断, 从而判断是否能够再次回到风控模型对第二数据储存模块中的数据信息进行 风险的评分;
所述风控模型评分结束后,检查系统将会得出不合格信息特征的原因。
本案例的所述储存在数据处理器内部的金融领域的行为特征包括:申请人年龄、收入。工作性质、家庭存款情况、家庭人口数,其中规则特征包括:申请人是不是第一次借款、和朋友之前有没有逾期过、直系亲属有无进入黑名单历史,其中直接提取的特征包括:申请人的二度关系中有多少个节点触碰了黑名单、工作收入和日常开销的比例,数据处理器可以将输入的模拟申请人的相关特征中与金融领域的行为特征的重复项数据内容进行提取,上述系统的设计,使得可以提取到有效的数据内容,避免了无关的数据对评分产生影响。
所述提取的数据内容组成一个训练样本的集合,且组成的训练样本的集合可以进过储存器的管理模块进行整理分类和汇总,上述系统的设计,使得训练样本集合的数据可以进行具体的分类和汇总,方便了与金融领域的行为特征的标准特征信息进行具体的对比。
所述提取模块提取到的数据通过在输送模块的输送下可以直接将数据传送至风控模型中,上述系统的设计,使得提取模块提取到的数据可以直接进入到风控模型中进行评分。
所述风控模型内部的对比系统通过将组成的训练样本的集合中的数据与风控模型中已存在的标准数据进行对比,从而对训练样本的集合中的数据进行合格性的判定和整体的评分,上述系统的设计,使得风控模型可以对训练样本的集合中的数据进行具体的评分和具体特征信息的合格性判定。
所述根据具体特征信息的评分判定是否需要将其滤出,评分低于标准的具体特征信息将会被滤出进入到第二数据储存模块中,上述系统的设计,使得可以实现不同评分的具体特征信息数据的分离。
所述不合格的具体特征信息可以在第二数据储存模块中进行汇总和整理,上述系统的设计,使得第二数据储存模块中整理后的数据可以直接通过数据信息输送模块输送至风控模型中进行对比和评分操作。
所述第二数据储存模块中的数据组成的新的训练集合将经过判断系统的判断,如果不超过两次,则信息传输模块将第二数据储存模块中的数据传输到风控模型中进行再一次的风险评分,如果判断出评分次数超过两次,则检查系统可以自动检查出新的训练集合中具体特征信息的不合格原因,上述系统的设计,使得第二数据储存模块中的数据可以反复的进入到风控模型中进行风险评分,从而使得可以对数据进行更具体的评分,降低了错误率,提高了系统方法的精准性。
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种风控模型的训练方法,其特征在于:所述金融领域的行为特征基于电脑的输入端进行执行,且模拟申请人的相关特征可通过电脑的输入端进行输入;
所述训练样本集合的数据与数据存储模块相连,且数据存储模块可分为不同的储存空间进行汇总和分类;
所述数据特征分类过后可以通过提取模块进行具体特征的提取,且提取到的数据可以有效的输入到电脑输入端的数据对比平台;
所述风控模型与数据处理的接收端相连,且风控模型内部将原有的数据标准与接收到的数据进行对比,并且风控模型可以将对比产生的结果进行风险的评分;
所述风控模型得出的评分可以被导出,且信息处理模块可以将低于标准数据特征要求的具体特征信息进行滤出;
所述低于标准数据特征要求的具体特征信息在滤出过后可以通过第二数据储存模块储存形成新的集合;
所述第二数据储存模块在储存结束后可以通过一个判断系统进行判断,从而判断是否能够再次回到风控模型对第二数据储存模块中的数据信息进行风险的评分;
所述风控模型评分结束后,检查系统将会得出不合格信息特征的原因。
2.根据权利要求1所述的一种风控模型的训练方法,其特征在于:所述储存在数据处理器内部的金融领域的行为特征包括:申请人年龄、收入。工作性质、家庭存款情况、家庭人口数,其中规则特征包括:申请人是不是第一次借款、和朋友之前有没有逾期过、直系亲属有无进入黑名单历史,其中直接提取的特征包括:申请人的二度关系中有多少个节点触碰了黑名单、工作收入和日常开销的比例,数据处理器可以将输入的模拟申请人的相关特征中与金融领域的行为特征的重复项数据内容进行提取。
3.根据权利要求2所述的一种风控模型的训练方法,其特征在于:所述提取的数据内容组成一个训练样本的集合,且组成的训练样本的集合可以进过储存器的管理模块进行整理分类和汇总。
4.根据权利要求1所述的一种风控模型的训练方法,其特征在于:所述提取模块提取到的数据通过在输送模块的输送下可以直接将数据传送至风控模型中。
5.根据权利要求4所述的一种风控模型的训练方法,其特征在于:所述风控模型内部的对比系统通过将组成的训练样本的集合中的数据与风控模型中已存在的标准数据进行对比,从而对训练样本的集合中的数据进行合格性的判定和整体的评分。
6.根据权利要求1所述的一种风控模型的训练方法,其特征在于:所述根据具体特征信息的评分判定是否需要将其滤出,评分低于标准的具体特征信息将会被滤出进入到第二数据储存模块中。
7.根据权利要求1所述的一种风控模型的训练方法,其特征在于:所述不合格的具体特征信息可以在第二数据储存模块中进行汇总和整理。
8.根据权利要求6所述的一种风控模型的训练方法,其特征在于:所述第二数据储存模块中的数据组成的新的训练集合将经过判断系统的判断,如果不超过两次,则信息传输模块将第二数据储存模块中的数据传输到风控模型中进行再一次的风险评分,如果判断出评分次数超过两次,则检查系统可以自动检查出新的训练集合中具体特征信息的不合格原因。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110203315.6A CN112907371A (zh) | 2021-02-23 | 2021-02-23 | 一种风控模型的训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110203315.6A CN112907371A (zh) | 2021-02-23 | 2021-02-23 | 一种风控模型的训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112907371A true CN112907371A (zh) | 2021-06-04 |
Family
ID=76124487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110203315.6A Pending CN112907371A (zh) | 2021-02-23 | 2021-02-23 | 一种风控模型的训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112907371A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270478A (zh) * | 2020-10-30 | 2021-01-26 | 重庆富民银行股份有限公司 | 用于风控模型竞争的管理方法及平台 |
CN114692724A (zh) * | 2022-03-03 | 2022-07-01 | 支付宝(杭州)信息技术有限公司 | 数据分类模型的训练方法、数据分类方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423871A (zh) * | 2017-04-24 | 2017-12-01 | 成都知数科技有限公司 | 金融风控领域多特征融合提取方法 |
CN110147823A (zh) * | 2019-04-16 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种风控模型训练方法、装置及设备 |
CN111369006A (zh) * | 2020-02-28 | 2020-07-03 | 上海蓝书信息科技有限公司 | 召回模型的生成方法及装置 |
CN112232947A (zh) * | 2020-10-23 | 2021-01-15 | 中国工商银行股份有限公司 | 贷中风险预测方法及装置 |
-
2021
- 2021-02-23 CN CN202110203315.6A patent/CN112907371A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423871A (zh) * | 2017-04-24 | 2017-12-01 | 成都知数科技有限公司 | 金融风控领域多特征融合提取方法 |
CN110147823A (zh) * | 2019-04-16 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种风控模型训练方法、装置及设备 |
CN111369006A (zh) * | 2020-02-28 | 2020-07-03 | 上海蓝书信息科技有限公司 | 召回模型的生成方法及装置 |
CN112232947A (zh) * | 2020-10-23 | 2021-01-15 | 中国工商银行股份有限公司 | 贷中风险预测方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270478A (zh) * | 2020-10-30 | 2021-01-26 | 重庆富民银行股份有限公司 | 用于风控模型竞争的管理方法及平台 |
CN112270478B (zh) * | 2020-10-30 | 2023-06-09 | 重庆富民银行股份有限公司 | 用于风控模型竞争的管理方法及平台 |
CN114692724A (zh) * | 2022-03-03 | 2022-07-01 | 支付宝(杭州)信息技术有限公司 | 数据分类模型的训练方法、数据分类方法和装置 |
CN114692724B (zh) * | 2022-03-03 | 2023-03-28 | 支付宝(杭州)信息技术有限公司 | 数据分类模型的训练方法、数据分类方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107025596B (zh) | 一种风险评估方法和系统 | |
CN110852856B (zh) | 一种基于动态网络表征的发票虚开识别方法 | |
CN112801498B (zh) | 风险识别模型的训练方法、风险识别方法、装置及设备 | |
CN111461216A (zh) | 一种基于机器学习的案件风险识别方法 | |
CN107807941A (zh) | 信息处理方法和装置 | |
CN112907371A (zh) | 一种风控模型的训练方法 | |
CN106203808A (zh) | 企业信用风险评估方法和装置 | |
CN108537273A (zh) | 一种针对不均衡样本执行自动化机器学习的方法 | |
CN113177839A (zh) | 一种信用风险评估方法、装置、存储介质和设备 | |
CN110309234A (zh) | 一种基于知识图谱的客户持仓预警方法、装置及存储介质 | |
CN112419029A (zh) | 类金融机构风险监控方法、风险模拟系统及存储介质 | |
CN108564465A (zh) | 一种企业信用管理方法 | |
CN111583012A (zh) | 融合文本信息的信用债发债主体违约风险评估方法 | |
CN116664012A (zh) | 一种基于大数据分析的企业信用评估方法及系统 | |
CN111754317A (zh) | 一种金融投资数据测评方法及系统 | |
CN111914542A (zh) | 疑似非法集资市场主体识别方法、装置、终端及存储介质 | |
CN114943458A (zh) | 一种基于权重分配模型的企业esg评级方法 | |
CN112037006A (zh) | 小微企业的信用风险识别方法及装置 | |
CN115423499A (zh) | 模型训练方法、价格预测方法、终端设备以及存储介质 | |
CN111047092A (zh) | 纠纷案件胜率预测方法、装置、计算机设备及存储介质 | |
CN107704869A (zh) | 一种语料数据抽样方法及模型训练方法 | |
CN115423600B (zh) | 数据筛选方法、装置、介质及电子设备 | |
CN114529255A (zh) | 一种基于风控评分卡的贷款自动审批方法及系统 | |
CN110795537B (zh) | 一种确定目标商品的改进策略的方法、装置、设备和介质 | |
CN114596152A (zh) | 基于无监督模型预测发债主体违约的方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210604 |