CN116757837A - 一种应用于中标贷的信用风控方法及系统 - Google Patents
一种应用于中标贷的信用风控方法及系统 Download PDFInfo
- Publication number
- CN116757837A CN116757837A CN202311057960.7A CN202311057960A CN116757837A CN 116757837 A CN116757837 A CN 116757837A CN 202311057960 A CN202311057960 A CN 202311057960A CN 116757837 A CN116757837 A CN 116757837A
- Authority
- CN
- China
- Prior art keywords
- data
- enterprise
- credit
- evaluated
- wind control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 230000002776 aggregation Effects 0.000 claims description 40
- 238000004220 aggregation Methods 0.000 claims description 40
- 238000004140 cleaning Methods 0.000 claims description 38
- 238000006243 chemical reaction Methods 0.000 claims description 36
- 230000004927 fusion Effects 0.000 claims description 19
- 238000007405 data analysis Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 18
- 238000013523 data management Methods 0.000 claims description 15
- 230000006399 behavior Effects 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 5
- 230000008439 repair process Effects 0.000 claims description 5
- 238000007619 statistical method Methods 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 230000002354 daily effect Effects 0.000 description 29
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本说明书实施例提供一种应用于中标贷的信用风控方法及系统,其中,所述系统包括:数据资源层,用于建立信息数据库;数据服务层,用于建立中标贷信用风控模型;还用于基于信息数据库,生成多个训练样本,对中标贷信用风控模型进行训练;还用于获取待评估企业的相关数据;还用于使用中标贷信用风控模型基于待评估企业的相关数据,确定待评估企业的信用风险,具有提高中标贷的贷款授信评估效率及准确度的优点。
Description
技术领域
本说明书涉及数据处理领域,特别涉及一种应用于中标贷的信用风控方法及系统。
背景技术
金融机构传统的组织模式、业务流程、审批模式无法满足中标贷的效率要求。中小微企业一旦中标,就需要垫资采购材料/设备,单大部门中小微企业都存在一个账期延后的情况,因此企业在中标后就需要资金,而金融机构传统的融资贷款授信模式无法满足中小微企业快速放款的需要,并且仅根据金融机构自身的风险数据,已无法满足融资担保信用风控的需求。
因此,需要提供一种应用于中标贷的信用风控方法及系统,用于提高中标贷的贷款授信评估效率及准确度。
发明内容
本说明书实施例之一提供一种应用于中标贷的信用风控方法,所述方法包括:建立信息数据库;建立中标贷信用风控模型;基于所述信息数据库,生成多个训练样本,对所述中标贷信用风控模型进行训练;获取待评估企业的相关数据,其中,所述待评估企业的相关数据至少包括所述待评估企业的交易行业数据、金融数据及社会数据,所述交易行业数据至少包括企业基本信息、企业交易信息、招投标黑名单、企业中标信息及企业财务报表,所述金融数据至少包括保证金缴纳信息及保函缴纳信息,所述社会数据至少包括案件信息、不良行为信息、网站备案信息、税务信用等级信息及商标信息;所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险。
在一些实施例中,所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险,包括:对所述待评估企业的相关数据进行数据汇聚、数据治理、数据融合及数据分析,生成特征向量,其中,所述特征向量至少包括历史中标次数、不良行为、历史投标次数、商标申请次数、税务等级、保证金缴纳金额、保函缴纳次数、财务报表及企业基本信息;所述中标贷信用风控模型基于所述特征向量,确定所述待评估企业的信用风险。
在一些实施例中,所述对所述待评估企业的相关数据进行数据汇聚,包括:创建切片作业,将所述待评估企业的相关数据抽取到历史数据表,使用非侵入式采集工具对所述待评估企业的相关数据实现数据增量,生成多个切片数据;创建增量日批作业,将多个切片数据去重汇聚到日批数据表;创建归档作业,将多个切片数据中满足归档条件的数据迁移到归档表;对所述待评估企业的相关数据进行数据治理,包括:配置一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,其中,配置清洗的数据转换规则包括:根据正则、约束条件识别异常数据进行替换或关联修复;根据源和目标字段的代码项,配置对应的转换规则;配置时间格式转换规则;配置字符串替换规则;配置大小写转换规则;根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对归档表的全量一次性清洗任务;根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对日批数据表的日批数据清洗任务;对所述待评估企业的相关数据进行数据融合,包括:将所述待评估企业的相关的至少一个所述日批数据表和/或至少一个所述归档表基于配置的多表对目标表的集成关系融合到实体聚合表,其中,配置所述多表对目标表的集成关系包括:配置字段映射关系;配置权威来源,以及来源优先级;配置业务主键;配置实体ID、实体名称为固定值;配置拉链控制字段默认值;配置拉链控制字段抽取;对所述待评估企业的相关数据进行数据分析,包括:对实体聚合表进行分析,形成新的决策性结果,将无序数据进行数据量化、在实体聚合表的字段上追加统计分析字段,形成统计数据,作为量化数据的一部分补充到信息数据库。
在一些实施例中,所述信息数据库包括原始资源库和指标库,其中,所述原始资源库用于存储多个样本企业的相关数据,所述样本企业的相关数据至少包括交易行业数据、金融数据及社会数据;所述待评估企业的相关数据至少包括所述待评估企业的交易行业数据、金融数据及社会数据。
在一些实施例中,所述基于所述信息数据库,生成多个训练样本,对所述中标贷信用风控模型进行训练,包括:对所述多个样本企业的相关数据进行预处理,生成多个训练样本;使用所述多个训练样本,对所述中标贷信用风控模型进行训练。
在一些实施例中,对所述多个样本企业的相关数据进行预处理,生成多个训练样本,包括:对所述多个样本企业的相关数据依次进行数据汇聚、数据治理、数据融合及数据分析,生成多个训练样本。
在一些实施例中,对所述多个样本企业的相关数据进行数据汇聚,包括:创建切片作业,将所述多个样本企业的相关数据抽取到历史数据表,使用非侵入式采集工具对所述多个样本企业的相关数据实现数据增量,生成多个切片数据;创建增量日批作业,将所述多个切片数据去重汇聚到日批数据表;创建归档作业,将所述多个切片数据中满足归档条件的数据迁移到归档表。
在一些实施例中,对所述多个样本企业的相关数据进行数据治理,包括:配置清洗规则;根据配置的清洗规则,生成对所述归档表的全量一次性清洗任务;根据配置的清洗规则,生成对所述日批数据表的日批数据清洗任务。
在一些实施例中,对所述多个样本企业的相关数据进行数据融合,包括:将至少一个所述日批数据表和/或至少一个所述归档表融合到实体聚合表。
本说明书实施例之一提供一种应用于中标贷的信用风控系统,所述系统包括:数据资源层,用于建立信息数据库;数据服务层,用于建立中标贷信用风控模型;还用于基于所述信息数据库,生成多个训练样本,对所述中标贷信用风控模型进行训练;还用于获取待评估企业的相关数据;还用于使用所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险。
本说明书实施例之一提供一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行一种应用于中标贷的信用风控方法。
本说明书实施例之一提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行一种应用于中标贷的信用风控方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的应用于中标贷的信用风控系统的模块图;
图2是根据本说明书一些实施例所示的数据预处理的流程示意图;
图3是根据本说明书一些实施例所示的应用于中标贷的信用风控方法的流程示意图;
图4是根据本说明书一些实施例所示的电子设备的结构框图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本说明书一些实施例所示的应用于中标贷的信用风控系统的模块图,如图1所示,应用于中标贷的信用风控系统可以包括:数据资源层及数据服务层。应用于中标贷的信用风控系统利用大数据技术,根据金融机构与当地交易中心的需求,灵活整合当地公共资源交易数据、三方数据、金融数据与社会数据,通过对数据资源的治理与转化,抓取特征向量(历史中标行为、不良行为、历史投标次数、税务等级、财务报表、企业基本信息等),建立公共资源交易中标贷信用风控模型,为交易中心侧金融产品前置程序提供风控能力输出,辅助金融机构进行风险识别。
在一些实施例中,应用于中标贷的信用风控系统可以通过以下步骤辅助金融机构进行风险识别:
步骤1,利用大数据技术存储硬件成本低、扩展性好的优势,建立统一的风险量化数据的数据库平台,构建原始资源库和指标库。
步骤2,利用大数据能力收集海量投标人数据,交易数据、社会数据、银行征信、第三方机构的数据,通过数据治理、数据清洗、数据转化、数据融合等大数据工具和手段,将差异化数据归集成标准化投标人数据。
步骤3,对归集到的标准化投标人数据,通过隐私计算的横向联邦学习,以样本联合为基本思想来进行模型训练,对数据提供隐私保护。
步骤4,和风控专家共同设计中标贷信用风控模型,规划风控模型的风险特征,如招投标黑名单信息、税务评级、企业投标中标信息、不良行为、网站备案、银行征信、企业商标信息、企业基本信息、企业经营实力等。
步骤5,使用大数据工具将特征对应的海量数据进行归一化处理,形成低维embedding向量,并做成训练集。
步骤6,将训练数据放入到中标贷信用风控模型中,进行模型训练。
步骤7,经过多轮训练迭代直至AUC(Area Under Curve)值达到最高,得到最终的中标贷信用风控模型。
步骤8,将中标贷信用风控模型的计算能力以服务的形式,通过接口对外进行赋能。
数据资源层可以用于建立信息数据库。
在一些实施例中,信息数据库包括原始资源库和指标库,其中,原始资源库用于存储多个样本企业的相关数据,样本企业的相关数据至少包括交易行业数据、金融数据及社会数据。待评估企业的相关数据至少包括待评估企业的交易行业数据、金融数据及社会数据。交易行业数据可以至少包括企业基本信息、企业交易信息、招投标黑名单、企业中标信息、企业财务报表,金融数据可以至少包括保证金缴纳信息、保函缴纳信息,社会数据可以至少包括案件信息、不良行为信息、网站备案信息、税务信用等级信息、商标信息。
在一些实施例中,数据资源层可以通过ETL(Extract-Transform-Load)等工具将交易行业数据抽取到原始资源库,可以通过共享交换平台将金融数据主动推送到原始资源库,还可以通过数据接口形式将第三方提供的社会数据同步到原始资源库。
数据服务层可以用于建立中标贷信用风控模型,其中,中标贷信用风控模型可以为基于循环神经网络(RNN)建立的机器学习模型。
数据服务层还可以用于基于信息数据库,生成多个训练样本,对中标贷信用风控模型进行训练。
在一些实施例中,数据服务层还可以对多个样本企业的相关数据进行预处理,生成多个训练样本;使用多个训练样本,对中标贷信用风控模型进行训练。
图2是根据本说明书一些实施例所示的数据预处理的流程示意图,如图2所示,在一些实施例中,数据服务层还可以对多个样本企业的相关数据依次进行数据汇聚、数据治理、数据融合及数据分析,生成多个训练样本。
在一些实施例中,数据服务层进行数据汇聚可以包括:
创建切片作业,将多个样本企业的相关数据抽取到历史数据表,使用非侵入式采集工具对多个样本企业的相关数据实现数据增量,生成多个切片数据;
创建增量日批作业,将多个切片数据去重汇聚到日批数据表;
创建归档作业,将多个切片数据中满足归档条件的数据迁移到归档表。
在一些实施例中,数据服务层进行数据治理可以包括:
配置清洗规则;
根据配置的清洗规则,生成对归档表的全量一次性清洗任务;
根据配置的清洗规则,生成对日批数据表的日批数据清洗任务;
在一些实施例中,配置清洗规则可以包括:配置一对一的表关系、配置字段和字段的映射关系、配置清洗的数据转换规则。其中,配置清洗的数据转换规则可以包括:根据正则、约束条件识别异常数据进行替换或关联修复;根据源和目标字段的代码项,配置对应的转换规则;时间格式转换规则;字符串替换规则;大小写转换规则。其中,字符串替换主要应用于数据治理过程中,遇到的字符内容不规范的问题,需要对部分内容进行批量的转化,清理多余的符号标记,以使数据更加的规范。例如,将数据“XX项目-项目编号-A标段、B标段、C标段”进行清洗后,生成以下三个数据“XX项目-项目编号-A标段”、“XX项目-项目编号-B标段”、“XX项目-项目编号-C标段”。
可以理解的,在数据治理的应用中,字符串的替换可以更加复杂,字符的内容也会更加的杂乱,例如,把无数据替换成空字符串,去除无效字符类型,针对不同标段的投标企业以及最终的中标企业的一些基本信息进行匹配、替换等。
在一些实施例中,数据服务层还可以将至少一个日批数据表和/或至少一个归档表融合到实体聚合表。具体可以包括:配置多表对目标表的集成关系;配置字段映射关系;配置权威来源,以及来源优先级;配置业务主键;配置实体ID、实体名称为固定值;拉链控制字段默认值;拉链控制字段抽取同上。
在一些实施例中,拉链控制字段默认值可以包括:有效期起始时间抽取标准层的业务时间、有效期终止时间默认为9999-12-31、当前记录标识默认为1。
在一些实施例中,数据服务层对多个样本企业的相关数据依次进行数据分析可以包括:对实体聚合表进行分析,形成新的决策性结果,将无序数据进行数据量化、在实体聚合表的字段上追加统计分析字段,形成统计数据,作为量化数据的一部分补充到信息数据库。
数据服务层还可以用于获取待评估企业的相关数据。
数据服务层还可以用于使用中标贷信用风控模型基于待评估企业的相关数据,确定待评估企业的信用风险。
具体包括:
对待评估企业的相关数据进行数据汇聚、数据治理、数据融合及数据分析,生成特征向量,其中,特征向量至少包括历史中标次数、不良行为、历史投标次数、商标申请次数、税务等级、保证金缴纳金额、保函缴纳次数、财务报表及企业基本信息;
中标贷信用风控模型基于特征向量,确定待评估企业的信用风险;
对待评估企业的相关数据进行数据汇聚,包括:
创建切片作业,将待评估企业的相关数据抽取到历史数据表,使用非侵入式采集工具对待评估企业的相关数据实现数据增量,生成多个切片数据;
创建增量日批作业,将多个切片数据去重汇聚到日批数据表;
创建归档作业,将多个切片数据中满足归档条件的数据迁移到归档表;
对待评估企业的相关数据进行数据治理,包括:
配置一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,其中,配置清洗的数据转换规则包括:根据正则、约束条件识别异常数据进行替换或关联修复;根据源和目标字段的代码项,配置对应的转换规则;配置时间格式转换规则;配置字符串替换规则;配置大小写转换规则;
根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对归档表的全量一次性清洗任务;
根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对日批数据表的日批数据清洗任务;
对待评估企业的相关数据进行数据融合,包括:
将待评估企业的相关的至少一个日批数据表和/或至少一个归档表基于配置的多表对目标表的集成关系融合到实体聚合表,其中,配置多表对目标表的集成关系包括:配置字段映射关系;配置权威来源,以及来源优先级;配置业务主键;配置实体ID、实体名称为固定值;配置拉链控制字段默认值;配置拉链控制字段抽取;
对待评估企业的相关数据进行数据分析,包括:
对实体聚合表进行分析,形成新的决策性结果,将无序数据进行数据量化、在实体聚合表的字段上追加统计分析字段,形成统计数据,作为量化数据的一部分补充到信息数据库。
在一些实施例中,应用于中标贷的信用风控系统至少具备以下有益效果:
1、基于大数据的数据分析能力,归集数据后进行数据治理与转化,形成中标贷信用风控模型并进行模型运行与监控,为交易中心侧金融产品前置程序提供风控能力输出,同时辅助金融机构进行风险识别。与传统的信用风控模式相比本发明的信用风控数据范围更全面、类型更多样,信用风控模型更先进,实现了对风险数据的“知、治、智”;
2、信用风控数据范围更全面、类型更多样:数据资源层除了基础的企业社会数据与金融机构内部数据以外,还为金融机构接入了交易行业的相关交易数据,对数据指标类型也进行了扩充,让中标贷业务在符合公共资源交易领域规定的同时,还能为金融机构提供更准确的信用风控结果;
3、中标贷信用风控模型更先进:深挖大数据风控应用场景,通过对外部系统中产生的交易数据的前期预处理,结合相应的风控规则,抓取特征向量后,对数据进行迭代训练,形成数据模型。中标贷信用风控模型会随着数据的不断获取而迭代优化,实现了模型的自动更新,提升了模型的复用性。
需要注意的是,以上对于考虑风电预测扰动的负荷频率控制系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。在一些实施例中,图1中披露的第一侧数据接收模块、第二侧数据接收模块、数据上链模块、保函验证模块、数据查询模块、风险评估模块及数据分析模块可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本说明书的保护范围之内。
图3是根据本说明书一些实施例所示的应用于中标贷的信用风控方法的流程示意图,在一些实施例中,应用于中标贷的信用风控方法可以由应用于中标贷的信用风控系统执行。例如,应用于中标贷的信用风控方法可以以程序或指令的形式存储在存储设备中,当应用于中标贷的信用风控系统执行指令时,可以实现应用于中标贷的信用风控方法。下面呈现的应用于中标贷的信用风控方法的操作示意图是说明性的。在一些实施例中,可以利用一个或以上未描述的附加操作和/或未讨论的一个或以上操作来完成该过程。另外,图3中示出的和下面描述的应用于中标贷的信用风控方法的操作的顺序并非限制性的。如图3所示,应用于中标贷的信用风控方法可以包括以下步骤。
步骤310,建立信息数据库。
在一些实施例中,信息数据库包括原始资源库和指标库,其中,原始资源库用于存储多个样本企业的相关数据,样本企业的相关数据至少包括交易行业数据、金融数据及社会数据。
步骤320,建立中标贷信用风控模型。
步骤330,基于信息数据库,生成多个训练样本,对中标贷信用风控模型进行训练。
在一些实施例中,基于信息数据库,生成多个训练样本,对中标贷信用风控模型进行训练,包括:
对多个样本企业的相关数据进行预处理,生成多个训练样本;
使用多个训练样本,对中标贷信用风控模型进行训练。
在一些实施例中,对多个样本企业的相关数据进行预处理,生成多个训练样本,包括:
对多个样本企业的相关数据依次进行数据汇聚、数据治理、数据融合及数据分析,生成多个训练样本。
在一些实施例中,对多个样本企业的相关数据进行数据汇聚,包括:
创建切片作业,将多个样本企业的相关数据抽取到历史数据表,使用非侵入式采集工具对多个样本企业的相关数据实现数据增量,生成多个切片数据;
创建增量日批作业,将多个切片数据去重汇聚到日批数据表;
创建归档作业,将多个样本企业中满足归档条件的数据迁移到归档表。
在一些实施例中,对多个样本企业的相关数据进行数据治理,包括:
配置清洗规则;
根据配置的清洗规则,生成对归档表的全量一次性清洗任务;
根据配置的清洗规则,生成对日批数据表的日批数据清洗任务。
在一些实施例中,对多个样本企业的相关数据进行数据融合,包括:
将至少一个日批数据表和/或至少一个归档表融合到实体聚合表。
步骤340,获取待评估企业的相关数据。
在一些实施例中,待评估企业的相关数据至少包括待评估企业的交易行业数据、金融数据及社会数据。
步骤350,中标贷信用风控模型基于待评估企业的相关数据,确定待评估企业的信用风险。
具体的,中标贷信用风控模型基于待评估企业的相关数据,确定待评估企业的信用风险,包括:
对待评估企业的相关数据进行数据汇聚、数据治理、数据融合及数据分析,生成特征向量,其中,特征向量至少包括历史中标次数、不良行为、历史投标次数、商标申请次数、税务等级、保证金缴纳金额、保函缴纳次数、财务报表及企业基本信息;
中标贷信用风控模型基于特征向量,确定待评估企业的信用风险;
对待评估企业的相关数据进行数据汇聚,包括:
创建切片作业,将待评估企业的相关数据抽取到历史数据表,使用非侵入式采集工具对待评估企业的相关数据实现数据增量,生成多个切片数据;
创建增量日批作业,将多个切片数据去重汇聚到日批数据表;
创建归档作业,将多个切片数据中满足归档条件的数据迁移到归档表;
对待评估企业的相关数据进行数据治理,包括:
配置一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,其中,配置清洗的数据转换规则包括:根据正则、约束条件识别异常数据进行替换或关联修复;根据源和目标字段的代码项,配置对应的转换规则;配置时间格式转换规则;配置字符串替换规则;配置大小写转换规则;
根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对归档表的全量一次性清洗任务;
根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对日批数据表的日批数据清洗任务;
对待评估企业的相关数据进行数据融合,包括:
将待评估企业的相关的至少一个日批数据表和/或至少一个归档表基于配置的多表对目标表的集成关系融合到实体聚合表,其中,配置多表对目标表的集成关系包括:配置字段映射关系;配置权威来源,以及来源优先级;配置业务主键;配置实体ID、实体名称为固定值;配置拉链控制字段默认值;配置拉链控制字段抽取;
对待评估企业的相关数据进行数据分析,包括:
对实体聚合表进行分析,形成新的决策性结果,将无序数据进行数据量化、在实体聚合表的字段上追加统计分析字段,形成统计数据,作为量化数据的一部分补充到信息数据库。
在一些实施例中,将从各个渠道获取的待评估企业的交易行业数据、金融数据及社会数据收集至前置库,每天的凌晨12点对前置库里的数据信息进行定时更新,根据单位统一信用代码和数据唯一标识符,来判断数据是新增插入还是覆盖插入,等到前置库里的信息更新完成后,将数据更新至贴源层并主动驱动数据按照规定好的一级指标、二级指标等进行清洗融合,例如,一级指标可以包括企业基本信息、企业投标信息、企业行政监管信息、企业司法监管信息及企业知识产权信息等;最后中标贷信用风控模型可以根据相应的算分指令,按照指标项逐一算分,然后将各个指标项按照一定的权重,累加后得到待评估企业的信用风险。
关于应用于中标贷的信用风控方法的更多描述可以参见图2及其相关描述,此处不再赘述。
图4是根据本说明书一些实施例所示的电子设备的结构框图,如图4所示,其是可以应用于本发明的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备包括计算单元,其可以根据存储在只读存储器(ROM)中的计算机程序或者从存储单元加载到随机访问存储器(RAM)中的计算机程序,来执行各种适当的动作和处理。在RAM中,还可存储设备操作所需的各种程序和数据。计算单元、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
电子设备中的多个部件连接至I/O接口,包括:输入单元、输出单元、存储单元以及通信单元。输入单元可以是能向电子设备输入信息的任何类型的设备,输入单元可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元可以包括但不限于磁盘、光盘。通信单元允许电子设备通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元执行上文所描述的各个方法和处理。例如,在一些实施例中,应用于中标贷的信用风控方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元。在一些实施例中,计算机程序的部分或者全部可以经由ROM和/或通信单元而被载入和/或安装到电子设备上。在一些实施例中,计算单元可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行应用于中标贷的信用风控方法。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (10)
1.一种应用于中标贷的信用风控方法,其特征在于,包括:
建立信息数据库;
建立中标贷信用风控模型;
基于所述信息数据库,生成多个训练样本,对所述中标贷信用风控模型进行训练;
获取待评估企业的相关数据,其中,所述待评估企业的相关数据至少包括所述待评估企业的交易行业数据、金融数据及社会数据,所述交易行业数据至少包括企业基本信息、企业交易信息、招投标黑名单、企业中标信息及企业财务报表,所述金融数据至少包括保证金缴纳信息及保函缴纳信息,所述社会数据至少包括案件信息、不良行为信息、网站备案信息、税务信用等级信息及商标信息;
所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险。
2.根据权利要求1所述的一种应用于中标贷的信用风控方法,其特征在于,所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险,包括:
对所述待评估企业的相关数据进行数据汇聚、数据治理、数据融合及数据分析,生成特征向量,其中,所述特征向量至少包括历史中标次数、不良行为、历史投标次数、商标申请次数、税务等级、保证金缴纳金额、保函缴纳次数、财务报表及企业基本信息;
所述中标贷信用风控模型基于所述特征向量,确定所述待评估企业的信用风险。
3.根据权利要求2所述的一种应用于中标贷的信用风控方法,其特征在于,所述对所述待评估企业的相关数据进行数据汇聚,包括:
创建切片作业,将所述待评估企业的相关数据抽取到历史数据表,使用非侵入式采集工具对所述待评估企业的相关数据实现数据增量,生成多个切片数据;
创建增量日批作业,将多个切片数据去重汇聚到日批数据表;
创建归档作业,将多个切片数据中满足归档条件的数据迁移到归档表;
对所述待评估企业的相关数据进行数据治理,包括:
配置一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,其中,配置清洗的数据转换规则包括:根据正则、约束条件识别异常数据进行替换或关联修复;根据源和目标字段的代码项,配置对应的转换规则;配置时间格式转换规则;配置字符串替换规则;配置大小写转换规则;
根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对归档表的全量一次性清洗任务;
根据配置的一对一的表关系、字段和字段的映射关系、清洗的数据转换规则,生成对日批数据表的日批数据清洗任务;
对所述待评估企业的相关数据进行数据融合,包括:
将所述待评估企业的相关的至少一个所述日批数据表和/或至少一个所述归档表基于配置的多表对目标表的集成关系融合到实体聚合表,其中,配置所述多表对目标表的集成关系包括:配置字段映射关系;配置权威来源,以及来源优先级;配置业务主键;配置实体ID、实体名称为固定值;配置拉链控制字段默认值;配置拉链控制字段抽取;
对所述待评估企业的相关数据进行数据分析,包括:
对实体聚合表进行分析,形成新的决策性结果,将无序数据进行数据量化、在实体聚合表的字段上追加统计分析字段,形成统计数据,作为量化数据的一部分补充到信息数据库。
4.根据权利要求1所述的一种应用于中标贷的信用风控方法,其特征在于,所述信息数据库包括原始资源库和指标库,其中,所述原始资源库用于存储多个样本企业的相关数据,所述样本企业的相关数据至少包括交易行业数据、金融数据及社会数据。
5.根据权利要求4所述的一种应用于中标贷的信用风控方法,其特征在于,所述基于所述信息数据库,生成多个训练样本,对所述中标贷信用风控模型进行训练,包括:
对所述多个样本企业的相关数据进行预处理,生成多个训练样本;
使用所述多个训练样本,对所述中标贷信用风控模型进行训练。
6.根据权利要求5所述的一种应用于中标贷的信用风控方法,其特征在于,对所述多个样本企业的相关数据进行预处理,生成多个训练样本,包括:
对所述多个样本企业的相关数据依次进行数据汇聚、数据治理、数据融合及数据分析,生成多个训练样本。
7.根据权利要求6所述的一种应用于中标贷的信用风控方法,其特征在于,对所述多个样本企业的相关数据进行数据汇聚,包括:
创建切片作业,将所述多个样本企业的相关数据抽取到历史数据表,使用非侵入式采集工具对所述多个样本企业的相关数据实现数据增量,生成多个切片数据;
创建增量日批作业,将所述多个切片数据去重汇聚到日批数据表;
创建归档作业,将所述多个切片数据中满足归档条件的数据迁移到归档表。
8.根据权利要求7所述的一种应用于中标贷的信用风控方法,其特征在于,对所述多个样本企业的相关数据进行数据治理,包括:
配置清洗规则;
根据配置的清洗规则,生成对所述归档表的全量一次性清洗任务;
根据配置的清洗规则,生成对所述日批数据表的日批数据清洗任务。
9.根据权利要求6所述的一种应用于中标贷的信用风控方法,其特征在于,对所述多个样本企业的相关数据进行数据融合,包括:
将至少一个所述日批数据表和/或至少一个所述归档表融合到实体聚合表。
10.一种应用于中标贷的信用风控系统,其特征在于,包括:
数据资源层,用于建立信息数据库;
数据服务层,用于建立中标贷信用风控模型;还用于基于所述信息数据库,生成多个训练样本,对所述中标贷信用风控模型进行训练;还用于获取待评估企业的相关数据;还用于使用所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险;
其中,所述中标贷信用风控模型基于所述待评估企业的相关数据,确定所述待评估企业的信用风险,包括:
对所述待评估企业的相关数据进行数据汇聚、数据治理、数据融合及数据分析,生成特征向量,其中,所述特征向量至少包括历史中标次数、不良行为、历史投标次数、商标申请次数、税务等级、保证金缴纳金额、保函缴纳次数、财务报表及企业基本信息;
所述中标贷信用风控模型基于所述特征向量,确定所述待评估企业的信用风险。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311057960.7A CN116757837A (zh) | 2023-08-22 | 2023-08-22 | 一种应用于中标贷的信用风控方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311057960.7A CN116757837A (zh) | 2023-08-22 | 2023-08-22 | 一种应用于中标贷的信用风控方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116757837A true CN116757837A (zh) | 2023-09-15 |
Family
ID=87955591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311057960.7A Pending CN116757837A (zh) | 2023-08-22 | 2023-08-22 | 一种应用于中标贷的信用风控方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757837A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117764703A (zh) * | 2024-02-21 | 2024-03-26 | 银联数据服务有限公司 | 一种申请业务行为的评估方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798311A (zh) * | 2020-07-22 | 2020-10-20 | 睿智合创(北京)科技有限公司 | 基于大数据的银行风险分析库平台、搭建方法及可读介质 |
CN112017025A (zh) * | 2020-08-26 | 2020-12-01 | 天元大数据信用管理有限公司 | 一种基于深度学习与逻辑回归相融合的企业信用评估方法 |
CN113822542A (zh) * | 2021-08-30 | 2021-12-21 | 天元大数据信用管理有限公司 | 一种基于政务大数据的企业征信平台构建方法 |
CN115330526A (zh) * | 2022-08-25 | 2022-11-11 | 天元大数据信用管理有限公司 | 一种企业信用评分方法及装置 |
CN115481111A (zh) * | 2022-09-29 | 2022-12-16 | 上海浦东发展银行股份有限公司 | 数据融合方法、装置、计算机设备和存储介质 |
-
2023
- 2023-08-22 CN CN202311057960.7A patent/CN116757837A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798311A (zh) * | 2020-07-22 | 2020-10-20 | 睿智合创(北京)科技有限公司 | 基于大数据的银行风险分析库平台、搭建方法及可读介质 |
CN112017025A (zh) * | 2020-08-26 | 2020-12-01 | 天元大数据信用管理有限公司 | 一种基于深度学习与逻辑回归相融合的企业信用评估方法 |
CN113822542A (zh) * | 2021-08-30 | 2021-12-21 | 天元大数据信用管理有限公司 | 一种基于政务大数据的企业征信平台构建方法 |
CN115330526A (zh) * | 2022-08-25 | 2022-11-11 | 天元大数据信用管理有限公司 | 一种企业信用评分方法及装置 |
CN115481111A (zh) * | 2022-09-29 | 2022-12-16 | 上海浦东发展银行股份有限公司 | 数据融合方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
孔宪光: "《工业互联网技术及应用》", 华中科技大学出版社, pages: 142 - 145 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117764703A (zh) * | 2024-02-21 | 2024-03-26 | 银联数据服务有限公司 | 一种申请业务行为的评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020220810A1 (zh) | 数据融合的方法和装置 | |
CN110197280B (zh) | 一种知识图谱构建方法、装置及系统 | |
CN106407278B (zh) | 一种大数据平台的架构设计系统 | |
EP3779729A1 (en) | Feature relationship recommendation method and apparatus, computing device and storage medium | |
CN111949643A (zh) | 基于业务建模的数据处理方法及系统 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN110880124A (zh) | 转化率评估方法及装置 | |
CN110544035A (zh) | 一种内控检测方法、系统和计算机可读存储介质 | |
CN116757837A (zh) | 一种应用于中标贷的信用风控方法及系统 | |
CN111192133A (zh) | 用户贷后风险模型生成方法、装置及电子设备 | |
CN114238655A (zh) | 企业关联关系识别方法、装置、设备及介质 | |
CN111160926A (zh) | 一种中小企业智能咨询服务云架构 | |
CN114723543A (zh) | 一种跨境电商的财务档案大数据管理系统及方法 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
CN113361959A (zh) | 一种银行业务集中运营成熟度的计算方法和装置 | |
CN112860672A (zh) | 标签权重的确定方法和装置 | |
CN110597796B (zh) | 基于全生命周期的大数据实时建模方法及系统 | |
CN117196808A (zh) | 一种同业业务的流动性风险预测方法及相关装置 | |
US11227288B1 (en) | Systems and methods for integration of disparate data feeds for unified data monitoring | |
CN112199395A (zh) | 一种人工智能分析方法及系统 | |
CN114969018B (zh) | 一种数据监控方法及系统 | |
CN116342137A (zh) | 客户数据回收再分配方法、装置、计算机设备及存储介质 | |
CN115034762A (zh) | 一种岗位推荐方法、装置、存储介质、电子设备及产品 | |
US11593740B1 (en) | Computing system for automated evaluation of process workflows | |
CN114048325A (zh) | 基于知识图谱的案件处理方法及装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |