CN115099957A - 一种企业信息数据处理方法及装置 - Google Patents
一种企业信息数据处理方法及装置 Download PDFInfo
- Publication number
- CN115099957A CN115099957A CN202210780660.0A CN202210780660A CN115099957A CN 115099957 A CN115099957 A CN 115099957A CN 202210780660 A CN202210780660 A CN 202210780660A CN 115099957 A CN115099957 A CN 115099957A
- Authority
- CN
- China
- Prior art keywords
- index
- index data
- data
- enterprise
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 50
- 238000011156 evaluation Methods 0.000 claims abstract description 27
- 238000009826 distribution Methods 0.000 claims description 26
- 238000013139 quantization Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000012797 qualification Methods 0.000 abstract description 36
- 238000005516 engineering process Methods 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 17
- 238000009825 accumulation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000029305 taxis Effects 0.000 description 4
- 238000011835 investigation Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 238000000586 desensitisation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011867 re-evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种企业信息数据处理方法及装置。涉及金融科技领域,该方法包括:获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;根据多个第一指标数据确定第一指标合格率;根据第一指标合格率以及多个第二指标数据确定第一风险等级,解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
Description
技术领域
本申请涉及金融科技领域,具体而言,涉及一种企业信息数据处理方法及装置。
背景技术
随着我国市场经济的蓬勃发展,小微经济在我国的整体经济体系中越发凸显了重要地位。与大型企业和中型企业相比,小微企业拥有着独特且不可替代的显著作用,比如提供了一定数量的就业岗位、推动技术创新等。因此,小微经济得到国家和政府的大力支持,成为维持“民生”的经济新支柱。
尽管国家和政府越来越重视小微企业的发展,但是资金问题却是大多数小微企业面对的难题:资金短缺导致企业不得不向金融机构申请贷款,但是不管是国有金融机构还是商业金融机构,出于利益等方面的考虑,在借贷方面都更偏爱和倾向于一些规模较大的企业,并且愿意给这些企业提供高额贷款。而小微企业由于制度不够完善、员工流动频繁、客户来源不稳定等问题导致了其贷款难度大和和所获贷款少。因此使得小微企业的资金链紧张,企业资金流动性变差,日常经营出现问题,无法做大做强,甚至出现企业倒闭的情况。
从整体来看,金融机构不愿意借贷给小微企业的根本原因在于对于小微型企业的信用风险得不到有效和准确的评估,这就导致了小微企业有贷款需求而金融机构不愿意冒险借贷,以及如果借贷给企业,而企业倒闭致使金融机构信贷坏账增加的风险。如果可以利用借贷企业的多种信息,综合考虑各种风险,并结合现有的机器学习算法,开发出一套针对小微企业贷款风险的完整评估流程,那么就更有利于金融机构决定是否借贷和提供何种程度的贷款金额,并且防止坏账概率增加等风险。
针对相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种企业信息数据处理方法及装置,以解决相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种企业信息数据处理方法。该方法包括:获取待评估企业的企业信息数据,根据预设规则将所述企业信息数据分为多个第一指标数据和多个第二指标数据,其中,所述第一指标数据为主观评估的指标数据,所述第二指标数据为能够客观量化的指标数据;根据所述多个第一指标数据确定第一指标合格率;根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级。
可选的,根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级包括:在所述第一指标合格率满足预设条件的情况下,根据所述多个第二指标数据确定每个第二指标数据对应的量化值;将所述多个第二指标数据的量化值输入向量机模型,确定所述第一风险等级。
可选的,将所述多个第二指标数据的量化值输入所述向量机模型,确定第一风险等级还包括:将所述多个第二指标数据的量化值输入向量机模型;根据所述向量机模型确定所述待评估企业的多个不同的风险等级的概率分布,其中,所述第一风险等级为所述多个不同的风险等级中的一个;根据所述概率分布,确定所述第一风险等级。
可选的,将所述多个第二指标数据的量化值输入所述向量机模型,确定第一风险等级之前还包括:获取历史指标数据,对所述历史指标数据进行筛选及数据清洗,确定多个第二指标历史数据,其中,所述多个第二指标历史数据中包括不同企业的第二指标历史数据的历史量化值,以及所述不同企业的企业历史风险等级;将所述多个第二指标历史数据的历史量化值及所述企业历史风其险等级作为训练样本,对所述向量机模型进行训练,直至所述向量机模型收敛。
可选的,在所述第一指标合格率满足预设条件的情况下,根据所述多个第二指标数据确定每个第二指标数据对应的量化值包括:在所述第一指标合格率小于第一指标合格率阈值的情况下,直接确定所述第一风险等级为不予贷款的风险等级;在所述第一指标合格率大于等于所述第一指标合格率阈值的情况下,执行根据所述多个第二指标数据确定每个第二指标数据对应的量化值的步骤。
可选的,根据所述多个第一指标数据确定第一指标合格率包括:确定所述第一指标数据的总数量,以及每个所述第一指标数据是否合格;将合格的第一指标数据的数量,与所述总数量的比值,作为所述第一指标合格率。
可选的,根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级之后,所述方法还包括:获取第三指标数据,根据所述第三指标数据确定目标概率,其中,所述第三指标数据为所述待评估企业的金融资产数据,所述目标概率为所述待评估企业的资产交易风险概率;根据所述第一风险等级以及所述目标概率,确定目标风险等级。
为了实现上述目的,根据本申请的另一方面,提供了一种企业信息数据处理装置。该装置包括:获取模块,获取待评估企业的企业信息数据,根据预设规则将所述企业信息数据分为多个第一指标数据和多个第二指标数据,其中,所述第一指标数据为主观评估的指标数据,所述第二指标数据为能够客观量化的指标数据;第一确定模块,根据所述多个第一指标数据确定第一指标合格率;第二确定模块,根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级。
根据本申请的另一方面,还提供了一种计算机可读存储介质,所述处存储介质用于存储程序,其中,所述程序执行上述中任意一项所述的企业信息数据处理方法。
根据本申请的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述中任意一项所述的企业信息数据处理方法。
通过本申请,采用以下步骤:获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;根据多个第一指标数据确定第一指标合格率;根据第一指标合格率以及多个第二指标数据确定第一风险等级,通过将待评估企业的信息数据划分为第一指标数据和第二指标数据,先通过第一指标数据计算第一指标的合格率,再根据第一指标数据合格率的情况,以及第二指标数据,确定第一风险等级,达到了利用企业信息的多个指标判断小微企业的风险等级的目的,实现了提供小微企业风险等级评估的准确性的技术效果,进而解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的一种企业信息数据处理方法的流程图;
图2是根据本申请实施方式提供的基于多信息的小微企业贷款风险研究方法的完整流程图;
图3是根据本申请实施方式提供的评估结果分类的示意图;
图4是根据本申请实施方式提供的贷款企业的各项信息的示意图;
图5是根据本申请实施方式提供的企业家个人信息的示意图;
图6是根据本申请实施方式提供的信息筛选和分类的示意图;
图7是根据本申请实施方式提供的评估等级流程的流程图;
图8是根据本申请实施例提供的一种企业信息数据处理装置的示意图;
图9是根据本申请实施例提供的一种电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的一种企业信息数据处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;
步骤S102,根据多个第一指标数据确定第一指标合格率;
步骤S103,根据第一指标合格率以及多个第二指标数据确定第一风险等级。
通过上述步骤,获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;根据多个第一指标数据确定第一指标合格率;根据第一指标合格率以及多个第二指标数据确定第一风险等级,通过将待评估企业的信息数据划分为第一指标数据和第二指标数据,先通过第一指标数据计算第一指标的合格率,再根据第一指标数据合格率的情况,以及第二指标数据,确定第一风险等级,达到了利用企业信息的多个指标判断小微企业的风险等级的目的,实现了提供小微企业风险等级评估的准确性的技术效果,进而解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
上述企业信息数据可以是企业的基本信息数据,如:关于企业和员工的各项信息,企业信息数据还可以是待评估企业的企业家个人信息,如企业的法人代表及主要负责人信息,为达到对待评估企业的风险等级进行准确评估的目的,可以先对上述企业信息数据进行数据脱敏,实现敏感隐私数据的可靠性保护,然后将上述企业信息数据划分为进行主观评估的上述第一指标数据以及可以客观量化的第二指标数据,通过上述第一指标数据以及第二指标数据确定待评估企业的风险等级。
上述第一指标数据可以是上述企业信息数据中的主观评估指标数据,用于确定上述第一指标合格率,在上述第一指标数据可以包括多个指标,例如,企业成立年限和企业性质、企业近年营业收入和企业近年净收入等,在上述第一指标合格率不满足预设条件的情况下,上述待评估企业的第一风险等级可以确定为不予贷款的风险等级,在上述第一指标合格率满足预设条件的情况下,可以再通过第二指标数据对上述待评估企业的风险等级进行评定。
上述第二指标数据可以包括可以量化的多个客观指标数据,例如,企业评级、企业规模、企业担保方式和担金额、企业交税情况、经营场地房屋所有权和房屋面积、企业员工信息、企业家个人信息等,通过上述第二指标数据对待评估企业的风险等级进行评估可以通过向量机模型进行判定,可以通过向量机模型确定待评估企业的多个第一风险等级的概率分布,通过概率分布情况确定上述第一风险等级,需要说明的是,上述第一风险等级可以包括提供大额贷款等级、提供中额度贷款等、提供小型额度贷款等级、需重新评定等级、以及不予提供贷款等级等。
先通过第一指标数据计算第一指标的合格率,再根据第一指标数据合格率的情况,以及第二指标数据,确定第一风险等级,达到了利用企业信息的多个指标判断小微企业的风险等级的目的,实现了提供小微企业风险等级评估的准确性的技术效果,进而解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级包括:在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值;将多个第二指标数据的量化值输入向量机模型,确定第一风险等级。
上述第一指标合格率可以与预设阈值进行比较,确定第一指标合格率是否满足预设条件,在第一指标合格率小于预设阈值的情况下,上述第一风险等级可以直接确定,具体的,第一指标合格率小于预设阈值的情况下,说明从主观的第一指标上,该企业就不满足条件,从而可以直接确定该企业的第一风险等级为风险最高的等级。在第一指标合格率大于等于预设阈值的情况下,可以通过多个第二指标数据确定上述第一风险等级,可以通过将上述第二指标数据中的每个第二指标数据进行量化,确定每个第二指标数据对应的量化值,再将上述多个第二指标数据的量化值输入向量机模型,可以确定上述第一风险等级。
需要说明的是,上述多个第二指标数据的每个第二指标数据中还可以包括多个二级指标数据,对每个二级指标数据量化加权,确定每个第二指标数据的量化值。上述多个第二指标数据中的每个第二指标数据还可以直接进行等级判断量化。
例如,企业评级指标:企业通常在贷款前会购买评级服务或进行外部的等级评价,因此采用0-10之间的整数来衡量。若取值为0,则代表该贷款企业没有进行评价;若取值越来越大,则代表该企业的外部口碑越好,信用越高。企业规模:在进行贷款时要求贷款企业提供企业相关信息,根据此划分出贷款时该企业的规模大小。企业规模指标,可以在1-10之间进行取数,若企业规模越大,则数字越大;企业规模越小,数字越小。担保方式及保证金额指标:若该企业没有担保人,则直接将该指标记为0。保证金额则为担保人保证该企业违约后可代还的金额,如果担保人不存在,该指标直接为0,若担保人存在,则根据企业规模、企业资产、担保金额和抵押品进行等级划分,等级越高则代表担保等级越高。企业交税情况:企业交税与否按照0和1进行记录,若企业交税,则会留下会税务登记号码,若贷款企业可以提供完整的税务登记号码和税务记录,则记为1;否则记为0。经营场地房屋所有权和房屋面积:若含有生产工厂、经营场地和办公场地中的一个,则记为1;若有其中两个,则记为2;若三个皆有则记为3。企业员工信息指标:主要包含企业员工公积金缴存人数、企业员工公积金缴存金额和企业员工公积金缴存比例等。这些信息可以度量贷款企业是否正当营业、是否保证了员工的利益,并可以根据企业所交公积金的比例和金额反映出企业近年来的盈利情况。企业家个人信息指标:企业家的信息可以反映出一个企业的经营状况,一般而言,企业营收越好,企业家的年收入就相对较高。因此,可以通过企业家的性别设立性别指标、根据年龄范围设置年龄指标、按照学历设置学历指标,并根据个人资产、个人流水、个人征信凭证、个人贷款情况查看企业家情况。不仅如此,也应该要求企业其他高层提供相应的个人信息,这样才可以得到较为客观的分析。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级还包括:将多个第二指标数据的量化值输入向量机模型;根据向量机模型确定待评估企业的多个不同的风险等级的概率分布,其中,第一风险等级为多个不同的风险等级中的一个;根据概率分布,确定第一风险等级。
将上述多个第二指标数据的量化值输入向量机模型,根据上述向量机模型可以确定上述待评估企业的多个不同风险等级的概率分布,也即是得到上述待评估企业在多个不同风险等级的每个风险的等级的概率,根据上述概率分布,可以确定上述第一风险等级的预测结果。
通过利用上述向量机模型,确定上述第一风险等级的评估结果,达到了利用第二指标数据确定第一风险等级的目的,实现了提高待评估企业的风险等级的评估的准确率的技术效果。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级之前还包括:获取历史指标数据,对历史指标数据进行筛选及数据清洗,确定多个第二指标历史数据,其中,多个第二指标历史数据中包括不同企业的第二指标历史数据的历史量化值,以及不同企业的企业历史风险等级;将多个第二指标历史数据的历史量化值及企业历史风其险等级作为训练样本,对向量机模型进行训练,直至向量机模型收敛。
在将多个第二指标数据的量化值输入向量机模型之前,还可以对上述向量机模型进行训练,可以通过获取历史指标数据,也即是多个不同企业的历史信息数据,对历史信息数据以及企业的进行数据脱敏,数据清洗,筛选提取出每个企业的多个第二指标历史数据,以及历史量化值和企业的历史风险等级,将多个第二指标历史数据的历史量化值及企业历史风其险等级作为训练样本,对上述向量机模型进行训练,直至向量机模型收敛。
可选的,在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值包括:在第一指标合格率小于第一指标合格率阈值的情况下,直接确定第一风险等级为不予贷款的风险等级;在第一指标合格率大于等于第一指标合格率阈值的情况下,执行根据多个第二指标数据确定每个第二指标数据对应的量化值的步骤。
在第一指标合格率小于第一指标合格率阈值的情况下,可以直接确定第一风险等级为不予贷款的风险等级,达到了对待评估企业的风险等级进行初步判定的目的,提高企业风险等级评估效率的技术效果,在第一指标合格率大于等于第一指标合格率阈值的情况下,通过第一指标数据不能准确评估待评估企业的风险等级,可以执行根据多个第二指标数据确定每个第二指标数据对应的量化值的步骤,通过第二指标数据对待评估企业的风险等级进行等级评估,进一步提高对待评估企业风险等级评估的准确性。
可选的,根据多个第一指标数据确定第一指标合格率包括:确定第一指标数据的总数量,以及每个第一指标数据是否合格;将合格的第一指标数据的数量,与总数量的比值,作为第一指标合格率。
通过判断第一指标数据是否合格,以及统计第一指标数据的合格的数量,以及第一指标数据的总数,根据合格的第一指标数据的数量与总数量的比值,确定第一指标合格率,达到了确定第一指标合格率的目的。
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级之后,方法还包括:获取第三指标数据,根据第三指标数据确定目标概率,其中,第三指标数据为待评估企业的金融资产数据,目标概率为待评估企业的资产交易风险概率;根据第一风险等级以及目标概率,确定目标风险等级。
为进一步增加企业风险等级评估的准确性,还可以通过上述第三指标数据对企业的风险等级进行进一步精确,上述第三指标数据可以是待评估企业的金融资产数据,例如,企业的违约概率或违约损失率,上述第三指标数据可以通过待评估企业的欠款金额、欠息金额、待款金额等,还可以通过企业的财务报表、企业流水等对企业的金融资产数据进行判断,通过将上述目标概率与上述第一风险等级进行结合,可以进一步确定上述目标风险等级。上述目标概率与上述第一风险等级可以通过加权计算的方式,上述目标概率还可以通过与多个不同的第一风险等级的概率分布情况进行加权计算,确定待评估企业的多个目标风险等级的概率,根据多个目标风险等级的概率,确定目标风险等级的评估结果。需要说明的是,上述目标风险等级可以为,提供大额贷款、提供中等小型额度贷款、重新评定、不提供贷款等。
通过根据上述第三指标数据确定目标概率,根据目标概率与上述第一风险等级确定上述目标风险等级,达到了进一步增加待评估企业的风险评估准确性的目的,实现了提高待评估企业的风险评估准确率的技术效果。
本申请实施例提供的企业信息数据处理方法,获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;根据多个第一指标数据确定第一指标合格率;根据第一指标合格率以及多个第二指标数据确定第一风险等级,通过将待评估企业的信息数据划分为第一指标数据和第二指标数据,先通过第一指标数据计算第一指标的合格率,再根据第一指标数据合格率的情况,以及第二指标数据,确定第一风险等级,达到了利用企业信息的多个指标判断小微企业的风险等级的目的,实现了提供小微企业风险等级评估的准确性的技术效果,进而解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
需要说明的是,本申请还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
本实施方式提供了一种基于多信息分析的小微企业的贷款风险方法,通过企业提供的各项数据进行筛选,筛选出可进一步用于金融机构进行借贷评估的相关信息,利用多种信息进行借贷风险评估,最后依据结果进行借贷等级评定。
本实施方式提供一种基于多信息的小微企业贷款风险研究方法,各模块如图所示,并对照图进行如下说明:
图2是根据本申请实施方式提供的基于多信息的小微企业贷款风险研究方法的完整流程图,如图2所示,包含了小微企业提供的企业各项基本信息模块1,企业家个人信息模块2、信息筛选和分类模块3、企业欠息金额模块4、计算违约损失率模块5和评估等级模块6。
企业各项基本信息模块1:要求需要进行贷款的企业提供关于企业和员工的各项信息,包括企业评级、行业分类、企业成立年限、企业规模大小、企业性质、担保方式及保证金额、企业近年营业收入、企业近年净收入、企业交税情况、经营场地房屋所有权和房屋面积、企业员工公积金缴存人数、企业员工公积金缴存金额、企业员工公积金缴存比例等。
企业家个人信息模块2:要求企业提供公司法人代表及主要负责人的性别、年龄、个人资产、个人流水、最高学历、个人征信凭证、个人贷款情况等。
信息筛选和分类模块3:考虑到在金融机构的实际操作中,企业所提供所有信息并不是都可以被客观衡量,一些信息需要金融机构从业人员进行主观评判。因此,需要进一步分析企业所提供的各项信息并划分为主客观指标,对于主观判定的信息,如果达到某一标准后则拒绝企业贷款,反之则可进一步评估并进行后续操作。
欠息金额模块4:根据企业类型判断该企业发展前景,并且查明贷款企业是否存在欠息金额,根据是否存在欠息金额判断该贷款企业有无贷款经历,并且有无构成违约行为,根据欠息金额可以判断企业是否有欠款金额。
计算违约损失率模块5:通过企业所提供的财务报表和企业流水等信息,需要判定企业的违约损失率,并且通过数字进行记录和衡量,基于此计算出企业贷款后可能存在的违约率。
评估等级模块6:图3是根据本申请实施方式提供的评估结果分类的示意图,如图3所示,设置五种贷款类型:可提供大额贷款、可提供中等额度贷款、可提供小型额度贷款、需要提供其他信息的重新评定企业贷款等级和不提供贷款。根据所筛选的企业信息和企业家个人信息,通过相关向量机算法(Relevance Vector Machine,RVM)训练样本数据得到相关数值结果和概率密度函数,根据所得结果和概率密度分布区间来确定是否对企业提供贷款及贷款类型。
图4是根据本申请实施方式提供的贷款企业的各项信息的示意图,如图4所示。获取了贷款企业的各项信息21后,由于并不是每一项基本信息都可以用数字衡量与量化,因为将企业的各项信息进行信息的分类和筛选,并将所有的信息分为主观指标23和客观指标22,本实施方式选取一些特定的信息进行讲解说明,具体分类如下:
(1)企业评级:企业通常在贷款前会购买评级服务或进行外部的等级评价,因此采用0-10之间的整数来衡量。若取值为0,则代表该贷款企业没有进行评价;若取值越来越大,则代表该企业的外部口碑越好,信用越高。
(2)行业分类:利用我国统计局所提供的国民经济行业分类标准进行行业分类,并在此基础上构建出划分标准模型,共分为A-E五个等级。A代表行业发展快,发展前途高;E代表行业整体不够景气,发展前途较为灰暗。但是按照行业进行分类并不能成为客观指标,因为将其作为主观指标。
(3)企业规模:在进行贷款时要求贷款企业提供企业相关信息,根据此划分出贷款时该企业的规模大小。企业规模指标可以在1-10之间进行取数,若企业规模越大,则数字越大;企业规模越小,数字越小。
(4)企业成立年限和企业性质:值得注意的是,企业成立年限是否久远并不能直接作为客观指标,因为该指标对于是否可贷款给企业影响不大。企业性质可以根据行业分类进行评判,也属于主观标准。因此,两者可以结合进行主观分析。
(5)担保方式及保证金额:若该企业没有担保人,则直接将该指标记为0。保证金额则为担保人保证该企业违约后可代还的金额,如果担保人不存在,该指标直接为0,若担保人存在,则根据企业规模、企业资产、担保金额和抵押品进行等级划分,等级越高则代表担保等级越高。
(6)企业近年营业收入和企业近年净收入:根据这两项信息可以直观评判出该企业的近些年的盈利情况,但是每个企业需要贷款的理由都不相同,有的企业为了扩大规模而需要贷款,该企业可能盈利数都为正数;有的企业可能经营不当而濒临破产,需要贷款改善企业状况,所以营业收入为负数或获利较少。因此不可以将这两个指标作为客观指标,而应该结合其他信息进行主观判断。
(7)企业交税情况:企业交税与否按照0和1进行记录,若企业交税,则会留下会税务登记号码,若贷款企业可以提供完整的税务登记号码和税务记录,则记为1;否则记为0。
(8)经营场地房屋所有权和房屋面积:若含有生产工厂、经营场地和办公场地中的一个,则记为1;若有其中两个,则记为2;若三个皆有则记为3。
(9)企业员工信息:主要包含企业员工公积金缴存人数、企业员工公积金缴存金额和企业员工公积金缴存比例等。这些信息可以度量贷款企业是否正当营业、是否保证了员工的利益,并可以根据企业所交公积金的比例和金额反映出企业近年来的盈利情况。
图5是根据本申请实施方式提供的企业家个人信息的示意图,如图5所示。企业家的信息可以反映出一个企业的经营状况,一般而言,企业营收越好,企业家的年收入就相对较高。因此,可以通过企业家的性别设立性别指标、根据年龄范围设置年龄指标、按照学历设置学历指标,并根据个人资产、个人流水、个人征信凭证、个人贷款情况查看企业家情况。不仅如此,也应该要求企业其他高层提供相应的个人信息,这样才可以得到较为客观的分析。
图6是根据本申请实施方式提供的信息筛选和分类的示意图,如图6所示,将所有信息进行数据脱敏,并通过信息筛选和分类41将它们分为主观指标和客观指标。客观指标是可以用数字进行衡量,并且用于进一步计算。主观指标是用于金融机构从业人员进行主观判断。
主观指标合格率是否超过三分之一42:判断主观指标合格数是否超过主观指标总数的三分之一。
主观指标判断43:若主观指标有三分之一不合格,则直拒绝贷款43,拒绝该企业的贷款请求。
客观指标判断:若主观指标合格数占三分之一及以上,则可利用客观指标进行下一步判断,可进行RVM预测44,并得到具体的贷款等级。
图7是根据本申请实施方式提供的评估等级流程的流程图,如图7所示:通过设置五种贷款类型允许企业进行贷款或拒绝企业贷款要求。需要注意的是,在进行此步骤之前,企业必须完成并通过主观指标的评定。评估等级步骤主要包含:提取客观指标51,选取训练样本集52、训练RVM模型53和评定等级范围54。
提取客观指标51:主要包含企业评级、企业规模、担保方式及保证金额、企业交税情况、经营场地房屋所有权和房屋面积、企业员工信息等。
选取训练样本集52:收集原始数据集并且对样本进行筛选和处理,在完成数据清洗后,提取出各个样本的客观指标,组成模型输入X。
训练RVM模型53:首先给定多输入客观指标-单输出预测结果的数据集,数据与预测结果之间的关系可描述为:
s=y(x)+ε
其中,y(x)一般为非线性函数,ε表示服从均值为0方差为σ2的独立同分布高斯噪声,s表示预测结果,RVM的目标输出可以表示为:
s=Φw+ε
其中,s=s1,s2,…,sN单输出预测结果的数据集,Φ=(φ(x1),φ(x2),…,φ(xN))T为多输入客观指标,为N×1阶核函数矩阵,φ(xj)=[1,K(xj,x1),…K(xj,xN)]T,K(x,xj)为核函数,ε表示服从均值为0方差为σ2的独立同分布高斯噪声。
首先假设sj是相互独立的,则其似然函数为:
其中,w代表多个客观指标的权重,σ2表示多个客观指标方差,s为单输出预测结果值。
在w上定义一个高斯先验分布,并且必须满足0均值分布的前提:
其中,α={α0,α1,…,αN}为N+1维的独立超参数向量。
其后验分布为:
其中,后验协方差和均值为:
Σ=(σ-2ΦTΦ+A)-1
μ=σ-2∑ΦTs
式中,A=(α0,α1,…,αN),μ表示均值,∑表示后协方差。
根据计算,就可以得到目标输出的分布:
利用迭代估计得到更新的超参数和方差:
式中,μj为第j个后验权重的均值,∑jj为协方差矩阵的第j个对角元素。当给定新的输入值x*时,得到的估计输出s*满足p(s*|s)=N(s*|y*,σ2*),并且有:
y*=μTφ(x*)
式中,y*即为新预测值,σ2*为估计方差。
评定等级范围54:提取信息进行分类筛选,将企业的客观指标放入训练好的RVM模型中进行预测,这样就可以得到直观的预测结果并且得到概率分布,因此可以结合概率密度分布和预测结果进行等级判定。
小微企业是我们市场经济的重要组成部分,具有企业数量多、人员流动频繁、企业管理不规范等特点,因此存在贷款难和所得贷款少的现象。针对上述现象,为了更好的评估小微企业的贷款资格,本实施方式提供一种基于多种信息的小微企业贷款评估的解决方法,首先要求企业提供各项基本信息、员工信息和企业家信息,然后对这些信息进行筛选和分类,分为主观指标和客观指标,如果企业满足主观条件,则可进一步进行客观测量,并根据结果划分可贷款等级。本实施方式具有如下特点:
首先,使用主客观指标分别进行筛选和验证,如果主观条件不满足,则直接拒绝企业的贷款要求,这样既可大幅度缩短时间,减少后续筛选,提高评估效率。若在客观评定中达到重新评定标准,还可要求企业提供详细信息,给予企业二次评定的机会。
其次,本实施方式利用RVM模型进行贷款结果评定,具有训练时间短和计算效率高等特点。而且RVM不仅可以提供预测数值,还可以提供概率密度函数,知晓概率密度分布区间,得到概率预测,因此将两者相结合可以得到更加准确的评定结果。
本申请实施例还提供了一种企业信息数据处理装置,需要说明的是,本申请实施例的企业信息数据处理装置可以用于执行本申请实施例所提供的用于企业信息数据处理方法。以下对本申请实施例提供的企业信息数据处理装置进行介绍。
图8是根据本申请实施例提供的一种企业信息数据处理装置的示意图。如图8所示,该装置包括:获取模块80,第一确定模块82,第二确定模块84,下面对该装置进行详细说明。
获取模块80,获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;第一确定模块82,与上述获取模块80相连,根据多个第一指标数据确定第一指标合格率;第二确定模块84,与上述第一确定模块82相连,根据第一指标合格率以及多个第二指标数据确定第一风险等级。
本申请实施例提供的企业信息数据处理装置,获取模块80,获取待评估企业的企业信息数据,根据预设规则将企业信息数据分为多个第一指标数据和多个第二指标数据,其中,第一指标数据为主观评估的指标数据,第二指标数据为能够客观量化的指标数据;第一确定模块82根据多个第一指标数据确定第一指标合格率;第二确定模块84根据第一指标合格率以及多个第二指标数据确定第一风险等级,先通过第一指标数据计算第一指标的合格率,再根据第一指标数据合格率的情况,以及第二指标数据,确定第一风险等级,达到了利用企业信息的多个指标判断小微企业的风险等级的目的,实现了提供小微企业风险等级评估的准确性的技术效果,进而解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
可选的,第二确定模块包括:第一确定单元,在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值;第二确定单元,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级。
可选的,第二确定单元:将多个第二指标数据的量化值输入向量机模型;根据向量机模型确定待评估企业的多个不同的风险等级的概率分布,其中,第一风险等级为多个不同的风险等级中的一个;根据概率分布,确定第一风险等级。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级之前还包括:获取历史指标数据,对历史指标数据进行筛选及数据清洗,确定多个第二指标历史数据,其中,多个第二指标历史数据中包括不同企业的第二指标历史数据的历史量化值,以及不同企业的企业历史风险等级;将多个第二指标历史数据的历史量化值及企业历史风其险等级作为训练样本,对向量机模型进行训练,直至向量机模型收敛。
可选的,第一确定单元包括:在第一指标合格率小于第一指标合格率阈值的情况下,直接确定第一风险等级为不予贷款的风险等级;在第一指标合格率大于等于第一指标合格率阈值的情况下,执行根据多个第二指标数据确定每个第二指标数据对应的量化值的步骤。
可选的,根据多个第一指标数据确定第一指标合格率包括:确定第一指标数据的总数量,以及每个第一指标数据是否合格;将合格的第一指标数据的数量,与总数量的比值,作为第一指标合格率。
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级之后,还包括:获取第三指标数据,根据第三指标数据确定目标概率,其中,第三指标数据为待评估企业的金融资产数据,目标概率为待评估企业的资产交易风险概率;根据第一风险等级以及目标概率,确定目标风险等级。
所述企业信息数据处理装置包括处理器和存储器,上述获取模块80,第一确定模块82,第二确定模块84等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决了相关技术中小微企业信用风险得不到准确评估,金融机构不能判断企业借贷风险,造成金融机构坏账概率增加的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述企业信息数据处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述企业信息数据处理方法。
图9是根据本申请实施例提供的一种电子设备的示意图,如图9所示,本申请实施例提供了一种电子设备90,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级包括:在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值;将多个第二指标数据的量化值输入向量机模型,确定第一风险等级。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级还包括:将多个第二指标数据的量化值输入向量机模型;根据向量机模型确定待评估企业的多个不同的风险等级的概率分布,其中,第一风险等级为多个不同的风险等级中的一个;根据概率分布,确定第一风险等级。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级之前还包括:获取历史指标数据,对历史指标数据进行筛选及数据清洗,确定多个第二指标历史数据,其中,多个第二指标历史数据中包括不同企业的第二指标历史数据的历史量化值,以及不同企业的企业历史风险等级;将多个第二指标历史数据的历史量化值及企业历史风其险等级作为训练样本,对向量机模型进行训练,直至向量机模型收敛。
可选的,在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值包括:在第一指标合格率小于第一指标合格率阈值的情况下,直接确定第一风险等级为不予贷款的风险等级;在第一指标合格率大于等于第一指标合格率阈值的情况下,执行根据多个第二指标数据确定每个第二指标数据对应的量化值的步骤。
可选的,根据多个第一指标数据确定第一指标合格率包括:确定第一指标数据的总数量,以及每个第一指标数据是否合格;将合格的第一指标数据的数量,与总数量的比值,作为第一指标合格率。
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级之后,方法还包括:获取第三指标数据,根据第三指标数据确定目标概率,其中,第三指标数据为待评估企业的金融资产数据,目标概率为待评估企业的资产交易风险概率;根据第一风险等级以及目标概率,确定目标风险等级。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级包括:在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值;将多个第二指标数据的量化值输入向量机模型,确定第一风险等级。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级还包括:将多个第二指标数据的量化值输入向量机模型;根据向量机模型确定待评估企业的多个不同的风险等级的概率分布,其中,第一风险等级为多个不同的风险等级中的一个;根据概率分布,确定第一风险等级。
可选的,将多个第二指标数据的量化值输入向量机模型,确定第一风险等级之前还包括:获取历史指标数据,对历史指标数据进行筛选及数据清洗,确定多个第二指标历史数据,其中,多个第二指标历史数据中包括不同企业的第二指标历史数据的历史量化值,以及不同企业的企业历史风险等级;将多个第二指标历史数据的历史量化值及企业历史风其险等级作为训练样本,对向量机模型进行训练,直至向量机模型收敛。
可选的,在第一指标合格率满足预设条件的情况下,根据多个第二指标数据确定每个第二指标数据对应的量化值包括:在第一指标合格率小于第一指标合格率阈值的情况下,直接确定第一风险等级为不予贷款的风险等级;在第一指标合格率大于等于第一指标合格率阈值的情况下,执行根据多个第二指标数据确定每个第二指标数据对应的量化值的步骤。
可选的,根据多个第一指标数据确定第一指标合格率包括:确定第一指标数据的总数量,以及每个第一指标数据是否合格;将合格的第一指标数据的数量,与总数量的比值,作为第一指标合格率。
可选的,根据第一指标合格率以及多个第二指标数据确定第一风险等级之后,方法还包括:获取第三指标数据,根据第三指标数据确定目标概率,其中,第三指标数据为待评估企业的金融资产数据,目标概率为待评估企业的资产交易风险概率;根据第一风险等级以及目标概率,确定目标风险等级。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种企业信息数据处理方法,其特征在于,包括:
获取待评估企业的企业信息数据,根据预设规则将所述企业信息数据分为多个第一指标数据和多个第二指标数据,其中,所述第一指标数据为主观评估的指标数据,所述第二指标数据为能够客观量化的指标数据;
根据所述多个第一指标数据确定第一指标合格率;
根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级。
2.根据权利要求1所述的方法,其特征在于,根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级包括:
在所述第一指标合格率满足预设条件的情况下,根据所述多个第二指标数据确定每个第二指标数据对应的量化值;
将所述多个第二指标数据的量化值输入向量机模型,确定所述第一风险等级。
3.根据权利要求2所述的方法,其特征在于,将所述多个第二指标数据的量化值输入所述向量机模型,确定第一风险等级还包括:
将所述多个第二指标数据的量化值输入所述向量机模型;
根据所述向量机模型确定所述待评估企业的多个不同的风险等级的概率分布,其中,所述第一风险等级为所述多个不同的风险等级中的一个;
根据所述概率分布,确定所述第一风险等级。
4.根据权利要求2所述的方法,其特征在于,将所述多个第二指标数据的量化值输入所述向量机模型,确定第一风险等级之前还包括:
获取历史指标数据,对所述历史指标数据进行筛选及数据清洗,确定多个第二指标历史数据,其中,所述多个第二指标历史数据中包括不同企业的第二指标历史数据的历史量化值,以及所述不同企业的企业历史风险等级;
将所述多个第二指标历史数据的历史量化值及所述企业历史风险等级作为训练样本,对所述向量机模型进行训练,直至所述向量机模型收敛。
5.根据权利要求2所述的方法,其特征在于,在所述第一指标合格率满足预设条件的情况下,根据所述多个第二指标数据确定每个第二指标数据对应的量化值包括:
在所述第一指标合格率小于第一指标合格率阈值的情况下,直接确定所述第一风险等级为不予贷款的风险等级;
在所述第一指标合格率大于等于所述第一指标合格率阈值的情况下,执行根据所述多个第二指标数据确定每个第二指标数据对应的量化值的步骤。
6.根据权利要求1所述的方法,其特征在于,根据所述多个第一指标数据确定第一指标合格率包括:
确定所述第一指标数据的总数量,以及每个所述第一指标数据是否合格;
将合格的第一指标数据的数量,与所述总数量的比值,作为所述第一指标合格率。
7.根据权利要求1所述的方法,其特征在于,根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级之后,所述方法还包括:
获取第三指标数据,根据所述第三指标数据确定目标概率,其中,所述第三指标数据为所述待评估企业的金融资产数据,所述目标概率为所述待评估企业的资产交易风险概率;
根据所述第一风险等级以及所述目标概率,确定目标风险等级。
8.一种企业信息数据处理装置,其特征在于,包括:
获取模块,获取待评估企业的企业信息数据,根据预设规则将所述企业信息数据分为多个第一指标数据和多个第二指标数据,其中,所述第一指标数据为主观评估的指标数据,所述第二指标数据为能够客观量化的指标数据;
第一确定模块,根据所述多个第一指标数据确定第一指标合格率;
第二确定模块,根据所述第一指标合格率以及所述多个第二指标数据确定第一风险等级。
9.一种计算机可读存储介质,其特征在于,存储介质用于存储程序,其中,所述程序执行权利要求1至7中任意一项所述的企业信息数据处理方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的企业信息数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210780660.0A CN115099957A (zh) | 2022-07-04 | 2022-07-04 | 一种企业信息数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210780660.0A CN115099957A (zh) | 2022-07-04 | 2022-07-04 | 一种企业信息数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115099957A true CN115099957A (zh) | 2022-09-23 |
Family
ID=83296464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210780660.0A Pending CN115099957A (zh) | 2022-07-04 | 2022-07-04 | 一种企业信息数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115099957A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022915A (zh) * | 2016-07-01 | 2016-10-12 | 中国民生银行股份有限公司 | 企业信用风险评估方法和装置 |
CN107292743A (zh) * | 2017-06-07 | 2017-10-24 | 前海梧桐(深圳)数据有限公司 | 针对企业投融资的智能化决策方法及其系统 |
CN110033159A (zh) * | 2019-02-27 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 风险识别方法、装置及设备 |
CN110348981A (zh) * | 2019-05-21 | 2019-10-18 | 平安科技(深圳)有限公司 | 贷款风控方法及装置、电子设备和计算机可读存储介质 |
CN111915155A (zh) * | 2020-07-13 | 2020-11-10 | 上海冰鉴信息科技有限公司 | 小微企业风险等级识别方法、装置及计算机设备 |
CN112017023A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 小微企业资源额度确定方法、装置及电子设备 |
CN114187104A (zh) * | 2021-12-18 | 2022-03-15 | 中国工商银行股份有限公司 | 交易风险检测方法、装置、计算机设备和存储介质 |
-
2022
- 2022-07-04 CN CN202210780660.0A patent/CN115099957A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022915A (zh) * | 2016-07-01 | 2016-10-12 | 中国民生银行股份有限公司 | 企业信用风险评估方法和装置 |
CN107292743A (zh) * | 2017-06-07 | 2017-10-24 | 前海梧桐(深圳)数据有限公司 | 针对企业投融资的智能化决策方法及其系统 |
CN110033159A (zh) * | 2019-02-27 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 风险识别方法、装置及设备 |
CN110348981A (zh) * | 2019-05-21 | 2019-10-18 | 平安科技(深圳)有限公司 | 贷款风控方法及装置、电子设备和计算机可读存储介质 |
CN111915155A (zh) * | 2020-07-13 | 2020-11-10 | 上海冰鉴信息科技有限公司 | 小微企业风险等级识别方法、装置及计算机设备 |
CN112017023A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 小微企业资源额度确定方法、装置及电子设备 |
CN114187104A (zh) * | 2021-12-18 | 2022-03-15 | 中国工商银行股份有限公司 | 交易风险检测方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230009149A1 (en) | System, method and computer program for underwriting and processing of loans using machine learning | |
de Castro Vieira et al. | Machine learning models for credit analysis improvements: Predicting low-income families’ default | |
Affes et al. | Predicting US banks bankruptcy: logit versus Canonical Discriminant analysis | |
KR20190064749A (ko) | 지능형 증권 투자 의사결정 지원 방법 및 그 장치 | |
US20130290167A1 (en) | System and method for credit risk management for educational institutions | |
Murugan | Large-scale data-driven financial risk management & analysis using machine learning strategies | |
Gupta | Financial determinants of corporate credit ratings: An Indian evidence | |
Giannopoulos et al. | Predicting SME loan delinquencies during recession using accounting data and SME characteristics: The case of Greece | |
Li et al. | Credit Risk management of P2P network Lending | |
Biswas et al. | Automated credit assessment framework using ETL process and machine learning | |
CN115860924A (zh) | 供应链金融信用风险预警方法及相关设备 | |
CN115186101A (zh) | 一种投资管理后端系统、方法、设备及存储介质 | |
CN115099957A (zh) | 一种企业信息数据处理方法及装置 | |
Bongaerts et al. | Imputing Mutual Fund Trades | |
Ahmadani et al. | Improving Creditworthiness Prediction Using Preprocessing Stages and Feature Selection | |
Zakowska | A New Credit Scoring Model to Reduce Potential Predatory Lending: A Design Science Approach | |
Taha | The possibility of using artificial neural networks in auditing-theoretical analytical paper | |
Alaba et al. | Data mining algorithm for development of a predictive model for mitigating loan risk in Nigerian banks | |
CN113537666B (zh) | 评测模型训练方法、评测和业务审核方法、装置及设备 | |
Pusapati | Loan Under writing prediction using Deep learning techniques | |
Scandizzo et al. | Loss given default models | |
Lextrait | Scaling up SME's credit scoring scope with LightGBM | |
Dichev | Discriminative Ability In Estimating Probability Of Default With Certain Machine Learning Algorithms | |
Obunadike | Machine learning for credit risk analysis across the United States | |
Gudiño et al. | Machine Learning Models, Risk Management Current Regulation and Perspectives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |