CN110782163A - 企业数据处理方法和装置 - Google Patents
企业数据处理方法和装置 Download PDFInfo
- Publication number
- CN110782163A CN110782163A CN201911023077.XA CN201911023077A CN110782163A CN 110782163 A CN110782163 A CN 110782163A CN 201911023077 A CN201911023077 A CN 201911023077A CN 110782163 A CN110782163 A CN 110782163A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- data
- feature
- characteristic
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000013210 evaluation model Methods 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 116
- 238000010586 diagram Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种企业数据处理方法和装置,该方法包括:获取企业的多种企业特征的特征数据;获得设定的每种该企业特征对应的最高分数;如企业特征的特征数据为逻辑类型,将企业特征的特征数据和最高分数输入到第一特征评估模型,以得到该企业特征对应的风险评分;如企业特征的特征数据为数值类型,确定该企业特征所属的目标影响等级及目标影响等级对应的目标权重系数,并将该企业特征的最高分数、目标影响等级及目标权重系数输入第二特征评估模型,以得到该企业特征的风险评分;根据该企业对应的多个企业特征的风险评分,确定该企业的风险状况。本申请可以确定出企业的风险状况,为企业监管部门及时有效的发现存在风险的企业提供了可靠依据。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种企业数据处理方法和装置。
背景技术
企业作为向市场提供商品或服务的单位,与市场经济状况和人们生活有着较大关系。因此,为了保障市场秩序和维护人民群众的利益,需要一些企业监管部门对企业进行监督和管控。
其中,企业监管部门需要结合企业的违法违规情况、企业经营状况以及企业法人信息等多种维度来综合分析企业的风险状况。由于影响企业风险的维度较多,且每种维度的数据的类型差异性也较大,不利于企业监管部门快速、有效的获取到不同企业的风险状况。因此,如何确定各个企业的风险状况是本领域技术人员迫切需要解决的技术问题。
发明内容
有鉴于此,本申请提供了一种企业数据处理方法和装置,以能够结合企业多种不同类型的数据确定出企业的风险状况,为企业监管部门及时有效的发现存在较大风险的企业提供的可靠的数据依据。
为实现上述目的,一方面,本申请提供了一种企业数据处理方法,包括:
获取企业的多种企业特征的特征数据,所述企业特征属于设定的能够影响企业风险的特征;
获得设定的每种所述企业特征对应的最高分数;
解析所述企业特征的特征数据所属的数据类型;
在所述企业特征的特征数据所属的数据类型为逻辑类型的情况下,调用第一特征评估模型,将所述企业特征的特征数据和所述企业特征的最高分数输入到所述第一特征评估模型,以通过所述第一特征评估模型转换出所述企业的所述企业特征对应的风险评分;
在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,并调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,其中,所述影响等级表中设置有企业特征对应的多个影响等级以及每种影响等级的权重系数;
根据所述企业对应的多个企业特征的风险评分,确定所述企业的风险状况。
优选的,所述依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,包括:
依据设定的影响等级表中影响等级的等级个数,设定的所述企业特征的极大边界值和所述企业特征的极小边界值,对所述企业特征的特征数据进行等级转换,得到所述企业的所述企业特征所属的目标影响等级;
按照所述影响等级表中不同影响等级与权重系数的对应关系,确定所述目标影响等级对应的目标权重系数。
优选的,在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,还包括:
如果所述企业特征的特征数据为时间序列数据,确定所述时间序列数据中各个时刻点的数据各自的风险影响权重;
按照所述时间序列数据中各个时刻点的数据各自的风险影响权重,对所述时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为所述企业特征对应的用于分析风险评分的特征数据,其中,所述时间序列数据中各个时刻点的数据对应的风险影响权重与所述时间序列数据中各个时刻点距离当前时刻的时长有关。
优选的,在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,还包括:
如果所述企业特征与企业风险之间的相关类型不属于设定相关类型,将所述企业特征的特征数据转换为符合所述设定相关类型的特征数据,其中,企业特征与企业风险之间的相关类型包括正相关类型和负相关类型,所述设定相关类型为所述正相关类型或者负相关类型;
其中,在所述企业特征与企业风险之间为正相关类型时,所述企业特征的特征数据的数据值越大,所述企业特征的特征数据导致企业存在风险的可能性越大;在所述企业特征与企业风险之间为负相关类型时,所述企业特征的特征数据的数据值越小,所述企业特征的特征数据导致企业存在风险的可能性越大。
优选的,在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,还包括:
依据所述多个企业特征各自对应的属于所述设定相关类型的特征数据,分别对每个所述企业特征对应的属于所述设定相关类型的特征数据进行标准化处理,得到处理后的所述企业特征的特征数据。
优选的,所述通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,包括:
通过所述第二特征评估模型确定出所述企业的所述企业特征所属的目标影响等级属于所述影响等级表中的影响等级时,利用企业特征所属的目标影响等级对应的目标权重系数以及所述企业特征对应的最高分数,确定所述企业的所述企业特征的风险评分;
通过所述第二特征评估模型确定出所述企业的所述企业特征所属的目标影响等级超出所述影响等级表中的影响等级时,根据所述企业的所述企业特征所属的目标影响等级,将所述企业的所述企业特征的风险评分设置为所述最高分数或者预置的所述企业特征对应的最低风险分数。
又一方面,本申请还提供了一种企业数据处理装置,包括:
数据获取单元,用于获取企业的多种企业特征的特征数据,所述企业特征属于设定的能够影响企业风险的特征;
标准分获得单元,用于获得设定的每种所述企业特征对应的最高分数;
类型解析单元,用于解析所述企业特征的特征数据所属的数据类型;
第一评分单元,用于在所述企业特征的特征数据所属的数据类型为逻辑类型的情况下,调用第一特征评估模型,将所述企业特征的特征数据和所述企业特征的最高分数输入到所述第一特征评估模型,以通过所述第一特征评估模型转换出所述企业的所述企业特征对应的风险评分;
第二评分单元,用于在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,并调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,其中,所述影响等级表中设置有企业特征对应的多个影响等级以及每种影响等级的权重系数;
风险评估单元,用于根据所述企业对应的多个企业特征的风险评分,确定所述企业的风险状况。
优选的,所述第二评分单元,包括:
等级确定单元,用于在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表中影响等级的等级个数,设定的所述企业特征的极大边界值和所述企业特征的极小边界值,对所述企业特征的特征数据进行等级转换,得到所述企业的所述企业特征所属的目标影响等级;
权重确定单元,用于按照所述影响等级表中不同影响等级与权重系数的对应关系,确定所述目标影响等级对应的目标权重系数;
模型调用单元,用于调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分。
优选的,所述第二评分单元,还用于在确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,如果所述企业特征的特征数据为时间序列数据,确定所述时间序列数据中各个时刻点的数据各自的风险影响权重;按照所述时间序列数据中各个时刻点的数据各自的风险影响权重,对所述时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为所述企业特征对应的用于分析风险评分的特征数据,其中,所述时间序列数据中各个时刻点的数据对应的风险影响权重与所述时间序列数据中各个时刻点距离当前时刻的时长有关。
优选的,所述第二评分单元,还用于在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,如果所述企业特征与企业风险之间的相关类型不属于设定相关类型,将所述企业特征的特征数据转换为符合所述设定相关类型的特征数据,其中,企业特征与企业风险之间的相关类型包括正相关类型和负相关类型,所述设定相关类型为所述正相关类型或者负相关类型;
其中,在所述企业特征与企业风险之间为正相关类型时,所述企业特征的特征数据的数据值越大,所述企业特征的特征数据导致企业存在风险的可能性越大;在所述企业特征与企业风险之间为负相关类型时,所述企业特征的特征数据的数据值越小,所述企业特征的特征数据导致企业存在风险的可能性越大。
经由上述的技术方案可知,本申请获取到能够影响企业风险的多种企业特征的特征数据,并解析出企业特征的特征数据的数据类型,针对不同的数据类型可以调用不同数据类型匹配的特征评估模型。其中,对于企业特征的特征数据为逻辑类型数据的情况,本申请考虑到逻辑类型的数据的取值只有是或者否(如,是为1,否为0)这一特性,可见,该企业特征的特征数据便可以直观反映出企业在该企业特征上有无风险,因此,仅仅结合该企业特征的特征数据以及该企业特征的最高风险评分,确定出该企业在该企业特征上的风险评分。而对于企业特征的特征数据为数值类型的情况,在调用该类型的特征评估模型之后,需要依据该企业特征的特征数据的具体取值、设定的影响等级表中的影响等级以及影响等级对应的权重,并结合该企业特征的最高风险评分,以合理的确定出该企业在该企业特征中的风险评分。可见,本申请可以结合企业特征的特征数据的类型,调用不同的特征评估模型,从而较为合理的确定出该企业在每种企业特征中的风险评分,这样,结合企业在多种维度上的企业特征上的风险评分,便可以确定出企业整体的风险状况,从而为企业监管部门快速,合理的分析各个企业的风险情况提供了依据。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请的一种企业数据处理方法所适用的一种场景的组成结构示意图;
图2示出了本申请一种企业数据处理方法一个实施例的流程示意图;
图3示出了本申请的一种企业数据处理方法又一个实施例的流程示意图;
图4示出了本申请一种企业数据处理装置一个实施例的组成结构示意图。
具体实施方式
本申请的方案适用于确定不同企业的企业风险状况,本申请的方案可以应用于服务器、终端等具备数据处理的计算机设备中。
如图1,其示出了本申请的方案所适用的一种场景的组成架构示意图。
由图1可以看出,该场景包括数据存储设备101、服务器102和终端103。
其中,该数据存储设备用于存储待分析的企业各个企业特征的特征数据。数据存储设备中获取到的特征数据可以是从网络获取的,或者是从企业管理部门的设备104中获得的,或者是由企业提供的,当然,也可能是结合多种获取特征数据的方式获得的。
该服务器102可以从数据存储设备中获取分析企业风险状况所需的特征数据,并对获得的特征数据进行处理,以确定出企业的风险状况。
该终端103可以从服务器查询各个企业对应的风险状况。
可以理解的是,图1仅仅是本申请是适用的一种场景,在实际应用中,也可以不设置数据存储设备,而直接通过服务器获取特征数据并存储。
在图1中是以分析企业风险的设备为服务器为例说明,但是该服务器也可以替换为个人计算机或者其他具备数据处理能力的大型主机等等。相应的,本实施例是以服务器确定出的企业的风险状况可以提供给不同监管部门的终端为例,但是如果该服务器(或者企业计算机设备)为监管部门的设备,则该场景也可以不包括终端。
下面结合流程图对本申请的企业数据处理方法进行介绍。
如图2所示,其示出了本申请一种企业数据处理方法一个实施例的流程示意图,本实施例的方法可以应用于计算机设备,如前面提到的服务器或者个人计算机等,本实施例的方法包括:
S201,获取企业的多种企业特征的特征数据。
其中,该企业特征属于设定的能够影响企业风险的特征。
与现有的银行等金融机构评定企业信用评分不同,本申请需要获取的企业特征不仅仅与金融等维度有关,还需要与企业具体经营状况、企业违法状况信息以及企业信用等有关。
如,本申请可以获得企业的多种指标下的企业特征。如,分析所采用的指标可以包括企业的企业经营、企业登记、企业信用、企业异动、企业舆情以及企业违规违法等多个指标中的部分或者全部。
其中,企业经营涉及到的企业特征可以包括:企业设备、产品质量、安全生产和环境保护等多种企业特征中的一种或者多种。例如,企业登记、许可、备案以及认证等事项是否与实际不符,比如,经营场所、法人或者经营者等信息与登记信息不符;又例如,企业设备可以为设备来源是否合格,产品质量可以为产品质量的级别,环境保护可以为是否设置环境保护设备等。
企业登记涉及到的企业特征可以包括:企业登记注册、许可、备案认证等企业特征的异常情况,例如,同一主体投资设立企业的新增数量是否过多;无经营资格从事的经营活动,例如,证照、备案等到期或者失效。;
企业信用中涉及的企业特征可以为与信用监管等涉企的不良信息,如,经常异常名录,具体的,可以为近三年因登记住所无法联系的情况;又如,是否属于严重违法失信企业名单等。。
企业异动可以为企业近期是否存在异常事件、异常事件持续时长和波动范围等特征信息。
企业舆情可以为公众对企业的评价分数等特征信息;
企业违规违法可以涉及企业法人的违法情况、企业涉及的违法事件等等企业特征。例如,因涉事涉案被调查或者采取强制措施等情况,具体的,可以包括案件信息、处罚信息以及违法记录等。
可以理解的是,待分析企业的企业特征的特征数据的获取方式可以有多种,如,可以是获取企业提供的企业特征的特征数据,或者是,从权威机构获取到企业相关的企业特征的特征数据,还可以是从网络中获取该企业的企业特征的特征数据。
S202,获得设定的每种该企业特征对应的最高分数。
其中,每个企业特征对应了一个最高分数,该最高分数为该企业特征所能得到的表征风险状况的最高分。该最高分数也就是该企业特征所能得到的满分。
其中,根据实际应用场景的不同,企业特征的最高分数所表征的该企业特征的风险程度也会有所不同,如,企业特征的最高分数表征企业在该企业特征所呈现出的最高风险,相应的,企业在该企业特征的评分越高,该企业在该企业特征上具有的风险越高。又如,企业特征的最高分数可以为企业在该企业特征所呈现出的最低风险,相应的,企业在该企业特征上的评分越高,该企业在该企业特征上所呈现出的风险越低。
其中,企业特征的最高分数可以根据实际需要设定。
作为一种可选方式,本申请可以预先设定表征企业风险状况的企业最高评分,如表征企业风险越低,企业的评分最高,则该企业最高评分为企业风险最低的情况下的评分。同时,可以设定分析企业风险所涉及到的多种指标以及每种指标包含的企业特征。相应的,可以根据经验或者结合一些其他因素,设置每种指标的权重以及每种企业特征的权重。这样,在企业风险状况的最高分数确定的情况下,针对每种企业特征,可以将该企业特征所属的指标的权重与该企业特征的权重以及该企业最高评分相乘,得到该企业特征的最高分数。
举例说明,假设企业风险最低的情况下,企业具有企业最高评分为100分(即企业评分的满分为100分),那么企业涉及到的多种企业特征的最高分数(即企业特征的满分)的总和为100分,如,假设有n个企业特征,分别多个企业特征的最高分数依次表示为S1,S2,…,Sn,则S1+S2+…+Sn=100。
相应的,假设第i个企业特征所属的指标的指标权重为wu(i)、该企业特征的特征权重为wi(i),则该企业特征的最高分数为Si:
Si=100*wu(i)*wi(i) (公式一);
以上是一种确定企业特征的最高分数的情况为例说明,在实际应用中,也可以直接结合经验或者企业特征对企业风险的影响大小,设定企业特征的最高分数。
S203,解析该企业特征的特征数据所属的数据类型。
可以理解的是,不同企业特征评判企业风险的标准不同,每种企业特征的特征数据也会呈现出不同的数据类型。具体的,企业特征的特征数据所属的数据类型可以包括:逻辑类型和数值类型。
其中,逻辑类型的数据的取值为0或1,如,对于企业特征为企业法人是否有违法行为,则结果只能是“有”或者“无”,其中,“有”的取值对应为“1“;而”无“的取值为”0“。
数值类型的数据就是具体的数字。比如,企业特征为企业安全生产时长,则取值为具体的天数,例如,300天等。
S204,在该企业特征的特征数据所属的数据类型为逻辑类型的情况下,调用第一特征评估模型,将该企业特征的特征数据和该企业特征的最高分数输入到该第一特征评估模型,以通过该第一特征评估模型转换出该企业的该企业特征对应的风险评分。
其中,该风险评分用于表征该企业的该企业特征对该企业存在风险影响的程度大小。如,该企业的该企业特征的风险评分越高,企业存在风险的概率越大;或者是,企业的企业特征的风险评分越低,企业存在风险的概率越小。
可以理解的是,由于逻辑类型的数据的取值为1或0,其含义也是“有“或者”无“,可见,该类企业特征的特征数据只能表示该企业特征对企业存在风险影响或者不存在风险影响。基于此,仅仅依据该企业特征的特征数据以及该企业特征的最高分数,便可以确定出该企业的企业特征的风险评分。
如,企业特征的特征数据为”1“时,该企业在该企业特征上的风险评分为企业特征的最高分数;而企业特征的特征数据为”0“,该企业的企业特征的风险评分为0。当然,也可以是企业特征的特征数据为”0“时,企业在该企业特征的风险评分为该企业特征对应的最高评分,相应的,企业特征的特征数据为1,则企业在该企业特征上的风险评分为0。具体结合企业特征中不同特征数据所表征的含义以及实际需要设定。
在本申请实施例中,该第一特征评估模型可以为预置的评分确定程序、评分确定函数或者评分确定代码段等,通过调用该第一特征评估模型,并将第一特征评估模型所需的该企业特征的特征数据以及该企业特征对应的最高分数作为该第一特征评估模型中相应的参数的输入,则可以利用该第一特征评估模型确定出该企业特征的风险评分。其中,对于特征数据为逻辑类型的每种企业特征,均可以通过该S204确定出该企业在该企业特征上的风险评分。
举例说明,第一特征评估模型可以通过如下公式二计算第i个企业特征的风险评分vi(x):
vi(x)=x*Si (公式二);
其中,x表示第i个企业特征的特征数据,Si为第i个企业特征的最高分数。
S205,在该企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表以及该企业特征的特征数据,确定该企业的该企业特征所属的目标影响等级以及该目标影响等级对应的目标权重系数,并调用第二特征评估模型,将该企业特征的最高分数、该企业的该企业特征所属的目标影响等级以及该目标影响等级对应的目标权重系数输入该第二特征评估模型,以通过该第二特征评估模型转换出该企业的该企业特征的风险评分。
其中,该影响等级表中设置有企业特征对应的多个影响等级以及每种影响等级的权重系数。其中,为了便于区分,基于企业特征的特征数据确定出该企业特征所属的影响等级称为目标影响等级。
在一种可能的实现方式中,可以针对企业特征分别设置一种影响等级表,在该影响等级表中可以设置划分出的多个影响等级,每个影响等级对应的权重系数,以及每种影响等级对应的特征数据的数值范围。在该种情况下,可以直接查询该影响等级表确定该企业特征的特征数据所属的影响等级。
在又一种可能的实现方式中,可以针对所有企业特征分别设置统一的影响等级表,在该影响等级表中可以设置划分出的多种影响等级以及每种影响等级对应的权重系数。在该种情况下,可以设置企业特征的特征数据与影响等级的转换函数。
如,针对每种企业特征,可以设置该企业特征的极大边界值和极小边界值,其中,该极大边界值大于该极小边界值,该极大边界值和极小边界值表为该企业特征的特征数据的两个边界范围。在实际应用中,可以根据经验确定该极大边界值和极小边界值。也可以是,确定多个企业在该企业特征上的特征数据从大到小的排名,将特征数据排名靠前的百分之二十的最小特征数据作为该极大边界值;相应的,将排名处于靠后的10%的特征数据中最大的特征数据确定为该极小边界值。
相应的,依据设定的影响等级表中影响等级的等级个数,设定的该企业特征的极大边界值和该企业特征的极小边界值,对该企业特征的特征数据进行等级转换,得到该企业的该企业特征所属的目标影响等级。
如,在该企业特征所属的目标影响等级d可以通过如下公式三得到:
其中,公式三中[]为取整运算。a为企业特征对应的极大边界值,b为企业特征对应的极小边界值,N为设定的影响等级的个数,如,影响等级表中设置有9个影响等级,则N的取值为9。
相应的,针对每种企业特征,在确定出该企业的该企业特征所属的目标影响等级之后,可以按照该影响等级表中不同影响等级与权重系数的对应关系,确定该目标影响等级对应的目标权重系数。
针对每种企业特征,在得到该企业的该企业特征对应的目标影响等级以及目标权重系数之后,可以调用第二特征评估模型,该第二特征评估模型为对数值类型的企业特征进行风险评分的程度或者函数等。相应的,在将该企业特征的最高分数、该企业的该企业特征所属的目标影响等级以及该目标影响等级对应的目标权重系数作为参数输入该第二特征评估模型之后,通过该第二特征评估模型转换出该企业的该企业特征的风险评分。
其中,本申请对第二特征评估模型基于输入的几种参数,确定出该企业的该企业特征的风险评分。其中,第二特征评估模型中可以设置该企业特征所属的目标影响等级、目标权重系数以及该企业特征的最高分数的函数关系,其中,该函数关系可以有多种形式。
可选的,通过该第二特征评估模型确定出该企业的该企业特征所属的目标影响等级属于该影响等级表中的影响等级时,利用企业特征所属的目标影响等级对应的目标权重系数以及该企业特征对应的最高分数,确定该企业的该企业特征的风险评分。通过该第二特征评估模型确定出该企业的该企业特征所属的目标影响等级超出该影响等级表中的影响等级时,根据该企业的该企业特征所属的目标影响等级,将该企业的该企业特征的风险评分设置为该最高分数或者预置的该企业特征对应的最低风险分数。
如,针对一种企业特征i,第二特征评估模型可以通过如下公式四中的函数关系,确定企业的该企业特征的风险评分vi(x):
如果d>N,vi(x)=0;
如果0≤d≤N,vi(x)=Wd*Si;
如果d<0,vi(x)=Si; (公式四);
其中,d为企业的该企业特征所属的目标影响等级,Wd为该目标影响等级对应的目标权重系数,N为设定的影响等级的数量。
x表示第i个企业特征的特征数据,Si为第i个企业特征的最高分。
其中,公式四适用于企业特征的风险评分越高企业出现风险的可能性越低的场景。
可以理解的是,基于企业特征的特征数据,有可能确定出的企业特征所属的目标影响等级会超出设定的影响等级,比如,设定的影响等级为从1到9这九个影响等级,然而,通过前面的方式可能分析出该企业的企业特征所属的影响等级已经超出9级,为十级,在该种情况下,可以将该企业风险的风险评分设置为0。在不同场景下,风险评分为0可以为表征该企业在该企业特征上的风险最低或者是最高。
当然,以上公式四仅仅是一种情况,在设置的影响等级可以包含所有可能出现的影响等级的情况下,也可以直接查询该企业的企业特征所属的目标影响等级对应的目标权重系数,从而直接利用该目标权重系数与该企业特征对应的最高分数相乘,得到该企业的企业特征对应的风险评分。
S206,根据该企业对应的多个企业特征的风险评分,确定该企业的风险状况。
在企业在各个企业特征的风险评分确定之后,可以结合各个企业特征对应的风险评分,综合确定该企业的风险状况。如,可以根据每种企业特征的风险评分所表征的风险大小,确定企业存在风险的大小程度。
可选的,在企业的每种企业特征的风险评分与企业存在风险的相关性统一,如,企业特征的风险评分越高,则表征企业存在风险的程度越低(当然,反过来也类似),那么可以采用模糊算子直接相加的方式,即将企业的多种企业特征的风险评分相加,作为评估该企业存在风险程度大小的企业风险评分。
当然,也可以结合每种企业特征的特征权重,对各个企业特征的风险评分进行加权求和,不过由于前面确定企业特征的风险评分已经考虑到企业特征的特征权重,因此,采用上面提到的模糊算子直接相加的方式效果可能会更好。
可见,本申请获取到能够影响企业风险的多种企业特征的特征数据,并解析出企业特征的特征数据的数据类型,针对不同的数据类型可以调用不同数据类型匹配的特征评估模型。其中,对于企业特征的特征数据为逻辑类型数据的情况,本申请考虑到逻辑类型的数据的取值只有是或者否(如,是为1,否为0)这一特性,可见,该企业特征的特征数据便可以直观反映出企业在该企业特征上有无风险,因此,仅仅结合该企业特征的特征数据以及该企业特征的最高风险评分,确定出该企业在该企业特征上的风险评分。而对于企业特征的特征数据为数值类型的情况,在调用该类型的特征评估模型之后,需要依据该企业特征的特征数据的具体取值、设定的影响等级表中的影响等级以及影响等级对应的权重,并结合该企业特征的最高风险评分,以合理的确定出该企业在该企业特征中的风险评分。可见,本申请可以结合企业特征的特征数据的类型,调用不同的特征评估模型,从而较为合理的确定出该企业在每种企业特征中的风险评分,这样,结合企业在多种维度上的企业特征上的风险评分,便可以确定出企业整体的风险状况,从而为企业监管部门快速,合理的分析各个企业的风险情况提供了依据。
可以理解的是,在本申请实施例中,在企业特征的特征数据属于数值类型的情况下,由于不同企业特征所产生的数据可能是一段时间内仅仅对应一个值,在该种情况下,企业特征的特征数据可能是单个数值。如,企业最近一年的年产值就是一个固定值。而有些企业特征的企业数据可能是一个时间序列数据,比如,企业每个季度末的销售量,这样,该销售量在不同季度末的数值会不同,是一个随着时间变化的数据序列。
在企业特征的特征数据为时间序列数据的情况下,为了使得得到反映该企业特征的风险情况的综合数值,本申请还可以先确定时间序列数据中各个时刻点的数据各自的风险影响权重。相应的,可以按照时间序列数据中各个时刻点的数据各自的风险影响权重,对时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为企业特征对应的用于分析风险评分的特征数据。然后,再基于处理得到的该企业特征的特征数据,确定该企业的该企业特征对应的风险评分。
其中,时间序列数据中各个时刻点的数据对应的风险影响权重与时间序列数据中各个时刻点距离当前时刻的时长有关。时间序列数据中时刻点距离当前时刻的时长越长,该时刻点的权重越小。
可选的,在实际应用中,可以按照时刻点所属的年度距离当前时刻所属的当前年度的时长,确定该时刻点所属的年度的风险影响权重,并将该时刻点所属年度的风向影响权重作为该时刻点对应的风险影响权重。
如,企业特征的特征数据为最近三年的特征数据,且当前年的特征数据表示为xt、当前年的前一年对应的特征数据表示为xt-1,而距离当前年两年的那一年的特征数据xt-2,则当前年对应的风险影响权重可以为0.5,当前年的前一年的风险影响权重可以为0.3;当前年之前两年对应的风险影响权重为0.2,则企业特征在这三年的特征数据的加权和x+可以表示如下:
x+=0.5*xt+0.3*xt-1+0.2*xt-2;
当然,一个年度内可能会存在该企业特征的多个特征数据,那么只需要将年度中每个时刻的特征数据均分别与该年度对应的风险影响权重相乘后,再相加即可。
仍以上面例子中最近三年的数据为例说明,假设当前年为19年表示为t,则风险影响权重为0.5;而18年表示为t-1,且18年的风险影响权重为0.3;而17年表示为t-2,且17年对应的风险影响权重为0.2。
对于第i个企业特征为,如下表格中为取值为企业特征在不同时间点的特征数据,则该企业特征获取到的特征数据以及各个特征数据对应的时刻点如表1所示:
表1
时间 | 数值 | 对应时间段 |
2014/6/4 | 4 | 删除 |
2017/5/4 | 5 | t-2 |
2018/8/2 | 6 | t-1 |
2018/9/1 | 4 | t-1 |
2019/8/9 | 9 | t |
其中,由于2014年距离19年的时长已经超过三年,所以可以不利用14年的特征数据分析该企业特征的风险评分,从而可以直接删除该数据。
那么,企业特征在最近三年的特征数据所组成的时间序列数据进行处理,可以通过如下方式进行加权求和,得到该企业特征处理后的特征数据x+为:
x+=0.2*5+0.3*6+0.3*4+0.5*9=8.5
可见,18年在两个不同时间点获取到特征数据,但是18年这两个时间点获取到的数据对应的权重均为0.3。
可以理解的是,每种企业特征与企业风险之间相关类型不同,其中,企业特征与企业风险之间的相关类型包括正相关类型和负相关类型,其中,在该企业特征与企业风险之间为正相关类型时,该企业特征的特征数据的数据值越大,企业特征的特征数据导致企业存在风险的可能性越大。如,企业特征为企业亏损时,则企业亏损的金额越大,则企业存现风险的可能性越大,因此,企业亏损这一企业特征与企业风险之间为正相关。
相应的,在企业特征与企业风险之间为负相关类型时,该企业特征的特征数据的数据值越小,该企业特征的特征数据导致企业存在风险的可能性越大。如,企业特征为企业正常盈利时,盈利金额越高,而企业特征出现风险的可能性相对越低,则该企业正常盈利与企业风险之间存在负相关。
考虑到企业特征与企业风险之间的相关性不同,企业特征对应的风险评分所表征出的含义也会不同,为了能够基于各个企业特征的风险评分,更为方便、快捷的确定出企业的风险状况,本申请还可以将企业特征的特征数据转换为同一种相关类型下的数据。具体的,针对每种企业特征,如果企业特征与企业风险之间的相关类型不属于设定相关类型,将该企业特征的特征数据转换为符合该设定相关类型的特征数据,其中,设定相关类型可以为正相关类型或者负相关类型。
如,对于与企业风险之间的相关性不属于设定相关类型的每种企业特征i,可以将该企业特征的企业数据按照如下公式五的方式进行转换,以将该企业特征的特征数据xi转换为与企业风险之间的相关性属于设定相关类型的特征数据x″i:
可以理解的是,经过公式五的转换之后,转换后的企业特征的特征数据与该企业风险之间存在负相关类型,即转换后的企业特征的特征数据的值越大,则企业在该企业特征上的风险越小。
可以理解的是,本申请考虑到不同企业特征的特征数据所涵盖的数值范围的差距也较大,因此,无法直观评分各个企业特征的特征数据对企业风险的影响程度的大小关系。因此,为了使得各个企业特征的特征数据之间具有可比性,在以上任意一个实施例中,在基于企业特征的特征数据(或者是转换后的特征数据)确定企业的该企业特征的风险评分之前,还可以依据该多个企业特征各自对应的属于该设定相关类型的特征数据,分别对每个企业特征的特征数据进行标准化处理。相应的,针对每种企业特征,可以依据标准化后的企业特征的特征数据确定企业在该企业特征上的风险评分。
为了便于理解,本申请中对于企业特征的特征数据的以上转换以及标准化处理,下面结合一种情况进行说明。如图3所示,其示出了本申请一种企业数据处理方法又一个实施例的流程示意图,本实施例的方法可以包括:
S301,获取企业的多种企业特征的特征数据。
其中,该企业特征属于设定的能够影响企业风险的特征。
S302,针对每种企业特征,解析该企业特征的特征数据所属的数据类型,如数据类型为逻辑类型,则执行步骤S303;如数据类型为数值类型,则执行步骤S304。
S303,在该企业特征的特征数据所属的数据类型为逻辑型数据的情况下,调用第一特征评估模型,通过该第一特征评估模型将该企业特征的特征数据与该企业特征的最高分数相乘,得到该企业的该企业特征的风险评分。
如,第一特征评估模型确定企业的企业特征的风险评分的具体方式可以参见公式二所示,在此不再赘述。
本实施例为了便于理解,以第一特征评估模型通过前面的公式二确定企业特征的风险评分为例说明,但是可以理解的是,对于第一特征评估模型通过其他方式确定属于逻辑类型的企业特征的特征数据所对应的风险评分也同样适用于本实施例。
S304,在企业特征的特征数据所属的数据类型为数值类型的情况下,检测该企业特征的特征数据是否属于时间序列数据,如果是,则执行步骤S305;如果否,则不对该企业特征的特征数据进行处理,并直接执行步骤S307;
S305,确定该时间序列数据中各个时刻点的数据各自的风险影响权重。
其中,该时间序列数据中各个时刻点的数据对应的风险影响权重与所述时间序列数据中各个时刻点距离当前时刻的时长有关
S306,按照该时间序列数据中各个时刻点的数据各自的风险影响权重,对该时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为该企业特征对应的用于分析风险评分的特征数据,并基于处理得到的该企业特征的特征数据,执行步骤S307。
S307,针对每种企业特征,如果该企业特征与企业风险之间的相关类型不属于负相关类型,将该企业特征的特征数据转换为符合负相关类型的特征数据,得到每种企业特征对应的符合负相关类型的目标特征数据。
可以理解的是,如果企业特征与企业风险之间的相关性属于负相关类型,则无需对该企业特征的特征数据进行转换,而该企业特征的特征数据就是该企业特征对应的符合负相关类型的目标特征数据。反之,如果企业特征与企业风险之间的相关性为负相关类型,则需要进行一些转换,如可以参照前面可以按照前面公式五进行转换。
在本申请实施例中,为了便于理解,以设定相关类型为负相关类型为例说明。
S308,对于每种企业特征,依据所有属于数值类型且属于负相关类型的多个企业特征的目标特征数据,对该企业特征的目标特征数据进行标准化处理,得到企业特征对应的标准化特征数据。
可以理解的是,在经过前面S304到S308的处理,对于每种属于数值类型的企业特征的特征数据而言,该企业特征的特征数据均会转换为与企业风险之间的相关性为负相关类型的目标特征数据。相应的,对于这些特征数据为数值类型的多个企业特征,,需要结合该多个企业特征对应的目标特征数据对每个企业特征对应的目标特征数据进行标准化,以得到每个企业特征对应的标准化特征数据。
其中,不同企业特征的标准化特征数据之间具有可比性,比如,由于标准化特征数据是与企业风险之间存在负相关,因此,如果企业特征的标准化特征数据越大,该企业特征对企业风险的影响越小。相应的,如果企业特征A的标准化特征数据比企业特征B的标准化特征数据大,则企业特征A导致企业存在风险的概率小于企业特征B导致企业存在风险的概率。
其中,为了便于理解,将特征数据属于数值类型的企业特征称为第二类企业特征,而所有第二类企业特征会组成第二类企业特征集合,该第二类企业特征集合包括多个第二类企业特征。其中,针对第i个第二类企业特征,该第二类企业特征的标准化特征数据X″i可以通过如下公式六计算得到:
其中,x″i为第i个第二类企业特征对应的设定相关类型的特征数据,其中,该设定相关类型的特征数据是指与企业风险之间的相关性为即设定相关类型(在本实施为负相关类型)的特征数据。m″i为第二类企业特征集合中各个第二类企业特征对应的设定相关类型的特征数据中,最小的设定相关类型的特征数据;M″i为第二类企业特征集合中各个第二类企业特征对应的设定相关类型的特征数据中,最大的设定相关类型的特征数据。
S309,针对每种企业特征,依据设定的影响等级表中影响等级的等级个数,设定的企业特征的极大边界值和企业特征的极小边界值,对该企业特征的标准化特征数据进行等级转换,得到企业的该企业特征所属的目标影响等级。
S310,在企业的企业特征所属的目标影响等级属于该设定的影响等级表中包含的影响等级的情况下,按照影响等级表中不同影响等级与权重系数的对应关系,确定该目标影响等级对应的目标权重系数。
举例说明,如结合国际惯例中信用等级的划分,在风险登记表中设置9个影响等级。如表2所示:
表2
在表2中示出了以影响等级表中划分出了9种影响等级,以及每种影响等级对应的权重系数的一个例子。
在表2的基础上,结合前面公式三可知,设定的影响等级的个数N为9,,那么:
其中,如果X″i的值大于企业特征对应的极大边界值a,那么d的取值将会大于9,其超出表2中影响等级表中最大的影响等级即9级。相应的,如果X″i的值小于企业特征对应的极小边界值b,那么确定出的目标影响等级d的取值将会小于表2中最小影响等级。而在X″i的值为极大边界值a或者极小边界值b,或者X″i的值处于极大边界值a和极小边界值b之间的情况,该目标影响等级可能为从1到9的任意一个等级。
假设目标影响等级d为6,则通过表2可知,目标风险等级对应的目标权重系数为0.65,而如果目标风险等级不属于表2中的9个等级,则获取到的目标权重系数为空。
S311,针对每种企业特征,调用第二特征评估模型,将该企业特征所属的目标影响等级、该企业特征的最高分数和/或该目标影响等级对应的目标权重系数输入到该第二特征评估模型,得到该第二特征评估模型输出该企业特征的风险评分。
举例说明,仍结合前面表2的情况,并以第二特征评估模型通过前面提到的公式四确定风险评分为例说明,则在设定的影响等级的数量N为9的情况下可得:
此特征的分值函数如下:
如果d>9,vi(x)=0;
如果0≤d≤9,vi(x)=Wd*Si;
如果d<0,vi(x)=Si;
由于本申请是以设定相关类型为负相关类型为例,因此,如果该企业特征的特征数据相对较高,则d会超过9级,在该种情况下,企业特征对应的风险评分却相对较低,即该企业的该企业特征导致企业出现风险的概率相对较低。其他几种情况类似。
S312,根据该企业对应的多个企业特征的风险评分,确定该企业的风险状况。
如,可以通过企业的风险评分来表征企业的风险状况。例如,该企业的风险评分V可以通过如下公式八得到:
其中,Vi(x)为企业的第i个企业特征对应的风险评分。i属于从1到n的自然数组成的自然数集合中的数,该自然数集合包括1和n,n为企业的多种企业特征的总数。
在本实施例中,由于以设定相关类型为负相关类型为例说明,因此,企业的企业特征的标准化特征数据的数值越低,则该企业特征导致企业出现风险的可能性越高,最终会使得企业的风险评分越高。相应的,如果企业的风险评分V越低,则说明企业存在风险的概率较低;如果企业的风险评分越高,则企业存在风险的概率越高。
可以理解的是,本实施例是以设定相关类型为负相关类型为例说明,在设定相关类型为正相关类型的情况下,只需要在企业特征的标准化特征数据未处于极大边界值和极小边界值的情况下,适当调整企业特征对应的风险评分即可,其原理基本相似,在此不再赘述。
对应本申请的一种企业数据处理方法,本申请还提供了一种企业数据处理装置。
如图4所示,其示出了本申请一种企业数据处理装置的一种组成结构示意图,本实施例的装置可以包括:
数据获取单元401,用于获取企业的多种企业特征的特征数据,所述企业特征属于设定的能够影响企业风险的特征;
标准分获得单元402,用于获得设定的每种所述企业特征对应的最高分数;
类型解析单元403,用于解析所述企业特征的特征数据所属的数据类型;
第一评分单元404,用于在所述企业特征的特征数据所属的数据类型为逻辑类型的情况下,调用第一特征评估模型,将所述企业特征的特征数据和所述企业特征的最高分数输入到所述第一特征评估模型,以通过所述第一特征评估模型转换出所述企业的所述企业特征对应的风险评分;
第二评分单元405,用于在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,并调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,其中,所述影响等级表中设置有企业特征对应的多个影响等级以及每种影响等级的权重系数;
风险评估单元406,用于根据所述企业对应的多个企业特征的风险评分,确定所述企业的风险状况。
在一种可能的情况中,所述第二评分单元,包括:
等级确定单元,用于在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表中影响等级的等级个数,设定的所述企业特征的极大边界值和所述企业特征的极小边界值,对所述企业特征的特征数据进行等级转换,得到所述企业的所述企业特征所属的目标影响等级;
权重确定单元,用于按照所述影响等级表中不同影响等级与权重系数的对应关系,确定所述目标影响等级对应的目标权重系数;
模型调用单元,用于调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分。
在又一种可能的情况中,所述第二评分单元,还用于在确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,如果所述企业特征的特征数据为时间序列数据,确定所述时间序列数据中各个时刻点的数据各自的风险影响权重;按照所述时间序列数据中各个时刻点的数据各自的风险影响权重,对所述时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为所述企业特征对应的用于分析风险评分的特征数据,其中,所述时间序列数据中各个时刻点的数据对应的风险影响权重与所述时间序列数据中各个时刻点距离当前时刻的时长有关。
在又一种可能的情况中,所述第二评分单元,还用于在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,如果所述企业特征与企业风险之间的相关类型不属于设定相关类型,将所述企业特征的特征数据转换为符合所述设定相关类型的特征数据,其中,企业特征与企业风险之间的相关类型包括正相关类型和负相关类型,所述设定相关类型为所述正相关类型或者负相关类型;
其中,在所述企业特征与企业风险之间为正相关类型时,所述企业特征的特征数据的数据值越大,所述企业特征的特征数据导致企业存在风险的可能性越大;在所述企业特征与企业风险之间为负相关类型时,所述企业特征的特征数据的数据值越小,所述企业特征的特征数据导致企业存在风险的可能性越大。
可选的,该第二评分装置,还用于在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,依据所述多个企业特征各自对应的属于所述设定相关类型的特征数据,分别对每个所述企业特征对应的属于所述设定相关类型的特征数据进行标准化处理,得到处理后的所述企业特征的特征数据。
在又一种可能的实现方式中,所述第二评分单元在通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分时,具体用于:
通过所述第二特征评估模型确定出所述企业的所述企业特征所属的目标影响等级属于所述影响等级表中的影响等级时,利用企业特征所属的目标影响等级对应的目标权重系数以及所述企业特征对应的最高分数,确定所述企业的所述企业特征的风险评分;
通过所述第二特征评估模型确定出所述企业的所述企业特征所属的目标影响等级超出所述影响等级表中的影响等级时,根据所述企业的所述企业特征所属的目标影响等级,将所述企业的所述企业特征的风险评分设置为所述最高分数或者预置的所述企业特征对应的最低风险分数。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种企业数据处理方法,其特征在于,包括:
获取企业的多种企业特征的特征数据,所述企业特征属于设定的能够影响企业风险的特征;
获得设定的每种所述企业特征对应的最高分数;
解析所述企业特征的特征数据所属的数据类型;
在所述企业特征的特征数据所属的数据类型为逻辑类型的情况下,调用第一特征评估模型,将所述企业特征的特征数据和所述企业特征的最高分数输入到所述第一特征评估模型,以通过所述第一特征评估模型转换出所述企业的所述企业特征对应的风险评分;
在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,并调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,其中,所述影响等级表中设置有企业特征对应的多个影响等级以及每种影响等级的权重系数;
根据所述企业对应的多个企业特征的风险评分,确定所述企业的风险状况。
2.根据权利要求1所述的方法,其特征在于,所述依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,包括:
依据设定的影响等级表中影响等级的等级个数,设定的所述企业特征的极大边界值和所述企业特征的极小边界值,对所述企业特征的特征数据进行等级转换,得到所述企业的所述企业特征所属的目标影响等级;
按照所述影响等级表中不同影响等级与权重系数的对应关系,确定所述目标影响等级对应的目标权重系数。
3.根据权利要求1所述的方法,其特征在于,在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,还包括:
如果所述企业特征的特征数据为时间序列数据,确定所述时间序列数据中各个时刻点的数据各自的风险影响权重;
按照所述时间序列数据中各个时刻点的数据各自的风险影响权重,对所述时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为所述企业特征对应的用于分析风险评分的特征数据,其中,所述时间序列数据中各个时刻点的数据对应的风险影响权重与所述时间序列数据中各个时刻点距离当前时刻的时长有关。
4.根据权利要求1或3所述的方法,其特征在于,在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,还包括:
如果所述企业特征与企业风险之间的相关类型不属于设定相关类型,将所述企业特征的特征数据转换为符合所述设定相关类型的特征数据,其中,企业特征与企业风险之间的相关类型包括正相关类型和负相关类型,所述设定相关类型为所述正相关类型或者负相关类型;
其中,在所述企业特征与企业风险之间为正相关类型时,所述企业特征的特征数据的数据值越大,所述企业特征的特征数据导致企业存在风险的可能性越大;在所述企业特征与企业风险之间为负相关类型时,所述企业特征的特征数据的数据值越小,所述企业特征的特征数据导致企业存在风险的可能性越大。
5.根据权利要求4所述的方法,其特征在于,在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,还包括:
依据所述多个企业特征各自对应的属于所述设定相关类型的特征数据,分别对每个所述企业特征对应的属于所述设定相关类型的特征数据进行标准化处理,得到处理后的所述企业特征的特征数据。
6.根据权利要求1所述的方法,其特征在于,所述通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,包括:
通过所述第二特征评估模型确定出所述企业的所述企业特征所属的目标影响等级属于所述影响等级表中的影响等级时,利用企业特征所属的目标影响等级对应的目标权重系数以及所述企业特征对应的最高分数,确定所述企业的所述企业特征的风险评分;
通过所述第二特征评估模型确定出所述企业的所述企业特征所属的目标影响等级超出所述影响等级表中的影响等级时,根据所述企业的所述企业特征所属的目标影响等级,将所述企业的所述企业特征的风险评分设置为所述最高分数或者预置的所述企业特征对应的最低风险分数。
7.一种企业数据处理装置,其特征在于,包括:
数据获取单元,用于获取企业的多种企业特征的特征数据,所述企业特征属于设定的能够影响企业风险的特征;
标准分获得单元,用于获得设定的每种所述企业特征对应的最高分数;
类型解析单元,用于解析所述企业特征的特征数据所属的数据类型;
第一评分单元,用于在所述企业特征的特征数据所属的数据类型为逻辑类型的情况下,调用第一特征评估模型,将所述企业特征的特征数据和所述企业特征的最高分数输入到所述第一特征评估模型,以通过所述第一特征评估模型转换出所述企业的所述企业特征对应的风险评分;
第二评分单元,用于在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表以及所述企业特征的特征数据,确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数,并调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分,其中,所述影响等级表中设置有企业特征对应的多个影响等级以及每种影响等级的权重系数;
风险评估单元,用于根据所述企业对应的多个企业特征的风险评分,确定所述企业的风险状况。
8.根据权利要求7所述的装置,其特征在于,所述第二评分单元,包括:
等级确定单元,用于在所述企业特征的特征数据所属的数据类型为数值类型的情况下,依据设定的影响等级表中影响等级的等级个数,设定的所述企业特征的极大边界值和所述企业特征的极小边界值,对所述企业特征的特征数据进行等级转换,得到所述企业的所述企业特征所属的目标影响等级;
权重确定单元,用于按照所述影响等级表中不同影响等级与权重系数的对应关系,确定所述目标影响等级对应的目标权重系数;
模型调用单元,用于调用第二特征评估模型,将所述企业特征的最高分数、所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数输入所述第二特征评估模型,以通过所述第二特征评估模型转换出所述企业的所述企业特征的风险评分。
9.根据权利要求7所述的装置,其特征在于,所述第二评分单元,还用于在确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,如果所述企业特征的特征数据为时间序列数据,确定所述时间序列数据中各个时刻点的数据各自的风险影响权重;按照所述时间序列数据中各个时刻点的数据各自的风险影响权重,对所述时间序列中各个时刻点的数据进行加权求和,将加权求和所得的数值确定为所述企业特征对应的用于分析风险评分的特征数据,其中,所述时间序列数据中各个时刻点的数据对应的风险影响权重与所述时间序列数据中各个时刻点距离当前时刻的时长有关。
10.根据权利要求7或9所述的装置,其特征在于,所述第二评分单元,还用于在所述确定所述企业的所述企业特征所属的目标影响等级以及所述目标影响等级对应的目标权重系数之前,如果所述企业特征与企业风险之间的相关类型不属于设定相关类型,将所述企业特征的特征数据转换为符合所述设定相关类型的特征数据,其中,企业特征与企业风险之间的相关类型包括正相关类型和负相关类型,所述设定相关类型为所述正相关类型或者负相关类型;
其中,在所述企业特征与企业风险之间为正相关类型时,所述企业特征的特征数据的数据值越大,所述企业特征的特征数据导致企业存在风险的可能性越大;在所述企业特征与企业风险之间为负相关类型时,所述企业特征的特征数据的数据值越小,所述企业特征的特征数据导致企业存在风险的可能性越大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911023077.XA CN110782163A (zh) | 2019-10-25 | 2019-10-25 | 企业数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911023077.XA CN110782163A (zh) | 2019-10-25 | 2019-10-25 | 企业数据处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110782163A true CN110782163A (zh) | 2020-02-11 |
Family
ID=69386458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911023077.XA Pending CN110782163A (zh) | 2019-10-25 | 2019-10-25 | 企业数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110782163A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353716A (zh) * | 2020-03-05 | 2020-06-30 | 苏宁金融科技(南京)有限公司 | 一种非法集资检测方法、系统及计算机可读存储介质 |
CN112001582A (zh) * | 2020-07-08 | 2020-11-27 | 中国兵器科学研究院 | 一种城区行动评估方法、装置、设备及计算机存储介质 |
-
2019
- 2019-10-25 CN CN201911023077.XA patent/CN110782163A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353716A (zh) * | 2020-03-05 | 2020-06-30 | 苏宁金融科技(南京)有限公司 | 一种非法集资检测方法、系统及计算机可读存储介质 |
CN112001582A (zh) * | 2020-07-08 | 2020-11-27 | 中国兵器科学研究院 | 一种城区行动评估方法、装置、设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Das et al. | Manipulation among the arbiters of collective intelligence: How Wikipedia administrators mold public opinion | |
CN116342259A (zh) | 一种用户信用自动评级方法、装置、电子设备及介质 | |
Carton et al. | Identifying police officers at risk of adverse events | |
KR101593910B1 (ko) | 개인 정보 상시 감시 시스템 및 그 상시 감시 방법 | |
CN111738549A (zh) | 食品安全风险评估方法、装置、设备及存储介质 | |
US7644026B2 (en) | Ranking systems based on a risk | |
US11507674B2 (en) | Quantifying privacy impact | |
Olaoye et al. | Impact of forensic accounting and investigation on corporate governance in Ekiti State | |
CN110782163A (zh) | 企业数据处理方法和装置 | |
CN111061948B (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN115619420A (zh) | 一种空壳企业精准识别方法、系统、设备及存储介质 | |
CN112712270B (zh) | 信息处理方法、装置、设备及存储介质 | |
CN110675240B (zh) | 风险雷达预警的监控方法及系统 | |
CN114997588A (zh) | 一种金融企业风险识别预警方法及系统 | |
CN115345401A (zh) | 一种发现企业金融风险的六维分析方法 | |
CN115146890A (zh) | 企业运营风险告警方法、装置、计算机设备和存储介质 | |
CN114493851A (zh) | 一种风险处理方法及装置 | |
CN113450010A (zh) | 数据对象的评价结果的确定方法、装置和服务器 | |
CN111652517A (zh) | 一种工程承载能力的量化评估方法及装置 | |
Pan | Fraudulent firm classification using monotonic classification techniques | |
CN113723522B (zh) | 异常用户的识别方法、装置、电子设备以及存储介质 | |
CN110738570A (zh) | 基于多通道异质数据的信息型操纵自动识别方法 | |
CN111611397A (zh) | 信息匹配方法、装置、计算机设备和存储介质 | |
Barbosa et al. | Single market non-compliance: how relevant is the institutional setting? | |
CN115829366A (zh) | 一种针对员工的审计方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200211 |