CN112581000A

CN112581000A - 企业风险指数计算方法及装置

Info

Publication number: CN112581000A
Application number: CN202011551983.XA
Authority: CN
Inventors: 邢竟; 江佳良; 华艺; 黄伟如; 金成伟; 郑建飞; 曾沂粲; 赵仕嘉
Original assignee: Guangdong Planning and Designing Institute of Telecommunications Co Ltd
Current assignee: Guangdong Planning and Designing Institute of Telecommunications Co Ltd
Priority date: 2020-12-24
Filing date: 2020-12-24
Publication date: 2021-03-30

Abstract

本发明实施例中，基于企业业务特点和企业风险现状，对企业风险点进行指标量化，建立企业风险指标体系；获取企业业务数据，根据预设的数据异常规则或使用数据异常识别算法，对所述企业业务数据进行数据清洗；根据预设的业务风险评估模型，对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到所述企业业务数据所对应的目标企业的风险情况。可见，本发明能够从企业业务特征和企业风险现状出发，建立合理全面的企业风险指标体系，并预先对企业业务数据进行数据清洗，提高数据质量，且从不同经营单元的级别分别进行风险指数的计算，从而有效提高企业风险评估的效率和准确性。

Description

企业风险指数计算方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种企业风险指数计算方法及装置。

背景技术

近年来，随着企业规模的扩大，在项目的管理上出现了各种各样的问题，例如有合同虚高、合同流失、虚假合同、虚假项目、虚假工作量、预算大幅调整、虚假列账、成本超前、项目关闭不及时、应收应付不及时等等。这些问题在一定程度上严重损害了企业的利益。全面风险管理与内控体系建设在国家法律法规引导下，正在全面推进。

现有的业务风险评估技术，一般根据预先建立的风险评估模型，评估各个规则对应的风险分值，将多条规则对应的风险分值进行累加，并将累加后的风险分值总和与预先设置的各个风险等级的风险总分阈值进行比较，确定出业务数据的风险等级。

上述现有的业务风险评估技术，其缺点在于部分风险点缺少指标量化，风险定性分析会受主观评价影响，且其从某一单一维度设计风险规则或者阈值，风险评估不够全面，同时其没有考虑到对现有数据进行风险识别与评估，缺少数据治理工作。

发明内容

本发明所要解决的技术问题在于，提供一种企业风险指数计算方法及装置，能够从企业业务特征和企业风险现状出发，建立合理全面的企业风险指标体系，并预先对企业业务数据进行数据清洗，提高数据质量，且从不同经营单元的级别分别进行风险指数的计算，从而有效提高企业风险评估的效率和准确性。

为了解决上述技术问题，本发明第一方面公开了一种企业风险指数计算方法，所述方法包括：

基于企业业务特点和企业风险现状，对企业风险点进行指标量化，建立企业风险指标体系；所述企业风险指标体系包括多个企业风险指标；获取企业业务数据，根据预设的数据异常规则或使用数据异常识别算法，对所述企业业务数据进行数据清洗；所述企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种；

根据预设的业务风险评估模型，对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到所述企业业务数据所对应的目标企业的风险情况。

作为一种可选的实施方式，在本发明第一方面中，所述方法还包括：

使用CART分类回归树算法，针对每个所述企业风险指标，对所有所述企业业务数据执行CART分类树生成操作。

作为一种可选的实施方式，在本发明第一方面中，所述企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种；

所述企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。

作为一种可选的实施方式，在本发明第一方面中，所述数据异常识别算法为3σ异常检测算法，所述经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。

作为一种可选的实施方式，在本发明第一方面中，所述根据预设的业务风险评估模型，对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到所述企业业务数据所对应的目标企业的风险情况，包括：

确定业务风险评估模型的定义为：

R(X_i)＝p(X_i)*C_损；

其中，R(X_i)为风险指数，P(X_i)为风险发生概率，C_损为该风险发生后带来的潜在损失；

计算第i个项目的第m个项目维度指标的指标风险值

其中i＝1,2,3,4……I，m＝1,2,3,4……M；I为项目个数，M为项目维度指标个数，P为风险发生概率；C为风险发生时带来的损失大小。

计算第j个项目部第n个经营单元维度指标的风险值

计算第k个分公司第n个经营单元维度指标的风险值

计算第l个专业公司第n个经营单元维度指标的风险值

计算每个所述项目的综合风险

包括：

其中，I为项目个数，M为项目维度指标个数；

为第m个项目维度指标的权重；

计算每一所述经营单元中的项目综合风险

计算每一所述经营单元维度指标的风险R⁽²⁾：

计算每一所述经营单元的综合风险R：

其中，

为项目维度指标的权重；

为经营单元维度指标的权重。

作为一种可选的实施方式，在本发明第一方面中，所述使用CART分类回归树算法，针对每个所述企业风险指标，对所有所述企业业务数据执行CART分类树生成操作，包括：

确定影响所述企业风险指标的项目属性；所述项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种；

对每一所述企业风险指标执行特征选择操作，从可能影响所述企业风险指标的所有所述项目因素中，筛选出显著影响的项目因素；

对每一所述企业风险指标执行生成CART分类树操作，对生成的所述CART分类树进行剪枝操作。

作为一种可选的实施方式，在本发明第一方面中，所述对每一所述企业风险指标执行生成CART分类树操作，包括：

(1)计算现有特征对该数据集的基尼指数，对于每一个特征A，可以对样本点A是否为a可以将数据集D分成数据集D1，D2；

(2)对于所有的特征A和所有可能的切分点a，选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点；

(3)对最优子树递归调用步骤(1)、步骤(2)，直到满足预设的停止条件；

(4)生成CART分类树；

以及，所述并对生成的所述CART分类树进行剪枝操作，包括：

①、计算每一个结点的经验熵；

②、递归的从叶子节点开始往上遍历，减掉叶子节点，然后判断损失函数的值是否减少，如果减少，则将父节点作为新的叶子节点；

③、重复步骤①②，直到完全不能剪枝。

本发明第二方面公开了一种企业风险指数计算装置，所述装置包括：

体系建立模块，用于基于企业业务特点和企业风险现状，对企业风险点进行指标量化，建立企业风险指标体系；所述企业风险指标体系包括多个企业风险指标；数据清洗模块，用于获取企业业务数据，根据预设的数据异常规则或使用数据异常识别算法，对所述企业业务数据进行数据清洗；所述企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种；

指数计算模块，用于根据预设的业务风险评估模型，对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到所述企业业务数据所对应的目标企业的风险情况。

作为一种可选的实施方式，在本发明第二方面中，所述装置还包括：

生成模块，用于使用CART分类回归树算法，针对每个所述企业风险指标，对所有所述企业业务数据执行CART分类树生成操作。

作为一种可选的实施方式，在本发明第二方面中，所述企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种；

作为一种可选的实施方式，在本发明第二方面中，所述数据异常识别算法为3σ异常检测算法，所述经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。

作为一种可选的实施方式，在本发明第二方面中，所述根据预设的业务风险评估模型，对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到所述企业业务数据所对应的目标企业的风险情况，包括：

确定业务风险评估模型的定义为：

R(X_i)＝p(X_i)*C_损；

计算第i个项目的第m个项目维度指标的指标风险值

计算第j个项目部第n个经营单元维度指标的风险值

计算第k个分公司第n个经营单元维度指标的风险值

计算第l个专业公司第n个经营单元维度指标的风险值

计算每个所述项目的综合风险

包括：

其中，I为项目个数，M为项目维度指标个数；

为第m个项目维度指标的权重；

计算每一所述经营单元中的项目综合风险R⁽¹⁾：

计算每一所述经营单元维度指标的风险R⁽²⁾：

计算每一所述经营单元的综合风险R：

其中，

为项目维度指标的权重；

为经营单元维度指标的权重。

作为一种可选的实施方式，在本发明第二方面中，所述使用CART分类回归树算法，针对每个所述企业风险指标，对所有所述企业业务数据执行CART分类树生成操作，包括：

作为一种可选的实施方式，在本发明第二方面中，所述对每一所述企业风险指标执行生成CART分类树操作，包括：

(4)生成CART分类树；

以及，所述并对生成的所述CART分类树进行剪枝操作，包括：

①、计算每一个结点的经验熵；

③、重复步骤①②，直到完全不能剪枝。

本发明第三方面公开了另一种企业风险指数计算装置，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面公开的企业风险指数计算方法中的部分或全部步骤。

本发明实施例第四方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明实施例第一方面公开的企业风险指数计算方法中的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种企业风险指数计算方法的流程示意图；

图2是本发明实施例公开的一种企业风险指数计算装置的结构示意图；

图3是本发明实施例公开的又一种企业风险指数计算装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种企业风险指数计算方法及装置，能够从企业业务特征和企业风险现状出发，建立合理全面的企业风险指标体系，并预先对企业业务数据进行数据清洗，提高数据质量，且从不同经营单元的级别分别进行风险指数的计算，从而有效提高企业风险评估的效率和准确性。以下分别进行详细说明。

实施例一

请参阅图1，图1是本发明实施例公开的一种企业风险指数计算方法的流程示意图。在阐述本发明实施例之前，先对本发明实施例所对应的创造目的进行阐述，本发明实施例的目的在于，以项目为核心主线，围绕项目全生命周期进行业务风险点的识别，根据风险点特征，建立一套完整的、全面的、可量化的风险评估指标体系。结合企业业务数据，利用大数据算法，构建业务风险评估模型，快速生成风险评估结果，帮助企业实现风险的远程监控、风险事前预警、风险线上闭环整改、快速准确定位风险问题源，以实现企业风险预警和风险防控。具体的，如图1所示，该企业风险指数计算方法可以包括以下操作：

101、基于企业业务特点和企业风险现状，对企业风险点进行指标量化，建立企业风险指标体系。

具体的，企业风险指标体系包括多个企业风险指标。本发明实施例中，企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种。

企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。

可见，本发明实施例是从企业业务特征和企业风险现状出发，贯穿项目实施全生命周期过程，识别业务风险点。利用风险检查表法、头脑风暴法，并结合文献法总结行业经验，组织风险管理领域专家和业务专家进行研究讨论，对进度风险、成本风险等风险点进行指标量化，构建以合同虚高，合同流失，虚假合同，虚假项目，虚假工作量，预算准确率，虚假列账，成本超前，以及项目关闭不及时和应收应付不及时等10个风险点为框架的全面风险指标体系。

进一步的，还可以同时利用大数据机器学习算法进行风险分析建模，形成完整的系统评测技术，实现风险量化。通过对数据源进行配置，及进行详细的ETL处理，并运用多种分析算法，对分析算法进行详细调参得到相应的结果，最终对结果可视化。

102、获取企业业务数据，根据预设的数据异常规则或使用数据异常识别算法，对企业业务数据进行数据清洗。

具体的，企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种。本发明实施例中，数据异常识别算法为3σ异常检测算法。

103、根据预设的业务风险评估模型，对企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到企业业务数据所对应的目标企业的风险情况。

具体的，经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。具体的，本发明实施例主要利用大数据异常识别算法(3σ异常算法)构建数据异常模型识别异常数据，处理异常数据，反向促动项目管理系统数据质量提升；利用多种特征选择算法(CART(Classification and Regression Trees)分类回归树)自动选择最优算法实现项目分组聚类，实现同类项目风险可比；利用专家调研法及层次分析法实现指标体系权重的确认；最后采用非线性风险判罚机制评估风险，实现风险的自动评估和风险的事前预测预警，通过自定义建模模型实现风险体系的动态更新。

具体的，在步骤102的数据清洗过程中，结合实现情况，主要从以下两个方面来实现。第一，采用专家调研法和集中会议讨论法，结合企业业务实际情况，对字段和指标设定异常规则，按异常规则识别异常数据。第二，采用大数据异常识别算法(3σ异常算法)，识别字段和指标异常情况。

具体的，3σ原则是指在正态分布中σ代表标准差，μ代表均值。x＝μ即为图像的对称轴。数值分布在(μ-σ，μ+σ)中的概率为0.6827，数值分布在(μ-2σ，μ+2σ)中的概率为95.45％，则值分布在(μ-3σ，μ+3σ)中的概率为99.73％。因此可认为，取值几乎全部集中在(μ-3σ，μ+3σ)区间内，超出这个范围的可能性仅占不到0.3％，有理由认为3σ以外的数据为异常值。

对于异常数据，统一制定数据异常规则，筛选异常清单，用于指导专业公司进行异常数据整改，提高数据质量；针对部分项目管理系统暂时无法提供的数据，提供数据开发需求，丰富完善数据资产。

可见，通过实施本发明实施例，能够从企业业务特征和企业风险现状出发，建立合理全面的企业风险指标体系，并预先对企业业务数据进行数据清洗，提高数据质量，且从不同经营单元的级别分别进行风险指数的计算，从而有效提高企业风险评估的效率和准确性。作为一种可选的实施方式，在本发明实施例中，步骤103中，根据预设的业务风险评估模型，对企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到企业业务数据所对应的目标企业的风险情况，包括：

确定业务风险评估模型的定义为：

R(X_i)＝p(X_i)*C_损；

其中，R(X_i)为风险指数，P(X_i)为风险发生概率，C_损为该风险发生后带来的潜在损失。

具体的，业务风险评估模型主要参考Boehm体系中提到的风险计算方法：即R_e＝R(U₀)*L(U₀)，即风险程度为风险损失程度与风险概率二者的乘积，以及Mauro,Gasparini运用项目风险发生可能性即概率与造成的影响程度二者的拟合值来评估项目风险。故本发明实施例中，文本的风险评估核心模型定义为：R(X_i)＝P(X_i)*C_损；其中，R(X_i)为风险指数，P(X_i)为风险发生概率，C_损为该风险发生后带来的潜在损失。

本次风险评估的最小粒度是细化到每个项目的每个风险指标，采用一种自下而上的风险计算方法，实现风险可溯源，风险全方面扫描，即先计算每个项目的每个指标风险；再计算每个项目的综合风险；再计算每个项目部所有项目的综合风险；再计算每个分公司的所有项目部的综合风险；最后计算每个公司的所有分公司的综合风险值。具体计算步骤如下：

1、计算每个指标的风险值，包括：

计算第i个项目的第m个项目维度指标的指标风险值

计算第j个项目部第n个经营单元维度指标的风险值

计算第k个分公司第n个经营单元维度指标的风险值

计算第l个专业公司第n个经营单元维度指标的风险值

2、计算每个所述项目的综合风险

包括：

其中，I为项目个数，M为项目维度指标个数；

为第m个项目维度指标的权重。

3、计算经营单元风险，包括：

计算每一所述经营单元中的项目综合风险R⁽¹⁾：

计算每一所述经营单元维度指标的风险R⁽²⁾：

计算每一所述经营单元的综合风险R：

其中，

为项目维度指标的权重；

为经营单元维度指标的权重。

作为一种可选的实施方式，在本发明实施例中，该方法还包括：

使用CART分类回归树算法，针对每个企业风险指标，对所有企业业务数据执行CART分类树生成操作。

CART模型由Breiman等人在1984年提出，由特征选择、树的生成以及剪枝等步骤组成。分类树是用基尼指数选择最优特征，决定该特征的最优二值切分点。

特征选择是指从可能影响该风险指标的所有因素中，筛选出显著影响的因素。根据前期与业务专家讨论调研，可能影响风险指标的因素包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态等6个项目属性。在算法实现中采用2σ和3mean作为影响指标的特征选择标准。

树的生成包括4个步骤:1)计算现有特征对该数据集的基尼指数，对于每一个特征A，可以对样本点A是否为a可以将数据集D分成数据集D1，D2；2)对于所有的特征A和所有可能的切分点a，选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点；3)对最优子树递归调用步骤1)、步骤2)，直到满足停止条件；4)生成CART分类树。

树的剪枝是指从已生成的树中剪掉一些子树或者叶子节点，并将根节点或者父节点作为新的叶子节点，从而简化分类树模型，以防止模型的过拟合。决策树剪枝通过极小化决策树的整体损失函数。剪枝包括3个步骤：①计算每一个结点的经验熵。②递归的从叶子节点开始往上遍历，减掉叶子节点，然后判断损失函数的值是否减少，如果减少，则将父节点作为新的叶子节点。③重复①②，直到完全不能剪枝。

本发明实施例考虑到不同经营单位的主要经营业务可能不同，与各业务专家进行沟通发现影响指标的主要项目属性是客户类型、客户区域以及客户专业。为处理不同项目间因本身业务不同导致的风险不可比问题，本文采用CART(Classification andRegression Trees)分类回归树，针对每个风险指标，实现对所有样本的分组分类，实现组内对比。

作为一种可选的实施方式，在本发明实施例中，使用CART分类回归树算法，针对每个企业风险指标，对所有企业业务数据执行CART分类树生成操作，包括：

确定影响企业风险指标的项目属性。项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种。

对每一企业风险指标执行特征选择操作，从可能影响企业风险指标的所有项目因素中，筛选出显著影响的项目因素。

对每一企业风险指标执行生成CART分类树操作，对生成的CART分类树进行剪枝操作。

作为一种可选的实施方式，在本发明实施例中，对每一企业风险指标执行生成CART分类树操作，包括：

(1)计算现有特征对该数据集的基尼指数，对于每一个特征A，可以对样本点A是否为a可以将数据集D分成数据集D1，D2。

(2)对于所有的特征A和所有可能的切分点a，选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点。

(3)对最优子树递归调用步骤(1)、步骤(2)，直到满足预设的停止条件。

(4)生成CART分类树。

以及，并对生成的CART分类树进行剪枝操作，包括：

①、计算每一个结点的经验熵。

②、递归的从叶子节点开始往上遍历，减掉叶子节点，然后判断损失函数的值是否减少，如果减少，则将父节点作为新的叶子节点。

③、重复步骤①②，直到完全不能剪枝。

具体的，基尼指数是指分类问题中，假设有K个类，样本点属于第K类的概率为p_k，则概率分布的基尼指数定义为：

对于二分类问题来说，若样本点属于第一类的概率为p，则概率分布的基尼指数为Gini(p)＝2p(1-p)。对于给定的样本集合D，其基尼指数为：

其中，C_k是D中属于第k类的样本子集，K是类的个数。|C_k|和D分别表示子集的个数和样本的个数。

如果样本集合D根据特征A是否取某一可能的值α被分割成D₁和D₂，即

D₁＝{(x，y)∈D|A(x)＝a}，D₂＝D-D₁；

所以在特征A的条件下集合D的基尼指数为：

Gini(D)表示集合的不确定性，基尼指数G(D,A)表示A＝a分解后集合的不确定性。基尼指数越大，样本集合的不确定性越大。

具体的，本发明实施例中，损失函数为：设树T的叶子节点数为|T|，叶子节点t上有Nt个样本点，其中k类的样本点数为Nkt，H_t(T)为结点t上的经验熵，α≥0为参数，损失函数定义为：

其中经验熵

令

则C_α(T)＝C(T)+α|T|，其中C(T)表示对训练数据的预测误差，|T|表示模型的复杂度，则损失函数表达了模型复杂度与预算误差的平衡，以防止模型过拟合。

最后，综合评述本发明实施例相对于现有技术，具有以下的技术优点：

(1)构建全面风险指标。

本发明实施例中，利用风险检查表法、头脑风险法，组织风险管理领域专家和业务专家进行研究讨论，构建以合同虚高、合同流失、虚假合同、虚假项目、预算准确率、成本超前等10个业务风险点为框架，构建项目全生命周期中的业务风险指标体系；

(2)分析粒度细化到项目。

本发明实施例中，将风险评估的最小粒度细化到每个项目的每个风险指标，实现风险全方位扫描；

(3)实现风险事前预警。

本发明实施例中，基于项目运作的一般规律及项目成本控制困难等特点，有效识别风险，实现风险事前预警；

(4)实现风险溯源。

本发明实施例中，使得企业风险能够追溯到每个项目的每个风险指标，采用一种自下而上的风险计算方法，实现风险可溯源，风险全方面扫描；

(5)实现数据闭环整改。

本发明实施例中，对企业数据进行数据治理，制定异常规则，识别异常数据，提高数据质量；针对部分项目管理系统暂时无法提供的数据，提供数据开发需求，丰富完善数据资产。

实施例二

请参阅图2，图2是本发明实施例公开的一种企业风险指数计算装置的结构示意图。如图2所示，该装置可以包括：

体系建立模块201，用于基于企业业务特点和企业风险现状，对企业风险点进行指标量化，建立企业风险指标体系。

数据清洗模块202，用于获取企业业务数据，根据预设的数据异常规则或使用数据异常识别算法，对企业业务数据进行数据清洗。

指数计算模块203，用于根据预设的业务风险评估模型，对企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到企业业务数据所对应的目标企业的风险情况。

具体的，在数据清洗模块202的数据清洗过程中，结合实现情况，主要从以下两个方面来实现。第一，采用专家调研法和集中会议讨论法，结合企业业务实际情况，对字段和指标设定异常规则，按异常规则识别异常数据。第二，采用大数据异常识别算法(3σ异常算法)，识别字段和指标异常情况。

可见，通过实施本发明实施例，能够从企业业务特征和企业风险现状出发，建立合理全面的企业风险指标体系，并预先对企业业务数据进行数据清洗，提高数据质量，且从不同经营单元的级别分别进行风险指数的计算，从而有效提高企业风险评估的效率和准确性。作为一种可选的实施方式，在本发明实施例中，指数计算模块203根据预设的业务风险评估模型，对企业业务数据中不同经营单元的企业业务数据进行风险指数计算，得到企业业务数据所对应的目标企业的风险情况的具体方式，包括：

确定业务风险评估模型的定义为：

R(X_i)＝P(X_i)*C_损；

其中，R(X_i)为风险指数，R(X_i)为风险发生概率，X_损为该风险发生后带来的潜在损失。

1、计算每个指标的风险值，包括：

计算第i个项目的第m个项目维度指标的指标风险值

计算第j个项目部第n个经营单元维度指标的风险值

计算第k个分公司第n个经营单元维度指标的风险值

计算第l个专业公司第n个经营单元维度指标的风险值

2、计算每个所述项目的综合风险

包括：

其中，I为项目个数，M为项目维度指标个数；

为第m个项目维度指标的权重。

3、计算经营单元风险，包括：

计算每一所述经营单元中的项目综合风险R⁽¹⁾：

计算每一所述经营单元维度指标的风险R⁽²⁾：

计算每一所述经营单元的综合风险R：

其中，

为项目维度指标的权重；

为经营单元维度指标的权重。

生成模块，用于使用CART分类回归树算法，针对每个企业风险指标，对所有企业业务数据执行CART分类树生成操作。

作为一种可选的实施方式，在本发明实施例中，生成模块使用CART分类回归树算法，针对每个企业风险指标，对所有企业业务数据执行CART分类树生成操作的具体方式，包括：

(4)生成CART分类树。

以及，并对生成的CART分类树进行剪枝操作，包括：

①、计算每一个结点的经验熵。

③、重复步骤①②，直到完全不能剪枝。

D₁＝{(x，y)∈D|A(x)＝a}，D₂＝D-D1；

所以在特征A的条件下集合D的基尼指数为：

其中经验熵

令

实施例三

请参阅图3，图3是本发明实施例公开的又一种企业风险指数计算装置的结构示意图。如图3所示，该装置可以包括：

存储有可执行程序代码的存储器301；

与存储器301耦合的处理器302；

处理器302调用存储器301中存储的可执行程序代码，执行本发明实施例一公开的企业风险指数计算方法中的部分或全部步骤。

实施例四

本发明实施例公开了一种计算机存储介质，该计算机存储介质存储有计算机指令，该计算机指令被调用时，用于执行本发明实施例一公开的企业风险指数计算方法中的部分或全部步骤。

以上所描述的装置实施例仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种企业风险指数计算方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。