CN112581000A - 企业风险指数计算方法及装置 - Google Patents

企业风险指数计算方法及装置 Download PDF

Info

Publication number
CN112581000A
CN112581000A CN202011551983.XA CN202011551983A CN112581000A CN 112581000 A CN112581000 A CN 112581000A CN 202011551983 A CN202011551983 A CN 202011551983A CN 112581000 A CN112581000 A CN 112581000A
Authority
CN
China
Prior art keywords
risk
enterprise
index
data
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011551983.XA
Other languages
English (en)
Inventor
邢竟
江佳良
华艺
黄伟如
金成伟
郑建飞
曾沂粲
赵仕嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Planning and Designing Institute of Telecommunications Co Ltd
Original Assignee
Guangdong Planning and Designing Institute of Telecommunications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Planning and Designing Institute of Telecommunications Co Ltd filed Critical Guangdong Planning and Designing Institute of Telecommunications Co Ltd
Priority to CN202011551983.XA priority Critical patent/CN112581000A/zh
Publication of CN112581000A publication Critical patent/CN112581000A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例中,基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系;获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对所述企业业务数据进行数据清洗;根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况。可见,本发明能够从企业业务特征和企业风险现状出发,建立合理全面的企业风险指标体系,并预先对企业业务数据进行数据清洗,提高数据质量,且从不同经营单元的级别分别进行风险指数的计算,从而有效提高企业风险评估的效率和准确性。

Description

企业风险指数计算方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种企业风险指数计算方法及装置。
背景技术
近年来,随着企业规模的扩大,在项目的管理上出现了各种各样的问题,例如有合同虚高、合同流失、虚假合同、虚假项目、虚假工作量、预算大幅调整、虚假列账、成本超前、项目关闭不及时、应收应付不及时等等。这些问题在一定程度上严重损害了企业的利益。全面风险管理与内控体系建设在国家法律法规引导下,正在全面推进。
现有的业务风险评估技术,一般根据预先建立的风险评估模型,评估各个规则对应的风险分值,将多条规则对应的风险分值进行累加,并将累加后的风险分值总和与预先设置的各个风险等级的风险总分阈值进行比较,确定出业务数据的风险等级。
上述现有的业务风险评估技术,其缺点在于部分风险点缺少指标量化,风险定性分析会受主观评价影响,且其从某一单一维度设计风险规则或者阈值,风险评估不够全面,同时其没有考虑到对现有数据进行风险识别与评估,缺少数据治理工作。
发明内容
本发明所要解决的技术问题在于,提供一种企业风险指数计算方法及装置,能够从企业业务特征和企业风险现状出发,建立合理全面的企业风险指标体系,并预先对企业业务数据进行数据清洗,提高数据质量,且从不同经营单元的级别分别进行风险指数的计算,从而有效提高企业风险评估的效率和准确性。
为了解决上述技术问题,本发明第一方面公开了一种企业风险指数计算方法,所述方法包括:
基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系;所述企业风险指标体系包括多个企业风险指标;获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对所述企业业务数据进行数据清洗;所述企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种;
根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况。
作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
使用CART分类回归树算法,针对每个所述企业风险指标,对所有所述企业业务数据执行CART分类树生成操作。
作为一种可选的实施方式,在本发明第一方面中,所述企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种;
所述企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。
作为一种可选的实施方式,在本发明第一方面中,所述数据异常识别算法为3σ异常检测算法,所述经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。
作为一种可选的实施方式,在本发明第一方面中,所述根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况,包括:
确定业务风险评估模型的定义为:
R(Xi)=p(Xi)*C
其中,R(Xi)为风险指数,P(Xi)为风险发生概率,C为该风险发生后带来的潜在损失;
计算第i个项目的第m个项目维度指标的指标风险值
Figure BDA0002857485740000021
Figure BDA0002857485740000031
其中i=1,2,3,4……I,m=1,2,3,4……M;I为项目个数,M为项目维度指标个数,P为风险发生概率;C为风险发生时带来的损失大小。
计算第j个项目部第n个经营单元维度指标的风险值
Figure BDA0002857485740000032
Figure BDA0002857485740000033
计算第k个分公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000034
Figure BDA0002857485740000035
计算第l个专业公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000036
Figure BDA0002857485740000037
计算每个所述项目的综合风险
Figure BDA0002857485740000038
包括:
Figure BDA0002857485740000039
其中,I为项目个数,M为项目维度指标个数;
Figure BDA00028574857400000310
为第m个项目维度指标的权重;
计算每一所述经营单元中的项目综合风险
Figure BDA00028574857400000311
Figure BDA00028574857400000312
计算每一所述经营单元维度指标的风险R(2)
Figure BDA00028574857400000313
计算每一所述经营单元的综合风险R:
Figure BDA00028574857400000314
其中,
Figure BDA00028574857400000315
为项目维度指标的权重;
Figure BDA00028574857400000316
为经营单元维度指标的权重。
作为一种可选的实施方式,在本发明第一方面中,所述使用CART分类回归树算法,针对每个所述企业风险指标,对所有所述企业业务数据执行CART分类树生成操作,包括:
确定影响所述企业风险指标的项目属性;所述项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种;
对每一所述企业风险指标执行特征选择操作,从可能影响所述企业风险指标的所有所述项目因素中,筛选出显著影响的项目因素;
对每一所述企业风险指标执行生成CART分类树操作,对生成的所述CART分类树进行剪枝操作。
作为一种可选的实施方式,在本发明第一方面中,所述对每一所述企业风险指标执行生成CART分类树操作,包括:
(1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2;
(2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点;
(3)对最优子树递归调用步骤(1)、步骤(2),直到满足预设的停止条件;
(4)生成CART分类树;
以及,所述并对生成的所述CART分类树进行剪枝操作,包括:
①、计算每一个结点的经验熵;
②、递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;
③、重复步骤①②,直到完全不能剪枝。
本发明第二方面公开了一种企业风险指数计算装置,所述装置包括:
体系建立模块,用于基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系;所述企业风险指标体系包括多个企业风险指标;数据清洗模块,用于获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对所述企业业务数据进行数据清洗;所述企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种;
指数计算模块,用于根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况。
作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
生成模块,用于使用CART分类回归树算法,针对每个所述企业风险指标,对所有所述企业业务数据执行CART分类树生成操作。
作为一种可选的实施方式,在本发明第二方面中,所述企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种;
所述企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。
作为一种可选的实施方式,在本发明第二方面中,所述数据异常识别算法为3σ异常检测算法,所述经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。
作为一种可选的实施方式,在本发明第二方面中,所述根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况,包括:
确定业务风险评估模型的定义为:
R(Xi)=p(Xi)*C
其中,R(Xi)为风险指数,P(Xi)为风险发生概率,C为该风险发生后带来的潜在损失;
计算第i个项目的第m个项目维度指标的指标风险值
Figure BDA0002857485740000051
Figure BDA0002857485740000052
其中i=1,2,3,4……I,m=1,2,3,4……M;I为项目个数,M为项目维度指标个数,P为风险发生概率;C为风险发生时带来的损失大小。
计算第j个项目部第n个经营单元维度指标的风险值
Figure BDA0002857485740000053
Figure BDA0002857485740000054
计算第k个分公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000055
Figure BDA0002857485740000056
计算第l个专业公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000057
Figure BDA0002857485740000058
计算每个所述项目的综合风险
Figure BDA0002857485740000059
包括:
Figure BDA00028574857400000510
其中,I为项目个数,M为项目维度指标个数;
Figure BDA0002857485740000061
为第m个项目维度指标的权重;
计算每一所述经营单元中的项目综合风险R(1)
Figure BDA0002857485740000062
计算每一所述经营单元维度指标的风险R(2)
Figure BDA0002857485740000063
计算每一所述经营单元的综合风险R:
Figure BDA0002857485740000064
其中,
Figure BDA0002857485740000065
为项目维度指标的权重;
Figure BDA0002857485740000066
为经营单元维度指标的权重。
作为一种可选的实施方式,在本发明第二方面中,所述使用CART分类回归树算法,针对每个所述企业风险指标,对所有所述企业业务数据执行CART分类树生成操作,包括:
确定影响所述企业风险指标的项目属性;所述项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种;
对每一所述企业风险指标执行特征选择操作,从可能影响所述企业风险指标的所有所述项目因素中,筛选出显著影响的项目因素;
对每一所述企业风险指标执行生成CART分类树操作,对生成的所述CART分类树进行剪枝操作。
作为一种可选的实施方式,在本发明第二方面中,所述对每一所述企业风险指标执行生成CART分类树操作,包括:
(1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2;
(2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点;
(3)对最优子树递归调用步骤(1)、步骤(2),直到满足预设的停止条件;
(4)生成CART分类树;
以及,所述并对生成的所述CART分类树进行剪枝操作,包括:
①、计算每一个结点的经验熵;
②、递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;
③、重复步骤①②,直到完全不能剪枝。
本发明第三方面公开了另一种企业风险指数计算装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的企业风险指数计算方法中的部分或全部步骤。
本发明实施例第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明实施例第一方面公开的企业风险指数计算方法中的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系;获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对所述企业业务数据进行数据清洗;根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况。可见,本发明能够从企业业务特征和企业风险现状出发,建立合理全面的企业风险指标体系,并预先对企业业务数据进行数据清洗,提高数据质量,且从不同经营单元的级别分别进行风险指数的计算,从而有效提高企业风险评估的效率和准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种企业风险指数计算方法的流程示意图;
图2是本发明实施例公开的一种企业风险指数计算装置的结构示意图;
图3是本发明实施例公开的又一种企业风险指数计算装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种企业风险指数计算方法及装置,能够从企业业务特征和企业风险现状出发,建立合理全面的企业风险指标体系,并预先对企业业务数据进行数据清洗,提高数据质量,且从不同经营单元的级别分别进行风险指数的计算,从而有效提高企业风险评估的效率和准确性。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种企业风险指数计算方法的流程示意图。在阐述本发明实施例之前,先对本发明实施例所对应的创造目的进行阐述,本发明实施例的目的在于,以项目为核心主线,围绕项目全生命周期进行业务风险点的识别,根据风险点特征,建立一套完整的、全面的、可量化的风险评估指标体系。结合企业业务数据,利用大数据算法,构建业务风险评估模型,快速生成风险评估结果,帮助企业实现风险的远程监控、风险事前预警、风险线上闭环整改、快速准确定位风险问题源,以实现企业风险预警和风险防控。具体的,如图1所示,该企业风险指数计算方法可以包括以下操作:
101、基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系。
具体的,企业风险指标体系包括多个企业风险指标。本发明实施例中,企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种。
企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。
可见,本发明实施例是从企业业务特征和企业风险现状出发,贯穿项目实施全生命周期过程,识别业务风险点。利用风险检查表法、头脑风暴法,并结合文献法总结行业经验,组织风险管理领域专家和业务专家进行研究讨论,对进度风险、成本风险等风险点进行指标量化,构建以合同虚高,合同流失,虚假合同,虚假项目,虚假工作量,预算准确率,虚假列账,成本超前,以及项目关闭不及时和应收应付不及时等10个风险点为框架的全面风险指标体系。
进一步的,还可以同时利用大数据机器学习算法进行风险分析建模,形成完整的系统评测技术,实现风险量化。通过对数据源进行配置,及进行详细的ETL处理,并运用多种分析算法,对分析算法进行详细调参得到相应的结果,最终对结果可视化。
102、获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对企业业务数据进行数据清洗。
具体的,企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种。本发明实施例中,数据异常识别算法为3σ异常检测算法。
103、根据预设的业务风险评估模型,对企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到企业业务数据所对应的目标企业的风险情况。
具体的,经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。具体的,本发明实施例主要利用大数据异常识别算法(3σ异常算法)构建数据异常模型识别异常数据,处理异常数据,反向促动项目管理系统数据质量提升;利用多种特征选择算法(CART(Classification and Regression Trees)分类回归树)自动选择最优算法实现项目分组聚类,实现同类项目风险可比;利用专家调研法及层次分析法实现指标体系权重的确认;最后采用非线性风险判罚机制评估风险,实现风险的自动评估和风险的事前预测预警,通过自定义建模模型实现风险体系的动态更新。
具体的,在步骤102的数据清洗过程中,结合实现情况,主要从以下两个方面来实现。第一,采用专家调研法和集中会议讨论法,结合企业业务实际情况,对字段和指标设定异常规则,按异常规则识别异常数据。第二,采用大数据异常识别算法(3σ异常算法),识别字段和指标异常情况。
具体的,3σ原则是指在正态分布中σ代表标准差,μ代表均值。x=μ即为图像的对称轴。数值分布在(μ-σ,μ+σ)中的概率为0.6827,数值分布在(μ-2σ,μ+2σ)中的概率为95.45%,则值分布在(μ-3σ,μ+3σ)中的概率为99.73%。因此可认为,取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性仅占不到0.3%,有理由认为3σ以外的数据为异常值。
对于异常数据,统一制定数据异常规则,筛选异常清单,用于指导专业公司进行异常数据整改,提高数据质量;针对部分项目管理系统暂时无法提供的数据,提供数据开发需求,丰富完善数据资产。
可见,通过实施本发明实施例,能够从企业业务特征和企业风险现状出发,建立合理全面的企业风险指标体系,并预先对企业业务数据进行数据清洗,提高数据质量,且从不同经营单元的级别分别进行风险指数的计算,从而有效提高企业风险评估的效率和准确性。作为一种可选的实施方式,在本发明实施例中,步骤103中,根据预设的业务风险评估模型,对企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到企业业务数据所对应的目标企业的风险情况,包括:
确定业务风险评估模型的定义为:
R(Xi)=p(Xi)*C
其中,R(Xi)为风险指数,P(Xi)为风险发生概率,C为该风险发生后带来的潜在损失。
具体的,业务风险评估模型主要参考Boehm体系中提到的风险计算方法:即Re=R(U0)*L(U0),即风险程度为风险损失程度与风险概率二者的乘积,以及Mauro,Gasparini运用项目风险发生可能性即概率与造成的影响程度二者的拟合值来评估项目风险。故本发明实施例中,文本的风险评估核心模型定义为:R(Xi)=P(Xi)*C;其中,R(Xi)为风险指数,P(Xi)为风险发生概率,C为该风险发生后带来的潜在损失。
本次风险评估的最小粒度是细化到每个项目的每个风险指标,采用一种自下而上的风险计算方法,实现风险可溯源,风险全方面扫描,即先计算每个项目的每个指标风险;再计算每个项目的综合风险;再计算每个项目部所有项目的综合风险;再计算每个分公司的所有项目部的综合风险;最后计算每个公司的所有分公司的综合风险值。具体计算步骤如下:
1、计算每个指标的风险值,包括:
计算第i个项目的第m个项目维度指标的指标风险值
Figure BDA0002857485740000111
Figure BDA0002857485740000112
其中i=1,2,3,4……I,m=1,2,3,4……M;I为项目个数,M为项目维度指标个数,P为风险发生概率;C为风险发生时带来的损失大小。
计算第j个项目部第n个经营单元维度指标的风险值
Figure BDA0002857485740000113
Figure BDA0002857485740000114
计算第k个分公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000115
Figure BDA0002857485740000116
计算第l个专业公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000117
Figure BDA0002857485740000118
2、计算每个所述项目的综合风险
Figure BDA0002857485740000119
包括:
Figure BDA00028574857400001110
其中,I为项目个数,M为项目维度指标个数;
Figure BDA00028574857400001111
为第m个项目维度指标的权重。
3、计算经营单元风险,包括:
计算每一所述经营单元中的项目综合风险R(1)
Figure BDA0002857485740000121
计算每一所述经营单元维度指标的风险R(2)
Figure BDA0002857485740000122
计算每一所述经营单元的综合风险R:
Figure BDA0002857485740000123
其中,
Figure BDA0002857485740000124
为项目维度指标的权重;
Figure BDA0002857485740000125
为经营单元维度指标的权重。
作为一种可选的实施方式,在本发明实施例中,该方法还包括:
使用CART分类回归树算法,针对每个企业风险指标,对所有企业业务数据执行CART分类树生成操作。
CART模型由Breiman等人在1984年提出,由特征选择、树的生成以及剪枝等步骤组成。分类树是用基尼指数选择最优特征,决定该特征的最优二值切分点。
特征选择是指从可能影响该风险指标的所有因素中,筛选出显著影响的因素。根据前期与业务专家讨论调研,可能影响风险指标的因素包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态等6个项目属性。在算法实现中采用2σ和3mean作为影响指标的特征选择标准。
树的生成包括4个步骤:1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2;2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点;3)对最优子树递归调用步骤1)、步骤2),直到满足停止条件;4)生成CART分类树。
树的剪枝是指从已生成的树中剪掉一些子树或者叶子节点,并将根节点或者父节点作为新的叶子节点,从而简化分类树模型,以防止模型的过拟合。决策树剪枝通过极小化决策树的整体损失函数。剪枝包括3个步骤:①计算每一个结点的经验熵。②递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点。③重复①②,直到完全不能剪枝。
本发明实施例考虑到不同经营单位的主要经营业务可能不同,与各业务专家进行沟通发现影响指标的主要项目属性是客户类型、客户区域以及客户专业。为处理不同项目间因本身业务不同导致的风险不可比问题,本文采用CART(Classification andRegression Trees)分类回归树,针对每个风险指标,实现对所有样本的分组分类,实现组内对比。
作为一种可选的实施方式,在本发明实施例中,使用CART分类回归树算法,针对每个企业风险指标,对所有企业业务数据执行CART分类树生成操作,包括:
确定影响企业风险指标的项目属性。项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种。
对每一企业风险指标执行特征选择操作,从可能影响企业风险指标的所有项目因素中,筛选出显著影响的项目因素。
对每一企业风险指标执行生成CART分类树操作,对生成的CART分类树进行剪枝操作。
作为一种可选的实施方式,在本发明实施例中,对每一企业风险指标执行生成CART分类树操作,包括:
(1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2。
(2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点。
(3)对最优子树递归调用步骤(1)、步骤(2),直到满足预设的停止条件。
(4)生成CART分类树。
以及,并对生成的CART分类树进行剪枝操作,包括:
①、计算每一个结点的经验熵。
②、递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点。
③、重复步骤①②,直到完全不能剪枝。
具体的,基尼指数是指分类问题中,假设有K个类,样本点属于第K类的概率为pk,则概率分布的基尼指数定义为:
Figure BDA0002857485740000141
对于二分类问题来说,若样本点属于第一类的概率为p,则概率分布的基尼指数为Gini(p)=2p(1-p)。对于给定的样本集合D,其基尼指数为:
Figure BDA0002857485740000142
其中,Ck是D中属于第k类的样本子集,K是类的个数。|Ck|和D分别表示子集的个数和样本的个数。
如果样本集合D根据特征A是否取某一可能的值α被分割成D1和D2,即
D1={(x,y)∈D|A(x)=a},D2=D-D1
所以在特征A的条件下集合D的基尼指数为:
Figure BDA0002857485740000143
Gini(D)表示集合的不确定性,基尼指数G(D,A)表示A=a分解后集合的不确定性。基尼指数越大,样本集合的不确定性越大。
具体的,本发明实施例中,损失函数为:设树T的叶子节点数为|T|,叶子节点t上有Nt个样本点,其中k类的样本点数为Nkt,Ht(T)为结点t上的经验熵,α≥0为参数,损失函数定义为:
Figure BDA0002857485740000144
其中经验熵
Figure BDA0002857485740000145
Figure BDA0002857485740000146
则Cα(T)=C(T)+α|T|,其中C(T)表示对训练数据的预测误差,|T|表示模型的复杂度,则损失函数表达了模型复杂度与预算误差的平衡,以防止模型过拟合。
最后,综合评述本发明实施例相对于现有技术,具有以下的技术优点:
(1)构建全面风险指标。
本发明实施例中,利用风险检查表法、头脑风险法,组织风险管理领域专家和业务专家进行研究讨论,构建以合同虚高、合同流失、虚假合同、虚假项目、预算准确率、成本超前等10个业务风险点为框架,构建项目全生命周期中的业务风险指标体系;
(2)分析粒度细化到项目。
本发明实施例中,将风险评估的最小粒度细化到每个项目的每个风险指标,实现风险全方位扫描;
(3)实现风险事前预警。
本发明实施例中,基于项目运作的一般规律及项目成本控制困难等特点,有效识别风险,实现风险事前预警;
(4)实现风险溯源。
本发明实施例中,使得企业风险能够追溯到每个项目的每个风险指标,采用一种自下而上的风险计算方法,实现风险可溯源,风险全方面扫描;
(5)实现数据闭环整改。
本发明实施例中,对企业数据进行数据治理,制定异常规则,识别异常数据,提高数据质量;针对部分项目管理系统暂时无法提供的数据,提供数据开发需求,丰富完善数据资产。
实施例二
请参阅图2,图2是本发明实施例公开的一种企业风险指数计算装置的结构示意图。如图2所示,该装置可以包括:
体系建立模块201,用于基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系。
具体的,企业风险指标体系包括多个企业风险指标。本发明实施例中,企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种。
企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。
可见,本发明实施例是从企业业务特征和企业风险现状出发,贯穿项目实施全生命周期过程,识别业务风险点。利用风险检查表法、头脑风暴法,并结合文献法总结行业经验,组织风险管理领域专家和业务专家进行研究讨论,对进度风险、成本风险等风险点进行指标量化,构建以合同虚高,合同流失,虚假合同,虚假项目,虚假工作量,预算准确率,虚假列账,成本超前,以及项目关闭不及时和应收应付不及时等10个风险点为框架的全面风险指标体系。
进一步的,还可以同时利用大数据机器学习算法进行风险分析建模,形成完整的系统评测技术,实现风险量化。通过对数据源进行配置,及进行详细的ETL处理,并运用多种分析算法,对分析算法进行详细调参得到相应的结果,最终对结果可视化。
数据清洗模块202,用于获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对企业业务数据进行数据清洗。
具体的,企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种。本发明实施例中,数据异常识别算法为3σ异常检测算法。
指数计算模块203,用于根据预设的业务风险评估模型,对企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到企业业务数据所对应的目标企业的风险情况。
具体的,经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。具体的,本发明实施例主要利用大数据异常识别算法(3σ异常算法)构建数据异常模型识别异常数据,处理异常数据,反向促动项目管理系统数据质量提升;利用多种特征选择算法(CART(Classification and Regression Trees)分类回归树)自动选择最优算法实现项目分组聚类,实现同类项目风险可比;利用专家调研法及层次分析法实现指标体系权重的确认;最后采用非线性风险判罚机制评估风险,实现风险的自动评估和风险的事前预测预警,通过自定义建模模型实现风险体系的动态更新。
具体的,在数据清洗模块202的数据清洗过程中,结合实现情况,主要从以下两个方面来实现。第一,采用专家调研法和集中会议讨论法,结合企业业务实际情况,对字段和指标设定异常规则,按异常规则识别异常数据。第二,采用大数据异常识别算法(3σ异常算法),识别字段和指标异常情况。
具体的,3σ原则是指在正态分布中σ代表标准差,μ代表均值。x=μ即为图像的对称轴。数值分布在(μ-σ,μ+σ)中的概率为0.6827,数值分布在(μ-2σ,μ+2σ)中的概率为95.45%,则值分布在(μ-3σ,μ+3σ)中的概率为99.73%。因此可认为,取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性仅占不到0.3%,有理由认为3σ以外的数据为异常值。
对于异常数据,统一制定数据异常规则,筛选异常清单,用于指导专业公司进行异常数据整改,提高数据质量;针对部分项目管理系统暂时无法提供的数据,提供数据开发需求,丰富完善数据资产。
可见,通过实施本发明实施例,能够从企业业务特征和企业风险现状出发,建立合理全面的企业风险指标体系,并预先对企业业务数据进行数据清洗,提高数据质量,且从不同经营单元的级别分别进行风险指数的计算,从而有效提高企业风险评估的效率和准确性。作为一种可选的实施方式,在本发明实施例中,指数计算模块203根据预设的业务风险评估模型,对企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到企业业务数据所对应的目标企业的风险情况的具体方式,包括:
确定业务风险评估模型的定义为:
R(Xi)=P(Xi)*C
其中,R(Xi)为风险指数,R(Xi)为风险发生概率,X为该风险发生后带来的潜在损失。
具体的,业务风险评估模型主要参考Boehm体系中提到的风险计算方法:即Re=R(U0)*L(U0),即风险程度为风险损失程度与风险概率二者的乘积,以及Mauro,Gasparini运用项目风险发生可能性即概率与造成的影响程度二者的拟合值来评估项目风险。故本发明实施例中,文本的风险评估核心模型定义为:R(Xi)=P(Xi)*C;其中,R(Xi)为风险指数,P(Xi)为风险发生概率,C为该风险发生后带来的潜在损失。
本次风险评估的最小粒度是细化到每个项目的每个风险指标,采用一种自下而上的风险计算方法,实现风险可溯源,风险全方面扫描,即先计算每个项目的每个指标风险;再计算每个项目的综合风险;再计算每个项目部所有项目的综合风险;再计算每个分公司的所有项目部的综合风险;最后计算每个公司的所有分公司的综合风险值。具体计算步骤如下:
1、计算每个指标的风险值,包括:
计算第i个项目的第m个项目维度指标的指标风险值
Figure BDA0002857485740000171
Figure BDA0002857485740000172
其中i=1,2,3,4……I,m=1,2,3,4……M;I为项目个数,M为项目维度指标个数,P为风险发生概率;C为风险发生时带来的损失大小。
计算第j个项目部第n个经营单元维度指标的风险值
Figure BDA0002857485740000173
Figure BDA0002857485740000174
计算第k个分公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000181
Figure BDA0002857485740000182
计算第l个专业公司第n个经营单元维度指标的风险值
Figure BDA0002857485740000183
Figure BDA0002857485740000184
2、计算每个所述项目的综合风险
Figure BDA0002857485740000185
包括:
Figure BDA0002857485740000186
其中,I为项目个数,M为项目维度指标个数;
Figure BDA0002857485740000187
为第m个项目维度指标的权重。
3、计算经营单元风险,包括:
计算每一所述经营单元中的项目综合风险R(1)
Figure BDA0002857485740000188
计算每一所述经营单元维度指标的风险R(2)
Figure BDA0002857485740000189
计算每一所述经营单元的综合风险R:
Figure BDA00028574857400001810
其中,
Figure BDA00028574857400001811
为项目维度指标的权重;
Figure BDA00028574857400001812
为经营单元维度指标的权重。
作为一种可选的实施方式,在本发明实施例中,该方法还包括:
生成模块,用于使用CART分类回归树算法,针对每个企业风险指标,对所有企业业务数据执行CART分类树生成操作。
CART模型由Breiman等人在1984年提出,由特征选择、树的生成以及剪枝等步骤组成。分类树是用基尼指数选择最优特征,决定该特征的最优二值切分点。
特征选择是指从可能影响该风险指标的所有因素中,筛选出显著影响的因素。根据前期与业务专家讨论调研,可能影响风险指标的因素包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态等6个项目属性。在算法实现中采用2σ和3mean作为影响指标的特征选择标准。
树的生成包括4个步骤:1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2;2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点;3)对最优子树递归调用步骤1)、步骤2),直到满足停止条件;4)生成CART分类树。
树的剪枝是指从已生成的树中剪掉一些子树或者叶子节点,并将根节点或者父节点作为新的叶子节点,从而简化分类树模型,以防止模型的过拟合。决策树剪枝通过极小化决策树的整体损失函数。剪枝包括3个步骤:①计算每一个结点的经验熵。②递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点。③重复①②,直到完全不能剪枝。
本发明实施例考虑到不同经营单位的主要经营业务可能不同,与各业务专家进行沟通发现影响指标的主要项目属性是客户类型、客户区域以及客户专业。为处理不同项目间因本身业务不同导致的风险不可比问题,本文采用CART(Classification andRegression Trees)分类回归树,针对每个风险指标,实现对所有样本的分组分类,实现组内对比。
作为一种可选的实施方式,在本发明实施例中,生成模块使用CART分类回归树算法,针对每个企业风险指标,对所有企业业务数据执行CART分类树生成操作的具体方式,包括:
确定影响企业风险指标的项目属性。项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种。
对每一企业风险指标执行特征选择操作,从可能影响企业风险指标的所有项目因素中,筛选出显著影响的项目因素。
对每一企业风险指标执行生成CART分类树操作,对生成的CART分类树进行剪枝操作。
作为一种可选的实施方式,在本发明实施例中,对每一企业风险指标执行生成CART分类树操作,包括:
(1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2。
(2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点。
(3)对最优子树递归调用步骤(1)、步骤(2),直到满足预设的停止条件。
(4)生成CART分类树。
以及,并对生成的CART分类树进行剪枝操作,包括:
①、计算每一个结点的经验熵。
②、递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点。
③、重复步骤①②,直到完全不能剪枝。
具体的,基尼指数是指分类问题中,假设有K个类,样本点属于第K类的概率为pk,则概率分布的基尼指数定义为:
Figure BDA0002857485740000201
对于二分类问题来说,若样本点属于第一类的概率为p,则概率分布的基尼指数为Gini(p)=2p(1-p)。对于给定的样本集合D,其基尼指数为:
Figure BDA0002857485740000202
其中,Ck是D中属于第k类的样本子集,K是类的个数。|Ck|和D分别表示子集的个数和样本的个数。
如果样本集合D根据特征A是否取某一可能的值α被分割成D1和D2,即
D1={(x,y)∈D|A(x)=a},D2=D-D1;
所以在特征A的条件下集合D的基尼指数为:
Figure BDA0002857485740000203
Gini(D)表示集合的不确定性,基尼指数G(D,A)表示A=a分解后集合的不确定性。基尼指数越大,样本集合的不确定性越大。
具体的,本发明实施例中,损失函数为:设树T的叶子节点数为|T|,叶子节点t上有Nt个样本点,其中k类的样本点数为Nkt,Ht(T)为结点t上的经验熵,α≥0为参数,损失函数定义为:
Figure BDA0002857485740000204
其中经验熵
Figure BDA0002857485740000205
Figure BDA0002857485740000206
则Cα(T)=C(T)+α|T|,其中C(T)表示对训练数据的预测误差,|T|表示模型的复杂度,则损失函数表达了模型复杂度与预算误差的平衡,以防止模型过拟合。
实施例三
请参阅图3,图3是本发明实施例公开的又一种企业风险指数计算装置的结构示意图。如图3所示,该装置可以包括:
存储有可执行程序代码的存储器301;
与存储器301耦合的处理器302;
处理器302调用存储器301中存储的可执行程序代码,执行本发明实施例一公开的企业风险指数计算方法中的部分或全部步骤。
实施例四
本发明实施例公开了一种计算机存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的企业风险指数计算方法中的部分或全部步骤。
以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种企业风险指数计算方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (10)

1.一种企业风险指数计算方法,其特征在于,所述方法包括:
基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系;所述企业风险指标体系包括多个企业风险指标;获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对所述企业业务数据进行数据清洗;所述企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种;
根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况。
2.根据权利要求1所述的企业风险指数计算方法,其特征在于,所述方法还包括:
使用CART分类回归树算法,针对每个所述企业风险指标,对所有所述企业业务数据执行CART分类树生成操作。
3.根据权利要求1所述的企业风险指数计算方法,其特征在于,所述企业风险点包括合同虚高风险、合同流失风险、虚假合同风险、虚假项目风险、虚假工作量风险、预算准确率风险、虚假列账风险、成本超前风险、项目关闭不及时风险和应付应收不及时风险中的一种或多种;
所述企业风险指标包括合同关联立项时间、合同收入转化率、零收款项目时间、成本预算偏离度、项目实施时间、外审流程时间、业务关闭时间差、工作量列账率、开票回款率、回现收入率和三年以上项目关闭率中的一种或多种。
4.根据权利要求1所述的企业风险指数计算方法,其特征在于,所述数据异常识别算法为3σ异常检测算法,所述经营单元包括项目、项目部门、分公司和专业公司中的一种或多种。
5.根据权利要求1所述的企业风险指数计算方法,其特征在于,所述根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况,包括:
确定业务风险评估模型的定义为:
R(Xi)=P(Xi)*C
其中,R(Xi)为风险指数,P(Xi)为风险发生概率,C为该风险发生后带来的潜在损失;
计算第i个项目的第m个项目维度指标的指标风险值
Figure FDA0002857485730000021
Figure FDA0002857485730000022
其中i=1,2,3,4……I,m=1,2,3,4……M;I为项目个数,M为项目维度指标个数,P为风险发生概率;C为风险发生时带来的损失大小。
计算第j个项目部第n个经营单元维度指标的风险值
Figure FDA0002857485730000023
Figure FDA0002857485730000024
计算第k个分公司第n个经营单元维度指标的风险值
Figure FDA0002857485730000025
Figure FDA0002857485730000026
计算第1个专业公司第n个经营单元维度指标的风险值
Figure FDA0002857485730000027
Figure FDA0002857485730000028
计算每个所述项目的综合风险
Figure FDA0002857485730000029
包括:
Figure FDA00028574857300000210
其中,I为项目个数,M为项目维度指标个数;
Figure FDA00028574857300000211
为第m个项目维度指标的权重;
计算每一所述经营单元中的项目综合风险R(1)
Figure FDA00028574857300000212
计算每一所述经营单元维度指标的风险R(2)
Figure FDA00028574857300000213
计算每一所述经营单元的综合风险R:
Figure FDA00028574857300000214
其中,
Figure FDA0002857485730000031
Figure FDA0002857485730000032
为项目维度指标的权重;
Figure FDA0002857485730000033
Figure FDA0002857485730000034
为经营单元维度指标的权重。
6.根据权利要求2所述的企业风险指数计算方法,其特征在于,所述使用CART分类回归树算法,针对每个所述企业风险指标,对所有所述企业业务数据执行CART分类树生成操作,包括:
确定影响所述企业风险指标的项目属性;所述项目属性包括客户类型、项目区域、项目专业、项目性质、项目类型以及项目状态中的一种或多种;
对每一所述企业风险指标执行特征选择操作,从可能影响所述企业风险指标的所有所述项目因素中,筛选出显著影响的项目因素;
对每一所述企业风险指标执行生成CART分类树操作,对生成的所述CART分类树进行剪枝操作。
7.根据权利要求6所述的企业风险指数计算方法,其特征在于,所述对每一所述企业风险指标执行生成CART分类树操作,包括:
(1)计算现有特征对该数据集的基尼指数,对于每一个特征A,可以对样本点A是否为a可以将数据集D分成数据集D1,D2;
(2)对于所有的特征A和所有可能的切分点a,选择基尼指数最小的特征以及相对应的切分点作为最优特征和最佳切分点;
(3)对最优子树递归调用步骤(1)、步骤(2),直到满足预设的停止条件;
(4)生成CART分类树;
以及,所述并对生成的所述CART分类树进行剪枝操作,包括:
①、计算每一个结点的经验熵;
②、递归的从叶子节点开始往上遍历,减掉叶子节点,然后判断损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;
③、重复步骤①②,直到完全不能剪枝。
8.一种企业风险指数计算装置,其特征在于,所述装置包括:
体系建立模块,用于基于企业业务特点和企业风险现状,对企业风险点进行指标量化,建立企业风险指标体系;所述企业风险指标体系包括多个企业风险指标;数据清洗模块,用于获取企业业务数据,根据预设的数据异常规则或使用数据异常识别算法,对所述企业业务数据进行数据清洗;所述企业业务数据包括财务数据、业务数据、客户数据和办公数据中的一种或多种;
指数计算模块,用于根据预设的业务风险评估模型,对所述企业业务数据中不同经营单元的企业业务数据进行风险指数计算,得到所述企业业务数据所对应的目标企业的风险情况。
9.一种企业风险指数计算装置,其特征在于,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-6任一项所述的企业风险指数计算方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的企业风险指数计算方法。
CN202011551983.XA 2020-12-24 2020-12-24 企业风险指数计算方法及装置 Pending CN112581000A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011551983.XA CN112581000A (zh) 2020-12-24 2020-12-24 企业风险指数计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011551983.XA CN112581000A (zh) 2020-12-24 2020-12-24 企业风险指数计算方法及装置

Publications (1)

Publication Number Publication Date
CN112581000A true CN112581000A (zh) 2021-03-30

Family

ID=75139605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011551983.XA Pending CN112581000A (zh) 2020-12-24 2020-12-24 企业风险指数计算方法及装置

Country Status (1)

Country Link
CN (1) CN112581000A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113240259A (zh) * 2021-04-30 2021-08-10 顶象科技有限公司 规则策略组的生成方法、系统及电子设备
CN113962614A (zh) * 2021-12-21 2022-01-21 深圳市迪博企业风险管理技术有限公司 一种上市公司经营异常智能审查方法及装置
CN114154866A (zh) * 2021-12-02 2022-03-08 北京顶象技术有限公司 一种上市企业财务风险预警方法和系统
CN115099586A (zh) * 2022-06-10 2022-09-23 上海异工同智信息科技有限公司 用于作业风险识别的方法及装置
CN115660410A (zh) * 2022-10-09 2023-01-31 广东迪浪科技股份有限公司 基于大数据的企业风险预测方法、控制装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180308160A1 (en) * 2016-02-01 2018-10-25 Tencent Technology (Shenzhen) Company Limited Risk assessment method and system
CN110443458A (zh) * 2019-07-05 2019-11-12 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机设备和存储介质
CN111091276A (zh) * 2019-12-04 2020-05-01 苏宁金融科技(南京)有限公司 企业风险评分方法、装置、计算机设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180308160A1 (en) * 2016-02-01 2018-10-25 Tencent Technology (Shenzhen) Company Limited Risk assessment method and system
CN110443458A (zh) * 2019-07-05 2019-11-12 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机设备和存储介质
CN111091276A (zh) * 2019-12-04 2020-05-01 苏宁金融科技(南京)有限公司 企业风险评分方法、装置、计算机设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113240259A (zh) * 2021-04-30 2021-08-10 顶象科技有限公司 规则策略组的生成方法、系统及电子设备
CN114154866A (zh) * 2021-12-02 2022-03-08 北京顶象技术有限公司 一种上市企业财务风险预警方法和系统
CN113962614A (zh) * 2021-12-21 2022-01-21 深圳市迪博企业风险管理技术有限公司 一种上市公司经营异常智能审查方法及装置
CN115099586A (zh) * 2022-06-10 2022-09-23 上海异工同智信息科技有限公司 用于作业风险识别的方法及装置
CN115660410A (zh) * 2022-10-09 2023-01-31 广东迪浪科技股份有限公司 基于大数据的企业风险预测方法、控制装置及存储介质

Similar Documents

Publication Publication Date Title
CN112581000A (zh) 企业风险指数计算方法及装置
CN110417721B (zh) 安全风险评估方法、装置、设备及计算机可读存储介质
CN110852856B (zh) 一种基于动态网络表征的发票虚开识别方法
CN112668944A (zh) 一种基于大数据征信的企业风控方法、装置、设备及介质
CN111639497A (zh) 一种基于大数据机器学习的异常行为发现方法
US10521748B2 (en) Retention risk determiner
CN111340606B (zh) 一种全流程收入稽核方法和装置
CN116955092B (zh) 基于数据分析的多媒体系统监控方法及系统
CN112445844B (zh) 大数据平台财务数据管理控制系统
CN113095927A (zh) 一种反洗钱可疑交易识别方法及设备
KR20190110084A (ko) Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
Wang et al. Partition cost-sensitive CART based on customer value for Telecom customer churn prediction
CN112037001A (zh) 打款风险预测模型训练方法、打款风险预测方法及其装置
CN114638498A (zh) Esg评价方法、系统、电子设备及存储设备
CN111695979A (zh) 一种原材料与成品的关系分析方法、装置及设备
US11409502B2 (en) Intelligent controls for end-user computing
CN112329862A (zh) 基于决策树的反洗钱方法及系统
CN116468273A (zh) 客户风险识别方法及装置
CN111160647A (zh) 一种洗钱行为预测方法及装置
CN115860924A (zh) 供应链金融信用风险预警方法及相关设备
US20230196370A1 (en) Artificial intelligence (ai) based transaction data processing and reconciliation
CN116051053A (zh) 一种科技项目申报流程精细化管理系统
CN114841239A (zh) 基于机器学习的上市公司财务异常分析方法
Bidyuk et al. The algorithm for predicting the cryptocurrency rate taking into account the influence of posts of a group of famous people in social networks
CN115345401A (zh) 一种发现企业金融风险的六维分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination