CN114723287A - 一种基于企业特征和经营行为对风险形成的量化统计方法 - Google Patents
一种基于企业特征和经营行为对风险形成的量化统计方法 Download PDFInfo
- Publication number
- CN114723287A CN114723287A CN202210366144.3A CN202210366144A CN114723287A CN 114723287 A CN114723287 A CN 114723287A CN 202210366144 A CN202210366144 A CN 202210366144A CN 114723287 A CN114723287 A CN 114723287A
- Authority
- CN
- China
- Prior art keywords
- risk
- data
- index
- early warning
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于企业特征和经营行为对风险形成的量化统计方法,包括以下步骤,首先进行数据采集与数据库管理;本发明以企业行为对风险形成的量化影响为切入点,通过大数据挖掘技术,对工商注册信息和市场行业信息等诸多维度的数据进行深入分析与智能匹配,挖掘它们与风险形成之间有效关联性,构建能够刻画企业行为对经营风险发生影响的指标体系,利用统计学手段合理科学的定义风险预警指数,并根据有效风险因子体系建立风险预警指数的动态计算模型,描述各指标与企业经营风险之间精确的量化关系,搭建云计算平台,实现数据库动态更新、计算模型实时校正、预警指数动态发布、数据可视化展示等功能的一体化。
Description
技术领域
本发明涉及量化统计技术领域,具体为一种基于企业特征和经营行为对风险形成的量化统计方法。
背景技术
风险量化是指通过不同的风险相互作用的估算来评价项目可能结果的范围。风险量化的基本内容是确定哪些实践需要制定应对措施。风险量化涉及到对不同的风险之间相互作用的评估,用这个评估分析项目可能的输出,这样首先就需要决定哪些风险值得反应。
风险量化用于衡量风险概率和风险对项目目标影响的程度,它依据风险管理计划、风险及风险条件排序表、历史资料、专家判断及其他计划成果,利用灵敏度分析、决策分析与模拟的方法与技术,得到量化序列表、项目确认研究以及所需应急资源等量化结果。
目前针对工商注册信息、市场行业信息、企业财务数据、非财务数据、法人治理、公司关联方、企业关键绩效指标KPI、知识产权等诸多维度的数据的量化在进行计算、分析、估算等一系列操作后,最终所得数据散乱,管理不便,无法实现数据总体可视化功能。
为此提出一种基于企业特征和经营行为对风险形成的量化统计方法,来解决此问题。
发明内容
本发明的目的在于提供一种基于企业特征和经营行为对风险形成的量化统计方法,解决了目前针对工商注册信息、市场行业信息、企业财务数据、非财务数据、法人治理、公司关联方、企业关键绩效指标KPI、知识产权等诸多维度的数据的量化在进行计算、分析、估算等一系列操作后,最终所得数据散乱,管理不便,无法实现数据总体可视化功能的问题。
为实现上述目的,本发明提供如下技术方案:一种基于企业特征和经营行为对风险形成的量化统计方法,包括以下步骤:
步骤1:数据采集与数据库管理:使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析;
步骤2:关联度分析与指标体系构建:通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系;
步骤3:企业风险指数编制和计算模型:使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证;
步骤4:云平台开发与应用:将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务。
优选的,所述在步骤1中,通过对数据进行存储、加工和处理等工作能够研究各种数据指标之间的关联强度、交互作用和修饰效应,进而筛选出对风险影响显著的因素,从而能够方便后续构建出完备的指标体系。
优选的,所述在步骤2中,Apriori算法是数据挖掘中寻找关联规则的一种常用算法,利用该算法寻找满足预设支持度和置信度阈值的规则,寻找风险发生的前提条件,利用置信度反应风险发生与前提因素之间的关联强度。
优选的,所述在步骤2中,结构方程模型是一种多元分析技术,它包含标准的方法,并在标准方法的基础上进行了扩展。
优选的,所述在步骤2中,多元分析技术的标准方法包括回归技术、因子分析、方差分析和相关分析。
优选的,所述在步骤2中,Amos让结构方程模型变为拖放式绘图工具,可快速地以演示级路径图定制模型容易,它拥有直观而无需编程,在构建方程式模型过程中的每一步骤均能提供图形环境,并能够通过快速的模型建立来检验变量是如何互相影响以及为何会发生此影响,利用结构方程模型分析风险发生风险预警指标的显著性,由此确认有效因子指标,构建相应的预警指标体系。
优选的,所述在步骤3中,机器学习算法包括逻辑回归、随机森林、ScoreNet技术、神经网络等。
优选的,所述在步骤4中,平台使用虚拟化技术,它能够有效提升云服务器的利用率,降低项目成本,目前普遍使用的三种虚拟化技术包括KVM、XEN和VMware。
优选的,所述在步骤4中,平台的云计算系统拟采用分布式存储方式存储数据,并采用冗余存储技术保证数据的可靠性,用户通过Web服务界面,可以将内容存储到服务端,同时也拟采用MapReduce的编程模式进行用户数据和采集数据的海量数据处理,由于它是一种简单的分布式编程模型,能够用于大规模数据的并行计算。
优选的,所述在步骤4中,针对全部数据的管理技术,为了实现可能的结构化大数据分析,拟采用MPP架构的新型数据库集群,通过列存储、粗粒度索引等多项大数据处理技术,结合高效的分布式计算模式,完成对分析类应用的支撑,而且其运行环境多为低成本PCServer,具有高性能和高扩展性的特点。
与现有技术相比,本发明的有益效果是:
本发明以企业行为对风险形成的量化影响为切入点,通过大数据挖掘技术,对工商注册信息和市场行业信息等诸多维度的数据进行深入分析与智能匹配,挖掘它们与风险形成之间有效关联性,构建能够刻画企业行为对经营风险发生影响的指标体系,利用统计学手段合理科学的定义风险预警指数,并根据有效风险因子体系建立风险预警指数的动态计算模型,用来描述各指标与企业经营风险之间精确的量化关系,最终初步搭建云计算平台,实现数据库动态更新、计算模型实时校正、预警指数动态发布、数据可视化展示等功能的一体化,有效解决了目前数据散乱和管理不便等问题。
具体实施方式
下面将通过实施例的方式对本发明作更详细的描述,这些实施例仅是举例说明性的而没有任何对本发明范围的限制。
本发明提供一种技术方案:一种基于企业特征和经营行为对风险形成的量化统计方法,包括以下步骤:
步骤1:数据采集与数据库管理:使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析;
步骤2:关联度分析与指标体系构建:通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系;
步骤3:企业风险指数编制和计算模型:使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证;
步骤4:云平台开发与应用:将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务。
实施例一:
首先进行数据采集与数据库管理,使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析,然后进行关联度分析与指标体系构建,通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系,之后进行企业风险指数编制和计算模型,使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证,最后进行云平台开发与应用,将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务。
实施例二:
在实施例一中,再加上下述工序:
在步骤1中,通过对数据进行存储、加工和处理等工作能够研究各种数据指标之间的关联强度、交互作用和修饰效应,进而筛选出对风险影响显著的因素,从而能够方便后续构建出完备的指标体系。
首先进行数据采集与数据库管理,使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析,通过对数据进行存储、加工和处理等工作能够研究各种数据指标之间的关联强度、交互作用和修饰效应,进而筛选出对风险影响显著的因素,从而能够方便后续构建出完备的指标体系,然后进行关联度分析与指标体系构建,通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系,之后进行企业风险指数编制和计算模型,使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证,最后进行云平台开发与应用,将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务。
实施例三:
在实施例二中,再加上下述工序:
在步骤2中,Apriori算法是数据挖掘中寻找关联规则的一种常用算法,利用该算法寻找满足预设支持度和置信度阈值的规则,寻找风险发生的前提条件,利用置信度反应风险发生与前提因素之间的关联强度,结构方程模型是一种多元分析技术,它包含标准的方法,并在标准方法的基础上进行了扩展,多元分析技术的标准方法包括回归技术、因子分析、方差分析和相关分析,Amos让结构方程模型变为拖放式绘图工具,可快速地以演示级路径图定制模型容易,它拥有直观而无需编程,在构建方程式模型过程中的每一步骤均能提供图形环境,并能够通过快速的模型建立来检验变量是如何互相影响以及为何会发生此影响,利用结构方程模型分析风险发生风险预警指标的显著性,由此确认有效因子指标,构建相应的预警指标体系。
在步骤3中,机器学习算法包括逻辑回归、随机森林、ScoreNet技术、神经网络等。
首先进行数据采集与数据库管理,使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析,通过对数据进行存储、加工和处理等工作能够研究各种数据指标之间的关联强度、交互作用和修饰效应,进而筛选出对风险影响显著的因素,从而能够方便后续构建出完备的指标体系,然后进行关联度分析与指标体系构建,通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系,Apriori算法是数据挖掘中寻找关联规则的一种常用算法,利用该算法寻找满足预设支持度和置信度阈值的规则,寻找风险发生的前提条件,利用置信度反应风险发生与前提因素之间的关联强度,结构方程模型是一种多元分析技术,它包含标准的方法,并在标准方法的基础上进行了扩展,多元分析技术的标准方法包括回归技术、因子分析、方差分析和相关分析,Amos让结构方程模型变为拖放式绘图工具,可快速地以演示级路径图定制模型容易,它拥有直观而无需编程,在构建方程式模型过程中的每一步骤均能提供图形环境,并能够通过快速的模型建立来检验变量是如何互相影响以及为何会发生此影响,利用结构方程模型分析风险发生风险预警指标的显著性,由此确认有效因子指标,构建相应的预警指标体系,之后进行企业风险指数编制和计算模型,使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证,机器学习算法包括逻辑回归、随机森林、ScoreNet技术、神经网络等,最后进行云平台开发与应用,将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务。
实施例四:
在实施例三中,再加上下述工序:
在步骤4中,平台使用虚拟化技术,它能够有效提升云服务器的利用率,降低项目成本,目前普遍使用的三种虚拟化技术包括KVM、XEN和VMware,平台的云计算系统拟采用分布式存储方式存储数据,并采用冗余存储技术保证数据的可靠性,用户通过Web服务界面,可以将内容存储到服务端,同时也拟采用MapReduce的编程模式进行用户数据和采集数据的海量数据处理,由于它是一种简单的分布式编程模型,能够用于大规模数据的并行计算,针对全部数据的管理技术,为了实现可能的结构化大数据分析,拟采用MPP架构的新型数据库集群,通过列存储、粗粒度索引等多项大数据处理技术,结合高效的分布式计算模式,完成对分析类应用的支撑,而且其运行环境多为低成本PC Server,具有高性能和高扩展性的特点。
首先进行数据采集与数据库管理,使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析,通过对数据进行存储、加工和处理等工作能够研究各种数据指标之间的关联强度、交互作用和修饰效应,进而筛选出对风险影响显著的因素,从而能够方便后续构建出完备的指标体系,然后进行关联度分析与指标体系构建,通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系,Apriori算法是数据挖掘中寻找关联规则的一种常用算法,利用该算法寻找满足预设支持度和置信度阈值的规则,寻找风险发生的前提条件,利用置信度反应风险发生与前提因素之间的关联强度,结构方程模型是一种多元分析技术,它包含标准的方法,并在标准方法的基础上进行了扩展,多元分析技术的标准方法包括回归技术、因子分析、方差分析和相关分析,Amos让结构方程模型变为拖放式绘图工具,可快速地以演示级路径图定制模型容易,它拥有直观而无需编程,在构建方程式模型过程中的每一步骤均能提供图形环境,并能够通过快速的模型建立来检验变量是如何互相影响以及为何会发生此影响,利用结构方程模型分析风险发生风险预警指标的显著性,由此确认有效因子指标,构建相应的预警指标体系,之后进行企业风险指数编制和计算模型,使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证,机器学习算法包括逻辑回归、随机森林、ScoreNet技术、神经网络等,最后进行云平台开发与应用,将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务,平台使用虚拟化技术,它能够有效提升云服务器的利用率,降低项目成本,目前普遍使用的三种虚拟化技术包括KVM、XEN和VMware,平台的云计算系统拟采用分布式存储方式存储数据,并采用冗余存储技术保证数据的可靠性,用户通过Web服务界面,可以将内容存储到服务端,同时也拟采用MapReduce的编程模式进行用户数据和采集数据的海量数据处理,由于它是一种简单的分布式编程模型,能够用于大规模数据的并行计算,针对全部数据的管理技术,为了实现可能的结构化大数据分析,拟采用MPP架构的新型数据库集群,通过列存储、粗粒度索引等多项大数据处理技术,结合高效的分布式计算模式,完成对分析类应用的支撑,而且其运行环境多为低成本PC Server,具有高性能和高扩展性的特点。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:包括以下步骤:
步骤1:数据采集与数据库管理:使用合作单位提供的数据接口,对企业大数据进行采集,使用现有的数据库技术实现研究需求的大数据的存储、加工和处理,特别是实时计算分析;
步骤2:关联度分析与指标体系构建:通过C4.5决策树算法及Apriori算法进行关联分析,风险的产生是企业特征、经营行为、行业变化、工商注册等各种因素相互影响的结果,通过各类指标获取,量化风险与各影响因素间的关联强度,为后续风险指数的编制服务,针对风险发生与否进行二元分类,通过C4.5算法,利用信息增益比例构建决策树,并利用决策树产生相关的预测规则,并挖掘出风险发生的相关前提因素以及因素影响度,从而反映出各指标与风险间的关联强度,使用统计分析中的显著性检验手段,通过拟使用结构方程模型,在数据指标中筛选出强关联影响因素,并经过数据整合流程,构建完备的风险影响指标体系;
步骤3:企业风险指数编制和计算模型:使用多种统计分析方法,从经营行为风险、诚信风险、综合实力风险、行业特征风险、静态关联方风险、动态关联方风险等维度,建立风险事件发生概率与相关数据指标之间的定量关系,以预警指标体系为基础,利用变异系数法、熵值法、CRITIC法等对各维度风险指标进行赋权,计算得到备选风险发生预警指数,使用谱分析法估计不同指标时间序列数据的谱密度,有效把握数据波动特征,对备选预警指数和风险发生进行领先和滞后关系分析,最终确定合理的预警指数编制方案和相应的预警指数,使用机器学习算法给出风险预警指数的计算模型,并进行模型有效性的样本验证;
步骤4:云平台开发与应用:将数据获取与数据库更新、风险预警指数计以及应用服务整合到同一个云平台上,基于静态的企业工商数据与动态的企业运营数据等,实现在WEB、移动等终端的风险预警服务。
2.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤1中,通过对数据进行存储、加工和处理等工作能够研究各种数据指标之间的关联强度、交互作用和修饰效应,进而筛选出对风险影响显著的因素,从而能够方便后续构建出完备的指标体系。
3.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤2中,Apriori算法是数据挖掘中寻找关联规则的一种常用算法,利用该算法寻找满足预设支持度和置信度阈值的规则,寻找风险发生的前提条件,利用置信度反应风险发生与前提因素之间的关联强度。
4.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤2中,结构方程模型是一种多元分析技术,它包含标准的方法,并在标准方法的基础上进行了扩展。
5.根据权利要求4所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤2中,多元分析技术的标准方法包括回归技术、因子分析、方差分析和相关分析。
6.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤2中,Amos让结构方程模型变为拖放式绘图工具,可快速地以演示级路径图定制模型容易,它拥有直观而无需编程,在构建方程式模型过程中的每一步骤均能提供图形环境,并能够通过快速的模型建立来检验变量是如何互相影响以及为何会发生此影响,利用结构方程模型分析风险发生风险预警指标的显著性,由此确认有效因子指标,构建相应的预警指标体系。
7.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤3中,机器学习算法包括逻辑回归、随机森林、ScoreNet技术、神经网络等。
8.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤4中,平台使用虚拟化技术,它能够有效提升云服务器的利用率,降低项目成本,目前普遍使用的三种虚拟化技术包括KVM、XEN和VMware。
9.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤4中,平台的云计算系统拟采用分布式存储方式存储数据,并采用冗余存储技术保证数据的可靠性,用户通过Web服务界面,可以将内容存储到服务端,同时也拟采用MapReduce的编程模式进行用户数据和采集数据的海量数据处理,由于它是一种简单的分布式编程模型,能够用于大规模数据的并行计算。
10.根据权利要求1所述的一种基于企业特征和经营行为对风险形成的量化统计方法,其特征在于:所述在步骤4中,针对全部数据的管理技术,为了实现可能的结构化大数据分析,拟采用MPP架构的新型数据库集群,通过列存储、粗粒度索引等多项大数据处理技术,结合高效的分布式计算模式,完成对分析类应用的支撑,而且其运行环境多为低成本PCServer,具有高性能和高扩展性的特点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210366144.3A CN114723287A (zh) | 2022-04-08 | 2022-04-08 | 一种基于企业特征和经营行为对风险形成的量化统计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210366144.3A CN114723287A (zh) | 2022-04-08 | 2022-04-08 | 一种基于企业特征和经营行为对风险形成的量化统计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114723287A true CN114723287A (zh) | 2022-07-08 |
Family
ID=82242750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210366144.3A Pending CN114723287A (zh) | 2022-04-08 | 2022-04-08 | 一种基于企业特征和经营行为对风险形成的量化统计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114723287A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115170166A (zh) * | 2022-09-06 | 2022-10-11 | 山东省市场监管监测中心 | 一种用于判断垄断行为的大数据感知方法及系统 |
CN115544045A (zh) * | 2022-11-23 | 2022-12-30 | 云账户技术(天津)有限公司 | 一种行业表述的获取方法及装置 |
CN115659832A (zh) * | 2022-11-08 | 2023-01-31 | 中国交通信息科技集团有限公司 | 一种基于大数据分析的企业运营分析及预警方法及系统 |
CN116307408A (zh) * | 2023-05-26 | 2023-06-23 | 山东共同体信息科技有限公司 | 基于数据分析的互联网企业管理系统 |
CN116596674A (zh) * | 2023-07-18 | 2023-08-15 | 山东省标准化研究院(Wto/Tbt山东咨询工作站) | 基于大数据分析的对外贸易风险评估方法 |
CN117455232A (zh) * | 2023-10-26 | 2024-01-26 | 广东电力交易中心有限责任公司 | 一种电力市场履约行为监测方法及系统 |
CN117495433A (zh) * | 2023-12-22 | 2024-02-02 | 车主邦(北京)科技有限公司 | 能源站的数据预测方法、装置、计算机设备和存储介质 |
-
2022
- 2022-04-08 CN CN202210366144.3A patent/CN114723287A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115170166A (zh) * | 2022-09-06 | 2022-10-11 | 山东省市场监管监测中心 | 一种用于判断垄断行为的大数据感知方法及系统 |
CN115170166B (zh) * | 2022-09-06 | 2023-04-11 | 山东省市场监管监测中心 | 一种用于判断垄断行为的大数据感知方法及系统 |
CN115659832A (zh) * | 2022-11-08 | 2023-01-31 | 中国交通信息科技集团有限公司 | 一种基于大数据分析的企业运营分析及预警方法及系统 |
CN115659832B (zh) * | 2022-11-08 | 2023-07-18 | 中国交通信息科技集团有限公司 | 一种基于大数据分析的企业运营分析及预警监控方法及系统 |
CN115544045A (zh) * | 2022-11-23 | 2022-12-30 | 云账户技术(天津)有限公司 | 一种行业表述的获取方法及装置 |
CN116307408A (zh) * | 2023-05-26 | 2023-06-23 | 山东共同体信息科技有限公司 | 基于数据分析的互联网企业管理系统 |
CN116596674A (zh) * | 2023-07-18 | 2023-08-15 | 山东省标准化研究院(Wto/Tbt山东咨询工作站) | 基于大数据分析的对外贸易风险评估方法 |
CN117455232A (zh) * | 2023-10-26 | 2024-01-26 | 广东电力交易中心有限责任公司 | 一种电力市场履约行为监测方法及系统 |
CN117495433A (zh) * | 2023-12-22 | 2024-02-02 | 车主邦(北京)科技有限公司 | 能源站的数据预测方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114723287A (zh) | 一种基于企业特征和经营行为对风险形成的量化统计方法 | |
CN111199343B (zh) | 一种多模型融合的烟草市场监管异常数据挖掘方法 | |
Gosiewska et al. | Simpler is better: Lifting interpretability-performance trade-off via automated feature engineering | |
US10445657B2 (en) | General framework for cross-validation of machine learning algorithms using SQL on distributed systems | |
CN112558931B (zh) | 一种面向用户工作流模式的智能模型构建及运行方法 | |
CN103971023B (zh) | 研发过程质量自动评估系统和方法 | |
CN111738331A (zh) | 用户分类方法及装置、计算机可读存储介质、电子设备 | |
CN105184886A (zh) | 一种云数据中心智能巡检系统及方法 | |
CN114757468B (zh) | 一种面向流程挖掘中流程执行异常的根源分析方法 | |
CN114036531A (zh) | 一种基于多尺度代码度量的软件安全漏洞检测方法 | |
CN114448657B (zh) | 一种配电通信网络安全态势感知与异常入侵检测方法 | |
CN117035563B (zh) | 产品质量安全风险监测方法、设备、监测系统及介质 | |
Rajbahadur et al. | Pitfalls analyzer: quality control for model-driven data science pipelines | |
CN112669039A (zh) | 基于知识图谱的客户风险管控系统及方法 | |
CN113918534A (zh) | 一种策略处理系统及方法 | |
Pham et al. | Predictive analysis of the supply chain management using machine learning approaches: Review and taxonomy | |
US20220374401A1 (en) | Determining domain and matching algorithms for data systems | |
CN111221704B (zh) | 一种确定办公管理应用系统运行状态的方法及系统 | |
Li et al. | Sparse inverse covariance estimation: a data mining technique to unravel holistic patterns among business practices in firms | |
Gopala Krishnan et al. | Predictive algorithm and criteria to perform big data analytics | |
CN113610225A (zh) | 质量评估模型训练方法、装置、电子设备及存储介质 | |
Luthfiarta et al. | Prediction on deposit subscription of customer based on bank telemarketing using Decision Tree with entropy comparison | |
Yefimenko | Advances in GMDH-based predictive analytics tools for business intelligence systems | |
CN117150389B (zh) | 模型训练方法、运营商号卡激活预测方法及其设备 | |
CN117690601B (zh) | 基于大数据分析的结核病流行趋势预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |