CN112734295A - 一种行业指数分析管理系统及分析方法 - Google Patents
一种行业指数分析管理系统及分析方法 Download PDFInfo
- Publication number
- CN112734295A CN112734295A CN202110110632.3A CN202110110632A CN112734295A CN 112734295 A CN112734295 A CN 112734295A CN 202110110632 A CN202110110632 A CN 202110110632A CN 112734295 A CN112734295 A CN 112734295A
- Authority
- CN
- China
- Prior art keywords
- index
- indexes
- data
- industry
- original data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000007726 management method Methods 0.000 claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 238000011157 data evaluation Methods 0.000 claims abstract description 4
- 238000013079 data visualisation Methods 0.000 claims abstract description 4
- 238000011161 development Methods 0.000 claims description 65
- 238000000034 method Methods 0.000 claims description 61
- 239000011159 matrix material Substances 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 21
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 15
- 230000008901 benefit Effects 0.000 claims description 7
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 101000878595 Arabidopsis thaliana Squalene synthase 1 Proteins 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 3
- 101000713575 Homo sapiens Tubulin beta-3 chain Proteins 0.000 claims description 3
- 101000713585 Homo sapiens Tubulin beta-4A chain Proteins 0.000 claims description 3
- 102100036790 Tubulin beta-3 chain Human genes 0.000 claims description 3
- 102100036788 Tubulin beta-4A chain Human genes 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000844 transformation Methods 0.000 claims description 3
- 238000011835 investigation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Fuzzy Systems (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种行业指数分析管理系统及分析方法,包括原始数据采集模块,原始数据预处理模块,第一模型构建模块、第二模型构建模块、总控模块、信息发模块与排名展示模块;所述原始数据采集模块用于进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理,之后将处理后的原始数据发送到第一模型构建模块;所述原始数据采集模块采集的原始数据包括模型三级指标,所述模型三级指标均为原始数据评价指标,收集电力侧及政府侧样本企业用户的用电、金融等原始数据,对其进行清洗整理,为下一步指标及指数的计算建立数据源,其具体包括采用数据可视化。本发明能够更好的进行行业指数分析,从而进行更好的行业管理。
Description
技术领域
本发明涉及区域行业发展领域,具体涉及一种行业指数分析管理系统及分析方法。
背景技术
区域行业发展智能管理平台整合社会经济发展资源,打造集行业指数、产值能耗、用能发展、金融健康、劳动力需求、物流货运于一体的大数据平台,以信息化提升数据化管理与服务能力,及时准确掌握社会经济发展情况,做到“用数据说话、用数据管理、用数据决策、用数据创新”,在进行区域行业发展过程中需要了解到行业发展指数,行业发展指数就是衡量某一个行业发展程度的数据标准。如果以某一具体时期为基准,以1或100为基数,使该行业在基准时期产生的原始数据与基数相对应,则基数与基准时期原始数据之比乘以考察时期产生的原始数据即为该行业在考察时期的发展指数,在进行行业发展指数信息管理时,需要使用到行业指数分析管理系统及分析方法。
现有的行业指数分析管理系统及分析方法,采集数据较为单一,到时分析出的行业指数偏差较大,从而导致实际管理难度大,给行业指数分析管理系统及分析方法的使用带来了一定的影响,因此,提出一种行业指数分析管理系统及分析方法。
发明内容
本发明所要解决的技术问题在于:如何解决现有的行业指数分析管理系统及分析方法,采集数据较为单一,到时分析出的行业指数偏差较大,从而导致实际管理难度大,给行业指数分析管理系统及分析方法的使用带来了一定的影响的问题,提供了一种行业指数分析管理系统及分析方法。
本发明是通过以下技术方案解决上述技术问题的,本发明包括原始数据采集模块,原始数据预处理模块,第一模型构建模块、第二模型构建模块、总控模块、信息发模块与排名展示模块;
所述原始数据采集模块用于进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理,之后将处理后的原始数据发送到第一模型构建模块;
所述原始数据采集模块采集的原始数据包括模型三级指标,所述模型三级指标均为原始数据评价指标,收集电力侧及政府侧样本企业用户的用电、金融等原始数据,对其进行清洗整理,为下一步指标及指数的计算建立数据源,其具体包括采用数据可视化,剔除统计意义弱以及明显异常的数据;采用回归拟合法,补齐缺失数据;采用数据归一化,消除量纲差异;
所述原始数据预处理的过程如下:
步骤一:进行数据剔除:获取原始数据后,对于统计意义弱的指标进行剔除,其中数据一致率高于95%即定义为统计意义弱,数据一致率定义为:Pd=Ds/Da其中:Ds为同一指标中一致的数据量;Da为同一指标所有数据量。
同时,对指标中个别异常数据进行剔除,比如超出数倍均值的企业指标数据,确保数据的可信度;
步骤二:缺失数据补齐:对于某企业的某一指标,如缺失个别月份数据,则根据三次样条插值简称Spline差值法补齐缺失值,获得完成可运行的数据;
步骤三:正向化处理:即将所有类型的指标都转化为效益型指标,主要是针对成本型指标,需将其转化为效益型指标;
对于成本型指标数据,需进行如下转化:Dij'=-Dij其中:Dij为一指标数据;
步骤四:一化处理:为消除不同指标量纲的影响,实现统一评判,需对数据进行归一化处理,本文采用均值法处理各指标数据。指标数据均值化是指利用每一指标数据去除同一指标全体数据的平均值得到新序列矩阵;
步骤五:根据企业的行业属性,将样本企业进行分类,得到多个单一行业指标数据矩阵;
所述第一模型构建模块接收到处理后的原始数据后对其进行计算处理生成二级指标与三级指标;
所述第一模型构建模块处理出的二级指标与三级指标被发送到第二模型构建模块;
所述第二模型构建模块对的二级指标与三级指标进行处理构建出一级指标,并对一级指标我进行处理得到行业指数信息;
所述指数信息生成后所述总控模块控制信息发送模块将指数信息发送到排名展示模块进行行业指数排名展示。
优选的,所述第一模型构建模块处理的二级指标与三级指标过程如下:根据生产建议,结合指标的属性,确定模型二级指标与三级指标的隶属关系,确定每个二级指标对应的三级原始数据指标种类,然后,采用向量夹角余弦法确定权重,加权形成二级指标,通过对同一行业的企业二级指标进行叠加,同步得到行业发展二级指标。
优选的,所述二级指标与三级指标的具体生成过程如下:
S1:确定样本数据:同一行业中,每个二级指标k(k=1,2,…,p)包含n个样本企业,m个原始属性指标构成三级指标矩阵Ak,Ak=(aij)n×m;
S2:确定最优、最劣序列:由于所有指标为正类属性,其指标值越大性能越优,选取各序列的最大值为最优参考序列U,选取各序列的最小值为最劣序列L。得到最优序列和最劣序列分别为:U=(ui)=max(uij)与L=(li)=min(lij);
S4:确定指标权重:指标权重是指该评价指标在整个评价体系中的重要程度,可通过指标权重对被评价对象重要程度从不同侧面进行定量分析。则关于指标k的权重,取最优偏差率矩阵R对应的列向量rj及最劣偏差率矩阵S对应的列向量sj,求2个列向量的夹角余弦值:
归一化可得指标的权重向量:
S5:计算单个企业二级指标:根据二级、三级指标隶属关系以及相应权重,可以得到企业每个月的二级指标:
Z=(zij)=(wj*aij)
由于四类二级指标均是基于当月的状态指标,为考虑历史因素,对企业的二级指标评分中需进行历史评分修正;
修正公式为:Yn=k*Sn-1+k2*Sn-2+…;
其中,Yn为修正分,Sn-1为上一月度某一项二级指标评分,Sn-2为上上月度某一项二级指标评分,k为系数且0<k<1,暂取k=0.5,修正后的评分Y仍用Z表示;
S6:计算行业二级指标:通过对同行业内企业二级指标进行累加,可以得到历月的行业二级指标值:
H=(hj)=sum(zij)/n。
优选的,所述第二模型构建模块构建第一指标的过程如下:使用合成指数方法,首先得到一级指标中的企业发展指数,再通过聚集同行业企业发展指数合成行业发展指数。具体方法是:利用得到的企业二级指标,使用主成分分析法,计算出t个二级指标的系数权重,最后合成行业发展指数。
优选的,所述行业发展指数的具体处理过程如下:
SS2:相关系数矩阵Rz的特征值和特征向量:由|RZ-λE|=0得到t个特征值λ1,λ2,…,λt,可以求出特征值以及相应的特征向量,其大小反映了各主成分的影响力,把特征值按从大到小顺序排列得到λ1≥λ2≥…≥λt,再分别求出对应特征值的特征向量[e1,e2,…,et];
SS3:方差贡献率:根据相关系数矩阵RZ的特征值求出方差贡献率,并从大到小依次计算累计方差贡献率,当前r个主成分的累计方差贡献率大于等于
则最终选取这r个主成分,方可综合体现总体指标;
SS4:获取企业发展指数:计算n个企业的主成分:M=RZ×[e1,e2,...,er],再计算企业历月一级评价指标:
得到同行业企业历月综合评价指数,同理,对由于一级指标均是基于当月的状态指标,为考虑历史因素,需对企业的一级指标进行历史评分修正,对Fi进行排序,即可得到同行业企业综合评价排名。
修正公式为:
In=k*Fn-1+k2*Fn-2+…
其中,In为修正分,Fn-1为上一月度某一项二级指标评分,Fn-2为上上月度某一项二级指标评分,以此类推,k为系数且0<k<1,暂取k=0.5,为表述一致,修正后的评分In仍用Fn表示;
SS5:获取行业发展指数:对统一行业的企业发展指数按照每月进行累计求平均,可以得到历月行业发展指数:
其中,n为同行业内企业个数。
优选的,所述排名展示模块的具体展示过程如下:将获取到最终的企业发展指数进行从大到小的排序,提取出企业发展指数的前x名进行展示,x≥4,企业发展指数的前x名均展示在排名展示模块上,同时企业发展指数最大的前三名的展示字体为预设颜色的加粗字体。
一种行业指数分析管理系统的分析方法,包括以下步骤:
步骤一:先进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理;
步骤二:处理后的原始数据发送到第一模型构建模块,第一模型构建模块进行处理生成二级指标与三级指标;
步骤三:生成后的二级指标与三级指标被发送到第二模型构建模块进行处理;
步骤四:第二模型构建模块对获取到二级指标与三级指标进行处理生成一级指标;
步骤五:对一级指标件处理生成企业发展指数,之后再对企业发展指数进行综合处理生成行业发展指数;
步骤六:行业发展指数生成后对其进行排名并展示。
本发明相比现有技术具有以下优点:该行业指数分析管理系统及分析方法,通过采集更加全面的数据,对数据优化处理后进行建模处理,能够获取到行业信息与企业信息,通过将行业信息与企业综合处理最终得到行业的指数信息,通过对行业指数信息进行分析能够了解到该行业的具体状态,方便了使用者根据行业指数来对企业进行调整整改,促进企业的良性发展,从而使得该系统挤方法,更加值得推广使用。
附图说明
图1是本发明的系统框图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例提供一种技术方案:一种行业指数分析管理系统,包括原始数据采集模块,原始数据预处理模块,第一模型构建模块、第二模型构建模块、总控模块、信息发模块与排名展示模块;
所述原始数据采集模块用于进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理,之后将处理后的原始数据发送到第一模型构建模块;
所述原始数据采集模块采集的原始数据包括模型三级指标,所述模型三级指标均为原始数据评价指标,收集电力侧及政府侧样本企业用户的用电、金融等原始数据,对其进行清洗整理,为下一步指标及指数的计算建立数据源,其具体包括采用数据可视化,剔除统计意义弱以及明显异常的数据;采用回归拟合法,补齐缺失数据;采用数据归一化,消除量纲差异;
所述原始数据预处理的过程如下:
步骤一:进行数据剔除:获取原始数据后,对于统计意义弱的指标进行剔除,其中数据一致率高于95%即定义为统计意义弱,数据一致率定义为:Pd=Ds/Da其中:Ds为同一指标中一致的数据量;Da为同一指标所有数据量。
同时,对指标中个别异常数据进行剔除,比如超出数倍均值的企业指标数据,确保数据的可信度;
步骤二:缺失数据补齐:对于某企业的某一指标,如缺失个别月份数据,则根据三次样条插值简称Spline差值法补齐缺失值,获得完成可运行的数据;
步骤三:正向化处理:即将所有类型的指标都转化为效益型指标,主要是针对成本型指标,需将其转化为效益型指标;
对于成本型指标数据,需进行如下转化:Dij'=-Dij其中:Dij为一指标数据;
步骤四:一化处理:为消除不同指标量纲的影响,实现统一评判,需对数据进行归一化处理,本文采用均值法处理各指标数据。指标数据均值化是指利用每一指标数据去除同一指标全体数据的平均值得到新序列矩阵;
步骤五:根据企业的行业属性,将样本企业进行分类,得到多个单一行业指标数据矩阵;
所述第一模型构建模块接收到处理后的原始数据后对其进行计算处理生成二级指标与三级指标;
所述第一模型构建模块处理出的二级指标与三级指标被发送到第二模型构建模块;
所述第二模型构建模块对的二级指标与三级指标进行处理构建出一级指标,并对一级指标我进行处理得到行业指数信息;
所述指数信息生成后所述总控模块控制信息发送模块将指数信息发送到排名展示模块进行行业指数排名展示。
优选的,所述第一模型构建模块处理的二级指标与三级指标过程如下:根据生产建议,结合指标的属性,确定模型二级指标与三级指标的隶属关系,确定每个二级指标对应的三级原始数据指标种类,然后,采用向量夹角余弦法确定权重,加权形成二级指标,通过对同一行业的企业二级指标进行叠加,同步得到行业发展二级指标。
优选的,所述二级指标与三级指标的具体生成过程如下:
S1:确定样本数据:同一行业中,每个二级指标k(k=1,2,…,p)包含n个样本企业,m个原始属性指标构成三级指标矩阵Ak,Ak=(aij)n×m;
S2:确定最优、最劣序列:由于所有指标为正类属性,其指标值越大性能越优,选取各序列的最大值为最优参考序列U,选取各序列的最小值为最劣序列L。得到最优序列和最劣序列分别为:U=(ui)=max(uij)与L=(li)=min(lij);
S3:确定最优、最劣偏差率矩阵:根据确定的最优、最劣序列,确定最优偏差率矩阵R、最劣偏差值矩阵S,即: S4:确定指标权重:指标权重是指该评价指标在整个评价体系中的重要程度,可通过指标权重对被评价对象重要程度从不同侧面进行定量分析。则关于指标k的权重,取最优偏差率矩阵R对应的列向量rj及最劣偏差率矩阵S对应的列向量sj,求2个列向量的夹角余弦值:归一化可得指标的权重向量:权重越大,表示在m个属性指标中属性指标j对二级指标的影响程度越大,对指标评价贡献度越大;S5:计算单个企业二级指标:根据二级、三级指标隶属关系以及相应权重,可以得到企业每个月的二级指标:Z=(zij)=(wj*aij)由于四类二级指标均是基于当月的状态指标,为考虑历史因素,对企业的二级指标评分中需进行历史评分修正;修正公式为:Yn=k*Sn-1+k2*Sn-2+…;其中,Yn为修正分,Sn-1为上一月度某一项二级指标评分,Sn-2为上上月度某一项二级指标评分,k为系数且0<k<1,暂取k=0.5,修正后的评分Y仍用Z表示;S6:计算行业二级指标:通过对同行业内企业二级指标进行累加,可以得到历月的行业二级指标值:H=(hj)=sum(zij)/n。
所述第二模型构建模块构建第一指标的过程如下:使用合成指数方法,首先得到一级指标中的企业发展指数,再通过聚集同行业企业发展指数合成行业发展指数。具体方法是:利用得到的企业二级指标,使用主成分分析法,计算出t个二级指标的系数权重,最后合成行业发展指数。
所述行业发展指数的具体处理过程如下:
SS2:相关系数矩阵Rz的特征值和特征向量:由|RZ-λE|=0得到t个特征值λ1,λ2,…,λt,可以求出特征值以及相应的特征向量,其大小反映了各主成分的影响力,把特征值按从大到小顺序排列得到λ1≥λ2≥…≥λt,再分别求出对应特征值的特征向量[e1,e2,…,et];
SS3:方差贡献率:根据相关系数矩阵RZ的特征值求出方差贡献率,并从大到小依次计算累计方差贡献率,当前r个主成分的累计方差贡献率大于等于95%时,即
则最终选取这r个主成分,方可综合体现总体指标;
SS4:获取企业发展指数:计算n个企业的主成分:M=RZ×[e1,e2,...,er],再计算企业历月一级评价指标:
得到同行业企业历月综合评价指数,同理,对由于一级指标均是基于当月的状态指标,为考虑历史因素,需对企业的一级指标进行历史评分修正,对Fi进行排序,即可得到同行业企业综合评价排名。
修正公式为:
In=k*Fn-1+k2*Fn-2+…
其中,In为修正分,Fn-1为上一月度某一项二级指标评分,Fn-2为上上月度某一项二级指标评分,以此类推,k为系数且0<k<1,暂取k=0.5,为表述一致,修正后的评分In仍用Fn表示;
SS5:获取行业发展指数:对统一行业的企业发展指数按照每月进行累计求平均,可以得到历月行业发展指数:
其中,n为同行业内企业个数。
所述排名展示模块的具体展示过程如下:将获取到最终的企业发展指数进行从大到小的排序,提取出企业发展指数的前x名进行展示,x≥4,企业发展指数的前x名均展示在排名展示模块上,同时企业发展指数最大的前三名的展示字体为预设颜色的加粗字体。
一种行业指数分析管理系统的分析方法,包括以下步骤:
步骤一:先进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理;
步骤二:处理后的原始数据发送到第一模型构建模块,第一模型构建模块进行处理生成二级指标与三级指标;
步骤三:生成后的二级指标与三级指标被发送到第二模型构建模块进行处理;
步骤四:第二模型构建模块对获取到二级指标与三级指标进行处理生成一级指标;
步骤五:对一级指标件处理生成企业发展指数,之后再对企业发展指数进行综合处理生成行业发展指数;
步骤六:行业发展指数生成后对其进行排名并展示。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.一种行业指数分析管理系统,其特征在于,包括原始数据采集模块,原始数据预处理模块,第一模型构建模块、第二模型构建模块、总控模块、信息发模块与排名展示模块;
所述原始数据采集模块用于进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理,之后将处理后的原始数据发送到第一模型构建模块;
所述原始数据采集模块采集的原始数据包括模型三级指标,所述模型三级指标均为原始数据评价指标,收集电力侧及政府侧样本企业用户的用电、金融等原始数据,对其进行清洗整理,为下一步指标及指数的计算建立数据源,其具体包括采用数据可视化,剔除统计意义弱以及明显异常的数据;采用回归拟合法,补齐缺失数据;采用数据归一化,消除量纲差异;
所述原始数据预处理的过程如下:
步骤一:进行数据剔除:获取原始数据后,对于统计意义弱的指标进行剔除,其中数据一致率高于95%即定义为统计意义弱,数据一致率定义为:Pd=Ds/Da其中:Ds为同一指标中一致的数据量;Da为同一指标所有数据量。
同时,对指标中个别异常数据进行剔除,比如超出数倍均值的企业指标数据,确保数据的可信度;
步骤二:缺失数据补齐:对于某企业的某一指标,如缺失个别月份数据,则根据三次样条插值简称Spline差值法补齐缺失值,获得完成可运行的数据;
步骤三:正向化处理:即将所有类型的指标都转化为效益型指标,主要是针对成本型指标,需将其转化为效益型指标;
对于成本型指标数据,需进行如下转化:Dij'=-Dij其中:Dij为一指标数据;
步骤四:一化处理:为消除不同指标量纲的影响,实现统一评判,需对数据进行归一化处理,本文采用均值法处理各指标数据。指标数据均值化是指利用每一指标数据去除同一指标全体数据的平均值得到新序列矩阵;
步骤五:根据企业的行业属性,将样本企业进行分类,得到多个单一行业指标数据矩阵;
所述第一模型构建模块接收到处理后的原始数据后对其进行计算处理生成二级指标与三级指标;
所述第一模型构建模块处理出的二级指标与三级指标被发送到第二模型构建模块;
所述第二模型构建模块对的二级指标与三级指标进行处理构建出一级指标,并对一级指标我进行处理得到行业指数信息;
所述指数信息生成后所述总控模块控制信息发送模块将指数信息发送到排名展示模块进行行业指数排名展示。
2.根据权利要求1所述的一种行业指数分析管理系统,其特征在于:所述第一模型构建模块处理的二级指标与三级指标过程如下:根据生产建议,结合指标的属性,确定模型二级指标与三级指标的隶属关系,确定每个二级指标对应的三级原始数据指标种类,然后,采用向量夹角余弦法确定权重,加权形成二级指标,通过对同一行业的企业二级指标进行叠加,同步得到行业发展二级指标。
3.根据权利要求2所述的一种行业指数分析管理系统,其特征在于:所述二级指标与三级指标的具体生成过程如下:
S1:确定样本数据:同一行业中,每个二级指标k(k=1,2,…,p)包含n个样本企业,m个原始属性指标构成三级指标矩阵Ak,Ak=(aij)n×m;
S2:确定最优、最劣序列:由于所有指标为正类属性,其指标值越大性能越优,选取各序列的最大值为最优参考序列U,选取各序列的最小值为最劣序列L。得到最优序列和最劣序列分别为:U=(ui)=max(uij)与L=(li)=min(lij);
S4:确定指标权重:指标权重是指该评价指标在整个评价体系中的重要程度,可通过指标权重对被评价对象重要程度从不同侧面进行定量分析。则关于指标k的权重,取最优偏差率矩阵R对应的列向量rj及最劣偏差率矩阵S对应的列向量sj,求2个列向量的夹角余弦值:
归一化可得指标的权重向量:
S5:计算单个企业二级指标:根据二级、三级指标隶属关系以及相应权重,可以得到企业每个月的二级指标:
Z=(zij)=(wj*aij)
由于四类二级指标均是基于当月的状态指标,为考虑历史因素,对企业的二级指标评分中需进行历史评分修正;
修正公式为:Yn=k*Sn-1+k2*Sn-2+…;
其中,Yn为修正分,Sn-1为上一月度某一项二级指标评分,Sn-2为上上月度某一项二级指标评分,k为系数且0<k<1,暂取k=0.5,修正后的评分Y仍用Z表示;
S6:计算行业二级指标:通过对同行业内企业二级指标进行累加,可以得到历月的行业二级指标值:
H=(hj)=sum(zij)/n。
4.根据权利要求1所述的一种行业指数分析管理系统,其特征在于:所述第二模型构建模块构建第一指标的过程如下:使用合成指数方法,首先得到一级指标中的企业发展指数,再通过聚集同行业企业发展指数合成行业发展指数。具体方法是:利用得到的企业二级指标,使用主成分分析法,计算出t个二级指标的系数权重,最后合成行业发展指数。
5.根据权利要求4所述的一种行业指数分析管理系统,其特征在于:所述行业发展指数的具体处理过程如下:
SS2:相关系数矩阵Rz的特征值和特征向量:由|RZ-λE|=0得到t个特征值λ1,λ2,…,λt,可以求出特征值以及相应的特征向量,其大小反映了各主成分的影响力,把特征值按从大到小顺序排列得到λ1≥λ2≥…≥λt,再分别求出对应特征值的特征向量[e1,e2,…,et];
则最终选取这r个主成分,方可综合体现总体指标;
SS4:获取企业发展指数:计算n个企业的主成分:M=RZ×[e1,e2,...,er],再计算企业历月一级评价指标:
得到同行业企业历月综合评价指数,同理,对由于一级指标均是基于当月的状态指标,为考虑历史因素,需对企业的一级指标进行历史评分修正,对Fi进行排序,即可得到同行业企业综合评价排名。
修正公式为:
In=k*Fn-1+k2*Fn-2+…
其中,In为修正分,Fn-1为上一月度某一项二级指标评分,Fn-2为上上月度某一项二级指标评分,以此类推,k为系数且0<k<1,暂取k=0.5,为表述一致,修正后的评分In仍用Fn表示;
SS5:获取行业发展指数:对统一行业的企业发展指数按照每月进行累计求平均,可以得到历月行业发展指数:
其中,n为同行业内企业个数。
6.根据权利要求1所述的一种行业指数分析管理系统,其特征在于:所述排名展示模块的具体展示过程如下:将获取到最终的企业发展指数进行从大到小的排序,提取出企业发展指数的前x名进行展示,x≥4,企业发展指数的前x名均展示在排名展示模块上,同时企业发展指数最大的前三名的展示字体为预设颜色的加粗字体。
7.一种行业指数分析管理系统的分析方法,其特征在于:包括以下步骤:
步骤一:先进行原始数据的采集,并将采集到的原始数据发生到数据处理模块进行数据处理;
步骤二:处理后的原始数据发送到第一模型构建模块,第一模型构建模块进行处理生成二级指标与三级指标;
步骤三:生成后的二级指标与三级指标被发送到第二模型构建模块进行处理;
步骤四:第二模型构建模块对获取到二级指标与三级指标进行处理生成一级指标;
步骤五:对一级指标件处理生成企业发展指数,之后再对企业发展指数进行综合处理生成行业发展指数;
步骤六:行业发展指数生成后对其进行排名并展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110110632.3A CN112734295A (zh) | 2021-01-27 | 2021-01-27 | 一种行业指数分析管理系统及分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110110632.3A CN112734295A (zh) | 2021-01-27 | 2021-01-27 | 一种行业指数分析管理系统及分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112734295A true CN112734295A (zh) | 2021-04-30 |
Family
ID=75593609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110110632.3A Pending CN112734295A (zh) | 2021-01-27 | 2021-01-27 | 一种行业指数分析管理系统及分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112734295A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114331308A (zh) * | 2021-08-12 | 2022-04-12 | 国网安徽省电力有限公司蚌埠供电公司 | 一种基于电力大数据的自贸区发展分析系统及其构建方法 |
CN117251745A (zh) * | 2023-11-17 | 2023-12-19 | 山东顺国电子科技有限公司 | 深度学习的大数据智能化标准管理方法、系统及存储介质 |
CN118691234A (zh) * | 2024-08-27 | 2024-09-24 | 金恒智控管理咨询集团股份有限公司 | 一种企业内控管理系统的数据评价方法 |
CN118691234B (zh) * | 2024-08-27 | 2024-10-22 | 金恒智控管理咨询集团股份有限公司 | 一种企业内控管理系统的数据评价方法 |
-
2021
- 2021-01-27 CN CN202110110632.3A patent/CN112734295A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114331308A (zh) * | 2021-08-12 | 2022-04-12 | 国网安徽省电力有限公司蚌埠供电公司 | 一种基于电力大数据的自贸区发展分析系统及其构建方法 |
CN117251745A (zh) * | 2023-11-17 | 2023-12-19 | 山东顺国电子科技有限公司 | 深度学习的大数据智能化标准管理方法、系统及存储介质 |
CN118691234A (zh) * | 2024-08-27 | 2024-09-24 | 金恒智控管理咨询集团股份有限公司 | 一种企业内控管理系统的数据评价方法 |
CN118691234B (zh) * | 2024-08-27 | 2024-10-22 | 金恒智控管理咨询集团股份有限公司 | 一种企业内控管理系统的数据评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112734295A (zh) | 一种行业指数分析管理系统及分析方法 | |
CN104318482A (zh) | 一套智能配电网综合评估体系和方法 | |
CN107563645A (zh) | 一种基于大数据的金融风险分析方法 | |
CN112614011B (zh) | 电力配网物资需求预测方法和装置、存储介质及电子设备 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN106980906B (zh) | 一种基于spark的Ftrl电压预测方法 | |
CN105303311B (zh) | 基于数据包络分析的评估指标选取方法及装置 | |
CN111081353A (zh) | 一种自动化在线学习智能辅助标注医学影像的方法和系统 | |
CN116883065A (zh) | 商户风险预测方法及装置 | |
CN112559591B (zh) | 一种用于冷轧辊制造过程的离群检测系统及其检测方法 | |
CN116595102B (zh) | 一种改进聚类算法的大数据管理方法及系统 | |
CN113918727A (zh) | 一种基于知识图谱和迁移学习的施工项目知识转移方法 | |
CN113435713A (zh) | 基于gis技术和两模型融合的风险地图编制方法及系统 | |
CN117035710A (zh) | 人才评估量化方法、系统、设备及介质 | |
CN115713270B (zh) | 一种同行互评异常评分检测及修正方法和装置 | |
CN114610234B (zh) | 一种存储系统参数推荐方法及相关装置 | |
CN115409541A (zh) | 基于数据血缘的卷烟品牌数据处理方法 | |
CN113947278A (zh) | 医院专科决策支持系统、方法及相应设备和存储介质 | |
CN112215514A (zh) | 一种经营分析报告生成方法及系统 | |
CN112308340A (zh) | 电力数据处理方法及装置 | |
CN111177205A (zh) | 一种新能源场站数据共享方法及系统 | |
CN111144910B (zh) | 基于模糊熵均值阴影集的招投标“串标、陪标”对象推荐方法及装置 | |
CN114896520B (zh) | 一种基于元社区一致性的集成社区检测方法及系统 | |
CN109102212A (zh) | 对电网企业运营监测业务数据资产进行价值评价的方法 | |
Wei et al. | An innovative multi-factor prediction algorithm construction and importance analysis model based on GBDT-LightGBM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210430 |