CN113743705A - 基于因子回归分析的储检配一体化诊断指标分类与筛选方法 - Google Patents

基于因子回归分析的储检配一体化诊断指标分类与筛选方法 Download PDF

Info

Publication number
CN113743705A
CN113743705A CN202110241162.4A CN202110241162A CN113743705A CN 113743705 A CN113743705 A CN 113743705A CN 202110241162 A CN202110241162 A CN 202110241162A CN 113743705 A CN113743705 A CN 113743705A
Authority
CN
China
Prior art keywords
factor
index
storage
inspection
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110241162.4A
Other languages
English (en)
Inventor
郑建华
罗拥军
郭伟
韩飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Anfang Electric Power Technology Co ltd
Original Assignee
Jiangsu Anfang Electric Power Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Anfang Electric Power Technology Co ltd filed Critical Jiangsu Anfang Electric Power Technology Co ltd
Priority to CN202110241162.4A priority Critical patent/CN113743705A/zh
Publication of CN113743705A publication Critical patent/CN113743705A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Abstract

基于因子回归分析的储检配一体化诊断指标分类与筛选方法,包括如下步骤:根据储检配一体化指标向量,结合公共因子和特殊因子对其进行初步因子分析;将储检配一体化的成本型指标转化为效益型指标,并进行归一化处理,得到储检配一体化诊断评估标准化指标;对储检配一体化诊断指标样本数据进行KMO统计量检验,然后对储检配一体化诊断指标样本进行因子分析,得到储检配一体化诊断指标的公共因子,根据公共因子包含的多个关系相近的评估指标对储检配一体化诊断指标进行分类;剔除变量以对分类好的指标进行筛选,得出最终的诊断指标。本方法着重改进了数据挖掘与处理,更好地实现诊断指标的分类和筛选,能够提高后续评估模型的精度。

Description

基于因子回归分析的储检配一体化诊断指标分类与筛选方法
技术领域
本发明涉及仓储管理领域,具体涉及一种基于因子回归分析的储检配一体化诊断指标分类与筛选方法。
背景技术
在储检配一体化诊断评估的过程中,可以收集到与评估相关的大量指标数据与直接运行数据。这些数据中包含着大量的信息,能够全面的反映各种指标对于储检配一体化评估的作用,但大多数情况下得到的指标类型复杂,相互之间存在一定的相关性,对评估工作的贡献程度也不尽相同。并且,一些评估对象不同的指标实际并没有体现影响储检配一体化诊断的不同因素,而是储检配一体化影响因素在不同方面的表现。因此,直接运用这些收集到的指标会影响评估模型的精度,忽略了数据挖掘与处理的重要性。
发明内容
本发明针对上述背景技术中存在的问题,提出一种基于因子回归分析的储检配一体化诊断指标分类与筛选方法,着重改进了数据挖掘与处理,更好地实现诊断指标的分类和筛选,能够提高后续评估模型的精度。
基于因子回归分析的储检配一体化诊断指标分类与筛选方法,包括如下步骤:
步骤1,根据储检配一体化指标向量,结合公共因子和特殊因子对其进行初步因子分析;
步骤2,将储检配一体化的成本型指标转化为效益型指标,并进行归一化处理,以消除指标间的量纲差异,得到储检配一体化诊断评估标准化指标;
步骤3,通过对储检配一体化诊断指标样本数据进行KMO统计量检验,然后对储检配一体化诊断指标样本进行因子分析,得到储检配一体化诊断指标的公共因子,根据公共因子包含的多个关系相近的评估指标对储检配一体化诊断指标进行分类;
步骤4,剔除变量以对分类好的指标进行筛选,得出最终的诊断指标。
进一步地,步骤1中,假定p维随机储检配一体化指标向量满足X=μ+Af=e;
f=(f1,f2,...,fq)T是q维随机变量,q≤p,满足Ef=0,EffT=Iq,它的分量fi称为公共因子,对X的每个分量都起作用;e= (e1,e2,...,eq)T是p维不可观测的随机向量,满足Ee=0,
Figure 1
且EfeT=0,e的分量ei称为特殊因子,它仅对X的分量Xi起作用;μ和A为参数矩阵;
若X满足上式,则称随机向量X具有因子结构,算得:
Var(X)=AAT+∑
矩阵A称为因子载荷,其元素aij是第i个分量Xi在第j个因子fj上的载荷;记
Figure RE-GDA0003343360830000022
则有:
Figure RE-GDA0003343360830000023
Figure RE-GDA0003343360830000024
反映了公共因子对Xi的影响,称为公共因子对Xi的贡献,当
Figure RE-GDA0003343360830000031
时,表示公共因子对Xi的影响大于特殊因子ei的影响,即
Figure RE-GDA0003343360830000032
反映了分量Xi对公共因子fi的依赖程度;
对一个指定的公共因子fi,记
Figure RE-GDA0003343360830000033
称为公共因子fi对X 的贡献;
Figure RE-GDA0003343360830000034
的值越大,反映了公共因子fi对X的影响也越大。
进一步地,步骤2中,设储检配一体化诊断评估的样本个数为q,指标个数为m,设效益型与成本型指标的集合为V1和V2,第i个样本的第j个指标值的Max-Min归一化结果为:
Figure RE-GDA0003343360830000035
其中,xij和xij′分别为同趋势化前后的指标值;
Figure RE-GDA0003343360830000036
为指标映射归一化所能达到的最大值,
Figure RE-GDA0003343360830000037
为指标映射归一化所能达到的最小值,一般情况下
Figure RE-GDA0003343360830000038
得到储检配一体化诊断评估同趋势化的指标值后,在进行因子分析前,需再计算标准化的指标值xij″。
Figure RE-GDA0003343360830000039
进一步地,步骤3具体流程为:判断指标样本的标准化数据的 KMO值是否大于0.7,若否则更新样本数据并增加样本容量以进行重新判断,若是则求出样本的相关矩阵及其特征值,然后选择指标使累积方差贡献率大于0.85,并求取特征值的特征向量,计算因子载荷矩阵并确认分类物理意义是否明确,明确后根据矩阵将指标归入不同分类,最终输出分类结果。
进一步地,分类物理意义不明确时,将因子载荷矩阵进行转置并重新计算。
进一步地,步骤4中,设第i个分类fi下所属指标数为mi,共有 p组样本数据;则自变量Xi为p×mi阶,因子分类得到的第i个分类因子为yi,得到多元线性回归模型为:
Figure RE-GDA0003343360830000041
其中,βi与βi′分别为mi×1阶的回归模型系数及估计值;μi为p×1阶随机误差;通过t检验,对回归模型中的变量进行检验,以剔除冗余的储检配一体化诊断评估指标,保留剩下的指标作为模型的解释变量; t检验第j个指标的统计量为:
Figure RE-GDA0003343360830000042
保留满足tj>tα,p的指标j,剔除tj<tα,p的指标;通过储检配一体化诊断评估指标的选取、分类与筛选,综合得出最终的现状诊断指标体系。
本发明达到的有益效果为:提出基于因子回归分析的储检配一体化诊断指标分类与筛选方法,着重改进了数据挖掘与处理,更好地实现诊断指标的分类和筛选,能够提高后续评估模型的精度。
附图说明
图1为本发明实施例中储检配一体化诊断指标分类流程图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
在储检配一体化诊断评估的过程中,可以收集到与评估相关的大量指标数据与直接运行数据。这些数据中包含着大量的信息,能够全面的反映各种指标对于储检配一体化评估的作用,但可以看出,大多数情况下,得到的指标类型复杂,相互之间存在一定的相关性,对评估工作的贡献程度也不尽相同。并且,一些评估对象不同的指标实际并没有体现影响储检配一体化诊断的不同因素,而是储检配一体化影响因素在不同方面的表现。因此,直接运用这些收集到的指标会影响评估模型的精度,忽略了数据挖掘与处理的重要性。本文采用因子分析法研究挖掘储检配一体化指标中存在的相关性信息。
因子分析法(Factor Analyze,FA)是简化、分析高维数据的一种统计方法,是研究从变量群中提取共性因子的统计技术。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。其基本原理可以概括为根据相关性大小对变量进行分组,使同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表了一个基本结构,称为公共因子。公共因子在互相不具有相关关系的情况下同时保留原有指标的主要信息。针对储检配一体化的大体量指标,可以使用因子分析法对各项指标提取公共因子,将相关性较大指标分为一类,减小各分类组指标之间的相关性。
假定p维随机储检配一体化指标向量满足:
X=μ+Af=e
f=(f1,f2,...,fq)T是q维随机变量,q≤p,满足Ef=0,EffT=Iq,它的分量fi称为公共因子,对X的每个分量都起作用。e= (e1,e2,...,eq)T是p维不可观测的随机向量,满足:
Ee=0,
Figure 1
且EfeT=0,e的分量ei称为特殊因子,它仅对X的分量Xi起作用。μ和A为参数矩阵。若X满足上式,则称随机向量X具有因子结构。这是,容易算得:
Var(X)=AAT+∑
矩阵A称为因子载荷,其元素aij是第i个分量Xi在第j个因子fj上的载荷。记
Figure RE-GDA0003343360830000062
则有:
Figure RE-GDA0003343360830000063
由此可见,
Figure RE-GDA0003343360830000064
反映了公共因子对Xi的影响,称为公共因子对Xi的“贡献”。当
Figure RE-GDA0003343360830000065
时,辨明公共因子对Xi的影响大于特殊因子ei的影响,也可以看出
Figure RE-GDA0003343360830000066
反映了分量Xi对公共因子fi的依赖程度。另一方面,对一个指定的公共因子fi,记
Figure RE-GDA0003343360830000067
称为公共因子fi对X的贡献。
Figure RE-GDA0003343360830000068
的值越大,反映了公共因子fi对X的影响也越大,所以
Figure RE-GDA0003343360830000069
是衡量公共因子重要性的一个尺度。
考虑到储检配一体化诊断评估的各指标存在不同的量纲和趋势,指标间不具有可比性。应将成本型指标转化为效益型指标,并进行归一化处理,以消除指标将的量纲差异。设储检配一体化诊断评估的样本个数为q,指标个数为m,设效益型与成本型指标的集合为V1和V2,第i个样本的第j个指标值的Max-Min归一化结果为:
Figure RE-GDA0003343360830000071
其中,xij和xij′分别为同趋势化前后的指标值;
Figure RE-GDA0003343360830000072
为指标映射归一化所能达到的最大值,
Figure RE-GDA0003343360830000073
为指标映射归一化所能达到的最小值,一般情况下
Figure RE-GDA0003343360830000074
得到储检配一体化诊断评估同趋势化的指标值后,在进行因子分析前,需再计算标准化的指标值xij″:
Figure RE-GDA0003343360830000075
得到储检配一体化诊断评估标准化指标后,通过对储检配一体化诊断指标样本数据进行KMO(Kaiser Meyer Olkin)统计量检验。KMO 是用于比较变量间的简单相关和偏相关系数的指标,当所有变量间的简单相关系数平方和远大于偏相关系数平方和时,其值越接近于1,即变量间的相关性越强,原有变量越适用于进行因子分析。KMO值大于0.8时,其表示适用于进行因子分析。对储检配一体化诊断指标样本进行因子分析可得到储检配一体化诊断指标的公共因子,这些因子包含多个关系相近的评估指标,由此可对储检配一体化诊断指标进行分类。其具体实现流程如图1所示。
采用因子分析对储检配一体化诊断指标进行分类之后,考虑到指标选取过多会增加模型的复杂度与计算量。当自变量之间存在着严重的多重共线性时,回归系数的估计值对样本数据的微小变化将变得非常敏感,使得稳定性变得很差。多重共线性的解决有多种经验性方法,这些方法因模型和样本数据的不同而各异,其中一类比较常用而且简单的办法是“剔除变量法”,即剔除引起多重共线性的解释变量,以达到解决多重共线性问题的目的。因此,为找出储检配一体化诊断评估指标每个分类下具有一定冗余度的指标,还须对分类好的指标进行筛选。设第i个分类fi下所属指标数为mi,共有p组样本数据。则自变量Xi为p×mi阶,因子分类得到的第i个分类因子为yi,得到多元线性回归模型为:
Figure RE-GDA0003343360830000081
其中,βi与βi′分别为mi×1阶的回归模型系数及估计值;μi为p×1阶随机误差。通过t检验,对回归模型中的变量进行检验,以剔除冗余的储检配一体化诊断评估指标,保留剩下的指标作为模型的解释变量。 t检验第j个指标的统计量为:
Figure RE-GDA0003343360830000091
保留满足tj>tα,p的指标j,剔除tj<tα,p的指标。通过储检配一体化诊断评估指标的选取、分类与筛选,综合得出最终的现状诊断指标体系。
以上所述仅为本发明的较佳实施方式,本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

Claims (6)

1.基于因子回归分析的储检配一体化诊断指标分类与筛选方法,其特征在于:所述方法包括如下步骤:
步骤1,根据储检配一体化指标向量,结合公共因子和特殊因子对其进行初步因子分析;
步骤2,将储检配一体化的成本型指标转化为效益型指标,并进行归一化处理,以消除指标间的量纲差异,得到储检配一体化诊断评估标准化指标;
步骤3,通过对储检配一体化诊断指标样本数据进行KMO统计量检验,然后对储检配一体化诊断指标样本进行因子分析,得到储检配一体化诊断指标的公共因子,根据公共因子包含的多个关系相近的评估指标对储检配一体化诊断指标进行分类;
步骤4,剔除变量以对分类好的指标进行筛选,得出最终的诊断指标。
2.根据权利要求1所述的基于因子回归分析的储检配一体化诊断指标分类与筛选方法,其特征在于:步骤1中,假定p维随机储检配一体化指标向量满足X=μ+Af=e;
f=(f1,f2,...,fq)T是q维随机变量,q≤p,满足Ef=0,EffT=Iq,它的分量fi称为公共因子,对X的每个分量都起作用;e= (e1,e2,...,eq)T是p维不可观测的随机向量,满足 Ee=0,
Figure DEST_PATH_1
且EfeT=0,e的分量ei称为特殊因子,它仅对X的分量Xi起作用;μ和A为参数矩阵;
若X满足上式,则称随机向量X具有因子结构,算得:
var(X)=AAT+∑
矩阵A称为因子载荷,其元素aij是第i个分量Xi在第j个因子fj上的载荷;记
Figure RE-FDA0003343360820000021
则有:
Figure RE-FDA0003343360820000022
Figure RE-FDA0003343360820000023
反映了公共因子对Xi的影响,称为公共因子对Xi的贡献,当
Figure RE-FDA0003343360820000024
时,表示公共因子对Xi的影响大于特殊因子ei的影响,即
Figure RE-FDA0003343360820000025
反映了分量Xi对公共因子fi的依赖程度;
对一个指定的公共因子fi,记
Figure RE-FDA0003343360820000026
称为公共因子fi对X的贡献;
Figure RE-FDA00033433608200000211
的值越大,反映了公共因子fi对X的影响也越大。
3.根据权利要求1所述的基于因子回归分析的储检配一体化诊断指标分类与筛选方法,其特征在于:步骤2中,设储检配一体化诊断评估的样本个数为q,指标个数为m,设效益型与成本型指标的集合为V1和V2,第i个样本的第j个指标值的Max-Min归一化结果为:
Figure RE-FDA0003343360820000027
其中,xij和xij′分别为同趋势化前后的指标值;
Figure RE-FDA0003343360820000028
为指标映射归一化所能达到的最大值,
Figure RE-FDA0003343360820000029
为指标映射归一化所能达到的最小值,一般情况下
Figure RE-FDA00033433608200000210
得到储检配一体化诊断评估同趋势化的指标值后,在进行因子分析前,需再计算标准化的指标值xij″。
Figure RE-FDA0003343360820000031
4.根据权利要求1所述的基于因子回归分析的储检配一体化诊断指标分类与筛选方法,其特征在于:步骤3具体流程为:判断指标样本的标准化数据的KMO值是否大于0.7,若否则更新样本数据并增加样本容量以进行重新判断,若是则求出样本的相关矩阵及其特征值,然后选择指标使累积方差贡献率大于0.85,并求取特征值的特征向量,计算因子载荷矩阵并确认分类物理意义是否明确,明确后根据矩阵将指标归入不同分类,最终输出分类结果。
5.根据权利要求4所述的基于因子回归分析的储检配一体化诊断指标分类与筛选方法,其特征在于:分类物理意义不明确时,将因子载荷矩阵进行转置并重新计算。
6.根据权利要求1所述的基于因子回归分析的储检配一体化诊断指标分类与筛选方法,其特征在于:步骤4中,设第i个分类fi下所属指标数为mi,共有p组样本数据;则自变量Xi为p×mi阶,因子分类得到的第i个分类因子为yi,得到多元线性回归模型为:
Figure RE-FDA0003343360820000032
其中,βi与βi′分别为mi×1阶的回归模型系数及估计值;μi为p×1阶随机误差;通过t检验,对回归模型中的变量进行检验,以剔除冗余的储检配一体化诊断评估指标,保留剩下的指标作为模型的解释变量;t检验第j个指标的统计量为:
Figure RE-FDA0003343360820000041
保留满足tj>tα,p的指标j,剔除tj<tα,p的指标;通过储检配一体化诊断评估指标的选取、分类与筛选,综合得出最终的现状诊断指标体系。
CN202110241162.4A 2021-03-04 2021-03-04 基于因子回归分析的储检配一体化诊断指标分类与筛选方法 Pending CN113743705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110241162.4A CN113743705A (zh) 2021-03-04 2021-03-04 基于因子回归分析的储检配一体化诊断指标分类与筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110241162.4A CN113743705A (zh) 2021-03-04 2021-03-04 基于因子回归分析的储检配一体化诊断指标分类与筛选方法

Publications (1)

Publication Number Publication Date
CN113743705A true CN113743705A (zh) 2021-12-03

Family

ID=78728192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110241162.4A Pending CN113743705A (zh) 2021-03-04 2021-03-04 基于因子回归分析的储检配一体化诊断指标分类与筛选方法

Country Status (1)

Country Link
CN (1) CN113743705A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577681A (zh) * 2013-06-26 2014-02-12 长沙理工大学 基于因子分析锅炉效率影响指标的定量评价方法
CN109191001A (zh) * 2018-09-21 2019-01-11 常州工学院 基于主成分分析的教育质量评价方法
CN109753684A (zh) * 2018-11-29 2019-05-14 国网江苏省电力有限公司盐城供电分公司 一种用于变电站能耗基准修正的多元线性回归建模方法
CN110189031A (zh) * 2019-05-31 2019-08-30 国网山东省电力公司经济技术研究院 一种基于因子回归分析的配电网诊断指标分类方法
US20200282503A1 (en) * 2018-08-28 2020-09-10 Dalian University Of Technology Comprehensive performance evaluation method for cnc machine tools based on improved pull-off grade method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577681A (zh) * 2013-06-26 2014-02-12 长沙理工大学 基于因子分析锅炉效率影响指标的定量评价方法
US20200282503A1 (en) * 2018-08-28 2020-09-10 Dalian University Of Technology Comprehensive performance evaluation method for cnc machine tools based on improved pull-off grade method
CN109191001A (zh) * 2018-09-21 2019-01-11 常州工学院 基于主成分分析的教育质量评价方法
CN109753684A (zh) * 2018-11-29 2019-05-14 国网江苏省电力有限公司盐城供电分公司 一种用于变电站能耗基准修正的多元线性回归建模方法
CN110189031A (zh) * 2019-05-31 2019-08-30 国网山东省电力公司经济技术研究院 一种基于因子回归分析的配电网诊断指标分类方法

Similar Documents

Publication Publication Date Title
Zhang et al. Quantile-regression-based clustering for panel data
CN111626821B (zh) 基于集成特征选择实现客户分类的产品推荐方法及系统
WO2023056723A1 (zh) 故障诊断的方法、装置、电子设备及存储介质
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN111563821A (zh) 一种基于支持向量机量化投资的金融股票涨跌预测方法
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN107807221A (zh) 一种地球化学普查实验室样品分析的异常点抽查检查方法
CN114385465A (zh) 一种故障预测方法、设备及存储介质
CN108090635B (zh) 一种基于聚类分类的路用性能预测方法
CN116578677B (zh) 一种针对医疗检验信息的检索系统和方法
CN110990384B (zh) 一种大数据平台bi分析方法
CN113743705A (zh) 基于因子回归分析的储检配一体化诊断指标分类与筛选方法
CN112434886A (zh) 一种预测客户抵押贷款违约概率的方法
CN111861785A (zh) 一种基于用电特征与离群点检测的专变行业错户识别方法
Mahmoudzadeh et al. The effect of product market competition on the relationship between capital structure and financial performance of companies
CN112131106B (zh) 基于小概率数据的测试数据构造方法及装置
WO2022183019A1 (en) Methods for mitigation of algorithmic bias discrimination, proxy discrimination and disparate impact
CN112348685A (zh) 信用评分方法、装置、设备及存储介质
CN111654853B (zh) 一种基于用户信息的数据分析方法
CN111860642A (zh) 一种不均衡样本分类方法和装置
CN111932142A (zh) 方案分组和数据分组方法、装置、设备及存储介质
CN112445632A (zh) 基于故障数据建模的hpc可靠性评估方法
CN113723835B (zh) 火电厂用水评估方法和终端设备
CN113486742B (zh) 一种故障识别方法、装置、系统及计算机可读存储介质
CN116342300B (zh) 一种保险理赔人员特征分析方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination