CN105303311A - 基于数据包络分析的评估指标选取方法及装置 - Google Patents
基于数据包络分析的评估指标选取方法及装置 Download PDFInfo
- Publication number
- CN105303311A CN105303311A CN201510688168.0A CN201510688168A CN105303311A CN 105303311 A CN105303311 A CN 105303311A CN 201510688168 A CN201510688168 A CN 201510688168A CN 105303311 A CN105303311 A CN 105303311A
- Authority
- CN
- China
- Prior art keywords
- occupancy
- output
- index
- efficiency value
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于数据包络分析的评估指标选取方法及装置。该方法包括:S1、依据指标选取原则确定n个主要投入指标和m个主要产出指标;S2、从n个主要投入指标确定至少两个相关性最强的主要投入指标;S3、利用至少两个主要投入指标与m个主要产出指标建立数据包络分析基础模型;S4、依次利用剩余主要投入指标和上述模型获取每个主要投入指标的效率值;S5、获取效率值变化超过率;S6、若效率值变化超过率超过第二预设值,将对应的主要投入指标引入到模型中形成新的数据包络分析模型并作为数据包络分析基础模型,返回S4;S7、若小于第二预设值将基础模型的主要投入指标作为最终的投入指标。本发明无需人工选择指标,能够提高评估的客观性。
Description
技术领域
本发明涉及一种数据评估方法,尤其涉及一种基于数据包络分析的评估指标选取方法。
背景技术
数据包络分析(DataEnvelopmentAnalysis,DEA)是一种常用的效率评估方法,用于评价一组具有多个投入、多个产出的评估决策单元(DecisionMakingUnits,DMUs)之间的相对效率。1978年,Chames,Cooper和Rhodes提出了第一个DEA模型,这个模型被命名为数据包络分析模型。该模型在评价多投入多产出DMU的规模有效性和技术有效性方面十分有效。
运用数据包络分析方法时需要根据不同的评价目的,选取不同的评价指标。目前,选择评价指标的方法主要包括主成分分析法、因子分析法。其中,Alder和Golany釆用主成分分析法对现有数据进行集成,解决了DEA计算中投入、产出变量过多的问题。匡海波等人应用主成分分析法对港口的投入产出指标进行筛选,用选取的评价指标计算其效率并排序。Azadeh等人使用PCA方法测量每一个指标的重要性,并与DEA方法、数值分类法相结合,用于产品质量评价。但是主成分分析法利用主成分代替原始变量,只能改进原始变量的线性组合,与DEA方法的改进投入与产出指标的目的不相符,不利于管理者及时发现问题。因子分析法可以将多个原始变量缩减成几个解释性较强的因子变量,从而实现计算过程降维的目的。
在计算过程之前,以上方法需要决策者主观确定每个因子变量的属性,人为规定因子变量为投入变量还是产出变量;或只是借鉴别人已有的评价指标,导致评估效率低。由于指标选取未引起决策者的足够重视,导致在指标选取、变量间的相关分析、指标属性确定等方面存在一些问题,需要进一步完善。
发明内容
本发明的其中一个目的在于提供一种基于数据包络分析的评估指标选取方法及装置,以解决现有技术中指标选取需要决策者主观选取以及导致的评估效率低的技术问题。
为实现上述发明目的,本发明实施例提供了一种基于数据包络分析的评估指标选取方法,包括:
S1、收集全部投入指标与产出指标,依据指标选取原则确定n个主要投入指标和m个主要产出指标,n、m为正整数;
S2、对n个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指标;
S3、利用上述至少两个主要投入指标与m个主要产出指标建立数据包络分析基础模型,并利用所述数据包络分析基础模型计算每个评估决策单元的第一效率值;
S4、将剩余的主要投入指标依次引入所述数据包络分析基础模型以获取多个新的数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率值变化超过率;
S6、若所述效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作为数据包络分析基础模型,返回步骤S4;
S7、当所得的效率值变化超过率全部小于所述第二预设值时,将此时数据包络分析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的产出指标。
可选地,当主要产出指标的数量m超过一定值时,步骤S2中还包括对m个主要产出指标做相关性分析,确定相关性最强的两个主要产生指标的步骤。
可选地,步骤S1中采用以下指标选取原则确定n个主要投入指标和m个主要产出指标:
(1)选取的投入指标与产出指标之间需相互关联;
(2)选取的投入指标与产出指标的数值存在且为正值;
(3)评估决策单元的个数要大于等于投入指标与产出指标的数量之和的2倍。
可选地,所述步骤S2中采用皮尔森方法对n个主要投入指标和/或m个主要产出指标作相关性分析,所述皮尔森方法的公式如下:
式中:n为样本量,Xi为第i行主要投入指标的值,为n行主要投入指标的平均值,sX为n行主要投入指标的方差,Yi为第i列主要投入指标的值,为n列主要投入指标的平均值,sX为n列主要投入指标的方差。
可选地,步骤S3中数据包络分析基础模型为:
式中:xi为投入指标,yi为产出指标,λi为第i个指标的权重,θ为效率值,S-为投入松弛变量,S+为产出松弛变量,e和为分别为分量为1的s维列向量、m维列向量,ε为非阿基米德无穷小量。
可选地,步骤S5中采用以下公式计算效率值变化比例:
效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效率值×100%。
可选地,步骤S5中采用以下公式计算效率值变化超过率:
效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入指标的总数)×100%。
第二方面,本发明实施例还提供了一种基于数据包络分析的评估指标选取装置,基于上文所述的评估指标选取方法实现,包括:
主要指标选取模块,用于收集全部投入指标与产出指标,依据指标选取原则确定n个主要投入指标和m个主要产出指标,n、m为正整数;
相关性分析模块,用于对n个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指标;和,
最终指标选取模块,用于执行以下步骤:
S4、将剩余的主要投入指标依次引入所述数据包络分析基础模型,形成多个新的数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率值变化超过率;
S6、若所述效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作为数据包络分析基础模型,返回步骤S4;
S7、当所得的效率值变化超过率全部小于所述第二预设值时,将此时数据包络分析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的产出指标。
可选地,当主要产出指标的数量m超过一定值时,所述相关性分析模块还包括产出指标分析单元,用于对m个主要产出指标做相关性分析,确定相关性最强的两个主要产生指标。
可选地,所述最终指标选取模块包括效率值变化比例计算单元和效率值变化超过率计算单元,其中:
所述效率值变化比例计算单元采用以下公式计算效率值变化比例:
效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效率值×100%;
所述效率值变化超过率计算单元采用以下公式计算效率值变化超过率:
效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入指标的总数)×100%。
本发明实施例根据指标选取原则对全部投入指标与产出指标初步筛选获取n个主要投入指标与m个主要产出指标;对n个主要投入指标进行相关性分析获取两个相关性最强的主要投入指标,利用这两个主要投入指标与m个主要产出指标建立数据包络分析基础模型;将剩余的主要投入指标引入数据包络分析基础模型获取效率值,并最终获取效率值变化超过率,将该效率值变化超过率所对应的主要投入指标引入上述数据包络分析基础模型获取效率值,重复上述步骤,直至效率值变化超过率小于第二预设值为止,此时模型所对应的主要输入指标即为最终的投入指标。本发明实施例运用相关性分析以及效率值变化评判的评估指标选取方法,将提取对效率值影响最大的指标取,从而选择出最为合适的评估指标,不但能够减少评估指标数量,提高指标可采集度,而且还能够提高评估效率。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1是本发明实施例提供的一种基于数据包络分析的评估指标选取方法流程示意图;
图2是本发明实施例提供的一种基于数据包络分析的评估指标选取装置框图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
第一方面,本发明实施例提供了一种基于数据包络分析的评估指标选取方法,如图1所示,包括:
S1、收集全部投入指标与产出指标,依据指标选取原则确定n个主要投入指标和m个主要产出指标,n、m为正整数;
S2、对n个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指标;
S3、利用上述至少两个主要投入指标与m个主要产出指标建立数据包络分析基础模型,并利用数据包络分析基础模型计算多个评估决策单元中每个评估决策单元的第一效率值;
S4、将剩余的主要投入指标依次引入数据包络分析基础模型,每个新的数据包络分析模型的效率值以获取多个新的数据包络分析模型,并分别计算每个新的数据包络分析模型的效率值;;
S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率值变化超过率;
S6、若效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作为数据包络分析基础模型,返回步骤S4;
S7、当所得的效率值变化超过率全部小于第二预设值时;将此时数据包络分析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的产出指标。
可理解的是,步骤S1中“全部投入指标与产出指标”是指与所有评估决策单元存在联系的投入指标与产出指标。
需要说明的是,本发明实施例中步骤S2中只对n个主要投入指标作了相关性分析,以获取相关性最强的两个主要投入指标,而未对m个主要产出指标作相关性分析。当主要产出指标的数量m较少时,采用全部作为最终的产出指标时,并不影响计算速度,此时无需进行相关性分析。当主要产出指标的数量m超过一定值时,为减少产出指标的数据,提高计算速度,可选地,本发明实施例中还可以对m个主要投入指标做相关性分析,以获取最终的产出指标。选取方法与投入指标的选取方法相同,在此不再赘述。
需要说明的是,上文中“一定值”并不是恒定的数值,而是结合使用场景以及计算效率等方面进行合理的设置。本领域的技术人员根据具体的使用场景设置不同的数值,例如:可以设置有5、10或者20,只要最终计算结果能够满足需要即可。
为获取合适的投入指标与产出指标,使所选取的指标能够真实反映生产过程,可选地,步骤S1中采用以下指标选取原则确定n个主要投入指标和m个主要产出指标:
(1)选取的投入指标与产出指标之间需相互关联;
(2)选取的投入指标与产出指标的数值存在且为正值;
(3)评估决策单元的个数要大于等于投入指标与产出指标的数量之和的2倍。
需要说明的是,本发明实施例中通过投入指标与产出指标之间相互关联,可以尽量避免决策者人为选取指标时的任意性与主观性,从而可以为投入指标或者产出指标定义正确的属性。
需要说明的是,投入指标与产出指标需要存在且为正值,是因为数据包络分析基础模型方法是一种效率评价方法,需要通过数据进行表示,若没有数据则无法进行计算。实际应用时,投入指标与产出指标为负值时,不能正确的反映真实的生产过程,因此需要去除。
需要说明的是,数据包络分析基础模型方法指标数量要少,减少因指标数量过多引起的评估决策单元的差异性。例如,当指标数量过多时,有效评估决策单元的个数也比较多,从而大大降低了数据包络分析基础模型方法的区分度;但是指标个数太少,也不利于发现问题,从而无法为决策者提供辅助信息进行决策。因此,本发明实施例中采用评估决策单元的个数要大于等于投入指标与产出指标的数量之和的2倍。
为发现不同指标之间的相关性,本发明实施例中对步骤S1中确定的n个主要投入指标和/或m个主要产出指标作相关性分析。可选地,本发明一个实施例中采用皮尔森(person)方法对n个主要投入指标作相关性分析。其中,皮尔森方法的公式如下:
式中:n为样本量,Xi为第i行主要投入指标的值,为n行主要投入指标的平均值,sX为n行主要投入指标的方差,Yi为第i列主要投入指标的值,为n列主要投入指标的平均值,sX为n列主要投入指标的方差。
需要说明的是,对主要投入指标与主要产出指标进行相关性分析除了皮尔森方法外,还可以采用spearman系数、Kendall系数、聚类分析、判别分析或者回归分析等方法进行分析。本领域技术人员可以根据具体的场合进行选择,本发明不作限定。
为方便计算,可选地,本发明实施例中数据包络分析基础模型采用CCR基础模型,该CCR基础模型如下:
式中:xi为投入指标,yi为产出指标,λi为第i个指标的权重,θ为效率值,S-为投入松弛变量,S+为产出松弛变量,e和为分别为分量为1的s维列向量、m维列向量,ε为非阿基米德无穷小量。
需要说明的是,步骤S3中的数据包络分析基础模型还可以为非线性模型、线性模型以及对偶模型。本领域技术人员可以根据具体场景进行选择,本发明不作限定。
需要说明的是,步骤S5中的效率值变化比例,是指将剩余的主要投入指标引入数据包络分析基础模型中所得的效率值与第一效率值的差值再除以第一效率值得到。也就是说,步骤S5中采用以下公式计算效率值变化比例:
效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效率值×100%。
当该效率值变化比例越小时,说明新引入的主要投入指标对数据包络分析基础模型产生的影响越小;越大时,说明新引入的主要投入指标对数据包络分析基础模型产生的影响越大。实际应用中,皮尔森等人给出的新引入的主要投入指标对模型产生显著影响的标准为10%。即当效率值变化比例超过10%时,说明新引入的主要投入指标对数据包络分析基础模型产生显著的影响。
为方便评价一个主要投入指标对多个评估决策单元产生的影响,本发明实施例中引入了效率值变化超过率。可选地,步骤S5中采用以下公式计算:
效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入指标的总数)×100%。
需要说明的是,第一预设值是指上文中皮尔森等人给出的新引入的主要投入指标对模型产生显著影响的标准为10%。
该效率值变化超过率可以评价一个主要投入指标对多个评估决策单元产生的影响。实际应用中,皮尔森等人给出的标准为15%。当该效率值变化超过率超过15%时,则将该主要投入指标引入到数据包络分析基础模型中,形成新的数据包络分析模型。
下面结合实施例和表格对本发明提供的评估指标选取方法进行详细说明。
装备保障效益投入指标的选取具有很大的主观性,例如投入指标“人力、财力、物力”中的“财力”大都选取的指标为“保障费用”,很少将其做进一步细分,导致无法细致地分析增加或者减少哪些投入,以保证高的保障效益。
本发明实施例中细分投入指标“人力、财力、物力”,“人力”指标细分为:保障人员、高保人员(即高级保障人员)、保障消耗人工小时;“财力”指标细分为:业务费、预防性维修费、自制件和修复件维修费、资源费;“物力”指标细分为:保障设备、保障设施、消耗器材、技术资料、计算机保障资源,共12个投入指标。产出指标为装备完好率、消耗摩托小时和回收摩托小时。上述过程中,对只与少数评估决策单元有关的指标进行初步剔除。
根据指标选取原则剔除自制件和修复件维修费、技术资料、计算机保障资源这3个投入指标。这3个指标只有少数单位用到,不能作为统一的投入指标进行评价,剩余9个为主要投入指标。另外,本发明实施例中采用14个评估决策单元,根据指标选取原则,投入指标与产出指标数量之和不能超过7个,最好设置在5~7个之间。由于产出指标只有三个,为真实反映生产情况,本发明实施例中,采用这三个产出指标作为主要产出指标;因此还需要在9个投入指标中选择3~4个投入指标,且能覆盖“人力、财力、物力”三大类型指标。主要投入指标与主要产出指标的数据参见表1。
表114个评估决策单元对应的原始数据
注:保障人员、高保人员单位:人;消耗人工小时单位:人小时;业务费、预防性维修费、资源费单位:万;保障设备、保障设施单位:台;消耗器材单位:件;装备完好率单位:%;消耗摩托小时、回收摩托小时单位:个。
根据步骤S2对9个主要投入指标与3个主要产生指标进行相关性分析,参见表2。
表2主要投入指标相关性分析结果
由表2可以看出,消耗人工小时指标与预防性维修费的相关系数为0.6501,在9个主要投入指标中相关性最强,因此选择消耗人工小时指标与预防性维修费作为投入指标构建CCR基础模型MD1。该CCR基础模型MD1包括2个主要投入指标与3个主要产出指标,参见表3。
表3MD1的主要投入指标与主要产出指标数据
根据步骤S3引入14个评估决策单元中,并计算每个评估决策单元的第一效率值。然后将剩余的主要投入指标:保障人员、高保人员、业务费、资源费、保障设备、保障设施和消耗器材分别引入CCR基础模型MD1建立CCR模型MD2到MD8,并计算每个新的CCR模型的效率值。根据新的CCR模型的效率值与基础模型的第一效率值计算效率值变化比例,具体数值参见表4。
表4MD2到MD8对应的效率值变化比例
若第一预设值为10%,那么效率值变化比例超过10%视为达标,则CCR模型MD2到MD8的效率值变化超过率分别为21%、21%、36%、29%、36%、29%。可以得出,CCR模型MD4与MD7的效率值变化超过率最大。由于CCR模型MD4的效率值变化比例的平均值比CCR模型MD7的大,因此将CCR模型MD4作为新的CCR基础模型,重复上述步骤。具体数据参见表5。
表5MD4、MD9~MD14对应的效率值变化比例
MD4 | MD9 | ηi | MD10 | ηi | MD11 | ηi | MD12 | ηi | MD13 | ηi | MD14 | ηi | |
DMU1 | 0.91 | 0.92 | 1% | 0.98 | 7% | 1 | 10% | 0.91 | 0% | 0.97 | 7% | 0.91 | 0% |
DMU2 | 0.7 | 0.7 | 0% | 0.75 | 7% | 0.79 | 13% | 0.7 | 0% | 0.81 | 16% | 0.7 | 0% |
DMU3 | 0.85 | 0.87 | 2% | 1 | 15% | 0.87 | 2% | 0.85 | 0% | 0.87 | 2% | 0.85 | 0% |
DMU4 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU5 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU6 | 0.91 | 1 | 10% | 1 | 9% | 0.91 | 0% | 1 | 10% | 1 | 10% | 1 | 10% |
DMU7 | 0.87 | 0.87 | 0% | 0.87 | 0% | 0.87 | 0% | 0.87 | 0% | 0.87 | 0% | 1 | 15% |
DMU8 | 0.88 | 0.88 | 0% | 0.88 | 0% | 0.88 | 0% | 0.88 | 0% | 0.88 | 0% | 0.97 | 10% |
DMU9 | 0.4 | 0.4 | 0% | 0.44 | 9% | 0.47 | 18% | 0.4 | 0% | 0.43 | 7% | 0.46 | 15% |
DMU10 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU11 | 0.74 | 0.74 | 0% | 0.74 | 0% | 0.74 | 0% | 0.78 | 5% | 0.83 | 12% | 0.83 | 12% |
DMU12 | 0.64 | 0.83 | 30% | 0.64 | 0% | 0.67 | 5% | 0.64 | 0% | 0.81 | 27% | 0.95 | 48% |
DMU13 | 0.92 | 1 | 9% | 1 | 8% | 0.92 | 0% | 1 | 9% | 0.94 | 2% | 0.99 | 8% |
DMU14 | 0.88 | 0.88 | 0% | 0.88 | 0% | 0.88 | 0% | 1 | 14% | 1 | 14% | 1 | 14% |
CCR模型MD9到MD14的效率值变化超过率分别为14%、7%、14%、36%、50%。可以得出,引入主要投入指标消耗器件时的CCR模型MD14的效率值变化超过率最大,因此将CCR模型MD14作为新的CCR基础模型,重复上述步骤。具体数据参见表6
表6M14~M19对应的效率值变化比例
MD14 | MD15 | ηi | MD16 | ηi | MD17 | ηi | MD18 | ηi | MD19 | ηi | |
DMU1 | 0.91 | 0.92 | 1% | 0.98 | 7% | 1 | 10% | 0.91 | 0% | 0.97 | 7% |
DMU2 | 0.7 | 0.7 | 0% | 0.75 | 7% | 0.79 | 13% | 0.7 | 0% | 0.81 | 16% |
DMU3 | 0.85 | 0.87 | 2% | 1 | 15% | 0.87 | 2% | 0.85 | 0% | 0.87 | 2% |
DMU4 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU5 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU6 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU7 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU8 | 0.97 | 0.97 | 0% | 0.97 | 0% | 1 | 3% | 0.97 | 0% | 0.97 | 0% |
DMU9 | 0.46 | 0.46 | 0% | 0.48 | 4% | 0.57 | 24% | 0.46 | 0% | 0.46 | 0% |
DMU10 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
DMU11 | 0.83 | 0.83 | 0% | 0.83 | 0% | 0.87 | 5% | 0.83 | 0% | 0.87 | 5% |
DMU12 | 0.95 | 0.95 | 0% | 0.95 | 0% | 0.95 | 0% | 0.95 | 0% | 0.95 | 0% |
DMU13 | 0.99 | 1 | 1% | 1 | 1% | 0.99 | 0% | 1 | 1% | 0.99 | 0% |
DMU14 | 1 | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% | 1 | 0% |
CCR模型MD15到MD19的效率值变化超过率分别为0、7%、21%、0、7%。可以得出,当主要投入指标资源费时所得CCR模型MD17的效率值变化超过率为21%大于第二预设值15%,满足要求;其他指标则不需要引入模型中。同时根据指标选取原则,剔除主要投入指标资源费。最终选定消耗人工小时、业务费、预防性维修费、消耗器材资源费4个主要投入指标作为最终选择的投入指标,而装备完好率、消耗摩托小时和回收摩托小时3个主要产出指标作为最终的产出指标。
为体现本发明实施例提供的一种基于数据包络分析的评估指标选取方法的优越性,第二方面,本发明实施例还提供了一种基于数据包络分析的评估指标选取装置,如图2所示,包括:
主要指标选取模块,用于收集全部投入指标与产出指标,依据指标选取原则确定n个主要投入指标和m个主要产出指标,n、m为正整数;
相关性分析模块,用于对n个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指标;和,
最终指标选取模块,用于执行以下步骤:
S4、将剩余的主要投入指标依次引入数据包络分析基础模型以获取多个新的数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率值变化超过率;
S6、若效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作为数据包络分析基础模型,返回步骤S4;
S7、当所得的效率值变化超过率全部小于第二预设值时,将此时数据包络分析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的产出指标。
可选地,当主要产出指标的数量m超过一定值时,相关性分析模块还包括产出指标分析单元,用于对m个主要投入指标做相关性分析,确定相关性最强的两个主要产生指标。
可选地,最终指标选取模块包括效率值变化比例计算单元和效率值变化超过率计算单元,其中:
效率值变化比例计算单元采用以下公式计算效率值变化比例:
效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效率值×100%;
效率值变化超过率计算单元采用以下公式计算效率值变化超过率:
效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入指标的总数)×100%。
可以看出,本发明实施例提供的指标选取装置可与前文中至少一种基于数据包络分析的评估指标选取装置相互对应,因而该指标选取装置可以解决同样的技术问题,并取得相同的技术效果,在此不再详述。其具体实施方式可以参照前文,在此不再赘述。
本发明实施例提供的基于数据包络分析的评估指标选取方法及装置,根据指标选取原则对全部投入指标与产出指标初步筛选获取n个主要投入指标与m个主要产出指标;对n个主要投入指标进行相关性分析获取两个相关性最强的主要投入指标,利用这两个主要投入指标与m个主要产出指标建立数据包络分析基础模型;将剩余的主要投入指标引入数据包络分析基础模型获取效率值,并最终获取效率值变化超过率,将该效率值变化超过率所对应的主要投入指标引入上述数据包络分析基础模型获取效率值,重复上述步骤,直至效率值变化超过率小于第二预设值为止,此时模型所对应的主要输入指标即为最终的投入指标。本发明实施例运用相关性分析以及效率值变化评判的评估指标选取方法,将提取对效率值影响最大的指标取,从而选择出最为合适的评估指标,不但能够减少评估指标数量,提高指标可采集度,而且还能够提高评估效率。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种基于数据包络分析的评估指标选取方法,其特征在于,包括:
S1、收集全部投入指标与产出指标,依据指标选取原则确定n个主要投入指标和m个主要产出指标,n、m为正整数;
S2、对n个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指标;
S3、利用上述至少两个主要投入指标与m个主要产出指标建立数据包络分析基础模型,并利用所述数据包络分析基础模型计算每个评估决策单元的第一效率值;
S4、将剩余的主要投入指标依次引入所述数据包络分析基础模型以获取多个新的数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率值变化超过率;
S6、若所述效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作为数据包络分析基础模型,返回步骤S4;
S7、当所得的效率值变化超过率全部小于所述第二预设值时,将此时数据包络分析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的产出指标。
2.根据权利要求1所述的评估指标选取方法,其特征在于,当主要产出指标的数量m超过一定值时,步骤S2中还包括对m个主要产出指标做相关性分析,确定相关性最强的两个主要产生指标的步骤。
3.根据权利要求1或2所述的评估指标选取方法,其特征在于,步骤S1中采用以下指标选取原则确定n个主要投入指标和m个主要产出指标:
(1)选取的投入指标与产出指标之间需相互关联;
(2)选取的投入指标与产出指标的数值存在且为正值;
(3)评估决策单元的个数要大于等于投入指标与产出指标的数量之和的2倍。
4.根据权利要求1或2所述的评估指标选取方法,其特征在于,所述步骤S2中采用皮尔森方法对n个主要投入指标和/或m个主要产出指标作相关性分析,所述皮尔森方法的公式如下:
式中:n为样本量,Xi为第i行主要投入指标的值,为n行主要投入指标的平均值,sX为n行主要投入指标的方差,Yi为第i列主要投入指标的值,为n列主要投入指标的平均值,sX为n列主要投入指标的方差。
5.根据权利要求1或2所述的评估指标选取方法,其特征在于,步骤S3中数据包络分析基础模型为:
式中:xi为投入指标,yi为产出指标,λi为第i个指标的权重,θ为效率值,S-为投入松弛变量,S+为产出松弛变量,e和为分别为分量为1的s维列向量、m维列向量,ε为非阿基米德无穷小量。
6.根据权利要求1或2所述的评估指标选取方法,其特征在于,步骤S5中采用以下公式计算效率值变化比例:
效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效率值×100%。
7.根据权利要求1或2所述的评估指标选取方法,其特征在于,步骤S5中采用以下公式计算效率值变化超过率:
效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入指标的总数)×100%。
8.一种基于数据包络分析的评估指标选取装置,基于权利要求1~7任意一项所述的评估指标选取方法实现,其特征在于,包括:
主要指标选取模块,用于收集全部投入指标与产出指标,依据指标选取原则确定n个主要投入指标和m个主要产出指标,n、m为正整数;
相关性分析模块,用于对n个主要投入指标做相关性分析,确定相关性最强的至少两个主要投入指标;和,
最终指标选取模块,用于执行以下步骤:
S4、将剩余的主要投入指标依次引入所述数据包络分析基础模型,形成多个新的数据包络分析模型,并分别计算每个新的数据包络分析模型对应的效率值;
S5、根据每个新的数据包络分析模型的效率值与第一效率值获取效率值变化比例;并根据效率值变化比例超过第一预设值的个数与剩余的主要投入指标的总数获取效率值变化超过率;
S6、若所述效率值变化超过率超过第二预设值,则将对应的主要投入指标引入到上述数据包络分析基础模型中形成新的数据包络分析模型;将该新的数据包络分析模型作为数据包络分析基础模型,返回步骤S4;
S7、当所得的效率值变化超过率全部小于所述第二预设值时,将此时数据包络分析基础模型的主要投入指标作为最终选定的投入指标,m个主要产出指标作为最终选定的产出指标。
9.根据权利要求8所述的评估指标选取装置,其特征在于,当主要产出指标的数量m超过一定值时,所述相关性分析模块还包括产出指标分析单元,用于对m个主要产出指标做相关性分析,确定相关性最强的两个主要产生指标。
10.根据权利要求8或9所述的评估指标选取方法,其特征在于,所述最终指标选取模块包括效率值变化比例计算单元和效率值变化超过率计算单元,其中:
所述效率值变化比例计算单元采用以下公式计算效率值变化比例:
效率值变化比例=(每个剩余的主要投入指标的效率值-第一效率值)/第一效率值×100%;
所述效率值变化超过率计算单元采用以下公式计算效率值变化超过率:
效率值变化超过率=(效率值变化比例超过第一预设值的个数/剩余的主要投入指标的总数)×100%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510688168.0A CN105303311B (zh) | 2015-10-21 | 2015-10-21 | 基于数据包络分析的评估指标选取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510688168.0A CN105303311B (zh) | 2015-10-21 | 2015-10-21 | 基于数据包络分析的评估指标选取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105303311A true CN105303311A (zh) | 2016-02-03 |
CN105303311B CN105303311B (zh) | 2021-07-02 |
Family
ID=55200548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510688168.0A Active CN105303311B (zh) | 2015-10-21 | 2015-10-21 | 基于数据包络分析的评估指标选取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105303311B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107146009A (zh) * | 2017-04-27 | 2017-09-08 | 杭州电子科技大学 | 一种供水管网运行状态评估方法 |
CN108564245A (zh) * | 2018-02-27 | 2018-09-21 | 国网冀北电力有限公司电力科学研究院 | 一种基于dea分析的配网投资效率评价方法 |
CN108734567A (zh) * | 2018-04-03 | 2018-11-02 | 杭州连银科技有限公司 | 一种基于大数据人工智能风控的资产管理系统及其评估方法 |
CN109034644A (zh) * | 2018-08-10 | 2018-12-18 | 中国南方电网有限责任公司 | 充电设施规划方案的评估方法、装置、计算机设备和存储介质 |
CN112446570A (zh) * | 2019-08-30 | 2021-03-05 | 顺丰科技有限公司 | 一种库存健康度指标构建方法、系统、设备、存储介质 |
CN115860510A (zh) * | 2022-10-31 | 2023-03-28 | 浙江淏瀚信息科技有限公司 | 一种基于大数据的生产效率分析评估方法 |
CN116049157A (zh) * | 2023-01-04 | 2023-05-02 | 北京京航计算通讯研究所 | 一种质量数据分析方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065436A1 (en) * | 2006-09-08 | 2008-03-13 | Gm Global Technology Operations, Inc. | Supply chain facility performance analyzer |
CN102254091A (zh) * | 2011-06-10 | 2011-11-23 | 华北电力大学 | 20千伏中压配电方案评估方法 |
CN103455727A (zh) * | 2013-09-12 | 2013-12-18 | 中国科学院地理科学与资源研究所 | 一种城市群投入产出效率综合测度技术方法 |
CN103606266A (zh) * | 2013-06-28 | 2014-02-26 | 长沙理工大学 | 基于数据包络分析的路网交通改善方案效率评估方法 |
CN104063613A (zh) * | 2014-07-02 | 2014-09-24 | 东南大学 | 多模式公交网络的效能评估方法 |
CN104463471A (zh) * | 2014-12-12 | 2015-03-25 | 中国科学院城市环境研究所 | 基于数据包络分析的公共机构能源管理绩效评估方法 |
-
2015
- 2015-10-21 CN CN201510688168.0A patent/CN105303311B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065436A1 (en) * | 2006-09-08 | 2008-03-13 | Gm Global Technology Operations, Inc. | Supply chain facility performance analyzer |
CN102254091A (zh) * | 2011-06-10 | 2011-11-23 | 华北电力大学 | 20千伏中压配电方案评估方法 |
CN103606266A (zh) * | 2013-06-28 | 2014-02-26 | 长沙理工大学 | 基于数据包络分析的路网交通改善方案效率评估方法 |
CN103455727A (zh) * | 2013-09-12 | 2013-12-18 | 中国科学院地理科学与资源研究所 | 一种城市群投入产出效率综合测度技术方法 |
CN104063613A (zh) * | 2014-07-02 | 2014-09-24 | 东南大学 | 多模式公交网络的效能评估方法 |
CN104463471A (zh) * | 2014-12-12 | 2015-03-25 | 中国科学院城市环境研究所 | 基于数据包络分析的公共机构能源管理绩效评估方法 |
Non-Patent Citations (3)
Title |
---|
EMINE DEMET MECIT 等: "A new restricted model using correlation coefficients as an alternative to cross-efficiency evaluation in Data Envelopment Analysis", 《HACETTEPE JOURNAL OF MATHEMATICS AND STATISTICS》 * |
王建宏 等: "基于相关性分析与DEA模型的寿险公司效率分析", 《数学的实践与认识》 * |
罗艳: "基于DEA方法的指标选取和环境效率评价研究", 《中国博士学位论文全文数据库经济与管理科学辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107146009A (zh) * | 2017-04-27 | 2017-09-08 | 杭州电子科技大学 | 一种供水管网运行状态评估方法 |
CN107146009B (zh) * | 2017-04-27 | 2020-09-04 | 杭州电子科技大学 | 一种供水管网运行状态评估方法 |
CN108564245A (zh) * | 2018-02-27 | 2018-09-21 | 国网冀北电力有限公司电力科学研究院 | 一种基于dea分析的配网投资效率评价方法 |
CN108734567A (zh) * | 2018-04-03 | 2018-11-02 | 杭州连银科技有限公司 | 一种基于大数据人工智能风控的资产管理系统及其评估方法 |
CN109034644A (zh) * | 2018-08-10 | 2018-12-18 | 中国南方电网有限责任公司 | 充电设施规划方案的评估方法、装置、计算机设备和存储介质 |
CN112446570A (zh) * | 2019-08-30 | 2021-03-05 | 顺丰科技有限公司 | 一种库存健康度指标构建方法、系统、设备、存储介质 |
CN112446570B (zh) * | 2019-08-30 | 2024-04-19 | 顺丰科技有限公司 | 一种库存健康度指标构建方法、系统、设备、存储介质 |
CN115860510A (zh) * | 2022-10-31 | 2023-03-28 | 浙江淏瀚信息科技有限公司 | 一种基于大数据的生产效率分析评估方法 |
CN115860510B (zh) * | 2022-10-31 | 2023-08-15 | 浙江淏瀚信息科技有限公司 | 一种基于大数据的生产效率分析评估方法 |
CN116049157A (zh) * | 2023-01-04 | 2023-05-02 | 北京京航计算通讯研究所 | 一种质量数据分析方法及系统 |
CN116049157B (zh) * | 2023-01-04 | 2024-05-07 | 北京京航计算通讯研究所 | 一种质量数据分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105303311B (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105303311A (zh) | 基于数据包络分析的评估指标选取方法及装置 | |
CN115564203B (zh) | 基于多维数据协同的设备实时性能评估系统及其方法 | |
CN105303468A (zh) | 一种基于主成分聚类分析的智能电网建设综合评价方法 | |
Seem | Using intelligent data analysis to detect abnormal energy consumption in buildings | |
CN108020752B (zh) | 一种基于多源贯通相关性的配线线损诊断方法及系统 | |
CN115545450B (zh) | 一种基于数字孪生的碳排放协同预测方法 | |
CN106327062A (zh) | 一种配电网设备的状态评估方法 | |
CN105956779A (zh) | 电力变压器运行状态评估方法和装置 | |
CN110930198A (zh) | 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备 | |
CN111738462A (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN104376413A (zh) | 基于层次分析法和数据包络法的电网规划方案评估系统 | |
CN106549826A (zh) | 智能变电站交换机网络性能测试评估方法 | |
CN104036364A (zh) | 一种配电网网络结构水平评价方法 | |
CN102522709A (zh) | 变压器状态检修的决策方法及系统 | |
CN106056307A (zh) | 一种基于综合赋权法的电能替代技术综合效益评估方法 | |
CN112132424B (zh) | 一种大规模储能多属性决策选型方法 | |
CN114662563A (zh) | 一种基于梯度提升算法的工业用电非侵入负荷分解方法 | |
CN117272995B (zh) | 一种重复工单推荐方法及装置 | |
CN113495800B (zh) | 基于扩展多属性决策的诊断预测数据和特征再认知方法 | |
CN114298598A (zh) | 城市高可靠性中压配电网接线模式综合评估方法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN115511230A (zh) | 一种电能替代潜力分析预测方法 | |
CN115906669A (zh) | 一种顾及负样本选取策略的密集残差网络滑坡易发性评价方法 | |
CN114693175A (zh) | 一种基于网源涉网试验的机组状态分析方法与系统 | |
CN101364898B (zh) | 一种流量平衡稽核的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |