CN108573344A

CN108573344A - 一种基于小样本的香农熵dea评价方法

Info

Publication number: CN108573344A
Application number: CN201810311173.3A
Authority: CN
Inventors: 宋马林; 安庆贤; 周健; 章琛
Original assignee: Anhui University of Finance and Economics
Current assignee: Anhui University of Finance and Economics
Priority date: 2018-04-09
Filing date: 2018-04-09
Publication date: 2018-09-25

Abstract

本发明公开一种基于小样本的香农熵DEA评价方法，包括根据不同的指标子集求解DEA模型K次得到相对效率矩阵标准化效率矩阵[E_jk]_n×K；计算香农熵；计算指标子集组合M_k的差异度d_k＝1‑f_k,k＝1,2,...,K；对d_k进行标准化；计算综合效率值θ_j，如果θ_j＝1,j＝1,2,...,n，那么DMU_j为综合DEA有效；本发明实现对小样本决策单元进行完全排序，该方法考虑所有可能的指标子集情况，弥补了传统DEA模型只依据某一特定的指标集合进行评价的缺陷。

Description

一种基于小样本的香农熵DEA评价方法

技术领域

本发明涉及一种基于小样本的香农熵DEA评价方法。

背景技术

小样本是统计学中一个重要的概念，它其实并不是指样本的绝对数量少，而是通过判断其样本容量是趋向于无限还是某个固定的数值来区别样本的大小。在实践中，我们通常将样本容量小于30的样本认为是小样本。

目前，小样本评价问题已涉及到许多领域，如军事，科技等领域；评价小样本的方法有多种，如Bootstrap方法，Bayes方法，支持向量机(SVM)方法，以及数据包络分析(DEA)方法等。其中，数据包络分析方法作为评价小样本数据的主要的非参数方法之一，最早是由Charnes等人于1978年提出，用于评价一组同质的含有多投入多产出的决策单元(即被评价的对象)。传统的DEA模型在对决策单元进行效率评价时，首先对每个投入或产出指标都赋予一组非负的未知权重，那么决策单元的相对效率就是寻求一组最优的权重能最大化其产出的加权和与投入的加权和之比，并且使得其它决策单元的相对效率不超过1。随着第一个CCR模型被提出以后，基于DEA的各种模型都相继提出，如BCC模型，超效率模型，松弛量模型。

在运用上述DEA方法评价决策单元效率时，会存在如下两方面缺陷：一、根据其中很多模型算出来的效率值无法实现决策单元(Decision Making Unit,DMU)的完整排序，以CCR,BCC等为例，对于DEA无效的单元，效率值存在差异，可以由高到低进行排序，但对于DEA有效的单元其效率值均为1，因此不能根据效率值对其进行完全排序；二、以超效率模型等为例，虽然可以通过算得的超效率值对DMU进行完全排序，但其结果依赖于所取的投入产出指标的集合，一旦选定就不可更改，因此不能体现指标对结果的影响。

发明内容

本发明的目的在于提供一种基于小样本的香农熵DEA评价方法，该方法能够弥补传统DEA在小样本排序方面的不足，实现完全排序。

本发明解决其技术问题所采用的技术方案是：

一种基于小样本的香农熵DEA评价方法，包括以下步骤：

a、在投入指标集M和产出指标集S中形成不同子集的组合数为

K＝(2^m-1)×(2^s-1)，令DEA模型中第k^th个指标子集组合为M_k，组合全集为Ω＝{M₁,M₂,...,M_K}；

定义n个相互独立的决策单元为DMU，其中任意一个决策单元为DMU_j(j∈N＝{1,2,...,n})；由指标子集组合M_k所算得到的DMU_j相对效率值为E_kj,j＝1,…,n,k＝1,…,K；

b、根据不同的指标子集求解DEA模型(1)K次得到相对效率矩阵

c、标准化效率矩阵[E_jk]_n×K，并且令

d、计算香农熵，记为

e、计算指标子集组合M_k的差异度d_k＝1-f_k,k＝1,2,...,K；

f、对d_k进行标准化，使

g、计算综合效率值θ_j，j＝1,2,...,n；如果θ_j＝1,j＝1,2,...,n，那么DMU_j为综合DEA有效。

本发明的有益效果是：基于DEA在小样本效率评价方面的优势以及香农熵在量化度量信息量方面的作用，本发明提出一种香农熵DEA模型，实现对小样本决策单元进行完全排序，该方法考虑所有可能的指标子集情况，弥补了传统DEA模型只依据某一特定的指标集合进行评价的缺陷，并且还能够给所有的决策单元一个完整的排序，提高传统DEA模型的判别能力。另外，本发明的方法不依赖于某一特定的DEA模型，不论是规模收益是否可变，投入导向型还是产出导向型模型均适用，拥有博弈交叉DEA模型和超效率DEA模型等不具备的特点，在适用范围上也优于传统模型。

具体实施方式

本发明提供一种基于小样本的香农熵DEA评价方法，包括以下步骤：

a、DEA模型为

定义n个相互独立的决策单元为DMU，其中任意一个决策单元为DMU_j(j∈N＝{1,2,...,n})；

每消费m种投入指标x_ij(i∈M＝{1,2,...,m})都能生产出s种产出指标y_rj(r∈S＝{1,2,...,s})；那么对于任一给定的DMU₀，其相对效率可以通过如下的传统的DEA模型(1)来求得，DEA模型(1)中μ_r和υ_i分别表示第r^th产出指标和第i^th投入指标的未知乘数；

E₀(M,S)表示在投入指标集M和产出指标集S条件下DMU₀的相对效率值；值得注意的是，DEA模型(1)中的符号μ没有确定，那是因为当μ恒为0时，DEA模型(1)就是标准的投入导向型的CCR模型，当μ无约束时，DEA模型(1)就是标准的BCC模型；

从理论上来说，在评价小样本数据时，DEA模型至少需要一个投入指标和一个产出指标；因此，在投入指标集M和产出指标集S中形成不同子集的组合数为K＝(2^m-1)×(2^s-1)，令DEA模型(1)中第k^th个指标子集组合为M_k，组合全集为Ω＝{M₁,M₂,...,M_K}；由指标子集组合M_k所算得到的DMU_j相对效率值为E_kj,j＝1,…,n,k＝1,…,K；

b、根据不同的指标子集求解DEA模型(1)K次得到相对效率矩阵

c、标准化效率矩阵[E_jk]_n×K，并且令

d、计算香农熵，记为

e、计算指标子集组合M_k的差异度d_k＝1-f_k,k＝1,2,...,K；

此差异度表示各DEA模型的判别能力，d_k值越小，DEA模型的判别能力越弱；对于给定的一个指标子集组合M_k,如果所有DMUs的效率值都有效，即效率值均为1，那么d_k的值最小；换句话说，指标子集M_k对于DMUs的效率评价没有判别作用，因此d_k值代表了指标子集M_k的重要性；

f、对d_k进行标准化，使

g、计算综合效率值θ_j，如果θ_j＝1，j＝1，2，...，n，那么DMU_j为综合DEA有效。

显然地，如果某一给定的DMU综合效率值为1，那么该DMU对于集合Ω中所有指标子集DEA效率均有效。

值得注意的是，若某个决策单元只有单投入单产出时，那么发明提出的方法等同于传统DEA模型。因为当决策单元为单投入单产出时，投入指标集M和产

出指标集S中形成不同子集的组合数为K＝(2¹-1)×(2¹-1)＝1，也就是说，可能的指标组合只有一种，即为包含单投入单产出的组合。因此由DEA模型(1)算出效率矩阵只有一列元素为[E₁₁ E₂₁ …E_n1]^T，再根据上述算综合效率的过程可知，最终得出的综合效率值与传统DEA模型得出的效率值一致。而且本发明的方法不依赖于某一特定的DEA模型，也就是说此方法不论是规模收益可变还是不变，投入导向型还是产出导向型均适用。

接下来将列举出一个小样本数例来阐述上文中香农熵DEA的方法。此小样本数据是来自《The DEA game cross-efficiency model and its Nashequilibrium.Operations research》<56(5)，1278-1288，2008>，作者为Liang，L.，Wu，J.，Cook，W.D.，&Zhu，J.。表1显示此数据有5个DMU，每个DMU有3个投入指标和2个产出指标。

DMU	X₁	X₂	X₃	Y₁	Y₂
						1	7	7	7	4	4
2	5	9	7	7	7
						3	4	6	5	5	7
4	5	9	8	6	2
						5	6	8	5	3	6

表1 小样本数据

依据表1，所有可能的指标子集的数目为K＝(2³-1)×(2²-1)＝21。每个指标子集代号以及相应的投入产出指标组合都显示在表2的前两列，其中第二列的数字“1”表示相应的指标包含在组合之中，而数字“0”则表示该指标被排除在指标组合之外。然后根据投入导向型规模收益不变的DEA模型将不同指标集的计算结果显示如下表：

表2 所有指标子集组合的判别度和对应效率值

依照香农熵DEA的计算，将效率值以及各指标子集的重要性程度计算出来并放在表2的后两列，表2是按子集组合重要性的降序排列的。从表2结果来看，最判别能力最强的指标组合是M₁其仅包含两个指标(X₃和Y₂)，其指标判别度为W₁＝0.11103。而判别能力最弱的指标组合为M₂₁其为指标全集，其判别度为W₂₁＝0.007768。

运用步骤g的表达式，计算每个DMU的综合效率值，并将结果分别与传统CCR模型，博弈交叉DEA模型以及超效率DEA模型的评价结果进行比较，结果见表3：

DMU	CES	CCR	GCE	SuperCCR
					1	0.47997	0.68571	0.6384	0.68571
2	0.83347	1	0.97664	1.12
					3	0.99283	1	1	1.5
4	0.41582	0.85714	0.79878	0.85714
					55	0.69064	0.85714	0.66703	0.85714

表3 比较四种不同DEA模型的效率值

从CCR的效率值可以看出DMU₂和DMU₃均为CCR有效，因此排序也相同，但是其余三个模型的结果是DMU₃比DMU₂表现更好。事实上，注意表2的第三列，除了M₈，DMU₃对于所有的指标子集都是有效的，而DMU₂只对其中12个指标子集是有效的，其余9个指标子集都是无效的。

四个DEA模型对于无效的决策单元判别能力也是不同的，其中CCR模型和超-CCR模型评价DMU₄和DMU₅时具有相同的效率值0.85714，而由博弈交叉模型得出DMU₄的排名低于DMU₅，这个结果与本发明提出的香农熵DEA模型的结果相反。再从表2第三列的结果来看，使得DMU₄的效率值为0.85714的指标组合有8个，同样的，使得DMU₅具有相同的效率值的指标组合也为8个。但是DMU₄的效率值比DMU₅的效率值变化幅度更大，例如，DMU₄对于后14个指标组合所得效率值至少为0.75，对于前7个指标组合效率值均低于0.23.而DMU₅的效率值则相对稳定，其区间为[0.35714 0.85714]。因此，仅仅选择指标全集计算效率值的做法是不可取的，特别是当需要选择什么样的指标集表征生产过程的条件下。从这个意义上来说，本发明提出的方法增加了DEA模型的判别能力，因为传统的DEA模型如CCR，博弈交叉以及超效率模型等等都只依靠单一的指标集。

除此以外，香农熵DEA还可以对DMUs进行完全排序，当然博弈交叉以及超效率模型在一定条件下也可以做到，但当DEA模型从规模收益不变CRS延生到规模收益可变VRS时，博弈交叉模型可能会得出负的效率值，超效率模型可能会出现无可行解的情况，只有香农熵DEA模型可以在CRS和VRS条件下通用。

基于DEA在小样本效率评价方面的优势以及香农熵在量化度量信息量方面的作用，本发明提出一种香农熵DEA模型，实现对小样本决策单元进行完全排序，该方法考虑所有可能的指标子集情况，弥补了传统DEA模型只依据某一特定的指标集合进行评价的缺陷；再通过一个小样本数例将此方法与传统DEA模型，博弈交叉DEA模型以及超效率DEA模型结果对比可知，除弥补上述缺陷外，本方法还能够给所有的决策单元一个完整的排序，综上，本发明提出的方法提高传统DEA模型的判别能力。

另外，本发明的方法不依赖于某一特定的DEA模型，不论是规模收益可变还是不变，投入导向型还是产出导向型模型均适用，而这又是博弈交叉DEA模型和超效率DEA模型等不具备的特点。从这点上看，本发明方法在适用范围上也优于上述模型。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制；任何熟悉本领域的技术人员，在不脱离本发明技术方案范围情况下，都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰，或修改为等同变化的等效实施例。因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同替换、等效变化及修饰，均仍属于本发明技术方案保护的范围内。

Claims

1.一种基于小样本的香农熵DEA评价方法，其特征在于，包括以下步骤：

a、在投入指标集M和产出指标集S中形成不同子集的组合数为K＝(2^m-1)×(2^s-1)，令DEA模型中第k^th个指标子集组合为M_k，组合全集为Ω＝{M₁,M₂,...,M_K}，

由指标子集组合M_k所算得到的DMU_j相对效率值为E_kj,j＝1,…,n,k＝1,…,K；

b、根据不同的指标子集求解DEA模型(1)K次得到相对效率矩阵

c、标准化效率矩阵[E_jk]_n×K，并且令

d、计算香农熵，记为

e、计算指标子集组合M_k的差异度d_k＝1-f_k,k＝1,2,...,K；

f、对d_k进行标准化，使

g、计算综合效率值θ_j，如果θ_j＝1,j＝1,2,...,n，那么DMU_j为综合DEA有效。