CN108573344A - 一种基于小样本的香农熵dea评价方法 - Google Patents

一种基于小样本的香农熵dea评价方法 Download PDF

Info

Publication number
CN108573344A
CN108573344A CN201810311173.3A CN201810311173A CN108573344A CN 108573344 A CN108573344 A CN 108573344A CN 201810311173 A CN201810311173 A CN 201810311173A CN 108573344 A CN108573344 A CN 108573344A
Authority
CN
China
Prior art keywords
dea
dmu
models
index
efficiency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810311173.3A
Other languages
English (en)
Inventor
宋马林
安庆贤
周健
章琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University of Finance and Economics
Original Assignee
Anhui University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University of Finance and Economics filed Critical Anhui University of Finance and Economics
Priority to CN201810311173.3A priority Critical patent/CN108573344A/zh
Publication of CN108573344A publication Critical patent/CN108573344A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开一种基于小样本的香农熵DEA评价方法,包括根据不同的指标子集求解DEA模型K次得到相对效率矩阵标准化效率矩阵[Ejk]n×K;计算香农熵;计算指标子集组合Mk的差异度dk=1‑fk,k=1,2,...,K;对dk进行标准化;计算综合效率值θj如果θj=1,j=1,2,...,n,那么DMUj为综合DEA有效;本发明实现对小样本决策单元进行完全排序,该方法考虑所有可能的指标子集情况,弥补了传统DEA模型只依据某一特定的指标集合进行评价的缺陷。

Description

一种基于小样本的香农熵DEA评价方法
技术领域
本发明涉及一种基于小样本的香农熵DEA评价方法。
背景技术
小样本是统计学中一个重要的概念,它其实并不是指样本的绝对数量少,而是通过判断其样本容量是趋向于无限还是某个固定的数值来区别样本的大小。在实践中,我们通常将样本容量小于30的样本认为是小样本。
目前,小样本评价问题已涉及到许多领域,如军事,科技等领域;评价小样本的方法有多种,如Bootstrap方法,Bayes方法,支持向量机(SVM)方法,以及数据包络分析(DEA)方法等。其中,数据包络分析方法作为评价小样本数据的主要的非参数方法之一,最早是由Charnes等人于1978年提出,用于评价一组同质的含有多投入多产出的决策单元(即被评价的对象)。传统的DEA模型在对决策单元进行效率评价时,首先对每个投入或产出指标都赋予一组非负的未知权重,那么决策单元的相对效率就是寻求一组最优的权重能最大化其产出的加权和与投入的加权和之比,并且使得其它决策单元的相对效率不超过1。随着第一个CCR模型被提出以后,基于DEA的各种模型都相继提出,如BCC模型,超效率模型,松弛量模型。
在运用上述DEA方法评价决策单元效率时,会存在如下两方面缺陷:一、根据其中很多模型算出来的效率值无法实现决策单元(Decision Making Unit,DMU)的完整排序,以CCR,BCC等为例,对于DEA无效的单元,效率值存在差异,可以由高到低进行排序,但对于DEA有效的单元其效率值均为1,因此不能根据效率值对其进行完全排序;二、以超效率模型等为例,虽然可以通过算得的超效率值对DMU进行完全排序,但其结果依赖于所取的投入产出指标的集合,一旦选定就不可更改,因此不能体现指标对结果的影响。
发明内容
本发明的目的在于提供一种基于小样本的香农熵DEA评价方法,该方法能够弥补传统DEA在小样本排序方面的不足,实现完全排序。
本发明解决其技术问题所采用的技术方案是:
一种基于小样本的香农熵DEA评价方法,包括以下步骤:
a、在投入指标集M和产出指标集S中形成不同子集的组合数为
K=(2m-1)×(2s-1),令DEA模型中第kth个指标子集组合为Mk,组合全集为Ω={M1,M2,...,MK};
定义n个相互独立的决策单元为DMU,其中任意一个决策单元为DMUj(j∈N={1,2,...,n});由指标子集组合Mk所算得到的DMUj相对效率值为Ekj,j=1,…,n,k=1,…,K;
b、根据不同的指标子集求解DEA模型(1)K次得到相对效率矩阵
c、标准化效率矩阵[Ejk]n×K,并且令
d、计算香农熵,记为
e、计算指标子集组合Mk的差异度dk=1-fk,k=1,2,...,K;
f、对dk进行标准化,使
g、计算综合效率值θjj=1,2,...,n;如果θj=1,j=1,2,...,n,那么DMUj为综合DEA有效。
本发明的有益效果是:基于DEA在小样本效率评价方面的优势以及香农熵在量化度量信息量方面的作用,本发明提出一种香农熵DEA模型,实现对小样本决策单元进行完全排序,该方法考虑所有可能的指标子集情况,弥补了传统DEA模型只依据某一特定的指标集合进行评价的缺陷,并且还能够给所有的决策单元一个完整的排序,提高传统DEA模型的判别能力。另外,本发明的方法不依赖于某一特定的DEA模型,不论是规模收益是否可变,投入导向型还是产出导向型模型均适用,拥有博弈交叉DEA模型和超效率DEA模型等不具备的特点,在适用范围上也优于传统模型。
具体实施方式
本发明提供一种基于小样本的香农熵DEA评价方法,包括以下步骤:
a、DEA模型为
定义n个相互独立的决策单元为DMU,其中任意一个决策单元为DMUj(j∈N={1,2,...,n});
每消费m种投入指标xij(i∈M={1,2,...,m})都能生产出s种产出指标yrj(r∈S={1,2,...,s});那么对于任一给定的DMU0,其相对效率可以通过如下的传统的DEA模型(1)来求得,DEA模型(1)中μr和υi分别表示第rth产出指标和第ith投入指标的未知乘数;
E0(M,S)表示在投入指标集M和产出指标集S条件下DMU0的相对效率值;值得注意的是,DEA模型(1)中的符号μ没有确定,那是因为当μ恒为0时,DEA模型(1)就是标准的投入导向型的CCR模型,当μ无约束时,DEA模型(1)就是标准的BCC模型;
从理论上来说,在评价小样本数据时,DEA模型至少需要一个投入指标和一个产出指标;因此,在投入指标集M和产出指标集S中形成不同子集的组合数为K=(2m-1)×(2s-1),令DEA模型(1)中第kth个指标子集组合为Mk,组合全集为Ω={M1,M2,...,MK};由指标子集组合Mk所算得到的DMUj相对效率值为Ekj,j=1,…,n,k=1,…,K;
b、根据不同的指标子集求解DEA模型(1)K次得到相对效率矩阵
c、标准化效率矩阵[Ejk]n×K,并且令
d、计算香农熵,记为
e、计算指标子集组合Mk的差异度dk=1-fk,k=1,2,...,K;
此差异度表示各DEA模型的判别能力,dk值越小,DEA模型的判别能力越弱;对于给定的一个指标子集组合Mk,如果所有DMUs的效率值都有效,即效率值均为1,那么dk的值最小;换句话说,指标子集Mk对于DMUs的效率评价没有判别作用,因此dk值代表了指标子集Mk的重要性;
f、对dk进行标准化,使
g、计算综合效率值θj如果θj=1,j=1,2,...,n,那么DMUj为综合DEA有效。
显然地,如果某一给定的DMU综合效率值为1,那么该DMU对于集合Ω中所有指标子集DEA效率均有效。
值得注意的是,若某个决策单元只有单投入单产出时,那么发明提出的方法等同于传统DEA模型。因为当决策单元为单投入单产出时,投入指标集M和产
出指标集S中形成不同子集的组合数为K=(21-1)×(21-1)=1,也就是说,可能的指标组合只有一种,即为包含单投入单产出的组合。因此由DEA模型(1)算出效率矩阵只有一列元素为[E11 E21 …En1]T,再根据上述算综合效率的过程可知,最终得出的综合效率值与传统DEA模型得出的效率值一致。而且本发明的方法不依赖于某一特定的DEA模型,也就是说此方法不论是规模收益可变还是不变,投入导向型还是产出导向型均适用。
接下来将列举出一个小样本数例来阐述上文中香农熵DEA的方法。此小样本数据是来自《The DEA game cross-efficiency model and its Nashequilibrium.Operations research》<56(5),1278-1288,2008>,作者为Liang,L.,Wu,J.,Cook,W.D.,&Zhu,J.。表1显示此数据有5个DMU,每个DMU有3个投入指标和2个产出指标。
DMU X1 X2 X3 Y1 Y2
1 7 7 7 4 4
2 5 9 7 7 7
3 4 6 5 5 7
4 5 9 8 6 2
5 6 8 5 3 6
表1 小样本数据
依据表1,所有可能的指标子集的数目为K=(23-1)×(22-1)=21。每个指标子集代号以及相应的投入产出指标组合都显示在表2的前两列,其中第二列的数字“1”表示相应的指标包含在组合之中,而数字“0”则表示该指标被排除在指标组合之外。然后根据投入导向型规模收益不变的DEA模型将不同指标集的计算结果显示如下表:
表2 所有指标子集组合的判别度和对应效率值
依照香农熵DEA的计算,将效率值以及各指标子集的重要性程度计算出来并放在表2的后两列,表2是按子集组合重要性的降序排列的。从表2结果来看,最判别能力最强的指标组合是M1其仅包含两个指标(X3和Y2),其指标判别度为W1=0.11103。而判别能力最弱的指标组合为M21其为指标全集,其判别度为W21=0.007768。
运用步骤g的表达式,计算每个DMU的综合效率值,并将结果分别与传统CCR模型,博弈交叉DEA模型以及超效率DEA模型的评价结果进行比较,结果见表3:
DMU CES CCR GCE SuperCCR
1 0.47997 0.68571 0.6384 0.68571
2 0.83347 1 0.97664 1.12
3 0.99283 1 1 1.5
4 0.41582 0.85714 0.79878 0.85714
55 0.69064 0.85714 0.66703 0.85714
表3 比较四种不同DEA模型的效率值
从CCR的效率值可以看出DMU2和DMU3均为CCR有效,因此排序也相同,但是其余三个模型的结果是DMU3比DMU2表现更好。事实上,注意表2的第三列,除了M8,DMU3对于所有的指标子集都是有效的,而DMU2只对其中12个指标子集是有效的,其余9个指标子集都是无效的。
四个DEA模型对于无效的决策单元判别能力也是不同的,其中CCR模型和超-CCR模型评价DMU4和DMU5时具有相同的效率值0.85714,而由博弈交叉模型得出DMU4的排名低于DMU5,这个结果与本发明提出的香农熵DEA模型的结果相反。再从表2第三列的结果来看,使得DMU4的效率值为0.85714的指标组合有8个,同样的,使得DMU5具有相同的效率值的指标组合也为8个。但是DMU4的效率值比DMU5的效率值变化幅度更大,例如,DMU4对于后14个指标组合所得效率值至少为0.75,对于前7个指标组合效率值均低于0.23.而DMU5的效率值则相对稳定,其区间为[0.35714 0.85714]。因此,仅仅选择指标全集计算效率值的做法是不可取的,特别是当需要选择什么样的指标集表征生产过程的条件下。从这个意义上来说,本发明提出的方法增加了DEA模型的判别能力,因为传统的DEA模型如CCR,博弈交叉以及超效率模型等等都只依靠单一的指标集。
除此以外,香农熵DEA还可以对DMUs进行完全排序,当然博弈交叉以及超效率模型在一定条件下也可以做到,但当DEA模型从规模收益不变CRS延生到规模收益可变VRS时,博弈交叉模型可能会得出负的效率值,超效率模型可能会出现无可行解的情况,只有香农熵DEA模型可以在CRS和VRS条件下通用。
基于DEA在小样本效率评价方面的优势以及香农熵在量化度量信息量方面的作用,本发明提出一种香农熵DEA模型,实现对小样本决策单元进行完全排序,该方法考虑所有可能的指标子集情况,弥补了传统DEA模型只依据某一特定的指标集合进行评价的缺陷;再通过一个小样本数例将此方法与传统DEA模型,博弈交叉DEA模型以及超效率DEA模型结果对比可知,除弥补上述缺陷外,本方法还能够给所有的决策单元一个完整的排序,综上,本发明提出的方法提高传统DEA模型的判别能力。
另外,本发明的方法不依赖于某一特定的DEA模型,不论是规模收益可变还是不变,投入导向型还是产出导向型模型均适用,而这又是博弈交叉DEA模型和超效率DEA模型等不具备的特点。从这点上看,本发明方法在适用范围上也优于上述模型。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制;任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同替换、等效变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (1)

1.一种基于小样本的香农熵DEA评价方法,其特征在于,包括以下步骤:
a、在投入指标集M和产出指标集S中形成不同子集的组合数为K=(2m-1)×(2s-1),令DEA模型中第kth个指标子集组合为Mk,组合全集为Ω={M1,M2,...,MK},
定义n个相互独立的决策单元为DMU,其中任意一个决策单元为DMUj(j∈N={1,2,...,n});
由指标子集组合Mk所算得到的DMUj相对效率值为Ekj,j=1,…,n,k=1,…,K;
b、根据不同的指标子集求解DEA模型(1)K次得到相对效率矩阵
c、标准化效率矩阵[Ejk]n×K,并且令
d、计算香农熵,记为
e、计算指标子集组合Mk的差异度dk=1-fk,k=1,2,...,K;
f、对dk进行标准化,使
g、计算综合效率值θj如果θj=1,j=1,2,...,n,那么DMUj为综合DEA有效。
CN201810311173.3A 2018-04-09 2018-04-09 一种基于小样本的香农熵dea评价方法 Pending CN108573344A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810311173.3A CN108573344A (zh) 2018-04-09 2018-04-09 一种基于小样本的香农熵dea评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810311173.3A CN108573344A (zh) 2018-04-09 2018-04-09 一种基于小样本的香农熵dea评价方法

Publications (1)

Publication Number Publication Date
CN108573344A true CN108573344A (zh) 2018-09-25

Family

ID=63573916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810311173.3A Pending CN108573344A (zh) 2018-04-09 2018-04-09 一种基于小样本的香农熵dea评价方法

Country Status (1)

Country Link
CN (1) CN108573344A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353675A (zh) * 2018-12-24 2020-06-30 中移(杭州)信息技术有限公司 一种作业调度方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353675A (zh) * 2018-12-24 2020-06-30 中移(杭州)信息技术有限公司 一种作业调度方法和装置
CN111353675B (zh) * 2018-12-24 2023-04-11 中移(杭州)信息技术有限公司 一种作业调度方法和装置

Similar Documents

Publication Publication Date Title
CN105740430B (zh) 一种融合社会化信息的个性化推荐方法
CN105138653B (zh) 一种基于典型度和难度的题目推荐方法及其推荐装置
CN107391713A (zh) 一种解决协同过滤推荐技术中冷启动问题的方法及系统
CN103810101B (zh) 一种软件缺陷预测方法和软件缺陷预测系统
CN104217015B (zh) 基于互为共享最近邻的层次聚类方法
CN108846259A (zh) 一种基于聚类和随机森林算法的基因分类方法及系统
CN106503731A (zh) 一种基于条件互信息和K‑means的无监督特征选择方法
CN105975518B (zh) 基于信息熵的期望交叉熵特征选择文本分类系统及方法
CN108363810A (zh) 一种文本分类方法及装置
CN107301604A (zh) 多模型融合评价系统
CN107220311A (zh) 一种利用局部嵌入话题建模的文本表示方法
CN107256241A (zh) 基于网格与差异替换改进多目标遗传算法的电影推荐方法
CN109977299A (zh) 一种融合项目热度和专家系数的推荐算法
CN102750286A (zh) 一种处理缺失数据的新型决策树分类器方法
CN108776919A (zh) 基于聚类及进化算法构建信息核的物品推荐方法
CN109472453A (zh) 基于全局最优模糊核聚类模型的电力用户信用评价方法
CN103268346B (zh) 半监督分类方法及系统
CN115374106A (zh) 一种基于知识图谱技术的数据智能分级方法
CN108154380A (zh) 基于大规模评分数据对用户进行商品在线实时推荐的方法
CN108573344A (zh) 一种基于小样本的香农熵dea评价方法
CN109978023A (zh) 面向高维大数据分析的特征选择方法及计算机存储介质
CN110389932A (zh) 电力文件自动分类方法及装置
CN106354886A (zh) 在推荐系统中利用潜在邻居关系图筛选最近邻居的方法
CN112836032B (zh) 一种融合双重分词和迭代反馈的自动应答方法
CN108596430A (zh) 一种专业性购物网站设计评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180925

RJ01 Rejection of invention patent application after publication