CN107085765A - 一种基于无监督聚类分析与灰理论的地区经济评估方法 - Google Patents

一种基于无监督聚类分析与灰理论的地区经济评估方法 Download PDF

Info

Publication number
CN107085765A
CN107085765A CN201710243506.9A CN201710243506A CN107085765A CN 107085765 A CN107085765 A CN 107085765A CN 201710243506 A CN201710243506 A CN 201710243506A CN 107085765 A CN107085765 A CN 107085765A
Authority
CN
China
Prior art keywords
sample
regional
economic
economy
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710243506.9A
Other languages
English (en)
Inventor
代劲
王梅
汪顺玉
宋娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201710243506.9A priority Critical patent/CN107085765A/zh
Publication of CN107085765A publication Critical patent/CN107085765A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明请求保护一种基于无监督聚类分析与灰理论的地区经济评估方法,主要解决多因素指标影响下的地区经济的评估。该方法包括如下步骤:(1)根据“奖优罚劣”的思想获取各区域下的局部最优经济情况,即参考样本序列;(2)以参考样本为模板,获取各地区经济发展情况与局部最优经济之间的相关性,即关联度;(3)根据逐级试探类别数,寻找最优评估效果的思想完成无监督地区经济评估。本发明通过对不同地区经济在多因素指标影响下的多阶段历史数据进行灰关联分析和无监督灰关联聚类,有效的对经济发展情况进行了评估,为决策者提供了有效依据。

Description

一种基于无监督聚类分析与灰理论的地区经济评估方法
技术领域
本发明属于经济评估技术领域,具体涉及基于无监督聚类分析与灰理论的地区经济评估方法。
背景技术
地区经济是国民经济的基础。它可以准确、系统地反映经济发展水平,客观地衡量经济发展进程;及时为领导提供准确、科学的统计数据具有战略意义。由于地理位置、资源环境等因素的影响,不同地区的经济发展水平各不相同,这样就会导致经济的发展不平衡,这种现象如果长期得不到缓解,就会对地区经济的发展造成极其不利的影响。因此,准确认识并合理的评价各地区经济发展水平,以便有针对性地根据特定地域的发展状况,制定地区经济发展战略,对促进地区经济协调发展具有重要的战略意义。
对地区经济评估的研究经历了较长的发展过程,并形成了一些传统的分析方法,其基本原理主要是通过计算各地区经济之间的关联度(邓聚龙.灰理论基础[M].华中科技大学出版社,2002.),再对其进行聚类(孟海东宋宇辰.大数据挖掘技术与应用[M].冶金工业出版社,2014.)分析实现的。宋马林等人采用因子分析和回归分析,对安徽省经济发展进行综合评价;栾金昌等人采用熵理论确定指标权重,采用AHP评价城市水平经济;王晓良等人采用改进的熵方法对东部沿海7个省市进行经济发展评价和分类;王锡钊等人采用因子分析法对黔西县经济发展水平进行评。Zhaohui Liu等人在采用了一种优化的模糊聚类方法(GAPSO-FCM),对长江三角洲各城市的综合经济实力进行分析,该方法采用GA和PSO算法,克服了FCM对初始值和噪声问题的敏感性,但容易陷入局部最小值;HUANG XiaoYing等人结合灰色聚类和综合权重,采用改进的模糊综合评价法完成了经济综合评价;Peizhe Li等人使用灰色聚类对不同区域的经济发展进行分类,并用粗糙集理论推导出模糊决策规则,从而分析决策者的偏好,提供科学合理的决策建议。
但由于影响地区经济的指标因素众多,往往由多个维度指标共同决定,而传统灰理论中的相关方法的研究对象仅局限于单一指标因素表征的数据序列;其次,由于技术、环境、突发情况等不确定因素的影响,使得数据在采集时具有一定的难度,从而导致各维度指标的取值存在着缺失或冗余的现象,导致了获取的指标数据具有不完备性(舒文豪.面向动态不完备数据的特征选择模型与算法研究[D].北京交通大学,2015.),而传统灰理论中的方法往往需要通过一些预处理方法进行补齐或删除数据,不仅破坏了原始数据结构,还引入了新的不确定性;最后,在进行评估过程中,往往需要有经验的经济学者参与,依据经验人为设置聚类数,而受领域知识及数据自身特点的限制,人为指定聚类数存在较大的难度及误差,而灰理论中的方法还未有能够在不改变原始数据、无需人工干预的基础上完成评估的方法。因此,当使用灰理论中的传统分析方法时,在计算地区之间经济发展的相似度时,由于影响经济的因素指标众多,且存在不完备性,使得其无法计算或计算结果偏差较大。且在后期根据地区经济发展的相似度对地区经济进行评估时,由于人工干预,使得评估结果具有一定的主观性。迄今,尚未见有关基于无监督聚类分析与灰理论的地区经济评估方法的文献报道和实际应用。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种无监督的,能够处理多因素影响下的地区经济评估方法,通过对地区经济发展水平进行综合评价与聚类分析,从而为经济发展的决策者和建设者提供有效参考的基于无监督聚类分析与灰理论的地区经济评估方法方法。本发明的技术方案如下:
一种基于无监督聚类分析与灰理论的地区经济评估方法,其包括以下步骤:
101、收集地区经济观测样本数据,并选取所有观测样本数据在各指标维度下的最大值,然后将各观测样本数据对应维度下的值除以该值,以完成数据的标准化处理,从而消除量纲的影响,使数据具有可比性。
102、根据各地区经济的观测样本数据值得到的一个局部最优化的经济发展情况,在实际分析中以该发展情况为参考样本序列,以参考样本序列为模板,根据灰系统理论中的灰关联度公式,计算各地区经济发展情况与局部最优经济之间的相关性,即关联度;
103、采用无监督灰关联聚类方法,通过逐级增加类别个数,寻找最优聚类结果完成无监督地区经济评估。灰理论主要是体现在102中采用了灰理论中的关联度计算方法,103中采用了灰理论中的灰关联聚类方法,灰理论的主要方法的优点是能够处理具有“小样本”、“贫信息”特点的不确定性信息,原始方法的评估都是采用数据挖掘中的方法,他们的研究对象主要针对大数据,对上述对象的处理结果不够精确。而地区的经济指标不多,且具有小样本的特点,因此在方案中主要是采用的灰理论中的方法进行聚类评估。而原始灰理论中的灰关联聚类方法需要人工干预,不能实现无监督聚类,在发明中将数据挖掘中的k-means方法进行了改进,获取了一种无监督聚类方法,并将其引入灰关联聚类中生成了无监督灰关联聚类。
进一步的,所述观测样本数据的收集包括步骤:
设有m个样本X1,X2,...,Xm(m∈N),每个样本表示每一地区在j个指标因素影响下持续观察i个时间段得到的样本序列,每个观测数据样本如下:
在地区经济发展评估中,Xm表示第m个地区的经济情况,下标i表示地区在第i个时间段内获取的经济观测值,序号j表示地区在第j个指标因素影响下的经济观测值,表示第m个地区在第i时间段内观测到的在第j指标因素影响下的经济情况。
进一步的,所述观测数据样本考虑到经济发展情况只有在同一时间段和同一指标上的相对比较才有意义,因此采用以下规范方法将其进行规范化处理,以消除量纲的影响,计算方式如下:具有同一级性指同一时间段和同一指标下的观测值;极大级性就是利用所有对象这一时间段、这一维度下的观测值的最大值对其进行标准化处理,使其消除量纲的影响
其中,表示规范化处理后第m个地区,在第i个时间段内,第j个指标下的值。
将每个观测数据转换为标准:
进一步的,所述参考样本序列的确定满足以下规则:
①当影响地区经济的第j个指标为正向指标,即希望效果样本值“越大越好”,则第i时间段内观测到的在第j指标因素影响下的最优经济情况si(j)计算如下:
②当影响地区经济的第j个指标为逆向指标,即希望效果样本值“越小越好”,则第i时间段内观测到的在第j指标因素影响下的最优经济情况si(j)计算如下:
③当影响地区经济的第j个指标为固定性指标,即希望效果样本值“既不太大又不太小”,则第i时间段内观测到的在第j指标因素影响下的最优经济情况si(j)计算如下:
进一步的,所述步骤102根据公式计算关联度之前还包括定义样本距离的步骤,具体包括:
样本间距离是两个样本之间的动态时间弯曲距离,计算方式如下:
①构造距离矩阵
式中,Dis(S,X)为参考样本与地区经济序列构成的距离矩阵,其中dis(sm,xn)为参考样本的第m年与地区经济的第n年在各指标维度上的欧式距离;
②计算动态时间弯曲距离
根据距离矩阵,寻找一条从dis(s1,x1)到dis(sm,xn)的最短弯曲路径,从而获得动态弯曲距离D(i,j),它反映了样本地区经济与参考样本观测数据之间的几何曲线的相似程度,计算方式如下:
进一步的,所述关联度计算方式如下。
式中,分别表示参考样本和样本地区各经济指标差值的最大值和最小值。其中S为地区经济的最优发展情况,即参考样本;X为指定地区的经济发展情况;D(S,X)表示S与X的动态时间弯曲距离;λ表示最短弯曲距离的在距离矩阵中所通过的路径格数。
进一步的,所述步骤103的聚类步骤如下:
1)将每个样本区域的经济情况与参考样本的关联度Cm={r(S1),r(S2),…,r(Sm)}以升序构成新类别向量Cm′={dij,Clusterid},其中r(Sm)为m区域的经济发展情况与参考样本经济情况之间的关联度,Clusterid为聚类类别编号;
2)计算动态聚类结果阈值即各样本区域关联度平均数的平均误差其中|Ci′|为评估的地区经济数;
3)初始试探类别数K=1,v=e+1,其中v为循环控制变量;
4)当v≤e时,各类的聚类程度已经比较好,聚类结束;
5)聚类结束,K′=K-1即为聚类类别数,Tk′为最终聚类结果。
进一步的,所述步骤4)具体步骤为:a)构建中心类别表TC:将Ci′平均分成K+1份,取区间右端点加入TC,作为Ci′在K情况下的初始类别,同时将Ci′各元素Clusterid置为0;
b)设定临时循环控制变量e1=0;
c)当e1≠v时,执行以下循环:①e1=v;
②计算Ci′中每个值与TC中各类别距离,将其归并到距离最小的类别中;
③根据加权平均修正TC中各类别的中心距离;
④计算TC中各类别的标准差Si,令
d)K=K+1//聚类类别数加1,进行下一轮的聚类处理。
本发明的优点及有益效果如下:
(1)由于本发明利用“奖优罚劣”的思想,在样本区域经济发展基础上构建了一个局部最优的参考样本,在计算关联度时只需计算各区域的经济情况与参考样本之间的关联度,避免了原始方法中构建两两区域经济发展之间的关联矩阵,使计算效率有了较大的提高。
(2)由于地区经济发展情况一般需要多项维度指标共同决定,并且因为数据的不确定性及数据收集的难度,时常导致数据的不完备。现有的评估方法大多数都是针对单一因素影响下的序列,无法处理具有多指标因素的数据,同时在处理不完备数据时还是通过补齐较短数据或删除较长序列,这不仅破坏了原始数据,也引入了新的不确定信息。在本发明中通过获取地区经济之间的多维动态弯曲距离进行相关性分析,很好的解决了上述问题。
(3)在现有的地区经济发展评估中,需要通过人工经验设定相似类别数,具有一定的主观性,极大的降低了评估结果的可靠性。在本发明中,充分考虑了数据自身的特点,通过逐级试探的方法找到最佳关系,解决了人工干预带来的不确定性。
附图说明
图1是本发明提供优选实施例整体聚类流程图;
图2为发明中计算地区经济发展序列与参考样本序列之间的关联度流程图;
图3为本发明构建理想参考样本方法流程图;
图4为发明中无监督聚类流程图。
具体实施方式
下面结合具体实施方式以及附图对本发明基于无监督聚类分析与灰理论的地区经济评估方法进一步予以阐述,以使发明的精神、技术特征及有益效果易于了解。
图1为基于无监督聚类分析与灰理论的地区经济评估方法整体流程图,使用本方法对区域经济的发展进行评估,其具体步骤如下:
S101、根据“奖优罚劣”的思想获取各区域下的局部最优发展情况,即参考样本序列。
S102、以参考样本为模板,获取各地区经济发展情况与局部最优发展之间的联系,即关联度。
S103、根据逐级试探类别数,以寻找最优效果的思想完成无监督地区经济的评估。
S104、返回最终分析结果。
以湖南省五市2003-2008年中每万人中科技活动人员数、R&D占GDP比例以及第二产业增加值三个维度指标对湖南省五市的经济发展情况进行评估,表1为初始样本观测数据。
表1湖南省五市2003-2008年间科研、经济统计数据初始值
本发明基于无监督聚类分析与灰理论的地区经济评估方法包括以下步骤:
(1)计算样本的关联度
图2为本发明中灰关联度的计算流程图,其步骤如下:
S201、将各地区经济发展时间序列各维度的值除以该维度的最大值,获得区域样本序列的初值项;
S202、根据“奖优罚劣”的思想构造局部最优经济发展序列作为参考样本。
S203、计算各地区经济发展时间序列与参考样本序列的差序列,分别取最大值和最小值作为邓氏关联度公式中的两级最大差和两级最小差
S204、根据多维动态时间弯曲距离计算方法,计算各序列初值项与参考序列的距离。
S205、根据邓氏关联度计算方法,得到样本序列与参考序列之间的灰关联度。
1)观测样本数据
本例有5个样本地区,每个样本包括2003-2008年持续观测的6个子样本元素,每一个子元素由三个维度指标共同描述,观测数据矩阵X如下:
利用公式将观测矩阵进行规范化处理:
2)获取参考样本
图3为本发明最优参考样本序列选取流程图,其步骤如下:
S301、判断反应地区经济发展数据中每个维度指标类型(正向指标、理想指标、固定性指标);
S302、根据维度指标的类型,分别选取每一维度的理想值。构成最优参考样本序列。
在湖南省五市经济发展分析中每万人中科技活动人员数、R&D占GDP比例以及第二产业增加值三个维度指标都为正向指标,则有参考样本如下:
3)定义样本距离
①构造距离矩阵
分别利用欧氏距离构造五个地区样本经济观测值与参考样本的距离矩阵,其结果分别如下:
②计算动态时间弯曲距离
根据五个地区与参考样本构造的距离矩阵,利用动态多维动态时间弯曲距离计算公式,寻找一条从dis(s1,x1)到dis(sm,xn)的最短弯曲路径,其计算结果如下:D(S,X1)=0.0、D(S,X2)=4.97、D(S,X3)=14.08、D(S,X4)=10.12、D(S,X5)=14.13。
4)计算关联度
在湖南省五市经济发展分析中,分别表示参考样本和样本地区各经济指标差值的最大值和最小值,其计算结果如下:
max(S,X1)=0.0,max(S,X2)=0.68,max(S,X3)=0.95,max(S,X4)=0.92,max(S,X5)=0.94
min(S,X1)=0.0,min(S,X2)=0.19,min(S,X2)=0.74,min(S,X4)=0.65,min(S,X5)=0.8
根据灰关联计算公式获得五个地区与参考样本的关联度:
r(S,X1)=1.0,r(S,X2)=0.45198,r(S,X3)=0.43094,r(S,X4)=0.51716,r(S,X5)=0.44169
(2)无监督聚类
区域经济的聚类分析能准确认识并合理的评价各地区经济发展水平,以便有针对性地根据特定地域的发展状况,制定地区经济发展战略,对促进地区经济协调发展具有重要的战略意义。无监督灰关联聚类步骤如图4所示,其具体描述如下:
S401、获取各地区经济发展情况与最优参考样本之间的灰关联度序列Ci
S402、将关联度序列Ci以升序构成新类别向量Ci′={dij,Clusterid},其中Clusterid设置为聚类类别编号,初始化为0。
S403、计算Ci关联度的平均误差作为聚类分析中的动态阈值设置循环控制变量v=e+1。
S404、利用循环控制变量和动态阈值判断聚类程度的好坏(v≤e)。
S405、通过动态类别数构建中心类别表;设置临时循环控制变量。
S406、利用各类别之间的标准差是否收敛为稳定值判定聚类是否达到稳定状态e1≠v。
S407、采用加权平均方法修正各类别的中心距;修正e1、v。
S408、调整聚类类别数。
S409、返回聚类结果。
以湖南省五市经济发展分析为例,无监督计算过程如下所示:
1)将每个样本区域的经济情况与参考样本的关联度Cm={1.0,0.45198,0.43094,0.51716,0.44169}以升序构成新类别向量其中第二列为聚类类别编号,初始化为0。
2)计算各区域样本关联度平均数的平均误差作为动态聚类结果阈值,
3)初始类别数K=1,循环控制变量v=e+1=1.09694。
4)通过逐级增加类别数,寻找最佳聚类效果,循环条件WHILE(v>e)DO。
a)构建中心类别表TC:将Ci′平均分成K+1份,取区间右端点加入TC,作为Ci′在K情况下的初始类别,同时将Ci′各元素Clusterid置为0;(以第一次循环为例,将Ci′平均分成两份,分别取两区间的最右端值0.45198和1.0加入中心类别表TC中作为初始类别。)
b)设定临时循环控制变量e1=0;
c)当e1≠v时,执行以下循环:(聚类稳定后,各类的标准差将收敛为稳定值)。
①e1=v(以第一次循环为例,e1=v=1.09694);
②计算Ci′中每个值与TC中各类别距离,将其归并到距离最小的类别中;
③根据加权平均修正TC中各类别的中心距离;
④计算TC中各类别的标准差Si,令(以第一次循环为例);
d)K=K+1//聚类类别数加1,进行下一轮的聚类处理。
LOOP
5)聚类结束,K′=K-1即为聚类类别数,Tk′为最终聚类结果。
6)RETURN Tk′
经过上述步骤,湖南省五市经济发展分析结果为长沙为一类,株洲、衡阳为一类,邵阳和益阳为一类,这与现实经济发展情况基本一致。实际上,长沙作为湖南省会城市,并且是全国两型社会建设综合配套改革试验区核心城市,其经济和各方面的发展都得到了重要关注。株洲作为湖南重要的工业基地,衡阳作为湖南地区的经济中心和综合交通枢纽,这些地区的经济实力较强。从科技投入、创新能力和科技第二产业的协调发展程度来看,株洲和衡阳属于第一阶梯,科技投入较高,从而促进了第二产业的快速发展;而邵阳主要受交通瓶颈制约,经济发展较缓慢;益阳是环洞庭湖城市群的主要城市之一,石长铁路和长益高速公路开通以后,尽管与长株潭区域的经济社会联系愈来愈紧密,但由于经济基础差,经济发展水平仍然较低。邵阳和益阳两地属于科技投入相对不足、第二产业相对不发达的地区。同时该方法还能分析各地区经济的相对发展情况,从分析结果我们可以获得湖南5市在历年每万人中科技活动人数、R&D占GDP比例和第二产业增加值三个因素影响下的经济发展情况,从好到坏分别为长沙、衡阳、株洲、邵阳、益阳,使经济决策者可以通过分析结果制定不同的实施政策。可见,本方法科学合理、切实可行,具有较强的实用性和有效性。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (8)

1.一种基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,包括以下步骤:
101、收集地区经济观测样本数据,并选取所有观测样本数据在同一时间段、同一指标维度下的最大值,然后将各观测样本数据对应时间段、对应维度下的值除以该值,以完成数据的标准化处理;
102、根据各地区经济的观测样本数据值得到的一个局部最优化的经济发展情况,在实际分析中以该发展情况为参考样本序列,以参考样本序列为模板,根据灰系统理论中的灰关联度公式,计算各地区经济发展情况与局部最优经济之间的相关性,即关联度;
103、采用无监督灰关联聚类方法,通过逐级增加类别个数,寻找最优聚类结果完成无监督地区经济评估。
2.根据权利要求1所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述观测样本数据的收集包括步骤:
设有m个样本X1,X2,...,Xm(m∈N),每个样本表示每一地区在j个指标因素影响下持续观察i个时间段得到的样本序列,每个观测数据样本如下:
在地区经济发展评估中,Xm表示第m个地区的经济情况,下标i表示地区在第i个时间段内获取的经济观测值,序号j表示地区在第j个指标因素影响下的经济观测值,表示第m个地区在第i时间段内观测到的在第j指标因素影响下的经济情况。
3.根据权利要求2所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述观测数据样本考虑到经济发展情况只有在同一时间段和同一指标上的相对比较才有意义,因此采用以下规范方法将其进行规范化处理,以消除量纲的影响,计算方式如下:
其中,表示规范化处理后第m个地区,在第i个时间段内,第j个指标下的值。
将每个观测数据转换为标准:
4.根据权利要求1所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述参考样本序列的确定满足以下规则:
①当影响地区经济的第j个指标为正向指标,即希望效果样本值“越大越好”,则第i时间段内观测到的在第j指标因素影响下的最优经济情况si(j)计算如下:
②当影响地区经济的第j个指标为逆向指标,即希望效果样本值“越小越好”,则第i时间段内观测到的在第j指标因素影响下的最优经济情况si(j)计算如下:
③当影响地区经济的第j个指标为固定性指标,即希望效果样本值“既不太大又不太小”,则第i时间段内观测到的在第j指标因素影响下的最优经济情况si(j)计算如下:
5.根据权利要求1所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述步骤102根据公式计算灰关联度之前还包括定义样本距离的步骤,具体包括:
样本间距离是两个样本之间的动态时间弯曲距离,计算方式如下:
①构造距离矩阵
式中,Dis(S,X)为参考样本与地区经济序列构成的距离矩阵,其中S为地区经济的最优发展情况,即参考样本;X为指定地区的经济发展情况,dis(sm,xn)为参考样本的第m年与地区经济的第n年在各指标维度上的欧式距离;
②计算动态时间弯曲距离
根据距离矩阵,寻找一条从dis(s1,x1)到dis(sm,xn)的最短弯曲路径,从而获得多维动态弯曲距离D(i,j),它反映了样本地区经济与参考样本观测数据之间的几何曲线的相似程度,计算方式如下:
6.根据权利要求4所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述关联度计算方式如下。
式中,分别表示参考样本和样本地区各经济指标差值的最大值和最小值。其中S为地区经济的最优发展情况,即参考样本;X为指定地区的经济发展情况;D(S,X)表示S与X的动态时间弯曲距离;λ表示最短弯曲距离的在距离矩阵中所经过的路径格数。
7.根据权利要求6所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述步骤103的聚类步骤如下:
1)将每个样本区域的经济情况与参考样本的关联度Cm={r(S1),r(S2),…,r(Sm)} 以升序构成新类别向量Cm′={dij,Clusterid},其中r(Sm)为m区域的经济发展情况与参考样本经济情况之间的关联度,Clusterid为聚类类别编号;
2)计算动态聚类结果阈值,即各样本区域关联度平均数的平均误差其中|Ci′|为评估的地区经济数;
3)初始试探类别数K=1,v=e+1,其中v为循环控制变量;
4)当v≤e时,各类的聚类程度已经比较好,聚类结束;
5)聚类结束,K′=K-1即为聚类类别数,Tk′为最终聚类结果。
8.根据权利要求7所述的基于无监督聚类分析与灰理论的地区经济评估方法,其特征在于,所述步骤4)具体步骤为:a)构建中心类别表TC:将Ci′平均分成K+1份,取区间右端点加入TC,作为Ci′在K情况下的初始类别,同时将Ci′各元素Clusterid置为0;
b)设定临时循环控制变量e1=0;
c)当e1≠v时,执行以下循环:①e1=v;
②计算Ci′中每个值与TC中各类别距离,将其归并到距离最小的类别中;
③根据加权平均修正TC中各类别的中心距离;
④计算TC中各类别的标准差Si,令
d)K=K+1//聚类类别数加1,进行下一轮的聚类处理。
CN201710243506.9A 2017-04-14 2017-04-14 一种基于无监督聚类分析与灰理论的地区经济评估方法 Pending CN107085765A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710243506.9A CN107085765A (zh) 2017-04-14 2017-04-14 一种基于无监督聚类分析与灰理论的地区经济评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710243506.9A CN107085765A (zh) 2017-04-14 2017-04-14 一种基于无监督聚类分析与灰理论的地区经济评估方法

Publications (1)

Publication Number Publication Date
CN107085765A true CN107085765A (zh) 2017-08-22

Family

ID=59613027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710243506.9A Pending CN107085765A (zh) 2017-04-14 2017-04-14 一种基于无监督聚类分析与灰理论的地区经济评估方法

Country Status (1)

Country Link
CN (1) CN107085765A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154189A (zh) * 2018-01-10 2018-06-12 重庆邮电大学 基于ldtw距离的灰关联聚类方法
CN108268901A (zh) * 2018-01-25 2018-07-10 中国环境监测总站 一种基于动态时间弯曲距离发现环境监测异常数据的算法
CN108491374A (zh) * 2018-02-12 2018-09-04 郑长敬 基于房地产行业的词库构建方法及系统
CN109918774A (zh) * 2018-11-22 2019-06-21 常州天正工业发展股份有限公司 用于数据评估的二维及多维模型排序评估系统及方法
CN110320333A (zh) * 2019-05-07 2019-10-11 西北农林科技大学 一种基于多种苹果品质指标的可视化评定方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043220A1 (en) * 2004-12-22 2009-02-12 Montgomery Jr Erwin B Methods and devices for analysis of clustered data, in particular action potentials (i.e. neuron firing signals in the brain)
CN104933444A (zh) * 2015-06-26 2015-09-23 南京邮电大学 一种面向多维属性数据的多层聚类融合机制的设计方法
CN105559813A (zh) * 2014-11-04 2016-05-11 株式会社东芝 医用图像诊断装置以及医用图像处理装置
CN105975937A (zh) * 2016-05-05 2016-09-28 南京学安网络科技有限公司 基于无监督学习的道路检测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043220A1 (en) * 2004-12-22 2009-02-12 Montgomery Jr Erwin B Methods and devices for analysis of clustered data, in particular action potentials (i.e. neuron firing signals in the brain)
CN105559813A (zh) * 2014-11-04 2016-05-11 株式会社东芝 医用图像诊断装置以及医用图像处理装置
CN104933444A (zh) * 2015-06-26 2015-09-23 南京邮电大学 一种面向多维属性数据的多层聚类融合机制的设计方法
CN105975937A (zh) * 2016-05-05 2016-09-28 南京学安网络科技有限公司 基于无监督学习的道路检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIN DAI等: "An unsupervised grey incidence clustering method based on multi-dimensional dynamic time warping distance", 《2018 IEEE 3RD INTERNATIONAL CONFERENCE ON CLOUD COMPUTING AND BIG DATA ANALYSIS (ICCCBDA)》 *
吴晓婕 等: "基于Segmental—DTW的无监督行为序列分割", 《软件学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154189A (zh) * 2018-01-10 2018-06-12 重庆邮电大学 基于ldtw距离的灰关联聚类方法
CN108268901A (zh) * 2018-01-25 2018-07-10 中国环境监测总站 一种基于动态时间弯曲距离发现环境监测异常数据的算法
CN108268901B (zh) * 2018-01-25 2021-05-18 中国环境监测总站 一种基于动态时间弯曲距离发现环境监测异常数据的方法
CN108491374A (zh) * 2018-02-12 2018-09-04 郑长敬 基于房地产行业的词库构建方法及系统
CN109918774A (zh) * 2018-11-22 2019-06-21 常州天正工业发展股份有限公司 用于数据评估的二维及多维模型排序评估系统及方法
CN109918774B (zh) * 2018-11-22 2023-07-14 常州天正工业发展股份有限公司 用于数据评估的二维及多维模型排序评估系统及方法
CN110320333A (zh) * 2019-05-07 2019-10-11 西北农林科技大学 一种基于多种苹果品质指标的可视化评定方法

Similar Documents

Publication Publication Date Title
CN107085765A (zh) 一种基于无监督聚类分析与灰理论的地区经济评估方法
CN106845717B (zh) 一种基于多模型融合策略的能源效率评价方法
Liu et al. An overview of ARAS method: Theory development, application extension, and future challenge
Fang et al. A general multi-source ensemble transfer learning framework integrate of LSTM-DANN and similarity metric for building energy prediction
CN101894270B (zh) 面向遥感影像分类的样本自动选取方法
CN109697566A (zh) 机电产品加工工艺评价系统及其评价方法
CN110377605A (zh) 一种结构化数据的敏感属性识别与分类分级方法
CN106056235A (zh) 基于古林法物元可拓模型的输电网效率效益检测方法
CN106650959A (zh) 一种基于改进灰色聚类的配电网抢修能力评估方法
CN114529038A (zh) 一种基于企业需求的智能匹配招商策略系统及方法
Xu et al. Pythagorean fuzzy induced generalized OWA operator and its application to multi-attribute group decision making
Gu et al. Application of fuzzy decision tree algorithm based on mobile computing in sports fitness member management
Wang et al. Design of the Sports Training Decision Support System Based on the Improved Association Rule, the Apriori Algorithm.
CN109711727A (zh) 机电产品加工工艺组合评价系统及其评价方法
Yufei et al. Application of Big Data Analysis Methods for Technology Foresight in Strategic Emerging Industries
CN115099481A (zh) 基于空间形态开放度预测传统村落文化旅游发展适宜性的方法
Zeyang Research on intelligent acceleration algorithm for big data mining in communication network based on support vector machine
Sai et al. Forecasting air passenger data using various models
Chen et al. The coupling coordination degree measurement of society-economy-ecosystem of regional national forest park in heilongjiang Province
Lan et al. Research on the coupling relationship between manufacturing technology innovation and energy consumption based on intelligent algorithms
Tu Evaluation Index System of Economic and Social Development Pilot Area Based on Spatial Network Structure Analysis
Liu The analysis of differential high-quality development of economy by deep neural network and internet of things
Geng et al. Study on index model of tropical cyclone intensity change based on projection pursuit and evolution strategy
Zhao et al. Evaluation of Competitiveness of Coastal Cities Based on Global Factor Analysis Model
Yuan et al. The applied research of grey relational analysis based on entropy weight

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170822