CN109408773A - 一种生态健康诊断的指标自动化筛选方法 - Google Patents
一种生态健康诊断的指标自动化筛选方法 Download PDFInfo
- Publication number
- CN109408773A CN109408773A CN201811312526.8A CN201811312526A CN109408773A CN 109408773 A CN109408773 A CN 109408773A CN 201811312526 A CN201811312526 A CN 201811312526A CN 109408773 A CN109408773 A CN 109408773A
- Authority
- CN
- China
- Prior art keywords
- index
- layer
- weights
- element layer
- environmental health
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 64
- 230000005183 environmental health Effects 0.000 title claims abstract description 61
- 238000012216 screening Methods 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000000513 principal component analysis Methods 0.000 claims abstract description 17
- 238000011156 evaluation Methods 0.000 claims description 60
- 238000011160 research Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000036541 health Effects 0.000 claims description 7
- 230000002068 genetic effect Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 239000000047 product Substances 0.000 claims description 6
- 238000000540 analysis of variance Methods 0.000 claims description 3
- 125000003118 aryl group Chemical group 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 abstract description 2
- 238000013139 quantization Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000004162 soil erosion Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2219/00—Indexing scheme relating to application aspects of data processing equipment or methods
- G06F2219/10—Environmental application, e.g. waste reduction, pollution control, compliance with environmental legislation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Analysis (AREA)
- Tourism & Hospitality (AREA)
- Computational Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种生态健康诊断的指标自动化筛选方法,引入网状生态健康诊断指标体系并结合一种新的指标权重确定方法,提出一种自动化的指标筛选方法,即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系,通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题;通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。本发明既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
Description
技术领域
本发明涉及生态系统领域,特别是一种生态健康诊断的指标自动化筛选方法。
背景技术
生态系统是人类赖以生存和发展的基础,开展生态系统健康诊断研究对探索区域与生态系统可持续发展具有重要意义。在生态系统健康诊断中所选取的诊断指标及其权重对生态健康诊断结果的质量尤为重要。
利用指标体系法进行生态健康诊断的应用较多,目前一般根据区域特点,按经验构建“树杈状”指标评价体系,但不同区域不具有可比性和可复制性,同时人为忽略或简化了指标之间的重叠和交叉联系,而吝涛等提出的网状指标体系所选用的指标均为抽象指标,无法量化,且对于指标层和要素层,均采用等权重的方法;对于要素层权重的计算一般采用层次分析法等主观赋权法,确定指标权重的过程受到人主观意愿的影响,诊断结果往往与实际会出现偏差;同时对于指标的筛选缺乏对生态完整性和复杂性的思考,指标的选取过程不够透明,掺杂很多主观臆断。
发明内容
有鉴于此,本发明的目的是提出一种生态健康诊断的指标自动化筛选方法,既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
本发明采用以下方案实现:一种生态健康诊断的指标自动化筛选方法,包括以下步骤:
步骤S1:基于理论分析、相关文献中指标出现频度统计的结果,收集用于生态健康诊断的可能评价指标;
步骤S2:分析步骤S1所收集的评价指标之间存在的交叉联系,构建多层次的网状生态健康诊断指标体系;
步骤S3:收集相关数据,确定评价单元,计算生态健康诊断的指标并归一化,构建生态健康诊断指标数据集;
步骤S4:综合利用主成分分析和熵权法,计算指标权重;
步骤S5:构建自动化指标筛选模型开展指标自动化筛选;
步骤S6:指标权重再分配。
进一步地,步骤S1具体为:通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标,并去除无法获取的指标,得到用于区域生态健康诊断的可能评价指标集。
进一步地,步骤S2具体包括以下步骤:
步骤S21:根据研究目标,设定目标层,根据压力-状态-响应模(PRS)型的理论框架构建准则层,将准则层细分为多个要素层,并以在实践中能够量化的生态指标作为指标层,从而完成具有层次结构的树状生态健康诊断指标体系的构建,包括目标层-准则层-要素层-指标层4个层次;
步骤S22:通过对文献与专著的广泛调研并结合因果分析的方法,分析并补充要素层与指标层之间的指标联系,形成网状的生态健康诊断指标体系;在网状指标体系中,指标层指标与要素层指标的联系不仅仅可以是传统的1对1的关系,还可以是1对多的关系。
进一步地,步骤S3具体包括以下步骤:
步骤S31:对指标层所涉及的原始数据进行收集、计算和整理;
步骤S32:确定评价单元;小流域是具有相对完整自然生态过程的区域单元,基于Arcgis水文分析模块,利用DEM数据确定研究区边界及其内部小流域边界,并以提取的小流域作为评价单元;
步骤S33:计算指标层指标;对于不需要评价单元直接基于栅格的数值型评价指标,如植被指数、叶面积指数,直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品;包括坡度、坡向在内的地形因子通过对DEM的处理获取,气象指标通过Anusplin专业气象插值软件插值获取,或者直接使用相关的数据产品;对于基于评价单元的评价指标,如土地垦殖率、人类干扰度、香浓多样性指数,首先按照公式计算其在每个评价单元中指标的数值,然后将矢量面状数据栅格化,从而将所有指标都统一为栅格格式;
步骤S34:指标体系中的定量评价指标与生态健康的关系有正向和负向之分,将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理,其值标准化为0-1之间:
式中,nij是第i个评价指标上第j个栅格的标准化值;xij是第i个评价指标上第j个栅格的原始值;max(xi)是第i个评价指标的最大值;min(xi)是第i个评价指标的最小值,从而把各要素层诊断指标的值归一化到[0,1]。
进一步地,步骤S4具体包括以下步骤:
步骤S41:按照网状指标体系结构,将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA;PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量,当PC1的方差贡献率大于等于85%时,将各指标在PC1线性组合中的系数作为指标重要性排序的标准;当PC1的方差贡献率小于85%时,选取主成分的累积方差贡献率大于85%的前n个主成分,并按其方差贡献率作为权重进行主成分的组合,将组合的主成分变量用以代替原有要素层的抽象指标;
步骤S42:将步骤S41中通过PCA所获取的要素层指标进行主成分分析,按照S41中所述方法确定所要选取的n个主成分,并计算指标在这n个主成分中的线性组合中的系数;主成分的方差贡献率越大则该主成分的重要性越强,将方差贡献率看成是不同主成分的权重,因此,以这n个主成分方差贡献率为权重,对指标在这n个主成分线性组合中的组合系数做加权平均,得到组合系数;最后对指标组合系数进行归一化处理,计算出要素层的各指标权重;
步骤S43:将指标层指标按照要素层的结构分组使用熵权法确定指标权重;
步骤S44:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重:
w'ij=wi×wij;
式中,i表示第i个要素层,wi为要素层指标权重,wij为第i个要素层对应的第j个指标层指标熵值权重,w'ij为第i个要素层对应的第j个指标层指标的组合权重;
步骤S45:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
进一步地,步骤S43中,所述使用熵权法确定指标权重的基本步骤如下:
步骤S431:定义熵;根据信息论中信息熵的定义,对于m个评价指标、n个评价对象的评估问题中,第i个指标的熵Hi定义为:
式中,k=1/lnn,nij是第i个评价指标上第j个栅格的标准化值,当fij=0是,令fijlnfij=0;
步骤S432:计算熵权wi:
式中,0≤wi≤1,
进一步地,步骤S5具体包括以下步骤:
步骤S51:通过线性代数的矩阵来表示指标体系的结构,并将各层次之间的网络关系量化表示,构建指标层指标与要素层的关系矩阵R;如果要素层与指标层没有关联,就设为0;如果两者有关联,则设为1:
式中,行与要素层指标对应,K表示要素层指标的个数;列与指标层指标对应,J表示指标层指标个数;k为要素层的指标序号,j为指标层的指标序号,rkj表示要素层k与指标层j是否有关联关系;
步骤S52:构建自动化指标筛选模型:
式中,Z代表指标层(j)指标要选择的数目;x4j代表备选评价指标dj是否被选;X4代表方程解集,W4表示指标的权重,′表示转置;目标方程表示指标选取满足选取的指标层指标数据最少;约束条件(1)表示以要素层(ck)的指标作为保障生态完整性的目标层,每个指标所衍生的dj指标中至少有一个对应被选取;约束条件(2)表示参照主成分分析法的要求,被选指标权重占原始权重比例不低于85%;约束条件(3)表示备选指标只能被选择(=1)或者被排除(=0);约束条件(4)表示备选指标层指标个数;约束条件(5)表示要素层指数个数;
步骤S53:通过遗传算法(GA)对步骤S52中的自动化指标筛选模型进行迭代求解,迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标,直到无法满足筛选条件,不再有指标被去除为止,则停止迭代的过程,得到自动化指标筛选模型的选取结果。
进一步地,步骤S6具体包括以下步骤:
步骤S61:将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除,然后将要素层指标按照步骤S4计算权重;如果要素层所对应的指标层指标仅有一个,则直接将该指标层指标权重设为1;
步骤S62:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重;
步骤S63:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
本发明引入“网状”生态健康诊断指标体系并结合一种新的指标权重确定方法,提出一种自动化的指标筛选方法,即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系,通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题;通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。
与现有技术相比,本发明有以下有益效果:本发明所提出的一种生态健康诊断中指标自动化筛选方法,既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
附图说明
图1为本发明实施例的方法流程示意图。
图2为本发明实施例的网状生态健康诊断指标体系结构图。
图3为本发明实施例的指标筛选后的生态健康诊断指标体系结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了一种生态健康诊断的指标自动化筛选方法,包括以下步骤:
步骤S1:基于理论分析、相关文献中指标出现频度统计的结果,收集用于生态健康诊断的可能评价指标;
步骤S2:分析步骤S1所收集的评价指标之间存在的交叉联系,构建多层次的网状生态健康诊断指标体系;
步骤S3:收集相关数据,确定评价单元,计算生态健康诊断的指标并归一化,构建生态健康诊断指标数据集;
步骤S4:综合利用主成分分析和熵权法,计算指标权重;
步骤S5:构建自动化指标筛选模型开展指标自动化筛选;
步骤S6:指标权重再分配。
在本实施例中,步骤S1具体为:通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标,并去除无法获取的指标,得到用于区域生态健康诊断的可能评价指标集。在本实例中,以新疆开孔河流域为研究区,共收集了31个生态健康诊断指标。
在本实施例中,步骤S2具体包括以下步骤:
步骤S21:根据研究目标,设定目标层,根据压力-状态-响应模(PRS)型的理论框架构建准则层,将准则层细分为多个要素层,在本实例中将准则层压力分为土地压力和人口压力,将状态分为活力、组织、恢复力、地形地貌、水热状况,将影响分为沙漠化敏感性、盐碱化敏感性、水土流失敏感性。并以在实践中能够量化的生态指标作为指标层,从而完成具有层次结构的树状生态健康诊断指标体系的构建,包括目标层-准则层-要素层-指标层4个层次;
步骤S22:通过对文献与专著的广泛调研并结合因果分析的方法,分析并补充要素层与指标层之间的指标联系,形成网状的生态健康诊断指标体系;在网状指标体系中,指标层指标与要素层指标的联系不仅仅可以是传统的1对1的关系,还可以是1对多的关系。
在本实施例中,步骤S3具体包括以下步骤:
步骤S31:对指标层所涉及的原始数据进行收集、计算和整理;
步骤S32:确定评价单元;小流域是具有相对完整自然生态过程的区域单元,基于Arcgis水文分析模块,利用DEM数据确定研究区边界及其内部小流域边界,并以提取的小流域作为评价单元,在新疆开孔河流域确定了682个小流域作为评价单元;
步骤S33:计算指标层指标;对于不需要评价单元直接基于栅格的数值型评价指标,如植被指数、叶面积指数,直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品;包括坡度、坡向在内的地形因子通过对DEM的处理获取,气象指标通过Anusplin专业气象插值软件插值获取,或者直接使用相关的数据产品;对于基于评价单元的评价指标,如土地垦殖率、人类干扰度、香浓多样性指数,首先按照公式计算其在每个评价单元中指标的数值,然后将矢量面状数据栅格化,从而将所有指标都统一为栅格格式;
步骤S34:指标体系中的定量评价指标与生态健康的关系有正向和负向之分,将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理,其值标准化为0-1之间:
式中,nij是第i个评价指标上第j个栅格的标准化值;xij是第i个评价指标上第j个栅格的原始值;max(xi)是第i个评价指标的最大值;min(xi)是第i个评价指标的最小值,从而把各要素层诊断指标的值归一化到[0,1]。
在本实施例中,步骤S4具体包括以下步骤:
步骤S41:按照网状指标体系结构,将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA;PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量,当PC1的方差贡献率大于等于85%时,将各指标在PC1线性组合中的系数作为指标重要性排序的标准;当PC1的方差贡献率小于85%时,选取主成分的累积方差贡献率大于85%的前n个主成分,并按其方差贡献率作为权重进行主成分的组合,将组合的主成分变量用以代替原有要素层的抽象指标;
步骤S42:将步骤S41中通过PCA所获取的要素层指标进行主成分分析,按照S41中所述方法确定所要选取的n个主成分,并计算指标在这n个主成分中的线性组合中的系数;主成分的方差贡献率越大则该主成分的重要性越强,将方差贡献率看成是不同主成分的权重,因此,以这n个主成分方差贡献率为权重,对指标在这n个主成分线性组合中的组合系数做加权平均,得到组合系数;最后对指标组合系数进行归一化处理,计算出要素层的各指标权重;
步骤S43:将指标层指标按照要素层的结构分组使用熵权法确定指标权重;
步骤S44:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重:
w'ij=wi×wij;
式中,i表示第i个要素层,wi为要素层指标权重,wij为第i个要素层对应的第j个指标层指标熵值权重,w'ij为第i个要素层对应的第j个指标层指标的组合权重;
步骤S45:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
在本实施例中,步骤S43中,所述使用熵权法确定指标权重的基本步骤如下:
步骤S431:定义熵;根据信息论中信息熵的定义,对于m个评价指标、n个评价对象的评估问题中,第i个指标的熵Hi定义为:
式中,k=1/lnn,nij是第i个评价指标上第j个栅格的标准化值,当fij=0是,令fijlnfij=0;
步骤S432:计算熵权wi:
式中,0≤wi≤1,
在本实施例中,步骤S5具体包括以下步骤:
步骤S51:通过线性代数的矩阵来表示指标体系的结构,并将各层次之间的网络关系量化表示,构建指标层指标与要素层的关系矩阵R;如果要素层与指标层没有关联,就设为0;如果两者有关联,则设为1:
式中,行与要素层指标对应,K表示要素层指标的个数;列与指标层指标对应,J表示指标层指标个数;k为要素层的指标序号,j为指标层的指标序号,rkj表示要素层k与指标层j是否有关联关系;
步骤S52:构建自动化指标筛选模型:
式中,Z代表指标层(j)指标要选择的数目;x4j代表备选评价指标dj是否被选;X4代表方程解集,W4表示指标的权重,′表示转置;目标方程表示指标选取满足选取的指标层指标数据最少;约束条件(1)表示以要素层(ck)的指标作为保障生态完整性的目标层,每个指标所衍生的dj指标中至少有一个对应被选取;约束条件(2)表示参照主成分分析法的要求,被选指标权重占原始权重比例不低于85%;约束条件(3)表示备选指标只能被选择(=1)或者被排除(=0);约束条件(4)表示备选指标层指标个数;约束条件(5)表示要素层指数个数;
步骤S53:通过遗传算法(GA)对步骤S52中的自动化指标筛选模型进行迭代求解,迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标,直到无法满足筛选条件,不再有指标被去除为止,则停止迭代的过程,得到自动化指标筛选模型的选取结果。
在本实施例中,步骤S6具体包括以下步骤:
步骤S61:将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除,然后将要素层指标按照步骤S4计算权重;如果要素层所对应的指标层指标仅有一个,则直接将该指标层指标权重设为1;
步骤S62:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重;
步骤S63:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
在本实施例中,以流域生态健康诊断为目标层,以压力、状态、响应为准则层,将准则层细分为土地压力、人口压力、活力等要素层,再以能够梁华的栅格诊断指标作为指标层。图2为补充要素层与指标层之间的指标联系,形成“网状”生态健康诊断指标体系。表1为基于生态健康诊断“网状”指标体系并结合主成分分析、熵权法、二次权重分配法计算的要素层和指标层的权重。
从表1中,通过主成分分析的方法获取的要素层的指标权重较为合理,且比等权重方法和层次法等更有说服力。通过利用要素层指标对指标层指标进行约束,再结合二次权重分配法,更体现生态系统的层次性和完整性,不同指标的权重存在差异,很好地区分了不同指标的重要性,而且整个过程都是通过客观的方法获取的指标的权重,可以避免人的主观影响。
表1生态健康诊断指标权重表
表2筛选后指标及权重分配
在本实例中,利用自动化的指标筛选模型完成指标的筛选工作。如图3所示,为本实例筛选后的生态健康诊断指标体系,可以发现要素层指标所衍生的指标中至少有一个对应选取,保证了指标体系的完整性。表2为指标筛选后所留下的指标层指标,指标原始权重以及指标权重再次分配后的权重,从表2中可以看出,在本实例中,将生态健康诊断指标体系评价指标体系从31个优化到17个,用54.8%的指标表达了85.98%的信息,可全面反应生态健康诊断的各种考虑方面,保证了指标体系的简洁与整体性并且排除了人的主观判断的影响。
本实施例引入“网状”生态健康诊断指标体系并结合一种新的指标权重确定方法,提出一种自动化的指标筛选方法,即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系,通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题;通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。本实施例所提出的一种生态健康诊断中指标自动化筛选方法,既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (8)
1.一种生态健康诊断的指标自动化筛选方法,其特征在于:包括以下步骤:
步骤S1:收集用于生态健康诊断的可能评价指标;
步骤S2:分析步骤S1所收集的评价指标之间存在的交叉联系,构建多层次的网状生态健康诊断指标体系;
步骤S3:计算生态健康诊断的指标并归一化,构建生态健康诊断指标数据集;
步骤S4:综合利用主成分分析和熵权法,计算指标权重;
步骤S5:构建自动化指标筛选模型开展指标自动化筛选;
步骤S6:指标权重再分配。
2.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S1具体为:通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标,并去除无法获取的指标,得到用于区域生态健康诊断的可能评价指标集。
3.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S2具体包括以下步骤:
步骤S21:根据研究目标,设定目标层,根据压力-状态-响应模型的理论框架构建准则层,将准则层细分为多个要素层,并以在实践中能够量化的生态指标作为指标层,从而完成具有层次结构的树状生态健康诊断指标体系的构建,包括目标层-准则层-要素层-指标层4个层次;
步骤S22:分析并补充要素层与指标层之间的指标联系,形成网状的生态健康诊断指标体系;在网状指标体系中,指标层指标与要素层指标的联系包括1对1的关系以及1对多的关系。
4.根据权利要求3所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S3具体包括以下步骤:
步骤S31:对指标层所涉及的原始数据进行收集、计算和整理;
步骤S32:确定评价单元;小流域是具有相对完整自然生态过程的区域单元,基于Arcgis水文分析模块,利用DEM数据确定研究区边界及其内部小流域边界,并以提取的小流域作为评价单元;
步骤S33:计算指标层指标;对于不需要评价单元直接基于栅格的数值型评价指标,如植被指数、叶面积指数,直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品;包括坡度、坡向在内的地形因子通过对DEM的处理获取,气象指标通过Anusplin专业气象插值软件插值获取,或者直接使用相关的数据产品;对于基于评价单元的评价指标,如土地垦殖率、人类干扰度、香浓多样性指数,首先按照公式计算其在每个评价单元中指标的数值,然后将矢量面状数据栅格化,从而将所有指标都统一为栅格格式;
步骤S34:指标体系中的定量评价指标与生态健康的关系有正向和负向之分,将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理,其值标准化为0-1之间:
式中,nij是第i个评价指标上第j个栅格的标准化值;xij是第i个评价指标上第j个栅格的原始值;max(xi)是第i个评价指标的最大值;min(xi)是第i个评价指标的最小值,从而把各要素层诊断指标的值归一化到[0,1]。
5.根据权利要求3所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S4具体包括以下步骤:
步骤S41:按照网状指标体系结构,将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA;PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量,当PC1的方差贡献率大于等于85%时,将各指标在PC1线性组合中的系数作为指标重要性排序的标准;当PC1的方差贡献率小于85%时,选取主成分的累积方差贡献率大于85%的前n个主成分,并按其方差贡献率作为权重进行主成分的组合,将组合的主成分变量用以代替原有要素层的抽象指标;
步骤S42:将步骤S41中通过PCA所获取的要素层指标进行主成分分析,按照S41中所述方法确定所要选取的n个主成分,并计算指标在这n个主成分中的线性组合中的系数;主成分的方差贡献率越大则该主成分的重要性越强,将方差贡献率看成是不同主成分的权重,因此,以这n个主成分方差贡献率为权重,对指标在这n个主成分线性组合中的组合系数做加权平均,得到组合系数;最后对指标组合系数进行归一化处理,计算出要素层的各指标权重;
步骤S43:将指标层指标按照要素层的结构分组使用熵权法确定指标权重;
步骤S44:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重:
w'ij=wi×wij;
式中,i表示第i个要素层,wi为要素层指标权重,wij为第i个要素层对应的第j个指标层指标熵值权重,w'ij为第i个要素层对应的第j个指标层指标的组合权重;
步骤S45:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
6.根据权利要求5所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S43中,所述使用熵权法确定指标权重的基本步骤如下:
步骤S431:定义熵;根据信息论中信息熵的定义,对于m个评价指标、n个评价对象的评估问题中,第i个指标的熵Hi定义为:
式中,k=1/lnn,nij是第i个评价指标上第j个栅格的标准化值,当fij=0是,令fijlnfij=0;
步骤S432:计算熵权wi:
式中,0≤wi≤1,
7.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S5具体包括以下步骤:
步骤S51:通过线性代数的矩阵来表示指标体系的结构,并将各层次之间的网络关系量化表示,构建指标层指标与要素层的关系矩阵R;如果要素层与指标层没有关联,就设为0;如果两者有关联,则设为1:
式中,行与要素层指标对应,K表示要素层指标的个数;列与指标层指标对应,J表示指标层指标个数;k为要素层的指标序号,j为指标层的指标序号,rkj表示要素层k与指标层j是否有关联关系;
步骤S52:构建自动化指标筛选模型:
式中,Z代表指标层指标要选择的数目;x4j代表备选评价指标dj是否被选;X4代表方程解集,W4表示指标的权重,′表示转置;目标方程表示指标选取满足选取的指标层指标数据最少;约束条件(1)表示以要素层的指标作为保障生态完整性的目标层,每个指标所衍生的dj指标中至少有一个对应被选取;约束条件(2)表示参照主成分分析法的要求,被选指标权重占原始权重比例不低于85%;约束条件(3)表示备选指标只能被选择或者被排除;约束条件(4)表示备选指标层指标个数;约束条件(5)表示要素层指数个数;
步骤S53:通过遗传算法对步骤S52中的自动化指标筛选模型进行迭代求解,迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标,直到无法满足筛选条件,不再有指标被去除为止,则停止迭代的过程,得到自动化指标筛选模型的选取结果。
8.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S6具体包括以下步骤:
步骤S61:将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除,然后将要素层指标按照步骤S4计算权重;如果要素层所对应的指标层指标仅有一个,则直接将该指标层指标权重设为1;
步骤S62:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重;
步骤S63:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811312526.8A CN109408773B (zh) | 2018-11-06 | 2018-11-06 | 一种生态健康诊断的指标自动化筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811312526.8A CN109408773B (zh) | 2018-11-06 | 2018-11-06 | 一种生态健康诊断的指标自动化筛选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109408773A true CN109408773A (zh) | 2019-03-01 |
CN109408773B CN109408773B (zh) | 2021-06-29 |
Family
ID=65471808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811312526.8A Active CN109408773B (zh) | 2018-11-06 | 2018-11-06 | 一种生态健康诊断的指标自动化筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109408773B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472818A (zh) * | 2019-07-03 | 2019-11-19 | 北京林业大学 | 一种快速评价扰动湿地恢复力的方法 |
CN113130073A (zh) * | 2020-01-16 | 2021-07-16 | 宏碁股份有限公司 | 利用自动化机制挑选影响力指标的方法及电子装置 |
CN114384435A (zh) * | 2021-12-09 | 2022-04-22 | 国网天津市电力公司 | 一种基于wsa-lstm算法的新能源汽车动力电池剩余使用寿命自适应预测方法 |
CN114626771A (zh) * | 2022-05-18 | 2022-06-14 | 中山大学 | 一种城市区域水生态状态反应器构建方法、装置及反应器 |
CN117332923A (zh) * | 2023-10-09 | 2024-01-02 | 北京京航计算通讯研究所 | 一种网状指标体系的赋权方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355016A (zh) * | 2016-08-30 | 2017-01-25 | 天津大学 | 基于协调发展度的河流健康评价方法 |
CN107093013A (zh) * | 2017-04-12 | 2017-08-25 | 山东大学 | 一种考虑水文指标分布规律的水文情势评价方法 |
CN107122927A (zh) * | 2017-06-27 | 2017-09-01 | 河海大学 | 一种调水引流水环境改善效果综合评价方法 |
CN107391939A (zh) * | 2017-07-25 | 2017-11-24 | 河海大学 | 一种量化的流域相似性综合评价指标计算方法 |
CN108364130A (zh) * | 2018-02-08 | 2018-08-03 | 北京中科乾和环保科技服务有限公司 | 一种小型人工湖库生态健康评估方法 |
-
2018
- 2018-11-06 CN CN201811312526.8A patent/CN109408773B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355016A (zh) * | 2016-08-30 | 2017-01-25 | 天津大学 | 基于协调发展度的河流健康评价方法 |
CN107093013A (zh) * | 2017-04-12 | 2017-08-25 | 山东大学 | 一种考虑水文指标分布规律的水文情势评价方法 |
CN107122927A (zh) * | 2017-06-27 | 2017-09-01 | 河海大学 | 一种调水引流水环境改善效果综合评价方法 |
CN107391939A (zh) * | 2017-07-25 | 2017-11-24 | 河海大学 | 一种量化的流域相似性综合评价指标计算方法 |
CN108364130A (zh) * | 2018-02-08 | 2018-08-03 | 北京中科乾和环保科技服务有限公司 | 一种小型人工湖库生态健康评估方法 |
Non-Patent Citations (2)
Title |
---|
ALISHA L. STEWARD ET.AL: "Assessing the ecological health of rivers when they are dry", 《HTTPS://DOI.ORG/10.1016/J.ECOLIND.2017.10.053》 * |
汪小钦 等: "基于指标自动筛选的新疆开孔河流域生态健康评价", 《生态学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472818A (zh) * | 2019-07-03 | 2019-11-19 | 北京林业大学 | 一种快速评价扰动湿地恢复力的方法 |
CN110472818B (zh) * | 2019-07-03 | 2022-03-15 | 北京林业大学 | 一种快速评价扰动湿地恢复力的方法 |
CN113130073A (zh) * | 2020-01-16 | 2021-07-16 | 宏碁股份有限公司 | 利用自动化机制挑选影响力指标的方法及电子装置 |
CN113130073B (zh) * | 2020-01-16 | 2024-01-19 | 宏碁股份有限公司 | 利用自动化机制挑选影响力指标的方法及电子装置 |
CN114384435A (zh) * | 2021-12-09 | 2022-04-22 | 国网天津市电力公司 | 一种基于wsa-lstm算法的新能源汽车动力电池剩余使用寿命自适应预测方法 |
CN114626771A (zh) * | 2022-05-18 | 2022-06-14 | 中山大学 | 一种城市区域水生态状态反应器构建方法、装置及反应器 |
CN114626771B (zh) * | 2022-05-18 | 2022-08-02 | 中山大学 | 一种城市区域水生态状态反应器构建方法、装置及反应器 |
CN117332923A (zh) * | 2023-10-09 | 2024-01-02 | 北京京航计算通讯研究所 | 一种网状指标体系的赋权方法及系统 |
CN117332923B (zh) * | 2023-10-09 | 2024-03-26 | 北京京航计算通讯研究所 | 一种网状指标体系的赋权方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109408773B (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408773A (zh) | 一种生态健康诊断的指标自动化筛选方法 | |
Liu et al. | Random forest regression evaluation model of regional flood disaster resilience based on the whale optimization algorithm | |
Chen et al. | Regional disaster risk assessment of China based on self-organizing map: clustering, visualization and ranking | |
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
Paudel et al. | Assessing landscape changes and dynamics using patch analysis and GIS modeling | |
Wolfslehner et al. | Mapping indicator models: From intuitive problem structuring to quantified decision-making in sustainable forest management | |
CN103400044B (zh) | 一种改进的水环境安全评价分析方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
Roy et al. | Predicting land cover change in a Mediterranean catchment at different time scales | |
CN108764675A (zh) | 一种水系连通性评价方法 | |
CN106549813A (zh) | 一种网络性能的评估方法及系统 | |
CN101916334B (zh) | 一种皮肤状况预测方法及其预测系统 | |
CN106707099A (zh) | 基于异常用电检测模型的监测定位方法 | |
CN103177301A (zh) | 一种台风灾害风险预估方法 | |
CN104239712B (zh) | 一种雷达抗干扰效能实时评估方法 | |
CN109000930A (zh) | 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法 | |
Couto | Assessing the accuracy of spatial simulation models | |
US20230385366A1 (en) | Method for ecological disturbance risk identification and assessment based on automatic parameter adjusting optimization model | |
CN106127242A (zh) | 基于集成学习的年极端降水预测系统及其预测方法 | |
Li et al. | A hybrid model for river water level forecasting: cases of Xiangjiang River and Yuanjiang River, China | |
CN107169289A (zh) | 一种基于可拓最优组合赋权法的滑坡危险性评价方法 | |
CN105760649A (zh) | 一种面向大数据的可信度量方法 | |
CN109410179A (zh) | 一种基于生成对抗网络的图像异常检测方法 | |
CN106656357A (zh) | 一种工频通信信道状态评估系统和方法 | |
Liu et al. | Hybrid intelligent algorithm and its application in geological hazard risk assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |