CN109408773A

CN109408773A - 一种生态健康诊断的指标自动化筛选方法

Info

Publication number: CN109408773A
Application number: CN201811312526.8A
Authority: CN
Inventors: 汪小钦; 丁哲; 陈芸芝; 林梦婧
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2018-11-06
Filing date: 2018-11-06
Publication date: 2019-03-01
Anticipated expiration: 2038-11-06
Also published as: CN109408773B

Abstract

本发明涉及一种生态健康诊断的指标自动化筛选方法，引入网状生态健康诊断指标体系并结合一种新的指标权重确定方法，提出一种自动化的指标筛选方法，即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系，通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题；通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。本发明既能反映生态系统系统真实交叉联系，又实现了指标筛选过程的定量化和自动化，避免了计算指标权重和指标筛选的过程中人的主观影响，提高了指标筛选过程的科学性和客观性。

Description

一种生态健康诊断的指标自动化筛选方法

技术领域

本发明涉及生态系统领域，特别是一种生态健康诊断的指标自动化筛选方法。

背景技术

生态系统是人类赖以生存和发展的基础，开展生态系统健康诊断研究对探索区域与生态系统可持续发展具有重要意义。在生态系统健康诊断中所选取的诊断指标及其权重对生态健康诊断结果的质量尤为重要。

利用指标体系法进行生态健康诊断的应用较多，目前一般根据区域特点，按经验构建“树杈状”指标评价体系，但不同区域不具有可比性和可复制性，同时人为忽略或简化了指标之间的重叠和交叉联系，而吝涛等提出的网状指标体系所选用的指标均为抽象指标，无法量化，且对于指标层和要素层，均采用等权重的方法；对于要素层权重的计算一般采用层次分析法等主观赋权法，确定指标权重的过程受到人主观意愿的影响，诊断结果往往与实际会出现偏差；同时对于指标的筛选缺乏对生态完整性和复杂性的思考，指标的选取过程不够透明，掺杂很多主观臆断。

发明内容

有鉴于此，本发明的目的是提出一种生态健康诊断的指标自动化筛选方法，既能反映生态系统系统真实交叉联系，又实现了指标筛选过程的定量化和自动化，避免了计算指标权重和指标筛选的过程中人的主观影响，提高了指标筛选过程的科学性和客观性。

本发明采用以下方案实现：一种生态健康诊断的指标自动化筛选方法，包括以下步骤：

步骤S1：基于理论分析、相关文献中指标出现频度统计的结果，收集用于生态健康诊断的可能评价指标；

步骤S2：分析步骤S1所收集的评价指标之间存在的交叉联系，构建多层次的网状生态健康诊断指标体系；

步骤S3：收集相关数据，确定评价单元，计算生态健康诊断的指标并归一化，构建生态健康诊断指标数据集；

步骤S4：综合利用主成分分析和熵权法，计算指标权重；

步骤S5：构建自动化指标筛选模型开展指标自动化筛选；

步骤S6：指标权重再分配。

进一步地，步骤S1具体为：通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标，并去除无法获取的指标，得到用于区域生态健康诊断的可能评价指标集。

进一步地，步骤S2具体包括以下步骤：

步骤S21：根据研究目标，设定目标层，根据压力-状态-响应模(PRS)型的理论框架构建准则层，将准则层细分为多个要素层，并以在实践中能够量化的生态指标作为指标层，从而完成具有层次结构的树状生态健康诊断指标体系的构建，包括目标层-准则层-要素层-指标层4个层次；

步骤S22：通过对文献与专著的广泛调研并结合因果分析的方法，分析并补充要素层与指标层之间的指标联系，形成网状的生态健康诊断指标体系；在网状指标体系中，指标层指标与要素层指标的联系不仅仅可以是传统的1对1的关系，还可以是1对多的关系。

进一步地，步骤S3具体包括以下步骤：

步骤S31：对指标层所涉及的原始数据进行收集、计算和整理；

步骤S32：确定评价单元；小流域是具有相对完整自然生态过程的区域单元，基于Arcgis水文分析模块，利用DEM数据确定研究区边界及其内部小流域边界，并以提取的小流域作为评价单元；

步骤S33：计算指标层指标；对于不需要评价单元直接基于栅格的数值型评价指标，如植被指数、叶面积指数，直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品；包括坡度、坡向在内的地形因子通过对DEM的处理获取，气象指标通过Anusplin专业气象插值软件插值获取，或者直接使用相关的数据产品；对于基于评价单元的评价指标，如土地垦殖率、人类干扰度、香浓多样性指数，首先按照公式计算其在每个评价单元中指标的数值，然后将矢量面状数据栅格化，从而将所有指标都统一为栅格格式；

步骤S34：指标体系中的定量评价指标与生态健康的关系有正向和负向之分，将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理，其值标准化为0-1之间：

式中，n_ij是第i个评价指标上第j个栅格的标准化值；x_ij是第i个评价指标上第j个栅格的原始值；max(x_i)是第i个评价指标的最大值；min(x_i)是第i个评价指标的最小值，从而把各要素层诊断指标的值归一化到[0,1]。

进一步地，步骤S4具体包括以下步骤：

步骤S41：按照网状指标体系结构，将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA；PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量，当PC1的方差贡献率大于等于85％时，将各指标在PC1线性组合中的系数作为指标重要性排序的标准；当PC1的方差贡献率小于85％时，选取主成分的累积方差贡献率大于85％的前n个主成分，并按其方差贡献率作为权重进行主成分的组合，将组合的主成分变量用以代替原有要素层的抽象指标；

步骤S42：将步骤S41中通过PCA所获取的要素层指标进行主成分分析，按照S41中所述方法确定所要选取的n个主成分，并计算指标在这n个主成分中的线性组合中的系数；主成分的方差贡献率越大则该主成分的重要性越强，将方差贡献率看成是不同主成分的权重，因此，以这n个主成分方差贡献率为权重，对指标在这n个主成分线性组合中的组合系数做加权平均，得到组合系数；最后对指标组合系数进行归一化处理，计算出要素层的各指标权重；

步骤S43：将指标层指标按照要素层的结构分组使用熵权法确定指标权重；

步骤S44：使用要素层指标的权重结果对指标层指标权重进行约束，将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重：

w'_ij＝w_i×w_ij；

式中，i表示第i个要素层，w_i为要素层指标权重，w_ij为第i个要素层对应的第j个指标层指标熵值权重,w'_ij为第i个要素层对应的第j个指标层指标的组合权重；

步骤S45：将同一个指标从不同要素层获取的多个权重进行合并，进行指标权重的二次分配，使得最终指标层每个指标的权重是唯一的。

进一步地，步骤S43中，所述使用熵权法确定指标权重的基本步骤如下：

步骤S431：定义熵；根据信息论中信息熵的定义，对于m个评价指标、n个评价对象的评估问题中，第i个指标的熵H_i定义为：

式中，k＝1/lnn，n_ij是第i个评价指标上第j个栅格的标准化值，当f_ij＝0是，令f_ijlnf_ij＝0；

步骤S432：计算熵权w_i：

式中，0≤w_i≤1，

进一步地，步骤S5具体包括以下步骤：

步骤S51：通过线性代数的矩阵来表示指标体系的结构，并将各层次之间的网络关系量化表示，构建指标层指标与要素层的关系矩阵R；如果要素层与指标层没有关联，就设为0；如果两者有关联，则设为1：

式中，行与要素层指标对应，K表示要素层指标的个数；列与指标层指标对应，J表示指标层指标个数；k为要素层的指标序号，j为指标层的指标序号，r_kj表示要素层k与指标层j是否有关联关系；

步骤S52：构建自动化指标筛选模型：

式中，Z代表指标层(j)指标要选择的数目；x_4j代表备选评价指标d_j是否被选；X₄代表方程解集，W₄表示指标的权重，′表示转置；目标方程表示指标选取满足选取的指标层指标数据最少；约束条件(1)表示以要素层(c_k)的指标作为保障生态完整性的目标层，每个指标所衍生的d_j指标中至少有一个对应被选取；约束条件(2)表示参照主成分分析法的要求，被选指标权重占原始权重比例不低于85％；约束条件(3)表示备选指标只能被选择(＝1)或者被排除(＝0)；约束条件(4)表示备选指标层指标个数；约束条件(5)表示要素层指数个数；

步骤S53：通过遗传算法(GA)对步骤S52中的自动化指标筛选模型进行迭代求解，迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标，直到无法满足筛选条件，不再有指标被去除为止，则停止迭代的过程，得到自动化指标筛选模型的选取结果。

进一步地，步骤S6具体包括以下步骤：

步骤S61：将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除，然后将要素层指标按照步骤S4计算权重；如果要素层所对应的指标层指标仅有一个，则直接将该指标层指标权重设为1；

步骤S62：使用要素层指标的权重结果对指标层指标权重进行约束，将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重；

步骤S63：将同一个指标从不同要素层获取的多个权重进行合并，进行指标权重的二次分配，使得最终指标层每个指标的权重是唯一的。

本发明引入“网状”生态健康诊断指标体系并结合一种新的指标权重确定方法，提出一种自动化的指标筛选方法，即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系，通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题；通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。

与现有技术相比，本发明有以下有益效果：本发明所提出的一种生态健康诊断中指标自动化筛选方法，既能反映生态系统系统真实交叉联系，又实现了指标筛选过程的定量化和自动化，避免了计算指标权重和指标筛选的过程中人的主观影响，提高了指标筛选过程的科学性和客观性。

附图说明

图1为本发明实施例的方法流程示意图。

图2为本发明实施例的网状生态健康诊断指标体系结构图。

图3为本发明实施例的指标筛选后的生态健康诊断指标体系结构图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本实施例提供了一种生态健康诊断的指标自动化筛选方法，包括以下步骤：

步骤S4：综合利用主成分分析和熵权法，计算指标权重；

步骤S5：构建自动化指标筛选模型开展指标自动化筛选；

步骤S6：指标权重再分配。

在本实施例中，步骤S1具体为：通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标，并去除无法获取的指标，得到用于区域生态健康诊断的可能评价指标集。在本实例中，以新疆开孔河流域为研究区，共收集了31个生态健康诊断指标。

在本实施例中，步骤S2具体包括以下步骤：

步骤S21：根据研究目标，设定目标层，根据压力-状态-响应模(PRS)型的理论框架构建准则层，将准则层细分为多个要素层，在本实例中将准则层压力分为土地压力和人口压力，将状态分为活力、组织、恢复力、地形地貌、水热状况，将影响分为沙漠化敏感性、盐碱化敏感性、水土流失敏感性。并以在实践中能够量化的生态指标作为指标层，从而完成具有层次结构的树状生态健康诊断指标体系的构建，包括目标层-准则层-要素层-指标层4个层次；

在本实施例中，步骤S3具体包括以下步骤：

步骤S32：确定评价单元；小流域是具有相对完整自然生态过程的区域单元，基于Arcgis水文分析模块，利用DEM数据确定研究区边界及其内部小流域边界，并以提取的小流域作为评价单元，在新疆开孔河流域确定了682个小流域作为评价单元；

在本实施例中，步骤S4具体包括以下步骤：

w'_ij＝w_i×w_ij；

在本实施例中，步骤S43中，所述使用熵权法确定指标权重的基本步骤如下：

步骤S432：计算熵权w_i：

式中，0≤w_i≤1，

在本实施例中，步骤S5具体包括以下步骤：

步骤S52：构建自动化指标筛选模型：

在本实施例中，步骤S6具体包括以下步骤：

在本实施例中，以流域生态健康诊断为目标层，以压力、状态、响应为准则层，将准则层细分为土地压力、人口压力、活力等要素层，再以能够梁华的栅格诊断指标作为指标层。图2为补充要素层与指标层之间的指标联系，形成“网状”生态健康诊断指标体系。表1为基于生态健康诊断“网状”指标体系并结合主成分分析、熵权法、二次权重分配法计算的要素层和指标层的权重。

从表1中，通过主成分分析的方法获取的要素层的指标权重较为合理，且比等权重方法和层次法等更有说服力。通过利用要素层指标对指标层指标进行约束，再结合二次权重分配法，更体现生态系统的层次性和完整性，不同指标的权重存在差异，很好地区分了不同指标的重要性，而且整个过程都是通过客观的方法获取的指标的权重，可以避免人的主观影响。

表1生态健康诊断指标权重表

表2筛选后指标及权重分配

在本实例中，利用自动化的指标筛选模型完成指标的筛选工作。如图3所示，为本实例筛选后的生态健康诊断指标体系，可以发现要素层指标所衍生的指标中至少有一个对应选取，保证了指标体系的完整性。表2为指标筛选后所留下的指标层指标，指标原始权重以及指标权重再次分配后的权重，从表2中可以看出，在本实例中，将生态健康诊断指标体系评价指标体系从31个优化到17个，用54.8％的指标表达了85.98％的信息，可全面反应生态健康诊断的各种考虑方面，保证了指标体系的简洁与整体性并且排除了人的主观判断的影响。

本实施例引入“网状”生态健康诊断指标体系并结合一种新的指标权重确定方法，提出一种自动化的指标筛选方法，即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系，通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题；通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。本实施例所提出的一种生态健康诊断中指标自动化筛选方法，既能反映生态系统系统真实交叉联系，又实现了指标筛选过程的定量化和自动化，避免了计算指标权重和指标筛选的过程中人的主观影响，提高了指标筛选过程的科学性和客观性。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种生态健康诊断的指标自动化筛选方法，其特征在于：包括以下步骤：

步骤S1：收集用于生态健康诊断的可能评价指标；

步骤S3：计算生态健康诊断的指标并归一化，构建生态健康诊断指标数据集；

步骤S4：综合利用主成分分析和熵权法，计算指标权重；

步骤S5：构建自动化指标筛选模型开展指标自动化筛选；

步骤S6：指标权重再分配。

2.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S1具体为：通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标，并去除无法获取的指标，得到用于区域生态健康诊断的可能评价指标集。

3.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S2具体包括以下步骤：

步骤S21：根据研究目标，设定目标层，根据压力-状态-响应模型的理论框架构建准则层，将准则层细分为多个要素层，并以在实践中能够量化的生态指标作为指标层，从而完成具有层次结构的树状生态健康诊断指标体系的构建，包括目标层-准则层-要素层-指标层4个层次；

步骤S22：分析并补充要素层与指标层之间的指标联系，形成网状的生态健康诊断指标体系；在网状指标体系中，指标层指标与要素层指标的联系包括1对1的关系以及1对多的关系。

4.根据权利要求3所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S3具体包括以下步骤：

5.根据权利要求3所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S4具体包括以下步骤：

w'_ij＝w_i×w_ij；

6.根据权利要求5所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S43中，所述使用熵权法确定指标权重的基本步骤如下：

步骤S432：计算熵权w_i：

式中，0≤w_i≤1，

7.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S5具体包括以下步骤：

步骤S52：构建自动化指标筛选模型：

式中，Z代表指标层指标要选择的数目；x_4j代表备选评价指标d_j是否被选；X₄代表方程解集，W₄表示指标的权重，′表示转置；目标方程表示指标选取满足选取的指标层指标数据最少；约束条件(1)表示以要素层的指标作为保障生态完整性的目标层，每个指标所衍生的d_j指标中至少有一个对应被选取；约束条件(2)表示参照主成分分析法的要求，被选指标权重占原始权重比例不低于85％；约束条件(3)表示备选指标只能被选择或者被排除；约束条件(4)表示备选指标层指标个数；约束条件(5)表示要素层指数个数；

步骤S53：通过遗传算法对步骤S52中的自动化指标筛选模型进行迭代求解，迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标，直到无法满足筛选条件，不再有指标被去除为止，则停止迭代的过程，得到自动化指标筛选模型的选取结果。

8.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法，其特征在于：步骤S6具体包括以下步骤：