CN109408773B - 一种生态健康诊断的指标自动化筛选方法 - Google Patents

一种生态健康诊断的指标自动化筛选方法 Download PDF

Info

Publication number
CN109408773B
CN109408773B CN201811312526.8A CN201811312526A CN109408773B CN 109408773 B CN109408773 B CN 109408773B CN 201811312526 A CN201811312526 A CN 201811312526A CN 109408773 B CN109408773 B CN 109408773B
Authority
CN
China
Prior art keywords
index
indexes
weight
layer
element layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811312526.8A
Other languages
English (en)
Other versions
CN109408773A (zh
Inventor
汪小钦
丁哲
陈芸芝
林梦婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201811312526.8A priority Critical patent/CN109408773B/zh
Publication of CN109408773A publication Critical patent/CN109408773A/zh
Application granted granted Critical
Publication of CN109408773B publication Critical patent/CN109408773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2219/00Indexing scheme relating to application aspects of data processing equipment or methods
    • G06F2219/10Environmental application, e.g. waste reduction, pollution control, compliance with environmental legislation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种生态健康诊断的指标自动化筛选方法,引入网状生态健康诊断指标体系并结合一种新的指标权重确定方法,提出一种自动化的指标筛选方法,即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系,通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题;通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。本发明既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。

Description

一种生态健康诊断的指标自动化筛选方法
技术领域
本发明涉及生态系统领域,特别是一种生态健康诊断的指标自动化筛选方法。
背景技术
生态系统是人类赖以生存和发展的基础,开展生态系统健康诊断研究对探索区域与生态系统可持续发展具有重要意义。在生态系统健康诊断中所选取的诊断指标及其权重对生态健康诊断结果的质量尤为重要。
利用指标体系法进行生态健康诊断的应用较多,目前一般根据区域特点,按经验构建“树杈状”指标评价体系,但不同区域不具有可比性和可复制性,同时人为忽略或简化了指标之间的重叠和交叉联系,而吝涛等提出的网状指标体系所选用的指标均为抽象指标,无法量化,且对于指标层和要素层,均采用等权重的方法;对于要素层权重的计算一般采用层次分析法等主观赋权法,确定指标权重的过程受到人主观意愿的影响,诊断结果往往与实际会出现偏差;同时对于指标的筛选缺乏对生态完整性和复杂性的思考,指标的选取过程不够透明,掺杂很多主观臆断。
发明内容
有鉴于此,本发明的目的是提出一种生态健康诊断的指标自动化筛选方法,既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
本发明采用以下方案实现:一种生态健康诊断的指标自动化筛选方法,包括以下步骤:
步骤S1:基于理论分析、相关文献中指标出现频度统计的结果,收集用于生态健康诊断的可能评价指标;
步骤S2:分析步骤S1所收集的评价指标之间存在的交叉联系,构建多层次的网状生态健康诊断指标体系;
步骤S3:收集相关数据,确定评价单元,计算生态健康诊断的指标并归一化,构建生态健康诊断指标数据集;
步骤S4:综合利用主成分分析和熵权法,计算指标权重;
步骤S5:构建自动化指标筛选模型开展指标自动化筛选;
步骤S6:指标权重再分配。
进一步地,步骤S1具体为:通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标,并去除无法获取的指标,得到用于区域生态健康诊断的可能评价指标集。
进一步地,步骤S2具体包括以下步骤:
步骤S21:根据研究目标,设定目标层,根据压力-状态-响应模(PRS)型的理论框架构建准则层,将准则层细分为多个要素层,并以在实践中能够量化的生态指标作为指标层,从而完成具有层次结构的树状生态健康诊断指标体系的构建,包括目标层-准则层-要素层-指标层4个层次;
步骤S22:通过对文献与专著的广泛调研并结合因果分析的方法,分析并补充要素层与指标层之间的指标联系,形成网状的生态健康诊断指标体系;在网状指标体系中,指标层指标与要素层指标的联系不仅仅可以是传统的1对1的关系,还可以是1对多的关系。
进一步地,步骤S3具体包括以下步骤:
步骤S31:对指标层所涉及的原始数据进行收集、计算和整理;
步骤S32:确定评价单元;小流域是具有相对完整自然生态过程的区域单元,基于Arcgis水文分析模块,利用DEM数据确定研究区边界及其内部小流域边界,并以提取的小流域作为评价单元;
步骤S33:计算指标层指标;对于不需要评价单元直接基于栅格的数值型评价指标,如植被指数、叶面积指数,直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品;包括坡度、坡向在内的地形因子通过对DEM的处理获取,气象指标通过Anusplin专业气象插值软件插值获取,或者直接使用相关的数据产品;对于基于评价单元的评价指标,如土地垦殖率、人类干扰度、香浓多样性指数,首先按照公式计算其在每个评价单元中指标的数值,然后将矢量面状数据栅格化,从而将所有指标都统一为栅格格式;
步骤S34:指标体系中的定量评价指标与生态健康的关系有正向和负向之分,将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理,其值标准化为0-1之间:
Figure BDA0001855374660000031
Figure BDA0001855374660000032
式中,nij是第i个评价指标上第j个栅格的标准化值;xij是第i个评价指标上第j个栅格的原始值;max(xi)是第i个评价指标的最大值;min(xi)是第i个评价指标的最小值,从而把各要素层诊断指标的值归一化到[0,1]。
进一步地,步骤S4具体包括以下步骤:
步骤S41:按照网状指标体系结构,将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA;PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量,当PC1的方差贡献率大于等于85%时,将各指标在PC1线性组合中的系数作为指标重要性排序的标准;当PC1的方差贡献率小于85%时,选取主成分的累积方差贡献率大于85%的前n个主成分,并按其方差贡献率作为权重进行主成分的组合,将组合的主成分变量用以代替原有要素层的抽象指标;
步骤S42:将步骤S41中通过PCA所获取的要素层指标进行主成分分析,按照S41中所述方法确定所要选取的n个主成分,并计算指标在这n个主成分中的线性组合中的系数;主成分的方差贡献率越大则该主成分的重要性越强,将方差贡献率看成是不同主成分的权重,因此,以这n个主成分方差贡献率为权重,对指标在这n个主成分线性组合中的组合系数做加权平均,得到组合系数;最后对指标组合系数进行归一化处理,计算出要素层的各指标权重;
步骤S43:将指标层指标按照要素层的结构分组使用熵权法确定指标权重;
步骤S44:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重:
w'ij=wi×wij
式中,i表示第i个要素层,wi为要素层指标权重,wij为第i个要素层对应的第j个指标层指标熵值权重,w'ij为第i个要素层对应的第j个指标层指标的组合权重;
步骤S45:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
进一步地,步骤S43中,所述使用熵权法确定指标权重的基本步骤如下:
步骤S431:定义熵;根据信息论中信息熵的定义,对于m个评价指标、n个评价对象的评估问题中,第i个指标的熵Hi定义为:
Figure BDA0001855374660000041
式中,k=1/lnn,
Figure BDA0001855374660000042
nij是第i个评价指标上第j个栅格的标准化值,当fij=0是,令fijlnfij=0;
步骤S432:计算熵权wi
Figure BDA0001855374660000051
式中,0≤wi≤1,
Figure BDA0001855374660000052
进一步地,步骤S5具体包括以下步骤:
步骤S51:通过线性代数的矩阵来表示指标体系的结构,并将各层次之间的网络关系量化表示,构建指标层指标与要素层的关系矩阵R;如果要素层与指标层没有关联,就设为0;如果两者有关联,则设为1:
Figure BDA0001855374660000053
式中,行与要素层指标对应,K表示要素层指标的个数;列与指标层指标对应,J表示指标层指标个数;k为要素层的指标序号,j为指标层的指标序号,rkj表示要素层k与指标层j是否有关联关系;
步骤S52:构建自动化指标筛选模型:
Figure BDA0001855374660000054
Figure BDA0001855374660000055
式中,Z代表指标层(j)指标要选择的数目;x4j代表备选评价指标dj是否被选;X4代表方程解集,W4表示指标的权重,′表示转置;目标方程表示指标选取满足选取的指标层指标数据最少;约束条件(1)表示以要素层(ck)的指标作为保障生态完整性的目标层,每个指标所衍生的dj指标中至少有一个对应被选取;约束条件(2)表示参照主成分分析法的要求,被选指标权重占原始权重比例不低于85%;约束条件(3)表示备选指标只能被选择(=1)或者被排除(=0);约束条件(4)表示备选指标层指标个数;约束条件(5)表示要素层指数个数;
步骤S53:通过遗传算法(GA)对步骤S52中的自动化指标筛选模型进行迭代求解,迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标,直到无法满足筛选条件,不再有指标被去除为止,则停止迭代的过程,得到自动化指标筛选模型的选取结果。
进一步地,步骤S6具体包括以下步骤:
步骤S61:将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除,然后将要素层指标按照步骤S4计算权重;如果要素层所对应的指标层指标仅有一个,则直接将该指标层指标权重设为1;
步骤S62:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重;
步骤S63:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
本发明引入“网状”生态健康诊断指标体系并结合一种新的指标权重确定方法,提出一种自动化的指标筛选方法,即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系,通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题;通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。
与现有技术相比,本发明有以下有益效果:本发明所提出的一种生态健康诊断中指标自动化筛选方法,既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
附图说明
图1为本发明实施例的方法流程示意图。
图2为本发明实施例的网状生态健康诊断指标体系结构图。
图3为本发明实施例的指标筛选后的生态健康诊断指标体系结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了一种生态健康诊断的指标自动化筛选方法,包括以下步骤:
步骤S1:基于理论分析、相关文献中指标出现频度统计的结果,收集用于生态健康诊断的可能评价指标;
步骤S2:分析步骤S1所收集的评价指标之间存在的交叉联系,构建多层次的网状生态健康诊断指标体系;
步骤S3:收集相关数据,确定评价单元,计算生态健康诊断的指标并归一化,构建生态健康诊断指标数据集;
步骤S4:综合利用主成分分析和熵权法,计算指标权重;
步骤S5:构建自动化指标筛选模型开展指标自动化筛选;
步骤S6:指标权重再分配。
在本实施例中,步骤S1具体为:通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标,并去除无法获取的指标,得到用于区域生态健康诊断的可能评价指标集。在本实例中,以新疆开孔河流域为研究区,共收集了31个生态健康诊断指标。
在本实施例中,步骤S2具体包括以下步骤:
步骤S21:根据研究目标,设定目标层,根据压力-状态-响应模(PRS)型的理论框架构建准则层,将准则层细分为多个要素层,在本实例中将准则层压力分为土地压力和人口压力,将状态分为活力、组织、恢复力、地形地貌、水热状况,将影响分为沙漠化敏感性、盐碱化敏感性、水土流失敏感性。并以在实践中能够量化的生态指标作为指标层,从而完成具有层次结构的树状生态健康诊断指标体系的构建,包括目标层-准则层-要素层-指标层4个层次;
步骤S22:通过对文献与专著的广泛调研并结合因果分析的方法,分析并补充要素层与指标层之间的指标联系,形成网状的生态健康诊断指标体系;在网状指标体系中,指标层指标与要素层指标的联系不仅仅可以是传统的1对1的关系,还可以是1对多的关系。
在本实施例中,步骤S3具体包括以下步骤:
步骤S31:对指标层所涉及的原始数据进行收集、计算和整理;
步骤S32:确定评价单元;小流域是具有相对完整自然生态过程的区域单元,基于Arcgis水文分析模块,利用DEM数据确定研究区边界及其内部小流域边界,并以提取的小流域作为评价单元,在新疆开孔河流域确定了682个小流域作为评价单元;
步骤S33:计算指标层指标;对于不需要评价单元直接基于栅格的数值型评价指标,如植被指数、叶面积指数,直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品;包括坡度、坡向在内的地形因子通过对DEM的处理获取,气象指标通过Anusplin专业气象插值软件插值获取,或者直接使用相关的数据产品;对于基于评价单元的评价指标,如土地垦殖率、人类干扰度、香浓多样性指数,首先按照公式计算其在每个评价单元中指标的数值,然后将矢量面状数据栅格化,从而将所有指标都统一为栅格格式;
步骤S34:指标体系中的定量评价指标与生态健康的关系有正向和负向之分,将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理,其值标准化为0-1之间:
Figure BDA0001855374660000091
Figure BDA0001855374660000092
式中,nij是第i个评价指标上第j个栅格的标准化值;xij是第i个评价指标上第j个栅格的原始值;max(xi)是第i个评价指标的最大值;min(xi)是第i个评价指标的最小值,从而把各要素层诊断指标的值归一化到[0,1]。
在本实施例中,步骤S4具体包括以下步骤:
步骤S41:按照网状指标体系结构,将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA;PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量,当PC1的方差贡献率大于等于85%时,将各指标在PC1线性组合中的系数作为指标重要性排序的标准;当PC1的方差贡献率小于85%时,选取主成分的累积方差贡献率大于85%的前n个主成分,并按其方差贡献率作为权重进行主成分的组合,将组合的主成分变量用以代替原有要素层的抽象指标;
步骤S42:将步骤S41中通过PCA所获取的要素层指标进行主成分分析,按照S41中所述方法确定所要选取的n个主成分,并计算指标在这n个主成分中的线性组合中的系数;主成分的方差贡献率越大则该主成分的重要性越强,将方差贡献率看成是不同主成分的权重,因此,以这n个主成分方差贡献率为权重,对指标在这n个主成分线性组合中的组合系数做加权平均,得到组合系数;最后对指标组合系数进行归一化处理,计算出要素层的各指标权重;
步骤S43:将指标层指标按照要素层的结构分组使用熵权法确定指标权重;
步骤S44:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重:
w'ij=wi×wij
式中,i表示第i个要素层,wi为要素层指标权重,wij为第i个要素层对应的第j个指标层指标熵值权重,w'ij为第i个要素层对应的第j个指标层指标的组合权重;
步骤S45:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
在本实施例中,步骤S43中,所述使用熵权法确定指标权重的基本步骤如下:
步骤S431:定义熵;根据信息论中信息熵的定义,对于m个评价指标、n个评价对象的评估问题中,第i个指标的熵Hi定义为:
Figure BDA0001855374660000101
式中,k=1/lnn,
Figure BDA0001855374660000102
nij是第i个评价指标上第j个栅格的标准化值,当fij=0是,令fijlnfij=0;
步骤S432:计算熵权wi
Figure BDA0001855374660000111
式中,0≤wi≤1,
Figure BDA0001855374660000112
在本实施例中,步骤S5具体包括以下步骤:
步骤S51:通过线性代数的矩阵来表示指标体系的结构,并将各层次之间的网络关系量化表示,构建指标层指标与要素层的关系矩阵R;如果要素层与指标层没有关联,就设为0;如果两者有关联,则设为1:
Figure BDA0001855374660000113
式中,行与要素层指标对应,K表示要素层指标的个数;列与指标层指标对应,J表示指标层指标个数;k为要素层的指标序号,j为指标层的指标序号,rkj表示要素层k与指标层j是否有关联关系;
步骤S52:构建自动化指标筛选模型:
Figure BDA0001855374660000114
Figure BDA0001855374660000115
式中,Z代表指标层(j)指标要选择的数目;x4j代表备选评价指标dj是否被选;X4代表方程解集,W4表示指标的权重,′表示转置;目标方程表示指标选取满足选取的指标层指标数据最少;约束条件(1)表示以要素层(ck)的指标作为保障生态完整性的目标层,每个指标所衍生的dj指标中至少有一个对应被选取;约束条件(2)表示参照主成分分析法的要求,被选指标权重占原始权重比例不低于85%;约束条件(3)表示备选指标只能被选择(=1)或者被排除(=0);约束条件(4)表示备选指标层指标个数;约束条件(5)表示要素层指数个数;
步骤S53:通过遗传算法(GA)对步骤S52中的自动化指标筛选模型进行迭代求解,迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标,直到无法满足筛选条件,不再有指标被去除为止,则停止迭代的过程,得到自动化指标筛选模型的选取结果。
在本实施例中,步骤S6具体包括以下步骤:
步骤S61:将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除,然后将要素层指标按照步骤S4计算权重;如果要素层所对应的指标层指标仅有一个,则直接将该指标层指标权重设为1;
步骤S62:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重;
步骤S63:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
在本实施例中,以流域生态健康诊断为目标层,以压力、状态、响应为准则层,将准则层细分为土地压力、人口压力、活力等要素层,再以能够梁华的栅格诊断指标作为指标层。图2为补充要素层与指标层之间的指标联系,形成“网状”生态健康诊断指标体系。表1为基于生态健康诊断“网状”指标体系并结合主成分分析、熵权法、二次权重分配法计算的要素层和指标层的权重。
从表1中,通过主成分分析的方法获取的要素层的指标权重较为合理,且比等权重方法和层次法等更有说服力。通过利用要素层指标对指标层指标进行约束,再结合二次权重分配法,更体现生态系统的层次性和完整性,不同指标的权重存在差异,很好地区分了不同指标的重要性,而且整个过程都是通过客观的方法获取的指标的权重,可以避免人的主观影响。
表1生态健康诊断指标权重表
Figure BDA0001855374660000131
Figure BDA0001855374660000141
表2筛选后指标及权重分配
Figure BDA0001855374660000142
在本实例中,利用自动化的指标筛选模型完成指标的筛选工作。如图3所示,为本实例筛选后的生态健康诊断指标体系,可以发现要素层指标所衍生的指标中至少有一个对应选取,保证了指标体系的完整性。表2为指标筛选后所留下的指标层指标,指标原始权重以及指标权重再次分配后的权重,从表2中可以看出,在本实例中,将生态健康诊断指标体系评价指标体系从31个优化到17个,用54.8%的指标表达了85.98%的信息,可全面反应生态健康诊断的各种考虑方面,保证了指标体系的简洁与整体性并且排除了人的主观判断的影响。
本实施例引入“网状”生态健康诊断指标体系并结合一种新的指标权重确定方法,提出一种自动化的指标筛选方法,即构建“网状”生态健康诊断指标体系代替传统的“树杈状”指标体系以反映复杂系统的真实交叉联系,通过主成分分析、熵权法、二次权重分配法相结合解决传统无法客观获取抽象层指标权重和权重分配不合理的问题;通过自动化的指标筛选模型解决传统指标设置随意、冗余的问题。本实施例所提出的一种生态健康诊断中指标自动化筛选方法,既能反映生态系统系统真实交叉联系,又实现了指标筛选过程的定量化和自动化,避免了计算指标权重和指标筛选的过程中人的主观影响,提高了指标筛选过程的科学性和客观性。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (5)

1.一种生态健康诊断的指标自动化筛选方法,其特征在于:包括以下步骤:
步骤S1:收集用于生态健康诊断的评价指标;
步骤S2:分析步骤S1所收集的评价指标之间存在的交叉联系,构建多层次的网状生态健康诊断指标体系;
步骤S3:计算生态健康诊断的指标并归一化,构建生态健康诊断指标数据集;
步骤S4:综合利用主成分分析和熵权法,计算指标权重;
步骤S5:构建自动化指标筛选模型开展指标自动化筛选;
步骤S6:指标权重再分配;
其中,步骤S2具体包括以下步骤:
步骤S21:根据研究目标,设定目标层,根据压力-状态-响应模型的理论框架构建准则层,将准则层细分为多个要素层,并以在实践中能够量化的生态指标作为指标层,从而完成具有层次结构的树状生态健康诊断指标体系的构建,包括目标层-准则层-要素层-指标层4个层次;
步骤S22:分析并补充要素层与指标层之间的指标联系,形成网状的生态健康诊断指标体系;在网状指标体系中,指标层指标与要素层指标的联系包括1对1的关系以及1对多的关系;
其中,步骤S3具体包括以下步骤:
步骤S31:对指标层所涉及的原始数据进行收集、计算和整理;
步骤S32:确定评价单元;小流域是具有相对完整自然生态过程的区域单元,基于Arcgis水文分析模块,利用DEM数据确定研究区边界及其内部小流域边界,并以提取的小流域作为评价单元;
步骤S33:计算指标层指标;对于不需要评价单元直接基于栅格的数值型评价指标,如植被指数、叶面积指数,直接通过对遥感数据进行相关波段运算或者直接使用相关的数据产品;包括坡度、坡向在内的地形因子通过对DEM的处理获取,气象指标通过Anusplin专业气象插值软件插值获取,或者直接使用相关的数据产品;对于基于评价单元的评价指标,如土地垦殖率、人类干扰度、香农 多样性指数,首先按照公式计算其在每个评价单元中指标的数值,然后将矢量面状数据栅格化,从而将所有指标都统一为栅格格式;
步骤S34:指标体系中的定量评价指标与生态健康的关系有正向和负向之分,将正向指标和负向指标分别采用公式(1)或公式(2)进行标准化处理,其值标准化为0-1之间:
Figure FDA0003041862630000021
Figure FDA0003041862630000022
式中,nij是第i个评价指标上第j个栅格的标准化值;xij是第i个评价指标上第j个栅格的原始值;max(xi)是第i个评价指标的最大值;min(xi)是第i个评价指标的最小值,从而把各要素层诊断指标的值归一化到[0,1];
其中,步骤S6具体包括以下步骤:
步骤S61:将在指标筛选过程中去除的要素层指标在网状生态健康诊断指标体系中删除,然后将要素层指标按照步骤S4计算权重;如果要素层所对应的指标层指标仅有一个,则直接将该指标层指标权重设为1;
步骤S62:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S61中计算所得的指标权重与其对应的要素层指标在步骤S4中计算所得的指标权重相乘得到组合权重;
步骤S63:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
2.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S1具体为:通过收集统计国内外相关文献在生态健康诊断领域的研究中所采用的高频生态健康诊断指标和区域生态健康诊断的典型指标,并去除无法获取的指标,得到用于区域生态健康诊断的评价指标集。
3.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S4具体包括以下步骤:
步骤S41:按照网状指标体系结构,将要素层所对应的指标层归一化后的指标分组进行主成分分析PCA;PCA中的第一主分量PC1是对原始多变量数据集方差贡献最大的新变量,当PC1的方差贡献率大于等于85%时,将各指标在PC1线性组合中的系数作为指标重要性排序的标准;当PC1的方差贡献率小于85%时,选取主成分的累积方差贡献率大于85%的前n个主成分,并按其方差贡献率作为权重进行主成分的组合,将组合的主成分变量用以代替原有要素层的抽象指标;
步骤S42:将步骤S41中通过PCA所获取的要素层指标进行主成分分析,按照S41中所述方法确定所要选取的n个主成分,并计算指标在这n个主成分中的线性组合中的系数;主成分的方差贡献率越大则该主成分的重要性越强,将方差贡献率看成是不同主成分的权重,因此,以这n个主成分方差贡献率为权重,对指标在这n个主成分线性组合中的组合系数做加权平均,得到组合系数;最后对指标组合系数进行归一化处理,计算出要素层的各指标权重;
步骤S43:将指标层指标按照要素层的结构分组使用熵权法确定指标权重;
步骤S44:使用要素层指标的权重结果对指标层指标权重进行约束,将指标层在步骤S43中计算所得的指标权重与其对应的要素层指标在步骤S42中计算所得的指标权重相乘得到组合权重:
w'ij=wi×wij
式中,i表示第i个要素层,wi为要素层指标权重,wij为第i个要素层对应的第j个指标层指标熵值权重,w'ij为第i个要素层对应的第j个指标层指标的组合权重;
步骤S45:将同一个指标从不同要素层获取的多个权重进行合并,进行指标权重的二次分配,使得最终指标层每个指标的权重是唯一的。
4.根据权利要求3所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S43中,所述使用熵权法确定指标权重的基本步骤如下:
步骤S431:定义熵;根据信息论中信息熵的定义,对于m个评价指标、n个评价对象的评估问题中,第i个指标的熵Hi定义为:
Figure FDA0003041862630000041
式中,k=1/ln n,
Figure FDA0003041862630000042
nij是第i个评价指标上第j个栅格的标准化值,当fij=0时,令fijln fij=0;
步骤S432:计算熵权wi
Figure FDA0003041862630000043
式中,0≤wi≤1,
Figure FDA0003041862630000044
5.根据权利要求1所述的一种生态健康诊断的指标自动化筛选方法,其特征在于:步骤S5具体包括以下步骤:
步骤S51:通过线性代数的矩阵来表示指标体系的结构,并将各层次之间的网络关系量化表示,构建指标层指标与要素层的关系矩阵R;如果要素层与指标层没有关联,就设为0;如果两者有关联,则设为1:
Figure FDA0003041862630000045
式中,行与要素层指标对应,K表示要素层指标的个数;列与指标层指标对应,J表示指标层指标个数;k为要素层的指标序号,j为指标层的指标序号,rkj表示要素层k与指标层j是否有关联关系;
步骤S52:构建自动化指标筛选模型:
Figure FDA0003041862630000046
Figure FDA0003041862630000051
式中,Z代表指标层指标要选择的数目;x4j代表备选评价指标dj是否被选;X4代表方程解集,W4表示指标的权重,′表示转置;目标方程表示指标选取满足选取的指标层指标数据最少;约束条件(1)表示以要素层的指标作为保障生态完整性的目标层,每个指标所衍生的dj指标中至少有一个对应被选取;约束条件(2)表示参照主成分分析法的要求,被选指标权重占原始权重比例不低于85%;约束条件(3)表示备选指标只能被选择或者被排除;约束条件(4)表示备选指标层指标个数;约束条件(5)表示要素层指数个数;
步骤S53:通过遗传算法对步骤S52中的自动化指标筛选模型进行迭代求解,迭代的方案是每次去除此次遗传算法所确定去除的指标中权重最小的指标,直到无法满足筛选条件,不再有指标被去除为止,则停止迭代的过程,得到自动化指标筛选模型的选取结果。
CN201811312526.8A 2018-11-06 2018-11-06 一种生态健康诊断的指标自动化筛选方法 Active CN109408773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811312526.8A CN109408773B (zh) 2018-11-06 2018-11-06 一种生态健康诊断的指标自动化筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811312526.8A CN109408773B (zh) 2018-11-06 2018-11-06 一种生态健康诊断的指标自动化筛选方法

Publications (2)

Publication Number Publication Date
CN109408773A CN109408773A (zh) 2019-03-01
CN109408773B true CN109408773B (zh) 2021-06-29

Family

ID=65471808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811312526.8A Active CN109408773B (zh) 2018-11-06 2018-11-06 一种生态健康诊断的指标自动化筛选方法

Country Status (1)

Country Link
CN (1) CN109408773B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472818B (zh) * 2019-07-03 2022-03-15 北京林业大学 一种快速评价扰动湿地恢复力的方法
CN113130073B (zh) * 2020-01-16 2024-01-19 宏碁股份有限公司 利用自动化机制挑选影响力指标的方法及电子装置
CN114384435A (zh) * 2021-12-09 2022-04-22 国网天津市电力公司 一种基于wsa-lstm算法的新能源汽车动力电池剩余使用寿命自适应预测方法
CN114626771B (zh) * 2022-05-18 2022-08-02 中山大学 一种城市区域水生态状态反应器构建方法、装置及反应器
CN116485205A (zh) * 2023-04-24 2023-07-25 中国农业科学院草原研究所 基于模型指标层次化叠加的生态预警方法、装置及设备
CN117332923B (zh) * 2023-10-09 2024-03-26 北京京航计算通讯研究所 一种网状指标体系的赋权方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355016A (zh) * 2016-08-30 2017-01-25 天津大学 基于协调发展度的河流健康评价方法
CN107093013A (zh) * 2017-04-12 2017-08-25 山东大学 一种考虑水文指标分布规律的水文情势评价方法
CN107122927A (zh) * 2017-06-27 2017-09-01 河海大学 一种调水引流水环境改善效果综合评价方法
CN107391939A (zh) * 2017-07-25 2017-11-24 河海大学 一种量化的流域相似性综合评价指标计算方法
CN108364130A (zh) * 2018-02-08 2018-08-03 北京中科乾和环保科技服务有限公司 一种小型人工湖库生态健康评估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355016A (zh) * 2016-08-30 2017-01-25 天津大学 基于协调发展度的河流健康评价方法
CN107093013A (zh) * 2017-04-12 2017-08-25 山东大学 一种考虑水文指标分布规律的水文情势评价方法
CN107122927A (zh) * 2017-06-27 2017-09-01 河海大学 一种调水引流水环境改善效果综合评价方法
CN107391939A (zh) * 2017-07-25 2017-11-24 河海大学 一种量化的流域相似性综合评价指标计算方法
CN108364130A (zh) * 2018-02-08 2018-08-03 北京中科乾和环保科技服务有限公司 一种小型人工湖库生态健康评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Assessing the ecological health of rivers when they are dry;Alisha L. Steward et.al;《https://doi.org/10.1016/j.ecolind.2017.10.053》;20180228;全文 *
基于指标自动筛选的新疆开孔河流域生态健康评价;汪小钦 等;《生态学报》;20200715;第40卷(第13期);全文 *

Also Published As

Publication number Publication date
CN109408773A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109408773B (zh) 一种生态健康诊断的指标自动化筛选方法
Wang et al. Novel approach to efficient slope reliability analysis in spatially variable soils
CN118350678B (zh) 基于物联网与大数据的水环境监测数据处理方法及系统
CN116451879B (zh) 一种干旱风险预测方法、系统及电子设备
CN108877905B (zh) 一种基于Xgboost框架的医院门诊就诊量预测方法
CN104809335A (zh) 一种环境变化对疾病发病影响的分析预测模型
CN107767954A (zh) 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法
CN110276477B (zh) 一种基于分层贝叶斯网络和增量学习的洪水预报方法
CN101480143A (zh) 一种预测灌区作物单产量的方法
CN102609612B (zh) 一种用于多参数仪表检定的数据融合方法
CN118171761A (zh) 一种雨量站网优化方法及系统
CN116680548B (zh) 一种针对多源观测数据的时间序列干旱因果分析方法
CN108984995A (zh) 一种计算数值模拟的生态园林景观设计方法
CN118690656A (zh) 一种多模型集成径流模拟方法及系统
CN106294932B (zh) 不同变化条件对流域径流不确定性影响的分析方法
CN115049135A (zh) 基于vmd和注意力机制前置的lstm中长期径流量预测方法
Das et al. Coastal groundwater quality prediction using objective-weighted WQI and machine learning approach
CN117807917A (zh) 基于场次洪涝灾害的损失函数构建方法和系统
Renton et al. Functional–structural plant modelling using a combination of architectural analysis, L-systems and a canonical model of function
CN112287299A (zh) 河流健康变化定量归因方法、装置及系统
Wang et al. A fuzzy intelligent system for land consolidation–a case study in Shunde, China
CN117408565A (zh) 一种用于土遗址片状剥离发育程度量化评估及预测的方法
CN116451905A (zh) 一种基于贝叶斯支持向量机和两步析因分析的需水量预测方法
CN115481366A (zh) 一种基于空间降尺度回归模型的耕地资源生产潜力测算方法
CN119539503B (zh) 一种基于多模式组合最优化的山洪灾害预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant