CN119379092A - 人工湿地生态系统性能评价方法 - Google Patents
人工湿地生态系统性能评价方法 Download PDFInfo
- Publication number
- CN119379092A CN119379092A CN202411495847.1A CN202411495847A CN119379092A CN 119379092 A CN119379092 A CN 119379092A CN 202411495847 A CN202411495847 A CN 202411495847A CN 119379092 A CN119379092 A CN 119379092A
- Authority
- CN
- China
- Prior art keywords
- index
- performance
- value
- artificial wetland
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Algebra (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
Abstract
本发明提供人工湿地生态系统性能评价方法,包括,步骤一:确定人工湿地生态系统评估的优化指标,并验证所述优化指标能够代替原始指标;所述确定人工湿地生态系统评估的优化指标包括对原始指标的数据进行处理,通过主成分分析与相关性分析筛选出最能评估人工湿地性能的指标作为优化指标;步骤二:构建输入数据为所述优化指标和评估值的逻辑回归模型,获得以所述优化指标为自变量、评估值为因变量的模拟方程;并验证模拟方程的准确性;步骤三:根据验证准确后的所述模拟方程即可计算性能估算值;根据评估值评价人工湿地生态系统的性能。减少了人工湿地性能评价所需要用到的指标,大大降低了人工湿地性能评价的复杂程度。
Description
技术领域
本发明涉及环保技术领域,具体为人工湿地生态系统性能评价方法。
背景技术
人工湿地生态系统性能评价具有重要的意义,它不仅关系到人工湿地的设计和运行效果,还直接影响到其在环境保护和资源利用方面的效益。
现有的相关技术,包括公开号为CN101916425A,名称为:一种用于人工湿地生态系统服务综合评价的方法,其公开了通过将层次分析法与模糊隶属函数法相结合,共同评价人工湿地生态系统服务,在层次分析法的运用中首先采取专家打分,构造准则层和指标层的比较判断矩阵,并通过MATLAB软件计算各个判断矩阵的权重向量,其次通过MATLAB软件进行准则层和指标层的层次单排序及一致性检验,并将层次进行总排序并检验一致性,随后根据对研究对象的跟踪监测及其指标层各指标的特点,求出原始数值,利用模糊隶属函数法构建指标层各指标的模糊隶属函数,并把指标层各指标的原始值代入其模糊隶属函数中,求出各个指标的模糊隶属度。模糊隶属函数法能实现各种数据的无量纲化,将各类数据转化为[0,1]区间内的数值,进而计算各个指标的模糊隶属度用于人工湿地生态系统服务综合指数的计算。
现有技术的专利中通过多个指标来综合评价人工湿地生态系统服务,使用的指标较多,导致在计算方面较为复杂。没有简化人工湿地的监测指标,并且也没有对人工湿地性能进行模拟,只是通过模糊隶属函数法来计算人工湿地的生态系统服务指数。
发明内容
针对现有技术存在的不足,本发明目的是提供人工湿地生态系统性能评价方法、设备,可以解决现有的问题。
为了实现上述目的,本发明是技术方案如下:
本发明是通过如下的技术方案来实现:人工湿地生态系统性能评价方法,包括以下步骤:
步骤一:确定人工湿地生态系统评估的优化指标,并验证所述优化指标能够代替原始指标;
所述确定人工湿地生态系统评估的优化指标包括对原始指标的数据进行处理,通过主成分分析与相关性分析筛选出最能评估人工湿地性能的指标作为优化指标;
步骤二:构建输入数据为所述优化指标和评估值的逻辑回归模型,获得以所述优化指标为自变量、评估值为因变量的模拟方程;并验证模拟方程的准确性;
步骤三:根据验证准确后的所述模拟方程即可计算性能估算值;根据评估值评价人工湿地生态系统的性能。
进一步的,所述通过主成分分析与相关性分析筛选出最能评估人工湿地性能的指标作为优化指标;包括
所述主成分分析采用从降维提取数据的主要成分,分析主要成分中指标的权重,确定重要指标;
所述相关性分析采用计算斯皮尔曼秩相关系数,捕捉其中的线性关系,确定最强指标;
以重要指标和最强指标都包含的指标作为优化指标。
进一步的,所述验证所述优化指标能够代替原始指标,包括:
确定人工湿地性能值;
构建原始指标、优化指标和人工湿地性能值之间的梯度提升树模型,使用训练集分别训练两个模型,对训练好的两个模型的测试集进行预测,得到预测结果;
通过比较原始指标模型和优化指标模型之间的均方误差和决定系数来验证结果。
进一步的,所述确定人工湿地性能值包括:
若人工湿地生态系统同时含有定性指标、定量指标的数据,利用层次分析法计算权重,根据层次分析法的加权评分结果确定人工湿地性能值;
若人工湿地生态系统仅含有定量指标的数据则用熵权法来计算权重,再根据权重,构建TOPSIS标准化评价矩阵,得出评估人工湿地处理性能优劣的值,确定人工湿地性能值。
进一步的,所述定性指标包括生态效益、社会效益、经济效益和运行与维护;
所述定量指标包括进出水的氨氮、硝态氮、亚硝态氮、总氮、总磷和化学需氧量的浓度。
进一步的,所述构建输入数据为所述优化指标和评估值的逻辑回归模型,获得以所述优化指标为自变量、评估值为因变量的模拟方程,包括:
2.1、构建数据集
数据矩阵X:
上式中,n为优化后的指标,m为样本数量;
标签向量y:表示加权评分或者贴近度,范围在0-1之间;
2.2、将数据集划分为训练集和测试集,80%的数据用于训练,20%的数据用于测试;
训练集:
测试集:
2.3、训练逻辑回归模型
使用训练集Xtrain和ytrain训练逻辑回归模型;模型的目标是找到参数β,使得预测值在最大程度上与真实值相符;其中逻辑回归模型的假设函数为:
是逻辑回归模型的假设函数,Xn是第n个特征值;
2.4、模型预测
使用训练集得出的参数β对测试集数据Xtest进行预测,得到每个测试样本的预测值预测公式为:
进一步的,所述验证模拟方程的准确性包括拟合模拟值和真实值,验证模拟方程的准确性。
进一步的,所述验证模拟方程的准确性包括拟合模拟值和真实值,验证模拟方程的准确性,模拟方程如下:
F=β0+β1X1+β2X2+…+βnXn
式中,β0是截距,X1,X2...Xn代表优化指标,β1,β2...βn则为优化指标对应的参数;F为计算出的加权评分或者贴近度;
将模拟方程的计算值和原始值进行线性拟合,得出决定系数R2值,若R2大于0.8则说明模拟方程可以用来简化人工湿地性能评估的计算;
式中,yi是原始加权评分或者贴近度值,是模拟方程的计算值,是原始贴近度的均值。
一种基于人工湿地生态系统性能评价设备,其特征在于:包括处理器以及存储器;所述存储器用于存储程序;所述处理器执行所述程序实现上述所述的方法。
一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现上述所述的方法。
与现有技术相比,本发明的有益效果包括:
本发明在对数据进行主成分分析法降维,提取主成分中系数值较大的特征向量作为重要指标的基础上,还结合了相关性分析,从多角度分析数据中存在的与贴近度或者加权评分相关性更强的指标,从而达到筛选指标代替原始指标进行计算的目的。并利用梯度提升树模型中验证筛选出的优化指标的合理性,这区别于以往技术中,仅使用主成分分析对数据集进行降维,而不考虑其中特征向量系数值对主成分的影响大小。同时使用的相关性分析,也进一步加强了指标的筛选结果的可靠性和说服性。此外,本发明使用了逻辑回归模型构建出人工湿地指标和贴近度或者加权评分的线性模拟方程,这大大减少了评价人工湿地性能的复杂程度,并且能得出与原始值较吻合的结果。本发明的独特之处在于减少了人工湿地性能评价所需要用到的指标,这意味着通过更少的数据就能得到相同甚至更好的结果,并且模型计算结果准确度高,大大降低了人工湿地性能评价的复杂程度。
附图说明
参照附图来说明本发明的公开内容。应当了解,附图仅仅用于说明目的,而并非意在对本发明的保护范围构成限制,在附图中,相同的附图标记用于指代相同的部件。其中:
图1为本发明人工湿地生态系统性能评价方法流程示意图。
具体实施方式
容易理解,根据本发明的技术方案,在不变更本发明实质精神下,本领域的一般技术人员可以提出可相互替换的多种结构方式以及实现方式。因此,以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。
本发明提供一种人工湿地生态系统性能评价方法,如图1所示,包括以下步骤:
步骤一:确定人工湿地生态系统评估的优化指标,并验证所述优化指标能够代替原始指标;
1.1:确定优化指标
具体的,所述确定人工湿地生态系统评估的优化指标包括对原始指标的数据进行处理,通过主成分分析与相关性分析筛选出最能评估人工湿地性能的指标作为优化指标;
具体的,先通过主成分分析降维来提取主要成分,并进一步分析这些主成分中指标的权重,以选择最重要的指标。其次通过计算斯皮尔曼秩相关系数进行相关性分析,捕捉其中的非线性关系,进而找出相关性最强的几个指标。最后,选择在主成分分析中和相关性分析中都包含的指标作为优化指标。
(1.11)主成分分析
主成分分析是一种常见的降维技术,主要用于将高维数据转换为低维数据,同时尽可能保留数据的主要信息。核心思想是通过线性变换,将原始数据映射到一个新的坐标系中,使得新坐标系的各个轴(即主成分)彼此正交,且这些主成分按照数据的方差从大到小排序。前几个主成分包含了数据中的大部分信息,因此可以使用它们来近似表示原始数据,达到降维的目的。
(1):对每个指标进行标准化,使其均值为0,标准差为1。在同时含有定性数据和定量数据的时候,将加权评分进行标准化计算。在只含有定量数据的时候,将水质指标进行标准化计算。
标准化公式为:
其中:
式中,Yij是第i个样本在第j个指标下的原始值,是第j个指标的均值,Sj是第j个指标的标准差,m代表样本数量。Zij是第i个样本在第j个指标下的标准化值。
(2):计算标准化数据的协方差矩阵,对于标准化后的数据矩阵Z,协方差矩阵C是:
式中,ZT是Z的转置矩阵。
(3):从协方差矩阵C中计算特征值和特征向量。
CvK=λkvk
式中,λk是第k个特征值,vk是对应的特征向量;C为协方差矩阵。
(4):选择主成分
根据特征值的大小选择主成分,选择能解释大部分方差的主成分。特征值排序从大到小,前k个特征值对应的特征向量构成主成分。
(5):构建主成分,将标准化的数据投影到选定的主成分上。
T=ZVk
式中,T是新的主成分矩阵,Vk是选定的k个特征向量组成的矩阵。
(6):分析主成分,分析每个主成分的载荷(即特征向量的系数)来理解原始指标的贡献。主成分载荷矩阵P可以从特征向量中得到。
P=Vk
式中,P是主成分载荷矩阵,其中每列对应一个主成分,每行对应一个原始指标。
通过特征向量的系数值的大小判断原始指标对主成分的重要性,系数值越大则说明该原始指标对主成分的影响越大,反之,系数值越小则说明原始指标体现不了主成分的特性。以系数值0.5为筛选原则,选择每个主成分中系数值都大于0.5的指标作为优化指标1。
(1.12)相关性分析
通过计算斯皮尔曼秩相关系数,判断两个变量之间的关系强弱。它基于数据的秩序而不是原始值。相关系数的值介于-1和1之间,数值越接近1或-1,表示两个变量之间的关系越强;接近0则表示关系较弱。正相关为相关系数接近1,负相关则为接近-1。
(1):数据排序
将两个变量x和y中的所有数据分别进行排序,并为每个数据分配一个秩(R)。若数据有相同的值,则为这些值赋予相同的平均秩。秩是数据排序后的位置编号,用于评估数据在群体中的相对位置。计算秩的目的是消除原始数据中的量纲和单位差异,只保留数据的排序信息,从而使分析更具鲁棒性。其中,在同时含有在同时含有定性数据和定量数据的时候,x,y分别代表量化的数据和加权评分。在只含有定量数据的时候,x,y分别代表定量数据和贴近度。
(2):计算秩差
对于每对数据(xi,yi)计算它们的秩差di=R(xi)-R(yi)
(3):计算斯皮尔曼秩相关系数
式中,ρ是斯皮尔曼秩相关系数,m代表样本数量。ρ的取值范围是[-1,1]。
相关系数值ρ大于0.5的指标为优化指标2。
选择在优化指标1和优化指标2中都存在的水质指标作为优化指标。
1.2、并验证所述优化指标能够代替原始指标
1.21、确定人工湿地性能值;
具体的,人工湿地往往包含着定性数据(包括但是不限于生态效益、社会效益、经济效益和运行与维护等)和定量数据(包括但是不限于进出水的氨氮、硝态氮、亚硝态氮、总氮、总磷和化学需氧量的浓度等)。在同时含有定性、定量数据的权重计算时用到层次分析法,根据层次分析法的加权评分结果可以判断人工湿地的性能。而仅含有定量数据则用熵权法来计算权重,再根据权重,构建TOPSIS标准化评价矩阵,得出评估人工湿地处理性能优劣的值(T)。将计算值(T)命名为贴近度。贴近度范围在0-1之间,它可以评估人工湿地的性能优良。贴近度可以划分为5个等级,分别为0-0.2(Ⅰ)、0.2-0.4(Ⅱ)、0.4-0.6(Ⅲ)、0.6-0.8(Ⅳ)、0.8-1.0(Ⅴ)。贴近度值越大意味着人工湿地性能越好。
1.211:对定性和定量指标使用层次分析法计算权重
(1)建立层次结构模型
目标层为人工湿地性能评价,准则层为水质、生态效益、景观价值、经济效益和管理水平等,指标层为具体的计算指标,包括:进出水的氨氮、硝态氮、亚硝态氮、总氮、总磷和化学需氧量的浓度、生物多样性指数、植被覆盖率、景观价值、建设成本、运行成本、管理水平和维护频率。
(2)根据专家打分构建准则层和指标层的判断矩阵
设计人工湿地性能评价专家打分调查问卷并通过邮件的形式发送给专家,获得打分结果后(打分结果范围为1-100)。随后对每个计算指标求取平均值,来构建每个层次的判断矩阵。
判断矩阵的形式为:
式中,n代表指标,A为判断矩阵
(3)计算权重向量
(3.1)求特征值与权重向量
AW=λW
式中,W=[w1,w2…wn]T,W是权重向量,λ是对应的特征值。通过此公式可以计算出最大特征值λmax和其对应的权重向量,最为最终的权重向量。
(3.2)归一化权重向量
为了让特征向量W的所有权重和为1,需要进行归一化
式中,wj是归一化后的权重。
(4)一致性检验
式中,CI是用于衡量判断矩阵的一致性的指标,λmax是判断矩阵的最大特征值,n是指标的个数。CR是一致性比率,RI是随机一致性指标,根据矩阵维度n确定。如果CR<0.1,则判断矩阵有可接受的一致性。
(5)计算总体权重
wA=w准则×w指标
式中,wA是通过层次分析法计算出来的权重,w准则是准则层的权重,w指标是指标层的权重。
(6)计算加权评分
Wij=Sij×w′j
式中,Wij是第i个评价对象在第j个指标上的加权评分,Sij是i个评价对象在第j个指标上的专家打分值。
加权评分的范围在1-100之间,值越接近于100,则说明人工湿地的性能越好。
1.222:对定量指标进行熵权法计算权重
(1),归一化:
首先需要将人工湿地的定量数据进行归一化处理。这样做的目的是通过对不同量纲的指标进行比较和分析,最终使其映射在[0,1]进行处理。数据中存在正负指标的计算,正指标是值越大代表指标越好;相反,负向指标则是值越小越好,其计算公式如下:
正指标:
负指标:
式中:Xi和Yi分别是原始值和归一化值;Xmin和Xmax是样本中的最小值和最大值。
(2),熵权法:
熵是系统无序程度的一个度量,指标的信息熵越小,其指标值的变异程度越大,表示该指标提供的信息量越大,在综合评价中所起作用越大,权重越高;反之,亦然。在实际应用时,可以根据各指标值的变异程度,利用熵来计算各指标的权重,能得出较为客观的权重值。
(2.1):将以各分区指标数据作为列向量,构建含有m个评价对象和n个评价指标的矩阵。
R=(Yij)m×n
式中,R为评价矩阵,Yij为第i个评价对象在第j个指标上的数值。
(2.2):计算第i个评价对象中j个评价指标的特征比重。
式中,Pij为特征比重。
(2.3):指标熵值计算。
式中,ej为第j个指标的熵值,若Pij=0,PijlnPij=0。
(2.4):指标权重计算。
式中,wj为j个指标的权重。
(3),构建TOPSIS标准化评价矩阵:
(3.1)构建标准化评价矩阵(R):
(3.2)计算正、负理想解与欧式距离。
式中,R+为正理想解,表示评价体系中每个指标的最优值,即最大化目标的理想值。R-为负理想解,表示评价体系中每个指标的最差值,即最小化目标的理想值。
式中,D+为第i个评价对象与正理想解之间的欧式距离,表示评价对象与最优解的差距。D-为第i个评价对象与负理想解之间的欧式距离,表示评价对象与最差解的差距。
(3.3)计算各个指标与最优解的贴近度(T)
式中,T为第i个评价对象与最优解的贴近度,反映该评价对象在所有评价对象中的相对优劣程度。
1.22、构建原始指标、优化指标和人工湿地性能值之间的梯度提升树模型,使用训练集分别训练两个模型,对训练好的两个模型的测试集进行预测,得到预测结果;
构建原始指标、优化指标和贴近度之间的梯度提升树模型,使用训练集分别训练两个模型,对训练好的两个模型的测试集进行预测,得到预测结果。通过比较原始指标模型和优化指标模型之间的均方误差和R2来验证结果。
(一):划分数据集
原始数据:{Xorig,Yorig}
在同时含有在同时含有定性数据和定量数据的时候,Xorig是量化的数据矩阵,Yorig是加权评分。在只含有定量数据的时候,Xorig是原始水质指标矩阵,Yorig是原始贴近度值。
优化数据:{Xnew,Yorig},Xnew是优化指标矩阵。
训练集:{Xtrain,Ytrain}。
测试集:{Xtest,Ytest}。
(二):训练梯度提升树模型
2.1、训练基于原始数据的模型
(1)初始化模型:
式中,是基于原始模型的预测值,是基于原始模型的预测值,Norig是原始数据集的样本数量,yorig,i是原始数据集中的第i个样本的目标值。
(2)训练迭代过程:
计算残差:
式中,是第i个样本在第m轮的残差,yorig,i是第i个样本的加权评分或者原始贴近度值,xorig,i是第i个样本的特征向量,是第m-1轮的模型对第i个样本的预测值。
训练决策树:
式中,是决策树训练的损失函数,通常为残差的平方和,是第i个样本的残差平方。
更新模型:
式中,是第m轮的模型预测值,是第m-1轮的模型预测值,η是学习率,控制每棵树对模型的贡献程度,是第m棵树对输入x的预测值。
最终模型的预测值:
式中,是基于原始数据的最终模型预测值,B是总树的数量,是第b棵树的预测函数,Xorig,train是训练集中的原始量化数据。
2.2、训练基于优化数据的模型
(1)初始化模型
式中,是基于优化模型的预测值,是基于优化模型的预测值,Nnew是优化数据集的样本数量。
(2)训练迭代过程:
计算残差:
式中,是第i个样本在第m轮的残差,xnew,i是第i个样本的特征向量,
是第m-1轮的模型对第i个样本的预测值。
训练决策树:
式中,是决策树训练的损失函数,通常为残差的平方和,是第i个样本的残差平方。
更新模型:
式中,是第m轮的模型预测值,是第m-1轮的模型预测值,η是学习率,控制每棵树对模型的贡献程度,是第m棵树对输入x的预测值。
最终模型的预测值:
式中,是基于优化数据的最终模型预测值,B是总树的数量,是第b棵树的预测函数,Xnew,train是训练集中的优化指标。
(三):使用训练好的模型对测试集进行预测
对原始数据测试集进行预测:
式中,是基于原始模型在测试集上的预测值,Xtest是测试集中的原始指标。
对优化数据测试集进行预测:
式中,是基于优化指标的模型在测试集上的预测值,Xnew,test是测试集中的优化指标。
(四):计算评估指标
均方误差(MSE)
Ytest,i是测试集中第i个样本的真实值,是基于原始模型对测试集中第i个样本的预测值,是基于优化模型对测试集中第i个样本的预测值。
决定系数(R2)
1.23、通过比较原始指标模型和优化指标模型之间的均方误差和决定系数来验证结果。
如果MSEnew低于MSEorig同时高于则说明优化指标可以有效地代替原始指标。
步骤二:构建输入数据为所述优化指标和评估值的逻辑回归模型,获得以所述优化指标为自变量、评估值为因变量的模拟方程;并验证模拟方程的准确性;
利用逻辑回归模型分别构建优化指标和加权评分、贴近度之间的模型,得出以优化指标为自变量,加权评分、贴近度为因变量的方程表达式。并通过线性拟合方式验证准确性,线性拟合的R2大于0.8,则说明模拟方程可以使用。
步骤1:构建数据集
数据矩阵X:
式中,n为优化后的指标,m为样本数量。
标签向量y:表示加权评分或者贴近度,范围在0-1之间。
步骤2:将数据集划分为训练集和测试集,80%的数据用于训练,20%的数据用于测试。
训练集:
测试集:
步骤3:训练逻辑回归模型
使用训练集Xtrain和ytrain训练逻辑回归模型。模型的目标是找到参数β,使得预测值在最大程度上与真实值相符。其中逻辑回归模型的假设函数为:
是逻辑回归模型的假设函数,Xn是第n个特征值。
步骤4:模型预测
使用训练集得出的参数β对测试集数据Xtest进行预测,得到每个测试样本的预测值预测公式为:
步骤5:模型评估
使用测试集上的预测值和真实的加权评分或者贴近度ytest进行评估,通过决定系数R2评估模型的解释能力,计算公式为:
式中,是ytest的均值。如果R2大于0.8则说明预测值能与真实值较好的拟合;
出能简便评判人工湿地性能的模拟方程,并验证
5.1模拟方程如下:
F=β0+β1X1+β2X2+…+βnXn
式中,β0是截距,X1,X2...Xn代表优化指标,β1,β2...βn则为优化指标对应的参数。F为计算出的加权评分或者贴近度。
5.2将模拟方程的计算值和原始值进行线性拟合,得出决定系数R2值。若R2大于0.8则说明模拟方程可以用来简化人工湿地性能评估的计算。
式中,yi是原始加权评分或者贴近度值,是模拟方程的计算值,是原始贴近度的均值。
实施案例:获得产品或结果的性能的实验数据:
表1的数据是通过在仅有定量数据时,使用熵权法结合TOPSIS计算的贴近度值,与通过模拟方程计算的贴近度值的对比。根据表1可以得出两个方法计算的贴近度值的决定系数R2为0.88,大于规定值0.8。因此可以说明模拟方程可以代替熵权法计算贴近度值。
表1
步骤三:根据验证准确后的所述模拟方程即可计算性能估算值;根据评估值评价人工湿地生态系统的性能。
本发明在对数据进行主成分分析法降维,提取主成分中系数值较大的特征向量作为重要指标的基础上,还结合了相关性分析,从多角度分析数据中存在的与贴近度或者加权评分相关性更强的指标,从而达到筛选指标代替原始指标进行计算的目的。并利用梯度提升树模型中验证筛选出的优化指标的合理性。这区别于以往技术中,仅使用主成分分析对数据集进行降维,而不考虑其中特征向量系数值对主成分的影响大小。同时使用的相关性分析,也进一步加强了指标的筛选结果的可靠性和说服性。此外,本发明使用了逻辑回归模型构建出人工湿地指标和贴近度或者加权评分的线性模拟方程,这大大减少了评价人工湿地性能的复杂程度,并且能得出与原始值较吻合的结果。本发明的独特之处在于减少了人工湿地性能评价所需要用到的指标,这意味着通过更少的数据就能得到相同甚至更好的结果,并且模型计算结果准确度高,大大降低了人工湿地性能评价的复杂程度。
相比较背景技术的内容,本发明同样也使用到了层次分析法,但是有对人工湿地各种指标的进一步筛选和验证,简化了人工湿地性能评估所使用到的指标数量,同时也能达到和原有评价方法得到的结果相同。并且在简化指标的基础上,还对人工湿地的性能进行建模,而不只是通过模糊隶属函数法来进行初步的计算。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其他的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机取出存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。
Claims (10)
1.人工湿地生态系统性能评价方法,其特征在于:包括以下步骤:
步骤一:确定人工湿地生态系统评估的优化指标,并验证所述优化指标能够代替原始指标;
所述确定人工湿地生态系统评估的优化指标包括对原始指标的数据进行处理,通过主成分分析与相关性分析筛选出最能评估人工湿地性能的指标作为优化指标;
步骤二:构建输入数据为所述优化指标和评估值的逻辑回归模型,获得以所述优化指标为自变量、评估值为因变量的模拟方程;并验证模拟方程的准确性;
步骤三:根据验证准确后的所述模拟方程即可计算性能估算值;根据评估值评价人工湿地生态系统的性能。
2.根据权利要求1所述的人工湿地生态系统性能评价方法,其特征在于:所述通过主成分分析与相关性分析筛选出最能评估人工湿地性能的指标作为优化指标;包括
所述主成分分析采用从降维提取数据的主要成分,分析主要成分中指标的权重,确定重要指标;
所述相关性分析采用计算斯皮尔曼秩相关系数,捕捉其中的线性关系,确定最强指标;
以重要指标和最强指标都包含的指标作为优化指标。
3.根据权利要求1所述的人工湿地生态系统性能评价方法,其特征在于:所述验证所述优化指标能够代替原始指标,包括:
确定人工湿地性能值;
构建原始指标、优化指标和人工湿地性能值之间的梯度提升树模型,使用训练集分别训练两个模型,对训练好的两个模型的测试集进行预测,得到预测结果;
通过比较原始指标模型和优化指标模型之间的均方误差和决定系数来验证结果。
4.根据权利要求3所述的人工湿地生态系统性能评价方法,其特征在于:所述确定人工湿地性能值包括:
若人工湿地生态系统同时含有定性指标、定量指标的数据,利用层次分析法计算权重,根据层次分析法的加权评分结果确定人工湿地性能值;
若人工湿地生态系统仅含有定量指标的数据则用熵权法来计算权重,再根据权重,构建TOPSIS标准化评价矩阵,得出评估人工湿地处理性能优劣的值,确定人工湿地性能值。
5.根据权利要求4所述的人工湿地生态系统性能评价方法,其特征在于:所述定性指标包括生态效益、社会效益、经济效益和运行与维护;
所述定量指标包括进出水的氨氮、硝态氮、亚硝态氮、总氮、总磷和化学需氧量的浓度。
6.根据权利要求1所述的人工湿地生态系统性能评价方法,其特征在于:
所述构建输入数据为所述优化指标和评估值的逻辑回归模型,获得以所述优化指标为自变量、评估值为因变量的模拟方程,包括:
2.1、构建数据集
数据矩阵X:
上式中,n为优化后的指标,m为样本数量;
标签向量y:表示加权评分或者贴近度,范围在0-1之间;
2.2、将数据集划分为训练集和测试集,80%的数据用于训练,20%的数据用于测试;
训练集:
测试集:
2.3、训练逻辑回归模型
使用训练集Xtrain和ytrain训练逻辑回归模型;模型的目标是找到参数β,使得预测值在最大程度上与真实值相符;其中逻辑回归模型的假设函数为:
是逻辑回归模型的假设函数,Xn是第n个特征值;
2.4、模型预测
使用训练集得出的参数β对测试集数据Xtest进行预测,得到每个测试样本的预测值预测公式为:
7.根据权利要求1所述的人工湿地生态系统性能评价方法,其特征在于:所述验证模拟方程的准确性包括拟合模拟值和真实值,验证模拟方程的准确性。
8.根据权利要求7所述的人工湿地生态系统性能评价方法,其特征在于:所述验证模拟方程的准确性包括拟合模拟值和真实值,验证模拟方程的准确性,模拟方程如下:
F=β0+β1X1+β2X2+…+βnXn
式中,β0是截距,X1,X2...Xn代表优化指标,β1,β2...βn则为优化指标对应的参数;F为计算出的加权评分或者贴近度;
将模拟方程的计算值和原始值进行线性拟合,得出决定系数R2值,若R2大于0.8则说明模拟方程可以用来简化人工湿地性能评估的计算;
式中,yi是原始加权评分或者贴近度值,是模拟方程的计算值,是原始贴近度的均值。
9.一种基于人工湿地生态系统性能评价设备,其特征在于:包括处理器以及存储器;所述存储器用于存储程序;所述处理器执行所述程序实现如权利要求1-8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于:所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411495847.1A CN119379092A (zh) | 2024-10-25 | 2024-10-25 | 人工湿地生态系统性能评价方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411495847.1A CN119379092A (zh) | 2024-10-25 | 2024-10-25 | 人工湿地生态系统性能评价方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN119379092A true CN119379092A (zh) | 2025-01-28 |
Family
ID=94327765
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202411495847.1A Pending CN119379092A (zh) | 2024-10-25 | 2024-10-25 | 人工湿地生态系统性能评价方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN119379092A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119988516A (zh) * | 2025-04-16 | 2025-05-13 | 中国电建集团华东勘测设计研究院有限公司 | 一种基于多手段耦合的模块化抗堵塞人工湿地低甲烷排放机理揭示方法 |
-
2024
- 2024-10-25 CN CN202411495847.1A patent/CN119379092A/zh active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119988516A (zh) * | 2025-04-16 | 2025-05-13 | 中国电建集团华东勘测设计研究院有限公司 | 一种基于多手段耦合的模块化抗堵塞人工湿地低甲烷排放机理揭示方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN119989267B (zh) | 基于云计算的多源数据融合方法及系统 | |
| CN113408869A (zh) | 一种配电网建设目标风险评估方法 | |
| CN115982141B (zh) | 一种针对时序数据预测的特征优化方法 | |
| CN119089367A (zh) | 智能温控无铅锡条生产方法及装置 | |
| CN115640744A (zh) | 一种油田集输管道外腐蚀速率预测方法 | |
| CN118134649A (zh) | 基于深度学习的金融风险智能识别预测方法及系统 | |
| CN115017813B (zh) | 一种基于隐层增强变分对抗主动学习的软测量建模方法 | |
| CN117094835A (zh) | 面向社交媒体内容的多目标群体分类方法 | |
| CN120106278A (zh) | 海洋牧场水质参数多模型融合动态预测方法及系统 | |
| CN119379092A (zh) | 人工湿地生态系统性能评价方法 | |
| CN120068620A (zh) | 一种基于深度学习的注浆参数选型优化方法及系统 | |
| CN119415914A (zh) | 一种基于多能力指标融合的智能系统智能化等级评估方法 | |
| CN118798421A (zh) | 基于自适应模型和动态数据融合的水生态环境监测数据预测方法 | |
| CN119939176B (zh) | 基于多源异构数据的海洋ai分析和海洋灾害预测方法及系统 | |
| CN112651168B (zh) | 基于改进神经网络算法的建设用地面积预测方法 | |
| CN119992819B (zh) | 一种高速公路路域风险因素识别方法及装置 | |
| CN120579820A (zh) | 融合XGBoost-SHAP与LSTM的氢能系统风险因素辨识及事故严重程度预测方法 | |
| CN114021905A (zh) | 一种中小企业信用风险评价方法 | |
| CN119721791A (zh) | 一种新型配电网规划评估方法及系统 | |
| CN119209460A (zh) | 一种基于组合模型的配网线路峰值负荷预测方法及系统 | |
| CN116051322A (zh) | 一种基于神经网络算法的英语学习动机调控方法 | |
| CN116432856A (zh) | 基于cnn-glstm模型的管道动态预警方法及装置 | |
| CN111160419B (zh) | 一种基于深度学习的电子式互感器数据分类预测方法及装置 | |
| CN114357869A (zh) | 一种基于数据关系学习和预测的多目标优化代理模型设计方法及系统 | |
| CN120724161B (zh) | 基于汽车特征参数的多车型风阻系数实时预测方法及系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |