CN105023071A - 一种基于高斯云变换和模糊时间序列的水质预测方法 - Google Patents

一种基于高斯云变换和模糊时间序列的水质预测方法 Download PDF

Info

Publication number
CN105023071A
CN105023071A CN201510500644.1A CN201510500644A CN105023071A CN 105023071 A CN105023071 A CN 105023071A CN 201510500644 A CN201510500644 A CN 201510500644A CN 105023071 A CN105023071 A CN 105023071A
Authority
CN
China
Prior art keywords
fuzzy
water quality
sigma
cloud
gaussian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510500644.1A
Other languages
English (en)
Inventor
王国胤
邓伟辉
张学睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Institute of Green and Intelligent Technology of CAS
Original Assignee
Chongqing Institute of Green and Intelligent Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Institute of Green and Intelligent Technology of CAS filed Critical Chongqing Institute of Green and Intelligent Technology of CAS
Priority to CN201510500644.1A priority Critical patent/CN105023071A/zh
Publication of CN105023071A publication Critical patent/CN105023071A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于高斯云变换和模糊时间序列的水质预测方法,属于人工智能、水环境监测技术领域。该方法主要包括以下步骤:步骤1)通过高斯云变换将水质参数的历史观测值离散化到不同的粒度层次;步骤2)计算水质参数历史数据近似周期长度;步骤3)根据近似周期长度构建训练集;步骤4)运用模糊时间序列模型计算预测值。本发明提供的一种基于高斯云变换和模糊时间序列的水质预测方法,能够利用高斯云变换和模糊时间序列预测,有效的处理具有不确定性特征的水质数据集,预测结果具有更好的鲁棒性;通过融合水质数据近似周期,利用水质数据本身的内在特征,去除噪声数据,避免噪声数据影响预测精度,保证模型对数据有较高的自适应性。

Description

一种基于高斯云变换和模糊时间序列的水质预测方法
技术领域
本发明属于人工智能、水环境监测技术领域,涉及一种基于高斯云变换和模糊时间序列的水质预测方法。
背景技术
水不仅是人类社会生存和发展不可缺少的自然资源,而且是生态环境的重要组成部分。近年来,随着水污染事件的频繁发生,水资源管理和水污染控制已经逐渐成为世界各国环境管理部门重点关注的问题。水质参数预测作为水资源管理的重要方法和手段,能够为相关部门及时掌握水质变化发展趋势提供科学依据和决策支撑。目前,许多统计分析模型和人工智能方法已成功应用于河流水质参数预测,常用的统计分析模型有ARIMA模型和偏最小二乘回归模型等,Ahmad运用乘积季节ARIMA模型分析和预测印度恒河的电导率、叶绿素和BOD等水质参数。然而统计分析模型高度依赖于水质参数历史数据的分布,对于历史数据不服从高斯分布的水质参数表现出很差的预测精度,并且统计分析模型对水质多因素预测难度大。
水质预测应用最为广泛的人工智能和机器学习方法有人工神经网络(ANN)、支持向量机(SVM)和灰色理论模型(GM)。人工神经网络具有较好的预测能力,但其本身存在网络收敛速度慢、容易陷入局部极小值等问题,模型的泛化能力不强。支持向量机的预测精度高度依赖于其模型本身参数的选择,且目前存在的参数寻优方法(遗传算法和粒子群算法等)时间复杂度较高。
上述方法的高精度预测都是基于确定性水质时间序列数据集,当因为仪器不精确或者传感器问题等导致采集的水质数据具有不精确或者缺失等不确定性特征时,当前存在模型不能表现出较好的预测性能。因此,仍然需要研发能够处理不确定性水质数据集能力的高精度预测模型。
发明内容
有鉴于此,本发明的目的在于提供一种基于高斯云变换和模糊时间序列的水质预测方法,提高了水质预测精度,且具有稳健性和自适应性。
为达到上述目的,本发明提供如下技术方案:
一种基于高斯云变换和模糊时间序列的水质预测方法,该方法包括以下步骤:
步骤1)通过高斯云变换将水质参数的历史观测值离散化到不同的粒度层次;
步骤2)计算水质参数历史数据近似周期长度;
步骤3)根据近似周期长度构建训练集;
步骤4)运用模糊时间序列模型计算预测值。
进一步,所述步骤1)具体为:分别给定所有因子的高斯云个数m1,m2,…,mp,其中m1为主因子高斯云个数,mi(2≤i≤p)为各个次因子高斯云个数,p为因子总数;运用启发式高斯云变换算法将所有因子的历史数值序列抽象成mi个高斯云Ci,j(Exi,j,Eni,j,Hei,j)(1≤i≤p,1≤j≤mi)。
进一步,所述启发式高斯云变换算法具体包括以下步骤:
步骤1-1)统计计算数据样本集X{xi|i=1,2,…,N}的频度分布,
h(yj)=p(xi),i=1,2,…,N;j=1,2,…,N′
其中,y为样本论域空间;
步骤1-2)设定M个高斯分布的初始值,第k(k=1,…,M)个高斯分布的期望uk、标准差σk和幅值ak分别设定为:
u k = k × m a x ( X ) M + 1 , σ k = m a x ( X ) , a k = 1 M
步骤1-3)计算目标函数,
J ( θ ) = Σ i = 1 N ′ { h ( y i ) × l n Σ k = 1 M [ a k g ( y i ; u k , σ k 2 ) ] }
其中, g ( y i ; u k , σ k 2 ) = 1 2 π σ k e - ( y i - u k ) 2 2 σ k 2 ;
步骤1-4)对第k(k=1,…,M)个高斯分布,根据极大似然估计,计算该分布的新参数,
u k = Σ i = 1 N L k ( x i ) x i Σ i = 1 N L k ( x i ) , σ k 2 = Σ i = 1 N L k ( x i ) ( x i - u k ) T ( x i - u k ) Σ i = 1 N L k ( x i ) , a k = 1 N Σ i = 1 N L k ( x i )
其中, L k ( x i ) = a k g ( x i ; u k , σ k 2 ) Σ n = 1 M ( a n g ( x i ; u n , σ n 2 ) ) ;
步骤1-5)计算目标函数的估计值,并判断估计值与原目标函数值的差异,
J ( θ ~ ) = Σ i = 1 N ′ { h ( y i ) × l n Σ k = 1 M [ a k g ( y i ; u k , σ k 2 ) ] }
如果则跳转至步骤1-6);否则,跳转至步骤1-3);
步骤1-6)对第k(k=1,…,M)个高斯分布,计算其标准差的缩放比αk;计算与左侧相邻概念之间弱外围区不交叠的缩放比α1以及与右侧相邻概念之间弱外围区不交叠的缩放比α2,其分别满足uk-1+3α1σk-1=uk-3α1σk,uk+3α2σk=uk+1-3α2σk+1
则αk=min(α12);
步骤1-7)计算第k(k=1,…,M)个概念的高斯云参数,
Exk=uk,Enk=(1+αk)×σk/2,Hek=(1-αk)×σk/6
概念的含混度为CDk=(1-αk)/(1+αk)。
进一步,所述步骤2)计算水质参数历史数据近似周期长度,具体包括以下步骤:
步骤2-1)一个水质参数历史数据收集了N个粗粒度单位时间的数据,每个单位时间包括M个细粒度的单位时间,该水质参数在第i个粗粒度单位时间上的第Ti个细粒度单位时间出现波谷,则波谷发生序列为{T1,T2,…,TN}(1≤Ti≤M,1≤i≤N);
步骤2-2)计算波谷发生序列的标准差STD,主因子近似周期长度
进一步,所述步骤3)根据近似周期长度构建训练集,设下一个需要预测的细粒度单位时间为tth,则当前状态为同一粗粒度单位时间上细粒度单位时间为(t-1)th的样本;选择历史数据集中每个粗粒度单位时间上的[t-1-L/2,t-1+L/2]细粒度区间内的样本构成训练集。
进一步,所述步骤4)具体包括以下步骤:
步骤4-1)根据历史数据和步骤1)得到的高斯云对论域分区;
步骤4-2)定义模糊集; 
根据步骤1)中每个因子获得的mi个高斯云,为每个因子定义mi个模糊集,具体如下:
A i , 1 = 1 / C i , 1 + 0.5 / C i , 2 + 0 / C i , 3 + 0 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i A i , 2 = 0.5 / C i , 1 + 1 / C i , 2 + 0.5 / C i , 3 + 0 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i A i , 3 = 0 / C i , 1 + 0.5 / C i , 2 + 1 / C i , 3 + 0.5 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i . . . A i , m i = 0 / C i , 1 + 0 / C i , 2 + 0 / C i .3 + 0 / C i , 4 + ... + 0.5 / C i , m i - 1 + 1 / C i , m i
其中,当i=1时,A1,1,A1,2,…,A1,m1为主因子模糊集,当i>1时,Ai,1,Ai,2,…,Ai,mi为第i-1个次因子模糊集;
步骤4-3)模糊化历史数据;
第i个因子,计算历史观测值xi,t属于此因子所有高斯云Ci,j(Exi,j,Eni,j,Hei,j)(1≤j≤mi)的确定度ui,j;随机生成一个以Eni,j为期望值,Hei,j 2为方差的高斯随机数Eni,j′,则有:
u i , j = e - ( x i , t - Ex i , j ) 2 2 ( En i , j ′ ) 2
令Ci,max为最大确定度ui,max所对应的高斯云,则历史观测值xi,t属于高斯云Ci,max,并且xi,t模糊化为Ai,max
步骤4-4)构建模糊逻辑关系和模糊逻辑关系组;
步骤4-5)计算t时刻的预测值。
进一步,所述步骤4-4)如果F(t-1)=A1,i1,A2,i2,…,Ap,ip,F(t)=A1,k,其中A1,i1,A2,i2,…,Ap,ip为所有p个因子在t-1时刻所对应的模糊集,A1,k为主因子在t时刻所对应的模糊集,则构建模糊逻辑关系A1,i1,A2,i2,…,Ap,ip→A1,k,并且A1,i1,A2,i2,…,Ap,ip是当前状态,A1,k为下一状态;
根据步骤3)获得的训练集,将训练集所有样本对应模糊集作为当前状态的模糊逻辑关系聚集成若干个模糊逻辑关系组;
设A1,i1,A2,i2,…,Ap,ip为训练集某样本对应模糊逻辑关系的当前状态,并且有:
A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,i1,A2,i2,…,Ap,ip→A1,k2,…,A1,i1,A2,i2,…,Ap,ip→A1,kr共r个以A1,i1,A2,i2,…,Ap,ip为当前状态的模糊逻辑关系,则可将这r个模糊逻辑关系聚集为一个模糊逻辑关系组A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,k2,…,A1,kr
进一步,所述步骤4-5)具体为:设t-1时刻的当前状态为A1,i1,A2,i2,…,Ap,ip,计算规则如下:
如果当前状态A1,i1,A2,i2,…,Ap,ip所对应的步骤4-4)中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→A1,k1
则t时刻的预测值P(t)=1/2×(Ex1,k1+S(t-1)),其中Ex1,k1为A1,k1对应高斯云C1,k1的期望,S(t-1)为主因子t-1时刻的实际观测值;
如果当前状态A1,i1,A2,i2,…,Ap,ip所对应的步骤4-4)中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,k2,…,A1,kr
则t时刻的预测值
P ( t ) = 1 / 2 × ( n 1 × Ex 1 , k 1 + n 2 × Ex 1 , k 2 + ... + n r × Ex 1 , k r n 1 + n 2 + ... + n r + S ( t - 1 ) )
其中ni为模糊逻辑关系A1,i1,A2,i2,…,Ap,ip→A1,ki重复发生的次数,Ex1,ki为A1,ki对应高斯云C1,ki的期望,1≤i≤r,S(t-1)为主因子t-1时刻的实际观测值;
如果当前状态A1,i1,A2,i2,…,Ap,ip所对应的步骤4-4)中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→#
符号#表示空值,即在所有步骤4-4)中获得的模糊逻辑关系组中,不存在当前状态为A1,i1,A2,i2,…,Ap,ip的模糊逻辑关系组,则t时刻的预测值P(t)=1/2×(Ex1,i1+S(t-1)),其中Ex1,i1为A1,i1对应高斯云C1,i1的期望,S(t-1)为主因子t-1时刻的实际观测值。
本发明的有益效果在于:本发明提供的一种基于高斯云变换和模糊时间序列的水质预测方法,能够利用高斯云变换和模糊时间序列预测,有效的处理具有不确定性特征的水质数据集,预测结果具有更好的鲁棒性;通过融合水质数据近似周期,利用水质数据本身的内在特征,去除噪声数据,避免噪声数据影响预测精度,保证模型对数据有较高的自适应性,与传统的统计回归模型、神经网络等水质预测方法相比,具有更高的预测精度。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明所述方法的流程图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
一种由高斯云变换、模糊时间序列预测模型和水质近似周期相结合的多参数水质时间序列预测模型(GCT-FTSM),模型中用于预测的参数称为主因子,其它所有辅助参数称为次因子。该模型主要解决向前一步预测问题,其算法结构流程图如图1所示。模型的详细步骤如下:
步骤1)通过高斯云变换将水质参数的历史观测值离散化到不同的粒度层次;
分别给定所有因子的高斯云个数m1,m2,…,mp,m1为主因子高斯云个数,mi(2≤i≤p)为各个次因子高斯云个数,p为因子总数。运用启发式高斯云变换算法将所有因子的历史数值序列抽象成mi个高斯云Ci,j(Exi,j,Eni,j,Hei,j)(1≤i≤p,1≤j≤mi)。
步骤2)计算主因子水质参数历史数据近似周期长度L。由于水质变化因季节不同将呈现出近似周期的规律,因此可根据水质参数在每个特定粒度时间下出现波谷的具体时间计算近似周期长度。假设一个水质参数历史数据收集了N个粗粒度单位时间的数据,每个单位时间又可分为M个更细粒度的单位时间,该水质参数在第i个粗粒度单位时间上的第Ti个细粒度单位时间出现波谷,则波谷发生序列为{T1,T2,…,TN}(1≤Ti≤M,1≤i≤N),计算波谷发生序列的标准差STD,主因子近似周期长度例如,假设某监测站溶解氧历史数据采集频率是1次/周,采集时长为9年,我们以“年”为粗粒度单位时间,以“周”为细粒度单位时间,每年出现波谷分别在第28周、第34周、第41周、第31周、第18周、第34周、第19周、第10周和第20周,则波谷发生序列为{28,34,41,31,18,34,19,10,20},计算波谷发生序列的标准差STD=8.3183,近似周期长度
步骤3)根据近似周期长度构建训练集。假设下一个需要预测的细粒度单位时间为tth,则“当前状态”为同一粗粒度单位时间上细粒度单位时间为(t-1)th的样本,选择历史数据集中每个粗粒度单位时间上的[t-1-L/2,t-1+L/2]细粒度区间内的样本构成训练集。例如,根据步骤2中的实例,我们需要预测第10年的第6周的溶解氧的值,则当前状态为第10年的第5周的样本,训练集应为历史数据集中每年从第1周到第9周的样本所构成的数据集。
步骤4)运用模糊时间序列模型计算预测值。
步骤4-1)根据历史数据和步骤1)得到的高斯云对论域分区;
步骤4-2)定义模糊集。根据步骤1)中每个因子获得的mi个高斯云,为每个因子定义mi个模糊集,具体如下:
A i , 1 = 1 / C i , 1 + 0.5 / C i , 2 + 0 / C i , 3 + 0 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i A i , 2 = 0.5 / C i , 1 + 1 / C i , 2 + 0.5 / C i , 3 + 0 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i A i , 3 = 0 / C i , 1 + 0.5 / C i , 2 + 1 / C i , 3 + 0.5 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i · · · A i , m i = 0 / C i , 1 + 0 / C i , 2 + 0 / C i , 3 + 0 / C i , 4 + ... + 0.5 / C i , m i - 1 + 1 / C i , m i
其中,当i=1时,A1,1,A1,2,…,A1,m1为主因子模糊集,当i>1时,Ai,1,Ai,2,…,Ai,mi为第i-1个次因子模糊集。
步骤4-3)模糊化历史数据。对于第i个因子,计算历史观测值xi,t属于此因子所有高斯云Ci,j(Exi,j,Eni,j,Hei,j)(1≤j≤mi)的确定度ui,j。随机生成一个以Eni,j为期望值,Hei,j 2为方差 的高斯随机数Eni,j′,则有:
u i , j = e - ( x i , t - Ex i , j ) 2 2 ( En i , j ′ ) 2
令Ci,max为最大确定度ui,max所对应的高斯云,则历史观测值xi,t属于高斯云Ci,max,并且xi,t模糊化为Ai,max
步骤4-4)构建模糊逻辑关系和模糊逻辑关系组。例如,如果F(t-1)=A1,i1,A2,i2,…,Ap,ip,F(t)=A1,k,其中A1,i1,A2,i2,…,Ap,ip为所有p个因子在t-1时刻所对应的模糊集,A1,k为主因子在t时刻所对应的模糊集,则构建模糊逻辑关系A1,i1,A2,i2,…,Ap,ip→A1,k,并且A1,i1,A2,i2,…,Ap,ip是“当前状态”,A1,k为“下一状态”。根据步骤3获得的训练集,将训练集所有样本对应模糊集作为“当前状态”的模糊逻辑关系聚集成若干个模糊逻辑关系组。例如,假设A1,i1,A2,i2,…,Ap,ip为训练集某样本对应模糊逻辑关系的“当前状态”,并且有:A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,i1,A2,i2,…,Ap,ip→A1,k2,…,A1,i1,A2,i2,…,Ap,ip→A1,kr共r个以A1,i1,A2,i2,…,Ap,ip为“当前状态”的模糊逻辑关系,则可将这r个模糊逻辑关系聚集为一个模糊逻辑关系组A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,k2,…,A1,kr
步骤4-5)计算t时刻的预测值。假设t-1时刻的“当前状态”为A1,i1,A2,i2,…,Ap,ip,则计算规则如下:
规则1:如果“当前状态”A1,i1,A2,i2,…,Ap,ip所对应的步骤6中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→A1,k1
则t时刻的预测值P(t)=1/2×(Ex1,k1+S(t-1)),其中Ex1,k1为A1,k1对应高斯云C1,k1的期望,S(t-1)为主因子t-1时刻的实际观测值。
规则2:如果“当前状态”A1,i1,A2,i2,…,Ap,ip所对应的步骤6中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,k2,…,A1,kr
则t时刻的预测值
P ( t ) = 1 / 2 × ( n 1 × Ex 1 , k 1 + n 2 × Ex 1 , k 2 + ... + n r × Ex 1 , k r n 1 + n 2 + ... + n r + S ( t - 1 ) )
其中ni为模糊逻辑关系A1,i1,A2,i2,…,Ap,ip→A1,ki重复发生的次数,Ex1,ki为A1,ki对应高斯云C1,ki的期望,1≤i≤r,S(t-1)为主因子t-1时刻的实际观测值。
规则3:如果“当前状态”A1,i1,A2,i2,…,Ap,ip所对应的步骤6中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→#
符号“#”表示空值,即在所有步骤6中获得的模糊逻辑关系组中,不存在“当前状态”为A1,i1,A2,i2,…,Ap,ip的模糊逻辑关系组,则t时刻的预测值P(t)=1/2×(Ex1,i1+S(t-1)),其中Ex1,i1为A1,i1对应高斯云C1,i1的期望,S(t-1)为主因子t-1时刻的实际观测值。
云模型可以揭示概念的随机性、模糊性以及随机性和模糊性之间的关联性,用期望、熵和超熵作为数字特征表示定性概念,并通过云变换实现定性概念(概念内涵)和定量数据(概念外延)之间的相互转换。
定义1:设U是一个用数值表示的定量论域,C是U上的定性概念,若定量数值x∈U是定性概念C的一次随机实现,x对C的确定度u(x)∈[0,1]是具有稳定倾向的随机数,即
u : U → [ 0 , 1 ] , ∀ x ∈ U , x → u ( x )
则x在论域U上的分布称为云,记为C(X)。每一个x称为一个云滴。
启发式高斯云变换是指利用先验知识预先给定高斯云的个数M,调用高斯变换,分别获得M个高斯分布的期望、标准差和幅值,这M个高斯分布的期望就是高斯云的期望;然后,根据高斯云分布之间的交叠程度,计算生成每个高斯云的熵、超熵及其含混度。
假设数据样本集的输入为X{xi|i=1,2,…,N},高斯云模型个数为M,迭代终止误差值为ε。启发式高斯云变换具体算法步骤如下:
步骤1-1)统计计算数据样本集X{xi|i=1,2,…,N}的频度分布
h(yj)=p(xi),i=1,2,…,N;j=1,2,…,N′
其中:y为样本论域空间;
步骤1-2)设定M个高斯分布的初始值,第k(k=1,…,M)个高斯分布的期望uk、标准差σk和幅值ak分别设定为:
u k = k × m a x ( X ) M + 1 , σ k = m a x ( X ) , a k = 1 M
步骤1-3)计算目标函数 
J ( θ ) = Σ i = 1 N ′ { h ( y i ) × l n Σ k = 1 M [ a k g ( y i ; u k , σ k 2 ) ] }
其中:
g ( y i ; u k , σ k 2 ) = 1 2 π σ k e - ( y i - u k ) 2 2 σ k 2
步骤1-4)对第k(k=1,…,M)个高斯分布,根据极大似然估计,计算该分布的新参数:
u k = Σ i = 1 N L k ( x i ) x i Σ i = 1 N L k ( x i ) , σ k 2 = Σ i = 1 N L k ( x i ) ( x i - u k ) T ( x i - u k ) Σ i = 1 N L k ( x i ) , a k = 1 N Σ i = 1 N L k ( x i )
其中:
L k ( x i ) = a k g ( x i ; u k , σ k 2 ) Σ n = 1 M ( a n g ( x i ; u n , σ n 2 ) )
步骤1-5)计算目标函数的估计值,并判断估计值与原目标函数值的差异
J ( θ ~ ) = Σ i = 1 N ′ { h ( y i ) × l n Σ k = 1 M [ a k g ( y i ; u k , σ k 2 ) ] }
如果则跳转至步骤6;否则,跳转至步骤3。
步骤1-6)对第k(k=1,…,M)个高斯分布,计算其标准差的缩放比αk。计算与左侧相邻概念之间弱外围区不交叠的缩放比α1以及与右侧相邻概念之间弱外围区不交叠的缩放比α2,其分别满足
uk-1+3α1σk-1=uk-3α1σk
uk+3α2σk=uk+1-3α2σk+1
则αk=min(α12)。
步骤1-7)计算第k(k=1,…,M)个概念的高斯云参数
Exk=uk,Enk=(1+αk)×σk/2,Hek=(1-αk)×σk/6
概念的含混度为CDk=(1-αk)/(1+αk)。
模糊时间序列的一些基本定义如下:
定义2:U为论域,U={u1,u2,…,un},定义A为论域U上的模糊集,记为:
A=fA(u1)/u1+fA(u2)/u2+…+fA(un)/un
其中,fA是定义在模糊集A上的模糊隶属函数,fA:U→[0,1]。fA(ui)表示ui在模糊集A的模糊隶属度,fA(ui)∈[0,1],1≤i≤n。
定义3:Y(t)(t=…,0,1,2,…)为实数域的子集,fi(t)(i=1,2,…)是定义在Y(t)上的一组 模糊集,且有F(t)={f1(t),f2(t),…},则F(t)为定义在论域Y(t)上的模糊时间序列。
定义4:设R(t,t-1)为定义在F(t-1)到F(t)的模糊逻辑关系,并且满足F(t)=F(t-1)οR(t,t-1),符号“ο”表示一次运算,F(t-1)和F(t)均为模糊集,则称F(t)是由F(t-1)得到的。假设F(t-1)=Ai,F(t)=Aj,Ai,Aj为定义在论域上的模糊集,则一阶模糊逻辑关系可表示为:Ai→Aj,其中Ai称为“当前状态”,Aj称为“下一状态”。
定义5:设F(t)是由(F1(t-1),F2(t-1),…,Fn(t-1))得到的。则多变量模糊逻辑关系可表示为:(F1(t-1),F2(t-1),…,Fn(t-1))→F(t)。令F1(t-1)=A1,i,F2(t-1)=A2,i,…,Fn(t-1)=An,i,F(t)=Aj,则有:A1,i,A2,i,…,An,i→Aj,其中A1,i,A2,i,…,An,i称为“当前状态”,Aj称为“下一状态”。
模糊时间序列预测模型可分为以下步骤:根据历史数据和所得高斯云对论域分区;定义模糊集和模糊化历史数据;建立模糊逻辑关系和构建模糊逻辑关系组;去模糊化操作,计算预测值。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

Claims (8)

1.一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:该方法包括以下步骤:
步骤1)通过高斯云变换将水质参数的历史观测值离散化到不同的粒度层次;
步骤2)计算水质参数历史数据近似周期长度;
步骤3)根据近似周期长度构建训练集;
步骤4)运用模糊时间序列模型计算预测值。
2.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述步骤1)具体为:分别给定所有因子的高斯云个数m1,m2,…,mp,其中m1为主因子高斯云个数,mi(2≤i≤p)为各个次因子高斯云个数,p为因子总数;运用启发式高斯云变换算法将所有因子的历史数值序列抽象成mi个高斯云Ci,j(Exi,j,Eni,j,Hei,j)(1≤i≤p,1≤j≤mi)。
3.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述启发式高斯云变换算法具体包括以下步骤:
步骤1-1)统计计算数据样本集X{xi|i=1,2,…,N}的频度分布,
h(yj)=p(xi),i=1,2,…,N;j=1,2,…,N′
其中,y为样本论域空间;
步骤1-2)设定M个高斯分布的初始值,第k(k=1,…,M)个高斯分布的期望uk、标准差σk和幅值ak分别设定为:
u k = k × m a x ( X ) M + 1 , σk=max(X), a k = 1 M
步骤1-3)计算目标函数,
J ( θ ) = Σ i = 1 N ′ { h ( y i ) × l n Σ k = 1 M [ a k g ( y i ; u k , σ k 2 ) ] }
其中, g ( y i ; u k , σ k 2 ) = 1 2 π σ k e - ( y i - u k ) 2 2 σ k 2 ;
步骤1-4)对第k(k=1,…,M)个高斯分布,根据极大似然估计,计算该分布的新参数,
u k = Σ i = 1 N L k ( x i ) x i Σ i = 1 N L k ( x i ) , σ k 2 = Σ i = 1 N L k ( x i ) ( x i - u k ) T ( x i - u k ) Σ i = 1 N L k ( x i ) , a k = 1 N Σ i = 1 N L k ( x i )
其中, L k ( x i ) = a k g ( x i ; u k , σ k 2 ) Σ n = 1 M ( a n g ( x i ; u n , σ n 2 ) ) ;
步骤1-5)计算目标函数的估计值,并判断估计值与原目标函数值的差异,
J ( θ ~ ) = Σ i = 1 N ′ { h ( y i ) × l n Σ k = 1 M [ a k g ( y i ; u k , σ k 2 ) ] }
如果则跳转至步骤1-6);否则,跳转至步骤1-3);
步骤1-6)对第k(k=1,…,M)个高斯分布,计算其标准差的缩放比αk;计算与左侧相邻概念之间弱外围区不交叠的缩放比α1以及与右侧相邻概念之间弱外围区不交叠的缩放比α2,其分别满足uk-1+3α1σk-1=uk-3α1σk,uk+3α2σk=uk+1-3α2σk+1,则αk=min(α12);
步骤1-7)计算第k(k=1,…,M)个概念的高斯云参数,
Exk=uk,Enk=(1+αk)×σk/2,Hek=(1-αk)×σk/6
概念的含混度为CDk=(1-αk)/(1+αk)。
4.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述步骤2)计算水质参数历史数据近似周期长度,具体包括以下步骤:
步骤2-1)一个水质参数历史数据收集了N个粗粒度单位时间的数据,每个单位时间包括M个细粒度的单位时间,该水质参数在第i个粗粒度单位时间上的第Ti个细粒度单位时间出现波谷,则波谷发生序列为{T1,T2,…,TN}(1≤Ti≤M,1≤i≤N);
步骤2-2)计算波谷发生序列的标准差STD,主因子近似周期长度
5.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述步骤3)根据近似周期长度构建训练集,设下一个需要预测的细粒度单位时间为tth,则当前状态为同一粗粒度单位时间上细粒度单位时间为(t-1)th的样本;选择历史数据集中每个粗粒度单位时间上的[t-1-L/2,t-1+L/2]细粒度区间内的样本构成训练集。
6.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述步骤4)具体包括以下步骤:
步骤4-1)根据历史数据和步骤1)得到的高斯云对论域分区;
步骤4-2)定义模糊集;
根据步骤1)中每个因子获得的mi个高斯云,为每个因子定义mi个模糊集,具体如下:
A i , 1 = 1 / C i , 1 + 0.5 / C i , 2 + 0 / C i , 3 + 0 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i
A i , 2 = 0.5 / C i , 1 + 1 / C i , 2 + 0.5 / C i , 3 + 0 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i
A i , 3 = 0 / C i , 1 + 0.5 / C i , 2 + 1 / C i , 3 + 0.5 / C i , 4 + ... + 0 / C i , m i - 1 + 0 / C i , m i
.
.
.
A i , m i = 0 / C i , 1 + 0 / C i , 2 + 0 / C i , 3 + 0 / C i , 4 + . . . + 0.5 / C i , m i - 1 + 1 / C i , m i
其中,当i=1时,为主因子模糊集,当i>1时,为第i-1个次因子模糊集;
步骤4-3)模糊化历史数据;
第i个因子,计算历史观测值xi,t属于此因子所有高斯云Ci,j(Exi,j,Eni,j,Hei,j)(1≤j≤mi)的确定度ui,j;随机生成一个以Eni,j为期望值,Hei,j 2为方差的高斯随机数Eni,j′,则有:
u i , j = e - ( x i , t - Ex i , j ) 2 2 ( En i , j ′ ) 2
令Ci,max为最大确定度ui,max所对应的高斯云,则历史观测值xi,t属于高斯云Ci,max,并且xi,t模糊化为Ai,max
步骤4-4)构建模糊逻辑关系和模糊逻辑关系组;
步骤4-5)计算t时刻的预测值。
7.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述步骤4-4)如果F(t-1)=A1,i1,A2,i2,…,Ap,ip,F(t)=A1,k,其中A1,i1,A2,i2,…,Ap,ip为所有p个因子在t-1时刻所对应的模糊集,A1,k为主因子在t时刻所对应的模糊集,则构建模糊逻辑关系A1,i1,A2,i2,…,Ap,ip→A1,k,并且A1,i1,A2,i2,…,Ap,ip是当前状态,A1,k为下一状态;
根据步骤3)获得的训练集,将训练集所有样本对应模糊集作为当前状态的模糊逻辑关系聚集成若干个模糊逻辑关系组;
设A1,i1,A2,i2,…,Ap,ip为训练集某样本对应模糊逻辑关系的当前状态,并且有:A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,i1,A2,i2,…,Ap,ip→A1,k2,…,A1,i1,A2,i2,…,Ap,ip→A1,kr共r个以A1,i1,A2,i2,…,Ap,ip为当前状态的模糊逻辑关系,则可将这r个模糊逻辑关系聚集为一个模糊逻辑关系组A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,k2,…,A1,kr
8.根据权利要求1所述的一种基于高斯云变换和模糊时间序列的水质预测方法,其特征在于:所述步骤4-5)具体为:设t-1时刻的当前状态为A1,i1,A2,i2,…,Ap,ip,计算规则如下:如果当前状态A1,i1,A2,i2,…,Ap,ip所对应的步骤4-4)中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→A1,k1
则t时刻的预测值P(t)=1/2×(Ex1,k1+S(t-1)),其中Ex1,k1为A1,k1对应高斯云C1,k1的期望,S(t-1)为主因子t-1时刻的实际观测值;
如果当前状态A1,i1,A2,i2,…,Ap,ip所对应的步骤4-4)中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→A1,k1,A1,k2,…,A1,kr
则t时刻的预测值
P ( t ) = 1 / 2 × ( n 1 × Ex 1 , k 1 + n 2 × Ex 1 , k 2 + ... + n r × Ex 1 , k r n 1 + n 2 + ... + n r + S ( t - 1 ) )
其中ni为模糊逻辑关系A1,i1,A2,i2,…,Ap,ip→A1,ki重复发生的次数,Ex1,ki为A1,ki对应高斯云C1,ki的期望,1≤i≤r,S(t-1)为主因子t-1时刻的实际观测值;
如果当前状态A1,i1,A2,i2,…,Ap,ip所对应的步骤4-4)中获得的模糊逻辑关系组为:
A1,i1,A2,i2,…,Ap,ip→#
符号#表示空值,即在所有步骤4-4)中获得的模糊逻辑关系组中,不存在当前状态为A1,i1,A2,i2,…,Ap,ip的模糊逻辑关系组,则t时刻的预测值P(t)=1/2×(Ex1,i1+S(t-1)),其中Ex1,i1为A1,i1对应高斯云C1,i1的期望,S(t-1)为主因子t-1时刻的实际观测值。
CN201510500644.1A 2015-08-14 2015-08-14 一种基于高斯云变换和模糊时间序列的水质预测方法 Pending CN105023071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510500644.1A CN105023071A (zh) 2015-08-14 2015-08-14 一种基于高斯云变换和模糊时间序列的水质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510500644.1A CN105023071A (zh) 2015-08-14 2015-08-14 一种基于高斯云变换和模糊时间序列的水质预测方法

Publications (1)

Publication Number Publication Date
CN105023071A true CN105023071A (zh) 2015-11-04

Family

ID=54413024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510500644.1A Pending CN105023071A (zh) 2015-08-14 2015-08-14 一种基于高斯云变换和模糊时间序列的水质预测方法

Country Status (1)

Country Link
CN (1) CN105023071A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122616A (zh) * 2017-05-09 2017-09-01 山东大学 一种地下水水质的多指标正态云综合评价方法
CN107944607A (zh) * 2017-11-03 2018-04-20 渤海大学 一种基于时间序列的抽油井停井时间集成预测方法
CN108053054A (zh) * 2017-11-22 2018-05-18 中国农业大学 一种河流水质预测方法
CN108710964A (zh) * 2018-04-09 2018-10-26 天津农学院 一种模糊时间序列水产养殖水质环境数据的预测方法
CN110619418A (zh) * 2019-07-26 2019-12-27 重庆大学 一种基于混合模型组合算法的多特征水质预测方法
CN111882138A (zh) * 2020-08-07 2020-11-03 中国农业大学 基于时空融合的水质预测方法、装置、设备及存储介质
CN112215396A (zh) * 2020-09-03 2021-01-12 中交西安筑路机械有限公司 一种基于模糊时间序列分析和粒子群技术的数据预测算法
CN116258403A (zh) * 2023-01-19 2023-06-13 河南省新乡水文水资源勘测局 一种基于大数据的水质监测预警方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886397A (zh) * 2014-04-17 2014-06-25 中国科学院重庆绿色智能技术研究院 一种分治法与水质周期性结合的水质预测方法
CN104155423A (zh) * 2014-08-08 2014-11-19 天津大学 一种变权组合的景观水水质预警方法
CN104680015A (zh) * 2015-03-02 2015-06-03 华南理工大学 一种基于快速相关向量机的污水处理在线软测量方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886397A (zh) * 2014-04-17 2014-06-25 中国科学院重庆绿色智能技术研究院 一种分治法与水质周期性结合的水质预测方法
CN104155423A (zh) * 2014-08-08 2014-11-19 天津大学 一种变权组合的景观水水质预警方法
CN104680015A (zh) * 2015-03-02 2015-06-03 华南理工大学 一种基于快速相关向量机的污水处理在线软测量方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
倪明: "模糊时间序列预测模型研究及其在污水处理上的应用", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 *
刘文 等: "基于灰色理论及支持向量机的水质预测", 《2013年水资源生态保护与水污染控制研讨会论文集》 *
刘玉超: "一种自适应的多粒度概念提取方法——高斯云变换", 《计算机工程与应用》 *
刘芬 等: "基于区间相似度的模糊时间序列预测算法", 《计算机应用》 *
王阅 等: "时间序列周期模式挖掘的周期检测方法", 《计算机工程》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122616A (zh) * 2017-05-09 2017-09-01 山东大学 一种地下水水质的多指标正态云综合评价方法
CN107944607A (zh) * 2017-11-03 2018-04-20 渤海大学 一种基于时间序列的抽油井停井时间集成预测方法
CN108053054A (zh) * 2017-11-22 2018-05-18 中国农业大学 一种河流水质预测方法
CN108053054B (zh) * 2017-11-22 2020-09-01 中国农业大学 一种河流水质预测方法
CN108710964A (zh) * 2018-04-09 2018-10-26 天津农学院 一种模糊时间序列水产养殖水质环境数据的预测方法
CN110619418A (zh) * 2019-07-26 2019-12-27 重庆大学 一种基于混合模型组合算法的多特征水质预测方法
CN111882138A (zh) * 2020-08-07 2020-11-03 中国农业大学 基于时空融合的水质预测方法、装置、设备及存储介质
CN111882138B (zh) * 2020-08-07 2024-02-23 中国农业大学 基于时空融合的水质预测方法、装置、设备及存储介质
CN112215396A (zh) * 2020-09-03 2021-01-12 中交西安筑路机械有限公司 一种基于模糊时间序列分析和粒子群技术的数据预测算法
CN116258403A (zh) * 2023-01-19 2023-06-13 河南省新乡水文水资源勘测局 一种基于大数据的水质监测预警方法及系统
CN116258403B (zh) * 2023-01-19 2023-09-15 河南省新乡水文水资源勘测局 一种基于大数据的水质监测预警方法及系统

Similar Documents

Publication Publication Date Title
CN105023071A (zh) 一种基于高斯云变换和模糊时间序列的水质预测方法
Shi et al. Direct interval forecast of uncertain wind power based on recurrent neural networks
Niu et al. Forecasting reservoir monthly runoff via ensemble empirical mode decomposition and extreme learning machine optimized by an improved gravitational search algorithm
He et al. A hybrid system for short-term wind speed forecasting
Ch et al. Streamflow forecasting by SVM with quantum behaved particle swarm optimization
CN104536412B (zh) 基于指标预报和解相似度分析的光刻工序动态调度方法
Jung et al. Prediction of building energy consumption using an improved real coded genetic algorithm based least squares support vector machine approach
Li et al. Identifying explicit formulation of operating rules for multi-reservoir systems using genetic programming
CN105243502B (zh) 一种基于径流区间预测的水电站调度风险评估方法及系统
CN107730044A (zh) 一种可再生能源发电和负荷的混合预测方法
CN107274030B (zh) 基于水文变量年际和月变化特性的径流预报方法和系统
CN104064023A (zh) 一种基于时空关联的动态交通流预测方法
CN109472321A (zh) 一种面向时间序列型地表水质大数据的预测与评估模型构建方法
CN103197983B (zh) 基于概率图模型的服务组件可靠性在线时间序列预测方法
Weng et al. A Decomposition Dynamic graph convolutional recurrent network for traffic forecasting
CN105425583A (zh) 基于协同训练lwpls的青霉素生产过程的控制方法
CN103886223B (zh) 功率预测方法和系统
Samsudin et al. A hybrid least squares support vector machines and GMDH approach for river flow forecasting
CN104020769B (zh) 一种基于电荷系统搜索的机器人全局路径规划方法
Shahraiyni et al. Comparison between active learning method and support vector machine for runoff modeling
Zhou et al. General regression neural network forecasting model based on PSO algorithm in water demand
Wenxian et al. RBF neural network model based on improved PSO for predicting river runoff
Yan et al. Water demand forecast model of least squares support vector machine based on particle swarm optimization
bin Ahmad et al. Application of hybrid GMDH and Least Square Support Vector Machine in energy consumption forecasting
Bahrami et al. Daily streamflow forecasting using nonlinear echo state network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151104

RJ01 Rejection of invention patent application after publication