CN113051742B - 基于关联规则的立体栅格气象要素短临预报方法 - Google Patents

基于关联规则的立体栅格气象要素短临预报方法 Download PDF

Info

Publication number
CN113051742B
CN113051742B CN202110291466.1A CN202110291466A CN113051742B CN 113051742 B CN113051742 B CN 113051742B CN 202110291466 A CN202110291466 A CN 202110291466A CN 113051742 B CN113051742 B CN 113051742B
Authority
CN
China
Prior art keywords
attribute
data
association rule
minimum
grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110291466.1A
Other languages
English (en)
Other versions
CN113051742A (zh
Inventor
徐明明
秦华旺
戴跃伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202110291466.1A priority Critical patent/CN113051742B/zh
Publication of CN113051742A publication Critical patent/CN113051742A/zh
Application granted granted Critical
Publication of CN113051742B publication Critical patent/CN113051742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于关联规则的立体栅格气象要素短临预报方法,采用多元线性回归模型,利用DEM高程信息和栅格坐标搭建立体栅格,通过关联规则算法分别设置最小项支持度、频繁项集和最小信任度来产生时空关联规则,包括步骤如下:(1)数据预处理;(2)建立趋势面模型;(3)气象数据栅格化;(4)识别立体栅格内用户感兴趣的气象数据,并结合时间,记为独立事务;(5)挖掘关联规则;(6)根据步骤(5)得到的关联规则,实现短临预报。本发明充分利用站点坐标及数据,得到了区域气象数据的空间分布;使用MSapriori算法结合数据立方体建立时间和空间的关联规则系,并有效降低扫描事务数据库的次数,提高短临预报速率。

Description

基于关联规则的立体栅格气象要素短临预报方法
技术领域
本发明涉及气象要素短临预报方法,尤其涉及一种基于关联规则的立体栅格气象要素短临预报方法。
背景技术
气象要素通常包括气温、气压、湿度、降水等因素。为了研究气象要素在一定时间内的动态变化,需要进行监测评价。气象栅格是一种用于监测评价的模型,不仅可以用于存储数据信息,还可以通过一定的方式将数据特征表征出来。
目前针对气象栅格的研究大多基于二维栅格,即通过大范围下的数据特征来研究全国或是某个流域数据的整体情况;但基于立体栅格气象要素短临预报的实现方法较少。
发明内容
发明目的:本发明的目的是提供一种有效降低扫描事务数据库的次数、提高短临预报速率的基于关联规则的立体栅格气象要素短临预报方法。
技术方案:本发明的立体栅格气象要素短临预报方法,采用多元线性回归模型,利用DEM高程信息和栅格坐标搭建立体栅格,通过关联规则算法分别设置最小项支持度、频繁项集和最小信任度来产生时空关联规则,包括步骤如下:(1)数据预处理;(2)建立趋势面模型;(3)气象数据栅格化;(4)识别立体栅格内用户感兴趣的气象数据,并结合时间,记为独立事务;(5)挖掘关联规则;(6)根据步骤(5)得到的关联规则,实现短临预报;所述步骤(5)中的关联规则为不同数据项目在时空间出现的相关性,是从大量数据中挖掘出时间、空间及气象要素间的关系。
进一步,步骤(1)中,在预测时刻前获取某站点的高分辨率气温和降水数据,删除缺少属性值和孤立点的数据,填写空缺的值。
进一步,步骤(2)中,获取某站点的坐标作为自变量,站点对应的趋势面拟合值作为因变量,建立两者间的多元线性回归关系如下:
Φ′=a0+a1Xr+a2Yr+a3Zr+a4Xr 2+a5Yr 2+a6Zr 2+a7XrYr+a8XrZr+a9YrZrΦ=Φ′+ε
其中,X轴方向坐标Xr,Y轴方向坐标Yr,Z轴方向坐标Zr作为自变量,站点对应的气象数据的观测值为Φ,趋势面的拟合值Φ′作为因变量,ε为观测值与趋势面拟合值的残差;
根据观测值与坐标间的关系来确定多项式系数a0~a9,使得残差平方和最小,得到地理空间的趋势面模型。
进一步,步骤(3)中,将选定区域的DEM高程信息及每个栅格的X坐标和Y坐标代入到趋势面模型,获得栅格图层,得到选定区域气象数据的空间分布。
进一步,步骤(4)中,识别立体栅格内用户感兴趣的气象数据,并结合时间,记为独立事务,在此基础上建立独立的数据库。
进一步,步骤(5)中,采用关联规则算法挖掘关联规则,首先设置最小项支持度,属性有时间、空间、降水与温度,属性的值为属性变量,利用MSapriori算法设置各个属性变量的最小项支持度MIS(i),表达式为:
Figure BDA0002982190580000021
Figure BDA0002982190580000022
其中,Sup[i]是系统属性i在事务数据库T中发生的频率;Count(i)表示系统属性i在事务数据库T中的支持数;Count(T)表示事务数据库T中记录的总数;P[i]为用户为每个属性变量设置的感兴趣等级;M(i)为级别个数,级别越高,用户对该属性变量的感兴趣值越大;V值为最小支持度的下限;
然后应用基于最小数据立方体的Apriori_Cube算法连接频繁项集,根据最小信任度原则从频繁项集的集合中产生时空关联规则,得到选定区域某时间段内气温变化、降水变化以及气温变化与降水变化间的关系;Dk表为包含所有长度为k的候选集,实现步骤如下:
(51)通过算法搜索出各属性的1维频繁项集后,对其进行判断,若某个属性不存在1维频繁项集则说明属性层次定的过低,通过上钻提高属性层次,若某个属性上所有的1维项集都是频繁项集则说明属性层次定的过高,通过下钻降低维层次;接着根据D1表中MIS值的顺序查找第一个满足最小支持度的属性变量i,加入到产生长度为1的候选集F中,对于D1表中i的后续属性变量j,若Sup(j)≥MIS(i),将属性变量j也加入到候选集F中;
(52)按顺序遍历候选集F中的属性变量,若属性变量k满足Sup(j)≥MIS(k)且候选集F中k的后续属性变量l与k来自不同维度,且Sup(l)≥MIS(k),则将l与k加入到产生长度为2的候选集;
(53)其余长度为k的候选集(k>2)的产生:先采用Apriori_Cube算法合并项集,再通过剪枝步骤完成;
(54)通过Dk表获取长度为k的候选集的任意子集c的支持度,若Sup(c)≥MIS(c[1]),则将c项集加入到最大频繁项集Lk中,最终获得最大频繁项集的集合L,其中c[1]为c的第一个元素。
本发明与现有技术相比,其显著效果如下:1、充分利用站点坐标及数据,得到了区域气象数据的空间分布;2、建立立体栅格,使得观感更为明显;3、使用MSapriori算法结合数据立方体建立关联规则,使得时间和空间相互联系,并有效降低扫描事务数据库的次数,提高短临预报速率。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合说明书附图和具体实施方式对本发明做进一步详细描述。
如图1所示为本发明的流程示意图,实现步骤如下:
步骤一,数据预处理。
选取在预测时刻前2小时获取某站点的高分辨率气温和降水数据的观测值,删除缺少属性值和孤立点的数据,填写空缺的值。
步骤二,建立趋势面模型。
获取站点的X轴方向坐标Xr,Y轴方向坐标Yr,Z轴方向坐标Zr作为自变量,站点对应的气象数据的观测值为Φ,趋势面的拟合值Φ′作为因变量,ε为观测值与趋势面拟合值的残差,则有多元线性回归关系如下:
Φ′=a0+a1Xr+a2Yr+a3Zr+a4Xr 2+a5Yr 2+a6Zr 2+a7XrYr+a8XrZr+a9YrZr
Φ=Φ′+ε                                        (1)
根据观测值与坐标间的关系,来确定多项式系数a0~a9,使得残差平方和最小,得到地理空间的趋势面模型。
步骤三,气象数据栅格化。
将选定区域的DEM(Digital Elevation Model数字高程模型)高程信息及每个栅格的X坐标和Y坐标代入到公式(1)中得到的趋势面模型,获得栅格图层,得到研究区域内气象数据的空间分布。
步骤四,独立事务识别。
识别立体栅格内用户感兴趣的气象数据,并结合时间,记为独立事务,如A地某时的气温降低a度,B地某时的气温升高b度,C地某时的降水量降低c毫米,在此基础上建立独立的事务数据库T。
步骤五,挖掘关联规则。
在MSapriori算法基础上引入数据立方体。在MSapriori算法中,属性有时间、空间(X、Y、Z)、降水与温度等等,属性的值称为属性变量。首先利用MSapriori算法设置各个属性变量的最小项支持度MIS(i),表达式为:
Figure BDA0002982190580000041
Figure BDA0002982190580000042
公式(2)中,Sup[i]是系统属性i在事务数据库T中发生的频率;Count(i)表示系统属性i在事务数据库T中的支持数;Count(T)表示事务数据库T中记录的总数;P[i]为用户为每个属性变量设置的感兴趣等级;M为级别个数,级别越高,用户对该属性变量的感兴趣值越大;V值为最小支持度的下限。
通过公式(2)的最小项支持度能得到用户感兴趣的规则。接着采用Apriori_Cube算法中对频繁项集的连接策略,若两个Lk-1项集前(k-2)项相同而最后一项来自不同维度,则将两项集的前(k-2)项与各自的最后一项合并得到一个新的k项集,最后直接对基于支持度的Dk表进行搜索,可快速得到各项集的支持度,若项集的支持度大于等于最小项支持度,则得到频繁项集。Dk表为包含所有长度为k的候选集,具体步骤如下:
(51)首先通过算法搜索出各属性的1维频繁项集后,对其进行判断,若某个属性不存在1维频繁项集则说明属性层次定的过低,通过上钻提高属性层次,若某个属性上所有的1维项集都是频繁项集则说明属性层次定的过高,通过下钻降低维层次。接着根据D1(包含所有长度为1的候选集)表中MIS值的顺序查找第一个满足最小支持度的属性变量i,加入到F(产生长度为1的候选集)中,对于D1表中i的后续属性变量j,若Sup(j)≥MIS(i),将属性变量j也加入到F中。
(52)按顺序遍历F中的属性变量,若属性变量k满足Sup(j)≥MIS(k)且F中k的后续属性变量l与k来自不同维度,且Sup(l)≥MIS(k),则将l与k加入到C2(产生长度为2的候选集)。
(53)其余长度为k的候选集(k>2)的产生:先采用Apriori_Cube算法合并项集,再通过剪枝步骤完成。
(54)通过Dk表获取长度为k的候选集的任意子集c的支持度,若Sup(c)≥MIS(c[1]),则将c项集加入到最大频繁项集Lk中,最终获得最大频繁项集的集合L。其中c[1]为c的第一个元素。
根据最小信任度原则从L中产生时空关联规则,得到研究区域某时间段内气温变化、降水变化及两者间的关系。
步骤六,预报。
根据步骤五得到的关联规则,能够得到A地上一时刻气温降低a,B地下一时刻降水升高b的组合效果,实现短临预报。该预报效果可通过用户自行设定气象要素的属性来实现。

Claims (3)

1.一种基于关联规则的立体栅格气象要素短临预报方法,其特征在于,采用多元线性回归模型,利用DEM高程信息和栅格坐标搭建立体栅格,通过关联规则算法分别设置最小项支持度、频繁项集和最小信任度来产生时空关联规则,包括步骤如下:(1)数据预处理;(2)建立趋势面模型;(3)气象数据栅格化;(4)识别立体栅格内用户感兴趣的气象数据,并结合时间,记为独立事务;(5)挖掘关联规则;(6)根据步骤(5)得到的关联规则,实现短临预报;所述步骤(5)中的关联规则为不同数据项目在时空间出现的相关性,是从大量数据中挖掘出时间、空间及气象要素间的关系;
所述步骤(2)中,获取某站点的坐标作为自变量,站点对应的趋势面拟合值作为因变量,建立两者间的多元线性回归关系如下:
Φ′=a0+a1Xr+a2Yr+a3Zr+a4Xr 2+a5Yr 2+a6Zr 2+a7XrYr+a8XrZr+a9YrZr
Φ=Φ′+ε
其中,X轴方向坐标Xr,Y轴方向坐标Yr,Z轴方向坐标Zr作为自变量,站点对应的气象数据的观测值为Φ,趋势面的拟合值Φ′作为因变量,ε为观测值与趋势面拟合值的残差;
根据观测值与坐标间的关系来确定多项式系数a0~a9,使得残差平方和最小,得到地理空间的趋势面模型;
所述步骤(3)中,将选定区域的DEM高程信息及每个栅格的X坐标和Y坐标代入到趋势面模型,获得栅格图层,得到选定区域气象数据的空间分布;
所述步骤(5)中,采用关联规则算法挖掘关联规则,首先设置最小项支持度,属性有时间、空间、降水与温度,属性的值为属性变量,利用MSapriori算法设置各个属性变量的最小项支持度MIS(i),表达式为:
Figure FDA0004153399900000011
Figure FDA0004153399900000012
其中,Sup[i]是系统属性i在事务数据库T中发生的频率;Count(i)表示系统属性i在事务数据库T中的支持数;Count(T)表示事务数据库T中记录的总数;P[i]为用户为每个属性变量设置的感兴趣等级;M(i)为级别个数,级别越高,用户对该属性变量的感兴趣值越大;V值为最小支持度的下限;
然后应用基于最小数据立方体的Apriori_Cube算法连接频繁项集,根据最小信任度原则从频繁项集的集合中产生时空关联规则,得到选定区域某时间段内气温变化、降水变化以及气温变化与降水变化间的关系;Dk表为包含所有长度为k的候选集,实现步骤如下:
(51)通过算法搜索出各属性的1维频繁项集后,对其进行判断,若某个属性不存在1维频繁项集则说明属性层次定的过低,通过上钻提高属性层次,若某个属性上所有的1维项集都是频繁项集则说明属性层次定的过高,通过下钻降低维层次;接着根据D1表中MIS值的顺序查找第一个满足最小支持度的属性变量i,加入到产生长度为1的候选集F中,对于D1表中i的后续属性变量j,若Sup(j)≥MIS(i),将属性变量j也加入到候选集F中;
(52)按顺序遍历候选集F中的属性变量,若属性变量k满足Sup(j)≥MIS(k)且候选集F中k的后续属性变量l与k来自不同维度,且Sup(l)≥MIS(k),则将l与k加入到产生长度为2的候选集;
(53)其余长度为k>2的候选集的产生:先采用Apriori_Cube算法合并项集,再通过剪枝步骤完成;
(54)通过Dk表获取长度为k的候选集的任意子集c的支持度,若Sup(c)≥MIS(c[1]),则将c项集加入到最大频繁项集Lk中,最终获得最大频繁项集的集合L,其中c[1]为c的第一个元素。
2.根据权利要求1所述的基于关联规则的立体栅格气象要素短临预报方法,其特征在于,步骤(1)中,在预测时刻前获取某站点的高分辨率气温和降水数据,删除缺少属性值和孤立点的数据,填写空缺的值。
3.根据权利要求1所述的基于关联规则的立体栅格气象要素短临预报方法,其特征在于,步骤(4)中,在独立事务的基础上建立独立的数据库。
CN202110291466.1A 2021-03-18 2021-03-18 基于关联规则的立体栅格气象要素短临预报方法 Active CN113051742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110291466.1A CN113051742B (zh) 2021-03-18 2021-03-18 基于关联规则的立体栅格气象要素短临预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110291466.1A CN113051742B (zh) 2021-03-18 2021-03-18 基于关联规则的立体栅格气象要素短临预报方法

Publications (2)

Publication Number Publication Date
CN113051742A CN113051742A (zh) 2021-06-29
CN113051742B true CN113051742B (zh) 2023-05-09

Family

ID=76513649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110291466.1A Active CN113051742B (zh) 2021-03-18 2021-03-18 基于关联规则的立体栅格气象要素短临预报方法

Country Status (1)

Country Link
CN (1) CN113051742B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8413087B1 (en) * 2010-03-26 2013-04-02 Cadence Design Systems, Inc. Method and mechanism for implementing region query using hierarchical grids
CN105677837A (zh) * 2016-01-05 2016-06-15 中国科学院深圳先进技术研究院 一种关联规则的挖掘方法和关联规则的挖掘装置
CN108492057A (zh) * 2018-04-28 2018-09-04 国网新疆电力公司电力科学研究院 基于FP-growth的跳闸明细数据与气象数据关联分析及预警方法
CN110458048A (zh) * 2019-07-23 2019-11-15 南京林业大学 顾及城镇格局特征的人口分布时空演变与认知
CN112149294A (zh) * 2020-09-14 2020-12-29 南京信息工程大学 弹性气象栅格设计方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8413087B1 (en) * 2010-03-26 2013-04-02 Cadence Design Systems, Inc. Method and mechanism for implementing region query using hierarchical grids
CN105677837A (zh) * 2016-01-05 2016-06-15 中国科学院深圳先进技术研究院 一种关联规则的挖掘方法和关联规则的挖掘装置
CN108492057A (zh) * 2018-04-28 2018-09-04 国网新疆电力公司电力科学研究院 基于FP-growth的跳闸明细数据与气象数据关联分析及预警方法
CN110458048A (zh) * 2019-07-23 2019-11-15 南京林业大学 顾及城镇格局特征的人口分布时空演变与认知
CN112149294A (zh) * 2020-09-14 2020-12-29 南京信息工程大学 弹性气象栅格设计方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Mining frequent patterns with multiple minimum supports using basic Apriori;Tiantian Xu等;《2013 Ninth International Conference on Natural Computation (ICNC)》;第957-961页 *
Multiple Multi-Qubit Quantum States Sharing;秦华旺等;《Communications in Theoretical Physics》;第65卷(第4期);第460-464页 *
Novel Traveling Wave Detection Method based on VMD-S Transform in Distribution Network;Lei Wang等;《2019 IEEE 3rd Conference on Energy Internet and Energy System Integration (EI2)》;第2593-2596页 *
基于DSCAN优化算法与决策树优化算法的气象时空数据挖掘技术研究;李进讷;《中国优秀硕士学位论文全文数据库》;基础科学辑 A008-155 *
气象科技项目/成果管理评估系统设计;赵远东等;《电脑知识与技术》;第6卷(第27期);第7452-7455页 *

Also Published As

Publication number Publication date
CN113051742A (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
Reuter et al. An evaluation of void‐filling interpolation methods for SRTM data
Tan et al. Comparative analysis of spatial interpolation methods: an experimental study
Brown et al. Stochastic simulation of land-cover change using geostatistics and generalized additive models
US9378462B2 (en) Probability mapping system
CN109142679B (zh) 基于人工神经网络克里金插值的森林土壤养分的空间预测方法
CN111475596A (zh) 一种基于多层级轨迹编码树的子段相似性匹配方法
CN113886917B (zh) 基于cnn-lstm模型的铁路沿线区域地面沉降预测预警方法
CN113532397B (zh) 一种基于扩展算法的分区域高程异常拟合方法
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN108986213B (zh) 一种基于叠置技术的三维地层建模方法
Qie et al. Method and its application of natural quality evaluation of arable land based on self-organizing feature map neural network
Bierman et al. Bayesian image restoration models for combining expert knowledge on recording activity with species distribution data
Hu et al. Long-term offshore wind power prediction using spatiotemporal kriging: A case study in China’s Guangdong Province
Ladner et al. Mining Spatio-Temporal Information Systems
CN113051742B (zh) 基于关联规则的立体栅格气象要素短临预报方法
Mercado‐Bettín et al. Long‐term water balance partitioning explained by physical and ecological characteristics in world river basins
Booker et al. Inside or outside: Quantifying extrapolation across river networks
McIntosh et al. A framework to enhance semantic flexibility for analysis of distributed phenomena
Zahraie et al. SST clustering for winter precipitation prediction in southeast of Iran: Comparison between modified K-means and genetic algorithm-based clustering methods
Liu et al. Soil polygon disaggregation through similarity-based prediction with legacy pedons
Caiyan et al. Landslides and slope aspect in the Three Gorges Reservoir area based on GIS and information value model
Tu et al. Mining regional patterns of land use with adaptive adjacent criteria
Tsui et al. Effect of sampling density on estimation of regional soil organic carbon stock for rural soils in Taiwan
Zhou et al. A new spatial interpolation approach based on inverse distance weighting: case study from interpolating soil properties
Hershey et al. Using geostatistical techniques to map the distribution of tree species from ground inventory data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant