CN109214563A - 一种基于聚类与线性回归的降雨量预测方法 - Google Patents

一种基于聚类与线性回归的降雨量预测方法 Download PDF

Info

Publication number
CN109214563A
CN109214563A CN201810999303.7A CN201810999303A CN109214563A CN 109214563 A CN109214563 A CN 109214563A CN 201810999303 A CN201810999303 A CN 201810999303A CN 109214563 A CN109214563 A CN 109214563A
Authority
CN
China
Prior art keywords
linear regression
clustering
rainfall
data
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810999303.7A
Other languages
English (en)
Other versions
CN109214563B (zh
Inventor
宋耀莲
马丽华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810999303.7A priority Critical patent/CN109214563B/zh
Publication of CN109214563A publication Critical patent/CN109214563A/zh
Application granted granted Critical
Publication of CN109214563B publication Critical patent/CN109214563B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于聚类与线性回归的降雨量预测方法,属于气象数据分析方法技术领域。本发明首先收集地区降雨观测数据并生成降雨数据库;然后获取降雨数据库中数据,并生成数据集;然后根据生成的数据集生成聚类;同时根据生成的聚类计算线性回归系数;再通过生成的聚类和线性回归系数,得到聚类的线性回归函数;再根据所得聚类的线性回归函数,计算K次聚类的线性回归;最后根据所得K次聚类的线性回归结果得到降雨预测数据。本发明使用聚类算法以及线性回归算法对降雨数据进行处理,从而得到降雨预测。

Description

一种基于聚类与线性回归的降雨量预测方法
技术领域
本发明涉及一种基于聚类与线性回归的降雨量预测方法,属于气象数据分析方法技术领域。
背景技术
准确的预测降水可用于各个相关行业,制定政策,规划和管理决策,并有助于水资源系统可持续的运作。使用历史数据,基于统计和智能计算的方法来进行未来降雨的预测,是现如今较为通用的降雨预测手段。但现有的一些降雨数据分析预测方法都有着准确性不高的缺点。
发明内容
本发明要解决的技术问题是提供一种基于聚类与线性回归的降雨量预测方法,用以解决上述问题。
本发明的技术方案是:一种基于聚类与线性回归的降雨量预测方法,具体步骤为:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,…,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
所述步骤Step3中,生成的聚类为:
所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,…,k的数据点计算的线性回归系数。
所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2
所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk
本发明的有益效果是:使用层次聚类算法以及线性回归算法对气象数据进行处理,提升降雨数据分析预测结果的准确性。
附图说明
图1是本发明流程示意图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1所示,一种基于聚类与线性回归的降雨量预测方法,具体步骤为:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,…,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
所述步骤Step3中,生成的聚类为:
所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,…,k的数据点计算的线性回归系数。
所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2
所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.一种基于聚类与线性回归的降雨量预测方法,其特征在于:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
2.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,...,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
3.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step3中,生成的聚类为:
4.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,...,k的数据点计算的线性回归系数。
5.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2
6.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk
CN201810999303.7A 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法 Active CN109214563B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810999303.7A CN109214563B (zh) 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810999303.7A CN109214563B (zh) 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法

Publications (2)

Publication Number Publication Date
CN109214563A true CN109214563A (zh) 2019-01-15
CN109214563B CN109214563B (zh) 2022-07-19

Family

ID=64985719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810999303.7A Active CN109214563B (zh) 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法

Country Status (1)

Country Link
CN (1) CN109214563B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112470888A (zh) * 2020-11-02 2021-03-12 广东职业技术学院 一种智慧社区的自动浇水方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127360A (zh) * 2016-06-06 2016-11-16 国网天津市电力公司 一种基于用户特性分析的多模型负荷预测方法
CN106951993A (zh) * 2017-03-20 2017-07-14 国网江苏省电力公司常州供电公司 一种电能量数据预估方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127360A (zh) * 2016-06-06 2016-11-16 国网天津市电力公司 一种基于用户特性分析的多模型负荷预测方法
CN106951993A (zh) * 2017-03-20 2017-07-14 国网江苏省电力公司常州供电公司 一种电能量数据预估方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112470888A (zh) * 2020-11-02 2021-03-12 广东职业技术学院 一种智慧社区的自动浇水方法及系统

Also Published As

Publication number Publication date
CN109214563B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
Oprea et al. Machine learning algorithms for short-term load forecast in residential buildings using smart meters, sensors and big data solutions
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN103729550B (zh) 基于传播时间聚类分析的多模型集成洪水预报方法
CN105825230B (zh) 基于深度置信网络模型的土壤墒情预测方法和系统
CN108304668A (zh) 一种结合水文过程数据和历史先验数据的洪水预测方法
CN106295899B (zh) 基于遗传算法与支持向量分位数回归的风电功率概率密度预测方法
CN112801342A (zh) 一种基于降雨径流相似性的自适应径流预报方法
CN103473438B (zh) 风功率预测模型优选及修正方法
CN105069476A (zh) 基于两阶段集成学习的风电异常数据识别方法
CN110705760A (zh) 一种基于深度置信网络的光伏发电功率预测方法
CN110210730A (zh) 一种区域综合能源系统能效状态评价方法
CN109389238B (zh) 一种基于岭回归的短期负荷预测方法及装置
CN115096627B (zh) 一种液压成形智能装备制造过程故障诊断与运维方法及系统
CN104572985A (zh) 一种基于复杂网络社区发现的工业数据样本筛选方法
CN116992385B (zh) 一种物联网水表用量异常检测方法及系统
CN110276477A (zh) 一种基于分层贝叶斯网络和增量学习的洪水预报方法
CN110110339B (zh) 一种日前水文预报误差校正方法及系统
CN112101765A (zh) 一种配电网运行指标数据异常数据处理方法及系统
Wang et al. Short-term wind speed forecasting using variational mode decomposition and support vector regression
CN113449920A (zh) 一种风电功率预测方法、系统及计算机可读介质
CN109214563A (zh) 一种基于聚类与线性回归的降雨量预测方法
CN118378135B (zh) 基于频率信道转换和自监督的气井积液分类和预测方法
CN114819260A (zh) 一种水文时间序列预测模型动态生成方法
CN118607674A (zh) 一种基于大数据的环境数据分析方法及系统
CN118656640A (zh) 基于深度学习的气象报告生成方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant