CN109214563A - 一种基于聚类与线性回归的降雨量预测方法 - Google Patents

一种基于聚类与线性回归的降雨量预测方法 Download PDF

Info

Publication number
CN109214563A
CN109214563A CN201810999303.7A CN201810999303A CN109214563A CN 109214563 A CN109214563 A CN 109214563A CN 201810999303 A CN201810999303 A CN 201810999303A CN 109214563 A CN109214563 A CN 109214563A
Authority
CN
China
Prior art keywords
linear regression
cluster
data
prediction
precipitation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810999303.7A
Other languages
English (en)
Other versions
CN109214563B (zh
Inventor
宋耀莲
马丽华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810999303.7A priority Critical patent/CN109214563B/zh
Publication of CN109214563A publication Critical patent/CN109214563A/zh
Application granted granted Critical
Publication of CN109214563B publication Critical patent/CN109214563B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于聚类与线性回归的降雨量预测方法,属于气象数据分析方法技术领域。本发明首先收集地区降雨观测数据并生成降雨数据库;然后获取降雨数据库中数据,并生成数据集;然后根据生成的数据集生成聚类;同时根据生成的聚类计算线性回归系数;再通过生成的聚类和线性回归系数,得到聚类的线性回归函数;再根据所得聚类的线性回归函数,计算K次聚类的线性回归;最后根据所得K次聚类的线性回归结果得到降雨预测数据。本发明使用聚类算法以及线性回归算法对降雨数据进行处理,从而得到降雨预测。

Description

一种基于聚类与线性回归的降雨量预测方法
技术领域
本发明涉及一种基于聚类与线性回归的降雨量预测方法,属于气象数据分析方法技术领域。
背景技术
准确的预测降水可用于各个相关行业,制定政策,规划和管理决策,并有助于水资源系统可持续的运作。使用历史数据,基于统计和智能计算的方法来进行未来降雨的预测,是现如今较为通用的降雨预测手段。但现有的一些降雨数据分析预测方法都有着准确性不高的缺点。
发明内容
本发明要解决的技术问题是提供一种基于聚类与线性回归的降雨量预测方法,用以解决上述问题。
本发明的技术方案是:一种基于聚类与线性回归的降雨量预测方法,具体步骤为:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,…,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
所述步骤Step3中,生成的聚类为:
所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,…,k的数据点计算的线性回归系数。
所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2
所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk
本发明的有益效果是:使用层次聚类算法以及线性回归算法对气象数据进行处理,提升降雨数据分析预测结果的准确性。
附图说明
图1是本发明流程示意图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1所示,一种基于聚类与线性回归的降雨量预测方法,具体步骤为:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,…,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
所述步骤Step3中,生成的聚类为:
所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,…,k的数据点计算的线性回归系数。
所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2
所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.一种基于聚类与线性回归的降雨量预测方法,其特征在于:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
2.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,...,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
3.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step3中,生成的聚类为:
4.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,...,k的数据点计算的线性回归系数。
5.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2
6.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk
CN201810999303.7A 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法 Active CN109214563B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810999303.7A CN109214563B (zh) 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810999303.7A CN109214563B (zh) 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法

Publications (2)

Publication Number Publication Date
CN109214563A true CN109214563A (zh) 2019-01-15
CN109214563B CN109214563B (zh) 2022-07-19

Family

ID=64985719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810999303.7A Active CN109214563B (zh) 2018-08-30 2018-08-30 一种基于聚类与线性回归的降雨量预测方法

Country Status (1)

Country Link
CN (1) CN109214563B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112470888A (zh) * 2020-11-02 2021-03-12 广东职业技术学院 一种智慧社区的自动浇水方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127360A (zh) * 2016-06-06 2016-11-16 国网天津市电力公司 一种基于用户特性分析的多模型负荷预测方法
CN106951993A (zh) * 2017-03-20 2017-07-14 国网江苏省电力公司常州供电公司 一种电能量数据预估方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127360A (zh) * 2016-06-06 2016-11-16 国网天津市电力公司 一种基于用户特性分析的多模型负荷预测方法
CN106951993A (zh) * 2017-03-20 2017-07-14 国网江苏省电力公司常州供电公司 一种电能量数据预估方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112470888A (zh) * 2020-11-02 2021-03-12 广东职业技术学院 一种智慧社区的自动浇水方法及系统

Also Published As

Publication number Publication date
CN109214563B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
Pinto et al. Transfer learning for smart buildings: A critical review of algorithms, applications, and future perspectives
Oprea et al. Machine learning algorithms for short-term load forecast in residential buildings using smart meters, sensors and big data solutions
CN106650767B (zh) 基于聚类分析和实时校正的洪水预报方法
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN109740175B (zh) 一种面向风电机组功率曲线数据的离群点判别方法
Oh et al. Short-term travel-time prediction on highway: a review of the data-driven approach
Shang et al. Short-term load forecasting based on PSO-KFCM daily load curve clustering and CNN-LSTM model
CN111369070A (zh) 一种基于包络线聚类的多模融合光伏功率预测方法
Kianfar et al. Optimizing freeway traffic sensor locations by clustering global-positioning-system-derived speed patterns
CN104090974B (zh) 展延水库后续来水的动态数据挖掘方法及系统
CN103473621A (zh) 风电场短期功率预测方法
CN105185106B (zh) 一种基于粒计算的道路交通流参数预测方法
CN105374209A (zh) 一种城市区域路网运行状态特征信息提取方法
CN102147839A (zh) 一种光伏发电量预测方法
CN116992385B (zh) 一种物联网水表用量异常检测方法及系统
Wu et al. Deterministic and probabilistic wind power forecasts by considering various atmospheric models and feature engineering approaches
CN111046968A (zh) 一种基于改进dpc算法的道路网络轨迹聚类分析方法
CN104021180A (zh) 一种组合式软件缺陷报告分类方法
CN110110339A (zh) 一种日前水文预报误差校正方法及系统
CN115915364A (zh) 通信基站的节能方法、装置、计算机可读介质及设备
CN115265555A (zh) 基于隐马尔科夫的多噪声感知的地图匹配校正方法及系统
CN108564110A (zh) 一种基于聚类算法的空气质量预测方法
CN116307291A (zh) 一种基于小波分解的分布式光伏发电预测方法及预测终端
CN109214563A (zh) 一种基于聚类与线性回归的降雨量预测方法
CN116502805B (zh) 基于围区水网提升量化评价模型的调度方案快速筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant