CN109214563A - 一种基于聚类与线性回归的降雨量预测方法 - Google Patents
一种基于聚类与线性回归的降雨量预测方法 Download PDFInfo
- Publication number
- CN109214563A CN109214563A CN201810999303.7A CN201810999303A CN109214563A CN 109214563 A CN109214563 A CN 109214563A CN 201810999303 A CN201810999303 A CN 201810999303A CN 109214563 A CN109214563 A CN 109214563A
- Authority
- CN
- China
- Prior art keywords
- linear regression
- cluster
- data
- prediction
- precipitation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012417 linear regression Methods 0.000 title claims abstract description 51
- 238000001556 precipitation Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于聚类与线性回归的降雨量预测方法,属于气象数据分析方法技术领域。本发明首先收集地区降雨观测数据并生成降雨数据库;然后获取降雨数据库中数据,并生成数据集;然后根据生成的数据集生成聚类;同时根据生成的聚类计算线性回归系数;再通过生成的聚类和线性回归系数,得到聚类的线性回归函数;再根据所得聚类的线性回归函数,计算K次聚类的线性回归;最后根据所得K次聚类的线性回归结果得到降雨预测数据。本发明使用聚类算法以及线性回归算法对降雨数据进行处理,从而得到降雨预测。
Description
技术领域
本发明涉及一种基于聚类与线性回归的降雨量预测方法,属于气象数据分析方法技术领域。
背景技术
准确的预测降水可用于各个相关行业,制定政策,规划和管理决策,并有助于水资源系统可持续的运作。使用历史数据,基于统计和智能计算的方法来进行未来降雨的预测,是现如今较为通用的降雨预测手段。但现有的一些降雨数据分析预测方法都有着准确性不高的缺点。
发明内容
本发明要解决的技术问题是提供一种基于聚类与线性回归的降雨量预测方法,用以解决上述问题。
本发明的技术方案是:一种基于聚类与线性回归的降雨量预测方法,具体步骤为:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,…,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
所述步骤Step3中,生成的聚类为:
所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,…,k的数据点计算的线性回归系数。
所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2。
所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk。
本发明的有益效果是:使用层次聚类算法以及线性回归算法对气象数据进行处理,提升降雨数据分析预测结果的准确性。
附图说明
图1是本发明流程示意图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1所示,一种基于聚类与线性回归的降雨量预测方法,具体步骤为:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,…,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
所述步骤Step3中,生成的聚类为:
所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,…,k的数据点计算的线性回归系数。
所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2。
所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (6)
1.一种基于聚类与线性回归的降雨量预测方法,其特征在于:
Step1:收集地区降雨观测数据并生成降雨数据库;
Step2:获取降雨数据库中数据,并生成数据集;
Step3:根据Step3中生成的数据集生成聚类;
Step4:根据Step4中生成的聚类计算线性回归系数;
Step5:根据Step3和Step4中生成的聚类和线性回归系数,得到聚类的线性回归函数;
Step6:根据Step5所得聚类的线性回归函数,计算K次聚类的线性回归;
Step7:根据Step6所得K次聚类的线性回归结果得到降雨预测数据。
2.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step2中,生成的数据集为:
{(ai,bi)∈Rn×Rn;i=1,...,l}
其中,Rn表示一个具有内积的n维欧几里德空间。
3.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step3中,生成的聚类为:
4.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step4中,生成的线性回归系数{xj,yj}是仅使用来自聚类Aj,j=1,...,k的数据点计算的线性回归系数。
5.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step5中,所述线性回归函数为:
其中,x=(x1,...,xk)∈Rnk且y=(y1,...,yk)∈Rk,l为数据集中点的总数,Eab(xj,yj)是数据点(a,b)∈A和系数{xj,yj}的平方回归误差,其计算公式为:
Eab(xj,yj)=(<xj,a>+yj-b)2。
6.根据权利要求1所述的基于聚类与线性回归的降雨量预测方法,其特征在于:所述步骤Step6中,K次聚类的线性回归的计算方式为:
minimize fk(x,y)(x,y)∈Rnk×Rk。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810999303.7A CN109214563B (zh) | 2018-08-30 | 2018-08-30 | 一种基于聚类与线性回归的降雨量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810999303.7A CN109214563B (zh) | 2018-08-30 | 2018-08-30 | 一种基于聚类与线性回归的降雨量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109214563A true CN109214563A (zh) | 2019-01-15 |
CN109214563B CN109214563B (zh) | 2022-07-19 |
Family
ID=64985719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810999303.7A Active CN109214563B (zh) | 2018-08-30 | 2018-08-30 | 一种基于聚类与线性回归的降雨量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109214563B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112470888A (zh) * | 2020-11-02 | 2021-03-12 | 广东职业技术学院 | 一种智慧社区的自动浇水方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127360A (zh) * | 2016-06-06 | 2016-11-16 | 国网天津市电力公司 | 一种基于用户特性分析的多模型负荷预测方法 |
CN106951993A (zh) * | 2017-03-20 | 2017-07-14 | 国网江苏省电力公司常州供电公司 | 一种电能量数据预估方法 |
-
2018
- 2018-08-30 CN CN201810999303.7A patent/CN109214563B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127360A (zh) * | 2016-06-06 | 2016-11-16 | 国网天津市电力公司 | 一种基于用户特性分析的多模型负荷预测方法 |
CN106951993A (zh) * | 2017-03-20 | 2017-07-14 | 国网江苏省电力公司常州供电公司 | 一种电能量数据预估方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112470888A (zh) * | 2020-11-02 | 2021-03-12 | 广东职业技术学院 | 一种智慧社区的自动浇水方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109214563B (zh) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pinto et al. | Transfer learning for smart buildings: A critical review of algorithms, applications, and future perspectives | |
Oprea et al. | Machine learning algorithms for short-term load forecast in residential buildings using smart meters, sensors and big data solutions | |
CN106650767B (zh) | 基于聚类分析和实时校正的洪水预报方法 | |
CN108985380B (zh) | 一种基于聚类集成的转辙机故障识别方法 | |
CN109740175B (zh) | 一种面向风电机组功率曲线数据的离群点判别方法 | |
Oh et al. | Short-term travel-time prediction on highway: a review of the data-driven approach | |
Shang et al. | Short-term load forecasting based on PSO-KFCM daily load curve clustering and CNN-LSTM model | |
CN111369070A (zh) | 一种基于包络线聚类的多模融合光伏功率预测方法 | |
Kianfar et al. | Optimizing freeway traffic sensor locations by clustering global-positioning-system-derived speed patterns | |
CN104090974B (zh) | 展延水库后续来水的动态数据挖掘方法及系统 | |
CN103473621A (zh) | 风电场短期功率预测方法 | |
CN105185106B (zh) | 一种基于粒计算的道路交通流参数预测方法 | |
CN105374209A (zh) | 一种城市区域路网运行状态特征信息提取方法 | |
CN102147839A (zh) | 一种光伏发电量预测方法 | |
CN116992385B (zh) | 一种物联网水表用量异常检测方法及系统 | |
Wu et al. | Deterministic and probabilistic wind power forecasts by considering various atmospheric models and feature engineering approaches | |
CN111046968A (zh) | 一种基于改进dpc算法的道路网络轨迹聚类分析方法 | |
CN104021180A (zh) | 一种组合式软件缺陷报告分类方法 | |
CN110110339A (zh) | 一种日前水文预报误差校正方法及系统 | |
CN115915364A (zh) | 通信基站的节能方法、装置、计算机可读介质及设备 | |
CN115265555A (zh) | 基于隐马尔科夫的多噪声感知的地图匹配校正方法及系统 | |
CN108564110A (zh) | 一种基于聚类算法的空气质量预测方法 | |
CN116307291A (zh) | 一种基于小波分解的分布式光伏发电预测方法及预测终端 | |
CN109214563A (zh) | 一种基于聚类与线性回归的降雨量预测方法 | |
CN116502805B (zh) | 基于围区水网提升量化评价模型的调度方案快速筛选方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |