CN102663082A - 基于数据挖掘的森林火灾预测方法 - Google Patents

基于数据挖掘的森林火灾预测方法 Download PDF

Info

Publication number
CN102663082A
CN102663082A CN201210097986XA CN201210097986A CN102663082A CN 102663082 A CN102663082 A CN 102663082A CN 201210097986X A CN201210097986X A CN 201210097986XA CN 201210097986 A CN201210097986 A CN 201210097986A CN 102663082 A CN102663082 A CN 102663082A
Authority
CN
China
Prior art keywords
forest fire
fire
probability
characteristic parameter
forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210097986XA
Other languages
English (en)
Inventor
刘云
高利娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201210097986XA priority Critical patent/CN102663082A/zh
Publication of CN102663082A publication Critical patent/CN102663082A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及一种基于数据挖掘的森林火灾预测方法,属于信息自动化技术领域;首先对实时的影响森林火灾的特征参数的采集,然后通过相关系数分析,回归模型进行预测,并采用Logistic回归模型进行概率预测,根据国家既定标准,得出预测结果;本方法将先进的数据挖掘技术应用于森林火灾预测,并采用Logistic回归模型对火灾发生的概率预测,与森林火灾预警分级结合,更精确的将森林火灾预警明确和分级,对于较高发生火险等级的情况及时告警增加了概率分析,提高了判断的准确性,同时使运算方便,快捷。

Description

基于数据挖掘的森林火灾预测方法
技术领域
本发明涉及一种基于数据挖掘的森林火灾预测方法,属于信息自动化技术领域。
背景技术
我国是森林火灾多发的国家之一。森林火灾对生态环境 造成的严重破坏,同时给人类的生存造成严重的经济损失。为了防止森林火灾的发生,需要对火灾发生的频率和因素进行研究,并能提供更可靠和更准确的森林火灾预测系统是重要的研究和探索的领域。目前在传统的森林火灾预测技术中,主要采用的是Logistic和零膨胀Poisson(ZIP)回归模型、智能预测等技术。这些技术能有效解决预测等问题,但在预测精度方面还可以进一步提升。
发明内容                                  
针对以上问题,本发明提供一种基于数据挖掘的森林火灾预测系统,将先进的数据挖掘技术应用于森林火灾预测,并采用Logistic回归模型对火灾发生的概率预测,与森林火灾预警分级结合,更精确的将森林火灾预警明确和分级,对于较高发生火险等级的情况及时告警增加了概率分析,提高了判断的准确性,同时使运算方便,快捷。
本发明采用的技术方案:本发明采用了相关性算法和回归模型算法相结合的数据挖掘技术和预测算法手段,并利用Logistic回归模型进行概率预测,根据预测的概率结果,与森林火险信号进行对比,进行预测,具体按照下面步骤进行;
第一步、数据采集过程:根据森林火灾预测所需要的特征参数进行数据的采集、处理和建立所需特征参数的实时和历史数据库;
第二步、相关性分析过程:根据收集到的特征参数利用相关系数公式:                                                
Figure 201210097986X100002DEST_PATH_IMAGE001
进行相关性分析,其中
Figure 358833DEST_PATH_IMAGE002
为相关系数,
Figure 201210097986X100002DEST_PATH_IMAGE003
分别为自变量;
第三步:利用最小二乘法计算回归系数,
Figure 161704DEST_PATH_IMAGE004
                                                                             
Figure 201210097986X100002DEST_PATH_IMAGE005
其中是回归系数 , 
Figure 201210097986X100002DEST_PATH_IMAGE007
Figure 759355DEST_PATH_IMAGE008
为变量
Figure 201210097986X100002DEST_PATH_IMAGE009
的平均值;              
第四步:利用公式
Figure 201210097986X100002DEST_PATH_IMAGE011
, 其中:
Figure 368246DEST_PATH_IMAGE012
是回归系数,
Figure 201210097986X100002DEST_PATH_IMAGE013
为自变量,
Figure 615687DEST_PATH_IMAGE014
为概率;并通过计算预测火灾发生的可能性概率;
第五步:利用Logistic回归模型进行概率预测,根据预测的概率结果,与国家林业局规定的森林火险信号进行对比,即:当概率在0-0.25之间时,此时是黄色警情,森林火灾较易发生,但是发生的可能性不大;当概率大于0.5时,需要用当年的每日测量值进行校验,此时橙色警情,森林火灾较易发生,火势蔓延速度快;当概率大于0.75时,需要用多年的日平均测量值进行校验,此时是红色警情,森林火灾极易发生,火势蔓延速度极快。
影响森林火灾因素的特征参数,根据影响火灾的多种因素,选择相应的特征参数作为系统的数据源,诸如:温度、湿度、风速直接因素和环境、地质结构、气候带等间接因素构成。
本发明的有益效果:将先进的数据挖掘技术应用于森林火灾预测,并采用Logistic回归模型对火灾发生的概率预测,与森林火灾预警分级结合,更精确的将森林火灾预警明确和分级,对于较高发生火险等级的情况及时告警增加了概率分析,提高了判断的准确性,同时使运算方便,快捷。
附图说明
图1为系统流程图。
具体实施方式
下面通过实施例对本发明进行详细说明。
本发明采用了相关性算法和回归模型算法相结合的数据挖掘技术和预测算法手段,并利用Logistic回归模型进行概率预测,根据预测的概率结果,与森林火险信号进行对比,进行预测,具体按照下面步骤进行;
第一步、数据采集过程:根据森林火灾预测所需要的特征参数进行数据的采集、处理和建立所需特征参数的实时和历史数据库;
影响森林火灾因素的特征参数,根据影响火灾的多种因素,选择相应的特征参数作为系统的数据源,诸如:温度、湿度、风速等直接因素和环境、地质结构、气候带等间接因素构成。
第二步、相关性分析过程
相关系数:
Figure 201210097986X100002DEST_PATH_IMAGE015
     
Figure 624095DEST_PATH_IMAGE016
                        (1)
在发明采用的是一元线性关联模型
Figure 201210097986X100002DEST_PATH_IMAGE017
,既:变量和变量
Figure 201210097986X100002DEST_PATH_IMAGE019
,例如
Figure 891183DEST_PATH_IMAGE018
为温度,
Figure 371843DEST_PATH_IMAGE019
为湿度。从上面的公式可以得到相关系数
Figure 601967DEST_PATH_IMAGE002
,如果两个变量之间的相关系数为1或-1,那么就可以由变量
Figure 459064DEST_PATH_IMAGE018
去得到变量的值,且相关系数的绝对值越高,从一个变量去预测另一个变量的精确度就越高,这是因为相关系数越高,就意味着这两个变量的共变部分就越多,所以从其中一个变量的变化就越多地得到另一个变量的变化。
第三步:利用最小二乘法计算回归系数
回归系数:一元回归模型里,通过观测得到若干数据(
Figure 742595DEST_PATH_IMAGE020
)。在这些数据的基础上,获得因变量
Figure 224130DEST_PATH_IMAGE019
对自变量
Figure 619339DEST_PATH_IMAGE018
的回归关系
Figure 201210097986X100002DEST_PATH_IMAGE021
,其中
Figure 105815DEST_PATH_IMAGE022
Figure 201210097986X100002DEST_PATH_IMAGE023
(0,
Figure 131540DEST_PATH_IMAGE024
)为误差估计,
Figure 398573DEST_PATH_IMAGE006
是回归系数。
利用最小二乘法来计算
Figure 535157DEST_PATH_IMAGE006
的值,从而估计
Figure DEST_PATH_IMAGE025
的值,用公式
Figure 374674DEST_PATH_IMAGE026
                          (2)
来计算,当公式中的
Figure 201210097986X100002DEST_PATH_IMAGE027
达到最小值时,表示该直线越靠近上述的
Figure 571301DEST_PATH_IMAGE028
个数据点。一般情况下
Figure 325630DEST_PATH_IMAGE028
对(
Figure 325DEST_PATH_IMAGE020
)不完全相等,则
Figure 523710DEST_PATH_IMAGE006
的最小二乘估计为:
                               (3)                                                   
Figure 891238DEST_PATH_IMAGE005
                  (4)
其中
Figure 303502DEST_PATH_IMAGE007
Figure 844205DEST_PATH_IMAGE008
Figure 425359DEST_PATH_IMAGE009
Figure 760525DEST_PATH_IMAGE010
的平均值。
在自变量为
Figure 427130DEST_PATH_IMAGE030
的情况下,线性回归模型将变为:  (5)
其中:
Figure 443628DEST_PATH_IMAGE012
是回归系数,
Figure 941605DEST_PATH_IMAGE022
Figure 883891DEST_PATH_IMAGE023
(0,
Figure 100109DEST_PATH_IMAGE024
)为误差估计。
第四步:利用公式
Figure 920297DEST_PATH_IMAGE011
, 其中:
Figure 272781DEST_PATH_IMAGE012
是回归系数,
Figure 153012DEST_PATH_IMAGE013
为自变量,
Figure 590947DEST_PATH_IMAGE014
为概率;并通过计算预测火灾发生的可能性概率;
第五步:根据预测的概率结果,与国家林业局规定的森林火险信号进行对比,即:当概率在0-0.25之间时,此时是黄色警情,森林火灾较易发生,但是发生的可能性不大;当概率大于0.5时,需要用当年的每日测量值进行校验,此时橙色警情,森林火灾较易发生,火势蔓延速度快;当概率大于0.75时,需要用多年的日平均测量值进行校验,此时是红色警情,森林火灾极易发生,火势蔓延速度极快。
另外,在实际预测中,我们必须考虑到地形等间接因素的影响。在用于其他领域时,有时特征参数具有非线性关系,就必须采用非线性回归模型。在这种情况下,必须把非线性模型转化成线性模型进行预测。
实施例1
本发明采用哈尔滨某年月平均值得实时气象数据为例,对这年来火灾的发生率进行短期的预测来详细的说明本方法。
基于Windows下的开发环境,使用SQL Sever 2005数据库建立相应的历史、实时数据库,通过Matlab或者C#、C++等编程工具建立模型。
再设计和实现上主要有以下几点:
1、通过对影响因素的考查,确定系统的特征参数;
2、通过相关性分析,确定特征参数间的相关性;
3、通过对特征参数相关性计算,选择相应的参数作为模型中所需的变量,再通过回归模型中的最小二乘法估计回归参数,最后通过回归估计算出预测值。
第一步、特征参数的确定和收集:取湿度、温度、风速、降水量和日照时间为特征参数。
通过特征参数的确定,从数据库中选取一年的相对湿度、温度、风速、降水量以及日照时间,如下表1所示:
表1特征参数
  相对湿度(%) 温度(℃) 风速(米/秒) 降水量(mm) 日照时间(h)
1月 20 -20.1 3.1 3 140.2
2月 29 -14.9 3.2 6 179.0
3月 43 -6.1 4.0 10 241.0
4月 50 6.21 4.7 21 272.2
5月 67 14.45 4.5 37 226.0
6月 70 20 3.6 78 285.0
7月 75 22.85 3.3 153 280.2
8月 64 21.1 3.0 116 210.8
9月 59 14.5 3.3 61 260.0
10月 38 5.8 3.7 23 164.6
11月 30 -5.4 3.8 8 193.3
12月 25 -15.05 3.2 5 162.3
第二步、通过相关性公式(1)对表1中的特征参数求其相互间的相关性,如下表2所示:
表2各特征参数间的相关性
  相对湿度(%) 温度(℃) 风速(米/秒) 降水量(mm) 日照时间(h)
相对湿度(%) 1.0000 0.9561 0.1938 0.8298 0.8284
温度(℃) 0.9561 1.0000 0.1533 0.8350 0.7424
风速(米/秒) 0.1938 0.1533 1.0000 -0.2821 0.3793
降水量(mm) 0.8298 0.8350 -0.2821 1.0000 0.5885
日照时间(h) 0.8284 0.7424 0.3793 0.5885 1.0000
通过上表2对多个特征参数的相关性分析,发现相对湿度、相对温度、降水量和日照时间的相关性较强,本实例采用相关性最强的相对湿度和温度作为变量,用回归模型进行预测。
第三步、通过最小二乘法求得的回归模型的回归系数为:1.8665,0.0212。因为在实施例中选用的是一元线性回归既:,所以
Figure 705905DEST_PATH_IMAGE034
1.8665+0.0212
Figure 568819DEST_PATH_IMAGE018
。 
第四步、利用公式
Figure 793127DEST_PATH_IMAGE011
计算概率:
Figure 201210097986X100002DEST_PATH_IMAGE035
通过此方程就能计算出预测概率为
Figure 57886DEST_PATH_IMAGE014
=0.1,
第五步:根据预测的概率结果,与国家林业局规定的森林火险信号进行对比:当概率在0-0.25之间时,不需要校正,此时是黄色警情,森林火灾较易发生,但是发生的可能性不大;当概率大于0.5时,需要用当年的每日测量值进行校验,此时橙色警情,森林火灾较易发生,火势蔓延速度快;当概率大于0.75时,需要用多年的日平均测量值进行校验,此时是红色警情,森林火灾极易发生,火势蔓延速度极快。
本实施例中概率为
Figure 342237DEST_PATH_IMAGE014
=0.1,概率在0-0.25之间,也就是说易发生火灾,此时的警情为黄色预警。
本发明是通过具体实施过程进行说明的,在不脱离本发明范围的情况下,还可以对发明进行各种变换及等同代替,因此,本发明不局限于所公开的具体实施过程,而应当包括落入本发明权利要求范围内的全部实施方案。

Claims (2)

1.一种基于数据挖掘的森林火灾预测方法,其特征在于:森林火灾预测方法按照下面步骤进行;
第一步、数据采集过程:根据森林火灾预测所需要的特征参数进行数据的采集、处理和建立所需特征参数的实时和历史数据库;
第二步、相关性分析过程:根据收集到的特征参数利用相关系数公式:                                                
Figure 984901DEST_PATH_IMAGE001
进行相关性分析,其中
Figure 884724DEST_PATH_IMAGE002
为相关系数,
Figure 388518DEST_PATH_IMAGE003
分别为自变量;
第三步:利用最小二乘法计算回归系数,
Figure 690186DEST_PATH_IMAGE004
                                                                             
Figure 988443DEST_PATH_IMAGE005
  其中是回归系数 , 
Figure 745364DEST_PATH_IMAGE007
为变量
Figure 869233DEST_PATH_IMAGE009
的平均值;              
第四步:利用公式
Figure 589244DEST_PATH_IMAGE011
, 其中:
Figure 537608DEST_PATH_IMAGE012
是回归系数,为自变量,
Figure 539379DEST_PATH_IMAGE014
为概率;并通过计算预测火灾发生的可能性概率;
第五步:根据预测的概率结果,与国家林业局规定的森林火险信号进行对比,即:当概率在0-0.25之间时,此时是黄色警情,森林火灾较易发生,但是发生火灾的可能性不大;当概率大于0.5时,需要用当年的每日测量值进行校验,此时橙色警情,森林火灾较易发生,火势蔓延速度快;当概率大于0.75时,需要用多年的日平均测量值进行校验,此时是红色警情,森林火灾极易发生,火势蔓延速度极快。
2.按照权利要求1所述的一种基于数据挖掘的森林火灾预测方法,其特征在于:确定影响森林火灾因素的特征参数,根据影响火灾的多种因素,选择相应的特征参数作为系统的数据源,诸如:温度、湿度、风速直接因素和环境、地质结构、气候带间接因素构成。
CN201210097986XA 2012-04-06 2012-04-06 基于数据挖掘的森林火灾预测方法 Pending CN102663082A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210097986XA CN102663082A (zh) 2012-04-06 2012-04-06 基于数据挖掘的森林火灾预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210097986XA CN102663082A (zh) 2012-04-06 2012-04-06 基于数据挖掘的森林火灾预测方法

Publications (1)

Publication Number Publication Date
CN102663082A true CN102663082A (zh) 2012-09-12

Family

ID=46772573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210097986XA Pending CN102663082A (zh) 2012-04-06 2012-04-06 基于数据挖掘的森林火灾预测方法

Country Status (1)

Country Link
CN (1) CN102663082A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020737A (zh) * 2012-12-12 2013-04-03 红塔烟草(集团)有限责任公司 一种烤片烟气的预测方法
CN104680138A (zh) * 2015-02-09 2015-06-03 北京空间飞行器总体设计部 基于特性参数相关性的卫星图像自动判读系统和方法
CN104835279A (zh) * 2015-06-02 2015-08-12 国家电网公司 一种输电线路山火告警集中时期计算方法
CN106295179A (zh) * 2016-08-10 2017-01-04 广东工业大学 一种流行性感冒预测方法及装置
CN106874671A (zh) * 2017-02-15 2017-06-20 淄博祥龙测控技术有限公司 一种用于煤矿自燃火灾大数据平台的数据驱动的算法
CN108520363A (zh) * 2018-04-18 2018-09-11 电子科技大学 一种用于预测未来时相森林火灾发生风险的评估方法
CN108717582A (zh) * 2018-04-17 2018-10-30 平安科技(深圳)有限公司 森林火灾预测方法、装置、计算机设备和存储介质
CN109492928A (zh) * 2018-11-23 2019-03-19 北京林业大学 一种构建森林火险预测模型的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1163439A (zh) * 1996-04-19 1997-10-29 黑龙江省气象局 火险等级的预报系统
CN1529291A (zh) * 2003-10-16 2004-09-15 华南理工大学 森林火灾智能监测报警装置
CN2653613Y (zh) * 2003-10-16 2004-11-03 华南理工大学 森林火灾智能监测报警装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1163439A (zh) * 1996-04-19 1997-10-29 黑龙江省气象局 火险等级的预报系统
CN1529291A (zh) * 2003-10-16 2004-09-15 华南理工大学 森林火灾智能监测报警装置
CN2653613Y (zh) * 2003-10-16 2004-11-03 华南理工大学 森林火灾智能监测报警装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于继武: "基于ARM的森林火险预警系统模型研究", 《中国科技信息》, no. 24, 31 December 2011 (2011-12-31), pages 100 - 101 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020737A (zh) * 2012-12-12 2013-04-03 红塔烟草(集团)有限责任公司 一种烤片烟气的预测方法
CN104680138A (zh) * 2015-02-09 2015-06-03 北京空间飞行器总体设计部 基于特性参数相关性的卫星图像自动判读系统和方法
CN104680138B (zh) * 2015-02-09 2017-11-03 北京空间飞行器总体设计部 基于特性参数相关性的卫星图像自动判读系统和方法
CN104835279A (zh) * 2015-06-02 2015-08-12 国家电网公司 一种输电线路山火告警集中时期计算方法
CN106295179A (zh) * 2016-08-10 2017-01-04 广东工业大学 一种流行性感冒预测方法及装置
CN106874671A (zh) * 2017-02-15 2017-06-20 淄博祥龙测控技术有限公司 一种用于煤矿自燃火灾大数据平台的数据驱动的算法
CN106874671B (zh) * 2017-02-15 2019-11-19 淄博祥龙测控技术有限公司 一种用于煤矿自燃火灾大数据平台的数据驱动的方法
CN108717582A (zh) * 2018-04-17 2018-10-30 平安科技(深圳)有限公司 森林火灾预测方法、装置、计算机设备和存储介质
CN108520363A (zh) * 2018-04-18 2018-09-11 电子科技大学 一种用于预测未来时相森林火灾发生风险的评估方法
CN109492928A (zh) * 2018-11-23 2019-03-19 北京林业大学 一种构建森林火险预测模型的方法及装置
CN109492928B (zh) * 2018-11-23 2021-08-06 北京林业大学 一种构建森林火险预测模型的方法及装置

Similar Documents

Publication Publication Date Title
CN102663082A (zh) 基于数据挖掘的森林火灾预测方法
Li et al. General models for estimating daily global solar radiation for different solar radiation zones in mainland China
CN108593990B (zh) 一种基于电能用户用电行为模式的窃电检测方法和应用
CN105303469B (zh) 线损异常原因数据挖掘分析的方法与系统
Shi et al. Prediction of indoor temperature and relative humidity based on cloud database by using an improved BP neural network in Chongqing
CN103093643B (zh) 一种确定公共停车场泊位数的方法
CN103631681A (zh) 一种在线修复风电场异常数据的方法
CN104462184A (zh) 一种基于双向抽样组合的大规模数据异常识别方法
CN105590023A (zh) 一种基于信息熵的滚动轴承性能退化模糊粒化预测方法
CN103226736A (zh) 基于聚类分析与灰靶理论的中长期电力负荷预测方法
CN106600037B (zh) 一种基于主成分分析的多参量辅助负荷预测方法
CN103729444B (zh) 一种基于设备监测数据间潜在关系的异常数据检测方法
CN105574587A (zh) 一种塑料注塑过程的在线工况过程监控方法
CN109165693A (zh) 一种适用于露、霜和结冰的天气现象的自动判识方法
CN107067100A (zh) 风电功率异常数据辨识方法及辨识装置
CN109378031B (zh) 一种基于植保和气象信息结合的水稻纹枯病预测方法
CN102968675B (zh) 一种短期预测棉蚜种群数量的方法
CN105373849A (zh) 光伏电池组件温度的分步预测方法
Chuchro et al. A concept of time windows length selection in stream databases in the context of sensor networks monitoring
CN103353295A (zh) 一种精确预测大坝坝体垂直变形量的方法
Kang et al. Examining the Impact of Weather Factors on Yield Industry Vitalization on Big Data Foundation Technique
CN114092729A (zh) 基于聚类匿名化与差分隐私保护的异构用电数据发布方法
CN103886177A (zh) 一种基于空间网格预测雷击火日发生概率的方法
CN116401561B (zh) 一种设备级运行状态序列的时间关联聚类方法
CN103115598A (zh) 电网覆冰区域分布的测绘方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912