CN108898159A - 基于dbscan算法的虚假林火热点过滤方法 - Google Patents
基于dbscan算法的虚假林火热点过滤方法 Download PDFInfo
- Publication number
- CN108898159A CN108898159A CN201810549897.1A CN201810549897A CN108898159A CN 108898159 A CN108898159 A CN 108898159A CN 201810549897 A CN201810549897 A CN 201810549897A CN 108898159 A CN108898159 A CN 108898159A
- Authority
- CN
- China
- Prior art keywords
- hot spot
- forest fires
- point
- fires hot
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 238000013480 data collection Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000013459 approach Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000009412 basement excavation Methods 0.000 abstract description 5
- 238000012544 monitoring process Methods 0.000 description 10
- 230000002123 temporal effect Effects 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 230000003993 interaction Effects 0.000 description 5
- 241001269238 Data Species 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于DBSCAN算法的虚假林火热点过滤方法,包括:确定时空聚类的参数;通过该确定的参数,利用DBSCAN算法对历史林火热点数据进行分析;基于上述分析,提取虚假林火热点。本发明基于时空数据的虚假林火热点判识方法,通过对计算机判读的历史林火热点数据的挖掘而形成的固定热源数据库,能够快速的排除在遥感影像上由固定热源造成的虚假林火热点。
Description
技术邻域
本发明涉及一种基于DBSCAN算法的虚假林火热点过滤方法。
背景技术
森林火灾不仅造成经济损失也严重危害森林及森林生态系统,提高林火热点监测对森林资源保护意义重大。遥感卫星具有监测覆盖范围广、时空分辨率高和获取数据方便的特性,其对林火热点监测具有重要作用。但是,通过遥感卫星监测林火热点时会提取地面所有热点,严重影响林火监测的精度。因此如何将虚假林火热点从卫星遥感林火热点监测数据中剔除是提高林火监测精度的关键。通过对计算机自动判读的历史林火热点数据进行数据挖掘,对提高虚假林火热点的判识精度提供了新的思路。
21世纪以来,随着遥感技术及互联网计算机技术的快速发展,国内外对虚假林火热点识别技术方法上比较成熟,同时随着地理信息系统数据挖掘方法的兴起,能够更好地指导森林防火工作的开展。但是依然存在着不少的问题,具体表现如下:(1)利用人机交互法对于虚假林火热点判识耗时耗力;(2)对于计算机自动判识的虚假林火热点方法,采用阈值法、通道法等方法对林火热点进行判识,尽管不断改进阈值法能够过滤掉一部分虚假林火热点,但也不能排除所有类型的虚假林火热点;没有利用历史林火热点数据对虚假林火热点进行排除;(3)在利用时空数据对虚假林火热点的挖掘研究上,国内的研究成果较少。在遥感数据走上“大数据”的今天,还缺乏对数据发掘的能力。并没有从时空数据中得到相对应的知识,从实现数据到知识的转化上明显不足。对历史数据的利用并没有得到重视。(4)尽管时空数据发掘的研究近年来得到了相当程度的发展,但在时空数据挖掘实际应用中,有时费时费力,并且在精度上没有达到一个完美的值,使得模型的应用缺乏相当的理论背景。
因此,需要一种结合时空数据和历史数据的虚假林火热点过滤方法。
发明内容
基于此,有必要提供一种结合时空特性,对历史数据进行分析,以挖掘虚假林火热点的方法。
根据本发明的目的,提供一种基于DBSCAN算法的虚假林火热点过滤方法,其特征在于,该方法包括以下步骤:
确定时空聚类的参数;
通过该确定的参数,利用DBSCAN算法对历史林火热点数据进行分析;
基于上述分析,提取虚假林火热点。
所述对历史林火热点数据进行分析,包括时序分布分析、地理分布分析、空间分布分析。
进一步地,所述的提取虚假林火热点,包括至少提取固定热源、农用热源和水面反射。
优选地,所述利用DBSCAN算法对历史林火热点数据进行分析,是采用 DBSCAN算法对林火热点数据进行聚类分析;所述确定时空聚类的参数,是确定DBSCAN算法的Eps参数和MinPts参数;
所述采用DBSCAN算法林火热点数据进行聚类分析,包括:根据输入的邻域参数Eps、MinPts和样本的欧式距离,对样本数据中的每个点的Eps邻域搜索成簇,当样本数据中的对象点P的Eps邻域包含的样本数据点个数多于MinPts,则建立以对象点P为核心对象的簇,之后不断迭代聚集核心对象直接密度可达的所有对象点,遍历所有对象点;当没有新对象点添加到任何簇时,聚类过程结束。
优选地,通过k-距离确定Eps,所述k-距离是指数据中的每个坐标点到数据中除这个点以外的所有点的距离;通过得到的k-距离,将距离进行统计,根据统计的曲线图以曲线明显变化的位置对应的距离作为合理的Eps的取值。
所述MinPts的计算公式如下:
其中,Pi为点i的Eps区域内的点的个数;N为数据集中的点的个数。
进一步地,所述的历史林火热点数据进行分析;通过上述分析确定时空聚类的参数;通过该确定的参数,利用DBSCAN算法对林火热点数据进行分析的过程为:
输入历史林火热点数据集,确定邻域参数Eps=2,MinPts=3,
输出簇集合;
所述输出簇集合包括:
(1)将历史林火热点数据集中的每一个对象点标记为未处理状态;
(2)对历史林火热点数据集中的每一个点对象P进行检查,若对象点P已经划分到某一个簇或标记为噪声点,则重新开始选择对象点P;若对象点P没有被分到任意簇和没有被标记为噪声点,则进行下一步;
(3)检查对象点P的Eps邻域NEps(P),若NEps(P)中包含的对象数小于MinPts,那么标记该对象点P为边界点或噪声点;若NEps(P)中包含对象数大于MinPts,那么标记该对象点P为核心点,并建立新簇集合G,并将P 邻域内的所有对象点加入G;
(4)对NEps(P)中存在没有被处理过的对象点D进行检查,当NEps(D) 中至少包含MInpts个对象点,那么将NEps(D)中未划分到任意一个簇的对象点加入簇G;
(5)遍历所有对象点,输出簇集合。
优选地,应用Python2.7进行测算,并将提取结果在ArcGIS上进行可视化分析。
优选地,该方法进一步包括验证虚假林火热点提取的正确性,所述验证使用中国森林防火网的对应区域的全年林火热点数据进行对比。
本申请基于时空数据的虚假林火热点判识方法,通过对计算机判读的历史林火热点数据的挖掘而形成的固定热源数据库,能够实现快速的排除在遥感影像上由固定热源造成的虚假林火热点。通过历史林火热点数据可以将固定热源和水面反射造成的虚假林火热点的位置精准定位,不用去实地考察位置。对于计算机每次判读的探测的林火热点不在固定热源数据库中的,通过与历史林火热点数据进行DBSCAN聚类分析后,可以排除掉一部分虚假林火热点,从而提升计算机自动判读林火热点的准确度。
附图说明
图1为本发明的虚假林火热点挖掘结构框图;
图2为历史林火热点统计图;
图3为历史林火热点地理分布图;
图4为任意一点到其他点的欧式距离图;
图5为林火热点聚类结果图。
具体实施方式
通过对数据库中的计算机自动判读的历史林火热点数据进行分析,发现历史林火热点数据是具有时序分布特征、地理分布特征以及空间分布特征的。这三个特征符合时空数据挖掘的要求,同时也具有时空聚类特征。因此以时空聚类规则进行虚假林火热点挖掘。
时空聚类规则是指以时空对象的一个或多种属性,通过某种相似或相近的原理,将这些时空对象进行分类,令属性相似或相近的时空对象形成一簇。同时将不相同的时空对象与成簇的时空对象分开,形成明显的分类。
本申请对基于时空数据的虚假林火热点挖掘方法进行研究,根据时空聚类规则,以聚类方法中的DBSCAN(density-based spatial clustering of applicationswithnoise)算法为挖掘算法对虚假林火热点进行挖掘。根据对历史林火点热数据分析发现,历史林火热点中有一部分林火热点在一定经纬度范围内聚集,因此利用聚类的方法可以将历史林火热点数据通过聚类后进行后续分析。
通过DBSCAN算法,计算每个林火热点之间经纬度的距离,选取合适的聚类半径,选取合适的聚类个数参数。将历史林火热点根据以挖掘虚假林火热点为目的,通过密度聚类后的簇,查看成簇内的林火热点的属性值,当簇内的林火热点不属于同一地表覆盖类型,并且没有时序特征,则簇不符合,仅考虑符合的簇类的林火热点。当所属簇的历史林火热点的卫星探测时间时序特征在3 个月内,同时属于同一个地表覆盖类型,通过地表覆盖类型能够确定是固定热源造成的虚假林火热点。当所属簇类的历史林火热点的卫星探测时间具有周期性,根据地表覆盖类型,处于耕地内,将这些林火热点确认为是农用火造成的虚假林火热点;若处于水系内,则确认为是水面反射造成的虚假林火热点。
如图1所示,为本发明的挖掘框架结构图,其对历史林火热点数据进行时序分布分析、地理分布分析、空间分布分析,确定DBSCAN算法的的Epts参数和MinPts参数,判断同一地表覆盖类是否具有时序特征,当具有时序特征时,判断是固定热源、农用热源或水面反射。
对历史林火热点数据进行三种分析,为时序分布分析、地理分布分析、空间分布分析。
(1)历史林火热点数据时序分布分析
以湖南省2015-1017年的数据为例,通过对经过修正的历史林火热点数据的统计图如图2所示。
从图2中可以明显看出,2016年计算机自动判读探测到的林火热点个数最多,且以2、5、6、7、8月最多,7月份为当年之最,共有1197个。同期2017 年探测到的林火热点个数分布月数与2016年分布一样,同样也是以2、5、6、7、 8月份探测到的林火热点个数最多。2015年数据以10月接收起,所以同期时间考虑只能考虑3年同月数据。可以看出10月-12月湖南省对比其他月份林火热点探测较少。
考虑同年对比数据,可以明显发现5、6、7、8在两年中探测的林火热点占全年个数的占比很大。同时可以认为林火热点探测得越多,那么虚假林火热点的占比也会越大。
(2)历史林火热点数据地理分布分析
将历史林火热点数据导入GIS,将.CSV的数据在GIS中打开,选择显示X, Y数据,选择地理坐标系中的GCS_WGS_1984。与湖南省边界的矢量数据叠加分析,林火热点地理分布图如图3所示。将数据选择通过GIS的叠加分析能对林火热点分布有一个直观的了解。从林火热点分布地理图(图3)可以看出,历史林火热点具有地区聚集性。同时可以认为历史林火热点中的虚假林火热点也具有聚集性。同时对各个市区林火热点个数进行统计,各市林火热点统计表见表1。
表1 湖南各市林火热点统计表
通过表1可知,湖南省2015年10月起至2017年12月底,衡阳市、常德市、永州市、怀化市4个市探测到的林火热点最多,分别占全省11.89%、10.65%、 10.79%。而张家界市在历史林火热点数据中探测到的林火热点最少,只有41个林火热点,只占全省的1.19%。其次较少的为娄底市、湘潭市、湘西土家族苗族自治州,分别占全省的3.04%、3.59%、4.63%。
(3)历史林火热点数据空间分布分析
对于历史林火热点数据的空间分布,在ArcGIS中提取栅格像元值,将两者叠加后,每个林火热点会落在栅格数据的某个像元中,因为地表覆盖数据的栅格数据的每一个像元均含有该像元点对应的经纬度和地表覆盖类型。利用GIS 提取栅格像元值需要以SHAPE文件的点和栅格数据在同一投影坐标系下进行,都为WGS 1984坐标系。栅格数据中属性对应表如表2所示:
表2 属性对应表
通过91位图助手下载的地表覆盖类型数据,湖南省对应的地表覆盖类型共有6种,为耕地、森琳、水系、湿地、人造地表、草地。
对添加了地表覆盖类型的历史林火热点进行统计,历史林火热点发生在不同地表覆盖类型的统计如下表3所示:
表3 历史林火热点地表覆盖类型统计表
通过表3可以确定,历史林火热点数据发生在森林的占总火点数据的35%,发生在耕地的占比为33%,发生在湿地的占比最少为1%。可以确定,虽然历史火点数据共有3475条记录,但是真正为林火热点的并不多,并且多为虚假林火热点。尽管在卫星地面接收站的计算机判读后的数据标识所有林火热点均来自林地,但是通过对历史林火热点数据分析发现单单通过卫星地面站的计算机判读处理,还是会有很多虚假林火热点存在,这些虚假林火热点的存在会严重影响林火监测的准确度。
通过修改、调整卫星提取林火热点的阈值和计算机自动判读的条件需要结合大量专家知识,并且需要做大量实验来验证阈值的正确性。除此之外更要考虑每个区域的地势、气候等阈值的不同。因此本发明利用历史林火热点数据进行分析,在现有的计算机自动判读虚假林火热点并结合人机交互方法的基础上,建立基于时空数据的虚假林火热点过滤方法。
DBSCAN算法是一种具有代表性的基于密度的DBSCAN算法。作为 DBSCAN算法之一,DBSCAN算法要聚集的簇定义为密度相连的点的最大集合。 DBSCAN聚类与其他聚类方法的区别就是不用事先知道聚类的簇为多少,通过聚类前选取合适的聚类半径和聚类的最少点数,按照给出的参数进行聚类划分。 DBSCAN算法的本质是计算给定的半径范围内包含了多少时空对象,算法包含两个参数Eps和MinPts,算法的核心概念如下:
(1)Eps邻域:在给定半径为E内的时空对象为该对象的E邻域;
(2)核心对象:核心对象是指在E邻域中达到设定密度值范围的点,即在Eps中的点数大于或者等于MinPts;
(3)直接密度可达:对于任意一个以对象P为核心对象的集合G,对象D 在对象P的Eps邻域内,那么对象D到对象P之间直接密度可达;
(4)密度可达:当存在集合,假如集合中任意点都是直接密度可达,那么集合中的点都是密度可达;
(5)密度相连:当集合G中点一个点使得任意点A,与对象P与对象D 都是密度可达,那么任意点P与对象P和对象D称为密度相连;
(6)类:当样本集合内要素为非空集合时为一类;
(7)噪声点:当样本集合中的存在某一点不属于任何类,该点为噪声点。
DBSCAN算法的聚类原理可以总结为,样本数据根据输入的邻域参数(Eps,MinPts)和样本的欧式距离,对样本数据中的每个点的Eps邻域进行搜索并形成簇,当样本数据中的对象点P的Eps邻域包含的样本数据点个数多于MinPts,则建立以对象点P为核心对象的簇。之后DBSCAN不断的迭代聚集核心对象直接密度可达的所有对象点,遍历所有对象点当没有新对象点添加到任何簇时,聚类过程结束。
DBSCAN算法聚类结果是否合理最大程度上取决于Eps参数的确定,当聚类半径Eps过大时会导致过多的噪声点被聚类成一簇,也有可能将本身不为同一簇的对象聚类。当聚类半径Eps过小是又会将本身属于同一簇的点给分成了不同的簇,那么这样的聚类时没有任何研究意义的。因此,计算合理的Eps是聚类成功与否的关键。
DBSCAN聚类所用的计算距离的方法为欧式距离,因此需要将历史林火热点坐标的经纬度转换为平面坐标进行计算。欧式距离计算公式如下:
上式中,d12为点1跟点2之间的欧式距离;x,y为数据的平面坐标。
通过ArcGIS将历史林火热点的经纬度转换为平面坐标。
对于Eps的确定,可以通过k-距离确定,k-距离是指数据中的每个坐标点到数据中除这个点以外的所有点的距离。通过得到的k-距离,将距离进行统计,根据统计的曲线图以曲线明显变化的位置对应的距离作为合理的Eps的取值。历史林火热点数据的任意一点到其它点的欧式距离分布情况如图4所示。本文根据实际情况,考虑到林火热点探测一个像元值为1000×1000m,Eps选择以历史林火热点数据中的火点像元面积的分布情况为初始聚类距离,历史林火热点数据的像素分布图如下:
从图4可以确定,历史林火热点数据中火点像元面积几乎都在4个像元面积以内,因此本发明选取2KM作为初始聚类距离。
确定了聚类半径后还需要确定每一个聚类点中的最小数目,当聚类数量选取过大时,原本能够作为聚类核心的点会因此被放弃;而当聚类数量选取过小时,会导致不应该为聚类核心的点作为核心点,从而将噪声点聚类到一簇,且聚类数量不能为2。在虚假林火热点挖掘时,根据实际挖掘目的需求,要求聚类中心区域需要体现虚假林火热点的密度特征。MinPts的计算公式如下:
式中,Pi为点i的Esp区域内的点的个数;N为数据集中的点的个数。
为了防止偶然相近的历史林火热点,根据实际需求,选取Minpts为3。
以历史林火热点数据的DBSCAN聚类挖掘的过程如下:
输入:历史林火热点数据集,邻域参数(Eps=2,MinPts=3),
输出:簇集合
(1)将历史林火热点数据集中的每一个对象点标记为未处理状态;
(2)对历史林火热点数据集中的每一个点对象P进行检查,若对象点P已经划分到某一个簇或标记为噪声点,则重新开始选择对象点P。若对象点P没有被分到任意簇和没有被标记为噪声点,则进行下一步;
(3)检查对象点P的Eps邻域NEps(P),若NEps(P)中包含的对象数小于MinPts,那么标记该对象点P为边界点或噪声点。若NEps(P)中包含对象数大于MinPts,那么标记该对象点P为核心点,并建立新簇集合G,并将P 邻域内的所有对象点加入G。
(4)对NEps(P)中存在没有被处理过的对象点D进行检查,当NEps(D) 中至少包含MInpts个对象点,那么将NEps(D)中未划分到任意一个簇的对象点加入簇G;
(5)遍历所有对象点,输出簇集合。
(6)挖掘结果与分析
应用Python2.7进行测算,并将挖掘结果在ArcGIS上进行可视化分析,挖掘结果展示如图5所示,图中黄点为每个聚类点,每个聚类点点中的林火热点数量在4及4个以上,对各市的簇的数量及各市簇中的所有的点数进行统计,统计如表4所示:
表4 簇的数量及各市簇中林火热点统计表
根据表4对每个簇的林火热点数据查看其属性,确定各林火热点是否符合处于同一地表覆盖类型和是否有时序特征。统计结果如表5所示:
表5 满足同一地表覆盖类型和时序条件的簇和热点统计
满足同一地表覆盖类型和满足时序条件热点的簇个数为169,不符合的为4 个。且不符合的簇内林火热点个数都为4。可以得出在样本中进行DBSCAN聚类得出的结果热点个数在4个以上时更符合虚假林火热点的特征。
对169个符合的簇类,进行统计,具体结果如表6所示:
表6 虚假林火热点统计
根据表6的统计结果可以确定,通过DBSCAN算法挖掘出的不同虚假林火热点类别的个数与占比情况,具体情况如下:
(1)固定热源
固定热源类的虚假林火热点占挖掘出的虚假林火热点的44.7%。同时发现,固定热源几乎都处于人造地表覆盖类型,且根据城市发达程度,越发达的城市由固定热源原因造成的虚假林火热点越多。固定热源的时序特征中以5、6、7、 8月最为显著。
(2)农用火源
虚假林火热点中由农用火源造成的虚假林火热点的个数占比为52.9%。同时发现,农用火源除了处于耕地中,也会处于森林中。农用火源造成的虚假林火热点的时间特征为农历春节前后、清明前后以及农作物春耕秋耕时间,以2、4 月份最为显著。
(3)水面反射
由水面反射造成的虚假林火热点仅占2.4%。通过挖掘发现,由水面反射造成20个虚假林火热点的卫星检测时间都为下午1:30左右。通过地图查询,20 点中4个点为郴州的资兴市的东江水库、4个点为岳阳湘阴县的湖泊、5个点为常德桃源县的沅江水段、7个点为岳阳岳阳县的东洞庭湖。
为了验证虚假林火热点挖掘结果的正确性,以中国森林防火网的湖南区域的2016年的全年林火热点数据进行对比。中国森林防火网2016年湖南区域的全年林火热点共计444条,根据Excel将每日林火热点数据编辑为数据表,数据表的样式与部分数据如表7所示:
表7 热点统计数据
中国森林防火网使用人机交互对林火热点进行判别,通过三通道合成遥感对林火热点目视解读预报林火热点,并且森林防火网的林火热点已经排除掉城市内固定热源、水面反射及云层反射造成的虚假林火热点,仅留下林地、草地内林火热点。将统计的444条数据添加到GIS中显示,查看是否有出现在簇内的热点。通过查看发现有8个林火热点处于8个不同的簇内,并且都是属于农用火源的簇内,8个簇中共计计算机判读的2016年历史林火热点数据40个。8 个森林防火网的林火热点数据如表8所示:
表8 8个林火热点数据
由表8可以确定,8个包含在簇内的森林防火网的热点中都不是林火热点。其中有6个为2016年2月7日、1个为2月8日、1个为12月10日。并且快速反馈为荒火的4个、农用火已灭的2个、未找到的2个。反馈为未找到的意思是指地面核查人员根据所报火点的附近的几公里范围内进行搜索并没有发现火点。未找到的基本上为农事用火熄灭后查找对象不明及热点位置出现偏差的原因。对快速反馈具体信息查看,并确认该8个林火热点都没有引起森林火灾,只是火烧热点。
同时查看簇内由计算机判读的40个历史林火热点数据,发现2月7日、8 日的历史林火热点数据的卫星监测时间与森林防火网的卫星监测时间仅相差3 分钟左右,可以认为历史林火热点数据与森林防火网的观测数据相同。但是通过计算机自动判读的林火热点却有40个。通过日历查询可知当年2月7日当天为除夕,可知2月7日、8日的林火热点是由祭祀火源引起的虚假林火热点。另外12月10日的由森林防火网人机交互判识该林火热点在历史林火热点数据库没有与之对应的热点数据。不存在的原因可能为地面接收站缺失当天的数据,也可能为计算机判读时直接将该点排除,更有可能是森林防火网的观测数据不准确。而此热点所处聚类中的由计算机自动判读的8个热点数据时间都为秋耕,时间为9月。但是森林防火网9月并没有热点数据,说明该簇类的8个热点都为虚假林火热点。
基于时空数据的虚假林火热点挖掘结果评价结论如下:
(1)通过对比森林防火网数据发现挖掘出的固定热源、水面发射造成的虚假热点确实为虚假林火热点。说明通过DBSCAN聚类挖掘出的这两类共385条虚假林火热点准确率为100%。
(2)虽然有40个由计算机自动判读的历史林火热点数据所成的8个簇与森林防火网的8个热点数据相交,但是通过上面分析可知,有7个簇内的历史林火热点数据与7个热点数据是能够对应的,且森林防火网的反馈为都不是林火热点,没有引起森林火灾,只是火烧点。一方面说明挖掘出的由农用火源造成的虚假林火热点是真实可靠的,另一方面从侧面说明通过森林防火网的人机交互目视判读也会出现虚假林火热点的情况。
(3)对于其中1个不能对应的簇内的历史林火热点数据通过比对发现的确为虚假林火热点。
由上述结论可知利用DBSCAN算法对计算机自动判读的历史林火热点数据的虚假林火热点挖掘结果是可行可靠、且准确度较高。
本申请基于时空数据的虚假林火热点挖掘方法,通过对计算机判读的历史林火热点数据的挖掘而形成的固定热源数据库,能够实现快速地对遥感影像上由固定热源造成的虚假林火热点进行过滤。通过历史林火热点数据可以将固定热源和水面反射造成的虚假林火热点的位置精准定位,不用去实地考察位置。对于计算机每次判读的探测的林火热点不在固定热源数据库中的,通过与历史林火热点数据进行DBSCAN聚类分析后,可以排除掉一部分虚假林火热点,从而提升计算机自动判读林火热点的准确度。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种基于DBSCAN算法的虚假林火热点过滤方法,其特征在于,该方法包括以下步骤:
确定时空聚类的参数;
通过该确定的参数,利用DBSCAN算法对历史林火热点数据进行分析;
基于上述分析,提取虚假林火热点。
2.根据权利要求1所述的方法,其特征在于,所述对历史林火热点数据进行分析,包括时序分布分析、地理分布分析、空间分布分析。
3.根据权利要求1或2所述的方法,其特征在于,所述的提取虚假林火热点,包括至少提取固定热源、农用热源和水面反射。
4.根据权利要求1所述的方法,其特征在于,所述利用DBSCAN算法对历史林火热点数据进行分析,是采用DBSCAN算法对林火热点数据进行聚类分析;所述确定时空聚类的参数,是确定DBSCAN算法的Eps参数和MinPts参数。
所述采用DBSCAN算法对林火热点数据进行聚类分析,包括:根据输入的邻域参数Eps、MinPts和样本的欧式距离,对样本数据中的每个点的Eps邻域搜索成簇,当样本数据中的对象点P的Eps邻域包含的样本数据点个数多于MinPts,则建立以对象点P为核心对象的簇,之后不断迭代聚集核心对象直接密度可达的所有对象点,遍历所有对象点;当没有新对象点添加到任何簇时,聚类过程结束。
5.根据权利要求4所述的方法,其特征在于,通过k-距离确定Eps,所述k-距离是指数据中的每个坐标点到数据中除这个点以外的所有点的距离;通过得到的k-距离,将距离进行统计,根据统计的曲线图以曲线明显变化的位置对应的距离作为合理的Eps的取值。
6.根据权利要求5所述的方法,其特征在于,所述MinPts的计算公式如下:
其中,Pi为点i的Eps区域内的点的个数;N为数据集中的点的个数。
7.根据权利要求6所述的方法,其特征在于,所述的历史林火热点数据进行分析;通过上述分析确定时空聚类的参数;通过该确定的参数,利用DBSCAN算法对林火热点数据进行分析的过程为:
输入历史林火热点数据集,确定邻域参数Eps=2,MinPts=3;
输出簇集合;
所述输出簇集合包括:
(1)将历史林火热点数据集中的每一个对象点标记为未处理状态;
(2)对历史林火热点数据集中的每一个点对象P进行检查,若对象点P已经划分到某一个簇或标记为噪声点,则重新开始选择对象点P;若对象点P没有被分到任意簇和没有被标记为噪声点,则进行下一步;
(3)检查对象点P的Eps邻域NEps(P),若NEps(P)中包含的对象数小于MinPts,那么标记该对象点P为边界点或噪声点;若NEps(P)中包含对象数大于MinPts,那么标记该对象点P为核心点,并建立新簇集合G,并将P邻域内的所有对象点加入G;
(4)对NEps(P)中存在没有被处理过的对象点D进行检查,当NEps(D)中至少包含MInpts个对象点,那么将NEps(D)中未划分到任意一个簇的对象点加入簇G;
(5)遍历所有对象点,输出簇集合。
8.根据权利要求7所述的方法,其特征在于,应用Python2.7进行测算,并将提取结果在ArcGIS上进行可视化分析。
9.根据权利要求8所述的方法,其特征在于,该方法进一步验证虚假林火热点提取的正确性,所述验证使用中国森林防火网对应区域的全年林火热点数据进行对比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810549897.1A CN108898159B (zh) | 2018-05-31 | 2018-05-31 | 基于dbscan算法的虚假林火热点过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810549897.1A CN108898159B (zh) | 2018-05-31 | 2018-05-31 | 基于dbscan算法的虚假林火热点过滤方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108898159A true CN108898159A (zh) | 2018-11-27 |
CN108898159B CN108898159B (zh) | 2022-05-27 |
Family
ID=64343633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810549897.1A Active CN108898159B (zh) | 2018-05-31 | 2018-05-31 | 基于dbscan算法的虚假林火热点过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108898159B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110021018A (zh) * | 2019-04-12 | 2019-07-16 | 电子科技大学 | 一种基于遥感数据提取森林火灾足迹的方法 |
CN111858813A (zh) * | 2020-07-21 | 2020-10-30 | 云南电网有限责任公司带电作业分公司 | 一种基于卫星技术的非火点区域排除方法 |
CN112562244A (zh) * | 2020-12-03 | 2021-03-26 | 广东电网有限责任公司电力科学研究院 | 一种输电线路山火识别方法和系统 |
CN113269175A (zh) * | 2021-07-21 | 2021-08-17 | 航天宏图信息技术股份有限公司 | 一种火情监测方法和装置 |
CN116047546A (zh) * | 2022-07-07 | 2023-05-02 | 北京玖天气象科技有限公司 | 基于多源卫星数据的山火监测方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993002749A1 (fr) * | 1991-07-31 | 1993-02-18 | Jacques Julien Lang | Procede pour la detection et la lutte contre les feux de forets |
EP0984413A2 (de) * | 1998-09-01 | 2000-03-08 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Verfahren und Vorrichtung zur automatischen Waldbranderkennung |
DE102010011588A1 (de) * | 2010-03-12 | 2011-09-15 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Verfahren zur Bestimmung von Sensitivitätsmatrizen für kritische Hotspots |
CN102289585A (zh) * | 2011-08-15 | 2011-12-21 | 重庆大学 | 基于数据挖掘的公共建筑能耗实时监测方法 |
DE102009048739B3 (de) * | 2009-07-14 | 2012-03-29 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Verfahren und Vorrichtung zur automatischen Waldbranderkennung |
CN104615848A (zh) * | 2014-12-26 | 2015-05-13 | 中国南方电网有限责任公司 | 一种集森林火险预报和地面火点监测于一体的综合应用方法 |
CN105678419A (zh) * | 2016-01-05 | 2016-06-15 | 天津大学 | 细粒度的森林火灾概率预报系统 |
CN105740817A (zh) * | 2016-01-29 | 2016-07-06 | 张弓 | 一种秸秆燃烧火点数据的判断方法及系统 |
WO2016132161A1 (en) * | 2015-02-16 | 2016-08-25 | Kontoes Charalampos | Method that detects areas of active fire hotspots in real-time, calculates the most probable ignition point and assesses fire probability indicators, using satellite images and fuel data. |
CN106228192A (zh) * | 2016-07-28 | 2016-12-14 | 国网湖南省电力公司 | 一种基于双阈值聚类分析的输电线路山火区域辨识方法 |
CN107609291A (zh) * | 2017-09-22 | 2018-01-19 | 哈尔滨工业大学 | 一种基于密度聚类的虚假模态剔除方法 |
-
2018
- 2018-05-31 CN CN201810549897.1A patent/CN108898159B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993002749A1 (fr) * | 1991-07-31 | 1993-02-18 | Jacques Julien Lang | Procede pour la detection et la lutte contre les feux de forets |
EP0984413A2 (de) * | 1998-09-01 | 2000-03-08 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Verfahren und Vorrichtung zur automatischen Waldbranderkennung |
DE102009048739B3 (de) * | 2009-07-14 | 2012-03-29 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Verfahren und Vorrichtung zur automatischen Waldbranderkennung |
DE102010011588A1 (de) * | 2010-03-12 | 2011-09-15 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Verfahren zur Bestimmung von Sensitivitätsmatrizen für kritische Hotspots |
CN102289585A (zh) * | 2011-08-15 | 2011-12-21 | 重庆大学 | 基于数据挖掘的公共建筑能耗实时监测方法 |
CN104615848A (zh) * | 2014-12-26 | 2015-05-13 | 中国南方电网有限责任公司 | 一种集森林火险预报和地面火点监测于一体的综合应用方法 |
WO2016132161A1 (en) * | 2015-02-16 | 2016-08-25 | Kontoes Charalampos | Method that detects areas of active fire hotspots in real-time, calculates the most probable ignition point and assesses fire probability indicators, using satellite images and fuel data. |
CN105678419A (zh) * | 2016-01-05 | 2016-06-15 | 天津大学 | 细粒度的森林火灾概率预报系统 |
CN105740817A (zh) * | 2016-01-29 | 2016-07-06 | 张弓 | 一种秸秆燃烧火点数据的判断方法及系统 |
CN106228192A (zh) * | 2016-07-28 | 2016-12-14 | 国网湖南省电力公司 | 一种基于双阈值聚类分析的输电线路山火区域辨识方法 |
CN107609291A (zh) * | 2017-09-22 | 2018-01-19 | 哈尔滨工业大学 | 一种基于密度聚类的虚假模态剔除方法 |
Non-Patent Citations (9)
Title |
---|
IMAS SUKAESIH SITANGGANG 等: "Burn Area Processing to Generate False Alarm Data for Hotspot Prediction Models", 《TELKOMNIKA (TELECOMMUNICATION COMPUTING ELECTRONICS AND CONTROL) 》 * |
MUHAMMAD USMAN 等: "Hotspot distribution analyses based on peat characteristics using density-based spatial clustering", 《 PROCEDIA ENVIRONMENTAL SCIENCES》 * |
张树誉 等: "卫星遥感林火监测中漏判与误判的原因分析", 《森林防火》 * |
李晓恋: "基于MODIS数据的多因子协同作用下森林火灾预测监测研究", 《中国博士学位论文全文数据库 农业科技辑》 * |
李爱国 等: "《数据挖掘原理、算法及应用》", 31 January 2012, 西安电子科技大学出版社 * |
王小妮: "《数据挖掘技术》", 31 August 2014, 北京航空航天大学出版社 * |
邹春辉 等: "卫星遥感技术在秸秆焚烧监测业务中的应用", 《应用气象》 * |
陈孝明 等: "利用卫星监测热点数据的湖北电网林火灾害时空聚类分析及其应用", 《测绘通报》 * |
黎良财 等: "基于时序遥感的喀斯特山区植被覆盖研究", 《中南林业科技大学学报》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110021018A (zh) * | 2019-04-12 | 2019-07-16 | 电子科技大学 | 一种基于遥感数据提取森林火灾足迹的方法 |
CN111858813A (zh) * | 2020-07-21 | 2020-10-30 | 云南电网有限责任公司带电作业分公司 | 一种基于卫星技术的非火点区域排除方法 |
CN112562244A (zh) * | 2020-12-03 | 2021-03-26 | 广东电网有限责任公司电力科学研究院 | 一种输电线路山火识别方法和系统 |
CN112562244B (zh) * | 2020-12-03 | 2022-06-14 | 广东电网有限责任公司电力科学研究院 | 一种输电线路山火识别方法和系统 |
CN113269175A (zh) * | 2021-07-21 | 2021-08-17 | 航天宏图信息技术股份有限公司 | 一种火情监测方法和装置 |
CN113269175B (zh) * | 2021-07-21 | 2021-10-22 | 航天宏图信息技术股份有限公司 | 一种火情监测方法和装置 |
CN116047546A (zh) * | 2022-07-07 | 2023-05-02 | 北京玖天气象科技有限公司 | 基于多源卫星数据的山火监测方法 |
CN116047546B (zh) * | 2022-07-07 | 2024-02-27 | 北京玖天气象科技有限公司 | 基于多源卫星数据的山火监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108898159B (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898159A (zh) | 基于dbscan算法的虚假林火热点过滤方法 | |
CN108875806A (zh) | 基于时空数据的虚假林火热点挖掘方法 | |
CN104699755B (zh) | 一种基于数据挖掘的智能化多目标综合识别方法 | |
CN106846163A (zh) | 一种电力缴费渠道综合分析系统 | |
CN107330734A (zh) | 基于Co‑location模式和本体的商业地址选择方法 | |
Merrett et al. | Applications of geographical information systems and remote sensing in natural disaster hazard assessment and mitigation in Taiwan | |
de Almeida Papa et al. | Evaluating tropical forest classification and field sampling stratification from lidar to reduce effort and enable landscape monitoring | |
CN106126882A (zh) | 基于肯德尔和谐系数排序的勘查区元素地球化学数据优选方法 | |
CN109325522B (zh) | 基于改进kmeans的重工业时序热源区域识别算法 | |
Egan et al. | Techniques to enhance assessment and reporting of pest damage estimated with aerial detection surveys | |
Frate et al. | Spatially explicit estimation of forest age by integrating remotely sensed data and inverse yield modeling techniques | |
Bourbonnais et al. | G eographic analysis of the impacts of mountain pine beetle infestation on forest fire ignition | |
Rowell et al. | Using laser altimetry-based segmentation to refine automated tree identification in managed forests of the Black Hills, South Dakota | |
Amati et al. | Using machine learning to identify urban forest crown bounding boxes (CBB): Exploring a new method to develop urban forest policy | |
Min et al. | Landscape Evaluation of Forest Park Based on Analytic Hierarchy Process | |
Prior et al. | Multi‐decadal stability of woody cover in a mesic eucalypt savanna in the Australian monsoon tropics | |
Cracknell et al. | Construction and analysis of hydrogeological landscape units using self-organising maps | |
Yan et al. | Outliers detection of cultivated land quality grade results based on spatial autocorrelation | |
Miarrostami et al. | Multihazard rangelands susceptibility mapping (drought, flood, and fire) in Siah Bisheh watershed in north of Iran | |
Bystron | GIS-based analysis of spring occurrence and spring source areas in Peace River Regional District, British Columbia | |
Porter et al. | Watershed Statues Evaluation Protocol (WSEP): Tier 1 watershed-level fish values monitoring | |
CN108009510A (zh) | 安保态势分析方法和装置 | |
Tokushima et al. | Ecology of the rare but irruptive Pilliga mouse, Pseudomys pilligaensis. IV. Habitat ecology | |
Metha et al. | Analysis of land use and land cover dynamics and forest disturbance in western ghats region of Maharashtra, India | |
Xie et al. | Assessing the dynamics and trigger factors of drought propagation in the China-Pakistan economic corridor: A three-dimensional perspective |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |