CN108875806A - 基于时空数据的虚假林火热点挖掘方法 - Google Patents

基于时空数据的虚假林火热点挖掘方法 Download PDF

Info

Publication number
CN108875806A
CN108875806A CN201810551145.9A CN201810551145A CN108875806A CN 108875806 A CN108875806 A CN 108875806A CN 201810551145 A CN201810551145 A CN 201810551145A CN 108875806 A CN108875806 A CN 108875806A
Authority
CN
China
Prior art keywords
forest fires
hot spot
point
data
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810551145.9A
Other languages
English (en)
Other versions
CN108875806B (zh
Inventor
张贵
杨志高
蔡琼
周璀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University of Forestry and Technology
Original Assignee
Central South University of Forestry and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University of Forestry and Technology filed Critical Central South University of Forestry and Technology
Priority to CN201810551145.9A priority Critical patent/CN108875806B/zh
Publication of CN108875806A publication Critical patent/CN108875806A/zh
Application granted granted Critical
Publication of CN108875806B publication Critical patent/CN108875806B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/28Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture specially adapted for farming

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Alarm Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于时空数据的虚假林火热点挖掘方法,包括以下步骤:基于DBSCAN算法聚类建立历史林火热点数据库;接收林火热点数据;判断林火热点数据中是否含有由核心对象点位置2KM内产生的林火热点;若是,则调用历史林火热点数据库排除虚假林火热点。本发明基于时空数据的虚假林火热点判别方法,通过对计算机判读的历史林火热点数据的挖掘而形成的固定热源数据库,能够实现快速的排除在遥感影像上由固定热源造成的虚假林火热火。

Description

基于时空数据的虚假林火热点挖掘方法
技术邻域
本发明涉及一种基于时空数据的虚假林火热点挖掘方法。
背景技术
森林火灾不仅造成经济损失也严重危害森林及森林生态系统,提高林火热点监测对森林资源保护意义重大。遥感卫星具有监测覆盖范围广、时空分辨率高和获取数据方便的特性,其对林火热点监测具有重要作用。但是,通过遥感卫星监测林火热点时会提取地面所有热点,严重影响林火监测的精度。因此如何将虚假林火热点从卫星遥感林火热点监测数据中剔除是提高林火监测精度的关键。通过对计算机自动判读的历史林火热点数据进行数据挖掘,给虚假林火热点的判别提供了新的思路。
21世纪以来,随着遥感技术及互联网计算机技术的快速发展,国内外对虚假林火热点识别技术方法上有了相当成熟的判断方法,同时随着数据挖掘的重视,也开始与地理信息系统相结合,对森林防火有了更好的指导。但是依然存在着不少的问题,具体表现如下:(1)利用人机交互法对于虚假林火热点判识耗时耗力;(2)对于计算机自动判别的虚假林火热点方法,采用阈值法、通道法等方法对林火热点进行判别。尽管不断改进阈值法能够滤除掉一部分虚假林火热点,但也不能将所有类型的虚假林火热点排除;没有利用历史林火热点数据对虚假林火热点进行排除;(3)在利用时空数据对虚假林火热点的挖掘研究上,国内的研究成果较少。在遥感数据走上“大数据”的今天,还缺乏对数据发掘的能力。并没有从时空数据中得到相对应的知识,从实现数据到知识的转化上明显不足。对历史数据的利用并没有得到重视。(4)尽管时空数据发掘的研究近年来得到了相当程度的发展但在时空数据挖掘实际应用中,有时费时费力。并且在精度上没有达到一个完美的值,使得模型的应用缺乏相当的理论背景;(5)林火热点数据可能存在异常或者误差,需要进行误差分析以及修正。
因此,需要一种结合时空数据和历史数据的虚假林火热点提取方法,其在对林火热点数据进行时空聚类前,首先要对数据进行修正。
发明内容
基于此,有必要提供一种结合时空特性,对历史数据进行分析,以挖掘虚假林火热点的方法。
本发明基于时空数据的虚假林火热点挖掘方法包括以下步骤:
基于DBSCAN算法聚类建立历史林火热点数据库;
接收林火热点数据;
判断林火热点数据中是否含有由核心对象点位置2KM内产生的热点;
若是,则调用历史林火热点数据库排除虚假林火热点。
进一步地。在建立历史林火热点数据库前,对历史林火数据进行清洗,包括修正经纬度错误和无效数据。
优选地,所述的基于DBSCAN算法聚类建立历史林火热点数据库,包括以下步骤:
根据输入的邻域参数Eps、MinPts和样本的欧式距离,对样本数据中的每个点的Eps邻域搜索成簇,当样本数据中的对象点P的Eps邻域包含的样本数据点个数多于MinPts,则建立以对象点P为核心对象的簇,之后不断迭代聚集核心对象直接密度可达的所有对象点,遍历所有对象点;当没有新对象点添加到任何簇时,聚类过程结束。
优选地,利用聚类算法输出簇类,具体包括:
输入历史林火热点数据集,确定邻域参数Eps=2,MinPts=3;
输出簇集合;
所述输出簇集合包括:
(1)将历史林火热点数据集中的每一个对象点标记为未处理状态;
(2)对历史林火热点数据集中的每一个点对象P进行检查,若对象点P已经划分到某一个簇或标记为噪声点,则重新开始选择对象点P;若对象点P没有被分到任意簇和没有被标记为噪声点,则进行下一步;
(3)检查对象点P的Eps邻域NEps(P),若NEps(P)中包含的对象数小于MinPts,那么标记该对象点P为边界点或噪声点;若NEps(P)中包含对象数大于MinPts,那么标记该对象点P为核心点,并建立新簇集合G,并将P邻域内的所有对象点加入G;
(4)对NEps(P)中存在没有被处理过的对象点D进行检查,当NEps(D)中至少包含MInpts个对象点,那么将NEps(D)中未划分到任意一个簇的对象点加入簇G;
(5)遍历所有对象点,输出簇集合。
本申请基于时空数据的虚假林火热点判别方法,通过对计算机判读的历史林火热点数据进行挖掘而建立的固定热源数据库,能够实现快速对遥感影像上由固定热源造成的虚假林火热点进行排除。通过历史林火热点数据可以将固定热源和水面反射造成的虚假林火热点的位置精准定位,不用去实地考察位置。对于计算机每次判读的林火热点不在固定热源数据库中的,通过与历史林火热点数据进行DBSCAN聚类分析后,可以排除掉一部分虚假林火热点,从而提升计算机自动判读林火热点的准确度。
附图说明
图1为数据清理流程图;
图2为本发明的虚假林火热点挖掘结构框图;
图3为历史林火热点统计图;
图4为历史林火热点地理分布图;
图5为任意一点到其他点的欧式距离图;
图6为聚类结果图;
图7为虚假林火热点判别流程图;
图8为虚假林火热点结果图。
具体实施方式
卫星遥感林火监测平台的数据较为完整的记录了计算机自动判读的历史林火热点的发生时间、火点的像素面积、火点所在行政区划代码等信息。通过SQL查询,为了方便后续数据调用,导出格式采用EXCEL、GIS等都能读取的.csv格式。历史火点数据结构如表1所示:
表1 数据结构
由于卫星对地面探测后将数据传输至地面接收站时,数据会存在一些误差和错误,会导致历史林火热点数据中会出现许多偏离点。为了不影响后续分析的准确性,需要在数据分析前对这些数据进行清洗。历史林火热点数据出现误差和错误的原因主要因为设备故障造成。由于卫星本身问题或者地面接收站问题或者其他原因导致,会使得获得的林火热点数据在一段时间内会一直向地面接收站传输相同的林火热点数据或者完全错误的林火热点数据。因此不管是由何原因造成的错误数据,都应该将这些错误数据进行剔除。
在对历史林火热点数据进行挖掘前,需要根据造成数据异常的原因对获得的数据进行清洗。对数据进行清洗指的是对获得的数据进行重新的审查和校验的一种过程。对数据清洗的目的是为了删除掉重复信息和剔除错误数据,使得分析的数据获得一致性。历史林火热点数据清洗中不符合的数据主要分为两类,分别为经纬度错误的数据和无效的数据。只有在经过对林火热点数据的清洗后,才能确保在林火热点数据正确的前提下进行后续的虚假林火热点数据挖掘。针对历史林火热点数据,主要考虑到林火热点数据是否位置正确和数据可用。在对历史林火热点数据进行清洗时,分以下两个步骤进行:
(1)经纬度错误
经纬度错误是指在数据库中林火热点对应的行政区划代码与林火热点所在经纬度出现偏离,如区域代码为湖南省浏阳市的历史林火热点数据对应的经纬度却处于台湾,这类数据便是错误数据。在对林火热点数据清理时要首先排除经纬度错误的数据。
(2)无效数据
所谓无效数据是指数据库中林火热点面积过大,根据调查森林防火网热点统计,火点像素面积几乎都在10像素以下。所以火场面积像素超过10像素以上的林火热点数据我们可以认为是数据错误,并将这类数据进行剔除。
修正流程图如图1所示,修正结果如表2所示。
表2 修正结果
通过对数据库中的计算机自动判读的历史林火热点数据进行分析,发现历史林火热点数据是具有时序分布特征、地理分布特征以及空间分布特征的。这三个特征符合时空数据挖掘的要求,同时也具有时空聚类特征。因此以时空聚类规则进行虚假林火热点挖掘。
时空聚类规则是指以时空对象的一个或多种属性,通过某种相似或相近的原理,将这些时空对象进行分类,令属性相似或相近的时空对象形成一簇。同时将不相同的时空对象与成簇的时空对象分开,形成明显的分类。
本申请对基于时空数据的虚假林火热点挖掘方法进行研究,根据时空聚类规则,以聚类方法中的DBSCAN(density-based spatial clustering of applicationswithnoise)算法为挖掘算法对虚假林火热点进行挖掘。根据对历史林火热点数据分析发现,历史林火热点中有一部分林火热点在一定经纬度范围内聚集,因此利用聚类的方法可以将历史林火热点数据通过聚类后进行后续分析。
通过DBSCAN算法,计算每个林火热点之间经纬度的距离,选取合适的聚类半径,选取合适的聚类个数参数。将历史林火热点以挖掘虚假林火热点为目的,通过密度聚类后的簇,查看成簇内的林火热点的属性值,当簇内的林火热点不属于同一地表覆盖类型并且没有时序特征,则簇不符合,仅考虑符合的簇类的林火热点。当所属簇的历史林火热点的卫星探测时间时序特征在3个月内,同时属于同一个地表覆盖类型,通过地表覆盖类型能够确定是固定热源造成的虚假林火热点。当所属簇类的历史林火热点的卫星探测时间具有周期性,根据地表覆盖类型,处于耕地内,将这些林火热点确认为是农用火造成的虚假林火热点;若处于水系内,则确认为是水面反射造成的虚假林火热点。
如图2所示,为本发明的挖掘框架结构图,其对历史林火热点数据进行时序分布分析、地理分布分析、空间分布分析,确定DBSCAN算法的的Epts参数和MinPts参数,判断同一地表覆盖类是否具有时序特征,当具有时序特征时,判断是固定热源、农用热源或水面反射。
对历史林火热点数据进行三种分析,为时序分布分析、地理分布分析、空间分布分析。
(1)历史林火热点数据时序分布分析
以湖南省2015-1017年的数据为例,通过对经过修正的历史林火热点数据的统计图如图3所示。
从图3中可以明显看出,2016年计算机自动判读探测到的林火热点个数最多,且以2、5、6、7、8月最多,7月份为当年之最,共有1197个。同期2017年探测到的林火热点个数分布月数与2016年分布一样,同样也是以2、5、6、7、8月份探测到的林火热点个数最多。2015年数据以10月接收起,所以同期时间考虑只能考虑3年同月数据。可以看出10月-12月湖南省对比其他月份探测到的林火热点较少。
考虑同年对比数据,可以明显发现5、6、7、8在两年中探测的林火热点占全年个数的占比很大。同时可以认为林火热点探测得越多,那么虚假林火热点的占比也会越大。
(2)历史林火热点数据地理分布分析
将历史林火数据导入GIS,将.CSV的数据在GIS中打开,选择显示X,Y数据,选择地理坐标系中的GCS_WGS_1984。与湖南省边界的矢量数据叠加分析,林火热点地理分布图如图4所示。将数据选择通过GIS的叠加分析能对林火热点分布有一个直观的了解。从林火热点分布地理图(图4)可以看出,历史林火热点具有地区聚集性。同时可以认为历史林火热点中的虚假林火热点也具有聚集性。同时对各个市区林火热点个数进行统计,各市林火热点统计表见表3。
表3 湖南各市林火热点统计
通过表3可知,湖南省2015年10月起至2017年12月底,衡阳市、常德市、永州市、怀化市4个市探测到的林火热点最多,分别占全省11.89%、10.65%、10.79%。而张家界市在历史林火热点数据中探测到的林火热点最少,只有41个林火热点,只占全省的1.19%。其次较少的为娄底市、湘潭市、湘西土家族苗族自治州,分别占全省的3.04%、3.59%、4.63%。
(3)历史林火热点数据空间分布分析
对于历史林火热点数据的空间分布,利用ArcGIS提取栅格像元值,将两者叠加后,每个林火热点会落在栅格数据的某个像元中,因为地表覆盖数据的栅格数据每一个像元均含有该像元点对应的经纬度和地表覆盖类型。利用GIS提取栅格像元值需要以SHAPE文件的点和栅格数据在同一投影坐标系下进行,都为WGS 1984坐标系。栅格数据中属性对应表如表4所示:
表4 栅格数据属性对应表
通过91位图助手下载的地表覆盖类型数据,湖南省对应的地表覆盖类型共有6种,为耕地、森琳、水系、湿地、人造地表、草地。
对添加了地表覆盖类型的历史林火热点进行统计,历史林火热点发生在不同地表覆盖类型的统计如下表5所示:
表5 历史林火热点地表覆盖类型统计
通过表5可以确定,历史林火热点数据发生在森林的占总林火热点数据的35%,发生在耕地的占比为33%。发生在湿地的占比最少为1%。可以确定,虽然历史火点数据共有3475条记录,但是真正为林火热点的并不多,并且多为虚假林火热点。尽管在卫星地面接收站的计算机判读后的数据标识所有林火热点均来自林地,但是通过对历史林火热点数据分析发现单单通过卫星地面站的计算机判读处理,还是会有很多虚假林火热点存在,这些虚假林火热点的存在会严重影响林火监测的准确度。
通过修改、调整卫星提取林火热点的阈值和计算机自动判读的条件需要结合大量专家知识,并且需要做大量实验来验证阈值的正确性。除此之外更要考虑每个区域的地势、气候等阈值的不同。因此本发明利用历史林火热点数据进行分析,在现有的计算机自动判读虚假林火热点并结合人机交互方法的基础上,建立基于时空数据的虚假林火热点过滤方法。
DBSCAN算法是一种具有代表性的基于密度的聚类算法。作为聚类算法之一,DBSCAN算法要聚集的簇定义为密度相连的点的最大集合。DBSCAN聚类与其他聚类方法的区别就是不用事先知道聚类的簇为多少,通过聚类前选取合适的聚类半径和聚类的最少点数,按照给出的参数进行聚类划分。DBSCAN算法的本质是计算给定的半径范围内包含了多少时空对象,算法包含两个参数Eps和MinPts,算法的核心概念如下:
(1)Eps邻域:在给定半径为E内的时空对象为该对象的E邻域;
(2)核心对象:核心对象是指在E邻域中达到设定密度值范围的点,即在Eps中的点数大于或者等于MinPts;
(3)直接密度可达:对于任意一个以对象P为核心对象的集合G,对象D在对象P的Eps邻域内,那么对象D到对象P之间直接密度可达;
(4)密度可达:当存在集合{D1,D2…Dn},假如集合中任意点Di从Di-1都是直接密度可达,那么集合中的点都是密度可达;
(5)密度相连:当集合G中点一个点使得任意点A,与对象P与对象D都是密度可达,那么任意点P与对象P和对象D称为密度相连;
(6)类:当样本集合内要素为非空集合时为一类;
(7)噪声点:当样本集合中的存在某一点不属于任何类,该点为噪声点。
DBSCAN算法在进行聚类原理可以总结为,样本数据根据输入的邻域参数(Eps,MinPts)和样本的欧式距离,对样本数据中的每个点的Eps邻域来搜索成簇,当样本数据中的对象点P的Eps邻域包含的样本数据点个数多于MinPts,则建立以对象点P为核心对象的簇。之后DBSCAN不断的迭代聚集核心对象直接密度可达的所有对象点,遍历所有对象点当没有新对象点添加到任何簇时,聚类过程结束。
DBSCAN算法聚类结果是否合理最大程度上取决于Eps参数的确定,当聚类半径Eps过大时会导致过多的噪声点被聚类成一簇,也有可能将本身不为同一簇的对象聚类。当聚类半径Eps过小是又会将本身属于同一簇的点给分成了不同的簇,那么这样的聚类时没有任何研究意义的。因此,计算合理的Eps是聚类成功与否的关键。
DBSCAN聚类所用的计算距离的方法为欧式距离,因此需要将历史林火热点坐标的经纬度转换为平面坐标进行计算。欧式距离计算公式如下:
上式中,d12为点1跟点2之间的欧式距离;x,y为数据的平面坐标。
通过ArcGIS将历史林火热点的经纬度转换为平面坐标。
对于Eps的确定,可以通过k-距离确定,k-距离是指数据中的每个坐标点到数据中除这个点以外的所有点的距离。通过得到的k-距离,将距离进行统计,根据统计的曲线图以曲线明显变化的位置对应的距离作为合理的Eps的取值。历史火点数据的任意一点到其它点的欧式距离分布情况如图5所示。本文根据实际情况,考虑到林火热点探测一个像元值为1000×1000m,Eps选择以历史林火热点数据中的火点像元面积的分布情况为初始聚类距离,历史林火热点数据的像素分布图如下:
从图5可以确定,历史林火热点数据中火点像元面积的几乎都在4个像元面积以内,因此本发明选取2KM作为初始聚类距离。
确定了聚类半径后还需要确定每一个聚类点中的最小数目,当聚类数量选取过大时,原本能够作为聚类核心的点会因此被放弃;而当聚类数量选取过小时,会导致不应该为聚类核心的点作为核心点,从而将噪声点聚类到一簇,且聚类数量不能为2。在虚假林火热点挖掘时,根据实际挖掘目的需求,要求聚类中心区域需要体现虚假林火热点的密度特征。MinPts的计算公式如下:
式中,Pi为点i的Esp区域内的点的个数;N为数据集中的点的个数。
为了防止偶然相近的历史林火热点,根据实际需求,选取Minpts为3。
以历史林火热点数据的DBSCAN聚类挖掘的过程如下:
输入:历史林火热点数据集,邻域参数(Eps=2,MinPts=3),
输出:簇集合
(1)将历史林火热点数据集中的每一个对象点标记为未处理状态;
(2)对历史林火热点数据集中的每一个点对象P进行检查,若对象点P已经划分到某一个簇或标记为噪声点,则重新开始选择对象点P。若对象点P没有被分到任意簇和没有被标记为噪声点,则进行下一步;
(3)检查对象点P的Eps邻域NEps(P),若NEps(P)中包含的对象数小于MinPts,那么标记该对象点P为边界点或噪声点。若NEps(P)中包含对象数大于MinPts,那么标记该对象点P为核心点,并建立新簇集合G,并将P邻域内的所有对象点加入G。
(4)对NEps(P)中存在没有被处理过的对象点D进行检查,当NEps(D)中至少包含MInpts个对象点,那么将NEps(D)中未划分到任意一个簇的对象点加入簇G;
(5)遍历所有对象点,输出簇集合。
(6)挖掘结果与分析
应用Python2.7进行测算,并将挖掘结果在ArcGIS上进行可视化分析,挖掘结果展示如图6所示,图中的点为每个聚类点,每个聚类点中的林火热点数量在4及4个以上,对各市的簇的数量及各市簇中的所有的点数进行统计,统计如表6所示:
表6 簇的数量及各市簇中林火热点统计表
根据表6对每个簇的林火热点数据查看其属性,确定各林火热点是否符合处于同一地表覆盖类型和是否有时序特征。统计结果如表7所示:
表7 满足同一地表覆盖类型和时序条件的簇和热点统计
满足同一地表覆盖类型和满足时序条件热点的簇个数为169,不符合的为4个。且不符合的簇内林火热点个数都为4。可以得出在样本中进行DBSCAN聚类得出的结果热点个数在4个以上时更符合虚假林火热点的特征。
对169个符合的簇类,进行统计,具体结果如表8所示:
表8 虚假林火热点统计
根据表8的统计结果可以确定,通过DBSCAN算法挖掘出的不同虚假林火热点类别的个数与占比情况,具体情况如下:
(1)固定热源
固定热源类的虚假林火热点占挖掘出的虚假林火热点的44.7%。同时发现,固定热源几乎都处于人造地表地表覆盖类型,且根据城市发达程度,越发达的城市的由固定热源原因造成的虚假林火热点越多。固定热源的时序特征中以5、6、7、8月最为显著。
(2)农用火源
虚假林火热点中由农用火源造成的虚假热点的个数占比为52.9%。同时发现,农用火源除了处于耕地中,也会处于森林中。农用火源造成的虚假热点的时间特征为农历春节前后、清明前后以及农作物春耕秋耕时间,以2、4月份最为显著。
(3)水面反射
由水面反射造成的虚假林火火点仅占2.4%。通过挖掘发现,由水面原因造成20个虚假林火热点的卫星检测时间都为下午1:30左右。通过地图查询,20点中4个点为郴州的资兴市的东江水库、4个点为岳阳湘阴县的湖泊、5个点为常德桃源县的沅江水段,7个点为岳阳岳阳县的东洞庭湖。
为了验证虚假林火热点挖掘结果的正确性,以中国森林防火网的湖南区域的2016年的全年林火热点数据进行对比。中国森林防火网2016年湖南区域的全年林火热点共计444条,根据Excel将每日林火热点数据编辑为数据表,数据表的样式与部分数据如表9所示:
表9 热点统计数据
中国森林防火网使用人机交互对林火热点进行判识别,通过三通道合成遥感对林火热点目视解读预报热点,并且森林防火网的林火热点已经排除掉城市内固定热源、水面反射及云层反射造成的虚假林火热点,仅留下林地、草地内林火热点。将统计的444条数据添加到GIS中显示,查看是否有出现在簇内的热点。通过查看发现有8个林火热点处于8个不同的簇内,并且都是属于农用火源的簇内,8个簇中计算机判读的2016年历史林火热点数据40个。8个森林防火网的林火热点数据如表10所示:
表10 8个林火热点数据
由表10可以确定,8个包含在簇内的森林防火网的热点中都不是林火热点。其中有6个为2016年2月7日、1个为2月8日、1个为12月10日。并且快速反馈为荒火的4个、农用火已灭的2个、未找到的2个。反馈为未找到的意思是指地面核查人员根据所报火点的附近的几公里范围内进行搜索并没有发现火点。未找到的基本上为农事用火熄灭后查找对象不明及热点位置出现偏差的原因。对快速反馈具体信息查看,并确认该8个林火热点都没有引起森林火灾,只是火烧热点。
同时查看簇内由计算机判读的40个历史林火热点数据,发现2月7日、8日的历史林火热点数据的卫星监测时间与森林防火网的卫星监测时间仅相差3分钟左右,可以认为历史林火热点数据与森林防火网的观测数据相同。但是通过计算机自动判读的林火热点却有40个。通过日历查询可知当年2月7日当天为除夕,可知2月7日、8日的林火热点是由祭祀火源引起的虚假林火热点。另外12月10日的由森林防火网人机交互判识该林火热点在历史林火热点数据库没有与之对应的热点数据。不存在的原因可能为地面接收站缺失当天的数据,也可能为计算机判读时直接将该点排除,更有可能是森林防火网的观测数据不准确。而此热点所处聚类中的由计算机自动判读的8个热点数据时间都为秋耕,时间为9月。但是森林防火网9月并没有热点数据,说明该簇类的8个热点都为虚假林火热点。
基于时空数据的虚假林火热点挖掘结果评价结论如下:
(1)通过对比森林防火网数据发现挖掘出的固定热源、水面发射造成的虚假热点确实为虚假林火热点。说明通过DBSCAN聚类挖掘出的这两类共385条虚假林火热点准确率为100%。
(2)虽然有40个由计算机自动判读的历史林火热点数据所成的8个簇与森林防火网的8个热点数据相交,但是通过上面分析可知,有7个簇内的历史林火热点数据与7个热点数据是能够对应的,且森林防火网的反馈为都不是为林火点,没有引起森林火灾,只是火烧点。一方面说明挖掘出的由农用火源造成的虚假林火热点是真实可靠的,另一方面从侧面说明通过森林防火网的人机交互目视判读也会出现虚假林火热点的情况。
(3)对于其中1个不能对应的簇内的历史林火热点数据通过比对发现的确为虚假林火热点。
由上述结论可知利用DBSCAN算法对计算机自动判读的历史林火热点数据的虚假林火热点挖掘结果是可行可靠、且精度较高。
根据森林防火网的数据对挖掘结果的检验,可知固定热源和水面反射造成的虚假林火热点非常准确。因此根据固定热源类和水面反射造成的虚假林点热点位置具有明显的位置特征性,可以将以DBSCAN算法聚类的这两类成簇的核心对象热点建立数据库。当以后接收的林火热点数据中含有由核心对象点位置2KM内产生的热点,只需调用数据库便可直接将其排除。2018年2月26日卫星地面接收站给出了10条林火热点数据,通过本发明的结果与方法对当日计算机自动判读的林火热点数据及时进行虚假林火热点判别,技术流程图如图7所示。
卫星地面站接收并处理的林火热点数据如下表11所示:
表11 卫星地面站接收并处理的林火热点数据
根据图7,首先将根据DESCAN算法聚类挖掘出的由固定热源和水面反射造成的虚假林火热点核心点数据对计算机自动判读林火热点数据进行判断,发现10条林火热点数据都不属于固定热源和水面反射造成的。然后将10个林火热点与地表覆盖类型赋值,根据赋值了解到10个林火热点的地表覆盖类型。将10个林火热点以所属行政区划的历史林火热点数据进行DBSCAN聚类分析。Eps及MinPts的参数选定参见本发明的方法。发现ID为53 770、53 767的林火热点并且能够与历史林火热点数据聚类,林火热点发现的时间具有周期性,在该簇类的林火热点发现时间都为下午1:30,且火点的日期都为2月底,通过查看地表覆盖类型为耕地,且2月底符合春耕,确认2个林火热点为农用火源造成的虚假林火火点。挖掘结果如图8所示:
通过查看当日森林防火网的林火热点数据,数据如表12所示:
表12 森林防火网林火热点数据
从森林防火网可以看出当日计算机自动判读的林火热点数据是能够对应的。但是森林防火网只有2条,这2条在计算机自动判读的林火热点中相近的ID为53 771和53 768。森林防火网的卫星数据接收时间为15:20,而我校地面接收站的卫星数据接受时间为13:37,时间相差2个小时。对于其他8个计算机自动判读的林火热点有两种情况,一种是森林防火网将其排除,另外一种是在15:20时并未发现8个热点。不管出于何种原因同时都能说明8个林火热点为虚假林火热点。所以判断的2个为农用火源的虚假林火热点结果正确。
基于时空数据的虚假林火热点判读方法是仅依靠历史林火热点数据库和地表覆盖类型的一种新的虚假林火热点的判断方法。此方法可以在卫星地面站接收处理遥感图像自动判读获取林火热点数据后,直接对林火热点进行虚假林火热点判别。通过建立的核心对象点数据库可以直接将固定热源和水面反射造成的虚假林火热点进行排除。根据DBSCAN算法将新的林火热点与历史林火热点数据进行密度聚类分析,可以排除由农用火源造成的虚假林火热点,并对后续基层人员的排除虚假林火热点提供了方法,可以提高林火监测的准确度。
本申请基于时空数据的虚假林火热点判识方法,通过对计算机判读的历史林火热点数据的挖掘而形成的固定热源数据库,能够实现快速的排除在遥感影像上由固定热源造成的虚假林火热点。通过历史林火热点数据可以将固定热源和水面反射造成的虚假林火热点的位置精准定位,不用去实地考察位置。对于计算机每次判读的探测的林火热点不在固定热源数据库中的,通过与历史林火热点数据进行DBSCAN聚类分析后,可以排除掉一部分虚假林火热点,从而提高计算机自动判读林火热点的准确度。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本邻域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种基于时空数据的虚假林火热点挖掘方法,其特征在于,该方法包括以下步骤:
基于DBSCAN算法聚类建立历史林火热点数据库;
接收林火热点数据;
判断林火热点数据中是否含有由核心对象点位置2KM内产生的林火热点;
若是,则调用历史林火热点数据库排除虚假林火热点。
2.基于权利要求1所述的方法,其特征在于,在建立历史林火热点数据库前,对历史林火数据进行清洗,包括修正经纬度错误和无效数据。
3.根据权利要求1或2所述的方法,其特征在于,所述的基于DBSCAN算法聚类建立历史林火热点数据库,包括以下步骤:
根据输入的邻域参数Eps、MinPts和样本的欧式距离,对样本数据中的每个点的Eps邻域搜索成簇,当样本数据中的对象点P的Eps邻域包含的样本数据点个数多于MinPts,则建立以对象点P为核心对象的簇,之后不断迭代聚集核心对象直接密度可达的所有对象点,遍历所有对象点;当没有新对象点添加到任何簇时,聚类过程结束。
4.根据权利要求3所述的方法,其特征在于,利用聚类算法输出簇类,具体包括:
输入历史林火热点数据集,确定邻域参数Eps=2,MinPts=3,
输出簇集合;
所述输出簇集合包括:
(1)将历史林火热点数据集中的每一个对象点标记为未处理状态;
(2)对历史林火热点数据集中的每一个点对象P进行检查,若对象点P已经划分到某一个簇或标记为噪声点,则重新开始选择对象点P;若对象点P没有被分到任意簇和没有被标记为噪声点,则进行下一步;
(3)检查对象点P的Eps邻域NEps(P),若NEps(P)中包含的对象数小于MinPts,那么标记该对象点P为边界点或噪声点;若NEps(P)中包含对象数大于MinPts,那么标记该对象点P为核心点,并建立新簇集合G,并将P邻域内的所有对象点加入G;
(4)对NEps(P)中存在没有被处理过的对象点D进行检查,当NEps(D)中至少包含MInpts个对象点,那么将NEps(D)中未划分到任意一个簇的对象点加入簇G;
(5)遍历所有对象点,输出簇集合。
5.根据权利要求1所述的方法,其特征在于,所述虚假林火热点包括固定热源和水面反射。
CN201810551145.9A 2018-05-31 2018-05-31 基于时空数据的虚假林火热点挖掘方法 Active CN108875806B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810551145.9A CN108875806B (zh) 2018-05-31 2018-05-31 基于时空数据的虚假林火热点挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810551145.9A CN108875806B (zh) 2018-05-31 2018-05-31 基于时空数据的虚假林火热点挖掘方法

Publications (2)

Publication Number Publication Date
CN108875806A true CN108875806A (zh) 2018-11-23
CN108875806B CN108875806B (zh) 2022-08-16

Family

ID=64336097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810551145.9A Active CN108875806B (zh) 2018-05-31 2018-05-31 基于时空数据的虚假林火热点挖掘方法

Country Status (1)

Country Link
CN (1) CN108875806B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859135A (zh) * 2019-01-31 2019-06-07 北京邮电大学 一种应用于关联成像的图像增强处理方法
CN110021018A (zh) * 2019-04-12 2019-07-16 电子科技大学 一种基于遥感数据提取森林火灾足迹的方法
CN110097126A (zh) * 2019-05-07 2019-08-06 江苏优聚思信息技术有限公司 基于dbscan聚类算法的核查重点人员、房屋漏登记的方法
CN111753754A (zh) * 2020-06-28 2020-10-09 三亚中科遥感研究所 一种基于热源重工业区域分析的秸秆燃烧火点识别方法
CN111858813A (zh) * 2020-07-21 2020-10-30 云南电网有限责任公司带电作业分公司 一种基于卫星技术的非火点区域排除方法
CN112643719A (zh) * 2020-12-11 2021-04-13 国网智能科技股份有限公司 一种基于巡检机器人的隧道安防检测方法及系统
CN114782729A (zh) * 2022-04-20 2022-07-22 重庆大学 一种基于激光雷达与视觉融合的实时目标检测方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0984413A2 (de) * 1998-09-01 2000-03-08 Deutsches Zentrum für Luft- und Raumfahrt e.V. Verfahren und Vorrichtung zur automatischen Waldbranderkennung
US20050189122A1 (en) * 2004-02-06 2005-09-01 Eads Deutschland Gmbh Method for detecting and combating forest and surface fires
CN102289585A (zh) * 2011-08-15 2011-12-21 重庆大学 基于数据挖掘的公共建筑能耗实时监测方法
US20120109955A1 (en) * 2010-10-28 2012-05-03 Tomi Lahcanski Organizing nearby picture hotspots
CN102497509A (zh) * 2011-12-14 2012-06-13 哈尔滨工业大学 森林火点去扰动单点定位装置及基于该装置的定位方法
CN202939121U (zh) * 2012-08-31 2013-05-15 李云梅 一种基于水体光学特性的综合采集处理系统
CN104794845A (zh) * 2015-05-04 2015-07-22 安徽大学 基于火险等级预报的森林火灾预警方法
CN105678419A (zh) * 2016-01-05 2016-06-15 天津大学 细粒度的森林火灾概率预报系统
CN105678237A (zh) * 2015-12-31 2016-06-15 张弓 一种火点确定方法及系统
WO2016132161A1 (en) * 2015-02-16 2016-08-25 Kontoes Charalampos Method that detects areas of active fire hotspots in real-time, calculates the most probable ignition point and assesses fire probability indicators, using satellite images and fuel data.
CN106023203A (zh) * 2016-05-19 2016-10-12 中国科学院遥感与数字地球研究所 基于Landsat-8陆地卫星数据的火点检测方法
CN106682876A (zh) * 2016-12-29 2017-05-17 广东精规划信息科技股份有限公司 一种用于公安指挥的可视化指挥平台

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0984413A2 (de) * 1998-09-01 2000-03-08 Deutsches Zentrum für Luft- und Raumfahrt e.V. Verfahren und Vorrichtung zur automatischen Waldbranderkennung
US20050189122A1 (en) * 2004-02-06 2005-09-01 Eads Deutschland Gmbh Method for detecting and combating forest and surface fires
US20120109955A1 (en) * 2010-10-28 2012-05-03 Tomi Lahcanski Organizing nearby picture hotspots
CN102289585A (zh) * 2011-08-15 2011-12-21 重庆大学 基于数据挖掘的公共建筑能耗实时监测方法
CN102497509A (zh) * 2011-12-14 2012-06-13 哈尔滨工业大学 森林火点去扰动单点定位装置及基于该装置的定位方法
CN202939121U (zh) * 2012-08-31 2013-05-15 李云梅 一种基于水体光学特性的综合采集处理系统
WO2016132161A1 (en) * 2015-02-16 2016-08-25 Kontoes Charalampos Method that detects areas of active fire hotspots in real-time, calculates the most probable ignition point and assesses fire probability indicators, using satellite images and fuel data.
CN104794845A (zh) * 2015-05-04 2015-07-22 安徽大学 基于火险等级预报的森林火灾预警方法
CN105678237A (zh) * 2015-12-31 2016-06-15 张弓 一种火点确定方法及系统
CN105678419A (zh) * 2016-01-05 2016-06-15 天津大学 细粒度的森林火灾概率预报系统
CN106023203A (zh) * 2016-05-19 2016-10-12 中国科学院遥感与数字地球研究所 基于Landsat-8陆地卫星数据的火点检测方法
CN106682876A (zh) * 2016-12-29 2017-05-17 广东精规划信息科技股份有限公司 一种用于公安指挥的可视化指挥平台

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
IMAS SUKAESIH SITANGGANG 等: "Burn Area Processing to Generate False Alarm Data for Hotspot Prediction Models", 《TELKOMNIKA (TELECOMMUNICATION COMPUTING ELECTRONICS AND CONTROL) 》 *
MUHAMMAD USMAN 等: "Hotspot distribution analyses based on peat characteristics using density-based spatial clustering", 《PROCEDIA ENVIRONMENTAL SCIENCES》 *
张树誉 等: "卫星遥感林火监测中漏判与误判的原因分析", 《森林防火》 *
李晓恋: "基于MODIS数据的多因子协同作用下森林火灾预测监测研究", 《中国博士学位论文全文数据库 农业科技辑》 *
王小妮: "《数据挖掘技术》", 31 August 2014, 北京航空航天大学出版社 *
陈孝明 等: "利用卫星监测热点数据的湖北电网林火灾害时空聚类分析及其应用", 《测绘通报》 *
黎良财 等: "基于时序遥感的喀斯特山区植被覆盖研究", 《中南林业科技大学学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859135A (zh) * 2019-01-31 2019-06-07 北京邮电大学 一种应用于关联成像的图像增强处理方法
CN109859135B (zh) * 2019-01-31 2021-05-07 北京邮电大学 一种应用于关联成像的图像增强处理方法
CN110021018A (zh) * 2019-04-12 2019-07-16 电子科技大学 一种基于遥感数据提取森林火灾足迹的方法
CN110097126A (zh) * 2019-05-07 2019-08-06 江苏优聚思信息技术有限公司 基于dbscan聚类算法的核查重点人员、房屋漏登记的方法
CN110097126B (zh) * 2019-05-07 2023-04-21 江苏优聚思信息技术有限公司 基于dbscan聚类算法的核查重点人员、房屋漏登记的方法
CN111753754A (zh) * 2020-06-28 2020-10-09 三亚中科遥感研究所 一种基于热源重工业区域分析的秸秆燃烧火点识别方法
CN111753754B (zh) * 2020-06-28 2023-09-12 三亚中科遥感研究所 一种基于热源重工业区域分析的秸秆燃烧火点识别方法
CN111858813A (zh) * 2020-07-21 2020-10-30 云南电网有限责任公司带电作业分公司 一种基于卫星技术的非火点区域排除方法
CN112643719A (zh) * 2020-12-11 2021-04-13 国网智能科技股份有限公司 一种基于巡检机器人的隧道安防检测方法及系统
CN114782729A (zh) * 2022-04-20 2022-07-22 重庆大学 一种基于激光雷达与视觉融合的实时目标检测方法

Also Published As

Publication number Publication date
CN108875806B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN108875806A (zh) 基于时空数据的虚假林火热点挖掘方法
CN108898159A (zh) 基于dbscan算法的虚假林火热点过滤方法
Stone Forest-type mapping by photo-interpretation: A multi-purpose base for Tasmania's forest management
CN110472661A (zh) 基于历史本底和现时遥感影像的自动变化检测方法和系统
CN109376996A (zh) 基于统计年鉴及地理信息的洪水损失评估方法和系统
CN107330734A (zh) 基于Co‑location模式和本体的商业地址选择方法
CN107346361A (zh) 基于地形地质图的边坡稳定性初步判别方法
CN109325522B (zh) 基于改进kmeans的重工业时序热源区域识别算法
Contreras et al. Developing a computerized approach for optimizing individual tree removal to efficiently reduce crown fire potential
Amati et al. Using machine learning to identify urban forest crown bounding boxes (CBB): Exploring a new method to develop urban forest policy
CN115861793A (zh) 一种基于最小累积阻力模型的区域生态安全格局构建方法
Stockdale A century of landscape change in the southern Rocky Mountains and foothills of Alberta: using historical photography to quantify ecological change
Zerger et al. Spatially modelling native vegetation condition
Mango Modeling the effect of land use and climate change scenarios on the water flux of the Upper Mara River flow, Kenya
Min et al. Landscape Evaluation of Forest Park Based on Analytic Hierarchy Process
Cornic et al. Assessment of urban land-cover classification: Comparison between pixel and object scales
CN108009510A (zh) 安保态势分析方法和装置
Metha et al. Analysis of land use and land cover dynamics and forest disturbance in western ghats region of Maharashtra, India
Kaffo Applying a Landscape Ecology Approach to Forest Disturbance from Marcellus Shale Gas Development: A Case Study of Center Township, Greene County, Pennsylvania
Bystron GIS-based analysis of spring occurrence and spring source areas in Peace River Regional District, British Columbia
CN112819315B (zh) 一种稳定水系的水系稳定度计算方法
Porter et al. Watershed Statues Evaluation Protocol (WSEP): Tier 1 watershed-level fish values monitoring
Watson et al. Rangeland monitoring, resource inventory, condition assessment and lease inspection activities in Western Australia conducted by the Department of Agriculture
Wu et al. Grade Division and Benchmark Price of Forestlands Using Geospatial Technology: A Case Study of Southeastern China. Forests 2022, 13, 1105
Santos et al. Spatial characterization of maritime pine productivity in Portugal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant