CN116363502B - 融合多源地理大数据的采矿地多维信息获取方法及装置 - Google Patents
融合多源地理大数据的采矿地多维信息获取方法及装置 Download PDFInfo
- Publication number
- CN116363502B CN116363502B CN202310048109.1A CN202310048109A CN116363502B CN 116363502 B CN116363502 B CN 116363502B CN 202310048109 A CN202310048109 A CN 202310048109A CN 116363502 B CN116363502 B CN 116363502B
- Authority
- CN
- China
- Prior art keywords
- mining
- mining site
- suspicious
- information
- range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005065 mining Methods 0.000 title claims abstract description 270
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000010586 diagram Methods 0.000 claims abstract description 22
- 230000008859 change Effects 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 36
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 12
- 230000009193 crawling Effects 0.000 claims description 8
- 230000002688 persistence Effects 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000009826 distribution Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012502 risk assessment Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003344 environmental pollutant Substances 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 231100000719 pollutant Toxicity 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- FHIJMQWMMZEFBL-HLAPJUAOSA-N DISS Natural products COc1cc(C=CC(=O)OC[C@H]2O[C@H](O[C@]3(CO)O[C@H](CO)[C@@H](O)[C@@H]3OC(=O)C=Cc3cc(OC)c(O)c(OC)c3)[C@H](O)[C@@H](O)[C@@H]2O)cc(OC)c1O FHIJMQWMMZEFBL-HLAPJUAOSA-N 0.000 description 1
- 241000238413 Octopus Species 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003137 locomotive effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/194—Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种融合多源地理大数据的采矿地多维信息获取方法及装置,所述方法获取采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;确定待确定采矿场地第一可疑采矿场地范围和第二可疑采矿场地范围;将第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;将采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息。本发明通过建立关联遥感识别采矿场地和互联网挖掘采矿企业信息,实现露天采矿场地空间信息与采矿企业属性信息有机融合,实现对露天采矿场地全周期、多维度信息的监测,方法具有获取时间短、人工成本低、多维度信息监测等特点。
Description
技术领域
本发明属于采矿数据处理技术领域,具体涉及一种融合多源地理大数据的采矿地多维信息获取方法及装置。
背景技术
露天采矿通过移除地表植被和表土进行矿产资源开采,可对矿区周边的大气、土壤及生态系统产生影响。由于采矿产生的污染物具有累积效应,在采矿场地不同发展阶段产生的影响也有差异。因此,跟踪获取采矿场地全周期的多维度信息,对监测环境、管控风险、治理污染具有重要意义。
相关技术中,现有的采矿场地信息主要通过遥感识别和互联网爬取的方式获取。遥感识别的方法主要包括人机交互解译和自动分类两种。其中人机交互解译的方法,是通过建立场地的训练样本,解译人员通过比对训练样本与遥感影像的色调、纹理、几何结构等特征,从遥感影像中确定场地的空间分布信息及采矿场地的类型。自动分类方法又分为监督分类方法和非监督分类方法,其中监督分类方法是通过建立场地的训练样本,对分类器进行训练,进而将影像中具有相似特征的像元或区域识别为采矿场地;而非监督分类方法则无需预先选定训练样本,根据影像的特征,自动将相似特征划分为同一类型,后期根据专业人员的知识确定类型的具体归属。基于遥感影像识别采矿场地的信息,往往随意选取某一或几个时间断面的遥感影像进行识别,而忽略了采矿场地本身的发生、发展过程。另一方面,因为遥感影像反映的是地物在不同光谱波段的反射特征,所蕴含的地物信息有限,所以基于遥感影像识别的采矿场地信息主要是其空间分布信息,如位置、大小、形状等,而对于场地产生的特征污染物、企业生产等属性信息无法获取,使这类数据用于环境监管、风险评估等应用时具有局限性。
互联网平台,如天眼查、企查查等,记录了大量采矿企业属性信息,包括名称、地址、所属行业类型、资本规模、经营时长、经营状态、经验范围等。但缺少空间信息,标记的地址精度往往不足,如仅记录到乡镇级,使得通过地址解析出的经纬度位置与实际生产经营地块存在偏差,缺少准确的空间信息使这类数据无法开展企业活动对周边环境的影响分析,对环境管控的支撑力有限。
发明内容
有鉴于此,本发明的目的在于克服现有技术的不足,提供一种融合多源地理大数据的采矿地多维信息获取方法及装置,以解决现有技术中采矿场地信息缺少准确的空间信息的问题。
为实现以上目的,本发明采用如下技术方案:一种融合多源地理大数据的采矿地多维信息获取方法,包括:
爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;
基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;
确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;
对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;
将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;
将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
进一步的,所述属性信息包括企业名称、成立时间、存续状态以及经纬度坐标;基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口,包括:
将所述空间位置信息所在的预定范围内的区域锁定为遥感识别的空间窗口;
根据所述成立时间、存续状态锁定遥感识别的时间窗口;
根据所述空间窗口和时间窗口确定时空窗口。
进一步的,所述基于所述植被变化信息确定第一可疑采矿场地范围,包括:
计算时空窗口范围内,所述待确定采矿企业成立之前预设年数的归一化植被指数的第一均值影像,所述第一均值影像用于表示开采前地表植被覆盖情况;
计算时空窗口范围内,所述采矿企业成立之后预设年数的归一化植被指数的第二均值影像,所述第二均值影像用于表示开采后的地表植被覆盖情况;
利用第一均值影像与第二均值影像的差,计算归一化植被指数的变化值,将所述变化值与预设阈值进行对比,根据对比结果确定可疑采矿场地。
进一步的,采用以下方式计算采矿场地的归一化植被指数,
其中,NDVI表示归一化植被指数,NIR为近红外波段,R为红波段。
进一步的,对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围,包括:
对所述可疑采矿场地遴选纹理分析波段及数字高程数据作为纹理分析数据源;所述波段包括红、绿、蓝、近红外波段;
基于所述纹理分析数据源,构造纹理特征指标;
将所述纹理特征指标输入至预构建的随机森林模型进行分类,得到第二可疑采矿场地范围。
进一步的,所述纹理特征指标,包括:
和平均,角二阶矩,对比度,相关性,逆差矩,方差,熵以及异质性。
进一步的,对所述数据进行预处理,包括:
数据清洗,用于剔除非资源开采企业数据;
地理转码,用于按地址转换为经纬度坐标;
坐标纠偏,用于将火星坐标系/百度坐标系转换成大地坐标系。
本申请实施例提供一种融合多源地理大数据的采矿地多维信息获取装置,包括:
获取模块,用于爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;
锁定模块,用于基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;
第一确定模块,用于确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;
第二确定模块,用于对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;
第三确定模块,用于将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;
关联模块,用于将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
本发明采用以上技术方案,能够达到的有益效果包括:
本发明提供一种融合多源地理大数据的采矿地多维信息获取方法及装置,本申请提供的技术方案能够有效关联互联网挖掘信息和遥感识别信息,能够支持采矿场地的全周期、多维度信息跟踪,提升了数据的应用深度与广度。
除此之外,本申请提供的融合多源地理大数据的采矿地多维信息获取方法,相比单一的互联网企业数据或遥感识别采矿场地数据,全周期多维度的采矿场地信息为场地污染风险评估、环境监测提供了更广泛的数据支撑。全周期多维度的采矿场地信息同时包含了采矿企业生产经营属性信息和空间地块信息,可在开展企业对周边环境植被退化、地面塌陷、风险评估等影响分析的同时,联系企业经营行为,作出科学研判,并提出管控意见。同时,本发明提出的方法,快速且有效,能为相关监管部门构建采矿场地数据库提供科学方法支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明融合多源地理大数据的采矿地多维信息获取方法的步骤示意图;
图2为本发明融合多源地理大数据的采矿地多维信息获取方法的流程示意图;
图3为本发明矿场开发之前和之后的NDVI多年均值对比图;其中,图3(a)为矿场开采之前NDVI均值分布示意图,图3(b)为矿场开采之后NDVI均值分布示意图;
图4为本发明提供的植被变化信息识别结果示意图;
图5为本发明提供的纹理特征指标识别结果示意图;
图6为本发明提供的筛选重叠区域的最终识别结果示意图;
图7为本发明提供的地块关联企业属性示意图;
图8为本发明提供的精度验证对比图;其中,图8(a)为目视翻译结果,图8(b)为本申请技术方案的识别结果;
图9为本发明融合多源地理大数据的采矿地多维信息获取装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
下面结合附图介绍本申请实施例中提供的一个具体的融合多源地理大数据的采矿地多维信息获取方法及装置。
如图1所示,本申请实施例中提供的融合多源地理大数据的采矿地多维信息获取方法,包括:
S101,爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;
本申请可以通过企查查、天眼查等信息平台,基于互联网挖掘技术,如Python爬虫、火车头采集器、八爪鱼采集器等,经过数据预处理,得到采矿企业的空间位置信息及属性信息。
S102,基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;
S103,确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;
S104,对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;
S105,将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;
本申请通过初步识别的第一可疑采矿场地范围与第二次纹理特征识别的第二可疑采矿场地范围进行重叠,能够将范围确定的更加精准。
S106,将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
融合多源地理大数据的采矿地多维信息获取方法的工作原理为:首先通过对爬取互联网平台数据进行预处理,能够得到采矿企业的空间位置信息及属性信息,从而锁定遥感影像识别的时空窗口,基于遥感影像技术确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围,对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围,第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分即为采矿场地;最后将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
一些实施例中,所述属性信息包括企业名称、成立时间、存续状态以及经纬度坐标;基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口,包括:
将所述空间位置信息所在的预定范围内的区域锁定为遥感识别的空间窗口;
根据所述成立时间、存续状态锁定遥感识别的时间窗口;
根据所述空间窗口和时间窗口确定时空窗口。
可以理解的是,企业登记地址通常与实际生产位置相距不远,因此,锁定爬取企业一定范围内区域,为遥感识别的空间窗口。另外,根据企业成立时间、经营时长等信息,锁定遥感识别的时间窗口。经营时长可以根据采矿企业的成立时间和存续状态获得。
例如,从天眼查(www.tianyancha.com)平台,爬取峨山昆钢矿产业有限公司相关信息,包括地址(云南省玉溪市峨山彝族自治县小街镇)、成立时间(2012年)、经营状态(存续)、所属行业类型(有色金属矿采选)等信息。经过地理转码和坐标纠偏,将地址转换成CGCS2000坐标系。
然后,如图2所示,以CGCS2000坐标系5km*4km内区域为空间窗口,以2012年公司成立时间确定时间窗口,收集矿场开采前后的landsat遥感影像,如表1所示,
表1目标区域的遥感影像的时相分布
序号 | 视为 | 来源 | 时间 |
1 | 矿场开采前 | landsat-5 | 19880720 |
2 | 矿场开采前 | landsat-5 | 19950825 |
3 | 矿场开采前 | landsat-5 | 19960201 |
4 | 矿场开采前 | landsat-5 | 19990430 |
5 | 矿场开采前 | landsat-5 | 20020406 |
6 | 矿场开采前 | landsat-5 | 20030815 |
7 | 矿场开采前 | landsat-5 | 20060228 |
8 | 矿场开采前 | landsat-5 | 20070130 |
9 | 矿场开采后 | landsat-8 | 20190131 |
10 | 矿场开采后 | landsat-8 | 20190216 |
11 | 矿场开采后 | landsat-8 | 20190507 |
12 | 矿场开采后 | landsat-8 | 20191217 |
13 | 矿场开采后 | landsat-8 | 20200306 |
14 | 矿场开采后 | landsat-8 | 20200509 |
一些实施例中,所述基于所述植被变化信息确定第一可疑采矿场地范围,包括:
计算时空窗口范围内,所述待确定采矿企业成立之前预设年数的归一化植被指数的第一均值影像,所述第一均值影像用于表示开采前地表植被覆盖情况;
计算时空窗口范围内,所述采矿企业成立之后预设年数的归一化植被指数的第二均值影像,所述第二均值影像用于表示开采后的地表植被覆盖情况;
利用第一均值影像与第二均值影像的差,计算归一化植被指数的变化值,将所述变化值与预设阈值进行对比,根据对比结果确定可疑采矿场地。
具体的,资源开采会破坏原有的地表覆盖。开采前,地表通常为植被所覆盖,开采后,植被被移除,地表覆盖类型转为裸地。因此,本申请利用反映植被长势的参数——归一化植被指数(NDVI,Normalized Difference Vegetation Index),进行疑似采矿场地的识别。
NDVI由近红外波段和红波段计算可得,其取值在[-1,1]之间。其中,负值表示地表覆盖为云、水、雪等;正值表示有植被覆盖,且数值越大,植被覆盖越茂密。
公式(1)中,NDVI表示归一化植被指数,NIR为近红外波段,R为红波段。
本申请在得到采矿企业成立之前的归一化植被指数的第一均值影像,和采矿企业成立之后的归一化植被指数的第二均值影像之后,通过两幅影像相减,得到NDVI变化值,需要说明的是,采矿场地NDVI变化特征以突变减少为主,设定预设阈值,从而识别采矿场地的疑似范围。
作为一个具体的实施例,如图3所示,以成立时间2012年为时间界线,分别基于像元尺度,计算矿场开采前后窗口内的NDVI多年平均值;然后将开采后NDVI均值减去开采前,得到NDVI变化栅格数据,初步设定-0.05,-0.08,-0.1,-0.15多个阈值,对比各个处理结果与目视范围,确定以-0.08疑似场地的提取预设阈值,将小于预设阈值的区域初步认定为疑似采矿场地,具体如图4所示。
一些实施例中,对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围,包括:
对所述可疑采矿场地遴选纹理分析波段及数字高程数据作为纹理分析数据源;所述波段包括红、绿、蓝、近红外波段;
基于所述纹理分析数据源,构造纹理特征指标;
将所述纹理特征指标输入至预构建的随机森林模型进行分类,得到第二可疑采矿场地范围。
可以理解的是,由于采矿场地的疑似范围主要以NDVI变化为主要特征,而建设用地扩张、道路建设、森林砍伐等均具有类似的特征,因此,初始识别的范围也包括了上述的用地类型。虽然采矿与上述活动的植被变化特征相似,但采矿场地具有特殊的地表纹理结构,主要呈褶皱、阶梯状,因此,进一步结合影像及数字高程的纹理分析,对疑似场地信息进而二次分类,确定采矿场地分布信息。分类过程可以采用随机森林算法。
随机森林是一种由多棵决策树构成的集成分类器,主要由训练和分类两个阶段构成。训练阶段首先要选取训练样本,此后用分类与回归算法(CAR,Classification andregression)为每个样本建立分类树,针对每一个分类节点,为其从所有特征中选择Mtry个特征,根据基尼系数进行分裂测试,以此选取最优特征。重复Ntree次取样、建树的过程,构成随机森林。分类阶段要以所构建的所有决策树对样本的类别进行独立判断,最后汇总所有决策树的分类结果,采用多数投票原则输出最终结果。
确定第二可以采矿场地范围的具体过程为:
首先对所述可疑采矿场地遴选纹理分析波段作为纹理分析数据源,本申请中使用STRM的30m分辨率数字高程数据(DEM),遥感影像红、绿、蓝、近红外波段,共计5个波段作为纹理分析数据源。
然后构造纹理特征指标。基于灰度共生矩阵,可获取18种纹理特征指标。对于18种纹理特征指标若均用作分类,必然会产生冗余;因此,本申请中选取比较常用的和平均(SAVG),角二阶矩(ASM),对比度(CONTRAST),相关性(CORR),逆差矩(IDM),方差(VAR),熵(ENT),异质性(DISS)8项,进行分类。5个波段分别计算这8项值,共计40个纹理指标。
然后基于纹理特征指标,输入预构建的随机森林模型中进行随机森林分类。根据得到的疑似采矿场地范围,选取“采矿场地”和“其他类型”两种样本点,作为进行随机森林分类的依据。
最后实现采矿场地空间信息的精确识别。将基于纹理分类得到采矿场地结果与基于植被变化分析识别得到的结果进行叠加,重叠区域被确定为采矿场地范围。
具体的,如图5所示,在GoogleEarth Engine平台中分别计算5个波段的8项纹理特征,得到40个分类指标,再以此为输入,使用随机森林分类方法,将空间窗口区域分为两类。然后,如图6所示,将纹理特征识别区与NDVI时序识别区进行空间叠加,筛选重叠区域,作为最终识别结果。
本申请中将遥感识别所得采矿场地转为矢量图斑,并添加企业属性信息字段,实现采矿企业属性信息和采矿场地空间信息关联。根据互联网平台的企业更新信息,例如企业的扩张,关停,可持续关联相应时空窗口的遥感影像,进而实现对采矿场地全生命周期的多维度信息跟踪。
最后,如图7所示,本申请将最终识别结果在ArcGIS软件中,使用“栅格转矢量”工具,转换成矢量斑块,并添加企业属性字段,进而得到采矿场地的多维度信息,包括空间分布信息及企业经营等属性信息。
一些实施例中,对所述数据进行预处理,包括:
数据清洗,用于剔除非资源开采企业数据;
地理转码,用于按地址转换为经纬度坐标;
坐标纠偏,用于将火星坐标系/百度坐标系转换成大地坐标系。
具体的,本申请中,数据清洗具体为剔除非资源开采企业数据,地理转码具体为按地址转换为经纬度坐标,坐标纠偏具体为将火星坐标系/百度坐标系转换成大地坐标系流程,最终在进行数据预处理后获得涉污企业信息,包括企业名称、成立时间、存续状态、经纬度坐标等。
需要说明的是,本申请还通过对比真实遥感影像和识别结果的方式,进行精度验证。如图8所示,基于高分辨率的GoogleEarth遥感影像,通过目视解译,勾画矿场实际轮廓,并测算其面积,结果显示为0.642km2。本发明识别场地的面积约为0.717km2,两者空间一致性约为70%,认为本发明提出的方法具有可行性。此外,弥补传统基于遥感识别方法的是,本发明同时提供采矿场地的空间分布信息及属性等多维度信息。
本发明能够有效关联互联网挖掘信息和遥感识别信息,能够支持采矿场地的全周期、多维度信息跟踪,提升了数据的应用深度与广度。本申请提供的技术方案相比单一的互联网企业数据或遥感识别采矿场地数据,全周期多维度的采矿场地信息为场地污染风险评估、环境监测提供了更广泛的数据支撑。全周期多维度的采矿场地信息同时包含了采矿企业生产经营属性信息和空间地块信息,可在开展企业对周边环境植被退化、地面塌陷、风险评估等影响分析的同时,联系企业经营行为,作出科学研判,并提出管控意见。除此之外,本申请提出的融合多源地理大数据的采矿地多维信息获取方法,快速且有效,能为相关监管部门构建采矿场地数据库提供科学方法支撑。
如图9所示,本申请实施例提供一种融合多源地理大数据的采矿地多维信息获取装置,包括:
获取模块201,用于爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;
锁定模块202,用于基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;
第一确定模块203,用于确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;
第二确定模块204,用于对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;
第三确定模块205,用于将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;
关联模块206,用于将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
本申请提供的融合多源地理大数据的采矿地多维信息获取装置的工作原理为,获取模块201爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;锁定模块202基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;第一确定模块203确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;第二确定模块204对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;第三确定模块205将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;关联模块206将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
可以理解的是,上述提供的方法实施例与上述的装置实施例对应,相应的具体内容可以相互参考,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令方法的制造品,该指令方法实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (8)
1.一种融合多源地理大数据的采矿地多维信息获取方法,其特征在于,包括:
爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;
基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;
确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;
所述基于所述植被变化信息确定第一可疑采矿场地范围,包括:
计算时空窗口范围内,待确定采矿企业成立之前预设年数的归一化植被指数的第一均值影像,所述第一均值影像用于表示开采前地表植被覆盖情况;
计算时空窗口范围内,所述采矿企业成立之后预设年数的归一化植被指数的第二均值影像,所述第二均值影像用于表示开采后的地表植被覆盖情况;
利用第一均值影像与第二均值影像的差,计算归一化植被指数的变化值,将所述变化值与预设阈值进行对比,根据对比结果确定可疑采矿场地;
采用以下方式计算采矿场地的归一化植被指数,
其中,NDVI表示归一化植被指数,NIR为近红外波段,R为红波段;对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;
对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围,包括:
对所述可疑采矿场地遴选纹理分析波段及数字高程数据作为纹理分析数据源;所述波段包括红、绿、蓝、近红外波段;
基于所述纹理分析数据源,构造纹理特征指标;
将所述纹理特征指标输入至预构建的随机森林模型进行分类,得到第二可疑采矿场地范围;
所述纹理特征指标,包括:
和平均,角二阶矩,对比度,相关性,逆差矩,方差,熵以及异质性;
将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;
将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
2.根据权利要求1所述的方法,其特征在于,所述属性信息包括企业名称、成立时间、存续状态以及经纬度坐标;基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口,包括:
将所述空间位置信息所在的预定范围内的区域锁定为遥感识别的空间窗口;
根据所述成立时间、存续状态锁定遥感识别的时间窗口;
根据所述空间窗口和时间窗口确定时空窗口。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述植被变化信息确定第一可疑采矿场地范围,包括:
计算时空窗口范围内,所述待确定采矿企业成立之前预设年数的归一化植被指数的第一均值影像,所述第一均值影像用于表示开采前地表植被覆盖情况;
计算时空窗口范围内,所述采矿企业成立之后预设年数的归一化植被指数的第二均值影像,所述第二均值影像用于表示开采后的地表植被覆盖情况;
利用第一均值影像与第二均值影像的差,计算归一化植被指数的变化值,将所述变化值与预设阈值进行对比,根据对比结果确定可疑采矿场地。
4.根据权利要求3所述的方法,其特征在于,采用以下方式计算采矿场地的归一化植被指数,
其中,NDVI表示归一化植被指数,NIR为近红外波段,R为红波段。
5.根据权利要求1所述的方法,其特征在于,对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围,包括:
对所述可疑采矿场地遴选纹理分析波段及数字高程数据作为纹理分析数据源;所述波段包括红、绿、蓝、近红外波段;
基于所述纹理分析数据源,构造纹理特征指标;
将所述纹理特征指标输入至预构建的随机森林模型进行分类,得到第二可疑采矿场地范围。
6.根据权利要求5所述的方法,其特征在于,所述纹理特征指标,包括:
和平均,角二阶矩,对比度,相关性,逆差矩,方差,熵以及异质性。
7.根据权利要求6所述的方法,其特征在于,对所述数据进行预处理,包括:
数据清洗,用于剔除非资源开采企业数据;
地理转码,用于按地址转换为经纬度坐标;
坐标纠偏,用于将火星坐标系/百度坐标系转换成大地坐标系。
8.一种融合多源地理大数据的采矿地多维信息获取装置,其特征在于,包括:
获取模块,用于爬取互联网平台数据,并对所述数据进行预处理,获取采矿企业的空间位置信息及属性信息;
锁定模块,用于基于所述采矿企业的空间位置信息及属性信息,锁定遥感影像识别的时空窗口;
第一确定模块,用于确定所述时空窗口内的待确定采矿场地的植被变化信息,基于所述植被变化信息确定第一可疑采矿场地范围;所述基于所述植被变化信息确定第一可疑采矿场地范围,包括:
计算时空窗口范围内,待确定采矿企业成立之前预设年数的归一化植被指数的第一均值影像,所述第一均值影像用于表示开采前地表植被覆盖情况;
计算时空窗口范围内,所述采矿企业成立之后预设年数的归一化植被指数的第二均值影像,所述第二均值影像用于表示开采后的地表植被覆盖情况;
利用第一均值影像与第二均值影像的差,计算归一化植被指数的变化值,将所述变化值与预设阈值进行对比,根据对比结果确定可疑采矿场地;
采用以下方式计算采矿场地的归一化植被指数,
其中,NDVI表示归一化植被指数,NIR为近红外波段,R为红波段;
第二确定模块,用于对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围;对所述待确定采矿场地进行地表纹理分析,确定第二可疑采矿场地范围,包括:
对所述可疑采矿场地遴选纹理分析波段及数字高程数据作为纹理分析数据源;所述波段包括红、绿、蓝、近红外波段;
基于所述纹理分析数据源,构造纹理特征指标;
将所述纹理特征指标输入至预构建的随机森林模型进行分类,得到第二可疑采矿场地范围;
所述纹理特征指标,包括:
和平均,角二阶矩,对比度,相关性,逆差矩,方差,熵以及异质性;
第三确定模块,用于将所述第一可疑采矿场地范围与第二可疑采矿场地范围的重叠部分确定为采矿场地;
关联模块,用于将所述采矿场地范围转化为矢量图并添加采矿企业的属性信息,以关联采矿企业的属性信息和采矿场地空间信息,实现对采矿场地全生命周期的多维度信息跟踪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310048109.1A CN116363502B (zh) | 2023-01-31 | 2023-01-31 | 融合多源地理大数据的采矿地多维信息获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310048109.1A CN116363502B (zh) | 2023-01-31 | 2023-01-31 | 融合多源地理大数据的采矿地多维信息获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116363502A CN116363502A (zh) | 2023-06-30 |
CN116363502B true CN116363502B (zh) | 2023-10-20 |
Family
ID=86940215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310048109.1A Active CN116363502B (zh) | 2023-01-31 | 2023-01-31 | 融合多源地理大数据的采矿地多维信息获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116363502B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117953313B (zh) * | 2024-03-26 | 2024-06-18 | 贵州大学 | 基于人工智能实现矿山数据的异常识别方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109684929A (zh) * | 2018-11-23 | 2019-04-26 | 中国电建集团成都勘测设计研究院有限公司 | 基于多源遥感数据融合的陆生植物生态环境监测方法 |
CN109816707A (zh) * | 2018-12-25 | 2019-05-28 | 中铁第四勘察设计院集团有限公司 | 一种基于高分辨率卫星影像的露天采矿场信息提取方法 |
CN112329706A (zh) * | 2020-11-23 | 2021-02-05 | 京师天启(北京)科技有限公司 | 一种基于遥感技术的采矿用地识别方法 |
CN113033381A (zh) * | 2021-03-23 | 2021-06-25 | 生态环境部卫星环境应用中心 | 基于遥感数据的矿山和固废填埋场自动提取方法和装置 |
WO2021226977A1 (zh) * | 2020-05-15 | 2021-11-18 | 安徽中科智能感知产业技术研究院有限责任公司 | 一种基于多源遥感数据融合和深度神经网络的矿山开采典型地物动态监测方法及平台 |
CN113920262A (zh) * | 2021-10-15 | 2022-01-11 | 中国矿业大学(北京) | 一种增强边缘取样与改进Unet模型的矿区FVC计算方法及系统 |
CN113919226A (zh) * | 2021-10-15 | 2022-01-11 | 中国矿业大学(北京) | 基于权重的采矿植被生态累积效应扰动范围识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2016315938B2 (en) * | 2015-08-31 | 2022-02-24 | Cape Analytics, Inc. | Systems and methods for analyzing remote sensing imagery |
US10264431B2 (en) * | 2016-02-01 | 2019-04-16 | Caterpillar Inc. | Work site perception system |
-
2023
- 2023-01-31 CN CN202310048109.1A patent/CN116363502B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109684929A (zh) * | 2018-11-23 | 2019-04-26 | 中国电建集团成都勘测设计研究院有限公司 | 基于多源遥感数据融合的陆生植物生态环境监测方法 |
CN109816707A (zh) * | 2018-12-25 | 2019-05-28 | 中铁第四勘察设计院集团有限公司 | 一种基于高分辨率卫星影像的露天采矿场信息提取方法 |
WO2021226977A1 (zh) * | 2020-05-15 | 2021-11-18 | 安徽中科智能感知产业技术研究院有限责任公司 | 一种基于多源遥感数据融合和深度神经网络的矿山开采典型地物动态监测方法及平台 |
CN112329706A (zh) * | 2020-11-23 | 2021-02-05 | 京师天启(北京)科技有限公司 | 一种基于遥感技术的采矿用地识别方法 |
CN113033381A (zh) * | 2021-03-23 | 2021-06-25 | 生态环境部卫星环境应用中心 | 基于遥感数据的矿山和固废填埋场自动提取方法和装置 |
CN113920262A (zh) * | 2021-10-15 | 2022-01-11 | 中国矿业大学(北京) | 一种增强边缘取样与改进Unet模型的矿区FVC计算方法及系统 |
CN113919226A (zh) * | 2021-10-15 | 2022-01-11 | 中国矿业大学(北京) | 基于权重的采矿植被生态累积效应扰动范围识别方法 |
Non-Patent Citations (2)
Title |
---|
基于Sentinel-2A影像的矿区土地利用信息提取方法;邵安冉;李新举;周晶晶;;山东农业大学学报(自然科学版)(03);54-59 * |
矿区沉降InSAR监测与预测方法研究;马飞;中国博士学位论文全文数据库 基础科学辑;A008-34 * |
Also Published As
Publication number | Publication date |
---|---|
CN116363502A (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grinand et al. | Estimating deforestation in tropical humid and dry forests in Madagascar from 2000 to 2010 using multi-date Landsat satellite images and the random forests classifier | |
Hölbling et al. | An object-based approach for semi-automated landslide change detection and attribution of changes to landslide classes in northern Taiwan | |
He et al. | Mask R-CNN based automated identification and extraction of oil well sites | |
Karimi et al. | Prediction of fugitive landfill gas hotspots using a random forest algorithm and Sentinel-2 data | |
CN111241611B (zh) | 一种辅助基坑实施的方法 | |
WO2023287276A1 (en) | Geographic data processing methods and systems for detecting encroachment by objects into a geographic corridor | |
CN116363502B (zh) | 融合多源地理大数据的采矿地多维信息获取方法及装置 | |
Wan et al. | A landslide expert system: image classification through integration of data mining approaches for multi-category analysis | |
Wang et al. | Construction and optimization method of the open-pit mine DEM based on the oblique photogrammetry generated DSM | |
CN116975576B (zh) | 基于关键信息统计的山区公路地质灾害危险性评价方法 | |
CN116363524A (zh) | 一种公路地质灾害高风险区域监测预警方法及装置 | |
Mansouri et al. | A soft computing method for damage mapping using VHR optical satellite imagery | |
Zhu et al. | Detection of industrial storage tanks at the city-level from optical satellite remote sensing images | |
CN118196642A (zh) | 一种地震区滑坡的识别与易发性评价方法 | |
CN113920440A (zh) | 垃圾填埋场遥感识别方法、装置和计算机设备 | |
Chang et al. | Spatial resolution effects of digital terrain models on landslide susceptibility analysis | |
Sui et al. | Processing of multitemporal data and change detection | |
Farhadi et al. | Developing a decision tree based on data mining method for detecting the influential parameters on the power of flood destruction | |
Oduro Appiah et al. | Measuring forest change patterns from oil and gas land use dynamics in northeastern British Columbia, 1975 to 2017 | |
Sardar et al. | Snow avalanche based susceptibility assessment of selected districts in northern zone of Pakistan applying MCDA approach in GIS. | |
Das et al. | Deep learning based landslide detection using open-source resources: Opportunities and challenges | |
Krauß et al. | Automatic change detection from high-resolution satellite imagery | |
CN113779888B (zh) | 地面沉降危险性评估方法、装置、设备及存储介质 | |
Parape et al. | Optimization of structure elements for morphological hit-or-miss transform for building extraction from VHR airborne imagery in natural hazard areas | |
Hua et al. | Forest Fire Assessment and Analysis in Liangshan, Sichuan Province Based on Remote Sensing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |