CN112288247A - 一种基于空间交互关系的土壤重金属风险识别方法 - Google Patents
一种基于空间交互关系的土壤重金属风险识别方法 Download PDFInfo
- Publication number
- CN112288247A CN112288247A CN202011124192.9A CN202011124192A CN112288247A CN 112288247 A CN112288247 A CN 112288247A CN 202011124192 A CN202011124192 A CN 202011124192A CN 112288247 A CN112288247 A CN 112288247A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- heavy metal
- soil
- data
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002689 soil Substances 0.000 title claims abstract description 118
- 229910001385 heavy metal Inorganic materials 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000003993 interaction Effects 0.000 title claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 21
- 239000013589 supplement Substances 0.000 claims abstract description 5
- 230000002452 interceptive effect Effects 0.000 claims abstract description 4
- 238000011160 research Methods 0.000 claims description 41
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000003709 image segmentation Methods 0.000 claims description 4
- 239000010865 sewage Substances 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 abstract description 3
- 238000007726 management method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000003900 soil pollution Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/176—Urban or other man-made structures
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Multimedia (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Remote Sensing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于空间交互关系的土壤重金属风险识别方法,其具体如下:S1:获得待研究区域的全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单、重点排污单位名录、企业POI数据、工商要素补充数据和遥感影像;S2:根据工商要素补充数据和和企业POI数据,得到含地理位置的企业基本信息关联数据;S3:判断该区域是否存在建筑或者企业工厂,得到污染企业点位数据;S4:对土壤重金属风险级别与污染企业密度值进行双变量局部空间自相关分析,得到土壤重金属与污染企业的空间交互关系;S5:对研究区域进行风险识别。本发明扩展了现有土壤重金属分区的方法和思路,对进一步管理与预防土壤重金属污染具有重要的理论与实际意义。
Description
技术领域
本发明属于土壤重金属风险识别领域,具体涉及一种基于空间交互关系的土壤重金属风险识别方法。
背景技术
我国政府非常重视土壤污染问题,开展了一系列土壤污染调查,包括重点排污单位名录、土壤环境重点企业监管名单和全口径涉重金属重点行业企业清单等,极大地提高了管理者和大众了解土壤环境污染相关企业,这同时也为技术和科研工作者提供了大量的污染企业信息来源。但是,这些数据均只有所在省市县和企业名称等信息,如何获取数据的经纬度信息和注册年份信息难度相对较大。
越来越多的学者开始研究土壤重金属与污染企业之间的空间关系,进而为土壤重金属污染溯源提供证据链。例如,Jiang等运用多元和地统计学方法确定了鄱阳湖地区土壤重金属的来源;Shao等运用正定矩阵分解和主成分分析方法定量计算了自然源和人为源对土壤重金属污染的贡献。然而,传统的源解析方法,如多元和地统计分析,主成分分析、正定矩阵分解等,在一定程度上都忽略了土壤重金属的空间污染特征,部分地区有可能得出相反的结果,难以有效和精准的指导土壤重金属管理。此外,土壤重金属污染往往与人为活动密切相关,尤其是污染企业,使用传统的源解析方法没有提供源汇之间可靠的空间耦合关系,对于污染的空间变异性也不能很好的解决,这使得目前由污染企业引起的土壤重金属污染防控治理工作变得相当艰难。
原农业部、国土部和环保部等相继出台了一些关于土壤重金属污染分区管理的技术规定或标准,但这些分区管理办法仅仅考虑到土壤重金属污染水平,而忽略了土壤重金属污染的风险,比如由于污染企业引起的土壤污染风险。幸运的是,一些研究开始考虑基于风险的污染土地管理。如Jiang等在综合考虑农业污染源、污染受体和社会经济的情境下,将农业污染区进一步分为高脆弱性区、高脆弱性高危害区和优先调查区。Jia等运用模糊K均值聚类方法将研究区土壤重金属污染划分为3个子区域,分别为高风险区、中度风险区和安全区。然而,这些研究仅基于土壤污染的确定性风险,而忽略了污染的空间交互关系。
因此,运用双变量局部莫兰指数建立土壤重金属与污染企业之间的空间交互关系,同时考虑土壤重金属污染水平和受体脆弱性水平,对于科学合理的土壤重金属风险识别和划分土壤重金属管理分区,以及指导政策制定者和利益相关者管控土壤重金属污染具有迫切的现实意义。
发明内容
本发明的目的在于解决现有技术中存在的问题,并提供一种基于空间交互关系的土壤重金属风险识别方法。
本发明所采用的具体技术方案如下:
一种基于空间交互关系的土壤重金属风险识别方法,其具体如下:
S1:基于http协议与公开网页端获得待研究区域的全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单、重点排污单位名录、企业POI数据、工商要素补充数据和遥感影像;其中,全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录均包括企业名称及其所属地市,企业POI数据包括企业名称及其经纬度信息;工商要素补充数据包括企业名称、经营范围、成立年份和注册地址;
S2:将S1中全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录的特征信息转换为结构化数据;根据工商要素补充数据和和企业POI数据,对两个数据中的企业名称分别进行分词处理,之后进行匹配,使得每个企业的基本信息与其地理位置信息相对应,得到含地理位置的企业基本信息关联数据;
S3:将S2中每个企业基本信息关联数据与遥感影像上的点位信息对应匹配,以获得每个污染企业及其周边场地的高分辨率遥感影像;然后使用基于深度学习的图像语义分割技术,对每个污染企业对应的遥感影像数据进行建筑物的特征提取,以判断该区域是否存在建筑或者企业工厂,实现污染企业分布情况与其企业基本信息关联数据的相似度匹配,得到污染企业点位数据;
S4:使用核密度法对S3中获取的污染企业点位数据进行核密度分析;运用反距离加权法预测研究区域内土壤重金属空间分布,并对土壤重金属风险级别进行划分;根据研究区域的研究边界生成特定规模的网格以及对应的网格点,基于网格点统计网格内土壤重金属风险级别与污染企业密度值;对土壤重金属风险级别与污染企业密度值进行双变量局部空间自相关分析,得到土壤重金属与污染企业的空间交互关系;
S5:根据所述土壤重金属风险、研究区域的受体脆弱性和空间交互关系,对研究区域进行风险识别。
作为优选,所述S1中,全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录均以PDF、word或图片格式存在。
进一步的,所述S2中,将全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录中以非结构化文档数据PDF、word或图片格式存在信息,使用OCR技术将其识别为基于Office Open XML标准的压缩文件格式,转换为结构化数据。
作为优选,所述S2中,特征信息包括企业名称、经营范围和地址。
作为优选,所述S2中,根据工商要素补充数据和企业POI数据,分别对两个数据中的企业名称使用分词引擎jieba分词处理,将其分词成“城市”+“企业名”+“行业名”+“后缀”四项;
若两个数据中的企业名称经分词处理后的四项完全匹配,则将该信息输出,并得到含地理位置的企业基本信息关联数据;
若两个数据中的企业名称经分词处理后的四项不完全匹配,提取工商要素补充数据中注册地址字段,使用高德API接口查询得到以GCJ-02坐标系表示的地理位置信息和位置范围,并与企业名称进行匹配,得到含地理位置的企业基本信息关联数据。
作为优选,所述S3的具体方法如下:
根据每个企业的基本信息关联数据及其对应遥感影像上的点位信息,对每个企业赋予经纬度信息,并获取该点位周边相应的遥感影像;通过获取的遥感影像进行数据的预处理,并生成相应的标注数据,对U-Net卷积神经网络模型进行训练建模;将训练好的U-Net卷积神经网络模型在研究区进行测试验证,模型对相应点位的影像进行图像分割,返还的结果图中的每个像元只有建筑与非建筑两类;若返还的结果图中存在建筑,则说明该点位的企业工厂真实存在;若返还的结果图中只存在非建筑,则说明该点位的企业工厂并不存在;
将该结果与企业基本信息关联数据进行比较,若两者相同,则自动筛选出有效企业基本信息关联数据的企业;若两者不同,则对该企业信息进行二次审查,通过企业的基本信息关联数据及其对应遥感影像判断该点位是否存在实际企业。
作为优选,所述S4的具体方法如下:
对所述土壤重金属风险级别进行划分后,根据研究区域的研究边界,得到其最小外接矩形所围成的范围;然后以该矩形的某个顶点开始,生成格网和对应的网格点;运用网格点提取污染企业核密度分析和土壤重金属空间分布插值结果在该网格内的数值,其数值分别代表研究边界中土壤重金属风险水平和污染企业的聚集程度;将带有土壤重金属风险级别与污染企业密度值的网格点进行双变量局部莫兰分析,具体公式如下:
其中和分别是变量a和b在位置i和j上的土壤重金属风险级别值和污染企业密度值,变量a和b分别代表网格内土壤重金属风险级别与污染企业密度;当小于等于1时即无风险水平,将重定义为0;当大于1时即有风险,将重定义为1;Wij为位置i和j的空间权重矩阵,是根据位置i和j之间的欧式距离权重所得;Iab表示格网i处的a属性与格网j处b属性的局部莫兰指数;
当Iab显著为正时,则格网i处的土壤重金属风险级别与格网j处的污染企业密度具有显著的局部正相关关系;当Iab显著为负时,则认为格网i处的土壤重金属风险级别与格网j处的污染企业密度具有显著的局部负相关关系;当Iab不显著时,则认为格网i处的土壤重金属风险级别与格网j处的污染企业密度无明显的空间交互关系。
作为优选,所述S5中,将所研究区域该年份的人口密度作为受体脆弱性指标,若人口密度高出当年我国平均人口密度1.5倍则认为是高脆弱性,否则,为低脆弱性。
本发明相对于现有技术而言,具有以下有益效果:
本发明基于政府调查并公开的污染企业数据进行后续建模,无需对数据进行分类以及污染状况以判别是否该企业是污染企业,后续研究可直接根据研究区所在省级政府公开的污染企业数据进行数据清洗与建模;此外,通过建立网格点数据,根据污染企业的建模结果得到密度值,并与土壤重金属风险级别进行双变量局部莫兰分析,分析二者在空间上的交互关系,从而使得离散的重金属污染点数据与污染企业点数据能够较为准确的探索空间交互关系,扩展了现有土壤重金属分区的方法和思路,对进一步管理与预防土壤重金属污染具有重要的理论与实际意义,并存在推广应用的价值。
本发明是通过一种基于模糊和相似度匹配的污染企业空间识别方法,主要采用U-Net模型建立污染企业识别的精度评价模型,通过一种基于特定的文本挖掘手段,主要采用了多项式朴素贝叶斯的方法建立分类模型,并通过得到的污染企业数据与当地的土壤重金属污染数据进行双变量局部莫兰指数分析来构建污染企业与土壤重金属含量分布之间的空间交互关系,进而对土壤重金属管理分区研究工作起到一个指向性的作用。
附图说明
图1是实施例中,(a)土壤重金属风险水平分区,(b)人口密度的分区,(c)污染企业密度分布,(d)土壤重金属Cd与污染企业的局部莫兰空间交互关系;
图2是实施例中,基于风险识别结果对研究区进行土壤重金属管理分区的示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。
本发明提供了一种基于空间交互关系的土壤重金属风险识别方法,具体方法如下:
S1:数据获取,具体如下:
基于http协议与公开网页端获得待研究区域的全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单、重点排污单位名录、企业POI数据、工商要素补充数据和遥感影像。其中,全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录均包括企业名称及其所属地市,且均以PDF、word或图片格式存在。企业POI数据包括企业名称及其经纬度信息。工商要素补充数据包括企业名称、经营范围、成立年份和注册地址。
S2:数据预处理。将S1中全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录的特征信息(包括企业名称、经营范围和地址)转换为结构化数据。具体为:将全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录中以非结构化文档数据PDF、word或图片格式存在信息,使用OCR技术将其识别为基于Office Open XML标准的压缩文件格式,转换为结构化数据。
根据工商要素补充数据和和企业POI数据,对两个数据中的企业名称分别进行分词处理,之后进行匹配,使得每个企业的基本信息与其地理位置信息相对应,得到含地理位置的企业基本信息关联数据。同时,将POI数据的GCJ-02坐标系转换为WGS-84地理坐标系。
根据工商要素补充数据和企业POI数据,分别对两个数据中的企业名称使用分词引擎jieba分词处理,将其分词成“城市”+“企业名”+“行业名”+“后缀”四项。若两个数据中的企业名称经分词处理后的四项完全匹配,则将该信息输出,并得到含地理位置的企业基本信息关联数据。若两个数据中的企业名称经分词处理后的四项不完全匹配,提取工商要素补充数据中注册地址字段,使用高德API接口查询得到以GCJ-02坐标系表示的地理位置信息和位置范围,并与企业名称进行匹配,得到含地理位置的企业基本信息关联数据。
S3:相似度匹配。将S2中每个企业基本信息关联数据与遥感影像上的点位信息对应匹配,以获得每个污染企业及其周边场地的高分辨率遥感影像。然后使用基于深度学习的图像语义分割技术,对每个污染企业对应的遥感影像数据进行建筑物的特征提取,以判断该区域是否存在建筑或者企业工厂,实现污染企业分布情况与其企业基本信息关联数据的相似度匹配,得到污染企业点位数据。
S3的具体方法如下:
根据每个企业的基本信息关联数据及其对应遥感影像上的点位信息,对每个企业赋予经纬度信息,并获取该点位周边相应的遥感影像。通过获取的遥感影像进行数据的预处理,并生成相应的标注数据,对U-Net卷积神经网络模型进行训练建模。模型主要通过卷积与池化的步骤对图像进行特征提取,并通过反卷积的步骤将特征图恢复至原始图像的尺寸大小,卷积与池化的具体计算如公式(2)与(3)所示,具体如下:
其中down()作为下采样的函数,在平均池化的步骤下,将固定大小的像素区域里的所有像素相加,最后得到的特征图的大小变为原来的1/n。
将训练好的U-Net卷积神经网络模型在研究区进行测试验证,模型对相应点位的影像进行图像分割,返还的结果图中的每个像元只有建筑与非建筑两类。若返还的结果图中存在建筑,则说明该点位的企业工厂真实存在。若返还的结果图中只存在非建筑,则说明该点位的企业工厂并不存在。
将该结果与企业基本信息关联数据进行比较,若两者相同,则自动筛选出有效企业基本信息关联数据的企业。若两者不同,则对该企业信息进行二次审查,通过企业的基本信息关联数据及其对应遥感影像判断该点位是否存在实际企业。
S4:使用核密度法对S3中获取的污染企业点位数据进行核密度分析。运用反距离加权法预测研究区域内土壤重金属空间分布,并运用全国农产品产地土壤重金属安全评估技术规定对土壤重金属风险级别进行划分。根据研究区域的研究边界生成特定规模的网格以及对应的网格点,基于网格点统计网格内土壤重金属风险级别与污染企业密度值。对土壤重金属风险级别与污染企业密度值进行双变量局部空间自相关分析,得到土壤重金属与污染企业的空间交互关系。
S4的具体方法如下:
对土壤重金属风险级别进行划分后,根据研究区域的研究边界,得到其最小外接矩形所围成的范围。然后以该矩形的某个顶点开始,生成格网和对应的网格点。运用网格点提取污染企业核密度分析和土壤重金属空间分布插值结果在该网格内的数值,其数值分别代表研究边界中土壤重金属风险水平和污染企业的聚集程度。将带有土壤重金属风险级别与污染企业密度值的网格点进行双变量局部莫兰分析,具体公式如下:
其中和分别是变量a和b在位置i和j上的土壤重金属风险级别值和污染企业密度值,变量a和b分别代表网格内土壤重金属风险级别与污染企业密度。当小于等于1时即无风险水平,将重定义为0。当大于1时即有风险,将重定义为1。Wij为位置i和j的空间权重矩阵,是根据位置i和j之间的欧式距离权重所得。Iab表示格网i处的a属性与格网j处b属性的局部莫兰指数。
当Iab显著为正时,则格网i处的土壤重金属风险级别与格网j处的污染企业密度具有显著的局部正相关关系。当Iab显著为负时,则认为格网i处的土壤重金属风险级别与格网j处的污染企业密度具有显著的局部负相关关系。当Iab不显著时,则认为格网i处的土壤重金属风险级别与格网j处的污染企业密度无明显的空间交互关系。
需要注意的是,将格网i和格网j进行变化,通过上述过程可得格网j处的a属性与格网i处b属性的局部莫兰指数。
S5:根据土壤重金属风险(以Cd为例)、研究区域的受体脆弱性(以人口密度为例)和空间交互关系,对研究区域进行风险识别。
其中,将所研究区域该年份的人口密度作为受体脆弱性指标,若人口密度高出当年我国平均人口密度1.5倍则认为是高脆弱性,否则,为低脆弱性。
根据表1将所研究区域进行管理分区,以便后续监测管理。
表1
实施例
选取中国东南沿海某区域作为研究区,使用本发明的方法进行分析,具体步骤如下:
S1:基于http协议与公开网页端获得待研究区域的全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单、重点排污单位名录、企业POI数据、工商要素补充数据和遥感影像。其中,工商要素补充数据的分类符合国民经济行业分类标准GB/T 4752-2011;企业POI数据需要有经纬度信息,属于WGS84地理坐标系,且是基于高德地图API下载而来。
S2:将S1中的数据使用分词引擎jieba,该引擎是经过隐马尔科夫链模型训练而来,具备很好的分词效果。首先,将工商要素补充数据的企业名字段,分词成“城市”+“企业名”+“行业名”+“后缀”四项;将企业POI数据的企业名字段,分词成“城市”+“企业名”+“行业名”+“后缀”四项。如工商与POI数据企业名字段的四项完全匹配,则得到含地理位置的企业基本信息关联数据;如后缀不符,例如“有限公司”和“有限责任公司”,仍认为是一家企业。对未能通过企业名关联到的工商企业数据,提取工商注册地址字段,使用高德API接口查询得到地理位置信息(GCJ-02)和位置范围(兴趣点、街道、乡镇、区、市、省),筛选位置范围为兴趣点的数据集,并与企业名称进行匹配,得到含地理位置的企业基本信息关联数据。
S3:根据每个企业的基本信息关联数据及其对应遥感影像上的点位信息,对每个企业赋予经纬度信息,并获取该点位周边相应的遥感影像。通过获取的遥感影像进行数据的预处理,并生成相应的标注数据,对U-Net卷积神经网络模型进行训练建模。具体如下:
将获得的相应点位的遥感影像与相应标注图进行切块处理,分成256*256大小的图像,并进行翻转与裁剪等数据增强的操作提高数据的多样性,以训练样本大小为10作为模型的训练输入,初始学习率为5e-5,损失函数选用二元交叉熵。在达到200K次的迭代后,模型基本达到局部最优点并收敛。在后续的模型验证过程中,对模型分割的结果以总体精度、召回率、F1-score作为模型性能的精度评价。
其中TP代表着是分类正确的并且类别为建筑的像元个数;TN表示分类正确的并且类别为背景的像元个数;FN表示本为建筑类别的像元被分为背景的像元个数;FP表示类别为背景的像元被分为建筑类别的像元个数。
将训练好的U-Net卷积神经网络模型在研究区进行测试验证,模型对相应点位的影像进行图像分割,返还的结果图中的每个像元只有建筑与非建筑两类。若返还的结果图中存在建筑,则说明该点位的企业工厂真实存在。若返还的结果图中只存在非建筑,则说明该点位的企业工厂并不存在。
将该结果与企业基本信息关联数据进行比较,若两者相同,则自动筛选出有效企业基本信息关联数据的企业。若两者不同,则对该企业信息进行二次审查,通过企业的基本信息关联数据及其对应遥感影像判断该点位是否存在实际企业。
S4:使用核密度法对S3中获取的污染企业点位数据进行空间插值,设定输出的分辨率为1km,得到研究区污染企业的空间分布密度图,即完成核密度分析。运用反距离加权法预测研究区域内土壤重金属空间分布,并运用全国农产品产地土壤重金属安全评估技术规定对土壤重金属风险级别进行划分。根据研究区域的研究边界生成特定l km分辨率的网格以及对应的网格点,基于网格点统计网格内土壤重金属风险级别(如图1a所示)与污染企业密度值(如图1c所示)。对土壤重金属风险级别与污染企业密度值进行双变量局部空间自相关分析,选取的空间相邻关系为K-Nearest neighbors,得到土壤重金属与污染企业的空间交互关系。
S5:如图2所示,根据土壤重金属风险(以Cd为例)、研究区域的受体脆弱性(以人口密度为例,如图1b所示)和空间交互关系(如图1d所示),对研究区域进行风险识别。并根据表1将所研究区域进行管理分区,以便后续监测管理。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (8)
1.一种基于空间交互关系的土壤重金属风险识别方法,其特征在于,具体如下:
S1:基于http协议与公开网页端获得待研究区域的全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单、重点排污单位名录、企业POI数据、工商要素补充数据和遥感影像;其中,全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录均包括企业名称及其所属地市,企业POI数据包括企业名称及其经纬度信息;工商要素补充数据包括企业名称、经营范围、成立年份和注册地址;
S2:将S1中全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录的特征信息转换为结构化数据;根据工商要素补充数据和和企业POI数据,对两个数据中的企业名称分别进行分词处理,之后进行匹配,使得每个企业的基本信息与其地理位置信息相对应,得到含地理位置的企业基本信息关联数据;
S3:将S2中每个企业基本信息关联数据与遥感影像上的点位信息对应匹配,以获得每个污染企业及其周边场地的高分辨率遥感影像;然后使用基于深度学习的图像语义分割技术,对每个污染企业对应的遥感影像数据进行建筑物的特征提取,以判断该区域是否存在建筑或者企业工厂,实现污染企业分布情况与其企业基本信息关联数据的相似度匹配,得到污染企业点位数据;
S4:使用核密度法对S3中获取的污染企业点位数据进行核密度分析;运用反距离加权法预测研究区域内土壤重金属空间分布,并对土壤重金属风险级别进行划分;根据研究区域的研究边界生成特定规模的网格以及对应的网格点,基于网格点统计网格内土壤重金属风险级别与污染企业密度值;对土壤重金属风险级别与污染企业密度值进行双变量局部空间自相关分析,得到土壤重金属与污染企业的空间交互关系;
S5:根据所述土壤重金属风险、研究区域的受体脆弱性和空间交互关系,对研究区域进行风险识别。
2.如权利要求1所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S1中,全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录均以PDF、word或图片格式存在。
3.如权利要求2所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S2中,将全口径涉重金属重点行业企业清单、土壤环境重点监管企业名单和重点排污单位名录中以非结构化文档数据PDF、word或图片格式存在信息,使用OCR技术将其识别为基于Office Open XML标准的压缩文件格式,转换为结构化数据。
4.如权利要求1所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S2中,特征信息包括企业名称、经营范围和地址。
5.如权利要求1所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S2中,根据工商要素补充数据和企业POI数据,分别对两个数据中的企业名称使用分词引擎jieba分词处理,将其分词成“城市”+“企业名”+“行业名”+“后缀”四项;
若两个数据中的企业名称经分词处理后的四项完全匹配,则将该信息输出,并得到含地理位置的企业基本信息关联数据;
若两个数据中的企业名称经分词处理后的四项不完全匹配,提取工商要素补充数据中注册地址字段,使用高德API接口查询得到以GCJ-02坐标系表示的地理位置信息和位置范围,并与企业名称进行匹配,得到含地理位置的企业基本信息关联数据。
6.如权利要求1所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S3的具体方法如下:
根据每个企业的基本信息关联数据及其对应遥感影像上的点位信息,对每个企业赋予经纬度信息,并获取该点位周边相应的遥感影像;通过获取的遥感影像进行数据的预处理,并生成相应的标注数据,对U-Net卷积神经网络模型进行训练建模;将训练好的U-Net卷积神经网络模型在研究区进行测试验证,模型对相应点位的影像进行图像分割,返还的结果图中的每个像元只有建筑与非建筑两类;若返还的结果图中存在建筑,则说明该点位的企业工厂真实存在;若返还的结果图中只存在非建筑,则说明该点位的企业工厂并不存在;
将该结果与企业基本信息关联数据进行比较,若两者相同,则自动筛选出有效企业基本信息关联数据的企业;若两者不同,则对该企业信息进行二次审查,通过企业的基本信息关联数据及其对应遥感影像判断该点位是否存在实际企业。
7.如权利要求1所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S4的具体方法如下:
对所述土壤重金属风险级别进行划分后,根据研究区域的研究边界,得到其最小外接矩形所围成的范围;然后以该矩形的某个顶点开始,生成格网和对应的网格点;运用网格点提取污染企业核密度分析和土壤重金属空间分布插值结果在该网格内的数值,其数值分别代表研究边界中土壤重金属风险水平和污染企业的聚集程度;将带有土壤重金属风险级别与污染企业密度值的网格点进行双变量局部莫兰分析,具体公式如下:
其中和分别是变量a和b在位置i和j上的土壤重金属风险级别值和污染企业密度值,变量a和b分别代表网格内土壤重金属风险级别与污染企业密度;当小于等于1时即无风险水平,将重定义为0;当大于1时即有风险,将重定义为1;Wij为位置i和j的空间权重矩阵,是根据位置i和j之间的欧式距离权重所得;Iab表示格网i处的a属性与格网j处b属性的局部莫兰指数;
当Iab显著为正时,则格网i处的土壤重金属风险级别与格网j处的污染企业密度具有显著的局部正相关关系;当Iab显著为负时,则认为格网i处的土壤重金属风险级别与格网j处的污染企业密度具有显著的局部负相关关系;当Iab不显著时,则认为格网i处的土壤重金属风险级别与格网j处的污染企业密度无明显的空间交互关系。
8.如权利要求1所述的基于空间交互关系的土壤重金属风险识别方法,其特征在于,所述S5中,将所研究区域该年份的人口密度作为受体脆弱性指标,若人口密度高出当年我国平均人口密度1.5倍则认为是高脆弱性,否则,为低脆弱性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124192.9A CN112288247B (zh) | 2020-10-20 | 2020-10-20 | 一种基于空间交互关系的土壤重金属风险识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124192.9A CN112288247B (zh) | 2020-10-20 | 2020-10-20 | 一种基于空间交互关系的土壤重金属风险识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112288247A true CN112288247A (zh) | 2021-01-29 |
CN112288247B CN112288247B (zh) | 2024-04-09 |
Family
ID=74423411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011124192.9A Active CN112288247B (zh) | 2020-10-20 | 2020-10-20 | 一种基于空间交互关系的土壤重金属风险识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112288247B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112836146A (zh) * | 2021-03-09 | 2021-05-25 | 威创集团股份有限公司 | 一种基于网络消息的地理空间坐标信息获取方法及装置 |
CN112986538A (zh) * | 2021-05-06 | 2021-06-18 | 中南大学 | 大区域土壤重金属检测与时空分布特征分析方法及系统 |
CN113220449A (zh) * | 2021-04-27 | 2021-08-06 | 武汉大学 | 一种基于边缘计算的脆弱线路识别方法及体系 |
CN113688940A (zh) * | 2021-09-09 | 2021-11-23 | 浙江大学 | 一种基于公开数据的疑似污染工业企业识别方法 |
CN113902249A (zh) * | 2021-09-02 | 2022-01-07 | 北京市农林科学院信息技术研究中心 | 一种土壤重金属影响因素解析方法及装置 |
CN114943441A (zh) * | 2022-05-17 | 2022-08-26 | 北京师范大学 | 一种基于poi数据的区域土壤污染健康风险评估方法 |
WO2023168781A1 (zh) * | 2022-03-10 | 2023-09-14 | 浙江大学 | 一种基于时空交互关系的土壤镉风险预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005158025A (ja) * | 2003-10-27 | 2005-06-16 | Mitsubishi Research Institute Inc | 土壌汚染リスク診断装置、方法及びプログラム |
CN108595414A (zh) * | 2018-03-22 | 2018-09-28 | 浙江大学 | 基于源汇空间变量推理的土壤重金属企业污染源识别方法 |
CN108805920A (zh) * | 2018-06-01 | 2018-11-13 | 环境保护部卫星环境应用中心 | 未利用地上土壤污染风险区域的识别方法和装置 |
CN110096490A (zh) * | 2018-10-18 | 2019-08-06 | 苏州科技大学 | 污染场地数据库及其构建方法 |
CN110726677A (zh) * | 2019-10-18 | 2020-01-24 | 中国科学院地理科学与资源研究所 | 一种污染场地遥感探测与空间热区识别系统和方法 |
AU2020100440A4 (en) * | 2020-01-21 | 2020-04-23 | Institute Of Agricultural Resources And Environment Hebei Academy Of Agriculture And Forestry Sciences | The high-risk area identification method and differential processing method for land agricultural product producing areas |
-
2020
- 2020-10-20 CN CN202011124192.9A patent/CN112288247B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005158025A (ja) * | 2003-10-27 | 2005-06-16 | Mitsubishi Research Institute Inc | 土壌汚染リスク診断装置、方法及びプログラム |
CN108595414A (zh) * | 2018-03-22 | 2018-09-28 | 浙江大学 | 基于源汇空间变量推理的土壤重金属企业污染源识别方法 |
CN108805920A (zh) * | 2018-06-01 | 2018-11-13 | 环境保护部卫星环境应用中心 | 未利用地上土壤污染风险区域的识别方法和装置 |
CN110096490A (zh) * | 2018-10-18 | 2019-08-06 | 苏州科技大学 | 污染场地数据库及其构建方法 |
CN110726677A (zh) * | 2019-10-18 | 2020-01-24 | 中国科学院地理科学与资源研究所 | 一种污染场地遥感探测与空间热区识别系统和方法 |
AU2020100440A4 (en) * | 2020-01-21 | 2020-04-23 | Institute Of Agricultural Resources And Environment Hebei Academy Of Agriculture And Forestry Sciences | The high-risk area identification method and differential processing method for land agricultural product producing areas |
Non-Patent Citations (1)
Title |
---|
周银香;洪兴建;: "中国交通业全要素碳排放效率的测度及动态驱动机理研究", 商业经济与管理, no. 05, 4 June 2018 (2018-06-04) * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112836146A (zh) * | 2021-03-09 | 2021-05-25 | 威创集团股份有限公司 | 一种基于网络消息的地理空间坐标信息获取方法及装置 |
CN112836146B (zh) * | 2021-03-09 | 2024-05-14 | 威创集团股份有限公司 | 一种基于网络消息的地理空间坐标信息获取方法及装置 |
CN113220449A (zh) * | 2021-04-27 | 2021-08-06 | 武汉大学 | 一种基于边缘计算的脆弱线路识别方法及体系 |
CN113220449B (zh) * | 2021-04-27 | 2023-11-14 | 武汉大学 | 一种基于边缘计算的脆弱线路识别方法及结构 |
CN112986538A (zh) * | 2021-05-06 | 2021-06-18 | 中南大学 | 大区域土壤重金属检测与时空分布特征分析方法及系统 |
CN113902249A (zh) * | 2021-09-02 | 2022-01-07 | 北京市农林科学院信息技术研究中心 | 一种土壤重金属影响因素解析方法及装置 |
CN113688940A (zh) * | 2021-09-09 | 2021-11-23 | 浙江大学 | 一种基于公开数据的疑似污染工业企业识别方法 |
WO2023168781A1 (zh) * | 2022-03-10 | 2023-09-14 | 浙江大学 | 一种基于时空交互关系的土壤镉风险预测方法 |
CN114943441A (zh) * | 2022-05-17 | 2022-08-26 | 北京师范大学 | 一种基于poi数据的区域土壤污染健康风险评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112288247B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112288247B (zh) | 一种基于空间交互关系的土壤重金属风险识别方法 | |
CN108710625B (zh) | 一种专题知识自动挖掘系统及方法 | |
WO2023168781A1 (zh) | 一种基于时空交互关系的土壤镉风险预测方法 | |
Henits et al. | Seasonal multitemporal land-cover classification and change detection analysis of Bochum, Germany, using multitemporal Landsat TM data | |
Ray et al. | Geolocated dataset of Chinese overseas development finance | |
Zhou et al. | Spatiotemporal change footprint pattern discovery: an inter‐disciplinary survey | |
Kyzirakos et al. | Wildfire monitoring using satellite images, ontologies and linked geospatial data | |
Muttaqin et al. | MaxEnt (Maximum Entropy) model for predicting prehistoric cave sites in Karst area of Gunung Sewu, Gunung Kidul, Yogyakarta | |
Mehdipoor et al. | Developing a workflow to identify inconsistencies in volunteered geographic information: a phenological case study | |
Alsaaideh et al. | New urban map of Eurasia using MODIS and multi-source geospatial data | |
Mast et al. | Mapping urban villages using fully convolutional neural networks | |
Iordache et al. | A cyberinfrastructure for air quality monitoring and early warnings to protect children with respiratory disorders | |
Shbita et al. | Building spatio-temporal knowledge graphs from vectorized topographic historical maps | |
Xu et al. | Building function classification in Nanjing, China, using deep learning | |
de Assis et al. | Geographical prioritization of social network messages in near real-time using sensor data streams: an application to floods. | |
Tiancheng et al. | Application of Improved Naive Bayesian‐CNN Classification Algorithm in Sandstorm Prediction in Inner Mongolia | |
Lin et al. | Knowledge transfer for large‐scale urban growth modeling based on formal concept analysis | |
CN113688940A (zh) | 一种基于公开数据的疑似污染工业企业识别方法 | |
Zhao et al. | Impacts of LiDAR sampling methods and point spacing density on DEM generation | |
CN110515961B (zh) | 一种基于时空大数据的基础地理信息更新需求评价方法 | |
CN113536781A (zh) | 地址识别方法及装置、可读存储介质、终端 | |
CN113032504A (zh) | 村镇社区公共服务时空数据汇聚方法及装置 | |
Wesley et al. | Methods for measuring geodiversity in large overhead imagery datasets | |
Bastos | Spatial analysis meets internet research | |
Miu et al. | Aggregation and visualization of spatial data with application to classification of land use and land cover |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |