CN115577099B - 一种污染地块边界识别方法、系统、介质及设备 - Google Patents
一种污染地块边界识别方法、系统、介质及设备 Download PDFInfo
- Publication number
- CN115577099B CN115577099B CN202211085445.5A CN202211085445A CN115577099B CN 115577099 B CN115577099 B CN 115577099B CN 202211085445 A CN202211085445 A CN 202211085445A CN 115577099 B CN115577099 B CN 115577099B
- Authority
- CN
- China
- Prior art keywords
- data
- polluted
- polluted land
- land block
- space information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Remote Sensing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于图像处理领域,尤其涉及一种污染地块边界识别方法、系统、介质及设备。该方法包括:步骤1,将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;步骤2,利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别;步骤3,利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别;步骤4,将污染行业识别结果以及污染地块识别结果分别以数据表的形式存储于所述预设数据库中。本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
Description
技术领域
本发明属于图像处理领域,尤其涉及一种污染地块边界识别方法、系统、介质及设备。
背景技术
我国场地土壤污染风险管理处于刚刚起步阶段,土壤污染底数不清,疑似污染场地的识别主要采用现场踏勘、人员访谈、资料分析并结合日常监管等方式进行,但是,这些传统污染场地识别方式存在全面性不够,工作效率较低,准确率不够,不能满足土地安全利用的准入管理需求。
发明内容
本发明所要解决的技术问题是提供一种污染地块边界识别方法、系统、介质及设备。
本发明解决上述技术问题的技术方案如下:一种污染地块边界识别方法,包括:
步骤1,将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;
步骤2,利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别;
步骤3,利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别;
步骤4,将污染行业识别结果以及污染地块识别结果分别以数据表的形式存储于所述预设数据库中。
本发明的有益效果是:通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述污染地块数据通过如下过程获取:
从多个数据源中自动获取所述污染地块数据或从已知数据库中获取所述污染地块数据,所述数据源包括:高德地图中包含坐标的兴趣点数据、环保企业公布的第一文本数据以及政府单位公布的第二文本数据,所述第一文本数据中包括:环保企业名称、经营状态以及经营范围,所述第二文本数据中包括:政府企业名称、所属行业以及主要污染物。
进一步,所述步骤1具体为:
将所述污染地块数据分为有空间信息类型以及无空间信息类型,将有空间信息类型的污染地块数据统一转换为国家标准坐标系下的位置数据,并判断所述位置数据是否存在异常,将无异常的有空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库;
将无空间信息类型的污染地块数据进行常规排查,将无异常的无空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库,所述常规排查包括名称规范性排查以及信息逻辑性排查。
进一步,所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果。
进一步,所述污染地块识别器处理流程为:
通过预设方案对输入数据进行预处理,得到预处理结果,通过主成分分析法以及核主成分分析法对所述预处理结果进行光谱特征提取,将光谱特征提取结果依次输入随机森林模型以及决策树模型中,得到污染地块数据的光谱特征分类结果,所述预设方案为辐射校正、大气校正、几何校正以及波段融合。
本发明解决上述技术问题的另一种技术方案如下:一种污染地块边界识别系统,包括:
获取模块,用于将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;
第一识别模块,用于利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别;
第二识别模块,用于利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别;
存储模块,用于将污染行业识别结果以及污染地块识别结果分别以数据表的形式存储于所述预设数据库中。
本发明的有益效果是:通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
进一步,所述污染地块数据通过如下过程获取:
从多个数据源中自动获取所述污染地块数据或从已知数据库中获取所述污染地块数据,所述数据源包括:高德地图中包含坐标的兴趣点数据、环保企业公布的第一文本数据以及政府单位公布的第二文本数据,所述第一文本数据中包括:环保企业名称、经营状态以及经营范围,所述第二文本数据中包括:政府企业名称、所属行业以及主要污染物。
进一步,所述获取模块具体用于:
将所述污染地块数据分为有空间信息类型以及无空间信息类型,将有空间信息类型的污染地块数据统一转换为国家标准坐标系下的位置数据,并判断所述位置数据是否存在异常,将无异常的有空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库;
将无空间信息类型的污染地块数据进行常规排查,将无异常的无空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库,所述常规排查包括名称规范性排查以及信息逻辑性排查。
进一步,所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果。
进一步,所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果。
本发明解决上述技术问题的另一种技术方案如下:一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述任一项所述的一种污染地块边界识别方法。
本发明的有益效果是:通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
本发明解决上述技术问题的另一种技术方案如下:一种电子设备,包括上述存储介质、执行上述存储介质内的指令的处理器。
本发明的有益效果是:通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
附图说明
图1为本发明一种污染地块边界识别方法实施例提供的流程示意图;
图2为本发明一种污染地块边界识别系统实施例提供的结构框架图;
图3为本发明一种污染地块边界识别方法实施例提供的完整流程示意图。
具体实施方式
以下对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种污染地块边界识别方法,包括:
步骤1,将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;
步骤2,利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别;
步骤3,利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别;
步骤4,将污染行业识别结果以及污染地块识别结果分别以数据表的形式存储于所述预设数据库中。
在一些可能的实施方式中,通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
需要说明的是,无空间信息为:地理实体缺少带有投影坐标的空间几何信息;
有空间信息为:地理实体有带有投影坐标的空间几何信息;
如图3所示,污染地块是指按照国家技术规范对疑似污染地块开展土壤环境初步调查后,确认超过有关土壤环境标准(风险筛选值)的疑似污染地块,称为污染地块。污染地块数据的获取分为以下两方面。
一方面,编写程序自动从多个数据源中获取污染地块数据;其中,数据源为高德地图中包含坐标的兴趣点数据(抽象为点的地理实体对象);环保企业公布的包含企业名称、经营状态和经营范围等信息的文本数据;政府相关单位公布的包含企业名称、所属行业和主要污染物等信息的文本数据。另一方面,从遥感相关单位数据库中获取已知的污染地块遥感数据。
将获取的数据按有无空间信息分为地理数据(地理数据为含有空间几何信息的数据。地理数据与空间数据按有无空间信息区分。)与文本数据。地理数据统一转换为国家标准坐标系(获取的地理数据坐标系可能为北京54坐标系、西安80坐标系、WGS84坐标系等,统一坐标转换指将以上不同坐标系的地理数据统一转换为2000国家大地坐标系下的地理数据)即位置数据可以理解为转后为2000国家大地坐标系下的地理数据,并结合我国行政区边界数据检查地理数据空间位置是否正确;文本数据检查包括但不限于行企业名称是否规范、企业名称是否重复、企业信息是否有逻辑性错误(如企业经营状态为北京市)。随后将地理数据与文本数据以数据表的形式进行数据表达,并使用Enterprise Architect软件梳理数据表的结构与关系,最后将数据表以污染地块数据库的形式进行存储。
构建污染行业识别器的过程如下:
污染行业识别器使用中文分词工具对已知为污染企业的企业名称信息、所属行业信息与经营范围信息中的中文进行分词处理。使用随机森林分类模型、朴素贝叶斯分类模型对分词结果进行分类。随后向识别器输入在先获取的污染地块企业信息,识别器依据分词的分类结果识别污染行业(火电、钢铁、水泥、电解铝、煤炭、冶金、化工、石化、建材、造纸、酿造、制药、发酵、纺织、制革和采矿业等16类行业)与污染企业(从事污染行业的相关企业)。
梳理上一段得到的污染企业信息,依据污染企业信息的类别(企业名称、经营范围、经营状态、识别行业、污染行业等)构建污染企业数据表,污染企业数据表导入污染地块数据库进行存储。
构建污染地块识别器的过程如下:
首先,使用辐射校正、大气校正、几何校正与波段融合对在先得到的已知的污染地块遥感数据进行数据预处理。之后采用主成分分析法与核主成分分析法提取污染地块遥感数据的光谱特征。污染地块识别器采用随机森林模型与决策树模型对以上光谱特征进行分类,并得到污染地块光谱特征分类结果。最后将污染企业区域遥感影像输入识别器,识别器提取遥感影像的光谱特征,并依据污染地块光谱特征分类结果识别污染地块。
识别器识别污染地块边界后,将污染地块边界数据以数据表的形式存储于污染地块数据库。应理解,通过污染地块行业识别器识别污染行业,进一步识别污染地块(此时的污染地块多为点数据,缺少污染地块区域的面数据)。
此处以实地调查得到的已知为污染地块(含有面数据)的遥感影像数据为基础,训练污染地块识别器(此识别器目的为获取前文识别得到的污染地块所缺少的面数据)。识别方法如下。
获取实地调查得到的已知为污染地块的遥感影像集,通过分析该影像集内污染地块遥感影像的光谱特征,利用机器学习分类算法训练污染地块识别模型(识别器)。以前文污染地块地理位置为圆心,以一定距离为半径,做圆形缓冲区。获取该缓冲区范围内的遥感影像,将该影像输入污染地块识别器,进而识别出影像中为污染地块的区域边界。
优选地,在上述任意实施例中,所述污染地块数据通过如下过程获取:
从多个数据源中自动获取所述污染地块数据或从已知数据库中获取所述污染地块数据,所述数据源包括:高德地图中包含坐标的兴趣点数据、环保企业公布的第一文本数据以及政府单位公布的第二文本数据,所述第一文本数据中包括:环保企业名称、经营状态以及经营范围,所述第二文本数据中包括:政府企业名称、所属行业以及主要污染物。
优选地,在上述任意实施例中,所述步骤1具体为:
将所述污染地块数据分为有空间信息类型以及无空间信息类型,将有空间信息类型的污染地块数据统一转换为国家标准坐标系下的位置数据,并判断所述位置数据是否存在异常,将无异常的有空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库;
将无空间信息类型的污染地块数据进行常规排查,将无异常的无空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库,所述常规排查包括名称规范性排查以及信息逻辑性排查。
优选地,在上述任意实施例中,所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果。
优选地,在上述任意实施例中,所述污染地块识别器处理流程为:
通过预设方案对输入数据进行预处理,得到预处理结果,通过主成分分析法以及核主成分分析法对所述预处理结果进行光谱特征提取,将光谱特征提取结果依次输入随机森林模型以及决策树模型中,得到污染地块数据的光谱特征分类结果,所述预设方案为辐射校正、大气校正、几何校正以及波段融合。
如图2所示,一种污染地块边界识别系统,包括:
获取模块100,用于将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;
第一识别模块200,用于利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别;
第二识别模块300,用于利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别;
存储模块400,用于将污染行业识别结果以及污染地块识别结果分别以数据表的形式存储于所述预设数据库中。
在一些可能的实施方式中,通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
优选地,在上述任意实施例中,所述污染地块数据通过如下过程获取:
从多个数据源中自动获取所述污染地块数据或从已知数据库中获取所述污染地块数据,所述数据源包括:高德地图中包含坐标的兴趣点数据、环保企业公布的第一文本数据以及政府单位公布的第二文本数据,所述第一文本数据中包括:环保企业名称、经营状态以及经营范围,所述第二文本数据中包括:政府企业名称、所属行业以及主要污染物。
优选地,在上述任意实施例中,所述获取模块100具体用于:
将所述污染地块数据分为有空间信息类型以及无空间信息类型,将有空间信息类型的污染地块数据统一转换为国家标准坐标系下的位置数据,并判断所述位置数据是否存在异常,将无异常的有空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库;
将无空间信息类型的污染地块数据进行常规排查,将无异常的无空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库,所述常规排查包括名称规范性排查以及信息逻辑性排查。
优选地,在上述任意实施例中,所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果。
优选地,在上述任意实施例中,所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果。
本发明解决上述技术问题的另一种技术方案如下:一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述任一项所述的一种污染地块边界识别方法。
在一些可能的实施方式中,通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
本发明解决上述技术问题的另一种技术方案如下:一种电子设备,包括上述存储介质、执行上述存储介质内的指令的处理器。
在一些可能的实施方式中,通过本发明无需实地调查污染地块,有效减少了地块调查过程中的工作量,同时因使用计算机自动处理技术,同时本专利也有效提高了污染地块调查的工作效率,也为污染地块准入管理提供了全面的底图数据。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的方法实施例仅仅是示意性的,例如,步骤的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个步骤可以结合或者可以集成到另一个步骤,或一些特征可以忽略,或不执行。
上述方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于大数据和深度学习的污染地块边界识别方法,其特征在于,包括:
步骤1,将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;
步骤2,利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别,得到污染行业识别结果;
步骤3,利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别,得到污染地块识别结果;
步骤4,将所述污染行业识别结果以及所述污染地块识别结果分别以数据表的形式存储于所述预设数据库中;
所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果;
所述污染地块识别器处理流程为:
通过预设方案对输入数据进行预处理,得到预处理结果,通过主成分分析法以及核主成分分析法对所述预处理结果进行光谱特征提取,将光谱特征提取结果依次输入随机森林模型以及决策树模型中,得到污染地块数据的光谱特征分类结果,所述预设方案为辐射校正、大气校正、几何校正以及波段融合;
所述预处理为:使用辐射校正、大气校正、几何校正与波段融合对在先得到的已知的污染地块遥感数据进行数据预处理。
2.根据权利要求1所述的一种基于大数据和深度学习的污染地块边界识别方法,其特征在于,所述污染地块数据通过如下过程获取:
从多个数据源中自动获取所述污染地块数据或从已知数据库中获取所述污染地块数据,所述数据源包括:高德地图中包含坐标的兴趣点数据、环保企业公布的第一文本数据以及政府单位公布的第二文本数据,所述第一文本数据中包括:环保企业名称、经营状态以及经营范围,所述第二文本数据中包括:政府企业名称、所属行业以及主要污染物。
3.根据权利要求1所述的一种基于大数据和深度学习的污染地块边界识别方法,其特征在于,所述步骤1具体为:
将所述污染地块数据分为有空间信息类型以及无空间信息类型,将有空间信息类型的污染地块数据统一转换为国家标准坐标系下的位置数据,并判断所述位置数据是否存在异常,将无异常的有空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库;
将无空间信息类型的污染地块数据进行常规排查,将无异常的无空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库,所述常规排查包括名称规范性排查以及信息逻辑性排查。
4.一种基于大数据和深度学习的污染地块边界识别系统,其特征在于,包括:
获取模块,用于将获取到的污染地块数据按有无空间信息的类型分别存储至预设数据库;
第一识别模块,用于利用污染行业识别器对无空间信息类型的污染地块数据进行污染行业识别,得到污染行业识别结果;
第二识别模块,用于利用污染地块识别器对有空间信息类型的污染地块数据进行污染地块识别,得到污染地块识别结果;
存储模块,用于将污染行业识别结果以及污染地块识别结果分别以数据表的形式存储于所述预设数据库中;
所述污染行业识别器处理流程为:
通过中文分词工具对输入数据进行分词处理,得到处理结果,将处理结果依次输入至随机森林分类模型以及朴素贝叶斯分类模型中,得到污染地块数据的污染行业分类结果;
所述污染地块识别器处理流程为:
通过预设方案对输入数据进行预处理,得到预处理结果,通过主成分分析法以及核主成分分析法对所述预处理结果进行光谱特征提取,将光谱特征提取结果依次输入随机森林模型以及决策树模型中,得到污染地块数据的光谱特征分类结果,所述预设方案为辐射校正、大气校正、几何校正以及波段融合;
所述预处理为:使用辐射校正、大气校正、几何校正与波段融合对在先得到的已知的污染地块遥感数据进行数据预处理。
5.根据权利要求4所述的一种基于大数据和深度学习的污染地块边界识别系统,其特征在于,所述污染地块数据通过如下过程获取:
从多个数据源中自动获取所述污染地块数据或从已知数据库中获取所述污染地块数据,所述数据源包括:高德地图中包含坐标的兴趣点数据、环保企业公布的第一文本数据以及政府单位公布的第二文本数据,所述第一文本数据中包括:环保企业名称、经营状态以及经营范围,所述第二文本数据中包括:政府企业名称、所属行业以及主要污染物。
6.根据权利要求4所述的一种基于大数据和深度学习的污染地块边界识别系统,其特征在于,所述获取模块具体用于:
将所述污染地块数据分为有空间信息类型以及无空间信息类型,将有空间信息类型的污染地块数据统一转换为国家标准坐标系下的位置数据,并判断所述位置数据是否存在异常,将无异常的有空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库;
将无空间信息类型的污染地块数据进行常规排查,将无异常的无空间信息类型的污染地块数据以数据表的形式存储至所述预设数据库,所述常规排查包括名称规范性排查以及信息逻辑性排查。
7.一种存储介质,其特征在于,所述介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至3中任一项所述的一种基于大数据和深度学习的污染地块边界识别方法。
8.一种电子设备,其特征在于,包括权利要求7所述的存储介质、执行所述存储介质内的指令的处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211085445.5A CN115577099B (zh) | 2022-09-06 | 2022-09-06 | 一种污染地块边界识别方法、系统、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211085445.5A CN115577099B (zh) | 2022-09-06 | 2022-09-06 | 一种污染地块边界识别方法、系统、介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115577099A CN115577099A (zh) | 2023-01-06 |
CN115577099B true CN115577099B (zh) | 2023-09-12 |
Family
ID=84580368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211085445.5A Active CN115577099B (zh) | 2022-09-06 | 2022-09-06 | 一种污染地块边界识别方法、系统、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115577099B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8082267B1 (en) * | 2009-07-23 | 2011-12-20 | Southern Company Services, Inc. | Parcel record information system management |
CN111666909A (zh) * | 2020-06-11 | 2020-09-15 | 中科山水(北京)科技信息有限公司 | 基于面向对象和深度学习的疑似污染场地空间识别方法 |
CN111914090A (zh) * | 2020-08-18 | 2020-11-10 | 生态环境部环境规划院 | 一种企业行业分类识别及其特征污染物识别的方法及装置 |
-
2022
- 2022-09-06 CN CN202211085445.5A patent/CN115577099B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8082267B1 (en) * | 2009-07-23 | 2011-12-20 | Southern Company Services, Inc. | Parcel record information system management |
CN111666909A (zh) * | 2020-06-11 | 2020-09-15 | 中科山水(北京)科技信息有限公司 | 基于面向对象和深度学习的疑似污染场地空间识别方法 |
CN111914090A (zh) * | 2020-08-18 | 2020-11-10 | 生态环境部环境规划院 | 一种企业行业分类识别及其特征污染物识别的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115577099A (zh) | 2023-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | A supervoxel approach to the segmentation of individual trees from LiDAR point clouds | |
CN110674360B (zh) | 一种用于数据的溯源方法和系统 | |
CN110109908B (zh) | 基于社会基础信息挖掘人物潜在关系的分析系统及方法 | |
Owen et al. | Towards a scientific workflow featuring Natural Language Processing for the digitisation of natural history collections. | |
CN116028499A (zh) | 检测信息生成方法、电子设备和计算机可读介质 | |
CN116468392A (zh) | 一种电网工程项目进度监控方法、装置、设备及存储介质 | |
CN115439753A (zh) | 一种基于dem的陡峭河岸识别方法及系统 | |
CN114881814A (zh) | 一种自然资源综合调查技术方法 | |
Shirazi et al. | Modeling Conditions Appropriate for Wildfire in South East China–A Machine Learning Approach | |
CN112363996B (zh) | 用于建立电网知识图谱的物理模型的方法及系统和介质 | |
CN115577099B (zh) | 一种污染地块边界识别方法、系统、介质及设备 | |
van Erp et al. | Georeferencing animal specimen datasets | |
CN112883018A (zh) | 基于大数据分析的银行业人才信息预测方法及装置 | |
CN115858598A (zh) | 基于企业大数据的目标信息筛选匹配方法及相关设备 | |
US20030233354A1 (en) | System for mapping business technology | |
CN112506930B (zh) | 一种基于机器学习技术的数据洞察系统 | |
CN109754159B (zh) | 一种电网运行日志的信息提取方法及系统 | |
CN114218383A (zh) | 重复事件的判定方法、装置及应用 | |
Nigar et al. | An offline image auditing system for legacy meter reading systems in developing countries: A machine learning approach | |
Clark et al. | A solar panel dataset of very high resolution satellite imagery to support the Sustainable Development Goals | |
CN111274240A (zh) | 审核土地卫片执法检查数据的方法、设备及存储介质 | |
CN113159118A (zh) | 物流数据指标的处理方法、装置、设备及存储介质 | |
CN112528293B (zh) | 安全漏洞预警方法、装置、设备及计算机可读存储介质 | |
Senior-Williams et al. | The Classification of Tropical Storm Systems in Infrared Geostationary Weather Satellite Images Using Transfer Learning | |
Song et al. | Discovering geometric theorems from scanned and photographed images of diagrams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |