CN112925863A - 一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法 - Google Patents
一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法 Download PDFInfo
- Publication number
- CN112925863A CN112925863A CN202110114485.7A CN202110114485A CN112925863A CN 112925863 A CN112925863 A CN 112925863A CN 202110114485 A CN202110114485 A CN 202110114485A CN 112925863 A CN112925863 A CN 112925863A
- Authority
- CN
- China
- Prior art keywords
- pollution
- water
- type
- pollution source
- river
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 91
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003911 water pollution Methods 0.000 title claims abstract description 21
- 238000000556 factor analysis Methods 0.000 title claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 238000012544 monitoring process Methods 0.000 claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000009792 diffusion process Methods 0.000 claims abstract description 4
- 238000003903 river water pollution Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000000977 initiatory effect Effects 0.000 claims description 9
- 230000002093 peripheral effect Effects 0.000 claims description 6
- 239000010865 sewage Substances 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000007635 classification algorithm Methods 0.000 claims description 2
- 230000003203 everyday effect Effects 0.000 claims description 2
- 239000002352 surface water Substances 0.000 claims description 2
- 239000000463 material Substances 0.000 claims 1
- 238000009826 distribution Methods 0.000 abstract description 3
- 238000007405 data analysis Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 abstract 1
- 239000000126 substance Substances 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 7
- 239000013505 freshwater Substances 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 3
- 239000013064 chemical raw material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000036449 good health Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003900 soil pollution Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Remote Sensing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法涉及大数据分析领域,自动实现水污染溯源定位,反馈可疑污染源头。该方法以平台管辖区域内可能的污染源信息,各水质监测站的水质指标,各河流地理信息和平台收到的投诉举报信息作为溯源定位算法的输入。该算法的输出为多个可疑污染源的分布情况和对应可疑程度的量化分数,目的是为水环境相关投诉举报事件的处理提供便捷。在多种类型的历史数据基础上,进行新举报事件的分析,并反过来丰富历史数据,使得分析结果具有更高的可信度。该方法与利用浓度扩散模型的溯源方法相比,具有外加检测设备量少,分析成本低的优点。
Description
技术领域
本发明涉及水环境污染溯源领域,具体提出一种面向水环境管理平 台的基于多要素分析的水污染溯源定位方法。
背景技术
随着三次工业革命的发展,我们的生活质量不断提高,与此同时, 我们赖以生存的地球却不断地被污染。生态问题、污染问题是一个国家可持 续发展必须要面对,也是必须要解决的问题。按环境要素进行分类,污染包 括大气污染、水体污染、土壤污染等,本专利涉及水体污染部分。水污染有 很多危害,破坏生态平衡,影响农业和工业生产,危害人类健康,造成生物 减少甚至灭绝等。
地球上可用的淡水资源并不富裕,淡水资源大概只占全球水资源总 量的2.7%,而且淡水资源也并非全部可以直接利用,例如冰山冰川占了淡水 资源的77.2%。我国淡水资源占淡水资源总量的6%,但是人口众多,人均水 量约是世界人均的1/4。我国水资源的时空分布不均衡,例如华北地区人口占 全国24.5%,水资源只有全国的6%。我国经济社会的发展迅速,国内生活和 生产用水需求提高,水污染类型和污染程度也在增长和加剧。
环境污染事件频发,人民群众的健康受到威胁,逐渐意识到保护环 境的重要性。公民监督意识加强,可以从近年来水污染投诉举报次数的增长 反映出来。伴随着人工智能和大数据的发展,有关水环境监测平台的开发研 究得到发展,为了对水环境进行监管,平台需要收集水环境相关信息数据, 接收群众投诉举报的信息。因此,有关水污染的投诉举报信息的智能处理很 有必要,这就需要基于多要素分析进行溯源定位水污染源。
目前已有的溯源技术有使用水质扩散模型的(CN105956664A),利 用企业封信信息数据库的(CN102622670A),对各个监测站进行关联分析及 拓扑分析的(CN109063071A),基于大数据分析水污染的(CN110458529A 和CN109270232A),利用污染的化学指纹信息排查污染源的(CN102661939A)。 相比之下,这些方法没有接收或者利用到群众投诉举报的信息。
发明内容
基于上述问题的存在,本发明提出一种面向水环境管理平台的基于 多要素分析的水污染溯源定位方法,当收到群众举报时,该方法可基于多要 素分析,提供可疑污染源名单和可疑分数,帮助工作人员或者执法人员定位 污染源。
为实现本发明目的,本发明采用如下技术方案:
步骤1,收到举报信息:水环境管理平台收到水污染相关投诉举报, 提出水污染源溯源定位请求;
步骤2,提取数据:通过对举报信息进行语义分类,得到举报类型 和举报对象所属行业,结合举报发起的地理位置,划定待排查区域,从水环 境管理平台数据库提取所需数据;
步骤3,溯源定位:将多种数据进行多要素分析,对待排查区域内 的污染源逐个排查,得到各污染源的可疑程度的量化分数;
步骤4,结果展示:整理最可疑的几个污染源地理位置情况,详细 信息与其对应的可疑分数情况,整理该次举报分析结果,供水环境管理平台 界面展示。
作为优选,所述步骤1中收到的投诉举报信息包括水环境相关投诉 事件发起的地理位置,发起时间与具体的投诉文本内容。
作为优选,所述步骤2需对举报信息的举报类型分类,流程如图1 所示,包括以下步骤:
(1)对历史投诉举报信息进行人工分类,分为与河流水污染相关 类型和与河流水污染无关的两类;
(2)对于历史举报信息,应用词袋模型(Bag-of-words model) 统计文本词频,该方法不考虑词法和语序,将所有词语装进一个袋子,每个 举报信息都有其对应的词频向量,得到词袋模型的目的是用于从文本中提取 特征;
(3)删除词袋模型中的常用停用词,结合每个举报信息的类型, 利用基于朴素贝叶斯的文本分类算法,训练分类器;
(4)每当收到新的举报信息,利用朴素贝叶斯算法分类器进行分 类,得到其对应的举报类型。
作为优选,所述步骤2需对举报信息中举报对象所属行业分类,流 程如图2所示,包括以下步骤:
(1)根据中华人民共和国生态环境部颁布的固定污染源排污许可 分类管理名录(2017年版),根据历史投诉举报信息中描述的污染情况,对可 能产生该污染情况的行业进行标注,即人工分类历史举报数据,细分为固定 污染源排污许可分类管理名录中的33类行业;
(2)对于已标注的举报信息,应用词频-逆向文件频率(TF-IDF) 算法进行关键词提取,词频(TF)表示的就是在一篇文档中某个词条出现的 次数,逆向文件频率(IDF)反映了某个词条的类别区分能力,TF-IDF实际 上就是TF乘以IDF,利用该算法帮助过滤掉常见的词语,保留重要的词语;
(3)长短时记忆神经网络(LSTM)可以用来对自然语言建模,利 用标注好的33类历史举报信息作为训练集,构建LSTM模型。
(4)每当收到新的举报信息,利用LSTM模型进行分类,得到其 对应的举报类型。
作为优选,所述步骤3的待排查区域划定情况为如下两类:
(1)对与河流水污染相关类型的投诉举报信息,偷排漏拍的情况 下往往出现在河流两岸,划定其待排查区域以距离举报位置最近的河岸位置 开始,沿河流上游方向X千米,偷排的污染源距离河流不会太远,两岸各展 开5千米的带状区域;X的大小与不同河流断面面积(M,单位m2)及水流 量(Q,单位m3/s)情况有关;流量等于流速(V,单位m/s)与过水断面面 积的乘积,即Q=V×M,若河流管理人员每天巡检y次,按污染为难溶物质 且随水漂浮,X取污染位置与污染源头可能的最大距离,可推算出
(2)对于与河流水污染无关类型的投诉举报信息,这类污染往往 是小水坑或排污管道等引起的,出现在举报发起位置周围;故划定其待排查 区域为圆形区域,圆心为举报位置,半径为10千米。
作为优选,所述步骤2需提取的数据包括区域内污染源名录和各个 污染源的行业类型,地理位置和历史违规记录,各河流地理信息,各水质监 测站的地理位置,水质情况及对应时间。
所述多要素分析方法,用于得到各污染源可疑程度的量化分数,影 响分数的有距离指标、行业类型一致性指标、历史违规次数指标和周边水质 情况指标,对于不同类型的投诉举报信息,使用不同的多要素分析指标:
作为优选,对与河流水污染相关的投诉举报信息,采用距离指标、 行业类型一致性指标、历史违规次数指标和周边水质情况指标,各指标参考 的内容均具有可信度,权重相同;在带状待排查区域找到所有域内的污染源, 各指标分数计算流程如图3所示,逐个进行多要素分析:
(2)若该污染源行业类型与权利要求4所述方法计算出的举报对 象所属行业类型一致,取行业类型一致性指标分数(B)为25,否则为0;
(3)根据三年内该污染源的历史违规记录,查询其违规次数(n), 历史违规次数指标分数(C)的计算公式为C=n×5,n大于等于5时C取25;
(4)根据举报位置找到距离最近的河岸位置,查询其下游距离最 近的水质监测站在一周内的水质情况,结合生态环境部颁布的地表水环境质 量标准将水质情况分为Ⅰ类、Ⅱ类水质、Ⅲ类水质、Ⅳ类水质、Ⅴ类水质、 劣Ⅴ类水共六类,找出一周内该站点最差的水质类型,六类水质对应水质情 况指标分数D分别取0、5、10、15、20和25;
(5)各个污染源可疑程度的量化分数=A+B+C+D,为距离指标分 数、类型一致性指标分数、历史违规次数指标分数和水质情况指标分数的和, 最高100分,某个污染源的分数越高代表其更可疑;
作为优选,对于与河流水污染无关类型的投诉举报信息,不考虑周 边河流情况;采用距离指标、行业类型一致性指标和历史违规次数指标,各 指标参考的内容均具有可信度;由于与河流无关,污染扩散能力并不大,取 距离指标分数权重更大为40分,其他两项指标各30分;找到所有在圆形的 待排查区域内的污染源,各指标分数计算流程如图4所示,逐个进行多要素 分析:
(2)若该污染源行业类型与权利要求4所述方法计算出的举报对 象所属行业类型一致,行业类型一致性指标分数(B)为30,否则为0;
(3)根据三年内该污染源的历史违规记录,查询其违规次数(n), 历史违规次数指标分数(C)的计算公式为C=n×6,n大于等于5时C取30;
(4)各个污染源可疑程度的量化分数=A+B+C,为距离指标分数、 类型一致性指标分数和历史违规次数指标分数的和,最高100分,某个污染 源的分数越高代表其更可疑。
作为优选,水环境管理平台界面具体包括两个界面,举报发起位置, 对应的待排查区域,区域内污染源位置,这些信息将展示在地图上。
本公开的有益效果为:本发明提供了一种基于多要素分析定位水污 染源的方法,实现丰富利用水环境监测平台的各项数据,分析得到可疑污染 源的分布情况和它们对应的可疑程度量化分数,为水污染投诉举报事件的处 理提供了方便。
附图说明:
图1是举报类型分类流程图。
图2是举报对象所属行业分类流程图。
图3是与河流水污染相关投诉事件的多要素分析流程图。
图4是与河流水污染无关投诉事件的多要素分析流程图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细说明。
实施例1:投诉举报内容:“【网民留言】xx园区企业污染,至数万群 众身体健康于不顾,盗采地下水,向地下排放污水。多次向xx管委会反映得 不到解决,希望xx执法人员能查处污染企业,重新规划我的的生活区或者关 闭化工园区,还老百姓一个碧水蓝天。)”。投诉举报发起位置:北纬3x度, 东经11x度。对投诉举报文本内容运行语义分析算法,得出是与河流水质无 关的举报,故定位到举报发出的位置在该位置周围划定圆形待排查区域,对域内各污染源进行未结合水质的多要素关联分析。
通过对举报信息中举报对象所属行业分类,得到污染类型为“化学 原料和化学制品制造业”,对于周围10千米半径内的污染源,逐个进行多要 素关联分析:
企业1,xxx焦化工有限公司,距离3.825千米(距离指标分数为 24.700分),类型“化学原料和化学制品制造业”与举报类型一致(类型一致性 指标分数为30.000分),三年内该污染源的历史违规0次(历史违规次数指标 分数为0.000分),总分54.700分。
企业2,xxx隆化工有限公司,距离0.519千米(距离指标分数为 37.924分),类型“化学原料和化学制品制造业”与举报类型一致(类型一致性 指标分数为30.000分),三年内该污染源的历史违规1次(历史违规次数指标 分数为6.000分),总分73.924分。
企业3,xxx装备有限公司,距离1.300千米(距离指标分数为34.800 分),类型“金属制品业”与举报类型不一致(类型一致性指标分数为0.00分), 三年内该污染源的历史违规0次(历史违规次数指标分数为0.00分),总分 34.800分。
企业4,xxx远化工有限公司,距离3.931千米(距离指标分数为 24.276分),类型“化学原料和化学制品制造业”与举报类型一致(类型一致性 指标分数为30.00分),三年内该污染源的历史违规4次(历史违规次数指标 分数为24.00分),总分78.276分。
整理分析结果如下表:
通过可疑程度量化分数的排名,执法人员可更快确定需要检查走访 的污染源名单,经比对,与人工判断结果一致。
水环境管理平台界面展示分两部分,举报发起位置,对应的待排查 区域,区域内污染源位置,这些信息将展示在地图上;各个污染源的名称, 历史违规信息、所属行业、下游水质情况和总分数,这些信息将展示在图表 中。
实施例2
投诉举报内容:“xx市xx县xx镇xx村村北有一条河流存在恶臭, 有垃圾漂浮”。
投诉举报位置:经度3x度,纬度11x度。
对投诉举报文本内容运行语义分析算法,得出是与河流水质相关的 举报,需要沿河流两岸进行排查。
通过对举报信息中举报对象所属行业分类,得到污染类型为“公共 设施管理业”。
在ArcMap中制作地图,将地图作为服务发布到ArcGIS Server站 点上,通过网址来查询服务。找到距离最近的河流水流速0.347m/s,一天巡 检河流三次,划定其待排查区域以距离举报位置最近的河岸位置开始,沿河 上游方向X=10千米,向两岸各拓宽5千米;对域内各污染源进行结合水质的 多要素关联分析。
企业1,xxx垃圾填埋有限公司,找出该污染源距离最近的河岸位 置和举报位置距离最近的河岸位置,取两位置沿河流的距离为9.302千米,污 染源距最近的河岸位置1.162千米(距离指标分数为1.340分),类型“公共设 施管理业”与举报类型一致(类型一致性指标分数为25.000分),三年内该污 染源的历史违规5次(历史违规次数指标分数为25.000分),对应下游监测站 点-xx桥水质监测站,举报创建日期2018/11/xx时间18:59:01,xx桥水质监测 站前一周水质最差情况为劣五类(水质情况指标25.000分),总分76.340分。
企业2,xxx电源科技有限公司,找出该污染源距离最近的河岸位 置和举报位置距离最近的河岸位置,取两位置沿河流的距离为4.981千米,污 染源距最近的河岸位置2.232千米(距离指标分数为6.946分),类型“计算机、 通信和其他电子设备制造业”与举报类型不一致(类型一致性指标分数为0.000 分),三年内该污染源的历史违规2次(历史违规次数指标分数为10.000分), 对应下游监测站点-xx桥水质监测站,举报创建日期2018/11/xx时间18:59:01, xx桥水质监测站前一周水质最差情况为劣五类(水质情况指标25.000分),总分41.946分。
企业3,xxx区污水处理厂,找出该污染源距离最近的河岸位置和 举报位置距离最近的河岸位置,取两位置沿河流的距离为3.650千米,污染源 距最近的河岸位置1.327千米(距离指标分数为11.662分),类型“水的生产和 供应业”与举报类型不一致(类型一致性指标分数为0.00分),三年内该污染 源的历史违规0次(历史违规次数指标分数为0.00分),对应下游监测站点-xx 桥水质监测站,举报创建日期2018/11/xx时间18:59:01,xx桥水质监测站前 一周水质最差情况为劣五类水质情况指标25.00分),总分36.662分。
整理分析结果如下表:
通过可疑程度量化分数的排名,执法人员可更快确定需要检查走访 的污染源名单,经比对,与人工判断结果一致。
水环境管理平台界面展示分两部分,举报发起位置,对应的待排查 区域,区域内污染源位置,这些信息将展示在地图上;各个污染源的名称, 历史违规信息、所属行业、下游水质情况和总分数,这些信息将展示在图表 中。
Claims (9)
1.一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法,其特征在于,包括以下步骤:
步骤1,收到举报信息:水环境管理平台收到水污染相关投诉举报,提出水污染源溯源定位请求;
步骤2,提取数据:通过对举报信息进行语义分类,得到举报类型和举报对象所属行业,结合举报发起的地理位置,划定待排查区域,从水环境管理平台数据库提取所需数据;
步骤3,溯源定位:将多种数据进行多要素分析,对待排查区域内的污染源逐个排查,得到各污染源的可疑程度的量化分数;
步骤4,结果展示:整理最可疑的几个污染源地理位置情况,详细信息与其对应的可疑分数情况,整理该次举报分析结果,供水环境管理平台界面展示。
2.根据权利要求1所述方法,其特征在于,所述步骤1中收到的投诉举报信息包括水环境相关投诉事件发起的地理位置,发起时间与具体的投诉文本内容。
3.根据权利要求1所述方法,其特征在于,所述步骤2需对举报信息的举报类型分类,包括以下步骤:
步骤3.1,对历史投诉举报信息进行人工分类,分为与河流水污染相关类型和与河流水污染无关的两类;
步骤3.2,对于历史举报信息,应用词袋模型统计文本词频,该词袋模型不考虑词法和语序,将所有词语装进一个袋子,每个举报信息都有其对应的词频向量,得到词袋模型的目的是用于从文本中提取特征;
步骤3.3,删除词袋模型中的常用停用词,结合每个举报信息的类型,利用基于朴素贝叶斯的文本分类算法,训练分类器;
步骤3.4,每当收到新的举报信息,利用朴素贝叶斯算法分类器进行分类,得到其对应的举报类型。
4.根据权利要求1所述方法,其特征在于,所述步骤2需对举报信息中举报对象所属行业分类,包括以下步骤:
步骤4.1,根据中华人民共和国生态环境部颁布的固定污染源排污许可分类管理名录,根据历史投诉举报信息中描述的污染情况,对可能产生该污染情况的行业进行标注,即人工分类历史举报数据,细分为固定污染源排污许可分类管理名录中的33类行业;
步骤4.2,对于已标注的举报信息,应用词频-逆向文件频率(TF-IDF)算法进行关键词提取,词频(TF)表示的就是在一篇文档中某个词条出现的次数,逆向文件频率(IDF)反映了某个词条的类别区分能力,TF-IDF实际上就是TF乘以IDF,利用该算法帮助过滤掉常见的词语,保留重要的词语;
步骤4.3,长短时记忆神经网络LSTM用来对自然语言建模,利用标注好的33类历史举报信息作为训练集,构建LSTM模型;
步骤4.4,每当收到新的举报信息,利用LSTM模型进行分类,得到其对应的举报类型。
5.根据权利要求1所述方法,其特征在于,所述步骤3的待排查区域划定方法如下:
类型5.1,对与河流水污染相关类型的投诉举报信息,偷排漏拍的情况下往往出现在河流两岸,划定其待排查区域以距离举报位置最近的河岸位置开始,沿河流上游方向X千米,偷排的污染源距离河流不会太远,两岸各展开5千米的带状区域;X的大小与不同河流断面面积M及水流量情况有关;流量等于流速V,与过水断面面积的乘积,即Q=V×M,若河流管理人员每天巡检y次,按污染为难溶物质且随水漂浮,X取污染位置与污染源头可能的最大距离,推算出
类型5.2,对于与河流水污染无关类型的投诉举报信息,这类污染往往是小水坑或排污管道等引起的,出现在举报发起位置周围;故划定其待排查区域为圆形区域,圆心为举报位置,半径为10千米。
6.根据权利要求1所述方法,其特征在于,所述步骤2需提取的数据包括区域内污染源名录和各个污染源的行业类型,地理位置和历史违规记录,各河流地理信息,各水质监测站的地理位置,水质情况及对应时间。
7.根据权利要求1所述方法,其特征在于,所述步骤3多要素分析方法,用于得到各污染源可疑程度的量化分数,影响分数的有距离指标、行业类型一致性指标、历史违规次数指标和周边水质情况指标。
8.根据权利要求1所述方法,对于不同类型的投诉举报信息,使用不同的多要素分析指标:
类型8.1,对与河流水污染相关的投诉举报信息,采用距离指标、行业类型一致性指标、历史违规次数指标和周边水质情况指标,各指标参考的内容均具有可信度,权重相同;在带状待排查区域找到所有域内的污染源,逐个进行多要素分析:
步骤8.1.2,若该污染源行业类型与权利要求4所述方法计算出的举报对象所属行业类型一致,取行业类型一致性指标分数(B)为25,否则为0;
步骤8.1.3,根据三年内该污染源的历史违规记录,查询其违规次数(n),历史违规次数指标分数(C)的计算公式为C=n×5,n大于等于5时取C取25;
步骤8.1.4,根据举报位置找到距离最近的河岸位置,查询其下游距离最近的水质监测站在一周内的水质情况,结合生态环境部颁布的地表水环境质量标准将水质情况分为Ⅰ类、Ⅱ类水质、Ⅲ类水质、Ⅳ类水质、Ⅴ类水质、劣Ⅴ类水共六类,找出一周内该站点最差的水质类型,六类水质对应水质情况指标分数D分别取0、5、10、15、20和25;
步骤8.1.5,各个污染源可疑程度的量化分数=A+B+C+D,为距离指标分数、类型一致性指标分数、历史违规次数指标分数和水质情况指标分数的和,最高100分,某个污染源的分数越高代表其更可疑;
类型8.2,对于与河流水污染无关类型的投诉举报信息,不考虑周边河流情况;采用距离指标、行业类型一致性指标和历史违规次数指标,各指标参考的内容均具有可信度;由于与河流无关,污染扩散能力并不大,取距离指标分数权重更大为40分,其他两项指标各30分;找到所有在圆形的待排查区域内的污染源,逐个进行多要素分析:
步骤8.2.2,若该污染源行业类型与权利要求4所述方法计算出的举报对象所属行业类型一致,行业类型一致性指标分数B为30,否则为0;
步骤8.2.3,根据三年内该污染源的历史违规记录,查询其违规次数(n),历史违规次数指标分数(C)的计算公式为C=n*6,n大于等于5时取C为30;
步骤8.2.4,各个污染源可疑程度的量化分数=A+B+C,为距离指标分数、类型一致性指标分数和历史违规次数指标分数的和,最高100分,某个污染源的分数越高代表其更可疑。
9.根据权利要求1所述方法,其特征在于,所述步骤4水环境管理平台界面具体包括两部分:
部分7.1,该举报发起位置,对应的待排查区域,区域内污染源位置,将这些信息展示在地图上;
部分7.2,各个污染源的名称,历史违规次数、所属行业、下游水质情况和量化总分数,将这些信息展示在图表中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110114485.7A CN112925863A (zh) | 2021-01-25 | 2021-01-25 | 一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110114485.7A CN112925863A (zh) | 2021-01-25 | 2021-01-25 | 一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112925863A true CN112925863A (zh) | 2021-06-08 |
Family
ID=76167352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110114485.7A Pending CN112925863A (zh) | 2021-01-25 | 2021-01-25 | 一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112925863A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065198A (zh) * | 2012-12-17 | 2013-04-24 | 天津市环境保护科学研究院 | 大气恶臭污染精细源解析方法 |
CN103929758A (zh) * | 2014-04-17 | 2014-07-16 | 杭州东方通信软件技术有限公司 | 故障信息处理方法 |
CN108416616A (zh) * | 2018-02-05 | 2018-08-17 | 阿里巴巴集团控股有限公司 | 投诉举报类别的排序方法和装置 |
CN108760912A (zh) * | 2018-05-21 | 2018-11-06 | 天津市环境保护科学研究院 | 一种基于恶臭指纹图谱的恶臭污染溯源方法及应用 |
CN109583743A (zh) * | 2018-11-26 | 2019-04-05 | 南京创蓝科技有限公司 | 基于拉格朗日模型和移动观测平台的大气污染溯源方法 |
CN109886830A (zh) * | 2019-01-02 | 2019-06-14 | 同济大学 | 一种基于用户投诉信息的供水管网污染源追踪定位方法 |
-
2021
- 2021-01-25 CN CN202110114485.7A patent/CN112925863A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065198A (zh) * | 2012-12-17 | 2013-04-24 | 天津市环境保护科学研究院 | 大气恶臭污染精细源解析方法 |
CN103929758A (zh) * | 2014-04-17 | 2014-07-16 | 杭州东方通信软件技术有限公司 | 故障信息处理方法 |
CN108416616A (zh) * | 2018-02-05 | 2018-08-17 | 阿里巴巴集团控股有限公司 | 投诉举报类别的排序方法和装置 |
CN108760912A (zh) * | 2018-05-21 | 2018-11-06 | 天津市环境保护科学研究院 | 一种基于恶臭指纹图谱的恶臭污染溯源方法及应用 |
CN109583743A (zh) * | 2018-11-26 | 2019-04-05 | 南京创蓝科技有限公司 | 基于拉格朗日模型和移动观测平台的大气污染溯源方法 |
CN109886830A (zh) * | 2019-01-02 | 2019-06-14 | 同济大学 | 一种基于用户投诉信息的供水管网污染源追踪定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021174751A1 (zh) | 基于大数据的污染源定位方法、装置、设备及存储介质 | |
Boudet et al. | The effect of geographic proximity to unconventional oil and gas development on public support for hydraulic fracturing | |
CN114399210B (zh) | 一种地质灾害应急管理与决策系统、方法及可读存储介质 | |
CN112085241B (zh) | 一种基于机器学习的环境大数据分析和决策平台 | |
CN113313387B (zh) | 一种企业重大安全风险分级智能化管控方法及系统 | |
CN103116825B (zh) | 智慧城市管理系统 | |
CN104850963A (zh) | 一种流域突发水污染事件预警及应急处置方法和系统 | |
CN112288247B (zh) | 一种基于空间交互关系的土壤重金属风险识别方法 | |
Tan et al. | Damage classification and recovery analysis of the Chongqing, China, floods of August 2020 based on social-media data | |
CN104346425A (zh) | 一种层次化的互联网舆情指标体系的方法及系统 | |
CN112446549A (zh) | 基于大数据的城市垃圾智慧监管平台 | |
Farooqi et al. | Global progress in climate change and biodiversity conservation research | |
Lucendo-Monedero et al. | Predictive model for areas with illegal landfills using logistic regression | |
Lei et al. | Emergency monitoring and disposal decision support system for sudden pollution accidents based on multimedia information system | |
Zhou et al. | Bibliometric analysis of research progress on karst groundwater pollution | |
CN113449120B (zh) | 一种结合空间信息的管线安全综合监管方法 | |
Wu et al. | Mining typhoon victim information based on multi-source data fusion using social media data in China: a case study of the 2019 Super Typhoon Lekima | |
Lim | Patterns in environmental priorities revealed through government open data portals | |
Gao et al. | Understanding the patterns and characteristics of Natech events in China | |
CN114580494A (zh) | 基于随机森林算法的依据企业用电对排污行为的监测方法 | |
Manservisi et al. | Environmental complaint insights through text mining based on the driver, pressure, state, impact, and response (DPSIR) framework: Evidence from an Italian environmental agency | |
Cui et al. | An attempt to grasp the disaster situation of “the 2018 Hokkaido eastern iburi earthquake” using SNS information | |
Elvas et al. | Data fusion and visualization towards city disaster management: Lisbon case study | |
CN112925863A (zh) | 一种面向水环境管理平台的基于多要素分析的水污染溯源定位方法 | |
Shohan et al. | Crime Prediction using Machine Learning with a Novel Crime Dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |