CN113570149B - 一种居民居住地距离矿区的安全距离确定方法及系统 - Google Patents
一种居民居住地距离矿区的安全距离确定方法及系统 Download PDFInfo
- Publication number
- CN113570149B CN113570149B CN202110883758.4A CN202110883758A CN113570149B CN 113570149 B CN113570149 B CN 113570149B CN 202110883758 A CN202110883758 A CN 202110883758A CN 113570149 B CN113570149 B CN 113570149B
- Authority
- CN
- China
- Prior art keywords
- data
- cancer
- spatial
- sample points
- mortality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005065 mining Methods 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 72
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 147
- 201000011510 cancer Diseases 0.000 claims abstract description 147
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims abstract description 83
- 230000034994 death Effects 0.000 claims abstract description 83
- 231100000517 death Toxicity 0.000 claims abstract description 83
- 201000005202 lung cancer Diseases 0.000 claims abstract description 83
- 208000020816 lung neoplasm Diseases 0.000 claims abstract description 83
- 238000011160 research Methods 0.000 claims abstract description 65
- 238000009499 grossing Methods 0.000 claims abstract description 51
- 238000009826 distribution Methods 0.000 claims abstract description 50
- 238000004458 analytical method Methods 0.000 claims abstract description 46
- 238000004140 cleaning Methods 0.000 claims abstract description 23
- 230000002776 aggregation Effects 0.000 claims abstract description 22
- 238000004220 aggregation Methods 0.000 claims abstract description 22
- 229910001385 heavy metal Inorganic materials 0.000 claims description 22
- 229910052751 metal Inorganic materials 0.000 claims description 20
- 239000002184 metal Substances 0.000 claims description 20
- 239000002689 soil Substances 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 238000003723 Smelting Methods 0.000 claims description 9
- 229910052804 chromium Inorganic materials 0.000 claims description 8
- 238000001556 precipitation Methods 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims description 7
- 239000000383 hazardous chemical Substances 0.000 claims description 7
- 229910052759 nickel Inorganic materials 0.000 claims description 6
- 238000011835 investigation Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000008602 contraction Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 239000011651 chromium Substances 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000011707 mineral Substances 0.000 description 4
- 230000002265 prevention Effects 0.000 description 4
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 3
- 235000017491 Bambusa tulda Nutrition 0.000 description 3
- 241001330002 Bambuseae Species 0.000 description 3
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 3
- 239000011425 bamboo Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012732 spatial analysis Methods 0.000 description 3
- 235000011511 Diospyros Nutrition 0.000 description 2
- 244000236655 Diospyros kaki Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000208140 Acer Species 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 1
- 235000019738 Limestone Nutrition 0.000 description 1
- 241000269799 Perca fluviatilis Species 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000009519 fu-yuan Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000003041 laboratory chemical Substances 0.000 description 1
- JQJCSZOEVBFDKO-UHFFFAOYSA-N lead zinc Chemical compound [Zn].[Pb] JQJCSZOEVBFDKO-UHFFFAOYSA-N 0.000 description 1
- 239000006028 limestone Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- NUJOXMJBOLGQSY-UHFFFAOYSA-N manganese dioxide Inorganic materials O=[Mn]=O NUJOXMJBOLGQSY-UHFFFAOYSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000005211 surface analysis Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- JFALSRSLKYAFGM-UHFFFAOYSA-N uranium(0) Chemical compound [U] JFALSRSLKYAFGM-UHFFFAOYSA-N 0.000 description 1
- 239000002912 waste gas Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000002351 wastewater Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/043—Optimisation of two dimensional placement, e.g. cutting of clothes or wood
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种居民居住地距离矿区的安全距离确定方法及系统。该方法包括对多源数据进行数据清洗;并确定不同样本点内癌症死亡率;对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析;当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率计算不同距离下癌症死亡的相对危险度;根据相对危险度确定居民居住地距离研究区域的安全距离。本发明能够根据矿区周边肺癌的空间分布规律确定居民居住地距离矿区的安全距离。
Description
技术领域
本发明属于空间信息科学、地理科学、环境科学、医学交叉领域,涉及空间分析技术、空间插值分析方法及平滑技术、医学空间统计技术、综合数据处理技术等,特别是涉及一种居民居住地距离矿区的安全距离确定方法及系统。
背景技术
着社会经济的发展,矿产资源被不断开发,在人们生活水平逐步提升的同时,也带来了许多环境问题。作为地壳的自然组成成分,重金属通常以较低浓度存在于自然界中。但受频繁的矿业活动影响,环境中重金属浓度逐渐增多,矿区周围重金属污染已成为一项严重的全球性环境问题。金属矿区在开采开发过程中,会产生废渣、废气和废水,其中含有的有毒物质不仅会直接对矿工产生影响,还可能会进一步通过沉积、沉降、搬运等方式从矿区转移,严重影响当地环境。环境中的重金属等有害物质也可集中土壤、水源、甚至在生物体内,通过食物链进一步威胁人类健康。
目前,已有学者从统计学角度出发,研究发现采矿厂、炼油厂造成的重金属污染和辐射会增加周围居民肺癌的死亡风险。例如,采用泊松回归、相关分析和逐步回归模型拟合矿业开采、累积辐射暴露量与肺癌死亡率间关系,发现矿业生产使得周边居民暴露于致癌物风险增大。也有学者从病理学角度出发,通过临床试验与队列对照研究方法,分析矿区周边重金属及其他污染物暴露与居民肺癌发病或死亡之间的关系。研究结果显示,由于矿山开采造成的铀暴露和土壤铬、铜污染与肺癌之间存在最显著的正剂量反应关系,污染水平与社区人群肺癌死亡风险成正相关关系。另外,加拿大学者还通过队列研究建立了Rn暴露累积效应与肺癌组织学结构间的关系,丰富了肺癌病理学研究成果。这些研究虽都证实了矿区与周边居民肺癌死亡之间具有明显的关系,但多是停留在对人群抽样调查数据进行研究,未能对矿区与周边全人群肺癌死亡率的空间相关关系进行探讨,也未能得出有效保障矿区周边居民健康的安全距离。究其原因,未能从空间的角度出发,借鉴空间分析的理念和思想,应用空间分析技术进行分析。
随着多学科交叉融合,近20年来,GIS(Geographic Information System)技术凭借其强大的空间数据管理与分析优势,已由简单的基础医疗设施空间位置显示逐渐应用到癌症研究各个方面,不仅可实现癌症时空分布规律分析,还可有效揭示癌症与外源性影响因素(如,地形、气象、植被覆盖、社会经济等因素)间的关联特征,为癌症空间流行病学研究的开展提供强有力的方法与技术支撑。
但是,如何根据矿区周边肺癌的空间分布规律指导高危地区的肺癌防控及统筹区内矿业发展是亟待解决的技术难题。
发明内容
本发明的目的是提供一种居民居住地距离矿区的安全距离确定方法及系统,能够根据矿区周边肺癌的空间分布规律确定居民居住地距离矿区的安全距离,进而加强高危地区肺癌的防控工作和区内矿业发展的协调统一。
为实现上述目的,本发明提供了如下方案:
一种居民居住地距离矿区的安全距离确定方法,包括:
获取研究区域内多源数据;所述多源数据包括:不同样本点内癌症数据、人口数据、基础地理数据、植被覆盖度数据、大气污染数据、气象数据、土壤重金属含量数据、矿业分布数据、国内生产总值栅格数据;所述基础地理数据包括:行政区划数据、道路数据、河流数据以及地形数据;所述气象数据包括:年均气温、年均降水、年均气压和年均相对湿度;土壤重金属包括:Cd、Ni、As、Pb、Mn、以及Cr;所述矿业分布数据包括:矿山企业、尾矿库、采石场、金属冶炼企业和危化品企业分布的矢量数据;
对所述多源数据进行数据清洗;并根据清洗后的不同样本点内癌症数据与清洗后的人口数据计算不同样本点内癌症死亡率;
对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性;
当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;
对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度;
根据相对危险度确定居民居住地距离研究区域的安全距离。
可选地,所述对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理,具体包括:
利用公式rLBS(ui)=λ(ui)z(ui)+[1-λ(ui)]m*(ui)对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
其中,λ(ui)为收缩因子,m*(ui)是邻域样本点范围内人口加权平均死亡率,s2是邻域样本点范围内人口加权的样本点死亡率的方差,ui指i个样本点,/>是邻域样本点范围内的平均人口数。
可选地,所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性,具体包括:
利用公式确定癌症死亡率在研究区内的空间自相关性;
其中,I为癌症死亡率在研究区内的空间自相关性,I的取值范围为-1~1,当I>0且p<0.05时,p为结果可信程度的一个检验指标,癌症死亡率在研究区内具有正空间自相关性,即空间自相关性表示为聚集性,当I<0且p<0.05时,癌症死亡率在研究区内具有负空间自相关性,即空间自相关性表示为无聚集性,当I=0时,癌症死亡率在研究区内呈现空间随机分布。
可选地,所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性,之后还包括:
对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行热点分析。
可选地,所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行热点分析,具体包括:
利用公式确定癌症死亡率在空间上发生聚类的位置;
其中,s为所有死亡率的标准差,xj是要素j的属性值,Wij是要素i和j之间的空间权重,n为要素总数,且/>统计量是Z得分;当Z得分为正时,Z得分越高,高值的聚类就越紧密,该样本点为热点区域;当Z得分为负时,Z得分越低,低值的聚类就越紧密,该样本点为冷点区域;Z得分接近于0时,说明癌症死亡率在样本点周围没有聚类的情况,呈现随机分布。
可选地,所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性,之后还包括:
利用Spearman相关系数公式分析癌症死亡率与数据清洗后的多源数据之间的关系,确定癌症死亡率的关键因素数据。
可选地,所述当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析,具体包括:
利用多种空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析,得到相应的插值结果;
对所有的插值结果进行交叉验证确定最优差值方法;
利用最优差值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析。
可选地,所述对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度,具体包括:
利用公式确定相对危险度;
其中,EER表示暴露于样本一定距离缓冲区范围内的区域5年内累积肺癌死亡率,CER表示缓冲区范围外区域5年内累积肺癌死亡率,RR值越大,表明暴露的效应越大,暴露与发病/死亡的关联强度越大。
一种居民居住地距离矿区的安全距离确定系统法,包括:
多源数据获取模块,用于获取研究区域内多源数据;所述多源数据包括:不同样本点内癌症数据、人口数据、基础地理数据、植被覆盖度数据、大气污染数据、气象数据、土壤重金属含量数据、矿业分布数据、国内生产总值栅格数据;所述基础地理数据包括:行政区划数据、道路数据、河流数据以及地形数据;所述气象数据包括:年均气温、年均降水、年均气压和年均相对湿度;土壤重金属包括:Cd、Ni、As、Pb、Mn、以及Cr;所述矿业分布数据包括:矿山企业、尾矿库、采石场、金属冶炼企业和危化品企业分布的矢量数据;
癌症死亡率确定模块,用于对所述多源数据进行数据清洗;并根据清洗后的不同样本点内癌症数据与清洗后的人口数据计算不同样本点内癌症死亡率;
空间经验贝叶斯平滑处理模块,用于对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
空间自相关性确定模块,用于对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性;
插值分析模块,用于当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;
相对危险度确定模块,用于对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度;
安全距离确定模块,用于根据相对危险度确定居民居住地距离研究区域的安全距离。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种居民居住地距离矿区的安全距离确定方法及系统,根据多源数据耦合癌症数据,对研究区域不同样本点的癌症死亡率进行空间分析,确定癌症死亡的空间分布特征,并定量分析研究区域对癌症死亡风险的空间影响范围,找到居民生活的安全距离。确定了居民生活的安全距离,无论对当地政府的疾病预防控制(例如对安全距离范围内的人群进行重点监控),还是对于矿山开采、运输等矿业活动(例如对安全距离范围内的矿业活动的规模和频次都可以具体规划和限制等)规范指导都具有重要意义。而现有技术中仅仅探讨生态风险(主要指生态环境)的风险距离,几乎没有涉及到健康风险(主要指人群的健康生活)的安全距离。本发明避免了现有技术弊端,根据确定的安全距离的方法,指导矿区周边的居民的居住选择,有助于环保部门、卫生部门和当地政府的管理和服务。进而根据探索矿区周边肺癌的空间分布规律,进一步加强高危地区肺癌的防控工作和区内矿业发展的协调统一。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种居民居住地距离矿区的安全距离确定方法流程示意图;
图2为本发明所提供的技术路线图;
图3为本发明所提供的实施例中研究区域的概况示意图;
图4为本发明所提供的实施例中2012~2016年肺癌死亡率空间趋势分析示意图;
图5为本发明所提供的实施例中肺癌死亡率Moran’s I散点图;
图6为本发明所提供的实施例中2012~2016年苏仙区肺癌死亡率空间分布图;
图7为本发明所提供的实施例中2012~2016年肺癌死亡率热点区域分布图;
图8为本发明所提供的实施例中不同类别样本点周边不同距离下肺癌死亡相对危险度示意图;
图9为本发明所提供的一种居民居住地距离矿区的安全距离确定系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种居民居住地距离矿区的安全距离确定方法及系统,能够根据矿区周边肺癌的空间分布规律确定居民居住地距离矿区的安全距离,进而加强高危地区肺癌的防控工作和区内矿业发展的协调统一。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明所提供的一种居民居住地距离矿区的安全距离确定方法流程示意图,图2为本发明所提供的技术路线图,如图1和图2所示,本发明所提供的一种居民居住地距离矿区的安全距离确定方法,包括:
S101,获取研究区域内多源数据;所述多源数据包括:不同样本点内癌症数据、人口数据、基础地理数据、植被覆盖度数据、大气污染数据、气象数据、土壤重金属含量数据、矿业分布数据、国内生产总值栅格数据;所述基础地理数据包括:行政区划数据、道路数据、河流数据以及地形数据;所述气象数据包括:年均气温、年均降水、年均气压和年均相对湿度;土壤重金属包括:Cd、Ni、As、Pb、Mn、以及Cr;所述矿业分布数据包括:矿山企业、尾矿库、采石场、金属冶炼企业和危化品企业分布的矢量数据;
S102,对所述多源数据进行数据清洗;并根据清洗后的不同样本点内癌症数据与清洗后的人口数据计算不同样本点内癌症死亡率;癌症数据进行ICD10编码,并开展数据查重与逻辑错误校验等数据清理工作。
其中,癌症死亡率=(某时间内癌症死亡总人数/同期平均总人口数)×100000/10万。
S103,对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;将区域内过大或过小的死亡率拉向邻近区域的局部平均水平,获得整个研究区内更为连续、稳定和平滑的率,使得估计的死亡率更接近真实的空间分布情况。
S103利用公式rLBS(ui)=λ(ui)z(ui)+[1-λ(ui)]m*(ui)对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
其中,λ(ui)为收缩因子,m*(ui)是邻域样本点范围内人口加权平均死亡率,s2是邻域样本点范围内人口加权的样本点死亡率的方差,ui指i个样本点,/>是邻域样本点范围内的平均人口数。
S104,对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性;
S104具体包括:
利用公式确定癌症死亡率在研究区内的空间自相关性;
其中,I为癌症死亡率在研究区内的空间自相关性,I的取值范围为-1~1,当I>0且p<0.05时,p为结果可信程度的一个检验指标,癌症死亡率在研究区内具有正空间自相关性,即空间自相关性表示为聚集性,当I<0且p<0.05时,癌症死亡率在研究区内具有负空间自相关性,即空间自相关性表示为无聚集性,当I=0时,癌症死亡率在研究区内呈现空间随机分布。
S104之后还包括:
对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行热点分析。
利用公式确定癌症死亡率在空间上发生聚类的位置;
其中,s为所有死亡率的标准差,xj是要素j的属性值,Wij是要素i和j之间的空间权重,n为要素总数,且Gi *统计量是Z得分;当Z得分为正时,Z得分越高,高值的聚类就越紧密,该样本点为热点区域;当Z得分为负时,Z得分越低,低值的聚类就越紧密,该样本点为冷点区域;Z得分接近于0时,说明癌症死亡率在样本点周围没有聚类的情况,呈现随机分布。
S104之后还包括:
利用Spearman相关系数公式分析癌症死亡率与数据清洗后的多源数据之间的关系,确定癌症死亡率的关键因素数据。即利用Spearman相关系数公式分析步骤3所得的肺癌死亡率与到道路距离、到矿点距离、人口密度、国内生产总值、程、坡度、到河流距离、年均气温、年均降水、年均气压、年均相对湿度、植被覆盖度、PM2.5和重金属Cd、Ni、As、Pb、Mn、Cr的分布等影响因素之间的关系,进行关键因素数据的筛选。具体公式为:
其中,rs为变量间的Spearman相关系数,di为每对观察值的等级差数,n为调查点数。
S105,当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;
S105具体包括:
利用多种空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析,得到相应的插值结果;
具体的,选择三类常用于癌症死亡率的空间插值方法,上述癌症死亡率进行肺癌死亡率空间插值方法比选:一类是仅考虑空间自相关性的空间插值方法,包括IDW、TSA和OK插值方法;第二类是仅考虑关键因素数据的MLR插值法;第三类是同时考虑空间自相关性和关键因素数据的CK插值法。
(1)反距离加权法(Inverse Distance Weighted,IDW)
IDW插值是一种简单、常用的空间内插方法。它假设每个采样点的局部影响随距离的增大而减小,因此,采样点对预测值的影响为各向同性的。该方法依据样本点和预测点间的距离计算权重进行加权平均,到预测点距离越近的样本点被赋的权重越大。计算公式为:
其中,Z*(x0)是预测点x0处的死亡率预测值;n为周围样本点数目;Z(xi)为样本点xi处的死亡率真实值;wi为样点xi的权重;di是预测点与样本点间的距离;p为距离的幂值,幂值大小可能影响生成表面的详细程度。
(2)趋势面分析法(Trend-surface Analysis,TSA)
TSA法是一种根据研究区有限观测数据与地理坐标建立关系,拟合平滑的数学曲面方程,从而对预测点处数据进行内插的方法。计算公式为:
zi(xi,yi)=f(xi,yi)+ei;
其中,(xi,yi)为各样本点的坐标,zi(xi,yi)表示肺癌死亡率的真实值,f(xi,yi)为趋势面拟合值,ei为剩余值(即残差)。
(3)普通克里金法(Ordinary Kriging Interpolation,OK)
OK法以变异函数理论与结构分析为基础,以空间自相关性为前提,根据样本点和预测点间距及预测点临近样本点的空间关系拟合模型确定权重,对预测点的取值进行无偏最优估计。该方法的计算公式和半变异函数为:
其中,Z*(x)是预测点x处的死亡率预测值,z(xi)是样本点xi处的死亡率真实值,λi为权重,n代表样点数;γ(h)是半变异函数值,N(h)是距离为h时的点对数,z(xi)和z(xi+h)分别代表xi和xi+h处的已知死亡率值。
(4)多元线性回归法(Multiple Linear Regression,MLR)
MLR法基于最小二乘原理,将影响肺癌死亡率的多个因素作为自变量进行多元回归分析,以构建估计肺癌死亡率的插值模型,后将影响因素数据集带入模型,获得肺癌死亡率的插值结果。MLR遵循多元回归方法的基本条件,将自变量的显著性和共线性问题都考虑在内,计算公式为:
Y=Xβ+ε;
其中Y为预测点死亡率的预测值,X为n×k的影响因素矩阵,β为各影响因素的参数值,ε为常数项。
(5)协同克里金法(Collocating Kriging,CK)
CK法是在OK法的基础上进行了扩展,以协同区域化变量理论为基础,将区域化变量的最佳估计方法从单变量发展到多变量,通过建立变异函数模型与趋势剔除,将主变量的自相关性和协变量(与主变量间存在相互关系的一个或多个相应的辅助变量)的交叉相关性结合起来,实现预测点数据的无偏最优估计,计算公式为:
其中,Z*(x0)为预测点x0处的主变量肺癌死亡率预测值,Z(xi)和Z(xj)分别为x0处的肺癌死亡率真实值和引入的协变量值,μi和μj分别为分配给主变量xi和协变量xj的权重,且Σμi=1,Σμj=0;n、m分别为主变量和协变量的实测数目。
对所有的插值结果进行交叉验证确定最优差值方法;
将平均误差(Mean Error,ME)、平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)作为精度评估的重要指标;
式中,n为样本点数,z(xi)与z*(xi)分别为xi处肺癌死亡率的真实值与预测值。
利用最优差值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析。
S106,对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度;
S106具体包括:
利用公式确定相对危险度;
其中,EER表示暴露于样本一定距离缓冲区范围内的区域5年内累积肺癌死亡率,CER表示缓冲区范围外区域5年内累积肺癌死亡率,RR值越大,表明暴露的效应越大,暴露与发病/死亡的关联强度越大。
利用确定相对危险度变化;95%CI为RR值的95%置信区间。
S107,根据相对危险度确定居民居住地距离研究区域的安全距离。
以湖南省郴州市苏仙区为具体的实施例进行说明,如图3所示,研究区为享誉世界的“有色金属之乡”(25°30′38″~25°00′19″N,112°16′41″~112°53′23″E),该地区属亚热带湿润季风气候,以东南高西北低的丘陵地形为主,包括白露塘、卜里坪、栖凤渡等14个乡镇和街道,总面积达1329.1km2,居住人口约有37万人。苏仙区依托于西河流域丰富的矿产资源,采矿历史悠久、矿业类型丰富。区内有金属矿、煤矿、石灰石矿等相关矿场处理厂近百家(图3),如柿竹园有色金属矿、桥口铅锌矿、玛瑙山铁锰矿等。当地已形成集矿产采集、运输、冶炼加工于一体的矿产加工布局,成为了中国南方乃至全中国典型的有色金属矿区。有色金属矿区在带来巨大的经济效益的同时也对当地造成严重的环境污染,居民健康受到严重危害。
研究区2012~2016年肺癌死亡数据来源于研究小组回顾性调查,进行逻辑错误校验等数据清洗工作后计算肺癌粗死亡率,并引入空间经验贝叶斯平滑方法进行数据处理。对平滑调整后的肺癌死亡率数据采用直方图法、正态QQ分布图进行统计检验,发现数据呈右偏分布。为避免半变异函数出现比例效应甚至产生畸变,故采取Johnson正态转换,使死亡率数据满足插值应用的前提。
肺癌死亡影响因素数据包括行政区划、地形(DEM)、道路、河流、矿业分布,以及气象监测数据(年均气温、降水、气压和相对湿度)、PM2.5、植被覆盖度(NDVI)、GDP和重金属分布数据。其中行政区划、DEM、NDVI、GDP和气象监测数据来源于中国科学院资源环境科学数据中心。道路和河流数据来源于国家地球系统科学数据中心。矿业分布数据来源于研究小组对郴州市安全生产监督管理局的“苏仙区安全生产重点监管企业分布图”的矢量化。PM2.5数据来源于加拿大达尔豪西大学大气成分分析组公布的中国地区PM2.5年均值数据集(http://fizz.phys.dal.ca/~atmos/martin/?page_id=140#)。重金属含量数据来源于土壤样品的野外采集和实验室化学分析。对所有肺癌影响因素数据开展一致性检查、拓扑检查、数据分层等处理工作,为后续分析应用奠定基础。
平滑后2012~2016年肺癌死亡率变化范围为35.91~372.61/10万。空间上,死亡率自东向西呈明显上升趋势,南北方向上存在明显倒“U”型趋势(图4)。同时,空间自相关计算结果显示,死亡率的Moran’s I指数为0.197(p<0.001),具有较强的空间聚集性(图5)。由此可见,苏仙区不同地区肺癌死亡率存在显著差异,具有较强的空间自相关性,可满足协同克里金插值法平稳假设要求,实现肺癌死亡率的空间分布预测。
社会经济、自然环境因素对肺癌的发病、死亡具有重要的影响,因此,综合前人研究成果与研究区特点,从社会经济和自然环境两方面共选取18个变量作为可能影响因素,进行相关性分析,结果如表1所示。结果显示,到河流距离(River)、到矿点距离(Mine)、人口密度(PopD)、GDP、年均降雨(Pre)、Ni、As、Mn和Cr共9个影响因素与肺癌死亡率显著相关。
表1
表1中**.在0.01水平上显著相关;*.在0.05水平上显著相关;粗体表示与肺癌死亡率显著相关的变量。
由于协同克里金插值模型计算复杂,且与肺癌死亡率显著相关的影响因素众多,若只是选取相关性最高的单一因素,则无法全面利用辅助变量信息,若直接选取所有因素进行插值,各因素间可能存在多重共线性问题,对结果造成影响。因此,对众多影响因素进行主成分分析,将较多的因素转化为几个少数主要的综合指标,再将其作为辅助变量进行插值。不仅可有效保留原始影响因素的主要信息,还可去除数据冗余和共线性,得到更优插值结果。影响因素主成分分析结果如表2所示。
前三个主成分累计贡献度达92.863%(大于85%),包含原变量的绝大多数信息。其中,第一主成分主要反映的是重金属含量信息,第二主成分主要反映社会经济因素信息,第三主成分主要反映距离信息,包含到矿点距离和到河流距离信息(表3)。以正态转换并剔除趋势后的死亡率数据为因变量,前三个主成分为协变量进行协同克里金插值,得到2012~2016年肺癌死亡率精度最优的空间插值结果(图6)。可见肺癌死亡率较高地区主要集中在中部地区,北部和南部地区死亡率较低。
表2
表3
对2012~2016年肺癌死亡率进行热点探测分析,找到5年间高肺癌死亡率聚集区(热点区域)和低肺癌死亡率聚集区(冷点区域),明确肺癌死亡的空间分布格局。
可以看出,5年肺癌死亡率的热点、冷点区域较为集中(图7),各个Gi *指数显著性水平都在0.05以上,5年肺癌死亡率分布共有2处热点聚集区(12个热点区域)和2处冷点聚集区(34个冷点区域)。其中,4个热点区域(卜里坪街道、许家洞镇的焦冲村、许家洞村与温泉村)主要分布在中西部,另外8个热点区域(白露塘镇的柿竹园社区、飞天镇的福源新村、两江口、麻田村、长冲村、塘溪村、宝安岭和石河村)集中在中东部地区。冷点区域主要分布在北部(栖凤渡镇的枫树下村、新庄村、庄门村、栖凤渡村、太阳坌村、瓦灶村、廖王坪村、村头村、朱家湾村与五里牌镇的张家冲村、红五星村、繁荣村、洞尾村、新塘村、太平村、大头垅村和联星村)和西南部地区(良田镇的鱼网村、吴溪村、大竹山村、秦岭村、黄家湾村、大山口村、廖家湾村、扶塘村、大虾尾村、两湾洞村、二渡水村、邓家塘村、鲁塘岭村、高雅岭村、枧石塘村、队上村、良田村)。
肺癌死亡率的冷热点区域与空间插值结果基本相似,金属矿业活动较少、自然环境较为优越的北部和西南部为冷点区域,肺癌死亡率较低;分布着许家洞煤矿、和部分金属冶炼企业与危化品企业的中西部热点区域,与周围分布着大量的危化品、尾矿库和金属矿山企业的中东部热点区域,肺癌死亡率均较高,肺癌死亡率随距矿业距离的增加而减小。不难发现,苏仙区内肺癌死亡的冷、热点区域分布与区内矿业分布情况密切相关,矿业分布对肺癌死亡率的空间影响关系如何也有待进一步分析探索。
以1km为间隔对全部矿点进行缓冲区分析,根据缓冲区内外肺癌死亡率分别计算全部矿点外不同距离下肺癌死亡的相对危险度(95%CI),变化情况如表4所示。空间上,相对危险度变化整体呈现距离矿区越远,相对危险度越小的趋势。当缓冲区距离范围设置为4-7km时,相对危险度大于1,且具有统计学意义,此时缓冲区内人口数已超过苏仙区人口总数一半以上。当缓冲区超过7km,相对危险度值小于1,且随距离增加逐渐减小,结果也不具有统计学意义。说明,苏仙区内矿区对居民肺癌死亡影响范围主要集中在4-7km范围内,距离超过7km范围时,矿区对肺癌死亡并没有产生显著影响,研究区周边居民生活的安全距离为7km。
表4
苏仙区内矿业类型丰富,已有研究表明,不同类型的采矿设施可能会对其周围居民的癌症死亡风险带来不同影响。因此,同样以1km为间隔分别对不同类型矿点进行缓冲区分析,并计算不同距离下肺癌死亡的相对危险度(95%CI),相对危险度变化情况如图8所示。
不同类型矿点周围肺癌死亡相对危险度在空间上均表现为:随着距离的增长,相对危险度先增大后减小并趋于稳定,但不同类型矿点的影响范围有所不同。对于金属矿点,当距离在0-5km时,相对危险度虽大于1,且数值逐渐增加,但并不具有统计学意义,5-15km时,相对危险度值均大于1.2,且具有统计学意义,当距离超出15km时,结果无统计学意义;对于危化品企业,相对危险度曲线在6km和10km距离处有两个峰值,均具有统计学意义,在10km距离以外,结果无统计学意义;对于尾矿库,当距离处在6-14km范围内时,相对危险度值均在1.2以上,且具有统计学意义。
矿山的开采、冶炼和运输过程中释放有毒有害物质,会对周边居民健康带来严重的负面影响。采用GIS析技术,探索中国南方典型有色金属矿区周边居民2012~2016年肺癌死亡率空间分布模式及冷热点聚集特征,并定量分析矿区对肺癌死亡率的空间影响范围。结果表明:(1)GIS技术不仅有效地描述肺癌死亡率空间分布特征,还可探析其与矿区间空间相关关系,是一项可有效服务于肺癌空间流行病学研究的关键技术。(2)2012~2016年研究区肺癌死亡率具有显著空间聚集性,中西部和中东部地区是肺癌死亡热点区域,北部和东南部地区是肺癌死亡冷点区域。(3)居民肺癌死亡率与区内矿业分布存在明显负向关系,矿业设施对肺癌死亡率的影响范围集中在4-7km,7km为周围居民生活的安全距离。(4)不同的矿业类型对于肺癌死亡风险的影响范围有所不同。金属矿的影响范围集中在5-15km,危化品企业影响范围集中在5-10km,尾矿库的影响范围集中在6-14km。本发明结果对于探索矿区周边肺癌的空间分布规律、指导高危地区的肺癌防控及统筹区内矿业发展具有指导意义和借鉴作用。
图9为本发明所提供的一种居民居住地距离矿区的安全距离确定系统结构示意图,如图9所示,本发明所提供的一种居民居住地距离矿区的安全距离确定系统法,包括:
多源数据获取模块901,用于获取研究区域内多源数据;所述多源数据包括:不同样本点内癌症数据、人口数据、基础地理数据、植被覆盖度数据、大气污染数据、气象数据、土壤重金属含量数据、矿业分布数据、国内生产总值栅格数据;所述基础地理数据包括:行政区划数据、道路数据、河流数据以及地形数据;所述气象数据包括:年均气温、年均降水、年均气压和年均相对湿度;土壤重金属包括:Cd、Ni、As、Pb、Mn、以及Cr;所述矿业分布数据包括:矿山企业、尾矿库、采石场、金属冶炼企业和危化品企业分布的矢量数据;
癌症死亡率确定模块902,用于对所述多源数据进行数据清洗;并根据清洗后的不同样本点内癌症数据与清洗后的人口数据计算不同样本点内癌症死亡率;
空间经验贝叶斯平滑处理模块903,用于对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
空间自相关性确定模块904,用于对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性;
插值分析模块905,用于当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;
相对危险度确定模块906,用于对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度;
安全距离确定模块907,用于根据相对危险度确定居民居住地距离研究区域的安全距离。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种居民居住地距离矿区的安全距离确定方法,其特征在于,包括:
获取研究区域内多源数据;所述多源数据包括:不同样本点内癌症数据、人口数据、基础地理数据、植被覆盖度数据、大气污染数据、气象数据、土壤重金属含量数据、矿业分布数据、国内生产总值栅格数据;所述基础地理数据包括:行政区划数据、道路数据、河流数据以及地形数据;所述气象数据包括:年均气温、年均降水、年均气压和年均相对湿度;土壤重金属包括:Cd、Ni、As、Pb、Mn、以及Cr;所述矿业分布数据包括:矿山企业、尾矿库、采石场、金属冶炼企业和危化品企业分布的矢量数据;
对所述多源数据进行数据清洗;并根据清洗后的不同样本点内癌症数据与清洗后的人口数据计算不同样本点内癌症死亡率;
对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性;
当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;
对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度;
根据相对危险度确定居民居住地距离研究区域的安全距离;
所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性,具体包括:
利用公式确定癌症死亡率在研究区内的空间自相关性;
其中,I为癌症死亡率在研究区内的空间自相关性,I的取值范围为-1~1,当I>0且p<0.05时,p为结果可信程度的一个检验指标,癌症死亡率在研究区内具有正空间自相关性,即空间自相关性表示为聚集性,当I<0且p<0.05时,癌症死亡率在研究区内具有负空间自相关性,即空间自相关性表示为无聚集性,当I=0时,癌症死亡率在研究区内呈现空间随机分布;
所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性,之后还包括:
对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行热点分析;
所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行热点分析,具体包括:
利用公式确定癌症死亡率在空间上发生聚类的位置;
其中,s为所有死亡率的标准差,xj是要素j的属性值,Wij是要素i和j之间的空间权重,n为要素总数,且/>统计量是Z得分;当Z得分为正时,Z得分越高,高值的聚类就越紧密,该样本点为热点区域;当Z得分为负时,Z得分越低,低值的聚类就越紧密,该样本点为冷点区域;Z得分接近于0时,说明癌症死亡率在样本点周围没有聚类的情况,呈现随机分布。
2.根据权利要求1所述的一种居民居住地距离矿区的安全距离确定方法,其特征在于,所述对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理,具体包括:
利用公式rLBS(ui)=λ(ui)z(ui)+[1-λ(ui)]m*(ui)对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
其中,λ(ui)为收缩因子,m*(ui)是邻域样本点范围内人口加权平均死亡率,s2是邻域样本点范围内人口加权的样本点死亡率的方差,ui指i个样本点,/>是邻域样本点范围内的平均人口数。
3.根据权利要求1所述的一种居民居住地距离矿区的安全距离确定方法,其特征在于,所述对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性,之后还包括:
利用Spearman相关系数公式分析癌症死亡率与数据清洗后的多源数据之间的关系,确定癌症死亡率的关键因素数据。
4.根据权利要求1所述的一种居民居住地距离矿区的安全距离确定方法,其特征在于,所述当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析,具体包括:
利用多种空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析,得到相应的插值结果;
对所有的插值结果进行交叉验证确定最优差值方法;
利用最优差值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析。
5.根据权利要求1所述的一种居民居住地距离矿区的安全距离确定方法,其特征在于,所述对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度,具体包括:
利用公式确定相对危险度;
其中,EER表示暴露于样本一定距离缓冲区范围内的区域5年内累积肺癌死亡率,CER表示缓冲区范围外区域5年内累积肺癌死亡率,RR值越大,表明暴露的效应越大,暴露与发病/死亡的关联强度越大。
6.一种居民居住地距离矿区的安全距离确定系统,用于实施权利要求1-5任意一项所述的一种居民居住地距离矿区的安全距离确定方法,其特征在于,包括:
多源数据获取模块,用于获取研究区域内多源数据;所述多源数据包括:不同样本点内癌症数据、人口数据、基础地理数据、植被覆盖度数据、大气污染数据、气象数据、土壤重金属含量数据、矿业分布数据、国内生产总值栅格数据;所述基础地理数据包括:行政区划数据、道路数据、河流数据以及地形数据;所述气象数据包括:年均气温、年均降水、年均气压和年均相对湿度;土壤重金属包括:Cd、Ni、As、Pb、Mn、以及Cr;所述矿业分布数据包括:矿山企业、尾矿库、采石场、金属冶炼企业和危化品企业分布的矢量数据;
癌症死亡率确定模块,用于对所述多源数据进行数据清洗;并根据清洗后的不同样本点内癌症数据与清洗后的人口数据计算不同样本点内癌症死亡率;
空间经验贝叶斯平滑处理模块,用于对不同样本点内癌症死亡率进行空间经验贝叶斯平滑处理;
空间自相关性确定模块,用于对空间经验贝叶斯平滑处理后的不同样本点内癌症死亡率进行全局空间自相关分析,确定癌症死亡率在研究区内的空间自相关性;
插值分析模块,用于当空间自相关性表示为聚集性时,利用空间插值方法对空间经验贝叶斯平滑处理后的癌症死亡率进行插值分析;
相对危险度确定模块,用于对研究区域内所有的样本点进行缓冲区分析,根据缓冲区内癌症死亡率和缓冲区外癌症死亡率分别计算不同距离下癌症死亡的相对危险度;
安全距离确定模块,用于根据相对危险度确定居民居住地距离研究区域的安全距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110883758.4A CN113570149B (zh) | 2021-08-03 | 2021-08-03 | 一种居民居住地距离矿区的安全距离确定方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110883758.4A CN113570149B (zh) | 2021-08-03 | 2021-08-03 | 一种居民居住地距离矿区的安全距离确定方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113570149A CN113570149A (zh) | 2021-10-29 |
CN113570149B true CN113570149B (zh) | 2024-02-27 |
Family
ID=78170079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110883758.4A Active CN113570149B (zh) | 2021-08-03 | 2021-08-03 | 一种居民居住地距离矿区的安全距离确定方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113570149B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140100783A (ko) * | 2013-02-07 | 2014-08-18 | 경희대학교 산학협력단 | 비모수적 베이지언 모션 인식 방법 및 그 장치 |
US8918285B1 (en) * | 2014-02-25 | 2014-12-23 | Fractest Llc | Testing water contamination in geographic areas |
RU158417U1 (ru) * | 2014-09-23 | 2015-12-27 | Екатерина Валентиновна Шевченко | Система моделирования инвестиционного риска для предприятий горной отрасли |
CN107545103A (zh) * | 2017-08-19 | 2018-01-05 | 安徽省环境科学研究院 | 煤矿区土壤重金属含量空间模型建立方法 |
CN110543671A (zh) * | 2019-07-25 | 2019-12-06 | 太原科技大学 | 一种基于人工社会的城市安全宜居度建模方法 |
CN111325406A (zh) * | 2020-03-03 | 2020-06-23 | 广东省公共卫生研究院 | 一种基于小空间尺度的热相关健康风险预警方法 |
CN111508613A (zh) * | 2020-04-26 | 2020-08-07 | 中国科学院地理科学与资源研究所 | 矿区周边肿瘤死亡率空间分布规律及影响因素的分析方法 |
CN111581250A (zh) * | 2020-04-21 | 2020-08-25 | 中国科学院地理科学与资源研究所 | 矿区周边土壤重金属随自然因素的变化定量研究方法 |
CN111625575A (zh) * | 2020-04-23 | 2020-09-04 | 中国地质大学(武汉) | 基于地质变异度的化探异常提取和评价方法 |
CN112381644A (zh) * | 2020-12-01 | 2021-02-19 | 天翼电子商务有限公司 | 一种基于空间变量推理的信贷场景风险用户评估方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10288433B2 (en) * | 2010-02-25 | 2019-05-14 | Microsoft Technology Licensing, Llc | Map-matching for low-sampling-rate GPS trajectories |
US20140188495A1 (en) * | 2012-12-30 | 2014-07-03 | Nanjing University | Method for assessing and managing health risks associated with heavy metal pollution |
US20210057109A1 (en) * | 2019-08-20 | 2021-02-25 | Peter Keith Rogan | Method for identifying and quantifying populations exposed to environmental hazards across a geographic region |
-
2021
- 2021-08-03 CN CN202110883758.4A patent/CN113570149B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140100783A (ko) * | 2013-02-07 | 2014-08-18 | 경희대학교 산학협력단 | 비모수적 베이지언 모션 인식 방법 및 그 장치 |
US8918285B1 (en) * | 2014-02-25 | 2014-12-23 | Fractest Llc | Testing water contamination in geographic areas |
RU158417U1 (ru) * | 2014-09-23 | 2015-12-27 | Екатерина Валентиновна Шевченко | Система моделирования инвестиционного риска для предприятий горной отрасли |
CN107545103A (zh) * | 2017-08-19 | 2018-01-05 | 安徽省环境科学研究院 | 煤矿区土壤重金属含量空间模型建立方法 |
CN110543671A (zh) * | 2019-07-25 | 2019-12-06 | 太原科技大学 | 一种基于人工社会的城市安全宜居度建模方法 |
CN111325406A (zh) * | 2020-03-03 | 2020-06-23 | 广东省公共卫生研究院 | 一种基于小空间尺度的热相关健康风险预警方法 |
CN111581250A (zh) * | 2020-04-21 | 2020-08-25 | 中国科学院地理科学与资源研究所 | 矿区周边土壤重金属随自然因素的变化定量研究方法 |
CN111625575A (zh) * | 2020-04-23 | 2020-09-04 | 中国地质大学(武汉) | 基于地质变异度的化探异常提取和评价方法 |
CN111508613A (zh) * | 2020-04-26 | 2020-08-07 | 中国科学院地理科学与资源研究所 | 矿区周边肿瘤死亡率空间分布规律及影响因素的分析方法 |
CN112381644A (zh) * | 2020-12-01 | 2021-02-19 | 天翼电子商务有限公司 | 一种基于空间变量推理的信贷场景风险用户评估方法 |
Non-Patent Citations (3)
Title |
---|
南丹矿业活动影响区蔬菜重金属含量及健康风险;陆素芬;宋波;伏凤艳;余元元;朱楠;钟雪梅;;生态与农村环境学报(第03期);第139-146页 * |
煤矿城镇居住环境予测评价及探讨;程经权;孔德宝;;能源环境保护(第04期);第66-73页 * |
矿山开采与居民住宅建设冲突分析及对策研究;南怀方;中州煤炭;第68-70、139页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113570149A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Approach based on TOPSIS and Monte Carlo simulation methods to evaluate lake eutrophication levels | |
CN114443982B (zh) | 一种大区域土壤重金属检测与时空分布特征分析方法及系统 | |
Luo et al. | Spatio-temporal analysis on built-up land expansion and population growth in the Yangtze River Delta Region, China: From a coordination perspective | |
Li et al. | Effects of cascade hydropower dams on the structure and distribution of riparian and upland vegetation along the middle-lower Lancang-Mekong River | |
Zhang et al. | An evaluation of the ecological and environmental security on China’s terrestrial ecosystems | |
Tang et al. | Tempo-spatial changes of ecological vulnerability in resource-based urban based on genetic projection pursuit model | |
Yang et al. | A novel comprehensive risk assessment method for sudden water accidents in the Middle Route of the South–North Water Transfer Project (China) | |
Zhao et al. | Quantifying the effects of vegetation restorations on the soil erosion export and nutrient loss on the Loess Plateau | |
Anderson et al. | Occupancy modeling and estimation of the holiday darter species complex within the Etowah River system | |
Guo et al. | Establishment of an integrated decision-making method for planning the ecological restoration of terrestrial ecosystems | |
Fang et al. | Characterizing the physical and demographic variables associated with heavy metal distribution along urban-rural gradient | |
Zhou et al. | Spatiotemporal analysis of interactions between seasonal water, climate, land use, policy, and socioeconomic changes: Hulun-Buir Steppe as a Case Study | |
Wei et al. | Spatial distribution of nutrient loads and thresholds in large shallow lakes: The case of Chaohu Lake, China | |
CN117009887A (zh) | 流域水环境质量精细化估算及分析的方法及系统 | |
Zhang et al. | Investigating river health and potential risks using a novel hybrid decision-making framework with multi-source data fusion in the Qinghai-Tibet Plateau | |
Li et al. | Heavy metal habitat: A novel framework for mapping heavy metal contamination over large-scale catchment with a species distribution model | |
Wang et al. | Stream water quality optimized prediction based on human activity intensity and landscape metrics with regional heterogeneity in Taihu Basin, China | |
Li et al. | Assessment of eutrophication and nitrogen and phosphorus carrying capacity before and after removing pen culture (2013–2018) in Lake Changhu, China | |
CN113570149B (zh) | 一种居民居住地距离矿区的安全距离确定方法及系统 | |
Çelekli et al. | Fuzzy logic as a novel approach to predict biological condition gradient of various streams in Ceyhan River Basin (Turkey) | |
Yang et al. | Strategy for management of lake-catchment system integrated with natural and anthropogenic factors in China | |
Yang et al. | Unveiling the air pollution tapestry in China: A comprehensive assessment of spatiotemporal variations through geographically and temporally weighted regression | |
CN113780817A (zh) | 一种土壤重金属分析方法和装置 | |
Karthe et al. | Water and environment in the Selenga-Baikal Basin: international research cooperation for an ecoregion of global relevance | |
Cao et al. | Debris flow susceptibility assessment based on information value and machine learning coupling method: from the perspective of sustainable development |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |