CN109360659B - 一种基于相对风险偏差和空间参量修正的时空扫描统计方法 - Google Patents

一种基于相对风险偏差和空间参量修正的时空扫描统计方法 Download PDF

Info

Publication number
CN109360659B
CN109360659B CN201810998895.0A CN201810998895A CN109360659B CN 109360659 B CN109360659 B CN 109360659B CN 201810998895 A CN201810998895 A CN 201810998895A CN 109360659 B CN109360659 B CN 109360659B
Authority
CN
China
Prior art keywords
value
relative risk
deviation
aggregation
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810998895.0A
Other languages
English (en)
Other versions
CN109360659A (zh
Inventor
龙华
王美
邵玉斌
杜庆治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810998895.0A priority Critical patent/CN109360659B/zh
Publication of CN109360659A publication Critical patent/CN109360659A/zh
Application granted granted Critical
Publication of CN109360659B publication Critical patent/CN109360659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于相对风险偏差和空间参量修正的时空扫描统计方法,属于疾病时空聚集性探测与预测预警技术领域。本发明对城镇、农村人口发病聚集的探索与预测预警创新性的考虑了两个因素,一个是人员发病地址和人员就医登记地址的矛盾,另一个是引入了power参与评估预测,此处power是一个关于人口密度和相对风险值RR的函数,强调应考虑城镇农村人口密度稀疏问题,而不是单纯的考虑RR值,使用中用相对偏差B来衡量,因为B和power变化一致,当B无限接近1时,power因素可忽略。

Description

一种基于相对风险偏差和空间参量修正的时空扫描统计方法
技术领域
本发明涉及一种基于相对风险偏差和空间参量修正的时空扫描统计方法,属于疾病时空聚集性探测与预测预警技术领域。
背景技术
时空事件聚类分析,从提出以来近十年里,出现了一些成熟的方法。其大致分为三种类型:(1)时空扫描统计,(2)时空密度聚类,(3)时空混合距离。本发明探讨的是第一类时空扫描统计部分。
2001年Kuiidorff在空间统计的基础上提出了时空扫描统计,其基本用于探测传染病的时空聚集模式。模型定义一系列以空间距离为半径,时间间隔为高的圆柱型时空扫描窗口。然后用最大似然函数、蒙特卡罗等对扫描窗口的显著性进行检验,寻找最异常的窗口。之后2008年TaKahash等人对扫描窗口的形状进行了扩展,提高了非球型簇探测的能力。2011年,Tango等人在模型中加入了期望发病数随时间的变化一因素,使时空扫描统计更为完善。
以上说明纯粹的空间和时空扫描已经成功的应用于检测和预估地理疾病爆发集群。但是尽管在成熟的模型下扫描统计量正确的识别集群的概率很高,并没有对所检测到的集群进行一个集群的相对风险的评估。如人员稀少地方,尽管有聚集情况,但其实发病率还是很低;扫描使用的空间参量数据一般来源于医院的登记,会有一个人员发病地点和人员就诊登记地点的矛盾,导致最终数据有一定偏差。
发明内容
本发明要解决的技术问题是提供一种基于相对风险偏差和空间参量修正的时空扫描统计方法,用于解决时空扫描统计中人员发病地点和人员就诊登记地点的矛盾问题和被探测到的聚集区域相对风险存在偏差等现象,致力于提高时空扫描疾病聚集性探测与预测预警的准确性。
本发明的技术方案是:一种基于相对风险偏差和空间参量修正的时空扫描统计方法,具体步骤为:
Step1:从城镇农村医院上报数据库中获取病例登记信息,主要获取空间地址,实际发病地址和就诊地址等数据集;
Step2:确认Step1中的地理信息,清洗数据,空间扫描地址扫描信息统一为实际发病地址;
Step3:信息搜集完毕后,调用Step1中的地理信息,基于Kulldorff模型,以G区域作为研究区域,其中Z区域为扫描的聚集区域,针对每个时空扫描窗口,在泊松分布假设前提下,定义真实的相对风险值RR;
Step4:继续Step3中的模型操作,假设选定的区域Z与观测值无关,根据扫描的数据得到相对风险值RR的估计量
Figure GDA0003191945980000021
Step5:根据Step3和Step4中得到的相对风险值RR与相对风险估计量
Figure GDA0003191945980000022
求解相对风险偏差
Figure GDA0003191945980000023
Step6:由Step5得到的相对风险偏差B,作为时空聚集性预测预警准确性的一个衡量条件,在一些探测结果中同时显示B值,B值越接近1,表示对结果值的判断越准确。
进一步地,所述步骤Step2中,考虑真实传染源在发病地点,空间扫描地址扫描信息统一为实际发病地址。
进一步地,所述Step3中,真实的相对风险值RR计算为:
Figure GDA0003191945980000024
其中,λZ为聚集区域Z内的风险值比上研究区域G处于Z以外的区域的风险值。
进一步地,所述Step3真实的相对风险值RR计算中,扫描窗口内的实体数目服从泊松分布,故聚集区域Z内病例数服从泊松分布,有聚集区域Z的风险值λZ为:
Figure GDA0003191945980000025
YZ为聚集区域Z内泊松随机变量总数,E(YZ)为其期望值,EZ为聚集区域Z内的病例期望值。N为研究区域G内的总病例数,PZ为Z区域内的人口数,PG为研究区域G的总人口数,所以有:
Figure GDA0003191945980000026
同理可得研究区域G处于Z以外的区域的风险值:
Figure GDA0003191945980000027
进一步地,所述Step4中相似风险值的值
Figure GDA0003191945980000028
的计算,假设被选定的区域Z独立于观测数据集,则其相对风险RR估计值
Figure GDA0003191945980000029
为:
Figure GDA0003191945980000031
其中,N为研究区域G内的总人口数,NZ聚集区域Z内的人口数,EZ为聚集区域Z内的病例期望值,EG研究区域G内病例期望值;由于假设被选定的区域Z独立于观测数据集,所以当
Figure GDA0003191945980000032
接近1的时候,表示研究区域G内无聚集,当
Figure GDA0003191945980000033
大于1时,表示Z区域内有聚集。
进一步地,所述Step5中,相对风险偏差B,其由Step5得到的相对风险估计值
Figure GDA0003191945980000034
比上Step4得到的真实相对风险值RR确定,即:
Figure GDA0003191945980000035
相对风险偏差B>1为正偏差,B<1为负偏差,B=1为无偏差。
进一步地,所述Step6中,得到的相对风险偏差B,参考若B在一定范围内,则聚集判断的各种信息准确性高。
本发明的有益效果是:单纯用空间和时空扫描得到聚集区域的相对风险值,对城镇农村的疾病聚集性探测与预测预警来说,以B值为参考量,减少了不必要的参考值,有效提高了预测效果,从而使得整体预测值更为稳定,所得预测结果将更为有参考性。
附图说明
图1是本发明步骤流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1所示,一种基于相对风险偏差和空间参量修正的时空扫描统计方法,修正了空间扫描量统一使用诊所登记地址,不考虑实际发病地址的情况,在登记数据库时就注意该问题,文中用是否住院来确定空间参数,若住院空间参量提取诊所登记地址,若未住院空间参量选用病例实际住址。由于中国一些城镇、农村人口稀疏,此时相对风险值偏大,由于人口基数小导致实际疾病预测效果不佳,引入power参数,其是一个关于人口密度和相对风险值RR的函数,强调应考虑城镇农村人口密度稀疏问题,而不是单纯的考虑RR值,使用中用相对风险偏差B来衡量,因为B和power成一致变化,B接近1的时候可不考虑power的影响。B越接近1,对城镇农村的疾病聚集性探测与预测预警越准确。
具体步骤为:
Step1:从城镇农村医院上报数据库中获取病例登记信息,主要获取空间地址,实际发病地址和就诊地址等数据集;
Step2:确认Step1中的地理信息,清洗数据,空间扫描地址扫描信息统一为实际发病地址;
Step3:信息搜集完毕后,调用Step1中的地理信息,基于Kulldorff模型,以G区域作为研究区域,其中Z区域为扫描的聚集区域,针对每个时空扫描窗口,在泊松分布假设前提下,定义真实的相对风险值RR;
Step4:继续Step3中的模型操作,假设选定的区域Z与观测值无关,根据扫描的数据得到相对风险值RR的估计量
Figure GDA0003191945980000041
Step5:根据Step3和Step4中得到的相对风险值RR与相对风险估计量
Figure GDA0003191945980000042
求解相对风险偏差
Figure GDA0003191945980000043
Step6:由Step5得到的相对风险偏差B,作为时空聚集性预测预警准确性的一个衡量条件,在一些探测结果中同时显示B值,B值越接近1,表示对结果值的判断越准确。
进一步地,所述步骤Step2中,考虑真实传染源在发病地点,空间扫描地址扫描信息统一为实际发病地址。
进一步地,所述Step3中,真实的相对风险值RR计算为:
Figure GDA0003191945980000044
其中,λZ为聚集区域Z内的风险值比上研究区域G处于Z以外的区域的风险值。
进一步地,所述Step3真实的相对风险值RR计算中,扫描窗口内的实体数目服从泊松分布,故聚集区域Z内病例数服从泊松分布,有聚集区域Z的风险值λZ为:
Figure GDA0003191945980000045
YZ为聚集区域Z内泊松随机变量总数,E(YZ)为其期望值,EZ为聚集区域Z内的病例期望值。N为研究区域G内的总病例数,PZ为Z区域内的人口数,PG为研究区域G的总人口数,所以有:
Figure GDA0003191945980000046
同理可得研究区域G处于Z以外的区域的风险值:
Figure GDA0003191945980000047
进一步地,所述Step4中相似风险值的值
Figure GDA0003191945980000048
的计算,假设被选定的区域Z独立于观测数据集,则其相对风险RR估计值
Figure GDA0003191945980000051
为:
Figure GDA0003191945980000052
其中,N为研究区域G内的总人口数,NZ聚集区域Z内的人口数,EZ为聚集区域Z内的病例期望值,EG研究区域G内病例期望值;由于假设被选定的区域Z独立于观测数据集,所以当
Figure GDA0003191945980000053
接近1的时候,表示研究区域G内无聚集,当
Figure GDA0003191945980000054
大于1时,表示Z区域内有聚集。
进一步地,所述Step5中,相对风险偏差B,其由Step5得到的相对风险估计值
Figure GDA0003191945980000055
比上Step4得到的真实相对风险值RR确定,即:
Figure GDA0003191945980000056
相对风险偏差B>1为正偏差,B<1为负偏差,B=1为无偏差。
进一步地,所述Step6中,得到的相对风险偏差B,参考若B在比如范围(0.97,1.03)内,则聚集判断的各种信息准确性高。具体范围可根据实际情况确定。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (2)

1.一种基于相对风险偏差和空间参量修正的时空扫描统计方法,其特征在于:
Step1:从城镇农村医院上报数据库中获取病例登记信息,主要获取空间地址,实际发病地址和就诊地址数据集;
Step2:确认Step1中的地理信息,清洗数据,若住院则选取诊所地址为实际发病地址,若未住院则选取实际病例住址为实际发病地址;
Step3:信息搜集完毕后,调用Step1中的地理信息,基于Kulldorff模型,以G区域作为研究区域,其中Z区域为扫描的聚集区域,针对每个时空扫描窗口,在泊松分布假设前提下,定义真实的相对风险值RR;
所述Step3中,真实的相对风险值RR计算为:
Figure FDA0003191945970000011
其中,λZ为聚集区域Z内的风险值比上研究区域G处于Z以外的区域的风险值;
真实的相对风险值RR计算中,扫描窗口内的实体数目服从泊松分布,故聚集区域Z内病例数服从泊松分布,有聚集区域Z的风险值λZ为:
Figure FDA0003191945970000012
YZ为聚集区域Z内泊松随机变量总数,E(YZ)为其期望值,EZ为聚集区域Z内的病例期望值。N为研究区域G内的总病例数,PZ为Z区域内的人口数,PG为研究区域G的总人口数,所以有:
Figure FDA0003191945970000013
同理可得研究区域G处于Z以外的区域的风险值:
Figure FDA0003191945970000014
Step4:继续Step3中的模型操作,假设选定的区域Z与观测值无关,根据扫描的数据得到相对风险值RR的估计量
Figure FDA0003191945970000015
所述Step4中相似风险值的值
Figure FDA0003191945970000016
的计算,假设被选定的区域Z独立于观测数据集,则其相对风险RR估计值
Figure FDA0003191945970000017
为:
Figure FDA0003191945970000018
其中,N为研究区域G内的总人口数,NZ聚集区域Z内的人口数,EZ为聚集区域Z 内的病例期望值,EG研究区域G内病例期望值;由于假设被选定的区域Z独立于观测数据集,所以当
Figure FDA0003191945970000021
接近1的时候,表示研究区域G内无聚集,当
Figure FDA0003191945970000022
大于1时,表示Z区域内有聚集;
Step5:根据Step3和Step4中得到的相对风险值RR与相对风险估计量
Figure FDA0003191945970000023
求解相对风险偏差
Figure FDA0003191945970000024
Step6:由Step5得到的相对风险偏差B,作为时空聚集性预测预警准确性的一个衡量条件,在一些探测结果中同时显示B值,B值越接近1,表示对结果值的判断越准确。
2.根据权利要求1所述的基于相对风险偏差和空间参量修正的时空扫描统计方法,其特征在于:所述Step5中,相对风险偏差B,其由Step5得到的相对风险估计值
Figure FDA0003191945970000025
比上Step4得到的真实相对风险值RR确定,即:
Figure FDA0003191945970000026
相对风险偏差B>1为正偏差,B<1为负偏差,B=1为无偏差。
CN201810998895.0A 2018-08-30 2018-08-30 一种基于相对风险偏差和空间参量修正的时空扫描统计方法 Active CN109360659B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810998895.0A CN109360659B (zh) 2018-08-30 2018-08-30 一种基于相对风险偏差和空间参量修正的时空扫描统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810998895.0A CN109360659B (zh) 2018-08-30 2018-08-30 一种基于相对风险偏差和空间参量修正的时空扫描统计方法

Publications (2)

Publication Number Publication Date
CN109360659A CN109360659A (zh) 2019-02-19
CN109360659B true CN109360659B (zh) 2021-09-14

Family

ID=65350186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810998895.0A Active CN109360659B (zh) 2018-08-30 2018-08-30 一种基于相对风险偏差和空间参量修正的时空扫描统计方法

Country Status (1)

Country Link
CN (1) CN109360659B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112447303A (zh) * 2020-11-20 2021-03-05 航天精一(广东)信息科技有限公司 一种传染病时空聚集性探测分析方法及系统
CN113298302B (zh) * 2021-05-18 2022-06-28 昆明理工大学 一种针对疾病预测的不规则形状时空扫描方法
CN115036040A (zh) * 2022-06-28 2022-09-09 福州大学 融合发热人数和人口背景数据的流行病疫情时空预警方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7343272B2 (en) * 2004-02-12 2008-03-11 International Business Machines Corporation System and method for detecting generalized space-time clusters
CN102646151A (zh) * 2011-02-18 2012-08-22 四川大学 基于泊松分布的可变窗口前瞻性时空重排扫描算法
CN202711253U (zh) * 2012-03-09 2013-01-30 李晓松 一种传染病聚集性探测与早期预警系统
CN103093106A (zh) * 2013-01-25 2013-05-08 上海市浦东新区疾病预防控制中心 大型活动中多源数据的传染病症状监测与预警方法
CN106126918A (zh) * 2016-06-23 2016-11-16 中国石油大学(华东) 一种基于相互作用力的地理空间异常聚集区扫描统计方法
CN107330283A (zh) * 2017-07-06 2017-11-07 江苏省疾病预防控制中心 一种预警方法及装置
CN107767954A (zh) * 2017-10-16 2018-03-06 中国科学院地理科学与资源研究所 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7343272B2 (en) * 2004-02-12 2008-03-11 International Business Machines Corporation System and method for detecting generalized space-time clusters
CN102646151A (zh) * 2011-02-18 2012-08-22 四川大学 基于泊松分布的可变窗口前瞻性时空重排扫描算法
CN202711253U (zh) * 2012-03-09 2013-01-30 李晓松 一种传染病聚集性探测与早期预警系统
CN103093106A (zh) * 2013-01-25 2013-05-08 上海市浦东新区疾病预防控制中心 大型活动中多源数据的传染病症状监测与预警方法
CN106126918A (zh) * 2016-06-23 2016-11-16 中国石油大学(华东) 一种基于相互作用力的地理空间异常聚集区扫描统计方法
CN107330283A (zh) * 2017-07-06 2017-11-07 江苏省疾病预防控制中心 一种预警方法及装置
CN107767954A (zh) * 2017-10-16 2018-03-06 中国科学院地理科学与资源研究所 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Evaluating Disease Outbreak Detection Methods: Benchmark Data and Power Calculations;Martin Kulldorff et.al;《MMWR. Morbidity and mortality weekly report》;20041031;全文 *
Influence of Spatial Resolution on Space-Time Disease Cluster Detection;Stephen G. Jones et.al;《PLOS ONE》;20121031;第7卷(第10期);全文 *
Prospective time periodic geographical disease surveillance using a scan statistic;Martin Kulldorff;《J.R.Statist.Soc.A》;20011231;全文 *
Review of methods for space–time disease surveillance;Colin Robertson et.al;《Spatial and Spatio-temporal Epidemiology》;20101231;全文 *
基于空间聚集性与时空扫描的肺结核流行特征分析;李婷 等;《中国防痨杂志》;20161231;第38卷(第12期);全文 *

Also Published As

Publication number Publication date
CN109360659A (zh) 2019-02-19

Similar Documents

Publication Publication Date Title
CN109360659B (zh) 一种基于相对风险偏差和空间参量修正的时空扫描统计方法
Patil et al. Upper level set scan statistic for detecting arbitrarily shaped hotspots
CN116186634A (zh) 一种建筑工程施工数据智能管理系统
CN111651545A (zh) 一种基于多源数据融合的城市边缘区提取方法
CN107767954A (zh) 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法
CN106126918B (zh) 一种基于相互作用力的地理空间异常聚集区扫描统计方法
CN108668233A (zh) 一种建筑物入口检测方法及系统
CN113033957B (zh) 一种多模式降水预报及实时动态检验评估系统
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN114518143A (zh) 一种智能环境感知系统
WO2021189559A1 (zh) 异常体温筛查方法、装置、计算机设备和存储介质
CN109190650A (zh) 一种不规则形状的时空扫描聚类方法
CN112463773A (zh) 数据质量确定方法及装置
CN113222327A (zh) 一种基于服务能力的地块可达性分析方法
McFee et al. Hierarchical Evaluation of Segment Boundary Detection.
CN105380622A (zh) 一种用于健康预警的多数据监控方法
CN110866689B (zh) 一种空间扫描统计量中选择最大扫描窗口的方法
CN117131441A (zh) 夜间光污染监测方法、装置、计算机设备和存储介质
CN105427303B (zh) 一种变电站遗留物的视觉测量与估计方法
CN104519511B (zh) 一种检测通信网络小区场景突变的方法和装置
CN115936526A (zh) 一种基于电力大数据的碳排放数据测算方法
CN109409638A (zh) 一种基于不规则形状时空扫描统计的犯罪预警方法
CN109325523A (zh) 一种基于最大关联和风险偏差的不规则形状时空扫描聚类方法
CN112925784B (zh) 一种实有人口数据多尺度空间化方法
CN106835201A (zh) 基于模糊聚类算法的铝电解槽控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant