CN114613518A - 基于空间信息的传染病预测方法、装置、存储介质及设备 - Google Patents
基于空间信息的传染病预测方法、装置、存储介质及设备 Download PDFInfo
- Publication number
- CN114613518A CN114613518A CN202210337550.7A CN202210337550A CN114613518A CN 114613518 A CN114613518 A CN 114613518A CN 202210337550 A CN202210337550 A CN 202210337550A CN 114613518 A CN114613518 A CN 114613518A
- Authority
- CN
- China
- Prior art keywords
- preset
- infectious disease
- confirmed
- area
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000035473 Communicable disease Diseases 0.000 title claims abstract description 144
- 208000015181 infectious disease Diseases 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000003745 diagnosis Methods 0.000 claims abstract description 61
- 238000012353 t test Methods 0.000 claims description 8
- 238000000692 Student's t-test Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 230000005541 medical transmission Effects 0.000 abstract description 3
- 230000002265 prevention Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 10
- 206010039587 Scarlet Fever Diseases 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000004429 Bacillary Dysentery Diseases 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 206010017915 Gastroenteritis shigella Diseases 0.000 description 1
- 208000020061 Hand, Foot and Mouth Disease Diseases 0.000 description 1
- 208000025713 Hand-foot-and-mouth disease Diseases 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 1
- 208000002979 Influenza in Birds Diseases 0.000 description 1
- 206010034038 Parotitis Diseases 0.000 description 1
- 241000315672 SARS coronavirus Species 0.000 description 1
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010064097 avian influenza Diseases 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000009351 contact transmission Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 208000001848 dysentery Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 201000004409 schistosomiasis Diseases 0.000 description 1
- 201000005113 shigellosis Diseases 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000005570 vertical transmission Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于空间信息的传染病预测方法、装置、设备及存储介质,该方法包括:获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,特征参数至少包括对象的以经纬度示出的位置信息;根据多个确诊对象的特征参数和区域确诊数量,确定影响区域确诊数量的特征参数的影响系数;根据影响系数,确定影响预设传染在预设区域的目标特征,以基于目标特征对预设传染病在预设区域进行预测。由此,加入被确诊预设传染病的确诊对象的空间位置信息,并基于此挖掘影响传染病传播的影响因子,快速准确的分析传染病的影响因素,为传染病的防控提供重要参考数据。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于空间信息的传染病预测方法、装置、计算机可读存储介质及设备。
背景技术
传染病一直是严重危害人们健康的一个重要病因,而且某些传染病的流行会出现逐渐扩大的趋势。经过研究发现,很多传染病如禽流感、手足口病的发生和传播在时间和空间上有特定的分布模式。因此,研究传染病的空间分布模式是流行病学研究中的主要组成部分。由此,引入了多种分布模型对传染病的分布情况进行分析,挖掘影响传染病传播和爆发的影响因素,并由此进一步研究传染病的发生与扩散的原因,合理制定有效的传染病防控策略具有重要的作用。
目前,主要是基于专家知识对传染病的影响因素进行分析。但是基于专家知识进行分析具有较大的主观性,并且具备较高分析水平的专家人才稀缺。
发明内容
本发明实施例为了解决上述问题,提供一种基于空间信息的传染病预测方法、装置及计算机可读存储介质。
根据本发明第一方面,提供了一种基于空间信息的传染病预测方法,所述方法包括:获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,所述特征参数至少包括对象的以经纬度示出的位置信息;根据所述多个确诊对象的特征参数和所述区域确诊数量,确定影响所述区域确诊数量的特征参数的影响系数;根据所述影响系数,确定影响所述预设传染在所述预设区域的目标特征,以基于所述目标特征对所述预设传染病在所述预设区域进行预测。
根据本发明一实施方式,所述获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,包括:获取所述多个确诊对象的特征参数中的地址信息;将所述地址信息转换为以经纬度示出的位置信息。
根据本发明一实施方式,所述根据所述多个确诊对象的特征参数和所述区域确诊数量,确定影响所述区域确诊数量的特征参数的影响系数,包括:根据所述多个确诊对象的特征参数,构建针对所述预设区域的预设传染病预测模型;根据所述区域确诊数量,确定所述预设传染病预测模型中针对每一特征参数对应的多个回归系数;根据所述多个回归系数,确定影响所述区域确诊数量的特征参数的影响系数。
根据本发明一实施方式,所述根据所述区域确诊数量,确定所述预设传染病预测模型中针对每一特征参数对应的多个回归系数,采用以下方式得到:
其中,yi表示所述预设区域被确诊所述预设传染病的区域确诊数量;
(ui,vi)表示所述预设区域的经纬度坐标;
β0(ui,vi)表示所述预设区域的所述预设传染病预测模型的常数项;
βk(ui,vi)表示所述预设区域的第k个特征参数的回归系数;
xik表示所述预设区域的第k个特征参数的值;
εi表示所述预设区域的所述预设传染病预测模型的残差。
根据本发明一实施方式,所述根据所述影响系数,确定影响所述预设传染在所述预设区域的目标特征,包括:通过t-test对多个特征参数的影响系数进行检验,确定设定个数的影响所述区域确诊数量的特征参数。
根据本发明一实施方式,所述特征参数包括所述预设区域的以下参数至少之一:人口密度、平均收入水平、人口移动率、区域内医院个数、区域GDP和气候的值。
根据本发明一实施方式,所述方法包括:获取所述预设区域在第二预设时间段内目标特征对应的数据;根据所述目标特征对应的数据,预测所述预设区域在第二预设时间段内传染病患者数量。
根据本发明第二方面,还提供一种基于空间信息的传染病预测装置,所述装置包括:第一获取模块,用于获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;第二获取模块,用于获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,所述特征参数至少包括对象的以经纬度示出的位置信息;第一系数确定模块,用于根据所述多个确诊对象的特征参数和所述区域确诊数量,确定影响所述区域确诊数量的特征参数的影响系数;特征确定模块,用于根据所述影响系数,确定影响所述预设传染病在所述预设区域的目标特征,以基于所述目标特征对所述预设传染病在所述预设区域进行预测。
根据本发明第三方面,又提供了一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行如上所述基于空间信息的传染病预测方法。
根据本发明第四方面,又提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述基于空间信息的传染病预测方法。
本发明实施例基于空间信息的传染病预测方法、装置、设备及计算机可读存储介质,该方法包括:获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,特征参数至少包括对象的以经纬度示出的位置信息;根据多个确诊对象的特征参数和区域确诊数量,确定影响区域确诊数量的特征参数的影响系数;根据影响系数,确定影响预设传染病在预设区域的目标特征,以基于目标特征对预设传染病在预设区域进行预测。由此,加入被确诊预设传染病的确诊对象的空间位置信息,并基于此挖掘影响传染病传播的影响因子,快速准确的分析传染病的影响因素,为传染病的防控提供重要参考数据。
需要理解的是,本发明的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本发明实施例基于空间信息的传染病预测方法的实现流程示意图;
图2示出了本发明实施例基于空间信息的传染病预测方法的具体应用示例的实现流程示意图;
图3示出了本发明实施例基于空间信息的传染病预测方法的具体应用示例的确诊数量在预设区域的多个子区域的分布情况示意图;
图4示出了本发明实施例基于空间信息的传染病预测装置的组成结构示意图;
图5示出了本发明实施例设备的组成结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为使本发明更加透彻和完整,并能够将本发明的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
图1示出了本发明实施例基于空间信息的传染病预测方法的实现流程示意图。
参考图1,本发明实施例基于空间信息的传染病预测方法,至少包括如下操作流程:操作101,获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;操作102,获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,特征参数至少包括对象的以经纬度示出的位置信息;操作103,根据多个确诊对象的特征参数和区域确诊数量,确定影响区域确诊数量的特征参数的影响系数;操作104,根据影响系数,确定影响预设传染病在预设区域的目标特征,以基于目标特征对预设传染病在预设区域进行预测。
在操作101中,获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量。
在本发明这一实施方式中,预设区域可以是一个国家、一个省级地区或一个市级地区等。具体可以根据实际情况设定,本发明对此不做具体限定。预设传染病可以是通过空气传播、水源传播、食物传播、接触传播、土壤传播、垂直传播(母婴传播)、体液传播、粪口传播等在人群或动物之间快速传播的疾病,例如:猩红热、流行性感冒、细菌性痢疾、痢疾杆菌、腮腺炎、腮腺炎病毒、血吸虫病、血吸虫、甲型肝炎、甲型肝炎病毒、严重急性呼吸综合征、SARS病毒、水痘和水痘-带状疱疹病毒等。这里举例说明了一些容易在人群中间进行传播的传染病。同样的,本发明实施例提供的基于空间信息的传染病预测方法同样适用于在动物之间进行传播的传染病确诊数量进行预测的过程中。本发明对此不做限定。
在本发明这一实施方式中,在第一预设时间段内被确诊预设传染病的区域确诊数量是可以直接获得的。相关部门会具有这些累积确诊人数的统计数据。这里只需要作为传染病感染发现率确定方法的输入数据进行应用即可。
在本发明这一实施方式中,第一预设时间段可以是从进行传染病预测的时间点之前的一年、2年或3年等,对于预设传染病的确诊人数的统计,以年份为单位的参考和应用价值相对较高。因此,在下文中以第一预设时间段可以是从进行传染病预测的时间点之前的一年为例,对本发明的方案进行描述。但是实际应用过程中,可以根据实际情况设定第一预设时段的时长。例如,可以将第一预设时段的时长设定为半年、9个月、1年、2年或3年等,第一预设时间段的起止时间也可以根据实际需求设定,为了保证计算结果更为准确,可以取距离当前时刻较近的第一预设时间段。
在操作102中,获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,特征参数至少包括对象的以经纬度示出的位置信息。
在本发明这一实施方式中,特征参数包括预设区域的以下参数至少之一:人口密度、平均收入水平、人口移动率、区域内医院个数、区域GDP和气候的值。
在本发明这一实施方式中,针对以经纬度示出的位置信息,可以首先获取预设区域的地址信息,然后调用设定地图应用,以通过设定地图应用,将地址信息转换为以经纬度示出的位置信息。
举例说明,以一个地市作为预设区域,该地市的多个行政区分别作为一个预设区域。基于行政区域的地址信息,例如:河东区和河西区等,可以编写代码调用高德地图的API,获取对应的以经纬度示出的地理位置信息。这里是为了将第一设定时间段内被确诊预设传染病的多个确诊对象所处的行政区域的地址可视化,获取到多个确诊对象所处的行政区域的地址信息后,通过设定地图API,输出多个确诊对象对应的行政区域对应的经纬度。
在操作103中,根据多个确诊对象的特征参数和区域确诊数量,确定影响区域确诊数量的特征参数的影响系数。
在本发明这一实施方式中,可以根据多个确诊对象的特征参数,构建针对预设区域的预设传染病预测模型,根据区域确诊数量,确定预设传染病预测模型的多个回归系数,并根据多个回归系数,确定影响区域确诊数量的特征参数的影响系数。
具体的,可以采用GWR(Geographically weighted regression,地理加权回归)进行传染病预测模型的构建,GWR是一种空间分析技术,GWR通过建立空间范围内每个点处的局部回归方程,来探索研究对象在某一尺度下的空间变化及相关驱动因素,并可用于对未来结果的预测,能够充分考虑空间对象的局部效应,预测结果具有更高的准确性。这里,可以再次以一个地市作为预设区域,该地市的多个行政区分别作为一个预设区域进行说明。地理加权回归模型是在每个行政区域的被确诊预设传染病的多个确诊对象的特征参数过程中,充分考虑了以行政区域的经纬度示出的位置信息。如此,充分考虑的相同的特诊参数在不同的行政区域对预设传染病的影响力不同,确定每一特征参数随地理位置变化的空间异质性。在采用GWR构建的传染病预测模型中,将多个确诊对象的地理位置信息嵌入到每一特征参数的回归参数之中。
在本发明这一实施方式中,根据区域确诊数量,确定预设传染病预测模型的多个回归系数,可以采用以下公式(1)得到:
其中,yi表示预设区域被确诊预设传染病的对象的区域确诊数量;
(ui,vi)表示预设区域的经纬度坐标;
β0(ui,vi)表示预设区域的预设传染病预测模型的常数项,是在具体的模型构建或应用过程中针对预设区域预先设定的一个回归系数的基数;
βk(ui,vi)表示预设区域的第k个特征参数的回归系数;
xik表示预设区域的第k个特征参数的值,例如:人口密度的值;
εi表示预设区域的预设传染病预测模型的残差。
需要说明的是,本发明的传染病的确诊数量的预测方法最终目的是要预测一个预设区域在第二预设时间段被确诊预设传染病的确诊数量。再次以预设区域为一个地市,预设区域为该地市的一个行政区域为例。(ui,vi)可以表示预设区域的经纬度坐标,这里,一个行政子区域的面积相差非常小,这里选取一个采样点的经纬度坐标作为该行政区域的经纬度坐标。当然,这里也可以将行政区域再做一次划分,以多个更细节的区域划分来执行接下来的操作,本发明对此不做限定。
βk(ui,vi)可以是关于一个行政区域坐标的函数,用于表示预设区域的第k个特征参数的回归系数。可以采用如下公式(2)计算βk(ui,vi)。计算过程中可以采用如下公式(3)计算βi。计算包含了行政区域i附近的区域信息。
其中,W是对角行列式。可以采用如下公式(4),计算W(ui,vi)。
W(u0,v0)=Diag(w1(u0,v0),w2(u0,v0),…,wn(u0,v0) (4)
m是空间样点数,即对行政区域i的预设传染病的区域确诊数量有影响的采样点的个数;
k是自变量的个数,例如:人口密度等特征参数的个数;
Wi是构建针对行政区域i的预设传染病确诊数量的预设传染病预测模型过程中,赋予数据点n的权重,可以采用权函数得到,具体的,距离行政区域i越近的采样点,权重越大,距离行政区域i越远的采样点,权值越小。这里,采用GWR构建的传染病预测模型的过程中,地理加权回归的距离权重核函数,还可以使用Bi-square、exponential等核函数。
其中,将公式(2)中的进行展开后,得到如下的四个表达式:
经过以上计算,可以得到对应每个行政区域的一套回归系数的矩阵。其中,未详细描述的细节采用本领域通用的GWR模型构建过程的计算即可,本发明对此不做具体限定。
如此,相对针对某个大的区域的多个子区域进行全局建模的方式,加入空间信息的分析,能够挖掘出在全局中可能没有能有效描述的在部分区域有显著影响力的因素。并且结合全局数据分析,能够为更加精细的流病防控提供更有价值的参考和指导意见。
例如,通过对全国猩红热数据的分析,发现人口密度在不同地区对流行病传播的影响有较大的差异。在人口数较多的地区,人口密度的影响更大,回归系数较大。
在操作104中,根据影响系数,确定影响预设传染在预设区域的目标特征,以基于目标特征对预设传染病在预设区域进行预测。
在本发明这一实施方式中,可以通过t-test对多个特征参数的影响系数进行检验,确定设定个数的影响区域确诊数量的特征参数,以实现根据影响系数,确定影响预设传染在预设区域的目标特征,
举例说明,可以通过t-test(Student's t test,Student's检验)对多个特征参数的影响系数进行检验。t-test主要用于样本含量较小,总体标准差σ未知的正态分布,例如n<30。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
举例说明,通过回归系数分析,可以确定每一特征参数对预设区域的预设传染病的确诊数量的影响。取其中对预设区域的预设传染病的确诊数量影响较大的几个特征参数作为影响区域确诊数量的主要特征参数。这些特征参数也就是预设传染病在预设区域传播的主要影响因素。
通过上述操作101~103,已经确定影响区域确诊数量的特征参数的影响系数,进一步,将影响区域确诊数量的特征参数的影响系数和第二预设时间段各个特征参数的值代入操作103中所构建的针对预设区域的预设传染病预测模型中,即可确定预设区域在第二预设时间段内被确诊预设传染病的预计区域确诊数量。
在本发明这一实施方式中,还根据预设区域所包括的多个预设区域的区域预测确诊数量,确定预设区域的预计合计确诊数量。这里,就是一个将预设区域所包括的多个预设区域的区域确诊数量进行简单的求和的过程。
图2示出了本发明实施例基于空间信息的传染病预测方法的具体应用示例的实现流程示意图。
参考图2,本发明实施例基于空间信息的传染病预测方法的具体应用示例,以北京猩红热发病场景为例,以全北京每个行政区域有基础单位,得到一定时间段内每个行政区域的猩红热确认人数。基于行政区域地址信息,调用高德地图API获取行政区域对应的经纬度地理信息。然后基于经纬度和确诊人数对发病数据进行可视化,观察病例的空间分布。获取与猩红热发病可能有关的因素,如行政区域人口密度、收入水平等。结合行政区域的经纬度地理位置信息,使用地理加权回归的方法进行拟合建模,计算得到所有行政区域上的各候选影响因素的回归系数。至少包括如下操作流程:
操作201,传染病数据搜集;地址相关信息搜集;可能影响传播的相关因素搜集。
操作202,以地址信息作为输出,编写代码调用地图API,获取每个地址对应的经纬度。
操作203,病例空间分布可视化。
举例说明,如图3所示,示出了本发明实施例基于空间信息的传染病预测方法的具体应用示例的确诊数量在预设区域的多个子区域的分布情况示意图。
操作204,以经纬度、影响因素数据作为输入,病例数据作为输出,构建地理加权回归模型,得到各区域的回归系数及相关数据。
操作205,根据回归系数的大小,判定某个区域的主要影响因素,并通过t-test判断某个因素在哪些区域显著相关。
其中,操作201~205的具体实现过程与图1所示实施例中操作101~104的具体实现过程相类似,这里不再赘述。
本发明实施例基于空间信息的传染病预测方法、装置、设备及计算机可读存储介质,首先获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量和多个确诊对象的特征参数,并根据多个确诊对象的特征参数和区域确诊数量,确定影响区域确诊数量的特征参数的影响系数,最后根据影响系数,确定影响预设传染在预设区域的目标特征,以基于目标特征对预设传染病在预设区域进行预测,其中,特征参数至少包括对象的以经纬度示出的位置信息。由此,加入被确诊预设传染病的确诊对象的空间位置信息,并基于此挖掘影响传染病传播的影响因子,快速准确的分析传染病的影响因素,为传染病的防控提供重要参考数据。
如图4所示,为本发明基于空间信息的传染病预测装置的一个具体实施例。本实施例装置,即用于执行图1~3方法的实体装置。其技术方案本质上与上述实施例一致,上述实施例中的相应描述同样适用于本实施例中。参考图4,本发明实施例提供一种基于空间信息的传染病预测装置,装置40包括:第一获取模块401,用于获取预设子区域在第一预设时间段内被确诊预设传染病的区域确诊数量;第二获取模块402,用于获取预设子区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,特征参数至少包括对象的以经纬度示出的位置信息;第一系数确定模块403,用于根据多个确诊对象的特征参数和区域确诊数量,确定影响区域确诊数量的特征参数的影响系数;特征确定模块404,用于根据影响系数,确定影响区域预设传染病确诊数量的设定个数的特征参数。
根据本发明一实施方式,第二获取模块402,包括:地址获取子模块,用于获取多个确诊对象的特征参数中的地址信息;转换子模块,用于将地址信息转换为以经纬度示出的位置信息。
根据本发明一实施方式,第一系数确定模块403包括:模型构建子模块,用于根据多个确诊对象的特征参数,构建针对预设区域的预设传染病预测模型;回归子模块,用于根据区域确诊数量,确定预设传染病预测模型中针对每一特征参数对应的多个回归系数;系数确定子模块,用于根据多个回归系数,确定影响区域确诊数量的特征参数的影响系数。
根据本发明一实施方式,回归子模块采用以下方式根据区域确诊数量,确定预设传染病预测模型中针对每一特征参数对应的多个回归系数:
其中,yi表示预设区域被确诊预设传染病的区域确诊数量;
(ui,vi)表示预设区域的经纬度坐标;
β0(ui,vi)表示预设区域的预设传染病预测模型的常数项;
βk(ui,vi)表示预设区域的第k个特征参数的回归系数;
xik表示预设区域的第k个特征参数的值;
εi表示预设区域的预设传染病预测模型的残差。
根据本发明一实施方式,特征确定模块404包括:检验子模块,用于通过t-test对多个特征参数的影响系数进行检验,确定设定个数的影响区域确诊数量的特征参数。
根据本发明一实施方式,特征参数包括预设区域的以下参数至少之一:人口密度、平均收入水平、人口移动率、区域内医院个数、区域GDP和气候的值。
根据本发明一实施方式,装置40还包括:第三获取模块,用于获取预设区域在第二预设时间段内目标特征对应的数据;预测模块,用于根据目标特征对应的数据,预测预设区域在第二预设时间段内传染病患者数量。
图5是本发明实施例提供的一种设备的结构示意图。在硬件层面,该设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放执行指令。具体地,执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器,并向处理器提供执行指令和数据。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成基于空间信息的传染病预测装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的基于空间信息的传染病预测方法。
上述如本发明图4所示实施例提供的基于空间信息的传染病预测装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提出了一种可读介质,该可读存储介质存储有执行指令,存储的执行指令被电子设备的处理器执行时,能够使该电子设备执行本发明任一实施例中提供的基于空间信息的传染病预测方法,并具体用于执行如图1~图3所示的方法。
前述各个实施例中的电子设备可以为计算机。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种基于空间信息的传染病预测方法,其特征在于,所述方法包括:
获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;
获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,所述特征参数至少包括对象的以经纬度示出的位置信息;
根据所述多个确诊对象的特征参数和所述区域确诊数量,确定影响所述区域确诊数量的特征参数的影响系数;
根据所述影响系数,确定影响所述预设传染病在所述预设区域的目标特征,以基于所述目标特征对所述预设传染病在所述预设区域进行预测。
2.根据权利要求1所述的方法,其特征在于,所述获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,包括:
获取所述多个确诊对象的特征参数中的地址信息;
将所述地址信息转换为以经纬度示出的位置信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个确诊对象的特征参数和所述区域确诊数量,确定影响所述区域确诊数量的特征参数的影响系数,包括:
根据所述多个确诊对象的特征参数,构建针对所述预设区域的预设传染病预测模型;
根据所述区域确诊数量,确定所述预设传染病预测模型中针对每一特征参数对应的多个回归系数;
根据所述多个回归系数,确定影响所述区域确诊数量的特征参数的影响系数。
5.根据权利要求1所述的方法,其特征在于,所述根据所述影响系数,确定影响所述预设传染在所述预设区域的目标特征,包括:
通过t-test对多个特征参数的影响系数进行检验,确定设定个数的影响所述区域确诊数量的目标特征。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述特征参数包括所述预设区域的以下参数至少之一:人口密度、平均收入水平、人口移动率、区域内医院个数、区域GDP和气候的值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述预设区域在第二预设时间段内目标特征对应的数据;
根据所述目标特征对应的数据,预测所述预设区域在第二预设时间段内传染病患者数量。
8.一种基于空间信息的传染病预测装置,其特征在于,所述装置包括:
第一获取模块,用于获取预设区域在第一预设时间段内被确诊预设传染病的区域确诊数量;
第二获取模块,用于获取预设区域在第一预设时间段内被确诊预设传染病的多个确诊对象的特征参数,所述特征参数至少包括对象的以经纬度示出的位置信息;
第一系数确定模块,用于根据所述多个确诊对象的特征参数和所述区域确诊数量,确定影响所述区域确诊数量的特征参数的影响系数;
特征确定模块,用于根据所述影响系数,确定影响所述预设传染病在所述预设区域的目标特征,以基于所述目标特征对所述预设传染病在所述预设区域进行预测。
9.一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于空间信息的传染病预测方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一项所述的基于空间信息的传染病预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210337550.7A CN114613518A (zh) | 2022-03-31 | 2022-03-31 | 基于空间信息的传染病预测方法、装置、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210337550.7A CN114613518A (zh) | 2022-03-31 | 2022-03-31 | 基于空间信息的传染病预测方法、装置、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114613518A true CN114613518A (zh) | 2022-06-10 |
Family
ID=81866913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210337550.7A Pending CN114613518A (zh) | 2022-03-31 | 2022-03-31 | 基于空间信息的传染病预测方法、装置、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114613518A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115050486A (zh) * | 2022-08-11 | 2022-09-13 | 中电科新型智慧城市研究院有限公司 | 传染病辅助防控方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111524610A (zh) * | 2020-04-24 | 2020-08-11 | 南方科技大学 | 预测传染病的确诊人数的方法、装置、设备和存储介质 |
CN111640515A (zh) * | 2020-05-26 | 2020-09-08 | 深圳市通用互联科技有限责任公司 | 区域的疫情风险确定方法、装置、计算机设备和存储介质 |
CN111652446A (zh) * | 2020-06-15 | 2020-09-11 | 深圳前海微众银行股份有限公司 | 传染病感染风险的预测方法、设备及存储介质 |
CN113113154A (zh) * | 2021-04-16 | 2021-07-13 | 南方科技大学 | 一种传染病防控方法、装置、计算机设备及存储介质 |
CN113539509A (zh) * | 2020-04-21 | 2021-10-22 | 香港理工大学深圳研究院 | 新发传染病发病风险预测方法、装置、终端设备及介质 |
-
2022
- 2022-03-31 CN CN202210337550.7A patent/CN114613518A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113539509A (zh) * | 2020-04-21 | 2021-10-22 | 香港理工大学深圳研究院 | 新发传染病发病风险预测方法、装置、终端设备及介质 |
CN111524610A (zh) * | 2020-04-24 | 2020-08-11 | 南方科技大学 | 预测传染病的确诊人数的方法、装置、设备和存储介质 |
CN111640515A (zh) * | 2020-05-26 | 2020-09-08 | 深圳市通用互联科技有限责任公司 | 区域的疫情风险确定方法、装置、计算机设备和存储介质 |
CN111652446A (zh) * | 2020-06-15 | 2020-09-11 | 深圳前海微众银行股份有限公司 | 传染病感染风险的预测方法、设备及存储介质 |
CN113113154A (zh) * | 2021-04-16 | 2021-07-13 | 南方科技大学 | 一种传染病防控方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
肖雄: "地理加权回归模型在传染病空间分析中的应用", 中国卫生统计, vol. 30, no. 6, 31 December 2013 (2013-12-31), pages 833 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115050486A (zh) * | 2022-08-11 | 2022-09-13 | 中电科新型智慧城市研究院有限公司 | 传染病辅助防控方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hammoudi et al. | Deep learning on chest X-ray images to detect and evaluate pneumonia cases at the era of COVID-19 | |
Ryan et al. | A review of land-use regression models for characterizing intraurban air pollution exposure | |
Reis et al. | Impact of environment and social gradient on Leptospira infection in urban slums | |
Jerrett et al. | A review and evaluation of intraurban air pollution exposure models | |
Larson et al. | Sampling manholes to home in on SARS-CoV-2 infections | |
Yao et al. | Examining the diffusion of coronavirus disease 2019 cases in a metropolis: a space syntax approach | |
Zhang et al. | Spatial measurement errors in the field of spatial epidemiology | |
CN113539509A (zh) | 新发传染病发病风险预测方法、装置、终端设备及介质 | |
Weinberger et al. | Levels and determinants of tree pollen in New York City | |
Durr et al. | Bayesian hierarchical modelling to enhance the epidemiological value of abattoir surveys for bovine fasciolosis | |
CN114613518A (zh) | 基于空间信息的传染病预测方法、装置、存储介质及设备 | |
Lewis et al. | Estimating local chlamydia incidence and prevalence using surveillance data | |
Madsen et al. | Evaluating the use of local ecological knowledge (LEK) in determining habitat preference and occurrence of multiple large carnivores | |
Takahashi et al. | Simulation of expected childhood and adolescent thyroid cancer cases in Japan using a cancer-progression model based on the National Cancer Registry: application to the first-round thyroid examination of the Fukushima Health Management Survey | |
Chen et al. | Mitigating COVID-19 outbreak via high testing capacity and strong transmission-intervention in the United States | |
Lurier et al. | Evaluation using latent class models of the diagnostic performances of three ELISA tests commercialized for the serological diagnosis of Coxiella burnetii infection in domestic ruminants | |
Goldstein et al. | A Bayesian approach to improving spatial estimates of prevalence of COVID-19 after accounting for misclassification bias in surveillance data in Philadelphia, PA | |
Zhang et al. | Nonparametric methods for measurements below detection limit | |
CN113793690A (zh) | 传染病的区域风险评估方法、装置、存储介质及设备 | |
Owers et al. | Fine-scale GPS tracking to quantify human movement patterns and exposure to leptospires in the urban slum environment | |
VanderEnde et al. | New analytic approaches for analyzing and presenting polio surveillance data to supplement standard performance indicators | |
Berchet et al. | Objectified quantification of uncertainties in Bayesian atmospheric inversions | |
Gonzalez et al. | Tijuana childhood lead risk assessment revisited: validating a GIS model with environmental data | |
Sidibé et al. | Performance evaluation of two serological tests for contagious bovine pleuropneumonia (CBPP) detection in an enzootic area using a Bayesian framework | |
Zheng et al. | Influence and prediction of meteorological factors on brucellosis in a northwest region of China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |