CN113571201A - 一种流行性呼吸系统疾病发病人数和上升趋势预测方法 - Google Patents

一种流行性呼吸系统疾病发病人数和上升趋势预测方法 Download PDF

Info

Publication number
CN113571201A
CN113571201A CN202110910031.0A CN202110910031A CN113571201A CN 113571201 A CN113571201 A CN 113571201A CN 202110910031 A CN202110910031 A CN 202110910031A CN 113571201 A CN113571201 A CN 113571201A
Authority
CN
China
Prior art keywords
data
time
climate
epidemic
respiratory system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110910031.0A
Other languages
English (en)
Inventor
姚凌
吕宁
秦军
陆佳莺
刘唐
姜侯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Geographic Sciences and Natural Resources of CAS
Original Assignee
Institute of Geographic Sciences and Natural Resources of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Geographic Sciences and Natural Resources of CAS filed Critical Institute of Geographic Sciences and Natural Resources of CAS
Priority to CN202110910031.0A priority Critical patent/CN113571201A/zh
Publication of CN113571201A publication Critical patent/CN113571201A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种流行性呼吸系统疾病发病人数和上升趋势预测方法,获取已有的气候监测数据和病人数据;根据监测到数据,其中数据包括平均气温、平均气压和平均空气质量指数,并筛选出所需的气候因子;呼吸系统疾病按照气管炎、肺部感染和胸腔感染三类进行划分;建立病人数据与气候因子指标的时序连接。本发明提供了一种流行性呼吸系统疾病发病人数和上升趋势预测方法,通过对感染流行性呼吸系统疾病时的气候要素进行观测,然后对流行性呼吸系统疾病与气候状况之间的分析,以流行性呼吸系统疾病发病趋势和日期来进行科学有效的预测未来一段时间内流行性呼吸系统疾病的发病情况,以为民众提供有效的预防提示。

Description

一种流行性呼吸系统疾病发病人数和上升趋势预测方法
技术领域
本发明涉及疾病防控领域,尤其涉及一种流行性呼吸系统疾病发病人数和上升趋势预测方法。
背景技术
呼吸系统疾病是一种常见病、多发病,主要病变在气管、支气管、肺部及胸腔,病变轻者多咳嗽、胸痛、呼吸受影响,重者呼吸困难、缺氧,甚至呼吸衰竭而致死,呼吸系统疾病作为危害人类健康的主要疾病之一,特别随着天气的变化,流行性呼吸系统疾病很容易出现爆发的状况,如何通过科学有效的预测未来一段时间内流行性呼吸系统疾病的发病情况成为人们主要的研究对象,为此,我们提出一种流行性呼吸系统疾病发病人数和上升趋势预测方法。
发明内容
基于背景技术存在的技术问题,本发明提出了一种流行性呼吸系统疾病发病人数和上升趋势预测方法。
本发明提供如下技术方案:
一种流行性呼吸系统疾病发病人数和上升趋势预测方法,包括如下步骤:
A、数据采集:获取已有的气候监测数据和病人数据;
(1)气候监测数据处理:根据监测到数据,其中数据包括平均气温、平均气压和平均空气质量指数,并筛选出所需的气候因子;
(2)病人数据处理:呼吸系统疾病按照气管炎、肺部感染和胸腔感染三类进行划分;
B、筛选:建立病人数据与气候因子指标的时序连接,将病人感染出现症状时间与天气记录的时间对应,然后计算出以时间为单位每一天的气候状况和病人数量;
C、预测:根据计算出的数据与流行性呼吸系统疾病发布指数,生成流行性呼吸系统疾病发病趋势预测提示。
优选的,所述步骤A在数据采集时,也可获取一定时间范围内的潜在样本数据;所述潜在样本数据包括:风速、平均气温、平均气压、降水量、平均湿度、最高气温、最低气温、平均空气质量指数和病例数,并对得到的数据分布特征进行分析,可得到基于时间上的数据分布特征。
优选的,所述步骤A中在获取气候监测数据时,也可获取城市中各设定区域的人口密度数据、大气污染物数据、气象数据及病例数据;然后构建与发病人数之间的暴露-反应关系模型,暴露-反应关系模型公式如下:
log[E(Yt)]=α+DOW+βf(xt)+S(time,df)+S(Zt,df)
其中,t为观察日期,E(Yt)为t日疾病人数的期望值,DOW为虚拟变量星期效应,α为截距,β为回归系数,为t日的污染物浓度,S(time,df)、S(Zt,df)分别代表日历效应以及气象条件的平滑函数;所述气象条件包括温度、相对湿度。
优选的,所述步骤B中在计算时,给出两个时间序列,分别为特征气候因子指标的时间序列x(t)和某一类型的呼吸系统疾病病人数量的时间序列y(t):
x(t)={x(t),x(t-δt),...,x(t-(n-1)δt)};
y(t)={y(t),y(t-δt),...,y(t-(n-1)δt)};
n是嵌入维度,δt表示时间间隔。
本发明提供了一种流行性呼吸系统疾病发病人数和上升趋势预测方法,通过对感染流行性呼吸系统疾病时的气候要素进行观测,然后对流行性呼吸系统疾病与气候状况之间的分析,以流行性呼吸系统疾病发病趋势和日期来进行科学有效的预测未来一段时间内流行性呼吸系统疾病的发病情况,以为民众提供有效的预防提示。
具体实施方式
对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种技术方案:
一种流行性呼吸系统疾病发病人数和上升趋势预测方法,包括如下步骤:
A、数据采集:获取已有的气候监测数据和病人数据;
(1)气候监测数据处理:根据监测到数据,其中数据包括平均气温、平均气压和平均空气质量指数,并筛选出所需的气候因子;
(2)病人数据处理:呼吸系统疾病按照气管炎、肺部感染和胸腔感染三类进行划分;
B、筛选:建立病人数据与气候因子指标的时序连接,将病人感染出现症状时间与天气记录的时间对应,然后计算出以时间为单位每一天的气候状况和病人数量;
C、预测:根据计算出的数据与流行性呼吸系统疾病发布指数,生成流行性呼吸系统疾病发病趋势预测提示。
具体的,从天气公开网站以天为维度自动爬取城市的日期、最高气温、最低气温、天气、风力信息数据,得到天气数据,然后对数据进行转换处理;
数据转换:对空气质量数据和天气数据的多个指标进行数据转换。其中,针对天气进行数值编码,转换规则为:小雨、中雨、阵雨、大雨、暴雨;
进一步地,所述步骤A在数据采集时,也可获取一定时间范围内的潜在样本数据;所述潜在样本数据包括:风速、平均气温、平均气压、降水量、平均湿度、最高气温、最低气温、平均空气质量指数和病例数,并对得到的数据分布特征进行分析,可得到基于时间上的数据分布特征。
具体的,对潜在样本数据中的每个数据进行分布特征分析,得到各潜在样本数据基于时间轴的数据分布特征;也可通过对潜在样本数据中的每个数据绘制分布图,就能够直观的看出疾病的高发期、低发期等特征以及其它一些指标的分布特征;
具体的,将气象要素相关的数据进行分析,得出病例数与气象要素相关的数据的多元线形相关性,结合分布特征,就可以识别出潜在样本数据中与病例数有较强相关性的数据,作为样本数据,将没有关系或相关性不明显的气象数据剔除;
进一步地,所述步骤A中在获取气候监测数据时,也可获取城市中各设定区域的人口密度数据、大气污染物数据、气象数据及病例数据;然后构建与发病人数之间的暴露-反应关系模型,暴露-反应关系模型公式如下:
log[E(Yt)]=α+DOW+βf(xt)+S(time,df)+S(Zt,df)
其中,t为观察日期,E(Yt)为t日疾病人数的期望值,DOW为虚拟变量星期效应,α为截距,β为回归系数,为t日的污染物浓度,S(time,df)、S(Zt,df)分别代表日历效应以及气象条件的平滑函数;所述气象条件包括温度、相对湿度。
进一步地,所述步骤B中在计算时,给出两个时间序列,分别为特征气候因子指标的时间序列x(t)和某一类型的呼吸系统疾病病人数量的时间序列y(t):
x(t)={x(t),x(t-δt),...,x(t-(n-1)δt)};
y(t)={y(t),y(t-δt),...,y(t-(n-1)δt)};
n是嵌入维度,δt表示时间间隔。
基于LSTM网络模型的疾病人数预测方法
S1、基于人口密度采用自然断点法进行分类,根据分类结果将城市划分为若干个子区域,并获取每个子区域的人口密度数据、大气污染物数据、气象数据及病例数据;
S2、处理PM2.5的气象站点日监测数据,采用批量空间统计算法求出不同子区域每日PM2.5平均浓度水平,得到PM2.5逐日均浓度时间序列数据;
S3、在医学信息中心系统数据库中采用ICD编码或者关键字筛选方式将疾病病例数据根据目标病种分类统计,并基于患者住址信息统计不同子区域内目标病种每日发病人数,得到逐日发病人数的时间序列数据;
S4、选取不同滞后天数验证PM2.5对目标病种滞后效应的显著性,确定存在显著滞后效应的最大滞后天数L;
S5、以每日发病人数为因变量Y,以日均PM2.5浓度为自变量X,以区域人口密度为辅助参数,构建基于长短期记忆网络(LSTM)的人数预报模型,模型中时间步长参数设置参考S4中的最大滞后天数L;
S6、将S2、S3中的时间序列样本数据输入预报模型进行训练,基于训练结果、通过输入PM2.5浓度以及人口密度参数对区域目标病种在未来L天内的每日发病人数进行预报。
结合大气污染物和气象条件对人体呼吸系统疾病的影响,采用深度学习技术进行目标病种发病人数预测,能够有效地提高呼吸系统疾病人数的预测精度;同时,将大气污染物对呼吸系统疾病影响的滞后效应纳入分析之中,提出了基于滞后分析的深度学习时间步长设置方法,能够在保证模型合理性的前提下,有效地简化LSTM网络参数的调优过程。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种流行性呼吸系统疾病发病人数和上升趋势预测方法,其特征在于,包括如下步骤:
A、数据采集:获取已有的气候监测数据和病人数据;
(1)气候监测数据处理:根据监测到数据,其中数据包括平均气温、平均气压和平均空气质量指数,并筛选出所需的气候因子;
(2)病人数据处理:呼吸系统疾病按照气管炎、肺部感染和胸腔感染三类进行划分;
B、筛选:建立病人数据与气候因子指标的时序连接,将病人感染出现症状时间与天气记录的时间对应,然后计算出以时间为单位每一天的气候状况和病人数量;
C、预测:根据计算出的数据与流行性呼吸系统疾病发布指数,生成流行性呼吸系统疾病发病趋势预测提示。
2.根据权利要求1所述的一种流行性呼吸系统疾病发病人数和上升趋势预测方法,其特征在于:所述步骤A在数据采集时,也可获取一定时间范围内的潜在样本数据;所述潜在样本数据包括:风速、平均气温、平均气压、降水量、平均湿度、最高气温、最低气温、平均空气质量指数和病例数,并对得到的数据分布特征进行分析,可得到基于时间上的数据分布特征。
3.根据权利要求1所述的一种流行性呼吸系统疾病发病人数和上升趋势预测方法,其特征在于:所述步骤A中在获取气候监测数据时,也可获取城市中各设定区域的人口密度数据、大气污染物数据、气象数据及病例数据;然后构建与发病人数之间的暴露-反应关系模型,暴露-反应关系模型公式如下:
log[E(Yt)]=α+DOW+βf(xt)+S(time,df)+S(Zt,df)
其中,t为观察日期,E(Yt)为t日疾病人数的期望值,DOW为虚拟变量星期效应,α为截距,β为回归系数,为t日的污染物浓度,S(time,df)、S(Zt,df)分别代表日历效应以及气象条件的平滑函数;所述气象条件包括温度、相对湿度。
4.根据权利要求1所述的一种流行性呼吸系统疾病发病人数和上升趋势预测方法,其特征在于:所述步骤B中在计算时,给出两个时间序列,分别为特征气候因子指标的时间序列x(t)和某一类型的呼吸系统疾病病人数量的时间序列y(t):
x(t)={x(t),x(t-δt),...,x(t-(n-1)δt)};
y(t)={y(t),y(t-δt),...,y(t-(n-1)δt)};
n是嵌入维度,δt表示时间间隔。
CN202110910031.0A 2021-08-09 2021-08-09 一种流行性呼吸系统疾病发病人数和上升趋势预测方法 Pending CN113571201A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110910031.0A CN113571201A (zh) 2021-08-09 2021-08-09 一种流行性呼吸系统疾病发病人数和上升趋势预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110910031.0A CN113571201A (zh) 2021-08-09 2021-08-09 一种流行性呼吸系统疾病发病人数和上升趋势预测方法

Publications (1)

Publication Number Publication Date
CN113571201A true CN113571201A (zh) 2021-10-29

Family

ID=78171044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110910031.0A Pending CN113571201A (zh) 2021-08-09 2021-08-09 一种流行性呼吸系统疾病发病人数和上升趋势预测方法

Country Status (1)

Country Link
CN (1) CN113571201A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047594A (zh) * 2019-05-27 2019-07-23 北京气象在线科技有限公司 基于气象环境监测数据的呼吸系统疾病发病趋势预测方法
CN110706823A (zh) * 2019-11-15 2020-01-17 广州地理研究所 一种基于滞后分析和lstm的呼吸系统疾病发病人数预测方法
CN111180073A (zh) * 2020-01-15 2020-05-19 杭州师范大学 基于气候因素的脑血管疾病高危人群风险预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047594A (zh) * 2019-05-27 2019-07-23 北京气象在线科技有限公司 基于气象环境监测数据的呼吸系统疾病发病趋势预测方法
CN110706823A (zh) * 2019-11-15 2020-01-17 广州地理研究所 一种基于滞后分析和lstm的呼吸系统疾病发病人数预测方法
CN111180073A (zh) * 2020-01-15 2020-05-19 杭州师范大学 基于气候因素的脑血管疾病高危人群风险预测方法

Similar Documents

Publication Publication Date Title
JP6129028B2 (ja) 建物動力設備のエネルギー消費量予測方法
CN116451879A (zh) 一种干旱风险预测方法、系统及电子设备
CN111639823A (zh) 一种基于特征集构建的建筑冷热负荷预测方法
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
CN114217025B (zh) 评估空气质量浓度预测中气象数据对其影响的分析方法
Liu et al. Research on data correction method of micro air quality detector based on combination of partial least squares and random forest regression
CN114970675A (zh) 基于特征选择的人工鼻冰箱食物新鲜度检测系统和方法
CN114066070A (zh) 基于人工智能和数值计算的天气预报方法
Carlin et al. Spatio-temporal hierarchical models for analyzing Atlanta pediatric asthma ER visit rates
CN113571201A (zh) 一种流行性呼吸系统疾病发病人数和上升趋势预测方法
CN116779172A (zh) 一种基于集成学习的肺癌疾病负担风险预警方法
CN116776263A (zh) 基于数据驱动的街区尺度建筑高能耗异常检测方法及系统
Adedotun et al. Modelling and forecasting climate time series with state-space model
CN114611399A (zh) 一种基于NGBoost算法的PM2.5浓度长时间序列预测方法
CN115526330A (zh) 有机物走航数据校准方法、装置、计算机设备和存储介质
LU505334B1 (en) Infectious disease trend prediction system and method based on big data
CN109784553B (zh) 一种室内pm2.5浓度预估方法
CN117557409B (zh) 基于物联网的智慧建筑火灾风险可视化评估管理系统
CN112582058B (zh) 一种基于空气质量的慢阻肺发病预测方法及系统
CN114328496A (zh) 一种中央空调云-边双端数据的降噪处理方法与系统
CN109492928B (zh) 一种构建森林火险预测模型的方法及装置
CN118053558A (zh) 一种用于哮喘病房的环境检测方法及系统
CN117592009A (zh) 面向径流预报的因子降维及误差校正方法及系统
CN115620876A (zh) 一种基于气象指标与负氧离子的森林康养潜力评价方法
CN117789853A (zh) 工业热源对大气污染物浓度影响的评估方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination