CN104809335A - 一种环境变化对疾病发病影响的分析预测模型 - Google Patents

一种环境变化对疾病发病影响的分析预测模型 Download PDF

Info

Publication number
CN104809335A
CN104809335A CN201510170135.7A CN201510170135A CN104809335A CN 104809335 A CN104809335 A CN 104809335A CN 201510170135 A CN201510170135 A CN 201510170135A CN 104809335 A CN104809335 A CN 104809335A
Authority
CN
China
Prior art keywords
alpha
sigma
regression
model
environmental pollution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510170135.7A
Other languages
English (en)
Other versions
CN104809335B (zh
Inventor
杨冬艳
马成龙
张敬谊
于广军
李光亚
陈诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WANDA INFORMATION CO Ltd
SHANGHAI HEALTH INFORMATION ENGINEERING TECHNOLOGY RESEARCH CENTER Co Ltd
Original Assignee
WANDA INFORMATION CO Ltd
SHANGHAI HEALTH INFORMATION ENGINEERING TECHNOLOGY RESEARCH CENTER Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WANDA INFORMATION CO Ltd, SHANGHAI HEALTH INFORMATION ENGINEERING TECHNOLOGY RESEARCH CENTER Co Ltd filed Critical WANDA INFORMATION CO Ltd
Priority to CN201510170135.7A priority Critical patent/CN104809335B/zh
Publication of CN104809335A publication Critical patent/CN104809335A/zh
Application granted granted Critical
Publication of CN104809335B publication Critical patent/CN104809335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明通过对门诊量数据与气象变化和环境污染数据的关联情况进行分析,构建基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对门诊量影响的预测模型,对医院各科室的每周门诊量进行预测。使患者能够提前规避致病的不良气象条件和环境污染因素的影响,合理的安排日常活动;医院能够针对高发疾病合理配置各个科室的医疗资源和人手;公共卫生部门能够提前做好应急准备等,对特定人群进行提前干预,从而减少疾病的发病率,提高人类生活质量。

Description

一种环境变化对疾病发病影响的分析预测模型
技术领域
本发明涉及一种基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对门诊量影响的预测方法。
背景技术
人类健康与所处的外部环境因素息息相关,其中气象条件变化与环境污染对人类疾病的发生尤其相关。气象变化和环境污染对健康的影响已经成为普遍关注的焦点问题。目前,人们对气象变化和环境污染对疾病发病率的影响方面大多还处于感性的认识。都认为有影响,但对哪些疾病有影响以及影响程度如何?缺少定性和定量的分析。
发明内容
本发明的目的是提供一种环境变化对疾病发病率的影响程度的定量分析方法。
为了达到上述目的,本发明的技术方案是提供了一种环境变化对疾病发病影响的分析预测模型,其特征在于,包括:
输入输出数据模块,该输入输出数据模块的输入数据为:整理好的气象和环境污染因子的时序数据;该输入输出数据模块的输出数据为:各科室的门诊预测量;
数据预处理模块,用于:
对气象和环境污染因子决策矩阵 X = x 11 x 12 . . . x 1 J x 21 x 22 . . . x 2 J . . . . . . x ij . . . . . x I 1 x I 2 . . . x IJ 进行归一化处理,其中,xij表示第i天的第j项气象和环境污染因子的数据指标;再计算归一化后的决策矩阵X的相关系数矩阵 R = r 11 r 12 . . . r 1 J r 21 r 22 . . . r 2 J . . . . . . r ij . . . . . r I 1 r I 2 . . . r IJ , 其中rij表示第i天的第j项气象和环境污染因子数据指标的相关系数,且rij=rji;同时计算气象和环境污染因子与各科室门诊量的相关系数;
非参数泊松回归模型模块,用于:
1)构建非参数泊松回归模型,采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量研究结果,将气象因子和环境污染因子作为变量引入模型,分别观察其对门诊量的影响:
log[E(Yi)]=a+ns[Xi]+YEAR+DOW+s(meteoro log y,df)+s(environment,df)
式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a为截距;Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量;s(meteoro logy,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数;
2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度,根据非参数泊松回归模型计算出各气象和环境污染因子的回归系数β,计算当各气象和环境污染因子变化四分位间距IQR时,门诊量自然对数的相对改变量,公式:[exp(β×IQR)-1]×100%,并在此基础上计算平均百分比改变的95%的置信区间;
3)敏感性分析:分析当气象因子和环境因子变化时,将在多长时间内对门诊量造成影响,采用滞后效应进行研究,选择分析滞后期lag为0~7天的气象和环境污染因子效应。最后,根据非参数泊松回归模型计算出回归系数β,由β计算出不同滞后天数的RR值,根据RR值确定最佳滞后期;
降维模块,用于:求取相关系数矩阵R所对应的J个特征根以及特征向量,每个特征根对应一个主成分,并选取累积方差贡献度大于等于指定阀值的主成分,则从J个主成分中筛选出p个主成分及特征向量;计算各个主成分因子在各个变量上的成分得分矩阵,得到p个主成分在每周的得分;
数据分区模块,采用交叉验证的方法将输入向量矩阵及输出变量分为训练集和测试集,输入向量矩阵为p+2维,由降维模块中得到的主成分得分与年份亚变量和节假日变量组合构成,输出变量为下周的科室就诊人数平均值;
构建支持向量回归机模块,包括如下步骤:
第一步、模型参数选择,用于构建支持向量回归机的输入和输出,并且选择支持向量回归机的特征参数,其中,特征参数包括核函数、初始的惩罚因子C和核函数参数δ的试凑范围与步长,以及初始的精度参数ε,通过核函数将数据映射到高维的向量空间中,在约束条件,其中,xi为l维空间的输入向量,yi为l维空间的输出向量,w为特征空间连接到输出空间的权值参数,φ(x)为x在特征空间的像,b为偏置或者负阀值:
<w,φ(xi)>+b-yi≤ξi *+ε,i=1,...,l
yi-<w,φ(xi)>-b≤ξi+ε,i=1,...,l
ξi,ξi *≥0,i=1,...,l
下求解目标函数,其中,C为选定的正参数:
min 1 2 | | w | | 2 + C &Sigma; i = 1 l &lambda; i ( &xi; i + &xi; i * )
该问题的对偶形式为:
max - 1 2 &Sigma; i , j = 1 l ( &alpha; i - &alpha; i * ) ( &alpha; j - &alpha; j * ) K ( x i , x j ) + &Sigma; i = 1 l ( &alpha; i - &alpha; i * ) y i - &Sigma; i = 1 l ( &alpha; i - &alpha; i * ) &epsiv;
其中约束条件为:
&Sigma; j = 1 l ( &alpha; j - &alpha; j * ) = 0
0≤αi,αi *≤λiC,i=1,2,...l
从而求解出参数αi和αi *
第二步、训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
f ( x ) = &Sigma; j = 1 l ( &alpha; j - &alpha; j * ) K ( x i , x ) + b
根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能力评价指标,判断回归函数f(x)是否满足性能要求,若回归函数f(x)不满足性能要求,则需要调整支持向量回归机中的核函数和特征参数重新训练模型,并保存最终结果;
第三步、根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值。
优选地,还包括:模型预测能力评估模块,其实施过程包括:
第一步、用支持向量回归机计算医院各科室的就诊人数的预测值;
第二步、获取各科室就诊人数的实际值,各科室就诊人数的预测值和实际值是同一时间段的就诊人数;
第三步、计算预测值与实际值之间的差异,并根据误差图对模型的预测效果进行评估,若模型的预测能力较差,则需要重新选择模型参数、重新训练模型,从而构建基于支持向量回归机的气象环境污染因子的就诊人数预测模型。
优选地,在数据预处理模块中,对决策矩阵X中第i天的第j项气象和环境污染因子数据指标xij进行归一化处理后得到zij,则式中,x′及σ分别为xij的期望和方差。
优选地,在构建支持向量回归机模块,所述核函数为Sigmoid核函数,其表达式为式中,c1为倾斜系数,c2为常数参数;或所述核函数为径向基核函数,其表达式为式中,γ为1/k(其中k为类别数);或所述核函数为多项式核函数,其表达式为式中,γ为1/k(其中k为类别数),a为常量参数,d为最高次项次数。
优选地,在所述构建支持向量回归机模块中,引入拉格朗日函数得到目标函数的对偶形式,如下所示:
L ( w , b , &xi; , &alpha; , &alpha; * , &gamma; ) = 1 2 | | w | | 2 + C &Sigma; j = 1 l &xi; i - &Sigma; i = 1 l &alpha; i [ &xi; i + &epsiv; - y i + f ( x i ) ] - &Sigma; i = 1 l &alpha; i * [ &xi; i + &epsiv; + y i - f ( x i ) ] - &Sigma; i = 1 l &gamma; i &xi; i
其中αi,αi *,γi≥0,i=1,...,l
函数L的极值应满足条件:
&PartialD; &PartialD; w L = 0 , &PartialD; &PartialD; b L = 0 , &PartialD; &PartialD; &xi; i L = 0
得到下面的式子:
w = &Sigma; i = 1 l ( &alpha; i - &alpha; i * ) &phi; ( x i )
&Sigma; i = 1 l ( &alpha; i - &alpha; i * ) = 0
C-αii *i=0
将上面3个公式带入到拉格朗日函数中即可得到函数的对偶形式。
优选地,在构建支持向量回归机模块的第二步的训练模型中,模型拟合能力评价指标:实际输出与期望输出之间的均方误差MAE以及拟合优度R2由下面的公式给出:
MAE = 1 n &Sigma; i = 1 n ( y ^ i - y i ) 2
R 2 = ( n &Sigma; i = 1 n y ^ i y i - &Sigma; i = 1 n y ^ i &Sigma; i = 1 n y i ) 2 ( n &Sigma; i = 1 n y ^ i 2 - ( &Sigma; i = 1 n y ^ i ) 2 ) ( n &Sigma; i = 1 n y i 2 - ( &Sigma; i = 1 n y i ) 2 )
式中,表示第i周的日平均就诊人数的预测值,yi表示第i周的日平均就诊人数的真实值,n,0<n<I,表示周数,其中MAE越小和R2越接近于1,表示所建立的支持向量回归机越具有良好的泛化能力。
本发明通过对门诊量数据与气象变化和环境污染数据的关联情况进行分析,构建基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对门诊量影响的预测模型,对医院各科室的每周患病人数进行预测。使患者能够提前规避致病的不良气象条件和环境污染因素的影响,合理的安排日常活动;医院能够针对高发疾病合理配置各个科室的医疗资源和人手;公共卫生部门能够提前做好应急准备等,对特定人群进行提前干预,从而减少疾病的发病率,提高人类生活质量。
附图说明
图1为本发明提供的一种环境变化对疾病发病影响的分析预测模型的原理图;
图2为原始数据和支持向量回归机预测的数据对比;
图3为原始数据和支持向量回归机预测的误差图。
具体实施方式
为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
本发明利用过去两年上海市三甲医院的门诊数据,通过对门诊量数据与气象变化和环境污染数据的关联情况进行分析,构建基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对门诊量影响的预测模型,对医院各科室的每周患病人数进行预测。使患者能够提前规避致病的不良气象条件和环境污染因素的影响,合理的安排日常活动;医院能够针对高发疾病合理配置各个科室的医疗资源和人手;公共卫生部门能够提前做好应急准备等,对特定人群进行提前干预,从而减少疾病的发病率,提高人类生活质量。
结合图1,本发明提供的一种环境变化对疾病发病影响的分析预测模型的具体实施步骤为:步骤1:整理气象和环境污染因子的时序数据,对数据进行预处理,将每天的平均气温、最高气温、最低气温、温差、最大气压、平均气压、最大湿度、平均湿度、最大风速、平均风速等气象因子按时间序列的形式进行汇总;将每天的PM2.5分指数、PM10分指数、03分指数、SO2分指数、NO2分指数、CO分指数等环境污染因子按照时间序列的形式进行汇总;并计算24小时温差、24小时压差、24小时风速差、24小时湿度差等时间序列数据,将气象和环境污染数据作为输入数据,各科室门诊量作为输出数据。
步骤2、对数据进行预处理,对数据进行归一化处理并求取相应的相关系数矩阵,归一化后的气象和环境污染因子的相关系数矩阵如表1所示:
表1气象因子和环境污染因子的相关系数矩阵
气象和环境污染因子与呼吸科就诊人数的相关系数矩阵如表2所示:
表2气象因子和环境污染因子与呼吸科就诊人数的相关系数矩阵
步骤3、构建非参数泊松回归模型:
(1)构建非参数泊松回归模型:采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量结果,将气象因子和环境污染因子作为变量引入模型,观察其对门诊量的影响:
log[E(Yi)]=a+ns[Xi,df=5]+YEAR+DOW+s(meteoro log y,df)+s(environment,df)式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a为截距;Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量;s(meteoro log y,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数。
(2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度。分析结果如表3所示:
表3气象因子因子和环境污染因子的脆弱性分析
在所有的气象因子中,气温对儿童各科室的就诊人数影响最大,同时气温对消化科的就诊人数的影响也大于呼吸科和皮肤科。在所有的环境污染因子中,NO2对儿童各科室的就诊人数影响最大,同时NO2对呼吸科的就诊人数的影响也大于消化科和皮肤科。
(3)敏感性分析:分析当气象和环境污染因子变化时,将在多长时间内对门诊量造成影响,我们用滞后效应进行研究。在所有的气象中,气温对儿童各科室的就诊人数主要集中在滞后1天,风速对当天的患病人数影响最大,气压和湿度主要影响滞后5天的就诊量。在所有的环境污染因子中,NO2对当天的儿童各科室的就诊量影响最大,SO2需要滞后2天,PM2.5和PM10则分别滞后4天和6天。
步骤4、求取相关系数矩阵R所对应的特征根和特征向量,按照累积方差贡献度大于等于85%的原则,共提取6个主成分,如表4所示;
表4解释的总方差
计算6个因子在各个气象和环境污染因子上的系数,从而计算每个因子的得分,各个因子的成分得分系数矩阵如表5所示:
表5因子的成分得分系数矩阵
计算每个主成分因子在各个气象和环境污染因子指标上的得分,取前10周的样例数据如表6所示:
表6因子在每周的得分
步骤5、数据分区:将每项气象和环境污染因子提取的主成分与年份亚变量和节假日变量进行组合构成输入向量矩阵,将下一周的各科室门诊量均值作为输出变量,为了降低参数的影响,采用交叉验证的方法分将数据分为训练集和测试集,即对每周的数据划分标签,在训练集上构建相应的支持向量回归机,并对测试集进行预测;
表7支持向量回归机的决策矩阵
步骤6、构建支持向量回归机:(1)采用支持向量回归机,将输入向量运用核函数Sigmoid核函数映射到高维的特征空间;同时设定初始的惩罚因子C的最小值为-8,最大值为8,核函数参数δ的最小值为-8,最大值为8,初始的步长0.5,以及初始的精度参数0.05,并将训练样本数据代入模型,利用回归预测分析进行训练,得出最佳的模型参数,并保存参数。
(2)训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
f ( x ) = &Sigma; j = 1 l ( &alpha; j - &alpha; j * ) K ( x i , x ) + b
根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能力评价指标,通过不断调整模型参数,使回归函数f(x)满足性能要求。
(3)根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值。
步骤7、模型预测能力评估:通过支持向量回归机得到的最佳参数对测试组的上海市儿童呼吸科的就诊人数进行预测,并保存最终的预测结果,将实际的就诊人数与模型得到的每周的日均就诊人数进行比较,比较结果如图2所示,相应的残差图形如图3所示。
通过计算模型拟合能力评价指标:实际输出与期望输出之间的均方误差 MAE = 1 n &Sigma; i = 1 n ( y ^ i - y i ) 2 及拟合优度 R 2 = ( n &Sigma; i = 1 n y ^ i y i - &Sigma; i = 1 n y ^ i &Sigma; i = 1 n y i ) 2 ( n &Sigma; i = 1 n y ^ i 2 - ( &Sigma; i = 1 n y ^ i ) 2 ) ( n &Sigma; i = 1 n y i 2 - ( &Sigma; i = 1 n y i ) 2 ) 对模型的效果进行评价,并最终判断模型的效果是否符合标准,本次研究中运用支持向量回归机对呼吸科的就诊人数的预测过程中,得到最终的模型的均方误差MAE=0.00332692,拟合优度R2=0.928161,模型的拟合效果总体较好。

Claims (6)

1.一种环境变化对疾病发病影响的分析预测模型,其特征在于,包括:
输入输出数据模块,该输入输出数据模块的输入数据为:整理好的气象和环境污染因子的时序数据;该输入输出数据模块的输出数据为:各科室的门诊预测量;
数据预处理模块,用于:
对气象和环境污染因子决策矩阵 X = x 11 x 12 . . . x 1 J x 21 x 22 . . . x 2 J . . . . . x ij . . . x I 1 x I 2 . . . x IJ 进行归一化处理,其中,xij表示第i天的第j项气象和环境污染因子的数据指标;再计算归一化后的决策矩阵X的相关系数矩阵 R = r 11 r 12 . . . r 1 J r 21 r 22 . . . r 2 J . . . . . r ij . . . r I 1 r I 2 . . . r IJ , 其中rij表示第i天的第j项气象和环境污染因子数据指标的相关系数,且rij=rji;同时计算气象和环境污染因子与各科室门诊量的相关系数;
非参数泊松回归模型模块,用于:
1)构建非参数泊松回归模型,采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量研究结果,将气象因子和环境污染因子作为变量引入模型,分别观察其对门诊量的影响:
log[E(Yi)]=a+ns[Xi]+YEAR+DOW+s(meteoro log y,df)+s(environment,df)
式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a为截距;Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量;s(meteoro log y,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数;
2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度,根据非参数泊松回归模型计算出各气象和环境污染因子的回归系数β,计算当各气象和环境污染因子变化四分位间距IQR时,门诊量自然对数的相对改变量,公式:[exp(β×IQR)-1]×100%,并在此基础上计算平均百分比改变的95%的置信区间;
3)敏感性分析:分析当气象因子和环境因子变化时,将在多长时间内对门诊量造成影响,采用滞后效应进行研究,选择分析滞后期lag为0~7天的气象和环境污染因子效应。最后,根据非参数泊松回归模型计算出回归系数β,由β计算出不同滞后天数的RR值,根据RR值确定最佳滞后期;
降维模块,用于:求取相关系数矩阵R所对应的J个特征根以及特征向量,每个特征根对应一个主成分,并选取累积方差贡献度大于等于指定阀值的主成分,则从J个主成分中筛选出p个主成分及特征向量;计算各个主成分因子在各个变量上的成分得分矩阵,得到p个主成分在每周的得分;
数据分区模块,采用交叉验证的方法将输入向量矩阵及输出变量分为训练集和测试集,输入向量矩阵为p+2维,由降维模块中得到的主成分得分与年份亚变量和节假日变量组合构成,输出变量为下周的科室就诊人数平均值;
构建支持向量回归机模块,包括如下步骤:
第一步、模型参数选择,用于构建支持向量回归机的输入和输出,并且选择支持向量回归机的特征参数,其中,特征参数包括核函数、初始的惩罚因子C和核函数参数δ的试凑范围与步长,以及初始的精度参数ε,通过核函数将数据映射到高维的向量空间中,在约束条件,其中,xi为l维空间的输入向量,yi为l维空间的输出向量,w为特征空间连接到输出空间的权值参数,φ(x)为x在特征空间的像,b为偏置或者负阀值:
<w,φ(xi)>+b-yi≤ξi *+ε,i=1,...,l
yi-<w,φ(xi)>-b≤ξi+ε,i=1,...,l
ξi,ξi *≥0,i=1,...,l
下求解目标函数,其中,C为选定的正参数:
min 1 2 | | w | | 2 + C &Sigma; i = 1 l &lambda; i ( &xi; i + &xi; i * )
该问题的对偶形式为:
max - 1 2 &Sigma; i , j = 1 l ( &alpha; i - &alpha; i * ) ( &alpha; j - &alpha; j * ) K ( x i , x j ) + &Sigma; i = 1 l ( &alpha; i - &alpha; i * ) y i - &Sigma; i = 1 l ( &alpha; i - &alpha; i * ) &epsiv;
其中约束条件为:
&Sigma; j = 1 l ( &alpha; j - &alpha; j * ) = 0
0≤αi,αi *≤λiC,i=1,2,...l
从而求解出参数αi和αi *
第二步、训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
f ( x ) = &Sigma; j = 1 l ( &alpha; j - &alpha; j * ) K ( x i , x ) + b
根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能力评价指标,判断回归函数f(x)是否满足性能要求,若回归函数f(x)不满足性能要求,则需要调整支持向量回归机中的核函数和特征参数重新训练模型,并保存最终结果;
第三步、根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值。
2.如权利要求1所述的一种环境变化对疾病发病影响的分析预测模型,其特征在于,还包括:模型预测能力评估模块,其实施过程包括:
第一步、用支持向量回归机计算医院各科室的就诊人数的预测值;
第二步、获取各科室就诊人数的实际值,各科室就诊人数的预测值和实际值是同一时间段的就诊人数;
第三步、计算预测值与实际值之间的差异,并根据误差图对模型的预测效果进行评估,若模型的预测能力较差,则需要重新选择模型参数、重新训练模型,从而构建基于支持向量回归机的气象环境污染因子的就诊人数预测模型。
3.如权利要求1所述的一种环境变化对疾病发病影响的分析预测模型,其特征在于,在数据预处理模块中,对决策矩阵X中第i天的第j项气象和环境污染因子数据指标xij进行归一化处理后得到zij,则式中,x′及σ分别为xij的期望和方差。
4.如权利要求1所述的一种环境变化对疾病发病影响的分析预测模型,其特征在于,在构建支持向量回归机模块,所述核函数为Sigmoid核函数,其表达式为式中,c1为倾斜系数,c2为常数参数;或所述核函数为径向基核函数,其表达式为式中,γ为1/k(其中k为类别数);或所述核函数为多项式核函数,其表达式为式中,γ为1/k(其中k为类别数),a为常量参数,d为最高次项次数。
5.如权利要求1所述的一种环境变化对疾病发病影响的分析预测模型,其特征在于,在所述构建支持向量回归机模块中,引入拉格朗日函数得到目标函数的对偶形式,如下所示:
L ( w , b , &xi; , &alpha; , &alpha; * , &gamma; ) = 1 2 | | w | | 2 + C &Sigma; j = 1 l &xi; i - &Sigma; i = 1 l &alpha; i [ &xi; i + &epsiv; - y i + f ( x i ) ] - &Sigma; i = 1 l &alpha; i * [ &xi; i + &epsiv; + y i - f ( x i ) ] - &Sigma; i = 1 l &gamma; i &xi; i
其中αi,αi *,γi≥0,i=1,...,l
函数L的极值应满足条件:
&PartialD; &PartialD; w L = 0 , &PartialD; &PartialD; b L = 0 , &PartialD; &PartialD; &xi; i L = 0
得到下面的式子:
w = &Sigma; i = 1 l ( &alpha; i - &alpha; i * ) &phi; ( x i )
&Sigma; i = 1 l ( &alpha; i - &alpha; i * ) = 0
C-αii *i=0
将上面3个公式带入到拉格朗日函数中即可得到函数的对偶形式。
6.如权利要求1所述的一种环境变化对疾病发病影响的分析预测模型,其特征在于,在构建支持向量回归机模块的第二步的训练模型中,模型拟合能力评价指标:实际输出与期望输出之间的均方误差MAE以及拟合优度R2由下面的公式给出:
MAE = 1 n &Sigma; i = 1 n ( y ^ i - y i ) 2
R 2 = ( n &Sigma; i = 1 n y ^ i y i - &Sigma; i = 1 n y ^ i &Sigma; i = 1 n y i ) 2 ( n &Sigma; i = 1 n y ^ i 2 - ( &Sigma; i = 1 n y ^ i ) 2 ) ( n &Sigma; i = 1 n y i 2 - ( &Sigma; i = 1 n y i ) 2 )
式中,表示第i周的日平均就诊人数的预测值,yi表示第i周的日平均就诊人数的真实值,n,0<n<I,表示周数,其中MAE越小和R2越接近于1,表示所建立的支持向量回归机越具有良好的泛化能力。
CN201510170135.7A 2015-04-10 2015-04-10 一种环境变化对疾病发病影响的分析预测装置 Active CN104809335B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510170135.7A CN104809335B (zh) 2015-04-10 2015-04-10 一种环境变化对疾病发病影响的分析预测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510170135.7A CN104809335B (zh) 2015-04-10 2015-04-10 一种环境变化对疾病发病影响的分析预测装置

Publications (2)

Publication Number Publication Date
CN104809335A true CN104809335A (zh) 2015-07-29
CN104809335B CN104809335B (zh) 2019-03-05

Family

ID=53694151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510170135.7A Active CN104809335B (zh) 2015-04-10 2015-04-10 一种环境变化对疾病发病影响的分析预测装置

Country Status (1)

Country Link
CN (1) CN104809335B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295229A (zh) * 2016-08-30 2017-01-04 青岛大学 一种基于医疗数据建模的川崎病分级预测方法
CN107180271A (zh) * 2017-04-27 2017-09-19 广州慧扬健康科技有限公司 基于最小二乘法的住院人数的预测系统
CN107451390A (zh) * 2017-02-22 2017-12-08 Cc和I研究有限公司 用于预测慢性阻塞性肺疾病急性加重的系统
CN107609706A (zh) * 2017-09-19 2018-01-19 东南大学 基于网络拓扑特性构建轨道交通站点客流预测模型的方法
CN107767960A (zh) * 2017-09-13 2018-03-06 温州悦康信息技术有限公司 临床检测项目的数据处理方法、装置及电子设备
CN107871538A (zh) * 2016-12-19 2018-04-03 平安科技(深圳)有限公司 基于宏观因子的大数据预测方法及系统
CN108471954A (zh) * 2016-08-10 2018-08-31 鲍里斯·伊万诺维奇·帕斯图霍夫 多参数评估环境对人体的影响的方法和系统
JP2018200567A (ja) * 2017-05-26 2018-12-20 一般財団法人日本気象協会 コンピュータプログラム、端末、方法およびサーバ
WO2019037260A1 (zh) * 2017-08-20 2019-02-28 平安科技(深圳)有限公司 预测模型建立装置、方法及计算机可读存储介质
CN109615538A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 社保违规检测方法、装置、设备及计算机存储介质
CN109711652A (zh) * 2017-10-26 2019-05-03 厦门一品威客网络科技股份有限公司 一种创客团队潜能评分方法
CN109712716A (zh) * 2018-12-25 2019-05-03 广州天鹏计算机科技有限公司 疾病影响因素确定方法、系统和计算机设备
CN110047594A (zh) * 2019-05-27 2019-07-23 北京气象在线科技有限公司 基于气象环境监测数据的呼吸系统疾病发病趋势预测方法
CN110444298A (zh) * 2019-07-02 2019-11-12 北京大学 基于高斯过程模型的流感预测建模方法及装置
CN110633856A (zh) * 2019-09-18 2019-12-31 柳州市工人医院 一种基于气象和大气污染物数据的co中毒预测方法
CN110706823A (zh) * 2019-11-15 2020-01-17 广州地理研究所 一种基于滞后分析和lstm的呼吸系统疾病发病人数预测方法
CN110751102A (zh) * 2019-10-22 2020-02-04 天津财经大学 京津冀三地机场客流关联性分析方法及装置
CN111292006A (zh) * 2020-02-25 2020-06-16 武汉轻工大学 基于黄酒制品品质范围获取原料品质范围的方法及装置
CN111400366A (zh) * 2020-02-27 2020-07-10 西安交通大学 一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统
CN111508598A (zh) * 2020-05-06 2020-08-07 万达信息股份有限公司 一种呼吸系统疾病门诊量预测方法
CN111554404A (zh) * 2020-04-13 2020-08-18 吾征智能技术(北京)有限公司 一种基于室内环境的疾病预测系统及其预测方法
CN111680841A (zh) * 2020-06-10 2020-09-18 广东电网有限责任公司 基于主成分分析的短期负荷预测方法、系统及终端设备
CN111755106A (zh) * 2019-03-28 2020-10-09 株式会社日立制作所 一种门诊量的预测方法及装置
CN112349420A (zh) * 2020-10-24 2021-02-09 武汉东湖大数据交易中心股份有限公司 一种基于气象数据的疾病预测模型的构建方法及系统
CN112582058A (zh) * 2019-11-07 2021-03-30 广州医科大学 一种基于空气质量的慢阻肺发病预测方法及系统
CN113077896A (zh) * 2021-04-27 2021-07-06 郑州大学 一种基于gam的心脑血管疾病门诊量评价系统及其使用方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678882A (zh) * 2013-11-22 2014-03-26 昆明医科大学第一附属医院 一种空间灾害性天气引起心脑血管事件的预警方法
CN104008164A (zh) * 2014-05-29 2014-08-27 华东师范大学 基于广义回归神经网络的短期腹泻病多步预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678882A (zh) * 2013-11-22 2014-03-26 昆明医科大学第一附属医院 一种空间灾害性天气引起心脑血管事件的预警方法
CN104008164A (zh) * 2014-05-29 2014-08-27 华东师范大学 基于广义回归神经网络的短期腹泻病多步预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YAN WU: "Detect Climatic Factors Contributing to Dengue Outbreak based on Wavelet, Support Vector Machines and Genetic Algorithm", 《PROCEEDINGS OF THE WORLD CONGRESS ON ENGINEERING 2008》 *
崔泳琳: "气象污染因子对心脑血管疾病急诊量影响的预报模型研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
张燕萍 等: "太原市空气污染对心脑血管疾病死亡率急性影响的Poisson 广义可加模型分析", 《环境与健康杂志》 *
殷永文 等: "上海市霾期间PM2.5 、PM10污染与呼吸科、儿呼吸科门诊人数的相关分析", 《环境科学》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108471954A (zh) * 2016-08-10 2018-08-31 鲍里斯·伊万诺维奇·帕斯图霍夫 多参数评估环境对人体的影响的方法和系统
CN106295229A (zh) * 2016-08-30 2017-01-04 青岛大学 一种基于医疗数据建模的川崎病分级预测方法
CN107871538A (zh) * 2016-12-19 2018-04-03 平安科技(深圳)有限公司 基于宏观因子的大数据预测方法及系统
CN107451390B (zh) * 2017-02-22 2020-11-17 Cc和I研究有限公司 用于预测慢性阻塞性肺疾病急性加重的系统
CN107451390A (zh) * 2017-02-22 2017-12-08 Cc和I研究有限公司 用于预测慢性阻塞性肺疾病急性加重的系统
CN107180271A (zh) * 2017-04-27 2017-09-19 广州慧扬健康科技有限公司 基于最小二乘法的住院人数的预测系统
CN107180271B (zh) * 2017-04-27 2021-01-19 广州慧扬健康科技有限公司 基于最小二乘法的住院人数的预测系统
JP7025131B2 (ja) 2017-05-26 2022-02-24 一般財団法人日本気象協会 コンピュータプログラム、端末、方法およびサーバ
JP2018200567A (ja) * 2017-05-26 2018-12-20 一般財団法人日本気象協会 コンピュータプログラム、端末、方法およびサーバ
WO2019037260A1 (zh) * 2017-08-20 2019-02-28 平安科技(深圳)有限公司 预测模型建立装置、方法及计算机可读存储介质
CN107767960A (zh) * 2017-09-13 2018-03-06 温州悦康信息技术有限公司 临床检测项目的数据处理方法、装置及电子设备
CN107609706A (zh) * 2017-09-19 2018-01-19 东南大学 基于网络拓扑特性构建轨道交通站点客流预测模型的方法
CN109711652A (zh) * 2017-10-26 2019-05-03 厦门一品威客网络科技股份有限公司 一种创客团队潜能评分方法
CN109615538A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 社保违规检测方法、装置、设备及计算机存储介质
CN109712716A (zh) * 2018-12-25 2019-05-03 广州天鹏计算机科技有限公司 疾病影响因素确定方法、系统和计算机设备
CN111755106A (zh) * 2019-03-28 2020-10-09 株式会社日立制作所 一种门诊量的预测方法及装置
CN110047594A (zh) * 2019-05-27 2019-07-23 北京气象在线科技有限公司 基于气象环境监测数据的呼吸系统疾病发病趋势预测方法
CN110444298A (zh) * 2019-07-02 2019-11-12 北京大学 基于高斯过程模型的流感预测建模方法及装置
CN110633856A (zh) * 2019-09-18 2019-12-31 柳州市工人医院 一种基于气象和大气污染物数据的co中毒预测方法
CN110751102B (zh) * 2019-10-22 2023-12-22 天津财经大学 京津冀三地机场客流关联性分析方法及装置
CN110751102A (zh) * 2019-10-22 2020-02-04 天津财经大学 京津冀三地机场客流关联性分析方法及装置
CN112582058A (zh) * 2019-11-07 2021-03-30 广州医科大学 一种基于空气质量的慢阻肺发病预测方法及系统
CN110706823A (zh) * 2019-11-15 2020-01-17 广州地理研究所 一种基于滞后分析和lstm的呼吸系统疾病发病人数预测方法
CN111292006A (zh) * 2020-02-25 2020-06-16 武汉轻工大学 基于黄酒制品品质范围获取原料品质范围的方法及装置
CN111400366A (zh) * 2020-02-27 2020-07-10 西安交通大学 一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统
CN111554404A (zh) * 2020-04-13 2020-08-18 吾征智能技术(北京)有限公司 一种基于室内环境的疾病预测系统及其预测方法
CN111554404B (zh) * 2020-04-13 2023-09-08 吾征智能技术(北京)有限公司 一种基于室内环境的疾病预测系统及其预测方法
CN111508598A (zh) * 2020-05-06 2020-08-07 万达信息股份有限公司 一种呼吸系统疾病门诊量预测方法
CN111508598B (zh) * 2020-05-06 2023-12-08 万达信息股份有限公司 一种呼吸系统疾病门诊量预测方法
CN111680841B (zh) * 2020-06-10 2024-01-26 广东电网有限责任公司 基于主成分分析的短期负荷预测方法、系统及终端设备
CN111680841A (zh) * 2020-06-10 2020-09-18 广东电网有限责任公司 基于主成分分析的短期负荷预测方法、系统及终端设备
CN112349420B (zh) * 2020-10-24 2023-04-14 武汉东湖大数据交易中心股份有限公司 一种基于气象数据的疾病预测模型的构建方法及系统
CN112349420A (zh) * 2020-10-24 2021-02-09 武汉东湖大数据交易中心股份有限公司 一种基于气象数据的疾病预测模型的构建方法及系统
CN113077896B (zh) * 2021-04-27 2023-05-26 郑州大学 一种基于gam的心脑血管疾病门诊量评价系统及其使用方法
CN113077896A (zh) * 2021-04-27 2021-07-06 郑州大学 一种基于gam的心脑血管疾病门诊量评价系统及其使用方法

Also Published As

Publication number Publication date
CN104809335B (zh) 2019-03-05

Similar Documents

Publication Publication Date Title
CN104809335A (zh) 一种环境变化对疾病发病影响的分析预测模型
Su et al. Area social deprivation and public health: Analyzing the spatial non-stationary associations using geographically weighed regression
Gouache et al. Modelling climate change impact on Septoria tritici blotch (STB) in France: Accounting for climate model and disease model uncertainty
Oteros et al. Year clustering analysis for modelling olive flowering phenology
López-Carr et al. Space versus place in complex human–natural systems: Spatial and multi-level models of tropical land use and cover change (LUCC) in Guatemala
CN111325406B (zh) 一种基于小空间尺度的热相关健康风险预警方法
Sánchez Mesa et al. The use of discriminant analysis and neural networks to forecast the severity of the Poaceae pollen season in a region with a typical Mediterranean climate
Chattopadhyay et al. Objective identification of nonlinear convectively coupled phases of monsoon intraseasonal oscillation: Implications for prediction
Ding et al. A hybrid CNN-LSTM model for predicting PM2. 5 in Beijing based on spatiotemporal correlation
CN109408773B (zh) 一种生态健康诊断的指标自动化筛选方法
CN111738138B (zh) 一种耦合气象特征区域尺度的小麦条绣病严重度遥感监测方法
CN106407643A (zh) 一种健康风险评估系统的建立方法
Ding et al. Research of neural network algorithm based on factor analysis and cluster analysis
CN109165693A (zh) 一种适用于露、霜和结冰的天气现象的自动判识方法
CN103745087B (zh) 一种基于遥感技术的森林资源动态变化预测方法
Yu et al. Enhanced observations from an optimized soil-canopy-photosynthesis and energy flux model revealed evapotranspiration-shading cooling dynamics of urban vegetation during extreme heat
Moyer et al. Weather during critical epidemiological periods and subsequent severity of powdery mildew on grape berries
CN117057490A (zh) 湿胁迫热浪-洪水复合灾害的预测方法、系统及电子设备
CN117877739A (zh) 一种基于动力学的传染病防控策略量化评估方法
CN116626780A (zh) 一种地面气象站集合预报的天气预报后处理方法及系统
CN115510991A (zh) 一种基于1dcnn-lstm多源信息融合模型的日光温室蚜虫预警方法
KR101900570B1 (ko) 기상변수와 지표특성을 이용한 모기 활동성 지수 산출 방법 및 시스템
Wang et al. Enhanced awareness of height-diameter allometry in response to climate, soil, and competition in secondary forests
Xu et al. Integrating global socio-economic influences into a regional land use change model for China
Kandasamy et al. Climate change vulnerability assessment of dryland farmers and factors Identification using machine learning techniques

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant