CN115860306A - 一种探测突发公卫事件区域公众风险感知时空差异的方法 - Google Patents
一种探测突发公卫事件区域公众风险感知时空差异的方法 Download PDFInfo
- Publication number
- CN115860306A CN115860306A CN202210217055.2A CN202210217055A CN115860306A CN 115860306 A CN115860306 A CN 115860306A CN 202210217055 A CN202210217055 A CN 202210217055A CN 115860306 A CN115860306 A CN 115860306A
- Authority
- CN
- China
- Prior art keywords
- time
- space
- public
- spatial
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008447 perception Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000005180 public health Effects 0.000 title claims abstract description 45
- 238000011156 evaluation Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 230000000694 effects Effects 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 23
- 230000002123 temporal effect Effects 0.000 claims description 18
- 238000005295 random walk Methods 0.000 claims description 17
- 230000008080 stochastic effect Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 7
- 230000000996 additive effect Effects 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 230000002093 peripheral effect Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 5
- 230000001550 time effect Effects 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 4
- 101100001674 Emericella variicolor andI gene Proteins 0.000 claims description 3
- TZJALUIVHRYQQB-UHFFFAOYSA-N Icarin Chemical compound C1=CC(OC)=CC=C1C1=C(OC2C(C(O)C(O)C(C)O2)O)C(=O)C2=C(O)C=C(OC3C(C(O)C(O)C(CO)O3)O)C(CC=C(C)C)=C2O1 TZJALUIVHRYQQB-UHFFFAOYSA-N 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 239000000523 sample Substances 0.000 claims 1
- 230000008859 change Effects 0.000 abstract description 10
- 238000011160 research Methods 0.000 abstract description 6
- 230000000007 visual effect Effects 0.000 abstract description 4
- 208000025721 COVID-19 Diseases 0.000 description 12
- 230000002354 daily effect Effects 0.000 description 11
- 230000007123 defense Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 206010035664 Pneumonia Diseases 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 238000013477 bayesian statistics method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 208000035473 Communicable disease Diseases 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241001678559 COVID-19 virus Species 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000005548 health behavior Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种探测突发公卫事件区域公众风险感知时空差异的方法,包括基于互联网搜索引擎数据刻画研究区内多个区域的整体公众关注度;构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;构建贝叶斯时空变系数模型,识别区域公众关注度与解释变量关系的时空非平稳性;计算考虑时空非平稳性后各个解释变量的贡献度;利用贝叶斯时空变系数模型拟合关键解释变量在各个区域的空间回归系数,用作区域公众风险感知评价指标。本发明是突发公卫事件背景下基于时空异质性视角的,用于区域公众关注度的趋势识别、差异分析与公众风险感知评价的方法,采用了贝叶斯时空变系数模型用于探测区域公众关注与突发事件真实风险之间关联的时空变化。
Description
技术领域
本发明属于数据分析方法技术领域,具体涉及一种探测突发公卫事件区域公众风险感知时空差异的方法。
背景技术
突发公卫事件,如重大新发传染病,非药物干预措施是应对其传播的即时和相对有效的策略,主要包括个人预防、社交距离和病例驱动措施。由于非药物干预措施需要公众层面的自发性、主动获取关键信息等积极配合行为,因此公众对突发公卫事件的区域群体关注会直接影响防疫机构采取缓解措施的时机和实施效果,进而影响突发公卫事件的实际进展。
从宏观视角出发,网络搜索引擎是快速获取大范围区域公众关注度的数据源。例如,百度指数作为互联网搜索引擎数据产品,其数据最小时空尺度可以汇总到每一天的城市级别。但是,目前面向突发公卫事件的互联网搜索引擎数据分析研究忽略了地方差异性和空间异质性。
同时,基于搜索引擎产品的公众关注度指标并不能真实客观地反映公众对突发公卫事件在区域层面的风险认知水平,特别是考虑地方差异(空间异质性)的影响。例如,突发公卫事件风险严重地区如果公众关注度较低,这表明公众的风险认知可能相对较低,需要提升群体健康素养;而在事件风险轻微地区如果公众关注度较高,则表明公众风险认知过高,可能引发区域公共恐慌而造成经济损失和社会动荡。传统突发事件情景下的公众风险感知研究几乎都是基于单个或者少量地区的人群个体抽样视角(如人群问卷调查),没有从整个国家层面考虑群体风险感知在每个区域的地理空间差异,以及风险感知在事件发展不同阶段的时间差异。因此,在区域公众关注(网络搜索引擎指标)基础上,创新提出区域公众风险感知指标,即如何定量化刻画突发公卫事件实际地方风险等级与区域群体公众关注度之间的局域关联程度,可以作为更有意义的评价指标,有助于理解大范围细尺度群体公众对突发公卫事件的真实反馈。
因此,本发明提供了一种探测突发公卫事件区域公众风险感知时空差异的方法,以至少解决上述部分技术问题。
发明内容
本发明要解决的技术问题是:提供一种探测突发公卫事件区域公众风险感知时空差异的方法,以至少解决上述部分技术问题。
为实现上述目的,本发明采用的技术方案如下:
一种探测突发公卫事件区域公众风险感知时空差异的方法,包括以下过程:
步骤S1,基于互联网搜索引擎数据刻画各个区域整体公众关注度;
步骤S2,将公众关注度作为目标变量,构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;
步骤S3,构建贝叶斯时空变系数模型,识别目标变量与解释变量关系的时空非平稳性;
步骤S4,计算时空非平稳性中各个解释变量的贡献度;
步骤S5,利用贝叶斯时空变系数模型模拟关键解释变量在每一个区域的空间回归系数,获取各个区域的公众风险感知指标。
进一步地,所述步骤S1包括以下过程:选取互联网搜索引擎多个关键字;采用主成分分析方法对多个关键字进行降维处理获得单一指标;将单一指标作为公众关注度。
进一步地,所述步骤S2包括以下过程:
进一步地,所述步骤S3包括以下过程:构建数据似然模型、时空过程模型、结构化空间自相关先验的条件自回归模型、以及结构化时间自相关先验的随机游动模型,方程式分别如下:
其中,为加性预测因子,为家族变换函数,Y为针对突发公卫事件的区域整体公众关注度,为每个空间单元i和时间单元t的观测项;为全局截距项,为关键解释变量,K为解释变量的个数,为辅助解释变量,H为辅助解释变量的个数;为空间回归系数,为时间回归系数,为辅助解释变量的全局回归系数,和为空间截距项和时间截距项;函数表示拟合时空随机效应的潜在高斯模型,为正态分布,j表示i的相邻空间单元,为空间邻接矩阵,代表空间单元i周围的邻居个数,为空间随机效应的方差,为时间随机效应的方差;
进一步地,所述步骤S4包括以下过程:
采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,计算方程式为:
由计算得到的方差分割系数表示时空非平稳性中各个解释变量的贡献度。
进一步地,所述步骤S5包括以下过程:构建简化的贝叶斯时空变系数模型,方程式如下:
其中,为数据似然水平,为结构的加性预测因子,为目标变量在每个时空单元it的观测值,为考虑空间非平稳性的解释变量,为考虑时间非平稳性的解释变量,为空间回归系数,为时间回归系数,K是空间非平稳因子的个数,M是时间非平稳因子的个数,iCAR为拟合空间随机效应, RW为拟合时间随机效应,函数和分别为拟合空间随机效应和拟合时间随机效应的潜在高斯过程模型,为空间效应精度参数,为表示空间近邻关系的结构矩阵,为时间效应精度参数,为一个的时间结构矩阵,N为高斯分布;
由步骤S5模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域公众风险感知地图;
采用局域莫兰指数统计量对区域公众风险感知指标进行空间集聚和异常分析,分析方程式为:
其中,为局域莫兰指数统计量,为区域公众风险感知指标,为区域公众风险感知指标,为各区域公众风险感知指标的均值,为不同空间单元之间的空间权重矩阵, j表示i的相邻空间单元,n是整个研究区空间单元的个数,是空间单元i的方差;
由局域莫兰指数统计量得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
与现有技术相比,本发明具有以下有益效果:
本发明是突发公卫事件背景下一种基于局域时空异质性视角的,用于区域公众关注度的趋势识别、差异分析与客观评价(公众风险感知)的方法,采用了适用于大数据应用计算的时空变系数模型,用于探测突发公卫事件区域公众风险感知时空差异。本发明通过前沿时空统计模型探测解释变量对目标变量的时空异质性影响效应(时空非平稳性),提升了模型拟合和预测效果;借助时空独立非平稳性的贝叶斯先验设定,直接输出考虑时空自相关效应的后验时间和空间回归系数及可信区间,无需时空系数再分析,并大幅降低了模型复杂度以减小贝叶斯推断的计算负担;并针对解释变量非平稳随机效应而采用的时空独立设定,不仅增强了对时空变量关系的直观解释能力,同时保证了其应用于地理时空大数据的计算可行性和算法可塑性。
本发明揭示了突发公卫事件背景下影响区域公众关注度的局域尺度驱动因素及其时空作用机理。在大范围细尺度层面,本发明基于局域时空异质性视角,挖掘突发公卫事件公众关注度的时空差异分布,以及其影响因素的时空非平稳,为宏观地理空间归因提供可能线索,为制定因地且因时制宜的公卫防控政策提供重要依据。
本发明弥补了传统刻画区域公众关注度指标的局限性,提出了局域公众风险感知的空间评价新指标。本发明基于时空非平稳的理论基础,提出区域公众风险感知指标,能够进一步考虑公众关注度与真实事件风险的时空异质性变量关系。采用的贝叶斯时空变系数模型为探索变量关系的时空非平稳性这一关键问题提供了可行的研究思路、理论基础和建模框架。
附图说明
图1为本发明方法流程图。
图2为具体实施例基于贝叶斯时空变截距模型拟合的整个研究区突发公卫事件公众关注度的总体时间变化趋势图(以中国首轮COVID-19疫情爆发为例)。
图3为具体实施例考虑时空非平稳后的各解释因子对目标变量的总体贡献百分比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进一步详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种探测突发公共事件区域公众风险感知时空差异的方法,是一种突发公卫事件背景下基于局域时空异质性视角的,用于区域公众关注度的趋势识别、差异分析与客观评价(公众风险感知)的方法,采用了适用于大数据应用计算的贝叶斯时空变系数模型,用于探测突发公卫事件区域公众风险感知时空差异。
近年来,局域空间和时空回归逐渐兴起,旨在拟合变量关系的空间和时空非平稳性。目前,基于频率统计框架的地理加权回归模型已经发展了它的时空版,即时空地理加权回归,并在不断地改进与发展。地理加权回归模型和时空地理加权回归是探测空间非平稳和时空非平稳的传统频率统计的典型代表。
局域回归根据建模体系差异又分为传统频率统计和现代贝叶斯统计两大家族,尽管它们输出结果类似,但是在整个建模策略与求解体系上本质不同。与传统频率统计相比,贝叶斯统计构建的局域空间和时空非平稳回归模型具有更强的优势:采用全地图建模策略(即建立针对全区域的完整和统一的模型),考虑多源先验知识,直接估算参数的不确定性,具有较强的模型可扩展性。贝叶斯时空变系数模型则是一类基于贝叶斯统计内核提出的局域时空非平稳性回归模型,因此本发明基于贝叶斯时空变系数模型,定量拟合区域群体公众关注度与突发公卫地方实际风险之间的时空非平稳性(不同变量之间关系的时空异质性)。
本发明所述的一种探测突发公共事件区域公众风险感知时空差异的方法,包括:
步骤S1,基于互联网搜索引擎数据刻画各个区域整体公众关注度;
步骤S2,将公众关注度作为目标变量,构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;
步骤S3,构建贝叶斯时空变系数模型,识别目标变量与解释变量关系的时空非平稳性;
步骤S4,计算时空非平稳性中各个解释变量的贡献度;
步骤S5,利用贝叶斯时空变系数模型模拟关键解释变量在每一个区域的空间回归系数,获取各个区域的公众风险感知指标。
互联网搜索引擎数据可以量化地描述区域公众对重大突发公卫事件,在突发事件处理上具有实时性、覆盖人群范围广和成本低廉等优点。互联网搜索引擎数据可以从时空维度定量地描述公众对突发公卫事件的集体关注,并且可限制在特定的行政地点和特定时期。为此,本发明采用采用互联网搜索引擎数据来反映公众对突发公卫事件的每一天的关注。
步骤S1包括以下过程:通过互联网搜索引擎搜集与突发公卫事件相关的多个关键字,采用主成分分析方法对多个关键字进行降维处理,从多个关键词中提取第一主成分并获得单一指标,代表研究期间各区域群体公众对突发公卫事件的关注程度,并将单一指标作为公众关注度。所述公众关注度仅代表搜索引擎指标的时空分布,未考虑地方真实的突发公卫事件的风险等级。主成分分析方法是一种著名的多元方法,它将不同的相关变量转换成几个线性不相关的变量,称为主成分,其中第一个主成分包含了关于数据集的大部分信息。本发明采用主成分分析方法分析的优点在于,可针对后续的时空回归建模,使用一个一维的因子作为目标变量,用于定量表达群体公众关注在每个地区每天的整体水平。
此外,以重大新发传染病为例,还必须考虑了影响区域公众关注的三类解释因素,即当地每天的疾病报告病例、当地每天的人口流动情况以及城市的宏观社会经济水平。疾病报告病例包括累计病例和新增病例,人口流动包括流入人口和流出人口,城市社会经济包括人均GDP、第一产业从业人员人口密度、从业人员平均工资等因子。其中,疾病报告病例是最重要的关键因子,用于代表当地的真实突发公卫的风险程度,进一步利用这个因子,才能计算区域公众风险感知指标。
贝叶斯时空变截距模型的建模统计原理与动态非参数化时空模型类似。动态非参数化时空模型是层次贝叶斯框架下时空统计建模研究中广泛使用的一种模型,相比于典型参数化时空模型,它不仅可以考虑线性关系的时间趋势,还可以考虑非线性变化的时间趋势,因而使用更加广泛。
对于随机变量,服从条件自回归先验分布,其空间相关性服从高斯分布的条件自回归模型,自回归模型被广泛运用在经济学、信息学、自然现象的预测上,它的优点是所需资料不多,可用自身变量数列来进行预测。构建条件自回归模型方程式:
贝叶斯时空变系数模型是一类基于贝叶斯统计内核提出的时空非平稳回归模型,旨在同时探测多个解释变量对目标变量的时空异质性影响,即在拟合目标变量与解释变量之间关系时,考虑地理现象中存在的时空非平稳性。贝叶斯时空变系数模型作为局域时空非平稳回归的新方法,通过借助贝叶斯统计理论和建模优势,能够更灵活地解决时空非平稳性变量关系的拟合问题。贝叶斯时空变系数模型采用了一种时空独立的非平稳假设,即通过分开考虑空间自相关和时间自相关的先验设定,分别估算解释变量后验的局域空间和时间回归系数集合,旨在直接定量刻画变量关系在时间和空间尺度的异质性变化规律。
一个完整的贝叶斯时空变系数模型体现了贝叶斯层次建模的三个层次思想,包括构建数据似然模型、时空过程模型、结构化空间自相关先验的条件自回归模型、以及结构化时间自相关先验的随机游动模型,方程式分别如下:
其中,为加性预测因子,为家族变换函数,Y为针对突发公卫事件的区域整体公众关注度,为每个空间单元i和时间单元t的观测项;为全局截距项,为关键解释变量,K为解释变量的个数,为辅助解释变量,H为辅助解释变量的个数;为空间回归系数,为时间回归系数,为辅助解释变量的全局回归系数,和为空间截距项和时间截距项;函数表示拟合时空随机效应的潜在高斯模型,为正态分布,j表示i的相邻空间单元,为空间邻接矩阵,代表空间单元i周围的邻居个数,为空间随机效应的方差,为时间随机效应的方差;
其次,时空过程模型包括三类效应,分别用于拟合关键解释变量的时空非平稳性,辅助解释变量的全局平稳性,以及截距项的时空异质性。贝叶斯时空变系数模型建模不可或缺的核心要素是关键解释变量的空间非平稳性和时间非平稳性。
函数表示不同的潜在高斯模型,用于拟合不同层次不同类型的空间和时间随机效应,进而估算后验局域变化的参数。贝叶斯时空变系数模型默认采用了两种主流的空间和时间回归子模型,作为潜在高斯模型来拟合时空非平稳性。
时间非平稳随机效应(时间回归系数)的拟合则采用了考虑结构化时间自相关先验的随机游动模型。参数由随机游动的一阶或二阶时间结构矩阵决定,结构化时间自相关先验的随机游动模型的一阶和二阶形式分别由以下两个公式拟合:
由上述模型拟合出的空间回归系数和时间回归系数识别目标变量与解释变量关系的时空非平稳性。模型拟合的空间回归系数和时间回归系数用于刻画空间和时间维度上的异质性变量关系,是贝叶斯时空变系数模型最重要的两大核心输出参数集。时空局部尺度参数集的解释与传统的全局尺度回归系数的解释类似,它们也代表了解释变量相对贡献的方向(正或负)和强度(绝对值),但是在每个空间或时间单元都可以得到每种解释变量的回归系数。例如,以0为阈值,一个空间或时间单元的局域尺度回归系数大于0,表明目标现象的空间或时间效应与当前解释变量呈正相关,局域尺度系数绝对值越大,相对贡献越高。如果局部尺度系数的值小于0,则解释正相反。
类似地,同样可以采用空间条件自回归模型和时间随机游动先验模型拟合时空截距项,的随机效应,即和。此外,针对地理时空大数据,贝叶斯时空变系数模型的参数、超参数模型采用了贝叶斯统计的无信息先验设定,体现了数据驱动的建模思想,以适用不同案例的通用建模需求。
贝叶斯时空变系数模型可以得到每个局域尺度不同驱动因子的贡献度(解释力),但是由于时空信息的多维复杂性,其结论可能不容易归纳为一个整体宏观的结论。实际应用中,实践者可能会需要感兴趣的随机效应(如时间总体、空间总体、每个因子、不同空间尺度效应)的总体贡献度。为了解决所述问题,采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,计算方程式为:
其中,为范围在[0,1]的百分比值,为所有随机效应的方差之和,为未解释随机效应(残差)的方差,为目标随机效应组分的方差之和;实际上,是可选的,取决于实际需求,可以是一个特定因素的单一随机效应的方差,或不同来源的随机效应的方差之和。
由计算得到的方差分割系数表示时空非平稳性中各个解释变量的贡献度。与主流的识别因子总体贡献的方法,如与随机森林和地理探测器相比,方差分割系数评价指标的优势在于利用贝叶斯时空变系数模型,不仅可以检测考虑局域时空非平稳特性后的解释因子总体贡献度,同时还可以检测每种解释因子在时间和空间维度上的差异贡献。
突发公卫事件地方真实风险对公众实时关注度的绝对影响,仅仅利用区域公众关注度表示群体的健康行为反应是不合理的。因此,可通过公众风险感知指标克服了上述问题。为此步骤S5基于步骤S4的分析结果进行,若解释变量的贡献度低于设定的百分比,例如50%,不进行步骤S5,反之则将此解释变量作为关键解释变量进行步骤S5。
定量识别突发公卫事件真实地方风险与区域公众关注度之间的时空异质性关联(时空非平稳),有助于进一步确定局域时空层面公众对突发公卫事件的风险感知。可利用贝叶斯时空变系数模型估计主导解释因素(突发公卫事件真实地方风险)的局域空间回归系数,以此来定量刻画区域尺度的公众风险感知指标。基于空间回归系数计算的总体公众风险感知地图呈现空间风险感知格局的总体规律,用于支撑宏观区域政策的制定。
构建简化的贝叶斯时空变系数模型,通过移除截距项的时空随机效应,以确保不同解释因素对目标响应变量的空间和时间非平稳影响均有显著变化,方程式如下:
其中,为数据似然水平,为结构的加性预测因子,为目标变量在每个时空单元it的观测值,为考虑空间非平稳性的解释变量,为考虑时间非平稳性的解释变量,为空间回归系数,为时间回归系数,K是空间非平稳因子的个数,M是时间非平稳因子的个数,iCAR为拟合空间随机效应, RW为拟合时间随机效应,函数和分别为拟合空间随机效应和拟合时间随机效应的潜在高斯过程模型,为空间效应精度参数,为表示空间近邻关系的结构矩阵,为时间效应精度参数,为一个的时间结构矩阵,N为高斯分布。
上述简化的贝叶斯时空变系数模型,主要考虑了两大类的随机效应,即具有空间变化的K个空间维度因子SX的空间非平稳随机效应,以及具有时间变化的M个时间维度因子TX的时间非平稳随机效应。其中,空间维度解释因SX的后验估算参数被称为解释因子k在每个区域i的空间回归系数,相对应地,时间维度的解释因子TX的后验估算参数被称为解释因子k在每个节点t的时间回归系数。
函数和代表潜在的高斯过程模型(LGM),分别用于拟合解释变量的空间和时间非平稳性。具体来说,条件自回归先验模型作为一种常见的空间高斯过程模型,将空间自相关特征考虑到随机效应。针对空间回归系数集合,我们定义它服从iCAR先验模型,即。 其中,是精度参数,是一个用于表示空间近邻关系的结构矩阵,可以采用空间10邻接关系定义该矩阵,也可以采用距离衰减函数等其他空间概念化关系来定义。时间维度,我们采用随机游走先验模型作为时间LGM,利用邻近结构估计时间自相关随机效应。针对时间回归系数集合,可以定义,表示其服从随机游走模型的先验分布。其中,代表精度参数,是一个的时间结构矩阵。
由模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域公众风险感知地图。实际应用中,区域公众风险感知指标的内涵定义是突发公卫事件真实风险(如传染病的日累积和新增病例)与区域人群公众关注度的空间异质性关联,可以用上述简化的贝叶斯时空变系数模型的特定区域的空间回归系数来表示。
进一步,针对区域公众风险感知指标做了空间集聚和异常分析,旨在识别突发公卫事件风险感知的四类典型地理区域,即公众高度关注和事件高风险的集聚区,公众低关注和事件低风险的集聚区,公众低关注但事件高风险的异常区,以及公众低关注但事件高风险的异常区。采用局域莫兰指数统计量对区域公众风险感知指标进行空间集聚和异常分析,分析方程式为:
其中,为局域莫兰指数统计量,为区域公众风险感知指标,为区域公众风险感知指标,为各区域公众风险感知指标的均值,为不同空间单元之间的空间权重矩阵, j表示i的相邻空间单元,n是整个研究区空间单元的个数,是空间单元i的方差。
由局域莫兰指数统计量得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
本发明可拟合突发公卫事件大范围细尺度公众关注度的时空差异分布。利用互联网搜索引擎数据多指标数据集,刻画各个区域的每天公众关注度。进一步,通过构建贝叶斯时空变截距统计模型,拟合公众关注度的时间变化趋势和区域时空差异,并估算各区域的公众关注度差异分布地图集。最后,利用方差分割系数评价指标,量化时空统计模型中时间和空间随机效应对公众关注度总体变化的解释程度。
本发明可探索突发公卫事件公众关注度的局域时空影响因素及其时空整体解释能力。在上一段时空描述性建模分析基础上,阐明公众关注度与潜在影响因素之间的局部时空变化关系(时空非平稳性),深入理解突发公卫事件中的集体人类行为;采用贝叶斯局域时空非平稳回归—时空变系数模型,探索各个区域公众关注度与三类影响因素的时空关联,包括突发公卫事件日发展情况,人口日流动情况和背景城市的区域社会决定因素;进一步利用方差分割系数指标评价不同类别影响因素在时间和空间尺度对公众关注度总体变化的解释程度。
本发明通过提出公众风险感知空间评价指标,可估计大范围突发公卫事件的局域风险感知地图集。基于上一段公众关注度与突发公卫事件实时发展之间的时空关联性,研究拟提出公众风险感知空间评价指标,真实客观反应突发公卫事件背景下的区域群体反馈。区域公众风险感知地图由贝叶斯时空非平稳模型拟合的空间回归系数绘制得到,显示了风险感知的总体规律性变化模式,以帮助了解公众应对突发公卫事件的集体行为。进一步,区域公众风险感知的空间集聚和异常地图旨在识别突发公卫事件风险感知的四类典型地理区域,即公众高度关注和突发公卫事件高风险的集聚区,低关注和低风险的集聚区,高关注但低风险的异常区,以及低关注但高风险的异常区。
以中国COVID-19为例。
在中国,截至2021年9月,82.47%的中国互联网用户一直在使用百度搜索引擎来检索他们关注的事件信息,为此,本实施例采用百度搜索引擎。选取了以下关键字“不明原因肺炎”,“全国新冠肺炎疫情实时动态”“无症状感染者”,“新冠肺炎”,“新冠肺炎的症状有哪些症状”,“新冠肺炎最新消息”,“疫情地图”,“COVID-19”,“2019-ncov”,“sars”,“ncp(novel coronavirus pneumonia)”,和“SARS-CoV-2”12个搜索关键词。然后采用主成分分析(PCA),对上述12个搜索关键词进行处理,提取出反映中国367个城市COVID-19日常公众关注度的单一指标。
由表1发现,第一个主成分(Comp.1)单独能够解释所有12个搜索关键词高达80.20%的方差,满足数据降维要求。因此,根据PCA载荷矩阵的强度和12个百度指标项的观测值,计算第一主成分中每个时空单元的主成分得分。我们将这一新的降维指标被重新命名为“综合互联网搜索引擎数据”,并将其作为COVID-19的区域整体公众关注度度量指标,以表征中国各城市日常公众对COVID-19的关注度总体情况。
将上述所得的COVID-19的公众关注度作为目标变量,通过构建贝叶斯时空变截距统计模型,拟合COVID-19公众关注度在国家级的时间变化趋势,如图2所示,并估算中国地级市尺度的公众关注度差异分布地图集。
采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,来衡量中国区域公众对COVID-19关注度的时空分布是否可以被不同的随机效应分量所解释,如协变量的时间、空间和时空相互作用的非平稳性。图3展示了三大类解释因子在考虑了时空非平稳性后,对区域公众关注度的总体解释能力。由图3发现,第一类因子(突发公共卫生事件的实时风险等级)的解释度可以达到82.6%(置信区间:77.6% - 86.4%),说明城市层面人类对COVID-19集体关注的时空差异与每日报告的累积病例(X1)和新增病例(X2)高度相关。第二类因子(人口实时流动)的解释度较低,仅占0.7%(置信区间:0.5% - 0.9%),说明城市每天流出人口(X3)和城市每天流入人口(X4)对COVID-19公众关注度的影响较低。此外,第三类因子(社会经济因素)能够影响城市当地居民的群体网络搜索行为差异,由于其不含有每一天的实时变化特征,仅作为控制因子。在本案例中,第三类因子的贡献为16.7%(置信区间:12.9% - 21.7%),主要包括人均GDP(X5),第一产业从业人员人口密度(X6)和从业人员平均工资(X7)。
正是因为突发公卫事件地方真实风险对公众实时关注度的绝对影响,仅仅利用区域公众关注度表示群体的健康行为反应是不合理的。因此,需提出公众风险感知的区域评价指标。
构建简化的贝叶斯时空变系数模型,由模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域COVID-19公众风险感知地图,既保证了空间完整性,也体现了空间的整体规律性差异,有利于制定地理宏观层面的区域差异性防控策略。并进一步对区域公众风险感知指标做空间集聚和异常分析,得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
最后应说明的是:以上各实施例仅仅为本发明的较优实施例用以说明本发明的技术方案,而非对其限制,当然更不是限制本发明的专利范围;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围;也就是说,但凡在本发明的主体设计思想和精神上作出的毫无实质意义的改动或润色,其所解决的技术问题仍然与本发明一致的,均应当包含在本发明的保护范围之内;另外,将本发明的技术方案直接或间接的运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,包括以下过程:
步骤S1,基于互联网搜索引擎数据刻画各个区域整体公众关注度;
步骤S2,将公众关注度作为目标变量,构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;
步骤S3,构建贝叶斯时空变系数模型,识别目标变量与解释变量关系的时空非平稳性;
步骤S4,计算时空非平稳性中各个解释变量的贡献度;
步骤S5,利用贝叶斯时空变系数模型模拟关键解释变量在每一个区域的空间回归系数,获取各个区域的公众风险感知指标;
所述步骤S5包括以下过程:构建简化的贝叶斯时空变系数模型,方程式如下:
其中,为数据似然水平,为结构的加性预测因子,为目标变量在每个时空单元it的观测值,为考虑空间非平稳性的解释变量,为考虑时间非平稳性的解释变量,为空间回归系数,为时间回归系数,K是空间非平稳因子的个数,M是时间非平稳因子的个数,iCAR为拟合空间随机效应, RW为拟合时间随机效应,函数和分别为拟合空间随机效应和拟合时间随机效应的潜在高斯过程模型,为空间效应精度参数,为表示空间近邻关系的结构矩阵,为时间效应精度参数,为一个的时间结构矩阵,N为高斯分布;
由步骤S5模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域公众风险感知地图;
采用局域莫兰指数统计量对区域公众风险感知指标进行空间集聚和异常分析,分析方程式为:
其中,为局域莫兰指数统计量,为区域公众风险感知指标,为区域公众风险感知指标,为各区域公众风险感知指标的均值,为不同空间单元之间的空间权重矩阵, j表示i的相邻空间单元,n是整个研究区空间单元的个数,是空间单元i的方差;
由局域莫兰指数统计量得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
2.如权利要求1所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述步骤S1包括以下过程:选取互联网搜索引擎多个关键字;采用主成分分析方法对多个关键字进行降维处理获得单一指标;将单一指标作为公众关注度。
6.如权利要求1所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述步骤S3包括以下过程:构建数据似然模型、时空过程模型、结构化空间自相关先验的条件自回归模型、以及结构化时间自相关先验的随机游动模型,方程式分别如下:
其中,为加性预测因子,为家族变换函数,Y为针对突发公卫事件的区域整体公众关注度,为每个空间单元i和时间单元t的观测项;为全局截距项,为关键解释变量,K为解释变量的个数,为辅助解释变量,H为辅助解释变量的个数;为空间回归系数,为时间回归系数,为辅助解释变量的全局回归系数,和为空间截距项和时间截距项;函数表示拟合时空随机效应的潜在高斯模型,为正态分布,j表示i的相邻空间单元,为空间邻接矩阵,代表空间单元i周围的邻居个数,为空间随机效应的方差,为时间随机效应的方差;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210217055.2A CN115860306B (zh) | 2022-03-07 | 2022-03-07 | 一种探测突发公卫事件区域公众风险感知时空差异的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210217055.2A CN115860306B (zh) | 2022-03-07 | 2022-03-07 | 一种探测突发公卫事件区域公众风险感知时空差异的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115860306A true CN115860306A (zh) | 2023-03-28 |
CN115860306B CN115860306B (zh) | 2023-06-06 |
Family
ID=85660008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210217055.2A Active CN115860306B (zh) | 2022-03-07 | 2022-03-07 | 一种探测突发公卫事件区域公众风险感知时空差异的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115860306B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101025737A (zh) * | 2006-02-22 | 2007-08-29 | 王东 | 基于关注度的同源信息搜索引擎聚合显示方法及相关系统 |
US20120315920A1 (en) * | 2011-06-10 | 2012-12-13 | International Business Machines Corporation | Systems and methods for analyzing spatiotemporally ambiguous events |
US8825584B1 (en) * | 2011-08-04 | 2014-09-02 | Smart Information Flow Technologies LLC | Systems and methods for determining social regard scores |
CN107767954A (zh) * | 2017-10-16 | 2018-03-06 | 中国科学院地理科学与资源研究所 | 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法 |
CN109307889A (zh) * | 2017-07-28 | 2019-02-05 | 中国石油化工股份有限公司 | 基于时空变系数加权的优化叠加方法及系统 |
CN111046517A (zh) * | 2019-08-13 | 2020-04-21 | 成都垣景科技有限公司 | 一种基于层次贝叶斯方法的局部尺度滑坡易发性预测方法 |
CN113378975A (zh) * | 2021-06-30 | 2021-09-10 | 哈尔滨理工大学 | 一种电工作业人员风险感知能力差异性评估方法 |
CN114021808A (zh) * | 2021-11-02 | 2022-02-08 | 广东电网有限责任公司广州供电局 | 一种基于突发事件影响等级识别的电力资源配置方法 |
-
2022
- 2022-03-07 CN CN202210217055.2A patent/CN115860306B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101025737A (zh) * | 2006-02-22 | 2007-08-29 | 王东 | 基于关注度的同源信息搜索引擎聚合显示方法及相关系统 |
US20120315920A1 (en) * | 2011-06-10 | 2012-12-13 | International Business Machines Corporation | Systems and methods for analyzing spatiotemporally ambiguous events |
US8825584B1 (en) * | 2011-08-04 | 2014-09-02 | Smart Information Flow Technologies LLC | Systems and methods for determining social regard scores |
CN109307889A (zh) * | 2017-07-28 | 2019-02-05 | 中国石油化工股份有限公司 | 基于时空变系数加权的优化叠加方法及系统 |
CN107767954A (zh) * | 2017-10-16 | 2018-03-06 | 中国科学院地理科学与资源研究所 | 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法 |
CN111046517A (zh) * | 2019-08-13 | 2020-04-21 | 成都垣景科技有限公司 | 一种基于层次贝叶斯方法的局部尺度滑坡易发性预测方法 |
CN113378975A (zh) * | 2021-06-30 | 2021-09-10 | 哈尔滨理工大学 | 一种电工作业人员风险感知能力差异性评估方法 |
CN114021808A (zh) * | 2021-11-02 | 2022-02-08 | 广东电网有限责任公司广州供电局 | 一种基于突发事件影响等级识别的电力资源配置方法 |
Non-Patent Citations (4)
Title |
---|
CHAO SONG 等: "Exploring spatiotemporal nonstationary effects of climate factors on hand, foot, and mouth disease using Bayesian Spatiotemporally Varying Coeffi cients (STVC) model in Sichuan, China", 《SCIENCE OF THE TOTAL ENVIRONMENT》, vol. 648, pages 550 * |
MARK BASS 等: "Efficient Fitting of Bayesian Regression Models with Spatio-temporally Varying Coefficients", 《PROCEEDINGS IN MATHEMATICS & STATISTICS》, vol. 63, pages 1 - 4 * |
解士瑶: "基于公众感知差异的城市综合交通问题程度量化研究", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》, no. 1, pages 038 - 2693 * |
赵宏波 等: "大城市居民自评健康与环境危害感知的空间差异及影响因素——基于郑州市区的实证研究", 《地理科学进展》, vol. 37, no. 12, pages 1713 - 1726 * |
Also Published As
Publication number | Publication date |
---|---|
CN115860306B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Real-time prediction and anomaly detection of electrical load in a residential community | |
Ye et al. | KCAR: A knowledge-driven approach for concurrent activity recognition | |
Zhang et al. | Forecasting seasonal influenza fusing digital indicators and a mechanistic disease model | |
Xiao et al. | Data mining in building automation system for improving building operational performance | |
Izakian et al. | Anomaly detection and characterization in spatial time series data: A cluster-centric approach | |
Gaidai et al. | A novel bio-system reliability approach for multi-state COVID-19 epidemic forecast | |
Aspinall et al. | Using hidden multi-state Markov models with multi-parameter volcanic data to provide empirical evidence for alert level decision-support | |
CN108417274A (zh) | 流行病预测方法、系统及设备 | |
Yuan et al. | A systematic review of aberration detection algorithms used in public health surveillance | |
Represa et al. | Data mining paradigm in the study of air quality | |
Tuke et al. | Pachinko Prediction: A Bayesian method for event prediction from social media data | |
Jiang et al. | COVINet: A deep learning-based and interpretable prediction model for the county-wise trajectories of COVID-19 in the United States | |
CN116258241A (zh) | 一种基于时空关联的监管环境风险预测方法及系统 | |
Teles et al. | Spatial and temporal dynamics of leptospirosis in South Brazil: A forecasting and nonlinear regression analysis | |
Yang et al. | An optimized decomposition integration model for deterministic and probabilistic air pollutant concentration prediction considering influencing factors | |
CN115860306A (zh) | 一种探测突发公卫事件区域公众风险感知时空差异的方法 | |
Mnatsakanyan et al. | Bayesian information fusion networks for biosurveillance applications | |
Saturi | Development of prediction and forecasting model for Dengue disease using machine learning algorithms | |
Haque et al. | Towards development of functional climate-driven early warning systems for climate-sensitive infectious disease: Statistical models and recommendations | |
Wang et al. | Quantitative analysis of the impact of various urban socioeconomic indicators on search-engine-based estimation of COVID-19 prevalence | |
CN114912354B (zh) | 一种预测蚊媒传染病风险的方法、装置及介质 | |
Li et al. | Dengue risk forecast with mosquito vector: A multicomponent fusion approach based on spatiotemporal analysis | |
Wang et al. | The cognitive and mathematical foundations of analytic epidemiology | |
Wanke et al. | Performance Evaluation and Lockdown Decisions of the UK Healthcare System in Dealing with COVID-19: a Novel Unbiased MCDM Score Decomposition into Latent Vagueness and Randomness Components | |
Balashankar et al. | Reconstructing the MERS disease outbreak from news |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |