CN115860306A - 一种探测突发公卫事件区域公众风险感知时空差异的方法 - Google Patents

一种探测突发公卫事件区域公众风险感知时空差异的方法 Download PDF

Info

Publication number
CN115860306A
CN115860306A CN202210217055.2A CN202210217055A CN115860306A CN 115860306 A CN115860306 A CN 115860306A CN 202210217055 A CN202210217055 A CN 202210217055A CN 115860306 A CN115860306 A CN 115860306A
Authority
CN
China
Prior art keywords
time
space
public
spatial
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210217055.2A
Other languages
English (en)
Other versions
CN115860306B (zh
Inventor
宋超
潘杰
解铭宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202210217055.2A priority Critical patent/CN115860306B/zh
Publication of CN115860306A publication Critical patent/CN115860306A/zh
Application granted granted Critical
Publication of CN115860306B publication Critical patent/CN115860306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种探测突发公卫事件区域公众风险感知时空差异的方法,包括基于互联网搜索引擎数据刻画研究区内多个区域的整体公众关注度;构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;构建贝叶斯时空变系数模型,识别区域公众关注度与解释变量关系的时空非平稳性;计算考虑时空非平稳性后各个解释变量的贡献度;利用贝叶斯时空变系数模型拟合关键解释变量在各个区域的空间回归系数,用作区域公众风险感知评价指标。本发明是突发公卫事件背景下基于时空异质性视角的,用于区域公众关注度的趋势识别、差异分析与公众风险感知评价的方法,采用了贝叶斯时空变系数模型用于探测区域公众关注与突发事件真实风险之间关联的时空变化。

Description

一种探测突发公卫事件区域公众风险感知时空差异的方法
技术领域
本发明属于数据分析方法技术领域,具体涉及一种探测突发公卫事件区域公众风险感知时空差异的方法。
背景技术
突发公卫事件,如重大新发传染病,非药物干预措施是应对其传播的即时和相对有效的策略,主要包括个人预防、社交距离和病例驱动措施。由于非药物干预措施需要公众层面的自发性、主动获取关键信息等积极配合行为,因此公众对突发公卫事件的区域群体关注会直接影响防疫机构采取缓解措施的时机和实施效果,进而影响突发公卫事件的实际进展。
从宏观视角出发,网络搜索引擎是快速获取大范围区域公众关注度的数据源。例如,百度指数作为互联网搜索引擎数据产品,其数据最小时空尺度可以汇总到每一天的城市级别。但是,目前面向突发公卫事件的互联网搜索引擎数据分析研究忽略了地方差异性和空间异质性。
同时,基于搜索引擎产品的公众关注度指标并不能真实客观地反映公众对突发公卫事件在区域层面的风险认知水平,特别是考虑地方差异(空间异质性)的影响。例如,突发公卫事件风险严重地区如果公众关注度较低,这表明公众的风险认知可能相对较低,需要提升群体健康素养;而在事件风险轻微地区如果公众关注度较高,则表明公众风险认知过高,可能引发区域公共恐慌而造成经济损失和社会动荡。传统突发事件情景下的公众风险感知研究几乎都是基于单个或者少量地区的人群个体抽样视角(如人群问卷调查),没有从整个国家层面考虑群体风险感知在每个区域的地理空间差异,以及风险感知在事件发展不同阶段的时间差异。因此,在区域公众关注(网络搜索引擎指标)基础上,创新提出区域公众风险感知指标,即如何定量化刻画突发公卫事件实际地方风险等级与区域群体公众关注度之间的局域关联程度,可以作为更有意义的评价指标,有助于理解大范围细尺度群体公众对突发公卫事件的真实反馈。
因此,本发明提供了一种探测突发公卫事件区域公众风险感知时空差异的方法,以至少解决上述部分技术问题。
发明内容
本发明要解决的技术问题是:提供一种探测突发公卫事件区域公众风险感知时空差异的方法,以至少解决上述部分技术问题。
为实现上述目的,本发明采用的技术方案如下:
一种探测突发公卫事件区域公众风险感知时空差异的方法,包括以下过程:
步骤S1,基于互联网搜索引擎数据刻画各个区域整体公众关注度;
步骤S2,将公众关注度作为目标变量,构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;
步骤S3,构建贝叶斯时空变系数模型,识别目标变量与解释变量关系的时空非平稳性;
步骤S4,计算时空非平稳性中各个解释变量的贡献度;
步骤S5,利用贝叶斯时空变系数模型模拟关键解释变量在每一个区域的空间回归系数,获取各个区域的公众风险感知指标。
进一步地,所述步骤S1包括以下过程:选取互联网搜索引擎多个关键字;采用主成分分析方法对多个关键字进行降维处理获得单一指标;将单一指标作为公众关注度。
进一步地,所述步骤S2包括以下过程:
将公众关注度作为目标变量
Figure RE-DEST_PATH_IMAGE001
构建方程式:
Figure RE-DEST_PATH_IMAGE002
其中,
Figure RE-DEST_PATH_IMAGE003
是截距,代表目标变量在所有空间单元i和时间范围t的均值,/>
Figure RE-DEST_PATH_IMAGE004
和/>
Figure RE-DEST_PATH_IMAGE005
分别为目标变量的空间结构化空间非结构化的随机变量,/>
Figure RE-DEST_PATH_IMAGE006
为时间结构化的随机变量,/>
Figure RE-DEST_PATH_IMAGE007
为时间非结构化的随机变量。
进一步地,对于随机变量
Figure RE-DEST_PATH_IMAGE008
,服从条件自回归先验分布,其空间相关性服从高斯分布的条件自回归模型,并构建条件自回归模型方程式:
Figure RE-DEST_PATH_IMAGE009
其中,
Figure RE-DEST_PATH_IMAGE010
为空间相关系数,/>
Figure RE-DEST_PATH_IMAGE011
为周边空间单元/>
Figure RE-DEST_PATH_IMAGE012
的条件函数,/>
Figure RE-DEST_PATH_IMAGE013
为方差,/>
Figure RE-DEST_PATH_IMAGE014
为空间单元i的周边空间单元数;
对于随机变量
Figure RE-DEST_PATH_IMAGE015
,服从随机游动先验分布/>
Figure RE-DEST_PATH_IMAGE016
,并构建随机游动先验模型方程式:
Figure RE-DEST_PATH_IMAGE017
t = 1,
Figure RE-DEST_PATH_IMAGE018
t = 2,……T-1,
Figure RE-DEST_PATH_IMAGE019
t = T
其中,
Figure RE-DEST_PATH_IMAGE020
为精度参数,T为最长时间跨度。
进一步地,构建方程式对
Figure RE-69946DEST_PATH_IMAGE011
参数先验:
Figure RE-DEST_PATH_IMAGE021
其中,
Figure RE-DEST_PATH_IMAGE022
为精度参数,它等于方差/>
Figure RE-DEST_PATH_IMAGE023
的倒数,i~j表示ij相邻;/>
由步骤S2模型拟合出的随机变量
Figure RE-770048DEST_PATH_IMAGE015
和随机变量/>
Figure RE-DEST_PATH_IMAGE024
分别可视化得到公众关注度在区域整体的时间变化趋势、以及各个区域的公众关注度差异分布地图集。
进一步地,所述步骤S3包括以下过程:构建数据似然模型、时空过程模型、结构化空间自相关先验的条件自回归模型、以及结构化时间自相关先验的随机游动模型,方程式分别如下:
Figure RE-DEST_PATH_IMAGE025
其中,
Figure RE-DEST_PATH_IMAGE026
为加性预测因子,/>
Figure RE-DEST_PATH_IMAGE027
为家族变换函数,Y为针对突发公卫事件的区域整体公众关注度,/>
Figure RE-DEST_PATH_IMAGE028
为每个空间单元i和时间单元t的观测项;/>
Figure RE-DEST_PATH_IMAGE029
为全局截距项,/>
Figure RE-DEST_PATH_IMAGE030
为关键解释变量,K为解释变量的个数,/>
Figure RE-DEST_PATH_IMAGE031
为辅助解释变量,H为辅助解释变量的个数;/>
Figure RE-DEST_PATH_IMAGE032
为空间回归系数,/>
Figure RE-DEST_PATH_IMAGE033
为时间回归系数,/>
Figure RE-DEST_PATH_IMAGE034
为辅助解释变量/>
Figure RE-DEST_PATH_IMAGE035
的全局回归系数,/>
Figure RE-DEST_PATH_IMAGE036
和/>
Figure RE-DEST_PATH_IMAGE037
为空间截距项和时间截距项;函数/>
Figure RE-DEST_PATH_IMAGE038
表示拟合时空随机效应的潜在高斯模型,/>
Figure RE-DEST_PATH_IMAGE039
为正态分布,j表示i的相邻空间单元,/>
Figure RE-DEST_PATH_IMAGE040
为空间邻接矩阵,/>
Figure RE-DEST_PATH_IMAGE041
代表空间单元i周围的邻居个数,
Figure RE-DEST_PATH_IMAGE042
为空间随机效应的方差,/>
Figure RE-DEST_PATH_IMAGE043
为时间随机效应的方差;
由步骤S3模型拟合出的空间回归系数
Figure RE-DEST_PATH_IMAGE044
和时间回归系数/>
Figure RE-DEST_PATH_IMAGE045
识别目标变量与解释变量关系的时空非平稳性。
进一步地,所述参数
Figure RE-470674DEST_PATH_IMAGE045
由随机游动的一阶或二阶时间结构矩阵决定,结构化时间自相关先验的随机游动模型的一阶和二阶形式分别由以下两个公式拟合:
Figure RE-DEST_PATH_IMAGE046
Figure RE-DEST_PATH_IMAGE047
其中,
Figure RE-DEST_PATH_IMAGE048
为时间随机效应参数,/>
Figure RE-DEST_PATH_IMAGE049
为精度参数,T为最长时间跨度。
进一步地,所述步骤S4包括以下过程:
采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,计算方程式为:
Figure RE-DEST_PATH_IMAGE050
其中,
Figure RE-DEST_PATH_IMAGE051
为范围在[0,1]的百分比值,/>
Figure RE-DEST_PATH_IMAGE052
为所有随机效应的方差之和,/>
Figure RE-DEST_PATH_IMAGE053
为未解释随机效应(残差)的方差,/>
Figure RE-DEST_PATH_IMAGE054
为目标随机效应组分的方差之和;
由计算得到的方差分割系数表示时空非平稳性中各个解释变量的贡献度。
进一步地,所述步骤S5包括以下过程:构建简化的贝叶斯时空变系数模型,方程式如下:
Figure RE-DEST_PATH_IMAGE055
Figure RE-DEST_PATH_IMAGE056
其中,
Figure RE-DEST_PATH_IMAGE057
为数据似然水平,/>
Figure RE-DEST_PATH_IMAGE058
为结构的加性预测因子,/>
Figure RE-DEST_PATH_IMAGE059
为目标变量在每个时空单元it的观测值,/>
Figure RE-DEST_PATH_IMAGE060
为考虑空间非平稳性的解释变量,/>
Figure RE-DEST_PATH_IMAGE061
为考虑时间非平稳性的解释变量,/>
Figure RE-DEST_PATH_IMAGE062
为空间回归系数,/>
Figure RE-DEST_PATH_IMAGE063
为时间回归系数,K是空间非平稳因子的个数,M是时间非平稳因子的个数,iCAR为拟合空间随机效应, RW为拟合时间随机效应,函数
Figure RE-DEST_PATH_IMAGE064
和/>
Figure RE-DEST_PATH_IMAGE065
分别为拟合空间随机效应和拟合时间随机效应的潜在高斯过程模型,/>
Figure RE-DEST_PATH_IMAGE066
为空间效应精度参数,/>
Figure RE-DEST_PATH_IMAGE067
为表示空间近邻关系的/>
Figure RE-DEST_PATH_IMAGE068
结构矩阵,/>
Figure RE-DEST_PATH_IMAGE069
为时间效应精度参数,
Figure RE-DEST_PATH_IMAGE070
为一个/>
Figure RE-DEST_PATH_IMAGE071
的时间结构矩阵,N为高斯分布;
由步骤S5模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域公众风险感知地图;
采用局域莫兰指数统计量对区域公众风险感知指标进行空间集聚和异常分析,分析方程式为:
Figure RE-DEST_PATH_IMAGE072
,/>
Figure RE-DEST_PATH_IMAGE073
其中,
Figure RE-DEST_PATH_IMAGE074
为局域莫兰指数统计量,/>
Figure RE-DEST_PATH_IMAGE075
为区域公众风险感知指标,/>
Figure RE-DEST_PATH_IMAGE076
为区域公众风险感知指标,/>
Figure RE-DEST_PATH_IMAGE077
为各区域公众风险感知指标的均值,/>
Figure RE-DEST_PATH_IMAGE078
为不同空间单元之间的空间权重矩阵, j表示i的相邻空间单元,n是整个研究区空间单元的个数,/>
Figure RE-DEST_PATH_IMAGE079
是空间单元i的方差;
由局域莫兰指数统计量得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
与现有技术相比,本发明具有以下有益效果:
本发明是突发公卫事件背景下一种基于局域时空异质性视角的,用于区域公众关注度的趋势识别、差异分析与客观评价(公众风险感知)的方法,采用了适用于大数据应用计算的时空变系数模型,用于探测突发公卫事件区域公众风险感知时空差异。本发明通过前沿时空统计模型探测解释变量对目标变量的时空异质性影响效应(时空非平稳性),提升了模型拟合和预测效果;借助时空独立非平稳性的贝叶斯先验设定,直接输出考虑时空自相关效应的后验时间和空间回归系数及可信区间,无需时空系数再分析,并大幅降低了模型复杂度以减小贝叶斯推断的计算负担;并针对解释变量非平稳随机效应而采用的时空独立设定,不仅增强了对时空变量关系的直观解释能力,同时保证了其应用于地理时空大数据的计算可行性和算法可塑性。
本发明揭示了突发公卫事件背景下影响区域公众关注度的局域尺度驱动因素及其时空作用机理。在大范围细尺度层面,本发明基于局域时空异质性视角,挖掘突发公卫事件公众关注度的时空差异分布,以及其影响因素的时空非平稳,为宏观地理空间归因提供可能线索,为制定因地且因时制宜的公卫防控政策提供重要依据。
本发明弥补了传统刻画区域公众关注度指标的局限性,提出了局域公众风险感知的空间评价新指标。本发明基于时空非平稳的理论基础,提出区域公众风险感知指标,能够进一步考虑公众关注度与真实事件风险的时空异质性变量关系。采用的贝叶斯时空变系数模型为探索变量关系的时空非平稳性这一关键问题提供了可行的研究思路、理论基础和建模框架。
附图说明
图1为本发明方法流程图。
图2为具体实施例基于贝叶斯时空变截距模型拟合的整个研究区突发公卫事件公众关注度的总体时间变化趋势图(以中国首轮COVID-19疫情爆发为例)。
图3为具体实施例考虑时空非平稳后的各解释因子对目标变量的总体贡献百分比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进一步详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种探测突发公共事件区域公众风险感知时空差异的方法,是一种突发公卫事件背景下基于局域时空异质性视角的,用于区域公众关注度的趋势识别、差异分析与客观评价(公众风险感知)的方法,采用了适用于大数据应用计算的贝叶斯时空变系数模型,用于探测突发公卫事件区域公众风险感知时空差异。
近年来,局域空间和时空回归逐渐兴起,旨在拟合变量关系的空间和时空非平稳性。目前,基于频率统计框架的地理加权回归模型已经发展了它的时空版,即时空地理加权回归,并在不断地改进与发展。地理加权回归模型和时空地理加权回归是探测空间非平稳和时空非平稳的传统频率统计的典型代表。
局域回归根据建模体系差异又分为传统频率统计和现代贝叶斯统计两大家族,尽管它们输出结果类似,但是在整个建模策略与求解体系上本质不同。与传统频率统计相比,贝叶斯统计构建的局域空间和时空非平稳回归模型具有更强的优势:采用全地图建模策略(即建立针对全区域的完整和统一的模型),考虑多源先验知识,直接估算参数的不确定性,具有较强的模型可扩展性。贝叶斯时空变系数模型则是一类基于贝叶斯统计内核提出的局域时空非平稳性回归模型,因此本发明基于贝叶斯时空变系数模型,定量拟合区域群体公众关注度与突发公卫地方实际风险之间的时空非平稳性(不同变量之间关系的时空异质性)。
本发明所述的一种探测突发公共事件区域公众风险感知时空差异的方法,包括:
步骤S1,基于互联网搜索引擎数据刻画各个区域整体公众关注度;
步骤S2,将公众关注度作为目标变量,构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;
步骤S3,构建贝叶斯时空变系数模型,识别目标变量与解释变量关系的时空非平稳性;
步骤S4,计算时空非平稳性中各个解释变量的贡献度;
步骤S5,利用贝叶斯时空变系数模型模拟关键解释变量在每一个区域的空间回归系数,获取各个区域的公众风险感知指标。
互联网搜索引擎数据可以量化地描述区域公众对重大突发公卫事件,在突发事件处理上具有实时性、覆盖人群范围广和成本低廉等优点。互联网搜索引擎数据可以从时空维度定量地描述公众对突发公卫事件的集体关注,并且可限制在特定的行政地点和特定时期。为此,本发明采用采用互联网搜索引擎数据来反映公众对突发公卫事件的每一天的关注。
步骤S1包括以下过程:通过互联网搜索引擎搜集与突发公卫事件相关的多个关键字,采用主成分分析方法对多个关键字进行降维处理,从多个关键词中提取第一主成分并获得单一指标,代表研究期间各区域群体公众对突发公卫事件的关注程度,并将单一指标作为公众关注度。所述公众关注度仅代表搜索引擎指标的时空分布,未考虑地方真实的突发公卫事件的风险等级。主成分分析方法是一种著名的多元方法,它将不同的相关变量转换成几个线性不相关的变量,称为主成分,其中第一个主成分包含了关于数据集的大部分信息。本发明采用主成分分析方法分析的优点在于,可针对后续的时空回归建模,使用一个一维的因子作为目标变量,用于定量表达群体公众关注在每个地区每天的整体水平。
此外,以重大新发传染病为例,还必须考虑了影响区域公众关注的三类解释因素,即当地每天的疾病报告病例、当地每天的人口流动情况以及城市的宏观社会经济水平。疾病报告病例包括累计病例和新增病例,人口流动包括流入人口和流出人口,城市社会经济包括人均GDP、第一产业从业人员人口密度、从业人员平均工资等因子。其中,疾病报告病例是最重要的关键因子,用于代表当地的真实突发公卫的风险程度,进一步利用这个因子,才能计算区域公众风险感知指标。
贝叶斯时空变截距模型的建模统计原理与动态非参数化时空模型类似。动态非参数化时空模型是层次贝叶斯框架下时空统计建模研究中广泛使用的一种模型,相比于典型参数化时空模型,它不仅可以考虑线性关系的时间趋势,还可以考虑非线性变化的时间趋势,因而使用更加广泛。
基于步骤S1的公众关注度,在步骤S2中采用贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布。将公众关注度作为目标变量
Figure RE-DEST_PATH_IMAGE080
构建方程式:
Figure RE-DEST_PATH_IMAGE081
其中,
Figure RE-142570DEST_PATH_IMAGE003
是截距,代表目标变量在所有空间单元i和时间范围t的均值,/>
Figure RE-760502DEST_PATH_IMAGE004
和/>
Figure RE-61034DEST_PATH_IMAGE005
分别为目标变量的空间结构化空间非结构化的随机变量,/>
Figure RE-97123DEST_PATH_IMAGE006
为时间结构化的随机变量,/>
Figure RE-926539DEST_PATH_IMAGE007
为时间非结构化的随机变量。/>
Figure RE-48078DEST_PATH_IMAGE004
和/>
Figure RE-886721DEST_PATH_IMAGE005
之间是相互独立的。
对于随机变量
Figure RE-DEST_PATH_IMAGE082
,服从条件自回归先验分布,其空间相关性服从高斯分布的条件自回归模型,自回归模型被广泛运用在经济学、信息学、自然现象的预测上,它的优点是所需资料不多,可用自身变量数列来进行预测。构建条件自回归模型方程式:
Figure RE-495426DEST_PATH_IMAGE009
其中,
Figure RE-761322DEST_PATH_IMAGE010
为空间相关系数,/>
Figure RE-104579DEST_PATH_IMAGE011
为周边空间单元/>
Figure RE-12492DEST_PATH_IMAGE012
的条件函数,/>
Figure RE-757594DEST_PATH_IMAGE013
为方差,/>
Figure RE-446589DEST_PATH_IMAGE014
为空间单元i的周边空间单元数;特别的, 当/>
Figure RE-DEST_PATH_IMAGE083
时,该过程被称为内稟的条件自回归过程(iCAR)。
构建方程式对
Figure RE-745983DEST_PATH_IMAGE011
参数先验:
Figure RE-DEST_PATH_IMAGE084
其中,
Figure RE-926429DEST_PATH_IMAGE022
为精度参数,它等于方差/>
Figure RE-260458DEST_PATH_IMAGE023
的倒数,i~j表示i地和j地相邻。
对于随机变量
Figure RE-383004DEST_PATH_IMAGE015
,服从随机游动先验分布/>
Figure RE-DEST_PATH_IMAGE085
,并构建随机游动先验模型方程式:
Figure RE-DEST_PATH_IMAGE086
其中,
Figure RE-638536DEST_PATH_IMAGE020
为精度参数,T为最长时间跨度;
Figure RE-622673DEST_PATH_IMAGE015
考虑的是数据中的结构化时间效应的影响,服从随机游动先验分布,即当前时间节点与前一个时间节点存在假设:/>
Figure RE-DEST_PATH_IMAGE087
。/>
时间非结构效应参数
Figure RE-DEST_PATH_IMAGE088
服从可交换的高斯先验分布:/>
Figure RE-DEST_PATH_IMAGE089
由模型拟合出的随机变量
Figure RE-529318DEST_PATH_IMAGE015
和随机变量/>
Figure RE-DEST_PATH_IMAGE090
分别可视化得到公众关注度在区域整体的时间变化趋势、以及各个区域的公众关注度差异分布地图集。
贝叶斯时空变系数模型是一类基于贝叶斯统计内核提出的时空非平稳回归模型,旨在同时探测多个解释变量对目标变量的时空异质性影响,即在拟合目标变量与解释变量之间关系时,考虑地理现象中存在的时空非平稳性。贝叶斯时空变系数模型作为局域时空非平稳回归的新方法,通过借助贝叶斯统计理论和建模优势,能够更灵活地解决时空非平稳性变量关系的拟合问题。贝叶斯时空变系数模型采用了一种时空独立的非平稳假设,即通过分开考虑空间自相关和时间自相关的先验设定,分别估算解释变量后验的局域空间和时间回归系数集合,旨在直接定量刻画变量关系在时间和空间尺度的异质性变化规律。
一个完整的贝叶斯时空变系数模型体现了贝叶斯层次建模的三个层次思想,包括构建数据似然模型、时空过程模型、结构化空间自相关先验的条件自回归模型、以及结构化时间自相关先验的随机游动模型,方程式分别如下:
Figure RE-42338DEST_PATH_IMAGE025
其中,
Figure RE-847483DEST_PATH_IMAGE026
为加性预测因子,/>
Figure RE-618999DEST_PATH_IMAGE027
为家族变换函数,Y为针对突发公卫事件的区域整体公众关注度,/>
Figure RE-193200DEST_PATH_IMAGE028
为每个空间单元i和时间单元t的观测项;/>
Figure RE-408281DEST_PATH_IMAGE029
为全局截距项,/>
Figure RE-169563DEST_PATH_IMAGE030
为关键解释变量,K为解释变量的个数,/>
Figure RE-761082DEST_PATH_IMAGE031
为辅助解释变量,H为辅助解释变量的个数;/>
Figure RE-189789DEST_PATH_IMAGE032
为空间回归系数,/>
Figure RE-556530DEST_PATH_IMAGE033
为时间回归系数,/>
Figure RE-336267DEST_PATH_IMAGE034
为辅助解释变量/>
Figure RE-465897DEST_PATH_IMAGE035
的全局回归系数,/>
Figure RE-483531DEST_PATH_IMAGE036
和/>
Figure RE-305994DEST_PATH_IMAGE037
为空间截距项和时间截距项;函数/>
Figure RE-307448DEST_PATH_IMAGE038
表示拟合时空随机效应的潜在高斯模型,/>
Figure RE-224457DEST_PATH_IMAGE039
为正态分布,j表示i的相邻空间单元,/>
Figure RE-362178DEST_PATH_IMAGE040
为空间邻接矩阵,/>
Figure RE-355541DEST_PATH_IMAGE041
代表空间单元i周围的邻居个数,
Figure RE-578712DEST_PATH_IMAGE042
为空间随机效应的方差,/>
Figure RE-50145DEST_PATH_IMAGE043
为时间随机效应的方差;
数据似然模型利用指数家族函数
Figure RE-DEST_PATH_IMAGE091
将结构化的加性预测因子
Figure RE-DEST_PATH_IMAGE092
与时空观测项
Figure RE-DEST_PATH_IMAGE093
连接,适用于不同种类数据先验分布,如高斯、logistic、泊松、负二项、零膨胀泊松与负 二项等。
其次,时空过程模型包括三类效应,分别用于拟合关键解释变量
Figure RE-DEST_PATH_IMAGE094
的时空非平稳性/>
Figure RE-DEST_PATH_IMAGE095
,辅助解释变量/>
Figure RE-DEST_PATH_IMAGE096
的全局平稳性/>
Figure RE-DEST_PATH_IMAGE097
,以及截距项的时空异质性/>
Figure RE-DEST_PATH_IMAGE098
。贝叶斯时空变系数模型建模不可或缺的核心要素是关键解释变量/>
Figure RE-885115DEST_PATH_IMAGE094
的空间非平稳性/>
Figure RE-DEST_PATH_IMAGE099
和时间非平稳性/>
Figure RE-DEST_PATH_IMAGE100
函数
Figure RE-DEST_PATH_IMAGE101
表示不同的潜在高斯模型/>
Figure RE-DEST_PATH_IMAGE102
,用于拟合不同层次不同类型的空间和时间随机效应,进而估算后验局域变化的参数。贝叶斯时空变系数模型默认采用了两种主流的空间和时间回归子模型,作为潜在高斯模型来拟合时空非平稳性。
其中,空间非平稳随机效应(空间回归系数
Figure RE-DEST_PATH_IMAGE103
)的拟合采用了考虑结构化空间自相关先验的条件自回归模型。/>
Figure RE-DEST_PATH_IMAGE104
的分布以/>
Figure RE-DEST_PATH_IMAGE105
为条件,得到/>
Figure RE-645785DEST_PATH_IMAGE104
的条件分布。其中,如果空间单元ij是相邻的则/>
Figure RE-DEST_PATH_IMAGE106
,否则/>
Figure RE-DEST_PATH_IMAGE107
时间非平稳随机效应(时间回归系数
Figure RE-DEST_PATH_IMAGE108
)的拟合则采用了考虑结构化时间自相关先验的随机游动模型。参数/>
Figure RE-543202DEST_PATH_IMAGE108
由随机游动的一阶或二阶时间结构矩阵决定,结构化时间自相关先验的随机游动模型的一阶和二阶形式分别由以下两个公式拟合:
Figure RE-552747DEST_PATH_IMAGE046
Figure RE-930638DEST_PATH_IMAGE047
其中,
Figure RE-226DEST_PATH_IMAGE048
为时间随机效应参数,/>
Figure RE-447256DEST_PATH_IMAGE049
为精度参数,T为最长时间跨度。
由上述模型拟合出的空间回归系数
Figure RE-DEST_PATH_IMAGE109
和时间回归系数/>
Figure RE-994912DEST_PATH_IMAGE108
识别目标变量与解释变量关系的时空非平稳性。模型拟合的空间回归系数/>
Figure RE-227311DEST_PATH_IMAGE109
和时间回归系数/>
Figure RE-202220DEST_PATH_IMAGE108
用于刻画空间和时间维度上的异质性变量关系,是贝叶斯时空变系数模型最重要的两大核心输出参数集。时空局部尺度参数集的解释与传统的全局尺度回归系数的解释类似,它们也代表了解释变量相对贡献的方向(正或负)和强度(绝对值),但是在每个空间或时间单元都可以得到每种解释变量的回归系数。例如,以0为阈值,一个空间或时间单元的局域尺度回归系数大于0,表明目标现象的空间或时间效应与当前解释变量呈正相关,局域尺度系数绝对值越大,相对贡献越高。如果局部尺度系数的值小于0,则解释正相反。
类似地,同样可以采用空间条件自回归模型和时间随机游动先验模型拟合时空截距项
Figure RE-DEST_PATH_IMAGE110
,/>
Figure RE-DEST_PATH_IMAGE111
的随机效应,即/>
Figure RE-DEST_PATH_IMAGE112
和/>
Figure RE-DEST_PATH_IMAGE113
。此外,针对地理时空大数据,贝叶斯时空变系数模型的参数、超参数模型采用了贝叶斯统计的无信息先验设定,体现了数据驱动的建模思想,以适用不同案例的通用建模需求。
贝叶斯时空变系数模型可以得到每个局域尺度不同驱动因子的贡献度(解释力),但是由于时空信息的多维复杂性,其结论可能不容易归纳为一个整体宏观的结论。实际应用中,实践者可能会需要感兴趣的随机效应(如时间总体、空间总体、每个因子、不同空间尺度效应)的总体贡献度。为了解决所述问题,采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,计算方程式为:
Figure RE-DEST_PATH_IMAGE114
其中,
Figure RE-DEST_PATH_IMAGE115
为范围在[0,1]的百分比值,/>
Figure RE-DEST_PATH_IMAGE116
为所有随机效应的方差之和,/>
Figure RE-DEST_PATH_IMAGE117
为未解释随机效应(残差)的方差,/>
Figure RE-DEST_PATH_IMAGE118
为目标随机效应组分的方差之和;实际上,/>
Figure RE-DEST_PATH_IMAGE119
是可选的,取决于实际需求,可以是一个特定因素的单一随机效应的方差,或不同来源的随机效应的方差之和。
由计算得到的方差分割系数表示时空非平稳性中各个解释变量的贡献度。与主流的识别因子总体贡献的方法,如与随机森林和地理探测器相比,方差分割系数评价指标的优势在于利用贝叶斯时空变系数模型,不仅可以检测考虑局域时空非平稳特性后的解释因子总体贡献度,同时还可以检测每种解释因子在时间和空间维度上的差异贡献。
突发公卫事件地方真实风险对公众实时关注度的绝对影响,仅仅利用区域公众关注度表示群体的健康行为反应是不合理的。因此,可通过公众风险感知指标克服了上述问题。为此步骤S5基于步骤S4的分析结果进行,若解释变量的贡献度低于设定的百分比,例如50%,不进行步骤S5,反之则将此解释变量作为关键解释变量进行步骤S5。
定量识别突发公卫事件真实地方风险与区域公众关注度之间的时空异质性关联(时空非平稳),有助于进一步确定局域时空层面公众对突发公卫事件的风险感知。可利用贝叶斯时空变系数模型估计主导解释因素(突发公卫事件真实地方风险)的局域空间回归系数,以此来定量刻画区域尺度的公众风险感知指标。基于空间回归系数计算的总体公众风险感知地图呈现空间风险感知格局的总体规律,用于支撑宏观区域政策的制定。
构建简化的贝叶斯时空变系数模型,通过移除截距项的时空随机效应,以确保不同解释因素对目标响应变量的空间和时间非平稳影响均有显著变化,方程式如下:
Figure RE-DEST_PATH_IMAGE120
Figure RE-DEST_PATH_IMAGE121
其中,
Figure RE-133617DEST_PATH_IMAGE057
为数据似然水平,/>
Figure RE-999811DEST_PATH_IMAGE058
为结构的加性预测因子,/>
Figure RE-821136DEST_PATH_IMAGE059
为目标变量在每个时空单元it的观测值,/>
Figure RE-498105DEST_PATH_IMAGE060
为考虑空间非平稳性的解释变量,/>
Figure RE-404881DEST_PATH_IMAGE061
为考虑时间非平稳性的解释变量,/>
Figure RE-559919DEST_PATH_IMAGE062
为空间回归系数,/>
Figure RE-766910DEST_PATH_IMAGE063
为时间回归系数,K是空间非平稳因子的个数,M是时间非平稳因子的个数,iCAR为拟合空间随机效应, RW为拟合时间随机效应,函数/>
Figure RE-332889DEST_PATH_IMAGE064
和/>
Figure RE-992540DEST_PATH_IMAGE065
分别为拟合空间随机效应和拟合时间随机效应的潜在高斯过程模型,/>
Figure RE-951269DEST_PATH_IMAGE066
为空间效应精度参数,/>
Figure RE-747187DEST_PATH_IMAGE067
为表示空间近邻关系的/>
Figure RE-765958DEST_PATH_IMAGE068
结构矩阵,/>
Figure RE-896594DEST_PATH_IMAGE069
为时间效应精度参数,
Figure RE-393435DEST_PATH_IMAGE070
为一个/>
Figure RE-309438DEST_PATH_IMAGE071
的时间结构矩阵,N为高斯分布。
上述简化的贝叶斯时空变系数模型,主要考虑了两大类的随机效应,即具有空间变化的K个空间维度因子SX的空间非平稳随机效应
Figure RE-DEST_PATH_IMAGE122
,以及具有时间变化的M个时间维度因子TX的时间非平稳随机效应/>
Figure RE-DEST_PATH_IMAGE123
。其中,空间维度解释因SX的后验估算参数/>
Figure RE-702373DEST_PATH_IMAGE062
被称为解释因子k在每个区域i的空间回归系数,相对应地,时间维度的解释因子TX的后验估算参数/>
Figure RE-336617DEST_PATH_IMAGE063
被称为解释因子k在每个节点t的时间回归系数。
函数
Figure RE-DEST_PATH_IMAGE124
和/>
Figure RE-DEST_PATH_IMAGE125
代表潜在的高斯过程模型(LGM),分别用于拟合解释变量的空间和时间非平稳性。具体来说,条件自回归先验模型作为一种常见的空间高斯过程模型,将空间自相关特征考虑到随机效应。针对空间回归系数集合/>
Figure RE-DEST_PATH_IMAGE126
,我们定义它服从iCAR先验模型,即/>
Figure RE-DEST_PATH_IMAGE127
。 其中,/>
Figure RE-DEST_PATH_IMAGE128
是精度参数,/>
Figure RE-DEST_PATH_IMAGE129
是一个用于表示空间近邻关系的/>
Figure RE-DEST_PATH_IMAGE130
结构矩阵,可以采用空间10邻接关系定义该矩阵,也可以采用距离衰减函数等其他空间概念化关系来定义。时间维度,我们采用随机游走先验模型作为时间LGM,利用邻近结构估计时间自相关随机效应。针对时间回归系数集合/>
Figure RE-DEST_PATH_IMAGE131
,可以定义/>
Figure RE-DEST_PATH_IMAGE132
,表示其服从随机游走模型的先验分布。其中,/>
Figure RE-DEST_PATH_IMAGE133
代表精度参数,
Figure RE-DEST_PATH_IMAGE134
是一个/>
Figure RE-DEST_PATH_IMAGE135
的时间结构矩阵。
由模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域公众风险感知地图。实际应用中,区域公众风险感知指标的内涵定义是突发公卫事件真实风险(如传染病的日累积和新增病例)与区域人群公众关注度的空间异质性关联,可以用上述简化的贝叶斯时空变系数模型的特定区域的空间回归系数
Figure RE-DEST_PATH_IMAGE136
来表示。
进一步,针对区域公众风险感知指标做了空间集聚和异常分析,旨在识别突发公卫事件风险感知的四类典型地理区域,即公众高度关注和事件高风险的集聚区,公众低关注和事件低风险的集聚区,公众低关注但事件高风险的异常区,以及公众低关注但事件高风险的异常区。采用局域莫兰指数统计量对区域公众风险感知指标进行空间集聚和异常分析,分析方程式为:
Figure RE-607455DEST_PATH_IMAGE072
,/>
Figure RE-377965DEST_PATH_IMAGE073
其中,
Figure RE-472960DEST_PATH_IMAGE074
为局域莫兰指数统计量,/>
Figure RE-594499DEST_PATH_IMAGE075
为区域公众风险感知指标,/>
Figure RE-416831DEST_PATH_IMAGE076
为区域公众风险感知指标,/>
Figure RE-DEST_PATH_IMAGE137
为各区域公众风险感知指标的均值,/>
Figure RE-41847DEST_PATH_IMAGE078
为不同空间单元之间的空间权重矩阵, j表示i的相邻空间单元,n是整个研究区空间单元的个数,/>
Figure RE-307743DEST_PATH_IMAGE079
是空间单元i的方差。
由局域莫兰指数统计量得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
本发明可拟合突发公卫事件大范围细尺度公众关注度的时空差异分布。利用互联网搜索引擎数据多指标数据集,刻画各个区域的每天公众关注度。进一步,通过构建贝叶斯时空变截距统计模型,拟合公众关注度的时间变化趋势和区域时空差异,并估算各区域的公众关注度差异分布地图集。最后,利用方差分割系数评价指标,量化时空统计模型中时间和空间随机效应对公众关注度总体变化的解释程度。
本发明可探索突发公卫事件公众关注度的局域时空影响因素及其时空整体解释能力。在上一段时空描述性建模分析基础上,阐明公众关注度与潜在影响因素之间的局部时空变化关系(时空非平稳性),深入理解突发公卫事件中的集体人类行为;采用贝叶斯局域时空非平稳回归—时空变系数模型,探索各个区域公众关注度与三类影响因素的时空关联,包括突发公卫事件日发展情况,人口日流动情况和背景城市的区域社会决定因素;进一步利用方差分割系数指标评价不同类别影响因素在时间和空间尺度对公众关注度总体变化的解释程度。
本发明通过提出公众风险感知空间评价指标,可估计大范围突发公卫事件的局域风险感知地图集。基于上一段公众关注度与突发公卫事件实时发展之间的时空关联性,研究拟提出公众风险感知空间评价指标,真实客观反应突发公卫事件背景下的区域群体反馈。区域公众风险感知地图由贝叶斯时空非平稳模型拟合的空间回归系数绘制得到,显示了风险感知的总体规律性变化模式,以帮助了解公众应对突发公卫事件的集体行为。进一步,区域公众风险感知的空间集聚和异常地图旨在识别突发公卫事件风险感知的四类典型地理区域,即公众高度关注和突发公卫事件高风险的集聚区,低关注和低风险的集聚区,高关注但低风险的异常区,以及低关注但高风险的异常区。
以中国COVID-19为例。
在中国,截至2021年9月,82.47%的中国互联网用户一直在使用百度搜索引擎来检索他们关注的事件信息,为此,本实施例采用百度搜索引擎。选取了以下关键字“不明原因肺炎”,“全国新冠肺炎疫情实时动态”“无症状感染者”,“新冠肺炎”,“新冠肺炎的症状有哪些症状”,“新冠肺炎最新消息”,“疫情地图”,“COVID-19”,“2019-ncov”,“sars”,“ncp(novel coronavirus pneumonia)”,和“SARS-CoV-2”12个搜索关键词。然后采用主成分分析(PCA),对上述12个搜索关键词进行处理,提取出反映中国367个城市COVID-19日常公众关注度的单一指标。
Figure RE-DEST_PATH_IMAGE138
/>
由表1发现,第一个主成分(Comp.1)单独能够解释所有12个搜索关键词高达80.20%的方差,满足数据降维要求。因此,根据PCA载荷矩阵的强度和12个百度指标项的观测值,计算第一主成分中每个时空单元的主成分得分。我们将这一新的降维指标被重新命名为“综合互联网搜索引擎数据”,并将其作为COVID-19的区域整体公众关注度度量指标,以表征中国各城市日常公众对COVID-19的关注度总体情况。
将上述所得的COVID-19的公众关注度作为目标变量,通过构建贝叶斯时空变截距统计模型,拟合COVID-19公众关注度在国家级的时间变化趋势,如图2所示,并估算中国地级市尺度的公众关注度差异分布地图集。
采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,来衡量中国区域公众对COVID-19关注度的时空分布是否可以被不同的随机效应分量所解释,如协变量的时间、空间和时空相互作用的非平稳性。图3展示了三大类解释因子在考虑了时空非平稳性后,对区域公众关注度的总体解释能力。由图3发现,第一类因子(突发公共卫生事件的实时风险等级)的解释度可以达到82.6%(置信区间:77.6% - 86.4%),说明城市层面人类对COVID-19集体关注的时空差异与每日报告的累积病例(X1)和新增病例(X2)高度相关。第二类因子(人口实时流动)的解释度较低,仅占0.7%(置信区间:0.5% - 0.9%),说明城市每天流出人口(X3)和城市每天流入人口(X4)对COVID-19公众关注度的影响较低。此外,第三类因子(社会经济因素)能够影响城市当地居民的群体网络搜索行为差异,由于其不含有每一天的实时变化特征,仅作为控制因子。在本案例中,第三类因子的贡献为16.7%(置信区间:12.9% - 21.7%),主要包括人均GDP(X5),第一产业从业人员人口密度(X6)和从业人员平均工资(X7)。
正是因为突发公卫事件地方真实风险对公众实时关注度的绝对影响,仅仅利用区域公众关注度表示群体的健康行为反应是不合理的。因此,需提出公众风险感知的区域评价指标。
构建简化的贝叶斯时空变系数模型,由模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域COVID-19公众风险感知地图,既保证了空间完整性,也体现了空间的整体规律性差异,有利于制定地理宏观层面的区域差异性防控策略。并进一步对区域公众风险感知指标做空间集聚和异常分析,得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
最后应说明的是:以上各实施例仅仅为本发明的较优实施例用以说明本发明的技术方案,而非对其限制,当然更不是限制本发明的专利范围;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围;也就是说,但凡在本发明的主体设计思想和精神上作出的毫无实质意义的改动或润色,其所解决的技术问题仍然与本发明一致的,均应当包含在本发明的保护范围之内;另外,将本发明的技术方案直接或间接的运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,包括以下过程:
步骤S1,基于互联网搜索引擎数据刻画各个区域整体公众关注度;
步骤S2,将公众关注度作为目标变量,构建贝叶斯时空变截距模型,拟合各个区域公众关注度时空分布;
步骤S3,构建贝叶斯时空变系数模型,识别目标变量与解释变量关系的时空非平稳性;
步骤S4,计算时空非平稳性中各个解释变量的贡献度;
步骤S5,利用贝叶斯时空变系数模型模拟关键解释变量在每一个区域的空间回归系数,获取各个区域的公众风险感知指标;
所述步骤S5包括以下过程:构建简化的贝叶斯时空变系数模型,方程式如下:
Figure 70278DEST_PATH_IMAGE001
Figure 979591DEST_PATH_IMAGE002
其中,
Figure 67633DEST_PATH_IMAGE003
为数据似然水平,/>
Figure 537928DEST_PATH_IMAGE004
为结构的加性预测因子,/>
Figure 330304DEST_PATH_IMAGE005
为目标变量在每个时空单元it的观测值,/>
Figure 264762DEST_PATH_IMAGE006
为考虑空间非平稳性的解释变量,/>
Figure 461388DEST_PATH_IMAGE007
为考虑时间非平稳性的解释变量,/>
Figure 809192DEST_PATH_IMAGE008
为空间回归系数,/>
Figure 811784DEST_PATH_IMAGE009
为时间回归系数,K是空间非平稳因子的个数,M是时间非平稳因子的个数,iCAR为拟合空间随机效应, RW为拟合时间随机效应,函数/>
Figure 538431DEST_PATH_IMAGE010
Figure 561751DEST_PATH_IMAGE011
分别为拟合空间随机效应和拟合时间随机效应的潜在高斯过程模型,/>
Figure 68955DEST_PATH_IMAGE012
为空间效应精度参数,/>
Figure 547341DEST_PATH_IMAGE013
为表示空间近邻关系的/>
Figure 285752DEST_PATH_IMAGE014
结构矩阵,/>
Figure 886498DEST_PATH_IMAGE015
为时间效应精度参数,/>
Figure 818682DEST_PATH_IMAGE016
为一个
Figure 490972DEST_PATH_IMAGE017
的时间结构矩阵,N为高斯分布;
由步骤S5模型拟合出的每个区域的空间回归系数作为区域公众风险感知指标、并可视化得到区域公众风险感知地图;
采用局域莫兰指数统计量对区域公众风险感知指标进行空间集聚和异常分析,分析方程式为:
Figure 254528DEST_PATH_IMAGE018
,/>
Figure 229438DEST_PATH_IMAGE019
其中,
Figure 445655DEST_PATH_IMAGE020
为局域莫兰指数统计量,/>
Figure 656057DEST_PATH_IMAGE021
为区域公众风险感知指标,/>
Figure 477382DEST_PATH_IMAGE022
为区域公众风险感知指标,/>
Figure 685510DEST_PATH_IMAGE023
为各区域公众风险感知指标的均值,/>
Figure 451340DEST_PATH_IMAGE024
为不同空间单元之间的空间权重矩阵, j表示i的相邻空间单元,n是整个研究区空间单元的个数,/>
Figure 340799DEST_PATH_IMAGE025
是空间单元i的方差;
由局域莫兰指数统计量得到两类集聚地区、两类异常地区和一类统计不显著地区、并可视化得到空间集聚和异常分布图。
2.如权利要求1所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述步骤S1包括以下过程:选取互联网搜索引擎多个关键字;采用主成分分析方法对多个关键字进行降维处理获得单一指标;将单一指标作为公众关注度。
3.如权利要求1所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述步骤S2包括以下过程:
将公众关注度作为目标变量
Figure 78948DEST_PATH_IMAGE026
构建方程式:
Figure 21758DEST_PATH_IMAGE027
其中,
Figure 212568DEST_PATH_IMAGE028
是截距,代表目标变量在所有空间单元i和时间范围t的均值,/>
Figure 905718DEST_PATH_IMAGE029
和/>
Figure 295111DEST_PATH_IMAGE030
分别为目标变量的空间结构化空间非结构化的随机变量,/>
Figure 845041DEST_PATH_IMAGE031
为时间结构化的随机变量,/>
Figure 460830DEST_PATH_IMAGE032
为时间非结构化的随机变量。
4.如权利要求3所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,对于随机变量
Figure 754408DEST_PATH_IMAGE033
,服从条件自回归先验分布,其空间相关性服从高斯分布的条件自回归模型,并构建条件自回归模型方程式:
Figure 529466DEST_PATH_IMAGE034
其中,
Figure 922401DEST_PATH_IMAGE035
为空间相关系数,/>
Figure 87803DEST_PATH_IMAGE036
为周边空间单元/>
Figure 981810DEST_PATH_IMAGE037
的条件函数,/>
Figure 752320DEST_PATH_IMAGE038
为方差,/>
Figure 378473DEST_PATH_IMAGE039
为空间单元i的周边空间单元数;
对于随机变量
Figure 854673DEST_PATH_IMAGE040
,服从随机游动先验分布/>
Figure 427737DEST_PATH_IMAGE041
,并构建随机游动先验模型方程式:
Figure 583912DEST_PATH_IMAGE042
t = 1,
Figure 974442DEST_PATH_IMAGE043
t = 2,……T-1,
Figure 786540DEST_PATH_IMAGE044
t = T
其中,
Figure 225612DEST_PATH_IMAGE045
为精度参数,T为最长时间跨度。
5.如权利要求4所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,构建方程式对
Figure 564189DEST_PATH_IMAGE046
参数先验:
Figure 797724DEST_PATH_IMAGE047
其中,
Figure 362698DEST_PATH_IMAGE048
为精度参数,它等于方差/>
Figure 402198DEST_PATH_IMAGE049
的倒数,i~j表示ij相邻;
由步骤S2模型拟合出的随机变量
Figure 532965DEST_PATH_IMAGE040
和随机变量/>
Figure 140664DEST_PATH_IMAGE046
分别可视化得到公众关注度在区域整体的时间变化趋势、以及各个区域的公众关注度差异分布地图集。
6.如权利要求1所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述步骤S3包括以下过程:构建数据似然模型、时空过程模型、结构化空间自相关先验的条件自回归模型、以及结构化时间自相关先验的随机游动模型,方程式分别如下:
Figure 553453DEST_PATH_IMAGE050
其中,
Figure 68748DEST_PATH_IMAGE051
为加性预测因子,/>
Figure 522863DEST_PATH_IMAGE052
为家族变换函数,Y为针对突发公卫事件的区域整体公众关注度,/>
Figure 160518DEST_PATH_IMAGE053
为每个空间单元i和时间单元t的观测项;/>
Figure 496821DEST_PATH_IMAGE054
为全局截距项,/>
Figure 753490DEST_PATH_IMAGE055
为关键解释变量,K为解释变量的个数,/>
Figure 186746DEST_PATH_IMAGE056
为辅助解释变量,H为辅助解释变量的个数;/>
Figure 932985DEST_PATH_IMAGE057
为空间回归系数,/>
Figure 428688DEST_PATH_IMAGE058
为时间回归系数,/>
Figure 551365DEST_PATH_IMAGE059
为辅助解释变量/>
Figure 839127DEST_PATH_IMAGE060
的全局回归系数,/>
Figure 693950DEST_PATH_IMAGE061
和/>
Figure 4846DEST_PATH_IMAGE062
为空间截距项和时间截距项;函数/>
Figure 229416DEST_PATH_IMAGE063
表示拟合时空随机效应的潜在高斯模型,/>
Figure 247051DEST_PATH_IMAGE064
为正态分布,j表示i的相邻空间单元,/>
Figure 600672DEST_PATH_IMAGE065
为空间邻接矩阵,/>
Figure 195601DEST_PATH_IMAGE066
代表空间单元i周围的邻居个数,/>
Figure 660080DEST_PATH_IMAGE067
为空间随机效应的方差,/>
Figure 266642DEST_PATH_IMAGE068
为时间随机效应的方差;
由步骤S3模型拟合出的空间回归系数
Figure 119061DEST_PATH_IMAGE069
和时间回归系数/>
Figure 138969DEST_PATH_IMAGE070
识别目标变量与解释变量关系的时空非平稳性。
7.如权利要求6所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述参数
Figure 79243DEST_PATH_IMAGE070
由随机游动的一阶或二阶时间结构矩阵决定,结构化时间自相关先验的随机游动模型的一阶和二阶形式分别由以下两个公式拟合:
Figure 196104DEST_PATH_IMAGE071
Figure 891528DEST_PATH_IMAGE072
其中,
Figure 70836DEST_PATH_IMAGE073
为时间随机效应参数,/>
Figure 877118DEST_PATH_IMAGE074
为精度参数,T为最长时间跨度。
8.如权利要求1所述的一种探测突发公卫事件区域公众风险感知时空差异的方法,其特征在于,所述步骤S4包括以下过程:
采用方差分割系数作为贝叶斯随机效应贡献百分比的评价指标,计算方程式为:
Figure 615529DEST_PATH_IMAGE075
其中,
Figure 153958DEST_PATH_IMAGE076
为范围在[0,1]的百分比值,/>
Figure 148459DEST_PATH_IMAGE077
为所有随机效应的方差之和,/>
Figure 555169DEST_PATH_IMAGE078
为未解释随机效应的方差,/>
Figure 521988DEST_PATH_IMAGE079
为目标随机效应组分的方差之和;
由计算得到的方差分割系数表示时空非平稳性中各个解释变量的贡献度。
CN202210217055.2A 2022-03-07 2022-03-07 一种探测突发公卫事件区域公众风险感知时空差异的方法 Active CN115860306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210217055.2A CN115860306B (zh) 2022-03-07 2022-03-07 一种探测突发公卫事件区域公众风险感知时空差异的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210217055.2A CN115860306B (zh) 2022-03-07 2022-03-07 一种探测突发公卫事件区域公众风险感知时空差异的方法

Publications (2)

Publication Number Publication Date
CN115860306A true CN115860306A (zh) 2023-03-28
CN115860306B CN115860306B (zh) 2023-06-06

Family

ID=85660008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210217055.2A Active CN115860306B (zh) 2022-03-07 2022-03-07 一种探测突发公卫事件区域公众风险感知时空差异的方法

Country Status (1)

Country Link
CN (1) CN115860306B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101025737A (zh) * 2006-02-22 2007-08-29 王东 基于关注度的同源信息搜索引擎聚合显示方法及相关系统
US20120315920A1 (en) * 2011-06-10 2012-12-13 International Business Machines Corporation Systems and methods for analyzing spatiotemporally ambiguous events
US8825584B1 (en) * 2011-08-04 2014-09-02 Smart Information Flow Technologies LLC Systems and methods for determining social regard scores
CN107767954A (zh) * 2017-10-16 2018-03-06 中国科学院地理科学与资源研究所 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法
CN109307889A (zh) * 2017-07-28 2019-02-05 中国石油化工股份有限公司 基于时空变系数加权的优化叠加方法及系统
CN111046517A (zh) * 2019-08-13 2020-04-21 成都垣景科技有限公司 一种基于层次贝叶斯方法的局部尺度滑坡易发性预测方法
CN113378975A (zh) * 2021-06-30 2021-09-10 哈尔滨理工大学 一种电工作业人员风险感知能力差异性评估方法
CN114021808A (zh) * 2021-11-02 2022-02-08 广东电网有限责任公司广州供电局 一种基于突发事件影响等级识别的电力资源配置方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101025737A (zh) * 2006-02-22 2007-08-29 王东 基于关注度的同源信息搜索引擎聚合显示方法及相关系统
US20120315920A1 (en) * 2011-06-10 2012-12-13 International Business Machines Corporation Systems and methods for analyzing spatiotemporally ambiguous events
US8825584B1 (en) * 2011-08-04 2014-09-02 Smart Information Flow Technologies LLC Systems and methods for determining social regard scores
CN109307889A (zh) * 2017-07-28 2019-02-05 中国石油化工股份有限公司 基于时空变系数加权的优化叠加方法及系统
CN107767954A (zh) * 2017-10-16 2018-03-06 中国科学院地理科学与资源研究所 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法
CN111046517A (zh) * 2019-08-13 2020-04-21 成都垣景科技有限公司 一种基于层次贝叶斯方法的局部尺度滑坡易发性预测方法
CN113378975A (zh) * 2021-06-30 2021-09-10 哈尔滨理工大学 一种电工作业人员风险感知能力差异性评估方法
CN114021808A (zh) * 2021-11-02 2022-02-08 广东电网有限责任公司广州供电局 一种基于突发事件影响等级识别的电力资源配置方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHAO SONG 等: "Exploring spatiotemporal nonstationary effects of climate factors on hand, foot, and mouth disease using Bayesian Spatiotemporally Varying Coeffi cients (STVC) model in Sichuan, China", 《SCIENCE OF THE TOTAL ENVIRONMENT》, vol. 648, pages 550 *
MARK BASS 等: "Efficient Fitting of Bayesian Regression Models with Spatio-temporally Varying Coefficients", 《PROCEEDINGS IN MATHEMATICS & STATISTICS》, vol. 63, pages 1 - 4 *
解士瑶: "基于公众感知差异的城市综合交通问题程度量化研究", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》, no. 1, pages 038 - 2693 *
赵宏波 等: "大城市居民自评健康与环境危害感知的空间差异及影响因素——基于郑州市区的实证研究", 《地理科学进展》, vol. 37, no. 12, pages 1713 - 1726 *

Also Published As

Publication number Publication date
CN115860306B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
Ye et al. KCAR: A knowledge-driven approach for concurrent activity recognition
Zhang et al. Forecasting seasonal influenza fusing digital indicators and a mechanistic disease model
Xiao et al. Data mining in building automation system for improving building operational performance
Izakian et al. Anomaly detection and characterization in spatial time series data: A cluster-centric approach
Gaidai et al. A novel bio-system reliability approach for multi-state COVID-19 epidemic forecast
Aspinall et al. Using hidden multi-state Markov models with multi-parameter volcanic data to provide empirical evidence for alert level decision-support
CN108417274A (zh) 流行病预测方法、系统及设备
Yuan et al. A systematic review of aberration detection algorithms used in public health surveillance
Represa et al. Data mining paradigm in the study of air quality
Tian et al. COVID-Net: A deep learning based and interpretable predication model for the county-wise trajectories of COVID-19 in the United States
CN116258241A (zh) 一种基于时空关联的监管环境风险预测方法及系统
Gao et al. Early indicators of human activity during COVID-19 period using digital trace data of population activities
Shi et al. Inference and prediction of malaria transmission dynamics using time series data
Lawson et al. Bayesian spatial modeling for the joint analysis of zoonosis between human and animal populations
CN115860306A (zh) 一种探测突发公卫事件区域公众风险感知时空差异的方法
Mnatsakanyan et al. Bayesian information fusion networks for biosurveillance applications
Saturi Development of prediction and forecasting model for Dengue disease using machine learning algorithms
Guo et al. Design and analysis of a prediction system about influenza-like illness from the latent temporal and spatial information
Wang et al. Quantitative analysis of the impact of various urban socioeconomic indicators on search-engine-based estimation of COVID-19 prevalence
CN114912354B (zh) 一种预测蚊媒传染病风险的方法、装置及介质
CN113130024A (zh) 医疗事件的预测方法及穿戴设备、计算机可读存储介质
Yang et al. An optimized decomposition integration model for deterministic and probabilistic air pollutant concentration prediction considering influencing factors
Irvine et al. A novel Bayesian approach to predicting reductions in HIV incidence following increased testing interventions among gay, bisexual and other men who have sex with men in Vancouver, Canada
Li et al. Dengue risk forecast with mosquito vector: A multicomponent fusion approach based on spatiotemporal analysis
Gao et al. Early indicators of COVID-19 spread risk using digital trace data of population activities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant