CN113053536A - 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 - Google Patents

一种基于隐马尔科夫模型的传染病预测方法、系统和介质 Download PDF

Info

Publication number
CN113053536A
CN113053536A CN202110053105.3A CN202110053105A CN113053536A CN 113053536 A CN113053536 A CN 113053536A CN 202110053105 A CN202110053105 A CN 202110053105A CN 113053536 A CN113053536 A CN 113053536A
Authority
CN
China
Prior art keywords
sequence
infectious disease
sample
state
outbreak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110053105.3A
Other languages
English (en)
Other versions
CN113053536B (zh
Inventor
方立群
刘玮
徐强
陈津津
蒋宝贵
张海洋
周士夏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Pharmacology and Toxicology of AMMS
Original Assignee
Institute of Pharmacology and Toxicology of AMMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Pharmacology and Toxicology of AMMS filed Critical Institute of Pharmacology and Toxicology of AMMS
Priority to CN202110053105.3A priority Critical patent/CN113053536B/zh
Publication of CN113053536A publication Critical patent/CN113053536A/zh
Application granted granted Critical
Publication of CN113053536B publication Critical patent/CN113053536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种基于隐马尔科夫模型的传染病预测方法、系统和介质,包括:S1生成气象水文观测序列和传染病爆发状态序列;S2对气象水文观测序列进行预处理以生成训练样本集,并将其中样本按照样本特征分为若干样本特征区间;S3根据样本特征、样本特征区间和传染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵;S4根据气象水文观测序列、传染病爆发状态序列、观测概率矩阵、爆发状态转移概率矩阵和初始状态概率分布生成隐马尔科夫模型;S5根据历史的气象水文观测序列预测将来某时刻的气象水文序列,并将预测的气象水文序列带入隐马尔科夫模型对传染病爆发状态进行预测。其具有计算速度快、准确性高、样本数据易于获取的特点。

Description

一种基于隐马尔科夫模型的传染病预测方法、系统和介质
技术领域
本发明涉及一种基于隐马尔科夫模型的传染病预测方法、系统和介质,属于人工智能智慧医疗技术领域。
背景技术
传染病的暴发对社会秩序的安定和人类的健康产生了一定的影响。在传染病的流行规律进行分析的基础上,用科学方法对传染病的流行趋势做出预测,可以对传染病 进行有效的主动预防与控制。传染病预测方法主要分为定性预测和定量预测,为保证 预测结果的准确性,需根据所预测传染病的预测目的、流行病学特征和资料特点等因 素合理选择,如预测某种传染病的发病率在未来是否会上升或下降,可选择定性预测 方法;如预测未来的流行趋势,则选择定量预测方法。
定性预测是通过对当地传染病的流行过程、流行特征及其有关因素的具体分析,判断该病即将流行的趋势和强度。研究方法主要包括流行控制图法、比数图法和“Z- D”现象等。定量预测是利用原始资料,建立恰当的数学模型,预测未来传染病的发病 情况。目前应用于传染病预测研究的数学模型较多,一类是基于动力学的微分方程模 型,该模型适用于自然发展过程中传染病,在人为的防控作用下,预测值与实际情况 相差甚大;一类是结合发病率影响因素的多元回归分析、人工神经网络模型和小波模 型等,此类方法在使用过程中对训练样本是否有代表性具有较高的要求,故不同的地 区、病种和时间的模型都需要根据具体情况进行调整,由于其分析的复杂性,局限了 此类方法的推广和应用。
发明内容
针对上述问题,本发明的目的是提供了一种基于隐马尔科夫模型的传染病预测方法、系统和介质,其具有计算速度快、准确性高、样本数据易于获取的特点。
为实现上述目的,本发明采取以下技术方案:一种基于隐马尔科夫模型的传染病预测方法,包括以下步骤:S1采集气象水文信息,生成气象水文观测序列和传染病爆 发状态序列;S2对气象水文观测序列进行预处理以生成训练样本集,并将训练样本集 中的样本按照样本特征分为若干样本特征区间;S3根据样本特征、样本特征区间和传 染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵;S4根据气象水文观测 序列、传染病爆发状态序列、观测概率矩阵、爆发状态转移概率矩阵和初始状态概率 分布生成隐马尔科夫模型;S5根据历史的气象水文观测序列预测将来某时刻的气象水 文序列,并将预测的气象水文序列带入隐马尔科夫模型对传染病爆发状态进行预测。
进一步,步骤S1中气象水文信息包括:降雨量RF、平均风速AW、平均气温AT、 平均最高气温HT、平均最低气温LT、平均气压AP、平均相对湿度ARH和日照时数SH。
进一步,步骤S1中传染病爆发状态序列包括:未爆发、局部爆发和大面积爆发。
进一步,步骤S2中将样本按照样本特征分为若干样本特征区间的方法为:将经过预处理的训练样本集中样本特征值j按照升序排列,若相邻样本的特征值之差小于预 设门限εj,则这两个样本属于同一特征区间,若相邻样本的特征值之差大于等于-预设 门限εj,则创建一新的特征区间。
进一步,步骤S3中观测概率矩阵的计算方法为:根据落入区间[b′j,b″j]d的样本个数
Figure BDA0002899720570000021
和总的样本个数|Oj′|计算样本落入区间[b′j,b″j]d的概率plj(k,d):
Figure BDA0002899720570000022
样本特征j的观测概率矩阵Bj为Bj={plj(k,d)|1≤k≤r,1≤d≤r′j},其中,k 表示样本特征j的状态序列编号,d表示样本特征区间的序号,b′j表示样本特征区间 最小值,b″j表示样本特征区间最大值,r表示样本特征j的状态总数,r′j表示样本特征 j的特征区间总数。
进一步,步骤S3中爆发状态转移概率矩阵的计算方法为:根据传染病爆发序列 S,采用akl表示t时刻处于状态sk、t+1时刻转移到状态sl的概率,用Nkl表示t时刻处 于状态sk、t+1时刻转移到状态sl的频次,利用极大似然估计法,则有
Figure BDA0002899720570000023
状态转移概率矩阵A为A={akl|1≤k≤r,1≤l≤r},其中,k和l均为状态序列编号。
进一步,步骤S5中根据历史的气象水文观测序列预测将来某时刻的气象水文序列的方法为:对气象水文观测序列O按照样本特征j按月进行样本的数据预处理,得到 历年第t个月样本特征j对应的训练样本集O′tj={V′tj(i)|1≤i≤m},利用马尔科夫模型对 训练样本集O′tj进行学习,获取m+1年第t个月样本特征j的预测值V"tj(m+1),将其与第 j类样本特征区间集合中的样本特征区间进行比较,获知预测值V"tj(m+1)所属的样本特 征区间[b′j,b"j]d
进一步,步骤S5中预测传染病爆发状态的预测方法为:基于隐马尔科夫模型 HID={O,S,A,B,π},根据Viterbi算法,对预测的气象水文序列O"进行传染病暴发状态 预测
Figure BDA0002899720570000031
本发明还公开了一种基于隐马尔科夫模型的传染病预测系统,包括:序列采集模块,用于采集气象水文信息,生成气象水文观测序列和传染病爆发状态序列;训练样 本生成模块,用于对气象水文观测序列进行预处理以生成训练样本集,并将训练样本 集中的样本按照样本特征分为若干样本特征区间;矩阵计算模块,用于根据样本特征、 样本特征区间和传染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵;模 型生成模块,用于根据气象水文观测序列、传染病爆发状态序列、观测概率矩阵、爆 发状态转移概率矩阵和初始状态概率分布生成隐马尔科夫模型;传染病预测模块,用 于根据历史的气象水文观测序列预测将来某时刻的气象水文序列,并将预测的气象水 文序列带入隐马尔科夫模型对传染病爆发状态进行预测。
本发明还公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行以实现上述任一项的基于隐马尔科夫模型的传染病预 测方法。
本发明由于采取以上技术方案,其具有以下优点:
1、快速数据处理能力:历年传染病暴发状态序列、加之传染病暴发序列对应的气象水文观测序列,累加起来数据量是惊人的,海量数据的分析处理对系统的响应能力 提出了挑战。本发明通过按月求平均的方法,对八类气象水文观测序列进行了预处理, 然后通过划分样本区间,采用递归算法求解的方法,在一定程度上提升了数据的分析 处理能力。
2、预测精准:本发明充分考虑了传染病未暴发、局部暴发和全面暴发三种隐状态,以及降雨量RF、平均风速AW、平均气温AT、平均最高气温HT、平均最低气温LT、 平均气压AP、平均相对湿度ARH、日照时数SH八类气象水文观测序列与传染病暴发 状态序列,数据全面,相较通过单一样本特征构建的模型,本发明创建的隐马尔科夫 模型预测结果更为精准。
3、具有前瞻性:本发明通过历年气象水文观测序列预测未来一年的气象水文预测序列,通过隐马尔科夫模型对气象水文预测序列进行学习,获取最优的传染病暴发状 态序列,相较只能基于现有观测数据的模型来说,本发明具有较强的前瞻性。
附图说明
图1是本发明一实施例中基于隐马尔科夫模型的传染病预测方法的流程图;
图2是本发明一实施例中基于隐马尔科夫模型的传染病预测系统的结构图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它 们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语 仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
本发明公开了一种基于隐马尔科夫模型的传染病预测方法、系统和介质,其可以通过历史的气象水文数据预测将来的气象水文数据变化,并通过隐马尔科夫模型建立 气象水文数据和传染病爆发情况的关系,从而通过预测将来的气象水文数据获得未来 一段时间内的传染病的爆发概率。其中,隐马尔科夫模型是在马尔科夫链的基础上发 展而来的,是一种广泛使用的统计模型,该模型刻画观测值序列时是以基于概率模型 的方式完成的,可以对观测值序列的特征进行较为完整的描述。其作为一种描述离散 时变序列的模型,在处理非线性时变的气象水文观测序列,可以较为准确的预测传染 病的暴发状态序列,从而大幅降低了样本数据的采集难度,有效预测传染病爆发概率。
实施例一
本实施例公开了一种基于隐马尔科夫模型的传染病预测方法,如图1所示,包括以下步骤:
S1采集气象水文信息,生成气象水文观测序列和传染病爆发状态序列。
某传染病的m年气象水文观测序列O={Vi|1≤i≤m},其中Vi={vit|1≤t≤12}表示历 年按月气象水文观测序列,且有
Figure BDA0002899720570000041
气象水文信息包 括:降雨量RF、平均风速AW、平均气温AT、平均最高气温HT、平均最低气温LT、平 均气压AP、平均相对湿度ARH和日照时数SH八类气象水文信息的向量。
与气象水文观测序列O相对应的传染病爆发状态序列S={Qi|1≤i≤m},其中每年传染病暴发状态序列Qi={st|st∈(未爆发,局部爆发,大面积爆发),1≤t≤12},即传 染病爆发状态序列包括:未爆发、局部爆发和大面积爆发。
S2对气象水文观测序列进行预处理以生成训练样本集,并将训练样本集中的样本按照样本特征分为若干样本特征区间。
选择降雨量RF、平均风速AW、平均气温AT、平均最高气温HT、平均最低气温LT、 平均气压AP、平均相对湿度ARH和日照时数SH作为样本特征,对气象水文观测序列 O={Vi|1≤i≤m}按照样本特征进行预处理,则样本特征值j为:j∈(RF,AW,AT,HT,LT, AP,ARH,SH)对应的训练样本集为O'j={V′ji|1≤i≤m},其中
Figure BDA0002899720570000042
将样本按照样本特征分为若干样本特征区间的方法为:将经过预处理的训练样本集O′tj={V′tj(i)|1≤i≤m}中样本特征值j按照升序排列,若相邻样本的特征值之差小于预 设门限εj,则这两个样本属于同一特征区间,若相邻样本的特征值之差大于等于预设门限εj,则创建一新的特征区间。最终得到HID的第j类样本特征区间集合 {[b'j,b″j]d|d∈r′j},r′j表示样本特征区间个数。
S3根据样本特征、样本特征区间和传染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵。
观测概率矩阵的计算方法为:根据落入区间[b′j,b″j]d的样本个数
Figure BDA0002899720570000051
和总的 样本个数|Oj′|计算样本落入区间[b′j,b″j]d的概率plj(k,d):
Figure BDA0002899720570000052
样本特征j的观测概率矩阵Bj为Bj={plj(k,d)|1≤k≤r,1≤d≤rj′},其中,k 表示样本特征j的状态序列编号,d表示样本特征区间的序号,bj′表示样本特征区间 最小值,b″j表示样本特征区间最大值,r表示样本特征j的状态总数,rj′表示样本特征 j的特征区间总数。
爆发状态转移概率矩阵的计算方法为:根据传染病爆发序列S,采用akl表示t时 刻处于状态sk、t+1时刻转移到状态sl的概率,用Nkl表示t时刻处于状态sk、t+1时刻 转移到状态sl的频次,利用极大似然估计法,则有
Figure BDA0002899720570000053
状态转移概率矩阵A为A={akl|1≤k≤r,1≤l≤r},其中,k和1均为状态序列编号。
S4根据气象水文观测序列、传染病爆发状态序列、观测概率矩阵、爆发状态转移概率矩阵和初始状态概率分布生成隐马尔科夫模型。
初始状态概率分布为π={πh|1≤h≤r},则有:
Figure BDA0002899720570000054
已知HID的气象水文观测序列O、传染病暴发序列S、状态转移概率矩阵A、每类 样本特征的观测概率矩阵Bj、初始状态概率分布π,令 B={Bj|j∈(RF,AW,AT,HT,LT,AP,ARH,SH)},则有传染病的隐马尔科夫模型HID可用 一个五元组描述,即HID={O,S,A,B,π}。
S5根据历史的气象水文观测序列预测将来某时刻的气象水文序列,并将预测的气象水文序列带入隐马尔科夫模型对传染病爆发状态进行预测。
根据历史的气象水文观测序列预测将来某时刻的气象水文序列的方法为:对气象水文观测序列O按照样本特征j按月进行样本的数据预处理,得到历年第t个月样本特 征j对应的训练样本集O′tj={V′tj(i)|1≤i≤m},利用马尔科夫模型对训练样本集O′tj进行学习,获取m+1年第t个月样本特征j的预测值V"tj(m+1),将其与第j类样本特征区间集 合{[b′j,b″j]d|d∈r′j}中的样本特征区间进行比较,获知预测值V"tj(m+1)所属的样本特征区间[b′j,b"j]d。则有第m+1年气象水文预测序列O"={O"j|j∈ (RF,AW,AT,HT,LT,AP,ARH,SH)},且
Figure BDA0002899720570000061
预测传染病爆发状态的预测方法为:基于隐马尔科夫模型HID={O,S,A,B,π},根据Viterbi算法,对第m+1年的预测的气象水文序列O"进行传染病暴发状态预测
Figure BDA0002899720570000062
Figure BDA0002899720570000063
从而获取其最优的传染病暴发状态序列。
实施例二
基于相同的发明构思,本实施例公开了一种基于隐马尔科夫模型的传染病预测系统,如图2所示,包括:
序列采集模块,用于采集气象水文信息,生成气象水文观测序列和传染病爆发状态序列;
训练样本生成模块,用于对气象水文观测序列进行预处理以生成训练样本集,并将训练样本集中的样本按照样本特征分为若干样本特征区间;
矩阵计算模块,用于根据样本特征、样本特征区间和传染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵;
模型生成模块,用于根据气象水文观测序列、传染病爆发状态序列、观测概率矩阵、爆发状态转移概率矩阵和初始状态概率分布生成隐马尔科夫模型;
染病预测模块,用于根据历史的气象水文观测序列预测将来某时刻的气象水文序列,并将预测的气象水文序列带入隐马尔科夫模型对传染病爆发状态进行预测。
实施例三
基于相同的发明构思,本实施例公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行以实现上述任一项的基于隐马 尔科夫模型的传染病预测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件 方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序 代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的 每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供 这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处 理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理 器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多 个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定 方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个 方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算 机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或 方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解: 依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范 围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。上述内 容仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术 领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本 申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于隐马尔科夫模型的传染病预测方法,其特征在于,包括以下步骤:
S1采集气象水文信息,生成气象水文观测序列和传染病爆发状态序列;
S2对所述气象水文观测序列进行预处理以生成训练样本集,并将训练样本集中的样本按照样本特征分为若干样本特征区间;
S3根据所述样本特征、所述样本特征区间和传染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵;
S4根据所述气象水文观测序列、传染病爆发状态序列、观测概率矩阵、爆发状态转移概率矩阵和初始状态概率分布生成隐马尔科夫模型;
S5根据历史的气象水文观测序列预测将来某时刻的气象水文序列,并将预测的所述气象水文序列带入所述隐马尔科夫模型对传染病爆发状态进行预测。
2.如权利要求1所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S1中所述气象水文信息包括:降雨量RF、平均风速AW、平均气温AT、平均最高气温HT、平均最低气温LT、平均气压AP、平均相对湿度ARH和日照时数SH。
3.如权利要求1所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S1中所述传染病爆发状态序列包括:未爆发、局部爆发和大面积爆发。
4.如权利要求1-3任一项所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S2中将样本按照样本特征分为若干样本特征区间的方法为:将经过预处理的训练样本集中样本特征值j按照升序排列,若相邻样本的特征值之差小于预设门限εj,则这两个样本属于同一特征区间,若相邻样本的特征值之差大于等于-预设门限εj,则创建一新的特征区间。
5.如权利要求1-3任一项所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S3中观测概率矩阵的计算方法为:根据落入区间[b′j,b″j]d的样本个数
Figure FDA0002899720560000011
和总的样本个数|Oj′|计算样本落入区间[b′j,b″j]d的概率plj(k,d):
Figure FDA0002899720560000012
样本特征j的观测概率矩阵Bj为Bj={plj(k,d)|1≤k≤r,1≤d≤rj′},其中,k表示样本特征j的状态序列编号,d表示样本特征区间的序号,b′j表示样本特征区间最小值,b″j表示样本特征区间最大值,r表示样本特征j的状态总数,rj′表示样本特征j的特征区间总数。
6.如权利要求1-3任一项所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S3中爆发状态转移概率矩阵的计算方法为:根据传染病爆发序列S,采用akl表示t时刻处于状态sk、t+1时刻转移到状态sl的概率,用Nkl表示t时刻处于状态sk、t+1时刻转移到状态sl的频次,利用极大似然估计法,则有
Figure FDA0002899720560000021
状态转移概率矩阵A为A={akl|1≤k≤r,1≤l≤r},其中,k和1均为状态序列编号。
7.如权利要求1-3任一项所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S5中根据历史的气象水文观测序列预测将来某时刻的气象水文序列的方法为:对气象水文观测序列O按照样本特征j按月进行样本的数据预处理,得到历年第t个月样本特征j对应的训练样本集O′tj={V′tj(i)|1≤i≤m},利用马尔科夫模型对训练样本集O′tj进行学习,获取m+1年第t个月样本特征j的预测值V″tj(m+1),将其与第j类样本特征区间集合中的样本特征区间进行比较,获知所述预测值V″tj(m+1)所属的样本特征区间[b′j,b″j]d
8.如权利要求1-3任一项所述的基于隐马尔科夫模型的传染病预测方法,其特征在于,所述步骤S5中预测传染病爆发状态的预测方法为:基于所述隐马尔科夫模型HID={O,S,A,B,π},根据Viterbi算法,对预测的所述气象水文序列O″进行传染病暴发状态预测
Figure FDA0002899720560000022
9.一种基于隐马尔科夫模型的传染病预测系统,其特征在于,包括:
序列采集模块,用于采集气象水文信息,生成气象水文观测序列和传染病爆发状态序列;
训练样本生成模块,用于对所述气象水文观测序列进行预处理以生成训练样本集,并将训练样本集中的样本按照样本特征分为若干样本特征区间;
矩阵计算模块,用于根据所述样本特征、所述样本特征区间和传染病爆发状态序列计算观测概率矩阵和爆发状态转移概率矩阵;
模型生成模块,用于根据所述气象水文观测序列、传染病爆发状态序列、观测概率矩阵、爆发状态转移概率矩阵和初始状态概率分布生成隐马尔科夫模型;
传染病预测模块,用于根据历史的气象水文观测序列预测将来某时刻的气象水文序列,并将预测的所述气象水文序列带入所述隐马尔科夫模型对传染病爆发状态进行预测。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-8任一项所述的基于隐马尔科夫模型的传染病预测方法。
CN202110053105.3A 2021-01-15 2021-01-15 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 Active CN113053536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110053105.3A CN113053536B (zh) 2021-01-15 2021-01-15 一种基于隐马尔科夫模型的传染病预测方法、系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110053105.3A CN113053536B (zh) 2021-01-15 2021-01-15 一种基于隐马尔科夫模型的传染病预测方法、系统和介质

Publications (2)

Publication Number Publication Date
CN113053536A true CN113053536A (zh) 2021-06-29
CN113053536B CN113053536B (zh) 2023-11-24

Family

ID=76508245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110053105.3A Active CN113053536B (zh) 2021-01-15 2021-01-15 一种基于隐马尔科夫模型的传染病预测方法、系统和介质

Country Status (1)

Country Link
CN (1) CN113053536B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117457231A (zh) * 2023-10-27 2024-01-26 中山大学 一种基于马尔可夫链模型的病毒传播风险计算方法及装置
CN117690601A (zh) * 2024-02-02 2024-03-12 江西省胸科医院(江西省第三人民医院) 基于大数据分析的结核病流行趋势预测系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0271325A (ja) * 1987-12-16 1990-03-09 Matsushita Electric Ind Co Ltd Hmm作成装置及びそれを用いた尤度計算装置、時系列パターン認識装置
CA2901275A1 (en) * 2013-02-15 2014-08-21 Battelle Memorial Institute Use of web-based symptom checker data to predict incidence of a disease or disorder
WO2015127065A1 (en) * 2014-02-19 2015-08-27 Hrl Laboratories, Llc Disease prediction system using open source data
US20160007913A1 (en) * 2013-02-13 2016-01-14 Lone DARKET System for monitoring a state of disease
CN106934413A (zh) * 2015-12-31 2017-07-07 阿里巴巴集团控股有限公司 模型训练方法、装置及系统以及样本集优化方法、装置
CN108172301A (zh) * 2018-01-31 2018-06-15 中国科学院软件研究所 一种基于梯度提升树的蚊媒传染病疫情预测方法及系统
KR101874994B1 (ko) * 2017-04-05 2018-08-02 동국대학교 산학협력단 노로바이러스 감염병 발병 확률 예측 장치 및 방법
CN109670543A (zh) * 2018-12-12 2019-04-23 中国人民解放军军事科学院军事医学研究院 一种数据融合方法及装置
CN110288046A (zh) * 2019-07-02 2019-09-27 南京恩瑞特实业有限公司 一种基于小波神经网络与隐马尔科夫模型的故障预测方法
CN110377847A (zh) * 2019-07-15 2019-10-25 中国人民解放军军事科学院军事医学研究院 一种面向传染病疫情分布的电子地图可视化方法及系统
CN110444298A (zh) * 2019-07-02 2019-11-12 北京大学 基于高斯过程模型的流感预测建模方法及装置
CN111223574A (zh) * 2020-01-14 2020-06-02 宁波市海洋与渔业研究院 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0271325A (ja) * 1987-12-16 1990-03-09 Matsushita Electric Ind Co Ltd Hmm作成装置及びそれを用いた尤度計算装置、時系列パターン認識装置
US20160007913A1 (en) * 2013-02-13 2016-01-14 Lone DARKET System for monitoring a state of disease
CA2901275A1 (en) * 2013-02-15 2014-08-21 Battelle Memorial Institute Use of web-based symptom checker data to predict incidence of a disease or disorder
WO2015127065A1 (en) * 2014-02-19 2015-08-27 Hrl Laboratories, Llc Disease prediction system using open source data
CN106934413A (zh) * 2015-12-31 2017-07-07 阿里巴巴集团控股有限公司 模型训练方法、装置及系统以及样本集优化方法、装置
KR101874994B1 (ko) * 2017-04-05 2018-08-02 동국대학교 산학협력단 노로바이러스 감염병 발병 확률 예측 장치 및 방법
CN108172301A (zh) * 2018-01-31 2018-06-15 中国科学院软件研究所 一种基于梯度提升树的蚊媒传染病疫情预测方法及系统
CN109670543A (zh) * 2018-12-12 2019-04-23 中国人民解放军军事科学院军事医学研究院 一种数据融合方法及装置
CN110288046A (zh) * 2019-07-02 2019-09-27 南京恩瑞特实业有限公司 一种基于小波神经网络与隐马尔科夫模型的故障预测方法
CN110444298A (zh) * 2019-07-02 2019-11-12 北京大学 基于高斯过程模型的流感预测建模方法及装置
CN110377847A (zh) * 2019-07-15 2019-10-25 中国人民解放军军事科学院军事医学研究院 一种面向传染病疫情分布的电子地图可视化方法及系统
CN111223574A (zh) * 2020-01-14 2020-06-02 宁波市海洋与渔业研究院 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A RAFEI等: "Tuberculosis surveillance using a hidden markov model", 《IRANIAN JOURNAL OF PUBLIC HEALTH》, vol. 41, no. 10 *
朱斌等: "隐马尔可夫模型估计的新方法及应用案例", 《浙江社会科学》, no. 08 *
楼向阳: "隐马尔可夫模型在生物学和医学研究中的应用", 《郑州大学学报(医学版)》, vol. 52, no. 03, pages 7 - 16 *
王芸;罗静;: "基于马尔可夫链和隐马尔可夫模型的庆阳市乙型肝炎发病趋势预测", 疾病预防控制通报, no. 06 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117457231A (zh) * 2023-10-27 2024-01-26 中山大学 一种基于马尔可夫链模型的病毒传播风险计算方法及装置
CN117457231B (zh) * 2023-10-27 2024-06-11 中山大学 一种基于马尔可夫链模型的病毒传播风险计算方法及装置
CN117690601A (zh) * 2024-02-02 2024-03-12 江西省胸科医院(江西省第三人民医院) 基于大数据分析的结核病流行趋势预测系统
CN117690601B (zh) * 2024-02-02 2024-05-24 江西省胸科医院(江西省第三人民医院) 基于大数据分析的结核病流行趋势预测系统

Also Published As

Publication number Publication date
CN113053536B (zh) 2023-11-24

Similar Documents

Publication Publication Date Title
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
JP6129028B2 (ja) 建物動力設備のエネルギー消費量予測方法
Phyo et al. Electricity load forecasting in Thailand using deep learning models
WO2022077767A1 (zh) 交通流量预测方法及装置、计算机设备及可读存储介质
CN112180471B (zh) 天气预报方法、装置、设备及存储介质
CN110212524A (zh) 一种区域电力负荷预测方法
CN113053536A (zh) 一种基于隐马尔科夫模型的传染病预测方法、系统和介质
Suryo et al. Improved time series prediction using LSTM neural network for smart agriculture application
CN110674965A (zh) 基于动态特征选取的多时间步长风功率预测方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN115146842A (zh) 基于深度学习的多元时间序列趋势预测方法和系统
CN116865251A (zh) 一种短期负荷概率预测方法及系统
CN115965135A (zh) 基于朴素贝叶斯分类的新能源预测误差建模方法及系统
CN116306902A (zh) 时序数据环境分析及决策方法、装置、设备及存储介质
CN113033910A (zh) 一种光伏发电功率的预测方法、存储介质及终端设备
CN114139783A (zh) 基于非线性加权组合的风电短期功率预测方法及装置
CN115879607A (zh) 一种电能表状态预测方法、系统、设备和存储介质
CN118157127A (zh) 基于lstm-mm模型的多天气光伏发电功率预测数字孪生系统
CN111697560A (zh) 一种基于lstm预测电力系统负荷的方法及系统
CN115062528A (zh) 一种针对工业过程时序数据的预测方法
CN118017482A (zh) 基于预测误差特征提取的灵活性爬坡容量需求分析方法
CN113191526A (zh) 一种基于随机敏感度的短期风速区间多目标优化预测方法及系统
CN117290673A (zh) 一种基于多模型融合的船舶能耗高精度预测系统
CN116628444A (zh) 一种基于改进元学习的水质预警方法
CN116227785A (zh) 考虑气候-植被-取用水影响的径流变化归因方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant