CN111477337A - 基于个体自适应传播网络的传染病预警方法、系统及介质 - Google Patents

基于个体自适应传播网络的传染病预警方法、系统及介质 Download PDF

Info

Publication number
CN111477337A
CN111477337A CN202010265557.3A CN202010265557A CN111477337A CN 111477337 A CN111477337 A CN 111477337A CN 202010265557 A CN202010265557 A CN 202010265557A CN 111477337 A CN111477337 A CN 111477337A
Authority
CN
China
Prior art keywords
infectious disease
individual
data
network
transmission network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010265557.3A
Other languages
English (en)
Other versions
CN111477337B (zh
Inventor
郭克华
陈翔
任盛
沈敏学
黄勋
黄志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010265557.3A priority Critical patent/CN111477337B/zh
Publication of CN111477337A publication Critical patent/CN111477337A/zh
Application granted granted Critical
Publication of CN111477337B publication Critical patent/CN111477337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种基于个体自适应传播网络的传染病预警方法、系统及介质,对多模态的传染病数据进行统一表征;利用统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的相互作用模型,分析相互作用模型的阈值,根据所述阈值确定个体自适应行为和传染病传播之间的作用关系。本发明能够将不同模态的数据统一表征,能够准确刻画个体自适应行为,准确预测传染病的传播阈值。

Description

基于个体自适应传播网络的传染病预警方法、系统及介质
技术领域
本发明涉及人工智能领域,特别是一种冠状病毒传染病预警方法、系统及存储介质。
背景技术
回顾人类历史,传染病一直以来都是人类健康的最大威胁。借助理论分析和模拟仿真,通过建立传染病传播模型,预测传染病的发展趋势,并且针对特定场景和个性化人群,制定精准的防控措施和个性化的应对策略,是优化传染病防治路径,战胜传染病的重要手段。基于动力模型的传染病研究最早可以追溯到1760年Bernoulli对天花疫苗的研究分析上[1].1911年Ross(诺贝尔奖获得者)在研究蚊子与人之间疟疾传播动力学时提出了一个微分动力模型[2].1927年Kermack和Mckendrick在研究流行于伦敦的黑死病时,将受疫情影响地区的总人口分为易感者、感病者、移出者,提出最具影响力的SIR模型[3][4]。SIR模型基于微分方程系统,具有充分的理论依据,并且可以根据已有数据比较准确地拟合疫情传播曲线,能够利用相轨线分析得出控制传染病蔓延的有效措施。1932年Kermack和Mckendrick提出了SIS仓室模型,并在对SIR模型和SIS模型分析研究的基础上提出了传染病动力学中的阈值理论[5]。我国于2004年建立基于互联网的中国疾病预防控制信息系统已并于2008年投入试运行,目前已经成为我国进行传染病监测的主要技术手段和相关数据的主要来源。
复杂网络是人类社会真实系统的简化和抽象,能够刻画交通运输网、在线社交网等真实网络,能够模拟个体之间的连接,吸引了社会、生物、物理、信息等众多领域学者的关注,并在多个领域取得了丰硕的成果。基于复杂网络研究传染病动力学,能够模拟传染病在真实社会的传播特性,从而为实际的精准预测和有效防控提供重要依据[6]。目前,基于复杂网络的传播动力学研究主要包括三个方面:预测传播动力学的爆发阈值[7]、建模分析传播行为的演化特征[8]、挖掘影响传播动力学的关键节点[9]。在传播动力学的爆发阈值研究方面,Satorras等人提出异质平均场理论用于计算无标度网络上的传播阈值[10]。他们通过计算度分布的二阶矩发散确定传播阈值,当度分布的二阶矩发散指数<=3时,传染病的传播阈值将消失;当度分布的二阶矩发散指数>3时,存在有限大小的传播阈值。在建模分析传播行为的演化特征研究方面,文献[11]将随机游走动力学应用于无标度网络上的传染病传播行为演化特征研究,提出中心性相比节点度能更好预测传染病的传播范围。在挖掘影响传播动力学的关键节点方面,Chen等人通过衡量介数中心性和紧密性中心性,提出半局域中心性,通过在实际网络上模拟仿真实验表明,半局域中心性能更好第识别影响传播动力学的关键节点[12]。在社会生活中,当人们通过大众媒体、在线社交媒体以及其他各种渠道知道一种传染病开始蔓延时,为了保护自己会做出行为的改变(如:减少外出、减少聚集、戴口罩等),这会有效降低传染病传播的风险和速度,会对传染病流传播动力学甚至传染病传播网络结构造成巨大影响。上述列举的相关研究没有将人类的自适应行为加入传播动力学研究中,对传染病实际传播的预测不够准确。因此,将人类自适应行为纳入传染病的传播模型中,构建多重网络驱动的传染病相互作用模型,具有重要价值。
参考文献:
[1]Bernoulli D,etdesavantages de l’inoculation pour la pr′evenir,Histoire de l’Acad.,Roy.Sci.(Paris)avec Mem,(1760),pp.1–45.
[2]Ross R,The Prevention of Malaria,no.2nd edition,John Murray,London,1911.
[3]Anderson R M and May R M,Infectious Diseases of Humans:Dynamicsand Control,Oxford University Press,Oxford,1991.
[4]Kermack W O andMc Kendrick A G,A contribution to the mathematicaltheory of epi-demics,Proceedings of the Royal Society of London.Series A,115(1927),pp.700–721.[5]Kermack W O and Mc Kendrick A G,Contributions to themathematical theory of epidemics.II.-The problem of endemicity,Proceedings ofthe Royal Society of London.Series A,138(1932),pp.55–83.
[6]Newman M E.The structure and function of complex networks.SIAMReview,2003.45(2):167-256.
[7]Barrat A,et al.Dynamical processes on complex networks[M].Cambridge:Ca-mbridge University Press,2008.
[8]Song C,et al.Limits of predictability in human mobility.Science,2010,327(5968):1018-1021.
[9]Jackson MO.Social and economic networks[M].Princeton:PrincetonUniversity Press,2008.
[10]Dorogovsev S N,et al.Critical phenomena in complexnetworks.Reviews of Modern Physics,2008,80(4):1275.
[11]Loecher M,et al.Enhanced Predictability of hierarchicalpropagation in complex networks.Physics Letters A,2007,366(6):535-539.
[12]Chen D,et al.Identifying influential nodes in complexnetworks.PhysicaA.2012,391(4):1777-1787.[13]Gan G,Ng K P.K-means clusteringwith outlier removal.Pattern Recognition Letters,2017(90):8-14.
[14]Chen Y,Yu W,Pock T.On learning optimized reaction diffusionprocesses for effective image restoration.//In Proceedings of IEEE Conferenceon Computer Vision and Pattern Recognition,2015:5261-5269.
[15]Zheng Y,Lin Z.The augmented homogeneous coordinates matrix-basedprojective mismatch removal for partial-duplicate image search.IEEETransactions on Image Processing,2019,28(1):181-193.
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种基于个体自适应传播网络的传染病预警方法、系统及介质,保证对传染病的传播预测和预警的准确性。
为解决上述技术问题,本发明所采用的技术方案是:一种传染病预警方法,包括以下步骤:
S1、对多模态的传染病数据进行统一表征;
S2、利用统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的相互作用模型,分析相互作用模型的阈值,根据所述阈值确定个体自适应行为和传染病传播之间的作用关系。
本发明考虑了传染病传播过程中个体自适应行为的影响,能够提高个体自适应行为刻画的精准度,提升预测传染病传播阈值的精准度。
步骤S1的具体实现过程包括:
1)对多模态的传染病数据进行预处理,得到消除异常值、噪音和冗余值的多模态数据;
2)对所述多模态数据进行编码;
3)将编码后的多模态数据分别经过不同的网络进行映射,构造损失函数,使同一个体的不同模态映射相聚;
4)将不同模态的数据融合成一个统一的向量,得到多模态数据的统一表征;
优选的,为了进一步提高预警的准确性,步骤1)中,所述预处理包括清洗所述多模态的传染病数据,消除多模态的传染病数据中的异常值、噪音和冗余值。通过步骤S1,可以将多模态传染病数据处理为一个统一的向量表示,能够提高个体表现形式的完整度,是构建动态自适应信息网络和传播网络的基础。
步骤2)中,所述损失函数表达式为:
Figure BDA0002441150000000041
Figure BDA0002441150000000042
其中,xi,xj为一个个体X的两种模态的表现形式,D(xi,xj)为xi,xj之间的相似性,
Figure BDA0002441150000000043
Figure BDA0002441150000000044
表示与xi最不相似的第k个其它模态表示形式,α,β是平衡因子;m为容许差异,表示匹配数据与不匹配数据之间的差值;匹配数据即(xi,xj)的数据对;不匹配数据即
Figure BDA0002441150000000045
数据对。通过步骤2)中损失函数的计算,不仅能够将不同模态的数据映射到统一的空间中,而且可以保持原有的同一个体不同模态数据之间的关系。
步骤4)中,多模态数据的统一表征为:
Figure BDA0002441150000000046
其中,ω12为只包含+1,-1的向量,xi和xj是同一个体的两种不同模态的表现形式,d为向量的维度。通过步骤4)的统一表征,可以将不同模态数据融合成一个统一的向量,提升个体表现形式的完整度。
步骤S2中,利用统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的传染病流行耦合模型,分析所述耦合模型的阈值的具体实现过程包括:
A.将统一表征的传染病数据中的个体视为图中的节点,个体间的关系视为图中的边,构建动态个体自适应行为信息网络;
B.构建与所述动态个体自适应行为信息网络具有相同节点、不同连边的传染病传播网络;
C.在所述传播网络中,设定动态个体自适应行为信息网络中的个体之间存在弱耦合,每个个体能及时获得准确的疫情信息,并且受到局部和全局传染病传播信息的影响;
D.在所述动态个体自适应行为信息网络中和所述传播网络中,设计个体的行为状态变量、个体耦合权重变化率和个体感染概率,构建动态个体自适应行为信息网络和传染病传播网络的相互作用模型;
E.根据流行病阈值λc、基本再生数R0、感染率λ之间的关系λc=λ/R0,计算所述相互作用模型的流行病阈值。
本发明中,步骤S2能够提高个体自适应行为刻画的精准度,提升预测传染病传播阈值的精准度。
为了便于使用,步骤E之后,还包括步骤F,根据所述流行病阈值反映出的全局感染密度、局部感染密度、个体感染概率,针对传染病的传播发出预警。
步骤A中,使用邻接矩阵A=(aij)N×N表示动态个体自适应行为信息网络,若节点i和节点j相连,则aij=1;否则aij=0;优选地,步骤B中,使用邻接矩阵B=(bij)N×N表示传染病传播网络,若节点i和节点j相连,则bij=1;否则bij=0。在步骤A和B中使用邻接矩阵表示动态个体自适应行为信息网络和传染病传播网络,能够精确保留网络结构所带来的影响(如个体之间的连边关系),从而准确刻画网络结构对传播动力学的影响。
步骤D中,动态个体自适应行为信息网络和传染病传播网络的相互作用模型个体耦合权重变化率表达式为:
Figure BDA0002441150000000051
其中,γ表示传播率,ψ(x)表示个体对传染病信息的反应强度,θ(x)表示个体受局部传染病信息影响的程度,1-θ(x)表示全局传染病信息对个体影响程度,x表示传播网络物理连接度,t表示时间;ci(t)为个体耦合权重变化率。个体耦合权重变化率ci(t)能准确表示动态个体自适应行为信息网络中个体与邻居的交流,提升传染病传播预测的准确性。
本发明还提供了一种传染病预警系统,包括:
数据预处理单元,用于对多模态的传染病数据进行统一表征;
建模单元,用于根据统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的相互作用模型,分析相互作用模型的阈值,根据所述阈值确定个体自适应行为和传染病传播之间的作用关系;
优选的,所述建模单元包括:
动态个体自适应行为信息网络,以统一表征的传染病数据中的个体视为图中的节点,个体间的关系为图中的边构建的网络;
传染病传播网络,与所述动态个体自适应行为信息网络具有相同节点、不同连边的网络;所述传播网络中设定动态个体自适应行为信息网络中的个体之间存在弱耦合,每个个体能及时获得准确的疫情信息,并且受到局部和全局传染病传播信息的影响;
动态个体自适应行为信息网络和传染病传播网络的相互作用模型,在所述动态个体自适应行为信息网络中和所述传播网络中,通过设计个体的行为状态变量、个体耦合权重变化率和个体感染概率构建的模型;
分析模块,用于根据流行病阈值λc、基本再生数R0、感染率λ之间的关系λc=λ/R0,计算所述动态个体自适应行为信息网络和传染病传播网络的相互作用模型。
作为一个发明构思,本发明还提高了一种计算机存储介质,其存储有程序,该程序用于执行上述方法的步骤。
与现有技术相比,本发明所具有的有益效果为:
本发明采用人工智能中的深度学习方法(卷积神经网络、损失函数),结合复杂网络技术,能够提升不同模态数据之间的特征提取能力,能够提高个体自适应行为刻画的精准度,提升预测传染病传播阈值的精准度。经过数值模拟实验证明,本发明能够将不同模态的数据统一表征,能够准确刻画个体自适应行为,准确预测传染病的传播阈值。
附图说明
图1为数据统一表征模型图。
图2为本发明方法流程图。
图3为本发明系统结构框图。
具体实施方式
针对新发传染病数据来源渠道多变、内容形式多样、质量参差不齐,无法直接用于传染病传播动力学建模及预警的问题,本发明提出基于深度学习技术,对新发传染病数据进行统一表征,用于构建动态个体自适应行为信息网络和传染病传播网络。针对现有传播动力学缺乏基于复杂网络的个体动态自适应行为与传染病传播动力相互作用研究,导致对传染病的传播预测和预警不够精准的问题,本发明提出基于动态个体自适应多重复杂网络驱动的新发传染病流行耦合模型,通过构建传染病传播和信息扩散相互作用模型,分析传染病阈值,保证对传染病的传播预测和预警的准确性。
在现实社会生活中,当人们通过大众媒体、在线社交媒体以及其他各种渠道知道一种传染病开始蔓延时,为了保护自己会做出行为的改变(如:减少外出、减少聚集、勤洗手、戴口罩等),这会有效降低传染病传播的风险和速度,会对传染病流传播动力学甚至传染病传播网络结构产生巨大影响。因此,传染病传播动力学的研究中应该将人类的自适应行为(个人、医院、学校、国家的预防行为)加入其中,构建多重复杂网络驱动的新发传染病流行模型。本发明技术方案分两步实施:第一步对跨模态多通道新型冠状病毒流行数据进行统一表征;第二步构建基于动态个体自适应行为信息网络和传染病传播网络的新发传染病流行耦合模型,分析相互作用模型的阈值。
新型冠状病毒流行数据包括人口学信息(年龄、性别、现居地点)、流行病学资料(疫区旅行史、与确诊疑似人员接触史、就诊史、农贸市场暴露史、既往史、孕产情况)、临床诊疗信息(发病日期、发病地点、就诊日期、就诊地点、诊断日期、入院日期、收治地点、症状、体征、体温、并发症、实验室检测、疾病严重程度)、胸片及CT等影像学资料、病历文本资料等多模态数据。将来源渠道多变、内容形式多样、质量参差不齐的新型冠状病毒流行数据,在不确定环境下进行跨模态多通道统一表征,是构建精准的动态个体自适应行为信息网络和新发传染病传播网络的基础。新型冠状病毒流行数据预处理步骤如图1和图2所示,图1中多模态数据是指使用图像(模态1)、文本(模态2)、音频(模态3)等具有不同模态的数据对同一个体的描述。全连接是指卷积神经网络中的全连接层(特点是:全连接层的每一个结点都与上一层的所有结点相连);损失函数是指
Figure BDA0002441150000000071
Figure BDA0002441150000000072
特征1是指从图像中提取的特征,特征2是指从文本中提取的特征,特征3是指从音频中提取的特征;连接是指将多模态传染病数据特征融合为一个统一的向量表示(即统一表征):
第一步:清洗多模态的新型冠状病毒流行数据,消除数据中的、异常值[13]、噪音值[14]、冗余值[15]
第二步:对多模态数据进行编码。将不同的模态转化成计算机能识别的格式,对于不同模态的数据,采取不同的编码网络结构,例如:图像使用CNN结构、文本使用RNN结构等;
第三步:每种模态的数据分别经过不同的网络进行映射,通过构造损失函数,使映射之后表示同一对象的不同模态数据在空间中接近,不同对象尽可能远离:假设编码后的数据分别为xi,xj,定义衡量xi,xj之间的相似性为D(xi,xj),损失函数为:
Figure BDA0002441150000000073
Figure BDA0002441150000000074
其中,
Figure BDA0002441150000000081
Figure BDA0002441150000000082
表示与xi最不相似的第k个对象(此处的对象是指其它模态表示形式,其他模态是指与xi格式不同的数据格式,例如,若xi为文本格式,则其他模态为图像、音频等),
Figure BDA0002441150000000083
Figure BDA0002441150000000084
表示与xj最不相似的第k个对象(此处的对象是指其它模态表示形式,其他模态是指与xi格式不同的数据格式,例如,若xi为文本格式,则其他模态为图像、音频等),α,β是平衡因子,用于权衡不同模态数据之间的比重。通过这样,将同一对象的不同模态映射的足够接近;
第四步:假设映射之后每种模态分别为x1,x2,采用紧凑双线性池化(compactbilinear pooling)将不同模态的数据融合成一个统一的向量表示。分别随机生成长度(维度)为d个只包含+1,-1的向量ω12,计算
Figure BDA0002441150000000085
得到多模态的统一表征;
第五步:将多模态融合表示结合实际任务需求训练深度学习模型(如预测网络、分类网络),在训练反向传播过程中,将梯度传播回映射网络中,映射网络根据梯度值在反向传播中进一步优化参数,使的映射的过程再融入更多的目标信息,统一表征更适应于相应的任务中。
复杂网络是一个具有非平凡拓扑特征的图,是人类社会真实系统的简化和抽象,能够刻画交通运输网、在线社交网等真实网络,能够模拟个体之间的连接。在数据统一表征的基础上,构建由动态个体自适应行为信息网络和新发传染病传播网络组成的多重复杂网络,研究个体自适应行为和传染病传播之间的复杂相互作用,能够在有效疫苗和针对性药物研发出来之前,帮助相关部分引导个人行为到达自我保护的最佳状态,降低人们对新型冠状病毒的易感性,降低病毒传播带来的危害。基于动态个体自适应多重复杂网络驱动的新发传染病流行耦合模型构建及相互作用分析步骤如下:
第一步:结合疫情的变化,将统一表征的冠状病毒流行数据中的个体视为图中的节点,个体间的关系视为图中的边,使用邻接矩阵A=(aij)N×N表示动态个体自适应行为信息网络,若节点i和节点j相连,则aij=1;否则aij=0,针对医院和学校两个特定场景人群,构建动态个体自适应行为信息网络。
第二步:在步骤2和冠状病毒流行数据统一表征的基础上,构建和个体自适应行为信息网络具有相同节点(两个网络中的个体是一样的),不同连边(传播网络和行为信息网络的邻居不同)的冠状病毒传播网络,使用邻接矩阵B=(bij)N×N表示传染病传播网络,若节点i和节点j相连,则bij=1;否则bij=0。
第三步:在上述步骤构建的多重网络(动态个体自适应行为信息网络和冠状病毒传播网络)的基础上,设定初始个体自适应行为信息网络中的个体之间存在弱耦合(个体之间在信息网络中的耦合权重,初始为弱耦合是因为传染病还没有开始传播,没有相关的传染病信息,所以个体之间耦合权重大于0,远小于1),每个个体能及时通过各种官方媒体获得相对准确的疫情信息,并且受到局部和全局新型冠状病毒传播信息的影响;
第四步:设定冠状病毒传播网络中全局感染密度
Figure BDA0002441150000000091
和局部感染密度
Figure BDA0002441150000000092
与个体在动态自适应行为信息网络中的个体耦合权重变化率ci(t)成正比(V.Marceau,P.A.No¨el,L.H′ebert-Dufresne,A.Allard,and L.J.Dub′e,Modeling the dy namicalinteraction between epidemics on overlay networks,Physical Review E,84(2011),p.026105.),且ci(t)与同步误差ei(t)成正比。通过设计个体行为状态变量xi(t)、个体感染概率ρi(t)、个体耦合权重变化率ci(t),构建动态个体自适应行为信息网络和冠状病毒传播网络相互作用模型。如:
Figure BDA0002441150000000093
其中,γ表示传播率(取值范围为[0,1]),ψ(x)表示个体对传染病信息的反应强度,θ(x)表示个体受局部传染病信息影响的程度,1-θ(x)表示全局传染病信息对个体影响程度,x表示传播网络物理连接度,t表示时间。个体耦合权重变化率ci(t)能准确表示动态个体自适应行为信息网络中个体与邻居的交流,提升传染病传播预测的准确性。
第五步:将动态个体自适应行为信息网络和冠状病毒传播网络相互作用模型用拉普拉斯矩阵L重新表示,定义有效再生数R(t),和基本再生数R0(t),R(t)=R0(t)表示所有人都是易感状态。
第六步:当所有个体的自适应行为实现同步时,即ei(t)→0,t→∞,计算流行病传播模型的基本再生数
Figure BDA0002441150000000094
根据流行病阈值λc和基本再生数R0之间的关系λc=λ/R0,计算动态个体自适应行为信息网络和传染病传播网络相互作用模型的流行病阈值。感染率λ的取值范围为[0,1]。
第七步:针对学校、医院两个特定的场景和人群,根据动态个体自适应行为信息网络和传染病传播网络相互作用模型流行病阈值反映出的全局感染密度、局部感染密度、个体感染概率等信息,将冠状病毒传播信息上报给单位负责人,针对传染病的传播发出预警。
如图3,本发明的系统包括数据预处理单元和与数据预处理单元连接的建模单元:
数据预处理单元,用于对多模态的传染病数据进行统一表征;
建模单元,用于根据统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的相互作用模型,分析相互作用模型的阈值,根据所述阈值确定个体自适应行为和传染病传播之间的作用关系;
建模单元包括动态个体自适应行为信息网络、传染病传播网络、动态个体自适应行为信息网络和传染病传播网络的相互作用模型和分析模块:
动态个体自适应行为信息网络,以统一表征的传染病数据中的个体视为图中的节点,个体间的关系为图中的边构建的网络;
传染病传播网络,与所述动态个体自适应行为信息网络具有相同节点、不同连边的网络;所述传播网络中设定动态个体自适应行为信息网络中的个体之间存在弱耦合,每个个体能及时获得准确的疫情信息,并且受到局部和全局传染病传播信息的影响;
动态个体自适应行为信息网络和传染病传播网络的相互作用模型,在所述动态个体自适应行为信息网络中和所述传播网络中,通过设计个体的行为状态变量、个体耦合权重变化率和个体感染概率构建的模型;
分析模块,用于根据流行病阈值λc、基本再生数R0、感染率λ之间的关系λc=λ/R0,计算所述动态个体自适应行为信息网络和传染病传播网络的相互作用模型。
实施例
将多模态传染病数据统一表征,是构建动态自适应信息网络和传播网络的基础。本发明基于深度学习方法,在消除数据中异常值[13]、噪音值[14]、冗余值[15]的基础上,将不同模态数据融合成一个统一的向量,能够提升个体表现形式的完整度。
本发明多模态传染病数据统一表征方法流程如图1所示:
1)对多模态数据进行编码。将不同的模态转化成计算机能识别的格式,对于不同模态的数据,采取不同的编码网络结构,例如:图像使用CNN结构、文本使用RNN结构等;
2)每种模态的数据分别经过不同的网络进行映射,通过构造损失函数,使映射之后表示同一对象的不同模态数据在空间中接近,不同对象尽可能远离:假设编码后的数据分别为xi,xj,定义衡量xi,xj之间的相似性为D(xi,xj),损失函数为:
Figure BDA0002441150000000111
其中,
Figure BDA0002441150000000112
Figure BDA0002441150000000113
表示与xi最不相似的第k个对象,α,β是平衡因子,取值范围为[0,1],用于权衡不同模态数据之间的比重。通过损失函数将同一对象的不同模态映射的足够接近;
3)假设映射之后每种模态分别为x1,x2,采用紧凑双线性池化(compact bilinearpooling)将不同模态的数据融合成一个统一的向量表示。分别随机生成长度为d多个只包含+1,-1的向量ω12,计算
Figure BDA0002441150000000114
得到多模态的统一表征;
4)将多模态融合表示结合实际任务需求训练深度学习模型(如预测网络、分类网络),在训练反向传播过程中,将梯度传播回映射网络中,映射网络根据梯度值在反向传播中进一步优化参数,使的映射的过程再融入更多的目标信息,统一表征更适应于相应的任务中。
实验在Ubuntu Server 16.04 x64系统上完成,训练使用NVIDIA Titan_Xp 12G的GPU。训练和测试过程均采用PyTorch深度学习框架,训练过程中采取Adam优化方法。实现数据来自合作医院提供的传染病图像和文字组成的数据对,数据集中包括20个类别,每个类别有50张图像,共1000张图像,每个类别随机选取5张图像作为测试图像,剩余45张图像作为训练图像。每张图像有相应的文字对其内容进行描述,每张图像包含5个对其内容描述的句子。我们将图像和一个句子组成一个样本,这样数据集中包含训练集4500对数据,测试集500对数据。实验中的数据编码过程,对于图像数据,使用ResNet作为特征提取网络,获取图像的特征向量,ResNet为在ImageNet上预训练的;对于文本,使用fasttext作为文字处理框架,获取句子的向量表达形式。
具体的实验内容为:
1)多模态数据映射和匹配有效性验证。为了验证映射功能的有效性,采取数据之间的跨模态检索,实验采用k近邻算法,分别检索每个对象距离最近的k个对象,如果改k个对象中存在有与该数据是成对的其他模态的数据,则认为检索是准确的。实验结果表明本发明设计的数据统一表征方法能够使多模态数据中同一个体的不同模态相聚,不同对象远离。
2)多模态数据分类效果与单一模态数据的对比。采取ResNet单独对图像分类,fasttext单独对文字进行分类,并与多模态数据的分类性能做对比与分析。ResNet为在ImageNet数据集完成预训练,通过fine tune方式,在网络最后训练一个输出维度为20的全连接层用作分类,经过200个batch的训练,学习率设置为0.0001。实验结果表明,本发明设计的数据统一表征方法相对单模态(图像)能够提升2.6%的分类精度,相对单模态(文字)能够提升9.3%的分类精度,说明统一表征的数据提升了个体信息的完整度。
3)不同的映射向量长度对性能的影响。分别设置维度值为256、512、1024、2048、4096、8192、10000,即调整网络的输出尺寸,然后进行框架的训练,得到训练好框架后,用测试数据进行测试。实验结果表明追求单一准确率的时候,无论是图像检索文字还是文字检索图像,都在维度为2048时取得最高的准确率,范围增大了之后,维度在1024的时候基本就能取得最佳的准确率。
4)不同的融合向量长度对分类性能的影响。本实验将验证模态融合维度对分类精度的影响,分别设置不同的融合向量,设置为256、512、1024、2048、4096、8192、10000,再将融合向量通过分类网络进行分类,对比不同的融合向量长度对分类精度的影响。实验结果表明由256维增加至512维时,准确率提升了将近5%,维度值在1024维度时,取得最高的精度。

Claims (10)

1.一种基于个体自适应传播网络的传染病预警方法,其特征在于,包括以下步骤:
S1、对多模态的传染病数据进行统一表征;
S2、利用统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的相互作用模型,分析相互作用模型的阈值,根据所述阈值确定个体自适应行为和传染病传播之间的作用关系。
2.根据权利要求1所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤S1的具体实现过程包括:
1)对多模态的传染病数据进行预处理,得到消除异常值、噪音和冗余值的多模态数据;
2)对所述多模态数据进行编码;
3)将编码后的多模态数据分别经过不同的网络进行映射,构造损失函数,使同一个体的不同模态映射相聚;
4)将不同模态的数据融合成一个统一的向量,得到多模态数据的统一表征;
优选的,步骤1)中,所述预处理包括清洗所述多模态的传染病数据,消除多模态的传染病数据中的异常值、噪音和冗余值。
3.根据权利要求2所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤2)中,所述损失函数表达式为:
Figure FDA0002441149990000011
Figure FDA0002441149990000012
其中,xi,xj为一个个体X的两种模态的表现形式,D(xi,xj)为xi,xj之间的相似性,
Figure FDA0002441149990000013
Figure FDA0002441149990000014
表示与xi最不相似的第k个其它模态表示形式,α,β是平衡因子;m为容许差异,表示匹配数据与不匹配数据之间的差值;匹配数据即(xi,xj)的数据对;不匹配数据即
Figure FDA0002441149990000015
数据对。
4.根据权利要求1~3之一所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤4)中,多模态数据的统一表征为:
Figure FDA0002441149990000016
Figure FDA0002441149990000021
其中,ω12为只包含+1,-1的向量,xi和xj是同一个体的两种不同模态的表现形式,d为向量的维度。
5.根据权利要求1所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤S2中,利用统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的传染病流行耦合模型,分析所述耦合模型的阈值的具体实现过程包括:
A.将统一表征的传染病数据中的个体视为图中的节点,个体间的关系视为图中的边,构建动态个体自适应行为信息网络;
B.构建与所述动态个体自适应行为信息网络具有相同节点、不同连边的传染病传播网络;
C.在所述传播网络中,设定动态个体自适应行为信息网络中的个体之间存在弱耦合,每个个体能及时获得准确的疫情信息,并且受到局部和全局传染病传播信息的影响;
D.在所述动态个体自适应行为信息网络中和所述传播网络中,设计个体的行为状态变量、个体耦合权重变化率和个体感染概率,构建动态个体自适应行为信息网络和传染病传播网络的相互作用模型;
E.根据流行病阈值λc、基本再生数R0、感染率λ之间的关系λc=λ/R0,计算所述相互作用模型的流行病阈值。
6.根据权利要求5所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤E之后,还包括步骤F,根据所述流行病阈值反映出的全局感染密度、局部感染密度、个体感染概率,针对传染病的传播发出预警。
7.根据权利要求5所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤A中,使用邻接矩阵A=(aij)N×N表示动态个体自适应行为信息网络,若节点i和节点j相连,则aij=1;否则aij=0;优选地,步骤B中,使用邻接矩阵B=(bij)N×N表示传染病传播网络,若节点i和节点j相连,则bij=1;否则bij=0。
8.根据权利要求5~7之一所述的基于个体自适应传播网络的传染病预警方法,其特征在于,步骤D中,动态个体自适应行为信息网络和传染病传播网络的相互作用模型个体耦合权重变化率表达式为:
Figure FDA0002441149990000031
其中,γ表示传播率,ψ(x)表示个体对传染病信息的反应强度,θ(x)表示个体受局部传染病信息影响的程度,1-θ(x)表示全局传染病信息对个体影响程度,x表示传播网络物理连接度,t表示时间;ci(t)为个体耦合权重变化率。
9.一种基于个体自适应传播网络的传染病预警系统,其特征在于,包括:
数据预处理单元,用于对多模态的传染病数据进行统一表征;
建模单元,用于根据统一表征的传染病数据,构建基于个体自适应行为信息网络和传染病传播网络的相互作用模型,分析相互作用模型的阈值,根据所述阈值确定个体自适应行为和传染病传播之间的作用关系;
优选的,所述建模单元包括:
动态个体自适应行为信息网络,以统一表征的传染病数据中的个体视为图中的节点,个体间的关系为图中的边构建的网络;
传染病传播网络,与所述动态个体自适应行为信息网络具有相同节点、不同连边的网络;所述传播网络中设定动态个体自适应行为信息网络中的个体之间存在弱耦合,每个个体能及时获得准确的疫情信息,并且受到局部和全局传染病传播信息的影响;
动态个体自适应行为信息网络和传染病传播网络的相互作用模型,在所述动态个体自适应行为信息网络中和所述传播网络中,通过设计个体的行为状态变量、个体耦合权重变化率和个体感染概率构建的模型;
分析模块,用于根据流行病阈值λc、基本再生数R0、感染率λ之间的关系λc=λ/R0,计算所述动态个体自适应行为信息网络和传染病传播网络的相互作用模型。
10.一种计算机存储介质,其特征在于,其存储有程序,该程序用于执行权利要求1~8之一所述方法的步骤。
CN202010265557.3A 2020-04-07 2020-04-07 基于个体自适应传播网络的传染病预警方法、系统及介质 Active CN111477337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010265557.3A CN111477337B (zh) 2020-04-07 2020-04-07 基于个体自适应传播网络的传染病预警方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010265557.3A CN111477337B (zh) 2020-04-07 2020-04-07 基于个体自适应传播网络的传染病预警方法、系统及介质

Publications (2)

Publication Number Publication Date
CN111477337A true CN111477337A (zh) 2020-07-31
CN111477337B CN111477337B (zh) 2023-05-19

Family

ID=71750635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010265557.3A Active CN111477337B (zh) 2020-04-07 2020-04-07 基于个体自适应传播网络的传染病预警方法、系统及介质

Country Status (1)

Country Link
CN (1) CN111477337B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112117010A (zh) * 2020-07-13 2020-12-22 北京大瑞集思技术有限公司 一种传染病智能预警系统及管理平台
CN112270999A (zh) * 2020-10-02 2021-01-26 孙炜 一种基于大数据和人工智能的流行病早期发现系统和方法
CN114446474A (zh) * 2021-12-25 2022-05-06 新瑞鹏宠物医疗集团有限公司 宠物疾病预警装置、方法、电子设备及存储介质
CN114758792A (zh) * 2022-06-14 2022-07-15 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的未知传染病的预警溯源方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108230170A (zh) * 2017-12-20 2018-06-29 重庆邮电大学 面向社交网络的多信息和多维网络信息传播模型及方法
CN110223785A (zh) * 2019-05-28 2019-09-10 北京师范大学 一种基于深度学习的传染病传播网络重构方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108230170A (zh) * 2017-12-20 2018-06-29 重庆邮电大学 面向社交网络的多信息和多维网络信息传播模型及方法
CN110223785A (zh) * 2019-05-28 2019-09-10 北京师范大学 一种基于深度学习的传染病传播网络重构方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GÜVEN DEMIREL 等: "Dynamics of epidemic diseases on a growing adaptive network" *
THILO GROSS 等: "Epidemic Dynamics on an Adaptive Network" *
李婵婵: "几类复杂社团网络上的病毒传播建模及免疫策略研究" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112117010A (zh) * 2020-07-13 2020-12-22 北京大瑞集思技术有限公司 一种传染病智能预警系统及管理平台
CN112270999A (zh) * 2020-10-02 2021-01-26 孙炜 一种基于大数据和人工智能的流行病早期发现系统和方法
CN112270999B (zh) * 2020-10-02 2022-10-11 孙炜 一种基于大数据和人工智能的流行病早期发现系统和方法
CN114446474A (zh) * 2021-12-25 2022-05-06 新瑞鹏宠物医疗集团有限公司 宠物疾病预警装置、方法、电子设备及存储介质
CN114758792A (zh) * 2022-06-14 2022-07-15 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的未知传染病的预警溯源方法及系统

Also Published As

Publication number Publication date
CN111477337B (zh) 2023-05-19

Similar Documents

Publication Publication Date Title
Kogilavani et al. [Retracted] COVID‐19 Detection Based on Lung Ct Scan Using Deep Learning Techniques
CN110929164B (zh) 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN111477337A (zh) 基于个体自适应传播网络的传染病预警方法、系统及介质
CN106778014A (zh) 一种基于循环神经网络的患病风险预测方法
Sun et al. Prediction of cardiovascular diseases based on machine learning
CN112949786A (zh) 数据分类识别方法、装置、设备及可读存储介质
Chen et al. Metafed: Federated learning among federations with cyclic knowledge distillation for personalized healthcare
CN109753571B (zh) 一种基于二次主题空间投影的场景图谱低维空间嵌入方法
CN108804677A (zh) 结合多层级注意力机制的深度学习问题分类方法及系统
US20210406687A1 (en) Method for predicting attribute of target object based on machine learning and related device
CN113593661B (zh) 临床术语标准化方法、装置、电子设备及存储介质
CN107480702A (zh) 面向hcc病理图像识别的特征选择与特征融合方法
CN109935337A (zh) 一种基于相似性度量的病案查找方法及系统
WO2024008043A1 (zh) 一种基于因果关系挖掘的临床数据自动化生成方法及系统
Lewis et al. Cooperative learning: Decentralized data neural network
CN116129141A (zh) 医学数据处理方法、装置、设备、介质和计算机程序产品
Aguilera et al. Blockchain cnn deep learning expert system for healthcare emergency
CN116705300A (zh) 基于体征数据分析的医疗决策辅助方法、系统及存储介质
Sridhar et al. Mobile application development for disease diagnosis based on symptoms using machine learning techniques
CN110335678A (zh) 一种高原适应性评估方法及系统
Herasymova et al. Development of Intelligent Information Technology of Computer Processing of Pedagogical Tests Open Tasks Based on Machine Learning Approach.
Walia et al. A survey on applications of adaptive neuro fuzzy inference system
CN116630062A (zh) 一种医保欺诈行为检测方法、系统、存储介质
WO2021114626A1 (zh) 一种病历数据的质量检测方法和相关装置
Rong et al. Exploring network behavior using cluster analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant