CN113762648B - 公卫黑天鹅事件预测方法、装置、设备及介质 - Google Patents

公卫黑天鹅事件预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN113762648B
CN113762648B CN202111246554.6A CN202111246554A CN113762648B CN 113762648 B CN113762648 B CN 113762648B CN 202111246554 A CN202111246554 A CN 202111246554A CN 113762648 B CN113762648 B CN 113762648B
Authority
CN
China
Prior art keywords
graph
mode data
data network
nodes
bipartite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111246554.6A
Other languages
English (en)
Other versions
CN113762648A (zh
Inventor
郭建影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111246554.6A priority Critical patent/CN113762648B/zh
Publication of CN113762648A publication Critical patent/CN113762648A/zh
Application granted granted Critical
Publication of CN113762648B publication Critical patent/CN113762648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了公卫黑天鹅事件预测方法、装置、设备及介质,涉及人工智能技术领域,可以对公卫黑天鹅事件作出预测,提升公卫黑天鹅事件预测准确性。其中方法包括:使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图;使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图;使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。本申请适用于对公卫黑天鹅事件的预测。

Description

公卫黑天鹅事件预测方法、装置、设备及介质
技术领域
本申请涉及人工智能技术领域,尤其是涉及到公卫黑天鹅事件预测方法、装置、设备及介质。
背景技术
黑天鹅事件是指满足以下三个特点的事件:具有意外性,产生重大影响,通常会引起连锁负面反应甚至颠覆,“公卫黑天鹅事件”是指非常难以预测,且不寻常的突发重大公共卫生事件,其发生概率极小,几乎无法预料在何时会出现从0到1的跳变,如非典、新型冠状病毒肺炎事件就是典型的公卫黑天鹅事件。可见,公卫黑天鹅事件一旦发生其造成的影响重大,对公卫黑天鹅事件的预测能够为重大公共卫生事件的防范提供参考依据。
现有基于人工智能的预测方法,如ARIMA、LR、深度学习等只能对已知疾病、具有历史发病数据的疾病进行模型预测,无法实现对公卫黑天鹅事件的模型预测,而现有针对黑天鹅事件的预测方法存在的不足为,例如,通过scikit-learn的逻辑回归模型对历史发病数据进行统计分析,无法充分利用社会关系因素及日常生活中的各潜在关系因素,以实现对公卫黑天鹅事件中需要重点关注和干预的高风险人物和事件的预测。
发明内容
有鉴于此,本申请提供了公卫黑天鹅事件预测方法、装置、设备及介质,主要目的在于填补人工智能领域对公卫黑天鹅事件预测方法的空缺,以及解决现有基于scikit-learn的逻辑回归模型的黑天鹅事件预测方法,仅对历史发病数据的统计分析,无法充分利用社会关系因素及日常生活中的各潜在关系,实现对公卫黑天鹅事件中的高风险人物和事件进行预测的技术问题。
根据本申请的一个方面,提供了一种公卫黑天鹅事件预测方法,该方法包括:
获取多个单模态数据库;
使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图;
使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图;
使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。根据本申请的另一方面,提供了一种公卫黑天鹅事件的预测装置,该装置包括:
获取模块,用于获取多个单模态数据库;
编码模块,用于使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图;
二分图转换模块,用于使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图;
解码模块,用于使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述公卫黑天鹅事件的预测方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述公卫黑天鹅事件的预测方法。
借由上述技术方案,本申请提供的公卫黑天鹅事件预测方法、装置、设备及介质,与现有基于scikit-learn的逻辑回归模型的预测技术方案相比,本申请获取多个单模态数据库,使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图,使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图,使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。可见,为有效避免现有scikit-learn逻辑回归模型基于历史发病数据进行统计分析,无法充分利用社会环境因素及日常生活因素对公卫黑天鹅事件作出预测的技术问题,能够通过预先训练好的预测网络模型,基于多个单模态数据库实现多模态数据网络图中图节点之间的特征信息传递及融合,能够充分融合复杂多变的社会环境因素,以及日常生活中各潜在因素与公卫黑天鹅事件之间的潜在关系,以预测出公卫黑天鹅事件中需要重点关注和干预的人物和事件,为决策者提供决策和防范的指导,具有较强的实用性和适用性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种公卫黑天鹅事件预测方法的流程示意图;
图2示出了本申请实施例提供的另一种公卫黑天鹅事件预测方法的流程示意图;
图3示出了本申请实施例提供的一种公卫黑天鹅事件预测装置的结构示意图;
图4示出了本申请实施例提供的另一种公卫黑天鹅事件预测装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(AI:Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
针对现有基于scikit-learn的逻辑回归模型的预测方式,基于历史发病数据进行统计分析,无法融合复杂多变的社会环境因素,以及日常生活中各潜在因素与公卫黑天鹅事件之间的潜在关系,对公卫黑天鹅事件的预测具有一定的局限性,无法实现对公卫黑天鹅事件中的高风险人物和事件进行预测的技术问题。本实施例提供了一种公卫黑天鹅事件预测方法,能够实现对公卫黑天鹅事件中需要重点关注和干预的人物和事件进行预测的同时,提升公卫黑天鹅事件预测准确性。如图1所示,以该方法应用于服务器等计算机设备为例进行说明,其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN:Content Delivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器,如智能医疗系统、数字医疗平台等。上述方法包括以下步骤:
步骤101、获取多个单模态数据库。
在本实施例中,单模态数据库是指每个类别的数据库对应一种模态,具体可以包括:行为标志物数据库,包括如上学、看电影、买菜、看病、吃野味、健身等信息数据;社交关系数据库,包括如A节点是B节点的母亲,B节点是C节点的护士等信息数据;健康诊断标志物数据库,包括如体检数据、诊疗数据等信息数据;决策数据库,包括如增加卫生经费、举办大型活动、建垃圾处理厂等信息数据,但不限于以上类别数据库。
在实际应用场景中,基于各类别的单模态信息数据的获取渠道可以包括网络支付软件,电子追踪软件,医院诊疗记录,户籍管理系统,学校人际关系数据中的一个或者多个,但不限于以上渠道。
步骤102、使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图。
在本实施例中,针对每个单模态数据库中的信息数据进行三元组信息提取,即提取单模态数据库中的实体对及其实体间关系;再利用预先训练好的预测网络模型的编码层对三元组信息中的实体及实体间关系进行特征提取,得到实体特征及实体间关系特征,并以每个实体特征作为节点(同构图节点),两个节点间的关系作为边,构建对应每个单模态数据库的单模态数据网络图。
步骤103、使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图。
在本实施例中,利用预先训练好的预测网络模型中的多个二分图层,对各单模态数据网络图分别进行二分图转换,得到多个单模态数据二分图。即通过针对每个单模态数据网络图中的同构图节点(实体特征向量)之间的特征信息传递,根据预设的二分图层的网络层数实现对同构图节点的多层更新,得到多个单模态数据二分图。进一步,根据多个单模态数据二分图,通过针对多个单模态数据网络图之间的异构图节点(实体特征向量)之间的特征信息传递,建立多个单模态数据网络图之间的预测关系向量,并通过多次更新,得到多模态数据网络图。通过多个单模态数据网路图之间异构图节点之间的特征信息融合,得到的多模态数据网络图能够针对两个及以上类别的单模态数据库之间建立包含单模态数据之间潜在关系的信息数据,从而提升多个单模态数据库之间的全局关联性,且二分图层在利用多个单模态信息数据资源的同时,能够兼顾图网络结构特征及单模态数据的属性特征,从而有效提升异构信息的融合度。
在实际应用场景中,公卫黑天鹅事件属于信息难以捕捉的高难度预测任务,对图节点特征的敏感度和可解释性要求较高,多模态数据网络图能够避免仅基于单模态数据网络图进行特征信息传递导致的特征过度平滑的问题,从而提高对每个图节点特征的捕捉敏感度,同时,基于二分图对不同单模态数据的属性特征进行划分,能够提高图节点特征的可解释性,进而提升公卫黑天鹅事件的预测准确性。
步骤104、使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。
在本实施例中,解码层为多层感知器(MLP:Muti-Layer Perception),利用多层感知器MLP预测多模态数据网络图中异构图节点间的关系向量(范数值),响应于关系向量预设条件,确定异构图节点之间的关系向量中的目标关系向量,目标关系向量对应的节点为目标图节点,目标图节点对应的尾实体作为公卫黑天鹅事件,头实体作为公卫黑天鹅事件的导致因素,即可能导致公卫黑天鹅事件发生的高风险人物和事件,进而根据预测到的高风险人物和事件,实现对公卫黑天鹅事件的干预。
对于本实施例可以按照上述方案,获取多个单模态数据库,使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图,使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图,以及使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件,与现有基于cikit-learn的逻辑回归模型的预测技术方案相比,本实施例通过预先训练好的预测网络模型能够有效避免现有scikit-learn逻辑回归模型基于历史发病数据进行统计分析,无法充分利用社会环境因素及日常生活因素对公卫黑天鹅事件作出预测的技术问题,进而在实现对公卫黑天鹅事件中需要重点关注和干预的人物和事件进行预测的同时,提升预测准确性。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种公卫黑天鹅事件预测方法,如图2所示,该方法包括:
步骤201、训练初始化预测网络模型。
为了说明步骤201的具体实施方式,作为一种优选实施例,步骤201具体可以包括:将多个单模态数据样本库中的三元组信息作为预设的初始化预测网络模型的输入数据;利用初始化预测网络模型中的编码层、二分图层和解码层,对多个单模态数据样本库中三元组信息对应的异构图节点之间进行特征信息传递,预测得到异构图节点之间的关系向量;利用预设的三重态损失函数,迭代更新所述异构图节点之间的关系向量;若更新后的关系向量与相应的目标关系向量之间的距离差值在预设范围内,则对所述初始化预测网络模型的训练结束,得到所述预先训练好的预测网络模型。
上述方法的具体实施步骤包括:
1)构建训练集S,训练集S包括多个单模态数据样本库,每个单模态数据样本库包括多个由两个实体和一个实体关系构成的三元组,表示为(h,l,t),其中h,t∈E(对应单模态数据样本库,如行为标志物Behavior、社交关系Social、健康诊断标志物Diagnosis、决策Policy等单模态数据样本库),l∈L(实体关系的集合,如导致、避免、时序关联等)。
2)基于二分图神经网络模型或者图神经网络模型,构建初始化预测网络模型,利用初始化预测网络模型中的编码层对训练集S中的三元组进行编码,得到包含实体对及实体间关系的图嵌入向量(图节点对)。根据三元组中的两个实体和一个实体关系,利用编码层对实体和实体关系进行图嵌入处理,得到多个单模态数据网络图。即将实体投影到向量空间中映射成实体嵌入向量,将两个实体间的关系投影到向量空间中映射成关系嵌入向量,得到包含实体及实体关系的图嵌入向量(图节点对),其中,每个实体表示为Rk(k是模型超参数)。
3)利用初始化预测网络模型中的二分图层,根据每个单模态数据网络图中同构图节点特征,以及同构图节点之间的关系特征,进行二分图处理,得到针对各单模态数据网络图的初始二分图;对初始二分图中同构图节点之间的特征信息进行训练更新,得到针对各单模态数据网络图的更新二分图;根据多个单模态数据网络图之间异构图节点特征,以及异构图节点之间的关系特征,对多个更新二分图进行聚合处理,得到初始多模态数据二分图;对初始多模态数据二分图中异构图节点之间的特征信息进行训练更新,得到更新多模态数据二分图,以实现异构图节点之间的特征信息传递。
需要说明的是,训练更新包括同构图节点训练更新以及异构图节点训练更新,即利用二分图实现同构图节点之间,以及异构图节点之间的特征信息传递。其中,针对每个单模态数据网络图分别设定二分图层,单模态数据网络图数量与二分图层数量相同。根据实际应用场景的需求,可针对同构图节点训练更新以及异构图节点训练更新分别设定损失函数,并在针对同构图节点的迭代更新后,再针对异构图节点进行迭代更新,以得到更新多模态数据二分图。
4)利用初始化预测网络模型中的解码器层(多层感知器MLP),训练更新多模态数据二分图中异构图节点之间的边关系向量(范数值),即预测关系向量,直至训练结束,得到训练好的预测网络模型。根据实际应用场景的需求,利用三层感知器MLP预测多模态数据二分图中异构图节点之间的边关系向量(范数值),当目标边关系向量(范数值)满足预设条件时,训练结束,得到训练好的预测网络模型。
具体地,针对多模态数据二分图预设用于预测头部实体向量指向尾部实体向量的关系向量函数为d(h+l,t),d为L1或L2范数。针对多模态数据二分图,分别提取异构图节点中的实体向量作为头部实体向量和尾部实体向量,根据头部实体向量和尾部实体向量中包含的实体属性特征,以及实体间关系特征,得到头部实体向量指向尾部实体向量的预测关系向量(范数值),并利用预设的三重态损失函数迭代头部实体向量指向尾部实体向量的预测关系向量(范数值)与头部实体向量指向尾部实体向量的目标关系向量(范数值)之间的距离差值,直至三重态损失函数最小化,得到训练好的预测网络模型。
步骤202、获取多个单模态数据库。
步骤203、对所述多个单模态数据库中的所述三元组信息进行图嵌入处理,得到对应每个三元组信息的同构图节点,其中,所述同构图节点是指每个所述单模态数据网络图内部的图节点。
实施中,利用预先训练好的预测网络模型中的编码层对每个单模态数据库中的三元组进行编码,即对多个单模态数据库的三元组信息的高维向量表示分别进行低维嵌入处理,得到用于表征三元组信息的低维向量表示,从而在保留节点及节点间关系特征的同时,提升运算效率。
步骤204、根据每个单模态数据库中对应每个三元组信息的同构图节点,构建对应每个单模态数据库的单模态数据网络图。
实施中,分别提取针对每个三元组信息的图嵌入向量中的实体向量作为头部实体向量和尾部实体向量,根据头部实体向量和尾部实体向量中包含的实体属性特征,以及实体间关系特征,得到头实体向量指向尾实体向量的预测关系向量(范数值),进而构建得到单模态数据网络图。
根据实际应用场景的需求,以社交关系数据样本库和健康诊断标志物数据样本库为例,社交关系数据样本库包括的三元组信息(图节点对)为,A节点是B节点的伴侣等,生物标志物数据样本库包括的三元组信息(图节点对)为,C节点艾滋病抗体阳性和D节点梅毒抗体阳性间存在强相关性等。根据社交关系数据样本库和健康诊断标志物数据样本库中每个三元组信息(图节点对),利用编码层进行图嵌入处理,分别生成基于社交关系的单模态数据网络图和基于健康诊断标志物的单模态数据网络图。
步骤205、分别更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征,得到对应每个单模态数据网络图的单模态数据二分图。
步骤206、分别融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征,得到多模态数据网络图。
其中,根据单模态数据网络图的数量确定用于二分图转换的自更新二分图层数量,利用针对每个单模态数据网络图设定的自更新二分图层,更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征;根据每两个单模态数据网络图的组合数量确定用于二分图转换的融合二分图层数量,利用针对每两个单模态数据网络图设定的融合二分图层,融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征;其中,所述异构图节点是指,单模态数据网络图中同构图节点在学习到其他单模态数据网络图中同构图节点的属性特征,和/或学习到与其他单模态数据网络图中同构图节点之间的关系特征后,将所述同构图节点设定为异构图节点。
为了说明步骤206的具体实施方式,作为一种优选实施例,按照单模态数据网络图的数量,将多个单模态数据网络图划分为第一单模态数据网络图和第二单模态数据网络图,步骤206具体可以包括:分别融合第一单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到对应第一单模态数据网络图的多个第一多模态数据二分图;根据所述多个第一多模态数据二分图,分别融合第二单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到对应第二单模态数据网络图的多个第二多模态数据二分图,并作为多模态数据网络图。
实施中,通过二分图层中的注意力机制对相邻图节点进行聚合更新,实现对不同相邻图节点权重的自适应分配,从而提升预测网络模型的表达能力。具体实施步骤包括:
1)设定二分图BG(U,V,ε),也即图G(U∪V,ε),其中U和V分别代表两个不同单模态数据样本库,社交关系数据样本库和健康诊断标志物数据样本库,社交关系数据样本库包括的三元组信息(图节点对)为,A节点是B节点的伴侣等,生物标志物数据样本库包括的三元组信息(图节点对)为,C节点艾滋病抗体阳性和D节点梅毒抗体阳性间存在强相关性等。
2)针对利用编码层生成的社交关系网络图(基于社交关系的单模态数据网络图)和健康诊断标志物网络图(基于健康诊断标志物的单模态数据网络图)分别设置二分图层,利用设置的二分图层对社交关系网络图和健康诊断标志物网络图同步进行二分图转换,得到社交关系初始二分图和健康诊断标志物初始二分图,分别对社交关系初始二分图和健康诊断标志物初始二分图进行训练更新,得到更新后的社交关系二分图和健康诊断标志物二分图。其中,基于注意力机制的二分图卷积算法的公式如下:
权重的公式为:
其中,表示社交关系数据样本库中图节点ui的节点特征,/>表示健康诊断标志物数据样本库中图节点vj的节点特征,bgaε()表示二分图卷积,/>表示agg聚合函数,ρ表示激活函数,/>表示图BG(U,V,ε)中图节点ui通过边ε连接的相邻图节点,Wu表示社交关系数据样本库的可学习矩阵,Wv表示健康诊断标志物数据样本库的可学习矩阵。
3)利用特征信息传递函数,通过遍历每两个二分图的方式实现对所有二分图的融合,得到多模态数据二分图。根据实际应用场景的需求,可以根据更新后的社交关系(S)二分图和健康诊断标志物(D)二分图中的图节点特征,以及图节点间关系特征对决策(P)二分图、行为标志物(B)二分图进行训练更新,此处不对遍历规则进行具体设定。例如,同构图节点间特征信息传递的函数,以及异构图节点间特征信息传递的函数分别为:
其中,MPS→S表示社交关系(S)二分图内同构图节点之间的特征信息传递(MassagePassing),MPD→P表示从健康诊断标志物(D)二分图中的图节点到决策(P)二分图中的图节点的特征信息传递,MPS→P表示从社交关系(S)二分图中的图节点到决策(P)二分图中的图节点的特征信息传递,k表示二分图卷积层数,h()表示图节点特征。
根据实际应用场景的需求,在二分图层的训练更新中,还可以根据更新后的决策(P)二分图、行为标志物(B)二分图中的图节点特征,以及图节点间关系特征对社交关系(S)二分图和健康诊断标志物(D)二分图进行训练更新,通过不断地迭代更新,得到更新后的多模态数据二分图。
步骤207、利用多层感知器对所述多模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征进行解码,得到异构图节点之间的关系向量。
步骤208、根据异构图节点之间的关系向量中满足预设条件的目标关系向量,确定所述目标关系向量中包含的目标图节点,并将确定的所述目标图节点的节点信息作为公卫黑天鹅事件。
实施中,利用三层感知器MLP预测多模态数据二分图中异构图节点间的关系向量(范数值),确定满足预设条件的关系向量(范数值)范围,并将该关系向量(范数值)范围内涉及的图节点作为目标图节点,目标图节点对应的尾实体作为公卫黑天鹅事件,头实体作为高风险人物和事件。其中,预设条件为图节点之间的预测关系向量(范数值)小于设定值,或者图节点之间的预测关系向量(范数值)升序排名在预设排名范围内,此处不对设定值和预设排名范围进行具体限定。
通过应用本实施例的技术方案,获取多个单模态数据库,使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图,使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图,使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件,与现有基于scikit-learn的逻辑回归模型的黑天鹅事件预测的技术方案相比,本实施例通过预先训练好的预测网络模型能够有效避免现有scikit-learn逻辑回归模型基于历史发病数据进行统计分析,无法充分利用社会环境因素及日常生活因素对公卫黑天鹅事件作出预测的技术问题,从而实现对公卫黑天鹅事件中需要重点关注和干预的人物和事件进行预测的同时,提升预测准确性。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种公卫黑天鹅事件预测装置,如图3所示,该装置包括:获取模块32、编码模块33、二分图转换模块34、解码模块35。
获取模块32,可以用于获取多个单模态数据库。
编码模块33,可以用于使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图。
二分图转换模块34,可以用于使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图。
解码模块35,可以用于使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。
在具体的应用场景中,如图4所示,还包括模型训练模块31。
在具体的应用场景中,编码模块33包括图嵌入单元331、构建单元332。
图嵌入单元331,可以用于对所述多个单模态数据库中的所述三元组信息进行图嵌入处理,得到对应每个三元组信息的同构图节点;其中,所述同构图节点是指每个所述单模态数据网络图内部的图节点。
构建单元332,可以用于根据每个单模态数据库中对应每个三元组信息的同构图节点,构建对应每个单模态数据库的单模态数据网络图。
在具体的应用场景中,二分图转换模块34包括自更新单元341、融合单元342。
自更新单元341,可以用于分别更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征,得到对应每个单模态数据网络图的单模态数据二分图。
融合单元342,可以用于分别融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征,得到多模态数据网络图。
其中,根据单模态数据网络图的数量确定用于二分图转换的自更新二分图层数量,利用针对每个单模态数据网络图设定的自更新二分图层,更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征;根据每两个单模态数据网络图的组合数量确定用于二分图转换的融合二分图层数量,利用针对每两个单模态数据网络图设定的融合二分图层,融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征;其中,所述异构图节点是指,单模态数据网络图中同构图节点在学习到其他单模态数据网络图中同构图节点的属性特征,和/或学习到与其他单模态数据网络图中同构图节点之间的关系特征后,将所述同构图节点设定为异构图节点。
在具体的应用场景中,按照单模态数据网络图的数量,将多个单模态数据网络图划分为第一单模态数据网络图和第二单模态数据网络图,融合单元342,可以具体用于分别融合第一单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到对应第一单模态数据网络图的多个第一多模态数据二分图;根据所述多个第一多模态数据二分图,分别融合第二单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到对应第二单模态数据网络图的多个第二多模态数据二分图,并作为多模态数据网络图。
在具体的应用场景中,解码模块35包括特征解码单元351、事件确定单元352,所述解码模块35为多层感知器。
特征解码单元351,可以用于利用多层感知器对所述多模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征进行解码,得到异构图节点之间的关系向量。
事件确定单元352,可以用于根据异构图节点之间的关系向量中满足预设条件的目标关系向量,确定所述目标关系向量中包含的目标图节点,并将获取到的所述目标图节点的节点信息作为公卫黑天鹅事件。
在具体的应用场景中,模型训练模块31,可以用于训练初始化预测网络模型。
在具体的应用场景中,模型训练模块31可以具体用于将多个单模态数据样本库中的三元组信息作为预设的初始化预测网络模型的输入数据;利用初始化预测网络模型中的编码层、二分图层和解码层,对多个单模态数据样本库中三元组信息对应的异构图节点之间进行特征信息传递,预测得到异构图节点之间的关系向量;利用预设的三重态损失函数,迭代更新所述异构图节点之间的关系向量;若更新后的关系向量与相应的目标关系向量之间的距离差值在预设范围内,则对所述初始化预测网络模型的训练结束,得到所述预先训练好的预测网络模型。
需要说明的是,本申请实施例提供的一种公卫黑天鹅事件预测装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的公卫黑天鹅事件预测方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的公卫黑天鹅事件的预测方法。
可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与现有基于cikit-learn的逻辑回归模型的预测技术方案相比,本实施例通过二分图层实现多个单模态数据库之间单模态数据的融合,基于融合后得到的多模态数据网络图对公卫黑天鹅事件进行预测,从而实现对高风险人物和事件的预测,提高预测准确性。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (9)

1.一种公卫黑天鹅事件预测方法,其特征在于,包括:
获取多个单模态数据库;
使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图;
使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图;
所述使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图,具体包括:
分别更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征,得到对应每个单模态数据网络图的单模态数据二分图;
分别融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征,得到多模态数据网络图;
其中,所述异构图节点是指,单模态数据网络图中同构图节点在学习到其他单模态数据网络图中同构图节点的属性特征,和/或学习到与其他单模态数据网络图中同构图节点之间的关系特征后,将所述同构图节点设定为异构图节点;
使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。
2.根据权利要求1所述的方法,其特征在于,所述使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图,具体包括:
对所述多个单模态数据库中的所述三元组信息进行图嵌入处理,得到对应每个三元组信息的同构图节点;
根据每个单模态数据库中对应每个三元组信息的同构图节点,构建对应每个单模态数据库的单模态数据网络图;
其中,所述同构图节点是指每个所述单模态数据网络图内部的图节点。
3.根据权利要求1所述的方法,其特征在于,所述使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图,具体包括:
根据单模态数据网络图的数量确定用于二分图转换的自更新二分图层数量,利用针对每个单模态数据网络图设定的自更新二分图层,更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征;
根据每两个单模态数据网络图的组合数量确定用于二分图转换的融合二分图层数量,利用针对每两个单模态数据网络图设定的融合二分图层,融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征。
4.根据权利要求1所述的方法,其特征在于,所述分别融合每两个单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到多模态数据网络图的步骤之前,还包括:
按照单模态数据网络图的数量,将多个单模态数据网络图划分为第一单模态数据网络图和第二单模态数据网络图;
所述分别融合每两个单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到多模态数据网络图,具体包括:
分别融合第一单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到对应第一单模态数据网络图的多个第一多模态数据二分图;
根据所述多个第一多模态数据二分图,分别融合第二单模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征,得到对应第二单模态数据网络图的多个第二多模态数据二分图,并作为多模态数据网络图。
5.根据权利要求1所述的方法,其特征在于,所述解码层为多层感知器,所述使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件,具体包括:
利用多层感知器对所述多模态数据网络图中异构图节点的属性特征和异构图节点之间的关系特征进行解码,得到异构图节点之间的关系向量;
根据异构图节点之间的关系向量中满足预设条件的目标关系向量,确定所述目标关系向量中包含的目标图节点,并将确定的所述目标图节点的节点信息作为公卫黑天鹅事件。
6.根据权利要求1所述的方法,其特征在于,所述获取多个单模态数据库之前,还包括:
将多个单模态数据样本库中的三元组信息作为预设的初始化预测网络模型的输入数据;
利用初始化预测网络模型中的编码层、二分图层和解码层,对多个单模态数据样本库中三元组信息对应的异构图节点之间进行特征信息传递,预测得到异构图节点之间的关系向量;
利用预设的三重态损失函数,迭代更新所述异构图节点之间的关系向量;
若更新后的关系向量与相应的目标关系向量之间的距离差值在预设范围内,则对所述初始化预测网络模型的训练结束,得到所述预先训练好的预测网络模型。
7.一种公卫黑天鹅事件预测装置,其特征在于,包括:
获取模块,用于获取多个单模态数据库;
编码模块,用于使用预先训练好的预测网络模型的编码层对所述多个单模态数据库中的三元组信息进行编码,根据编码结果生成对应每个单模态数据库的单模态数据网络图;
二分图转换模块,用于使用所述预测网络模型的二分图层对多个所述单模态数据网络图进行二分图转换,得到多模态数据网络图;
所述二分图转换模块具体包括:
自更新单元,用于分别更新每个单模态数据网络图中同构图节点的属性特征和同构图节点之间的关系特征,得到对应每个单模态数据网络图的单模态数据二分图;
融合单元,用于分别融合每两个单模态数据网络图之间异构图节点的属性特征和异构图节点之间的关系特征,得到多模态数据网络图;
其中,所述异构图节点是指,单模态数据网络图中同构图节点在学习到其他单模态数据网络图中同构图节点的属性特征,和/或学习到与其他单模态数据网络图中同构图节点之间的关系特征后,将所述同构图节点设定为异构图节点;
解码模块,用于使用所述预测网络模型的解码层确定所述多模态数据网络图中满足预设条件的目标图节点,并将所述目标图节点的节点信息作为公卫黑天鹅事件。
8.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至6中任一项所述公卫黑天鹅事件预测方法。
9.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述的公卫黑天鹅事件预测方法。
CN202111246554.6A 2021-10-26 2021-10-26 公卫黑天鹅事件预测方法、装置、设备及介质 Active CN113762648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111246554.6A CN113762648B (zh) 2021-10-26 2021-10-26 公卫黑天鹅事件预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111246554.6A CN113762648B (zh) 2021-10-26 2021-10-26 公卫黑天鹅事件预测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113762648A CN113762648A (zh) 2021-12-07
CN113762648B true CN113762648B (zh) 2023-12-19

Family

ID=78784450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111246554.6A Active CN113762648B (zh) 2021-10-26 2021-10-26 公卫黑天鹅事件预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113762648B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114238572B (zh) * 2021-12-15 2024-04-16 平安科技(深圳)有限公司 基于人工智能的多数据库数据提取方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111260462A (zh) * 2020-01-16 2020-06-09 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN111367961A (zh) * 2020-02-27 2020-07-03 西安交通大学 基于图卷积神经网络的时序数据事件预测方法、系统及其应用
CN112906770A (zh) * 2021-02-04 2021-06-04 浙江师范大学 一种基于跨模态融合的深度聚类方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111260462A (zh) * 2020-01-16 2020-06-09 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN111367961A (zh) * 2020-02-27 2020-07-03 西安交通大学 基于图卷积神经网络的时序数据事件预测方法、系统及其应用
CN112906770A (zh) * 2021-02-04 2021-06-04 浙江师范大学 一种基于跨模态融合的深度聚类方法及系统

Also Published As

Publication number Publication date
CN113762648A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
Mohammadi et al. Deep learning for IoT big data and streaming analytics: A survey
Srinivasu et al. From blackbox to explainable AI in healthcare: existing tools and case studies
CN112084422B (zh) 一种账号数据智能处理方法和装置
Usman et al. A survey on big multimedia data processing and management in smart cities
US20110202326A1 (en) Modeling social and cultural conditions in a voxel database
Bajo et al. Self-organizing architecture for information fusion in distributed sensor networks
Ma et al. Unsupervised human activity representation learning with multi-task deep clustering
Ahmad et al. An efficient multidimensional big data fusion approach in machine-to-machine communication
Xu et al. Bipolar fuzzy Petri nets for knowledge representation and acquisition considering non-cooperative behaviors
Aziz et al. Automated solutions for crowd size estimation
CN112231592A (zh) 基于图的网络社团发现方法、装置、设备以及存储介质
JP2022530868A (ja) 機械学習に基づくターゲットオブジェクト属性予測方法、関連機器及びコンピュータプログラム
CN114357105A (zh) 地理预训练模型的预训练方法及模型微调方法
WO2023231753A1 (zh) 一种神经网络的训练方法、数据的处理方法以及设备
Klemmer et al. Spate-gan: Improved generative modeling of dynamic spatio-temporal patterns with an autoregressive embedding loss
Bourached et al. Generative model‐enhanced human motion prediction
CN116821301A (zh) 基于知识图谱的问题应答方法、装置、介质及计算机设备
CN113762648B (zh) 公卫黑天鹅事件预测方法、装置、设备及介质
Wan et al. Addressing location uncertainties in GPS‐based activity monitoring: A methodological framework
CN115271980A (zh) 风险值预测方法、装置、计算机设备和存储介质
Hu et al. Teacher-student architecture for knowledge distillation: A survey
KR102491285B1 (ko) 메타버스 기술로 고인의 장례를 온라인으로 진행 가능하며 인공지능 기반으로 장례식 진행 프로세스와 조문객 접객 서비스가 제공되는 플랫폼의 운영방법
Zhong A convolutional neural network based online teaching method using edge-cloud computing platform
CN114898184A (zh) 模型训练方法、数据处理方法、装置及电子设备
CN117010480A (zh) 模型训练方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant