CN116304205A - 一种传播网络结构重构方法、装置、设备及存储介质 - Google Patents

一种传播网络结构重构方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116304205A
CN116304205A CN202310178906.1A CN202310178906A CN116304205A CN 116304205 A CN116304205 A CN 116304205A CN 202310178906 A CN202310178906 A CN 202310178906A CN 116304205 A CN116304205 A CN 116304205A
Authority
CN
China
Prior art keywords
node
propagation
propagation network
infection
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310178906.1A
Other languages
English (en)
Inventor
黄浩
吴伟观
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Qiushi Higher Research Institute
Original Assignee
Jiangxi Qiushi Higher Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Qiushi Higher Research Institute filed Critical Jiangxi Qiushi Higher Research Institute
Priority to CN202310178906.1A priority Critical patent/CN116304205A/zh
Publication of CN116304205A publication Critical patent/CN116304205A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种传播网络结构重构方法、装置、设备及存储介质,属于信息传播技术领域。所述方法通过获取传播网络中各节点的感染状态概率;根据所述感染状态概率计算各节点间的相关性数据;根据相关性数据筛选候选父节点集合;在候选父节点集合内定义优化函数,求解使函数取得最大值的参数;根据参数构建所述传播网络的影响关系图。本发明能够利用关于节点感染状态的概率信息准确地推断出节点之间的影响关系,不需要传播过程中每个节点的确切感染状态,减少了重构耗时,提高了影响关系确定精度,能够有效统计节点感染相关性,提高了传播网络管控速度和效率,有利于后续传播网络管控方案的制定和实施。

Description

一种传播网络结构重构方法、装置、设备及存储介质
技术领域
本发明涉及信息传播技术领域,尤其涉及一种传播网络结构重构方法、装置、设备及存储介质。
背景技术
传播网络是一种研究物质、信息传播规律的数学模型。观点、虚假信息和疾病的传播通常被建模为传播网络上的概率过程。在网络中,有向边表示父子关系,父节点可以以一定概率影响子节点。传播网络结构重构旨在从观测数据推断传播网络结构(即影响关系的拓扑结构)。在大多数情况下,这种影响关系是不可见的,只能观察到有限数量的历史传播过程。如何从有限数量的历史传播过程数据还原准确的传播网络结构这一问题在社交网络、病毒营销和流行病预防等领域受到了相当大的关注,因为重构出的传播网络结构能够直观地揭示节点之间的潜在交互,对于制定控制未来传播过程的策略至关重要,可以帮助研究人员更好地预测、促进或组织未来的物质、信息传播。
已有的重构方法假设观测数据包含每个节点感染的确切发生时间,或者至少包含每个扩散过程中节点的最终感染状态;他们通过识别节点感染之间的时间序列或统计相关性来确定节点之间的潜在影响关系;在不太理想和更现实环境中,往往只能得到关于节点感染状态的概率信息;例如,很难根据头痛、疲劳等可观察到的症状来确定门诊患者的感染状况,因为这些症状可能是由睡眠不足等其他原因引起的;在这种环境下,能得到的关于节点感染状态的概率信息无法直接用以计算统计相关性,因此需要新的方法来基于节点感染状态的概率信息推断传播网络中的影响关系。
发明内容
本发明的主要目的在于提供一种传播网络结构重构方法、装置、设备及存储介质,旨在解决现有技术中传播网络重构方法中,过于依赖节点感染之间的时间序列或统计相关性来确定节点之间的潜在影响关系、影响关系的确定精确度较低以及无法有效统计相关性的问题,从而得以快速制定和实施后续传播网络管控方案,提高传播网络管控速度和效率。
具体说明本发明所述传播网络结构重构方法、装置、设备及存储介质之前,约定以下符号:
定义传播网络中潜在的影响关系图为G={V,E},其中V={V1,V2,…,Vn}表示组成网络的n个节点,E是表示影响关系图中的有向边集合,从父节点Vi∈V到子节点Vj∈V的有向边(Vi,Vj)∈E表示若节点Vi被感染Vj节点未被感染,那么有αij概率Vj节点会被Vi节点感染,其中αij为感染传播概率。同时,使用集合S={S1,S2,...,Sβ}来记录网络中β次传播过程结束后的概率信息,其中
Figure SMS_1
表示第l次传播过程结束后网络中n个节点的感染概率,/>
Figure SMS_2
表示第l次传播过程结束后节点Vi的感染概率。
第一方面,本发明提供一种传播网络结构重构方法,所述传播网络结构重构方法包括以下步骤:
获取传播网络中各节点的感染状态概率;
根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;
在候选父节点集合内定义优化函数,求解使优化函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
进一步的,所述获取传播网络中各节点的感染状态概率,包括:
获取传播网络中任意节点到其他节点的感染传播概率,获取各节点在传播过程结束后的节点感染概率,根据所述感染传播概率和所述节点感染概率确定各节点的感染状态概率。
进一步的,所述根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合,包括:
根据所述感染状态概率计算各节点间的连续型互信息,根据所述连续型互信息判断各节点之间是否存在有向边,统计不同有向边的集合,获得有向边集合;
根据有向边集合对所述传播网络中的各节点进行分类,获得候选父节点集合。
进一步的,根据所述感染状态概率通过下式计算各节点间的连续型互信息:
Figure SMS_3
其中,CMI(Vi,Vj)为每个节点Vi和剩余每个节点Vj∈V\{Vi}的连续型互信息,V为传播网络中的所有节点构成的集合,
Figure SMS_4
为第l次传播过程结束后节点Vi的感染状态,a∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_5
为/>
Figure SMS_6
取值为a的概率,/>
Figure SMS_7
为第l次传播过程结束后节点Vj的感染状态,b∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_8
为/>
Figure SMS_9
取值为b的概率,β为传播过程的次数。
进一步的,所述对所述传播网络中的各节点进行分类,获得候选父节点集合,包括:
使用K-means聚类方法将所述传播网络中的各节点分为两类,并从分类结果中获得各节点的候选父节点集合。
进一步的,所述优化函数如下:
Figure SMS_10
其中,L(x,α)为优化函数,Ci为候选父节点集合,n为传播网络中的节点数,Vj为传播网络中的第j个节点,β为传播过程的次数,集合x为包含所有xji的集合,集合α为所有αji的集合,对任意的i,j,xji∈[0,1],αji∈[0,1],xji表示从节点Vj到节点Vi存在有向边的概率,αji为从节点Vj到节点Vi的感染传播概率,
Figure SMS_11
表示第l次传播过程结束后节点Vi的感染概率。
进一步的,所述求解使优化函数取得最大值的参数,根据参数构建所述传播网络的影响关系图,包括:
更新所述优化函数中的集合x和集合α中的变量,迭代求解获得所述优化函数的最大值;
根据所述优化函数的最大值确定每个节点的父节点集合,根据所述父节点集合获得所述传播网络的边集合;
根据所述边集合重构所述传播网络,获得重构后的传播网络中各节点的影响关系图。
第二方面,为实现上述目的,本发明还提出一种传播网络结构重构装置,所述传播网络结构重构装置包括:
数据获取模块,用于获取传播网络中各节点的感染状态概率;
相关性计算模块,用于根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;
关系图生成模块,用于在候选父节点集合内定义优化函数,求解使优化函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
第三方面,为实现上述目的,本发明还提出一种传播网络结构重构设备,所述传播网络结构重构设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的传播网络结构重构程序,所述传播网络结构重构程序配置为实现如上文所述的传播网络结构重构方法的步骤。
第四方面,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有传播网络结构重构程序,所述传播网络结构重构程序被处理器执行时实现如上文所述的传播网络结构重构方法的步骤。
本发明提出的传播网络结构重构方法,获取传播网络中各节点的感染状态概率;根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;定义优化函数,求解使函数取得最大值的参数,根据参数构建所述传播网络的影响关系图,能够利用关于节点感染状态的概率信息准确地推断出节点之间的影响关系,不需要传播过程中每个节点的确切感染状态,能够有效统计节点感染相关性,有利于后续传播网络管控方案的制定和实施。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明传播网络结构重构方法实施例的流程示意图;
图3是本发明实施例在LFR算法生成的人工网络上构建影响关系图对应F值的结果图。
图4是本发明实施例在DUNF和DPU网络上使用不同不确定因子均值构建影响关系图对应的F值的结果图。
图5为本发明传播网络结构重构装置实施例的功能模块图。
本发明的实现、功能特点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
硬件运行环境实施例1
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
如图1所示,该设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(Non-Volatile Memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对该设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及传播网络结构重构程序。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,并执行以下操作:
获取传播网络中各节点的感染状态概率;
根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;
定义优化函数,求解使函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,还执行以下操作:
获取传播网络中任意节点到其他节点的感染传播概率,获取各节点在传播过程结束后的节点感染概率,根据所述感染传播概率和所述节点感染概率确定各节点的感染状态概率。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,还执行以下操作:
根据所述感染状态概率计算各节点间的连续型互信息,根据所述连续型互信息确定有向边集合;
根据有向边集合对所述传播网络中的各节点进行分类,获得候选父节点集合。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,还执行以下操作:
根据所述感染状态概率通过下式计算各节点间的连续型互信息:
Figure SMS_12
其中,CMI(Vi,Vj)为每个节点Vi和剩余每个节点Vj∈V\{Vi}的连续型互信息,
Figure SMS_13
为第l次传播过程结束后节点Vi的感染状态,a∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_14
为/>
Figure SMS_15
取值为a的概率,/>
Figure SMS_16
为第l次传播过程结束后节点Vj的感染状态,b∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_17
为/>
Figure SMS_18
取值为b的概率,β为传播过程的次数;
通过所述连续型互信息判断各节点之间是否存在有向边;
在各节点之间存在有向边时,统计不同有向边的集合,获得有向边集合。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,还执行以下操作:
使用K-means聚类方法将所述传播网络中的各节点分为两类,并从分类结果中获得各节点的候选父节点集合。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,还执行以下操作:
在候选父节点集合内定义优化函数:
Figure SMS_19
其中,L(x,α)为优化函数,集合x为包含所有变量xji(Vi∈V,Vj∈Ci)的集合,集合α为所有变量αij(Vi∈V,Vj∈Ci)的集合,Ci为候选父节点集合,Ci={Vj|CMI(Vj,Vi)∈MI2},其中MI2为除MI包含的节点之外剩余节点的集合,MI为各节点中均值接近0的集合;对任意的i,j,xji∈[0,1],αji∈[0,1],xji表示从节点Vj到节点Vi存在有向边的概率,αji为从节点Vj到节点Vi的感染传播概率,
Figure SMS_20
表示第l次传播过程结束后节点Vi的感染概率。
本发明设备通过处理器1001调用存储器1005中存储的传播网络结构重构程序,还执行以下操作:
更新所述优化函数中集合x、α中的变量,直至迭代求解获得所述优化函数的最大值;
根据所述优化函数最大值确定函数参数,即每个节点的父节点集合,根据所述父节点集合获得所述传播网络的边集合;
根据所述边集合重构所述传播网络,获得重构后的传播网络中各节点的影响关系图。
传播网络结构重构方法实施例2
基于上述硬件结构,提出本发明传播网络结构重构方法实施例。
参照图2,图2为本发明传播网络结构重构方法实施例的流程示意图。
在此实施例中,所述传播网络结构重构方法包括以下步骤:
步骤1、获取传播网络中各节点的感染状态概率。
步骤1具体操作包括:
使用了七个网络(如表1所示),其中网络Net1,Net2,Net3,Net4和Net5是采用LFR算法生成的人工网络,DUNF和DPU是两个常用的现实世界微博网络。每个网络的传播数据生成过程如下:假定网络中各个节点之间的影响程度相同,每次传播过程中,从测试网络中随机选择15%的节点作为初始“感染”点,并根据IC模型进行传播模拟,在传播模拟结束后,记录每个节点的感染状态作为一条传播轨迹数据,并生成多条数据作为实验的观测数据集,所述的观测数据集包含的各节点的感染状态概率。为了增加感染数据的不确定性,对于观测数据集中每个确切的节点感染状态概率,将其替换为u,其中u是一个随机不确定因子,其值服从高斯分布,平均值和标准差为0.1。
表1实验网络
网络 节点个数 不确定因子u均值
Net1 1000 0.3
Net2 1500 0.3
Net3 2000 0.3
Net4 2500 0.3
Net5 3000 0.3
DUNF 750 0,0.05,0.1,0.15,0.2,0.25,0.3
DPU 1038 0,0.05,0.1,0.15,0.2,0.25,0.3
步骤2、根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合。
步骤2具体操作包括:
依次考虑网络中的每个节点Vi,计算剩余每个节点Vj∈V\{Vi}与Vi的连续型互信息CMI(Vi,Vj):
Figure SMS_21
定义感染状态概率,
Figure SMS_22
其中,
Figure SMS_23
和/>
Figure SMS_24
分别表示第l次传播过程结束后节点Vi和Vj的感染状态,a∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_25
为/>
Figure SMS_26
取值为a的概率,b∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_27
为/>
Figure SMS_28
取值为b的概率;/>
Figure SMS_29
表示第l次传播过程结束后节点Vi的感染概率;β表示传播过程的次数。对于网络中的每个节点Vi,使用K-means聚类方法将连续型互信息{CMI(Vj,Vi)|Vj∈V\{Vi}}分为2类,其中固定一类的均值接近0,该集合记为MI,设另一类为集合MI2,从集合MI2中可以得到节点Vi的候选父节点集合Ci={Vj|CMI(Vj,Vi)∈MI2}。
步骤3、定义优化函数,求解使函数取得最大值时的参数,构造传播网络的影响关系图。
步骤3具体操作包括:
定义变量xji表示从节点Vj到节点Vi存在有向边的概率,αij表示从节点Vi到节点Vj的感染传播概率,x是包含所有xji(Vi∈V,Vj∈Ci)的集合,α是包含所有αij(Vi∈V,Vj∈Ci)的集合,T为迭代次数。随机初始化x和α,并满足对任意的i,j,xji∈[0,1],αij∈[0,1]。
定义优化函数L(x,α),依次执行步骤4和步骤5迭代求解L(x,α)的最大值。本实施例中,L(x,α)的表达式为:
Figure SMS_30
其中,L(x,α)为优化函数,对任意的i,j,xji∈[0,1],αij∈[0,1],xji表示从节点Vj到节点Vi存在有向边的概率,αji为从节点Vj到节点Vi的感染传播概率,
Figure SMS_31
表示第l次传播过程结束后节点Vi的感染概率,n表示传播网络中的节点数量。
更新操作:对变量x,每次迭代用
Figure SMS_32
更新x值,搜索能使L(x,α)取得最大值的x,其中,θ=min{θji|i∈{1,…,n},Vj∈Ci},取最小的自然数m使得
Figure SMS_33
y表示更新x值的方向向量,将x更新为/>
Figure SMS_34
θji计算表达式如下:
Figure SMS_35
其中,
Figure SMS_36
其中,x(T)(T)分别为变量x和变量α迭代T次得到的值,yji表示方向向量y对应分量的值,θji表示更新步长的候选值。
对变量α,每次迭代用
Figure SMS_37
更新α值,搜索能使L(x,α)取得最大值的α,λ=min{λji|i∈{1,…,n},Vj∈Ci},取最小的自然数k使得/>
Figure SMS_38
z表示更新α值的方向向量,将α更新为/>
Figure SMS_39
λji计算表达式如下:
Figure SMS_40
其中,
Figure SMS_41
其中,x(T)(T)分别为变量x和变量α迭代T次得到的值。
若L(x(T)(T))未达到最大值,回到更新操作,依次更新x(T)(T)得到x(T+1)(T+1)再判断;若取得最大值,设(x**)为对应最优解,视
Figure SMS_42
为xji∈{0,1}取1的概率,对xji进行r次采样,得到r次采样结果/>
Figure SMS_43
变量x最终解/>
Figure SMS_44
根据最终解/>
Figure SMS_45
得到每个节点Vi的父节点集合/>
Figure SMS_46
进而得到传播网络G的边集合E={(Vj,Vi)|Vi∈V,Vj∈Fi},将重构得到的传播网络G={V,E}返回给用户。
参照图3、图4为本发明发明传播网络结构重构方法实施例的结果图,图3是本发明实施例在LFR算法生成的人工网络上构建影响关系图对应F值的结果图,图4是本发明实施例在DUNF和DPU网络上使用不同不确定因子均值构建影响关系图对应的F值的结果图,可以看出,LFR算法生成的人工网络和DUNF网络对应的F值基本稳定在0.9左右,DPU网络对应的F值基本稳定在0.7-0.6之间,说明了本发明所提的方法在不依赖节点感染之间的时间序列和每个节点的确切感染状态,仅利用关于节点感染状态的概率信息可以准确地推断出节点之间的影响关系。
在本发明的一项具体实施中,上述传播网络重构方法可以有多种应用场景,例如,某一虚假信息在社交网络中的传播、某一流行病的传播和预防等,网络中的每一个节点即代表每一个个体,本发明的重构方法可以揭示不同个体之间的潜在交互,不需要传播过程中每个节点的确切感染状态,可显著提高传播网络管控速度和效率,对于制定控制未来传播过程的策略至关重要。
传播网络结构重构装置实施例3
相应地,本发明进一步提供一种传播网络结构重构装置。
参照图5为本发明传播网络结构重构装置实施例的功能模块图。
本发明传播网络结构重构装置实施例中,该传播网络结构重构装置包括:
数据获取模块M1,用于获取传播网络中各节点的感染状态概率。
相关性计算模块M2,用于根据感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合。
关系图生成模块M3,用于在候选父节点集合内定义优化函数,求解使函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
在本发明的一项具体实施中,所述数据获取模块M1,还用于获取传播网络中任意节点到其他节点的感染传播概率,获取各节点在传播过程结束后的节点感染概率,根据所述感染传播概率和所述节点感染概率确定各节点的感染状态概率。
所述相关性计算模块M2,还用于根据所述感染状态概率计算各节点间的连续型互信息,根据所述连续型互信息确定有向边集合;根据有向边集合对所述传播网络中的各节点进行分类,获得候选父节点集合。
所述各节点间的连续型互信息的计算公式如下:
Figure SMS_47
其中,CMI(Vi,Vj)为每个节点Vi和剩余每个节点Vj∈V\{Vi}的连续型互信息,
Figure SMS_48
为第l次传播过程结束后节点Vi的感染状态,a∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_49
为/>
Figure SMS_50
取值为a的概率,/>
Figure SMS_51
为第l次传播过程结束后节点Vj的感染状态,b∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_52
为/>
Figure SMS_53
取值为b的概率,β为传播过程的次数;
通过所述连续型互信息可以判断各节点之间是否存在有向边,例如,当连续型互信息接近0时,可以认为两节点之间不存在有向边;在各节点之间存在有向边时,统计不同有向边的集合,获得有向边集合,根据所述的有向边集合,可以采用K-means聚类方法将所述传播网络中的各节点分为两类,并从分类结果中获得候选父节点集合。
所述关系图生成模块M3,其定义的优化函数如下:
Figure SMS_54
其中,L(x,α)为优化函数,集合x为包含所有有向边xji(Vi∈V,Vj∈Ci)的集合,集合α为所有有向边αij(Vi∈V,Vj∈Ci)的集合,Ci为候选父节点集合,Ci={Vj|CMI(Vj,Vi)∈mI2},其中MI2为除MI包含的节点之外剩余节点的集合,MI为各节点中均值接近0的集合;对任意的i,j,xji∈[0,1],αji∈[0,1],xji表示从节点Vj到节点Vi存在有向边的概率,αji为从节点Vj到节点Vi的感染传播概率,
Figure SMS_55
表示第l次传播过程结束后节点Vi的感染概率。
所述关系图生成模块M3通过更新集合x和集合α中的变量,直至迭代求解获得所述优化函数的最大值;根据所述最大值确定每个节点的父节点集合,根据所述父节点集合获得所述传播网络的边集合;根据所述边集合重构所述传播网络,获得重构后的传播网络中各节点的影响关系图。
其中,传播网络结构重构装置的各个功能模块实现的步骤可参照本发明传播网络结构重构方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有传播网络结构重构程序,所述传播网络结构重构程序被处理器执行时实现如下操作:
获取传播网络中各节点的感染状态概率;
根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;
在候选父节点集合内定义优化函数,求解使函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
在本发明的一项具体实施中,所述传播网络结构重构程序被处理器执行时还实现如下操作:
获取传播网络中任意节点到其他节点的感染传播概率,获取各节点在传播过程结束后的节点感染概率,根据所述感染传播概率和所述节点感染概率确定各节点的感染状态概率。
在本发明的一项具体实施中,所述传播网络结构重构程序被处理器执行时还实现如下操作:
根据所述感染状态概率计算各节点间的连续型互信息,根据所述连续型互信息确定有向边集合;
根据有向边集合对所述传播网络中的各节点进行分类,获得候选父节点集合。
在本发明的一项具体实施中,所述传播网络结构重构程序被处理器执行时还实现如下操作:
根据所述感染状态概率通过下式计算各节点间的连续型互信息:
Figure SMS_56
其中,CMI(Vi,Vj)为每个节点Vi和剩余每个节点Vj∈V\{Vi}的连续型互信息,
Figure SMS_57
为第l次传播过程结束后节点Vi的感染状态,a∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_58
为/>
Figure SMS_59
取值为a的概率,/>
Figure SMS_60
为第l次传播过程结束后节点Vj的感染状态,b∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure SMS_61
为/>
Figure SMS_62
取值为b的概率,β为传播过程的次数;
通过所述连续型互信息判断各节点之间是否存在有向边;
在各节点之间存在有向边时,统计不同有向边的集合,获得有向边集合。
在本发明的一项具体实施中所述传播网络结构重构程序被处理器执行时还实现如下操作:
使用K-means聚类方法将所述传播网络中的各节点分为两类,并从分类结果中获得候选父节点集合。
在本发明的一项具体实施中所述传播网络结构重构程序被处理器执行时还实现如下操作:
在候选父节点集合内定义优化函数
Figure SMS_63
其中,L(x,α)为优化函数,集合x为包含所有有向边xji(Vi∈V,Vj∈Ci)的集合,集合α为所有有向边αij(Vi∈V,Vj∈Ci)的集合,Ci为候选父节点集合,Ci={Vj|CMI(Vj,Vi)∈mI2},其中MI2为除MI包含的节点之外剩余节点的集合,MI为各节点中均值接近0的集合;对任意的i,j,xji∈[0,1],αji∈[0,1],xji表示从节点Vj到节点Vi存在有向边的概率,αji为从节点Vj到节点Vi的感染传播概率,
Figure SMS_64
表示第l次传播过程结束后节点Vi的感染概率。
在本发明的一项具体实施中所述传播网络结构重构程序被处理器执行时还实现如下操作:
更新优化函数中的集合x和集合α中的变量,直至迭代求解获得所述优化函数的最大值;
根据所述最大值确定每个节点的父节点集合,根据所述父节点集合获得所述传播网络的边集合;
根据所述边集合重构所述传播网络,获得重构后的传播网络中各节点的影响关系图。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种传播网络结构重构方法,其特征在于,包括:
获取传播网络中各节点的感染状态概率;
根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;
在候选父节点集合内定义优化函数,求解使优化函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
2.如权利要求1所述的传播网络结构重构方法,其特征在于,所述获取传播网络中各节点的感染状态概率,包括:
获取传播网络中任意节点到其他节点的感染传播概率,获取各节点在传播过程结束后的节点感染概率,根据所述感染传播概率和所述节点感染概率确定各节点的感染状态概率。
3.如权利要求1所述的传播网络结构重构方法,其特征在于,所述根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合,包括:
根据所述感染状态概率计算各节点间的连续型互信息,根据所述连续型互信息判断各节点之间是否存在有向边,统计不同有向边的集合,获得有向边集合;
根据有向边集合对所述传播网络中的各节点进行分类,获得候选父节点集合。
4.如权利要求3所述的传播网络结构重构方法,其特征在于,根据所述感染状态概率通过下式计算各节点间的连续型互信息:
Figure FDA0004101935690000011
其中,CMI(Vi,Vj)为每个节点Vi和剩余每个节点Vj∈V\{Vi}的连续型互信息,V为传播网络中的所有节点构成的集合,
Figure FDA0004101935690000012
为第l次传播过程结束后节点Vi的感染状态,a∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure FDA0004101935690000013
为/>
Figure FDA0004101935690000014
取值为a的概率,/>
Figure FDA0004101935690000015
为第l次传播过程结束后节点Vj的感染状态,b∈{0,1}为节点感染状态取值,0表示被感染,1表示未感染,/>
Figure FDA0004101935690000016
为/>
Figure FDA0004101935690000017
取值为b的概率,β为传播过程的次数。
5.如权利要求3所述的传播网络结构重构方法,其特征在于,所述对所述传播网络中的各节点进行分类,获得候选父节点集合,包括:
使用K-means聚类方法将所述传播网络中的各节点分为两类,并从分类结果中获得各节点的候选父节点集合。
6.如权利要求1所述的传播网络结构重构方法,其特征在于,所述优化函数如下:
Figure FDA0004101935690000021
其中,L(x,α)为优化函数,Ci为候选父节点集合,n为传播网络中的节点数,Vj为传播网络中的第j个节点,β为传播过程的次数,集合x为包含所有xji的集合,集合α为所有αji的集合,对任意的i,j,xji∈[0,1],αji∈[0,1],xji表示从节点Vj到节点Vi存在有向边的概率,αji为从节点Vj到节点Vi的感染传播概率,
Figure FDA0004101935690000022
表示第l次传播过程结束后节点Vi的感染概率。
7.如权利要求6所述的传播网络结构重构方法,其特征在于,所述求解使优化函数取得最大值的参数,根据参数构建所述传播网络的影响关系图,包括:
更新所述优化函数中的集合x和集合α中的变量,迭代求解获得所述优化函数的最大值;
根据所述优化函数的最大值确定每个节点的父节点集合,根据所述父节点集合获得所述传播网络的边集合;
根据所述边集合重构所述传播网络,获得重构后的传播网络中各节点的影响关系图。
8.一种传播网络结构重构装置,其特征在于,所述传播网络结构重构装置包括:
数据获取模块,用于获取传播网络中各节点的感染状态概率;
相关性计算模块,用于根据所述感染状态概率计算获得各节点间的相关性数据,筛选候选父节点集合;
关系图生成模块,用于在候选父节点集合内定义优化函数,求解使优化函数取得最大值的参数,根据参数构建所述传播网络的影响关系图。
9.一种传播网络结构重构设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的传播网络结构重构程序,所述传播网络结构重构程序配置为实现如权利要求1至7中任一项所述的传播网络结构重构方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有传播网络结构重构程序,所述传播网络结构重构程序被处理器执行时实现如权利要求1至7中任一项所述的传播网络结构重构方法的步骤。
CN202310178906.1A 2023-02-28 2023-02-28 一种传播网络结构重构方法、装置、设备及存储介质 Pending CN116304205A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310178906.1A CN116304205A (zh) 2023-02-28 2023-02-28 一种传播网络结构重构方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310178906.1A CN116304205A (zh) 2023-02-28 2023-02-28 一种传播网络结构重构方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116304205A true CN116304205A (zh) 2023-06-23

Family

ID=86829892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310178906.1A Pending CN116304205A (zh) 2023-02-28 2023-02-28 一种传播网络结构重构方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116304205A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118055030A (zh) * 2024-04-12 2024-05-17 江西求是高等研究院 一种传播网络重构方法、系统、存储介质及设备
CN118096417A (zh) * 2024-04-28 2024-05-28 江西求是高等研究院 一种传播网络模式发掘方法、系统、计算机及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118055030A (zh) * 2024-04-12 2024-05-17 江西求是高等研究院 一种传播网络重构方法、系统、存储介质及设备
CN118096417A (zh) * 2024-04-28 2024-05-28 江西求是高等研究院 一种传播网络模式发掘方法、系统、计算机及存储介质

Similar Documents

Publication Publication Date Title
Hübler et al. Metropolis algorithms for representative subgraph sampling
Chen et al. A general framework for estimating graphlet statistics via random walk
Andradóttir An overview of simulation optimization via random search
Zhou et al. Bayesian network approach to multinomial parameter learning using data and expert judgments
CN116304205A (zh) 一种传播网络结构重构方法、装置、设备及存储介质
Leung et al. Frequent pattern mining from time-fading streams of uncertain data
Ahmed et al. Sampling-based algorithm for link prediction in temporal networks
Tsirlis et al. On scoring maximal ancestral graphs with the max–min hill climbing algorithm
US20100076913A1 (en) Finding communities and their evolutions in dynamic social network
Lacasa On the degree distribution of horizontal visibility graphs associated with Markov processes and dynamical systems: diagrammatic and variational approaches
Liu et al. A scalable redefined stochastic blockmodel
Cerinšek et al. Generalized two-mode cores
Sarkar et al. Nonparametric link prediction in large scale dynamic networks
García-Pérez et al. Precision as a measure of predictability of missing links in real networks
Bucur et al. Improving multi-objective evolutionary influence maximization in social networks
Efendi et al. Maximum-minimum temperature prediction using fuzzy random auto-regression time series model
Lugo-Martinez et al. Classification in biological networks with hypergraphlet kernels
Kamkhad et al. Toward semantic data imputation for a dengue dataset
Chen et al. LinkProbe: Probabilistic inference on large-scale social networks
Yemane et al. Performance analysis of unreliable manufacturing systems with uncertain reliability parameters estimated from production data
Hilton et al. Design and analysis of demographic simulations
Purohit et al. ITeM: Independent temporal motifs to summarize and compare temporal networks
Teixeira et al. Graph pattern mining and learning through user-defined relations
Chen et al. Scaling up Markov logic probabilistic inference for social graphs
CN116611508A (zh) 面向无感染时间戳数据的传播网络重构方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination