CN109462506B - 一种在线社交网络数据竞争性信息提取传播工作方法 - Google Patents
一种在线社交网络数据竞争性信息提取传播工作方法 Download PDFInfo
- Publication number
- CN109462506B CN109462506B CN201811353286.6A CN201811353286A CN109462506B CN 109462506 B CN109462506 B CN 109462506B CN 201811353286 A CN201811353286 A CN 201811353286A CN 109462506 B CN109462506 B CN 109462506B
- Authority
- CN
- China
- Prior art keywords
- information
- node
- state
- data
- propagation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000000605 extraction Methods 0.000 title claims abstract description 12
- 230000002860 competitive effect Effects 0.000 claims abstract description 55
- 238000011161 development Methods 0.000 claims abstract description 15
- 230000007480 spreading Effects 0.000 claims abstract description 14
- 238000004088 simulation Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 230000007704 transition Effects 0.000 claims description 56
- 239000011159 matrix material Substances 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 36
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 230000005540 biological transmission Effects 0.000 claims description 18
- 230000000644 propagated effect Effects 0.000 claims description 12
- 238000009792 diffusion process Methods 0.000 claims description 11
- 230000001902 propagating effect Effects 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013075 data extraction Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 5
- 230000008901 benefit Effects 0.000 claims description 4
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 abstract description 3
- 230000015572 biosynthetic process Effects 0.000 abstract 2
- 239000000284 extract Substances 0.000 abstract 1
- 238000005315 distribution function Methods 0.000 description 9
- 230000006399 behavior Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 208000035473 Communicable disease Diseases 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000005290 field theory Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 241000079527 Ziziphus spina-christi Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Mathematical Optimization (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提出了一种在线社交网络数据竞争性信息提取传播工作方法,包括如下步骤:S1,获取在线社交网络信息数据,S2,建立竞争性信息传播概率模型,S3,建立竞争性信息宏观传播模型;S4,将在线网络数据经过宏观传播模型筛选后的数据进行网络数据稳定性分析;S5,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;S6,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。
Description
技术领域
本发明涉及大数据分析,尤其涉及一种在线社交网络数据竞争性信息提取传播工作方法。
背景技术
随着移动互联网的发展、5G时代的来临,在线社交网络越来越流行,人们的日常工作和生活已经离不开这些社交网络,随之产生的大量信息也充斥着网络,无论是谣言还是商品广告信息等都会在网络上蔓延,因而了解信息背后的传播机理能够帮助人们更好地管理和控制网络上信息的传播。
在线社交网络上的信息传播在诸多因素的影响下进行演化,既包括传播速度和扩散范围的演化也包括信息自身内容的演化。影响因素有很多,但归结起来不外乎信息自身特征、传播信息的网络用户的特征与行为、承载信息传播的社交网络的拓扑结构,以及信息传播的宏观环境。此外,社交媒体上信息传播有时还受到社会媒体服务所提供的信息推送功能的影响,比如Facebook的News Feed、新浪微博的即时推、腾讯视频的消息推荐等。这几个方面是在线社交网络中信息传播的关键因素,它们共同决定了信息传播与演化的行为与模式。
基于传染病的多信息建模方法是从用户的角度出发,认为用户以一定概率传播事件信息,传染病模型是信息传播领域公认比较成熟的模型,传统模型有SI、SIR、SIS,其中SIR模型是将人群分为易感者S状态、感染者I状态和治愈者R状态,信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定态。SIS和SIR模型产生了很多变体,如SIRS、SIDR和SAIR。但是这些模型均无法反映S状态节点转化为I状态节点之前有一个潜伏期的事实,为此将潜伏状态引入SIR模型,产生了SEIR模型。在此基础上,为了刻画信息传播中广泛存在的点到群的传播模式,提出了e-SEIR模型。随着研究工作的不断深入,传染病模型在许多实际应用领域得到了进一步的发展,例如,研究新产品在社交网络中扩散的Bass-SIR模型,恢复时间是幂律分布的SIR生命动力学模型,基于情感交流的HIT-SCIR模型和具有两个时滞和垂直转移的SEIRS模型。
但是,这些研究工作基本上都是将网络信息抽象为一种单一信息或同一类型的多信息在在线社交网络上传播,但现实网络中往往存在多种类型信息同时传播的情形,这些信息间可能具有合作或竞争的关系,即呈现出正相关或负相关的外在表现。现有技术所构造的模型无法实现相应的关联关系。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种在线社交网络数据竞争性信息提取传播工作方法。
为了实现本发明的上述目的,本发明提供了一种在线社交网络数据竞争性信息提取传播工作方法,包括如下步骤:
S1,获取在线社交网络信息数据,对于A信息数据处于在线社交网络上传播扩散时,匹配B竞争性的信息数据来抑制A信息数据的蔓延,遏制A信息的进一步传播扩散,对A信息数据和B信息数据进行竞争性信息数据分析;
S2,建立竞争性信息传播概率模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;
S3,建立竞争性信息宏观传播模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;
S4,将在线网络数据经过宏观传播模型筛选后的数据进行网络数据稳定性分析,从而提高网络信息数据发展趋势的准确度;
S5,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;
S6,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。
所述的在线社交网络数据竞争性信息提取传播工作方法,优选的,所述S1包括:
S1-1,假设在竞争性信息传播模型中,网络上同时存在A信息数据和B信息数据两种不同类型的信息,随着时间的变化进行竞争性传播;
S1-2,按信息传播过程中网络节点所处的状态,可将网络节点划分为四类,分别为未传播任何信息节点的S状态、已经收到A信息并积极传播的节点的IA网络状态、已经收到B信息并积极传播的节点的IB网络状态、已失去信息传播兴趣对所有信息持抵制态度的遗弃状态节点的R状态。
所述的在线社交网络数据竞争性信息提取传播工作方法,优选的,所述S2包括:
S2-1,设置邻接矩阵,该邻接矩阵表示网络节点之间的邻接关系,在线社交网络抽象为一个无向图,则邻接矩阵D是一个N阶方阵,其元素为
网络中某节点的邻边数量称为该节点的度,用k表示。网络拓扑结构的邻接矩阵表示方法与节点度表示方法二者本质上是等价的。邻接矩阵D与节点i的度ki满足如下函数关系式;
邻接矩阵二次幂D2的对角元素就是节点i的邻边数,即节点i的度。
所述的在线社交网络数据竞争性信息提取传播工作方法,优选的,所述S3包括:
S3-1,对于在线社交网络数据的传播初始状态是网络中所有节点均处于未传播任何信息状态,即S状态;在某时刻由外部事件信息所引发的A信息和B信息同时注入网络,随即在网络上分别沿各自的数据传播路径进行扩散传播,被A信息覆盖的节点处于IA状态,被B信息覆盖的节点处于IB状态,当两种类型的信息在IA状态或IB状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触数据并逐渐形成遗忘数据或者不活跃数据,转化为R状态;最终,在线社交网络数据将处于稳定状态,在整个信息传播过程中,A信息和B信息之间相互博弈、对抗竞争和持续影响。
所述的在线社交网络数据竞争性信息提取传播工作方法,优选的,所述S4包括:
S4-1,对于CISIR信息传播模型微分方程组,将四个方程两端分别相加,得
从而使模型满足
S(t)+IA(t)+IB(t)+R(t)=N,其中N为常数,
根据不含R状态下的计算方法,得到如下公式:
假设在t时刻网络达到平衡点,那么网络将处于平衡态,因此有
所述的在线社交网络数据竞争性信息提取传播工作方法,优选的,所述S5包括:
S5-1,根据转移概率矩阵P,考虑某个S状态节点同时存在na个IA状态、nb个IB状态的邻居节点,则以λ1为横轴、λ2为纵轴,以S状态节点成功接收到某一类型信息导致状态转移的概率为竖轴,绘制了S状态节点转移概率随λ1,λ2,na,nb的变化关系图;
S5-2,转移概率随λ1,λ2的增加呈线性增长,随na,nb的增加呈指数快速增长,当λ1>λ2时,节点向IA状态转移,反之,向IB状态转移,在na=10,nb=2情形下,S状态节点向IA状态转移的概率很快达到1,当节点只接触到某一种信息,即λ1=0或λ2=0时,节点只向接触到的这种类型信息的节点状态转变;
S5-3,节点在信息竞争中向对方状态转移的概率随θ1,θ2的增加呈线性增长,随na,nb的增加呈指数快速增长,在na=10,nb=2情形下,竞争使节点转移到IA状态的概率远高于转移到IB状态的概率,当在线社交网络数据信息中一类数据信息占有绝对优势时,信息竞争行为消失,即θ1=0或θ2=0,传播节点将快速向某一种状态单方向转化,整个网络舆论迅速统一。
所述的在线社交网络数据竞争性信息提取传播工作方法,优选的,所述S6包括:
S6-1,根据传播模型所提取的在线社交网络数据,度k的分布服从幂律分布P(k)~αk-γ,γ为常量,无标度网络的平均路径长度较小,聚类系数也较小;
S6-2,在整个传播过程中,节点的状态不断改变,每一时刻节点处于某一状态,那么不同的状态在往下一状态转化时其处理过程是不同的;
S6-3,当节点当前状态为未传播任何信息的S状态时,节点在某一时刻接收不到任何信息,那么节点状态保持不变;当只接收到某一类型的信息,然后以一定的传播概率进行传播,当同时接收到两类信息,那么将对两类信息的传播可能性进行讨论和比较,因此,需分三种情况进行处理。
A.当只接收到信息A时,
B.当只接收到信息B时,
C.当同时接收到A信息和B信息两类信息时,需要更进一步的判断处理,对两类信息的传播可能性进行比较。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
提出的竞争性信息宏观传播模型CISIR是合理、有效的,为解决在线社交网络上不同类型信息的竞争性传播这一类问题提供了一种新的科学方法和研究途径,具有较高的应用价值,能够很好地描述复杂网络的传播特性,通过该CISIR概率模型挖掘出在线网络数据的正相关关联数据,对于数据收集整理提供了极大的帮助,形成独特的数据流分析效果,同时对于在线网络数据的各项信息因素在传播中所具有的影响力提供了初步判断,并发现该信息因素的发展规律。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明数据结构节点状态转换示意图;
图2是本发明节点状态转化过程图;
图3是本发明S状态节点与IA,IB状态节点信息交互关系;
图4是本发明概率模型下的数值模拟示意图;
图5是本发明在线社交网络数据相对趋势变化示意图;
图6是本发明传播节点竞争转移和遗弃转移的变化趋势图;
图7是本发明S状态节点的转化算法流程图;
图8是本发明IA状态节点的转化算法流程图;
图9是本发明传播过程流程图;
图10是本发明方法流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明是基于在线社交网络的竞争性信息宏观传播模型CISIR(CompetitiveInformation Susceptible Infected Recovered)提出的技术方案。
假设在竞争性信息传播模型中,网络上同时存在A信息和B信息两种不同类型的信息,随着时间的变化进行竞争性传播。按信息传播过程中网络节点所处的状态,可将节点划分为四类,分别为未传播任何信息节点(S状态)、已经收到A信息并积极传播的节点(IA状态)、已经收到B信息并积极传播的节点(IB状态)、已失去信息传播兴趣对所有信息持抵制态度的遗弃状态节点(R状态)。
如图1-3所示,λ1和λ2分别表示A信息和B信息的信息传播概率,刻画一个未传播任何信息状态下的节点对某种类型信息的响应程度,传播率越高,表示该节点有更高的可能性去选择传播该条信息。δ1和δ2分别表示对A信息和B信息的遗弃率,随着时间的推移,节点会逐渐对传播过的信息失去兴趣,在沉寂中慢慢遗忘。θ1和θ2分别表示A信息和B信息的置换率,即相互影响力,θ1越大,则表示B信息的吸引力更大,能把传播A信息的节点状态转化为传播B信息;反之,θ2越大,则表示A信息的吸引力更大,能把传播B信息的节点状态转化为传播A信息。
如图10所示,本发明提供了一种在线社交网络数据竞争性信息提取传播工作方法,包括如下步骤:
S1,获取在线社交网络信息数据,对于A信息数据处于在线社交网络上传播扩散时,匹配B竞争性的信息数据来抑制A信息数据的蔓延,遏制A信息的进一步传播扩散,对A信息数据和B信息数据进行竞争性信息数据分析;
S2,建立竞争性信息传播概率模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;
S3,建立竞争性信息宏观传播模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;
S4,将在线网络数据经过宏观传播模型筛选后的数据进行网络数据稳定性分析,从而提高网络信息数据发展趋势的准确度;
S5,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;
S6,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。
由上述转化规则可知,网络节点的状态空间C={S,IA,IB,R},每一个节点的状态转换是一个相对随机的过程,下一时刻的状态与该节点的历史状态无关,只与当前状态有关,也就是说节点的“将来”不依赖于“过去”,仅由“现在”决定,整个传播过程可以看成一个马尔可夫随机过程。因此,可用分布函数来描述节点状态转换的马尔可夫性,用X表示节点状态转换的随机变量,随机过程{X(t),t∈T}的状态空间为C,T为离散的时间序列集合,在条件X(ti)=xi,xi∈C下,X(tn)的条件分布函数恰等于在条件X(tn-1)=xn-1下X(tn)的条件分布函数,即
因此,竞争性信息传播过程本质上是每一个网络节点在状态空间C中不断进行状态转换的马尔可夫链。节点从状态u迁移到状态v的转移概率记为pij。
pij=P{X(tn)=v|X(tn-1)=u} (14)
由此可获得转移概率矩阵P。
X(tn)的状态
将竞争性信息传播模型的节点状态规则代入(15)式,则转移概率矩阵P可简化为
X(tn)的状态
在竞争性信息传播过程,一个节点从S状态X(ts)=S出发,在ti时刻转化为IA状态X(ti)=IA或IB状态X(ti)=IB,再经过若干个时间步的竞争,最后在tn时刻转化为R状态X(tn)=R,从此退出竞争而节点状态不再改变,直至传播过程结束,如图3所示。
在t∈(ti,tn)期间,由于A信息和B信息相互竞争,一个IA状态节点可能转化为IB状态,或者一个IB状态节点可能转化为IA状态。在这个随机过程中,转移概率矩阵P只与节点状态和时间t有关,因此,竞争性信息传播过程是齐次的马尔可夫链,根据C-K方程(Chapman-Kolmogorov Equation)可知,节点状态的n步转移概率矩阵P(n)为P(n)=Pn。
也就是说,竞争性信息传播过程中,n步转移概率矩阵P(n)是一步转移概率矩阵P的n次方。从而可知,竞争性信息传播过程中网络节点状态的分布可由初始分布与一步转移概率完全确定。
提出的宏观CISIR概率模型
网络节点的转移概率不仅与信息传播率λ1,λ2、信息遗弃率δ1,δ2、信息置换率θ1,θ2有关,而且与网络拓扑结构关系密切,对于网络拓扑结构有两种表示方式:
1)邻接矩阵;
2)节点度。
邻接矩阵表示了网络节点之间的邻接关系,本模型中将在线社交网络抽象为一个无向图,则邻接矩阵D是一个N阶方阵,其元素为
网络中某节点的邻边数量称为该节点的度,用k表示。网络拓扑结构的邻接矩阵表示方法与节点度表示方法二者本质上是等价的。邻接矩阵D与节点i的度ki满足如下函数关系式。
(18)式中,邻接矩阵二次幂D2的对角元素就是节点i的邻边数,即节点i的度。
下面分别考虑节点在不同状态下的转换概率。
1)S→IA,IB,节点从S状态转化为IA,IB状态。
假设t时刻一个S状态节点i同时与多IA,IB状态传播节点相邻,如图3所示,S状态节点与IA,IB状态节点信息交互关系。
每一个IA状态节点成功将自身持有的A信息传播给节点i的概率为λ1,传播不成功的概率为1-λ1,如果相邻的所有IA状态节点均传播不成功的概率为λSS1,则t时刻λSS1(t)表示为
(19)式中,表示t时刻节点j为IA状态的概率。
同理,可得节点i的邻居节点中所有IB状态节点均传播不成功的概率λSS2为
(20)式中,表示t时刻节点j为IB状态的概率。
综合(19),(20)式可知,t时刻节点i无法接收到任何信息的概率λSS为
t时刻网络上S状态节点个数为S(t),用表示S状态节点无法接收到任何信息的概率的期望值,则
实际上,也表示S状态节点在下一时刻仍保持为S状态的概率,也就是转移概率矩阵P中的转移概率p11,即
由(19),(20)式易知,S状态节点转化为IA,IB状态的转移概率p12,p13可表示为
2)IA,IB→R,节点从IA,IB状态转化为R状态。
处于IA,IB状态的节点,随着时间的推移,节点会逐渐对信息失去兴趣,慢慢遗忘,IA,IB状态节点对信息的遗弃率分别为δ1,δ2。由于IA,IB状态节点转化到R状态与R状态节点无关,仅由IA,IB状态节点的遗弃率决定。因此,转移概率矩阵P中的转移概率p24,p34可取值为
p24=δ1 (26)
p34=δ2 (27)
3)IA→IB、IB→IA,节点从IA状态转化为IB状态,或从IB状态转化为IA状态。
在信息传播过程中,一个IA状态节点和一个IB状态节点进行竞争,在下一时刻都希望对方转化为本方相同的状态,这种竞争力度的大小取决于各自的置换率θ1,θ2。当t时刻在线社交网络上同时存在多个IA和IB状态节点,分别用IA(t),IB(t)表示它们的数量。根据1)中类似的方法,推导出转移概率矩阵P中的转移概率p22,p23,p32,p33分别为
至此,将各种状态之间的转移概率代入(15)式,即把转移概率矩阵P表示为:
将一个节点i的状态表示为则S,IA,IB,R状态节点的状态取值分别为(1,0,0,0)T,(0,1,0,0)T,(0,0,1,0)T,(0,0,0,1)T。因此,节点的状态变量是离散形随机变量,因而有节点在t时刻属于某一状态的概率可表示该种状态的数学期望,如式(33)所示。
其中,分别表示t时刻节点i属于S,IA,IB,R状态的概率,一个节点在某一时刻一定属于四种状态中的其中一种,因此,一定满足概率的规范性和可列可加性,即
根据移概率矩阵P,结合(33)式,通过平均场理论得到CISIR概率模型:
dij为网络节点邻接矩阵D中第i行第j列的取值。
由概率模型可见,竞争性信息传播过程中网络节点状态转化不仅与信息传播率λ1,λ2、信息遗弃率δ1,δ2、信息置换率θ1,θ2有关,而且还受到网络结构的影响。
宏观传播模型就是用统计的方法从系统层面去构建CISIR信息传播过程的模型。传播初始状态是网络中所有节点均处于未传播任何信息状态,即S状态;在某时刻由外部事件引发的A信息和B信息同时注入网络,随即在网络上分别沿各自的传播路径进行扩散传播,被A信息覆盖的节点处于IA状态,被B信息覆盖的节点处于IB状态,当两种类型的信息在IA状态或IB状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触心理并逐渐遗忘,转化为R状态,最终,网络系统将处于一个稳定状态。在整个信息传播过程中,两种类型信息之间相互博弈、对抗竞争和持续影响。容易看出,这种传播方式本质上属于竞争性信息同步传播模式。
在现实环境中,更多的情况属于竞争性信息异步传播模式,在t1时刻A信息出现在网络上并迅速扩散传播,被A信息覆盖的节点处于IA状态;在某一时刻ti,B信息也在网络上传播,被B信息覆盖的节点处于IB状态,B信息会抑制A信息的进一步蔓延,甚至有可能会取代A信息,即能够使IA状态节点转化为IB状态,当然,竞争过程中也存在IB状态节点转化为IA状态的情形;随着时间的推移,节点逐渐转化为R状态,最终,网络系统会达到一个稳定状态。
从竞争性信息异步传播模式可以看出,信息传播过程被划分为两个阶段,第一阶段是网络上只有A信息的单一信息传播阶段,第二阶段是网络同时存在A信息和B信息的信息竞争传播阶段。在单一信息传播阶段,CISIR模型退化为普通SIR模型,此时网络节点的状态转换关系如图3所示为单一信息传播阶段的节点状态转换关系。
在传播过程的第二阶段,即信息竞争传播阶段,传播行为与竞争性信息同步传播模式相同。
假设在线社交网络是一个封闭网络,信息在网络中产生,而且仅在该网络中传播,期间网络上节点总量为N是稳定的,每个时刻变化的是网络中各种状态类型节点所占的比例。t时刻网络中S,IA,IB,R状态节点的数量分别为S(t),IA(t),IB(t),R(t)。用表示一个节点在某一时刻的状态,对于整个网络则有
其中,S(t)+IA(t)+IB(t)+R(t)=N。
根据平均场理论,CISIR信息传播宏观模型在在线社交网络中传播演化过程可表示成微分方程组所示:
λ1,λ2分别表示A信息、B信息的传播率;θ1,θ2分别表示A信息、B信息被对方信息取代的置换率;δ1和δ2分别表示节点对A信息、B信息的遗弃率。
容易看出,宏观CISIR概率模型揭示了内在传播规律和演化机制。
形成模型稳定性分析方法,在受到的在线社交网络数据扰动作用消除后,经过一段过渡过程以后能否回到原来的平衡状态或足够准确地返回到之前的平衡态。如果系统能够恢复到此前的平衡状态,那么称该系统是稳定的;若扰动消失后系统不能恢复到原来的平衡状态,反而偏差变得更大,则称该系统是不稳定的。
其中步骤3包括:S3-1,对于CISIR信息传播模型微分方程组,将四个方程两端分别相加,得
从而使模型满足
S(t)+IA(t)+IB(t)+R(t)=N,其中N为常数,
根据不含R状态下的计算方法,得到如下公式:
假设在t时刻网络达到平衡点,那么网络将处于平衡态,因此有
优选的,S3-2,用P(k)表示在线社交网络的度分布函数,该分布函数表示选定一个在线社交网络数据信息节点,其度值恰好为k的概率,也就是该节点恰有k条边连接的概率,即公式:
设平衡点E=(S,IA,IB)T,求解上式得到方程组的三个解E0,En,Et,这三个解都是CISIR传播模型的平衡点,E0,En,Et的具体表示分别为:
A,E0=(1,0,0)T,初始状态,无信息传播时的平衡点;
终止状态,信息已经传遍整个网络后的平衡点;
C,在前提下,表示信息在竞争传播过程中,系统达到暂时稳定状态的平衡点;
为了描述的方便,对
中的部分表达式进行变量替换,令
然后再对
的每个变量求偏导数,得到方程组的对应矩阵:
设平衡点E=(S,IA,IB)T,求解上式得到方程组的三个解E0,En,Et,这三个解都是CISIR传播模型的平衡点,E0,En,Et的具体表示分别为:
S-A,E0=(1,0,0)T,初始状态,无信息传播时的平衡点;
S-B,终止状态,信息已经传遍整个网络后的平衡点;
S-C,在前提下,表示信息在竞争传播过程中,系统达到暂时稳定状态的平衡点;
为了描述的方便,对
中的部分表达式进行变量替换,令
其中,μ1为A信息传播率与在线社交网络的度分布函数的乘积,μ2为B信息传播率与在线社交网络的度分布函数的乘积,v1为A信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,v2为B信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,
然后再对
的每个变量求偏导数,得到方程组的对应矩阵:
对于S-A,当R0<1时,平衡点E0=(1,0,0)T是全局渐近稳定的。
在平衡点E0=(1,0,0)T处,平衡点矩阵J(E0)为
设矩阵的特征多项式为
m3r3+m2r2+m1r+m0=0
求解J(E0)的特征多项式,
解得
由此构造出在平衡点E0处的Routh阵列表
只有当阵列表中第一列系数均为正实数,计算结果才稳定,即
经整理得,
因此,当时,E0平衡点才是稳定的,A信息和B信息所覆盖的节点数量均为零;为了使信息能够在网络上传播扩散,将参数设定必须满足条件,那么A信息和B信息才会在网络上传播,系统最终达到一个非零平衡点,使网络重新达到稳定态;
S-B,在平衡点处,
J(En)为
同理得,J(En)的特征多项式为
解得
由此构造出在En点处的Routh阵列表
由表En第三行与第四行的第一列系数不可能同时为正数,因此,根据Routh-Hurwitz稳定性判据,系统在平衡点En处是不稳定的;说明当信息传遍整个网络后,网络同时存在信息A和信息B是不稳定的,受随机性影响,两种类型信息之间的替代行为会出波动,只有当其中一种类型信息完成抑制和替代了另一种类型信息之后,系统才会回到稳定状态,即En=(0,0,N)T或En=(0,N,0)T的情况;
S-C,在平衡点Et处,
考察系统在平衡点处,J(Et)为
同理可得,J(Et)的特征多项式为
|rI-J(Et)|=0
解得
由此可构造出在Et点处的Routh阵列表,
由Routh-Hurwitz稳定性判据和表Et可知,当系统满足(56)式约束条件时,系统在平衡点En处是局部稳定的。
上式看出,这是一个非常强的约束条件,一般情况下难以满足,说明网络上信息一旦开始传播,不借助外力干预很难立即停止信息的传播扩散行为。
如果网络上同时传播两种类型信息,其中一种类型信息对另一种类型信息形成完全压制之势,比如B信息在竞争中处于绝对优势,那么B信息被A信息替代的概率几乎为零,可认为是零概率事件,即置换率θ2=0,此时(56)式可简化为
系统稳定性条件更难满足,说明网络上两种类型信息竞争过程中,如果其中一种类型信息取得了传播主导地位,那么该信息会更加迅速的进行传播扩散和替代另一种类型信息。
S1,获取在线社交网络数据,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;
S2,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。
在网络系统中,未传播任何信息的S状态节点,要转化为传播信息的IA或IB状态节点,与两个因素有关。一是传播率λ1,λ2,体现了人们主动传播信息的意愿大小;二是网络拓扑结构,即S状态节点的邻居节点中存在IA或IB状态节点的数量,体现了可能接收到信息的路径多寡。为了观察这两个因素对节点状态转化的影响,根据转移概率矩阵P,考虑某个S状态节点同时存在na个IA状态、nb个IB状态的邻居节点,则以λ1为横轴、λ2为纵轴,以S状态节点成功接收到某一类型信息导致状态转移的概率为竖轴,绘制了S状态节点转移概率随λ1,λ2,na,nb的变化关系图,其中na,nb分别取(1,1),(5,5),(10,2),(2,10),(0,5),(5,0),结果如图8所示。
由图4A-4D可见,转移概率随λ1,λ2的增加呈线性增长,随na,nb的增加呈指数快速增长,如λ1>λ2时,节点向IA状态转移,反之,向IB状态转移。由图4C,图4D容易看出,邻居节点的数量可大大提高转移概率的权重,在na=10,nb=2情形下,S状态节点向IA状态转移的概率很快达到1。说明在信息传播率一定的情况下,只要邻居节点中的处于信息传播状态的节点足够多时,那么该节点状态转移可看成是必然事件。当节点只接触到某一种信息,即λ1=0或λ2=0时,模型退化为传统SIR模型,节点只向接触到的这种类型信息的节点状态转变。
系统中相邻节点处于不同信息传播状态时,比如一对邻居节点中其中一个节点处于IA状态,另一个节点处于IB状态,此时必将引起信息竞争,双方都希望用自身获取的信息去覆盖对方节点,驱赶对方原有信息。这种竞争力度的大小与信息置换率θ1,θ2和网络结构有关,在考虑邻居接点na,nb的情形下,na,nb分别取(1,1),(5,5),(10,2),(2,10),(0,5),(5,0),以θ1为横轴、θ2纵轴、p23与p32之差的绝对值为竖轴绘图,体现出的相对变化关系如图5A-5F所示。
由图5A-5F可见,节点在信息竞争中向对方状态转移的概率随θ1,θ2的增加呈线性增长,随na,nb的增加呈指数快速增长。从图4C-4D可以看出,网络结构对节点间的竞争关系影响重大,在na=10,nb=2情形下,竞争使节点转移到IA状态的概率远高于转移到IB状态的概率。当网络某种信息占有绝对优势时,信息竞争行为消失,即θ1=0或θ2=0,传播节点将快速向某一种状态单方向转化,整个网络舆论迅速统一,如图5E-5F所示。
传播节点在受信息竞争影响的同时,也受节点本身信息遗弃率δ1,δ2的影响。比如一个IA状态节点受竞争影响可能转化为IB状态,也可能受遗忘效应的影响转化为R状态。对于IA状态节点,将θ1视为横轴、δ1为纵轴、节点发生状态转移的概率为竖轴绘图,这种节点状态转移变化关系如图10所示,对于IB状态节点具有相似的变化关系。
由图6可见,一个IA状态传播节点转化为R状态的概率与遗弃率δ1呈线性关系;转化为IB状态的概率与置换率θ1呈指数关系,其主要原因仍然是受到网络结构的影响。当δ1,θ1两者比较小的状态下,节点保持原有状态,不进行转化。传播节点以遗弃率为概率从传播状态转化为R状态,一旦转化为R状态后就不再参与信息竞争。
小世界网络模型用来生成现实世界的人际网络或社交网络的一些特征,此类网络中每对节点间平均距离非常短,同时又具有较高的聚类系数。
小世界网络属于均匀网络,度分布服从幂律分布P(k)~αk-γ,γ为常量,一般2<γ≤3,这种网络就称为无标度网络。此种网络最大的特点就是异质性,网络中大部分节点只与很少的其他节点相连接,而只有小部分节点与非常多的其他节点相连接。无标度网络的平均路径长度较小,聚类系数也较小。
首先给定initNodeNum=40个节点组成的最近邻耦合网络,然后每次加入一个新节点,新节点通过newLinks=30条新加入的边与网络中已有节点相连,新加入节点与已存在节点相连接的概率正比于已有节点的度。网络构建完成后,对节点度进行统计,发现该网络的度分布呈现以P(k)~20k-3幂律分布,
CISIR模型提供了信息传播过程中节点状态转换的规则,将这些规则分别应用到小世界网络和无标度网络开展传播过程模拟实验,输出传播过程中每个时刻网络状态的变化情况。
在整个传播过程中,节点的状态不断改变,每一时刻节点处于某一状态,那么不同的状态在往下一状态转化时其处理过程是不同的,下面将分别介绍不同状态节点的转化算法。
如图7所示,1)对于在线社交网络数据选取未传播任何信息节点的S状态的节点i,收集在线社交网络数据节点i收到A信息并积极传播的节点的IA网络状态的邻居节点数量IANum,同时收集在线社交网络数据节点i收到B信息并积极传播的节点的IB网络状态的邻居节点数量IBNum,收集完毕IAnum和IBnum之后,计算未传播任何信息节点的S状态向IA状态转换的转移概率和未传播任何信息节点的S状态向IB状态转换的转移概率然后生成原始随机数Prand∈(0,1),将转移概率和进行比较;
当时执行Prand和比较步骤,如果则在线网络数据节点i转化为IA状态,如果则在线网络数据节点i不发生变化;
当时执行Prand和比较步骤,如果则在线网络数据节点i转化为IB状态,如果则在线网络数据节点i不发生变化;
当时,读取在线社交网络数据信息偏好权重系数η,执行和比较步骤,如果则执行Prand和比较步骤,如果则在线网络数据节点i转化为IA状态,如果则在线网络数据节点i不发生变化;
如果则执行Prand和比较步骤,如果则在线网络数据节点i转化为IB状态,如果则在线网络数据节点i不发生变化;
上述步骤比较完毕后结束该步骤。
当节点当前状态为未传播任何信息的S状态时,节点在某一时刻接收不到任何信息,那么节点状态保持不变;当只接收到某一类型的信息,然后以一定的传播概率进行传播,当同时接收到两类信息,那么将对两类信息的传播可能性进行讨论和比较,因此,需分三种情况进行处理。
A.当只接收到信息A时,
B.当只接收到信息B时,
C.当同时接收到A信息和B信息两类信息时,需要更进一步的判断处理,对两类信息的传播可能性进行比较。
2)当节点当前状态为传播A信息的IA状态时,该节点有一定的遗弃率转化为R状态,同时还以一定的概率被B信息所取代而转化为IB状态。
如图8所示,首先选取IA状态的在线社交网络数据节点i,生成第一随机数Prand1∈(0,1),判断是否Prand1<δ1,如果是,则执行在线社交网络数据节点i转化为所有信息持抵制态度的遗弃状态节点的R状态,如果否,则统计在线社交网络数据节点i的IB状态的邻居节点数量IBNum,计算IA向IB转换的转移概率生成第二随机数Prand2∈(0,1),判断是否如果是,则执行在线社交网络数据节点i转化为IB状态,如果否,则执行在线社交网络数据节点i保持不变。
其中,δ1表示对A信息的遗弃率,
3)当节点当前状态为传播B信息的IB状态时,其转换规则与2)类似,需同时考虑遗弃率和置换率。
首先选取IB状态的在线社交网络数据节点i,生成第三随机数Prand3∈(0,1),判断是否Prand3<δ2,如果是,则执行在线社交网络数据节点i转化为所有信息持抵制态度的遗弃状态节点的R状态,如果否,则统计在线社交网络数据节点i的IA状态的邻居节点数量IANum,计算IA向IB转换的转移概率生成第四随机数Prand4∈(0,1),判断是否如果是,则执行在线社交网络数据节点i转化为IA状态,如果否,则执行在线社交网络数据节点i保持不变。
其中,δ2表示对B信息的遗弃率,
4)若节点状态为R状态,表明该节点已退出信息传播过程,属于最终状态而不再转化。
根据设定的实验参数,B信息强度大于A信息,其目的是观察强度更大的B信息能否在竞争中覆盖掉A信息。首先在t=0时发布A信息,该信息在网络中迅速扩散传播,被A信息覆盖的节点数峰值高达4541人,覆盖率为91%;然后在t=5时发布B信息,B信息紧接着在接下来的6个时间步内与A信息竞争;在t=11时,网络上A信息占绝对优势,覆盖率为86%,对B信息的传播扩散进行了有效抑制和替代。
如图9所示,对于在线社交网络数据进行竞争性信息传播过程包括:
S-A,将在线社交网络数据进行初始换,将全部的在线社交网络数据节点i设置为S状态;
S-B,将发布的A信息中随机选取若干节点,设置为IA状态;将发布的B信息中随机选取若干节点,设置为IB状态;
S-C,统计相应的S状态的节点数为SCount、IA状态的节点数为IACount,IB状态的节点数为IBCount,判断是否满足如下条件:
(IACount>>IBCount或IBCount>>IACount)and SCount≈0,如果是,则结束进程,如果否,则设置节点i的计数器等于1,如果在线社交网络数据节点大于等于1,则选取第i个节点,判断节点i的状态;
S-D,当节点i为IA状态时,则执行IA状态节点的转化方法,当节点i为S状态时,则执行S状态节点的转化方法,当节点i为IB状态时,则执行IB状态节点的转化方法,全部方法执行完毕之后,更新节点i的计数器加1,直到达到在线社交网络数据全部的节点数。
为了进一步考察A,B信息竞争中相互置换对方的剧烈程度,统计每一个时间步内IA,IB状态节点向对方状态转化的数量,B信息发布后经过一个时间步的扩散传播后,随即开始大规模置换A信息。在最终状态下,两种类型信息间相互置换对方的节点数量占网络节点总数量4%左右。
无标度网络上B信息对A信息置换强度更大,速度更快。说明在无标度网络上,信息十分活跃,传播速度快、范围广,这是由于二个原因引起的。一是无标度网络与同等规模的小世界网络相比,具有更小的平均路径长度;二是无标度网络具有异质性,网络节点度分布严重的不均匀性引起。
B信息发布的时间早晚,决定了A信息传播扩散的范围,也就是说,B信息在网络中开始传播时,网络中节点的传播状态分布会因其相对A信息滞后发布程度的不同而有很大不同。
再用同样的实验方法和实验参数在无标度网络上进行仿真,为了更清晰地展现A信息被抑制的情况,分别单独给出了不同时间间隔的控制信息发布时间点下A信息、B信息的传播情况,
在无标度网络上,不管是同步竞争传播模式,还是异步竞争传播模式,对A信息控制和抑制效果都是类似的,仅仅是在抑制的速度和A信息残留的数量上略有差别。
B信息发布时刻不同,A信息竞争的初始传播覆盖范围就会不同,A信息竞争的初始传播扩散范围会随着B信息发布时间间隔的增长呈一个类似对数函数的增长态势,B信息发布时间间隔越长,A信息的覆盖范围越大,增长也越发平稳。因此,如果想通过B信息的发布去抑制A信息的传播,则需要尽早发布,当一个信息在网络上蔓延时,对其控制的措施要及时,等到蔓延的范围很广时,管控该信息所付出的成本将大大提高。
真实统计数据中B信息的传播数据出现两次峰值Q1,Q2点,与仿真结果数据差异较大,是因为在真实在线社交网络中,网民规模巨大而且是开放的系统,导致Q1点传播峰值极高;而CISIR模型的实验网络规模较小而且是封闭的,不可能产生这种奇点。Q2峰值的出现是由于官方部门对该事件的后续处理并发布相关信息所造成,
在线社交网络上普遍存在同一事件产生的多种不同类型信息同时在网络中传播的情形,这些信息之间往往存在着正相关或负相关的特性,本文提出的CISIR模型主要是为了揭示不同类型信息之间的负相关性,即后发布的信息如何与先前发布的信息进行竞争,最终达到完全抑制先发信息的目的。信息间的竞争是借助于网络节点实现的,本文深入研究了节点状态转换的内部机制,从概率侧面构建了概率模型,考察节点状态随时间不断转化的规律,从统计侧面构建了传播模型,考察不同类型信息在传播过程覆盖面的大小,并通过数值模拟、仿真分析、实证对比一系列实验,证明了该模型的合理性和准确性。可将该模型的研究成果应用到广告定向投放、商品推荐系统、网络传播辟谣和社会舆情引导等领域,与具体应用场景相结合,能够快速地将其转化为生产力。
Claims (5)
1.一种在线社交网络数据竞争性信息提取传播工作方法,其特征在于,包括如下步骤:
S1,获取在线社交网络信息数据,对于A信息数据处于在线社交网络上传播扩散时,匹配B竞争性的信息数据来抑制A信息数据的蔓延,遏制A信息的进一步传播扩散,对A信息数据和B信息数据进行竞争性信息数据分析;
S2,建立竞争性信息传播概率模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;
所建立的竞争性信息传播概率模型为:
dij为网络节点邻接矩阵D中第i行第j列的取值;
其中,分别表示t时刻节点i属于S,IA,IB,R状态的概率,一个节点在某一时刻一定属于四种状态中的其中一种;λ1,λ2分别表示A信息、B信息的传播率;θ1,θ2分别表示A信息、B信息被对方信息取代的置换率;δ1和δ2分别表示节点对A信息、B信息的遗弃率;分别表示t+1时刻节点i属于S,IA,IB,R状态的概率,
S2-1,设置邻接矩阵,该邻接矩阵表示网络节点之间的邻接关系,在线社交网络抽象为一个无向图,则邻接矩阵D是一个N阶方阵,其元素为
网络中某节点的邻边数量称为该节点的度,用k表示;网络拓扑结构的邻接矩阵表示方法与节点度表示方法二者本质上是等价的;邻接矩阵D与节点i的度ki满足如下函数关系式;
邻接矩阵二次幂D2的对角元素就是节点i的邻边数,即节点i的度;
S3,建立竞争性信息宏观传播模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;
竞争性信息宏观传播模型用统计的方法构建竞争性信息传播过程的模型;传播初始状态是网络中所有节点均处于未传播任何信息状态,即S状态;在某时刻由外部事件引发的A信息和B信息同时注入网络,随即在网络上分别沿各自的传播路径进行扩散传播,被A信息覆盖的节点处于IA状态,被B信息覆盖的节点处于IB状态,当两种类型的信息在IA状态或IB状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触心理并逐渐遗忘,转化为R状态,最终,网络系统将处于一个稳定状态;
S4,将在线网络数据经过竞争性信息宏观传播模型筛选后的数据进行网络数据稳定性分析,从而提高网络信息数据发展趋势的准确度;
S5,形成竞争性信息传播概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成竞争性信息传播概率模型的数据趋势,并发送到远程终端;
S6,对于在线社交网络数据进行竞争性信息宏观传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。
2.根据权利要求1所述的在线社交网络数据竞争性信息提取传播工作方法,其特征在于,所述S1包括:
S1-1,假设在竞争性信息传播模型中,网络上同时存在A信息数据和B信息数据两种不同类型的信息,随着时间的变化进行竞争性传播;
S1-2,按信息传播过程中网络节点所处的状态,可将网络节点划分为四类,分别为未传播任何信息节点的S状态、已经收到A信息并积极传播的节点的IA网络状态、已经收到B信息并积极传播的节点的IB网络状态、已失去信息传播兴趣对所有信息持抵制态度的遗弃状态节点的R状态。
3.根据权利要求1所述的在线社交网络数据竞争性信息提取传播工作方法,其特征在于,所述S3包括:
S3-1,对于在线社交网络数据的传播初始状态是网络中所有节点均处于未传播任何信息状态,即S状态;在某时刻由外部事件信息所引发的A信息和B信息同时注入网络,随即在网络上分别沿各自的数据传播路径进行扩散传播,被A信息覆盖的节点处于IA状态,被B信息覆盖的节点处于IB状态,当两种类型的信息在IA状态或IB状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触数据并逐渐形成遗忘数据或者不活跃数据,转化为R状态;最终,在线社交网络数据将处于稳定状态,在整个信息传播过程中,A信息和B信息之间相互博弈、对抗竞争和持续影响。
4.根据权利要求1所述的在线社交网络数据竞争性信息提取传播工作方法,其特征在于,所述S4包括:
S4-1,对于竞争性信息传播模型微分方程组,将四个方程两端分别相加,得
其中四个方程为:
t时刻网络中S,IA,IB,R状态节点的数量分别为S(t),IA(t),IB(t),R(t);用表示一个节点在某一时刻的状态,对于整个网络则有
从而使模型满足
S(t)+IA(t)+IB(t)+R(t)=N,其中N为常数,
根据不含R状态下的计算方法,得到如下公式:
其中,λ1,λ2分别表示A信息、B信息的传播率;θ1,θ2分别表示A信息、B信息被对方信息取代的置换率;δ1和δ2分别表示节点对A信息、B信息的遗弃率;
假设在t时刻网络达到平衡点,那么网络将处于平衡态,因此有
5.根据权利要求1所述的在线社交网络数据竞争性信息提取传播工作方法,其特征在于,所述S5包括:
S5-1,根据转移概率矩阵P,考虑某个S状态节点同时存在na个IA状态、nb个IB状态的邻居节点,则以λ1为横轴、λ2为纵轴,以S状态节点成功接收到某一类型信息导致状态转移的概率为竖轴,绘制了S状态节点转移概率随λ1,λ2,na,nb的变化关系图;
S5-2,转移概率随λ1,λ2的增加呈线性增长,随na,nb的增加呈指数快速增长,当λ1>λ2时,节点向IA状态转移,反之,向IB状态转移,在na=10,nb=2情形下,S状态节点向IA状态转移的概率很快达到1,当节点只接触到某一种信息,即λ1=0或λ2=0时,节点只向接触到的这种类型信息的节点状态转变;
S5-3,节点在信息竞争中向对方状态转移的概率随θ1,θ2的增加呈线性增长,随na,nb的增加呈指数快速增长,在na=10,nb=2情形下,竞争使节点转移到IA状态的概率远高于转移到IB状态的概率,当在线社交网络数据信息中一类数据信息占有绝对优势时,信息竞争行为消失,即θ1=0或θ2=0,传播节点将快速向某一种状态单方向转化,整个网络舆论迅速统一。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811353286.6A CN109462506B (zh) | 2018-11-14 | 2018-11-14 | 一种在线社交网络数据竞争性信息提取传播工作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811353286.6A CN109462506B (zh) | 2018-11-14 | 2018-11-14 | 一种在线社交网络数据竞争性信息提取传播工作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109462506A CN109462506A (zh) | 2019-03-12 |
CN109462506B true CN109462506B (zh) | 2019-08-23 |
Family
ID=65610437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811353286.6A Active CN109462506B (zh) | 2018-11-14 | 2018-11-14 | 一种在线社交网络数据竞争性信息提取传播工作方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109462506B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113946732A (zh) * | 2020-07-15 | 2022-01-18 | 北京信息科技大学 | 官方信息控制下的舆情传播模型研究 |
CN111818633B (zh) * | 2020-07-20 | 2021-09-28 | 西安电子科技大学 | 星型接入网络中的动态节点接纳方法 |
CN112199468B (zh) * | 2020-09-23 | 2022-09-30 | 夏一雪 | 一种大数据环境下网络舆情人工智能决策系统 |
CN112199574B (zh) * | 2020-09-23 | 2022-09-13 | 夏一雪 | 一种大数据环境下网络舆情人工智能预警系统 |
CN112131259B (zh) * | 2020-09-28 | 2024-03-15 | 绿盟科技集团股份有限公司 | 一种相似恶意软件推荐方法、装置、介质和设备 |
CN114628038B (zh) * | 2022-03-11 | 2022-08-26 | 电子科技大学 | 一种基于在线社交网络的skir信息传播方法 |
CN116679301B (zh) * | 2023-07-28 | 2023-10-20 | 西安电子科技大学 | 一种宽带雷达目标距离像快速超分辨重构的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108092832A (zh) * | 2018-02-12 | 2018-05-29 | 山东师范大学 | 一种社交网络病毒信息抑制方法及系统 |
CN108230170A (zh) * | 2017-12-20 | 2018-06-29 | 重庆邮电大学 | 面向社交网络的多信息和多维网络信息传播模型及方法 |
US10129093B1 (en) * | 2014-03-28 | 2018-11-13 | Hrl Laboratories, Llc | Strategic network formation involving information sources, aggregators, and consumers |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091206B (zh) * | 2014-06-18 | 2017-07-28 | 北京邮电大学 | 基于演化博弈论的社交网络信息传播预测方法 |
CN107171835A (zh) * | 2017-05-08 | 2017-09-15 | 浙江大学城市学院 | 一种基于dwm 的社会信息传播与预测的仿真方法 |
CN108540369A (zh) * | 2018-03-06 | 2018-09-14 | 南京邮电大学 | 考虑用户重度传播行为的sndr信息传播过程描述方法 |
-
2018
- 2018-11-14 CN CN201811353286.6A patent/CN109462506B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10129093B1 (en) * | 2014-03-28 | 2018-11-13 | Hrl Laboratories, Llc | Strategic network formation involving information sources, aggregators, and consumers |
CN108230170A (zh) * | 2017-12-20 | 2018-06-29 | 重庆邮电大学 | 面向社交网络的多信息和多维网络信息传播模型及方法 |
CN108092832A (zh) * | 2018-02-12 | 2018-05-29 | 山东师范大学 | 一种社交网络病毒信息抑制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109462506A (zh) | 2019-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109462506B (zh) | 一种在线社交网络数据竞争性信息提取传播工作方法 | |
CN111222029B (zh) | 一种网络舆情信息传播中关键节点选择方法 | |
Jackson et al. | Behavioral communities and the atomic structure of networks | |
CN109376195B (zh) | 用于在线社交网络数据挖掘模型数值机理有效性验证方法 | |
CN108304521B (zh) | 基于演化博弈的微博谣言传播的分析方法与系统 | |
CN106682770A (zh) | 一种基于好友圈子的动态微博转发行为预测系统及方法 | |
CN109727152B (zh) | 一种基于时变阻尼运动的在线社交网络信息传播构建方法 | |
Wu et al. | Public opinion dissemination with incomplete information on social network: A study based on the infectious diseases model and game theory | |
CN111079024B (zh) | 基于加强效应scir网络的舆情传播模型构建方法 | |
CN109408911A (zh) | 一种在cpss下基于acp理论的群体演化方法 | |
CN102982236B (zh) | 一种通过网络用户建模的观点预测方法 | |
CN109727154A (zh) | 一种基于时变阻尼运动的在线社交网络信息传播分析方法 | |
Ding et al. | Asynchronous opinion dynamics with online and offline interactions in bounded confidence model | |
CN112269945B (zh) | 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法 | |
CN111414552B (zh) | 一种在线社交网络谣言传播范围的估计方法 | |
CN109446713B (zh) | 针对在线社交网络数据提取后的稳定性判别方法 | |
CN117057943A (zh) | 一种节点特征感知的时序社交网络影响力最大化方法及系统 | |
Agarwal et al. | Co-virality of competing content over osns? | |
CN109525428B (zh) | 基于在线社交网络数据的竞争性信息传播概率模型挖掘构建方法 | |
CN112256756B (zh) | 一种基于三元关联图和知识表示的影响力发现方法 | |
Wu et al. | Analysis of timescale to consensus in voting dynamics with more than two options | |
CN109410078A (zh) | 一种适用于面向文件共享的移动社交网络的信息传播预测方法 | |
Zhang et al. | Opinion Formation over Clustered Social Networks with Intermittent Communication | |
CN109508443B (zh) | 基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法 | |
Ao et al. | Agents attraction competition in an extended Friedkin-Johnsen social network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220919 Address after: Room 208, 2nd Floor, Harbin Institute of Technology Science and Technology Park Building, No. 434, Deputy Post Street, Nangang District, Harbin City, Heilongjiang Province, 150000 Patentee after: Heilongjiang Shengmou Technology Co.,Ltd. Address before: No.69 Hongguang Avenue, Banan District, Chongqing Patentee before: Chongqing University of Technology |
|
TR01 | Transfer of patent right |