CN114298009B - 混合信息传播动力学模型及其信息传播分析方法 - Google Patents

混合信息传播动力学模型及其信息传播分析方法 Download PDF

Info

Publication number
CN114298009B
CN114298009B CN202210218560.9A CN202210218560A CN114298009B CN 114298009 B CN114298009 B CN 114298009B CN 202210218560 A CN202210218560 A CN 202210218560A CN 114298009 B CN114298009 B CN 114298009B
Authority
CN
China
Prior art keywords
information
forwarding
emotion
comment
propagation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210218560.9A
Other languages
English (en)
Other versions
CN114298009A (zh
Inventor
殷复莲
马瑞
梁彤宇
王锦霞
唐鑫夷
邝清华
夏欣雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN202210218560.9A priority Critical patent/CN114298009B/zh
Publication of CN114298009A publication Critical patent/CN114298009A/zh
Application granted granted Critical
Publication of CN114298009B publication Critical patent/CN114298009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于个体情感交互的混合信息传播动力学模型及其信息传播分析方法,沿用结合两种模型的思路,改进原有的SFI模型,考虑评论对事件传播的影响,将传播群体扩展为转发群体和评论群体。同时利用基于情感词典的分析方法对传播用户观点中所蕴含的情感进行识别,将观点动力学延拓至情感动力学并融合信息传播动力学,从而建立了基于个体情感交互的混合信息传播动力学模型,可以有效分析出传播用户情感传播的一般模式,并在一定程度上预测受相关衍生事件影响后用户再度参与信息传播的情感演变态势。

Description

混合信息传播动力学模型及其信息传播分析方法
技术领域
本发明涉及模型构建技术领域,更为具体地,涉及一种基于个体情感交互的混合信息传播动力学模型及该模型进行信息传播分析的方法。
背景技术
自传染病模型成功解释生物疾病的传播规律以来,人们不断将传染病模型进行推广,并且在多个领域都取得了良好的成果。在传染病模型的研究中,最为经典的是SIR(Susceptible-Infected-Recovered)模型,在SIR模型中,人群被划分为三类:易感者、感染者和治愈者。在SIR模型基础上发展出的SFI(Susceptible-Forwarding-Immune)模型是SIR模型在信息传播领域的应用,聚焦还未接触事件但对事件可能产生兴趣的易感者、知晓事件信息并产生转发行为的转发者,和对事件已经不感兴趣或失去影响力的免疫者,利用已知的真实信息数据预测事件的传播趋势。
信息传播是用户进行观点交流的过程,而观点是影响用户做出传播行为的重要因素,观点动力学试图从微观个体间的意见交互来解释宏观群体间意见的形成机理。目前主流的观点动力学模型被分成离散模型和连续观点模型。在离散模型中,个体的观点只有赞成和反对两种情况,Sznajd模型是离散模型的典型代表;连续观点动力学中个体的观点值是一定范围内的连续数值,经典模型有DW(Deffuant-Weisbuch)模型和HK(Hegselmann–Krause)模型。
许多学者在将观点动力学与信息传播动力学相结方面进行了研究。例如,Liang等人基于吸收定律和改进的信任传播与聚集方法,结合改进的SIR模型和HK模型调查了网络社区之间的观点对于公共信息传播的影响。中国专利申请CN108540369A公开的一种考虑用户重度传播行为的SNDR信息传播过程描述方法,结合用户重度传播行为将用户分为4类节点,结合上述划分节点,建立SNDR信息传播模型,根据该模型对信息传播过程进行描述,针对感染概率固定,并考虑由于主观或者利益因素导致的在微博社交网络中传播用户群体中进行深度传播、发表评论并转播和多次传播的行为对信息传播的影响。中国专利申请CN106649685A公开的一种考虑带评论转发行为的SEIAR谣言传播过程描述方法,在传统的病毒式感染模型的基础上,考虑了节点属性差异的因素。中国专利申请CN111460679A公开的一种基于动力学的同步交叉信息传播分析方法及系统,将网络用户的状态分为易感状态、转发状态和免疫状态三种用户状态;构建随着两条信息传播,用户在不同用户状态之间转变的交叉信息同步传播动力学模型;采集发布时间间隔小于设定值的两条信息,将它们的网络用户进行用户状态划分,将划分后的两条信息的多个用户状态输入交叉信息同步传播动力学模型,预测随时间变化的不同人群的个体总数。中国专利申请CN112102960A公开的基于动力学的延迟交叉信息传播分析方法及系统,将个体状态划分为易受影响状态、转发状态、超时免疫状态和直接免疫状态;监测个体接触的信息的传播时期并构建传播动力学模型;将各人群的个体总数与信息的转发量相对应,通过对累计转发量的监测根据传播动力学模型信息传播过程中人群的个体总数变化进行预测。中国专利申请 CN110297984B公开的基于微博的信息传播动力系统、构建方法,将微博中用户的状态分为易感状态、转发状态或/和阅读状态以及免疫状态;根据用户状态的变化构建信息传播动力模型;通过对微博的累计转发量或/和累计阅读量的监测根据上述信息传播动力模型对未来的处于各状态的用户数量及变化趋势进行预测。
但是,在上述现有的信息传播动力学模型中,并未有研究曾考虑过拓展信息渠道,考虑信息传播除转发传播以外的传播途径,同时也并未考虑到传播用户的情感演变过程,因此不能满足当今对公共事件的分析,从而导致模型不理想。
发明内容
鉴于上述问题,本发明考虑到两种社交网络上对情感演化和信息传播发挥重要作用的互动机制:转发和评论,根据用户是否存在以上两种交互行为将其区分为“评论群体”和“转发群体”,并将其统称为“传播群体”。结合情感动力学和信息传播动力学,通过参数敏感性分析技术手段研究模型参数对模型指标的影响,预测受衍生信息影响后用户再度参与信息传播时的情感演变态势,从而基于个体情感交互机制制定有效的信息传播引导策略。
根据本发明的一个方面,提供一种信息传播动力学模型,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,在所述信息传播动力学模型中,
假设信息传播在一个封闭稳定的环境中进行,所述环境的总人数
Figure 100002_DEST_PATH_IMAGE001
不变,将
Figure 469570DEST_PATH_IMAGE002
分为易感状态
Figure 917869DEST_PATH_IMAGE003
、评论状态
Figure 100002_DEST_PATH_IMAGE004
、转发状态
Figure 494344DEST_PATH_IMAGE005
以及免疫状态
Figure 100002_DEST_PATH_IMAGE006
四个群体,并且假设在任意时刻,人群中的每个个体所处状态唯一;所述信息传播动力学模型中各状态代表的含义如下:
易感状态
Figure 748608DEST_PATH_IMAGE007
:处于该状态的个体还未接触到信息,但未来有可能接触到信息并受该信息的影响,从而产生评论或转发行为;
评论状态
Figure 828559DEST_PATH_IMAGE004
:处于该状态的个体产生了评论的行为,具有使处于易感状态的个体接触该信息并产生评论行为的能力;同时,随着信息传播的推进,处于该状态的个体未来有可能产生转发行为,进一步推动信息传播;
转发状态
Figure 182180DEST_PATH_IMAGE005
:处于该状态的个体产生了转发的行为,具有感染处于易感状态的个体、处于评论状态的个体转发信息的能力;
免疫状态
Figure 980372DEST_PATH_IMAGE006
:处于该状态的群体由以下两部分组成:
处于评论或转发状态的个体超过了活跃的曝光期,不再有能力影响其他人,从而转换为免疫状态;以及
处于易感状态、评论状态的个体,接触到信息后,由于主观上对信息不感兴趣而直接转换为免疫状态;
定义
Figure 100002_DEST_PATH_IMAGE008
Figure 38327DEST_PATH_IMAGE009
Figure 100002_DEST_PATH_IMAGE010
以及
Figure 503943DEST_PATH_IMAGE011
Figure 28465DEST_PATH_IMAGE012
时刻处于各状态的有效传播个体总数,且
Figure 100002_DEST_PATH_IMAGE013
所述信息传播动力学模型的公式如下:
Figure 641849DEST_PATH_IMAGE014
其中,
Figure 100002_DEST_PATH_IMAGE015
为评论用户的平均接触速率,表示处于评论状态的个体能够接触到其他个体的平均速率;
Figure 441178DEST_PATH_IMAGE016
为转发用户的平均接触速率,表示处于转发状态的个体能够接触到其他个体的平均速率;
Figure 100002_DEST_PATH_IMAGE017
为易感用户的平均评论概率,表示处于易感状态的个体在接触到信息后以评论的方式参与信息传播的平均评论概率;
Figure 761301DEST_PATH_IMAGE018
为易感用户的平均转发概率,表示处于易感状态的个体 在接触到信息后以转发的方式参与信息传播的平均转发概率;
Figure 100002_DEST_PATH_IMAGE019
为评论用户的平均转发概率,表示处于评论状态的个体由于自身兴趣因素以转发的方式继续参与信息传播的平均转发概率;
Figure 50200DEST_PATH_IMAGE020
为评论用户的平均免疫速率,表示处于评论状态的个体在信息的传播中变得不活跃的平均免疫速率;
Figure 100002_DEST_PATH_IMAGE021
为转发用户的平均免疫速率,表示处于转发状态的个体在信息的传播中变得不活跃的平均免疫速率。
根据本发明的另一方面,提供了一种基于混合信息传播动力学模型进行信息传播分析的方法,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,其中的信息传播动力学模型为前述的信息传播动力学模型;所述方法包括:
利用所述信息传播动力学模型进行信息传播分析;以及,
在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析;
其中,利用所述信息传播动力学模型进行信息传播分析的方法包括:
基于预设的搜索引擎在预设社交平台搜索并采集待分析事件的原始信息数据,所述信息数据包括用户评论文本、转发文本以及转发时间、评论时间;
对所述原始信息数据进行预处理,以获取每条信息下无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间;
以所述无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间为数据驱动,利用最小二乘法估计所述信息传播动力学模型的参数和初始易感人群总数;
基于所述参数和初始易感人群总数,通过所述信息传播动力学模型确定所述待分析事件的信息传播指标数据。
上述根据本发明的基于个体情感交互的混合信息传播动力学模型及该模型进行信息传播分析方法,通过改进现有的SFI模型,考虑评论用户对事件传播的影响,将传播群体扩展为转发群体和评论群体。同时将观点动力学延拓至情感动力学并融合信息传播动力学,从而建立了基于个体情感交互的混合信息传播动力学模型。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为根据本发明实施例的基于个体情感交互的混合信息传播动力学模型示意图;
图2为根据本发明实施例的基于混合信息传播动力学模型进行信息传播分析的方法流程示意图;
图3为根据本发明实施例的特定事件相关信息评论及转发结构示意图;
图4为根据本发明实施例的特定事件评论和转发信息传播曲线示意图;
图5为根据本发明实施例的特定事件的情感交互模拟示意图;
图6为根据本发明实施例的多样化参数影响下指标
Figure 354142DEST_PATH_IMAGE022
的PRCC结果示意图;
图7为根据本发明实施例的多样化参数影响下指标
Figure 100002_DEST_PATH_IMAGE023
Figure 426003DEST_PATH_IMAGE024
Figure 100002_DEST_PATH_IMAGE025
Figure 928529DEST_PATH_IMAGE026
的PRCC结果示意图;
图8为根据本发明实施例的单一参数变化引起的信息传播指标波动示意图;
图9示出了根据本发明实施例的情感交互阈值变化引起的用户情感稳态变化示意图;
图10示出了根据本发明实施例的情感固守程度变化引起的用户情感稳态变化示意图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
本发明立足于当下的社会背景,结合情感动力学和信息传播动力学,从宏观和微观两个层面研究网络信息传播及用户情感演变的过程。在宏观层面,考虑两种社交网络上能够助力于信息传播的特有的互动机制,将用户是否存在“转发”、“评论”交互行为而将其区分为“转发群体”和“评论群体”,通过实验进一步研究这两类群体对信息传播的影响以及其在信息传播过程中规模的变化。在微观层面,深入研究两类传播群体中的个体的情感演化机制,将情感敏感度作为个体特征加入到模型中,再现传播个体在社交网络平台上的情感交互动态过程,包括个体间交互关系的建立与断裂、个体的加入与退出。最终,在目标信息传播周期结束之后,预测再次受到相关衍生信息刺激后传播用户情感的演变趋势。
以下将结合附图对本发明的具体实施例进行详细描述。
以信息传播动力学模型(SCFI)结合情感动力学(HK)模型为例,本发明构建出的基于个体情感交互的混合信息传播动力学模型,即HK-SCFI(Hegselmann–KrauseSusceptible-Commanding-Forwarding-Immune)模型示意图如图1所示。
在图1中,下虚线框表示在单一网络信息的传播过程中不同人群状态的动态变化,图1的上虚线框表示在单一网络信息传播过程中传播个体间的情感交互。灰色空心小人代表评论信息的个体;黑色空心小人代表转发信息的个体;黑色实心小人代表不具有传播影响力的个体;双箭头代表个体间在传播信息的同时交换情感,建立情感交互关系。当媒体发布信息后,人们会通过评论、转发两种方式表达自己对该信息的情感态度,并与他人进行讨论,从而产生情感交互。随着信息传播进程的推进,一些用户的情感态度会发生变化,也会与此前未产生交互的用户建立新的交互关系。
本混合信息传播动力学模型中涉及的全部参数及相应解释如下表1所示。
表1 HK-SCFI模型参数表
Figure 100002_DEST_PATH_IMAGE027
在宏观层面,本发明使用SCFI模型来观察传播过程中不同人群状态的动态变化。在SCFI模型中,假设信息传播在一个封闭稳定的环境中进行,该环境的总人数(
Figure 60433DEST_PATH_IMAGE002
)不变。定义
Figure 320513DEST_PATH_IMAGE028
Figure 930486DEST_PATH_IMAGE009
Figure 756360DEST_PATH_IMAGE010
以及
Figure 793586DEST_PATH_IMAGE011
Figure 275383DEST_PATH_IMAGE012
时刻处于各状态的有效传播个体总数,且
Figure 689046DEST_PATH_IMAGE013
。将
Figure 369426DEST_PATH_IMAGE002
分为四个群体,即易感状态(
Figure 843133DEST_PATH_IMAGE007
)、评论状态(
Figure 812226DEST_PATH_IMAGE004
)、转发状态(
Figure 764002DEST_PATH_IMAGE005
)以及免疫状态(
Figure 513869DEST_PATH_IMAGE006
),并且假设在任意时刻,人群中的每个个体所处状态唯一。模型中各状态代表的含义如下:
(1)易感状态(
Figure 158477DEST_PATH_IMAGE007
):处于该状态的个体还未接触到信息,但未来有可能接触到信息并受该信息的影响,从而产生评论或转发行为。
(2)评论状态(
Figure 411604DEST_PATH_IMAGE004
):处于该状态的个体产生了评论的行为,具有使处于易感状态的个体接触该信息并产生评论行为的能力。同时,随着信息传播的推进,处于该状态的个体未来有可能产生转发行为,进一步推动信息传播。
(3)转发状态(
Figure 167070DEST_PATH_IMAGE005
):处于该状态的个体产生了转发的行为,具有感染处于易感状态的个体、处于评论状态的个体转发信息的能力。
(4)免疫状态(
Figure 759726DEST_PATH_IMAGE006
):处于该状态的群体由以下部分组成:
a)处于评论或转发状态的个体超过了活跃的曝光期,不再有能力影响其他人,从而转换为免疫状态;
b)处于易感状态、评论状态的个体,接触到信息后,由于主观上对信息不感兴趣而直接转换为免疫状态。
SCFI模型的公式如下:
Figure 100002_DEST_PATH_IMAGE029
(1)
在动力学系统中,一个处于评论状态的用户在平均单位时间内会接触到
Figure 840814DEST_PATH_IMAGE030
个用户,接触到的用户中,处于易感状态的概率为
Figure 100002_DEST_PATH_IMAGE031
。所以一个处于评论状态的用户会接触到
Figure 315658DEST_PATH_IMAGE032
个处于易感状态的用户,他们将以平均评论概率
Figure 671553DEST_PATH_IMAGE017
进行评论,因此,有
Figure 100002_DEST_PATH_IMAGE033
个处于易感状态的用户会受到处于评论状态的活跃用户的影响,其中,有
Figure 649873DEST_PATH_IMAGE034
个用户会产生评论行为,有
Figure 100002_DEST_PATH_IMAGE035
个用户对信息不感兴趣,不参与信息传播。
同理,一个处于转发状态的用户在平均单位时间内会接触到
Figure 433021DEST_PATH_IMAGE036
个处于易感状态的用户以及
Figure 100002_DEST_PATH_IMAGE037
个处于评论状态的用户。接触到的处于易感状态的用户将以平均转发概率
Figure 395161DEST_PATH_IMAGE018
进行转发,而接触到的处于评论状态的用户将以评论状态平均转发概率
Figure 492430DEST_PATH_IMAGE019
进行转发。
因此,有
Figure 121995DEST_PATH_IMAGE038
个处于易感状态的用户受到处于
Figure 13727DEST_PATH_IMAGE005
状态活跃用户的影响,其中,有
Figure 100002_DEST_PATH_IMAGE039
个用户会产生转发行为,有
Figure 197584DEST_PATH_IMAGE040
个用户对信息不感兴趣,不参与信息传播;有
Figure 100002_DEST_PATH_IMAGE041
个处于评论状态的用户受到处于转发状态的用户的影响,其中,有
Figure 629702DEST_PATH_IMAGE042
个用户会产生转发行为,有
Figure 100002_DEST_PATH_IMAGE043
个用户选择不转发信息,不再参与信息传播。随着时间的推移,有
Figure 379353DEST_PATH_IMAGE044
个用户超过了曝光期,不再有能力影响他人。
在研究微观层面个体情感特征时,本发明受到原始HK(Hegselmann-Krause)模型的启发,基于SCFI模型得到各时刻评论用户有效传播人数
Figure 707566DEST_PATH_IMAGE010
和转发用户有效传播人数
Figure 100002_DEST_PATH_IMAGE045
,同时引入意大利经济学家维尔弗雷多·帕累托提出的意大利社会财富分配的研究结论帕累托定则(Pareto principle),提出一种新的基于信息传播的个体情感演化模型。帕累托定则原指社会中有20%的人口掌握着80%的社会财富,在这里认为参与传播的用户中有20%的个体具有情感固守的特性,其情感不易受外界影响轻易改变,而80%的个体对外界情感接受程度大,其下一时刻的情感近似平均地由当前时刻的自身情感和外界情感共同组成。
为了进一步研究个体情感的演化规律,本发明基于情感词典,对用户观点中所蕴含的情感进行识别,利用情感极性词将情感划分正面情感、中立情感和负面情感三种情感,并分别将其量化为(0,1)区间的连续数值,情感值越接近0表明用户对事件持有的负面情感越强烈,情感值越接近1表明用户对事件持有的正面情感越强烈。最终划分的情感区间为,负面情感区间(0,0.4),中立情感值区间(0.4,0.7),以及正面情感值区间(0.7,1)。最后将量化后的情感值带入情感交互模型,观察个体间的情感交互过程。根据本发明的情感动力学模型,只有当两个个体间情感值之差小于设定的情感交互阈值
Figure 113139DEST_PATH_IMAGE046
,这两个个体之间才能产生情感交互,从而有可能使自己的情感值发生改变。反之,如果两个个体的情感值之差大于情感交互阈值,则这两个个体无法产生情感交互。
在本发明的一个具体实施例中,用
Figure 100002_DEST_PATH_IMAGE047
来表示个体对自身原有情感的坚持程度,
Figure 348948DEST_PATH_IMAGE048
表示个体对其他个体情感的信任程度。在本发明的HK-SCFI模型中,信息传播者的情感更新规则描述如下:
Figure 100002_DEST_PATH_IMAGE049
(2)
其中,以个体
Figure 218684DEST_PATH_IMAGE050
为例,
Figure 100002_DEST_PATH_IMAGE051
表示t时刻个体
Figure 248957DEST_PATH_IMAGE050
的情感值,表示
Figure 610668DEST_PATH_IMAGE052
时刻个体
Figure 853431DEST_PATH_IMAGE050
的情感值,
Figure 249777DEST_PATH_IMAGE053
表示
Figure 716531DEST_PATH_IMAGE012
时刻与个体
Figure 831117DEST_PATH_IMAGE054
情感值之差小于设定情感交互阈值
Figure 611991DEST_PATH_IMAGE046
的评论和转发个体集合,
Figure 862844DEST_PATH_IMAGE055
表示集合
Figure 703761DEST_PATH_IMAGE053
的总人数,
Figure 100002_DEST_PATH_IMAGE056
表示集合
Figure 836802DEST_PATH_IMAGE053
中所有个体的平均情感值,
Figure 218105DEST_PATH_IMAGE057
表示个体
Figure 589044DEST_PATH_IMAGE054
Figure 100002_DEST_PATH_IMAGE058
时刻对自身
Figure 132020DEST_PATH_IMAGE012
时刻情感的保留值,
Figure 690041DEST_PATH_IMAGE059
表示个体
Figure 78297DEST_PATH_IMAGE054
Figure 100479DEST_PATH_IMAGE058
时刻对
Figure 283199DEST_PATH_IMAGE012
时刻其他个体情感的接受值。
对于80%的大部分个体,表征情感固守程度的参数
Figure 100002_DEST_PATH_IMAGE060
,这表示传播个体在情感更新时没有特定倾向,不会固守原来的情感,也不会因受外界情感影响而产生较大情感波动,即个体对自身情感态度的坚持程度与对他人情感态度的接受程度相同。对于20%的情感固守个体,表征情感固守程度的参数
Figure 125253DEST_PATH_IMAGE061
,这表示传播个体更倾向于保持自身情感不变,对外界的情感刺激有一定的抵抗作用。
利用本发明提供的HK-SCFI模型,可以分析出用户情感传播的一般模式,并在一定程度上预测受信息衍生事件影响后用户再度参与信息传播的情感演变态势。针对有关部门对于不同信息的传播需求,可以通过调整本模型参数的大小,做到增大或减小信息传播规模以及信息传播强度。例如,可以通过适当与主流媒体合作,调整转发用户的平均接触速率
Figure 100002_DEST_PATH_IMAGE062
;在信息中增加问题或添加用户互动模块,调节用户的平均转发概率
Figure 594498DEST_PATH_IMAGE018
或平均评论概率
Figure 674449DEST_PATH_IMAGE017
;通过控制网络中偏激极端传播者,从而调节用户的情感交互阈值
Figure 90387DEST_PATH_IMAGE063
;通过引入拥有大量信息参与者的特定用户,增大初始易感人群总数
Figure 100002_DEST_PATH_IMAGE064
,利用特定用户对信息参与者的影响,改变用户对不同情感的接受程度,从而调节情感固守程度
Figure 419737DEST_PATH_IMAGE065
。同时也可以通过模型预测的用户再度参与信息传播的情感演变态趋势,提前做好网络信息治理和情绪引导工作,避免信息衍生事件导致的负面网络情绪累积,从而营造风清气正的网络环境。
为了更好的说明上述基于混合信息传播动力学模型,本发明还提供一种基于上述混合信息传播动力学模型进行信息传播的方法,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析。该方法包括:方法包括:利用所述信息传播动力学模型进行信息传播分析;以及,在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析。
图2示出了根据本发明实施例的利用信息传播动力学模型进行信息传播分析的方法流程图。
如图2所示,本实施例提供的利用信息传播动力学模型进行信息传播分析的方法包括如下步骤:
S210:基于预设的搜索引擎在预设社交平台搜索并采集待分析事件的原始信息数据,信息数据包括用户评论文本、转发文本以及转发时间、评论时间;其中的待分析事件为信息的某一具体例子,用户评论文本为传播群体中所有评论个体所评论的文本,用户转发文本为传播群体中所有转发个体转发的文本。
S220:对原始信息数据进行预处理,以获取每条信息下无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间;
S230:以所述无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间为数据驱动,利用最小二乘法估计所述信息传播动力学模型的参数和初始易感人群总数;
S240:基于所述参数和初始易感人群总数,通过所述信息传播动力学模型确定所述待分析事件的信息传播指标数据。
此外,在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析之前,还包括:
基于预设的情感词典,对所述无噪声冗余的用户评论文本、转发文本中蕴含的情感进行识别;
基于预设的情感量化规则,将所识别的情感进行量化分类;
具体的,在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析的方法包括:基于所述情感动力学模型分析和预测传播用户的情感演变过程;以及,在所述信息传播动力学模型的基础上结合所述情感演变过程进行信息传播分析。该传播用户包括所有的评论用户和转发用户。
用户在互联网中通过评论和转发两种方式表达自己的观点,观点中含有情绪,携带情绪的观点不断交互最终形成网络信息。
为了对信息传播进行定性定量的分析,本发明中定义了信息传播指标数据,用于表述信息在信息传播过程中的发展状况。该信息传播指标数据包括信息传播可再生数
Figure 100002_DEST_PATH_IMAGE066
、信息传播峰值、信息传播最终规模以及信息传播高潮时间。其中,信息传播可再生数
Figure 415375DEST_PATH_IMAGE067
用于判断信息是否可能爆发传播;信息传播峰值用于表示信息传播的强度,包括信息评论峰值和信息转发峰值;信息传播最终规模包括通过评论行为传播的最终规模和通过转发行为传播的最终规模;信息传播高潮时间包括到达信息评论峰值的时间和到达信息转发峰值的时间。
下面将对本发明中的信息传播指标数据的获取方法做进一步详细说明。
信息传播可再生数
Figure 100002_DEST_PATH_IMAGE068
在传染病模型中,
Figure 880992DEST_PATH_IMAGE068
为基本可再生数,表示在排除外力干预且所有人都易感的情况下,每一例新病例所造成继发感染数量的平均值。类似地,在本发明的HK-SCFI模型中,对基本可再生数进行拓展,用来表示在排除外力干预且所有用户都易感的情况下,每一个传播用户所引起的继发传播者的平均值,可通过
Figure 467831DEST_PATH_IMAGE068
判断信息是否可能爆发传播。在本发明的HK-SCFI模型中,信息传播可再生数
Figure 753319DEST_PATH_IMAGE068
可通过以下式子进行计算:
Figure 21489DEST_PATH_IMAGE069
(3)
其中,
Figure 100002_DEST_PATH_IMAGE070
Figure 341612DEST_PATH_IMAGE071
为列向量,
Figure 99352DEST_PATH_IMAGE072
数学符号表示向量的转置,
Figure 606557DEST_PATH_IMAGE071
表示具有传播能力的群体。
Figure 100002_DEST_PATH_IMAGE073
是列向量
Figure 943997DEST_PATH_IMAGE071
中的第一个元素,表示
Figure 118627DEST_PATH_IMAGE012
时刻有效评论用户总数;
Figure 984952DEST_PATH_IMAGE074
是列向量
Figure 41769DEST_PATH_IMAGE071
中的第二个元素,表示
Figure 651742DEST_PATH_IMAGE012
时刻有效转发用户总数。其中,有效评论用户总数为根据SCFI模型计算得到的t时刻评论用户人数,指截止到t时刻为止,动力学系统中还能够有效影响易感者的评论者数量;有效转发用户总数为是根据SCFI模型计算得到的t时刻转发用户人数,指截止到t时刻为止,动力学系统中还能够有效影响易感者和评论者的转发者数量。
Figure 100002_DEST_PATH_IMAGE075
表示对向量
Figure 946457DEST_PATH_IMAGE071
中的各元素求导。
Figure 983683DEST_PATH_IMAGE076
包含两个元素,其中第一个元素为t时刻成为评论用户的用户人数,第二个元素为t时刻成为转发用户的用户人数;
Figure 100002_DEST_PATH_IMAGE077
同样包含两个元素,其中第一个元素为t时刻不再是评论用户的用户人数,第二个元素为t时刻不再是转发用户的用户人数;
根据前述HK-SCFI模型的公式(1),可得:
Figure 58956DEST_PATH_IMAGE078
(4)
Figure 100002_DEST_PATH_IMAGE079
(5)
其中,
Figure 738199DEST_PATH_IMAGE080
表示
Figure 621841DEST_PATH_IMAGE012
时刻易感用户成为评论用户的人数,
Figure 100002_DEST_PATH_IMAGE081
表示
Figure 423444DEST_PATH_IMAGE012
时刻易感用户和评论用户成为转发用户的人数;
Figure 392537DEST_PATH_IMAGE082
表示
Figure 78733DEST_PATH_IMAGE012
时刻评论用户成为转发用户和免疫用户的人数,
Figure 100002_DEST_PATH_IMAGE083
表示
Figure 613620DEST_PATH_IMAGE012
时刻转发用户成为免疫用户的人数。
假设系统中存在无信息传播平衡态
Figure 789386DEST_PATH_IMAGE084
Figure 245775DEST_PATH_IMAGE064
代表初始易感人群总数。在无信息传播平衡态下基于
Figure 100002_DEST_PATH_IMAGE085
Figure 532400DEST_PATH_IMAGE086
的表达式分别对
Figure 125055DEST_PATH_IMAGE073
Figure 940565DEST_PATH_IMAGE074
求偏导,对应得到矩阵
Figure 100002_DEST_PATH_IMAGE087
及矩阵
Figure 212146DEST_PATH_IMAGE088
Figure 100002_DEST_PATH_IMAGE089
(6)
Figure 36883DEST_PATH_IMAGE090
(7)
则可以得到特征方程如下:
Figure DEST_PATH_IMAGE091
(8)
其中,
Figure 15203DEST_PATH_IMAGE092
为特征值,
Figure DEST_PATH_IMAGE093
表示单位矩阵,
Figure 532772DEST_PATH_IMAGE094
代表
Figure 760491DEST_PATH_IMAGE088
的逆矩阵。通过计算特征方程的特征根可推导出
Figure 857760DEST_PATH_IMAGE068
Figure DEST_PATH_IMAGE095
(9)
其中,
Figure 690587DEST_PATH_IMAGE096
为特征方程的第一个特征根,
Figure DEST_PATH_IMAGE097
为特征方程的第二个特征根,
Figure 187513DEST_PATH_IMAGE068
取两个特征值中的最大值。
Figure 105791DEST_PATH_IMAGE098
意味着在信息发布之初,评论和转发群体总数呈现下降趋势,信息不会爆发传播;
Figure DEST_PATH_IMAGE099
则表示在信息发布之初,评论和转发群体总数呈现指数增长,信息必然爆发传播,并且
Figure 6751DEST_PATH_IMAGE068
越大,信息爆发传播的速度越快。
信息传播峰值、信息传播最终规模以及信息传播高潮时间:
在信息传播过程中,累积量可用于表征信息的传播规模。其中,累积评论量可用于表征评论群体的规模,累积转发量可用于表征转发群体的规模。由前述HK-SCFI模型的公式(1)进一步推导,可以得出两种累积转发量的方程:
Figure 694084DEST_PATH_IMAGE100
, (10)
Figure DEST_PATH_IMAGE101
(11)
其中
Figure 350193DEST_PATH_IMAGE102
表示
Figure 224608DEST_PATH_IMAGE012
时刻的累积评论量,
Figure DEST_PATH_IMAGE103
表示
Figure 257155DEST_PATH_IMAGE012
时刻的累积转发量。
为了将真实数据与模型进行拟合,在本发明的一个具体实施例中,通过最小二乘法估计模型参数和初始易感人群总数。设置参数矢量为
Figure 798995DEST_PATH_IMAGE104
,用
Figure DEST_PATH_IMAGE105
表示
Figure 563689DEST_PATH_IMAGE106
时刻累积转发量的模拟值,用
Figure DEST_PATH_IMAGE107
表示
Figure 722138DEST_PATH_IMAGE106
时刻累积评论量的模拟值,用
Figure 496059DEST_PATH_IMAGE108
表示
Figure 157984DEST_PATH_IMAGE106
时刻累积转发量的真实值,用
Figure DEST_PATH_IMAGE109
表示
Figure 93579DEST_PATH_IMAGE106
时刻累积评论量的真实值。由此,可以得到最小二乘
Figure 208166DEST_PATH_IMAGE110
误差函数:
Figure DEST_PATH_IMAGE111
(12)
其中,
Figure 316936DEST_PATH_IMAGE110
为残差平方和,
Figure 833368DEST_PATH_IMAGE112
代表采样时间。在数据拟合的过程中,参数需要满足以下条件:
Figure DEST_PATH_IMAGE113
Figure 205444DEST_PATH_IMAGE114
Figure DEST_PATH_IMAGE115
信息的累积转发量和累积评论量均为随时间变化的曲线,总体趋势先快速上升,后平稳上升,最终趋于稳定。有效评论量和有效转发量均为随时间增加先上升后下降的钟形曲线。本实施例中,将表征有效评论量的钟形曲线的最大值定义为信息评论峰值
Figure 72905DEST_PATH_IMAGE023
,将表征有效转发量的钟形曲线的最大值定义为信息转发峰值
Figure 454208DEST_PATH_IMAGE024
,用
Figure 825147DEST_PATH_IMAGE116
表示信息通过评论行为传播的强度,用
Figure 836965DEST_PATH_IMAGE024
表示信息通过转发行为传播的强度。同时将累积评论量
Figure 394985DEST_PATH_IMAGE102
的稳态值定义为信息通过评论行为传播的最终规模
Figure DEST_PATH_IMAGE117
,将累积转发量
Figure 314400DEST_PATH_IMAGE103
的稳态值定义为信息通过转发行为传播的最终规模
Figure 336582DEST_PATH_IMAGE118
,用
Figure 519302DEST_PATH_IMAGE117
表示信息通过评论行为传播的广度,用
Figure 95777DEST_PATH_IMAGE118
表示信息通过转发行为传播的广度。通过
Figure DEST_PATH_IMAGE119
Figure 287724DEST_PATH_IMAGE118
能够表示信息传播的最终规模。
本发明将到达信息评论峰值的时间定义为
Figure 367675DEST_PATH_IMAGE120
,将到达信息转发峰值的时间定义为
Figure DEST_PATH_IMAGE121
,信息传播高潮时间包括到达信息评论峰值的时间
Figure 314772DEST_PATH_IMAGE120
和到达信息转发峰值的时间
Figure 112963DEST_PATH_IMAGE121
,利用信息传播高潮时间衡量信息传播过程中用户分别通过评论行为和转发行为到达信息评论峰值和信息转发峰值的快慢。
以下,将结合一个应用本发明进行网络信息传播及用户情感演的演变过程的研究实施例,对本发明做更为详细的说明。
本发明在社交平台上对最近发生的信息事件进行广泛搜索,在基于预设的社交平台(本实施例采用的是微博平台),发现在某话题下,某账号的报道占据了话题榜单的榜首,其微博评论量、转发量在话题均排名第一。通过对该条微博采集用户评论文本、转发文本以及转发时间、评论时间的真实信息数据,获取该事件的评论及转发结构示例图如图3所示。
由于用户转发文本、评论文本存在随机性,因此需要对采集的数进行过滤,以滤除与原博文不相关和毫无意义的转发文本、评论文本。在对数据进行预处理后,可以获得每条信息下无噪声无冗余的转发时间、评论时间及转发文本、评论文本。接着,为了得到最佳的拟合结果,本实施例中,以用户的真实评论、转发量为数据驱动,利用最小二乘法估计模型参数和初始易感人群总数。图4示出了根据本实施例的特定事件评论和转发信息传播曲线。
如图4所示,其中的星号表示真实累积评论量,菱形表示真实累积转发量,粗实线表示通过模型计算得到的累积评论量的模拟值,细实线表示通过模型计算得到的累积转发量的模拟值,虚线表示通过模型计算得到的有效评论量的模拟值,点横线表示通过模型计算得到的有效转发量的模拟值。从数值模拟结果来看,利用本发明的模型的拟合曲线几乎和真实数据点重合,证明本发明的模型能够充分表示信息的传播过程,从而验证了本发明的模型的有效性。
以实际用户真实评论量、转发量为数据驱动得到的参数估计值如下表2所示。
表2 HK-SCFI模型中SCFI模型的参数结果
Figure 577443DEST_PATH_IMAGE122
用户的平均接触速率与网络密度有关,获得的模型参数中评论用户平均接触速率
Figure 511901DEST_PATH_IMAGE123
和转发用户平均接触速率
Figure 302002DEST_PATH_IMAGE062
数值大致相等,说明评论和转发群体的网络密度差异较小。易感用户的平均评论概率
Figure 321911DEST_PATH_IMAGE017
小于易感用户的平均转发概率
Figure 855660DEST_PATH_IMAGE018
,表明相比于评论行为,易感用户更愿意通过转发行为表达自己的情感。用户的平均免疫速率与其自身行为规律有关,而评论用户的平均免疫速率
Figure 706942DEST_PATH_IMAGE020
小于转发用户的免疫速率
Figure 402365DEST_PATH_IMAGE021
,说明评论用户活跃的曝光期较长,影响信息传播的时间也较长。利用模型数值拟合结果,可以计算出该事件信息传播指标的具体数值,其数值具体如下表3所示。
表3 特定事件的信息传播指标结果
Figure DEST_PATH_IMAGE124
该事件的信息传播可再生数
Figure 440728DEST_PATH_IMAGE099
,表明在事件信息发布之初,评论和转发群体总数呈现指数增长,因此信息必然爆发。信息评论峰值
Figure 512589DEST_PATH_IMAGE023
大于信息转发峰值
Figure 218377DEST_PATH_IMAGE125
,表明在信息传播过程中评论信息传播强度大于转发信息传播强度。到达信息评论峰值所需的时间
Figure 350281DEST_PATH_IMAGE120
大于到达信息转发峰值所需的时间
Figure 356501DEST_PATH_IMAGE121
,结合信息评论峰值
Figure 232053DEST_PATH_IMAGE116
和信息转发峰值
Figure 995610DEST_PATH_IMAGE024
,说明信息传播过程中通过转发行为到达信息转发峰值的时间比通过评论行为到达信息评论峰值的时间更早。信息评论最终规模
Figure 32836DEST_PATH_IMAGE117
大于信息转发最终规模
Figure 780212DEST_PATH_IMAGE118
,说明相较转发行为,信息通过评论行为传播的范围更广。
同时,在本实施例中,还在上述信息传播动力学模型的基础上对传播用户的情感进行量化,以划分不同的情感区间。具体的,作为示例,本发明基于预设的情感词典,对用户观点中所蕴含的情感进行识别,将用户情感划分为正面情感、中立情感和负面情感三种情感,并分别将其量化为(0,1)区间的连续数值。情感值越接近0表明用户对事件持有的负面情感越强烈,情感值越接近1表明用户对事件持有的正面情感越强烈。为了确保算法判断标注的情感倾向准确,在本发明的一个具体实施例中,最后将所有标注的结果进行人工审核,对算法判断不准确的数值进行矫正。当用户仅转发信息但没有发表看法时,假设他们与其转发的信息具有相同情感。在量化情感区间之后,就可以结合情感动力学模型分析传播用户的情感演变过程,进而实现对信息传播的分析。
具体的,作为示例,若一个信息从开始传播到结束传播共经历18个小时,以1小时为时间间隔,将信息传播周期划分为0,1,2,… ,18,共19个时刻。为确定
Figure 990613DEST_PATH_IMAGE012
时刻能够进行情感交互的转发、评论用户人数及对应的情感值,分别计算
Figure 874256DEST_PATH_IMAGE012
时刻累积转发用户和评论用户中携带正面情感、中立情感、负面情感的比例,基于SCFI模型得到的
Figure 82383DEST_PATH_IMAGE012
时刻有效评论用户总数
Figure 51476DEST_PATH_IMAGE073
Figure 3252DEST_PATH_IMAGE012
时刻有效转发用户总数
Figure 741401DEST_PATH_IMAGE074
并结合各情感比例确定
Figure 386009DEST_PATH_IMAGE012
时刻携带各情感的用户人数后,对
Figure 639135DEST_PATH_IMAGE012
时刻累积转发用户和评论用户进行分层抽样。
以确定
Figure 394602DEST_PATH_IMAGE012
时刻能够进行情感交互的评论用户人数及对应的情感值为例,本发明用
Figure 252836DEST_PATH_IMAGE126
表示
Figure 802766DEST_PATH_IMAGE012
时刻累积评论用户,
Figure DEST_PATH_IMAGE127
Figure 12031DEST_PATH_IMAGE128
Figure 367926DEST_PATH_IMAGE129
分别表示
Figure 80667DEST_PATH_IMAGE130
中持正面情感、中立情感、负面情感用户所占的比例,
Figure 67078DEST_PATH_IMAGE073
表示
Figure 232480DEST_PATH_IMAGE012
时刻有效评论用户人数。将
Figure DEST_PATH_IMAGE131
中的用户按负面情感区间(0,0.4),中立情感值区间(0.4,0.7),以及正面情感值区间(0.7,1)划分,接着从正面情感用户中抽取
Figure 860907DEST_PATH_IMAGE132
个持正面情感的用户,从中立情感用户中抽取
Figure DEST_PATH_IMAGE133
个持中立情感的用户,从负面情感用户中抽取
Figure 756051DEST_PATH_IMAGE134
个持负面情感的用户,抽出的用户总数等于
Figure 913363DEST_PATH_IMAGE012
时刻有效评论用户人数
Figure 566061DEST_PATH_IMAGE073
,他们在
Figure 201442DEST_PATH_IMAGE012
时刻产生情感交互。采取相同的方式确定
Figure 888775DEST_PATH_IMAGE012
时刻能够进行情感交互的转发用户人数及对应的情感值,最终确定
Figure 216988DEST_PATH_IMAGE012
时刻能够产生情感交互的总传播用户。
该信息在
Figure DEST_PATH_IMAGE135
结束传播,但由于受到信息衍生信息的影响,这部分用户将继续进行情感交互直至达到情感平衡,如图5所示。
在图5中,白色区域所示的0~18轮次表示当前信息传播过程中用户的真实情感交互情况;灰色区域所示的19~44轮次表示当前信息的情感交互结束后,在无新增评论、转发用户的情况下,考虑信息衍生信息对用户情感的影响,预测用户情感的演化趋势及最终的情感状态。
观察0~18轮次情感交互情况,可以得出以下结论:在0~11轮次,每一次新增传播者加入进行情感交互后,用户情感值的所在区间范围大致呈现出逐渐减小的趋势;在11~12轮次,用户情感值出现聚集现象,大多数用户的情感值聚集在0.5附近;而在12~18轮次阶段,用户情感值所在的区间范围增大,此时情感交互更加剧烈。在0~18轮次的情感演化阶段,促使用户情感值改变的是不断加入的新增传播者,同时由于个体情感交互阈值
Figure 684878DEST_PATH_IMAGE046
和情感固守程度
Figure 123950DEST_PATH_IMAGE047
的存在,每一次新加入的新增传播者的情感值不同,对正在进行交互的传播用户的影响也各不相同。在每一次新加入的传播者情感值中,持中立情感用户的占比最大,情感占比超过50%,负面情感用户次之,正面情感用户占比最少。
通过观察第19~44轮次无新增传播者下的情感交互情况,可以发现,受到信息衍生信息的影响,用户在第19轮次再次产生情感交互,同时因为情感固守程度
Figure 400211DEST_PATH_IMAGE047
的影响,在每一轮交互过程中,有少部分个体对不同个体情感的接受程度较小,导致用户情感达成稳态的时间较长,本实施例中预测最终一共需要经历25轮次情感交互,用户情感才能达到稳态。在现实社会中,如果个体间进行充分交流,所有个体经过情感交互后,情感值几乎不再变化,此时可以认为用户的情感演化已经进入稳定状态。对于该事件,用户受信息衍生信息影响的情感最终趋于统一,表现为中立情感,情感值处于(0.45,0.5)区间。
为了进一步研究本发明提供的模型中的参数(
Figure 899325DEST_PATH_IMAGE136
Figure DEST_PATH_IMAGE137
Figure 854512DEST_PATH_IMAGE138
Figure DEST_PATH_IMAGE139
Figure 628433DEST_PATH_IMAGE140
Figure DEST_PATH_IMAGE141
Figure 821516DEST_PATH_IMAGE142
Figure DEST_PATH_IMAGE143
)对信息传播的影响,在本发明的一个应用实施例中,使用了偏秩相关系数(PRCC)方法和单个参数变化的方法对相关参数进行敏感性分析。
偏秩相关系数法通过调整输入的参数和阈值条件,在参数边界范围内进行重复实验,最终给出平均的参数敏感性结果。这里可以设置重复性实验次数为1000次,并且在直方图下方以散点图的形式给出各参数对指标的影响结果。参数相关性影响结果落入[-1,1]之间,结果大于0,表明该参数与对应指标呈正相关;结果小于0,则表明该参数与对应指标呈负相关,且结果的绝对值越接近于1,参数对指标的相关性影响作用越强。同时,可将显著性水平P值设定为0.01,作为判断参数与指标之间的偏秩相关性结论是否成立的标准。若P值大于
Figure 757111DEST_PATH_IMAGE144
,则说明参数与指标之间的偏秩相关性结论需要进一步确认。
本实施例中使用偏秩相关系数PRCCs法对影响
Figure 606119DEST_PATH_IMAGE068
的相关参数进行敏感性分析,结果如图6所示。通过观察图6中所示的直方图和散点图,可以清楚地看出评论用户平均接触速率
Figure DEST_PATH_IMAGE145
、平均评论概率
Figure 980468DEST_PATH_IMAGE146
、初始易感人群总数
Figure 496900DEST_PATH_IMAGE143
均与信息传播可再生数
Figure 72238DEST_PATH_IMAGE068
呈正相关关系。其中,
Figure 408542DEST_PATH_IMAGE136
Figure 993107DEST_PATH_IMAGE138
Figure 160783DEST_PATH_IMAGE068
具有强影响,
Figure 172601DEST_PATH_IMAGE143
Figure 261780DEST_PATH_IMAGE068
具有弱影响;而评论用户平均免疫速率
Figure 384457DEST_PATH_IMAGE141
对信息传播可再生数
Figure 609902DEST_PATH_IMAGE068
具有负向一般影响。结果表明,个体间情感交互是否能产生、信息是否能爆发传播,重点受
Figure DEST_PATH_IMAGE147
Figure 335498DEST_PATH_IMAGE020
三个因子的影响。
接下来对模型中的其他重要指标:信息评论峰值
Figure 646394DEST_PATH_IMAGE023
、信息转发峰值
Figure 369499DEST_PATH_IMAGE125
、信息评论传播最终规模
Figure 715030DEST_PATH_IMAGE117
以及信息转发传播最终规模
Figure 68651DEST_PATH_IMAGE118
,进行参数敏感性分析。在本模型中,
Figure 866843DEST_PATH_IMAGE023
Figure 331322DEST_PATH_IMAGE024
用于表征信息传播强度,
Figure 531359DEST_PATH_IMAGE117
Figure 55882DEST_PATH_IMAGE118
用于表征信息传播的最终规模。参数的敏感性分析结果如图7所示。
根据性质,划分信息评论峰值
Figure 138107DEST_PATH_IMAGE023
与信息评论传播最终规模
Figure 671857DEST_PATH_IMAGE117
为事件评论组指标、信息转发峰值
Figure 726400DEST_PATH_IMAGE024
与信息转发传播最终规模
Figure 156245DEST_PATH_IMAGE118
为事件转发组指标。根据偏秩相关系数法的结果可知,任意一个参数对组内不同指标均具有相同性质的影响。
通过观察图7可以看出,评论用户的平均接触速率
Figure 929029DEST_PATH_IMAGE123
、转发用户的平均接触速率
Figure 890DEST_PATH_IMAGE148
、平均免疫速率
Figure 909940DEST_PATH_IMAGE021
、易感用户的平均评论概率
Figure 838582DEST_PATH_IMAGE017
、平均转发概率
Figure 833082DEST_PATH_IMAGE018
和初始易感人群总数
Figure 708635DEST_PATH_IMAGE064
对各指标的显著性水平和评论用户平均免疫速率
Figure 472191DEST_PATH_IMAGE020
对评论组指标的显著性水平均远小于0.01,这说明对于这些参数,本发明针对相应指标用偏秩相关系数法所表征的相关性关系结果非常显著,结果具有统计学意义。而评论用户的平均转发概率
Figure 509417DEST_PATH_IMAGE019
对大多数指标的显著性水平和评论用户的平均免疫速率
Figure 991214DEST_PATH_IMAGE020
对转发组指标的显著性水平均大于0.01,这说明参数
Figure 201616DEST_PATH_IMAGE019
对大多数指标、参数
Figure 85258DEST_PATH_IMAGE020
对转发组指标用偏秩相关系数法所表征的相关性关系不显著。
对于评论组指标,评论用户的平均接触速率
Figure 558965DEST_PATH_IMAGE123
、易感用户的平均评论概率
Figure 528058DEST_PATH_IMAGE017
、转发用户的平均免疫速率
Figure 479833DEST_PATH_IMAGE021
和初始易感人群总数
Figure 217982DEST_PATH_IMAGE064
对评论组指标均具有正相关影响,其中,
Figure DEST_PATH_IMAGE149
Figure 190486DEST_PATH_IMAGE017
对评论组指标具有强影响,
Figure 646875DEST_PATH_IMAGE021
Figure 402342DEST_PATH_IMAGE064
对评论组指标具有弱影响。而转发用户的平均接触速率
Figure 260576DEST_PATH_IMAGE062
、易感用户的平均转发概率
Figure 544927DEST_PATH_IMAGE018
和评论用户的平均免疫速率
Figure 488612DEST_PATH_IMAGE020
,则对评论组指标均具有一般负相关影响。说明增大
Figure 47770DEST_PATH_IMAGE123
Figure 557249DEST_PATH_IMAGE017
Figure 543659DEST_PATH_IMAGE021
Figure 709061DEST_PATH_IMAGE064
,同时减小
Figure 806330DEST_PATH_IMAGE062
Figure 639157DEST_PATH_IMAGE018
Figure 530890DEST_PATH_IMAGE150
能有效增强评论信息的传播影响力、增大评论群体规模。
对于转发组指标,转发用户的平均接触速率
Figure 183588DEST_PATH_IMAGE062
、易感用户的平均转发概率
Figure 84548DEST_PATH_IMAGE018
和初始易感人群总数
Figure 568619DEST_PATH_IMAGE064
均具有正相关影响。其中,
Figure 896832DEST_PATH_IMAGE062
Figure 36826DEST_PATH_IMAGE018
对转发组指标具有强影响,
Figure 475898DEST_PATH_IMAGE064
对转发组指标具有一般影响。而评论用户的平均接触速率
Figure 752158DEST_PATH_IMAGE123
和易感用户的平均评论概率
Figure 251273DEST_PATH_IMAGE017
对转发组指标具有弱负相关影响,转发用户的平均免疫速率
Figure 878563DEST_PATH_IMAGE021
对转发组指标具有一般负相关影响。说明可以通过增大
Figure DEST_PATH_IMAGE151
Figure 449222DEST_PATH_IMAGE064
,减小
Figure 845568DEST_PATH_IMAGE123
Figure 250005DEST_PATH_IMAGE017
Figure 376310DEST_PATH_IMAGE021
来提高转发信息的传播强度,扩大转发信息的影响力,同时扩大转发群体规模。
以上结果表明,增大
Figure 422763DEST_PATH_IMAGE064
有利于扩大信息传播的规模,增大参数
Figure 673616DEST_PATH_IMAGE123
Figure 311271DEST_PATH_IMAGE017
Figure 913153DEST_PATH_IMAGE021
同时减小
Figure 497719DEST_PATH_IMAGE148
Figure 603078DEST_PATH_IMAGE018
Figure 614896DEST_PATH_IMAGE150
有利于扩大评论信息传播的强度与广度,减小参数
Figure 704075DEST_PATH_IMAGE123
Figure 623489DEST_PATH_IMAGE017
Figure 848934DEST_PATH_IMAGE021
同时增大
Figure 297233DEST_PATH_IMAGE148
Figure 342550DEST_PATH_IMAGE018
Figure 268917DEST_PATH_IMAGE150
有利于扩大转发信息传播的强度与广度。因此,可以有机地调整这些参数的大小来影响评论、转发信息的强度与广度,进而影响信息传播规模,达到调控信息传播的目的。
此外,易感用户的平均评论概率
Figure 614448DEST_PATH_IMAGE017
、平均转发概率
Figure 968069DEST_PATH_IMAGE018
和评论用户的平均转发概率
Figure 562998DEST_PATH_IMAGE152
也是本模型非常重要的参数,体现了模型中评论和转发群体的影响力,是影响信息传播规模的重要因素。除了明确他们对
Figure 293057DEST_PATH_IMAGE023
Figure 493094DEST_PATH_IMAGE024
Figure 17616DEST_PATH_IMAGE117
Figure 37525DEST_PATH_IMAGE118
指标的相关性影响之外,还需进一步研究它们对表征传播趋势的各变量(有效评论用户人数
Figure 305695DEST_PATH_IMAGE073
、有效转发用户人数
Figure 360239DEST_PATH_IMAGE074
、累积评论量
Figure 117979DEST_PATH_IMAGE102
和累积转发量
Figure 890763DEST_PATH_IMAGE103
)的具体影响。为此,在本发明的一个应用实施例中,使用单个参数变化的方法,对
Figure 697045DEST_PATH_IMAGE017
Figure 606095DEST_PATH_IMAGE018
Figure 472420DEST_PATH_IMAGE019
进行参数敏感性分析,结果如图8所示。
由模型的参数拟合结果可知,评论用户的平均接触速率
Figure 732500DEST_PATH_IMAGE153
,转发用户的平均接触速率
Figure DEST_PATH_IMAGE154
,易感用户的平均评论概率
Figure 670369DEST_PATH_IMAGE155
,易感用户的平均转发概率
Figure DEST_PATH_IMAGE156
,评论用户的平均转发概率
Figure 230664DEST_PATH_IMAGE157
,评论用户的平均免疫速率
Figure DEST_PATH_IMAGE158
,转发用户的平均免疫速率
Figure 799048DEST_PATH_IMAGE159
,初始易感人群总数
Figure DEST_PATH_IMAGE160
。分别改变易感用户的平均评论概率
Figure 812004DEST_PATH_IMAGE017
、平均转发概率
Figure 225667DEST_PATH_IMAGE018
以及评论用户的平均转发概率
Figure 906048DEST_PATH_IMAGE019
,同时保持其他参数不变,研究受单一参数变化引起的信息传播指标变化。例如,图8最左侧的波动示意图中,仅改变参数
Figure 379754DEST_PATH_IMAGE017
的值,保持其他参数为默认值不变。
通过观察图8最左侧的波动示意图中转发传播曲线
Figure 348847DEST_PATH_IMAGE074
Figure 300623DEST_PATH_IMAGE161
随易感用户平均评论概率
Figure 38772DEST_PATH_IMAGE017
的变化,可以看出,参数
Figure 683380DEST_PATH_IMAGE017
几乎不影响其前半程传播,而对其后半程传播起到十分显著的负向影响;与此同时,对于评论传播曲线
Figure 139769DEST_PATH_IMAGE073
Figure 895235DEST_PATH_IMAGE102
,参数
Figure 284628DEST_PATH_IMAGE017
则几乎对其全程都有着较为显著的正向影响。参数
Figure 100137DEST_PATH_IMAGE017
越大,信息评论峰值
Figure 43823DEST_PATH_IMAGE023
越大,信息评论传播最终规模
Figure 337401DEST_PATH_IMAGE117
越大,而信息转发峰值
Figure 50142DEST_PATH_IMAGE024
越小,信息转发传播最终规模
Figure DEST_PATH_IMAGE162
越小。通过增大易感用户的平均评论概率
Figure 98869DEST_PATH_IMAGE017
有利于增强评论信息的传播影响力,扩大评论信息传播规模,同时削弱转发信息的传播影响力,减小转发信息传播规模。
通过观察图8中间的波动示意图中评论传播曲线
Figure 529851DEST_PATH_IMAGE073
Figure 627120DEST_PATH_IMAGE102
和转发传播曲线
Figure 194367DEST_PATH_IMAGE163
Figure 97818DEST_PATH_IMAGE103
随易感用户平均转发概率
Figure 16096DEST_PATH_IMAGE018
的变化,可以看出,对于评论传播曲线,参数
Figure 917056DEST_PATH_IMAGE018
对其前半程传播几乎没有影响,但对后半程传播有着十分显著的负向影响;对于转发传播曲线,参数
Figure 338810DEST_PATH_IMAGE018
则几乎对全程都有着较为显著的正向影响。通过观察图8最右侧的波动示意图中评论、转发传播曲线随评论用户平均转发概率
Figure 463761DEST_PATH_IMAGE019
的变化,可以发现参数
Figure 603755DEST_PATH_IMAGE152
对所有曲线的前半程传播几乎没有影响,而对评论传播曲线的后半程起到负向影响,对转发传播曲线的后半程起到正向影响。分别以0.01、0.45为单位改变参数
Figure 308406DEST_PATH_IMAGE018
Figure 584666DEST_PATH_IMAGE019
的值,对比图8中间和最右侧的波动示意图,可以看出参数
Figure 83781DEST_PATH_IMAGE018
对各变量的影响效果明显比参数
Figure 711071DEST_PATH_IMAGE019
的大。参数
Figure 750571DEST_PATH_IMAGE018
Figure 146918DEST_PATH_IMAGE019
越大,信息转发峰值
Figure 816934DEST_PATH_IMAGE024
越大、信息转发传播最终规模
Figure 931520DEST_PATH_IMAGE118
越大,而信息评论峰值
Figure 446815DEST_PATH_IMAGE023
越小、信息评论传播最终规模
Figure 963247DEST_PATH_IMAGE117
越小。实验结果说明增大参数
Figure 804164DEST_PATH_IMAGE018
Figure 202784DEST_PATH_IMAGE019
,能够增强转发信息的传播影响力、扩大转发信息传播规模,同时削弱评论信息的传播影响力、减小评论信息的传播规模。
上述结论说明,易感用户的平均评论概率
Figure 787349DEST_PATH_IMAGE017
、易感用户的平均转发概率
Figure 158288DEST_PATH_IMAGE018
和评论用户的平均转发概率
Figure 170106DEST_PATH_IMAGE019
对有效评论用户人数
Figure 728127DEST_PATH_IMAGE073
、有效转发用户人数
Figure 116383DEST_PATH_IMAGE074
、累积评论量
Figure 341828DEST_PATH_IMAGE102
和累积转发量
Figure 524547DEST_PATH_IMAGE103
都有重要的影响。因此,可以调整参数
Figure 897760DEST_PATH_IMAGE017
Figure 824127DEST_PATH_IMAGE018
Figure 904079DEST_PATH_IMAGE019
的大小来影响信息传播的趋势,调节信息传播的强度及信息传播的广度,从而有效地调控信息传播。
根据本发明的模型的定义,个体情感交互阈值
Figure 257700DEST_PATH_IMAGE046
决定群体不同个体间是否能够产生情感交互。只有当两个个体间情感值之差小于设定的情感交互阈值
Figure 55892DEST_PATH_IMAGE046
,这两个个体才能产生情感交互。显然,个体情感交互阈值
Figure 582688DEST_PATH_IMAGE046
越大,个体越容易产生情感交互。当两个个体产生情感交互后,情感值的改变程度主要取决于情感固守程度
Figure 517146DEST_PATH_IMAGE047
的大小。情感固守程度
Figure 307247DEST_PATH_IMAGE065
表示个体对自身原有情感的固执程度,
Figure 592735DEST_PATH_IMAGE047
越大,该个体在与其他个体进行情感交互时,越坚持己见,越不容易改变自己的情感,用户的情感也越难达成一致。
以下通过两个相关实验,分别改变HK情感交互模型中个体情感交互阈值
Figure 595326DEST_PATH_IMAGE046
和情感固守程度
Figure 649870DEST_PATH_IMAGE047
的大小,研究单个参数对传播用户情感最终稳定状态的影响。假设初始时刻各状态用户的情感值与实例事件中用户的情感值保持一致。首先,固定情感固守程度
Figure DEST_PATH_IMAGE164
不变,只改变个体情感交互阈值
Figure 938769DEST_PATH_IMAGE046
进行实验,设置个体情感交互阈值
Figure 445973DEST_PATH_IMAGE046
以0.05为单位逐渐增大,而情感固守程度
Figure 517835DEST_PATH_IMAGE047
保持0.6不变。图9示出了根据本发明实施例的情感交互阈值变化引起的用户情感稳态变化示意图。如图9所示,当个体情感交互阈值
Figure 426885DEST_PATH_IMAGE165
时,模型预测的最终群体分歧情感束为4个;个体情感交互阈值
Figure DEST_PATH_IMAGE166
时,模型预测的最终群体分歧情感束为3个;个体情感交互阈值
Figure 824368DEST_PATH_IMAGE167
时,模型预测最终没有群体分歧情感束,不同用户之间情感达成统一。在0~18轮次,不断有新增传播者不断加入,个体情感交互阈值
Figure 84448DEST_PATH_IMAGE046
越大,个体间越容易产生情感交互,情感越可能趋于一致。从第19轮次开始,用户情感演化过程中无新增传播者,个体情感交互阈值
Figure 491159DEST_PATH_IMAGE046
越大,个体间情感交互的剧烈程度越大,情感交互最终达到稳态时留下的单独情感束越少。上述结果说明,个体情感交互阈值
Figure 520295DEST_PATH_IMAGE046
越大,个体越容易受到环境情绪的影响,不同用户的情感也越容易达成一致。
然后固定个体情感交互阈值
Figure 557521DEST_PATH_IMAGE046
不变,只改变情感固守程度
Figure 39318DEST_PATH_IMAGE047
进行实验,设置情感固守程度
Figure 452981DEST_PATH_IMAGE047
以0.1为单位逐渐增大,而个体情感交互阈值
Figure 336624DEST_PATH_IMAGE046
保持0.15不变。图10示出了根据本发明实施例的情感固守程度变化引起的用户情感稳态变化示意图。如图10所示,情感固守程度
Figure 607068DEST_PATH_IMAGE060
时,用户情感需要交互39次达到稳态;情感固守程度
Figure DEST_PATH_IMAGE168
时,用户情感需要交互44次达到稳态;情感固守程度
Figure 107320DEST_PATH_IMAGE169
时,用户情感需要交互51次达到稳态。从图中还可以看出,在新增传播者不断加入的情感演化阶段(0~8轮次),情感固守程度
Figure 793516DEST_PATH_IMAGE047
越大,个体在与其他个体进行情感交互时,越坚持己见,在新增传播者加入后,用户间情感交互的剧烈程度越小;在无新增传播者的情感演化阶段(第19轮次以后),情感固守程度
Figure 797244DEST_PATH_IMAGE047
越大,所需交互成本越高,用户情感达到平稳所需交互次数越多,即需要更长的时间用户情感才能达到稳态。上述结果表明,情感固守程度
Figure 176273DEST_PATH_IMAGE164
越大,个体间情感交互的剧烈程度越小,需要更多交互次数才能使用户情感达到稳态。虽然情感固守用户只占20%,但其对用户情感演化的影响较为显著.
通过以上两个对比实验,可以确定情感交互阈值
Figure 644381DEST_PATH_IMAGE046
越大,个体间越容易产生情感交互;用户的情感固守程度
Figure 196585DEST_PATH_IMAGE047
越小,用户越容易接受其他用户的情感,最终用户情感到达稳态后越容易达成一致。因此,可以通过调整情感交互阈值
Figure 54819DEST_PATH_IMAGE046
和情感固守程度
Figure 870329DEST_PATH_IMAGE047
的大小来影响个体间情感交互的剧烈程度以及不同用户情感的差异程度,从而影响用户对公众卫生事件讨论的参与度,达到信息传播引导、提示、警醒等作用。
如上参照附图以示例的方式描述根据本发明的基于个体情感交互的混合信息传播动力学模型及应用该模型进行信息传播分析的方法。但是,本领域技术人员应当理解,对于上述本发明所提出的基于个体情感交互的混合信息传播动力学模型及应用该模型进行信息传播分析的方法,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (9)

1.一种基于混合信息传播动力学模型进行信息传播分析的方法,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,在所述信息传播动力学模型中,
假设信息传播在一个封闭稳定的环境中进行,所述环境的总人数
Figure DEST_PATH_IMAGE001
不变,将
Figure 561520DEST_PATH_IMAGE001
分为易 感状态
Figure DEST_PATH_IMAGE002
、评论状态
Figure DEST_PATH_IMAGE003
、转发状态
Figure DEST_PATH_IMAGE004
以及免疫状态
Figure DEST_PATH_IMAGE005
四个群体,并且假设在任意时刻,人群中 的每个个体所处状态唯一;所述信息传播动力学模型中各状态代表的含义如下:
易感状态
Figure 337715DEST_PATH_IMAGE002
:处于该状态的个体还未接触到信息,但未来有可能接触到信息并受该信息 的影响,从而产生评论或转发行为;
评论状态
Figure 648610DEST_PATH_IMAGE003
:处于该状态的个体产生了评论的行为,具有使处于易感状态的个体接触该 信息并产生评论行为的能力;同时,随着信息传播的推进,处于该状态的个体未来有可能产 生转发行为,进一步推动信息传播;
转发状态
Figure 76443DEST_PATH_IMAGE004
:处于该状态的个体产生了转发的行为,具有感染处于易感状态的个体、处 于评论状态的个体转发信息的能力;
免疫状态
Figure 421974DEST_PATH_IMAGE005
:处于该状态的群体由以下两部分组成:
处于评论或转发状态的个体超过了活跃的曝光期,不再有能力影响其他人,从而转换为免疫状态;以及
处于易感状态、评论状态的个体,接触到信息后,由于主观上对信息不感兴趣而直接转换为免疫状态;
定义
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE008
以及
Figure DEST_PATH_IMAGE009
Figure DEST_PATH_IMAGE010
时刻处于各状态的有效传播个体总数,且
Figure DEST_PATH_IMAGE011
所述信息传播动力学模型的公式如下:
Figure DEST_PATH_IMAGE013
其中,
Figure DEST_PATH_IMAGE014
为评论用户的平均接触速率,表示处于评论状态的个体能够接触到其他个体 的平均速率;
Figure DEST_PATH_IMAGE015
为转发用户的平均接触速率,表示处于转发状态的个体能够接触到其他个 体的平均速率;
Figure DEST_PATH_IMAGE016
为易感用户的平均评论概率,表示处于易感状态的个体在接触到信息后 以评论的方式参与信息传播的平均评论概率;
Figure DEST_PATH_IMAGE017
为易感用户的平均转发概率,表示处于易 感状态的个体在接触到信息后以转发的方式参与信息传播的平均转发概率;
Figure DEST_PATH_IMAGE018
为评论用户 的平均转发概率,表示处于评论状态的个体由于自身兴趣因素以转发的方式继续参与信息 传播的平均转发概率;
Figure DEST_PATH_IMAGE019
为评论用户的平均免疫速率,表示处于评论状态的个体在信息的 传播中变得不活跃的平均免疫速率;
Figure DEST_PATH_IMAGE020
为转发用户的平均免疫速率,表示处于转发状态的 个体在信息的传播中变得不活跃的平均免疫速率;
所述方法包括:
利用所述信息传播动力学模型进行信息传播分析;以及,
在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析;
其中,利用所述信息传播动力学模型进行信息传播分析的方法包括:
基于预设的搜索引擎在预设社交平台搜索并采集待分析事件的原始信息数据,所述信息数据包括用户评论文本、转发文本以及转发时间、评论时间;
对所述原始信息数据进行预处理,以获取每条信息下无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间;
以所述无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间为数据驱动,利用最小二乘法估计信息传播动力学模型的参数和初始易感人群总数;
基于所述参数和初始易感人群总数,通过所述信息传播动力学模型确定所述待分析事件的信息传播指标数据。
2.如权利要求1所述的基于混合信息传播动力学模型进行信息传播分析的方法,其特征在于,在所述情感动力学模型中,用评论群体和转发群体表示传播群体,所述传播群体中个体的情感交互更新规则描述如下:
Figure DEST_PATH_IMAGE021
其中,以个体
Figure DEST_PATH_IMAGE022
为例,
Figure DEST_PATH_IMAGE023
表示
Figure DEST_PATH_IMAGE024
时刻个体
Figure 683584DEST_PATH_IMAGE022
的情感值,
Figure DEST_PATH_IMAGE025
表示
Figure DEST_PATH_IMAGE026
时刻个体
Figure 45558DEST_PATH_IMAGE022
的情感值,
Figure DEST_PATH_IMAGE027
为情感固守程度,表示个体对自身原有情感的坚持程度;
Figure DEST_PATH_IMAGE028
表示个体对其 他个体情感的信任程度;
Figure DEST_PATH_IMAGE029
表示
Figure 634671DEST_PATH_IMAGE010
时刻与个体
Figure DEST_PATH_IMAGE030
情感值之差小于设定个体情感交互阈 值
Figure DEST_PATH_IMAGE031
的评论和转发个体集合,个体情感交互阈值
Figure DEST_PATH_IMAGE032
表示个体间的情感差异度,
Figure DEST_PATH_IMAGE033
Figure DEST_PATH_IMAGE034
表示集合
Figure DEST_PATH_IMAGE035
的总人数,
Figure DEST_PATH_IMAGE036
表示集合
Figure 742697DEST_PATH_IMAGE035
中所有个体 的平均情感值,
Figure DEST_PATH_IMAGE037
表示个体
Figure 1640DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE038
时刻对自身
Figure 818287DEST_PATH_IMAGE010
时刻情感的保留值,
Figure DEST_PATH_IMAGE039
表示个体
Figure 130799DEST_PATH_IMAGE030
Figure 185343DEST_PATH_IMAGE038
时刻对
Figure 411925DEST_PATH_IMAGE010
时刻其他个体情感的接受值。
3.如权利要求2所述的基于混合信息传播动力学模型进行信息传播分析的方法,其特征在于,
所述情感包括正面情感、中立情感和负面情感;
将所述情感量化为(0,1)区间的连续数值,并划分成三种情感区间,分别为:负面情感区间(0,0.4),中立情感区间(0.4,0.7),以及正面情感区间(0.7,1);
当两个个体间的情感值之差小于设定的个体情感交互阈值
Figure 184709DEST_PATH_IMAGE031
时,所述两个个体产生情 感交互,从而有可能使自己的情感值发生改变;反之,如果两个个体间的情感值之差大于所 述个体情感交互阈值
Figure 882668DEST_PATH_IMAGE031
,则所述两个个体无法产生情感交互。
4.如权利要求1-3中任一项所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,
在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析之前,还包括:
基于预设的情感词典,对所述无噪声冗余的用户评论文本、转发文本中蕴含的情感进行识别;
基于预设的情感量化规则,将所识别的情感进行量化分类;
所述在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析的方法包括:基于所述情感动力学模型分析和预测传播用户的情感演变过程;以及,在所述信息传播动力学模型的基础上结合所述情感演变过程进行信息传播分析。
5.如权利要求4所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中, 所述信息传播指标数据包括信息传播可再生数
Figure DEST_PATH_IMAGE040
、信息传播峰值、信息传播最终规模以及 信息传播高潮时间;其中,
所述信息传播可再生数
Figure 588456DEST_PATH_IMAGE040
用于判断信息是否可能爆发传播;
所述信息传播峰值包括信息评论峰值和信息转发峰值;
所述信息传播最终规模包括通过评论行为传播的最终规模和通过转发行为传播的最终规模;
所述信息传播高潮时间包括到达信息评论峰值的时间和到达信息转发峰值的时间。
6.如权利要求5所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中, 所述信息传播可再生数
Figure 720360DEST_PATH_IMAGE040
通过以下式子进行计算获取:
Figure DEST_PATH_IMAGE041
其中,
Figure DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
为列向量,
Figure DEST_PATH_IMAGE044
数学符号表示向量的转置,
Figure 606539DEST_PATH_IMAGE043
表示具有传播 能力的群体;
Figure DEST_PATH_IMAGE045
是列向量
Figure 950933DEST_PATH_IMAGE043
中的第一个元素,表示
Figure 980069DEST_PATH_IMAGE010
时刻有效评论用户总数;
Figure DEST_PATH_IMAGE046
是列向 量
Figure 814032DEST_PATH_IMAGE043
中的第二个元素,表示
Figure 561409DEST_PATH_IMAGE010
时刻有效转发用户总数;
Figure DEST_PATH_IMAGE047
表示对向量
Figure 194646DEST_PATH_IMAGE043
中的各元素求导;
Figure DEST_PATH_IMAGE048
包含两个元素,其中第一个元素为t时刻成为评论用户的用户人数,第二个元素为t 时刻成为转发用户的用户人数;
Figure DEST_PATH_IMAGE049
同样包含两个元素,其中第一个元素为t时刻不再是 评论用户的用户人数,第二个元素为t时刻不再是转发用户的用户人数;根据所述信息传播 动力学模型的公式,得到:
Figure DEST_PATH_IMAGE050
其中,
Figure DEST_PATH_IMAGE051
表示
Figure 704387DEST_PATH_IMAGE010
时刻易感用户成为评论用户的人数,
Figure DEST_PATH_IMAGE052
表示
Figure 709252DEST_PATH_IMAGE010
时刻易感用户和评论用户成为转发用户的人数;
Figure DEST_PATH_IMAGE053
表示
Figure 710969DEST_PATH_IMAGE010
时刻评论用户成为转发用户和免疫用户的人数,
Figure DEST_PATH_IMAGE054
表示
Figure 193903DEST_PATH_IMAGE010
时刻转发用户成为免疫用户的人数;
假设存在无信息传播平衡态
Figure DEST_PATH_IMAGE055
Figure DEST_PATH_IMAGE056
代表初始易感人群总数,在无信 息传播平衡态下基于
Figure 463210DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE057
的表达式分别对
Figure 904556DEST_PATH_IMAGE045
Figure 360945DEST_PATH_IMAGE046
求偏导,对应得到矩阵
Figure DEST_PATH_IMAGE058
及矩阵
Figure DEST_PATH_IMAGE059
Figure DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
则得到特征方程如下:
Figure DEST_PATH_IMAGE062
其中,
Figure DEST_PATH_IMAGE063
为特征值,
Figure DEST_PATH_IMAGE064
表示单位矩阵,
Figure DEST_PATH_IMAGE065
代表
Figure 899767DEST_PATH_IMAGE059
的逆矩阵;通过计算所述特征方程的 特征根可推导出所述信息传播可再生数
Figure 492422DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE066
其中,
Figure DEST_PATH_IMAGE067
为所述特征方程的第一个特征根,
Figure DEST_PATH_IMAGE068
为所述特征方程的第二个特征根,信 息传播可再生数
Figure 46945DEST_PATH_IMAGE040
取两个特征根中的最大值。
7.如权利要求6所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,在利用最小二乘法估计所述信息传播动力学模型的参数和初始易感人群总数的过程中,
设置参数矢量为
Figure DEST_PATH_IMAGE069
,用
Figure DEST_PATH_IMAGE070
表示
Figure DEST_PATH_IMAGE071
时刻累积转发 量的模拟值,用
Figure DEST_PATH_IMAGE072
表示
Figure 318527DEST_PATH_IMAGE071
时刻累积评论量的模拟值,用
Figure DEST_PATH_IMAGE073
表示
Figure 910307DEST_PATH_IMAGE071
时刻累积转发量 的真实值,用
Figure DEST_PATH_IMAGE074
表示
Figure 154207DEST_PATH_IMAGE071
时刻累积评论量的真实值;由此,可以得到最小二乘
Figure DEST_PATH_IMAGE075
误差函数:
Figure DEST_PATH_IMAGE076
其中,
Figure 202934DEST_PATH_IMAGE075
为残差平方和,
Figure DEST_PATH_IMAGE077
代表采样时间;
在数据拟合的过程中,所述信息传播动力学模型的参数需要满足以下条件:
Figure DEST_PATH_IMAGE078
Figure DEST_PATH_IMAGE079
Figure DEST_PATH_IMAGE080
8.如权利要求7所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,用于表征信息传播规模的物理量包括累积评论量和累积转发量,其中,所述累积评论量用于表征评论群体的规模,所述累积转发量用于表征转发群体的规模;所述累积评论量和所述累积转发量的方程为:
Figure DEST_PATH_IMAGE081
,
Figure DEST_PATH_IMAGE082
其中,
Figure DEST_PATH_IMAGE083
表示
Figure 948430DEST_PATH_IMAGE010
时刻的累积评论量,
Figure DEST_PATH_IMAGE084
表示
Figure 576857DEST_PATH_IMAGE010
时刻的累积转发量。
9.如权利要求5~8中任一项所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,信息的累积转发量和累积评论量均为随时间变化的曲线,总体趋势先快速上升,后平稳上升,最终趋于稳定;有效评论量和有效转发量均为随时间增加先上升后下降的钟形曲线;
将表征有效评论量的钟形曲线的最大值定义为信息评论峰值
Figure DEST_PATH_IMAGE085
,所述信息评论峰 值
Figure 940842DEST_PATH_IMAGE085
用于表示信息通过评论行为传播的强度;将表征有效转发量的钟形曲线的最大值 定义为信息转发峰值
Figure DEST_PATH_IMAGE086
,所述信息转发峰值
Figure 363733DEST_PATH_IMAGE086
表示信息通过转发行为传播的强度;
同时,将累积评论量
Figure 485273DEST_PATH_IMAGE083
的稳态值定义为信息通过评论行为传播的最终规模
Figure DEST_PATH_IMAGE087
, 所述通过评论行为传播的最终规模
Figure 418856DEST_PATH_IMAGE087
表示信息通过评论行为传播的广度;将累积转发 量
Figure 840610DEST_PATH_IMAGE084
的稳态值定义为信息通过转发行为传播的最终规模
Figure DEST_PATH_IMAGE088
,所述通过转发行为传 播的最终规模
Figure 965561DEST_PATH_IMAGE088
表示信息通过转发行为传播的广度;
以及,将到达信息评论峰值的时间定义为
Figure DEST_PATH_IMAGE089
,将到达信息转发峰值的时间定义为
Figure DEST_PATH_IMAGE090
,利用所述信息传播高潮时间衡量信息传播过程中用户分别通过评论行为和转发行 为到达信息评论峰值和信息转发峰值的快慢。
CN202210218560.9A 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法 Active CN114298009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210218560.9A CN114298009B (zh) 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210218560.9A CN114298009B (zh) 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法

Publications (2)

Publication Number Publication Date
CN114298009A CN114298009A (zh) 2022-04-08
CN114298009B true CN114298009B (zh) 2022-06-21

Family

ID=80978688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210218560.9A Active CN114298009B (zh) 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法

Country Status (1)

Country Link
CN (1) CN114298009B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115132369B (zh) * 2022-06-09 2023-05-02 中国传媒大学 基于社交媒体拟态环境建模的信息传播分析方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN109727154A (zh) * 2019-01-29 2019-05-07 重庆理工大学 一种基于时变阻尼运动的在线社交网络信息传播分析方法
CN111460679A (zh) * 2020-04-17 2020-07-28 中国传媒大学 基于动力学的同步交叉信息传播分析方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8473437B2 (en) * 2010-12-17 2013-06-25 Microsoft Corporation Information propagation probability for a social network
CN106156030A (zh) * 2014-09-18 2016-11-23 华为技术有限公司 社交网络中预测信息传播的方法及设备
CN108540369A (zh) * 2018-03-06 2018-09-14 南京邮电大学 考虑用户重度传播行为的sndr信息传播过程描述方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN109727154A (zh) * 2019-01-29 2019-05-07 重庆理工大学 一种基于时变阻尼运动的在线社交网络信息传播分析方法
CN111460679A (zh) * 2020-04-17 2020-07-28 中国传媒大学 基于动力学的同步交叉信息传播分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于信息形式的微博舆情传播模型研究;吴谦等;《通信技术》;20180110(第01期);全文 *

Also Published As

Publication number Publication date
CN114298009A (zh) 2022-04-08

Similar Documents

Publication Publication Date Title
Werner et al. Expert judgement for dependence in probabilistic modelling: A systematic literature review and future research directions
Seker Computerized argument Delphi technique
Zhao et al. Automatically learning topics and difficulty levels of problems in online judge systems
Hix-Small et al. A multivariate associative finite growth mixture modeling approach examining adolescent alcohol and marijuana use
Kotte et al. Intergenerational transmission of fertility intentions and behaviour in Germany: The role of contagion
CN113282841B (zh) 基于建模的公众话题传播评估方法及系统
CN102075352A (zh) 一种网络用户行为预测的方法和装置
CN110781411B (zh) 一种基于辟谣消息的谣言传播控制方法
CN104182457B (zh) 在社交网络中基于泊松过程模型的事件流行度预测方法
CN113254719B (zh) 一种基于地位理论的在线社交网络信息传播方法
CN114298009B (zh) 混合信息传播动力学模型及其信息传播分析方法
Wang et al. Modeling information diffusion in online social networks with partial differential equations
CN107566249A (zh) 一种训练用于预测社交网络用户转发消息的模型的方法
CN111460679B (zh) 基于动力学的同步交叉信息传播分析方法及系统
CN107784387B (zh) 一种微博事件信息传播的连续动态预测方法
Janssens et al. Predicting the next Pogačar: a data analytical approach to detect young professional cycling talents
CN113517030A (zh) 基于病毒传播网络的基因序列表示学习方法
CN113850446B (zh) 融合时空注意力和异构图卷积网络的信息扩散预测方法
CN115470991A (zh) 基于用户短时情感和演化博弈的网络谣言传播预测方法
CN112269945B (zh) 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法
van den Berg et al. Dynamic risk factors in adult men who committed sexual offenses: Replication and comparison of networks found in two independent samples.
Song et al. Research on public opinion guidance of converging media based on AHP and transmission dynamics
Becatti et al. Collaboration and followership: a stochastic model for activities in bipartite social networks
Fontaine et al. Developmental trajectories of psychopathology: An overview of approaches and applications
CN115132369B (zh) 基于社交媒体拟态环境建模的信息传播分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant