CN114298009A - 混合信息传播动力学模型及其信息传播分析方法 - Google Patents

混合信息传播动力学模型及其信息传播分析方法 Download PDF

Info

Publication number
CN114298009A
CN114298009A CN202210218560.9A CN202210218560A CN114298009A CN 114298009 A CN114298009 A CN 114298009A CN 202210218560 A CN202210218560 A CN 202210218560A CN 114298009 A CN114298009 A CN 114298009A
Authority
CN
China
Prior art keywords
information
forwarding
emotion
propagation
comment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210218560.9A
Other languages
English (en)
Other versions
CN114298009B (zh
Inventor
殷复莲
马瑞
梁彤宇
王锦霞
唐鑫夷
邝清华
夏欣雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN202210218560.9A priority Critical patent/CN114298009B/zh
Publication of CN114298009A publication Critical patent/CN114298009A/zh
Application granted granted Critical
Publication of CN114298009B publication Critical patent/CN114298009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于个体情感交互的混合信息传播动力学模型及其信息传播分析方法,沿用结合两种模型的思路,改进原有的SFI模型,考虑评论对事件传播的影响,将传播群体扩展为转发群体和评论群体。同时利用基于情感词典的分析方法对传播用户观点中所蕴含的情感进行识别,将观点动力学延拓至情感动力学并融合信息传播动力学,从而建立了基于个体情感交互的混合信息传播动力学模型,可以有效分析出传播用户情感传播的一般模式,并在一定程度上预测受相关衍生事件影响后用户再度参与信息传播的情感演变态势。

Description

混合信息传播动力学模型及其信息传播分析方法
技术领域
本发明涉及模型构建技术领域,更为具体地,涉及一种基于个体情感交互的混合信息传播动力学模型及该模型进行信息传播分析的方法。
背景技术
自传染病模型成功解释生物疾病的传播规律以来,人们不断将传染病模型进行推广,并且在多个领域都取得了良好的成果。在传染病模型的研究中,最为经典的是SIR(Susceptible-Infected-Recovered)模型,在SIR模型中,人群被划分为三类:易感者、感染者和治愈者。在SIR模型基础上发展出的SFI(Susceptible-Forwarding-Immune)模型是SIR模型在信息传播领域的应用,聚焦还未接触事件但对事件可能产生兴趣的易感者、知晓事件信息并产生转发行为的转发者,和对事件已经不感兴趣或失去影响力的免疫者,利用已知的真实信息数据预测事件的传播趋势。
信息传播是用户进行观点交流的过程,而观点是影响用户做出传播行为的重要因素,观点动力学试图从微观个体间的意见交互来解释宏观群体间意见的形成机理。目前主流的观点动力学模型被分成离散模型和连续观点模型。在离散模型中,个体的观点只有赞成和反对两种情况,Sznajd模型是离散模型的典型代表;连续观点动力学中个体的观点值是一定范围内的连续数值,经典模型有DW(Deffuant-Weisbuch)模型和HK(Hegselmann–Krause)模型。
许多学者在将观点动力学与信息传播动力学相结方面进行了研究。例如,Liang等人基于吸收定律和改进的信任传播与聚集方法,结合改进的SIR模型和HK模型调查了网络社区之间的观点对于公共信息传播的影响。中国专利申请CN108540369A公开的一种考虑用户重度传播行为的SNDR信息传播过程描述方法,结合用户重度传播行为将用户分为4类节点,结合上述划分节点,建立SNDR信息传播模型,根据该模型对信息传播过程进行描述,针对感染概率固定,并考虑由于主观或者利益因素导致的在微博社交网络中传播用户群体中进行深度传播、发表评论并转播和多次传播的行为对信息传播的影响。中国专利申请CN106649685A公开的一种考虑带评论转发行为的SEIAR谣言传播过程描述方法,在传统的病毒式感染模型的基础上,考虑了节点属性差异的因素。中国专利申请CN111460679A公开的一种基于动力学的同步交叉信息传播分析方法及系统,将网络用户的状态分为易感状态、转发状态和免疫状态三种用户状态;构建随着两条信息传播,用户在不同用户状态之间转变的交叉信息同步传播动力学模型;采集发布时间间隔小于设定值的两条信息,将它们的网络用户进行用户状态划分,将划分后的两条信息的多个用户状态输入交叉信息同步传播动力学模型,预测随时间变化的不同人群的个体总数。中国专利申请CN112102960A公开的基于动力学的延迟交叉信息传播分析方法及系统,将个体状态划分为易受影响状态、转发状态、超时免疫状态和直接免疫状态;监测个体接触的信息的传播时期并构建传播动力学模型;将各人群的个体总数与信息的转发量相对应,通过对累计转发量的监测根据传播动力学模型信息传播过程中人群的个体总数变化进行预测。中国专利申请 CN110297984B公开的基于微博的信息传播动力系统、构建方法,将微博中用户的状态分为易感状态、转发状态或/和阅读状态以及免疫状态;根据用户状态的变化构建信息传播动力模型;通过对微博的累计转发量或/和累计阅读量的监测根据上述信息传播动力模型对未来的处于各状态的用户数量及变化趋势进行预测。
但是,在上述现有的信息传播动力学模型中,并未有研究曾考虑过拓展信息渠道,考虑信息传播除转发传播以外的传播途径,同时也并未考虑到传播用户的情感演变过程,因此不能满足当今对公共事件的分析,从而导致模型不理想。
发明内容
鉴于上述问题,本发明考虑到两种社交网络上对情感演化和信息传播发挥重要作用的互动机制:转发和评论,根据用户是否存在以上两种交互行为将其区分为“评论群体”和“转发群体”,并将其统称为“传播群体”。结合情感动力学和信息传播动力学,通过参数敏感性分析技术手段研究模型参数对模型指标的影响,预测受衍生信息影响后用户再度参与信息传播时的情感演变态势,从而基于个体情感交互机制制定有效的信息传播引导策略。
根据本发明的一个方面,提供一种信息传播动力学模型,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,在所述信息传播动力学模型中,
假设信息传播在一个封闭稳定的环境中进行,所述环境的总人数
Figure 802426DEST_PATH_IMAGE001
不变,将
Figure 47462DEST_PATH_IMAGE001
分为 易感状态
Figure 827199DEST_PATH_IMAGE002
、评论状态
Figure 222409DEST_PATH_IMAGE003
、转发状态
Figure 82786DEST_PATH_IMAGE004
以及免疫状态
Figure 905249DEST_PATH_IMAGE005
四个群体,并且假设在任意时刻,人群中 的每个个体所处状态唯一;所述信息传播动力学模型中各状态代表的含义如下:
易感状态
Figure 234599DEST_PATH_IMAGE002
:处于该状态的个体还未接触到信息,但未来有可能接触到信息并受该 信息的影响,从而产生评论或转发行为;
评论状态
Figure 433499DEST_PATH_IMAGE003
:处于该状态的个体产生了评论的行为,具有使处于易感状态的个体接 触该信息并产生评论行为的能力;同时,随着信息传播的推进,处于该状态的个体未来有可 能产生转发行为,进一步推动信息传播;
转发状态
Figure 102378DEST_PATH_IMAGE004
:处于该状态的个体产生了转发的行为,具有感染处于易感状态的个 体、处于评论状态的个体转发信息的能力;
免疫状态
Figure 174370DEST_PATH_IMAGE005
:处于该状态的群体由以下两部分组成:
处于评论或转发状态的个体超过了活跃的曝光期,不再有能力影响其他人,从而转换为免疫状态;以及
处于易感状态、评论状态的个体,接触到信息后,由于主观上对信息不感兴趣而直接转换为免疫状态;
定义
Figure 928699DEST_PATH_IMAGE006
Figure 665711DEST_PATH_IMAGE007
Figure 985834DEST_PATH_IMAGE008
以及
Figure 415678DEST_PATH_IMAGE009
Figure 657304DEST_PATH_IMAGE010
时刻处于各状态的有效传播个体总数,且
Figure 509591DEST_PATH_IMAGE011
所述信息传播动力学模型的公式如下:
Figure 153062DEST_PATH_IMAGE012
其中,
Figure 488228DEST_PATH_IMAGE013
为评论用户的平均接触速率,表示处于评论状态的个体能够接触到其他 个体的平均速率;
Figure 13888DEST_PATH_IMAGE014
为转发用户的平均接触速率,表示处于转发状态的个体能够接触到其 他个体的平均速率;
Figure 92702DEST_PATH_IMAGE015
为易感用户的平均评论概率,表示处于易感状态的个体在接触到信息 后以评论的方式参与信息传播的平均评论概率;
Figure 590680DEST_PATH_IMAGE016
为易感用户的平均转发概率,表示处于 易感状态的个体 在接触到信息后以转发的方式参与信息传播的平均转发概率;
Figure 175376DEST_PATH_IMAGE017
为评论用 户的平均转发概率,表示处于评论状态的个体由于自身兴趣因素以转发的方式继续参与信 息传播的平均转发概率;
Figure 126014DEST_PATH_IMAGE018
为评论用户的平均免疫速率,表示处于评论状态的个体在信息 的传播中变得不活跃的平均免疫速率;
Figure 8520DEST_PATH_IMAGE019
为转发用户的平均免疫速率,表示处于转发状态 的个体在信息的传播中变得不活跃的平均免疫速率。
根据本发明的另一方面,提供了一种基于混合信息传播动力学模型进行信息传播分析的方法,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,其中的信息传播动力学模型为前述的信息传播动力学模型;所述方法包括:
利用所述信息传播动力学模型进行信息传播分析;以及,
在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析;
其中,利用所述信息传播动力学模型进行信息传播分析的方法包括:
基于预设的搜索引擎在预设社交平台搜索并采集待分析事件的原始信息数据,所述信息数据包括用户评论文本、转发文本以及转发时间、评论时间;
对所述原始信息数据进行预处理,以获取每条信息下无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间;
以所述无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间为数据驱动,利用最小二乘法估计所述信息传播动力学模型的参数和初始易感人群总数;
基于所述参数和初始易感人群总数,通过所述信息传播动力学模型确定所述待分析事件的信息传播指标数据。
上述根据本发明的基于个体情感交互的混合信息传播动力学模型及该模型进行信息传播分析方法,通过改进现有的SFI模型,考虑评论用户对事件传播的影响,将传播群体扩展为转发群体和评论群体。同时将观点动力学延拓至情感动力学并融合信息传播动力学,从而建立了基于个体情感交互的混合信息传播动力学模型。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为根据本发明实施例的基于个体情感交互的混合信息传播动力学模型示意图;
图2为根据本发明实施例的基于混合信息传播动力学模型进行信息传播分析的方法流程示意图;
图3为根据本发明实施例的特定事件相关信息评论及转发结构示意图;
图4为根据本发明实施例的特定事件评论和转发信息传播曲线示意图;
图5为根据本发明实施例的特定事件的情感交互模拟示意图;
图6为根据本发明实施例的多样化参数影响下指标
Figure 688900DEST_PATH_IMAGE020
的PRCC结果示意图;
图7为根据本发明实施例的多样化参数影响下指标
Figure 631448DEST_PATH_IMAGE021
Figure 69382DEST_PATH_IMAGE022
Figure 530145DEST_PATH_IMAGE023
Figure 2715DEST_PATH_IMAGE024
的PRCC 结果示意图;
图8为根据本发明实施例的单一参数变化引起的信息传播指标波动示意图;
图9示出了根据本发明实施例的情感交互阈值变化引起的用户情感稳态变化示意图;
图10示出了根据本发明实施例的情感固守程度变化引起的用户情感稳态变化示意图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
本发明立足于当下的社会背景,结合情感动力学和信息传播动力学,从宏观和微观两个层面研究网络信息传播及用户情感演变的过程。在宏观层面,考虑两种社交网络上能够助力于信息传播的特有的互动机制,将用户是否存在“转发”、“评论”交互行为而将其区分为“转发群体”和“评论群体”,通过实验进一步研究这两类群体对信息传播的影响以及其在信息传播过程中规模的变化。在微观层面,深入研究两类传播群体中的个体的情感演化机制,将情感敏感度作为个体特征加入到模型中,再现传播个体在社交网络平台上的情感交互动态过程,包括个体间交互关系的建立与断裂、个体的加入与退出。最终,在目标信息传播周期结束之后,预测再次受到相关衍生信息刺激后传播用户情感的演变趋势。
以下将结合附图对本发明的具体实施例进行详细描述。
以信息传播动力学模型(SCFI)结合情感动力学(HK)模型为例,本发明构建出的基于个体情感交互的混合信息传播动力学模型,即HK-SCFI(Hegselmann–KrauseSusceptible-Commanding-Forwarding-Immune)模型示意图如图1所示。
在图1中,下虚线框表示在单一网络信息的传播过程中不同人群状态的动态变化,图1的上虚线框表示在单一网络信息传播过程中传播个体间的情感交互。灰色空心小人代表评论信息的个体;黑色空心小人代表转发信息的个体;黑色实心小人代表不具有传播影响力的个体;双箭头代表个体间在传播信息的同时交换情感,建立情感交互关系。当媒体发布信息后,人们会通过评论、转发两种方式表达自己对该信息的情感态度,并与他人进行讨论,从而产生情感交互。随着信息传播进程的推进,一些用户的情感态度会发生变化,也会与此前未产生交互的用户建立新的交互关系。
本混合信息传播动力学模型中涉及的全部参数及相应解释如下表1所示。
表1 HK-SCFI模型参数表
Figure 116165DEST_PATH_IMAGE025
在宏观层面,本发明使用SCFI模型来观察传播过程中不同人群状态的动态变化。 在SCFI模型中,假设信息传播在一个封闭稳定的环境中进行,该环境的总人数(
Figure 103712DEST_PATH_IMAGE001
)不变。定 义
Figure 328020DEST_PATH_IMAGE006
Figure 468146DEST_PATH_IMAGE007
Figure 752496DEST_PATH_IMAGE008
以及
Figure 165023DEST_PATH_IMAGE009
Figure 193022DEST_PATH_IMAGE010
时刻处于各状态的有效传播个体总数,且
Figure 171342DEST_PATH_IMAGE011
。将
Figure 361015DEST_PATH_IMAGE001
分为四个群体,即易感状态(
Figure 260838DEST_PATH_IMAGE002
)、评论状态(
Figure 404112DEST_PATH_IMAGE003
)、转发状态 (
Figure 705781DEST_PATH_IMAGE004
)以及免疫状态(
Figure 66355DEST_PATH_IMAGE005
),并且假设在任意时刻,人群中的每个个体所处状态唯一。模型中各状 态代表的含义如下:
(1)易感状态(
Figure 250212DEST_PATH_IMAGE002
):处于该状态的个体还未接触到信息,但未来有可能接触到信息 并受该信息的影响,从而产生评论或转发行为。
(2)评论状态(
Figure 620013DEST_PATH_IMAGE003
):处于该状态的个体产生了评论的行为,具有使处于易感状态的 个体接触该信息并产生评论行为的能力。同时,随着信息传播的推进,处于该状态的个体未 来有可能产生转发行为,进一步推动信息传播。
(3)转发状态(
Figure 510609DEST_PATH_IMAGE004
):处于该状态的个体产生了转发的行为,具有感染处于易感状态 的个体、处于评论状态的个体转发信息的能力。
(4)免疫状态(
Figure 120713DEST_PATH_IMAGE005
):处于该状态的群体由以下部分组成:
a)处于评论或转发状态的个体超过了活跃的曝光期,不再有能力影响其他人,从而转换为免疫状态;
b)处于易感状态、评论状态的个体,接触到信息后,由于主观上对信息不感兴趣而直接转换为免疫状态。
SCFI模型的公式如下:
Figure 729549DEST_PATH_IMAGE026
(1)
在动力学系统中,一个处于评论状态的用户在平均单位时间内会接触到
Figure 230937DEST_PATH_IMAGE027
个用 户,接触到的用户中,处于易感状态的概率为
Figure 241618DEST_PATH_IMAGE028
。所以一个处于评论状态的用户会接触 到
Figure 255580DEST_PATH_IMAGE029
个处于易感状态的用户,他们将以平均评论概率
Figure 351712DEST_PATH_IMAGE015
进行评论,因此,有
Figure 63316DEST_PATH_IMAGE030
个 处于易感状态的用户会受到处于评论状态的活跃用户的影响,其中,有
Figure 256400DEST_PATH_IMAGE031
个用户 会产生评论行为,有
Figure 395257DEST_PATH_IMAGE032
个用户对信息不感兴趣,不参与信息传播。
同理,一个处于转发状态的用户在平均单位时间内会接触到
Figure 978685DEST_PATH_IMAGE033
个处于易感状 态的用户以及
Figure 41450DEST_PATH_IMAGE034
个处于评论状态的用户。接触到的处于易感状态的用户将以平均转发 概率
Figure 26724DEST_PATH_IMAGE016
进行转发,而接触到的处于评论状态的用户将以评论状态平均转发概率
Figure 336482DEST_PATH_IMAGE017
进行转发。
因此,有
Figure 203944DEST_PATH_IMAGE035
个处于易感状态的用户受到处于
Figure 257351DEST_PATH_IMAGE004
状态活跃用户的影响,其中, 有
Figure 97131DEST_PATH_IMAGE036
个用户会产生转发行为,有
Figure 154954DEST_PATH_IMAGE037
个用户对信息不感兴趣,不参 与信息传播;有
Figure 447395DEST_PATH_IMAGE038
个处于评论状态的用户受到处于转发状态的用户的影响,其中, 有
Figure 304493DEST_PATH_IMAGE039
个用户会产生转发行为,有
Figure 795517DEST_PATH_IMAGE040
个用户选择不转发信息,不再 参与信息传播。随着时间的推移,有
Figure 447078DEST_PATH_IMAGE041
个用户超过了曝光期,不再有能力影响 他人。
在研究微观层面个体情感特征时,本发明受到原始HK(Hegselmann-Krause)模型 的启发,基于SCFI模型得到各时刻评论用户有效传播人数
Figure 492395DEST_PATH_IMAGE008
和转发用户有效传播人数
Figure 700653DEST_PATH_IMAGE042
,同时引入意大利经济学家维尔弗雷多·帕累托提出的意大利社会财富分配的研究结 论帕累托定则(Pareto principle),提出一种新的基于信息传播的个体情感演化模型。帕 累托定则原指社会中有20%的人口掌握着80%的社会财富,在这里认为参与传播的用户中有 20%的个体具有情感固守的特性,其情感不易受外界影响轻易改变,而80%的个体对外界情 感接受程度大,其下一时刻的情感近似平均地由当前时刻的自身情感和外界情感共同组 成。
为了进一步研究个体情感的演化规律,本发明基于情感词典,对用户观点中所蕴 含的情感进行识别,利用情感极性词将情感划分正面情感、中立情感和负面情感三种情感, 并分别将其量化为(0,1)区间的连续数值,情感值越接近0表明用户对事件持有的负面情感 越强烈,情感值越接近1表明用户对事件持有的正面情感越强烈。最终划分的情感区间为, 负面情感区间(0,0.4),中立情感值区间(0.4,0.7),以及正面情感值区间(0.7,1)。最后将 量化后的情感值带入情感交互模型,观察个体间的情感交互过程。根据本发明的情感动力 学模型,只有当两个个体间情感值之差小于设定的情感交互阈值
Figure 249446DEST_PATH_IMAGE043
,这两个个体之间才能产 生情感交互,从而有可能使自己的情感值发生改变。反之,如果两个个体的情感值之差大于 情感交互阈值,则这两个个体无法产生情感交互。
在本发明的一个具体实施例中,用
Figure 337488DEST_PATH_IMAGE044
来表示个体对自身原有情感的坚持程度,
Figure 932417DEST_PATH_IMAGE045
表示个体对其他个体情感的信任程度。在本发明的HK-SCFI模型中,信息传播者的情 感更新规则描述如下:
Figure 131318DEST_PATH_IMAGE046
(2)
其中,以个体
Figure 534617DEST_PATH_IMAGE047
为例,
Figure 845425DEST_PATH_IMAGE048
表示t时刻个体
Figure 599754DEST_PATH_IMAGE047
的情感值,
Figure 336766DEST_PATH_IMAGE049
表示
Figure 188047DEST_PATH_IMAGE050
时刻个体
Figure 617892DEST_PATH_IMAGE047
的情感值,
Figure 406987DEST_PATH_IMAGE051
表示
Figure 947690DEST_PATH_IMAGE010
时刻与个体
Figure 591161DEST_PATH_IMAGE052
情感值之差小于设定情感交互阈值
Figure 723065DEST_PATH_IMAGE043
的评论和转发个 体集合,
Figure 451987DEST_PATH_IMAGE053
表示集合
Figure 530801DEST_PATH_IMAGE051
的总人数,
Figure 605942DEST_PATH_IMAGE054
表示集合
Figure 112010DEST_PATH_IMAGE051
中所有个体 的平均情感值,
Figure 328228DEST_PATH_IMAGE055
表示个体
Figure 7471DEST_PATH_IMAGE052
Figure 359955DEST_PATH_IMAGE056
时刻对自身
Figure 302503DEST_PATH_IMAGE010
时刻情感的保留值,
Figure 553487DEST_PATH_IMAGE057
表示个体
Figure 974104DEST_PATH_IMAGE052
Figure 446673DEST_PATH_IMAGE056
时刻对
Figure 622440DEST_PATH_IMAGE010
时刻其他个体情感的接受值。
对于80%的大部分个体,表征情感固守程度的参数
Figure 547670DEST_PATH_IMAGE058
,这表示传播个体在情感 更新时没有特定倾向,不会固守原来的情感,也不会因受外界情感影响而产生较大情感波 动,即个体对自身情感态度的坚持程度与对他人情感态度的接受程度相同。对于20%的情感 固守个体,表征情感固守程度的参数
Figure 817984DEST_PATH_IMAGE059
,这表示传播个体更倾向于保持自身情感不 变,对外界的情感刺激有一定的抵抗作用。
利用本发明提供的HK-SCFI模型,可以分析出用户情感传播的一般模式,并在一定 程度上预测受信息衍生事件影响后用户再度参与信息传播的情感演变态势。针对有关部门 对于不同信息的传播需求,可以通过调整本模型参数的大小,做到增大或减小信息传播规 模以及信息传播强度。例如,可以通过适当与主流媒体合作,调整转发用户的平均接触速率
Figure 145060DEST_PATH_IMAGE060
;在信息中增加问题或添加用户互动模块,调节用户的平均转发概率
Figure 429411DEST_PATH_IMAGE016
或平均评论概率
Figure 169833DEST_PATH_IMAGE015
;通过控制网络中偏激极端传播者,从而调节用户的情感交互阈值
Figure 932253DEST_PATH_IMAGE043
;通过引入拥有大量信 息参与者的特定用户,增大初始易感人群总数
Figure 113836DEST_PATH_IMAGE061
,利用特定用户对信息参与者的影响,改变 用户对不同情感的接受程度,从而调节情感固守程度
Figure 382137DEST_PATH_IMAGE044
。同时也可以通过模型预测的用户再 度参与信息传播的情感演变态趋势,提前做好网络信息治理和情绪引导工作,避免信息衍 生事件导致的负面网络情绪累积,从而营造风清气正的网络环境。
为了更好的说明上述基于混合信息传播动力学模型,本发明还提供一种基于上述混合信息传播动力学模型进行信息传播的方法,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析。该方法包括:方法包括:利用所述信息传播动力学模型进行信息传播分析;以及,在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析。
图2示出了根据本发明实施例的利用信息传播动力学模型进行信息传播分析的方法流程图。
如图2所示,本实施例提供的利用信息传播动力学模型进行信息传播分析的方法包括如下步骤:
S210:基于预设的搜索引擎在预设社交平台搜索并采集待分析事件的原始信息数据,信息数据包括用户评论文本、转发文本以及转发时间、评论时间;其中的待分析事件为信息的某一具体例子,用户评论文本为传播群体中所有评论个体所评论的文本,用户转发文本为传播群体中所有转发个体转发的文本。
S220:对原始信息数据进行预处理,以获取每条信息下无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间;
S230:以所述无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间为数据驱动,利用最小二乘法估计所述信息传播动力学模型的参数和初始易感人群总数;
S240:基于所述参数和初始易感人群总数,通过所述信息传播动力学模型确定所述待分析事件的信息传播指标数据。
此外,在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析之前,还包括:
基于预设的情感词典,对所述无噪声冗余的用户评论文本、转发文本中蕴含的情感进行识别;
基于预设的情感量化规则,将所识别的情感进行量化分类;
具体的,在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析的方法包括:基于所述情感动力学模型分析和预测传播用户的情感演变过程;以及,在所述信息传播动力学模型的基础上结合所述情感演变过程进行信息传播分析。该传播用户包括所有的评论用户和转发用户。
用户在互联网中通过评论和转发两种方式表达自己的观点,观点中含有情绪,携带情绪的观点不断交互最终形成网络信息。
为了对信息传播进行定性定量的分析,本发明中定义了信息传播指标数据,用于 表述信息在信息传播过程中的发展状况。该信息传播指标数据包括信息传播可再生数
Figure 281960DEST_PATH_IMAGE062
、 信息传播峰值、信息传播最终规模以及信息传播高潮时间。其中,信息传播可再生数
Figure 848071DEST_PATH_IMAGE062
用于 判断信息是否可能爆发传播;信息传播峰值用于表示信息传播的强度,包括信息评论峰值 和信息转发峰值;信息传播最终规模包括通过评论行为传播的最终规模和通过转发行为传 播的最终规模;信息传播高潮时间包括到达信息评论峰值的时间和到达信息转发峰值的时 间。
下面将对本发明中的信息传播指标数据的获取方法做进一步详细说明。
信息传播可再生数
Figure 680897DEST_PATH_IMAGE062
在传染病模型中,
Figure 307051DEST_PATH_IMAGE062
为基本可再生数,表示在排除外力干预且所有人都易感的情 况下,每一例新病例所造成继发感染数量的平均值。类似地,在本发明的HK-SCFI模型中,对 基本可再生数进行拓展,用来表示在排除外力干预且所有用户都易感的情况下,每一个传 播用户所引起的继发传播者的平均值,可通过
Figure 694170DEST_PATH_IMAGE062
判断信息是否可能爆发传播。在本发明的 HK-SCFI模型中,信息传播可再生数
Figure 798392DEST_PATH_IMAGE062
可通过以下式子进行计算:
Figure 531731DEST_PATH_IMAGE063
(3)
其中,
Figure 328785DEST_PATH_IMAGE064
Figure 734359DEST_PATH_IMAGE065
为列向量,
Figure 720901DEST_PATH_IMAGE066
数学符号表示向量的转置,
Figure 731582DEST_PATH_IMAGE065
表示具有传播 能力的群体。
Figure 699538DEST_PATH_IMAGE067
是列向量
Figure 123566DEST_PATH_IMAGE065
中的第一个元素,表示
Figure 569591DEST_PATH_IMAGE010
时刻有效评论用户总数;
Figure 700358DEST_PATH_IMAGE068
是列向量
Figure 902799DEST_PATH_IMAGE065
中的第二个元素,表示
Figure 486227DEST_PATH_IMAGE010
时刻有效转发用户总数。其中,有效评论用户总数为根据SCFI模型 计算得到的t时刻评论用户人数,指截止到t时刻为止,动力学系统中还能够有效影响易感 者的评论者数量;有效转发用户总数为是根据SCFI模型计算得到的t时刻转发用户人数,指 截止到t时刻为止,动力学系统中还能够有效影响易感者和评论者的转发者数量。
Figure 735942DEST_PATH_IMAGE069
表示对 向量
Figure 49112DEST_PATH_IMAGE065
中的各元素求导。
Figure 358871DEST_PATH_IMAGE070
包含两个元素,其中第一个元素为t时刻成为评论用户的用户 人数,第二个元素为t时刻成为转发用户的用户人数;
Figure 429595DEST_PATH_IMAGE071
同样包含两个元素,其中第一个 元素为t时刻不再是评论用户的用户人数,第二个元素为t时刻不再是转发用户的用户人 数;
根据前述HK-SCFI模型的公式(1),可得:
Figure 296051DEST_PATH_IMAGE072
(4)
Figure 135831DEST_PATH_IMAGE073
(5)
其中,
Figure 413228DEST_PATH_IMAGE031
表示
Figure 705669DEST_PATH_IMAGE010
时刻易感用户成为评论用户的人数,
Figure 562767DEST_PATH_IMAGE074
表示
Figure 834217DEST_PATH_IMAGE010
时刻易感用户和评论用户成为转发用户的人数;
Figure 485778DEST_PATH_IMAGE075
表示
Figure 531095DEST_PATH_IMAGE010
时刻评论 用户成为转发用户和免疫用户的人数,
Figure 723042DEST_PATH_IMAGE076
表示
Figure 271835DEST_PATH_IMAGE010
时刻转发用户成为免疫用户的人数。
假设系统中存在无信息传播平衡态
Figure 359877DEST_PATH_IMAGE077
Figure 705538DEST_PATH_IMAGE061
代表初始易感人群总数。 在无信息传播平衡态下基于
Figure 638859DEST_PATH_IMAGE078
Figure 370055DEST_PATH_IMAGE079
的表达式分别对
Figure 628998DEST_PATH_IMAGE067
Figure 117748DEST_PATH_IMAGE068
求偏导,对应得到矩阵
Figure 120339DEST_PATH_IMAGE080
及矩阵
Figure 689730DEST_PATH_IMAGE081
Figure 853995DEST_PATH_IMAGE082
(6)
Figure 423516DEST_PATH_IMAGE083
(7)
则可以得到特征方程如下:
Figure 964219DEST_PATH_IMAGE084
(8)
其中,
Figure 342111DEST_PATH_IMAGE085
为特征值,
Figure 755906DEST_PATH_IMAGE086
表示单位矩阵,
Figure 219248DEST_PATH_IMAGE087
代表
Figure 563642DEST_PATH_IMAGE081
的逆矩阵。通过计算特征方程的特 征根可推导出
Figure 858357DEST_PATH_IMAGE062
Figure 364425DEST_PATH_IMAGE088
(9)
其中,
Figure 157806DEST_PATH_IMAGE089
为特征方程的第一个特征根,
Figure 40311DEST_PATH_IMAGE090
为特征方程的第二个特征根,
Figure 392795DEST_PATH_IMAGE062
取 两个特征值中的最大值。
Figure 866502DEST_PATH_IMAGE091
意味着在信息发布之初,评论和转发群体总数呈现下降趋 势,信息不会爆发传播;
Figure 304437DEST_PATH_IMAGE092
则表示在信息发布之初,评论和转发群体总数呈现指数增 长,信息必然爆发传播,并且
Figure 990633DEST_PATH_IMAGE062
越大,信息爆发传播的速度越快。
信息传播峰值、信息传播最终规模以及信息传播高潮时间:
在信息传播过程中,累积量可用于表征信息的传播规模。其中,累积评论量可用于表征评论群体的规模,累积转发量可用于表征转发群体的规模。由前述HK-SCFI模型的公式(1)进一步推导,可以得出两种累积转发量的方程:
Figure 276252DEST_PATH_IMAGE093
, (10)
Figure 389701DEST_PATH_IMAGE094
(11)
其中
Figure 314932DEST_PATH_IMAGE095
表示
Figure 601557DEST_PATH_IMAGE010
时刻的累积评论量,
Figure 928633DEST_PATH_IMAGE096
表示
Figure 212984DEST_PATH_IMAGE010
时刻的累积转发量。
为了将真实数据与模型进行拟合,在本发明的一个具体实施例中,通过最小二乘 法估计模型参数和初始易感人群总数。设置参数矢量为
Figure 411796DEST_PATH_IMAGE097
,用
Figure 439795DEST_PATH_IMAGE098
表示
Figure 621377DEST_PATH_IMAGE099
时刻累积转发量的模拟值,用
Figure 404526DEST_PATH_IMAGE100
表示
Figure 304349DEST_PATH_IMAGE099
时刻累积评论量的模拟值,用
Figure 870459DEST_PATH_IMAGE101
表示
Figure 719598DEST_PATH_IMAGE099
时刻累积转发量的真实值,用
Figure 345751DEST_PATH_IMAGE102
表示
Figure 467291DEST_PATH_IMAGE099
时刻累积评论量的真实值。由此,可以得 到最小二乘
Figure 633830DEST_PATH_IMAGE103
误差函数:
Figure 790005DEST_PATH_IMAGE104
(12)
其中,
Figure 587059DEST_PATH_IMAGE103
为残差平方和,
Figure 773059DEST_PATH_IMAGE105
代表采样时间。在数据拟合的过程中,参数 需要满足以下条件:
Figure 680972DEST_PATH_IMAGE106
Figure 691653DEST_PATH_IMAGE107
Figure 456347DEST_PATH_IMAGE108
信息的累积转发量和累积评论量均为随时间变化的曲线,总体趋势先快速上升, 后平稳上升,最终趋于稳定。有效评论量和有效转发量均为随时间增加先上升后下降的钟 形曲线。本实施例中,将表征有效评论量的钟形曲线的最大值定义为信息评论峰值
Figure 552479DEST_PATH_IMAGE021
,将 表征有效转发量的钟形曲线的最大值定义为信息转发峰值
Figure 264083DEST_PATH_IMAGE022
,用
Figure 473479DEST_PATH_IMAGE021
表示信息通过评论 行为传播的强度,用
Figure 612336DEST_PATH_IMAGE022
表示信息通过转发行为传播的强度。同时将累积评论量
Figure 930185DEST_PATH_IMAGE095
的稳 态值定义为信息通过评论行为传播的最终规模
Figure 507797DEST_PATH_IMAGE109
,将累积转发量
Figure 493070DEST_PATH_IMAGE096
的稳态值定义为 信息通过转发行为传播的最终规模
Figure 802829DEST_PATH_IMAGE110
,用
Figure 653979DEST_PATH_IMAGE109
表示信息通过评论行为传播的广度,用
Figure 707386DEST_PATH_IMAGE110
表示信息通过转发行为传播的广度。通过
Figure 547166DEST_PATH_IMAGE109
Figure 27826DEST_PATH_IMAGE110
能够表示信息传播的最终规模。
本发明将到达信息评论峰值的时间定义为
Figure 913742DEST_PATH_IMAGE111
,将到达信息转发峰值的时间定义 为
Figure 505260DEST_PATH_IMAGE112
,信息传播高潮时间包括到达信息评论峰值的时间
Figure 465126DEST_PATH_IMAGE111
和到达信息转发峰值的时间
Figure 929737DEST_PATH_IMAGE112
,利用信息传播高潮时间衡量信息传播过程中用户分别通过评论行为和转发行为到达 信息评论峰值和信息转发峰值的快慢。
以下,将结合一个应用本发明进行网络信息传播及用户情感演的演变过程的研究实施例,对本发明做更为详细的说明。
本发明在社交平台上对最近发生的信息事件进行广泛搜索,在基于预设的社交平台(本实施例采用的是中国新浪微博平台),发现在#北京确诊病例曾坐地铁1号线和4号线#话题下,各大媒体对北京新增确诊病例的报道引发了网友们的热烈讨论。其中某官方账号对确诊病例17天内主要行程的报道占据了话题榜单的榜首,其微博评论量、转发量在话题均排名第一。通过对该条微博采集用户评论文本、转发文本以及转发时间、评论时间的真实信息数据,获取该事件的评论及转发结构示例图如图3所示。
由于用户转发文本、评论文本存在随机性,因此需要对采集的数进行过滤,以滤除与原博文不相关和毫无意义的转发文本、评论文本。在对数据进行预处理后,可以获得每条信息下无噪声无冗余的转发时间、评论时间及转发文本、评论文本。接着,为了得到最佳的拟合结果,本实施例中,以用户的真实评论、转发量为数据驱动,利用最小二乘法估计模型参数和初始易感人群总数。图4示出了根据本实施例的特定事件评论和转发信息传播曲线。
如图4所示,其中的星号表示真实累积评论量,菱形表示真实累积转发量,粗实线表示通过模型计算得到的累积评论量的模拟值,细实线表示通过模型计算得到的累积转发量的模拟值,虚线表示通过模型计算得到的有效评论量的模拟值,点横线表示通过模型计算得到的有效转发量的模拟值。从数值模拟结果来看,利用本发明的模型的拟合曲线几乎和真实数据点重合,证明本发明的模型能够充分表示信息的传播过程,从而验证了本发明的模型的有效性。
以实际用户真实评论量、转发量为数据驱动得到的参数估计值如下表2所示。
表2 HK-SCFI模型中SCFI模型的参数结果
Figure 709474DEST_PATH_IMAGE114
用户的平均接触速率与网络密度有关,获得的模型参数中评论用户平均接触速率
Figure 901421DEST_PATH_IMAGE115
和转发用户平均接触速率
Figure 715793DEST_PATH_IMAGE060
数值大致相等,说明评论和转发群体的网络密度差异较小。 易感用户的平均评论概率
Figure 538256DEST_PATH_IMAGE015
小于易感用户的平均转发概率
Figure 382453DEST_PATH_IMAGE016
,表明相比于评论行为,易感用 户更愿意通过转发行为表达自己的情感。用户的平均免疫速率与其自身行为规律有关,而 评论用户的平均免疫速率
Figure 581353DEST_PATH_IMAGE018
小于转发用户的免疫速率
Figure 250231DEST_PATH_IMAGE019
,说明评论用户活跃的曝光期较 长,影响信息传播的时间也较长。利用模型数值拟合结果,可以计算出该事件信息传播指标 的具体数值,其数值具体如下表3所示。
表3 特定事件的信息传播指标结果
Figure 243595DEST_PATH_IMAGE116
该事件的信息传播可再生数
Figure 794662DEST_PATH_IMAGE092
,表明在事件信息发布之初,评论和转发群体 总数呈现指数增长,因此信息必然爆发。信息评论峰值
Figure 797253DEST_PATH_IMAGE021
大于信息转发峰值
Figure 399267DEST_PATH_IMAGE022
,表明在 信息传播过程中评论信息传播强度大于转发信息传播强度。到达信息评论峰值所需的时间
Figure 563532DEST_PATH_IMAGE111
大于到达信息转发峰值所需的时间
Figure 805158DEST_PATH_IMAGE112
,结合信息评论峰值
Figure 345860DEST_PATH_IMAGE021
和信息转发峰值
Figure 786069DEST_PATH_IMAGE022
,说明信息传播过程中通过转发行为到达信息转发峰值的时间比通过评论行为到达信息评 论峰值的时间更早。信息评论最终规模
Figure 386815DEST_PATH_IMAGE109
大于信息转发最终规模
Figure 850157DEST_PATH_IMAGE110
,说明相较转发行 为,信息通过评论行为传播的范围更广。
同时,在本实施例中,还在上述信息传播动力学模型的基础上对传播用户的情感进行量化,以划分不同的情感区间。具体的,作为示例,本发明基于预设的情感词典,对用户观点中所蕴含的情感进行识别,将用户情感划分为正面情感、中立情感和负面情感三种情感,并分别将其量化为(0,1)区间的连续数值。情感值越接近0表明用户对事件持有的负面情感越强烈,情感值越接近1表明用户对事件持有的正面情感越强烈。为了确保算法判断标注的情感倾向准确,在本发明的一个具体实施例中,最后将所有标注的结果进行人工审核,对算法判断不准确的数值进行矫正。当用户仅转发信息但没有发表看法时,假设他们与其转发的信息具有相同情感。在量化情感区间之后,就可以结合情感动力学模型分析传播用户的情感演变过程,进而实现对信息传播的分析。
具体的,作为示例,若一个信息从开始传播到结束传播共经历18个小时,以1小时 为时间间隔,将信息传播周期划分为0,1,2,… ,18,共19个时刻。为确定
Figure 234697DEST_PATH_IMAGE010
时刻能够进行情 感交互的转发、评论用户人数及对应的情感值,分别计算
Figure 467095DEST_PATH_IMAGE010
时刻累积转发用户和评论用户中 携带正面情感、中立情感、负面情感的比例,基于SCFI模型得到的
Figure 238742DEST_PATH_IMAGE010
时刻有效评论用户总数
Figure 517276DEST_PATH_IMAGE067
Figure 399782DEST_PATH_IMAGE010
时刻有效转发用户总数
Figure 752266DEST_PATH_IMAGE068
并结合各情感比例确定
Figure 694814DEST_PATH_IMAGE010
时刻携带各情感的用户人数 后,对
Figure 945798DEST_PATH_IMAGE010
时刻累积转发用户和评论用户进行分层抽样。
以确定
Figure 631994DEST_PATH_IMAGE010
时刻能够进行情感交互的评论用户人数及对应的情感值为例,本发明用
Figure 838984DEST_PATH_IMAGE117
表示
Figure 749172DEST_PATH_IMAGE010
时刻累积评论用户,
Figure 674402DEST_PATH_IMAGE118
Figure 475874DEST_PATH_IMAGE119
Figure 802950DEST_PATH_IMAGE120
分别表示
Figure 618459DEST_PATH_IMAGE117
中持正面情感、中立情感、负面情感 用户所占的比例,
Figure 30986DEST_PATH_IMAGE067
表示
Figure 58985DEST_PATH_IMAGE010
时刻有效评论用户人数。将
Figure 319196DEST_PATH_IMAGE121
中的用户按负面情感区间(0, 0.4),中立情感值区间(0.4,0.7),以及正面情感值区间(0.7,1)划分,接着从正面情感用户 中抽取
Figure 774448DEST_PATH_IMAGE122
个持正面情感的用户,从中立情感用户中抽取
Figure 408692DEST_PATH_IMAGE123
个持中立情感的用户,从 负面情感用户中抽取
Figure 37119DEST_PATH_IMAGE124
个持负面情感的用户,抽出的用户总数等于
Figure 338788DEST_PATH_IMAGE010
时刻有效评论用 户人数
Figure 964941DEST_PATH_IMAGE067
,他们在
Figure 132486DEST_PATH_IMAGE010
时刻产生情感交互。采取相同的方式确定
Figure 502288DEST_PATH_IMAGE010
时刻能够进行情感交互的 转发用户人数及对应的情感值,最终确定
Figure 658462DEST_PATH_IMAGE010
时刻能够产生情感交互的总传播用户。
该信息在
Figure 783413DEST_PATH_IMAGE125
结束传播,但由于受到信息衍生信息的影响,这部分用户将继续进 行情感交互直至达到情感平衡,如图5所示。
在图5中,白色区域所示的0~18轮次表示当前信息传播过程中用户的真实情感交互情况;灰色区域所示的19~44轮次表示当前信息的情感交互结束后,在无新增评论、转发用户的情况下,考虑信息衍生信息对用户情感的影响,预测用户情感的演化趋势及最终的情感状态。
观察0~18轮次情感交互情况,可以得出以下结论:在0~11轮次,每一次新增传播者 加入进行情感交互后,用户情感值的所在区间范围大致呈现出逐渐减小的趋势;在11~12轮 次,用户情感值出现聚集现象,大多数用户的情感值聚集在0.5附近;而在12~18轮次阶段, 用户情感值所在的区间范围增大,此时情感交互更加剧烈。在0~18轮次的情感演化阶段,促 使用户情感值改变的是不断加入的新增传播者,同时由于个体情感交互阈值
Figure 392249DEST_PATH_IMAGE043
和情感固守 程度
Figure 113212DEST_PATH_IMAGE044
的存在,每一次新加入的新增传播者的情感值不同,对正在进行交互的传播用户的影 响也各不相同。在每一次新加入的传播者情感值中,持中立情感用户的占比最大,情感占比 超过50%,负面情感用户次之,正面情感用户占比最少。
通过观察第19~44轮次无新增传播者下的情感交互情况,可以发现,受到信息衍生 信息的影响,用户在第19轮次再次产生情感交互,同时因为情感固守程度
Figure 123893DEST_PATH_IMAGE044
的影响,在每一 轮交互过程中,有少部分个体对不同个体情感的接受程度较小,导致用户情感达成稳态的 时间较长,本实施例中预测最终一共需要经历25轮次情感交互,用户情感才能达到稳态。在 现实社会中,如果个体间进行充分交流,所有个体经过情感交互后,情感值几乎不再变化, 此时可以认为用户的情感演化已经进入稳定状态。对于该事件,用户受信息衍生信息影响 的情感最终趋于统一,表现为中立情感,情感值处于(0.45,0.5)区间。
为了进一步研究本发明提供的模型中的参数(
Figure 91849DEST_PATH_IMAGE126
Figure 250298DEST_PATH_IMAGE127
Figure 961902DEST_PATH_IMAGE128
Figure 827090DEST_PATH_IMAGE129
Figure 277532DEST_PATH_IMAGE130
Figure 860960DEST_PATH_IMAGE131
Figure 172992DEST_PATH_IMAGE132
Figure 892687DEST_PATH_IMAGE133
)对信息传播的影响,在本发明的一个应用实施例中,使用了偏秩相关系数(PRCC)方法和 单个参数变化的方法对相关参数进行敏感性分析。
偏秩相关系数法通过调整输入的参数和阈值条件,在参数边界范围内进行重复实 验,最终给出平均的参数敏感性结果。这里可以设置重复性实验次数为1000次,并且在直方 图下方以散点图的形式给出各参数对指标的影响结果。参数相关性影响结果落入[-1,1]之 间,结果大于0,表明该参数与对应指标呈正相关;结果小于0,则表明该参数与对应指标呈 负相关,且结果的绝对值越接近于1,参数对指标的相关性影响作用越强。同时,可将显著性 水平P值设定为0.01,作为判断参数与指标之间的偏秩相关性结论是否成立的标准。若P值 大于
Figure 202445DEST_PATH_IMAGE134
,则说明参数与指标之间的偏秩相关性结论需要进一步确认。
本实施例中使用偏秩相关系数PRCCs法对影响
Figure 351798DEST_PATH_IMAGE062
的相关参数进行敏感性分析,结 果如图6所示。通过观察图6中所示的直方图和散点图,可以清楚地看出评论用户平均接触 速率
Figure 405205DEST_PATH_IMAGE135
、平均评论概率
Figure 244985DEST_PATH_IMAGE136
、初始易感人群总数
Figure 787961DEST_PATH_IMAGE133
均与信息传播可再生数
Figure 345982DEST_PATH_IMAGE062
呈正相关关系。其 中,
Figure 937500DEST_PATH_IMAGE126
Figure 683651DEST_PATH_IMAGE128
Figure 600792DEST_PATH_IMAGE062
具有强影响,
Figure 380529DEST_PATH_IMAGE133
Figure 775738DEST_PATH_IMAGE062
具有弱影响;而评论用户平均免疫速率
Figure 918006DEST_PATH_IMAGE131
对信息传播 可再生数
Figure 740469DEST_PATH_IMAGE062
具有负向一般影响。结果表明,个体间情感交互是否能产生、信息是否能爆发传 播,重点受
Figure 7502DEST_PATH_IMAGE137
Figure 19452DEST_PATH_IMAGE018
三个因子的影响。
接下来对模型中的其他重要指标:信息评论峰值
Figure 688330DEST_PATH_IMAGE021
、信息转发峰值
Figure 681694DEST_PATH_IMAGE022
、信息评 论传播最终规模
Figure 498340DEST_PATH_IMAGE109
以及信息转发传播最终规模
Figure 235352DEST_PATH_IMAGE110
,进行参数敏感性分析。在本模型中,
Figure 758738DEST_PATH_IMAGE021
Figure 500166DEST_PATH_IMAGE022
用于表征信息传播强度,
Figure 741792DEST_PATH_IMAGE109
Figure 16915DEST_PATH_IMAGE110
用于表征信息传播的最终规模。参数的敏感 性分析结果如图7所示。
根据性质,划分信息评论峰值
Figure 457124DEST_PATH_IMAGE021
与信息评论传播最终规模
Figure 792290DEST_PATH_IMAGE109
为事件评论组指 标、信息转发峰值
Figure 521212DEST_PATH_IMAGE022
与信息转发传播最终规模
Figure 678655DEST_PATH_IMAGE110
为事件转发组指标。根据偏秩相关系 数法的结果可知,任意一个参数对组内不同指标均具有相同性质的影响。
通过观察图7可以看出,评论用户的平均接触速率
Figure 176632DEST_PATH_IMAGE115
、转发用户的平均接触速率
Figure 948279DEST_PATH_IMAGE060
、平均免疫速率
Figure 898918DEST_PATH_IMAGE019
、易感用户的平均评论概率
Figure 843740DEST_PATH_IMAGE015
、平均转发概率
Figure 196224DEST_PATH_IMAGE016
和初始易感人群总数
Figure 138772DEST_PATH_IMAGE061
对 各指标的显著性水平和评论用户平均免疫速率
Figure 622712DEST_PATH_IMAGE018
对评论组指标的显著性水平均远小于 0.01,这说明对于这些参数,本发明针对相应指标用偏秩相关系数法所表征的相关性关系 结果非常显著,结果具有统计学意义。而评论用户的平均转发概率
Figure 43329DEST_PATH_IMAGE017
对大多数指标的显著性 水平和评论用户的平均免疫速率
Figure 515899DEST_PATH_IMAGE018
对转发组指标的显著性水平均大于0.01,这说明参数
Figure 957244DEST_PATH_IMAGE017
对大多数指标、参数
Figure 882475DEST_PATH_IMAGE018
对转发组指标用偏秩相关系数法所表征的相关性关系不显著。
对于评论组指标,评论用户的平均接触速率
Figure 106783DEST_PATH_IMAGE115
、易感用户的平均评论概率
Figure 981329DEST_PATH_IMAGE015
、转发 用户的平均免疫速率
Figure 265680DEST_PATH_IMAGE019
和初始易感人群总数
Figure 678207DEST_PATH_IMAGE061
对评论组指标均具有正相关影响,其中,
Figure 768523DEST_PATH_IMAGE115
Figure 950105DEST_PATH_IMAGE015
对评论组指标具有强影响,
Figure 139778DEST_PATH_IMAGE019
Figure 351185DEST_PATH_IMAGE061
对评论组指标具有弱影响。而转发用户的平均接触速 率
Figure 714034DEST_PATH_IMAGE060
、易感用户的平均转发概率
Figure 15702DEST_PATH_IMAGE016
和评论用户的平均免疫速率
Figure 376276DEST_PATH_IMAGE018
,则对评论组指标均具有 一般负相关影响。说明增大
Figure 842024DEST_PATH_IMAGE115
Figure 211825DEST_PATH_IMAGE015
Figure 102421DEST_PATH_IMAGE019
Figure 961792DEST_PATH_IMAGE061
,同时减小
Figure 570628DEST_PATH_IMAGE060
Figure 744121DEST_PATH_IMAGE016
Figure 754802DEST_PATH_IMAGE018
能有效增强评论信息的传播 影响力、增大评论群体规模。
对于转发组指标,转发用户的平均接触速率
Figure 786341DEST_PATH_IMAGE060
、易感用户的平均转发概率
Figure 882473DEST_PATH_IMAGE016
和初 始易感人群总数
Figure 594077DEST_PATH_IMAGE061
均具有正相关影响。其中,
Figure 787161DEST_PATH_IMAGE060
Figure 926019DEST_PATH_IMAGE016
对转发组指标具有强影响,
Figure 509447DEST_PATH_IMAGE061
对转发组 指标具有一般影响。而评论用户的平均接触速率
Figure 572212DEST_PATH_IMAGE115
和易感用户的平均评论概率
Figure 557485DEST_PATH_IMAGE015
对转发组 指标具有弱负相关影响,转发用户的平均免疫速率
Figure 867244DEST_PATH_IMAGE019
对转发组指标具有一般负相关影响。 说明可以通过增大
Figure 285DEST_PATH_IMAGE138
Figure 53692DEST_PATH_IMAGE061
,减小
Figure 893472DEST_PATH_IMAGE115
Figure 685716DEST_PATH_IMAGE015
Figure 978157DEST_PATH_IMAGE019
来提高转发信息的传播强度,扩大转发信息 的影响力,同时扩大转发群体规模。
以上结果表明,增大
Figure 835255DEST_PATH_IMAGE061
有利于扩大信息传播的规模,增大参数
Figure 529541DEST_PATH_IMAGE115
Figure 977840DEST_PATH_IMAGE015
Figure 23156DEST_PATH_IMAGE019
同时减小
Figure 418366DEST_PATH_IMAGE060
Figure 45787DEST_PATH_IMAGE016
Figure 133829DEST_PATH_IMAGE018
有利于扩大评论信息传播的强度与广度,减小参数
Figure 400862DEST_PATH_IMAGE115
Figure 662079DEST_PATH_IMAGE015
Figure 65379DEST_PATH_IMAGE019
同时增大
Figure 324322DEST_PATH_IMAGE060
Figure 390236DEST_PATH_IMAGE016
Figure 127248DEST_PATH_IMAGE018
有利于扩大转发信息传播的强度与广度。因此,可以有机地调整这些参数的大小来影响 评论、转发信息的强度与广度,进而影响信息传播规模,达到调控信息传播的目的。
此外,易感用户的平均评论概率
Figure 650633DEST_PATH_IMAGE015
、平均转发概率
Figure 80477DEST_PATH_IMAGE016
和评论用户的平均转发概率
Figure 118840DEST_PATH_IMAGE017
也是本模型非常重要的参数,体现了模型中评论和转发群体的影响力,是影响信息传播规 模的重要因素。除了明确他们对
Figure 659543DEST_PATH_IMAGE021
Figure 303014DEST_PATH_IMAGE022
Figure 451230DEST_PATH_IMAGE109
Figure 180151DEST_PATH_IMAGE110
指标的相关性影响之外,还需进一步 研究它们对表征传播趋势的各变量(有效评论用户人数
Figure 258966DEST_PATH_IMAGE067
、有效转发用户人数
Figure 819260DEST_PATH_IMAGE068
、累积 评论量
Figure 325328DEST_PATH_IMAGE095
和累积转发量
Figure 541545DEST_PATH_IMAGE096
)的具体影响。为此,在本发明的一个应用实施例中,使用单 个参数变化的方法,对
Figure 735635DEST_PATH_IMAGE015
Figure 88119DEST_PATH_IMAGE016
Figure 30667DEST_PATH_IMAGE017
进行参数敏感性分析,结果如图8所示。
由模型的参数拟合结果可知,评论用户的平均接触速率
Figure 468602DEST_PATH_IMAGE139
,转发 用户的平均接触速率
Figure 685957DEST_PATH_IMAGE140
,易感用户的平均评论概率
Figure 158526DEST_PATH_IMAGE141
,易感用户 的平均转发概率
Figure 85025DEST_PATH_IMAGE142
,评论用户的平均转发概率
Figure 10256DEST_PATH_IMAGE143
,评论用户的平均 免疫速率
Figure 234564DEST_PATH_IMAGE144
,转发用户的平均免疫速率
Figure 623957DEST_PATH_IMAGE145
,初始易感人群总数
Figure 908308DEST_PATH_IMAGE146
。分别改变易感用户的平均评论概率
Figure 638278DEST_PATH_IMAGE015
、平均转发概率
Figure 400698DEST_PATH_IMAGE016
以及评论用户的平均转 发概率
Figure 582281DEST_PATH_IMAGE017
,同时保持其他参数不变,研究受单一参数变化引起的信息传播指标变化。例如,图 8最左侧的波动示意图中,仅改变参数
Figure 99850DEST_PATH_IMAGE015
的值,保持其他参数为默认值不变。
通过观察图8最左侧的波动示意图中转发传播曲线
Figure 999672DEST_PATH_IMAGE068
Figure 565783DEST_PATH_IMAGE147
随易感用户平均评 论概率
Figure 414921DEST_PATH_IMAGE015
的变化,可以看出,参数
Figure 41075DEST_PATH_IMAGE015
几乎不影响其前半程传播,而对其后半程传播起到十分 显著的负向影响;与此同时,对于评论传播曲线
Figure 428194DEST_PATH_IMAGE067
Figure 532416DEST_PATH_IMAGE095
,参数
Figure 750908DEST_PATH_IMAGE015
则几乎对其全程都有着较 为显著的正向影响。参数
Figure 547963DEST_PATH_IMAGE015
越大,信息评论峰值
Figure 156798DEST_PATH_IMAGE021
越大,信息评论传播最终规模
Figure 641875DEST_PATH_IMAGE109
越大, 而信息转发峰值
Figure 652557DEST_PATH_IMAGE022
越小,信息转发传播最终规模
Figure 620513DEST_PATH_IMAGE110
越小。通过增大易感用户的平均评 论概率
Figure 513382DEST_PATH_IMAGE015
有利于增强评论信息的传播影响力,扩大评论信息传播规模,同时削弱转发信息的 传播影响力,减小转发信息传播规模。
通过观察图8中间的波动示意图中评论传播曲线
Figure 959407DEST_PATH_IMAGE067
Figure 90174DEST_PATH_IMAGE095
和转发传播曲线
Figure 307660DEST_PATH_IMAGE068
Figure 891088DEST_PATH_IMAGE096
随易感用户平均转发概率
Figure 140804DEST_PATH_IMAGE016
的变化,可以看出,对于评论传播曲线,参数
Figure 188394DEST_PATH_IMAGE016
对其前半程 传播几乎没有影响,但对后半程传播有着十分显著的负向影响;对于转发传播曲线,参数
Figure 498153DEST_PATH_IMAGE016
则几乎对全程都有着较为显著的正向影响。通过观察图8最右侧的波动示意图中评论、转发 传播曲线随评论用户平均转发概率
Figure 568877DEST_PATH_IMAGE017
的变化,可以发现参数
Figure 622284DEST_PATH_IMAGE017
对所有曲线的前半程传播几 乎没有影响,而对评论传播曲线的后半程起到负向影响,对转发传播曲线的后半程起到正 向影响。分别以0.01、0.45为单位改变参数
Figure 773648DEST_PATH_IMAGE016
Figure 254308DEST_PATH_IMAGE017
的值,对比图8中间和最右侧的波动示意 图,可以看出参数
Figure 546749DEST_PATH_IMAGE016
对各变量的影响效果明显比参数
Figure 466164DEST_PATH_IMAGE017
的大。参数
Figure 160450DEST_PATH_IMAGE016
Figure 812011DEST_PATH_IMAGE017
越大,信息转发峰值
Figure 670377DEST_PATH_IMAGE022
越大、信息转发传播最终规模
Figure 65586DEST_PATH_IMAGE110
越大,而信息评论峰值
Figure 614379DEST_PATH_IMAGE021
越小、信息评论传播最终 规模
Figure 764738DEST_PATH_IMAGE109
越小。实验结果说明增大参数
Figure 31771DEST_PATH_IMAGE016
Figure 965092DEST_PATH_IMAGE017
,能够增强转发信息的传播影响力、扩大转发 信息传播规模,同时削弱评论信息的传播影响力、减小评论信息的传播规模。
上述结论说明,易感用户的平均评论概率
Figure 633971DEST_PATH_IMAGE015
、易感用户的平均转发概率
Figure 204498DEST_PATH_IMAGE016
和评论用 户的平均转发概率
Figure 693249DEST_PATH_IMAGE017
对有效评论用户人数
Figure 695840DEST_PATH_IMAGE067
、有效转发用户人数
Figure 15963DEST_PATH_IMAGE068
、累积评论量
Figure 180228DEST_PATH_IMAGE095
和 累积转发量
Figure 421853DEST_PATH_IMAGE096
都有重要的影响。因此,可以调整参数
Figure 41184DEST_PATH_IMAGE015
Figure 419076DEST_PATH_IMAGE016
Figure 19822DEST_PATH_IMAGE017
的大小来影响信息传播的 趋势,调节信息传播的强度及信息传播的广度,从而有效地调控信息传播。
根据本发明的模型的定义,个体情感交互阈值
Figure 545481DEST_PATH_IMAGE043
决定群体不同个体间是否能够产 生情感交互。只有当两个个体间情感值之差小于设定的情感交互阈值
Figure 889875DEST_PATH_IMAGE043
,这两个个体才能产 生情感交互。显然,个体情感交互阈值
Figure 387852DEST_PATH_IMAGE043
越大,个体越容易产生情感交互。当两个个体产生情 感交互后,情感值的改变程度主要取决于情感固守程度
Figure 893920DEST_PATH_IMAGE044
的大小。情感固守程度
Figure 415863DEST_PATH_IMAGE044
表示个体 对自身原有情感的固执程度,
Figure 298368DEST_PATH_IMAGE044
越大,该个体在与其他个体进行情感交互时,越坚持己见,越 不容易改变自己的情感,用户的情感也越难达成一致。
以下通过两个相关实验,分别改变HK情感交互模型中个体情感交互阈值
Figure 650852DEST_PATH_IMAGE043
和情感 固守程度
Figure 390138DEST_PATH_IMAGE044
的大小,研究单个参数对传播用户情感最终稳定状态的影响。假设初始时刻各状 态用户的情感值与实例事件中用户的情感值保持一致。首先,固定情感固守程度
Figure 828072DEST_PATH_IMAGE044
不变,只 改变个体情感交互阈值
Figure 514269DEST_PATH_IMAGE043
进行实验,设置个体情感交互阈值
Figure 534308DEST_PATH_IMAGE043
以0.05为单位逐渐增大,而情 感固守程度
Figure 647758DEST_PATH_IMAGE044
保持0.6不变。图9示出了根据本发明实施例的情感交互阈值变化引起的用户 情感稳态变化示意图。如图9所示,当个体情感交互阈值
Figure 572989DEST_PATH_IMAGE148
时,模型预测的最终群体分 歧情感束为4个;个体情感交互阈值
Figure 859613DEST_PATH_IMAGE149
时,模型预测的最终群体分歧情感束为3个;个 体情感交互阈值
Figure 186690DEST_PATH_IMAGE150
时,模型预测最终没有群体分歧情感束,不同用户之间情感达成统 一。在0~18轮次,不断有新增传播者不断加入,个体情感交互阈值
Figure 471040DEST_PATH_IMAGE043
越大,个体间越容易产生 情感交互,情感越可能趋于一致。从第19轮次开始,用户情感演化过程中无新增传播者,个 体情感交互阈值
Figure 929572DEST_PATH_IMAGE043
越大,个体间情感交互的剧烈程度越大,情感交互最终达到稳态时留下的 单独情感束越少。上述结果说明,个体情感交互阈值
Figure 957571DEST_PATH_IMAGE043
越大,个体越容易受到环境情绪的影 响,不同用户的情感也越容易达成一致。
然后固定个体情感交互阈值
Figure 139154DEST_PATH_IMAGE043
不变,只改变情感固守程度
Figure 594406DEST_PATH_IMAGE044
进行实验,设置情感固 守程度
Figure 290967DEST_PATH_IMAGE044
以0.1为单位逐渐增大,而个体情感交互阈值
Figure 857077DEST_PATH_IMAGE043
保持0.15不变。图10示出了根据本 发明实施例的情感固守程度变化引起的用户情感稳态变化示意图。如图10所示,情感固守 程度
Figure 893166DEST_PATH_IMAGE058
时,用户情感需要交互39次达到稳态;情感固守程度
Figure 597948DEST_PATH_IMAGE151
时,用户情感需要交 互44次达到稳态;情感固守程度
Figure 719488DEST_PATH_IMAGE152
时,用户情感需要交互51次达到稳态。从图中还可以 看出,在新增传播者不断加入的情感演化阶段(0~8轮次),情感固守程度
Figure 151606DEST_PATH_IMAGE044
越大,个体在与其 他个体进行情感交互时,越坚持己见,在新增传播者加入后,用户间情感交互的剧烈程度越 小;在无新增传播者的情感演化阶段(第19轮次以后),情感固守程度
Figure 307781DEST_PATH_IMAGE044
越大,所需交互成本 越高,用户情感达到平稳所需交互次数越多,即需要更长的时间用户情感才能达到稳态。上 述结果表明,情感固守程度
Figure 104836DEST_PATH_IMAGE044
越大,个体间情感交互的剧烈程度越小,需要更多交互次数才 能使用户情感达到稳态。虽然情感固守用户只占20%,但其对用户情感演化的影响较为显 著.
通过以上两个对比实验,可以确定情感交互阈值
Figure 713672DEST_PATH_IMAGE043
越大,个体间越容易产生情感交 互;用户的情感固守程度
Figure 933169DEST_PATH_IMAGE044
越小,用户越容易接受其他用户的情感,最终用户情感到达稳态 后越容易达成一致。因此,可以通过调整情感交互阈值
Figure 943851DEST_PATH_IMAGE043
和情感固守程度
Figure 911807DEST_PATH_IMAGE044
的大小来影响个 体间情感交互的剧烈程度以及不同用户情感的差异程度,从而影响用户对公众卫生事件讨 论的参与度,达到信息传播引导、提示、警醒等作用。
如上参照附图以示例的方式描述根据本发明的基于个体情感交互的混合信息传播动力学模型及应用该模型进行信息传播分析的方法。但是,本领域技术人员应当理解,对于上述本发明所提出的基于个体情感交互的混合信息传播动力学模型及应用该模型进行信息传播分析的方法,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (10)

1.一种混合信息传播动力学模型,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,在所述信息传播动力学模型中,
假设信息传播在一个封闭稳定的环境中进行,所述环境的总人数
Figure 776219DEST_PATH_IMAGE001
不变,将
Figure 487823DEST_PATH_IMAGE001
分为易感 状态
Figure 618590DEST_PATH_IMAGE002
、评论状态
Figure 819764DEST_PATH_IMAGE003
、转发状态
Figure 137613DEST_PATH_IMAGE004
以及免疫状态
Figure 652908DEST_PATH_IMAGE005
四个群体,并且假设在任意时刻,人群中的每 个个体所处状态唯一;所述信息传播动力学模型中各状态代表的含义如下:
易感状态
Figure 779844DEST_PATH_IMAGE002
:处于该状态的个体还未接触到信息,但未来有可能接触到信息并受该信息 的影响,从而产生评论或转发行为;
评论状态
Figure 89603DEST_PATH_IMAGE003
:处于该状态的个体产生了评论的行为,具有使处于易感状态的个体接触该 信息并产生评论行为的能力;同时,随着信息传播的推进,处于该状态的个体未来有可能产 生转发行为,进一步推动信息传播;
转发状态
Figure 957064DEST_PATH_IMAGE004
:处于该状态的个体产生了转发的行为,具有感染处于易感状态的个体、处 于评论状态的个体转发信息的能力;
免疫状态
Figure 10471DEST_PATH_IMAGE005
:处于该状态的群体由以下两部分组成:
处于评论或转发状态的个体超过了活跃的曝光期,不再有能力影响其他人,从而转换为免疫状态;以及
处于易感状态、评论状态的个体,接触到信息后,由于主观上对信息不感兴趣而直接转换为免疫状态;
定义
Figure 850251DEST_PATH_IMAGE006
Figure 143960DEST_PATH_IMAGE007
Figure 701981DEST_PATH_IMAGE008
以及
Figure 355816DEST_PATH_IMAGE009
Figure 315682DEST_PATH_IMAGE010
时刻处于各状态的有效传播个体总数,且
Figure 967243DEST_PATH_IMAGE011
所述信息传播动力学模型的公式如下:
Figure 58564DEST_PATH_IMAGE012
其中,
Figure 453774DEST_PATH_IMAGE013
为评论用户的平均接触速率,表示处于评论状态的个体能够接触到其他个体的 平均速率;
Figure 330463DEST_PATH_IMAGE014
为转发用户的平均接触速率,表示处于转发状态的个体能够接触到其他个体 的平均速率;
Figure 152925DEST_PATH_IMAGE015
为易感用户的平均评论概率,表示处于易感状态的个体在接触到信息后以评 论的方式参与信息传播的平均评论概率;
Figure 419959DEST_PATH_IMAGE016
为易感用户的平均转发概率,表示处于易感状 态的个体在接触到信息后以转发的方式参与信息传播的平均转发概率;
Figure 431908DEST_PATH_IMAGE017
为评论用户的平 均转发概率,表示处于评论状态的个体由于自身兴趣因素以转发的方式继续参与信息传播 的平均转发概率;
Figure 100787DEST_PATH_IMAGE018
为评论用户的平均免疫速率,表示处于评论状态的个体在信息的传播 中变得不活跃的平均免疫速率;
Figure 94151DEST_PATH_IMAGE019
为转发用户的平均免疫速率,表示处于转发状态的个体 在信息的传播中变得不活跃的平均免疫速率。
2.如权利要求1所述的混合信息传播动力学模型,其特征在于,在所述情感动力学模型中,用评论群体和转发群体表示传播群体,所述传播群体中个体的情感交互更新规则描述如下:
Figure 910797DEST_PATH_IMAGE020
其中,以个体
Figure 913388DEST_PATH_IMAGE021
为例,
Figure 436773DEST_PATH_IMAGE022
表示
Figure 912623DEST_PATH_IMAGE023
时刻个体
Figure 154248DEST_PATH_IMAGE021
的情感值,
Figure 694951DEST_PATH_IMAGE024
表示
Figure 135160DEST_PATH_IMAGE025
时刻个体
Figure 735905DEST_PATH_IMAGE021
的情 感值,
Figure 12297DEST_PATH_IMAGE026
为情感固守程度,表示个体对自身原有情感的坚持程度;
Figure 356691DEST_PATH_IMAGE027
表示个体对其他个体 情感的信任程度;
Figure 589089DEST_PATH_IMAGE028
表示
Figure 423053DEST_PATH_IMAGE010
时刻与个体
Figure 373691DEST_PATH_IMAGE029
情感值之差小于设定个体情感交互阈值
Figure 256196DEST_PATH_IMAGE030
的评 论和转发个体集合,个体情感交互阈值
Figure 920265DEST_PATH_IMAGE031
表示个体间的情感差异度,
Figure 862813DEST_PATH_IMAGE032
Figure 300748DEST_PATH_IMAGE033
表示 集合
Figure 49261DEST_PATH_IMAGE034
的总人数,
Figure 256251DEST_PATH_IMAGE035
表示集合
Figure 369701DEST_PATH_IMAGE034
中所有个体的平均情感值,
Figure 107981DEST_PATH_IMAGE036
表示个体
Figure 332289DEST_PATH_IMAGE029
Figure 659365DEST_PATH_IMAGE037
时刻对自身
Figure 740453DEST_PATH_IMAGE010
时刻情感的保留值,
Figure 152980DEST_PATH_IMAGE038
表示个体
Figure 498423DEST_PATH_IMAGE029
Figure 680005DEST_PATH_IMAGE037
时刻对
Figure 135258DEST_PATH_IMAGE010
时刻其他个体情感的接受值。
3.如权利要求2所述的混合信息传播动力学模型,其特征在于,
所述情感包括正面情感、中立情感和负面情感;
将所述情感量化为(0,1)区间的连续数值,并划分成三种情感区间,分别为:负面情感区间(0,0.4),中立情感区间(0.4,0.7),以及正面情感区间(0.7,1);
当两个个体间的情感值之差小于设定的个体情感交互阈值
Figure 769501DEST_PATH_IMAGE030
时,所述两个个体产生情 感交互,从而有可能使自己的情感值发生改变;反之,如果两个个体间的情感值之差大于所 述个体情感交互阈值
Figure 397929DEST_PATH_IMAGE030
,则所述两个个体无法产生情感交互。
4.一种基于混合信息传播动力学模型进行信息传播分析的方法,用于在信息传播动力学模型的基础上结合情感动力学模型进行信息的传播分析,其中,所述混合信息传播动力学模型为如权利要求1~3中任一项所述的混合信息传播动力学模型;所述方法包括:
利用所述信息传播动力学模型进行信息传播分析;以及,
在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析;
其中,利用所述信息传播动力学模型进行信息传播分析的方法包括:
基于预设的搜索引擎在预设社交平台搜索并采集待分析事件的原始信息数据,所述信息数据包括用户评论文本、转发文本以及转发时间、评论时间;
对所述原始信息数据进行预处理,以获取每条信息下无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间;
以所述无噪声冗余的用户评论文本、转发文本以及转发时间、评论时间为数据驱动,利用最小二乘法估计信息传播动力学模型的参数和初始易感人群总数;
基于所述参数和初始易感人群总数,通过所述信息传播动力学模型确定所述待分析事件的信息传播指标数据。
5.如权利要求4所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,
在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析之前,还包括:
基于预设的情感词典,对所述无噪声冗余的用户评论文本、转发文本中蕴含的情感进行识别;
基于预设的情感量化规则,将所识别的情感进行量化分类;
所述在信息传播动力学模型的基础上结合情感动力学模型进行信息传播分析的方法包括:基于所述情感动力学模型分析和预测传播用户的情感演变过程;以及,在所述信息传播动力学模型的基础上结合所述情感演变过程进行信息传播分析。
6.如权利要求5所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中, 所述信息传播指标数据包括信息传播可再生数
Figure 699597DEST_PATH_IMAGE039
、信息传播峰值、信息传播最终规模以及 信息传播高潮时间;其中,
所述信息传播可再生数
Figure 138800DEST_PATH_IMAGE039
用于判断信息是否可能爆发传播;
所述信息传播峰值包括信息评论峰值和信息转发峰值;
所述信息传播最终规模包括通过评论行为传播的最终规模和通过转发行为传播的最终规模;
所述信息传播高潮时间包括到达信息评论峰值的时间和到达信息转发峰值的时间。
7.如权利要求6所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中, 所述信息传播可再生数
Figure 260340DEST_PATH_IMAGE039
通过以下式子进行计算获取:
Figure 630141DEST_PATH_IMAGE040
其中,
Figure 848633DEST_PATH_IMAGE041
Figure 645687DEST_PATH_IMAGE042
为列向量,
Figure 566108DEST_PATH_IMAGE043
数学符号表示向量的转置,
Figure 474021DEST_PATH_IMAGE042
表示具有传播能力 的群体;
Figure 484702DEST_PATH_IMAGE044
是列向量
Figure 514975DEST_PATH_IMAGE042
中的第一个元素,表示
Figure 611107DEST_PATH_IMAGE010
时刻有效评论用户总数;
Figure 322711DEST_PATH_IMAGE045
是列向量
Figure 948DEST_PATH_IMAGE042
中 的第二个元素,表示
Figure 139806DEST_PATH_IMAGE010
时刻有效转发用户总数;
Figure 723234DEST_PATH_IMAGE046
表示对向量
Figure 300846DEST_PATH_IMAGE042
中的各元素求导;
Figure 20540DEST_PATH_IMAGE047
包含 两个元素,其中第一个元素为t时刻成为评论用户的用户人数,第二个元素为t时刻成为转 发用户的用户人数;
Figure 330299DEST_PATH_IMAGE048
同样包含两个元素,其中第一个元素为t时刻不再是评论用户的 用户人数,第二个元素为t时刻不再是转发用户的用户人数;根据所述信息传播动力学模型 的公式,得到:
Figure 712607DEST_PATH_IMAGE049
其中,
Figure 766014DEST_PATH_IMAGE050
表示
Figure 605794DEST_PATH_IMAGE010
时刻易感用户成为评论用户的人数,
Figure 148771DEST_PATH_IMAGE051
表示
Figure 706791DEST_PATH_IMAGE010
时刻易感用户和评论用户成为转发用户的人数;
Figure 298309DEST_PATH_IMAGE052
表示
Figure 992596DEST_PATH_IMAGE010
时刻评论 用户成为转发用户和免疫用户的人数,
Figure 722786DEST_PATH_IMAGE053
表示
Figure 502523DEST_PATH_IMAGE010
时刻转发用户成为免疫用户的人数;
假设存在无信息传播平衡态
Figure 897732DEST_PATH_IMAGE054
Figure 774421DEST_PATH_IMAGE055
代表初始易感人群总数,在无信息传 播平衡态下基于
Figure 596884DEST_PATH_IMAGE047
Figure 175501DEST_PATH_IMAGE056
的表达式分别对
Figure 374402DEST_PATH_IMAGE044
Figure 43280DEST_PATH_IMAGE045
求偏导,对应得到矩阵
Figure 36644DEST_PATH_IMAGE057
及矩阵
Figure 853290DEST_PATH_IMAGE058
Figure 590302DEST_PATH_IMAGE059
Figure 113687DEST_PATH_IMAGE060
则得到特征方程如下:
Figure 356581DEST_PATH_IMAGE061
其中,
Figure 598207DEST_PATH_IMAGE062
为特征值,
Figure 935647DEST_PATH_IMAGE063
表示单位矩阵,
Figure 579118DEST_PATH_IMAGE064
代表
Figure 914284DEST_PATH_IMAGE058
的逆矩阵;通过计算所述特征方程的特 征根可推导出所述信息传播可再生数
Figure 948931DEST_PATH_IMAGE039
Figure 27745DEST_PATH_IMAGE065
其中,
Figure 588040DEST_PATH_IMAGE066
为所述特征方程的第一个特征根,
Figure 359687DEST_PATH_IMAGE067
为所述特征方程的第二个特征根,信 息传播可再生数
Figure 310325DEST_PATH_IMAGE039
取两个特征根中的最大值。
8.如权利要求7所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,在利用最小二乘法估计所述信息传播动力学模型的参数和初始易感人群总数的过程中,
设置参数矢量为
Figure 5880DEST_PATH_IMAGE068
,用
Figure 358364DEST_PATH_IMAGE069
表示
Figure 300912DEST_PATH_IMAGE070
时刻累积转发量的模拟 值,用
Figure 801163DEST_PATH_IMAGE071
表示
Figure 221781DEST_PATH_IMAGE070
时刻累积评论量的模拟值,用
Figure 694350DEST_PATH_IMAGE072
表示
Figure 119384DEST_PATH_IMAGE070
时刻累积转发量的真实值,用
Figure 44615DEST_PATH_IMAGE073
表示
Figure 268923DEST_PATH_IMAGE070
时刻累积评论量的真实值;由此,可以得到最小二乘
Figure 392737DEST_PATH_IMAGE074
误差函数:
Figure 677087DEST_PATH_IMAGE075
其中,
Figure 89614DEST_PATH_IMAGE074
为残差平方和,
Figure 117613DEST_PATH_IMAGE076
代表采样时间;
在数据拟合的过程中,所述信息传播动力学模型的参数需要满足以下条件:
Figure 112245DEST_PATH_IMAGE077
Figure 301918DEST_PATH_IMAGE078
Figure 264058DEST_PATH_IMAGE079
9.如权利要求8所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,用于表征信息传播规模的物理量包括累积评论量和累积转发量,其中,所述累积评论量用于表征评论群体的规模,所述累积转发量用于表征转发群体的规模;所述累积评论量和所述累积转发量的方程为:
Figure 830168DEST_PATH_IMAGE080
,
Figure 131837DEST_PATH_IMAGE081
其中,
Figure 803995DEST_PATH_IMAGE082
表示
Figure 191114DEST_PATH_IMAGE010
时刻的累积评论量,
Figure 560916DEST_PATH_IMAGE083
表示
Figure 513828DEST_PATH_IMAGE010
时刻的累积转发量。
10.如权利要求5~9中任一项所述的基于混合信息传播动力学模型进行信息传播分析的方法,其中,信息的累积转发量和累积评论量均为随时间变化的曲线,总体趋势先快速上升,后平稳上升,最终趋于稳定;有效评论量和有效转发量均为随时间增加先上升后下降的钟形曲线;
将表征有效评论量的钟形曲线的最大值定义为信息评论峰值
Figure 310883DEST_PATH_IMAGE084
,所述信息评论峰值
Figure 919719DEST_PATH_IMAGE084
用于表示信息通过评论行为传播的强度;将表征有效转发量的钟形曲线的最大值定义 为信息转发峰值
Figure 906260DEST_PATH_IMAGE085
,所述信息转发峰值
Figure 916942DEST_PATH_IMAGE085
表示信息通过转发行为传播的强度;
同时,将累积评论量
Figure 884898DEST_PATH_IMAGE082
的稳态值定义为信息通过评论行为传播的最终规模
Figure 43347DEST_PATH_IMAGE086
,所 述通过评论行为传播的最终规模
Figure 754951DEST_PATH_IMAGE086
表示信息通过评论行为传播的广度;将累积转发量
Figure 620139DEST_PATH_IMAGE083
的稳态值定义为信息通过转发行为传播的最终规模
Figure 70580DEST_PATH_IMAGE087
,所述通过转发行为传播的 最终规模
Figure 654008DEST_PATH_IMAGE087
表示信息通过转发行为传播的广度;
以及,将到达信息评论峰值的时间定义为
Figure 903724DEST_PATH_IMAGE088
,将到达信息转发峰值的时间定义为
Figure 951315DEST_PATH_IMAGE089
,利用所述信息传播高潮时间衡量信息传播过程中用户分别通过评论行为和转发行为 到达信息评论峰值和信息转发峰值的快慢。
CN202210218560.9A 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法 Active CN114298009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210218560.9A CN114298009B (zh) 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210218560.9A CN114298009B (zh) 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法

Publications (2)

Publication Number Publication Date
CN114298009A true CN114298009A (zh) 2022-04-08
CN114298009B CN114298009B (zh) 2022-06-21

Family

ID=80978688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210218560.9A Active CN114298009B (zh) 2022-03-08 2022-03-08 混合信息传播动力学模型及其信息传播分析方法

Country Status (1)

Country Link
CN (1) CN114298009B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115132369A (zh) * 2022-06-09 2022-09-30 中国传媒大学 基于社交媒体拟态环境建模的信息传播分析方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158630A1 (en) * 2010-12-17 2012-06-21 Microsoft Corporation Information propagation probability for a social network
US20170185908A1 (en) * 2014-09-18 2017-06-29 Huawei Technologies Co.,Ltd. Method and device for predicting information propagation in social network
CN108540369A (zh) * 2018-03-06 2018-09-14 南京邮电大学 考虑用户重度传播行为的sndr信息传播过程描述方法
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN109727154A (zh) * 2019-01-29 2019-05-07 重庆理工大学 一种基于时变阻尼运动的在线社交网络信息传播分析方法
CN111460679A (zh) * 2020-04-17 2020-07-28 中国传媒大学 基于动力学的同步交叉信息传播分析方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158630A1 (en) * 2010-12-17 2012-06-21 Microsoft Corporation Information propagation probability for a social network
US20170185908A1 (en) * 2014-09-18 2017-06-29 Huawei Technologies Co.,Ltd. Method and device for predicting information propagation in social network
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN108540369A (zh) * 2018-03-06 2018-09-14 南京邮电大学 考虑用户重度传播行为的sndr信息传播过程描述方法
CN109727154A (zh) * 2019-01-29 2019-05-07 重庆理工大学 一种基于时变阻尼运动的在线社交网络信息传播分析方法
CN111460679A (zh) * 2020-04-17 2020-07-28 中国传媒大学 基于动力学的同步交叉信息传播分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴谦等: "基于信息形式的微博舆情传播模型研究", 《通信技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115132369A (zh) * 2022-06-09 2022-09-30 中国传媒大学 基于社交媒体拟态环境建模的信息传播分析方法及系统

Also Published As

Publication number Publication date
CN114298009B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
Seker Computerized argument Delphi technique
Schoon Parental worklessness and the experience of NEET among their offspring. Evidence from the Longitudinal Study of Young People in England (LSYPE)
Hix-Small et al. A multivariate associative finite growth mixture modeling approach examining adolescent alcohol and marijuana use
Wojciechowski The development of deviant peer association across the life-course and its relevance for predicting offending in early adulthood
CN113282841B (zh) 基于建模的公众话题传播评估方法及系统
CN104182457B (zh) 在社交网络中基于泊松过程模型的事件流行度预测方法
Ojanen et al. Social goals and adolescent friendships: Social selection, deselection, and influence
CN106570525A (zh) 一种基于贝叶斯网络的在线商品评价质量评估方法
CN113254719B (zh) 一种基于地位理论的在线社交网络信息传播方法
CN109727152B (zh) 一种基于时变阻尼运动的在线社交网络信息传播构建方法
CN110781411B (zh) 一种基于辟谣消息的谣言传播控制方法
Redhead et al. Coalitions and conflict: A longitudinal analysis of men's politics
CN107315775A (zh) 一种指数计算平台和方法
CN114298009B (zh) 混合信息传播动力学模型及其信息传播分析方法
CN115712772A (zh) 一种基于话题关联的话题传播预测方法
Kornienko et al. Dynamic pathways between rejection and antisocial behavior in peer networks: Update and test of confluence model
Liu et al. Analysis of rumor spreading in communities based on modified SIR model in microblog
CN115470991A (zh) 基于用户短时情感和演化博弈的网络谣言传播预测方法
CN112860973B (zh) 基于社交网络分析的组织健康评估方法
CN108520337B (zh) 一种基于网络风险熵差的谣言风险评估方法
CN113850446B (zh) 融合时空注意力和异构图卷积网络的信息扩散预测方法
van den Berg et al. Dynamic risk factors in adult men who committed sexual offenses: Replication and comparison of networks found in two independent samples.
Becatti et al. Collaboration and followership: a stochastic model for activities in bipartite social networks
Fontaine et al. Developmental trajectories of psychopathology: An overview of approaches and applications
Greetham et al. Interventions in social networks: impact on mood and network dynamics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant