CN114004709B - 一种信息传播的监测方法、装置及计算机可读存储介质 - Google Patents

一种信息传播的监测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN114004709B
CN114004709B CN202111331547.6A CN202111331547A CN114004709B CN 114004709 B CN114004709 B CN 114004709B CN 202111331547 A CN202111331547 A CN 202111331547A CN 114004709 B CN114004709 B CN 114004709B
Authority
CN
China
Prior art keywords
information
user
propagation
time
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111331547.6A
Other languages
English (en)
Other versions
CN114004709A (zh
Inventor
桑春艳
胥文
贾朝龙
刘兰徽
方能炜
邢镔
胡小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Industrial Big Data Innovation Center Co ltd
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing Industrial Big Data Innovation Center Co ltd
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Industrial Big Data Innovation Center Co ltd, Chongqing University of Post and Telecommunications filed Critical Chongqing Industrial Big Data Innovation Center Co ltd
Priority to CN202111331547.6A priority Critical patent/CN114004709B/zh
Publication of CN114004709A publication Critical patent/CN114004709A/zh
Application granted granted Critical
Publication of CN114004709B publication Critical patent/CN114004709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于社交网络分析传播领域,涉及社交网络中信息的传播过程,具体涉及一种信息传播的监测方法、装置及计算机可读存储介质;所述方法包括从社交平台中获取用户参与信息传播过程的数据,并将数据按照传播的时间周期进行预处理;从预处理的数据中获取信息传播过程中的时间间隔矩阵和相对位置矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息和位置结构信息;将时序结构信息和位置结构信息进行融合,并将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹;本发明能够更好的提取信息传播的特征信息,从而对信息传播过程进行监测。

Description

一种信息传播的监测方法、装置及计算机可读存储介质
技术领域
本发明属于社交网络分析传播领域,涉及社交网络中信息的传播过程,具体涉及一种信息传播的监测方法、装置及计算机可读存储介质。
背景技术
随着网络的普及,在线社交网络已经成为用户传播、交流、共享和收集信息的主要平台,在线社交网络的快速发展产生了海量的数据,这不仅可以通过信息传播的监测来进行商业营销,从而创造出商业价值;同时海量的数据也为研究者提供了探索信息传播的规律和其结构特性的可能。在线社交网络在传播新闻、思想、观点等方面发挥着突出的作用。例如,权威机构利用官方微信、微博、网络新媒体等平台及时发布官方信息,有效的阻止了虚假、有害信息的传播。同时,社交平台也为谣言、虚假新闻、有害信息的广泛传播提供了途径。
因此,通过对社交网络中的用户行为数据的分析建模,不仅可以挖掘社交网络中信息传播的特点和演化规律,还可以监测出社交网络中信息传播的演化趋势,从而对信息传播过程进行有效干预和实时控制。
现阶段,对社交网络信息传播过程的研究主要体现在用户影响力、信息传播、用户转发等方向;许多研究利用深度学习进行信息传播监测建模,这些研究利用基于循环神经网络的模型在此问题上取得了一定的效果。然而,大多数模型对于传播时间的利用,仅限于对用户按照时间戳排序,获得传播的先后顺序特征,以此来监测参与传播的下一个用户。忽略了用户之间的传播时间间隔对整个信息传播过程的影响,而且循环神经网络模型在长序列信息传播建模上表现较差。
发明内容
为了解决这些问题,本发明提出一种融合传播时间间隔信息和用户的相对位置信息的自注意力模型,旨在捕获信息传播过程中在不同方面的潜在影响因素。具体来说,利用融合的自注意力模块获取用户之间的依赖性和传播过程的轨迹特征。
在本发明的第一方面,本发明提供了一种信息传播的监测方法,所述方法包括:
从社交平台中获取用户参与信息传播过程的数据,并将所述数据按照传播的时间周期进行预处理;所述数据包括用户信息数据、传播信息项数据以及用户与传播信息项互动信息数据;
从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
将所述时序结构信息和所述位置结构信息进行融合,并将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹。
在本发明的第二方面,本发明还提供了一种信息传播的监测装置,所述装置包括:
数据采集模块,用于从社交平台中获取用户参与信息传播过程的数据;
数据处理模块,用于将所述数据按照传播的时间周期进行预处理;
时序数据模块,用于从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
位置数据模块,用于从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
信息融合模块,用于将所述时序结构信息和所述位置结构信息进行融合;
信息监测模块,用于将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹。
在本发明的第三方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如本发明第一方面的一种信息传播的监测方法的步骤。
本发明的有益效果:
本发明从传播网络的复杂性和信息间的相互作用的动态性入手,通过融合序列的时间间隔信息和相对位置信息,从而充分利用序列的时序结构信息和位置结构信息来监测整个信息传播过程。本发明引入了相对位置信息向量来刻画信息传播的轨迹特征位置信息,并扩展自注意力机制来考虑用户的相对位置。同时本发明将时间结构信息也与自注意力机制融合,来更好的提取信息传播的特征信息,从而对信息传播过程进行监测。本发明提出的融合传播时间间隔和用户相对位置的信息传播趋势监测模型,针对传播过程中时间间隔的不同,通过融合序列的相对位置信息和时间间隔信息,从而充分利用序列的时序结构信息和位置结构信息来监测信息传播过程,能够综合考虑用户在信息传播过程的作用,可以根据历史信息传播过程把握信息传播趋势,所以可以对舆情管控、网络水军的发现提供有力证据,从而为相关信息决策机构提供有效的建议以及应对策略。
附图说明
图1是本发明信息传播的监测过程的整体框图;
图2是本发明实施例中一种信息传播的监测方法总体架构图;
图3是本发明优选实施例中一种信息传播的监测方法流程图;
图4是本发明优选实施例中一种信息传播的监测装置结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好的说明本发明的内容,以下参考说明书附图并举实施例的,对本发明的具体实施例作进一步的阐述。图1表明本发明的输入是某一个信息项在社交网络中当前的传播过程,经过模型后的输出是潜在用户是否会参与信息传播过程的预测结果。
基于上述整体思路,图2提供了本发明实施例中一种信息传播的监测方法总体架构图;如图2所示,对于采集到的信息传播过程的数据源,本发明需要对所述数据源进行数据清洗,并对清洗后的数据进行预处理;从预处理后的数据中获取传播过程中的时间间隔矩阵和相对位置矩阵;从这些矩阵中构建出可学习的位置向量和可学习的时间向量;并采用自注意力机制来融合向量特征;将融合的向量特征输入到模型中,进行动态信息传播过程的趋势监测。
图3提供了本发明优选实施例中一种信息传播的监测方法流程图,如图3所示,详细说明本发明的优选实施过程,包括如下几个步骤:
101、从社交平台中获取用户参与信息传播过程的数据,并将所述数据按照传播的时间周期进行预处理;
其中,所述数据包括用户信息数据、传播信息项数据以及用户与传播信息项互动信息数据;
在本发明实施例中,各类数据可以分别以级联形式进行体现,举个例子,该级联形式表示为:其中下标id用于表征用户信息,下标time用于表征时间信息;例如:34,478,398,222:75.117015,77.968750,78.757250,80.020426,该数字串可以表示一个级联的用户信息数据。
在本发明实施例中,数据源的获取可以直接从现有的开源数据集获取信息传播过程数据,或者也可以利用成熟的社交平台的公共API获取。
在本发明实施例中,将所述数据按照传播的时间周期进行预处理的过程可以是将根据每一信息项数据的特点,按照时间戳信息将同一时间周期的数据提取出来。
102、从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
在本发明实施例中,需要从预处理的数据中获取信息传播过程中的时序结构信息,在这个过程中,本实施例对预处理的数据中的用户进行全信息表示,确定出用户级联序列集;将所述用户级联序列集中的用户采用向量表示,嵌入得到用户社交结构特征的低维稠密实值向量,表示成一个特征向量;从而得到用户嵌入向量矩阵;利用所述用户嵌入向量矩阵计算得到信息传播过程中的时序结构信息。
具体的,本实施假设用户级联序列集表示为Cas={s0,s1,…,s|Cas|-1};其中,每一个级联序列为uj∈U表示第j个用户uj在级联序列si中,tj∈T表示第j个用户uj接受事件的时间,且接受事件的事件按照事件排序即tj-1<tj,|si|为第i个级联序列的长度。
对于级联序列中的已经进行信息传播的用户{u0,u1,…,un},将这些用户采用向量表示为ei=emb(ui)∈Rd,d为向量的维度;从而得到用户嵌入向量矩阵ue=[emb(u0),emb(u1),…,emb(un)]T,上标T表示转置矩阵,n表示进行信息传播的用户数量。
在本发明实施例中,采用训练级联序列集提取其时间序列集/>对于时间序列集Ttrain,给予一个固定的序列长度n,对于小于长度n的序列,做补零处理。在时间序列Ti={t0,t1,…,tn}中,级联序列中最近的传播用户会对下一时间的用户有着更大的影响,因此计算相邻两个用户之间的时间间隔是非常具有必要性;本发明对于两个用户a,b之间的时间间隔的计算公式表示为Δab=|ta-tb|,由于每个级联序列中时间间隔的不等,需要求得每个级联序列中的最小时间间隔tMIN,按照该最小时间间隔Intab确定出用户a,b之间的间隔信息,则a,b用户在级联序列中的间隔信息为/>以此可以建立级联的时间间隔矩阵MT:
对于时间间隔矩阵MT,本实施例还设定有最大时间间隔tMAX,对于时间矩阵中的每一个元素,若该元素超过最大时间间隔则截取掉该元素,即对于矩阵元素有Intab=min(tMAX,Intab)。
本发明中,使用两个可学习的第一学习时间向量TEk和第二学习时间向量TEv来学习时间间隔对于级联序列的影响。
其中,Embedding(MT)表示时间间隔矩阵MT的嵌入矩阵;Embedding方法创建可训练向量P(如tf.Variable);以MT矩阵中的值Intab为索引,d为向量的维度;n表示进行信息传播的用户数量。这里的分别为从向量P中抽取的一行作为向量表示。
103、从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
在本发明实施例中,同样需要从预处理的数据中的用户进行全信息表示,确定出用户级联序列集;将所述用户级联序列集中的用户采用向量表示,得到用户嵌入向量矩阵;利用所述用户嵌入向量矩阵计算得到信息传播过程中的位置结构信息;当然所述用户嵌入向量矩阵可以直接调用上一获取时序结构信息过程中所计算而得的结果。
更进一步的,本发明还需要计算用户级联序列集中每一个级联序列中相邻两个用户之间的位置间隔,对两个用户之间的位置间隔编码,使用第一学习位置向量和第二学习位置向量来学习级联序列的位置信息,计算得到每一个级联序列中用户之间的注意力得分,基于所述注意力得分使用自注意力中的key向量和value向量依次对所述第一学习位置向量和第二学习位置向量进行训练,得到时间间隔矩阵。
在本发明实施例中,通过相对位置表示来对两个用户的相对位置之间的距离进行编码,相对位置可以分为前后,位置表示可以区分不同的方向,赋予不同的相对位置编码。
在本发明实施例中,采用训练级联序列集提取其时间序列集/>对于时间序列集Utrain,给予一个固定的序列长度n,对于小于长度n的序列,做补零处理。在时间序列Ui={u0,u1,…,un}中,级联序列中最近的传播用户会对下一时间的用户有着更大的影响,因此计算相邻两个用户之间的相对位置间隔是非常具有必要性;本发明设置出两个用户之间的最大距离maxD;如果超过最大距离,则可以忽略两个用户之间的连接;dij是第i个用户相对于第j个用户的距离,其计算公式表示为:
其中,w=(w-maxD,…,wmaxD)是可学习的向量表示;
因此相对距离矩阵DM表示:
本发明实施例可以使用两个不同的第一学习位置向量PEk和第二学习位置向量PEv来学习级联序列的位置信息,它们分别用自注意力中的key向量和value向量进行训练,可以表示为:
其中,PEk表示采用key向量的嵌入矩阵向量;PEv;DM表示相对距离矩阵;dij是第i个用户相对于第j个用户的距离;maxD为两个用户之间的最大距离,如果超过最大距离,则可以忽略两个用户之间的连接。w=(w-maxD,…,wmaxD)是可学习的向量表示。
Embedding方法创建可训练向量P(如tf.Variable),以DM矩阵中的值dij为索引,从P中抽取一行作为用户i相对位置的embedding向量给用户j。对于为值向量创建的相对位置嵌入向量/>遵循相同的过程。
类似于位置向量,对于时间矩阵MT做类似的操作,使用两个可学习的时间位置向量TEk和TEv来学习时间间隔对于级联序列的影响。
本申请中考虑到位置结构信息反映了信息传播的轨迹特征位置信息,该信息是可以反映传播的过程的重要因素。因此,本申请引入了相对位置信息所对应的第一学习位置向量PEk以及第二学习位置向量PEv,同时,本申请扩展自注意力机制考虑用户的相对位置。为了进一步获取序列的时序结构信息,本文发现如果仅仅考虑级联序列中的用户位置信息,仍然不能反映传播过程中时间的影响,因此本申请将时间间隔矩阵TEk,TEv也与自注意力机制融合,更好地提取出信息传播的特征信息。
104、将所述时序结构信息和所述位置结构信息进行融合,并将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹。
在本发明实施例中,首先需要融合结构信息,对于输入的训练级联序列集US={u0e0,u1e1,…,unen},计算输入用户u={u0,u1,…,un}之间的注意力得分:
其中,表示可学习的参数矩阵,这些参数学习矩阵随着训练过程用于学习细节信息;emb(ui)表示用户ui的嵌入向量;emb(uj)表示用户uj的嵌入向量;αij表示用户ui对用户uj归一化的注意力。
利用输入的用户序列,计算一个新的输出序列c=(c0,c1,…,cn),输出元素ci为输入元素的注意力的加权之和。
其中,ci表示用户ui的融合信息;表示可学习的参数矩阵,WV用于表示这一过程中的学习结果。
当搭建多层的模型时,使用随机梯度下降来训练网络时,每次参数更新都会导致该神经层的输入分布发生改变,层数越多,其输入分布会改变得越明显。
为了缓解问题,本文对模型进行层归一化,使其分布保持稳定。
其中,这里∈>0是一个很小的常数,为了保证分母大于0,γ和β分别表示缩放和平移的参数向量,μ和δ2分别表示均值和方差。
利用Position-wise Feed Forward层,来综合前面所获得所有信息,自适应的调节权重参数。
FFN(ci)=W2ReLu(W1ci+b1)+b2
其中,和/>为参数向量,ReLu为激活函数。
同时加入Dropout层,避免在训练中出现更多问题,如梯度消失,过拟合等问题。
Ci=ci+Dropout(FFN(Norm(ci)))
其中,m∈{0,1}为丢弃掩码,p为丢弃神经元的概率。最终可以利用Ci来监测下一个可能接收信息的用户。
基于上述融合信息Ci来监测信息传播过程。所述信息传播监测模型的目的是通过学习给出的部分级联序列{(u0,t0),…,(uj,tj)},来监测出下一时间tj+1接受事件的用户uj+1。其中下一时间接受信息的用户的概率表示为:
其中,Wz和bz为权重参数和偏置参数。
对于上述信息传播预测模型,需要寻找模型的最优的参数。对于给定的训练信息传播序列集US={u0e0,u1e1,…,unen},使用负对数似然估计函数来定义损失函数:
其中,ui+1为级联序列中在时间ti+1真实信息传播的用户;nm为级联序列uem的长度。在训练过程中最小化损失函数训练参数通过使用小批量(mini-batch)的Adam优化器来更新。从而构建最终的融合传播时间间隔和用户相对位置的信息传播趋势预测模型,动态预测下一时间信息传播的轨迹。
图4是本发明优选实施例中一种信息传播的监测装置结构图;如图4所示,所述装置包括:
201、数据采集模块,用于从社交平台中获取用户参与信息传播过程的数据;
202、数据处理模块,用于将所述数据按照传播的时间周期进行预处理;
203、时序数据模块,用于从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
204、位置数据模块,用于从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
205、信息融合模块,用于将所述时序结构信息和所述位置结构信息进行融合;
206、信息监测模块,用于将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹。
本申请实施例中的一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现以下步骤:
从社交平台中获取用户参与信息传播过程的数据,并将所述数据按照传播的时间周期进行预处理;所述数据包括用户信息数据、传播信息项数据以及用户与传播信息项互动信息数据;
从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
将所述时序结构信息和所述位置结构信息进行融合,并将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,实施例所涉及到的方法或装置或电子设备的通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员也应该清楚,只需要将方法流程用几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明从社交网络中信息传播轨迹出发,提出一种融合传播时间间隔和用户相对位置的信息传播趋势预测模型。利用传播过程中时间间隔的不同,通过融合序列的相对位置信息和时间间隔信息,从而充分利用序列的时序结构信息和位置结构信息来预测信息传播过程。最后,综合考虑影响信息传播的驱动因素,得到信息传播演化趋势预测模型。判断用户是否参与该信息的传播,从而预测整个信息传播的演化趋势。
在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种信息传播的监测方法,其特征在于,所述方法包括:
从社交平台中获取用户参与信息传播过程的数据,并将所述数据按照传播的时间周期进行预处理;所述数据包括用户信息数据、传播信息项数据以及用户与传播信息项互动信息数据;
从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
所述从预处理的数据中获取信息传播过程中的时间间隔矩阵,获得用户在信息传播过程中的时序结构信息包括对预处理的数据中的用户进行全信息表示,确定出用户级联序列集;将所述用户级联序列集中的用户采用向量表示,得到用户嵌入向量矩阵;利用所述用户嵌入向量矩阵计算得到信息传播过程中的时序结构信息;
所述利用所述用户嵌入向量矩阵计算得到信息传播过程中的时序结构信息包括计算用户级联序列集中每一个级联序列中相邻两个用户之间的时间间隔,对两个用户之间的时间间隔编码,并计算得到每一个级联序列中的最小时间间隔,按照该最小时间间隔确定出用户之间的间隔信息,按照所述间隔信息建立出级联的时间矩阵,设置出最大时间间隔,将超过所述最大时间间隔的元素从所述级联的时间矩阵中截取;使用第一学习时间向量和第二学习时间向量来学习级联序列的时间信息,计算得到每一个级联序列中用户之间的注意力得分,基于所述注意力得分使用自注意力中的key向量和value向量依次对所述第一学习时间向量和第二学习时间向量进行训练,得到训练后的相对时间间隔矩阵;
从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
所述从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息包括从预处理的数据中的用户进行全信息表示,确定出用户级联序列集;将所述用户级联序列集中的用户采用向量表示,得到用户嵌入向量矩阵;利用所述用户嵌入向量矩阵计算得到信息传播过程中的位置结构信息;
所述利用所述用户嵌入向量矩阵计算得到信息传播过程中的位置结构信息包括计算用户级联序列集中每一个级联序列中相邻两个用户之间的位置间隔,得到相对位置矩阵;对两个用户之间的位置间隔编码,使用第一学习位置向量和第二学习位置向量来学习级联序列的位置信息,计算得到每一个级联序列中用户之间的注意力得分,基于所述注意力得分使用自注意力中的key向量和value向量依次对所述第一学习位置向量和第二学习位置向量进行训练,得到训练后的相对位置矩阵;
将所述时序结构信息和所述位置结构信息进行融合,并将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹;
所述将所述时序结构信息和所述位置结构信息进行融合,并将融合后的信息输入到信息传播监测模型中包括将所述融合信息输入到多层模型中,采用层归一化对所述融合信息进行处理;使用随机梯度下降函数来训练所述多层模型,利用随时间反向传播算法来进行模型训练,在训练过程中最小化损失函数,训练参数通过使用小批量的Adam优化器来更新。
2.根据权利要求1所述的一种信息传播的监测方法,其特征在于,将所述数据按照传播的时间周期进行预处理包括对重复数据以及无效数据进行清洗;并将清洗后的数据按照传播信息项的时间周期进行划分。
3.一种信息传播的监测装置,其用于实现如权利要求1或2所述的一种信息传播的监测方法,其特征在于,所述装置包括:
数据采集模块,用于从社交平台中获取用户参与信息传播过程的数据;
数据处理模块,用于将所述数据按照传播的时间周期进行预处理;
时序数据模块,用于从预处理的数据中获取信息传播过程中的时间间隔矩阵,采用自注意机制获得用户在信息传播过程中的时序结构信息;
位置数据模块,用于从预处理的数据中获取信息传播过程中的相对位置矩阵,采用自注意机制获得用户在信息传播过程中的位置结构信息;
信息融合模块,用于将所述时序结构信息和所述位置结构信息进行融合;
信息监测模块,用于将融合后的信息输入到信息传播监测模型中,动态监测出下一时间用户参与信息传播的轨迹。
4.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1或2所述的一种信息传播的监测方法的步骤。
CN202111331547.6A 2021-11-11 2021-11-11 一种信息传播的监测方法、装置及计算机可读存储介质 Active CN114004709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111331547.6A CN114004709B (zh) 2021-11-11 2021-11-11 一种信息传播的监测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111331547.6A CN114004709B (zh) 2021-11-11 2021-11-11 一种信息传播的监测方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN114004709A CN114004709A (zh) 2022-02-01
CN114004709B true CN114004709B (zh) 2024-04-30

Family

ID=79928577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111331547.6A Active CN114004709B (zh) 2021-11-11 2021-11-11 一种信息传播的监测方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114004709B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019183191A1 (en) * 2018-03-22 2019-09-26 Michael Bronstein Method of news evaluation in social media networks
CN111373769A (zh) * 2018-05-24 2020-07-03 索尼公司 信息处理装置和信息处理方法
CN111881705A (zh) * 2019-09-29 2020-11-03 深圳数字生命研究院 数据处理、训练、识别方法、装置和存储介质
CN112182423A (zh) * 2020-10-14 2021-01-05 重庆邮电大学 一种基于注意力机制的信息传播演化趋势预测方法
CN113505924A (zh) * 2021-07-09 2021-10-15 福州大学 一种基于级联时空特征的信息传播预测方法及系统
CN113536144A (zh) * 2021-06-17 2021-10-22 中国人民解放军国防科技大学 一种社交网络信息的传播规模预测方法、装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019183191A1 (en) * 2018-03-22 2019-09-26 Michael Bronstein Method of news evaluation in social media networks
CN111373769A (zh) * 2018-05-24 2020-07-03 索尼公司 信息处理装置和信息处理方法
CN111881705A (zh) * 2019-09-29 2020-11-03 深圳数字生命研究院 数据处理、训练、识别方法、装置和存储介质
CN112182423A (zh) * 2020-10-14 2021-01-05 重庆邮电大学 一种基于注意力机制的信息传播演化趋势预测方法
CN113536144A (zh) * 2021-06-17 2021-10-22 中国人民解放军国防科技大学 一种社交网络信息的传播规模预测方法、装置
CN113505924A (zh) * 2021-07-09 2021-10-15 福州大学 一种基于级联时空特征的信息传播预测方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SFTRD:A novel information propagation model in heterogeneous networks:Modeling and restraining strategy;Chunyan Sang 等;《Physica A :Statistical Mechanics and its Applications》;20190615;第524卷;第475-490页 *
基于多维特征的信息传播预测研究;胥文;《万方学位论文》;20230706;第1-85页 *
社交网络中基于注意力机制的网络舆情事件演化趋势预测;桑春艳 等;《 计算机科学》;20210311;第118-123页 *

Also Published As

Publication number Publication date
CN114004709A (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
Lee et al. IMPACT: Impersonation attack detection via edge computing using deep autoencoder and feature abstraction
CN112800234B (zh) 信息处理方法、装置、电子设备和存储介质
Das et al. A Hybrid Neuro‐Fuzzy and Feature Reduction Model for Classification
CN112138403A (zh) 交互行为的识别方法和装置、存储介质及电子设备
CN112733043B (zh) 评论推荐方法及装置
Alomari et al. Prediction of the digital game rating systems based on the ESRB
Imtiaz Khan et al. COVID‐19 and black fungus: Analysis of the public perceptions through machine learning
Fisher et al. Simulating the evolution of homeless populations in canada using modified deep q-learning (mdql) and modified neural fitted q-iteration (mnfq) algorithms
Chand et al. Cooperative coevolution of feed forward neural networks for financial time series problem
Chen et al. An LSTM with differential structure and its application in action recognition
US20210073629A1 (en) Prediction model preparation and use for socioeconomic data and missing value prediction
CN114004709B (zh) 一种信息传播的监测方法、装置及计算机可读存储介质
CN1036492C (zh) 计算机辅助决策方法
Cagcag Yolcu A hybrid fuzzy time series approach based on fuzzy clustering and artificial neural network with single multiplicative neuron model
Sung et al. A Study of BERT-Based Classification Performance of Text-Based Health Counseling Data.
CN115862862A (zh) 疾病预测方法、装置及计算机可读存储介质
CN115168722A (zh) 内容交互预测方法以及相关设备
CN114358186A (zh) 一种数据处理方法、装置及计算机可读存储介质
CN114707633A (zh) 特征提取方法、装置、电子设备和存储介质
WO2005048185A1 (en) Transductive neuro fuzzy inference method for personalised modelling
Gonfiantini Utilizing individual patient unpunctuality and no-show predictions to develop optimal appointment overbooking strategies in an outpatient setting
Tomkins et al. Intelligent pooling in Thompson sampling for rapid personalization in mobile health
Park et al. Medical Time-series Prediction With LSTM-MDN-ATTN
Liu et al. Application of Distributed Probability Model in Sports Based on Deep Learning: Deep Belief Network (DL‐DBN) Algorithm for Human Behaviour Analysis
CN117556149B (zh) 资源推送方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant