CN103699650B - 消息传播预测方法及装置 - Google Patents

消息传播预测方法及装置 Download PDF

Info

Publication number
CN103699650B
CN103699650B CN201310733040.2A CN201310733040A CN103699650B CN 103699650 B CN103699650 B CN 103699650B CN 201310733040 A CN201310733040 A CN 201310733040A CN 103699650 B CN103699650 B CN 103699650B
Authority
CN
China
Prior art keywords
centerdot
delta
message
forwarding
prediction models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310733040.2A
Other languages
English (en)
Other versions
CN103699650A (zh
Inventor
薛波
薛一波
鲍媛媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201310733040.2A priority Critical patent/CN103699650B/zh
Publication of CN103699650A publication Critical patent/CN103699650A/zh
Application granted granted Critical
Publication of CN103699650B publication Critical patent/CN103699650B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种消息传播预测方法及装置,能够预测消息在网络中的传输情况。该方法包括:获取社交网络中消息的转发信息;根据所述转发信息确定非线性预测模型;确定所述非线性预测模型的系数;根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。本发明实施例获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。

Description

消息传播预测方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种消息传播预测方法及装置。
背景技术
近几年,社交网络成为人们交流沟通以及消息传播的全新工具,对于正面的信息,社交网络的参与扩大了消息的传播受众面,并提高了消息传播的速度,具有积极作用;对于负面信息,社交网络中信息发布的便捷性使得负面消息迅速传播污染了社交网络环境。
因此,如何预测消息在网络中的传输情况是当前需要解决的问题。
发明内容
本发明实施例提供一种消息传播预测方法及装置,能够预测消息在网络中的传输情况。
本发明实施例采用如下技术方案:
一种消息传播预测方法,包括:
获取社交网络中消息的转发信息;
根据所述转发信息确定非线性预测模型;
确定所述非线性预测模型的系数;
根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
可选的,所述根据所述转发信息确定非线性预测模型包括:
根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;
确定所述消息传播过程中的关联维数;
根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;
将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。
可选的,所述转发信息包括所述消息的转发时间,所述根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列包括:
根据所述消息的转发时间得到消息的转发时间序列;
在所述转发时间序列每一个时间步增加消息转发数,得到所述广度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次,得到所述深度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和,得到所述受众增加时间序列。
可选的,所述确定所述消息传播过程中的关联维数包括:
应用GP算法确定所述消息传播过程中的关联维数。
可选的,应用偏微分方程将所述广度自变量与所述广度变化时间序列整合,应用偏微分方程将所述深度自变量与所述深度变化时间序列整合,应用偏微分方程将所述受众自变量与所述受众增加时间序列整合;
所述偏微分方程为:
dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz dy dt = b 1 x + b 2 y + b 3 z + b 4 x 2 + b 5 y 2 + b 6 z 2 + b 7 xy + b 8 xz + b 9 yz dz dt = c 1 x + c 2 y + c 3 z + c 4 x 2 + c 5 y 2 + c 6 z 2 + c 7 xy + c 8 xz + c 9 yz
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如 dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz 可以记为D=GP,其中
D = x 3 Δt - x Δt 2 Δt x 4 Δt - x 2 Δt 2 Δt · · · x mΔt - x ( m - 2 ) Δt 2 Δt , G = x 2 Δt y 2 Δt . . . ( yz ) 2 Δt x 3 Δt y 3 Δt . . . ( yz ) 3 Δt · · · · · · · · · · · · x ( m - 1 ) Δt y ( m - 1 ) Δt . . . ( yz ) ( m - 1 ) Δt , P = a 1 a 2 · · · a 9
m为观测的转发时间序列的长度,D根据观测的转发时间序列确定,G根据观测的转发时间序列确定,P为所述非线性预测模型的参数矩阵。
可选的,所述确定所述非线性预测模型的系数包括:
根据使残差平方和S取最小值确定P,其中残差平方和S=(D-GP)T(D-GP),P为所述非线性预测模型的系数,D根据所述观测的转发时间序列得到,G根据所述观测的转发时间序列得到,P则可根据令上式残差平方和取最小确定。
可选的,P的确定方法为:
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D由观测的转发时间序列确定,G由观测的转发时间序列确定,P为非线性预测模型的参数,具体如下所示:
D = x 3 Δt - x Δt 2 Δt x 4 Δt - x 2 Δt 2 Δt · · · x mΔt - x ( m - 2 ) Δt 2 Δt , G = x 2 Δt y 2 Δt . . . ( yz ) 2 Δt x 3 Δt y 3 Δt . . . ( yz ) 3 Δt · · · · · · · · · · · · x ( m - 1 ) Δt y ( m - 1 ) Δt . . . ( yz ) ( m - 1 ) Δt , P = a 1 a 2 · · · a 9
则会遇到两种情况,如下所述:
如果GTG为非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
1|≥|λ2|≥…≥|λK|
存在有L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
U L = U 11 . . . U 1 L · · · · · · U K 1 . . . U KL
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUii=(V1i,V2i,…VMi)T
V L = V 11 . . . V 1 L · · · · · · V M 1 . . . V ML
由特征值组成的对角阵记为下式:
Λ L = λ 1 0 . . . 0 0 λ 2 . . . 0 · · · · · · · · · 0 0 . . . λ L
从而得到P=HD,其中H=ULΛ-1VL T,从而实现对非线性预测模型参数P的求取。
可选的,所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测包括:将所述广度变化时间序列、深度变化时间序列、受众增加时间序列代入所述非线性预测模型,对所述消息进行传播预测。
可选的,所述转发信息包括以下至少一种:
所述消息的转发时间、转发所述消息的用户帐号、转发所述消息的用户ID、转发述消息的用户账号的粉丝数量、所述转发所述消息的用户帐号所处的转发层。
一种消息传播预测装置,包括:
获取单元,用于获取社交网络中消息的转发信息;
第一确定单元,用于根据所述转发信息确定非线性预测模型;
第二确定单元,用于确定所述非线性预测模型的系数;
预测单元,用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
基于上述方案,本发明实施例的消息传播预测方法及装置,获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种消息传播预测方法的流程图;
图2为本发明实施例2提供的另一种消息传播预测方法的流程图;
图3为本发明实施例3提供的一种消息传播预测装置的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本实施例提供一种消息传播预测方法,包括:
11、获取社交网络中消息的转发信息;
12、根据所述转发信息确定非线性预测模型;
13、确定所述非线性预测模型的系数;
14、根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
可选的,所述根据所述转发信息确定非线性预测模型包括:
根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;
确定所述消息传播过程中的关联维数;
根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;
将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。
可选的,所述转发信息包括所述消息的转发时间,所述根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列包括:
根据所述消息的转发时间得到消息的转发时间序列;
在所述转发时间序列每一个时间步增加消息转发数,得到所述广度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次,得到所述深度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和,得到所述受众增加时间序列。
可选的,所述确定所述消息传播过程中的关联维数包括:
应用GP算法确定所述消息传播过程中的关联维数。
可选的,应用偏微分方程将所述广度自变量与所述广度变化时间序列整合,应用偏微分方程将所述深度自变量与所述深度变化时间序列整合,应用偏微分方程将所述受众自变量与所述受众增加时间序列整合;
所述偏微分方程为:
dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz dy dt = b 1 x + b 2 y + b 3 z + b 4 x 2 + b 5 y 2 + b 6 z 2 + b 7 xy + b 8 xz + b 9 yz dz dt = c 1 x + c 2 y + c 3 z + c 4 x 2 + c 5 y 2 + c 6 z 2 + c 7 xy + c 8 xz + c 9 yz
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如 dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz 可以记为D=GP,其中
D = x 3 Δt - x Δt 2 Δt x 4 Δt - x 2 Δt 2 Δt · · · x mΔt - x ( m - 2 ) Δt 2 Δt , G = x 2 Δt y 2 Δt . . . ( yz ) 2 Δt x 3 Δt y 3 Δt . . . ( yz ) 3 Δt · · · · · · · · · · · · x ( m - 1 ) Δt y ( m - 1 ) Δt . . . ( yz ) ( m - 1 ) Δt , P = a 1 a 2 · · · a 9
m为观测的转发时间序列的长度,D和G都可以根据观测的转发时间序列求得,P为所述非线性预测模型的参数矩阵。
可选的,所述确定所述非线性预测模型的系数包括:
根据使残差平方和S取最小值求得P,其中残差平方和S=(D-GP)T(D-GP),P为所述非线性预测模型的系数,D和G根据所述观测的转发时间序列得到,P则可根据令上式残差平方和取最小确定。
可选的,P的确定方法为:
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D和G可由观测的转发时间序列求得,P为非线性预测模型的参数,具体如下所示:
D = x 3 Δt - x Δt 2 Δt x 4 Δt - x 2 Δt 2 Δt · · · x mΔt - x ( m - 2 ) Δt 2 Δt , G = x 2 Δt y 2 Δt . . . ( yz ) 2 Δt x 3 Δt y 3 Δt . . . ( yz ) 3 Δt · · · · · · · · · · · · x ( m - 1 ) Δt y ( m - 1 ) Δt . . . ( yz ) ( m - 1 ) Δt , P = a 1 a 2 · · · a 9
则会遇到两种情况,如下所述:
如果GTG是非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
1|≥|λ2|≥…≥|λK|
假设有L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
U L = U 11 . . . U 1 L · · · · · · U K 1 . . . U KL
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUii=(V1i,V2i,…VMi)T
V L = V 11 . . . V 1 L · · · · · · V M 1 . . . V ML
由特征值组成的对角阵记为下式:
Λ L = λ 1 0 . . . 0 0 λ 2 . . . 0 · · · · · · · · · 0 0 . . . λ L
从而得到P=HD,其中H=ULΛ-1VL T,从而实现对非线性预测模型参数P的求取。
应当理解,本实施例中 dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz 可以记为D=GP,相应的也可以进行类似处理,此处不赘述。
可选的,所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测包括:将所述广度变化时间序列、深度变化时间序列、受众增加时间序列代入所述非线性预测模型,对所述消息进行传播预测。
可选的,所述转发信息包括以下至少一种:
所述消息的转发时间、转发所述消息的用户帐号、转发所述消息的用户ID、转发述消息的用户账号的粉丝数量、所述转发所述消息的用户帐号所处的转发层。
本实施例的方法,获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。
实施例2
如图2所示,本实施例提供一种消息传播预测方法,包括:
21、获取社交网络中的消息转发数据。
获取社交网络中的消息转发数据主要包括各转发消息的转发时间、转发用户帐号、转发用户ID、转发用户粉丝数以及转发者所处的转发层数。
22、对消息转发数据进行清洗及统计,得到消息转发时间序列、广度变化时间序列、深度变化时间序列以及受众增加时间序列。
根据数据获取中消息转发时间能够得到消息转发时间序列;而在每一个时间步,增加的消息转发数则为消息转发广度序列;深度序列则为每一个时间步,增加的消息转发数所在的最深层次;受众增加序列则为在每一个时间步,增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和。
23、利用GP算法确定社交网络消息传播过程的关联维数,GP算确定传播过程关联维数的方法将在下文具体介绍。
24、选择消息转发过程中广度、深度及受众作为自变量。
对消息传播广度、深度及受众增加进行分析,确定广度、深度及受众增加对消息转发过程具有重要的标识作用。
25、建立消息转发中广度、深度及受众的非线性预测模型。
构建消息传播广度、深度及受众的非线性偏微分方程组,详细如下式所示。
dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz dy dt = b 1 x + b 2 y + b 3 z + b 4 x 2 + b 5 y 2 + b 6 z 2 + b 7 xy + b 8 xz + b 9 yz dz dt = c 1 x + c 2 y + c 3 z + c 4 x 2 + c 5 y 2 + c 6 z 2 + c 7 xy + c 8 xz + c 9 yz
其中,x为广度,y为深度,z为受众,t为时间,a1,a2,…,a8,b1,b2,…,b8,c1,c2,…,c8分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如 dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz 可以记为D=GP,其中
D = x 3 Δt - x Δt 2 Δt x 4 Δt - x 2 Δt 2 Δt · · · x mΔt - x ( m - 2 ) Δt 2 Δt , G = x 2 Δt y 2 Δt . . . ( yz ) 2 Δt x 3 Δt y 3 Δt . . . ( yz ) 3 Δt · · · · · · · · · · · · x ( m - 1 ) Δt y ( m - 1 ) Δt . . . ( yz ) ( m - 1 ) Δt , P = a 1 a 2 · · · a 9
m为观测的转发时间序列的长度,D和G都可以根据观测的转发时间序列求得,P为所述非线性预测模型的参数矩阵。
应当理解,本实施例中 dx dt = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 xy + a 8 xz + a 9 yz 可以记为D=GP,相应的也可以进行类似处理,此处不赘述。
26、根据矩阵论及反演理论,确定非线性预测模型的系数。
D和G可以由获取的消息转发时间序列数据直接获得,P则是令下式残差平方和达到最小时的取值,
S=(D-GP)T(D-GP)
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D和G可由观测的转发时间序列求得,P为非线性预测模型的参数,具体如下所示:
D = x 3 Δt - x Δt 2 Δt x 4 Δt - x 2 Δt 2 Δt · · · x mΔt - x ( m - 2 ) Δt 2 Δt , G = x 2 Δt y 2 Δt . . . ( yz ) 2 Δt x 3 Δt y 3 Δt . . . ( yz ) 3 Δt · · · · · · · · · · · · x ( m - 1 ) Δt y ( m - 1 ) Δt . . . ( yz ) ( m - 1 ) Δt , P = a 1 a 2 · · · a 9
则会遇到两种情况,如下所述:
如果GTG是非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
1|≥|λ2|≥…≥|λK|
假设有L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
U L = U 11 . . . U 1 L · · · · · · U K 1 . . . U KL
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUii=(V1i,V2i,…VMi)T
V L = V 11 . . . V 1 L · · · · · · V M 1 . . . V ML
由特征值组成的对角阵记为下式:
Λ L = λ 1 0 . . . 0 0 λ 2 . . . 0 · · · · · · · · · 0 0 . . . λ L
从而得到P=HD,其中H=ULΛ-1VL T
从而实现对非线性预测模型参数P的求取。
27、进行广度、深度及受众的非线性序列预测。
将广度、深度及受众序列代入非线性预测方程组中,可以得到广度、深度及受众在每一时间点对应的取值,完成社会网络中消息传播广度、深度及受众的非线性预测。
下面对本发明中采用的GP算法求消息传播过程关联维数的方法进行简单介绍。
GP算法的输入量为时间延迟和初始潜入维数m0;重构相空间,计算向量距离,得出最大值和最小值,从而确定超球面半径r的步长;计算关联积分C(r);以lnC(r)~lnr作图,找到曲线的线性部分,并用最小二乘法估计关联维数;增加嵌入维数m0,直到相应的维数估计值d(m)不再随着m的增加而在一定误差范围内不变为止,得到消息传播过程的关联维数。
GP算法的具体实施步骤如下所示:
(1)确定时间延迟和初始嵌入维数m0
(2)重构相空间,计算向量距离,得出最大值和最小值,从而确定超球面半径r的步长;
(3)计算关联积分C(r);
(4)以lnC(r)~lnr作图,找到曲线的线性部分,并用最小二乘法估计关联维数;
(5)增加嵌入维数m0,直到相应的维数估计值d(m)不再随着m的增加而在一定误差范围内不变为止,得到消息传播过程的关联维数。
本实施例的方法基于获取的消息转发数据得到所需的转发时间、广度、深度、受众序列;随后基于GP算法获取消息转发过程的关联维数,从而确定描述转发过程的自变量个数;通过对广度、深度及受众三个变量分布的分析,确定以这三个变量作为非线性预测模型的自变量,并构建非线性预测模型;随后根据矩阵论、反演理论等对于非线性预测模型的系数进行求解;代入实证观测数据,获得在每一个时间点对广度、深度及受众的预测值,完成对消息传播广度、深度及受众的及时性、准确性预测,有利于对不同消息传播规律的把握及进行适当控制。
实施例3
如图3所示,本实施例提供一种消息传播预测装置,包括:
获取单元31,用于获取社交网络中消息的转发信息;
第一确定单元32,用于根据所述转发信息确定非线性预测模型;
第二确定单元33,用于确定所述非线性预测模型的系数;
预测单元34,用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测。
本发明实施例的节点可以实现上述对应的方法实施例,详细实现过程,请参阅上述方法实施例,本实施例的装置的组成单元与上述方法实施例对应,此处仅为简要描述,此处不赘述。
本实施例的消息传播预测装置,获取社交网络中消息的转发信息,根据所述转发信息确定非线性预测模型,确定所述非线性预测模型的系数,根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测,从而预测消息在网络中的传输情况。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
本领域普通技术人员将会理解,本发明的各个方面、或各个方面的可能实现方式可以被具体实施为系统、方法或者计算机程序产品。因此,本发明的各方面、或各个方面的可能实现方式可以采用完全硬件实施例、完全软件实施例(包括固件、驻留软件等等),或者组合软件和硬件方面的实施例的形式,在这里都统称为“电路”、“模块”或者“系统”。此外,本发明的各方面、或各个方面的可能实现方式可以采用计算机程序产品的形式,计算机程序产品是指存储在计算机可读介质中的计算机可读程序代码。
计算机可读程序代码可以完全在用户的计算机上执行、部分在用户的计算机上执行、作为单独的软件包、部分在用户的计算机上并且部分在远程计算机上,或者完全在远程计算机或者服务器上执行。也应该注意,在某些替代实施方案中,在流程图中各步骤、或框图中各块所注明的功能可能不按图中注明的顺序发生。例如,依赖于所涉及的功能,接连示出的两个步骤、或两个块实际上可能被大致同时执行,或者这些块有时候可能被以相反顺序执行。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种消息传播预测方法,其特征在于,包括:
获取社交网络中消息的转发信息;
根据所述转发信息确定非线性预测模型;
确定所述非线性预测模型的系数;
根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测;
其中,所述根据所述转发信息确定非线性预测模型包括:
根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;
确定所述消息传播过程中的关联维数;
根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;
将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。
2.根据权利要求1所述的方法,其特征在于,所述转发信息包括所述消息的转发时间,所述根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列包括:
根据所述消息的转发时间得到消息的转发时间序列;
在所述转发时间序列每一个时间步增加消息转发数,得到所述广度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数所在的最深层次,得到所述深度变化时间序列;
在所述转发时间序列每一个时间步增加的消息转发数对应的消息转发用户ID所具有的粉丝数之和,得到所述受众增加时间序列。
3.根据权利要求1所述的方法,其特征在于,所述确定所述消息传播过程中的关联维数包括:
应用GP算法确定所述消息传播过程中的关联维数。
4.根据权利要求1所述的方法,其特征在于,应用偏微分方程将所述广度自变量与所述广度变化时间序列整合,应用偏微分方程将所述深度自变量与所述深度变化时间序列整合,应用偏微分方程将所述受众自变量与所述受众增加时间序列整合;
所述偏微分方程为:
d x d t = a 1 x + a 2 y + a 3 z + a 4 x 2 + a 5 y 2 + a 6 z 2 + a 7 x y + a 8 x z + a 9 y z d y d t = b 1 x + b 2 y + b 3 z + b 4 x 2 + b 5 y 2 + b 6 z 2 + b 7 x y + b 8 x z + b 9 y z d z d t = c 1 x + c 2 y + c 3 z + c 4 x 2 + c 5 y 2 + c 6 z 2 + c 7 x y + c 8 x z + c 9 y z
其中,x为广度值,y为深度值,z为受众值,t为时间,a1,a2,…,a9,b1,b2,…,b9,c1,c2,…,c9分别为偏微分方程组的参数,偏微分方程组中每一偏微分方程都被写成差分方程的形式,例如可以记为D=GP,其中
D = x 3 Δ t - x Δ t 2 Δ t x 4 Δ t - x 2 Δ t 2 Δ t · · · x m Δ t - x ( m - 2 ) Δ t 2 Δ t , G = x 2 Δ t y 2 Δ t ... ( y z ) 2 Δ t x 3 Δ t y 3 Δ t ... ( y z ) 3 Δ t · · · · · · · · · · · · x ( m - 1 ) Δ t y ( m - 1 ) Δ t ... ( y z ) ( m - 1 ) Δ t , P = a 1 a 2 · · · a 9
m为观测的转发时间序列的长度,D根据观测的转发时间序列确定,G根据观测的转发时间序列确定,P为所述非线性预测模型的参数矩阵。
5.根据权利要求1所述的方法,其特征在于,所述确定所述非线性预测模型的系数包括:
根据使残差平方和S取最小值确定P,其中残差平方和S=(D-GP)T(D-GP),P为所述非线性预测模型的系数,D根据观测的转发时间序列得到,G根据观测的转发时间序列得到,P则可根据令上式残差平方和取最小确定。
6.根据权利要求5所述的方法,其特征在于,P的确定方法为:
按照最小二乘原则得到如下正则方程:
GTGP=GTD
其中,D由观测的转发时间序列确定,G由观测的转发时间序列确定,P为非线性预测模型的参数,具体如下所示:
D = x 3 Δ t - x Δ t 2 Δ t x 4 Δ t - x 2 Δ t 2 Δ t · · · x m Δ t - x ( m - 2 ) Δ t 2 Δ t , G = x 2 Δ t y 2 Δ t ... ( y z ) 2 Δ t x 3 Δ t y 3 Δ t ... ( y z ) 3 Δ t · · · · · · · · · · · · x ( m - 1 ) Δ t y ( m - 1 ) Δ t ... ( y z ) ( m - 1 ) Δ t , P = a 1 a 2 · · · a 9
如果GTG为非奇异矩阵,那么得到P=(GTG)-1GTD;
如果G为奇异矩阵,那么根据反演理论,首先计算GTG,GTG是一个实对称矩阵,有K个线性无关的而且正交的特征向量,对应的特征值如下:
1|≥|λ2|≥...≥|λK|
存在L个不为零的特征值λ1≥λ2≥…≥λL,而K-L个特征值为零,得到对应于L个不为零的特征值的特征向量组成一个矩阵UL:
U L = U 11 ... U 1 L · · · · · · U K 1 ... U K L
其中Ui=(U1i,U2i,…UKi)T(i=1,2,…L)是对应于λi的特征向量,从而得到Vi=GUii=(V1i,V2i,…VMi)T
V L = V 11 ... V 1 L · · · · · · V M 1 ... V M L
其中M为矩阵G的行数,M=m-2,其中m是观测的转发时间序列的长度;
由特征值组成的对角阵记为下式:
Λ L = λ 1 0 ... 0 0 λ 2 ... 0 · · · · · · · · · 0 0 ... λ L
从而得到P=HD,其中H=ULΛ-1VL T,从而实现对非线性预测模型参数P的求取。
7.根据权利要求1所述的方法,其特征在于,所述根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测包括:将所述广度变化时间序列、深度变化时间序列、受众增加时间序列代入所述非线性预测模型,对所述消息进行传播预测。
8.根据权利要求1或3至7中任一项所述的方法,其特征在于,所述转发信息包括以下至少一种:
所述消息的转发时间、转发所述消息的用户帐号、转发所述消息的用户ID、转发述消息的用户账号的粉丝数量、所述转发所述消息的用户帐号所处的转发层。
9.一种消息传播预测装置,其特征在于,包括:
获取单元,用于获取社交网络中消息的转发信息;
第一确定单元,用于根据所述转发信息确定非线性预测模型;
第二确定单元,用于确定所述非线性预测模型的系数;
预测单元,用于根据所述非线性预测模型及所述非线性预测模型的系数对所述消息进行传播预测;
其中,所述第一确定单元,具体用于根据所述转发信息得到广度变化时间序列、深度变化时间序列、受众增加时间序列;确定所述消息传播过程中的关联维数;根据所述关联维数确定消息转发过程中广度自变量、深度自变量及受众自变量;将所述广度自变量与所述广度变化时间序列整合、将所述深度自变量与所述深度变化时间序列整合、将所述受众自变量与所述受众增加时间序列整合,得到所述非线性预测模型。
CN201310733040.2A 2013-12-26 2013-12-26 消息传播预测方法及装置 Active CN103699650B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310733040.2A CN103699650B (zh) 2013-12-26 2013-12-26 消息传播预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310733040.2A CN103699650B (zh) 2013-12-26 2013-12-26 消息传播预测方法及装置

Publications (2)

Publication Number Publication Date
CN103699650A CN103699650A (zh) 2014-04-02
CN103699650B true CN103699650B (zh) 2017-01-18

Family

ID=50361178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310733040.2A Active CN103699650B (zh) 2013-12-26 2013-12-26 消息传播预测方法及装置

Country Status (1)

Country Link
CN (1) CN103699650B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016041376A1 (zh) * 2014-09-18 2016-03-24 华为技术有限公司 社交网络中预测信息传播的方法及设备
CN106156030A (zh) 2014-09-18 2016-11-23 华为技术有限公司 社交网络中预测信息传播的方法及设备
CN105005583A (zh) * 2015-06-17 2015-10-28 清华大学 一种社交网络中信息转发增量的预测方法及系统
CN106372437B (zh) * 2016-09-07 2019-03-29 北京邮电大学 一种信息扩散预测的方法和装置
CN106503859A (zh) * 2016-10-28 2017-03-15 国家计算机网络与信息安全管理中心 一种基于在线社会关系网络的消息传播预测方法及装置
CN110609940A (zh) * 2019-09-20 2019-12-24 东北大学 一种带有空间因素的二维时空pde信息传播模型及求解方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007004638A (ja) * 2005-06-24 2007-01-11 Denso It Laboratory Inc 情報普及予測装置、情報普及予測方法、及び情報普及予測システム
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007004638A (ja) * 2005-06-24 2007-01-11 Denso It Laboratory Inc 情報普及予測装置、情報普及予測方法、及び情報普及予測システム
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
社交网络分析与信息传播研究;郭琛;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130315(第03期);正文第21页第4-7段、第35页第4段至37页第2段 *

Also Published As

Publication number Publication date
CN103699650A (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
CN103699650B (zh) 消息传播预测方法及装置
Leguy et al. Parameterization of basal friction near grounding lines in a one-dimensional ice sheet model
CN106525466B (zh) 一种动车组制动系统关键部件鲁棒滤波方法和系统
CN104034409A (zh) 基于脉冲编码外调制的分布式光纤振动传感方法及其系统
CN104048777B (zh) 用于ntc型热敏电阻的温度与电阻值转换方法
CN104807414A (zh) 基于分布式光纤传感技术的地铁隧道沉降变形监测方法
CN106294334A (zh) 一种微博舆情指标体系的计算方法及装置
Lehtola et al. Critical evaluation of the computational methods used in the forced polymer translocation
CN103743435A (zh) 一种多传感器数据融合方法
CN105574191A (zh) 在线社会网络多源点信息溯源系统及其方法
CN104729748A (zh) 用于确定移动设备的环境温度的方法
CN103607772A (zh) 一种基于lmbp神经网络的泰勒定位算法
CN102979517A (zh) 一种复杂油气储层饱和度定量评价方法
CN108459087A (zh) 一种应用于板结构损伤检测的多模态Lamb波模态分离方法
Arbogast et al. A posteriori error estimates for mixed finite element and finite volume methods for parabolic problems coupled through a boundary
CN104331087B (zh) 一种鲁棒的水下传感器网络目标跟踪方法
CN101710023B (zh) 一种保偏光纤拍长的测试方法及装置
KR101677809B1 (ko) 정보 처리 장치, 프로그램 및 방법
CN103428733A (zh) 一种预测方法和装置
CN104350491A (zh) 数据采样方法以及数据采样装置
CN105843997A (zh) 一种基于分形理论的水文模型升尺度方法
CN115687854A (zh) 高精度土样参数测量方法及其系统
CN103473477A (zh) 基于改进卡尔曼滤波的变参数迭代估计方法
CN105046324A (zh) 一种基于移动神经网络的高程异常拟合内插计算方法
Zhang et al. Soil salinity estimation based on near-ground multispectral imagery in typical area of the Yellow River Delta

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant