CN108632054A - 信息传播量的预测方法及装置 - Google Patents

信息传播量的预测方法及装置 Download PDF

Info

Publication number
CN108632054A
CN108632054A CN201710159611.4A CN201710159611A CN108632054A CN 108632054 A CN108632054 A CN 108632054A CN 201710159611 A CN201710159611 A CN 201710159611A CN 108632054 A CN108632054 A CN 108632054A
Authority
CN
China
Prior art keywords
propagation
propagation amount
amount
parameter
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710159611.4A
Other languages
English (en)
Other versions
CN108632054B (zh
Inventor
吴蕾蕾
任晓龙
吕琳媛
易玲玲
贺鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
University of Electronic Science and Technology of China
Original Assignee
Tencent Technology Shenzhen Co Ltd
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, University of Electronic Science and Technology of China filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710159611.4A priority Critical patent/CN108632054B/zh
Publication of CN108632054A publication Critical patent/CN108632054A/zh
Application granted granted Critical
Publication of CN108632054B publication Critical patent/CN108632054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/56Unified messaging, e.g. interactions between e-mail, instant messaging or converged IP messaging [CPM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种信息传播量的预测方法及装置,属于网络技术领域。本发明通过利用由多条历史信息的传播量训练得到的传播预测模型,来对待预测信息的目标预测时间的传播量进行预测,由于在模型训练时是基于多条历史信息的传播量与传播量峰值等进行,因此,该传播预测模型能够表示传播量与传播量峰值之间的准确关系,从而达到对传播量进行预测的目的,且预测所得到的传播量准确性高,有利于后续有针对性的制定传播策略,为商业运营等提供了有力依据。

Description

信息传播量的预测方法及装置
技术领域
本发明涉及网络技术领域,特别涉及一种信息传播量的预测方法及装置。
背景技术
随着网络技术的发展,网络作为信息的传播平台,所发挥的作用越来越大,一条信息一旦进入网络,可能会以成千上万的量级被阅读或者被转发,从而实现该信息的传播。
目前,为了获知信息的影响面有多大,可以对信息的阅读量和转发量等传播相关信息进行统计获知,这种统计通常是建立在实际的阅读行为和转发行为上的,虽然所统计到的数据真实可信,但是,所统计到的也仅是其传播的结果,是一个比较滞后的信息。
而在很多场合下,信息的传播是为了满足一定的运营目的,例如推广活动、宣传产品等等,那么可能需要预先获知信息的传播量,从而预计信息的影响面,进行有针对性的制定传播策略,因此,亟需一种信息传播量的预测方法。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种信息传播量的预测方法及装置。所述技术方案如下:
一方面,提供了一种信息传播量的预测方法,所述方法包括:
获取待预测信息的已知传播量,所述已知传播量至少包括指定时间内的传播量;
确定第一传播量峰值,所述第一传播量峰值为所述待预测信息的已知传播量中的传播量峰值;
根据所述第一传播量峰值以及传播预测模型,获取所述待预测信息在目标预测时间内的传播量;
所述传播预测模型由多条历史信息在所述目标预测时间内的传播量以及多个第二传播量峰值训练得到,所述多个第二传播量峰值为所述多条历史信息在指定时间内传播量峰值,所述指定时间早于所述目标预测时间。
另一方面,提供了一种信息传播量的预测装置,所述装置包括:
获取模块,用于获取待预测信息的已知传播量,所述已知传播量至少包括指定时间内的传播量;
确定模块,用于确定第一传播量峰值,所述第一传播量峰值为所述待预测信息的已知传播量中的传播量峰值;
预测模块,用于根据所述第一传播量峰值以及传播预测模型,获取所述待预测信息在目标预测时间内的传播量;
所述传播预测模型由多条历史信息的在所述目标预测时间内的已知传播量以及多个第二传播量峰值训练得到,所述多个第二传播量峰值为所述多条历史信息在所述目标预测时间内的指定时间内传播量峰值,所述指定时间早于所述目标预测时间。
本发明实施例提供的技术方案带来的有益效果是:
通过利用由多条历史信息的传播量训练得到的传播预测模型,来对待预测信息的目标预测时间的传播量进行预测,由于在模型训练时是基于多条历史信息的传播量与传播量峰值以及传播时间等进行,因此,该传播预测模型能够表示传播量与传播量峰值之间的准确关系,从而达到对传播量进行预测的目的,且预测所得到的传播量准确性高,有利于后续有针对性的制定传播策略,为商业运营等提供了有力依据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种实施环境图;
图2是本发明实施例提供的一种信息传播量的预测方法的流程图;
图3是本发明实施例提供的一种信息传播情况的示意图;
图4是本发明实施例提供的一种信息传播量的预测装置的结构示意图;
图5是本发明实施例提供的一种信息传播量的预测装置的结构框图;
图6是本发明实施例提供的一种信息传播量的预测装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的一种实施环境图。该实施环境包括多个终端101、用于为该多个终端提供服务的服务器102。多个终端101通过无线或者有线网络和服务器102连接,该多个终端101可以为能够访问服务器102的电子设备,该电子设备可以为电脑、智能手机、平板电脑或者其他电子设备。服务器102可以为一个或者多个网站服务器,该服务器102可以作为信息的载体,该服务器102可以根据其用户通过终端对信息进行的传播操作,例如转发、阅读、分享等操作,对信息进行传播。对于服务器102来说,该服务器102还可以具有至少一种数据库,用以存储用户关系链、信息传播量以及用户相关数据等等。
其中,本发明实施例所涉及的信息可以是指文章、图片以及视频等任一种信息,这类信息可以具有地址链接,从而使得用户通过终端对该地址链接进行点击、转发等操作时,能够实现对信息的传播。例如,该服务器102为微型博客服务器,则该服务器102上存储有多个新闻页面,每个新闻页面具有其链接地址,当用户通过终端对链接地址进行点击时,服务器102确定该新闻页面被阅读,还可以通过该服务器102所提供的分享或转发功能,将该链接地址分享至其他网站或是转发至新微博,以实现对该新闻页面的传播。
图2是本发明实施例提供的一种信息传播量的预测方法的流程图。参见图2,该图2所示的流程具体包括两部分,第一部分为基于历史信息的模型训练过程,第二部分为基于模型的预测过程。在通过步骤200至203训练得到传播预测模型后,即可在需要进行预测时直接使用该传播预测模型,如步骤204至206,而无需再次进行训练或复杂计算。下面对各个步骤进行详述:
200、获取训练集,该训练集包括多条历史信息的传播量。
发明人认识到,信息在网络平台上的传播过程中,会随着传播时间经历上升期和衰减期,也即是,随着时间的推移,信息的传播量会迅速增加(激发),而在达到峰值后,传播量会发生慢慢的衰减,直至传播量趋近于0。基于这样的认识,可以利用网络平台上的历史信息的传播量来寻找信息传播量的变化规律,为此,可以执行例如步骤200的训练集获取过程。
在本发明实施例中,对于每条历史信息来说,每发生一次传播事件(例如被转发、被阅读或是被分享等),网络平台均会记录该传播事件,以累计得到该历史信息的传播量,该传播量可以是一条历史信息从其发布时间开始进行累计。
在收集多条历史信息的传播量时,至少要获取到与目标预测时间相等的传播量,从而训练得到的传播预测模型才能够对目标预测时间内的传播情况进行预测。例如,如果想要建立能够预测7天内传播量的传播预测模型,则对于信息A和信息B,至少要均获取其从发布时间到发布7天内的传播量。当然,在一种实施方式中,也可以根据待预测信息的目标预测时间,实时进行模型训练,上述步骤200可以是根据该待预测信息的目标预测时间,获取训练集,该训练集包括该多条历史信息在该目标预测时间内的传播量。
经过实际社交网络验证,单位时间(也可以称为时间序列粒度)一般小于30分钟,并且根据目前实验,随着时间序列粒度增加,预测准确率会有所提升,当时间序列粒度达到一定值时,准确率会有所下降。在一种可能实现方式中,后续在预测过程中,还可以基于待预测的待预测信息的指定时长来决定该时间序列粒度,也即是单位时间的选取,例如,待预测信息只有1小时的已知传播量,那么时间序列粒度就不能设为1小时,要根据指定时长的具体时长进行调整,从而合理确定待预测信息的传播量峰值。另外,训练集和待预测信息的时间序列粒度应保持一致。
另外,本发明实施例中所涉及的单位时间事实上可以根据不同需求设置,而不仅限于1小时,例如,单位时间可以为10秒到几分钟或几十分钟不等,单位时间越小(或越大),后续通过训练得到的模型的精度越高,本发明实施例对此不做限定。
由于历史信息本身的传播相关数据均具有时间戳,用于表示该历史信息的真实发布时间以及传播事件发生时的真实时间,针对各条历史信息进行归一化的处理,可以将历史信息的传播量整理为指定格式,将每条历史信息的发布时间记为0,并将每条历史信息的传播事件的真实时间相应转换为相对时间。例如,仍以信息A为例,其发布时间为1月1目的0点,则采用单位时间为1小时的话,可以将信息A的传播量记为(信息A,1,A在每第一个单位时间内的传播量Q(1)A),在下一个单位时间段的传播量记为(信息A,2,A在第二个单位时间内的传播量Q(2)A),...,信息A在第t个单位时间内的传播量记为(信息A,t,A在第t个单位时间内的传播量Q(t)A),依次类推。
需要说明的是,上述多条历史信息可以是来自一个网络平台或来自多个网络平台。每个网络平台可能具有不同的传播特性,因此,为了获知某个网络平台的传播规律,则可以针对该网络平台进行历史信息的获取,并基于获取到的历史信息来训练模型。在实际场景中,如果被预测信息为某些类型,例如政治、娱乐类型等的信息,则可以针对多个网络平台进行同类型的历史信息的获取,并基于获取到的历史信息来训练模型,以增加模型的通用性,并且,可以实现对跨平台信息的传播规律的研究。
另外,还需要说明的是,为了验证后续预测传播模型的有效性和准确性,在获取训练集的同时,还可以获取测试集,该测试集也可以包括多条历史信息的传播量,用以在模型训练成功后对模型进行测试,其中,测试集所包括的历史信息与训练集所包括的历史信息不同,当然,测试集还可以包括部分与训练集相同的信息,但不能完全相同,本发明对此不做具体限定。
201、根据该多条历史信息的传播量在达到峰值之前的激发情况和在达到峰值之后的衰减情况,确定非线性曲线的激发因子参数和衰减因子参数,该非线性曲线用于表示历史信息的传播量随着时间推移的变化规律。
以所获取到的历史信息的条数为N,t为传播时间,T为本次模型训练的目标预测时间为例,该获取激发因子参数和衰减因子参数的过程具体包括以下步骤:
步骤1:获取每个单位时间段内该N条历史信息的平均传播量Q(t),其中,Q(t)id为第t个单位时间内信息id的传播量。
步骤2:令其中,qmax=max[Q(t)],经过线性拟合处理可得:r(t)=K*tH,进一步基于上述公式表达可以推出其中,qmax为多条历史信息的传播量均值的峰值,K、H为常数。且,根据该N条历史信息的传播量峰值可以确定激发因子参数Ka、Ha以及衰减因子参数Kd、Hd。“*”符号用于表示乘法运算。
在该步骤2中,r(t)用于衡量信息传播量接近(或远离)传播量峰值的速度,r(t)的值越小,说明传播量与传播量峰值之间越接近。根据实际社交网络数据验证,该r(t)事实上是一个在双log坐标轴下,呈现“V”字形状的分段函数。在H<0时,r(t)对应V字的下降部分,此时信息的传播量呈上升趋势;当H>0时,r(t)对应V字的上升部分,此时信息的传播量呈衰减趋势,如图3所示。
基于上述描述,可以令其中,H<0时,F为激发因子,当H>0时,F为衰减因子。由于传播过程事实上可以认为是由激发因子和衰减因子起作用,在传播量达到峰值之前,是激发因子在起主导作用,而在传播量达到峰值之后,衰减因子起主导作用,因此,基于上述构思,可以构造如下传播预测模型:
其中,α、β分别为第一常数和第二常数,此时,可以应用通过步骤2中所得到的激发因子参数Ka、Ha以及衰减因子参数Kd、Hd,剩余的未知参数α、β需要经过后续训练步骤得到,qmax为该条历史信息的指定时间内的传播量峰值。
202、对于多条历史信息,确定多个第二传播量峰值,该多个第二传播量峰值为多条历史信息在指定时间内的传播量峰值。
具体地,对于一条历史信息,比较该历史信息在其从发布时间起始的指定时间内各个单位时间段的传播量,将最大传播量作为该历史信息的第二传播量峰值。
需要说明的是,该指定时间可以是基于待预测信息的已知传播量对应的时间段确定,也即是,当需要对某条信息进行预测时,可以先获取该信息从发布到当前时间内的传播量,也即是已知传播量,并将该从发布到当前时间内之间的时长确定为指定时间,并基于指定时间,在步骤202的过程中,获取每条历史信息在指定时间内的传播量峰值并进行后续训练过程。在另一种可能实现方式中,该指定时间还可以是一个固定值,在训练过程中按照历史信息在指定时间的传播量峰值进行训练,而在后续预测时,也要求待预测的信息必须已经至少具有指定时间内的传播量,才可以进行传播量的预测,本发明实施例对该指定时间的确定不做具体限定。
在本发明实施例中,是以从步骤201至步骤202的过程均是基于步骤200中所获取的训练集为训练基础为例说明的,而在实际训练过程中,也可以是基于获取两个训练集,其中一个训练集用于在步骤201中对激发因子参数和衰减因子参数进行训练,该训练集需要包括历史信息在目标预测时间内的传播量,而另一个训练集用于进行步骤202以及之后的训练过程,该两个训练集需要至少包括历史信息在目标预测时间内的传播量,本发明实施例对上述具体获取几个训练集不做限定,可以基于获取平台或是获取耗时要求等选择是获取一个训练集还是获取两个训练集。
203、利用该每条历史信息的传播量、该第二传播量峰值以及该激发因子参数和衰减因子参数,确定传播预测模型的第一参数和第二参数,该传播预测模型用于表示待预测信息随着时间变化而变化的预测传播量。
其中,该第一参数和第二参数能够使得基于该每条历史信息的第二传播量峰值预测得到的传播量与该每条历史信息的传播量(也即是实际传播量)之间最接近。具体地,上述步骤203可以包括以下步骤1至步骤3:
步骤1:获取多组第一参数和第二参数。
其中,该多组第一参数和第二参数可以由技术人员设置,用于代入已构造的传播预测模型,从而经过训练确定哪组第一参数和第二参数能够使得基于该每条历史信息的第二传播量峰值以及该第二时间预测得到的传播量与该每条历史信息的实际传播量最接近。例如,可以获取第一参数集合{0,0.01,0.02,0.03,0.04,....,1}和第二参数集合{0,0.01,0.02,0.03,0.04,....,10},对于第一参数集合和第二参数集合来说,其集合中粒度可以为任意数值,粒度越小,后续所构建的传播预测模型的预测准确性越高。将第一参数集合中的取值和第二参数集合中的取值随意排列组合,得到多组第一参数和第二参数,用以构造多个不同的传播预测模型。
步骤2:将该每条历史信息的第二传播量峰值输入基于该多组第一参数和第二参数的传播预测模型,得到该每条历史信息的预测传播量。
将每条历史信息的第二传播量峰值输入设置了任一组参数的传播预测模型中,计算得到该条历史信息的预测传播量,从而得到基于多组参数的预测传播量。
对于每条历史信息来说,其预测传播量实际上已知时间段内的传播量与预测的未知时间段内的传播量的和值,也即是,
其中,Tknown是指指定时间,T为该条历史信息的目标预测时间。因此,可以根据之前构造的以及预设的第一参数和第二参数等参数,计算得到再与也即是达到第二时间之前的传播量求和,从而得到在该组参数设置下该条历史信息的预测传播量。
在该次计算过程中,qmax实际上是指该条历史信息的在指定时间也即Tknown内的传播量峰值,也即是,
步骤3:获取该每条历史信息的预测传播量和该每条历史信息的传播量之间的平均绝对误差,将该平均绝对误差最小时的第一参数和第二参数作为该传播预测模型的第一参数和第二参数。
将每条历史信息通过计算得到的预测传播量与实际的传播量进行比较,计算出平均绝对误差并将MAPE最小时的第一参数和第二参数作为该传播预测模型的第一参数和第二参数,得到最终的传播预测模型。其中,N为历史信息的条数,为一条历史信息的实际传播量,QT id为该条历史信息的预测传播量。
上述步骤202至203,通过激发因子参数Ka、Ha以及衰减因子参数Kd、Hd,并构造了Q(t)的公式,则可以再继续根据历史信息的传播量峰值等来训练以得到未知参数α、β,从而完善传播预测模型的过程,由于所获取的第一参数和第二参数可以使得传播预测模型的预测最为接近实际传播量,从而达到准确预测的目的。
204、在进行预测时,获取待预测信息的已知传播量,该已知传播量至少包括指定时间内的传播量。
当需要对某一条待预测信息进行传播量的预测时,可以获取该待预测信息目前的已知传播量,也即是,该待预测信息需要是一条已经发布并且经过一段时间的传播的信息。
205、确定第一传播量峰值,该第一传播量峰值为该待预测信息的已知传播量中的传播量峰值。
具体地,比较该待预测信息在指定时间内各个单位时间段的传播量,将最大传播量作为该第一传播量峰值。
206、根据该第一传播量峰值以及传播预测模型,获取该待预测信息在目标预测时间内的传播量。
当然,在进行传播量计算时,如果所得到的传播量不是整数,则可以基于一定原则进行取整,例如,采用四舍五入的原理进行,将大于或等于0.5的值取为1,而将小于0.5的值取为0。
该目标预测时间可以由用户自行设置,例如,当想要预测一条待预测信息在5天内的传播量时,可以将目标预测时间设置为5天。当然,该5天实际上是以该待预测信息的发布时间起始。
其中,该传播预测模型由多条历史信息的传播量以及该多条历史信息的第二传播量峰值通过上述训练过程训练得到。具体地,由于之前已经确定了第一参数、第二参数以及激发因子参数、衰减因子参数,又通过步骤205确定了待预测信息的第一传播量峰值,则可以直接将该第一传播量峰值代入下述传播预测模型,获取该待预测信息在该目标预测时间内的传播量:
其中,为该待预测信息在信息发布之后到该指定时间Tknown内的传播量,为该待预测信息在Tknown到该目标预测时间内的传播量;
其中,α为第一参数,β为第二参数,qmax为该第一传播量峰值,Ka、Ha为激发因子参数,Kd、Hd为衰减因子参数。
需要说明的是,上述的模型训练过程和对待预测信息的传播量预测过程可以是在同一个设备上实现,例如,均可由服务器进行,在服务器侧进行模型训练,并基于模型训练得到的传播预测模型进行预测,或者,还可以由服务器侧进行模型训练后,将训练所得到的传播预测模型下发至其他设备,而由其他设备基于该传播预测模型进行预测,本发明实施例对具体由哪些设备参与上述过程不做限定。
本发明实施例提供的方法,通过利用由多条历史信息的传播量训练得到的传播预测模型,来对待预测信息的目标预测时间的传播量进行预测,由于在模型训练时是基于多条历史信息的传播量与传播量峰值等进行,因此,该传播预测模型能够表示传播量与传播量峰值之间的准确关系,从而达到对传播量进行预测的目的,且预测所得到的传播量准确性高,有利于后续有针对性的制定传播策略,为商业运营等提供了有力依据。
图4是本发明实施例提供的一种信息传播量的预测装置的结构示意图。参见图4,所述装置包括:
获取模块401,用于获取待预测信息的已知传播量,所述已知传播量至少包括指定时间内的传播量;
确定模块402,用于确定第一传播量峰值,所述第一传播量峰值为所述待预测信息的已知传播量中的传播量峰值;
预测模块403,用于根据所述第一传播量峰值以及传播预测模型,获取所述待预测信息在目标预测时间内的传播量;
所述传播预测模型由多条历史信息的在所述目标预测时间内的已知传播量以及多个第二传播量峰值训练得到,所述多个第二传播量峰值为所述多条历史信息在所述目标预测时间内的指定时间内传播量峰值,所述指定时间早于所述目标预测时间。
在任一种可能实现方式中,所述确定模块用于比较比较所述待预测信息在所述指定时间中各个单位时间段内的传播量,将单位时间段内的最大传播量作为所述第一传播量峰值。
在任一种可能实现方式中,所述装置还包括:传播预测模型训练模块,用于根据所述多条历史信息的传播量在达到峰值之前的激发情况和在达到峰值之后的衰减情况,确定非线性曲线的激发因子参数和衰减因子参数,所述非线性曲线用于表示历史信息的传播量随着时间推移的变化规律;对于所述多条历史信息,确定所述多个第二传播量峰值;利用所述多条历史信息的传播量、所述多个第二传播量峰值以及所述激发因子参数和衰减因子参数,确定传播预测模型的第一参数和第二参数,所述传播预测模型用于表示待预测信息随着时间变化而变化的预测传播量;其中,所述第一参数和第二参数能够使得基于所述多个第二传播量峰值预测得到的传播量与所述每条历史信息的传播量最接近。
在任一种可能实现方式中,所述传播预测模型训练模块用于获取多组第一参数和第二参数;将所述多个第二传播量峰值输入基于所述多组第一参数和第二参数的传播预测模型,得到所述每条历史信息的预测传播量;获取所述每条历史信息的预测传播量和所述每条历史信息的传播量之间的平均绝对误差,将所述平均绝对误差最小时的第一参数和第二参数作为所述传播预测模型的第一参数和第二参数。
在任一种可能实现方式中,所述预测模块用于将所述第一传播量峰值代入下述传播预测模型,获取所述待预测信息在所述目标预测时间内的传播量:
其中,为所述待预测信息在发布之后到所述指定时间Tknown内的传播量,为所述待预测信息在所述指定时间到所述目标预测时间内的传播量;
其中,α为第一参数,β为第二参数,qmax为所述第一传播量峰值,Ka、Ha为激发因子参数,Kd、Hd为衰减因子参数。
本发明实施例提供的装置,通过利用由多条历史信息的传播量训练得到的传播预测模型,来对待预测信息的目标预测时间的传播量进行预测,由于在模型训练时是多条历史信息的传播量与传播量峰值以及传播时间等进行,因此,该传播预测模型能够表示传播量与传播量峰值之间的准确关系,从而达到对传播量进行预测的目的,且预测所得到的传播量准确性高,有利于后续那有针对性的制定传播策略,为商业运营等提供了有力依据。
图5是本发明实施例提供的一种信息传播量的预测装置的结构框图。该终端可以用于执行上述各个实施例中提供的信息传播量的预测方法。参见图5,该装置500包括:装置500可以包括一个或者一个以上处理核心的处理器110、一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、通信模块150等部件。本领域技术人员可以理解,图5中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
通信模块150可以包括RF(Radio Frequency,射频)电路和WiFi(WirelessFidelity,无线保真)模块中至少一项。RF电路可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器110处理;另外,将涉及上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobilecommunication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband CodeDivision Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。WiFi属于短距离无线传输技术,装置500通过WiFi模块可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。
存储器120可用于存储软件程序以及模块,处理器110通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据装置500的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器110和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及装置500的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图5中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。该显示单元140可用于显示待预测信息,并通过输入单元130等所输入的操作对待预测信息进行操作,例如转发、触发预测流程、发布信息等。
处理器110是装置500的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行装置500的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器110可包括一个或多个处理核心;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
装置500还包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,装置500还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端的显示单元是触摸屏显示器,终端还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。所述一个或者一个以上程序包含用于执行图2所示实施例中所执行操作的指令。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成下述实施例中的信息传播量的预测方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图6是本发明实施例提供的一种信息传播量的预测装置的结构框图。例如,装置600可以被提供为一服务器。参照图6,装置600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理部件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述图2所示实施例提供的信息传播量的预测方法。
装置600还可以包括一个电源组件626被配置为执行装置600的电源管理,一个有线或无线网络接口650被配置为将装置600连接到网络,和一个输入输出(I/O)接口658。装置600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成下述实施例中的信息传播量的预测方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种信息传播量的预测方法,其特征在于,所述方法包括:
获取待预测信息的已知传播量,所述已知传播量至少包括指定时间内的传播量;
确定第一传播量峰值,所述第一传播量峰值为所述待预测信息的已知传播量中的传播量峰值;
根据所述第一传播量峰值以及传播预测模型,获取所述待预测信息在目标预测时间内的传播量;
所述传播预测模型由多条历史信息在所述目标预测时间内的传播量以及多个第二传播量峰值训练得到,所述多个第二传播量峰值为所述多条历史信息在指定时间内传播量峰值,所述指定时间早于所述目标预测时间。
2.根据权利要求1所述的方法,其特征在于,所述确定第一传播量峰值包括:
比较所述待预测信息在所述指定时间中各个单位时间段内的传播量,将单位时间段内的最大传播量作为所述第一传播量峰值。
3.根据权利要求1所述的方法,其特征在于,所述传播预测模型的训练过程包括:
根据所述多条历史信息的传播量在达到峰值之前的激发情况和在达到峰值之后的衰减情况,确定非线性曲线的激发因子参数和衰减因子参数,所述非线性曲线用于表示历史信息的传播量随着时间推移的变化规律;
对于所述多条历史信息,确定所述多个第二传播量峰值;
利用所述多条历史信息的传播量、所述多个第二传播量峰值以及所述激发因子参数和衰减因子参数,确定传播预测模型的第一参数和第二参数,所述传播预测模型用于表示待预测信息随着时间变化而变化的预测传播量;
其中,所述第一参数和第二参数能够使得基于所述多个第二传播量峰值预测得到的传播量与所述每条历史信息的传播量最接近。
4.根据权利要求3所述的方法,其特征在于,所述利用所述多条历史信息的传播量、所述多个第二传播量峰值以及所述激发因子参数和衰减因子参数,确定传播预测模型的第一参数和第二参数包括:
获取多组第一参数和第二参数;
将所述多个第二传播量峰值输入基于所述多组第一参数和第二参数的传播预测模型,得到所述每条历史信息的预测传播量;
获取所述每条历史信息的预测传播量和所述每条历史信息的传播量之间的平均绝对误差,将所述平均绝对误差最小时的第一参数和第二参数作为所述传播预测模型的第一参数和第二参数。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述第一传播量峰值以及传播预测模型,获取所述待预测信息在目标预测时间内的传播量包括:
将所述第一传播量峰值代入下述传播预测模型,获取所述待预测信息在所述目标预测时间内的传播量:
其中,为所述待预测信息在发布之后到所述指定时间Tknown内的传播量,为所述待预测信息在所述指定时间到所述目标预测时间的结束时间内的传播量;
其中,α为第一参数,β为第二参数,qmax为所述第一传播量峰值,Ka、Ha为激发因子参数,Kd、Hd为衰减因子参数。
6.一种信息传播量的预测装置,其特征在于,所述装置包括:
获取模块,用于获取待预测信息的已知传播量,所述已知传播量至少包括指定时间内的传播量;
确定模块,用于确定第一传播量峰值,所述第一传播量峰值为所述待预测信息的已知传播量中的传播量峰值;
预测模块,用于根据所述第一传播量峰值以及传播预测模型,获取所述待预测信息在目标预测时间内的传播量;
所述传播预测模型由多条历史信息的在所述目标预测时间内的已知传播量以及多个第二传播量峰值训练得到,所述多个第二传播量峰值为所述多条历史信息在所述目标预测时间内的指定时间内传播量峰值,所述指定时间早于所述目标预测时间。
7.根据权利要求6所述的装置,其特征在于,所述确定模块用于比较所述待预测信息在所述指定时间中各个单位时间段内的传播量,将单位时间段内的最大传播量作为所述第一传播量峰值。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:传播预测模型训练模块,用于根据所述多条历史信息的传播量在达到峰值之前的激发情况和在达到峰值之后的衰减情况,确定非线性曲线的激发因子参数和衰减因子参数,所述非线性曲线用于表示历史信息的传播量随着时间推移的变化规律;对于所述多条历史信息,确定所述多个第二传播量峰值;利用所述多条历史信息的传播量、所述多个第二传播量峰值以及所述激发因子参数和衰减因子参数,确定传播预测模型的第一参数和第二参数,所述传播预测模型用于表示待预测信息随着时间变化而变化的预测传播量;
其中,所述第一参数和第二参数能够使得基于所述多个第二传播量峰值预测得到的传播量与所述每条历史信息的传播量最接近。
9.根据权利要求8所述的装置,其特征在于,所述传播预测模型训练模块用于获取多组第一参数和第二参数;将所述多个第二传播量峰值输入基于所述多组第一参数和第二参数的传播预测模型,得到所述每条历史信息的预测传播量;获取所述每条历史信息的预测传播量和所述每条历史信息的传播量之间的平均绝对误差,将所述平均绝对误差最小时的第一参数和第二参数作为所述传播预测模型的第一参数和第二参数。
10.根据权利要求6至9任一项所述的装置,其特征在于,所述预测模块用于将所述第一传播量峰值代入下述传播预测模型,获取所述待预测信息在所述目标预测时间内的传播量:
其中,为所述待预测信息在发布之后到所述指定时间Tknown内的传播量,为所述待预测信息在所述指定时间到所述目标预测时间内的传播量;
其中,α为第一参数,β为第二参数,qmax为所述第一传播量峰值,Ka、Ha为激发因子参数,Kd、Hd为衰减因子参数。
CN201710159611.4A 2017-03-17 2017-03-17 信息传播量的预测方法及装置 Active CN108632054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710159611.4A CN108632054B (zh) 2017-03-17 2017-03-17 信息传播量的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710159611.4A CN108632054B (zh) 2017-03-17 2017-03-17 信息传播量的预测方法及装置

Publications (2)

Publication Number Publication Date
CN108632054A true CN108632054A (zh) 2018-10-09
CN108632054B CN108632054B (zh) 2022-08-05

Family

ID=63686957

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710159611.4A Active CN108632054B (zh) 2017-03-17 2017-03-17 信息传播量的预测方法及装置

Country Status (1)

Country Link
CN (1) CN108632054B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008740A (zh) * 2019-12-04 2020-04-14 武汉轻工大学 数据传播趋势的预测方法、设备、存储介质及装置
CN111340240A (zh) * 2020-03-25 2020-06-26 第四范式(北京)技术有限公司 实现自动机器学习的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984264A (en) * 1989-02-22 1991-01-08 Kabushiki Kaisha Toshiba Call admission control method and cell flow monitoring method in the same method
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统
CN103546335A (zh) * 2013-09-16 2014-01-29 紫光股份有限公司 一种网络流量的预测方法及其装置
CN104134159A (zh) * 2014-08-04 2014-11-05 中国科学院软件研究所 一种基于随机模型预测信息最大化传播范围的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984264A (en) * 1989-02-22 1991-01-08 Kabushiki Kaisha Toshiba Call admission control method and cell flow monitoring method in the same method
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统
CN103546335A (zh) * 2013-09-16 2014-01-29 紫光股份有限公司 一种网络流量的预测方法及其装置
CN104134159A (zh) * 2014-08-04 2014-11-05 中国科学院软件研究所 一种基于随机模型预测信息最大化传播范围的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋海: "电信数据网性能监测与流量预测技术研究及实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008740A (zh) * 2019-12-04 2020-04-14 武汉轻工大学 数据传播趋势的预测方法、设备、存储介质及装置
CN111008740B (zh) * 2019-12-04 2022-05-24 武汉轻工大学 数据传播趋势的预测方法、设备、存储介质及装置
CN111340240A (zh) * 2020-03-25 2020-06-26 第四范式(北京)技术有限公司 实现自动机器学习的方法及装置

Also Published As

Publication number Publication date
CN108632054B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN104618440B (zh) 智能设备控制方法及装置
CN104967679B (zh) 信息推荐系统、方法及装置
CN104239535B (zh) 一种为文字配图的方法、服务器、终端及系统
CN104618222B (zh) 一种匹配表情图像的方法及装置
CN104980455B (zh) 一种基于云存储的多终端数据同步方法、装置和系统
CN107391259A (zh) 资源处理方法和装置、计算机可读存储介质、移动终端
CN110019825B (zh) 一种分析数据语义的方法及装置
CN104572889A (zh) 一种搜索词推荐方法、装置和系统
CN104850434A (zh) 多媒体资源下载方法及装置
CN104992342A (zh) 推广信息投放有效性确定方法、监测服务器及终端
CN108846767B (zh) 社交群组的特征获取方法及装置
CN107545404A (zh) 账单提醒方法及装置
CN104636255A (zh) 网页应用的显示效果测试方法及装置
CN104699501B (zh) 一种运行应用程序的方法及装置
CN107645682A (zh) 进行直播的方法和系统
CN104424211A (zh) 一种基于微博的业务数据的发布方法、装置和系统
CN106909667A (zh) 基于桌面启动器的应用推荐方法、装置及移动终端
CN104968008A (zh) 一种接入调度方法、装置和系统
CN113537685A (zh) 一种数据处理方法和装置
CN109151949A (zh) 阻断接入异常网络小区的方法、移动终端和存储介质
CN114840565A (zh) 抽样查询方法、装置、电子设备及计算机可读存储介质
CN109246233A (zh) 基于在线监控的数据处理方法、装置、设备及存储介质
CN115904950A (zh) 一种测试用例生成方法、装置、设备及存储介质
CN105550316A (zh) 音频列表的推送方法及装置
CN108632054A (zh) 信息传播量的预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant