CN103761292A

CN103761292A - 基于用户转发行为的微博阅读概率计算方法

Info

Publication number: CN103761292A
Application number: CN201410020499.2A
Authority: CN
Inventors: 宋丹丹; 杜建光; 廖乐健; 礼欣
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2014-01-16
Filing date: 2014-01-16
Publication date: 2014-04-30
Anticipated expiration: 2034-01-16
Also published as: CN103761292B

Abstract

本发明涉及一种基于用户转发行为的微博阅读概率计算方法，用于计算在一段给定的时间范围(T₁,T₂)内，一用户H的好友发送的一条微博W_x，其发送时间用t_x表示，T₁<t_x<T₂，被用户H阅读的概率，其具体操作步骤如下：首先，在给定的时间范围(T₁,T₂)内，查找时间t_x之前用户H转发的最后一条微博W_i的原始发送时间点t_i，以及时间t_x之后用户H转发的第一条微博W_j的原始转发时间点t_j；同时获取微博W_i的转发时间点t_i′，和微博W_j的转发时间点t′_j。然后，按照t_i、t_i′、t_j和t′_j的时间顺序，将t_i、t_i′、t_j、t′_j的关系分为6种情况。最后，分别按照6种情况计算微博W_x被用户H阅读的概率。使用本发明提出的基于用户转发行为的微博阅读概率计算方法计算微博的阅读概率，可以更准确的衡量用户的属性，方便其它微博应用，如：推荐系统、虚拟广告等。

Description

基于用户转发行为的微博阅读概率计算方法

技术领域

本发明涉及一种基于用户转发行为的微博阅读概率计算方法，属于计算机应用技术领域。

背景技术

随着在线社交网络的高速发展，微博这种新型的社交网络在人们的生活中发挥着越来越重要的作用。因此，在微博中进行用户行为分析逐渐成为一个新兴的热点研究方向。

在已有研究中，关于用户行为的分析侧重于在微博中进行统计分析，例如：认证用户的个数、活跃用户的个数、用户的地理位置分布、用户每天发的微博个数与时间的关系、用户回复和转发情况等。在这些统计数据上进一步进行数据挖掘对微博中的应用，如：推荐系统、虚拟广告等都具有重要意义。

阅读行为和转发行为都属于用户行为。用户阅读其好友所发的微博，同时转发有意义的微博。现实中，用户往往关注许多好友，这些好友每天会发表大量的微博。因此，对一个用户而言，其能够阅读的微博数量巨大，而用户每天有特定的活动规律，因此这些微博中，有些微博有较大的可能性被阅读，而有些微博被阅读的可能性会很低。

近些年来，虽然研究人员做了大量关于社交网络的研究。但还没有研究人员根据用户的行为，研究其好友所发微博被阅读的概率。早期，研究人员根据用户的被关注程度计算用户的影响力，随后研究人员通过分析用户行为（转发、回复、提到）来计算用户的影响力，结果表明分别通过用户转发行为、用户回复发行为和用户提到（）行为计算得到的用户影响力结果之间能够很好的相互关联，而这三个结果与通过被关注数计算得到的用户影响力不相关联，这表明通过被关注数计算得到的用户影响力的准确度更低。但分别通过用户转发行为、用户回复发行为和用户提到行为计算得到的用户影响力的方法存在一个明显的缺陷：这些研究没有更深层次的考虑用户的阅读行为。例如：用户每天查看微博的上线习惯。

用户阅读微博有一定的习惯，例如：当用户在浏览微博时，这些微博是按照时间倒序排列的。通常情况下，用户会从上到下阅读微博。当阅读完一页的时候，通过点击“更多”按钮阅读更早的微博。一旦遇到感兴趣的微博，用户会选择转发。根据这些习惯，2010年CIKM会议上，Zi Yang等人将用户好友所发的微博分为三类：转发、错过、忽略，并将这些习惯作为一个特征，系统的研究了转发行为的内在机制。

总体而言，已有的研究存在以下问题：

(1)在计算用户影响力时没有考虑用户的行为习惯。导致这种计算方法不能很好的刻画用户的阅读行为。例如在极端情况下，用户好友会发表大量的微博，对用户而言阅读到所有的微博是不可能的。

(2)虽然一些研究考虑了用户的阅读行为习惯，但是没有更深进一步的研究这些阅读习惯。

发明内容

本发明的目的是在于针对现有技术的缺点，提供一种基于用户转发行为的微博阅读概率计算方法。

一种基于用户转发行为的微博阅读概率计算方法，用于计算在一段给定的时间范围内（用符号(T₁,T₂)表示，其中T₁、T₂之间的时间间隔不小于1小时），一用户（用符号H表示）的好友发送的一条微博（用符号W_x表示，其发送时间用t_x表示，T₁<t_x<T₂）被用户H阅读的概率（用符号P(W_x)表示），其具体操作步骤如下：

步骤一、在给定的时间范围(T₁,T₂)内，查找时间t_x之前用户H转发的最后一条微博（用符号W_i表示）的原始发送时间点（用符号t_i表示，T₁<t_i<t_x），以及时间t_x之后用户H转发的第一条微博（用符号W_j表示）的原始转发时间点（用符号t_j表示，t_x<t_j<T₂）；同时获取微博W_i的转发时间点（用符号t_i′表示，T₁<t_i′<T₂）和微博W_j的转发时间点（用符号t′_j表示，T₁<t_j′<T₂）。

步骤二、在步骤一操作的基础上，按照微博W_i的原始发送时间点t_i、转发时间点t_i′，以及微博W_j的原始发送时间点t_j和转发时间点t′_j的时间顺序，将t_i、t_i′、t_j、t′_j的关系分为以下6种情况：

情况1：T₁<t_i<t_j<t'_j<t_i'<T₂；

情况2：T₁<t_i<t_i'<t_j<t'_j<T₂；

情况3：T₁<t_i<t_j<t_i'<t'_j<T₂。

情况4：在时间范围(T₁,T₂)内，在时间t_x之前未查找到用户H转发的最后一条微博W_i，即不存在t_i和t_i′，但在时间t_x之后查找到用户H转发的第一条微博W_j，且T₁<t_j<t'_j<T₂；

情况5：在时间范围(T₁,T₂)内，在时间t_x之后未查找到用户H转发的第一条微博W_j，即不存在t_j和t′_j，但在时间t_x之前查找到用户H转发的最后一条微博W_i，且T₁<t_i<t_i'<T₂；

情况6：在时间范围(T₁,T₂)内，在时间t_x之前未查找到用户H转发的最后一条微博W_i，同时在时间t_x之后未查找到用户H转发的第一条微博W_j，即t_i、t_i′、t_j、t′_j都不存在。

步骤三、在步骤二操作的基础上，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况1时，则认为用户H在t_i≤t_x≤t_j时间范围内持续在阅读微博，因此判断用户H一定能阅读到微博W_x，因此微博W_x被用户H阅读的概率函数如公式（1）所示。

P(W_x)=1 （1）

步骤四、在步骤二操作的基础上，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况2时，则认为用户H在(t_i,t'_j)时间范围内有2次阅读过程。所述一次阅读过程是指在一段连续的时间范围内，用户持续在微博页面上从上向下阅读微博的过程。

用户H在(t_i,t'_j)时间范围内的第1次阅读过程的开始时间为(t_i,t_i')中的某一时刻，在此阅读过程中用户H转发了微博W_i；用户H在(t_i,t'_j)时间范围内的第2次阅读过程的开始时间为(t_j,t'_j)中的某一时刻，在此阅读过程中用户H转发了微博W_j。

在第1次阅读过程中，用户在t_i′时刻转发了发布在t_i时刻的微博W_i，因此微博W_i被用户H读到的概率为1。由于第1次阅读过程的开始时间在t_i与t_i′之间，因此，发布在t_i′时刻的微博在第1次阅读过程中被用户的读到的概率为0。因此，当t_i≤t_x≤t_i'时，微博W_x被用户H阅读的概率函数是递减的，微博W_x被用户H阅读的概率可通过公式（2）得到。

P (W_{x}) = \frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}}, t_{i} \leq t_{x} \leq t_{i}^{'} - - - (2)

在第2次阅读过程中，用户在t_j′时刻转发了发表在t_j时刻的微博W_j，因此微博W_j被用户H读到的概率为1。由于用户在前一次阅读过程中已经阅读了发布在t_i时刻的微博，因此，在此次阅读过程中，t_i时刻和早于t_i时刻的微博的阅读概率都为0。因此，当t_i≤t_x≤t_j，微博W_x被用户H阅读的概率函数可通过公式（3）计算得到。

P (W_{x}) = \frac{t_{x} - t_{i}}{t_{j} - t_{i}}, t_{i} \leq t_{x} \leq t_{j} - - - (3)

当微博W_x的阅读概率可以通过公式（2）和公式（3）分别计算并得到两个不同值时，取其中较大的值作为微博W_x的阅读概率。因此，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况2时，可通过公式（4）获得发布在时刻t_x的微博W_x被用户H阅读的概率函数，其中t_i≤t_x≤t_j。

P (W_{x}) = \{\begin{matrix} \max (\frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}}, \frac{t_{x} - t_{i}}{t_{j} - t_{i}}), & t_{i} \leq t_{x} \leq t_{i}^{'} \\ \frac{t_{x} - t_{i}}{t_{j} - t_{i}}, & t_{i}^{'} < t_{x} \leq t_{j} \end{matrix} - - - (4)

步骤五、在步骤二操作的基础上，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况3时，认为用户H在(t_i,t'_j)时间范围内有2次阅读过程。

在第1次阅读过程中，用户在t_i′时刻转发了发布在t_i时刻的微博W_i，因此微博W_i被用户H读到的概率为1。由于这次阅读过程的开始时间介于t_i与t_i′之间，而且微博W_j在第2次阅读过程中被转发，所以，这次阅读过程的开始时间介于t_i与t_j之间。因此发布在t_j时刻的微博在这次阅读过程中被用户的读到的概率为0。因此，当t_i≤t_x≤t_j时，微博W_x被用户H阅读的概率可通过公式（5）得到。

P (W_{x}) = \frac{t_{j} - t_{x}}{t_{j} - t_{i}}, t_{i} \leq t_{x} \leq t_{j} - - - (5)

在第2次阅读过程中，用户在t_j′时刻转发了发表在t_j时刻的微博W_j，因此微博W_j被用户H读到的概率为1。由于用户在前一次阅读过程中已经阅读了发布在t_i时刻的微博，因此，在此次阅读过程中，t_i时刻和早于t_i时刻的微博的阅读概率都为0。因此，当t_i≤t_x≤t_j，则微博W_x被用户H阅读的概率函数可通过公式（6）计算得到。

P (W_{x}) = \frac{t_{x} - t_{i}}{t_{j} - t_{i}}, t_{i} \leq t_{x} \leq t_{j} - - - (6)

当微博W_x的阅读概率可以通过公式（5）和公式（6）分别计算并得到两个不同值时，取其中较大的值作为W_x的阅读概率。因此，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况3时，可通过公式（7）获得发布在时刻t_x的微博W_x被用户H阅读的概率函数，其中t_i≤t_x≤t_j。

P (W_{x}) =max (\frac{t_{j} - t_{x}}{t_{j} - t_{i}}, \frac{t_{x} - t_{i}}{t_{j} - t_{i}}), t_{i} \leq t_{x} \leq t_{j} - - - (7)

步骤六、在步骤二操作的基础上，当微博W_i不存在，微博W_j存在，并且t_j、t′_j满足步骤二中所述情况4时，即微博W_j为用户H在时间段(T₁,T₂)内转发的第一条微博。由于用户在t_j′时刻转发了发表在t_j时刻的微博W_j，因此微博W_j被用户H读到的概率为1。因此从时间点t_j到时间点T₁之间的微博被用户H读到的概率是递减的，此时发布在时刻t_x的微博W_x被用户H阅读的概率可通过公式（8）计算得到。

P (W_{x}) = \frac{t_{x} - T_{1}}{t_{j} - T_{1}}, T_{1} \leq t_{x} \leq t_{j} - - - (8)

步骤七、在步骤二操作的基础上，当微博W_j不存在，微博W_i存在，并且t_i、t_i′满足步骤二中所述情况5时，即微博W_i为用户H在时间段(T₁,T₂)内转发的最后一条微博。由于用户在t_i′时刻转发了发表在t_i时刻的微博W_i，因此微博W_j被用户H读到的概率为1。因此从时间点t_i到时间点t_i′之间的微博被用户H读到的概率是递减的，此时发布在时刻t_x的微博W_x被用户H阅读的概率可通过公式（9）计算得到。

P (W_{x}) = \{\begin{matrix} \frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}}, & t_{i} \leq t_{x} \leq t_{i}^{'} \\ 0, & t_{i}^{'} < t_{x} < T_{2} \end{matrix} - - - (9)

步骤八、在步骤二操作的基础上，当微博W_i与W_j都不存在，用户H在时间段(T₁,T₂)内没有转发微博，即为情况6所述。由于用户H在此时间内没有转发微博，因此此段时间内微博W_i被用户H阅读的概率都为0。其概率函数，如公式（10）所示。

P(W_x)=0,T₁<t_x<T₂ （10）

通过上述步骤的操作，即可得到(T₁,T₂)时间范围内，用户H的好友发送的微博W_x被用户H阅读的概率P(W_x)。

有益效果

使用本发明提出的基于用户转发行为的微博阅读概率计算方法计算微博的阅读概率，可以更准确的衡量用户的属性，方便其它微博应用，如：推荐系统、虚拟广告等。

具体实施方式

为了更好的说明本发明的技术方案，下面通过6个实施例，对本发明做进一步说明。

实施例中以Twitter中的一个实例用户数据为例。设置数据集起始时间T₁为：2009-08-1400:00:00；终止时间T₂为：2009-08-2600:00:00。将用户转发信息进行抽取，得到的内容如表1所示。

表1用户转发信息表

原始发送人	原始发送时间	转发人	转发时间
				alexblagg	2009-08-1401:04:43	10bagspacking	2009-08-1401:43:06
lisacongdon	2009-08-1401:10:50	10bagspacking	2009-08-1401:42:46
				chrisgeidner	2009-08-1715:45:27	10bagspacking	2009-08-2017:26:27
schmange19	2009-08-2017:26:20	10bagspacking	2009-08-2020:00:34

表1中第一行数据显示了用户10bagspacking在2009-08-14的01:43:06时刻转发了其好友alexblagg发表在2009-08-14的01:04:43时刻发送的微博；第二行数据显示了用户10bagspacking在2009-08-14的01:42:46时刻转发了其好友lisacongdon发表在2009-08-14的01:10:50时刻发送的微博；第三行数据显示了用户10bagspacking在2009-08-20的17:26:27时刻转发了其好友chrisgeidner发表在2009-08-17的15:45:27时刻发送的微博；第四行数据显示了用户10bagspacking在2009-08-20的20:00:34时刻转发了其好友schmange19发表在2009-08-20的17:26:20时刻发送的微博。

同时抽取到用户10bagspacking的好友fmanjoo在(T₁,T₂)内发布的5条微博的时间，如表2所示。

表2用户fmanjoo在(T₁,T₂)内发布5条微博的时间信息

微博代号	原始发送时间
		W₁	2009-08-1400:18:24
W₂	2009-08-1401:06:09
		W₃	2009-08-1404:19:29
W₄	2009-08-1417:21:51
		W₅	2009-08-1619:05:53

实施例1：

计算用户10bagspacking的好友fmanjoo在t_x时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)，此时t_x为2009-08-1400:18:24，W_x为W₁。

步骤一、在表1中查找时间t_x之前用户10bagspacking最后一次转发的微博，表1中未能找到时间t_x之前用户10bagspacking最后一次转发的微博。在表1中查找时间t_x之后用户10bagspacking第一次转发微博W_j的原始发送时间点t_j=2009-08-1401:04:43，微博W_j的转发时间点t_j′=2009-08-1401:43:06。

步骤二、在步骤一操作的基础上，根据微博W_j的原始发送时间点t_j和转发时间点t′_j的时间顺序，判断其符合情况4。

步骤六、微博W_x被用户10bagspacking阅读的概率可通过公式（8）计算：

P (W_{x}) = \frac{t_{x} - T_{1}}{t_{j} - T_{1}} = \frac{{2009 - 08 - 1400 : 18 : 24}_{''}^{''} - {2009 - 08 - 1400 : 00 : 00}_{''}^{''}}{{2009 - 08 - 1401 : 04 : 43}_{''}^{''} - {2009 - 08 - 1400 : 00 : 00}_{''}^{''}} \approx 0.2843

即用户10bagspacking的好友fmanjoo在2009-08-1400:18:24时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)约为28.43%。

实施例2：

计算用户10bagspacking的好友fmanjoo在t_x时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)，此时t_x为2009-08-1401:06:09，W_x为W₂。

步骤一、在表1中查找时间t_x之前用户10bagspacking最后一次转发的微博的原始发送时间点t_i=2009-08-1401:04:43，微博W_i的转发时间点t_i′=2009-08-1401:43:06。在表1中查找时间t_x之后用户10bagspacking第一次转发微博W_j的原始发送时间点t_j=2009-08-1401:10:50，微博W_j的转发时间点t_j′=2009-08-1401:42:46。

步骤二、在步骤一操作的基础上，根据微博W_i的原始发送时间点t_i、转发时间点t_i′，以及微博W_j的原始发送时间点t_j和转发时间点t′_j的时间顺序，判断其符合情况1。

步骤三、微博W_x被用户10bagspacking阅读的概率可通过公式（1）计算：

P(W_x)=1

即用户10bagspacking的好友fmanjoo在2009-08-1401:06:09时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)为100%。

实施例3：

计算用户10bagspacking的好友fmanjoo在t_x时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)，此时t_x为2009-08-1404:19:29，W_x为W₃。

步骤一、在表1中查找时间t_x之前用户10bagspacking最后一次转发的微博的原始发送时间点t_i=2009-08-1401:10:50，微博W_i的转发时间点t_i′=2009-08-1401:42:46。在表1中查找时间t_x之后用户10bagspacking第一次转发微博W_j的原始发送时间点t_j=2009-08-1715:45:27，微博W_j的转发时间点t_j′=2009-08-2017:26:27。

步骤二、在步骤一操作的基础上，根据微博W_i的原始发送时间点t_i、转发时间点t_i′，以及微博W_j的原始发送时间点t_j和转发时间点t′_j的时间顺序，判断其符合情况2。

步骤四、微博W_x被用户10bagspacking阅读的概率可通过公式（4）计算，由于t_x>t_i′，因此：

P (W_{x}) = \frac{t_{x} - t_{i}}{t_{j} - t_{i}} = \frac{{2009 - 08 - 1404 : 19 : 29}_{''}^{''} - {2009 - 08 - 1401 : 10 : 50}_{''}^{''}}{{2009 - 08 - 1715 : 45 : 27}_{''}^{''} - {2009 - 08 - 1401 : 10 : 50}_{''}^{''}} \approx 0.0363

即用户10bagspacking的好友fmanjoo在2009-08-1404:19:29时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)约为3.63%。

实施例4：

计算用户10bagspacking的好友fmanjoo在t_x时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)，此时t_x为2009-08-1717:21:51，W_x为W₄。

步骤一、在表1中查找时间t_x之前用户10bagspacking最后一次转发的微博的原始发送时间点t_i=2009-08-1715:45:27，微博W_i的转发时间点t_i′=2009-08-2017:26:27。在表1中查找时间t_x之后用户10bagspacking第一次转发微博W_j的原始发送时间点t_j=2009-08-2017:26:20，微博W_j的转发时间点t_j′=2009-08-2020:00:34。

步骤二、在步骤一操作的基础上，根据微博W_i的原始发送时间点t_i、转发时间点t_i′，以及微博W_j的原始发送时间点t_j和转发时间点t′_j的时间顺序，判断其符合情况3。

步骤五、微博W_x被用户10bagspacking阅读的概率可通过公式（7）计算：

\begin{matrix} P (W_{x}) = \max (\frac{t_{j} - t_{x}}{t_{j} - t_{i}}, \frac{t_{x} - t_{i}}{t_{j} - t_{i}}) = \frac{t_{j} - t_{x}}{t_{j} - t_{i}} \\ = \frac{{2009 - 08 - 2017 : 26 : 20}_{''}^{''} - {2009 - 08 - 1717 : 21 : 51}_{''}^{''}}{{2009 - 08 - 2017 : 26 : 20}_{''}^{''} - {2009 - 08 - 1715 : 45 : 27}_{''}^{''}} \end{matrix}, \approx 0.9782

即用户10bagspacking的好友fmanjoo在2009-08-1717:21:51时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)约为97.82%。

实施例5：

计算用户10bagspacking的好友fmanjoo在t_x时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)，此时t_x为2009-08-2019:05:53，W_x为W₅。

步骤一、在表1中查找时间t_x之前用户10bagspacking最后一次转发的微博W_i的原始发送时间点t_i=2009-08-2017:26:20，微博W_j的转发时间点t_i′=2009-08-2020:00:34。，表1中未能找到时间t_x之后用户10bagspacking第一次转发的微博。

步骤二、在步骤一操作的基础上，根据微博W_i的原始发送时间点t_i和转发时间点t_i′的时间顺序，判断其符合情况5。

步骤七、微博W_x被用户10bagspacking阅读的概率可通过公式（9）计算，由于t_i≤t_x≤t_i'，因此：

P (W_{x}) = \frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}} = \frac{{2009 - 08 - 2020 : 00 : 34}_{''}^{''} - {2009 - 08 - 2019 : 05 : 53}_{''}^{''}}{{2009 - 08 - 2020 : 00 : 34}_{''}^{''} - {2009 - 08 - 2017 : 26 : 20}_{''}^{''}} \approx 0.03545

即用户10bagspacking的好友fmanjoo在2009-08-2019:05:53时刻发送的微博W_x被用户10bagspacking阅读的概率P(W_x)约为35.45%。

实施例6：

在(T₁,T₂)时间范围内，另一用户waleedovase没有转发任何微博。

计算用户waleedovase的好友fmanjoo在(T₁,T₂)时间范围内的t_x时刻发送的微博W_x被用户waleedovase阅读的概率P(W_x)。

步骤一、未能找到时间t_x之前用户waleedovase最后一次转发的微博。也未能找到时间t_x之后用户waleedovase第一次转发的微博。

步骤二、在步骤一操作的基础上，判断其符合情况6。

步骤八、微博W_x被用户H阅读的概率可通过公式（10）计算：

P(W_x)=0

即用户waleedovase的好友fmanjoo在(T₁,T₂)时间范围内发送的微博W_x被用户waleedovase阅读的概率P(W_x)为0。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例，用于解释本发明，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于用户转发行为的微博阅读概率计算方法，用于计算在一段给定的时间范围内，一用户H的好友发送的一条微博W_x，被用户H阅读的概率P(W_x)，其中：一段给定的时间范围用符号(T₁,T₂)表示，T₁、T₂之间的时间间隔不小于1小时；微博W_x的发送时间用t_x表示，T₁<t_x<T₂；其特征在于：其具体操作步骤如下：

步骤一、在给定的时间范围(T₁,T₂)内，查找时间t_x之前用户H转发的最后一条微博W_i的原始发送时间点t_i，T₁<t_i<t_x，以及时间t_x之后用户H转发的第一条微博W_j的原始转发时间点t_j，t_x<t_j<T₂；同时获取微博W_i的转发时间点t_i′，T₁<t_i′<T₂和微博W_j的转发时间点t′_j，T₁<t_j′<T₂；

情况1：T₁<t_i<t_j<t'_j<t_i'<T₂；

情况2：T₁<t_i<t_i'<t_j<t'_j<T₂；

情况3：T₁<t_i<t_j<t_i'<t'_j<T₂；

情况6：在时间范围(T₁,T₂)内，在时间t_x之前未查找到用户H转发的最后一条微博W_i，同时在时间t_x之后未查找到用户H转发的第一条微博W_j，即t_i、t_i′、t_j、t′_j都不存在；

步骤三、在步骤二操作的基础上，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况1时，则认为用户H在t_i≤t_x≤t_j时间范围内持续在阅读微博，因此判断用户H一定能阅读到微博W_x，因此微博W_x被用户H阅读的概率函数如公式（1）所示；

P(W_x)=1 （1）

步骤四、在步骤二操作的基础上，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况2时，则认为用户H在(t_i,t'_j)时间范围内有2次阅读过程；所述一次阅读过程是指在一段连续的时间范围内，用户持续在微博页面上从上向下阅读微博的过程；

用户H在(t_i,t'_j)时间范围内的第1次阅读过程的开始时间为(t_i,t_i')中的某一时刻，在此阅读过程中用户H转发了微博W_i；用户H在(t_i,t'_j)时间范围内的第2次阅读过程的开始时间为(t_j,t'_j)中的某一时刻，在此阅读过程中用户H转发了微博W_j；

在第1次阅读过程中，用户在t_i′时刻转发了发布在t_i时刻的微博W_i，因此微博W_i被用户H读到的概率为1；由于第1次阅读过程的开始时间在t_i与t_i′之间，因此，发布在t_i′时刻的微博在第1次阅读过程中被用户的读到的概率为0；因此，当t_i≤t_x≤t_i'时，微博W_x被用户H阅读的概率函数是递减的，微博W_x被用户H阅读的概率可通过公式（2）得到；

P (W_{x}) = \frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}}, t_{i} \leq t_{x} \leq t_{i}^{'} - - - (2)

在第2次阅读过程中，用户在t_j′时刻转发了发表在t_j时刻的微博W_j，因此微博W_j被用户H读到的概率为1；由于用户在前一次阅读过程中已经阅读了发布在t_i时刻的微博，因此，在此次阅读过程中，t_i时刻和早于t_i时刻的微博的阅读概率都为0；因此，当t_i≤t_x≤t_j，微博W_x被用户H阅读的概率函数可通过公式（3）计算得到；

P (W_{x}) = \frac{t_{x} - t_{i}}{t_{j} - t_{i}}, t_{i} \leq t_{x} \leq t_{j} - - - (3)

当微博W_x的阅读概率可以通过公式（2）和公式（3）分别计算并得到两个不同值时，取其中较大的值作为微博W_x的阅读概率；因此，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况2时，可通过公式（4）获得发布在时刻t_x的微博W_x被用户H阅读的概率函数，其中t_i≤t_x≤t_j；

P (W_{x}) = \{\begin{matrix} \max (\frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}}, \frac{t_{x} - t_{i}}{t_{j} - t_{i}}), & t_{i} \leq t_{x} \leq t_{i}^{'} \\ \frac{t_{x} - t_{i}}{t_{j} - t_{i}}, & t_{i}^{'} < t_{x} \leq t_{j} \end{matrix} - - - (4)

步骤五、在步骤二操作的基础上，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况3时，认为用户H在(t_i,t'_j)时间范围内有2次阅读过程；

在第1次阅读过程中，用户在t_i′时刻转发了发布在t_i时刻的微博W_i，因此微博W_i被用户H读到的概率为1；由于这次阅读过程的开始时间介于t_i与t_i′之间，而且微博W_j在第2次阅读过程中被转发，所以，这次阅读过程的开始时间介于t_i与t_j之间；因此发布在t_j时刻的微博在这次阅读过程中被用户的读到的概率为0；因此，当t_i≤t_x≤t_j时，微博W_x被用户H阅读的概率可通过公式（5）得到；

P (W_{x}) = \frac{t_{j} - t_{x}}{t_{j} - t_{i}}, t_{i} \leq t_{x} \leq t_{j} - - - (5)

在第2次阅读过程中，用户在t_j′时刻转发了发表在t_j时刻的微博W_j，因此微博W_j被用户H读到的概率为1；由于用户在前一次阅读过程中已经阅读了发布在t_i时刻的微博，因此，在此次阅读过程中，t_i时刻和早于t_i时刻的微博的阅读概率都为0；因此，当t_i≤t_x≤t_j，则微博W_x被用户H阅读的概率函数可通过公式（6）计算得到；

P (W_{x}) = \frac{t_{x} - t_{i}}{t_{j} - t_{i}}, t_{i} \leq t_{x} \leq t_{j} - - - (6)

当微博W_x的阅读概率可以通过公式（5）和公式（6）分别计算并得到两个不同值时，取其中较大的值作为W_x的阅读概率；因此，当微博W_i的原始发送时间点t_i、转发时间点t_i′、微博W_j的原始发送时间点t_j和转发时间点t′_j之间的关系为步骤二中所述情况3时，可通过公式（7）获得发布在时刻t_x的微博W_x被用户H阅读的概率函数，其中t_i≤t_x≤t_j；

P (W_{x}) =max (\frac{t_{j} - t_{x}}{t_{j} - t_{i}}, \frac{t_{x} - t_{i}}{t_{j} - t_{i}}), t_{i} \leq t_{x} \leq t_{j} - - - (7)

步骤六、在步骤二操作的基础上，当微博W_i不存在，微博W_j存在，并且t_j、t′_j满足步骤二中所述情况4时，即微博W_j为用户H在时间段(T₁,T₂)内转发的第一条微博；由于用户在t_j′时刻转发了发表在t_j时刻的微博W_j，因此微博W_j被用户H读到的概率为1；因此从时间点t_j到时间点T₁之间的微博被用户H读到的概率是递减的，此时发布在时刻t_x的微博W_x被用户H阅读的概率可通过公式（8）计算得到；

P (W_{x}) = \frac{t_{x} - T_{1}}{t_{j} - T_{1}}, T_{1} \leq t_{x} \leq t_{j} - - - (8)

步骤七、在步骤二操作的基础上，当微博W_j不存在，微博W_i存在，并且t_i、t_i′满足步骤二中所述情况5时，即微博W_i为用户H在时间段(T₁,T₂)内转发的最后一条微博；由于用户在t_i′时刻转发了发表在t_i时刻的微博W_i，因此微博W_j被用户H读到的概率为1；因此从时间点t_i到时间点t_i′之间的微博被用户H读到的概率是递减的，此时发布在时刻t_x的微博W_x被用户H阅读的概率可通过公式（9）计算得到；

P (W_{x}) = \{\begin{matrix} \frac{t_{i}^{'} - t_{x}}{t_{i}^{'} - t_{i}}, & t_{i} \leq t_{x} \leq t_{i}^{'} \\ 0, & t_{i}^{'} < t_{x} < T_{2} \end{matrix} - - - (9)

步骤八、在步骤二操作的基础上，当微博W_i与W_j都不存在，用户H在时间段(T₁,T₂)内没有转发微博，即为情况6所述；由于用户H在此时间内没有转发微博，因此此段时间内微博W_i被用户H阅读的概率都为0；其概率函数，如公式（10）所示；

P(W_x)=0,T₁<t_x<T₂ （10）