CN108197424A

CN108197424A - 大规模网络教育中网络学习行为幂律分布概率建模方法

Info

Publication number: CN108197424A
Application number: CN201810026932.1A
Authority: CN
Inventors: 刘均; 薛妮; 杨宽; 宋凌云; 张玲玲; 任若清
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2018-01-11
Filing date: 2018-01-11
Publication date: 2018-06-22

Abstract

本发明展示大规模网络教育中网络学习行为幂律分布概率建模方法，1.得出服从幂律分布的网络学习行为B的初始影响因素集合F_ori；2.将相关系数大于给定相关系数阈值r的因素加入候选影响因素集合F_con；3.将与网络学习行为B之间具有因果关系的因素加入最终影响因素集合F；4.提出网络学习行为幂律分布的概率模型假设；5.建立学习者在具体某天进行学习活动的概率模型；6.对所有学习者在课程周期内的学习过程进行模拟。本发明建立了通用的网络学习行为概率模型以及学习过程生成算法，适用于多种网络学习行为，可以基于模型对学习者在课程后续阶段的学习表现进行预测，从而对教学计划进行动态调整，及时做出补救措施。

Description

大规模网络教育中网络学习行为幂律分布概率建模方法

技术领域

本发明涉及网络学习行为分析领域，具体为大规模网络教育中网络学习行为幂律分布概率建模方法。

背景技术

随着网络通信技术的日趋成熟，远程教育规模逐渐增大，网络学习行为分析也逐渐受到相关领域研究者的重视。当前，网络教育(e-Learning)领域中网络学习行为分析的相关研究主要分为五大类：影响因素研究、调控机制研究、交互行为研究、学习风格研究及学习行为建模研究。

2013年Romero C、López M I和Luna J M等人在Computers&Education的68期上458-472页，公开的Predicting students'final performance from participation inon-line discussion forums中；利用学习者在论坛中的讨论数据分析得到学习者在论坛的表现，从而研究学习者在论坛的表现和最终成绩之间的相关性，并基于多种数据挖掘算法和社交网络分析方法构建预测模型，对学习者的最终成绩进行预测。但是该文献的研究重视相关性分析，却忽略因果性分析，并且未能正确认识相关性与因果性的区别，即相关性并非因果性的充分条件，也非必要条件，导致因素分析的准确性较低，参考意义降低。同时，现有研究大部分是基于小规模e-Learning展开的，因而挖掘出的学习规律或建立的模型对大规模e-Learning并不适用。其中，大规模e-Learning与小规模e-Learning一般从学生数量上进行区分，小规模e-Learning中学生数量最多几百人，而大规模e-Learning环境下学生数量达到上千人，甚至数万人。

发明内容

针对现有技术中存在的问题，本发明提供一种大规模网络教育中网络学习行为幂律分布概率建模方法，针对规模网络教育，因素分析准确性高，适用于多种网络学习行为。

本发明是通过以下技术方案来实现：

大规模网络教育中网络学习行为幂律分布概率建模方法，包括以下步骤：

步骤1，在大规模e-Learning环境下，给定服从幂律分布的网络学习行为B，根据幂律分布生成机制以及网络教育机构的教学要求，得出网络学习行为B的初始影响因素集合F_ori；

步骤2，通过相关性分析，计算F_ori中的每个因素f与网络学习行为B之间的相关系数，将相关系数大于给定相关系数阈值r的因素加入候选影响因素集合F_con；

步骤3，通过因果分析，检验F_con中的每个因素f与网络学习行为B之间的因果关系，将与网络学习行为B之间具有因果关系的因素加入最终影响因素集合F；

步骤4，基于BA模型的特性，根据最终影响因素集合F提出网络学习行为幂律分布的概率模型假设；

步骤5，基于最终影响因素集合F以及网络学习行为概率模型假设，建立学习者在具体某天进行学习活动的概率模型；

步骤6，根据得到的概率模型，设计学习过程生成算法，对所有学习者在课程周期内的学习过程进行模拟。

优选的，步骤1中，所述的幂律分布生成机制为增长与优先连接机制，用于描述无标度网络的幂律度分布，其包括如下两个机制：

增长机制，用于描述网络通过增加节点而不断扩张；

优先连接机制，用于描述网络中新加入的节点总是优先选择与网络中连接度值较高的节点进行连接。

优选的，步骤1中，所述的网络教育机构的教学要求为网络教育机构根据教学计划和培养计划提出的针对学习者学习行为的各种约束条件。

优选的，步骤2具体包括如下步骤，

步骤2-1，从初始影响因素集合中任取初始影响因素N是初始影响因素的数量；根据初始影响因素与网络学习行为B之间的散点图，判断二者之间具有线性关系还是非线性关系：

a、如果初始影响因素因素与网络学习行为B之间具有线性关系，则计算初始影响因素因素与网络学习行为B之间的Spearman相关系数，作为执行步骤2-2；

b、如果初始影响因素与网络学习行为B之间具有非线性关系，则计算初始影响因素与网络学习行为B之间的最大信息系数，作为执行步骤2-2；

步骤2-2，判断是否大于相关系数阈值r：

a、如果大于等于r，则将初始影响因素加入候选影响因素集合F_con，执行步骤2-3；

b、如果小于相关系数阈值r，执行步骤2-3；

步骤2-3，从初始影响因素集合F_ori中删除初始影响因素并判断F_ori是否为空：

a、如果F_ori不为空，则执行步骤2-1)；

b、如果F_ori为空，则已处理完所有初始影响因素，得到候选影响因素集合F_con。

优选的，步骤3中，基于Granger因果检验算法，检验步骤2中得出的候选影响因素集合中的每个候选影响因素f_con∈F_con与网络学习行为B之间的因果关系，将与网络学习行为B之间具有因果关系的因素加入最终影响因素集合F，M是候选影响因素的数量。

进一步，步骤3具体包括如下步骤，

步骤3-1，从候选影响因素集合F_con中任取候选影响基于Granger因果检验算法判断因素与网络学习行为B之间是否存在因果关系：

a、如果候选影响因素是B的Granger原因，则将候选影响因素加入最终影响因素集合F，执行步骤3-2)；

b、如果候选影响因素不是B的Granger原因，则执行步骤3-2)；

步骤3-2，从候选影响因素集合F_con中删除候选影响因素并判断F_con是否为空：

a、如果F_con不为空，则执行步骤3-1)；

b、如果F_con为空，则已处理完所有候选影响因素，得到最终影响因素集合F。

优选的，步骤4中，所述的BA模型的特性包括，网络中的节点数目是不断增加的；且新节点优先选择与网络中连接度较大的节点进行连接。

优选的，步骤4中，所述的网络学习行为幂律分布的概率模型假设包含以下三个：

a.每隔一段时间会有新的学习者开始进行学习活动，不同类型的学习行为对应的学习活动不同，并且学习者加入学习的过程为线性过程，即新加入学习者的数量为常数，设该值为△N，具体数值可根据相应学习行为的学习者历史入学过程计算得到；

b.学习者进行学习活动是一个概率事件，概率由最终影响因素集合F中的所有因素共同决定；

c.学习者每次进行学习活动时，产生的活动量为固定值，设该值为△a，具体数值为根据对应学习行为的历史数据计算所得的活动量均值。

进一步，步骤5中得到的概率模型如下，

其中，F_k(t)为最终影响因素F_k在第t天的取值，f_k为最终影响因素F_k的标准化函数，p_s(t)为概率模型的概率值。

进一步，步骤6中，所述的设计学习过程生成算法包括以下步骤：

步骤6-1，初始化开始日期及已参加学习活动的学习者列表L，设置开始日期为当前日期，设置L为空；

步骤6-2，判断L中的学习者数量与学习者总数是否相等：

a、如果相等，则执行步骤6-3；

b、如果不相等，则向L中加入ΔN名学习者，并按如下方式对每个新加入学习者的学习行为影响因素集合F进行初始化：

F＝(F₁(t)，F₂(t)，…，F_K(t)}

其中，F_k(t)为最终影响因素F_k在第t天的取值；

步骤6-3)基于步骤5所述概率模型，计算L中的每个学习者在当前日期进行学习活动的概率p，并以概率p使学习者的累计学习活动量增加Δa，以概率1-p使学习者的累积活动量保持不变；

步骤6-4，如果当前日期为结束日期，则算法结束；否则，日期加1，执行步骤6-2。

与现有技术相比，本发明具有以下有益的技术效果：

本发明通过在因素分析过程中，将相关性分析与因果性分析相结合，提高了因素分析的准确性。采用BA模型的思想，基于最终影响因素集合F以及网络学习行为概率模型假设，建立了通用的网络学习行为概率模型以及学习过程生成算法，适用于多种网络学习行为。对于某个具体的网络学习行为，仅需将通用概率模型中的影响因素改为该学习行为的影响因素即可。从而能够在教学计划设计阶段，利用构建的幂律分布概率模型可以对指定参数下学习者可能的学习行为进行预测，结合模型预测结果来合理设置课程参数，以期获得较好的学习者学习表现；在教学计划实施阶段，可以基于模型对学习者在课程后续阶段的学习表现进行预测，从而对教学计划进行动态调整，及时做出补救措施。

附图说明

图1是本发明所述方法的整体流程示意图。

图2是本发明实例中所述《毛泽东思想和中国特色社会主义理论体系概论》课程的学习者视频观看次数分布图。

图3是本发明实例中所述《毛泽东思想和中国特色社会主义理论体系概论》课程的学习者视频观看次数对数分布图。

图4是本发明本发明实例中所述候选影响因素集合生成方法的流程图。

图5是本发明实例中所述学习者观看频率与视频观看次数的关系图。

图6是本发明实例中所述最终影响因素集合生成方法的流程图。

图7是本发明实例中所述学习过程生成算法的流程图。

具体实施方式

下面结合具体的实施例对本发明做进一步的详细说明，所述是对本发明的解释而不是限定。

本发明大规模网络教育(e-Learning)中网络学习行为幂律分布概率建模方法，建立通用的网络学习行为概率模型以及学习过程生成算法，适用于多种网络学习行为，如图1所示，其包括以下步骤：在大规模e-Learning环境下，给定服从幂律分布的网络学习行为B，根据幂律分布生成机制以及网络教育机构的教学要求，得出网络学习行为B的初始影响因素集合计算F_ori中的每个初始影响因素与网络学习行为B之间的相关系数，将相关系数大于给定相关系数阈值r的因素加入候选影响因素集合检验F_con中的每个候选影响因素f_con∈F_con与网络学习行为B之间的因果关系，将与网络学习行为B之间具有因果关系的因素加入最终影响因素集合F；借鉴BA模型的思想，根据最终影响因素集合F提出网络学习行为概率模型的假设；基于最终影响因素集合F以及网络学习行为概率模型假设，建立学习者在具体某天进行学习活动的概率模型；设计学习过程生成算法，对所有学习者在课程周期内的学习过程进行模拟。本发明在因素分析过程中，将相关性分析与因果性分析相结合，提高了因素分析的准确性。同时，建立了通用的网络学习行为概率模型以及学习过程生成算法，适用于多种网络学习行为。

具体的，大规模网络教育(e-Learning)中网络学习行为幂律分布概率建模方法，包括下述步骤：

1)在大规模e-Learning环境中，给定服从幂律分布的网络学习行为B，根据幂律分布生成机制以及网络教育机构的教学要求，得出网络学习行为B的初始影响因素集合F_ori；

所述的幂律分布生成机制指增长与优先连接机制，该机制是在研究无标度网络的幂律度分布时提出的，包含两个内容：

1-1)增长：网络通过增加节点而不断扩张；

1-2)优先连接：新加入的节点总是优先选择与网络中连接度值较高的节点进行连接。

所述的网络教育机构的教学要求指网络教育机构根据教学计划和培养计划提出的针对学习者学习行为的各种约束条件。

2)计算步骤1)中得出的初始影响因素集合F_ori中的每个因素f与网络学习行为B之间的相关系数，记为R(f，B)，将相关系数大于给定相关系数阈值r(0<r<1，默认取值为0.7)的因素加入候选影响因素集合F_con；

所述的相关系数计算方法以及候选影响因素集合生成方法如下：

2-1)从初始影响因素集合中任取初始影响因素N是初始影响因素的数量。根据初始影响因素与网络学习行为B之间的散点图，判断二者之间具有线性关系还是非线性关系：

a、如果初始影响因素与网络学习行为B之间具有线性关系，则计算初始影响因素与网络学习行为B之间的Spearman相关系数(Spearman相关系数用于度量数据之间的线性相关性)，作为执行步骤2-2)；

b、如果初始影响因素与网络学习行为B之间具有非线性关系，则计算初始影响因素与网络学习行为B之间的最大信息系数，作为执行步骤2-2)；

2-2)判断是否大于相关系数阈值r：

a、如果大于等于r，则将初始影响因素加入候选影响因素集合F_con，执行步骤2-3)；

b、如果小于相关系数阈值r，执行步骤2-3)；

2-3)从初始影响因素集合F_ori中删除初始影响因素并判断F_ori是否为空：

a、如果F_ori不为空，则执行步骤2-1)；

b、如果F_ori为空，则已处理完所有初始影响因素；

3)基于Granger因果检验算法(Granger因果检验算法是目前最常用的检验两个因素之间的因果关系的方法，被广泛应用于经济学领域)，检验步骤2)中得出的候选影响因素集合中的每个候选影响因素f_con∈F_con与网络学习行为B之间的因果关系，将与网络学习行为B之间具有因果关系的因素加入最终影响因素集合F，M是候选影响因素的数量；

所述的因果关系检验方法以及最终影响因素集合生成方法如下：

3-1)从候选影响因素集合F_con中任取候选影响因素基于Granger因果检验算法判断候选影响因素与网络学习行为B之间是否存在因果关系：

b、如果候选影响因素不是B的Granger原因，则执行步骤3-2)；

3-2)从候选影响因素集合F_con中删除候选影响因素并判断F_con是否为空：

a、如果F_con不为空，则执行步骤3-1)；

b、如果F_con为空，则已处理完所有候选影响因素；

4)借鉴BA模型的思想，基于步骤3)得出的最终影响因素集合F提出网络学习行为概率模型的假设；

BA模型是最常用的幂律分布生成模型，其首次把幂律度分布引入到复杂网络中，该模型说明网络中的节点数目是不断增大的，且新节点并非随机选择与网络中已存在节点进行连接，而是倾向于选择与网络中连接度较大的节点进行连接。

所述的网络学习行为概率模型的假设包含以下三个：

4-1)每隔一段时间会有新的学习者开始进行学习活动(不同类型的学习行为对应的学习活动不同，例如，视频观看行为对应的学习活动是观看视频课件，登录行为对应的学习活动是登录系统)，并且学习者加入学习的过程为线性过程，即新加入学习者的数量为常数，设该值为ΔN，具体数值可根据相应学习行为的学习者历史入学过程计算得到；

4-2)学习者进行学习活动是一个概率事件，概率由最终影响因素集合F中的所有因素共同决定；

4-3)学习者每次进行学习活动时，产生的活动量为固定值，设该值为Δa，具体数值为根据对应学习行为的历史数据计算所得的活动量均值。

5)基于步骤3)得出的最终影响因素集合F以及步骤4)提出的模型假设，建立学习者在具体某天进行学习活动的概率模型；

所述的学习者在具体某天进行学习活动的概率模型为：

其中，F_k(t)为最终影响因素F_k在第t天的取值，f_k为最终影响因素F_k的标准化函数，标准化函数的功能是基于相关教学参数对影响因素进行标准化处理，将其取值范围缩小到0到1之间，从而保证最终所得的概率值p_s(t)在0到1之间。

6)基于步骤5)得出的概率模型，设计学习过程生成算法，对所有学习者在课程周期内的学习过程进行模拟。

所述的学习过程生成算法包含以下步骤：

6-1)初始化开始日期及已参加学习活动的学习者列表L，设置开始日期为当前日期，设置L为空；

6-2)判断L中的学习者数量与学习者总数是否相等：

a、如果相等，则执行步骤6-3)；

F＝{F₁(t)，F₂(t)，…，F_K(t)}

其中，F_k(t)为最终影响因素F_k在第t天的取值。

6-3)基于步骤5)所述概率模型，计算L中的每个学习者在当前日期进行学习活动的概率p，并以概率p使学习者的累计学习活动量增加Δa，以概率1-p使学习者的累积活动量保持不变；

6-4)如果当前日期为结束日期，则算法结束；否则，日期加1，执行步骤6-2)。

以下参照附图，以《毛泽东思想和中国特色社会主义理论体系概论》，以下简称《毛概》，这门课程的视频观看行为为例，对本发明大规模网络教育中网络学习行为幂律分布概率建模方法作进一步的详细说明。

1、在大规模e-Learning环境下，构建服从幂律分布的视频观看行为的初始影响因素集合F_ori。

101、视频观看行为对应的学习活动是观看视频课件，下面需要首先验证《毛概》课程视频观看次数的幂律分布特性。

如图2所示，图中每个数据点的横坐标表示视频观看次数区间右值(前一个数据点的横坐标为区间左值)，纵坐标表示课件观看次数在该区间范围内的学习者数量。从图中可以明显看出《毛概》这门课程学习者的视频课件观看次数分布具有“长尾”特性。将《毛概》课程的视频课件观看次数分布曲线绘制在双对数坐标系中，如图3所示，可以看出它们均呈现为斜率为负的直线，从而证明单一课程的视频观看行为同样具有幂律分布特性。

102、在验证了网络学习行为的基础上，构建初始影响因素集合F_ori＝{观看频率，登录次数，平均观看视频时间间隔，起始学习日期，考试日期}，记为{f₁，f₂，f₃，f₄，f₅}。

2、计算步骤1中构建的初始影响因素集合F_ori中每个初始影响因素与视频观看行为B之间的相关系数，记为设定相关系数的阈值r＝0.7。如图4流程所示，不断从F_ori取出因素，并计算与视频观看次数的Spearman相关系数。

以F_ori中的影响因素观看频率为例，如图5所示，图中每个点代表一个学习者，点的横坐标表示学习者的累计视频观看次数，纵坐标表示学习者的观看频率。由图5可见，学习者的观看频率与视频观看次数近似呈线性正相关。观看频率与视频观看次数之间的Spearman相关系数为0.838(p<0.01)，即证明二者之间具有较强的正相关。具体来说，视频课件观看次数较多的学习者具有更高的观看频率，即看的多的学习者会看得更多。

Spearman相关系数对两组数据进行相关性分析时，分析依据是两组数据的秩次大小。给定两个n维随机变量X和Y，将X和Y同时进行升序(或降序)排列，得到有序的n维变量x和y。Spearman相关系数按如下公式计算：

其中，x_i为X_i在x中的排行，y_i为Y_i在y中的排行，也称x_i和y_i分别为X_i和Y_i的秩。ρ的取值范围为[-1，1]，ρ为正数表示变量之间呈正相关，为负数表示变量之间呈负相关，ρ的绝对值越大表示变量之间的相关性越强。

同理，我们计算得到

由于相关系数阈值r＝0.7，所以从初始影响因素集合F_ori中删除登录次数和平均观看视频时间间隔两个因素，保留观看频率、起始学习日期和考试日期三个因素，作为候选影响因素集合F_con。

3、检验步骤2中得出的候选影响因素集合F_con中每个候选影响因素与视频观看行为B之间的因果关系，流程如图6所示。

本发明使用推广的Granger因果检验算法检验影响因素f与视频观看行为B之间的因果关系。由于Granger因果检验针对平稳序列，因此，首先对视频观看次数(Video Views，简称VV)序列和观看频率(Viewing Frequency，简称VF)序列的平稳性进行检验。ADF单位根检验结果如表1所示，检验形式(c，t，k)分别表示常数项、趋势项和滞后阶数。由检验结果可知，VF和VV在1％显著性水平下的临界值均大于T统计量的值，即在1％显著性水平下，VF和VV都是平稳的。对VF和VV进行Granger因果关系检验，检验结果如表2所示。由检验结果可知，两个零假设的P值均远小于0.05，所以VF和VV之间存在双向的Granger因果关系，即学习者的观看频率与视频观看次数之间存在双向的Granger因果关系。

表1单位根检验结果

表2 Granger因果检验结果

同理，利用推广的Granger因果检验算法得到学习者的起始学习日期和考试日期都是视频观看次数的单向Granger原因。因此最终影响因素集合F＝{观看频率，起始学习日期，考试日期}。

4、根据步骤3的分析，能够得到视频观看行为的最终影响因素集合F＝{观看频率，起始学习日期，考试日期}。其中，观看频率大、起始学习时间早的学习者具有较大的观看视频课件的概率，另外，距离考试时间越近，学习者观看视频课件的概率越大。因此，本发明基于BA模型提出如下假设：

(1)每隔一段时间会有新的学习者开始进行学习活动(不同类型的学习行为对应的学习活动不同，例如，视频观看行为对应的学习活动是观看视频课件，登录行为对应的学习活动是登录系统)，并且学习者加入学习的过程为线性过程，即新加入学习者的数量为常数，具体数值可根据相应学习行为的学习者历史入学过程计算得到；

(2)学习者进行学习活动是一个概率事件，概率由影响因素集合F中的所有因素共同决定；

(3)学习者每次进行学习活动时，产生的活动量为固定值，具体数值为根据对应学习行为的历史数据计算所得的活动量均值。

基于上述假设及学习行为影响因素集合F，本发明建立了学习者s在第t天进行学习活动的概率模型。

5、基于步骤3得出的最终影响因素集合F和步骤四提出的概率模型假设，本发明建立学习者在具体某天观看教学视频的学习行为概率模型(Probabilistic LearningBehavior Model，简称PLBM)。

学习者的累计视频观看次数是将其在课程周期内每天的视频课件观看次数进行累计得到的，通过模拟某学习者在具体某一天的视频课件观看情况并逐天迭代，最终可以得到该学习者的完整学习过程。将所有学习者的完整学习过程进行整合即可得到课程的视频观看次数模拟分布。因此，基于步骤3得出的三个因素：观看频率、起始学习日期及考试日期，首先建立学习者i在第t天观看视频课件事件的概率模型：

公式(2)中，p_i(t)由三个部分组成：

(1)表示学习者当前完成课件观看的程度。由步骤3可知，学习者视频课件观看次数与观看频率之间具有较强的正相关，且具有双向Granger因果关系，即观看频率越大视频课件观看次数越多，同时视频课件观看次数越多观看频率越大。即，当前视频观看次数越多的学习者，下一次观看视频的概率越大。该项中C是课程视频课件总数量，w_i，t是学习者i在第t天的累计视频课件观看次数。因此w越大，即学习者当前课件观看次数越多，p_i(t)值越大，表示学习者在第t天观看视频课件的可能性就越大，反之越小；

(2)表示学习者起始学习日期与学期开始日期的接近程度。根据步骤3可知，学习者起始学习日期与视频课件观看次数之间具有较强的负相关，且起始学习日期是视频观看次数的单向Granger原因，即起始学习日期越早的学习者视频观看次数越大。该项中，D是课程学期总天数，s_i是学习者i开始学习日期距学期开始的天数。所以s_i越小，即学习者起始学习的日期越早，p_i(t)越大，表示该学习者相对其他到课较晚的学习者观看视频课件的可能性就越大，反之越小；

(3)表示当前日期与考试日期的接近程度，其中，c为常数，E是课程考试日期距学期开始的天数。当t≤E时，c＝1，当t＞E时，c＝-1。根据步骤3可知，随着考试日期的邻近，学习者的视频观看次数逐渐增加，在考试日期附近达到峰值，在考试结束之后逐渐减少，且考试日期是视频观看次数的单向Granger原因。该项中，E为固定值，当t≤E时，c＝1，该项为从而t越大，即越接近考试日期，p_i(t)越大，表示学习者观看视频课件的概率越大；当t＞E时，c＝-1，该项为从而t越大，即越远离考试日期，p_i(t)越小，表示学习者观看视频课件的概率越小。

6、基于步骤5中单个学习者在具体某天观看视频课件的概率模型，本发明设计学习过程生成算法模拟所有学习者在课程周期内观看视频课件的学习过程，如图7所示，包括以下步骤：

Step 1：初始化开始日期，即t＝t₀，初始化已到课学习者列表，即L＝L₀；

Step 2：判断当前已到课学习者列表L中的学习者数量是否等于学习者总数N，如果是，则进入Step 3；否则，向L中加入u名学习者，并将每个学习者的当前课件观看次数设置为初始值，即w_i＝Δw，起始学习时间设置为当前日期，即s_i＝t；

Step 3：对已到课的学习者列表L中的每个学习者i，按照公式(2)计算其在时间t观看视频课件的概率p_i(t)，并按如下公式更新w_i，t：

Step 4：当t等于D时，算法结束，否则t＝t+1，转到Step 2。

根据上述概率模型和学习过程生成算法，在给定学习者总数(N)，每日新增学习者数量(u)，课程周期(D)，视频课件数量(C)，考试日期(E)以及学习者每次学习时观看视频课件的次数(Δw)的情况下，便可以模拟整个课程周期内的学习者观看视频的学习过程和全体学习者的视频观看次数分布。

根据步骤6中的概率模型和学习过程生成算法，在教学计划设计阶段和教学计划实施阶段，模拟学习过程从而可以完成特定的教学需求，以下将分别对这两个阶段学习者的视频观看行为预测方法进行说明。

1)教学计划设计阶段

在e-Learning环境中，对教学任务及流程进行详细计划，有助于教学工作的顺利进行。为了合理安排教学计划，相关人员可以在教学计划设计过程中，使用模型预测指定参数下学习者可能的视频课件学习表现，结合模型预测结果来合理设置课程参数，以期获得较好的学习者学习表现。

2)教学计划实施阶段

在教学过程中，教育者可能需要根据学习者的学习表现对教学计划进行动态调整，及时作出补救措施。如果将课程进行到某阶段时对应的各项参数作为输入，学习行为概率模型就能模拟出学习者在课程剩余时间的视频观看行为，为教育者制定课程调整策略提供参考依据。同时教育者可根据学习行为概率模型的模拟结果，对预测视频观看次数可能达不到课程考核要求的学习者发出提醒，督促其加大学习力度。

Claims

1.大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤1中，所述的幂律分布生成机制为增长与优先连接机制，用于描述无标度网络的幂律度分布，其包括如下两个机制：

增长机制，用于描述网络通过增加节点而不断扩张；

3.根据权利要求1所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤1中，所述的网络教育机构的教学要求为网络教育机构根据教学计划和培养计划提出的针对学习者学习行为的各种约束条件。

4.根据权利要求1所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤2具体包括如下步骤，

步骤2-2，判断是否大于相关系数阈值r：

b、如果小于相关系数阈值r，执行步骤2-3；

a、如果F_ori不为空，则执行步骤2-1)；

5.根据权利要求1所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤3中，基于Granger因果检验算法，检验步骤2中得出的候选影响因素集合中的每个候选影响因素f_con∈F_con与网络学习行为B之间的因果关系，将与网络学习行为B之间具有因果关系的因素加入最终影响因素集合F，M是候选影响因素的数量。

6.根据权利要求5所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤3具体包括如下步骤，

b、如果候选影响因素不是B的Granger原因，则执行步骤3-2)；

a、如果F_con不为空，则执行步骤3-1)；

7.根据权利要求1所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤4中，所述的BA模型的特性包括，网络中的节点数目是不断增加的；且新节点优先选择与网络中连接度较大的节点进行连接。

8.根据权利要求1所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤4中，所述的网络学习行为幂律分布的概率模型假设包含以下三个：

9.根据权利要求8所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤5中得到的概率模型如下，

10.根据权利要求9所述的大规模网络教育中网络学习行为幂律分布概率建模方法，其特征在于，步骤6中，所述的设计学习过程生成算法包括以下步骤：

步骤6-2，判断L中的学习者数量与学习者总数是否相等：

a、如果相等，则执行步骤6-3；

F＝{F₁(t)，F₂(t)，…，F_K(t)}

其中，F_k(t)为最终影响因素F_k在第t天的取值；

步骤6-3)基于步骤5所述概率模型，计算L中的每个学习者在当前日期进行学习活动的概率p，并以概率p使学习者的累计学习活动量增加Δα，以概率1-p使学习者的累积活动量保持不变；