CN107644272A - 基于行为模式的学生异常学习表现预测方法 - Google Patents
基于行为模式的学生异常学习表现预测方法 Download PDFInfo
- Publication number
- CN107644272A CN107644272A CN201710883211.8A CN201710883211A CN107644272A CN 107644272 A CN107644272 A CN 107644272A CN 201710883211 A CN201710883211 A CN 201710883211A CN 107644272 A CN107644272 A CN 107644272A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- behavior
- student
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 125
- 230000007786 learning performance Effects 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000002159 abnormal effect Effects 0.000 claims abstract description 35
- 230000000694 effects Effects 0.000 claims description 35
- 238000009826 distribution Methods 0.000 claims description 23
- 230000007704 transition Effects 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 230000008439 repair process Effects 0.000 claims description 2
- 230000003542 behavioural effect Effects 0.000 abstract 2
- 238000000605 extraction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 235000021152 breakfast Nutrition 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000020595 eating behavior Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于行为模式的学生异常学习表现预测方法,包括:基于原始的校园记录获取行为序列,并构建隐马尔可夫模型;从隐马尔可夫模型中提取行为统计特征及行为关联特征;基于提取的行为统计特征及行为关联特征,应用正则化的多任务模型对异常学习表现进行预测。该方案基于丰富的校园数据,获取学生的行为序列,构建行为模型,并从统计特征与关联特征两个角度对学生的个体行为模式进行更加直观与有效的刻画。同时,多任务学习模型的采用可以更细粒度的对学生在不同课程上的异常学习表现进行预测,为学生提供监督和指导,优化教学效果。
Description
技术领域
本发明涉及用户行为建模与教育数据挖掘技术领域,尤其涉及一种基于行为模式的学生异常学习表现预测方法。
背景技术
随着教育的信息化,数字校园应运而生。对于学生而言,校园作为主要的生活范围,扮演着一个微型社会的角色,不仅包含学习环境,也提供了基础生活设施如餐厅、宿舍、超市、健身房、校医院等。校园中记录着丰富的多源数据,主要包括:1.基本信息系统,记录学生的基本信息;2.选课系统与成绩查询系统,记录学生的选课与成绩信息;3.消费系统,记录学生日常活动以及与相关消费信息;4.门禁与身份认证系统,提供学生身份认证与位置信息的记录。目前对学生的行为数据进行挖掘的工作较少,数据采集方式有限,应用成本较高。
学习表现是衡量一个学校教学水平最关键的指标,有效与及时的预测学习表现既有利于提高学校监督工作的效率,也有利于学生养成良好的学习习惯。随着教育数据挖掘(EDM)的发展,已有越来越多的工作将数据挖掘方法应用于预测学习表现。近年来对学生学习表现预测的相关工作主要存在两方面的问题:1.采用的预测因子主要包括CGPA、中期评测、人口信息、高校背景信息等,较少有工作根据学生的校园行为对学习表现进行建模与分析。然而在看似无差异的教学环境下,学生的学习表现不仅与教学环境、教学方法以及学生固有的能力有关,与其行为模式存在着很大程度的相关性。2.目前工作通常以学生的综合绩点作为预测目标,采用回归或者分类的方法预测学生的学习表现。但其忽略了课程之间的差异性,预测粒度较为粗糙,指导意义不强。
发明内容
针对现有的学习表现预测方法存在着预测因子不全面、预测粒度较为粗糙等不足之处,本发明的目的是提供一种基于行为模式的学生异常学习表现预测方法,从丰富的校园记录中挖掘与刻画学生的校园行为模式,并对学生在不同课程上的异常学习表现进行有效的预测。
本发明的目的是通过以下技术方案实现的:
一种基于行为模式的学生异常学习表现预测方法,包括:
基于原始的校园记录获取行为序列,并构建隐马尔可夫模型;
从隐马尔可夫模型中提取行为统计特征及行为关联特征;
基于提取的行为统计特征及行为关联特征,应用正则化的多任务模型对异常学习表现进行预测。
由上述本发明提供的技术方案可以看出,基于丰富的校园数据,获取学生的行为序列,构建行为模型,并从统计特征与关联特征两个角度对学生的个体行为模式进行更加直观与有效的刻画。同时,多任务学习模型的采用可以更细粒度的对学生在不同课程上的异常学习表现进行预测,为学生提供监督和指导,优化教学效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于行为模式的学生异常学习表现预测方法的流程图;
图2为本发明实施例提供的一种基于行为模式的学生异常学习表现预测方法的框架图;
图3为本发明实施例提供的隐马尔可夫模型示意图
图4为本发明实施例提供的多任务模型示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种基于行为模式的学生异常学习表现预测方法,如图1所示,主要包括如下步骤:
步骤11、基于原始的校园记录获取行为序列,并构建隐马尔可夫模型。
步骤12、从隐马尔可夫模型中提取行为统计特征及行为关联特征。
步骤13、基于提取的行为统计特征及行为关联特征,应用正则化的多任务模型对异常学习表现进行预测。
本发明实施例提供的一种基于行为模式的学生异常学习表现预测方法的框架图如图2所示,各个步骤的具体实现过程如下:
一、基于原始的校园记录构建学生行为模式。
目前,校园一卡通作为学生校园生活的主要媒介,能够自动捕获的学生日常消费与身份认证等行为数据。如表1所示,为原始的校园记录(USERID,DEALTIME,TRANSMONEY,ORGINID,DEALCODE)包含用户的学生学号、行为时间戳、行为位置、交易金额、交易类型等信息。
表1原始的校园记录
通过对原始的校园记录做进一步处理与挖掘,获取每一个用户的行为序列,并对其行为模式进行建模。具体如下:
1、获取行为序列。
首先,定义用户的一条记录为一个事件单元。考虑地点的多样化,如一个学校可能会有多个校区,一个校区内可能分布着多个食堂,采用位置类别来代替具体的物理地点,位置类别可以根据先验判断进行标注,如将不同食堂以及其下各窗口所对应记录的位置类别设置为均设置为食堂。在任意特定的应用场景下,均存在着确定的位置类别集合P、消费类型(交易类型)集合C以及学生群体U。
1)将用户的每一条记录作为一个事件,用户u的一个事件定义为e=(t,p,c,m),e∈Eu;其中,t、p、c、m分别为事件时间戳、位置所属类别、交易类型、交易金额,Eu为事件集合。如表1中,根据位置类别与交易类型,前五条记录依次是充值事件、在商店的交易事件、在食堂的交易事件、在食堂的交易事件、在超市的交易事件。
2)对于位置类别相同、交易类型相同且在一定时间段内的一组连续事件,可以将其合并为一个活动,如在某一个食堂的多个窗口中的一系列连续消费事件可以合并为一次具体的吃饭活动。
本发明实施例中,对于用户u在一定时间段δ(例如,一个小时)内具有相同位置类别、相同交易类型的一组连续的事件序列(e1,e2,...,eG),合并为一个活动v=(tstart,tend,p,c,m),v∈Vu;其中,G为事件序列的总数,Vu为活动集合,tstart、tend分别为起始时间戳(即事件e1的时间戳)、结束时间戳(即事件eG的时间戳),且tend-tstart≤δ。如在表1中的第三、四条记录所对应的两个发生于食堂连续的消费事件可以合并为一次具体的吃饭活动v0=(2015-03-02 11:56:03,2015-03-02 11:56:23,canteen,consumption,4.5)。
则根据时间顺序,用户u在指定周期T内的活动序列为Seq(u,t0)=(v1,v2,...,vS),其中t0为第一个活动v1的起始时间戳,S为事件序列的总数活动序列中活动的总数。
3)一组多样的活动往往暗示着同样的行为,如吃饭行为会因在时间或地点上的不同分布而对应着多样的活动表现。对于特定应用场景,存在映射f,根据活动时间、位置类别以及交易类型,为活动定义一个唯一确定的行为标签。
对于用户u的第c个活动vc,其对应的行为为hc=f(vc),hc∈H,其中函数f为实际应用场景下预定义的确定映射,如于早上5点至11点位置类别为食堂且交易类型为消费的活动对应一次吃早饭行为(f(v)=Breakfast)、位置类别为校医院的活动对应就诊行为(f(v)=Treatment);H为有效行为集,有效行为集H为学生参与度较高(平均频率达到某一阈值)的一个确定行为集合。表2是在示例场景下的选取的有效行为集。如表1中由第三、四条事件合并而来的活动v0,根据行为映射函数得f(v0)=Lunch,即对应着吃午饭行为。
表2有效行为集
因此,活动序列Seq(u,t0)=(v1,v2,...,vS)对应的行为序列为Seq′(u,t0)=(h1,h2,...,hS)。
如表1中用户U1前五条记录对应的行为序列为:(Recharge,Shopping,Lunch,Shopping)。
2、构建隐马尔可夫模型。
受移动规律与移动速度的限制,马尔可夫模型是目前应用于行为建模最广泛的模型之一,本发明将采用隐马尔可夫模型(HMM)对学生行为进行建模,其中,利用隐状态刻画用户多样活动背后隐含的行为规律。
首先构造离散化的活动空间V′:将活动的时间以小时为单位进行划分(共划分为24小时),忽略交易金额。假设当前场景下位置类别有11种,交易类型15种,则活动空间V′={v′1,v′2,...v′M}中活动总数M=24×11×15=3960,隐状态空间同行为集H={h1,h2,...hN},假设N为12。
利用活动序列构造观测序列O=(v′1,v2′,...,v′S),vc'∈V′,提取活动序列对应的行为序列作为隐状态序列I=(h1,h2,...hS),h∈H,如图3所示。基于L个观测序列和对应的隐状态序列{(O1,I1),(O2,I2),...,(OL,IL)},构建隐马尔可夫模型λ=(π,A,B),通过极大似然估计法估计模型的参数;其中,π、A、B分别为初始概率分布、状态转移概率分布、观测概率分布;具体如下:
初始概率分布π(π1,π2,...,πN):πj为N个序列中初始状态为hj的频率;
状态转移概率分布A=[aij]N×N,其中aij为在某时刻t处于隐状态(行为)hi条件下在t+1时刻转移到状态(行为)hj的概率,其估计值为:
上式中,Aij为相应的频数;
观测概率分布B=[bj(k)]N×M,其中bj(k)为在某时刻t处于隐状态(行为)hj下生成观测(活动)vk的概率,其估计值为:
上式中,Bjk为相应的频数;
如在当前场景下,初始概率分布π为12×1维度的向量,状态转移概率分布A为12×12维度的矩阵,观测转移概率分布B为的12×3690维度的矩阵。
二、从隐马尔可夫模型中提取行为统计特征及行为关联特征。
1、提取行为统计特征。
对于每一个行为hc,包含其两类可度量属性:指定周期T内行为hc的累积频率hfre,以及指定周期T内行为hc的累积交易金额hamo,对于非交易类行为(如Exercise、Libraryentrance、Card service、School bus)忽略本属性;
对每个具体行为在上述的任一个属性,从行为水平、行为变化以及行为规律三个方面提取特征,假设行为hc的频率属性hfre在第p个单位周期内的均值为连续P个周期内的均值序列为对均值序列随周期t的波动情况做线性拟合其中,b为截距,则:
行为水平:以均值衡量某一特定行为的平均水平;
行为变化:对均值序列在连续多个周期上的线性拟合,以斜率a衡量某一特定行为的变化趋势;
行为规律:对均值序列在连续多个周期上的线性拟合,以残差平方和衡量某一特定行为的规律性。
假设提取统计特征共d1维。
2、提取行为关联特征。
行为之间的转移隐含着用户内在的行为习惯,行为在不同活动上的分布也暗示着用户确定或不确定的生活状态,本发明实施例中,采用熵来衡量行为与行为之间,以及行为与活动之间分布的不确定性:
行为转移熵:隐马尔可夫模型中状态转移概率分布A的每一行能够获得一个特定行为的转移熵:
行为观测熵:隐马尔可夫模型中观测概率分布B的每一行能够求得一个特定行为的观测熵:
由上述过程提取d1维统计特征与d2维关联特征,则总维度d=d1+d2。
三、应用正则化的多任务模型对异常学习表现进行预测
1)异常学习表现标签与模型定义
考虑到选课群体的不同,本发明实施例以课程为单位进行任务的划分。假设课程的数量为m,课程l有Ul个学生选修,则定义特征矩阵d是行为统计特征及行为关联特征的总维度,每一行Xl,u是选择课程l的学生u的行为特征向量;定义标签向量为如果学生u在课程l上出现异常学习表现,则表现标签Yl,u=1;
如图4所示,对课程l新样本x输入模型,其异常学习表现标签为y=sign(Wl Tx),W∈Rd×m,每一列Wl是课程l对应的系数向量;
2)少类样本过采样处理
现实情况下,异常学习表现群体其比例较低,数据是有偏的,本发明实施例中,对每一个课程独立地应用SMOTE算法,平衡两类样本(异常类与正常类),及对每一个异常类样本,以一定的采样率从最近邻样本中随机选择一个样本做线性差值,将构造的新样本加入数据集中;主要过程如下:
对任务l的数据集,其大小为Ul,设少数类(异常类)的样本集为Sl,其大小为SUl,自动设置上采样率Ratel=Ul/SUl-1;
每一个少类样本x∈Sl,搜索K个其少数类最近邻样本,记为neighbors={x′1,x′2,...,x′K},以Ratel为倍率,每次从neighbors中选择一个样本x′b做线性差值构造新样本newxr,并将新样本加入数据集中:
newxr=x+rand(0,1)*(x′b-x),r=1,2,...,Ratel,rand(0,1)表示区间(0,1)内的一个随机数。
例如,若某课程样本数为109,其中异常类别为10,正常类别为99,则经过SMOTE(自动采样率,Nl=8,K=5)后,其样本数量为189(90+99)。
3)采用Z-score标准化方法对数据归一化
为消除不同维度之间量纲的影响,需要对数据进行归一化处理,使处理后的每一维特征数据(即之前从隐马尔可夫模型中提取出的特征数据)符合标准正态分布;即均值为0,标准差为1,转化函数为:其中,μ为样本均值,σ为样本标准差。
4)求解最优超参数。
以归一化处理后的数据作为输入,训练正则化的多任务模型,采用交叉验证方法选择最优超参数;
为求解模型即系数矩阵W,最小化准则函数:
其中,第一项为逻辑斯蒂损失,后两项为正则化项,包括:用于选择共享特征空间的l2,1-范数||W||2,1,用于增强模型的鲁棒性的Frobenius-范数ρ1、ρL2分别控制模型的稀疏度与复杂度;
将上式划分为如下两部分:
g(x)可导,且其在每项Wl,q,q=1,2,...,d的梯度为:
其中,Xl,u,q表示选择课程l的学生u第q维特征向量,Wl,q表示课程l在第q维特征值上的系数;
上式满足Lipschitz连续条件,采用近端梯度下降求解最小准则函数下的解W;同时,采用基于交叉验证的网格搜索方法选择最优超参数ρ1与ρL2。
例如采用5-fold交叉验证,对于每一组超参数的可能取值,将样本随机划分为5等分,每次选择一份作为测试集,由剩余样本作为训练集训练模型,选择5组测试的平均结果最优者作为超参数。为保证预测学生异常学习表现的应用性,建议采用召回率(及查全率)作为评价指标。可用MALSAR工具对多任务模型进行求解。
本发明实施例上述方案,基于丰富的校园数据,获取学生的行为序列,构建行为模型,并从统计特征与关联特征两个角度对学生的个体行为模式进行更加直观与有效的刻画。同时,多任务学习模型的采用可以更细粒度的对学生在不同课程上的异常学习表现进行预测,为学生提供监督和指导,优化教学效果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (6)
1.一种基于行为模式的学生异常学习表现预测方法,其特征在于,包括:
基于原始的校园记录获取行为序列,并构建隐马尔可夫模型;
从隐马尔可夫模型中提取行为统计特征及行为关联特征;
基于提取的行为统计特征及行为关联特征,应用正则化的多任务模型对异常学习表现进行预测。
2.根据权利要求1所述的一种基于行为模式的学生异常学习表现预测方法,其特征在于,所述基于原始的校园记录获取行为序列包括:
将用户的每一条记录作为一个事件,用户u的一个事件定义为e=(t,p,c,m),e∈Eu;其中,t、p、c、m分别为事件时间戳、位置所属类别、交易类型、交易金额,Eu为事件集合;
对于用户u在一定时间段δ内具有相同位置类别、相同交易类型的一组连续的事件序列(e1,e2,...,eG),合并为一个活动v=(tstart,tend,p,c,m),v∈Vu;其中,G为事件序列的总数,Vu为活动集合,tstart、tend分别为起始时间戳、结束时间戳,且tend-tstart≤δ;
则根据时间顺序,用户u在指定周期T内的活动序列为Seq(u,t0)=(v1,v2,...,vS),其中t0为第一个活动v1的起始时间戳,S为事件序列的总数活动序列中活动的总数;
对于用户第c个活动vc,其对应的行为为hc=f(vc),hc∈H,其中函数f为实际应用场景下预定义的确定映射,H为有效行为集;则活动序列Seq(u,t0)=(v1,v2,...,vS)对应的行为序列为Seq′(u,t0)=(h1,h2,...,hS)。
3.根据权利要求2所述的一种基于行为模式的学生异常学习表现预测方法,其特征在于,所述构建隐马尔可夫模型包括:
首先构造离散化的活动空间V′={v′1,v′2,...v′M}:将活动的时间以小时为单位进行划分,忽略交易金额,其中,M为V′中活动的总数;利用活动序列构造观测序列O=(v′1,v′2,...,v′S),vc'∈V′,提取活动序列对应的行为序列作为隐状态序列I=(h1,h2,...hS),h∈H,基于L个观测序列和对应的隐状态序列{(O1,I1),(O2,I2),...,(OL,IL)},构建隐马尔可夫模型λ=(π,A,B),通过极大似然估计法估计模型的参数;其中,π、A、B分别为初始概率分布、状态转移概率分布、观测概率分布。
4.根据权利要求1或3所述的一种基于行为模式的学生异常学习表现预测方法,其特征在于,所述提取行为统计特征包括:
对于每一个行为hc,包含其两类可度量属性:指定周期T内行为hc的累积频率hfre,以及指定周期T内行为hc的累积交易金额hamo,对于非交易类行为忽略本属性;
对每个具体行为在上述的任一个属性,从行为水平、行为变化以及行为规律三个方面提取特征,假设行为hc的频率属性hfre在第p个单位周期内的均值为连续P个周期内的均值序列为对均值序列随周期t的波动情况做线性拟合其中,b为截距,则:
行为水平:以均值衡量某一特定行为的平均水平;
行为变化:对均值序列在连续多个周期上的线性拟合,以斜率a衡量某一特定行为的变化趋势;
行为规律:对均值序列在连续多个周期上的线性拟合,以残差平方和衡量某一特定行为的规律性。
5.根据权利要求1或3所述的一种基于行为模式的学生异常学习表现预测方法,其特征在于,所述提取行为关联特征包括:
行为之间的转移隐含着用户内在的行为习惯,行为在不同活动上的分布也暗示着用户确定或不确定的生活状态,采用熵来衡量行为与行为之间,以及行为与活动之间分布的不确定性:
行为转移熵:隐马尔可夫模型中状态转移概率分布A的每一行能够获得一个特定行为的转移熵:
<mrow>
<mi>E</mi>
<mi>n</mi>
<mi>t</mi>
<mi>r</mi>
<mi>o</mi>
<mi>p</mi>
<mi>y</mi>
<mo>_</mo>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>h</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>h</mi>
<mi>j</mi>
</msub>
<mo>&Element;</mo>
<mi>H</mi>
</mrow>
</munder>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>h</mi>
<mi>j</mi>
</msub>
<mo>|</mo>
<msub>
<mi>h</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>log</mi>
<mi> </mi>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>h</mi>
<mi>j</mi>
</msub>
<mo>|</mo>
<msub>
<mi>h</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mover>
<mi>a</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<msub>
<mover>
<mi>a</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>;</mo>
</mrow>
行为观测熵:隐马尔可夫模型中观测概率分布B的每一行能够求得一个特定行为的观测熵:
<mrow>
<mi>E</mi>
<mi>n</mi>
<mi>t</mi>
<mi>r</mi>
<mi>o</mi>
<mi>p</mi>
<mi>y</mi>
<mo>_</mo>
<mi>O</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>h</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mo>&Element;</mo>
<msup>
<mi>V</mi>
<mo>&prime;</mo>
</msup>
</mrow>
</munder>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mi>h</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>log</mi>
<mi> </mi>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mi>h</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>M</mi>
</munderover>
<msub>
<mover>
<mi>b</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>j</mi>
<mi>k</mi>
</mrow>
</msub>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<msub>
<mover>
<mi>b</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>j</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>.</mo>
</mrow>
6.根据权利要求1或3所述的一种基于行为模式的学生异常学习表现预测方法,其特征在于,所述基于提取的行为统计特征及行为关联特征,应用正则化的多任务模型对异常学习表现进行预测包括:
假设课程的数量为m,课程l有Ul个学生选修,则定义特征矩阵d是行为统计特征及行为关联特征的总维度,每一行Xl,u是选择课程l的学生u的行为特征向量;定义标签向量为如果学生u在课程l上出现异常学习表现,则表现标签Yl,u=1;
对课程l新样本x输入模型,其异常学习表现标签为y=sign(Wl Tx),W∈Rd×m,每一列Wl是课程l对应的系数向量;
对每一个课程独立地应用SMOTE算法,平衡异常类与正常类样本,及对每一个异常类样本,以一定的采样率从最近邻样本中随机选择一个样本做线性差值,将构造的新样本加入数据集中;
再对数据进行归一化处理,使处理后的每一维特征数据符合标准正态分布;
以归一化处理后的数据作为输入,训练正则化的多任务模型,采用交叉验证方法选择最优超参数;
为求解模型即系数矩阵W,最小化准则函数:
<mrow>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>W</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>U</mi>
<mi>l</mi>
</msub>
</munderover>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>+</mo>
<mi>exp</mi>
<mo>(</mo>
<mrow>
<mo>-</mo>
<msub>
<mi>Y</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>W</mi>
<mi>l</mi>
<mi>T</mi>
</msubsup>
<msub>
<mi>X</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&rho;</mi>
<mn>1</mn>
</msub>
<mo>|</mo>
<mo>|</mo>
<mi>W</mi>
<mo>|</mo>
<msub>
<mo>|</mo>
<mrow>
<mn>2</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>&rho;</mi>
<mrow>
<mi>L</mi>
<mn>2</mn>
</mrow>
</msub>
<mo>|</mo>
<mo>|</mo>
<mi>W</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mi>F</mi>
<mn>2</mn>
</msubsup>
<mo>;</mo>
</mrow>
其中,第一项为逻辑斯蒂损失,后两项为正则化项,包括:用于选择共享特征空间的l2,1-范数||W||2,1,用于增强模型的鲁棒性的Frobenius-范数ρ1、ρL2分别控制模型的稀疏度与复杂度;
将上式划分为如下两部分:
<mrow>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>W</mi>
</munder>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&rho;</mi>
<mn>1</mn>
</msub>
<mo>|</mo>
<mo>|</mo>
<mi>W</mi>
<mo>|</mo>
<msub>
<mo>|</mo>
<mrow>
<mn>2</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>;</mo>
</mrow>
<mrow>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>U</mi>
<mi>l</mi>
</msub>
</munderover>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>+</mo>
<mi>exp</mi>
<mo>(</mo>
<mrow>
<mo>-</mo>
<msub>
<mi>Y</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>W</mi>
<mi>l</mi>
<mi>T</mi>
</msubsup>
<msub>
<mi>X</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&rho;</mi>
<mrow>
<mi>L</mi>
<mn>2</mn>
</mrow>
</msub>
<mi>T</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<mi>W</mi>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
g(x)可导,且其在每项Wl,q,q=1,2,...,d的梯度为
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<mo>&dtri;</mo>
<mi>g</mi>
<msub>
<mrow>
<mo>(</mo>
<mi>W</mi>
<mo>)</mo>
</mrow>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>q</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mo>&part;</mo>
<msub>
<mi>W</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>q</mi>
</mrow>
</msub>
</mrow>
</mfrac>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>u</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>U</mi>
<mi>l</mi>
</msub>
</munderover>
<mrow>
<mo>(</mo>
<mo>-</mo>
<msub>
<mi>Y</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
<msub>
<mi>X</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
<mo>,</mo>
<mi>q</mi>
</mrow>
</msub>
<mo>+</mo>
<mfrac>
<mrow>
<msub>
<mi>Y</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
<msub>
<mi>X</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
<mo>,</mo>
<mi>q</mi>
</mrow>
</msub>
</mrow>
<mrow>
<mn>1</mn>
<mo>+</mo>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<mo>-</mo>
<msub>
<mi>Y</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
<mo>(</mo>
<msubsup>
<mi>W</mi>
<mi>l</mi>
<mi>T</mi>
</msubsup>
<msub>
<mi>X</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>u</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mn>2</mn>
<msub>
<mi>&rho;</mi>
<mrow>
<mi>L</mi>
<mn>2</mn>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mrow>
<mi>l</mi>
<mo>,</mo>
<mi>q</mi>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>;</mo>
</mrow>
其中,Xl,u,q表示选择课程l的学生u第q维特征向量,Wl,q表示课程l在第q维特征值上的系数;
上式满足Lipschitz连续条件,采用近端梯度下降求解最小准则函数下的解W;同时,采用基于交叉验证的网格搜索方法选择最优超参数ρ1与ρL2。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710883211.8A CN107644272A (zh) | 2017-09-26 | 2017-09-26 | 基于行为模式的学生异常学习表现预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710883211.8A CN107644272A (zh) | 2017-09-26 | 2017-09-26 | 基于行为模式的学生异常学习表现预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107644272A true CN107644272A (zh) | 2018-01-30 |
Family
ID=61113872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710883211.8A Pending CN107644272A (zh) | 2017-09-26 | 2017-09-26 | 基于行为模式的学生异常学习表现预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107644272A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830409A (zh) * | 2018-05-31 | 2018-11-16 | 中国科学技术大学 | 面向众筹平台的捐赠行为与捐赠者保持预测方法 |
CN110111139A (zh) * | 2019-04-23 | 2019-08-09 | 上海淇玥信息技术有限公司 | 行为预估模型生成方法、装置、电子设备及可读介质 |
CN111797655A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 用户活动识别方法、装置、存储介质及电子设备 |
CN113128611A (zh) * | 2021-04-27 | 2021-07-16 | 陕西师范大学 | 基于深度学习学生在线学习效率预测的模型检测方法 |
CN113516286A (zh) * | 2021-05-14 | 2021-10-19 | 山东建筑大学 | 基于多粒度任务联合建模的学生学业预警方法及系统 |
CN114218998A (zh) * | 2021-11-02 | 2022-03-22 | 国家电网有限公司信息通信分公司 | 一种基于隐马尔可夫模型的电力系统异常行为分析方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156171A1 (en) * | 2011-12-15 | 2013-06-20 | Nuance Communications, Inc. | System and method for servicing a call |
CN107122452A (zh) * | 2017-04-26 | 2017-09-01 | 中国科学技术大学 | 时序化的学生认知诊断方法 |
-
2017
- 2017-09-26 CN CN201710883211.8A patent/CN107644272A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156171A1 (en) * | 2011-12-15 | 2013-06-20 | Nuance Communications, Inc. | System and method for servicing a call |
CN107122452A (zh) * | 2017-04-26 | 2017-09-01 | 中国科学技术大学 | 时序化的学生认知诊断方法 |
Non-Patent Citations (1)
Title |
---|
XI ZHANG 等: "Poor Performance Discovery of College Students Based on Behavior Pattern", 《14TH IEEE CONFERENCES ON UBIQUITOUS INTELLIGENCE & COMPUTING》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830409A (zh) * | 2018-05-31 | 2018-11-16 | 中国科学技术大学 | 面向众筹平台的捐赠行为与捐赠者保持预测方法 |
CN111797655A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 用户活动识别方法、装置、存储介质及电子设备 |
CN110111139A (zh) * | 2019-04-23 | 2019-08-09 | 上海淇玥信息技术有限公司 | 行为预估模型生成方法、装置、电子设备及可读介质 |
CN110111139B (zh) * | 2019-04-23 | 2021-09-24 | 上海淇玥信息技术有限公司 | 行为预估模型生成方法、装置、电子设备及可读介质 |
CN113128611A (zh) * | 2021-04-27 | 2021-07-16 | 陕西师范大学 | 基于深度学习学生在线学习效率预测的模型检测方法 |
CN113128611B (zh) * | 2021-04-27 | 2023-06-06 | 陕西师范大学 | 基于深度学习学生在线学习效率预测的模型检测方法 |
CN113516286A (zh) * | 2021-05-14 | 2021-10-19 | 山东建筑大学 | 基于多粒度任务联合建模的学生学业预警方法及系统 |
CN113516286B (zh) * | 2021-05-14 | 2024-05-10 | 山东建筑大学 | 基于多粒度任务联合建模的学生学业预警方法及系统 |
CN114218998A (zh) * | 2021-11-02 | 2022-03-22 | 国家电网有限公司信息通信分公司 | 一种基于隐马尔可夫模型的电力系统异常行为分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107644272A (zh) | 基于行为模式的学生异常学习表现预测方法 | |
Yao et al. | Predicting academic performance for college students: a campus behavior perspective | |
Frühwirth‐Schnatter et al. | Labor market entry and earnings dynamics: Bayesian inference using mixtures‐of‐experts Markov chain clustering | |
Bicego et al. | On the distinctiveness of the electricity load profile | |
CN110503531A (zh) | 时序感知的动态社交场景推荐方法 | |
US20180144352A1 (en) | Predicting student retention using smartcard transactions | |
CN109002492B (zh) | 一种基于LightGBM的绩点预测方法 | |
US20210125073A1 (en) | Method and system for individual demand forecasting | |
CN110310163A (zh) | 一种精准制定营销策略的方法、设备及可读介质 | |
Liu et al. | A comparison of the approaches for gentrification identification | |
Xue et al. | A decision model for spatial site selection by criminals: a foundation for law enforcement decision support | |
Arif et al. | An Improved Prediction System of Students' Performance Using Classification model and Feature Selection Algorithm | |
Ragapriya et al. | Machine Learning Based House Price Prediction Using Modified Extreme Boosting | |
Abrishami et al. | Using real-world store data for foot traffic forecasting | |
Onderwater | Detecting unusual user profiles with outlier detection techniques | |
Wang et al. | Computer supported data-driven decisions for service personalization: a variable-scale clustering method | |
CN111177657B (zh) | 需求确定方法、系统、电子设备及存储介质 | |
Yin et al. | Forecast customer flow using long short-term memory networks | |
Bharathy et al. | Applications of social systems modeling to political risk management | |
Bao et al. | Dynamic financial distress prediction based on Kalman filtering | |
JP2021068163A (ja) | 予測プログラム、予測方法及び予測装置 | |
Siswanto et al. | Salary Classification & Prediction based on Job Field and Location using Ensemble Methods | |
Adusumilli | Unobserved Heterogeneity, Grouped Random Effects and the EAMP Algorithm | |
Panda et al. | Machine learning using exploratory analysis to predict taxi fare | |
Follesø et al. | Predicting patent litigation: a comprehensive comparison of machine learning algorithm performance in predicting patent litigation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180130 |
|
RJ01 | Rejection of invention patent application after publication |