CN108022057A - 学习行为分析方法及系统 - Google Patents
学习行为分析方法及系统 Download PDFInfo
- Publication number
- CN108022057A CN108022057A CN201711485520.6A CN201711485520A CN108022057A CN 108022057 A CN108022057 A CN 108022057A CN 201711485520 A CN201711485520 A CN 201711485520A CN 108022057 A CN108022057 A CN 108022057A
- Authority
- CN
- China
- Prior art keywords
- support
- item
- learning behavior
- behavior data
- frequent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Technology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种学习行为分析方法及系统,该方法包括:采集学习行为数据;根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。利用本发明,提高了学生的学习行为差异分析的准确性,提高了教学效率。
Description
技术领域
本发明涉及数据分析领域,具体涉及一种学习行为分析方法及系统。
背景技术
教育是关乎国计民生的社会重要领域,大数据作为社会变革的一股洪流,正在成为推进教育创新发展的科学技术与教育系统变革的颠覆力量。
近年来,大数据引起了学术界教育研究者、产业界平台与应用实践者以及行业界管理与决策者的广泛关注。随着全球教育信息化的快速发展,教育数据正在以几何级的规模递增。除了传统学校教育产生的数据外,互联网教育市场每天也在产生海量的教育数据。
大数据技术允许中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。许多这样的数据已经被诸如美国国家教育统计中心之类的政府机构储存起来用于统计和分析。而近年来越来越多的网络在线教育和大规模开放式网络课程横空出世,也使教育领域中的大数据获得了更为广阔的应用空间。专家指出,大数据将掀起新的教育革命,比如革新学生的学习、教师的教学、教育政策制定的方式与方法。
教育领域中的大数据分析最终目的是为了改善学生的学习成绩。成绩优异的学生对学校、对社会、以及对国家来说都是好事。不同的学习行为和习惯会导致不同的考试成绩,学生的学习行为数据中有一系列重要的信息往往被我们常规的研究所忽视。而通过分析大数据,我们就能发现这些重要信息,并利用它们为改善学生的成绩提供个性化的服务。
目前,研究成绩好/差学生的学习行为差异时,多采用问卷调查或经验式判断,通过在课堂上观察不同学生的上课学习行为来分析和判定行为差异。没有结合学生在线学习过程中的不同行为或离开课堂之后学习行为进行记录,这样无法保证学习行为差异分析的全面性和准确性。
发明内容
本发明的目的是提供一种学习行为分析方法及系统,以期提高学生的学习行为差异分析的准确性,提高教学效率。
本发明提供了一种学习行为分析方法,其中,包括:
采集学习行为数据;
根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。
优选地,所述学习行为数据包括课后学习行为数据和课中学习行为数据。
优选地,所述采集学习行为数据之后,所述方法还包括:
对所述学习行为数据进行预处理。
优选地,所述根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则包括:
将一定时间内发生的学习行为数据作为一个子项集,将多个子项集集合,形成事务集;
根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合;
根据所述频繁项集集合,得到学生的学习行为规则。
优选地,所述根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合包括:
将各个所述学习行为数据作为各项,形成第一项集;
确定所述第一项集中各项的第一支持度;
基于所述第一支持度和预先确定的权重值确定所述第一项集中的各项的最小项支持度;
将所述第一项集作为候选1项集;
根据所述各项的最小项支持度,基于设定的条件确定第二支持度;
根据所述第一支持度和所述第二支持度的比较结果,对所述候选1项集进行剪枝,生成频繁1项集;
遍历所述事务集,生成候选2项集;
确定所述候选2项集中各项集的第三支持度;
根据所述第三支持度和所述第二支持度的比较结果,对所述候选2项集进行剪枝,生成频繁2项集;
遍历所述事务集,生成候选3项集至候选k项集,基于与生成频繁2项集相同的过程,直至生成的频繁k项集为空;
将所述频繁1项集至所述频繁k-1项集作为所述频繁项集集合。
优选地,所述权重值通过如下方式确定:
确定学习行为数据中能使成绩上升的学习行为数据与成绩上升之间为正相关关系;
确定学习行为数据中能使成绩下降的学习行为数据与成绩下降之间为负相关关系;
根据所述正相关关系和所述负相关关系确定各个学习行为数据对成绩影响的权重值。
优选地,所述根据所述各项的最小项支持度,基于设定的条件确定第二支持度包括:
随机确定初始最小支持度;
如果所述初始最小支持度小于候选x项集中各项的最小项支持度中的最小值,则将所述最小值作为所述第二支持度;其中,1≤x≤k;
如果所述初始最小支持度大于等于所述最小值且小于等于候选x项集中各项的最小项支持度中的最大值,则将所述初始最小支持度作为所述第二支持度;
如果所述初始最小支持度大于所述最大值,则将所述最大值作为所述第二支持度;
如果所述最大值等于所述最小值,则将所述最大值和所述初始最小支持度中的较小值作为所述第二支持度。
优选地,所述方法还包括:
在生成频繁项集集合时,对所述候选1项集至候选k项集进行排序。
本发明还提供了一种学习行为分析系统,其中,包括:
采集模块,用于采集学习行为数据;
分析模块,用于根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。
优选地,所述系统还包括:
预处理模块,用于对所述学习行为数据进行预处理。
优选地,所述分析模块包括:
事务集生成单元,用于将一段时间内发生的学习行为数据作为一个子项集,将多个子项集集合,形成事务集;
频繁项集集合生成单元,用于根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合;
分析单元,用于根据所述频繁项集集合,得到学生的学习行为规则。
本发明提供的学习行为分析方法及系统通过采集学生课中学习行为数据和课后学习行为数据,并基于预设的多最小支持度关联规则算法对上述数据进行分析,与现有技术相比,提高了学生的学习行为差异分析的准确性,提高了教学效率。
附图说明
图1为本发明实施例提供的学习行为分析方法的流程图;
图2为本发明实施例中对学习行为数据进行分析的流程图;
图3为本发明实施例中生成频繁项集集合的流程图;
图4为本发明实施例提供的学习行为分析系统的结构图;
图5为本发明实施例中分析模块的结构图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
如图1所示,为本发明实施例提供的学习行为分析方法的流程图,包括以下步骤:
步骤101,采集学习行为数据。
所述学习行为数据可以包括课后学习行为数据和课中学习行为数据,从多种在线学习平台以及学生在课堂上的学习行为数据,收集海量的、实时的教育数据。
所述课后学习行为数据可以包括以下一种或几种:做作业、提交作业、与同学互批作业、收藏错题、向老师发送私信、接收私信、观看微课、评论微课、点赞微课、收藏微课、访问他人空间、班级圈发布帖子、回复帖子、回复班级通知。
所述课中学习行为数据可以包括学生在课堂上接收教师教学时,抢答问题、做试题、提交作业、向老师提问等数据。
优选地,所述方法还包括:
对所述学习行为数据进行预处理,得到预处理后的学习行为数据。
具体地,可以将采集到的行为数据按照“主、谓、宾”方式进行清洗,得到用户、时间、动作、操作对象为基础的标准行为数据,例如:“张三,2017-06-26 09:25:06,观看微课,微课”,整理成规范的数据格式方便后面的学习行为分析。
步骤102,根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。
所述学习行为规则指的是学生一系列的学习相关的行为动作中,经常一起发生的动作,通常用“{}”进行表示,例如:{微课点赞,微课学习}=>{微课收藏},即部分学生通常会在观看微课之后对微课进行微课收藏。
将本发明实施例预设的多最小支持度关联规则引入教育教学中,通过数据挖掘算法对学生在线行为的关联性进行分析,得到每个学生的行为规则,使得教学模式更具有针对性。
利用该数据挖掘算法进行分析的具体过程如下:
首先确定研究的会话(session),一个会话是指学生使用在线教育产品的一个访问期限,也就是说需要研究的是每个学生一个会话内所有行为的频繁项集集合。本实施例中采用的是一天(每日00:00:00至23:59:59)作为一个会话,根据实际情况,也可选择其他合适的时间间隔作为一个会话。
然后,采用本发明实施例中的预设的多最小支持度关联规则算法进行数据挖掘和分析,下面具体描述该算法生成过程。
如图2所示,为本发明实施例中对学习行为数据进行分析的流程图,包括以下步骤:
步骤201,将一定时间内发生的学习行为数据作为一个子项集,将多个子项集集合,形成事务集。
比如一定时间可以取一个小时或几个小时等,本案不做限制。以一个学生的以下学习行为为例进行说明:
设A=观看微课次数,B=空间访问次数,C=提交作业次数,D=修订作业次数,E=社区发帖次数
则上述事务集如下表:
表一
TID | Items |
T1 | A,B,C |
T2 | C,B,E |
T3 | B,C |
T4 | A,B,D |
T5 | A,C |
T6 | C,D |
T7 | A,D |
T8 | A,C,E |
T9 | A,C,D |
T10 | B,D |
步骤202,根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合。
频繁项集的生成过程将在下文具体描述。
步骤203,根据所述频繁项集集合,得到学生的学习行为规则。
如图3所示,为本发明实施例中频繁项集的生成流程图,包括以下步骤:
步骤301,将各个所述学习行为数据作为各项,形成第一项集。
本实施例中,第一项集为:{E,C,A,D,B}。
步骤302,确定所述第一项集中各项的第一支持度。
本实施例中,各项的第一支持度为:
sup(A)=0.6,sup(B)=0.5,sup(C)=0.7,sup(D)=0.5,sup(E)=0.2
步骤303,基于所述第一支持度和预先确定的权重值确定所述第一项集中的各项的最小项支持度。
最小项支持度的定义如下:对于数据项集I={i1,i2,i3,...,in},赋予其中任意的元素i所需满足的最小支持度,称为最小项支持度MIS(i)。
具体地,可以根据所述第一项集中的各个学习行为数据的实际发生频率和各个学习行为数据对成绩影响的权重值,确定各最小项支持度。
各项的最小项支持度MIS(i)的示例确定方法如下:
其中H(i)表示各个学习行为数据的实际发生频率;P(i)表示各个学习行为数据对成绩影响的权重值。可以通过两种不同的示例方法来确定各个学习行为数据的权重值,一种属于客观的确定权重的方法:相关性分析法,以及一种主观确定权重值的方法:专家评分法。
本实施例中,优选地,通过以下方式确定权重值:
确定学习行为数据中能使成绩上升的行为数据与成绩上升之间为正相关关系;确定学习行为数据中能使成绩下降的行为数据与成绩下降之间为负相关关系;根据所述正相关关系和所述负相关关系确定各个学习行为对成绩影响的权重值。
优选地,针对成绩好的学生的学习行为数据,确定所述最小项支持度为所述第一支持度与所述权重值的比值;针对成绩差的学生的学习行为数据,确定所述最小项支持度为所述第一支持度与所述权重值的乘积。也可以通过其他的计算方法通过所述第一支持度和权重值确定各项的最小项支持度,比如通过第一支持度和权重值加、减等方法。此外,针对学习成绩好/差的学生也可以确定部分学习行为数据项的最小项支持度为所述第一支持度与所述权重值的比值,部分学习行为数据项的最小项支持度为所述第一支持度与所述权重值的乘积。也可以将好学生与差学生的行为数据合在一起分析,本案不做限制。
下面通过具体示例介绍一下上述相关性分析法和专家评分法。
一、相关性分析法(Pearson相关系数)
相关性分析是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。它是描述客观事物相互间关系的密切程度并用适当的统计数据表示出来的过程。在一段时期内学生成绩随观看微课数的上升而上升,说明这两个数据间是正相关关系;而在一段时期内学生成绩随社区发帖数的上升而下降,说明这两个数据间就是负相关关系。
对于所研究的总体,两个相互联系的变量的Pearson相关系数称为总体相关系数,通常用ρ表示:
其中Var(x)是变量x的方差,Var(y)是变量y的方差,Cov(x,y)是变量x和y的协方差。
总体相关系数ρ反应了两个变量x和y的线性相关程度,对于特定的总体来说,x和y的数值是既定的,总体相关系数ρ是客观存在的特定数值,但是通常不能去直接观测总体的两个变量x和y的全部数值,所以总体相关系数一般是未知的。可以做到的是从总体中堆积抽取一定数量的样本,通过x和y的观测值去估计样本相关系数,变量x和y的样本相关系数通常用r来表示:
其中xi和yi分别是变量x和y的样本观测值,和分别是变量x和y样本值的平均值。
Pearson相关系数的取值在-1与1之间,当r=0时,表明x和y没有线性相关关系;当0<|r|<1,表明x和y存在一定的线性相关关系,若r>0表明x与y正相关,若r<0表明x与y负相关;当|r|=1,表明x和y完全线性相关,若r=1称x5与y完全正相关,若r=-1称x与y完全负相关。
通过选取m个学生在一段时间内的行为数据x=(x1,x2,…,xm)和成绩数据y,可以计算得出各个行为数据xi和成绩y之间的相关性ri,其中xi=(xi1,xi2,…,xin)表示n个学生行为数据i(例如各个学生观看微课的次数),y=(y1,y2,…,yn)表示n个学生的考试成绩:
其中xij和yj分别是变量xi和y的样本观测值,和分别是变量xi和y样本值的平均值。可以令(也可以用其他的表示方法)表示行为数据xi对成绩影响的权重值。
二、专家评分法
专家评分法是一种定性描述定量化方法,先选定若干个评价项目,再根据评价项目制订出评价标准,请若干代表性专家凭借自己的经验按此评价标准给出各项目的评价分值,然后对其进行结合。专家评分法的计算方法主要分为三种:连加评价型,连积评价型,加权评价型。
(1)连加评价型
当数据间关系较简单者时,广泛使用加法评价型,将评价各数据项目所得的分值用连加求和,所得总分表示评价结果。公式为:
其中,W是评价对象总分值,Wi是第i项数据得分值,n是数据项数。
(2)连积评价型
将各个项目的分值连乘,并按其乘积大小来表现业绩结果。这种方法灵敏度很高,被评价对象各数据间的关系特别密切,其中一项的分数连带影响到其他各项的总结果,即具有某项数据不合格,就对整体起否定作用的特点,公式为:
其中,W是评价对象总分值,Wi是第i项数据得分值,n是数据项数。
(3)加权评价型
将评价对象中的各项数据项目依照评价数据的重要程度,给与不同的权重,即对各因素的重要程度做区别对待,公式为:
其中,W是评价对象总分值,Wi是第i项数据得分值,Ai是第i项数据的权值,n是数据项数。
下面以连加评价型对学生行为数据权重进行评价为例进行说明。选取学生行为数据x=(x1,x2,…,xn),5个专家(n=5)分别对于每个行为数据xi进行评分,分为3个评价项目,连加评分法见下表:
表二
其中评价项目A表示行为数据对学习的促进程度,评价项目B表示行为数据对成绩的阻碍程度,评价项目C表示行为数据对成绩的预警效果,第j个专家(1≤j≤5)根据评价项目对行为数据xi进行评分之后,得到行为数据xi的总分Wij,再将5个专家的对数据xi的总分进行平均,得到行为数据xi的平均总分:
得到行为数据x=(x1,x2,…,xn)的平均总分W=(W1,W2,…,Wn)之后,将W进行归一化处理,得到W′=(W1′,W2′,…,Wn′),其中:
令P(i)=Wi′,P(i)表示各个行为数据对成绩影响的权重值。
需要说明的是,针对成绩差的学生的学习行为数据,最小项支持度也可以为各项的第一支持度与权重值的乘积。
或者,还可以针对想要特定分析的学生,针对某一类学生,部分行为数据的最小项支持度是第一支持度与权重值的乘积,其他行为数据的最小项支持度是第一支持度与权重值的比值,本实施例对此进行说明,并不以此为限。
本实施例中,与成绩的相关性如下,可以使用(表示尽量筛选留下正相关的数据而过滤负相关)计算P(i)的值,P(i)只是示例,也可以选择其他的计算公式:
表三
行为数据 | 与成绩的相关性 | P(i) |
A(观看微课) | 0.33 | 2.138 |
B(空间访问次数) | -0.1 | 0.794 |
C(提交作业) | 0.4 | 2.511 |
D(修订作业) | 0.24 | 1.738 |
E(社区发帖) | -0.04 | 0.912 |
计算出各项的最小项支持度:
MIS(A)=0.6/2.138=0.281,MIS(B)=0.5/0.794=0.63,MIS(C)=0.7/2.511=0.279,MIS(D)=0.5/1.738=0.288,MIS(E)=0.2/0.912=0.22。
步骤304,将所述第一项集作为候选1项集。
即,候选1项集为:{E,C,A,D,B}。
步骤305,根据所述各项的最小项支持度,基于设定的条件确定第二支持度。
在多最小支持度关联规则算法中挖掘频繁项集集合的时候,第二支持度由各项的最小项支持度的最小值、最大值和给定的参考值所决定,这样避免了现有技术中采用最小值作为最小支持度算法的时间复杂度高和存在无效规则的问题,以及采用最大值剪枝程度过大而造成规则遗漏的问题。
具体地,上述设定的第二支持度和最小项支持度的条件关系通过如下方式确定:
首先,随机确定初始最小支持度。
上述给定的参考值即为初始最小支持度iminsup。
然后,将该初始最小支持度与最小项支持度中的最大值和最小值作比较。
如果所述初始最小支持度小于所述候选x项集中各项的最小项支持度中的最小值,则将所述最小值作为所述第二支持度;其中,1≤x≤k;
如果所述初始最小支持度大于等于所述最小值且小于等于所述候选x项集中各项的最小项支持度中的最大值,则将所述初始最小支持度作为所述第二支持度;
如果所述初始最小支持度大于所述最大值,则将所述最大值作为所述第二支持度;
如果所述最大值等于所述最小值,则将所述最大值和所述初始最小支持度中的较小值作为所述第二支持度。
具体地,根据上述初始最小支持度iminsup,结合计算得出的最小项支持度MIS(i)之后,在对频繁集Lk选择剪枝条件,即选择第二支持度(f(minsup)时,基于以下策略:
其中:
min(MIS)=min(MIS(i1),MIS(i2),...,MIS(ik));
max(MIS)=max(MIS(i1),MIS(i2),...,MIS(ik))。
由候选集集合Ck生成频繁集集合Lk时,对于项集I={i1,i2,i3,...,in}:
若iminsup<min(MIS),采用f(minsup)=min(MIS)作为剪枝条件,避免iminsup过小带来组合爆炸和产生无效规则的问题。
若iminsup>max(MIS),采用f(minsup)=max(MIS)作为剪枝条件,避免iminsup过高造成规则遗漏的问题。
若min(MIS)≤iminsup≤max(MIS),作为剪枝条件,避免多支持度中最小值或最大值算法中由于相应的MIS过小或过大引起的问题。
步骤306,根据所述第一支持度和所述第二支持度的比较结果,对所述候选1项集进行剪枝,生成频繁1项集。
随机确定初始最小支持度iminsup=0.25,由于min(MIS)<iminsup<max(MIS),f(minsup)=iminsup=0.25(f(minsup)是公式1中的第二支持度,iminsup是随机确定的初始最小支持度)。
对于C1中的每项i,如果sup(i)>=f(minsup)(f(minsup)的初始值为0.25),就将该项加入到L1中,得到频繁1项集集合L1={{C},{A},{D},{B}}。
步骤307,遍历所述事务集,生成候选2项集。
遍历第一项集中的所有项,生成候选2项集C2。
步骤308,确定所述候选2项集中各项集的第三支持度。
候选2项集及对应的各项集的第三支持度如下:{AB 0.2},{AC 0.4},{AD 0.3},{AE 0.1},{BC 0.3},{BD 0.2},{BE 0.1},{CD 0.2},{CE 0.2}。
步骤309,根据所述第三支持度和所述第二支持度的比较结果,对所述候选2项集进行剪枝,生成频繁2项集;
按照公式1根据候选2项集中各项集中各项的最小项支持度得到第二支持度,对于{AB 0.2},iminsup<min(MIS(A),MIS(B)),令项集的第二支持度f(minsup)=min(MIS(A),MIS(B))=0.281。下面举例说明:对于{AB 0.2},iminsup<min(MIS(A),MIS(B)),令f(minsup)=min(MIS(A),MIS(B))=0.281,sup(AB)<f(minsup)(f(minsup)的当前值为0.281),所以{AB}不加入到频繁2项集中;对于{AC 0.4},iminsup<min(MIS(A),MIS(C)),令f(minsup)=min(MIS(A),MIS(C))=0.279,sup(AC)>f(minsup)(f(minsup)的当前值为0.279),所以将{AC}加入到频繁2项集L2中,最终确定频繁2项集L2={{AC},{AD},{BC}}。
步骤310,遍历所述事务集,生成候选3项集至候选k项集,基于与生成频繁2项集相同的过程,直至生成的频繁k项集为空。
遍历所述事务集的所有项,生成候选3项集C3,并计算其相应的支持度,候选3项集如下:{{ABC 0.1},{ABD 0.1},{ACD 0.1}},{ACE 0.1}},{BCE 0.1}};根据候选3项集中各项集的支持度和第二支持度的比较,对于{ABC 0.1},iminsup<min(MIS(A),MIS(B),MIS(C)),令f(minsup)=min(MIS(A),MIS(B),MIS(C))=0.279,sup(ABC)<f(minsup)((fminsup)的当前值为0.279),所以{ABC}不加入到频繁3项集中,以此类推,确定频繁3项集L3为空。
步骤311,将所述频繁1项集至所述频繁k-1项集作为所述频繁项集集合。
由此得到的频繁1项集至频繁k-1项集作为所述频繁项集集合,可以用于后续生成关联规则,从而分析学生的学习行为规则。
本发明实施例提供的学习行为分析方法,通过采集学生课中学习行为数据和课后学习行为数据,并基于预设的多最小支持度关联规则算法对上述数据进行分析,与现有技术相比,提高了学生的学习行为差异分析的准确性,提高了教学效率。
相应地,本发明实施例提供一种学习行为分析系统,如图4所示,为本发明实施例提供的学习行为分析系统的结构图。
在该实施例中,该系统包括:
采集模块401,用于采集学习行为数据;所述学习行为数据包括课后学习行为数据和课中学习行为数据;
分析模块402,用于根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。
在本实施例中,所述课后学习行为数据包括以下一种或几种:做作业、提交作业、与同学互批作业、收藏错题、向老师发送私信、接收私信、观看微课、评论微课、点赞微课、收藏微课、访问他人空间、班级圈发布帖子、回复帖子、回复班级通知。
所述课中学习行为数据可以包括学生在课堂上接收教师教学时,抢答问题、做试题、提交作业、向老师提问等数据。
优选地,该系统还包括:
预处理模块,用于对所述学习行为数据进行预处理。
所述分析模块的一种具体结构如图5所示,该分析模块包括:
事务集生成单元501,用于将一段时间内发生的学习行为数据作为一个子项集,将多个子项集集合,形成事务集;
频繁项集集合生成单元502,用于根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合;
分析单元503,用于根据所述频繁项集集合,得到学生的学习行为规则。
本发明实施例提供的学习行为分析系统,通过采集模块采集学生课中学习行为数据和课后学习行为数据,通过分析模块基于预设的多最小支持度关联规则算法进行分析,与现有技术相比,提高了学生的学习行为差异分析的准确性,提高了教学效率。
虽然本发明是结合以上实施例进行描述的,但本发明并不限定于上述实施例,而只受权利要求的限定,本领域普通技术人员能够容易地对其进行修改和变化,但并不离开本发明的实质构思和范围。
Claims (11)
1.一种学习行为分析方法,其特征在于,包括:
采集学习行为数据;
根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。
2.根据权利要求1所述的方法,其特征在于,所述学习行为数据包括课后学习行为数据和课中学习行为数据。
3.根据权利要求1或2所述的方法,其特征在于,所述采集学习行为数据之后,所述方法还包括:
对所述学习行为数据进行预处理。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则包括:
将一定时间内发生的学习行为数据作为一个子项集,将多个子项集集合,形成事务集;
根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合;
根据所述频繁项集集合,得到学生的学习行为规则。
5.根据权利要求4所述的方法,其特征在于,所述根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合包括:
将各个所述学习行为数据作为各项,形成第一项集;
确定所述第一项集中各项的第一支持度;
基于所述第一支持度和预先确定的权重值确定所述第一项集中的各项的最小项支持度;
将所述第一项集作为候选1项集;
根据所述各项的最小项支持度,基于设定的条件确定第二支持度;
根据所述第一支持度和所述第二支持度的比较结果,对所述候选1项集进行剪枝,生成频繁1项集;
遍历所述事务集,生成候选2项集;
确定所述候选2项集中各项集的第三支持度;
根据所述第三支持度和所述第二支持度的比较结果,对所述候选2项集进行剪枝,生成频繁2项集;
遍历所述事务集,生成候选3项集至候选k项集,基于与生成频繁2项集相同的过程,直至生成的频繁k项集为空;
将所述频繁1项集至所述频繁k-1项集作为所述频繁项集集合。
6.根据权利要求5所述的方法,其特征在于,所述权重值通过如下方式确定:
确定学习行为数据中能使成绩上升的学习行为数据与成绩上升之间为正相关关系;
确定学习行为数据中能使成绩下降的学习行为数据与成绩下降之间为负相关关系;
根据所述正相关关系和所述负相关关系确定各个学习行为数据对成绩影响的权重值。
7.根据权利要求5所述的方法,其特征在于,所述根据所述各项的最小项支持度,基于设定的条件确定第二支持度包括:
随机确定初始最小支持度;
如果所述初始最小支持度小于候选x项集中各项的最小项支持度中的最小值,则将所述最小值作为所述第二支持度;其中,1≤x≤k;
如果所述初始最小支持度大于等于所述最小值且小于等于候选x项集中各项的最小项支持度中的最大值,则将所述初始最小支持度作为所述第二支持度;
如果所述初始最小支持度大于所述最大值,则将所述最大值作为所述第二支持度;
如果所述最大值等于所述最小值,则将所述最大值和所述初始最小支持度中的较小值作为所述第二支持度。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在生成频繁项集集合时,对所述候选1项集至所述候选k项集进行排序。
9.一种学习行为分析系统,其特征在于,包括:
采集模块,用于采集学习行为数据;
分析模块,用于根据所述学习行为数据,基于预设的多最小支持度关联规则算法,分析得到学生的学习行为规则。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括:
预处理模块,用于对所述学习行为数据进行预处理。
11.根据权利要求9或10所述的系统,其特征在于,所述分析模块包括:
事务集生成单元,用于将一段时间内发生的学习行为数据作为一个子项集,将多个子项集集合,形成事务集;
频繁项集集合生成单元,用于根据所述事务集和所述多个子项集集合,并基于多最小支持度关联规则算法,生成频繁项集集合;
分析单元,用于根据所述频繁项集集合,得到学生的学习行为规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711485520.6A CN108022057A (zh) | 2017-12-29 | 2017-12-29 | 学习行为分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711485520.6A CN108022057A (zh) | 2017-12-29 | 2017-12-29 | 学习行为分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108022057A true CN108022057A (zh) | 2018-05-11 |
Family
ID=62072506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711485520.6A Pending CN108022057A (zh) | 2017-12-29 | 2017-12-29 | 学习行为分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108022057A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255660A (zh) * | 2018-09-25 | 2019-01-22 | 科达集团股份有限公司技术分公司 | 一种利用高度不均衡数据的广告账户优化方法 |
CN110110225A (zh) * | 2019-04-17 | 2019-08-09 | 重庆第二师范学院 | 基于用户行为数据分析的在线教育推荐模型及构建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105589908A (zh) * | 2014-12-31 | 2016-05-18 | 中国银联股份有限公司 | 用于事务集合的关联规则计算方法 |
CN106297445A (zh) * | 2015-05-15 | 2017-01-04 | 北京邮电大学 | 一种基于大数据的移动学习系统 |
CN106778054A (zh) * | 2017-04-07 | 2017-05-31 | 中南大学 | 基于数据挖掘的在校学生成绩预警方法 |
-
2017
- 2017-12-29 CN CN201711485520.6A patent/CN108022057A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105589908A (zh) * | 2014-12-31 | 2016-05-18 | 中国银联股份有限公司 | 用于事务集合的关联规则计算方法 |
CN106297445A (zh) * | 2015-05-15 | 2017-01-04 | 北京邮电大学 | 一种基于大数据的移动学习系统 |
CN106778054A (zh) * | 2017-04-07 | 2017-05-31 | 中南大学 | 基于数据挖掘的在校学生成绩预警方法 |
Non-Patent Citations (1)
Title |
---|
赵玉航等: "基于分段函数的多支持度关联规则挖掘算法", 《计算机工程与设计》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255660A (zh) * | 2018-09-25 | 2019-01-22 | 科达集团股份有限公司技术分公司 | 一种利用高度不均衡数据的广告账户优化方法 |
CN109255660B (zh) * | 2018-09-25 | 2021-09-21 | 浙文互联集团股份有限公司技术分公司 | 一种利用高度不均衡数据的广告账户优化方法 |
CN110110225A (zh) * | 2019-04-17 | 2019-08-09 | 重庆第二师范学院 | 基于用户行为数据分析的在线教育推荐模型及构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pradeep et al. | Students dropout factor prediction using EDM techniques | |
Asanbe et al. | Teachers’ performance evaluation in higher educational institution using data mining technique | |
CN106373057B (zh) | 一种面向网络教育的成绩不良学习者识别方法 | |
Liu et al. | Collaborative learning team formation: a cognitive modeling perspective | |
Satria et al. | Application of SAW in the Class Leader Selection Decision Support System | |
WO2011034381A9 (ko) | 진로 상담 시스템 및 방법 | |
CN106202377A (zh) | 一种基于随机梯度下降的在线协同排序方法 | |
Hossain et al. | Use of scholarly communication and citation-based metrics as a basis for university ranking in developing country perspective | |
CN108022057A (zh) | 学习行为分析方法及系统 | |
Sharma et al. | Student’s Employability Indexing Using Machine Learning Approach | |
Marshall | Contribution of open-ended questions in student evaluation of teaching | |
Lan et al. | Evaluation system of music art instructional quality based on convolutional neural networks and big data analysis | |
Ruocco et al. | An empirical approach to compare the performance of heterogeneous academic fields | |
Zhang et al. | Research and application of grade prediction model based on decision tree algorithm | |
Kaensar et al. | Analysis and Prediction of Student Performance Based on Moodle Log Data using Machine Learning Techniques | |
Arlitt et al. | Feature engineering for design thinking assessment | |
Bakhshi et al. | Developing a Model to Predict Success of Agricultur al Production Enterprises Based on Their Capitals | |
Wyness et al. | Grade expectations: how well can past performance predict future grades? | |
Pisutaporn et al. | Relevant factors and classification of student alcohol consumption | |
Din et al. | Creation of a knowledge society via the use of mobile blog: a model of integrated meaningful hybrid e-training | |
Pejic et al. | Relationship Mining in PISA CBA 2012 Problem Solving Dataset using Association Rules | |
Ukwueze Frederick et al. | C.: Evaluation of data mining classification algorithms for predicting students performance in technical trades | |
Delima et al. | The use of Schoology as learning management system in the college of computing education: A response assessment using data mining techniques | |
Ali S et al. | Multi-class LDA classifier and CNN feature extraction for student performance analysis during Covid-19 pandemic | |
Patacsil | Predicting University Students’ Academic Success Using Different Tree Classifiers And Ensemble Approaches To Suggest Suitable Program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180511 |