CN107274020B - 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法 - Google Patents

一种基于协同过滤思想的学习者学科总测成绩预测系统及方法 Download PDF

Info

Publication number
CN107274020B
CN107274020B CN201710454618.9A CN201710454618A CN107274020B CN 107274020 B CN107274020 B CN 107274020B CN 201710454618 A CN201710454618 A CN 201710454618A CN 107274020 B CN107274020 B CN 107274020B
Authority
CN
China
Prior art keywords
learner
learners
knowledge point
similarity
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710454618.9A
Other languages
English (en)
Other versions
CN107274020A (zh
Inventor
余胜泉
卢宇
杨博达
李葆萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN201710454618.9A priority Critical patent/CN107274020B/zh
Publication of CN107274020A publication Critical patent/CN107274020A/zh
Application granted granted Critical
Publication of CN107274020B publication Critical patent/CN107274020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于协同过滤思想的学习者学科总测成绩预测系统及方法,包括:数据采集标注模块、学习者的量化特征提取模块、基于学习者量化特征的相似度向量提取模块、基于相似度向量的成绩预测模块。本发明可以解决对学习者学业成绩的预测问题,适用于一般在线学习平台和系统,也可以应用于实际教学评估和诊断中,为学习者提供个性化的教学服务,提高学习针对性和学习效率。

Description

一种基于协同过滤思想的学习者学科总测成绩预测系统及 方法
技术领域
本发明涉及一种基于协同过滤思想的学习者学科总测成绩预测系统及方法,属于数据挖掘技术,特别是涉及教育领域的数据挖掘。
背景技术
数据挖据是一种基于大量数据进行信息提取和知识发现的方法,数据挖掘中的一些方法包括聚类、关联规则学习、相关性分析、回归性分析以及分类等已经被广泛应用于互联网、工业制造、交通等各个领域。其中一类基于协同过滤思想的数据挖掘算法可以有效筛选出相似群体,故该算法已经成熟应用于电商推荐系统上来寻找相似兴趣品味的用户并进行推荐。在教育领域,此类算法的应用相对比较新颖,而且在教育技术领域有很大的应用前景。本发明首次提出将该算法用于学习者学科总测学习预测的问题上。做到了提前预测学习者对于未来的知识的学习效果。该方法的实现可以用来支持教育决策、对学习者进行信息和课程内容的推荐、学习者学习过程中的提前预警、学习者专业选择推荐以及制定学习者个性化的学习策略等。
发明内容
本发明要解决的问题是:克服现有技术的不足,将教育学测量手段跟数据挖掘技术相结合,提供一种基于协同过滤思想的学科总测成绩预测系统及方法,对学习者知识点和整体学科的掌握状态进行预测和估计,从而为学习者提供个性化的教学服务,提高学习针对性和学习效率。
本发明解决其问题所采用的方案是:一种基于协同过滤思想的学习者学科总测成绩预测系统,包括数据采集标注模块、学习者的量化特征提取模块、基于学习者量化特征的相似度向量提取模块、基于相似度向量的成绩预测模块,其中:
数据采集标注模块:根据具体学科科目的课程标准,系统对该学科的知识点进行划分,按照时间顺序排列划分后的知识点。学习者在对每个知识点进行学习后,进行该知识点的水平测试。测试将通过线上电子化课堂或者线下课堂或作业的形式进行,从而收集各知识点对应的测试数据和成绩。测试数据中包括题目本身及题目标注所属知识点。每一个知识点都包含至少一道以上的测试题目,每个知识点对应的测试题目数量可以不等。同时,在测试过程中,收集学习者本身的个体基础数据,例如所在地区和学校。
学习者的量化特征提取模块:基于模块一中所收集的数据,可以分别针对每个学习者,计算其在知识点p的得分率vp
vp=p下答对的题目的数量/p下包含的所有题目的数量。
因此,对于完成P个知识点的个体学习者i的成绩测试层面,该学习者对应的基本特征向量Vi={vp|p∈P}。除此之外,根据项目反映理论,该系统还可以通过整合学习者i对于每个知识点答题情况,得到学习者i在每个知识点的能力值
Figure BDA0001322718550000021
因此,对于完成P个知识点的学习者i的成绩测试层面,该学习者对应的特征向量有得分率向量Vi={vp|p∈P}和能力值向量
Figure BDA0001322718550000022
同时,将学习者i的所在的地区、学校等个体特征进行量化,作为补充特征向量Gi,来细化学习者个体区别之间的差异,从而形成多维度特征向量。具体来说,学习者i的多维度特征向量
Figure BDA0001322718550000023
其包括已学习过的知识点的得分率向量Vi,能力值向量
Figure BDA0001322718550000024
以及学习者个体特征向量Gi
基于学习者多维度特征向量的相似度计算模块:基于学习者的量化特征提取模块产生的学习者i的多维度特征Ti,计算Ti与系统中具有相同学习过程的其他学习者的多维度特征Tj的欧式距离。从而得到学习者i与其余学习者之间的欧氏距离向量{Dij|j∈J},其中J为其余学习者的集合。为了进一步得到相似度的数值,需要利用反转函数将学习者i与学习者j之间的欧氏距离Dij转化为相似度Sij。此模块中使用高斯函数作为反转函数,将学习者i与其余学习者j之间的欧氏距离向量{Dij|j∈J},转变为学习者i与其余学习者j之间的相似度向量{Sij|j∈J}。
基于相似度向量的成绩预测模块:给定系统中学习者i的学科总测成绩Yi是待预测的;系统中储存的历史数据包含的其余学习者J的学科总测成绩{Yj|j∈J}是已知。根据得到的学习者i与其余学习者J之间的相似度向量{Sij|j∈J},本模块从J个其余学习者中,筛选出前N个与学习者i相似度最高学习者。此处用JN表示这N个学习者的集合。以学习者i与挑选出的N个学习者的相似度{Sij|j∈JN}作为权重,用N个相似度高的学习者学业成绩{Yj|j∈JN}进行加权平均,最终预测学习者i的总测成绩
Figure BDA0001322718550000031
由于系统预测的准确率随着N的变化而变化,故在进行预测前需要先根据系统预测效果调试N的数值。
系统参数的调试方法:
由于系统预测的准确率随着N的变化而变化,故在基于相似度向量的成绩预测模块中,需要对算法中的参数N进行调试,得到合适的N的数值,最终得到可以最准确预测的系统模型。具体调试参数N的方法如下:
1)给N一个初始值,以一个常数递增,分别计算不同的N下,系统的预测效果。一般情况下随着N的增加,系统的预测误差先减小,后增加。故当随着N的增加,系统的预测误差不再减小时,那么此时的N就被选取为系统中最终的常数N。
2)模型预测的误差大小的评判标准为平均绝对误差(MAE)为:
Figure BDA0001322718550000032
n表示系统对n个学习者做了学业成绩的预测。
Figure BDA0001322718550000033
表示系统预测的学习者i的学业成绩。yi表示学习者i的实际成绩。
3)对于某一给定N值的系统。根据系统中已经储存的学习者,使用K次交叉验证法计算得出的K个平均绝对误差(MAE)的平均值来作为系统的平均绝对误差。通过变化N值,当系统的平均绝对误差不再减小时,那么此时的N就被选取为系统中最终的常数N。
本发明与现有方法相比的有益效果为:
(1)本发明可以解决对学习者科目总测成绩的预测的问题,为学习者提前预警,提高了学习针对性和学习效率。
(2)本发明方法将数据挖掘技术和教育测量手段相结合。针对学习者科目总测成绩的预测问题,提出了利用测试数据结合学习者能力和个人特征数据提取出多维度的特征向量。然后,基于协同过滤思想,建立预测模型,最终给出学习者总测成绩的预测结果。
附图说明
图1为本发明一种基于协同过滤思想的学科总测成绩预测系统的结构图;
图2为本发明的学习者能力特征提取流程;
图3为本发明的中使用的交叉验证流程;
图4为本发明系统中的数据储存结构。
具体实施方式
下面结合附图及具体实施方式详细介绍本发明。
如图1所示,本发明为一种基于协同过滤思想的学习者学科总测成绩预测系统,包括:数据采集标注模块、学习者的量化特征提取模块、基于学习者量化特征的相似度向量提取模块、基于相似度向量的成绩预测模块。
数据采集标注模块具体实现如下:
根据具体学科科目的课程标准,系统对该学科的知识点进行划分,按照时间顺序排列划分后的知识点。例如:数学学科某一年级的知识点划分和知识点的学习时间顺序如下:有理数→一元一次方程→几何体→线段→角→相交线→平行线。学习者在对每个知识点进行学习后,进行该知识点的水平测试。测试将通过线上电子化课堂或者线下课堂或作业的形式进行,从而收集各知识点对应的测试数据和成绩。测试数据中包括题目本身及题目标注所属知识点。每一个知识点都包含至少一道以上的测试题目,每个知识点对应的测试题目数量可以不等。同时,在测试过程中,收集学习者本身的个体基础数据,例如所在地区和学校。学习者应涵盖同一年纪各层次水平的人群。例如,可以是某一地区同一年级所有的在籍学生;对于每个学科,训练数据的规模应保持在一定规模以上。例如3000个学习者对于数学学科14个知识点的独立测试结果。数据将以图4的结构储存:每个知识点对应一张表,表中每一行对应一名学习者在该知识点下各个题目上的测试结果。
基于采集标注的信息进行学习者能力特征提取,具体实现如下:
基于模块一中所收集的数据,可以分别对每个学习者,计算其在知识点p的得分率vp
vp=p下答对的题目的数量/p下包含的所有题目的数量。
例如某学习者在一元一次不等式这个学科答对了5道题,该学科下一共包含了10道题,则学习者在该学科下的得分率v=0.5。对于完成P个知识点的个体学习者i的成绩测试层面,该学习者对应的基本特征向量Vi={vp|p∈P}。除此之外,根据项目反映理论,该系统还可以通过整合所有学习者i对于每个知识点答题情况,得到学习者i在每个知识点的能力值
Figure BDA0001322718550000041
Figure BDA0001322718550000042
如图2所示,例如某学习者在一元一次不等式这个学科下的十道题目的答题情况如下[1,0,1,1,1,0,0,0,1,0]。向量里1表示回答正确,0表示回答错误。根据学习者的答题情况,寻找到的使目标似然函数最大的能力值,便是该学习者的能力值θ。因此,对于完成P个知识点的学习者i的成绩测试层面,该学习者对应的特征向量有得分率向量Vi={vp|p∈P}和能力值向量
Figure BDA0001322718550000051
同时,将学习者i的所在的地区、学校等个体特征进行量化,作为补充特征向量Gi,来细化学习者个体区别之间的差异,从而形成多维度特征向量。例如某一学习者所在的地区的数学平均分为72,其所在学校的数学平均分为69,那么该学习者补充特征向量G=[72,69]。最后,学习者i的多维度特征向量
Figure BDA0001322718550000052
其包括已学习过的知识点的得分率向量Vi,能力值向量
Figure BDA0001322718550000053
以及学习者个体特征向量Gi
基于学习者多维度特征向量的相似度计算模块,其具体实现如下:
基于学习者的量化特征提取模块产生的学习者i的多维度特征Ti,计算Ti与系统中具有相同学习过程的其他学习者的多维度特征Tj的欧式距离。从而得到学习者i与其余学习者之间的欧氏距离向量{Dij|j∈J},其中J为其余学习者的集合。例如学习者A的多维度向量TA=[a1,a2,…,an]学习者B的多维度向量TB=[b1,b2,…,bn]。这两个学习者之间的距离
Figure BDA0001322718550000054
Figure BDA0001322718550000055
为了进一步得到相似度的数值,需要利用反转函数将学习者i与学习者j之间的欧氏距离Dij转化为相似度Sij。此模块中使用高斯函数作为反转函数,将学习者i与其余学习者j之间的欧氏距离向量{Dij|j∈J},转变为学习者i与其余学习者j之间的相似度向量{Sij|j∈J}。高斯函数的数学表达如下:
Figure BDA0001322718550000056
其中的Sij为学习者i与学习者j之间的相似度,Dij为学习者i与学习者j的综合特征向量间的欧氏距离,σ和μ为决定高斯函数形状的常数。通常μ=0;σ=1。
基于相似度向量的成绩预测模块,其具体实现如下:
给定系统中储存的历史数据包含的其余学习者J的学科总测成绩{Yj|j∈J}是已知,则对于待预测学科总测成绩Yi的学习者i,根据得到的学习者i与其余学习者J之间的相似度向量{Sij|j∈J},本模块从J个其余学习者中,筛选出前N个与学习者i相似度最高的学习者。此处用JN表示这N个学习者的集合。以学习者i与筛选出的N个学习者的相似度{Sij|j∈JN}作为权重,用N个其余学习者学业成绩{Yj|j∈JN}进行加权平均,最终预测学习者i的总测成绩
Figure BDA0001322718550000057
加权平均的数学方程如下:
Figure BDA0001322718550000061
例如对于学习者A,系统根据其他学习者与A的相似度向量寻找到了前5个跟他相似度最高的学生,那些相似度分别是[1,0.99,0.99,0.83,0.82]。这5个学习者的总测成绩分别是[74,89,83,70,78],那么根据加权平均,得到学习者A的成绩
Figure BDA0001322718550000062
由于不同的N值对系统的预测效果有显著的影响。故需要先调试出合适的N值使系统的预测误差最小。其具体的过程和方法如下:
(1)一般情况下随着N的增加,系统的预测误差先减小,后增加。给N一个初始值,以一个常数递增,分别计算不同的N下系统的预测效果。例如计算N分别取值5,10,15,20,25时系统的预测误差。当随着N的增加,系统的预测误差不再减小时,那么此时的N就被选取为系统中最终的N值。
(2)如图3所示,对某一N值。基于系统中已经储存的学习者数,使用K次交叉验证计算得出的K个平均绝对误差(MAE)的平均值来作为系统的平均绝对误差。其中模型预测的误差大小的评判标准为平均绝对误差(MAE)为:
Figure BDA0001322718550000063
n表示系统对n个学习者做了学业成绩的预测。
Figure BDA0001322718550000064
表示系统预测的学习者i的学业成绩,yi表示学习者i的实际成绩。
(3)当系统的平均绝对误差不再随着N的增加而减小时,此时的数值将作为系统中最终确定的该参数值。
本发明未详细阐述的部分属于本领域公知技术。

Claims (3)

1.一种基于协同过滤思想的学习者学科总测成绩预测系统,其特征在于:包括数据采集标注模块、学习者的量化特征提取模块、基于学习者量化特征的相似度向量提取模块和基于相似度向量的成绩预测模块;其中:
数据采集标注模块:根据具体学科科目的课程标准,对该学科科目的知识点进行划分,按照学习的时间顺序排列划分知识点;学习者在对每个知识点进行学习后,进行该知识点的水平测试,测试将通过线上电子化课堂或者线下课堂或作业的形式进行,从而收集各知识点对应的测试数据和成绩,测试数据中包括题目本身及题目标注所属的知识点,每一个知识点都包含至少一道测试题目,每个知识点所包含的测试题目数量可以不等;同时,在测试过程中,收集学习者本身的基础数据,包括所在学校及地区;
学习者的量化特征提取模块:基于数据采集标注模块中所收集的基础数据,计算学习者i在知识点p的得分率vp
vp=学习者答对的p的题目的数量/p涵盖的题目的数量
对每个知识点计算得分率,得到学习者i在每个知识点的能力值Vi={vp|p∈P},此处的P为某一学习过程中知识点p的集合;除此之外,根据项目反映理论,通过整合学习者i对于每个知识点答题情况,得到学习者i在每个知识点的能力值
Figure FDA0002432775740000011
完成所有知识点P的学习者i的成绩测试层面,该学习者对应的特征向量有得分率向量Vi={vp|p∈P}和能力值向量
Figure FDA0002432775740000012
同时,将学习者i的所在的学校、地区的基础数据进行量化,作为补充特征向量Gi,来细化学习者个体区别之间的差异,从而形成多维度特征向量;最终,学习者i的多维度特征向量
Figure FDA0002432775740000013
包括已学习过的知识点的得分率向量Vi,能力值向量
Figure FDA0002432775740000014
以及学习者个体特征向量Gi
基于学习者多维度特征向量的相似度计算模块:根据学习者的量化特征提取模块产生的学习者i的多维度特征Ti,计算Ti与具有相同学习过程的其他学习者j的欧氏距离,从而得到学习者i与其余学习者之间的距离向量{Dij|j∈J},其中J为其余学习者的集合,然后利用高斯函数作为反转函数将学习者i与其余学习者j之间的欧氏距离Dij,转变为学习者i与其余学习者j之间的相似度Sij
基于相似度向量的成绩预测模块:基于学习者多维度特征向量的相似度计算模块中得到的学习者i与其余学习者J之间的相似度向量{Sij|j∈J},从J个其余学习者中,筛选出前N个与学习者i相似度最高的学习者,JN表示这N个学习者的集合,以学习者i与挑选出的N个学习者的相似度{Sij|j∈JN}作为权重,用N个学习者学业成绩{Yj|j∈JN}进行加权平均,从而预测学习者i的成绩,预测的准确率随着N的变化而变化,在进行预测前需要先根据预测效果调试N的数值;
所述学习者的量化特征提取模块中,利用项目反应理论计算学习者i在每个知识点的能力值
Figure FDA0002432775740000021
具体方法如下:
在测试数据中,任一知识点p往往包含多个题目,知识点p下的题目表示为{k|k∈p},学习者i在知识点p下的答题表现
Figure FDA0002432775740000022
其中
Figure FDA0002432775740000023
表示学习者i对题目k的作答结果,当作答结果正确时
Figure FDA0002432775740000024
当作答结果错误时,
Figure FDA0002432775740000025
基于项目反映理论,学习者i的能力值跟其答对题目k的概率满足下方的双参数模型:
Figure FDA0002432775740000026
其中θi表示学习者i在知识点p的能力,参数ak与bk分别为题目k的区分度与难度,f(θi)为学习者正确作答该题目的概率;
已知所有学习者在知识点p下的答题表现
Figure FDA0002432775740000027
此处M为所有学习者的集合,通过使用最大期望算法来寻得到每个学习者对于知识点p的能力
Figure FDA0002432775740000028
和每道题目的难度{bk|k∈p}和区分度{ak|k∈p},目标似然函数数学表达为
Figure FDA0002432775740000029
所述基于相似度向量的成绩预测模块中,调试参数N的方法如下:
利用平均绝对误差(MAE)作为主要调参依据,其中
Figure FDA00024327757400000210
n表示对n个学习者做了学业成绩的预测,
Figure FDA00024327757400000211
表示预测的学习者i的学业成绩,yi表示学习者i的实际成绩;具体调整过程中利用K次交叉验证方法计算得出的K个平均绝对误差(MAE)的平均值来作为平均绝对误差,选取使平均绝对误差最小的N值来作为模型参数。
2.根据权利要求1所述的一种基于协同过滤思想的学习者学科总测成绩预测系统,其特征在于:所述基于学习者多维度特征向量的相似度计算模块中,利用高斯函数作为反转函数将学习者i与其余学习者j之间的欧氏距离Dij,转变为学习者i与其余学习者j之间的相似度Sij,具体实现如下:
Figure FDA0002432775740000031
其中的Sij为学习者i与学习者j之间的相似度,Dij为学习者i与学习者j的综合特征向量间的欧氏距离,σ和μ为决定高斯函数形状的常数。
3.一种基于权利要求1所述协同过滤思想的学习者学科总测成绩预测系统的方法,其特征在于步骤如下:
(1)数据采集标注:根据具体学科科目的课程标准,对该学科科目的知识点进行划分,按照学习的时间顺序排列划分知识点;学习者在对每个知识点进行学习后,进行该知识点的水平测试,测试将通过线上电子化课堂或者线下课堂或作业的形式进行,从而收集各知识点对应的测试数据和成绩;测试数据中包括题目本身及题目标注所属的知识点,每一个知识点都包含至少一道测试题目,每个知识点所包含的测试题目数量可以不等;同时,在测试过程中,收集学习者本身的基础数据,包括所在学校及地区;
(2)学习者的量化特征提取:基于数据采集标注模块中所收集的基础数据,计算学习者i在知识点p的得分率vp
vp=学习者答对的p的题目的数量/p涵盖的题目的数量
对每个知识点计算得分率,得到学习者i在每个知识点的能力值Vi={vp|p∈P},此处的P为某一学习过程中知识点p的集合;除此之外,根据项目反映理论,通过整合学习者i对于每个知识点答题情况,得到学习者i在每个知识点的能力值
Figure FDA0002432775740000032
完成所有知识点P的学习者i的成绩测试层面,该学习者对应的特征向量有得分率向量Vi={vp|p∈P}和能力值向量
Figure FDA0002432775740000033
同时,将学习者i的所在的学校、地区的基础数据进行量化,作为补充特征向量Gi,来细化学习者个体区别之间的差异,从而形成多维度特征向量;最终,学习者i的多维度特征向量
Figure FDA0002432775740000034
包括已学习过的知识点的得分率向量Vi,能力值向量
Figure FDA0002432775740000035
以及学习者个体特征向量Gi
(3)基于学习者多维度特征向量的相似度计算:根据学习者的量化特征提取模块产生的学习者i的多维度特征Ti,计算Ti与具有相同学习过程的其他学习者j的欧氏距离,从而得到学习者i与其余学习者之间的距离向量{Dij|j∈J},其中J为其余学习者的集合,然后利用高斯函数作为反转函数将学习者i与其余学习者j之间的欧氏距离Dij,转变为学习者i与其余学习者j之间的相似度Sij
(4)基于相似度向量的成绩预测:基于学习者多维度特征向量的相似度计算模块中得到的学习者i与其余学习者J之间的相似度向量{Sij|j∈J},从J个其余学习者中,筛选出前N个与学习者i相似度最高的学习者,JN表示这N个学习者的集合,以学习者i与挑选出的N个学习者的相似度{Sij|j∈JN}作为权重,用N个学习者学业成绩{Yj|j∈JN}进行加权平均,从而预测学习者i的成绩,预测的准确率随着N的变化而变化,在进行预测前需要先根据预测效果调试N的数值。
CN201710454618.9A 2017-06-15 2017-06-15 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法 Active CN107274020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710454618.9A CN107274020B (zh) 2017-06-15 2017-06-15 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710454618.9A CN107274020B (zh) 2017-06-15 2017-06-15 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法

Publications (2)

Publication Number Publication Date
CN107274020A CN107274020A (zh) 2017-10-20
CN107274020B true CN107274020B (zh) 2020-05-22

Family

ID=60066815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710454618.9A Active CN107274020B (zh) 2017-06-15 2017-06-15 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法

Country Status (1)

Country Link
CN (1) CN107274020B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977708A (zh) * 2017-11-24 2018-05-01 重庆科技学院 面向个性化学习方案推荐的学生dna身份信息定义方法
CN108171358B (zh) * 2017-11-27 2021-10-01 科大讯飞股份有限公司 成绩预测方法及装置、存储介质、电子设备
CN108228779B (zh) * 2017-12-28 2021-03-23 华中师范大学 一种基于学习社区对话流的成绩预测方法
CN109086939A (zh) * 2018-08-14 2018-12-25 合肥知多少教育科技有限公司 一种做题结果的录入方法及装置
CN110069704B (zh) * 2019-03-22 2021-05-18 天津大学 基于分数和任课教师的协同选课推荐方法
CN110443427B (zh) * 2019-08-12 2023-11-07 浙江蓝鸽科技有限公司 基于认知知识谱的成绩预测方法及其系统
CN110727788B (zh) * 2019-10-17 2020-11-10 上海松鼠课堂人工智能科技有限公司 基于知识点相似度的自适应教学方案调整方法
CN111260518B (zh) * 2020-04-30 2020-08-14 成都派沃智通科技有限公司 一种校园信息管理系统
CN112446558B (zh) * 2021-01-29 2022-05-17 北京世纪好未来教育科技有限公司 模型训练方法、学习结果获取方法、装置、设备及介质
CN114461786B (zh) * 2022-04-13 2022-10-21 北京东大正保科技有限公司 一种学习路径生成方法和系统
CN114912027A (zh) * 2022-05-31 2022-08-16 济南大学 一种基于学习成效预测的学习方案推荐方法及系统
CN118429159B (zh) * 2024-07-05 2024-10-08 江西师范大学 一种教育数据框架驱动的教育决策支持方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127634A (zh) * 2016-06-20 2016-11-16 山东师范大学 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
CN106408475A (zh) * 2016-09-30 2017-02-15 中国地质大学(北京) 一种在线课程适用性评价方法
DE102015221743A1 (de) * 2015-11-05 2017-05-11 Robert Bosch Gmbh Verfahren und Informationssystem zum Vorhersagen einer zukünftigen Bodentemperatur in einem Spargeldamm
CN106779166A (zh) * 2016-11-23 2017-05-31 北京师范大学 一种基于数据驱动的知识点掌握状态的预测系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015221743A1 (de) * 2015-11-05 2017-05-11 Robert Bosch Gmbh Verfahren und Informationssystem zum Vorhersagen einer zukünftigen Bodentemperatur in einem Spargeldamm
CN106127634A (zh) * 2016-06-20 2016-11-16 山东师范大学 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
CN106408475A (zh) * 2016-09-30 2017-02-15 中国地质大学(北京) 一种在线课程适用性评价方法
CN106779166A (zh) * 2016-11-23 2017-05-31 北京师范大学 一种基于数据驱动的知识点掌握状态的预测系统及方法

Also Published As

Publication number Publication date
CN107274020A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN107274020B (zh) 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法
CN109919810B (zh) 在线学习系统中的学生建模与个性化课程推荐方法
CN111460249B (zh) 一种基于学习者偏好建模的个性化学习资源推荐方法
CN107123068B (zh) 一种面向程序设计语言课程个性化学习效果分析系统及方法
Sass et al. Value-added models and the measurement of teacher productivity
CN109858797B (zh) 基于知识网络精准在线教育系统的多维度信息学情分析方法
CN112508334B (zh) 融合认知特性及试题文本信息的个性化组卷方法及系统
CN110378818A (zh) 基于难度的个性化习题推荐方法、系统及介质
CN112184500A (zh) 基于深度学习和知识图谱的课外学习辅导系统及实现方法
CN111581529B (zh) 一种结合学生适合度和课程搭配度的课程推荐方法及装置
CN108334943A (zh) 基于主动学习神经网络模型的工业过程半监督软测量建模方法
CN106095812A (zh) 一种基于相似性度量的智能试卷生成方法
KR20190098376A (ko) 대학입시 합격 예측 방법
CN110543995A (zh) 一种基于模糊算法的学生认知水平的测试评定系统
CN113672809A (zh) 一种基于个性化推荐算法的智能导学方法及系统
Aji et al. An implementation of C4. 5 classification algorithm to analyze student’s performance
Wang et al. Educational question mining at scale: Prediction, analysis and personalization
CN114971425A (zh) 数据库信息监控方法、装置、设备及存储介质
Scarlatos et al. Process-BERT: A framework for representation learning on educational process data
Xu et al. Modeling Student Performance using Feature Crosses Information for Knowledge Tracing
Jasim et al. Characteristics of data mining by classification educational dataset to improve student’s evaluation
Sghir et al. Using learning analytics to improve students' enrollments in higher education
CN113743495B (zh) 一种基于注意力机制的学习风格识别方法及系统
Sethi et al. Machine learning based performance evaluation system based on multi-categorial factors
CN113919983A (zh) 试题画像方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant