CN111754097A - 基于多视图编码器-解码器架构的学生成绩预测系统 - Google Patents
基于多视图编码器-解码器架构的学生成绩预测系统 Download PDFInfo
- Publication number
- CN111754097A CN111754097A CN202010557859.8A CN202010557859A CN111754097A CN 111754097 A CN111754097 A CN 111754097A CN 202010557859 A CN202010557859 A CN 202010557859A CN 111754097 A CN111754097 A CN 111754097A
- Authority
- CN
- China
- Prior art keywords
- student
- encoder
- prediction system
- lstm
- students
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000006399 behavior Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Educational Technology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于多视图编码器‑解码器架构的学生成绩预测系统,包括:第一编码器、第二编码器、第三编码器和解码器,其中:第一编码器处理学生成绩信息,捕获学生总的成绩趋势;第二编码器处理门禁数据,捕获学生近期的努力程度,第三编码器处理学生基本情况数据,捕获学生的学习基础;解码器与三个编码器相连接,建模编码器学得的高层特征之间复杂的非线性依赖关系。本系统通过利用学生在大学校园内产生的门禁刷卡记录作为辅助信息,形成对学生全方位、多视角的分析评价以实现对学生成绩的智能预测。
Description
技术领域
本发明涉及的是一种人工智能应用领域的技术,具体是一种基于多视图编码器-解码器架构的学生成绩预测系统。
背景技术
根据研究、工作所涉及的数据来分,前人大部分是在MOOC或者ITS上进行。在传统教学情境下,相当一部分研究是限制在单门课程上。很少有研究是在专业层次上。
至于影响学生成绩的因子,学生以前的成绩、学生所提交的作业等等被广泛应用。除此之外,额外信息如学生的基本信息、学生在使用在线学习系统所被记录的各种学习行为、学生出席次数等被证明对提升预测准确度有很大帮助。但是学生在使用在线学习系统所被记录的各种学习行为、学生出席次数不易被收集因为种种原因,如缺乏相关记录设施、课堂上学生人数太多。
至于预测模型,前人工作大部分是基于传统的分类/回归方法,比如说线性回归、逻辑回归、决策树、支持向量机等。此外,一些人提出使用矩阵分解相关技术;一些人提出使用人工神经网络;一些人提出使用集成学习的思想。
发明内容
本发明提出一种基于多视图编码器-解码器架构的学生成绩预测系统,本系统通过利用学生在大学校园内产生的门禁刷卡记录作为辅助信息,形成对学生全方位、多视角的分析评价以实现对学生成绩的智能预测。总的来说,采集校园中易得的和成绩最为相关的三种数据:学生各科成绩数据、门禁数据(包括寝室门禁和图书馆门禁)以及学生基本情况数据(如年级、专业等)。其中,学生成绩信息可以反映学生的总的成绩趋势;门禁数据可以反映学生的学习努力程度;学生基本情况数据可以反映学生的学习基础。针对这三种数据,发明三种对应的编码器去处理。此外,还发明可以有效建模高层特征间复杂的非线性依赖关系的解码器。
本发明是通过以下技术方案实现的:
本发明包括:第一编码器、第二编码器、第三编码器和解码器,其中:第一编码器处理学生成绩信息,捕获学生总的成绩趋势;第二编码器处理门禁数据,捕获学生近期的努力程度,第三编码器处理学生基本情况数据,捕获学生的学习基础;解码器与三个编码器相连接,建模编码器学得的高层特征之间复杂的非线性依赖关系。
技术效果
与现有技术相比,本发明根据学生图书馆进馆刷卡记录、学生基本信息等额外的信息为成绩预测提供额外有效的依据。本发明使用这些辅助信息,结合学生成绩数据,所有的数据分成三个视图:一个数据视图(学生每学期的加权平均成绩序列)蕴含学生的总的成绩趋势;一个数据视图(学生最近图书馆进馆刷卡和宿舍进门刷卡序列)反映学生近期的努力程度,直观来讲,去图书馆次数越多、越早,回寝室越晚,学生越努力;一个数据视图(学生的基本信息)隐含着学生的学习基础情况,例如,东部沿海地区教育资源较为发达,来自沿海省份的学生学习基础较雄厚。本发明利用多视图编码器-解码器架构来整合这三个视图。本发明是端到端的架构,不需要人工定义、抽取特别多的特征;架构也具有良好的可扩展性。
附图说明
图1为多视图编码器-解码器结构示意图;
图2为第二编码器所使用到的注意力机制示意图;
图3为解码器使用到的残差单元示意图。
具体实施方式
本实施例为每个学生计算其历史各学期加权平均成绩,学生s在学期t的课程集合若为Θ,则t学期的加权平均成绩为这样,学生s的历史成绩序列为T是指学生s参与的学期总数为T个,即第一部分输入。真正输入模型前需要做预处理,这里把数值点使用标准的最小最大正则缩放到-1到1之间。
本实施例统计学生每天每个小时段内刷卡进图书馆的次数。具体来讲,若是第x天,记录[00:00,01:00)时间段内学生s去图书馆的次数c0,一整天则会产生24个计数c0——c23,这24个值就构成一个向量,反映学生s进图书馆的情况,蕴含时间信息和次数信息。类似的,本实施例统计学生每天每个小时段内刷卡进宿舍的次数得到另外24个计数c′0——c′23。再把这 48个值拼接成48维的向量其中,T+1指要预测的第T+1学期。一般每学期有18周,这里为提早做出预测,本实施例选取前9周,即63天,过完第63天本实施例就可以给出成绩预测结果。
第二部分输入为学生行为序列:{VT+1,1,VT+1,2,…,VT+1,x,…,VT+1,63}。这里对序列采用的预处理是把数值点使用标准的最小最大正则缩放到到0到1之间。
第三部分输入为学生基本信息B。这里对学生基本信息采用的预处理是连续值等宽离散化和独热编码。
如图1所示,本实施例包括:第一编码器、第二编码器、第三编码器和解码器,其中:第一编码器处理第一部分输入,即学生成绩信息,捕获学生总的成绩趋势;第二编码器处理第二部分输入,即学生日常行为数据,捕获学生近期的努力程度,第三编码器处理第三部分输入,即学生基本情况信息,捕获学生的学习基础;解码器与三个编码器相连接,建模编码器学得的高层特征之间复杂的非线性依赖关系。
所述的第一编码器使用变长LSTM进行建模因为学生的加权平均成绩序列是不等长的,例如,有的学生在大学只呆一学期,其产生的序列长度便为1。
所述的第二编码器使用加入注意力机制的LSTM进行建模。加入注意力机制是为区分不同天的重要程度。不同天对不同学生成绩影响不同,如因学生学习习惯不同、是否为假期等因素影响。
所述的第三编码器使用密集嵌入学得一个紧凑的学生基础表示。
所述的第一编码器、第二编码器的LSTM满足:it=σ(Wixxt+Wihhh-1+Wicct-1+ bi),ft=σ(Wfxxt+Wfhhh-1+Wfcct-1+bf),ct=ft⊙ct-1+it⊙tanh(Wcxxt+Wchhh-1+ bc),ot=σ(Woxxt+Wohhh-1+Wocct+bo),ht=ot⊙tanh(ct),其中:xt和ht是LSTM的输入和相应的输出,W是权重,b是偏置,σ是sigmoid函数,⊙是点积。对于第一编码器来讲,取LSTM最后一个输出作为学生成绩趋势表示hL=LSTM(g1,…,gT)。对于第二编码器来讲, LSTM和注意力机制相结合,LSTM部分为:
如图2所示,所述的第二编码器的注意力机制满足: 其中:是LSTM的输出,W是权重,b是偏置,αx为注意力得分,uw可以看成是提问“哪天信息更丰富更重要”的抽象表达,其和W、b一样,也是在训练过程中学得的。这样得到学生近期努力程度的表示hs。
所述的第三编码器即密集嵌入满足:e=[W1B1,W2B2,…,WNBN],其中:W是权重,N 表示有N个类别信息,如性别、专业。形式化来讲,B=[B1,B2,…,BN]。这样得到学生基础的表示e。
所述的解码器选用残差网络,其中残差单元设计如图3所示,满足: 其中:l指的是第l个残差单元,是残差方程,即2组“Dense+PRelu+Dropout”,Dense 即为全连接,PRelu是激活函数,Dropout层为防止过拟合。根据式子,不难发现X(l)和要求维度一致,若不一致,可以对实验中X(l)施以线性变换。我们的残差网络使用2组残差单元,效果达到最佳。残差网络的第0层即为残差网络的输入,为[hL,hS,e]。最后的输出为其中:W是权重,b是偏置,X(L+1)为残差网络的输出,即为本实施例的预测结果。
为防止模型在训练集上过拟合,本实施例使用Dropout技术。
实验数据从真实的大学校园采集,数据都经过匿名化处理,涉及8005名学生,有两
个连续学期的行为数据,图书馆门禁条数共为830781,宿舍门禁条数共为1584927。前一个
学期的数据用作训练,后一个学期的数据用作测试。超参数设置为:第一编码器变长LSTM的
隐状态长度为5,第二编码器LSTM的隐状态长度为24,第三编码器共有30个神经元,残差单
元的Dense有100个神经元,Dropout率为0.4,选用2个残差单元。实验结果与相关工作做对
比,我们的效果最佳,有着明显的提升。
方法 | 均方误差 |
历史成绩均值 | 30.03 |
贝叶斯岭回归 | 23.10 |
支持向量回归 | 22.43 |
随机森林 | 17.55 |
梯度提升树 | 17.67 |
前馈神经网络 | 17.28 |
本实施例 | 14.57 |
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。
Claims (10)
1.一种基于多视图编码器-解码器架构的学生成绩预测系统,其特征在于,包括:第一编码器、第二编码器、第三编码器和解码器,其中:第一编码器处理学生成绩信息,捕获学生总的成绩趋势;第二编码器处理门禁数据,捕获学生近期的努力程度,第三编码器处理学生基本情况数据,捕获学生的学习基础;解码器与三个编码器相连接,建模编码器学得的高层特征之间复杂的非线性依赖关系。
3.根据权利要求1所述的学生成绩预测系统,其特征是,所述的学生近期的努力程度,即学生行为序列:{VT+1,1,VT+1,2,…,VT+1,x,…,VT+1,63},该序列采用的预处理是把数值点使用标准的最小最大正则缩放到到0到1之间。
4.根据权利要求1所述的学生成绩预测系统,其特征是,所述的学生基本情况数据,即学生基本信息B,这里对学生基本信息采用的预处理是连续值等宽离散化和独热编码。
5.根据权利要求1所述的学生成绩预测系统,其特征是,所述的第一编码器使用变长LSTM进行建模。
6.根据权利要求1所述的学生成绩预测系统,其特征是,所述的第二编码器使用加入注意力机制的LSTM进行建模。
7.根据权利要求1所述的学生成绩预测系统,其特征是,所述的第三编码器使用密集嵌入学得一个紧凑的学生基础表示。
8.根据权利要求5或6所述的学生成绩预测系统,其特征是,所述的第一编码器、第二编码器的LSTM满足:it=σ(Wixxt+Wihhh-1+Wicct-1+bi),ft=σ(Wfxxt+Wfhhh-1+Wfcct-1+bf),ct=ft⊙ct-1+it⊙tanh(Wcxxt+Wchhh-1+bc),ot=σ(Woxxt+Wohhh-1+Wocct+bo),ht=ot⊙tanh(ct),其中:xt和ht是LSTM的输入和相应的输出,W是权重,b是偏置,σ是sigmoid函数,⊙是点积;对于第一编码器来讲,取LSTM最后一个输出作为学生成绩趋势表示hL=LSTM(g1,…,gT);对于第二编码器来讲,LSTM和注意力机制相结合,LSTM部分为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010557859.8A CN111754097A (zh) | 2020-06-18 | 2020-06-18 | 基于多视图编码器-解码器架构的学生成绩预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010557859.8A CN111754097A (zh) | 2020-06-18 | 2020-06-18 | 基于多视图编码器-解码器架构的学生成绩预测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111754097A true CN111754097A (zh) | 2020-10-09 |
Family
ID=72675428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010557859.8A Pending CN111754097A (zh) | 2020-06-18 | 2020-06-18 | 基于多视图编码器-解码器架构的学生成绩预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111754097A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108320045A (zh) * | 2017-12-20 | 2018-07-24 | 卓智网络科技有限公司 | 学生成绩预测方法和装置 |
CN110110939A (zh) * | 2019-05-15 | 2019-08-09 | 杭州华网信息技术有限公司 | 基于深度学习学生序列化行为的学业成绩预测预警方法 |
CN110276439A (zh) * | 2019-05-08 | 2019-09-24 | 平安科技(深圳)有限公司 | 基于注意力机制的时间序列预测方法、装置及存储介质 |
CN110555459A (zh) * | 2019-07-24 | 2019-12-10 | 四川大学 | 基于模糊聚类和支持向量回归的成绩预测方法 |
CN110852390A (zh) * | 2019-11-13 | 2020-02-28 | 山东师范大学 | 一种基于校园行为序列的学生成绩分类预测方法及系统 |
CN111260514A (zh) * | 2020-01-14 | 2020-06-09 | 华中师范大学 | 一种基于校园大数据的学生成绩预测方法 |
-
2020
- 2020-06-18 CN CN202010557859.8A patent/CN111754097A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108320045A (zh) * | 2017-12-20 | 2018-07-24 | 卓智网络科技有限公司 | 学生成绩预测方法和装置 |
CN110276439A (zh) * | 2019-05-08 | 2019-09-24 | 平安科技(深圳)有限公司 | 基于注意力机制的时间序列预测方法、装置及存储介质 |
CN110110939A (zh) * | 2019-05-15 | 2019-08-09 | 杭州华网信息技术有限公司 | 基于深度学习学生序列化行为的学业成绩预测预警方法 |
CN110555459A (zh) * | 2019-07-24 | 2019-12-10 | 四川大学 | 基于模糊聚类和支持向量回归的成绩预测方法 |
CN110852390A (zh) * | 2019-11-13 | 2020-02-28 | 山东师范大学 | 一种基于校园行为序列的学生成绩分类预测方法及系统 |
CN111260514A (zh) * | 2020-01-14 | 2020-06-09 | 华中师范大学 | 一种基于校园大数据的学生成绩预测方法 |
Non-Patent Citations (1)
Title |
---|
刘博鹏等: "基于数据挖掘技术的学生成绩预警应用研究", 《四川大学学报(自然科学版)》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695779B (zh) | 一种知识追踪方法、装置及存储介质 | |
Khalil et al. | Energy efficiency prediction using artificial neural network | |
Liu et al. | Time series classification with multivariate convolutional neural network | |
Tay et al. | Skipflow: Incorporating neural coherence features for end-to-end automatic text scoring | |
Dasgupta et al. | Nonlinear dynamic Boltzmann machines for time-series prediction | |
Minkoff | The sequencing of social movements | |
Fernández-García et al. | Creating a recommender system to support higher education students in the subject enrollment decision | |
Raga et al. | Early prediction of student performance in blended learning courses using deep neural networks | |
Martinho et al. | An intelligent system for prediction of school dropout risk group in higher education classroom based on artificial neural networks | |
CN112508077A (zh) | 一种基于多模态特征融合的社交媒体情感分析方法及系统 | |
CN108090686B (zh) | 一种医疗事件风险评估分析方法及系统 | |
CN111222992A (zh) | 一种基于注意力机制的长短期记忆神经网络的股票价格预测方法 | |
Rahman et al. | Predicting human design decisions with deep recurrent neural network combining static and dynamic data | |
CN113360635A (zh) | 一种基于自注意和预训练机制的智能教学方法及系统 | |
CN116311483B (zh) | 基于局部面部区域重构和记忆对比学习的微表情识别方法 | |
CN111881299B (zh) | 基于复制神经网络的离群事件检测与识别方法 | |
Rahman et al. | A deep learning based approach to predict sequential design decisions | |
CN115080715A (zh) | 基于残差结构和双向融合注意力的跨度提取阅读理解方法 | |
Feng et al. | A dual-staged attention based conversion-gated long short term memory for multivariable time series prediction | |
CN113378581A (zh) | 一种基于多元概念注意力模型的知识追踪方法及系统 | |
CN112381213A (zh) | 一种基于双向长短期记忆网络的工业设备剩余寿命预测方法 | |
CN113159945A (zh) | 一种基于多任务自监督学习的股票涨跌预测方法 | |
CN111754097A (zh) | 基于多视图编码器-解码器架构的学生成绩预测系统 | |
CN115795015A (zh) | 一种试题难度增强的综合知识追踪方法 | |
CN116402134A (zh) | 基于行为感知的知识追踪方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201009 |