CN110070232A - 引入教师教学风格的多维度预测学生成绩的方法 - Google Patents

引入教师教学风格的多维度预测学生成绩的方法 Download PDF

Info

Publication number
CN110070232A
CN110070232A CN201910347207.9A CN201910347207A CN110070232A CN 110070232 A CN110070232 A CN 110070232A CN 201910347207 A CN201910347207 A CN 201910347207A CN 110070232 A CN110070232 A CN 110070232A
Authority
CN
China
Prior art keywords
data
student
style
teaching
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910347207.9A
Other languages
English (en)
Other versions
CN110070232B (zh
Inventor
李嘉伟
费雪
党同真
李丞勇
赵长宽
高克宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910347207.9A priority Critical patent/CN110070232B/zh
Publication of CN110070232A publication Critical patent/CN110070232A/zh
Application granted granted Critical
Publication of CN110070232B publication Critical patent/CN110070232B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提出引入教师教学风格的多维度预测学生成绩的方法,该方法在学生基本信息数据中加入了量化后的教师风格这一因素来进行预测学生成绩的模型建立,使用随机森林分别建立针对于学生特征与教师风格特征的学生成绩预测模型,最终由每一位学生自效问卷调查针对于不同的学生来确定两种预测模型所占据在最终预测时所占的比重,从而使得预测方法更具有针对性与普适性。这些分析结论可以帮助教师认识到教师教学风格对学生学习具体有些怎么样的影响和影响的方式如何,在实际的教学工作中更加合理有效的调整自己的教学风格、选择教学方法、制定教学方案提供参考依据,帮助教师更加高效的开展教学活动。同时针对学生进行教学上的干预使其避免成绩落后。

Description

引入教师教学风格的多维度预测学生成绩的方法
技术领域
本发明属于数据挖掘领域,涉及教育学、心理学等相关方面的研究内容,具体设及引入教师教学风格的多维度预测学生成绩的方法。
背景技术
随着信息时代的发展和数据的爆炸式增长,影响传统教学的变革已经来临。通过应用数据挖掘技术在教育领域进行的研究叫做教育数据挖掘(EDM),其中包括对学生教学评价、对教师的教学方式的改进、对学校管理人员的教学管理与对教育理论研究者提供支撑数据。因此,数据挖掘技术在教育领域引起的变革已经值得我们重视。有关于教育数据挖掘技术的分支,预测学生成绩此领域也经由海内外多位学者进行研究,并提供了多种成绩分类回归算法模型。众多研究更多的将注意力集中在学生本身信息数据上,如学生家庭信息,父母受教育程度,前期考试成绩等,在这些信息上进行数据挖掘,然而鲜有考虑教师授课风格对学生成绩的影响。
社会的不断发展与持续推进的教育改革对现代教育对教师的专业水平提出了更高的要求。教师教学风格作为影响教学水平和质量的重要因素,也应该被预测学生成绩的模型进行挖掘。教学活动是教师的教与学生的学相结合的互动过程,因此相关学者的教育研究也应当同时关注作为教学活动主体的教师和学生这两个方面。教师的教学风格是教师在教学活动中采用的个性化的、一贯的方式、方法,是教师给学生讲授、传递知识的一个载体,对教学活动及其有效性有重要的影响。相关研究表示,不同教师在同一科目上不同的授课风格对不同学生产生的效果不同,进而使得学生对待某一科目的学习兴趣不同,最终影响到学生的成绩等级。同时对于已然培养出固定授课方式教学风格的教师而言,缺少与学生成绩匹配的反馈,进而可能会影响相关学科教学方式的进步。
学生成绩与教师教学方式之间是一种互相反馈的关系,教学方式对学生成绩之间的影响,反馈于教师教学方式本身,使教师发现自身教学方式的改进空间进而推动教学质量,形成学生于与教师之间的一个良性循环。同时由于不同学生素质之间的差异性导致预测分类模型效果不理想,本发明专利正是针对于此,提出一种集多维度,通过学生自效能答卷确定教师风格特征与学生基本信息特征在最终预测所占比重,进而能更有效的预测学生成绩的系统,力求推动教育领域的研究与发展。
发明内容
本发明基于当前有关于“教师教学风格对学生成绩的影响”这一研究所得出的结论,学生的成绩与教师授课方式有关,因此在学生基本信息数据中加入了量化后的教师风格这一因素来进行预测学生成绩的模型建立,使用随机森林分别建立针对于学生特征与教师风格特征的学生成绩预测模型,最终由每一位学生自效问卷调查针对于不同的学生来确定两种预测模型所占据在最终预测时所占的比重,从而使得预测更具有针对性与普适性。这些分析结论可以帮助教师认识到教师教学风格对学生学习具体有些怎么样的影响和影响的方式如何,在实际的教学工作中更加合理有效的调整自己的教学风格、选择教学方法、制定教学方案提供参考依据,帮助教师更加高效的开展教学活动。同时针对学生进行教学上的干预使其避免成绩落后。
基于上述发明构思,本发明采用下述技术方案。
引入教师教学风格的多维度预测学生成绩的方法,其特征在于,包括如下步骤:
步骤一:数据收集,待收集的数据包括学生特征数据、学生成绩、教师风格数据和学生自效能数据;其中学生特征数据和学生成绩从教学系统中导出,教师风格数据和学生自效能数据通过向学生发布调查问卷的形式分别收集;
步骤二:将步骤一收集到的数据进行数据处理规范化后传输至数据库中;将学生自效能数据进行转化,计算教师风格与学生特征分别对学生成绩的影响因子ω1与ω2
ω2=1-ω1
其中,gi(i=1,2,…,n)代表学生自效能问卷中每道题目的得分,将问卷所得分数归一化至目标区间[a,b],其中参数a,b设定取值范围为[0,0.3]且a<b,ω1与ω2分别代表教师风格与学生特征对学生成绩的影响权值,因此ω1的取值区间为[0,0.3],ω2的取值区间为[0.7,1)。
步骤三:使用规范化后的学生特征数据和教师风格数据这两类数据,分别与学生成绩作为组合,划分为两类数据集;每类数据集拆分成为训练集和测试集;随后使用随机森林对训练集进行模型训练,将测试集输入训练结果调试模型,最终每类数据分别生成随机森林预测分类模型;将步骤二中,计算的影响因子分别代入对应数据模型中,最终按照影响因子权值分别乘以两个随机森林模型的投票结果,得到最终投票结果。
教师风格数据集U1及学生特征数据集U2
Xteac her的维数为T维,Xstudents的维数为S维,R为最终学生成绩分类。IT与IS为两待测样本数据集,n代表原数据集中的样本个数。
其中xteac her属于教师风格数据集,即IT
其中xstudents属于学生特征数据集,即IS
其中xpredict包括xteac her与xstudents两类数据。
pi(xteac her)与qi(xstudents)分别代表第i颗决策树对教师风格与学生特征的待测样本的预测结果。vote()函数代表每颗决策树的投票结果。majority()函数代表取经过权重处理后所有决策树投票结果最多的分类。树的集合P={pi,i=1,2,…,Ntree},Q={qi,i=1,2,…,Ntree}和待测样本的分类,Ntree代表决策树的个数。
步骤四:输入待预测成绩学生的规范数据,包括学生特征数据、教师风格数据和学生自效能数据,根据训练好的模型进行预测,最终在显示单元输出预测成绩结果。
进一步地,上述步骤二,将步骤一收集到的数据进行数据处理规范化后传输至数据库中,具体步骤如下:
2.1)将学生特征数据、学生成绩、教师风格数据和学生自效能数据整合到数据库中;
2.2)对数据中非数值变量进行独热编码;
2.3)对于数据中存在缺失的数据进行处理,若缺失的数据信息不超过全部数据信息的0.2%,则将这些缺失数据信息直接标记为0;若缺失数据信息超过0.2%,则对缺失数据进行数据补全;
2.4)对数据进行分析,识别离群点并平滑噪声数据;对数据进行异常值(离群点)分析,采用3σ原则,如果数据服从正态分布,则数据中标准差超过3σ的值被认定为异常值,采用回归法消除噪音数据:使用拟合数据函数光滑数据。
上述对缺失数据进行数据补全采用多重插补方法。
上述步骤三,建立得到两个随机森林预测分类模型,具体包括以下步骤
从学生特征数据所包含的n个样本中,以有放回随机选取k个样本,利用所选择的k个样本来训练生成一颗决策树;当决策树的每个节点需要分裂时,随机从数据中所包含的S个变量中选取s个变量,其中,s<<S;然后,从选取出的s个变量中,采用基尼指数来选取一个变量作为对应节点的分裂变量;
再从教师风格特征数据所包含的N个样本中,选择上一步中相同的k个样本;当决策树的每个节点需要分裂时,随机从数据中所包含的T个变量中选取t个变量,其中,t<<T;然后,从选取出的t个变量中,采用基尼指数来选取一个变量作为对应节点的分裂变量。本发明的有益效果:
本发明相较于传统预测模型提出了一种新的模式,通过确定对不同的因素、对不同的学生所造成不同的影响比重,在最终的预测模型中加入此影响权重因子,使得预测成绩更具有普适性和差异性。这些分析结论可以帮助教师认识到教师教学风格对学生学习具体有些怎么样的影响和影响的方式如何,在实际的教学工作中更加合理有效的调整自己的教学风格、选择教学方法、制定教学方案提供参考依据,帮助教师更加高效的开展教学活动。同时针对学生进行教学上的干预使其避免成绩落后。
附图说明
图1预测学生成绩分类的流程图。
具体实施方式
下面结合附图对本发明做出详细的步骤阐述
如图1所示,具体的学生成绩预测流程主要包括以下步骤:
步骤一:对学生的相关数据进行收集,待收集的数据包括学生特征数据、学生成绩、教师风格数据和学生自效能数据。
步骤二:将收集到的数据进行数据处理规范化后传输至数据库中;将学生自效能数据进行转化,计算教师风格与学生特征分别对学生成绩的影响因子ω1与ω2
步骤三:使用清洗后的数据进行模型的训练,将完整数据集拆分成为训练集和测试集,随后使用随机森林对训练集进行模型的训练,将测试集输入训练结果调试模型,最终生成随机森林预测分类模型。
步骤四:传输待预测学生成绩规范数据,根据训练好的模型进行预测,最终输出预测结果。
其中的步骤一中学生的相关成绩应从学校教务系统中导出,有关于学生学习习惯及周围环境,教师风格等调查问卷则由电子进行发放,使得便于进行数据导入。在进行调查问卷收集的过程中必须要求学生实名进行甜心,因为需要对应每一个学生差异化的基本信息和最终成绩。结合这两方面数据使得预测学生成绩更为精准有效。
对于学生基本信息则包括:性别、年龄、学号、生源地、父母教育背景、期中考试成绩或各单元测验成绩等。
对于学生学习习惯及环境等包括:单日学习时间、完成作业效率、认真听讲时间比重、作息习惯、班级班风、图书馆/自习室频率等。
有关于教师教学风格主要包括:逻辑性强的、擅于启发的、条理清晰的、感情充沛的、能旁征博引的、生动形象的、幽默诙谐的、富有情趣的、教学手段现代化的、教学手段传统的、随机应变的、因材施教的等。而按照顺序每三点可归为一个类别,最终将总和计算即可。其中很不符合、比较不符合、有点不符合、说不准、有点符合、比较符合、很符合从1-7打分。
有关于学生学业自效能主观上的评价其中直接对其进行求和,范围5-40分。
学生生活学习习惯、学习自效能、教师风格调查问卷分别采用李斯特四点、五点、七点的选项设计,由于每一个问题具有较强的倾向性,因此在数据处理的时候按照顺序进行1-4、1-5、1-7编码。
表1:教师教学风格
表2:学生学习习惯及环境属性
步骤二中对于学生成绩、学生特征、教师风格分别进行数据处理。将期中考试或单元测验成绩以及期末学习成绩划分成为5个部分:
A:>90 B:80-90 C:70-80 D:60-70 E:<60
每一部分的教师风格分成4个部分
A:16-18 B:13-15 C:9-12 D:3-8
对表中所有类别特征进行独热编码。
例:单元测试成绩共分为5个类别因此将“A”“B”“C”“D”“E”分别转化为“1 0 0 00”,“0 1 0 0 0”,“0 0 1 0 0”,“0 0 0 1 0”,“0 0 0 0 1”。
生源地、性别、自习频率、教师风格等其余编码诸如此类在此不进行详述。
进一步的有关教师风格与学生特征对学生成绩的影响权重,在问卷1中主要设定8道题目,由于每一道题目的设定具有倾向性,打分越高越能体现教师对学生自主学习、知识掌握、兴趣启发等方面有着更重要的作用。但是由于问卷调查为自主答卷,容易出现数据自我倾向较重,因此将问卷所得分数归一化至目标区间[a,b],其中参数a,b设定取值范围为[0,0.3]且a<b,即代表教师风格对学生成绩的影响最大程度上只占据30%。对于具体一样本X计算如下:
ω2=1-ω1
其中,gi(i=1,2,…,n)代表学生自效能问卷中每道题目的得分,ω1与ω2分别代表教师风格与学生特征对学生成绩的影响权值,因此ω1的取值区间为[0,0.3],ω2的取值区间为[0.7,1)。
问卷1:学生自效能调查问卷
亲爱的同学:你好,感谢你抽出时间填来写这份问卷,完成本问卷将会占用你十分钟的时间。本调查问卷的结果仅用于研究,绝不他用,调查的内容绝对保密。请认真作答,谢谢。
下面为一些陈述语句,请把你认为最符合你自身情况的选项填在括号里
1.我会随时跟着老师的教学进度学习。
A很不符合 B不符合 C不确定 D符合 E完全符合
2.老师的教学风格和授课方式对我行为习惯的培养影响很大。
A很不符合 B不符合 C不确定 D符合 E完全符合
3.遇到难以理解和掌握的知识,我更愿意去询问老师。
A很不符合 B不符合 C不确定 D符合 E完全符合
4.老师讲课能促进我的积极思考,富有启发性。
A很不符合 B不符合 C不确定 D符合 E完全符合
5.我会积极的完成老师布置的作业。
A很不符合 B不符合 C不确定 D符合 E完全符合
6.通过老师的教学,我理解并学会了该课程内容
A很不符合 B不符合 C不确定 D符合 E完全符合
7.我认为我在该门学科更多的学习的知识获取来自老师。
A很不符合 B不符合 C不确定 D符合 E完全符合
8.老师的教学使我对该领域产生了浓厚的兴趣,甚至希望未来在该领域取得一定的成就。
A很不符合 B不符合 C不确定 D符合 E完全符合
在本例中得到了以下数据集
表1:学生特征训练数据集示例
表2:教师风格特征训练数据示例
序号 风格一 风格二 风格三 风格四 期末成绩
1 C C B D Pass
2 D C C C Pass
3 A C C C Fail
4 B A C B Pass
5 D B B B Fail
6 A A A C Fail
7 B A A B Pass
8 A D A D Pass
9 B A B D Pass
10 B D B D Fail
11 C C C D Fail
12 B D C C Pass
13 D C C A Fail
14 B A A B Pass
15 A B C C Fail
16 A C B A Fail
17 B D B C Fail
18 B A A B Pass
19 C D B A Fail
20 D D B B Pass
进一步的有关于步骤三中构建随机森林预测所使用的数据,对学生与教师风格数据中各类特征进行编码后,数据集的维数分别为50维与18维。分别将前48维与16维作为随机森林的输入特征,将后两维作为输出目标。
其中U1代表教师风格数据集和学生期末成绩,U2代表学生特征和学生期末成绩。
Xteac her的维数为T维,Xstudents的维数为S维,即T=16,S=48。R为最终学生成绩分类数据集,在本例中学生成绩为Pass、Fail二元分类,因此R的维数为2。IT与IS为两待测样本数据集,n代表原数据集中的样本个数,即在此例中n=20。
进一步的有关于步骤三中建立随机森林模型:
随机森林的核心思想在于通过构建大量的弱分类器,最终通过投票的方式得到最终分类,随机森林基分类器的决策树生成算法包括CART、ID3、C4.5。CART相较于其他两种优势在于不仅可以进行分类,也可以进行回归,因此也可以在该领域做出推广。本专利以二元分类举例,可推广至多元分类。
本发明采用CART算法生成随机森林基分类器,以学生特征和学生成绩样本集为例,其详细流程如下:
(1)将U2划分为训练集Train2和测试集Test2,训练集与预测集均具有S=50维特征。
(2)设共生成Ntree棵CART分类树,每棵树的深度设为Deep。Deep为初始值,值为NULL。
(3)每个节点使用s维特征,当某一节点包含样本数最少并且信息增益最少时,该节点停止分裂。本例中,取Ntree为20,s维取(可选择效果最好的一个)。
(4)从训练集中有放回地采样形成Train2(j),表示第j棵CART分类树的训练集,其中,j=1,2,3,,10,从根节点开始训练。
(5)如果当前节点上达到终止条件,则设置当前节点为叶子节点。该叶子节点的预测输出为当前节点样本集合中数量最多的那一类,概率p为该类别占当前样本集的比例。
(6)如果当前节没有达到终止条件,则从S维特征中无放回的随机选取s维特征。利用这s维特征,寻找分类效果最好的一维特征k及其阈值value,当前节点上样本第k维特征小于value的样本被划分到左节点,其余的被划分到右节点。继续训练其他节点。在寻找最佳的分类特征和阈值时,评判标准为:argmax(Gini-GiniLeft-GiniRight),即寻找最佳的特征k和阈值value,使得当前节点的Gini值减去左子节点的Gini和右子节点的Gini值最大。
(7)重复(4)(5)(6)直到所有节点都训练过了或者被标记为叶子节点。
(8)重复(4)(5)(6)(7)直到所有CART分类树都被训练过。生成随机森林学生特征预测学生成绩的随机森林模型
教师风格的随机森林模型训练流程同上(1)-(8)。
进一步的步骤四输入待预测成绩学生的规范数据,包括学生特征数据、教师风格数据和学生自效能数据,根据训练好的模型进行预测,最终在显示单元输出预测成绩结果。
其中xteac her属于教师风格数据集,即IT
其中xstudents属于学生特征数据集,即IS
其中xpredict包括xteac her与xstudents两类数据。
pi(xteac her)与qi(xstudents)分别代表第i颗决策树对教师风格与学生特征的待测样本的预测结果。vote()函数代表每颗决策树的投票结果。majority()函数代表取经过权重处理后所有决策树投票结果最多的分类。树的集合P={pi,i=1,2,…,Ntree},Q={qi,i=1,2,…,Ntree}和待测样本的分类,Ntree代表决策树的个数。f(xpredict)即为该样本的预测结果。

Claims (4)

1.引入教师教学风格的多维度预测学生成绩的方法,其特征在于,包括如下步骤:
步骤一:数据收集,待收集的数据包括学生特征数据、学生成绩、教师风格数据和学生自效能数据;其中学生特征数据和学生成绩从教学系统中导出,教师风格数据和学生自效能数据通过向学生发布调查问卷的形式分别收集;
步骤二:将步骤一收集到的数据进行数据处理规范化后传输至数据库中;将学生自效能数据进行转化,计算教师风格与学生特征分别对学生成绩的影响因子ω1与ω2
ω2=1-ω1
其中,gi(i=1,2,...,n)代表学生自效能问卷中每道题目的得分,将问卷所得分数归一化至目标区间[a,b],其中参数a,b设定取值范围为[0,0.3]且a<b,ω1与ω2分别代表教师风格数据与学生特征数据对学生成绩的影响权值,因此ω1的取值区间为[0,0.3],ω2的取值区间为[0.7,1);
步骤三:使用规范化后的学生特征数据和教师风格数据这两类数据,分别与学生成绩作为组合,划分为两类数据集;每类数据集拆分成为训练集和测试集;随后使用随机森林对训练集进行模型训练,将测试集输入训练结果调试模型,最终每类数据分别生成随机森林预测分类模型;将步骤二中,计算的影响因子分别代入对应数据模型中,最终按照影响因子权值分别乘以两个随机森林模型的投票结果,得到最终投票结果;
教师风格数据集U1及学生特征数据集U2
Xteacher的维数为T维,Xstudents的维数为S维,R为最终学生成绩分类;IT与IS为两待测样本数据集,n代表原数据集中的样本个数;
其中xteacher属于教师风格数据集,即IT
其中xstudents属于学生特征数据集,即IS
其中xpredict包括xteacher与xstudents两类数据;
pi(xteacher)与qi(xstudents)分别代表第i颗决策树对教师风格与学生特征的待测样本的预测结果;vote()函数代表每颗决策树的投票结果;majority()函数代表取经过权重处理后所有决策树投票结果最多的分类;树的集合P={pi,i=1,2,...,Ntree},Q={qi,i=1,2,...,Ntree}和待测样本的分类,Ntree代表决策树的个数;
步骤四:输入待预测成绩学生的规范数据,包括学生特征数据、教师风格数据和学生自效能数据,根据训练好的模型进行预测,最终在显示单元输出预测成绩结果。
2.根据权利要求1所述的引入教师教学风格的多维度预测学生成绩的方法,其特征在于,步骤二,将步骤一收集到的数据进行数据处理规范化后传输至数据库中,具体步骤如下:
2.1)将学生特征数据、学生成绩、教师风格数据和学生自效能数据整合到数据库中;
2.2)对数据中非数值变量进行独热编码;
2.3)对于数据中存在缺失的数据进行处理,若缺失的数据信息不超过全部数据信息的0.2%,则将这些缺失数据信息直接标记为0;若缺失数据信息超过0.2%,则对缺失数据进行数据补全;
2.4)对数据进行分析,识别离群点并平滑噪声数据;对数据进行异常值分析,采用3σ原则,如果数据服从正态分布,则数据中标准差超过3σ的值被认定为异常值,采用回归法消除噪音数据:使用拟合数据函数光滑数据。
3.根据权利要求2所述的引入教师教学风格的多维度预测学生成绩的方法,其特征在于,对缺失数据进行数据补全采用多重插补方法。
4.根据权利要求1或2所述的引入教师教学风格的多维度预测学生成绩的方法,其特征在于,步骤三,建立得到两个随机森林预测分类模型,具体包括以下步骤:
从学生特征数据所包含的n个样本中,以有放回随机选取k个样本,利用所选择的k个样本来训练生成一颗决策树;当决策树的每个节点需要分裂时,随机从数据中所包含的S个变量中选取s个变量,其中,s<<S;然后,从选取出的s个变量中,采用基尼指数来选取一个变量作为对应节点的分裂变量;
再从教师风格特征数据所包含的N个样本中,选择上一步骤中相同的k个样本;当决策树的每个节点需要分裂时,随机从数据中所包含的T个变量中选取t个变量,其中,t<<T;然后,从选取出的t个变量中,采用基尼指数来选取一个变量作为对应节点的分裂变量。
CN201910347207.9A 2019-04-28 2019-04-28 引入教师教学风格的多维度预测学生成绩的方法 Expired - Fee Related CN110070232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910347207.9A CN110070232B (zh) 2019-04-28 2019-04-28 引入教师教学风格的多维度预测学生成绩的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910347207.9A CN110070232B (zh) 2019-04-28 2019-04-28 引入教师教学风格的多维度预测学生成绩的方法

Publications (2)

Publication Number Publication Date
CN110070232A true CN110070232A (zh) 2019-07-30
CN110070232B CN110070232B (zh) 2021-06-18

Family

ID=67369185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910347207.9A Expired - Fee Related CN110070232B (zh) 2019-04-28 2019-04-28 引入教师教学风格的多维度预测学生成绩的方法

Country Status (1)

Country Link
CN (1) CN110070232B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626252A (zh) * 2020-06-02 2020-09-04 北京中广上洋科技股份有限公司 一种教学视频分析方法及装置
CN111627289A (zh) * 2020-05-27 2020-09-04 西北工业大学 一种导航雷达模拟训练效果评价方法
CN113706195A (zh) * 2021-08-26 2021-11-26 东北大学秦皇岛分校 一种基于两阶段组合的在线消费行为预测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020184215A1 (en) * 2001-05-31 2002-12-05 International Business Machines Corporation Aligning learning capabilities with teaching capabilities
CN101419758A (zh) * 2008-12-12 2009-04-29 天津师范大学 学习能力测试设备
CN101901555A (zh) * 2010-07-30 2010-12-01 政高有限公司 学习能力检测系统及其方法
CN103930939A (zh) * 2011-03-21 2014-07-16 Learn-Bop有限公司 学习行为优化方案
US20160379243A1 (en) * 2015-06-23 2016-12-29 Bidtellect, Inc. Method and system for forecasting a campaign performance using predictive modeling
CN106408475A (zh) * 2016-09-30 2017-02-15 中国地质大学(北京) 一种在线课程适用性评价方法
CN109255998A (zh) * 2018-10-25 2019-01-22 杭州数理大数据技术有限公司 一种学生成绩诊断提升系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020184215A1 (en) * 2001-05-31 2002-12-05 International Business Machines Corporation Aligning learning capabilities with teaching capabilities
CN101419758A (zh) * 2008-12-12 2009-04-29 天津师范大学 学习能力测试设备
CN101901555A (zh) * 2010-07-30 2010-12-01 政高有限公司 学习能力检测系统及其方法
CN103930939A (zh) * 2011-03-21 2014-07-16 Learn-Bop有限公司 学习行为优化方案
US20160379243A1 (en) * 2015-06-23 2016-12-29 Bidtellect, Inc. Method and system for forecasting a campaign performance using predictive modeling
CN106408475A (zh) * 2016-09-30 2017-02-15 中国地质大学(北京) 一种在线课程适用性评价方法
CN109255998A (zh) * 2018-10-25 2019-01-22 杭州数理大数据技术有限公司 一种学生成绩诊断提升系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
余悦: "教师教学风格对学生学习成绩的影响:学业自我效能感、学习兴趣的中介作用", 《中国优秀硕士学位论文全文数据库社会科学Ⅱ辑》 *
许可: "英语教师个性特征与学生学习成绩的相关性研究", 《沧州师范学院学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627289A (zh) * 2020-05-27 2020-09-04 西北工业大学 一种导航雷达模拟训练效果评价方法
CN111626252A (zh) * 2020-06-02 2020-09-04 北京中广上洋科技股份有限公司 一种教学视频分析方法及装置
CN111626252B (zh) * 2020-06-02 2023-04-07 北京中广上洋科技股份有限公司 一种教学视频分析方法及装置
CN113706195A (zh) * 2021-08-26 2021-11-26 东北大学秦皇岛分校 一种基于两阶段组合的在线消费行为预测方法及系统
CN113706195B (zh) * 2021-08-26 2023-10-31 东北大学秦皇岛分校 一种基于两阶段组合的在线消费行为预测方法及系统

Also Published As

Publication number Publication date
CN110070232B (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN109299372A (zh) 一种基于协同过滤的智慧选课推荐方法
CN110070232A (zh) 引入教师教学风格的多维度预测学生成绩的方法
CN110532379A (zh) 一种基于lstm的用户评论情感分析的电子资讯推荐方法
CN108256102A (zh) 一种基于聚类的独立学院学生评教数据分析方法
Nayak et al. Participation in self-help groups and empowerment of women: A structural model analysis
Comendador et al. An educational model based on Knowledge Discovery in Databases (KDD) to predict learner's behavior using classification techniques
Lütfi et al. Determining the factors that affect the satisfaction of students having undergraduate tourism education with the department by means of the method of classification tree
CN106168952A (zh) 学系选择系统及其方法
Shingari et al. A review of applications of data mining techniques for prediction of students’ performance in higher education
CN106202377A (zh) 一种基于随机梯度下降的在线协同排序方法
Zhang et al. [Retracted] Decision Tree Algorithm‐Based Model and Computer Simulation for Evaluating the Effectiveness of Physical Education in Universities
Siddiqui et al. ANALYZING STUDENTS'ACADEMIC PERFORMANCE THROUGH EDUCATIONAL DATA MINING.
Adak et al. An elective course suggestion system developed in computer engineering department using fuzzy logic
Xiongjun et al. [Retracted] The Evaluation of Music Teaching in Colleges and Universities Based on Machine Learning
Rusydiyah et al. Clustering of learning media user data during Covid-19 Pandemic using K-Means method based on multicultural culture in Indonesia
Fong et al. An automated university admission recommender system for secondary school students
CN110163495A (zh) 一种多维综合大学发展评价指标体系的评估方法
Huang et al. A discussion on the user intention of golfers toward golf GPS navigation
Algur et al. Educational data mining: RT and RF classification models for higher education professional courses
Shibli et al. Machine learning-based predictive modeling of student counseling gratification: a case study of Aligarh Muslim University
CN116011856A (zh) 基于情感分析的在线课程质量评价系统及方法
Liu et al. Dynamic Assessment and Prediction in Online Learning: Exploring the Methods of Collaborative Filtering in a Task Recommender System.
Wang et al. Construction and analysis of discrete system dynamic modeling of physical education teaching mode based on decision tree algorithm
CN114580912A (zh) 一种基于知识距离的项目式学习分组方法及装置
Kong et al. [Retracted] Construction and Application of Physical Education Teacher Literacy Evaluation System Based on Grey Relational Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210618