CN112115357B - 一种在线课程论坛交互模式识别方法及系统 - Google Patents
一种在线课程论坛交互模式识别方法及系统 Download PDFInfo
- Publication number
- CN112115357B CN112115357B CN202010955009.3A CN202010955009A CN112115357B CN 112115357 B CN112115357 B CN 112115357B CN 202010955009 A CN202010955009 A CN 202010955009A CN 112115357 B CN112115357 B CN 112115357B
- Authority
- CN
- China
- Prior art keywords
- forum
- students
- posting
- course
- teacher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title abstract description 16
- 230000007774 longterm Effects 0.000 claims abstract description 33
- 238000012216 screening Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 82
- 230000002452 interceptive effect Effects 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000003909 pattern recognition Methods 0.000 claims description 8
- 238000012567 pattern recognition method Methods 0.000 claims description 7
- 230000006399 behavior Effects 0.000 description 64
- 235000019580 granularity Nutrition 0.000 description 22
- 238000000605 extraction Methods 0.000 description 12
- 238000011160 research Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000007621 cluster analysis Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012482 interaction analysis Methods 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种在线课程论坛交互模式识别方法及系统,包括:获取在线课程论坛中学生发帖、回帖、跟帖、教师发帖、回帖以及跟帖的长期数据和短期数据;根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛。本发明可以帮助教学研究人员快速识别和分析某个论坛。
Description
技术领域
本发明属于在线课程分析技术领域,更具体地,涉及一种在线课程论坛交互模式识别方法及系统。
背景技术
线上课程已经成为了学生教育的重要部分,是加强学生自学能力,减轻教师负担的重要途径。课程论坛是在线开放课程师生交互的重要渠道,教师的交互思路与其设计有关系,因此不同的论坛的数量与帖数的结果不同,例如,教师布置若干交互式作业,教师要求某几个小组展开讨论,教师要求学生展开讨论自由发挥等等。仅仅看帖数或者数量很难知道教师的教学设计。相关的测量与分析成为在线教育数据分析研究的热点。同时,对在线课程论坛进行合理准确的分析可以帮助学生更好地交流和提问问题,更加有效率地解决学习中遇到的困难。
以往对在线课程论坛的分析主要集中在主题分类方面,研究方法多是用自然语言处理或者文本分析的技术,提取论坛文本的关键词,然后利用关键词构建文本特征对论坛主题进行分类。单一主题的分类研究很难对论坛整体情况分析透彻。而事实是论坛有着它的教学设计,比如任务型论坛,自由型论坛等。
我国现有的论坛研究都是对论坛的文本内容进行研究,而论坛的教学设计在目前的研究领域没有人研究。通过对在线学习平台论坛数据的初步分析发现相同学科内不同课程的论坛交互模式有所不同。从我国在线课程的论坛发帖行为来看,可以分为教师引导的任务型论坛和学习者讨论为主的自由型论坛。不同模式论坛的帖数规模也存在较大的差异性,论坛交互模式的识别是分析教师线上教学活动组织风格和特色的有效手段,也是合理评估课程质量的前提条件。然而,现有关于论坛交互分析的研究,缺乏对论坛交互模式的识别。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种在线课程论坛交互模式识别方法及系统,旨在解决现有关于论坛交互分析的研究,缺乏对论坛交互模式的识别的问题。
为实现上述目的,第一方面,本发明提供了一种在线课程论坛交互模式识别方法,包括如下步骤:
获取在线课程论坛中学生发帖、学生回帖、学生跟帖、教师发帖、教师回帖以及教师跟帖的长期数据和短期数据;其中,所述长期数据指的是课程总周期内的发帖、回帖以及跟帖总数,每个星期内的发帖和回帖总数,发帖和回帖最多的星期,发帖和回帖最多日期与开课时间的间隔,发帖和回帖最多日期对应帖子量;所述短期数据指的是将课程总周期划分为预设段数的课程,每段课程中的发帖量、回帖量以及跟帖量;
根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;
基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;
根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将所述在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛。
在一个可能的实施例中,将在线课程论坛的交互模式划分的规则具体为:
若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上吻合,则将该活跃学生设为第一类学生;当所述第一类学生的数量占在线课程论坛中学生总数量的比例超过第一预设比例时,判断所述在线课程论坛的交互模式为任务型论坛;
若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量超过给定门限,则将该活跃学生设为第二类学生;当所述第二类学生的数量占在线课程论坛中学生总数量的比例超过第二预设比例时,判断所述在线课程论坛的交互模式为自主型论坛;
若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量未超过给定门限,则将该活跃学生设为第三类学生;当所述第三类学生的数量占在线课程论坛中学生总数量的比例超过第三预设比例时,判断所述在线课程论坛的交互模式为引导型论坛;
若没有活跃学生的短期数据聚类成功,但活跃学生的数量占在线课程论坛中学生总数量的比例超过第四预设比例时,判断所述在线课程论坛的交互模式为自由型论坛。
在一个可能的实施例中,当判断所述在线课程论坛的交互模式是否为任务型论坛时,按照每段课程对应的时间粒度上的回帖量和跟帖量进行聚类;当判断所述在线课程论坛的交互模式是否为引导型论坛时,按照每段课程对应的时间粒度上的发帖量进行聚类;当判断所述在线课程论坛的交互模式是否为自主型论坛时,按照每段课程对应的时间粒度上的发帖量和回帖量进行聚类;当判断所述在线课程论坛的交互模式是否为自由型论坛时,按照每段课程对应的时间粒度上的发帖量、回帖量以及跟帖量中的至少一个进行聚类。
在一个可能的实施例中,所述学生发帖、学生回帖以及学生跟帖的长期数据包括:课程总周期内学生的总发帖数、课程总周期内学生的总回帖数、课程总周期内学生的总跟帖数、课程总周期内学生回学生的贴数、课程总周期内学生回教师的贴数、学生发帖最多的星期、学生发帖最少的星期、学生回帖最多的星期、学生回帖最少的星期、发帖最密集的星期(发帖最多可以是一个人发很多帖子,发帖密集则是很多人在那个星期发帖子)、学生发帖量最多的日期与开课时间的间隔、学生发帖量最多的日期的发帖量、学生回帖量最多的日期与开课时间的间隔以及学生回帖量最多的日期的回帖量;
所述教师发帖、教师回帖以及教师跟帖的长期数据包括:课程总周期内教师的总发帖数、课程总周期内教师的总回帖数、课程总周期内教师的总跟帖数、课程总周期内教师回学生的贴数、课程总周期内教师回教师的贴数、教师发帖最多的星期、教师发帖最少的星期、教师回帖最多的星期,教师回帖最少的星期、教师发帖量最多的星期与开课时间的间隔、教师发帖量最多的日期的发帖量、教师回帖量最多的日期与开课时间的间隔以及教师回帖量最多的日期的回帖量。
在一个可能的实施例中,所述学生发帖、学生回帖以及学生跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录学生的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上学生的发帖总数、回帖总数以及跟帖总数依次排列生成对应的学生行为向量;
所述教师发帖、教师回帖以及教师跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录教师的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上教师的发帖总数、回帖总数以及跟帖总数依次排列生成对应的教师行为向量。
第二方面,本发明提供一种在线课程论坛交互模式识别系统,包括:
数据获取单元,用于获取在线课程论坛中学生发帖、学生回帖、学生跟帖、教师发帖、教师回帖以及教师跟帖的长期数据和短期数据;其中,所述长期数据指的是课程总周期内的发帖、回帖以及跟帖总数,每个星期内的发帖和回帖总数,发帖和回帖最多的星期,发帖和回帖最多日期与开课时间的间隔,发帖和回帖最多日期对应帖子量;所述短期数据指的是将课程总周期划分为预设段数的课程,每段课程中的发帖量、回帖量以及跟帖量;
活跃学生筛选单元,用于根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;
活跃学生聚类单元,用于基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;
论坛模式分析单元,用于根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将所述在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛。
在一个可能的实施例中,所述论坛模式分析单元将在线课程论坛的交互模式划分的规则具体为:若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上吻合,则将该活跃学生设为第一类学生;当所述第一类学生的数量占在线课程论坛中学生总数量的比例超过第一预设比例时,判断所述在线课程论坛的交互模式为任务型论坛;若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量超过给定门限,则将该活跃学生设为第二类学生;当所述第二类学生的数量占在线课程论坛中学生总数量的比例超过第二预设比例时,判断所述在线课程论坛的交互模式为自主型论坛;若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量未超过给定门限,则将该活跃学生设为第三类学生;当所述第三类学生的数量占在线课程论坛中学生总数量的比例超过第三预设比例时,判断所述在线课程论坛的交互模式为引导型论坛;若没有活跃学生的短期数据聚类成功,但活跃学生的数量占在线课程论坛中学生总数量的比例超过第四预设比例时,判断所述在线课程论坛的交互模式为自由型论坛。
在一个可能的实施例中,所述活跃学生聚类单元用于当判断所述在线课程论坛的交互模式是否为任务型论坛时,按照每段课程对应的时间粒度上的回帖量和跟帖量进行聚类;当判断所述在线课程论坛的交互模式是否为引导型论坛时,按照每段课程对应的时间粒度上的发帖量进行聚类;当判断所述在线课程论坛的交互模式是否为自主型论坛时,按照每段课程对应的时间粒度上的发帖量和回帖量进行聚类;以及当判断所述在线课程论坛的交互模式是否为自由型论坛时,按照每段课程对应的时间粒度上的发帖量、回帖量以及跟帖量中的至少一个进行聚类。
在一个可能的实施例中,所述数据获取单元获取的学生发帖、学生回帖以及学生跟帖的长期数据包括:课程总周期内学生的总发帖数、课程总周期内学生的总回帖数、课程总周期内学生的总跟帖数、课程总周期内学生回学生的贴数、课程总周期内学生回教师的贴数、学生发帖最多的星期、学生发帖最少的星期、学生回帖最多的星期、学生回帖最少的星期、发帖最密集的星期(发帖最多可以是一个人发很多帖子,发帖密集则是很多人在那个星期发帖子)、学生发帖量最多的日期与开课时间的间隔、学生发帖量最多的日期的发帖量、学生回帖量最多的日期与开课时间的间隔以及学生回帖量最多的日期的回帖量;
所述数据获取单元获取的教师发帖、教师回帖以及教师跟帖的长期数据包括:课程总周期内教师的总发帖数、课程总周期内教师的总回帖数、课程总周期内教师的总跟帖数、课程总周期内教师回学生的贴数、课程总周期内教师回教师的贴数、教师发帖最多的星期、教师发帖最少的星期、教师回帖最多的星期,教师回帖最少的星期、教师发帖量最多的星期与开课时间的间隔、教师发帖量最多的日期的发帖量、教师回帖量最多的日期与开课时间的间隔以及教师回帖量最多的日期的回帖量。
在一个可能的实施例中,所述数据获取单元获取的学生发帖、学生回帖以及学生跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录学生的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上学生的发帖总数、回帖总数以及跟帖总数依次排列生成对应的学生行为向量;
所述数据获取单元获取的教师发帖、教师回帖以及教师跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录教师的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上教师的发帖总数、回帖总数以及跟帖总数依次排列生成对应的教师行为向量。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
本发明提供一种在线课程论坛交互模式识别方法及系统,从学生的发帖、回帖、跟帖、教师发帖、回帖以及跟帖的长期数据和短期数据入手,覆盖度较广,结果可信度高;随后优选的使用k均值聚类算法,对长期数据中活跃的学生的短期数据进行聚类,聚类结果较为明显,可以较好的把行为相似的活跃学生进行聚类;最终综合考虑教师行为向量和学生行为向量的相似性,算出各种类型的学生在论坛中的比例,得到的结果对教师和学生在论坛中行为刻画更加深刻。
附图说明
图1是本发明提供的在线课程论坛交互模式识别方法流程图;
图2是本发明实施例提供的学习者行为向量的聚类结果示意图;
图3是本发明提供的在线课程论坛交互模式识别系统架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明公开了一种在线课程论坛交互模式的分析系统,属于教育信息化应用领域。包括:学习者交互行为特征提取模块,描述学生行为向量;教师交互行为特征提取模块,描述教师行为向量;论坛交互模式分析模块,进一步分析学生行为模式教师行为模式以及论坛交互模式。本发明通过对在线课程论坛日志数据处理,自动生成学生行为向量,教师行为向量,对向量进行聚类分析进而计算把学生和教师分为多个大类,然后通过人工校验的方法对分类进行再次划分,进而识别在线课程论坛的交互模式,具有很强的适用性,可以用于使得识别各类在线课程论坛的模式。
本发明的结果可以帮助教学研究人员快速识别和分析某个论坛中的教学方案和设计,对于评价和认识论坛中的部分内容和帖数有辅助支撑作用。在各种论坛分析中间可以先实行本方案,对论坛进行模式识别,然后在模式分类中的内容进行进一步的分析,这样有利于获得师生交互中更详细的特征。
本发明针对论坛的教学设计部分进行相关研究。我们在论坛教学设计这方面独立提出了论坛的交互模式这个概念,可能若干种交互模式在同一个论坛中都出现,这种情况为论坛的多模式交互,如果论坛中一种交互模式出现的比例大于一个阈值,则会把这个论坛识别为这种交互模式下的论坛也就是单一模式下的论坛交互。
图1是本发明提供的在线课程论坛交互模式识别方法流程图,如图1所示,包括如下步骤:
S110,获取在线课程论坛中学生发帖、学生回帖、学生跟帖、教师发帖、教师回帖以及教师跟帖的长期数据和短期数据;其中,所述长期数据指的是课程总周期内的发帖、回帖以及跟帖总数,每个星期内的发帖和回帖总数,发帖和回帖最多的星期,发帖和回帖最多日期与开课时间的间隔,发帖和回帖最多日期对应帖子量;所述短期数据指的是将课程总周期划分为预设段数的课程,每段课程中的发帖量、回帖量以及跟帖量;
S120,根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;
S130,基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;
S140,根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将所述在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛。
在一个可能的实施例中,将在线课程论坛的交互模式划分的规则具体为:
若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上吻合,则将该活跃学生设为第一类学生;当所述第一类学生的数量占在线课程论坛中学生总数量的比例超过第一预设比例时,判断所述在线课程论坛的交互模式为任务型论坛;
若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量超过给定门限,则将该活跃学生设为第二类学生;当所述第二类学生的数量占在线课程论坛中学生总数量的比例超过第二预设比例时,判断所述在线课程论坛的交互模式为自主型论坛;
若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量未超过给定门限,则将该活跃学生设为第三类学生;当所述第三类学生的数量占在线课程论坛中学生总数量的比例超过第三预设比例时,判断所述在线课程论坛的交互模式为引导型论坛;
若没有活跃学生的短期数据聚类成功,但活跃学生的数量占在线课程论坛中学生总数量的比例超过第四预设比例时,判断所述在线课程论坛的交互模式为自由型论坛。
在一个可能的实施例中,当判断所述在线课程论坛的交互模式是否为任务型论坛时,按照每段课程对应的时间粒度上的回帖量和跟帖量进行聚类;当判断所述在线课程论坛的交互模式是否为引导型论坛时,按照每段课程对应的时间粒度上的发帖量进行聚类;当判断所述在线课程论坛的交互模式是否为自主型论坛时,按照每段课程对应的时间粒度上的发帖量和回帖量进行聚类;当判断所述在线课程论坛的交互模式是否为自由型论坛时,按照每段课程对应的时间粒度上的发帖量、回帖量以及跟帖量中的至少一个进行聚类。
在一个可能的实施例中,所述学生发帖、学生回帖以及学生跟帖的长期数据包括:课程总周期内学生的总发帖数、课程总周期内学生的总回帖数、课程总周期内学生的总跟帖数、课程总周期内学生回学生的贴数、课程总周期内学生回教师的贴数、学生发帖最多的星期、学生发帖最少的星期、学生回帖最多的星期、学生回帖最少的星期、发帖最密集的星期(发帖最多可以是一个人发很多帖子,发帖密集则是很多人在那个星期发帖子)、学生发帖量最多的日期与开课时间的间隔、学生发帖量最多的日期的发帖量、学生回帖量最多的日期与开课时间的间隔以及学生回帖量最多的日期的回帖量;
所述教师发帖、教师回帖以及教师跟帖的长期数据包括:课程总周期内教师的总发帖数、课程总周期内教师的总回帖数、课程总周期内教师的总跟帖数、课程总周期内教师回学生的贴数、课程总周期内教师回教师的贴数、教师发帖最多的星期、教师发帖最少的星期、教师回帖最多的星期,教师回帖最少的星期、教师发帖量最多的星期与开课时间的间隔、教师发帖量最多的日期的发帖量、教师回帖量最多的日期与开课时间的间隔以及教师回帖量最多的日期的回帖量。
在一个可能的实施例中,所述学生发帖、学生回帖以及学生跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录学生的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上学生的发帖总数、回帖总数以及跟帖总数依次排列生成对应的学生行为向量;
所述教师发帖、教师回帖以及教师跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录教师的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上教师的发帖总数、回帖总数以及跟帖总数依次排列生成对应的教师行为向量。
本发明提供的在线课程论坛交互模式识别系统的数据流如下:本发明的技术方案中设计到的整个系统,依据具体功能进行划分,整个系统可以分为三个模块:学习者交互行为特征提取模块,教师交互行为特征提取模块,论坛交互模式分析模块。其中:
(1)学习者交互行为特征提取模块
该模块把能够反映自身特征的量和与教师交互的量体现在特征向量中间。在这组向量中,分为长期数据和短期数据两个类别。长期数据包括:总发帖数,总回帖数,总跟帖数,学生的总发帖量,学生的总跟帖数,学生回教师贴数,学生回学生贴数,每个星期的跟帖数以及最多和最少的发帖回帖的星期,发帖最密集的星期,发帖量最多的日期与开课时间的间隔(天)、发帖量最多的日期的发帖量、回帖量最多的日期与开课时间的间隔(天)、回帖量最多的日期的回帖量。
短期数据首先对整个教学时间长度进行均匀量化,量化等级可以由人来订制,比如一个二十周的课量化为五段,也可以量化成十段,也可以量化为八段,根据课程的不同来选取不同的量化等级。在每个量化的单位时间上记录学生的发帖总数,回帖总数,总跟帖数。最终生成一个N维的行为向量,可以表示为Z(z1,z2,z3,.....,zN)。其中,N为大于1的整数,zi表示学生行为向量的第i个元素,1≤i≤N,i为整数。
(2)教师交互行为特征提取模块
设计了一种教师行为向量,在这组向量中,分为长期数据和短期数据两个类别。长期数据为教师总回帖数,教师发帖总数,教师发帖最多星期数,教师回帖最多星期数。
短期数据首先对整个教学时间长度进行均匀量化,量化等级可以由人来定,根据课程的不同来选取不同的量化等级。在每个量化的单位时间上记录教师的发帖数,教师回帖数,跟帖总数。最终生成一个长度与学生行为向量长度相同的一个向量X(x1,x2,x3,......,xN),其中xi表示教师行为向量的第i个元素。
(3)论坛交互模式分析模块
论坛交互模式分析模块步骤如下:
(a)对学生的特征向量进行初步筛选
首先对学生的特征向量中的长期向量中的值设定门限,来筛选出论坛中活跃的学生。比如设定门限总发帖数大于5,总回帖数大于5,发帖时间间隔小于一周等等。
(b)对活跃的学生进行聚类
在(a)中活跃的学生中选择相关短期数据进行聚类,比如选取短期数据中每个时间粒度内的发帖量进行聚类。优选的采用k均值聚类进行聚类,其步骤是,预将数据分为k组,则随机选取k个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。
(c)设定门限对聚类再次筛选
使用k均值聚类算法的时候,会得到若干类别,计算出每个类别最边缘的向量与质心向量之间的距离,设定门限筛选掉最松散的类别。比如设定门限为3个(可以更改),在(b)中得到类别里如果边缘向量与质心向量之间的帖数距离相隔3个(可以更改)以下,则认为这个聚类比较紧凑。
(d)学生的模式与教师的模式综合分析
通过对学生特征向量与教师特征向量进行综合分析,判断得出他们之间是否具有学习任务,这种学习任务既包括显性的学习任务如对教师的回帖,也包括隐性的学习任务如教师口头要求学生进行小组讨论。若存在则课判别为任务型。比如结果判断为任务型学生(教师布置作业后学生按时发帖)和引导型学生(教师课堂上布置讨论后学生某天集中发帖)。
(e)打印出论坛数据报告
首先从(a)中可以得到词条,论坛的活跃比例。随后根据学生向量中不同的短期数据,重复步骤(b)(c)(d)生成不同的词条,最终打印出论坛数据报告。比如根据短期数据中的学生发帖数,可以得到字段,任务型学生的比例。根据短期数据中的学生发帖时间,可以得到字段,学生最活跃的星期等。
(f)判断论坛形式
根据论坛数据报告,最终判断论坛的形式。
1.任务型论坛
活跃的学生聚类成功,并且在发帖时间曲线上与教师发帖时间曲线吻合,同时这类学生在论坛中占的比例大于50%则判断为任务型论坛。
2.自主型论坛
活跃的学生聚类成功,发帖时间曲线与教师发帖时间曲线不符,学生回学生的帖数超过给定门限,同时这类学生在论坛中的比例大于50%则判断为自主型论坛。
3.引导型论坛
活跃的学生聚类成功,发帖时间曲线上与教师发帖时间曲线不符,学生回学生回帖数未超过给定门限,同时这类学生在论坛中的比例大于50%则判定为引导型论坛。
4.自由型论坛
活跃的学生聚类不成功,但活跃的学生在论坛中占的比例大于50%则判定为自由型论坛。
可以理解的是,面向在线课程论坛研究者需要在论坛分析时需要识别论坛交互模式的需求,本发明公开了一种在线论坛交互模式识别系统,依据具体功能进行划分,整个系统可以划分为:学习者交互行为特征提取模块,教师交互行为特征提取模块,论坛交互模式分析模块。
(1)学习者交互行为特征提取模块
交互行为模块,用于对读取到的在线课程论坛中学习者基于相应特征进行描述。
为了更全面的描述学习者论坛交互行为,设计了三组向量:学习者整体行为向量、学习者发帖进度行为向量和师生互动向量。下面介绍使用这三组向量对学习者交互行为的流程。
a.学习者整体行为向量
学习者整体行为向量特征为总发帖量、总回帖量、回教师帖数和、回学习者帖数和、发帖量最多的日期与开课时间的间隔(天)、发帖量最多的日期的发帖量、回帖量最多的日期与开课时间的间隔(天)、回帖量最多的日期的回帖量,假设向量为Z,对每一个特征使用zi表示,则学习者整体行为向量表示为Z(z1,z2,…,z8)。
b.学习者发帖进度行为向量
在线课程中,学习者会随着课程的进行,对存在的问题在论坛中发帖进行互动讨论,要了解所有学习者发帖进度之间的关系,就需要对每个学习者的发帖进度进行描述,在本文中使用对教学时间进行均匀量化来生成均匀的时间粒度,再对每个时间粒度进行分析。
由于不同的学习者,其所在课程的时间是相同的,因此可以设学习者发帖互动进度向量X的维度为N,对课程的时间进行N等份的均匀量化。例课程时长为20周如N为5时,每隔4周划分一个时间粒度,然后对每周的学生行为向量做分析,则可以生成学习者发帖进度向量X(x1,x2,x3,x4,x5)。
c.师生互动向量
在在线论坛中还有一种学习者行为,那就是与教师之间的互动行为,在本文中由于是要描述学习者的交互行为,因此只考虑教师发帖后学习者回复的情况。对于师生互动向量,维度为教师发帖的数量,对教师发帖的数量进行N等份的均匀量化,比如N取5教师发了10个帖子时,则2个帖子一组进行分析,N的取值可以事先人为定义,如果在该教师发帖下学习者没有进行回帖,则这一维特征使用-0.1来表示。
(3)教师交互行为特征提取模块
以周次为时间粒度,统计教师的周论坛行为向量,在这组向量中,分为长期数据和短期数据两个类别。长期数据为教师总回帖数,教师发帖总数,教师发帖最多星期数,交会上回帖最多星期数。短期数据也是首先对整个教学时间长度进行均匀量化,量化等级可以由人来定,根据课程的不同来选取不同的量化等级。在每个量化的单位时间上对教师交互行为的信息进行详细的记录。
(4)论坛交互模式识别模块
论坛交互模式识别模块,使用学习者交互行为特征提取模块得到的学习者征和教师交互行为特征提取模块的教师特征,识别论坛交互模式。
(a)对学生的特征向量进行初步筛选
比如对某学校某学期的课程《中国近现代史纲要》使用聚类分析方法进行论坛交互模式识别,首先通过设定门限发帖数大于5,发帖间隔小于一周对学生进行筛选,把满足条件的学生判定为活跃的学生。
(b)对活跃的学生进行聚类
将课程论坛数据得到的短期数据向量合并成一个向量来表示学习者在论坛中的互动行为。对合成的向量使用k均值聚类,计算聚类类别为2-6时的Calinski-Harabasz评价指数值,选择最大Calinski-Harabasz值对应的聚类数,查看两个类别的质心向量代表的学习者的论坛互动行为。判别质心向量代表的学习者论坛行为是否具有任务性。上述方法可以得到图2所示的学习者行为向量的聚类结果示意图,图2中圆点覆盖的区域和星点覆盖的色区域的质心向量在空间中存在显著距离,它的发帖数量与学生的行为也有明显差异,因此把它们区分为两个类别。
(c)设定门限对聚类再次筛选
对得到的类别进行再次筛选,在一个聚类中,边缘的学生行为向量距离质心向量的距离小于3的时候则判断为这个聚类比较紧凑。当距离大于3的聚类直接判断为聚类失败。
(d)学生的模式与教师的模式综合分析
通过对学生特征向量与教师特征向量进行综合分析,判断得出他们之间是否具有学习任务,这种学习任务既包括显性的学习任务如对教师的回帖,也包括隐性的学习任务如教师口头要求学生进行小组讨论。若存在则课判别为任务型。比如结果判断为任务型学生(教师布置作业后学生按时发帖)和引导型学生(教师课堂上布置讨论后学生某天集中发帖)。具体操作为对教师的行为向量与学生的质心向量进行相似度分析。
(e)打印出论坛数据报告
首先从(a)中可以得到词条,论坛的活跃比例。随后根据学生向量中不同的短期数据,重复步骤(b)(c)(d)生成不同的词条,最终打印出论坛数据报告。比如根据短期数据中的学生发帖数,可以得到字段,任务型学生的比例。根据短期数据中的学生发帖时间,可以得到字段,学生最活跃的星期等。
(f)判断论坛形式
根据论坛数据报告,最终判断论坛的形式。
对应地,本发明提供一种在线课程论坛交互模式识别系统,该系统包括以下过程:
S1:对论坛进行时间上的均匀量化,使用得到的长期数据和短期数据计算出所述三组行为向量描述学习者的论坛互动行为,得到学习者特征向量集;
S2:对学习者特征向量集进行聚类分析,获得各类别的质心向量。
S3:对聚类后的人群进行相似识别,把表现相近的人群进行二次合并;
S4:统计不同类型学习者所在聚类的学习者总数,以及这些学习者群体的总发帖量,计算不同类型学习者的占比,及其发帖量的占比;
S5:使用教师行为向量按照周次为时间粒度描述教师的论坛互动行为,特征,得到教师周行为特征向量;
S6:计算不同周次的周行为特征向量相似度,进而获得相似度的方差;
S7:综合S5和S6的结果识别论坛是否具有显性或者隐性的教师布置任务的行为;
S8:对整个论坛进行成分测算,计算出论坛中各个成分所占的比例;
S9:对S8中得到的结构进行分析,如果论坛中单一成分的比例超过50%则判断该论坛为这种成分的论坛(结果可以叠加比如任务自主型论坛),如果以上四种类型的学生比例都未超过50%,则判定为混合型论坛。
本发明具有很强的适用性,可以用于各类在线课程论坛交互模式识别。
图3是本发明提供的在线课程论坛交互模式识别系统架构图,如图3所示,包括:
数据获取单元310,用于获取在线课程论坛中学生发帖、学生回帖、学生跟帖、教师发帖、教师回帖以及教师跟帖的长期数据和短期数据;其中,所述长期数据指的是课程总周期内的发帖、回帖以及跟帖总数,每个星期内的发帖和回帖总数,发帖和回帖最多的星期,发帖和回帖最多日期与开课时间的间隔,发帖和回帖最多日期对应帖子量;所述短期数据指的是将课程总周期划分为预设段数的课程,每段课程中的发帖量、回帖量以及跟帖量;
活跃学生筛选单元320,用于根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;
活跃学生聚类单元330,用于基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;
论坛模式分析单元340,用于根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将所述在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛。
可以理解的是,图3中各个单元的详细功能可参见前述方法实施例中的介绍,在此不做赘述。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种在线课程论坛交互模式识别方法,其特征在于,包括如下步骤:
获取在线课程论坛中学生发帖、学生回帖、学生跟帖、教师发帖、教师回帖以及教师跟帖的长期数据和短期数据;其中,所述长期数据指的是课程总周期内的发帖、回帖以及跟帖总数,每个星期内的发帖和回帖总数,发帖和回帖最多的星期,发帖和回帖最多日期与开课时间的间隔,发帖和回帖最多日期对应帖子量;所述短期数据指的是将课程总周期划分为预设段数的课程,每段课程中的发帖量、回帖量以及跟帖量;
根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;
基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;
根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将所述在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛;将在线课程论坛的交互模式划分的规则具体为:若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上吻合,则将该活跃学生设为第一类学生;当所述第一类学生的数量占在线课程论坛中学生总数量的比例超过第一预设比例时,判断所述在线课程论坛的交互模式为任务型论坛;若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量超过给定门限,则将该活跃学生设为第二类学生;当所述第二类学生的数量占在线课程论坛中学生总数量的比例超过第二预设比例时,判断所述在线课程论坛的交互模式为自主型论坛;若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量未超过给定门限,则将该活跃学生设为第三类学生;当所述第三类学生的数量占在线课程论坛中学生总数量的比例超过第三预设比例时,判断所述在线课程论坛的交互模式为引导型论坛;若没有活跃学生的短期数据聚类成功,但活跃学生的数量占在线课程论坛中学生总数量的比例超过第四预设比例时,判断所述在线课程论坛的交互模式为自由型论坛。
2.根据权利要求1所述的在线课程论坛交互模式识别方法,其特征在于,
当判断所述在线课程论坛的交互模式是否为任务型论坛时,按照每段课程对应的时间粒度上的回帖量和跟帖量进行聚类;
当判断所述在线课程论坛的交互模式是否为引导型论坛时,按照每段课程对应的时间粒度上的发帖量进行聚类;
当判断所述在线课程论坛的交互模式是否为自主型论坛时,按照每段课程对应的时间粒度上的发帖量和回帖量进行聚类;
当判断所述在线课程论坛的交互模式是否为自由型论坛时,按照每段课程对应的时间粒度上的发帖量、回帖量以及跟帖量中的至少一个进行聚类。
3.根据权利要求1或2所述的在线课程论坛交互模式识别方法,其特征在于,所述学生发帖、学生回帖以及学生跟帖的长期数据包括:课程总周期内学生的总发帖数、课程总周期内学生的总回帖数、课程总周期内学生的总跟帖数、课程总周期内学生回学生的贴数、课程总周期内学生回教师的贴数、学生发帖最多的星期、学生发帖最少的星期、学生回帖最多的星期、学生回帖最少的星期、发帖最密集的星期、学生发帖量最多的日期与开课时间的间隔、学生发帖量最多的日期的发帖量、学生回帖量最多的日期与开课时间的间隔以及学生回帖量最多的日期的回帖量;
所述教师发帖、教师回帖以及教师跟帖的长期数据包括:课程总周期内教师的总发帖数、课程总周期内教师的总回帖数、课程总周期内教师的总跟帖数、课程总周期内教师回学生的贴数、课程总周期内教师回教师的贴数、教师发帖最多的星期、教师发帖最少的星期、教师回帖最多的星期,教师回帖最少的星期、教师发帖量最多的星期与开课时间的间隔、教师发帖量最多的日期的发帖量、教师回帖量最多的日期与开课时间的间隔以及教师回帖量最多的日期的回帖量。
4.根据权利要求1或2所述的在线课程论坛交互模式识别方法,其特征在于,所述学生发帖、学生回帖以及学生跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录学生的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上学生的发帖总数、回帖总数以及跟帖总数依次排列生成对应的学生行为向量;
所述教师发帖、教师回帖以及教师跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录教师的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上教师的发帖总数、回帖总数以及跟帖总数依次排列生成对应的教师行为向量。
5.一种在线课程论坛交互模式识别系统,其特征在于,包括:
数据获取单元,用于获取在线课程论坛中学生发帖、学生回帖、学生跟帖、教师发帖、教师回帖以及教师跟帖的长期数据和短期数据;其中,所述长期数据指的是课程总周期内的发帖、回帖以及跟帖总数,每个星期内的发帖和回帖总数,发帖和回帖最多的星期,发帖和回帖最多日期与开课时间的间隔,发帖和回帖最多日期对应帖子量;所述短期数据指的是将课程总周期划分为预设段数的课程,每段课程中的发帖量、回帖量以及跟帖量;
活跃学生筛选单元,用于根据所述在线课程论坛中学生发帖的数量和发帖的时间间隔筛选出论坛中活跃的学生;
活跃学生聚类单元,用于基于筛选出的每个活跃学生的短期数据,分别按照每段课程对应的时间粒度上的发帖量、回帖量或跟帖量中的至少一个进行聚类;
论坛模式分析单元,用于根据是否有活跃学生的短期数据聚类成功,聚类成功的活跃学生占总活跃学生的比例,以及学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上是否吻合将所述在线课程论坛的交互模式划分为任务型论坛、自主型论坛、引导型论坛或自由型论坛;所述论坛模式分析单元将在线课程论坛的交互模式划分的规则具体为:若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上吻合,则将该活跃学生设为第一类学生;当所述第一类学生的数量占在线课程论坛中学生总数量的比例超过第一预设比例时,判断所述在线课程论坛的交互模式为任务型论坛;若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量超过给定门限,则将该活跃学生设为第二类学生;当所述第二类学生的数量占在线课程论坛中学生总数量的比例超过第二预设比例时,判断所述在线课程论坛的交互模式为自主型论坛;若有活跃学生的短期数据聚类成功,且该活跃学生发帖量的短期数据与教师发帖量的短期数据在时间曲线上不吻合,且学生回学生帖子的数量未超过给定门限,则将该活跃学生设为第三类学生;当所述第三类学生的数量占在线课程论坛中学生总数量的比例超过第三预设比例时,判断所述在线课程论坛的交互模式为引导型论坛;若没有活跃学生的短期数据聚类成功,但活跃学生的数量占在线课程论坛中学生总数量的比例超过第四预设比例时,判断所述在线课程论坛的交互模式为自由型论坛。
6.根据权利要求5所述的在线课程论坛交互模式识别系统,其特征在于,所述活跃学生聚类单元用于当判断所述在线课程论坛的交互模式是否为任务型论坛时,按照每段课程对应的时间粒度上的回帖量和跟帖量进行聚类;当判断所述在线课程论坛的交互模式是否为引导型论坛时,按照每段课程对应的时间粒度上的发帖量进行聚类;当判断所述在线课程论坛的交互模式是否为自主型论坛时,按照每段课程对应的时间粒度上的发帖量和回帖量进行聚类;以及当判断所述在线课程论坛的交互模式是否为自由型论坛时,按照每段课程对应的时间粒度上的发帖量、回帖量以及跟帖量中的至少一个进行聚类。
7.根据权利要求5或6所述的在线课程论坛交互模式识别系统,其特征在于,所述数据获取单元获取的学生发帖、学生回帖以及学生跟帖的长期数据包括:课程总周期内学生的总发帖数、课程总周期内学生的总回帖数、课程总周期内学生的总跟帖数、课程总周期内学生回学生的贴数、课程总周期内学生回教师的贴数、学生发帖最多的星期、学生发帖最少的星期、学生回帖最多的星期、学生回帖最少的星期、发帖最密集的星期、学生发帖量最多的日期与开课时间的间隔、学生发帖量最多的日期的发帖量、学生回帖量最多的日期与开课时间的间隔以及学生回帖量最多的日期的回帖量;
所述数据获取单元获取的教师发帖、教师回帖以及教师跟帖的长期数据包括:课程总周期内教师的总发帖数、课程总周期内教师的总回帖数、课程总周期内教师的总跟帖数、课程总周期内教师回学生的贴数、课程总周期内教师回教师的贴数、教师发帖最多的星期、教师发帖最少的星期、教师回帖最多的星期,教师回帖最少的星期、教师发帖量最多的星期与开课时间的间隔、教师发帖量最多的日期的发帖量、教师回帖量最多的日期与开课时间的间隔以及教师回帖量最多的日期的回帖量。
8.根据权利要求5或6所述的在线课程论坛交互模式识别系统,其特征在于,所述数据获取单元获取的学生发帖、学生回帖以及学生跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录学生的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上学生的发帖总数、回帖总数以及跟帖总数依次排列生成对应的学生行为向量;
所述数据获取单元获取的教师发帖、教师回帖以及教师跟帖的短期数据包括:对整个课程周期的教学时间长度进行均匀量化,将其量化成预设段数的课程,在每个量化的课程段上记录教师的发帖总数、回帖总数以及跟帖总数;将各个量化的课程段上教师的发帖总数、回帖总数以及跟帖总数依次排列生成对应的教师行为向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010955009.3A CN112115357B (zh) | 2020-09-11 | 2020-09-11 | 一种在线课程论坛交互模式识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010955009.3A CN112115357B (zh) | 2020-09-11 | 2020-09-11 | 一种在线课程论坛交互模式识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112115357A CN112115357A (zh) | 2020-12-22 |
CN112115357B true CN112115357B (zh) | 2021-05-07 |
Family
ID=73802880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010955009.3A Active CN112115357B (zh) | 2020-09-11 | 2020-09-11 | 一种在线课程论坛交互模式识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115357B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114429281B (zh) * | 2021-12-30 | 2022-11-15 | 华中师范大学 | 一种基于深度聚类算法的在线学习者活跃度测评方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810170A (zh) * | 2012-11-06 | 2014-05-21 | 腾讯科技(深圳)有限公司 | 交流平台文本分类方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8676815B2 (en) * | 2008-05-07 | 2014-03-18 | City University Of Hong Kong | Suffix tree similarity measure for document clustering |
US8893024B2 (en) * | 2008-12-24 | 2014-11-18 | Microsoft Corporation | User evaluation in a collaborative online forum |
CN102314489B (zh) * | 2011-08-15 | 2017-02-15 | 哈尔滨工业大学 | 网络论坛中舆论领袖分析方法 |
CN103544210B (zh) * | 2013-09-02 | 2017-01-18 | 烟台中科网络技术研究所 | 一种识别网页类型的系统和方法 |
US10824660B2 (en) * | 2015-11-24 | 2020-11-03 | Adobe Inc. | Segmenting topical discussion themes from user-generated posts |
CN106295701A (zh) * | 2016-08-11 | 2017-01-04 | 五八同城信息技术有限公司 | 用户识别方法及装置 |
CN107133894B (zh) * | 2017-05-09 | 2021-05-25 | 广州大洋教育科技股份有限公司 | 基于复杂网络理论的在线学习分组方法 |
CN109635869B (zh) * | 2018-12-11 | 2023-04-07 | 成都信息工程大学 | 在线学习干预系统 |
-
2020
- 2020-09-11 CN CN202010955009.3A patent/CN112115357B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810170A (zh) * | 2012-11-06 | 2014-05-21 | 腾讯科技(深圳)有限公司 | 交流平台文本分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112115357A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
John | The policy agendas project: a review | |
Murnane et al. | Who benefits from obtaining a GED? Evidence from high school and beyond | |
Betts et al. | The determinants of undergraduate grade point average: The relative importance of family background, high school resources, and peer group effects | |
Bosker et al. | Issues in the interpretation of the results of school effectiveness research | |
Blatchford et al. | Rethinking class size: The complex story of impact on teaching and learning | |
Gemici et al. | The Impact of Schools on Young People's Transition to University. Longitudinal Surveys of Australian Youth. Research Report 61. | |
Maaliw III et al. | Classification of Learning Styles in Virtual Learning Environment Using J48 Decision Tree. | |
Barclay et al. | Birth order and college major in Sweden | |
Cooksey et al. | Teachers’ predictions of children’s early reading achievement: An application of social judgment theory | |
Bosker et al. | Criterion-Definition, Effect Size and Stability, Three Fundamental Questions in School Effectiveness Research | |
CN114913729A (zh) | 一种选题方法、装置、计算机设备和存储介质 | |
Hill et al. | Education and Certification Qualifications of Departmentalized Public High School-Level Teachers of Selected Subjects: Evidence from the 2011-12 Schools and Staffing Survey. NCES 2015-814. | |
Sizmur et al. | Achievement of 15-year-olds in England: PISA 2018 results | |
CN112115357B (zh) | 一种在线课程论坛交互模式识别方法及系统 | |
CN115689340A (zh) | 一种基于彩色动态人脸特征的课堂质量监控系统 | |
Rehelmi | The The Relationship between Writing Anxiety and Writing Achievement: A Case of One Islamic University in Palembang | |
Travis III | Assessing the quality of doctoral programs in deviance, criminology, and criminal justice: A response to Thomas and Bronick | |
Acheson et al. | Enhance E-Learning through Data Mining for Personalized Intervention. | |
Sizmur et al. | Achievement of 15-Year Olds in Wales: PISA 2018 National Report | |
Dragičević et al. | Improving university operations with data mining: predicting student performance | |
Endo et al. | Developing and using a longitudinal student outcomes data file: The University of Colorado experience | |
Teach et al. | The role of experiential learning and simulation in teaching management skills | |
Frischemeier et al. | Preservice teachers' statistical reasoning when comparing groups facilitated by software | |
Docherty et al. | Test construction: The Cambridge English approach | |
Armstrong | Validating Placement Tests in the Community College: The Role of Test Scores, Biographical Data, and Grading Variation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |