CN109977263B - 一种在线开放课程最优视频时长分析方法 - Google Patents
一种在线开放课程最优视频时长分析方法 Download PDFInfo
- Publication number
- CN109977263B CN109977263B CN201910278768.8A CN201910278768A CN109977263B CN 109977263 B CN109977263 B CN 109977263B CN 201910278768 A CN201910278768 A CN 201910278768A CN 109977263 B CN109977263 B CN 109977263B
- Authority
- CN
- China
- Prior art keywords
- video
- duration
- optimal
- viewing
- attraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 13
- 230000006399 behavior Effects 0.000 claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 4
- 238000001914 filtration Methods 0.000 claims abstract description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 238000013461 design Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 3
- 238000013178 mathematical model Methods 0.000 abstract description 2
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明属于教育信息化领域,具体涉及一种在线开放课程最优视频时长分析方法。包括以下步骤:S1矩阵表示观看视频行为数据;S2过滤无效观看视频行为数据;S3计算吸引力因子;S4估计最优视频时长分布区间;S5计算课程各个阶段最优视频时长的分布区间。该方法通过建立视频编号对于视频吸引力影响的数学模型,根据学习者观看视频数量的容忍度阈值,根据课程视频数量与容忍度阈值的关系,建立了两类课程的最优视频时长计算方法,具有统计学意义和严谨的数学机理;该方法具有普适性,能够帮助视频设计者优化视频设计,提高视频吸引力,从而提高MOOC课程参与度和学习效果。
Description
技术领域
本发明属于教育信息化领域,具体涉及一种在线开放课程最优视频时长分析方法。
背景技术
大规模开放在线课程(MOOC,Massive Open Online Courses)由国内外知名大学通过网络学习平台开设,实现了优质课程资源全球共享。大量的在线开放课程使全球学习者能够访问教育资源,分享学习经验并获得认证。
尽管MOOC发展迅速,但也存在高辍学率,低资源利用率以及缺乏有效的盈利模式等问题,而视频使用率低下的情形尤为严重。以某MOOC平台一门课程为例,有学习行为的学习者人数为4317人,而观看超过50%视频的学习者仅为18人。
视频吸引力与课程内容相关,在不考虑教师表现的情况下,视频的时长会影响学习者的学习兴趣。如果能够找到最科学合理的视频时长,就能帮助视频制作者设计出更吸引学习者的视频。
MOOOC学习平台采集的观看视频行为数据中就包含了最优视频时长的规律。通过分析MOOC学习行为数据来研究每一类课程最优欢迎的视频时长是一项非常有意义的研究工作。美国麻省理工大学的Guo P.J[P.J.Guo,J.Kim,and R.Rubin,“How videoproduction affects student engagement:An empirical study of mooc videos,”inProceedings of the first ACM conference on Learning@scale conference,2014,pp.41–50.]应用调查研究,发现最受欢迎的视频时长应该在6分钟以内,这项研究没有给出视频属性对于视频吸引力数学机理,并且我们发现课程后期学习者对于视频的观看热情下降[Y.Luo,G.Zhou,J.Li,and X.Xiao,“A MOOC Video Viewing Behavior AnalysisAlgorithm,”Math.Probl.Eng.,vol.2018,pp.1–7,2018.],其受欢迎的时长应该随着发布时间而变化。
发明内容
本发明的目的就是为了填补在线开放课程最优视频时长分析方法的空白,提出一种在线开放课程最优视频时长分析方法,该方法通过建立视频编号对于视频吸引力影响的数学模型,根据学习者观看视频数量的容忍度阈值,根据课程视频数量与容忍度阈值的关系,建立了两类课程的最优视频时长计算方法,具有统计学意义和严谨的数学机理。该方法具有普适性,能够帮助视频设计者优化视频设计,提高视频吸引力,从而提高MOOC课程参与度和学习效果。
本发明的目的是通过以下技术实现的:一种在线开放课程最优视频时长分析方法,该方法包括以下步骤:
S1:将学习者观看视频行为数据转化为矩阵表示;
将学习者观看视频行为数据表示为一个矩阵,dij表示第i个学习者观看第j个视频的总时间,学习者观看视频行为就可以表示为一个矩阵D=(dij)m×n,其中m表示学习者的数量,n表示视频的数量,i=1,2,...,m,j=1,2,3,...,n。
S2:过滤无效的观看视频行为数据;
观看时间太短,无法掌握视频中包含的知识。低于60秒的观看记录通常是由于学习者浏览视频,判断该视频是否满足自己需要,或者无意中打开造成的,属于无效观看行为,为了保证分析数据的有效性,需要删除这一类数据。通过预处理,所有的观看数据中不再包含介于0-60秒的数据。预处理算法公式为:
S3:计算视频吸引力因子;
设wj为第j个视频有效观看视频行为的平均观看时间,计算公式为:
设课程的视频时长为{vj|j=1,2,...,n},视频吸引力因子定义为第j个视频平均观看时间与视频长度的比率,为:
S4:估计最优视频分布区间[L,U];
S4.1选取视频吸引力因子Rj大于0.9的视频,记录每一个视频的时长;
S4.2应用Bootstrap方法[B.Efron and R.Tibshirani,“Improvements oncross-validation:the 632+bootstrap method,”J.Am.Stat.Assoc.,vol.92,no.438,pp.548–560,1997.]估计最受学习者欢迎的视频时长的分布区间;
在一门MOOC课程中,视频吸引力因子Rj大于0.9的视频数量一般不超过50个,也就是说用于参数估计的样本数量小于50,而且分布未知。为了解决这个问题,引入了Bootstrap方法,Bootstrap方法对于未知样本分布和低样本量的情况非常有效。利用Bootstrap方法通过计算机模拟采样估计参数均值区间[L,U]。对样本做放回抽样,根据抽取实验估计均值的分布区间[L,U],将区间[L,U]作为最受欢迎的视频时长分布的区间。
S5:计算课程各个时段视频的最优长度。研究发现学习者对于视频时长存在容忍度阈值[Y.Luo,G.Zhou,J.Li,and X.Xiao,“A MOOC Video Viewing Behavior AnalysisAlgorithm,”Math.Probl.Eng.,vol.2018,pp.1–7,2018.],记为M,M通常介于40-50之间,为了保证一般性取M=50;
S5.1当视频数量小于容忍度阈值M时,视频吸引力受到发布时间的影响较小,课程各个时段的视频时长都为[L,U];
S5.2当课程视频数量大于容忍度阈值M时,计算视频吸引力与视频编号的回归系数;
视频吸引力与视频发布时间线性相关,利用线性回归分析,建立视频吸引力与发布时间的函数关系:
设课程视频吸引力集合为{Rj},视频编号集合为{Nj},这里j=1,2,...,n。建立回归方程这里b0和b1为回归系数,ej为残差,即Rj和估计值之间的误差值。应用回归分析,计算回归系数b0和b1。
S5.3利用回归系数b0和b1计算视频数量大于容忍度阈值M时各阶段最优视频时长,公式为
即第j个视频的最优视频时长应该包含在区间[Lj,Uj]中,也就是说设计的第j个视频的时长不超过Uj时,能够最大限度保持学习者的观看热情。
本发明提供的技术方案与现有技术相比有以下有效效果:
(1)本发明基于大数据分析和统计方法,突破传统问卷调查方法的局限性,具有更强的理论基础;
(2)设计的最优视频时长计算方法,考虑了发布时间对于吸引力的影响,能够计算出课程各个阶段的最优视频时长,比现有技术更科学合理;
(3)该发明具有普适性,而且不需要设计专门的调查问卷,完全基于观看视频行为大数据,可以应用于所有包含数字视频资源的教学模式的视频设计;
(4)本发明建立视频吸引力与视频发布时间的数学模型,解决了如何视频数量影响视频吸引力的数学机理问题。
附图说明
图1.本发明所述一种在线开放课程最优视频时长分析方法的总流程图;
图2.视频总数少于50时视频吸引力与视频编号的关系;
图3.视频吸引力因子Rj与视频编号j的关系;
图4.残差的直方图;
图5.每一个视频的最优视频区间。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。
图1为本发明所述方法的总流程图,如图1所示。本发明所述一种在线开放课程最优视频时长分析方法,包括以下步骤:
S1矩阵表示观看视频行为数据;
S2过滤无效观看视频行为数据;
S3计算吸引力因子;
S4估计最优视频时长分布区间;
S5计算课程各个阶段最优视频时长的分布区间。
当课程视频数量很少时,视频吸引力几乎不受发布时间的影响。对于总视频少于50个的课程,视频吸引力因子Rj几乎不受视频编号的影响,则最优视频时长是固定不变的。
选择中国大学MOOC的《博弈论》和《急救常识》课程来说明这一现象。《博弈论》课程中有38个视频,《急救常识》包含19个视频。从图2可以看出,这两门课程的视频吸引力因子Rj几乎不受发布时间的影响。
由于视频是按照编号的顺序进行发布的,因此视频编号可反映视频发布的时间。视频编号j和Rj之间的关系可以在上图中观察到。上图的横坐标是Rj,纵坐标是视频编号j。我们发现课程后期的Rj值小于课程早期的视频。Pearson相关系数等于-0.646,它表明Rj和视频编号之间存在显着的负线性相关性(p-value<0.05)。因此,使用回归方程建立视频吸引力与视频编号的关系是合理的。
以中国大学MOOC平台《高等数学》课程为例,来分析最优视频时长的分布区间,由于该课程包含了129个视频,因此每个阶段视频的最优视频时长是在不断变化的。在129个视频中,符合条件视频吸引力因子大于0.9的视频有43个。使用Bootstrap方法估计最优视频区间。
表1基于Bootstrap的最受欢迎视频的区间估计
上限 | 下限 | |
均值 | 322.76 | 435.51 |
上表列出了基于Bootstrap方法的最佳视频长度的区间估计。采样数为1000,最受欢迎的视频区间为[322.76,435.51],置信度为95%。
回归系数如表2所示,在表2中还列出了残差的均值u和方差σ。
表2.《高等数学》课程线性回归系数和残差统计
参数 | b<sub>0</sub> | b<sub>1</sub> | u | σ |
数值 | 1.026611 | -0.002434 | <10<sup>-6</sup> | 0.145197 |
当残差{ej},j=1,2,...,n服从N(0,σ2)正态分布时,说明回归模型对数据的近似程度很高。表2的数据表明残差的均值接近0,为了进一步说明回归分析的合理性,对残差{ej},j=1,2,...,n做正态分布检验,这里将使用Kolmogorov-Smirnov检验。
图4是残差的直方图,直方图接近正态分布,表明数据符合正态分布。另一方面,Kolmogorov-Smirnov检验结果也显示残差服从正常分布(显著水平为0.05,p-值=0.260)。综合这些结果,可以得出结论,回归模型具有良好的数据近似。
接下来,计算每个阶段设计最佳视频长度。由回归方程,视频编号j与Rj之间的线性关系已经确定。设[Lj,Uj]是每个编号对应的最优视频时长的区间,其中j=1,2,...,n。由回归方程,表达式为
按照这个公式,计算了《高等数学》129个视频的最优长度的区间。
上图的深色区域就是最优视频时长的分布区域,横坐标是视频的编号,纵坐标是时间。过横轴的j点,做垂直于横轴的竖线,与蓝色区域交于两个点,其中下方的交点就是最优视频时长下限,而上方的交点代表最优视频时长的上限。结果显示第一个视频的最优时长分布区间是[330.56,446.04],最后一个视频的最优时长分布区间是[230.01,310.36]。随着视频编号的增加,最有视频长度的上限和下限都在减小,分布区间长度也减小。
视频吸引力与内容相关,因此每一类课程的最优视频时长是存在差异的,本发明可以根据学习者观看视频行为数据分析出最受学习者欢迎的视频时长分布区间,帮助设计者优化视频设计。
Claims (3)
1.一种在线开放课程最优视频时长分析方法,其特征在于,该方法包括以下步骤:
S1:将学习者观看视频行为数据转化为矩阵表示;
将学习者观看视频行为数据表示为一个矩阵,dij表示第i个学习者观看第j个视频的总时间,学习者观看视频行为就可以表示为一个矩阵D=(dij)m×n,其中m表示学习者的数量,n表示视频的数量,i=1,2,...,m,j=1,2,3,...,n;
S2:过滤无效的观看视频行为数据;
通过预处理,所有的观看数据中不再包含介于0-60秒的数据;预处理算法公式为:
S3:计算视频吸引力因子;
设wj为第j个视频有效观看视频行为的平均观看时间,计算公式为:
设课程的视频时长为{vj|j=1,2,...,n},视频吸引力因子定义为第j个视频平均观看时间与视频长度的比率,为:
S4:估计最优视频分布区间[L,U];
S4.1选取视频吸引力因子Rj大于0.9的视频,记录每一个视频的时长;
S4.2应用Bootstrap方法估计最受学习者欢迎的视频时长的分布区间;
利用Bootstrap方法通过计算机模拟采样估计参数均值区间[L,U],对样本做放回抽样,根据抽取实验估计均值的分布区间[L,U],将区间[L,U]作为最受欢迎的视频时长分布的区间;
S5:计算课程各个时段视频的最优长度;
S5.1当视频数量小于容忍度阈值M时,视频吸引力受到发布时间的影响较小,课程各个时段的视频时长都为[L,U];
S5.2当课程视频数量大于容忍度阈值M时,计算视频吸引力与视频编号的回归系数;
视频吸引力与视频发布时间线性相关,利用线性回归分析,建立视频吸引力与发布时间的函数关系:
S5.3利用回归系数b0和b1计算视频数量大于容忍度阈值M时各阶段最优视频时长,公式为
即第j个视频的最优视频时长应该包含在区间[Lj,Uj]中,也就是说设计的第j个视频的时长不超过Uj时,能够最大限度保持学习者的观看热情。
2.一种根据权利要求1所述在线开放课程最优视频时长分析方法,其特征在于:视频时长的容忍度阈值M介于40-50之间。
3.一种根据权利要求1所述在线开放课程最优视频时长分析方法,其特征在于:视频时长的容忍度阈值M=50。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910278768.8A CN109977263B (zh) | 2019-04-09 | 2019-04-09 | 一种在线开放课程最优视频时长分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910278768.8A CN109977263B (zh) | 2019-04-09 | 2019-04-09 | 一种在线开放课程最优视频时长分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109977263A CN109977263A (zh) | 2019-07-05 |
CN109977263B true CN109977263B (zh) | 2020-12-15 |
Family
ID=67083520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910278768.8A Active CN109977263B (zh) | 2019-04-09 | 2019-04-09 | 一种在线开放课程最优视频时长分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977263B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163778B (zh) * | 2020-10-13 | 2024-03-15 | 中国人民解放军国防科技大学 | 一种在线开放课程视频质量量化评价方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214962A (zh) * | 2017-06-29 | 2019-01-15 | 北京易教阳光教育科技有限公司 | 网络教育学习方法、系统、终端及其存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9100550B2 (en) * | 2009-11-20 | 2015-08-04 | At&T Intellectual Property I, L.P. | Apparatus and method for managing a social network |
CN108376166A (zh) * | 2018-02-24 | 2018-08-07 | 宁夏玲杰科技有限公司 | 智能学习方法、装置及电子设备 |
CN108597280B (zh) * | 2018-04-27 | 2021-02-26 | 中国人民解放军国防科技大学 | 一种基于学习行为分析的教学系统及教学方法 |
CN108898519A (zh) * | 2018-06-05 | 2018-11-27 | 上海速云信息科技有限公司 | 一种在线平台授课方法 |
CN109191952A (zh) * | 2018-11-08 | 2019-01-11 | 南京鸣鸣德教育科技有限公司 | 基于网络的师生平台互动乐器学习系统及微慕课制作方法 |
-
2019
- 2019-04-09 CN CN201910278768.8A patent/CN109977263B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214962A (zh) * | 2017-06-29 | 2019-01-15 | 北京易教阳光教育科技有限公司 | 网络教育学习方法、系统、终端及其存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109977263A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zuo et al. | K-12 students’ online learning experiences during COVID-19: Lessons from China | |
Kazu et al. | Effect of Blended Learning Environment Model on High School Students' Academic Achievement. | |
Admiraal et al. | The Integrative Model of Behavior Prediction to Explain Technology Use in Post-Graduate Teacher Education Programs in the Netherlands. | |
Novak | Toward a mathematical model of motivation, volition, and performance | |
Liu et al. | Emotion and associated topic detection for course comments in a MOOC platform | |
CN109977263B (zh) | 一种在线开放课程最优视频时长分析方法 | |
CN111598750A (zh) | 一种基于反刍比算法的学生在线学习状态评估方法及系统 | |
Urip et al. | Determinants of technology acceptance model (TAM) towards ICT use for English language learning | |
Rahmadi | Perbandingan Digital Model dan Hybrid Model dalam Pembelajaran Jarak Jauh (PJJ) Selama Pandemi COVID-19 | |
Tian et al. | An Empirical Study on Interactive Flipped Classroom Model Based on Digital Micro‐Video Course by Big Data Analysis and Models | |
CN112163778B (zh) | 一种在线开放课程视频质量量化评价方法 | |
Tao | Reflection on teaching research of English applied linguistics based on big data | |
Jia et al. | Smart Education Under 5G+ | |
CN116596071A (zh) | Vr实景教学模型大数据教学知识挖掘方法及系统 | |
Chimalakonda et al. | What makes it hard to teach software engineering to end users? some directions from adaptive and personalized learning | |
Selmbacherova et al. | The impact of visual realism on the authenticity of educational simulation: a comparative study | |
Wang et al. | APPLICATION OF FLIPPED CLASSROOM FOR ENGLISH EDUCATION BASED ON NETWORK INFORMATION TECHNOLOGY. | |
Zhao et al. | Fractional Modeling Method Research on Education Evaluation. | |
Chen et al. | The Effects of Information Literacy and ICT Self-Efficacy on K-12 Teachers' Intention to Use ICT for Teaching | |
Chen | Timing of support in one-on-one math problem solving coaching: a survival analysis approach with multimodal data | |
Gao et al. | Design of English Teaching System Based On KMean Clustering Algorithm | |
Wang et al. | A Dynamic Learning Interest Model for a Personalized Learning Requirement Analysis of College Students | |
Li | MOOC Teaching Platform System Based on Application of Artificial Intelligence | |
Huang et al. | Design System of Virtual Computer Simulation Teaching Platform Based on Unity3D | |
Effendi et al. | An Analysis The Implementation of Distance Learning System to Support The Teaching Process At SMA/SMK Level in the Region of North Maluku |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |