CN109636696B - 一种基于回归分析的在线课程视频吸引力评估方法 - Google Patents
一种基于回归分析的在线课程视频吸引力评估方法 Download PDFInfo
- Publication number
- CN109636696B CN109636696B CN201910013128.4A CN201910013128A CN109636696B CN 109636696 B CN109636696 B CN 109636696B CN 201910013128 A CN201910013128 A CN 201910013128A CN 109636696 B CN109636696 B CN 109636696B
- Authority
- CN
- China
- Prior art keywords
- video
- regression
- attraction
- course
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000611 regression analysis Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 15
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 230000002547 anomalous effect Effects 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 4
- 241001122767 Theaceae Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于教育信息化领域,具体涉及一种基于回归分析的在线课程视频吸引力评估方法。包括以下步骤:S1计算吸引力因子和logit(p);S2建立回归方程;S3过滤异常数据;S4计算用于预测吸引力因子的回归系数;S5利用回归方程预测视频吸引力。本发明有以下有益效果:(1)建立了视频吸引力和视频长度以及视频编号之间的函数关系;(2)能够利用已有的观看视频行为数据准确预测同类课程视频的吸引力;(3)异常数据过滤方法能够大幅度的提高预测的精度;(4)预测的吸引力能够帮助视频设计者优化视频的分割方案。
Description
技术领域
本发明属于教育信息化领域,具体涉及一种基于回归分析的在线课程视频吸引力评估方法。
背景技术
MOOC(大规模开放在线课程)发展迅速,Coursera,Udacity和edX目前是全球三大MOOC供应商。中国大学MOOC是中国重要的在线开放课程运营商,它承担了国家教育部开放课程发布的任务。
大量的在线开放课程使全球学习者能够访问教育资源,分享学习经验并获得认证。尽管MOOC发展迅速,但也存在高辍学率,低资源利用率以及缺乏有效的盈利模式等问题,而视频使用率低下的情形尤为严重。以中国大学MOOC《高等数学》为例,在2017年,有学习行为的学生人数为4317人,而观看超过50%视频的学生人数仅为18人。因此,如何使MOOC视频更具吸引力是一项非常重要的工作。
视频吸引力与课程内容相关,在不考虑教师表现的情况下,视频的时长和视频的数量会影响学习者的学习兴趣。如果能够找到视频时长和数量影响视频吸引力的机制,就能帮助我们设计出更吸引学习者的视频。
MOOOC学习平台采集的观看视频行为数据中就包含了这些规律。因此,通过分析MOOC学习行为数据来分析和预测视频的吸引力是一项非常有意义的研究工作。如果MOOC视频设计人员能够预先了解视频的吸引力,则可以帮助他们改进视频设计方案。同时,也可以帮助MOOC运营商评价课程视频的质量,淘汰劣质课程。
发明内容
本发明的目的就是为了填补MOOC视频吸引力评估和预测方法的空白,提出一种基于Logistics回归分析的在线课程视频吸引力评估方法。为了消除课程内容对于吸引力的影响,本发明利用采集的观看视频行为数据,计算每一类课程的回归系数。再根据视频的时长和视频的数量,预测出同类课程的每一个视频的吸引力。预测的吸引力能够帮助在线开放课程的运营商评估视频的质量,帮助视频设计者优化视频设计方案,从而提高视频的吸引力。
本发明的目的是通过以下技术实现的:一种基于回归分析的在线课程视频吸引力评估方法,该方法包括以下步骤:
S1:计算学习者完整观看课程中每一段视频的概率,设学习者完整观看第i个视频的概率为pi,pi的Logistic变换为logit(pi):
为了描述视频的吸引力,将观看视频行为分为完整观看视频和非完整观看视频两类,分别用事件A和事件B表示:当观看视频时间大于视频长度时,事件A发生,表示学习者已完整观看了视频;当观看视频时间小于视频长度时,事件B发生,表示学习者没有完整观看视频;
设事件A发生的概率为p,则事件B发生的概率是1-p;统计每一个完整观看第i个视频的学习者的人数ai和所有观看了第i个视频的学习者人数bi,计算概率设课程有n个视频,则i的取值范围为{1,2,…,n};
S2:建立Logistics线性回归方程
设logit(pi)为因变量,视频时长ti和课程的视频编号ki为自变量,建立回归方程logit(pi)=β0+β1ti+β2ki+ei,在等式中β0,β1和β2是回归系数;ei是回归分析的残差,残差为回归方程预测数值与正式数值的误差;在本发明中将两次使用回归方程:第一次回归分析用于过滤异常数据,其回归系数记为β01、β11和β21,第一次回归分析的残差记为第二次回归分析用于计算预测视频吸引力的参数,其回归系数记为β02,β12和β22,第二次回归分析的残差记为
S3:过滤异常数据(第一次回归分析)
异常数据会影响回归系数,因此需要设计一个方法去除它们。根据Durbin-Watson测试理论,残差不属于区间(u-3σ,u+3σ)的点将被过滤掉,其中u是残差的平均值,σ是残差的标准方差,Logistics回归方程为
该过程可分为以下步骤:
S3.1计算视频时长ti和课程的视频编号ki关于logit(pi)的用于过滤异常数据的线性回归系数β01,β11,β21;
S3.3判断残差是否包含在区间(u-3σ,u+3σ)中,不包含在区间中的残差记为 为异常的残差,这里Q为异常数据的数量,iq∈{1,2,3,...,n},{iq|q=1,2,...,Q}表示从n个残差数据中选出的Q个异常的数据对应的视频编号;满足或者以{iq|q=1,2,...,Q}为编号的和为异常数据;
S4:计算用于预测吸引力因子的回归系数(第二次回归分析)
重新计算用于预测视频吸引力的回归系数β02,β12和β22;
S5:计算用于预测视频的吸引力因子
这里ti为第i个视频的时长,ki为视频的编号,ki=i。
本发明提供的技术方案与现有技术相比有以下有益效果:
(1)建立了视频吸引力和视频长度以及视频编号之间的函数关系;
(2)能够利用已有的观看视频行为数据准确预测同类课程视频的吸引力;
(3)异常数据过滤方法能够大幅度的提高预测的精度;
(4)预测的吸引力能够帮助视频设计者优化视频的分割方案。
附图说明
图1.视频吸引力预测流程;
图2.视频长度和logit(p)的散点图;
图3.视频编号和logit(p)的散点图;
图4.残差P-P图;
图5.两个视频分割方案。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。
图1为本发明所述方法的总流程图;如图1所示,本发明所述基于Logistics线性回归的在线开放课程视频吸引力评估方法包括以下步骤:
S1计算吸引力因子和logit(p);
S2建立回归方程;
S3过滤异常数据;
S4计算用于预测吸引力因子的回归系数;
S5利用回归方程预测视频吸引力。
使用回归方程必须要建立在数据存在显著的线性关系的前提下才是准确性。因此我们分析了logit(p)和视频长度,logit(p)和视频编号之间的关系。以中国大学MOOC平台的两门课程《Advanced Mathematics》和《Chinese Tea Ceremony》为例,说明数据之间的相关性。
图2是2门课程的视频长度和logit(p)的散点图。两门课程都有一个共同的特点,这就是视频长度和logit(p)之间存在负线性相关性。为了严格分析相关性,我们计算它们之间的相关系数。
表1视频长度和logit(p)相关系数
课程 | 相关系数 |
Advanced Mathematics | -0.765 |
Chinese tea ceremony | -0.768 |
相关系数的数值表示相关性的强弱,表1列出了2门课程中logit(p)和视频时长之间的相关系数,在显著水平0.001的条件下,两门课程的视频时长与logit(p)存在显著的负线性相关。当视频长度增加时,logit(p)减少。相应的概率p也变得越来越小,表明视频的吸引力在下降。
图3是2个课程的视频编号和logit(p)的散点图。可以看出,它们之间存在显著的负线性关系。
表2视频编号和logit(p)相关系数
课程 | 相关系数 |
Advanced Mathematics | -0.526 |
Chinese tea ceremony | -0.476 |
表2列出了2门课程的logit(p)与视频编号之间的相关系数。相关性测试结果显示,在显著水平0.001的条件下,logit(p)与视频编号存在显著的负线性相关。图2和图3以及相关系数表1和表2说明Logistics回归分析是合理的。
另一方面,为了说明本发明回归分析的逼近精度,我们对残差e做P-P图来检验。当P-P图接近一条直线时,说明模型对于数据有非常好的近似,图4说明了本发明能够准确的反映视频吸引力与视频时长和视频编号之间的关系。同样也说明预测的视频吸引力是可靠的。
我们做了一个评估视频吸引力,并用于比较视频分割方案的实例。
课程所有视频的总时长是60000秒,图5显示了两个视频分割方案。在总时长相同的情况下,方案1包含70个视频,方案2包含80个视频。方案1的视频数量少,但是视频的平均时长较大,而方案2的视频数量多,视频的平均时长较短。当视频时长较长时,视频吸引力较低,而视频数量较多时,视频吸引力也会下降。因此很难判断出哪个方案更能吸引学习者。由于课程还没有在线发布,无法获得学习者的数据,但是可以根据已经发布的相同课程的回归系数来评估这两个视频分割方案。应用本发明预测出方案1的视频平均吸引力为0.5199,方案2的视频平均吸引力为0.5427,因此方案2优于方案1。从而说明本发明可以帮助视频设计者优化视频的设计,提高视频的吸引力。
Claims (2)
1.一种基于回归分析的在线课程视频吸引力评估方法,其特征在于,该方法包括以下步骤:
S1:计算学习者完整观看课程中每一段视频的概率,设学习者完整观看第i个视频的概率为pi,pi的Logistic变换为logit(pi):
为了描述视频的吸引力,将观看视频行为分为完整观看视频和非完整观看视频两类,分别用事件A和事件B表示:当观看视频时间大于视频长度时,事件A发生,表示学习者已完整观看了视频;当观看视频时间小于视频长度时,事件B发生,表示学习者没有完整观看视频;
设事件A发生的概率为p,则事件B发生的概率是1-p;统计每一个完整观看第i个视频的学习者的人数ai和所有观看了第i个视频的学习者人数bi,计算概率设课程有n个视频,则i的取值范围为{1,2,…,n};
S2:建立Logistics线性回归方程
设logit(pi)为因变量,视频时长ti和课程的视频编号ki为自变量,建立回归方程logit(pi)=β0+β1ti+β2ki+ei,在等式中β0,β1和β2是回归系数;ei是回归分析的残差,残差为回归方程预测数值与正式数值的误差;两次使用回归方程:第一次回归分析用于过滤异常数据,其回归系数记为β01、β11和β21,第一次回归分析的残差记为第二次回归分析用于计算预测视频吸引力的参数,其回归系数记为β02,β12和β22,第二次回归分析的残差记为
S3:过滤异常数据
根据Durbin-Watson测试理论,残差不属于区间(u-3σ,u+3σ)的点将被过滤掉,其中u是残差的平均值,σ是残差的标准方差,Logistics回归方程为
该过程可分为以下步骤:
S3.1计算视频时长ti和课程的视频编号ki关于logit(pi)的用于过滤异常数据的线性回归系数β01,β11,β21;
S3.3判断残差是否包含在区间(u-3σ,u+3σ)中,不包含在区间中的残差记为 为异常的残差,这里Q为异常数据的数量,iq∈{1,2,3,...,n},{iq|q=1,2,...,Q}表示从n个残差数据中选出的Q个异常的数据对应的视频编号;满足或者以{iq|q=1,2,...,Q}为编号的 和为异常数据;
S4:计算用于预测吸引力因子的回归系数
重新计算用于预测视频吸引力的回归系数β02,β12和β22;
S5:计算用于预测视频的吸引力因子
这里ti为第i个视频的时长,ki为视频的编号,ki=i。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013128.4A CN109636696B (zh) | 2019-01-07 | 2019-01-07 | 一种基于回归分析的在线课程视频吸引力评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013128.4A CN109636696B (zh) | 2019-01-07 | 2019-01-07 | 一种基于回归分析的在线课程视频吸引力评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109636696A CN109636696A (zh) | 2019-04-16 |
CN109636696B true CN109636696B (zh) | 2022-12-09 |
Family
ID=66057976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910013128.4A Active CN109636696B (zh) | 2019-01-07 | 2019-01-07 | 一种基于回归分析的在线课程视频吸引力评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109636696B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844562A (zh) * | 2016-05-23 | 2016-08-10 | 华中师范大学 | 基于课程教学模型的学习者学习表现分析方法 |
CN108197424A (zh) * | 2018-01-11 | 2018-06-22 | 西安交通大学 | 大规模网络教育中网络学习行为幂律分布概率建模方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9875443B2 (en) * | 2015-06-18 | 2018-01-23 | TCL Research America Inc. | Unified attractiveness prediction framework based on content impact factor |
-
2019
- 2019-01-07 CN CN201910013128.4A patent/CN109636696B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844562A (zh) * | 2016-05-23 | 2016-08-10 | 华中师范大学 | 基于课程教学模型的学习者学习表现分析方法 |
CN108197424A (zh) * | 2018-01-11 | 2018-06-22 | 西安交通大学 | 大规模网络教育中网络学习行为幂律分布概率建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109636696A (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cronbach | Statistical tests for moderator variables: Flaws in analyses recently proposed. | |
CN106407237B (zh) | 在线学习试题推荐方法及系统 | |
Fan et al. | Improved automated operational modal identification of structures based on clustering | |
Zhou et al. | A study of the system's hierarchical structure through integration of DEMATEL and ISM | |
Taylor | Overview and illustration of Bayesian confirmatory factor Analysis with ordinal indicators | |
Gu et al. | Hypothesis testing of the Q-matrix | |
Wang et al. | Equivalence analysis of accelerated degradation mechanism based on stochastic degradation models | |
CN109636696B (zh) | 一种基于回归分析的在线课程视频吸引力评估方法 | |
Radcliffe et al. | Modeling the incidence and timing of student attrition: A survival analysis approach to retention analysis | |
CN116137012B (zh) | 一种基于互联网教育的线上教学质量监督管理系统 | |
CN113239669A (zh) | 试题难度预测方法 | |
Casabianca et al. | The impact of design decisions on measurement accuracy demonstrated using the hierarchical rater model | |
US20140052425A1 (en) | Method and apparatus for evaluating a model of an industrial plant process | |
Sugiyanto | Predict high school students' final grades using basic machine learning | |
Carrion‐I‐Silvestre et al. | Bounds, breaks and unit root tests | |
Bidah et al. | Modeling and Control of the Public Opinion: An Agree‐Disagree Opinion Model | |
Zhang et al. | A model for residual life prediction based on brownian motion in framework of similarity | |
Yu et al. | Feature based causality analysis and its applications in soft sensor modeling | |
CN112231360A (zh) | 一种基于大数据的经济趋势分析系统 | |
Garai | A characterization of a value added model and a new multi-stage model for estimating teacher effects within small school systems | |
Albers | Risk‐Adjusted Control Charts for Health Care Monitoring | |
Zhu et al. | Estimation for extreme conditional quantiles of functional quantile regression | |
Bell et al. | Using multilevel models to assess the comparability of examinations | |
Markoska et al. | A Workflow for Continuous Performance Testing in Smart Buildings | |
CN117436770B (zh) | 基于bim的建筑工程建设管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |