CN116777692A - 基于数据分析的在线学习方法、装置、设备及存储介质 - Google Patents

基于数据分析的在线学习方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116777692A
CN116777692A CN202310715258.9A CN202310715258A CN116777692A CN 116777692 A CN116777692 A CN 116777692A CN 202310715258 A CN202310715258 A CN 202310715258A CN 116777692 A CN116777692 A CN 116777692A
Authority
CN
China
Prior art keywords
data
student
online
learning
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310715258.9A
Other languages
English (en)
Inventor
卢鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Eaglesoul Technology Co Ltd
Original Assignee
Shenzhen Eaglesoul Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Eaglesoul Technology Co Ltd filed Critical Shenzhen Eaglesoul Technology Co Ltd
Priority to CN202310715258.9A priority Critical patent/CN116777692A/zh
Publication of CN116777692A publication Critical patent/CN116777692A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及在线教育技术领域,公开了一种基于数据分析的在线学习方法、装置、设备及存储介质。本方法包括:通过获取在线教育平台中的教学内容数据和学习行为数据;将教学内容数据和学习行为数据进行归一化处理,将得到的目标学生数据输入学生数据分析模型进行分析,生成学生的学习内容标签和学生属性标签;基于该标签进行建模,构建学生的学习行为画像,筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。

Description

基于数据分析的在线学习方法、装置、设备及存储介质
技术领域
本发明涉及在线教育技术领域,尤其涉及一种基于数据分析的在线学习方法、装置、设备及存储介质。
背景技术
随着科学技术的发展,教育信息化发展从顶层规划到用户的实际需求都对信息化建设提出了新的要求,深入推进教育信息化。发挥信息化对教育的促进作用,通过“互联网+教育”,持续推动信息技术与教育教学深度融合。因而,在线教学成为人们越来越受欢迎的一种学习方式。
现有的智慧教育生态云一般是通过应用程序(Application,APP)或是网页进行,无法通过“互联网+”思维模式,通过各类应用技术,借助智慧城市的技术架构体系,将教育的各级数据不仅在教育体系的部门之间共享,也可以为市民、其他单位共享。因此,如何深入推进教育信息化。发挥信息化对教育的促进作用,通过“互联网+教育”,基于有效的数据开放共享,市民和其他单位可以有效利用这些数据,提供更加创新、智慧的全民教育服务成了本领域技术人员在现阶段丞待解决的技术问题。
发明内容
本发明的主要目的是对教学业务数据进行分析构建学生画像,确定与对应学生相适应的教学方法,解决了无法通过数据共享全面实现全年龄段的在线教学的技术问题。
本发明第一方面提供了一种基于数据分析的在线学习方法,包括:获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对所述教学业务数据进行检测,得到所述教学业务数据对应的教学内容数据和学习行为数据;通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签;基于所述学习内容标签和所述学生属性标签进行建模,构建所述目标学生的在线学习行为画像,并根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生;确定与所述相似学生对应的在线课程和学习方法,并基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习。
可选地,在本发明第一方面的第一种实现方式中,所述通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据,包括:对所述教学内容数据和所述学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;接收数据分析请求,根据所数据分析请求获取数据字段,并根据所述数据分析请求检测所述原始学生数据中是否存在所述数据字段;若是,则从所述原始学生数据中确定与所述数据字段对应的目标学生数据。
可选地,在本发明第一方面的第二种实现方式中,在所述将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析之前,还包括:从预设大数据资源池中获取历史教学数据作为训练样本数据,并对所述训练样本数据进行特征抽取,构建所述训练样本数据的特征向量;基于预设逻辑回归算法,将所述训练样本数据输入预设的机器学习算法模型中进行计算,得到损失函数值;判断所述损失函数值是否满足预设条件,若否,则根据所述损失函数值调整所述机器学习算法模型的模型参数;将所述训练样本数据输入调整所述模型参数后的机器学习算法模型中重新训练,直到所述损失函数值满足所述预设条件,得到所述数据分析模型。
可选地,在本发明第一方面的第三种实现方式中,所述将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签,包括:对所述目标学生数据进行聚类处理,得到学生特征标签;基于预设多模态算法对所述目标学生数据进行特征提取与特征融合,得到融合特征向量,并将所述融合特征向量输入预设学生数据分析模型的分类器对所述融合特征向量进行分类,得到内容特征标签;基于所述学生数据分析模型的时序神经网络分别对所述学生特征标签和所述内容特征标签进行预测,生成所述目标学生的学习内容标签和学生属性标签。
可选地,在本发明第一方面的第四种实现方式中,所述根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生,包括:根据历史学习行为数据确定所述目标学生对所述在线学习行为画像中各个标签的互动状态;基于预设评分规则计算所述目标学生对所述各个标签的第一亲密度;基于预设评分规则计算预设数据库中历史学生对各个标签的第二亲密度;基于预设聚类算法、所述第一亲密度及所述第二亲密度,确定与所述目标学生相似的相似学生。
可选地,在本发明第一方面的第五种实现方式中,所述基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习,包括:当目标学生进入选定的在线课程的课堂时,通过预设授课标识获取与所述在线课程对应教师的在线授课直播,并展示所述在线授课直播;基于所述在线课程确定所述相似学生的学习方法,并将所述学习方法展示给所述目标学生;在所述目标学生观看所述在线授课直播时,通过预设多媒体工具对在线课程进行标记和做笔记,实现在线学习。
可选地,在本发明第一方面的第六种实现方式中,所述从所述原始学生数据中确定与所述数据字段对应的目标学生数据,包括:从所述原始学生数据的所有数据表中筛选包含所述数据字段的数据表,并将所述数据表划分为多个分区;计算所述多个分区的分区数量,并根据所述分区数量从预设线程池中获取多个闲置线程;利用所述多个闲置线程读取所述多个分区中的学生数据,并将读取到的数据确定为与所述数据字段对应的目标学生数据。
本发明第二方面提供了一种基于数据分析的在线学习装置,包括:检测模块,用于获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对所述教学业务数据进行检测,得到所述教学业务数据对应的教学内容数据和学习行为数据;拟合模块,用于通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;分析模块,用于将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签;构建模块,用于基于所述学习内容标签和所述学生属性标签进行建模,构建所述目标学生的在线学习行为画像,并根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生;展示模块,用于确定与所述相似学生对应的在线课程和学习方法,并基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习。
可选地,在本发明第二方面的第一种实现方式中,所述拟合模块包括:归一化单元,用于对所述教学内容数据和所述学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;检测单元,用于接收数据分析请求,根据所数据分析请求获取数据字段,并根据所述数据分析请求检测所述原始学生数据中是否存在所述数据字段;确定单元,用于若是,则从所述原始学生数据中确定与所述数据字段对应的目标学生数据。
可选地,在本发明第二方面的第二种实现方式中,所述基于数据分析的在线学习装置还包括:特征抽取模块,用于从预设大数据资源池中获取历史教学数据作为训练样本数据,并对所述训练样本数据进行特征抽取,构建所述训练样本数据的特征向量;计算模块,用于基于预设逻辑回归算法,将所述训练样本数据输入预设的机器学习算法模型中进行计算,得到损失函数值;判断模块,用于判断所述损失函数值是否满足预设条件,若否,则根据所述损失函数值调整所述机器学习算法模型的模型参数;训练模块,用于将所述训练样本数据输入调整所述模型参数后的机器学习算法模型中重新训练,直到所述损失函数值满足所述预设条件,得到所述数据分析模型。
可选地,在本发明第二方面的第三种实现方式中,所述分析模块具体用于:对所述目标学生数据进行聚类处理,得到学生特征标签;基于预设多模态算法对所述目标学生数据进行特征提取与特征融合,得到融合特征向量,并将所述融合特征向量输入预设学生数据分析模型的分类器对所述融合特征向量进行分类,得到内容特征标签;基于所述学生数据分析模型的时序神经网络分别对所述学生特征标签和所述内容特征标签进行预测,生成所述目标学生的学习内容标签和学生属性标签。
可选地,在本发明第二方面的第四种实现方式中,所述构建模块具体用于:根据历史学习行为数据确定所述目标学生对所述在线学习行为画像中各个标签的互动状态;基于预设评分规则计算所述目标学生对所述各个标签的第一亲密度;基于预设评分规则计算预设数据库中历史学生对各个标签的第二亲密度;基于预设聚类算法、所述第一亲密度及所述第二亲密度,确定与所述目标学生相似的相似学生。
可选地,在本发明第二方面的第五种实现方式中,所述展示模块具体用于:当目标学生进入选定的在线课程的课堂时,通过预设授课标识获取与所述在线课程对应教师的在线授课直播,并展示所述在线授课直播;基于所述在线课程确定所述相似学生的学习方法,并将所述学习方法展示给所述目标学生;在所述目标学生观看所述在线授课直播时,通过预设多媒体工具对在线课程进行标记和做笔记,实现在线学习。
可选地,在本发明第二方面的第六种实现方式中,所述确定单元具体用于:从所述原始学生数据的所有数据表中筛选包含所述数据字段的数据表,并将所述数据表划分为多个分区;计算所述多个分区的分区数量,并根据所述分区数量从预设线程池中获取多个闲置线程;利用所述多个闲置线程读取所述多个分区中的学生数据,并将读取到的数据确定为与所述数据字段对应的目标学生数据。
本发明第三方面提供了一种基于数据分析的在线学习设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于数据分析的在线学习设备执行上述的基于数据分析的在线学习方法的各个步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于数据分析的在线学习方法的各个步骤。
本发明提供的技术方案中,通过获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
附图说明
图1为本发明提供的基于数据分析的在线学习方法的第一个实施例示意图;
图2为本发明提供的基于数据分析的在线学习方法的第二个实施例示意图;
图3为本发明提供的基于数据分析的在线学习方法的第三个实施例示意图;
图4为本发明提供的基于数据分析的在线学习装置的第一个实施例示意图;
图5为本发明提供的基于数据分析的在线学习装置的第二个实施例示意图;
图6为本发明提供的基于数据分析的在线学习设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种基于数据分析的在线学习方法、装置、设备及存储介质,本发明的技术方案中,首先通过获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于数据分析的在线学习方法的第一个实施例包括:
101、获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对教学业务数据进行检测,得到教学业务数据对应的教学内容数据和学习行为数据;
本实施例中,首先需要获取智慧教育平台中的教学业务数据,这里的教学业务数据至少包括教学内容数据和学习行为数据,其中,教学内容数据可以为直播间主播直播的传播在线学习课程的视频,也可以为传播在线学习课程的音频。此外,学习行为数据为观看教学内容数据时学生进行的操作,学习行为数据至少包括点击操作数据、停留操作数据、互动操作数据和留言操作数据,还可以包括服务器通过这些学习行为数据可以进一步构建在线学习行为画像。
进一步地,所述多模态算法指的是通过不同的模态对多模态数据进行分析的算法,其中,模态指的是不同的领域或视角,多模态数据指的是通过不同领域或视角描述同一个对象的描述数据,例如:在教学业务数据分析中,教学业务数据可以分解为音频、图像、文本(字幕)等多模态信息,其中图片又可以表示为强度、灰度、纹理等不同模态特征。通过预置的多模态算法可以更好的对教学业务数据进行处理,从而得到内容特征标签。
102、通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;
本实施例中,对所述教学内容数据和所述学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;接收数据分析请求,根据所数据分析请求获取数据字段,并根据所述数据分析请求检测所述原始学生数据中是否存在所述数据字段;进一步地,从所述原始学生数据的所有数据表中筛选包含所述数据字段的数据表,并将所述数据表划分为多个分区;计算所述多个分区的分区数量,并根据所述分区数量从预设线程池中获取多个闲置线程;利用所述多个闲置线程读取所述多个分区中的学生数据,并将读取到的数据确定为与所述数据字段对应的目标学生数据。
具体地,所述数据表是指包含所述数据字段的系统表。具体地,所述电子设备根据所述数据表的数据配置量将所述数据表划分为所述多个分区。其中,所述数据配置量的大小可以根据需求自由配置。将所述数据表拆分为多个分区,并利用所述多个闲置线程对所述多个分区中的学生数据进行读取,由于无需等待线程其他请求,以及减少了单个线程读取的数据量,因此,能够提高所述目标数据的获取效率。
103、将目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成目标学生的学习内容标签和学生属性标签;
本实施例中,对所述目标学生数据进行聚类处理,得到学生特征标签;基于预设多模态算法对所述目标学生数据进行特征提取与特征融合,得到融合特征向量,并将所述融合特征向量输入预设学生数据分析模型的分类器对所述融合特征向量进行分类,得到内容特征标签;基于所述学生数据分析模型的时序神经网络分别对所述学生特征标签和所述内容特征标签进行预测,生成所述目标学生的学习内容标签和学生属性标签。
具体地,对目标学生数据进行处理,从而生成对应的学习内容标签和学生属性标签。因为学生行为数据至少包括点击操作数据、停留操作数据、互动操作数据和留言操作数据,其中留言操作数据的类型为文本数据,所以对留言操作数据进行聚类处理,而点击操作数据、停留操作数据和互动操作数据的类型为动作数据,所以对点击操作数据、停留操作数据和互动操作数据的动作类型进行辨别处理,得到对应的特征标签,这样对不同类别的操作数据进行不同的处理,即可得到学生操作数据的学生特征标签。
进一步地,在对目标学生数据进行特征提取后,需要对目标学生数据进行特征融合,因为目标学生数据具体包括教学视频数据,其中教学视频数据中至少存在视频数据、音频数据和文字数据,因此服务器需要利用预置的多模态算法对目标学生数据进行特征提取与特征融合,得到融合特征向量,再通过预置的多模态算法中分类器对融合特征向量进行分类,得到内容特征标签;最后,利用预置的时序神经网络对内容特征标签和学生特征标签进行预测,从而达到生成学习内容标签和学生属性标签的目的。
104、基于学习内容标签和学生属性标签进行建模,构建目标学生的在线学习行为画像,并根据在线学习行为画像和预设聚类算法,筛选出与目标学生相似的相似学生;
本实施例中,根据历史学习行为数据确定所述目标学生对所述在线学习行为画像中各个标签的互动状态;基于预设评分规则计算所述目标学生对所述各个标签的第一亲密度;基于预设评分规则计算预设数据库中历史学生对各个标签的第二亲密度;基于预设聚类算法、所述第一亲密度及所述第二亲密度,确定与所述目标学生相似的相似学生。
其中,所述互动状态包括点击量、收藏状态、标签使用状态,如是否将标签应用于学生分群对接智慧教育平台、是否将标签应用于多维教学分析平台等。所述评分规则可为预先根据各个标签互动状态设定的用于评定标签‘亲密度’的分值,第一亲密度是根据上述评分规则进行计算得到的,在计算亲密度时,应首先根据目标学生的历史数据记录筛选出评分规则中包含的标签互动状态数据,之后计算各个标签互动状态数据与对应分值的乘积加和,并将该乘积加和确定为目标目标学生对该标签的第一亲密度。
具体地,可利用“余弦相似性”来计算目标学生与现有学生两两之间的相似度。其中,余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫“余弦相似性”。
105、确定与相似学生对应的在线课程和学习方法,并基于预设授课标识将在线课程和学习方法展示给目标学生,实现在线学习。
本实施例中,当目标学生进入选定的在线课程的课堂时,通过预设授课标识获取与所述在线课程对应教师的在线授课直播,并展示所述在线授课直播;基于所述在线课程确定所述相似学生的学习方法,并将所述学习方法展示给所述目标学生;在所述目标学生观看所述在线授课直播时,通过预设多媒体工具对在线课程进行标记和做笔记,实现在线学习。其中,当目标学生进入选定的在线课程的课堂时,通过对所述跳转请求进行解析,获取到所述跳转请求中的授课标识,具体的,所述授课标识可以为学生名或是学生账号。
当登录预设在线教学系统时,判断所述学生是否成功登录所述在线教学系统;当所述学生成功登录所述在线教学系统时,获取学生选定的在线课程,在线课程的课程信息可以是与在线课程对应的课件和直播教学数据等信息。
本发明实施例中,通过获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
请参阅图2,本发明实施例中基于数据分析的在线学习方法的第二个实施例包括:
201、获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对教学业务数据进行检测,得到教学业务数据对应的教学内容数据和学习行为数据;
202、对教学内容数据和学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;
本实施例中,所述教学内容数据和所述学习行为数据包括数值型数据和非数值型数据,对所述教学内容数据和所述学习行为数据进行预处理时,需要首先对所述教学内容数据和学习行为数据进行分类,得到数值型的该数据和非数值型的该数据。进一步地,对非数值型的所述数据进行独热编码,并对数值型的所述数据根据预设公式进行归一化处理,得到目标学生的原始学生数据。
具体地,独热编码和归一化处理指的是将原始数据转变为模型的目标数据的过程,常用的独热编码和归一化处理方法包括:时间戳处理、分解类别属性、分箱/分区、交叉特征、特征选择、特征缩放以及特征提取。行为数据主要分为两类,一类是数值型的行为数据,例如为车龄、浏览时长以及年收入等,另一类是非数值型的行为数据,例如为收藏、评论、关注以及加入购物车等。具体地,通过分解类别属性的方式将非数值型的行为数据转化为可供模型输入的目标数据,通过特征缩放的方式将数值型的行为数据转化为可供模型输入的目标数据。
203、接收数据分析请求,根据所数据分析请求获取数据字段,并根据数据分析请求检测原始学生数据中是否存在数据字段;
本实施例中,接收数据分析请求,并从所述数据分析请求中提取词性为预设词性的词语作为目标数据。从所述目标数据中剔除所述数据字段得到分析指标。确定与所述分析指标对应的分析算法。从所述数据分析请求中获取分析字段。从预设数据资源库中获取与所述分析字段对应的分析数据。基于所述分析算法对所述分析数据进行分析,得到所述数据分析请求中携带的报文数据。
进一步地,获取用于指示地址的预设标签,送所述报文数据中获取与所述标签对应的数据作为存储地址。从所述存储地址中获取任意语句作为分析语句,并从所述分析语句中提取指示字段的数据作为对应的数据字段。
204、从原始学生数据的所有数据表中筛选包含数据字段的数据表,并将数据表划分为多个分区;
本实施例中,所述数据表是指包含所述数据字段的系统表。具体地,所述电子设备根据所述数据表的数据配置量将所述数据表划分为所述多个分区。其中,所述数据配置量的大小可以根据需求自由配置。
205、计算多个分区的分区数量,并根据分区数量从预设线程池中获取多个闲置线程;
本实施例中,所述分区数量是指所述多个分区的数据。所述预设线程池中存储多个预先定义好的线程。
206、利用多个闲置线程读取多个分区中的学生数据,并将读取到的数据确定为与数据字段对应的目标学生数据;
本实施例中,将所述数据表拆分为多个分区,并利用所述多个闲置线程对所述多个分区中的学生数据进行读取,由于无需等待线程其他请求,以及减少了单个线程读取的数据量,因此,能够提高所述目标数据的获取效率。
207、将目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成目标学生的学习内容标签和学生属性标签;
208、基于学习内容标签和学生属性标签进行建模,构建目标学生的在线学习行为画像,并根据在线学习行为画像和预设聚类算法,筛选出与目标学生相似的相似学生;
209、当目标学生进入选定的在线课程的课堂时,通过预设授课标识获取与在线课程对应教师的在线授课直播,并展示在线授课直播;
本实施例中,当目标学生进入选定的在线课程的课堂时,通过对所述跳转请求进行解析,获取到所述跳转请求中的授课标识,具体的,所述授课标识可以为学生名或是学生账号。
进一步地,在所述在线教学系统的账户登录管理模块中进行查找,判断所述账户登录管理模块中是否存在与所述授课标识对应的登录标识;需要说明的是,所述在线教学系统中的账户登录管理模块用于保存各个学生的授课标识、账号信息以及登录标识等数据,所述账户登录管理系统用于鉴定所述学生是否登录在线教学系统。通过预设授课标识获取与在线课程对应教师的在线授课直播,并展示在线授课直播。
210、基于在线课程确定相似学生的学习方法,并将学习方法展示给目标学生,在目标学生观看在线授课直播时,通过预设多媒体工具对在线课程进行标记和做笔记,实现在线学习。
本实施例中,当登录预设在线教学系统时,判断所述学生是否成功登录所述在线教学系统;当所述学生成功登录所述在线教学系统时,获取学生选定的在线课程,在线课程的课程信息可以是与在线课程对应的课件和直播教学数据等信息。
具体地,通过响应学生通过应用程序发送的跳转请求,确定与跳转请求对应的小程序,并跳转至与所述小程序相关联的在线教学系统,当所述学生成功登录所述在线教学系统时,获取所述学生选定的在线课程,并将所述在线课程的课程信息以直播的形式展示给所述学生。应用本发明提供的方法,可通过应用程序中的小程序快速进入在线教学系统。同时,通过预设多媒体工具对在线课程进行标记和做笔记,使学生在线学习的过程更加的便捷,实现在线学习。
本实施例中步骤201、207-208与第一实施例中的步骤101、103-104类似,此处不再赘述。
本发明实施例中,通过获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
请参阅图3,本发明实施例中基于数据分析的在线学习方法的第三个实施例包括:
301、获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对教学业务数据进行检测,得到教学业务数据对应的教学内容数据和学习行为数据;
302、通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;
本实施例中,对所述教学内容数据和所述学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;接收数据分析请求,根据所数据分析请求获取数据字段,并根据所述数据分析请求检测所述原始学生数据中是否存在所述数据字段;若是,则从所述原始学生数据中确定与所述数据字段对应的目标学生数据。
具体地,独热编码和归一化处理指的是将原始数据转变为模型的目标数据的过程,常用的独热编码和归一化处理方法包括:时间戳处理、分解类别属性、分箱/分区、交叉特征、特征选择、特征缩放以及特征提取。行为数据主要分为两类,一类是数值型的行为数据,例如为车龄、浏览时长以及年收入等,另一类是非数值型的行为数据,例如为收藏、评论、关注以及加入购物车等。
进一步地,从所述原始学生数据的所有数据表中筛选包含所述数据字段的数据表,并将所述数据表划分为多个分区;计算所述多个分区的分区数量,并根据所述分区数量从预设线程池中获取多个闲置线程;利用所述多个闲置线程读取所述多个分区中的学生数据,并将读取到的数据确定为与所述数据字段对应的目标学生数据。
303、从预设大数据资源池中获取历史教学数据作为训练样本数据,并对训练样本数据进行特征抽取,构建训练样本数据的特征向量;
本实施例中,所述大数据资源库为学生已经了解其数据特性对应的历史教学数据,其数据特性包括:数据字段类型、数据字段格式以及饱和度等信息。具体为服务器获取大数据资源库并扫描该大数据资源库中的数据作为训练样本数据,该大数据资源库可以学生通过终端选定的历史教学数据,并将历史教学数据的标识发送至服务器,由服务器获取该历史教学数据作为大数据资源库并扫描读取该大数据资源库中的数据作为训练样本数据。
进一步地,对该训练样本数据进行特征抽取,比如抽取文本类型、维度类型和离散数字类型的字段信息作为特征字段。由此根据该字段构建特征向量,其中特征向量中的数值与每个特征字段对应。
304、基于预设逻辑回归算法,将训练样本数据输入预设的机器学习算法模型中进行计算,得到损失函数值;
本实施例中,基于机器学习的数据分析装置在将所述样本数据集中的多个训练样本数据输入预设的机器学习算法模型中进行训练,得到所述数据分析模型时,可以将所述样本数据集中的多个训练样本数据输入预设的机器学习算法模型中,得到损失函数值。
本实施例中,根据所述数据分析标识从所述大数据平台中选取与所述数据分析标识对应的预训练的数据分析模型之前,可以根据数据分析的类型收集与数据分析的类型对应的样本数据集,所述样本数据集中包括多个训练样本数据,所述训练样本数据包括但不限于不同业务应用的历史日志信息;并将所述样本数据集中的多个训练样本数据输入预设的机器学习算法模型中进行训练,得到所述数据分析模型。
305、判断损失函数值是否满足预设条件,若否,则根据损失函数值调整机器学习算法模型的模型参数;
本实施例中,判断损失函数值是否满足预设条件,当所述损失函数值不满足预设条件时,根据所述损失函数值调整所述预设的机器学习算法模型的模型参数,并将所述训练样本数据输入调整所述模型参数后的机器学习算法模型中重新训练。
306、将训练样本数据输入调整模型参数后的机器学习算法模型中重新训练,直到损失函数值满足预设条件,得到数据分析模型;
本实施例中,基于机器学习的数据分析装置在根据所述数据分析标识从所述大数据平台中选取与所述数据分析标识对应的预训练的数据分析模型之前,可以根据数据分析的类型收集与数据分析的类型对应的样本数据集,所述样本数据集中包括多个训练样本数据,所述训练样本数据包括但不限于不同业务应用的历史日志信息;并将所述样本数据集中的多个训练样本数据输入预设的机器学习算法模型中进行训练,得到学习数据分析模型。
307、对目标学生数据进行聚类处理,得到学生特征标签;
本实施例中,对目标学生数据进行处理,从而生成对应的学习内容标签和学生属性标签。因为学生行为数据至少包括点击操作数据、停留操作数据、互动操作数据和留言操作数据,其中留言操作数据的类型为文本数据,所以对留言操作数据进行聚类处理,而点击操作数据、停留操作数据和互动操作数据的类型为动作数据,所以对点击操作数据、停留操作数据和互动操作数据的动作类型进行辨别处理,得到对应的特征标签,这样对不同类别的操作数据进行不同的处理,即可得到学生操作数据的学生特征标签。
308、基于预设多模态算法对目标学生数据进行特征提取与特征融合,得到融合特征向量,并将融合特征向量输入预设学生数据分析模型的分类器对融合特征向量进行分类,得到内容特征标签;
本实施例中,在对目标学生数据进行特征提取后,需要对目标学生数据进行特征融合,因为目标学生数据具体包括教学视频数据,其中教学视频数据中至少存在视频数据、音频数据和文字数据,因此服务器需要利用预置的多模态算法对目标学生数据进行特征提取与特征融合,得到融合特征向量,再通过预置的多模态算法中分类器对融合特征向量进行分类,得到内容特征标签。
进一步地,这里预置的多模态算法指的是通过不同的模态对多模态数据进行分析的算法,其中,模态指的是不同的领域或视角,多模态数据指的是通过不同领域或视角描述同一个对象的描述数据,例如:在教学视频数据分析中,教学视频数据可以分解为音频、图像、文本(字幕)等多模态信息,其中图片又可以表示为强度、灰度、纹理等不同模态特征。通过预置的多模态算法可以更好的对目标学生数据进行处理,从而得到内容特征标签。
309、基于学生数据分析模型的时序神经网络分别对学生特征标签和内容特征标签进行预测,生成目标学生的学习内容标签和学生属性标签;
本实施例中,所述内容特征标签和学生特征标签是在一定时段内的教学业务数据中提取出来的,由于学生的喜好或行为操作会随着时间的变化而变化,因此服务器需要利用预置的时序神经网络对内容特征标签和学生特征标签进行预测,从而达到生成学习内容标签和学生属性标签的目的。
这里预置的时序神经网络指的是循环神经网络(recurrentneural network,RNN),其是一种处理时序型输入的神经网络,输入循环神经网络中的时序型数据的长度是不同的,并且输入的时序型数据的上下文是存在关联的,通过循环神经网络中多个隐藏层对输入数据进行卷积计算,最后通过输出层输出卷积后的数据,即可生成预测的学习内容标签和学生属性标签。
310、根据历史学习行为数据确定目标学生对在线学习行为画像中各个标签的互动状态;
本实施例中,互动状态包括点击量、收藏状态、标签使用状态,如是否将标签应用于学生分群对接智慧教育平台、是否将标签应用于多维教学分析平台等。
其中,标签属性信息可为目标学生对各个标签的互动状态,具体可通过埋点,获取目标学生在预设历史时间段内对画像系统中标签的互动信息,即可获取到学生对标签的点击、收藏动作,对标签引用做教学活动、做微课教学分析或预测等行为数据。其中,预设历史时间段可根据实际需求进行设定,如可设定预设历史时间段为当前时刻的前一个月。
311、基于预设评分规则计算目标学生对各个标签的第一亲密度,并基于预设评分规则计算预设数据库中历史学生对各个标签的第二亲密度;
本实施例中,所述评分规则可为预先根据各个标签互动状态设定的用于评定标签“亲密度”的分值,第一亲密度是根据上述评分规则进行计算得到的,在计算亲密度时,应首先根据目标学生的历史数据记录筛选出评分规则中包含的标签互动状态数据,之后计算各个标签互动状态数据与对应分值的乘积加和,并将该乘积加和确定为目标目标学生对该标签的第一亲密度。其中,所述评分规则为:学生对标签n的亲密度=标签的浏览量*浏览次数+收藏(2分)+标签用于学生分群智慧教育平台(3分)+标签应用于在线教学平台(3分)。
具体地,可从数据库中筛选出多个现有目标学生,并利用确定好的评分规则计算现有目标学生对各个标签的第二亲密度,例如,若确定目标学生A对于标签1的浏览量为14,且收藏了标签1,并且将标签1分别应用于学生分群智慧教育平台和在线教学平台,则可根据评分规则,计算出目标学生B针对标签1的亲密度为:1*14+2+3+3=22。
312、基于预设聚类算法、第一亲密度及第二亲密度,确定与目标学生相似的相似学生;
本实施例中,在具体的应用场景中,为了筛选出目标学生的相似学生,具体可以包括:依据预设的第一计算公式对第一亲密度和第二亲密度进行归一化处理;根据归一化处理结果计算目标学生与各个现有学生之间的第一相似度;将第一相似度高于第一预设阈值的现有学生确定为第一相似学生。
其中,第一计算公式的特征描述为:X1=(x-min)/(max-min),公式中,X1为目标学生或现有学生对应当前标签亲密度的归一化结果,x为目标学生或现有学生对应标签的亲密度,min为目标学生和现有学生中对应标签亲密度的最小值,max为目标学生和现有学生中对应标签亲密度的最大值。
在具体的应用场景中,为了便于第一相似学生的判断,需要利用第一计算公式对标签亲密度进行减噪与归一化处理,使结果落到[0,1]区间。
相应的,可利用“余弦相似性”来计算目标学生与现有学生两两之间的相似度。其中,余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫“余弦相似性”。对于两个向量,如果它们之间的夹角越小,则认为这两个向量是越相似的。余弦相似性就是利用了这个理论思想。它通过计算两个向量的夹角的余弦值来衡量向量之间的相似度值。
313、确定与相似学生对应的在线课程和学习方法,并基于预设授课标识将在线课程和学习方法展示给目标学生,实现在线学习。
本实施例中步骤301-302、313与第一实施例中的步骤101-102、105类似,此处不再赘述。
本发明实施例中,通过获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
上面对本发明实施例中基于数据分析的在线学习方法进行了描述,下面对本发明实施例中基于数据分析的在线学习装置进行描述,请参阅图4,本发明实施例中基于数据分析的在线学习装置的第一个实施例包括:
检测模块401,用于获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对所述教学业务数据进行检测,得到所述教学业务数据对应的教学内容数据和学习行为数据;
拟合模块402,用于通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;
分析模块403,用于将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签;
构建模块404,用于基于所述学习内容标签和所述学生属性标签进行建模,构建所述目标学生的在线学习行为画像,并根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生;
展示模块405,用于确定与所述相似学生对应的在线课程和学习方法,并基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习。
本发明实施例中,通过获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
请参阅图5,本发明实施例中基于数据分析的在线学习装置的第二个实施例,该基于数据分析的在线学习装置具体包括:
检测模块401,用于获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对所述教学业务数据进行检测,得到所述教学业务数据对应的教学内容数据和学习行为数据;
拟合模块402,用于通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;
分析模块403,用于将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签;
构建模块404,用于基于所述学习内容标签和所述学生属性标签进行建模,构建所述目标学生的在线学习行为画像,并根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生;
展示模块405,用于确定与所述相似学生对应的在线课程和学习方法,并基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习。
本实施例中,所述拟合模块402包括:
归一化单元4021,用于对所述教学内容数据和所述学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;
检测单元4022,用于接收数据分析请求,根据所数据分析请求获取数据字段,并根据所述数据分析请求检测所述原始学生数据中是否存在所述数据字段;
确定单元4023,用于若是,则从所述原始学生数据中确定与所述数据字段对应的目标学生数据。
本实施例中,所述基于数据分析的在线学习装置还包括:
特征抽取模块406,用于从预设大数据资源池中获取历史教学数据作为训练样本数据,并对所述训练样本数据进行特征抽取,构建所述训练样本数据的特征向量;
计算模块407,用于基于预设逻辑回归算法,将所述训练样本数据输入预设的机器学习算法模型中进行计算,得到损失函数值;
判断模块408,用于判断所述损失函数值是否满足预设条件,若否,则根据所述损失函数值调整所述机器学习算法模型的模型参数;
训练模块409,用于将所述训练样本数据输入调整所述模型参数后的机器学习算法模型中重新训练,直到所述损失函数值满足所述预设条件,得到所述数据分析模型。
本实施例中,所述分析模块403具体用于:
对所述目标学生数据进行聚类处理,得到学生特征标签;
基于预设多模态算法对所述目标学生数据进行特征提取与特征融合,得到融合特征向量,并将所述融合特征向量输入预设学生数据分析模型的分类器对所述融合特征向量进行分类,得到内容特征标签;
基于所述学生数据分析模型的时序神经网络分别对所述学生特征标签和所述内容特征标签进行预测,生成所述目标学生的学习内容标签和学生属性标签。
本实施例中,所述构建模块404具体用于:
根据历史学习行为数据确定所述目标学生对所述在线学习行为画像中各个标签的互动状态;
基于预设评分规则计算所述目标学生对所述各个标签的第一亲密度;
基于预设评分规则计算预设数据库中历史学生对各个标签的第二亲密度;
基于预设聚类算法、所述第一亲密度及所述第二亲密度,确定与所述目标学生相似的相似学生。
本实施例中,所述展示模块405具体用于:
当目标学生进入选定的在线课程的课堂时,通过预设授课标识获取与所述在线课程对应教师的在线授课直播,并展示所述在线授课直播;
基于所述在线课程确定所述相似学生的学习方法,并将所述学习方法展示给所述目标学生;
在所述目标学生观看所述在线授课直播时,通过预设多媒体工具对在线课程进行标记和做笔记,实现在线学习。
本实施例中,所述确定单元4023具体用于:
从所述原始学生数据的所有数据表中筛选包含所述数据字段的数据表,并将所述数据表划分为多个分区;
计算所述多个分区的分区数量,并根据所述分区数量从预设线程池中获取多个闲置线程;
利用所述多个闲置线程读取所述多个分区中的学生数据,并将读取到的数据确定为与所述数据字段对应的目标学生数据。
本发明实施例中,获取在线教育平台中的教学内容数据和学习行为数据;通过独热编码将教学内容数据和学习行为数据进行数据拟合和归一化处理,将得到的目标学生数据输入学生数据分析模型进行多维度分析,生成学生的学习内容标签和学生属性标签;基于学习内容标签和学生属性标签进行建模,构建学生的学习行为画像,并根据聚类算法筛选出与学生相似的相似学生;确定与相似学生对应的在线课程和学习方法,并基于授课标识将在线课程和学习方法展示给学生,实现在线学习。本发明通过对教学业务数据进行分析构建学生画像和数据共享,确定与对应学生相适应的教学方法,全面实现全年龄段的在线教学的技术问题。
上面图4和图5从模块化功能实体的角度对本发明实施例中的基于数据分析的在线学习装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于数据分析的在线学习设备进行详细描述。
图6是本发明实施例提供的一种基于数据分析的在线学习设备的结构示意图,该基于数据分析的在线学习设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于数据分析的在线学习设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在基于数据分析的在线学习设备600上执行存储介质630中的一系列指令操作,以实现上述各方法实施例提供的基于数据分析的在线学习方法的步骤。
基于数据分析的在线学习设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的基于数据分析的在线学习设备结构并不构成对本申请提供的基于数据分析的在线学习设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行上述基于数据分析的在线学习方法的步骤。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于数据分析的在线学习方法,其特征在于,所述基于数据分析的在线学习方法包括:
获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对所述教学业务数据进行检测,得到所述教学业务数据对应的教学内容数据和学习行为数据;
通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;
将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签;
基于所述学习内容标签和所述学生属性标签进行建模,构建所述目标学生的在线学习行为画像,并根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生;
确定与所述相似学生对应的在线课程和学习方法,并基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习。
2.根据权利要求1所述的基于数据分析的在线学习方法,其特征在于,所述通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据,包括:
对所述教学内容数据和所述学习行为数据进行独热编码和归一化处理,得到目标学生的原始学生数据;
接收数据分析请求,根据所数据分析请求获取数据字段,并根据所述数据分析请求检测所述原始学生数据中是否存在所述数据字段;
若是,则从所述原始学生数据中确定与所述数据字段对应的目标学生数据。
3.根据权利要求1所述的基于数据分析的在线学习方法,其特征在于,在所述将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析之前,还包括:
从预设大数据资源池中获取历史教学数据作为训练样本数据,并对所述训练样本数据进行特征抽取,构建所述训练样本数据的特征向量;
基于预设逻辑回归算法,将所述训练样本数据输入预设的机器学习算法模型中进行计算,得到损失函数值;
判断所述损失函数值是否满足预设条件,若否,则根据所述损失函数值调整所述机器学习算法模型的模型参数;
将所述训练样本数据输入调整所述模型参数后的机器学习算法模型中重新训练,直到所述损失函数值满足所述预设条件,得到所述数据分析模型。
4.根据权利要求1所述的基于数据分析的在线学习方法,其特征在于,所述将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签,包括:
对所述目标学生数据进行聚类处理,得到学生特征标签;
基于预设多模态算法对所述目标学生数据进行特征提取与特征融合,得到融合特征向量,并将所述融合特征向量输入预设学生数据分析模型的分类器对所述融合特征向量进行分类,得到内容特征标签;
基于所述学生数据分析模型的时序神经网络分别对所述学生特征标签和所述内容特征标签进行预测,生成所述目标学生的学习内容标签和学生属性标签。
5.根据权利要求1所述的基于数据分析的在线学习方法,其特征在于,所述根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生,包括:
根据历史学习行为数据确定所述目标学生对所述在线学习行为画像中各个标签的互动状态;
基于预设评分规则计算所述目标学生对所述各个标签的第一亲密度;
基于预设评分规则计算预设数据库中历史学生对各个标签的第二亲密度;
基于预设聚类算法、所述第一亲密度及所述第二亲密度,确定与所述目标学生相似的相似学生。
6.根据权利要求1所述的基于数据分析的在线学习方法,其特征在于,所述基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习,包括:
当目标学生进入选定的在线课程的课堂时,通过预设授课标识获取与所述在线课程对应教师的在线授课直播,并展示所述在线授课直播;
基于所述在线课程确定所述相似学生的学习方法,并将所述学习方法展示给所述目标学生;
在所述目标学生观看所述在线授课直播时,通过预设多媒体工具对在线课程进行标记和做笔记,实现在线学习。
7.根据权利要求2所述的基于数据分析的在线学习方法,其特征在于,所述从所述原始学生数据中确定与所述数据字段对应的目标学生数据,包括:
从所述原始学生数据的所有数据表中筛选包含所述数据字段的数据表,并将所述数据表划分为多个分区;
计算所述多个分区的分区数量,并根据所述分区数量从预设线程池中获取多个闲置线程;
利用所述多个闲置线程读取所述多个分区中的学生数据,并将读取到的数据确定为与所述数据字段对应的目标学生数据。
8.一种基于数据分析的在线学习装置,其特征在于,所述基于数据分析的在线学习装置包括:
检测模块,用于获取在线教育平台中的教学业务数据,基于预设多模态检测算法和预设过滤算法对所述教学业务数据进行检测,得到所述教学业务数据对应的教学内容数据和学习行为数据;
拟合模块,用于通过独热编码将所述教学内容数据和所述学习行为数据进行数据拟合和归一化处理,得到目标学生的目标学生数据;
分析模块,用于将所述目标学生数据输入预设学生数据分析模型进行多维度数据分析,并按照预设的标签规则生成所述目标学生的学习内容标签和学生属性标签;
构建模块,用于基于所述学习内容标签和所述学生属性标签进行建模,构建所述目标学生的在线学习行为画像,并根据所述在线学习行为画像和预设聚类算法,筛选出与所述目标学生相似的相似学生;
展示模块,用于确定与所述相似学生对应的在线课程和学习方法,并基于预设授课标识将所述在线课程和所述学习方法展示给所述目标学生,实现在线学习。
9.一种基于数据分析的在线学习设备,其特征在于,所述基于数据分析的在线学习设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于数据分析的在线学习设备执行如权利要求1-7中任一项所述的基于数据分析的在线学习方法的各个步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于数据分析的在线学习方法的各个步骤。
CN202310715258.9A 2023-06-15 2023-06-15 基于数据分析的在线学习方法、装置、设备及存储介质 Pending CN116777692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310715258.9A CN116777692A (zh) 2023-06-15 2023-06-15 基于数据分析的在线学习方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310715258.9A CN116777692A (zh) 2023-06-15 2023-06-15 基于数据分析的在线学习方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116777692A true CN116777692A (zh) 2023-09-19

Family

ID=87985330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310715258.9A Pending CN116777692A (zh) 2023-06-15 2023-06-15 基于数据分析的在线学习方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116777692A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117474353A (zh) * 2023-10-27 2024-01-30 国家开放大学 一种基于在线教育的决策自动生成方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117474353A (zh) * 2023-10-27 2024-01-30 国家开放大学 一种基于在线教育的决策自动生成方法和装置

Similar Documents

Publication Publication Date Title
Kühl et al. Supporting customer-oriented marketing with artificial intelligence: automatically quantifying customer needs from social media
Sun et al. Discovering themes and trends in transportation research using topic modeling
CN110163647B (zh) 一种数据处理方法及装置
CN109145216A (zh) 网络舆情监控方法、装置及存储介质
CN114238573B (zh) 基于文本对抗样例的信息推送方法及装置
CN109522562B (zh) 一种基于文本图像融合识别的网页知识抽取方法
Hassan et al. Sentiment analysis from images of natural disasters
CN111783712A (zh) 一种视频处理方法、装置、设备及介质
CN110972499A (zh) 神经网络的标注系统
CN113139141A (zh) 用户标签扩展标注方法、装置、设备及存储介质
US20210374681A1 (en) System and method for providing job recommendations based on users' latent skills
CN111696656B (zh) 一种互联网医疗平台的医生评价方法、装置
Ikawati et al. Student behavior analysis to detect learning styles in Moodle learning management system
KR20200145299A (ko) 온라인 면접 동영상 분석 및 소셜미디어 정보분석 기반 지능형 채용지원 플랫폼
CN116777692A (zh) 基于数据分析的在线学习方法、装置、设备及存储介质
CN115203338A (zh) 一种标签及标签实例推荐方法
CN114491034B (zh) 一种文本分类方法及智能设备
CN110929169A (zh) 基于改进Canopy聚类协同过滤算法的职位推荐方法
CN114862140A (zh) 基于行为分析的潜力评估方法、装置、设备及存储介质
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN112883018A (zh) 基于大数据分析的银行业人才信息预测方法及装置
CN110414621B (zh) 基于多示例学习的分类器构建方法及装置
Pohl et al. Active online learning for social media analysis to support crisis management
Bedruz et al. Analysis of big data technologies for policy building in the Philippines
CN115203532A (zh) 一种项目推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination