CN112184500A - 基于深度学习和知识图谱的课外学习辅导系统及实现方法 - Google Patents
基于深度学习和知识图谱的课外学习辅导系统及实现方法 Download PDFInfo
- Publication number
- CN112184500A CN112184500A CN201910596244.3A CN201910596244A CN112184500A CN 112184500 A CN112184500 A CN 112184500A CN 201910596244 A CN201910596244 A CN 201910596244A CN 112184500 A CN112184500 A CN 112184500A
- Authority
- CN
- China
- Prior art keywords
- learning
- knowledge
- students
- data
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000013135 deep learning Methods 0.000 title claims abstract description 28
- 230000006399 behavior Effects 0.000 claims abstract description 30
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000012552 review Methods 0.000 claims abstract description 16
- 238000003745 diagnosis Methods 0.000 claims abstract description 11
- 238000013456 study Methods 0.000 claims abstract description 11
- 238000013507 mapping Methods 0.000 claims abstract description 7
- 230000001149 cognitive effect Effects 0.000 claims abstract description 5
- 238000005728 strengthening Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000010561 standard procedure Methods 0.000 claims description 3
- 230000009897 systematic effect Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000003930 cognitive ability Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000576 supplementary effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/02—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
- G09B7/04—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying a further explanation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了辅导学习技术领域的基于深度学习和知识图谱的课外学习辅导系统及实现方法,包括如下步骤:步骤一、对学习的资源、题目进行资源标签化,对学生、教师及其他的社群标签化,并形成知识图谱化;步骤二、学生预习、复习回顾,在线看资源;学生做作业、学习、考试、在线做题目;步骤三、收集学生学习过程和结果数据,收集学生社群的学习行为数据,基于认知模型、知识结构进行诊断分析,生成学生学情报告、学生画像,加入到知识图谱中,并进一步完善学习资源、题目、学生、教师、社群的标签,强化知识图谱,本发明在学生课外学习的教学练测评过程,引入了学生认知能力模型,采用深度学习和知识图谱的技术,提供中小学生课外个性化学习辅导。
Description
技术领域
本发明涉及辅导学习技术领域,特别是涉及基于深度学习和知识图谱的课外学习辅导系统及实现方法。
背景技术
首先,中小学生课外的学习内容很广,其中针对考试所需的学科进行课外学习辅导的范围也存在一定的广度。不同阶段的学习内容范围不同,不同地区的教材也不尽相同,即使采用全国卷的不同省份,考查范围又不完全相同,更不用说不同地区、不同学校的不同阶段考查内容也有所不同了。其次,影响学习效果的因素很多,包括人的状态、学习内容、学习过程、心态、考查内容等等。不同因素在不同人不同的时期,影响的程度也不同。因此,学生学习的知识结构需要考虑地区、学校的差异;影响学生学习考试的因素需要针对性的采集分析。
现有同类产品/同类处理方法,常见的类别包括:
(1)基于知识点图谱为主的个性化推荐资源的学习系统。基于使用的资源对象(如题目、课程)进行标签化,通过机器学习和深度学习等技术,进行数据建模,推荐不同的学生使用不同的资源,从而达到个性化学习路径规划。
基于知识点图谱的产品/方法,主要是梳理知识点体系,精细化知识点并建立知识点之间联系,形成网状交叉纵横的标准化知识点图谱。在此基础上,通过人工和机器对线上的课程/题目等资源进行统一打标签,给资源加上知识点标签,形成知识点图谱化的结构性课程/题目等资源。学生在线学习这些结构性的课程/做结构性的题目,通过聚类等算法,对学生学习的内容结果进行分析,生成不同学生的学习画像和知识结构,基于画像和知识结构,进行推荐学习课程/题目等资源。该方法的实现逻辑类似于电商平台推荐商品。用户购买标签化好的产品,平台推荐可能标签关联的商品。这里对商品的标签化,类似与对学习课程/题目的标签化。而商品标签之间的关系,就类似知识点图谱的关系。
相似的产品/处理方法,例如:个性化作业系统及其作业方法专利申请号为201410290164.2、一种表征学习者在特定领域知识学习掌握状态的在线学习认知地图生成系统及方法专利申请号为201610797877.7。
(2)基于用户行为分析为主的个性化推荐资源的学习系统。通过学生在线学习的行为数据持续收集或线下数据录入、扫描等汇总收集,形成用户一段时间的数据集,通过数据挖掘学生学习习惯、喜好等,诊断不同学生的学情,并推荐不同的学生使用不同的资源,从而达到个性化学习路径规划。
基于用户行为分析的产品/方法,主要是依托收集用户的学习行为数据,分析学生的潜在学习情况,并规划学生学习的路径。学生的学习行为数据包括线下定期考试、排名、上课表现等和线上的学习课程内容、时长、做题目数量以及正确率等进行分析,通过分类、聚类、回归等算法,提供学习学习的重点和方向。该类产品/方法类似于BI分析,通过数据的采集、加工、建模、分析,并提供结果用于辅助决策。
如图1-2所示,现有技术的处理方法的流程,主要步骤如下:
(1)对学习的资源进行知识图谱化;
(2)学生在线学习,看资源、做题目;
(3)收集学生学习数据,进行诊断分析;
(4)规划学生学习路径和计划,推荐资源和题目
基于以上情况,目前的两种产品/处理方法,存在一定的不足和缺陷的地方。
(1)基于知识点图谱的产品/方法。首先,知识点的范围广,跟版本、地区等有关,很难统一,需要依托大量人工完成初始化建模。该工作需要考虑现有的不同的教材、不同的考纲,而且教材未来差异化还会进一步扩大,搭建覆盖全版本和全地区的标准化知识点图谱几乎不可能。如果不完整,知识点图谱的价值又会被削弱。学生学习过程中,对不同知识掌握情况和关联关系的知识点推荐,会存在一定的误差。其次,知识点的掌握熟练度很难等同于相同知识点及其相关题型、难度的题目正确率,因此题目涉及的知识点和考查目标(主要指解题思路和方法)不完全等同。例如,高中的几何题,可以用几何的解法、也可以用坐标方程、也可以用计算的方法等等。综上所述,目前基于知识点图谱的产品/方法,碰到难以知识结构很难统一化、标准化的问题;又缺乏与考查的目标(方法、思想)结合的延伸,因此基于知识点图谱的产品/方法,只能解决一部分个性化学习的工作,针对中小学生考试的补充作用就更弱了。
(2)基于用户行为分析的产品/方法。首先,影响学生学习效果(尤其是考试)的因素很多,不同时期不同的人,又存在很大差异。现有的基于用户行为分析的产品/方法,往往以过往学习结果数据(例如考试成绩)和学习过程数据(例如课程表现)构建数据模型,这些数据分析结果的区分度不够明显,从而影响对群体和个体的差异分析,无法做到更精细的个性化学习。其次,收集的数据覆盖学习范围不完整,很多重要的学习过程数据缺失,例如学生自主学习的数据,错题分析数据等。其中学生独立回顾课堂内容,自主学习、总结等以及教师教学重点、命题人出题等数据,往往又是缺失的部分。综上所述,目前基于用户行为分析的产品/方法,关于影响学习效果层面的用户数据指标缺乏广度和深度,对个性化学习筛查还需要进一步加强。
基于此,本发明设计了基于深度学习和知识图谱的课外学习辅导系统及实现方法,以解决上述问题。
发明内容
为了解决目前知识点图谱结构化工作量大,标准难,维护工作量大,极度依赖人力投入。集中维护满足了的统一性和规范性,但是满足不了地区和学校的差异性需求以及用户行为分析需要获取更多的学生学习行为,尤其是过程数据。现有的用户行为更多的是侧重学习结果为主,过程为辅的数据收集模式,会导致数据模型的缺失的问题,本发明的目的是提供基于深度学习和知识图谱的课外学习辅导系统及实现方法。
为了实现上述目的,本发明采用如下技术方案:
基于深度学习和知识图谱的课外学习辅导实现方法,包括如下步骤:
步骤一、对学习的资源、题目进行资源标签化,对学生、教师及其他的社群标签化,并形成知识图谱化;
步骤二、学生预习、复习回顾,在线看资源;学生做作业、学习、考试、在线做题目;
步骤三、收集学生学习过程和结果数据,收集学生社群的学习行为数据,基于认知模型、知识结构进行诊断分析,生成学生学情报告、学生画像,加入到知识图谱中,并进一步完善学习资源、题目、学生、教师、社群的标签,强化知识图谱;
步骤四、基于知识图谱,规划学生学习路径和计划,推荐资源和题目,进入新一轮的学习流程。
优选的,所述步骤三中包括有收集数据、知识抽取、知识融合、深度学习抽取数据训练模型以及调用模型推荐学习资源。
优选的,所述步骤一中的资源标签化包括不同的教师对题目进行属性标签标注、学生对题目进行行为标签标注、平台对该题目及相似属性的题目标注不同学生学习数据以及对教师上传题目、布置作业的题目、考试的题目进行系统自动标注。
优选的,所述收集数据包括从数据库的用户属性表抽取学生基础属性数据、从非关系型数据库的用户行为表抽取学生行为数据、从数据库的资源表抽取资源的属性数据以及从数据库的题库表抽取题目属性数据。
优选的,所述知识抽取包括对收集的数据应用具有语言识别能力的信息抽取工具抽取用户和资源的实体、抽取用户和资源属性、抽取实体和属性之间的分类关系,并生成分类结果为实体对间某一关系成立的期望值。
优选的,所述知识融合通过网络嵌入获得结构化知识的向量化表示,然后分别用堆叠去噪自动编码器和层叠卷积自编码器抽取文本知识特征和图片知识特征,通过NER能识别出的实体对,根据该实体对的上下文特征做出判断;APCNNs模型保证实体在语料中出现的次数高于一定的阈值,如min_count>=5,保证该实体有word2vec的向量表示;bag中有一定数量的sentence,便于选取相似度高的用于训练;Deepdive对输出结果正误的判断针对单个语句,相同实体对出现在不同的语句中可能给出完全不同的预测结果。
优选的,所述深度学习抽取数据训练模型的实现方法包括抽取知识图谱和用户表的数据,对数据进行预处理后,得到了两个文件:kg_final和rating_final;rating_final数据形式如下,三列分别是user-id,item-id以及label,分别代表h,r,t;网络输入主要有item的id,label以及对应的用户的ripple set;embedding层构建主要有entity的embedding和relation的embedding,embedding的长度为dim,relation用来链接head和tail的,它的embedding的维度为dim*dim;建立一个transform_matrix的tensor,用来更新计算过程中的item-embedding的,采用两个函数_key_addressing()和predict(),_key_addressing()是用来的olist的,即在RippleNet中的绿色矩形表示的向量:计算rippleset中每一个(h,r,t)和item-embedding的相关性,在每一个hop计算完成后,进行update_item_embedding的操作;选择不同的替换策略:在得到olist之后,用olist里面最后一个向量,选择相加所有的向量,来代表user-embedding,并最终计算得到预测值:计算损失;模型的loss最终由三部分组成,在取对数后,三部分损失分别表示对数损失、知识图谱特征表示的损失,正则化损失;采用spark.ML进行协同过滤算法训练,用户和产品用预测缺失条目的一小组潜在因素来描述;spark.ml使用交替最小二乘算法来学习这些潜在因素;算法实现中spark.ml提供有以下参数:numBlocks是为了并行化计算而将用户和项目分割成的块的数量;rank是模型中潜在因子的数量;maxIter是要运行的最大迭代次数;regParam指定ALS中的正则化参数;implicitPrefs显示的反馈ALS或者隐式的反馈ALS;认是false,显示反馈ALS;alpha偏好观察中置信度,用于隐式反馈ALS;默认值是1;nonnegative指定是否对最小二乘使用非负约束;显式与隐式反馈;基于矩阵分解的协作过滤的标准方法将用户条目矩阵中的条目视为用户对该项目的显式偏好,给题目进打标签;设置访问隐式反馈。
优选的,所述调用模型推荐学习资源用于调用推荐算法模型,推荐不同的题目。
基于深度学习和知识图谱的课外学习辅导系统,其特征在于:包括资源模块,用于学生在线学习、复习回顾看资源;教师在线上传资源、资源打标签;
作业模块,用于学生在线做作业、查看作业报告、查看作业错题、学生错题分析;教师在线布置作业、批阅作业、查看作业报告、查看班级错题、班级错题分析;
题库模块,用于学生在线自助做练习、系统推荐练习;教师在线发布题目、题目打标签;
个人中心,用于学生在线查看学习过程数据、学习报告、诊断;教师在线查看班级学生学习过程数据、学习报告、诊断评估。
与现有技术相比,本发明实现的有益效果:本发明可以在学生课外学习的教学练测评过程,引入了学生认知能力模型,采用深度学习和知识图谱的技术,提供中小学生课外个性化学习辅导。
通过知识图谱技术,对知识点建立自然语义关联,通过题目、教学资源、课程等标签化的数据收集为主,辅助管理维护,解决知识点结构关系维护工作量大的问题。通过知识图谱,收集学生、教师等行为数据,并通过自然语义,构建用户画像,并结合学生的认知模型,并个性化推荐学习内容。
通过深度学习技术,在教学练测评的过程中,强化学生与学生、学生与教师、教师与教师以及题目与题目、资源与资源、课程与课程之间的属性、行为等关联关系,并寻找出相对只适合路径,提供个性化学习内容推荐
附图说明
以下结合附图和具体实施方式来进一步详细说明本发明:
图1-2为现有技术实施流程图;
图3为本发明整体流程框图;
图4为本发明系统构架图;
图5为本发明工作原理图
图6为本发明产品工作过程图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。
实施例一
请参阅图1至图6。本发明提供一种技术方案:基于深度学习和知识图谱的课外学习辅导实现方法,包括如下步骤:
步骤一、对学习的资源、题目进行资源标签化,对学生、教师及其他的社群标签化,并形成知识图谱化;
步骤二、学生预习、复习回顾,在线看资源;学生做作业、学习、考试、在线做题目;
步骤三、收集学生学习过程和结果数据,收集学生社群的学习行为数据,基于认知模型、知识结构进行诊断分析,生成学生学情报告、学生画像,加入到知识图谱中,并进一步完善学习资源、题目、学生、教师、社群的标签,强化知识图谱;
步骤四、基于知识图谱,规划学生学习路径和计划,推荐资源和题目,进入新一轮的学习流程。
更进一步的实施方式为,所述步骤三中包括有收集数据、知识抽取、知识融合、深度学习抽取数据训练模型以及调用模型推荐学习资源;可以便于实现对收集数据进行数据训练和知识推荐管理。
更进一步的实施方式为,所述步骤一中的资源标签化包括不同的教师对题目进行属性标签标注、学生对题目进行行为标签标注、平台对该题目及相似属性的题目标注不同学生学习数据以及对教师上传题目、布置作业的题目、考试的题目进行系统自动标注;不同的教师对题目进行属性标签标注,包括学科、学段、难度、题型、所属知识点、知识点分类、考查方法等。学生对题目进行行为标签标注,包括复习次数、重要程度、错误原因等。平台对该题目及相似属性的题目标注不同学生学习数据,包括不同的学生做题的正确率、学习频率、时长等行为数据。对教师上传题目、布置作业的题目、考试的题目等进行系统自动标注,包括出题难度、题型、所属知识点、重复率等。
更进一步的实施方式为,所述收集数据包括从数据库的用户属性表抽取学生基础属性数据、从非关系型数据库的用户行为表抽取学生行为数据、从数据库的资源表抽取资源的属性数据以及从数据库的题库表抽取题目属性数据;从数据库的用户属性表user_student抽取学生基础属性数据,包括ID、学段、所在学校、性别;从NoSQL数据库的用户行为表user_behavior抽取学生行为数据,包括ID、学习时长、题目ID、答题状态、答题答案、学习时间等;从数据库的资源表library_resource抽取资源的属性数据,包括资源ID、资源标题、学科、学段、所属章节、所属知识点、附件文件等;从数据库的题库表library_topic抽取题目属性数据,包括题目ID、题目内容、题目答案、学科、学段、所属章节、所属知识点、题型、难度等。
更进一步的实施方式为,所述知识抽取包括对收集的数据应用具有语言识别能力的信息抽取工具抽取用户和资源的实体、抽取用户和资源属性、抽取实体和属性之间的分类关系,并生成分类结果为实体对间某一关系成立的期望值;针对不同的关系,可以运营不同的规则,通过基于规则的标注能较好地提升训练集的标注准确率。学生做练习、看资源等多分类问题采用APCNNs模型,分类结果为relation集合中的关系得分排序。无需针对relation集合中特定的某个关系做规则运营。
更进一步的实施方式为,所述知识融合通过网络嵌入获得结构化知识的向量化表示,然后分别用堆叠去噪自动编码器和层叠卷积自编码器抽取文本知识特征和图片知识特征,通过NER能识别出的实体对,根据该实体对的上下文特征做出判断;APCNNs模型保证实体在语料中出现的次数高于一定的阈值,如min_count>=5,保证该实体有word2vec的向量表示;bag中有一定数量的sentence,便于选取相似度高的用于训练;Deepdive对输出结果正误的判断针对单个语句,相同实体对出现在不同的语句中可能给出完全不同的预测结果;测试需要结合原语句判断结果是否准确,方便进行人工验证。APCNNs模型针对特定的实体对做判断,对于给定的实体对,系统给出一致的输出结果。对于新数据的结果正确性判断,需要结合中间结果,对包中被选取的句子集合进行提取和验证,生成知识图谱存入neo4j。
更进一步的实施方式为,所述深度学习抽取数据训练模型的实现方法包括抽取知识图谱和用户表的数据,对数据进行预处理后,得到了两个文件:kg_final和rating_final;rating_final数据形式如下,三列分别是user-id,item-id以及label,分别代表h,r,t(entity和item用的是同一套id);网络输入主要有item的id,label以及对应的用户的ripple set;embedding层构建主要有entity的embedding和relation的embedding,embedding的长度为dim,relation用来链接head和tail的,它的embedding的维度为dim*dim;建立一个transform_matrix的tensor,用来更新计算过程中的item-embedding的,采用两个函数_key_addressing()和predict(),_key_addressing()是用来的olist的,即在RippleNet中的绿色矩形表示的向量:计算ripple set中每一个(h,r,t)和item-embedding的相关性,在每一个hop计算完成后,进行update_item_embedding的操作;选择不同的替换策略:在得到olist之后,用olist里面最后一个向量,选择相加所有的向量,来代表user-embedding,并最终计算得到预测值:计算损失;模型的loss最终由三部分组成,在取对数后,三部分损失分别表示对数损失、知识图谱特征表示的损失,正则化损失;采用spark.ML进行协同过滤算法训练,用户和产品用预测缺失条目的一小组潜在因素来描述;spark.ml使用交替最小二乘(ALS)算法来学习这些潜在因素;算法实现中spark.ml提供有以下参数:numBlocks是为了并行化计算而将用户和项目分割成的块的数量(默认为10);rank是模型中潜在因子的数量(默认为10);maxIter是要运行的最大迭代次数(默认为10);regParam指定ALS中的正则化参数(默认为1.0);implicitPrefs显示的反馈ALS(true,显示的表示偏好程度)或者隐式的反馈ALS(false隐式指定偏好);认是false,显示反馈ALS;alpha偏好观察中置信度(可理解为一个系数),用于隐式反馈ALS;默认值是1;nonnegative指定是否对最小二乘使用非负约束(默认为false);显式与隐式反馈;基于矩阵分解的协作过滤的标准方法将用户条目矩阵中的条目视为用户对该项目的显式偏好,给题目进打标签;设置访问隐式反馈(优选为观看,点击,购买,收藏,分享等)。这种方法是根据用户的行为(点击次数,停留时间),将其视为数字,代表用户对题目的可能犯错的程度。这些数字与观察到的用户偏好的置信度相关,不是与题目的显式评分。该模型将尝试找出可以用来预测用户对于某一项目的预期偏好的潜在因子。调整的正则化参数regParam,根据用户在更新用户因子时产生的评分数或者题目在更新题目因子时收到的评分数来解决每个最小二乘问题。选用ALS-WR算法(ALS with Weighted-λ-Regularization)对regParam数据集规模的依赖较小,从采样子集学习到的最佳参数应用于整个数据集,并有相似的性能。使用ALSModel进行预测时,在生产中,对于没有评级历史记录且未进行模型训练的新用户或题目。在交叉验证过程中,数据分为训练集和评估集。当评估集不在训练集中的用户和项目,Spark中的使用简单随机拆分为CrossValidator或者TrainValidationSplit。Spark在ALSModel.transform用户和项目因素不存在于模型中时分配NaN预测。在交叉验证期间是不希望的,任何NaN预测值都将影响NaN评估度量的结果。Spark允许用户将coldStartStrategy参数设置为“drop”,以便删除DataFrame包含NaN值的预测中的任何行。通过训练后得到用户向量和资源向量的推荐模型。
更进一步的实施方式为,所述调用模型推荐学习资源用于调用推荐算法模型,推荐不同的题目;题目涉及学生近期薄弱知识点、易错题型等题目以及同班、同校、同地区的学生以及具备有相似认知能力的其他学生群体相关的题目。
实施例二
基于深度学习和知识图谱的课外学习辅导系统,其特征在于:包括资源模块,用于学生在线学习、复习回顾看资源;教师在线上传资源、资源打标签;
作业模块,用于学生在线做作业、查看作业报告、查看作业错题、学生错题分析;教师在线布置作业、批阅作业、查看作业报告、查看班级错题、班级错题分析;
题库模块,用于学生在线自助做练习、系统推荐练习;教师在线发布题目、题目打标签;
个人中心,用于学生在线查看学习过程数据、学习报告、诊断;教师在线查看班级学生学习过程数据、学习报告、诊断评估;
通过教师在线和学生之间的互动课外教学,可以更好的帮助有需要的学生进行辅导培训。
须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (9)
1.基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:包括如下步骤:
步骤一、对学习的资源、题目进行资源标签化,对学生、教师及其他的社群标签化,并形成知识图谱化;
步骤二、学生预习、复习回顾,在线看资源;学生做作业、学习、考试、在线做题目;
步骤三、收集学生学习过程和结果数据,收集学生社群的学习行为数据,基于认知模型、知识结构进行诊断分析,生成学生学情报告、学生画像,加入到知识图谱中,并进一步完善学习资源、题目、学生、教师、社群的标签,强化知识图谱;
步骤四、基于知识图谱,规划学生学习路径和计划,推荐资源和题目,进入新一轮的学习流程。
2.根据权利要求1所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述步骤三中包括有收集数据、知识抽取、知识融合、深度学习抽取数据训练模型以及调用模型推荐学习资源。
3.根据权利要求1所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述步骤一中的资源标签化包括不同的教师对题目进行属性标签标注、学生对题目进行行为标签标注、平台对该题目及相似属性的题目标注不同学生学习数据以及对教师上传题目、布置作业的题目、考试的题目进行系统自动标注。
4.根据权利要求2所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述收集数据包括从数据库的用户属性表抽取学生基础属性数据、从非关系型数据库的用户行为表抽取学生行为数据、从数据库的资源表抽取资源的属性数据以及从数据库的题库表抽取题目属性数据。
5.根据权利要求2所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述知识抽取包括对收集的数据应用具有语言识别能力的信息抽取工具抽取用户和资源的实体、抽取用户和资源属性、抽取实体和属性之间的分类关系,并生成分类结果为实体对间某一关系成立的期望值。
6.根据权利要求2所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述知识融合通过网络嵌入获得结构化知识的向量化表示,然后分别用堆叠去噪自动编码器和层叠卷积自编码器抽取文本知识特征和图片知识特征,通过NER能识别出的实体对,根据该实体对的上下文特征做出判断;APCNNs模型保证实体在语料中出现的次数高于一定的阈值,如min_count>=5,保证该实体有word2vec的向量表示;bag中有一定数量的sentence,便于选取相似度高的用于训练;Deepdive对输出结果正误的判断针对单个语句,相同实体对出现在不同的语句中可能给出完全不同的预测结果。
7.根据权利要求2所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述深度学习抽取数据训练模型的实现方法包括抽取知识图谱和用户表的数据,对数据进行预处理后,得到了两个文件:kg_final和rating_final;rating_final数据形式如下,三列分别是user-id,item-id以及label,分别代表h,r,t;网络输入主要有item的id,label以及对应的用户的ripple set;embedding层构建主要有entity的embedding和relation的embedding,embedding的长度为dim,relation用来链接head和tail的,它的embedding的维度为dim*dim;建立一个transform_matrix的tensor,用来更新计算过程中的item-embedding的,采用两个函数_key_addressing()和predict(),_key_addressing()是用来的olist的,即在RippleNet中的绿色矩形表示的向量:计算ripple set中每一个(h,r,t)和item-embedding的相关性,在每一个hop计算完成后,进行update_item_embedding的操作;选择不同的替换策略:在得到olist之后,用olist里面最后一个向量,选择相加所有的向量,来代表user-embedding,并最终计算得到预测值:计算损失;模型的loss最终由三部分组成,在取对数后,三部分损失分别表示对数损失、知识图谱特征表示的损失,正则化损失;采用spark.ML进行协同过滤算法训练,用户和产品用预测缺失条目的一小组潜在因素来描述;spark.ml使用交替最小二乘算法来学习这些潜在因素;算法实现中spark.ml提供有以下参数:numBlocks是为了并行化计算而将用户和项目分割成的块的数量;rank是模型中潜在因子的数量;maxIter是要运行的最大迭代次数;regParam指定ALS中的正则化参数;implicitPrefs显示的反馈ALS或者隐式的反馈ALS;认是false,显示反馈ALS;alpha偏好观察中置信度,用于隐式反馈ALS;默认值是1;nonnegative指定是否对最小二乘使用非负约束;显式与隐式反馈;基于矩阵分解的协作过滤的标准方法将用户条目矩阵中的条目视为用户对该项目的显式偏好,给题目进打标签;设置访问隐式反馈。
8.根据权利要求2所述的基于深度学习和知识图谱的课外学习辅导实现方法,其特征在于:所述调用模型推荐学习资源用于调用推荐算法模型,推荐不同的题目。
9.基于深度学习和知识图谱的课外学习辅导系统,其特征在于:包括资源模块,用于学生在线学习、复习回顾看资源;教师在线上传资源、资源打标签;
作业模块,用于学生在线做作业、查看作业报告、查看作业错题、学生错题分析;教师在线布置作业、批阅作业、查看作业报告、查看班级错题、班级错题分析;
题库模块,用于学生在线自助做练习、系统推荐练习;教师在线发布题目、题目打标签;
个人中心,用于学生在线查看学习过程数据、学习报告、诊断;教师在线查看班级学生学习过程数据、学习报告、诊断评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910596244.3A CN112184500A (zh) | 2019-07-03 | 2019-07-03 | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910596244.3A CN112184500A (zh) | 2019-07-03 | 2019-07-03 | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112184500A true CN112184500A (zh) | 2021-01-05 |
Family
ID=73914499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910596244.3A Pending CN112184500A (zh) | 2019-07-03 | 2019-07-03 | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112184500A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380359A (zh) * | 2021-01-18 | 2021-02-19 | 平安科技(深圳)有限公司 | 基于知识图谱的培训资源分配方法、装置、设备及介质 |
CN112734142A (zh) * | 2021-04-02 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于深度学习的资源学习路径规划方法及装置 |
CN112948650A (zh) * | 2021-03-31 | 2021-06-11 | 北京大米科技有限公司 | 学习效果展示方法、装置及计算机存储介质 |
CN113221566A (zh) * | 2021-05-08 | 2021-08-06 | 北京百度网讯科技有限公司 | 实体关系抽取方法、装置、电子设备和存储介质 |
CN113610237A (zh) * | 2021-08-19 | 2021-11-05 | 北京京东乾石科技有限公司 | 学习路径规划方法及装置 |
CN113672809A (zh) * | 2021-08-18 | 2021-11-19 | 广州创显科教股份有限公司 | 一种基于个性化推荐算法的智能导学方法及系统 |
CN113761030A (zh) * | 2021-09-07 | 2021-12-07 | 辽宁铂阳科技集团有限公司 | 一种错题统计分析系统 |
CN114020929A (zh) * | 2021-11-03 | 2022-02-08 | 北京航空航天大学 | 一种基于课程知识图谱的智慧教育系统平台设计方法 |
CN114492848A (zh) * | 2022-01-13 | 2022-05-13 | 成都合源美智教育科技有限公司 | 一种兼容多学习模型的自适应学习系统、方法及应用 |
CN114817560A (zh) * | 2022-04-15 | 2022-07-29 | 华南师范大学 | 一种基于级联深度图谱知识的慕课智能推荐方法及系统 |
CN114912656A (zh) * | 2022-04-07 | 2022-08-16 | 浙江师范大学 | 基于多模态互补图神经网络的认知诊断方法和系统 |
CN115422347A (zh) * | 2022-07-25 | 2022-12-02 | 海南科技职业大学 | 一种基于知识图谱的中文课程教案生成方法 |
CN116244512A (zh) * | 2023-01-17 | 2023-06-09 | 航天物联网技术有限公司 | 一种基于图结构数据的军事体能训练智能推荐方法 |
CN116433427A (zh) * | 2023-03-10 | 2023-07-14 | 四川生学教育科技有限公司 | 一种个性化学习生涯数据画像方法及系统 |
CN117114939A (zh) * | 2023-10-18 | 2023-11-24 | 朗朗教育科技股份有限公司 | 多用户协同的学前智慧课堂管理系统 |
CN117952072A (zh) * | 2024-03-22 | 2024-04-30 | 浙江蓝鸽科技有限公司 | Ai校本化英语教材编辑方法及系统 |
-
2019
- 2019-07-03 CN CN201910596244.3A patent/CN112184500A/zh active Pending
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380359A (zh) * | 2021-01-18 | 2021-02-19 | 平安科技(深圳)有限公司 | 基于知识图谱的培训资源分配方法、装置、设备及介质 |
CN112380359B (zh) * | 2021-01-18 | 2021-04-20 | 平安科技(深圳)有限公司 | 基于知识图谱的培训资源分配方法、装置、设备及介质 |
CN112948650A (zh) * | 2021-03-31 | 2021-06-11 | 北京大米科技有限公司 | 学习效果展示方法、装置及计算机存储介质 |
CN112948650B (zh) * | 2021-03-31 | 2024-04-12 | 北京大米科技有限公司 | 学习效果展示方法、装置及计算机存储介质 |
CN112734142A (zh) * | 2021-04-02 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于深度学习的资源学习路径规划方法及装置 |
CN112734142B (zh) * | 2021-04-02 | 2021-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的资源学习路径规划方法及装置 |
CN113221566A (zh) * | 2021-05-08 | 2021-08-06 | 北京百度网讯科技有限公司 | 实体关系抽取方法、装置、电子设备和存储介质 |
CN113221566B (zh) * | 2021-05-08 | 2023-08-01 | 北京百度网讯科技有限公司 | 实体关系抽取方法、装置、电子设备和存储介质 |
CN113672809A (zh) * | 2021-08-18 | 2021-11-19 | 广州创显科教股份有限公司 | 一种基于个性化推荐算法的智能导学方法及系统 |
CN113610237A (zh) * | 2021-08-19 | 2021-11-05 | 北京京东乾石科技有限公司 | 学习路径规划方法及装置 |
CN113761030A (zh) * | 2021-09-07 | 2021-12-07 | 辽宁铂阳科技集团有限公司 | 一种错题统计分析系统 |
CN114020929A (zh) * | 2021-11-03 | 2022-02-08 | 北京航空航天大学 | 一种基于课程知识图谱的智慧教育系统平台设计方法 |
CN114020929B (zh) * | 2021-11-03 | 2024-05-28 | 北京航空航天大学 | 一种基于课程知识图谱的智慧教育系统平台设计方法 |
CN114492848A (zh) * | 2022-01-13 | 2022-05-13 | 成都合源美智教育科技有限公司 | 一种兼容多学习模型的自适应学习系统、方法及应用 |
CN114912656A (zh) * | 2022-04-07 | 2022-08-16 | 浙江师范大学 | 基于多模态互补图神经网络的认知诊断方法和系统 |
CN114817560A (zh) * | 2022-04-15 | 2022-07-29 | 华南师范大学 | 一种基于级联深度图谱知识的慕课智能推荐方法及系统 |
CN115422347A (zh) * | 2022-07-25 | 2022-12-02 | 海南科技职业大学 | 一种基于知识图谱的中文课程教案生成方法 |
CN115422347B (zh) * | 2022-07-25 | 2024-03-22 | 海南科技职业大学 | 一种基于知识图谱的中文课程教案生成方法 |
CN116244512A (zh) * | 2023-01-17 | 2023-06-09 | 航天物联网技术有限公司 | 一种基于图结构数据的军事体能训练智能推荐方法 |
CN116244512B (zh) * | 2023-01-17 | 2024-02-13 | 航天物联网技术有限公司 | 一种基于图结构数据的军事体能训练智能推荐方法 |
CN116433427A (zh) * | 2023-03-10 | 2023-07-14 | 四川生学教育科技有限公司 | 一种个性化学习生涯数据画像方法及系统 |
CN117114939A (zh) * | 2023-10-18 | 2023-11-24 | 朗朗教育科技股份有限公司 | 多用户协同的学前智慧课堂管理系统 |
CN117952072A (zh) * | 2024-03-22 | 2024-04-30 | 浙江蓝鸽科技有限公司 | Ai校本化英语教材编辑方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112184500A (zh) | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 | |
Matzavela et al. | Decision tree learning through a predictive model for student academic performance in intelligent m-learning environments | |
Kotsiantis | Use of machine learning techniques for educational proposes: a decision support system for forecasting students’ grades | |
CN107230174B (zh) | 一种基于网络的在线互动学习系统和方法 | |
Papamitsiou et al. | Learning analytics and educational data mining in practice: A systematic literature review of empirical evidence | |
Zain et al. | Data Mining for Education Decision Support: A Review. | |
Nazaretsky et al. | Empowering teachers with AI: Co-designing a learning analytics tool for personalized instruction in the science classroom | |
CN113886567A (zh) | 一种基于知识图谱的教学方法及系统 | |
CN112287037B (zh) | 一种多实体混合知识图谱构建方法、装置及存储介质 | |
Liu et al. | Collaborative learning team formation: a cognitive modeling perspective | |
CN113851020A (zh) | 一种基于知识图谱的自适应学习平台 | |
Bryfczynski | BeSocratic: An intelligent tutoring system for the recognition, evaluation, and analysis of free-form student input | |
Ilić et al. | Intelligent techniques in e-learning: a literature review | |
Aydoğdu | Educational data mining studies in Turkey: A systematic review | |
JP2024511355A (ja) | 理科教授システム、その使用方法、及びコンピュータ読み取り可能な記憶媒体 | |
CN115544268A (zh) | 一种教学与就业辅助知识图谱的构建及应用方法 | |
Aji et al. | An implementation of C4. 5 classification algorithm to analyze student’s performance | |
Mühling | Investigating knowledge structures in computer science education | |
Dai et al. | An embodied, analogical and disruptive approach of AI pedagogy in upper elementary education: An experimental study | |
Mallikarjun Rao et al. | Prediction of student’s educational performance using machine learning techniques | |
Hussain et al. | Identifying beneficial sessions in an e-learning system using machine learning techniques | |
CN115640403A (zh) | 基于知识图谱的知识管控方法及装置 | |
Mihăescu et al. | Learning analytics solution for building personalized quiz sessions | |
Ayyoub et al. | Learning Style Identification Using Semi-Supervised Self-Taught Labeling | |
Chen et al. | Analysing preservice teachers' reflection journals using text-mining techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |