CN109902298B - 一种自适应学习系统中领域知识建模及知识水平估测方法 - Google Patents

一种自适应学习系统中领域知识建模及知识水平估测方法 Download PDF

Info

Publication number
CN109902298B
CN109902298B CN201910116245.3A CN201910116245A CN109902298B CN 109902298 B CN109902298 B CN 109902298B CN 201910116245 A CN201910116245 A CN 201910116245A CN 109902298 B CN109902298 B CN 109902298B
Authority
CN
China
Prior art keywords
knowledge
entity
marking
domain
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910116245.3A
Other languages
English (en)
Other versions
CN109902298A (zh
Inventor
周东岱
李振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Normal University
Original Assignee
Northeast Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Normal University filed Critical Northeast Normal University
Priority to CN201910116245.3A priority Critical patent/CN109902298B/zh
Publication of CN109902298A publication Critical patent/CN109902298A/zh
Application granted granted Critical
Publication of CN109902298B publication Critical patent/CN109902298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种自适应学习系统中领域知识建模及知识水平估测方法,具体涉及自适应学习领域。其解决了现有教育领域班级化教育服务难以满足个性化教育需求的问题。具体包括基于知识图谱的领域知识建模和基于深度学习技术的知识水平估测两方面的内容。基于知识图谱的领域知识建模包括确定学科知识图谱框架;收集数字教学资源,并分析数字教学资源的文本的结构特点和语言特点,构建用于学科知识图谱抽取的教育语料库:教育语料库包括分词和词性标注、句法分析、命名实体、实体关系四个语料;学科知识图谱构建。基于深度学习技术的知识水平估测包括领域数据预处理与向量化,采用CNN对领域特征进行自动提取,特征向量降维,基于LSTM模型的深度知识追踪。

Description

一种自适应学习系统中领域知识建模及知识水平估测方法
技术领域
本发明涉及自适应学习领域,具体涉及一种自适应学习系统中领域知识建模及知识水平估测方法。
背景技术
我国古代伟大的思想家、教育家孔子在公元前就提出了“因材施教”的教育思想,美国哈佛大学心理学教授霍华德·加德纳也再三强调学校教育改革必须重视“学生个体的差异”。然而,传统教学中,由于班级学生众多,教师凭个人能力很难做到“因材施教”。实践表明,在传统的规模化、流水线教学模式下,教师是知识的传授者,学生是知识的灌输对象,学生的学习主动性、创造性受到很大限制,不利于培养满足21世纪需要的个性化、创新型人才。
自适应学习系统是实现个性化学习的主要技术手段,主要包括领域模型、学习者模型和自适应模型三个核心组件。其中:领域知识模型的核心是领域知识建模,一般采用知识图对主题、概念、知识点、学习活动等内容及其关系进行表征;学习者模型作为自适应学习系统的基础,其实质是对学习者的知识水平进行测评。
领域知识建模方面,目前的主要方法包括概念图、知识地图、认知地图等。研究表明,知识图谱相比概念图、知识地图和认知地图,能够表达更加广泛的实体内容以及丰富的语义关联关系,而且能够基于大数据、机器学习技术进行自动化的构建。知识水平估测方面,主要方法有项目反应理论、认知诊断模型、贝叶斯知识追踪等。随着新一代人工智能的发展,基于深度学习的知识水平估测方法成为新的突破口。
因此,以知识图谱为基础对领域知识进行建模,以深度学习为手段对学习者学科知识水平进行精准估测,对于开展自适应学习、提供个性化学习服务和学习体验,解决我国教育供给中存在的个性化学习服务能力不足问题,具有重大的理论意义和现实的应用价值。
发明内容
本发明的目的是整合领域知识模型和相应的估测方法,以学科知识图谱为基础,以深度学习技术为手段对学习者知识水平进行精准估测,为应用技术提供个性化学习服务和学习体验的自适应学习系统提供更加精准的学习者知识水平估测方法。
本发明具体采用如下技术方案:
一种自适应学习系统中领域知识建模及知识水平估测方法,所述领域知识建模采用知识图谱实现,具体包括以下步骤:
步骤Ⅰ:确定学科知识图谱框架
学科知识图谱采用式(1)表示:
G=(E,R,S) (1)
其中,E={e1,e1,...,e|E|}表示学科知识图谱中的知识实体集合,共包含|E|种不同实体;R={r1,r1,...,r|R|}表示学科知识图谱中的知识关系集合,共包含|R|种不同关系;
Figure BDA0001970234440000021
表示学科知识图谱中的实体及其关系组成的三元组集合;
步骤Ⅱ:对教育语料进行标注;
步骤Ⅲ:学科知识图谱构建。优选地,所述步骤Ⅱ具体包括:
2-1)数据收集与分析:收集数字教学资源,并分析数字教学资源的文本结构特点和语言特点,为语料库的构建提供数据基础;
2-2)构建用于学科知识图谱抽取的教育语料库:教育语料库包括分词和词性标注、句法分析、命名实体、实体关系四个语料;
首先依据学科知识图谱框架的命名实体分类和实体关系分类建立实体和实体关系标注体系;然后针对每类实体和实体关系的标注,制定总体标注原则以及正反标注示例,制定标注规范草稿;再通过三轮以上的预标注和专家评判法,完善形成标准规范;在此基础上,采用领域专家的标注模式,进行命名实体和实体关系语料的标注,形成命名实体语料和实体关系语料。
优选地,所述分词和词性语料库以宾州中文树库标注规范作为基础规范,从教学设计文本中抽取语句,构建分词和词性标注语料。
优选地,所述句法分析标注以宾州中文树库标注规范为基础,结合教学设计和试卷文本的实际标注情况及信息抽取的需要,对标注规范进行迭代修订,最后通过人机互助的方式进行数字化资源的标注工作,形成标注的语法树。
优选地,所述步骤Ⅲ中的学科知识图谱构建具体包括:
3-1)实体识别和关系分类的关键特征提取,总体特征采用式(2)的特征向量表示:
F=(Pre,Suf,Stop,Pos,Wordlen,Distance,...,Simi) (2)
其中,Pre表示前词,Suf表示后词,Stop表示停用词,Pos表示词性特征,Wordlen表示词长特征,Distance表示词距离特性,语义特征指的是词语级别的语义特征,采用连续词袋模型表示词向量,记为w=(v1,v2,...,vm),并基于词向量计算词语的语义相似度特征Simi;
3-2)构建基于半监督方法的联合抽取模型;
3-2-1)基于半监督CRF模型识别命名实体:
应用CRF模型,通过序列标注进行命名实体识别;假设需要标注的词语序列为X=(x1,x2,x3,...,xt),即观察序列;定义Y=(y1,y2,y3,...,yt)为X上对应的标注序列,即状态序列;学科知识命名实体识别问题可转化为:已知观察序列X的条件下,求解状态序列Y的概率P(Y/X)最大时的状态序列,该状态序列即为学科知识命名实体识别问题的标注结果,计算方法如式(3)所示:
Figure BDA0001970234440000031
其中,Z(x)表示归一化因子,fk表示特征函数,λk表示权重参数;
在进行半监督CRF模型训练时,将前述总体特征向量F作为输入,已标注的训练语料采用BIOES规范进行编码,通过最小化未标注数据的条件熵来有效利用未标注数据的信息;具体计算如式(4):
Figure BDA0001970234440000032
3-2-2)基于最大熵模型的实体关系分类
对识别出的实体集合按概率输出大小对其进行排序,记为Ebest1、Ebest2、Ebest3……,对任意n∈E,o∈E′,构建候选实体对(n,o),使用最大熵模型并融入特征向量F对候选实体对进行关系分类,形成关系候选集R,记分类概率为p;
3-2-3)基于反馈阈值的联合学习
以Ebest1、E′best1作为命名实体集合的初始值,分别以EbestN、E′bestM作为候选集合;对于每句中的关系集合R,选取分类概率p最大的关系r,将p与设定的实体反馈阈值q进行比较,若p>q,则加入最终命名实体集合中;同时,当且仅当
Figure BDA0001970234440000033
同时成立时,将关系r加入最终关系集合Rlast
优选地,知识水平估测方法采用CNN对领域特征进行自动提取,再基于LSTM模型进行深度知识追踪,具体步骤包括:
1)领域数据预处理与向量化,并构建数据集
根据建立的学科知识图谱框架,对学科知识内容特征数据和学习者答题数据进行预处理,把输入数据各个维度都中心化为零并进行特征的归一化处理,然后将每位学习者个体差异和答题数据构造成二维向量,并将数据集分割为训练集、开发集和测试集三部分;
2)采用卷积神经网络模型CNN作为特征提取器从训练数据中自动学习影响知识追踪的领域特征
建立由多个卷积层、池化层和全连接层构成的CNN网络,其中:
卷积层由多种不同大小的卷积核来提取多组局部特征图,卷积操作后的输出为式(5):
ci=f(w×xi,i+h-1+b) (5)
其中,w为卷积核,h为窗口长度,b为偏置项,f为激活函数,为加快训练收敛速度,采用ReLu函数作为激活函数,即f(x)=max(0,x);
对卷积层提取出来的特征图进行max-pooling操作,然后通过全连接层的Softmax函数对特征进行计算,从而根据输出的概率值提取出领域特征;假设提取的领域特征向量为M={m1,m2,m3,...,mn},设答题正误的变量为a,则所有的影响知识追踪模型的特征集合表示为式(6)
A=M∪a={m1,m2,m3,...,mn,a} (6);
3)特征向量降维
首先对上述特征进行特征交叉,在此基础上进行one-hot编码、编码特征级联,此过程表达如式(7):
vt=O(C(m1,a))~O(C(m2,a))~...~O(C(mn,a)) (7)
其中,O函数表示对向量进行one-hot编码,C函数表示对特征进行交叉运算,~运算表示对特征编码进行级联;
使用Autoencoder对特征向量进行降维,隐藏层和输出层函数分别为式(8)、(9):
v′t=tanh(Wed·vt+bed) (8)
Figure BDA0001970234440000041
4)知识追踪模型的训练和优化
将上述编码、降维后的向量作为输入,训练基于长短期记忆网络并融入领域特征的深度知识追踪模型,LSTM网络包括输入门i,遗忘门f,输出门o,以及cell单元c,其传递公式如式(10)-(14):
it=σ(wxixt+whiht-1+wcict-1+bi) (10)
ft=σ(wxfxt+whfht-1+wcfct-1+bf) (11)
ct=ft·ct-1+it·tanh(wxcxt+whcht-1+bc) (12)
ot=σ(wxoxt+whoht-1+wcoct+bo) (13)
ht=ot·tanh(ct) (14)
其中,xt为t时刻的输入,w为权重,b为偏置,g代表激活函数,h为当前层的输出,
LSTM网络训练时拟采用交叉熵损失函数,公式如(15)
Figure BDA0001970234440000051
其中,q表示学习者t+1时刻回答的题目,a表示t+1时刻答题的对错情况,δ表示降维后的one-hot编码格式,l表示交叉熵函数,yT表示t时刻的输出。
本发明具有如下有益效果:
自适应学习系统中领域知识建模及知识水平估测方法,以学科知识图谱为基础,以深度学习技术为手段,对于开展自适应学习、提供个性化学习服务和学习体验,解决我国教育供给中存在的个性化学习服务能力不足问题,具有重大的理论意义和现实的应用价值。
附图说明
图1为知识水平估测方法框图。
具体实施方式
下面结合附图和具体实施例对本发明的具体实施方式做进一步说明:
一种自适应学习系统中领域知识建模及知识水平估测方法,所述领域知识建模采用知识图谱实现,具体包括以下步骤:
步骤Ⅰ:确定学科知识图谱框架
学科知识图谱框架是知识图谱体系的最底层模式结构,也就是知识图谱的Schema,学科知识图谱框架包括知识实体类别以及实体关系类别。学科知识图谱的实体包括学科的主题、概念、知识点等,实体关系有包含关系、父子关系、解释关系、因果关系等。
学科知识图谱采用式(1)表示:
G=(E,R,S) (1)
其中,E={e1,e1,...,e|E|}表示学科知识图谱中的知识实体集合,共包含|E|种不同实体;R={r1,r1,...,r|R|}表示学科知识图谱中的知识关系集合,共包含|R|种不同关系;
Figure BDA0001970234440000052
表示学科知识图谱中的实体及其关系组成的三元组集合;
步骤Ⅱ:对教育语料进行标注;
步骤Ⅲ:学科知识图谱构建。
步骤Ⅱ具体包括:
当前,所积累的海量教学设计以及试题试卷数据堪称教育领域的大数据,蕴含了大量的学科知识和教与学策略,是构建学科知识图谱的重要数据源,能够为学科知识图谱实体和实体关系自动抽取提供支持。
2-1)数据收集与分析:收集数字教学资源,并分析数字教学资源的文本的结构特点和语言特点(子语言特性),为语料库的构建提供数据基础;
2-2)构建用于学科知识图谱抽取的教育语料库:教育语料库包括分词和词性标注、句法分析、命名实体、实体关系四个语料;
首先依据学科知识图谱框架的命名实体分类和实体关系分类建立实体和实体关系标注体系;然后针对每类实体和实体关系的标注,制定总体标注原则以及正反标注示例,制定标注规范草稿;再通过三轮以上的预标注和专家评判法,完善形成标准规范;在此基础上,采用领域专家的标注模式,进行命名实体和实体关系语料的标注,形成命名实体语料和实体关系语料。
分词和词性语料库以宾州中文树库((PennChinesetreebank,PCTB))标注规范作为基础规范,从教学设计文本中抽取语句,构建分词和词性标注语料。
句法分析标注以宾州中文树库标注规范为基础,结合教学设计和试卷文本的实际标注情况及信息抽取的需要,对标注规范进行迭代修订,最后通过人机互助的方式进行数字化资源的标注工作,形成标注的语法树。
步骤Ⅲ中的学科知识图谱构建具体包括:
3-1)实体识别和关系分类的关键特征提取,总体特征采用式(2)的特征向量表示:
F=(Pre,Suf,Stop,Pos,Wordlen,Distance,...,Simi) (2)
其中,Pre表示前词,Suf表示后词,Stop表示停用词,Pos表示词性特征,Wordlen表示词长特征,Distance表示词距离特性,语义特征指的是词语级别的语义特征,采用连续词袋模型表示词向量,记为w=(v1,v2,...,vm),并基于词向量计算词语的语义相似度特征Simi;
3-2)构建基于半监督方法的联合抽取模型;
3-2-1)基于半监督CRF模型识别命名实体:
应用CRF模型,通过序列标注进行命名实体识别;假设需要标注的词语序列为X=(x1,x2,x3,...,xt),即观察序列;定义Y=(y1,y2,y3,...,yt)为X上对应的标注序列,即状态序列;学科知识命名实体识别问题可转化为:已知观察序列X的条件下,求解状态序列Y的概率P(Y/X)最大时的状态序列,该状态序列即为学科知识命名实体识别问题的标注结果,计算方法如式(3)所示:
Figure BDA0001970234440000071
其中,Z(x)表示归一化因子,fk表示特征函数,λk表示权重参数;
在进行半监督CRF模型训练时,将前述总体特征向量F作为输入,已标注的训练语料采用BIOES规范进行编码,通过最小化未标注数据的条件熵来有效利用未标注数据的信息;具体计算如式(4):
Figure BDA0001970234440000072
3-2-2)基于最大熵模型的实体关系分类
对识别出的实体集合按概率输出大小对其进行排序,记为Ebest1、Ebest2、Ebest3……,对任意n∈E,o∈E′,构建候选实体对(n,o),使用最大熵模型并融入特征向量F对候选实体对进行关系分类,形成关系候选集R,记分类概率为p;
3-2-3)基于反馈阈值的联合学习
以Ebest1、E′best1作为命名实体集合的初始值,分别以EbestN、E′bestM作为候选集合;对于每句中的关系集合R,选取分类概率p最大的关系r,将p与设定的实体反馈阈值q进行比较,若p>q,则加入最终命名实体集合中;同时,当且仅当
Figure BDA0001970234440000073
同时成立时,将关系r加入最终关系集合Rlast
当前深度知识追踪模型的预测性能与传统模型相比提高并不明显的原因是忽视了学习者间的个体差异以及测试项目内容特征等领域特征。然而,通过特征工程,人工选择领域特征再输入到RNN网络中,费时费力而且难以保证其客观性,同时也与数据驱动的思路相悖。学习者间的个体差异以及测试项目的内容特征实际上可以理解或映射为关于学习者和测试项目的图像,而CNN可作为空间上的深度网络能够较好地实现特征的提取。
本发明中的知识水平估测方法采用CNN对领域特征进行自动提取,再基于LSTM模型进行深度知识追踪。
如图1所示,知识水平估测方法具体包括:
1)领域数据预处理与向量化,并构建数据集
根据建立的学科知识图谱框架,对学科知识内容特征数据和学习者答题数据进行预处理,把输入数据各个维度都中心化为零并进行特征的归一化处理,然后将每位学习者个体差异和答题数据构造成二维向量,并将数据集分割为训练集、开发集和测试集三部分;
2)采用卷积神经网络模型CNN作为特征提取器从训练数据中自动学习影响知识追踪的领域特征
建立由多个卷积层、池化层和全连接层构成的CNN网络,其中:
卷积层由多种不同大小的卷积核来提取多组局部特征图,卷积操作后的输出为式(5):
ci=f(w×xi,i+h-1+b) (5)
其中,w为卷积核,h为窗口长度,b为偏置项,f为激活函数,为加快训练收敛速度,采用ReLu函数作为激活函数,即f(x)=max(0,x);
对卷积层提取出来的特征图进行max-pooling操作,然后通过全连接层的Softmax函数对特征进行计算,从而根据输出的概率值提取出领域特征;假设提取的领域特征向量为M={m1,m2,m3,...,mn},设答题正误的变量为a,则所有的影响知识追踪模型的特征集合表示为式(6)
A=M∪a={m1,m2,m3,...,mn,a} (6);
3)特征向量降维
首先对上述特征进行特征交叉,在此基础上进行one-hot编码、编码特征级联,此过程表达如式(7):
vt=O(C(m1,a))~O(C(m2,a))~...~O(C(mn,a)) (7)
其中,O函数表示对向量进行one-hot编码,C函数表示对特征进行交叉运算,~运算表示对特征编码进行级联;
使用Autoencoder对特征向量进行降维,隐藏层和输出层函数分别为式(8)、(9):
vt′=tanh(Wed·vt+bed) (8)
Figure BDA0001970234440000081
4)知识追踪模型的训练和优化
将上述编码、降维后的向量作为输入,训练基于长短期记忆网络并融入领域特征的深度知识追踪模型,LSTM网络包括输入门i,遗忘门f,输出门o,以及cell单元c,其传递公式如式(10)-(14):
it=σ(wxixt+whiht-1+wcict-1+bi) (10)
ft=σ(wxfxt+whfht-1+wcfct-1+bf) (11)
ct=ft·ct-1+it·tanh(wxcxt+whcht-1+bc) (12)
ot=σ(wxoxt+whoht-1+wcoct+bo) (13)
ht=ot·tanh(ct) (14)
其中,xt为t时刻的输入,w为权重,b为偏置,g代表激活函数,h为当前层的输出,
LSTM网络训练时拟采用交叉熵损失函数,公式如(15)
Figure BDA0001970234440000091
其中,q表示学习者t+1时刻回答的题目,a表示t+1时刻答题的对错情况,δ表示降维后的one-hot编码格式,l表示交叉熵函数,yT表示t时刻的输出。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (2)

1.一种自适应学习系统中领域知识建模及知识水平估测方法,所述领域知识建模采用知识图谱实现,其特征在于,具体包括以下步骤:
步骤Ⅰ:确定学科知识图谱框架,学科知识图谱采用式(1)表示:
G=(E,R,S) (1)
其中,E={e1,e1,...,e|E|}表示学科知识图谱中的知识实体集合,共包含|E|种不同实体;R={r1,r1,...,r|R|}表示学科知识图谱中的知识关系集合,共包含|R|种不同关系;表示学科知识图谱中的实体及其关系组成的三元组集合;
步骤Ⅱ:对教育语料进行标注;
步骤Ⅲ:学科知识图谱构建;
所述步骤Ⅱ具体包括:
2-1)数据收集与分析:收集数字教学资源,并分析数字教学资源的文本的结构特点和语言特点,为语料库的构建提供数据基础;
2-2)构建用于学科知识图谱抽取的教育语料库:教育语料库包括分词和词性标注、句法分析、命名实体、实体关系四个语料;
首先依据学科知识图谱框架的命名实体分类和实体关系分类建立实体和实体关系标注体系;然后针对每类实体和实体关系的标注,制定总体标注原则以及正反标注示例,制定标注规范草稿;再通过三轮以上的预标注和专家评判法,完善形成标准规范;在此基础上,采用领域专家的标注模式,进行命名实体和实体关系语料的标注,形成命名实体语料和实体关系语料;
所述分词和词性语料库以宾州中文树库标注规范作为基础规范,从教学设计文本中抽取语句,构建分词和词性标注语料;
所述句法分析标注以宾州中文树库标注规范为基础,结合教学设计和试卷文本的实际标注情况及信息抽取的需要,对标注规范进行迭代修订,最后通过人机互助的方式进行数字化资源的标注工作,形成标注的语法树;
所述步骤Ⅲ中的学科知识图谱构建具体包括:
3-1)实体识别和关系分类的关键特征提取,总体特征采用式(2)的特征向量表示:
F=(Pre,Suf,Stop,Pos,Wordlen,Distance,...,Simi) (2)
其中,Pre表示前词,Suf表示后词,Stop表示停用词,Pos表示词性特征,Wordlen表示词长特征,Distance表示词距离特性,语义特征指的是词语级别的语义特征,采用连续词袋模型表示词向量,记为w=(v1,v2,...,vm),并基于词向量计算词语的语义相似度特征Simi;
3-2)构建基于半监督方法的联合抽取模型;
3-2-1)基于半监督CRF模型识别命名实体:
应用CRF模型,通过序列标注进行命名实体识别;假设需要标注的词语序列为X=(x1,x2,x3,...,xt),即观察序列;定义Y=(y1,y2,y3,...,yt)为X上对应的标注序列,即状态序列;学科知识命名实体识别问题可转化为:已知观察序列X的条件下,求解状态序列Y的概率P(Y/X)最大时的状态序列,该状态序列即为学科知识命名实体识别问题的标注结果,计算方法如式(3)所示:
其中,Z(x)表示归一化因子,fk表示特征函数,λk表示权重参数;
在进行半监督CRF模型训练时,将前述总体特征向量F作为输入,已标注的训练语料采用BIOES规范进行编码,通过最小化未标注数据的条件熵来有效利用未标注数据的信息;具体计算如式(4):
3-2-2)基于最大熵模型的实体关系分类
对识别出的实体集合按概率输出大小对其进行排序,记为Ebest1、Ebest2、Ebest3……,对任意n∈E,o∈E′,构建候选实体对(n,o),使用最大熵模型并融入特征向量F对候选实体对进行关系分类,形成关系候选集R,记分类概率为p;
3-2-3)基于反馈阈值的联合学习
以Ebest1、E'best1作为命名实体集合的初始值,分别以EbestN、E'bestM作为候选集合;对于每句中的关系集合R,选取分类概率p最大的关系r,将p与设定的实体反馈阈值q进行比较,若p>q,则加入最终命名实体集合中;同时,当且仅当同时成立时,将关系r加入最终关系集合Rlast
2.如权利要求1所述的一种自适应学习系统中领域知识建模及知识水平估测方法,其特征在于,知识水平估测方法采用CNN对领域特征进行自动提取,再基于LSTM模型进行深度知识追踪,具体步骤包括:
1)领域数据预处理与向量化,并构建数据集
根据建立的学科知识图谱框架,对学科知识内容特征数据和学习者答题数据进行预处理,把输入数据各个维度都中心化为零并进行特征的归一化处理,然后将每位学习者个体差异和答题数据构造成二维向量,并将数据集分割为训练集、开发集和测试集三部分;
2)采用卷积神经网络模型CNN作为特征提取器从训练数据中自动学习影响知识追踪的领域特征
建立由多个卷积层、池化层和全连接层构成的CNN网络,其中:
卷积层由多种不同大小的卷积核来提取多组局部特征图,卷积操作后的输出为式(5):
ci=f(w×xi,i+h-1+b) (5)
其中,w为卷积核,h为窗口长度,b为偏置项,f为激活函数,为加快训练收敛速度,采用ReLu函数作为激活函数,即f(x)=max(0,x);
对卷积层提取出来的特征图进行max-pooling操作,然后通过全连接层的Softmax函数对特征进行计算,从而根据输出的概率值提取出领域特征;假设提取的领域特征向量为M={m1,m2,m3,...,mn},设答题正误的变量为a,则所有的影响知识追踪模型的特征集合表示为式(6)
A=M∪a={m1,m2,m3,...,mn,a} (6);
3)特征向量降维
首先对上述特征进行特征交叉,在此基础上进行one-hot编码、编码特征级联,此过程表达如式(7):
vt=O(C(m1,a))~O(C(m2,a))~...~O(C(mn,a)) (7)
其中,O函数表示对向量进行one-hot编码,C函数表示对特征进行交叉运算,~运算表示对特征编码进行级联;
使用Autoencoder对特征向量进行降维,隐藏层和输出层函数分别为式(8)、(9):
vt'=tanh(Wed·vt+bed) (8)
4)知识追踪模型的训练和优化
将上述编码、降维后的向量作为输入,训练基于长短期记忆网络并融入领域特征的深度知识追踪模型,LSTM网络包括输入门i,遗忘门f,输出门o,以及cell单元c,其传递公式如式(10)-(14):
it=σ(wxixt+whiht-1+wcict-1+bi) (10)
ft=σ(wxfxt+whfht-1+wcfct-1+bf) (11)
ct=ft·ct-1+it·tanh(wxcxt+whcht-1+bc)(12)
ot=σ(wxoxt+whoht-1+wcoct+bo) (13)
ht=ot·tanh(ct) (14)
其中,xt为t时刻的输入,w为权重,b为偏置,g代表激活函数,h为当前层的输出,
LSTM网络训练时拟采用交叉熵损失函数,公式如(15)
其中,q表示学习者t+1时刻回答的题目,a表示t+1时刻答题的对错情况,δ表示降维后的one-hot编码格式,l表示交叉熵函数,yT表示t时刻的输出。
CN201910116245.3A 2019-02-13 2019-02-13 一种自适应学习系统中领域知识建模及知识水平估测方法 Active CN109902298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910116245.3A CN109902298B (zh) 2019-02-13 2019-02-13 一种自适应学习系统中领域知识建模及知识水平估测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910116245.3A CN109902298B (zh) 2019-02-13 2019-02-13 一种自适应学习系统中领域知识建模及知识水平估测方法

Publications (2)

Publication Number Publication Date
CN109902298A CN109902298A (zh) 2019-06-18
CN109902298B true CN109902298B (zh) 2023-04-18

Family

ID=66944843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910116245.3A Active CN109902298B (zh) 2019-02-13 2019-02-13 一种自适应学习系统中领域知识建模及知识水平估测方法

Country Status (1)

Country Link
CN (1) CN109902298B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149940A (zh) * 2019-06-28 2020-12-29 上海掌学教育科技有限公司 一种知识点掌握程度在线测评系统和方法
CN110705296A (zh) * 2019-09-12 2020-01-17 华中科技大学 一种基于机器学习和深度学习的中文自然语言处理工具系统
CN110675297B (zh) * 2019-10-09 2022-02-01 济源职业技术学院 计算机数字化教学资源的调取系统及方法
KR102223382B1 (ko) * 2019-11-14 2021-03-08 숭실대학교산학협력단 다중타입 엔티티에 기반한 지식 보완 방법 및 장치
CN110941723A (zh) * 2019-11-18 2020-03-31 广东宜学通教育科技有限公司 一种知识图谱的构建方法、系统及存储介质
CN110969412A (zh) * 2019-11-25 2020-04-07 大连理工大学 一种电子实验报告生成、智能批阅、存储及下载系统
CN110930274B (zh) * 2019-12-02 2023-04-28 中山大学 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法
CN111198950B (zh) * 2019-12-24 2021-10-15 浙江工业大学 一种基于语义向量的知识图谱表示学习方法
CN111159356B (zh) * 2019-12-31 2023-06-09 重庆和贯科技有限公司 基于教学内容的知识图谱构建方法
CN111143539B (zh) * 2019-12-31 2023-06-23 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111241243B (zh) * 2020-01-13 2023-05-26 华中师范大学 面向知识测量的试题、知识、能力张量构建与标注方法
CN113449113A (zh) * 2020-03-27 2021-09-28 京东数字科技控股有限公司 一种知识图谱构建方法、装置、电子设备及存储介质
CN111444432A (zh) * 2020-04-01 2020-07-24 中国科学技术大学 领域自适应的深度知识追踪及个性化习题推荐方法
CN111985560B (zh) * 2020-08-19 2023-05-12 中南大学 知识追踪模型的优化方法、系统及计算机存储介质
CN112100617B (zh) * 2020-09-15 2023-11-24 全球能源互联网研究院有限公司 一种异常sql检测方法及装置
CN112542223A (zh) * 2020-12-21 2021-03-23 西南科技大学 一种从中文电子病历构建医疗知识图谱的半监督学习方法
CN112990464B (zh) * 2021-03-12 2022-06-28 东北师范大学 一种知识追踪方法及系统
CN113486193A (zh) * 2021-07-26 2021-10-08 国网经济技术研究院有限公司 一种基于机器学习的电网基建工程数据知识图谱构建方法
CN114443813B (zh) * 2022-01-09 2024-04-09 西北大学 一种智能化的在线教学资源知识点概念实体链接方法
CN114722159B (zh) * 2022-06-01 2022-08-23 中科航迈数控软件(深圳)有限公司 针对数控机床制造资源的多源异构数据处理方法及系统
CN115495593B (zh) * 2022-10-13 2023-08-01 中原工学院 基于大数据的数学知识图谱构建方法
CN116976351B (zh) * 2023-09-22 2024-01-23 之江实验室 基于学科实体的语言模型构建方法以及学科实体识别装置
CN117273130B (zh) * 2023-11-13 2024-02-23 南京信息工程大学 一种基于知识图谱与个体能力的认知诊断状态机实现方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770453A (zh) * 2008-12-31 2010-07-07 华建机器翻译有限公司 基于领域本体结合机器学习模型的汉语文本共指消解方法
CN104268200A (zh) * 2013-09-22 2015-01-07 中科嘉速(北京)并行软件有限公司 一种基于深度学习的非监督命名实体语义消歧方法
CN104933152A (zh) * 2015-06-24 2015-09-23 北京京东尚科信息技术有限公司 命名实体识别方法及装置
CN107038508A (zh) * 2017-06-06 2017-08-11 海南大学 基于知识图谱的学习能力建模及动态自适应的目标驱动的学习点组织及执行路径推荐方法
CN108647363A (zh) * 2018-05-21 2018-10-12 安徽知学科技有限公司 图谱构建、显示方法、装置、设备及存储介质
CN109062939A (zh) * 2018-06-20 2018-12-21 广东外语外贸大学 一种面向汉语国际教育的智能导学方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7128266B2 (en) * 2003-11-13 2006-10-31 Metrologic Instruments. Inc. Hand-supportable digital imaging-based bar code symbol reader supporting narrow-area and wide-area modes of illumination and image capture

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770453A (zh) * 2008-12-31 2010-07-07 华建机器翻译有限公司 基于领域本体结合机器学习模型的汉语文本共指消解方法
CN104268200A (zh) * 2013-09-22 2015-01-07 中科嘉速(北京)并行软件有限公司 一种基于深度学习的非监督命名实体语义消歧方法
CN104933152A (zh) * 2015-06-24 2015-09-23 北京京东尚科信息技术有限公司 命名实体识别方法及装置
CN107038508A (zh) * 2017-06-06 2017-08-11 海南大学 基于知识图谱的学习能力建模及动态自适应的目标驱动的学习点组织及执行路径推荐方法
CN108647363A (zh) * 2018-05-21 2018-10-12 安徽知学科技有限公司 图谱构建、显示方法、装置、设备及存储介质
CN109062939A (zh) * 2018-06-20 2018-12-21 广东外语外贸大学 一种面向汉语国际教育的智能导学方法

Also Published As

Publication number Publication date
CN109902298A (zh) 2019-06-18

Similar Documents

Publication Publication Date Title
CN109902298B (zh) 一种自适应学习系统中领域知识建模及知识水平估测方法
CN111488734B (zh) 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN108182295B (zh) 一种企业知识图谱属性抽取方法及系统
CN107273355B (zh) 一种基于字词联合训练的中文词向量生成方法
CN110245229B (zh) 一种基于数据增强的深度学习主题情感分类方法
CN108647233B (zh) 一种用于问答系统的答案排序方法
CN108363743B (zh) 一种智能问题生成方法、装置和计算机可读存储介质
CN110609891A (zh) 一种基于上下文感知图神经网络的视觉对话生成方法
CN114064918B (zh) 一种多模态事件知识图谱构建方法
CN112487143A (zh) 一种基于舆情大数据分析的多标签文本分类方法
CN109255359B (zh) 一种基于复杂网络分析方法的视觉问答问题解决方法
Sonkar et al. qdkt: Question-centric deep knowledge tracing
CN108647191B (zh) 一种基于有监督情感文本和词向量的情感词典构建方法
CN111522965A (zh) 一种基于迁移学习的实体关系抽取的问答方法及系统
CN113344053B (zh) 一种基于试题异构图表征与学习者嵌入的知识追踪方法
CN113987147A (zh) 样本处理方法及装置
CN110909736A (zh) 一种基于长短期记忆模型与目标检测算法的图像描述方法
CN115599899B (zh) 基于飞行器知识图谱的智能问答方法、系统、设备及介质
CN109271636B (zh) 词嵌入模型的训练方法及装置
CN111710428B (zh) 一种建模全局和局部上下文交互的生物医学文本表示方法
CN114417851A (zh) 一种基于关键词加权信息的情感分析方法
CN113343690A (zh) 一种文本可读性自动评估方法及装置
CN113807519A (zh) 一种融入教学反馈与习得理解的知识图谱构建方法
CN113553402B (zh) 一种基于图神经网络的考试阅读理解自动问答方法
CN113157932B (zh) 基于知识图谱表示学习的隐喻计算和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant