CN115422256A - 融合学习认知要素的可解释知识认知水平挖掘方法及系统 - Google Patents
融合学习认知要素的可解释知识认知水平挖掘方法及系统 Download PDFInfo
- Publication number
- CN115422256A CN115422256A CN202211034335.6A CN202211034335A CN115422256A CN 115422256 A CN115422256 A CN 115422256A CN 202211034335 A CN202211034335 A CN 202211034335A CN 115422256 A CN115422256 A CN 115422256A
- Authority
- CN
- China
- Prior art keywords
- learner
- learning
- knowledge
- matrix
- learning resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 110
- 238000005065 mining Methods 0.000 title claims abstract description 84
- 230000019771 cognition Effects 0.000 title claims description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 217
- 239000013598 vector Substances 0.000 claims abstract description 155
- 230000001149 cognitive effect Effects 0.000 claims abstract description 143
- 230000003993 interaction Effects 0.000 claims abstract description 68
- 238000003745 diagnosis Methods 0.000 claims abstract description 58
- 230000004044 response Effects 0.000 claims abstract description 31
- 238000005728 strengthening Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 32
- 230000003213 activating effect Effects 0.000 claims description 12
- 241001649081 Dina Species 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims 3
- 230000008569 process Effects 0.000 description 15
- 230000002452 interceptive effect Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Educational Technology (AREA)
- Human Resources & Organizations (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明属于个性化学习技术领域,公开了一种融合学习认知要素的可解释知识认知水平挖掘方法及系统,包括:构建学习资源‑作答反应矩阵和学习资源‑知识点矩阵,估计基于认知诊断模型的失误和猜测参数;获取包含学习者对潜在知识点的总体掌握状态的特征向量;融入基于认知诊断模型的失误和猜测参数,得到新的特征向量,预测学习者在特定学习资源上的作答表现;获取知识增长向量、学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。本发明提出的融合学习认知要素的可解释知识认知水平挖掘方法比传统知识认知水平挖掘方法更有效。
Description
技术领域
本发明属于个性化学习技术领域,尤其涉及一种融合学习认知要素的可解释知识认知水 平挖掘方法及系统。
背景技术
目前,新冠疫情的爆发,使得线上教育模式得到规模空前的普及。然而,疫情期间的线 上教育模式还是延续着传统线下的教育模式,虽然用到一系列在线学习平台、计算机辅助系 统等电子学习软件,但仍然没有很好地利用学习者在线上教育模式中产生的学习数据,也没 有给每一位学生提供个性化的学习服务。
而知识认知水平挖掘是提供个性化学习服务的典型方法。在现有知识认知水平挖掘方法 使用最为广泛的是引入深度学习的知识认知水平挖掘方法,这一类方法在表征学习者知识状 态变化以及预测学习者表现方面的性能非常优越,但是由于深度学习的“黑匣子”属性,使 得该类知识认知水平挖掘方法在教育领域的可解释性有待提升。因此,有不少研究针对提升 知识认知水平挖掘模型的可解释性开展,但大部分都是基于统计学的方法,通常这些方法都 是依据常识或者教育理论来对学习者的认知要素进行量化,虽然可解释性增强了,但是挖掘 的学习者认知要素不够深入,没有深入到学习者的认知层面,仅仅停留在数据驱动层面。
通过上述分析,现有技术存在的问题及缺陷为:现有的知识认知水平挖掘系统或方法在 教育领域的可解释性较弱;对学习者的认知要素挖掘不够深入,挖掘方法单一。
发明内容
针对现有技术存在的问题,本发明提供了一种融合学习认知要素的可解释知识认知水平 挖掘方法及系统。
本发明是这样实现的,一种融合学习认知要素的可解释知识认知水平挖掘方法,所述融 合学习认知要素的可解释知识认知水平挖掘方法包括:
步骤一,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资 源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
步骤二,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知 识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点; 从所述值矩阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体 掌握状态的特征向量;
步骤三,从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者 的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向 量,预测学习者在特定学习资源上的作答表现;
步骤四,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当 前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点 的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
进一步,所述步骤一包括:
(1)以学习者与学习资源的交互序列为基础,做学习资源序列的嵌入矩阵向量表示以及 学习者与学习资源交互的交互序列的嵌入矩阵向量表示:
(1.1)设置学习资源的嵌入矩阵A,并将学习资源序列(q1,q2,...,qt)与所述学习资源的嵌 入矩阵A进行嵌入,得到学习资源序列的嵌入矩阵向量表示K=(k1,k2,...,kt);
(1.2)设置学习者与学习资源的交互序列的嵌入矩阵B,将学习者与学习资源的交互序 列X=(x1,x2,...,xt)与所述学习者与学习资源的交互序列的嵌入矩阵B进行嵌入,得到学习者 与学习资源交互的交互序列的嵌入矩阵向量表示V=(v1,v2,...,vt);
(2)以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源- 知识点矩阵;所述学习资源-作答反应矩阵为行为学习者作答的学习资源,列为学习者在学习 资源上的作答反应的矩阵;所述学习资源-知识点矩阵为行为学习者作答的学习资源,列为学 习资源对应的知识点的矩阵;
(3)以学习资源-作答反应矩阵和学习资源-知识点矩阵为基础,引入认知诊断模型,估 计基于认知诊断模型的失误和猜测参数:
(3.2)依据学习资源-作答反应矩阵R和理想作答矩阵η形式化定义失误参数s和猜测参 数g,得到学习资源-作答反应矩阵R的概率模型,如下:
s=P(R=0|η=1)
g=P(R=1|η=0)
P(α)=P(R=1|α)=g(1-η)·(1-s)η
(3.3)引入认知诊断模型DINA,得到DINA模型的总似然函数:
(3.4)使用极大似然函数估计学习者的知识状态,使用EM算法估计失误参数和猜测参 数,得到基于认知诊断模型的失误参数s和猜测参数g。
进一步,所述步骤二包括:
所述学习者作答的学习资源所相关的知识点的权重wt计算公式为:wt=σ(ktKCk);
3)结合获取的学习者作答的学习资源所相关的知识点及所述学习者作答的学习资源所相 关的知识点的权重wt,从值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))中读取学习者在相关知 识点上的掌握情况
4)将获取的学习者在相关知识点上的掌握情况进行加权求和,得到学习资源所包含的知 识点的总体掌握状态;
所述学习资源所包含的知识点的总体掌握状态rt计算公式如下:
5)将学习资源所包含的知识点的总体掌握状态与学习资源序列的嵌入矩阵向量表示kt连 接,再通过Tanh函数进行激活,获得包含学习者对潜在知识点的总体掌握状态的特征向量;
所述包含学习者对潜在知识点的总体掌握状态的特征向量Ft表示如下:
Ft=Tanh(W1 T[rt,kt]+b1)。
进一步,所述步骤三包括:
首先,从特征向量中学习基于学习者的个性化失误参数和猜测参数:
s′t=tanh(W1Ft+b1)
g′t=tanh(W2Ft+b2)
其次,融入基于学习者的个性化失误参数s'和猜测参数g'以及基于认知诊断模型的失误 参数s和猜测参数g,获得新的特征向量:
最后,通过sigmoid函数对获得的新的特征向量进行激活,预测学习者在特定学习资源上 的作答表现;
所述预测学习者在特定学习资源上的作答表现Pt公式如下:
进一步,所述步骤四包括:
(1)结合学习者当前的知识状态,将得到新的特征向量与学习者与学习资源交互的交互 序列的嵌入矩阵向量表示V=(v1,v2,...,vt)进行融合,获取学习者在作答完学习资源之后的知 识增长向量:
v′t=[vt,Ft];
(2)获取学习资源所包含的全部知识点的知识增长向量,并将所述学习资源所包含的全 部知识点的知识增长向量分布在所有记忆片段中:获取学习资源所包含的全部知识点的知识 增长向量为wtv′t,将所述知识增长向量根据值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))的值槽 进行分割,得到分割后的知识增长向量(wtv′t(1),...,wtv′t(i),...,wtv′t(N));
(3)将每个值槽分布的片段都作为LSTM模型的输入,获得学习者个性化的遗忘速率 LSTM(wt(i)v′t);
(4)依据学习者个性化的遗忘速率,获取学习者答完学习资源后对知识点的遗忘程度:
(7)定义损失函数,并使用Adma优化器对权值进行更新;所述损失函数、如下:
(8)在损失函数中添加正则化项l1和l2:L'=L+λ1l1+λ2l2;其中,λ1,λ2为正则化项对应 的系数。
进一步,所述步骤(4)中,依据学习者个性化的遗忘速率,获取学习者答完学习资源后 对知识点的遗忘程度包括:
(4.1)将任一个值槽分布的片段输入LSTM中,确定丢弃信息: ft(i)=σ(Wf·[ht-1,w(i)v']+bf);其中W表示权重系数;b表示相应偏置向量;
(4.2)确定待更新的信息:mt(i)=σ(Wm·[ht-1,w(i)v']+bm);
(4.5)得到学习者个性化的遗忘速率:
其中,ht(i)表示某一个值槽的记忆片段获取的遗忘程度。
本发明的另一目的在于提供一种实施所述融合学习认知要素的可解释知识认知水平挖掘 方法的融合学习认知要素的可解释知识认知水平挖掘系统,所述融合学习认知要素的可解释 知识认知水平挖掘系统包括:
学习资源-作答反应矩阵和学习资源-知识点矩阵构建模块,用于以学习者与学习资源的 交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵,估计基于认知诊断 模型的失误和猜测参数;
特征向量提取模块,用于分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存 储对所述潜在知识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所 相关的知识点;从所述值矩阵读取学习者在相关知识点上的掌握情况;得到包含学习者对潜 在知识点的总体掌握状态的特征向量;
作答表现预测模块,用于从所述包含学习者对潜在知识点的总体掌握状态的特征向量中 学习基于学习者的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数, 得到新的特征向量,预测学习者在特定学习资源上的作答表现;
知识状态更新模块,用于根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示, 并基于学习者当前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取 学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状 态。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所 述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所 述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤:
步骤一,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资 源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
步骤二,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知 识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点; 从所述值矩阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体 掌握状态的特征向量;
步骤三,从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者 的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向 量,预测学习者在特定学习资源上的作答表现;
步骤四,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当 前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点 的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机 程序被处理器执行时,使得所述处理器执行所述融合学习认知要素的可解释知识认知水平挖 掘方法如下步骤:
步骤一,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资 源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
步骤二,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知 识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点; 从所述值矩阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体 掌握状态的特征向量;
步骤三,从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者 的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向 量,预测学习者在特定学习资源上的作答表现;
步骤四,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当 前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点 的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所 述融合学习认知要素的可解释知识认知水平挖掘系统。
结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方 案所具备的优点及积极效果为:
第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所 要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解 决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明一方面结合认知诊断模型估计的学习者认知要素,另一方面通过神经网络学习学 习者的认知要素,不仅解决了目前知识认知水平领域对学习者认知要素挖掘不够的问题,还 从参数可解释、预测结果可解释以及知识状态更新可解释层面增加了模型的可解释性,也提 高了模型在预测学习者表现方面的性能。
本发明提高了模型在教育领域的可解释性;本发明为知识认知水平挖掘领域的发展提供 新的发展视角;本发明提高了知识认知水平挖掘模型在预测学习者表现方面的性能;本发明 考虑了更多的学习者认知参数,深度学习者的认知层面,更好地模拟了学习者的学习过程。
第二,把技术方案看作一个整体或者从产品的角度,本发明所要保护的技术方案具备的 技术效果和优点,具体描述如下:
本发明提出的融合学习认知要素的可解释知识认知水平挖掘方法比传统知识认知水平挖 掘方法更有效。
本发明提供的融合学习认知要素的可解释认知水平挖掘方法对学习者来说,不仅能使其 更清晰自我知识结构,还能了解到自我认知层面的信息,例如失误概率、猜测概率、遗忘速 率等等。对教师来说,能更好地进行干预和有针对性的教学,从而因材施教。
第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
本发明的技术方案填补了国内外业内技术空白:本发明创新性地集成了认知诊断方法 和知识认知水平挖掘方法,融入了认知诊断模型估计的学习者认知要素。
本发明使用神经网络学习学习者的认知要素参数,使得模型在学习者认知要素挖掘方面 方式更丰富、表征更精确。
本发明以认知诊断理论为支撑,在预测时考虑了学习者认知要素,不仅更好地模拟了学 习者的学习过程,也从预测可解释层面提高了知识认知水平挖掘方法在教育领域的可解释性。
本发明在计算学习者知识增长量时,考虑到了学习者当前的知识状态,不仅仅停留于学 习者的答题情况。
本发明的技术方案是否解决了人们一直渴望解决、但始终未能获得成功的技术难题:
本发明解决了以往知识认知水平挖掘方法在挖掘学习者认知要素时不足的问题,一方面 结合认知诊断模型估计的学习者认知要素,一方面通过网络学习学习者的认知要素。
本发明解决了以往知识认知水平挖掘方法基于数据驱动的方法来预测学习者表现,导致 模型可解释性较弱的问题,从参数可解释、预测结果可解释以及知识状态更新可解释层面增 加了模型的可解释性,也提高了模型在预测学习者表现方面的性能。
本发明的技术方案是否克服了技术偏见:
以往知识认知水平挖掘方法使用深度学习方法表征学习者的知识认知水平,由于深度学 习的黑匣子属性,使得其在教育领域的可解释性较差。本发明的技术方案融合了认知诊断理 论和学习者的的认知要素参数,从参数可解释、预测结果可解释以及知识状态更新可解释层 面增加了模型的可解释性。
附图说明
图1是本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法原理图;
图2是本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法流程图;
图3是本发明实施例提供的模型虚拟数据集上训练过程示意图;
图4是本发明实施例提供的模型在真实C语言数据集上训练过程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行 进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定 本发明。
一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是 对权利要求技术方案进行展开说明的解释说明实施例。
如图1-图2所示,本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方 法包括:
S101,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源 -知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
S102,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识 点的掌握状态的值矩阵;同时从键矩阵获取学习者作答的学习资源所相关的知识点;从值矩 阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体掌握状态的 特征向量;
S103,从包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性 化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向量,预 测学习者在特定学习资源上的作答表现;
S104,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当前 的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点的 遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法具体包括:
(1)以学习者与学习资源的交互序列为基础,做学习资源序列的嵌入矩阵向量表示以及 学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并构建学习资源-作答反应矩阵和学 习资源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数,从参数可解释性层面增加了 模型的可解释性,具体包括:
步骤1.1:以学习者与学习资源的交互序列为基础,做学习资源序列的嵌入矩阵向量表示 以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示。
本发明实施例提供的步骤1.1进一步包括:
步骤1.1.1:设置学习资源的嵌入矩阵A,并将学习资源序列(q1,q2,...,qt)与该矩阵进行嵌 入,获得学习资源序列的嵌入矩阵向量表示K=(k1,k2,...,kt);
步骤1.1.2:设置学习者与学习资源的交互序列的嵌入矩阵B,将学习者与学习资源的交 互序列X=(x1,x2,...,xt)与该矩阵进行嵌入,获得学习者与学习资源交互的交互序列的嵌入矩 阵向量表示V=(v1,v2,...,vt);
步骤1.2:以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习 资源-知识点矩阵;
本发明实施例提供的学习资源-作答反应矩阵为行为学习者作答的学习资源,列为学习者 在学习资源上的作答反应的矩阵R;
本发明实施例提供的学习资源-知识点矩阵为行为学习者作答的学习资源,列为学习资源 对应的知识点的矩阵Q。
本发明实施例提供的步骤1.2进一步包括:
步骤1.2.1:本发明实施例提供的进行实验所用的数据集有两个,包括:虚拟数据集和真 实C语言数据集。
本发明实施例提供的虚拟数据集包含2000个学习者在50道学习资源上依次作答的记录, 共有100000条学习数据,且设置这50道学习资源包含5个知识点;
本发明实施例提供的真实C语言数据集包含93名学习者在36道C语言练习题上依次作 答的记录,共有3348条学习数据,且这36道C语言练习题包含12个知识点。
步骤1.2.2:设置虚拟数据集和真实C语言数据集的学习资源-作答反应矩阵R和学习资 源-知识点矩阵Q。
虚拟数据集:
真实C语言数据集:
步骤1.3:以学习资源-作答反应矩阵和学习资源-知识点矩阵为基础,引入认知诊断模型, 估计基于认知诊断模型的失误和猜测参数,进而从参数可解释性层面增加了模型的可解释性。 步骤1.3进一步包括:
步骤1.3.1:初始化学习者的知识状态α,再结合学习资源-知识点矩阵Q,获得学习者在 学习资源上的理想作答情况;
本发明实施例提供的理想作答情况为当学习者掌握了回答该学习资源所需的全部知识 点,则作答正确,否则作答错误。具体公式为:
其中N表示学习资源包含的知识点数
步骤1.3.2:依据学习资源-作答反应矩阵R和理想作答矩阵η形式化定义失误参数s和猜 测参数g,从而得到学习资源-作答反应矩阵R的概率模型;
s=P(R=0|η=1)
g=P(R=1|η=0)
P(α)=P(R=1|α)=g(1-η)·(1-s)η
步骤1.3.3:引入认知诊断模型DINA,得到DINA模型的总似然函数;
步骤1.3.4:使用极大似然函数估计学习者的知识状态,使用EM算法估计失误参数和猜 测参数,从而得到基于认知诊断模型的失误参数s和猜测参数g。其中EM算法估计失误参 数和猜测参数的算法过程如表1所示。
表1使用EM算法估计失误参数s和猜测参数g的算法过程
步骤1.3.5:融入了失误参数和猜测参数,更好地模拟了学习者的真实学习情况,从参数 层面增加了模型的可解释性。
(2)分别创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知 识点的掌握状态的值矩阵,并从键矩阵获取学习者作答的学习资源所相关的知识点,从值矩 阵读取学习者在相关知识点上的掌握情况,从而获得包含学习者对潜在知识点的总体掌握状 态的特征向量;具体包括:
步骤2.1:创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知 识点的掌握状态的值矩阵;
本发明实施例提供的值矩阵为KCv=(KCv(1),...,KCv(i),...,KCv(N)),其含有N个值槽, 动态存储了学习者对这些知识点的掌握状态。
wt=σ(ktKCk)
步骤2.3:结合获取的学习者作答的学习资源所相关的知识点及其权重,从值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))读取学习者在相关知识点上的掌握情况;
步骤2.4:将获取的学习者在相关知识点上的掌握情况进行加权求和,从而得到学习资源 所包含的知识点的总体掌握状态;
步骤2.5:将学习资源所包含的知识点的总体掌握状态与学习资源序列的嵌入矩阵向量表 示kt连接,再通过Tanh函数进行激活,从而获得包含学习者对潜在知识点的总体掌握状态的 特征向量。
(3)从特征向量中学习基于学习者的个性化失误参数和猜测参数,再以认知诊断理论为 支撑,融入基于认知诊断模型的失误和猜测参数,获得新的特征向量,从而预测学习者在特 定学习资源上的作答表现,一方面从参数可解释层面增加了模型的可解释性,一方面从预测 结果可解释性层面增加了模型的可解释性,具体包括:
步骤3.1:从特征向量中学习基于学习者的个性化失误参数和猜测参数;
s′t=tanh(W1Ft+b1)
g′t=tanh(W2Ft+b2)
步骤3.2:以认知诊断理论为支撑,融入基于学习者的个性化失误参数s'和猜测参数g'以 及基于认知诊断模型的失误参数s和猜测参数g,从而获得新的特征向量;
步骤3.3:依据获得的新的特征向量,将其通过sigmoid函数进行激活,从而预测学习者 在特定学习资源上的作答表现;
步骤3.4:融入了认知诊断模型DINA估计的和神经网络学习的失误和猜测参数,在保证 深度知识追踪模型预测性能的前提下,参照认知诊断理论,从学习者答题失误和猜测两个方 面给予模型预测结果解释性。
(4)根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并考虑学习者当前的 知识状态,获取知识增长向量,再考虑学习者个性化的遗忘速率,获取学习者对知识点的遗 忘程度以及记忆强化程度,从而综合更新学习者与学习资源交互后的知识状态,进而从知识 状态更新可解释层面增加模型的可解释性,具体包括:
步骤4.1:考虑学习者当前的知识状态,将获得新的特征向量与学习者与学习资源交互的 交互序列的嵌入矩阵向量表示V=(v1,v2,...,vt)进行融合,从而获取学习者在作答完学习资源 之后的知识增长向量;
v′t=[vt,Ft]
步骤4.2:获取学习资源所包含的全部知识点的知识增长向量,并将其根据值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))的值槽进行分割,从而将学习资源所包含的全部知识点 的知识增长向量分布在所有记忆片段中。
本发明实施例提供的获取的学习资源所包含的全部知识点的知识增长向量为wtv′t。
本发明实施例提供的分割后的知识增长向量为(wtv′t(1),...,wtv′t(i),...,wtv′t(N))。
步骤4.3:将每个值槽分布的片段都作为LSTM模型的输入,从而获得学习者个性化的遗 忘速率;
本发明实施例提供的某一个值槽中获得的学习者个性化的遗忘速率为LSTM(wt(i)v′t)。
步骤4.4:依据学习者个性化的遗忘速率,获取学习者答完学习资源后对知识点的遗忘程 度,为学习者知识状态更新提供了一定的解释性;
本发明实施例提供的步骤4.4进一步包括:
步骤4.4.1:将某一个值槽分布的片段输入LSTM中,确定丢弃信息;
ft(i)=σ(Wf·[ht-1,w(i)v']+bf)
步骤4.4.2:确定待更新的信息;
mt(i)=σ(Wm·[ht-1,w(i)v']+bm)
步骤4.4.3:确定要更新的信息;
步骤4.4.4:根据丢弃的信息和待更新的信息更新状态;
步骤4.4.5:输出学习者个性化的遗忘速率。
gt(i)=σ(Wg·[ht-1,w(i)v']+bg)
ht(i)=gt(i)·tanh(Ut)
步骤4.5:获取学习者答完学习资源后的记忆强化程度;
步骤4.6:根据学习者答完学习资源后的遗忘程度和记忆强化程度综合更新学习者与学习 资源交互后的知识状态。
步骤4.7:定义损失函数,并使用Adma优化器对权值进行更新。
所述损失函数为真实输出和预测输出之间的二交叉熵,如下公式:
步骤4.8:在损失函数中添加正则化项l1和l2,使得知识认知水平挖掘模型的预测结果更 加稳定。
L'=L+λ1l1+λ2l2
其中,λ1,λ2为正则化项对应的系数。
本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘系统包括:
学习资源-作答反应矩阵和学习资源-知识点矩阵构建模块,用于以学习者与学习资源的 交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵,估计基于认知诊断 模型的失误和猜测参数;
特征向量提取模块,用于分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存 储对所述潜在知识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所 相关的知识点;从所述值矩阵读取学习者在相关知识点上的掌握情况;得到包含学习者对潜 在知识点的总体掌握状态的特征向量;
作答表现预测模块,用于从所述包含学习者对潜在知识点的总体掌握状态的特征向量中 学习基于学习者的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数, 得到新的特征向量,预测学习者在特定学习资源上的作答表现;
知识状态更新模块,用于根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示, 并基于学习者当前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取 学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状 态。
本发明实施例涉及的符号如下:
二、应用实施例。为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要 求技术方案进行具体产品上或相关技术上的应用实施例。
融合学习认知要素的可解释知识认知水平挖掘方法及系统具体包括:
(1)以学习者与学习资源的交互序列为基础,做学习资源序列的嵌入矩阵向量表示以及 学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并构建学习资源-作答反应矩阵和学 习资源-知识点矩阵,从而估计基于认知诊断模型的失误和猜测参数,进而从参数可解释性层 面增加了模型的可解释性;
(2)分别创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知 识点的掌握状态的值矩阵,并从键矩阵获取学习者作答的学习资源所相关的知识点,从值矩 阵读取学习者在相关知识点上的掌握情况,从而获得包含学习者对潜在知识点的总体掌握状 态的特征向量;
(3)从特征向量中学习基于学习者的个性化失误参数和猜测参数,再以认知诊断理论为 支撑,融入基于认知诊断模型的失误和猜测参数,获得新的特征向量,从而预测学习者在特 定学习资源上的作答表现,一方面从参数可解释层面增加了模型的可解释性,一方面从预测 结果可解释性层面增加了模型的可解释性;
(4)根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并考虑学习者当前的 知识状态,获取知识增长向量,再考虑学习者个性化的遗忘速率,获取学习者对知识点的遗 忘程度以及记忆强化程度,从而综合更新学习者与学习资源交互后的知识状态,进而从知识 状态更新可解释层面增加模型的可解释性。
作为本发明优选实施例。以学习者与学习资源的交互序列为基础,做学习资源序列的嵌 入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并构建学习资 源-作答反应矩阵和学习资源-知识点矩阵,从而估计基于认知诊断模型的失误和猜测参数, 进而从参数可解释性层面增加了模型的可解释性,具体包括:
步骤1.1:以学习者与学习资源的交互序列为基础,做学习资源序列的嵌入矩阵向量表示 以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示。步骤1.1进一步包括:
步骤1.1.1:设置学习资源的嵌入矩阵A,并将学习资源序列(q1,q2,...,qt)与该矩阵进行嵌 入,获得学习资源序列的嵌入矩阵向量表示K=(k1,k2,...,kt);
步骤1.1.2:设置学习者与学习资源的交互序列的嵌入矩阵B,将学习者与学习资源的交 互序列X=(x1,x2,...,xt)与该矩阵进行嵌入,获得学习者与学习资源交互的交互序列的嵌入矩 阵向量表示V=(v1,v2,...,vt);
步骤1.2:以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习 资源-知识点矩阵;
所述学习资源-作答反应矩阵为行为学习者作答的学习资源,列为学习者在学习资源上的 作答反应的矩阵R;
所述学习资源-知识点矩阵为行为学习者作答的学习资源,列为学习资源对应的知识点的 矩阵Q。
步骤1.2进一步包括:
步骤1.2.1:该实施例进行实验所用的数据集有两个,包括:虚拟数据集和真实C语言数 据集。
所述虚拟数据集包含2000个学习者在50道学习资源上依次作答的记录,共有100000条 学习数据,且设置这50道学习资源包含5个知识点;
所述真实C语言数据集包含93名学习者在36道C语言练习题上依次作答的记录,共有 3348条学习数据,且这36道C语言练习题包含12个知识点。
步骤1.2.2:设置虚拟数据集和真实C语言数据集的学习资源-作答反应矩阵R和学习资 源-知识点矩阵Q。
虚拟数据集:
真实C语言数据集:
步骤1.3:以学习资源-作答反应矩阵和学习资源-知识点矩阵为基础,引入认知诊断模型, 估计基于认知诊断模型的失误和猜测参数,进而从参数可解释性层面增加了模型的可解释性。 步骤1.3进一步包括:
步骤1.3.1:初始化学习者的知识状态α,再结合学习资源-知识点矩阵Q,获得学习者在 学习资源上的理想作答情况;
所述理想作答情况为当学习者掌握了回答该学习资源所需的全部知识点,则作答正确, 否则作答错误。具体公式为:
其中N表示学习资源包含的知识点数
步骤1.3.2:依据学习资源-作答反应矩阵R和理想作答矩阵η形式化定义失误参数s和猜 测参数g,从而得到学习资源-作答反应矩阵R的概率模型;
s=P(R=0|η=1)
g=P(R=1|η=0)
P(α)=P(R=1|α)=g(1-η)·(1-s)η
步骤1.3.3:引入认知诊断模型DINA,得到DINA模型的总似然函数;
步骤1.3.4:使用极大似然函数估计学习者的知识状态,使用EM算法估计失误参数和猜 测参数,从而得到基于认知诊断模型的失误参数s和猜测参数g。其中EM算法估计失误参 数和猜测参数的算法过程如表2所示。
表2使用EM算法估计失误参数s和猜测参数g的算法过程
步骤1.3.5:融入了失误参数和猜测参数,更好地模拟了学习者的真实学习情况,从参数 层面增加了模型的可解释性。
作为本发明优选实施例。分别创建存储了学习者作答学习资源潜在知识点的键矩阵以及 存储了对这些潜在知识点的掌握状态的值矩阵,并从键矩阵获取学习者作答的学习资源所相 关的知识点,从值矩阵读取学习者在相关知识点上的掌握情况,从而获得包含学习者对潜在 知识点的总体掌握状态的特征向量,具体包括:
步骤2.1:创建存储了学习者作答学习资源潜在知识点的键矩阵以及存储了对这些潜在知 识点的掌握状态的值矩阵;
所述值矩阵为KCv=(KCv(1),...,KCv(i),...,KCv(N)),其含有N个值槽,动态存储了学习 者对这些知识点的掌握状态。
wt=σ(ktKCk)
步骤2.3:结合获取的学习者作答的学习资源所相关的知识点及其权重,从值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))读取学习者在相关知识点上的掌握情况;
步骤2.4:将获取的学习者在相关知识点上的掌握情况进行加权求和,从而得到学习资源 所包含的知识点的总体掌握状态;
步骤2.5:将学习资源所包含的知识点的总体掌握状态与学习资源序列的嵌入矩阵向量表 示kt连接,再通过Tanh函数进行激活,从而获得包含学习者对潜在知识点的总体掌握状态的 特征向量。
Ft=Tanh(W1 T[rt,kt]+b1)
作为本发明优选实施例。从特征向量中学习基于学习者的个性化失误参数和猜测参数, 再以认知诊断理论为支撑,融入基于认知诊断模型的失误和猜测参数,获得新的特征向量, 从而预测学习者在特定学习资源上的作答表现,一方面从参数可解释层面增加了模型的可解 释性,一方面从预测结果可解释性层面增加了模型的可解释性,具体包括:
步骤3.1:从特征向量中学习基于学习者的个性化失误参数和猜测参数;
s′t=tanh(W1Ft+b1)
g′t=tanh(W2Ft+b2)
步骤3.2:以认知诊断理论为支撑,融入基于学习者的个性化失误参数s'和猜测参数g'以 及基于认知诊断模型的失误参数s和猜测参数g,从而获得新的特征向量;
步骤3.3:依据获得的新的特征向量,将其通过sigmoid函数进行激活,从而预测学习者 在特定学习资源上的作答表现;
步骤3.4:融入了认知诊断模型DINA估计的和神经网络学习的失误和猜测参数,在保证 深度知识追踪模型预测性能的前提下,参照认知诊断理论,从学习者答题失误和猜测两个方 面给予模型预测结果解释性。
作为本发明优选实施例。根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示, 并考虑学习者当前的知识状态,获取知识增长向量,再考虑学习者个性化的遗忘速率,获取 学习者对知识点的遗忘程度以及记忆强化程度,从而综合更新学习者与学习资源交互后的知 识状态,进而从知识状态更新可解释层面增加模型的可解释性,具体包括:
步骤4.1:考虑学习者当前的知识状态,将获得新的特征向量与学习者与学习资源交互的 交互序列的嵌入矩阵向量表示V=(v1,v2,...,vt)进行融合,从而获取学习者在作答完学习资源 之后的知识增长向量;
v′t=[vt,Ft]
步骤4.2:获取学习资源所包含的全部知识点的知识增长向量,并将其根据值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))的值槽进行分割,从而将学习资源所包含的全部知识点 的知识增长向量分布在所有记忆片段中。;
所述获取的学习资源所包含的全部知识点的知识增长向量为wtv′t。
所述分割后的知识增长向量为(wtv′t(1),...,wtv′t(i),...,wtv′t(N))。
步骤4.3:将每个值槽分布的片段都作为LSTM模型的输入,从而获得学习者个性化的遗 忘速率;
所述某一个值槽中获得的学习者个性化的遗忘速率为LSTM(wt(i)v′t)。
步骤4.4:依据学习者个性化的遗忘速率,获取学习者答完学习资源后对知识点的遗忘程 度,为学习者知识状态更新提供了一定的解释性;
步骤4.4进一步包括:
步骤4.4.1:将某一个值槽分布的片段输入LSTM中,确定丢弃信息;
ft(i)=σ(Wf·[ht-1,w(i)v']+bf)
步骤4.4.2:确定待更新的信息;
mt(i)=σ(Wm·[ht-1,w(i)v']+bm)
步骤4.4.3:确定要更新的信息;
步骤4.4.4:根据丢弃的信息和待更新的信息更新状态;
步骤4.4.5:输出学习者个性化的遗忘速率。
gt(i)=σ(Wg·[ht-1,w(i)v']+bg)
ht(i)=gt(i)·tanh(Ut)
步骤4.5:获取学习者答完学习资源后的记忆强化程度;
步骤4.6:根据学习者答完学习资源后的遗忘程度和记忆强化程度综合更新学习者与学习 资源交互后的知识状态。
步骤4.7:定义损失函数,并使用Adma优化器对权值进行更新。
所述损失函数为真实输出和预测输出之间的二交叉熵,如下公式:
步骤4.8:在损失函数中添加正则化项l1和l2,使得知识认知水平挖掘模型的预测结果更 加稳定。
L'=L+λ1l1+λ2l2
其中,λ1,λ2为正则化项对应的系数。
作为本发明的优选实施例。本发明实验过程中,主要开发环境为Windows 10,AMDRyzen Threadripper 2950X 16-Core Processor,32RAM,GTX 1080Ti graphics,Tensorflow1.9, Python3.5。训练时的实验超参数如表3所示。
表3训练时的实验参数
我们使用AUC和RMSE作为衡量模型预测性能的指标。AUC是在处理分类问题时被经常用到的可靠指标,处理时将学习者正确的回答作为正样本,学习者错误的回答作为负样本, AUC值越高说明预测更准确。RMSE用来衡量真实结果和预测结果之间的偏差,RMSE值越小代表着更好的预测性能。
我们将本方法与传统知识认知水平挖掘方法进行了比较。为了公平地进行比较,所有这 些方法都被调整为具有最佳性能,一种融合学习认知要素的可解释知识认知水平挖掘方法与 传统知识认知水平挖掘方法在虚拟数据集和真实C语言数据集下的AUC、RMSE对比结果如 表4所示,模型在虚拟数据集和真实C语言数据集上训练过程示意图如图4所示。
表4在虚拟数据集和真实C语言数据集上实验结果对比
由实验结果可知:本发明提出的融合学习认知要素的可解释知识认知水平挖掘方法比传 统知识认知水平挖掘方法更有效。在虚拟数据集上,传统知识认知水平挖掘方法上考虑学习 者当前知识状态的AUC比传统知识认知水平挖掘方法提高了约0.8%,RMSE下降了约0.003, 在真实C语言数据集的实验同样表现出传统知识认知水平挖掘方法上考虑学习者当前知识状 态的AUC比传统知识认知水平挖掘方法高,RMSE低。这表明,传统知识认知水平挖掘方法 上考虑学习者当前知识状态模型通过考虑学习者当前的知识状态,有效地提高了模型的预测 性能。本方法的AUC较传统知识认知水平挖掘方法提升了约2%,这表明本章提出的融合学习 认知要素的可解释知识认知水平挖掘方法有效,且提高了模型在预测学习者表现方面的精确 度。另外,我们还发现传统知识认知水平挖掘方法上融入失误和猜测认知要素和传统知识认 知水平挖掘方法上融入失误、猜测和遗忘速率认知要素较传统知识认知水平挖掘方法在AUC 值上有所提高,在RMSE值上有所下降,这表明从不同的角度挖掘并融入学习者认知要素对 学习者在学习过程中的知识状态变化追踪以及表现预测有影响。总之,本方法具有最佳的实 验效果。
三、实施例相关效果的证据。本发明实施例在研发或者使用过程中取得了一些积极效果, 和现有技术相比的确具备很大的优势,下面内容结合试验过程的数据、图表等进行描述。
本发明仿真实验过程中,主要开发环境为Windows 10,AMD Ryzen Threadripper2950X 16-Core Processor,32RAM,GTX 1080Ti graphics,Tensorflow1.9,Python3.5。训练时的实 验超参数如表5所示。
表5训练时的实验参数
实验参数 | 虚拟数据集 | 真实C语言数据集 |
batch_size | 32 | 32 |
learning_rate | 0.05 | 0.05 |
epoch | 300 | 300 |
memory size | 5 | 5 |
sequence length | 50 | 36 |
dropout | 0.2 | 0.2 |
hidden size(LSTM) | 100 | 100 |
仿真实验使用AUC和RMSE作为衡量模型预测性能的指标。AUC是在处理分类问题时被经常用到的可靠指标,处理时将学习者正确的回答作为正样本,学习者错误的回答作为负 样本,AUC值越高说明预测更准确。RMSE用来衡量真实结果和预测结果之间的偏差,RMSE值越小代表着更好的预测性能。
将本发明实施例与传统知识认知水平挖掘方法进行了比较。为了公平地进行比较,所有 这些方法都被调整为具有最佳性能,一种融合学习认知要素的可解释知识认知水平挖掘方法 与传统知识认知水平挖掘方法在虚拟数据集和真实C语言数据集下的AUC、RMSE对比结果 如表3所示,模型在虚拟数据集和真实C语言数据集上训练过程示意图如图3、图4所示。
表6在虚拟数据集和真实C语言数据集上实验结果对比
由实验结果可知:本发明实施例提出的融合学习认知要素的可解释知识认知水平挖掘方 法比传统知识认知水平挖掘方法更有效。在虚拟数据集上,传统知识认知水平挖掘方法上考 虑学习者当前知识状态的AUC比传统知识认知水平挖掘方法提高了约0.8%,RMSE下降了 约0.003,在真实C语言数据集的实验同样表现出传统知识认知水平挖掘方法上考虑学习者 当前知识状态的AUC比传统知识认知水平挖掘方法高,RMSE低。这表明,传统知识认知水 平挖掘方法上考虑学习者当前知识状态模型通过考虑学习者当前的知识状态,有效地提高了 模型的预测性能。本发明实施例的AUC较传统知识认知水平挖掘方法提升了约2%,这表明 本发明实施例提出的融合学习认知要素的可解释知识认知水平挖掘方法有效,且提高了模型 在预测学习者表现方面的精确度。另外,本发明实施例还发现传统知识认知水平挖掘方法上 融入失误和猜测认知要素和传统知识认知水平挖掘方法上融入失误、猜测和遗忘速率认知要 素较传统知识认知水平挖掘方法在AUC值上有所提高,在RMSE值上有所下降,这表明从 不同的角度挖掘并融入学习者认知要素对学习者在学习过程中的知识状态变化追踪以及表现 预测有影响。总之,本发明实施例提供的融合学习认知要素的可解释知识认知水平挖掘方法 具有最佳的实验效果。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件 部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例 如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可 以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或 DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号 载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路 或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设 备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也 可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉 本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任 何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种融合学习认知要素的可解释知识认知水平挖掘方法,其特征在于,所述融合学习认知要素的可解释知识认知水平挖掘方法包括:
步骤一,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
步骤二,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点;从所述值矩阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体掌握状态的特征向量;
步骤三,从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向量,预测学习者在特定学习资源上的作答表现;
步骤四,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
2.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法,其特征在于,所述步骤一包括:
(1)以学习者与学习资源的交互序列为基础,做学习资源序列的嵌入矩阵向量表示以及学习者与学习资源交互的交互序列的嵌入矩阵向量表示:
(1.1)设置学习资源的嵌入矩阵A,并将学习资源序列(q1,q2,...,qt)与所述学习资源的嵌入矩阵A进行嵌入,得到学习资源序列的嵌入矩阵向量表示K=(k1,k2,...,kt);
(1.2)设置学习者与学习资源的交互序列的嵌入矩阵B,将学习者与学习资源的交互序列X=(x1,x2,...,xt)与所述学习者与学习资源的交互序列的嵌入矩阵B进行嵌入,得到学习者与学习资源交互的交互序列的嵌入矩阵向量表示V=(v1,v2,...,vt);
(2)以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵;所述学习资源-作答反应矩阵为行为学习者作答的学习资源,列为学习者在学习资源上的作答反应的矩阵;所述学习资源-知识点矩阵为行为学习者作答的学习资源,列为学习资源对应的知识点的矩阵;
(3)以学习资源-作答反应矩阵和学习资源-知识点矩阵为基础,引入认知诊断模型,估计基于认知诊断模型的失误和猜测参数:
(3.2)依据学习资源-作答反应矩阵R和理想作答矩阵η形式化定义失误参数s和猜测参数g,得到学习资源-作答反应矩阵R的概率模型,如下:
s=P(R=0|η=1)
g=P(R=1|η=0)
P(α)=P(R=1|α)=g(1-η)·(1-s)η
(3.3)引入认知诊断模型DINA,得到DINA模型的总似然函数:
(3.4)使用极大似然函数估计学习者的知识状态,使用EM算法估计失误参数和猜测参数,得到基于认知诊断模型的失误参数s和猜测参数g。
3.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法,其特征在于,所述步骤二包括:
所述学习者作答的学习资源所相关的知识点的权重wt计算公式为:wt=σ(ktKCk);
3)结合获取的学习者作答的学习资源所相关的知识点及所述学习者作答的学习资源所相关的知识点的权重wt,从值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))中读取学习者在相关知识点上的掌握情况
4)将获取的学习者在相关知识点上的掌握情况进行加权求和,得到学习资源所包含的知识点的总体掌握状态;
所述学习资源所包含的知识点的总体掌握状态rt计算公式如下:
5)将学习资源所包含的知识点的总体掌握状态与学习资源序列的嵌入矩阵向量表示kt连接,再通过Tanh函数进行激活,获得包含学习者对潜在知识点的总体掌握状态的特征向量;
所述包含学习者对潜在知识点的总体掌握状态的特征向量Ft表示如下:
5.如权利要求1所述融合学习认知要素的可解释知识认知水平挖掘方法,其特征在于,所述步骤四包括:
(1)结合学习者当前的知识状态,将得到新的特征向量与学习者与学习资源交互的交互序列的嵌入矩阵向量表示V=(v1,v2,...,vt)进行融合,获取学习者在作答完学习资源之后的知识增长向量:
v′t=[vt,Ft];
(2)获取学习资源所包含的全部知识点的知识增长向量,并将所述学习资源所包含的全部知识点的知识增长向量分布在所有记忆片段中:获取学习资源所包含的全部知识点的知识增长向量为wtvt',将所述知识增长向量根据值矩阵KCv=(KCv(1),...,KCv(i),...,KCv(N))的值槽进行分割,得到分割后的知识增长向量(wtv′t(1),...,wtv′t(i),...,wtv′t(N));
(3)将每个值槽分布的片段都作为LSTM模型的输入,获得学习者个性化的遗忘速率LSTM(wt(i)v′t);
(4)依据学习者个性化的遗忘速率,获取学习者答完学习资源后对知识点的遗忘程度:
(5)获取学习者答完学习资源后的记忆强化程度αt:αt=Tanh(W3 Tv′t+b3);
(7)定义损失函数,并使用Adma优化器对权值进行更新;所述损失函数、如下:
(8)在损失函数中添加正则化项l1和l2:L'=L+λ1l1+λ2l2;其中,λ1,λ2为正则化项对应的系数。
6.如权利要求5所述融合学习认知要素的可解释知识认知水平挖掘方法,其特征在于,所述步骤(4)中,依据学习者个性化的遗忘速率,获取学习者答完学习资源后对知识点的遗忘程度包括:
(4.1)将任一个值槽分布的片段输入LSTM中,确定丢弃信息:ft(i)=σ(Wf·[ht-1,w(i)v']+bf);其中W表示权重系数;b表示相应偏置向量;
(4.2)确定待更新的信息:mt(i)=σ(Wm·[ht-1,w(i)v']+bm);
(4.5)得到学习者个性化的遗忘速率:
其中,ht(i)表示某一个值槽的记忆片段获取的遗忘程度。
7.一种实施如权利要求1-6任意一项所述融合学习认知要素的可解释知识认知水平挖掘方法的融合学习认知要素的可解释知识认知水平挖掘系统,其特征在于,所述融合学习认知要素的可解释知识认知水平挖掘系统包括:
学习资源-作答反应矩阵和学习资源-知识点矩阵构建模块,用于以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
特征向量提取模块,用于分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点;从所述值矩阵读取学习者在相关知识点上的掌握情况;得到包含学习者对潜在知识点的总体掌握状态的特征向量;
作答表现预测模块,用于从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向量,预测学习者在特定学习资源上的作答表现;
知识状态更新模块,用于根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤:
步骤一,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
步骤二,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点;从所述值矩阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体掌握状态的特征向量;
步骤三,从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向量,预测学习者在特定学习资源上的作答表现;
步骤四,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1-6任意一项所述融合学习认知要素的可解释知识认知水平挖掘方法如下步骤:
步骤一,以学习者与学习资源的交互序列为基础,构建学习资源-作答反应矩阵和学习资源-知识点矩阵,估计基于认知诊断模型的失误和猜测参数;
步骤二,分别创建存储学习者作答学习资源潜在知识点的键矩阵以及存储对所述潜在知识点的掌握状态的值矩阵;同时从所述键矩阵获取学习者作答的学习资源所相关的知识点;从所述值矩阵读取学习者在相关知识点上的掌握情况,得到包含学习者对潜在知识点的总体掌握状态的特征向量;
步骤三,从所述包含学习者对潜在知识点的总体掌握状态的特征向量中学习基于学习者的个性化失误参数和猜测参数,融入基于认知诊断模型的失误和猜测参数,得到新的特征向量,预测学习者在特定学习资源上的作答表现;
步骤四,根据学习者与学习资源交互的交互序列的嵌入矩阵向量表示,并基于学习者当前的知识状态,获取知识增长向量;再基于学习者个性化的遗忘速率,获取学习者对知识点的遗忘程度以及记忆强化程度,综合更新学习者与学习资源交互后的知识状态。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述融合学习认知要素的可解释知识认知水平挖掘系统。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210550979 | 2022-05-20 | ||
CN2022105509794 | 2022-05-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115422256A true CN115422256A (zh) | 2022-12-02 |
Family
ID=84199672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211034335.6A Pending CN115422256A (zh) | 2022-05-20 | 2022-08-26 | 融合学习认知要素的可解释知识认知水平挖掘方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115422256A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763361A (zh) * | 2024-02-22 | 2024-03-26 | 泰山学院 | 一种基于人工智能的学生成绩预测方法及系统 |
-
2022
- 2022-08-26 CN CN202211034335.6A patent/CN115422256A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763361A (zh) * | 2024-02-22 | 2024-03-26 | 泰山学院 | 一种基于人工智能的学生成绩预测方法及系统 |
CN117763361B (zh) * | 2024-02-22 | 2024-04-30 | 泰山学院 | 一种基于人工智能的学生成绩预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huo et al. | Knowledge modeling via contextualized representations for LSTM-based personalized exercise recommendation | |
US10290221B2 (en) | Systems and methods to customize student instruction | |
CN110807469B (zh) | 融合长短时记忆与贝叶斯网络的知识追踪方法及系统 | |
CN110941723A (zh) | 一种知识图谱的构建方法、系统及存储介质 | |
CN110991645A (zh) | 一种基于知识模型的自适应学习方法、系统及存储介质 | |
CN111159419B (zh) | 基于图卷积的知识追踪数据处理方法、系统和存储介质 | |
CN112085168A (zh) | 一种基于动态键值门控循环网络的知识追踪方法及系统 | |
CN114254127A (zh) | 学生能力画像方法、学习资源推荐方法及装置 | |
CN111680216A (zh) | 一种试题推荐方法、系统、介质及设备 | |
CN115545155A (zh) | 一种多层级智能认知追踪方法、系统、可存储介质及终端 | |
CN115422256A (zh) | 融合学习认知要素的可解释知识认知水平挖掘方法及系统 | |
CN116306863A (zh) | 基于对比学习的协同知识追踪建模方法及系统 | |
CN114298299A (zh) | 基于课程学习的模型训练方法、装置、设备及存储介质 | |
CN111898803A (zh) | 一种习题预测方法、系统、设备及存储介质 | |
Kondo et al. | Modeling of learning process based on Bayesian networks | |
CN116361744A (zh) | 一种面向学习过程性评价的学习者认知追踪方法及系统 | |
Oka et al. | Scalable Bayesian approach for the DINA Q-matrix estimation combining stochastic optimization and variational inference | |
CN114925218A (zh) | 一种基于自适应图的学习者知识认知结构动态挖掘方法 | |
CN114925610A (zh) | 一种学习者知识结构与水平建模方法、系统、设备及终端 | |
US20230100924A1 (en) | Skill output device, skill output method, and skill output program | |
Pérez et al. | Reinforcement learning for estimating student proficiency in math word problems | |
CN114091657A (zh) | 基于多任务框架的智能学习状态追踪方法、系统及应用 | |
Liu et al. | Learning evidential cognitive diagnosis networks robust to response bias | |
Kumar et al. | Causal competencies and learning styles: A framework for adaptive instruction | |
Liao et al. | Predicting learners' multi-question performance based on neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |