CN110377707A - 基于深度项目反应理论的认知诊断方法 - Google Patents
基于深度项目反应理论的认知诊断方法 Download PDFInfo
- Publication number
- CN110377707A CN110377707A CN201910676812.0A CN201910676812A CN110377707A CN 110377707 A CN110377707 A CN 110377707A CN 201910676812 A CN201910676812 A CN 201910676812A CN 110377707 A CN110377707 A CN 110377707A
- Authority
- CN
- China
- Prior art keywords
- exercise
- student
- knowledge point
- vector
- item response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000004044 response Effects 0.000 title claims abstract description 28
- 230000001149 cognitive effect Effects 0.000 title claims abstract description 25
- 238000003745 diagnosis Methods 0.000 title claims abstract description 25
- 238000013135 deep learning Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 41
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 230000007787 long-term memory Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 230000013016 learning Effects 0.000 claims description 2
- 230000015654 memory Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 206010016256 fatigue Diseases 0.000 claims 1
- 230000019771 cognition Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000931705 Cicada Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度项目反应理论的认知诊断方法,包括:获取学生的历史习题数据;对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。上述方法可以给学生提供更有效、更详细以及更鲁棒的认知诊断结果。
Description
技术领域
本发明涉及深度学习和教育数据挖掘领域,尤其涉及一种基于深度项目反应理论的认知诊断方法。
背景技术
当前的大数据和数据挖掘技术快速发展,尤其是在教育领域,大量的习题数据被收集,并且被广泛应用于教育相关领域。比如个性化试题推荐可以给学生推荐合适的练习题,来加强学生在知识点或者答题技巧上的熟练度;自适应测试可以根据学生自身的认知情况,给学生提供个性化的测试方案。而对学生的认知情况,也就是学上在知识点或者答题技巧上的掌握程度的准确诊断,是这些应用的基础。
传统的认知诊断方法都基于统计学,仅仅使用学生答题结果的历史数据来对学生进行诊断,对数据敏感,且鲁棒性不好。围绕认知诊断这个问题,很多研究者提出了不少方法,但是这些方法都没能够使用习题文本数据来提升诊断效果,然而,教育领域已经积累了很多习题数据,尤其是文本数据。
因此如何利用习题文本,来增强传统认知诊断模型的有效性以及鲁棒性,是当前教育大数据背景下亟待解决的一个重要问题。
发明内容
本发明的目的是提供一种基于深度项目反应理论的认知诊断方法,可以给学生提供更有效、更详细以及更鲁棒的认知诊断结果,从而能够更有针对性的给学生推荐合适的习题。
本发明的目的是通过以下技术方案实现的:
一种基于深度项目反应理论的认知诊断方法,其特征在于,包括:
获取学生的历史习题数据;
对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;
根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。
由上述本发明提供的技术方案可以看出,充分利用了习题数据,能够增强认知诊断的有效性和鲁棒性,同时,弥补了传统项目反映理论的单维性和不能冷启动以及大规模训练的弊端。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于深度项目反应理论的认知诊断方法的流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种基于深度项目反应理论的认知诊断方法,其具体基于深度项目反应理论实现,如图1所示,主要包括如下步骤:
步骤11、获取学生的历史习题数据。
本发明实施例中,所述历史习题数据包含了M个习题,每一习题包括的习题描述文本以及习题包含的知识点集合。同时,还获取学生的答题记录,其中的实际得分将用于训练阶段。
步骤12、对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度。
本步骤主要包括两个阶段:预处理阶段与建模阶段,下面给出各阶段的优选实施方式。
一、预处理阶段。
预处理的目的是使用通信的数学形式来表示相关数据。
1)假设有L个学生和M个习题,则组成了答题记录R={Rij|1≤i≤L,1≤j≤M};其中Rij=<Si,Qj,rij>是一条答题记录,表示一个学生Si在一道习题Qj上的实际得分为rij;习题Qj=<QTj,QKj>,包含习题描述文本QTj和知识点集合QKj两个部分;所有习题共包含有P个知识点;初始化学生Si在每个知识点p上的掌握度记为αp,所有知识点掌握度组成一个P维的向量α=(α1,α2,…,αP)。
2)对习题的描述文本和知识点数据进行表征。
假设一道习题Qj中的习题描述文本QTj由U个单词组成,通过预训练得到Word2Vec模型将习题描述文本QTj中的每一个单词表示成向量形式,得到QTj={w1,w2,…,wU},其中包含,每一个单词u都被表示成一个d0维的向量
假设一道习题Qj中的知识点集合QKj由V个知识点组成,将每一个知识点v表示成一个P维的one-hot向量(独热向量)Kv∈{0,1}P,得到QKj={K1,K2,…,KV},再使用一个d1维的密集层将每一个知识点的one-hot向量Kv转化为一个d1维的密集向量转换方式为:
kv=KvWk
其中,是密集层的参数;
转换后的知识点向量集合记为
二、建模阶段。
建模主要包括三个部分:利用深度神经网络建模学生的潜在特质、利用基于注意力机制的长短期记忆网络建模习题难度、以及利用深度神经网络建模习题区分度。
1)利用深度神经网络建模学生的潜在特质。
深度神经网络建模学生潜在特质。学生的潜在特质θ对于学生在习题上的表现具有很强的可解释性,并且与学生在每个知识点上的掌握度有很重要的关系,在每个知识点上都具有很高的掌握度的学生,潜在特质也会比较高,因为对每个知识点的掌握度可以反映学生综合能力。深度学习方法具有很好的数据自动表征和学习的能力,因此使用一个深度神经网络DNNθ来诊断学生的潜在特质θ。
本发明实施例中,假设一个学生Si在的知识点掌握度向量为α=(α1,α2,…,αP),其中的P为所有历史习题数据中知识点的总数;预处理后的一道习题Qj的知识点向量集合为
则将知识点向量集合与相应的掌握度对应相乘,得到一个d1维的向量计算方式为:
本发明实施例中,知识点向量集合的元素数量V小于等于知识点掌握度向量α的元素数量P,上述计算时只考虑与知识点向量具有对应关系的掌握度向量。
将d1维的向量Φ输入到一个深度神经网络DNNθ中,得到学生潜在特质θ:
θ=DNNθ(Φ)。
区别于传统项目反映理论中的潜在特质保持不变,本发明实施例中得到的学生潜在特质针对不同的的习题是不同的,比传统项目反映理论中的潜在特质具有更强的解释性。
2)利用深度神经网络建模习题区分度。
习题区分度a可以用来分析学生在习题上的表现的分布情况,区分度的建模方法,受到多维项目反映理论中习题区分度和知识点之间关系的启发,习题区分度和习题所包含的知识点之间有很紧密的关系。因此,通过对习题的知识点进行建模来得到习题的区分度,同样,深度学习方法具有很好的数据自动表征和学习的能力,使用一个和DNNθ结构一样的深度神经网络DNNa来建模习题区分度a,深度神经网络DNNa和DNNθ结构一样,但是他们之间的参数并不共享。
本发明实施例中,预处理后的一道习题Qj的知识点向量集合为将所有知识点向量累加,得到一个d1维的向量计算方式为:
将得到的d1维的向量A输入到一个深度神经网络DNNa中来确定习题Qj的区分度;
由于在传统的项目反映理论中,习题区分度的理论范围区间为[-4,4],因此,对深度神经网络DNNa的输出值DNNa(A)进行变换:先通过一个sigmoid函数归一化到区间[0,1];然后通过平移和放缩变换,将sigmoid函数输出值减去0.5,再乘以8,从而将DNNa的输出值变换到习题区分度的理论范围区间[-4,4]中,得到习题Qj的区分度a,变换方式表示为:
a=8×(sigmoid(DNNa(A))-0.5)。
3)利用基于注意力机制的长短期记忆网络建模习题难度。
习题难度b决定了一个题目被解决的难易程度。确定习题难度可以从两个角度入手,其一是可以通过习题的描述文本来确定难度,因为习题难度跟描述文本是紧密相关的,比如有些题目的文本难以理解,那么难度就可想而知了,而在处理文本这样的长时间序列数据,长短期记忆网络具有很好的处理这种长时间依赖数据的优势,能够自动的从文本中学习语义信息,从而能够给出现次数少的习题提供更好的鲁棒性,因此使用一个长短期记忆网络从文本的角度来建模难度。另一方面,习题知识点考察的深度和广度,对习题的难度也都有很大的影响,知识点被考察的深度越深广度越广,那么此题的难度也就会越大,显然,知识点的广度和深度可以通过习题文本与每个知识点的相关程度来表示,为了能够捕捉到习题文本和知识点之间的关联性,使用注意力机制来来实现。综合这两个方面,设计了一个基于注意机制的长短期记忆网络,来融合这两个方面对习题难度的影响。
本发明实施例中,将预处理后的一道习题Qj的习题描述文本QTj={w1,w2,…,wU}以及相应的知识点向量集合经过注意力机制融合得到输入序列x=(x1,x2,…,xN),并输入到步长为N的长短期记忆网络中,得到长短期网络输出的隐含状态序列h=(h1,h2,…,hN);其中,N≥U;
每一个时刻t的状态ht定义如下:
it=σ(Wxixt+Whiht-1+bi)
ft=σ(Wxfxt+Whfht-1+bf)
ot=σ(Wxoxt+Whoht-1+bo)
ct=ftct-1+it·tanh(Wxcxt+Whcht-1+bc)
ht=ottanh(ct)
其中,i,f,c,o分别表示长短期记忆网络中的输入门、遗忘门、记忆单元和输出门,σ(.)为激活函数,W*,b*表示每个门中的可学习参数;
每一个时刻t的输入xt定义如下:
其中,是放缩因子;ξj是习题描述文本QTj中的单词wt,和习题知识点集合中知识点的相关性,表示知识点的深度和广度,当U<t≤N时,wt用0向量来表示;ξj的计算方式如下:
将长短期记忆网络的最后一个时刻N的输出值hN用均值池化操作得到习题难度,然后通过平移和放缩变换,先将averagePooling函数输出值averagePooling(hN)减去0.5,再乘以8,从而将输出值变换到区间[-4,4]中,得到习题难度b,变换方式表示为:
b=8×(sigmoid(averagePooling(hN))-0.5)。
步骤13、根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分,实现认知诊断。
根据学生Si的潜在特质θ、以及习题Qj的难度b和区分度a,利用项目反应理论的二参数模型预测学生Si在习题Qj上的得分表示为:
其中,D为常数,示例性的,可以设置D=-1.7。
上述方案,不仅保留了相关参数在传统项目反映理论中的可解释性,并且其诊断结果也得到了深度学习方法的增强。
本发明实施例中上述方案可以构成一个完整的网络模型,为了确保预测结果的准确性,需要进行模型训练在训练阶段针对预处理时的参数以及深度学习方法的参数进行更新,即:文本嵌入word2vec模型的参数WQ和知识点嵌入的密集层参数WK,建模学生潜在特质θ、习题难度b、习题区分度a的深度学习方法的参数本发明实施例中,设定目标损失函数为负对数似然函数。在获取学生的历史习题数据时同样获取了学生的实际得分,一个学生Si在一道习题Qj上的实际得分为rij,训练阶段,学生Si在一道习题Qj上的预测得分为则损失函数为:
通过Adam优化器最小化目标损失函数来训练,以更新相应参数。
利用训练好的参数,对于任意一个学生Si和习题Qj,通过梯度下降算法更新学生Si在每个知识点上的掌握度,并且可以利用项目反映理论的二参数模型预测出得分。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (10)
1.一种基于深度项目反应理论的认知诊断方法,其特征在于,包括:
获取学生的历史习题数据;
对历史习题数据进行预处理,使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度;
根据学生的潜在特质、以及习题难度和区分度,利用项目反应理论的二参数模型预测学生在习题上的得分。
2.根据权利要求1所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述历史习题数据包含了M个习题,每一习题包括的习题描述文本以及习题包含的知识点集合。
3.根据权利要求1或2所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,
假设有L个学生和M个习题,则组成了答题记录R={Rij|1≤i≤L,1≤j≤M};其中Rij=<Si,Qj,rij>是一条答题记录,表示一个学生Si在一道习题Qj上的实际得分为rij;
习题Qj=<QTj,QKj>,包含习题描述文本QTj和知识点集合QKj两个部分;所有习题共包含有P个知识点;初始化学生Si在每个知识点p上的掌握度记为αp,所有知识点掌握度组成一个P维的向量α=(α1,α2,…,αP)。
4.根据权利要求1所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述对历史习题数据进行预处理包括:
假设一道习题Qj中的习题描述文本QTj由U个单词组成,通过预训练得到Word2Vec模型将习题描述文本QTj中的每一个单词表示成向量形式,得到QTj={w1,w2,…,wU},其中包含,每一个单词u都被表示成一个d0维的向量
假设一道习题Qj中的知识点集合QKj由V个知识点组成,将每一个知识点v表示成一个P维的one-hot向量Kv∈{0,1}P,得到QKj={K1,K2,…,KV},再使用一个d1维的密集层将每一个知识点的one-hot向量Kv转化为一个d1维的密集向量转换方式为:
kv=KvWk
其中,是密集层的参数;
转换后的知识点向量集合记为
5.根据权利要求1或4所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述使用深度学习方法并结合预处理结果对学生和习题数据进行建模,获得学生的潜在特质、以及习题难度和区分度,包括三个部分:利用深度神经网络建模学生的潜在特质、利用基于注意力机制的长短期记忆网络建模习题难度、以及利用深度神经网络建模习题区分度。
6.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述利用深度神经网络建模学生的潜在特质包括:
假设一个学生Si在的知识点掌握度向量为α=(α1,α2,…,αP),其中的P为所有历史习题数据中知识点的总数;预处理后的一道习题Qj的知识点向量集合为
则将知识点向量集合与相应的掌握度对应相乘,得到一个d1维的向量计算方式为:
将d1维的向量Φ输入到一个深度神经网络DNNθ中,得到学生潜在特质θ:
θ=DNNθ(Φ)。
7.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,利用深度神经网络建模习题区分度包括:
预处理后的一道习题Qj的知识点向量集合为将所有知识点向量累加,得到一个d1维的向量计算方式为:
将得到的d1维的向量A输入到一个深度神经网络DNNa中来确定习题Qj的区分度;
对深度神经网络DNNa的输出值DNNa(A)进行变换:先通过一个sigmoid函数归一化到区间[0,1];然后通过平移和放缩变换,将sigmoid函数输出值减去0.5,再乘以8,从而将DNNa的输出值变换到习题区分度的理论范围区间[-4,4]中,得到习题Qj的区分度a,变换方式表示为:
a=8×(sigmoid(DNNa(A))-0.5)。
8.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,所述利用基于注意力机制的长短期记忆网络建模习题难度包括:
将预处理后的一道习题Qj的习题描述文本QTj={w1,w2,…,wU}以及相应的知识点向量集合经过注意力机制融合得到输入序列x=(x1,x2,…,xN),并输入到步长为N的长短期记忆网络中,得到长短期网络输出的隐含状态序列h=(h1,h2,…,hN);其中,N≥U;
每一个时刻t的状态ht定义如下:
it=σ(Wxixt+Whiht-1+bi)
ft=σ(Wxfxt+Whfht-1+bf)
ot=σ(Wxoxt+Whoht-1+bo)
ct=ftct-1+it·tanh(Wxcxt+Whcht-1+bc)
ht=ottanh(ct)
其中,i,f,c,o分别表示长短期记忆网络中的输入门、遗忘门、记忆单元和输出门,σ(.)为激活函数,W*,b*表示每个门中的可学习参数;
每一个时刻t的输入xt定义如下:
其中,是放缩因子;ξj是习题描述文本QTj中的单词wt,和习题知识点集合中知识点的相关性,表示知识点的深度和广度,当U<t≤N时,wt用0向量来表示;ξj的计算方式如下:
将长短期记忆网络的最后一个时刻N的输出值hN用均值池化操作得到习题难度,然后通过平移和放缩变换,先将averagePooling函数输出值averagePooling(hN)减去0.5,再乘以8,从而将输出值变换到区间[-4,4]中,得到习题难度b,变换方式表示为:
b=8×(sigmoid(averagePooling(hN))-0.5)。
9.根据权利要求1、6、7或8所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,根据学生Si的潜在特质θ、以及习题Qj的难度b和区分度a,利用项目反应理论的二参数模型预测学生Si在习题Qj上的得分表示为:
其中,D为常数。
10.根据权利要求1、6、7或8所述的一种基于深度项目反应理论的认知诊断方法,其特征在于,
在训练阶段针对预处理时的参数以及深度学习方法的参数进行更新,目标损失函数为负对数似然函数;在获取学生的历史习题数据时同样获取了学生的实际得分,一个学生Si在一道习题Qj上的实际得分为rij,训练阶段,学生Si在一道习题Qj上的预测得分为则损失函数为:
通过Adam优化器最小化目标损失函数来训练,以更新相应参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910676812.0A CN110377707B (zh) | 2019-07-25 | 2019-07-25 | 基于深度项目反应理论的认知诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910676812.0A CN110377707B (zh) | 2019-07-25 | 2019-07-25 | 基于深度项目反应理论的认知诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110377707A true CN110377707A (zh) | 2019-10-25 |
CN110377707B CN110377707B (zh) | 2024-04-02 |
Family
ID=68255942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910676812.0A Active CN110377707B (zh) | 2019-07-25 | 2019-07-25 | 基于深度项目反应理论的认知诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110377707B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930274A (zh) * | 2019-12-02 | 2020-03-27 | 中山大学 | 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法 |
CN111898803A (zh) * | 2020-07-09 | 2020-11-06 | 西北大学 | 一种习题预测方法、系统、设备及存储介质 |
CN112116092A (zh) * | 2020-08-11 | 2020-12-22 | 浙江师范大学 | 可解释性知识水平追踪方法、系统和存储介质 |
CN116166998A (zh) * | 2023-04-25 | 2023-05-26 | 合肥师范学院 | 一种联合全局和局部特征的学生表现预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430838A (zh) * | 2008-12-12 | 2009-05-13 | 天津师范大学 | 学习能力训练设备 |
CN107122452A (zh) * | 2017-04-26 | 2017-09-01 | 中国科学技术大学 | 时序化的学生认知诊断方法 |
CN109509126A (zh) * | 2018-11-02 | 2019-03-22 | 中山大学 | 一种基于用户学习行为的个性化试题推荐方法 |
US20190188295A1 (en) * | 2017-12-15 | 2019-06-20 | Accenture Global Solutions Limited | Cognitive searches based on deep-learning neural networks |
CN109919810A (zh) * | 2019-01-22 | 2019-06-21 | 山东科技大学 | 在线学习系统中的学生建模与个性化课程推荐方法 |
CN110032651A (zh) * | 2019-04-18 | 2019-07-19 | 江苏师范大学 | 一种基于知识图谱的个性化学习特征模型的建构方法 |
-
2019
- 2019-07-25 CN CN201910676812.0A patent/CN110377707B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430838A (zh) * | 2008-12-12 | 2009-05-13 | 天津师范大学 | 学习能力训练设备 |
CN107122452A (zh) * | 2017-04-26 | 2017-09-01 | 中国科学技术大学 | 时序化的学生认知诊断方法 |
US20190188295A1 (en) * | 2017-12-15 | 2019-06-20 | Accenture Global Solutions Limited | Cognitive searches based on deep-learning neural networks |
CN109509126A (zh) * | 2018-11-02 | 2019-03-22 | 中山大学 | 一种基于用户学习行为的个性化试题推荐方法 |
CN109919810A (zh) * | 2019-01-22 | 2019-06-21 | 山东科技大学 | 在线学习系统中的学生建模与个性化课程推荐方法 |
CN110032651A (zh) * | 2019-04-18 | 2019-07-19 | 江苏师范大学 | 一种基于知识图谱的个性化学习特征模型的建构方法 |
Non-Patent Citations (4)
Title |
---|
刘淇等: "面向在线智慧学习的教育数据挖掘技术研究", 《模式识别与人工智能》 * |
刘淇等: "面向在线智慧学习的教育数据挖掘技术研究", 《模式识别与人工智能》, no. 01, 15 January 2018 (2018-01-15) * |
马玉慧等: "面向智慧教育的学习分析与智能导学研究――基于RSM的个性化学习资源推送方法", 《电化教育研究》 * |
马玉慧等: "面向智慧教育的学习分析与智能导学研究――基于RSM的个性化学习资源推送方法", 《电化教育研究》, no. 10, 21 September 2018 (2018-09-21) * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930274A (zh) * | 2019-12-02 | 2020-03-27 | 中山大学 | 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法 |
CN110930274B (zh) * | 2019-12-02 | 2023-04-28 | 中山大学 | 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法 |
CN111898803A (zh) * | 2020-07-09 | 2020-11-06 | 西北大学 | 一种习题预测方法、系统、设备及存储介质 |
CN111898803B (zh) * | 2020-07-09 | 2023-10-24 | 西北大学 | 一种习题预测方法、系统、设备及存储介质 |
CN112116092A (zh) * | 2020-08-11 | 2020-12-22 | 浙江师范大学 | 可解释性知识水平追踪方法、系统和存储介质 |
CN116166998A (zh) * | 2023-04-25 | 2023-05-26 | 合肥师范学院 | 一种联合全局和局部特征的学生表现预测方法 |
CN116166998B (zh) * | 2023-04-25 | 2023-07-07 | 合肥师范学院 | 一种联合全局和局部特征的学生表现预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110377707B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377707A (zh) | 基于深度项目反应理论的认知诊断方法 | |
Dougherty et al. | MINERVA-DM: A memory processes model for judgments of likelihood. | |
Xu | A note on linguistic hybrid arithmetic averaging operator in multiple attribute group decision making with linguistic information | |
CN107122452A (zh) | 时序化的学生认知诊断方法 | |
CN110516116A (zh) | 一种多步分层的学习者认知水平挖掘方法及系统 | |
CN109145083B (zh) | 一种基于深度学习的候选答案选取方法 | |
Matsumoto et al. | Reconstructions and predictions of nonlinear dynamical systems: A hierarchical Bayesian approach | |
Saffari et al. | Fuzzy Grasshopper Optimization Algorithm: A Hybrid Technique for Tuning the Control Parameters of GOA Using Fuzzy System for Big Data Sonar Classification. | |
Kelly et al. | Holographic declarative memory: Distributional semantics as the architecture of memory | |
Abubakar et al. | Modified election algorithm in hopfield neural network for optimal random k satisfiability representation | |
Seo et al. | Estimation for generalized half logistic distribution based on records | |
Lu et al. | Fusion Algorithm‐Based Temperature Compensation Method for High‐G MEMS Accelerometer | |
Sun et al. | Entity disambiguation with memory network | |
Dang et al. | TNT: Vision transformer for turbulence simulations | |
Smirnov et al. | Parameters and structure of neural network databases for assessment of learning outcomes | |
Wang et al. | [Retracted] Evaluation of the Online and Offline Mixed Teaching Effect of MOOC Based upon the Deep Neural Network Model | |
Dou et al. | The Measurement of Knowledge in Knowledge Graphs | |
Guldal | Modeling and analysis of systems using the least action principle in information theory | |
Zhu et al. | Rethink of orthographic constraints on RNN and its application in acoustic sensor data modeling | |
Machová et al. | Recognition of toxicity of reviews in online discussions | |
Marinho et al. | Predicting Item Response Theory Parameters Using Question Statements Texts | |
Kelly et al. | High-Dimensional Vector Spaces as the Architecture of Cognition. | |
Pu et al. | EAKT: Embedding Cognitive Framework with Attention for Interpretable Knowledge Tracing | |
Guo et al. | Learning Beyond Pattern Matching? Assaying Mathematical Understanding in LLMs | |
CN110046147A (zh) | 适用自适应系统的用户学习能力值获取方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |