CN113239699A - 一种融合多特征的深度知识追踪方法及系统 - Google Patents
一种融合多特征的深度知识追踪方法及系统 Download PDFInfo
- Publication number
- CN113239699A CN113239699A CN202110407038.0A CN202110407038A CN113239699A CN 113239699 A CN113239699 A CN 113239699A CN 202110407038 A CN202110407038 A CN 202110407038A CN 113239699 A CN113239699 A CN 113239699A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- text
- knowledge point
- point
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000013598 vector Substances 0.000 claims abstract description 97
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 44
- 230000002159 abnormal effect Effects 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000001174 ascending effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 21
- 238000010276 construction Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 3
- 238000007499 fusion processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种融合多特征的深度知识追踪方法及系统。其中,该方法包括:确定待分析文本对应的知识点语义表征向量;其中,所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征;将所述知识点语义表征向量输入至深度知识追踪模型中进行处理,得到所述深度知识追踪模型输出的相应的知识状态预测结果;其中,所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。采用本发明公开的融合多特征的深度知识追踪方法,引入多种特征,提高知识追踪模型的预测精度和效率,能够准确预测目标对象在下一次答题时的表现。
Description
技术领域
本发明涉及计算机应用技术领域,具体涉及一种融合多特征的深 度知识追踪方法及系统。另外,还涉及一种电子设备及非暂态计算机 可读存储介质。
背景技术
随着信息技术的迅速发展,改变了人们传统学习方式,促进了在 线教育的蓬勃兴起。丰富多样的线上教育资源和方便智能的在线教育 平台使得在线教育用户规模不断扩大,人们在线上教育投入的时间逐 渐增多。在线教育平台收集了海量的用户学习数据,教育行业逐渐进 入大数据时代。然而,如何利用海量的用户学习数据结合人工智能技 术来促进教育行业发展,是研究者长期探索的问题。其中,知识追踪 是目前研究的热点之一。知识追踪是利用目标对象(比如学生)答题 序列对目标对象知识状态的变化进行建模,评估目标对象对知识点的 掌握程度以及预测目标对象对知识点的作答表现。
为了解决上述问题,现有技术中通常基于项目反应理论(Item Response Theory,IRT)、贝叶斯知识追踪(Bayesian Knowledge Tracing,BKT)模型、深度知识追踪(DeepKnowledge Tracing,DKT) 模型和动态键值对记忆网络(Dynamic Key-Value MemoryNetworks, DKVMN)模型实现。IRT模型假设在每一次答题测试中只评估目标 对象(比如学生)的某一种能力,且学生在每一道题目上的作答反应 是相互独立,互不影响的,作答反应只与学生自身的能力水平有关, 与其他元素无关。BKT基于隐马尔可夫模型(HiddenMarkov Model, HMM),学生在t+1时刻的知识状态仅依赖于t时刻,这不符合现 实学习过程中知识状态的变化;而且,BKT根据知识点构建,不同 的学生共用同一个模型,不能捕获不同知识点之间的联系。DKT利 用长短时记忆(Long Short-Term Memory,LSTM)对学生历史知识 状态进行记忆,其隐藏层状态表示学生综合的知识状态。DKT中不 同知识点的知识状态之间相互影响,学生在知识点上的作答反应受到 综合知识状态的影响。但是,在DKT中,如果知识点之间相互独立, 仅用一个隐藏层状态表示知识状态不能区分学生对不同类知识点的 知识状态。为了解决这个问题,DKVMN提出了使用Key-value Memory去存储和更新各个知识点的知识状态。上述知识追踪模型仅 使用了学生的答题记录,即简单的使用知识点编号表示题目信息。但 在现实场景中,题目文本蕴含着题目类型、题目难度、知识点等丰富 信息,非常有必要将题目文本引入知识追踪模型。另外,知识点难度、 学生能力和答题用时等均影响学生知识状态的预测。因此如何提供一 种融合多特征的深度知识追踪方案成为本领域研究的重要课题。
发明内容
为此,本发明提供一种融合多特征的深度知识追踪方法及系统, 以解决现有技术中存在的知识追踪方案准确度较低的问题。
本发明提供一种融合多特征的深度知识追踪方法,包括:
确定待分析文本对应的知识点语义表征向量;
其中,所述知识点语义表征向量包含知识点编号特征、题目文本 特征以及知识点难度特征;
将所述知识点语义表征向量输入至深度知识追踪模型中进行处 理,得到所述深度知识追踪模型输出的相应的知识状态预测结果;
其中,所述深度知识追踪模型是以样本文本、所述样本文本对应 的样本知识状态预测结果以及真实标签进行训练得到的。
进一步的,所述确定待分析文本对应的知识点语义表征向量,具 体包括:
确定所述待分析文本对应的知识点编号特征;
确定所述待分析文本对应的题目文本特征;
确定所述待分析文本对应的知识点难度特征;
基于预设转换器模型中的多头自注意力机制对所述知识点编号 特征、所述题目文本特征以及所述知识点难度特征进行融合处理,得 到相应的知识点语义表征向量。
进一步的,确定所述待分析文本对应的知识点编号特征,包括: 基于所述待分析文本中的知识点编号对应的独热向量和嵌入知识点 矩阵,得到相应的知识点编号特征;
确定所述待分析文本对应的题目文本特征,包括:对所述待分析 文本中的题目文本进行分词处理,并对特殊符号、停用词进行清洗, 得到分词特征;其中,所述题目文本为包含若干个词的句子;将所述 题目文本中的每一个词转化为相应的词向量,得到所述题目文本对应 的句子矩阵;并根据每一个词构建相应的位置向量,得到相应的位置 矩阵;将所述句子矩阵和所述位置矩阵输入到预设的网络模型结构 中,得到所述题目文本对应的题目文本特征;其中,所述题目文本特 征用于对题目文本进行表征;
确定所述待分析文本对应的知识点难度特征,包括:确定知识点 数据对应题目文本回答的正确率集合;根据所述正确率集合得到所述 知识点数据正确率的下四分位点、中位数以及上四分位点,并将所述 知识点数据正确率的下四分位点、中位数以及上四分位点输入到预设 的限值公式中,得到相应的上限值和下限值;若所述正确率集合存在 大于所述上限值或者小于所述下限值的正确率值,则判定所述正确率 值为异常值,将所述正确率集合对应的均值替换所述异常值,得到目 标正确率集合;根据所述目标正确率集合,对所述知识点数据按照不 同的知识点难度区间进行划分,根据不同知识点难度数据对应的独热 向量和嵌入难度类别数矩阵,得到相应的知识点难度特征。
进一步的,所述的融合多特征的深度知识追踪方法,还包括:
确定所有回答正确的题目对应的第一知识点难度数据;
确定所有回答过的题目对应的第二知识点难度数据;
根据所述第一知识点难度数据、所述第二知识点难度数据以及目 标对象能力类别数,得到目标对象能力特征,并通过相应的嵌入矩阵, 得到目标对象能力值特征向量。
进一步的,所述的融合多特征的深度知识追踪方法,还包括:
对数据集合中所有的答题用时按升序进行排序,并将连续的答题 用时进行离散化处理后,对目标对象的答题用时进行归一化处理,得 到答题用时的下四分位点、中位数以及上四分位点;将所述答题用时 的下四分位点、中位数以及上四分位点输入到预设的限值公式中,得 到答题用时的上限值和下限值;
若所述数据集合的答题用时中存在大于所述上限值或者小于所 述下限值的正确率值,则判定所述答题用时为异常值,将所述数据集 合的答题用时对应的均值替换所述异常值,得到目标答题用时集合;
根据所述目标答题用时集合,对所述数据集合按照不同的答题用 时区间进行划分,根据所述数据集合中不同答题用时对应的独热向量 和嵌入答题用时等级数矩阵,得到相应的答题用时特征。
进一步的,所述知识状态预测结果,具体包括:目标对象对知识 点的掌握程度的评估结果以及目标对象对知识点在下一时刻的作答 表现的预测结果。
进一步的,所述深度知识追踪模型是以样本文本、所述样本文本 对应的样本知识状态预测结果以及真实标签进行训练得到的,具体包 括:所述深度知识追踪模型是以样本文本、所述样本文本对应的样本 知识状态预测结果以及真实标签进行训练,以使所述真实标签与样本 知识状态预测结果之间的交叉熵损失达到最小化为训练目标得到的; 所述深度知识追踪模型用于基于对所述样本文本进行特征提取得到 的知识点语义表征向量,对所述待分析文本进行语义理解。
相应的,本发明还提供一种融合多特征的深度知识追踪系统,包 括:
知识点语义表征向量确定单元,用于确定待分析文本对应的知识 点语义表征向量;其中,所述知识点语义表征向量包含知识点编号特 征、题目文本特征以及知识点难度特征;
知识状态预测单元,用于将所述知识点语义表征向量输入至深度 知识追踪模型中进行处理,得到所述深度知识追踪模型输出的相应的 知识状态预测结果;其中,所述深度知识追踪模型是以样本文本、所 述样本文本对应的样本知识状态预测结果以及真实标签进行训练得 到的。
进一步的,所述知识点语义表征向量确定单元,具体包括:
知识点编号特征确定单元,用于确定所述待分析文本对应的知识 点编号特征;
题目文本特征确定单元,用于确定所述待分析文本对应的题目文 本特征;
知识点难度特征单元,用于确定所述待分析文本对应的知识点难 度特征;
融合处理单元,用于基于预设转换器模型中的多头自注意力机制 对所述知识点编号特征、所述题目文本特征以及所述知识点难度特征 进行融合处理,得到相应的知识点语义表征向量。
进一步的,所述知识点编号特征确定单元,具体用于:基于所述 待分析文本中的知识点编号对应的独热向量和嵌入知识点矩阵,得到 相应的知识点编号特征;
所述题目文本特征确定单元,具体用于:对所述待分析文本中的 题目文本进行分词处理,并对特殊符号、停用词进行清洗,得到分词 特征;其中,所述题目文本为包含若干个词的句子;将所述题目文本 中的每一个词转化为相应的词向量,得到所述题目文本对应的句子矩 阵;并根据每一个词构建相应的位置向量,得到相应的位置矩阵;将 所述句子矩阵和所述位置矩阵输入到预设的网络模型结构中,得到所 述题目文本对应的题目文本特征;其中,所述题目文本特征用于对题 目文本进行表征;
所述知识点难度特征单元,具体用于:确定知识点数据对应题目 文本回答的正确率集合;根据所述正确率集合得到所述知识点数据正 确率的下四分位点、中位数以及上四分位点,并将所述知识点数据正 确率的下四分位点、中位数以及上四分位点输入到预设的限值公式 中,得到相应的上限值和下限值;若所述正确率集合存在大于所述上 限值或者小于所述下限值的正确率值,则判定所述正确率值为异常 值,将所述正确率集合对应的均值替换所述异常值,得到目标正确率 集合;根据所述目标正确率集合,对所述知识点数据按照不同的知识 点难度区间进行划分,根据不同知识点难度数据对应的独热向量和嵌 入难度类别数矩阵,得到相应的知识点难度特征。
进一步的,所述的融合多特征的深度知识追踪系统,还包括:
能力值特征向量获得单元,用于确定所有回答正确的题目对应的 第一知识点难度数据;确定所有回答过的题目对应的第二知识点难度 数据;根据所述第一知识点难度数据、所述第二知识点难度数据以及 目标对象能力类别数,得到目标对象能力特征,并通过相应的嵌入矩 阵,得到目标对象能力值特征向量。
进一步的,所述的融合多特征的深度知识追踪系统,还包括:
答题用时特征获得单元,用于对数据集合中所有的答题用时按升 序进行排序,并将连续的答题用时进行离散化处理后,对目标对象的 答题用时进行归一化处理,得到答题用时的下四分位点、中位数以及 上四分位点;将所述答题用时的下四分位点、中位数以及上四分位点 输入到预设的限值公式中,得到答题用时的上限值和下限值;若所述 数据集合的答题用时中存在大于所述上限值或者小于所述下限值的 正确率值,则判定所述答题用时为异常值,将所述数据集合的答题用 时对应的均值替换所述异常值,得到目标答题用时集合;根据所述目 标答题用时集合,对所述数据集合按照不同的答题用时区间进行划分,根据所述数据集合中不同答题用时对应的独热向量和嵌入答题用 时等级数矩阵,得到相应的答题用时特征。
进一步的,所述知识状态预测结果,具体包括:目标对象对知识 点的掌握程度的评估结果以及目标对象对知识点在下一时刻的作答 表现的预测结果。
进一步的,所述深度知识追踪模型是以样本文本、所述样本文本 对应的样本知识状态预测结果以及真实标签进行训练,以使所述真实 标签与样本知识状态预测结果之间的交叉熵损失达到最小化为训练 目标得到的;所述深度知识追踪模型用于基于对所述样本文本进行特 征提取得到的知识点语义表征向量,对所述待分析文本进行语义理 解。
相应的,本发明还提供一种电子设备,包括:存储器、处理器及 存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行 所述程序时实现如上述任意一项所述的融合多特征的深度知识追踪 方法的步骤。
相应的,本发明还提供一种非暂态计算机可读存储介质,其上存 储有计算机程序,该计算机程序被处理器执行时实现如上述任意一项 所述的融合多特征的深度知识追踪方法的步骤。
采用本发明所述的融合多特征的深度知识追踪方法,能够将目标 对象的答题情况与对应的题目文本特征进行统一建模,同时将知识点 难度特征、学生能力值特征和答题用时特征引入知识追踪模型中,并 采用多头自注意力机制对上述特征组合,提高了知识追踪模型的预测 精度和效率,能够准确预测目标对象在下一次答题时的表现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面 将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显 而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普 通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附 图获取其他的附图。
图1为本发明实施例提供的一种融合多特征的深度知识追踪方 法的流程示意图;
图2为本发明实施例提供的一种融合多特征的深度知识追踪系 统的结构示意图;
图3为本发明实施例提供的一种融合多特征的深度知识追踪系 统的结构图;
图4为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结 合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、 完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有 做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护 的范围。
下面基于本发明所述的融合多特征的深度知识追踪方法,对其实 施例进行详细描述。如图1所示,其为本发明实施例提供的融合多特 征的深度知识追踪方法的流程示意图,具体实现过程包括以下步骤:
步骤101:确定待分析文本对应的知识点语义表征向量;其中, 所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知 识点难度特征。
在本步骤中,确定待分析文本对应的知识点语义表征向量,具体 实现过程包括:确定所述待分析文本对应的知识点编号特征,确定所 述待分析文本对应的题目文本特征,确定所述待分析文本对应的知识 点难度特征,并基于预设转换器模型(即Transformer模型)中的多 头自注意力机制对所述知识点编号特征、所述题目文本特征以及所述 知识点难度特征进行融合处理,得到相应的知识点语义表征向量。
需要说明的是,由于目标对象在答题过程中的每一道题都对应着 一个知识点编号,若用独热(one-hot)向量来直接构造知识点编号特 征会使特征非常稀疏。因此在本发明实施例中,确定所述待分析文本 对应的知识点编号特征时,可基于所述待分析文本中的知识点编号对 应的独热向量和嵌入知识点矩阵得到相应的知识点编号特征。具体的 也就是将知识点编号对应的独热向量乘以相应的嵌入矩阵,得到知识 点编号特征。
实践中,题目文本特征可以有效地对题目文本信息进行表征,比 只用知识点编号来表示题目文本包含了更多语义信息。在本发明实施 例中,使用的具有题目文本的数据集是中文的。对于中文题目文本, 其题目文本特征可使用Transformer模型方法来提取。具体的,首先 对所述待分析文本中的题目文本进行分词处理,并对特殊符号、停用 词等进行清洗,得到分词特征。经过上述处理,所述题目文本可以描 述为包含若干个词的句子。将所述题目文本中的每一个词转化为相应 的词向量,得到所述题目文本对应的句子矩阵;并根据每一个词构建 相应的位置向量,得到相应的位置矩阵。将所述句子矩阵和所述位置 矩阵输入到预设的网络模型结构中,得到所述题目文本对应的题目文 本特征。比如将句子矩阵和位置矩阵相加之后分别线性投影到三个不 同的空间当作Key,Value,Query输入模型中,经过包含Multi-head Attention和Feed Forward Networks的Transformer Block结构,得到 相应的题目文本特征。其中,所述题目文本特征用于对题目文本进行 表征。
在具体实施过程中,知识点难度通常用各知识点相关题目回答的 正确率表示,数值范围在[0,1]。考虑各个知识点上回答的正确率分 布不均匀,在本发明实施例中可使用箱线图对数据进行处理。确定所 述待分析文本对应的知识点难度特征,具体实现过程包括:计算知识 点数据对应题目文本回答的正确率集合,根据所述正确率集合得到所 述知识点数据正确率的下四分位点、中位数以及上四分位点,并将所 述知识点数据正确率的下四分位点、中位数以及上四分位点输入到预 设的限值公式,即下述公式(1)和(2),得到相应的上限值和下限 值;若所述正确率集合存在大于所述上限值或者小于所述下限值的正确率值,则判定所述正确率值为异常值,将所述正确率集合对应的均 值替换所述异常值,得到目标正确率集合;根据所述目标正确率集合, 对所述知识点数据按照不同的知识点难度区间进行划分,根据不同知 识点难度数据对应的独热向量和嵌入难度类别数矩阵,得到相应的知 识点难度特征。
另外,由于目标对象在各知识点上的表现还与目标对象能力值等 有关。对于难度较大的题目,能力值较高的目标对象回答的正确率更 高。因此,在本发明实施例中,还引入了目标对象能力值特征,其构 造方法包括:确定所有回答正确的题目对应的第一知识点难度数据, 确定所有回答过的题目对应的第二知识点难度数据,并根据所述第一 知识点难度数据、所述第二知识点难度数据以及目标对象能力类别 数,得到目标对象能力特征,并通过相应的嵌入矩阵,得到目标对象 能力值特征向量。具体的,可将所有回答正确的题目对应的知识点难 度求和,除以所有回答过的题目对应的知识点难度之和,再乘以目标 对象能力类别数,然后向下取整得到目标对象能力值特征,再通过嵌 入矩阵,得到目标对象能力值特征向量。
除此之外,现有多数研究的答题记录表征向量仅考虑了目标对象 的作答情况。然而,答题用时也能在一定程度上反映作答该题时知识 状态的掌握程度。因此,在本发明具体实施过程中,还引入了答题用 时特征。其构造方法包括:对数据集合中所有的答题用时按升序进行 排序,并将连续的答题用时进行离散化处理后,对目标对象的答题用 时进行归一化处理,得到答题用时的下四分位点、中位数以及上四分 位点;将所述答题用时的下四分位点、中位数以及上四分位点输入到 预设的限值公式中,得到答题用时的上限值和下限值。该数据集合为 所述待分析文本对应的答题用时数据的集合。若所述数据集合的答题用时中存在大于所述上限值或者小于所述下限值的正确率值,则判定 所述答题用时为异常值,将所述数据集合的答题用时对应的均值替换 所述异常值,得到目标答题用时集合。根据所述目标答题用时集合, 对所述数据集合按照不同的答题用时区间进行划分,根据所述数据集 合中不同答题用时对应的独热向量和嵌入答题用时等级数矩阵,得到 相应的答题用时特征。
步骤102:将所述知识点语义表征向量输入至深度知识追踪模型 中进行处理,得到所述深度知识追踪模型输出的相应的知识状态预测 结果。其中,所述知识状态预测结果可包括目标对象对知识点的掌握 程度的评估结果以及目标对象对知识点在下一时刻的作答表现的预 测结果。所述深度知识追踪模型是以样本文本、所述样本文本对应的 样本知识状态预测结果以及真实标签进行训练,以使所述真实标签与 样本知识状态预测结果之间的交叉熵损失达到最小化为训练目标得 到的;所述深度知识追踪模型用于基于对所述样本文本进行特征提取 得到的知识点语义表征向量,对所述待分析文本进行语义理解。
举例而言,在一个完整实施例中,本发明所述融合多特征的深度 知识追踪方法至少包括相关权重计算过程、读过程、写过程以及模型 训练过程。如图2所示,其为本发明实施例提供的一种融合多特征的 深度知识追踪系统的结构示意图。
在本发明实施例中,深度知识追踪模型(MFKT模型)引入了题 目文本特征、知识点难度特征等来提取深层次的语义信息。第t时刻 知识点语义表征向量qt包括三个部分:知识点编号特征kt,题目文本 特征qtt,知识点难度特征dift。需要说明的是,本发明所有特征的 构造方法均以第t时刻深度知识追踪模型的输入特征为例,相关权重 计算过程中相关特征构造方法具体如下所述:
知识点编号特征kt构造方法:目标对象在答题过程中的每一道题 都对应着一个知识点编号,若用独热向量来构造知识点编号特征会使 特征非常稀疏,于是将知识点编号对应的独热(one-hot)向量乘以嵌 入矩阵Mk(l×dk维),可得到知识点编号特征kt(dk维);其中l为 知识点总数。
题目文本特征qtt使用Transformer方法来提取:题目文本特征可 以有效地对题目文本信息进行表征,比只用知识点编号来表示题目包 含了更多语义信息。首先使用预设的分词工具对题目文本进行分词, 然后对特殊符号、停用词等进行清洗,最终得到分词特征。经过上述 处理,题目文本可以描述为是一个包含m个词的句子 Ei={w1,w2,…,wm}。对于Ei,首先将每一个词wi转化为d0维的词 向量,题目文本Ei则对应一个m×d0维的句子矩阵。进一步的,为每 个词构建一个d0维的位置向量,形成一个m×d0维的位置矩阵。将句 子矩阵和位置矩阵相加之后分别线性投影到三个不同的空间当作 Key,Value,Query输入模型中,经过包含Multi-head Attention和Feed Forward Networks的Transformer Block结构,得到题目文本特征qt。
知识点难度特征dift构造方法DIFbox:通常知识点难度可用各知 识点相关题目回答的正确率表示,数值范围在[0,1]。考虑到各个知 识点上回答的正确率分布不均匀,因此本发明使用箱线图对数据进行 处理。假如,有s个知识点,计算出s个知识点的正确率c={c1,c2,…,cs},从这s个数值中统计出下四分位点Q1、中位数Q2、上四 分位点Q3,分别利用公式(1)和(2)求出上限high和下限low。如 果知识点正确率大于上限或者小于下限,则将其视为异常值,异常值 用均值代替。然后,将连续特征c离散化,根据数据分布将知识点难 度按区间划分为p类。因此,知识点难度特征dift(dk维)由知识点 难度对应的独热向量乘以相应的嵌入矩阵Md(p×dk维)得到。
high=Q3+(Q3-Q1)*1.5 (1)
low=Q1-(Q3-Q1)*1.5 (2)
另外,为了将上述三个部分的特征有效地融合在一起,充分表征 知识点语义特征,本发明采用了基于Multi-head Self-Attention机制的 方法来构造知识点语义特征。具体构造方法如下:
Q=UWQ,K=UWK,V=UWV (3)
然后,使用Scaled Dot-product得到注意力权重:
为了从不同的特征子空间中提取信息,还需要将Q、K、V线性投 影k次,然后将所有的head拼接起来,得到:
MultiHead(Q,K,V)=concat(head1,…,headk)WO (5)
其中,然后,进一步的 将MultiHead(Q,K,V)通过Feed Forward Networks进行非线性变换。 具体的,为了更好的优化深度网络,整个网络模型使用残差连接,并 对子层进行了标准化处理。最后输出结果时,将原始v个特征向量统 一成一个定长的特征向量。因此,知识点语义表征qt可由式(6)得 到,其中F函数表示上述提出的融合特征的方法。
qt=F(kt,qtt,dift) (6)
模型输入的知识点语义表征向量qt与Key Memory的每一个 Key Slot向量Mk(i)(3dk维)做内积运算,再通过Softmax激活函 数,可以得到潜在知识点的相关权重。相关权重wt表示当前输入知 识点与各个潜在知识点之间的相关程度:
在本发明实施例中,读过程包括:当预测kt作答表现时,模型利 用相关权重wt将Value Memory中所有Value Slot向量(2dv维) 加权求和得到读取内容rt。rt表示目标对象对知识点的掌握水平。
另外,在具体实施过程中,由于目标对象在各知识点上的表现还 与目标对象能力值等有关。对于难度较大的题目,能力值较高的目标 对象回答的正确率更高。因此MFKT模型引入了目标对象能力值特 征abit,其构造方法ABIatt如下:将所有回答正确的题目对应的知识 点难度求和,除以所有回答过的题目对应的知识点难度之和,再乘以 目标对象能力类别数w,然后向下取整得到abit,如式(9)所示。再 通过相应的嵌入矩阵,得到目标对象能力值向量abit。
将rt与qt和abit拼接,再通过一个全连接层和激活函数得到向量 ft。
ft=Tanh(W1 T[rt,qt,abit]+b1) (10)
最终,向量ft通过另一个全连接层和一个Sigmoid激活函数来预 测目标对象的表现。pt代表目标对象正确回答该知识点的概率。
在本发明实施例中,写过程包括:现有多数研究的答题记录表征 向量qat仅考虑了目标对象的作答情况。目标对象在答题过程中的作 答情况都对应着一个二元组xt=(kt,rt),使xt=kt+l*rt,将xt对 应的独热向量乘以嵌入矩阵Mi(2l×dv维),可得到it(dv维)。然而,答题用时也能在一定程度上反映作答该题时知识状态的掌握程 度。因此,在本发明实施例中引入了答题用时特征dt。其构造方法 DURbox如下:对数据集中所有的答题用时按升序进行排序,其中最 小值为min,最大值为max。考虑到答题用时分布不均匀,同样使用 箱线图对数据进行处理。首先,将连续的答题用时离散化,将目标对 象的答题用时进行归一化处理,然后统计出答题用时的下四分位点 Q1、中位数Q2、上四分位点Q3,分别利用式(1)和(2)求出上限high和 下限low。大于上限或小于下限的点为异常值,异常值用均值代替。 根据数据分布将答题用时按区间划分为q类。因此,答题用时特征dt由 答题用时对应的的独热向量乘以相应的嵌入矩阵Md(q×dv维)得 到。类似的,答题记录表征向量qat如式(12)所示。
qat=F(it,dt) (12)
当目标对象回答qt后,MKFT模型使用t时刻的目标对象作答情 况更新t+1时刻的Value Memory。受到长短时记忆网络输入门和遗 忘门的启发,qat通过一个全连接层和一个Sigmoid激活函数得到擦 除向量et:
et=Sigmoid(ETqat+be) (13)
然后,qat通过一个全连接层和一个激活函数得到增长向量at:
at=Tanh(DTqat+ba)T (14)
最后通过式(15)即可更新目标对象下一时刻的知识状态:
在本发明实施例中,训练过程包括:使用随机高斯分布N=(0,σ) 初始化Mk、Mv、相应的嵌入矩阵以及其他权重矩阵。使用交叉熵函 数来优化该模型,深度知识追踪系统模型的优化目标是使真实标签rt与预测值pt之间的交叉熵损失达到最小,如式(16)所示。训练结束 后,深度知识追踪系统模型得到目标对象在该知识点上的知识状态。
在本发明实施例中,上述公式(1)-(16)中包含的参数对应的 具体含义如下:kt为知识点编号特征;Mk为知识点矩阵;dift为知 识点难度特征;为t时刻的知识点记忆矩阵;qtt为题目文本特征; wt为知识点权重;it为答题交互特征;rt为对t时刻知识点的掌握程 度;dt为答题用时特征;abit为目标对象能力特征;qt为知识点语义 特征;ft为对t时刻知识点的综合掌握程度;qat为答题记录特征;pt为 对t时刻知识点回答正确的概率;et为擦除向量;at为增长向量;n为 答题序列最大长度;l为知识点总数;m为单词个数;s为知识点个数; p为难度类别数;c为正确率;u为特征向量;q为答题用时等级数;w为 目标对象能力值等级数;v为特征向量个数。在此不再一一赘述。
本发明综合考虑了题目文本、知识点难度、目标对象能力和答题 用时等关键特征,能够将目标对象的答题情况与对应的题目文本特征 进行统一建模,同时将知识点难度特征、学生能力值特征和答题用时 特征引入知识追踪模型中,并采用多头自注意力(Multi-head Self-Attention)机制对上述特征组合,提出了一种融合多特征的深度 知识追踪方法,提高了知识追踪模型的预测精度和效率,能够准确预 测目标对象在下一次答题时的表现。
与上述提供的一种融合多特征的深度知识追踪方法相对应,本发 明还提供一种融合多特征的深度知识追踪系统。由于该系统的实施例 相似于上述方法实施例,所以描述得比较简单,相关之处请参见上述 方法实施例部分的说明即可,下面描述的融合多特征的深度知识追踪 系统的实施例仅是示意性的。请参考图3所示,其为本发明实施例提 供的一种融合多特征的深度知识追踪系统的结构示意图。
本发明所述的一种融合多特征的深度知识追踪系统具体包括如 下部分:
知识点语义表征向量确定单元301,用于确定待分析文本对应的 知识点语义表征向量;其中,所述知识点语义表征向量包含知识点编 号特征、题目文本特征以及知识点难度特征;
知识状态预测单元302,用于将所述知识点语义表征向量输入至 深度知识追踪模型中进行处理,得到所述深度知识追踪模型输出的相 应的知识状态预测结果;其中,所述深度知识追踪模型是以样本文本、 所述样本文本对应的样本知识状态预测结果以及真实标签进行训练 得到的。
本发明综合考虑了题目文本、知识点难度、目标对象能力和答题 用时等关键特征,能够将目标对象的答题情况与对应的题目文本特征 进行统一建模,同时将知识点难度特征、学生能力值特征和答题用时 特征引入知识追踪模型中,并采用多头自注意力(Multi-head Self-Attention)机制对上述特征组合,提出了一种融合多特征的深度 知识追踪系统,提高了知识追踪模型的预测精度和效率,能够准确预 测目标对象在下一次答题时的表现。
与上述提供的融合多特征的深度知识追踪方法相对应,本发明还 提供一种电子设备。由于该电子设备的实施例相似于上述方法实施 例,所以描述得比较简单,相关之处请参见上述方法实施例部分的说 明即可,下面描述的电子设备仅是示意性的。如图4所示,其为本发 明实施例公开的一种电子设备的实体结构示意图。该电子设备可以包 括:处理器(processor)401、存储器(memory)402和通信总线403, 其中,处理器401,存储器402通过通信总线403完成相互间的通信。 处理器401可以调用存储器402中的逻辑指令,以执行融合多特征的 深度知识追踪方法,该方法包括:确定待分析文本对应的知识点语义 表征向量;其中,所述知识点语义表征向量包含知识点编号特征、题 目文本特征以及知识点难度特征;将所述知识点语义表征向量输入至 深度知识追踪模型中进行处理,得到所述深度知识追踪模型输出的相 应的知识状态预测结果;其中,所述深度知识追踪模型是以样本文本、 所述样本文本对应的样本知识状态预测结果以及真实标签进行训练 得到的。
此外,上述的存储器402中的逻辑指令可以通过软件功能单元的 形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可 读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说 对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品 的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若 干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者 网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而 前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁 碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算 机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序, 所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计 算机能够执行上述各方法实施例所提供的融合多特征的深度知识追 踪方法,该方法包括:确定待分析文本对应的知识点语义表征向量; 其中,所述知识点语义表征向量包含知识点编号特征、题目文本特征 以及知识点难度特征;将所述知识点语义表征向量输入至深度知识追 踪模型中进行处理,得到所述深度知识追踪模型输出的相应的知识状 态预测结果;其中,所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介 质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执 行上述各实施例提供的融合多特征的深度知识追踪方法,该方法包 括:确定待分析文本对应的知识点语义表征向量;其中,所述知识点 语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特 征;将所述知识点语义表征向量输入至深度知识追踪模型中进行处 理,得到所述深度知识追踪模型输出的相应的知识状态预测结果;其 中,所述深度知识追踪模型是以样本文本、所述样本文本对应的样本 知识状态预测结果以及真实标签进行训练得到的。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部 件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的 部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也 可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付 出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解 到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然 也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现 有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软 件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光 盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所 述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而 非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领 域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技 术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修 改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方 案的精神和范围。
Claims (10)
1.一种融合多特征的深度知识追踪方法,其特征在于,包括:
确定待分析文本对应的知识点语义表征向量;
其中,所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征;
将所述知识点语义表征向量输入至深度知识追踪模型中进行处理,得到所述深度知识追踪模型输出的相应的知识状态预测结果;
其中,所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。
2.根据权利要求1所述的融合多特征的深度知识追踪方法,其特征在于,所述确定待分析文本对应的知识点语义表征向量,具体包括:
确定所述待分析文本对应的知识点编号特征;
确定所述待分析文本对应的题目文本特征;
确定所述待分析文本对应的知识点难度特征;
基于预设转换器模型中的多头自注意力机制对所述知识点编号特征、所述题目文本特征以及所述知识点难度特征进行融合处理,得到相应的知识点语义表征向量。
3.根据权利要求2所述的融合多特征的深度知识追踪方法,其特征在于,确定所述待分析文本对应的知识点编号特征,包括:基于所述待分析文本中的知识点编号对应的独热向量和嵌入知识点矩阵,得到相应的知识点编号特征;
确定所述待分析文本对应的题目文本特征,包括:对所述待分析文本中的题目文本进行分词处理,并对特殊符号、停用词进行清洗,得到分词特征;其中,所述题目文本为包含若干个词的句子;将所述题目文本中的每一个词转化为相应的词向量,得到所述题目文本对应的句子矩阵;并根据每一个词构建相应的位置向量,得到相应的位置矩阵;将所述句子矩阵和所述位置矩阵输入到预设的网络模型结构中,得到所述题目文本对应的题目文本特征;其中,所述题目文本特征用于对题目文本进行表征;
确定所述待分析文本对应的知识点难度特征,包括:确定知识点数据对应题目文本回答的正确率集合;根据所述正确率集合得到所述知识点数据正确率的下四分位点、中位数以及上四分位点,并将所述知识点数据正确率的下四分位点、中位数以及上四分位点输入到预设的限值公式中,得到相应的上限值和下限值;若所述正确率集合存在大于所述上限值或者小于所述下限值的正确率值,则判定所述正确率值为异常值,将所述正确率集合对应的均值替换所述异常值,得到目标正确率集合;根据所述目标正确率集合,对所述知识点数据按照不同的知识点难度区间进行划分,根据不同知识点难度数据对应的独热向量和嵌入难度类别数矩阵,得到相应的知识点难度特征。
4.根据权利要求3所述的融合多特征的深度知识追踪方法,其特征在于,还包括:
确定所有回答正确的题目对应的第一知识点难度数据;
确定所有回答过的题目对应的第二知识点难度数据;
根据所述第一知识点难度数据、所述第二知识点难度数据以及目标对象能力类别数,得到目标对象能力特征,并通过相应的嵌入矩阵,得到目标对象能力值特征向量。
5.根据权利要求1所述的融合多特征的深度知识追踪方法,其特征在于,还包括:
对数据集合中所有的答题用时按升序进行排序,并将连续的答题用时进行离散化处理后,对目标对象的答题用时进行归一化处理,得到答题用时的下四分位点、中位数以及上四分位点;将所述答题用时的下四分位点、中位数以及上四分位点输入到预设的限值公式中,得到答题用时的上限值和下限值;
若所述数据集合的答题用时中存在大于所述上限值或者小于所述下限值的正确率值,则判定所述答题用时为异常值,将所述数据集合的答题用时对应的均值替换所述异常值,得到目标答题用时集合;
根据所述目标答题用时集合,对所述数据集合按照不同的答题用时区间进行划分,根据所述数据集合中不同答题用时对应的独热向量和嵌入答题用时等级数矩阵,得到相应的答题用时特征。
6.根据权利要求1所述的融合多特征的深度知识追踪方法,其特征在于,所述知识状态预测结果,具体包括:目标对象对知识点的掌握程度的评估结果以及目标对象对知识点在下一时刻的作答表现的预测结果。
7.根据权利要求1所述的融合多特征的深度知识追踪方法,其特征在于,所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的,具体包括:所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练,以使所述真实标签与样本知识状态预测结果之间的交叉熵损失达到最小化为训练目标得到的;所述深度知识追踪模型用于基于对所述样本文本进行特征提取得到的知识点语义表征向量,对所述待分析文本进行语义理解。
8.一种融合多特征的深度知识追踪系统,其特征在于,包括:
知识点语义表征向量确定单元,用于确定待分析文本对应的知识点语义表征向量;其中,所述知识点语义表征向量包含知识点编号特征、题目文本特征以及知识点难度特征;
知识状态预测单元,用于将所述知识点语义表征向量输入至深度知识追踪模型中进行处理,得到所述深度知识追踪模型输出的相应的知识状态预测结果;其中,所述深度知识追踪模型是以样本文本、所述样本文本对应的样本知识状态预测结果以及真实标签进行训练得到的。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任意一项所述的融合多特征的深度知识追踪方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7任意一项所述的融合多特征的深度知识追踪方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110407038.0A CN113239699B (zh) | 2021-04-15 | 2021-04-15 | 一种融合多特征的深度知识追踪方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110407038.0A CN113239699B (zh) | 2021-04-15 | 2021-04-15 | 一种融合多特征的深度知识追踪方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113239699A true CN113239699A (zh) | 2021-08-10 |
CN113239699B CN113239699B (zh) | 2023-11-07 |
Family
ID=77128135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110407038.0A Active CN113239699B (zh) | 2021-04-15 | 2021-04-15 | 一种融合多特征的深度知识追踪方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239699B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023155301A1 (zh) * | 2022-02-16 | 2023-08-24 | 平安科技(深圳)有限公司 | 基于改进irt结构的答题序列预测方法、控制器及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160048546A1 (en) * | 2014-08-14 | 2016-02-18 | Nice-Systems Ltd | Determination of prominent phrases in multi-channel interactions by multi-feature evaluations |
CN110991645A (zh) * | 2019-11-18 | 2020-04-10 | 广东宜学通教育科技有限公司 | 一种基于知识模型的自适应学习方法、系统及存储介质 |
CN111832312A (zh) * | 2020-05-15 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 文本处理方法、装置、设备和存储介质 |
CN111831789A (zh) * | 2020-06-17 | 2020-10-27 | 广东工业大学 | 一种基于多层语义特征提取结构的问答文本匹配方法 |
CN112052828A (zh) * | 2020-09-23 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 一种学习能力确定方法、装置及存储介质 |
CN112116092A (zh) * | 2020-08-11 | 2020-12-22 | 浙江师范大学 | 可解释性知识水平追踪方法、系统和存储介质 |
CN112182308A (zh) * | 2020-09-29 | 2021-01-05 | 华中师范大学 | 基于多热编码的多特征融合深度知识追踪方法及系统 |
CN112257966A (zh) * | 2020-12-18 | 2021-01-22 | 北京世纪好未来教育科技有限公司 | 模型处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-04-15 CN CN202110407038.0A patent/CN113239699B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160048546A1 (en) * | 2014-08-14 | 2016-02-18 | Nice-Systems Ltd | Determination of prominent phrases in multi-channel interactions by multi-feature evaluations |
CN110991645A (zh) * | 2019-11-18 | 2020-04-10 | 广东宜学通教育科技有限公司 | 一种基于知识模型的自适应学习方法、系统及存储介质 |
CN111832312A (zh) * | 2020-05-15 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 文本处理方法、装置、设备和存储介质 |
CN111831789A (zh) * | 2020-06-17 | 2020-10-27 | 广东工业大学 | 一种基于多层语义特征提取结构的问答文本匹配方法 |
CN112116092A (zh) * | 2020-08-11 | 2020-12-22 | 浙江师范大学 | 可解释性知识水平追踪方法、系统和存储介质 |
CN112052828A (zh) * | 2020-09-23 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 一种学习能力确定方法、装置及存储介质 |
CN112182308A (zh) * | 2020-09-29 | 2021-01-05 | 华中师范大学 | 基于多热编码的多特征融合深度知识追踪方法及系统 |
CN112257966A (zh) * | 2020-12-18 | 2021-01-22 | 北京世纪好未来教育科技有限公司 | 模型处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
艾方哲: "基于知识追踪的智能导学算法设计", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 1, pages 140 - 140 * |
陶泽泽: "智能教育系统中的知识追踪模型研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 8, pages 138 - 892 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023155301A1 (zh) * | 2022-02-16 | 2023-08-24 | 平安科技(深圳)有限公司 | 基于改进irt结构的答题序列预测方法、控制器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113239699B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111125331B (zh) | 语义识别方法、装置、电子设备及计算机可读存储介质 | |
CN111078836B (zh) | 基于外部知识增强的机器阅读理解方法、系统、装置 | |
CN110188272B (zh) | 一种基于用户背景的社区问答网站标签推荐方法 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN113656570B (zh) | 基于深度学习模型的视觉问答方法及装置、介质、设备 | |
CN110377916A (zh) | 词预测方法、装置、计算机设备及存储介质 | |
CN112257966B (zh) | 模型处理方法、装置、电子设备及存储介质 | |
CN110334275B (zh) | 一种新闻流行度预测方法、设备和存储介质 | |
Tang et al. | Modelling student behavior using granular large scale action data from a MOOC | |
CN115146162A (zh) | 一种在线课程推荐方法及系统 | |
CN113902129A (zh) | 多模态的统一智能学习诊断建模方法、系统、介质、终端 | |
CN111460101A (zh) | 知识点类型的识别方法、装置及处理器 | |
CN114021722A (zh) | 一种融合认知刻画的注意力知识追踪方法 | |
CN111368082A (zh) | 一种基于层次网络的领域自适应词嵌入的情感分析方法 | |
CN114385801A (zh) | 一种基于分层细化lstm网络的知识追踪方法及系统 | |
CN114913729A (zh) | 一种选题方法、装置、计算机设备和存储介质 | |
Mrhar et al. | A Bayesian CNN-LSTM model for sentiment analysis in massive open online courses MOOCs | |
CN114429212A (zh) | 智能学习知识能力跟踪方法、电子设备及存储介质 | |
CN116306863A (zh) | 基于对比学习的协同知识追踪建模方法及系统 | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN113283488B (zh) | 一种基于学习行为的认知诊断方法及系统 | |
CN113239699A (zh) | 一种融合多特征的深度知识追踪方法及系统 | |
CN111782964A (zh) | 一种社区帖子的推荐方法 | |
CN110334353A (zh) | 词序识别性能的分析方法、装置、设备及存储介质 | |
CN116502713B (zh) | 一种基于加权元路径增强题目相似性嵌入的知识追踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |