CN112231373B - 知识点数据的处理方法、装置、设备和计算机可读介质 - Google Patents

知识点数据的处理方法、装置、设备和计算机可读介质 Download PDF

Info

Publication number
CN112231373B
CN112231373B CN202011216836.7A CN202011216836A CN112231373B CN 112231373 B CN112231373 B CN 112231373B CN 202011216836 A CN202011216836 A CN 202011216836A CN 112231373 B CN112231373 B CN 112231373B
Authority
CN
China
Prior art keywords
knowledge point
degree
knowledge
labels
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011216836.7A
Other languages
English (en)
Other versions
CN112231373A (zh
Inventor
杨晨
孙康明
卢鑫鑫
刘萌
叶礼伟
孙朝旭
覃伟枫
吴嫒博
刘晓靖
夏志群
蔡晓凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011216836.7A priority Critical patent/CN112231373B/zh
Publication of CN112231373A publication Critical patent/CN112231373A/zh
Application granted granted Critical
Publication of CN112231373B publication Critical patent/CN112231373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Abstract

本申请的实施例提供了一种知识点数据的处理方法、装置、设备和计算机可读介质,涉及人工智能技术领域中的机器学习。本申请实施例中的知识点数据的处理方法包括:获取用户在各历史时间段的知识点掌握度集合;按照时间顺序对知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列;输入知识点掌握度集合序列至预训练的预测模型;获取预训练的预测模型输出的多个知识点的掌握度标签,作为用户在当前时间段对多个知识点的掌握度标签。本申请实施例的技术方案提高了预测用户对知识点的掌握程度的准确度。

Description

知识点数据的处理方法、装置、设备和计算机可读介质
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种知识点数据的处理方法、装置、设备和计算机可读介质。
背景技术
在用户对知识点的掌握程度进行预测的场景中,通常会对用户以往的答题数据进行分析,进而预测用户对知识点的掌握程度。
由于用户对知识点的掌握程度与时间存在较大关联,在相关技术中,提出了一种通过预测模型来预测用户对知识点的掌握程度的方法,该方法主要通过具有连续时序关系的答题数据对机器学习模型进行训练得到,因而非常适合针对用户对单一知识点的掌握程度进行预测的情况,如,对于某个知识点,主要通过对用户在不同时间阶段所做过的包含该知识点的答题数据进行分析,以确定用户对知识点的掌握程度。
而针对多次考试或作业等阶段性的答题数据,其答题数据存在以下特性:在多次考试或作业之间是存在时序特性的、而单次考试或作业内的答题行为之间是不存在时序特性的。因此,采用相关技术中提出的模型来对用户多次考试或作业等阶段性的答题数据进行预测,以确定用户对知识点的掌握程度的场景中,由于数据结构性的偏差的原因,会导致相关技术中提出的方法存在预测准确度较低的技术问题。
发明内容
本申请的实施例提供了一种知识点数据的处理方法、装置、设备和计算机可读介质,可以解决相关技术中提出的方法所存在的预测准确度较低的技术问题。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种知识点数据的处理方法,包括:获取用户在各历史时间段的知识点掌握度集合,所述知识点掌握度集合包括所述用户对多个知识点的掌握度标签;按照时间顺序对所述知识点掌握度集合进行排序处理,生成由所述知识点掌握度集合组成的知识点掌握度集合序列;输入所述知识点掌握度集合序列至预训练的预测模型,所述预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到;获取所述预训练的预测模型输出的多个知识点的掌握度标签,作为所述用户在当前时间段对多个知识点的掌握度标签。
根据本申请实施例的一个方面,提供了一种知识点数据的处理装置,包括:第一获取单元,用于获取用户在各历史时间段的知识点掌握度集合,所述知识点掌握度集合包括所述用户对多个知识点的掌握度标签;排序单元,用于按照时间顺序对所述知识点掌握度集合进行排序处理,生成由所述知识点掌握度集合组成的知识点掌握度集合序列;第一输入单元,用于输入所述知识点掌握度集合序列至预训练的预测模型,所述预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到;第二获取单元,用于获取所述预训练的预测模型输出的多个知识点的掌握度标签,作为所述用户在当前时间段对多个知识点的掌握度标签。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:第三获取单元,用于获取所述用户在各历史时间段内所做过题目的答题数据;第一生成单元,用于基于所述用户在各历史时间段内所做过题目的答题数据,生成所述用户在各历史时间段内对多个知识点的掌握度标签;第二生成单元,用于基于所述用户在各历史时间段内对多个知识点的掌握度标签,生成所述用户在各历史时间段的知识点掌握度集合。
在本申请的一些实施例中,基于前述方案,所述答题数据包括题目所包含的知识点和题目的答题结果标签,所述第一生成单元被配置为:基于题目所包含的知识点,确定包含各知识点的目标题目;基于包含各知识点的目标题目对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签。
在本申请的一些实施例中,基于前述方案,所述第一生成单元被配置为:确定包含各知识点的目标题目对应的答题结果标签为正确标签的数量以及包含各知识点的目标题目对应的答题结果标签为错误标签的数量;基于包含各知识点的目标题目对应的正确标签的数量和包含各知识点的目标题目对应的错误标签的数量,选择标签数量最多的答题结果标签作为各知识点对应的答题结果标签;基于各知识点对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:第四获取单元,用于获取用于对待训练的机器学习模型进行训练的训练集样本数据,所述训练集样本数据中的每条样本数据包括训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签;训练单元,用于通过所述训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:第五获取单元,用于获取用于对训练后的机器学习模型进行校验的测试集样本数据,所述测试集样本数据中的每条样本数据包括测试样本知识点掌握度集合序列、多个测试样本知识点的预设掌握度标签;第二输入单元,用于将所述测试集样本数据中的每条样本数据的测试样本知识点掌握度集合序列输入至训练后的机器学习模型,输出得到预测的所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签;识别单元,用于若所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的预设掌握度标签与预测的所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签均一致的样本数据条数占所述测试集样本数据中总样本数据条数的比例超过预定比例阈值,则将训练后的机器学习模型识别为所述预训练的预测模型。
在本申请的一些实施例中,基于前述方案,所述训练单元被配置为:将所述训练集样本数据中的每条样本数据输入至待训练的机器学习模型;基于所述待训练的机器学习模型内部的网络结构对所述测试样本知识点掌握度集合序列进行处理,输出得到预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签;计算预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差;基于预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差之和,计算得到所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差;基于所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差之和,计算得到所述测试样本知识点掌握度集合序列对应的预测误差;若所述测试样本知识点掌握度集合序列对应的预测误差小于预定误差阈值,则确定所述待训练的机器学习模型训练完成;若所述测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值,则继续基于所述训练集样本数据对所述待训练的机器学习模型进行训练,直至所述测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值小于预定误差阈值。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的知识点数据的处理方法。
根据本申请实施例的一个方面,提供了一种知识点数据的处理设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的知识点数据的处理方法。
在本申请的一些实施例所提供的技术方案中,按照时间顺序对用户在各历史时间段的知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列,并通过预训练的预测模型对知识点掌握度集合序列进行处理,确定用户在当前时间段对多个知识点的掌握度标签,由于知识点掌握度集合是包括用户在某个历史时间段内对多个知识点的掌握度标签,因此满足在历史时间段内针对用户对多个知识点的掌握度标签是无序的数据结构特性,多个知识点掌握度集合是按照时间顺序排列的,因此满足在不同历史时间段对应的知识点掌握度集合数据之间是有序的数据结构特性;实现在根据多次考试或作业等阶段性的答题数据来预测用户对知识点的掌握程度的场景中,避免由于数据结构性的偏差的原因而导致知识点的掌握程度的预测准确度较低的技术问题,提高了预测用户对知识点的掌握程度的准确度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
图2示出了根据本申请的一个实施例的知识点数据的处理方法的流程图。
图3示出了根据本申请的一个实施例的知识点数据的处理方法的流程图。
图4示出了根据本申请的一个实施例的知识点数据的处理方法的步骤S320的具体流程图。
图5示出了根据本申请的一个实施例的知识点数据的处理方法的步骤S420的具体流程图。
图6示出了根据本申请的一个实施例的知识点数据的处理方法的流程图。
图7示出了根据本申请的一个实施例的深度知识追踪模型的构架图。
图8示出了根据本申请的一个实施例的知识点数据的处理方法的步骤S620的具体流程图。
图9示出了根据本申请的一个实施例的知识点数据的处理方法的流程图。
图10示出了根据本申请的一个实施例的知识点数据的处理方法的流程图。
图11示出了根据本申请的一个实施例的知识点数据的处理装置的框图。
图12示出了适于用来实现本申请实施例的知识点数据的处理设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
机器学习(ML ,Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例提供的方案涉及机器学习等技术,通过获取用户在各历史时间段的知识点掌握度集合,并按照时间顺序对知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列,将知识点掌握度集合序列输入到预训练的预测模型中,由预训练的预测模型根据输入的知识点掌握度集合序列确定多个知识点的掌握度标签,进而确定用户在当前时间段对多个知识点的掌握度标签,以提高预测用户对知识点的掌握程度的预测准确度。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构可以包括客户端101、网络102和服务器103。客户端101可以是智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等等,网络102用以在客户端101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
应该理解,图1中的客户端101、网络102和服务器103的数目仅仅是示意性的。根据实现需要,可以具有任意数目的客户端101、网络102和服务器103。比如服务器103可以是多个服务器组成的服务器集群等。
客户端101通过网络102与服务器103交互,以接收或发送消息等,服务器103可以是提供各种服务的服务器。服务器103从客户端101中获取客户端101对应的用户在各历史时间段的知识点掌握度集合;知识点掌握度集合包括用户对多个知识点的掌握度标签;按照时间顺序对知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列;输入知识点掌握度集合序列至预训练的预测模型,预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到;获取预训练的预测模型输出的多个知识点的掌握度标签,作为用户在当前时间段对多个知识点的掌握度标签,服务器103可以将用户在当前时间段对多个知识点的掌握度标签发送至客户端101,以使得用户获知在当前时间段对多个知识点的掌握程度。
上述方案中,按照时间顺序对用户在各历史时间段的知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列,并通过预训练的预测模型对知识点掌握度集合序列进行处理,确定用户在当前时间段对多个知识点的掌握度标签,由于知识点掌握度集合是包括用户在某个历史时间段内对多个知识点的掌握度标签,因此满足在历史时间段内针对用户对多个知识点的掌握度标签是无序的数据结构特性,多个知识点掌握度集合是按照时间顺序排列的,因此满足在不同历史时间段对应的知识点掌握度集合数据之间是有序的数据结构特性;实现在根据多次考试或作业等阶段性的答题数据来预测用户对知识点的掌握程度的场景中,避免由于数据结构性的偏差的原因而导致知识点的掌握程度的预测准确度较低的技术问题,提高了预测用户对知识点的掌握程度的准确度。
需要说明的是,本申请实施例所提供的知识点数据的处理方法一般由服务器103执行,相应地,知识点数据的处理装置一般设置于服务器103中。但是,在本申请的其它实施例中,客户端101也可以与服务器103具有相似的功能,从而执行本申请实施例所提供的知识点数据的处理方案。
以下对本申请实施例的技术方案的实现细节进行详细阐述。
图2示出了根据本申请的一个实施例的知识点数据的处理方法的流程图,该知识点数据的处理方法可以由服务器来执行,该服务端可以是图1中所示的服务器103。参照图2所示,该知识点数据的处理方法至少包括步骤S210至步骤S240,详细描述如下。
在步骤S210中,获取用户在各历史时间段的知识点掌握度集合,知识点掌握度集合包括用户对多个知识点的掌握度标签。
在一个实施例中,用户指的是需要进行知识点的掌握程度预测的用户,如需要对教学科目中的知识点的掌握程度进行预测的学生,或需要对专业技能中的知识点的掌握程度进行预测的各个领域的技术人员。知识点是该用户所学习的教学科目或专业技能中需要掌握的知识单位。
掌握度标签是反映用户对所学习的教学科目或专业技能中的某个知识点的掌握程度的一种标签,它可以包括“掌握”和“未掌握”这两类标签,“掌握”标签表明该用户已掌握知识点,“未掌握”标签表明该用户还没有掌握知识点。
用户在各历史时间段的知识点掌握度集合是指用户在过去某个历史时间段对多个不同知识点的掌握度标签所组成的集合。由于用户对某个知识点的掌握程度与时间存在关联,如用户在某个时间段内已掌握某个知识点,但是一段时间之后,用户可能又已经遗忘了这个知识点,因此在不同时间段内,用户对各个知识点的掌握程度可能不同,对应的,用户在各历史时间段的知识点掌握度集合也可能不同,但是总体上来说,用户学习一个知识点的时间越长,已掌握该知识点的可能性越大。需要指出的是,本实施例中的各个历史时间段一般指的是一个较短的时间区间,在这个较短的时间区间,我们可以认为用户对知识点的掌握程度不会产生改变,例如一次考试所对应的时间区间或包含多个题目的一次作业所对应的时间区间。
用户对知识点的掌握度标签可以有多种方式来生成。
在一个实施例中,掌握度标签可以由用户的指导老师基于预设的评分标准针对用户对各个知识点的掌握程度进行考察后人工设置的标签。
在一个实施例中,用户对知识点的掌握度标签还可以根据以下方式生成,参考图3,图3示出了根据本申请的一个实施例的知识点数据的处理方法的流程图,该实施例中的知识点数据的处理方法还可以包括步骤S310至步骤S330,详细描述如下。
在步骤S310中,获取用户在各历史时间段内所做过题目的答题数据。
在一个实施例中,用户所做过的包含知识点的题目的答题情况可以有效反映该用户对知识点的掌握程度,在确定在某个历史时间段的知识点掌握度集合时,可以根据用户在该历史时间段内所做过题目的答题情况来确定用户在该各历史时间段对知识点的掌握度标签。
用户所做过题目的答题数据可以以历史答题记录的形式被上传至服务器的数据库中,每道题目的答题数据可以生成一条历史答题记录,每条历史答题记录可以包括用户的标识信息、答题结果标签以及这道题目所包含的知识点。
用户在同一历史时间段所做过题目所生成的历史答题记录可以组成一个历史答题记录集合进行一次性上传,在提高上传效率的同时,也便于基于用户在各历史时间段内所做过题目的答题数据,生成用户在各历史时间段内对多个知识点的掌握度标签。
在步骤S320中,基于用户在各历史时间段内所做过题目的答题数据,生成用户在各历史时间段内对多个知识点的掌握度标签。
在一个实施例中,在生成用户在各历史时间段内对多个知识点的掌握度标签时,可以根据各题目所包含的知识点和各题目对应的答题结果标签来确定用户对知识点的掌握度标签。
参考图4,图4示出了根据本申请的一个实施例的知识点数据的处理方法的步骤S320的具体流程图,该实施例中的知识点数据的处理方法还可以包括步骤S410至步骤S420,详细描述如下。
在步骤S410中,基于题目所包含的知识点,确定包含各知识点的目标题目。
在本申请的一个实施例中,由于答题数据包括题目所包含的知识点和题目的答题结果标签,因此,针对各知识点,可以根据每个题目所包含的知识点,依次确定包含各个知识点的所有题目,作为包含该知识点的目标题目。
在步骤S420中,基于包含各知识点的目标题目对应的答题结果标签,生成用户在各历史时间段内对多个知识点的掌握度标签。
在一个实施例中,对于包含某个知识点的所有目标题目,可以通过目标题目对应的答题结果标签、以及包含知识点的题目对应的答题结果标签和用户对该知识点的掌握度标签之间的对应关系,来生成用户对该知识点的掌握度标签。
参考图5,图5示出了根据本申请的一个实施例的知识点数据的处理方法的步骤S420的具体流程图,该实施例中的知识点数据的处理方法还可以包括步骤S510至步骤S530,详细描述如下。
在步骤S510中,确定包含各知识点的目标题目对应的答题结果标签为正确标签的数量以及包含各知识点的目标题目对应的答题结果标签为错误标签的数量。
在一个实施例中,答题结果标签包括“正确”标签以及“错误”标签这两类,对于包含某个知识点的目标题目有多个的情况,可以确定包含该知识点的目标题目对应的答题结果标签为“正确”标签的数量以及包含该知识点的目标题目对应的答题结果标签为“错误”标签的数量。
在步骤S520中,基于包含各知识点的目标题目对应的正确标签的数量和包含各知识点的目标题目对应的错误标签的数量,选择标签数量最多的答题结果标签作为各知识点对应的答题结果标签。
在一个实施例中,针对某个知识点,在确定包含该知识点的目标题目对应的答题结果标签为“正确”标签的数量以及包含该知识点的目标题目对应的答题结果标签为“错误”标签的数量后,可以从二者中选择标签数量最多的答题结果标签,作为各知识点对应的答题结果标签。
在步骤S530中,基于各知识点对应的答题结果标签,生成用户在各历史时间段内对多个知识点的掌握度标签。
基于各知识点对应的答题结果标签,生成用户在各历史时间段内对多个知识点的掌握度标签时,可以根据知识点对应的答题结果标签、以及答题结果标签与掌握度标签这二者之间的对应关系,来生成用户在各历史时间段内对多个知识点的掌握度标签。可以理解的是,答题结果标签与掌握度标签这二者之间的对应关系为“正确”标签与“掌握”标签对应,而“错误”标签与“未掌握”标签对应。
例如,针对某个知识点,用户在一个历史时间段内做过包含该知识点的题目共有5道,其中,用户答对的题目数量为4道,用户答错的题目数量为1道。因此包含该知识点的题目对应的“正确”标签的数量为4,包含该知识点的题目对应的“错误”标签的数量为1,那么该知识点对应的答题结果标签为“正确”标签,依据答题结果标签与掌握度标签之间的对应关系,可以确定用户在该历史时间段对该知识点的掌握度标签为“掌握”标签。
还请继续参考图3,在步骤S330中,基于用户在各历史时间段内对多个知识点的掌握度标签,生成用户在各历史时间段的知识点掌握度集合。
在一个实施例中,在确定用户在各历史时间段内对多个知识点的掌握度标签后,可以根据用户在各历史时间段内对多个知识点的掌握度标签,生成用户在各历史时间段的知识点掌握度集合,知识点掌握度集合包含用户对多个知识点的掌握度标签。
在图3至图5所示实施例的技术方案中,依据用户在各历史时间段所做过题目的答题情况来生成用户在各历史时间段的知识点掌握度集合,可以更加准确地反映用户在各历史时间段对知识点的掌握情况。
还请继续参考图2,在步骤S220中,按照时间顺序对知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列。
在一个实施例中,在得到各历史时间段的知识点掌握度集合后,可以按照时间顺序对知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列,由于该知识点掌握度集合序列作为预测用户在当前时间段对多个知识点的掌握度标签的输入数据,因此一般按照从前往后的时间顺序对知识点掌握度集合进行排序处理,通过对知识点掌握度集合进行排序处理,使得用户在不同历史时间段的知识点掌握度集合可以按照从前往后的时间顺序进行排列,以提高预测用户在当前时间段在各个知识点的掌握程度进行预测的准确度。
在步骤S230中,输入知识点掌握度集合序列至预训练的预测模型,预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到。
在一个实施例中,预训练的预测模型是通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的训练样本数据来对机器学习模型进行训练得到的。预训练的预测模型用于对输入的知识点掌握度集合序列进行处理,确定得到多个样本知识点的掌握度标签。
在一个实施例中,进行训练的机器学习模型具体可以为用于处理时间序列数据的模型,如可以是循环神经网络(RNN,Recurrent Neural Network)模型,也可以是基于循环神经网络模型所衍生的深度知识追踪 (DKT, Deep Knowledge Tracing) 模型,还可以是长短期记忆网络(LSTM,Long Short-Term Memory)模型,在此不作限定。
参考图6,图6示出了根据本申请的一个实施例的知识点数据的处理方法的流程图,该知识点数据的处理方法可以包括步骤S610至步骤S620,详细描述如下。
在步骤S610中,获取用于对待训练的机器学习模型进行训练的训练集样本数据,训练集样本数据中的每条样本数据包括训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签。
在一个实施例中,训练集样本数据中的每条样本数据包括训练样本知识点掌握度集合序列以及多个训练样本知识点的预设掌握度标签,训练样本知识点掌握度集合序列为对多个样本用户在各历史时间段内的样本知识点掌握度集合进行排序处理所生成的,样本用户在各历史时间段内的样本知识点掌握度集合是可以是根据样本用户在各历史时间段所做过的题目的答题数据所生成的,样本用户在某个历史时间段所做过的题目的答题数据可以是一次考试所做过题目的答题数据或者包含多个题目的一次作业的答题数据。训练样本知识点的预设掌握度标签是根据样本用户在当前时间段对知识点的掌握情况而预先人工设置,具体而言,若样本用户在当前时间段已掌握某个样本知识点,则样本用户对训练样本知识点的预设掌握度标签会被设置为“掌握”,若样本用户在当前时间段还未掌握某个训练样本知识点,则样本用户对对该训练样本知识点的预设掌握度标签会被设置为“未掌握”。
根据样本用户在各历史时间段所做过的题目的答题数据生成的样本用户在各历史时间段内的样本知识点掌握度集合的方法还请参照前述实施例描述的内容,在此不再赘述。
在步骤S620中,通过训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型。
在一个实施例中,将训练集样本数据输入至机器学习模型中,通过训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型。对机器学习模型进行训练的过程是调整机器学习模型对应的网络结构中的各项系数,使得对于输入的样本知识点掌握度集合,经过机器学习模型对应的网络结构中的各项系数运算,输出结果为多个样本知识点的掌握度标签。
图7示出了根据本申请的一个实施例的深度知识追踪 (DKT,Deep KnowledgeTracing) 模型的构架图,本实施例可以通过训练样本数据来对深度知识追踪 (DKT,DeepKnowledge Tracing) 模型进行训练得到预训练的预测模型。将包含T个训练样本知识点掌握度集合生成的训练样本知识点掌握度集合序列()输入至深度知识追踪模型中,其中,各个训练样本知识点掌握度集合在训练样本知识点掌握度集合序列是按照从前往后的时间顺序排列的。
具体的,针对各个样本知识点,由于样本用户在某个历史时间段对各个样本知识点的掌握程度与用户在该历史时间段的学习行为以及样本用户在之前历史时间段对各个样本知识点的掌握程度的存在关联。
如图7所示,训练样本知识点掌握度集合序列中的每一个训练样本知识点掌握度集合是基于样本用户在某个历史时间段所做过题目的答题数据所生成,其分别对应1到T时刻。/>为深度知识追踪模型在T时刻输出的隐藏特征信息,它是深度知识追踪模型内部的网络结构根据样本用户在T-1时刻输出的隐藏特征信息以及T时刻的样本知识点掌握度集合/>进行计算所得到的,/>为深度知识追踪模型输出的在T时刻对多个知识点的掌握度标签。
参考图8,图8示出了根据本申请的一个实施例的知识点数据的处理方法的步骤S620的具体流程图,步骤S620可以包括步骤S810至步骤S870,详细描述如下。
在步骤S810中,将训练集样本数据中的每条样本数据输入至待训练的机器学习模型。
在步骤S820中,基于待训练的机器学习模型内部的网络结构对测试样本知识点掌握度集合序列进行处理,输出得到预测的测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签。
在步骤S830中,计算预测的测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差。
在步骤S840中,基于预测的测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差之和,计算得到测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差。
在步骤S850中,基于测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差之和,计算得到测试样本知识点掌握度集合序列对应的预测误差。
在步骤S860中,若测试样本知识点掌握度集合序列对应的预测误差小于预定误差阈值,则确定待训练的机器学习模型训练完成。
在步骤S870中,若测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值,则继续基于训练集样本数据对待训练的机器学习模型进行训练,直至测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值小于预定误差阈值。
以对深度知识追踪模型进行训练得到预训练的预测模型为例,为了保证模型的效果,可以通过损失函数来提高模型的预测效果。
该损失函数累积训练集样本数据的各个知识点掌握度集合中每一个知识点对应的掌握度标签的预测误差。其中,是/>阶段的知识点掌握度集合;/>为/>阶段的知识点掌握度集合中的某个知识点,/>为/>阶段的知识点掌握度集合中的某个知识点对应的掌握度标签;/>为示性函数,通过按元素乘,用于将/>中对应/>的真实值提取出来。/>为计算得到的预测的测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差;/>为测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差;/>为测试样本知识点掌握度集合序列对应的预测误差。
测试样本知识点掌握度集合序列对应的预测误差越小,则训练后的深度知识追踪模型的预测效果就越好,当测试样本知识点掌握度集合序列对应的预测误差小于预定误差阈值,则确定待训练的深度知识追踪模型训练完成,当测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值,则需要继续基于训练集样本数据对待训练的深度知识追踪模型进行训练,以调整深度知识追踪模型中的网络结构的参数,直至测试样本知识点掌握度集合序列对应的预测误差小于预定误差阈值,则确定待训练的深度知识追踪模型训练完成。当待训练的机器学习模型为其它模型时,其训练方法与对深度知识追踪模型的训练方法是相同,在此不再赘述。
参考图9,图9示出了根据本申请的一个实施例的知识点数据的处理方法的流程图,在步骤S620之后,该知识点数据的处理方法可以包括步骤S910至步骤S930,详细描述如下。
在步骤S910中,获取用于对训练后的机器学习模型进行校验的测试集样本数据,测试集样本数据中的每条样本数据包括测试样本知识点掌握度集合序列、多个测试样本知识点的预设掌握度标签。
在一个实施例中,对于训练后的机器学习模型,还需要对其进行校验,以确保机器学习模型在实际应用时符合预期的功能效果。在对训练后的机器学习模型进行校验时,可以获取用于对训练后的机器学习模型进行校验的测试集样本数据,其中,测试集样本数据中的每条样本数据均包括测试样本知识点掌握度集合序列以及多个测试样本知识点的预设掌握度标签。
在步骤S920中,将测试集样本数据中的每条样本数据的测试样本知识点掌握度集合序列输入至训练后的机器学习模型,输出得到预测的测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签。
在一个实施例中,将测试集样本数据的每条样本数据的测试样本知识点掌握度集合序列输入至训练后的机器学习模型,由机器学习模型对应的网络结构中的各项系数对每条样本数据包含样本知识点掌握度集合序列处理,得到预测的测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签。
在步骤S930中,若测试集样本数据中的每条样本数据对应的多个测试样本知识点的预设掌握度标签与预测的测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签均一致的样本数据条数占测试集样本数据中总样本数据条数的比例超过预定比例阈值,则将训练后的机器学习模型识别为预训练的预测模型。
在一个实施例中,若测试集样本数据中的每条样本数据对应的多个测试样本知识点的预设掌握度标签与预测的测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签均一致的样本数据条数占测试集样本数据中总样本数据条数的比例超过预定比例阈值,则说明机器学习模型符合预期的功能效果,则可以将训练后的机器学习模型识别为预训练的预测模型,否则,则需要通过训练集样本数据继续对其进行训练,直到该机器学习模型符合在实际应用时的功能效果。
还请继续参考图2,在步骤S240中,获取预训练的预测模型输出的多个知识点的掌握度标签,作为用户在当前时间段对多个知识点的掌握度标签。
在一个实施例中,获取预训练的预测模型输出的输出结果,该预训练的预测模型输出的输出结果为多个知识点的掌握度标签,该输出结果即为预训练的预测模型根据用户对应的知识点掌握度集合序列所预测的用户在当前时间段对多个知识点的掌握度标签。
以上可以看出,按照时间顺序对用户在各历史时间段的知识点掌握度集合进行排序处理,生成由知识点掌握度集合组成的知识点掌握度集合序列,并通过预训练的预测模型对知识点掌握度集合序列进行处理,确定用户在当前时间段对多个知识点的掌握度标签,由于知识点掌握度集合是包括用户在某个历史时间段内对多个知识点的掌握度标签,因此满足在历史时间段内针对用户对多个知识点的掌握度标签是无序的数据结构特性,多个知识点掌握度集合是按照时间顺序排列的,因此满足在不同历史时间段对应的知识点掌握度集合数据之间是有序的数据结构特性;实现在根据多次考试或作业等阶段性的答题数据来预测用户对知识点的掌握程度的场景中,避免由于数据结构性的偏差的原因而导致知识点的掌握程度的预测准确度较低的技术问题,提高了预测用户对知识点的掌握程度的准确度。
参考图10,图10示出了根据本申请的一个实施例的知识点数据的处理方法的流程图,该实施例中的知识点数据的处理方法可以包括步骤S1010至步骤S1020,详细描述如下。
在步骤S1010中,基于用户在当前时间段对多个知识点的掌握度标签,选取掌握度标签与预定掌握度标签不匹配的特定知识点。
在一个实施例中,预定掌握度标签一般设置为用户对知识点的掌握程度较好的标签,例如,可以设置为“掌握”标签。在获取到用户在当前时间段对多个知识点的掌握度标签后,可以将用户在当前时间段对多个知识点的掌握度标签与预定掌握度标签进行匹配,将掌握度标签与预定掌握度标签不匹配的特定知识点筛选出来,以便于确定用户掌握程度较差的特定知识点。
在步骤S1020中,基于特定知识点、以及知识点和学习资源之间的对应关系,确定向用户进行推送的学习资源。
在一个实施例中,基于用户掌握程度较差的特定知识点,以及不同的知识点和学习资源之间的对应关系,确定向用户进行推送的学习资源,向用户进行推送的学习资源为包含进一步对这些知识点进行学习的学习资源,例如用于对知识点进行强化学习的题目、书籍、教学课程或教学视频等多种类型的学习资源。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的知识点数据的处理方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的知识点数据的处理方法的实施例。
图11示出了根据本申请的一个实施例的知识点数据的处理装置的框图。
参照图11所示,根据本申请的一个实施例的知识点数据的处理装置1100,包括:第一获取单元1110、排序单元1120、第一输入单元1130以及第二获取单元1140。其中,第一获取单元1110,用于获取用户在各历史时间段的知识点掌握度集合,所述知识点掌握度集合包括所述用户对多个知识点的掌握度标签;排序单元1120,用于按照时间顺序对所述知识点掌握度集合进行排序处理,生成由所述知识点掌握度集合组成的知识点掌握度集合序列;第一输入单元1130,用于输入所述知识点掌握度集合序列至预训练的预测模型,所述预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到;第二获取单元1140,用于获取所述预训练的预测模型输出的多个知识点的掌握度标签,作为所述用户在当前时间段对多个知识点的掌握度标签。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:第三获取单元,用于获取所述用户在各历史时间段内所做过题目的答题数据;第一生成单元,用于基于所述用户在各历史时间段内所做过题目的答题数据,生成所述用户在各历史时间段内对多个知识点的掌握度标签;第二生成单元,用于基于所述用户在各历史时间段内对多个知识点的掌握度标签,生成所述用户在各历史时间段的知识点掌握度集合。
在本申请的一些实施例中,基于前述方案,所述答题数据包括题目所包含的知识点和题目的答题结果标签,所述第一生成单元被配置为:基于题目所包含的知识点,确定包含各知识点的目标题目;基于包含各知识点的目标题目对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签。
在本申请的一些实施例中,基于前述方案,所述第一生成单元被配置为:确定包含各知识点的目标题目对应的答题结果标签为正确标签的数量以及包含各知识点的目标题目对应的答题结果标签为错误标签的数量;基于包含各知识点的目标题目对应的正确标签的数量和包含各知识点的目标题目对应的错误标签的数量,选择标签数量最多的答题结果标签作为各知识点对应的答题结果标签;基于各知识点对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:第四获取单元,用于获取用于对待训练的机器学习模型进行训练的训练集样本数据,所述训练集样本数据中的每条样本数据包括训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签;训练单元,用于通过所述训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:第五获取单元,用于获取用于对训练后的机器学习模型进行校验的测试集样本数据,所述测试集样本数据中的每条样本数据包括测试样本知识点掌握度集合序列、多个测试样本知识点的预设掌握度标签;第二输入单元,用于将所述测试集样本数据中的每条样本数据的测试样本知识点掌握度集合序列输入至训练后的机器学习模型,输出得到预测的所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签;识别单元,用于若所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的预设掌握度标签与预测的所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签均一致的样本数据条数占所述测试集样本数据中总样本数据条数的比例超过预定比例阈值,则将训练后的机器学习模型识别为所述预训练的预测模型。
在本申请的一些实施例中,基于前述方案,所述训练单元被配置为:将所述训练集样本数据中的每条样本数据输入至待训练的机器学习模型;基于所述待训练的机器学习模型内部的网络结构对所述测试样本知识点掌握度集合序列进行处理,输出得到预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签;计算预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差;基于预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差之和,计算所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差;基于所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差之和,计算所述测试样本知识点掌握度集合序列对应的预测误差;若所述测试样本知识点掌握度集合序列对应的预测误差小于预定误差阈值,则确定所述待训练的机器学习模型训练完成;若所述测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值,则继续基于所述训练集样本数据对所述待训练的机器学习模型进行训练,直至所述测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值小于预定误差阈值。
在本申请的一些实施例中,基于前述方案,所述知识点数据的处理装置还包括:选取单元,用于基于所述用户在当前时间段对多个知识点的掌握度标签,选取掌握度标签与预定掌握度标签不匹配的特定知识点;推送单元,用于基于所述特定知识点、以及知识点和学习资源之间的对应关系,确定向所述用户进行推送的学习资源。
图12示出了适于用来实现本申请实施例的知识点数据的处理设备的计算机系统的结构示意图。
需要说明的是,图12示出的知识点数据的处理设备的计算机系统1200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图12所示,计算机系统1210包括中央处理单元(Central Processing Unit,CPU)1201,其可以根据存储在只读存储器(Read-Only Memory,ROM)1202中的程序或者从储存部分1208加载到随机访问存储器(Random Access Memory,RAM)1203中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1203中,还存储有系统操作所需的各种程序和数据。CPU 1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input /Output,I/O)接口1205也连接至总线1204。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1207;包括硬盘等的储存部分1208;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入储存部分1208。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的知识点数据的处理设备中所包含的;也可以是单独存在,而未装配入该知识点数据的处理设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该知识点数据的处理设备执行时,使得该知识点数据的处理设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种知识点数据的处理方法,其特征在于,包括:
获取用户在各历史时间段内所做过题目的答题数据;其中,所述历史时间段对应的答题数据是在所述历史时间段的考试或作业的答题数据;
基于所述用户在各历史时间段内所做过题目的答题数据,生成所述用户在各历史时间段内对多个知识点的掌握度标签;
基于所述用户在各历史时间段内对多个知识点的掌握度标签,生成所述用户在各历史时间段的知识点掌握度集合,所述知识点掌握度集合包括所述用户对多个知识点的掌握度标签;
按照时间顺序对所述知识点掌握度集合进行排序处理,生成由所述知识点掌握度集合组成的知识点掌握度集合序列;
输入所述知识点掌握度集合序列至预训练的预测模型,所述预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到;
获取所述预训练的预测模型输出的多个知识点的掌握度标签,作为所述用户在当前时间段对多个知识点的掌握度标签。
2.根据权利要求1所述的知识点数据的处理方法,其特征在于,所述答题数据包括题目所包含的知识点和题目的答题结果标签,所述基于所述用户在各历史时间段内所做过题目的答题数据,生成所述用户在各历史时间段内对多个知识点的掌握度标签,包括:
基于题目所包含的知识点,确定包含各知识点的目标题目;
基于包含各知识点的目标题目对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签。
3.根据权利要求2所述的知识点数据的处理方法,其特征在于,所述基于包含各知识点的目标题目对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签,包括:
确定包含各知识点的目标题目对应的答题结果标签为正确标签的数量以及包含各知识点的目标题目对应的答题结果标签为错误标签的数量;
基于包含各知识点的目标题目对应的正确标签的数量和包含各知识点的目标题目对应的错误标签的数量,选择标签数量最多的答题结果标签作为各知识点对应的答题结果标签;
基于各知识点对应的答题结果标签,生成所述用户在各历史时间段内对多个知识点的掌握度标签。
4.根据权利要求1所述的知识点数据的处理方法,其特征在于,所述知识点数据的处理方法还包括:
获取用于对待训练的机器学习模型进行训练的训练集样本数据,所述训练集样本数据中的每条样本数据包括训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签;
通过所述训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型。
5.根据权利要求4所述的知识点数据的处理方法,其特征在于,在通过所述训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型之后,所述知识点数据的处理方法还包括:
获取用于对训练后的机器学习模型进行校验的测试集样本数据,所述测试集样本数据中的每条样本数据包括测试样本知识点掌握度集合序列、多个测试样本知识点的预设掌握度标签;
将所述测试集样本数据中的每条样本数据的测试样本知识点掌握度集合序列输入至训练后的机器学习模型,输出得到预测的所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签;
若所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的预设掌握度标签与预测的所述测试集样本数据中的每条样本数据对应的多个测试样本知识点的掌握度标签均一致的样本数据条数占所述测试集样本数据中总样本数据条数的比例超过预定比例阈值,则将训练后的机器学习模型识别为所述预训练的预测模型。
6.根据权利要求4所述的知识点数据的处理方法,其特征在于,所述通过所述训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型,包括:
将所述训练集样本数据中的每条样本数据输入至待训练的机器学习模型;
基于所述待训练的机器学习模型内部的网络结构对测试样本知识点掌握度集合序列进行处理,输出得到预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签;
计算预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差;
基于预测的所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合包含的多个测试样本知识点的掌握度标签分别与多个训练样本知识点的预设掌握度标签之间的预测误差之和,计算得到所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差;
基于所述测试样本知识点掌握度集合序列中的各测试样本知识点掌握度集合对应的预测误差之和,计算得到所述测试样本知识点掌握度集合序列对应的预测误差;
若所述测试样本知识点掌握度集合序列对应的预测误差小于预定误差阈值,则确定所述待训练的机器学习模型训练完成;
若所述测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值,则继续基于所述训练集样本数据对所述待训练的机器学习模型进行训练,直至所述测试样本知识点掌握度集合序列对应的预测误差大于或等于预定误差阈值小于预定误差阈值。
7.一种知识点数据的处理装置,其特征在于,包括:
第一获取单元,用于获取用户在各历史时间段内所做过题目的答题数据;其中,所述历史时间段对应的答题数据是在所述历史时间段的考试或作业的答题数据;基于所述用户在各历史时间段内所做过题目的答题数据,生成所述用户在各历史时间段内对多个知识点的掌握度标签;基于所述用户在各历史时间段内对多个知识点的掌握度标签,生成所述用户在各历史时间段的知识点掌握度集合,所述知识点掌握度集合包括所述用户对多个知识点的掌握度标签;
排序单元,用于按照时间顺序对所述知识点掌握度集合进行排序处理,生成由所述知识点掌握度集合组成的知识点掌握度集合序列;
输入单元,用于输入所述知识点掌握度集合序列至预训练的预测模型,所述预训练的预测模型通过包含有训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签的样本数据训练得到;
第二获取单元,用于获取所述预训练的预测模型输出的多个知识点的掌握度标签,作为所述用户在当前时间段对多个知识点的掌握度标签。
8.根据权利要求7所述的知识点数据的处理装置,其特征在于,所述装置还包括:
第四获取单元,用于获取用于对待训练的机器学习模型进行训练的训练集样本数据,所述训练集样本数据中的每条样本数据包括训练样本知识点掌握度集合序列、多个训练样本知识点的预设掌握度标签;
训练单元,用于通过所述训练集样本数据对待训练的机器学习模型进行训练,得到训练后的机器学习模型。
9.一种知识点数据的处理设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的知识点数据的处理方法。
10.一种计算机可读介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的知识点数据的处理方法。
CN202011216836.7A 2020-11-04 2020-11-04 知识点数据的处理方法、装置、设备和计算机可读介质 Active CN112231373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011216836.7A CN112231373B (zh) 2020-11-04 2020-11-04 知识点数据的处理方法、装置、设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011216836.7A CN112231373B (zh) 2020-11-04 2020-11-04 知识点数据的处理方法、装置、设备和计算机可读介质

Publications (2)

Publication Number Publication Date
CN112231373A CN112231373A (zh) 2021-01-15
CN112231373B true CN112231373B (zh) 2024-04-09

Family

ID=74121509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011216836.7A Active CN112231373B (zh) 2020-11-04 2020-11-04 知识点数据的处理方法、装置、设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN112231373B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114647721B (zh) * 2022-05-23 2022-09-16 风林科技(深圳)有限公司 教育智能机器人控制方法、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130062414A (ko) * 2011-11-11 2013-06-13 와이즈멘토 유한회사 학습 패턴 평가 시스템
WO2017025046A1 (zh) * 2015-08-13 2017-02-16 马正方 一种基于知识点结构的题库系统
CN107122452A (zh) * 2017-04-26 2017-09-01 中国科学技术大学 时序化的学生认知诊断方法
CN107657560A (zh) * 2017-09-18 2018-02-02 哈尔滨成长科技有限公司 知识点强化训练方法、介质和电子设备
CN108764569A (zh) * 2018-05-28 2018-11-06 上海谦问万答吧云计算科技有限公司 一种学生学情的分析预测方法、装置、设备和存储介质
US10354544B1 (en) * 2015-02-20 2019-07-16 Snapwiz Inc. Predicting student proficiencies in knowledge components
CN111159419A (zh) * 2019-12-09 2020-05-15 浙江师范大学 基于图卷积的知识追踪数据处理方法、系统和存储介质
CN111461442A (zh) * 2020-04-07 2020-07-28 中国科学技术大学 基于联邦学习的知识追踪的方法及系统
CN111695779A (zh) * 2020-05-14 2020-09-22 华南师范大学 一种知识追踪方法、装置及存储介质
CN111831914A (zh) * 2020-07-22 2020-10-27 上海掌学教育科技有限公司 一种在线教育的智能推题系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090089238A1 (en) * 2007-09-27 2009-04-02 Henry Colburn Stevenson-Perez Knowledge management portal for rapid learning and assessment of science
WO2011061758A1 (en) * 2009-11-18 2011-05-26 Kumar Gl Umesh Assessment for efficient learning and top performance in competitive exams - system, method, user interface- and a computer application
US10490092B2 (en) * 2017-03-17 2019-11-26 Age Of Learning, Inc. Personalized mastery learning platforms, systems, media, and methods
US11869385B2 (en) * 2018-03-08 2024-01-09 Erind Pajo Methods, systems, devices, and software for managing and conveying knowledge

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130062414A (ko) * 2011-11-11 2013-06-13 와이즈멘토 유한회사 학습 패턴 평가 시스템
US10354544B1 (en) * 2015-02-20 2019-07-16 Snapwiz Inc. Predicting student proficiencies in knowledge components
WO2017025046A1 (zh) * 2015-08-13 2017-02-16 马正方 一种基于知识点结构的题库系统
CN107122452A (zh) * 2017-04-26 2017-09-01 中国科学技术大学 时序化的学生认知诊断方法
CN107657560A (zh) * 2017-09-18 2018-02-02 哈尔滨成长科技有限公司 知识点强化训练方法、介质和电子设备
CN108764569A (zh) * 2018-05-28 2018-11-06 上海谦问万答吧云计算科技有限公司 一种学生学情的分析预测方法、装置、设备和存储介质
CN111159419A (zh) * 2019-12-09 2020-05-15 浙江师范大学 基于图卷积的知识追踪数据处理方法、系统和存储介质
CN111461442A (zh) * 2020-04-07 2020-07-28 中国科学技术大学 基于联邦学习的知识追踪的方法及系统
CN111695779A (zh) * 2020-05-14 2020-09-22 华南师范大学 一种知识追踪方法、装置及存储介质
CN111831914A (zh) * 2020-07-22 2020-10-27 上海掌学教育科技有限公司 一种在线教育的智能推题系统

Also Published As

Publication number Publication date
CN112231373A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN109460513B (zh) 用于生成点击率预测模型的方法和装置
CN106202453B (zh) 一种多媒体资源推荐方法和装置
CN111339255B (zh) 目标情感分析的方法、模型训练方法、介质和设备
CN109976997B (zh) 测试方法和装置
CN111274411A (zh) 课程推荐方法、装置、电子设备及可读存储介质
CN108960316B (zh) 用于生成模型的方法和装置
CN111914176B (zh) 题目的推荐方法及装置
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
Liu et al. Mining online discussion data for understanding teachers reflective thinking
CN109801527B (zh) 用于输出信息的方法和装置
CN108228567B (zh) 用于提取组织机构的简称的方法和装置
US10354543B2 (en) Implementing assessments by correlating browsing patterns
CN112417158A (zh) 文本数据分类模型的训练方法、分类方法、装置和设备
CN111738010A (zh) 用于生成语义匹配模型的方法和装置
CN111723180A (zh) 一种面试方法和装置
CN110826327A (zh) 情感分析方法、装置、计算机可读介质及电子设备
CN112231373B (zh) 知识点数据的处理方法、装置、设备和计算机可读介质
CN114398556A (zh) 学习内容的推荐方法、装置、设备及存储介质
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
CN116596073A (zh) 基于推理路径的自然语言推理方法、装置及设备
US20220245199A1 (en) Virtual Dialog System Performance Assessment and Enrichment
CN113569091A (zh) 视频数据的处理方法、装置
CN113569741A (zh) 图像试题的答案生成方法、装置、电子设备及可读介质
CN112131378A (zh) 用于识别民生问题类别的方法、装置及电子设备
CN112231444A (zh) 结合rpa和ai的语料数据的处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant