CN113919983A - 试题画像方法、装置、电子设备和存储介质 - Google Patents

试题画像方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113919983A
CN113919983A CN202111177214.2A CN202111177214A CN113919983A CN 113919983 A CN113919983 A CN 113919983A CN 202111177214 A CN202111177214 A CN 202111177214A CN 113919983 A CN113919983 A CN 113919983A
Authority
CN
China
Prior art keywords
knowledge point
knowledge
test question
imaged
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111177214.2A
Other languages
English (en)
Inventor
程礼磊
于俊
李雅洁
程知远
武文强
陈琦
谭昶
陈涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Qiancui Intelligent Technology Service Co ltd
iFlytek Co Ltd
Original Assignee
Nanjing Qiancui Intelligent Technology Service Co ltd
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Qiancui Intelligent Technology Service Co ltd, iFlytek Co Ltd filed Critical Nanjing Qiancui Intelligent Technology Service Co ltd
Priority to CN202111177214.2A priority Critical patent/CN113919983A/zh
Publication of CN113919983A publication Critical patent/CN113919983A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种试题画像方法、装置、电子设备和存储介质,其中方法包括:确定待画像试题的试题数据;基于试题数据,对待画像试题进行知识点预测,得到待画像试题属于各个候选知识点的概率;基于待画像试题属于各个候选知识点的概率的分布情况,确定待画像试题的知识点标签数量;基于知识点标签数量,以及待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像,解决了试题画像的构建依赖于人为经验导致可靠性差的问题,并且对待画像试题进行多知识点画像,能够对待画像试题的试题特征进行深层次的挖掘,从而实现对待画像试题所包含的知识点信息的充分反映,在保证试题画像准确性的基础上,实现其应用场景的多样化。

Description

试题画像方法、装置、电子设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种试题画像方法、装置、电子设备和存储介质。
背景技术
为满足对学生综合能力培养的需求,选择符合教育教学需求的试题资源是重中之重,恰当的试题资源能够为学生综合能力的培养提供强有力的助益,试题资源的选择又依赖于试题画像。
目前的试题画像通常是由教师根据教学经验建立相应的知识点体系,再根据已构建的知识点体系,人工给试题建立试题标签,例如,题干标签、解析标签、知识点标签、难度标签等,由此即可得到包含多类标签的试题画像。
但是,上述方案中知识点体系以及标签的构建很大程度上都依赖于人为经验,具有强烈的主观色彩,导致得到的试题画像具有偏向性。
发明内容
本发明提供一种试题画像方法、装置、电子设备和存储介质,用以解决现有技术中试题画像的构建依赖于人为经验导致可靠性差的缺陷。
本发明提供一种试题画像方法,包括:
确定待画像试题的试题数据;
基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;
基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;
基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
根据本发明提供的一种试题画像方法,所述基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率,包括:
基于所述试题数据,对所述待画像试题进行各个知识点层级的知识点预测,得到所述待画像试题属于各个知识点层级下的各个候选知识点的概率;
所述基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量,包括:
基于所述待画像试题属于各个知识点层级下的各个候选知识点的概率的分布情况,确定所述待画像试题属于各个知识点层级下的知识点标签数量;
所述基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像,包括:
基于所述待画像试题属于各个知识点层级下的知识点标签数量,以及所述待画像试题属于各个知识点层级下的各个候选知识点的概率,对所述待画像试题进行各个知识点层级的多知识点画像。
根据本发明提供的一种试题画像方法,所述确定所述待画像试题属于各个知识点层级下的知识点标签数量,之后还包括:
基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行综合度画像;
所述候选知识点概率总和为按照概率从高到低的顺序排列时,前所述知识点标签数量个候选知识点的概率之和。
根据本发明提供的一种试题画像方法,所述基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行综合度画像,包括:
基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行各个知识点层级的综合度画像,得到各个知识点层级下的综合度画像;
对各个知识点层级下的综合度画像进行加权求和,得到所述待画像试题的综合度画像。
根据本发明提供的一种试题画像方法,所述基于所述试题数据,对所述待画像试题进行各个知识点层级的知识点预测,得到所述待画像试题属于各个知识点层级下的各个候选知识点的概率,包括:
将所述试题数据分别输入至各个知识点层级对应的知识点预测模型,得到各个知识点层级对应的知识点预测模型分别输出的所述待画像试题属于各个知识点层次下的各个候选知识点的概率;
各个知识点层级对应的知识点预测模型是基于样本试题的试题数据,以及所述样本试题属于对应知识点层级下的各个候选知识点的概率训练得到的。
根据本发明提供的一种试题画像方法,所述对所述待画像试题进行多知识点画像,之后还包括:
确定多知识点画像所得的待画像试题的关联知识点;
基于所述关联知识点、各学生对所述关联知识点的熟练度、所述关联知识点的难度、所述待画像试题的区分度与所述待画像试题的得分情况之间的约束关系,对所述待画像试题进行知识点难度画像和区分度画像。
根据本发明提供的一种试题画像方法,所述对所述待画像试题进行知识点难度画像,之后还包括:
确定知识点难度画像所得的待画像试题的知识点难度画像;
基于所述知识点难度画像、所述待画像试题的热度以及所述待画像试题的得分率,对所述待画像试题进行难度画像;
所述待画像试题的热度是基于所述待画像试题的出现频次确定的,所述待画像试题的得分率是基于所述待画像试题出现频次下的得分总和,以及出现频次下的试题总分确定的。
本发明还提供一种试题画像装置,包括:
试题数据确定单元,用于确定待画像试题的试题数据;
知识点预测单元,用于基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;
标签数量确定单元,用于基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;
多知识点画像单元,用于基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的试题画像方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的试题画像方法的步骤。
本发明提供的试题画像方法、装置、电子设备和存储介质,根据待画像试题的试题数据,对待画像试题进行知识点预测,得到待画像试题属于各个候选知识点的概率;根据待画像试题属于各个候选知识点的概率的分布情况,确定待画像试题的知识点标签数量,并根据知识点标签数量以及待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像,解决了试题画像的构建依赖于人为经验以及试题本身的内容属性的问题,并且对待画像试题进行多知识点画像,不仅能够克服传统方案中基于多选一方式构建的知识点标签会导致得到的知识点画像功能薄弱的缺陷,还能对待画像试题的试题特征进行深层次的挖掘,从而实现对待画像试题所包含的知识点信息的充分反映,在保证试题画像准确性的基础上,实现其应用场景的多样化。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的试题画像方法的流程示意图;
图2是本发明提供的知识点体系的示意图;
图3是本发明提供的试题画像方法中步骤120、步骤130和步骤140的流程示意图;
图4是本发明提供的试题画像方法中综合度画像的确定过程的流程图;
图5是本发明提供的试题画像方法中知识点难度画像和区分度画像的确定过程的流程示意图;
图6是本发明提供的认知诊断模型的结构示意图;
图7是本发明提供的试题画像方法中难度画像的确定过程的流程示意图;
图8是本发明提供的试题画像装置的结构示意图;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在教育教学领域,通过基于课程的高质量试题进行有针对性的训练,可以使学生对各科课程中的诸多知识点有较好的掌握以及进一步的巩固。目前的试题资源还停留于陈旧教学试题、教材课后习题以及出处不明的线上试题阶段,这类试题资源无法满足当下的教育教学需求,而选择符合教育教学需求的试题资源不仅能够帮助学生巩固知识,还能够为学生综合能力的培养提供强有力的助益,试题资源的选择又依赖于试题画像。
目前,试题画像的构建通常是由教师根据教学经验建立课程的知识点体系,再根据已构建的知识点体系,人工给试题建立试题标签,例如,题干标签、解析标签、知识点标签、难度标签等;或者通过已有的试题标签预测算法构建试题标签,其过程包括:首先,提取试题的文本特征;然后,通过文本分类算法训练试题标签分类器,通过训练完成的试题标签分类器对试题进行标签预测,通过上述两种方法可得到包含多类试题标签的试题画像。
但是,上述第一种方案中知识点体系以及标签的构建很大程度上依赖于人为经验,具有强烈的主观色彩,这就导致基于此确定的试题画像具有偏向性;另外,上述两种方案中试题画像的构建均停留于试题本身,即试题标签的构建均源于试题本身的内容属性,这就导致由此得到的试题画像功能较为单薄,无法支撑部分个性化功能,例如试题推荐、掌握程度预估等。
针对上述情况,本发明提供一种试题画像方法,旨在克服试题画像的构建依赖于人为经验以及试题本身的内容属性的缺陷,实现深层次试题特征的挖掘,图1是本发明提供的试题画像方法的流程示意图,如图1所示,该方法包括:
步骤110,确定待画像试题的试题数据。
具体地,在构建试题画像之前,首先需要确定进行试题画像构建的对象,以及该对象的相关数据,即确定待画像试题以及待画像试题的试题数据,此处的试题数据可以表示为试题文本,或者试题文本与试题图像相结合的形式,其中试题文本可以是相关人员直接输入的文本,也可以是通过从电子版试卷中提取的文本,还可以是通过光学字符识别OCR(Optical Character Recognition,光学字符识别)技术从纸质版试卷所对应的图像中提取的文本,本发明实施例对此不作具体限定。
通常试题数据可以包含试题题干、试题答案和试题解析,在此基础上,还可以包含试题类型、试题ID等。上述数据可以是预先整理并且存储好的结构化的信息,也可以是对试题文本或者试题图像等进行结构化分析处理得到的信息。
步骤120,基于试题数据,对待画像试题进行知识点预测,得到待画像试题属于各个候选知识点的概率。
具体地,在通过步骤110得到待画像试题的试题数据之后,即可基于试题数据对待画像试题进行知识点预测,以确定待画像试题中各知识点属于各个候选知识点的概率,以便后续根据待画像试题属于各个候选知识点的概率,对待画像试题进行试题画像。
待画像试题属于各个候选知识点的概率中,概率越大表明待画像试题属于此候选知识点的可能性越大;反之,概率越小表明待画像试题属于此候选知识点的可能性越小。
知识点预测可以通过预先训练得到的知识点预测模型实现,具体可以将待画像试题的试题数据输入至知识点预测模型,由知识点预测模型对输入的待画像试题的试题数据进行知识点预测,得到知识点预测模型输出的待画像试题属于各个候选知识点的概率,此处的候选知识点是教师根据教学经验预先建立的课程相关的知识点体系中的知识点。
需要说明的是,在将待画像试题的试题数据输入至知识点预测模型之前,还可以预先训练得到知识点预测模型,知识点预测模型的训练方法包括如下步骤:首先,收集大量的样本试题以及样本试题的试题数据,并确定样本试题属于各个候选知识点的概率;随即,基于样本试题的试题数据以及样本试题属于各个候选知识点的概率,对初始知识点预测模型进行训练,从而得到训练完成的知识点预测模型。
步骤130,基于待画像试题属于各个候选知识点的概率的分布情况,确定待画像试题的知识点标签数量。
考虑到传统方案中在对待画像试题进行试题画像的过程中,若待画像试题包含了多个知识点标签,则会从多个知识点标签中选取其中一个作为该试题的知识点标签,即目前知识点标签的构建是多选一,导致基于此确定的知识点标签无法充分囊括该试题所包含的知识点信息。
为了能够真实地反映待画像试题中包含的知识点信息,本发明实施例中在确定待画像试题属于各个候选知识点的概率之后,还需确定待画像试题中的知识点数量,即确定待画像试题的知识点标签数量,以便根据待画像试题的知识点标签数量,以及前述步骤中确定的待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像。
具体地,待画像试题的知识点标签数量可以根据待画像试题属于各个候选知识点的概率的分布情况确定,此处的分布情况可以理解为待画像试题属于各个候选知识点的概率分布是相差无几较为平均,还是相差较大存在个别几个突出的概率,通过待画像试题属于各个候选知识点的概率的分布情况,可以反映出待画像试题是比较广泛地覆盖了多个候选知识点,还是偏重于其中一个或者多个知识点,由此判断出知识点标签数量是偏大还是偏小。例如,待画像试题属于各个候选知识点的概率分布中,属于其中两种候选知识点的概率远高于属于其他候选知识点的概率,则待画像试题的知识点标签数量可以设置为2,又例如待画像试题属于各候选知识点的概率分布中,属于其中5种候选知识点的概率均较为接近,且不存在其他和上述5种候选知识点的概率接近的候选知识点的概率,其他候选知识点的概率均较小,则待画像试题的知识点标签数量可以设置为5。
基于此分布情况,确定待画像试题的知识点标签数量时,可以从此分布情况中选取前预设数量个候选知识点的概率,此时选取出的前预设数量个候选知识点的概率对应的候选知识点基本囊括了该试题所包含的知识点信息,因此,可将选取出的前预设数量个候选知识点的概率对应的候选知识点确定为待画像试题的知识点标签,并将此预设数量作为待画像试题的知识点标签数量。
步骤140,基于知识点标签数量,以及待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像。
具体地,经过步骤120和步骤130分别得到待画像试题属于各个候选知识点的概率以及待画像试题的知识点标签数量后,即可根据待画像试题的知识点标签数量以及待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像。
多知识点画像的确定过程包括:按照待画像试题属于各个候选知识点的概率从高到低的顺序,依次选取知识点标签数量个候选知识点的概率,并将选取出的知识点标签数量个候选知识点的概率对应的候选知识点,作为待画像试题的知识点标签,从而得到待画像的多知识点画像。
本发明提供的试题画像方法,根据待画像试题的试题数据,对待画像试题进行知识点预测,得到待画像试题属于各个候选知识点的概率;根据待画像试题属于各个候选知识点的概率的分布情况,确定待画像试题的知识点标签数量,并根据知识点标签数量以及待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像,解决了试题画像的构建依赖于人为经验导致可靠性差的问题,并且对待画像试题进行多知识点画像,不仅能够克服传统方案中基于多选一方式构建的知识点标签会导致得到的知识点画像功能薄弱的缺陷,还能对待画像试题的试题特征进行深层次的挖掘,从而实现对待画像试题所包含的知识点信息的充分反映,在保证试题画像准确性的基础上,实现其应用场景的多样化。
基于上述实施例,对待画像试题进行试题数据确定的过程可以包括:首先,确定待画像试题中的待提取字段,例如,题干、答案、解析等;随即,基于待提取字段,从待画像试题的试题数据中提取与待提取字段相应的试题信息,例如,试题题干、试题答案、试题解析等,得到包含试题信息的试题数据;随后,对此试题数据进行结构化处理,得到包含试题基本信息的试题数据。
下面以一道深度学习框架的试题为例,进行说明:
提取到的试题信息如下所示:
试题题干:下列哪些是深度学习框架?()
A:Tensorflow B:Spark C:Keras D:Scikitlearn
试题答案:A,C
试题解析:Tensorflow与keras都是深度学习框架。
得到包含试题信息的试题数据后,可对此试题数据进行结构化处理,从而得到包含试题基本信息的试题数据,如下表所示:
Figure BDA0003296025800000081
此后,即可根据上述处理得到的包含试题基本信息的试题数据,进行试题画像的构建。
基于上述实施例,考虑到待画像试题所包含的知识点的复杂性,本发明实施例中将知识点进行了层级式的划分,每个知识点层级下均存在其对应的候选知识点,且各个知识点层级之间存在包含或被包含的关系。由此可以根据各个知识点层级之间的关系,构建知识点体系。
具体地,各个知识点层级的划分方式可以由教师根据教学经验预先确定,例如可以划分为两级、三级或者四级等。其中上下两级之间可以是包含关系,例如上级是针对下级所有知识点的概括。图2是本发明提供的知识点体系的示意图,如图2所示,以数据处理与可视化的知识点体系为例,其知识点体系中将知识点层级划分为3层,分别为一级知识点、二级知识点和三级知识点。其中,一级知识点为数据处理与可视化;二级知识点包括数据处理(Pandas)、科学计算(Numpy)和数据降维;三级知识点包括pandas环境配置、pandas数据筛选以及pandas异常值处理。
需要说明的是,本发明实施例中通过对待画像试题进行知识点层级的划分,能够明确待画像试题中各个知识点之间的层级关系,以便根据各个知识点之间的层级关系建立知识点体系。
基于上述实施例,图3是本发明提供的试题画像方法中步骤120、步骤130和步骤140的流程示意图,如图3所示,步骤120包括:
步骤121,基于试题数据,对待画像试题进行各个知识点层级的知识点预测,得到待画像试题属于各个知识点层级下的各个候选知识点的概率;
由于待画像试题的知识点与知识点之间可能存在包含与被包含的关系,即待画像试题的各个知识点间存在知识层级关系的情况,本发明实施例中在根据待画像试题的试题数据,对待画像试题进行知识点预测时,还可以更进一步的对待画像试题进行各个知识点层级的知识点预测,以确定待画像试题属于各个知识点层级下的各个候选知识点的概率,以便后续根据待画像试题属于各个知识点层级下的各个候选知识点的概率,对待画像试题进行各个知识点层级的多知识点画像。
具体地,各个知识点层级的知识点预测可以通过预先训练得到的各个知识点层级对应的知识点预测模型实现,具体可以将待画像试题的试题数据输入至各个知识点层级对应的知识点预测模型,由各个知识点层级对应的知识点预测模型对输入的试题数据进行各个知识点层级的知识点预测,从而得到各个知识点层级对应的知识点预测模型输出的待画像试题属于各个知识点层级下的各个候选知识点的概率。
待画像试题属于各个知识点层级下的各个候选知识点的概率中,概率越大表明待画像试题属于此知识点层级下的此候选知识点的可能性越大;反之,概率越小表明待画像试题属于此知识点层级下的此候选知识点的可能性越小。
需要说明的是,在将待画像试题的试题数据输入至各个知识点层级对应的知识点预测模型之前,还可以预先训练得到各个知识点层级对应的知识点预测模型,各个知识点层级对应的知识点预测模型的训练方法包括如下步骤:首先,收集大量的样本试题以及样本试题的试题数据,并确定样本试题属于各个知识点层级下的各个候选知识点的概率;随即,基于样本试题的试题数据以及样本试题属于各个知识点层级下的各个候选知识点的概率,对各个知识点层级对应的初始知识点预测模型进行训练,从而得到训练完成的各个知识点层级对应的知识点预测模型。
步骤130包括:
步骤131,基于待画像试题属于各个知识点层级下的各个候选知识点的概率的分布情况,确定待画像试题属于各个知识点层级下的知识点标签数量;
具体地,在执行步骤130,根据待画像试题属于各个候选知识点的概率的分布情况,确定待画像试题的知识点标签数量时,还可以进一步对待画像试题的知识点标签进行知识层级的划分,以确定待画像试题属于各个知识点层级下的知识点标签,并确定待画像试题属于各个知识点层级下的知识点标签数量,从而实现根据待画像试题属于各个知识点层级下的知识点标签数量,以及待画像试题属于各个知识点层级下的各个候选知识点的概率,对待画像试题进行各个知识点层级的多知识点画像。
具体地,待画像试题属于各个知识点层级下的知识点标签数量,可以根据待画像试题属于各个知识点层级下的各个候选知识点的概率的分布情况确定,此处的分布情况可以理解为待画像试题属于各个知识点层级下的各个候选知识点的概率分布是相差无几较为平均,还是相差较大存在个别几个突出的概率,通过待画像试题属于各个知识点层级下的各个候选知识点的概率的分布情况,可以反映出待画像试题是比较广泛地覆盖了多个知识点层级下的多个候选知识点,还是偏重于其中一个知识点层级下的一个或多个候选知识点,又或者是较为分散的囊括了多个知识点层级下的单个知识点,由此判断出各个知识点层级下的知识点标签数量是偏大还是偏小。
例如,待画像试题属于各个知识点层级下的各个候选知识点的概率分布中,属于其中任一知识点层级下的两种候选知识点的概率远高于属于其他候选知识点的概率,或者属于任意两种知识点层级中,每一知识点层级下的一种候选知识点的概率远高于属于其他候选知识点的概率,则待画像试题属于各个知识点层级下的知识点标签数量可以设置为2。
又例如,待画像试题属于各个知识点层级下的各候选知识点的概率分布中,属于其中任一知识点层级下的5种候选知识点的概率均较为接近,或者属于任意两种或三种知识点层级中,共有5种候选知识点的概率较为接近,且不存在其他和上述5种候选知识点的概率较为接近的候选知识点,其他候选知识点的概率均较小,则待画像试题属于各个知识点层级下的知识点标签数量可以设置为5。
基于此分布情况,确定待画像试题属于各个知识点层级下的知识点标签数量时,可以从对应知识点层级下的各个候选知识点的概率的分布情况中,选取前预设数量个候选知识点的概率,此时选取出的前预设数量个对应知识点层级下的候选知识点的概率对应的候选知识点基本囊括了该试题在对应知识点层级下所包含的知识点信息,因此,可将选取出的对应知识点层级下的前预设数量个候选知识点的概率对应的候选知识点,确定为待画像试题在对应知识点层级下的知识点标签,并将此预设数量作为待画像试题属于对应知识点层级下的知识点标签数量。
步骤140包括:
步骤141,基于待画像试题属于各个知识点层级下的知识点标签数量,以及待画像试题属于各个知识点层级下的各个候选知识点的概率,对待画像试题进行各个知识点层级的多知识点画像。
具体地,经过上述步骤确定待画像试题属于各个知识点层级下的各个候选知识点的概率,以及待画像试题属于各个知识点层级下的知识点标签数量后,即可根据此两者对待画像试题进行各个知识点层级下的多知识点画像。
各个知识点层级下的多知识点画像的确定过程包括:按照待画像试题属于对应知识点层级下的各个候选知识点的概率从高到低的顺序,依次选取对应知识点层级下的知识点标签数量个候选知识点的概率,并将选取出的知识点标签数量个候选知识点的概率对应的候选知识点,作为待画像试题在对应知识点层级下的知识点标签,从而得到待画像试题属于对应知识点层级下的多知识点画像。
本发明实施例提供的方法,在对待画像试题进行知识点预测时,进一步对其进行各个知识点层级下的知识点预测,确定其属于各个知识点层级下的各个候选知识点的概率;同理,在确定待画像试题的知识点标签数量时,也可进一步确定其属于各个知识点层级下的知识点标签数量,从而实现根据待画像试题属于各个知识点层级下的知识点标签数量,以及其属于各个知识点层级下的各个候选知识点的概率,对其进行各个知识点层级的多知识点画像,解决了试题画像的构建依赖于人为经验导致可靠性差的问题,并且对待画像试题进行各个知识点层级的多知识点画像,不仅能够克服传统方案中基于多选一方式构建的知识点标签会导致得到的知识点画像功能薄弱的缺陷,还能对待画像试题的试题特征进行各个知识点层级的深度挖掘,从而实现对待画像试题所包含的各个知识点层级下的知识点信息的充分反映,在保证试题画像准确性的基础上,实现其应用场景的多样化。
基于上述实施例,待画像试题属于各个知识点层级下的候选知识点标签集合可表示为:
yj,(j=1,2,3)
其中,yj表示待画像试题属于第j知识点层级下的候选知识点标签集合,j表示待画像试题的知识点层级,需要说明的是,本发明实施例中将待画像试题的知识点层级确定为3级,即j=1,2,3。
待画像试题属于各个知识点层级下的各个候选知识点的概率可通过如下公式计算得到:
rij=fj(qi,xj,yj),(i=1,...,n;j=1,2,3)
其中,rij表示第i道待画像试题属于第j知识点层级下的各个候选知识点的概率集合,i表示第i道待画像试题,n表示待画像试题的数量,fj(·)表示第j知识点层级的知识点预测函数,qi表示第i道待画像试题的试题数据,xj表示第j知识点层级的样本试题的试题数据,yj表示样本试题属于第j知识点层级下的各个候选知识点的概率集合。
待画像试题属于各个知识点层级下的知识点标签数量可采用主成分分析的思想计算确定,其计算公式为:
Figure BDA0003296025800000111
其中,θ表示待画像试题属于各个知识点层级下的知识点标签数量,argmin表示求
Figure BDA0003296025800000112
取最小值时的变量值的函数,S(·)表示按照数值从高到低的顺序进行排序的函数,S(rij)表示按照第i道待画像试题属于第j知识点层级下的各个候选知识点的概率从高到低的顺序进行排序,sum(SUM Function)为求和函数,sum(rij)表示对第i道待画像试题属于第j知识点层级下的各个候选知识点的概率进行求和,α表示置信度。
需要说明的是,此处的置信度α可以根据实际情况预先设定,作为优选,置信度α可以是95%。
待画像试题属于各个知识点层级下的知识点标签概率集合可通过如下公式表示:
Figure BDA0003296025800000121
其中,
Figure BDA0003296025800000122
表示第i道待画像试题属于第j知识点层级下的知识点标签概率集合,lj表示各个知识点层级下的候选知识点标签数量。
基于上述实施例,对待画像试题进行各个知识点层级下的多知识点画像的过程为:计算每一
Figure BDA0003296025800000123
在rij中的位置ind_list,得到待画像试题属于第j知识点层级下的多知识点画像
Figure BDA0003296025800000124
此外,若对待画像试题进行各个知识点层级下的知识点画像,则其过程为:计算rij中的最大值在rij的位置ind,得到待画像试题属于第j知识点层级下的知识点画像
Figure BDA0003296025800000125
基于上述实施例,步骤131中,确定待画像试题属于各个知识点层级下的知识点标签数量,之后还包括:
基于待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点的概率总和,对待画像试题进行综合度画像;
所述候选知识点概率总和为按照概率从高到低的顺序排列时,前所述知识点标签数量个候选知识点的概率之和。
考虑到待画像试题的多知识点画像只能表征待画像试题的知识点属性,并不能反映待画像试题其他方面的属性,因而,本发明实施例中可构建一个综合度画像,用以反映待画像试题的全局属性。
具体地,在步骤131确定待画像试题属于各个知识点层级下的知识点标签数量后,对待画像试题进行综合度画像之前,还需确定预先设置的各个知识点层级下的候选知识点标签数量,以及各个知识点层级下的候选知识点概率总和,以便基于此两者以及待画像试题属于各个知识点层级下的知识点标签数量,对待画像试题进行综合度画像。
其中,对应知识点层级下的候选知识点概率总和是从对应知识点层级下的各个候选知识点的概率从高到低的排列顺序中,选取的前知识点标签数量个候选知识点的概率之和。
待画像试题属于各个知识点层级下的知识点标签数量能够反映待画像试题所涵盖的知识点信息的覆盖范围,知识点标签数量越多表明待画像试题涉猎的范围越广;反之,知识点标签数量越少,表明待画像试题侧重于对某一知识点层级下的单个或几个知识点的考察。
待画像试题属于各个知识点层级下的候选知识点概率总和,与各个知识点层级下的候选知识点标签数量的比值能够反映待画像试题对于各个知识点层级下的各个候选知识点的覆盖率,而覆盖率用以体现待画像试题是广泛的覆盖了各个知识点层级下的多个知识点,还是局限于单一知识点层级下的单个知识点。综合度画像的确定过程包括:首先,确定各个知识点层级下的候选知识点标签数量;随即,从待画像试题属于各个知识点层级下的各个候选知识点的概率中,按照概率从高到低的顺序依次选取知识点标签数量个候选知识点的概率,并对选取出的知识点标签数量个候选知识点的概率进行求和,得到待画像试题属于各个知识点层级下的候选知识点概率总和;随后,根据待画像试题属于各个知识点层级下的候选知识点概率总和,与各个知识点层级下的候选知识点标签数量的比值,确定待画像试题的综合度画像。
此处的各个知识点层级下的候选知识点标签数量即教师根据教学经验预先建立的课程相关的知识点体系中各个知识点层级下的各知识点的数量。
基于上述实施例,图4是本发明提供的试题画像方法中综合度画像的确定过程的流程图,如图4所示,基于待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对待画像试题进行综合度画像,包括:
步骤410,基于待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对待画像试题进行各个知识点层级的综合度画像,得到各个知识点层级下的综合度画像;
步骤420,对各个知识点层级下的综合度画像进行加权求和,得到待画像试题的综合度画像。
具体地,在上述步骤中对待画像试题进行综合度画像时,还可更进一步地根据待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对待画像试题进行各个知识点层级的综合度画像,从而得到待画像试题属于各个知识点层级下的综合度画像;随后,可根据待画像试题属于各个知识点层级下的综合度画像,确定待画像试题的综合度画像。
步骤410中,各个知识点层级的综合度画像的步骤过程包括:首先,确定各个知识点层级下的候选知识点标签数量;随即,从待画像试题属于各个知识点层级下的各个候选知识点的概率中,按照概率从高到低的顺序依次选取知识点标签数量个候选知识点的概率,并对选取出的知识点标签数量个候选知识点的概率进行求和,得到待画像试题属于各个知识点层级下的候选知识点概率总和;随后,根据待画像试题属于各个知识点层级下的候选知识点概率总和,与各个知识点层级下的候选知识点标签数量的比值,确定待画像试题属于各个知识点层级下的综合度画像。
得到各个知识点层级下的综合度画像后,执行步骤420,对各个知识点层级下的综合度画像进行加权求和,得到待画像试题的综合度画像,具体可以是将待画像试题属于各个知识点层级下的综合度画像乘以对应知识点层级的权重系数,并对加权所得的结果进行求和,从而得到待画像试题的综合度画像。此处的权重系数可以是根据各个知识点层级预先设定的,例如可以是根据各个知识点层级的知识覆盖面,各个知识点层级的重要程度等设定的。
基于上述实施例,对各个知识点层级下的综合度画像进行加权求和,得到待画像试题的综合度画像的过程可以通过如下公式表示:
Figure BDA0003296025800000141
其中,cdki(comprehensive degree ofknowledge)表示第i道待画像试题的综合度画像,
Figure BDA0003296025800000142
表示第i道待画像试题属于第j知识点层级下的综合度画像,λj表示待画像试题的第j知识点层级的权重系数,
Figure BDA0003296025800000143
Figure BDA0003296025800000144
表示实数集。
由上述公式可知,通过调整不同知识点层级的权重系数,可以实现待画像试题的综合度画像对不同知识点层级的侧重程度的把控。
基于上述实施例,步骤121包括:
将试题数据分别输入至各个知识点层级对应的知识点预测模型,得到各个知识点层级对应的知识点预测模型分别输出的待画像试题属于各个知识点层次下的各个候选知识点的概率;
各个知识点层级对应的知识点预测模型是基于样本试题的试题数据,以及样本试题属于对应知识点层级下的各个候选知识点的概率训练得到的。
考虑到各个知识点层级所包含的候选知识点各有不同,且各个知识点层级的知识覆盖面,以及其重要程度均不同,因而,本发明实施例中在对待画像试题进行各个知识点层级的知识点预测之前,可以预先对各个知识点层级设置不同的知识点预测模型,通过其知识点层级对应的知识点预测模型实现对应知识点层级的知识点预测。
具体地,步骤121中,根据待画像试题的试题数据,对待画像试题进行各个知识点层级的知识点预测可以通过预先训练得到的各个知识点层级对应的知识点预测模型实现,具体可以将待画像试题的试题数据输入至各个知识点层级对应的知识点预测模型,由各个知识点层级对应的知识点预测模型对输入的试题数据进行各个知识点层级的知识点预测,从而得到各个知识点层级对应的知识点预测模型输出的待画像试题属于各个知识点层级下的各个候选知识点的概率。
待画像试题属于各个知识点层级下的各个候选知识点的概率中,概率越大表明待画像试题属于此知识点层级下的此候选知识点的可能性越大;反之,概率越小表明待画像试题属于此知识点层级下的此候选知识点的可能性越小。
需要说明的是,在将待画像试题的试题数据输入至各个知识点层级对应的知识点预测模型之前,还可以预先训练得到各个知识点层级对应的知识点预测模型,各个知识点层级对应的知识点预测模型可以根据样本试题的试题数据,以及样本试题属于对应知识点层级下的各个候选知识点的概率训练得到的。
各个知识点层级对应的知识点预测模型的训练方法包括如下步骤:首先,首先,收集大量的样本试题以及样本试题的试题数据,并确定样本试题属于各个知识点层级下的各个候选知识点的概率;随即,基于样本试题的试题数据以及样本试题属于各个知识点层级下的各个候选知识点的概率,对各个知识点层级对应的初始知识点预测模型进行训练,从而得到训练完成的各个知识点层级对应的知识点预测模型。
考虑到传统方案中对待画像试题进行试题画像的过程完全依赖于教师,与学生脱离,而脱离于学生构建的试题画像最终应用于学生,会导致应用于学生后的结果难以预料,准确性得不到保障。基于上述实施例,图5是本发明提供的试题画像方法中知识点难度画像和区分度画像的确定过程的流程示意图,如图5所示,步骤140中,对待画像试题进行多知识点画像,之后还包括:
步骤510,确定多知识点画像所得的待画像试题的关联知识点;
步骤520,基于关联知识点、各学生对关联知识点的熟练度、关联知识点的难度、待画像试题的区分度与待画像试题的得分情况之间的约束关系,对待画像试题进行知识点难度画像和区分度画像。
具体地,本发明实施例中在经过步骤140对待画像试题进行多知识点画像后,还可结合学生对于待画像试题的答题情况,对待画像试题进行知识点难度画像以及区分度画像。
实际答题中,学生是否能够正确作答,或者针对某一试题,某一学生的得分情况由该试题所考察的知识点、该知识点在该试题中的考察难度,该学生对该知识点的熟练程度,以及该试题对于学生的区分度所决定的。其中,该试题所考察的知识点即对待画像试题进行多知识点画像所得的待画像试题的关联知识点,该知识点在该试题中的考察难度即关联知识点的难度,该学生对该知识点的熟练程度即各学生对关联知识点的熟练度,该试题对于学生的区分度即待画像试题的区分度。
其中,关联知识点的多少表征待画像试题考察范围的大小,在其他条件固定的前提下,关联知识点越多,待画像试题的得分情况越差;反之,关联知识点越少,待画像试题的得分情况越好。
各学生对关联知识点的熟练度表征各学生对待画像试题的关联知识点的掌握程度,各学生对关联知识点的熟练度越高,待画像试题的得分情况越好;反之,各学生对关联知识点的熟练度越低,待画像试题的得分情况越差。
关联知识点的难度表征待画像试题的关联知识点的难易程度,关联知识点的难度越高,待画像试题的得分情况越差;反之,关联知识点的难度越低,待画像试题的得分情况越好。
待画像试题的区分度表征待画像试题对于学生对知识点的掌握程度的区分能力,用以区分对知识点的掌握程度较好的学生和知识点的掌握程度较差的学生,待画像试题的区分度越高,待画像试题的得分情况越差;反之,待画像试题的区分度越低,待画像试题的得分情况越好。
通过历史数据可确定待画像试题的关联知识点、各学生对关联知识点的熟练度、关联知识点的难度以及待画像试题的区分度,并确定上述四者与待画像试题的得分情况之间的约束关系。
此后,即可根据此四者与待画像试题的得分情况之间的约束关系,对待画像试题进行知识点难度画像和区分度画像,从而得到待画像试题的知识点难度画像和区分度画像。
基于上述实施例,确定学生答题数据,之后还包括:
具体地,收集学生对于待画像试题的答题情况后,还需对表征此答题情况的答题记录进行数据处理,从而得到较为规整化的学生答题数据。此处,收集的学生对于待画像试题的答题记录以及最终得到的答题数据中均只包含学生答题的正确性以及学生答题次数,不涉及有关学生画像的个人数据。
最终得到的学生答题数据可表示为下表所示形式:
Figure BDA0003296025800000161
Figure BDA0003296025800000171
需要说明的是,在获取学生答题数据的过程中,还需筛除无效答题记录,以减少对待试题画像进行试题画像的干扰。
得到学生答题数据后,可根据待画像的学生答题数据,建立试题ID(Identitydocument,身份标识号)独热编码(One-Hot Encoding),以及学生ID独热编码。其中,试题ID独热编码表示为:
Figure BDA0003296025800000172
其中,
Figure BDA0003296025800000173
表示试题ID独热编码,N表示待画像试题的数量,e表示属于试题(exercise)的信息。
学生ID独热编码表示为:
Figure BDA0003296025800000174
其中,
Figure BDA0003296025800000175
表示学生ID独热编码,m表示第m个学生,M表示学生数量,s表示属于学生(student)的信息。
基于上述实施例,对待画像试题进行多知识点画像所得的待画像试题的关联知识点,可表示为:
Figure BDA0003296025800000176
其中,
Figure BDA0003296025800000177
表示待画像试题的关联知识点,
Figure BDA0003296025800000178
表示试题ID独热编码,Q={Qik}N×K,为N×K的Q矩阵,若第i道待画像试题中包含知识点k时,则令Qik=1;反之,若为第i道待画像试题中未包含候选知识点k时,则令Qik=0,k表示候选知识点,K表示候选知识点标签数量。
需要说明的是,此处的Q矩阵可以经由步骤120中对待画像试题进行知识点标签预测,得到的待画像试题属于各个候选知识点的概率,再结合教研经验确定。
各学生对关联知识点的熟练度可以通过如下公式计算得到:
Figure BDA0003296025800000179
其中,
Figure BDA00032960258000001710
表示各学生对关联知识点的熟练度,
Figure BDA00032960258000001711
表示学生ID独热编码,A表示各学生与待画像试题的关联知识点之间的关系,
Figure BDA00032960258000001712
是一个预先确定参数的参数矩阵,
Figure BDA00032960258000001713
表示实数集,sigmoid(Sigmoid function)为S型生长曲线。
关联知识点的难度可通过如下公式计算得到:
Figure BDA00032960258000001714
其中,
Figure BDA00032960258000001715
表示第i道待画像试题的关联知识点的难度,
Figure BDA00032960258000001716
B表示待画像试题与关联知识点之间的难度关系,
Figure BDA00032960258000001717
是一个预先确定参数的参数矩阵,
Figure BDA0003296025800000181
表示实数集。
待画像试题的区分度可通过如下公式计算得到:
Figure BDA0003296025800000182
其中,
Figure BDA0003296025800000183
表示第i道待画像试题的区分度,D表示待画像试题与学生对知识点的掌握程度的区分能力之间的关系,
Figure BDA0003296025800000184
是一个预先确定参数的参数矩阵,
Figure BDA0003296025800000185
表示实数集。
通过待画像试题的区分度能够对知识掌握程度高的学生和知识掌握程度低的学生进行区分。
需要说明的是,此处待画像试题的各个知识点层级的各学生对关联知识点的熟练度、关联知识点的难度以及待画像试题的区分度的计算流程一致,因而,在根据上述公式进行计算时,不对各个知识点层级下的各学生对关联知识点的熟练度、关联知识点的难度以及待画像试题的区分度进行区分。
基于上述实施例,关联知识点
Figure BDA0003296025800000186
各学生对关联知识点的熟练度
Figure BDA0003296025800000187
关联知识点的难度
Figure BDA0003296025800000188
待画像试题的区分度
Figure BDA0003296025800000189
与待画像试题的得分情况之间的约束关系,可以体现为认知诊断模型。
图6是本发明提供的认知诊断模型的结构示意图,如图6所示,KnowledgeRelevancy表示关联知识点,Knowledge Proficiency表示各学生对关联知识点的熟练度,Knowledge Difficulty表示关联知识点的难度,Exercise Discrimination表示待画像试题的区分度,本发明实施例中无需构建认知诊断标签,重点在于对待画像试题进行知识点难度画像以及区分度画像,以及进行各个知识点层级的知识点难度画像以及区分度画像,得到
Figure BDA00032960258000001810
以及
Figure BDA00032960258000001811
其中,
Figure BDA00032960258000001812
表示第i道待画像试题属于第j知识点层级下的关联知识点的难度,
Figure BDA00032960258000001813
表示第i道待画像试题属于第j知识点层级下的区分度。
除此之外,通过此认知诊断模型还可得到上述A、B和D三个矩阵,基于此模型确定的A、B和D,可直接应用于上述各学生对关联知识点的熟练度的计算公式、关联知识点的难度的计算公式以及待画像试题的区分度的计算公式中,从而实现通过计算公式计算得到各学生对关联知识点的熟练展
Figure BDA00032960258000001814
关联知识点的难度
Figure BDA00032960258000001815
以及待画像试题的区分度
Figure BDA00032960258000001816
基于上述实施例,图7是本发明提供的试题画像方法中难度画像的确定过程的流程示意图,如图7所示,步骤520中,对待画像试题进行知识点难度画像,之后还包括:
步骤710,确定知识点难度画像所得的待画像试题的知识点难度画像;
步骤720,基于知识点难度画像、待画像试题的热度以及待画像试题的得分率,对待画像试题进行难度画像;
待画像试题的热度是基于待画像试题的出现频次确定的,待画像试题的得分率是基于待画像试题出现频次下的得分总和,以及出现频次下的试题总分确定的。
具体地,在步骤520中,对待画像试题进行知识点难度画像之后,还可以对待画像试题进行难度画像,难度画像的确定过程具体包括:步骤710,确定知识点难度画像所得的待画像试题的知识点难度画像;随后,还需确定待画像试题的热度以及待画像试题的得分率。
其中,待画像试题的热度可根据试题数据中待画像试题的出现频次确定,在试题数据一定的前提下,出现频次越高表明待画像试题的热度越高;反之,出现频次越低表明待画像试题的热度越低。
待画像试题的热度越低可通过如下公式计算得到:
Figure BDA0003296025800000191
其中,hoti表示待画像试题的热度,freqi表示待画像试题的出现频次。
待画像试题的得分率可根据待画像试题出现频次下的得分总和,以及出现频次下的试题总分确定的。待画像试题的得分率的确定过程具体包括:首先,确定待画像试题每次出现时的实际得分,并对此实际得分进行求和,得到待画像试题出现频次下的得分总和;随即,确定待画像试题出现频次下的试题总分,并求待画像试题出现频次下的得分总和与待画像试题出现频次下的试题总分的比值,将此比值作为待画像试题的得分率。
待画像试题的得分率的计算公式如下所示:
Figure BDA0003296025800000192
其中,si表示待画像试题的得分率,t表示待画像试题的单次出现时的试题总分,t′ii表示待画像试题在第ii次出现时的实际得分。
确定待画像试题的知识点难度画像、待画像试题的热度以及待画像试题的得分率后,即可执行步骤720,根据待画像试题的知识点难度画像、待画像试题的热度以及待画像试题的得分率,对待画像试题进行难度画像,从而得到待画像试题的难度画像。
待画像试题的难度画像可通过如下公式计算得到:
Figure BDA0003296025800000193
其中,di表示待画像试题的难度画像,α、β和ηj
Figure BDA0003296025800000194
中的参数,α、β是数值的量纲,ηj表示第j知识点层级下的知识点权重,g(·)表示控制hoti和si对di的影响的函数,g(·)还用于控制di的难度数值所在的区间。g(·)可以是log(logarithm,对数函数)、sigmoid(Sigmoid function,S型生长曲线)、tanh(hyperbolic tangent function,双曲正切函数)等。
下面对本发明提供的试题画像装置进行描述,下文描述的试题画像装置与上文描述的试题画像方法可相互对应参照。
图8是本发明提供的试题画像装置的结构示意图,如图8所示,该装置包括:
试题数据确定单元810,用于确定待画像试题的试题数据;
知识点预测单元820,用于基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;
标签数量确定单元830,用于基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;
多知识点画像单元840,用于基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
本发明提供的试题画像装置,根据待画像试题的试题数据,对待画像试题进行知识点预测,得到待画像试题属于各个候选知识点的概率;根据待画像试题属于各个候选知识点的概率的分布情况,确定待画像试题的知识点标签数量,并根据知识点标签数量以及待画像试题属于各个候选知识点的概率,对待画像试题进行多知识点画像,解决了试题画像的构建依赖于人为经验导致可靠性差的问题,并且对待画像试题进行多知识点画像,不仅能够克服传统方案中基于多选一方式构建的知识点标签会导致得到的知识点画像功能薄弱的缺陷,还能对待画像试题的试题特征进行深层次的挖掘,从而实现对待画像试题所包含的知识点信息的充分反映,在保证试题画像准确性的基础上,实现其应用场景的多样化。
基于上述实施例,知识点预测单元820用于:
基于所述试题数据,对所述待画像试题进行各个知识点层级的知识点预测,得到所述待画像试题属于各个知识点层级下的各个候选知识点的概率;
标签数量确定单元830用于:
基于所述待画像试题属于各个知识点层级下的各个候选知识点的概率的分布情况,确定所述待画像试题属于各个知识点层级下的知识点标签数量;
多知识点画像单元840用于:
基于所述待画像试题属于各个知识点层级下的知识点标签数量,以及所述待画像试题属于各个知识点层级下的各个候选知识点的概率,对所述待画像试题进行各个知识点层级的多知识点画像。
基于上述实施例,所述装置还包括综合度画像单元,用于:
基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行综合度画像;
所述候选知识点概率总和为按照概率从高到低的顺序排列时,前所述知识点标签数量个候选知识点的概率之和。
基于上述实施例,综合度画像单元用于:
基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行各个知识点层级的综合度画像,得到各个知识点层级下的综合度画像;
对各个知识点层级下的综合度画像进行加权求和,得到所述待画像试题的综合度画像。
基于上述实施例,知识点预测单元820用于:
将所述试题数据分别输入至各个知识点层级对应的知识点预测模型,得到各个知识点层级对应的知识点预测模型分别输出的所述待画像试题属于各个知识点层次下的各个候选知识点的概率;
各个知识点层级对应的知识点预测模型是基于样本试题的试题数据,以及所述样本试题属于对应知识点层级下的各个候选知识点的概率训练得到的。
基于上述实施例,所述装置还包括知识点难度画像和区分度画像单元,用于:
确定多知识点画像所得的待画像试题的关联知识点;
基于所述关联知识点、各学生对所述关联知识点的熟练度、所述关联知识点的难度、所述待画像试题的区分度与所述待画像试题的得分情况之间的约束关系,对所述待画像试题进行知识点难度画像和区分度画像。
基于上述实施例,所述装置还包括难度画像单元,用于:
确定知识点难度画像所得的待画像试题的知识点难度画像;
基于所述知识点难度画像、所述待画像试题的热度以及所述待画像试题的得分率,对所述待画像试题进行难度画像;
所述待画像试题的热度是基于所述待画像试题的出现频次确定的,所述待画像试题的得分率是基于所述待画像试题出现频次下的得分总和,以及出现频次下的试题总分确定的。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行试题画像方法,该方法包括:确定待画像试题的试题数据;基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的试题画像方法,该方法包括:确定待画像试题的试题数据;基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法所提供的试题画像方法,该方法包括:确定待画像试题的试题数据;基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种试题画像方法,其特征在于,包括:
确定待画像试题的试题数据;
基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;
基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;
基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
2.根据权利要求1所述的试题画像方法,其特征在于,所述基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率,包括:
基于所述试题数据,对所述待画像试题进行各个知识点层级的知识点预测,得到所述待画像试题属于各个知识点层级下的各个候选知识点的概率;
所述基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量,包括:
基于所述待画像试题属于各个知识点层级下的各个候选知识点的概率的分布情况,确定所述待画像试题属于各个知识点层级下的知识点标签数量;
所述基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像,包括:
基于所述待画像试题属于各个知识点层级下的知识点标签数量,以及所述待画像试题属于各个知识点层级下的各个候选知识点的概率,对所述待画像试题进行各个知识点层级的多知识点画像。
3.根据权利要求2所述的试题画像方法,其特征在于,所述确定所述待画像试题属于各个知识点层级下的知识点标签数量,之后还包括:
基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行综合度画像;
所述候选知识点概率总和为按照概率从高到低的顺序排列时,前所述知识点标签数量个候选知识点的概率之和。
4.根据权利要求3所述的试题画像方法,其特征在于,所述基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行综合度画像,包括:
基于所述待画像试题属于各个知识点层级下的知识点标签数量、各个知识点层级下的候选知识点标签数量以及各个知识点层级下的候选知识点概率总和,对所述待画像试题进行各个知识点层级的综合度画像,得到各个知识点层级下的综合度画像;
对各个知识点层级下的综合度画像进行加权求和,得到所述待画像试题的综合度画像。
5.根据权利要求2所述的试题画像方法,其特征在于,所述基于所述试题数据,对所述待画像试题进行各个知识点层级的知识点预测,得到所述待画像试题属于各个知识点层级下的各个候选知识点的概率,包括:
将所述试题数据分别输入至各个知识点层级对应的知识点预测模型,得到各个知识点层级对应的知识点预测模型分别输出的所述待画像试题属于各个知识点层次下的各个候选知识点的概率;
各个知识点层级对应的知识点预测模型是基于样本试题的试题数据,以及所述样本试题属于对应知识点层级下的各个候选知识点的概率训练得到的。
6.根据权利要求1至5中任一项所述的试题画像方法,其特征在于,所述对所述待画像试题进行多知识点画像,之后还包括:
确定多知识点画像所得的待画像试题的关联知识点;
基于所述关联知识点、各学生对所述关联知识点的熟练度、所述关联知识点的难度、所述待画像试题的区分度与所述待画像试题的得分情况之间的约束关系,对所述待画像试题进行知识点难度画像和区分度画像。
7.根据权利要求6所述的试题画像方法,其特征在于,所述对所述待画像试题进行知识点难度画像,之后还包括:
确定知识点难度画像所得的待画像试题的知识点难度画像;
基于所述知识点难度画像、所述待画像试题的热度以及所述待画像试题的得分率,对所述待画像试题进行难度画像;
所述待画像试题的热度是基于所述待画像试题的出现频次确定的,所述待画像试题的得分率是基于所述待画像试题出现频次下的得分总和,以及出现频次下的试题总分确定的。
8.一种试题画像装置,其特征在于,包括:
试题数据确定单元,用于确定待画像试题的试题数据;
知识点预测单元,用于基于所述试题数据,对所述待画像试题进行知识点预测,得到所述待画像试题属于各个候选知识点的概率;
标签数量确定单元,用于基于所述待画像试题属于各个候选知识点的概率的分布情况,确定所述待画像试题的知识点标签数量;
多知识点画像单元,用于基于所述知识点标签数量,以及所述待画像试题属于各个候选知识点的概率,对所述待画像试题进行多知识点画像。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的试题画像方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的试题画像方法的步骤。
CN202111177214.2A 2021-10-09 2021-10-09 试题画像方法、装置、电子设备和存储介质 Pending CN113919983A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111177214.2A CN113919983A (zh) 2021-10-09 2021-10-09 试题画像方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111177214.2A CN113919983A (zh) 2021-10-09 2021-10-09 试题画像方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113919983A true CN113919983A (zh) 2022-01-11

Family

ID=79239160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111177214.2A Pending CN113919983A (zh) 2021-10-09 2021-10-09 试题画像方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113919983A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383481A (zh) * 2023-02-09 2023-07-04 四川云数赋智教育科技有限公司 一种基于学生画像的个性化试题推荐方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383481A (zh) * 2023-02-09 2023-07-04 四川云数赋智教育科技有限公司 一种基于学生画像的个性化试题推荐方法及系统
CN116383481B (zh) * 2023-02-09 2024-03-29 四川云数赋智教育科技有限公司 一种基于学生画像的个性化试题推荐方法及系统

Similar Documents

Publication Publication Date Title
CN107230174B (zh) 一种基于网络的在线互动学习系统和方法
CN112508334B (zh) 融合认知特性及试题文本信息的个性化组卷方法及系统
CN111144191B (zh) 字体识别方法、装置、电子设备及存储介质
CN111274411A (zh) 课程推荐方法、装置、电子设备及可读存储介质
CN107274020B (zh) 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法
CN111915148B (zh) 一种基于信息技术的课堂教学评价方法和系统
CN112699283B (zh) 试卷生成方法及装置
CN110443427A (zh) 基于认知知识谱的成绩预测方法及其系统
CN116541538B (zh) 基于大数据的智慧学习知识点挖掘方法及系统
CN111597305B (zh) 实体标记方法、装置、计算机设备和存储介质
Shan et al. Research on classroom online teaching model of “learning” wisdom music on wireless network under the background of artificial intelligence
CN113919983A (zh) 试题画像方法、装置、电子设备和存储介质
CN112507792A (zh) 在线视频关键帧定位方法、定位系统、设备及存储介质
CN114971425B (zh) 数据库信息监控方法、装置、设备及存储介质
CN115511670A (zh) 一种在线教育方法及在线教育平台
CN115757112A (zh) 基于变异分析的测试子集构建方法及相关设备
JP7303243B2 (ja) 試験問題予測システム及び試験問題予測方法
Jiang Analysis of Students’ Role Perceptions and their Tendencies in Classroom Education Based on Visual Inspection
CN115205072A (zh) 一种面向长周期测评的认知诊断方法
CN114444500A (zh) 基于表达式链表树匹配程度的数学主观题评分方法及系统
CN115687910A (zh) 一种数据处理方法、装置、计算机设备以及可读存储介质
Gorin et al. Test design with higher order cognition in mind
CN110334353A (zh) 词序识别性能的分析方法、装置、设备及存储介质
Ali S et al. Multi-class LDA classifier and CNN feature extraction for student performance analysis during Covid-19 pandemic
CN117556381B (zh) 一种面向跨学科主观试题的知识水平深度挖掘方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination