CN114077873A - 数学试题难度类型的确定方法、系统、存储介质及设备 - Google Patents

数学试题难度类型的确定方法、系统、存储介质及设备 Download PDF

Info

Publication number
CN114077873A
CN114077873A CN202210007571.2A CN202210007571A CN114077873A CN 114077873 A CN114077873 A CN 114077873A CN 202210007571 A CN202210007571 A CN 202210007571A CN 114077873 A CN114077873 A CN 114077873A
Authority
CN
China
Prior art keywords
difficulty
mathematical test
mathematical
test questions
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210007571.2A
Other languages
English (en)
Other versions
CN114077873B (zh
Inventor
李巧艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Wind Vane Intelligent Technology Co ltd
Original Assignee
Jiangxi Vaneducation Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Vaneducation Technology Inc filed Critical Jiangxi Vaneducation Technology Inc
Priority to CN202210007571.2A priority Critical patent/CN114077873B/zh
Publication of CN114077873A publication Critical patent/CN114077873A/zh
Application granted granted Critical
Publication of CN114077873B publication Critical patent/CN114077873B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Technology (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提供一种数学试题难度类型的确定方法、系统、存储介质及设备,方法包括:根据每道历史使用的数学试题的得分率计算得到其初始难度值;结合数学试题的知识点、使用次数及初始难度值进行分析以确定每道历史使用的数学试题的最终难度值,并查询得到每道历史使用的数学试题的难度类型;实时获取待预测数学试题,并对待预测数学试题与每道历史使用的数学试题的相似度进行计算以得到待预测数学试题与每道历史使用的数学试题的相似值;根据待预测数学试题与每道历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给待预测数学试题,能够得到更为准确可靠的待预测数学试题的难度类型。

Description

数学试题难度类型的确定方法、系统、存储介质及设备
技术领域
本发明涉及数据处理领域,特别是涉及一种数学试题难度类型的确定方法、系统、存储介质及设备。
背景技术
近年来,随着计算机技术和教育信息化的不断推进发展,计算机技术和人工智能技术已经逐步应用于日常教育教学的各项活动中。试题的难度类型作为考查试题的重要指标之一,其在题库构建过程中的选题、学生能力评估、以及个性化学习等方面起着重要的作用。
而现有的题目难度类型分析方法,存在以下缺陷:一、基于人工标注的方法:通过此试题所在领域的专家对此试题进行主观评价,从而获取试题难度类型,其缺点为标注难度和成本偏大,速度太慢,且主观因素较大,容易导致不同的专家评价标准不一致;二、基于简单统计的方法:通过试题被学生做过的历史记录,统计试题的正确率,将正确率作为试题难度系数的评估依据,其缺点为对学生答题样本的分布和数量有较高要求,并且不同考次间的评分带有主观性,用此种方法获得的难度在大多情况下和人工专家的评价会产生偏差。因此,急需提供一种数学试题难度类型的确定方法来保证试题难度类型评估的准确度。
发明内容
本发明的目的在于提出一种数学试题难度类型的确定方法、系统、存储介质及设备,以解决现有的题目难度类型分析方法难以保证试题难度类型评估的准确度的问题。
本发明提出一种数学试题难度类型的确定方法,所述方法包括:
从大数据平台获取大量历史使用的数学试题,并提取每道所述历史使用的数学试题的试题信息,所述试题信息包括知识点、使用次数和得分率;
根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值;
结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型;
根据最终难度值及难度类型对所有所述历史使用的数学试题进行标记,并建立包含标记有最终难度值及难度类型的所有所述历史使用的数学试题的试题库;
实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值;
根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型。
根据本发明提出的数学试题难度类型的确定方法,具有以下有益效果:
本发明根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值,为后续的最终难度值的确定提供了一个很好的参照及基准,通过结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析来确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型;
再实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值;根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型,本发明能够适用试题库中试题量有限的情况,在试题库中试题量有限的情况下,由于学习算法通常需要基于大数据的基础上,样本数量不足,便难以训练出准确度高的难度预测模型,而本发明在确定了试题库中的每道所述历史使用的数学试题的最终难度值及难度类型后,再通过难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题,以得到更为准确可靠的待预测数学试题的难度类型,使得组卷、推题都有更高的准确率,以帮助在线数学题库更好的建设,大大提升用户体验。
另外,根据本发明提供的数学试题难度类型的确定方法,还可以具有如下附加的技术特征:
进一步地,所述根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型的步骤包括:
根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值对试题库中的所有历史使用的数学试题进行降序排序,并依序获取试题库中前K道历史使用的数学试题;
判断所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值是否大于第一预设相似值;
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值大于第一预设相似值,则将所述前K道历史使用的数学试题中的前1道历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题;
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值不大于第一预设相似值,则判断所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第二预设相似值,其中,k2大于k1;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值均大于第二预设相似值,则将所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题的众数最终难度值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值不均大于第二预设相似值,则判断所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第三预设相似值且所述待预测数学试题中的知识点是否为知识点群,其中,k4大于k3且k3大于或等于k2;
若所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值均大于第三预设相似值且所述待预测数学试题中的知识点为知识点群,则将所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题的众数最终难度值及知识点群难度平均值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型。
进一步地,所述结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值的步骤包括:
判断目标历史使用的数学试题的使用次数是否大于预设次数,所述目标历史使用的数学试题为大数据平台的任一所述历史使用的数学试题;
若所述目标历史使用的数学试题的使用次数大于预设次数,则对每次使用的所述目标历史使用的数学试题的初始难度值进行相加并取平均值以得到所述目标历史使用的数学试题的最终难度值;
若所述目标历史使用的数学试题的使用次数不大于预设次数,则判断众数使用的所述目标历史使用的数学试题的初始难度值是否在预设范围内;
若众数使用的所述目标历史使用的数学试题的初始难度值在预设范围内,则将众数使用的所述目标历史使用的数学试题的初始难度值的均值定为所述目标历史使用的数学试题的最终难度值;
若众数使用的所述目标历史使用的数学试题的初始难度值不在预设范围内,则对所述目标历史使用的数学试题中知识点的类型进行识别;
若所述目标历史使用的数学试题中知识点为知识点群,则从大数据平台找出与所述目标历史使用的数学试题的知识点群相同的其他历史使用的数学试题;
根据所述其他历史使用的数学试题的初始难度值计算所述目标历史使用的数学试题的知识点群的难度方差,并判断所述目标历史使用的数学试题的知识点群的难度方差是否小于预设方差阈值;
若所述目标历史使用的数学试题的知识点群的难度方差小于预设方差阈值,则去掉所述其他历史使用的数学试题中离散的初始难度值并计算平均初始难度值,将所述平均初始难度值定为所述目标历史使用的数学试题的最终难度值。
进一步地,所述对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值的步骤前还包括:
对试题库中的历史使用的数学试题及所述待预测数学试题均进行公式语义理解以将每道试题中的公式转化为文字并生成与每道试题对应的文字文本。
进一步地,所述根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型的步骤后还包括:
若经过难度类型传递算法后还无法确定所述待预测数学试题的难度类型,则提取对数学试题难度影响大的因素,设为难度影响因素,所述难度影响因素包括计算量、知识综合度、知识难度、解析复杂度和知识点群难度。
进一步地,所述试题信息还包括题目和解析,所述提取对数学试题难度影响大的因素的步骤后还包括:
将公式语义理解后的试题库中的所有所述历史使用的数学试题的题目文本和解析文本及与每道所述历史使用的数学试题对应的难度影响因素数据和最终难度值输入wide&deep多分类模型中进行训练,以得到数学试题难度分类深度模型;
将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布。
进一步地,所述试题信息还包括试题id,所述将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布的步骤后还包括:
根据所述待预测数学试题的难度类型概率分布判断所述待预测数学试题的难度类型概率的最大值是否大于预设概率阈值;
若所述待预测数学试题的难度类型概率的最大值大于预设概率阈值,则将所述待预测数学试题的难度类型概率的最大值对应的难度类型确定为所述待预测数学试题的难度类型;
若所述待预测数学试题的难度类型概率的最大值不大于预设概率阈值且所述待预测数学试题的多个难度类型对应的概率值接近,则将概率值接近的多个难度类型的中间难度类型初定为所述待预测数学试题的难度类型;
根据所述待预测数学试题的试题id对所述待预测数学试题的难度类型进行微调,并对所述待预测数学试题打上难度微调标记。
本发明还提出一种数学试题难度类型的确定系统,包括:
获取模块:用于从大数据平台获取大量历史使用的数学试题,并提取每道所述历史使用的数学试题的试题信息,所述试题信息包括知识点、使用次数和得分率;
第一计算模块:用于根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值;
确定模块:用于结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型;
建立模块:用于根据最终难度值及难度类型对所有所述历史使用的数学试题进行标记,并建立包含标记有最终难度值及难度类型的所有所述历史使用的数学试题的试题库;
第二计算模块:用于实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值;
传递模块:用于根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的数学试题难度类型的确定方法。
本发明还提出一种数学试题难度类型的确定设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的数学试题难度类型的确定方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明第一实施例数学试题难度类型的确定方法的流程图;
图2为本发明第二实施例数学试题难度类型的确定系统的系统框图;
图3为本发明第三实施例数学试题难度类型的确定设备的结构示意图。
具体实施方式
为使本发明的目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
实施例1
如图1所示,本发明的实施例提供一种数学试题难度类型的确定方法,包括步骤S101~S106。
S101,从大数据平台获取大量历史使用的数学试题,并提取每道所述历史使用的数学试题的试题信息,所述试题信息包括知识点、使用次数和得分率。
S102,根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值。
其中,初始难度值=1-得分率。
S103,结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型。
其中,所述结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值的步骤包括:
判断目标历史使用的数学试题的使用次数是否大于预设次数,所述目标历史使用的数学试题为大数据平台的任一所述历史使用的数学试题;
若所述目标历史使用的数学试题的使用次数大于预设次数,则对每次使用的所述目标历史使用的数学试题的初始难度值进行相加并取平均值以得到所述目标历史使用的数学试题的最终难度值。
例如,预设次数可以2000次,若所述目标历史使用的数学试题的使用次数大于预设次数,可以判断所述目标历史使用的数学试题为一高频使用试题,则平均难度值便能很好的代表所述目标历史使用的数学试题的最终难度值。
若所述目标历史使用的数学试题的使用次数不大于预设次数,则判断众数使用的所述目标历史使用的数学试题的初始难度值是否在预设范围内;
若众数使用的所述目标历史使用的数学试题的初始难度值在预设范围内,则将众数使用的所述目标历史使用的数学试题的初始难度值的均值定为所述目标历史使用的数学试题的最终难度值。
其中,众数为大多数的意思,如果所述目标历史使用的数学试题不是高频使用试题,且众数使用的所述目标历史使用的数学试题的初始难度值在预设范围内,则说明众数使用的所述目标历史使用的数学试题的初始难度值能够保持稳定,则取众数使用的稳定的初始难度值的均值来代表所述目标历史使用的数学试题的最终难度值。
若众数使用的所述目标历史使用的数学试题的初始难度值不在预设范围内,则对所述目标历史使用的数学试题中知识点的类型进行识别;
若所述目标历史使用的数学试题中知识点为知识点群,则从大数据平台找出与所述目标历史使用的数学试题的知识点群相同的其他历史使用的数学试题;
根据所述其他历史使用的数学试题的初始难度值计算所述目标历史使用的数学试题的知识点群的难度方差,并判断所述目标历史使用的数学试题的知识点群的难度方差是否小于预设方差阈值;
若所述目标历史使用的数学试题的知识点群的难度方差小于预设方差阈值,则去掉所述其他历史使用的数学试题中离散的初始难度值并计算平均初始难度值,将所述平均初始难度值定为所述目标历史使用的数学试题的最终难度值。
如果所述目标历史使用的数学试题既不是高频使用试题,也不存在众数使用的稳定的初始难度值,则由该题的知识点群的难度来表示该题的难度,首先通过难度方差来判断该题的知识点群的难度值是否稳定,若稳定,则将离散难度值去除,并取知识点群的平均难度值作为所述目标历史使用的数学试题的最终难度。
而若所述目标历史使用的数学试题既不是高频使用试题,也不存在众数使用的稳定的初始难度值,包含的知识点也不是知识点群或者包含的知识点是知识点群但知识点群的难度方差不小于预设方差阈值(即知识点群的难度值不稳定),则通过所述数学试题难度分类深度模型来对所述待预测数学试题的难度类型的概率进行计算,再来对所述待预测数学试题的难度类型进行确定。
S104,根据最终难度值及难度类型对所有所述历史使用的数学试题进行标记,并建立包含标记有最终难度值及难度类型的所有所述历史使用的数学试题的试题库。
S105,实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值。
其中,所述对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值的步骤前还包括:
对试题库中的历史使用的数学试题及所述待预测数学试题均进行公式语义理解以将每道试题中的公式转化为文字并生成与每道试题对应的文字文本;
所述对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值的步骤包括:
利用word2vec将公式语义理解后的所述待预测数学试题的文字文本及试题库中的每道所述历史使用的数学试题的文字文本进行向量化以得到所述待预测数学试题的文本向量及试题库中的每道所述历史使用的数学试题的文本向量;
根据所述待预测数学试题的文本向量与试题库中的每道所述历史使用的数学试题的文本向量计算所述待预测数学试题与试题库中的每道所述历史使用的数学试题的欧几里得相似距离,并得到对应的相似值。
本发明实施例中的相似值,也可以用其他相似值算法,如余弦相似度算法。
S106,根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型。
所述待预测数学试题的最终难度值及对应的难度类型获得后,便根据最终难度值及难度类型对所述待预测数学试题进行标记,并将标记后的所述待预测数学试题存入试题库中,以不断丰富试题库。
其中,所述根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型的步骤包括:
根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值对试题库中的所有历史使用的数学试题进行降序排序,并依序获取试题库中前K道历史使用的数学试题;
判断所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值是否大于第一预设相似值;
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值大于第一预设相似值,则将所述前K道历史使用的数学试题中的前1道历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题。
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值不大于第一预设相似值,则判断所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第二预设相似值,其中,k2大于k1;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值均大于第二预设相似值,则将所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题的众数最终难度值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值不均大于第二预设相似值,则判断所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第三预设相似值且所述待预测数学试题中的知识点是否为知识点群,其中,k4大于k3且k3大于或等于k2,例如,k1可以为5,k2可以为10,k3可以为10,k4可以为50;
若所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值均大于第三预设相似值且所述待预测数学试题中的知识点为知识点群,则将所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题的众数最终难度值及知识点群难度平均值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型。
本发明实施例的上述步骤先通过相似度计算来获取与待预测数学试题相似度高的前K道题,再应用topk进行分层相似匹配,根据前K道题的相似度情况分配不同的传递算法以将更准确的难度值及难度类型传递给待预测数学试题,从而保证待预测数学试题的难度类型判断的准确性。
而对于不满足上述topk分层相似匹配条件的待预测数学试题,即所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值不均大于第三预设相似值,或所述待预测数学试题中的知识点不是知识点群的情况,通过难度类型传递算法无法获取到准确的所述待预测数学试题的难度类型,此时,便可以通过所述数学试题难度分类深度模型来对所述待预测数学试题的难度类型的概率进行计算,再来对所述待预测数学试题的难度类型进行确定,能够更好更准确的获取待预测数学试题的难度类型。
进一步的,所述根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型的步骤后还包括:
若经过难度类型传递算法后还无法确定所述待预测数学试题的难度类型,则提取对数学试题难度影响大的因素,设为难度影响因素,所述难度影响因素包括计算量、知识综合度、知识难度、解析复杂度和知识点群难度。
本发明的实施例中的难度影响因素可以通过难度影响因素模型来进行提取。
进一步的,所述试题信息还包括题目和解析,所述提取对数学试题难度影响大的因素的步骤后还包括:
将公式语义理解后的试题库中的所有所述历史使用的数学试题的题目文本和解析文本及与每道所述历史使用的数学试题对应的难度影响因素数据和最终难度值输入wide&deep多分类模型中进行训练,以得到数学试题难度分类深度模型;
将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布。
所述将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布的步骤具体包括:
将公式语义理解后的所述待预测数学试题的题目文本、解析文本及难度影响因素数据输入;
利用word2vec将公式语义理解后的所述待预测数学试题的题目文本和解析文本进行向量化以得到所述待预测数学试题的初始化向量;
利用transformer-encoder对所述待预测数学试题的初始化向量提取结构体以得到所述待预测数学试题的题目高维特征向量;
将所述待预测数学试题的难度影响因素数据向量化并与所述待预测数学试题的题目高维特征向量进行拼接融合以得到所述待预测数学试题的拼接向量;
将所述待预测数学试题的拼接向量输入softmax激活函数以计算得到所述待预测数学试题的每种难度类型的概率。
进一步的,所述试题信息还包括试题id,所述试题id为试题在对应试卷中的位置,比如第几道题,所述将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布的步骤后还包括:
根据所述待预测数学试题的难度类型概率分布判断所述待预测数学试题的难度类型概率的最大值是否大于预设概率阈值;
若所述待预测数学试题的难度类型概率的最大值大于预设概率阈值,则将所述待预测数学试题的难度类型概率的最大值对应的难度类型确定为所述待预测数学试题的难度类型;
若所述待预测数学试题的难度类型概率的最大值不大于预设概率阈值且所述待预测数学试题的多个难度类型对应的概率值接近,则将概率值接近的多个难度类型的中间难度类型初定为所述待预测数学试题的难度类型;
根据所述待预测数学试题的试题id对所述待预测数学试题的难度类型进行微调,并对所述待预测数学试题打上难度微调标记。
随着试题库的不断丰富,所述待预测数学试题的使用次数逐渐递增,还需要对打上了难度微调标记的待预测数学试题的难度类型不断进行微调,该题被逐渐多次使用后,可以根据每次使用(即考试)时所有学生的得分情况来获得该题每次使用的得分率,再根据该题每次使用的得分率计算该题每次对应的初始难度值,之后按照本发明实施例中所述历史使用的数学试题的最终难度值及难度类型的获得方法来确定所述待预测数学试题的最终难度值及难度类型,再将所述待预测数学试题的难度微调标记删除,微调步骤如下:
当所述待预测数学试题的使用次数大于第一预设次数且小于预设次数时,则判断众数使用的所述待预测数学试题的初始难度值是否稳定;
若众数使用的所述待预测数学试题的初始难度值稳定,则将众数使用的所述待预测数学试题的初始难度值定为所述待预测数学试题的最终难度值。
若众数使用的所述待预测数学试题的初始难度值不稳定,则对所述待预测数学试题中知识点的类型进行识别;
若所述待预测数学试题中知识点为知识点群,则从大数据平台找出与所述待预测数学试题的知识点群相同的其他数学试题;
根据所述其他数学试题的初始难度值计算所述待预测数学试题的知识点群的难度方差,并判断所述待预测数学试题的知识点群的难度方差是否小于预设方差阈值;
若所述待预测数学试题的知识点群的难度方差小于预设方差阈值,则去掉所述待预测数学试题中离散的初始难度值并计算平均初始难度值,将所述平均初始难度值定为所述待预测数学试题的最终难度值。
若所述待预测数学试题的使用次数大于第一预设次数且小于预设次数的情况下无法通过上述步骤确定所述待预测数学试题的最终难度值,便等待所述待预测数学试题的使用次数继续增加,当超过预设次数时,则对每次使用的所述待预测数学试题的初始难度值进行相加并取平均值以得到所述待预测数学试题的最终难度值。
最后将所述待预测数学试题的最终难度值对照难度类型表进行查询以得到所述待预测数学试题的难度类型,其中,难度类型可以分为五类:超难、难、中、易和超易。
该步骤能够根据所述数学试题难度分类深度模型计算得到的待预测数学试题的难度类型的概率,对待预测数学试题的难度类型进行很好的确定,其中结合了难度微调算法,以便更好的确保待预测数学试题的难度类型的准确性。
本发明实施例若在对待预测数学试题经过难度类型传递算法后,还未能获取待预测数学试题的难度类型,则通过所述数学试题难度分类深度模型来计算待预测数学试题的难度类型的概率,再来对所述待预测数学试题的难度类型进行确定,能够很好的弥补难度类型传递算法无法获取新题难度类型的一些情况。
每道所述待预测数学试题的最终难度值及难度类型确定并获得后,便根据最终难度值及难度类型对所述待预测数学试题进行标记,并将标记后的所述待预测数学试题存入试题库中,以不断丰富试题库。
综上,本发明提供的一种数学试题难度类型的确定方法,有益效果在于:本发明根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值,为后续的最终难度值的确定提供了一个很好的参照及基准,通过结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析来确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型;
再实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值;根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型,本发明能够适用试题库中试题量有限的情况,在试题库中试题量有限的情况下,由于学习算法通常需要基于大数据的基础上,样本数量不足,便难以训练出准确度高的难度预测模型,而本发明在确定了试题库中的每道所述历史使用的数学试题的最终难度值及难度类型后,再通过难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题,以得到更为准确可靠的待预测数学试题的难度类型,使得组卷、推题都有更高的准确率,以帮助在线数学题库更好的建设,大大提升用户体验。
实施例2
请参考图2,本实施例提供一种数学试题难度类型的确定系统,包括:
获取模块:用于从大数据平台获取大量历史使用的数学试题,并提取每道所述历史使用的数学试题的试题信息,所述试题信息包括知识点、使用次数和得分率。
第一计算模块:用于根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值。
确定模块:用于结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型。
其中,所述结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值的步骤包括:
判断目标历史使用的数学试题的使用次数是否大于预设次数,所述目标历史使用的数学试题为大数据平台的任一所述历史使用的数学试题;
若所述目标历史使用的数学试题的使用次数大于预设次数,则对每次使用的所述目标历史使用的数学试题的初始难度值进行相加并取平均值以得到所述目标历史使用的数学试题的最终难度值。
若所述目标历史使用的数学试题的使用次数不大于预设次数,则判断众数使用的所述目标历史使用的数学试题的初始难度值是否在预设范围内;
若众数使用的所述目标历史使用的数学试题的初始难度值在预设范围内,则将众数使用的所述目标历史使用的数学试题的初始难度值的均值定为所述目标历史使用的数学试题的最终难度值。
若众数使用的所述目标历史使用的数学试题的初始难度值不在预设范围内,则对所述目标历史使用的数学试题中知识点的类型进行识别;
若所述目标历史使用的数学试题中知识点为知识点群,则从大数据平台找出与所述目标历史使用的数学试题的知识点群相同的其他历史使用的数学试题;
根据所述其他历史使用的数学试题的初始难度值计算所述目标历史使用的数学试题的知识点群的难度方差,并判断所述目标历史使用的数学试题的知识点群的难度方差是否小于预设方差阈值;
若所述目标历史使用的数学试题的知识点群的难度方差小于预设方差阈值,则去掉所述其他历史使用的数学试题中离散的初始难度值并计算平均初始难度值,将所述平均初始难度值定为所述目标历史使用的数学试题的最终难度值。
建立模块:用于根据最终难度值及难度类型对所有所述历史使用的数学试题进行标记,并建立包含标记有最终难度值及难度类型的所有所述历史使用的数学试题的试题库。
第二计算模块:用于实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值。
其中,所述第二计算模块还用于:
对试题库中的历史使用的数学试题及所述待预测数学试题均进行公式语义理解以将每道试题中的公式转化为文字并生成与每道试题对应的文字文本;
所述第二计算模块还用于:
利用word2vec将公式语义理解后的所述待预测数学试题的文字文本及试题库中的每道所述历史使用的数学试题的文字文本进行向量化以得到所述待预测数学试题的文本向量及试题库中的每道所述历史使用的数学试题的文本向量。
根据所述待预测数学试题的文本向量与试题库中的每道所述历史使用的数学试题的文本向量计算所述待预测数学试题与试题库中的每道所述历史使用的数学试题的欧几里得相似距离,并得到对应的相似值。
传递模块:用于根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型。
其中,所述传递模块还用于:
根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值对试题库中的所有历史使用的数学试题进行降序排序,并依序获取试题库中前K道历史使用的数学试题;
判断所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值是否大于第一预设相似值;
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值大于第一预设相似值,则将所述前K道历史使用的数学试题中的前1道历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题。
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值不大于第一预设相似值,则判断所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第二预设相似值,其中,k2大于k1;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值均大于第二预设相似值,则将所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题的众数最终难度值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值不均大于第二预设相似值,则判断所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第三预设相似值且所述待预测数学试题中的知识点是否为知识点群,其中,k4大于k3且k3大于或等于k2,例如,k1可以为5,k2可以为10,k3可以为10,k4可以为50;
若所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值均大于第三预设相似值且所述待预测数学试题中的知识点为知识点群,则将所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题的众数最终难度值及知识点群难度平均值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型。
进一步的,所述传递模块还用于:
若经过难度类型传递算法后还无法确定所述待预测数学试题的难度类型,则提取对数学试题难度影响大的因素,设为难度影响因素,所述难度影响因素包括计算量、知识综合度、知识难度、解析复杂度和知识点群难度。
进一步的,所述传递模块还用于:
将公式语义理解后的试题库中的所有所述历史使用的数学试题的题目文本和解析文本及与每道所述历史使用的数学试题对应的难度影响因素数据和最终难度值输入wide&deep多分类模型中进行训练,以得到数学试题难度分类深度模型;
将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布。
所述传递模块还用于:
将公式语义理解后的所述待预测数学试题的题目文本、解析文本及难度影响因素数据输入;
利用word2vec将公式语义理解后的所述待预测数学试题的题目文本和解析文本进行向量化以得到所述待预测数学试题的初始化向量;
利用transformer-encoder对所述待预测数学试题的初始化向量提取结构体以得到所述待预测数学试题的题目高维特征向量;
将所述待预测数学试题的难度影响因素数据向量化并与所述待预测数学试题的题目高维特征向量进行拼接融合以得到所述待预测数学试题的拼接向量;
将所述待预测数学试题的拼接向量输入softmax激活函数以计算得到所述待预测数学试题的每种难度类型的概率。
所述传递模块还用于:
根据所述待预测数学试题的难度类型概率分布判断所述待预测数学试题的难度类型概率的最大值是否大于预设概率阈值;
若所述待预测数学试题的难度类型概率的最大值大于预设概率阈值,则将所述待预测数学试题的难度类型概率的最大值对应的难度类型确定为所述待预测数学试题的难度类型;
若所述待预测数学试题的难度类型概率的最大值不大于预设概率阈值且所述待预测数学试题的多个难度类型对应的概率值接近,则将概率值接近的多个难度类型的中间难度类型初定为所述待预测数学试题的难度类型;
根据所述待预测数学试题的试题id对所述待预测数学试题的难度类型进行微调,并对所述待预测数学试题打上难度微调标记。
实施例3
请参考图3,本发明还提出一种数学试题难度类型的确定设备,所示为本发明第三实施例当中的数学试题难度类型的确定设备,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,所述处理器10执行所述计算机程序30时实现如上述的数学试题难度类型的确定方法。
其中,所述数学试题难度类型的确定设备具体可以为计算机、服务器、上位机等,处理器10在一些实施例中可以是中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。
其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是数学试题难度类型的确定设备的内部存储单元,例如该数学试题难度类型的确定设备的硬盘。存储器20在另一些实施例中也可以是数学试题难度类型的确定设备的外部存储装置,例如数学试题难度类型的确定设备上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器20还可以既包括数学试题难度类型的确定设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储安装于数学试题难度类型的确定设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
需要指出的是,图3示出的结构并不构成对数学试题难度类型的确定设备的限定,在其它实施例当中,该数学试题难度类型的确定设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的数学试题难度类型的确定方法。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (10)

1.一种数学试题难度类型的确定方法,其特征在于,所述方法包括:
从大数据平台获取大量历史使用的数学试题,并提取每道所述历史使用的数学试题的试题信息,所述试题信息包括知识点、使用次数和得分率;
根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值;
结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型;
根据最终难度值及难度类型对所有所述历史使用的数学试题进行标记,并建立包含标记有最终难度值及难度类型的所有所述历史使用的数学试题的试题库;
实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值;
根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型。
2.根据权利要求1所述的数学试题难度类型的确定方法,其特征在于,所述根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型的步骤包括:
根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值对试题库中的所有历史使用的数学试题进行降序排序,并依序获取试题库中前K道历史使用的数学试题;
判断所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值是否大于第一预设相似值;
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值大于第一预设相似值,则将所述前K道历史使用的数学试题中的前1道历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题;
若所述前K道历史使用的数学试题中的前1道历史使用的数学试题与所述待预测数学试题的相似值不大于第一预设相似值,则判断所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第二预设相似值,其中,k2大于k1;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值均大于第二预设相似值,则将所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题的众数最终难度值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型;
若所述前K道历史使用的数学试题中的前k1到k2道历史使用的数学试题与所述待预测数学试题的相似值不均大于第二预设相似值,则判断所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值是否均大于第三预设相似值且所述待预测数学试题中的知识点是否为知识点群,其中,k4大于k3且k3大于或等于k2;
若所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题与所述待预测数学试题的相似值均大于第三预设相似值且所述待预测数学试题中的知识点为知识点群,则将所述前K道历史使用的数学试题中的前k3到k4道历史使用的数学试题的众数最终难度值及知识点群难度平均值传递给所述待预测数学试题,并确定所述待预测数学试题的难度类型。
3.根据权利要求1所述的数学试题难度类型的确定方法,其特征在于,所述结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值的步骤包括:
判断目标历史使用的数学试题的使用次数是否大于预设次数,所述目标历史使用的数学试题为大数据平台的任一所述历史使用的数学试题;
若所述目标历史使用的数学试题的使用次数大于预设次数,则对每次使用的所述目标历史使用的数学试题的初始难度值进行相加并取平均值以得到所述目标历史使用的数学试题的最终难度值;
若所述目标历史使用的数学试题的使用次数不大于预设次数,则判断众数使用的所述目标历史使用的数学试题的初始难度值是否在预设范围内;
若众数使用的所述目标历史使用的数学试题的初始难度值在预设范围内,则将众数使用的所述目标历史使用的数学试题的初始难度值的均值定为所述目标历史使用的数学试题的最终难度值;
若众数使用的所述目标历史使用的数学试题的初始难度值不在预设范围内,则对所述目标历史使用的数学试题中知识点的类型进行识别;
若所述目标历史使用的数学试题中知识点为知识点群,则从大数据平台找出与所述目标历史使用的数学试题的知识点群相同的其他历史使用的数学试题;
根据所述其他历史使用的数学试题的初始难度值计算所述目标历史使用的数学试题的知识点群的难度方差,并判断所述目标历史使用的数学试题的知识点群的难度方差是否小于预设方差阈值;
若所述目标历史使用的数学试题的知识点群的难度方差小于预设方差阈值,则去掉所述其他历史使用的数学试题中离散的初始难度值并计算平均初始难度值,将所述平均初始难度值定为所述目标历史使用的数学试题的最终难度值。
4.根据权利要求1所述的数学试题难度类型的确定方法,其特征在于,所述对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值的步骤前还包括:
对试题库中的历史使用的数学试题及所述待预测数学试题均进行公式语义理解以将每道试题中的公式转化为文字并生成与每道试题对应的文字文本。
5.根据权利要求4所述的数学试题难度类型的确定方法,其特征在于,所述根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型的步骤后还包括:
若经过难度类型传递算法后还无法确定所述待预测数学试题的难度类型,则提取对数学试题难度影响大的因素,设为难度影响因素,所述难度影响因素包括计算量、知识综合度、知识难度、解析复杂度和知识点群难度。
6.根据权利要求5所述的数学试题难度类型的确定方法,其特征在于,所述试题信息还包括题目和解析,所述提取对数学试题难度影响大的因素的步骤后还包括:
将公式语义理解后的试题库中的所有所述历史使用的数学试题的题目文本和解析文本及与每道所述历史使用的数学试题对应的难度影响因素数据和最终难度值输入wide&deep多分类模型中进行训练,以得到数学试题难度分类深度模型;
将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布。
7.根据权利要求6所述的数学试题难度类型的确定方法,其特征在于,所述试题信息还包括试题id,所述将公式语义理解后的所述待预测数学试题的题目文本和解析文本及与所述待预测数学试题对应的难度影响因素数据输入所述数学试题难度分类深度模型,以通过所述数学试题难度分类深度模型对公式语义理解后的所述待预测数学试题的题目文本和解析文本进行特征提取以得到所述待预测数学试题的题目高维特征,且融合所述待预测数学试题的难度影响因素和题目高维特征,并根据融合后的所述待预测数学试题的难度影响因素和题目高维特征对所述待预测数学试题的每种难度类型的概率进行计算,以得到所述待预测数学试题的难度类型概率分布的步骤后还包括:
根据所述待预测数学试题的难度类型概率分布判断所述待预测数学试题的难度类型概率的最大值是否大于预设概率阈值;
若所述待预测数学试题的难度类型概率的最大值大于预设概率阈值,则将所述待预测数学试题的难度类型概率的最大值对应的难度类型确定为所述待预测数学试题的难度类型;
若所述待预测数学试题的难度类型概率的最大值不大于预设概率阈值且所述待预测数学试题的多个难度类型对应的概率值接近,则将概率值接近的多个难度类型的中间难度类型初定为所述待预测数学试题的难度类型;
根据所述待预测数学试题的试题id对所述待预测数学试题的难度类型进行微调,并对所述待预测数学试题打上难度微调标记。
8.一种数学试题难度类型的确定系统,其特征在于,包括:
获取模块:用于从大数据平台获取大量历史使用的数学试题,并提取每道所述历史使用的数学试题的试题信息,所述试题信息包括知识点、使用次数和得分率;
第一计算模块:用于根据每道所述历史使用的数学试题的得分率计算得到每道所述历史使用的数学试题的初始难度值;
确定模块:用于结合每道所述历史使用的数学试题的知识点、使用次数及初始难度值进行分析以确定每道所述历史使用的数学试题的最终难度值,并将每道所述历史使用的数学试题的最终难度值对照难度类型表进行查询以得到每道所述历史使用的数学试题的难度类型;
建立模块:用于根据最终难度值及难度类型对所有所述历史使用的数学试题进行标记,并建立包含标记有最终难度值及难度类型的所有所述历史使用的数学试题的试题库;
第二计算模块:用于实时获取待预测数学试题,并对所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似度进行计算以得到所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值;
传递模块:用于根据所述待预测数学试题与试题库中的每道所述历史使用的数学试题的相似值并基于难度类型传递算法将相似历史使用的数学试题的最终难度值及难度类型传递给所述待预测数学试题以得到所述待预测数学试题的最终难度值及对应的难度类型。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一所述的数学试题难度类型的确定方法。
10.一种数学试题难度类型的确定设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一所述的数学试题难度类型的确定方法。
CN202210007571.2A 2022-01-06 2022-01-06 数学试题难度类型的确定方法、系统、存储介质及设备 Active CN114077873B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210007571.2A CN114077873B (zh) 2022-01-06 2022-01-06 数学试题难度类型的确定方法、系统、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210007571.2A CN114077873B (zh) 2022-01-06 2022-01-06 数学试题难度类型的确定方法、系统、存储介质及设备

Publications (2)

Publication Number Publication Date
CN114077873A true CN114077873A (zh) 2022-02-22
CN114077873B CN114077873B (zh) 2022-05-31

Family

ID=80284653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210007571.2A Active CN114077873B (zh) 2022-01-06 2022-01-06 数学试题难度类型的确定方法、系统、存储介质及设备

Country Status (1)

Country Link
CN (1) CN114077873B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115269644A (zh) * 2022-06-09 2022-11-01 知学云(北京)科技股份有限公司 一种高性能在线考试方法、系统及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377802A (zh) * 2019-07-26 2019-10-25 江苏曲速教育科技有限公司 一种新增试题的知识点标注方法及系统
CN111444339A (zh) * 2020-02-29 2020-07-24 平安国际智慧城市科技股份有限公司 文本题目难度标注方法、装置及计算机可读存储介质
CN111932160A (zh) * 2020-10-09 2020-11-13 北京世纪好未来教育科技有限公司 知识掌握信息处理方法、装置、计算机设备及存储介质
CN112598202A (zh) * 2021-03-03 2021-04-02 北京世纪好未来教育科技有限公司 试题难度评估方法、装置及存储介质、计算设备
CN113344053A (zh) * 2021-05-29 2021-09-03 华中师范大学 一种基于试题异构图表征与学习者嵌入的知识追踪方法
CN113506003A (zh) * 2021-07-16 2021-10-15 上海松鼠课堂人工智能科技有限公司 学生水平标签的确定方法、装置、设备及存储介质
US20210365817A1 (en) * 2020-05-13 2021-11-25 International Business Machines Corporation First-order logical neural networks with bidirectional inference

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377802A (zh) * 2019-07-26 2019-10-25 江苏曲速教育科技有限公司 一种新增试题的知识点标注方法及系统
CN111444339A (zh) * 2020-02-29 2020-07-24 平安国际智慧城市科技股份有限公司 文本题目难度标注方法、装置及计算机可读存储介质
US20210365817A1 (en) * 2020-05-13 2021-11-25 International Business Machines Corporation First-order logical neural networks with bidirectional inference
CN111932160A (zh) * 2020-10-09 2020-11-13 北京世纪好未来教育科技有限公司 知识掌握信息处理方法、装置、计算机设备及存储介质
CN112598202A (zh) * 2021-03-03 2021-04-02 北京世纪好未来教育科技有限公司 试题难度评估方法、装置及存储介质、计算设备
CN113344053A (zh) * 2021-05-29 2021-09-03 华中师范大学 一种基于试题异构图表征与学习者嵌入的知识追踪方法
CN113506003A (zh) * 2021-07-16 2021-10-15 上海松鼠课堂人工智能科技有限公司 学生水平标签的确定方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WAYNE XIN ZHAO ET AL.: "Automatically learning topics and difficulty levels of problems in online judge system", 《ACM TRANSACTIONS ON INFORMATION SYSTEMS》 *
王青梅: "基于题目属性与文本的试题难度预测研究-以数学试题为例", 《中国万方硕士论文全文数据库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115269644A (zh) * 2022-06-09 2022-11-01 知学云(北京)科技股份有限公司 一种高性能在线考试方法、系统及设备

Also Published As

Publication number Publication date
CN114077873B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN109598995B (zh) 基于贝叶斯知识跟踪模型的智能教学系统
CN110377911B (zh) 对话框架下的意图识别方法和装置
CN111368024A (zh) 文本语义相似度的分析方法、装置及计算机设备
Yeung et al. Incorporating features learned by an enhanced deep knowledge tracing model for stem/non-stem job prediction
US20160132815A1 (en) Skill estimation method in machine-human hybrid crowdsourcing
CN110188351A (zh) 语句通顺度及句法评分模型的训练方法及装置
KR102265573B1 (ko) 인공지능 기반 입시 수학 학습 커리큘럼 재구성 방법 및 시스템
CN111445200A (zh) 基于人工智能的面试方法、装置、计算机设备及存储介质
CN104111925B (zh) 项目推荐方法和装置
CN112347226A (zh) 文档知识抽取方法、装置、计算机设备及可读存储介质
CN114971425B (zh) 数据库信息监控方法、装置、设备及存储介质
CN111428448A (zh) 文本生成方法、装置、计算机设备及可读存储介质
CN113486203B (zh) 基于问答平台的数据处理方法、装置及相关设备
CN114077873B (zh) 数学试题难度类型的确定方法、系统、存储介质及设备
WO2020170593A1 (ja) 情報処理装置及び情報処理方法
CN110321421A (zh) 用于网站知识社区系统的专家推荐方法及计算机存储介质
CN112348417A (zh) 一种基于主成分分析算法的营销价值评估方法及装置
CN115496638A (zh) 基于智慧校园的学生课程成绩分析管理方法及系统
CN115082041A (zh) 用户信息管理方法、装置、设备及存储介质
CN114416929A (zh) 实体召回模型的样本生成方法、装置、设备及存储介质
CN111639485A (zh) 基于文本相似性的课程推荐方法及相关设备
CN109325099A (zh) 一种自动检索的方法和装置
CN113569018A (zh) 问答对挖掘方法及装置
CN111930908A (zh) 基于人工智能的答案识别方法及装置、介质、电子设备
CN112732908B (zh) 试题新颖度评估方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 330000 Building 1, maiyuan Road, Nanchang Economic and Technological Development Zone, Jiangxi Province

Patentee after: Jiangxi wind vane Intelligent Technology Co.,Ltd.

Address before: 330000 Building 1, maiyuan Road, Nanchang Economic and Technological Development Zone, Jiangxi Province

Patentee before: JIANGXI VANEDUCATION TECHNOLOGY Inc.