CN117251533B - 一种数学题目及其解答过程的生成方法 - Google Patents
一种数学题目及其解答过程的生成方法 Download PDFInfo
- Publication number
- CN117251533B CN117251533B CN202311541028.1A CN202311541028A CN117251533B CN 117251533 B CN117251533 B CN 117251533B CN 202311541028 A CN202311541028 A CN 202311541028A CN 117251533 B CN117251533 B CN 117251533B
- Authority
- CN
- China
- Prior art keywords
- mathematical
- topic
- steps
- questions
- transformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 192
- 230000008569 process Effects 0.000 title claims abstract description 55
- 230000009466 transformation Effects 0.000 claims abstract description 113
- 239000011159 matrix material Substances 0.000 claims abstract description 79
- 238000005259 measurement Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000013178 mathematical model Methods 0.000 claims abstract description 11
- 230000000638 stimulation Effects 0.000 claims description 107
- 238000012360 testing method Methods 0.000 claims description 76
- 230000004044 response Effects 0.000 claims description 35
- 230000001149 cognitive effect Effects 0.000 claims description 29
- 238000009826 distribution Methods 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000010276 construction Methods 0.000 claims description 21
- 230000010354 integration Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 12
- 238000007476 Maximum Likelihood Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 10
- 230000001174 ascending effect Effects 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 9
- 230000019771 cognition Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 230000004069 differentiation Effects 0.000 claims description 6
- 238000004445 quantitative analysis Methods 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 6
- 230000004936 stimulating effect Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 239000000047 product Substances 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 241000764238 Isis Species 0.000 claims 1
- 241000894007 species Species 0.000 claims 1
- 230000006872 improvement Effects 0.000 abstract description 2
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000004816 latex Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Educational Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数学题目及其解答过程的生成方法,包括:1)量化分析数学题目的特征,得到包含数学题目所属章节与题目特征的数据集;2)基于矩阵初等变换构建用于数学题目及其解答过程生成的框架和一般化数学模型;3)设计生成数学题目及其解答过程的算法;4)输入数学题目的测量内容、考查知识和相关特征参数,输出数学题目及其详细解答过程;5)量化分析输出的数学题目难度和相关测量学指标,评价所生成数学题目的质量。本发明方法能够快速准确地为学习者提供大量的针对性习题及完整的解答过程,缩短学习者通过其他渠道搜集针对性习题的时间,减轻教师教学负担,提高学生学习效率,促进教学质量的提升。
Description
技术领域
本发明涉及电子信息技术领域,具体涉及一种数学题目及其解答过程的生成方法。
背景技术
随着认知理论与心理计量学技术在心理与教育测量学上的不断尝试与应用,一些由理论驱动的测量模式已经在计算机自动化题目生成上表现出了非常不错的效果。计算机自动化题目生成作为一种以题目认知加工理论为基础的原则性题目设计模式,将理论驱动的测量模式融入计算机化题目生成,通过理论分析和实证研究,建立测验建构的内在表征与测验题目之间的对应关系,能够更深入地挖掘在被试的作答反应模式下提供的更丰富的信息,进而详细说明被试者表现的潜在认知基础,更为准确地提供后继决策和干预措施。
心理与教育测量模型的融合,给计算机自动化题目生成带来了许多优良的性质与强劲活力。利用这些优良性质,可以建设起大型优质题库,并可以按测验精度目标编制各种计算机化自适应测验。但是获得这些优良性质必须解决测量模型中的一个基础问题,即参数估计问题。现有方法通常采用极大似然估计法和边际极大似然估计法进行参数估计,其中极大似然估计法的原理是分两步进行参数估计:第一步,假设题目参数已知,只对被试参数进行估计;第二步,将估计出的被试参数值假设为真实值,只对题目参数进行估计。将这两个步骤反复循环进行,直至参数估计值达到稳定为止。该方法存在两条明显缺点:其一是由于牛顿-拉夫逊迭代算法的应用需要对所有参数的似然函数的二阶导数矩阵进行求逆,这在大样本下的计算量是巨大的;其二是为使得项目参数估计的精度更高,需要获得更多被试作答样本,这会增加被试参数的数量,可能会导致参数估计不一致的问题。而边际极大似然估计法,则是通过引入被试参数的总体分布,将被试参数从概率模型中积分出来,以获得关于项目参数的边际分布,从而获得一致的项目参数估计。边际极大似然估计的最大缺点是运算量很大,需要进行大量的积分运算,只要项目数量稍大一点,这个方法就无法使用。虽然采取边际极大似然估计的方法能够获得一致的项目参数估计,但对于某些数据集包含了不正常反应(例如被试在作答过程中存在作弊等情况)产生的数据,项目参数的估计会产生偏离,在这种情况下使用边际极大似然估计方法就不能解决。
发明内容
本发明的目的是为了针对现有技术的不足,避免项目参数估计出现偏离,提供一种数学题目及其解答过程的生成方法,该方法使用边际贝叶斯参数估计法,能够在参数估计过程中防止不合理估计值的产生,从而根据输入的题目测量内容、考查知识和相关特征参数,生成优质的数学题目和解答过程。
为实现上述技术目的,本发明采用如下技术方案。
一种数学题目及其解答过程的生成方法,包括以下步骤:
步骤1、量化分析数学题目的特征,得到包含数学题目所属章节与题目特征的数据集;
步骤2、基于矩阵初等变换构建用于数学题目及其解答过程生成的框架和一般化数学模型;
步骤3、根据步骤2中构建的数学题目及其解答过程生成框架和模型,综合步骤1中所得包含数学题目所属章节与题目特征的数据集,设计生成数学题目及其解答过程的算法;
步骤4、根据步骤3中所设计的数学题目及其解答过程生成算法,输入数学题目的测量内容、考查知识和相关特征参数,输出数学题目及其详细解答过程;
步骤5、量化分析步骤4中输出的数学题目难度和相关测量学指标,评价所生成数学题目的质量。
具体的,步骤1中所述量化分析数学题目的特征,得到包含数学题目所属章节与题目特征的数据集,过程如下:
步骤1.1、将已有数学题目按照章节进行分类,综合分析被试者对每个章节数学题目的认知加工过程,并人工标定影响每个认知加工过程的数学题目刺激特征,将所有标定的刺激特征组合起来,构成该章节数学题目刺激特征集合,记为,应用统计学方法量化分析刺激特征集合/>对被试者作答反应的显著性程度,得到二元组/>;其中,/>表示数学题目的章节信息,/>,/>表示第/>个章节的信息,/>,/>为人工预设的数学章节的数量,/>,表示数学题目所属章节名,/>表示该章节知识点对应数学题目的关键数量特征;/>表示数学题目的刺激特征集合,/>,/>为第/>类数学题目刺激特征;当/>个章节数学题目的刺激特征都不同时,则/>,即每个刺激特征对应一个章节;否则/>,/>为所划分出来的不同数学题目刺激特征的类别数,当存在部分章节数学题目的刺激特征相同时,/>,为/>个章节的数学题目所包含的第/>个刺激特征,/>为具有相同刺激特征的章节号;
步骤1.2、使用经步骤1.1量化分析后得到的数学题目特征二元组构成所述包含数学题目所属章节与题目特征的数据集。
进一步地,步骤1.1中所述应用统计学方法量化分析刺激特征对被试者作答反应的显著性程度,得到二元组/>,具体包括以下步骤:
步骤1.11、人工按照数学章节对已有数学题目进行分类,记为,,根据每个章节知识点,分别选取若干影响被试者作答的刺激特征,记为/>,/>,/>;/>表示每个章节中未经统计检验的数学题目刺激特征;在/>中,/>与/>的每个元素为一对一的关系;
步骤1.12、根据步骤1.11中对章节的分类结果,从每个章节已有数学题目中选取道题构成试题集,每个试题集只包含一个章节的数学题目,记录每道数学题目中每个刺激特征对应的数值,即在求解该数学题目时对相应刺激特征所需操作的次数,将试题集分发给/>名被试者进行作答;
步骤1.13、收集被试者的作答情况,对名被试者在同一章节下每道数学题目的作答结果求平均,作为该数学题目的被试者作答观测值,记为/>;
;
其中,表示在第/>个章节下第/>名被试者对第/>道数学题目的作答结果,/>表示在第/>个章节下的第/>道数学题目的被试作答观测值;
步骤1.14、构建关于题号、题目刺激特征、作答结果的观测数据表;其中数据表的每一行表示一道数学题目,每一列表示该道数学题目的若干特征信息;
步骤1.15、收集组观测数据表,构造/>与/>的关联模型;假定因变量/>与自变量/>线性相关,则收集到的/>组观测数据,/>,满足以下关联模型:
;
记;
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是可观测的随机变量,/>是不可观测的随机变量,/>是题目特征矩阵,/>、是未知参数,并设/>,且/>;
步骤1.16、估计不同特征对被试者作答结果的权重向量;
在上述关联模型中,权重的估计量/>,使得误差平方和达到最小,即:
;
其中,;
设,求/>阶线性方程组:/>的解;所得结果即是参数向量/>的估计量,记为/>,其表达式为:
;
步骤1.17、对求解出的第个章节的被试者作答观测值/>与该章节下/>个数学题目刺激特征/>关联模型进行显著性检验:
对第个章节,/>的观测数据阵/>,具有恒等关系:
;
其中,,/>,/>;
体现了/>的观测值/>的总波动大小,记作/>;
体现了/>个估计值/>的波动大小,记作/>;
为残差平方和,记作/>;
由此得出的符号化表达就为:
;
对关联模型的显著性检验就是检验以下假设是否成立:
;
在步骤1.15推导出的关联模型的矩阵形式下有:
;
;
其中,与/>相互独立;
当成立时,/>;
由此能够得出为假设构造检验统计量为:
;
在成立时,检验统计量/>;利用/>组观测数据,计算检验统计量/>的值,记为/>;显著性概率,记为/>;/>值是指在/>下,利用/>的分布规律,计算出检验统计量/>大于等于/>的概率;若得出的/>值小于显著性水平/>,则依统计思想,小概率事件在一次实践中一般不会发生,据此能够得出/>个数学题目刺激特征构成的整体对被试者作答反应的显著性程度;
步骤1.18、对第个章节选出的/>个数学题目刺激特征的权值进行显著性检验:
根据第个章节选出的/>个数学题目刺激特征,构造原假设为:
;
构造检验以上假设的检验统计量:
设为/>对/>的回归平方和;/>为去掉/>后余下的/>个自变量对/>的回归平方和;则/>,其中/>为变量/>的偏回归平方和,则/>的计算公式为:
;
其中, 为/>的第/>个对角元素,/>是中心化后的数学题目刺激特征;
检验的检验统计量计算公式为:
;
已知,而/>;
又已知:;
所以有:;
在成立时,/>,即/>,且与/>相互独立,所以构造的检验统计量为:
;
给定显著性水平,由样本观测数据计算/>、/>及检验统计量的值,记为/>,并计算显著性概率值/>,/>;若/>,否定/>,即认为/>对/>的作用是显著的,据此能够具体得出每个刺激特征对被试者作答反应的影响程度;
步骤1.19、根据步骤1.18中计算出的个数学题目刺激特征的显著性水平,剔除在显著性水平/>下对/>作用不显著的变量;
经过对个变量逐个做检验后,若/>个变量在给定的显著性水平/>下对/>的作用都是显著的,即认为步骤1.11中提取的第/>个章节的数学题目刺激特征对被试者作答结果的影响是显著的;若有不显著变量,则每次剔除一个,然后由余下的变量和/>重复步骤1.15~步骤1.19,然后再逐个检验,直至模型中的变量都是显著的为止;
步骤1.20、将步骤1.19分析得到的第个章节的最优数学题目刺激特征/>按照如下关系加入数学题目刺激特征集/>:
;
当时,表示第/>个章节数学题目的刺激特征未和前/>个章节的重复,则将加入数学题目刺激特征集/>,并建立章节/>与数学题目刺激特征/>的联系/>;当时,则表示第/>个章节的数学题目刺激特征/>存在于数学题目刺激特征集合/>,此时无需再将/>加入集合/>,建立章节/>与数学题目刺激特征/>的联系/>;
步骤1.21、遍历完步骤1.11构建的,每个/>执行步骤1.12~步骤1.20,就得到了经过量化分析后的/>,其中/>,/>,此时与/>的对应关系为一对多,即一个数学题目刺激特征能够对应多个章节,但一个章节只能对应一个数学题目刺激特征;该二元组/>包含了数学题目所属章节以及刺激特征。
具体的,步骤2中所述构建用于数学题目及其解答过程生成的框架和一般化数学模型,包括以下步骤:
步骤2.1、对于待生成的第章的题目,综合数学题目刺激特征/>以及相应的数量特征/>,构造系数矩阵,记为/>;其中/>为行阶梯形矩阵,/>表示该数学题目包含/>个方程和/>个未知量;生成随机矩阵/>,其中/>的取值与章节/>所涉及知识点相关;将系数矩阵/>与随机矩阵/>进行水平连接运算,得到初始数学题目/>;初始数学题目是指在问题推理过程中,推导出的最后一个步骤,即根据该步骤就可得到所求;/>可表示为:
;
其中,表示矩阵的水平连接运算,表示将系数矩阵/>和随机矩阵/>按行进行连接,计算后的结果/>可表示为:
;
步骤2.2、根据矩阵的初等变换,按照数学题目刺激特征决定的步骤数,定义数学题目变换规则,构造变换步骤;
步骤2.21、定义初始数学题目的变换规则;在矩阵计算类题目中,变换规则更侧重于对变换顺序的规定;于是对于矩阵推理类题目,普遍按照以下顺序将初始题目矩阵进行变换:
初始数学题目矩阵;
对的上三角矩阵元素按照以下步骤进行变换:第一步用/>将/>变为非零,记为/>;第二步用/>将/>变为非零,记为/>;第三步用/>将/>变为非零,记为/>;以此类推,第/>步为用/>将/>变为非零,记为;
对的下三角矩阵元素按照以下步骤进行变换:第一步用/>将/>变为非零,记为/>;第二步用/>将/>变为非零,记为;第三步用/>将/>变为非零,记为;以此类推,第/>步为用/>将/>变为非零,记为/>;
上述变换步骤中的表达式为:
;
上述表达式表示将第行的元素减去第/>行元素的/>倍作为倍加变换后的第/>行的元素;
上述对初始数学题目矩阵的上下三角矩阵元素进行变换的次数/>为:
;
步骤2.22、从步骤2.21所述的步上三角矩阵元素变换步骤中随机选择/>步,然后对选出的/>步按照步骤序号进行升序排列,排列后的变换步骤的数学表达式为:
;
其中,表示对单位矩阵/>进行初等行变换,即将单位矩阵的第/>行减去第/>行的/>倍作为第/>行的元素;/>,/>表示先对单位矩阵进行/>变换,然后再将变换后的结果进行/>变换;
步骤2.23、从步骤2.21所述的步下三角矩阵元素变换步骤中随机选择/>步,然后对选出的/>步按照步骤序号进行升序排列,排列后的变换步骤的数学表达式为:
;
步骤2.24、构造变换步骤;整合步骤2.22和步骤2.23,按照先进行上三角变换,即先进行变换;再进行下三角变换,即后进行/>变换的顺序,对步骤2.1构造的初始数学题目/>进行变换;将变换步骤记为/>,就可表示为:
;
步骤2.3、对变换步骤进行验证;
步骤2.4、整合步骤2.1构造的初始数学题目和步骤2.24构造的变换步骤/>,得出生成原始数学题目的一般化数学模型/>;/>的表达式为:
;
其中,为/>的矩阵,/>为/>的矩阵,经过/>得到的原始数学题目为/>的矩阵;
根据章节所涉及知识点的提问方式,将/>得到的原始数学题目矩阵/>按照Latex形式进行编码,存入题库数据表;
步骤2.5、逆序遍历步骤2.2所述的数学题目变换规则,生成数学题目解答步骤,记为;按照章节/>的数学题目解答步骤形式,对每个变换步骤进行编码,存入解答步骤数据表。
进一步地,步骤2.3中所述对变换步骤进行验证,具体包括以下步骤:
步骤2.31、对于步骤2.24构造出的变换步骤,做出如下约束:上三角变换的/>步和下三角变换的/>步变换之和加1等于数学题目刺激特征规定的/>步,即;
步骤2.32、由步骤2.24得出的变换步骤,共包含了前面/>个步骤,最后1个步骤就需要根据约束条件决定是否将倍乘或交换变换加入到变换步骤中,约束条件为:
初始数学题目经过步骤2.24所述的/>个倍加变换,记为/>;
如果中的第一行第一列元素/>为-1或1,并且第/>行第一列元素/> ,/>,满足/>时,变换步骤的最后一步就为交换,即将矩阵/>的第1行和第/>行进行交换,记为/>;/>的表达式为:/>;否则,当/>不满足上述条件时,则变换步骤/>的最后一步就为倍加变换,并且需要在步骤2.21所述的对/>进行下三角矩阵元素变换的/>步中随机抽取1步,使其满足步骤2.31所述关系;
随机抽取的1步也需满足按照步骤序号进行升序排列,且最小的序号应该大于中最大的序号,排列后的变换步骤的数学表达式为:
;
通过验证的变换步骤能够表示为:
。
更进一步地,步骤2.5中所述生成数学题目解答步骤,具体包括以下步骤:
步骤2.51、将步骤2.32所得变换步骤进行水平反转;解答步骤/>与变换步骤/>存在关系:/>;其中,/>表示将/>进行水平反转;
步骤2.511、对原始数学题目的下三角元素进行变换,将倍加变换中的倍数取其相反数;将原来/>下三角变换中的第一步与第/>步反转,第二步与第/>步反转;于此类推,直至将第/>步与第/>步反转;
;
步骤2.512、对原始数学题目的上三角元素进行变换,将倍加变换中的倍数取其相反数;将原来/>上三角变换中的第一步与第/>步反转,第二步与第/>步反转;于此类推,直至将第/>步与第/>步反转;
;
步骤2.513、对变换步骤验证补充的最后一步也进行水平反转;其最后一步要为倍加变换,就将其倍数取相反数;
;
通过变换步骤水平反转后的解答步骤表达式为:
;
步骤2.514、由步骤2.41得到的数学题目和步骤2.512得到的解答步骤/>满足如下关系式:
;
步骤2.52、按照章节的题目解答步骤形式,对每个变换步骤进行编码,存入解答步骤数据表。
具体的,步骤5中所述评价所生成数学题目的质量,具体方法如下:
步骤5.1、根据步骤1~步骤4,分别为不同章节编制一套数学题目,在同一套试题上将教材章节后提供的试题和自动生成的试题混合,并标定每个数学题目的刺激特征复杂度;然后随机抽取一个样本量为的已经学习过该数学课程的大学本科学生作为被试者对上述试题进行作答,并且收集被试者的作答结果;
步骤5.2、构建基于认知心理学和心理测量学相结合的数学题目认知复杂度测量模型;
步骤5.3、编制模型参数估计算法,根据步骤5.1中被试者的作答反应,估计出每个数学题目的题目参数;
步骤5.4、构造题目参数与题目特征的关联模型,估计出题目特征对题目参数的影响系数;
步骤5.5、将题目参数作为因变量,题目特征作为自变量,将步骤5.4中构造的关联模型代入步骤5.2中构建的测量模型中,得到认知复杂性模型;
步骤5.6、比较自动生成与教材课后习题之间的题目参数,验证自动生成的数学题目与教材课后习题之间的差异性;并利用步骤5.5得到的认知复杂性模型,分析影响被试作答的潜在认知因素;
步骤5.61、根据步骤5.3估计出的每个数学题目的题目参数,从区分度与难度两个维度比较计算机化自动生成的数学题目和教材中的课后习题在区分度、难度方面的差距大小;
步骤5.62:根据步骤5.5得出的认知复杂度模型,探查被试者在作答数学题目时的知识结构;通过认知复杂度模型能够直观看出导致作答结果不同的两个被试者在知识结构上的差异。
具体的,步骤5.2中所述数学题目认知复杂度测量模型的构建过程如下:
步骤5.21、以Logistic潜在特质模型为基础,记为,改造该模型以生成只包含两个项目参数的Logistic潜在特质模型,记为/>,Logistic潜在特质模型/>的表达式为:
;
其中,表示被试者/>在第/>个章节的区分度为/>,难度为/>,猜测度为/>的数学题目/>上作答正确的概率;/>是Logistic潜在特质模型的分布函数,;/>表示第/>名被试者的能力;事件/>表示被试者/>答对了第/>个章节的第/>题;
令的参数/>可得/>;/>的表达式为:
;
与上述Logistic潜在特质模型相比,只包含两个项目参数的Logistic潜在特质模型/>表示被试者/>在第/>个章节题目区分度为/>,难度为/>的数学题目/>上作答正确的概率;其中被试者参数/>,项目参数/>,/>所表示的含义与/>中一致;/>就使得被试者/>答对第/>个章节第/>题的概率只取决于该题目的区分度和难度;
步骤5.22、把章节中题目所含刺激特征融入步骤5.21所构造的潜在特质模型;将/>中的题目区分度/>,用一组关于第/>个章节题目的刺激特征/>的线性组合模型来代替,/>;由/>替换后的/>记为/>;则/>的表达式为:
;
其中,为第/>个章节题目的/>个刺激特征对题目区分度的影响系数,;
用刺激特征的线性组合模型来代替题目难度/>,记为/>;/>的表达式为:
;
其中,为第/>个章节题目的/>个刺激特征对题目难度的影响系数,;
将,/>分别替换步骤2.21所述的潜在特质模型/>中的/>,/>,得到认知复杂度模型/>;/>的表达式为:
;
具体的,步骤5.3中所述被试者的作答反应,估计出每个数学题目的题目参数,过程如下:
步骤5.31、构建关于数学题目参数的计算公式;
按照步骤5.1所述在同一套试题上将教材章节后提供的试题和自动生成的试题混合组成长度为的测验试题;/>名被试者的能力分别记为/>,数学题目参数分别为:区分度参数/>,难度参数/>,/>;
将名被试者的作答结果,记为/>,/>中的一行表示一个被试者,一列表示一道数学题目;为便于计算,将被试者对于数学题目的作答反应采用二级记分模式,即;则第/>行记为/>,/>;那么,/>对/>的条件分布,记为/>;/>的表达式为:
;
假设名被试者都服从同一分布,且这/>名被试者的能力的先验分布已知,记为;就可得出边缘分布:
;
由上述边缘分布可得关于数学题目参数的边缘似然函数,记为;/>的表达式为:;
同时根据上述边缘分布和连续型Bayes公式,可推出被试者能力参数对/>的后验分布,记为:
;
对上述边缘似然函数取对数并对求偏导,令其等于0,得到边缘对数似然方程:/>
;
将上述被试者能力参数对/>的后验分布/>代入/>,可得:
;
求解上式可得:
;
同理可得的表达式为:
;
根据Gauss-Hermite数值积分公式,可将上述和/>的表达式化为数值积分的形式;变化后的/>和/>的表达式为:
;
;
其中,,
并且如果记,则/>表达式进一步可推出:
;
其中,,/>为第/>个章节下的题目数;/>,/>,/>,前者为用随机变量/>来表示数值积分的求积结点,后者为求积系数;
由Hermite多项式可知,是其多项式/>的根;
其中,将/>代入/>,并令其等于0,解出/>的值,即为/>;将/>代入求积系数/>,即可求出系数的值;
记个被试者中期望具有能力为/>的被试人数为/>;能力为/>的被试期望答对第/>章的第/>题的人数为/>;则根据Bock关于题目间独立,被试独立以及题目与被试独立的假设可得:/>
;
;
由此上述和/>就可被进一步用/>和/>替换为:
;
;
步骤5.32、构造被试者作答数据和被试者能力参数/>组成完全数据的极大似然函数,并求其后验期望;
将个被试者能力/>划分到/>个组/>;任取一个被试者/>,其能力/>的可能性为/>;取完所有被试者,能力/>取到这/>个组能力的可能性之和就为:/>;
用表示被试者能力属于第/>种能力的数量,则根据多项分布的定义有:
;
用来表示具有第/>种能力的被试者,答对第/>个章节的第/>题的概率,则可根据概率公式推导出/>的表达式:
;
其中,表示答对第/>章的第/>题,且能力属于/>的被试者数量,用随机变量/>表示该被试者的数量;
由式(54)可进一步得出具有第/>种能力的被试者刚好有/>答对第/>章的第/>题的概率,/>;
;
联立上述和/>两式;可得/>和/>的联合概率为:
;
其中,上式所得就为关于数学题目参数的似然函数;忽略/>的常数项,取/>的对数,得到/>;/>的表达式为:
;
用表项目参数,则/>的期望值就为:
;
步骤5.33、通过整合步骤5.31构造的数学题目参数计算公式以及步骤5.32构造的完全数据后验期望估计数学题目参数;
步骤5.331、通过数学题目参数分布给出初始数学题目参数,以及数值积分的求积结点/>;计算由步骤5.31所述的/>的值;
步骤5.332、给定随机变量的下角标/>,/>;然后计算由步骤5.32推导出的后验概率/>;
步骤5.333、对给定的,计算/>个被试者中期望具有能力为/>的被试人数为/>,以及能力为/>的被试者期望答对第/>章的第/>题的人数/>;
步骤5.334、用牛顿-拉夫逊迭代方法求解由步骤5.31推导出的含有和/>的数学题目参数/>和/>,得到数学题目参数估计值,即/>和/>;
步骤5.335、分别将和/>和代入步骤5.31推导出的数学题目参数的边缘似然函数/>,所得结果记为/>和/>;计算/>和/>的差值/>;
步骤5.336、两数差值,则此时/>就为估计出的数学题目参数;否则就令/>,/>,重复执行步骤5.331~步骤5.335;经过多次迭代更新得到每个数学题目的题目参数。
具体的,步骤5.4中所述构造题目参数与题目特征的关联模型,估计出题目特征对题目参数的影响系数,包括以下步骤:
步骤5.41、从数学题目的区分度和难度两个维度出发,来评估生成数学题目的质量;构建关于题号、题目特征、题目参数/>和/>的数学题目数据表,其中一行表示一道数学题目,一列表示数学题目的特征信息;
步骤5.42、根据步骤5.41中所得数学题目数据表,分别构造题目参数,/>与题目特征/>的关联模型;
假定因变量与自变量/>线性相关,收集到的/>组数据/>,,/>满足以下关联模型:
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是由步骤5.3估计出的数学题目区分度参数,/>是不可观测的随机变量;/>是题目特征对数学题目区分度的影响程度、/>是未知参数,是题目特征矩阵,并设/>,且/>;
同理,因变量与自变量/>同样满足以下关联模型:
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是由步骤5.3估计出的数学题目难度参数,/>是题目特征对数学题目难度的影响程度;其它符号定义与上述关联模型一致;
步骤5.43、重复步骤1.16~步骤1.18,分别估计出题目特征对数学题目区分度参数与数学题目难度参数/>的权值/>和/>,以及显著性程度。
与现有技术相比,本发明具有以下有益效果:
本发明构造了能够自动生成求解多元线性方程组和矩阵计算类数学题目及其解答步骤的生成框架和数学模型,将影响学生正确作答的认知难度因素融入生成框架,能够自动生成符合各因素层次要求的题目及其解答过程,还可以生成具有指定参数的题目及其解答过程;并且本发明所构造的生成框架还具有可重用性,只需根据学科知识更改其中少量模块,便可快捷生成满足特定要求的数学题目及其解答步骤;将本发明运用到教学过程中,能够为学习者提供大量的针对性习题及完整的解答过程,缩短学习者通过其他渠道搜集针对性习题的时间,减轻教师教学负担,提高学生学习效率,促进教学质量的提升。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简要介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关附图。
图1为本发明实施例的方法实现流程图;
图2为本发明实施例的模型结构图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面对本发明提出方法的各个步骤进行详细说明,应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
实施例
如图1所示,本发明提供了一种数学题目及其解答过程的生成方法,包括以下步骤:
步骤1、量化分析数学题目的特征,得到包含数学题目所属章节与题目特征的数据集;
步骤2、基于矩阵初等变换构建用于数学题目及其解答过程生成的框架和一般化数学模型,构建的数学题目及其解答过程自动生成框架如图2所示;
步骤3、根据步骤2中构建的数学题目及其解答过程生成框架和模型,综合步骤1中所得包含数学题目所属章节与题目特征的数据集,设计生成数学题目及其解答过程的算法;
步骤4、根据步骤3中所设计的数学题目及其解答过程生成算法,输入数学题目的测量内容、考查知识和相关特征参数,输出数学题目及其详细解答过程;
步骤5、量化分析步骤4中输出的数学题目难度和相关测量学指标,评价所生成数学题目的质量。
具体的,步骤1中所述量化分析数学题目的特征,得到包含数学题目所属章节与题目特征的数据集,过程如下:
步骤1.1、将已有数学题目按照章节进行分类,综合分析被试者对每个章节数学题目的认知加工过程,并人工标定影响每个认知加工过程的数学题目刺激特征,将所有标定的刺激特征组合起来,构成该章节数学题目刺激特征集合,记为,应用统计学方法量化分析刺激特征集合/>对被试者作答反应的显著性程度,得到二元组/>;其中,/>表示数学题目的章节信息,/>,/>表示第/>个章节的信息,/>,/>为人工预设的数学章节的数量,/>,表示数学题目所属章节名,/>表示该章节知识点对应数学题目的关键数量特征;/>表示数学题目的刺激特征集合,/>,/>为第/>类数学题目刺激特征;当/>个章节数学题目的刺激特征都不同时,则/>,即每个刺激特征对应一个章节;否则/>,/>为所划分出来的不同数学题目刺激特征的类别数,当存在部分章节数学题目的刺激特征相同时,/>,为/>个章节的数学题目所包含的第/>个刺激特征,/>为具有相同刺激特征的章节号;
步骤1.2、使用经步骤1.1量化分析后得到的数学题目特征二元组构成所述包含数学题目所属章节与题目特征的数据集。
进一步地,步骤1.1中所述应用统计学方法量化分析刺激特征对被试者作答反应的显著性程度,得到二元组/>,具体包括以下步骤:
步骤1.11、人工按照数学章节对已有数学题目进行分类,记为,,根据每个章节知识点,分别选取若干影响被试者作答的刺激特征,记为/>,/>,/>;/>表示每个章节中未经统计检验的数学题目刺激特征;在/>中,/>与/>的每个元素为一对一的关系;
步骤1.12、根据步骤1.11中对章节的分类结果,从每个章节已有数学题目中选取道题构成试题集,每个试题集只包含一个章节的数学题目,记录每道数学题目中每个刺激特征对应的数值,即在求解该数学题目时对相应刺激特征所需操作的次数,将试题集分发给/>名被试者进行作答;
步骤1.13、收集被试者的作答情况,对名被试者在同一章节下每道数学题目的作答结果求平均,作为该数学题目的被试者作答观测值,记为/>;
;
其中,表示在第/>个章节下第/>名被试者对第/>道数学题目的作答结果,/>表示在第/>个章节下的第/>道数学题目的被试作答观测值;
步骤1.14、构建关于题号、题目刺激特征、作答结果的观测数据表;其中数据表的每一行表示一道数学题目,每一列表示该道数学题目的若干特征信息;
步骤1.15、收集组观测数据表,构造/>与/>的关联模型;假定因变量/>与自变量/>线性相关,则收集到的/>组观测数据,/>,满足以下关联模型:
;
记;
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是可观测的随机变量,/>是不可观测的随机变量,/>是题目特征矩阵,/>、是未知参数,并设/>,且/>;
步骤1.16、估计不同特征对被试者作答结果的权重向量;
在上述关联模型中,权重的估计量/>,使得误差平方和达到最小,即:
;/>
其中,;
设,求/>阶线性方程组:/>的解;所得结果即是参数向量/>的估计量,记为/>,其表达式为:
;
步骤1.17、对求解出的第个章节的被试者作答观测值/>与该章节下/>个数学题目刺激特征/>关联模型进行显著性检验:
对第个章节,/>的观测数据阵/>,具有恒等关系:
;
其中,,/>,/>;
体现了/>的观测值/>的总波动大小,记作/>;
体现了/>个估计值/>的波动大小,记作/>;
为残差平方和,记作/>;
由此得出的符号化表达就为:
;
对关联模型的显著性检验就是检验以下假设是否成立:
;
在步骤1.15推导出的关联模型的矩阵形式下有:
;
;
其中,与/>相互独立;
当成立时,/>;
由此能够得出为假设构造检验统计量为:
;/>
在成立时,检验统计量/>;利用/>组观测数据,计算检验统计量/>的值,记为/>;显著性概率,记为/>;/>值是指在/>下,利用/>的分布规律,计算出检验统计量/>大于等于/>的概率;若得出的/>值小于显著性水平/>,则依统计思想,小概率事件在一次实践中一般不会发生,据此能够得出/>个数学题目刺激特征构成的整体对被试者作答反应的显著性程度;
步骤1.18、对第个章节选出的/>个数学题目刺激特征的权值进行显著性检验:
根据第个章节选出的/>个数学题目刺激特征,构造原假设为:
;
构造检验以上假设的检验统计量:
设为/>对/>的回归平方和;/>为去掉/>后余下的/>个自变量对/>的回归平方和;则/>,其中/>为变量/>的偏回归平方和,则/>的计算公式为:
;
其中, 为/>的第/>个对角元素,/>是中心化后的数学题目刺激特征;
检验的检验统计量计算公式为:
;
已知,而/>;
又已知:;
所以有:;
在成立时,/>,即/>,且与/>相互独立,所以构造的检验统计量为:
;
给定显著性水平,由样本观测数据计算/>、/>及检验统计量的值,记为/>,并计算显著性概率值/>,/>;若/>,否定/>,即认为/>对/>的作用是显著的,据此能够具体得出每个刺激特征对被试者作答反应的影响程度;
步骤1.19、根据步骤1.18中计算出的个数学题目刺激特征的显著性水平,剔除在显著性水平/>下对/>作用不显著的变量;
经过对个变量逐个做检验后,若/>个变量在给定的显著性水平/>下对/>的作用都是显著的,即认为步骤1.11中提取的第/>个章节的数学题目刺激特征对被试者作答结果的影响是显著的;若有不显著变量,则每次剔除一个,然后由余下的变量和/>重复步骤1.15~步骤1.19,然后再逐个检验,直至模型中的变量都是显著的为止;/>
步骤1.20、将步骤1.19分析得到的第个章节的最优数学题目刺激特征/>按照如下关系加入数学题目刺激特征集/>:
;
当时,表示第/>个章节数学题目的刺激特征未和前/>个章节的重复,则将加入数学题目刺激特征集/>,并建立章节/>与数学题目刺激特征/>的联系/>;当时,则表示第/>个章节的数学题目刺激特征/>存在于数学题目刺激特征集合/>,此时无需再将/>加入集合/>,建立章节/>与数学题目刺激特征/>的联系/>;
步骤1.21、遍历完步骤1.11构建的,每个/>执行步骤1.12~步骤1.20,就得到了经过量化分析后的/>,其中/>,/>,此时与/>的对应关系为一对多,即一个数学题目刺激特征能够对应多个章节,但一个章节只能对应一个数学题目刺激特征;该二元组/>包含了数学题目所属章节以及刺激特征。
具体的,步骤2中所述构建用于数学题目及其解答过程生成的框架和一般化数学模型,包括以下步骤:
步骤2.1、对于待生成的第章的题目,综合数学题目刺激特征/>以及相应的数量特征/>,构造系数矩阵,记为/>;其中/>为行阶梯形矩阵,/>表示该数学题目包含/>个方程和/>个未知量;生成随机矩阵/>,其中/>的取值与章节/>所涉及知识点相关;将系数矩阵/>与随机矩阵/>进行水平连接运算,得到初始数学题目/>;初始数学题目是指在问题推理过程中,推导出的最后一个步骤,即根据该步骤就可得到所求;/>可表示为:
;
其中,表示矩阵的水平连接运算,表示将系数矩阵/>和随机矩阵/>按行进行连接,计算后的结果/>可表示为:
;
步骤2.2、根据矩阵的初等变换,按照数学题目刺激特征决定的步骤数,定义数学题目变换规则,构造变换步骤;
步骤2.21、定义初始数学题目的变换规则;在矩阵计算类题目中,变换规则更侧重于对变换顺序的规定;于是对于矩阵推理类题目,普遍按照以下顺序将初始题目矩阵进行变换:
初始数学题目矩阵;
对的上三角矩阵元素按照以下步骤进行变换:第一步用/>将/>变为非零,记为/>;第二步用/>将/>变为非零,记为/>;第三步用/>将/>变为非零,记为/>;以此类推,第/>步为用/>将/>变为非零,记为/>;
对的下三角矩阵元素按照以下步骤进行变换:第一步用/>将/>变为非零,记为/>;第二步用/>将/>变为非零,记为;第三步用/>将/>变为非零,记为;以此类推,第/>步为用/>将/>变为非零,记为/>;
上述变换步骤中的表达式为:
;
上述表达式表示将第行的元素减去第/>行元素的/>倍作为倍加变换后的第/>行的元素;
上述对初始数学题目矩阵的上下三角矩阵元素进行变换的次数/>为:
;
步骤2.22、从步骤2.21所述的步上三角矩阵元素变换步骤中随机选择/>步,然后对选出的/>步按照步骤序号进行升序排列,排列后的变换步骤的数学表达式为:
;
其中,表示对单位矩阵/>进行初等行变换,即将单位矩阵的第/>行减去第/>行的/>倍作为第/>行的元素;/>,/>表示先对单位矩阵进行/>变换,然后再将变换后的结果进行/>变换;
步骤2.23、从步骤2.21所述的步下三角矩阵元素变换步骤中随机选择/>步,然后对选出的/>步按照步骤序号进行升序排列,排列后的变换步骤的数学表达式为:
;
步骤2.24、构造变换步骤;整合步骤2.22和步骤2.23,按照先进行上三角变换,即先进行变换;再进行下三角变换,即后进行/>变换的顺序,对步骤2.1构造的初始数学题目/>进行变换;将变换步骤记为/>,就可表示为:
;
步骤2.3、对变换步骤进行验证;
步骤2.4、整合步骤2.1构造的初始数学题目和步骤2.24构造的变换步骤/>,得出生成原始数学题目的一般化数学模型/>;/>的表达式为:
;
其中,为/>的矩阵,/>为/>的矩阵,经过/>得到的原始数学题目为/>的矩阵;
根据章节所涉及知识点的提问方式,将/>得到的原始数学题目矩阵/>按照Latex形式进行编码,存入题库数据表;
步骤2.5、逆序遍历步骤2.2所述的数学题目变换规则,生成数学题目解答步骤,记为;按照章节/>的数学题目解答步骤形式,对每个变换步骤进行编码,存入解答步骤数据表。/>
进一步地,步骤2.3中所述对变换步骤进行验证,具体包括以下步骤:
步骤2.31、对于步骤2.24构造出的变换步骤,做出如下约束:上三角变换的/>步和下三角变换的/>步变换之和加1等于数学题目刺激特征规定的/>步,即;
步骤2.32、由步骤2.24得出的变换步骤,共包含了前面/>个步骤,最后1个步骤就需要根据约束条件决定是否将倍乘或交换变换加入到变换步骤中,约束条件为:
初始数学题目经过步骤2.24所述的/>个倍加变换,记为/>;
如果中的第一行第一列元素/>为-1或1,并且第/>行第一列元素/> ,/>,满足/>时,变换步骤的最后一步就为交换,即将矩阵/>的第1行和第/>行进行交换,记为/> ;/>的表达式为:/>;否则,当/>不满足上述条件时,则变换步骤/>的最后一步就为倍加变换,并且需要在步骤2.21所述的对/>进行下三角矩阵元素变换的/>步中随机抽取1步,使其满足步骤2.31所述关系;
随机抽取的1步也需满足按照步骤序号进行升序排列,且最小的序号应该大于中最大的序号,排列后的变换步骤的数学表达式为:
;
通过验证的变换步骤能够表示为:
。
更进一步地,步骤2.5中所述生成数学题目解答步骤,具体包括以下步骤:
步骤2.51、将步骤2.32所得变换步骤进行水平反转;解答步骤/>与变换步骤/>存在关系:/>;其中,/>表示将/>进行水平反转;
步骤2.511、对原始数学题目的下三角元素进行变换,将倍加变换中的倍数取其相反数;将原来/>下三角变换中的第一步与第/>步反转,第二步与第/>步反转;于此类推,直至将第/>步与第/>步反转;
;
步骤2.512、对原始数学题目的上三角元素进行变换,将倍加变换中的倍数取其相反数;将原来/>上三角变换中的第一步与第/>步反转,第二步与第/>步反转;于此类推,直至将第/>步与第/>步反转;
;
步骤2.513、对变换步骤验证补充的最后一步也进行水平反转;其最后一步要为倍加变换,就将其倍数取相反数;
;
通过变换步骤水平反转后的解答步骤表达式为:
;
步骤2.514、由步骤2.41得到的数学题目和步骤2.512得到的解答步骤/>满足如下关系式:
;
步骤2.52、按照章节的题目解答步骤形式,对每个变换步骤进行编码,存入解答步骤数据表。
具体的,步骤5中所述评价所生成数学题目的质量,具体方法如下:
步骤5.1、根据步骤1~步骤4,分别为不同章节编制一套数学题目,在同一套试题上将教材章节后提供的试题和自动生成的试题混合,并标定每个数学题目的刺激特征复杂度;然后随机抽取一个样本量为的已经学习过该数学课程的大学本科学生作为被试者对上述试题进行作答,并且收集被试者的作答结果;
步骤5.2、构建基于认知心理学和心理测量学相结合的数学题目认知复杂度测量模型;
步骤5.3、编制模型参数估计算法,根据步骤5.1中被试者的作答反应,估计出每个数学题目的题目参数;
步骤5.4、构造题目参数与题目特征的关联模型,估计出题目特征对题目参数的影响系数;
步骤5.5、将题目参数作为因变量,题目特征作为自变量,将步骤5.4中构造的关联模型代入步骤5.2中构建的测量模型中,得到认知复杂性模型;
步骤5.6、比较自动生成与教材课后习题之间的题目参数,验证自动生成的数学题目与教材课后习题之间的差异性;并利用步骤5.5得到的认知复杂性模型,分析影响被试作答的潜在认知因素;
步骤5.61、根据步骤5.3估计出的每个数学题目的题目参数,从区分度与难度两个维度比较计算机化自动生成的数学题目和教材中的课后习题在区分度、难度方面的差距大小;
步骤5.62:根据步骤5.5得出的认知复杂度模型,探查被试者在作答数学题目时的知识结构;通过认知复杂度模型能够直观看出导致作答结果不同的两个被试者在知识结构上的差异。
具体的,步骤5.2中所述数学题目认知复杂度测量模型的构建过程如下:
步骤5.21、以Logistic潜在特质模型为基础,记为,改造该模型以生成只包含两个项目参数的Logistic潜在特质模型,记为/>,Logistic潜在特质模型/>的表达式为:
;
其中,表示被试者/>在第/>个章节的区分度为/>,难度为/>,猜测度为/>的数学题目/>上作答正确的概率;/>是Logistic潜在特质模型的分布函数,;/>表示第/>名被试者的能力;事件/>表示被试者/>答对了第/>个章节的第/>题;
令的参数/>可得/>;/>的表达式为:
;/>
与上述Logistic潜在特质模型相比,只包含两个项目参数的Logistic潜在特质模型/>表示被试者/>在第/>个章节题目区分度为/>,难度为/>的数学题目/>上作答正确的概率;其中被试者参数/>,项目参数/>,/>所表示的含义与/>中一致;/>就使得被试者/>答对第/>个章节第/>题的概率只取决于该题目的区分度和难度;
步骤5.22、把章节中题目所含刺激特征融入步骤5.21所构造的潜在特质模型;将/>中的题目区分度/>,用一组关于第/>个章节题目的刺激特征/>的线性组合模型来代替,/>;由/>替换后的/>记为/>;则/>的表达式为:
;
其中,为第/>个章节题目的/>个刺激特征对题目区分度的影响系数,;
用刺激特征的线性组合模型来代替题目难度/>,记为/>;/>的表达式为:
;
其中,为第/>个章节题目的/>个刺激特征对题目难度的影响系数,;
将,/>分别替换步骤2.21所述的潜在特质模型/>中的/>,/>,得到认知复杂度模型/>;/>的表达式为:
;
具体的,步骤5.3中所述被试者的作答反应,估计出每个数学题目的题目参数,过程如下:
步骤5.31、构建关于数学题目参数的计算公式;
按照步骤5.1所述在同一套试题上将教材章节后提供的试题和自动生成的试题混合组成长度为的测验试题;/>名被试者的能力分别记为/>,数学题目参数分别为:区分度参数/>,难度参数/>,/>;
将名被试者的作答结果,记为/>,/>中的一行表示一个被试者,一列表示一道数学题目;为便于计算,将被试者对于数学题目的作答反应采用二级记分模式,即;则第/>行记为/>,/>;那么,/>对/>的条件分布,记为/>;/>的表达式为:
;
假设名被试者都服从同一分布,且这/>名被试者的能力的先验分布已知,记为;就可得出边缘分布:
;
由上述边缘分布可得关于数学题目参数的边缘似然函数,记为;/>的表达式为:;/>
同时根据上述边缘分布和连续型Bayes公式,可推出被试者能力参数对/>的后验分布,记为:
;
对上述边缘似然函数取对数并对求偏导,令其等于0,得到边缘对数似然方程:
;
将上述被试者能力参数对/>的后验分布/>代入/>,可得:
;
求解上式可得:
;
同理可得的表达式为:
;
根据Gauss-Hermite数值积分公式,可将上述和/>的表达式化为数值积分的形式;变化后的/>和/>的表达式为:
;
;
其中,,
并且如果记,则/>表达式进一步可推出:
;
其中,,/>为第/>个章节下的题目数;/>,/>,/>,前者为用随机变量/>来表示数值积分的求积结点,后者为求积系数;
由Hermite多项式可知,是其多项式/>的根;
其中,将/>代入/>,并令其等于0,解出/>的值,即为/>;将/>代入求积系数/>,即可求出系数的值;/>
记个被试者中期望具有能力为/>的被试人数为/>;能力为/>的被试期望答对第/>章的第/>题的人数为/>;则根据Bock关于题目间独立,被试独立以及题目与被试独立的假设可得:
;
;
由此上述和/>就可被进一步用/>和/>替换为:
;
;
步骤5.32、构造被试者作答数据和被试者能力参数/>组成完全数据的极大似然函数,并求其后验期望;
将个被试者能力/>划分到/>个组/>;任取一个被试者/>,其能力/>的可能性为/>;取完所有被试者,能力/>取到这/>个组能力的可能性之和就为:/>;
用表示被试者能力属于第/>种能力的数量,则根据多项分布的定义有:
;
用来表示具有第/>种能力的被试者,答对第/>个章节的第/>题的概率,则可根据概率公式推导出/>的表达式:
;
其中,表示答对第/>章的第/>题,且能力属于/>的被试者数量,用随机变量/>表示该被试者的数量;
由式(54)可进一步得出具有第/>种能力的被试者刚好有/>答对第/>章的第/>题的概率,/>;
;
联立上述和/>两式;可得/>和/>的联合概率为:
;
其中,上式所得就为关于数学题目参数的似然函数;忽略/>的常数项,取/>的对数,得到/>;/>的表达式为:
;/>
用表项目参数,则/>的期望值就为:
;
步骤5.33、通过整合步骤5.31构造的数学题目参数计算公式以及步骤5.32构造的完全数据后验期望估计数学题目参数;
步骤5.331、通过数学题目参数分布给出初始数学题目参数,以及数值积分的求积结点/>;计算由步骤5.31所述的/>的值;
步骤5.332、给定随机变量的下角标/>,/>;然后计算由步骤5.32推导出的后验概率/>;
步骤5.333、对给定的,计算/>个被试者中期望具有能力为/>的被试人数为/>,以及能力为/>的被试者期望答对第/>章的第/>题的人数/>;
步骤5.334、用牛顿-拉夫逊迭代方法求解由步骤5.31推导出的含有和/>的数学题目参数/>和/>,得到数学题目参数估计值,即/>和/>;
步骤5.335、分别将和/>和代入步骤5.31推导出的数学题目参数的边缘似然函数/>,所得结果记为/>和/>;计算/>和/>的差值/>;
步骤5.336、两数差值,则此时/>就为估计出的数学题目参数;否则就令/>,/>,重复执行步骤5.331~步骤5.335;经过多次迭代更新得到每个数学题目的题目参数。
具体的,步骤5.4中所述构造题目参数与题目特征的关联模型,估计出题目特征对题目参数的影响系数,包括以下步骤:
步骤5.41、从数学题目的区分度和难度两个维度出发,来评估生成数学题目的质量;构建关于题号、题目特征、题目参数/>和/>的数学题目数据表,其中一行表示一道数学题目,一列表示数学题目的特征信息;
步骤5.42、根据步骤5.41中所得数学题目数据表,分别构造题目参数,/>与题目特征/>的关联模型;
假定因变量与自变量/>线性相关,收集到的/>组数据/>,,/>满足以下关联模型:
;
将上述关联模型用矩阵形式表示,则有:
;/>
其中,是由步骤5.3估计出的数学题目区分度参数,/>是不可观测的随机变量;/>是题目特征对数学题目区分度的影响程度、/>是未知参数,是题目特征矩阵,并设/>,且/>;
同理,因变量与自变量/>同样满足以下关联模型:
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是由步骤5.3估计出的数学题目难度参数,/>是题目特征对数学题目难度的影响程度;其它符号定义与上述关联模型一致;
步骤5.43、重复步骤1.16~步骤1.18,分别估计出题目特征对数学题目区分度参数与数学题目难度参数/>的权值/>和/>,以及显著性程度。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容 ,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (9)
1.一种数学题目及其解答过程的生成方法,其特征在于,包括以下步骤:
步骤1、量化分析数学题目的特征,得到包含数学题目所属章节与题目特征的数据集;
步骤1.1、将已有数学题目按照章节进行分类,综合分析被试者对每个章节数学题目的认知加工过程,并人工标定影响每个认知加工过程的数学题目刺激特征,将所有标定的刺激特征组合起来,构成该章节数学题目刺激特征集合,记为,应用统计学方法量化分析刺激特征集合/>对被试者作答反应的显著性程度,得到二元组/>;其中,/>表示数学题目的章节信息,
,/>表示第/>个章节的信息,/>,/>为人工预设的数学章节的数量,/>,/>表示数学题目所属章节名,/>表示该章节知识点对应数学题目的关键数量特征;/>表示数学题目的刺激特征集合,
,/>为第/>类数学题目刺激特征;当/>个章节数学题目的刺激特征都不同时,则/>,即每个刺激特征对应一个章节;否则/>,/>为所划分出来的不同数学题目刺激特征的类别数,当存在部分章节数学题目的刺激特征相同时,/>,/>为/>个章节的数学题目所包含的第/>个刺激特征,/>为具有相同刺激特征的章节号;
步骤1.2、使用经步骤1.1量化分析后得到的数学题目特征二元组构成所述包含数学题目所属章节与题目特征的数据集;
步骤2、基于矩阵初等变换构建用于数学题目及其解答过程生成的框架和一般化数学模型;
步骤3、根据步骤2中构建的数学题目及其解答过程生成框架和模型,综合步骤1中所得包含数学题目所属章节与题目特征的数据集,设计生成数学题目及其解答过程的算法;
步骤4、根据步骤3中所设计的数学题目及其解答过程生成算法,输入数学题目的测量内容、考查知识和相关特征参数,输出数学题目及其详细解答过程;
步骤5、量化分析步骤4中输出的数学题目难度和相关测量学指标,评价所生成数学题目的质量。
2.根据权利要求1所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤1.1中所述应用统计学方法量化分析刺激特征对被试者作答反应的显著性程度,得到二元组/>,具体包括以下步骤:
步骤1.11、人工按照数学章节对已有数学题目进行分类,记为,,根据每个章节知识点,分别选取若干影响被试者作答的刺激特征,记为/>,/>,/>;/>表示每个章节中未经统计检验的数学题目刺激特征;在/>中,/>与/>的每个元素为一对一的关系;
步骤1.12、根据步骤1.11中对章节的分类结果,从每个章节已有数学题目中选取/>道题构成试题集,每个试题集只包含一个章节的数学题目,记录每道数学题目中每个刺激特征对应的数值,即在求解该数学题目时对相应刺激特征所需操作的次数,将试题集分发给/>名被试者进行作答;
步骤1.13、收集被试者的作答情况,对名被试者在同一章节下每道数学题目的作答结果求平均,作为该数学题目的被试者作答观测值,记为/>;
;
其中,表示在第/>个章节下第/>名被试者对第/>道数学题目的作答结果,/>表示在第/>个章节下的第/>道数学题目的被试作答观测值;
步骤1.14、构建关于题号、题目刺激特征、作答结果的观测数据表;其中数据表的每一行表示一道数学题目,每一列表示该道数学题目的若干特征信息;
步骤1.15、收集组观测数据表,构造/>与/>的关联模型;
假定因变量与自变量/>线性相关,则收集到的/>组观测数据,/>,满足以下关联模型:
;
记;
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是可观测的随机变量,/>是不可观测的随机变量,/>是题目特征矩阵,/>、/>是未知参数,并设/>,且/>;
步骤1.16、估计不同特征对被试者作答结果的权重向量;
在上述关联模型中,权重的估计量/>,使得误差平方和/>达到最小,即:
;
其中,;
设,求/>阶线性方程组:/>的解;所得结果即是参数向量/>的估计量,记为/>,其表达式为:
;
步骤1.17、对求解出的第个章节的被试者作答观测值/>与该章节下/>个数学题目刺激特征/>关联模型进行显著性检验:
对第个章节,/>的观测数据阵/>,具有恒等关系:
;
其中,,/>,/>;
体现了/>的观测值/>的总波动大小,记作/>;
体现了/>个估计值/>的波动大小,记作/>;
为残差平方和,记作/>;
由此得出的符号化表达就为:
;
对关联模型的显著性检验就是检验以下假设是否成立:
;
在步骤1.15推导出的关联模型的矩阵形式下有:
;
;
其中,与/>相互独立;
当成立时,/>;
由此能够得出为假设构造检验统计量为:
;
在成立时,检验统计量/>;利用/>组观测数据,计算检验统计量/>的值,记为/>;显著性概率,记为/>;/>值是指在/>下,利用/>的分布规律,计算出检验统计量/>大于等于/>的概率;若得出的/>值小于显著性水平/>,则依统计思想,小概率事件在一次实践中一般不会发生,据此能够得出/>个数学题目刺激特征构成的整体对被试者作答反应的显著性程度;
步骤1.18、对第个章节选出的/>个数学题目刺激特征的权值进行显著性检验:
根据第个章节选出的/>个数学题目刺激特征,构造原假设为:
;
构造检验以上假设的检验统计量:
设为/>对/>的回归平方和;/>为去掉/>后余下的/>个自变量对/>的回归平方和;则/>,其中/>为变量/>的偏回归平方和,则/>的计算公式为:
;
其中, 为/>的第/>个对角元素,/>是中心化后的数学题目刺激特征;
检验的检验统计量计算公式为:
;
已知,而/>;
又已知:;
所以有:;
在成立时,/>,即/>,且与/>相互独立,所以构造的检验统计量为:
;
给定显著性水平,由样本观测数据计算/>、/>及检验统计量的值,记为/>,并计算显著性概率值/>,/>;若/>,否定/>,即认为/>对/>的作用是显著的,据此能够具体得出每个刺激特征对被试者作答反应的影响程度;
步骤1.19、根据步骤1.18中计算出的个数学题目刺激特征的显著性水平,剔除在显著性水平/>下对/>作用不显著的变量;
经过对个变量逐个做检验后,若/>个变量在给定的显著性水平/>下对/>的作用都是显著的,即认为步骤1.11中提取的第/>个章节的数学题目刺激特征对被试者作答结果的影响是显著的;若有不显著变量,则每次剔除一个,然后由余下的变量和/>重复步骤1.15~步骤1.19,然后再逐个检验,直至模型中的变量都是显著的为止;
步骤1.20、将步骤1.19分析得到的第个章节的最优数学题目刺激特征/>按照如下关系加入数学题目刺激特征集/>:
;
当时,表示第/>个章节数学题目的刺激特征未和前/>个章节的重复,则将/>加入数学题目刺激特征集/>,并建立章节/>与数学题目刺激特征/>的联系/>;当/>时,则表示第/>个章节的数学题目刺激特征/>存在于数学题目刺激特征集合/>,此时无需再将/>加入集合/>,建立章节/>与数学题目刺激特征/>的联系/>;
步骤1.21、遍历完步骤1.11构建的,每个/>执行步骤1.12~步骤1.20,就得到了经过量化分析后的/>,其中/>,/>,此时/>与的对应关系为一对多,即一个数学题目刺激特征能够对应多个章节,但一个章节只能对应一个数学题目刺激特征;该二元组/>包含了数学题目所属章节以及刺激特征。
3.根据权利要求1所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤2中所述构建用于数学题目及其解答过程生成的框架和一般化数学模型,包括以下步骤:
步骤2.1、对于待生成的第章的题目,综合数学题目刺激特征/>以及相应的数量特征,构造系数矩阵,记为/>;其中/>为行阶梯形矩阵,/>表示该数学题目包含/>个方程和/>个未知量;生成随机矩阵/>,其中/>的取值与章节/>所涉及知识点相关;将系数矩阵与随机矩阵/>进行水平连接运算,得到初始数学题目/>;初始数学题目是指在问题推理过程中,推导出的最后一个步骤,即根据该步骤就可得到所求;/>可表示为:
;
其中,表示矩阵的水平连接运算,表示将系数矩阵/>和随机矩阵/>按行进行连接,计算后的结果/>可表示为:
;
步骤2.2、根据矩阵的初等变换,按照数学题目刺激特征决定的步骤数,定义数学题目变换规则,构造变换步骤;
步骤2.21、定义初始数学题目的变换规则;在矩阵计算类题目中,变换规则更侧重于对变换顺序的规定;于是对于矩阵推理类题目,普遍按照以下顺序将初始题目矩阵进行变换:
初始数学题目矩阵;
对的上三角矩阵元素按照以下步骤进行变换:第一步用/>将/>变为非零,记为;第二步用/>将/>变为非零,记为/>;第三步用/>将/>变为非零,记为/>;以此类推,第/>步为用/>将/>变为非零,记为;
对的下三角矩阵元素按照以下步骤进行变换:第一步用/>将/>变为非零,记为/>;第二步用/>将/>变为非零,记为;第三步用/>将/>变为非零,记为;以此类推,第/>步为用/>将/>变为非零,记为/>;
上述变换步骤中的表达式为:
;
上述表达式表示将第行的元素减去第/>行元素的/>倍作为倍加变换后的第/>行的元素;
上述对初始数学题目矩阵的上下三角矩阵元素进行变换的次数/>为:
;
步骤2.22、从步骤2.21所述的步上三角矩阵元素变换步骤中随机选择/>步,然后对选出的/>步按照步骤序号进行升序排列,排列后的变换步骤的数学表达式为:
;
其中,表示对单位矩阵/>进行初等行变换,即将单位矩阵的第/>行减去第/>行的倍作为第/>行的元素;/>,/>表示先对单位矩阵进行/>变换,然后再将变换后的结果进行/>变换;
步骤2.23、从步骤2.21所述的步下三角矩阵元素变换步骤中随机选择/>步,然后对选出的/>步按照步骤序号进行升序排列,排列后的变换步骤的数学表达式为:
;
步骤2.24、构造变换步骤;整合步骤2.22和步骤2.23,按照先进行上三角变换,即先进行变换;再进行下三角变换,即后进行/>变换的顺序,对步骤2.1构造的初始数学题目进行变换;将变换步骤记为/>,就可表示为:
;
步骤2.3、对变换步骤进行验证;
步骤2.4、整合步骤2.1构造的初始数学题目和步骤2.24构造的变换步骤/>,得出生成原始数学题目的一般化数学模型/>;/>的表达式为:
;
其中,为/>的矩阵,/>为/>的矩阵,经过/>得到的原始数学题目为的矩阵;
根据章节所涉及知识点的提问方式,将/>得到的原始数学题目矩阵/>按照形式进行编码,存入题库数据表;
步骤2.5、逆序遍历步骤2.2所述的数学题目变换规则,生成数学题目解答步骤,记为;按照章节/>的数学题目解答步骤形式,对每个变换步骤进行编码,存入解答步骤数据表。
4.根据权利要求3所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤2.3中所述对变换步骤进行验证,具体包括以下步骤:
步骤2.31、对于步骤2.24构造出的变换步骤,做出如下约束:上三角变换的/>步和下三角变换的/>步变换之和加1等于数学题目刺激特征规定的/>步,即/>;
步骤2.32、由步骤2.24得出的变换步骤,共包含了前面/>个步骤,最后1个步骤就需要根据约束条件决定是否将倍乘或交换变换加入到变换步骤中,约束条件为:
初始数学题目经过步骤2.24所述的/>个倍加变换,记为/>;
如果中的第一行第一列元素/>为-1或1,并且第/>行第一列元素/> ,/>,满足时,变换步骤的最后一步就为交换,即将矩阵/>的第1行和第/>行进行交换,记为/>;/>的表达式为:/>;否则,当/>不满足上述条件时,则变换步骤/>的最后一步就为倍加变换,并且需要在步骤2.21所述的对/>进行下三角矩阵元素变换的/>步中随机抽取1步,使其满足步骤2.31所述关系;
随机抽取的1步也需满足按照步骤序号进行升序排列,且最小的序号应该大于中最大的序号,排列后的变换步骤的数学表达式为:
;
通过验证的变换步骤能够表示为:
。
5.根据权利要求3所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤2.5中所述生成数学题目解答步骤,具体包括以下步骤:
步骤2.51、将步骤2.32所得变换步骤进行水平反转;解答步骤/>与变换步骤/>存在关系:/>;其中,/>表示将/>进行水平反转;
步骤2.511、对原始数学题目的下三角元素进行变换,将倍加变换中的倍数取其相反数;将原来/>下三角变换中的第一步与第/>步反转,第二步与第/>步反转;于此类推,直至将第/>步与第/>步反转;
;
步骤2.512、对原始数学题目的上三角元素进行变换,将倍加变换中的倍数取其相反数;将原来/>上三角变换中的第一步与第/>步反转,第二步与第/>步反转;于此类推,直至将第/>步与第/>步反转;
;
步骤2.513、对变换步骤验证补充的最后一步也进行水平反转;其最后一步要为倍加变换,就将其倍数取相反数;
;
通过变换步骤水平反转后的解答步骤表达式为:
;
步骤2.514、由步骤2.41得到的数学题目和步骤2.512得到的解答步骤/>满足如下关系式:
;
步骤2.52、按照章节的题目解答步骤形式,对每个变换步骤进行编码,存入解答步骤数据表。
6.根据权利要求1所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤5中所述评价所生成数学题目的质量,具体方法如下:
步骤5.1、根据步骤1~步骤4,分别为不同章节编制一套数学题目,在同一套试题上将教材章节后提供的试题和自动生成的试题混合,并标定每个数学题目的刺激特征复杂度;然后随机抽取一个样本量为的已经学习过该数学课程的大学本科学生作为被试者对上述试题进行作答,并且收集被试者的作答结果;
步骤5.2、构建基于认知心理学和心理测量学相结合的数学题目认知复杂度测量模型;
步骤5.3、编制模型参数估计算法,根据步骤5.1中被试者的作答反应,估计出每个数学题目的题目参数;
步骤5.4、构造题目参数与题目特征的关联模型,估计出题目特征对题目参数的影响系数;
步骤5.5、将题目参数作为因变量,题目特征作为自变量,将步骤5.4中构造的关联模型代入步骤5.2中构建的测量模型中,得到认知复杂性模型;
步骤5.6、比较自动生成与教材课后习题之间的题目参数,验证自动生成的数学题目与教材课后习题之间的差异性;并利用步骤5.5得到的认知复杂性模型,分析影响被试作答的潜在认知因素;
步骤5.61、根据步骤5.3估计出的每个数学题目的题目参数,从区分度与难度两个维度比较计算机化自动生成的数学题目和教材中的课后习题在区分度、难度方面的差距大小;
步骤5.62:根据步骤5.5得出的认知复杂度模型,探查被试者在作答数学题目时的知识结构;通过认知复杂度模型能够直观看出导致作答结果不同的两个被试者在知识结构上的差异。
7.根据权利要求6所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤5.2中所述数学题目认知复杂度测量模型的构建过程如下:
步骤5.21、以Logistic潜在特质模型为基础,记为,改造该模型以生成只包含两个项目参数的Logistic潜在特质模型,记为/>,Logistic潜在特质模型/>的表达式为:
;
其中,表示被试者/>在第/>个章节的区分度为/>,难度为/>,猜测度为/>的数学题目/>上作答正确的概率;/>是Logistic潜在特质模型的分布函数,;/>表示第/>名被试者的能力;事件/>表示被试者/>答对了第/>个章节的第/>题;
令的参数/>可得/>;/>的表达式为:
;
与上述Logistic潜在特质模型相比,只包含两个项目参数的Logistic潜在特质模型/>表示被试者/>在第/>个章节题目区分度为/>,难度为/>的数学题目/>上作答正确的概率;其中被试者参数/>,项目参数/>,/>所表示的含义与/>中一致;/>就使得被试者/>答对第/>个章节第/>题的概率只取决于该题目的区分度和难度;
步骤5.22、把章节中题目所含刺激特征融入步骤5.21所构造的潜在特质模型/>;将/>中的题目区分度/>,用一组关于第/>个章节题目的刺激特征/>的线性组合模型来代替,/>;由/>替换后的/>记为/>;则/>的表达式为:
;
其中,为第/>个章节题目的/>个刺激特征对题目区分度的影响系数,;
用刺激特征的线性组合模型来代替题目难度/>,记为/>;/>的表达式为:
;
其中,为第/>个章节题目的/>个刺激特征对题目难度的影响系数,;
将,/>分别替换步骤2.21所述的潜在特质模型/>中的/>,/>,得到认知复杂度模型/>;/>的表达式为:
。
8.根据权利要求6所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤5.3中所述被试者的作答反应,估计出每个数学题目的题目参数,具体过程如下:
步骤5.31、构建关于数学题目参数的计算公式;
按照步骤5.1所述在同一套试题上将教材章节后提供的试题和自动生成的试题混合组成长度为的测验试题;/>名被试者的能力分别记为/>,数学题目参数分别为:区分度参数/>,难度参数/>,/>;
将名被试者的作答结果,记为/>,/>中的一行表示一个被试者,一列表示一道数学题目;为便于计算,将被试者对于数学题目的作答反应采用二级记分模式,即;则第/>行记为/>,/>;那么,/>对/>的条件分布,记为/>;/>的表达式为:
;
假设名被试者都服从同一分布,且这/>名被试者的能力的先验分布已知,记为/>;就可得出边缘分布:
;
由上述边缘分布可得关于数学题目参数的边缘似然函数,记为;/>的表达式为:;
同时根据上述边缘分布和连续型Bayes公式,可推出被试者能力参数对/>的后验分布,记为:
;
对上述边缘似然函数取对数并对求偏导,令其等于0,得到边缘对数似然方程:
;
将上述被试者能力参数对/>的后验分布/>代入/>,可得:
;
求解上式可得:
;
同理可得的表达式为:
;
根据Gauss-Hermite数值积分公式,可将上述和/>的表达式化为数值积分的形式;变化后的/>和/>的表达式为:
;
;
其中,,
并且如果记,则/>表达式进一步可推出:
;
其中,,/>为第/>个章节下的题目数;/>,/>,/>,前者为用随机变量/>来表示数值积分的求积结点,后者为求积系数;
由Hermite多项式可知,是其多项式/>的根;
其中,将/>代入/>,并令其等于0,解出/>的值,即为;将/>代入求积系数/>,即可求出系数的值;
记个被试者中期望具有能力为/>的被试人数为/>;能力为/>的被试期望答对第/>章的第/>题的人数为/>;则根据Bock关于题目间独立,被试独立以及题目与被试独立的假设可得:
;/>
;
由此上述和/>就可被进一步用/>和/>替换为:
;
;
步骤5.32、构造被试者作答数据和被试者能力参数/>组成完全数据的极大似然函数,并求其后验期望;
将个被试者能力/>划分到/>个组/>;任取一个被试者/>,其能力/>的可能性为/>;取完所有被试者,能力/>取到这/>个组能力的可能性之和就为:/>;
用表示被试者能力属于第/>种能力的数量,则根据多项分布的定义有:
;
用来表示具有第/>种能力的被试者,答对第/>个章节的第/>题的概率,则可根据概率公式推导出/>的表达式:
;
其中,表示答对第/>章的第/>题,且能力属于/>的被试者数量,用随机变量/>表示该被试者的数量;
由式(54)可进一步得出具有第种能力的被试者刚好有/>答对第/>章的第/>题的概率,/>;
;
联立上述和/>两式;可得/>和/>的联合概率为:
;
其中,上式所得就为关于数学题目参数的似然函数;忽略/>的常数项,取/>的对数,得到/>;/>的表达式为:
;
用表项目参数,则/>的期望值就为:
;
步骤5.33、通过整合步骤5.31构造的数学题目参数计算公式以及步骤5.32构造的完全数据后验期望估计数学题目参数;
步骤5.331、通过数学题目参数分布给出初始数学题目参数,以及数值积分的求积结点/>;计算由步骤5.31所述的/>的值;
步骤5.332、给定随机变量的下角标/>,/>;然后计算由步骤5.32推导出的后验概率/>;
步骤5.333、对给定的,计算/>个被试者中期望具有能力为/>的被试人数为/>,以及能力为/>的被试者期望答对第/>章的第/>题的人数/>;
步骤5.334、用牛顿-拉夫逊迭代方法求解由步骤5.31推导出的含有和/>的数学题目参数/>和/>,得到数学题目参数估计值,即/>和/>;
步骤5.335、分别将和/>和代入步骤5.31推导出的数学题目参数的边缘似然函数/>,所得结果记为/>和/>;计算/>和/>的差值/>;
步骤5.336、两数差值,则此时/>就为估计出的数学题目参数;否则就令/>,/>,重复执行步骤5.331~步骤5.335;经过多次迭代更新得到每个数学题目的题目参数。
9.根据权利要求6所述的一种数学题目及其解答过程的生成方法,其特征在于,步骤5.4中所述构造题目参数与题目特征的关联模型,估计出题目特征对题目参数的影响系数,具体包括以下步骤:
步骤5.41、从数学题目的区分度和难度两个维度出发,来评估生成数学题目的质量;构建关于题号、题目特征、题目参数/>和/>的数学题目数据表,其中一行表示一道数学题目,一列表示数学题目的特征信息;
步骤5.42、根据步骤5.41中所得数学题目数据表,分别构造题目参数,/>与题目特征的关联模型;
假定因变量与自变量/>线性相关,收集到的/>组数据/>,,/>满足以下关联模型:
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是由步骤5.3估计出的数学题目区分度参数,/>是不可观测的随机变量;/>是题目特征对数学题目区分度的影响程度、/>是未知参数,是题目特征矩阵,并设/>,且/>;
同理,因变量与自变量/>同样满足以下关联模型:
;
将上述关联模型用矩阵形式表示,则有:
;
其中,是由步骤5.3估计出的数学题目难度参数,/>是题目特征对数学题目难度的影响程度;其它符号定义与上述关联模型一致;
步骤5.43、重复步骤1.16~步骤1.18,分别估计出题目特征对数学题目区分度参数与数学题目难度参数/>的权值/>和/>,以及显著性程度。/>
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311541028.1A CN117251533B (zh) | 2023-11-20 | 2023-11-20 | 一种数学题目及其解答过程的生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311541028.1A CN117251533B (zh) | 2023-11-20 | 2023-11-20 | 一种数学题目及其解答过程的生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117251533A CN117251533A (zh) | 2023-12-19 |
CN117251533B true CN117251533B (zh) | 2024-01-30 |
Family
ID=89135435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311541028.1A Active CN117251533B (zh) | 2023-11-20 | 2023-11-20 | 一种数学题目及其解答过程的生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117251533B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846975A (zh) * | 2015-12-07 | 2017-06-13 | 刘满根 | 一种k12阶段数据处理及学生学习情况的智能诊断方法 |
CN110414683A (zh) * | 2019-07-02 | 2019-11-05 | 科大讯飞股份有限公司 | 数学题解答方法及装置 |
CN113743083A (zh) * | 2021-09-06 | 2021-12-03 | 东北师范大学 | 一种基于深度语义表征的试题难度预测方法及系统 |
CN116884006A (zh) * | 2022-12-19 | 2023-10-13 | 慧之安信息技术股份有限公司 | 结合视觉扫描识别与纠正的数学解题方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124464A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | Rapid predictive analysis of very large data sets using the distributed computational graph |
-
2023
- 2023-11-20 CN CN202311541028.1A patent/CN117251533B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846975A (zh) * | 2015-12-07 | 2017-06-13 | 刘满根 | 一种k12阶段数据处理及学生学习情况的智能诊断方法 |
CN110414683A (zh) * | 2019-07-02 | 2019-11-05 | 科大讯飞股份有限公司 | 数学题解答方法及装置 |
CN113743083A (zh) * | 2021-09-06 | 2021-12-03 | 东北师范大学 | 一种基于深度语义表征的试题难度预测方法及系统 |
CN116884006A (zh) * | 2022-12-19 | 2023-10-13 | 慧之安信息技术股份有限公司 | 结合视觉扫描识别与纠正的数学解题方法和系统 |
Non-Patent Citations (1)
Title |
---|
标准参照测验分数报告中子分数估计方法;宋丽红,汪文义,丁树良;江西师范大学学报;第44卷(第3期);292-300 * |
Also Published As
Publication number | Publication date |
---|---|
CN117251533A (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Cognitive modelling for predicting examinee performance | |
CN107657559A (zh) | 一种中文阅读能力测评方法及系统 | |
Lu et al. | Slice–Gibbs sampling algorithm for estimating the parameters of a multilevel item response model | |
Muldyagin | The Correlation between the Interest in Practicing English Conversation and Speaking Fluency of English Department Students of Pasundan University. Deago Helgy Muldyagin (127010044) | |
Daumiller et al. | Teaching quality in higher education: Agreement between teacher self-reports and student evaluations. | |
Evangelinos et al. | An investigation of teaching and learning about measurement data and their treatment in the introductory physics laboratory | |
CN117251533B (zh) | 一种数学题目及其解答过程的生成方法 | |
Bolsinova et al. | Using expert knowledge for test linking. | |
Mustofa et al. | Perceived Behavioral Control Builds Students' Entrepreneurial Intentions | |
Nuankaew et al. | Institution recommendation using relationship optimisation between program and student context | |
CN117556381B (zh) | 一种面向跨学科主观试题的知识水平深度挖掘方法及系统 | |
Ustinova et al. | Performance criteria of learning math tests | |
Qin et al. | Exploration of polytomous-attribute Q-matrix validation in cognitive diagnostic assessment | |
Arafiyah et al. | Monitoring online learners’ performance based on learning progress prediction | |
Li | Estimation of Q-matrix for DINA Model Using the Constrained Generalized DINA Framework | |
Holgado-Tello et al. | Robust estimation methods in confirmatory factor analysis of Likert scales: A simulation study | |
Sukajaya et al. | Classification of Students' Mathematics Learning Achievement on Bloom's Taxonomy-Based Serious Game Using Ordinal Logistic Regression | |
Uyumaz | THE IMPACT OF Q MATRIX MISSPECIFICATION ON ITEM PARAMETERS AND CLASSIFICATION ACCURACY IN THE DINA MODEL | |
Wijaya et al. | Application of Data Mining using Naive Bayes for Student Success Rates in Learning | |
Perozo et al. | Bayesian Multi-Faceted TRI Models for Measuring Professor's Performance in the Classroom | |
Zheng | Latent growth curve analysis with item response data: Model specification, estimation, and panel attrition | |
Taktak et al. | Agile School Scale: Validity and Reliability Study | |
Maulida et al. | LEARNING PROCESS ANALYSIS MIS GUPPI PADANG HILIR (Using a Multivariate Analysis Approach) | |
Sari et al. | Empowering Educators: The Impact of Principal Leadership and Supervision on Teacher Performance at Ulu Tulisi Private Madrasah Aliyah | |
Akürek et al. | A Nano Topology Based Assessment with Parameter Reduction in Mathematics Education |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |