CN112182172A - 基于粒子群遗传算法的组卷方法、系统、装置及介质 - Google Patents
基于粒子群遗传算法的组卷方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN112182172A CN112182172A CN202011007300.4A CN202011007300A CN112182172A CN 112182172 A CN112182172 A CN 112182172A CN 202011007300 A CN202011007300 A CN 202011007300A CN 112182172 A CN112182172 A CN 112182172A
- Authority
- CN
- China
- Prior art keywords
- particle swarm
- particles
- particle
- question
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002245 particle Substances 0.000 title claims abstract description 258
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000002068 genetic effect Effects 0.000 title claims abstract description 43
- 238000012360 testing method Methods 0.000 claims description 158
- 230000006870 function Effects 0.000 claims description 44
- 108090000623 proteins and genes Proteins 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 27
- 238000009826 distribution Methods 0.000 claims description 7
- 101150010487 are gene Proteins 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 108700028369 Alleles Proteins 0.000 claims description 4
- 238000005457 optimization Methods 0.000 abstract description 8
- 230000035772 mutation Effects 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000012634 fragment Substances 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013142 basic testing Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明的提供了基于粒子群遗传算法的组卷方法、系统、装置及介质,方法在粒子群算法中融入遗传操作;粒子群中的粒子不通过速度和位置更新粒子个体,采用交叉操作和自身的变异操作进行更新。粒子进行交叉操作的对象来自于每次迭代中,根据目标函数比较适应度值而得出的个体极值和群体极值。通过两算法的结合进行优化的基础上,还采用基于知识点、题型和分数等参数,以不完全随机方式对种群初始化,以及分段实数编码等方法进一步提高算法的可行性和高效性。本发明方法可广泛应用于智能组卷技术领域。
Description
技术领域
本发明属于智能组卷技术领域,尤其是基于粒子群遗传算法的组卷方法、系统、装置及介质。
背景技术
目前,计算机技术被广泛应用于各个领域,尤其是与教育模式的结合,大大弥补了传统教学流程和学习方式上的缺陷,人们可通过互联网远程在线学习,使学习不受空间和时间限制,降低了学习成本。相比起传统教学模式,网络教育也减少了学生、老师之间信息反馈的时间成本。
经过近年来国内高校的努力研究与探索,开发了如全国计算机等级考试等其它功能完善的在线考试系统。另外,许多在线教育平台也涵盖了在线考试功能,着力给师生提供完善的教育资源。
人工智能化考试组卷,是完成在线考试高效性的核心所在专业技术之一。人工智能考试组卷,就是根据已定的组卷要求,从题库里抽取适合测试试题构成试卷的过程。解决这类多目标组合问题的策略,通常划分为如下两大类:一、传统组卷策略,例如随机抽取法。随机抽取法是按照预设参数,不断从题库随机抽取满足要求的试题,直到整个组卷工作结束。有学者在此算法基础上,提出了一种基于知识点与难度的随机组卷算法,根据用户设置的知识点与难度系数抽题,提高了组卷质量,但存在重复抽取无效试题的现象,故组卷时间长,组卷成功率不高。二、智能组卷策略,例如遗传算法。该算法将组卷问题模拟成生物进化过程,对测试试题展开程序编码,随机生成规模合适的初始种群,通过适应度运算函数,对初始种群进行优劣评测,并且通过选择、交叉与变异操作应用,生成新一代群体,重复这个运算过程,当算法达到迭代数目或者符合考试组卷需求的时候,适应度值最高的个体也就是最优试卷。有学者将遗传算法进行改进,通过优化遗传算子提高最优个体的适应度,从而提高了组卷效率。但在迭代初期优化效果并不明显,算法收敛速度慢,组卷时间长。
发明内容
有鉴于此,为部分解决上述技术问题之一,本发明实施例目的在于提供一种高效可行的基于粒子群遗传算法的组卷方法;同时,本发明的实施例还提供可对应执行该组卷方法的系统、装置以及介质。
第一方面,本发明实施例提供了基于粒子群遗传算法的组卷方法,其包括以下步骤:
获取组卷需求的参数集,根据参数集构建组卷模型;根据组卷模型确定目标函数;
根据知识点从原始题库中筛选试题构成若干子题库,对子题库中的试题进行编码,并将编码完成后的试题根据题型进行分段归置,得到试题基因片段;
根据目标函数遍历试题基因片段,生成第一粒子群;其中,第一粒子群中的粒子为子题库中的基因片段;
根据目标函数生成第一粒子群中粒子的适应度值;在第一粒子群中进行极值交叉,得到第二粒子群,第二粒子群中粒子的适应度值大于第一粒子群;
根据子题库,将第二粒子群中的粒子进行试题替换,得到第三粒子群;输出第三粒子群中最高适应度值的粒子,得到试题集。
在本发明的一些实施例中,适应度值的生成过程,具体包括以下步骤:
获取粒子中试题的特征参数,粒子的来源为以下三者至少之一:第一粒子群、第二粒子群以及第三粒子群;
根据特征参数以及组卷需求的参数集,生成参数偏差值;
确定偏差值的权重,根据权重以及目标函数确定适应度值。
在本发明的一些实施例中,根据目标函数遍历试题基因片段,生成第一粒子群这一步骤,其具体包括:
根据试题类型,在子题库中进行无放回的抽取,得到粒子,根据若干粒子组合得到第一粒子群;试题类型包括以下至少之一:单选题、多选题、判断题、填空题以及主观题。
在本发明的一些实施例中,在第一粒子群中进行极值交叉,得到第二粒子群这一步骤,其具体包括:
生成第一粒子群的粒子的第一概率值;
根据预设的交叉率,确定交叉率大于第一概率值;从第一粒子群中获取第一粒子以及粒子极值个体;粒子极值个体为粒子群中最高适应度值的粒子;
确定第一粒子与粒子极值个体不存在等位基因;交换第一粒子与粒子极值个体中的基因片段;生成第二粒子群。
在本发明的一些实施例中,粒子极值个体的极值包括个体粒子极值以及群体粒子极值。
在本发明的一些实施例中,根据子题库,将第二粒子群中的粒子进行试题替换,得到第三粒子群这一步骤,其具体包括:
生成第二粒子群的粒子的第二概率值;
根据预设的变异率,确定变异率大于第二概率值;从子题库中获取试题替换第二粒子群的粒子的试题,生成第三粒子群。
在本发明的一些实施例中,组卷需求的参数集包括以下至少之一:试卷能力层次分布、试卷难度系数、试卷知识点、试卷题型分数分布以及期望分数。
第二方面,本发明的技术方案还提供基于粒子群遗传算法的组卷系统,包括参数获取单元、基因编码单元、种群初始化单元、交叉操作单元、变异操作单元以及组卷输出单元,其中:
参数获取单元,用于获取组卷需求的参数集,根据参数集构建组卷模型;根据组卷模型确定目标函数;
基因编码单元,用于根据知识点从原始题库中筛选试题构成若干子题库,对子题库中的试题进行编码,并将编码完成后的试题根据题型进行分段归置,得到试题基因片段;
种群初始化单元,用于根据目标函数遍历试题基因片段,生成第一粒子群;第一粒子群中的粒子为子题库中的基因片段;
交叉操作单元,用于根据目标函数生成第一粒子群中粒子的适应度值;在第一粒子群中进行极值交叉,得到第二粒子群,第二粒子群中粒子的适应度值大于第一粒子群;
变异操作单元,用于根据子题库,将第二粒子群中的粒子进行试题替换,得到第三粒子群;
组卷输出单元,用于输出第三粒子群中最高适应度值的粒子,得到试题集。
第三方面,本发明的技术方案还提供基于粒子群遗传算法的组卷装置,其包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当至少一个程序被至少一个处理器执行,使得至少一个处理器实现第一方面中的基于粒子群遗传算法的组卷方法。
第四方面,本发明的技术方案还提供了一种存储介质,其中存储有处理器可执行的程序,处理器可执行的程序在由处理器执行时用于实现如第一方面的方法。
本发明的优点和有益效果将在下面的描述中部分给出,其他部分可以通过本发明的具体实施方式了解得到:
本发明实施例的所提供的技术方案,通过构建组卷模型以及确定目标函数的方式组成试卷,可以更加清楚地展示试卷的特征;同时方案结合了粒子群算法和遗传算法各自的优点,组卷成功率较其它算法更高,在迭代过程中呈缓慢收敛趋势,避免出现因收敛速度过快而陷入局部最优解的情况,使得最终得出的试卷质量更高,更符合用户要求。总体来说,本发明所提供的技术方案相较于其它组卷方法性能更优。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于粒子群遗传算法的组卷方法的步骤流程图;
图2为本发明实施例中试题基因编码方式的示意图;
图3为本发明实施例中不重复随机数列生成算法原理示意图;
图4为本发明实施例中交叉操作过程示意图;
图5为本发明实施例中编译操作过程示意图;
图6为本发明实施例基于粒子群遗传算法的组卷装置的示意图。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
遗传算法,是将组卷问题模拟成生物进化过程,对测试试题展开程序编码,随机生成规模合适的初始种群,通过适应度运算函数,对初始种群进行优劣评测,并且通过选择、交叉与变异操作应用,生成新一代群体,重复这个运算过程,当算法达到迭代数目或者符合考试组卷需求的时候,适应度值最高的个体也就是最优试卷。有学者将遗传算法进行改进,通过优化遗传算子提高最优个体的适应度,从而提高了组卷效率。但在迭代初期优化效果并不明显,算法收敛速度慢,组卷时间长。
粒子群算法,是模拟鸟类觅食来获取最优具体位置。首先随机抽取试题生成初始种群作为可行解,每一个粒子依据适应度函数记录自身最优值与整个种群最优值,经过这两个数值更新调整自己的速率与位置,持续迭代更新,当算法结束时,适应度值最大的粒子即为最优试卷。有学者将粒子群算法进行优化,即在寻优早期对粒子群进行前期调和,使粒子群均匀分散在问题解空间中,再与标准遗传算法结合,组卷效率高,但在迭代过程中,收敛速度较慢,收敛效率有待改进。现有技术提出过结合粒子群算法和改进后的遗传算法,并利用贪心算法优化初始种群,避免粒子陷入局部最优解,组卷成功率高,但其采用的二进制编码会存在映射误差,不利于算法得到最优解。
本发明实施例所提供的技术方案的核心构想是,结合遗传算法和粒子群算法的优势,在粒子群算法中融入遗传操作,粒子群中的粒子不通过速度和位置更新自己,而采用交叉操作和自身的变异操作进行更新。粒子进行交叉操作的对象来自于每次迭代中,根据目标函数比较适应度值而得出的个体极值和群体极值。通过两种算法的结合进行优化的基础上,还采用基于知识点、题型和分数等参数,以不完全随机方式对种群初始化,以及分段实数编码等方法进一步提高算法的可行性和高效性。
在第一方面,如图1所示,本发明实施例提供的基于粒子群遗传算法的组卷方法,其主要包括步骤S01-S05:
S01、获取组卷需求的参数集,根据参数集构建组卷模型;根据组卷模型确定目标函数。具体地,组卷问题其本质上为一个多约束条件的组合优化问题。一份标准试卷,一般要求紧跟测评考试大纲,试题难度适当且具有一定的可区分性,能考查应试者的知识储备量。试卷由试题组成,试题本身包含一些固有的特征参数,通过建立指标体系可以更清楚地显示试卷的特征。步骤S01中,组卷需求的参数集的特征参数包括但不限于:试卷难度参数、试卷区分度、试卷信度、试卷效度、试卷能力层次以及知识点覆盖率。
其中,考试卷难度参数反应测试试题的难易水平,也就是考生在试卷上的失分水平:
在计算式(1)中,ki、Pi代表第i题的分数与难度参数,K代表考试卷总分,m代表试卷的总题量。由计算式(1)可知,难度系数越大,试卷实际难度越小。
试卷区分度是用来识别和区分考生解决问题能力的指标。通过测试结果,可将考生的能力水平划分为不同等级:
在计算式(2)中,Qi为第i题的区分度。如果全体考生的成绩在某一分数范围内相对集中,则表明试卷区分度较低。
试卷信度是指试卷的可行性,也就是测试最终结果的稳定可靠程度:
在计算式(3)中,m代表总题量,S2代表考试卷总分的方差,pi代表第i题的考试通过率,C表示信度系统。例如,当C<0.7时,说明该试卷不可信。
试卷效度是是通过试卷测试结果反映试卷质量的指标。即通过测试成绩验证该试卷是否达到了期望目的,如区分度、难度系数是否合理:
在计算式(4)中,Yi与Zi依次是第i个考生的考试成绩。Sy、Sz、Y′、Z′为2次测评考试的参考标准差和平均值,Pt为考试总人数;例如在实施例中,设置r需要超过0.4。
更为具体地,在本实施例中,为满足用户设定条件的最优试卷,根据参数集构建组卷模型过程中,将一份试卷转换成一个m×n矩阵,其中,试卷总题量为m,每道试题有n个属性,矩阵中的元素aij表示第i题的第j个属性,矩阵表示为:
例如,当选取n=5时,即设置5个试题属性,五个试题属性分别选择为试题的分值、题型、难度系数、知识点、教学能力层次等属性。目标矩阵S应满足的约束条件及其计算公式包括:
a)试卷总分。m为总题量,ai1为第i题的分数,则有:
b)试卷题型与分数:
c)试卷难度系数与分数:
在计算式(8)中,f1i是每一题难度系数。
d)试卷能力层次及分数,同一知识点下的不同能力层次的试题更能反映考生的能力水平。Ak代表第k级别,k是级别号,C是教学能力层次,可包括但不限于:识记、理解、简单应用、综合运用、创新能力。每个知识点都有相应的能力层次要求。具体试卷的能力层次等级分值为:
e)知识点覆盖率:
在计算式(10)中,r1指试卷含有知识点数,r2代表用户希望的知识点数。知识点覆盖率越大,表明越达到用户期望。
S02、根据知识点从原始题库中筛选试题构成若干子题库,对子题库中的试题进行编码,并将编码完成后的试题根据题型进行分段归置,得到试题基因片段;具体地,在获得最优解即最优选的组卷结果前,首先要确定群体粒子的编码方式。实施例中,采用分段实数编码机制,区别于二进制编码需要将表现型和基因型进行双向转换,本实施例用一个唯一的编号即可作为一道试题的编码,试题按照题型分类后,分段归置,即同一段编码上的试题为同一题型。分段实数编码机制大大减小了基因长度,且不同题型间可独立操作,互不干扰,确保了题型匹配的可靠性,有效提高了搜索效率。
更为具体地,实施例设置五种题型,分别用C、M、T、F、S表示单选题、多选题、判断题、填空题和主观题,每类题型所生成的题目数量分别为m1、m2、m3、m4、m5,则生成的试卷编码如图2基因编码方式图所示。
S03、根据目标函数遍历试题基因片段,生成第一粒子群;第一粒子群中的粒子为子题库中的基因片段;具体地,本实施例中,设置种群规模数为30,为了解决抽题过程中容易反复选取无效试题这一问题,保证初始化结束后每个个体符合最基本的试卷要求,便于在后期的遗传操作过程中,减少迭代次数,提高系统效率。采用不重复随机数列生成算法作为解决方案。该算法利用随机数的生成特点,将已经抽取的试题号,排除在随机区间之外,使得选题过程一直在抽取不重复试题的前提下进行。
如图3所示,更为具体地,步骤S03可进一步细分为步骤S031-S032:
S031、根据目标函数遍历试题基因片段,生成子题库;即根据目标函数中所包含的具体参数,例如题型、分数、难度系数、知识点等。先从数据库中取出该课程下的所有试题,再根据试题的知识点是否为用户需要的知识点的子集,对试题进行遍历,取出所有符合用户期望知识点的试题,得到小题库,即为子题库。
S032、根据试题类型,在子题库中进行无放回的抽取,得到粒子,根据若干粒子组合得到第一粒子群;其中,试题类型包括但也不仅限于:单选题、多选题、判断题、填空题以及主观题。根据题型等条件遍历小题库,实施例中采用无放回的随机抽样方法,如图3所示:
(1)选取1-5号试题存入数组,如图3中的(a)列所示;
(2)生成一个随机数R作为数组下标,例如R为2,则选取图3中的(b)列中的试题号3存入新数组,并将原数组中最后一个有效的题号5与题号3交换,将产生随机数的范围减小1,如图3中的(b)列和图3中的(c)列所示;
(3)重复(2)过程,直到产生的题号数量达到要求,即得到第一粒子群,应当理解的是,在第一粒子群中的粒子即为通过无放回地随机抽样得到的试题。
方法利用数组的特点,使得抽题过程的时间复杂度仅为线性阶O(n),不存在重复抽取同一试题的现象,且删除操作可通过交换数组元素来实现。
在此需要进行补充说明的是:本实施例方法引入适应度的概念,适应度值的生成过程,具体包括以下步骤:
获取粒子中试题的特征参数,其中粒子的来源为各个过程或步骤中的粒子群;根据特征参数以及组卷需求的参数集,生成参数偏差值;确定偏差值的权重,根据权重以及目标函数确定适应度值。具体地,实施例在抽取题目进行组卷时,会保证试卷的各题型分数和总分为用户的期望分数,因此只需要考虑其它约束条件。例如:A代表试卷的能力层次分布,D代表试卷难度系数,R代表知识点覆盖率,由于组卷结果往往与用户期望存在偏差,偏差值分别为EA、ED、ER,计算公式由式(11)至(13)所示:
ER=1-R (13)
在公式(11)至(13)中,试卷能力层次的总个数用m1表示,能力层次为i的期望分数用Ai表示;另外,D、M、R分别由公式(8)、公式(6)与公式(10)计算得到。UD是用户希望的试卷难度参数。
因组卷问题是多约束问题,所以组卷约束条件不可能全满足。应根据实际情况忽略部分次要指标,获得近似最优解即可。本文中智能组卷问题的目标函数F,为所有约束条件的差值加权和的最小值函数(0≤F≤1),即F越接近1,越达到用户期望。目标函数F为:
F=1-(w1×EA+w2×ED+w3×ER)(14)
在公式(14)中,wi表示第i个约束条件的权重值。由公式(14)可知,各约束的权重分配能够引导组卷过程中的侧重方向,对组卷结果直接产生影响,因此需要合理分配。实施例应用层次分析法(AHP)来调配比例权重数值;例如,通过该方法得出w1=0.14,w2=w3=0.43。
S04、根据目标函数生成第一粒子群中粒子的适应度值;在第一粒子群中进行极值交叉,得到第二粒子群,第二粒子群中粒子的适应度值大于第一粒子群;具体地,实施例中对第一粒群中的粒子进行分段离散交叉的交叉操作处理,当随机概率数低于交叉率的时候,子个体的每一个遗传基因等概率随机地选用父个体的遗传基因。而步骤中的粒子适应度值通过公式(14)计算得到,而适应度值直接反映了试卷的质量高低情况。
本实施例通过个体粒子与这两个极值进行交叉操作,来实现粒子群向全局最优解的移动,为了提高算法效率,可对该离散交叉操作的选择过程加条件限制,例如,在本实施例中,交叉率设置为0.95。在迭代更新过程中会利用适应度函数计算每一代粒子群的适应度值,其中适合度值最大的粒子,是群体极值,即表示该粒子在群体中是最优个体,解码后的试卷即为最优试卷,而个体极值就是粒子自身在持续自动更新调整过程里产生的适合度值最大的情况。更为具体地,以个体与个体极值交叉为例,步骤S04可进一步细分为:
S041、生成第一粒子群的粒子的第一概率值;具体地,即生成一随机数R1。
S042、根据预设的交叉率,确定交叉率大于第一概率值;从第一粒子群中获取第一粒子以及粒子极值个体;粒子极值个体为最高适应度值的粒子;如图4所示,粒子个体中某一类型编码段长度为s1,当随机数R1小于交叉率时,依次选择个体、个体极值的等位基因g1,g2。
S043、确定第一粒子与粒子极值个体不存在等位基因;交换第一粒子与粒子极值个体中的基因片段;生成第二粒子群。具体地,g1,g2分值相等且不存在重合现象,生成第二个随机数R2当随机数R2>0.5时,新个体的基因来自于g2,否则来自于g1。得到的新的粒子个体组成第二粒子群。
步骤S04可使生成的新个体的所有基因都唯一,即同一试卷的题目不存在重复现象。如果交叉操作应用之后的粒子的适应度值,高于以前的适应度值,则自动更新粒子,反之不进行调整。
S05、根据子题库,将第二粒子群中的粒子进行试题替换,得到第三粒子群;输出第三粒子群中最高适应度值的粒子,得到试题集。实施例采用分段变异模式,也就是变异操作在每一类题型与对应的程序编码段内展开。如图5所示,以第二粒子群中某粒子个体的单选题为例,将变异率设置为0.01,步骤S05可进一步具体为:
S051、生成第二粒子群的粒子的第二概率值,即生成随机数R3为第二概率值。
S052、根据预设的变异率,确定变异率大于第二概率值;从子题库中获取试题替换第二粒子群的粒子的试题,生成第三粒子群。具体地,选取第二粒子群中某粒子个体中某一题型编码段长度为s2,当随机数R3小于变异率时,确定变异位置;获得步骤S051的变异位置上的基因,即题号,进一步得到题目信息,并获取与该题目相同题型、分值且知识点为包含关系的题目集,即对应的子题库;在题目集中随机选择一个题目,用此题目的题号替换步骤S051中被确定的题号。
当迭代次数未达到规定的值时,循环步骤S04和步骤S05,直到迭代次数达到规定的值时,迭代结束。例如,实施例中设置迭代次数为100次。当达到迭代次数时,选择粒子群中适应度值最大的粒子作为最优个体进行输出,得到对应的试卷。
第二方面,本发明实施例提供了基于粒子群遗传算法的组卷系统,包括参数获取单元、基因编码单元、种群初始化单元、交叉操作单元、变异操作单元以及组卷输出单元,其中:
参数获取单元,用于获取组卷需求的参数集,根据参数集构建组卷模型;根据组卷模型确定目标函数;
基因编码单元,用于根据知识点从原始题库中筛选试题构成若干子题库,对子题库中的试题进行编码,并将编码完成后的试题根据题型进行分段归置,得到试题基因片段;
种群初始化单元,用于根据目标函数遍历试题基因片段,生成第一粒子群;第一粒子群中的粒子为子题库中的基因片段;
交叉操作单元,用于根据目标函数生成第一粒子群中粒子的适应度值;在第一粒子群中进行极值交叉,得到第二粒子群,第二粒子群中粒子的适应度值大于第一粒子群;
变异操作单元,用于根据子题库,将第二粒子群中的粒子进行试题替换,得到第三粒子群;
组卷输出单元,用于输出第三粒子群中最高适应度值的粒子,得到试题集。
第三方面,如图6所示,本发明实施例还提供基于粒子群遗传算法的组卷装置的实施例,其包括至少一个处理器;至少一个存储器,用于存储至少一个程序;当至少一个程序被至少一个处理器执行,使得至少一个处理器实现如第一方面中的基于粒子群遗传算法的组卷方法。
本发明实施例还提供了一种存储介质内存储有程序,程序被处理器执行如第一方面中的方法。
从上述具体的实施过程,可以总结出,本发明所提供的技术方案相较于现有技术存在以下优点或优势:
1.本发明所提供的实施例,采用合理的智能组卷策略,使得用户只要输入组卷的相关参数包括但不限于试卷题型及各题型分数、试卷难度系数、试卷知识点分布、试卷能力层次分布,通过该策略生成的试卷能最大程度满足用户的期望。
2.本发明所提供的实施例,相比起现有的智能组卷算法,本发明方法结合了粒子群算法和遗传算法各自的优点,组卷成功率较其它算法更高,算法在迭代过程中呈缓慢收敛趋势,避免了现有技术方法出现的因收敛速度过快而陷入局部最优解的情况,使得最终得出的试卷质量更高。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
其中,功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.基于粒子群遗传算法的组卷方法,其特征在于,包括以下步骤:
获取组卷需求的参数集,根据所述参数集构建组卷模型;根据所述组卷模型确定目标函数;
根据知识点从原始题库中筛选试题构成若干子题库,对所述子题库中的试题进行编码,并将编码完成后的试题根据题型进行分段归置,得到试题基因片段;
根据所述目标函数遍历所述试题基因片段,生成第一粒子群;所述第一粒子群中的粒子为所述子题库中的基因片段;
根据所述目标函数生成所述第一粒子群中粒子的适应度值;在所述第一粒子群中进行极值交叉,得到第二粒子群,所述第二粒子群中粒子的适应度值大于所述第一粒子群;
根据所述子题库,将所述第二粒子群中的粒子进行试题替换,得到第三粒子群;输出所述第三粒子群中最高适应度值的粒子,得到试题集。
2.根据权利要求1所述的基于粒子群遗传算法的组卷方法,其特征在于,所述适应度值的生成过程,具体包括以下步骤:
获取粒子中试题的特征参数,所述粒子的来源为以下三者至少之一:第一粒子群、第二粒子群以及第三粒子群;
根据所述特征参数以及所述组卷需求的参数集,生成参数偏差值;
确定所述偏差值的权重,根据所述权重以及所述目标函数确定所述适应度值。
3.根据权利要求1所述的基于粒子群遗传算法的组卷方法,其特征在于,所述根据所述目标函数遍历所述试题基因片段,生成第一粒子群这一步骤,其具体包括:
根据试题类型,在所述子题库中进行无放回的抽取,得到粒子,根据若干所述粒子组合得到所述第一粒子群;所述试题类型包括以下至少之一:单选题、多选题、判断题、填空题以及主观题。
4.根据权利要求1所述的基于粒子群遗传算法的组卷方法,其特征在于,所述在所述第一粒子群中进行极值交叉,得到第二粒子群这一步骤,其具体包括:
生成所述第一粒子群的粒子的第一概率值;
根据预设的交叉率,确定所述交叉率大于所述第一概率值;从第一粒子群中获取第一粒子以及粒子极值个体;所述粒子极值个体为粒子群中粒子的最高适应度值的粒子;
确定所述第一粒子与所述粒子极值个体不存在等位基因;交换所述第一粒子与所述粒子极值个体中的基因片段;生成第二粒子群。
5.根据权利要求4所述的基于粒子群遗传算法的组卷方法,其特征在于,所述粒子极值个体的极值包括个体粒子极值以及群体粒子极值。
6.根据权利要求3所述的基于粒子群遗传算法的组卷方法,其特征在于,所述根据所述子题库,将所述第二粒子群中的粒子进行试题替换,得到第三粒子群这一步骤,其具体包括:
生成所述第二粒子群的粒子的第二概率值;
根据预设的变异率,确定所述变异率大于所述第二概率值;从所述子题库中获取试题替换所述第二粒子群的粒子的试题,生成第三粒子群。
7.根据权利要求1-6任一项所述的基于粒子群遗传算法的组卷方法,其特征在于,所述组卷需求的参数集包括以下至少之一:试卷能力层次分布、试卷难度系数、试卷知识点、试卷题型分数分布以及期望分数。
8.基于粒子群遗传算法的组卷系统,其特征在于,包括参数获取单元、基因编码单元、种群初始化单元、交叉操作单元、变异操作单元以及组卷输出单元,其中:
所述参数获取单元,用于获取组卷需求的参数集,根据所述参数集构建组卷模型;根据所述组卷模型确定目标函数;
所述基因编码单元,用于根据知识点从原始题库中筛选试题构成若干子题库,对所述子题库中的试题进行编码,并将编码完成后的试题根据题型进行分段归置,得到试题基因片段;
所述种群初始化单元,用于根据所述目标函数遍历所述试题基因片段,生成第一粒子群;
所述第一粒子群中的粒子为所述子题库中的基因片段;
所述交叉操作单元,用于根据所述目标函数生成所述第一粒子群中粒子的适应度值;在所述第一粒子群中进行极值交叉,得到第二粒子群,所述第二粒子群中粒子的适应度值大于所述第一粒子群;
所述变异操作单元,用于根据所述子题库,将所述第二粒子群中的粒子进行试题替换,得到第三粒子群;
所述组卷输出单元,用于输出所述第三粒子群中最高适应度值的粒子,得到试题集。
9.基于粒子群遗传算法的组卷装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7任一项所述的基于粒子群遗传算法的组卷方法。
10.一种存储介质,其中存储有处理器可执行的程序,其特征在于:所述处理器可执行的程序在由处理器执行时用于实现如权利要求1-7中任一项所述的基于粒子群遗传算法的组卷方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011007300.4A CN112182172B (zh) | 2020-09-23 | 2020-09-23 | 基于粒子群遗传算法的组卷方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011007300.4A CN112182172B (zh) | 2020-09-23 | 2020-09-23 | 基于粒子群遗传算法的组卷方法、系统、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112182172A true CN112182172A (zh) | 2021-01-05 |
CN112182172B CN112182172B (zh) | 2024-05-31 |
Family
ID=73957127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011007300.4A Active CN112182172B (zh) | 2020-09-23 | 2020-09-23 | 基于粒子群遗传算法的组卷方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182172B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131104A (zh) * | 2023-08-28 | 2023-11-28 | 河北望岳信息科技有限公司 | 智能抽题组卷方法、装置、电子设备及存储介质 |
CN117667669A (zh) * | 2023-10-31 | 2024-03-08 | 中国科学院空间应用工程与技术中心 | 基于变异遗传算法的功能测试方法、系统、介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469145A (zh) * | 2016-01-15 | 2016-04-06 | 清华大学 | 一种基于遗传粒子群算法的智能组卷方法 |
CN110990573A (zh) * | 2019-12-16 | 2020-04-10 | 山东山大鸥玛软件股份有限公司 | 一种基于分段实数编码的遗传算法智能组卷方法,设备及可读存储介质 |
CN111242267A (zh) * | 2019-12-31 | 2020-06-05 | 国网北京市电力公司 | 在线考试的组卷方法和组卷装置 |
CN111427925A (zh) * | 2020-03-20 | 2020-07-17 | 北京易真学思教育科技有限公司 | 组卷方法、装置、设备及存储介质 |
-
2020
- 2020-09-23 CN CN202011007300.4A patent/CN112182172B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469145A (zh) * | 2016-01-15 | 2016-04-06 | 清华大学 | 一种基于遗传粒子群算法的智能组卷方法 |
CN110990573A (zh) * | 2019-12-16 | 2020-04-10 | 山东山大鸥玛软件股份有限公司 | 一种基于分段实数编码的遗传算法智能组卷方法,设备及可读存储介质 |
CN111242267A (zh) * | 2019-12-31 | 2020-06-05 | 国网北京市电力公司 | 在线考试的组卷方法和组卷装置 |
CN111427925A (zh) * | 2020-03-20 | 2020-07-17 | 北京易真学思教育科技有限公司 | 组卷方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
肖豆: "智能组卷系统的设计与实现", 《中国优秀硕士学位论文全文数据库 社会科学II辑》, pages 127 - 35 * |
马跃亮;靳志强;孙晨霞;: "一种改进的多目标粒子群组卷算法", 微型机与应用, no. 23, pages 11 - 13 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131104A (zh) * | 2023-08-28 | 2023-11-28 | 河北望岳信息科技有限公司 | 智能抽题组卷方法、装置、电子设备及存储介质 |
CN117131104B (zh) * | 2023-08-28 | 2024-02-27 | 河北望岳信息科技有限公司 | 智能抽题组卷方法、装置、电子设备及存储介质 |
CN117667669A (zh) * | 2023-10-31 | 2024-03-08 | 中国科学院空间应用工程与技术中心 | 基于变异遗传算法的功能测试方法、系统、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112182172B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105279555A (zh) | 一种基于进化算法的自适应学习神经网络实现方法 | |
JPH04503876A (ja) | 神経回路網の遺伝子的合成 | |
CN112699283B (zh) | 试卷生成方法及装置 | |
CN112182172A (zh) | 基于粒子群遗传算法的组卷方法、系统、装置及介质 | |
CN112700688A (zh) | 一种智能课堂教学辅助系统 | |
Shi et al. | Symmetry in computer-aided music composition system with social network analysis and artificial neural network methods | |
CN110990573A (zh) | 一种基于分段实数编码的遗传算法智能组卷方法,设备及可读存储介质 | |
CN114429212A (zh) | 智能学习知识能力跟踪方法、电子设备及存储介质 | |
Chai | Construction and analysis of a business English classroom teaching quality evaluation system based on multimodal neural network model assessment | |
CN113870634A (zh) | 一种结合虚拟教学的智能组卷方法与系统 | |
CN112256869A (zh) | 一种基于题意文本的同知识点试题分组系统和方法 | |
CN115345106B (zh) | 电子器件的Verilog-A模型构建方法、系统及设备 | |
CN116227992A (zh) | 一种考核试卷生成方法、装置及终端设备 | |
CN110046667B (zh) | 一种基于深度神经网络学习评分数据对的教学评价方法 | |
CN114943276A (zh) | 基于树型注意力机制的深度知识追踪方法 | |
CN109409642A (zh) | 一种基于大数据的教学资源评级方法 | |
Binh et al. | Student ability estimation based on IRT | |
Ventura | A Self-learning musical tool to support the educational activity | |
CN113052315B (zh) | 组卷模型训练及其组卷方法、装置及计算机存储介质 | |
CN112863465A (zh) | 基于上下文信息的音乐生成方法、装置及存储介质 | |
CN112732889A (zh) | 一种基于合作网络的学者检索方法和装置 | |
Li et al. | Evaluation method of GA-BP neural network programming ability based on entropy weight-deviation | |
CN117763361B (zh) | 一种基于人工智能的学生成绩预测方法及系统 | |
CN115952838B (zh) | 一种基于自适应学习推荐系统生成方法及系统 | |
CN117520527B (zh) | 答疑对话数据生成方法、系统、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |