CN114239735A

CN114239735A - 随机组卷方法及系统

Info

Publication number: CN114239735A
Application number: CN202111572354.XA
Authority: CN
Inventors: 熊逸
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2022-03-25

Abstract

本申请实施例提供一种随机组卷方法及系统。方法包括：获取组卷需求；根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目；其中，所述预设二维数组根据预设题库生成，用于存储所述预设题库中的所有题目信息；根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。本发明方案利用预设的二维数组来存储题库中的题目信息，在保证题目抽取随机性的同时，极大提高了组卷效率。

Description

随机组卷方法及系统

技术领域

本申请涉及考试组卷技术领域，具体涉及一种随机组卷方法及一种随机组卷系统。

背景技术

考试需求在日常生活中十分常见，在传统的试卷整理中，是将所有的题目整理成题库，然后将题库看做为题集，由老师等管理人员在需要试卷生成时进行人工组卷，进行组卷时主观性非常强。人工组卷通常提取整理多份试卷，将整理好的试卷形成试卷库，在需要考试的时候再随机进行试卷抽取，这种方法灵活性很差，因为形成的试卷是无法修改的，后续有新的题目时，需要重新设定。为了应对这种情况，自动化的随机组卷方法开始出现，目前主要存在有三种随机组卷方法，分别为回溯算法、遗传算法和随机选取法，这三种方法均存在一定的问题，例如随机性差、系统成本高和抽取效率低等问题。针对目前随机组卷方法存在的诸多问题，需要创造一种新的随机组卷方法。

发明内容

本申请实施例的目的是提供一种随机组卷方法及系统，以至少解决现有随机组卷方法随机性差、系统成本高和抽取效率低等问题。

为了实现上述目的，本申请第一方面提供一种随机组卷方法，包括获取组卷需求；根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目；其中，所述预设二维数组根据预设题库生成，用于映射所述预设题库中的所有题目信息；根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。

在本申请实施例中，所述组卷需求包括：题目类型以及每种题目类型的题目数量；试卷整体难度分值；其中，所述每种题目类型的题目数量用于决定所述预设试卷模板。

在本申请实施例中，所述预设二维数组包括：题数数组和难度数组；所述预设二维数组表示为：

inta[n][m]，c[n][m]

其中，a[n][m]为题数数组；c[n][m]为难度数组；n为预设题库中的题目类型；m为预设题库中的预设难度等级；a为第n种题目类型中难度等级为m的题目数量；c为第n种题目类型中难度等级为m的题目难度分值。

在本申请实施例中，所述方法还包括：对预设题库中的各题目进行题目分类，包括：根据预设学习模型或预设标注结果进行题目分类；其中，所述预设学习模型为以基于题目完成类型区分的历史试卷题目作为训练样本构建的类型区分模型；所述预设标注结果为在审核者录入题目时对应采集的题目类型标注结果。

在本申请实施例中，所述方法还包括：对预设题库的各题目难度进行难度等级划分，包括：预设多个难度等级，并确定每个难度等级对应的难度分值范围；获取所述预设题库中各题目的难度分值；将所述预设题库中各题目的难度分值与所确定的各难度等级对应的难度分值范围进行匹配，将所述预设题库中各题目划分到对应的难度等级。

在本申请实施例中，所述根据预设二维数组对所述组卷需求进行各题目随机抽取适配，获得拟定试卷题目，包括：根据题目类型以及每种题目类型的题目数量进行题数数组抽取；根据试卷整体难度分值进行难度数组抽取；其中，所述题数数组抽取和所述难度数组抽取的抽取过程为：根据预设题目类型顺序进行题目逐一随机抽取。

在本申请实施例中，所述根据试卷整体难度分值进行难度数组抽取，包括：将所述试卷整体难度分值进行随机拆分，拆分的目标份数等于题目总数；其中，所述题目总数为题目类型以及每种题目类型的题目数量总和；拆分后每一份拆分部分的数值均处于所述预设题库中题目难度分值最小值到题目难度分值最大值之间；确定拆分后每一份拆分部分的对应难度等级，并统计每一难度等级下的拆分部分数量作为该难度等级下的目标题目数量；将各难度等级下的目标题目数量进行拆分并基于分配规则随机分配到各题目类型下；其中，所述分配规则为，保证每一难度等级在每个题目类型中至少出现一次；基于随机分配结果进行每种题目类型下的题目随机抽取，直到所有题目类型的题目数量抽取完毕。

在本申请实施例中，所述根据试卷整体难度分值进行难度数组抽取，包括：每随机抽取一个类型的题目，更新统计一次已抽取类型题目的总难度分值；每更新统计一次已抽取类型题目的总难度分值，进行一次试卷整体难度分值与该已抽取类型题目的总难度分值求差，获得剩余需求难度分值；每随机抽取一个类型的题目，确定对应题目类型下各题目的难度等级，并更新一次对应难度等级的题目总数；若所有题目抽取完毕，所述剩余需求难度分值绝对值大于预设超范阈值，则在题目总数最大的难度等级内进行题目调整，并获得调整后的剩余需求难度分值，直到调整后的剩余需求难度分值绝对值小于所述预设超范阈值。

在本申请实施例中，进行题目随机抽取的随机算法为水库抽样算法。

本申请第二方面提供一种随机组卷系统，包括：采集单元，用于获取组卷需求；处理单元，用于根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目；其中，所述预设二维数组根据预设题库生成，用于映射所述预设题库中的所有题目信息；输出单元，用于根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。

在本申请实施例中，所述系统还包括：存储单元，用于存储所述预设题库。

本申请第三方面提供一种机器可读存储介质，该机器可读存储介质上存储有指令，该指令在被处理器执行时使得所述处理器被配置成执行上述的随机组卷方法。

本申请第四方面提供一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现上述的随机组卷方法。

通过上述技术方案，通过预设的二维数组来存储题库中的所有题目信息(例如多类型的题型，以及每个题型的配置，难易程度和分值)，以二维数组的配置来最终随机抽取出符合配置策略的试卷。用户仅需要录入自己的组卷需求，便可以自动的完成所有拟定试卷题目抽取。由于本发明方案中利用到数组，数组的存储和随机访问对象是引用序列最有效的方式，集合类的底层也是通过数组实现的，数组的性能和速度是有很大优势的，在保证题目抽取随机性的同时，极大提高了组卷效率。

本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本申请实施例，但并不构成对本申请实施例的限制。在附图中：

图1示意性示出了根据本申请实施例的随机组卷方法的步骤流程图；

图2示意性示出了根据本申请实施例的随机组卷系统的系统结构图；

图3示意性示出了根据本申请实施例的计算机设备的内部结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解的是，此处所描述的具体实施方式仅用于说明和解释本申请实施例，并不用于限制本申请实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明，若本申请实施例中有涉及方向性指示(诸如上、下、左、右、前、后……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，若本申请实施例中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

考试需求在日常生活中十分常见，在传统的试卷整理中，是将所有的题目整理成题库，然后将题库看做为题集，由老师等管理人员在需要试卷生成时进行人工组卷，进行组卷时主观性非常强。人工组卷通常提取整理多份试卷，将整理好的试卷形成试卷库，在需要考试的时候再随机进行试卷抽取，这种方法灵活性很差，因为形成的试卷是无法修改的，后续有新的题目时，需要重新设定。为了应对这种情况，自动化的随机组卷方法开始出现，目前主要存在有三种随机组卷方法，分别为：

1)回溯算法。其思想是将随机选取法产生的每一个状态类型记录下来，当存在搜索失败时，将上次记录的状态类型释放出来，然后基于预设特定的规律变换一种新的状态类型进行试探，通过不断的回溯试探直到试卷生成完毕或退回出发点为止。因为其需要基于预设特定的规律进行状态类型变换，所以其并非绝对的随机算法，这种有条件的深度优先算法，对于状态类型和出题量都较少的题库系统而言，组卷成功率较好，但是实际应用时发现这种算法对内存的占用量很大，程序结构相对比较复杂，而且选取试题缺乏随机性，组卷时间长，后两点是用户无法接受的，因此不是一种很好的用来自动组卷的算法。

2)遗传算法。遗传算法本质是一种把自然界有机体的优胜劣汰的自然选择、适者生存的进化机制与同一群体中个体与个体间的随机信息交换机制相结合的搜索算法。其是一种并行的、能够有效优化的算法，其运用遗传算法求解问题首先需将所要求解的问题表示成二进制编码，然后根据环境进行基本的操作不断生存选择，最后收敛到一个最适应环境条件的个体上，得到问题的最优解。虽然其解决效果很好，但有很多不足，需要各种算法改进，使用成本太大。

3)随机选取法。这种方法是根据状态空间的控制指标，由计算机随机的抽取一道试题放入试题库，此过程不断重复，直到组卷完毕，或已无法从题库中抽取满足控制指标的试题为止。该方法结构简单，对于单道题的抽取运行速度较快。但其需要进行循环的重复抽取，在题目很少的情况下效率可观，当需要进行大量的题目抽取时，其效率越来越低。

可见，目前的三种随机组卷方法均存在一定的问题，这些问题在进行组卷时会极大影响用户的使用体验。本发明方案针对这些问题，需要同时兼顾试卷组卷的时间短和稳定性，自动按照组卷策略的配置来执行。本发明方案结合二维数组来存储试卷的所有题目信息，例如息多类型的题型，以及每个题型的配置，难易程度和分值，以二维数组的配置来最终随机抽取出符合配置策略的试卷。本发明方案利用到了数组，数组的存储和随机访问对象是引用序列最有效的方式，集合类的底层也是通过数组实现的。数组的性能和速度是有很大优势的。其中，二维数组较简单易懂，结构便于理解，二维数组就是一个一维数组中嵌套了一个一维数组，例如初始化一个二维数组int[][]arr＝new int[4][2]，[4]表示四个一维数组，每个一维数组都嵌套了一个两个元素的一维数组。用表格形式可以表示为4行2列。

图1示意性示出了根据本申请实施例的随机组卷方法的流程示意图。如图1所示，在本申请一实施例中，提供了一种随机组卷方法，包括以下步骤：

步骤S10：获取组卷需求。

具体的，老师为了减少自己的工作量，也为了提高组卷的客观性和效率，仅需要提出自己的组卷需求，所述组卷需求可以是题目类型以及每种题目类型的题目数量和试卷整体难度分值。

其中，题目类型为例如单选题、多选题、填空题、判断题、问答题和写作题等具体类型的题目。而每种题目类型的题目数量便是目标试卷需求的各种题目的题目数量，例如单选题15个、判断题10个等。

试卷整体难度分值体现了目标试卷的难度情况，该项特征往往需要根据老师的主观进行判断，进行题目提取组卷。在本发明中，老师仅需要根据想要评估的程度以及对学生掌握情况的判断进行试卷难度评估，然后录入评估的试卷难度分数，后续自动根据该分数进行自动组卷。保证不论最终组件的题目类型和各类型的题目数量，还是试卷的整体难度分数，都能够符合老师的预期，全程不需要老师干预，系统的智能性和效率性均能得到很好的保证。

步骤S20：根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目。

具体的，上述已知，本发明方案是结合二维数组来存储试卷多类型题型，以及每个题型的配置，难易程度和分值，以二维数组的配置来最终随机抽取出符合配置策略的试卷。所以，本发明方案还需要进行题库整理。若是直接的海量题库，这种方式中，题库仅存储具体题目，对于题目的类型和难度分值均未进行区分。对于这种题库，首先需要进行题目类型区分。

在一个实施例中，提取历史试卷题目作为训练样本，在试卷中，题目的类型已经制定，仅需要根据题目情况和目标作答情况作为训练样本，便可以训练获得类型区分模型。获得该类型区分模型后，将海量题库中的题目作为输入，进行该模型训练，输出对应题目的题目类型，自动进行海量题库中题目类型区分和整理，完成整个题库整理。

在一个实施例中，在题目录入时，开放类型输入功能，由老师录入题目的同时进行类型选择，基于该选择的类型进行题目标注。该标注结果便可以作为对应题目的类型标签，基于该标签进行类型归类。

完成类型区分后，还需要进行难度等级区分，可以预设多个难度等级，例如，难、中、易三种难度等级，每个题目均有其具体的难度分值，该难度分值为老师标注情况或生成时候的关联情况，但分值仅是一个量化条件，为了进行更好的区分，需要进行量化对应的定性区分，即区分不同的难度等级。不同的难度等级对应不同的难度分值范围，获取每个题目的难度分值后，便可以对应获得该题目的难度关系。

二维数组本质上是以数组作为数组元素的数组，即“数组的数组”。本发明中，两个分量数组分别为题数数组和难度数组，其中，题数数组存储了每个题型每个难度题目数量，难度数组存储了每个题型每个难度的分值。其具体的表达式为：

inta[n][m]，c[n][m]

其中，a[n][m]为题数数组；c[n][m]为难度数组；n为预设题库中的题目类型；m为预设题库中的预设难度等级；a为第n中类型中难度等级为m的题目数量；c为第n中类型中难度等级为m的题目难度分值。例如，题库中存在单选、多选、判断题、填空题、问答题五中题目类型，对应预设的难度等级有难、中、易三种难度等级，则对应的题数数组为int[5][3]a，对应的难度数组为int[5][3]c。其中，[5]为五种题目类型，[3]为三种难度等级。

完成二维数组规则建立后，便需要根据该规则进行题目抽取。优选的，在本发明中，利用的随机算法为水库抽样算法。因为，随着历史题目录入以及新增题目的不断填充，题库的题目数量是非常庞大的，若每抽取一个题目，便需要遍历一次整个题库，其势必会造成很大的时延，这对于一套试卷需要很多题目的高效抽取需求是相悖的。为了解决这种问题，理想条件是只需要遍历一次题库内容，便可以抽取完成所有的题目。适用于这种需求，本发明使用的随机算法为水库抽样算法。这种应用的场景一般是数据流的情况下，由于数据只能被读取一次，而且数据量很大，并不能全部保存，因此数据量是无法在抽样开始时确定的，但又要保持随机性，这里的核心问题就是“随机”。其实现方式为，例如，蓄水池(水库)的容量为k，对于n(n>k)个元素，如果第i个元素(i从1逐渐递增至n)以k/i的概率决定是否将它放入蓄水池，当i＝n时，蓄水池中存放的是n个元素的均匀抽样，每个数字最终被存在数组中的概率相等，为k/n。要求从N个元素中随机的抽取k个元素，其中N无法确定。基于上述方法，在保证试题库数据体量很大的情况下，只需要遍历一次数据，就能实现随机抽取的目的。

基于上述方法，在预设的二维数组中进行题目抽取。

具体地，在一个实施例中，首先获得各类型题目对应题目数量和对应的难度等级确定，基于确定好的分配规则进行题目随机抽取。首先，将老师的组卷需求中的试卷整体难度分值进行拆分，拆分为多份，具体份数与题目总数相同，所述题目总数为题目类型以及每种题目类型的题目数量总和。

例如，整张试卷有题目50个，则对应将试卷整体难度分值随机拆分为50份。例如，难度分值为80分，则需要将80分随机拆分为50份，每一份的分值即为对应目标题目的难度分值。

优选的，为了避免出现难度极端失衡的情况，例如，出现为49个1分的题目和一个31分的题目的情况，这种情况下势必会造成试卷失衡。通过两种方法来限制，首先是限制每个题目的上限分值，即拆分后的分数必须处于预设题库中题目难度分值最小值到难度分值最大值之间，避免出现超出难度分值上限的难度分。然后，对每一种难度等级的题目设置阈值，例如，中等难度的阈值高，低等难度和高等难度的阈值低，以此保证拆分后的份数中，中等难度的题目更多。获得每一份的分值后，将该分值对应划分到匹配的难度区间内，以此确定对应难度区间内的题目数量。例如，低：10；中：35；难：5。然后，将这些目标题目分配到对应的题目类型中去，为了避免某种题目中的简单题目或高难度题目扎堆的情况，预设限制规则，即保证每种难度等级在每个题目类型中至少出现一次。即例如，高等难度的题目数为5，则将这5个题目平均分配到对应的5种类型中去，保证每一种类型中均存在一个难度等级最高的题目，以此来调控试卷的平衡性。分配完成后，基于模拟的分配过程生成分配规则，根据该分配规则进行题目随机抽取。

例如，首先进行单选题题目抽取，分为三个步骤，即对应的三个难度题目的抽取步骤。则先进行简单难度题目抽取，抽取的数量为a[0][0],分值为[0][0]；然后抽取难度为中的题目，数量为a[0][1],分值为[0][1]；最后抽取难度为难的题目，数量为a[0][2],分值为[0][2]。通过两个数组组合区分数量和难度分值，以此达到随机抽取的目的。相应的，对于第二种题目类型，三个步骤的抽取规则分别为：抽取难度为易的题目，数量为a[1][0],分值为[1][0]；抽取难度为中的题目，数量为a[1][1],分值为[1][1]；抽取难度为难的题目，数量为a[1][2],分值为[1][2]。以此类推，第五种题目类型，三个步骤的抽取规则分别为：抽取难度为易的题目，数量为a[4][0],分值为[4][0]；抽取难度为中的题目，数量为a[4][1],分值为[4][1]；抽取难度为难的题目，数量为a[4][2],分值为[4][2]。

在一个实施例中，不进行分配规则预先设定，而是动态的进行分配规则调整，根据题目序号，直接开始进行随机抽取，每随机抽取一个题目，获得对应题目的难度分值，并更新统计一次已抽取题目的总难度分值。例如，抽取5个问答题的难度分值分别为2、3、4、2、5，则对应的更新的总难度分值为16。每更新统计一次已抽取题目的总难度分值，便进行一次试卷整体难度分值和所述已抽取题目的总难度分值求差，获得剩余需求难度分值。

例如，总难度分值为80分，则第三次更新后的剩余需求难度分值为64分。每随机抽取一个题目，便确定对应题目的难度等级，并更新一次对应难度等级的题目总数。根据每种类型和具体的题目数量抽取后，获得最终的剩余需求难度分值，该分值为0时，表示组卷结果难度分值正好等于80分；若该分值为负，则表示组卷结果难度分值大于80分；若该分值为正，则表示组卷结果难度分值小于80分。难易程度是一个模糊的概念，并不一定保证其必须满足80分的难度评分，所以可以预设一定的浮动范围，例如80±5内。则当剩余需求难度分值绝对值大于5时，表示当前试卷与预期试卷相比，过于简单或复杂了，需要进行动态调整。因为中等难度的题目类型最多，所以选择题目类型最多的一类进行调整，随机选择任几个最多难度等级下的题目进行调整，并计算调整后的剩余需求难度分值，直到其绝对值小于5，判定组件结果符合预期。

步骤S30：根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。

具体的，完成题目抽取后，便需要根据这些题目进行试卷组卷，基于预设的模板进行试卷自动排版。根据常规规律，题目难易程度是逐级递进的，即序号靠前的往往为简单的题，越往后，难度逐渐升级。例如，最后的一道题往往是难度最高的压轴大题。为了适应该规则，对抽取的题目进行难度分值排序，排序顺序为从小到大，然后基于该规则进行试卷自动排版，并在排版完成后输出完整的试卷，便可以直接基于该完整的试卷进行考试，保证完全解放老师的双手，极大提高系统的便利性。

如图2，本发明还提供一种随机组卷系统，所述系统包括：采集单元，用于获取组卷需求；处理单元，用于根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目；其中，所述预设二维数组根据预设题库生成，用于存储所述预设题库中的所有题目信息；输出单元，用于根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。

在一个实施例中，所述系统还包括：存储单元，用于存储所述预设题库。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本申请实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现上述随机组卷方法。

本申请实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行上述随机组卷方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器A01、网络接口A02、显示屏A04、输入装置A05和存储器(图中未示出)。其中，该计算机设备的处理器A01用于提供计算和控制能力。该计算机设备的存储器包括内存储器A03和非易失性存储介质A06。该非易失性存储介质A06存储有操作系统B01和计算机程序B02。该内存储器A03为非易失性存储介质A06中的操作系统B01和计算机程序B02的运行提供环境。该计算机设备的网络接口A02用于与外部的终端通过网络连接通信。该计算机程序被处理器A01执行时以实现一种随机组卷方法。该计算机设备的显示屏A04可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置A05可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的随机组卷系统可以实现为一种计算机程序的形式，计算机程序可在如图3所示的计算机设备上运行。计算机设备的存储器中可存储组成该随机组卷系统的各个程序模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的随机组卷方法中的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种随机组卷方法，其特征在于，所述方法包括：

获取组卷需求；

根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目；其中，所述预设二维数组根据预设题库生成，用于映射所述预设题库中的所有题目信息；

根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。

2.根据权利要求1所述的方法，其特征在于，所述组卷需求包括：

题目类型以及每种题目类型的题目数量；

试卷整体难度分值；其中，

所述每种题目类型的题目数量用于决定所述预设试卷模板。

3.根据权利要求1所述的方法，其特征在于，所述预设二维数组包括：

题数数组和难度数组；

所述预设二维数组表示为：

inta[n][m]，c[n][m]

其中，a[n][m]为题数数组；

c[n][m]为难度数组；

n为预设题库中的题目类型；

m为预设题库中的预设难度等级；

a为第n种题目类型中难度等级为m的题目数量；

c为第n种题目类型中难度等级为m的题目难度分值。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

对预设题库中的各题目进行题目分类，包括：

根据预设学习模型或预设标注结果进行题目分类；其中，

所述预设学习模型为以基于题目完成类型区分的历史试卷题目作为训练样本构建的类型区分模型；

所述预设标注结果为在审核者录入题目时对应采集的题目类型标注结果。

5.根据权利要求3所述的方法，其特征在于，所述方法还包括：

对预设题库的各题目难度进行难度等级划分，包括：

预设多个难度等级，并确定每个难度等级对应的难度分值范围；

获取所述预设题库中各题目的难度分值；

将所述预设题库中各题目的难度分值与所确定的各难度等级对应的难度分值范围进行匹配，将所述预设题库中各题目划分到对应的难度等级。

6.根据权利要求2或3所述的方法，其特征在于，所述根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目，包括：

根据题目类型以及每种题目类型的题目数量进行题数数组抽取；

根据试卷整体难度分值进行难度数组抽取；其中，

所述题数数组抽取和所述难度数组抽取的抽取过程为：根据预设题目类型顺序进行题目逐一随机抽取。

7.根据权利要求6所述的方法，其特征在于，所述根据试卷整体难度分值进行难度数组抽取，包括：

将所述试卷整体难度分值进行随机拆分，拆分的目标份数等于题目总数；其中，所述题目总数为题目类型以及每种题目类型的题目数量总和；

拆分后每一份拆分部分的数值均处于所述预设题库中题目难度分值最小值到题目难度分值最大值之间；

确定拆分后每一份拆分部分的对应难度等级，并统计每一难度等级下的拆分部分数量作为该难度等级下的目标题目数量；

将各难度等级下的目标题目数量进行拆分并基于分配规则随机分配到各题目类型下；其中，所述分配规则为，保证每一难度等级在每个题目类型中至少出现一次；

基于随机分配结果进行每种题目类型下的题目随机抽取，直到所有题目类型的题目数量抽取完毕。

8.根据权利要求6所述的方法，其特征在于，所述根据试卷整体难度分值进行难度数组抽取，包括：

每随机抽取一个类型的题目，更新统计一次已抽取类型题目的总难度分值；

每更新统计一次已抽取类型题目的总难度分值，进行一次试卷整体难度分值与该已抽取类型题目的总难度分值求差，获得剩余需求难度分值；

每随机抽取一个类型的题目，确定对应题目类型下各题目的难度等级，并更新一次对应难度等级的题目总数；

若所有题目抽取完毕，所述剩余需求难度分值绝对值大于预设超范阈值，则在题目总数最大的难度等级内进行题目调整，并获得调整后的剩余需求难度分值，直到调整后的剩余需求难度分值绝对值小于所述预设超范阈值。

9.根据权利要求6所述的方法，其特征在于，进行题目随机抽取的随机算法为水库抽样算法。

10.一种随机组卷系统，其特征在于，所述系统包括：

采集单元，用于获取组卷需求；

处理单元，用于根据预设二维数组和所述组卷需求进行目标试卷各题目随机抽取适配，获得拟定试卷题目；其中，所述预设二维数组根据预设题库生成，用于映射所述题库中的所有题目信息；

输出单元，用于根据拟定试卷题目和预设试卷模板组成所述目标试卷，并输出所述目标试卷。

11.根据权利要求10所述的系统，其特征在于，所述系统还包括：

存储单元，用于存储所述预设题库。

12.一种计算机可读储存介质，该计算机可读存储介质上储存有指令，其在计算机上运行时使得计算机执行权利要求1-9中任一项权利要求所述的随机组卷方法。

13.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序在被处理器执行时实现权利要求1-9中任一项权利要求所述的随机组卷方法。