CN109670042A

CN109670042A - 一种基于递归神经网络的试题分类及难度分级方法

Info

Publication number: CN109670042A
Application number: CN201811473934.1A
Authority: CN
Inventors: 杜振锋; 周晓清; 周燕; 曾凡智
Original assignee: Guangzhou Etonedu Education Co Ltd
Current assignee: Guangzhou Etonedu Education Co Ltd
Priority date: 2018-12-04
Filing date: 2018-12-04
Publication date: 2019-04-23

Abstract

本发明公开了一种基于递归神经网络的试题分类及难度分级方法，该方法使用两级的神经网络，第一级网络可以为未标明科目的试题进行分类，同时将分类好的试题放入第二级网络中,可为没有标明试题难度的题目提供一个近似的参考难度。另外，由于试题的属性与试题的难度之间具有某种关联关系，例如某些省份的模拟题往往难于其他题目，同样的包括年份、题型、包含知识点等等也会跟试题的难度有一定的关联关系，因此可以通过这些属性来构建试题的特征向量作深度学习的训练样本。

Description

一种基于递归神经网络的试题分类及难度分级方法

技术领域

本发明涉及难度分级领域，尤其涉及一种基于递归神经网络的试题分类及难度分级方法。

背景技术

随着计算机网络技术的不断发展，计算机联网考试日益成为一种重要的考核手段和方法。支撑联网考试需要庞大的考试题库，以利于网考系统抽题组卷的随机性和客观性。同时移动互联网、智能终端设备和社会网络平台为全方位海量信息的产生、收集和分析提供了保障，促进了个性化在线教育的发展与普及。

但是互联网题库中存在大量的科目未分类同时难度也未分级的题目。现有试题难度的分类方法往往是使用人工分级的方法，然而使用人工分级的需要耗费大量的人力及时间，不利于个性化教育的推广。而近年来随着深度神经网络的普及，已经有一些研究使用神经网络来对未注明科目的试题进行分类，然而这些研究仅仅停留在对试题科目进行分类上面，而不能满足对难度分级的需求。

发明内容

本发明所要解决的技术问题提供一种基于深度学习的试题难度自动分级方法。该方法使用两级的神经网络，第一级网络可以为未标明科目的试题进行分类，同时将分类好的试题放入第二级网络中,可为没有标明试题难度的题目提供一个近似的参考难度。另外，由于试题的属性与试题的难度之间具有某种关联关系，因此可以通过这些属性来构建试题的特征向量作深度学习的训练样本。

为了解决上述问题，本发明的技术方案是：一种基于递归神经网络的试题分类及难度分级方法，该方法包括以下步骤：

步骤S1，初始化：选取一定数量的已标明科目和难度的试题作为训练样本，分为不同难度的类别，并给定标签，再进一步从已有数据中提取试题的地区、年份、题型、所包含知识点的属性；

步骤S2，构建神经网络：将所述的属性量化为特征向量，并作为科目分类神经网络的输入；

步骤S21，构建科目分类神经网络：所述的特征向量利用已标明科目的试题做为训练集来训练科目分类神经网络,再利用训练好的科目分类神经网络对试题进行科目分类；

步骤S22，构建难度分类神经网络：将所述的科目分类神经网络做好科目分类的试题放入与科目对应的难度分级神经网络中进行训练，再利用训练好的难度分级神经网络得到输出值；

选取不同的训练样本的放入到训练好的难度分级神经网络中进行训练，通过BP算法来调节参数，设定迭代次数和迭代误差使输出值逼近期望输出值。

进一步的，所述的科目分类神经网络和所述的难度分级神经网络均采用递归神经网络。

进一步的，所述的递归神经网络中单个递归神经网络的计算方法为其中为S_t当前时序的输出，为激活函数，u当前时序输入的权重，x_t为当前时序的输入，w为前一时序输入的权重，s_t-1为前一时序的输出；网络的输出为：o_t＝v*s_t，其中o_t为单个递归神经网络的输出，v为隐层和输出之间的权重。

由于采用了上述技术方案，本发明与现有技术相比具有如下有益效果：

本发明构建两级的神经网络，使得训练好的网络可以为没有分类的题目给出一个可供参考的题目难度和科目分类，因此可以节省大量的人力成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的试题分类及难度分级方法框架图。

图2是本发明实施例的试题分类及难度分级方法网络结构图。

图3是本发明实施例的单个递归神经网络结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例和附图，对本发明实施例中的技术方案进行清楚、完整地描述。需要说明的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图说明本发明的一种具体实施方式。

图1是基于递归神经网络的试题分类及难度分级方法框架图。如图1所示，一种基于递归神经网络的试题分类及难度分级方法，该方法包括以下步骤：

步骤S1，初始化：选取一定数量的已标明科目和难度的试题作为训练样本，从不同来源的试题库选择已知科目和难度的试题，并保证选择的随机性，依据试题已知的难度分为不同难度的类别，并给定标签，例如将易，中，难这三个难度的试题标为100,010,001。再进一步从已有数据中提取试题的地区(不同地区的题目难度有所不同)、年份(每年试题难度也不同)、题型(相同试题而题型不同会导致难度不同)、所包含知识点(知识点是导致难度不同的直接因素)的属性；并将其量化为特征向量，从而作为神经网络的输入。举例说明，如地区：山东(00010)年份：1997(0001101110110111)题型：选择(001)知识点：动能定理(00001000001110...)则构建特征向量为：00010000110111011011100100001000001110...特征向量可以根据提取的属性个数及类别来确定维度。

步骤S2，如图2所示，构建神经网络：这里可以借鉴已有的方法，将所述的试题信息属性量化为特征向量，并作为科目分类神经网络的输入，试题信息属性包括地区、年份、题型以及包含的知识点，特征向量可以根据属性的个数和类别来确定维度；这里所述的试题是待进行分类的试题，所述的神经网络即人工神经网络(Artificial Neural Network，即ANN)，是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数(activationfunction)。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。

步骤S21，构建科目分类神经网络：这里借鉴上述方法，将试题信息提取为词向量特征，所述的特征向量利用已标明科目的试题做为训练集来训练科目分类神经网络,再利用训练好的科目分类神经网络对试题进行科目分类；所述训练集可以理解为：为了提高科目分类精确度的确定，而选取的已知具体科目的试题。

本发明实施例中，由于不同科目在不同时期，其对应的重要等级不同，因此，在构建试题训练库时，可以根据具体情况进行试题难度等级的确定；另外，针对已构建的试题训练库，根据需要，难度分类神经网络接收到更新指令时，更新试题训练库。难度分类神经网络从试题训练库中提取相应的试题作为训练试题时，可以根据待分级试题的特点进行提取，也可以随机提取。

选取不同的训练样本的放入到训练好的难度分级神经网络中进行训练，通过BP算法来调节参数，设定迭代次数和迭代误差使输出值逼近期望输出值。训练完成后，将未标签的测试集放入训练好的网络则该网络会自动给出该试题属于某个难度的概率，例如试题1属于难度中的概率为80％。总体来说将试题特征向量作为深度学习神经网络的输入。并将不同的难度作为试题的标签，并利用这些样本来训练网络，使得训练好的网络可以自动给出题属于某个难度的概率，从而提供一个参考的试题难度。深度学习：深度学习(deeplearning)作为机器学习算法中的一个新兴技术，其动机在于建立，模拟人脑进行分析学习的神经网络。

所述的科目分类神经网络和所述的难度分级神经网络均采用递归神经网络。RNN是一类用于处理序列数据的神经网络，该网络的优点在于当前神经元的输出不仅与当前输入有关也与前一时序的输出有关，因此保持了输入信号的时序性，使得输入信号的前后时序具有关联性。

如图3所示，RNN网络的结构图在附图中给出。图中每个箭头代表做一次变换，也就是说箭头连接带有权值。左侧是折叠起来的样子，右侧是展开的样子。其中x_t代表输入序列，o_t代表输出序列，s为隐层，u、v分别代表输入到隐层之间的和隐层和输出之间的权重。左侧中s旁边的箭头代表此结构中的“循环”体现在隐层，可以看出当前的输出取决于当前输入与前一时序的输出。

所述的递归神经网络中单个递归神经网络的计算方法为其中为s_t当前时序的输出，为激活函数，u当前时序输入的权重，x_t为当前时序的输入，w为前一时序输入的权重，s_t-1为前一时序的输出；网络的输出为：O_t＝v*s_t，其中O_t为单个递归神经网络的输出，v为隐层和输出之间的权重。

以上所述具体实施方式仅表达了本发明的一种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种基于递归神经网络的试题分类及难度分级方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于递归神经网络的试题分类及难度分级方法，其特征在于所述的科目分类神经网络和所述的难度分级神经网络均采用递归神经网络。

3.根据权利要求2所述的基于递归神经网络的试题分类及难度分级方法，其特征在于所述的递归神经网络中单个递归神经网络的计算方法为其中为s_t当前时序的输出，为激活函数，u当前时序输入的权重，x_t为当前时序的输入，w为前一时序输入的权重，s_t-1为前一时序的输出；网络的输出为：o_t＝v*s_t，其中O_t为单个递归神经网络的输出，v为隐层和输出之间的权重。