CN109670042A - 一种基于递归神经网络的试题分类及难度分级方法 - Google Patents

一种基于递归神经网络的试题分类及难度分级方法 Download PDF

Info

Publication number
CN109670042A
CN109670042A CN201811473934.1A CN201811473934A CN109670042A CN 109670042 A CN109670042 A CN 109670042A CN 201811473934 A CN201811473934 A CN 201811473934A CN 109670042 A CN109670042 A CN 109670042A
Authority
CN
China
Prior art keywords
neural network
difficulty
examination question
classification
grade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811473934.1A
Other languages
English (en)
Inventor
杜振锋
周晓清
周燕
曾凡智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Etonedu Education Co Ltd
Original Assignee
Guangzhou Etonedu Education Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Etonedu Education Co Ltd filed Critical Guangzhou Etonedu Education Co Ltd
Priority to CN201811473934.1A priority Critical patent/CN109670042A/zh
Publication of CN109670042A publication Critical patent/CN109670042A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于递归神经网络的试题分类及难度分级方法,该方法使用两级的神经网络,第一级网络可以为未标明科目的试题进行分类,同时将分类好的试题放入第二级网络中,可为没有标明试题难度的题目提供一个近似的参考难度。另外,由于试题的属性与试题的难度之间具有某种关联关系,例如某些省份的模拟题往往难于其他题目,同样的包括年份、题型、包含知识点等等也会跟试题的难度有一定的关联关系,因此可以通过这些属性来构建试题的特征向量作深度学习的训练样本。

Description

一种基于递归神经网络的试题分类及难度分级方法
技术领域
本发明涉及难度分级领域,尤其涉及一种基于递归神经网络的试题分类及难度分级方法。
背景技术
随着计算机网络技术的不断发展,计算机联网考试日益成为一种重要的考核手段和方法。支撑联网考试需要庞大的考试题库,以利于网考系统抽题组卷的随机性和客观性。同时移动互联网、智能终端设备和社会网络平台为全方位海量信息的产生、收集和分析提供了保障,促进了个性化在线教育的发展与普及。
但是互联网题库中存在大量的科目未分类同时难度也未分级的题目。现有试题难度的分类方法往往是使用人工分级的方法,然而使用人工分级的需要耗费大量的人力及时间,不利于个性化教育的推广。而近年来随着深度神经网络的普及,已经有一些研究使用神经网络来对未注明科目的试题进行分类,然而这些研究仅仅停留在对试题科目进行分类上面,而不能满足对难度分级的需求。
发明内容
本发明所要解决的技术问题提供一种基于深度学习的试题难度自动分级方法。该方法使用两级的神经网络,第一级网络可以为未标明科目的试题进行分类,同时将分类好的试题放入第二级网络中,可为没有标明试题难度的题目提供一个近似的参考难度。另外,由于试题的属性与试题的难度之间具有某种关联关系,因此可以通过这些属性来构建试题的特征向量作深度学习的训练样本。
为了解决上述问题,本发明的技术方案是:一种基于递归神经网络的试题分类及难度分级方法,该方法包括以下步骤:
步骤S1,初始化:选取一定数量的已标明科目和难度的试题作为训练样本,分为不同难度的类别,并给定标签,再进一步从已有数据中提取试题的地区、年份、题型、所包含知识点的属性;
步骤S2,构建神经网络:将所述的属性量化为特征向量,并作为科目分类神经网络的输入;
步骤S21,构建科目分类神经网络:所述的特征向量利用已标明科目的试题做为训练集来训练科目分类神经网络,再利用训练好的科目分类神经网络对试题进行科目分类;
步骤S22,构建难度分类神经网络:将所述的科目分类神经网络做好科目分类的试题放入与科目对应的难度分级神经网络中进行训练,再利用训练好的难度分级神经网络得到输出值;
选取不同的训练样本的放入到训练好的难度分级神经网络中进行训练,通过BP算法来调节参数,设定迭代次数和迭代误差使输出值逼近期望输出值。
进一步的,所述的科目分类神经网络和所述的难度分级神经网络均采用递归神经网络。
进一步的,所述的递归神经网络中单个递归神经网络的计算方法为其中为St当前时序的输出,为激活函数,u当前时序输入的权重,xt为当前时序的输入,w为前一时序输入的权重,st-1为前一时序的输出;网络的输出为:ot=v*st,其中ot为单个递归神经网络的输出,v为隐层和输出之间的权重。
由于采用了上述技术方案,本发明与现有技术相比具有如下有益效果:
本发明构建两级的神经网络,使得训练好的网络可以为没有分类的题目给出一个可供参考的题目难度和科目分类,因此可以节省大量的人力成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的试题分类及难度分级方法框架图。
图2是本发明实施例的试题分类及难度分级方法网络结构图。
图3是本发明实施例的单个递归神经网络结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例和附图,对本发明实施例中的技术方案进行清楚、完整地描述。需要说明的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图说明本发明的一种具体实施方式。
图1是基于递归神经网络的试题分类及难度分级方法框架图。如图1所示,一种基于递归神经网络的试题分类及难度分级方法,该方法包括以下步骤:
步骤S1,初始化:选取一定数量的已标明科目和难度的试题作为训练样本,从不同来源的试题库选择已知科目和难度的试题,并保证选择的随机性,依据试题已知的难度分为不同难度的类别,并给定标签,例如将易,中,难这三个难度的试题标为100,010,001。再进一步从已有数据中提取试题的地区(不同地区的题目难度有所不同)、年份(每年试题难度也不同)、题型(相同试题而题型不同会导致难度不同)、所包含知识点(知识点是导致难度不同的直接因素)的属性;并将其量化为特征向量,从而作为神经网络的输入。举例说明,如地区:山东(00010)年份:1997(0001101110110111)题型:选择(001)知识点:动能定理(00001000001110...)则构建特征向量为:00010000110111011011100100001000001110...特征向量可以根据提取的属性个数及类别来确定维度。
步骤S2,如图2所示,构建神经网络:这里可以借鉴已有的方法,将所述的试题信息属性量化为特征向量,并作为科目分类神经网络的输入,试题信息属性包括地区、年份、题型以及包含的知识点,特征向量可以根据属性的个数和类别来确定维度;这里所述的试题是待进行分类的试题,所述的神经网络即人工神经网络(Artificial Neural Network,即ANN),是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activationfunction)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。
步骤S21,构建科目分类神经网络:这里借鉴上述方法,将试题信息提取为词向量特征,所述的特征向量利用已标明科目的试题做为训练集来训练科目分类神经网络,再利用训练好的科目分类神经网络对试题进行科目分类;所述训练集可以理解为:为了提高科目分类精确度的确定,而选取的已知具体科目的试题。
步骤S22,构建难度分类神经网络:将所述的科目分类神经网络做好科目分类的试题放入与科目对应的难度分级神经网络中进行训练,再利用训练好的难度分级神经网络得到输出值;
本发明实施例中,由于不同科目在不同时期,其对应的重要等级不同,因此,在构建试题训练库时,可以根据具体情况进行试题难度等级的确定;另外,针对已构建的试题训练库,根据需要,难度分类神经网络接收到更新指令时,更新试题训练库。难度分类神经网络从试题训练库中提取相应的试题作为训练试题时,可以根据待分级试题的特点进行提取,也可以随机提取。
选取不同的训练样本的放入到训练好的难度分级神经网络中进行训练,通过BP算法来调节参数,设定迭代次数和迭代误差使输出值逼近期望输出值。训练完成后,将未标签的测试集放入训练好的网络则该网络会自动给出该试题属于某个难度的概率,例如试题1属于难度中的概率为80%。总体来说将试题特征向量作为深度学习神经网络的输入。并将不同的难度作为试题的标签,并利用这些样本来训练网络,使得训练好的网络可以自动给出题属于某个难度的概率,从而提供一个参考的试题难度。深度学习:深度学习(deeplearning)作为机器学习算法中的一个新兴技术,其动机在于建立,模拟人脑进行分析学习的神经网络。
所述的科目分类神经网络和所述的难度分级神经网络均采用递归神经网络。RNN是一类用于处理序列数据的神经网络,该网络的优点在于当前神经元的输出不仅与当前输入有关也与前一时序的输出有关,因此保持了输入信号的时序性,使得输入信号的前后时序具有关联性。
如图3所示,RNN网络的结构图在附图中给出。图中每个箭头代表做一次变换,也就是说箭头连接带有权值。左侧是折叠起来的样子,右侧是展开的样子。其中xt代表输入序列,ot代表输出序列,s为隐层,u、v分别代表输入到隐层之间的和隐层和输出之间的权重。左侧中s旁边的箭头代表此结构中的“循环”体现在隐层,可以看出当前的输出取决于当前输入与前一时序的输出。
所述的递归神经网络中单个递归神经网络的计算方法为 其中为st当前时序的输出,为激活函数,u当前时序输入的权重,xt为当前时序的输入,w为前一时序输入的权重,st-1为前一时序的输出;网络的输出为:Ot=v*st,其中Ot为单个递归神经网络的输出,v为隐层和输出之间的权重。
以上所述具体实施方式仅表达了本发明的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (3)

1.一种基于递归神经网络的试题分类及难度分级方法,其特征在于,该方法包括以下步骤:
步骤S1,初始化:选取一定数量的已标明科目和难度的试题作为训练样本,分为不同难度的类别,并给定标签,再进一步从已有数据中提取试题的地区、年份、题型、所包含知识点的属性;
步骤S2,构建神经网络:将所述的属性量化为特征向量,并作为科目分类神经网络的输入;
步骤S21,构建科目分类神经网络:所述的特征向量利用已标明科目的试题做为训练集来训练科目分类神经网络,再利用训练好的科目分类神经网络对试题进行科目分类;
步骤S22,构建难度分类神经网络:将所述的科目分类神经网络做好科目分类的试题放入与科目对应的难度分级神经网络中进行训练,再利用训练好的难度分级神经网络得到输出值;
选取不同的训练样本的放入到训练好的难度分级神经网络中进行训练,通过BP算法来调节参数,设定迭代次数和迭代误差使输出值逼近期望输出值。
2.根据权利要求1所述的基于递归神经网络的试题分类及难度分级方法,其特征在于所述的科目分类神经网络和所述的难度分级神经网络均采用递归神经网络。
3.根据权利要求2所述的基于递归神经网络的试题分类及难度分级方法,其特征在于所述的递归神经网络中单个递归神经网络的计算方法为其中为st当前时序的输出,为激活函数,u当前时序输入的权重,xt为当前时序的输入,w为前一时序输入的权重,st-1为前一时序的输出;网络的输出为:ot=v*st,其中Ot为单个递归神经网络的输出,v为隐层和输出之间的权重。
CN201811473934.1A 2018-12-04 2018-12-04 一种基于递归神经网络的试题分类及难度分级方法 Pending CN109670042A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811473934.1A CN109670042A (zh) 2018-12-04 2018-12-04 一种基于递归神经网络的试题分类及难度分级方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811473934.1A CN109670042A (zh) 2018-12-04 2018-12-04 一种基于递归神经网络的试题分类及难度分级方法

Publications (1)

Publication Number Publication Date
CN109670042A true CN109670042A (zh) 2019-04-23

Family

ID=66144128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811473934.1A Pending CN109670042A (zh) 2018-12-04 2018-12-04 一种基于递归神经网络的试题分类及难度分级方法

Country Status (1)

Country Link
CN (1) CN109670042A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245860A (zh) * 2019-06-13 2019-09-17 桂林电子科技大学 一种基于虚拟实验平台的自动评分的方法
CN110321361A (zh) * 2019-06-15 2019-10-11 河南大学 基于改进的lstm神经网络模型的试题推荐判定方法
CN110347791A (zh) * 2019-06-20 2019-10-18 广东工业大学 一种基于多标签分类卷积神经网络的题目推荐方法
CN117437094A (zh) * 2023-08-04 2024-01-23 北京信诺软通信息技术有限公司 一种答题试卷分类的方法、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914567A (zh) * 2014-04-23 2014-07-09 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103927552A (zh) * 2014-04-23 2014-07-16 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN105183831A (zh) * 2015-08-31 2015-12-23 上海德唐数据科技有限公司 一种针对不同学科题目文本分类的方法
CN106815601A (zh) * 2017-01-10 2017-06-09 西安电子科技大学 基于递归神经网络的高光谱图像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914567A (zh) * 2014-04-23 2014-07-09 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103927552A (zh) * 2014-04-23 2014-07-16 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN105183831A (zh) * 2015-08-31 2015-12-23 上海德唐数据科技有限公司 一种针对不同学科题目文本分类的方法
CN106815601A (zh) * 2017-01-10 2017-06-09 西安电子科技大学 基于递归神经网络的高光谱图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
付佩宣: "《基于人工神经网络的C.TEST阅读理解题目难度预测的研究》", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》 *
王蕾: "《基于神经网络的中文命名实体识别研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245860A (zh) * 2019-06-13 2019-09-17 桂林电子科技大学 一种基于虚拟实验平台的自动评分的方法
CN110245860B (zh) * 2019-06-13 2022-08-23 桂林电子科技大学 一种基于虚拟实验平台的自动评分的方法
CN110321361A (zh) * 2019-06-15 2019-10-11 河南大学 基于改进的lstm神经网络模型的试题推荐判定方法
CN110321361B (zh) * 2019-06-15 2021-04-16 河南大学 基于改进的lstm神经网络模型的试题推荐判定方法
CN110347791A (zh) * 2019-06-20 2019-10-18 广东工业大学 一种基于多标签分类卷积神经网络的题目推荐方法
CN117437094A (zh) * 2023-08-04 2024-01-23 北京信诺软通信息技术有限公司 一种答题试卷分类的方法、电子设备及存储介质
CN117437094B (zh) * 2023-08-04 2024-05-07 北京信诺软通信息技术有限公司 一种答题试卷分类的方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109670042A (zh) 一种基于递归神经网络的试题分类及难度分级方法
CN105930277B (zh) 一种基于缺陷报告分析的缺陷源代码定位方法
CN110188331A (zh) 模型训练方法、对话系统评价方法、装置、设备及存储介质
CN103207855B (zh) 针对产品评论信息的细粒度情感分析系统及方法
CN110516539A (zh) 基于对抗网络的遥感影像建筑物提取方法、系统、存储介质及设备
CN106156003A (zh) 一种问答系统中的问句理解方法
Lin et al. Deep structured scene parsing by learning with image descriptions
CN112596731B (zh) 一种融合智能教育的编程教学系统及方法
Zhu et al. Topic-guided attention for image captioning
CN110110225A (zh) 基于用户行为数据分析的在线教育推荐模型及构建方法
Siregar et al. A Decision Support System For Selecting The Best Practical Work Students Using MOORA Method
CN107025598A (zh) 一种基于极限学习机的个人信用风险评估方法
CN108470061A (zh) 一种针对视角级文本的情感分类系统
CN112182241A (zh) 一种空管领域知识图谱的自动化构建方法
CN110321555A (zh) 一种基于循环神经网络模型的电网信号分类方法
Qi et al. Higher education teaching quality evaluation model based on improved RBF neural network
KR102269606B1 (ko) 콜드 스타트를 해결하기 위한 신규 컨텐츠 분석 분석 방법, 장치 및 컴퓨터 프로그램
He Evaluation and stratification for Chinese international education quality with deep learning model
CN109582309A (zh) 一种用于网站界面生成的辅助设计方法
CN108932289A (zh) 一种基于信息抽取和深度学习的问题回答处理方法及系统
CN108074240A (zh) 识别方法、识别装置、计算机可读存储介质及程序产品
Schimpf et al. Large data for design research: An educational technology framework for studying design activity using a big data approach
CN114840717A (zh) 面向图数据的挖掘方法、装置、电子设备及可读存储介质
Xie Evaluation of multimedia classroom teaching effectiveness based on RS-BP neural network
CN112966831A (zh) 一种基于人工智能能源超级大脑的智慧能源构建模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190423

WD01 Invention patent application deemed withdrawn after publication