CN107194337A - 一种非选择题的智能批阅方法 - Google Patents

一种非选择题的智能批阅方法 Download PDF

Info

Publication number
CN107194337A
CN107194337A CN201710336878.6A CN201710336878A CN107194337A CN 107194337 A CN107194337 A CN 107194337A CN 201710336878 A CN201710336878 A CN 201710336878A CN 107194337 A CN107194337 A CN 107194337A
Authority
CN
China
Prior art keywords
grader
examination papers
over examination
result
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710336878.6A
Other languages
English (en)
Inventor
朱宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Link Technologies (beijing) Ltd
Original Assignee
Link Technologies (beijing) Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Link Technologies (beijing) Ltd filed Critical Link Technologies (beijing) Ltd
Priority to CN201710336878.6A priority Critical patent/CN107194337A/zh
Publication of CN107194337A publication Critical patent/CN107194337A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

一种非选择题的智能批阅方法,此发明应用于计算机辅助阅卷领域,可以为各类学校和考试机构提高阅卷的效率。目前在计算机辅助阅卷领域,对于绝大多数非选择题的批阅,仍然需要大量的人工干预,所以阅卷的整体效率不高。本发明将来自不同答题者的试题答案图片样本集合分为若干批次,依次经过分类器产生粗分类结果,然后由阅卷者审阅和修正,修正后的结果用来对分类器进行训练和更新,从而产生更有效的分类器供其他批次的样本使用。本发明能够在没有提前训练分类器的前提下对大多数类型的非选择题实施机器学习算法辅助下的批阅,减少了阅卷人的工作量,提高了整个阅卷系统的效率。

Description

一种非选择题的智能批阅方法
技术领域
本发明应用于计算机辅助阅卷领域。
背景技术
在计算机辅助阅卷领域,目前常见的技术是先采集试卷的图像信息,之后采用光学识别技术由计算机系统自动批阅选择题,而对于绝大多数非选择题则仍需要阅卷人进行人工批阅。
此外,有一些解决方案,例如(ZL201410472818.3),采用预先训练的通用字符分类器和字符分割算法以及语义分析系统代替人工批阅,但是,由于试卷答案内容的多样性,当答案中含有特殊符号或图形,以及多个字符之间难以分割时的批阅准确率仍然比较低,需要大量的人工干预,所以阅卷的整体效率仍然不高。
发明内容
本发明的目的在于克服当前计算机辅助阅卷技术存在的不足,提出了一种高效率的针对非选择题的批阅方法,可以在没有提前训练分类器的前提下对大多数类型的非选择题实施机器学习算法辅助下的批阅,并且提高了对任意字符和具有特殊形式的答案的答卷的适应性,减少了人工干预的工作量。从而提高了整个阅卷系统的效率。
为了实现以上目的,本发明提出了以下技术方案:
1.获取由答题卡,试卷或作业经过扫描或拍摄生成的图像
2.根据每个题目的标记信息,获取选择题和非选择题分别对应的试题答案图片样本集合
3.对应于某个特定的非选择题,提取的来自不同答题者的试题答案图片样本集合,并将其分为若干批次
4.初始化一个对应这个样本集合的分类器,这个分类器可以由系统参数库存储的参数进行初始化
5.将每个批次的样本依次经过分类器产生粗分类结果
6.将当前批次的粗分类结果由阅卷人审阅,如果有错误,阅卷人在此结果上做出必要的修正
7.当前批次修正完成后,将经过人工修正的最终结果作为参考数据,结合当前批次的样本数据,对分类器进行训练和更新
8.如果还有剩余批次的样本,回到步骤5继续处理
9.样本全部处理完后,将分类器的参数存储到参数库中供以后使用
本发明的积极效果是:
1.由于本发明中的分类器参数可以采用样本自身的数据进行实时训练,可以适应处理带有特殊字符和图形的样本,对含有多个字符的样本无需进行分割,并且避免了预先收集,标定样本的工作量
2.人工修正的结果不仅为最终用户提供输出,同时还可以训练和改进分类器的参数,更高效的利用了阅卷人提供的信息
3.由于随着训练样本数目的增加,分类器的准确性也逐渐提高,因此对阅卷人来说,越到后面的批次,需要的人工干预越少。对于样本数目比较多的场景,此方法可以显著减少阅卷人的工作量
4.经过训练的分类器参数,可以为以后同类型的题目阅卷使用,进一步提高了综合的阅卷效率
以下提供本发明一种非选择题的智能批阅方法的具体实施方式,并提供2个实施例,但本发明不限于所提供的实施例。
实施例1:
此系统通过阅卷客户端进行操作。
教师或操作员编辑生成试卷或答题卡模板,同时通过阅卷客户端将各个试题答案的类型和位置信息存入数据库中。
阅卷人或操作员通过扫描仪将试卷或答题卡图像批量扫描生成试卷图片样本集合。
通过阅卷客户端读取扫描生成的试卷图片样本集合,从试卷图片样本集合中获取试卷编号,学生编号及其他相关信息。并根据数据库中存储的题目类型和位置信息分离出选择题和非选择题的试题答案图片样本集合。
将选择题对应的试题答案图片样本集合由选择题识别模块处理,将结果存储在数据库中。
客户端将每一个非选择题对应的试题答案图片样本集合分为若干批次。
客户端初始化一个基于机器学习技术的分类器,其结构按照试题答案图片的大小和输出结果的种类来确定。如果数据库中已经存在同一个试题的分类器训练结果,则用数据库中存储的参数进行初始化。
客户端将每个批次的样本数据逐次经过上述分类器进行分类,其结果输出在客户端的窗口,由阅卷人进行修正。
将阅卷人修正后的结果存入数据库中。
经过人工修正后的阅卷结果和样本数据作为分类器的参考和训练数据,更新分类器的模型参数。
当前试题的全部样本处理结束后,将此试题对应的分类器模型参数存入数据库,再处理下一个非选择题对应的试题答案图片样本集合。
当试卷图片样本集合上的全部或部分试题处理完毕后,统计试卷分数和其他试卷数据,将结果存储在数据库中,并按用户需求输出报告。
实施例2:
此系统部署在阅卷服务器上,由操作人通过浏览器进行操作。
教师或操作员编辑生成试卷或答题卡模板,将试卷或答题卡模板上传到服务器上,通过浏览器将各个试题答案的类型和位置信息标定并记录在服务器端的数据库上。
阅卷人或操作员通过扫描仪将试卷或答题卡图像批量扫描生成试卷图片样本集合并上传到服务器端。
服务器端的程序读取扫描生成的试卷图片样本集合,从试卷图片样本集合中获取试卷编号,学生编号及其他相关信息。并根据数据库中存储的题目类型和位置信息分离出选择题和非选择题的试题答案图片样本集合。
将选择题对应的试题答案图片样本集合由选择题识别模块处理,将结果存储在数据库中。
服务器端的程序将每一个非选择题对应的试题答案图片样本集合分为若干批次。
服务器端初始化一个基于机器学习技术的分类器,其结构按照试题答案图片的大小和输出结果的种类来确定。如果数据库中已经存在同一个试题的分类器训练结果,则用数据库中存储的参数进行初始化。
服务器端的程序将每个批次的样本数据逐次经过上述分类器进行分类,其结果输出到浏览器,由阅卷人进行修正。
将阅卷人修正后的结果存入数据库中。
经过人工修正后的阅卷结果和样本数据作为分类器的参考和训练数据,更新分类器的模型参数。
当前试题的全部样本处理结束后,将此试题对应的分类器模型参数存入数据库,再处理下一个非选择题对应的试题答案图片样本集合。
当试卷图片样本集合上的全部或部分试题处理完毕后,统计试卷分数和其他试卷数据,将结果存储在数据库中,并按用户需求输出报告。

Claims (1)

1.一种非选择题的智能批阅方法,将来自不同答题者的试题答案图片样本集合作为输入,经过计算机处理输出批阅结果,其特征在于:
将试题答案图片样本集合分为若干批次,将每个批次的图片样本数据通过分类器产生粗分类结果,然后将粗分类结果经人工批阅后做出必要的修正;将经过修正的结果结合样本数据,对分类器进行训练和更新,将更新后的分类器用于其他批次样本的分类。
CN201710336878.6A 2017-05-14 2017-05-14 一种非选择题的智能批阅方法 Pending CN107194337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710336878.6A CN107194337A (zh) 2017-05-14 2017-05-14 一种非选择题的智能批阅方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710336878.6A CN107194337A (zh) 2017-05-14 2017-05-14 一种非选择题的智能批阅方法

Publications (1)

Publication Number Publication Date
CN107194337A true CN107194337A (zh) 2017-09-22

Family

ID=59872466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710336878.6A Pending CN107194337A (zh) 2017-05-14 2017-05-14 一种非选择题的智能批阅方法

Country Status (1)

Country Link
CN (1) CN107194337A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832768A (zh) * 2017-11-23 2018-03-23 盐城线尚天使科技企业孵化器有限公司 基于深度学习的高效阅卷方法和阅卷系统
CN111008594A (zh) * 2019-12-04 2020-04-14 科大讯飞股份有限公司 改错题评阅方法、相关设备及可读存储介质
CN112182232A (zh) * 2019-07-03 2021-01-05 广州市教育研究院 一种教师智能组卷系统
CN114860133A (zh) * 2022-06-01 2022-08-05 北京达佳互联信息技术有限公司 问卷处理方法、装置、电子设备、介质及产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197084A (zh) * 2007-11-06 2008-06-11 安徽科大讯飞信息科技股份有限公司 自动化英语口语评测学习系统
CN103186658A (zh) * 2012-12-24 2013-07-03 中国科学院声学研究所 用于英语口语考试自动评分的参考语法生成方法和设备
CN104143094A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种无需答题卡的试卷自动阅卷处理方法及系统
US20150302243A1 (en) * 2014-04-18 2015-10-22 Xerox Corporation Distance based binary classifier of handwritten words
CN105184232A (zh) * 2015-08-12 2015-12-23 祁亨年 一种o2o互联网作业本、系统及实现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197084A (zh) * 2007-11-06 2008-06-11 安徽科大讯飞信息科技股份有限公司 自动化英语口语评测学习系统
CN103186658A (zh) * 2012-12-24 2013-07-03 中国科学院声学研究所 用于英语口语考试自动评分的参考语法生成方法和设备
US20150302243A1 (en) * 2014-04-18 2015-10-22 Xerox Corporation Distance based binary classifier of handwritten words
CN104143094A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种无需答题卡的试卷自动阅卷处理方法及系统
CN105184232A (zh) * 2015-08-12 2015-12-23 祁亨年 一种o2o互联网作业本、系统及实现方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832768A (zh) * 2017-11-23 2018-03-23 盐城线尚天使科技企业孵化器有限公司 基于深度学习的高效阅卷方法和阅卷系统
CN112182232A (zh) * 2019-07-03 2021-01-05 广州市教育研究院 一种教师智能组卷系统
CN111008594A (zh) * 2019-12-04 2020-04-14 科大讯飞股份有限公司 改错题评阅方法、相关设备及可读存储介质
CN111008594B (zh) * 2019-12-04 2024-04-19 科大讯飞股份有限公司 改错题评阅方法、相关设备及可读存储介质
CN114860133A (zh) * 2022-06-01 2022-08-05 北京达佳互联信息技术有限公司 问卷处理方法、装置、电子设备、介质及产品

Similar Documents

Publication Publication Date Title
Huang et al. Icdar2019 competition on scanned receipt ocr and information extraction
CN108171297B (zh) 一种答题卡识别方法
US11790641B2 (en) Answer evaluation method, answer evaluation system, electronic device, and medium
CN108764074A (zh) 基于深度学习的主观题智能阅卷方法、系统及存储介质
CN107194337A (zh) 一种非选择题的智能批阅方法
CN111597908A (zh) 试卷批改方法和试卷批改装置
CN109241894A (zh) 一种基于表格定位和深度学习的针对性票据内容识别系统和方法
CN110751137A (zh) 一种自动求解数学题的方法和系统
CN107832768A (zh) 基于深度学习的高效阅卷方法和阅卷系统
CN108735021A (zh) 一种用于学生作业的智能辅导系统
CN110689013A (zh) 一种基于特征识别的自动阅卷方法及系统
CN105590101A (zh) 基于手机拍照的手写答题卡自动处理和阅卷方法及系统
CN107909067A (zh) 智能生成答题卡以及移动终端自动阅卷评分的考试系统
CN110275834A (zh) 用户界面自动化测试系统及方法
CN109242856A (zh) 一种纸质作业电子化批阅方法及装置
CN106846961A (zh) 电子试卷的处理方法和装置
CN105740857A (zh) 一种基于ocr的快速纸笔投票结果自动采集与识别系统
CN110837793A (zh) 一种智能识别手写数学公式批阅系统
CN109657619A (zh) 一种附图翻译方法、装置及存储介质
CN110852204A (zh) 一种智能远程书法数字化学习评价信息处理系统及方法
CN110942063B (zh) 证件文字信息获取方法、装置以及电子设备
DE60115955T2 (de) System und verfahren zur verbesserung der genauigkeit von signalauswertung
CN107066939A (zh) 一种网上阅卷系统的试卷切割处理方法
CN107067399A (zh) 一种试卷图像分割处理方法
CN114266541A (zh) 一种智能批阅试卷的体系方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170922