CN110837793A - 一种智能识别手写数学公式批阅系统 - Google Patents

一种智能识别手写数学公式批阅系统 Download PDF

Info

Publication number
CN110837793A
CN110837793A CN201911064853.0A CN201911064853A CN110837793A CN 110837793 A CN110837793 A CN 110837793A CN 201911064853 A CN201911064853 A CN 201911064853A CN 110837793 A CN110837793 A CN 110837793A
Authority
CN
China
Prior art keywords
model
handwritten
mathematical formula
characters
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911064853.0A
Other languages
English (en)
Inventor
骆研
吴奂
陶双全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201911064853.0A priority Critical patent/CN110837793A/zh
Publication of CN110837793A publication Critical patent/CN110837793A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种智能识别手写数学公式批阅系统,包括如下步骤:(1)识别;(2)预处理;(3)字符识别;(4)生产正答率。本发明采用卷积神经网络模型,无需提取字符特征值,图像识别精度高。本发明采用国际数学公式识别比赛数据集作为训练样本,与实际输入相似。本发明完全取代阅卷人手工阅卷的操作,降低人力成本。本发明为阅卷者或教师提供一份作答者对该试卷各题的正答率报表,使后续教学更具针对性,提高教学质量。

Description

一种智能识别手写数学公式批阅系统
技术领域
本发明涉及一种智能识别手写数学公式批阅系统。
背景技术
在小学手写教学试卷批阅中,基本都是采用人工批阅,采用光学识别技术有计算机系统自动批阅选择题,对于大多数非选择题仍需阅卷人进行传统的手工批阅方式,如在纸质试卷上批改或在计算机上对试卷的扫描件批改。此外,有一些解决方案,例如(ZL201410472818.3),采用预先训练的通用字符分类器和字符分割算法以及语义分析系统代替人工批阅,但是由于试卷答案内容的多样性,当答案中含有特殊符号或图形,以及多个字符之间难以分割时的批阅准确率仍然比较低,需要大量人工干预,所以阅卷的整体效率仍然不高。
目前在计算机阅卷领域,教师在网上阅卷或纸质阅卷,工作量大,人力需求较大,整体工作效率偏低,仍不能完全取代传统手工阅卷方式。因此随着互联网技术和产品逐步向教育领域渗透,在线教育的受众的规模不断扩大,又进一步增加了考试和作业评阅的数量。因此如何减少人工评阅的工作量,提升评阅尤其是评分的准确性和客观性,是目前业界亟待解决的问题。
发明内容
针对上述现有技术的不足,本发明提供了一种智能识别手写数学公式批阅系统,并可整理出答卷者对每道题的作答情况,可以极大降低阅卷者的劳动强度,并提高工作效率,对后续教学工作提高了针对性,让教师更了解学生对知识的掌握程度。
本发明提供了一种智能识别手写数学公式批阅系统,包括如下步骤:
(1)识别:基于CHROME数据集训练用于识别手写卷子上数学公式的模型,该模型用于识别所述手写卷子上的各个题目的手写区域,其中,所述模型是基于lenet5的卷积神经网络的模型;
(2)预处理:根据收集的学生手写数学试卷拍照或扫描成图片文档,所述图片文档使用opencv对输入的图像进行预处理,包括灰度化、二值化、高斯滤波和字符分割,所述字符分割是将字符裁剪出来再归一化成固定大小的矩阵;
(3)字符识别:根据分割出的字符采用深度学习预先训练的模型分类器完成字符识别,所述模型是基于lenet5的卷积神经网络的模型,该模型图像识别精确度高;
(4)生产正答率:根据将各个非选择题单独进行与标准答案识别匹配,并逐题生成各个非选择题的正答率,可为各类学校和考试机构提高阅卷效率,并根据各类题目的正答率,得出本批答题者对各个题目的掌握程度。
进一步的,步骤(1)中的所述模型用于识别字符,所述字符包括打印字体和手写字符组成;所述手写字符是特指手写数学公式的计算题。
进一步的,所述的模型是通过以下步骤训练得到的:
在TensorFlow上训练了一个lenet5的卷积神经网络,所述网络用来识别数学字符,所述数据集是使用CHROME数据集。
进一步的,所述的神经网路是基于tensorflow上训练的深度学习网络模型。
进一步的,卷积神经网络模型从所述手写数学公式试卷的影像中提取二维特征向量,包括灰度化、二值化、高斯滤波和字符分割。
本发明的有益效果是:本发明采用卷积神经网络模型,无需提取字符特征值,图像识别精度高。本发明采用国际数学公式识别比赛数据集作为训练样本,与实际输入相似。本发明完全取代阅卷人手工阅卷的操作,降低人力成本。本发明为阅卷者或教师提供一份作答者对该试卷各题的正答率报表,使后续教学更具针对性,提高教学质量。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1是本发明的题目智能识别手写数学公式批阅系统的总流程图。
图2是本发明的图像预处理的流程图。
图3是本发明的字符识别卷积神经网络结构图。
图4是本发明的语义分析的节点属性传递过程流程图。
具体实施方式
为使本发明的内容更加清楚易懂,以下结合说明书附图,对本发明的内容作进一步说明。当然本发明并不局限于该具体实施例,本领域内的技术人员所熟知的一般替换也涵盖在本发明的保护范围内。
如图1-4所示,图1示出了本发明的题目智能识别手写数学公式批阅系统执行的整个流程:
(1)用户采用电子扫描设备或其他设备将纸质试卷转变成电子版,用户上传手写数学公式试卷照片文档。
(2)将样本采用openCV进行灰度化、二值化和字符切割等技术提炼字符特征。图2显示了步骤(2)的图像预处理的流程图;
(3)将预先训练的lenet5神经网络模型进行字符识别,所述预训练模型是基于CHROME数据集训练用于识别手写数学公式的模型,该模型用于识别所述的手写卷子上的各个题目的手写区域,其中,图3是基于lenet5的卷积神经网络的模型结构图。
(4)根据分割出的字符采用深度学习预先训练的模型分类器完成字符识别,所述模型是基于lenet5的卷积神经网络的模型。该模型图像识别精确度高。
(5)根据词法分析,系统自动机后得到数学元素节点序列,图4语义分析的节点属性传递过程流程图。
(6)计算题还原,通过字符空间关系判定,结构分析和文法分析方法将计算题还原用于下一步的手写数字识别做铺垫。
(7)构建数学计算题解析树。
(8)计算题自动求解,通过数学计算题解析树,利用语法制导翻译,此过程可以定位计算题数学公式并判断数学题是否正确,正确打勾√,错误标注×,
(9)根据模型识别的结果以图片的方式显示计算过程和求解结果以及汇总正答率和错题。

Claims (5)

1.一种智能识别手写数学公式批阅系统,其特征在于,包括如下步骤:
(1)识别:基于CHROME数据集训练用于识别手写卷子上数学公式的模型,该模型用于识别所述手写卷子上的各个题目的手写区域,其中,所述模型是基于lenet5的卷积神经网络的模型;
(2)预处理:根据收集的学生手写数学试卷拍照或扫描成图片文档,所述图片文档使用opencv对输入的图像进行预处理,包括灰度化、二值化、高斯滤波和字符分割,所述字符分割是将字符裁剪出来再归一化成固定大小的矩阵;
(3)字符识别:根据分割出的字符采用深度学习预先训练的模型分类器完成字符识别,所述模型是基于lenet5的卷积神经网络的模型,该模型图像识别精确度高;
(4)生产正答率:根据将各个非选择题单独进行与标准答案识别匹配,并逐题生成各个非选择题的正答率,可为各类学校和考试机构提高阅卷效率,并根据各类题目的正答率,得出本批答题者对各个题目的掌握程度。
2.如权利要求1所述智能识别手写数学公式批阅系统,其特征在于,步骤(1)中的所述模型用于识别字符,所述字符包括打印字体和手写字符组成;所述手写字符是特指手写数学公式的计算题。
3.如权利要求1所述的智能识别手写数学公式批阅系统,其特征在于,所述的模型是通过以下步骤训练得到的:
在TensorFlow上训练了一个lenet5的卷积神经网络,所述网络用来识别数学字符,所述数据集是使用CHROME数据集。
4.如权利要求1所述的智能识别手写数学公式批阅系统,其特征在于,所述的神经网路是基于tensorflow上训练的深度学习网络模型。
5.如权利要求1所述的智能识别手写数学公式批阅系统,其特征在于,卷积神经网络模型从所述手写数学公式试卷的影像中提取二维特征向量,包括灰度化、二值化、高斯滤波和字符分割。
CN201911064853.0A 2019-11-04 2019-11-04 一种智能识别手写数学公式批阅系统 Pending CN110837793A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911064853.0A CN110837793A (zh) 2019-11-04 2019-11-04 一种智能识别手写数学公式批阅系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911064853.0A CN110837793A (zh) 2019-11-04 2019-11-04 一种智能识别手写数学公式批阅系统

Publications (1)

Publication Number Publication Date
CN110837793A true CN110837793A (zh) 2020-02-25

Family

ID=69576037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911064853.0A Pending CN110837793A (zh) 2019-11-04 2019-11-04 一种智能识别手写数学公式批阅系统

Country Status (1)

Country Link
CN (1) CN110837793A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738169A (zh) * 2020-06-24 2020-10-02 北方工业大学 一种基于端对端网络模型的手写公式识别方法
CN111986117A (zh) * 2020-08-31 2020-11-24 南京大学 一种算术作业批改系统及方法
CN112597990A (zh) * 2020-12-22 2021-04-02 安徽鸿程光电有限公司 手写公式的判阅方法、系统、终端设备及存储介质
CN112906559A (zh) * 2021-02-10 2021-06-04 网易有道信息技术(北京)有限公司 由机器实施的用于批改算式的方法及相关产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108932508A (zh) * 2018-08-13 2018-12-04 杭州大拿科技股份有限公司 一种题目智能识别、批改的方法和系统
CN110084239A (zh) * 2019-04-10 2019-08-02 中国科学技术大学 降低离线手写数学公式识别时网络训练过拟合的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108932508A (zh) * 2018-08-13 2018-12-04 杭州大拿科技股份有限公司 一种题目智能识别、批改的方法和系统
CN110084239A (zh) * 2019-04-10 2019-08-02 中国科学技术大学 降低离线手写数学公式识别时网络训练过拟合的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吕红: "基于卷积神经网络的手写数字识别系统的设计" *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738169A (zh) * 2020-06-24 2020-10-02 北方工业大学 一种基于端对端网络模型的手写公式识别方法
CN111738169B (zh) * 2020-06-24 2023-05-23 北方工业大学 一种基于端对端网络模型的手写公式识别方法
CN111986117A (zh) * 2020-08-31 2020-11-24 南京大学 一种算术作业批改系统及方法
CN112597990A (zh) * 2020-12-22 2021-04-02 安徽鸿程光电有限公司 手写公式的判阅方法、系统、终端设备及存储介质
CN112906559A (zh) * 2021-02-10 2021-06-04 网易有道信息技术(北京)有限公司 由机器实施的用于批改算式的方法及相关产品
CN112906559B (zh) * 2021-02-10 2022-03-18 网易有道信息技术(北京)有限公司 由机器实施的用于批改算式的方法及相关产品

Similar Documents

Publication Publication Date Title
CN110348400B (zh) 一种评分获取方法、装置及电子设备
CN110110585B (zh) 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110110581B (zh) 一种基于人工智能的试卷批改方法和系统
CN110837793A (zh) 一种智能识别手写数学公式批阅系统
WO2020034523A1 (zh) 一种题目智能识别、批改的方法和系统
CN111597908A (zh) 试卷批改方法和试卷批改装置
CN108121702B (zh) 数学主观题评阅方法及系统
CN108052504B (zh) 数学主观题解答结果的结构分析方法及系统
CN105427696A (zh) 一种对目标题目所作答案进行判别的方法
CN111144079B (zh) 一种智能获取学习资源的方法、装置、打印机和存储介质
CN109242856A (zh) 一种纸质作业电子化批阅方法及装置
CN110689018A (zh) 一种智能阅卷系统及其处理方法
CN107301411A (zh) 数学公式识别方法及装置
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN112116840B (zh) 一种基于图像识别的作业批改方法、系统和智能终端
CN113408253A (zh) 一种作业评阅系统及方法
CN108681713A (zh) 一种用于教师教学质量评价的系统
CN112966518A (zh) 一种面向大规模在线学习平台的优质答案识别方法
CN107992482B (zh) 数学主观题解答步骤的规约方法及系统
CN111428623B (zh) 基于大数据和计算机视觉的中文板书风格分析系统
Rajesh et al. Digitized exam paper evaluation
CN112164262A (zh) 一种智能阅卷辅导系统
CN113256457A (zh) 一种基于人工智能的在线学习诊断方法及装置
CN112613500A (zh) 一种基于深度学习的校园动态阅卷系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination