CN109284355A - 一种批改试卷中口算题的方法及装置 - Google Patents

一种批改试卷中口算题的方法及装置 Download PDF

Info

Publication number
CN109284355A
CN109284355A CN201811125657.5A CN201811125657A CN109284355A CN 109284355 A CN109284355 A CN 109284355A CN 201811125657 A CN201811125657 A CN 201811125657A CN 109284355 A CN109284355 A CN 109284355A
Authority
CN
China
Prior art keywords
topic
searched
paper
changed
mental arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811125657.5A
Other languages
English (en)
Other versions
CN109284355B (zh
Inventor
石凡
何涛
罗欢
陈明权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dana Technology Inc
Original Assignee
Hangzhou Dana Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dana Technology Inc filed Critical Hangzhou Dana Technology Inc
Priority to CN201811125657.5A priority Critical patent/CN109284355B/zh
Publication of CN109284355A publication Critical patent/CN109284355A/zh
Priority to US16/756,468 priority patent/US11721229B2/en
Priority to EP19865656.3A priority patent/EP3859558A4/en
Priority to JP2021517407A priority patent/JP7077483B2/ja
Priority to PCT/CN2019/105321 priority patent/WO2020063347A1/zh
Application granted granted Critical
Publication of CN109284355B publication Critical patent/CN109284355B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种批改试卷中口算题的方法及装置,利用口算引擎对待搜索试卷进行处理,同时根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量,然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷,而对于题目类型为口算题的待搜索题目,在目标试卷内部基于题目的特征向量进行二次查找,查找的标准为最短编辑距离最小,若匹配到的目标题目的题目类型也是口算题,则确认待搜索题目为待批改口算题目,将口算引擎在待批改口算题目区域对应的计算结果作为待批改口算题目的答案,并将口算引擎在所有待批改口算题目区域以外的计算结果丢弃。应用本发明提供的方案可以提高口算题的搜索准确度。

Description

一种批改试卷中口算题的方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种批改试卷中口算题的方法、装置、电子设备和计算机可读存储介质。
背景技术
随着计算机技术和教育信息化的不断推进,计算机技术已经逐步应用于日常的教育教学各项活动中,例如在教学评测场景下得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试,在此状况下,教师背负着很大的批改试卷的工作压力。
目前,智能终端类产品有许多解决批改作业和试卷的搜题APP,将包含待批改试卷的影像输入搜题APP,以便搜题APP根据试卷的影像内容从题库中搜索到与试卷的影像中的各个题目相对应的题目。
现有的题目搜索方法,可以根据题目的题干的文字内容生成题目的特征向量,根据该特征向量从题库中进行搜索。在生成特征向量时,不同的文字(token)基于词频所产生的权重不同,在题干的文字内容中出现越频繁表明该文字(token)越不重要(如“的”字在题干中出现次数很多,则认定“的”字不重要),则将该文字(token)的权重设置的越低。
然而,对于口算题而言,口算题的题干的文字内容大多为数字和计算符号,而数字和计算符号的词频相对较高,即口算题的题干的文字内容中缺乏具有区分度的高权重的文字(token),这会导致不同的口算题所对应的特征向量彼此之间的区分度较小,一旦识别引擎出现微小的识别错误,就会导致口算题匹配到另一个不同的口算题,进而导致口算题目的批改出错。可见,针对口算题的题目批改容易出现错误,准确度不高。
发明内容
本发明的目的在于提供一种批改试卷中口算题的方法、批改、装置、电子设备和计算机可读存储介质,以解决现有的题目批改方式针对口算题进行批改容易出错,准确度不高的问题。
为达到上述目的,本发明提供了一种批改试卷中口算题的方法,所述方法包括:
步骤S11:对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容;
步骤S12:利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果;
步骤S13:根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目;
步骤S14:汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷;
步骤S15:在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定所述目标试卷中与该待搜索题目相匹配的目标题目,若所述目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目;
步骤S16:针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
可选的,在步骤S15中,在所述目标题目的题目类型为口算题,且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下,确定该待搜索题目为待批改口算题目。
可选的,在步骤S14不存在满足预设条件的目标试卷的情况下,在所述待搜索试卷中包含题目类型为口算题的待搜索题目时,将题目类型为口算题的待搜索题目确定为待批改口算题目,针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
可选的,步骤S16还包括:检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致,如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
可选的,当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参考答案不一致时,输出用于表示该待批改口算题目的参考答案不一致的提示信息,以提示试卷批改者注意该待批改口算题目。
可选的,所述预设的口算引擎包括预先训练的第一识别模型,所述第一识别模型是基于神经网络的模型;
步骤S12中利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,包括:
通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型,所述计算类型包括:各种四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算;
根据所识别出的数字、字母、文字、字符以及计算类型进行计算,得到各个区域的计算结果。
可选的,所述步骤S13进一步包括:
步骤S131,将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型;
步骤S132,针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。
可选的,所述题干向量化模型通过以下步骤训练得到:
对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的文字内容;
利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取,从而训练得到所述题干向量化模型。
可选的,预先对题库中试卷上的各个题目的特征向量建立索引信息表;
步骤S132进一步包括:
针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量;
将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。
可选的,在建立所述索引信息表之前,将不同长度的特征向量按照长度进行分组;
所述针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量,包括:
针对每一待搜索题目,在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内,查找与该待搜索题目的特征向量相匹配的特征向量。
可选的,步骤S14将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷,包括:
将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。
可选的,步骤S11对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,包括:
利用预先训练好的检测模型对所述待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,其中,所述检测模型是基于神经网络的模型。
为达到上述目的,本发明还提供了一种批改试卷中口算题的装置,所述装置包括:
检测识别模块,用于对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容;
计算模块,用于利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果;
题目查找模块,用于根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目;
试卷确定模块,用于汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷;
口算题确定模块,用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定所述目标试卷中与该待搜索题目相匹配的目标题目,若所述目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目;
口算题批改模块,用于针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
可选的,所述口算题确定模块,还用于在所述目标题目的题目类型为口算题,且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下,确定该待搜索题目为待批改口算题目。
可选的,所述试卷确定模块,还用于不存在满足预设条件的目标试卷的情况下,在所述待搜索试卷中包含题目类型为口算题的待搜索题目时,将题目类型为口算题的待搜索题目确定为待批改口算题目,针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
可选的,所述口算题批改模块,还用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致,如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
可选的,所述口算题批改模块,还用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参考答案不一致时,输出用于表示该待批改口算题目的参考答案不一致的提示信息,以提示试卷批改者注意该待批改口算题目。
可选的,所述预设的口算引擎包括预先训练的第一识别模型,所述第一识别模型是基于神经网络的模型;
所述计算模块,具体用于通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型,所述计算类型包括:四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算;根据所识别出的数字、字母、文字、字符以及计算类型进行计算,得到各个区域的计算结果。
可选的,所述题目查找模块,包括:
特征向量获得单元,用于将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型;
题目查找单元,用于针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。
可选的,所述题干向量化模型通过以下步骤训练得到:
对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的文字内容;
利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取,从而训练得到所述题干向量化模型。
可选的,所述装置还包括:
预处理模块,用于预先对题库中试卷上的各个题目的特征向量建立索引信息表;
所述题目查找单元,具体用于针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量;将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。
可选的,所述预处理模块,还用于在建立所述索引信息表之前,将不同长度的特征向量按照长度进行分组;
所述题目查找单元,具体用于针对每一待搜索题目,在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内,查找与该待搜索题目的特征向量相匹配的特征向量。
可选的,所述试卷确定模块,具体用于将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。
可选的,所述检测识别模块,具体用于利用预先训练好的检测模型对所述待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,其中,所述检测模型是基于神经网络的模型。
可选的,所述检测识别模块,具体用于利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容,其中,所述第二识别模型是基于神经网络的模型。
为达到上述目的,本发明还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如上任一所述批改试卷中口算题的方法的步骤。
为达到上述目的,本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现所述批改试卷中口算题的方法的步骤。
与现有技术相比,本发明针对待搜索试卷,利用口算引擎对待搜索试卷进行处理,同时根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量,然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷,而对于题目类型为口算题的待搜索题目,在目标试卷内部基于题目的特征向量进行二次查找,查找的标准为最短编辑距离最小,若匹配到的目标题目的题目类型也是口算题,则确认待搜索题目为待批改口算题目,将口算引擎在待批改口算题目区域对应的计算结果作为待批改口算题目的答案,并将口算引擎在所有待批改口算题目区域以外的计算结果丢弃。可见,对于待批改口算题目,由于根据题干的文字内容获得的特征向量彼此间区分度较小,导致从题库中查找的目标试卷中的参考答案与待批改口算题目不匹配的可能性也较大,因此二次查找确定待批改口算题目并采用口算引擎在待批改口算题目区域对应的计算结果作为答案,可以提高口算题目的批改准确度。
附图说明
图1是本发明一实施例提供的批改试卷中口算题的方法的流程示意图;
图2是本发明一实施例提供的批改试卷中口算题的装置的结构示意图;
图3是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
以下结合附图和具体实施例对本发明提出的一种批改试卷中口算题的方法、装置、电子设备及计算机可读存储介质作进一步详细说明。根据权利要求书和下面说明,本发明的优点和特征将更清楚。
为解决现有技术的问题,本发明实施例提供了一种批改试卷中口算题的方法、装置、电子设备及计算机可读存储介质。
需要说明的是,本发明实施例的批改试卷中口算题的方法可应用于本发明实施例的批改试卷中口算题的装置,该批改试卷中口算题的装置可被配置于电子设备上。其中,该电子设备可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等具有各种操作系统的硬件设备。
图1是本发明一实施例提供的一种批改试卷中口算题的方法的流程示意图。请参考图1,一种批改试卷中口算题的方法可以包括如下步骤:
步骤S11:对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容。
待搜索试卷的影像可以为包含待搜索试卷的图像。具体的,可以利用检测模型对待搜索试卷的影像进行检测,检测出待搜索试卷上的各个待搜索题目的区域,所述检测模型是基于神经网络的模型。其中,检测模型例如可以是基于深度卷积神经网络(Convolutional Neural Networks,CNN)对试卷样本训练集中的样本进行训练得到的。利用训练好的检测模型从待搜索试卷的影像中提取二维特征向量,在二维特征向量的每个网格生成不同形状的锚点,使用标注框(Groundtruth Boxes)将检测出的各个待搜索题目的区域进行标注,还可以将标注框与生成的锚点作回归(regression)处理,以使标注框更贴近题目的实际位置。识别完题目区域后会将每道待搜索题目进行切割为单个影像,或者不实际切割,而在处理时将每个待搜索题目区域区分开为单个区域影像进行处理,会根据题目位置信息进行排序。
检测出各个待搜索题目的区域后,可以利用分类识别模型确定各个待搜索题目的题目类型,所述分类识别模型是基于神经网络的模型。其中,分类识别模型例如可以是基于深度卷积神经网络对试卷样本训练集中的样本进行训练得到的,每一样本中的题目均标注有题目类型。题目类型可以分为操作题、口算题、填空题、选择题、应用题等。
同时,还可以利用第二识别模型识别出待搜索题目的区域中题干的文字内容,所述第二识别模型是基于神经网络的模型。首先标注出待搜索题目中的各个组成部分,组成部分可以包括题干、答题和/或图片,进而通过第二识别模型识别出题目中题干的文字内容。其中,第二识别模型可以是基于空洞卷积和注意力模型建立的,具体的,采用空洞卷积对题干、答题和/或图片对应的标注框进行特征提取,再通过注意力模型将提取到的特征解码成字符。
步骤S12:利用预设的口算引擎对待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果。
其中,所述预设的口算引擎可以包括预先训练的第一识别模型,所述第一识别模型是基于神经网络的模型,与第二识别模型相同,第一识别模型可以是基于空洞卷积和注意力模型建立的,具体的,采用空洞卷积对待批改口算题目进行特征提取,再通过注意力模型将提取到的特征解码成字符。
步骤S12中利用预设的口算引擎对待搜索试卷中包含算式和/或公式的区域进行计算处理,可以包括:通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型,所述计算类型包括:四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算;根据所识别出的数字、字母、文字、字符以及计算类型进行计算,得到各个区域的计算结果。举例而言,例如待搜索试卷中某一区域包含“385×8-265=()”,针对该区域,口算引擎通过第一识别模型可以识别出“3”、“8”、“5”、“×”、“8”、“-”、“2”、“6”、“5”、“=”、“(”、“”、“)”,计算类型为四则混合运算,进而再自动计算得到该区域的计算结果。
步骤S13:根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目。
具体的,所述步骤S13进一步可以包括:
步骤S131,将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型。
举例而言,例如待搜索题目中题干的文字内容为“4.小明走3分钟刚好到全程的一半,他家距离学校多少米?(6分)”,将该文字内容输入预先训练的题干向量化模型—sent2vec模型中,获得该题干的特征向量,特征向量可以表示为[x0,x1,x2….xn]。
其中,所述题干向量化模型可以是基于神经网络的模型,如CNN模型,所述题干向量化模型可以通过以下步骤训练得到:对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的文字内容;利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取,从而训练得到所述题干向量化模型。其中,具体的训练过程属于现有技术,在此不做赘述。
步骤S132,针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。
其中,可以通过向量近似搜索的方式,在题库中查找与该待搜索题目的特征向量相匹配的特征向量,具体为在题库中查找与该待搜索题目的特征向量距离最近的特征向量。可以理解的是,不同向量之间的相似性度量(Similarity Measurement)通常采用的方法就是计算向量间的“距离(Distance)”,常用的距离计算方式有:欧式距离、曼哈顿距离、夹角余弦(Cosine)等。本实施例中采用的计算方式是夹角余弦。
优选的,为便于特征向量的查找,还可以预先对题库中试卷上的各个题目的特征向量建立索引信息表。索引信息表中可以存储题库中各个题目的特征向量、题目的具体内容以及题目所在试卷的ID等。
相应的,步骤S132进一步可以包括:针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量;将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。
可以理解的是,在索引信息表中查找到相匹配的特征向量后,在所述索引信息表中找到最接近的题目,此时可以获得最接近题目的具体内容(包括题目的题干、答案和/或图片),以及该最接近题目所在试卷的ID信息。
优选的,在建立所述索引信息表之前,还可以将不同长度的特征向量按照长度进行分组,这样,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量时,可以首先在所述索引信息表中定位到与该待搜索题目的特征向量的长度相同或相近的分组,进而在所述索引信息表中与该待搜索题目的特征向量长度相同的分组内,查找与该待搜索题目的特征向量相匹配的特征向量。其中,分组时可以将长度相同的特征向量分为一组,也可以将长度在某个范围内的特征向量分成一组,本发明对此不做限定。可见,将不同长度的特征向量按照长度分组,可以使得后期搜索题目时根据特征向量的长度在相应分组内进行查询,提高题目搜索速度。可以理解的是,特征向量的长度不同是因为题干的文字数量不同导致的。
步骤S14:汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与待搜索试卷匹配的目标试卷。
其中,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷,具体可以为:将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。实际在处理时,由于题库中每道题目都有相应的试卷ID信息和在当前试卷里的位置信息,因此可以根据最接近题目所在的试卷ID来判断最接近题目是属于哪张试卷的,进而可以确定出现频率最大且大于第一预设阈值的试卷ID,从而将该试卷ID确定为匹配的目标试卷。其中,某一试卷的出现频率可以用以下方式计算:最接近题目在该试卷的待搜索题目的数量与待搜索试卷中待搜索题目总数的比值,或者,该试卷与待搜索试卷相匹配的题目数量与待搜索试卷中待搜索题目总数的比值。可以理解的是,若出现频率最大的试卷的出现频率小于所述第一预设阈值,表示该出现频率最大的试卷与待搜索试卷中相匹配的题目数量太少,此时可以认为题库中不存在与待搜索试卷匹配的目标试卷。
进一步的,在步骤S14不存在满足预设条件的目标试卷的情况下,在所述待搜索试卷中包含题目类型为口算题的待搜索题目时,可以将题目类型为口算题的待搜索题目确定为待批改口算题目,针对每一待批改口算题目,利用预设的口算引擎对该待批改口算题目进行计算并输出该待批改口算题目的计算结果作为该待批改口算题目的答案,完成对所述待搜索试卷上待批改口算题目的批改。
步骤S15:在待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定目标试卷中与该待搜索题目相匹配的目标题目,若目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目。
具体的,针对题目类型为口算题的待搜索题目,进行最短编辑距离匹配的过程可以称之为二次查找的过程,通过二次查找可以进一步确认待搜索试卷中的口算题。在二次查找时,针对每一题目类型为口算题的待搜索题目,可以将目标试卷中与该待搜索题目的最短编辑距离最小且小于第二预设阈值的题目作为该待搜索题目的搜索结果,也就是目标试卷中与该待搜索题目相匹配的目标题目。如果目标题目的题目类型也是口算题,则可以确认该待搜索题目确实为口算题,从而确定该待搜索题目为待批改口算题目。其中,对特征向量进行最短编辑距离匹配的算法属于本领域常规的计算方法,在此不做赘述。
举例而言,例如口算题A:“385×8-265=()”和口算题B:“375×8-265=()”,这两个题目利用题干向量化所获得的特征向量非常近似,因此,若待搜索试卷中某一题目为“385×8-265=()”,在步骤S13中很容易将题库中的口算题B确定为该题目的最接近题目,即此时对该的搜索结果是不准确的。为了提高准确度,针对该题目在目标试卷中进行二次查找,查找的标准为文字的最短编辑距离最小,由于最短编辑距离不计算权重,可以很容易找到该题目在目标试卷中对应的目标题目也就是口算题A,由于口算题A的题目类型标注为口算题,从而确定该题目确实为口算题。
进一步的,在步骤S15中,还可以在所述目标题目的题目类型为口算题,且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下,确定该待搜索题目为待批改口算题目。可以理解的是,对待搜索题目和目标题目的位置进行确认,也就是将待搜索试卷中识别为口算题的题目在待搜索题目中的位置和目标题目在目标试卷中的位置进行比较,两者位置相同表示目标题目确实是该待搜索题目的正确搜索结果,这样可以避免识别时由于向量差异,错误地将该待搜索题目识别为目标试卷中另一道近似的题目。举例而言,待批改口算题目在待搜索试卷中所处的区域,与目标题目在目标试卷中所处的区域一致,则表示二者的位置相同。
步骤S16:针对每一待批改口算题目,将口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对待搜索试卷上待批改口算题目的批改。
具体的,步骤S12中口算引擎会返回很多区域的计算结果,在步骤S16中,针对每一待批改口算题目,会从很多区域的计算结果中找到和该待批改口算题目区域充分重叠的区域对应的计算结果,即为该待批改口算题目的答案。
进一步的,为保证口算题批改结果准确,步骤S16还可以包括:检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致,如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
进一步的,当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参考答案不一致时,输出用于表示该待批改口算题目的参考答案不一致的提示信息,以提示试卷批改者注意该待批改口算题目。
举例而言,若口算引擎的计算结果与该待批改口算题目在目标试卷上对应的参考答案一致,在该待批改口算题目的区域内显示口算引擎的计算结果,若不一致,在该待批改口算题目的区域内显示提示信息,提示信息可以为:“答案待确定,请手动批改”字样。
与现有技术相比,本发明针对待搜索试卷,利用口算引擎对待搜索试卷进行处理,同时根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量,然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷,而对于题目类型为口算题的待搜索题目,在目标试卷内部基于题目的特征向量进行二次查找,查找的标准为最短编辑距离最小,若匹配到的目标题目的题目类型也是口算题,则确认待搜索题目为待批改口算题目,将口算引擎在待批改口算题目区域对应的计算结果作为待批改口算题目的答案,并将口算引擎在所有待批改口算题目区域以外的计算结果丢弃。可见,对于待批改口算题目,由于根据题干的文字内容获得的特征向量彼此间区分度较小,导致从题库中查找的目标试卷中的参考答案与待批改口算题目不匹配的可能性也较大,因此二次查找确定待批改口算题目并采用口算引擎在待批改口算题目区域对应的计算结果作为答案,可以提高口算题目的批改准确度。
相应于上述批改试卷中口算题的方法实施例,本发明提供了一种批改试卷中口算题的装置,参见图2,该装置可以包括:
检测识别模块21,可以用于对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容;
计算模块22,可以用于利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果;
题目查找模块23,可以用于根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目;
试卷确定模块24,可以用于汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷;
口算题确定模块25,可以用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定所述目标试卷中与该待搜索题目相匹配的目标题目,若所述目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目;
口算题批改模块26,可以用于针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
可选的,所述口算题确定模块25,还可以用于在所述目标题目的题目类型为口算题,且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下,确定该待搜索题目为待批改口算题目。
可选的,所述试卷确定模块24,还可以用于不存在满足预设条件的目标试卷的情况下,在所述待搜索试卷中包含题目类型为口算题的待搜索题目时,将题目类型为口算题的待搜索题目确定为待批改口算题目,针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
可选的,所述口算题批改模块26,还可以用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致,如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
可选的,所述口算题批改模块26,还可以用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参考答案不一致时,输出用于表示该待批改口算题目的参考答案不一致的提示信息,以提示试卷批改者注意该待批改口算题目。
可选的,所述预设的口算引擎可以包括预先训练的第一识别模型,所述第一识别模型是基于神经网络的模型;
所述计算模块22,具体可以用于通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型,所述计算类型包括:四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算;根据所识别出的数字、字母、文字、字符以及计算类型进行计算,得到各个区域的计算结果。
可选的,所述题目查找模块23,可以包括:
特征向量获得单元,可以用于将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型;
题目查找单元,可以用于针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。
可选的,所述题干向量化模型可以通过以下步骤训练得到:
对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的文字内容;
利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取,从而训练得到所述题干向量化模型。
可选的,所述装置还可以包括:
预处理模块,可以用于预先对题库中试卷上的各个题目的特征向量建立索引信息表;
所述题目查找单元,具体可以用于针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量;将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。
可选的,所述预处理模块,还可以用于在建立所述索引信息表之前,将不同长度的特征向量按照长度进行分组;
所述题目查找单元,具体可以用于针对每一待搜索题目,在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内,查找与该待搜索题目的特征向量相匹配的特征向量。
可选的,所述试卷确定模块24,具体可以用于将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。
可选的,所述检测识别模块21,具体可以用于利用预先训练好的检测模型对所述待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,其中,所述检测模型是基于神经网络的模型。
可选的,所述检测识别模块21,具体可以用于利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容,其中,所述第二识别模型是基于神经网络的模型。
本发明还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
步骤S11:对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容;
步骤S12:利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果;
步骤S13:根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目;
步骤S14:汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷;
步骤S15:在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定所述目标试卷中与该待搜索题目相匹配的目标题目,若所述目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目;
步骤S16:针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图1所示的方法实施例,在此不做赘述。
另外,处理器301执行存储器303上所存放的程序而实现的批改试卷中口算题的方法的其他实现方式,与前述方法实施例部分所提及的实现方式相同,这里也不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述的批改试卷中口算题的方法的步骤。
需要说明的是,本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。

Claims (20)

1.一种批改试卷中口算题的方法,其特征在于,所述方法包括:
步骤S11:对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容;
步骤S12:利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果;
步骤S13:根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目;
步骤S14:汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷;
步骤S15:在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定所述目标试卷中与该待搜索题目相匹配的目标题目,若所述目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目;
步骤S16:针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
2.如权利要求1所述的批改试卷中口算题的方法,其特征在于,在步骤S15中,在所述目标题目的题目类型为口算题,且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下,确定该待搜索题目为待批改口算题目。
3.如权利要求1所述的批改试卷中口算题的方法,其特征在于,在步骤S14不存在满足预设条件的目标试卷的情况下,在所述待搜索试卷中包含题目类型为口算题的待搜索题目时,将题目类型为口算题的待搜索题目确定为待批改口算题目,针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
4.如权利要求1所述的批改试卷中口算题的方法,其特征在于,步骤S16还包括:检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致,如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
5.如权利要求4所述的批改试卷中口算题的方法,其特征在于,当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参考答案不一致时,输出用于表示该待批改口算题目的参考答案不一致的提示信息,以提示试卷批改者注意该待批改口算题目。
6.如权利要求1所述的批改试卷中口算题的方法,其特征在于,所述预设的口算引擎包括预先训练的第一识别模型,所述第一识别模型是基于神经网络的模型;
步骤S12中利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,包括:
通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型,所述计算类型包括:各种四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算;
根据所识别出的数字、字母、文字、字符以及计算类型进行计算,得到各个区域的计算结果。
7.如权利要求1所述的批改试卷中口算题的方法,其特征在于,所述步骤S13进一步包括:
步骤S131,将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中,得到每一待搜索题目的题干的特征向量,作为每一待搜索题目的特征向量,其中,所述题干向量化模型是基于神经网络的模型;
步骤S132,针对每一待搜索题目,在题库中进行搜索,查找与该待搜索题目的特征向量相匹配的特征向量,将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。
8.如权利要求7所述的批改试卷中口算题的方法,其特征在于,所述题干向量化模型通过以下步骤训练得到:
对第一题目样本训练集中每个题目样本进行标注处理,标注出每个题目样本中题干的文字内容;
利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取,从而训练得到所述题干向量化模型。
9.如权利要求7所述的批改试卷中口算题的方法,其特征在于,预先对题库中试卷上的各个题目的特征向量建立索引信息表;
步骤S132进一步包括:
针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量;
将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。
10.如权利要求9所述的批改试卷中口算题的方法,其特征在于,在建立所述索引信息表之前,将不同长度的特征向量按照长度进行分组;
所述针对每一待搜索题目,在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量,包括:
针对每一待搜索题目,在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内,查找与该待搜索题目的特征向量相匹配的特征向量。
11.如权利要求1所述的批改试卷中口算题的方法,其特征在于,步骤S14将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷,包括:
将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。
12.如权利要求1所述的批改试卷中口算题的方法,其特征在于,步骤S11对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,包括:
利用预先训练好的检测模型对所述待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,其中,所述检测模型是基于神经网络的模型。
13.如权利要求1所述的批改试卷中口算题的方法,其特征在于,步骤S11识别出各个待搜索题目的区域中题干的文字内容,包括:
利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容,其中,所述第二识别模型是基于神经网络的模型。
14.一种批改试卷中口算题的装置,其特征在于,所述装置包括:
检测识别模块,用于对待搜索试卷的影像进行检测,检测出所述待搜索试卷上的各个待搜索题目的区域,确定各个待搜索题目的题目类型,并识别出各个待搜索题目的区域中题干的文字内容;
计算模块,用于利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理,得到各个区域的计算结果;
题目查找模块,用于根据每一待搜索题目的题干的文字内容,获得该待搜索题目的特征向量,并根据该待搜索题目的特征向量在题库中进行搜索,查找该待搜索题目最接近的题目;
试卷确定模块,用于汇总查找到的所有待搜索题目的最接近题目所在的试卷,将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷;
口算题确定模块,用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下,针对每一题目类型为口算题的待搜索题目,将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配,确定所述目标试卷中与该待搜索题目相匹配的目标题目,若所述目标题目的题目类型为口算题,则确定该待搜索题目为待批改口算题目;
口算题批改模块,用于针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
15.如权利要求14所述的批改试卷中口算题的装置,其特征在于,所述口算题确定模块,还用于在所述目标题目的题目类型为口算题,且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下,确定该待搜索题目为待批改口算题目。
16.如权利要求14所述的批改试卷中口算题的装置,其特征在于,所述试卷确定模块,还用于不存在满足预设条件的目标试卷的情况下,在所述待搜索试卷中包含题目类型为口算题的待搜索题目时,将题目类型为口算题的待搜索题目确定为待批改口算题目,针对每一待批改口算题目,将所述口算引擎在该待批改口算题目区域对应的计算结果,作为该待批改口算题目的答案,并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃,完成对所述待搜索试卷上待批改口算题目的批改。
17.如权利要求14所述的批改试卷中口算题的装置,其特征在于,所述口算题批改模块,还用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致,如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
所述口算题批改模块,还用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参考答案不一致时,输出用于表示该待批改口算题目的参考答案不一致的提示信息,以提示试卷批改者注意该待批改口算题目。
18.如权利要求14所述的批改试卷中口算题的装置,其特征在于,所述预设的口算引擎包括预先训练的第一识别模型,所述第一识别模型是基于神经网络的模型;
所述计算模块,具体用于通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型,所述计算类型包括:四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算;根据所识别出的数字、字母、文字、字符以及计算类型进行计算,得到各个区域的计算结果。
19.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-13任一所述的方法步骤。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-13任一项所述的方法步骤。
CN201811125657.5A 2018-09-26 2018-09-26 一种批改试卷中口算题的方法及装置 Active CN109284355B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201811125657.5A CN109284355B (zh) 2018-09-26 2018-09-26 一种批改试卷中口算题的方法及装置
US16/756,468 US11721229B2 (en) 2018-09-26 2019-09-11 Question correction method, device, electronic equipment and storage medium for oral calculation questions
EP19865656.3A EP3859558A4 (en) 2018-09-26 2019-09-11 ANSWER MARKING PROCEDURE FOR HEADPHONES, DEVICE, ELECTRONIC DEVICE AND STORAGE MEDIA
JP2021517407A JP7077483B2 (ja) 2018-09-26 2019-09-11 暗算問題に対する問題添削方法、装置、電子機器及び記憶媒体
PCT/CN2019/105321 WO2020063347A1 (zh) 2018-09-26 2019-09-11 针对口算题的题目批改方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811125657.5A CN109284355B (zh) 2018-09-26 2018-09-26 一种批改试卷中口算题的方法及装置

Publications (2)

Publication Number Publication Date
CN109284355A true CN109284355A (zh) 2019-01-29
CN109284355B CN109284355B (zh) 2020-09-22

Family

ID=65182340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811125657.5A Active CN109284355B (zh) 2018-09-26 2018-09-26 一种批改试卷中口算题的方法及装置

Country Status (1)

Country Link
CN (1) CN109284355B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929582A (zh) * 2019-10-25 2020-03-27 广州视源电子科技股份有限公司 口算题自动批改方法及装置、存储介质、电子设备
WO2020063347A1 (zh) * 2018-09-26 2020-04-02 杭州大拿科技股份有限公司 针对口算题的题目批改方法、装置、电子设备和存储介质
WO2020177531A1 (zh) * 2019-03-04 2020-09-10 杭州大拿科技股份有限公司 题目辅助方法及系统
CN111666799A (zh) * 2019-03-08 2020-09-15 小船出海教育科技(北京)有限公司 一种口算题的校验方法及终端
CN112396009A (zh) * 2020-11-24 2021-02-23 广东国粒教育技术有限公司 一种基于全卷积神经网络模型的算题批改方法、算题批改装置
WO2021051502A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于长短期记忆的教学方法、装置和计算机设备
CN112559676A (zh) * 2019-09-25 2021-03-26 北京新唐思创教育科技有限公司 相似题目的检索方法、装置及计算机存储介质
CN112686170A (zh) * 2020-12-31 2021-04-20 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备
CN112699881A (zh) * 2020-12-31 2021-04-23 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060240394A1 (en) * 2005-04-20 2006-10-26 Management Simulations, Inc. Examination simulation system and method
CN101950496A (zh) * 2010-01-04 2011-01-19 代利忠 计算类型题目随机出题及答案生成的方法
US20110165550A1 (en) * 2010-01-07 2011-07-07 Ubion Corp. Management system for online test assessment and method thereof
KR20150041897A (ko) * 2013-10-10 2015-04-20 재단법인대구경북과학기술원 영상 처리를 통한 실시간 시험 문제지 채점 장치 및 그 동작 방법
CN104809677A (zh) * 2015-05-13 2015-07-29 江苏黄金屋教育咨询有限公司 基于统计和分析知识点掌握情况的自动阅卷方法
CN105955962A (zh) * 2016-05-10 2016-09-21 北京新唐思创教育科技有限公司 题目相似度的计算方法及装置
CN106096564A (zh) * 2016-06-17 2016-11-09 福建网龙计算机网络信息技术有限公司 一种数学自动批改方法
CN106251725A (zh) * 2016-07-21 2016-12-21 北京华云天科技有限公司 试题批改方法和服务器
CN107818168A (zh) * 2017-11-10 2018-03-20 广东小天才科技有限公司 题目搜索方法、装置及设备
CN108537014A (zh) * 2018-04-04 2018-09-14 深圳大学 一种基于移动设备的用户身份认证方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060240394A1 (en) * 2005-04-20 2006-10-26 Management Simulations, Inc. Examination simulation system and method
CN101950496A (zh) * 2010-01-04 2011-01-19 代利忠 计算类型题目随机出题及答案生成的方法
US20110165550A1 (en) * 2010-01-07 2011-07-07 Ubion Corp. Management system for online test assessment and method thereof
KR20150041897A (ko) * 2013-10-10 2015-04-20 재단법인대구경북과학기술원 영상 처리를 통한 실시간 시험 문제지 채점 장치 및 그 동작 방법
CN104809677A (zh) * 2015-05-13 2015-07-29 江苏黄金屋教育咨询有限公司 基于统计和分析知识点掌握情况的自动阅卷方法
CN105955962A (zh) * 2016-05-10 2016-09-21 北京新唐思创教育科技有限公司 题目相似度的计算方法及装置
CN106096564A (zh) * 2016-06-17 2016-11-09 福建网龙计算机网络信息技术有限公司 一种数学自动批改方法
CN106251725A (zh) * 2016-07-21 2016-12-21 北京华云天科技有限公司 试题批改方法和服务器
CN107818168A (zh) * 2017-11-10 2018-03-20 广东小天才科技有限公司 题目搜索方法、装置及设备
CN108537014A (zh) * 2018-04-04 2018-09-14 深圳大学 一种基于移动设备的用户身份认证方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李先岭: "基于识别的公式编辑器的研究和开发", 《中国优秀硕士学位论文全文数据库》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020063347A1 (zh) * 2018-09-26 2020-04-02 杭州大拿科技股份有限公司 针对口算题的题目批改方法、装置、电子设备和存储介质
US11721229B2 (en) 2018-09-26 2023-08-08 Hangzhou Dana Technology Inc. Question correction method, device, electronic equipment and storage medium for oral calculation questions
WO2020177531A1 (zh) * 2019-03-04 2020-09-10 杭州大拿科技股份有限公司 题目辅助方法及系统
CN111666799A (zh) * 2019-03-08 2020-09-15 小船出海教育科技(北京)有限公司 一种口算题的校验方法及终端
WO2021051502A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于长短期记忆的教学方法、装置和计算机设备
CN112559676A (zh) * 2019-09-25 2021-03-26 北京新唐思创教育科技有限公司 相似题目的检索方法、装置及计算机存储介质
CN112559676B (zh) * 2019-09-25 2022-05-17 北京新唐思创教育科技有限公司 相似题目的检索方法、装置及计算机存储介质
CN110929582A (zh) * 2019-10-25 2020-03-27 广州视源电子科技股份有限公司 口算题自动批改方法及装置、存储介质、电子设备
CN112396009A (zh) * 2020-11-24 2021-02-23 广东国粒教育技术有限公司 一种基于全卷积神经网络模型的算题批改方法、算题批改装置
CN112686170A (zh) * 2020-12-31 2021-04-20 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备
CN112699881A (zh) * 2020-12-31 2021-04-23 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备
CN112686170B (zh) * 2020-12-31 2023-10-17 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备

Also Published As

Publication number Publication date
CN109284355B (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
CN109284355A (zh) 一种批改试卷中口算题的方法及装置
CN109583429A (zh) 一种批改试卷中应用题的方法及装置
CN109189895A (zh) 一种针对口算题的题目批改方法及装置
CN109271401A (zh) 一种题目搜索、批改方法、装置、电子设备和存储介质
US11508251B2 (en) Method and system for intelligent identification and correction of questions
CN109670504A (zh) 一种手写答案识别批改方法及装置
CN109710590A (zh) 一种错题本生成方法及装置
CN109712043A (zh) 一种答案批改方法及装置
CN107832432A (zh) 一种搜索结果排序方法、装置、服务器和存储介质
CN108846126A (zh) 关联问题聚合模型的生成、问答式聚合方法、装置及设备
CN109902285B (zh) 语料分类方法、装置、计算机设备及存储介质
CN109815955A (zh) 题目辅助方法及系统
CN116795973B (zh) 基于人工智能的文本处理方法及装置、电子设备、介质
CN109299269A (zh) 一种文本分类方法和装置
CN110825867B (zh) 相似文本推荐方法、装置、电子设备和存储介质
JP7077483B2 (ja) 暗算問題に対する問題添削方法、装置、電子機器及び記憶媒体
CN108121702A (zh) 数学主观题评阅方法及系统
CN111222330B (zh) 一种中文事件的检测方法和系统
CN108090098B (zh) 一种文本处理方法及装置
CN115761366A (zh) 补充缺失特征的零样本图片分类方法、系统、设备及介质
AU2021203869A1 (en) Methods, devices, electronic apparatuses and storage media of image processing
CN109902157A (zh) 一种训练样本有效性检测方法及装置
CN115934955A (zh) 一种电力标准知识图谱构建方法、知识问答系统及装置
CN113486174B (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN113420833A (zh) 一种基于问题语义映射的视觉问答方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant