CN113971805A - 一种结合机器视觉和语义分析的智能阅卷评分方法 - Google Patents

一种结合机器视觉和语义分析的智能阅卷评分方法 Download PDF

Info

Publication number
CN113971805A
CN113971805A CN202111578858.2A CN202111578858A CN113971805A CN 113971805 A CN113971805 A CN 113971805A CN 202111578858 A CN202111578858 A CN 202111578858A CN 113971805 A CN113971805 A CN 113971805A
Authority
CN
China
Prior art keywords
test paper
text
answering
standard answer
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111578858.2A
Other languages
English (en)
Inventor
胡为民
郑喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dib Enterprise Risk Management Technology Co ltd
Original Assignee
Shenzhen Dib Enterprise Risk Management Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dib Enterprise Risk Management Technology Co ltd filed Critical Shenzhen Dib Enterprise Risk Management Technology Co ltd
Priority to CN202111578858.2A priority Critical patent/CN113971805A/zh
Publication of CN113971805A publication Critical patent/CN113971805A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Geometry (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种结合机器视觉和语义分析的智能阅卷评分方法,包括:手写体识别阶段;对输入的试卷扫描图像进行缩放;对缩放后的试卷扫描图像进行预处理,得到缩放后的试卷图像手写体文字的连通域;根据连通域中的手写体文字,得到单字符文本;对所有单字符文本进行校验和修正,得到试卷作答文本;智能评分阶段;根据试卷作答文本和标准答案文本,得到试卷作答文本向量和标准答案文本向量;计算试卷作答文本向量和标准答案文本向量之间的相似度,得到试卷作答文本和标准答案文本之间的匹配程度,匹配程度为最终题目作答得分;该方法提升了手写体文字识别的准确性,实现了智能阅卷评分,提高了教学事务中主观题阅卷评分的工作效率。

Description

一种结合机器视觉和语义分析的智能阅卷评分方法
技术领域
本发明属于智能阅卷评分技术领域,尤其涉及一种结合机器视觉和语义分析的智能阅卷评分方法。
背景技术
阅卷评分作为教学事务中的关键环节一直以来耗费阅卷人大量的时间和精力,特别是当试卷数量较大时。传统通过答题卡等方式仅能支持客观题阅卷评分,难以支持主观题,特别是主观题手写体阅卷评分,不同于客观题阅卷评分,主观题存在考试人作答内容多样性、不统一的问题,需要阅卷人理解标准答案和主观题作答内容的语境语义才能给出合理的评分,类似客观题作答和答案匹配的方式不再有效。不仅如此,当前试卷作答仍以纸质手写体作答为主,考试人作答时的笔迹形态各异,传统手写体识别技术受限于训练样本规模和泛化性,容易出现手写体识别错误的现象,而一旦关键作答内容识别错误,会造成语义偏差较大使得阅卷评分不准确的问题。
发明内容
本发明的目的在于克服上述现有技术中主观题手写体难以阅卷评分的不足,提供了一种针对主观题手写体阅卷评分的方法,具体为一种结合机器视觉和语义分析的智能阅卷评分方法。
本发明提供了一种结合机器视觉和语义分析的智能阅卷评分方法,包括:
手写体识别阶段;
S1:对输入的试卷扫描图像进行缩放;
S2:对缩放后的试卷扫描图像进行预处理,得到缩放后的试卷图像手写体文字的连通域;
S3:根据连通域中的手写体文字,得到单字符文本;
S4:对所有单字符文本进行校验和修正,得到试卷作答文本;
智能评分阶段;
S5:根据试卷作答文本和标准答案文本,得到试卷作答文本向量和标准答案文本向量;
S6:计算试卷作答文本向量和标准答案文本向量之间的相似度,得到试卷作答文本和标准答案文本之间的匹配程度,匹配程度为最终题目作答得分。
优选的,S1中,采用双线性插值法对输入的试卷扫描图像进行缩放。
优选的,S2中,试卷扫描图像包括试卷作答区图像,采用阈值分割法对缩放后的试卷作答区图像进行二值化处理,采用区域自增长算法得到缩放后的试卷图像手写体文字的连通域,并根据连通域将试卷作答区图像分割成多个手写体单字符图像。
优选的,S2中,还包括剔除噪点,噪点为连通域面积小于10的缩放后的试卷作答区图像。
优选的,S3中,包括步骤:
S3.1:基于全卷积神经网络对连通域中的手写体进行特征提取,将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中,全卷积神经网络将计算全连接层向量,输出手写体文字分类置信度,并通过训练样本训练全卷积神经网络,手写体文字分类置信度用于与训练样本的标签值进行比较,修正网络权重;
S3.2:提取全卷积神经网络中全连接层向量作为特征向量,采用K近邻算法与训练样本逐一比较,得到手写体中文字符,进而得到单字符文本。
优选的,S4中,基于马尔科夫矩阵,提取单字符文本中手写体中文字符的上下文条件转移概率,并进行判断,若概率小于阈值,则手写体中文字符为异常字符,并将异常字符修正为手写体中文字符的上下文条件转移概率最大的字符;若概率大于阈值,则手写体中文字符为正常字符;根据异常字符修正后的字符、以及正常字符,构建试卷作答文本。
优选的,S5中,包括:
S5.1:采用分词法对试卷作答文本、以及给定的标准答案文本进行中文分词,分别得到试卷作答文本词语集和标准答案文本词语集;
S5.2:采用词向量模型提取试卷作答文本词语集中所有分词的词向量,得到试卷作答词向量;采用加权方法对试卷作答文本词语集中所有分词进行统一加权,得到试卷作答词权;根据试卷作答词向量和试卷作答词权,得到试卷作答文本向量;
采用词向量模型提取标准答案文本词语集中所有分词的词向量,得到标准答案词向量;采用加权方法对标准答案文本词语集中所有分词进行统一加权,得到标准答案词权;根据标准答案词向量和标准答案词权,得到标准答案文本向量。
优选的,S6中,包括:
S6.1:将试卷作答文本向量与标准答案文本向量代入欧氏距离计算方法中,得到两向量之间的欧氏距离;
将试卷作答文本向量与标准答案文本向量代入余弦相似度计算方法中,得到两向量之间的余弦相似度;
S6.2:将两向量之间的欧氏距离和两向量之间的余弦相似度进行加权求和,得到试卷作答文本与标准答案文本之间的匹配程度,匹配程度即为最终题目作答得分。
优选的,S3.1中,全卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层,输入分割成多个手写体单字符图像的试卷扫描图像至输入层;卷积层提取局部视野权重共享特征;池化层对缩放后的试卷扫描图像进行降维处理;全连接层是全卷积神经网络中的隐含层,当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时,全卷积神经网络将计算全连接层向量,全连接层用于对手写体文字进行分类,输出层输出分类置信度。
有益效果:本发明提供的这种方法针对主观题手写体阅卷评分,采用马尔科夫矩阵校验和修正手写体文字识别中的错误信息,提升了手写体文字识别的准确性;采用欧式距离和余弦相似度计算试卷作答文本与标准答案文本之间的匹配程度,以匹配程度作为最终题目作答得分;实现了智能阅卷评分,提高了教学事务中主观题阅卷评分的工作效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施中方法的流程图。
图2为本发明实施中全卷积神经网络的架构图。
具体实施方式
下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供了一种结合机器视觉和语义分析的智能阅卷评分方法,包括:
手写体识别阶段;
S1:对输入的试卷扫描图像进行缩放;
在本实施例中,对于输入m*n尺寸的试卷扫描图像
Figure 543072DEST_PATH_IMAGE001
,采用双线性插值法
Figure 663475DEST_PATH_IMAGE002
对输入的试卷扫描图像进行缩放,缩放至420*300尺寸的
Figure 315648DEST_PATH_IMAGE003
,如下公式所示:
Figure 914120DEST_PATH_IMAGE004
其中,x、y为420*300尺寸缩放的试卷扫描图像中对应横坐标和纵坐标位置,取值如下公式所示:
Figure 197334DEST_PATH_IMAGE005
其中,ximg、yimg为原试卷扫描图像中横纵坐标位置;x1、x2、y1、y2为原试卷扫描图像中插值范围对应横纵坐标位置,
Figure 488638DEST_PATH_IMAGE006
表示图像中对应x、y坐标位置的像素灰度值;x1、x2、y1、y2取值如下公式所示:
Figure 224513DEST_PATH_IMAGE007
S2:对缩放后的试卷扫描图像进行预处理,得到缩放后的试卷图像手写体文字的连通域;
具体的,试卷扫描图像包括试卷作答区图像,采用阈值分割法(阈值分割法中阈值设定为128)对缩放后的试卷作答区图像进行二值化处理,采用区域自增长算法(深度优先遍历所有连通的像素)得到缩放后的试卷图像手写体文字的连通域,剔除噪点,噪点为连通域面积小于10的缩放后的试卷作答区图像,并根据连通域将试卷作答区图像分割成多个手写体单字符图像,后续采用全卷机神经网络识别手写体单字符图像,再将识别出的单字符文本合并为试卷作答文本。
S3:根据连通域中的手写体文字,得到单字符文本;
具体的,包括步骤:
S3.1:基于全卷积神经网络对连通域中的手写体进行特征提取,将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中,全卷积神经网络将计算全连接层向量,输出手写体文字分类置信度。通过训练样本训练全卷积神经网络,以识别试卷扫描图像中的手写体文字,其中训练方法采用梯度下降法;手写体文字分类置信度用于与训练样本的标签值进行比较,修正网络权重。
S3.2:因为手写体中文的字符数量较多,全卷积神经网络的全连接层分类函数在处理超多类分类时准确性会随着分类数量增加而下降,故本实施例提取全卷积神经网络中全连接层向量作为特征向量,采用K近邻算法(K=1,余弦距离)与训练样本逐一比较,得到手写体中文字符,进而得到单字符文本。
如图2所示,全卷积神经网络包括一个输入层、两个卷积层、两个池化层、一个全连接层和一个输出层,输入缩放后的420*300试卷扫描图像至输入层,卷积层提取局部视野权重共享特征,卷积核是数量为10的5*5的随机卷积核,池化层对缩放后的试卷扫描图像进行降维处理,池化核是数量为10的2*2的最大值池化核,全连接层的激活函数采用Softmax函数,损失函数采用交叉熵损失函数,全连接层是全卷积神经网络中的隐含层,是全卷积神经网络组成部分,当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时,全卷积神经网络将计算全连接层向量,用于对手写体文字进行分类,输出层输出分类置信度。
S4:对所有单字符文本进行校验和修正,得到试卷作答文本;
具体的,由于受限于训练样本的规模和泛化性,容易出现手写体文字识别错误的现象,而一旦关键作答内容识别错误,会造成语义偏差较大使得阅卷评分不准确的问题,故本实施例采用马尔科夫矩阵验证并自适应修正手写体文字识别中的错误信息,提升手写体文字识别的准确性,利用常用中文词库基于马尔科夫矩阵,提取单字符文本中手写体中文字符的上下文条件转移概率,并进行判断,若概率小于阈值(阈值设定为0.0001),则手写体中文字符为异常字符,并将异常字符修正为手写体中文字符的上下文条件转移概率最大的字符;若概率大于阈值,则手写体中文字符为正常字符;实现手写体文字是识别中错误信息的验证并自适应修正,根据异常字符修正后的字符、以及正常字符,构建试卷作答文本;
马尔科夫矩阵中i、j分别表示两相邻前、后连续中文字符
Figure 892254DEST_PATH_IMAGE008
在词库中的索引,矩阵元素表示两相邻前、后连续中文字符在词库汇总的条件转移概率,记为:
Figure 29975DEST_PATH_IMAGE009
,其计算公式如下:
Figure 226601DEST_PATH_IMAGE010
Figure 449772DEST_PATH_IMAGE011
表示两相邻前、后连续中文字符
Figure 655625DEST_PATH_IMAGE012
的联合概率,
Figure 647852DEST_PATH_IMAGE013
表示两相邻前连续中文字在词库中出现的概率。
手写体中文字符的上下文条件转移概率记为:
Figure 546538DEST_PATH_IMAGE014
手写体中文字符的上下文条件转移概率最大的字符记为:
Figure 991426DEST_PATH_IMAGE015
其中,
Figure 735391DEST_PATH_IMAGE016
表示手写体中文字符的上文字符,
Figure 862352DEST_PATH_IMAGE017
表示手写体中文字符,
Figure 666360DEST_PATH_IMAGE018
表示手写体中文字符的下文字符,a表示上文字符在词库中的索引,x表示手写体中文字符在词库中的索引,b表示下文字符在词库中的索引。
智能评分阶段;
S5:根据试卷作答文本和标准答案文本,得到试卷作答文本向量和标准答案文本向量;
具体的,包括:
S5.1:采用jieba分词法对试卷作答文本
Figure 598543DEST_PATH_IMAGE019
、以及给定的标准答案文本
Figure 146199DEST_PATH_IMAGE020
进行中文分词,分别得到试卷作答文本词语集和标准答案文本词语集,试卷作答文本词语集记为:
Figure 113018DEST_PATH_IMAGE021
;标准答案文本词语集记为:
Figure 353507DEST_PATH_IMAGE022
S5.2:采用word2vec词向量模型提取试卷作答文本词语集中所有分词的词向量,得到试卷作答词向量;采用TFIDF加权方法对试卷作答文本词语集中所有分词进行统一加权,得到试卷作答词权;根据试卷作答词向量和试卷作答词权,得到试卷作答文本向量;试卷作答文本向量记为:
Figure 772987DEST_PATH_IMAGE023
;计算公式为:
Figure 858755DEST_PATH_IMAGE024
其中,
Figure 680080DEST_PATH_IMAGE025
表示试卷作答词权,
Figure 91470DEST_PATH_IMAGE026
表示试卷作答词向量,g表示试卷作答文本词语集中分词的总数,
Figure 594651DEST_PATH_IMAGE027
Figure 687372DEST_PATH_IMAGE028
Figure 97625DEST_PATH_IMAGE029
表示试卷作答文本词语集中所有的分词;
采用词向量模型提取标准答案文本词语集中所有分词的词向量,得到标准答案词向量;采用加权方法对标准答案文本词语集中所有分词进行统一加权,得到标准答案词权;根据标准答案词向量和标准答案词权,得到标准答案文本向量;标准答案文本向量记为:
Figure 679916DEST_PATH_IMAGE030
;计算公式为:
Figure 73988DEST_PATH_IMAGE031
其中,
Figure 498629DEST_PATH_IMAGE032
表示标准答案词权,
Figure 28967DEST_PATH_IMAGE033
表示标准答案词向量,h表示标准答案文本词语集中分词的总数,
Figure 782159DEST_PATH_IMAGE034
Figure 663528DEST_PATH_IMAGE035
Figure 894789DEST_PATH_IMAGE036
表示标准答案文本词语集中所有的分词。
S6:计算试卷作答文本向量和标准答案文本向量之间的相似度,得到试卷作答文本和标准答案文本之间的匹配程度,匹配程度为最终题目作答得分。
具体的,包括:
S6.1:将试卷作答文本向量与标准答案文本向量代入欧氏距离计算方法中,得到两向量之间的欧氏距离,两向量之间的欧式距离记为:
Figure 545213DEST_PATH_IMAGE037
将试卷作答文本向量与标准答案文本向量代入余弦相似度计算方法中,得到两向量之间的余弦相似度,两向量之间的余弦相似度记为:
Figure 203728DEST_PATH_IMAGE038
S6.2:将两向量之间的欧氏距离和两向量之间的余弦相似度按照0.4比0.6的比例进行加权求和,得到试卷作答文本与标准答案文本之间的匹配程度,匹配程度即为最终题目作答得分;加权求和公式如下:
Figure 572392DEST_PATH_IMAGE040
其中,
Figure 607344DEST_PATH_IMAGE041
表示试卷作答文本与标准答案文本之间的匹配程度,
Figure 377854DEST_PATH_IMAGE042
表示试卷作答文本向量,
Figure 941691DEST_PATH_IMAGE043
表示标准答案文本向量。
本实施例提供的这种结合机器视觉和语义分析的智能阅卷评分方法具有以下有益效果:
针对主观题手写体阅卷评分,采用马尔科夫矩阵校验和修正手写体文字识别中的错误信息,提升了手写体文字识别的准确性;采用欧式距离和余弦相似度计算试卷作答文本与标准答案文本之间的匹配程度,以匹配程度作为最终题目作答得分;实现了智能阅卷评分,提高了教学事务中主观题阅卷评分的工作效率。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,包括:
手写体识别阶段;
S1:对输入的试卷扫描图像进行缩放;
S2:对缩放后的试卷扫描图像进行预处理,得到缩放后的试卷图像手写体文字的连通域;
S3:根据连通域中的手写体文字,得到单字符文本;
S4:对所有单字符文本进行校验和修正,得到试卷作答文本;
智能评分阶段;
S5:根据试卷作答文本和标准答案文本,得到试卷作答文本向量和标准答案文本向量;
S6:计算试卷作答文本向量和标准答案文本向量之间的相似度,得到试卷作答文本和标准答案文本之间的匹配程度,所述匹配程度为最终题目作答得分。
2.根据权利要求1所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S1中,采用双线性插值法对输入的试卷扫描图像进行缩放。
3.根据权利要求2所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S2中,所述试卷扫描图像包括试卷作答区图像,采用阈值分割法对缩放后的试卷作答区图像进行二值化处理,采用区域自增长算法得到缩放后的试卷图像手写体文字的连通域,并根据连通域将试卷作答区图像分割成多个手写体单字符图像。
4.根据权利要求3所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S2中,还包括剔除噪点,所述噪点为连通域面积小于10的缩放后的试卷作答区图像。
5.根据权利要求4所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S3中,包括步骤:
S3.1:基于全卷积神经网络对连通域中的手写体进行特征提取,将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中,全卷积神经网络将计算全连接层向量,输出手写体文字分类置信度,并通过训练样本训练全卷积神经网络,手写体文字分类置信度用于与训练样本的标签值进行比较,修正网络权重;
S3.2:提取全卷积神经网络中全连接层向量作为特征向量,采用K近邻算法与训练样本逐一比较,得到手写体中文字符,进而得到单字符文本。
6.根据权利要求5所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S4中,基于马尔科夫矩阵,提取单字符文本中手写体中文字符的上下文条件转移概率,并进行判断,若概率小于阈值,则所述手写体中文字符为异常字符,并将所述异常字符修正为手写体中文字符的上下文条件转移概率最大的字符;若概率大于阈值,则所述手写体中文字符为正常字符;根据异常字符修正后的字符、以及正常字符,构建试卷作答文本。
7.根据权利要求6所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S5中,包括:
S5.1:采用分词法对试卷作答文本、以及给定的标准答案文本进行中文分词,分别得到试卷作答文本词语集和标准答案文本词语集;
S5.2:采用词向量模型提取试卷作答文本词语集中所有分词的词向量,得到试卷作答词向量;采用加权方法对试卷作答文本词语集中所有分词进行统一加权,得到试卷作答词权;根据试卷作答词向量和试卷作答词权,得到试卷作答文本向量;
采用词向量模型提取标准答案文本词语集中所有分词的词向量,得到标准答案词向量;采用加权方法对标准答案文本词语集中所有分词进行统一加权,得到标准答案词权;根据标准答案词向量和标准答案词权,得到标准答案文本向量。
8.根据权利要求7所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S6中,包括:
S6.1:将试卷作答文本向量与标准答案文本向量代入欧氏距离计算方法中,得到两向量之间的欧氏距离;
将试卷作答文本向量与标准答案文本向量代入余弦相似度计算方法中,得到两向量之间的余弦相似度;
S6.2:将两向量之间的欧氏距离和两向量之间的余弦相似度进行加权求和,得到试卷作答文本与标准答案文本之间的匹配程度,匹配程度即为最终题目作答得分。
9.根据权利要求5所述的一种结合机器视觉和语义分析的智能阅卷评分方法,其特征在于,S3.1中,所述全卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层,输入分割成多个手写体单字符图像的试卷扫描图像至输入层;卷积层提取局部视野权重共享特征;池化层对缩放后的试卷扫描图像进行降维处理;全连接层是全卷积神经网络中的隐含层,当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时,全卷积神经网络将计算全连接层向量,全连接层用于对手写体文字进行分类,输出层输出分类置信度。
CN202111578858.2A 2021-12-22 2021-12-22 一种结合机器视觉和语义分析的智能阅卷评分方法 Pending CN113971805A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111578858.2A CN113971805A (zh) 2021-12-22 2021-12-22 一种结合机器视觉和语义分析的智能阅卷评分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111578858.2A CN113971805A (zh) 2021-12-22 2021-12-22 一种结合机器视觉和语义分析的智能阅卷评分方法

Publications (1)

Publication Number Publication Date
CN113971805A true CN113971805A (zh) 2022-01-25

Family

ID=79590804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111578858.2A Pending CN113971805A (zh) 2021-12-22 2021-12-22 一种结合机器视觉和语义分析的智能阅卷评分方法

Country Status (1)

Country Link
CN (1) CN113971805A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882504A (zh) * 2022-07-06 2022-08-09 成都西交智汇大数据科技有限公司 一种评分方法、装置、设备及可读存储介质
CN115243098A (zh) * 2022-07-19 2022-10-25 上海联影医疗科技股份有限公司 屏幕录制方法、装置、计算机设备和存储介质
CN115243098B (zh) * 2022-07-19 2024-05-24 上海联影医疗科技股份有限公司 屏幕录制方法、装置、计算机设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622610A (zh) * 2012-03-05 2012-08-01 西安电子科技大学 一种基于分类器集成的手写维文字符识别方法
JP2015176080A (ja) * 2014-03-17 2015-10-05 株式会社ベネッセコーポレーション 学習支援システム及び方法
CN109614734A (zh) * 2018-12-21 2019-04-12 内江师范学院 一种机场沥青混凝土道面变形有限元模型及对比分析方法
CN109871443A (zh) * 2018-12-25 2019-06-11 杭州茂财网络技术有限公司 一种基于记账场景的短文本分类方法及装置
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110222328A (zh) * 2019-04-08 2019-09-10 平安科技(深圳)有限公司 基于神经网络的分词和词类标注方法、装置、设备及存储介质
CN110298249A (zh) * 2019-05-29 2019-10-01 平安科技(深圳)有限公司 人脸识别方法、装置、终端及存储介质
CN110414563A (zh) * 2019-06-27 2019-11-05 深圳中兴网信科技有限公司 考试成绩统计方法、系统及计算机可读存储介质
WO2020156362A1 (zh) * 2019-02-02 2020-08-06 杭州大拿科技股份有限公司 一种试卷批改方法、装置、电子设备及存储介质
CN112446262A (zh) * 2019-09-02 2021-03-05 深圳中兴网信科技有限公司 文本分析方法、装置、终端和计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622610A (zh) * 2012-03-05 2012-08-01 西安电子科技大学 一种基于分类器集成的手写维文字符识别方法
JP2015176080A (ja) * 2014-03-17 2015-10-05 株式会社ベネッセコーポレーション 学習支援システム及び方法
CN109614734A (zh) * 2018-12-21 2019-04-12 内江师范学院 一种机场沥青混凝土道面变形有限元模型及对比分析方法
CN109871443A (zh) * 2018-12-25 2019-06-11 杭州茂财网络技术有限公司 一种基于记账场景的短文本分类方法及装置
WO2020156362A1 (zh) * 2019-02-02 2020-08-06 杭州大拿科技股份有限公司 一种试卷批改方法、装置、电子设备及存储介质
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110222328A (zh) * 2019-04-08 2019-09-10 平安科技(深圳)有限公司 基于神经网络的分词和词类标注方法、装置、设备及存储介质
CN110298249A (zh) * 2019-05-29 2019-10-01 平安科技(深圳)有限公司 人脸识别方法、装置、终端及存储介质
CN110414563A (zh) * 2019-06-27 2019-11-05 深圳中兴网信科技有限公司 考试成绩统计方法、系统及计算机可读存储介质
CN112446262A (zh) * 2019-09-02 2021-03-05 深圳中兴网信科技有限公司 文本分析方法、装置、终端和计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EMAN SHAIKH等: "Automated Grading for Handwritten Answer Sheets using Convolutional Neural Networks", 《CONFERENCE: 2019 2ND INTERNATIONAL CONFERENCE ON NEW TRENDS IN COMPUTING SCIENCES (ICTCS)》 *
相洋: "问答系统的答案优化方法研究", 《中国博士学位论文全文数据库_信息科技辑》 *
赵骥: "基于HMM的满文文本识别后处理的研究", 《DOI:10.7666/D.Y816894》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882504A (zh) * 2022-07-06 2022-08-09 成都西交智汇大数据科技有限公司 一种评分方法、装置、设备及可读存储介质
CN115243098A (zh) * 2022-07-19 2022-10-25 上海联影医疗科技股份有限公司 屏幕录制方法、装置、计算机设备和存储介质
CN115243098B (zh) * 2022-07-19 2024-05-24 上海联影医疗科技股份有限公司 屏幕录制方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110110585B (zh) 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN111325203B (zh) 一种基于图像校正的美式车牌识别方法及系统
Saba et al. Annotated comparisons of proposed preprocessing techniques for script recognition
CN110032938B (zh) 一种藏文识别方法、装置及电子设备
Balaha et al. Automatic recognition of handwritten Arabic characters: a comprehensive review
CN111401372A (zh) 一种扫描文档图文信息提取与鉴别的方法
CN112836650B (zh) 一种质量检验报告扫描图像表格语义解析方法与系统
Ohyama et al. Detecting mathematical expressions in scientific document images using a u-net trained on a diverse dataset
RU2757713C1 (ru) Распознавание рукописного текста посредством нейронных сетей
CN110458158B (zh) 一种针对盲人辅助阅读的文本检测与识别方法
CN111626292B (zh) 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN113554027A (zh) 一种报销单据图像文本信息校准与提取方法
Vasudeva et al. Offline character recognition system using artificial neural network
Hasnat et al. A high performance domain specific OCR for Bangla script
CN115620312A (zh) 跨模态字符笔迹验证方法、系统、设备及存储介质
CN113971805A (zh) 一种结合机器视觉和语义分析的智能阅卷评分方法
CN111340032A (zh) 一种基于金融领域应用场景的字符识别方法
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
Gandhi et al. An attempt to recognize handwritten Tamil character using Kohonen SOM
Afroge et al. Bangla optical character recognition through segmentation using curvature distance and multilayer perceptron algorithm
CN115393861B (zh) 一种手写体文本精准分割方法
JP5211449B2 (ja) 認識距離を調整するプログラム、装置および方法、ならびに文字列を認識するプログラム
Van Phan et al. Collecting handwritten nom character patterns from historical document pages
CN115601843A (zh) 基于双流网络的多模态签名笔迹鉴别系统及方法
CN115880566A (zh) 一种基于视觉分析的智能阅卷系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination