CN118053144A - 批改系统的文本检测方法、装置、设备及可读存储介质 - Google Patents

批改系统的文本检测方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN118053144A
CN118053144A CN202211426295.XA CN202211426295A CN118053144A CN 118053144 A CN118053144 A CN 118053144A CN 202211426295 A CN202211426295 A CN 202211426295A CN 118053144 A CN118053144 A CN 118053144A
Authority
CN
China
Prior art keywords
question
area
answer
bounding box
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211426295.XA
Other languages
English (en)
Inventor
李德健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Guangzhou Shiyuan Artificial Intelligence Innovation Research Institute Co Ltd
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Guangzhou Shiyuan Artificial Intelligence Innovation Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd, Guangzhou Shiyuan Artificial Intelligence Innovation Research Institute Co Ltd filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN202211426295.XA priority Critical patent/CN118053144A/zh
Publication of CN118053144A publication Critical patent/CN118053144A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

本发明涉及文本识别技术领域,公开了一种批改系统的文本检测方法、装置、设备及可读存储介质。其中,该方法包括:获取待批改作业的目标图片;基于预构建的文本检测模型对目标图片进行文本检测,确定目标图片中针对于目标题型的问答区、题目区和答案区,该问答区包括题目区和答案区;检测题目区的题目信息与答案区的答案信息,确定题目信息与答案信息是否相匹配。通过实施本发明技术方案,能够直接筛选出目标题型,减少了无关文本的识别时间,提高了批改效率;在确定出问答区的同时能够识别出题目区与答案区,由此能够直接确定出题目区与答案区的对应关系,避免题目区与答案区不匹配而出现误判,提高了批改准确率,提升了用户体验。

Description

批改系统的文本检测方法、装置、设备及可读存储介质
技术领域
本发明涉及文本识别技术领域,具体涉及一种批改系统的文本检测方法、装置、设备及可读存储介质。
背景技术
随着批改系统的发展,最大程度上辅助了教师或家长进行作业批改或检查。例如,对于拼音写汉字这一题型的批改而言,批改系统多是基于YOLO检测算法检测出手写文本和印刷文本,以从印刷文本中识别出拼音文本,继而通过一定的规则找到每个拼音文本对应的手写文本,进而对拼音和手写文本进行一致性检查。
尽管目前的批改系统能够实现拼音写汉字等题型的批改和检查,但是由于要识别所有的印刷文本,那么与题目不相关的内容越多,识别速度越慢,且由于其是将题目文本与手写文本分开检测的,难以预测题目和手写文本之间的对应关系,容易发生误判而降低批改准确性,严重影响了用户体验。
发明内容
有鉴于此,本发明实施例提供了一种批改系统的文本检测方法、装置、设备及可读存储介质,以解决现有批改系统容易发生误判而影响批改准确率和用户体验的问题。
根据第一方面,本发明实施例提供了一种批改系统的文本检测方法,包括:获取待批改作业的目标图片;基于预构建的文本检测模型对所述目标图片进行文本检测,确定所述目标图片中针对于目标题型的问答区、题目区和答案区,所述问答区包括所述题目区和所述答案区;检测所述题目区的题目信息与所述答案区的答案信息,确定所述题目信息与所述答案信息是否相匹配。
本发明实施例提供的批改系统的文本检测方法,通过文本检测模型检测目标图片中所存在的针对于目标题型的问答区、题目区和答案区,由此能够直接筛选出目标题型,减少了无关文本的识别时间,提高了批改效率。在确定出问答区的同时能够识别出题目区与答案区,由此能够直接确定出题目区与答案区的对应关系,避免题目区与答案区不匹配而出现误判,提高了批改准确率,提升了用户体验。
结合第一方面,在第一方面的第一实施方式中,所述基于预构建的文本检测模型对所述目标图片进行文本检测,确定所述目标图片中针对于目标题型的问答区、题目区和答案区,包括:将所述目标图片输入至所述文本检测模型,识别所述目标图片中的目标题型,确定与所述目标题型对应的所述问答区,生成对应于所述问答区的第一包围框;对所述第一包围框中的所述题目区和所述答案区进行检测,生成对应于所述题目区的第二包围框和对应于所述答案区的第三包围框。
本发明实施例提供的批改系统的文本检测方法,通过生成问答区的第一包围框,并在第一包围框中确定出题目区的第二包围框和答案区的第三包围框,由此能够实现第二包围框与第三包围框的关联,实现了题目区与答案区的对应关系,在最大程度上避免了因题目区与答案区分开检测所导致的难以准确匹配的问题。
结合第一方面第一实施方式,在第一方面的第二实施方式中,所述将所述目标图片输入至所述文本检测模型,识别所述目标图片中的目标题型,确定与所述目标题型对应的所述问答区,生成对应于所述问答区的第一包围框,包括:采用所述文本检测模型确定所述目标题型在所述目标图片中的位置信息;基于所述位置信息确定出所述问答区在所述目标图片中的第一位置;根据所述第一位置确定所述问答区的第一中心点坐标、第一目标宽度和第一目标高度;根据所述第一中心点坐标、所述第一目标宽度和所述第一目标高度生成所述第一包围框。
本发明实施例提供的批改系统的文本检测方法,通过检测问答区在目标图片中的中心点坐标、目标宽度和目标高度,以确定出能够包围问答区的包围框,实现了对于问答区精准检测,避免与其他问答区的混淆,便于后续确定题目区与答案区的对应关系。
结合第一方面第一实施方式,在第一方面的第三实施方式中,所述对所述第一包围框中的所述题目区和所述答案区进行检测,生成对应于所述题目区的第二包围框和对应于所述答案区的第三包围框,包括:识别所述题目区在所述第一包围框中的第二位置,以及所述答案区在所述第一包围框中的第三位置;根据所述第二位置确定所述题目区的第二中心点坐标、第二目标宽度和第二目标高度;根据所述第三位置确定所述答案区的第三中心点坐标、第三目标宽度和第三目标高度;根据所述第二中心点坐标、所述第二目标宽度和所述第二目标高度生成所述第二包围框;根据所述第三中心点坐标、所述第三目标宽度和所述第三目标高度生成所述第三包围框。
本发明实施例提供的批改系统的文本检测方法,通过从第一包围框中确定出的第二包围框与第三包围框的位置,能够将第一包围框中的第二包围框与第三包围框关联起来,由此即可直接确定出题目区与答案区的对应关系,大大提高了批改准确率。
结合第一方面第一实施方式至第三实施方式中的任一实施方式,在第一方面的第四实施方式中,所述第二包围框与所述第三包围框为上下排列,和/或,所述第二包围框与所述第三包围框为左右排列。
本发明实施例提供的批改系统的文本检测方法,支持上下排列的第二包围框与第三包围框,以及左右排列第二包围框与第三包围框,拓展了批改系统的应用场景,有利于提升用户体验。
结合第一方面第一实施方式,在第一方面的第五实施方式中,所述方法还包括:获取所述第一包围框、所述第二包围框和所述第三包围框的生成置信度;检测所述生成置信度是否大于第一预设阈值;当所述生成置信度大于所述第一预设阈值时,判定生成的所述第一包围框、所述第二包围框和所述第三包围框为有效包围框。
本发明实施例提供的批改系统的文本检测方法,通过检测生成置信度以确定当前所生成的第一包围框、第二包围框和第三包围框是否有效,避免第一包围框、第二包围框和第三包围框不匹配而出现误判,从而提高了批改准确率。
结合第一方面,在第一方面的第六实施方式中,所述检测所述题目区的题目信息与所述答案区的答案信息,确定所述题目信息与所述答案信息是否相匹配,包括:获取与所述题目信息对应的目标答案信息;检测所述答案信息相较于所述目标答案信息的匹配置信度;当所述匹配置信度达到第二预设阈值时,确定所述题目信息与所述答案信息相匹配。
本发明实施例提供的批改系统的文本检测方法,通过检测答案信息相较于目标答案信息的匹配置信度,以实现对于答案信息的检测,进一步降低了误判率,提高了批改准确率。
根据第二方面,本发明实施例提供了一种批改系统的文本检测装置,包括:获取模块,用于获取待批改作业的目标图片;确定模块,用于基于预构建的文本检测模型对所述目标图片进行文本检测,确定所述目标图片中针对于目标题型的问答区、题目区和答案区,所述问答区包括所述题目区和所述答案区;检测模块,用于检测所述题目区的题目信息与所述答案区的答案信息,确定所述题目信息与所述答案信息是否相匹配。
根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或第一方面任一实施方式所述的批改系统的文件检测方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行第一方面或第一方面任一实施方式所述的批改系统的文件检测方法。
需要说明的是,本发明实施例提供的批改系统的文件检测装置、电子设备以及计算机可读存储介质的相应有益效果,请参见批改系统的文件检测方法中相应内容的描述,在此不再赘述。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的批改系统的文本检测方法的流程图;
图2是本发明实施例的问答区、题目区和答案区的识别示意图;
图3是本发明实施例的批改系统的文本检测方法的另一流程图;
图4是本发明实施例的目标题型的问答区的识别示意图;
图5是本发明实施例的左右排列的第二包围框与第三包围框的示意图;
图6是本发明实施例的左右排列的第二包围框与第三包围框的另一示意图;
图7是本发明实施例的批改系统的文本检测方法的又一流程图;
图8是本发明实施例的批改系统的文本检测装置的结构框图;
图9是本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于拼音写汉字这一题型的批改而言,目前的批改系统多是基于YOLO检测算法检测出手写文本和印刷文本,以从印刷文本中识别出拼音文本,继而通过一定的规则找到每个拼音文本对应的手写文本,进而对拼音和手写文本进行一致性检查。
但是,由于要识别所有的印刷文本,那么与题目不相关的内容越多,识别速度越慢,且由于其是将题目文本与手写文本分开检测的,难以预测题目和手写文本之间的对应关系,容易发生误判而降低批改准确性。同时,需要用规则判断题目是否属于拼音写汉字,但现实场景往往复杂多变,规则设计很难面面俱到,有些不属于拼音写汉字的场景很容易发生题型误判,导致批改错误,影响用户体验。
基于此,本发明技术方案能够通过文本检测模型检测目标图片中所存在的针对于目标题型的问答区、题目区和答案区,且题目区与答案区均位于问答区中,由此能够直接确定出题目区与答案区的对应关系,同时能够直接筛选出目标题型,减少了无关文本的识别时间,提高了批改效率,提升了用户体验。
根据本发明实施例,提供了一种批改系统的文本检测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种批改系统的文本检测方法,可用于电子设备,如手机、平板电脑、电脑等,图1是根据本发明实施例的批改系统的文本检测方法的流程图,如图1所示,该流程包括如下步骤:
S11,获取待批改作业的目标图片。
目标图片为针对于待批改作业所生成的图片。具体地,该目标图片可以是通过电子设备的摄像/拍照功能拍摄纸质版作业得到的,也可以是通过电子设备所截取的需要予以批改某部分作业图片;还可以是通过电子设备所提交的待批改的电子版作业图片。
相应地,电子设备中的批改系统可以调用摄像头以获取针对于待批改作业的目标图片;还可以响应于用户对该电子版作业的提交操作,以获取到针对于待批改作业的目标图片。当然,此处还可以通过其他方式获取到待批改作业的目标图片,本申请不作具体限定,本领域技术人员可以根据实际需要确定。
S12,基于预构建的文本检测模型对目标图片进行文本检测,确定目标图片中针对于目标题型的问答区、题目区和答案区,问答区包括题目区和答案区。
预构建的文本检测模型为通过多种类型的题型样本对卷积神经网络进行训练所生成的文本检测模型,不同的题型具有不同的特征,通过不同题型的样本对卷积神经网络进行训练,即可确定出不同题型所具有的特征,包括问答区、题目区以及答案区的位置关系。将该文本检测模型部署至电子设备的批改系统中,在批改系统获取到目标图片后即可通过该文本检测模型输出目标图片中所包含的针对于目标题型的问答区、题目区和答案区。
具体地,目标题型为需要进行批改的题型,例如拼音写汉字、英文单词翻译为中文词语、中文词语翻译为英文单词、汉字填空等。问答区为目标题型中各个题目所对应的题目区与答题区所处的区域,即问答区包括题目区和答案区;题目区表示题目所处的区域;答案区表示填写答案的区域。如图2所示,box1为问答区、box2为题目区、box3为答案区。
当批改系统在获取到目标图片后,将该目标图片输入至文本检测模型,通过文本检测模型络即可确定出目标图片中各个题型的特征,从各个题型中筛选出的需要予以批改的目标题型。例如,需要对拼音写汉字进行批改,此时可以则可以对判断题、填空题等进行滤除,直接定位至拼音写汉字这一题型。
在完成目标题型的确定后,通过文本检测模型可以进一步的识别针对于目标题型所存在的问答区、题目区以及答案区。
S13,检测题目区的题目信息与答案区的答案信息,确定题目信息与答案信息是否相匹配。
题目信息与答案信息之间存在一一对应关系,当确定出题目区与答案区之后,可以识别题目区的题目信息与答案区的答案信息,检测两者是否相匹配。若两者相匹配,表示该题目作答正确;若两者不匹配,表示该题目作答错误。
可选地,对于作答正确的题目可以生成标记“√”,对于作答错误的题目可以生成标记“×”。对于正确率较高的情况,还可以生成奖励标记,例如五角星“☆”、花朵等,此处对此不作具体限定,本领域技术人员可以根据实际需要确定。
本实施例提供的批改系统的文本检测方法,通过检测目标图片中所存在的针对于目标题型的问答区、题目区和答案区,由此能够直接筛选出目标题型,减少了无关文本的识别时间,提高了批改效率。在确定出问答区的同时能够识别出题目区与答案区,由此能够直接确定出题目区与答案区的对应关系,避免题目区与答案区不匹配而出现误判,提高了批改准确率,提升了用户体验。
在本实施例中提供了一种批改系统的文本检测方法,可用于电子设备,如手机、平板电脑、电脑等,图3是根据本发明实施例的批改系统的文本检测方法的流程图,如图3所示,该流程包括如下步骤:
S21,获取待批改作业的目标图片。详细说明参见上述实施例对应的相关描述,此处不再赘述。
S22,基于预构建的文本检测模型对目标图片进行文本检测,确定目标图片中针对于目标题型的问答区、题目区和答案区,问答区包括题目区和答案区。
具体地,上述步骤S22可以包括:
S221,将目标图片输入至文本检测模型,识别目标图片中的目标题型,确定与目标题型对应的问答区,生成对应于问答区的第一包围框。
第一包围框为包围题目区和答题区的封闭框。电子设备中的批改系统在接收到针对于待批改作业的目标图片后,会将其输入至文本检测模型进行文本检测,从目标图片中识别出的所需批改目标题型以及目标题型所对应的问答区,根据问答区的所处位置生成相应的第一包围框。
作为一个可选的实施方式,上述步骤S221可以包括:
(1)采用文本检测模型确定目标题型在目标图片中的位置信息。
(2)基于位置信息确定出问答区在目标图片中的第一位置。
(3)根据第一位置确定问答区的第一中心点坐标、第一目标宽度和第一目标高度。
(4)根据第一中心点坐标、第一目标宽度和第一目标高度生成第一包围框。
位置信息表示目标题型在目标图片中所处的位置,例如目标题型为拼音写汉字,目标图片中依次显示有填空题、连线题、拼音写汉字题、判断题,则电子设备中的批改系统可以利用卷积神经网络直接定位至拼音写汉字题在目标图片中的位置。
目标题型中通常包括有多道题目,第一位置表示各个题目的问答区所处的位置。以图4所示为例,当前存在3个题目,每个题目均对应有问答区,每个问答区对应有各自的位置。
根据问答区当前所处的第一位置,通过文本检测模型预测出当前问答区的第一中心点坐标(x1,y1)、第一目标宽度w1以及第一目标高度h1。以第一中心点坐标(x1,y1)为中心,结合第一目标宽度w1和第一目标高度h1即可生成第一包围框。
通过检测问答区在目标图片中的中心点坐标、目标宽度和目标高度,以确定出能够包围问答区的包围框,实现了对于问答区精准检测,避免与其他问答区的混淆,便于后续确定题目区与答案区的对应关系。
S222,对第一包围框中的题目区和答案区进行检测,生成对应于题目区的第二包围框和对应于答案区的第三包围框。
第二包围框为包围题目区的封闭框,第三包围框为包围答案区的封闭框。对第一包围框所包围的封闭区域内的文本进行检测,确定出包围题目区的第二包围框和包围答案区的第三包围框。
作为一个可选的实施方式,上述步骤S222可以包括:
(1)识别题目区在第一包围框中的第二位置,以及答案区在第一包围框中的第三位置。
(2)根据第二位置确定题目区的第二中心点坐标、第二目标宽度和第二目标高度。
(3)根据第三位置确定答案区的第三中心点坐标、第三目标宽度和第三目标高度。
(4)根据第二中心点坐标、第二目标宽度和第二目标高度生成第二包围框。
(5)根据第三中心点坐标、第三目标宽度和第三目标高度生成第三包围框。
文本检测模型在预测问答区的中心点坐标、宽度和高度的同时还能够预测题目区和答案区在第一包围框中的位置,即题目区在第一包围中的第二位置以及答案区在第一包围框中的第三位置,继而根据题目区当前所处的第二位置,通过文本检测模型预测出当前题目区的第二中心点坐标(x2,y2)、第二目标宽度w2以及第二目标高度h2。以第二中心点坐标(x2,y2)为中心,结合第二目标宽度w2和第二目标高度h2即可生成第二包围框。
同理,根据答案区当前所处的第三位置,通过文本检测模型预测出当前题目区的第三中心点坐标(x3,y3)、第三目标宽度w3以及第三目标高度h3。以第三中心点坐标(x3,y3)为中心,结合第三目标宽度w3和第三目标高度h3即可生成第三包围框。
由于第二包围框和第三包围框均处于第一包围框中,而第一包围框则代表一个题目的问答区,由此能够直接确定出第二包围框与第三包围框的关联关系,实现题目区与答案区的对应,无需再设计其他批改规则以确定题目与答案的对应关系,避免所设计规则难以适应题型的变换而出现误判,提高了批改准确率。
作为一个可选的实施方式,第二包围框与第三包围框为上下排列,和/或,第二包围框与第三包围框为左右排列。
对于如图2所示的题型为例;第二包围框与第三包围框为上下排列,对于如图5所述的题型为例,第二包围框与第三包围框为左右排列;对于如图6所述的题型为例,第二包围框与第三包围框亦为左右排列。由此能够支持上下排列的第二包围框与第三包围框,以及左右排列第二包围框与第三包围框,拓展了批改系统的应用场景,有利于提升用户体验。
作为一个可选的实施方式,在得到第一包围框、第二包围框以及第三包围框之后,上述方法还可以包括:
S223,获取第一包围框、第二包围框和第三包围框的生成置信度。
生成置信度用于表征第一包围框、第二包围框和第三包围框的可信程度,即确定当前所生成的第一包围框、第二包围框以及第三包围框是否有效。文本检测模型在输出第一包围框、第二包围框和第三包围框的中心点坐标、宽度和高度的同时还能够输出针对于第一包围框、第二包围框和第三包围框的生成置信度c。
S224,检测生成置信度是否大于第一预设阈值。
第一预设阈值为预先设定的用于表征第一包围框、第二包围框以及第三包围框可信的最小置信度。第一预设阈值可以为80%、85%、90%、95%等,当然还可以为其他值,此处不作具体限定,本领域技术人员可以根据实际需要设定。将当前的生成置信度与第一预设阈值进行对比,以确定当前的生成置信度是否超过第一预设阈值。当生成置信度大于第一预设阈值时,执行步骤S225,否则表示包围框生成有误,并返回重新识别文本进行包围框的生成。
S225,当生成置信度大于第一预设阈值时,判定生成的第一包围框、第二包围框和第三包围框为有效包围框。
当生成置信度大于第一预设阈值时,表示当前所生成的第一包围框、第二包围框以及第三包围框是可信的,即第一包围框包括有第二包围框和第三包围框,第二包围框和第三包围框是具有对应关系的包围框。由此即可判定第二包围框和第三包围框为有效包围框。
具体地,当电子设备接收到待批改作业的目标图片之后,可以将该目标图片输入至文本检测模型,文本检测模型则可以输出多维数组[c,(x1,y1,w1,h1),(x2,y2,w2,h2),(x3,y3,w3,h3)],通过该多维数组即可构建出第一包围框、第二包围框和第三包围框,同时能够基于生成置信度c确定上述所生成的第一包围框、第二包围框和第三包围框是否有效。
S23,检测题目区的题目信息与答案区的答案信息,确定题目信息与答案信息是否相匹配。详细说明参见上述实施例对应的相关描述,此处不再赘述。
本实施例提供的批改系统的文本检测方法,通过生成问答区的第一包围框,并在第一包围框中确定出题目区的第二包围框和答案区的第三包围框,由此能够实现第二包围框与第三包围框的关联,实现了题目区与答案区的对应关系,在最大程度上避免了因题目区与答案区分开检测所导致的难以准确匹配的问题。通过检测生成置信度以确定当前所生成的第一包围框、第二包围框和第三包围框是否有效,避免第一包围框、第二包围框和第三包围框不匹配而出现误判,从而提高了批改准确率。
在本实施例中提供了一种批改系统的文本检测方法,可用于电子设备,如手机、平板电脑、电脑等,图7是根据本发明实施例的批改系统的文本检测方法的流程图,如图7所示,该流程包括如下步骤:
S31,获取待批改作业的目标图片。详细说明参见上述实施例对应的相关描述,此处不再赘述。
S32,基于预构建的文本检测模型对目标图片进行文本检测,确定目标图片中针对于目标题型的问答区、题目区和答案区,问答区包括题目区和答案区。详细说明参见上述实施例对应的相关描述,此处不再赘述。
S33,检测题目区的题目信息与答案区的答案信息,确定题目信息与答案信息是否相匹配。
具体地,上述步骤S33可以包括:
S331,获取与题目信息对应的目标答案信息。
目标答案信息为根据题目信息生成的标准答案,目标答案信息与题目信息是一一对应的。具体地,该目标答案信息可以存储在数据库中,批改系统可以根据题目信息查询数据库,以从数据库调取相应的目标答案信息。例如,题目信息为“wǒmen”,其对应的目标答案信息为“我们”。
S332,检测答案信息相较于目标答案信息的匹配置信度。
匹配置信度为当前题目信息所对应的答案信息与目标答案信息之间的相似匹配度,相似匹配度越高,答案信息越准确。具体地,批改系统中所部署的文本检测模型可以预先进行相似度训练,由此将其检测出的答案信息与目标答案信息进行对比,以确定出答案信息相较于目标答案信息的匹配置信度。
S333,当匹配置信度达到第二预设阈值时,确定题目信息与答案信息相匹配。
第二预设阈值为预先设定的用于表征答案信息准确的相似度,具体地,第二预设阈值可以为90%、95%、98%、100%等,此处对第二预设阈值不作具体限定。将当前的匹配置信度与第二预设阈值进行对比,以确定当前的匹配置信度是否达到第二预设阈值。当匹配置信度达到第二预设阈值时,表示当前的答案信息是准确的,即答案信息与题目信息相匹配,否则表示当前的答案信息存在错误,并在完成作业批改之后生成提示信息,以提醒用户进行确认。
本实施例提供的批改系统的文本检测方法,通过检测答案信息相较于目标答案信息的匹配置信度,以实现对于答案信息的检测,进一步降低了误判率,提高了批改准确率。
在本实施例中还提供了一种批改系统的文本检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种批改系统的文本检测装置,如图8所示,包括:
获取模块41,用于获取待批改作业的目标图片。
确定模块42,用于基于预构建的文本检测模型对目标图片进行文本检测,确定目标图片中针对于目标题型的问答区、题目区和答案区,问答区包括题目区和答案区。
检测模块43,用于检测题目区的题目信息与答案区的答案信息,确定题目信息与答案信息是否相匹配。
可选地,上述确定模块42具体可以包括:
第一生成子模块,用于将目标图片输入至文本检测模型,识别目标图片中的目标题型,确定与目标题型对应的问答区,生成对应于问答区的第一包围框。
第二生成子模块,用于对第一包围框中的题目区和答案区进行检测,生成对应于题目区的第二包围框和对应于答案区的第三包围框。
可选地,上述第一生成子模块具体用于:采用文本检测模型确定目标题型在目标图片中的位置信息;基于位置信息确定出问答区在目标图片中的第一位置;根据第一位置确定问答区的第一中心点坐标、第一目标宽度和第一目标高度;根据第一中心点坐标、第一目标宽度和第一目标高度生成第一包围框。
可选地,上述第一生成子模块具体用于:识别题目区在第一包围框中的第二位置,以及答案区在第一包围框中的第三位置;根据第二位置确定题目区的第二中心点坐标、第二目标宽度和第二目标高度;根据第三位置确定答案区的第三中心点坐标、第三目标宽度和第三目标高度;根据第二中心点坐标、第二目标宽度和第二目标高度生成第二包围框;根据第三中心点坐标、第三目标宽度和第三目标高度生成第三包围框。
可选地,上述确定模块42还可以包括:
第一获取子模块,用于获取第一包围框、第二包围框和第三包围框的生成置信度。
第一检测子模块,用于检测生成置信度是否大于第一预设阈值。
判定子模块,用于当生成置信度大于第一预设阈值时,判定生成的第一包围框、第二包围框和第三包围框为有效包围框。
可选地,第二包围框与第三包围框为上下排列,和/或,第二包围框与第三包围框为左右排列。
可选地,上述检测模块43具体可以包括:
第二获取子模块,用于获取与题目信息对应的目标答案信息。
第二检测子模块,用于检测答案信息相较于目标答案信息的匹配置信度。
确定子模块,用于当匹配置信度达到第二预设阈值时,确定题目信息与答案信息相匹配。
本实施例中的批改系统的文本检测装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例提供的批改系统的文本检测装置,通过文本检测模型检测目标图片中所存在的针对于目标题型的问答区、题目区和答案区,由此能够直接筛选出目标题型,减少了无关文本的识别时间,提高了批改效率。在确定出问答区的同时能够识别出题目区与答案区,由此能够直接确定出题目区与答案区的对应关系,避免题目区与答案区不匹配而出现误判,提高了批改准确率,提升了用户体验。
本发明实施例还提供一种电子设备,具有上述图8所示的批改系统的文本检测装置。
请参阅图9,图9是本发明可选实施例提供的一种电子设备的结构示意图,如图9所示,该电子设备可以包括:至少一个处理器501,例如中央处理器(Central ProcessingUnit,CPU),至少一个通信接口503,存储器504,至少一个通信总线502。其中,通信总线502用于实现这些组件之间的连接通信。其中,通信接口503可以包括显示屏(Display)、键盘(Keyboard),可选通信接口503还可以包括标准的有线接口、无线接口。存储器504可以是高速易挥发性随机存取存储器(Random Access Memory,RAM),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器504可选的还可以是至少一个位于远离前述处理器501的存储装置。其中处理器501可以结合图8所描述的装置,存储器504中存储应用程序,且处理器501调用存储器504中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线502可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。通信总线502可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器504可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器504还可以包括上述种类的存储器的组合。
其中,处理器501可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP)或者CPU和NP的组合。
其中,处理器501还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gatearray,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
可选地,存储器504还用于存储程序指令。处理器501可以调用程序指令,实现如本申请上述实施例中所示的批改系统的文本检测方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的批改系统的文本检测方法。其中,该存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,HDD)或固态硬盘(Solid-State Drive,SSD)等;还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种批改系统的文本检测方法,其特征在于,包括:
获取待批改作业的目标图片;
基于预构建的文本检测模型对所述目标图片进行文本检测,确定所述目标图片中针对于目标题型的问答区、题目区和答案区,所述问答区包括所述题目区和所述答案区;
检测所述题目区的题目信息与所述答案区的答案信息,确定所述题目信息与所述答案信息是否相匹配。
2.根据权利要求1所述的方法,其特征在于,所述基于预构建的文本检测模型对所述目标图片进行文本检测,确定所述目标图片中针对于目标题型的问答区、题目区和答案区,包括:
将所述目标图片输入至所述文本检测模型,识别所述目标图片中的所述目标题型,确定与所述目标题型对应的所述问答区,生成对应于所述问答区的第一包围框;
对所述第一包围框中的所述题目区和所述答案区进行检测,生成对应于所述题目区的第二包围框和对应于所述答案区的第三包围框。
3.根据权利要求2所述的方法,其特征在于,所述将所述目标图片输入至所述文本检测模型,识别所述目标图片中的目标题型,确定与所述目标题型对应的所述问答区,生成对应于所述问答区的第一包围框,包括:
采用所述文本检测模型确定所述目标题型在所述目标图片中的位置信息;
基于所述位置信息确定出所述问答区在所述目标图片中的第一位置;
根据所述第一位置确定所述问答区的第一中心点坐标、第一目标宽度和第一目标高度;
根据所述第一中心点坐标、所述第一目标宽度和所述第一目标高度生成所述第一包围框。
4.根据权利要求2所述的方法,其特征在于,所述对所述第一包围框中的所述题目区和所述答案区进行检测,生成对应于所述题目区的第二包围框和对应于所述答案区的第三包围框,包括:
识别所述题目区在所述第一包围框中的第二位置,以及所述答案区在所述第一包围框中的第三位置;
根据所述第二位置确定所述题目区的第二中心点坐标、第二目标宽度和第二目标高度;
根据所述第三位置确定所述答案区的第三中心点坐标、第三目标宽度和第三目标高度;
根据所述第二中心点坐标、所述第二目标宽度和所述第二目标高度生成所述第二包围框;
根据所述第三中心点坐标、所述第三目标宽度和所述第三目标高度生成所述第三包围框。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述第二包围框与所述第三包围框为上下排列,和/或,所述第二包围框与所述第三包围框为左右排列。
6.根据权利要求2所述的方法,其特征在于,还包括:
获取所述第一包围框、所述第二包围框和所述第三包围框的生成置信度;
检测所述生成置信度是否大于第一预设阈值;
当所述生成置信度大于所述第一预设阈值时,判定生成的所述第一包围框、所述第二包围框和所述第三包围框为有效包围框。
7.根据权利要求1所述的方法,其特征在于,所述检测所述题目区的题目信息与所述答案区的答案信息,确定所述题目信息与所述答案信息是否相匹配,包括:
获取与所述题目信息对应的目标答案信息;
检测所述答案信息相较于所述目标答案信息的匹配置信度;
当所述匹配置信度达到第二预设阈值时,确定所述题目信息与所述答案信息相匹配。
8.一种批改系统的文本检测装置,其特征在于,包括:
获取模块,用于获取待批改作业的目标图片;
确定模块,用于基于预构建的文本检测模型对所述目标图片进行文本检测,确定所述目标图片中针对于目标题型的问答区、题目区和答案区,所述问答区包括所述题目区和所述答案区;
检测模块,用于检测所述题目区的题目信息与所述答案区的答案信息,确定所述题目信息与所述答案信息是否相匹配。
9.一种电子设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7任一项所述的批改系统的文件检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7任一项所述的批改系统的文件检测方法。
CN202211426295.XA 2022-11-15 2022-11-15 批改系统的文本检测方法、装置、设备及可读存储介质 Pending CN118053144A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211426295.XA CN118053144A (zh) 2022-11-15 2022-11-15 批改系统的文本检测方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211426295.XA CN118053144A (zh) 2022-11-15 2022-11-15 批改系统的文本检测方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN118053144A true CN118053144A (zh) 2024-05-17

Family

ID=91045467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211426295.XA Pending CN118053144A (zh) 2022-11-15 2022-11-15 批改系统的文本检测方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN118053144A (zh)

Similar Documents

Publication Publication Date Title
US11450081B2 (en) Examination paper correction method and apparatus, electronic device, and storage medium
CN109726643B (zh) 图像中表格信息的识别方法、装置、电子设备及存储介质
US11410407B2 (en) Method and device for generating collection of incorrectly-answered questions
CN109522816B (zh) 表格识别方法及装置、计算机存储介质
CN109685055B (zh) 一种图像中文本区域的检测方法及装置
WO2020238054A1 (zh) Pdf文档中图表的定位方法、装置及计算机设备
CN109634961B (zh) 一种试卷样本生成方法、装置、电子设备和存储介质
CN108491866B (zh) 色情图片鉴定方法、电子装置及可读存储介质
CN109918523B (zh) 一种基于yolo9000算法的电路板元器件检测方法
CN111626177B (zh) 一种pcb元件识别方法及装置
CN109598185B (zh) 图像识别翻译方法、装置、设备及可读存储介质
US11341376B2 (en) Method and device for recognizing image and storage medium
CN111709414A (zh) Ar设备及其文字识别方法、装置和计算机可读存储介质
CN114549993B (zh) 实验中线段图像的评分方法、系统、设备及可读存储介质
CN116311279A (zh) 样本图像的生成、模型训练、字符识别方法、设备及介质
CN111832550B (zh) 数据集制作方法、装置、电子设备及存储介质
CN113569677A (zh) 一种基于扫描件的纸质试验报告生成方法
CN112991410A (zh) 一种文本图像配准方法、电子设备及其存储介质
CN110956087B (zh) 一种图片中表格的识别方法、装置、可读介质和电子设备
CN118053144A (zh) 批改系统的文本检测方法、装置、设备及可读存储介质
CN111062377B (zh) 一种题号检测方法、系统、存储介质及电子设备
CN114240837A (zh) 焊缝定位方法、装置、设备及存储介质
CN110751140A (zh) 字符批量识别方法、装置和计算机设备
CN113111713B (zh) 一种图像检测方法、装置、电子设备及存储介质
CN113033400B (zh) 识别数学式子的方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination