CN112906499A - 文本信息识别方法及装置 - Google Patents
文本信息识别方法及装置 Download PDFInfo
- Publication number
- CN112906499A CN112906499A CN202110125220.7A CN202110125220A CN112906499A CN 112906499 A CN112906499 A CN 112906499A CN 202110125220 A CN202110125220 A CN 202110125220A CN 112906499 A CN112906499 A CN 112906499A
- Authority
- CN
- China
- Prior art keywords
- text information
- result
- cluster analysis
- text
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000007621 cluster analysis Methods 0.000 claims abstract description 60
- 230000002159 abnormal effect Effects 0.000 claims description 49
- 238000002372 labelling Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 abstract description 15
- 238000012937 correction Methods 0.000 abstract description 7
- 238000012360 testing method Methods 0.000 description 169
- 238000012552 review Methods 0.000 description 13
- 238000012015 optical character recognition Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008407 joint function Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Character Discrimination (AREA)
Abstract
本公开涉及一种文本信息识别方法及装置。该方法包括:从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息;识别所述目标区域的所述文本信息的内容,得到第一识别结果;基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果;根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。本公开在利用文本识别算法对文本信息的内容进行识别后,通过聚类分析对识别结果进行进一步判断,识别可能存在的错误识别结果,方便教师查错,大大减少教师的纠错工作量,同时通过少量的人工干预即可提升文本识别算法的准确可用性,提高文本识别准确率,提高用户体验。
Description
技术领域
本公开涉及智慧教育领域,具体涉及一种文本信息识别方法及装置。
背景技术
在先阅后扫智慧阅卷方案的自动合分功能中,需要对含有教师批阅痕迹的试卷图片上的手写分数进行检测和识别,当教师书写字迹潦草时,通过OCR算法引擎识别出的教师手写分数不可避免的会出现错误情况,现有技术无法对错误识别结果进行提示或标记,需要教师依次检查核对进行人工纠错,工作量大,识别准确率低,用户体验差。
发明内容
本公开意图提供一种文本信息识别方法及装置,以解决现有文本信息识别方法对可能存在的错误识别结果核验时纠错工作量大、识别准确率低、用户体验差的问题。
根据本公开的方案之一,提供一种文本信息识别方法,包括:
从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息;
识别所述目标区域的所述文本信息的内容,得到第一识别结果;
基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果;
根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。
在一些实施例中,每帧原始图像中包含至少一个所述目标区域,从采集到的多帧原始图像中获取目标区域,包括:
检测所述原始图像中的标注特征;
基于所述标注特征,确定待识别的所述文本信息的位置;
基于待识别的所述文本信息的位置确定所述目标区域;
其中,所述标注特征包括手写文本、文本颜色、文本字符数量、文本长度中的至少一种。
在一些实施例中,每帧原始图像中包含一个所述目标区域,基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果,包括:
基于所述第一识别结果的类型,提取多帧原始图像中的多个所述目标区域的图像进行聚类分析,得到聚类分析结果。
在一些实施例中,每帧原始图像中包含多个所述目标区域,基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果,包括:
确定多个所述目标区域的所述文本信息的类型;
基于所述文本信息的类型和所述第一识别结果的类型,提取多帧原始图像中同一目标区域的图像进行聚类分析,得到聚类分析结果。
在一些实施例中,确定多个所述目标区域的所述文本信息的类型,包括:
基于所述文本信息的标注特征和/或所述原始图像中的预设文本信息确定所述目标区域的所述文本信息的类型。
在一些实施例中,根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果,包括:
判断所述聚类分析结果中是否存在离散点,并判断所述离散点对应的所述文本信息的第一识别结果是否为异常识别结果。
在一些实施例中,在每帧原始图像中包含多个所述目标区域时,所述方法还包括:
基于第一目标区域的第一文本信息的第二识别结果确定第二目标区域的第二文本信息的第二识别结果。
在一些实施例中,所述方法还包括:
在确定所述第一识别结果为异常识别结果时,生成提示信息,以提示用户对所述文本信息进行核验;或者,
在确定所述第一识别结果为异常识别结果时,对所述文本信息进行标记,以提示用户对所述文本信息进行核验。
在一些实施例中,所述方法还包括:
在所述异常识别结果为多个时,将与所述异常识别结果对应的多个所述文本信息或所述文本信息所属的所述原始图像依序突出显示。
根据本公开的方案之一,提供一种文本信息识别装置,包括:
获取模块,配置为从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息;
识别模块,配置为配置为识别所述目标区域的所述文本信息的内容,得到第一识别结果;
聚类模块,配置为基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果;
确定模块,配置为根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。
根据本公开的方案之一,提供一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行指令,所述处理器执行所述计算机可执行指令时实现上述的文本信息识别方法。
根据本公开的方案之一,提供一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现上述的文本信息识别方法。
本公开的各种实施例提供的文本信息识别方法及装置,在利用文本识别算法对文本信息的内容进行识别后,通过聚类分析对识别结果进行进一步判断,识别可能存在的错误识别结果,方便教师查错,大大减少由于文本识别算法本身的不可靠性给教师带来的纠错工作量,同时通过少量的人工干预即可提升文本识别算法的准确可用性,提高文本识别准确率,提高用户体验。
应当理解,前面的大体描述以及后续的详细描述只是示例性的和说明性的,并非对所要求保护的本公开的限制。
附图说明
在未必按照比例绘制的附图中,不同视图中相似的附图标记可以表示相似的构件。具有字母后缀的相似附图标记或具有不同字母后缀的相似附图标记可以表示相似构件的不同实例。附图通常作为示例而非限制地图示各种实施例,并且与说明书和权利要求书一起用于解释所公开的实施例。
图1示出本公开实施例的文本信息识别方法的流程图;
图2示出本公开实施例的文本信息识别方法的另一流程图;
图3示出本公开实施例的文本信息识别装置的结构示意图;
图4示出本公开实施例的电子设备的结构示意图。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
图1示出了本公开实施例的文本信息识别方法的流程图。如图1所示,本公开实施例提供一种文本信息识别方法,包括:
S1:从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息。
本实施例中,以试卷中教师批阅试题的批阅得分的识别为例,对文本信息识别方法进行具体说明。其中,原始图像为对批阅后的试卷进行扫描后得到的试卷图像,多帧原始图像为基于考生信息(例如准考证号)连续排列的多张试卷图像;待识别的文本信息为试卷中的批阅得分,目标区域为试卷中包含该批阅得分的区域(简称得分区域)。
步骤S1中,可以利用OCR(Optical Character Recognition,光学字符识别)识别引擎对原始图像进行电子扫描确定目标区域,并从中提取待识别的文本信息。
在一些实施例中,每帧原始图像中包含至少一个所述目标区域,从采集到的多帧原始图像中获取目标区域,包括:
S11:检测所述原始图像中的标注特征;
S12:基于所述标注特征,确定待识别的所述文本信息的位置;
S13:基于待识别的所述文本信息的位置确定所述目标区域;
其中,所述标注特征包括手写文本、文本颜色、文本字符数量、文本长度中的至少一种。
具体地,试卷中的批阅得分可以为试卷总分,也可以为试卷中各试题的试题得分,每个批阅得分对应一个目标区域。批阅得分的形式可以为数字、字母以及文字等,例如,试卷的评分标准为分数时,得分即为数字;试卷的评分标准为等级时,得分可以为A、B、C、D等使用字母表示的等级,也可以为优、良、中、差等使用文字表示的等级。
在采集到多帧试卷图像后,可以通过步骤S11检测每帧试卷图像中是否存在标注特征,并判断该标注特征是否为与待识别的文本信息对应的特定标注特征。如果是,则确定该标注特征对应的文本信息为待识别的文本信息。基于标注特征确定出待识别的文本信息后,可以基于该标注特征在试卷图像中的位置,确定待识别的所述文本信息的具体位置。即步骤S11和S12为查找待识别的文本信息的步骤,可以基于待识别的文本信息的特定的标注特征以及该标注特征的位置,查找待识别的文本信息并定位待识别的文本信息的位置。
在一具体实施例中,标注特征可以为手写文本,通过步骤S11检测原始图像中是否存在手写文本,若存在手写文本,则可以将该手写文本确定为待识别的文本信息。教师在进行试卷批阅时,通常使用红色字迹笔进行批阅,因此,在另一些实施例中,标注特征也可以为文本颜色,通过步骤S11检测原始图像中是否存在特定颜色(例如红色)的文本信息,将该特定颜色的文本信息确定为待识别的文本信息。
在查找到待识别的文本信息后,可以截取原始图像中包含该文本信息的区域作为目标区域。确定出目标区域后,可以基于文本信息的边界,截取目标区域的图像。例如,可以先确定文本信息的四个顶点,然后,根据四个顶点确定包含文本信息的外接矩形框,将该矩形框内的区域确定为目标区域。
在另一些实施例中,可以基于原始图像中的预设区域确定包含文本信息的目标区域。例如,试卷中预先设有批阅区域以供教师打分,因此,可以直接将该批阅区域确定为目标区域。
S2:识别所述目标区域的所述文本信息的内容,得到第一识别结果。
具体地,在确定出包含待识别的文本信息的目标区域后,可以将截取的目标区域的图像输入OCR识别引擎中,识别出其中的文本信息的内容,得到第一识别结果。
S3:基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果。
在对文本信息的内容进行识别时,由于不同教师的批阅字迹不同,因此,可能存在文本信息误识别或者无法识别文本信息的内容的情况。为了提取出文本信息的第一识别结果中可能存在的错误,本步骤中,在得到第一识别结果后,基于该第一识别结果提取多帧原始图像中相应的多个所述目标区域的图像构成聚类图像集,将该聚类图像集作为聚类对象进行聚类分析。
在一些实施例中,每帧原始图像中包含一个所述目标区域,步骤S3具体包括:
S31:基于所述第一识别结果的类型,提取多帧原始图像中的多个所述目标区域的图像进行聚类分析,得到聚类分析结果。
具体地,当试卷图像中仅包含一个得分区域时,可以确定该得分区域为试卷的总分区域或试卷中某一试题的得分区域。此时,可以提取识别成同一识别结果的多帧原始图像中相应的多个目标区域的图像进行聚类分析。第一识别结果的类型可以为批阅得分的具体分数,例如识别出的试卷总分可以为“95”。即当聚类对象仅为一个类别的对象时,可以直接基于目标区域的位置提取具有同一识别结果的多帧原始图像中相应目标区域的图像构成聚类图像集,进行聚类分析。
在另一些实施例中,每帧原始图像中包含多个所述目标区域,步骤S3具体包括:
S321:确定多个所述目标区域的所述文本信息的类型;
S322:基于所述文本信息的类型和所述第一识别结果的类型,提取多帧原始图像中同一目标区域的图像进行聚类分析,得到聚类分析结果。
具体地,当试卷图像中包含多个得分区域时,得分区域可以为试卷中各试题的得分区域,也可以同时包括试卷的总分区域和试卷中各试题的得分区域,因此,在进行聚类分析之前需要确定目标区域的文本信息的类型,并基于文本信息的类型和所述第一识别结果的类型提取相应的得分区域的图像。
例如,当得分区域包括多个试题的得分区域时,确定原始图像中多个目标区域的文本信息的类型为试题得分,可以从多帧原始图像中提取识别成同一识别结果的同一试题的得分区域的图像进行聚类分析,以得到多个试卷中某一试题得分的聚类分析结果。
当得分区域包括试题的得分区域和试卷的总分区域时,确定原始图像中多个目标区域的文本信息的类型为试题得分和试卷总分,可以确定教师对多个试题进行了人工批阅,并在对多个试题进行人工批阅后,进行了人工合分,得到试卷总分。此时,可以从多帧原始图像中提取识别成同一识别结果的同一试题的得分区域的图像进行聚类分析,以得到试卷中某一试题的聚类分析结果;也可以从多帧原始图像中提取识别成同一识别结果的试卷的总分区域的图像进行聚类分析,得到多个试卷中试卷总分的聚类分析结果。
进一步地,步骤S321中,确定多个所述目标区域的所述文本信息的类型,包括:
基于所述文本信息的标注特征和/或所述原始图像中的预设文本信息确定所述目标区域的所述文本信息的类型。
具体地,目标区域的所述文本信息的类型为得分区域的批阅得分的类型,批阅得分的类型可以分为试题分数和试卷总分。可以根据批阅得分的标注特征和/或试卷中的预设文本信息确定得分区域的批阅得分的类型。
在一些实施例中,在通过不同的颜色笔批阅试卷时,可以基于批阅得分的文本颜色确定该批阅得分是试卷总分(例如以红色表示)还是试题得分(例如以蓝色表示)。
在另一些实施例中,预设文本信息为试卷中的试题信息或者试卷名称等预设的信息,可以基于试卷中的或者试卷名称等来确定得分区域的批阅得分的类型。例如,试题得分一般靠近相应的试题设置,因此,可以将靠近试题信息的批阅得分确定为试题得分;而试卷总分一般靠近试卷名称,因此,可以将靠近试卷名称的批阅得分确定为试卷总分。
本实施例中,可以先通过步骤S11和S12检测批阅得分的标注特征查找出试卷中的批阅得分,然后根据批阅得分与预设文本信息的相对位置关系确定批阅得分的具体类型。例如,可以检测试卷中的手写文本,确定该手写文本为批阅得分,然后根据批阅得分与各试题以及试卷名称的距离确定该批阅得分的类型。
在又一些实施例中,可以同时根据批阅得分的标注特征和试卷中的预设文本信息确定得分区域的批阅得分的类型。例如,可以同时根据批阅得分的不同文本颜色和批阅得分与预设文本信息的相对位置关系确定批阅得分的类型,如此,可以保证批阅得分的类型确定的准确性,保证聚类分析时,目标区域的图像提取的准确性。
在一些实施例中,文本信息的类型可以进行进一步划分,例如,试题得分可以基于试卷中试题的类型这一预设文本信息进行进一步分类,试题得分可以为填空题得分、选择题得分(包括单选、多选或不定项选择题)、简答题得分、计算题得分等。即试题得分可以为不同类型试题的得分,例如同一试卷中可以根据试题的类型进行批阅,得到每一类型试题的得分,填空题得分可以为“10”、选择题得分可以为“20”等,然后将不同试题得分进行人工汇总得到试卷总分。
步骤S322可以进一步包括:基于所述文本信息的子类型和所述第一识别结果的类型,提取多帧原始图像中同一目标区域的图像进行聚类分析,得到聚类分析结果。
当试卷中的多个试题得分是不同类型试题的得分时,可以基于试题的类型确定不同的聚类对象。例如,将包含选择题的得分的图像作为第一聚类对象,将包含选择题的得分的图像作为第二聚类对象,将包含简答题得分的图像作为第三聚类对象等等,然后分别对每个聚类对象进行聚类分析,得到相应聚类对象的聚类分析结果。
进一步地,在确定待聚类的聚类对象之后、提取相应目标区域的图像之前,可以基于不同子类型的文本信息或不同子类型的预设文本信息,确定目标区域的位置,然后提取不同帧图像中目标区域的图像。例如,可以基于填空题、选择题等不同类型试题的位置确定相应试题类型的得分区域的位置,然后提取不同帧图像中该得分区域的图像,可以实现聚类对象的快速定位、获取。上述实施例中,将不同类型试题的得分区域的图像分别作为聚类子对象,将试卷的总分区域的图像作为聚类总对象。
在另一些实施例中,试题得分也可以为同一类型试题的得分,例如可以对同一试卷中每个简答题进行批阅得到每个简答题的试题得分,然后将各简答题的试题得分进行人工汇总得到简答题总分。即将不同题目对应的得分区域的图像分别作为聚类子对象,将该类型试题的总分区域的图像作为聚类总对象。
本实施例中,在确定具体的聚类对象后,可以将聚类对象输入预设的聚类分析算法模型中进行聚类分析。聚类分析算法可以为k-means聚类算法等。
聚类分析时,可以先对各聚类子对象进行聚类分析,得到每一聚类子对象的聚类分析结果,然后,再对聚类总对象进行聚类分析得到聚类总对象的聚类分析结果;也可以分别对各聚类子对象和聚类总对象分别进行聚类分析,即在检测到试卷中同时包含不同类型试题的试题得分和试卷总分时可以分别聚类;由于聚类总对象的试卷总分基于聚类子对象的试题得分确定,因此,还可以仅对各聚类子对象进行聚类分析,然后基于各聚类子对象的聚类分析结果,得到聚类总对象的聚类分析结果。
S4:根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。
第一识别结果可以分为正常和异常两种识别结果,正常识别结果能够准确识别出文本信息的内容,异常识别结果不能准确识别出文本信息的内容,例如文本信息被错误识别或无法识别。
在得到聚类分析结果后,可以对第一识别结果进行进一步判断识别,确定第一识别结果是否正常,即判断通过OCR识别引擎识别出的文本信息的内容是否存在异常。
在一些实施例中,根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果,包括:
判断所述聚类分析结果中是否存在离散点,并判断所述离散点对应的所述文本信息的第一识别结果是否为异常识别结果。
例如,在对第一识别结果为“95”的试卷总分区域的图像进行聚类分析后,若聚类分析结果中存在离散点,进一步判断该离散点对应的文本信息的第一识别结果是否为异常识别结果,从而确定文本信息的内容识别过程中的错误识别结果。
具体地,在确定聚类分析结果中存在离散点后,如果所述聚类分析结果中只有一个分类,且该分类结果与所述第一识别结果对应,则所述离散点对应的所述第一识别结果为异常识别结果。例如,在确定聚类中心为“95”时,可以确定离散点对应的识别结果为异常识别结果。如果聚类中心不是“95”,可以继续迭代进行聚类分析,直至聚类中心调整为“95”,并获取此时聚类分析结果中的离散点,该离散点对应的第一识别结果即为异常识别结果。
在另一些实施例中,如果所述聚类分析结果中包括多个分类,将多个分类结果与所述第一识别结果进行比较,得到第二识别结果;
不同于所述第一识别结果的所述分类结果对应的所述第一识别结果为异常识别结果。
具体地,在存在多个聚类中心时,例如存在聚类中心为“95”、“96”和“97”的三个簇,与聚类中心“95”相关的离散点所对应的第一识别结果为异常识别结果。聚类中心“96”和“97”的簇内数据对应的第一识别结果也为异常识别结果。
在一些实施例中,在每帧原始图像中包含多个所述目标区域时,所述方法还包括:
基于第一目标区域的第一文本信息的第二识别结果确定第二目标区域的第二文本信息的第二识别结果。
在上述可以对各聚类子对象分别进行聚类分析,然后基于各聚类子对象的聚类分析结果,得到聚类总对象的聚类分析结果的基础上,可以在确定出文本信息的子类型中存在异常识别结果时,与各子类型对应的上一级分类类型中存在异常识别结果。
具体地,第一文本信息可以为试题得分,第一目标区域为试题的得分区域;第二文本信息可以为试卷总分,第二目标区域为试卷的总分区域。
当检测到的试卷中文本信息的类型既包括试题得分也包括试卷总分时,可以基于各试题得分的第二识别结果确定试卷总分的第二识别结果。如果某一或某一类型试题得分对应的第一识别结果为异常识别结果,则试卷总分对应的第一识别结果为异常识别结果。在对试题得分和试卷总分的第一识别结果进行判断识别时,仅需对试题得分的第一识别结果对应的试题得分区域的图像进行聚类分析,如此,可以大大提高整个试卷中第一识别结果的识别效率。
在一些实施例中,若异常识别结果的异常个数大于异常阈值,则可能是OCR识别引擎存在问题,因此,可以对OCR识别引擎进行检测,并调节其参数。
在一些实施例中,文本信息识别方法还包括:
在确定所述第一识别结果为异常识别结果时,生成提示信息,以提示用户对所述文本信息进行核验。
具体地,当通过步骤S4确定第一识别结果为异常识别结果时,即通过OCR识别引擎识别出的文本信息的内容存在异常时,可以生成提示信息,以提示用户进行相应的核验操作。通过生成提示信息可以使用户较为直观和快速地确定出异常的得分,并及时对异常的得分进行核验,提高文本信息识别准确率和异常处理效率。
生成提示信息的具体方式可以有多种。例如,直接在电子设备的显示界面显示该提示信息。生成的提示信息可以为语音提示、文字提示、短信提示等。
具体实施中,若第一识别结果为异常识别结果,电子设备可以基于所述文本信息的类型生成不同的提示信息。例如,可以基于各试题的类型,对不同类型试题中的异常得分通过不同的提示方式进行提示,以使用户快速定位至异常得分对应的试题类型。试题得分和试题总分的提示信息也可以不同。当提示信息为文字提示时,可以在电子设备的显示界面上显示响应的错误试卷或试题,例如试卷的编号或试题的试题类型及具体的试题题号。当提示信息为短信提示时,电子设备可以与用户的智能终端(例如手机、平板电脑)等建立通信连接,将该提示信息发送至用户,并在用户的智能终端中输出对应的错误试卷或试题。
可以理解的是,上述不同种类的提示信息可以单独使用也可以结合使用,比如可以在生成音频提示音的同时生成文字或图像提示等,在此不进行赘述。
上述核验操作可以是对该文本信息进行重新识别或人工核验等,并基于重新识别或核验结果进行校正,例如,当批阅得分存在异常时,可以提示用户对该批阅得分进行核验,并对错误识别的批阅得分进行纠正。
特别地,在一些实施例中,当试题中包含多个类型试题的试题得分时,同一试卷中不同类型试题的得分可能存在异常,但是,试卷总分的识别结果正常,此时,可以输出该试卷的第一类型试题的第一异常提示,第二类型试题的第二异常提示以及试卷总分的正常提示,以便用户进行相应的操作。例如,对该试卷的第一类型试题的试题得分和第二类型试题的试题得分进行人工核验校正后,判断是否与“被正常识别的试卷总分”对应,若不对应,可以生成另一提示信息,以提示用户对试卷总分进行进一步校正,以保证各试题得分和试卷总分的准确性。即本实施例中提示信息可以为与第一类型文本信息的异常识别结果相关的第二类型文本信息的正常识别结果的提示信息。
除了生成提示信息这一方式外,在确定所述第一识别结果为异常识别结果时,还可以对所述文本信息进行标记,以提示用户对所述文本信息进行核验。
其中,标记所述文本信息可以是标记试卷及该试卷对应的试卷总分,也可以标记试卷中的具体试题及该试题对应的试题得分,对于不同类型的试题可以采用不同的标记形式。标记形式可以为通过圆圈、三角、“×”等图形符号标记,也可以为突出显示或高亮显示等。
在确定出第一识别结果为异常识别结果时,可以在标记异常识别结果对应的文本信息的同时,输出该文本信息的第一识别结果异常的提示。提示信息可以携带标记有目标区域的图像,以提示用户根据标记后的目标区域的图像重新识别目标区域的文本信息。用户接收到该重新识别的提示消息时,可以通过电子设备的显示界面中显示的标记后的目标图像,对目标区域的文本信息进行重新识别。重新识别可以是自动识别也可以是手动识别,或者是二者的结合。
在一些实施例中,在得到第二识别结果之后,文本信息识别方法还包括:
在所述异常识别结果为多个时,将与所述异常识别结果对应的多个所述文本信息或所述文本信息所属的所述原始图像依序突出显示。
具体地,异常识别结果对应的文本信息或文本信息所属的原始图像可以作为提示信息依序排列,并在较为明显的位置显示,以方便进行重新识别或人工核验。具体的排序规则和显示方式可以根据异常识别结果的数量和文本信息的类型确定。例如,当异常识别结果的数量较多、且包含不同类型的试题时,可以根据试题类型将不同类型的异常识别结果对应的试题标号以列表的形式在显示器的左侧栏依序显示。
本公开实施例中,通过OCR识别引擎识别出文本信息的第一识别结果后,可以自动进行步骤S3和S4,从而准确识别出第一识别结果中的异常识别结果,保证人工阅卷后合分的准确性,同时,可以利用上述批阅得分进行自动合分,无需人工合分,可以有效提高阅卷后的合分效率。例如,可以通过自动合分的方式对同一考生不同科目的试卷总分进行合分,也可以对同一试卷的不同试题进行自动合分得到试卷总分。
本公开实施例中,也可以基于用户选择进行步骤S3,例如,可以根据用户需求仅对第一文本信息(例如试题得分)的第一识别结果进行聚类分析,也可仅对第二文本信息(例如试卷总分)的第一识别结果进行聚类分析,具体实施方式本公开不具体限定。
本公开实施例提供的文本信息识别方法在利用文本识别算法对文本信息的内容进行识别后,通过聚类分析对识别结果进行进一步判断,识别可能存在的错误识别结果,方便教师查错,大大减少由于文本识别算法本身的不可靠性给教师带来的纠错工作量,同时通过少量的人工干预即可提升文本识别算法的准确可用性,提高文本识别准确率,提高用户体验。
图3示出了本公开实施例的文本信息识别装置的结构示意图。如图3所示,本公开实施例提供一种文本信息识别装置,包括:
获取模块301,配置为从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息;
识别模块302,配置为配置为识别所述目标区域的所述文本信息的内容,得到第一识别结果;
聚类模块303,配置为基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果;
确定模块304,配置为根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。
本公开实施例提供的文本信息识别装置在利用文本识别算法对文本信息的内容进行识别后,通过聚类分析对识别结果进行进一步判断,识别可能存在的错误识别结果,方便教师查错,大大减少由于文本识别算法本身的不可靠性给教师带来的纠错工作量,同时通过少量的人工干预即可提升文本识别算法的准确可用性,提高文本识别准确率,提高用户体验。
由于本公开实施例提供的文本信息识别装置与本公开实施例中文本信息识别方法相对应,因此,基于本公开实施例中的文本信息识别方法,本领域的技术人员能够了解本公开实施例中文本信息识别装置具体实施方式以及其各种变化形式,在此对于该文本信息识别装置不再详细介绍。只要本领域所述技术人员实施本公开实施例中应用于的文本信息识别方法的文本信息识别装置,都属于本公开所欲保护的范围。
图4示出了本公开实施例的电子设备的结构示意图。如图4所示,本公开实施例提供一种电子设备,该电子设备可以包括:处理器401和存储器402,所述存储器402用于存储计算机可执行指令,所述处理器401执行所述计算机可执行指令时实现如上述实施例所述的文本信息识别方法。
电子设备还可以包括用于显示图像的显示器403,处理器401可以逐帧扫描显示于显示器403的一组连续的原始图像,并利用OCR识别引擎逐帧识别原始图像中的文本信息的内容得到第一识别结果,并在第一识别结果为异常识别结果时,将对应文本信息或该文本信息所属的原始图像等提示信息显示于显示器403,以提示用户对所述文本信息进行核验。
存储器402可能包括随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器401可以是通用处理器,包括中央处理器CPU、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
电子设备还可以包括至少一个通信接口404,其中:
通信接口404可以为通信模块的接口,如GSM模块、WIFI模块、GPRS模块等通信模块的接口,可以实现与其他设备的数据交互,还可以包括如USB接口、串/并口等接口,用于实现电子设备内部组成部件之间的数据交互,可以根据该电子设备的产品类型确定,本公开不进行赘述。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现如上述实施例所述的文本信息识别方法。
以上实施例仅为本公开的示例性实施例,不用于限制本公开,本公开的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本公开做出各种修改或等同替换,这种修改或等同替换也应视为落在本公开的保护范围内。
Claims (10)
1.一种文本信息识别方法,包括:
从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息;
识别所述目标区域的所述文本信息的内容,得到第一识别结果;
基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果;
根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。
2.根据权利要求1所述的方法,其中,每帧原始图像中包含至少一个所述目标区域,从采集到的多帧原始图像中获取目标区域,包括:
检测所述原始图像中的标注特征;
基于所述标注特征,确定待识别的所述文本信息的位置;
基于待识别的所述文本信息的位置确定所述目标区域;
其中,所述标注特征包括手写文本、文本颜色、文本字符数量、文本长度中的至少一种。
3.根据权利要求1所述的方法,其中,每帧原始图像中包含一个所述目标区域,基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果,包括:
基于所述第一识别结果的类型,提取多帧原始图像中的多个所述目标区域的图像进行聚类分析,得到聚类分析结果。
4.根据权利要求1所述的方法,其中,每帧原始图像中包含多个所述目标区域,基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果,包括:
确定多个所述目标区域的所述文本信息的类型;
基于所述文本信息的类型和所述第一识别结果的类型,提取多帧原始图像中同一目标区域的图像进行聚类分析,得到聚类分析结果。
5.根据权利要求4所述的方法,其中,确定多个所述目标区域的所述文本信息的类型,包括:
基于所述文本信息的标注特征和/或所述原始图像中的预设文本信息确定所述目标区域的所述文本信息的类型。
6.根据权利要求3或4所述的方法,其中,根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果,包括:
判断所述聚类分析结果中是否存在离散点,并判断所述离散点对应的所述文本信息的第一识别结果是否为异常识别结果。
7.根据权利要求1所述的方法,其中,在每帧原始图像中包含多个所述目标区域时,所述方法还包括:
基于第一目标区域的第一文本信息的第二识别结果确定第二目标区域的第二文本信息的第二识别结果。
8.根据权利要求6所述的方法,其中,所述方法还包括:
在确定所述第一识别结果为异常识别结果时,生成提示信息,以提示用户对所述文本信息进行核验;或者,
在确定所述第一识别结果为异常识别结果时,对所述文本信息进行标记,以提示用户对所述文本信息进行核验。
9.根据权利要求6所述的方法,其中,所述方法还包括:
在所述异常识别结果为多个时,将与所述异常识别结果对应的多个所述文本信息或所述文本信息所属的所述原始图像依序突出显示。
10.一种文本信息识别装置,包括:
获取模块,配置为从采集到的多帧原始图像中获取目标区域,其中,所述目标区域包含待识别的文本信息;
识别模块,配置为配置为识别所述目标区域的所述文本信息的内容,得到第一识别结果;
聚类模块,配置为基于所述第一识别结果对多帧原始图像中相应的多个所述目标区域的图像进行聚类分析,得到聚类分析结果;
确定模块,配置为根据所述聚类分析结果,确定与所述第一识别结果相关的第二识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125220.7A CN112906499A (zh) | 2021-01-29 | 2021-01-29 | 文本信息识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125220.7A CN112906499A (zh) | 2021-01-29 | 2021-01-29 | 文本信息识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112906499A true CN112906499A (zh) | 2021-06-04 |
Family
ID=76120808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110125220.7A Pending CN112906499A (zh) | 2021-01-29 | 2021-01-29 | 文本信息识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906499A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024183372A1 (zh) * | 2023-03-06 | 2024-09-12 | 荣耀终端有限公司 | 基于终端设备的文本识别方法、设备以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262614A (zh) * | 2010-05-31 | 2011-11-30 | 汉王科技股份有限公司 | 纵向校对方法和装置 |
CN109389061A (zh) * | 2018-09-26 | 2019-02-26 | 苏州友教习亦教育科技有限公司 | 试卷识别方法和系统 |
CN110414563A (zh) * | 2019-06-27 | 2019-11-05 | 深圳中兴网信科技有限公司 | 考试成绩统计方法、系统及计算机可读存储介质 |
-
2021
- 2021-01-29 CN CN202110125220.7A patent/CN112906499A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262614A (zh) * | 2010-05-31 | 2011-11-30 | 汉王科技股份有限公司 | 纵向校对方法和装置 |
CN109389061A (zh) * | 2018-09-26 | 2019-02-26 | 苏州友教习亦教育科技有限公司 | 试卷识别方法和系统 |
CN110414563A (zh) * | 2019-06-27 | 2019-11-05 | 深圳中兴网信科技有限公司 | 考试成绩统计方法、系统及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024183372A1 (zh) * | 2023-03-06 | 2024-09-12 | 荣耀终端有限公司 | 基于终端设备的文本识别方法、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11790641B2 (en) | Answer evaluation method, answer evaluation system, electronic device, and medium | |
CN110008933B (zh) | 一种通用智能阅卷系统和方法 | |
CN109271401B (zh) | 一种题目搜索、批改方法、装置、电子设备和存储介质 | |
CN109284355B (zh) | 一种批改试卷中口算题的方法及装置 | |
WO2018006294A1 (zh) | 一种基于图像模式识别技术的阅卷系统、装置和方法 | |
CN109189895B (zh) | 一种针对口算题的题目批改方法及装置 | |
CN110135225B (zh) | 样本标注方法及计算机存储介质 | |
US12051256B2 (en) | Entry detection and recognition for custom forms | |
CN114549993B (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
JP2008204226A (ja) | 帳票認識装置およびそのプログラム | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
CN112149680A (zh) | 错字检测识别方法、装置、电子设备及存储介质 | |
CN106372216A (zh) | 提高题目查找准确率的方法和装置 | |
CN113610068B (zh) | 基于试卷图像的试题拆解方法、系统、存储介质及设备 | |
CN112906499A (zh) | 文本信息识别方法及装置 | |
CN112084103B (zh) | 界面测试方法、装置、设备和介质 | |
CN111090989B (zh) | 一种基于文字识别的提示方法及电子设备 | |
CN114299523A (zh) | 一种教辅作业识别批改分析方法和分析系统 | |
CN114581934A (zh) | 试卷图像的处理方法、装置及设备 | |
CN115546811A (zh) | 一种识别印章的方法、装置、设备及存储介质 | |
CN113515588A (zh) | 表单数据检测方法、计算机装置及存储介质 | |
CN114550181B (zh) | 一种小题识别方法、装置及介质 | |
CN116662211B (zh) | 显示界面测试方法、装置及设备和介质 | |
CN114241503B (zh) | 一种错题原因采集方法、系统、可读存储介质及设备 | |
CN113239893B (zh) | 一种文档录入复核方法、系统、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |