CN112036343A - 答案提取方法、装置、计算机可读介质及电子设备 - Google Patents

答案提取方法、装置、计算机可读介质及电子设备 Download PDF

Info

Publication number
CN112036343A
CN112036343A CN202010922271.8A CN202010922271A CN112036343A CN 112036343 A CN112036343 A CN 112036343A CN 202010922271 A CN202010922271 A CN 202010922271A CN 112036343 A CN112036343 A CN 112036343A
Authority
CN
China
Prior art keywords
connected component
answer
preset
preset separator
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010922271.8A
Other languages
English (en)
Other versions
CN112036343B (zh
Inventor
郝昱
黄灿
文林福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010922271.8A priority Critical patent/CN112036343B/zh
Publication of CN112036343A publication Critical patent/CN112036343A/zh
Application granted granted Critical
Publication of CN112036343B publication Critical patent/CN112036343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种答案提取方法、装置、计算机可读介质及电子设备。方法包括:识别答案图像中是否包含预设分隔符;在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。这样,通过提取被该预设分隔符前后分隔开的文本区域即可获取到各作答点对应的答案的区域图像,可有效提升相邻作答点的答案分隔的精度和稳定性,进而保证后续基于各作答点对应的答案的区域图像提取出的答案信息的准确性。

Description

答案提取方法、装置、计算机可读介质及电子设备
技术领域
本公开涉及图像处理技术领域,具体地,涉及一种答案提取方法、装置、计算机可读介质及电子设备。
背景技术
随着在线教育的不断发展,在线测试也变得越来越普及。通常情况下,用户根据线上展示的题目,给出答案(例如,在纸上手写),之后,用户使用图像采集装置(例如,智能终端、相机等)拍摄答案图像,并将其上传至用于答案提取的电子设备(例如,服务器或智能终端);电子设备对答案图像的中答案进行识别,并进行对错判定。当一道题目包含多个作答点时(例如:找规律写数字:101、102、103、?、105、106、?、108,其中,“?”代表一个作答点),需要先将每一作答点对应的答案提取出来,再将提取到的各作答点对应的答案分别与标准答案进行匹配,以进行对错判定。
现阶段,大多使用基于连通组件和连通组件距离的方法进行答案提取。具体来说,首先对答案图像进行连通域提取,得到多个连通组件;然后将多个连通组件按照其在答案图像中的前后顺序排列,并计算每相邻两个连通组件之间的距离。若相邻两个连通组件之间的距离小于距离平均值(每相邻两个连通组件之间的距离之和的平均值),则将二者合并;最后,得到多个连通组件,其中,每一连通组件与一作答点对应,从而可将多个作答点的答案提取出来。但当答案图像中相邻字符之间的间距不明朗时,将无法精准地将各作答点对应的答案分隔开。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种答案提取方法,包括:
识别答案图像中是否包含预设分隔符;
在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;
对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
第二方面,本公开提供一种答案提取装置,包括:
第一识别模块,用于识别答案图像中是否包含预设分隔符;
提取模块,用于在所述第一识别模块识别出所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;
第二识别模块,用于对所述提取模块提取到的所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面提供的所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面提供的所述方法的步骤。
在上述技术方案中,答案图像中前后相邻的两个文本区域(即作答点对应的答案所在的区域)之间通过预设分隔符分隔开,这样,通过提取被该预设分隔符前后分隔开的文本区域即可获取到各作答点对应的答案的区域图像,可有效提升相邻作答点的答案分隔的精度和稳定性,进而保证后续基于各作答点对应的答案的区域图像提取出的答案信息的准确性。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1是现有技术中的一种答案图像的示意图。
图2是根据一示例性实施例示出的一种答案提取方法的流程图。
图3是根据一示例性实施例示出的一种答案图像的示意图。
图4A-图4D是对图3中的答案图像进行处理得到的多个区域图像的示意图。
图5是根据一示例性实施例示出的一种识别答案图像中是否包含预设分隔符的方法的流程图。
图6是根据一示例性实施例示出的一种提取区域图像的方法的流程图。
图7是根据一示例性实施例示出的一种对图3中的答案图像进行连通域提取后得到的多个连通组件的示意图。
图8是根据一示例性实施例示出的一种对图7中、满足条件的连通组件进行拆分得到的连通组件的示意图。
图9是根据一示例性实施例示出的一种当前得到的多个连通组件的示意图。
图10是根据另一示例性实施例示出的一种提取区域图像的方法的流程图。
图11是根据另一示例性实施例示出的一种对图7中、满足条件的连通组件进行拆分得到的连通组件的示意图。
图12是根据另一示例性实施例示出的一种答案提取方法的流程图。
图13是根据一示例性实施例示出的一种答案提取装置的框图。
图14是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
正如背景技术所述的那样,当答案图像中相邻字符之间的间距不明朗时,将无法精准地将各作答点对应的答案分隔开。示例地,针对题目“101、102、103、?、105、106、?、108”,学生给出的答案如图1中所示。由图1可知,相邻字符之间的间距不明朗(例如,字符“4”和相邻字符“1”间距比较近,字符“7”和相邻字符“0”间距比较远),若基于连通组件和连通组件距离的方法对其进行答案提取,可能无法精准地将各作答点对应的答案分隔开。例如,提取到的答案信息为“10410”和“7”。
为此,本公开提供一种答案提取方法、装置、计算机可读介质及电子设备。
如图2所示,本公开提供的答案提取方法可以包括S201~S203。
在S201中,识别答案图像中是否包含预设分隔符。
在本公开中,答案图像中的文本可以为手写体,也可以为印刷体。当一道题目包含多个作答点时,学生在作答时,可以在相邻作答点对应的答案之间插入预设分隔符,其中,该预设分隔符可以为除常用字符(例如常用的标点符号、常用的公式符号、常用的字母等)之外的任意符号。
示例地,针对题目“101、102、103、?、105、106、?、108、?、?”,学生给出的答案如图3中所示,其中,相邻作答点对应的答案之间采用带圈的五角星这一预设分隔符分隔开。
在通过S201中确定答案图像中包含预设分隔符的情况下,则提取被预设分隔符前后分隔开的文本区域的区域图像,即执行S202;在通过S201中确定答案图像中不包含预设分隔符,则表明该答案图像中仅包含一个作答点的答案,此时,不需要进行答案分隔,可以直接对该答案图像进行文本识别,以得到该答案图像中该一个作答点对应的答案信息。
在S202中,在答案图像中包含预设分隔符的情况下,提取被预设分隔符前后分隔开的文本区域的区域图像。
在本公开中,前后相邻的两个文本区域之间被预设分隔符分隔开,其中,文本区域为相应作答点对应的答案所在的区域,即文本区域的区域图像中包含的答案信息为相应作答点对应的答案信息。示例地,如图3所示,文本区域a、文本区域b、文本区域c和文本区域d中,前后相邻的两个文本区域之间被带圈的五角星这一预设分隔符分隔开。对图3中所示的答案图像进行区域图像提取后,可以得到图4A-图4D中所示的四个区域图像。
在S203中,对区域图像进行文本识别,以得到区域图像对应的答案信息。
在本公开中,在通过S202提取到多个区域图像后,可以针对每一区域图像,对其进行文本识别,以得到该区域图像对应的答案信息。
示例地,在通过S202提取到图4A-图4D中所示的四个区域图像后,针对每一区域图像,进行文本识别,可以得到图4A中所示的区域图像对应的答案信息为“104”、图4B中所示的区域图像对应的答案信息为“107”、图4C中所示的区域图像对应的答案信息为“109”、图4D中所示的区域图像对应的答案信息为“110”。
在上述技术方案中,答案图像中前后相邻的两个文本区域(即作答点对应的答案所在的区域)之间通过预设分隔符分隔开,这样,通过提取被该预设分隔符前后分隔开的文本区域即可获取到各作答点对应的答案的区域图像,可有效提升相邻作答点的答案分隔的精度和稳定性,进而保证后续基于各作答点对应的答案的区域图像提取出的答案信息的准确性。
下面针对上述S201中的识别答案图像中是否包含预设分隔符的具体实施方式进行详细说明。
在一种实施方式中,可以采用尺度不变特征变换(Scale-invariant featuretransform,SIFT)、加速稳健特征(Speed Up Robust Feature,SURF)等方法将答案图像与预设分隔符进行匹配,以确定答案图像中是否包含预设分隔符。
在另一种实施方式中,通过图5中所示的S2011~S2013来识别答案图像中是否包含预设分隔符。
在S2011中,对答案图像进行连通域提取,得到多个连通组件。
在本公开中,可以通过Two-Pass(两遍扫描法)、Seed-Filling(种子填充法)等连通域提取方法对答案图像进行连通域提取,以得到多个连通组件。
在S2012中,对每一连通组件分别进行识别,以确定连通组件中是否包含预设分隔符。
在本公开中,可以针对每一连通组件,通过SIFT、SURF等方法将该连通组件与预设分隔符进行匹配,以确定该连通组件中是否包含预设分隔符。
在S2013中,在存在包含预设分隔符的连通组件的情况下,确定答案图像中包含预设分隔符。
在本公开中,若上述多个组件中存在包含预设分隔符的连通组件,则确定答案图像中包含预设分隔符;若上述多个组件中不存在包含预设分隔符的连通组件,即上述多个连通组件中的各连通组件均不包含预设分隔符,则确定答案图像中不包含预设分隔符。
通过将答案图像分割为多个连通组件,之后,可以对每一连通组件分别进行识别,若存在包含预设分隔符的连通组件,则可确定答案图像中包含预设分隔符。其中,各连通组件的尺寸相对整个答案图像会小很多,并且,各连通组件的识别操作可以同时进行,由此可以快速确定答案图像中是否包含预设分隔符,从而提升了答案提取的效率。
下面针对上述S2011中的对答案图像进行连通域提取,得到多个连通组件的具体实施方式进行详细说明。
在一种实施方式中,可以通过Two-Pass、Seed-Filling等连通域提取方法对答案图像进行连通域提取;之后,可以将提取到的多个连通区域作为上述连通组件。
在另一种实施方式中,可以先通过Two-Pass、Seed-Filling等连通域提取方法对答案图像进行连通域提取;之后,可以对提取出的多个连通区域进行优化处理;最后,将优化处理后得到的连通区域确定为上述连通组件。
在本公开中,优化处理包括形态学处理(例如,腐蚀、膨胀、开操作、闭操作等)和/或面积过滤。由于预设分隔符可以为除常用字符(例如常用的标点符号、常用的公式符号、常用的字母等)之外的任意符号,即预设分隔符需要与常用字符区分开,这将导致预设分隔符不会特别简单,同时其占用的面积也不会太小。因此,采用面积过滤可以筛选掉面积过大或者过小的连通区域,以去除其他符号(例如,“·”)的干扰,进而提升后续确定答案图像中是否包含预设分隔符的效率和精度。
在一种实施方式中,优化处理包括形态学处理。即在对答案图像进行连通域提取后,可以对提取到的多个连通区域进行形态学处理,之后,将形态学处理后得到的连通区域确定为上述连通组件。
由于提取到的连通区域可能存在其不能包含完整的答案信息的情况,从而导致答案信息丢失,降低后续答案提取的准确度。因此,在提取到连通区域后,对其进行形态学处理,可使得形态学处理后的连通区域尽可能包含完整的答案信息,以提升后续答案提取的准确度。
在另一种实施方式中,优化处理包括面积过滤。即在对答案图像进行连通域提取后,可以对提取到的多个连通区域进行面积过滤,之后,将面积过滤后得到的连通区域确定为上述连通组件。
在又一种实施方式中,优化处理包括形态学处理和面积过滤。即在对答案图像进行连通域提取后,可以对提取到的多个连通区域进行形态学处理和面积过滤,之后,可以将经过形态学处理、面积过滤后得到的连通区域确定为上述连通组件。
下面针对上述S202中的提取被预设分隔符前后分隔开的文本区域的区域图像的具体实施方式进行详细说明。
在一种实施方式中,可以确定答案图像中预设分隔符的位置;之后,可以提取答案图像中、预设分隔符的位置前的文本区域的区域图像以及答案图像中、预设分隔符的位置后的文本区域的区域图像,从而得到被预设分隔符前后分隔开的各文本区域的区域图像。
在另一种实施方式中,在通过上述S2011~S2013来确定答案图像中包含预设分隔符时,可以对S2011得到的多个连通组件中、包含预设分隔符和除预设分隔符之外的其他文本的每一连通组件分别进行拆分;之后,将拆分后得到的连通组件和未进行拆分的连通组件按照其在答案图像中的前后顺序排列,得到第一连通组件序列;接下来,遍历第一连通组件序列中的各连通组件,并在遍历的过程中,对满足条件的连通组件进行合并操作,从而可以快速提取被预设分隔符前后分隔开的文本区域的区域图像。具体来说,可通过图6中所示的S601~S608来实现。
在S601中,将包含预设分隔符和除预设分隔符之外的其他文本的连通组件,以预设分隔符为分界点,拆分成多个连通组件。
在本公开中,在确定答案图像中包含预设分隔符时,可以将上述S2011得到的多个连通组件中、包含预设分隔符和除预设分隔符之外的其他文本的连通组件,以预设分隔符为分界点,拆分成多个连通组件。其中,预设分隔符被拆分为一个独立的连通组件,并且,拆分后得到的连通组件和未进行拆分的连通组件按照其在答案图像中的前后顺序排列,得到第一连通组件序列。
示例地,图3中所示的答案图像经过连通域提取后,得到图7中所示的八个连通组件,即连通组件A、连通组件B、连通组件C、连通组件D、连通组件E、连通组件F、连通组件G和连通组件H。由图7可知,八个连通组件中、包含预设分隔符和除预设分隔符之外的其他文本的连通组件分别为连通组件C和连通组件E;以预设分隔符为分界点,将连通组件C拆分成图8中所示的连通组件C1和连通组件C2;以预设分隔符为分界点,将连通组件E拆分成图8中所示的连通组件E1、连通组件E2和连通组件E3。之后,将拆分后得到的连通组件和未进行拆分的连通组件按照其在答案图像中的前后顺序排列,得到图8中所示的第一连通组件序列,即连通组件A、连通组件B、连通组件C1、连通组件C2、连通组件D、连通组件E1、连通组件E2、连通组件E3、连通组件F、连通组件G、连通组件H。
在S602中,按照连通组件的排列顺序遍历多个连通组件。
在S603中,判定当前遍历到的连通组件是否包含预设分隔符。
在本公开中,若当前遍历到的连通组件不包含预设分隔符,则执行S604;若当前遍历到的连通组件包含预设分隔符,则判定遍历是否完成,即执行S606。
在S604中,判定当前遍历到的连通组件的前一连通组件是否包含预设分隔符。
若当前遍历到的连通组件的前一连通组件不包含预设分隔符,则说明当前遍历到的连通组件和其前一连通组件属于同一文本区域,故可以将二者合并,即执行S605;若当前遍历到的连通组件的前一连通组件包含预设分隔符,则执行S606。
在S605中,将当前遍历到的连通组件与前一连通组件合并成一个连通组件。
在S606中,判定遍历是否完成。
在本公开中,若当前遍历的连通组件非上述第一连通组件序列中的最后一个连通组件,则说明遍历未完成,继续遍历,即遍历第一连通组件序列中、当前遍历的连通组件的下一连通组件,即执行S607;若当前遍历的连通组件为上述第一连通组件序列中的最后一个连通组件,则说明遍历已完成,则结束遍历,并将当前得到的不包含预设分隔符的连通组件确定为文本区域的区域图像,即执行S608。
在S607中,继续遍历。之后,返回上述S603继续执行。
在S608中,将当前得到的不包含预设分隔符的连通组件确定为文本区域的区域图像。
示例地,通过上述在S601中得到图8中所示的第一连通组件序列,之后,可以按照连通组件A、连通组件B、连通组件C1、连通组件C2、连通组件D、连通组件E1、连通组件E2、连通组件E3、连通组件F、连通组件G、连通组件H的顺序对第一连通组件序列进行遍历。
首先遍历连通组件A,由图8可知,连通组件A不包含预设分隔符,其不存在前一连通组件,故不对其进行处理;接下来继续遍历,即当前遍历的连通组件为连通组件B,由图8可知,连通组件B不包含预设分隔符、且当前遍历到的连通组件B的前一连通组件A也不包含预设分隔符,故将连通组件B和连通组件A合并成一个连通组件(即图9中所示的连通组件A’);接下来,继续遍历,即当前遍历的连通组件为连通组件C1,由图8可知,连通组件C1包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件C2;由图8可知,连通组件C2不包含预设分隔符、且前一连通组件C1中包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件D;由图8可知,连通组件D不包含预设分隔符、且前一连通组件C2中不包含预设分隔符,故将连通组件D和连通组件C2合并成一个连通组件DC2(图中未示出);接下来,继续遍历,即当前遍历的连通组件为连通组件E1,由图8可知,连通组件E1不包含预设分隔符、且前一连通组件DC2中不包含预设分隔符,故将连通组件E1和连通组件DC2合并成一个连通组件(即图9中所示的连通组件C’);接下来,继续遍历,即当前遍历的连通组件为连通组件E2,由图8可知,连通组件E2包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件E3;由图8可知,连通组件E3不包含预设分隔符、且前一连通组件E2中包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件F;由图8可知,连通组件F不包含预设分隔符、且前一连通组件E3中不包含预设分隔符,故将连通组件F和连通组件E3合并成一个连通组件(即图9中所示的连通组件E’);接下来,继续遍历,即当前遍历的连通组件为连通组件G,由图8可知,连通组件G包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件H;由图8可知,连通组件H不包含预设分隔符、且前一连通组件G中包含预设分隔符,且连通组件H为第一连通组件序列中的最后一个连通组件,故遍历结束。从而得到图9中所示的连通组件A’、连通组件C1、连通组件C’、连通组件E2、连通组件E’、连通组件G和连通组件H。其中,连通组件A’、连通组件C’、连通组件E’和连通组件H均不包含预设分隔符,连通组件C1、连通组件E2和连通组件G均包含预设分隔符,故将连通组件A’、连通组件C’、连通组件E’和连通组件H确定为文本区域的区域图像。
在又一种实施方式中,在通过上述S2011~S2013来确定答案图像中包含预设分隔符时,可以先将S2011中得到的多个连通组件按照其在答案图像中的前后顺序排列,得到第二连通组件序列;之后,遍历第二连通组件序列中的各连通组件,并在遍历的过程中执行连通组件拆分或合并操作,从而可以快速提取被预设分隔符前后分隔开的文本区域的区域图像。具体来说,可通过图10中所示的S1001~S1009来实现。
在S1001中,按照连通组件的排列顺序遍历连通组件。
在S1002中,判定当前遍历到的连通组件是否包含预设分隔符。
在本公开中,若当前遍历到的连通组件不包含预设分隔符,则执行S1003;若当前遍历到的连通组件包含预设分隔符,则执行S1004。
在S1003中,判定当前遍历到的连通组件的前一连通组件是否包含预设分隔符。
若当前遍历到的连通组件的前一连通组件不包含预设分隔符,则说明当前遍历到的连通组件和其前一连通组件属于同一文本区域,故可以将二者合并,即执行S1005;若当前遍历到的连通组件的前一连通组件包含预设分隔符,则执行S1007。
在S1004中,判定当前遍历到的连通组件是否包含除预设分隔符之外的其他文本。
若当前遍历到的连通组件包含除预设分隔符之外的其他文本,即当前遍历到的连通组件包含预设分隔符和除预设分隔符之外的其他文本,则执行S1006;若当前遍历到的连通组件不包含除预设分隔符之外的其他文本,即当前遍历到的连通组件仅包含预设分隔符,则执行S1007。
在S1005中,将当前遍历到的连通组件与前一连通组件合并成一个连通组件。
在S1006中,以预设分隔符为分界点,将当前遍历到的连通组件拆分成多个连通组件,并以拆分得到的最靠近当前遍历到的连通组件的前一连通组件的连通组件为起点继续遍历。
其中,预设分隔符被拆分为一个独立的连通组件。
在S1007中,判定遍历是否完成。
在本公开中,若当前遍历的连通组件非上述第二连通组件序列中的最后一个连通组件,则说明遍历未完成,继续遍历,即遍历第二连通组件序列中、当前遍历的连通组件的下一连通组件,即执行S1008;若当前遍历的连通组件为上述第二连通组件序列中的最后一个连通组件,则说明遍历已完成,则结束遍历,并将当前得到的不包含预设分隔符的连通组件确定为文本区域的区域图像,即执行S1009。
在S1008中,继续遍历。之后,返回上述S1002继续执行。
在S1009中,将当前得到的不包含预设分隔符的连通组件确定为文本区域的区域图像。
示例地,图3中所示的答案图像经过连通域提取后,将得到的多个连通组件按照其在答案图像中的前后顺序排列,得到图7中所示的第二连通组件序列,即连通组件A、连通组件B、连通组件C、连通组件D、连通组件E、连通组件F、连通组件G、连通组件H。
之后,按照连通组件A、连通组件B、连通组件C、连通组件D、连通组件E、连通组件F、连通组件G、连通组件H的顺序对第二连通组件序列进行遍历。
首先遍历连通组件A,由图7可知,连通组件A不包含预设分隔符,其不存在前一连通组件,故不对其进行处理;接下来继续遍历,即当前遍历的连通组件为连通组件B,由图7可知,连通组件B不包含预设分隔符、且当前遍历到的连通组件B的前一连通组件A也不包含预设分隔符,故将连通组件B和连通组件A合并成一个连通组件(即图9中所示的连通组件A’);接下来,继续遍历,即当前遍历的连通组件为连通组件C,由图7可知,连通组件C包含预设分隔符和除该预设分隔符之外的其他文本,此时,以预设分隔符为分界点,将当前遍历到的连通组件C拆分成多个连通组件(即拆分得到图11中所示的连通组件C1和连通组件C2),其中,连通组件C1为拆分得到的最靠近当前遍历到的连通组件C的前一连通组件B的连通组件,故以连通组件C1为起点继续遍历,即当前遍历的连通组件为连通组件C1;由图11所示,连通组件C1包含预设分隔符、且不包含除预设分隔符之外的其他文本,故继续遍历,即当前遍历的连通组件为连通组件C2;由图11可知,连通组件C2不包含预设分隔符、且前一连通组件C1中包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件D;由图11可知,连通组件D不包含预设分隔符、且前一连通组件C2中不包含预设分隔符,故将连通组件D和连通组件C2合并成一个连通组件DC2(图中未示出);接下来,继续遍历,即当前遍历的连通组件为连通组件E,由图11可知,连通组件E包含预设分隔符和除该预设分隔符之外的其他文本,此时,以预设分隔符为分界点,将当前遍历到的连通组件E拆分成多个连通组件(即拆分得到图8中所示的连通组件E1、连通组件E2和连通组件E3),其中,连通组件E1为拆分得到的最靠近当前遍历到的连通组件E的前一连通组件DC2的连通组件,故以连通组件E1为起点继续遍历,即当前遍历的连通组件为连通组件E1;由图8可知,连通组件E1不包含预设分隔符、且前一连通组件DC2中不包含预设分隔符,故将连通组件E1和连通组件DC2合并成一个连通组件(即图9中所示的连通组件C’);接下来,继续遍历,即当前遍历的连通组件为连通组件E2,由图8可知,连通组件E2包含预设分隔符、且不包含除预设分隔符之外的其他文本,故继续遍历,即当前遍历的连通组件为连通组件E3;由图8可知,连通组件E3不包含预设分隔符、且前一连通组件E2中包含预设分隔符,故继续遍历,即当前遍历的连通组件为连通组件F;由图8可知,连通组件F不包含预设分隔符、且前一连通组件E3中不包含预设分隔符,故将连通组件F和连通组件E3合并成一个连通组件(即图9中所示的连通组件E’);接下来,继续遍历,即当前遍历的连通组件为连通组件G,由图8可知,连通组件G包含预设分隔符、且不包含除预设分隔符之外的其他文本,故继续遍历,即当前遍历的连通组件为连通组件H;由图8可知,连通组件H不包含预设分隔符、前一连通组件G中包含预设分隔符,且连通组件H为第二连通组件序列中的最后一个连通组件,故遍历结束,从而得到图9中所示的连通组件A’、连通组件C1、连通组件C’、连通组件E2、连通组件E’、连通组件G和连通组件H。之后,将连通组件A’、连通组件C’、连通组件E’和连通组件H确定为文本区域的区域图像。
图12是根据另一示例性实施例示出的一种答案提取方法的流程图。如图12所示,上述方法还可以包括S204和S205。
在S204中,对区域图像对应的答案信息进行对错判定。
在本公开中,可以通过多种方式对答案信息进行对错判定。在一种实施方式中,用户(例如,教师、阅卷人、家长)可以对答案信息进行对错判定,并将用于表征该答案信息的对错判定结果的指令输入至用于执行上述答案提取方法的电子设备;电子设备接收该指令,并根据该指令确定答案信息是否正确。
在另一种实施方式中,可以获取答案图像对应的题目,并将该题目与题库中的题目进行匹配,将匹配度最高的题目对应的答案确定目标答案,之后,根据该目标答案对各区域图像对应的答案信息进行对错判定。这样,可以对答案信息进行自动对错判定,而无需人工干预,省时省力。
在S205中,根据答案信息的对错判定结果,对区域图像进行颜色更新,以通过更新后的颜色表征判定结果。
在本公开中,可以根据预先存储的对错判定结果和颜色的对应关系,确定答案信息的对错判定结果对应的目标颜色,其中,判定结果“对”对应的颜色不同于判定结果“错”对应的颜色,优选地,二者具有明显的区别,这样,可以更加明了的表征相应答案信息的判定结果;之后,将区域图像中的目标像素点(例如,背景部分的像素点、前景部分的像素点或者区域图像中的全部像素点)的颜色更新为该目标颜色。这样,通过区域图像的颜色即可呈现相应答案信息的对错判定结果,而无需像通过对错号展示对错判定结果那样考虑对错号的大小和放置位置,简单明了。并且,能够在对错判定结果与答案信息之间建立起自然的联系,而无需用户再去查找与当前对错号对应的答案信息,方便用户阅读,提升了用户体验。
示例地,上述对应关系如下:判定结果“对”对应颜色a,判定结果“错”对应颜色b。这样,当答案信息的对错判定结果为“对”时,目标颜色为颜色a;当答案信息的的对错判定结果为“错”时,目标颜色为颜色b。
图13是根据一示例性实施例示出的一种答案提取装置。如图13所示,该装置1300包括:第一识别模块1301,用于识别答案图像中是否包含预设分隔符;提取模块1302,用于在所述第一识别模块1301识别出所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;第二识别模块1303,用于对所述提取模块1302提取到的所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
在上述技术方案中,答案图像中前后相邻的两个文本区域(即作答点对应的答案所在的区域)之间通过预设分隔符分隔开,这样,通过提取被该预设分隔符前后分隔开的文本区域即可获取到各作答点对应的答案的区域图像,可有效提升相邻作答点的答案分隔的精度和稳定性,进而保证后续基于各作答点对应的答案的区域图像提取出的答案信息的准确性。
在一种实施方式中,第一识别模块1301用于SIFT、SURF等方法将答案图像与预设分隔符进行匹配,以确定答案图像中是否包含预设分隔符。
在另一种实施方式中,第一识别模块1301包括:提取子模块,用于对所述答案图像进行连通域提取,得到多个连通组件;识别子模块,用于对每一所述连通组件分别进行识别,以确定所述连通组件中是否包含所述预设分隔符;第一确定子模块,用于在存在包含所述预设分隔符的所述连通组件的情况下,确定所述答案图像中包含所述预设分隔符。
另外,在一种实施方式中,上述提取模块1302包括:第一拆分子模块,用于将包含所述预设分隔符和除所述预设分隔符之外的其他文本的连通组件,以所述预设分隔符为分界点,拆分成多个连通组件,其中,所述预设分隔符被拆分为一个独立的连通组件,并且,拆分后得到的连通组件和未进行拆分的连通组件按照其在所述答案图像中的前后顺序排列;第一遍历子模块,用于按照所述连通组件的排列顺序遍历所述连通组件;第一合并子模块,用于在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后,触发所述第一遍历子模块继续遍历;第一触发子模块,用于在当前遍历的所述连通组件包含所述预设分隔符的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,触发所述第一遍历子模块继续遍历;第二确定子模块,用于在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
在另一种实施方式中,所述多个连通组件按照其在所述答案图像中的前后顺序排列;所述提取模块1302包括:第二遍历子模块,用于按照所述连通组件的排列顺序遍历所述连通组件;第二合并子模块,用于在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后触发所述第二遍历子模块继续遍历;第二拆分子模块,用于在当前遍历到的所述连通组件包含所述预设分隔符和除所述预设分隔符之外的其他文本的情况下,以所述预设分隔符为分界点,将当前遍历到的所述连通组件拆分成多个连通组件,并以拆分得到的最靠近所述前一连通组件的连通组件为起点继续遍历,其中,所述预设分隔符被拆分为一个独立的连通组件;第二触发子模块,用于在当前遍历到的所述连通组件包含所述预设分隔符、且不包含除所述预设分隔符之外的其他文本的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,触发所述第二遍历子模块继续遍历;第三确定子模块,用于在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
可选地,所述提取子模块包括:连通域提取子模块,用于对所述答案图像进行连通域提取;优化子模块,用于对提取出的多个连通区域进行优化处理,其中,所述优化处理包括形态学处理和/或面积过滤;第四确定子模块,用于将优化处理后得到的连通区域确定为所述连通组件。
可选地,所述答案图像中的文本为手写体。
可选地,所述装置1300还包括:判定模块,用于对所述区域图像对应的答案信息进行对错判定;更新模块,用于根据所述答案信息的对错判定结果,对所述区域图像进行颜色更新,以通过更新后的颜色表征所述判定结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明
下面参考图14,其示出了适于用来实现本公开实施例的电子设备(例如终端设备或服务器)1400的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图14示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图14所示,电子设备1400可以包括处理装置(例如中央处理器、图形处理器等)1401,其可以根据存储在只读存储器(ROM)1402中的程序或者从存储装置1408加载到随机访问存储器(RAM)1403中的程序而执行各种适当的动作和处理。在RAM 1403中,还存储有电子设备1400操作所需的各种程序和数据。处理装置1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
通常,以下装置可以连接至I/O接口1405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1407;包括例如磁带、硬盘等的存储装置1408;以及通信装置1409。通信装置1409可以允许电子设备1400与其他设备进行无线或有线通信以交换数据。虽然图14示出了具有各种装置的电子设备1400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1409从网络上被下载和安装,或者从存储装置1408被安装,或者从ROM 1402被安装。在该计算机程序被处理装置1401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:识别答案图像中是否包含预设分隔符;在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,第一识别模块还可以被描述为“识别答案图像中是否包含预设分隔符的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑组件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑组件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,示例1提供了一种答案提取方法,包括:识别答案图像中是否包含预设分隔符;在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
根据本公开的一个或多个实施例,示例2提供了示例1的方法,所述识别答案图像中是否包含预设分隔符,包括:对所述答案图像进行连通域提取,得到多个连通组件;对每一所述连通组件分别进行识别,以确定所述连通组件中是否包含所述预设分隔符;在存在包含所述预设分隔符的所述连通组件的情况下,确定所述答案图像中包含所述预设分隔符。
根据本公开的一个或多个实施例,示例3提供了示例2的方法,所述提取被所述预设分隔符前后分隔开的文本区域的区域图像,包括:将包含所述预设分隔符和除所述预设分隔符之外的其他文本的连通组件,以所述预设分隔符为分界点,拆分成多个连通组件,其中,所述预设分隔符被拆分为一个独立的连通组件,并且,拆分后得到的连通组件和未进行拆分的连通组件按照其在所述答案图像中的前后顺序排列;按照所述连通组件的排列顺序遍历所述连通组件;在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后继续遍历;在当前遍历的所述连通组件包含所述预设分隔符的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,继续遍历;在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
根据本公开的一个或多个实施例,示例4提供了示例2的方法,所述多个连通组件按照其在所述答案图像中的前后顺序排列;所述提取被所述预设分隔符前后分隔开的文本区域的区域图像,包括:按照所述连通组件的排列顺序遍历所述连通组件;在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后继续遍历;在当前遍历到的所述连通组件包含所述预设分隔符和除所述预设分隔符之外的其他文本的情况下,以所述预设分隔符为分界点,将当前遍历到的所述连通组件拆分成多个连通组件,并以拆分得到的最靠近所述前一连通组件的连通组件为起点继续遍历,其中,所述预设分隔符被拆分为一个独立的连通组件;在当前遍历到的所述连通组件包含所述预设分隔符、且不包含除所述预设分隔符之外的其他文本的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,继续遍历;在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
根据本公开的一个或多个实施例,示例5提供了示例2的方法,所述对所述答案图像进行连通域提取,得到多个连通组件,包括:对所述答案图像进行连通域提取;对提取出的多个连通区域进行优化处理,其中,所述优化处理包括形态学处理和/或面积过滤;将优化处理后得到的连通区域确定为所述连通组件。
根据本公开的一个或多个实施例,示例6提供了示例1-5中任一项所述的方法,所述答案图像中的文本为手写体。
根据本公开的一个或多个实施例,示例7提供了示例1-5中任一项所述的方法,所述方法还包括:对所述区域图像对应的答案信息进行对错判定;根据所述答案信息的对错判定结果,对所述区域图像进行颜色更新,以通过更新后的颜色表征所述判定结果。
根据本公开的一个或多个实施例,示例8提供了一种答案提取装置,包括:第一识别模块,用于识别答案图像中是否包含预设分隔符;提取模块,用于在所述第一识别模块识别出所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;第二识别模块,用于对所述提取模块提取到的所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
根据本公开的一个或多个实施例,示例9提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现示例1-7中任一项所述方法的步骤。
根据本公开的一个或多个实施例,示例10提供了一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现示例1-7中任一项所述方法的步骤。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

Claims (10)

1.一种答案提取方法,其特征在于,包括:
识别答案图像中是否包含预设分隔符;
在所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;
对所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
2.根据权利要求1所述的方法,其特征在于,所述识别答案图像中是否包含预设分隔符,包括:
对所述答案图像进行连通域提取,得到多个连通组件;
对每一所述连通组件分别进行识别,以确定所述连通组件中是否包含所述预设分隔符;
在存在包含所述预设分隔符的所述连通组件的情况下,确定所述答案图像中包含所述预设分隔符。
3.根据权利要求2所述的方法,其特征在于,所述提取被所述预设分隔符前后分隔开的文本区域的区域图像,包括:
将包含所述预设分隔符和除所述预设分隔符之外的其他文本的连通组件,以所述预设分隔符为分界点,拆分成多个连通组件,其中,所述预设分隔符被拆分为一个独立的连通组件,并且,拆分后得到的连通组件和未进行拆分的连通组件按照其在所述答案图像中的前后顺序排列;
按照所述连通组件的排列顺序遍历所述连通组件;
在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后继续遍历;
在当前遍历的所述连通组件包含所述预设分隔符的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,继续遍历;
在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
4.根据权利要求2所述的方法,其特征在于,所述多个连通组件按照其在所述答案图像中的前后顺序排列;
所述提取被所述预设分隔符前后分隔开的文本区域的区域图像,包括:
按照所述连通组件的排列顺序遍历所述连通组件;
在当前遍历到的所述连通组件不包含所述预设分隔符,且当前遍历到的所述连通组件的前一连通组件也不包含所述预设分隔符的情况下,将当前遍历到的所述连通组件与所述前一连通组件合并成一个连通组件,之后继续遍历;
在当前遍历到的所述连通组件包含所述预设分隔符和除所述预设分隔符之外的其他文本的情况下,以所述预设分隔符为分界点,将当前遍历到的所述连通组件拆分成多个连通组件,并以拆分得到的最靠近所述前一连通组件的连通组件为起点继续遍历,其中,所述预设分隔符被拆分为一个独立的连通组件;
在当前遍历到的所述连通组件包含所述预设分隔符、且不包含除所述预设分隔符之外的其他文本的情况下,或者,在当前遍历到的所述连通组件不包含所述预设分隔符,而所述前一连通组件中包含所述预设分隔符的情况下,继续遍历;
在遍历完成后,将当前得到的不包含所述预设分隔符的连通组件确定为所述文本区域的区域图像。
5.根据权利要求2所述的方法,其特征在于,所述对所述答案图像进行连通域提取,得到多个连通组件,包括:
对所述答案图像进行连通域提取;
对提取出的多个连通区域进行优化处理,其中,所述优化处理包括形态学处理和/或面积过滤;
将优化处理后得到的连通区域确定为所述连通组件。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述答案图像中的文本为手写体。
7.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
对所述区域图像对应的答案信息进行对错判定;
根据所述答案信息的对错判定结果,对所述区域图像进行颜色更新,以通过更新后的颜色表征所述判定结果。
8.一种答案提取装置,其特征在于,包括:
第一识别模块,用于识别答案图像中是否包含预设分隔符;
提取模块,用于在所述第一识别模块识别出所述答案图像中包含所述预设分隔符的情况下,提取被所述预设分隔符前后分隔开的文本区域的区域图像,其中,前后相邻的两个所述文本区域之间被所述预设分隔符分隔开;
第二识别模块,用于对所述提取模块提取到的所述区域图像进行文本识别,以得到所述区域图像对应的答案信息。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
CN202010922271.8A 2020-09-04 2020-09-04 答案提取方法、装置、计算机可读介质及电子设备 Active CN112036343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010922271.8A CN112036343B (zh) 2020-09-04 2020-09-04 答案提取方法、装置、计算机可读介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010922271.8A CN112036343B (zh) 2020-09-04 2020-09-04 答案提取方法、装置、计算机可读介质及电子设备

Publications (2)

Publication Number Publication Date
CN112036343A true CN112036343A (zh) 2020-12-04
CN112036343B CN112036343B (zh) 2022-02-08

Family

ID=73590724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010922271.8A Active CN112036343B (zh) 2020-09-04 2020-09-04 答案提取方法、装置、计算机可读介质及电子设备

Country Status (1)

Country Link
CN (1) CN112036343B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505588A (zh) * 2021-07-14 2021-10-15 京东科技控股股份有限公司 信息抽取方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170262738A1 (en) * 2014-09-16 2017-09-14 Iflytek Co., Ltd. Intelligent scoring method and system for text objective question
CN108985300A (zh) * 2018-07-01 2018-12-11 甘肃万维信息技术有限责任公司 一种基于Wunsch算法的自动阅卷系统
CN111507251A (zh) * 2020-04-16 2020-08-07 北京世纪好未来教育科技有限公司 试题图像中作答区域的定位方法、装置和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170262738A1 (en) * 2014-09-16 2017-09-14 Iflytek Co., Ltd. Intelligent scoring method and system for text objective question
CN108985300A (zh) * 2018-07-01 2018-12-11 甘肃万维信息技术有限责任公司 一种基于Wunsch算法的自动阅卷系统
CN111507251A (zh) * 2020-04-16 2020-08-07 北京世纪好未来教育科技有限公司 试题图像中作答区域的定位方法、装置和电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505588A (zh) * 2021-07-14 2021-10-15 京东科技控股股份有限公司 信息抽取方法、装置和电子设备

Also Published As

Publication number Publication date
CN112036343B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN110135411B (zh) 名片识别方法和装置
CN109697291B (zh) 文本的语义段落识别方法和装置
CN113313064A (zh) 字符识别方法、装置、可读介质及电子设备
CN111445902A (zh) 数据收集方法、装置、存储介质及电子设备
CN112883968B (zh) 图像字符识别方法、装置、介质及电子设备
CN110659639B (zh) 汉字识别方法、装置、计算机可读介质及电子设备
CN112712069A (zh) 一种判题方法、装置、电子设备及存储介质
CN113205047A (zh) 药名识别方法、装置、计算机设备和存储介质
CN112883967A (zh) 图像字符识别方法、装置、介质及电子设备
CN112036343B (zh) 答案提取方法、装置、计算机可读介质及电子设备
CN113223011B (zh) 基于引导网络和全连接条件随机场的小样本图像分割方法
CN114494709A (zh) 特征提取模型的生成方法、图像特征提取方法和装置
CN114153959A (zh) 键值匹配方法、装置、可读介质及电子设备
CN112800961A (zh) 笔画书写顺序检测方法、装置、介质和电子设备
CN110674813B (zh) 汉字识别方法、装置、计算机可读介质及电子设备
WO2023130925A1 (zh) 字体识别方法、装置、可读介质及电子设备
CN110825874A (zh) 一种中文文本分类方法和装置及计算机可读存储介质
CN114612909A (zh) 字符识别方法、装置、可读介质及电子设备
CN113128470B (zh) 笔划识别方法、装置、可读介质及电子设备
CN109740130A (zh) 用于生成文件的方法和装置
CN114463768A (zh) 表格识别方法、装置、可读介质和电子设备
CN115273057A (zh) 文本识别方法、装置和听写批改方法、装置及电子设备
CN113971402A (zh) 内容识别方法、装置、介质及电子设备
CN113033682A (zh) 视频分类方法、装置、可读介质、电子设备
CN111460214A (zh) 分类模型训练方法、音频分类方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant