CN110135425A - 样本标注方法及计算机存储介质 - Google Patents

样本标注方法及计算机存储介质 Download PDF

Info

Publication number
CN110135425A
CN110135425A CN201810134893.7A CN201810134893A CN110135425A CN 110135425 A CN110135425 A CN 110135425A CN 201810134893 A CN201810134893 A CN 201810134893A CN 110135425 A CN110135425 A CN 110135425A
Authority
CN
China
Prior art keywords
character
character frame
radical sign
frame
connected domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810134893.7A
Other languages
English (en)
Other versions
CN110135425B (zh
Inventor
兴百桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN201810134893.7A priority Critical patent/CN110135425B/zh
Publication of CN110135425A publication Critical patent/CN110135425A/zh
Application granted granted Critical
Publication of CN110135425B publication Critical patent/CN110135425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种样本标注方法及计算机存储介质。该样本标注方法包括对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据所述连通域分析的分析结果确定标注所述根号符号位置的字符框;获取所述根号符号中的每个像素点与所述字符框的左边界以及上边界的距离之和;从所有像素点对应的多个距离之和中,确定最小的距离之和;将所述最小的距离之和的像素点对应的横坐标设置为所述字符框的右边界的横坐标,并根据所述右边界的横坐标更新标注所述根号符号位置的字符框。该样本标注方法的标注效果更好。

Description

样本标注方法及计算机存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种样本标注方法及计算机存储介质。
背景技术
随着人工智能和机器学习技术的发展,越来越多的领域开始采用机器学习方法训练设备,使之具有一定的智能性。随之而来的是对训练样本的需求增长。例如,在训练光学字符检测模型和识别模型时都需要大量的标注样本,标注样本是指在真实样本上通过人工标注出用于指示字符位置的字符框和字符类别。现有的在获取真实样本时利用纯手工标注的方法,存在着效率低的问题,而且因为人工标注会有一定的精度损失,例如存在人工失误造成字符位置标注不准确,字符内容标注错误的情况,这使得标注后的样本在进行机器学习方法训练设备时效果不能发挥最好。
现有的字符检测模型可以实现自动化字符检测,并可以通过字符框的方式对字符进行标识,但也存在着一些问题,例如,在包含公式的样本图像中,可能存在一些公式符号,例如分式线、根号、加号和减号等,这些公式符号通过现有的字符检测模型可能被误检测为其他字形类似的字符,导致字符检测和标注的位置不准确,或者根本不能被检测,而不会对其进行标注,使得字符检测的准确度下降,需要人工进行大量修正,增加了人工的劳动强度。在通过人工修正时,又存在着前述的人工标注精度低的问题。总之,现有的通过字符标注方法存在着效率低、精度不好的问题。
发明内容
有鉴于此,本发明实施例提供一种样本标注方法及计算机存储介质,以解决现有技术中真实样本标注准确率低的问题。
本发明实施例提供一种样本标注方法,其包括:对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据连通域分析的分析结果确定标注根号符号位置的字符框;获取根号符号中的每个像素点与字符框的左边界以及上边界的距离之和;从所有像素点对应的多个距离之和中,确定最小的距离之和;将最小的距离之和的像素点对应的横坐标设置为字符框的右边界的横坐标,并根据右边界的横坐标更新标注根号符号位置的字符框。
根据本发明的第二方面,提供一种计算机存储介质,该计算机存储介质存储有:用于对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据连通域分析的分析结果确定标注根号符号位置的字符框的指令;用于获取根号符号中的每个像素点与字符框的左边界以及上边界的距离之和的指令;用于从所有像素点对应的多个距离之和中,确定最小的距离之和的指令;用于将最小的距离之和的像素点对应的横坐标设置为字符框的右边界的横坐标,并根据右边界的横坐标更新标注根号符号位置的字符框的指令。
本发明实施例提供的一种样本标注方案,该样本标注方案对待标注的样本图像进行连通域分析,并从待标注的样本图像中确定出是根号符号的字符,对根号符号中的每个像素点计算其与根号符号对应的字符框的上边界和左边界的距离和,根据每个像素点的距离和确定距离和最小的像素点的横坐标,作为新的字符框的右边界的横坐标,从而实现对根号符号对应的字符框的调节,避免字符框所围的区域内包括根号符号之外的字符,提升样本标注的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种样本标注方法的流程示意图;
图2为图1所示实施例的样本标注方法中连通域分析后根号符号与字符框的位置示意图;
图3为图1所示实施例的样本标注方法中更新后的字符框与根号符号的位置示意图;
图4为本发明实施例二提供的一种样本标注方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明实施例一提供的一种样本标注方法的流程示意图。如图1所示,该样本标注方法包括:
S101:对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据连通域分析的分析结果确定标注根号符号位置的字符框。
待标注的样本图像可以用于后续进行机器学习模型训练,作为训练样本图像使用。本发明实施例中,训练用的样本图像为包括字符的图像,其中,字符包括但不限于:文字、字母、数字、符号。
连通域一般是指图像中具有相同像素值且位置相邻的像素点组成的图像区域。连通域分析是一种将图像中的各个连通区域找出并标记的分析方法。本发明实施例中,连通域分析方法可以由本领域技术人员根据实际需求采用任意适当的方式实现,如采用openVC二值图像连通域分析方法等。
通过连通域分析获得的分析结果中可以包括用于指示待标注的样本图像中的各个字符的字符位置的字符框。对于字符框的具体表示方式,本领域技术人员可以根据实际需求确定合适的方式。例如,通过定位点坐标、字符框宽度和高度的方式表示字符框;也可以通过确定字符框的四个定位点坐标的方式表示字符框等。其中,定位点坐标是指字符框的定位点在待标注的样本图像上的坐标。
可选地,该分析结果除了包括字符框外,还可以包括连通域区块信息,该连通域区块信息用于指示各个字符对应的连通域区块、以及各个连通域区块的相关信息,例如,像素数量、像素颜色等。
通过待标注的样本图像进行连通域分析,可以得到待标注的样本图像中的各个字符,进而可以针对每个字符确定其是否为根号符号,以得到根号符号对应的字符及该字符对应的字符框。
如图2所示,对于是根号符号的字符而言,指示其字符位置的字符框所围成的区域中除了包括根号符号外,还包括了根号符号内的数字。这种情况若不做处理则会造成字符框指示不准确的问题,由于这个字符框不仅指示了根号符号还包括了根号内的数字,使得后续的样本图像标注过程中不能确定该字符框对应的字符内容,不利于保证样本图像标注的准确性。标注后的样本图像在进行机器学习模型训练时也不利于保证机器学习模型的训练效果。
基于上述理由,需要确定根号符号对应的字符框,以备后续对这些字符框进行处理和优化。本领域技术人员可以根据需要采用合适的方式对根号符号对应的字符框进行处理和优化。例如,调整根号符号对应的字符框的边界,以使其所围成的区域内仅包括根号符号,或包括根号符号的一部分。
在本发明的实施例中,将标注根号符号的字符框的右边界调整到根号符号的横线的左顶点处,调整后的字符框与根号符号的相对位置如图3所示。其中一种可行的调整根号符号对应的字符框的边界的方式如下:
S102:获取根号符号中的每个像素点与字符框的左边界以及上边界的距离之和。
对于本领域技术人员而言,其可以根据需要采用适当的方式确定根号符号中的每个像素点与字符框的左边界以及上边界的距离之和。例如,根据连通域分析的分析结果确定根号符号对应的字符框的左边界的横坐标、上边界的纵坐标,并确定每个像素点对应的坐标,针对各个像素点,根据当前像素点的横坐标和左边界的横坐标计算当前像素点与左边界的距离,根据当前像素点的纵坐标和上边界的纵坐标计算当前像素点与上边界的距离,进而确定距离和。
S103:从所有像素点对应的多个距离之和中,确定最小的距离之和。
通过比较各个像素点对应的距离和,可以确定最小的距离之和。该最小的距离之和对应的像素点即为根号符号的横线的左顶点。
S104:将最小的距离之和的像素点对应的横坐标设置为字符框的右边界的横坐标,并根据右边界的横坐标更新标注根号符号位置的字符框。
确定根号符号的横线的左顶点对应的像素点之后,获取该像素点对应的横坐标设置为字符框的右边界的横坐标,即可更新该用于标注根号符号位置的字符框,更新后的字符框如图3所示。
该样本标注方法对待标注的样本图像进行连通域分析,并从待标注的样本图像中确定出是根号符号的字符,对根号符号中的每个像素点计算其与根号符号对应的字符框的上边界和左边界的距离和,根据每个像素点的距离和确定距离和最小的像素点的横坐标,作为新的字符框的右边界的横坐标,从而实现对根号符号对应的字符框的调节,避免字符框所围的区域内包括根号符号之外的字符,提升样本标注的准确性。
实施例二
图4为本发明实施例二提供的一种样本标注方法的流程示意图。如图二所示,该样本标注方法包括:
S201:对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,并根据连通域分析的分析结果确定标注根号符号位置的字符框。
通过对待标注的样本图像进行连通域分析获得分析结果。分析结果中可以包括用于指示待标注的样本图像中的各个字符的字符位置的字符框。可选地,该分析结果还可以包括连通域区块信息,该连通域区块信息用于指示各个字符对应的连通域区块、以及各个连通域区块的相关信息,例如,像素数量、像素颜色等。
可选地,为了提高对待标注的样本图像的字符检测精度,避免错检、漏检等情况,除通过连通域分析方式获得用于指示待标注的样本图像中的各个字符的字符位置的字符框外,可以通过其他合适的方式对待标注的样本图像进行检测,并获得用于指示待标注的样本图像中的各个字符的字符位置的字符框,再综合多种方式获得的字符框,确定最终的用于标注样本图像中的各个字符的字符位置的字符框。下面以采用连通域分析和神经网络模型两种方式对待标注的样本图像进行标注为例进行说明:
对待标注的样本图像进行连通域分析,并生成第一检测结果,其中,第一检测结果包括用于指示待标注的样本图像中的各字符的字符位置的第一预选字符框信息。
通过神经网络模型对待标注的样本图像进行字符检测,并生成第二检测结果,其中,第二检测结果包括检测出的待标注的样本图像中的各字符的字符位置的第二预选字符框信息。需要说明的是,该神经网络模型可以是任何合适的能够实现字符检测的模型。
分别比对第一预选字符框信息和第二预选字符框信息,根据比对结果确定字符位置标注结果,该字符位置标注结果包括用于指示待标注的样本图像中的各个字符的字符位置的字符框。
一种可行的分别比对第一预选字符框信息和第二预选字符框信息,根据比对结果确定字符位置标注结果的方式包括:
根据第一预选字符信息确定各字符的第一预选字符框,根据第二预选字符框信息确定各字符的第二预选字符框;比对各第一预选字符框和第二预选字符框,并根据比对结果确定字符位置标注结果。采用字符框的方式标示字符位置,一方面,便于操作人员查看各字符明确的位置信息,另一方面,也便于进行数据处理,提高数据处理效率。
其中,比对各字符的第一字符框和第二字符框,并根据比对结果确定字符位置标注结果包括:
针对每个字符,判断是否存在与当前字符的第一预选字符框存在重叠、且重叠面积大于或等于预设重叠值的第二预选字符框;若存在,则将第二预选字符框确定为当前字符的字符位置标注结果,保留第二预选字符框,删除第一预选字符框。
其中,预设重叠值可以由本领域技术人员根据实际情况适当设置,如可以设置为80%,本发明实施例对此不作限制。
若不存在与当前字符的第一预选字符框存在重叠、且重叠面积大于或等于预设重叠值的第二预选字符框,则可以针对每个字符,判断是否存在与当前字符的所述第一预选字符框存在重叠、且重叠面积小于预设重叠值的第二预选字符框;若存在,则将所述第一预选字符框和第二预选字符框均确定为当前字符的字符位置标注结果,即同时保留连通域分析检测出的第一预选字符框和第一神经网络模型检测出的第二预选字符框。
若也不存在与当前字符的第一预选字符框存在重叠、且重叠面积大于或等于预设重叠值的第二预选字符框,则针对每个字符,执行判断是否存在与当前字符的第一预选字符框重叠的第二预选字符框后;若判断结果为不存在,则判断是否存在与当前字符的第一预选字符框的水平距离小于设定距离值的第二预选字符框;若存在,则将第一预选字符框确定为当前字符的字符位置标注结果。若不存在与当前字符的第一预选字符框的水平距离小于设定距离值的第二预选字符框,则删除第一预选字符框。其中,设定距离值可以由本领域技术人员根据实际情况适当设置,本发明实施例对此不作限制。
由于待标注的样本图像中的字符排列方式通常是水平排列,因此判断是否存在当前字符的第一预选字符框的水平距离小于设定距离值的第二预选字符框。若待标注的样本图像的字符排列方式为竖直排列,则可以根据具体情况,判断是否存在与当前字符的第一预选字符框的垂直距离小于设定距离值的第二预选字符框。
通过对第一预选字符框在水平方向上查找是否存在与之相邻第二预选字符框,若存在则保留,否则舍弃的方式,可以删除连通域分析检测过程中没有去掉的噪声框,或者保留神经网络模型漏检的字符框,最大限度提升字符检测及识别的精度。
对于字符位置标注结果中的各个字符框,可以再对样本图像中的每个字符框对应的区域进行连通域分析,以获得分析结果,并针对每个字符框对应的字符判断该字符是否为根号符号,以得到根号符合对应的字符。本领域技术人员能够根据需求确定合适的方式进行根号符号的判断。例如,根据字符的像素数量和像素位置判断该字符是否为根号符号。
在一种可行方式中,先判断字符的像素数量和像素位置,若像素数量和像素位置满足条件,再将字符输入二分类器中,通过二分类器判断该字符是否为根号符号。这样可以提升当前字符是否为根号符号的判断的准确性。
其中,一种判断字符的像素数量和像素位置是否满足条件的方式包括:根据对待标注的样本图像进行连通域分析的分析结果,获得各个字符的字符像素在对应的连通域区块中的总像素数量,以及,在连通域区块的第一设定区域的第一像素数量和第二设定区域的第二像素数量;针对各个字符,根据当前字符的总像素数量、第一像素数量和第二像素数量,将满足根号确定条件的当前字符确定为根号符号。
其中,待标注的样本图像中的各个字符框对应的图像经过连通域分析,获取的分析结果中包括连通域区块信息,连通域区块信息用于指示各个字符对应的连通域区块、以及各个连通域区块的相关信息,例如,像素数量、像素颜色等。连通域区块信息可以通过黑白二值图显示。
各个字符的字符像素在对应的连通域区块中的总像素数量可以根据连通域区块信息形成的黑白二值图确定总像素数量。该总像素数量可以是连通域区块中的相互连通的黑色像素的总数量。
前述的第一设定区域为距离连通域区块的顶部边沿第一预设距离内的区域;前述的第二设定区域为距离连通域区块的左侧边沿第二预设距离内的区域。
对于根号符号而言,其可以分为处于左侧的折线部分和处于上部的横线部分,因此,在判断是否为根号符号时,需要获取位于距离连通域区块的顶部边沿第一预设距离内的区域的像素数量、和距离连通域区块的左侧边沿第二预设距离内的区域的像素数量。本领域技术人员可以需要适当选取合适的预设距离,例如,第一预设距离为字符框的高度的30%、或者50%等。第二预设距离为字符框的宽度的30%或者50%等。
第一设定区域的第一像素数量可以是字符框的最上部的30%区域内的黑色像素数量。第二设定区域的第二像素数量可以是字符框最左侧的30%区域内的黑色像素数量。
前述的根号确定条件包括:第一像素数量大于第一参照值,且第一像素数量与第二像素数量之和大于第二参照值。其中,第一参照值根据总像素数量和第一预设比例确定,第二参照值根据总像素数量和第二预设比例确定。需要说明的是,本实施例中仅是例举了一种确定第一参照值和第二参照值的方式,在其他实施例中,可以通过其他任何合适的方式确定第一参照值和第二参照值,例如,由本领域技术人员根据经验,预设第一参照值和第二参照值。
其中,第一预设比例和第二预设比例可以根据需求设置。例如,第一预设比例可以是30%、40%、50%等,第二预设比例可以是80%、90%等。第一参照值可以是0.3倍的总像素数量。第二参照值可以是0.9倍的总像素数量。
若第一像素数量大于第一参照值,即当前字符的位于连通域区块的最上部的30%区域内的像素数量大于总像素数量的30%,则进一步比较第一像素数量与第二像素数量之和是否大于第二参照值,即当前字符的位于连通域区块的最上部的30%区域内的像素数量与位于连通域区块的左侧的30%区域内的像素数量之和是否大于总像素数量的90%,此时可以确定当前字符为根号符号。
可选地,为了进一步提高准确性,根号确定条件还可以包括以当前字符作为二分类器的输入时,输出的判断结果为当前字符为根号符号。例如,若第一像素数量大于第一参照值,且第一像素数量与第二像素数量之和大于第二参照值,则将该当前字符作为输入,输入到二分类器的输入中,若二分类器判断确定当前字符为根号符号,则确定该当前字符为根号符号。
若第一像素数量与第二像素数量之和不大于第二参照值,则直接确定该当前字符不是根号符号,直接进行下一字符判定。这样可以在连通域分析后,根据分析结果对各个字符进行预判断,将预判断出的字符输入二分类器中进行判断,从而提升字符判断效率。
对于判断为根号符号的各个字符,进行对应的字符框修正处理,以使修正后的字符框仅指示根号或根号的部分。
S202:获取根号符号中的每个像素点与字符框的左边界以及上边界的距离之和。
对于本领域技术人员而言,其可以根据需要采用适当的方式确定根号符号中的每个像素点与字符框的左边界以及上边界的距离之和。例如,根据分析结果确定根号符号对应的字符框的左边界的横坐标、上边界的纵坐标,并确定每个像素点对应的坐标,针对各个像素点,根据当前像素点的横坐标和左边界的横坐标计算当前像素点与左边界的距离,根据当前像素点的纵坐标和上边界的纵坐标计算当前像素点与上边界的距离,进而确定距离和。
S203:从所有像素点对应的多个距离之和中,确定最小的距离之和。
通过比较各个像素点对应的距离和,可以确定最小的距离之和。该最小的距离之和对应的像素点即为根号符号的横线的左顶点。
S204:将最小的距离之和的像素点对应的横坐标设置为字符框的右边界的横坐标,并根据右边界的横坐标更新标注根号符号位置的字符框。
确定根号符号的横线的左顶点对应的像素点之后,获取该像素点对应的横坐标设置为字符框的右边界的横坐标,即可更新该字符框,以使更新后的字符框的右边界的横坐标是确定的根号符号的横线的左顶点对应的像素点的横坐标。
S205:根据分析结果确定各个字符对应的字符框,从各个字符对应的字符框中,删除满足设定删除条件的字符框,其中,设定删除条件包括以下至少之一:用于表示当前字符框的面积不符合设定面积范围的第一删除条件;用于表示当前字符框的长度大于预设长度阈值的第二删除条件;用于表示当前字符框宽度大于预设宽度阈值的第三删除条件;用于表示当前字符框的长宽比大于预设长宽比阈值的第四删除条件。
需要说明的是,本步骤为可选步骤。
对待标注的样本图像,为了进一步提高标注的准确度,可以在对待标注的样本图像进行根号处理之后,删除过大、过小和其他不正常的字符框,其中,过小的字符框可能是噪点。过大的字符框可能是图表,其他不正常的字符框指示的可能是图形等。
第一删除条件用于表示当前字符框的面积不符合设定面积范围。其中,设定面积范围为根据各个字符框的面积确定的正常的字符框的面积。若当前字符框的面积不在设定面积范围,则表示当前字符框所对应的字符可能是噪点或者图表,因此,直接将该当前字符删除。各个字符框的面积可以通过字符框的长度与宽度的乘积获得。本领域技术人员可以根据需要设定合适的面积取值范围。例如,设定面积取值范围的上限为5倍的平均面积,设定面积取值范围的下限为0.1倍的平均面积。平均面积可以根据字符框数量和各个字符框的面积确定。
第二删除条件用于表示当前字符框的长度大于预设长度阈值。其中,预设长度阈值根据各个字符框的长度确定。例如,预设长度阈值为字符框的平均长度的一定倍数,如5倍的字符框的平均长度等。若当前字符框的长度大于预设长度阈值,则表示该当前字符框对应的字符并非正常字符而可能是图形中的线条,因此,直接将该当前字符删除。
第三删除条件用于表示当前字符框宽度大于预设宽度阈值。其中,预设宽度阈值根据各个字符框的宽度确定。例如,预设宽度阈值为字符框的平均宽度的一定倍数,如5倍的字符框的平均宽度等。若当前字符框的宽度大于预设宽度阈值,则表示该当前字符框对应的字符并非正常字符,而可能是图形中的线条,因此,直接将当前字符删除。
第四删除条件用于表示当前字符框的长宽比大于预设长宽比阈值。其中,预设长度比阈值根据各个字符框的长宽比确定。例如,预设长宽比阈值为字符框的平均长宽比的一定倍数,如10倍的字符框的平均长宽比。若当前字符框的长宽比大于预设长宽比阈值,则表示当前字符框的长宽比不正常,其对应的字符为非正常字符,则直接删除该当前字符框。
在实际应用中,本领域技术人员可以根据实际需要选用上述设定删除条件中的任意一个或多个。
在一种可行方式中,当设定删除条件包括第二、第三、第四删除条件中的至少一个,以及,包括第一删除条件时,也即,除包括第一删除条件外,还包括第二、第三、第四删除条件中的一个或多个时,从各个字符对应的字符框中,删除满足设定删除条件的字符框包括:从各个字符对应的字符框中,删除满足第一删除条件的字符框;从剩余的字符框中,删除满足第二、第三、第四删除条件中的至少一个的字符框。即在判断各个字符框是否满足删除条件时,判断各个字符框的面积是否满足第一删除条件;若满足,则直接删除字符框;对于面积不满足第一删除条件的字符框,再判断是否满足第二和/或第三和/或第四删除条件,若满足,则删除字符框。
该样本标注方法,对待标注的样本图像进行连通域分析,并从待标注的样本图像中确定出是根号符号的字符,对根号符号中的每个像素点计算其与根号符号对应的字符框的上边界和左边界的距离和,根据每个像素点的距离和确定距离和最小的像素点的横坐标,作为新的字符框的右边界的横坐标,从而实现对根号符号对应的字符框的调节,避免字符框所围的区域内包括根号符号之外的字符,提升样本标注的准确性,还可以实现自动标注真实样本,自动检测字符框的位置,大大提高了样本标注的效率及精度。此外,该样本标注方法还可以删除过大或过小的字符框,进一步提升样本标注的准确性。
实施例三
根据本发明的实施例三,提供一种计算机存储介质,所述计算机存储介质存储有:用于对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据所述连通域分析的分析结果确定标注所述根号符号位置的字符框的指令;用于获取所述根号符号中的每个像素点与所述字符框的左边界以及上边界的距离之和的指令;用于从所有像素点对应的多个距离之和中,确定最小的距离之和的指令;用于将所述最小的距离之和的像素点对应的横坐标设置为所述字符框的右边界的横坐标,并根据所述右边界的横坐标更新标注所述根号符号位置的字符框的指令。
可选地,用于对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据所述连通域分析的分析结果确定标注所述根号符号位置的字符框的指令,包括:用于根据对待标注的样本图像进行连通域分析的分析结果,获得各个字符的字符像素在对应的连通域区块中的总像素数量,以及,在所述连通域区块的第一设定区域的第一像素数量和第二设定区域的第二像素数量的指令;用于针对各个字符,根据当前字符的所述总像素数量、所述第一像素数量、所述第二像素数量,确定满足根号确定条件的所述当前字符为根号符号的指令。
可选地,所述第一设定区域为距离所述连通域区块的顶部边沿第一预设距离内的区域;所述第二设定区域为距离所述连通域区块的左侧边沿第二预设距离内的区域。
可选地,根号确定条件包括:所述第一像素数量大于所述第一参照值,且所述第一像素数量与所述第二像素数量之和大于所述第二参照值,其中,所述第一参照值根据所述总像素数量和第一预设比例确定,所述第二参照值根据所述总像素数量和第二预设比例确定。
可选地,所述根号确定条件还包括:以所述当前字符作为二分类器的输入时,所述二分类器输出的判断结果为所述当前字符为根号符号。
可选地,所述分析结果包括用于指示所述待标注的样本图像中的各个字符的字符位置的字符框,所述计算机存储介质还存储有:用于根据所述分析结果确定各个字符对应的字符框,从各个字符对应的字符框中,删除满足设定删除条件的字符框指令;其中,所述设定删除条件包括以下至少之一:用于表示所述当前字符框的面积不符合设定面积范围的第一删除条件;用于表示当前字符框的长度大于预设长度阈值的第二删除条件;用于表示所述当前字符框宽度大于预设宽度阈值的第三删除条件;用于表示所述当前字符框的长宽比大于预设长宽比阈值的第四删除条件。
可选地,当所述设定删除条件包括第二、第三、第四删除条件中的至少一个,以及,包括第一删除条件时:用于根据所述分析结果确定各个字符对应的字符框,从各个字符对应的字符框中,删除满足设定删除条件的字符框指令包括:用于从各个字符对应的字符框中,删除满足所述第一删除条件的字符框的指令;用于从剩余的字符框中,删除满足第二、第三、第四删除条件中的至少一个的字符框的指令。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机存储介质中,所述计算机存储介质包括用于以计算机(例如计算机)可读的形式存储或传送信息的任何机制。例如,机器可读介质包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪速存储介质、电、光、声或其他形式的传播信号(例如,载波、红外信号、数字信号等)等,该计算机软件产品包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种样本标注方法,其特征在于,包括:
对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据所述连通域分析的分析结果确定标注所述根号符号位置的字符框;
获取所述根号符号中的每个像素点与所述字符框的左边界以及上边界的距离之和;
从所有像素点对应的多个距离之和中,确定最小的距离之和;
将所述最小的距离之和的像素点对应的横坐标设置为所述字符框的右边界的横坐标,并根据所述右边界的横坐标更新标注所述根号符号位置的字符框。
2.根据权利要求1所述的样本标注方法,其特征在于,对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,包括:
根据对待标注的样本图像进行连通域分析的分析结果,获得各个字符的字符像素在对应的连通域区块中的总像素数量,以及,在所述连通域区块的第一设定区域的第一像素数量和第二设定区域的第二像素数量;
针对各个字符,根据当前字符的所述总像素数量、所述第一像素数量、所述第二像素数量,确定满足根号确定条件的所述当前字符为根号符号。
3.根据权利要求2所述的样本标注方法,其特征在于,所述第一设定区域为距离所述连通域区块的顶部边沿第一预设距离内的区域;所述第二设定区域为距离所述连通域区块的左侧边沿第二预设距离内的区域。
4.根据权利要求2或3所述的样本标注方法,其特征在于,根号确定条件包括:所述第一像素数量大于所述第一参照值,且所述第一像素数量与所述第二像素数量之和大于所述第二参照值,其中,所述第一参照值根据所述总像素数量和第一预设比例确定,所述第二参照值根据所述总像素数量和第二预设比例确定。
5.根据权利要求4所述的样本标注方法,其特征在于,所述根号确定条件还包括:
以所述当前字符作为二分类器的输入时,所述二分类器输出的判断结果为所述当前字符为根号符号。
6.根据权利要求1所述的样本标注方法,其特征在于,所述分析结果包括用于指示所述待标注的样本图像中的各个字符的字符位置的字符框,所述方法还包括:
根据所述分析结果确定各个字符对应的字符框,从各个字符对应的字符框中,删除满足设定删除条件的字符框;
其中,所述设定删除条件包括以下至少之一:用于表示所述当前字符框的面积不符合设定面积范围的第一删除条件;用于表示当前字符框的长度大于预设长度阈值的第二删除条件;用于表示所述当前字符框宽度大于预设宽度阈值的第三删除条件;用于表示所述当前字符框的长宽比大于预设长宽比阈值的第四删除条件。
7.根据权利要求6所述的样本标注方法,其特征在于,
当所述设定删除条件包括第二、第三、第四删除条件中的至少一个,以及,包括第一删除条件时:
所述从各个字符对应的字符框中,删除满足设定删除条件的字符框,包括:
从各个字符对应的字符框中,删除满足所述第一删除条件的字符框;
从剩余的字符框中,删除满足第二、第三、第四删除条件中的至少一个的字符框。
8.一种计算机存储介质,其特征在于,所述计算机存储介质存储有:用于对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据所述连通域分析的分析结果确定标注所述根号符号位置的字符框的指令;用于获取所述根号符号中的每个像素点与所述字符框的左边界以及上边界的距离之和的指令;用于从所有像素点对应的多个距离之和中,确定最小的距离之和的指令;用于将所述最小的距离之和的像素点对应的横坐标设置为所述字符框的右边界的横坐标,并根据所述右边界的横坐标更新标注所述根号符号位置的字符框的指令。
9.根据权利要求8所述的计算机存储介质,其特征在于,用于对待标注的样本图像进行连通域分析,得到当前字符为根号符号时,根据所述连通域分析的分析结果确定标注所述根号符号位置的字符框的指令,包括:
用于根据对待标注的样本图像进行连通域分析的分析结果,获得各个字符的字符像素在对应的连通域区块中的总像素数量,以及,在所述连通域区块的第一设定区域的第一像素数量和第二设定区域的第二像素数量的指令;
用于针对各个字符,根据当前字符的所述总像素数量、所述第一像素数量、所述第二像素数量,确定满足根号确定条件的所述当前字符为根号符号的指令。
10.根据权利要求9所述的计算机存储介质,其特征在于,所述第一设定区域为距离所述连通域区块的顶部边沿第一预设距离内的区域;所述第二设定区域为距离所述连通域区块的左侧边沿第二预设距离内的区域。
CN201810134893.7A 2018-02-09 2018-02-09 样本标注方法及计算机存储介质 Active CN110135425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810134893.7A CN110135425B (zh) 2018-02-09 2018-02-09 样本标注方法及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810134893.7A CN110135425B (zh) 2018-02-09 2018-02-09 样本标注方法及计算机存储介质

Publications (2)

Publication Number Publication Date
CN110135425A true CN110135425A (zh) 2019-08-16
CN110135425B CN110135425B (zh) 2021-02-26

Family

ID=67568000

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810134893.7A Active CN110135425B (zh) 2018-02-09 2018-02-09 样本标注方法及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110135425B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796135A (zh) * 2019-09-20 2020-02-14 平安科技(深圳)有限公司 目标的定位方法及装置、计算机设备、计算机存储介质
CN111583199A (zh) * 2020-04-24 2020-08-25 上海联影智能医疗科技有限公司 样本图像标注方法、装置、计算机设备和存储介质

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1438603A (zh) * 2003-03-25 2003-08-27 西安理工大学 基于通用办公设备的二维条码自动识读方法
CN101082912A (zh) * 2006-06-01 2007-12-05 上海杰图软件技术有限公司 通过具有位置信息的图片集对电子地图进行标注的方法
CN101122953A (zh) * 2007-09-21 2008-02-13 北京大学 一种图片文字分割的方法
CN101149790A (zh) * 2007-11-14 2008-03-26 哈尔滨工程大学 中文印刷体公式识别方法
CN101251892A (zh) * 2008-03-07 2008-08-27 北大方正集团有限公司 一种字符切分方法和装置
CN101276249A (zh) * 2007-03-30 2008-10-01 北京三星通信技术研究有限公司 一种手写字符预测识别的方法和装置
US20080252511A1 (en) * 2005-11-04 2008-10-16 Thales Method for Automatically Selecting Radionavigation Beacons
CN101393601A (zh) * 2007-09-21 2009-03-25 汉王科技股份有限公司 印刷体数学公式识别方法
CN101833661A (zh) * 2009-03-13 2010-09-15 欧姆龙株式会社 字符识别装置、字符识别程序及字符识别方法
CN102073871A (zh) * 2011-01-12 2011-05-25 广州市伟时信息系统技术有限公司 一种基于非负矩阵分解的离线中文字符识别方法
CN102147863A (zh) * 2010-02-10 2011-08-10 中国科学院自动化研究所 一种网络动画中的文字定位及识别方法
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN102184399A (zh) * 2011-03-31 2011-09-14 上海名图信息技术有限公司 基于水平投影和连通域分析的字符分割方法
US20130100119A1 (en) * 2011-10-25 2013-04-25 Microsoft Corporation Object refinement using many data sets
CN103235945A (zh) * 2013-03-27 2013-08-07 重庆市科学技术研究院 一种基于Android系统的手写数学公式识别及生成MathML的方法
CN103257810A (zh) * 2012-02-17 2013-08-21 汉王科技股份有限公司 手写数学公式识别方法及装置
CN104182750A (zh) * 2014-07-14 2014-12-03 上海交通大学 一种在自然场景图像中基于极值连通域的中文检测方法
CN104298966A (zh) * 2014-09-17 2015-01-21 电子科技大学 一种车牌定位方法
CN104392205A (zh) * 2014-10-24 2015-03-04 浙江力石科技股份有限公司 一种非正常车牌的识别方法和系统
CN104951741A (zh) * 2014-03-31 2015-09-30 阿里巴巴集团控股有限公司 一种文字识别方法及装置
CN105184292A (zh) * 2015-08-26 2015-12-23 北京云江科技有限公司 自然场景图像中手写体数学公式结构分析与识别方法
US20160063735A1 (en) * 2014-08-29 2016-03-03 Fujifilm Corporation Image combining apparatus, image combining method and recording medium storing control program for image combining apparatus
CN105678300A (zh) * 2015-12-30 2016-06-15 成都数联铭品科技有限公司 一种复杂图像文字序列识别方法
CN106575190A (zh) * 2014-07-31 2017-04-19 微软技术许可有限责任公司 图标调整大小

Patent Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1438603A (zh) * 2003-03-25 2003-08-27 西安理工大学 基于通用办公设备的二维条码自动识读方法
US20080252511A1 (en) * 2005-11-04 2008-10-16 Thales Method for Automatically Selecting Radionavigation Beacons
CN101082912A (zh) * 2006-06-01 2007-12-05 上海杰图软件技术有限公司 通过具有位置信息的图片集对电子地图进行标注的方法
CN101276249A (zh) * 2007-03-30 2008-10-01 北京三星通信技术研究有限公司 一种手写字符预测识别的方法和装置
CN101122953A (zh) * 2007-09-21 2008-02-13 北京大学 一种图片文字分割的方法
CN101393601A (zh) * 2007-09-21 2009-03-25 汉王科技股份有限公司 印刷体数学公式识别方法
CN101149790A (zh) * 2007-11-14 2008-03-26 哈尔滨工程大学 中文印刷体公式识别方法
CN101251892A (zh) * 2008-03-07 2008-08-27 北大方正集团有限公司 一种字符切分方法和装置
CN101833661A (zh) * 2009-03-13 2010-09-15 欧姆龙株式会社 字符识别装置、字符识别程序及字符识别方法
CN102147863A (zh) * 2010-02-10 2011-08-10 中国科学院自动化研究所 一种网络动画中的文字定位及识别方法
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN102073871A (zh) * 2011-01-12 2011-05-25 广州市伟时信息系统技术有限公司 一种基于非负矩阵分解的离线中文字符识别方法
CN102184399A (zh) * 2011-03-31 2011-09-14 上海名图信息技术有限公司 基于水平投影和连通域分析的字符分割方法
US20130100119A1 (en) * 2011-10-25 2013-04-25 Microsoft Corporation Object refinement using many data sets
CN103257810A (zh) * 2012-02-17 2013-08-21 汉王科技股份有限公司 手写数学公式识别方法及装置
CN103235945A (zh) * 2013-03-27 2013-08-07 重庆市科学技术研究院 一种基于Android系统的手写数学公式识别及生成MathML的方法
CN104951741A (zh) * 2014-03-31 2015-09-30 阿里巴巴集团控股有限公司 一种文字识别方法及装置
CN104182750A (zh) * 2014-07-14 2014-12-03 上海交通大学 一种在自然场景图像中基于极值连通域的中文检测方法
CN106575190A (zh) * 2014-07-31 2017-04-19 微软技术许可有限责任公司 图标调整大小
US20160063735A1 (en) * 2014-08-29 2016-03-03 Fujifilm Corporation Image combining apparatus, image combining method and recording medium storing control program for image combining apparatus
CN104298966A (zh) * 2014-09-17 2015-01-21 电子科技大学 一种车牌定位方法
CN104392205A (zh) * 2014-10-24 2015-03-04 浙江力石科技股份有限公司 一种非正常车牌的识别方法和系统
CN105184292A (zh) * 2015-08-26 2015-12-23 北京云江科技有限公司 自然场景图像中手写体数学公式结构分析与识别方法
CN105678300A (zh) * 2015-12-30 2016-06-15 成都数联铭品科技有限公司 一种复杂图像文字序列识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LIN X等: "Mathematical formula identification in PDF documents", 《PROCEEDINGS OF INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 *
林晓燕等: "中文电子文档的数学公式定位研究", 《北京大学学报(自然科学版)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796135A (zh) * 2019-09-20 2020-02-14 平安科技(深圳)有限公司 目标的定位方法及装置、计算机设备、计算机存储介质
WO2021051868A1 (zh) * 2019-09-20 2021-03-25 平安科技(深圳)有限公司 目标的定位方法及装置、计算机设备、计算机存储介质
CN111583199A (zh) * 2020-04-24 2020-08-25 上海联影智能医疗科技有限公司 样本图像标注方法、装置、计算机设备和存储介质
CN111583199B (zh) * 2020-04-24 2023-05-26 上海联影智能医疗科技有限公司 样本图像标注方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110135425B (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
CN110059694B (zh) 电力行业复杂场景下的文字数据的智能识别方法
CN109685199B (zh) 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置
US6404936B1 (en) Subject image extraction method and apparatus
CN105323416A (zh) 图像处理装置及图像处理方法
CN106546263B (zh) 一种基于机器视觉的激光水平仪出射激光线检测方法
CN105260713A (zh) 一种车道线检测方法和装置
US20120197429A1 (en) Method and system for detecting suitability of an image to embroidery
CN110135225B (zh) 样本标注方法及计算机存储介质
CN110135417A (zh) 样本标注方法及计算机存储介质
US11908127B2 (en) Internet of Things systems for industrial data processing, control methods, and storage medium thereof
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
CN115063618B (zh) 一种基于模板匹配的缺陷定位方法、系统、设备及介质
CN110135425A (zh) 样本标注方法及计算机存储介质
CN110232445A (zh) 一种基于知识蒸馏的文物真伪鉴定方法
CN112001406A (zh) 一种文本区域检测方法及装置
CN110135407B (zh) 样本标注方法及计算机存储介质
CN110288624A (zh) 一种图像中直线段的检测方法、装置及相关设备
CN104112123A (zh) 一种用于子弹表观缺陷检测的aoi系统的缺陷特征提取与识别方法
CN110503705B (zh) 图像标注方法和设备
CN112434583B (zh) 车道横向减速标线检测方法、系统、电子设备及存储介质
CN107230195B (zh) 一种影像处理方法和装置
CN112434582A (zh) 一种车道线颜色识别方法、系统、电子设备及存储介质
CN112434585A (zh) 一种车道线的虚实识别方法、系统、电子设备及存储介质
CN111079744A (zh) 适用于复杂光照环境的车辆车牌智能识别方法及装置
CN111161264A (zh) 一种对含有缺陷的tft电路图像的分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant