CN117670884A - 图像标注方法、装置、设备及存储介质 - Google Patents
图像标注方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117670884A CN117670884A CN202410135494.8A CN202410135494A CN117670884A CN 117670884 A CN117670884 A CN 117670884A CN 202410135494 A CN202410135494 A CN 202410135494A CN 117670884 A CN117670884 A CN 117670884A
- Authority
- CN
- China
- Prior art keywords
- image
- template
- labeling
- labeled
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 127
- 238000003860 storage Methods 0.000 title claims abstract description 24
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 230000007547 defect Effects 0.000 abstract description 10
- 238000001514 detection method Methods 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000002950 deficient Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请涉及一种图像标注方法、装置、设备及存储介质,所述方法包括:从模板库中查找与待标注图像相匹配的模板图像,其中,模板图像中具有标注区域,基于模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵,利用仿射矩阵将模板图像的标注区域映射至待标注图像,得到待标注图像的标注区域,分割待标注图像的标注区域中的标注轮廓,得到待标注图像的轮廓标注结果。本申请可以提高工业产品缺陷检测领域中的样本标注效率。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像标注方法、装置、设备及存储介质。
背景技术
在训练深度学习模型之前需要制作数据集,即对数据集进行标注。目前,对图像进行标注可以使用手动的标注工具,面对大量的待标注数据集时,该标注方式耗时费力。虽然现有技术中有自动标注工具可以实现智能标注,但由于这些标注工具往往借助大模型的推理能力,对计算机的硬件配置和算力等要求较高。特别是在工业机器视觉领域应用中(例如,工业产品的缺陷检测应用中),经常遇到小批量产品、多样化产品、频繁切换不同型号产品的应用场景,若无法对工业产品图像快速完成标注,会导致检测模型的训练、部署上线无法跟上生产进度要求。
因此,在工业机器视觉领域应用中,提供一种轻量且快捷的自动标注技术方案,已成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上内容,本申请提供一种图像标注方法、装置、设备及存储介质,其目的在于解决上述技术问题。
第一方面,本申请提供一种图像标注方法,所述方法包括:
从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
第二方面,本申请提供一种图像标注装置,所述装置包括:
匹配模块:用于从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
生成模块:用于基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
第一标注模块:用于利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
第二标注模块:用于分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
第三方面,本申请提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的图像标注方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的图像标注方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请从模板库中查找与待标注图像相匹配的模板图像,模板图像中具有标注区域,基于模板图像的模板中心点坐标与模板图像的模板角度生成仿射矩阵,利用仿射矩阵将模板图像的标注区域映射至待标注图像,由于模板库中存储有多种类型的模板图像,通过查找与待标注图像匹配的模板图像,再结合仿射矩阵可以快速得到待标注图像的标注区域。当需要进一步标出具体轮廓时,分割待标注图像的标注区域中的标注轮廓,得到待标注图像的轮廓标注结果,无需借助大模型的推理,节省了系统算力,即可得到待标注图像的轮廓标注结果,提高工业产品缺陷检测领域中的样本标注效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请图像标注方法实施例的流程示意图;
图2为本申请图像标注装置实施例的模块示意图;
图3为本申请电子设备实施例的示意图;
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
下文的公开提供了许多不同的实施例或例子用来实现本申请的不同结构。为了简化本申请的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本申请。此外,本申请可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。
本申请提供一种图像标注方法。参照图1所示,为本申请图像标注方法的实施例的方法流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。图像标注方法包括:
步骤S10:从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
步骤S20:基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
步骤S30:利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
步骤S40:分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
本实施例中,以待标注图像为工业产品图像(例如,标准零部件的图像、非标零部件的图像)为例,对本申请的方案进行说明,可以理解的是,在实际应用场景中,待标注图像还可以是人脸检测、物品检测等其它领域的需要标注的图像。
模板库中存储有多种类型的模板图像,模板图像可以是利用自动标注工具已标注好的图像,例如,利用模板图像上明显的特征及对比度较高的掩膜点定位到需要标注的区域,以完成模板图像上相关区域的标注,又例如,利用语义分割算法确定模板图像上需要标注的轮廓,以完成模板图像上轮廓区域的标注。当利用自动标注方案标注模板图像存在标注区域不准确或无法定位所需标注的区域时,则可以采用人工手动标注的方式对模板图像进行标注。
待标注图像可以是批量的多张待标注图像,与待标注图像相匹配的模板图像是指与待标注图像相似度最高的模板图像,通过计算待标注图像与模板库中每张模板图像的相似度,并从模板库中选取相似度值最高的模板图像作为与待标注图像相匹配的模板图像。
具体而言,从模板库中查找与待标注图像相匹配的模板图像,包括:
提取所述模板库中每张模板图像的掩膜图像的第一边缘轮廓点,并计算所述第一边缘轮廓点的特征向量;
计算所述第一边缘轮廓点的坐标及角度;
提取所述待标注图像的掩膜图像的第二边缘轮廓点,并计算所述第二边缘轮廓点的特征向量;
计算所述第二边缘轮廓点的坐标及角度;
基于所述第一边缘轮廓点的特征向量与所述第二边缘轮廓点的特征向量的相似度,所述第一边缘轮廓点的坐标及角度与所述第二边缘轮廓点的坐标及角度的相似度,确定出与所述待标注图像相匹配的模板图像。
分别提取模板库中每张模板图像对应的掩膜图像的边缘轮廓点(记为第一边缘轮廓点),并计算出第一边缘轮廓点的特征向量,计算出第一边缘轮廓点的坐标及第一轮廓点的角度,第一边缘轮廓点的坐标可以是通过边缘检测算法获取到的该边缘轮廓点的坐标值,第一轮廓点的角度可以是掩膜图像边缘轮廓点的法向角度,或者相对于预先设定的参考方向(例如,水平方向)的角度,轮廓点的角度信息可以用于判断轮廓的走向、进行形状匹配等。同理,以相同的方式提取待标注图像的掩膜图像的边缘轮廓点(记为第二边缘轮廓点),并计算第二边缘轮廓点的特征向量,计算出第二边缘轮廓点的坐标及第二轮廓点的角度,第二轮廓点的角度对应为边缘轮廓点的法向角度,或者相对于预先设定的参考方向(例如,水平方向)的角度。
计算出第一边缘轮廓点的特征向量与第二边缘轮廓点的特征向量的相似度,相似度值可以用欧式距离、余弦距离或余弦相似度表示。计算第一边缘轮廓点的坐标与第二边缘轮廓点的坐标的相似度,并计算第一边缘轮廓点的角度与第二边缘轮廓点的角度的相似度,为每个相似度赋予不同的权重,通过加权计算确定出每个模板图像与待标注图像的相似度值,将相似度值最高的模板图像作为与待标注图像相匹配的模板图像。
确定出待标注图像相匹配的模板图像后,根据模板图像的模板中心点坐标与模板图像的模板角度生成仿射矩阵,假设模板为一个矩形工件,则模板图像的模板中心点坐标是指在模板图像中该矩形工件的中心点坐标,模板图像的模板角度是指在模板图像中该矩形工件的角度,该角度可以是相对于预先设定的参考方向(例如,水平方向)的角度。仿射矩阵可以将模板图像的像素点映射到待标注图像中的对应位置,通过对仿射矩阵进行不同参数的设置,可以实现不同的图像变换效果。
具体而言,基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵,包括:
获取所述模板图像的模板中心点坐标与模板图像的模板角度;
在所述待标注图像中确定出与所述模板图像的模板中心点坐标对应的目标坐标,及在所述待标注图像中确定出与所述模板图像的模板角度对应的目标角度;
根据所述中心点坐标、所述模板图像的模板角度、所述目标坐标及所述目标角度,生成仿射矩阵。
获取模板图像的模板中心点坐标,记为(Row,Column),并获取模板图像的模板角度,记为Angle。在待标注图像中确定出与模板图像的模板中心点坐标对应的目标坐标,记为(BaseRow,BaseColumn),在待标注图像中确定出与模板图像的模板角度对应的目标角度,记为BaseAngle。假设模板图像的模板为一个矩形工件,则目标坐标是指在待标注图像中该矩形工件的中心点坐标,目标角度是指在待标注图像中该矩形工件的角度,根据中心点坐标到所述目标坐标的向量及模板图像的模板角度与目标角度的角度差,生成仿射矩阵。
其中,根据所述中心点坐标、所述模板图像的模板角度、所述目标坐标及所述目标角度,生成仿射矩阵,包括:
利用如下公式计算所述仿射矩阵,所述公式包括:
其中,Mat2D表示所述仿射矩阵,α表示所述模板图像的模板角度与所述目标角度的角度差,即α=Angle-BaseAngle,α的数值用弧度表示,t表示所述中心点坐标到所述目标坐标的向量,Tx表示所述中心点坐标的纵坐标值与所述目标坐标的纵坐标值的差值,即Tx=Column-BaseColumn,Ty表示所述中心点坐标的横坐标值与所述目标坐标的横坐标值的差值,即Ty=Row-BaseRow。
生成仿射矩阵后,利用仿射矩阵将模板图像的标注区域映射至待标注图像得到待标注图像的标注区域,即运用上述计算公式得到的仿射矩阵对模板图像上的标注区域进行仿射变换,将模板图像上的标注区域进行旋转、平移到与模板图像相匹配的待标注图像上,从而得到待标注图像的标注区域。举例而言,当模板图像与模板图像的标注区域为相同形状时(例如,模板图像的边缘轮廓就是标注区域时),则对模板图像作仿射变换。当模板图像与模板图像的标注区域为不同形状时(例如,模板图像的边缘轮廓是圆角矩型,而标注区域为圆角矩型区域之外的矩形时),则对模板图像的标注区域作仿射变换。
进一步地,在得到所述待标注图像的标注区域,所述方法还包括:
获取所述待标注图像的属性信息、所述待标注图像的标注区域的轮廓的坐标点集及所述待标注图像的标注区域的标签信息;
将所述属性信息、所述坐标点集及所述标签信息以JSON格式进行存储得到存储文件;
将所述存储文件以所述待标注图像的文件名进行命名。
待标注图像的属性信息包括该图像的文件名称、图像的宽度和图像的高度等信息。待标注图像的标注区域的轮廓的坐标点集是指生成待标注图像的标注区域的轮廓后,提取的该轮廓角点的坐标。待标注图像的标注区域的标签信息是指预设的标签类型或标签形状等信息。将属性信息、坐标点集及标签信息生成JSON格式的数据,得到JSON文件作为存储文件,以图像的文件名称对JSON文件进行命名。
工业产品的待标注图像包括未含有缺陷区域的图像及含有缺陷区域的图像,当待标注图像为含有缺陷区域的图像时,需要标注出该图像中的缺陷区域。可以利用图像分割算法分割出待标注图像的标注区域中的标注轮廓,标注轮廓为待标注图像中缺陷区域的轮廓,从而得到待标注图像的轮廓标注结果,及得到待标注图像的缺陷区域的标注结果,其中,图像分割算法可以是基于阈值的分割算法、基于边缘的分割算法、基于区域的分割算法、基于图论的分割算法等。具体而言,分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果,包括:
获取用户输入的分割参数和提取参数;
确定所述待标注图像的标注区域中的分割区域;
根据所述分割参数和所述提取参数,从所述分割区域中分割出所述待标注图像的标注区域中的标注轮廓,作为所述待标注图像的轮廓标注结果。
用户可以在人机交互界面中选择的分割参数和提取参数,分割参数包括分割算法、彩色图像处理方式、平滑系数、灰度差等,分割参数用于将缺陷区域的轮廓与待标注图像的背景进行分割。由于在分割过程中,可能分割出不需要分割的轮廓区域,因此需要用到提取参数来筛选出需要分割的轮廓区域,提取参数可以是设定的需要分割轮廓的最小面积,即小于提取参数的轮廓不会被分割。确定待标注图像的标注区域中的分割区域,分割区域可以是用户通过人机交互界面绘制的区域(例如,矩形区域、圆形区域等),利用分割算法从分割区域中分割并提取缺陷区域,生成该缺陷区域的轮廓,作为待标注图像的轮廓标注结果,从而完成缺陷区域的标注。还可以然后提取缺陷区域的轮廓的角点的坐标并保存。
在一个实施例中,在得到所述待标注图像的标注结果之后,所述方法还包括:
分别计算所述待标注图像中每个字符的角度;
基于所述每个字符的角度,将所述每个字符旋转至水平方向;
识别出旋转后的所述每个字符的所处的字符区域;
分割每个字符区域,将分割后的每个字符区域进行拼接得到矩形拼接结果,将所述矩形拼接结果作为所述待标注图像的字符标注结果。
由于工业产品通常通过识别产品图像上的二维码或产品型号的方式判断是否存在混料,因此在训练工业产品的字符识别模型时,通常也需要大量的样本数据。当待标注图像中含有产品型号(字符)信息时,本申请还可以对待标注图像中的字符进行自动标注。具体而言,由于待标注图像中的字符可能是倾斜的或者为斜体字符,因此需要先计算出待标注图像中字符的角度,计算字符的角度可以根据字符宽度、高度及对比度从背景中提取出来,将提取的字符区域膨胀连接在一起,再计算出膨胀区域外接矩形,将该外接矩形的长边与水平线之间的夹角作为字符的角度。根据计算出的字符的角度,将每个字符旋转至水平方向,利用OCR识别模型识别出旋转后的字符的所处的字符区域,根据每个字符区域将每个字符进行分割,将分割后的每个字符区域宽度方向进行膨胀连通,经过形状变换得到矩形拼接结果,将矩形拼接结果作为待标注图像的字符标注结果,每个矩形拼接结果对应一行字符。还可以将每个矩形拼接结果分别进行裁剪,以该矩形拼接结果的字符作为文件名对裁剪图像进行命名后保存。
参照图2所示,为本申请图像标注装置100的功能模块示意图。
本申请所述图像标注装置100可以安装于电子设备中。根据实现的功能,所述图像标注装置100可以包括匹配模块110、生成模块120、第一标注模块130及第二标注模块140。本申请所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
匹配模块110:用于从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
生成模块120:用于基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
第一标注模块130:用于利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
第二标注模块140:用于分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
在一个实施例中,图像标注装置100还包括第三标注模块,第三标注模块用于:
分别计算所述待标注图像中每个字符的角度;
基于所述每个字符的角度,将所述每个字符旋转至水平方向;
识别出旋转后的所述每个字符的所处的字符区域;
分割每个字符区域,将分割后的每个字符区域进行拼接得到矩形拼接结果,将所述矩形拼接结果作为所述待标注图像的字符标注结果。
在一个实施例中,所述从模板库中查找与待标注图像相匹配的模板图像,包括:
提取所述模板库中每张模板图像的掩膜图像的第一边缘轮廓点,并计算所述第一边缘轮廓点的特征向量;
计算所述第一边缘轮廓点的坐标及角度;
提取所述待标注图像的掩膜图像的第二边缘轮廓点,并计算所述第二边缘轮廓点的特征向量;
计算所述第二边缘轮廓点的坐标及角度;
基于所述第一边缘轮廓点的特征向量与所述第二边缘轮廓点的特征向量的相似度,所述第一边缘轮廓点的坐标及角度与所述第二边缘轮廓点的坐标及角度的相似度,确定出与所述待标注图像相匹配的模板图像。
在一个实施例中,所述基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵,包括:
获取所述模板图像的模板中心点坐标与模板图像的模板角度;
在所述待标注图像中确定出与所述模板图像的模板中心点坐标对应的目标坐标,及在所述待标注图像中确定出与所述模板图像的模板角度对应的目标角度;
根据所述中心点坐标、所述模板图像的模板角度、所述目标坐标及所述目标角度,生成仿射矩阵。
在一个实施例中,所述根据所述中心点坐标、所述模板图像的模板角度、所述目标坐标及所述目标角度,生成仿射矩阵,包括:
利用如下公式计算所述仿射矩阵,所述公式包括:
其中,Mat2D表示所述仿射矩阵,α表示所述模板图像的模板角度与所述目标角度的角度差,α的数值用弧度表示,t表示所述中心点坐标到所述目标坐标的向量,Tx表示所述中心点坐标的纵坐标值与所述目标坐标的纵坐标值的差值,Ty表示所述中心点坐标的横坐标值与所述目标坐标的横坐标值的差值。
在一个实施例中,所述分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果,包括:
获取用户输入的分割参数和提取参数;
确定所述待标注图像的标注区域中的分割区域;
根据所述分割参数和所述提取参数,从所述分割区域中分割出所述待标注图像的标注区域中的标注轮廓,作为所述待标注图像的轮廓标注结果。
在一个实施例中,图像标注装置还包括存储模块,存储模块用于:
获取所述待标注图像的属性信息、所述待标注图像的标注区域的轮廓的坐标点集及所述待标注图像的标注区域的标签信息;
将所述属性信息、所述坐标点集及所述标签信息以JSON格式进行存储得到存储文件;
将所述存储文件以所述待标注图像的文件名进行命名。
参照图3所示,为本申请电子设备较佳实施例的示意图。
该电子设备包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信;
存储器113,用于存放计算机程序,例如,图像标注程序;
其中,处理器111在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器111通常用于控制所述电子设备的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器111用于运行所述存储器113中存储的程序代码或者处理数据,例如运行图像标注程序的程序代码等。
通信接口112可选地可以包括标准的有线接口、无线接口(如WI-FI接口),该通信接口112还可以用于在所述电子设备与其它电子设备之间建立通信连接。
存储器113至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器113可以是所述电子设备的内部存储单元,例如该电子设备的硬盘或内存。在另一些实施例中,所述存储器113也可以是所述电子设备的外部存储设备,例如该电子设备配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器113还可以既包括所述电子设备的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备的操作系统和各类计算机程序,例如图像标注程序的程序代码等。此外,存储器113还可以用于暂时地存储已经输出或者将要输出的各类数据。
图3仅示出了具有组件111-114的电子设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
在本申请一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的图像标注方法,包括:
从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
关于上述步骤的详细介绍,请参照上述图2关于图像标注装置100实施例的功能模块图以及图1关于图像标注方法实施例的流程图的说明。
此外,本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性的,也可以是易失性的。计算机可读存储介质中包括存储数据区和存储程序区,存储程序区存储有图像标注程序,所述图像标注程序被处理器执行时实现如下操作:
从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
本申请之计算机可读存储介质的具体实施方式与上述图像标注方法的具体实施方式大致相同,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
应理解的是,文中使用的术语仅出于描述特定示例实施方式的目的,而无意于进行限制。除非上下文另外明确地指出,否则如文中使用的单数形式“一”、“一个”以及“所述”也可以表示包括复数形式。术语“包括”、“包含”、“含有”以及“具有”是包含性的,并且因此指明所陈述的特征、步骤、操作、元件和/或部件的存在,但并不排除存在或者添加一个或多个其它特征、步骤、操作、元件、部件、和/或它们的组合。文中描述的方法步骤、过程、以及操作不解释为必须要求它们以所描述或说明的特定顺序执行,除非明确指出执行顺序。还应当理解,可以使用另外或者替代的步骤。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种图像标注方法,其特征在于,所述方法包括:
从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
2.如权利要求1所述的图像标注方法,其特征在于,在得到所述待标注图像的标注结果之后,所述方法还包括:
分别计算所述待标注图像中每个字符的角度;
基于所述每个字符的角度,将所述每个字符旋转至水平方向;
识别出旋转后的所述每个字符的所处的字符区域;
分割每个字符区域,将分割后的每个字符区域进行拼接得到矩形拼接结果,将所述矩形拼接结果作为所述待标注图像的字符标注结果。
3.如权利要求1或2所述的图像标注方法,其特征在于,所述从模板库中查找与待标注图像相匹配的模板图像,包括:
提取所述模板库中每张模板图像的掩膜图像的第一边缘轮廓点,并计算所述第一边缘轮廓点的特征向量;
计算所述第一边缘轮廓点的坐标及角度;
提取所述待标注图像的掩膜图像的第二边缘轮廓点,并计算所述第二边缘轮廓点的特征向量;
计算所述第二边缘轮廓点的坐标及角度;
基于所述第一边缘轮廓点的特征向量与所述第二边缘轮廓点的特征向量的相似度,所述第一边缘轮廓点的坐标及角度与所述第二边缘轮廓点的坐标及角度的相似度,确定出与所述待标注图像相匹配的模板图像。
4.如权利要求1所述的图像标注方法,其特征在于,所述基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵,包括:
获取所述模板图像的模板中心点坐标与模板图像的模板角度;
在所述待标注图像中确定出与所述模板图像的模板中心点坐标对应的目标坐标,及在所述待标注图像中确定出与所述模板图像的模板角度对应的目标角度;
根据所述中心点坐标、所述模板图像的模板角度、所述目标坐标及所述目标角度,生成仿射矩阵。
5.如权利要求4所述的图像标注方法,其特征在于,所述根据所述中心点坐标、所述模板图像的模板角度、所述目标坐标及所述目标角度,生成仿射矩阵,包括:
利用如下公式计算所述仿射矩阵,所述公式包括:
其中,Mat2D表示所述仿射矩阵,α表示所述模板图像的模板角度与所述目标角度的角度差,α的数值用弧度表示,t表示所述中心点坐标到所述目标坐标的向量,Tx表示所述中心点坐标的纵坐标值与所述目标坐标的纵坐标值的差值,Ty表示所述中心点坐标的横坐标值与所述目标坐标的横坐标值的差值。
6.如权利要求1所述的图像标注方法,其特征在于,所述分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果,包括:
获取用户输入的分割参数和提取参数;
确定所述待标注图像的标注区域中的分割区域;
根据所述分割参数和所述提取参数,从所述分割区域中分割出所述待标注图像的标注区域中的标注轮廓,作为所述待标注图像的轮廓标注结果。
7.如权利要求1所述的图像标注方法,其特征在于,在得到所述待标注图像的标注区域,所述方法还包括:
获取所述待标注图像的属性信息、所述待标注图像的标注区域的轮廓的坐标点集及所述待标注图像的标注区域的标签信息;
将所述属性信息、所述坐标点集及所述标签信息以JSON格式进行存储得到存储文件;
将所述存储文件以所述待标注图像的文件名进行命名。
8.一种图像标注装置,其特征在于,所述装置包括:
匹配模块:用于从模板库中查找与待标注图像相匹配的模板图像,其中,所述模板图像中具有标注区域;
生成模块:用于基于所述模板图像的模板中心点坐标与模板图像的模板角度,生成仿射矩阵;
第一标注模块:用于利用所述仿射矩阵将所述模板图像的标注区域映射至所述待标注图像,得到所述待标注图像的标注区域;
第二标注模块:用于分割所述待标注图像的标注区域中的标注轮廓,得到所述待标注图像的轮廓标注结果。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1至7中任一项所述的图像标注方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的图像标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410135494.8A CN117670884A (zh) | 2024-01-31 | 2024-01-31 | 图像标注方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410135494.8A CN117670884A (zh) | 2024-01-31 | 2024-01-31 | 图像标注方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117670884A true CN117670884A (zh) | 2024-03-08 |
Family
ID=90064599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410135494.8A Pending CN117670884A (zh) | 2024-01-31 | 2024-01-31 | 图像标注方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117670884A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974767A (zh) * | 2024-04-01 | 2024-05-03 | 深圳中科精工科技有限公司 | 一种连接器的目标区域定位方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584250A (zh) * | 2018-11-28 | 2019-04-05 | 哈工大机器人(合肥)国际创新研究院 | 一种鲁棒的视觉区域自动划分标注的方法 |
CN111639647A (zh) * | 2020-05-22 | 2020-09-08 | 深圳市赛为智能股份有限公司 | 指示灯状态识别方法、装置、计算机设备及存储介质 |
CN116012493A (zh) * | 2022-12-30 | 2023-04-25 | 壹沓科技(上海)有限公司 | 图像标注方法、装置、存储介质、计算机设备 |
CN116092064A (zh) * | 2022-12-21 | 2023-05-09 | 广州市斯睿特智能科技有限公司 | 一种铭牌识别方法、系统、装置及存储介质 |
CN117173223A (zh) * | 2023-09-01 | 2023-12-05 | 杭州德创电子股份有限公司 | 电表断码屏的标准模板生成方法、装置、设备及介质 |
-
2024
- 2024-01-31 CN CN202410135494.8A patent/CN117670884A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584250A (zh) * | 2018-11-28 | 2019-04-05 | 哈工大机器人(合肥)国际创新研究院 | 一种鲁棒的视觉区域自动划分标注的方法 |
CN111639647A (zh) * | 2020-05-22 | 2020-09-08 | 深圳市赛为智能股份有限公司 | 指示灯状态识别方法、装置、计算机设备及存储介质 |
CN116092064A (zh) * | 2022-12-21 | 2023-05-09 | 广州市斯睿特智能科技有限公司 | 一种铭牌识别方法、系统、装置及存储介质 |
CN116012493A (zh) * | 2022-12-30 | 2023-04-25 | 壹沓科技(上海)有限公司 | 图像标注方法、装置、存储介质、计算机设备 |
CN117173223A (zh) * | 2023-09-01 | 2023-12-05 | 杭州德创电子股份有限公司 | 电表断码屏的标准模板生成方法、装置、设备及介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974767A (zh) * | 2024-04-01 | 2024-05-03 | 深圳中科精工科技有限公司 | 一种连接器的目标区域定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476227B (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
WO2020173008A1 (zh) | 一种文本识别方法及装置 | |
EP2201495B1 (en) | Computer vision cad models | |
US8590794B2 (en) | Barcode recognion method and computer product thereof | |
CN110751682B (zh) | 一种提取和标识图像的方法、装置、终端设备及存储介质 | |
CN117670884A (zh) | 图像标注方法、装置、设备及存储介质 | |
US8340433B2 (en) | Image processing apparatus, electronic medium, and image processing method | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN111325104A (zh) | 文本识别方法、装置及存储介质 | |
WO2021147219A1 (zh) | 基于图像的文本识别方法、装置、电子设备及存储介质 | |
CN111310426A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
CN111738247B (zh) | 极性标识的识别方法、识别装置、电子设备及存储介质 | |
JP2020507831A (ja) | 長距離高密度視覚マーカの検出および認識方法 | |
CN112307786A (zh) | 一种多个不规则二维码批量定位识别方法 | |
CN113420580B (zh) | 用于对二维码进行辅助定位符定位的方法及装置、二维码扫描设备、存储介质 | |
WO2021179751A1 (zh) | 图像处理方法和系统 | |
CN112579810B (zh) | 印刷电路板分类方法、装置、计算机设备和存储介质 | |
CN110110731A (zh) | 基于深度学习的定位方法及装置 | |
CN110263310B (zh) | 数据图生成方法、装置及计算机可读存储介质 | |
JP6171786B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
CN113012189A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN112287763A (zh) | 图像处理方法、装置、设备及介质 | |
CN117974767B (zh) | 一种连接器的目标区域定位方法 | |
CN113177532B (zh) | 图像中文字的段落边界的识别方法、装置、设备及介质 | |
CN112507921B (zh) | 基于目标区域的图形搜索方法、系统、电子装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |