CN112183629A - 一种图像标识方法、装置、存储介质及电子设备 - Google Patents
一种图像标识方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112183629A CN112183629A CN202011045119.2A CN202011045119A CN112183629A CN 112183629 A CN112183629 A CN 112183629A CN 202011045119 A CN202011045119 A CN 202011045119A CN 112183629 A CN112183629 A CN 112183629A
- Authority
- CN
- China
- Prior art keywords
- target object
- target
- identification frame
- picture
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004590 computer program Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种图像标识方法、装置、存储介质及电子设备,其方法包括:获取初始对象图片,其中,所述初始对象图片中包含目标对象;从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;根据所述目标边缘点的坐标确定用于包围所述目标对象的边缘点的第一标识框;根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,所述第一标识框与第二标识框大小相同。通过本发明,解决了相关技术中对训练用的图片进行标识耗时耗力的问题,进而达到了提高图像标识效率的效果。
Description
技术领域
本发明实施例涉及图像识别领域,具体而言,涉及一种图像标识方法、装置、存储介质及电子设备。
背景技术
目前在利用图片对神经网络进行训练以获取能够对图像进行识别的过程中,需要对用于进行训练的图片进行特征标注,标注的特征包括目标对象的位置、种类等;为保证神经网络训练的精确度,需要使用大量的图片进行训练;因而对这些图片进行特征标注时需要耗费大量的人工进行采集处理标注等过程,耗时耗力。而目前并没有较好的方案解决上述问题。
发明内容
本发明实施例提供了一种图像标识方法、装置、存储介质及电子设备,以至少解决相关技术中对训练用的图片进行标识耗时耗力的问题。
根据本发明的一个实施例,提供了一种图像标识方法,包括:
获取初始对象图片,其中,所述初始对象图片中包含目标对象;
从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;
根据所述目标边缘点的坐标确定用于包围所述目标对象的边缘点的第一标识框;
根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,所述第一标识框与第二标识框大小相同。
在一个示例性实施例中,在所述根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片之后,所述方法还包括:
根据预设算法对目标对象图片进行优化处理,以得到目标合成图片。
在一个示例性实施例中,
在所述从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标之前,所述方法包括:
确定所述目标对象的边缘点,以得到所述边缘点的坐标;
所述根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片包括:
根据所述目标对象的边缘点的坐标,确定所述第一标识框与所述目标对象的边缘点的相对位置;
根据所述第一标识框与所述目标对象的边缘点的相对位置确定所述目标对象在所述第二标识框中的目标位置;
将所述目标对象截取至所述第二标识框中的所述目标位置处,以得到所述目标对象图片。
在一个示例性实施例中,所述根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片还包括:
在所述初始对象图片中,沿所述目标对象的边缘连接所述目标对象的边缘点;
沿所述边缘点之间的连线将所述目标对象从所述第一标识框中截取出;
将所述第二标识框中的所述目标位置处的图像替换为从所述第一标识框中截取出的所述目标对象,以得到所述目标对象图片。
根据本发明的另一个实施例,提供了一种图像标识装置,包括:
初始图片获取模块,用于获取初始对象图片,其中,所述初始对象图片中包含目标对象;
第一坐标采集模块,用于从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;
第一标识模块,用于根据所述目标边缘点的坐标确定用于包围所述目标对象的边缘点的第一标识框;
第二标识模块,用于根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,所述第一标识框与第二标识框大小相同。
在一个示例性实施例中,所述装置还包括:
优化模块,用于根据预设算法对目标对象图片进行优化处理,以得到目标合成图片。
在一个示例性实施例中,
所述装置还包括:
第二目标采集模块,用于确定所述目标对象的边缘点,以得到所述边缘点的坐标;
所述第二标识模块包括:
位置采集单元,用于根据所述第一标识框与所述目标对象的边缘点的相对位置确定所述目标对象在所述第二标识框中的目标位置;
目标截取单元,用于将所述目标对象截取至所述第二标识框中的所述目标位置处,以得到所述目标对象图片。
在一个示例性实施例中,所述第二标识模块还包括:
连接单元,用于在所述初始对象图片中,连接所述目标对象的边缘点;
对象截取单元,用于沿所述边缘点之间的连线将所述目标对象从所述第一标识框中截取出;
目标替换单元,将所述第二标识框中的所述目标位置处的图像替换为从所述第一标识框中截取出的所述目标对象,以得到所述目标对象图片。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于通过对目标对象进行截取,并将截取的目标对象截取至目标对象图片中,且自动在目标对象图片对目标对象间标识,从而节约了人工对目标对象进行标识的过程,因此,可以解决对训练用图片进行标识的过程中耗时耗力的问题,达到提高图像标识效率效果。
附图说明
图1是本发明实施例的一种图像标识方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种图像标识方法的流程图;
图3是根据本发明实施例的一种图像标识装置的结构框图;
图4是本发明的一个具体实施例的流程图;
图5是本发明的一个具体实施例的目标对象标识示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种图像标识方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种图像标识方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种图像标识方法,图2是根据本发明实施例的的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取初始对象图片,其中,初始对象图片中包含目标对象;
在本实施例中,获取包含目标对象的初始对象图片是为了能够将目标对象进行截取,从而方便获取目标对象,以及方便对目标对象进行标注;其中,目标对象可以是手势,如手指张开的手势、手指蜷缩的手势、拳头紧握的手势等,也可以是物体,如行人、动物、汽车等,也可以是某个动作,如人体站立的姿势、人体单腿站立的姿势等,还可以是人的面部表情,如大笑、愤怒等,还可以是其它按照实际需求设置的对象,此处不再赘述。
为使目标对象便于被识别,初始对象图片的背景颜色可以与目标对象的颜色呈反差,如手势为红色,则初始对象图片的背景为白色或者蓝色等,或者目标对象为白色,初始对象图片的背景颜色为红色等,只要能够方便目标对象易于被识别即可。
获取初始对象图片的方式可以是通过对包含目标对象的场景进行拍摄获得,也可以是通过将目标对象的图片与背景图片相组合获得,还可以是通过网络爬虫从互联网随机抓取获得,还可以是通过其它方式获得。
步骤S204,从目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;
在本实施例中,沿目标对象的边缘设置边缘点,随后将目标对象所在的初始对象图片分割为若干个像素或坐标点,从而获取目标对象的边缘点在初始对象图片中的坐标;而在初始对象图片中设置边缘点是为了能够确定目标对象的边缘的位置,从而确定目标对象的范围。
其中,在目标对象的边缘设置边缘点的方式可以是通过人工进行设置,也可以是通过图像识别进行自动设置,目标对象的边缘点的数量可以根据目标对象边缘的复杂程度设置为任意个,也可以是为方便进行计算而设置为固定个,且边缘点的密度也可以根据实际需求进行不同设置;目标对象的边缘点的颜色可以与目标对象的颜色以及初始对象图片的背景颜色均不同,从而使边缘点易于被识别,以获取边缘点的坐标。
需要说明的是,边缘点可以是圆形实心点,也可以是方形、三角形的实心点,还可以是多边形或圆形的空心点。
步骤S206,根据目标边缘点的坐标确定用于包围目标对象的边缘点的第一标识框;
在本实施例中,通过第一标识框将目标对象及其边缘点进行包围一方面是为了在对目标对象进行识别时将识别区域缩小至第一标识框内,从而能够减少待识别的区域,进而减少识别过程受到的干扰,提高对目标对象的识别效率;另一方面,第一标识框能够在识别过程中使识别设备快速确定需要识别的区域和目标对象的所在位置,从而提高识别效率。
其中,第一标识框可以是沿水平和竖直方向设置的标准矩形,也可以是沿对角线方向设置的四边形,还可以是三角形或圆形以及其它多边形,只要能够方便识别且将目标对象及其边缘点包围即可;且为方便对第一标识框进行识别,第一标识框可以设置为与初始对象图片的背景的颜色、目标对象的颜色、边缘点的颜色均不同的颜色,例如,当背景的颜色为白色,目标对象为红色,边缘点为蓝色时,第一标识框可以设置为黄色或紫色,还可以是其它颜色,只要能够方便对第一标识框进行识别即可。
需要说明的是,第一标识框的形状可以是按照目标对象的边缘点的位置实时变化的形状,如在第一张初始对象图片中,用于包围第一张初始对象图片中的目标对象的形状可以是三角形,而在第二张初始对象图片中,用于包围第二张初始对象图片中的目标对象的形状可以是矩形;也可以是按照要求设置的固定形状,如矩形等;且第一标识框的大小可以随目标对象的大小变化而变化,以减少识别干扰,也可以是固定大小,以方便对目标对象进行包围,还可以是在预设的类型的图片中为固定大小,在其它类型的图片中则可以随目标对象的大小的变化而变化,此处不再赘述。
步骤S208,根据第一标识框以及目标对象的目标边缘点的坐标,将目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,第一标识框与第二标识框大小相同。
在本实施例中,将目标对象截取到目标背景图片中是为了得到在不同背景下的目标对象,从而在进行神经网络训练时能够识别不同场景或背景中的目标对象;而将目标对象截取到第二标识框中是为了对目标背景图片中的目标对象进行标识,从而无需再额外进行标识,方便进行训练时能够快速识别。
其中,第二标识框与第一标识框一样,也可以设置为不同的颜色,且标识框的大小形状也可以是随目标对象大小形状进行变化,也可以是固定大小和形状;而目标背景图片中的第二标识框的位置可以是随机选取的,也可以是在固定位置进行选取,还可以是根据图片类型确定第二标识框的选取位置的方式;对目标对象的截取方式可以是沿目标对象的边缘进行截取,也可以是沿目标对象的边缘点进行截取,还可以是沿第一标识框进行截取,此处不再赘述。
通过上述步骤,由于在目标背景图片中设置第二标识框以包围目标对象及其边缘点,实现了对图片的自动标识,解决了对图片进行标识造成的耗时耗力,提高了图像标识效率。
其中,上述步骤的执行主体可以为基站、终端等,但不限于此。
在一个可选的实施例中,在根据第一标识框以及目标对象的目标边缘点的坐标,将目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片之后,该方法还包括:
步骤S2010,根据预设算法对目标对象图片进行优化处理,以得到目标合成图片。
在本实施例中,将目标对象截取至目标背景图片中之后,必然在目标对象的边缘存在因图片截取造成的差异,从而影响图像识别,因此,为减少差异,提高图片识别精度,需要对目标对象图像进行优化处理;其中,对图像进行优化处理的方式可以是采用SRGAN对抗生成网络对目标对象图像进行优化处理,从合成图像生成超高分辨率图像;也可以是采用其他方式进行优化处理,只要能够实现对图片的优化即可。
在一个可选的实施例中,
在从目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标之前,该方法包括:
步骤S200,确定目标对象的边缘点,以得到边缘点的坐标;
根据第一标识框以及目标对象的目标边缘点的坐标,将目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片包括:
步骤S2082,根据目标对象的边缘点的坐标,确定第一标识框与目标对象的边缘点的相对位置;
步骤S2084,根据第一标识框与目标对象的边缘点的相对位置确定目标对象在第二标识框中的目标位置;
步骤S2086,将目标对象截取至第二标识框中的目标位置处,以得到目标对象图片。
在本实施例中,在确定目标对象在第二标识框中的位置之前,需要确定目标对象在第一标识框中的位置,而为快速确定目标对象在第一标识框中的位置,可以通过确定目标对象的边缘点与第一标识框的相对位置的方式进行确定,因而在此之前需要确定目标对象的边缘及其坐标,从而能够计算目标对象的边缘点与第一标识框的相对位置。
其中,确定边缘点的方式可以是沿目标对象的边缘随机设置,也可以是沿目标对象的边缘在固定位置进行设置,还可以是沿目标对象的边缘等间隔设置;还可以是通过其他方式进行设置;相应的,获取边缘点的坐标的方式可以是将初始对象图片划分为多个像素或坐标点,由此获取边缘点的坐标,也可以是通过其他方式获得。
而在获取边缘点的坐标的同时,也可以是获取第一标识框的框边及框端点的坐标,因而可以据此计算边缘点与第一标识框的相对距离;同理,由于第一标识框与第二标识框的大小相同,因而,在确定目标对象的边缘点与第一标识框的相对位置之后,即可确定边缘点与第二标识框的相对位置,进而可以确定边缘点在第二标识框中的目标位置;又由于边缘点是沿目标对象的边缘设置的,因而也可以确定目标对象在第二标识框中的目标位置。同时,确定边缘点在第二标识框中的目标位置后,也方便将目标对象截取至目标位置,提高了图像标识效率。
在一个可选的实施例中,根据第一标识框以及目标对象的目标边缘点的坐标,将目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片还包括:
步骤S2088,在初始对象图片中,沿目标对象的边缘连接目标对象的边缘点;
步骤S20810,沿边缘点之间的连线将目标对象从第一标识框中截取出;
步骤S20812,将第二标识框中的目标位置处的图像替换为从第一标识框中截取出的目标对象,以得到目标对象图片。
在本实施例中,连接目标对象的边缘点的连线可以是实心直线,也可以是间断的虚线,还可以是与目标兑现的边缘相贴合的曲线,只要能够实现对边缘点的连接即可。
将第二标识框中的目标位置处的图像替换为从第一标识框中截取出的目标对象的过程可以(但不限于)是先将将第二标识框中的目标位置处的图像以及目标对象均划分为多个像素,随后再将第二标识框中的目标位置处的像素依次进行替换或统一进行替换。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种图像标识装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明实施例的图像标识装置的结构框图,如图3所示,该装置包括:
初始图片获取模块32,用于获取初始对象图片,其中,初始对象图片中包含目标对象;
第一坐标采集模块34,用于从目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;
第一标识模块36,用于根据目标边缘点的坐标确定用于包围目标对象的边缘点的第一标识框;
第二标识模块38,用于根据第一标识框以及目标对象的目标边缘点的坐标,将目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,第一标识框与第二标识框大小相同。
在一个可选的实施例中,该装置还包括:
优化模块310,用于根据预设算法对目标对象图片进行优化处理,以得到目标合成图片。
在一个可选的实施例中,该装置还包括:
第二目标采集模块312,用于确定目标对象的边缘点,以得到边缘点的坐标;
第二标识模块38包括:
位置采集单元382,用于根据第一标识框与目标对象的边缘点的相对位置确定目标对象在第二标识框中的目标位置;
目标截取单元384,用于将目标对象截取至第二标识框中的目标位置处,以得到目标对象图片。
在一个可选的实施例中,第二标识模块38还包括:
连接单元386,用于在初始对象图片中,连接目标对象的边缘点;
对象截取单元388,用于沿边缘点之间的连线将目标对象从第一标识框中截取出;
目标替换单元3810,将第二标识框中的目标位置处的图像替换为从第一标识框中截取出的目标对象,以得到目标对象图片。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
下面结合具体实施例对本发明进行说明。
参照图4及图5,先选择全白的背景对所需要的手势进行拍摄,由于全白背景与前景的手势区域有强烈反差,因而易于将手势区域进行截取(对应图4中的步骤S401)。
随后选取手势的固定点作为边缘点,比如对于“5”的手势,然后通过直线连接边缘点(对应图4中的步骤S402),然后将对应连线区域内的手势图片截取出(对应图4中的步骤S403)。
再根据边缘点坐标,计算边缘点的最大最小x-y坐标(对应图4中的步骤S404);再将包含最值坐标的边缘点作为框终点,并根据框终点设置第一标识框对手势进行标识(对应图4中的步骤S405)。
随后采集任意数量的背景图片,随机在背景图片中选取与手势等大的第二矩形框(对应图4中的步骤S406),并计算第一矩形框与边缘点的距离(对应图4中的步骤S407),再根据第一矩形框与边缘点的距离在背景图片中定位出相应坐标区域(对应图4中的步骤S408)。
再将定位到的区域背景像素替换为手势像素(对应图4中的步骤S409),即完成手势图片的生成。
此时,由于此时生成的图像在边缘上出现锯齿和与背景明显是两张图片合成的痕迹,非常近似于带有马赛克的低质量图片,与真实图片有明显差异,因此为生成与背景完全融合及高像素质量图片,采用SRGAN对抗生成网络合成图像生成超高分辨率图像(对应图4中的步骤S410)。
随后将生成的超高分辨率图像作为图像标识深度学习模型的训练图片。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种图像标识方法,其特征在于,包括:
获取初始对象图片,其中,所述初始对象图片中包含目标对象;
从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;
根据所述目标边缘点的坐标确定用于包围所述目标对象的边缘点的第一标识框;
根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,所述第一标识框与第二标识框大小相同。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片之后,所述方法还包括:
根据预设算法对目标对象图片进行优化处理,以得到目标合成图片。
3.根据权利要求1所述的方法,其特征在于,
在所述从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标之前,所述方法包括:
确定所述目标对象的边缘点,以得到所述边缘点的坐标;
所述根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片包括:
根据所述目标对象的边缘点的坐标,确定所述第一标识框与所述目标对象的边缘点的相对位置;
根据所述第一标识框与所述目标对象的边缘点的相对位置确定所述目标对象在所述第二标识框中的目标位置;
将所述目标对象截取至所述第二标识框中的所述目标位置处,以得到所述目标对象图片。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片还包括:
在所述初始对象图片中,沿所述目标对象的边缘连接所述目标对象的边缘点;
沿所述边缘点之间的连线将所述目标对象从所述第一标识框中截取出;
将所述第二标识框中的所述目标位置处的图像替换为从所述第一标识框中截取出的所述目标对象,以得到所述目标对象图片。
5.一种图像标识装置,其特征在于,包括:
初始图片获取模块,用于获取初始对象图片,其中,所述初始对象图片中包含目标对象;
第一坐标采集模块,用于从所述目标对象的边缘点的坐标中确定出满足目标条件的目标边缘点的坐标;
第一标识模块,用于根据所述目标边缘点的坐标确定用于包围所述目标对象的边缘点的第一标识框;
第二标识模块,用于根据所述第一标识框以及所述目标对象的目标边缘点的坐标,将所述目标对象截取至目标背景图片中的第二标识框中,以得到目标对象图片,其中,所述第一标识框与第二标识框大小相同。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
优化模块,用于根据预设算法对目标对象图片进行优化处理,以得到目标合成图片。
7.根据权利要求5所述的装置,其特征在于,
所述装置还包括:
第二目标采集模块,用于确定所述目标对象的边缘点,以得到所述边缘点的坐标;
所述第二标识模块包括:
位置采集单元,用于根据所述第一标识框与所述目标对象的边缘点的相对位置确定所述目标对象在所述第二标识框中的目标位置;
目标截取单元,用于将所述目标对象截取至所述第二标识框中的所述目标位置处,以得到所述目标对象图片。
8.根据权利要求7所述的装置,其特征在于,所述第二标识模块还包括:
连接单元,用于在所述初始对象图片中,连接所述目标对象的边缘点;
对象截取单元,用于沿所述边缘点之间的连线将所述目标对象从所述第一标识框中截取出;
目标替换单元,将所述第二标识框中的所述目标位置处的图像替换为从所述第一标识框中截取出的所述目标对象,以得到所述目标对象图片。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011045119.2A CN112183629B (zh) | 2020-09-28 | 2020-09-28 | 一种图像标识方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011045119.2A CN112183629B (zh) | 2020-09-28 | 2020-09-28 | 一种图像标识方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112183629A true CN112183629A (zh) | 2021-01-05 |
CN112183629B CN112183629B (zh) | 2024-05-28 |
Family
ID=73945663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011045119.2A Active CN112183629B (zh) | 2020-09-28 | 2020-09-28 | 一种图像标识方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183629B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003062948A2 (en) * | 2002-01-22 | 2003-07-31 | Milliken & Company | Interactive system and method for design, customization and manufacture of decorative textile substrates |
CN104272377A (zh) * | 2012-02-06 | 2015-01-07 | 莱金德3D有限责任公司 | 运动图片项目管理系统 |
US20190116322A1 (en) * | 2017-10-13 | 2019-04-18 | Fyusion, Inc. | Skeleton-based effects and background replacement |
CN111046950A (zh) * | 2019-12-11 | 2020-04-21 | 北京迈格威科技有限公司 | 一种图像处理方法、装置、存储介质和电子装置 |
CN111401421A (zh) * | 2020-03-06 | 2020-07-10 | 上海眼控科技股份有限公司 | 基于深度学习的图像类别判定方法、电子设备以及介质 |
CN111540020A (zh) * | 2020-04-28 | 2020-08-14 | 浙江大华技术股份有限公司 | 目标行为的确定方法及装置、存储介质、电子装置 |
CN111640123A (zh) * | 2020-05-22 | 2020-09-08 | 北京百度网讯科技有限公司 | 无背景图像的生成方法、装置、设备及介质 |
-
2020
- 2020-09-28 CN CN202011045119.2A patent/CN112183629B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003062948A2 (en) * | 2002-01-22 | 2003-07-31 | Milliken & Company | Interactive system and method for design, customization and manufacture of decorative textile substrates |
CN104272377A (zh) * | 2012-02-06 | 2015-01-07 | 莱金德3D有限责任公司 | 运动图片项目管理系统 |
US20190116322A1 (en) * | 2017-10-13 | 2019-04-18 | Fyusion, Inc. | Skeleton-based effects and background replacement |
CN111046950A (zh) * | 2019-12-11 | 2020-04-21 | 北京迈格威科技有限公司 | 一种图像处理方法、装置、存储介质和电子装置 |
CN111401421A (zh) * | 2020-03-06 | 2020-07-10 | 上海眼控科技股份有限公司 | 基于深度学习的图像类别判定方法、电子设备以及介质 |
CN111540020A (zh) * | 2020-04-28 | 2020-08-14 | 浙江大华技术股份有限公司 | 目标行为的确定方法及装置、存储介质、电子装置 |
CN111640123A (zh) * | 2020-05-22 | 2020-09-08 | 北京百度网讯科技有限公司 | 无背景图像的生成方法、装置、设备及介质 |
Non-Patent Citations (4)
Title |
---|
ANURAG DESHMUKH 等: "Synthesis of Optical Nerve Head Region of Fundus Image", 《2019 IEEE 16TH INTERNATIONAL SYMPOSIUM ON BIOMEDICAL IMAGING (ISBI 2019)》 * |
孟云: "基于卷积神经网络的腰椎骨质增生检测", 《中国优秀硕士学位论文全文数据库 (医药卫生科技辑)》 * |
我爱计算机视觉: "ECCV18 | 如何正确使用样本扩充改进目标检测性能", pages 1 - 9, Retrieved from the Internet <URL:https://www.sohu.com/a/256639412_100279313> * |
杨金华;芦宇;蒋慕蓉;: "结合ViBe算法改进与Triplet-ResNet网络实现行人重识别", 计算机应用研究, no. 1 * |
Also Published As
Publication number | Publication date |
---|---|
CN112183629B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109388093B (zh) | 基于线特征识别的机器人姿态控制方法、系统及机器人 | |
CN106548516B (zh) | 三维漫游方法和装置 | |
CN110443212B (zh) | 用于目标检测的正样本获取方法、装置、设备及存储介质 | |
CN111294563B (zh) | 视频监控方法及装置、存储介质、电子装置 | |
CN112950667A (zh) | 一种视频标注方法、装置、设备及计算机可读存储介质 | |
CN110149551B (zh) | 媒体文件播放方法和装置、存储介质及电子装置 | |
CN108765584A (zh) | 激光点云数据集增广方法、装置及可读存储介质 | |
CN108111911B (zh) | 基于自适应跟踪框分割的视频数据实时处理方法及装置 | |
WO2018102880A1 (en) | Systems and methods for replacing faces in videos | |
CN107563978A (zh) | 人脸去模糊方法及装置 | |
CN110298314A (zh) | 手势区域的识别方法及装置 | |
CN105701496B (zh) | 一种基于人工智能技术的围棋盘面识别方法 | |
CN112991456A (zh) | 拍摄定位方法、装置、计算机设备和存储介质 | |
CN112837251A (zh) | 图像处理方法及装置 | |
CN113741495B (zh) | 无人机姿态调整方法、装置、计算机设备和存储介质 | |
CN112183629B (zh) | 一种图像标识方法、装置、存储介质及电子设备 | |
CN109345560B (zh) | 增强现实设备的运动跟踪精度测试方法及装置 | |
CN114897999B (zh) | 物体位姿识别方法、电子设备、存储介质和程序产品 | |
CN113256484B (zh) | 一种对图像进行风格化处理的方法及装置 | |
CN111179408A (zh) | 三维建模的方法及设备 | |
CN107103321B (zh) | 道路二值化图像的生成方法及生成系统 | |
CN113472998B (zh) | 图像处理方法、装置、电子设备和存储介质 | |
CN110969674B (zh) | 一种生成绕线画的方法、装置、终端设备及可读存储介质 | |
CN109286798B (zh) | 一种投影屏幕的边框位置识别方法、系统及终端设备 | |
CN114049355B (zh) | 一种散乱工件的识别标注方法、系统和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |