发明内容
本发明的主要目的在于提供一种分类识别定位方法、装置、设备及计算机可读存储介质,旨在解决如何提高多目标工件分类定位识别的准确性的技术问题。
为实现上述目的,本发明提供一种分类识别定位方法,包括以下步骤:
对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像;
根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取,得到目标特征信息,并确定所述目标特征信息在所述目标图像中的目标位置信息;
根据预设的历史类别对照表确定所述目标特征信息对应的类别,并输出所述目标位置信息和所述类别。
可选地,根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取的步骤,包括:
根据预设的多轮毂目标检测网络对所述目标图像进行填充处理,得到填充特征图;
获取所述填充特征图中的锚箱特征信息,并对所述锚箱特征信息进行加权处理,得到目标特征信息。
可选地,获取所述填充特征图中的锚箱特征信息的步骤,包括:
提取所述填充特征图中的第一特征,并对所述第一特征进行resize处理,得到特征映射信息,获取所述特征映射信息中的锚箱特征信息。
可选地,对所述锚箱特征信息进行加权处理,得到目标特征信息的步骤,包括:
确定所述锚箱特征信息所在的特征映射图,并确定所述特征映射图中和所述锚箱特征信息关联的感兴趣区域,对所述感兴趣区域中的图像信号进行加权处理,将经过加权处理后的所述感兴趣区域中的特征信息作为目标特征信息。
可选地,对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像的步骤,包括:
采集待测目标的初始图像,并根据预设的切割方式对所述初始图像进行切割,得到碎片轮毂图像;
调整所有所述碎片轮毂图像的图像尺寸,直至调整后的所述图像尺寸和预设的标准图像尺寸相同,再根据调整后的碎片轮毂图像构建目标图像。
可选地,根据调整后的碎片轮毂图像构建目标图像的步骤,包括:
对调整后的碎片轮毂图像进行标注,得到标注碎片轮毂图像,将所有所述标注碎片轮毂图像进行组合,得到组合轮毂图像,并将所述组合轮毂图像作为目标图像。
可选地,确定所述目标特征信息在所述目标图像中的目标位置信息的步骤,包括:
若存在多个目标特征信息,则确定各所述目标特征信息在所述目标图像中的位置区域,并将各所述位置区域之间的位置关系作为各所述目标特征信息在所述目标图像中的目标位置信息。
此外,为实现上述目的,本发明还提供一种分类识别定位装置,包括:
切割模块,用于对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像;
提取模块,用于根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取,得到目标特征信息,并确定所述目标特征信息在所述目标图像中的目标位置信息;
确定模块,用于根据预设的历史类别对照表确定所述目标特征信息对应的类别,并输出所述目标位置信息和所述类别。
此外,为实现上述目的,本发明还提供一种分类识别定位设备,分类识别定位设备包括存储器、处理器及存储在存储器上并可在处理器上运行的分类识别定位程序,分类识别定位程序被处理器执行时实现如上述的分类识别定位方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有分类识别定位程序,分类识别定位程序被处理器执行时实现如上述的分类识别定位方法的步骤。
本发明通过切割初始图像,得到碎片轮毂图像,并根据碎片轮毂图像构建目标图像,再根据多轮毂检测网络提取目标图像中的目标特征信息,并确定目标特征信息对应的目标位置信息,并根据历史类别对照表确定目标特征信息对应的类别,再输出目标位置信息和类别,从而避免了现有技术中由于目标遮挡,无法进行识别定位,导致定位识别的准确性较差的现象发生,提高了多目标工件分类定位识别的准确性。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端为分类识别定位设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在终端设备移动到耳边时,关闭显示屏和/或背光。当然,终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及分类识别定位程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的分类识别定位程序,并执行以下操作:
对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像;
根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取,得到目标特征信息,并确定所述目标特征信息在所述目标图像中的目标位置信息;
根据预设的历史类别对照表确定所述目标特征信息对应的类别,并输出所述目标位置信息和所述类别。
参照图2,本发明提供一种分类识别定位方法,在分类识别定位方法的第一实施例中,分类识别定位方法包括以下步骤:
步骤S10,对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像;
在本实施例中,是针对多目标工件分类识别和定位中的缺陷,如灵活性差、工件易损伤、受限于传感器、目标遮挡、尺度变化下背景干扰等问题进行的,提高了多目标轮毂分类定位与识别的准确性和时效性,也提高了生产的效率、节约时间、人力及经济成本。并且为提高不同场景下,多目标轮毂的分类定位与识别的工作效率,因此是通过MHDN(Multi-objective hub detection net,多目标轮毂分类检测网络)网络模型来对轮毂进行分类识别与定位分析的。并且在本实施例中,如图4所示,是通过数据处理、模型搭建、训练优化和系统搭建进行的,即首先构建多目标轮毂HFD(Hub fragment database,轮毂碎片数据库),通过HFD增强数据,构建新数据集,再引入HSAM(Hub sovereignty focuses attentionmechanism,轮毂主权重注意力机制)来搭建预测算法模型,并根据数据集对预测算法模型进行训练优化,再对训练好的预测算法模型进行部署、系统搭建。并且本实施例中的数据处理可以为多轮毂数据预处理;部分数据分割,构建HFD,并基于分割后的碎片轮毂图像构建新的数据,加入到原有的数据中,得到新的数据集,再对新的数据集进行划分,包括训练数据集、测试数据集和验证数据集等。模型搭建是进行网络结构搭建、网络隐藏层函数的构建和HSAM的构建,并在模型搭建完成后,再进行网络的训练优化。
并且在本实施例中,通过在不同场景,对轮毂进行分类与定位,可以实现迎合用户、企业对轮毂分类与定位需求,提高了工作效率和经济效益,并且是通过HFD来增强数据,构建新数据集,从而解决了目标遮挡识别能力弱的问题,并且在本实施例中,会突出轮毂特征信息,因此也解决了尺度变化场景干扰、像素级分类能力差的问题。
因此,在本实施例中,需要采集待测目标的图像信息,并将采集后的图像信息作为初始图像,如通过工业相机对待测目标进行图像采集。并在得到初始图像后,可以对初始图像进行切割,切割方式可以是用户基于自身需求提前设置的,如随机切割、等比例切割、重点位置切割等。其中,重点位置切割可以是先确定初始图像中的特征(如轮毂),并检测初始图像中是否存在不完整的轮毂,若存在不完整的轮毂,则对存在不完整的轮毂所在位置区域进行切割。并在切割得到碎片轮毂图像后,可以根据各个碎片轮毂图像来构建目标图像。
并且在本实施例中,可以采集多个初始图像,并将各个初始图像作为原始数据存储至原始数据集中,并且会对原始数据集中的原始数据赋予标签,再对原始数据集中的原始数据进行随机切割,得到碎片轮毂图像,并标注打标签后,重新组合为新的特征图,将新的特征图存储至基于HFD组合数据集中,再将基于HFD组合数据集和原始数据集进行组合合并,形成组合数据集,将组合数据集中的数据作为目标图像。其中,组合新的特征图的方式可以如图7所示进行重新组合,将不同初始图像之间的碎片轮毂图像按照轮毂图像的方式进行重新组合,即若初始图像存在多个,且对每个初始图像均进行切割后,得到各个初始图像的碎片轮毂图像时,可以按照完整的轮毂图像在各个碎片轮毂图像中进行有选择性的筛选,再组合,以使组合的图像和完整的轮毂图像之间的相似度最大,并且本实施例中,重新组合的图像数量可以为多个。
步骤S20,根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取,得到目标特征信息,并确定所述目标特征信息在所述目标图像中的目标位置信息;
在本实施例中,当确定目标图像后,可以根据提前设置的多轮毂目标检测网络对目标图像进行特征识别提取。而多轮毂目标检测网络是需要提前搭建训练的,并在搭建训练完成后,才能进行分类判定。因此在本实施例中,可以先对多轮毂目标检测网络MHDN进行网络结构设计,MHDN结构包括VGG特征提取网络、主权Feature map(特征映射)特征提取网络(包括13个Conv(卷积)层、4个pool(池化)层和1个全连接层)和分类器。如图5所示,首先对代建目标进行padding(填充)处理,生成合适大小的padding图像,接着使用VGG特征提取网络提取padding图像中的特征信息和resize,并根据特征提取和resize生成Featuremap,再进行HSAM处理,即对Feature map中生成的Anchor box进行加权处理,得到主权Feature map,再通过主权Feature map提取网络从主权Feature map中提取加权后的Anchor box特征信息,生成Linear vector(线性向量),接着通过softmax(逻辑回归)、分类器进行分类定位处理。
因此可以直接将目标图像输入至多轮毂目标检测网络中进行特征识别提取,而多轮毂目标检测网络进行特征识别提取的方式可以是将目标图像转换为特征图,再进行特征识别提取,得到目标特征信息,然后再确定目标特征信息在目标图像中的位置信息。但由于在进行位置定位时,会存在一定的损失,因此为了提高位置定位的精确性,会根据多轮毂目标检测网络中的定位损失函数对位置信息进行调整,得到目标位置信息。同理在后续进行类别确定时,也会根据分类损失函数对类别进行调整。
并且在提前搭建训练多轮毂目标检测网络时,会获取训练数据集中的预处理图像,并对预处理图像进行数据分割、组合、添加处理,再将处理后的数据写入h5文件中,再定义初始的MHDN网络模型,并确定训练策略,如随机梯度下降策略,并对初始的MHDN网络模型的参数进行设置,如学习率和优化器等参数,设置方式可以根据用户需求自行进行设置。再根据选择好的训练策略进行训练,并在训练完成后使用验证数据集进行验证,验证无误后,进行后续的正常使用操作。
并且,本实施例中的MHDN的主要工作流程可以是先获取待测目标图像,并进行HSAM搭建训练,得到HSAM模型,再将待测目标图像输入至特征提取网络进行特征提取,并根据HSAM模型进行分类判定。
步骤S30,根据预设的历史类别对照表确定所述目标特征信息对应的类别,并输出所述目标位置信息和所述类别。
当获取到目标特征信息后,可以在数据库中获取提前设置好的历史类别对照表,并在历史类别对照表中来获取目标特征信息对应的类别,再输出识别到的目标位置信息和所属类别。例如,如图6所示,通过工业相机对待检目标进行图像采集,并通过MHDN对采集的图像进行轮毂图像特征信息提取,并经过分类器与数据库中的历史类别对照表进行匹配分析对比,根据匹配分析对比结果确定分类定位轮毂的具体信息。
在本实施例中,通过通过切割初始图像,得到碎片轮毂图像,并根据碎片轮毂图像构建目标图像,再根据多轮毂检测网络提取目标图像中的目标特征信息,并确定目标特征信息对应的目标位置信息,并根据历史类别对照表确定目标特征信息对应的类别,再输出目标位置信息和类别,从而避免了现有技术中由于目标遮挡,无法进行识别定位,导致定位识别的准确性较差的现象发生,提高了多目标工件分类定位识别的准确性。
进一步地,基于上述本发明的第一实施例,提出本发明分类识别定位方法的第二实施例,在本实施例中,上述实施例步骤S20,根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取的步骤的细化,包括:
步骤a,根据预设的多轮毂目标检测网络对所述目标图像进行填充处理,得到填充特征图;
在本实施例中,当根据碎片轮毂图像获取到目标图像后,可以根据提前训练好的多轮毂目标检测网络对目标图像进行填充处理,即padding处理,得到padding图像,将此padding图像作为填充特征图,需要说明的是填充特征图的图像大小,规格类型等参数均为多轮毂目标检测网络可识别操作的参数。
步骤b,获取所述填充特征图中的锚箱特征信息,并对所述锚箱特征信息进行加权处理,得到目标特征信息。
并在得到填充特征图后,可以通过VGG网络对填充特征图中进行特征提取,并对提取的特征进行resize调整,得到新的Feature map,即特征映射图,并确定Feature map中生成的Anchor box,即锚箱特征信息,再对锚箱特征信息进行加权处理,得到目标特征信息。
在本实施例中,通过先对目标图像进行填充处理,再获取填充图中的锚箱特征信息,并进行加权处理,得到目标特征信息,从而保障了获取到的目标特征信息的准确性。
具体地,获取所述填充特征图中的锚箱特征信息的步骤,包括:
步骤c,提取所述填充特征图中的第一特征,并对所述第一特征进行resize处理,得到特征映射信息,获取所述特征映射信息中的锚箱特征信息。
在本实施例中,可以通过VGG网络对填充特征图中的特征进行提取,如轮毂特征,并将提取的特征作为第一特征,再对轮毂特征进行resize调整,得到特征映射信息,并在特征映射信息中来获取锚箱特征信息。
在本实施例中,通过通过对提前的填充特征图中的第一特征进行resize处理,得到特征映射信息,并获取特征映射信息中的锚箱特征信息,从而保障了获取到的锚箱特征信息的有效性。
具体地,对所述锚箱特征信息进行加权处理,得到目标特征信息的步骤,包括:
步骤d,确定所述锚箱特征信息所在的特征映射图,并确定所述特征映射图中和所述锚箱特征信息关联的感兴趣区域,对所述感兴趣区域中的图像信号进行加权处理,将经过加权处理后的所述感兴趣区域中的特征信息作为目标特征信息。
在本实施例中,由于提取的第一特征可能存在多个,为了更加清晰地识别,因此可以对包含第一特征的锚箱特征信息进行加权处理。因此需要先确定锚箱特征信息所在的特征映射图,并确定特征映射图中和锚箱特征信息关联的感兴趣区域,即在感兴趣区域中可能也有第一特征,再对感兴趣区域中的图像信号进行加权处理,使其更加清晰,并将经过加权处理后的感兴趣区域中的特征信息作为目标特征信息。
其中,在进行加权处理时,可以先对特征映射图进行全局平均池化操作处理,再进行一次全连接操作,最后经过激活函数进行一次激励操作,从而完成加权处理。
在本实施例中,通过先确定锚箱特征信息所在的特征映射图,并确定感兴趣区域,再进行加权处理,并将经过加权处理后的感兴趣区域中的特征信息作为目标特征信息,从而保障了获取到的目标特征信息的准确性。
进一步地,对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像的步骤,包括:
步骤e,采集待测目标的初始图像,并根据预设的切割方式对所述初始图像进行切割,得到碎片轮毂图像;
在本实施例中,先确定待测目标,即待检目标,如轮毂。再通过工业相机对待测目标进行图像采集,得到初始图像,然后再确定初始图像的切割方向,如随机切割等。根据确定切割方式对初始图像进行切割,将切割后的图像中具有轮毂特征的图像作为碎片轮毂图像。
步骤f,调整所有所述碎片轮毂图像的图像尺寸,直至调整后的所述图像尺寸和预设的标准图像尺寸相同,再根据调整后的碎片轮毂图像构建目标图像。
当获取到各个碎片轮毂图像后,可以对各个碎片轮毂图像进行HFD构建,但由于各个碎片轮毂图像不一定均符合要求,因此可以调整各个碎片轮毂图像的图像尺寸,使其标准化,即可以调整碎片轮毂图像的图像尺寸和提前设置的标准图像尺寸相同,再对调整后的碎片轮毂图像进行组合,得到组合后的图像,根据组合后的图像来构建目标图像。其中,HFD的构建可以如图7所示,若初始图像为obj1和obj2,则对这两个初始图像进行切割后,得到obj1-2;obj1-1和obj2-1,再将其随机组合,得到的组合图像为HFPtrain-1,即HFD。
在本实施例中,通过采集待测目标的初始图像再进行切割,得到碎片轮毂图像,并调整碎片轮毂图像的尺寸,根据调整后的碎片轮毂图像构建目标图像,从而便于后续对存在遮挡的目标进行识别。
具体地,根据调整后的碎片轮毂图像构建目标图像的步骤,包括:
步骤g,对调整后的碎片轮毂图像进行标注,得到标注碎片轮毂图像,将所有所述标注碎片轮毂图像进行组合,得到组合轮毂图像,并将所述组合轮毂图像作为目标图像。
在本实施例中,当对碎片轮毂图像进行调整后可以进行标注,以便区别于其他的碎片轮毂图像,并将标注后的碎片轮毂图像作为标注碎片轮毂图像。并且在本实施例中会对所有的碎片轮毂图像都进行标注。当所有碎片轮毂图像均标注完成后,可以将各个标注碎片轮毂图像进行组合,其组合方式可以不做限制。并将组合后的图像作为组合轮毂图像,再将组合轮毂图像和初始图像存储至组合数据集中,并将组合数据集中的组合轮毂图像和初始图像均作为目标图像。
在本实施例中,通过对调整后的碎片轮毂图像进行标注,再进行组合,得到组合轮毂图像,再将组合轮毂图像作为目标图像,从而保障了获取到的目标图像的准确性。
进一步地,确定所述目标特征信息在所述目标图像中的目标位置信息的步骤,包括:
步骤h,若存在多个目标特征信息,则确定各所述目标特征信息在所述目标图像中的位置区域,并将各所述位置区域之间的位置关系作为各所述目标特征信息在所述目标图像中的目标位置信息。
当获取到目标图像中的目标特征信息,且目标特征信息存在多个时,可以先确定目标特征信息在目标图像的位置区域,并根据各个位置区域之间的位置关系来确定目标位置信息。如目标特征信息存在a和b,a在目标图像的位置区域为第一位置区域,b在目标图像中的位置区域为第二位置区域,且第一位置区域在第二位置区域的左侧,则确定目标位置信息为a在b的左侧。此外也可以根据VGG网络来具体定位目标特征信息在目标图像中的具体位置信息,并将其作为目标位置信息。
在本实施例中,通过根据各个目标特征信息在目标图像中的位置区域之间的位置关系来确定目标位置信息,从而保障了获取到的目标位置信息的有效性。
此外,参照图3,本发明实施例还提供一种分类识别定位装置,包括:
切割模块A10,用于对采集的初始图像进行切割,得到碎片轮毂图像,并根据所述碎片轮毂图像构建目标图像;
提取模块A20,用于根据预设的多轮毂目标检测网络对所述目标图像进行特征识别提取,得到目标特征信息,并确定所述目标特征信息在所述目标图像中的目标位置信息;
确定模块A30,用于根据预设的历史类别对照表确定所述目标特征信息对应的类别,并输出所述目标位置信息和所述类别。
可选地,提取模块A20,用于:
根据预设的多轮毂目标检测网络对所述目标图像进行填充处理,得到填充特征图;
获取所述填充特征图中的锚箱特征信息,并对所述锚箱特征信息进行加权处理,得到目标特征信息。
可选地,提取模块A20,用于:
提取所述填充特征图中的第一特征,并对所述第一特征进行resize处理,得到特征映射信息,获取所述特征映射信息中的锚箱特征信息。
可选地,提取模块A20,用于:
确定所述锚箱特征信息所在的特征映射图,并确定所述特征映射图中和所述锚箱特征信息关联的感兴趣区域,对所述感兴趣区域中的图像信号进行加权处理,将经过加权处理后的所述感兴趣区域中的特征信息作为目标特征信息。
可选地,切割模块A10,用于:
采集待测目标的初始图像,并根据预设的切割方式对所述初始图像进行切割,得到碎片轮毂图像;
调整所有所述碎片轮毂图像的图像尺寸,直至调整后的所述图像尺寸和预设的标准图像尺寸相同,再根据调整后的碎片轮毂图像构建目标图像。
可选地,切割模块A10,用于:
对调整后的碎片轮毂图像进行标注,得到标注碎片轮毂图像,将所有所述标注碎片轮毂图像进行组合,得到组合轮毂图像,并将所述组合轮毂图像作为目标图像。
可选地,提取模块A20,用于:
若存在多个目标特征信息,则确定各所述目标特征信息在所述目标图像中的位置区域,并将各所述位置区域之间的位置关系作为各所述目标特征信息在所述目标图像中的目标位置信息。
其中,分类识别定位装置的各个功能单元实现的步骤可参照本发明分类识别定位方法的各个实施例,此处不再赘述。
此外,本发明还提供一种分类识别定位设备,所述分类识别定位设备包括:存储器、处理器及存储在所述存储器上的分类识别定位程序;所述处理器用于执行所述分类识别定位程序,以实现上述分类识别定位方法各实施例的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述分类识别定位方法各实施例的步骤。
本发明计算机可读存储介质具体实施方式与上述分类识别定位方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。