目标检测网络训练方法及系统及网络及装置及介质
技术领域
本发明涉及目标检测领域,具体地,涉及一种目标检测网络训练方法及系统及目标检测网络或模型及目标检测系统及目标检测网络训练装置及计算机可读存储介质。
背景技术
在现有的工业缺陷检测的业务场景中,往往会伴有很多重叠的缺陷数据,现有解决重叠缺陷的检测方法主要包括以下两种方式:第一种是对一张图多次预测,每一次预测排除上一次预测的结果,然后综合每一次的预测结果最终得到包含所有目标的检测结果,虽然此方式对重叠目标的检测效果比原始检测方法更好,但多余运算资源的开销较大,不利于实际的项目落地。第二种方式是在图片上mask(掩码)随机一组groudtruth(图像标注信息)的boundingbox(标注信息中的回归框)来预测剩余的boundingbox。这种方式虽然提升效果也很明显,但如果在重叠程度较高的目标之间,使用boundingbox进行mask会导致与其重叠的目标的部分或者全部特征也被mask,使其特征缺失较多,不利于模型学习。
目前的目标检测框架对于这部分重叠的目标检测效果并不好,其中的主要原因在于以下两点:
1)当多缺陷位于重叠位置时,在重叠下方的缺陷被上方缺陷所覆盖,导致位于重叠下方的缺陷特征与此类缺陷完整特征存在较大差异,因此难以被检测出。
2)即使第一点所述情况的缺陷能够被检测器检出,但往往其置信度会偏低,在后处理阶段也会被用于抑制重叠框的NMS所抑制。
因此检测重叠目标也是目标检测任务的一大难点。
发明内容
本发明结合上述两种方式的优缺点,发明出利用目标轮廓mask的方式,克服了上述两种方式的不足,使目标检测网络在重叠的目标下,依然能有很好的检测效果。
为实现上述目的,本发明提供了一种目标检测网络训练方法,所述方法包括:
初始化分组比例K;
采集拥有标注信息的训练数据,训练数据包括:原始输入的图像以及其对应的标注信息,标注信息包括目标框及掩码;
将图像上缺陷目标以分组比例K划分为partA和partB两部分,目标掩码为一张图像上所有的缺陷及各缺陷对应的掩码;
针对partA部分,结合目标掩码对应的目标掩码信息,将原始图像上对应的目标掩码区域掩码,针对partB部分,保留partB部分在原始图像上对应的全部标注信息,得到history图像;
将history图像和原始图像输入待训练目标检测网络,原始图像经过目标检测网第一层之后得到第一特征图,history图像经过目标检测网第一层之后得到第二特征图,将第一特征图与第二特征图相加后输入目标检测网后续层进行相关计算训练目标检测网络。
其中,将一特征图与第二特征图相加作用在于使网络能够学习到两个特征图的所包含的信息,而不是单一的特征图,即结果融合。
其中,本方法提出的针对重叠或相互遮挡的缺陷的深度学习网络的训练方法,用于提升现有的目标检测算法对于高度重叠目标的检测性能。本发明的原理为:在存在重叠缺陷目标的图像上,深度学习往往会更偏向于学习一组重叠目标中的最上层的目标所包含的图像信息,而忽略掉下层的目标所包含的图像信息。本发明利用标注信息中的掩码信息,随机地抑制掉上层目标的缺陷信息,而强制模型学习下层目标的信息,以此来增强模型对于重叠目标中被覆盖的目标学习效果。
其中,将目标掩码以分组比例K划分为partA和partB两部分的目的是便用于在步骤二中均衡地划分partA和partB组内元素数量,以及便于在后续步骤中针对两个部分分别进行各自的处理。
其中,partA和partB组内元素为缺陷目标,原始图像中具有多个缺陷目标,组内元素数量即指图像上目标缺陷的数量。
其中,结合目标掩码对应的目标掩码信息,将原始图像上对应的目标掩码区域掩码,以便于神经网络能学习到被遮挡缺陷的图像特征信息。
优选的,所述针对partA部分,结合目标掩码对应的目标掩码信息,将原始图像上对应的目标掩码区域掩码,具体包括:
在原始图像中将partA部分目标掩码所覆盖的像素置为0,并在原始groundtruth的回归框和目标掩码中去掉partA部分目标掩码对应的标注信息。原始groundtruth为图像上缺陷的标注信息。
其中,保留partB部分在原始图像上对应的全部标注信息即为网络此轮训练所要学习的目标。
优选的,本方法中将第一特征图与第二特征图相加具体为:将第一特征图与第二特征图按位相加。
优选的,所述方法还包括测试和验证训练后的目标检测网络。具体为使用测试数据集和验证数据集分别测试和验证训练后的目标检测网络,使得目标检测网络的准确性和稳定性更高。
优选的,本发明中分组比例K为1:1,使用这个比例在后续步骤中进行分组。
本发明还提供了一种目标检测网络训练系统,所述系统包括:
初始化单元,用于初始化分组比例K;
标注单元,用于采集拥有标注信息的训练数据,对训练数据标注信息回归框,训练数据包括:原始输入的图像以及其对应的标注信息,标注信息包括目标框及掩码;
分组单元,用于将目标掩码以分组比例K划分为partA和partB两部分;目标掩码为一张图像上所有的缺陷及各缺陷对应的掩码;
掩码单元,用于针对partA部分,结合目标掩码对应的目标掩码信息,将原始图像上对应的目标掩码区域掩码,针对partB部分,保留partB部分在原始图像上对应的全部标注信息,得到history图像;
训练单元,用于将history图像和原始图像输入待训练目标检测网络,原始图像经过目标检测网第一层之后获得到第一特征图,history图像经过目标检测网第一层之后得到第二特征图,将第一特征图与第二特征图相加后输入到目标检测网后续层进行相关计算训练目标检测网络。
本发明还提供了一种目标检测网络,所述目标检测网络用于对预设目标进行检测,所述目标检测网络采用所述目标检测网络训练方法训练获得。
本发明还提供了一种目标检测系统,所述系统包括:
采集器,用于采集待检测图像;
处理器,所述处理器用于运行目标检测网络或模型,所述目标检测网络或模型用于对待检测图像进行目标检测,并输出目标检测结果,所述目标检测网络或模型采用所述目标检测网络训练方法训练获得。
本发明还提供了一种目标检测网络训练装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述目标检测网络训练方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述目标检测网络训练方法的步骤。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于普通的基于深度学习的缺陷检测算法,在图像上存在重叠目标时,往往只会检测到这组重叠目标上层的缺陷,而漏检下层的缺陷。因为在模型训练过程中,算法更加倾向于学习更为明显的缺陷特征,而忽略掉一些细节的缺陷特征,而在重叠缺陷目标中,被覆盖的缺陷的显著特征会被其他的缺陷所覆盖而失去缺陷图像信息,导致模型对被覆盖的缺陷的识别效果不佳。本发明通过利用目标轮廓mask增强重叠目标检测的训练方法,在学习过程中能更好的关注被覆盖缺陷的图像信息,可以有效提升数据中存在的高度重叠目标、边界目标的识别和分类。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1为本发明中一种目标检测网络训练方法的流程示意图;
图2为原始图像以及groundtruth信息示意图;
图3为利用Seg进行mask后的图像及标注信息示意图;
图4是本发明中目标检测网络训练系统示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
请参考图1-图3,图1为本发明中一种目标检测网络训练方法的流程示意图,图2为原始图像以及groundtruth信息示意图,图3为利用Seg进行mask后的图像及标注信息示意图,其中,Seg为SegNet图像分割网络,所述方法包括:
初始化分组比例K;
采集拥有标注信息的训练数据,对训练数据标注信息回归框;
将目标掩码以分组比例K划分为partA和partB两部分;
针对partA部分,结合目标掩码对应的目标掩码信息,将原始图像上对应的目标掩码区域掩码,针对partB部分,保留partB部分在原始图像上对应的全部标注信息,获得history图像;
将history图像和原始图像输入待训练目标检测网络,原始图像经过目标检测网第一层之后得到第一特征图,history图像经过目标检测网第一层之后得到第二特征图,将第一特征图与第二特征图相加后输入到目标检测网后续层进行相关计算训练目标检测网络。
其中,在具体实施的过程中,本发明可以采用以下步骤进行实现:
步骤1:初始化一个分组比例,此比例可以为1:1,以便用于在步骤二中均衡地划分partA和partB组内元素数量;在实际的应用中分组比例也可以为其他比例,本发明实施例不对具体的分组比例进行限制;
步骤2:对于一张拥有标注信息的训练数据,首先对其标注信息回归框,目标掩码以初始化的分组比例进行随机的筛选,筛选出partA和partB两部分,此目的在于在步骤3,4中针对两个部分分别进行各自的处理;
步骤3:针对partA部分,结合其对应的缺陷目标掩码信息,标掩码信息指的标注文件中所指出的缺陷在图像上所占像素,在原始图像上对应的目标掩码区域进行掩码操作,即将在输入图像partA部分掩码所覆盖的像素置为0。并在原始groundtruth的回归框和目标掩码部分去掉partA部分的标注信息,以便于神经网络能学习到被遮挡缺陷的图像特征信息;原始图像为未经过图像处理的图像,输入图像为原始图像经过图像预处理之后,输入进神经网络的图像;图像标注信息包含图像上的目标掩码和目标回归框;
步骤4:针对partB部分,保留partB全部标注信息,即为网络此轮训练所要学习的目标。
步骤5:partA进行掩码之后的图像作为history信息。只保留partB部分的回归框,掩码信息作为groundtruth,并将partB输入到任何所选择的目标检测网络。
步骤6:在网络的第一层之后,将原始图像经过了卷积网络第一层之后的特征图,与同样经过卷积网络第一层后的history图像所得到的特征图进行按位相加操作,得到的特征图再连接到后续的卷积神经网络中进行网络原有的计算,如神经网络中的卷积,标准化,激活,池化等计算。
其中,本实施例中的方法通过利用目标轮廓mask增强重叠目标检测的训练方法,可以有效提升数据中存在的高度重叠目标、边界目标的识别和分类。
实施例二
请参考图4,本发明实施例二提供了一种目标检测网络训练系统,所述系统包括:
初始化单元,用于初始化分组比例K;
标注单元,用于采集拥有标注信息的训练数据,对训练数据标注信息回归框;
分组单元,用于将目标掩码以分组比例K划分为partA和partB两部分;
掩码单元,用于针对partA部分,结合目标掩码对应的目标掩码信息,将原始图像上对应的目标掩码区域掩码,针对partB部分,保留partB部分在原始图像上对应的全部标注信息,获得history图像;
训练单元,用于将history图像和原始图像输入待训练目标检测网络,原始图像经过目标检测网第一层之后得到第一特征图,history图像经过目标检测网第一层之后得到第二特征图,将第一特征图与第二特征图相加后输入到目标检测网后续层进行相关计算训练目标检测网络。
实施例三
本发明实施例三提供了一种目标检测网络或模型,所述目标检测网络或模型用于对预设目标进行检测,所述目标检测网络或模型采用所述目标检测网络训练方法训练获得。
实施例四
本发明实施例四提供了一种目标检测系统,所述系统包括:
采集器,用于采集待检测图像;
处理器,所述处理器用于运行目标检测网络或模型,所述目标检测网络或模型用于对待检测图像进行目标检测,并输出目标检测结果,所述目标检测网络或模型采用所述目标检测网络训练方法训练获得。
实施例五
本发明实施例五提供了一种目标检测网络训练装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述目标检测网络训练方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述目标检测网络训练方法的步骤。
所述目标检测网络训练装置可以是桌上型计算机、笔记本、掌上电脑以及云端服务器等计算设备。所述装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述装置还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理器(CPU,Central Processing Unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路(ApplicationSpecific Integrated Circuit)、现成可编程门阵列(Fieldprogrammable gate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述目标检测网络训练装置的控制中心,利用各种接口和线路连接整个装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现所述目标检测网络训练装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述目标检测网络训练装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。