CN109325538B - 目标检测方法、装置和计算机可读存储介质 - Google Patents

目标检测方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN109325538B
CN109325538B CN201811143927.5A CN201811143927A CN109325538B CN 109325538 B CN109325538 B CN 109325538B CN 201811143927 A CN201811143927 A CN 201811143927A CN 109325538 B CN109325538 B CN 109325538B
Authority
CN
China
Prior art keywords
target
target detection
picture
detected
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811143927.5A
Other languages
English (en)
Other versions
CN109325538A (zh
Inventor
叶韵
吕晓磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201811143927.5A priority Critical patent/CN109325538B/zh
Publication of CN109325538A publication Critical patent/CN109325538A/zh
Application granted granted Critical
Publication of CN109325538B publication Critical patent/CN109325538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开涉及一种目标检测方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:识别训练样本图片中标注的目标的类别;根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入标注的类别对应的目标检测子网络,以对目标检测模型进行训练,目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络;将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。本公开能够融合不同标签的训练样本,在训练样本标注不完备的情况下,实现多目标的目标检测模型的训练,提高目标检测的准确性。

Description

目标检测方法、装置和计算机可读存储介质
技术领域
本公开涉及计算机技术领域,特别涉及一种目标检测方法、装置和计算机可读存储介质。
背景技术
目标检测是计算机视觉中的基本任务之一,通过机器学习模型判断图像中是否有某类物体,及该物体的位置。
目前的一些目标检测算法,可以对一副图像输出多个类别的目标识别结果。针对这种多类别的目标检测算法,需要对训练样本图片中存在的所有的类别的目标进行标注。
发明内容
发明人发现:现有目标检测算法都对训练数据有很高要求,需要大量的标注。而实际问题中,训练数据的获取往往是最困难的,一个常见的状况是,训练数据集往往都是部分标注的,存在交集,但是没有足够的完整标注的训练数据。例如服饰检测中,有的训练数据集只标注了衣服和裤子,而有的训练数据集只标注了鞋子和配饰,而出现鞋子和配饰的图片中衣服裤子部分则没有标注,同样道理,标注了衣服裤子的图片中,人物可能也带着配饰,而这些配饰都没有标注,直接训练会导致目标检测模型难以收敛。
本公开所要解决的一个技术问题是:如何在训练样本标注不完整的情况下,实现对目标检测模型的训练,从而实现对多目标的检测。
根据本公开的一些实施例,提供的一种目标检测方法,包括:识别训练样本图片中标注的目标的类别;根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入类别对应的目标检测子网络,以对目标检测模型进行训练,目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络;将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。
在一些实施例中,对目标检测模型进行训练包括:根据训练样本图片中的标注信息和类别对应的目标检测子网络输出的训练样本图片的目标检测结果,对类别对应的目标检测子网络和特征提取子网络中的权重进行调整;直至各个类别对应的目标检测子网络输出的目标检测结果和训练样本图片中的标注信息的误差达到预设误差范围,得到训练完成的目标检测模型。
在一些实施例中,将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标包括:将待检测图片输入训练完成的目标检测模型的特征提取子网络,提取待检测图片的特征;将待检测图片的特征输入目标检测子网络;根据目标检测子网络的输出结果,确定待检测图片中的目标。
在一些实施例中,根据各个类别对应的目标检测子网络的输出结果,确定待检测图片中目标的位置和目标的类别包括:根据各个类别对应的目标检测子网络分别输出的待检测图片中属于本类别的目标的位置和目标所属类别为本类别的置信度,确定待检测图片中目标的位置和目标的类别。
在一些实施例中,在检测出待检测图片中多个类别目标的位置重合的情况下,根据多个目标所属类别的置信度,确定该位置的目标所属类别。
在一些实施例中,将待检测图片的特征输入目标检测子网络包括:在待检测图片被设置了待检测目标的情况下,将待检测图片的特征输入待检测目标所属类别对应的目标检测子网络中。
根据本公开的另一些实施例,提供的一种目标检测装置,包括:标注识别模块,用于识别训练样本图片中标注的目标的类别;训练模块,用于根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入类别对应的目标检测子网络,以对目标检测模型进行训练,目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络;目标检测模块,用于将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。
在一些实施例中,训练模块用于根据训练样本图片中的标注信息和类别对应的目标检测子网络输出的训练样本图片的目标检测结果,对类别对应的目标检测子网络和特征提取子网络中的权重进行调整;直至各个类别对应的目标检测子网络输出的目标检测结果和训练样本图片中的标注信息的误差达到预设误差范围,得到训练完成的目标检测模型。
在一些实施例中,目标检测模块用于将待检测图片输入训练完成的目标检测模型的特征提取子网络,提取待检测图片的特征;将待检测图片的特征输入目标检测子网络;根据目标检测子网络的输出结果,确定待检测图片中的目标。
在一些实施例中,目标检测模块用于根据各个类别对应的目标检测子网络分别输出的待检测图片中属于本类别的目标的位置和目标所属类别为本类别的置信度,确定待检测图片中目标的位置和目标的类别。
在一些实施例中,目标检测模块用于在检测出待检测图片中多个类别目标的位置重合的情况下,根据多个目标所属类别的置信度,确定该位置的目标所属类别。
在一些实施例中,目标检测模块用于在待检测图片被设置了待检测目标的情况下,将待检测图片的特征输入待检测目标所属类别对应的目标检测子网络中。
根据本公开的又一些实施例,提供的一种目标检测装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行如前述任意实施例的目标检测方法。
根据本公开的再一些实施例,提供的一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意实施例的目标检测方法。
本公开中目标检测模型包括特征提取子网络和多个类别对应的不同的目标检测子网络。根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入标注的类别对应的目标检测子网络,对目标检测模型进行训练。进而将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。本公开设计多个类别对应的目标检测子网络,分别负责识别不同类别的目标,在训练时根据训练样本的标注,对目标检测模型中相应的部分进行训练,而训练样本中没有标注的目标对应的目标检测子网络不会受到训练样本的干扰而造成无法收敛的问题。本公开能够融合不同标签的训练样本,在训练样本标注不完备的情况下,实现多目标的目标检测模型的训练,提高目标检测的准确性。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开的一些实施例的目标检测方法的流程示意图。
图2示出本公开的另一些实施例的目标检测方法的流程示意图。
图3示出本公开的一些实施例的目标检测装置的结构示意图。
图4示出本公开的另一些实施例的目标检测装置的结构示意图。
图5示出本公开的又一些实施例的目标检测装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开提供了一种目标检测方法,下面结合图1进行描述。
图1为本公开方法一些实施例的流程图。如图1所示,该实施例的方法包括:步骤S102~S106。
在步骤S102中,识别训练样本图片中标注的目标的类别。
不同的训练样本中可以只标注了部分类别的目标。可以识别已标注的图片中标注的目标的类别,在多张已标注的图片中存在类别相同的目标的情况下,将多张已标注的图片作为训练样本图片,组成训练样本集。可以根据实际需求选取训练样本组成训练样本集。训练样本集中各个训练样本图片标注的目标的类别的并集,作为目标检测模型最终可以检测的目标的类别。
例如,有些图片标注了帽子、衣服和裤子,有些图片标注了裤子和鞋,有些图片标注了帽子和鞋,这些图片组成的训练样本集对目标检测模型进行训练,则目标检测模型可以检测帽子、衣服、裤子和鞋。
在步骤S104中,根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入类别对应的目标检测子网络,以对目标检测模型进行训练。
目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络。可以每个类别对应一个目标检测子网络。也可根据训练样本图片中标注目标的类别的交集中包含最少类别的交集确定目标检测子网络。例如训练样本图片中标注目标的类别的交集包括{A、B},但不包括{A}或{B},即训练样本图片中标注的目标要么都包含A和B,要么就不包含A和B,不会只包含A或只包含B。这种情况下,可以设置{A、B}对应的目标检测子网络,即目标检测子网络可以检测A和B类别的目标。
特征提取子网络用于提取训练样本图片中的特征。目标检测子网络用于根据提取的特征识别训练样本图片中的目标。特征提取子网络和目标检测子网络可以参考现有的目标检测模型进行设置。例如,典型的YOLO(You Only Look Once,你只看一次)模型,可以由24个卷积层与2个全连接层构成。如果对YOLO进行改进,卷积层可以作为特征提取子网络,全连接层可以作为目标检测子网络,特征提取子网络与各个目标检测子网络进行串联,各个目标检测子网络之间是并联关系。同样的,针对目前常用的Faster RCNN(Regions withConvolutional Neural Network Feature,基于卷积神经网络特征的区域方法)等模型,也可以将其中特征提取的部分作为特征提取子网络,剩余部分作为目标检测子网络进行改进,在此不再赘述。也可以根据实际需求设置特征提取子网络和目标检测子网络。特征提取子网络可以包括卷积层或者特征提取子网络包括卷积层和全连接层。目标检测子网络包括全连接层或者目标检测子网络包括卷积层和全连接层。
可以在将训练样本图片输入目标检测模型之前,执行步骤S102,也可以在特征提取子网络输出训练样本图片的特征后执行步骤S102,从而根据训练样本图片的特征,输入标注的类别对应的目标检测子网络。训练样本图片标注了多个目标类别,则可以被输入多个类别对应的多个目标检测子网络。
在一些实施例中,根据训练样本图片中的标注信息和类别对应的目标检测子网络输出的训练样本图片的目标检测结果,对标注的类别对应的目标检测子网络和特征提取子网络中的权重进行调整;直至各个类别对应的目标检测子网络输出的目标检测结果和训练样本图片中的标注信息的误差达到预设误差范围,得到训练完成的目标检测模型。
训练样本图片中的标注信息例如为目标的位置信息(坐标等)和目标的类别。针对不同的目标检测模型训练样本图片中的标注信息可以不同。将一张训练样本图片输入目标检测模型,经过特征提取子网络输出该图片的特征信息,将该图片的特征信息输入标注的类别对应的目标检测子网络,则输出检测到的该图片中目标的位置信息和目标属于该类别的置信度。将目标检测子网络输出的信息与标注信息进行比对,设置损失函数,根据损失函数例如采用梯度下降算法,调整标注的类别对应的目标检测子网络和特征提取子网络中的各项权重,即卷积层、全连接层等中的权重,直至标注的类别对应的目标检测子网络输出的信息与标注信息的误差达到预设误差范围。对于训练样本图片中没有标注的目标的类别对应的目标检测子网络则不进行调整和计算。针对每一张训练样本图片可以采用上述过程对目标检测模型进行训练,直至完成所有训练样本对模型的训练。如果多张训练样本图片中标注了相同类别的目标,也可以将这些图片输入目标检测模型一起计算损失函数对模型进行调整和训练。具体的调整权重、设置损失函数等可以采用现有技术中的方法,在此不再赘述。
在步骤S106中,将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。
对待检测图片中检测目标的过程可以参考图2所示的实施例。如图2所示,步骤S106包括:步骤S1061~步骤S1063。
在步骤S1061中,将待检测图片输入训练完成的目标检测模型的特征提取子网络,提取待检测图片的特征。
在步骤S1062中,将待检测图片的特征输入目标检测子网络。
训练好的目标检测模型可以识别多个类别的目标,但是应用时也可以选择针对某一种或多种特定类别的目标进行检测。在待检测图片被设置了待检测目标的情况下,可以将待检测图片的特征输入待检测目标所属类别对应的目标检测子网络中。例如,想要识别待检测图片中是否包含帽子,则可以将待检测图片的特征输入帽子对应的目标检测子网络。这样不需要对所有类别的目标都进行识别,可以减少计算量,提高计算效率。可以根据实际需求配置待检测图片中待检测目标。
在步骤S1063中,根据目标检测子网络的输出结果,确定待检测图片中的目标。
在一些实施例中,根据各个类别对应的目标检测子网络分别输出的待检测图片中属于本类别的目标的位置和目标所属类别为本类别的置信度,确定待检测图片中目标的位置和目标的类别。例如,检测图片中是否存在裤子的目标检测子网络,可以输出待检测图片中裤子的位置,可以以边框(Bounding Box)的形式框出裤子,并且输出该位置为裤子的置信度即概率。
每个目标检测子网络都可以输出检测结果,在检测出待检测图片中多个类别目标的位置重合的情况下,可以根据多个目标所属类别的置信度,确定该位置的目标所属类别。即待检测图片中检测出多个类别的目标,并且多个类别的目标的位置重合度超过阈值,则认为一个位置被识别成多个类别的目标,在这种情况下,可以根据该位置对应的各个类别的置信度,选取置信度最高的一个类别作为该位置对应的目标的类别。例如,待检测图片中同一个位置被识别为上衣和裤子,则将该位置为上衣的概率与该位置为裤子的概率进行对比,则可以确定该位置的目标具体为上衣还是裤子。
上述实施例的方法中目标检测模型包括特征提取子网络和多个类别对应的不同的目标检测子网络。根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入标注的类别对应的目标检测子网络,对目标检测模型进行训练。进而将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。上述实施例的方法设计多个类别对应的目标检测子网络,分别负责识别不同类别的目标,在训练时根据训练样本的标注,对目标检测模型中相应的部分进行训练,而训练样本中没有标注的目标对应的目标检测子网络不会受到训练样本的干扰而造成无法收敛的问题。本公开能够融合不同标签的训练样本,在训练样本标注不完备的情况下,实现多目标的目标检测模型的训练,提高目标检测的准确性。
本公开提供一种目标检测装置,下面结合图3进行描述。
图3为本公开目标检测装置的一些实施例的结构图。如图3所示,该实施例的装置30包括:标注识别模块302,训练模块304,目标检测模块306。
标注识别模块302,用于识别训练样本图片中标注的目标的类别。
训练模块304,用于根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入标注的类别对应的目标检测子网络,以对目标检测模型进行训练,目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络。
在一些实施例中,训练模块302用于根据训练样本图片中的标注信息和标注的类别对应的目标检测子网络输出的训练样本图片的目标检测结果,对标注的类别对应的目标检测子网络和特征提取子网络中的权重进行调整;直至各个类别对应的目标检测子网络输出的目标检测结果和训练样本图片中的标注信息的误差达到预设误差范围,得到训练完成的目标检测模型。
目标检测模块306,用于将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。
在一些实施例中,目标检测模块306用于将待检测图片输入训练完成的目标检测模型的特征提取子网络,提取待检测图片的特征;将待检测图片的特征输入目标检测子网络;根据目标检测子网络的输出结果,确定待检测图片中的目标。
在一些实施例中,目标检测模块306用于根据各个类别对应的目标检测子网络分别输出的待检测图片中属于本类别的目标的位置和目标所属类别为本类别的置信度,确定待检测图片中目标的位置和目标的类别。
在一些实施例中,目标检测模块306用于在检测出待检测图片中多个类别目标的位置重合的情况下,根据多个目标所属类别的置信度,确定该位置的目标所属类别。
在一些实施例中,目标检测模块306用于在待检测图片被设置了待检测目标的情况下,将待检测图片的特征输入待检测目标所属类别对应的目标检测子网络中。
上述实施例的装置中目标检测模型包括特征提取子网络和多个类别对应的不同的目标检测子网络。训练模块根据训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的训练样本图片的特征,输入标注的类别对应的目标检测子网络,对目标检测模型进行训练。进而目标检测模块将待检测图片输入训练完成的目标检测模型,以检测出待检测图片中的目标。上述实施例的装置中设计多个类别对应的目标检测子网络,分别负责识别不同类别的目标,在训练时根据训练样本的标注,对目标检测模型中相应的部分进行训练,而训练样本中没有标注的目标对应的目标检测子网络不会受到训练样本的干扰而造成无法收敛的问题。上述实施例的装置能够融合不同标签的训练样本,在训练样本标注不完备的情况下,实现多目标的目标检测模型的训练,提高目标检测的准确性。
本公开的实施例中的目标检测装置可各由各种计算设备或计算机系统来实现,下面结合图4以及图5进行描述。
图4为本公开目标检测装置的一些实施例的结构图。如图4所示,该实施例的装置40包括:存储器410以及耦接至该存储器410的处理器420,处理器420被配置为基于存储在存储器410中的指令,执行本公开中任意一些实施例中的目标检测方法。
其中,存储器410例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图5为本公开目标检测装置的另一些实施例的结构图。如图5所示,该实施例的装置50包括:存储器510以及处理器520,分别与存储器410以及处理器420类似。还可以包括输入输出接口530、网络接口540、存储接口550等。这些接口530,540,550以及存储器510和处理器520之间例如可以通过总线560连接。其中,输入输出接口530为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口540为各种联网设备提供连接接口,例如可以连接到数据库服务器或者云端存储服务器等。存储接口550为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (12)

1.一种目标检测方法,包括:
识别训练样本图片中标注的目标的类别,其中,不同的训练样本中只标注了部分类别的目标;
根据所述训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的所述训练样本图片的特征,输入所述类别对应的目标检测子网络,以对所述目标检测模型进行训练,所述目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络,其中,根据训练样本图片中标注目标的类别的交集中包含最少类别的交集确定目标检测子网络对应的类别,至少一个目标检测子网络对应所述多个类别中的至少两个类别;
将待检测图片输入训练完成的所述目标检测模型,以检测出所述待检测图片中的目标;
其中,所述待检测图片中的目标包括:各个目标的位置和各个目标的所属类别的置信度;在检测出所述待检测图片中多个类别目标的位置重合的情况下,根据多个目标所属类别的置信度,确定该位置的目标所属类别。
2.根据权利要求1所述的目标检测方法,其中,
所述对所述目标检测模型进行训练包括:
根据所述训练样本图片中的标注信息和所述类别对应的目标检测子网络输出的所述训练样本图片的目标检测结果,对所述类别对应的目标检测子网络和所述特征提取子网络中的权重进行调整;
直至各个类别对应的目标检测子网络输出的目标检测结果和所述训练样本图片中的标注信息的误差达到预设误差范围,得到训练完成的目标检测模型。
3.根据权利要求1所述的目标检测方法,其中,
所述将待检测图片输入训练完成的所述目标检测模型,以检测出所述待检测图片中的目标包括:
将待检测图片输入训练完成的所述目标检测模型的特征提取子网络,提取所述待检测图片的特征;
将所述待检测图片的特征输入目标检测子网络;
根据目标检测子网络的输出结果,确定所述待检测图片中的目标。
4.根据权利要求3所述的目标检测方法,其中,
所述根据各个类别对应的目标检测子网络的输出结果,确定所述待检测图片中目标的位置和目标的类别包括:
根据各个类别对应的目标检测子网络分别输出的所述待检测图片中属于本类别的目标的位置和目标所属类别为本类别的置信度,确定所述待检测图片中目标的位置和目标的类别。
5.根据权利要求3所述的目标检测方法,其中,
所述将所述待检测图片的特征输入目标检测子网络包括:
在所述待检测图片被设置了待检测目标的情况下,将所述待检测图片的特征输入所述待检测目标所属类别对应的目标检测子网络中。
6.一种目标检测装置,包括:
标注识别模块,用于识别训练样本图片中标注的目标的类别,其中,不同的训练样本中只标注了部分类别的目标;
训练模块,用于根据所述训练样本图片中标注的目标的类别,将目标检测模型中特征提取子网络中输出的所述训练样本图片的特征,输入所述类别对应的目标检测子网络,以对所述目标检测模型进行训练,所述目标检测模型包括特征提取子网络和多个类别对应的不同目标检测子网络,其中,根据训练样本图片中标注目标的类别的交集中包含最少类别的交集确定目标检测子网络对应的类别,至少一个目标检测子网络对应所述多个类别中的至少两个类别;
目标检测模块,用于将待检测图片输入训练完成的所述目标检测模型,以检测出所述待检测图片中的目标;
其中,所述待检测图片中的目标包括:各个目标的位置和各个目标的所属类别的置信度,所述目标检测模块用于在检测出所述待检测图片中多个类别目标的位置重合的情况下,根据多个目标所属类别的置信度,确定该位置的目标所属类别。
7.根据权利要求6所述的目标检测装置,其中,
所述训练模块用于根据所述训练样本图片中的标注信息和所述类别对应的目标检测子网络输出的所述训练样本图片的目标检测结果,对所述类别对应的目标检测子网络和所述特征提取子网络中的权重进行调整;直至各个类别对应的目标检测子网络输出的目标检测结果和所述训练样本图片中的标注信息的误差达到预设误差范围,得到训练完成的目标检测模型。
8.根据权利要求6所述的目标检测装置,其中,
所述目标检测模块用于将待检测图片输入训练完成的所述目标检测模型的特征提取子网络,提取所述待检测图片的特征;将所述待检测图片的特征输入目标检测子网络;根据目标检测子网络的输出结果,确定所述待检测图片中的目标。
9.根据权利要求8所述的目标检测装置,其中,
所述目标检测模块用于根据各个类别对应的目标检测子网络分别输出的所述待检测图片中属于本类别的目标的位置和目标所属类别为本类别的置信度,确定所述待检测图片中目标的位置和目标的类别。
10.根据权利要求8所述的目标检测装置,其中,
所述目标检测模块用于在所述待检测图片被设置了待检测目标的情况下,将所述待检测图片的特征输入所述待检测目标所属类别对应的目标检测子网络中。
11.一种目标检测装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-5任一项所述的目标检测方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现权利要求1-5任一项所述方法的步骤。
CN201811143927.5A 2018-09-29 2018-09-29 目标检测方法、装置和计算机可读存储介质 Active CN109325538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811143927.5A CN109325538B (zh) 2018-09-29 2018-09-29 目标检测方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811143927.5A CN109325538B (zh) 2018-09-29 2018-09-29 目标检测方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109325538A CN109325538A (zh) 2019-02-12
CN109325538B true CN109325538B (zh) 2020-12-22

Family

ID=65265087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811143927.5A Active CN109325538B (zh) 2018-09-29 2018-09-29 目标检测方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109325538B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113575A (zh) * 2019-05-14 2019-08-09 嘉应学院 一种基于NB-IoT的农情信息实时监测平台
CN110516090A (zh) * 2019-08-09 2019-11-29 广东浪潮大数据研究有限公司 一种物体检测方法、装置、设备及计算机可读存储介质
CN110472737B (zh) * 2019-08-15 2023-11-17 腾讯医疗健康(深圳)有限公司 神经网络模型的训练方法、装置和医学图像处理系统
CN111178202B (zh) * 2019-12-20 2024-03-22 西安天和防务技术股份有限公司 目标检测方法、装置、计算机设备和存储介质
CN111191606A (zh) * 2019-12-31 2020-05-22 Oppo广东移动通信有限公司 图像处理方法及相关产品
CN111767802B (zh) * 2020-06-05 2024-02-06 京东科技控股股份有限公司 一种对象异常状态的检测方法和装置
CN112734693B (zh) * 2020-12-18 2024-06-07 平安科技(深圳)有限公司 一种管道焊缝缺陷检测方法及相关装置
CN112598081A (zh) * 2020-12-31 2021-04-02 广州文远知行科技有限公司 一种目标检测方法、装置、设备和计算机可读存储介质
CN112801237B (zh) * 2021-04-15 2021-07-23 北京远鉴信息技术有限公司 暴恐内容识别模型的训练方法、训练装置及可读存储介质
CN113449781B (zh) * 2021-06-17 2023-04-07 上海深至信息科技有限公司 一种甲状腺结节分类模型的生成方法及系统
CN114445340A (zh) * 2021-12-24 2022-05-06 南京紫津融畅信息科技服务有限公司 一种钱捆检测方法、入库方法及相关装置
CN117083621A (zh) * 2022-02-25 2023-11-17 京东方科技集团股份有限公司 检测器训练方法、装置及存储介质
CN115100419B (zh) * 2022-07-20 2023-02-21 中国科学院自动化研究所 目标检测方法、装置、电子设备及存储介质
CN116246128B (zh) * 2023-02-28 2023-10-27 深圳市锐明像素科技有限公司 跨数据集的检测模型的训练方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178773A (zh) * 2007-12-13 2008-05-14 北京中星微电子有限公司 基于特征提取和分类器的图像识别系统及方法
CN104281843A (zh) * 2014-10-20 2015-01-14 上海电机学院 基于自适应特征和分类模型选择的图像识别方法及系统
CN106557778A (zh) * 2016-06-17 2017-04-05 北京市商汤科技开发有限公司 通用物体检测方法和装置、数据处理装置和终端设备
CN108052894A (zh) * 2017-12-11 2018-05-18 北京飞搜科技有限公司 一种目标对象的多属性识别方法、设备、介质及神经网络

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11176423B2 (en) * 2016-10-24 2021-11-16 International Business Machines Corporation Edge-based adaptive machine learning for object recognition
US20180189228A1 (en) * 2017-01-04 2018-07-05 Qualcomm Incorporated Guided machine-learning training using a third party cloud-based system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178773A (zh) * 2007-12-13 2008-05-14 北京中星微电子有限公司 基于特征提取和分类器的图像识别系统及方法
CN104281843A (zh) * 2014-10-20 2015-01-14 上海电机学院 基于自适应特征和分类模型选择的图像识别方法及系统
CN106557778A (zh) * 2016-06-17 2017-04-05 北京市商汤科技开发有限公司 通用物体检测方法和装置、数据处理装置和终端设备
CN108052894A (zh) * 2017-12-11 2018-05-18 北京飞搜科技有限公司 一种目标对象的多属性识别方法、设备、介质及神经网络

Also Published As

Publication number Publication date
CN109325538A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
CN109325538B (zh) 目标检测方法、装置和计算机可读存储介质
KR102138082B1 (ko) 다수의 이미지 일치성을 바탕으로 보험클레임 사기 방지를 실현하는 방법, 시스템, 기기 및 판독 가능 저장매체
CN109145766B (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
CN105975913B (zh) 一种基于自适应聚类学习的道路网提取的方法
CN111783505A (zh) 伪造人脸的识别方法、装置和计算机可读存储介质
KR101836811B1 (ko) 이미지 상호간의 매칭을 판단하는 방법, 장치 및 컴퓨터 프로그램
CN108256454B (zh) 一种基于cnn模型的训练方法、人脸姿态估测方法及装置
CN111738252B (zh) 图像中的文本行检测方法、装置及计算机系统
CN112966618B (zh) 着装识别方法、装置、设备及计算机可读介质
CN116168351B (zh) 电力设备巡检方法及装置
US20210374455A1 (en) Utilizing machine learning and image filtering techniques to detect and analyze handwritten text
CN113282215A (zh) 一种rpa系统中基于目标检测技术的ui元素拾取方法和系统
CN110175500B (zh) 指静脉比对方法、装置、计算机设备及存储介质
CN111783812A (zh) 违禁图像识别方法、装置和计算机可读存储介质
CN111461143A (zh) 一种图片翻拍识别方法和装置及电子设备
CN113762049B (zh) 内容识别方法、装置、存储介质和终端设备
CN111680635B (zh) 一种文本识别的方法、装置、电子设备和存储介质
CN112529218A (zh) 一种基于关联分析的建筑物安全检测方法及系统
CN112686122A (zh) 人体及影子的检测方法、装置、电子设备、存储介质
CN111753618A (zh) 图像识别方法、装置、计算机设备及计算机可读存储介质
CN113705559B (zh) 基于人工智能的文字识别方法及装置、电子设备
CN115116073A (zh) 洗涤标签识别方法、装置、存储介质及电子装置
CN116935010A (zh) 一种标注内外墙的方法、装置、设备及可读存储介质
CN114153730A (zh) 埋点配置页面生成方法及相关设备
CN113903025A (zh) 场景文本检测方法、装置和模型及其训练方法和训练装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant