CN112598081A - 一种目标检测方法、装置、设备和计算机可读存储介质 - Google Patents

一种目标检测方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN112598081A
CN112598081A CN202011643200.0A CN202011643200A CN112598081A CN 112598081 A CN112598081 A CN 112598081A CN 202011643200 A CN202011643200 A CN 202011643200A CN 112598081 A CN112598081 A CN 112598081A
Authority
CN
China
Prior art keywords
data
target
target detection
detected
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011643200.0A
Other languages
English (en)
Inventor
何钦尧
郭湘
韩文韬
吴子豪
韩旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Weride Technology Co Ltd
Original Assignee
Guangzhou Weride Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Weride Technology Co Ltd filed Critical Guangzhou Weride Technology Co Ltd
Priority to CN202011643200.0A priority Critical patent/CN112598081A/zh
Publication of CN112598081A publication Critical patent/CN112598081A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种目标检测方法、装置、设备和计算机可读存储介质,其中方法包括:响应于目标检测请求,获取待检测数据;将所述待检测数据同时输入至多个目标检测模型,获取各所述目标检测模型对所述待检测数据的检测结果,其中,多个所述目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,所述目标检测模型的模型数量与所述训练数据的目标类别数量相同;合并所有所述检测结果,获取所述待检测数据的目标检测结果。解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。

Description

一种目标检测方法、装置、设备和计算机可读存储介质
技术领域
本申请涉及目标检测领域,尤其涉及一种目标检测方法、装置、设备和计算机可读存储介质。
背景技术
随着计算机技术的发展,计算机视觉的研究得到了越来越多的关注,例如图像分类、目标检测和目标追踪等。其中,目标检测可以将检测数据中的感兴趣目标与不感兴趣的部分区分开,以对目标进行针对性处理,在安全领域、军事领域、交通领域和医疗领域有广泛的应用前景。
以智能驾驶为例,目标检测技术作为智能驾驶的基础,其的准确性直接影响到智能驾驶的安全性和可靠性。然而,现有的目标检测方法检测时效果有限,准确度较低。
发明内容
本申请提供了一种目标检测方法、装置、设备和计算机可读存储介质,解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
有鉴于此,本申请第一方面提供了一种目标检测方法,包括:
响应于目标检测请求,获取待检测数据;
将所述待检测数据同时输入至多个目标检测模型,获取各所述目标检测模型对所述待检测数据的检测结果,其中,多个所述目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,所述目标检测模型的模型数量与所述训练数据的目标类别数量相同;
合并所有所述检测结果,获取所述待检测数据的目标检测结果。
可选地,所述训练数据中的子集包括:原始子集和新增子集,所述原始子集和所述新增子集的目标类别不同。
可选地,多个所述目标检测模型是根据训练数据中的多个子集配置,具体包括:
获取所述训练数据中子集对应的子集数据;
根据所述子集数据,更新对应的所述目标检测模型的权重,以配置对应的目标检测模型。
可选地,根据所述子集数据,更新对应的所述目标检测模型的权重,以配置对应的目标检测模型,具体包括:
将所述子集数据单独输入至各所述目标检测模型;
根据各所述目标检测模型中输入的所述子集数据,更新该目标检测模型的权重,以配置对应的目标检测模型。
可选地,当所述待检测数据为待检测图像数据,所述方法还包括:
根据所述目标检测结果,对所述待检测图像数据的特征图像进行裁剪,得到所述待检测图像数据的目标特征。
可选地,所述方法还包括:
根据所述目标特征和预设分类模型,得到所述待检测图像数据的目标分类结果。
可选地,当所述待检测数据为待检测图像数据,且所述待检测图像数据为原始图像的特征图像数据时,所述方法还包括:
根据所述目标检测结果,对所述待检测图像数据进行裁剪得到目标特征。
可选地,所述方法还包括:
根据所述目标特征和预设分类模型,得到所述待检测图像数据的目标分类结果。
可选地,所述方法还包括:
根据所述目标特征,对所述待检测图像数据中所述目标特征对应的目标检测框进行边框回归。
可选地,多个所述目标检测模型集成于一个网络中。
本申请第二方面提供了一种目标检测装置,包括:
第一获取单元,用于响应于目标检测请求,获取待检测图像数据;
第二获取单元,用于将所述待检测数据同时输入至多个目标检测模型,获取各所述目标检测模型对所述待检测数据的检测结果,其中多个所述目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,所述目标检测模型的模型数量与所述训练数据的目标类别数量相同;
第三获取单元,用于根据所有所述检测结果,获取所述待检测数据的目标检测结果。
本申请第三方面提供了一种目标检测设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所述的目标检测方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的目标检测方法。
从以上技术方法可以看出,本申请具有以下优点:
本申请中响应于目标检测请求,获取待检测数据,由于多个目标检测模是根据训练数据中的多个子集配置的,且对应的一个子集是一个目标类别,即配置得到的多个目标检测模型各自对应的目标类别不相同,如此当将待检测数据同时输入至多个目标检测模型后,便可获取到多个目标检测模型各自输出的检测结果,接着合并所有的检测结果便可获取到待检测数据的目标检测结果,本申请根据不同目标类别的多个目标检测模型对检测数据的检测结果,确定目标检测结果,相较于现有单一地通过一个目标检测模型进行目标检测的方式,准确率更高,从而解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方法,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例中一种目标检测方法的实施例一的流程示意图;
图2为本申请实施例中目标检测模型的配置过程的流程示意图;
图3为本申请实施例中一种目标检测方法的实施例三的流程示意图;
图4为本申请实施例中一种目标检测方法的实施例四中的网络结构示意图;
图5为本申请实施例中一种目标检测装置的实施例的结构示意图。
具体实施方式
本申请实施例提供了一种目标检测方法、装置、设备和计算机可读存储介质,解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
为了使本技术领域的人员更好地理解本申请方法,下面将结合本申请实施例中的附图,对本申请实施例中的技术方法进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以便于理解,请参阅图1,图1为本申请实施例中一种目标检测方法的实施例一的流程示意图。
本实施例中的一种目标检测方法,包括:
步骤101、响应于目标检测请求,获取待检测数据。
在进行目标检测时,首先响应于目标检测请求,获取待检测数据。其中,待检测数据的数据类型可以为多种,例如,声音数据、图像数据、视频数据、激光点云数据等,本领域技术人员可以根据自己的检测需求进行配置。相应地,不同数据类型的待检测数据的采集或获取,可以根据待检测数据的类型配置,例如声音数据是通过麦克风采集、图片数据是通过照相机等,本领域技术人员可以根据需要进行设置,在此不再一一赘述。
步骤102、将待检测数据同时输入至多个目标检测模型,获取各目标检测模型对待检测数据的检测结果,其中,多个目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,目标检测模型的模型数量与训练数据的目标类别数量相同目标类别。
本实施例中的多个目标检测模型是根据训练数据中的多个子集配置的,且同一子集中的子集数据为同一目标类别,一个子集对应的是一个目标类别,对应根据子集配置的目标检测模型,也是一个目标检测模型对应一个目标类别。如此,当获取到待检测数据后,将待检测数据同时输入至多个目标检测模型,便可得到各目标检测模型对待检测数据的检测结果。
可以理解的是,目标检测模型的目的是为了将待检测数据中的前景(障碍物)和背景区分开,目标类别即该目标检测模型的关注的前景,此时,当将待检测数据输入至不同目标类别的目标检测模型后,各目标检测模型输出对应的前景。例如,待检测数据标注有很多信息,如小车、大车、自行车,将待检测数据同时输入至只检测小车的小车目标检测模型、只检测大车的大车目标检测模型、只检测自行车的自行车目标检测模型来区分前景和背景,小车目标检测模型的检测结果为待检测数据中的小车、大车目标检测模型的检测结果为待检测数据中的大车、自行车目标检测模型的检测结果为待检测数据中的自行车。
当待检测数据为其他数据类型的数据时,目标检测模型的目标类别可以根据待检测数据的数据类型和检测需求进行设置,在此不再详述。
在一种实施方式中,多个目标检测模型集成于一个网络中,即各目标检测模型是该网络中的不同子网络,当网络接收到待检测数据时,将待检测数据输入至该网络的不同子网络中进行目标检测,各子网络输出对应的检测结果。
在另一种实施方式中,多个目标检测模型也可以是同时对应不同的网络,获取到待检测数据后,将待检测数据同时输入至不同的网络,进行对应的目标检测。
可以理解的是,多个为两个以上,具体的数量本领域技术人员可以根据对待检测数据的分析需求进行设置,在此不再一一限定和赘述。
步骤103、合并所有检测结果,获取待检测数据的目标检测结果。
获取到各目标检测模型对待检测数据各自输出的检测结果后,便可以合并所有的检测结果,确定待检测数据的目标检测结果。
在一种实施方式中,合并所有的检测结果,得到待检测数据的目标检测结果的具体合并方式可以是,对所有检测结果进行求和运算,例如当对图片数据的检测结果为小车、汽车、自行车时,此时该图片的目标检测结果为小车+汽车+自行车。
可以理解的是,在另一种实施方式中,检测结果的合并方式还可以是筛选合并,即包括:
步骤1031、获取各检测结果对应的匹配度,匹配度为该检测结果与目标检测模型目标类别的匹配度。
步骤1032、根据匹配度,对检测结果进行筛选后,对筛选出的检测结果进行求和运算。
即根据各检测结果与目标检测模型目标类别的匹配度对检测结果进行筛选后再进行。例如图片数据的检测结果为小车、汽车、自行车,同时各自对应的匹配度为95%、85%和98%,此时将小于90%的匹配度的检测结果剔除后,此时该图片的目标检测结果为汽车+自行车。
本申请中响应于目标检测请求,获取待检测数据,由于多个目标检测模是根据训练数据中的多个子集配置的,且对应的一个子集是一个目标类别,即配置得到的多个目标检测模型各自对应的目标类别不相同,如此当将待检测数据同时输入至多个目标检测模型后,便可获取到多个目标检测模型各自输出的检测结果,接着合并所有的检测结果便可获取到待检测数据的目标检测结果,本申请根据不同目标类别的多个目标检测模型对检测数据的检测结果,确定目标检测结果,相较于现有单一地通过一个目标检测模型进行目标检测的方式,准确率更高,从而解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
以上为本申请实施例提供的一种目标检测方法的实施例一,以下为本申请实施例提供的一种目标检测方法的实施例二,实施例二在实施例一的基础上,对多个目标检测模型的配置过程进行详细说明。
请参阅图2,图2为本申请实施例中目标检测模型的配置过程的流程示意图。
本实施例中的多个目标检测模型是根据训练数据中的多个子集配置,具体包括:
步骤201、获取训练数据中子集对应的子集数据。
由于训练数据中的一个子集对应一个目标类别,且目标检测模型的模型数量与训练数据的目标数量相同,即一个子集对应配置一个目标检测模型。故本实施例中获取训练数据中子集对应的子集数据。例如,训练数据中包括小车子集、大车子集和自行车子集,对应的子集数据为小车子集数据、大车子集数据和自行车子集数据。
可以理解的是,训练数据中有多个子集,对应的在子集中有多个子集数据,因此获取子集数据可以是随机选取一个子集,然后在该子集中随机选取一个子集数据。需要说明的是,上述子集数据的获取方式本领域技术人员还可以设置为其他的方式,在此不再一一限定和赘述。
步骤202、根据子集数据,更新对应的目标检测模型的权重,以配置对应的目标检测模型。
在一种实施方式中,根据子集数据,更新对应的目标检测模型的权重,以配置对应的目标检测模型,具体包括:
步骤2021、将子集数据单独输入至各目标检测模型;
步骤2022、根据各目标检测模型中输入的子集数据,更新该目标检测模型的权重,以配置对应的目标检测模型。
在一种实施方式下,可依次选取各目标检测模型对应的子集数据,输入至对应的目标检测模型中,以此更新该目标检测模型的权重。可以理解的是,在另一种实施方式中,任意选择子集数据输入至各目标检测模型,目标检测模型判断输入的子集数据是否对应检测对象,如符合,则更新该目标检测模型的权重。如不符合,则保持当前目标检测模型的权重不变。
本实施例中,同一子集中的子集数据对应一种目标类别,在获取子集数据后,根据子集数据便可更新对应的目标检测模型的权重,从而训练对应的目标检测模型。例如通过小车子集数据更新小车目标检测模型的权重,通过大车子集数据更新大车目标检测模型的权重,通过自行车子集数据更新自行车目标检测模型的权重,最终得到配置好的小车目标检测模型、大车目标检测模型和自行车目标检测模型。
可以理解的是,在一种实施方式中,多个目标检测模型集成于一个网络中,该网络获取到某一目标类别的子集数据后,将该子集数据只输入至该网络中对应目标类别的目标检测模型中,对目标检测模型进行配置,忽略其他的目标检测模型。在另一种实施方式中,多个目标检测模型分别对应不同的网络时,将子集数据输入至不同的网络,且同时在梯度更新阶段更新该网络的权重。
可以理解的是,多个子集可以构成一个混合数据集,在对多个目标检测模型进行配置时,对混合数据集中的数据使用随机抽样,确保每个子集和每个目标检测模型都会得到均匀的训练。
对于目标检测而言,需要在每一张图片中对于所有关心的物体类型都进行标注。如果在图片中有某一种类型的物体没有被标注,则在训练时会被当做背景,如此对模型的训练是有害的。目标检测模型是用于判断前景和背景的关键。现有技术中由于不同数据集对前景和背景的判断不同(标注类别不一致),一个数据集的前景可能就是另一个数据集的背景,如果要新增一个目标类别的检测,则必须对所有原有数据里面可能存在的该目标类别补上标注,例如数据集M中的数据的已有标注为:小车、大车和自行车,对应的目标类别也即小车、大车和自行车,此时若要新增一个三轮车的类别,则需要对数据集中所有可能存在的三轮车补加标注,然后根据补标注后的数据训练目标检测模型,才可以得到目标类别为:小车、大车、自行车和三轮车的目标检测模型,工作量大、繁琐,给目标检测模型的配置带来了困难和不一致性。
而本实施例中训练数据的子集包括:原始子集和新增子集,且原始子集和新增子集的目标类别不同,对应的各子集配置其对应目标类别的目标检测模型,即利用新增子集中的子集数据可以训练新的目标检测模型,原始子集训练得到原始的目标检测模型。如此,当需要新增一个目标类别的检测时,只需要增加一个对应目标类别的新增子集即可,接着根据该新增子集配置新的目标检测模型。
例如,训练数据为A中的原始子集为小车子集、大车子集和自行车子集,对应的子集数据为小车子集数据、大车子集数据和自行车子集数据,各子集对应配置的目标检测模型(即此时训练数据A对应目标检测模型)的目标类别是小车、大车和自行车,此时若要增加目标类别三轮车,只需要在训练数据A中新增一个三轮车子集,然后利用该三轮车子集中的三轮车子集数据来训练对应的三轮车目标检测模型即可,此时训练数据A对应的目标检测模型的目标类别同样为:小车、大车、自行车和三轮车。上述的过程不再重新对A中的原始子集的子集数据补标注(A中可能会有三轮车的情形),再通过补标注后的A训练模型。本实施例中在新增目标类别时,只需要利用新增的目标类别的子集数据配置对应的目标检测模型,相较于现有的训练方式,训练更简单、便捷。
以上为本申请实施例提供的一种目标检测方法的实施例二,以下为本申请实施例提供的一种目标检测方法的实施例三,实施例三以待检测数据为待检测图像数据为例对目标检测方法的具体实现进行详细说明。
请参阅图3,图3为本申请实施例中一种目标检测方法的实施例三的流程示意图。
本实施例中的一种目标检测方法,包括:
步骤301、响应于目标检测请求,获取待检测图像数据。
需要说明的是,步骤301与实施例一中步骤101的描述相似,具体可以参见上述步骤101的描述,在此不再赘述。
步骤302、将待检测数据同时输入至多个目标检测模型,获取各目标检测模型对待检测数据的检测结果,其中,多个目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,目标检测模型的模型数量与训练数据的目标类别数量相同。
需要说明的是,步骤302与实施例一中步骤102的描述相似,具体可以参见上述步骤102的描述,在此不再赘述。
步骤303、合并所有检测结果,获取待检测数据的目标检测结果。
需要说明的是,步骤303与实施例一中步骤103的描述相似,具体可以参见上述步骤103的描述,在此不再赘述。
步骤304、根据目标检测结果,对待检测图像数据的特征图像进行裁剪,得到待检测图像数据的目标特征。
可以理解的是,在一种实施方式中,待检测图像数据为原始图像数据,在得到待检测图像数据的目标检测结果后,根据目标检测结果,对待检测图像数据的特征图像进行裁剪,得到待检测图像数据的目标特征,具体包括:
步骤3041、对待检测图像数据进行特征提取,得到特征图像。
可以理解的是,待检测图像数据为原始图像数据时,要获取到目标特征,首先需要对待检测图像数据进行特征提取,得到待检测图像数据的特征图像。具体地特征提取方法本领域技术人员可以根据需要进行选择,在此不做限定和赘述。
步骤3042、根据目标检测结果,对特征图像进行裁剪得到目标特征。
可以理解的是,在获取到目标检测结果后,根据目标检测结果对提取到的特征图像进行裁剪即可得到目标特征。
可以理解的是,在另一种实施方式中,待检测图像数据为原始图像的特征图像,根据目标检测结果,对待检测图像数据的特征图像进行裁剪,得到待检测图像数据的目标特征,具体包括:
根据目标检测结果,对待检测图像数据进行裁剪得到目标特征。
由于此时的待检测数据为原始图像的特征图像,在获取目标特征时,无需再进行待检测图像的特征图像,直接对待检测图像数据进行裁剪便可得到目标特征。
步骤305、根据目标特征和预设分类模型,得到待检测图像数据的目标分类结果。
在得到目标特征以后,便可以根据目标特征和预设分类模型得到待检测图像数据的目标分类结果。需要说明的是,预设分类模型可以是多种类型的模型结构,只要能够实现目标分类即可,本领域技术人员可以根据需要设置,在此不做具体限定。
步骤306、根据目标特征,对待检测图像数据中目标特征对应的目标检测框进行边框回归。
边框回归的目的是利用映射关系使得候选目标框的映射目标框无限接近于真实目标框,从而使得目标定位更准确。故本实施例中根据目标特征,还可以对待检测图像数据中目标特征对应的目标检测框进行边框回归,以更准确地对目标进行定位等。
可以理解的是,本实施例中的待检测图像数据的目标检测方法仅仅是一种示意性的举例说明,本领域技术人员可以将上述的方法根据使用需求进行适应性改动后应用于待检测激光点云数据、待检测声音数据等。
本实施例中响应于目标检测请求,获取待检测数据,由于多个目标检测模是根据训练数据中的多个子集配置的,且对应的一个子集是一个目标类别,即配置得到的多个目标检测模型各自对应的目标类别不相同,如此当将待检测数据同时输入至多个目标检测模型后,便可获取到多个目标检测模型各自输出的检测结果,接着合并所有的检测结果便可获取到待检测数据的目标检测结果,本申请根据不同目标类别的多个目标检测模型对检测数据的检测结果,确定目标检测结果,相较于现有单一地通过一个目标检测模型进行目标检测的方式,准确率更高,从而解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
以上为本申请实施例提供的一种目标检测方法的实施例三,以下为本申请实施例提供的一种目标检测方法的实施例四。
首先对本实施例中目标检测方法使用到的网络模型结构进行说明,如图4所示为本实施例中的目标检测方法对应的网络结构,包括:主干网络、目标检测模型、区域合并模块、特征区域裁剪模块和分类回归模块,下面以待检测图像数据为例对网络模型结构的各部分说明如下:
主干网络,用于对待检测图像数据进行特征提取。输入图片为一个4阶张量,各维度的大小分别为(图片总数、高度、宽度和颜色三通道),主干网络使用多层卷积神经网络结构。
目标检测模型,用于在整张图片中初步估计目标区域(即前景),将目标区域和背景做出区分。本实施例中的多个目标检测模型集成于主干网络上。目标检测模型对应的网络为全卷积结构,在每一个位置上对预定义的锚框进行是否为背景的预测。
区域合并模块,用于将每个目标检测模型的检测结果进行合并。
特征区域裁剪模块,用于根据区域合并模块得到的结果,在主干网络提取出的特征图像中裁剪、缩放得到目标特征。
分类回归模块,用于对上一步裁剪取得的目标特征,进行进一步的细分类和边框回归。
利用上述的网络模型结构进行目标检测时,主要包括两个阶段,训练阶段和应用阶段,分别为:
首先假设不同的数据集(即子集)为Di,1≤i≤N,同样构建N个独立的目标检测模型RPNi。在目标检测模型RPNi的后端接入区域合并模块,用于将多个RPNi的检测结果pi进行合并。
训练阶段:随机选取数据集Di,并从中获取一个批次的数据xi,在主干网络之后,进入对应的RPNi,忽略其余的目标检测模型。区域合并模块仅接收一个输入,因此不需要合并。在该步前向计算完成做梯度更新时,也只更新该步使用的目标检测模型RPNi的权重。在训练过程中由于每一步使用随机抽样,因此每个数据集Di和RPNi会得到均匀的训练。
应用阶段:在应用阶段,输入的数据x在经过主干网络之后,需要进入所有的目标检测模型计算检测结果的提议,区域合并模块合并所有RPNi的输出。
本实施例中响应于目标检测请求,获取待检测数据,由于多个目标检测模是根据训练数据中的多个子集配置的,且对应的一个子集是一个目标类别,即配置得到的多个目标检测模型各自对应的目标类别不相同,如此当将待检测数据同时输入至多个目标检测模型后,便可获取到多个目标检测模型各自输出的检测结果,接着合并所有的检测结果便可获取到待检测数据的目标检测结果,本申请根据不同目标类别的多个目标检测模型对检测数据的检测结果,确定目标检测结果,相较于现有单一地通过一个目标检测模型进行目标检测的方式,准确率更高,从而解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
以上为本申请实施例提供的一种目标检测方法的实施例四,以下为本申请实施例提供的一种目标检测装置的实施例。
请参阅图5,图5本申请实施例中一种目标检测装置的实施例的结构示意图。
本实施例中的一种目标检测装置,包括:
第一获取单元501,用于响应于目标检测请求,获取待检测图像数据;
第二获取单元502,用于将待检测数据输入至多个目标检测模型,获取各目标检测模型对待检测数据的检测结果,其中,多个目标检测模型各自对应的目标类别不相同;
第三获取单元503,用于根据所有检测结果,获取待检测数据的目标检测结果。
进一步地,当多个目标检测模型各自对应的目标类别不相同时,第三获取单元503具体用于,合并所有检测结果,得到待检测数据的目标检测结果。
进一步地,训练数据中的子集包括:原始子集和新增子集,原始子集和新增子集的目标类别不同。
进一步地,多个目标检测模型是根据训练数据中的多个子集配置,具体包括:
获取训练数据中子集对应的子集数据;
根据子集数据,更新对应的目标检测模型的权重,以配置对应的目标检测模型。
进一步地,根据子集数据,更新对应的目标检测模型的权重,以配置对应的目标检测模型,具体包括:
将子集数据单独输入至各目标检测模型;
根据各目标检测模型中输入的子集数据,更新该目标检测模型的权重,以配置对应的目标检测模型。
进一步地,当待检测数据为待检测图像数据,本实施例中的目标检测装置还包括:
裁剪单元,用于根据目标检测结果,对待检测图像数据的特征图像进行裁剪,得到待检测图像数据的目标特征。
进一步地,本实施例中的目标检测装置还包括:
分类单元,用于根据目标特征和预设分类模型,得到待检测图像数据的目标分类结果。
进一步地,本实施例中的目标检测装置还包括:
边框回归单元,用于根据目标特征,对待检测图像数据中目标特征对应的目标检测框进行边框回归。
本申请中响应于目标检测请求,获取待检测数据,由于多个目标检测模是根据训练数据中的多个子集配置的,且对应的一个子集是一个目标类别,即配置得到的多个目标检测模型各自对应的目标类别不相同,如此当将待检测数据同时输入至多个目标检测模型后,便可获取到多个目标检测模型各自输出的检测结果,接着合并所有的检测结果便可获取到待检测数据的目标检测结果,本申请根据不同目标类别的多个目标检测模型对检测数据的检测结果,确定目标检测结果,相较于现有单一地通过一个目标检测模型进行目标检测的方式,准确率更高,从而解决了现有的目标检测方法检测时效果有限,准确度较低的技术问题。
本申请实施例还提供了一种目标检测设备的实施例,本实施例中的检测设备包括处理器以及存储器;存储器用于存储程序代码,并将程序代码传输给处理器;处理器用于根据程序代码中的指令执行前述实施例中的目标检测方法。
本申请实施例还提供了一种计算机可读存储介质的实施例,本实施例中计算机可读存储介质用于存储程序代码,程序代码用于执行前述实施例中的目标检测方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,商品加载服务器和方法,可以通过其它的方式实现。例如,以上所描述的商品加载服务器实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,商品加载服务器或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-Only Memory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (11)

1.一种目标检测方法,其特征在于,包括:
响应于目标检测请求,获取待检测数据;
将所述待检测数据同时输入至多个目标检测模型,获取各所述目标检测模型对所述待检测数据的检测结果,其中,多个所述目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,所述目标检测模型的模型数量与所述训练数据的目标类别数量相同;
合并所有所述检测结果,获取所述待检测数据的目标检测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,所述训练数据中的子集包括:原始子集和新增子集,所述原始子集和所述新增子集的目标类别不同。
3.根据权利要求1或2所述的目标检测方法,其特征在于,多个所述目标检测模型是根据训练数据中的多个子集配置,具体包括:
获取所述训练数据中子集对应的子集数据;
根据所述子集数据,更新对应的所述目标检测模型的权重,以配置对应的目标检测模型。
4.根据权利要求3所述的目标检测方法,其特征在于,根据所述子集数据,更新对应的所述目标检测模型的权重,以配置对应的目标检测模型,具体包括:
将所述子集数据单独输入至各所述目标检测模型;
根据各所述目标检测模型中输入的所述子集数据,更新该目标检测模型的权重,以配置对应的目标检测模型。
5.根据权利要求1所述的目标检测方法,其特征在于,当所述待检测数据为待检测图像数据,所述方法还包括:
根据所述目标检测结果,对所述待检测图像数据的特征图像进行裁剪,得到所述待检测图像数据的目标特征。
6.根据权利要求5所述的目标检测方法,其特征在于,所述方法还包括:
根据所述目标特征和预设分类模型,得到所述待检测图像数据的目标分类结果。
7.根据权利要求5所述的目标检测方法,其特征在于,所述方法还包括:
根据所述目标特征,对所述待检测图像数据中所述目标特征对应的目标检测框进行边框回归。
8.根据权利要求1所述的目标检测方法,其特征在于,多个所述目标检测模型集成于一个网络中。
9.一种目标检测装置,其特征在于,包括:
第一获取单元,用于响应于目标检测请求,获取待检测图像数据;
第二获取单元,用于将所述待检测数据同时输入至多个目标检测模型,获取各所述目标检测模型对所述待检测数据的检测结果,其中多个所述目标检测模型是根据训练数据中的多个子集配置的,同一子集中的子集数据为同一目标类别,所述目标检测模型的模型数量与所述训练数据的目标类别数量相同;
第三获取单元,用于根据所有所述检测结果,获取所述待检测数据的目标检测结果。
10.一种目标检测设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1至8中任一项所述的目标检测方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1至8中任一项所述的目标检测方法。
CN202011643200.0A 2020-12-31 2020-12-31 一种目标检测方法、装置、设备和计算机可读存储介质 Pending CN112598081A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011643200.0A CN112598081A (zh) 2020-12-31 2020-12-31 一种目标检测方法、装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011643200.0A CN112598081A (zh) 2020-12-31 2020-12-31 一种目标检测方法、装置、设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112598081A true CN112598081A (zh) 2021-04-02

Family

ID=75206679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011643200.0A Pending CN112598081A (zh) 2020-12-31 2020-12-31 一种目标检测方法、装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112598081A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627568A (zh) * 2021-08-27 2021-11-09 广州文远知行科技有限公司 一种补标方法、装置、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325538A (zh) * 2018-09-29 2019-02-12 北京京东尚科信息技术有限公司 目标检测方法、装置和计算机可读存储介质
CN110110652A (zh) * 2019-05-05 2019-08-09 达闼科技(北京)有限公司 一种目标检测方法、电子设备及存储介质
CN111310858A (zh) * 2020-03-26 2020-06-19 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN111310574A (zh) * 2020-01-17 2020-06-19 清华大学 一种车载视觉实时多目标多任务联合感知方法和装置
CN111709371A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 基于人工智能的分类方法、装置、服务器和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325538A (zh) * 2018-09-29 2019-02-12 北京京东尚科信息技术有限公司 目标检测方法、装置和计算机可读存储介质
CN110110652A (zh) * 2019-05-05 2019-08-09 达闼科技(北京)有限公司 一种目标检测方法、电子设备及存储介质
CN111310574A (zh) * 2020-01-17 2020-06-19 清华大学 一种车载视觉实时多目标多任务联合感知方法和装置
CN111310858A (zh) * 2020-03-26 2020-06-19 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN111709371A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 基于人工智能的分类方法、装置、服务器和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627568A (zh) * 2021-08-27 2021-11-09 广州文远知行科技有限公司 一种补标方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN110443969B (zh) 一种火点检测方法、装置、电子设备及存储介质
CN110070029B (zh) 一种步态识别方法及装置
CN111161311A (zh) 一种基于深度学习的视觉多目标跟踪方法及装置
CN110781711A (zh) 目标对象识别方法、装置、电子设备及存储介质
CN110363220B (zh) 行为类别检测方法、装置、电子设备和计算机可读介质
CN108229292A (zh) 目标识别方法、装置、存储介质和电子设备
CN112560827B (zh) 模型训练方法、装置、预测方法、电子设备及介质
CN112529005B (zh) 基于语义特征一致性监督金字塔网络的目标检测方法
CN104615986A (zh) 利用多检测器对场景变化的视频图像进行行人检测的方法
CN110765863A (zh) 一种基于时空约束的目标聚类方法及系统
CN111563398A (zh) 用于确定目标物的信息的方法和装置
CN110610169A (zh) 图片标注方法和装置、存储介质及电子装置
CN114783021A (zh) 一种口罩佩戴智能检测方法、装置、设备及介质
CN112651458A (zh) 分类模型的训练方法、装置、电子设备及存储介质
CN113313098B (zh) 视频处理方法、设备、系统及存储介质
CN114241384A (zh) 连续帧图片标注方法、电子设备及存储介质
CN114267049A (zh) 基于yolov5的多任务目标检测识别方法和网络结构
CN111401438B (zh) 图像分拣方法、装置及系统
CN115114329A (zh) 数据流异常检测的方法、装置、电子设备和存储介质
CN111652080A (zh) 基于rgb-d图像的目标跟踪方法和装置
CN112598081A (zh) 一种目标检测方法、装置、设备和计算机可读存储介质
Arif Wani et al. Trends in deep learning applications
CN113723431B (zh) 图像识别方法、装置以及计算机可读存储介质
CN113609948B (zh) 一种视频时序动作的检测方法、装置及设备
CN114359700A (zh) 数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination