CN113255671A - 针对长宽比大物体的目标检测方法、系统、设备及介质 - Google Patents

针对长宽比大物体的目标检测方法、系统、设备及介质 Download PDF

Info

Publication number
CN113255671A
CN113255671A CN202110754438.9A CN202110754438A CN113255671A CN 113255671 A CN113255671 A CN 113255671A CN 202110754438 A CN202110754438 A CN 202110754438A CN 113255671 A CN113255671 A CN 113255671A
Authority
CN
China
Prior art keywords
target detection
detection model
loss value
category
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110754438.9A
Other languages
English (en)
Other versions
CN113255671B (zh
Inventor
廖丹萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Eda Precision Electromechanical Science & Technology Co ltd
Original Assignee
Zhejiang Smart Video Security Innovation Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Smart Video Security Innovation Center Co Ltd filed Critical Zhejiang Smart Video Security Innovation Center Co Ltd
Priority to CN202110754438.9A priority Critical patent/CN113255671B/zh
Publication of CN113255671A publication Critical patent/CN113255671A/zh
Application granted granted Critical
Publication of CN113255671B publication Critical patent/CN113255671B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及目标检测技术领域,更为具体来说,本申请涉及针对长宽比大物体的目标检测方法、系统、设备及介质。所述方法包括:获取待检测的目标图像;将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;输出所述目标图像中各物体的位置与多个类别概率值;根据所述多个类别概率值确定出所述各物体的最终类别。本申请所述针对长宽比大物体的目标检测方法在损失函数中额外加入物体长边的中心位置损失值和物体长边的长度损失值,从而引导模型提升对长宽比例大物体的检测性能,进而提升了目标检测精度和效率。

Description

针对长宽比大物体的目标检测方法、系统、设备及介质
技术领域
本申请涉及目标检测技术领域,更为具体来说,本申请涉及针对长宽比大物体的目标检测方法、系统、设备及介质。
背景技术
目标检测是计算机视觉和数字图像处理的重要研究方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。目标检测的目标是找出图像中感兴趣的对象,包含物体定位和物体分类两个子任务,即同时确定物体的类别和位置。
目前,利用神经网络结合大量图片数据进行训练的目标检测模式已经成为行业的主流方式。基于神经网络的算法基本上可以归为两类:以Faster R-CNN为代表的两阶段算法和以YOLO、SSD等为代表的一阶段算法。不论是一阶段算法还是两阶段算法,对于检测长宽比例很大的长条形物体,例如滑雪板、铅笔等,相比检测长宽比例较小的物体,如足球、汽车等,性能有很大程度的下降。一些情况下,网络不能检测出长宽比大的物体,另一些情况,虽然网络可以检测出长宽比大的物体,但是目标位置不够准确,特别是物体的长边检测得不准确。此外,从检测结果看,目前现有的方法很多是在目标的长边出现较大的误差,这也进一步证实了IoU损失的缺点。
发明内容
基于上述IoU损失的缺点,本发明旨在通过计算物体长边的长度损失值与物体长边的中心位置损失值来优化目标检测模型,从而引导模型提升对长宽比例大物体的检测性能。
为实现上述技术目的,本申请提供了一种针对长宽比大物体的目标检测方法,包括以下步骤:
一种针对长宽比大物体的目标检测方法,包括以下步骤:
获取待检测的目标图像;
将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出所述目标图像中各物体的位置与多个类别概率值;
根据所述多个类别概率值确定出所述各物体的最终类别。
具体地,所述目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值,包括:
判断物体是否为长宽比大物体,如果是,则计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值;
根据所述长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值构建所述目标检测模型的损失函数。
优选地,所述目标检测模型的训练步骤包括:
采集模型训练样本,所述模型训练样本包括长宽比大物体的图像;
将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息;
计算所述目标检测模型的损失值,所述目标检测模型的损失值为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和;
利用所述目标检测模型的损失值优化所述目标检测模型。
进一步地,所述目标检测模型包括特征提取模块、分类模块与回归模块;
将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息,包括:
从所述模型训练样本中获取第n图像输入所述特征提取模块中,得到图像特征图;
针对所述图像特征图的每个位置产生多个不同大小和不同长宽比的候选区域;
采用所述分类模块与所述回归模块针对所述候选区域进行分类以及位置调整后,输出所述第n图像中每个物体的位置信息与类别信息。
优选地,利用所述目标检测模型的损失值优化所述目标检测模型,包括:
根据所述目标检测模型的损失值对所述目标检测模型的参数进行求导,生成局部梯度序列;
采用随机梯度下降算法以及所述局部梯度序列对所述目标检测模型进行迭代优化;
当所述迭代优化的优化次数等于预设上限值或者所述损失值小于预设阈值时,停止所述模型的优化;
生成训练好的目标检测模型。
选择性地,所述目标检测模型采用基于锚框的一阶段目标检测模型或采用基于锚框的二阶段目标检测模型。
优选地,根据所述多个类别概率值确定出所述各物体的最终类别,包括:
选择所述多个类别概率值中的最大概率值;
识别所述选择的最大概率值对应的类别;
将所述最大概率值对应的类别确定为所述各物体的最终类别。
本发明第二方面提供了一种针对长宽比大物体的目标检测系统,所述系统包括:
图像获取模块,用于获取待检测的目标图像;
图像输入模块,用于将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出模块,用于输出所述目标图像中各物体的位置与多个类别概率值;
最终类别确定模块,用于根据所述多个类别概率值确定出所述各物体的最终类别。
本发明第三方面提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如下步骤:
获取待检测的目标图像;
将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出所述目标图像中各物体的位置与多个类别概率值;
根据所述多个类别概率值确定出所述各物体的最终类别。
本发明第四方面提供了一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如下步骤:
获取待检测的目标图像;
将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出所述目标图像中各物体的位置与多个类别概率值;
根据所述多个类别概率值确定出所述各物体的最终类别。
本申请的有益效果为:本发明的针对长宽比大物体的目标检测方法在损失函数中额外加入物体长边的中心位置损失值和物体长边的长度损失值,从而引导模型提升对长宽比例大物体的检测性能,进而提升了目标检测精度和效率。
附图说明
图1示出了本申请一示例性实施例的方法流程示意图;
图2示出了本申请一示例性实施例的目标检测模型的结构示意图;
图3示出了本申请一示例性实施例的系统结构示意图;
图4示出了本申请一实施例所提供的一种电子设备的结构示意图;
图5示出了本申请一实施例所提供的一种存储介质的示意图。
具体实施方式
以下,将参照附图来描述本申请的实施例。但是应该理解的是,这些描述只是示例性的,而并非要限制本申请的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本申请的概念。对于本领域技术人员来说显而易见的是,本申请可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本申请发生混淆,对于本领域公知的一些技术特征未进行描述。
应予以注意的是,这里所使用的术语仅是为了描述具体实施例,而非意图限制根据本申请的示例性实施例。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组合。
现在,将参照附图更详细地描述根据本申请的示例性实施例。然而,这些示例性实施例可以多种不同的形式来实施,并且不应当被解释为只限于这里所阐述的实施例。附图并非是按比例绘制的,其中为了清楚表达的目的,可能放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
实施例1:
本实施例实施了一种针对长宽比大物体的目标检测方法,如图1所示,包括以下步骤:
S101、获取待检测的目标图像;
S102、将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
S103、输出所述目标图像中各物体的位置与多个类别概率值;
S104、根据所述多个类别概率值确定出所述各物体的最终类别。
具体地,目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值,包括:判断物体是否为长宽比大物体,如果是,则计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值;根据长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值构建目标检测模型的损失函数。
优选地,目标检测模型的训练步骤包括:采集模型训练样本,模型训练样本包括长宽比大物体的图像;将模型训练样本输入到目标检测模型中,输出每个物体的位置信息与类别信息;计算目标检测模型的损失值,目标检测模型的损失值为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和;利用目标检测模型的损失值优化目标检测模型。
进一步地,目标检测模型包括特征提取模块、分类模块与回归模块;将模型训练样本输入到目标检测模型中,输出每个物体的位置信息与类别信息,包括:从模型训练样本中获取第n图像输入特征提取模块中,得到图像特征图;针对图像特征图的每个位置产生多个不同大小和不同长宽比的候选区域;采用分类模块与回归模块针对候选区域进行分类以及位置调整后,输出第n图像中每个物体的位置信息与类别信息。
优选地,利用目标检测模型的损失值优化目标检测模型,包括:根据目标检测模型的损失值对目标检测模型的参数进行求导,生成局部梯度序列;采用随机梯度下降算法以及局部梯度序列对目标检测模型进行迭代优化;当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化;生成训练好的目标检测模型。
选择性地,目标检测模型采用基于锚框的一阶段目标检测模型或采用基于锚框的二阶段目标检测模型。
优选地,根据多个类别概率值确定出各物体的最终类别,包括:选择多个类别概率值中的最大概率值;识别选择的最大概率值对应的类别;将最大概率值对应的类别确定为各物体的最终类别。
实施例2:
本实施例实施了一种针对长宽比大物体的目标检测方法,包括四步,具体步骤详述如下。
第一步,获取待检测的目标图像。
优选地,所获取的待检测的目标图像中包括长宽比大物体,例如滑雪板、铅笔等等。
第二步,将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值。
具体地,所述目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值,包括:判断物体是否为长宽比大物体,如果是,则计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值;根据所述长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值构建所述目标检测模型的损失函数。其中,长宽比定义为
Figure 373852DEST_PATH_IMAGE001
Figure 963096DEST_PATH_IMAGE002
大于判定阈值r,则其为长宽比大物体,反之则不是,r优选为5。计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的方法为:
Figure 477254DEST_PATH_IMAGE003
其中,i表示候选区域的索引号,
Figure 669201DEST_PATH_IMAGE004
表示模型对候选区域的输出类别,
Figure 217994DEST_PATH_IMAGE005
表示候选区域对应的真实类别,
Figure 194784DEST_PATH_IMAGE006
表示模型对候选区域的输出位置信息,
Figure 258555DEST_PATH_IMAGE007
表示候选区域对应目标的真实位置信息,
Figure 191876DEST_PATH_IMAGE008
表示候选目标是否为正样本,即候选目标是否与一个或者多个真实目标相匹配,当候选区域是正样本时取值为1,否则取值为0;
Figure 532859DEST_PATH_IMAGE009
表示分类的损失值,可以根据任务需要设计,优选为交叉熵损失,
Figure 260643DEST_PATH_IMAGE010
表示预测目标与真实目标位置的IoU的损失值;
Figure 811710DEST_PATH_IMAGE011
是平衡分类损失和位置损失的权重,
Figure 283143DEST_PATH_IMAGE012
表示候选目标对应的真实目标是否为长宽比大的物体的判定值,当是长宽比大的物体取值为1,否则取值为0,
Figure 727899DEST_PATH_IMAGE013
表示预测目标的长边中心位置,
Figure 892165DEST_PATH_IMAGE014
表示真实目标的长边中心位置,
Figure 930528DEST_PATH_IMAGE015
表示预测目标的长边的宽度,
Figure 205651DEST_PATH_IMAGE016
表示真实目标的长边的中心位置,
Figure 255647DEST_PATH_IMAGE017
表示长边损失的权重,
Figure 325234DEST_PATH_IMAGE018
表示正样本和负样本的数量之和,
Figure 850893DEST_PATH_IMAGE019
表示负样本的数量。可见,该损失函数为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和。本申请在针对长宽比大物体的检测时,通过引入了长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值来不断优化目标检测模型的精度。
优选地,目标检测模型的训练步骤包括:采集模型训练样本,模型训练样本包括长宽比大物体的图像;将模型训练样本输入到目标检测模型中,输出每个物体的位置信息与类别信息;计算目标检测模型的损失值,目标检测模型的损失值为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和;利用目标检测模型的损失值优化目标检测模型。
进一步地,如图2所示,目标检测模型包括特征提取模块201、分类模块202与回归模块203;将模型训练样本输入到目标检测模型中,输出每个物体的位置信息与类别信息,包括:从模型训练样本中获取第n图像输入特征提取模块201中,得到图像特征图;针对图像特征图的每个位置产生多个不同大小和不同长宽比的候选区域;采用分类模块202与回归模块203针对候选区域进行分类以及位置调整后,输出第n图像中每个物体的位置信息与类别信息。
优选地,利用目标检测模型的损失值优化目标检测模型,包括:根据目标检测模型的损失值对目标检测模型的参数进行求导,生成局部梯度序列;采用随机梯度下降算法以及局部梯度序列对目标检测模型进行迭代优化;当迭代优化的优化次数等于预设上限值或者损失值小于预设阈值时,停止模型的优化;生成训练好的目标检测模型。
选择性地,目标检测模型采用基于锚框的一阶段目标检测模型或采用基于锚框的二阶段目标检测模型。其中,一阶段目标检测模型采用如SSD,YOLOV3等均可。
第三步,输出所述目标图像中各物体的位置与多个类别概率值。
第四步,根据所述多个类别概率值确定出所述各物体的最终类别。
具体地,根据多个类别概率值确定出各物体的最终类别,包括:选择多个类别概率值中的最大概率值;识别选择的最大概率值对应的类别;将最大概率值对应的类别确定为各物体的最终类别。
实施例3:
本实施例实施了一种针对长宽比大物体的目标检测方法系统,如图3所示,包括:
图像获取模块301,用于获取待检测的目标图像;
图像输入模块302,用于将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出模块303,用于输出所述目标图像中各物体的位置与多个类别概率值;
最终类别确定模块304,用于根据所述多个类别概率值确定出所述各物体的最终类别。
接下来请参考图4,其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图4所示,所述电子设备2包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的针对长宽比大物体的目标检测方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述针对长宽比大物体的目标检测方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的针对长宽比大物体的目标检测方法与系统出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的针对长宽比大物体的目标检测方法对应的计算机可读存储介质,请参考图5,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的针对长宽比大物体的目标检测方法。
所述计算机可读存储介质的例子还可以包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
需要说明的是:在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备有固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种针对长宽比大物体的目标检测方法,其特征在于,包括以下步骤:
获取待检测的目标图像;
将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出所述目标图像中各物体的位置与多个类别概率值;
根据所述多个类别概率值确定出所述各物体的最终类别。
2.根据权利要求1所述的针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值,包括:
判断物体是否为长宽比大物体,如果是,则计算长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值;
根据所述长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值构建所述目标检测模型的损失函数。
3.根据权利要求2所述的针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型的训练步骤包括:
采集模型训练样本,所述模型训练样本包括长宽比大物体的图像;
将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息;
计算所述目标检测模型的损失值,所述目标检测模型的损失值为位置信息损失值、类别信息损失值、长宽比大物体长边的长度损失值和长宽比大物体的中心位置损失值的加权和;
利用所述目标检测模型的损失值优化所述目标检测模型。
4.根据权利要求3所述针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型包括特征提取模块、分类模块与回归模块;
将所述模型训练样本输入到所述目标检测模型中,输出每个物体的位置信息与类别信息,包括:
从所述模型训练样本中获取第n图像输入所述特征提取模块中,得到图像特征图;
针对所述图像特征图的每个位置产生多个不同大小和不同长宽比的候选区域;
采用所述分类模块与所述回归模块针对所述候选区域进行分类以及位置调整后,输出所述第n图像中每个物体的位置信息与类别信息。
5.根据权利要求3所述的针对长宽比大物体的目标检测方法,其特征在于,利用所述目标检测模型的损失值优化所述目标检测模型,包括:
根据所述目标检测模型的损失值对所述目标检测模型的参数进行求导,生成局部梯度序列;
采用随机梯度下降算法以及所述局部梯度序列对所述目标检测模型进行迭代优化;
当所述迭代优化的优化次数等于预设上限值或者所述损失值小于预设阈值时,停止所述模型的优化;
生成训练好的目标检测模型。
6.根据权利要求1所述的针对长宽比大物体的目标检测方法,其特征在于,所述目标检测模型采用基于锚框的一阶段目标检测模型或采用基于锚框的二阶段目标检测模型。
7.根据权利要求1所述的针对长宽比大物体的目标检测方法,其特征在于,根据所述多个类别概率值确定出所述各物体的最终类别,包括:
选择所述多个类别概率值中的最大概率值;
识别所述选择的最大概率值对应的类别;
将所述最大概率值对应的类别确定为所述各物体的最终类别。
8.一种针对长宽比大物体的目标检测系统,其特征在于,所述系统包括:
图像获取模块,用于获取待检测的目标图像;
图像输入模块,用于将所述待检测的目标图像输入训练好的目标检测模型中,其中,所述训练好的目标检测模型的损失函数包括物体长边的长度损失值与物体长边的中心位置损失值;
输出模块,用于输出所述目标图像中各物体的位置与多个类别概率值;
最终类别确定模块,用于根据所述多个类别概率值确定出所述各物体的最终类别。
9.一种计算机设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1至7任一项方法的步骤。
CN202110754438.9A 2021-07-05 2021-07-05 针对长宽比大物体的目标检测方法、系统、设备及介质 Active CN113255671B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110754438.9A CN113255671B (zh) 2021-07-05 2021-07-05 针对长宽比大物体的目标检测方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110754438.9A CN113255671B (zh) 2021-07-05 2021-07-05 针对长宽比大物体的目标检测方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN113255671A true CN113255671A (zh) 2021-08-13
CN113255671B CN113255671B (zh) 2022-04-22

Family

ID=77190714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110754438.9A Active CN113255671B (zh) 2021-07-05 2021-07-05 针对长宽比大物体的目标检测方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN113255671B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114332369A (zh) * 2021-12-28 2022-04-12 埃洛克航空科技(北京)有限公司 楼体图像处理方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489347A (zh) * 2020-04-15 2020-08-04 深圳前海环融联易信息科技服务有限公司 营业执照图片质量检测方法、装置、计算机设备及存储介质
CN111814827A (zh) * 2020-06-08 2020-10-23 三峡大学 基于yolo的关键点目标检测方法
CN112013820A (zh) * 2020-09-04 2020-12-01 中山大学 一种面向无人机机载平台部署的实时目标检测方法及装置
CN112580643A (zh) * 2020-12-09 2021-03-30 浙江智慧视频安防创新中心有限公司 一种基于深度学习的车牌识别方法、装置及存储介质
CN112990066A (zh) * 2021-03-31 2021-06-18 武汉大学 基于多策略增强的遥感影像固体废弃物识别方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489347A (zh) * 2020-04-15 2020-08-04 深圳前海环融联易信息科技服务有限公司 营业执照图片质量检测方法、装置、计算机设备及存储介质
CN111814827A (zh) * 2020-06-08 2020-10-23 三峡大学 基于yolo的关键点目标检测方法
CN112013820A (zh) * 2020-09-04 2020-12-01 中山大学 一种面向无人机机载平台部署的实时目标检测方法及装置
CN112580643A (zh) * 2020-12-09 2021-03-30 浙江智慧视频安防创新中心有限公司 一种基于深度学习的车牌识别方法、装置及存储介质
CN112990066A (zh) * 2021-03-31 2021-06-18 武汉大学 基于多策略增强的遥感影像固体废弃物识别方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114332369A (zh) * 2021-12-28 2022-04-12 埃洛克航空科技(北京)有限公司 楼体图像处理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN113255671B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN110991311B (zh) 一种基于密集连接深度网络的目标检测方法
CN109961107B (zh) 目标检测模型的训练方法、装置、电子设备及存储介质
CN110689010A (zh) 一种证件识别方法及装置
CN110598764A (zh) 目标检测模型的训练方法、装置及电子设备
CN112634201B (zh) 目标检测方法、装置和电子设备
CN112036462A (zh) 一种模型训练以及目标检测的方法及装置
CN111461145A (zh) 一种基于卷积神经网络进行目标检测的方法
CN113255671B (zh) 针对长宽比大物体的目标检测方法、系统、设备及介质
CN112233182A (zh) 一种多激光雷达的点云数据的标注方法和装置
CN111797711A (zh) 一种模型训练的方法及装置
CN116168041A (zh) 一种应用于贴合装置的实时检测方法及其系统
US10803295B2 (en) Method and device for face selection, recognition and comparison
CN113762508A (zh) 一种图像分类网络模型的训练方法、装置、设备和介质
CN114139564B (zh) 二维码检测方法、装置、终端设备及检测网络的训练方法
CN113221855B (zh) 基于尺度敏感损失与特征融合的小目标检测方法和系统
CN114359624A (zh) 一种物品分拣方法、装置及存储介质
CN116205918B (zh) 基于图卷积的多模态融合半导体检测方法、装置及介质
CN112633066A (zh) 一种航拍小目标检测方法、装置、设备及存储介质
CN116433661B (zh) 多任务学习的半导体晶圆检测方法、装置、设备及介质
CN110852261B (zh) 目标检测方法、装置、电子设备和可读存储介质
CN112884054A (zh) 一种目标标注方法和一种目标标注装置
CN112149693A (zh) 轮廓识别模型的训练方法和目标对象的检测方法
CN111709377A (zh) 特征提取方法、目标重识别方法、装置及电子设备
CN116309628A (zh) 车道线识别方法和装置、电子设备和计算机可读存储介质
CN115908332A (zh) 电池极片表面缺陷的检测方法及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210813

Assignee: Zhejiang Fenghuang Yunrui Technology Co.,Ltd.

Assignor: Zhejiang smart video security Innovation Center Co.,Ltd.

Contract record no.: X2022330000060

Denomination of invention: Target detection method, system, equipment and medium for objects with large aspect ratio

License type: Common License

Record date: 20220325

Application publication date: 20210813

Assignee: HANGZHOU SHIHUI TECHNOLOGY Co.,Ltd.

Assignor: Zhejiang smart video security Innovation Center Co.,Ltd.

Contract record no.: X2022330000061

Denomination of invention: Target detection method, system, equipment and medium for objects with large aspect ratio

License type: Common License

Record date: 20220325

EE01 Entry into force of recordation of patent licensing contract
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220615

Address after: 311261 No. 60, Hengda Road, daicun Town, Xiaoshan District, Hangzhou City, Zhejiang Province

Patentee after: HANGZHOU EDA PRECISION ELECTROMECHANICAL SCIENCE & TECHNOLOGY CO.,LTD.

Address before: 311215 unit 1, building 1, area C, Qianjiang Century Park, ningwei street, Xiaoshan District, Hangzhou City, Zhejiang Province

Patentee before: Zhejiang smart video security Innovation Center Co.,Ltd.

TR01 Transfer of patent right
EC01 Cancellation of recordation of patent licensing contract

Assignee: HANGZHOU SHIHUI TECHNOLOGY Co.,Ltd.

Assignor: Zhejiang smart video security Innovation Center Co.,Ltd.

Contract record no.: X2022330000061

Date of cancellation: 20220707

Assignee: Zhejiang Fenghuang Yunrui Technology Co.,Ltd.

Assignor: Zhejiang smart video security Innovation Center Co.,Ltd.

Contract record no.: X2022330000060

Date of cancellation: 20220706

EC01 Cancellation of recordation of patent licensing contract