CN110705627A - 目标检测方法、目标检测系统、装置及可读存储介质 - Google Patents
目标检测方法、目标检测系统、装置及可读存储介质 Download PDFInfo
- Publication number
- CN110705627A CN110705627A CN201910919207.1A CN201910919207A CN110705627A CN 110705627 A CN110705627 A CN 110705627A CN 201910919207 A CN201910919207 A CN 201910919207A CN 110705627 A CN110705627 A CN 110705627A
- Authority
- CN
- China
- Prior art keywords
- target detection
- client
- difference
- loss function
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 331
- 238000012549 training Methods 0.000 claims abstract description 54
- 230000006870 function Effects 0.000 claims description 153
- 238000000034 method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 abstract description 12
- 230000002776 aggregation Effects 0.000 abstract description 8
- 238000004220 aggregation Methods 0.000 abstract description 8
- 239000000523 sample Substances 0.000 description 28
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 2
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开了一种目标检测方法,包括以下步骤:所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表,而后所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数,接下来所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端,最后所述客户端基于所述最终目标检测模型确定待检测样本对应的目标检测结果。本发明还公开了一种装置、目标检测系统及可读存储介质。根据损失函数选择客户端有效的模型参数进行模型聚合,无需传输全部的参数,能够减少服务器的计算量和计算时间,在不影响目标检测模型性能的同时,大幅提升了模型聚合的效率。
Description
技术领域
本发明涉及机器学习技术领域,尤其涉及一种目标检测方法、目标检测系统、装置及可读存储介质。
背景技术
Faster R-CNN是当前非常流行的目标检测模型,整个网络结构损失函数由两部分构成:分别是寻找候选区域的RPN层损失损失,以及最后的目标检测层的损失函数。
当前将Faster R-CNN模型放置在联邦学习框架中进行训练时,客户端会进行局部的模型训练,在服务器进行聚合,这种无差别的训练模式适合于大部分的网络模型。这两部分的损失函数实际上对于图片输入有不同的处理方式和关注点,比如RPN层更关心的是如何选取出合理的候选区域,而目标检测层关心的是类别分类和边界框的准确度,其中每一层都会存在大量无效的参数,如果将全部参数都上传到服务器,这将增加服务器的计算量和计算时间。
发明内容
本发明的主要目的在于提供一种目标检测方法、标检测系统、装置及可读存储介质,旨在解决现有Faster R-CNN目标检测模型在进行模型聚合时效率的技术问题。
为实现上述目的,本发明提供一种目标检测方法,所述的目标检测方法包括以下步骤:
所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表;
所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数;
所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端;
所述客户端基于所述最终目标检测模型确定待检测样本对应的目标检测结果。
进一步地,在一实施方式中,所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数的步骤包括:
所述客户端基于所述损失函数列表计算RPN层损失函数对应的第一差值和目标检测层损失函数对应的第二差值,其中,所述第一差值为损失函数列表中最大的RPN层损失函数值与最小的RPN层损失函数值的差,所述第二差值为损失函数列表中最大的目标检测层损失函数值与最小的目标检测层损失函数值的差;
所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数。
进一步地,在一实施方式中,所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数的步骤包括:
在所述第一差值大于所述第二差值时,所述客户端将所述第一差值与所述第二差值相减,得到第三差值;
在所述第三差值大于或者等于预设值时,所述客户端将所述目标检测模型中的RPN层参数作为所需参数;
在所述第三差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
进一步地,在一实施方式中,所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数的步骤,还包括:
在所述第二差值大于所述第一差值时,所述客户端将所述第二差值与所述第一差值相减,得到第四差值;
在所述第四差值大于或者等于预设值时,所述客户端将所述目标检测模型中的目标检测层参数作为所需参数;
在所述第四差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
进一步地,在一实施方式中,所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端的步骤之后,还包括:
所述服务器在接收到各个客户端发送的所需参数时,确定所述各个所需参数对应的参数类型,其中,所述参数类型包括RPN层参数和目标检测层参数;
所述服务器基于所述所需参数确定各个参数类型对应的参数均值,基于所述参数均值确定所述最终目标检测模型对应的参数。
进一步地,在一实施方式中,所述初始检测模型为Faster R-CNN模型,所述FasterR-CNN模型包括RPN层和目标检测层,所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表的步骤包括:
所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数;
所述客户端基于所述RPN层损失函数和所述目标检测层损失函数生成所述损失函数列表;
所述客户端判断所述初始检测模型是否收敛;
若所述初始检测模型收敛,所述客户端确定所述初始检测模型为所述目标检测模型。
进一步地,在一实施方式中,所述客户端判断所述初始检测模型是否收敛的步骤之后,还包括:
若所述初始检测模型不收敛,所述客户端更新所述初始检测模型的模型参数;
基于更新后的所述模型参数,更新所述初始检测模型,并继续执行所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数的步骤。
进一步地,在一实施方式中,所述目标检测装置包括:
确定模块,用于基于训练样本和初始检测模型,确定目标检测模型和损失函数列表;
处理模块,用于基于所述损失函数列表确定所述目标检测模型对应的所需参数;
发送模块,用于发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端;
检测模块,用于基于所述最终目标检测模型确定待检测样本对应的目标检测结果。
此外,为实现上述目的,本发明还提供一种目标检测系统,所述目标检测系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的目标检测程序,所述目标检测程序被所述处理器执行时实现上述任一项所述的目标检测方法的步骤。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有目标检测程序,所述目标检测程序被处理器执行时实现上述任一项所述的目标检测方法的步骤。
本发明通过所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表,而后所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数,接下来所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端,最后所述客户端基于所述最终目标检测模型确定待检测样本对应的目标检测结果。根据损失函数选择客户端有效的模型参数进行模型聚合,无需传输全部的参数,能够减少服务器的计算量和计算时间,在不影响目标检测模型性能的同时,大幅提升了模型聚合的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中目标检测系统的结构示意图;
图2为本发明目标检测方法第一实施例的流程示意图;
图3为本发明目标检测方法第二实施例的流程示意图;
图4为本发明目标检测装置实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境中目标检测系统的结构示意图。
如图1所示,该目标检测系统可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的目标检测系统结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图片处理程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的图片处理程序。
在本实施例中,目标检测系统包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的目标检测程序,其中,处理器1001调用存储器1005中存储的目标检测程序时,执行本申请各个实施例提供的目标检测方法的步骤。
本发明还提供一种目标检测方法,参照图2,图2为本发明目标检测方法第一实施例的流程示意图。
本发明实施例提供了目标检测方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中,该目标检测方法包括:
步骤S10,所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表;
在本实施例中,目标检测是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。尤其是在复杂场景中,需要对多个目标进行实时处理时,目标自动提取和识别就显得特别重要。目标检测在视频监控、自动驾驶汽车、人体跟踪等领域得到了广泛的应用。目标检测定位图像中目标的存在,并在该目标周围绘制一个边界框(bounding box)。这通常包括两个过程:预测目标的类型,然后在该目标周围绘制一个框。
进一步地,Faster R-CNN是常见的用于目标检测的模型架构,Faster R-CNN模型由两个模块组成:负责提出区域的深度卷积网络(RPN层)和使用这些区域的Fast R-CNN探测器(目标检测层)。候选区域网络(Region Proposal Network),也就是RPN层,以图像为输入,生成矩形目标候选的输出,每个矩形都有一个objectness score。本发明的目标检测方法应用于目标检测系统,目标检测系统包括多个客户端和一个服务器,各个客户端根据训练样本以及初始检测模型进行局部的模型训练,然后将客户端本地的模型参数上传至服务器进行聚合,其中,模型参数中的主要参数包括RPN层参数和目标检测层参数。具体地,系统中的各个客户端根据各自的训练样本训练该客户端对应的初始检测模型,进而确定该客户端对应的目标检测模型以及损失函数列表,其中损失函数列表中保存了RPN层损失函数和目标检测层损失函数。
具体地,步骤S10包括:
步骤a,所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数;
在本实施例中,客户端的初始检测模型是Faster R-CNN模型,其包括了RPN层和目标检测层,客户端根据预设的训练样本对初始检测模型进行模型训练,在模型训练的过程中,可以获取到RPN层损失函数和目标检测层损失函数,需要说明的是,模型训练是经过多轮训练,每一轮训练的过程RPN层损失函数和目标检测层损失函数都不同,通常情况下是越来越小,直到损失函数收敛,也就是说,首次用训练样本进行模型训练时,RPN层损失函数值和目标检测层损失函数值都是最大的,当模型收敛时,RPN层损失函数值和目标检测层损失函数值都是最小的。
步骤b,所述客户端基于所述RPN层损失函数和所述目标检测层损失函数生成所述损失函数列表;
在本实施例中,客户端根据预设的训练样本对初始检测模型进行多轮训练,每一轮训练的过程获取RPN层损失函数值和目标检测层损失函数值,并将这两个损失函数值保存到损失函数列表,如果进行了N轮迭代,则会保存N个RPN层损失函数值和N个目标检测层损失函数值,且N个RPN层损失函数值各不相同,N个目标检测层损失函数值也各不相同。
步骤c,所述客户端判断所述初始检测模型是否收敛;
在本实施例中,客户端根据预设的训练样本对初始检测模型进行每一轮训练结束时,客户端会根据模型的损失函数值确定模型是否收敛,其中,如果模型的损失函数值小于一个预设值时,可以认为模型收敛,该预设值根据实际情况确定,在本发明中不做限定,另外一个判断模型收敛的方法是,当模型的损失函数值,在下一轮模型训练过程中不再变化,则说明此时的模型收敛。
步骤d,若所述初始检测模型收敛,所述客户端确定所述初始检测模型为所述目标检测模型。
在本实施例中,当客户端根据模型的损失函数确定模型收敛时,则表示模型训练完成,不需要再进行下一轮模型训练了,当前的初始检测模型是经过模型训练后的目标检测模型。
步骤e,若所述初始检测模型不收敛,所述客户端更新所述初始检测模型的模型参数;
在本实施例中,当客户端根据模型的损失函数确定模型不收敛时,则表示模型训练未完成,仍需要再进行下一轮模型训练,此时,根据预设的更新模型参数的原则对模型的系统参数进行更新,然后再进行下一轮模型训练。
步骤f,基于更新后的所述模型参数,更新所述初始检测模型,并继续执行所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数的步骤。
在本实施例中,当对模型的系统参数进行更新后,客户端继续利用预设的训练样本对更新后的初始检测模型进行模型训练,并且在模型训练的过程中,继续获取到RPN层损失函数值和目标检测层损失函数值,保存到损失函数列表,并执行后续操作。
步骤S20,所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数;
在本实施例中,模型训练结束后,客户端在损失函数列表获取到最大的RPN层损失函数值及最小的RPN层损失函数值,并计算最大的RPN层损失函数值与最小的RPN层损失函数值的差,该差值定义为第一差值,同时获取最大的目标检测层损失函数值和最小的目标检测层损失函数值,并计算最大的目标检测层损失函数值与最小的目标检测层损失函数值的差,该差值定义为第二差值,然后根据两个差值比较,确定目标检测模型对应的所需参数。
需要说明的是,如果第一差值大于第二差值,且差异比较大,则说明RPN层的损失比目标检测层损失更为明显,则RPN层参数作为所需参数,同理,如果第二差值大于第一差值,且差异比较大,则说明目标检测层损失比RPN层的损失更为明显,则目标检测层参数作为所需参数。也就是说,每个客户端根据各自的RPN层损失函数以及目标检测层损失函数的变化情况,确定需要上传RPN层参数或目标检测层参数,这样大大减轻了服务器侧的计算量,提升了模型生成效率。
步骤S30,所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端;
在本实施例中,客户端根据第一差值与第二差值的比较关系,确定客户端的目标检测模型对应的所需参数后,将该所需参数发送到服务器进行聚合,然后将聚合后的参数作为最终目标检测模型的模型参数,而后服务器再将最终目标检测模型反馈给客户端。
步骤S40,所述客户端基于所述最终目标检测模型确定待检测样本对应的目标检测结果。
在本实施例中,客户端在接收到服务器反馈的最终目标检测模型,可以使用该最终目标检测模型进行目标检测操作。当客户端检测到需要进行目标检测的待检测样本以及目标检测命令时,将待检测样本作为最终目标检测模型的输入,执行目标检测操作,而后最终目标检测模型输出该待检测样本对应的目标检测结果。
进一步地,在一实施例中,步骤S40之后还包括:
步骤S50,所述服务器在接收到各个客户端发送的所需参数时,确定所述各个所需参数对应的参数类型,其中,所述参数类型包括RPN层参数和目标检测层参数;
在本实施例中,目标检测系统包括多个客户端,各个客户端根据训练样本以及初始检测模型进行各自的模型训练,当模型训练完成且确定了各自的所需参数后,各个客户端发送各自的所需参数至服务器,当服务器接收到各个终端发送的所需参数时,进一步确定这些所需参数对应的参数类型,其中,参数类型包括RPN层参数和目标检测层参数。
步骤S60,所述服务器基于所述所需参数确定各个参数类型对应的参数均值,基于所述参数均值确定所述最终目标检测模型对应的参数。
在本实施例中,参数类型包括RPN层参数和目标检测层参数,则服务器将接收到所有所需参数分成两大类,即RPN层参数和目标检测层参数,然后分别求取多个RPN层参数的均值,以及多个目标检测层参数的均值。然后将RPN层参数的均值作为最终目标检测模型对应的RPN层参数,将标检测层参数的均值作为最终目标检测模型对应的目标检测层参数。
本实施例提出的目标检测方法,通过所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表,而后所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数,接下来所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端,最后所述客户端基于所述最终目标检测模型确定待检测样本对应的目标检测结果。根据损失函数选择客户端有效的模型参数进行模型聚合,无需传输全部的参数,能够减少服务器的计算量和计算时间,在不影响目标检测模型性能的同时,大幅提升了模型聚合的效率。
基于第一实施例,参照图3,提出本发明目标检测方法的第二实施例,在本实施例中,步骤S20包括:
步骤S21,所述客户端基于所述损失函数列表计算RPN层损失函数对应的第一差值和目标检测层损失函数对应的第二差值,其中,所述第一差值为损失函数列表中最大的RPN层损失函数值与最小的RPN层损失函数值的差,所述第二差值为损失函数列表中最大的目标检测层损失函数值与最小的目标检测层损失函数值的差;
在本实施例中,客户端根据预设的训练样本对初始检测模型进行多轮训练,每一轮训练的过程获取RPN层损失函数值和目标检测层损失函数值,并将这两个损失函数值保存到损失函数列表,模型训练结束后,客户端在损失函数列获取到最大的RPN层损失函值及最小的RPN层损失函值,并计算最大的RPN层损失函值与最小的RPN层损失函值的差,该差值定义为第一差值,同时获取最大的目标检测层损失函数值和最小的目标检测层损失函数值,并计算最大的目标检测层损失函数值与最小的目标检测层损失函数值的差,该差值定义为第二差值。
步骤S22,所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数。
在本实施例中,客户端根据第一差值和第二差值确定目标检测模型对应的所需参数,如果第一差值大于第二差值,且差异比较大,则说明RPN层的损失比目标检测层损失更为明显,同理,如果第二差值大于第一差值,且差异比较大,则说明目标检测层损失比RPN层的损失更为明显。
具体地,步骤S22包括:
步骤g,在所述第一差值大于所述第二差值时,所述客户端将所述第一差值与所述第二差值相减,得到第三差值;
步骤h,在所述第三差值大于或着等于预设值时,所述客户端将所述目标检测模型中的RPN层参数作为所需参数;
步骤i,在所述第三差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
在本实施例中,进一步比较第一差值和第二差值,当第一差值大于第二差值时,则第一差值与第二差值相减,它们的差值记做第三差值。需要说明的是,RPN层损失函数与目标检测层损失函数不同,故RPN层损失函数对应的第一差值和目标检测层损失函数对应的第二差值不存在完全相等的情况。
进一步地,预设值是根据实际情况确定的一个值,用来评估第一差值与第二差值的接近程度,也就是确定RPN层损失函数和目标检测层损失函数中,哪一个层的损失变化更明显。当第三差值大于或等于预设值时,即第一差值与第二差值差异比较大,说明RPN层的损失比目标检测层损失更为明显,此时,客户端将RPN层参数作为所需参数;当第三差值小于预设值时,即第一差值与第二差值差异不大,说明RPN层的损失与目标检测层损失相当,此时,客户端同时将RPN层参数和目标检测层参数作为所需参数。
步骤k,在所述第二差值大于所述第一差值时,所述客户端将所述第二差值与所述第一差值相减,得到第四差值;
步骤l,在所述第四差值大于或着等于预设值时,所述客户端将所述目标检测模型中的目标检测层参数作为所需参数;
步骤m,在所述第四差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
在本实施例中,进一步比较第一差值和第二差值,当第二差值大于第一差值时,则第二差值与第一差值相减,它们的差值记做第四差值。
进一步地,预设值是根据实际情况确定的一个值,用来评估第一差值与第二差值的接近程度,也就是确定RPN层损失函数和目标检测层损失函数中,哪一个层的损失变化更明显。当第四差值大于或等于预设值时,即第二差值与第一差值差异比较大,说明目标检测层损失比RPN层的损失更为明显,此时,客户端将目标检测层参数作为所需参数;当第四差值小于预设值时,即第一差值与第二差值差异不大,说明RPN层的损失与目标检测层损失相当,此时,客户端同时将RPN层参数和目标检测层参数作为所需参数。
本实施例提出的目标检测方法,通过所述客户端基于所述损失函数列表计算RPN层损失函数对应的第一差值,和目标检测层损失函数对应的第二差值,其中,所述第一差值等于损失函数列表中最大的RPN层损失函数值与最小的RPN层损失函数值的差,所述第二差值等于损失函数列表中最大的目标检测层损失函数值与最小的目标检测层损失函数值的差,而后所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数。根据第一差值与第二差值比较了目标检测层与RPN层的损失情况,进而根据比较结果准确确定各个客户端的所需参数,无需传输全部的参数,能够减少服务器的计算量和计算时间,实现了减少客户端参数的上传数量,从而减轻了服务器侧的计算量,提升了模型生成效率。
本发明进一步提供一种目标检测装置,参照图4,图4为本发明目标检测装置实施例的功能模块示意图。
确定模块10,用于基于训练样本和初始检测模型,确定目标检测模型和损失函数列表;
处理模块20,用于基于所述损失函数列表确定所述目标检测模型对应的所需参数;
发送模块30,用于发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端;
检测模块40,用于基于所述最终目标检测模型确定待检测样本对应的目标检测结果。
进一步地,所述处理模块20还用于:
所述客户端基于所述损失函数列表计算RPN层损失函数对应的第一差值和目标检测层损失函数对应的第二差值,其中,所述第一差值为损失函数列表中最大的RPN层损失函数值与最小的RPN层损失函数值的差,所述第二差值为损失函数列表中最大的目标检测层损失函数值与最小的目标检测层损失函数值的差;
所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数。
进一步地,所述处理模块20还用于:
在所述第一差值大于所述第二差值时,所述客户端将所述第一差值与所述第二差值相减,得到第三差值;
在所述第三差值大于或者等于预设值时,所述客户端将所述目标检测模型中的RPN层参数作为所需参数;
在所述第三差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
进一步地,所述处理模块20还用于:
在所述第二差值大于所述第一差值时,所述客户端将所述第二差值与所述第一差值相减,得到第四差值;
在所述第四差值大于或者等于预设值时,所述客户端将所述目标检测模型中的目标检测层参数作为所需参数;
在所述第四差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
进一步地,所述目标检测装置还包括:
分类模块,用于在接收到各个客户端发送的所需参数时,确定所述各个所需参数对应的参数类型,其中,所述参数类型包括RPN层参数和目标检测层参数;
聚类模块,用于基于所述所需参数确定各个参数类型对应的参数均值,基于所述参数均值确定所述最终目标检测模型对应的参数。
进一步地,所述确定模块10还用于:
所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数;
所述客户端基于所述RPN层损失函数和所述目标检测层损失函数生成所述损失函数列表;
所述客户端判断所述初始检测模型是否收敛;
若所述初始检测模型收敛,所述客户端确定所述初始检测模型为所述目标检测模型。
进一步地,所述确定模块10还用于:
若所述初始检测模型不收敛,所述客户端更新所述初始检测模型的模型参数;
基于更新后的所述模型参数,更新所述初始检测模型,并继续执行所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数的步骤。
此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有目标检测程序,所述目标检测程序被处理器执行时实现上述各个实施例中目标检测方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台系统设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种目标检测方法,应用于目标检测系统,所述目标检测系统包括服务器和多个客户端,其特征在于,所述目标检测方法包括以下步骤:
所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表;
所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数;
所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端;
所述客户端基于所述最终目标检测模型确定待检测样本对应的目标检测结果。
2.如权利要求1所述的目标检测方法,其特征在于,所述客户端基于所述损失函数列表确定所述目标检测模型对应的所需参数的步骤包括:
所述客户端基于所述损失函数列表计算RPN层损失函数对应的第一差值和目标检测层损失函数对应的第二差值,其中,所述第一差值为损失函数列表中最大的RPN层损失函数值与最小的RPN层损失函数值的差,所述第二差值为损失函数列表中最大的目标检测层损失函数值与最小的目标检测层损失函数值的差;
所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数。
3.如权利要求2所述的目标检测方法,其特征在于,所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数的步骤包括:
在所述第一差值大于所述第二差值时,所述客户端将所述第一差值与所述第二差值相减,得到第三差值;
在所述第三差值大于或者等于预设值时,所述客户端将所述目标检测模型中的RPN层参数作为所需参数;
在所述第三差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
4.如权利要求2所述的目标检测方法,其特征在于,所述客户端基于所述第一差值和所述第二差值确定所述目标检测模型对应的所需参数的步骤,还包括:
在所述第二差值大于所述第一差值时,所述客户端将所述第二差值与所述第一差值相减,得到第四差值;
在所述第四差值大于或者等于预设值时,所述客户端将所述目标检测模型中的目标检测层参数作为所需参数;
在所述第四差值小于预设值时,所述客户端将所述目标检测模型中的RPN层参数和目标检测层参数作为所需参数。
5.如权利要求1所述的目标检测方法,其特征在于,所述客户端发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端的步骤之后,还包括:
所述服务器在接收到各个客户端发送的所需参数时,确定所述各个所需参数对应的参数类型,其中,所述参数类型包括RPN层参数和目标检测层参数;
所述服务器基于所述所需参数确定各个参数类型对应的参数均值,基于所述参数均值确定所述最终目标检测模型对应的参数。
6.如权利要求1至5中任一项所述的目标检测方法,其特征在于,所述初始检测模型为Faster R-CNN模型,所述Faster R-CNN模型包括RPN层和目标检测层,所述客户端基于训练样本和初始检测模型,确定目标检测模型和损失函数列表的步骤包括:
所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数;
所述客户端基于所述RPN层损失函数和所述目标检测层损失函数生成所述损失函数列表;
所述客户端判断所述初始检测模型是否收敛;
若所述初始检测模型收敛,所述客户端确定所述初始检测模型为所述目标检测模型。
7.如权利要求6所述的目标检测方法,其特征在于,所述客户端判断所述初始检测模型是否收敛的步骤之后,还包括:
若所述初始检测模型不收敛,所述客户端更新所述初始检测模型的模型参数;
基于更新后的所述模型参数,更新所述初始检测模型,并继续执行所述客户端基于所述训练样本训练所述初始检测模型,获取所述初始检测模型对应的RPN层损失函数和所述初始检测模型对应的目标检测层损失函数的步骤。
8.一种目标检测装置,其特征在于,所述目标检测装置包括:
确定模块,用于基于训练样本和初始检测模型,确定目标检测模型和损失函数列表;
处理模块,用于基于所述损失函数列表确定所述目标检测模型对应的所需参数;
发送模块,用于发送所述所需参数至所述服务器,以使所述服务器发送最终目标检测模型至所述客户端;
检测模块,用于基于所述最终目标检测模型确定待检测样本对应的目标检测结果。
9.一种目标检测系统,其特征在于,所述目标检测系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的目标检测程序,所述目标检测程序被所述处理器执行时实现如权利要求1至7中任一项所述的目标检测方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有所述目标检测程序,所述目标检测程序被处理器执行时实现如权利要求1至7中任一项所述的目标检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910919207.1A CN110705627A (zh) | 2019-09-26 | 2019-09-26 | 目标检测方法、目标检测系统、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910919207.1A CN110705627A (zh) | 2019-09-26 | 2019-09-26 | 目标检测方法、目标检测系统、装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110705627A true CN110705627A (zh) | 2020-01-17 |
Family
ID=69197466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910919207.1A Pending CN110705627A (zh) | 2019-09-26 | 2019-09-26 | 目标检测方法、目标检测系统、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705627A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325417A (zh) * | 2020-05-15 | 2020-06-23 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的多方协同更新业务预测模型的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180174046A1 (en) * | 2016-12-15 | 2018-06-21 | Beijing Kuangshi Technology Co., Ltd. | Target detection method and device, neural network training method and device |
WO2018137357A1 (zh) * | 2017-01-24 | 2018-08-02 | 北京大学 | 一种目标检测性能优化的方法 |
CN109635462A (zh) * | 2018-12-17 | 2019-04-16 | 深圳前海微众银行股份有限公司 | 基于联邦学习的模型参数训练方法、装置、设备及介质 |
CN109657615A (zh) * | 2018-12-19 | 2019-04-19 | 腾讯科技(深圳)有限公司 | 一种目标检测的训练方法、装置及终端设备 |
CN109871702A (zh) * | 2019-02-18 | 2019-06-11 | 深圳前海微众银行股份有限公司 | 联邦模型训练方法、系统、设备及计算机可读存储介质 |
-
2019
- 2019-09-26 CN CN201910919207.1A patent/CN110705627A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180174046A1 (en) * | 2016-12-15 | 2018-06-21 | Beijing Kuangshi Technology Co., Ltd. | Target detection method and device, neural network training method and device |
WO2018137357A1 (zh) * | 2017-01-24 | 2018-08-02 | 北京大学 | 一种目标检测性能优化的方法 |
CN109635462A (zh) * | 2018-12-17 | 2019-04-16 | 深圳前海微众银行股份有限公司 | 基于联邦学习的模型参数训练方法、装置、设备及介质 |
CN109657615A (zh) * | 2018-12-19 | 2019-04-19 | 腾讯科技(深圳)有限公司 | 一种目标检测的训练方法、装置及终端设备 |
CN109871702A (zh) * | 2019-02-18 | 2019-06-11 | 深圳前海微众银行股份有限公司 | 联邦模型训练方法、系统、设备及计算机可读存储介质 |
Non-Patent Citations (3)
Title |
---|
DAVID LEROY; ALICE COUCKE; THIBAUT LAVRIL; THIBAULT GISSELBRECHT; JOSEPH DUREAU: "FEDERATED LEARNING FOR KEYWORD SPOTTING", ICASSP 2019 - 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 17 April 2019 (2019-04-17) * |
刘桂雄;刘思洋;吴俊芳;罗文佳;: "基于深度学习的机器视觉目标检测算法及在票据检测中应用", 中国测试, vol. 45, no. 05, 31 May 2019 (2019-05-31) * |
胡彬轩: "基于联邦学习的空气质量监测系统设计与实现", 中国优秀硕士学位论文全文数据库 (工程科技Ⅰ辑), no. 08, 15 August 2019 (2019-08-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325417A (zh) * | 2020-05-15 | 2020-06-23 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的多方协同更新业务预测模型的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150278706A1 (en) | Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning | |
CN107688950B (zh) | 家电售后咨询方法、电子设备和计算机可读存储介质 | |
CN112712498B (zh) | 移动终端执行的车辆定损方法、装置、移动终端、介质 | |
EP4339843A1 (en) | Neural network optimization method and apparatus | |
CN110866555A (zh) | 增量数据的聚类方法、装置、设备及可读存储介质 | |
KR20200017611A (ko) | 딥러닝을 이용한 위치 측위 방법 및 장치 | |
CN110633717A (zh) | 一种目标检测模型的训练方法和装置 | |
CN113239975A (zh) | 一种基于神经网络的目标检测方法和装置 | |
CN114971433A (zh) | 基于工业互联网的质量管控方法、装置、设备及存储介质 | |
CN114612531B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN115587545A (zh) | 一种用于光刻胶的参数优化方法、装置、设备及存储介质 | |
CN113657370B (zh) | 一种文字识别方法及其相关设备 | |
CN110705627A (zh) | 目标检测方法、目标检测系统、装置及可读存储介质 | |
CN112257856A (zh) | 深度学习框架确定方法、设备及可读存储介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN110909797B (zh) | 图像检测方法以及装置、设备、存储介质 | |
CN116596903A (zh) | 缺陷识别方法、装置、电子设备及可读存储介质 | |
CN116030415A (zh) | 一种环境卫生检测方法、装置、设备及存储介质 | |
CN114021705A (zh) | 模型的精度确定方法以及相关装置、设备 | |
CN113988316A (zh) | 对机器学习模型训练的方法和装置 | |
CN110796200B (zh) | 数据分类方法、终端、装置及存储介质 | |
CN113360590A (zh) | 兴趣点信息的更新方法、装置、电子设备及存储介质 | |
CN108831548B (zh) | 远程智能医疗的优化方法、装置及系统 | |
CN112085119A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN107562050B (zh) | 一种机器人识别环境的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |