CN115527163A - 目标检测模型优化方法、装置、电子设备及可读存储介质 - Google Patents
目标检测模型优化方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN115527163A CN115527163A CN202211144966.3A CN202211144966A CN115527163A CN 115527163 A CN115527163 A CN 115527163A CN 202211144966 A CN202211144966 A CN 202211144966A CN 115527163 A CN115527163 A CN 115527163A
- Authority
- CN
- China
- Prior art keywords
- domain
- target detection
- decoupling
- domain information
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 301
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000005457 optimization Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 238000009826 distribution Methods 0.000 claims abstract description 111
- 238000012549 training Methods 0.000 claims abstract description 106
- 238000000605 extraction Methods 0.000 claims abstract description 71
- 230000002776 aggregation Effects 0.000 claims description 14
- 238000004220 aggregation Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 230000004931 aggregating effect Effects 0.000 claims description 6
- 230000002708 enhancing effect Effects 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种目标检测模型优化方法、装置、电子设备及可读存储介质,目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,该方法包括:获取不同数据分布域的训练图像样本以及训练图像样本所属数据分布域的域信息特征;通过共享网络参数的特征提取单元对训练图像样本进行特征提取,得到域共享图像特征;通过将域信息特征和域共享图像特征共同输入域特征解耦单元,对域共享图像特征进行域解耦,得到域解耦特征;通过目标检测单元域解耦特征进行目标检测,得到目标检测结果;根据目标检测结果对应的目标检测损失,优化目标检测模型。本申请解决了针对于不同数据分布域的训练图像样本,目标检测模型冗余严重的技术问题。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种目标检测模型优化方法、装置、电子设备及可读存储介质。
背景技术
随着人工智能技术的不断发展,目标检测的应用领域也越来越广泛,由于当前大量的监控设备部署的环境、高度和角度等因素的不同,从而会引入海量的跨域数据,目前针对于这些跨域数据,通常训练针对性的单域目标检测模型,然后利用这些单域目标检测模型分别对每一个域的图像数据分别检测目标检测,模型的冗余较为严重。
发明内容
本申请的主要目的在于提供一种目标检测模型优化方法、装置、电子设备及可读存储介质,旨在解决现有技术中针对于不同数据分布域的训练图像样本,目标检测模型冗余严重的技术问题。
为实现上述目的,本申请提供一种目标检测模型优化方法,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,所述目标检测模型优化方法包括:
获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;
通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;
通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;
通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;
根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
可选地,所述对所述域共享图像特征进行域解耦,得到域解耦特征的步骤包括:
根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重;
根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到所述域解耦特征。
可选地,所述域特征解耦单元包括第一编码器和第二编码器,
所述根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重的步骤包括:
通过将所述域信息特征输入所述第一编码器,对所述域信息特征进行编码,得到域信息编码特征;
将所述域信息编码特征与所述域共享图像特征进行聚合,得到聚合域信息特征;
通过将所述聚合域信息特征输入所述第二编码器,对所述聚合域信息特征进行编码,得到所述通道注意力权重。
可选地,所述根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到域解耦特征的步骤包括:
根据预设约束函数,将所述通道注意力权重转换为重加权参数;
根据所述重加权参数,对所述域共享图像特征的输出通道进行重加权,得到所述域解耦特征,其中,所述重加权参数用于增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值。
可选地,所述根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型的步骤包括:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述特征提取单元、所述域特征解耦单元、所述目标检测单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
可选地,所述根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型的步骤包括:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述域特征解耦单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
可选地,获取所述训练图像样本所属数据分布域的域信息特征,包括:
获取所述训练图像样本所属数据分布域的域信息;
对所述域信息进行域信息特征提取,得到所述所属域对应的域信息特征。
本申请还提供一种目标检测模型优化装置,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,所述目标检测模型优化装置包括:
获取模块,用于获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;
域共享特征提取模块,用于通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;
域特征解耦模块,用于通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;
目标检测模块,用于通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;
模型优化模块,用于根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
可选地,所述域特征解耦模块还用于:
根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重;
根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到所述域解耦特征。
可选地,所述域特征解耦单元包括第一编码器和第二编码器,所述域特征解耦模块还用于:
通过将所述域信息特征输入所述第一编码器,对所述域信息特征进行编码,得到域信息编码特征;
将所述域信息编码特征与所述域共享图像特征进行聚合,得到聚合域信息特征;
通过将所述聚合域信息特征输入所述第二编码器,对所述聚合域信息特征进行编码,得到所述通道注意力权重。
可选地,所述域特征解耦模块还用于:
根据预设约束函数,将所述通道注意力权重转换为重加权参数;
根据所述重加权参数,对所述域共享图像特征的输出通道进行重加权,得到所述域解耦特征,其中,所述重加权参数用于增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值。
可选地,所述模型优化模块还用于:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述特征提取单元、所述域特征解耦单元、所述目标检测单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
可选地,所述模型优化模块还用于:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述域特征解耦单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
可选地,所述获取模块还用于:
获取所述训练图像样本所属数据分布域的域信息;
对所述域信息进行域信息特征提取,得到所述所属域对应的域信息特征。
本申请还提供一种电子设备,所述电子设备为实体设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述目标检测模型优化方法的程序,所述目标检测模型优化方法的程序被处理器执行时可实现如上述的目标检测模型优化方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现目标检测模型优化方法的程序,所述目标检测模型优化方法的程序被处理器执行时实现如上述的目标检测模型优化方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的目标检测模型优化方法的步骤。
本申请提供了一种目标检测模型优化方法、装置、电子设备及可读存储介质,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,本申请中首先获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征,实现了利用各个域共享的特征提取单元和各个域的域信息特征,构建各个域对应的具备差异化的域解耦特征,从而通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果,可实现针对于各个域进行差异化目标检测的目的,进而根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。本申请中并未为每一个域训练一个单域目标检测模型,以实现为每个域进行有针对性的目标检测,本申请的目标检测模型中,特征提取单元、目标检测单元以及域特征解耦单元均为不同跨的图像数据集的共享模块,各个域之间的差异仅在于作为输入的域信息特征不同,且借助于域信息特征对域共享图像特征进行域解耦,可以得到具备差异化的域解耦特征,从而利用具备差异化的域解耦特征进行目标检测,同样可以实现对每个域进行有针对性地目标检测,可以保证在各个域中进行目标检测的精度,因此实现了在保证所有域中目标检测的精度的情况下,构建所有域的共享目标检测模型的目的,降低了针对于不同数据分布域的训练图像样本,目标检测模型的冗余性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请目标检测模型优化方法第一实施例的流程示意图;
图2为本申请目标检测模型优化方法第二实施例的流程示意图;
图3为本申请实施例中目标检测模型优化方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本申请保护的范围。
由于当前大量的监控设备部署的环境、高度和角度等因素的不同,从而会引入海量的跨域数据,目前针对于这些跨域数据,通常是针对于每一个域训练一个单独的目标检测模型,从而可以实现对每个域执行有针对性地目标检测过程,该目标检测模型通常由特征提取单元和目标检测单元构成,但是当域的数量较多时,模型的数量也会较多,模型的冗余较为严重。
本申请实施例提供一种目标检测模型优化方法,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,在本申请目标检测模型优化方法的一实施例中,参照图1,所述目标检测模型优化方法包括:
步骤S10,获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;
步骤S20,通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;
步骤S30,通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;
步骤S40,通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;
步骤S50,根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
在本实施例中,需要说明的是,数据分布域可以为一个数据分布所在的样本空间,不同数据分布域通常对应不同的目标检测任务,例如不同数据分布域可以分别对应白天和黑夜的目标检测任务,又例如不同数据分布域可以对应不同道路场景的目标检测任务,又例如不同数据分布域可以对应不同天气下的目标检测任务等;所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,所述特征提取单元用于对图像进行特征提取,输出图像特征,且不同数据分布域的图像数据共享特征提取单元的网络参数;所述域特征解耦单元用于根据域信息特征对特征提取单元输出的图像特征进行解耦,从而基于每一个数据分布域的域信息,得到各个数据分布域对应的差异化图像特征,也即得到域解耦特征;所述目标检测单元用于依据域解耦特征对图像进行目标检测,其中,不同数据分布域的图像数据共享目标检测单元的网络参数,由于输入目标检测单元的特征为每一个数据分布域的差异化图像特征,因此可以对每个数据分布域执行有针对性地目标检测过程。所以本申请实施例中在目标检测模型中使用各个数据分布域共享的特征提取单元和共享的域特征解耦单元代替了各个数据分布域分别对应的特征提取单元,且相比于各个数据分布域分别对应的特征提取单元,共享的特征提取单元和共享的域特征解耦单元同样可以生成各个数据分布域之间的差异化图像特征,实现对各个数据分布域进行有针对性地目标检测,因此降低了针对于不同数据分布域的图像,目标检测模型的冗余性。
另外,由于域解耦特征是基于域信息特征对域共享图像特征进行域解耦得到的,因此域解耦特征中会同时具备域信息和不同数据分布域之间的共享特征信息,目标检测模型是基于不同数据分布域的训练图像样本训练得到,因此目标检测模型是基于不同数据分布域的图像样本训练得到,还可以实现基于不同数据分布域之间的多任务互补性提升目标检测模型的泛化性。
所述域信息特征为表征域信息的特征向量,所述域信息可以为图像拍摄场景的场景特征信息,例如可以为拍摄位置、拍摄角度、场景光照强度以及摄像头高度等信息。
作为一种示例,步骤S10至步骤S50包括:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域ID,根据所述域ID,查找对应的域信息特征;通过将所述训练图像样本输入所述特征提取单元,对所述训练图像样本进行特征提取,以将所述训练图像样本对应的像素矩阵转换至预设特征维度,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,利用所述域信息特征对所述域共享图像特征进行域解耦,以增强所述域共享图像特征中与域信息强关联的图像特征信息,以及抑制所述域共享图像特征中与域信息弱关联的图像特征信息,从而得到域解耦特征;通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;获取所述训练图像样本对应的图像样本标签,根据所述图像样本标签和所述目标检测结果之间的距离,计算目标检测损失;若目标检测损失收敛,则判定目标检测模型优化完毕;若目标检测损失未收敛,则根据所述目标检测损失计算的模型梯度,更新所述目标检测模型,并返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至计算得到的目标检测损失收敛。
作为一种示例,所述图像样本标签包括候选框位置标签和分类标签,所述目标检测损失可以为位置损失以及分类损失中的一种或者多种,所述目标检测损失可以由位置损失和分类损失求和得到,该位置损失可以为目标检测过程中预测得到的候选框位置与候选框位置标签之间的相似度损失,该分类损失可以为目标检测过程中预测得到的图像分类结果与分类标签之间的相似度损失。
作为一种示例,不同数据分布域的训练图像样本可以为预处理后的图像样本,预处理的目的在于保证不同数据分布域的训练图像样本的均衡性和多样性,预处理的方式可以为批量采样、采用MixUp的图像混合扩增方法、采用多尺度图像扩增方法以及采用PhotoDistortion扩增方法等预处理方式。
作为一种示例,所述域共享图像特征可以为多尺度融合图像特征,所述特征提取单元可以包括骨干网络和多尺度融合网络,其中,所述骨干网络用于对图像样本进行特征提取,得到不同深度的图像样本特征,所述多尺度融合网络用于将不同深度的图像样本特征进行融合,得到多尺度融合图像特征。
作为一种示例,所述将所述域解耦特征输入所述目标检测单元中进行目标检测,包括:
在所述域解耦特征对应的特征图中选取至少一个候选图像框,利用各所述候选图像框,在所述特征图提取对应的图像实例特征;根据各所述图像实例特征,分别对各所述候选图像框进行分类预测,根据得到的各分类预测结果,在各所述候选图像框中选取目标图像框,其中,所述目标图像框中的图像目标为检测确定的目标,所述分类预测结果可以为分类概率或者分类标签;对所述目标图像框所框选的图像区域进行图像分类,得到图像分类结果。
其中,所述对所述域共享图像特征进行域解耦,得到域解耦特征的步骤包括:
步骤S31,根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重;
步骤S32,根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到所述域解耦特征。
在本实施例中,需要说明的是,所述域共享图像特征中的每一个特征值通常是由对应的输出通道输出,而不同的输出通道输出的图像特征值对于进行目标检测的重要程度通常不同,不同数据分布域对应的重要程度较高的输出通道通常也不完全相同,例如数据分布域A对应的重要程度较高的输出通道为a,b和c,而数据分布域b对应的重要程度较高的输出通道为a,d和f。所述域特征解耦单元包括编码器,该编码器用于将所述域信息特征和所述域共享图像特征共同转换为对应的通道注意力权重。所述通道注意力权重为表征域共享图像特征对应的输出通道的重要程度的权重,所述通道注意力权重至少包括一个域共享图像特征对应的输出通道对应的权重值,其中,该输出通道的权重值越大,则证明该输出通道输出的图像特征值对在对应的域中进行目标检测的准确度的影响程度越高。
作为一种示例,步骤S31至步骤S32包括:通过将所述域信息特征和所述域共享图像特征共同输入编码器,将所述域信息特征和所述域共享图像特征共同转换为对应的通道注意力权重,其中,所述通道注意力权重用于表征域共享图像特征的输出通道对于在对应域进行目标检测的重要程度;通过所述通道注意力权重对所述域共享图像特征对应的输出通道进行重加权,以对所述域共享图像特征进行域解耦,将重加权后的各输出通道输出的图像特征作为所述域解耦特征。本申请实施例实现了基于域信息构建通道注意力权重的目的,从而根据所述通道注意力权重,对所述域共享图像特征进行域解耦,可实现依据域信息,对域共享图像特征施加一个对应的干扰,使得各个数据分布域之间的图像特征存在差异化,从而在学习到各个数据分布域的图像共享特征之外,还能学习到各个数据分布域的域信息特征,也即学习到了不同数据分布域之间的差异化特征,为不同数据分布域分别进行有针对性地目标检测奠定了基础。
其中,所述域特征解耦单元包括第一编码器和第二编码器,所述根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重的步骤包括:
步骤S311,通过将所述域信息特征输入所述第一编码器,对所述域信息特征进行编码,得到域信息编码特征;
步骤S312,将所述域信息编码特征与所述域共享图像特征进行聚合,得到聚合域信息特征;
步骤S313,通过将所述聚合域信息特征输入所述第二编码器,对所述聚合域信息特征进行编码,得到所述通道注意力权重。
作为一种示例,步骤S311至步骤S313包括:通过将所述域信息特征输入所述第一编码器,对所述域信息特征进行编码,以将所述域信息特征转换至第一预设特征维度,得到域信息编码特征;将所述域信息编码特征与所述域共享图像特征进行聚合,得到聚合域信息特征,其中,聚合方式可以为求和以及求积等方式;通过将所述聚合域信息特征输入所述第二编码器,对所述聚合域信息特征进行编码,以将所述聚合域信息特征转换至第二预设特征维度,得到所述通道注意力权重。
作为一种示例,计算所述通道注意力权重的具体计算公式如下:
其中,attn为所述通道注意力权重,Femd为所述第一编码器,Fattn为所述第二编码器,Ed为所述域信息特征,fc d为所述域共享图像特征,matmul为矩阵乘法。
其中,所述根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到域解耦特征的步骤包括:
步骤S321,根据预设约束函数,将所述通道注意力权重转换为重加权参数;
步骤S322,根据所述重加权参数,对所述域共享图像特征的输出通道进行重加权,得到所述域解耦特征,其中,所述重加权参数用于增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值。
作为一种示例,步骤S321至步骤S322包括:通过将所述通道注意力权重输入预设约束函数,将所述通道注意力权重约束至预设取值范围内,得到所述重加权参数;根据所述重加权参数,对所述域共享图像特征的输出通道进行重加权,得到所述域解耦特征,其中,所述重加权参数用于增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值,也即对于与域信息关联性强的输出通道,会给予较大的权重值,以增强输出通道的输出,对于与域信息关联性弱的输出通道,会给予较小的权重值,以抑制输出通道的输出。
作为一种示例,计算所述域解耦特征的计算公式如下:
其中,获取所述训练图像样本所属数据分布域的域信息特征,包括:
步骤A10,获取所述训练图像样本所属数据分布域的域信息;
步骤A20,对所述域信息进行域信息特征提取,得到所述所属域对应的域信息特征。
在本实施例中,需要说明的是,所述目标检测模型还包括域信息特征提取单元,其中,所述域信息特征可以根据所述训练图像样本对应的域ID进行检索得到,也可以根据已知的域信息进行生成。
作为一种示例,步骤A10至步骤A20包括:获取所述训练图像样本所属数据分布域的域信息,其中,所述域信息包括图像拍摄角度、图像拍摄高度以及图像拍摄光照等信息,所述域信息可以为域信息向量;将所述域信息向量输入所述域信息特征提取单元,对所述域信息向量进行特征提取,以将所述域信息向量转换为预设域信息特征维度,得到所述所属数据分布域对应的域信息特征。
其中,所述根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型的步骤包括:
步骤S51,若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
步骤S52,若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述特征提取单元、所述域特征解耦单元、所述目标检测单元以及所述域信息特征进行反向传播更新;
步骤S53,返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
作为一种示例,步骤S51至步骤S53包括:若所述目标检测损失收敛,则证明所述目标检测模型的精度已经符合要求,从而判定所述目标检测模型优化完毕;若所述目标检测损失未收敛,则根据所述目标检测损失,分别计算针对于所述特征提取单元的第一梯度、针对于所述域特征解耦单元的第二梯度、针对于所述目标检测单元的第三梯度以及针对于所述域信息特征的第四梯度;根据所述第一梯度更新所述特征提取单元,根据所述第二梯度更新所述域特征解耦单元,根据所述第三梯度更新所述目标检测单元,以及根据所述第四梯度更新所述域信息特征;返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,以进行所述目标检测模型的下一轮迭代更新,直至在迭代更新过程中计算得到的目标检测损失收敛。
另外,需要说明的是,目前在进行多域学习时,由于不同数据分布域的图像数据存在语义以及分布差异问题,因此若直接基于不同数据分布域的图像数据进行多域学习,则多域数据之间可能会存在干扰,从而影响基于多域学习构建的目标检测模型的准确度。而本申请实施例中设置了域特征解耦单元,该域特征解耦单元对所述域共享图像特征的输出通道进行重加权,可以增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值,因此通过域特征解耦单元进行域特征解耦,可以在不同数据分布域数据联合优化的检测任务中降低多域数据之间的干扰,解决数据分布差异带来的信息干扰问题,提升基于多域学习构建的目标检测模型的准确度,也即提升跨域目标检测模型的性能。
本申请实施例提供了一种目标检测模型优化方法,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,本申请实施例中首先获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征,实现了利用各个域共享的特征提取单元和各个域的域信息特征,构建各个域对应的具备差异化的域解耦特征,从而通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果,可实现针对于各个域进行差异化目标检测的目的,进而根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。本申请实施例中并未为每一个域训练一个单域目标检测模型,以实现为每个域进行有针对性的目标检测,本申请实施例的目标检测模型中,特征提取单元、目标检测单元以及域特征解耦单元均为不同跨的图像数据集的共享模块,各个域之间的差异仅在于作为输入的域信息特征不同,且借助于域信息特征对域共享图像特征进行域解耦,可以得到具备差异化的域解耦特征,从而利用具备差异化的域解耦特征进行目标检测,同样可以实现对每个域进行有针对性地目标检测,可以保证在各个域中进行目标检测的精度,因此实现了在保证所有域中目标检测的精度的情况下,构建所有域的共享目标检测模型的目的,降低了针对于不同数据分布域的训练图像样本,目标检测模型的冗余性。
进一步地,参照图2,在本申请另一实施例中,与上述实施例相同或相似的内容,可以参考上文介绍,后续不再赘述。所述根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型的步骤包括:
步骤B10,若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
步骤B20,若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述域特征解耦单元以及所述域信息特征进行反向传播更新;
步骤B30,返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
在本实施例中,需要说明的是,所述域特征解耦单元为可插拔的模块,可加入已有的目标检测模型中进行迭代更新,从而得到最终的目标检测模型。
作为一种示例,步骤B10至步骤B30包括:若所述目标检测损失收敛,则证明所述目标检测模型的精度已经符合要求,从而判定所述目标检测模型优化完毕;若所述目标检测损失未收敛,则根据所述目标检测损失,分别计算针对于所述域特征解耦单元的第五梯度以及针对于所述域信息特征的第六梯度;根据所述第五梯度更新域特征解耦单元,以及根据所述第六梯度更新所述域信息特征;返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,以进行所述目标检测模型的下一轮迭代更新,直至在迭代更新过程中计算得到的目标检测损失收敛。
本申请实施例提供了一种目标检测模型优化方法,也即在计算得到目标检测损失后,若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述域特征解耦单元以及所述域信息特征进行反向传播更新;返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。在特征提取单元与目标检测单元组成的现有目标检测模型的基础上加入域特征解耦单元进行迭代更新,即可实现在现有的目标检测模型的基础上插入域解耦模型进行训练得到针对于不同数据分布域的训练图像样本的目标检测模型,无需从头训练一个新的目标检测模型,因此提升了针对于不同数据分布域的训练图像样本的目标检测模型的模型训练效率。
本申请实施例还提供一种目标检测模型优化装置,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,所述目标检测模型优化装置包括:
获取模块,用于获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;
域共享特征提取模块,用于通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;
域特征解耦模块,用于通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;
目标检测模块,用于通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;
模型优化模块,用于根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
可选地,所述域特征解耦模块还用于:
根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重;
根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到所述域解耦特征。
可选地,所述域特征解耦单元包括第一编码器和第二编码器,所述域特征解耦模块还用于:
通过将所述域信息特征输入所述第一编码器,对所述域信息特征进行编码,得到域信息编码特征;
将所述域信息编码特征与所述域共享图像特征进行聚合,得到聚合域信息特征;
通过将所述聚合域信息特征输入所述第二编码器,对所述聚合域信息特征进行编码,得到所述通道注意力权重。
可选地,所述域特征解耦模块还用于:
根据预设约束函数,将所述通道注意力权重转换为重加权参数;
根据所述重加权参数,对所述域共享图像特征的输出通道进行重加权,得到所述域解耦特征,其中,所述重加权参数用于增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值。
可选地,所述模型优化模块还用于:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述特征提取单元、所述域特征解耦单元、所述目标检测单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
可选地,所述模型优化模块还用于:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述域特征解耦单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
可选地,所述获取模块还用于:
获取所述训练图像样本所属数据分布域的域信息;
对所述域信息进行域信息特征提取,得到所述所属域对应的域信息特征。
本申请提供的目标检测模型优化装置,采用上述实施例中的目标检测模型优化方法,解决了针对于不同数据分布域的训练图像样本,目标检测模型冗余严重的技术问题。与现有技术相比,本申请实施例提供的目标检测模型优化装置的有益效果与上述实施例提供的目标检测模型优化方法的有益效果相同,且该目标检测模型优化装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
本申请实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例一中的目标检测模型优化方法。
下面参考图3,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下系统可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本申请提供的电子设备,采用上述实施例中的目标检测模型优化方法,解决了针对于不同数据分布域的训练图像样本,目标检测模型冗余严重的技术问题。与现有技术相比,本申请实施例提供的电子设备的有益效果与上述实施例提供的目标检测模型优化方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的目标检测模型优化方法的方法。
本申请实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定。
本申请提供的计算机可读存储介质,存储有用于执行上述目标检测模型优化方法的计算机可读程序指令,解决了针对于不同数据分布域的训练图像样本,目标检测模型冗余严重的技术问题。与现有技术相比,本申请实施例提供的计算机可读存储介质的有益效果与上述实施例提供的目标检测模型优化方法的有益效果相同,在此不做赘述。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的目标检测模型优化方法的步骤。
本申请提供的计算机程序产品解决了针对于不同数据分布域的训练图像样本,目标检测模型冗余严重的技术问题。与现有技术相比,本申请实施例提供的计算机程序产品的有益效果与上述实施例提供的目标检测模型优化方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种目标检测模型优化方法,其特征在于,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,所述目标检测模型优化方法包括:
获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;
通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;
通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;
通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;
根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
2.如权利要求1所述目标检测模型优化方法,其特征在于,所述对所述域共享图像特征进行域解耦,得到域解耦特征的步骤包括:
根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重;
根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到所述域解耦特征。
3.如权利要求2所述目标检测模型优化方法,其特征在于,所述域特征解耦单元包括第一编码器和第二编码器,
所述根据所述域信息特征和所述域共享图像特征,构建基于域信息的通道注意力权重的步骤包括:
通过将所述域信息特征输入所述第一编码器,对所述域信息特征进行编码,得到域信息编码特征;
将所述域信息编码特征与所述域共享图像特征进行聚合,得到聚合域信息特征;
通过将所述聚合域信息特征输入所述第二编码器,对所述聚合域信息特征进行编码,得到所述通道注意力权重。
4.如权利要求2所述目标检测模型优化方法,其特征在于,所述根据所述通道注意力权重,对所述域共享图像特征进行域解耦,得到域解耦特征的步骤包括:
根据预设约束函数,将所述通道注意力权重转换为重加权参数;
根据所述重加权参数,对所述域共享图像特征的输出通道进行重加权,得到所述域解耦特征,其中,所述重加权参数用于增强与域信息关联性强的输出通道的输出特征值,以及抑制与域信息关联性弱的输出通道的输出特征值。
5.如权利要求1所述目标检测模型优化方法,其特征在于,所述根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型的步骤包括:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述特征提取单元、所述域特征解耦单元、所述目标检测单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
6.如权利要求1所述目标检测模型优化方法,其特征在于,所述根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型的步骤包括:
若所述目标检测损失收敛,则判定所述目标检测模型优化完毕;
若所述目标检测损失未收敛,则根据所述目标检测损失计算的梯度,对所述域特征解耦单元以及所述域信息特征进行反向传播更新;
返回执行步骤:获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征,直至检测到所述目标检测损失收敛。
7.如权利要求1所述目标检测模型优化方法,其特征在于,获取所述训练图像样本所属数据分布域的域信息特征,包括:
获取所述训练图像样本所属数据分布域的域信息;
对所述域信息进行域信息特征提取,得到所述所属域对应的域信息特征。
8.一种目标检测模型优化装置,其特征在于,所述目标检测模型包括特征提取单元、域特征解耦单元和目标检测单元,所述目标检测模型优化装置包括:
获取模块,用于获取不同数据分布域的训练图像样本以及所述训练图像样本所属数据分布域的域信息特征;
域共享特征提取模块,用于通过所述特征提取单元对所述训练图像样本进行特征提取,得到域共享图像特征,其中,不同数据分布域的训练图像样本共享所述特征提取单元的网络参数;
域特征解耦模块,用于通过将所述域信息特征和所述域共享图像特征共同输入所述域特征解耦单元,对所述域共享图像特征进行域解耦,得到域解耦特征;
目标检测模块,用于通过将所述域解耦特征输入所述目标检测单元,对所述训练图像样本进行目标检测,得到目标检测结果;
模型优化模块,用于根据所述目标检测结果得到的目标检测损失,优化所述目标检测模型。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的目标检测模型优化方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现目标检测模型优化方法的程序,所述实现目标检测模型优化方法的程序被处理器执行以实现如权利要求1至7中任一项所述目标检测模型优化方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211144966.3A CN115527163A (zh) | 2022-09-20 | 2022-09-20 | 目标检测模型优化方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211144966.3A CN115527163A (zh) | 2022-09-20 | 2022-09-20 | 目标检测模型优化方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115527163A true CN115527163A (zh) | 2022-12-27 |
Family
ID=84697715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211144966.3A Pending CN115527163A (zh) | 2022-09-20 | 2022-09-20 | 目标检测模型优化方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115527163A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934451A (zh) * | 2024-03-13 | 2024-04-26 | 中国水利水电第一工程局有限公司 | 应用于光伏电站的无人机巡检方法及系统 |
-
2022
- 2022-09-20 CN CN202211144966.3A patent/CN115527163A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117934451A (zh) * | 2024-03-13 | 2024-04-26 | 中国水利水电第一工程局有限公司 | 应用于光伏电站的无人机巡检方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650236B2 (en) | Road detecting method and apparatus | |
CN112598762B (zh) | 三维车道线信息生成方法、装置、电子设备和介质 | |
CN112668588B (zh) | 车位信息生成方法、装置、设备和计算机可读介质 | |
CN110222726A (zh) | 图像处理方法、装置及电子设备 | |
CN110288037A (zh) | 图像处理方法、装置及电子设备 | |
CN112712036A (zh) | 交通标志识别方法、装置、电子设备及计算机存储介质 | |
CN110555861B (zh) | 光流计算方法、装置及电子设备 | |
CN115527163A (zh) | 目标检测模型优化方法、装置、电子设备及可读存储介质 | |
CN110287817B (zh) | 目标识别及目标识别模型的训练方法、装置和电子设备 | |
CN114971093A (zh) | 城市道路交通流属性预测方法、系统、设备及介质 | |
CN114972113A (zh) | 图像处理方法、装置、电子设备及可读存储介质 | |
CN114385662A (zh) | 路网更新方法、装置、存储介质及电子设备 | |
CN111310595B (zh) | 用于生成信息的方法和装置 | |
CN114647721B (zh) | 教育智能机器人控制方法、设备及介质 | |
CN113723712B (zh) | 风电功率预测方法、系统、设备及介质 | |
CN110378936A (zh) | 光流计算方法、装置及电子设备 | |
CN115393423A (zh) | 目标检测方法和装置 | |
CN115293889A (zh) | 信用风险预测模型训练方法、电子设备及可读存储介质 | |
CN112529315B (zh) | 一种滑坡的预测方法、装置、设备和存储介质 | |
CN115131291A (zh) | 对象计数模型的训练方法、装置、设备以及存储介质 | |
CN113516315A (zh) | 风力发电功率区间预测方法、设备及介质 | |
CN111562749A (zh) | 基于ai的通用智能家居方案自动化设计方法及装置 | |
CN118447723B (zh) | 低空空域网格化无人机管理系统 | |
CN115470292B (zh) | 区块链共识方法、装置、电子设备及可读存储介质 | |
CN118536021B (zh) | 基于多传感器的实时地下水水位动态监测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |