CN113076969A

CN113076969A - 基于混合高斯损失函数的图像目标检测方法

Info

Publication number: CN113076969A
Application number: CN202110203764.0A
Authority: CN
Inventors: 熊文昌
Original assignee: Shanghai Xinwei Intelligent Technology Co ltd
Current assignee: Shanghai Xinwei Intelligent Technology Co ltd
Priority date: 2021-02-24
Filing date: 2021-02-24
Publication date: 2021-07-06
Anticipated expiration: 2041-02-24
Also published as: CN113076969B

Abstract

本发明提供了基于混合高斯损失函数的图像目标检测方法，其基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库，并对所述采样数据库进行数据增强处理，并且还能够基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，最后对所述深度神经网络模型的参数进行训练优化，并将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者，其能够对包含角度信息的待检测图像进行有效的和可靠的分析处理，从而准确地和全面地获得待检测图像中目标对应的长度、宽度和角度信息。

Description

基于混合高斯损失函数的图像目标检测方法

技术领域

本发明涉及图像智能处理的技术领域，特别涉及基于混合高斯损失函数的图像目标检测方法。

背景技术

现有的图像目标检测方法所检测的图像主要为水平拍摄的透视场景图像，其在实际应用中通常是基于水平框的深度学习目标检测方法来实现的。而对于利用无人机或者光学遥感拍摄得到的车辆、房屋、桥梁等俯视拍摄得到的航拍图像，这类图像中的待检测目标通常与横轴方向呈一定夹角，这使得待检测目标不仅包含长度和宽度等信息，还包括待检测目标在图像中的角度信息。现有的基于水平框的深度学习目标检测方法并不能全面地和有效地估计图像中待检测目标对应的旋转框的长度、宽度和角度，从而降低对图像中待检测目标进行角度检测的准确性和可靠性。

发明内容

针对现有技术存在的缺陷，本发明提供基于混合高斯损失函数的图像目标检测方法，其通过获取待检测图像，基于预设训练样本构建关于该待检测图像的旋转框的采样数据库，并对该采样数据库进行数据增强处理，再基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，再利用该数据分析的结果，初始化该深度神经网络模型的参数，最后对该深度神经网络模型的参数进行训练优化，并将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者；可见，该基于混合高斯损失函数的图像目标检测方法能够基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库，并对所述采样数据库进行数据增强处理，并且还能够基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，最后对所述深度神经网络模型的参数进行训练优化，并将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者，其能够对包含角度信息的待检测图像进行有效的和可靠的分析处理，从而准确地和全面地获得待检测图像中目标对应的长度、宽度和角度信息，以此提高对待检测图像中目标检测的可信度和精确度。

本发明提供基于混合高斯损失函数的图像目标检测方法，其特征在于，其包括如下步骤：

步骤S1，获取待检测图像，基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库，并对所述采样数据库进行数据增强处理；

步骤S2，基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，再利用所述数据分析的结果，初始化所述深度神经网络模型的参数；

步骤S3，对所述深度神经网络模型的参数进行训练优化，并将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者；

进一步，在所述步骤S1中，获取待检测图像，基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库具体包括：

获取待检测图像，确定所述预设训练样本的样本个数为bs，训练样本的图像宽度为W_img，图像高度为H_img，训练样本的通道个数为3，以及确定所述旋转框的个数为nb，特征值类别概率为c，所述旋转框的中心坐标为(x，y)，所述旋转框的宽度为w、高度为h、旋转角度为θ，根据下面公式(1)确定所述采样数据库的输入Inputs-输出outputs关系：

(Inputs,outputs)＝(M(bs×3×H_img×W_img),M(bs×nb×(c+6))) (1)

在上述公式(1)中，M表示数值矩阵，c+6表示所述旋转框的特征长度，c为所述旋转框对应置信度p、坐标x、坐标y、宽度w、高度h、旋转角度θ中任一特征值类别的概率；

进一步，在所述步骤S1中，对所述采样数据库进行数据增强处理具体包括：

对所述采样数据库进行随机灰度、随机饱和度、随机色调、随机色相、随机透视变换和随机仿射变换中任意一者的数据增强处理，从而防止后续深度神经网络模型训练过拟合；

进一步，在所述步骤S2中，基于混合高斯模型的损失函数，构建相应的深度神经网络模型具体包括：

基于预设网络框架作为模型框架，构建深度神经网络模型，具体为将宽度为W_img，高度为H_img和通道数为3的彩色图像作为输入图像，并利用特征提取网络生成具有第一尺寸、第二尺寸和第三尺寸的三个特征图，且第一尺寸、第二尺寸和第三尺寸依次变小，将所述三个特征图输入到基于混合高斯模型的损失函数以此得到相应的真值特征图，再确定预设预测特征图与所述真值特征图之间的相对误差，然后对所述相对误差进行误差方向传播处理，从而构建得到所述深度神经网络模型；

进一步，在所述步骤S2中，所述预设预测特征图是通过如下方式来实现：

设定特征提取网络输出的预测特征图的尺寸为ng*ng*(na*(c+6))，待检测图像对应的标注值尺寸为nb*(c+6)，ng、na、nb分别为预定特征长度值，c+6表示所述旋转框的特征长度，；

对预测特征图的索引1到索引5的特征向量进行sigmoid网络层计算处理，以此得到取值范围为[0，1]的坐标x、坐标y、宽度w、高度h、旋转角度θ的特征向量，并根据ng*ng的网格将坐标x、坐标y、宽度w、高度h、旋转角度θ映射到所述特征向量的取值范围中，具体为：

(x,y)＝sigmoid((x,y))*ng*grid(x,y) (2)

(w,h)＝sigmoid((w,h))*ng*anchor (3)

grid(x,y)＝{(x,y)|x∈(0,1,…,ng-1),y∈(0,1,…,ng-1)} (5)

在上述公式(2)-(5)中，grid(x,y)表示特征图归一化网格系数，anchor表示特征图对应的锚点；

进一步，在所述步骤S2中，确定预设预测特征图与所述真值特征图之间的相对误差具体包括：

确定预设预测特征图的矩形旋转框和所述真值特征图的矩形旋转框之间的相对置信度，从而利用所述相对置信度评估矩形旋转框之间的相似度；

进一步，在所述步骤S2中，确定预设预测特征图的矩形旋转框和所述真值特征图的矩形旋转框之间的相对置信度具体包括：

根据下面公式(6)-(10)，确定真值特征图的矩形旋转框特征向量与映射后的预测特征图的矩形旋转框特征向量的置信度P：

在上述公式(6)-(10)中，x_p,y_p,w_p,h_p,θ_p表示映射后的预测特征图的矩形旋转框特征向量，x_t,y_t,w_t,h_t,θ_t表示真值特征图的矩形旋转框特征向量，ρ、a、b、c分别表示预设系数；

根据下面公式(11)-(13)，对映射后的预测特征图的矩形旋转框特征向量进行方向计算：

根据真值特征图的矩形旋转框特征向量的置信度P_t与映射后的预测特征图的矩形旋转框特征向量的置信度P_p，确定所述相对置信度；

进一步，在所述步骤S2中，利用所述数据分析的结果，初始化所述深度神经网络模型的参数具体包括：

对所述数据分析的结果进行统计分析，依照锚点的数量对所述旋转框的宽度w、高度h进行聚类，得到具有第一尺寸、第二尺寸和第三尺寸的三个特征图中旋转框的锚点值，对所述锚点值进行初始化，以此得到特征提取网络的网络权重和偏置量，从而实现初始化所述深度神经网络模型的参数；

进一步，在所述步骤S3中，对所述深度神经网络模型的参数进行训练优化具体包括：

根据预设训练数据库和预设模型优化器，对所述深度神经网络模型进行训练优化，并保存其中平均精度最高的模型Model_best。

进一步，在所述步骤S3中，将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者具体包括：

将统一格式后的所述待检测图像输入至所述模型Model_best中进行推断，以此得到np*(c+6)维度的输出矩阵Moutputs，其中np表示所述待检测图像中旋转框的总推断个数；

对所述输出矩阵Moutputs进行如下过程的非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者：

A.确定所述输出矩阵Moutputs的绝对置信度阈值Thresh_a和相对置信度阈值Thresh_c；

B.剔除实际绝对置信度小于所述绝对置信度阈值Thresh_a对应的输出矩阵Moutputs，从剩余的输出矩阵Moutputs中选取具有最大绝对置信度阈值的输出矩阵Moutputs，并计算所述选取的输出矩阵Moutputs的向量V_max；

C.计算其他未选取的输出矩阵Moutputs的向量与所述向量V_max之间的相对置信度，剔除所述相对置信度小于所述相对置信度阈值Thresh_c对应的输出矩阵Moutputs；

D.重复上述步骤B和C，直到输出矩阵Moutputs中的向量个数为1；

E.根据步骤D中得到的输出矩阵Moutputs中的向量，得到关于所述旋转框的长度、宽度和旋转角度中的任意一者。

相比于现有技术，该基于混合高斯损失函数的图像目标检测方法通过获取待检测图像，基于预设训练样本构建关于该待检测图像的旋转框的采样数据库，并对该采样数据库进行数据增强处理，再基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，再利用该数据分析的结果，初始化该深度神经网络模型的参数，最后对该深度神经网络模型的参数进行训练优化，并将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者；可见，该基于混合高斯损失函数的图像目标检测方法能够基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库，并对所述采样数据库进行数据增强处理，并且还能够基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，最后对所述深度神经网络模型的参数进行训练优化，并将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者，其能够对包含角度信息的待检测图像进行有效的和可靠的分析处理，从而准确地和全面地获得待检测图像中目标对应的长度、宽度和角度信息，以此提高对待检测图像中目标检测的可信度和精确度。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于混合高斯损失函数的图像目标检测方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的基于混合高斯损失函数的图像目标检测方法的结构示意图。该基于混合高斯损失函数的图像目标检测方法包括如下步骤：

步骤S1，获取待检测图像，基于预设训练样本构建关于该待检测图像的旋转框的采样数据库，并对该采样数据库进行数据增强处理；

步骤S2，基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，再利用该数据分析的结果，初始化该深度神经网络模型的参数；

步骤S3，对该深度神经网络模型的参数进行训练优化，并将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者。

上述技术方案的有益效果为：该基于混合高斯损失函数的图像目标检测方法能够基于预设训练样本构建关于该待检测图像的旋转框的采样数据库，并对该采样数据库进行数据增强处理，并且还能够基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，最后对该深度神经网络模型的参数进行训练优化，并将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者，其能够对包含角度信息的待检测图像进行有效的和可靠的分析处理，从而准确地和全面地获得待检测图像中目标对应的长度、宽度和角度信息，以此提高对待检测图像中目标检测的可信度和精确度。

优选地，在该步骤S1中，获取待检测图像，基于预设训练样本构建关于该待检测图像的旋转框的采样数据库具体包括：

获取待检测图像，确定该预设训练样本的样本个数为bs，训练样本的图像宽度为W_img，图像高度为H_img，训练样本的通道个数为3，以及确定该旋转框的个数为nb，特征值类别概率为c，该旋转框的中心坐标为(x，y)，该旋转框的宽度为w、高度为h、旋转角度为θ，根据下面公式(1)确定该采样数据库的输入Inputs-输出outputs关系：

(Inputs,outputs)＝(M(bs×3×H_img×W_img),M(bs×nb×(c+6))) (1)

在上述公式(1)中，M表示数值矩阵，c+6表示该旋转框的特征长度，c为该旋转框对应置信度p、坐标x、坐标y、宽度w、高度h、旋转角度θ中任一特征值类别的概率。

上述技术方案的有益效果为：由于该公式(1)包含了图像中目标对应的旋转框的宽度、高度和旋转角度，通过该公式(1)确定该采样数据库的输入Inputs-输出outputs关系，能够确保通过该采样数据库即可快速地和准确地得到该旋转框对应的宽度信息、高度信息和旋转角度信息，从而提高对图像中目标对应的旋转框分析的效率。

优选地，在该步骤S1中，对该采样数据库进行数据增强处理具体包括：

对该采样数据库进行随机灰度、随机饱和度、随机色调、随机色相、随机透视变换和随机仿射变换中任意一者的数据增强处理，从而防止后续深度神经网络模型训练过拟合。

上述技术方案的有益效果为：对该采样数据库进行随机灰度、随机饱和度、随机色调、随机色相、随机透视变换和随机仿射变换中任意一者的数据增强处理，能够便于根据待检测图像的具体类型选择相匹配的数据增强处理方式，从而改善对待检测图像进行数据增强处理的灵活性和有效性。

优选地，在该步骤S2中，基于混合高斯模型的损失函数，构建相应的深度神经网络模型具体包括：

基于预设网络框架作为模型框架，构建深度神经网络模型，具体为将宽度为W_img，高度为H_img和通道数为3的彩色图像作为输入图像，并利用特征提取网络生成具有第一尺寸、第二尺寸和第三尺寸的三个特征图，且第一尺寸、第二尺寸和第三尺寸依次变小，将该三个特征图输入到基于混合高斯模型的损失函数以此得到相应的真值特征图，再确定预设预测特征图与该真值特征图之间的相对误差，然后对该相对误差进行误差方向传播处理，从而构建得到该深度神经网络模型。

上述技术方案的有益效果为：将该预设网络框架作为模型框架，能够便于利用该模型框架作为参照比对基准，从而准确地确定预设预测特征图与该真值特征图之间的相对误差，以此有效地构建得到该深度神经网络模型。

优选地，在该步骤S2中，该预设预测特征图是通过如下方式来实现：

设定特征提取网络输出的预测特征图的尺寸为ng*ng*(na*(c+6))，待检测图像对应的标注值尺寸为nb*(c+6)，ng、na、nb分别为预定特征长度值，c+6表示该旋转框的特征长度，；

对预测特征图的索引1到索引5的特征向量进行sigmoid网络层计算处理，以此得到取值范围为[0，1]的坐标x、坐标y、宽度w、高度h、旋转角度θ的特征向量，并根据ng*ng的网格将坐标x、坐标y、宽度w、高度h、旋转角度θ映射到该特征向量的取值范围中，具体为：

(x,y)＝sigmoid((x,y))*ng*grid(x,y) (2)

(w,h)＝sigmoid((w,h))*ng*anchor (3)

grid(x,y)＝{(x,y)|x∈(0,1,…,ng-1),y∈(0,1,…,ng-1)} (5)

在上述公式(2)-(5)中，grid(x,y)表示特征图归一化网格系数，anchor表示特征图对应的锚点。

上述技术方案的有益效果为：通过上述公式(2)-(5)，能够对预测特征图进行关于坐标x、坐标y、宽度w、高度h、旋转角度θ的归一化的映射，从而准确地确定特征图对应的锚点。

优选地，在该步骤S2中，确定预设预测特征图与该真值特征图之间的相对误差具体包括：

确定预设预测特征图的矩形旋转框和该真值特征图的矩形旋转框之间的相对置信度，从而利用该相对置信度评估矩形旋转框之间的相似度。

上述技术方案的有益效果为：由于预设预测特征图的矩形旋转框和该真值特征图的矩形旋转框之间的相对置信度与这两者之间的相似度存在相应的正相关关系，通过该相对置信度能够快速地和准确地确定其对应的相似度。

优选地，在该步骤S2中，确定预设预测特征图的矩形旋转框和该真值特征图的矩形旋转框之间的相对置信度具体包括：

根据真值特征图的矩形旋转框特征向量的置信度P_t与映射后的预测特征图的矩形旋转框特征向量的置信度P_p，确定该相对置信度。

上述技术方案的有益效果为：通过该公式(6)-(10)能够对真值特征图的矩形旋转框特征向量与映射后的预测特征图的矩形旋转框特征向量的置信度进行快速的和可靠的计算，而通过该公式(11)-(13)能够实现对对映射后的预测特征图的矩形旋转框特征向量进行准确的方向计算，从而提高确定该相对置信度的可靠性。

优选地，在该步骤S2中，利用该数据分析的结果，初始化该深度神经网络模型的参数具体包括：

对该数据分析的结果进行统计分析，依照锚点的数量对该旋转框的宽度w、高度h进行聚类，得到具有第一尺寸、第二尺寸和第三尺寸的三个特征图中旋转框的锚点值，对该锚点值进行初始化，以此得到特征提取网络的网络权重和偏置量，从而实现初始化该深度神经网络模型的参数。

上述技术方案的有益效果为：通过类聚计算的方式计算得到不同尺寸旋转框的锚点值，并对锚点值进行初始化，能够准确地和可靠地实现初始化该深度神经网络模型的参数。

优选地，在该步骤S3中，对该深度神经网络模型的参数进行训练优化具体包括：

根据预设训练数据库和预设模型优化器，对该深度神经网络模型进行训练优化，并保存其中平均精度最高的模型Model_best。

上述技术方案的有益效果为：利用预设模型优化器，能够快速地实现对深度神经网络模型的训练优化性能，从而确保平均精度最高的模型的确定效率。

优选地，在该步骤S3中，将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者具体包括：

将统一格式后的该待检测图像输入至该模型Model_best中进行推断，以此得到np*(c+6)维度的输出矩阵Moutputs，其中np表示该待检测图像中旋转框的总推断个数；

对该输出矩阵Moutputs进行如下过程的非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者：

A.确定该输出矩阵Moutputs的绝对置信度阈值Thresh_a和相对置信度阈值Thresh_c；

B.剔除实际绝对置信度小于该绝对置信度阈值Thresh_a对应的输出矩阵Moutputs，从剩余的输出矩阵Moutputs中选取具有最大绝对置信度阈值的输出矩阵Moutputs，并计算该选取的输出矩阵Moutputs的向量V_max；

C.计算其他未选取的输出矩阵Moutputs的向量与该向量V_max之间的相对置信度，剔除该相对置信度小于该相对置信度阈值Thresh_c对应的输出矩阵Moutputs；

D.重复上述步骤B和C，直到输出矩阵Moutputs中的向量个数为1；

E.根据步骤D中得到的输出矩阵Moutputs中的向量，得到关于该旋转框的长度、宽度和旋转角度中的任意一者。

上述技术方案的有益效果为：通过将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，并执行上述步骤A-E的处理过程，能够便于快速地和准确地识别得到该旋转框的长度、宽度和旋转角度中的任意一者，以此提高对待检测图像中目标检测的可信度和精确度。

从上述实施例的内容可知，该基于混合高斯损失函数的图像目标检测方法通过获取待检测图像，基于预设训练样本构建关于该待检测图像的旋转框的采样数据库，并对该采样数据库进行数据增强处理，再基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，再利用该数据分析的结果，初始化该深度神经网络模型的参数，最后对该深度神经网络模型的参数进行训练优化，并将统一格式后的该待检测图像输入至该深度神经网络模型进行非极大值抑制处理，从而得到关于该旋转框的长度、宽度和旋转角度中的任意一者；可见，该基于混合高斯损失函数的图像目标检测方法能够基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库，并对所述采样数据库进行数据增强处理，并且还能够基于混合高斯模型的损失函数，构建相应的深度神经网络模型，并对经过数据增强处理后的采样数据库进行数据分析，最后对所述深度神经网络模型的参数进行训练优化，并将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者，其能够对包含角度信息的待检测图像进行有效的和可靠的分析处理，从而准确地和全面地获得待检测图像中目标对应的长度、宽度和角度信息，以此提高对待检测图像中目标检测的可信度和精确度。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.基于混合高斯损失函数的图像目标检测方法，其特征在于，其包括如下步骤：

步骤S3，对所述深度神经网络模型的参数进行训练优化，并将统一格式后的所述待检测图像输入至所述深度神经网络模型进行非极大值抑制处理，从而得到关于所述旋转框的长度、宽度和旋转角度中的任意一者。

2.如权利要求1所述的基于混合高斯损失函数的图像目标检测方法，其特征在于：

在所述步骤S1中，获取待检测图像，基于预设训练样本构建关于所述待检测图像的旋转框的采样数据库具体包括：

(Inputs，outputs)＝(M(bs×3×H_img×W_img)，M(bs×nb×(c+6))) (1)

在上述公式(1)中，M表示数值矩阵，c+6表示所述旋转框的特征长度，c为所述旋转框对应置信度p、坐标x、坐标y、宽度w、高度h、旋转角度θ中任一特征值类别的概率。

3.如权利要求1所述的基于混合高斯损失函数的图像目标检测方法，其特征在于：

在所述步骤S1中，对所述采样数据库进行数据增强处理具体包括：

对所述采样数据库进行随机灰度、随机饱和度、随机色调、随机色相、随机透视变换和随机仿射变换中任意一者的数据增强处理，从而防止后续深度神经网络模型训练过拟合。

4.如权利要求2所述的基于混合高斯损失函数的图像目标检测方法，其特征在于：

在所述步骤S2中，基于混合高斯模型的损失函数，构建相应的深度神经网络模型具体包括：

基于预设网络框架作为模型框架，构建深度神经网络模型，具体为将宽度为W_img，高度为H_img和通道数为3的彩色图像作为输入图像，并利用特征提取网络生成具有第一尺寸、第二尺寸和第三尺寸的三个特征图，且第一尺寸、第二尺寸和第三尺寸依次变小，将所述三个特征图输入到基于混合高斯模型的损失函数以此得到相应的真值特征图，再确定预设预测特征图与所述真值特征图之间的相对误差，然后对所述相对误差进行误差方向传播处理，从而构建得到所述深度神经网络模型。

5.如权利要求4所述的基于混合高斯损失函数的图像目标检测方法，其特征在于：

在所述步骤S2中，所述预设预测特征图是通过如下方式来实现：

(x，y)＝sigmoid((x，y))*ng*grid(x，y) (2)

(w，h)＝sigmoid((w，h))*ng*anchor (3)