CN113469976A

CN113469976A - 一种对象检测的方法、装置及电子设备

Info

Publication number: CN113469976A
Application number: CN202110762095.0A
Authority: CN
Inventors: 赵兴科; 王枫; 任馨怡; 熊剑平
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2021-07-06
Filing date: 2021-07-06
Publication date: 2021-10-01

Abstract

本申请公开一种对象检测的方法、装置及电子设备，该方法包括通过一个摄像头采集任意场景下包含待检测对象的对象区域的输入图像，然后基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值，比较所述各个像素的像素参考值和预设参考值阈值大小，并且根据比较结果，生成包括第一区域和第二区域的显著图。在此基础上对所述融合显著图进行目标识别，确定所述待检测对象。其中，第一区域与对象区域对应，第二区域与非对象区域对应。基于上述方法可以精准检测输入图像中的待检测对象，实现自动化的对象检测，满足对象检测识别自动化、轻量化和便捷化的应用需求。

Description

一种对象检测的方法、装置及电子设备

技术领域

本申请涉及图像处理技术领域，尤其涉及一种对象检测的方法、装置及电子设备。

背景技术

随着物流行业的快速发展，物流包裹越来越多，海量包裹作为待检测的目标对象为物流公司的周转带来挑战，如何高效精准检测目标对象日益成为行业亟待解决的难题。

当前对象检测的方法主要有：人工检测的对象检测方法；借助硬件设备和对象本身的标识码的对象检测方法；以及根据海量样本数据训练深度学习模型的对象检测方法。

然而，上述对象检测方法均存在一些问题：前述依赖人工检测的方法，存在人力检测繁琐的问题；前述依赖设备和标识码的方法，存在设备部署复杂的问题；前述深度学习的方法，存在数据采集、学习训练、模型维护复杂的问题。

发明内容

本申请提供一种对象检测的方法、装置及电子设备，用以分割输入图像中的对象区域与非对象区域，获取待检测对象。

第一方面，本申请提供一种对象检测的方法，所述方法包括：

基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值；其中，所述输入图像中包括待检测对象的对象区域；

基于所述各个像素的像素参考值和预设参考值阈值的大小关系，生成包括第一区域和第二区域的显著图；其中，所述第一区域对应所述对象区域，所述第二区域对应所述输入图像的非对象区域；

基于所述显著图像对所述输入图像进行处理，得到融合显著图；其中，所述融合显著图中的对象区域和非对象区域之间的差异度，大于所述输入图像中的对象区域和非对象区域之间的差异度。

通过上述方法，提高对象检测的精准性，实现自动化的对象检测，满足对象检测识别自动化、轻量化和便捷化的应用需求。

在一种可能的设计中，在所述基于所述显著图像对所述输入图像进行处理，得到融合显著图之后，还包括：

对所述融合显著图进行目标识别，确定所述待检测对象。

通过目标识别确认待检测对象的方法，有效提高了对象检测的精准性。

在一种可能的设计中，所述对所述融合显著图进行目标识别，确定所述待检测对象，包括：

获取隶属矩阵和聚类中心；

基于所述隶属矩阵和所述聚类中心，确定当前聚类操作的迭代次数不大于预设迭代步数时，计算目标函数的损失值；其中，所述损失值表示每个所述融合显著图中的像素到所述聚类中心的欧式距离之和；确定所述损失值大于预设误差阈值时，调整所述隶属矩阵以及所述聚类中心；利用调整后的隶属矩阵和聚类中心进行聚类操作；更新所述迭代次数；

确定所述迭代次数大于所述预设迭代步数，或者，确定所述损失值不大于所述预设误差阈值时，结束聚类操作，得到所述融合显著图中像素的聚类结果；

根据所述聚类结果，确定所述待检测对象。

通过调整隶属矩阵以及聚类中心，调整融合显著图中每个对象隶属每个类别的程度，突出融合显著图中第一区域与第二区域第一区域的细微差异，提高了检测出待检测对象的精准性。

在一种可能的设计中，所述基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值，包括：

量化所述输入图像对应的各颜色通道的像素值，建立统计直方图；其中，所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布；

根据所述直方图，将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色；其中，所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色，所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色；

根据对筛除低频颜色后的输入图像做去噪处理，确定所述各个像素的像素参考值。

通过确定各个像素的像素参考值，增加输入图像的局部对比度，提高输入图像中第一区域与第二区域的差异，使得第一区域部分更加突出看，解决在提取输入图像的第一区域存在的灰度级个数减少，局部细节信息缺失的问题。

在一种可能的设计中，所述基于所述各个像素的像素参考值和预设参考值阈值的大小关系，生成包括第一区域和第二区域的显著图，包括：

判定所述各个像素的像素参考值是否大于预设参考值阈值；

若所述像素的像素参考值大于预设参考值阈值，则所述像素值为第一区域；

若所述像素的像素参考值小于等于预设参考值阈值，则所述像素标记为第二区域；

根据所述第一区域和所述第二区域，生成显著图。

通过生成显著图的方法，有效增强输入图像中的第一区域与第二区域之间的差异性。

在一种可能的设计中，所述基于所述显著图像对所述输入图像进行处理，得到融合显著图，包括：

基于所述第一区域与对应所述输入图像的对象区域，按照预设权重，计算两个区域中的各个像素值和值，得到第一融合区域；

基于所述第二区域与对应所述输入图像的非对象区域，按照预设权重，计算两个区域中的各个像素值和值，得到第二融合区域；

根据所述第一融合区域和所述第二融合区域，得到融合显著图。

通过生成融合显著图，解决无法直接将输入图像中各个像素精准划分为不同类别的问题，提高对象检测中分割对象区域以及非对象区域的准确率。

第二方面，本申请提供了一种对象检测的装置，所述装置包括：

计算模块，用于基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值；所述输入图像中包括待检测对象的对象区域；

生成模块，用于基于所述各个像素的像素参考值和预设参考值阈值的大小关系，生成包括第一区域和第二区域的显著图；其中，所述第一区域对应所述对象区域，所述第二区域对应所述输入图像的非对象区域；

融合模块，用于基于所述显著图像对所述输入图像进行处理，得到融合显著图；其中，所述融合显著图中的对象区域和非对象区域之间的差异度，大于所述输入图像中的对象区域和非对象区域之间的差异度。

在一种可能的设计中，所述计算模块，具体用于量化所述输入图像对应的各颜色通道的像素值，建立统计直方图；其中，所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布；根据所述直方图，将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色；其中，所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色，所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色；根据对筛除低频颜色后的输入图像做去噪处理，确定所述各个像素的像素参考值。

在一种可能的设计中，所述生成模块，具体用于判定所述各个像素的像素参考值是否大于预设参考值阈值；若所述像素的像素参考值大于预设参考值阈值，则所述像素值为第一区域；若所述像素的像素参考值小于等于预设参考值阈值，则所述像素标记为第二区域；根据所述第一区域和所述第二区域，生成显著图。

在一种可能的设计中，所述融合模块，具体用于基于所述第一区域与对应所述输入图像的对象区域，按照预设权重，计算两个区域中的各个像素值和值，得到第一融合区域；基于所述第二区域与对应所述输入图像的非对象区域，按照预设权重，计算两个区域中的各个像素值和值，得到第二融合区域；根据所述第一融合区域和所述第二融合区域，得到融合显著图。

第三个方面，本申请提供了一种电子设备，所述电子设备包括：

存储器，用于存放计算机程序；

处理器，用于执行所述存储器上所存放的计算机程序时，实现上述的一种生成图像的方法步骤。

第四个方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述的一种生成图像的方法步骤。

上述第二方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明，这里不再重复赘述。

附图说明

图1为本申请提供的一种对象检测的方法的流程图；

图2为本申请提供的一种包含待检测对象的输入图像的示意图；

图3为本申请提供的一种确定输入图像各个像素的像素参考值的方法的流程图；

图4为本申请提供的一种根据输入图像生成的显著图的示意图；

图5为本申请提供的一种输入图像生成的融合显著图的示意图；

图6为本申请提供的一种输入图像生成的目标图像的示意图；

图7为本申请提供的一种基于改进的k-means聚类算法的流程图；

图8为本申请提供的一种对象检测的装置的示意图；

图9为本申请提供的一种电子设备的结构的示意图。

具体实施方式

本申请实施例提供了一种对象检测的方法、装置及电子设备，解决现有技术中利用图像分析方法实现对象检测的过程繁琐且复杂的问题。

根据本申请实施例提供的方法，不需要进行复杂的设备部署，可以通过一个摄像头采集任意场景下的输入图像，并且不需要训练深度学习模型，便可以直接对输入图像作预处理操作，生成对象区域相对于非对象区域更为明显的融合显著图。在此基础上，再通过聚类算法精准分割融合显著图中的对象区域与非对象区域，实现自动化的对象检测，现对于现有技术来说对象检测过程更为简洁，从而满足对象检测识别自动化、轻量化和便捷化的应用需求。

下面结合附图对本申请实施例所提供的方法作出进一步详细说明。

参阅图1所示，本申请实施例提供了一种对象检测的方法，具体流程如下：

步骤101：基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值；

举例来说，输入图像是包含待检测的对象区域的图像。如果输入图像是通过普通摄像头采集到的包含有待检测的对象区域的彩色三通道图像，其中，输入图像可以如图2所示：白色部分表示输入图像中包含待检测的对象区域，其他区域为未包含对象的非对象区域，即背景区域。

本申请实施例中可以基于改进的直方图均衡化处理，生成输入图像的显著图，改进的直方图均衡化处理可以用来增加输入图像的局部对比度，提高输入图像中第一区域与第二区域的差异，使得第一区域部分更加突出。其中，第一区域对应输入图像的对象区域，第二区域对应输入图像的非对象区域。

相比现有的直方图均衡化，解决在提取输入图像的第一区域存在的灰度级个数减少，局部细节信息缺失的问题。

其中，直方图是对图像像素的统计分布，它统计了每个像素的数量。直方图均衡化就是将原始的直方图拉伸，使之均匀分布在全部灰度范围内，从而增强图像的对比度。直方图均衡化的中心思想是对图像进行非线性拉伸，把输入图像的灰度直方图从比较集中的某个区域变成在全部灰度范围内的均匀分布。在一幅图像中，明亮图像的直方图倾向于灰度级高的一侧，灰暗图像的直方图倾向于灰度级低的一侧，如果一副图像占有全部可能的灰度级并且分布均匀，则这样的图像有高对比度和多变的灰度色调。基于改进直方图均衡化，生成输入图像的显著图，具体实现方式可以是：

首先通过量化输入图像的颜色通道，建立输入图像的直方图，计算输入图像中每个颜色的像素数量占输入图像总的像素数量的实际比例，根据预设比例，将实际比例大于预设比例的颜色作为高频颜色，其余颜色作为低频颜色。并将所述低频颜色对应像素的颜色以直方图中排序距离最近的高频颜色替代，筛除输入图像中的低频颜色，得到第一图像。

然后针对第一图像，进行颜色空间平滑操作，改善第一图像中每个颜色对应像素的显著性值，并且将改善后的显著性值重新分配给第一图像中的每一个像素，再通过高斯滤波以及归一化处理，确定第一图像的各个像素的像素参考值。

具体来说，针对输入图像建立统计直方图，以直方图为邻域，将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色，根据对筛除低频颜色后的输入图像做去噪处理，确定所述各个像素的像素参考值。

根据上述方法，本申请实施例中，提供一种确定输入图像各个像素的像素参考值的方法，参见图3所示，具体流程如下：

步骤301：量化所述输入图像对应的各颜色通道的像素值，建立统计直方图；

其中，所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布。

输入图像的每个像素都含有相应的颜色信息，针对输入图像的像素坐标位置从上至下、从左至右依次遍历，统计输入图像的像素中所含的所有的颜色数量，同时统计每个颜色对应的像素数量。其中，所述颜色数量表示输入图像中包含的不同颜色的总数，所述像素数量表示某一种颜色所包含的像素在输入图像中总数量。

根据输入图像的颜色数量以及像素数量，建立统计直方图，在所述直方图中，可以将输入图像所含的颜色数量作为X轴，以每个颜色对应的像素数量作为Y轴，并且根据所述像素数量的大小按照从大到小的递减顺序排列。因此，在直方图中，统计了输入图像包含的每一种颜色的像素数量，并且将在输入图像的像素中出现最多的颜色作为直方图的第一列，将在输入图像的像素中出现最少的颜色作为直方图的最后一列。

通过输入图像的直方图，表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布，较为直观地传达了输入图像中有关颜色数量与像素数量之间的联系。

步骤302：根据所述直方图，筛除在所述输入图像中颜色对应的像素数量占比不高于预设比例的颜色，生成第一图像；

由于具有相同颜色值的像素具有相同的显著性特征，为了节约图像处理中的计算开支，本申请实施例中通过筛除在所述输入图像的像素中出现频率不高于预设比例的低频颜色，并将低频颜色替换为在所述输入图像的像素中出现频率高于预设比例的高频颜色，保留下来的高频颜色有效增强了输入图像中第一区域与第二区域的差异。

具体来说，首先获取一个预设比例，其中，预设比例可以设置为95％。根据直方图，将输入图像中每个颜色的像素数量除以输入图像总的像素数量，得到输入图像中每个颜色的像素数量的实际比例。比较实际比例与预设比例的大小：若实际比例大于预设比例，那么对应颜色作为高频颜色，并且所述高频颜色对应的像素均包含所述高频颜色；若实际比例小于或者等于预设比例，那么对应的颜色作为低频颜色，并且所述低频颜色对应的像素均包含所述低频颜色。

根据直方图对输入图像所含颜色对应的像素数量的统计分布的排列顺序，将所有低频颜色替换为在直方图中排序距离最近的高频颜色。

举例来说，定义按照直方图降序排列的最后一个高频颜色为第一颜色，在这里，所有低频颜色对应像素的颜色都将被替换为第一颜色。

通过颜色替换的处理，减少了输入图像的颜色数量，在这里将减少颜色数量的图像命名为第一图像。因此，通过使用输入图像的高频颜色替换低频颜色生成第一图像，在这里第一图像使用少量的色彩便提高了对象检测中显著性与第二区域的差异，并且实现优先为图像分配所需计算资源，有效缩短图像计算所用时长。

步骤303：对所述第一图像进行去噪处理，确定输入图像各个像素的像素参考值。

为了进一步保持第一图像原有的显著性信息，对第一图像做去噪处理，所述去噪处理分为颜色空间平滑、高斯滤波以及归一化处理，在此分别上述去噪处理作如下说明：

在第一图像中，存在相似颜色被数量化为不同显著性值的可能，为了减少上述由于随机性给显著性结果引入的噪声，采用颜色空间平滑的处理改善第一图像的显著性值：通过对第一图像中每个颜色的相似颜色显著性值计算第一加权平均值，使用所述第一加权平均值替换第一图像中每个颜色的显著性值。根据第一图像中的每个像素对应的颜色，为每个像素分配对应颜色的显著性值。

为了更好去除噪声，在此做高斯滤波以及归一化处理。针对所述经过颜色空间平滑处理的图像中的每一个像素点，通过对每一个像素点本身的像素值以及所述像素点邻域内的其他的像素值计算第二加权平均值，并将所述第二加权平均值赋值给所述像素点，确定输入图像各个像素的像素参考值。

因此，通过上述去噪处理确定输入图像各个像素的像素参考值，相比第一图像去除多余的噪声，并使得第一区域更加突出。

步骤102：基于所述显著图像对所述输入图像进行处理，得到融合显著图；

在本申请实施例中显著图的特征是：增强输入图像的第一区域以及第二区域的对比度，表征输入图像的第一区域与第二区域的差异信息。

为了实现对对象的精准检测，需要在采集到的图像中确定出第一区域以及第二区域，其中，第一区域表示包含对象的区域，第二区域表示未包含对象的区域。

具体来说，生成显著图的方式可以是：

基于所述各个像素的像素参考值与预设阈值比较：若像素参考值大于预设阈值则将该像素参考值对应的像素标记为第一区域；若像素参考值小于或者等于预设阈值则将该像素参考值对应的像素标记为第二区域。根据得到输入图像中的第一区域以及第二区域，生成输入图像的显著图。生成的显著图有效增强输入图像中的对象区域，抑制输入图像中的非对象区域。

在这里，生成的显著图可以如图4所示：白色区域为划分的第一区域，黑色区域为划分的第二区域。

举例来说，比较输入图像中各个像素的像素参考值和预设参考值阈值的大小关系：若所述像素值大于所述预设阈值，则将所述像素值对应像素标记为第一区域；若所述像素值不大于所述预设阈值，则将所述像素值对应的像素标记为第二区域；生成显著图。

初始化预设阈值，将预设阈值与输入图像中各个像素的像素参考值比较：若输入图像中各个像素的像素参考值大于预设阈值，那么将输入图像中各个像素的像素参考值置1，并且将对应像素标记为第一区域；若输入图像中各个像素的像素参考值小于或等于预设阈值，那么将输入图像中各个像素的像素参考值置0，并且将对应像素标记为第二区域。

其中，像素值置1的像素对应的颜色为白色，像素值置0的像素对应的颜色为黑色，针对标记的第一区域和第二区域进行划分，生成输入图像的显著图，所述显著图为通过黑白两种颜色划分第一区域以及第二区域第一区域的三通道二值图像。

通过上述比较第二图像的像素值与预设阈值，划分第一区域与第二区域第一区域，生成显著图，有效增强输入图像中的第一区域与第二区域第一区域之间的差异性。

步骤103：基于所述显著图像对所述输入图像进行处理，得到融合显著图。

图像融合是指将多幅图像，在经过去噪、配准等预处理后，再依据某些融合规则合成一幅图像的过程。因为，经过融合后的融合图像含有所有源图像的显著性信息，抑制源图像中非显著性信息以及噪声信息，并且不含有任何人为信息，所以融合图像对显著性目标的描述更清晰和准确，更适合图像后续的处理。

图像融合有很多种具体实现的方法，例如：像素级图像融合的方法、特征级图像融合的方法、决策级图像融合的方法等，在本申请实施例中，以采用像素级图像融合的方法为例，对其他图像融合的方法不做具体阐述。

应用像素级图像融合的方法，根据融合规则直接对输入图像以及显著图基于像素的特征进行融合，生成融合显著图。其中，生成的融合显著图包含输入图像的原始细节信息，以及显著图的第一区域与第二区域的特征差异信息。通过该方法可以保留输入图像以及显著图最多的信息，使得生成的融合显著图的融合准确性最高。

举例来说，为了抑制输入图像的噪声以及抑制第二区域对对象检测的精准性带来的不良影响，获取第一权重以及第二权重：将第一权重赋值给输入图像中所有的像素值；将第二权重赋值给显著图中所有的像素值。根据对赋值后的输入图像的像素值与赋值后显著图中对应的像素值求和，使输入图像与显著图融合，生成融合显著图，达到增强第一区域的目的。其中，上述的第一权重以及第二权重可以分别取值为0.5与0.5。

融合显著图可以如图5所示：白色区域为输入图像中待检测对象的对象区域与显著图中第一区域的叠加，其他部分为输入图像非对象区域与显著图中第二区域的叠加。

由于融合显著图根据输入图像以及显著图生成，因此所述融合显著图不仅保持输入图像的原始细节信息，还增强了输入图像的对象区域。并且通过融合显著图，解决针对输入图像偏暗、对比度低的情况下，对象检测效果差的问题，提升对象检测在采集输入图像上的泛用性。

在此完成对输入图像的预处理操作，融合显著图还将作为输入为后续的提升图像分割的精准度起到重要作用。

为了提高对象检测的准确度，实现对第一区域与第二区域第一区域的精准划分，本申请实施例还提出一种对所述融合显著图进行目标识别，确定所述待检测对象的方法，通过该方法可以有效提高目标检测的精准性。

在此将融合显著图中的像素作为样本，针对融合显著图中的样本进行划分，通过使划分相似度相近的样本到同一类别，划分相似度较远的样本到不同类别，实现对融合显著图中第一区域与第二区域的分割，也就是实现针对输入图像待检测对象的对象区域以及非对象区域的精准划分，完成对象检测，并生成目标图像作为输出，表示图像分割的检测结果。

举例来说，可以基于改进的k-means聚类算法划分融合显著图中第一区域与第二区域，基于改进的k-means聚类算法是一种基于模糊划分的模糊聚类分析法，首先初始化融合显著图中待分样本的隶属矩阵与聚类中心，然后按照最优原则进行分类，经过多次迭代更新隶属矩阵与聚类中心，直到满足预设条件将分割结果输出为生成的目标图像。

目标图像可以如图6所示：白色区域为通过基于改进的k-means聚类算法分割出的第一区域，黑色区域为通过基于改进的k-means聚类算法分割出的第二区域。

参见图7所示，基于改进的k-means聚类算法划分融合显著图中第一区域与第二区域方法的流程如下：

步骤701：获取融合显著图；

为了准确分割融合显著图中的第一区域与第二区域，将经过预处理操作生成的融合显著图作为输入图像输入到图像分割模型中，并且在这里将融合显著图作为样本集，将融合显著图中的像素作为待分类的样本。

在这里使用融合显著图，优化了直接使用输入图像可能存在噪声，以及抑制输入图像中第二区域带来的不良影响，使得聚类后的分割结果更加精准。

步骤702：获取对所述融合显著图进行聚类操作的隶属矩阵和聚类中心；

获取隶属矩阵以及聚类中心，并且可以使用0-1之间的随机数初始化隶属矩阵以及聚类中心。

由于传统的k-means聚类算法存在无法明确划分图像的显著性与非显著性对象的问题，本申请实施例基于改进的k-means聚类算法引入隶属度，将隶属度作为权重作加权平均，并通过在分类过程中不断调整隶属度，以此提高图像分割的准确性。在此，若隶属度越高，则表示样本越靠近聚类中心；反之若隶属度越低，则表示样本越远离聚类中心。

在分类过程中，某一个样本可以以某一个隶属度隶属于某一个类别，所述某一个样本还可以以另一个隶属度隶属于另一个类别。因此，任意一个样本可以以不同隶属度隶属于不同的类别。

在此，通过隶属矩阵更好表示样本集中的样本的隶属度，并且使用0-1之间的随机数初始化隶属矩阵，所述隶属矩阵参见公式1：

如上述公式所示，融合显著图的隶属矩阵可以是一个C×N的矩阵，表示将样本集中N个样本划分为C个类别，其中，样本集中的N个样本可以表示为X＝{x₁,x₂,...,x_i,...,x_N}，为K个类的聚类中心可以表示为C＝{c₁,c₂,...,c_j,...,c_K}，在此使用0-1之间的随机数初始化所述聚类中心，u_ij表示第i个样本隶属于第j个类别的隶属度，并且任意一个样本属于不同类别的隶属度之和为1。

步骤703：判定当前聚类操作的迭代次数是否小于预设迭代步数；

为提高算法的运算速度，可以预先设定一个预设迭代步数，通过比较当前聚类操作的迭代次数与预设迭代步数的大小，判定是继续迭代进行聚类操作，还是结束聚类操作输出聚类结果。

若是迭代次数小于或者等于预设迭代步数时，执行步骤704；若是迭代次数大于预设迭代步数时，执行步骤706。

步骤704：计算目标函数的损失值，判定损失值是否小于预设误差阈值；

所述目标函数用于计算在图像分割过程中的损失值，聚类的过程就是减小目标函数的损失值的过程，目标函数的损失值为各个样本到各个聚类中心的欧式距离之和，根据目标函数，计算损失值的方法如下公式2所示：

如上述公式2所示，其中，J_m表示目标函数的损失值，若损失值越小，则目标函数收敛，聚类效果越好；若损失值越大，则目标函数误差值大，聚类效果越差。

根据预先设定的预设误差阈值，比较所述损失值与预设误差阈值的大小：若是损失值不大于预设误差阈值时，则执行步骤706；若是损失值大于预设误差阈值时，则执行步骤705。

步骤705：更新隶属矩阵以及聚类中心；

根据目标函数得知：通过隶属矩阵与聚类中心计算的目标函数的损失值越小，得到的聚类效果越好，因此，在这里，为得到最好的聚类效果，使得步骤704中公式2的目标函数的损失值最小，应用数学微分的计算方法对步骤704中公式2的目标函数求偏导，确定所述目标函数得到最小值时，对应的所述隶属矩阵以及所述聚类中心：

通过更新隶属矩阵，使精确划分融合显著图中的第一区域与第二区域，所述隶属矩阵的计算方式如下公式3所示：

如上述公式所述，其中，u_ij表示样本x_i到聚类中心c_j的隶属度，d²(x_i,c_j)表示样本x_i到聚类中心c_j的距离，d²(x_i,c_k)表示样本x_i到聚类中心c_k的距离，上述距离可以用欧式距离计算得到，m表示聚类划分的总类别。

根据更新的隶属矩阵，更新聚类中心，聚类中心的计算方法如下公式4所示：

如上述公式所示，其中，c_j表示聚类中心。

根据更新后的隶属矩阵以及聚类中心进行聚类操作，并且将迭代次数增加一次，转回前面聚类步骤703，基于新的隶属矩阵以及聚类中心继续进行聚类操作。

通过更新隶属矩阵以及聚类中心，调整融合显著图中每个对象隶属每个类别的程度，突出融合显著图中第一区域与第二区域的细微差异，提高了分割的准确性。

步骤706：输出生成的目标图像。

根据隶属矩阵，取隶属矩阵中的最大隶属度，在此所述最大隶属度表示某个样本以最大隶属度隶属于对应的类别，以所述对应的类别作为聚类的结果，输出为生成的目标图像。

本申请实施例中提供一种更加灵活的聚类方法，通过使用融合显著图作为输入，针对每个对象属于每个类的程度赋予一个隶属度，并更新初始化的隶属矩阵和聚类中心减小聚类中目标函数的误差值的方法，解决无法直接将输入图像的显著性对象精准划分为不同类别的问题，该方法在对图像第一区域与第二区域的分割上具有较好效果。有效解决对象检测过程繁琐且复杂的问题，并且提高了对象检测中分割对象图像的精准性。

基于同一发明构思，本申请还提供了一种对象检测的装置，用以解决现有技术中利用图像分析方法实现对象检测的过程繁琐且复杂的问题，有效满足对象检测识别自动化、轻量化和便捷化的应用需求，参见图8，该装置包括：

计算模块801，用于基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值；所述输入图像中包括待检测对象的对象区域。

生成模块802，用于基于所述各个像素的像素参考值和预设参考值阈值的大小关系，生成包括第一区域和第二区域的显著图；其中，所述第一区域对应所述对象区域，所述第二区域对应所述输入图像的非对象区域。

融合模块803，用于基于所述显著图像对所述输入图像进行处理，得到融合显著图；其中，所述融合显著图中的对象区域和非对象区域之间的差异度，大于所述输入图像中的对象区域和非对象区域之间的差异度。

在一种可能的设计中，所述计算模块801，具体用于量化所述输入图像对应的各颜色通道的像素值，建立统计直方图；其中，所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布；根据所述直方图，将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色；其中，所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色，所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色；根据对筛除低频颜色后的输入图像做去噪处理，确定所述各个像素的像素参考值。

在一种可能的设计中，所述生成模块802，具体用于判定所述各个像素的像素参考值是否大于预设参考值阈值；若所述像素的像素参考值大于预设参考值阈值，则所述像素值为第一区域；若所述像素的像素参考值小于等于预设参考值阈值，则所述像素标记为第二区域；根据所述第一区域和所述第二区域，生成显著图。

在一种可能的设计中，所述融合模块803，具体用于基于所述第一区域与对应所述输入图像的对象区域，按照预设权重，计算两个区域中的各个像素值和值，得到第一融合区域；基于所述第二区域与对应所述输入图像的非对象区域，按照预设权重，计算两个区域中的各个像素值和值，得到第二融合区域；根据所述第一融合区域和所述第二融合区域，得到融合显著图。

基于上述装置，有效分割待检测对象的对象区域与非对象区域，实现自动化的对象检测，满足对象检测识别精准化、轻量化和便捷化的应用需求。

基于同一发明构思，本申请实施例中还提供了一种电子设备，所述电子设备可以实现前述一种对象检测的装置的功能，参见图9，所述电子设备包括：

至少一个处理器901，以及与至少一个处理器901连接的存储器902，本申请实施例中不限定处理器901与存储器902之间的具体连接介质，图9中是以处理器901和存储器902之间通过总线900连接为例。总线900在图9中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。总线900可以分为地址总线、数据总线、控制总线等，为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。或者，处理器901也可以称为控制器，对于名称不做限制。

在本申请实施例中，存储器902存储有可被至少一个处理器901执行的指令，至少一个处理器901通过执行存储器902存储的指令，可以执行前文论述的对象检测的方法。处理器901可以实现图9所示的装置中各个模块的功能。

其中，处理器901是该装置的控制中心，可以利用各种接口和线路连接整个该控制设备的各个部分，通过运行或执行存储在存储器902内的指令以及调用存储在存储器902内的数据，该装置的各种功能和处理数据，从而对该装置进行整体监控。

在一种可能的设计中，处理器901可包括一个或多个处理单元，处理器901可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作装置、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器901中。在一些实施例中，处理器901和存储器902可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器901可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的对象检测的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器902作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器902可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器902是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器902还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

通过对处理器901进行设计编程，可以将前述实施例中介绍的对象检测的方法所对应的代码固化到芯片内，从而使芯片在运行时能够执行图1所示的实施例的对象检测的方法的步骤。如何对处理器901进行设计编程为本领域技术人员所公知的技术，这里不再赘述。

基于同一发明构思，本申请实施例还提供一种存储介质，该存储介质存储有计算机指令，当该计算机指令在计算机上运行时，使得计算机执行前文论述落脚区域的输出方法。

在一些可能的实施方式中，本申请提供的对象检测的方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在装置上运行时，程序代码用于使该控制设备执行本说明书上述描述的根据本申请各种示例性实施方式的对象检测的方法中的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、装置、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种对象检测的方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，在所述基于所述显著图像对所述输入图像进行处理，得到融合显著图之后，还包括：

对所述融合显著图进行目标识别，确定所述待检测对象。

3.如权利要求2所述的方法，其特征在于，所述对所述融合显著图进行目标识别，确定所述待检测对象，包括：

获取隶属矩阵和聚类中心；

根据所述聚类结果，确定所述待检测对象。

4.如权利要求1所述的方法，其特征在于，所述基于输入图像中各像素的邻域像素，确定所述各个像素的像素参考值，包括：

5.如权利要求1所述的方法，其特征在于，所述基于所述各个像素的像素参考值和预设参考值阈值的大小关系，生成包括第一区域和第二区域的显著图，包括：

判定所述各个像素的像素参考值是否大于预设参考值阈值；

根据所述第一区域和所述第二区域，生成显著图。

6.如权利要求1所述的方法，其特征在于，所述基于所述显著图像对所述输入图像进行处理，得到融合显著图，包括：

7.一种对象检测的装置，其特征在于，所述装置包括：

8.如权利要求7所述的装置，其特征在于，所述融合模块，具体用于：

9.一种电子设备，其特征在于，包括：

存储器，用于存放计算机程序；

处理器，用于执行所述存储器上所存放的计算机程序时，实现权利要求1-6中任一项所述的方法步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法步骤。