CN113469976A - 一种对象检测的方法、装置及电子设备 - Google Patents
一种对象检测的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113469976A CN113469976A CN202110762095.0A CN202110762095A CN113469976A CN 113469976 A CN113469976 A CN 113469976A CN 202110762095 A CN202110762095 A CN 202110762095A CN 113469976 A CN113469976 A CN 113469976A
- Authority
- CN
- China
- Prior art keywords
- pixel
- region
- input image
- fusion
- reference value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 52
- 230000004927 fusion Effects 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 72
- 239000003086 colorant Substances 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000013461 design Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000003709 image segmentation Methods 0.000 description 5
- 238000003064 k means clustering Methods 0.000 description 5
- 238000009499 grossing Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000003703 image analysis method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请公开一种对象检测的方法、装置及电子设备,该方法包括通过一个摄像头采集任意场景下包含待检测对象的对象区域的输入图像,然后基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值,比较所述各个像素的像素参考值和预设参考值阈值大小,并且根据比较结果,生成包括第一区域和第二区域的显著图。在此基础上对所述融合显著图进行目标识别,确定所述待检测对象。其中,第一区域与对象区域对应,第二区域与非对象区域对应。基于上述方法可以精准检测输入图像中的待检测对象,实现自动化的对象检测,满足对象检测识别自动化、轻量化和便捷化的应用需求。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种对象检测的方法、装置及电子设备。
背景技术
随着物流行业的快速发展,物流包裹越来越多,海量包裹作为待检测的目标对象为物流公司的周转带来挑战,如何高效精准检测目标对象日益成为行业亟待解决的难题。
当前对象检测的方法主要有:人工检测的对象检测方法;借助硬件设备和对象本身的标识码的对象检测方法;以及根据海量样本数据训练深度学习模型的对象检测方法。
然而,上述对象检测方法均存在一些问题:前述依赖人工检测的方法,存在人力检测繁琐的问题;前述依赖设备和标识码的方法,存在设备部署复杂的问题;前述深度学习的方法,存在数据采集、学习训练、模型维护复杂的问题。
发明内容
本申请提供一种对象检测的方法、装置及电子设备,用以分割输入图像中的对象区域与非对象区域,获取待检测对象。
第一方面,本申请提供一种对象检测的方法,所述方法包括:
基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值;其中,所述输入图像中包括待检测对象的对象区域;
基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图;其中,所述第一区域对应所述对象区域,所述第二区域对应所述输入图像的非对象区域;
基于所述显著图像对所述输入图像进行处理,得到融合显著图;其中,所述融合显著图中的对象区域和非对象区域之间的差异度,大于所述输入图像中的对象区域和非对象区域之间的差异度。
通过上述方法,提高对象检测的精准性,实现自动化的对象检测,满足对象检测识别自动化、轻量化和便捷化的应用需求。
在一种可能的设计中,在所述基于所述显著图像对所述输入图像进行处理,得到融合显著图之后,还包括:
对所述融合显著图进行目标识别,确定所述待检测对象。
通过目标识别确认待检测对象的方法,有效提高了对象检测的精准性。
在一种可能的设计中,所述对所述融合显著图进行目标识别,确定所述待检测对象,包括:
获取隶属矩阵和聚类中心;
基于所述隶属矩阵和所述聚类中心,确定当前聚类操作的迭代次数不大于预设迭代步数时,计算目标函数的损失值;其中,所述损失值表示每个所述融合显著图中的像素到所述聚类中心的欧式距离之和;确定所述损失值大于预设误差阈值时,调整所述隶属矩阵以及所述聚类中心;利用调整后的隶属矩阵和聚类中心进行聚类操作;更新所述迭代次数;
确定所述迭代次数大于所述预设迭代步数,或者,确定所述损失值不大于所述预设误差阈值时,结束聚类操作,得到所述融合显著图中像素的聚类结果;
根据所述聚类结果,确定所述待检测对象。
通过调整隶属矩阵以及聚类中心,调整融合显著图中每个对象隶属每个类别的程度,突出融合显著图中第一区域与第二区域第一区域的细微差异,提高了检测出待检测对象的精准性。
在一种可能的设计中,所述基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值,包括:
量化所述输入图像对应的各颜色通道的像素值,建立统计直方图;其中,所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布;
根据所述直方图,将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色;其中,所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色,所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色;
根据对筛除低频颜色后的输入图像做去噪处理,确定所述各个像素的像素参考值。
通过确定各个像素的像素参考值,增加输入图像的局部对比度,提高输入图像中第一区域与第二区域的差异,使得第一区域部分更加突出看,解决在提取输入图像的第一区域存在的灰度级个数减少,局部细节信息缺失的问题。
在一种可能的设计中,所述基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图,包括:
判定所述各个像素的像素参考值是否大于预设参考值阈值;
若所述像素的像素参考值大于预设参考值阈值,则所述像素值为第一区域;
若所述像素的像素参考值小于等于预设参考值阈值,则所述像素标记为第二区域;
根据所述第一区域和所述第二区域,生成显著图。
通过生成显著图的方法,有效增强输入图像中的第一区域与第二区域之间的差异性。
在一种可能的设计中,所述基于所述显著图像对所述输入图像进行处理,得到融合显著图,包括:
基于所述第一区域与对应所述输入图像的对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第一融合区域;
基于所述第二区域与对应所述输入图像的非对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第二融合区域;
根据所述第一融合区域和所述第二融合区域,得到融合显著图。
通过生成融合显著图,解决无法直接将输入图像中各个像素精准划分为不同类别的问题,提高对象检测中分割对象区域以及非对象区域的准确率。
第二方面,本申请提供了一种对象检测的装置,所述装置包括:
计算模块,用于基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值;所述输入图像中包括待检测对象的对象区域;
生成模块,用于基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图;其中,所述第一区域对应所述对象区域,所述第二区域对应所述输入图像的非对象区域;
融合模块,用于基于所述显著图像对所述输入图像进行处理,得到融合显著图;其中,所述融合显著图中的对象区域和非对象区域之间的差异度,大于所述输入图像中的对象区域和非对象区域之间的差异度。
在一种可能的设计中,所述计算模块,具体用于量化所述输入图像对应的各颜色通道的像素值,建立统计直方图;其中,所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布;根据所述直方图,将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色;其中,所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色,所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色;根据对筛除低频颜色后的输入图像做去噪处理,确定所述各个像素的像素参考值。
在一种可能的设计中,所述生成模块,具体用于判定所述各个像素的像素参考值是否大于预设参考值阈值;若所述像素的像素参考值大于预设参考值阈值,则所述像素值为第一区域;若所述像素的像素参考值小于等于预设参考值阈值,则所述像素标记为第二区域;根据所述第一区域和所述第二区域,生成显著图。
在一种可能的设计中,所述融合模块,具体用于基于所述第一区域与对应所述输入图像的对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第一融合区域;基于所述第二区域与对应所述输入图像的非对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第二融合区域;根据所述第一融合区域和所述第二融合区域,得到融合显著图。
第三个方面,本申请提供了一种电子设备,所述电子设备包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,实现上述的一种生成图像的方法步骤。
第四个方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种生成图像的方法步骤。
上述第二方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。
附图说明
图1为本申请提供的一种对象检测的方法的流程图;
图2为本申请提供的一种包含待检测对象的输入图像的示意图;
图3为本申请提供的一种确定输入图像各个像素的像素参考值的方法的流程图;
图4为本申请提供的一种根据输入图像生成的显著图的示意图;
图5为本申请提供的一种输入图像生成的融合显著图的示意图;
图6为本申请提供的一种输入图像生成的目标图像的示意图;
图7为本申请提供的一种基于改进的k-means聚类算法的流程图;
图8为本申请提供的一种对象检测的装置的示意图;
图9为本申请提供的一种电子设备的结构的示意图。
具体实施方式
本申请实施例提供了一种对象检测的方法、装置及电子设备,解决现有技术中利用图像分析方法实现对象检测的过程繁琐且复杂的问题。
根据本申请实施例提供的方法,不需要进行复杂的设备部署,可以通过一个摄像头采集任意场景下的输入图像,并且不需要训练深度学习模型,便可以直接对输入图像作预处理操作,生成对象区域相对于非对象区域更为明显的融合显著图。在此基础上,再通过聚类算法精准分割融合显著图中的对象区域与非对象区域,实现自动化的对象检测,现对于现有技术来说对象检测过程更为简洁,从而满足对象检测识别自动化、轻量化和便捷化的应用需求。
下面结合附图对本申请实施例所提供的方法作出进一步详细说明。
参阅图1所示,本申请实施例提供了一种对象检测的方法,具体流程如下:
步骤101:基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值;
举例来说,输入图像是包含待检测的对象区域的图像。如果输入图像是通过普通摄像头采集到的包含有待检测的对象区域的彩色三通道图像,其中,输入图像可以如图2所示:白色部分表示输入图像中包含待检测的对象区域,其他区域为未包含对象的非对象区域,即背景区域。
本申请实施例中可以基于改进的直方图均衡化处理,生成输入图像的显著图,改进的直方图均衡化处理可以用来增加输入图像的局部对比度,提高输入图像中第一区域与第二区域的差异,使得第一区域部分更加突出。其中,第一区域对应输入图像的对象区域,第二区域对应输入图像的非对象区域。
相比现有的直方图均衡化,解决在提取输入图像的第一区域存在的灰度级个数减少,局部细节信息缺失的问题。
其中,直方图是对图像像素的统计分布,它统计了每个像素的数量。直方图均衡化就是将原始的直方图拉伸,使之均匀分布在全部灰度范围内,从而增强图像的对比度。直方图均衡化的中心思想是对图像进行非线性拉伸,把输入图像的灰度直方图从比较集中的某个区域变成在全部灰度范围内的均匀分布。在一幅图像中,明亮图像的直方图倾向于灰度级高的一侧,灰暗图像的直方图倾向于灰度级低的一侧,如果一副图像占有全部可能的灰度级并且分布均匀,则这样的图像有高对比度和多变的灰度色调。基于改进直方图均衡化,生成输入图像的显著图,具体实现方式可以是:
首先通过量化输入图像的颜色通道,建立输入图像的直方图,计算输入图像中每个颜色的像素数量占输入图像总的像素数量的实际比例,根据预设比例,将实际比例大于预设比例的颜色作为高频颜色,其余颜色作为低频颜色。并将所述低频颜色对应像素的颜色以直方图中排序距离最近的高频颜色替代,筛除输入图像中的低频颜色,得到第一图像。
然后针对第一图像,进行颜色空间平滑操作,改善第一图像中每个颜色对应像素的显著性值,并且将改善后的显著性值重新分配给第一图像中的每一个像素,再通过高斯滤波以及归一化处理,确定第一图像的各个像素的像素参考值。
具体来说,针对输入图像建立统计直方图,以直方图为邻域,将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色,根据对筛除低频颜色后的输入图像做去噪处理,确定所述各个像素的像素参考值。
根据上述方法,本申请实施例中,提供一种确定输入图像各个像素的像素参考值的方法,参见图3所示,具体流程如下:
步骤301:量化所述输入图像对应的各颜色通道的像素值,建立统计直方图;
其中,所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布。
输入图像的每个像素都含有相应的颜色信息,针对输入图像的像素坐标位置从上至下、从左至右依次遍历,统计输入图像的像素中所含的所有的颜色数量,同时统计每个颜色对应的像素数量。其中,所述颜色数量表示输入图像中包含的不同颜色的总数,所述像素数量表示某一种颜色所包含的像素在输入图像中总数量。
根据输入图像的颜色数量以及像素数量,建立统计直方图,在所述直方图中,可以将输入图像所含的颜色数量作为X轴,以每个颜色对应的像素数量作为Y轴,并且根据所述像素数量的大小按照从大到小的递减顺序排列。因此,在直方图中,统计了输入图像包含的每一种颜色的像素数量,并且将在输入图像的像素中出现最多的颜色作为直方图的第一列,将在输入图像的像素中出现最少的颜色作为直方图的最后一列。
通过输入图像的直方图,表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布,较为直观地传达了输入图像中有关颜色数量与像素数量之间的联系。
步骤302:根据所述直方图,筛除在所述输入图像中颜色对应的像素数量占比不高于预设比例的颜色,生成第一图像;
由于具有相同颜色值的像素具有相同的显著性特征,为了节约图像处理中的计算开支,本申请实施例中通过筛除在所述输入图像的像素中出现频率不高于预设比例的低频颜色,并将低频颜色替换为在所述输入图像的像素中出现频率高于预设比例的高频颜色,保留下来的高频颜色有效增强了输入图像中第一区域与第二区域的差异。
具体来说,首先获取一个预设比例,其中,预设比例可以设置为95%。根据直方图,将输入图像中每个颜色的像素数量除以输入图像总的像素数量,得到输入图像中每个颜色的像素数量的实际比例。比较实际比例与预设比例的大小:若实际比例大于预设比例,那么对应颜色作为高频颜色,并且所述高频颜色对应的像素均包含所述高频颜色;若实际比例小于或者等于预设比例,那么对应的颜色作为低频颜色,并且所述低频颜色对应的像素均包含所述低频颜色。
根据直方图对输入图像所含颜色对应的像素数量的统计分布的排列顺序,将所有低频颜色替换为在直方图中排序距离最近的高频颜色。
举例来说,定义按照直方图降序排列的最后一个高频颜色为第一颜色,在这里,所有低频颜色对应像素的颜色都将被替换为第一颜色。
通过颜色替换的处理,减少了输入图像的颜色数量,在这里将减少颜色数量的图像命名为第一图像。因此,通过使用输入图像的高频颜色替换低频颜色生成第一图像,在这里第一图像使用少量的色彩便提高了对象检测中显著性与第二区域的差异,并且实现优先为图像分配所需计算资源,有效缩短图像计算所用时长。
步骤303:对所述第一图像进行去噪处理,确定输入图像各个像素的像素参考值。
为了进一步保持第一图像原有的显著性信息,对第一图像做去噪处理,所述去噪处理分为颜色空间平滑、高斯滤波以及归一化处理,在此分别上述去噪处理作如下说明:
在第一图像中,存在相似颜色被数量化为不同显著性值的可能,为了减少上述由于随机性给显著性结果引入的噪声,采用颜色空间平滑的处理改善第一图像的显著性值:通过对第一图像中每个颜色的相似颜色显著性值计算第一加权平均值,使用所述第一加权平均值替换第一图像中每个颜色的显著性值。根据第一图像中的每个像素对应的颜色,为每个像素分配对应颜色的显著性值。
为了更好去除噪声,在此做高斯滤波以及归一化处理。针对所述经过颜色空间平滑处理的图像中的每一个像素点,通过对每一个像素点本身的像素值以及所述像素点邻域内的其他的像素值计算第二加权平均值,并将所述第二加权平均值赋值给所述像素点,确定输入图像各个像素的像素参考值。
因此,通过上述去噪处理确定输入图像各个像素的像素参考值,相比第一图像去除多余的噪声,并使得第一区域更加突出。
步骤102:基于所述显著图像对所述输入图像进行处理,得到融合显著图;
在本申请实施例中显著图的特征是:增强输入图像的第一区域以及第二区域的对比度,表征输入图像的第一区域与第二区域的差异信息。
为了实现对对象的精准检测,需要在采集到的图像中确定出第一区域以及第二区域,其中,第一区域表示包含对象的区域,第二区域表示未包含对象的区域。
具体来说,生成显著图的方式可以是:
基于所述各个像素的像素参考值与预设阈值比较:若像素参考值大于预设阈值则将该像素参考值对应的像素标记为第一区域;若像素参考值小于或者等于预设阈值则将该像素参考值对应的像素标记为第二区域。根据得到输入图像中的第一区域以及第二区域,生成输入图像的显著图。生成的显著图有效增强输入图像中的对象区域,抑制输入图像中的非对象区域。
在这里,生成的显著图可以如图4所示:白色区域为划分的第一区域,黑色区域为划分的第二区域。
举例来说,比较输入图像中各个像素的像素参考值和预设参考值阈值的大小关系:若所述像素值大于所述预设阈值,则将所述像素值对应像素标记为第一区域;若所述像素值不大于所述预设阈值,则将所述像素值对应的像素标记为第二区域;生成显著图。
初始化预设阈值,将预设阈值与输入图像中各个像素的像素参考值比较:若输入图像中各个像素的像素参考值大于预设阈值,那么将输入图像中各个像素的像素参考值置1,并且将对应像素标记为第一区域;若输入图像中各个像素的像素参考值小于或等于预设阈值,那么将输入图像中各个像素的像素参考值置0,并且将对应像素标记为第二区域。
其中,像素值置1的像素对应的颜色为白色,像素值置0的像素对应的颜色为黑色,针对标记的第一区域和第二区域进行划分,生成输入图像的显著图,所述显著图为通过黑白两种颜色划分第一区域以及第二区域第一区域的三通道二值图像。
通过上述比较第二图像的像素值与预设阈值,划分第一区域与第二区域第一区域,生成显著图,有效增强输入图像中的第一区域与第二区域第一区域之间的差异性。
步骤103:基于所述显著图像对所述输入图像进行处理,得到融合显著图。
图像融合是指将多幅图像,在经过去噪、配准等预处理后,再依据某些融合规则合成一幅图像的过程。因为,经过融合后的融合图像含有所有源图像的显著性信息,抑制源图像中非显著性信息以及噪声信息,并且不含有任何人为信息,所以融合图像对显著性目标的描述更清晰和准确,更适合图像后续的处理。
图像融合有很多种具体实现的方法,例如:像素级图像融合的方法、特征级图像融合的方法、决策级图像融合的方法等,在本申请实施例中,以采用像素级图像融合的方法为例,对其他图像融合的方法不做具体阐述。
应用像素级图像融合的方法,根据融合规则直接对输入图像以及显著图基于像素的特征进行融合,生成融合显著图。其中,生成的融合显著图包含输入图像的原始细节信息,以及显著图的第一区域与第二区域的特征差异信息。通过该方法可以保留输入图像以及显著图最多的信息,使得生成的融合显著图的融合准确性最高。
举例来说,为了抑制输入图像的噪声以及抑制第二区域对对象检测的精准性带来的不良影响,获取第一权重以及第二权重:将第一权重赋值给输入图像中所有的像素值;将第二权重赋值给显著图中所有的像素值。根据对赋值后的输入图像的像素值与赋值后显著图中对应的像素值求和,使输入图像与显著图融合,生成融合显著图,达到增强第一区域的目的。其中,上述的第一权重以及第二权重可以分别取值为0.5与0.5。
融合显著图可以如图5所示:白色区域为输入图像中待检测对象的对象区域与显著图中第一区域的叠加,其他部分为输入图像非对象区域与显著图中第二区域的叠加。
由于融合显著图根据输入图像以及显著图生成,因此所述融合显著图不仅保持输入图像的原始细节信息,还增强了输入图像的对象区域。并且通过融合显著图,解决针对输入图像偏暗、对比度低的情况下,对象检测效果差的问题,提升对象检测在采集输入图像上的泛用性。
在此完成对输入图像的预处理操作,融合显著图还将作为输入为后续的提升图像分割的精准度起到重要作用。
为了提高对象检测的准确度,实现对第一区域与第二区域第一区域的精准划分,本申请实施例还提出一种对所述融合显著图进行目标识别,确定所述待检测对象的方法,通过该方法可以有效提高目标检测的精准性。
下面结合附图对本申请实施例所提供的方法作出进一步详细说明。
在此将融合显著图中的像素作为样本,针对融合显著图中的样本进行划分,通过使划分相似度相近的样本到同一类别,划分相似度较远的样本到不同类别,实现对融合显著图中第一区域与第二区域的分割,也就是实现针对输入图像待检测对象的对象区域以及非对象区域的精准划分,完成对象检测,并生成目标图像作为输出,表示图像分割的检测结果。
举例来说,可以基于改进的k-means聚类算法划分融合显著图中第一区域与第二区域,基于改进的k-means聚类算法是一种基于模糊划分的模糊聚类分析法,首先初始化融合显著图中待分样本的隶属矩阵与聚类中心,然后按照最优原则进行分类,经过多次迭代更新隶属矩阵与聚类中心,直到满足预设条件将分割结果输出为生成的目标图像。
目标图像可以如图6所示:白色区域为通过基于改进的k-means聚类算法分割出的第一区域,黑色区域为通过基于改进的k-means聚类算法分割出的第二区域。
参见图7所示,基于改进的k-means聚类算法划分融合显著图中第一区域与第二区域方法的流程如下:
步骤701:获取融合显著图;
为了准确分割融合显著图中的第一区域与第二区域,将经过预处理操作生成的融合显著图作为输入图像输入到图像分割模型中,并且在这里将融合显著图作为样本集,将融合显著图中的像素作为待分类的样本。
在这里使用融合显著图,优化了直接使用输入图像可能存在噪声,以及抑制输入图像中第二区域带来的不良影响,使得聚类后的分割结果更加精准。
步骤702:获取对所述融合显著图进行聚类操作的隶属矩阵和聚类中心;
获取隶属矩阵以及聚类中心,并且可以使用0-1之间的随机数初始化隶属矩阵以及聚类中心。
由于传统的k-means聚类算法存在无法明确划分图像的显著性与非显著性对象的问题,本申请实施例基于改进的k-means聚类算法引入隶属度,将隶属度作为权重作加权平均,并通过在分类过程中不断调整隶属度,以此提高图像分割的准确性。在此,若隶属度越高,则表示样本越靠近聚类中心;反之若隶属度越低,则表示样本越远离聚类中心。
在分类过程中,某一个样本可以以某一个隶属度隶属于某一个类别,所述某一个样本还可以以另一个隶属度隶属于另一个类别。因此,任意一个样本可以以不同隶属度隶属于不同的类别。
在此,通过隶属矩阵更好表示样本集中的样本的隶属度,并且使用0-1之间的随机数初始化隶属矩阵,所述隶属矩阵参见公式1:
如上述公式所示,融合显著图的隶属矩阵可以是一个C×N的矩阵,表示将样本集中N个样本划分为C个类别,其中,样本集中的N个样本可以表示为X={x1,x2,...,xi,...,xN},为K个类的聚类中心可以表示为C={c1,c2,...,cj,...,cK},在此使用0-1之间的随机数初始化所述聚类中心,uij表示第i个样本隶属于第j个类别的隶属度,并且任意一个样本属于不同类别的隶属度之和为1。
步骤703:判定当前聚类操作的迭代次数是否小于预设迭代步数;
为提高算法的运算速度,可以预先设定一个预设迭代步数,通过比较当前聚类操作的迭代次数与预设迭代步数的大小,判定是继续迭代进行聚类操作,还是结束聚类操作输出聚类结果。
若是迭代次数小于或者等于预设迭代步数时,执行步骤704;若是迭代次数大于预设迭代步数时,执行步骤706。
步骤704:计算目标函数的损失值,判定损失值是否小于预设误差阈值;
所述目标函数用于计算在图像分割过程中的损失值,聚类的过程就是减小目标函数的损失值的过程,目标函数的损失值为各个样本到各个聚类中心的欧式距离之和,根据目标函数,计算损失值的方法如下公式2所示:
如上述公式2所示,其中,Jm表示目标函数的损失值,若损失值越小,则目标函数收敛,聚类效果越好;若损失值越大,则目标函数误差值大,聚类效果越差。
根据预先设定的预设误差阈值,比较所述损失值与预设误差阈值的大小:若是损失值不大于预设误差阈值时,则执行步骤706;若是损失值大于预设误差阈值时,则执行步骤705。
步骤705:更新隶属矩阵以及聚类中心;
根据目标函数得知:通过隶属矩阵与聚类中心计算的目标函数的损失值越小,得到的聚类效果越好,因此,在这里,为得到最好的聚类效果,使得步骤704中公式2的目标函数的损失值最小,应用数学微分的计算方法对步骤704中公式2的目标函数求偏导,确定所述目标函数得到最小值时,对应的所述隶属矩阵以及所述聚类中心:
通过更新隶属矩阵,使精确划分融合显著图中的第一区域与第二区域,所述隶属矩阵的计算方式如下公式3所示:
如上述公式所述,其中,uij表示样本xi到聚类中心cj的隶属度,d2(xi,cj)表示样本xi到聚类中心cj的距离,d2(xi,ck)表示样本xi到聚类中心ck的距离,上述距离可以用欧式距离计算得到,m表示聚类划分的总类别。
根据更新的隶属矩阵,更新聚类中心,聚类中心的计算方法如下公式4所示:
如上述公式所示,其中,cj表示聚类中心。
根据更新后的隶属矩阵以及聚类中心进行聚类操作,并且将迭代次数增加一次,转回前面聚类步骤703,基于新的隶属矩阵以及聚类中心继续进行聚类操作。
通过更新隶属矩阵以及聚类中心,调整融合显著图中每个对象隶属每个类别的程度,突出融合显著图中第一区域与第二区域的细微差异,提高了分割的准确性。
步骤706:输出生成的目标图像。
根据隶属矩阵,取隶属矩阵中的最大隶属度,在此所述最大隶属度表示某个样本以最大隶属度隶属于对应的类别,以所述对应的类别作为聚类的结果,输出为生成的目标图像。
本申请实施例中提供一种更加灵活的聚类方法,通过使用融合显著图作为输入,针对每个对象属于每个类的程度赋予一个隶属度,并更新初始化的隶属矩阵和聚类中心减小聚类中目标函数的误差值的方法,解决无法直接将输入图像的显著性对象精准划分为不同类别的问题,该方法在对图像第一区域与第二区域的分割上具有较好效果。有效解决对象检测过程繁琐且复杂的问题,并且提高了对象检测中分割对象图像的精准性。
基于同一发明构思,本申请还提供了一种对象检测的装置,用以解决现有技术中利用图像分析方法实现对象检测的过程繁琐且复杂的问题,有效满足对象检测识别自动化、轻量化和便捷化的应用需求,参见图8,该装置包括:
计算模块801,用于基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值;所述输入图像中包括待检测对象的对象区域。
生成模块802,用于基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图;其中,所述第一区域对应所述对象区域,所述第二区域对应所述输入图像的非对象区域。
融合模块803,用于基于所述显著图像对所述输入图像进行处理,得到融合显著图;其中,所述融合显著图中的对象区域和非对象区域之间的差异度,大于所述输入图像中的对象区域和非对象区域之间的差异度。
在一种可能的设计中,所述计算模块801,具体用于量化所述输入图像对应的各颜色通道的像素值,建立统计直方图;其中,所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布;根据所述直方图,将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色;其中,所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色,所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色;根据对筛除低频颜色后的输入图像做去噪处理,确定所述各个像素的像素参考值。
在一种可能的设计中,所述生成模块802,具体用于判定所述各个像素的像素参考值是否大于预设参考值阈值;若所述像素的像素参考值大于预设参考值阈值,则所述像素值为第一区域;若所述像素的像素参考值小于等于预设参考值阈值,则所述像素标记为第二区域;根据所述第一区域和所述第二区域,生成显著图。
在一种可能的设计中,所述融合模块803,具体用于基于所述第一区域与对应所述输入图像的对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第一融合区域;基于所述第二区域与对应所述输入图像的非对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第二融合区域;根据所述第一融合区域和所述第二融合区域,得到融合显著图。
基于上述装置,有效分割待检测对象的对象区域与非对象区域,实现自动化的对象检测,满足对象检测识别精准化、轻量化和便捷化的应用需求。
基于同一发明构思,本申请实施例中还提供了一种电子设备,所述电子设备可以实现前述一种对象检测的装置的功能,参见图9,所述电子设备包括:
至少一个处理器901,以及与至少一个处理器901连接的存储器902,本申请实施例中不限定处理器901与存储器902之间的具体连接介质,图9中是以处理器901和存储器902之间通过总线900连接为例。总线900在图9中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线900可以分为地址总线、数据总线、控制总线等,为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器901也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器902存储有可被至少一个处理器901执行的指令,至少一个处理器901通过执行存储器902存储的指令,可以执行前文论述的对象检测的方法。处理器901可以实现图9所示的装置中各个模块的功能。
其中,处理器901是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器902内的指令以及调用存储在存储器902内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器901可包括一个或多个处理单元,处理器901可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作装置、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器901中。在一些实施例中,处理器901和存储器902可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器901可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的对象检测的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器902作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器902可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器902是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器902还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器901进行设计编程,可以将前述实施例中介绍的对象检测的方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图1所示的实施例的对象检测的方法的步骤。如何对处理器901进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述落脚区域的输出方法。
在一些可能的实施方式中,本申请提供的对象检测的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在装置上运行时,程序代码用于使该控制设备执行本说明书上述描述的根据本申请各种示例性实施方式的对象检测的方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种对象检测的方法,其特征在于,所述方法包括:
基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值;其中,所述输入图像中包括待检测对象的对象区域;
基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图;其中,所述第一区域对应所述对象区域,所述第二区域对应所述输入图像的非对象区域;
基于所述显著图像对所述输入图像进行处理,得到融合显著图;其中,所述融合显著图中的对象区域和非对象区域之间的差异度,大于所述输入图像中的对象区域和非对象区域之间的差异度。
2.如权利要求1所述的方法,其特征在于,在所述基于所述显著图像对所述输入图像进行处理,得到融合显著图之后,还包括:
对所述融合显著图进行目标识别,确定所述待检测对象。
3.如权利要求2所述的方法,其特征在于,所述对所述融合显著图进行目标识别,确定所述待检测对象,包括:
获取隶属矩阵和聚类中心;
基于所述隶属矩阵和所述聚类中心,确定当前聚类操作的迭代次数不大于预设迭代步数时,计算目标函数的损失值;其中,所述损失值表示每个所述融合显著图中的像素到所述聚类中心的欧式距离之和;确定所述损失值大于预设误差阈值时,调整所述隶属矩阵以及所述聚类中心;利用调整后的隶属矩阵和聚类中心进行聚类操作;更新所述迭代次数;
确定所述迭代次数大于所述预设迭代步数,或者,确定所述损失值不大于所述预设误差阈值时,结束聚类操作,得到所述融合显著图中像素的聚类结果;
根据所述聚类结果,确定所述待检测对象。
4.如权利要求1所述的方法,其特征在于,所述基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值,包括:
量化所述输入图像对应的各颜色通道的像素值,建立统计直方图;其中,所述直方图用于表征所述输入图像所含的颜色数量和每个颜色对应的像素数量的统计分布;
根据所述直方图,将所述各个像素中的低频颜色替换为邻域内距离最近的高频颜色;其中,所述低频颜色为直方图中颜色对应的像素数量占比不高于预设比例的颜色,所述高频颜色为直方图中颜色对应的像素数量占比高于预设比例的颜色;
根据对筛除低频颜色后的输入图像做去噪处理,确定所述各个像素的像素参考值。
5.如权利要求1所述的方法,其特征在于,所述基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图,包括:
判定所述各个像素的像素参考值是否大于预设参考值阈值;
若所述像素的像素参考值大于预设参考值阈值,则所述像素值为第一区域;
若所述像素的像素参考值小于等于预设参考值阈值,则所述像素标记为第二区域;
根据所述第一区域和所述第二区域,生成显著图。
6.如权利要求1所述的方法,其特征在于,所述基于所述显著图像对所述输入图像进行处理,得到融合显著图,包括:
基于所述第一区域与对应所述输入图像的对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第一融合区域;
基于所述第二区域与对应所述输入图像的非对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第二融合区域;
根据所述第一融合区域和所述第二融合区域,得到融合显著图。
7.一种对象检测的装置,其特征在于,所述装置包括:
计算模块,用于基于输入图像中各像素的邻域像素,确定所述各个像素的像素参考值;所述输入图像中包括待检测对象的对象区域;
生成模块,用于基于所述各个像素的像素参考值和预设参考值阈值的大小关系,生成包括第一区域和第二区域的显著图;其中,所述第一区域对应所述对象区域,所述第二区域对应所述输入图像的非对象区域;
融合模块,用于基于所述显著图像对所述输入图像进行处理,得到融合显著图;其中,所述融合显著图中的对象区域和非对象区域之间的差异度,大于所述输入图像中的对象区域和非对象区域之间的差异度。
8.如权利要求7所述的装置,其特征在于,所述融合模块,具体用于:
基于所述第一区域与对应所述输入图像的对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第一融合区域;
基于所述第二区域与对应所述输入图像的非对象区域,按照预设权重,计算两个区域中的各个像素值和值,得到第二融合区域;
根据所述第一融合区域和所述第二融合区域,得到融合显著图。
9.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,实现权利要求1-6中任一项所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110762095.0A CN113469976A (zh) | 2021-07-06 | 2021-07-06 | 一种对象检测的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110762095.0A CN113469976A (zh) | 2021-07-06 | 2021-07-06 | 一种对象检测的方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469976A true CN113469976A (zh) | 2021-10-01 |
Family
ID=77878529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110762095.0A Pending CN113469976A (zh) | 2021-07-06 | 2021-07-06 | 一种对象检测的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469976A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104966085A (zh) * | 2015-06-16 | 2015-10-07 | 北京师范大学 | 一种基于多显著特征融合的遥感图像感兴趣区域检测方法 |
US20160086052A1 (en) * | 2014-09-19 | 2016-03-24 | Brain Corporation | Apparatus and methods for saliency detection based on color occurrence analysis |
CN106056581A (zh) * | 2016-05-23 | 2016-10-26 | 北京航空航天大学 | 一种利用改进模糊聚类算法提取红外行人目标的方法 |
CN106157266A (zh) * | 2016-07-07 | 2016-11-23 | 江苏城乡建设职业学院 | 一种果园果实图像获取方法 |
CN106815843A (zh) * | 2016-11-30 | 2017-06-09 | 江苏城乡建设职业学院 | 一种基于凸包中心先验和马尔可夫吸收链的果实目标获取方法 |
CN107067037A (zh) * | 2017-04-21 | 2017-08-18 | 河南科技大学 | 一种使用llc准则定位图像前景的方法 |
CN107169487A (zh) * | 2017-04-19 | 2017-09-15 | 西安电子科技大学 | 基于超像素分割及深度特征定位的显著性目标检测方法 |
CN107240119A (zh) * | 2017-04-19 | 2017-10-10 | 北京航空航天大学 | 利用改进模糊聚类算法提取灰度不均匀红外行人的方法 |
CN107665347A (zh) * | 2017-09-22 | 2018-02-06 | 中国科学院西安光学精密机械研究所 | 基于滤波优化的视觉显著性目标检测方法 |
CN108921820A (zh) * | 2018-05-30 | 2018-11-30 | 咸阳师范学院 | 一种基于特征聚类和颜色对比度的图像显著性目标检测方法 |
CN109636784A (zh) * | 2018-12-06 | 2019-04-16 | 西安电子科技大学 | 基于最大邻域和超像素分割的图像显著性目标检测方法 |
CN110188763A (zh) * | 2019-05-28 | 2019-08-30 | 江南大学 | 一种基于改进图模型的图像显著性检测方法 |
CN110458172A (zh) * | 2019-08-16 | 2019-11-15 | 中国农业大学 | 一种基于区域对比度检测的弱监督图像语义分割方法 |
KR102051032B1 (ko) * | 2018-08-01 | 2019-12-02 | 경북대학교 산학협력단 | 객체 탐지 장치 및 제어 방법 |
CN110853064A (zh) * | 2019-11-12 | 2020-02-28 | 吉林大学 | 一种基于最小模糊散度的图像协同分割方法 |
WO2020133170A1 (zh) * | 2018-12-28 | 2020-07-02 | 深圳市大疆创新科技有限公司 | 图像处理方法和装置 |
-
2021
- 2021-07-06 CN CN202110762095.0A patent/CN113469976A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160086052A1 (en) * | 2014-09-19 | 2016-03-24 | Brain Corporation | Apparatus and methods for saliency detection based on color occurrence analysis |
CN104966085A (zh) * | 2015-06-16 | 2015-10-07 | 北京师范大学 | 一种基于多显著特征融合的遥感图像感兴趣区域检测方法 |
CN106056581A (zh) * | 2016-05-23 | 2016-10-26 | 北京航空航天大学 | 一种利用改进模糊聚类算法提取红外行人目标的方法 |
CN106157266A (zh) * | 2016-07-07 | 2016-11-23 | 江苏城乡建设职业学院 | 一种果园果实图像获取方法 |
CN106815843A (zh) * | 2016-11-30 | 2017-06-09 | 江苏城乡建设职业学院 | 一种基于凸包中心先验和马尔可夫吸收链的果实目标获取方法 |
CN107169487A (zh) * | 2017-04-19 | 2017-09-15 | 西安电子科技大学 | 基于超像素分割及深度特征定位的显著性目标检测方法 |
CN107240119A (zh) * | 2017-04-19 | 2017-10-10 | 北京航空航天大学 | 利用改进模糊聚类算法提取灰度不均匀红外行人的方法 |
CN107067037A (zh) * | 2017-04-21 | 2017-08-18 | 河南科技大学 | 一种使用llc准则定位图像前景的方法 |
CN107665347A (zh) * | 2017-09-22 | 2018-02-06 | 中国科学院西安光学精密机械研究所 | 基于滤波优化的视觉显著性目标检测方法 |
CN108921820A (zh) * | 2018-05-30 | 2018-11-30 | 咸阳师范学院 | 一种基于特征聚类和颜色对比度的图像显著性目标检测方法 |
KR102051032B1 (ko) * | 2018-08-01 | 2019-12-02 | 경북대학교 산학협력단 | 객체 탐지 장치 및 제어 방법 |
CN109636784A (zh) * | 2018-12-06 | 2019-04-16 | 西安电子科技大学 | 基于最大邻域和超像素分割的图像显著性目标检测方法 |
WO2020133170A1 (zh) * | 2018-12-28 | 2020-07-02 | 深圳市大疆创新科技有限公司 | 图像处理方法和装置 |
CN110188763A (zh) * | 2019-05-28 | 2019-08-30 | 江南大学 | 一种基于改进图模型的图像显著性检测方法 |
CN110458172A (zh) * | 2019-08-16 | 2019-11-15 | 中国农业大学 | 一种基于区域对比度检测的弱监督图像语义分割方法 |
CN110853064A (zh) * | 2019-11-12 | 2020-02-28 | 吉林大学 | 一种基于最小模糊散度的图像协同分割方法 |
Non-Patent Citations (4)
Title |
---|
MEHMOOD NAWAZ 等: "Saliency Detection via Multiple-Morphological and Superpixel based Fast Fuzzy C-Mean Clustering Network", EXPERT SYSTEMS WITH APPLICATIONS, 31 December 2020 (2020-12-31) * |
孙赫赫;尚晓清;王冲;: "基于区域对比的图像显著性检测方法", 计算机工程与应用, no. 10, 30 April 2017 (2017-04-30) * |
苏珊: "联合颜色和纹理特征的图像显著性检测算法研究", 中国优秀硕士学位论文全文数据库 信息科技辑, no. 03, 15 March 2021 (2021-03-15), pages 138 - 450 * |
郑海军;吴建国;刘政怡;: "相似矩阵和聚类一致性的协同显著检测", 计算机科学与探索, no. 09, 31 October 2017 (2017-10-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112052787B (zh) | 基于人工智能的目标检测方法、装置及电子设备 | |
CN111027493B (zh) | 一种基于深度学习多网络软融合的行人检测方法 | |
KR101640998B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
CN107103326B (zh) | 基于超像素聚类的协同显著性检测方法 | |
CN109977997B (zh) | 基于卷积神经网络快速鲁棒的图像目标检测与分割方法 | |
CN110929617B (zh) | 一种换脸合成视频检测方法、装置、电子设备及存储介质 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN108090470A (zh) | 一种人脸对齐方法及装置 | |
CN111340195A (zh) | 网络模型的训练方法及装置、图像处理方法及存储介质 | |
CN109145964B (zh) | 一种实现图像颜色聚类的方法和系统 | |
WO2019197021A1 (en) | Device and method for instance-level segmentation of an image | |
CN111753119A (zh) | 一种图像搜索方法、装置、电子设备及存储介质 | |
Lee et al. | Flood fill mean shift: A robust segmentation algorithm | |
CN111914668A (zh) | 一种基于图像增强技术的行人重识别方法、装置及系统 | |
CN117315377B (zh) | 基于机器视觉的图像处理方法、装置及电子设备 | |
CN112070116B (zh) | 一种基于支持向量机的艺术画作自动分类系统及方法 | |
CN111199228B (zh) | 一种车牌定位的方法及装置 | |
CN112364916A (zh) | 基于迁移学习的图像分类方法、相关设备及存储介质 | |
CN111401485A (zh) | 实用的纹理分类方法 | |
Gunawan et al. | Fuzzy Region Merging Using Fuzzy Similarity Measurement on Image Segmentation | |
CN115984671A (zh) | 模型在线更新方法、装置、电子设备及可读存储介质 | |
CN113469976A (zh) | 一种对象检测的方法、装置及电子设备 | |
CN109460777A (zh) | 图片分类方法、装置及计算机可读存储介质 | |
CN114463574A (zh) | 一种遥感图像的场景分类方法及装置 | |
CN112149674A (zh) | 一种图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |