CN111833363B - 图像边缘和显著性检测方法及装置 - Google Patents
图像边缘和显著性检测方法及装置 Download PDFInfo
- Publication number
- CN111833363B CN111833363B CN201910311911.9A CN201910311911A CN111833363B CN 111833363 B CN111833363 B CN 111833363B CN 201910311911 A CN201910311911 A CN 201910311911A CN 111833363 B CN111833363 B CN 111833363B
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- images
- sampling
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 392
- 238000003708 edge detection Methods 0.000 claims abstract description 112
- 238000000034 method Methods 0.000 claims abstract description 79
- 238000005070 sampling Methods 0.000 claims description 287
- 238000011176 pooling Methods 0.000 claims description 200
- 230000004927 fusion Effects 0.000 claims description 145
- 238000012549 training Methods 0.000 claims description 81
- 230000015654 memory Effects 0.000 claims description 61
- 238000004891 communication Methods 0.000 claims description 40
- 230000008569 process Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 230000001965 increasing effect Effects 0.000 abstract description 3
- 238000013527 convolutional neural network Methods 0.000 description 40
- 238000013528 artificial neural network Methods 0.000 description 37
- 239000011159 matrix material Substances 0.000 description 28
- 239000013598 vector Substances 0.000 description 20
- 230000006870 function Effects 0.000 description 18
- 238000013507 mapping Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 210000002569 neuron Anatomy 0.000 description 11
- 238000003860 storage Methods 0.000 description 11
- 230000004913 activation Effects 0.000 description 10
- 230000001537 neural effect Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- MHABMANUFPZXEB-UHFFFAOYSA-N O-demethyl-aloesaponarin I Natural products O=C1C2=CC=CC(O)=C2C(=O)C2=C1C=C(O)C(C(O)=O)=C2C MHABMANUFPZXEB-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
- G06V10/464—Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了人工智能领域的一种检测方法及装置。涉及人工智能领域。具体涉及计算机视觉领域。该方法包括:获取待检测图像;将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像。本申请的检测方法适用于显著性物体检测和边缘检测的应用场景,实现了在不明显增加模型参数的前提下,有效协同显著性物体检测和边缘检测,并提高了检测结果的精度。
Description
技术领域
本申请涉及人工智能领域,尤其涉及一种图像边缘和显著性检测方法及装置。
背景技术
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成象系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。
显著性物体检测是从图像中检测出最能引起人的视觉注意的物体区域的计算机视觉处理过程。边缘检测是从图像中检测出对象间以及对象内部的显著边界的计算机视觉处理过程。
显著性物体检测和边缘检测这两类问题在图像处理技术领域有着重要的研究和应用价值,在例如无人驾驶、自动导航、机器人控制等众多高科技领域均发挥着不可替代的作用。早期的工作通过提取人工设计的全局和局部特征进行处理,而卷积神经网络通过进一步引入语义特征大大提升了检测效果。但现有大部分的卷积神经网络方法都是针对上述问题中的某一个特定问题而专门设计一个深度网络结构,独立地完成这两类检测任务,这极大浪费资源和时间内,提高了此类方法的研发和应用成本。
发明内容
本申请实施例提供一种图像边缘和显著性检测方法及装置,有利于在不明显增加模型参数的前提下,有效协同显著性物体检测和边缘检测,并提高了检测结果的精度。
第一方面,提供一种图像边缘和显著性检测方法,包括:
将待检测图像输入到特征检测模型,得到待检测图像的显著性检测图像和边缘检测图像;其中,将待检测图像输入到特征检测模型,得到待检测图像的显著性检测图像和边缘检测图像,包括:
对待检测图像进行卷积池化操作,得到M张第一采样特征图像,M为大于1的整数,对M张第一采样特征图像中分辨率最小的采样特征图像进行金字塔池化操作,以得到金字塔池化特征图像;根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像;对待检测图像的边缘特征图像进行卷积操作,以得到待检测图像的边缘检测图像;根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像。通过特征检测模型同时检测待检测图像的显著性检测图像和边缘检测图像,与现有技术相比,提高了图像检测的效率,并有效减少了模型的参数量,进而减少了存储资源的开销。
在一个可行的实施例中,将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像之前,检测方法还包括:
获取待检测图像。
在一个可行的实施例中,根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像,包括:
对M张第一采样特征图像中分辨率最小的采样特征图像进行特征融合,得到第一融合特征图像;
将金字塔池化特征图像与M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像;其中,M-1张第一采样特征图像为M张第一采样特征图像中除了分辨率最小的图像之外的采样图像;
对第一融合特征图像进行残差操作,并分别对M-2张第二融合特征图像进行残差操作,以得到M-1张边缘特征图像;M-2张第二融合特征图像为M-1张第二融合特征图像中除了分辨率最大的图像之外的第二融合特征图像。
在一个可行的实施例中,根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像,包括:
对特征图像A和M-1张边缘特征图像进行拼接,再进行卷积操作,以得到待检测图像的显著性检测图像,特征图像A为M-2张第二融合特征图像中分辨率最大的图像。通过M-1张边缘检测图像和特征图像A确定待检测图像的显著性检测图像,充分利用了边缘特征的协同性,使得显著性检测图像更加精确和真实。通过金字塔池化操作,提取了待检测图像的多尺度的更高层次的全局语义特征,保证了检测结果的完整性。
在一个可行的实施例中,将金字塔池化特征图像与所述M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像,包括:
在进行第j次拼接融合操作时,若j等于1,则根据2倍采样率对第一融合特征图像进行上采样操作,以得到第j张第二采样特征图像;若j大于1且不大于M-1,则根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,以得到第j张第二采样特征图像;
根据采样率2j对金字塔池化特征图像进行上采样操作,以得到采样后的金字塔池化特征图像;
对第j张第二采样特征图像、第M-j张第一采样特征图像和采样后的金字塔池化特征图像进行拼接操作,以得到第j张拼接特征图像;其中,第j张第二采样特征图像、第j张第一采样特征图像和采样后的金字塔池化特征图像的分辨率相同;
对第j张拼接特征图像进行融合操作,以得到第M-j张第二融合特征图像,M-1张第二融合特征图像包括第j张第二融合特征图像。通过对金字塔池化特征图像进行不同比率的上采样,与各个尺度的融合特征进行拼接,为下一层的融合处理提供新的特征图,将待检测图像的全局语义特征反复用于增强多尺度特征,提升了特征检测模型的感受野,保证了检测结果的完整性。
在一个可行的实施例中,在对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像之前,检测方法还包括:
根据S个比率分别对第j张拼接特征图像进行S次平均池化操作,得到S张平均池化特征图;S为大于1的整数;
分别对S张平均池化特征图进行卷积操作,得到S张卷积特征图;
分别对S张卷积特征图进行上采样,得到S张第三采样特征图像,该S张第三采样特征图像中的每张图像的分辨率与第j张拼接特征图像的分辨率相同;
对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像,包括:
根据S张第三采样特征图像和第j张拼接特征图像得到目标特征图像,目标特征图像中第p行的第q个像素点的特征值为S张第三采样特征图像中第p行的第q个像素点的特征值和第j张拼接特征图像的第p行的第q个像素点的特征值之和;其中,q为大于0且不大于w的整数,p为大于0且不大于h的整数,w为第三采样特征图像的宽度值;h为第三采样特征图像的高度值;对目标特征图像卷积操作,以得到第j张第二融合特征图像。通过多个比率的池化融合操作,既抑制了不同尺度特征间的混淆效应,也提升了特征检测模型的感受野,从而提供了特征检测模型的精度,同时还能有效减少模型的参数量,从而提高了存储和运算效率。
在一个可行的实施例中,对待检测图像进行卷积池化操作,得到M张第一采样特征图像和金字塔池化特征图像,包括
根据预设采样率对待检测图像进行M次卷积池化操作,以得到M张第一采样特征图像,其中M张第一采样特征图像中的第i张第一采样特征图像是对第i-1张第一采样特征图像进行卷积池化操作得到的;i为大于1且不大于M的整数。
第二方面,提供一种检测装置,该装置包括用于执行第一方面中的方法的模块。
第三方面,提供一种检测装置,该装置包括:存储器,用于存储程序;处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行第一方面中的方法。
第四方面,提供一种终端设备,包括:
处理器;与该处理器耦合的通信接口;
处理器调用可执行程序代码,执行如第一方面中的方法,得到待检测图像的边缘检测图像和显著性检测图像;
通信接口将待检测图像的边缘检测图像和显著性检测图像发送至其他电子设备。
第五方面,提供另一种图像边缘和显著性检测方法,包括:
接收终端设备发送的图像检测请求,该图像检测请求携带有待检测图像;
按照第一方面所述方法的部分或全部对待检测图像进行处理,以得到待检测图像的边缘检测图像和显著性检测图像;
向终端设备发送携带有所述待检测图像的边缘检测图像和显著性检测图像的检测响应。
第六方面,提供另一种检测服务器,包括:
处理器和与该处理器耦合的通信接口;
通信接口接收终端设备发送的图像检测请求,该图像检测请求携带有待检测图像;
处理器按照第一方面所述方法的部分或全部对待检测图像进行处理,以得到待检测图像的边缘检测图像和显著性检测图像;
通信接口向终端设备发送携带有待检测图像的边缘检测图像和显著性检测图像的检测响应。
第七方面,提供一种训练装置,包括:
获取模块,用于获取多张显著性检测图像样本和多张边缘检测图像样本;
训练模块,用于根据多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型。通过显著性检测图像样本和边缘检测图像样本交替训练特征检测模型,解决了如何利用两类面向单一任务的样本数据集进行有效训练的问题,提高了图像样本的利用率,进一步提高了特征检测模型的精度。
在一个可行的实施例中,训练模块还用于:
在根据多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型之后,根据待检测图像的显著性检测图像和边缘检测图像训练特征检测模型,其中,待检测图像的显著性检测图像和边缘检测图像是将待检测图像输入到特征检测模型得到的。通过基于特征检测模型得到的显著性检测图像和边缘检测图像来训练特征检测模型,提高了特征检测模型的精度,进而提高了后续待检测图像的显著性检测图像和边缘检测图像的准确性。
第八方面,提供一种计算机可读介质,该计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于执行第一方面或第五方面中的方法。
第九方面,提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述第一方面或第五方面中的方法。
第十方面,提供一种芯片,该芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,执行第一方面或第五方面中的方法。
可选地,作为一种实现方式,所述芯片还可以包括存储器,所述存储器中存储有指令,所述处理器用于执行所述存储器上存储的指令,当所述指令被执行时,所述处理器用于执行第一方面或第五方面中的方法。
第十一方面,提供一种电子设备,该电子设备包括上述第二方面至第四方面中的任意一个方面中的装置或者包括上述第六方面至第十方面中任一个方面中的装置。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的系统架构的结构示意图;
图2为本申请实施例提供的特征检测模型的示意图;
图3是本申请实施例提供的一种芯片硬件结构示意图;
图4为本申请实施例提供的一种检测方法的流程示意图;
图5为本申请实施例提供的一种模型更新流程示意图;
图6为本申请实施例提供的另一种检测方法的流程示意图;
图7为本申请实施例提供的一种特征融合的流程示意图;
图8为本申请实施例提供的一种检测方法的交互式流程示意图;
图9为本申请实施例提供的一种检测装置的结构示意图;
图10为本申请实施例提供的另一种检测装置的结构示意图;
图11为本申请实施例提供的一种终端设备的结构示意图;
图12为本申请实施例提供的一种训练装置的结构示意图。
具体实施方式
下面结合附图对本申请的实施例进行描述。
本申请实施例提供的检测方法能够应用在背景虚化、人像美化、人像风格化、背景替换、拍照自动对焦、视频的人像分割和除人像外其他重要目标的检测(如车辆检测、动物检测等)的场景。具体而言,本申请实施例的检测方法能够应用在人像风格化和背景替换的场景中,下面分别对人像风格化和背景替换进行简单的介绍。
人像风格化:
检测装置根据特征检测模型得到待检测图像的显著性检测图像和边缘检测图像,然后基于该显著性检测图像和边缘检测图像确定待检测图像中人物图像,然后对人物图像进行风格化处理,得到人物风格化图像。比如黑白图像,老照片图像、怀旧图像等。采样本发明实施例能够检测出更多的细节,使得人物风格化图像更加清楚。
背景替换:
检测装置根据特征检测模型得到待检测图像的显著性检测图像和边缘检测图像,然后根据该显著性检测图像和边缘检测图像将待检测图像中物体或人物与图像的背景分开,进而实现待检测图像的背景进行替换。由于采用本发明实施例的方案能够检测出更多的边缘细节,因此使得待检测图像背景替换的结果更加精细。
本申请实施例提供的方法和装置还可以用于扩充训练数据库,如图1所示执行设备110的I/O接口112可以将待检测图像经执行设备110得到的显著性检测图像和边缘检测图像及待检测图像一起作为训练数据对发送给数据库130,以使得数据库130维护的训练数据更加丰富,从而为训练设备120的训练工作提供更丰富的训练数据。
下面从模型训练侧和模型应用侧对本申请提供的方法进行描述:
本申请实施例提供的训练特征检测模型的方法,涉及计算机视觉的处理,具体可以应用于数据训练、机器学习、深度学习等数据处理方法,对训练数据(如本申请中的待检测图像及其显著性检测图像和边缘检测图像)进行符号化和形式化的智能信息建模、抽取、预处理、训练等,最终得到训练好的特征检测模型的。
需要说明的是,本申请实施例提供的特征检测模型的训练方法和检测方法是基于同一个构思产生的发明,也可以理解为一个系统中的两个部分,或一个整体流程的两个阶段:如模型训练阶段和模型应用阶段。
由于本申请实施例涉及大量神经网络的应用,为了便于理解,下面先对本申请实施例涉及的相关术语及神经网络等相关概念进行介绍。
(1)显著性物体检测和边缘检测,利用图像处理和机器学习、计算机图形学等相关方法,得到待检测图像中显著性检测图像和边缘检测图像。
(2)神经网络
神经网络可以是由神经单元组成的,神经单元可以是指以xs和截距1为输入的运算单元,该运算单元的输出可以为:
其中,s=1、2、……n,n为大于1的自然数,Ws为xs的权重,b为神经单元的偏置。f为神经单元的激活函数(activation functions),用于将非线性特性引入神经网络中,来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入。激活函数可以是sigmoid函数。神经网络是将许多个上述单一的神经单元联结在一起形成的网络,即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连,来提取局部接受域的特征,局部接受域可以是由若干个神经单元组成的区域。
(3)深度神经网络
深度神经网络(Deep Neural Network,DNN),也称多层神经网络,可以理解为具有很多层隐含层的神经网络,这里的“很多”并没有特别的度量标准。从DNN按不同层的位置划分,DNN内部的神经网络可以分为三类:输入层,隐含层,输出层。一般来说第一层是输入层,最后一层是输出层,中间的层数都是隐含层。层与层之间是全连接的,也就是说,第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。虽然DNN看起来很复杂,但是就每一层的工作来说,其实并不复杂,简单来说就是如下线性关系表达式:其中,/>是输入向量,/>是输出向量,/>是偏移向量,W是权重矩阵(也称系数),α()是激活函数。每一层仅仅是对输入向量/>经过如此简单的操作得到输出向量/>由于DNN层数多,则系数W和偏移向量/>的数量也就很多了。这些参数在DNN中的定义如下所述:以系数W为例:假设在一个三层的DNN中,第二层的第4个神经元到第三层的第2个神经元的线性系数定义为/>上标3代表系数W所在的层数,而下标对应的是输出的第三层索引2和输入的第二层索引4。总结就是:第L-1层的第k个神经元到第L层的第j个神经元的系数定义为/>需要注意的是,输入层是没有W参数的。在深度神经网络中,更多的隐含层让网络更能够刻画现实世界中的复杂情形。理论上而言,参数越多的模型复杂度越高,“容量”也就越大,也就意味着它能完成更复杂的学习任务。训练深度神经网络的也就是学习权重矩阵的过程,其最终目的是得到训练好的深度神经网络的所有层的权重矩阵(由很多层的向量W形成的权重矩阵)。
(4)卷积神经网络
卷积神经网络(CNN,Convolutional Neuron Network)是一种带有卷积结构的深度神经网络。卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器。该特征抽取器可以看作是滤波器,卷积过程可以看作是使用一个可训练的滤波器与一个输入的图像或者卷积特征平面(feature map)做卷积。卷积层是指卷积神经网络中对输入信号进行卷积处理的神经元层。在卷积神经网络的卷积层中,一个神经元可以只与部分邻层神经元连接。一个卷积层中,通常包含若干个特征平面,每个特征平面可以由一些矩形排列的神经单元组成。同一特征平面的神经单元共享权重,这里共享的权重就是卷积核。共享权重可以理解为提取图像信息的方式与位置无关。这其中隐含的原理是:图像的某一部分的统计信息与其他部分是一样的。即意味着在某一部分学习的图像信息也能用在另一部分上。所以对于图像上的所有位置,都能使用同样的学习得到的图像信息。在同一卷积层中,可以使用多个卷积核来提取不同的图像信息,一般地,卷积核数量越多,卷积操作反映的图像信息越丰富。
卷积核可以以随机大小的矩阵的形式初始化,在卷积神经网络的训练过程中卷积核可以通过学习得到合理的权重。另外,共享权重带来的直接好处是减少卷积神经网络各层之间的连接,同时又降低了过拟合的风险。
(5)损失函数
在训练深度神经网络的过程中,因为希望深度神经网络的输出尽可能的接近真正想要预测的值,所以可以通过比较当前网络的预测值和真正想要的目标值,再根据两者之间的差异情况来更新每一层神经网络的权重向量(当然,在第一次更新之前通常会有初始化的过程,即为深度神经网络中的各层预先配置参数),比如,如果网络的预测值高了,就调整权重向量让它预测低一些,不断的调整,直到深度神经网络能够预测出真正想要的目标值或与真正想要的目标值非常接近的值。因此,就需要预先定义“如何比较预测值和目标值之间的差异”,这便是损失函数(loss function)或目标函数(objective function),它们是用于衡量预测值和目标值的差异的重要方程。其中,以损失函数举例,损失函数的输出值(loss)越高表示差异越大,那么深度神经网络的训练就变成了尽可能缩小这个loss的过程。
(6)反向传播算法
卷积神经网络可以采用误差反向传播(back propagation,BP)算法在训练过程中修正初始的超分辨率模型中参数的大小,使得超分辨率模型的重建误差损失越来越小。具体地,前向传递输入信号直至输出会产生误差损失,通过反向传播误差损失信息来更新初始的超分辨率模型中参数,从而使误差损失收敛。反向传播算法是以误差损失为主导的反向传播运动,旨在得到最优的超分辨率模型的参数,例如权重矩阵。
下面介绍本申请实施例提供系统架构。
参见图1,本申请实施例提供了一种系统架构100。如所述系统架构100所示,数据采集设备160用于采集训练数据,本申请实施例中训练数据包括:待检测图像的真实显著性物体图像和真实边缘图像及对待检测图像进行检测得到的显著性检测图像和边缘图像;并将训练数据存入数据库130,训练设备120基于数据库130中维护的训练数据训练得到特征检测模型101(解释说明:这里的101就是前面介绍的经训练阶段训练得到的模型,可以是用于特征提取的网络等)。下面将更详细地描述训练设备120如何基于训练数据得到特征检测模型101,该特征检测模型101能够用于实现本申请实施例提供的检测方法,即,将待检测图像输入特征检测模型101,即可得到待检测图像显著性检测图像和边缘图像。本申请实施例中的特征检测模型101具体可以为卷积神经网络。需要说明的是,在实际的应用中,所述数据库130中维护的训练数据不一定都来自于数据采集设备160的采集,也有可能是从其他设备接收得到的。另外需要说明的是,训练设备120也不一定完全基于数据库130维护的训练数据进行特征检测模型101的训练,也有可能从云端或其他地方获取训练数据进行模型训练,上述描述不应该作为对本申请实施例的限定。
根据训练设备120训练得到的特征检测模型101可以应用于不同的系统或设备中,如应用于图1所示的执行设备110,所述执行设备110可以是终端,如手机终端,平板电脑,笔记本电脑,AR/VR,车载终端等,还可以是服务器或者云端等。在附图1中,执行设备110配置有I/O接口112,用于与外部设备进行数据交互,用户可以通过客户设备140向I/O接口112输入数据,所述输入数据在本申请实施例中可以包括:用户输入的待检测图像或者从其本地或者通过摄像头获取的图像。
在执行设备110对输入数据进行预处理,或者在执行设备110的计算模块111执行计算等相关的处理(比如进行本申请中显著性物体检测和边缘检测方法)过程中,执行设备110可以调用数据存储系统150中的数据、代码等以用于相应的处理,也可以将相应处理得到的数据、指令等存入数据存储系统150中。
最后,I/O接口112将处理结果,如上述得到的显著性检测图像和边缘检测图像返回给客户设备140,从而提供给用户。
值得说明的是,训练设备120可以针对不同的目标或称不同的任务,基于不同的训练数据生成相应的特征检测模型101,该相应的特征检测模型101即可以用于实现上述目标或完成上述任务,从而为用户提供所需的结果。
在附图1中所示情况下,用户可以手动给定输入数据,该手动给定可以通过I/O接口112提供的界面进行操作。另一种情况下,客户设备140可以自动地向I/O接口112发送输入数据,如果要求客户设备140自动发送输入数据需要获得用户的授权,则用户可以在客户设备140中设置相应权限。用户可以在客户设备140查看执行设备110输出的结果,具体的呈现形式可以是显示、声音、动作等具体方式。客户设备140也可以作为数据采集端,采集如图所示输入I/O接口112的输入数据及输出I/O接口112的输出结果作为新的样本数据,并存入数据库130。当然,也可以不经过客户设备140进行采集,而是由I/O接口112直接将如图所示输入I/O接口112的输入数据及输出I/O接口112的输出结果,作为新的样本数据存入数据库130。
值得注意的是,附图1仅是本发明实施例提供的一种系统架构的示意图,图中所示设备、器件、模块等之间的位置关系不构成任何限制,例如,在附图1中,数据存储系统150相对执行设备110是外部存储器,在其它情况下,也可以将数据存储系统150置于执行设备110中。
如图1所示,根据训练设备120训练得到特征检测模型101,该特征检测模型101在本申请实施例中可以是CNN。
如前文的基础概念介绍所述,卷积神经网络是一种带有卷积结构的深度神经网络,是一种深度学习(deep learning)架构,深度学习架构是指通过机器学习的算法,在不同的抽象层级上进行多个层次的学习。作为一种深度学习架构,CNN是一种前馈(feed-forward)人工神经网络,该前馈人工神经网络中的各个神经元可以对输入其中的图像作出响应。
如图2所示,卷积神经网络(CNN)200可以包括输入层210,卷积层/池化层220(其中池化层为可选的),以及神经网络层230。
卷积层/池化层220:
卷积层:
如图2所示卷积层/池化层220可以包括如示例221-226层,举例来说:在一种实现中,221层为卷积层,222层为池化层,223层为卷积层,224层为池化层,225为卷积层,226为池化层;在另一种实现方式中,221、222为卷积层,223为池化层,224、225为卷积层,226为池化层。即卷积层的输出可以作为随后的池化层的输入,也可以作为另一个卷积层的输入以继续进行卷积操作。
下面将以卷积层221为例,介绍一层卷积层的内部工作原理。
卷积层221可以包括很多个卷积算子,卷积算子也称为核,其在图像处理中的作用相当于一个从输入图像矩阵中提取特定信息的过滤器,卷积算子本质上可以是一个权重矩阵,这个权重矩阵通常被预先定义,在对图像进行卷积操作的过程中,权重矩阵通常在输入图像上沿着水平方向一个像素接着一个像素(或两个像素接着两个像素……这取决于步长stride的取值)的进行处理,从而完成从图像中提取特定特征的工作。该权重矩阵的大小应该与图像的大小相关,需要注意的是,权重矩阵的纵深维度(depth dimension)和输入图像的纵深维度是相同的,在进行卷积运算的过程中,权重矩阵会延伸到输入图像的整个深度。因此,和一个单一的权重矩阵进行卷积会产生一个单一纵深维度的卷积化输出,但是大多数情况下不使用单一权重矩阵,而是应用多个尺寸(行×列)相同的权重矩阵,即多个同型矩阵。每个权重矩阵的输出被堆叠起来形成卷积图像的纵深维度,这里的维度可以理解为由上面所述的“多个”来决定。不同的权重矩阵可以用来提取图像中不同的特征,例如一个权重矩阵用来提取图像边缘信息,另一个权重矩阵用来提取图像的特定颜色,又一个权重矩阵用来对图像中不需要的噪点进行模糊化等。该多个权重矩阵尺寸(行×列)相同,经过该多个尺寸相同的权重矩阵提取后的特征图的尺寸也相同,再将提取到的多个尺寸相同的特征图合并形成卷积运算的输出。
这些权重矩阵中的权重值在实际应用中需要经过大量的训练得到,通过训练得到的权重值形成的各个权重矩阵可以用来从输入图像中提取信息,从而使得卷积神经网络200进行正确的预测。
当卷积神经网络200有多个卷积层的时候,初始的卷积层(例如221)往往提取较多的一般特征,该一般特征也可以称之为低级别的特征;随着卷积神经网络200深度的加深,越往后的卷积层(例如226)提取到的特征越来越复杂,比如高级别的语义之类的特征,语义越高的特征越适用于待解决的问题。
池化层:
由于常常需要减少训练参数的数量,因此卷积层之后常常需要周期性的引入池化层,在如图2中220所示例的221-226各层,可以是一层卷积层后面跟一层池化层,也可以是多层卷积层后面接一层或多层池化层。在图像处理过程中,池化层的唯一目的就是减少图像的空间大小。池化层可以包括平均池化算子和/或最大池化算子,以用于对输入图像进行采样得到较小尺寸的图像。平均池化算子可以在特定范围内对图像中的像素值进行计算产生平均值作为平均池化的结果。最大池化算子可以在特定范围内取该范围内值最大的像素作为最大池化的结果。另外,就像卷积层中用权重矩阵的大小应该与图像尺寸相关一样,池化层中的运算符也应该与图像的大小相关。通过池化层处理后输出的图像尺寸可以小于输入池化层的图像的尺寸,池化层输出的图像中每个像素点表示输入池化层的图像的对应子区域的平均值或最大值。
神经网络层230:
在经过卷积层/池化层220的处理后,卷积神经网络200还不足以输出所需要的输出信息。因为如前所述,卷积层/池化层220只会提取特征,并减少输入图像带来的参数。然而为了生成最终的输出信息(所需要的类信息或其他相关信息),卷积神经网络200需要利用神经网络层230来生成一个或者一组所需要的类的数量的输出。因此,在神经网络层230中可以包括多层隐含层(如图2所示的231、232至23n)以及输出层240,该多层隐含层中所包含的参数可以根据具体的任务类型的相关训练数据进行预先训练得到,例如该任务类型可以包括图像识别,图像分类,图像超分辨率重建等等……
在神经网络层230中的多层隐含层之后,也就是整个卷积神经网络200的最后层为输出层240,该输出层240具有类似分类交叉熵的损失函数,具体用于计算预测误差,一旦整个卷积神经网络200的前向传播(如图2由210至240方向的传播为前向传播)完成,反向传播(如图2由240至210方向的传播为反向传播)就会开始更新前面提到的各层的权重值以及偏差,以减少卷积神经网络200的损失,及卷积神经网络200通过输出层输出的结果和理想结果之间的误差。
需要说明的是,如图2所示的卷积神经网络200仅作为一种卷积神经网络的示例,在具体的应用中,卷积神经网络还可以以其他网络模型的形式存在。
下面介绍本申请实施例提供的一种芯片硬件结构。
图3为本发明实施例提供的一种芯片硬件结构,该芯片包括神经网络处理器30。该芯片可以被设置在如图1所示的执行设备110中,用以完成计算模块111的计算工作。该芯片也可以被设置在如图1所示的训练设备120中,用以完成训练设备120的训练工作并输出目标模型/规则101。如图2所示的卷积神经网络中各层的算法均可在如图3所示的芯片中得以实现。
神经网络处理器NPU 30,NPU作为协处理器挂载到主CPU(Host CPU)上,由HostCPU分配任务。NPU的核心部分为运算电路303,控制器304控制运算电路303提取存储器(权重存储器或输入存储器)中的数据并进行运算。
在一些实现中,运算电路303内部包括多个处理单元(Process Engine,PE)。在一些实现中,运算电路303是二维脉动阵列。运算电路303还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中,运算电路303是通用的矩阵处理器。
举例来说,假设有输入矩阵A,权重矩阵B,输出矩阵C。运算电路从权重存储器302中取矩阵B相应的数据,并缓存在运算电路中每一个PE上。运算电路从输入存储器301中取矩阵A数据与矩阵B进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器(accumulator)308中。
向量计算单元307可以对运算电路的输出做进一步处理,如向量乘,向量加,指数运算,对数运算,大小比较等等。例如,向量计算单元307可以用于神经网络中非卷积/非FC层的网络计算,如池化(Pooling),批归一化(Batch Normalization),局部响应归一化(Local Response Normalization)等。
在一些实现种,向量计算单元能307将经处理的输出的向量存储到统一缓存器306。例如,向量计算单元307可以将非线性函数应用到运算电路303的输出,例如累加值的向量,用以生成激活值。在一些实现中,向量计算单元307生成归一化的值、合并值,或二者均有。在一些实现中,处理过的输出的向量能够用作到运算电路303的激活输入,例如用于在神经网络中的后续层中的使用。
入口:可以根据实际情况,说明算法的运算可以由303或307执行。
统一存储器306用于存放输入数据以及输出数据。
权重数据直接通过存储单元访问控制器305(Direct Memory AccessController,DMAC)将外部存储器中的输入数据搬运到输入存储器301和/或统一存储器306、将外部存储器中的权重数据存入权重存储器302,以及将统一存储器306中的数据存入外部存储器。
总线接口单元(Bus Interface Unit,BIU)310,用于通过总线实现主CPU、DMAC和取指存储器309之间进行交互。
与控制器304连接的取指存储器(instruction fetch buffer)309,用于存储控制器304使用的指令;
控制器304,用于调用指存储器309中缓存的指令,实现控制该运算加速器的工作过程。
入口:可以根据实际发明说明这里的数据是说明数据,比如探测到车辆速度、障碍物距离等。
一般地,统一存储器306,输入存储器301,权重存储器302以及取指存储器309均为片上(On-Chip)存储器,外部存储器为该NPU外部的存储器,该外部存储器可以为双倍数据率同步动态随机存储器(Double Data Rate Synchronous Dynamic Random AccessMemory,简称DDR SDRAM)、高带宽存储器(High Bandwidth Memory,HBM)或其他可读可写的存储器。
入口:可以由实际情况说明,图1和图2中的程序算法是由主CPU和NPU共同配合完成的。
其中,图2所示的卷积神经网络中各层的运算可以由运算电路303或向量计算单元307执行。
参见图4,图4为本申请实施例提供的一种检测方法的流程示意图。如图4所示,该方法包括:
S401、检测装置获取待检测图像。
具体地,检测装置从其本地或者通过器摄像头获取待检测图像。
S402、检测装置将待检测图像输入特征检测模型,得到待检测图像的边缘检测图像和显著性检测图像。
其中,特征检测模型是基于VGG-16架构训练得到的。
显著性检测是一种计算机视觉处理过程,它从图像中检测出最能引起人的视觉注意的物体区域,输出掩模用于示意该检出物体区域,该掩模可以被称为显著性检测图像。
边缘检测是一种计算机视觉处理过程,它从图像中检测出对象间的边界以及对象内部的显著边界,输出掩模用于示意边界与非边界,该掩模可以被称为边缘检测图像。
其中,检测装置将待检测图像输入特征检测模型中,得到待检测图像的边缘检测图像和显著性检测图像,包括:
对待检测图像进行卷积池化操作,得到M个第一采样特征图像,M为大于1的整数,对该M个第一采样特征图像中分辨率最小的采样特征图像进行金字塔池化操作,得到金字塔池化特征图像和M张第一采样特征图像;根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像;对待检测图像的边缘特征图像进行卷积操作,以得到待检测图像的边缘检测图像;根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像。
在此需要说明的是,对待检测图像进行卷积池化操作具体可以是对待检测图像先进行卷积操作,然后再对卷积后的结果进行池化操作。
其中,卷积操作是CNN的一种通用操作,它可以是为了从输入图像中提取特征,同时保留像素间的空间关系。可以使用特定尺寸、权值的窗口滤波器(又叫做卷积核),以规定的步长在输入图像或特征图上滑动并计算点乘,可以得到输出图像,又称为“特征图(Feature Map)”;通过使用N’(N’>1)个窗口滤波器可以得到N张特征图(或者一张N’通道的特征图),则该卷积操作的深度为N’。
池化操作是CNN的一种通用操作,也叫做亚采样或者下采样,它降低了各个特征图的维度,但可以保持大部分重要的信息。常见的空间池化可以有下面几种方式:最大化、平均化、加和等等。例如,对于最大池化(Max Pooling)操作,定义一个空间邻域(比如,2x2的窗口),按照规定步长从窗口内的特征图中取出最大的元素,输出新的特征图;此外,也可以定义一个输出图像尺寸(比如3×3),对输入图像进行空间划分,在每个划分中取最大元素,输出新的特征图。
在一个可行的实施例中,对待检测图像进行卷积池化操作,得到M张第一采样特征图像,包括
根据预设采样率对待检测图像进行M次卷积池化操作,以得到M张第一采样特征图像,其中M张第一采样特征图像中的第i张第一采样特征图像是对第i-1张第一采样特征图像进行卷积池化操作得到的;i为大于1且不大于M的整数。
需要说明的是,由于第i张第一采样特征图像是对第i-1张第一采样特征图像基于池化窗口进行卷积池化操作得到的,因此第i-1张第一采样图像的分辨率为第i张第一采样图像的分辨率的L2倍,其中,L*L为池化窗口的尺寸。可以看出M张第一采样特征图像在时间上是连续的。
举例说明,假设池化窗口为2*2,待检测图像的分辨率为256*256,检测装置根据池化窗口连续对待检测图像进行4次卷积池化操作,得到4张第一采样特征图像。具体地,检测装置根据池化窗口2*2对待检测图像进行卷积池化操作,得到第1张第一采样特征图像,该采样特征图像的分辨率为128*128;检测装置再根据池化窗口2*2对第1张采样图像进行卷积池化操作,得到第2张第一采样特征图像,该采样特征图像的分辨率为64*64;检测装置再根据池化窗口2*2对第2张采样图像进行卷积池化操作,得到第3张第一采样特征图像,该采样特征图像的分辨率为32*32;检测装置再根据池化窗口2*2对第3张第一采样特征图像进行卷积池化操作,得到第4张特征图像,该采样特征图像的分辨率为16*16。至此,对待检测图像连续进行了4次卷积池化操作,得到4张第一采样特征图像。
由于第2张第一采样特征图像的分辨率为64*64,第3张第一采样特征图像的分辨率为32*32,第4张第一采样特征图像的分辨率为16,因此第2,3,4张第一采样特征图像可以看成是分别根据采样率4,8,16对待检测图像进行下采样得到的。
需要指出的是,连续对待检测图像进行卷积池化操作是为了获取待检测图像的多个尺度层次特征。
在一个示例中,金字塔池化特征图像包括m张图像,m为正整数。该m张图像是检测装置对M张第一采样特征图像中分辨率最小的图像进行金字塔池化操作得到的。
金字塔池化操作可以将单个池化操作拓展为多个尺度的池化操作,有效获取了图像的多尺度信息。比如,在2015年由He等人在“Spatial Pyramid Pooling in DeepConvolutional Networks for Visual Recognition”中的示例,在进行最后一次卷积操作后,使用1×1、2×2、4×4三种尺寸进行池化,得到三张池化特征图并输入全连接层进行后续处理。在通用的金字塔池化操作中,按照T种约定尺寸分别对卷积特征图进行池化,得到T张池化特征图,以进行后续处理步骤。
在一个示例中,金字塔池化特征图像包括4张图像,分别为映射特征图像、全局平局池化特征图像和两张自适应平均池化特征图像。其中,对M张第一采样特征图像中分辨率最小的特征图像进行同一映射操作,得到映射特征图像,该映射特征图像的分辨率与M张第一采样特征图像中分辨率最小的特征图像的分辨率相同;对M张第一采样特征图像中分辨率最小的特征图像进行全局平均池化操作,得到全局平均池化特征图像,该全局平均池化特征图像的分辨率为1*1;对M张第一采样特征图像中分辨率最小的特征图像分别进行两次自适应平均池化操作,得到两张自适应平均池化特征图像,该两张自适应平均池化特征图像的分辨率分辨为3*3和5*5。
具体地,检测装置根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像,包括:
对M张第一采样特征图像中分辨率最小的采样特征图像进行特征融合,得到第一融合特征图像;
将金字塔池化特征图像与M-1张第一采样特征图像中的每张进行拼接融合操作,以得到M-1张第二融合特征图像;其中,M-1张第一采样特征图像为M张第一采样特征图像中除了分辨率最小的图像之外的采样图像;
对第一融合特征图像进行残差操作,并分别对M-2张第二融合特征图像进行残差操作,以得到M-1张边缘特征图像;M-2张第二融合特征图像为M-1张第二融合特征图像中除了分辨率最大的图像之外的第二融合特征图像。
在一个可行的实施例中,检测装置根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像,包括:
检测装置对特征图像A和M-1张边缘特征图像进行拼接,再进行卷积操作,以得到待检测图像的显著性检测图像,特征图像A为M-2张第二融合特征图像中分辨率最大的图像。
在一个可行的实施例中,检测装置根据M-1张第一采样特征图像和金字塔池化特征图像进行M-1次拼接融合操作,以得到M-1张第二融合特征图像,包括:
在进行第j次拼接融合操作时,若j等于1,则根据2倍采样率对第一融合特征图像进行上采样操作,以得到第j张第二采样特征图像;若j大于1且不大于M-1,则根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,以得到第j张第二采样特征图像;
根据采样率2j对金字塔池化特征图像进行上采样操作,以得到采样后的金字塔池化特征图像;
对所述第j张第二采样特征图像、第M-j张第一采样特征图像和所述采样后的金字塔池化特征图像进行拼接操作,以得到第j张拼接特征图像;其中,第j二采样特征图像、第j张第一采样特征图像和采样后的金字塔池化特征图像的分辨率相同;
对第j张拼接特征图像进行融合操作,以得到第M-j张融合特征图像,M-1张第二融合特征图像包括第j张融合特征图像。
具体地,在进行第j次拼接融合操作时,若j=1时,检测装置根据2倍采样率对第一融合特征图像进行上采样操作,以得到第j张第二采样特征图像;其中,第j张采样特征图像的分辨率为第一融合特征图像的分辨率的4倍。比如,若第一融合特征图像的分辨率为64*64,则第j张第二采样特征图像的分辨率为128*128;若第一融合特征图像的分辨率为128*128,则第j张第二采样特征图像的分辨率为256*256。若j为大于1且不大于M-1的整数时,检测装置根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,以得到第j张第二采样特征图像,其中第j张第二采样特征图像的分辨率为第j-1张第二融合特征图像的分辨率的4倍。比如,若第j-1张融合特征图像的分辨率为64*64,则第j张第二采样特征图像的分辨率为128*128;若第j-1张融合特征图像的分辨率为128*128,则第j张第二采样特征图像的分辨率为256*256。
由于金字塔池化特征图像包括m张图像,对金字塔池化特征图像进行上采样操作具体是对m张图像中每张图像进行上采样操作,使得采样后的m张图像的分辨率都相同。比如金字塔池化特征图像包括分辨率与第M张第一采样特征图像分辨率相同的映射特征图像、分辨率为1*1的全局平局池化特征图像和两张分辨率为3*3和5*5自适应平均池化特征图像,检测装置根据采样率2^j对金字塔池化图像进行上采样操作具体是:根据采样率2^j对映射特征图像进行上采样操作,使得采样后的映射特征图像的分辨率与第j张第一采样特征图像的分辨率相同;分别对全局平局池化特征图像和两张自适应平均池化特征图像进行上采样,以得到采样后的全局平均池化特征图像和两张采样后的自适应池化特征图像,其中,采样后的全局平均池化特征图像的分辨率和两张采样后的自适应池化特征图像的分辨率均与采样后的映射特征图像的分辨率相同。
检测装置对第j张第二采样特征图像、第j张第一采样特征图像和采样后的金字塔池化特征图像进行拼接操作具体包括:将对第j张第二采样特征图像、第j张第一采样特征图像和采样后的金字塔池化特征图像进行拼接,得到多通道特征图像,然后对多通道特征图像进行多通道卷积操作,以得到第j张拼接特征图像。
需要指出的是,多通道特征图像的通道数据与第j张第二采样特征图像、第j张第一采样特征图像和采样后的金字塔池化特征图像的通道数相关。若第j张第二采样特征图像、第j张第一采样特征图像和采样后的金字塔池化特征图像均为单通道图像,则多通道特征图像为6通道图像;若第j张第二采样特征图像为3通道图像,第j张第一采样特征图像为5通道特征图像,且采样后的金字塔池化图像均为单通道特征图像,则多通道特征图像为12通道图像。
在一个可行的实施例中,检测装置对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像,具体包括:
根据S个比率分别对第j张第二融合特征图像进行S次平均池化操作,以得到S张平均池化特征图;S为大于1的整数;分别对S张平均池化特征图进行卷积操作,以得到S张卷积特征图;分别对S张卷积特征图进行上采样,以得到S张第三采样特征图像,该S张第三采样特征图像中的每张图像的分辨率与第j张拼接特征图像的分辨率相同;
根据S张第三采样特征图像和所述第j张拼接特征图像得到目标特征图像,该目标特征图像中第p行的第q个像素点的特征值为S张第三采样特征图像中第p行的第q个像素点的特征值和第j张拼接特征图像的第p行的第q个像素点的特征值之和;其中,q为大于0且不大于w,p为大于0且不大于h,w和h为第三采样特征图像的宽度值和高度值;对目标特征图像卷积操作,以得到所述第j张拼接融合特征图像。
需要指出的是,若第三采样特征图像为单通道图像,则该第三采样特征图像中第p行的第q个像素点的特征值为第三采样特征图像中第p行的第q个像素点的像素值;若第三采样特征图像为多通道图像,则该第三采样特征图像中第p行的第q个像素点的特征值为第三采样特征图像中每个通道上第p行的第q个像素点的像素值之和。
残差操作是一种常见的处理方法,它将输入的特征图经过若干卷积、池化、激活等操作得到新的特征图,新的特征图与输入特征图进行相加作为输出特征图。该操作有效解决了深度卷积神经网络的梯度消失和梯度爆炸问题,在现代卷积神经网络设计中被广泛使用。
在一个可行的实施例中,检测装置对M-2张第二融合特征图像和第一融合特征图像分别进行残差操作,以得到M-1张边缘特征图像,具体包括:
对第一融合特征图像进行多次卷积、池化、激活等操作后,得到第一特征图像,该第一特征图像的分辨率与第一融合特征图像的分辨率相同;再将第一特征图像和第一融合特征图像进行相加,以得到第二特征图像,其中,第二特征图像的第k1行的第k2个像素点的特征值为第一特征图像和第一融合特征图像的第k1行的第k2个像素点的特征值之和;对第二特征图像进行一次多通道卷积操作和一次单通道卷积操作,以得到一张边缘特征图像。其中,k1为大于0且不大于H,k2为大于0且不大于W,W和H分别为第一融合特征图像的宽度值和高度值。
检查装置对M-2张第二融合图像中的每张图像进行如对第一融合特征图像进行的操作,得到M-2张边缘特征图像。此时检测装置共得到M-1张边缘特征图像。
在一个可行的实施例中,在将待检测图像输入到卷积神经网络特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像之前,检测方法还包括:
获取多张显著性检测图像样本和多张边缘检测样本,根据该多张显著性检测样本和多张边缘检测样本交替训练特征检测模型。
具体地,如图5所示,检测装置将一张显著性检测图像样本输入到特征检测模型中进行深度神经网络前向传播运算,再计算特征检测模型的梯度,该梯度可称为第一梯度;检测装置然后将一张边缘检测图像样本输入到特征检测模型中进行深度神经网络前向传播运算,再计算特征检测模型的梯度,该梯度可称为第二梯度。
重复进行N次后,检测装置得到N个第一梯度和N个第二梯度。检测装置根据N个第一梯度和N个第二梯度更新特征检测模型中的参数,以得到新的特征检测模型。其中,N为大于或者等于1的整数。通过显著性检测图像样本和边缘检测图像样本交替训练特征检测模型,可以避免训练时过拟合,导致特征检测模型不精确,使得检测出来的结果误差大。
需要说明的是,多张显著性检测图像样本可以来自于主流的显著性检测数据集,包括ECSSD,PASCAL-S、DUT-OMRON、HKU-IS、SOD、DUTS,多张边缘检测图像可以来自于以下边缘检测数据集:BSDS300、BSDS500、PASCAL-CONTEXT。
在一个可行的实施例中,在将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像之前,检测装置从其他装置中获取特征检测模型。
在一个可行的实施例中,在将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像后,检测方法还包括:
根据待检测图像的显著性检测图像和边缘检测图像训练特征检测模型。
具体地,检测装置将待检测图像的显著性检测图像和边缘检测图像分别作为显著性检测图像样本和边缘检测图像样本,分别将待检测图像的显著性检测图像和边缘检测图像输入到C特征检测模型中,分别得到新的第一梯度和新的第二梯度,然后再根据新的第一梯度和新的第二梯度训练特征检测模型。
在一个具体的实施例中,如图6所示,假设待检测图像的分辨率为256*256,预设采样率为2,检测装置根据2倍采样率对待检测图像连续进行4次卷积池化操作,以得到4张第一采样特征图像,具体包括:对待检测图像进行卷积池化操作,得到第1张第一采样特征图像,该第一采样特征图像的分辨率为128*128;对第1张第一采样特征图像进行卷积池化操作,得到第2张第一采样特征图像,该第一采样特征图像的分辨率为64*64;对第2张第一采样特征图像进行卷积池化操作,得到第3张第一采样特征图像,该第一采样特征图像的分辨率为32*32;对第3张第一采样特征图像进行卷积池化操作,得到第4张第一采样特征图像,该第一采样特征图像的分辨率为16*16,至此得到4张第一采样特征图像。
检测装置对第4张第一采样特征图像进行金字塔池化操作,得到金字塔池化特征图像。具体地,检测装置对第4张第一采样特征图像进行同一映射操作,得到映射特征图像,该映射特征图像的分辨率与第4张第一采样特征图像的分辨率相同;对第4张第一采样特征图像进行全局平均池化操作,得到全局平均池化特征图像,该全局平均池化特征图像的分辨率为1*1;对第4张第一采样特征图像分别进行两次自适应平均池化操作,得到两张自适应平均池化特征图像,该两张自适应平均池化特征图像的分辨率分辨为3*3和5*5。换言之,金字塔池化特征图像包括上述映射特征图像、全局平均池化特征图像和两张自适应平均池化特征图像。
检测装置对第4张第一采样特征图像进行特征融合操作,得到第一融合特征图像。具体地,如图7所示,检测装置分别根据3个比率(包括1/8,1/4,1/2)对第4张第一采样特征图像进行平均池化操作,以得到3张平均池化特征图像,其中,该3张平均池化特征图像的分辨率分别为2*2,4*4,8*8。3张平均池化特征图像可以分别称为1/8倍下采样特征图,1/4倍下采样特征图,1/2倍下采样特征图。检测装置然后对3张平均池化特征图像分别进行进行卷积操作,以得到3张卷积特征图像。其中进行卷积操作的卷积核为3*3。检测装置对3张卷积特征图像进行上采样操作,以得到3张第三采样特征图像,其中采样率分别为8,4,2,3张上采样图像的分辨率均与第4张第一采样特征图像的分辨率相同,均为16*16。检测装置根据3张第三采样特征图像和第4张第一采样特征图像得到目标特征图像,该目标特征图像中的第k行第j个像素点的特征值为3张第三采样特征图像和第4张采样特征图像中第k行第j个像素点的特征值之和。其中,k为大于0且不大于16的整数,j为大于0且不大于16的整数;检测装置对该目标特征图像进行卷积核为3*3的卷积操作,以得到第一融合特征图像,该图像的分辨率为16*16。
检测装置对第一融合特征图像进行残差操作,以得到第1张边缘特征图像。具体包括检测装置对第一融合特征图像进行多次卷积、池化和激活等操作后,得到第一特征图像,该第一特征图像的分辨率与第一融合特征图像的分辨率相同;再将第一特征图像和第一融合特征图像进行相加,以得到第二特征图像,其中,第二特征图像的第k1行的第k2个像素点的特征值为第一特征图像和第一融合特征图像的第k1行的第k2个像素点的特征值之和;其中,k1为大于0且不大于H的整数,k2为大于0且不大于W的整数,H和W分别为第一特征图像的高度值和宽度值;对第二特征图像进行一次16通道3*3的卷积操作和一次单通道1*1的卷积操作,以得到第1张边缘特征图像。检测装置对第3张边缘特征图像进行卷积操作,以得到第3张边缘检测图像。
检测装置对根据2倍采样率第一融合特征图像进行上采样,得到第1张第二采样特征图像,该图像的分辨率为32*32。检测装置根据2倍采样率对金字塔池化特征图像进行上采样,得到采样后的金字塔池化特征图像。该采样后的金字塔池化特征图像包括采样后的映射特征图像、采样后的全局平均池化特征图像和采样后的两张自适应平均池化特征图像,且分辨率均为32*32。检测装置对第1张第二采样特征图像、采样后的金字塔池化特征图像和第1张第一采样特征图像进行拼接,以得到多通道特征图像,然后对该多通道特征图像进行卷积核为3*3的多通道卷积操作,以得到第1拼接特征图像。
检测装置对第1拼接特征图像进行融合操作,以得到第1张第二融合特征图像,其中,第1张第二融合特征图像的分辨率为32*32。具体过程可参见检测装置对第4张第一采样特征图像进行融合操作的过程,在此不再叙述。
检测装置对第1张第二融合特征图像进行残差操作,以得到第2张边缘特征图,具体过程可参见检测装置对第一融合特征图像进行残差操作的过程,在此不再叙述。检测装置对第2张边缘特征图像进行卷积操作,以得到第2张边缘检测图像。
检测装置根据2倍采样率对第1张第二融合特征图像进行上采样操作,以得到第2张第二采样特征图像,该第二采样特征图像的分辨率为64*64。检测装置根据4倍采样率对金字塔池化特征图像进行上采样,得到采样后的金字塔池化特征图像。该采样后的金字塔池化特征图像包括采样后的映射特征图像、采样后的全局平均池化特征图像和采样后的两张自适应平均池化特征图像,且分辨率均为64*64。检测装置对第2张第二采样特征图像、采样后的金字塔池化特征图像和第2张第一采样特征图像进行拼接,以得到多通道特征图像,然后对该多通道特征图像进行卷积核为3*3的多通道卷积操作,以得到第2拼接特征图像。
检测装置对第2拼接特征图像进行融合操作,以得到第2张第二融合特征图像,其中,第2张第二融合特征图像的分辨率为64*64。具体过程可参见检测装置对第4张第一采样特征图像进行融合操作的过程,在此不再叙述。
检测装置对第2张第二融合特征图像进行残差操作,以得到第3张边缘特征图,具体过程可参见检测装置对第一融合特征图像进行残差操作的过程,在此不再叙述。检测装置对第3张边缘特征图像进行卷积操作,以得到第3张边缘检测图像。
检测装置根据2倍采样率对第2张第二融合特征图像进行上采样操作,以得到第3张第二采样特征图像,该第二采样特征图像的分辨率为128*128。检测装置根据8倍采样率对金字塔池化特征图像进行上采样,得到采样后的金字塔池化特征图像。该采样后的金字塔池化特征图像包括采样后的映射特征图像、采样后的全局平均池化特征图像和采样后的两张自适应平均池化特征图像,且分辨率均为128*128。检测装置对第2张第二采样特征图像、采样后的金字塔池化特征图像和第1张第一采样特征图像进行拼接,以得到多通道特征图像,然后对该多通道特征图像进行卷积核为3*3的多通道卷积操作,以得到第2拼接特征图像。
检测装置对第2拼接特征图像进行融合操作,以得到第2张第二融合特征图像,其中,第2张第二融合特征图像的分辨率为128*128。具体过程可参见检测装置对第4张第一采样特征图像进行融合操作的过程,在此不再叙述。
检测装置对第1张第二采样特征图像、第1张边缘特征图像、第2张边缘特征图像和第3张边缘特征图像进行拼接,以得到多通道特征图像,然后对该多通道特征图像进行卷积核为3*3的多通道卷积操作,以得到待检测图像的显著性检测图像。
检测装置根据待检测图像的显著性检测图像和边缘检测图像(包括第1张边缘检测图像、第2张边缘检测图像和第3张边缘检测图像)训练特征检测模型。
可以看出,在本申请实施例的方案中,通过一个特征检测模型得到待检测图像的显著性检测图像和边缘检测图像,减少了模型的参数量,避免了存储资源的浪费。通过对金字塔池化特征图像进行不同比率的上采样,与各个尺度的融合特征进行拼接,为下一层的融合处理提供新的特征图,将待检测图像的全局语义特征反复用于增强多尺度特征,提升了特征检测模型的感受野,保证了检测结果的完整性。通过多个比率的池化融合操作,既抑制了不同尺度特征间的混淆效应,也提升了特征检测模型的感受野,从而提供了特征检测模型的精度,同时还能有效减少模型的参数量,从而提高了存储和运算效率。通过M-1张边缘检测图像和特征图像A确定待检测图像的显著性检测图像,充分利用了边缘特征的协同性,使得显著性检测图像更加精确和完整。
参见图8,图8为本申请实施例提供的一种检测方法的交互式流程示意图。该检测方法应用于图像检测系统,该图像检测系统包括终端设备和检测服务器。该检测方法包括:
S801、终端设备向检测服务器发送检测请求。
其中,检测请求携带有待检测图像,该检测请求用于请求获取待检测图像的显著性检测图像和边缘检测图像。
S802、检测服务器将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像。
需要说明的是,检测服务器将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像的具体过程可参见图4所示实施例中检测装置的相关描述,在此不再叙述。
在一个示例中,检测装置从第三方服务器中获取特征检测模型。
S803、检测服务器向终端设备发送检测响应。
其中,该检测响应携带有待检测图像的显著性检测图像和边缘检测图像。
参见图9,图9为本申请实施例提供的一种检测装置的结构示意图。如图9所示,该检测装置900包括:
获取模块901,用于获取待检测图像;
检测模块902,用于将待检测图像输入到卷积神经网络特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像;
其中,检测模块902具体用于:
对待检测图像进行卷积池化操作,得到M张第一采样特征图像,M为大于1的整数,对M张第一采样特征图像中分辨率最小的采样特征图像进行金字塔池化操作,以得到金字塔池化特征图像;根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像;对待检测图像的边缘特征图像进行卷积操作,以得到待检测图像的边缘检测图像;根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像。
在一个可行的实施例中,在根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像的方面,检测模块902具体用于:
对M张第一采样特征图像中分辨率最小的采样特征图像进行特征融合,得到第一融合特征图像;
将金字塔池化特征图像与M-1张第一采样特征图像中的每张进行拼接融合操作,以得到M-1张第二融合特征图像;其中,M-1张第一采样特征图像为M张第一采样特征图像中除了分辨率最小的图像之外的采样图像;
对第一融合特征图像进行残差操作,并分别对M-2张第二融合特征图像进行残差操作,以得到M-1张边缘特征图像;M-2张第二融合特征图像为M-1张第二融合特征图像中除了分辨率最大的图像之外的第二融合特征图像。
在一个可行的实施例中,在根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像的方面,检测模块902具体用于:
对特征图像A和M-1张边缘特征图像进行拼接,再进行卷积操作,以得到待检测图像的显著性检测图像,特征图像A为M-2张第二融合特征图像中分辨率最大的图像。
在一个可行的实施例中,在根据M-1张第一采样特征图像和金字塔池化特征图像进行M-1次拼接融合操作,以得到M-1张第二融合特征图像的方面,检测模块902具体用于:
在进行第j次拼接融合操作时,若j等于1,则根据2倍采样率对第一融合特征图像进行上采样操作,以得到第j张第二采样特征图像;若j大于1且不大于M-1,则根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,以得到第j张第二采样特征图像;
根据采样率2j对金字塔池化特征图像进行上采样操作,以得到采样后的金字塔池化特征图像;
对第j张第二采样特征图像、第M-j张第一采样特征图像和采样后的金字塔池化特征图像进行拼接操作,以得到第j张拼接特征图像;其中,第j张第二采样特征图像、第M-j张第一采样特征图像和采样后的金字塔池化特征图像的分辨率相同;
对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像,M-1张第二融合特征图像包括第j张第二融合特征图像。
在一个可行的实施例中,检测模块902还用于:
在对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像之前,根据S个比率分别对第j张拼接特征图像进行S次平均池化操作,以得到S张平均池化特征图;S为大于1的整数;
分别对S张平均池化特征图进行卷积操作,以得到S张卷积特征图;分别对S张卷积特征图进行上采样,以得到S张第三采样特征图像,该S张第三采样特征图像中的每张图像的分辨率与第j张拼接特征图像的分辨率相同;
在对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像的方面,检测模块902具体用于:
根据S张第三采样特征图像和第j张拼接特征图像得到目标特征图像,目标特征图像中第p行的第q个像素点的特征值为S张第三采样特征图像中第p行的第q个像素点的特征值和第j张拼接特征图像的第p行的第q个像素点的特征值之和;其中,q为大于0且不大于w的整数,p为大于0且不大于h的整数,w为第三采样特征图像的宽度值;h为第三采样特征图像的高度值;对目标特征图像卷积操作,以得到第j张第二融合特征图像。
在一个可行的实施例中,在对待检测图像进行卷积池化操作,得到M张第一采样特征图像的方面,检测模块902具体用于:
根据预设采样率对待检测图像进行M次卷积池化操作,以得到M张第一采样特征图像,其中M张第一采样特征图像中的第i张第一采样特征图像是对第i-1张第一采样特征图像进行卷积池化操作得到的;i为大于1且不大于M的整数。
在一个可行的实施例中,
获取模块901,还用于在将待检测图像输入到卷积神经网络特征检测模型,得到待检测图像的显著性检测图像和边缘检测图像之前,获取多张显著性检测图像样本和多张边缘检测图像样本;
检测装置900还包括:
训练模块903,用于根据多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型。
在一个可行的实施例中,在检测模块902执行将待检测图像输入到卷积神经网络特征检测模型,得到待检测图像的显著性检测图像和边缘检测图像之后,训练模块903还用于:
根据待检测图像的显著性检测图像和边缘检测图像训练特征检测模型。
需要说明的是,由于检测装置900可以从其他装置中获取特征检测模型,不需要自己训练模型,因此检测装置900可以只包括获取模块901和检测模块902,训练模块903是可选的,图9中训练模块903用虚线框表示。
需要说明的是,上述各模块(获取模块901、检测模块902和训练模块903)用于执行上述步骤S401和S402的相关内容。具体地,获取模块901用于执行步骤S401的相关内容,检测模块902和训练模块903用于执行步骤S402的相关内容。
在本实施例中,检测装置900是以模块的形式来呈现。这里的“模块”可以指特定专用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。此外,以上获取模块901、9检测模块902和训练模块903可通过图10所示的检测装置的处理器1001来实现。
如图10所示的检测装置可以以图10中的结构来实现,该检测装置1000包括至少一个处理器1001,至少一个存储器1002、至少一个通信接口1003。处理器1001、存储器1002和通信接口1003通过通信总线连接并完成相互间的通信。
通信接口1003,用于与其他设备或通信网络通信,如以太网,无线接入网(radioaccess network,RAN),无线局域网(wireless local area networks,WLAN)等。
存储器1002可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器1002用于存储执行以上方案的应用程序代码,并由处理器1001来控制执行。所述处理器1001用于执行所述存储器1002中存储的应用程序代码。
存储器1002存储的代码可执行以上提供的一种检测方法。
处理器1001还可以采用或者一个或多个集成电路,用于执行相关程序,以实现本申请实施例的检测方法或检测特征模型训练方法。
处理器1001还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本申请的推荐方法的各个步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。在实现过程中,本申请的状态生成模型和选择策略的训练方法的各个步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1001还可以是通用处理器、数字信号处理器(digital signal processing,DSP)、ASIC、现成可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及模块框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1002,处理器1001读取存储器1002中的信息,结合其硬件完成本申请实施例的图像边缘和显著性检测方法或模型训练方法。
通信接口1003使用例如但不限于收发器一类的收发装置,来实现推荐装置或训练装置与其他设备或通信网络之间的通信。例如,可以通过通信接口1003接收终端设备发送携带待检测图像的检测请求和向终端设备发送携带待检测图像的显著性检测图像和边缘检测图像。
总线可包括在装置各个部件(例如,存储器1002、处理器1001、通信接口1003)之间传送信息的通路。
在一种可能的实施例中,处理器1001具体执行以下步骤:将待检测图像输入到卷积神经网络特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像;
其中,将待检测图像输入到特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像,包括:
待检测图像进行卷积池化操作,得到M张第一采样特征图像,M为大于1的整数,对M张第一采样特征图像中分辨率最小的采样特征图像进行金字塔池化操作,以得到金字塔池化特征图像;根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像;对所述待检测图像的边缘特征图像进行卷积操作,以得到待检测图像的边缘检测图像;根据待检测图像的边缘特征图像得到待检测图像的显著性检测图像。
在一个可能的实施例中,处理器1001还用于执行如下步骤:
在将待检测图像输入到特征检测模型中之前,获取待检测图像。
在一种可能的实施例中,在执行根据金字塔池化特征图像和M张第一采样特征图像得到待检测图像的边缘特征图像的步骤时,处理器1001具体执行如下步骤:对M张第一采样特征图像中分辨率最小的采样特征图像进行特征融合,得到第一融合特征图像;
将金字塔池化特征图像与M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像;其中,M-1张第一采样特征图像为M张第一采样特征图像中除了分辨率最小的图像之外的采样图像;
对第一融合特征图像进行残差操作,并分别对M-2张第二融合特征图像进行残差操作,得到M-1张边缘特征图像;M-2张第二融合特征图像为M-1张第二融合特征图像中除了分辨率最大的图像之外的第二融合特征图像。
在一个可行的实施例中,在执行根据待检测图像的边缘检测图像得到待检测图像的显著性检测图像的步骤时,处理器1001具体执行如下步骤:
对特征图像A和M-1张边缘特征图像进行拼接,再进行卷积操作,以得到待检测图像的显著性检测图像,特征图像A为M-2张第二融合特征图像中分辨率最大的图像。
在一种可能的实施例中,在执行将金字塔池化特征图像与所述M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像的步骤时,处理器1001具体执行如下步骤:
在进行第j次拼接融合操作时,若j等于1,则根据2倍采样率对第一融合特征图像进行上采样操作,以得到第j张第二采样特征图像;若j大于1且不大于M-1,则根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,以得到第j张第二采样特征图像;
根据采样率2j对金字塔池化特征图像进行上采样操作,以得到采样后的金字塔池化特征图像;
对第j张第二采样特征图像、第M-j张第一采样特征图像和采样后的金字塔池化特征图像进行拼接操作,以得到第j张拼接特征图像;其中,第j张第二采样特征图像、第M-j张第一采样特征图像和采样后的金字塔池化特征图像的分辨率相同;
对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像,M-1张第二融合特征图像包括第j张第二融合特征图像。
在一种可能的实施例中,在时,处理器1001还执行如下步骤:
对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像之前,根据S个比率分别对第j张拼接特征图像进行S次平均池化操作,以得到S张平均池化特征图;S为大于1的整数;
分别对S张平均池化特征图进行卷积操作,以得到S张卷积特征图;
分别对S张卷积特征图进行上采样,以得到S张第三采样特征图像,该S张第三采样特征图像中的每张图像的分辨率与第j张拼接特征图像的分辨率相同;
在执行对第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像的步骤时,处理器1001具体执行如下步骤:
根据S张第三采样特征图像和第j张拼接特征图像得到目标特征图像,目标特征图像中第p行的第q个像素点的特征值为S张第三采样特征图像中第p行的第q个像素点的特征值和第j张拼接特征图像的第p行的第q个像素点的特征值之和;其中,q为大于0且不大于w的整数,p为大于0且不大于h的整数,w为第三采样特征图像的宽度值;h为第三采样特征图像的高度值;对目标特征图像卷积操作,以得到第j张第二融合特征图像。
在一种可能的实施例中,在执行对待检测图像进行卷积池化操作得到M张第一采样特征图像的步骤时,处理器1001还执行如下步骤:
根据预设采样率对待检测图像进行M次卷积池化操作,以得到M张第一采样特征图像,其中M张第一采样特征图像中的第i张第一采样特征图像是对第i-1张第一采样特征图像进行卷积池化操作得到的,i为大于1且不大于M的整数。
在一种可能的实施例中,处理器1001还执行如下步骤:
在将待检测图像输入到卷积神经网络特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像之前,获取多张显著性检测图像样本和多张边缘检测图像样本;根据多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型。
在一种可能的实施例中,处理器1001还执行如下步骤:
在将待检测图像输入到卷积神经网络特征检测模型中,得到待检测图像的显著性检测图像和边缘检测图像之后,根据待检测图像的显著性检测图像和边缘检测图像训练特征检测模型。
如图11所示的终端设备可以以图11中的结构来实现,该终端设备1100包括至少一个处理器1101和至少一个通信接口1102。处理器1101和通信接口1102通过通信总线连接并完成相互间的通信。
通信接口1102,用于与其他设备或通信网络通信,如以太网,RAN,WLAN等。
通信接口1102从第三方服务器获取程序,处理器1102调用该程序执行如图4所示实施例的相关检测方法,通信接口并将得到的结果(即本申请中的待检测图像的显著性检测图像和边缘检测图像)发送至其他电子设备。
处理器1101还可以采用或者一个或多个集成电路,用于执行相关程序,以实现本申请实施例的检测方法或检测特征模型训练方法。
处理器1101还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本申请的推荐方法的各个步骤可以通过处理器1101中的硬件的集成逻辑电路或者软件形式的指令完成。在实现过程中,本申请的状态生成模型和选择策略的训练方法的各个步骤可以通过处理器1101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1101还可以是通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及模块框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
通信接口1102使用例如但不限于收发器一类的收发装置,来实现推荐装置或训练装置与其他设备或通信网络之间的通信。
总线可包括在装置各个部件(例如处理器1001、通信接口1102)之间传送信息的通路。
在一个实施例中,本发明实施例还提供另一种检测方法,包括:
接收终端设备发送的图像检测请求,该图像检测请求携带有待检测图像;
按照第一方面所述方法的部分或全部对待检测图像进行处理,以得到待检测图像的边缘检测图像和显著性检测图像;
向终端设备发送携带有所述待检测图像的边缘检测图像和显著性检测图像的检测响应。
在一个实施例中,本发明实施例提供一种检测服务器,包括:
处理器和与该处理器耦合的通信接口;
通信接口接收终端设备发送的图像检测请求,该图像检测请求携带有待检测图像;
处理器按照第一方面所述方法的部分或全部对待检测图像进行处理,以得到待检测图像的边缘检测图像和显著性检测图像;
通信接口向终端设备发送携带有待检测图像的边缘检测图像和显著性检测图像的检测响应。
需要说明的是,检测服务器的处理器和通信接口的连接关系可参见图11,具体功能的描述可参见对图11中的处理器1101和通信接口1102的相关描述。
参见图12,图12为本申请实施例提供的一种训练装置的结构示意图。如图12所示,该训练装置1200包括:
获取模块1201,用于获取多张显著性检测图像样本和多张边缘检测图像样本;
训练模块1202,用于根据多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型。通过显著性检测图像样本和边缘检测图像样本交替训练特征检测模型,解决了如何利用两类面向单一任务的样本数据集进行有效训练的问题,提高了图像样本的利用率,进一步提高了特征检测模型的精度。
需要说明的是,训练模块1202训练特征检测模型的过程具体可参见图4所示实施例中根据显著性检测图像样本和边缘检测图像样本交替训练特征检测模型的相关描述,在此不再叙述。
在一个可行的实施例中,训练模块1202还用于:
在根据多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型之后,根据待检测图像的显著性检测图像和边缘检测图像训练特征检测模型,其中,待检测图像的显著性检测图像和边缘检测图像是将待检测图像输入到特征检测模型得到的。通过基于特征检测模型得到的显著性检测图像和边缘检测图像来训练特征检测模型,提高了特征检测模型的精度,进而提高了后续待检测图像的显著性检测图像和边缘检测图像的准确性。
本申请提供一种计算机可读介质,该计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于执行如图4所示实施例的检测方法的相关内容。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。
Claims (14)
1.一种图像边缘和显著性检测方法,其特征在于,包括:
将待检测图像输入到特征检测模型,得到所述待检测图像的显著性检测图像和边缘检测图像;
其中,所述将所述待检测图像输入到特征检测模型,得到所述待检测图像的显著性检测图像和边缘检测图像,包括:
对所述待检测图像进行卷积池化操作,得到M张第一采样特征图像,所述M为大于1的整数;
对所述M张第一采样特征图像中分辨率最小的采样特征图像进行金字塔池化操作,得到金字塔池化特征图像;
根据所述金字塔池化特征图像和所述M张第一采样特征图像得到待检测图像的边缘特征图像;
对所述待检测图像的边缘特征图像进行卷积操作,以得到所述待检测图像的边缘检测图像;
根据所述待检测图像的边缘特征图像得到所述待检测图像的显著性检测图像;
其中,所述根据所述金字塔池化特征图像和所述M张第一采样特征图像得到待检测图像的边缘特征图像,包括:
对所述M张第一采样特征图像中分辨率最小的采样特征图像进行特征融合,得到第一融合特征图像;
将所述金字塔池化特征图像与M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像;其中,所述M-1张第一采样特征图像为所述M张第一采样特征图像中除了所述分辨率最小的图像之外的采样图像;
对所述第一融合特征图像进行残差操作,并分别对M-2张第二融合特征图像进行残差操作,得到M-1张边缘特征图像,所述M-2张第二融合特征图像为所述M-1张第二融合特征图像中除了分辨率最大的图像之外的第二融合特征图像;
所述根据所述待检测图像的边缘特征图像得到所述待检测图像的显著性检测图像,包括:
对特征图像A和所述M-1张边缘特征图像进行拼接,再进行卷积操作,以得到所述待检测图像的显著性检测图像,所述特征图像A为所述M-2张第二融合特征图像中分辨率最大的图像。
2.根据权利要求1所述的方法,其特征在于,所述将所述金字塔池化特征图像与所述M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像,包括:
在进行第j次拼接融合操作时,若j等于1,则根据2倍采样率对所述第一融合特征图像进行上采样操作,得到第j张第二采样特征图像;若j大于1且不大于M-1,则根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,得到所述第j张第二采样特征图像;
根据采样率2j对所述金字塔池化特征图像进行上采样操作,得到采样后的金字塔池化特征图像;
对所述第j张第二采样特征图像、第M-j张第一采样特征图像和所述采样后的金字塔池化特征图像进行拼接操作,得到第j张拼接特征图像;其中,所述第j张第二采样特征图像、第M-j张第一采样特征图像和所述采样后的金字塔池化特征图像的分辨率相同;
对所述第j张拼接特征图像进行融合操作,得到第j张所述第二融合特征图像。
3.根据权利要求2所述的方法,其特征在于,在所述对所述第j张拼接特征图像进行融合操作,以得到第j张所述第二融合特征图像之前,所述方法还包括:
根据S个比率分别对所述第j张拼接特征图像进行S次平均池化操作,得到S张平均池化特征图;所述S为大于1的整数;
分别对所述S张平均池化特征图进行卷积操作,得到S张卷积特征图;
分别对所述S张卷积特征图进行上采样,得到S张第三采样特征图像,所述S张第三采样特征图像中的每张图像的分辨率与所述第j张拼接特征图像的分辨率相同;
所述对所述第j张拼接特征图像进行融合操作,以得到第j张所述第二融合特征图像,包括:
根据所述S张第三采样特征图像和所述第j张拼接特征图像得到目标特征图像,所述目标特征图像中第p行的第q个像素点的特征值为所述S张第三采样特征图像中第p行的第q个像素点的特征值和所述第j张拼接特征图像的第p行的第q个像素点的特征值之和;其中,q为大于0且不大于w的整数,p为大于0且不大于h的整数,所述w为所述第三采样特征图像的宽度值;所述h为所述第三采样特征图像的高度值;
对所述目标特征图像卷积操作,得到第j张第二融合特征图像。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述对所述待检测图像进行卷积池化操作,得到M张第一采样特征图像,包括:
根据预设采样率对所述待检测图像进行M次卷积池化操作,得到M张第一采样特征图像,
其中所述M张第一采样特征图像中的第i张第一采样特征图像是对第i-1张第一采样特征图像进行卷积池化操作得到的;所述i为大于1且不大于M的整数。
5.一种检测装置,其特征在于,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-4任一项权利要求所述的方法。
6.一种终端设备,其特征在于,包括:
处理器;与所述处理器耦合的通信接口;
所述处理器调用可执行程序代码,执行如权利要求1-4任一项权利要求所述的方法,得到待检测图像的边缘检测图像和显著性检测图像;
所述通信接口将所述待检测图像的边缘检测图像和显著性检测图像发送至其他电子设备。
7.一种检测装置,其特征在于,包括:
获取模块,用于获取待检测图像;
检测模块,用于将所述待检测图像输入到特征检测模型中,得到所述待检测图像的显著性检测图像和边缘检测图像;
其中,所述检测模块具体用于:
对所述待检测图像进行卷积池化操作,得到M张第一采样特征图像;所述M为大于1的整数;
对所述M张第一采样特征图像中的分辨率最小的采样特征图像进行金字塔池化操作,以得到金字塔池化特征图像;
根据所述金字塔池化特征图像和所述M张第一采样特征图像得到待检测图像的边缘特征图像;
对所述待检测图像的边缘特征图像进行卷积操作,以得到所述待检测图像的边缘检测图像;
根据所述待检测图像的边缘特征图像得到所述待检测图像的显著性检测图像;
其中,在根据所述金字塔池化特征图像和所述M张第一采样特征图像得到待检测图像的边缘特征图像的方面,所述检测模块具体用于:
对所述M张第一采样特征图像中分辨率最小的采样特征图像进行特征融合,得到第一融合特征图像;
将所述金字塔池化特征图像与所述M-1张第一采样特征图像中的每张进行拼接融合操作,以得到M-1张第二融合特征图像;其中,所述M-1张第一采样特征图像为所述M张第一采样特征图像中除了分辨率最小的图像之外的采样图像;
对所述第一融合特征图像进行残差操作和分别对M-2张第二融合特征图像,以得到M-1张边缘特征图像;所述M-2张第二融合特征图像为所述M-1张第二融合特征图像中除了分辨率最大的图像之外的第二融合特征图像;
在根据所述待检测图像的边缘特征图像得到所述待检测图像的显著性检测图像的方面,所述检测模块具体用于:
对特征图像A和M-1张边缘特征图像进行拼接,再进行卷积操作,以得到所述待检测图像的显著性检测图像,所述特征图像A为所述M-2张第二融合特征图像中分辨率最大的图像。
8.根据权利要求7所述的装置,其特征在于,在将所述金字塔池化特征图像与所述M-1张第一采样特征图像中的每张进行拼接融合操作,得到M-1张第二融合特征图像的方面,所述检测模块具体用于:
在进行第j次拼接融合操作时,若j等于1,则根据2倍采样率对所述第一融合特征图像进行上采样操作,以得到第j张第二采样特征图像;若j大于1且不大于M-1,则根据2倍采样率对第j-1张第二融合特征图像进行上采样操作,以得到所述第j张第二采样特征图像;
根据采样率2j对所述金字塔池化特征图像进行上采样操作,以得到采样后的金字塔池化特征图像;
对所述第j张第二采样特征图像、第M-j张第一采样特征图像和所述采样后的金字塔池化特征图像进行拼接操作,以得到第j张拼接特征图像;其中,所述第j张第二采样特征图像、第M-j张第一采样特征图像和所述采样后的金字塔池化特征图像的分辨率相同
对所述第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像。
9.根据权利要求8所述的装置,其特征在于,所述检测模块还用于:
在所述对所述第j张拼接特征图像进行融合操作,以得到第j张所述第二融合特征图像之前,根据S个比率分别对所述第j张拼接特征图像进行S次平均池化操作,以得到S张平均池化特征图;所述S为大于1的整数;
分别对所述S张平均池化特征图进行卷积操作,以得到S张卷积特征图;
分别对所述S张卷积特征图进行上采样,以得到S张第三采样特征图像,所述S张第三采样特征图像中的每张图像的分辨率与所述第j张拼接特征图像的分辨率相同;
在对所述第j张拼接特征图像进行融合操作,以得到第j张第二融合特征图像的方面,所述检测模块具体用于
根据所述S张第三采样特征图像和所述第j张拼接特征图像得到目标特征图像,所述目标特征图像中第p行的第q个像素点的特征值为所述S张第三采样特征图像中第p行的第q个像素点的特征值和所述第j张拼接特征图像的第p行的第q个像素点的特征值之和;其中,q为大于0且不大于w的整数,p为大于0且不大于h的整数,所述w为所述第三采样特征图像的宽度值;所述h为所述第三采样特征图像的高度值;
对所述目标特征图像卷积操作,以得到所述第j张第二融合特征图像。
10.根据权利要求7-9任一项所述的装置,其特征在于,在对所述待检测图像分别进行卷积池化操作,得到M张第一采样特征图像的方面,所述检测模块具体用于:
根据预设采样率对所述待检测图像进行M次卷积池化操作,以得到所述M张第一采样特征图像,
其中所述M张第一采样特征图像中的第i张第一采样特征图像是对第i-1张第一采样特征图像进行卷积池化操作得到的,所述i为大于1且不大于M的整数。
11.一种图像边缘和显著性检测方法,其特征在于,包括:
接收终端设备发送的图像检测请求,所述图像检测请求携带有待检测图像;
按照如权利要求1-4任一项所述的方法对所述待检测图像进行处理,以得到所述待检测图像的边缘检测图像和显著性检测图像;
向所述终端设备发送携带有所述待检测图像的边缘检测图像和显著性检测图像的检测响应。
12.一种检测服务器,其特征在于,包括:
处理器和与所述处理器耦合的通信接口;
所述通信接口接收终端设备发送的图像检测请求,所述图像检测请求携带有待检测图像;
所述处理器按照如权利要求1-4任一项所述的方法对所述待检测图像进行处理,以得到待检测图像的边缘检测图像和显著性检测图像;
所述通信接口向所述终端设备发送携带有所述待检测图像的边缘检测图像和显著性检测图像的检测响应。
13.一种训练装置,其特征在于,包括:
获取模块,用于获取多张显著性检测图像样本和多张边缘检测图像样本;
训练模块,用于根据所述多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型,所述特征检测模型用于权利要求1-4任一项所述的方法。
14.根据权利要求13所述的装置,其特征在于,所述训练模块还用于:
在根据所述多张显著性检测图像样本和多张边缘检测图像样本交替训练特征检测模型之后,根据待检测图像的显著性检测图像和边缘检测图像训练所述特征检测模型,
其中,所述待检测图像的显著性检测图像和边缘检测图像是将所述待检测图像输入到所述特征检测模型得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910311911.9A CN111833363B (zh) | 2019-04-17 | 2019-04-17 | 图像边缘和显著性检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910311911.9A CN111833363B (zh) | 2019-04-17 | 2019-04-17 | 图像边缘和显著性检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111833363A CN111833363A (zh) | 2020-10-27 |
CN111833363B true CN111833363B (zh) | 2023-10-24 |
Family
ID=72915071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910311911.9A Active CN111833363B (zh) | 2019-04-17 | 2019-04-17 | 图像边缘和显著性检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111833363B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112884730B (zh) * | 2021-02-05 | 2022-06-07 | 南开大学 | 一种协同显著性物体检测方法及系统 |
CN113283421B (zh) * | 2021-06-24 | 2024-03-01 | 中国平安人寿保险股份有限公司 | 信息识别方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609911A (zh) * | 2012-01-16 | 2012-07-25 | 北方工业大学 | 基于边缘的图像显著性检测 |
CN107220962A (zh) * | 2017-04-07 | 2017-09-29 | 北京工业大学 | 一种隧道裂纹的图像检测方法和装置 |
CN107967474A (zh) * | 2017-11-24 | 2018-04-27 | 上海海事大学 | 一种基于卷积神经网络的海面目标显著性检测方法 |
CN109118459A (zh) * | 2017-06-23 | 2019-01-01 | 南开大学 | 图像显著性物体检测方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9665962B2 (en) * | 2015-07-29 | 2017-05-30 | Adobe Systems Incorporated | Image distractor detection and processng |
-
2019
- 2019-04-17 CN CN201910311911.9A patent/CN111833363B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609911A (zh) * | 2012-01-16 | 2012-07-25 | 北方工业大学 | 基于边缘的图像显著性检测 |
CN107220962A (zh) * | 2017-04-07 | 2017-09-29 | 北京工业大学 | 一种隧道裂纹的图像检测方法和装置 |
CN109118459A (zh) * | 2017-06-23 | 2019-01-01 | 南开大学 | 图像显著性物体检测方法和装置 |
CN107967474A (zh) * | 2017-11-24 | 2018-04-27 | 上海海事大学 | 一种基于卷积神经网络的海面目标显著性检测方法 |
Non-Patent Citations (4)
Title |
---|
A Multi-scale Pyramid Pooling Network for salient object detection;Abdelhafid Dakhia.et al;《Neurocomputing》;第333卷(第14期);全文 * |
Three Birds One Stone: A General Architecture for Salient Object Segmentation, Edge Detection and Skeleton Extraction;Qibin Hou.et al;《Arxiv》;全文 * |
基于空间卷积神经网络模型的图像显著性检测;高东东等;计算机工程(第05期);全文 * |
基于边缘信息的显著性区域检测算法的研究;王豪聪;中国优秀硕士学位论文全文数据库 信息科技辑》(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111833363A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110033003B (zh) | 图像分割方法和图像处理装置 | |
JP7289918B2 (ja) | 物体認識方法及び装置 | |
CN110378381B (zh) | 物体检测方法、装置和计算机存储介质 | |
CN112446270B (zh) | 行人再识别网络的训练方法、行人再识别方法和装置 | |
CN110532871B (zh) | 图像处理的方法和装置 | |
CN109993707B (zh) | 图像去噪方法和装置 | |
CN111402130B (zh) | 数据处理方法和数据处理装置 | |
CN110070107B (zh) | 物体识别方法及装置 | |
CN111914997B (zh) | 训练神经网络的方法、图像处理方法及装置 | |
CN110309856A (zh) | 图像分类方法、神经网络的训练方法及装置 | |
CN111797881B (zh) | 图像分类方法及装置 | |
CN112446834A (zh) | 图像增强方法和装置 | |
CN112446380A (zh) | 图像处理方法和装置 | |
CN113011562B (zh) | 一种模型训练方法及装置 | |
CN111797882B (zh) | 图像分类方法及装置 | |
CN112581379A (zh) | 图像增强方法以及装置 | |
CN114255361A (zh) | 神经网络模型的训练方法、图像处理方法及装置 | |
CN112308200A (zh) | 神经网络的搜索方法及装置 | |
CN111695673B (zh) | 训练神经网络预测器的方法、图像处理方法及装置 | |
CN113807183B (zh) | 模型训练方法及相关设备 | |
CN112257759A (zh) | 一种图像处理的方法以及装置 | |
CN112529904A (zh) | 图像语义分割方法、装置、计算机可读存储介质和芯片 | |
EP4293628A1 (en) | Image processing method and related apparatus | |
CN111833363B (zh) | 图像边缘和显著性检测方法及装置 | |
CN115239581A (zh) | 一种图像处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |