WO2018082130A1

WO2018082130A1 - 一种显著图生成方法及用户终端

Info

Publication number: WO2018082130A1
Application number: PCT/CN2016/106771
Authority: WO
Inventors: 张星; 李江伟; 杜成; 罗巍
Original assignee: 华为技术有限公司
Priority date: 2016-11-02
Filing date: 2016-11-22
Publication date: 2018-05-11
Also published as: CN109844806A

Abstract

一种显著图生成方法及用户终端，其中方法包括：获取输入图像的亮度信息、色度信息和深度信息；根据所述亮度信息计算所述输入图像的梯度信息；根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；根据所述输入图像的初始显著图生成所述输入图像的显著图。本发明实施例能够实现毫秒级的运算速度，同时能够确保显著图的准确性。

Description

一种显著图生成方法及用户终端

技术领域

本发明涉及图像处理技术领域，尤其涉及一种显著图生成方法及用户终端。

背景技术

在图像领域中，图像蕴含的信息量很大，但人眼特别关心的往往是图像中少数几个比较突出的区域，这些突出的区域被称为显著性区域或主体区域。对于显著性区域之外的区域，人眼的关注度很低。

显著性区域的计算过程是通过模拟人眼观察图像的过程，进而提取人眼感兴趣区域，最后得到一幅与关注度相对应的显著图。通过某种计算方法将这些显著性区域突显出来的过程称为显著性区域检测，该计算方法称为显著性检测算法。

文献“Global contrast based salient region detection,IEEE Proceedings on Computer Vision and Pattern Recognition,2011,p409-416”公开了一种显著性物体检测算法。该方法首先使用图割(Graph Cut)算法，将图像分割成接近预置数量的图像块，每个图像块拥有相近的颜色特征。然后计算区域及颜色的对比度，利用每个区域和其它所有区域的对比度加权和来定义每个区域的显著性。区域权重由空间距离决定，较远的区域分配较小的权重。

上述通过图像分割、计算各个区域和其它所以区域的全局对比度来检测显著性区域的算法，存在以下问题：(1)分割过程中可能会出现漏分割和误分割情况，影响生成的显著图的准确性；(2)该算法基于分割和区域间的全局对比度，运算复杂，无法达到毫秒级运算要求；(3)该算法对于多物体和颜色复杂的图像，生成的显著图的准确性较低。

发明内容

本发明实施例提供了一种显著图生成方法及用户终端，能够实现毫秒级的运算速度，同时能够确保显著图的准确性。

本发明实施例第一方面提供一种显著图生成方法，包括：

获取输入图像的亮度信息、色度信息和深度信息；

根据所述亮度信息计算所述输入图像的梯度信息；

根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；

根据所述输入图像的初始显著图生成所述输入图像的显著图。

本发明实施例第一方面，根据输入图像的亮度信息、色度信息和深度信息生成输入图像的显著图，融合深度信息，可以确保显著图的准确性，由于在生成输入图像的初始显著图的过程中对梯度信息、色度信息、深度信息并行处理，可以实现毫秒级的运算速度。

在一种可能实现的方式中，根据所述亮度信息计算所述输入图像的梯度信息的具体过程为：根据所述亮度信息，通过索贝尔算子，计算所述输入图像的梯度信息。通过索贝尔算子计算梯度信息可以对输入图像的边缘进行很好的处理。

在一种可能实现的方式中，根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图的具体过程为：将所述输入图像的每个像素的像素值分别与所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值进行比较，生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图；根据所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图生成所述输入图像的初始显著图。对梯度信息通道、色度信息通道、深度信息通道同时进行处理，有利于提升运算速度，实现毫秒级的运算速度。

在一种可能实现的方式中，将所述输入图像的每个像素的像素值分别与所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值进行比较，生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图的具体过程为：

若目标像素的像素值大于目标预设门限值，则将所述目标像素的布尔值设为第一预设值，所述目标像素为所述输入图像的任意一个像素，所述目标预设门限值为所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值中的任意一种；

若所述目标像素的像素值小于或等于所述目标预设门限值，则将所述目标像素的布尔值设为第二预设值；

根据所述梯度信息、所述色度信息、所述深度信息各自对应的所述输入图像的每个像素的布尔值生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图。

该种可能实现的方式，将输入图像的每个像素的像素值与每个通道对应的预设门限进行比较，从而得到各个通道对应的第一波尔图。一旦各个通道对应的预设门限确定，各个通道生成各自对应的第一波尔图便可同时进行，有利于提升运算速度，实现毫秒级的运算速度。

在一种可能实现的方式中，根据所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图生成所述输入图像的初始显著图的具体过程为：

在目标第一波尔图中选取至少两个种子点，所述目标第一波尔图为所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图中的任意一种；

将所述至少两个种子点中每个种子点的连通域设为所述第一预设值，得到所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图；

对所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图进行累加求和归一化处理得到所述输入图像的初始显著图。

在该种可能实现的方式中，对各个通道对应的第一波尔图进行种子点选取和连通域设置，实现对边缘非显著性区域的处理，增强非显著性区域与显著性区域之间的对比效果。

在一种可能实现的方式中，根据所述输入图像的初始显著图生成所述输入图像的显著图的具体过程为：对所述输入图像的初始显著图进行滤波处理得到所述输入图像的显著图，以减少噪声的影响，从而确保输入图像的显著图的准确性。

在一种可能实现的方式中，所述色度信息包括第一色度信息和第二色度信息，在YUV颜色空间中，所述第一色度信息为U分量，所述第二色度信息为V分量。

本发明实施例第二方面提供一种用户终端，包括：

信息获取单元，用于获取输入图像的亮度信息、色度信息和深度信息；

梯度计算单元，用于根据所述亮度信息计算所述输入图像的梯度信息；

初始生成单元，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；

显著图生成单元，用于根据所述输入图像的初始显著图生成所述输入图像的显著图。

基于同一发明构思，由于该用户终端解决问题的原理以及有益效果可以参见上述第一方面和第一方面的各可能的方法实施方式以及所带来的有益效果，因此该用户终端的实施可以参见上述第一方面和第一方面的各可能的方法的实施方式，重复之处不再赘述。

本发明实施例第三方面提供另一种用户终端，所述用户终端包括处理器和存储器，其中，所述存储器用于存储计算机可执行程序代码，所述程序代码包括指令；所述处理器调用存储在所述存储器中的指令以实现上述第一方面的方法设计中的方案，由于该用户终端解决问题的实施方式以及有益效果可以参见上述第一方面和第一方面的各可能的方法的实施方式以及有益效果，因此该用户终端的实施可以参见方法的实施，重复之处不再赘述。

本发明实施例第四方面提供一种存储介质，所述存储介质为非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有至少一个程序，每个所述程序包括上述第一方面方法设计方案所涉及所用的计算机软件指令，所述指令当被具有处理器的用户终端执行时使所述用户终端执行上述第一方面和第一方面的各可能的显著图生成方法。

在本发明实施例中，通过获取输入图像的亮度信息、色度信息和深度信息，并根据亮度信息计算输入图像的梯度信息，然后根据梯度信息、色度信息、深度信息各自对应的预设门限值生成输入图像的初始显著图，最后根据输入图像的初始显著图生成输入图像的显著图，在生成显著图的过程中，综合考虑输入图像的亮度信息、色度信息和深度信息，从而确保显著图的准确性，同时能够实现毫秒级的运算速度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种显著图生成方法的流程示意图；

图2为本发明实施例提供的另一种显著图生成方法的流程示意图；

图3a为本发明实施例提供的输入图像；

图3b为图3a所示输入图像的深度图像；

图3c为图3a所示输入图像的梯度图像；

图3d为图3a所示输入图像的显著图；

图4为本发明实施例提供的输入图像与输入图像的显著图之间的对比效果图；

图5为应用本发明实施例进行图像后处理指导的前后对比效果图；

图6为应用本发明实施例进行自动曝光指导的前后对比效果图；

图7为本发明实施例提供的一种用户终端的结构示意图；

图8为本发明实施例提供的另一种用户终端的结构示意图。

具体实施方式

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本发明实施例提供一种显著图生成方法及用户终端，可以应用于用户终端获取显著图的场景，例如，用户终端获取输入图像的亮度信息、色度信息和深度信息；所述用户终端根据所述亮度信息计算所述输入图像的梯度信息；所述用户终端根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；所述用户终端根据所述输入图像的初始显著图生成所述输入图像的显著图的场景。本发明实施例还可以应用于用户终端利用显著图进行拍摄指导(例如自动曝光指导、图像后处理指导、资源预分配指导等)的场景。本发明实施例在获取输入图像的显著图时，综合考虑输入图像的亮度信息、色度信息和深度信息，从而确保获取的显著图的准确性，同时能够实现毫秒级的运算速度。

本发明实施例中的用户终端具有摄像装置，具有摄像功能，摄像装置可以为单摄像头装置，也可以为双摄像头装置。用户终端可以包括但不限于智能手机、平板电脑(PAD)、可穿戴设备、相机、摄像机等电子设备。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

请参见图1，为本发明实施例提供的一种显著图生成方法的流程示意图，该方法包括步骤101，获取输入图像的亮度信息、色度信息和深度信息；步骤102，根据所述亮度信息计算所述输入图像的梯度信息；步骤103，根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；步骤104，根据所述输入图像的初始显著图生成所述输入图像的显著图。

下面将对图1所示实施例中的步骤101-104进行详细介绍：

101，获取输入图像的亮度信息、色度信息和深度信息；

其中，所述输入图像可以是用户终端通过摄像装置采集的图像，可以理解的是，此时的所述输入图像为所述用户终端在接收到拍摄指令之前所采集的图像，即预览图像；所述输入图像还可以是用户选择的待处理的图像，可以理解的是，此时的所述输入图像是所述用户终端保存的图像或从其它终端接收到的图像。请参见图3a，为本发明实施例提供的输入图像，人眼比较关注的是该图中的苹果，苹果可为该输入图像的显著性区域。

图像的颜色是由亮度和色度共同表示的。亮度是光作用于人眼所引起的明亮程度的感觉，它与被观察物体的发光强度有关，主要表现光的强和弱。而色度则是不包括亮度在内的颜色的性质，它反映的是颜色的色调和饱和度，换言之，色度包括色调和饱和度。其中，色调是当人眼看一种或多种波长的光时所产生的色彩感觉，它反映颜色的种类，是决定颜色的基本特征。饱和度是指颜色的纯度即掺入白光的程度，表示颜色深浅的程度。

颜色通常用三个相对独立的属性来描述，三个独立变量综合作用，自然就构成一个空间坐标，这就是颜色空间。而颜色可以由不同的角度，用三个一组的不同属性加以描述，就产生了不同的颜色空间。但被描述的颜色对象本身是客观的，不同颜色空间只是从不同的角度去衡量同一个对象。颜色空间，指的是用一种客观的方式叙述颜色在人眼上的感觉。颜色空间也称彩色模型、又称彩色空间或彩色系统，它的用途是在某些标准下用通常可接受的方式对彩色加以说明。颜色空间按照基本结构可以分为两大类：基色颜色空间和色、亮分离颜色空间。其中，基色颜色空间的典型是红绿蓝(RGB)，还包括青(Cyan)品红(Magenta)黄(Yellow)(CMY)、青品红黄黑(CMYK)、国际照明委员会(Commission Internationale de L'Eclairage，CIE)XYZ等；色、亮分离颜色空间包括Ycc、YUV、Lab以及一批“色相类颜色空间”。CIE XYZ是定义一切颜色空间的基准，它既属于基色颜色空间，也属于色、亮分离颜色空间，是贯穿两者的枢纽。色、亮分离颜色空间中的子类型“色相类颜色空间”，是把颜色分成一个表亮属性，和两个表色属性。

RGB颜色空间：一个能发出光波的物体称为有源物体，它的颜色由该物体发出的光波决定，使用RGB相加混合模型。RGB是计算机彩色显示器所需输入的三个彩色分量，通过三个分量的不同比例，在显示屏幕上合成所需要的任意颜色。在RGB颜色空间，任意彩色光F的配色方程可表达为：F＝r[R](红色百分比)+g[G](绿色百分比)+b[B](蓝色百分比)。

CMY颜色空间：一个能不发光波的物体称为无源物体，它的颜色由该物体吸收或者反射哪些光波决定，使用CMY相减混合模型。彩色印刷或彩色打印的纸张是不能发射光线的，因而印刷机或彩色打印机就只能使用一些能够吸收特定的光波而反射其它光波的油墨或颜料。油墨或颜料的三基色是青色、品红色和黄色。青色对应蓝绿色；品红对应紫红色。理论上说，任何一种由颜料表现的色彩都可以用这三种基色按不同的比例混合而成，这种色彩表示方法称CMY色彩空间表示法。彩色打印机和彩色印刷系统都采用CMY色彩空间。青色，品红色，黄色分别是红、绿、蓝三色的补色。

CMYK颜色空间：也称作印刷色彩模式，顾名思义就是用来印刷的。CMYK是一种减色模式，由青、洋红、黄、黑四色构成。CMYK是四色打印和印刷的基础。

CIE XYZ颜色空间是国际照明委员会在1931年开发并在1964修订的CIE颜色系统(CIE Color System)，该系统是其他颜色系统的基础。它使用相应于红、绿和蓝三种颜色作为三种基色，而所有其他颜色都从这三种颜色中导出。通过相加混色或者相减混色，任何色调都可以使用不同量的基色产生。

Ycc颜色空间：柯达发明的颜色空间。Ycc颜色空间将亮度作由它的主要组件，具有两个单独的颜色通道，采用Ycc颜色空间来保存图像，可以节约存储空间。

YUV颜色空间：在现代彩色电视系统中，通常采用三管彩色摄像机或彩色点耦合器件(charge-coupled device，CCD)摄像机，它把摄得的彩色图像信号，经分色、分别放大校正得到RGB，再经过矩阵变换电路得到亮度信号Y和两个色差信号R－Y、B－Y，最后发送端将亮度和色差三个信号分别进行编码，用同一信道发送出去。这就是我们常用的YUV颜色空间。采用YUV颜色空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量，那么这样表示的图就是黑白灰度图。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题，使黑白电视机也能接收彩色信号。色差U、V是由B－Y、R－Y按不同比例压缩而成的。如果要由YUV颜色空间转化成颜色RGB空间，只要进行相反的逆运算即可。与YUV颜色空间类似的还有Lab色彩空间，它也是用亮度和色差来描述色彩分量，其中L为亮度、a和b分别为各色差分量。

在以智能手机为例的用户终端中，无论是拍摄还是预览，均以YUV颜色空间为主，因此，在本发明实施例中，以YUV颜色空间为例。若所述输入图像采用其它颜色空间表示，则所述用户终端可通过一些转换算法将其转换为YUV颜色空间来表示。由于采用YUV颜色空间，因此所述用户终端可根据所述输入图像的YUV颜色空间表示来获取所述输入图像的亮度信息(Y分量)和色度信息，所述色度信息包括第一色度信息(U分量)和第二色度信息(V分量)。

所述用户终端在获取所述输入图像的亮度信号和色度信息的同时，还获取所述输入图像的深度信息。可以理解的是，深度信息表示所述输入图像中各物体与摄像装置之间的距离。在本发明实施例中，不限定获取所述输入图像的深度信息的方式，例如，若所述用户终端具有双摄像头装置，则可采用双目立体视觉算法获取深度信息。双目立体视觉理论建立在对人类视觉系统研究的基础上，通过两个摄像头成像，因为两个摄像头之间存在一定的距离，所以同一景物通过两个镜头所成的像有一定的差别，既视差，因为视差信息的存在，可以用来估计出景物的大体深度信息。所述用户终端还可以采用其它类型的深度传感器来获取所述输入图像的深度信息，例如结构光深度传感器、时差测距传感器(Time Of Flight，TOF)等。请参见图3b，为图3a所示输入图像的深度图像，图3b中越亮的区域表示离拍摄装置越近。

102，根据所述亮度信息计算所述输入图像的梯度信息；

在一个示例中，所述用户终端根据所述亮度信息、通过索贝尔(Sobel)算子，计算所述输入图像的梯度信息。其中，索贝尔算子主要用于获得图像的一阶梯度，常见的应用和物理意义是边缘检测。在技术上，它是一个离散的一阶差分算子，用来计算图像亮度函数的一阶梯度之近似值。在图像的任何一点使用此算子，将会产生该点对应的梯度矢量或是其法矢量。索贝尔卷积因子为：

该算子包含上述两组3*3的矩阵，分别为横向及纵向，将之与图像作平面卷积，即可分别得出横向及纵向的亮度差分近似值。在本发明实施例中，以A代表亮度图像(Y分量)，G_x及G_y分别代表经横向及纵向边缘检测的图像，其公式如下：

图像的每一个像素的横向及纵向梯度近似值可用

来计算梯度的大小，可用以下公式计算梯度方向。

其中，若θ等于零，即代表图像该处拥有纵向边缘，左方较右方暗。

所述用户终端也可通过其它方式计算所述输入图像的梯度信息。请参见图3c，为图3a所示输入图像的梯度图像，可以从图3c中看出，各物体的边缘区域较亮。

103，根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；

可以理解的是，对所述梯度信息、所述色度信息、所述深度信息的处理过程为对三个通道进行处理的过程，所述色度信息包括所述第一色度信息和所述第二色度信息，也可以看作是对四个通道进行处理的过程。这三个或四个通道可同时进行处理，从而提升运算速度，实现毫秒级的运算速度。

在一个示例中，所述用户终端可分别针对所述梯度信息、所述色度信息、所述深度信息设定预设门限值，由于所述色度信息包括所述第一色度信息和所述第二色度信息，所述用户终端还可分别针对所述第一色度信息和所述第二色度信息设定预设门限值，假设，所述梯度信息对应第一预设门限值、所述第一色度信息对应第二预设门限值、所述第二色度信息对应第三预设门限值、所述深度信息对应第四预设门限值。需要说明的是，上述四种预设门限值中每种预设门限值可包括多个门限值，所述用户终端可将一种预设门限值所包括的多个门限值设置为等比例，也可以根据经验值进行设置，各种预设门限值所包括的多个门限值之间的大小可以完全相同，也可以部分相同，也可以完全不相同，具体数值在此不做限定。需要说明的是，各种预设门限值所包括的多个门限值的取值范围为0-255。可以理解的是，所述用户终端将所述输入图像的每个像素的像素值与每个通道对应的预设门限进行比较，从而得到各个通道对应的第一波尔图，此时各个通道对应的第一波尔图数量为多个。

在一个示例中，所述用户终端将所述输入图像的每个像素的像素值分别与所述第一预设门限值、所述第二预设门限值、所述第三预设门限值和所述第四预设门限值进行比较。具体比较过程为：若目标像素的像素值大于目标预设门限值，则将所述目标像素的布尔值设为第一预设值，所述目标像素为所述输入图像的任意一个像素，所述目标预设门限值为上述四种预设门限值中的任意一种；若所述目标像素的像素值小于或等于所述目标预设门限值，则将所述目标像素的布尔值设为第二预设值。其中，所述第一预设值可为“1”，所述第二预设值可为“0”；或者，所述第一预设值可为“0”，所述第二预设值可为“1”。所述用户终端根据所述输入图像的像素与上述四种预设门限值每种预设门限值所包括的多个门限值的比较结果，得到所述梯度信息、所述第一色度信息、所述第二色度信息、所述深度信息各自对应的所述输入图像的每个像素的布尔值，并根据所述梯度信息、所述色度信息、所述深度信息各自对应的所述输入图像的每个像素的布尔值生成所述梯度信息、所述第一色度信息、所述第二色度信息、所述深度信息各自对应的第一波尔图，此时各个通道对应的第一波尔图数量为多个。可以理解的是，一个通道对应的多个第一波尔图中每个波尔图对应一个门限值。

在一个示例中，所述用户终端在目标第一波尔图中选取至少两个种子点，所述目标第一波尔图为所述梯度信息、所述第一色度信息、所述第二色度信息、所述深度信息各自对应的第一波尔图中的任意一种。可以理解的是，种子点为连通域检测的起始点。其中，所述至少两个种子点可选取四个种子点，可为所述输入图像四个角落的点。为了确保最终生成的显著图的效果较好，可在所述输入图像的边缘位置选取种子点。所述用户终端将所述至少两个种子点中每个种子点的连通域设为所述第一预设值，得到所述梯度信息、所述第一色度信息、所述第二色度信息、所述深度信息各自对应的第二波尔图，此时各个通道对应的第二波尔图数量为多个。选取种子点，并进行连通域检测设置的目的是对边缘的非显著性区域进行处理，增强非显著性区域与显著性区域之间的对比效果。所述用户终端对所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图进行累加求和归一化处理得到所述输入图像的初始显著图的过程为：所述用户终端分别对所述梯度信息、所述第一色度信息、所述第二色度信息、所述深度信息各自对应的多个第二波尔图进行累加求和，得到第一初始图、第二初始图、第三初始图、第四初始图(这四个初始图不是波尔图，因为累加求和得到的初始图中每个像素的像素值的取值范围为0-255)；所述用户终端在对这四个初始图进行累加求和和归一化处理得到所述输入图像的初始显著图。可以理解的是，所述用户终端先分别对每个通道进行累加求和处理，再对处理后的每个通道进行累加求和和归一化处理，最终得到所述输入图像的初始显著图，此时所述输入图像的初始显著图为一副，所述输入图像的初始显著图中每个像素的像素值的取值范围为0-255。

需要说明的是，各个通道对应的生成波尔图、选取种子点、连通域设置的过程可并行执行，从而有利于提升运算速度，实现毫秒级的运算速度。

104，根据所述输入图像的初始显著图生成所述输入图像的显著图；

在一个示例中，所述用户终端对所述输入图像的初始显著图进行滤波处理得到所述输入图像的显著图。其中，滤波处理可以包括高斯滤波处理、双边滤波处理等等。滤波处理的目的是减少噪声的影响，从而确保所述输入图像的显著图的准确性。请参见图3d，为图3a所示输入图像的显著图，可以从图3d 中看出，显著性区域不仅仅包括苹果所在的区域，还包括其它一些区域。

结合图3a和图3d，可以获得应用本发明实施例的效果。为了使效果更加明显，增强说服力，请参见图4，为本发明实施例提供的输入图像与输入图像的显著图之间的对比效果图。从图4可以看出，应用本发明实施例得到的显著图并不局限于中心区域或某个区域。

需要说明的是，本发明实施例最终生成的显著图并不会呈现给用户，而是存储于用户终端，可以用于对后续拍摄过程进行指导，例如智能控制(自动白平衡、自动曝光、自动对焦)指导，计算资源的预分配指导，图像后处理指导，还可以用于对显著性区域使用更复杂、效果更好的算法，还可以用于对非显著性区域进行简化处理。

在一个示例中，显著图可用于图像后处理指导。可以理解的是，图像后处理为对图像进行亮度调节、对比度增强、边缘锐化、色彩饱和度增强等调整，提升照片的层次感，突出用户的感兴趣区域。请参见图5，为应用本发明实施例进行图像后处理指导的前后对比效果图。由图5可知，指导后的图片中显著性区域得到了优化处理(显著性区域更加突出)，得到的图片效果更好。

在一个示例中，显著图可用于自动曝光指导。自动曝光是摄像装置根据光线的强弱自动调整曝光量，防止曝光过度或者不足。请参见图6，为应用本发明实施例进行自动曝光指导的前后对比效果图。现有自动曝光方案，都是基于图像全局信息进行分析和处理，而将本发明实施例生成的显著图应用在自动曝光指导中，可针对性地对显著性区域设置最优的曝光参数，使得整体图片曝光效果提升。

请参见图2，为本发明实施例提供的另一种显著图生成方法的流程示意图。需要说明的是，图2所示的实施例可对应于图1所示的实施例，为图1 的另一种表示方式。

由图2可知，四个通道(梯度、U分量、V分量、深度)各自对应的进程是并行执行的，因此可以提高用户终端的运算速度，实现毫秒级的运算速度。并且，本发明实施例综合考虑输入图像的亮度、色度和深度，从而确保最终生成的显著图的准确性。

请参见图7，为本发明实施例提供的一种用户终端的结构示意图，该用户终端70包括信息获取单元701、梯度计算单元702、初始生成单元703和显著图生成单元704，其中：

信息获取单元701，用于获取输入图像的亮度信息、色度信息和深度信息；

梯度计算单元702，用于根据所述亮度信息计算所述输入图像的梯度信息；

在一种可能实现的方式中，所述梯度计算单元702具体用于根据所述亮度信息，通过索贝尔算子，计算所述输入图像的梯度信息。

初始生成单元703，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；

在一种可能实现的方式，所述初始生成单元703包括第一生成单元和第二生成单元，未在图7中标明。

第一生成单元，用于将所述输入图像的每个像素的像素值分别与所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值进行比较，生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图；

第二生成单元，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图生成所述输入图像的初始显著图。

其中，所述第一生成单元包括：

布尔值设定单元，用于若目标像素的像素值大于目标预设门限值，则将所述目标像素的布尔值设为第一预设值，所述目标像素为所述输入图像的任意一个像素，所述目标预设门限值为所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值中的任意一种；

所述布尔值设定单元，还用于若所述目标像素的像素值小于或等于所述目标预设门限值，则将所述目标像素的布尔值设为第二预设值；

波尔图生成单元，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的所述输入图像的每个像素的布尔值生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图。

其中，所述第二生成单元包括：

种子点选取单元，用于在目标第一波尔图中选取至少两个种子点，所述目标第一波尔图为所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图中的任意一种；

连通域设置单元，用于将所述至少两个种子点中每个种子点的连通域设为所述第一预设值，得到所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图；

波尔图处理单元，用于对所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图进行累加求和归一化处理得到所述输入图像的初始显著图。

显著图生成单元704，用于根据所述输入图像的初始显著图生成所述输入图像的显著图。

在一种可能实现的方式，所述显著图生成单元704具体用于对所述输入图像的初始显著图进行滤波处理得到所述输入图像的显著图。

其中，所述色度信息包括第一色度信息和第二色度信息。

需要说明的是，上述信息获取单元701用于执行图1所示实施例中的步骤101；上述梯度计算单元702用于执行图1所示实施例中的步骤102；上述初始生成单元703用于执行图1所示实施例中的步骤103；上述显著图生成单元704用于执行图1所示实施例中的步骤104。

其中，上述各个单元可以是处理器或控制器，例如可以是中央处理器(Central Processing Unit，CPU)，通用处理器，数字信号处理器(Digital Signal Processor，DSP)，专用集成电路(Application-Specific Integrated Circuit，ASIC)，现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

当上述各个单元为处理器时，本发明实施例所涉及的用户终端可以为图8所示的用户终端。

请参见图8，为本发明实施例提供的另一种用户终端的结构示意图，该用户终端80包括存储器820、其他输入设备830、显示屏840、传感器880、、输入/输出系统870、处理器880和电源890，若该用户终端80为智能手机、平板电脑等，还包括射频电路810和音频电路860。本领域技术人员可以理解，图8中示出的用户终端的结构并不构成对用户终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。本领领域技术人员可以理解显示屏840属于用户界面(UI，User Interface)，且用户终端80可以包括比图示更多或者更少的用户界面。

射频电路810可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站或多媒体网元的下行信息接收后，给处理器880处理；另外，将设计上行的数据发送给基站或多媒体网元。通常，射频电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。此外，射频电路810还可以通过无线通信与网络和其他设备通信。

存储器820可用于存储软件程序以及模块，所述存储器用于存储计算机可执行程序代码，所述程序代码包括指令；处理器880通过运行存储在存储器820的软件程序以及模块，从而执行用户终端80的各种功能应用以及数据处理。存储器820可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据用户终端80的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器820可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其他输入设备830可用于接收输入的数字或字符信息，以及产生与用户终端80的用户设置以及功能控制有关的键信号输入。具体地，其他输入设备830可包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆、光鼠(光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸)、摄像头等中的一种或多种。其他输入设备830与输入/输出系统870的其他输入设备控制器871相连接，在其他设备输入控制器871的控制下与处理器880进行信号交互。应用于本发明实施例中，其他输入设备830可为摄像头，可以为单摄像头，也可以为双摄像头，用于采集图像。

显示屏840可用于显示由用户输入的信息或提供给用户的信息以及用户终端80的各种菜单，还可以接收用户输入。应用于本发明实施例中，显示屏840用于预览图像或输出图像。

用户终端80还可包括至少一种传感器880，比如光传感器、运动传感器以及其他传感器。

音频电路860、扬声器861，麦克风862可提供用户与用户终端80之间的音频接口。音频电路860可将接收到的音频数据转换后的信号，传输到扬声器861，由扬声器861转换为声音信号输出；另一方面，麦克风862将收集的声音信号转换为信号，由音频电路860接收后转换为音频数据，再将音频数据输出至射频电路810以发送给比如另一用户终端，或者将音频数据输出至存储器820以便进一步处理。

输入/输出系统870用来控制输入输出的外部设备，可以包括其他设备输入控制器871、传感器控制器872、显示控制器873。可选的，一个或多个其他输入控制设备控制器871从其他输入设备830接收信号和/或者向其他输入设备830发送信号，其他输入设备830可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮、光鼠(光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸)。值得说明的是，其他输入控制设备控制器871可以与任一个或者多个上述设备连接。所述输入/输出系统870中的显示控制器873从显示屏840接收信号和/或者向显示屏840发送信号。

处理器880是用户终端80的控制中心，利用各种接口和线路连接整个用户终端80的各个部分，通过运行或执行存储在存储器820内的指令，以及调用存储在存储器820内的数据，执行用户终端80的各种功能和处理数据。应用在本发明实施例中，处理器880用于执行图1所示实施例中的101-104。

电源890(比如电池)，优选的，电源可以通过电源管理系统与处理器880逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗等功能。

本发明实施例还提供一种存储介质，所述存储介质为非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有至少一个程序，每个所述程序包括指令，所述指令当被具有处理器的用户终端执行时使所述用户终端执行本发明实施例提供的显著图生成方法。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为根据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。本领域的技术人员可以将本说明书中描述的不同实施例以及不同实施例的特征进行结合或组合。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可以用硬件实现，或固件实现，或它们的组合方式来实现。当使用软件实现时，可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于：计算机可读介质可以包括随机存取存储器(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如，如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(Digital Subscriber Line，DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的，那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的，盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟，其中盘通常磁性的复制数据，而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。

总之，以上所述仅为本发明技术方案的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种显著图生成方法，其特征在于，包括：

获取输入图像的亮度信息、色度信息和深度信息；

根据所述亮度信息计算所述输入图像的梯度信息；

根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；

根据所述输入图像的初始显著图生成所述输入图像的显著图。
根据权利要求1所述的方法，其特征在于，所述根据所述亮度信息计算所述输入图像的梯度信息，包括：

根据所述亮度信息，通过索贝尔算子，计算所述输入图像的梯度信息。
根据权利要求1所述的方法，其特征在于，所述根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图，包括：

将所述输入图像的每个像素的像素值分别与所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值进行比较，生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图；

根据所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图生成所述输入图像的初始显著图。
根据权利要求3所述的方法，其特征在于，所述将所述输入图像的每个像素的像素值分别与所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值进行比较，生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图，包括：

若目标像素的像素值大于目标预设门限值，则将所述目标像素的布尔值设为第一预设值，所述目标像素为所述输入图像的任意一个像素，所述目标预设门限值为所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值中的任意一种；

若所述目标像素的像素值小于或等于所述目标预设门限值，则将所述目标像素的布尔值设为第二预设值；

根据所述梯度信息、所述色度信息、所述深度信息各自对应的所述输入图像的每个像素的布尔值生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图。
根据权利要求3所述的方法，其特征在于，所述根据所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图生成所述输入图像的初始显著图，包括：

在目标第一波尔图中选取至少两个种子点，所述目标第一波尔图为所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图中的任意一种；

将所述至少两个种子点中每个种子点的连通域设为所述第一预设值，得到所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图；

对所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图进行累加求和归一化处理得到所述输入图像的初始显著图。
根据权利要求1所述的方法，其特征在于，所述根据所述输入图像的初始显著图生成所述输入图像的显著图，包括：

对所述输入图像的初始显著图进行滤波处理得到所述输入图像的显著图。
根据权利要求1所述的方法，其特征在于，所述色度信息包括第一色度信息和第二色度信息。
一种用户终端，其特征在于，包括：

信息获取单元，用于获取输入图像的亮度信息、色度信息和深度信息；

梯度计算单元，用于根据所述亮度信息计算所述输入图像的梯度信息；

初始生成单元，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值生成所述输入图像的初始显著图；

显著图生成单元，用于根据所述输入图像的初始显著图生成所述输入图像的显著图。
根据权利要求8所述的用户终端，其特征在于，所述梯度计算单元具体用于根据所述亮度信息，通过索贝尔算子，计算所述输入图像的梯度信息。
根据权利要求8所述的用户终端，其特征在于，所述初始生成单元包括：

第一生成单元，用于将所述输入图像的每个像素的像素值分别与所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值进行比较，生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图；

第二生成单元，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图生成所述输入图像的初始显著图。
根据权利要求10所述的用户终端，其特征在于，所述第一生成单元包括：

布尔值设定单元，用于若目标像素的像素值大于目标预设门限值，则将所述目标像素的布尔值设为第一预设值，所述目标像素为所述输入图像的任意一个像素，所述目标预设门限值为所述梯度信息、所述色度信息、所述深度信息各自对应的预设门限值中的任意一种；

所述布尔值设定单元，还用于若所述目标像素的像素值小于或等于所述目标预设门限值，则将所述目标像素的布尔值设为第二预设值；

波尔图生成单元，用于根据所述梯度信息、所述色度信息、所述深度信息各自对应的所述输入图像的每个像素的布尔值生成所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图。
根据权利要求10所述的用户终端，其特征在于，所述第二生成单元包括：

种子点选取单元，用于在目标第一波尔图中选取至少两个种子点，所述目标第一波尔图为所述梯度信息、所述色度信息、所述深度信息各自对应的第一波尔图中的任意一种；

连通域设置单元，用于将所述至少两个种子点中每个种子点的连通域设为所述第一预设值，得到所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图；

波尔图处理单元，用于对所述梯度信息、所述色度信息、所述深度信息各自对应的第二波尔图进行累加求和归一化处理得到所述输入图像的初始显著图。
根据权利要求8所述的用户终端，其特征在于，所述显著图生成单元具体用于对所述输入图像的初始显著图进行滤波处理得到所述输入图像的显著图。
根据权利要求8所述的用户终端，其特征在于，所述色度信息包括第一色度信息和第二色度信息。
一种用户终端，其特征在于，包括处理器和存储器，其中，所述存储器用于存储计算机可执行程序代码，所述程序代码包括指令；当所述处理器执行所述指令时，所述指令使所述用户终端执行根据权利要求1-7任一项所述的显著图生成方法。
一种存储介质，其特征在于，所述存储介质为非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有至少一个程序，每个所述程序包括指令，所述指令当被具有处理器的用户终端执行时使所述用户终端执行根据权利要求1-7任一项所述的显著图生成方法。