CN108629815A - 图像生成方法和装置 - Google Patents
图像生成方法和装置 Download PDFInfo
- Publication number
- CN108629815A CN108629815A CN201710152538.8A CN201710152538A CN108629815A CN 108629815 A CN108629815 A CN 108629815A CN 201710152538 A CN201710152538 A CN 201710152538A CN 108629815 A CN108629815 A CN 108629815A
- Authority
- CN
- China
- Prior art keywords
- pixel
- value
- image
- label value
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000003860 storage Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 abstract description 14
- 238000012545 processing Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 77
- 230000011218 segmentation Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000006854 communication Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G06T5/70—
Abstract
本申请公开了图像生成方法和装置。该方法的一具体实施方式包括:获取待处理的图像的像素点的像素值集合和与图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;根据标签值集合和像素值集合,建立能量函数,其中,能量函数用于表征标签值与像素值的一致性;对于图像的每个像素点,从标签值集合选择标签值进行分配,以使得能量函数的值最小;根据图像的每个像素点所分配的标签值,将图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。该实施方式实现了图像的分割处理,能够有效抑制图像噪声对图像分割结果的影响。
Description
技术领域
本申请涉及计算机技术领域,具体涉及计算机图像处理技术领域,尤其涉及图像生成方法和装置。
背景技术
图像分割是把图像划分为有意义的若干区域的图像处理技术,分割技术在辅助医学诊断及运动分析、结构分析等领域都有着重要的研究价值和广泛的应用发展前景。图像分割是图像分析的第一步,图像分割接下来的任务,如特征提取、目标识别等的好坏,都取决于图像分割的质量如何。例如在医学上,随着影像医学技术在医学中的作用越来越大,图像分割在医学应用中具有特殊的重要意义,分割技术使得人们能够获得有效的医学图像信息。分割后的图像广泛应用于病变部位诊断、术前方案制定、术后监测等各个重要的环节。
目前被广泛应用的图像分割方法主要包括基于区域和基于边缘的两种方式。其中阈值法的缺点是对于目标与背景或目标之间灰度差异不明显的情况,或者目标与背景的灰度值范围有较大重叠的图像,则难以得到精确的分割结果,并且阈值法对噪声很敏感。基于边缘的分割方法利用物体边界的像素值不连续性完成对图像分割,当图像中存在噪声时,往往容易产生虚假边缘,从而影响分割效果。
总体而言,上述的图像分割方法仅从单点图像的像素值出发,忽略了图像局部平滑的先验,对图像噪声敏感。
发明内容
本申请的目的在于提出一种改进的图像生成方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种图像生成方法,该方法包括:获取待处理的图像的像素点的像素值集合和与图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;根据标签值集合和像素值集合,建立能量函数,其中,能量函数用于表征标签值与像素值的一致性;对于图像的每个像素点,从标签值集合选择标签值进行分配,以使得能量函数的值最小;根据图像的每个像素点所分配的标签值,将图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
在一些实施例中,能量函数包括数据能量函数和光滑能量函数,其中,数据能量函数用于表征像素点的像素值与该像素点所分配的标签值的一致性,光滑能量函数用于表征像素点的像素值与该像素点相邻的像素点所分配的标签值的一致性。
在一些实施例中,在获取待处理的图像的像素点的像素值集合之后,该方法还包括:将像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换像素值集合中的每个像素值。
在一些实施例中,在获取待处理的图像的像素点的像素值集合之后,该方法还包括:将像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换像素值集合中的每个像素值。
在一些实施例中,为每个像素点分配标签值,以使得能量函数的值最小,包括:采用渐非凸渐凹化过程的子图匹配算法求解能量函数的值最小时每个像素点应分配的标签值。
第二方面,本申请实施例提供了一种图像生成装置,该装置包括:获取单元,用于获取待处理的图像的像素点的像素值集合和与图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;建立单元,用于根据标签值集合和像素值集合,建立能量函数,其中,能量函数用于表征标签值与像素值的一致性;分配单元,用于对于图像的每个像素点,从标签值集合选择标签值进行分配,以使得能量函数的值最小;生成单元,用于根据图像的每个像素点所分配的标签值,将图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
在一些实施例中,能量函数包括数据能量函数和光滑能量函数,其中,数据能量函数用于表征像素点的像素值与该像素点所分配的标签值的一致性,光滑能量函数用于表征像素点的像素值与该像素点相邻的像素点所分配的标签值的一致性。
在一些实施例中,该装置还包括:归一化单元,用于在获取待处理的图像的像素点的像素值集合之后,将像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换像素值集合中的每个像素值。
在一些实施例中,该装置还包括:接收单元,用于在获取待处理的图像的像素点的像素值集合之前,接收用户通过终端输入的标签数量,并根据标签数量确定标签值集合。
在一些实施例中,分配单元进一步用于:采用渐非凸渐凹化过程的子图匹配算法求解能量函数的值最小时每个像素点应分配的标签值。
第三方面,本申请实施例提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实施例的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实施例的方法。
本申请实施例提供的图像生成方法和装置,通过建立能量函数使得待处理的图像的像素点的像素值和与该图像相关联的标签值相关联,为该图像的每个像素点分配标签值以使得能量函数的值最小,按照标签值将该图像的每个像素点分类后,再修改每个类别的像素点的像素值,得到处理后的图像。由于能量函数的值反应了标签值与像素值的一致性,因此能量函数的值最小时,标签值与像素值一致性最高,处理后的图像更平滑,从而消除因图像噪声引起的错误分割问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的图像生成方法的一个实施例的流程图;
图3是本申请的图像的像素点的邻接关系图;
图4a、4b是根据本申请的图像生成方法的一个应用场景的示意图;
图5是根据本申请的图像生成装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的图像生成方法或图像生成装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如图像浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持图像浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的图像提供支持的后台图像服务器。后台图像服务器可以对接收到的图像处理请求等数据进行分析等处理,并将处理结果(例如分割后新生成的图像)反馈给终端设备。
需要说明的是,本申请实施例所提供的图像生成方法一般由服务器105执行,相应地,图像生成装置一般设置于服务器105中。也可以不需要服务器105,而直接由终端设备101、102、103执行本申请实施例所提供的图像生成方法。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的图像生成方法的一个实施例的流程200。该图像生成方法,包括以下步骤:
步骤201,获取待处理的图像的像素点的像素值集合和与图像相关联的标签值集合。
在本实施例中,图像生成方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从用户利用其进行图像浏览的终端接收待处理的图像。并从该待处理的图像中获取待处理的图像的像素点的像素值集合。与图像相关联的标签值集合可以是预设的标签值集合。其中,标签值用于标识像素点所属的类别。像素点所属的类别的数量可以是固定值,例如,只分成两类,前景和背景。如果图像的像素点的像素值取值在0-255之间,则可将标签值集合设置为{0,255}。当一个像素点被分配到标签值0时,则该像素点的被划分为背景。当一个像素点被分配到标签值255时,则该像素点的被划分为前景。可以通过设定标签值集合的大小,确定分割后的图像包含几个类别。
在本实施例的一些可选的实现方式中,在获取待处理的图像的像素点的像素值集合之后,该方法还包括:将像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换像素值集合中的每个像素值。例如,如果图像的像素点的像素值取值在0-255之间,归一化处理后得到的像素值在0-1之间,此时标签值集合可以设置为{0,1}。当一个像素点被分配到标签值0时,则该像素点的被划分为背景。当一个像素点被分配到标签值1时,则该像素点的被划分为前景。
在本实施例的一些可选的实现方式中,在获取待处理的图像的像素点的像素值集合之前,该方法还包括:接收用户通过终端输入的标签数量,并根据标签数量确定标签值集合。例如,如果用户输入的标签数量为2,则可确定标签集合为{0,1}。如果用户输入的标签数量为3,则可确定标签集合为{0,1,2}。
步骤202,根据标签值集合和像素值集合,建立能量函数。
在本实施例中,基于步骤201获取的标签值集合和像素值集合,建立能量函数。该能量函数用于表征标签值与像素值的一致性。能量函数是计算机视觉领域中的一种目标函数,其刻画的是图像的不一致性,是图像像素间的一种相互作用形成的能量。
图像分割问题可以表达成像素标签(pixel-labeling)问题,即为图像中的每一个像素一个标签值。在图像分割中通过不同标签来区分图像中的前景和背景。
定义:P={p1,p2,p3,..,pn},其中,P是由n个像素组成的集合。
定义:L={l1,l2,l3,..,lk},其中,L由k个标签组成的集合。在图像分割中,标签值表示像素点所属的类别像素标签问题就是将标签集合中的某一个标签值li赋予像素集合中的每个元素pi。那么像素标签问题就是建立集合P和集合L之间的一个映射:F={f1,f2,f3,..,fn}
整个集合Ln上完整映射用F表示。图像分割问题即转化为求解F的过程。像素标签问题可以通过能量函数进行求解。
在本实施例的一些可选的实现方式中,能量函数包括数据能量函数和光滑能量函数,其中,数据能量函数用于表征像素点的像素值与该像素点所分配的标签值的一致性,光滑能量函数用于表征像素点的像素值与该像素点相邻的像素点所分配的标签值的一致性。
本申请的能量函数如下式所示:
E(f)=Edata(f)+λEprior(f) (公式1)
其中Edata(f)称之为数据能量函数,它是数据约束条件。在图像分割中,假设观测到一幅图像,我们需要对图像中的每个像素赋予一个标签值,以确定像素点所属的分割类别。在以全局最小能量为最优解时,当标签值能更好的吻合像素点的灰度值时,数据能量更小。当标签值不能吻合强度值时,惩罚更大,即数据能量更大。
如果我们只以数据能量作为限制条件,实际结果可能显得噪声很多,图像不够平滑。然而视觉问题不是随机的,像素标签值存在一定关系,因此我们引入先验知识作为能量函数的约束条件。
Eprior(f)称为光滑能量函数,它对应于先验知识的约束条件。在实际图像中,图像总是趋于局部光滑,即像素点总是和邻域内的像素点保持相对一致。在视觉任务中,如以最小化能量作为最优解,则如果像素点对应的标签值和邻域内的标签值一致性较好,则光滑能量函数的值较小,反之则较大。
参数λ控制数据和先验知识之间的关系。λ值越大,则先验的权重越大,先验知识在最优解中所起的作用就越大。如在图像分割中,如果先验以标准邻域(MRF(Markov RandomFiled,马尔科夫随机场)邻域)为其邻域系统,λ值越大则分割结果就会更加平滑。
数据能量函数Edata(f)惩罚标签值与像素实际强度不一致性。一致性越好,数据能量越小。其数学表达式如式:
Dp(fp)描述像素点p取得标签fp时的数据能量。在视觉任务中通常认为Dp(fp)是相互独立的,一般情况下Dp(fp)为非负数。数据能量是能量函数中重要的约束条件,它反映了总体标签值与实际数据的吻合度。
在实际的图像分割问题中,背景和前景往往具有不同的强度,因此本发明采用如下的数据能量形式约束标签值与观测数据的一致性:
其中k为标签值,Ip为点p的像素值,max(I)为图像的最大观测值(即,像素点的实际像素值)。从数据能量函数的形式可以看出当图像的像素点的像素值较大时,如果将该像素点的标签赋值为0,即标识该像素点的类别为背景,此时则具有较大的数据能量,反之亦然。当使得数据能量取得最小值时,图像所取得的效果与阈值法一致。
光滑能量函数用于表征该像素点标签值与其邻域内标签值的不一致性。光滑能量函数是像素点与邻接点的相互作用的结果。由于图像总是局部平滑的,光滑能量就是用于约束平滑先验。定义像素点p的邻接点集合用NP表示。在本申请中NP满足以下两个条件:
1)
2)如果p∈Nq,则q∈Np。
即定义图为无向图,邻域关系时对称的。
光滑能量的数学表达式如下式所示:
Esmooth(f)=∑{p,q}∈NVpq(fp,fq) (公式4)
其中N为图像的邻域系统,当N为标准的一阶马尔可夫随机场(Markov RandomField)时,邻接关系如图3所示:
标准邻域NP={t,l,b,r};Nq={x,z}
在本申请中定义光滑能量的形式如下式所示:
||Ip-Iq||2为邻域像素差值的平方,用于描述邻域内像素点的距离。从光滑能量函数的形式可以看出当邻域像素取相同标签时,光滑能量函数的值为0,这满足图像的平滑先验。当邻域内像素取不同标签值时,图像将赋予一定的光滑能量,其大小取决于邻域像素的距离。当图像邻域内差值越大,其获得的能量越小;距离越小则能量越大。分析光滑能量函数,可以看出为了使得全局光滑能量最小,图像总是趋于局部平滑,即邻域内为同一标签,并且在图像邻域内像素值发生突变的地方产生标签变化。光滑能量最小化与传统的基于边缘的方法具有一定的相似性。
通过最小化数据能量与光滑能量,将使得图像产生平滑的分割结果,并且与观测数据具有较强的一致性。由于光滑能量的引入,分割结果能够有效抑制噪声点的影响。因为噪声点往往是孤立的,为了保持邻域内标签的一致性,其往往会取得与邻域相同的标签,从而达到消除噪声点的目的。
光滑能量还可以采用其它的形式,如下式所示::
其中cons为一固定常数,其与像素值无关。
步骤203,对于图像的每个像素点,从标签值集合选择标签值进行分配,以使得能量函数的值最小。
在本实施例中,能量函数的求解是最优化问题中的组合最优化问题,即在离散状态下求极值的问题。把某种离散对象按某个确定的约束条件进行安排,当已知合乎这种约束条件的特定安排存在时,寻求这种特定安排在某个优化准则下的极大解或极小解的间题。能量函数还有很多的替代求解方法,包括条件迭代模式(Iteration Condition Model,ICM),置信度传播算法(Belief Propagation,BP)和图割算法(Graph Cuts,GC)。
在本实施例的一些可选的实现方式中,从标签值集合选择标签值进行分配,以使得能量函数的值最小,包括:采用渐非凸渐凹化过程的子图匹配算法求解能量函数的值最小时每个像素点应分配的标签值。
设一幅二维图像像素点为N个,每个点标签值有K种可能。那么求解能量函数E(f)=Edata(f)+λEprior(f)是一个组合优化问题。每个像素点有K个取值,通过穷举每种组和求得最优解的方法复杂度为O(NK),对于视觉任务中这个复杂度显然不可实现的。这是数学中的非确定性多项式问题,实际任务中需要对问题进行近似,从而得出能量函数的解。
本申请采用渐非凸渐凹化过程的子图匹配算法求解能量函数的最小值。其核心思想是将离散的组合最优化问题松弛到连续域内求解,在连续域内对目标函数进行一个由凸到凹的松弛过程,并在松弛的过程中求解到能量函数的最小值。其具体步骤如下:
(1)将能量函数改写为矩阵形式:
E=1/2xTQx+Dx (公式7)
其中Q∈Rnk×nk,D∈R1*nk,x∈{0,1}nk,n为图像总像素数,k为标签值的个数。矩阵Q,D分别满足Q(ia,jb)=Vab(i,j),D(ia)=D(a,i),如果像素a取标签值i,则x(ia)=1。
(2)对能量函数进行松弛,将离散的x向量放松到连续域内求解,并对能量函数进行凸松弛和凹松弛。
(3)初始化初始化组合系数γ=-1
(4)求取能量函数下降方向d;
下降方向d=y-x,其中
(5)求取步长α;
在这一步中确定当前点沿下降方向的移动步长α,
(6)更新待求向量x;
如果更新后的满足条件:
其中ε是一个很小的常数,则证明x已经收敛,转向步骤(7),否则转向步骤(4)。
(7)更新组合系数γ:
如果γ>1,停止循环。输出x。
(8)将输出x转换为离散的标签值。
将向量x转换为n*k的矩阵,导出最优标签值集合f*=argmaxk(x)。
到此通过求解能量函数的最小值,就得到了每个像素点的标签值,根据标签值即得到了图像的分割结果。
步骤204,根据图像的每个像素点所分配的标签值,将图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
在本实施例中,基于步骤203得到的标签值将图像的每个像素点分类。标签值可以与最终生成的图像的像素点的像素值成正比。例如,将标签值为0的像素点归类为背景,将标签值为1的像素点归类为前景。将属于背景的像素点的像素值都修改为0,将属于前景的像素点的像素值都修改为255,即用黑白两种颜色区分不同类别的像素点。对于每种类别的像素点的像素值只要能达到肉眼容易识别即可,不限定为0或255。同理,如果标签的数目为3,将像素点分为三类,用三种不同的像素值区分这三类像素点。最终生成的处理分的图像为按类别分割后的结果。
继续参见图4a、4b,图4a、4b是根据本实施例的图像生成方法的应用场景的一个示意图,其中图4a为原始噪声图像,图4b为分割处理后的图像。在图4a、4b的应用场景中,用户通过终端将原始噪声图像4a发送给服务器,用户输入期望的分割类别数目为3,服务器接收到图4a后获取图像的每个像素点的像素值并获取对应的标签值,将图像的像素点分配了适当的标签值以使得生成的图4b的能量函数值最小。将生成的图4b返回给用户的终端。
本申请的上述实施例提供的方法利用图像局部平滑的先验知识,为图像建立能量函数,通过求解能量函数的最小值达到图像分割的目的。由于先验平滑的引入,当图像中存在孤立噪声点时,其能根据邻居像素的像素值,自动的将像素点归类,因此能够有效处理有噪声图像的分割问题,消除因噪声引起的错误分割问题。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种图像生成装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的图像生成装置500包括:获取单元501、建立单元502、分配单元503和生成单元504。其中,获取单元501用于获取待处理的图像的像素点的像素值集合和与所述图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;建立单元502用于根据所述标签值集合和所述像素值集合,建立能量函数,其中,所述能量函数用于表征标签值与像素值的一致性;分配单元503用于对于所述图像的每个像素点,从所述标签值集合选择标签值进行分配,以使得所述能量函数的值最小;生成单元504用于根据所述图像的每个像素点所分配的标签值,将所述图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
在本实施例中,图像生成装置500的获取单元501、建立单元502、分配单元503和生成单元504的具体处理可以参考图2对应实施例中的步骤201、步骤202、步骤203、步骤204。
在本实施例的一些可选的实现方式中,能量函数包括数据能量函数和光滑能量函数,其中,数据能量函数用于表征像素点的像素值与该像素点所分配的标签值的一致性,光滑能量函数用于表征像素点的像素值与该像素点相邻的像素点所分配的标签值的一致性。
在本实施例的一些可选的实现方式中,装置500还包括:归一化单元,用于在获取待处理的图像的像素点的像素值集合之后,将像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换像素值集合中的每个像素值。
在本实施例的一些可选的实现方式中,装置500还包括:接收单元,用于在获取待处理的图像的像素点的像素值集合之前,接收用户通过终端输入的标签数量,并根据标签数量确定标签值集合。
在本实施例的一些可选的实现方式中,分配单元503进一步用于:采用渐非凸渐凹化过程的子图匹配算法求解能量函数的值最小时每个像素点应分配的标签值。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备/服务器的计算机系统600的结构示意图。图6示出的终端设备/服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、建立单元、分配单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取待处理的图像的像素点的像素值集合和与所述图像相关联的标签值集合的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取待处理的图像的像素点的像素值集合和与图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;根据标签值集合和像素值集合,建立能量函数,其中,能量函数用于表征标签值与像素值的一致性;对于图像的每个像素点,从标签值集合选择标签值进行分配,以使得能量函数的值最小;根据图像的每个像素点所分配的标签值,将图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种图像生成方法,其特征在于,所述方法包括:
获取待处理的图像的像素点的像素值集合和与所述图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;
根据所述标签值集合和所述像素值集合,建立能量函数,其中,所述能量函数用于表征标签值与像素值的一致性;
对于所述图像的每个像素点,从所述标签值集合选择标签值进行分配,以使得所述能量函数的值最小;
根据所述图像的每个像素点所分配的标签值,将所述图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
2.根据权利要求1所述的方法,其特征在于,所述能量函数包括数据能量函数和光滑能量函数,其中,所述数据能量函数用于表征像素点的像素值与该像素点所分配的标签值的一致性,所述光滑能量函数用于表征像素点的像素值与该像素点相邻的像素点所分配的标签值的一致性。
3.根据权利要求1所述的方法,其特征在于,在获取待处理的图像的像素点的像素值集合之后,所述方法还包括:
将所述像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换所述像素值集合中的每个像素值。
4.根据权利要求1所述的方法,其特征在于,在获取待处理的图像的像素点的像素值集合之前,所述方法还包括:
接收用户通过终端输入的标签数量,并根据所述标签数量确定标签值集合。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述从所述标签值集合选择标签值进行分配,以使得所述能量函数的值最小,包括:
采用渐非凸渐凹化过程的子图匹配算法求解能量函数的值最小时每个像素点应分配的标签值。
6.一种图像生成装置,其特征在于,所述装置包括:
获取单元,用于获取待处理的图像的像素点的像素值集合和与所述图像相关联的标签值集合,其中,标签值用于标识像素点所属的类别;
建立单元,用于根据所述标签值集合和所述像素值集合,建立能量函数,其中,所述能量函数用于表征标签值与像素值的一致性;
分配单元,用于对于所述图像的每个像素点,从所述标签值集合选择标签值进行分配,以使得所述能量函数的值最小;
生成单元,用于根据所述图像的每个像素点所分配的标签值,将所述图像的每个像素点分类,并将属于同一类的像素点的像素值修改为同一值,以生成处理后的图像。
7.根据权利要求6所述的装置,其特征在于,所述能量函数包括数据能量函数和光滑能量函数,其中,所述数据能量函数用于表征像素点的像素值与该像素点所分配的标签值的一致性,所述光滑能量函数用于表征像素点的像素值与该像素点相邻的像素点所分配的标签值的一致性。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
归一化单元,用于在获取待处理的图像的像素点的像素值集合之后,将所述像素值集合中的每个像素值进行归一化处理得到归一化的像素值,并使用每个归一化的像素值替换所述像素值集合中的每个像素值。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
接收单元,用于在获取待处理的图像的像素点的像素值集合之前,接收用户通过终端输入的标签数量,并根据所述标签数量确定标签值集合。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述分配单元进一步用于:
采用渐非凸渐凹化过程的子图匹配算法求解能量函数的值最小时每个像素点应分配的标签值。
11.一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710152538.8A CN108629815B (zh) | 2017-03-15 | 2017-03-15 | 图像生成方法和装置 |
PCT/CN2018/072287 WO2018166289A1 (zh) | 2017-03-15 | 2018-01-11 | 图像生成方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710152538.8A CN108629815B (zh) | 2017-03-15 | 2017-03-15 | 图像生成方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108629815A true CN108629815A (zh) | 2018-10-09 |
CN108629815B CN108629815B (zh) | 2021-02-26 |
Family
ID=63522742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710152538.8A Active CN108629815B (zh) | 2017-03-15 | 2017-03-15 | 图像生成方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108629815B (zh) |
WO (1) | WO2018166289A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993756A (zh) * | 2019-04-09 | 2019-07-09 | 中康龙马(北京)医疗健康科技有限公司 | 一种基于图模型与连续逐步优化的通用医学图像分割方法 |
CN110765935A (zh) * | 2019-10-22 | 2020-02-07 | 上海眼控科技股份有限公司 | 图像处理方法、装置、计算机设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777180A (zh) * | 2009-12-23 | 2010-07-14 | 中国科学院自动化研究所 | 基于背景建模和能量最小化的复杂背景实时替换方法 |
CN102270343A (zh) * | 2011-07-27 | 2011-12-07 | 宁波大学 | 一种基于Ising图模型的图像分割方法 |
CN104166983A (zh) * | 2014-06-30 | 2014-11-26 | 中国传媒大学 | 基于结合图割(Graph Cut)的Vibe改进算法的运动目标实时提取方法 |
CN104463786A (zh) * | 2014-12-03 | 2015-03-25 | 中国科学院自动化研究所 | 一种移动机器人图像拼接方法及装置 |
EP2919192A2 (en) * | 2014-03-12 | 2015-09-16 | Fujifilm Corporation | Image processing apparatus, and operation method and program therefor |
CN106340024A (zh) * | 2016-08-30 | 2017-01-18 | 厦门美图之家科技有限公司 | 一种图像分割方法、应用和计算设备 |
-
2017
- 2017-03-15 CN CN201710152538.8A patent/CN108629815B/zh active Active
-
2018
- 2018-01-11 WO PCT/CN2018/072287 patent/WO2018166289A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777180A (zh) * | 2009-12-23 | 2010-07-14 | 中国科学院自动化研究所 | 基于背景建模和能量最小化的复杂背景实时替换方法 |
CN102270343A (zh) * | 2011-07-27 | 2011-12-07 | 宁波大学 | 一种基于Ising图模型的图像分割方法 |
EP2919192A2 (en) * | 2014-03-12 | 2015-09-16 | Fujifilm Corporation | Image processing apparatus, and operation method and program therefor |
CN104166983A (zh) * | 2014-06-30 | 2014-11-26 | 中国传媒大学 | 基于结合图割(Graph Cut)的Vibe改进算法的运动目标实时提取方法 |
CN104463786A (zh) * | 2014-12-03 | 2015-03-25 | 中国科学院自动化研究所 | 一种移动机器人图像拼接方法及装置 |
CN106340024A (zh) * | 2016-08-30 | 2017-01-18 | 厦门美图之家科技有限公司 | 一种图像分割方法、应用和计算设备 |
Non-Patent Citations (3)
Title |
---|
YURI BOYKOV等: "《Fast Approximate Energy Minimization via Graph Cuts》", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
石文成: "《基于图分割的运动物体前景检测算法的研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
高坤: "《基于Graph Cuts的图像分割关键技术研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993756A (zh) * | 2019-04-09 | 2019-07-09 | 中康龙马(北京)医疗健康科技有限公司 | 一种基于图模型与连续逐步优化的通用医学图像分割方法 |
CN109993756B (zh) * | 2019-04-09 | 2022-04-15 | 中康龙马(北京)医疗健康科技有限公司 | 一种基于图模型与连续逐步优化的通用医学图像分割方法 |
CN110765935A (zh) * | 2019-10-22 | 2020-02-07 | 上海眼控科技股份有限公司 | 图像处理方法、装置、计算机设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108629815B (zh) | 2021-02-26 |
WO2018166289A1 (zh) | 2018-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308681A (zh) | 图像处理方法和装置 | |
CN109389640A (zh) | 图像处理方法和装置 | |
CN109003028A (zh) | 用于划分物流区域的方法和装置 | |
US10586330B2 (en) | Detection of outlier lesions based on extracted features from skin images | |
CN109344752A (zh) | 用于处理嘴部图像的方法和装置 | |
CN108595628A (zh) | 用于推送信息的方法和装置 | |
CN109360028A (zh) | 用于推送信息的方法和装置 | |
CN109272050B (zh) | 图像处理方法和装置 | |
CN109993150A (zh) | 用于识别年龄的方法和装置 | |
CN109344762A (zh) | 图像处理方法和装置 | |
CN108694535A (zh) | 信息生成方法和装置 | |
CN108460761A (zh) | 用于生成信息的方法和装置 | |
CN108764319A (zh) | 一种样本分类方法和装置 | |
CN108960110A (zh) | 用于生成信息的方法和装置 | |
CN110084317A (zh) | 用于识别图像的方法和装置 | |
CN109087377A (zh) | 用于处理图像的方法和装置 | |
CN108595448A (zh) | 信息推送方法和装置 | |
CN109118456A (zh) | 图像处理方法和装置 | |
CN108182457A (zh) | 用于生成信息的方法和装置 | |
CN109255814A (zh) | 用于处理图像的方法和装置 | |
CN108629815A (zh) | 图像生成方法和装置 | |
CN110443899A (zh) | 用于处理数据的方法和装置 | |
CN109993749A (zh) | 提取目标图像的方法和装置 | |
CN109241930A (zh) | 用于处理眉部图像的方法和装置 | |
CN109446379A (zh) | 用于处理信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |