CN109359655B - 基于上下文正则化循环深度学习的图像分割方法 - Google Patents
基于上下文正则化循环深度学习的图像分割方法 Download PDFInfo
- Publication number
- CN109359655B CN109359655B CN201811089851.2A CN201811089851A CN109359655B CN 109359655 B CN109359655 B CN 109359655B CN 201811089851 A CN201811089851 A CN 201811089851A CN 109359655 B CN109359655 B CN 109359655B
- Authority
- CN
- China
- Prior art keywords
- layer
- convolution
- following
- context
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了基于上下文正则化循环深度学习的图像分割方法,通过卷积操作、上下文正则化操作和循环迭代操作解决了现有同类算法图像区域和非图像区域分割不准确的问题,尤其解决了预测图片大面积错误和边缘分割不清晰的问题,提高了图像分割准确程度。
Description
技术领域
本发明涉及图像语义分割领域,尤其涉及一种基于上下文正则化循环深度学习的图像分割方法。
背景技术
当今社会,手机、平板电脑等智能移动设备已被广泛使用。显示器作为智能移动设备中人机交互不可或缺的界面,主要分为非自发光显示器和自发光显示器。有机发光二极管(Organic Light-Emitting,OLED)作为一种新兴的自发光显示器技术,不同于传统的非自发光显示器,每一个像素都可以提供光源,可以单独调节,易于有效控制电池消耗。现有的功率约束图像增强算法有个明显的不足之处。现有的方法都是直接将整张图片进行调整,这种操作会损失图像的细节信息,影响视觉感受。
基于视觉心理学,显示器内容中有图像的区域(图像区域)像素亮度值的降低对人类视觉感受的影响比较大,而文本和其他空白等无图像区域(非图像区域)像素亮度值的降低对视觉感受的影响相对较小。根据这一特点,本发明将智能移动设备显示器内容,分成图像区域和非图像区域。目前效果较好的图像语义分割方法是全卷积网络(FullyConvolutionalNetworks,FCN),但是FCN在进行图像区域和非图像区域的语义分割操作时,出现了预测图片大面积错误和边缘分割不清晰的问题。
发明内容
本发明的目的在于提供基于上下文正则化循环深度学习的图像分割方法,能够解决CN在进行图像区域和非图像区域的语义分割操作时,出现了预测图片大面积错误和边缘分割不清晰的问题。
为了实现上述目的,本发明采用以下技术方案:
基于上下文正则化循环深度学习的图像分割方法,包括以下步骤:
步骤1.1:卷积层操作,采用以下方法:
步骤1.2:池化层最大池化操作,采用以下公式(1-3)表示:
步骤1.3:反卷积层操作,采用以下方法:
步骤1.4:调整学习率,采用以下方法:
学习率的调整如公式(1-5)所示:
其中,Rt为学习率,t为变化计数,t=0,1,2,3;α为衰减指数;ρ=0.90;
其中,η是最原始的误差,η为:
步骤2.2:定义约束函数:
步骤2.3:定义权重函数W(m,n):
当w(m,n)=0时,m和n之间的相应上下文约束将被取消;
步骤2.4:基于两个相邻像素的向量之间的平方差的方法,构造权重函数W(m,n):
其中,σ为规定参数,σ=0.5,I(m+Δm,n+Δn)为Xg的输入像素周围8个方向的像素;
步骤2.5:在图像域中加入加权上下文约束,改写公式(1-9)为:
其中,ω代表8个所在位置的像素的不同方向;
步骤2.6:定义高阶滤波器DΔm,Δn,使DΔm,Δn在每一个位置(Δm,Δn)的值都满足:
即使DΔm,Δn在每一个位置(Δm,Δn)的值都满足
步骤2.7:定义并最小化下面的目标函数,目标函数(1-14)由公式(1-7)和公式(1-13)得:
其中,sign(·)是信号函数;
其中,τ是傅里叶变化,τ(·)-1是反傅里叶变化;
步骤3:循环迭代操作,包括以下步骤:
步骤3.2:将步骤3.1中的Y作为输入,重复进行步骤1、步骤2和步骤3.1,基于Y的熵值,设置熵值临界值6.92,使迭代从0到6.92进行,直至预测出与真相最为接近的二值掩膜图。
步骤1.1中,所述的激活函数使用的是修正线性单元,如公式(1-2)所示:
f(x)=max(0,x);(1-2)
其中x是激活函数的输入值。
步骤1.4中,所述的学习率Rt的初始值R0设为10-4。
步骤3.2中,判断图片Y是否为与真相最为接近的二值掩膜图的方法为:通过查准率、召回率、F1_measure和相似度这4个评价指标判断。
本发明的有益效果:
本发明所述的一种基于上下文正则化的图像语义分割方法,通过卷积操作、上下文正则化操作和循环迭代操作解决了现有同类算法图像区域和非图像区域分割不准确的问题,尤其解决了预测图片大面积错误和边缘分割不清晰的问题,提高了图像分割准确程度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图;
图2为本发明所述高阶滤波器DΔm,Δn的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示:本发明所述的一种基于上下文正则化的图像语义分割方法,包括以下步骤:
步骤1:在VGG19-FCN网络中进行卷积操作,其中,VGG19-FCN网络由18个卷积层、5个池化层和3个反卷积层构成;具体包括以下步骤:
其中,是第I层卷积层的第i层卷积层的卷积核,是第I层卷积层的第i层卷积层的偏差参数;其中n是在中特征映射的数量,*表示为卷积操作,f(·)代表激活函数,激活函数使用的是修正线性单元(Rectified linear unit,ReLU),如公式(1-2)所示:
f(x)=max(0,x);(1-2)
其中x是激活函数的输入值;
步骤1.3:反卷积层操作,采用以下方法:
如果直接对第6层网络的输出进行放大32倍的反卷积操作,得到的结果对比于的真相二值图来说,结果并不精确,有很多错误;因此,按从后向前的顺序,将第4层的输出16倍反卷积之后再根据第3层的输出8倍反卷积,得到的结果比之前未经过此过程的输出结果更加精确;进一步的,反卷积操作用公式(1-4)表示:
其中表示第I层卷积层的第i层反卷积层的核的值,表示为反卷积操作;因此,在执行反卷积操作之后,生成一个二值掩膜图(Binary mask)作为显著性映射图(saliency-guided map),以分离出显示图像中的图像区域和非图像区域;
其中,t表示变化计数,t=0,1,2,3;R0是学习率的初始值,初始值设为10-4;α为衰减指数;本发明一共进行了15个纪元的卷积操作,其中,每3个纪元减少为之前的α倍,一共变化了4次;本发明将衰减指数α的值设置为0.90;
步骤2:上下文正则化操作,具体包括以下步骤:
其中η是最原始的误差,可以用公式(1-7)表示为:
步骤2.2:定义约束函数::
步骤2.3:设置一个权重函数为W(m,n):
权重函数w(m,n)代表在位置(m,n)处加权函数起到了m和n之间的约束的“开关”作用,当w(m,n)=0时,m和n之间的相应上下文约束将被取消;一个非常关键的问题是如何选择一个合理的w(m,n);
步骤2.4:基于两个相邻像素的向量之间的平方差的方法,构造权重函数W(m,n):
其中,σ为一个规定参数,值为0.5,I(m,n)和I(m+Δm,n+Δn)分别为Xg的输入像素和输入像素周围8个方向的像素;
步骤2.5:在图像域中加入加权上下文约束;为了便于计算,公式(1-9)可以表示为:
其中,ω代表8个所在位置的像素的不同方向;
步骤2.6:如图2所示:定义高阶滤波器DΔm,Δn;
设置DΔm,Δn在每一个位置(Δm,Δn)的值的计算都满足公式(1-12):
为了方便计算,公式(2-12)使用更合理的表达方法,如公式(1-13):
本发明根据一个最小滤波器的移动窗口,对输入图片的每个像素通道进行滤波,然后将每个通道的最大值作为Xg的分量的估计值;
步骤2.7:定义并最小化下面的目标函数,从而找到一个最优的函数,由公式(1-7)和公式(1-13)得目标函数为:
其中,sign(·)是信号函数;
步骤3:循环迭代操作,包括以下步骤:
步骤3.2:将步骤3.1中的Y作为输入,重复进行步骤1、步骤2和步骤3.1,基于Y的熵值,设置熵值临界值6.92,使迭代从0到6.92进行,直至预测出与真相最为接近的二值掩膜图。
本发明通过计算查准率(Precision)、召回率(Recall,也叫查全率)、F1-Measure和相似度(Similary)判断最终结果是否是与真相最为接近的二值掩膜图。
其中真正例(True Positive,TP)说明答案为0时,预测结果为0;真反例(TrueNegative,TN)说明答案为1时,预测结果为1;假正例(False Positive,FP)说明答案为0时,预测结果为1;假反例(False Negative,FN)说明答案为1时,预测结果为0。
查准率(Precision)为真正正确的个数占整个结果的比例;即在正确答案应该为0这一标准下,预测正确的个数占所有预测结果出的值是0的个数的比例。
召回率(Recall,也叫查全率)为真正正确的个数占整个数据集中真正正确个数的比例;即在正确答案应该为0这一标准下,预测正确的个数占整个数据集中正确答案为0的个数的比例。
F1-Measure是精准率Precision和召回率Recall加权调和平均。
相似度(Similary)为真正正确的个数占预测错误的个数与误报率和漏报率之和;即在正确答案应该为0这一标准下,预测正确的个数,占整个数据集中正确答案为0的个数和正确答案为1而预测答案为0的个数之和的比例。
查准率、召回率、F1_measure和相似度这4个评价指标的值在0-1之间,其中值越接近1,表明最终结果与真相最为接近。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (4)
1.基于上下文正则化循环深度学习的图像分割方法,其特征在于,包括以下步骤:
步骤1.1:卷积层操作,采用以下方法:
步骤1.2:池化层最大池化操作,采用以下公式(1-3)表示:
步骤1.3:反卷积层操作,采用以下方法:
步骤1.4:调整学习率,采用以下方法:
学习率的调整如公式(1-5)所示:
其中,Rt为学习率,t为变化计数,t=0,1,2,3;α为衰减指数;ρ=0.90;
其中,η是最原始的误差,η为:
步骤2.2:定义约束函数:
步骤2.3:定义权重函数W(m,n):
当w(m,n)=0时,m和n之间的相应上下文约束将被取消;
步骤2.4:基于两个相邻像素的向量之间的平方差的方法,构造权重函数W(m,n):
其中,σ为规定参数,σ=0.5,I(m+Δm,n+Δn)为Xg的输入像素周围8个方向的像素;
步骤2.5:在图像域中加入加权上下文约束,改写公式(1-9)为:
其中,ω代表8个所在位置的像素的不同方向;
步骤2.6:定义高阶滤波器DΔm,Δn,使DΔm,Δn在每一个位置(Δm,Δn)的值都满足:
即使DΔm,Δn在每一个位置(Δm,Δn)的值都满足
步骤2.7:定义并最小化下面的目标函数,目标函数(1-14)由公式(1-7)和公式(1-13)得:
其中,sign(·)是信号函数;
其中,τ是傅里叶变化,τ(·)-1是反傅里叶变化;
步骤3:循环迭代操作,包括以下步骤:
步骤3.2:将步骤3.1中的Y作为输入,重复进行步骤1、步骤2和步骤3.1,基于Y的熵值,设置熵值临界值6.92,使迭代从0到6.92进行,直至预测出与真相最为接近的二值掩膜图。
2.根据权利要求1所述的基于上下文正则化循环深度学习的图像分割方法,其特征在于:步骤1.1中,所述的激活函数使用的是修正线性单元,如公式(1-2)所示:
f(x)=max(0,x);(1-2)
其中x是激活函数的输入值。
3.根据权利要求1所述的基于上下文正则化循环深度学习的图像分割方法,其特征在于:步骤1.4中,所述的学习率Rt的初始值R0设为10-4。
4.根据权利要求1所述的基于上下文正则化循环深度学习的图像分割方法,其特征在于:步骤3.2中,判断图片Y是否为与真相最为接近的二值掩膜图的方法为:通过查准率、召回率、F1_measure和相似度这4个评价指标判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811089851.2A CN109359655B (zh) | 2018-09-18 | 2018-09-18 | 基于上下文正则化循环深度学习的图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811089851.2A CN109359655B (zh) | 2018-09-18 | 2018-09-18 | 基于上下文正则化循环深度学习的图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109359655A CN109359655A (zh) | 2019-02-19 |
CN109359655B true CN109359655B (zh) | 2021-07-16 |
Family
ID=65351309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811089851.2A Active CN109359655B (zh) | 2018-09-18 | 2018-09-18 | 基于上下文正则化循环深度学习的图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359655B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203781A (zh) * | 2017-05-22 | 2017-09-26 | 浙江大学 | 一种基于显著性指导的端到端的弱监督目标检测方法 |
CN107464228A (zh) * | 2017-08-24 | 2017-12-12 | 深圳市唯特视科技有限公司 | 一种基于自适应正则化的图像分析方法 |
CN107680037A (zh) * | 2017-09-12 | 2018-02-09 | 河南大学 | 改进的基于最近特征线流形学习的人脸超分辨率重建方法 |
CN108062756A (zh) * | 2018-01-29 | 2018-05-22 | 重庆理工大学 | 基于深度全卷积网络和条件随机场的图像语义分割方法 |
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8311973B1 (en) * | 2011-09-24 | 2012-11-13 | Zadeh Lotfi A | Methods and systems for applications for Z-numbers |
CN108171711A (zh) * | 2018-01-17 | 2018-06-15 | 深圳市唯特视科技有限公司 | 一种基于完全卷积网络的婴幼儿脑部磁共振图像分割方法 |
-
2018
- 2018-09-18 CN CN201811089851.2A patent/CN109359655B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203781A (zh) * | 2017-05-22 | 2017-09-26 | 浙江大学 | 一种基于显著性指导的端到端的弱监督目标检测方法 |
CN107464228A (zh) * | 2017-08-24 | 2017-12-12 | 深圳市唯特视科技有限公司 | 一种基于自适应正则化的图像分析方法 |
CN107680037A (zh) * | 2017-09-12 | 2018-02-09 | 河南大学 | 改进的基于最近特征线流形学习的人脸超分辨率重建方法 |
CN108062756A (zh) * | 2018-01-29 | 2018-05-22 | 重庆理工大学 | 基于深度全卷积网络和条件随机场的图像语义分割方法 |
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
Non-Patent Citations (3)
Title |
---|
A novel target detection algorithm combining foreground and background manifold-based models;Sebastien Razakarivony et.al;《Machine Vision and Applications》;20150403;第27卷;第363–375页 * |
Deep Learning for Object Saliency Detection and Image Segmentation;Hengyue Pan et.al;《ArXiv:1505.01173v1》;20150505;第1-9页 * |
基于深度学习的图像语义分割研究;肖旭;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180115;第I138-1011页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109359655A (zh) | 2019-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | Image super-resolution using knowledge distillation | |
US20230267730A1 (en) | Image abnormality detection model training | |
CN109343692B (zh) | 基于图像分割的移动设备显示器省电方法 | |
US20200117981A1 (en) | Data representation for dynamic precision in neural network cores | |
CN112132149B (zh) | 一种遥感影像语义分割方法及装置 | |
CN110728637B (zh) | 基于深度学习的用于图像处理的动态调光背光扩散方法 | |
CN116010684A (zh) | 物品推荐方法、装置及存储介质 | |
CN106372749A (zh) | 基于云变分析的超短期光伏功率预测方法 | |
CN112800915A (zh) | 建筑物变化检测方法、装置、电子设备以及存储介质 | |
CN111339724B (zh) | 用于生成数据处理模型和版图的方法、设备和存储介质 | |
CN115882454B (zh) | 基于多元信息融合的源荷功率预测方法及系统 | |
CN115631396A (zh) | 一种基于知识蒸馏的YOLOv5目标检测方法 | |
CN105893590A (zh) | 一种用于数字地形分析建模知识案例化自动处理方法 | |
US20220004849A1 (en) | Image processing neural networks with dynamic filter activation | |
Ye et al. | Multi-year ENSO forecasts using parallel convolutional neural networks with heterogeneous architecture | |
CN109359655B (zh) | 基于上下文正则化循环深度学习的图像分割方法 | |
CN112288084B (zh) | 基于特征图通道重要性的深度学习目标检测网络压缩方法 | |
CN116106909A (zh) | 一种雷达回波外推方法、系统及存储介质 | |
CN115205157B (zh) | 图像处理方法和系统、电子设备和存储介质 | |
CN114153996B (zh) | 多图注意力协同的地学知识图谱更新方法和装置 | |
Li et al. | AdaRW training optimization algorithm for deep learning model of marine target detection based on SAR | |
CN113723712B (zh) | 风电功率预测方法、系统、设备及介质 | |
CN113344200B (zh) | 用于训练可分离卷积网络的方法、路侧设备及云控平台 | |
CN112598663B (zh) | 基于视觉显著性的粮食害虫检测方法和装置 | |
CN107330905A (zh) | 一种图像处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |