CN114612489A - 一种基于自编码神经网络的图像边缘提取方法及系统 - Google Patents
一种基于自编码神经网络的图像边缘提取方法及系统 Download PDFInfo
- Publication number
- CN114612489A CN114612489A CN202210254460.1A CN202210254460A CN114612489A CN 114612489 A CN114612489 A CN 114612489A CN 202210254460 A CN202210254460 A CN 202210254460A CN 114612489 A CN114612489 A CN 114612489A
- Authority
- CN
- China
- Prior art keywords
- edge
- pixel
- image
- obtaining
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 67
- 238000000605 extraction Methods 0.000 title claims abstract description 38
- 230000003313 weakening effect Effects 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 20
- 230000002708 enhancing effect Effects 0.000 claims abstract description 9
- 230000008859 change Effects 0.000 claims description 34
- 230000000694 effects Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 10
- 238000003708 edge detection Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 6
- 238000005728 strengthening Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于自编码神经网络的图像边缘提取方法及系统。方法包括:将原图像输入至自编码神经网络,在该网络的损失函数监督下训练输出边缘弱化图像;对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像;通过在自编码神经网络的损失函数中加入边缘弱化系数对该网络进行训练,最终实现多场景下图像的边缘提取。相较于现有技术,该网络不但有满意度较高的边缘提取效果,而且对各种图像场景有很好的适应能力,可实现对多种图像场景的边缘提取功能。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于自编码神经网络的图像边缘提取方法及系统。
背景技术
目前常用的边缘提取方法可以分为两大类,基于梯度的图像处理方式,和基于神经网络语义分割方式。基于梯度的边缘检测算子的缺陷在于,不同场景、不同图像需要遍历各种算子才能实现最优边缘的提取,算子通用性差、边缘检测效率低。一些语义分割技术,例如用于街景理解的融合点与区域特征的语义分割方法及系统(CN110059768A),使用语义分割损失对深度神经网络进行训练,通过标签图像中的信息对边缘增强进行图像分割,一方面基于语义分割的边缘检测技术仅能实现样本训练集中标记的目标的边缘标识,不能实现未标记目标的边缘提取,另一方面仅适用于需要对目标进行辨识且分割出目标区域的场景,对于无需识别目标的应用场景,语义分割显然是多余且低效的。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于自编码神经网络的图像边缘提取方法及系统,通过在损失函数中加入边缘弱化系数对自编码神经网络进行训练,最终实现多场景下图像的边缘提取。所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种基于自编码神经网络的图像边缘提取方法。
将原图像输入至自编码神经网络,输出边缘弱化图像;所述自编码神经网络的损失通过以下方式衡量:获取原图像与边缘弱化图像每个对应像素点的像素差异,根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数,利用边缘弱化系数对所述像素差异进行修正得到修正值,对所有像素点对应的修正值求和得到自编码神经网络的损失;对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
优选的,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:获取原图像像素点在各边缘方向上梯度的最大值以及最大值对应的关联像素,根据像素点邻域内最大、最小像素的差异和像素点及其邻域内非关联像素的差异得到一致性指数;根据像素点一致性指数及其对应的梯度的最大值计算像素点的独立边缘指数;分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数;根据像素点的独立边缘程度、行像素系数和列像素系数得到像素点对应的边缘弱化系数。
优选的,所述分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数包括:分别对像素点同行像素、同列像素的独立边缘指数进行曲线拟合得到行变化曲线、列变化曲线;根据行变化曲线的极大值点得到第一极值点分布中心,根据列变化曲线的极值点得到第二极值点分布中心;第一极值点分布中心将行变化曲线分为两侧,计算与像素点位于同侧的极值点到第一极值点分布中心的距离之和得到第一距离,第二极值点分布中心将列变化曲线分为两侧,计算与像素点位于同侧的极值点到第二极值点分布中心的距离之和得到第二距离;根据像素点到第一极值点分布中心的距离和第一距离获得行像素系数;根据像素点到第二极值点分布中心的距离和第二距离获得列像素系数。
优选的,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:获取原图像上像素点各边缘方向上的梯度;根据梯度平均值与梯度最大值得到像素点的边缘弱化系数。
优选的,所述边缘强化系数根据每个像素点的边缘弱化系数获取。
第二方面,本发明一个实施例提供了一种基于自编码神经网络的图像边缘提取系统。
自编码神经网络模块,用于对原图像进行处理,输出边缘弱化图像;所述自编码神经网络模块的损失通过以下方式衡量:获取原图像与边缘弱化图像每个对应像素点的像素差异,根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数,利用边缘弱化系数对所述像素差异进行修正得到修正值,对所有像素点对应的修正值求和得到自编码神经网络的损失;
边缘强化处理模块,用于对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
优选的,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:获取原图像上像素点各边缘方向上的梯度;根据梯度平均值与梯度最大值得到像素点的边缘弱化系数。
优选的,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:获取原图像像素点在各边缘方向上梯度的最大值以及最大值对应的关联像素,根据像素点邻域内最大、最小像素的差异和像素点及其邻域内非关联像素的差异得到一致性指数;根据像素点一致性指数及其对应的梯度的最大值计算像素点的独立边缘指数;分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数;根据像素点的独立边缘程度、行像素系数和列像素系数得到像素点对应的边缘弱化系数。
优选的,所述分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数包括:分别对像素点同行像素、同列像素的独立边缘指数进行曲线拟合得到行变化曲线、列变化曲线;根据行变化曲线的极大值点得到第一极值点分布中心,根据列变化曲线的极值点得到第二极值点分布中心;第一极值点分布中心将行变化曲线分为两侧,计算与像素点位于同侧的极值点到第一极值点分布中心的距离之和得到第一距离,第二极值点分布中心将列变化曲线分为两侧,计算与像素点位于同侧的极值点到第二极值点分布中心的距离之和得到第二距离;根据像素点到第一极值点分布中心的距离和第一距离获得行像素系数;根据像素点到第二极值点分布中心的距离和第二距离获得列像素系数。
优选的,所述边缘强化系数根据每个像素点的边缘弱化系数获取。
本发明具有如下有益效果:
通过在自编码神经网络损失函数中加入弱化系数使自编码神经网络输出边缘弱化的图像,从而实现DNN方式的边缘提取自编码神经网络;该网络不但有满意度较高的提取效果,而且对各种图像场景有很好的适应能力,可实现对多种图像场景的边缘提取功能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于自编码神经网络的图像边缘提取方法流程图;
图2为本发明一个实施例所提供的一种基于自编码神经网络的图像边缘提取方法的像素点独立边缘指数gl的变化曲线;
图3为本发明一个实施例所提供的一种基于自编码神经网络的图像边缘提取方法的自编码神经网络输出结果以及边缘强化处理结果。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于自编码神经网络的图像边缘提取方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
为解决图像边缘提取过程中,各种边缘检测算子对不同场景、不同图像的适应性不同的问题,本发明通过在自编码神经网络损失函数中加入弱化系数使自编码神经网络输出边缘弱化的图像,从而实现DNN方式的边缘提取。下面结合附图具体的说明本发明所提供的一种基于自编码神经网络的图像边缘提取方法及系统的具体方案。
具体实施例1:
本实施例提供一种基于自编码神经网络的图像边缘提取方法。
本发明所针对的具体场景为:需要提取图像边缘的不同场景的图像,并对该图像进行灰度化处理。由于场景的随机性,适用的边缘检测算子也不同。DNN具有很好的泛化能力,训练完成后,能适用于各种各样的场景。所以本发明通过构建边缘弱化损失函数使自编码神经网络在图像重构过程中,能更大程度的保留内部像素,弱化边缘像素。从而得到边缘弱化图像,结合后续处理,最后得到优质的边缘图像。
参阅图1,其示出了本发明所提供的基于自编码神经网络的图像边缘提取方法流程图。基于自编码神经网络的图像边缘提取方法包括:
将原图像输入至自编码神经网络,输出边缘弱化图像;所述自编码神经网络的损失通过以下方式衡量:获取原图像与边缘弱化图像每个对应像素点的像素差异,根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数,利用边缘弱化系数对所述像素差异进行修正得到修正值,对所有像素点对应的修正值求和得到自编码神经网络的损失;对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
具体实施步骤如下:
首先,对图像进行展平操作,得到图像对应的一维向量,作为边缘提取网络的输入数据。由于网络的输入数据尺寸往往是固定的,所以需要对图像进行统一的归一化处理,使其尺寸能符合网络的输入需求。本发明对图像的处理使用全连接网络(FC),所以需要先对图像进行展平处理,得到图像对应的一维数据。灰度化后的图像展平成一维数据的过程为:
(1)获得灰度图像的尺寸(C,K);
(2)按照逐行排列的方式,得到长度为C*K的一维向量。
其次,针对展开的一维向量,构建边缘弱化损失函数,并进行网络的训练。目前使用DNN网络进行边缘检测的方式,都是需要大量的标注标签来训练,但是,图像进行标注往往采用人工的方式,对大量的训练数据进行人工标注,无疑增加了系统的成本费用。而自编码神经网络最大的优点就在于不用标签数据,自身作为自身的标签。但是自编码神经网络是使用重构损失函数(均方差损失函数)进行训练监督的,其核心目的是保证重构前后的差异尽量小。而本发明的目的是让自编码神经网络在图像重构过程弱化图像边缘,所以原有的重构损失函数已经不适用,要训练边缘弱化自编码神经网络,需要重新构建合理的边缘弱化损失函数,来让网络达到弱化图像边缘的目的,即在原有重构损失函数的基础上加入边缘弱化系数得到边缘弱化损失函数。
具体地,本发明所述边缘弱化损失函数为:
其中,I为每张图像中像素点的数量,i为像素点序号,lsi为每个像素点对应的边缘弱化系数,si和yi分别表示原图像和自编码神经网络输出图像的像素灰度值。相比图像重构均方差损失函数,图像边缘弱化损失函数新添了弱化系数,对不同序列内的像素进行不同程度的重构弱化。
具体地,获取原图像像素点在各边缘方向上梯度的最大值以及最大值对应的关联像素,根据像素点邻域内最大、最小像素的差异和像素点及其邻域内非关联像素的差异得到一致性指数;根据像素点一致性指数及其对应的梯度的最大值计算像素点的独立边缘指数;分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数;根据像素点的独立边缘程度、行像素系数和列像素系数得到像素点对应的边缘弱化系数。
获得像素对应的边缘弱化系数的具体过程为:
(1)获得像素点及其邻域内的像素值。网络处理的是图像的一维数据,需要根据图像一维序列内的ID来获取其邻域内的像素。像素的序列关系与其在图像内位置的关系如下:
i-C-1 | i-C | i-C+1 |
i-1 | i | i+1 |
i+C-1 | i+C | i+C+1 |
其中,C为图像的长度尺寸。
除自身像素外,其余像素按序排列,得到像素点的邻域像素序列:
SM=[si-C-1,si-C,si-C+1,si-1,si+1,si+C-1,si+C,si+C+1]
(2)计算像素点邻域像素序列四个方向上的差异:
分别表示序列中像素si四个方向上的像素灰度差异,即为像素点在各边缘方向上梯度。按序排列,得到对应的序列数据:
CY=[cy1,cy2,cy3,cy4]
求得最大差异及其对应方向,即为最大梯度:
Gm=Max(CY)
其中,cy1,cy2,cy3,cy4为像素点邻域像素在四个方向上的差异,即原图像上像素点在各边缘方向上的梯度,max(SM)和min(SM)分别是最大和最小的邻域像素。
(3)求得最大差异剩余像素的一致性:
上述步骤仅能获得像素点周围四个方向的差异,还不能更加准确的判断该像素点是否为边缘像素点。如果像素点横向的梯度差异最大,若像素所在列的梯度差异也大,那么该像素点很可能只是高频的像素点,而不是边缘像素点;只有其所在列的像素差异不大时,该像素点才会有较大的概率是边缘像素点。
此时,根据像素点邻域内最大、最小像素的差异和像素点及其邻域内非关联像素的差异得到一致性指数,其公式为:
其中,a、b、c分别为像素点及其邻域内非关联像素的像素值。
得到像素点的独立边缘指数gl:
该gl值越大,表明该像素点是边缘像素点的概率越大。
特别地,分别对像素点同行像素、同列像素的独立边缘指数进行曲线拟合得到行变化曲线、列变化曲线;根据行变化曲线的极大值点得到第一极值点分布中心,根据列变化曲线的极值点得到第二极值点分布中心;第一极值点分布中心将行变化曲线分为两侧,计算与像素点位于同侧的极值点到第一极值点分布中心的距离之和得到第一距离,第二极值点分布中心将列变化曲线分为两侧,计算与像素点位于同侧的极值点到第二极值点分布中心的距离之和得到第二距离;根据像素点到第一极值点分布中心的距离和第一距离获得行像素系数;根据像素点到第二极值点分布中心的距离和第二距离获得列像素系数。
具体地,对同行和同列像素的独立边缘指数gl进行分析处理,最终得到各像素的边缘程度指数。具体过程为:
首先,得到各行像素对应的独立边缘指数gl,并进行散点拟合,得到行变化曲线。参阅图2,其示出了独立边缘指数gl的变化曲线。对行变化曲线进行处理,得到各极大值点。优选地,本实施例对其进行求导处理。至此,得到各行像素分析后的极大值点。根据极值点所处坐标位置,进行边缘程度的增强:得到该像素到其所在同行像素对应边缘中心的距离:
得到各列像素对应的独立边缘指数gl,并进行散点拟合,得到列变化曲线。对列变化曲线进行处理,得到各极大值点。优选地,本实施例对其进行求导处理。至此,得到各列像素分析后的极大值点。根据极值点所处坐标位置,进行边缘程度的增强:得到该像素到其所在同列像素对应边缘中心的距离:
其次,计算与像素点位于同侧的极值点到第一极值点分布中心的距离之和得到第一距离,与像素点位于同侧的极值点到第二极值点分布中心的距离之和得到第二距离;根据像素点到第一极值点分布中心的距离和第一距离获得行像素系数;根据像素点到第二极值点分布中心的距离和第二距离获得列像素系数。对于单侧的距离进行统计归一化处理,得到对应的系数值sp或者sq,其中sp为行像素计算得到的系数值,sq为列像素计算得到的系数值:
则像素点对应的边缘程度指数为:
gc=gl+(1+sq+sp)
其中,若像素在其所在行列都存在极大值点,则式中sq、sp的值都为0;若像素仅存在所在行像素的极大值点,则sp>0,sq=0;若像素仅存在所在列像素的极大值点,则sq>0,sp=0。
(4)最后,根据图像中各像素的边缘程度指数gc,得到像素对应的边缘弱化系数lsi:
即对整体图像各像素的gc进行归一化处理,使其取值范围为[0,1]。
上式保证了越可能为最外层边缘点的像素点,其重构的要求程度越小,以便重构时产生需要的损失。在重构损失函数中加入上述弱化系数,保证图像内像素点之间各向差异越大,越需要弱化。
本实施例还包括另一种获取边缘弱化系数的方法:
获取原图像上像素点各边缘方向上的梯度;根据梯度平均值与梯度最大值得到像素点的边缘弱化系数。
具体地,cy1,cy2,cy3,cy4为关联像素在四个方向上的差异。
获得最大差异及其对应方向,即为梯度最大值:
Gm=Max(CY)
求得平均差异,即为梯度平均值:
Gn=Mean(CY)
此时,获得边缘弱化系数:
至此,通过构建边缘弱化损失函数,得到了图像中各像素的重构要求,其中,边缘弱化系数代表了重构时对该像素的准确性要求程度。
再次,使用构建的边缘弱化损失函数对边缘弱化自编码神经网络进行训练。训练具体内容为:
(1)任意采集图像作为训练数据,输入网络前需要进行归一化处理,得到符合网络输入要求的图像尺寸(C*K);
(2)使用构建的边缘弱化损失函数进行训练,当边缘弱化损失函数趋于稳定时,即为网络完成训练。
最后,对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
具体地,使用训练完成的网络对图像进行推理,得到边缘弱化图像。而后结合原输入图像得到边缘强化图像,随后对该边缘强化图像进行形态学处理,得到优质的边缘图像。自编码神经网络若使用均方差损失函数进行图像恢复,则各位置像素值的重构要求是一致的,网络推理得到的图像也为原图像对应的重构图像。但是本发明使用边缘弱化损失函数进行训练,图像中各像素值的重构要求是不一致的,网络推理得到的图像为原图像的边缘弱化图像。对边缘弱化图像和原图像进行处理得到边缘强化图像。其过程为:
(1)将原图像与边缘弱化图像进行作差操作,得到差值图像。
(2)根据各像素的弱化系数反比得到像素的强化系数:
qsi=1/lsi
(3)差值图像内各差值与相应的强化系数进行乘法操作。得到新的图像。对新图像内的像素值进行归一化操作,使像素值的取值范围为[0,255]
至此,得到边缘强化图像。
以MNIST手写数字数据集为例,参阅图3,其示出了使用边缘弱化损失函数训练的自编码神经网络输出结果以及边缘强化处理结果。其中,第一行为原数据图像,第二行为自编码神经网络的边缘弱化图像,第三行为对应的边缘强化图像。得到的边缘强化图像中,边缘像素点是离散的,且边缘像素点的像素值是不同的。所以需要利用形态学处理的方来得到光滑一致的边缘图像。
其具体过程为:
(1)首先使用阈值化处理边缘强化图像,大于0的替代为1或者255.得到对应的二值图像。
(2)对二值图像先使用开运算消除内部噪点,再使用闭运算来进行断续的连接。
至此,得到连续的二值化边缘提取图像。
至此,本发明完成。
具体实施例2:
本实施例提供一种基于自编码神经网络的图像边缘提取系统。
本发明所针对的具体场景为:需要提取图像边缘的不同场景的图像,并对该图像进行灰度化处理。由于场景的随机性,适用的边缘检测算子也不同。DNN具有很好的泛化能力,训练完成后,能适用于各种各样的场景。所以本发明通过构建边缘弱化损失函数使自编码神经网络在图像重构过程中,能更大程度的保留内部像素,弱化边缘像素。从而得到边缘弱化图像,结合后续处理,最后得到优质的边缘图像。
基于自编码神经网络的图像边缘提取系统包括:
将原图像输入至自编码神经网络模块,输出边缘弱化图像;所述自编码神经网络模块的损失通过以下方式衡量:获取原图像与边缘弱化图像每个对应像素点的像素差异,根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数,利用边缘弱化系数对所述像素差异进行修正得到修正值,对所有像素点对应的修正值求和得到自编码神经网络的损失;将边缘弱化图像输入至边缘强化模块,对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于自编码神经网络的图像边缘提取方法,其特征在于,该方法包括:
将原图像输入至自编码神经网络,输出边缘弱化图像;所述自编码神经网络的损失通过以下方式衡量:获取原图像与边缘弱化图像每个对应像素点的像素差异,根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数,利用边缘弱化系数对所述像素差异进行修正得到修正值,对所有像素点对应的修正值求和得到自编码神经网络的损失;
对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
2.根据权利要求1所述的一种基于自编码神经网络的图像边缘提取方法,其特征在于,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:
获取原图像上像素点各边缘方向上的梯度;根据梯度平均值与梯度最大值得到像素点的边缘弱化系数。
3.根据权利要求1所述的一种基于自编码神经网络的图像边缘提取方法,其特征在于,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:
获取原图像像素点在各边缘方向上梯度的最大值以及最大值对应的关联像素,根据像素点邻域内最大、最小像素的差异和像素点及其邻域内非关联像素的差异得到一致性指数;
根据像素点一致性指数及其对应的梯度的最大值计算像素点的独立边缘指数;
分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数;
根据像素点的独立边缘程度、行像素系数和列像素系数得到像素点对应的边缘弱化系数。
4.根据权利要求1所述的一种基于自编码神经网络的图像边缘提取方法,其特征在于,所述分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数包括:
分别对像素点同行像素、同列像素的独立边缘指数进行曲线拟合得到行变化曲线、列变化曲线;
根据行变化曲线的极大值点得到第一极值点分布中心,根据列变化曲线的极值点得到第二极值点分布中心;第一极值点分布中心将行变化曲线分为两侧,计算与像素点位于同侧的极值点到第一极值点分布中心的距离之和得到第一距离,第二极值点分布中心将列变化曲线分为两侧,计算与像素点位于同侧的极值点到第二极值点分布中心的距离之和得到第二距离;
根据像素点到第一极值点分布中心的距离和第一距离获得行像素系数;根据像素点到第二极值点分布中心的距离和第二距离获得列像素系数。
5.根据权利要求1所述的一种基于自编码神经网络的图像边缘提取方法,其特征在于,所述边缘强化系数根据每个像素点的边缘弱化系数获取。
6.一种基于自编码神经网络的图像边缘提取系统,其特征在于,该系统包括:
自编码神经网络模块,用于对原图像进行处理,输出边缘弱化图像;所述自编码神经网络模块的损失通过以下方式衡量:获取原图像与边缘弱化图像每个对应像素点的像素差异,根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数,利用边缘弱化系数对所述像素差异进行修正得到修正值,对所有像素点对应的修正值求和得到自编码神经网络的损失;
边缘强化处理模块,用于对原图像与边缘弱化图像进行差分得到差值图像,利用边缘强化系数对差值图像进行增强得到边缘强化图像。
7.根据权利要求6所述的一种基于自编码神经网络的图像边缘提取系统,其特征在于,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:
获取原图像上像素点各边缘方向上的梯度;根据梯度平均值与梯度最大值得到像素点的边缘弱化系数。
8.根据权利要求6所述的一种基于自编码神经网络的图像边缘提取系统,其特征在于,所述根据原图像上像素点在各边缘方向上的梯度得到每个像素点的边缘弱化系数包括:
获取原图像像素点在各边缘方向上梯度的最大值以及最大值对应的关联像素,根据像素点邻域内最大、最小像素的差异和像素点及其邻域内非关联像素的差异得到一致性指数;
根据像素点一致性指数及其对应的梯度的最大值计算像素点的独立边缘指数;
分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数;
根据像素点的独立边缘程度、行像素系数和列像素系数得到像素点对应的边缘弱化系数。
9.根据权利要求6所述的一种基于自编码神经网络的图像边缘提取系统,其特征在于,所述分别对像素点同行和同列像素的独立边缘指数处理得到行像素系数和列像素系数包括:
分别对像素点同行像素、同列像素的独立边缘指数进行曲线拟合得到行变化曲线、列变化曲线;
根据行变化曲线的极大值点得到第一极值点分布中心,根据列变化曲线的极值点得到第二极值点分布中心;第一极值点分布中心将行变化曲线分为两侧,计算与像素点位于同侧的极值点到第一极值点分布中心的距离之和得到第一距离,第二极值点分布中心将列变化曲线分为两侧,计算与像素点位于同侧的极值点到第二极值点分布中心的距离之和得到第二距离;
根据像素点到第一极值点分布中心的距离和第一距离获得行像素系数;根据像素点到第二极值点分布中心的距离和第二距离获得列像素系数。
10.根据权利要求6所述的一种基于自编码神经网络的图像边缘提取系统,其特征在于,所述边缘强化系数根据每个像素点的边缘弱化系数获取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210254460.1A CN114612489A (zh) | 2022-03-15 | 2022-03-15 | 一种基于自编码神经网络的图像边缘提取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210254460.1A CN114612489A (zh) | 2022-03-15 | 2022-03-15 | 一种基于自编码神经网络的图像边缘提取方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114612489A true CN114612489A (zh) | 2022-06-10 |
Family
ID=81863573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210254460.1A Withdrawn CN114612489A (zh) | 2022-03-15 | 2022-03-15 | 一种基于自编码神经网络的图像边缘提取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114612489A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114820615A (zh) * | 2022-06-29 | 2022-07-29 | 江苏优创生物医学科技有限公司 | 基于人工智能的骨科牵引辅助方法 |
CN115952316A (zh) * | 2023-03-10 | 2023-04-11 | 北京点聚信息技术有限公司 | 电子合同在线签约过程的数据记录存储方法 |
CN116523901A (zh) * | 2023-06-20 | 2023-08-01 | 东莞市京品精密模具有限公司 | 一种基于计算机视觉的冲切模具检测方法 |
-
2022
- 2022-03-15 CN CN202210254460.1A patent/CN114612489A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114820615A (zh) * | 2022-06-29 | 2022-07-29 | 江苏优创生物医学科技有限公司 | 基于人工智能的骨科牵引辅助方法 |
CN115952316A (zh) * | 2023-03-10 | 2023-04-11 | 北京点聚信息技术有限公司 | 电子合同在线签约过程的数据记录存储方法 |
CN116523901A (zh) * | 2023-06-20 | 2023-08-01 | 东莞市京品精密模具有限公司 | 一种基于计算机视觉的冲切模具检测方法 |
CN116523901B (zh) * | 2023-06-20 | 2023-09-19 | 东莞市京品精密模具有限公司 | 一种基于计算机视觉的冲切模具检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114612489A (zh) | 一种基于自编码神经网络的图像边缘提取方法及系统 | |
Babu et al. | Statistical features based optimized technique for copy move forgery detection | |
CN109635744B (zh) | 一种基于深度分割网络的车道线检测方法 | |
Jain et al. | Natural image denoising with convolutional networks | |
CN107729890B (zh) | 基于lbp和深度学习的人脸识别方法 | |
CN102663400B (zh) | 一种结合预处理的lbp特征提取方法 | |
Konwer et al. | Staff line removal using generative adversarial networks | |
CN113344933B (zh) | 一种基于多层次特征融合网络的腺体细胞分割方法 | |
Huang et al. | Extraction of vectorized graphical information from scientific chart images | |
CN1790374A (zh) | 一种基于模板匹配的人脸识别方法 | |
CN112070714A (zh) | 一种基于局部三元计数特征的翻拍图像检测方法 | |
Bahi et al. | A robust system for printed and handwritten character recognition of images obtained by camera phone | |
CN114419341B (zh) | 一种基于迁移学习改进的卷积神经网络图像识别方法 | |
Alshathri et al. | Denoising Letter Images from Scanned Invoices Using Stacked Autoencoders. | |
CN112435186B (zh) | 一种基于双规则矩阵方向场的指纹图像增强方法 | |
CN111753842B (zh) | 票据文本区域检测方法及装置 | |
Ulu et al. | MLFAN: Multilevel Feature Attention Network With Texture Prior for Image Denoising | |
Fan et al. | New network based on D-LinkNet and ResNeXt for high resolution satellite imagery road extraction | |
CN113269788A (zh) | 一种x射线透视图像下基于深度分割网络和最短路径算法的导丝分割方法 | |
CN117727059B (zh) | 汽车金融发票信息核验方法、装置、电子设备及存储介质 | |
Antony et al. | Segmentation and recognition of characters on Tulu palm leaf manuscripts | |
Psaila et al. | Image matching using enhancement offsets with adaptive parameter selection via histogram analysis | |
Ho et al. | Nom document background removal using generative adversarial network | |
Zhang et al. | A lightweight CNN based information fusion for image denoising | |
Ramteke et al. | Noise reduction in urdu document image–spatial and frequency domain approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220610 |
|
WW01 | Invention patent application withdrawn after publication |