CN116543001A - 彩色图像边缘检测方法及装置、设备、存储介质 - Google Patents
彩色图像边缘检测方法及装置、设备、存储介质 Download PDFInfo
- Publication number
- CN116543001A CN116543001A CN202310615417.8A CN202310615417A CN116543001A CN 116543001 A CN116543001 A CN 116543001A CN 202310615417 A CN202310615417 A CN 202310615417A CN 116543001 A CN116543001 A CN 116543001A
- Authority
- CN
- China
- Prior art keywords
- edge
- edge detection
- pixel point
- training
- color image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003708 edge detection Methods 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 89
- 238000012549 training Methods 0.000 claims abstract description 72
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 238000012884 algebraic function Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 abstract description 19
- 238000012545 processing Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 108010001267 Protein Subunits Proteins 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明属于图像处理技术领域,公开了一种彩色图像边缘检测方法,通过利用Clifford代数函数计算候选彩色图的各个像素点的第一特征向量,根据第一特征向量判断各个像素点是否为边缘样本点,确定对应的边缘标签图,将各个候选彩色图的第一特征向量及边缘标签图输入误差反向传播神经网络进行训练获得边缘检测模型;在对未知的彩色图进行预测时,利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量输入模型进行边缘提取,其中第一特征向量和第二特征向量均包括十二个特征值,也即使用Clifford代数可以描述更高维的数据特征,因此提取的边缘信息更丰富,抗噪声性能好,可以提高识别准确性,同时可以降低计算耗时。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种彩色图像边缘检测方法及装置、设备、存储介质。
背景技术
图像是最直接的视觉信息,包含了最原始的海量数据,其中边缘是图像最基本的特征,代表了图像的大部分信息,包括有价值的目标边界信息。它在人工智能、模式识别与分类、故障检测等领域有着重要的应用。图像边缘检测通常有经典的基于微分、基于小波与小波包变换、基于数学形态学,以及近年来发展的基于模糊学、基于神经网络、基于遗传算法、基于多尺度等多种图像边缘检测方法。
大部分现有的边缘检测方法是基于灰度图像进行处理,都是用灰度图像边缘检测方法分别检测RGB三幅分量图像的边缘,再合成这三幅边缘图像作为原图像的边缘,这样容易丢失大量的由色度变化引起的边缘信息。然而,彩色图像比灰度图像所包含的信息更丰富,所以直接对彩色图像进行边缘检测,获取到的边缘信息会更多,精度更高。
神经网络所具有的自组织性、自学习性以及自适应性决定了神经网络用于边缘检测的可行性。因此现有技术中也有提出一些采用神经网络进行彩色图像边缘检测的方法。但由于神经网络是通过样本进行学习的,样本选择的合理与否极大程度地决定了神经网络性能的好坏,因此泛化能力较低,识别准确性不高。而且神经网络通过卷积操作提取图像特征,所耗费的计算时间较长,对运行平台的配置要求较高。
发明内容
本发明的目的在于提供一种彩色图像边缘检测方法及装置、设备、存储介质,可以提高识别准确性,同时降低计算耗时。
本发明第一方面公开一种彩色图像边缘检测方法,包括:
利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量;
根据所述第一特征向量,判断各个像素点是否为边缘样本点;
根据所述边缘样本点,确定各个候选彩色图对应的边缘标签图;
将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型;
利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,所述第一特征向量和所述第二特征向量分别包括十二个特征值;
将所述第二特征向量输入所述目标边缘检测模型,获得所述待处理彩色图的边缘提取结果。
在一些实施例中,根据所述第一特征向量,判断各个像素点是否为边缘样本点,包括:
判断各个像素点的第一特征向量中各个特征值是否小于指定阈值;
若像素点的第一特征向量中各个特征值均小于指定阈值,判定该像素点并非边缘样本点;
若像素点的第一特征向量中各个特征值未均小于指定阈值,判定该像素点为边缘样本点。
在一些实施例中,将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型,包括:
将多个候选彩色图划分得到训练集和测试集;
将所述训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,直至满足第一收敛条件,获得初始边缘检测模型;
将所述测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入所述初始边缘检测模型进行训练,直至满足第二收敛条件,获得目标边缘检测模型。
在一些实施例中,将所述训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练之后,所述方法还包括:
计算误差反向传播神经网络输出的第一预测图像与相应的边缘标签图之间的第一误差值;
若所述第一误差值收敛至第一设定阈值时,判定满足第一收敛条件。
在一些实施例中,将所述测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入所述初始边缘检测模型进行训练之后,所述方法还包括:
计算初始边缘检测模型输出的第二预测图像与相应的边缘标签图之间的第二误差值;
若所述第二误差值收敛至第二设定阈值时,判定满足第二收敛条件。
本发明第二方面公开一种彩色图像边缘检测装置,包括:
第一计算单元,用于利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量;
判断单元,用于根据所述第一特征向量,判断各个像素点是否为边缘样本点;
标注单元,用于根据所述边缘样本点,确定各个候选彩色图对应的边缘标签图;
训练单元,用于将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型;
第二计算单元,用于利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,所述第一特征向量和所述第二特征向量分别包括十二个特征值;
检测单元,用于将所述第二特征向量输入所述目标边缘检测模型,获得所述待处理彩色图的边缘提取结果。
在一些实施例中,所述训练单元包括:
划分子单元,用于将多个候选彩色图划分得到训练集和测试集;
记忆训练子单元,用于将所述训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,直至满足第一收敛条件,获得初始边缘检测模型;
学习收敛子单元,用于将所述测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入所述初始边缘检测模型进行训练,直至满足第二收敛条件,获得目标边缘检测模型。
本发明第三方面公开一种电子设备,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行第一方面公开的彩色图像边缘检测方法。
本发明第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行第一方面公开的彩色图像边缘检测方法。
本发明的有益效果在于,所提供的彩色图像边缘检测方法及装置、设备、存储介质,通过利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量,根据第一特征向量判断各个像素点是否为边缘样本点,然后确定各个候选彩色图对应的边缘标签图,将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型;在对未知的待处理彩色图进行预测时,利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,第一特征向量和第二特征向量分别包括十二个特征值,将第二特征向量输入目标边缘检测模型,获得待处理彩色图的边缘提取结果,从而使用Clifford代数可以描述更高维的数据特征,因此提取的边缘信息更丰富,抗噪声性能好,可以提高识别准确性,同时无需通过网络卷积操作提取特征,可以较大幅度的降低计算耗时。
附图说明
此处的附图,示出了本发明所述技术方案的具体实例,并与具体实施方式构成说明书的一部分,用于解释本发明的技术方案、原理及效果。
除非特别说明或另有定义,不同附图中,相同的附图标记代表相同或相似的技术特征,对于相同或相似的技术特征,也可能会采用不同的附图标记进行表示。
图1是本发明实施例公开的一种彩色图像边缘检测方法的流程图;
图2是本发明实施例公开的像素点Clifford特征向量构成的三维模板;
图3是本发明实施例公开的一种彩色图像边缘检测装置的结构示意图;
图4是本发明实施例公开的一种电子设备的结构示意图。
附图标记说明:
301、第一计算单元;302、判断单元;303、标注单元;304、训练单元;305、第二计算单元;306、检测单元;401、存储器;402、处理器。
具体实施方式
为了便于理解本发明,下面将参照说明书附图对本发明的具体实施例进行更详细的描述。
除非特别说明或另有定义,本文所使用的所有技术和科学术语与所属技术领域的技术人员通常理解的含义相同。在结合本发明的技术方案以现实的场景的情况下,本文所使用的所有技术和科学术语也可以具有与实现本发明的技术方案的目的相对应的含义。本文所使用的“第一、第二…”仅仅是用于对名称的区分,不代表具体的数量或顺序。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
需要说明的是,当元件被认为“固定于”另一个元件,它可以是直接固定在另一个元件上,也可以是存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件,也可以是同时存在居中元件;当一个元件被认为是“安装在”另一个元件,它可以是直接安装在另一个元件,也可以是同时存在居中元件。当一个元件被认为是“设在”另一个元件,它可以是直接设在另一个元件,也可以是同时存在居中元件。
除非特别说明或另有定义,本文所使用的“所述”、“该”为相应位置之前所提及或描述的技术特征或技术内容,该技术特征或技术内容与其所提及的技术特征或技术内容可以是相同的,也可以是相似的。此外,本文所使用的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
如图1所示,本发明实施例公开一种彩色图像边缘检测方法。该方法的执行主体可为如计算机电脑、笔记本电脑、平板电脑等电子设备,或内嵌于电子设备中的彩色图像边缘检测装置,本发明对此不作限定。在本实施例中,该方法包括以下步骤110~160:
110、利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量。
首先获取与实际应用中待提取边缘的彩色图像色彩轮廓相当的图像作为训练样本图,即候选彩色图。然后为候选彩色图中的每个像素点构建一个Clifford代数函数,再根据Clifford代数函数的解析性,计算出各个像素点的十二个特征值,获得各个像素点的第一特征向量。
在为候选彩色图中的每个像素点构建一个Clifford代数函数的过程中,假设(e1,e2,…en)是实数域R上的线性空间的一组正交基,Clifford代数An是由(e1,e2,…en)张成的结合代数,满足:
i=1,2,...n.eiej=-ejei,1≤i≠j≤n。
An中的元素称为Clifford数,任意元素x∈An,元素x具有形式:
x=λ0+∑λAeA;A=(h1,...,hp),1≤h1<…<hp≤n,1≤p≤n,xA∈R。
显然,An是2n维的结合但非交换的代数。
若Clifford数x具有形式则x称为一个Clifford向量。对任意的x∈An,x的Clifford模定义为/>特别地,Clifford向量x的模是/>
设Ω是Rn中的连通开集,定义:设f∈C∞(Ω,An),如果则称f是在Ω集合上的左Clifford解析函数,其中/>其中,n代表维度,ei代表了Clifford代数正交基中的各个基元,xi代表了函数f中的各个变量。
因此,可以定义像素点的Clifford函数,即十二维向量空间的向量函数f(x)=f1e1+f2e2+f3e3+f4e4+f5e5+f6e6+f7e7+f8e8+f9e9+f10e10+f11e11+f12e12
其中,f1,f2,…f12分别对应像素点前、后两个邻域点的R,G,B,H,S,I六个分量值,同时作为向量函数虚部e1,e2,…e12上对应的数值。而x1,x2,…x12分别对应像素点的前、后、左、右、上、下、上左、下右、上上、下下、上上右、下下左十二个方向的邻域点的坐标值。像素点的十二邻域如图2所示。
由左Clifford解析函数的定义有展开可得:
其中,分别代表向量函数f(x)对各个像素点坐标分量(x1,x2,…x12)的偏导数。
将上面中得到的公式改写成:展开可得如下12个特征值:
因此在步骤110中,具体根据上述a1~a12的公式计算出第一特征向量包括的十二个特征值。为了逐一获取各个候选彩色图的边缘标签图,需要对候选彩色图进行边缘提取,可以采用人工描绘的方式进行标签标注,或者,也可以根据第一特征向量进行边缘提取,例如本发明实施例中所执行的步骤120~130。
120、根据第一特征向量,判断各个像素点是否为边缘样本点。
考虑到实际图像的解析性不会都完全符合上面公式,根据Clifford代数的解析性定理,可以使用恰当的指定阈值T来判断该像素点是否满足解析性。作为一种可选的实施方式,步骤120可以包括以下步骤1201~1203:
1201、判断各个像素点的第一特征向量中各个特征值是否小于指定阈值。若是,执行步骤1202;否则,执行步骤1203。
其中,可以设定指定阈值T=0.4。若第一特征向量中的12个特征值均小于T,则认为该像素点为非边缘点,反之,则视该像素点为边缘点。
1202、若像素点的第一特征向量中各个特征值均小于指定阈值,判定该像素点并非边缘样本点。
1203、若像素点的第一特征向量中各个特征值未均小于指定阈值,判定该像素点为边缘样本点。
其中,各个特征值未均小于指定阈值的情况指的是存在至少一个特征值不小于指定阈值。
130、根据边缘样本点,确定各个候选彩色图对应的边缘标签图。
最后遍历候选彩色图的所有像素点之后,将判定为边缘样本点的像素点组合可获得该候选彩色图对应的边缘标签图。
140、将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型。
作为一种可选的实施方式,步骤140可以包括以下步骤1401~1403:
1401、将多个候选彩色图划分得到训练集和测试集。
其中,可以按照80%、20%的比例划分得到训练集和测试集。在训练集中包括80%数量的候选彩色图及每个候选彩色图对应的边缘标签图,在测试集中包括20%数量的候选彩色图及每个候选彩色图对应的边缘标签图。或者,也可以按照70%、30%的比例划分得到训练集和测试集。
1402、将训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,直至满足第一收敛条件,获得初始边缘检测模型。
将训练集中包括的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播(BackPropagation,BP)神经网络,通过BP神经网络的自学习能力对这些数据进行分类记忆训练,以学习得到模型参数(包括权值和阈值),从而获得初始边缘检测模型。
由于输入的有12个特征值,在本发明实施例中,BP神经网络包括依次连接的输入层、隐含层和输出层,整体采用的是12*10*2的结构,也即,BP神经网络的输入层有12个节点,隐含层的单元数设为10,最后输出层有2个节点,输出的结果为二值化图。另外优选的,输入层的传递函数采用的是Tan-Sigmoid函数,输出层的传递函数采用的是Log-Sigmoid函数,隐含层的激活函数采用的是S型的Sigmoid函数,BP神经网络采用L-M(Levenberg-Marquardt)优化算法进行优化训练。
在利用训练集进行记忆训练过程中,将训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练之后,计算BP神经网络输出的第一预测图像与相应的边缘标签图之间的第一误差值,若第一误差值收敛至第一设定阈值时,判定满足第一收敛条件。
1403、将测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入初始边缘检测模型进行训练,直至满足第二收敛条件,获得目标边缘检测模型。
步骤1403中,将测试集中的候选彩色图的各个像素点的十二个特征值输入初始边缘检测模型,进行学习收敛。
在利用测试集进行学习收敛过程中,将测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入初始边缘检测模型进行训练之后,每输入一个候选彩色图,初始边缘检测模型进行预测输出对应的第二预测图像,然后计算初始边缘检测模型输出的第二预测图像与相应的边缘标签图之间的第二误差值,直至若第二误差值收敛至第二设定阈值时,判定满足第二收敛条件。
其中,第一设定阈值和第二设定阈值可以是相同的数值,也可以是不同的数值,优选的,可同样设置为0.001。
150、利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,第一特征向量和第二特征向量分别包括十二个特征值。
在收敛优化获得目标边缘检测模型之后,可对未知的样本,即待处理彩色图进行边缘提取。首先也是同样的计算待处理彩色图的各个像素点的第二特征向量,通过BP神经网络的泛化能力来识别各个像素点是否为边缘点,从而定位待处理彩色图的边缘线,即获得边缘提取结果。
160、将第二特征向量输入目标边缘检测模型,获得待处理彩色图的边缘提取结果。
可见,实施本发明实施例,针对传统神经网络模型网络训练时间过长,对运行平台的配置要求较高的不足之处,本发明以Clifford代数这一高维数学理论为基础,构造合适的高维向量来提取边缘特征,并将得到的特征结合具有良好特点的自适应学习性的BP神经网络,来进行训练学习,最终提取出边缘信息,结果更精细、更快速、更自动化。
此外,采用Clifford代数的解析性结合BP神经网络进行彩色图像边缘检测,可以基于彩色图像的RGB、HSI分量值建立多维向量特征值,可以利用Clifford代数解析函数特征将图像的各分量联系的、系统的综合起来进行考虑和处理,较之与将图像各分量视作是独立的、分开的,更适合提高计算机视觉和获得良好效果。相对于传统的灰度图像边缘检测方法而言,能够提取到更丰富的边缘信息封闭性好、连续且细节丰富,效果更好。而且,泛化能力强,识别率高,对边缘轮廓较明显和不太明显的图像均能获得较满意的结果。
当然也可以使用四元数、八元数、Stein-Weiss函数等其他高维数学工具进行特征向量表示。但是由于四元数、八元数只可以处理八维以下的特征数据,而Clifford代数则可以处理任意高维的特征数据,所以可以尝试更多方向,更多维度来进行提取彩色图像边缘。虽然Stein-Weiss函数也同样可以表示更多维度,但是该函数的解析函数条件比Clifford代数更多,导致同维度的邻域情况下,产生的特征向量会更多,因此在提取细节差不多的情况下,会较大程度的影响提取效率。综上,采取本发明提出的利用Clifford代数的解析性结合BP神经网络进行彩色图像边缘检测的方法,可以更好的协调计算简单耗时少、较好解决边缘检测精度与抗噪声性能等问题。
为了验证本发明实施例中的目标边缘检测模型的效果,本发明进行实验结果分析。在传统的边缘检测方法中,绝大多数的滤波器都将被判断的像素点与其周围的像素点的关系处理成1个特征值,仅仅通过考察该特征值是否超过阈值来判断该点是否为边缘点。而高维数学工具的出现,则可以将被判断的像素点与其周围的像素点的关系处理成4、8、12、16甚至任意数目,运用多个数目的特征值对每个被判断的像素点进行解析性质特征的刻画;再在训练阶段通过BP神经网络的自学习能力对该系列特征值的分类进行学习;最后通过BP神经网络的泛化能力获取测试图像的边缘。但传统BP神经网络通过卷积操作提取图像特征,所耗费的计算时间较长,且识别准确性不高。
以下实验将本发明提出的彩色图像边缘检测方法分别与利用传统BP神经网络进行图像边缘提取的方法进行对比。
为了客观评价本发明所提出方法的边缘检测效果,使用人工边缘提取结果作为边缘检测评价的金标准,将实验数据运用上述两种方法分别计算出彩色图像边缘检测效果的敏感度和特异度,具体评价参数说明如表1所示:
表1边缘检测结果评价参数
其中,TP代表检测出边缘结果中的真边缘数量、FP代表检测出边缘结果中的非边缘数量、FN代表检测非边缘部分中的真边缘数量、TN代表检测非边缘部分中的非边缘数量。
同时记录下各种方法各自所用的时间,最终测试结果如表2所示。
表2各种方法的平均运行时间
由上述实验结果表2数据可以看出,相对于传统BP神经网络检测方法而言,本发明所提出的边缘检测方法所使用的Clifford代数可以描述更高维(十二维)的数据特征,因此输入的特征值更多,提取出来的边缘封闭性更好、连续且细节更丰富,敏感度和特异度都要更高,效果较好。而且相比传统BP神经网络方法,所耗费的时间更是节省了接近一半的时间。所以从边缘提取效果和运行时间综合考虑的情况下,本发明提出的彩色图像边缘检测模型具有很高的检测精度和运行效率。
如图3所示,本发明实施例公开一种彩色图像边缘检测装置,包括第一计算单元301、判断单元302、标注单元303、训练单元304、第二计算单元305、检测单元306,其中,
第一计算单元301,用于利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量;
判断单元302,用于根据第一特征向量,判断各个像素点是否为边缘样本点;
标注单元303,用于根据边缘样本点,确定各个候选彩色图对应的边缘标签图;
训练单元304,用于将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型;
第二计算单元305,用于利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,第一特征向量和第二特征向量分别包括十二个特征值;
检测单元306,用于将第二特征向量输入目标边缘检测模型,获得待处理彩色图的边缘提取结果。
在一些实施例中,上述彩色图像边缘检测装置中,判断单元302,具体用于判断各个像素点的第一特征向量中各个特征值是否小于指定阈值;若像素点的第一特征向量中各个特征值均小于指定阈值,判定该像素点并非边缘样本点;若像素点的第一特征向量中各个特征值未均小于指定阈值,判定该像素点为边缘样本点。
在一些实施例中,上述训练单元304可以包括以下未图示的子单元:
划分子单元,用于将多个候选彩色图划分得到训练集和测试集;
记忆训练子单元,用于将训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,直至满足第一收敛条件,获得初始边缘检测模型;
学习收敛子单元,用于将测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入初始边缘检测模型进行训练,直至满足第二收敛条件,获得目标边缘检测模型。
在一些实施例中,上述训练单元304还包括以下未图示的子单元:
第一逆传播子单元,用于在记忆训练子单元将训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练之后,计算误差反向传播神经网络输出的第一预测图像与相应的边缘标签图之间的第一误差值;若第一误差值收敛至第一设定阈值时,判定满足第一收敛条件。
在一些实施例中,上述训练单元304还包括以下未图示的子单元:
第二逆传播子单元,用于在学习收敛子单元将测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入初始边缘检测模型进行训练之后,计算初始边缘检测模型输出的第二预测图像与相应的边缘标签图之间的第二误差值;若第二误差值收敛至第二设定阈值时,判定满足第二收敛条件。
如图4所示,本发明实施例公开一种电子设备,包括存储有可执行程序代码的存储器401以及与存储器401耦合的处理器402;
其中,处理器402调用存储器401中存储的可执行程序代码,执行上述各实施例中描述的彩色图像边缘检测方法。
本发明实施例还公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行上述各实施例中描述的彩色图像边缘检测方法。
以上实施例的目的,是对本发明的技术方案进行示例性的再现与推导,并以此完整的描述本发明的技术方案、目的及效果,其目的是使公众对本发明的公开内容的理解更加透彻、全面,并不以此限定本发明的保护范围。
以上实施例也并非是基于本发明的穷尽性列举,在此之外,还可以存在多个未列出的其他实施方式。在不违反本发明构思的基础上所作的任何替换与改进,均属本发明的保护范围。
Claims (10)
1.彩色图像边缘检测方法,其特征在于,包括:
利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量;
根据所述第一特征向量,判断各个像素点是否为边缘样本点;
根据所述边缘样本点,确定各个候选彩色图对应的边缘标签图;
将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型;
利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,所述第一特征向量和所述第二特征向量分别包括十二个特征值;
将所述第二特征向量输入所述目标边缘检测模型,获得所述待处理彩色图的边缘提取结果。
2.如权利要求1所述的彩色图像边缘检测方法,其特征在于,根据所述第一特征向量,判断各个像素点是否为边缘样本点,包括:
判断各个像素点的第一特征向量中各个特征值是否小于指定阈值;
若像素点的第一特征向量中各个特征值均小于指定阈值,判定该像素点并非边缘样本点;
若像素点的第一特征向量中各个特征值未均小于指定阈值,判定该像素点为边缘样本点。
3.如权利要求2所述的彩色图像边缘检测方法,其特征在于,将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型,包括:
将多个候选彩色图划分得到训练集和测试集;
将所述训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,直至满足第一收敛条件,获得初始边缘检测模型;
将所述测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入所述初始边缘检测模型进行训练,直至满足第二收敛条件,获得目标边缘检测模型。
4.如权利要求3所述的彩色图像边缘检测方法,其特征在于,将所述训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练之后,所述方法还包括:
计算误差反向传播神经网络输出的第一预测图像与相应的边缘标签图之间的第一误差值;
若所述第一误差值收敛至第一设定阈值时,判定满足第一收敛条件。
5.如权利要求3所述的彩色图像边缘检测方法,其特征在于,将所述测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入所述初始边缘检测模型进行训练之后,所述方法还包括:
计算初始边缘检测模型输出的第二预测图像与相应的边缘标签图之间的第二误差值;
若所述第二误差值收敛至第二设定阈值时,判定满足第二收敛条件。
6.彩色图像边缘检测装置,其特征在于,包括:
第一计算单元,用于利用Clifford代数函数计算多个候选彩色图的各个像素点的第一特征向量;
判断单元,用于根据所述第一特征向量,判断各个像素点是否为边缘样本点;
标注单元,用于根据所述边缘样本点,确定各个候选彩色图对应的边缘标签图;
训练单元,用于将各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,获得目标边缘检测模型;
第二计算单元,用于利用Clifford代数函数计算待处理彩色图的各个像素点的第二特征向量,所述第一特征向量和所述第二特征向量分别包括十二个特征值;
检测单元,用于将所述第二特征向量输入所述目标边缘检测模型,获得所述待处理彩色图的边缘提取结果。
7.如权利要求6所述的彩色图像边缘检测装置,其特征在于,
所述判断单元,具体用于判断各个像素点的第一特征向量中各个特征值是否小于指定阈值;若像素点的第一特征向量中各个特征值均小于指定阈值,判定该像素点并非边缘样本点;若像素点的第一特征向量中各个特征值未均小于指定阈值,判定该像素点为边缘样本点。
8.如权利要求6所述的彩色图像边缘检测装置,其特征在于,所述训练单元包括:
划分子单元,用于将多个候选彩色图划分得到训练集和测试集;
记忆训练子单元,用于将所述训练集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入误差反向传播神经网络进行训练,直至满足第一收敛条件,获得初始边缘检测模型;
学习收敛子单元,用于将所述测试集中的各个候选彩色图的各个像素点的第一特征向量及对应的边缘标签图输入所述初始边缘检测模型进行训练,直至满足第二收敛条件,获得目标边缘检测模型。
9.电子设备,其特征在于,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至5任一项所述的彩色图像边缘检测方法。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至5任一项所述的彩色图像边缘检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310615417.8A CN116543001B (zh) | 2023-05-26 | 2023-05-26 | 彩色图像边缘检测方法及装置、设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310615417.8A CN116543001B (zh) | 2023-05-26 | 2023-05-26 | 彩色图像边缘检测方法及装置、设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116543001A true CN116543001A (zh) | 2023-08-04 |
CN116543001B CN116543001B (zh) | 2024-01-12 |
Family
ID=87452361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310615417.8A Active CN116543001B (zh) | 2023-05-26 | 2023-05-26 | 彩色图像边缘检测方法及装置、设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116543001B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117474742A (zh) * | 2023-11-22 | 2024-01-30 | 广州工程技术职业学院 | 彩色图像数字水印方法、系统、设备及存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060120580A1 (en) * | 2002-09-04 | 2006-06-08 | Sherif Makram-Ebeid | Characterizing, surfaces in medical imaging |
CN103150722A (zh) * | 2013-01-17 | 2013-06-12 | 东南大学 | 应用四元数分割与图论优化的外周血白细胞边缘提取方法 |
CN103714336A (zh) * | 2012-10-08 | 2014-04-09 | 陈建成 | 基于八元数和回声状态网络的织物图像边缘检测方法 |
CN105069456A (zh) * | 2015-07-30 | 2015-11-18 | 北京邮电大学 | 一种车牌字符分割方法及装置 |
CN105701857A (zh) * | 2014-12-10 | 2016-06-22 | 达索系统公司 | 3d建模的对象的纹理化 |
US20160295243A1 (en) * | 2015-03-31 | 2016-10-06 | Nxgen Partners Ip, Llc | Compression of signals, images and video for multimedia, communications and other applications |
CN106251359A (zh) * | 2016-08-09 | 2016-12-21 | 南通大学 | 基于Clifford代数几何相对不变量的3D图像配准方法 |
CN107818579A (zh) * | 2017-09-20 | 2018-03-20 | 东北电力大学 | 基于四元数Gabor滤波的彩色纹理特征提取方法 |
CN108960041A (zh) * | 2018-05-17 | 2018-12-07 | 首都师范大学 | 图像特征提取方法及装置 |
CN109447057A (zh) * | 2018-08-30 | 2019-03-08 | 深圳大学 | 图像特征识别方法、相关装置及存储介质 |
CN109949198A (zh) * | 2019-02-22 | 2019-06-28 | 中国农业机械化科学研究院 | 一种麦田边界检测装置和检测方法 |
CN110443205A (zh) * | 2019-08-07 | 2019-11-12 | 北京华捷艾米科技有限公司 | 一种手部图像分割方法及装置 |
WO2020088588A1 (zh) * | 2018-11-01 | 2020-05-07 | 长沙小钴科技有限公司 | 一种基于深度学习的静态三维人脸活体检测方法 |
WO2020164468A1 (zh) * | 2019-02-15 | 2020-08-20 | 腾讯科技(深圳)有限公司 | 医学图像分割方法、图像分割方法及相关装置、系统 |
US20220092351A1 (en) * | 2019-05-30 | 2022-03-24 | Huawei Technologies Co., Ltd. | Image classification method, neural network training method, and apparatus |
US11361507B1 (en) * | 2021-03-03 | 2022-06-14 | Nvidia Corporation | Articulated body mesh estimation using three-dimensional (3D) body keypoints |
-
2023
- 2023-05-26 CN CN202310615417.8A patent/CN116543001B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060120580A1 (en) * | 2002-09-04 | 2006-06-08 | Sherif Makram-Ebeid | Characterizing, surfaces in medical imaging |
CN103714336A (zh) * | 2012-10-08 | 2014-04-09 | 陈建成 | 基于八元数和回声状态网络的织物图像边缘检测方法 |
CN103150722A (zh) * | 2013-01-17 | 2013-06-12 | 东南大学 | 应用四元数分割与图论优化的外周血白细胞边缘提取方法 |
CN105701857A (zh) * | 2014-12-10 | 2016-06-22 | 达索系统公司 | 3d建模的对象的纹理化 |
US20160295243A1 (en) * | 2015-03-31 | 2016-10-06 | Nxgen Partners Ip, Llc | Compression of signals, images and video for multimedia, communications and other applications |
CN105069456A (zh) * | 2015-07-30 | 2015-11-18 | 北京邮电大学 | 一种车牌字符分割方法及装置 |
CN106251359A (zh) * | 2016-08-09 | 2016-12-21 | 南通大学 | 基于Clifford代数几何相对不变量的3D图像配准方法 |
CN107818579A (zh) * | 2017-09-20 | 2018-03-20 | 东北电力大学 | 基于四元数Gabor滤波的彩色纹理特征提取方法 |
CN108960041A (zh) * | 2018-05-17 | 2018-12-07 | 首都师范大学 | 图像特征提取方法及装置 |
CN109447057A (zh) * | 2018-08-30 | 2019-03-08 | 深圳大学 | 图像特征识别方法、相关装置及存储介质 |
WO2020088588A1 (zh) * | 2018-11-01 | 2020-05-07 | 长沙小钴科技有限公司 | 一种基于深度学习的静态三维人脸活体检测方法 |
WO2020164468A1 (zh) * | 2019-02-15 | 2020-08-20 | 腾讯科技(深圳)有限公司 | 医学图像分割方法、图像分割方法及相关装置、系统 |
CN109949198A (zh) * | 2019-02-22 | 2019-06-28 | 中国农业机械化科学研究院 | 一种麦田边界检测装置和检测方法 |
US20220092351A1 (en) * | 2019-05-30 | 2022-03-24 | Huawei Technologies Co., Ltd. | Image classification method, neural network training method, and apparatus |
CN110443205A (zh) * | 2019-08-07 | 2019-11-12 | 北京华捷艾米科技有限公司 | 一种手部图像分割方法及装置 |
US11361507B1 (en) * | 2021-03-03 | 2022-06-14 | Nvidia Corporation | Articulated body mesh estimation using three-dimensional (3D) body keypoints |
Non-Patent Citations (11)
Title |
---|
JOHANNES BRANDSTETTER 等: "Clifford Neural Layers for PDE Modeling", ARXIV:2209.04934, pages 1 - 10 * |
U. A. BHATTI 等: "Advanced Color Edge Detection Using Clifford Algebra in Satellite Images", IEEE PHOTONICS JOURNAL, vol. 13, no. 2, pages 1 - 6 * |
YING CHEN等: "BP Neural Network Based on Simulated Annealing Algorithm Optimization for Financial Crisis Dynamic Early Warning Model", DOI:10.1155/2021/4034903, pages 1 - 5 * |
刘伟: "八元数及Clifford代数在数字图像处理中的应用", 万方, pages 1 - 46 * |
吴明珠 等: "基于Stein-Weiss函数的彩色掌纹特征识别算法", 计算机应用研究, vol. 37, no. 04, pages 1276 - 1280 * |
王再尚: "基于Markov随机场的木材表面缺陷模式识别方法的研究", 中国优秀硕士学位论文全文数据库 (信息科技辑), no. 2013, pages 138 - 1387 * |
王怡;涂宇;罗斐;何美生;: "彩色图像分割方法综述", 电脑知识与技术, no. 23, pages 189 - 190 * |
郭立强: "彩色图像处理的可交换Clifford代数方法", 中国光学, vol. 6, no. 6, pages 885 - 891 * |
钱萍: "基于对偶四元数的航天器交会对接位姿关键技术研究", 中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑), no. 2013, pages 031 - 177 * |
陈鹏光: "基于各类高维解析函数特征的BP网络及其应用", 万方, pages 1 - 37 * |
黄国恒 等: "基于八元数的彩色掌纹特征提取与识别算法", 计算机工程, vol. 38, no. 22, pages 28 - 33 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117474742A (zh) * | 2023-11-22 | 2024-01-30 | 广州工程技术职业学院 | 彩色图像数字水印方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116543001B (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
CN107330437B (zh) | 基于卷积神经网络目标实时检测模型的特征提取方法 | |
CN110852316B (zh) | 一种采用密集结构卷积网络的图像篡改检测和定位方法 | |
CN110533086B (zh) | 图像数据半自动标注方法 | |
CN106897673B (zh) | 一种基于retinex算法和卷积神经网络的行人再识别方法 | |
CN106023257B (zh) | 一种基于旋翼无人机平台的目标跟踪方法 | |
CN111739007B (zh) | 内窥镜图像识别方法、设备、存储介质及装置 | |
US8811725B2 (en) | Learning device, learning method, identification device, identification method, and program | |
CN116543001B (zh) | 彩色图像边缘检测方法及装置、设备、存储介质 | |
CN110415260B (zh) | 基于字典与bp神经网络的烟雾图像分割与识别方法 | |
CN113052185A (zh) | 一种基于Faster R-CNN的小样本目标检测方法 | |
CN107862680B (zh) | 一种基于相关滤波器的目标跟踪优化方法 | |
CN111667001A (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
CN110222705A (zh) | 一种网络模型的训练方法以及相关装置 | |
CN112183356A (zh) | 驾驶行为检测方法、设备及可读存储介质 | |
Bappy et al. | Real estate image classification | |
CN114429577B (zh) | 一种基于高置信标注策略的旗帜检测方法及系统及设备 | |
CN114821155A (zh) | 一种基于可变形nts-net神经网络的多标签分类方法及系统 | |
CN113221763A (zh) | 一种基于视频图像亮度的火焰识别方法 | |
CN113076876B (zh) | 一种基于三维结构监督和置信度加权的人脸欺骗检测方法和系统 | |
CN111310720A (zh) | 基于图度量学习的行人重识别方法及系统 | |
CN112330648A (zh) | 基于半监督学习的无参考图像质量评价方法及装置 | |
CN108256578B (zh) | 一种灰度图像的识别方法、装置、设备及可读存储介质 | |
CN115620083A (zh) | 模型训练方法、人脸图像质量评价方法、设备及介质 | |
CN111582057B (zh) | 一种基于局部感受野的人脸验证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20230804 Assignee: Guangzhou Jingsheng Technology Co.,Ltd. Assignor: GUANGZHOU INSTITUTE OF TECHNOLOGY Contract record no.: X2024980005523 Denomination of invention: Color image edge detection method, device, device, and storage medium Granted publication date: 20240112 License type: Common License Record date: 20240510 |
|
EE01 | Entry into force of recordation of patent licensing contract |