CN112215849A - 一种基于色彩空间的图像无监督分割优化方法 - Google Patents
一种基于色彩空间的图像无监督分割优化方法 Download PDFInfo
- Publication number
- CN112215849A CN112215849A CN202011196798.3A CN202011196798A CN112215849A CN 112215849 A CN112215849 A CN 112215849A CN 202011196798 A CN202011196798 A CN 202011196798A CN 112215849 A CN112215849 A CN 112215849A
- Authority
- CN
- China
- Prior art keywords
- training
- network
- accuracy
- color space
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000011218 segmentation Effects 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 89
- 238000013528 artificial neural network Methods 0.000 claims abstract description 31
- 210000002569 neuron Anatomy 0.000 claims description 28
- 238000011156 evaluation Methods 0.000 claims description 18
- 230000001965 increasing effect Effects 0.000 claims description 11
- 230000003247 decreasing effect Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 abstract description 5
- 230000010355 oscillation Effects 0.000 abstract description 4
- 230000001174 ascending effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000003709 image segmentation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及计算机视觉技术领域,尤其涉及一种基于色彩空间的图像无监督分割优化方法,包括定义颜色参考点、采集色彩空间序列、生成标签数据、样本类别以及批次划分,通过第一、第二神经网络进行优化训练获取最优网络参数;解决了基于颜色域来执行分割具有很强的通用性,但其算法复杂度高、推理速度慢的问题;本发明实现了基于样本批次准确率上升或下降数量动态调节样本批次,使得在促进网络优化的同时,避免网络陷入局部最优解,减少优化过程出现大幅度震荡;相比于现有技术,本发明的网络时间复杂度低,且可进行大批次的网络推理,大大提高了分割效率,减少神经网络的训练时间,节约成本。
Description
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于色彩空间的图像无监督分割优化方法。
背景技术
随着机器学习的发展,无监督学习方法的精度越来越高,相比于监督学习方法,无监督学习无需标注标签,通常以某些特定规则实施,其中,基于颜色域来执行分割具有很强的通用性,但是,其存在算法复杂度高、推理速度慢的问题。
目前,神经网络训练过程和推断过程对于网络计算的加速都有着较为迫切的需求,且神经网络在隐藏层神经元数目的选择和优化问题上没有一个确定性的理论指导,难以获得速度与准确率兼顾的最佳神经网络拓扑结构。
发明内容
本发明提供一种基于色彩空间的图像无监督分割优化方法,解决的技术问题是,基于颜色域来执行分割具有很强的通用性,但其算法复杂度高、推理速度慢。
为解决以上技术问题,本发明提供了一种基于色彩空间的图像无监督分割优化方法,包括以下步骤:
S1.通过调色板定义颜色参考点,采集色彩空间序列,并利用最近邻搜索生成标签数据;
S2.将属于每个所述颜色参考点的所述色彩空间序列划分为同一类别,并初始化网络参数以及训练周期数;
S3.对于每一类别,动态调整样本批次,划分得到属于同一类别的训练样本数据;
S4.将所述训练样本数据以及所述标签数据输入第一神经网络中训练,得到颜色索引概率,并将所述颜色索引概率进行转换处理,得到训练索引;
S5.根据所述训练索引以及当前的网络参数,获取新的网络参数,具体包括:
S51.根据所述标签数据以及所述训练索引,获取所述训练样本数据的准确率;
S52.统计设定周期内,每个周期当前所述训练样本数据的准确率,并计算所述设定周期内的准确率平均增量;
S53.将所述准确率平均增量与预设的增量阈值对比,若所述准确率平均增量小于所述增量阈值,则根据第一模型获取新的网络参数;
S6.将所述新网络参数用于下一批次的所述训练样本数据的训练,重复所述S4~S6步骤,直至所有类别训练结束;
S7.将所有所述网络参数输入第二神经网络训练,输出对应的预测评价指标,将所述预测评价指标输入第二模型,以获取最优网络参数。
进一步地,在所述步骤S3中,若当前的所述训练样本数据是第一个输入的训练样本,则初始化其样本批次;若否,则动态调整样本批次,具体为:
根据所述准确率,获取在所述设定周期内,当前所述训练样本数据的准确率上升次数以及准确率下降次数;
将所述准确率上升次数、所述准确率下降次数以及当前所述训练样本数据的数量输入样本批次模型中,获取下一批次所述训练样本数据的数量。
进一步地,在所述步骤S43中,若所述准确率平均增量大于所述增量阈值,则冻结此隐藏层的权重,然后对下一隐藏层进行神经元数量寻优,直至所有隐藏层训练结束。
更进一步地,所述第一模型为:
O=S+round(Z)+b
式中,O表示新的网络参数,S表示当前的网络参数,round表示取整函数,Z表示所述准确率平均增量,b为常数项。
进一步地,在所述步骤S5中,选取所述第二模型输出的最大的参数评价值,将其对应的所述网络参数作为最优网络参数。
其中,所述网络参数为所述第一神经网络的隐藏层神经元数量序列。
进一步地,所述样本批次为所述训练样本数据一次输入所述第一神经网络训练的数量。
更进一步地,所述第一神经网络、所述第二神经网络均采用全连接网络基础架构。
本发明提供了一种基于色彩空间的图像无监督分割优化方法,包括样本批次、隐藏层神经元数量的优化,同时通过第二神经网络进行网络优化,从而筛选出速度与准确率兼顾的网络参数,降低了陷入局部最优解的概率,解决了基于颜色域来执行分割具有很强的通用性,但其算法复杂度高、推理速度慢的问题,实现了通用性强,且只需基于色彩空间即可进行分割,推理速度快的效果,相比于现有技术,本发明的网络时间复杂度低,且在计算资源充足的情况下,全连接网络可进行大批次推理,即实现图像分割的速度更快,节约了时间以及成本。
附图说明
图1是本发明实施例提供的一种基于色彩空间的图像无监督分割优化方法的流程示意图;
图2是本发明实施例提供的40个颜色参考点的最优网络参数示意图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
针对基于颜色域来执行分割具有很强的通用性,但其算法复杂度高、推理速度慢低的问题,本发明实施例提供了一种基于色彩空间的图像无监督分割优化方法,其中,所述色彩空间有很多,比如RGB、HSV等,本发明实施例均适用,但是,为了方便说明,本实施例以RGB空间进行示例说明;如图1所示,包括以下步骤:
S1.通过调色板定义颜色参考点,并采集色彩空间序列,同时基于所述颜色参考点以及所述色彩空间序列,利用最近邻搜索生成标签数据;
在本发明实施例中,所述颜色参考点基于具体实施任务进行定义,其定义形式为:['R','G','B','颜色','对应RGB的十六进制','索引'];
色彩空间序列基于人为定义生成,对于RGB空间,其颜色值的组成有256*256*256=16777216种,因此,本实施例采集16777216个样本,即可覆盖到所有RGB颜色值组成,本实施例的样本获取简单、训练快速。
本实施例利用KD-Tree算法生成所述色彩空间序列的标签数据,即将所述颜色参考点以及所述色彩空间序列输入所述KD-Tree,输出为每个所述色彩空间序列最近邻的所述颜色参考点的RGB值。
需要说明的是,利用KD-Tree算法进行图像分割,通常在小型任务上表现好,比如:简单提取若干个色彩分明的语义类别:水体、森林等;但是,对于大型任务,本实施例需对色彩空间的值进行加权,使其达到更好的效果。
S2.根据所述最近邻搜索,将属于每个所述颜色参考点的所述色彩空间序列划分为同一类别,并初始化网络参数以及训练周期数;
由于神经网络的优化受众多因素的影响,神经网络优化很容易陷入鞍点,导致神经网络非最优解,包括神经网络训练时所述训练样本数据一次输入的数量(样本批次)都会对网络优化产生影响,因此,本实施例需进行样本批次划分,从而提高网络优化效果;另外,由于本发明实施例的训练数据是基于色彩空间的,通常网络训练会随机打乱样本顺序,导致每一批次会存在多个类别样本,导致网络训练容易陷入局部最优,且会导致模型训练出现波动,因此,本实施例通过动态调整样本批次保证在进行批次划分时,每一个批次都是同一类别的样本;
S3.对于每一类别,动态调整样本批次,划分得到属于同一类别的训练样本数据;其中,所述网络参数为所述第一神经网络的隐藏层神经元数量序列;
在本发明实施例中,若当前的所述训练样本数据是第一个输入的训练样本,则初始化其样本批次;
若当前的所述训练样本数据不是第一个输入的训练样本,则动态调整样本批次,具体为:
根据所述准确率,获取在所述设定周期内,所述训练样本数据的平均准确率上升次数以及平均准确率下降次数;
将所述平均准确率上升次数、所述平均准确率下降次数以及所述训练样本数据的数量输入样本批次模型中,获取下一批次所述训练样本数据的数量;
其中,所述样本批次模型具体为:
Bs′=Bs-ceil{|R-D|*c}*d 1-1
式中,Bs表示当前的训练样本数据的数量,Bs′表示下一批次的训练样本数据的数量,ceil为向上取整函数,R表示网络训练后(A-L)周期内,每U个周期的平均准确率上升次数,其中,L表示前L个周期,D表示网络训练后(A-L)周期内,每U个周期的平均准确率下降次数,c为映射系数,通常取0.0005,d为样本批次常量,经验值取64;
由于网络为随机初始化权重,前L周期训练会出现大幅度准确率递增,因此,本实施例统计后(A-L)个周期的所述训练样本数据的平均准确率上升或者下降次数,同理,在下述S52步骤中,本实施例也只统计后(A-L)个周期的准确率平均增量。
对于平均准确率上升次数R、平均准确率下降次数D的说明:每一个样本批次均存在一个准确率,则每一当前样本批次计算后得到的准确率与上一样本批次计算后得到的准确率进行比较,若当前样本批次准确率较大,则准确率上升次数的数值加1,反之,准确率下降次数的数值加1,最终统计U个周期内的准确率总上升次数、准确率总下降次数,再求U个周期平均准确率上升次数R、准确率下降次数D。本实施例依据平均准确率上升次数和平均准确率下降次数,反映训练过程的“震荡”现象,根据此“震荡”现象,促进网络的优化,减少优化过程出现的大幅度震荡现象。
需要说明的是,由于网络初期权重为随机初始化,因此,初始的样本批次初始,即训练样本数据可设置较大,比如:3072;
S4.将所述训练样本数据以及所述标签数据输入第一神经网络中进行训练,得到颜色索引概率,并将所述颜色索引概率进行转换处理,得到训练索引;
在本发明实施例中,所述第一神经网络采用第一全连接网络,其优化采用随机梯度下降法,损失函数为交叉熵函数;由于网络是基于色彩空间进行训练的,因此,本实施例的网络训练不需要划分测试集、验证集;
另外,所述第一全连接网络的隐藏层神经元数量初始设置可通过倍数体现,比如,为了方便说明,本实施例将第一全连接网络设计为三层隐藏层,则神经元数量依次设置为2、4、8,本领域技术人员可根据具体情况进行调整,但须使神经元初始数量设置较小。
另外,在研究和实践中已反复证明,由于接受过类似训练任务的网络具有相似的权重,迁移学习有助于在短时间内实现更高的精度,即为节省计算资源、加速网络收敛,强制让所有模型共享权重,而不是去从头训练从头收敛。因此,每次训练新的模型的时候,实际上都进行了迁移学习,这样收敛速度会非常快,即每调整一层全连接的神经元个数后,即增加新的神经元,已有神经元权值不变,本实施例借鉴此思想,对第一神经网络进行优化训练;
S5.根据所述训练索引以及当前的网络参数,获取新的网络参数,具体包括:
S51.根据所述标签数据以及所述训练索引,获取所述训练样本数据的准确率;
S52.统计设定周期内,每个周期所述训练样本数据的准确率,并计算所述设定周期内的准确率平均增量,其中,所述准确率平均增量公式为:
式中,Racci+1表示第i+1个周期所述训练样本数据的准确率,Racci表示第i个周期所述训练样本数据的准确率,A表示训练的周期数,L表示前L个周期,Z表示所述准确率平均增量;
S53.将所述准确率平均增量与预设的增量阈值对比,若所述准确率平均增量小于所述增量阈值,则根据第一模型调整所述隐藏层神经元数量序列,并将其作为新的网络参数;若所述准确率平均增量大于所述增量阈值,则冻结此隐藏层的权重,然后对下一隐藏层进行神经元数量寻优,直至所有隐藏层训练结束;本实施例的增量阈值代表后(A-L)个周期训练后,所述训练样本数据的准确率增长很小。
在本发明实施例中,所述第一模型为:
O=S+round(Z)+b 1-3
式中,O表示调整后的所述隐藏层神经元数量,S表示调整前的所述隐藏层神经元数量,round表示取整函数,Z表示所述准确率平均增量,b为常数项,本实施例优先选取b=1;当round(Z)=0时,所述隐藏层神经元数量至少增加b个。
S6.将所述新网络参数用于下一批次的所述训练样本数据的训练,重复所述S4~S6步骤,直至所有类别训练结束。
S7.将所有所述网络参数输入第二神经网络进行训练,输出对应的预测评价指标,其中,所述预测评价指标表示训练完A周期后对所述训练样本数据的准确率评估;另外,本实施例的所述第一全连接网络为三层隐藏层,因此,所述网络参数为三层隐藏层的神经元个数序列,此序列共三个值;
在本实施例中,第二全连接网络设计简单几层即可,隐藏层数目及对应的神经元个数可根据具体情况进行设置,但须使最后一层的全连接输出1个值,此值表示预测评价指标;另外,在本实施例中,所述第二全连接网络的优化采用随机梯度下降法;采用均方误差函数作为损失函数。
本实施例设定三层隐藏层神经元个数均控制在(0,32],即32个可能,因此遍历得到的网络参数组合为32*32*32=32768种组合,最终将得到32768个预测评价指标,值域在[0,1]之间;
然后,本实施例计算所述第二全连接网络的计算量,输入层为色彩空间值,有3个值,同时,设定三层隐藏层神经元个数分别为D1、D2、D3,输出层的颜色参考点个数为D4,则计算量E为:
E=3*D1*D2*D3*D4 1-4
将所述预测评价指标输入第二模型,选取所述第二模型输出的最大的参数评价值,将其对应的网络参数作为最优网络参数,并将其作为所述第一神经网络所述隐藏层神经元的最优个数,本实施例通过第二模型保证所述最优网络参数同时兼顾运行速度与准确率,现有技术通常只保证了准确率;
其中,所述第二模型为:
在本发明实施例设置隐藏层为3层,颜色参考点为40个时,调整因子分别取值为θ=100000,μ=0.2,然后利用本实施例的优化策略搜索,所得结果如图2所示,搜索出的三层隐藏层的最优网络参数,即神经元最优个数分别为20、18、15,在所有网络参数中,此最优网络参数{20,18,15}的参数评价值V最高。
在另一实施例中,本发明实施例可通过AutoML选择模型,并设定它的参数,从而实现分割优化。
需要说明的是,本发明实施例实现将KD-tree基于颜色分割的功能映射到全连接网络中,使得全连接网络对RGB值仅通过隐藏层数值的加权,就可以实现图像的分割,速度快;表1为通过KD-Tree与通过搜索出的最优全连接网络推理一百万个RGB点的速度对比结果,可见全连接网络相比KD-Tree的时间复杂度低,且全连接网络在计算资源充足的情况下,可以进行大批次推理,即可以更快地进行图像的分割。
表1
算法 | 所耗时间(s) |
KD-Tree(Python) | 84.364 |
KD-Tree(C语言) | 0.694 |
全连接网络 | 0.515 |
另外,由于本实施例是基于RGB颜色空间来实现的图像分割,因此,训练完毕后可将本实施例提供的方法应用于任意的RGB图像。
对于一张RGB样本图像,要先进行所述样本图像的色彩增强,使得图像色彩更加分明;图像色彩增强的算法有很多,如基于Retinex的图像增强算法(SSR,MSR,MSRCR),都可以实现图像色彩的增强,提高图像的对比度,得到色彩增强后的所述样本图像;
然后,对处理后的所述样本图像进行重塑Reshape操作,使其变为色彩空间序列张量,接着,通过网络返回颜色索引概率,再经过Argmax转换操作得到具体的索引,最终,通过重塑Reshape及渲染操作将其转为与样本图像大小相等的RGB分割图像,从而实现图像的分割。
本发明实施例提供的一种基于色彩空间的图像无监督分割优化方法,包括定义颜色参考点、采集色彩空间序列、生成标签数据、样本类别以及批次划分,通过第一神经网络、第二神经网络进行优化训练获取最优网络参数、获取分割色彩序列;解决了基于颜色域来执行分割具有很强的通用性,但其算法复杂度高、推理速度慢的问题;实验表明,本发明实施例相比于现有技术,网络时间复杂度低,且进行大批次的网络推理,实现图像分割的速度更快,大大提高了分割效率,节约了时间以及成本;同时,本发明实施例通过搜索最优神经元个数确定网络的最优结构,具有很高的实用价值。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (8)
1.一种基于色彩空间的图像无监督分割优化方法,其特征在于,包括以下步骤:
S1.通过调色板定义颜色参考点,采集色彩空间序列,并利用最近邻搜索生成标签数据;
S2.将属于每个所述颜色参考点的所述色彩空间序列划分为同一类别,并初始化网络参数以及训练周期数;
S3.对于每一类别,动态调整样本批次,划分得到属于同一类别的训练样本数据;
S4.将所述训练样本数据以及所述标签数据输入第一神经网络中训练,得到颜色索引概率,并将所述颜色索引概率进行转换处理,得到训练索引;
S5.根据所述训练索引以及当前的网络参数,获取新的网络参数,具体包括:
S51.根据所述标签数据以及所述训练索引,获取所述训练样本数据的准确率;
S52.统计设定周期内,每个周期当前所述训练样本数据的准确率,并计算所述设定周期内的准确率平均增量;
S53.将所述准确率平均增量与预设的增量阈值对比,若所述准确率平均增量小于所述增量阈值,则根据第一模型获取新的网络参数;
S6.将所述新网络参数用于下一批次的所述训练样本数据的训练,并重复所述S4、S5步骤,直至所有类别训练结束;
S7.将所有所述网络参数输入第二神经网络训练,输出对应的预测评价指标,将所述预测评价指标输入第二模型,以获取最优网络参数。
2.如权利要求1所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于:在所述步骤S3中,若当前的所述训练样本数据是第一个输入的训练样本,则初始化其样本批次;若否,则动态调整样本批次,具体为:
根据所述准确率,获取在所述设定周期内,当前所述训练样本数据的准确率上升次数以及准确率下降次数;
将所述准确率上升次数、所述准确率下降次数以及当前所述训练样本数据的数量输入样本批次模型中,获取下一批次所述训练样本数据的数量。
3.如权利要求1所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于:在所述步骤S53中,若所述准确率平均增量大于所述增量阈值,则冻结此隐藏层的权重,然后对下一隐藏层进行神经元数量寻优,直至所有隐藏层训练结束。
4.如权利要求1所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于,所述第一模型为:
O=S+round(Z)+b
式中,O表示新的网络参数,S表示当前的网络参数,round表示取整函数,Z表示所述准确率平均增量,b为常数项。
5.如权利要求4所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于:在所述步骤S5中,选取第二模型输出的最大的参数评价值,将其对应的所述网络参数作为最优网络参数。
6.如权利要求5所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于:所述网络参数为所述第一神经网络的隐藏层神经元数量序列。
7.如权利要求1所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于:所述样本批次为所述训练样本数据一次输入所述第一神经网络训练的数量。
8.如权利要求1所述的一种基于色彩空间的图像无监督分割优化方法,其特征在于:所述第一神经网络、所述第二神经网络均采用全连接网络基础架构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011196798.3A CN112215849B (zh) | 2020-10-31 | 2020-10-31 | 一种基于色彩空间的图像无监督分割优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011196798.3A CN112215849B (zh) | 2020-10-31 | 2020-10-31 | 一种基于色彩空间的图像无监督分割优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112215849A true CN112215849A (zh) | 2021-01-12 |
CN112215849B CN112215849B (zh) | 2023-07-07 |
Family
ID=74057843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011196798.3A Active CN112215849B (zh) | 2020-10-31 | 2020-10-31 | 一种基于色彩空间的图像无监督分割优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215849B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106920243A (zh) * | 2017-03-09 | 2017-07-04 | 桂林电子科技大学 | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 |
CN109325495A (zh) * | 2018-09-21 | 2019-02-12 | 南京邮电大学 | 一种基于深度神经网络建模的作物图像分割系统及方法 |
US20190147340A1 (en) * | 2017-11-16 | 2019-05-16 | Mitusbishi Electric Research Laboratories, Inc. | Machine Learning via Double Layer Optimization |
CN110348396A (zh) * | 2019-07-15 | 2019-10-18 | 南京信息工程大学 | 一种基于深度学习的道路上方文字交通标志识别方法及装置 |
CN111160313A (zh) * | 2020-01-02 | 2020-05-15 | 华南理工大学 | 一种基于lbp-vae异常检测模型的人脸表示攻击检测方法 |
CN111738928A (zh) * | 2020-04-30 | 2020-10-02 | 南京图格医疗科技有限公司 | 一种基于概率优化和神经网络的内窥镜去雾方法及装置 |
-
2020
- 2020-10-31 CN CN202011196798.3A patent/CN112215849B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106920243A (zh) * | 2017-03-09 | 2017-07-04 | 桂林电子科技大学 | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 |
US20190147340A1 (en) * | 2017-11-16 | 2019-05-16 | Mitusbishi Electric Research Laboratories, Inc. | Machine Learning via Double Layer Optimization |
CN109325495A (zh) * | 2018-09-21 | 2019-02-12 | 南京邮电大学 | 一种基于深度神经网络建模的作物图像分割系统及方法 |
CN110348396A (zh) * | 2019-07-15 | 2019-10-18 | 南京信息工程大学 | 一种基于深度学习的道路上方文字交通标志识别方法及装置 |
CN111160313A (zh) * | 2020-01-02 | 2020-05-15 | 华南理工大学 | 一种基于lbp-vae异常检测模型的人脸表示攻击检测方法 |
CN111738928A (zh) * | 2020-04-30 | 2020-10-02 | 南京图格医疗科技有限公司 | 一种基于概率优化和神经网络的内窥镜去雾方法及装置 |
Non-Patent Citations (3)
Title |
---|
SEUNG-SOO HAN等: "Optimization of neural network structure and learning parameters using genetic algorithms", 《PROCEEDINGS EIGHTH IEEE INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE》, pages 200 - 206 * |
TIAGO MATIAS等: "Learning of a single-hidden layer feedforward neural network using an optimized extreme learning machine", 《NEUROCOMPUTING》, vol. 129, pages 428 - 436, XP028606739, DOI: 10.1016/j.neucom.2013.09.016 * |
高胡琨: "基于压缩感知和深度学习的爆炸物识别分类方法研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》, no. 07, pages 140 - 50 * |
Also Published As
Publication number | Publication date |
---|---|
CN112215849B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108717568B (zh) | 一种基于三维卷积神经网络的图像特征提取与训练方法 | |
CN110334580A (zh) | 基于集成增量的动态权重组合的设备故障分类方法 | |
CN108805193B (zh) | 一种基于混合策略的电力缺失数据填充方法 | |
Paupamah et al. | Quantisation and pruning for neural network compression and regularisation | |
Istrate et al. | Incremental training of deep convolutional neural networks | |
CN111008694A (zh) | 基于深度卷积对抗生成网络的无数据模型量化压缩方法 | |
CN114186672A (zh) | 一种用于脉冲神经网络的高效高精度训练算法 | |
CN114266351A (zh) | 基于无监督学习时间编码的脉冲神经网络训练方法及系统 | |
CN114239861A (zh) | 基于多教师联合指导量化的模型压缩方法及系统 | |
Ma et al. | A survey of sparse-learning methods for deep neural networks | |
CN112487933B (zh) | 一种基于自动化深度学习的雷达波形识别方法及系统 | |
CN111831955B (zh) | 一种锂离子电池剩余寿命预测方法及系统 | |
CN112215849A (zh) | 一种基于色彩空间的图像无监督分割优化方法 | |
CN111897809A (zh) | 一种基于生成对抗网络的指挥信息系统数据生成方法 | |
CN116108975A (zh) | 基于br-som聚类算法的配电网短期负荷预测模型建立方法 | |
CN113132482B (zh) | 一种基于强化学习的分布式消息系统参数自适应优化方法 | |
Sarkar et al. | An incremental pruning strategy for fast training of CNN models | |
CN113747500A (zh) | 移动边缘计算环境下基于生成对抗式网络的高能效低延迟任务卸载方法 | |
KR20210157826A (ko) | 심층 신경망 구조 학습 및 경량화 방법 | |
Ikushima et al. | Differential evolution neural network optimization with individual dependent mechanism | |
CN118114754B (zh) | 一种基于决策树的混合专家模型的训练方法和装置 | |
Binas et al. | Low-memory convolutional neural networks through incremental depth-first processing | |
Qi et al. | Analysis and Prediction of Energy Consumption in Neural Networks Based on Machine Learning | |
CN113627537B (zh) | 一种图像识别方法、装置、存储介质及设备 | |
Ma et al. | Augmapping: Accurate and efficient inference with deep double-threshold spiking neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |