CN115346052A - 基于神经网络的图像调色板快速提取方法及装置 - Google Patents
基于神经网络的图像调色板快速提取方法及装置 Download PDFInfo
- Publication number
- CN115346052A CN115346052A CN202211008784.3A CN202211008784A CN115346052A CN 115346052 A CN115346052 A CN 115346052A CN 202211008784 A CN202211008784 A CN 202211008784A CN 115346052 A CN115346052 A CN 115346052A
- Authority
- CN
- China
- Prior art keywords
- palette
- image
- neural network
- color
- convolutional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于神经网络的图像调色板快速提取方法及装置,所述方法包括:获取待提取调色板的图像的LAB格式数据;将获取到的所述LAB格式数据输入至多个级联的组卷积层中,得到用于表述所述LAB格式数据特征的多个特征图;将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果;基于得到的所述调色板特征分类结果生成所述LAB格式数据对应的调色板。该图像调色板快速提取方法可准确的描述待识别图像中的颜色分布。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于神经网络的图像调色板快速提取方法及装置。
背景技术
在图像编辑、图像重上色等图像处理领域,往往需要用到调色板;调色板也被称为颜色表或者颜色图,表示图像中存在的主要色彩;调色板提供了一个简单的方法来减少表达一幅图所需的颜色数量;并且通过修改调色板,配合图层分解、重新上色等技术,可以完成各种不同的图像编辑任务。
现有的从图像中提取调色板的技术主要是采用聚类方法,比如k-means算法等;k-means算法通过指定K值,将全图的颜色数量聚成K类,并以K类的类心作为调色板的颜色。目前所采用的聚类方法虽然可完成图像调色板的提取;但如果图像比较大,则采用聚类算法对该大图像进行调色板提取其速度将非常慢;其次,由于不同图像的颜色丰富程度不同,而聚类算法需要预先指定K值,因此生成的调色板常常不能非常准确地描述不同颜色丰富程度的图像中的颜色分布。因此,如何提供一种图像调色板提取方法以准确的描述图像中的颜色分布是亟待解决的技术问题。
发明内容
有鉴于此,本发明提供了一种基于神经网络的图像调色板快速提取方法及装置,以解决现有技术中存在的一个或多个问题。
根据本发明的一个方面,本发明公开了一种基于神经网络的图像调色板快速提取方法,所述方法包括:
获取待提取调色板的图像的LAB格式数据;
将获取到的所述LAB格式数据输入至多个级联的卷积层组中,得到用于表述所述LAB格式数据特征的多个特征图;
将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果;
基于得到的所述调色板特征分类结果生成所述LAB格式数据对应的调色板。
在本发明的一些实施例中,获取待提取调色板的图像的LAB格式数据,包括:
获取待提取调色板的待识别图像,将所述待识别图像缩放至预设像素尺寸,将缩放至预设像素尺寸的待识别图像转换为LAB颜色空间,并对所述待识别图像在所述LAB颜色空间中每个通道的值进行归一化。
在本发明的一些实施例中,所述方法还包括:对包含有所述组卷积层、全连接层的卷积神经网络进行训练,以优化所述卷积神经网络的网络参数。
在本发明的一些实施例中,对包含有所述卷积层组、全连接层的卷积神经网络模型进行训练,包括:
获取训练样本集,所述训练样本集包括多个样本数据;
确定对所述全连接层进行约束的目标损失函数;
将所述训练样本集中的样本数据输入至所述卷积神经网络模型进行训练。
在本发明的一些实施例中,所述目标损失函数为:
其中,LP代表损失值,N代表缩放后的待识别图像的像素尺寸,Ii代表缩放后的所述待识别图像的第i个像素点,p’表示生成的所述调色板上的与所述第i个像素点距离最近的颜色。
在本发明的一些实施例中,所述方法还包括:
获取待提取调色板的图像的各像素点;
确定生成的所述调色板上的与各所述像素点的颜色相近的颜色数量;
在所述颜色数量小于预设阈值的情况下,将所述调色板上的相应颜色删除。
在本发明的一些实施例中,所述卷积层组包括七个组卷积层,各所述组卷积层包括两个卷积层;和/或
将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果,包括:
将所述多个特征图输入至全连接层,所述全连接层将多个所述特征图转换为代表所述调色板的K*3维特征。
在本发明的一些实施例中,各所述卷积层的卷积核大小为3*3,步长为1,七个组卷积层输出的特征图的数量分别为8个、16个、32个、64个、128个、256个和256个。
根据本发明的另一方面,还公开了一种基于神经网络的图像调色板快速提取系统,该系统包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如上任一实施例所述方法的步骤。
根据本发明的再一方面,还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一实施例所述方法的步骤。
本发明所公开的基于神经网络的图像调色板快速提取方法及装置,通过将待识别图像的LAB格式数据输入至级联的卷积层中组得到多个特征图,进而再将得到的多个特征图输入至全连接层中,进而基于全连接层的输出生成待识别图像的调色板,该方法的算法速度不受图像大小的影响,并且该方法基于卷积神经网络可准确的描述图像中的颜色分布。
除上述之外,该基于神经网络的图像调色板快速提取方法还可将调色板上的颜色数量小于预设阈值的颜色从调色板上删除,因而该图像调色板快速提取方法可适用于不同颜色丰富程度的图像,且均能准确且快速的表达不同丰富程度色彩的图像的代表性颜色。
本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在书面说明及其权利要求书以及附图中具体指出的结构实现到并获得。
本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。附图中的部件不是成比例绘制的,而只是为了示出本发明的原理。为了便于示出和描述本发明的一些部分,附图中对应部分可能被放大,即,相对于依据本发明实际制造的示例性装置中的其它部件可能变得更大。在附图中:
图1为本发明一实施例的基于神经网络的图像调色板快速提取方法的流程示意图。
图2为本发明一实施例的基于神经网络的图像调色板快速提取系统的架构示意图。
图3为本发明一实施例的卷积神经网络的组卷积层的结构示意图。
图4为两个卷积层的输出进行像素级相加的结构示意图。
图5为全连接层的操作流程示意图。
图6为K*3维特征表示转换为含有K个颜色的调色板的流程示意图。
图7为多个含有不同丰富程度的颜色的待识别图像所生成的调色板的对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在此,需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
应该强调,术语“包括/包含/具有”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
为了解决现有技术的图像调色板提取方法存在的大图像算法速度低,以及往往不能非常准确地描述图像中的颜色分布的缺陷,本发明提供了一种新的基于神经网络的图像调色板快速提取方法及装置,以更加准确地提取待识别图像的调色板,并且本发明的图像调色板提取方法所应用的算法速度不受图像大小的影响,能实时且准确的从待识别图像中提取到图像的调色板,以较准确的描述图像中的颜色分布。
在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
图1为本发明一实施例的基于神经网络的图像调色板快速提取方法的流程示意图,如图1所示,该基于神经网络的图像调色板快速提取方法至少包括步骤S10至S40。
步骤S10:获取待提取调色板的图像的LAB格式数据。
在该步骤中,待提取调色板的图像为待识别图像,也即本发明的卷积神经网络的输入图像;在获取待提取调色板的图像的LAB格式数据时,可将获取到的RGB格式的待识别图像转换为LAB格式,LAB色彩模型是由亮度(L)和有关色彩的a,b三个要素组成,L表示亮度(Luminosity),a表示从洋红色至绿色的范围,b表示从黄色至蓝色的范围。在该步骤中获取待提取调色板的图像的LAB格式数据,是为了使在后续步骤中通过卷积神经网络模型对图像的调色板进行识别时,以获得较好的识别结果。
示例性的,获取待提取调色板的图像的LAB格式数据具体包括如下步骤:获取待提取调色板的待识别图像,将所述待识别图像缩放至预设像素尺寸,将缩放至预设像素尺寸的待识别图像转换为LAB颜色空间,并对所述待识别图像在所述LAB颜色空间中每个通道的值进行归一化。该过程也可理解成对待识别图像进行预处理,以获得满足本发明的基于神经网络的图像调色板快速提取系统对输入数据格式的要求。在该实施例中,首先获取到的待识别图像一般为RGB图像,而为了更准确的提取待识别图像的调色板,则进一步将RGB格式的图像转换为LAB表达格式,以基于待识别图像的LAB格式数据作为输入数据。
具体的,将待识别图像缩放至预设像素尺寸,是将待识别图像缩放至大小为N*N的图像,N示例性的可为256,此时待识别图像被缩放至256*256大小。而对待识别图像在所述LAB颜色空间中每个通道的值进行归一化,具体的是将各值归一化到[0,1]之间。在该步骤中待识别图像作为输入数据,首先将输入图像缩放至N*N大小,然后将缩放后的图像转换为LAB颜色空间表达,最后进行归一化处理,即将输入数据归一化到[0,1]之间。
步骤S20:将获取到的所述LAB格式数据输入至多个级联的卷积层组中,得到用于表述所述LAB格式数据特征的多个特征图。
在该步骤中,基于卷积层对待识别图像进行特征提取,以得到用于表述所述LAB格式数据特征的多个特征图。其中,卷积层组包括多个级联的组卷积层,图3为本发明一实施例的卷积神经网络的组卷积层的结构示意图,参考图3,各组卷积层至少包括多个卷积层;示例性的,各卷积层卷积核的大小均可为3*3,而卷积核在图像上滑动的步长为1。由于卷积层的输出尺寸大小和选取的窗口大小有着密切关系,而经过3*3的卷积核进行卷积之后,卷积层的输出尺寸相对于输入尺寸减小,因而为了保证输入输出尺寸保持一致,则一般在输入图像的周围进行填充,填充的方式可选为镜像填充或填充值为0。比如,首先在输入图像的各侧均填充1行,进而该填充了1行的输入图像经过两次3*3的卷积得到一个特征图;另外,输入图像直接经过一次3*3的卷积得到另一个特征图,该两个特征图的尺寸一致,因而可直接将两个特征图进行相加。
进一步的,当基于两个卷积层分别提取到输入图像的特征之后,进一步的对两个卷积层的输出进行像素级相加,如图4所示,图4中Xi所在的特征图像为第一卷积层的输出,而Yi所在的特征图像为第二卷积层的输出,则Xi+Yi所在的特征图为第一卷积层的输出与第二卷积层的输出进行像素级相加后得到的特征图像。
另外,组卷积层还可包括激活层,激活层负责对上述卷积层抽取的待识别图像的特征进行激活,由于卷积操作把输入图像和卷积核进行相应的线性变换,因而需要引入激活层(非线性函数)对其进行非线性映射。激活函数具体的可为ReLU函数、Sigmoid函数、tanh函数等,在一实施例中,激活函数选用LReLU(带泄露线性整流函数)函数;LReLU函数线性、非饱和的形式在SGD中能够快速收敛,且LReLU函数计算速度比sigmoid和tanh都快。
池化层用于对特征图进行下采样,以对感受域内的特征进行筛选,提取区域内最具代表性的特征,能够有效的降低输出特征尺度,进而减少模型所需要的参数量。根据操作类型池化操作可分为最大池化、平均池化和求和池化,分别提取感受域内最大、平均与总和的特征值作为输出;在一具体实施例中,选用最大池化方法对特征图进行下采样。
步骤S30:将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果。
在该步骤中,是将卷积层组输出的多个特征图进一步的输送至全连接层,全连接层在整个卷积神经网络中起到“分类器”的作用;如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。
示例性的,将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果,包括:将所述多个特征图输入至全连接层,所述全连接层将多个所述特征图转换为代表所述调色板的K*3维特征。参考图5,在该步骤中,通过全连接层操作,将卷积层组输出的多个特征图转换为代表最终调色板的K*3维特征。其中,K的取值范围可为5至15;在一具体示例中,K的取值为14,此时通过全连接层操作,将组卷积层输出的多个特征图转换为代表最终调色板的14*3维特征。应当理解的是,K代表最终生成的调色板上的颜色种类的数量,则K的数值越大,则调色板上的颜色数量越多,即K的取值可根据实际应用场景进行选择,但还应注意的是K的取值影响调色板提取的效果;申请人在研究中发现,当基于全连接层转换为代表最终调色板的14*3维特征时,可以较好的提取到待识别图像的调色板;而当K值过大时,则最终所提取的调色板中可能会包含过多相近的颜色;而当K值过小时,最终生成的调色板无法准确反应图像中的颜色分布,或者缺少了图像中的部分主要颜色;因而为了避免K取值过小或过大造成的上述现象发生,则将K值限定为5至15最佳,优选的K值选择14。
在一实施例中,卷积层组输出的特征图像的数量为256个,此时经过全连接层,将卷积层组输出的256个特征图像转换为代表最终调色板的14*3维特征。
步骤S40:基于得到的所述调色板特征分类结果生成所述LAB格式数据对应的调色板。
该步骤是经过维度调整,将全连接层输出的K*3维特征表征为包含K种颜色的调色板。当全连接层输出的为14*3维特征时,则此时基于该14*3维特征通过维度转换所表征的对应调色板的颜色种类为14。参考图6,(R1,G1,B1)被表征成调色板上C1颜色,而(Rk,Gk,Bk)则被表征成调色板上Ck颜色。
通过上述步骤可以发现,通过将待识别图像转换为LAB格式数据,并输入至卷积层组中,进而将卷积层组输出的多个特征图像输入至全连接层中,而全连接层进而将特征图像表征为用于代表调色板的K*3维特征,进而基于全连接层输出的K*3维特征表示为包含有K种颜色的调色板。由此即完成了对待识别图像的调色板的提取。
在本发明的另一实施例中,该基于神经网络的图像调色板快速提取方法还包括以下步骤:对包含有所述组卷积层、全连接层的卷积神经网络进行训练,以优化所述卷积神经网络的网络参数。
示例性的,对包含有所述卷积层组、全连接层的卷积神经网络模型进行训练,包括:获取训练样本集,所述训练样本集包括多个样本数据;确定对所述全连接层进行约束的目标损失函数;将所述训练样本集中的样本数据输入至所述卷积神经网络模型进行训练。在该实施例中,可选取10000多张初始分辨率大小为2048*2048的图像生成训练样本集,此时样本数据包括上述选取的图像以及用于代表其调色板的K*3维特征,该训练样本集中的样本数据包括了摄影、油画、彩绘、水彩等多种样式的图像,训练进行约600,000轮,学习率设为0.0001。在训练之前,首先将各分辨率大小为2048*2048的图像缩放为256*256像素的图像,并将256*256像素的图像转换为LAB颜色空间。
示例性的,在对模型进行训练时,具体的是在全连接层对进行损失LP计算,计算损失时所采用的目标损失函数为:
其中,LP代表损失值,N代表缩放后的待识别图像的像素尺寸,Ii代表缩放后的所述待识别图像的第i个像素点,p’表示生成的所述调色板上的与所述第i个像素点距离最近的颜色。
另外,为了使得色彩丰富程度不同的待识别图像,得到含有不同颜色数量的调色板,即生成的调色板上的颜色数量与输入图像相适应,则本发明的基于神经网络的图像调色板快速提取方法还包括对生成的调色板大小进行调整的步骤。因为在上述步骤中可知,对于色彩丰富程度不同的待识别图像,其作为输入图像依次经过卷积层组、全连接层得到的均是用于表示其调色板的K*3维特征,从而不同的待识别图像基于上述步骤S10至S40均生成具有K种颜色的调色板,当K=14时,则不同的待识别图像基于上述步骤S10至S40均生成具有14种颜色的调色板。而可以理解的,对于色彩种类较丰富的图像来说,其最终生成的调色板上的颜色数量往往较多,而对于色彩种类较少(如仅有两种颜色)的图像,其最终生成的调色板上的颜色数量也应该较少,才能更精确且明确的表达对应图像的颜色分布;因而在该实施例中,当基于上述步骤S10至S40生成包含有14种颜色的调色板之后,进一步的对调色板的大小进行调整。
具体的,在调整调色板的大小时,首先获取待提取调色板的图像的各像素点;确定生成的所述调色板上的与各所述像素点的颜色相近的颜色数量;在所述颜色数量小于预设阈值的情况下,将所述调色板上的相应颜色删除。其中,在确定生成的所述调色板上的与各所述像素点的颜色相近的颜色数量时,可首先获取调色板上的各颜色,计算调色板上的各颜色与待识别图像上的第一像素点之间的距离,当计算出的距离数值小于预设值时,代表第一像素点与对应的颜色相近,进一步计算调色板上与第一像素点相近的颜色总数量,判断颜色总数量是否小于预设阈值,当判断得出调色板上的与第一像素点之间的距离小于预设值的颜色总数量小于预设阈值的情况下,则从调色板上将对应的颜色进行删除。其中,预设阈值可取为N2与102的比值,N代表缩放后的待识别图像的像素尺寸。
本发明的基于神经网络的图像调色板快速提取方法,为了使颜色分布差异较大的图像具有不同大小的调色板,则通过上述步骤对调色板大小进行了调整。即通过调色板大小调整方法使得颜色丰富的图像,其最终的调色板上显示的颜色种类较多;而对于一些颜色较少的图像,通过调色板大小调整方法使得其最终的调色板上显示的颜色种类较少;如仅包含蓝天白云的图像上由于仅具有蓝色和白色两种颜色,则经过调色板大小的调整,最终生成的调色板上仅显示蓝天和白云两种颜色。由此可知,当基于本发明上述实施例的卷积神经网络模型提取到待识别图像的调色板后,进一步的基于调色板大小调整步骤,则最终生成的调色板可更明确的表示对应图像的颜色分布。
示例性的,如图7所示,其中的三幅图像首先均表示为包含13种颜色的调色板,此时全连接层的输出为代表对应图像的调色板的13*3维特征,而进一步的基于调色板大小调整步骤,使得仅具有两种颜色的第一张图像生成的最终调色板上的颜色数量为2,而第二张图像生成的最终调色板上的颜色数量为6,第三张图像生成的最终调色板上的颜色数量为7。由此可以看出,对调色板的大小进行调整则可基于待识别图像的颜色丰富程度适应的调整调色板的大小,从而更准确的表达待识别图像上的颜色分布。
在一实施例中,卷积层组包括七个组卷积层,各组卷积层均包括两个卷积层,并且各卷积层的卷积核大小为3*3,步长为1。第一个组卷积层输出的特征图的数量为8个,而第二个组卷积层输出的特征图的数量为16个;在一实施例中,七个组卷积层输出的特征图的数量分别为8个、16个、32个、64个、128个、256个和256个,则此时待识别图像的LAB格式数据输入至多个级联的卷积层组中得到256个特征图,则256个特征图进一步的通过全连接操作获取到用于表征调色板的K*3维特征。
相应的,本发明还公开了一种基于神经网络的图像调色板快速提取系统,该系统包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如上任一实施例所述方法的步骤。
图2为本发明一实施例的基于神经网络的图像调色板快速提取系统的架构示意图,如图2所示,该图像调色板快速提取系统至少包括卷积神经网络,而卷积神经网络至少包括七组卷积层以及一组全连接层。应当理解的是,将卷积层组限定为包括七个组卷积层,以及各组卷积层包括两个卷积层均是一种示例,在其他实施例中,其也可以根据实际需要进行相应调整。
通过上述实施例可以发现,本发明所公开的基于神经网络的图像调色板快速提取方法及系统可快速且准确的提取到待识别图像的调色板;另外,在初步生成调色板后,还可进一步的调整调色板的大小,即将调色板上的部分颜色删除,因而该方法及系统可适用于不同色彩丰富程度的图像,其适应范围广。
另外,该发明还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一实施例所述方法的步骤。
本领域普通技术人员应该可以明白,结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法,能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
本发明中,针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于神经网络的图像调色板快速提取方法,其特征在于,所述方法包括:
获取待提取调色板的图像的LAB格式数据;
将获取到的所述LAB格式数据输入至多个级联的卷积层组中,得到用于表述所述LAB格式数据特征的多个特征图;
将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果;
基于得到的所述调色板特征分类结果生成所述LAB格式数据对应的调色板。
2.根据权利要求1所述的基于神经网络的图像调色板快速提取方法,其特征在于,获取待提取调色板的图像的LAB格式数据,包括:
获取待提取调色板的待识别图像,将所述待识别图像缩放至预设像素尺寸,将缩放至预设像素尺寸的待识别图像转换为LAB颜色空间,并对所述待识别图像在所述LAB颜色空间中每个通道的值进行归一化。
3.根据权利要求2所述的基于神经网络的图像调色板快速提取方法,其特征在于,所述方法还包括:对包含有所述组卷积层、全连接层的卷积神经网络进行训练,以优化所述卷积神经网络的网络参数。
4.根据权利要求3所述的基于神经网络的图像调色板快速提取方法,其特征在于,对包含有所述卷积层组、全连接层的卷积神经网络模型进行训练,包括:
获取训练样本集,所述训练样本集包括多个样本数据;
确定对所述全连接层进行约束的目标损失函数;
将所述训练样本集中的样本数据输入至所述卷积神经网络模型进行训练。
6.根据权利要求1所述的基于神经网络的图像调色板快速提取方法,其特征在于,所述方法还包括:
获取待提取调色板的图像的各像素点;
确定生成的所述调色板上的与各所述像素点的颜色相近的颜色数量;
在所述颜色数量小于预设阈值的情况下,将所述调色板上的相应颜色删除。
7.根据权利要求1至6中任意一项所述的基于神经网络的图像调色板快速提取方法,其特征在于,所述卷积层组包括七个组卷积层,各所述组卷积层包括两个卷积层;和/或
将所述多个特征图输入至全连接层,得到所述图像的调色板特征分类结果,包括:
将所述多个特征图输入至全连接层,所述全连接层将多个所述特征图转换为代表所述调色板的K*3维特征。
8.根据权利要求7所述的基于神经网络的图像调色板快速提取方法,其特征在于,各所述卷积层的卷积核大小为3*3,步长为1,七个组卷积层输出的特征图的数量分别为8个、16个、32个、64个、128个、256个和256个。
9.一种基于神经网络的图像调色板快速提取系统,该系统包括处理器和存储器,其特征在于,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如权利要求1至8中任意一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211008784.3A CN115346052A (zh) | 2022-08-22 | 2022-08-22 | 基于神经网络的图像调色板快速提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211008784.3A CN115346052A (zh) | 2022-08-22 | 2022-08-22 | 基于神经网络的图像调色板快速提取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115346052A true CN115346052A (zh) | 2022-11-15 |
Family
ID=83954401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211008784.3A Pending CN115346052A (zh) | 2022-08-22 | 2022-08-22 | 基于神经网络的图像调色板快速提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115346052A (zh) |
-
2022
- 2022-08-22 CN CN202211008784.3A patent/CN115346052A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108717524B (zh) | 一种基于双摄手机和人工智能系统的手势识别系统 | |
TWI406180B (zh) | 用於產生具有多重前景平面之高度壓縮影像資料檔案的系統及方法 | |
CN111428781A (zh) | 遥感影像地物分类方法及系统 | |
CN110717953A (zh) | 基于cnn-lstm组合模型的黑白图片的着色方法和系统 | |
CN106650615A (zh) | 一种图像处理方法及终端 | |
CN110969171A (zh) | 基于改进卷积神经网络的图像分类模型、方法及应用 | |
EP4075373A1 (en) | Image processing method and apparatus | |
CN112819096A (zh) | 一种基于复合卷积神经网络的化石图像分类模型的构建方法 | |
CN113392930A (zh) | 基于多层次分治网络的交通标志目标检测方法 | |
CN114187515A (zh) | 图像分割方法和图像分割装置 | |
CN113627481A (zh) | 一种面向智慧园林的多模型组合的无人机垃圾分类方法 | |
CN110796716B (zh) | 一种基于多重残差网络和正则化迁移学习的图像着色方法 | |
CN112489049A (zh) | 基于超像素和svm的成熟番茄果实的分割方法及系统 | |
CN115346052A (zh) | 基于神经网络的图像调色板快速提取方法及装置 | |
CN116452900A (zh) | 一种基于轻量级神经网络的目标检测方法 | |
CN115359562A (zh) | 基于卷积神经网络的手语字母拼写识别方法 | |
CN114511862B (zh) | 表格识别方法、装置及电子设备 | |
CN113837236B (zh) | 图像中目标对象的识别方法、装置、终端设备及存储介质 | |
CN113379785B (zh) | 一种融合边界先验与频域信息的显著性目标检测方法 | |
CN115731172A (zh) | 基于图像增强和纹理提取的裂缝检测方法、装置及介质 | |
CN116777929A (zh) | 一种黑夜场景图像语义分割方法、装置及计算机介质 | |
CN110647898B (zh) | 图像处理方法、装置、电子设备及计算机存储介质 | |
CN114693697A (zh) | 图像处理方法、装置、设备及计算机可读存储介质 | |
CN113128614A (zh) | 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法 | |
CN111931688A (zh) | 船只识别方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |