CN108230232B - 一种图像处理的方法以及相关装置 - Google Patents
一种图像处理的方法以及相关装置 Download PDFInfo
- Publication number
- CN108230232B CN108230232B CN201611191518.3A CN201611191518A CN108230232B CN 108230232 B CN108230232 B CN 108230232B CN 201611191518 A CN201611191518 A CN 201611191518A CN 108230232 B CN108230232 B CN 108230232B
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- preset
- trained
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 133
- 238000012549 training Methods 0.000 claims abstract description 96
- 238000000605 extraction Methods 0.000 claims abstract description 72
- 230000004913 activation Effects 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 31
- 230000001960 triggered effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 27
- 239000002699 waste material Substances 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 48
- 238000010586 diagram Methods 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000012800 visualization Methods 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明实施例公开了一种图像处理的方法,包括:获取待处理图像;采用预置训练模型对所述待处理图像进行处理,其中,所述预置图像训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;根据所述预置训练模型的处理结果,获取所述待处理图像所对应的目标图像。本发明还提供一种图像处理装置。本发明实施例可用将一些不满足预设图像特征值提取条件的样本图像在训练模型时进行剔除,从而有效地减少计算冗余和和空间浪费,同时这类模型的压缩率较高,能够应用于移动终端的应用程序,以此提升方案的实用性。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种图像处理的方法以及相关装置。
背景技术
随着图像处理技术的日益成熟,可以通过风格转换将一张普通图片转换为具有特定风格的艺术效果图,如图1所示,风格转换主要是采用神经网络的人工智能算法将普通图片的背景进行白净化处理,然后与绘画流派的艺术风格相结合,最后经过图像智能化处理得到艺术效果图。
目前,较为常用的人工智能算法为风格网络法,在普通的全连接网络或者卷积神经网络(英文全称:Convolutional Neuron Networks,英文缩写:CNN)中,每层神经元信号只能向上一层传播,又称为前向神经网络。如图2所示,通过将原图输入至已经训练好的离线风格转换模型,便可以快速得到风格化处理后的艺术效果图,其中,该风格转换模型中的相关参数固定不变。
由于风格转换模型中的相关参数固定不变,然而部分参数对整体的结果输出并不影响,这将会造成计算冗余和空间浪费。通常情况下,支持离线风格转换模型的方案需要约13兆(英文全称:MByte,英文缩写:MB)的计算资源,因此在移动终端的应用程序上进行操作就会显得过大,且无法支持多个前向神经网络并存。
发明内容
本发明实施例提供了一种图像处理的方法以及相关装置,可以将一些不满足预设图像特征值提取条件的样本图像在训练模型时进行剔除,可以有效地减少计算冗余和和空间浪费,同时这类模型的压缩率较高,能够应用于移动终端的应用程序,从而提升方案的实用性。
有鉴于此,本发明第一方面提供了图像处理的方法,包括:
获取待处理图像;
采用预置训练模型对所述待处理图像进行处理,其中,所述预置图像训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;
根据所述预置训练模型的处理结果,获取所述待处理图像所对应的目标图像。
本发明第二方面提供了图像处理装置,包括:
第一获取模块,用于获取待处理图像;
处理模块,用于采用预置训练模型对所述第一获取模块获取的所述待处理图像进行处理,其中,所述预置图像训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;
第二获取模块,用于根据所述处理模块通过所述预置训练模型处理得到的处理结果,获取所述待处理图像所对应的目标图像。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,提供了一种图像处理的方法,图像处理装置先获取待处理图像,然后采用预置训练模型对待处理图像进行处理,其中,预置图像训练模型为特征样本图像与特征样本图像的激活函数的函数关系模型,且特征样本图像中包含满足预设图像特征值提取条件的图像,最后图像处理装置根据预置训练模型的处理结果,获取待处理图像所对应的目标图像。通过上述方式,将一些不满足预设图像特征值提取条件的样本图像在训练模型时进行剔除,可以有效地减少计算冗余和和空间浪费,同时这类模型的压缩率较高,能够应用于移动终端的应用程序,从而提升方案的实用性。
附图说明
图1为本发明实施例中将图片进行风格转换的效果示意图;
图2为现有技术中采用风格网络法进行风格转换的效果示意图;
图3为本发明实施例中预置训练模型的结构示意图;
图4为本发明实施例中图像处理的方法一个实施例示意图;
图5为本发明实施例中多个卷积样本图像的示意图;
图6为本发明实施例中待训练图像集合中多个样本图像的示意图;
图7为本发明实施例中半自动化选取样本图像的示意图;
图8为本发明实施例中目标感兴趣区域的模板示意图;
图9为本发明实施例中自动选取样本图像的流程示意图;
图10为本发明应用场景中特征样本图像调参模块流程设计图;
图11为应用场景中基于非线性激活函数的可视化技术分析示意图;
图12为本发明实施例中图像处理装置一个实施例示意图;
图13为本发明实施例中图像处理装置另一个实施例示意图;
图14为本发明实施例中图像处理装置另一个实施例示意图;
图15为本发明实施例中图像处理装置另一个实施例示意图;
图16为本发明实施例中图像处理装置另一个实施例示意图;
图17为本发明实施例中图像处理装置另一个实施例示意图;
图18为本发明实施例中图像处理装置另一个实施例示意图;
图19为本发明实施例中图像处理装置一个结构示意图。
具体实施方式
本发明实施例提供了一种图像处理的方法以及相关装置,可以将一些不满足预设图像特征值提取条件的样本图像在训练模型时进行剔除,可以有效地减少计算冗余和和空间浪费,同时这类模型的压缩率较高,能够应用于移动终端的应用程序,从而提升方案的实用性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本发明主要采用一种经过改良的预置训练模型进行图像的白净化处理,请参阅图3,图3即为本发明实施例中预置训练模型的结构示意图,与风格网络法目前所采用的离线风格转换模型不同,本发明中的预置训练模型的结构为“323结构”,即3个卷积层,2个残差层以及3个反卷积层,而现有的离线风格转换模型具有3个卷积层,5个残差层以及3个反卷积层,因此本发明的预置训练模型所占用计算资源更少,通常可以在1MB以下。需要说明的是,本发明采用2个残差层仅为一个示意,在实际应用中还可以对残差层数量进行改变。
直观看来,卷积层的参数其实可以看做一系列的可训练或者学习的过滤器。卷积神经网络中每一层的神经元只会和上一层的一些局部区域相连,在前向计算过程中,我们首先将目标输入图像中的图像数据输入至可训练的滤波器,在滤波器对图像数据进行卷积后会在产生卷积样本图像,然后对卷积样本图像中的像素再进行求和,加权值以及加偏置处理,接着,再通过一个激活函数就可以得到样本图像。
具体地,在卷积层需要依次进行卷积(英文全称:Convolution,英文缩写:Conv)计算、修正的非线性激活函数(英文全称:rectified linear units,英文缩写:ReLU)计算以及批量规范化(英文全称:batch normalization,英文缩写:BN)计算。利用Conv计算可以得到第一特征图,然后采用ReLU计算第一特征图,并得到第二特征图,相比于Conv计算,ReLU计算由于采用率激活函数,因此可以把有价值的激活信号都过滤出来,使得分析起来更加方便。在神经网络训练时遇到收敛速度很慢,或梯度爆炸等无法训练的状况时可以尝试BN来解决。此外,在一般使用情况下也可以加入BN算法来加快训练速度,提高模型精度。
残差层蕴含了有关模型基本假设的重要信息。如果回归模型正确的话,我们可以将残差看作误差的观测值,它应符合模型的假设条件,且具有误差的一些性质,利用残差所提供的信息,来考察模型假设的合理性及数据的可靠性称为残差分析。
反卷积网络可以看成是卷积网络的逆过程,是用于无监督学习的。然而反卷积过程并不具备学习的能力,仅仅是用于可视化一个已经训练好的卷积网络模型,没有学习训练的过程。反卷积可视化以各层得到的特征图作为输入,进行反卷积,得到反卷积结果,用以验证显示各层提取到的特征图。
下面将从图像处理装置的角度,对本发明中图像处理的方法进行介绍,请参阅图4,本发明实施例中图像处理的方法一个实施例包括:
101、获取待处理图像;
本实施例中,图像处理装置首先获取至少一张待处理图像,待处理图像也可以成为输入的原图,图像处理装置需要将这个输入的原图进行背景白净化处理,也就是尽量消除输入原图中的噪声。
102、采用预置训练模型对待处理图像进行处理,其中,预置图像训练模型为特征样本图像与特征样本图像的激活函数的函数关系模型,特征样本图像中包含满足预设图像特征值提取条件的图像;
本实施例中,图像处理装置采用预置训练模型对待处理图像进行处理,具体可以是将待处理图像输入至已经训练得到的预置训练模型。
其中,该预置训练模型实际上是特征样本图像与特征样本图像的激活函数的函数关系模型,但是这些特征样本图像是经过筛选后得到的样本图像,且满足预设图像特征值提取条件,并非将所有的样本图像都用于训练,以此减少训练所采用的计算资源。
103、根据预置训练模型的处理结果,获取待处理图像所对应的目标图像。
本实施例中,图像处理装置根据采用的预置训练模型得到输出的处理结果,该处理结果即为待处理图像所对应的目标图像,目标图像为已经经过白净化处理后的图像,可以用于与其他图画相结合,最后经过图像智能化处理得到艺术效果图。
本发明实施例中,提供了一种图像处理的方法,图像处理装置先获取待处理图像,然后采用预置训练模型对待处理图像进行处理,其中,预置图像训练模型为特征样本图像与特征样本图像的激活函数的函数关系模型,且特征样本图像中包含满足预设图像特征值提取条件的图像,最后图像处理装置根据预置训练模型的处理结果,获取待处理图像所对应的目标图像。通过上述方式,将一些不满足预设图像特征值提取条件的样本图像在训练模型时进行剔除,可以有效地减少计算冗余和和空间浪费,同时这类模型的压缩率较高,能够应用于移动终端的应用程序,从而提升方案的实用性。
可选地,在上述图4对应的实施例的基础上,本发明实施例提供的图像处理的方法第一个可选实施例中,采用预置训练模型对待处理图像进行处理之前,还可以包括:
获取待训练图像集合,其中,待训练图像集合中包含多个样本图像;
判断待训练图像集合中的样本图像是否满足预设图像特征值提取条件;
若样本图像满足预设图像特征值提取条件,则将样本图像确定为特征样本图像,特征样本图像用于进行预置训练模型的训练。
本实施例中,图像处理装置在采用预置训练模型对待处理图像进行处理之前,还需要对该预置训练模型进行训练。
具体地,首先图像处理装置获取至少一个待训练图像集合,每个待训练图像集合都分别对应一个待训练的目标输入图像,且每个待训练图像集合中包含多个样本图像,这些样本图像是目标输入图像经过一系列计算后得到的。接着由图像处理装置按照顺序一一判断每个样本图像是否满足预设图像特征值提取条件,将满足条件的样本图像确定为特征样本图像,遍历完一个待训练图像集合中的所有样本图像之后,再对下一个待训练图像集合中的所有样本图像进行筛选,直到获取每个待训练图像集合中的特征样本图像,即可采用这些特征样本图像训练得到预置训练模型。
其次,本发明实施例中,说明了图像处理装置预先选取特征样本图像的方法,主要是先获取包含多个样本图像的待训练图像集合,然后根据预设图像特征值提取条件来提取可以作为训练样本的特征样本图像,只需要采用这部分特征样本图像即可训练得到预置训练模型。通过上述方式,限定了在训练预置训练模型的过程中,并非将所有的样本图像都进行训练,而且选择一部分价值较高的样本图像,以此提升了样本训练的准确性,同时也减少了样本训练的资源,进而提升方案的实用性。
可选地,在上述图4对应的第一个实施例的基础上,本发明实施例提供的图像处理的方法第二个可选实施例中,判断待训练图像集合中的样本图像是否满足预设图像特征值提取条件之后,还可以包括:
若样本图像不满足预设图像特征值提取条件,则从待训练图像集合中删除样本图像。
本实施例中,图像处理装置按照顺序一一判断每个样本图像是否满足预设图像特征值提取条件,若判断得到某个样本图像不满足预设图像特征值提取条件,那就就把这个样本图像从它对应的待训练图像集合中删除。
删除了待训练图像集合中不满足预设图像特征值提取条件的样本图像后,相当于对待训练图像集合进行了压缩,从而减少了用于训练的参数数量,进而完成了预置训练模型的压缩任务。
再次,本发明实施例中,在图像处理装置根据预设图像特征值提取条件提取特征样本图像的过程中,还可以把没有通过筛选的样本图像从待训练图像集合中删除。通过上述方式,能够剔除待训练图像集合中不满足要求的样本图像,以此来压缩待训练图像集合,从而降低样本训练过程中的计算复杂度以及节省网络中的计算资源。
可选地,在上述图4对应的第一个实施例的基础上,本发明实施例提供的图像处理的方法第二个可选实施例中,获取待训练图像集合,可以包括:
获取目标输入图像;
采用线性滤波器对目标输入图像进行卷积处理,并获取到多个卷积样本图像;
采用非线性激活函数对多个卷积样本图像进行计算,并获取到待训练图像集合中的多个样本图像。
本实施例中,将介绍如何对待训练图像集合中的样本图像进行预处理。首先图像处理装置获取至少一张目标输入图像,为了便于理解,下面将以一张目标输入图像为例进行说明,请参阅图5,图5为本发明实施例中多个卷积样本图像的示意图,如图所示,这是经过Conv层计算后所得到的特征图Ci,即卷积样本图像。
Conv层的计算公式如下:
其中,式(1)中xi,j表示目标输入图像第i行第j列的元素,对滤波器的每一个权重进行编号,wi,j表示第i行第j列的权重值,wb表示滤波器的偏置项,对卷积样本图像的每个元素进行编号,ai,j表示卷积样本图像第i行第j列的元素,用f表示非线性激活函数,本发明所选用的非线性激活函数为ReLU函数。最后将第i个Conv层的输出结果结果记为Ci。
经过Conv层的计算之后,接着进行ReLU层的计算,并得到如图6所示的多个样本图像的示意图,其中,样本图像具体为特征图,特征图可以看作是一个函数将数据向量映射到特征空间,先采用多个线性滤波器对目标输入图像进行卷积操作,然后加上一个偏置,最后应用于一个非线性激活函数。请参阅图6,图6为本发明实施例中待训练图像集合中多个样本图像的示意图,ReLU层的计算公式如下:
Rj=max(0,Ci); (2)
其中,式(2)中Rj表示第j个ReLU层的输出结果,即本发明所要采用的样本图像。
图5和图6中,数值标号从到小所对应特征图像中从蓝到红,相比Conv层,Relu层由于经过了激活函数之后,可以把有价值的激活信号都过滤出来,分析起来更加方便。
再次,本发明实施例中,在图像处理装置训练特征样本图像之前,还需要预先对待训练图像集合中所有的样本图像进行预处理,即先获取至少一张目标输入图像,在该目标输入图像依次经过卷积计算和非线性激活函数之后,可以得到多个样本图像。通过上述方式,多个样本图像是经过了非线性激活函数计算而得到的,而采用非线性激活函数能够把有价值的激活信号都过滤处理,使得分析起来更加方便,且非线性激活函数本身页具有计算速度快,能够减轻梯度消失问题,以及激活率具有稀疏性的优势。
可选地,在上述图4对应的第三个实施例的基础上,本发明实施例提供的图像处理的方法第四个可选实施例中,判断待训练图像集合中的样本图像是否满足预设图像特征值提取条件,可以包括:
获取待训练图像集合中的样本图像的感兴趣区域ROI亮度值;
判断ROI亮度值是否小于或等于第一预置门限,若是,则确定样本图像满足预设图像特征值提取条件。
本实施例中,图像处理装置可以获取至少一个待训练图像集合中,每个样本图像的感兴趣区域(英文全称:region of interest,英文缩写:ROI),其中,样本图像的ROI是由用户预先设定的,可以从样本图像的背景中选取,也可以是从图层中选取,且不对选取区域的形状进行限定。
由于样本图像是经过ReLU层计算得到的,根据ReLU层查找样本图像中RIO被激活的部分,其中,如图6所示,背景较亮的则是被ReLU函数激活的,然后将这些背景较亮的样本图像的权重值和偏置值都设置为0,代入式(1)中就不难发现,这个样本图像不满足预设图像特征值提取条件。
在判断亮度时,具体可以以一个第一预置门限进行判断,如果ROI亮度值小于或等于第一预置门限,若是,则确定样本图像满足预设图像特征值提取条件,反之,如果ROI亮度值大于第一预置门限,那么这个样本图像就不满足预设图像特征值提取条件,从而将其剔除。其中,第一预置门限为预先设定的一个亮度预置值,通常是根据一系列经验数据确定的一个值,既可以是人为设定的,也可以是设备自动生成的,此处不作限定。
进一步地,本发明实施例中,图像处理装置还可以预先获取待训练图像集合中的样本图像的ROI亮度值,通过判断ROI亮度值是否小于或等于第一预置门限来确定是否满足预设图像特征值提取条件。通过上述方式,采用基于非线性激活函数来激活样本图像,通过获取ROI的亮度值来选择满足预设图像特征值提取条件的样本图像,亮度较高的ROI则是被非线性激活函数来激活的部分,这部分会造成图像输出不够干净,因此在训练模型的过程中将不采用这些样本图像,以此提升输出图像的白净化效果。
可选地,在上述图4对应的第四个实施例的基础上,本发明实施例提供的图像处理的方法第五个可选实施例中,判断ROI亮度值是否小于或等于第一预置门限,可以包括:
接收用户触发的样本提取指令,样本提取指令用于指示样本图像的ROI亮度值小于或等于第一预置门限;
根据样本提取指令确定样本图片的ROI亮度值小于或等于第一预置门限。
本实施例中,主要通过手动选取样本图像中符合亮度值小于或等于第一预置门限的样本图像,这些样本图像即为特征样本图像。
为了保持目标图像输出的背景白净化,需要训练得到一个较优的预置训练模型。请继续参阅图6,根据ReLU层计算得到的样本图像,用户可以一一进行查找,寻找背景被点亮的样本图像,其中,被点亮则是背景被激活的部分,也是造成图像输出背景不干净的原因,因此对症下药,将背景较亮的特征图的权重值wi,j和偏置值wb设置为0,即将该样本图像抹杀掉,因此也达到了参数减少和模型压缩的效果。将图6背景较亮的样本图像(例如第0号样本图像,第1号样本图像以及第7号样本图像)设置为0,最后输出的样本图像如图7所示,图7为本发明实施例中半自动化选取样本图像的示意图,用户通过手动选择图6中ROI亮度值小于或等于第一预置门限的样本图片,由此触发样本提取指令,使得图像处理装置可以根据该样本提取指令知道哪些样本图片小于或者等于第一预置门限,即可确定这些样本图像满足预设图像特征值提取条件。
更进一步地,本发明实施例中,提供了一种半自动选取样本图像的方式,图像处理装置接收用户手动选择的样本图像,并将这些样本图像作为特征样本图像进行模型训练。通过上述方式,用户可以根据需预置训练模型的需求选取符合要求的特征样本图像,从而提升方案的灵活性和可行性。
可选地,在上述图4对应的第四个实施例的基础上,本发明实施例提供的图像处理的方法第六个可选实施例中,判断ROI亮度值是否小于或等于第一预置门限,可以包括:
获取ROI亮度值与目标RIO亮度值之间的亮度差值,其中,目标RIO亮度值为预先设定的;
判断亮度差值是否大于或等于第二预置门限,若是,则确定ROI亮度值小于或等于第一预置门限。
本实施例中,在图像处理装置自动选择样本图像中的满足条件的特征样本图像时,需要预先选取一个标准模板,请参阅图8,图8为本发明实施例中目标感兴趣区域的模板示意图,在图8的左图中选择目标RIO区域,即人脸上方的区域,然后做成相应的目标RIO模板,该目标RIO模板的亮度值为Fm,具体如图8的右图所示,若设定的一个第二预置门限为T,并获取样本图像ROI的亮度值Fn,将ROI亮度值Fn与目标RIO亮度值Fm相减,从而得到亮度差值D,如果D小于T,则将该样本图像的权重值和偏置值设置为0,从而自动完成背景白净化处理和自动压缩的任务。
为便于理解,下面可以以一个具体应用场景对本发明中自动选取样本图像流程过程进行详细描述,请参阅图9,图9为本发明实施例中自动选取样本图像的流程示意图,具体为:
步骤201中,图像处理装置开始从待训练图像集合中进行样本图像的自动选取;
步骤202中,Fn表示每层的第n个样本图像,Fm表示与RIO对应的目标RIO模板,N表示该层样本图像的总个数,首先判断Fn-Fm是否小于T,T为预先设定的第二预置门限,如果是,则进入步骤203,反之,则跳转至步骤206;
步骤203中,当Fn-Fm<T成立时,则将这张样本图像Fn的权重值和偏置值均设置为0;
步骤204中,在将样本图像Fn的权重值和偏置值均设置为0之后,再进入对下一张样本图像的判断过程,即在n变为n+1时,可以进入下一张样本图像筛选;
步骤205中,判断n是否小于N,若是,则进入步骤202,开始新一轮的循环判断和计算,若否,则跳转至步骤209,完成对样本图像的自动选取;
步骤206中,图像处理装置对这张样本图像不执行任何操作;
步骤207中,继续对下一张样本图像进行判断,即n变为n+1,从而进入下一张样本图像筛选;
步骤208中,判断n是否小于N,若是,则进入步骤202,开始新一轮的循环判断和计算,若否,则跳转至步骤209,完成对样本图像的自动选取;
步骤209中,图像处理装置结束样本图像的自动选取。
更进一步地,本发明实施例中,提供了一种自动选取样本图像的方式,即图像处理装置获取ROI亮度值与目标RIO亮度值之间的亮度差值,然后若亮度差值是否大于或等于第二预置门限,则确定样本图像满足预设图像特征值提取条件。通过上述方式,可以由图像处理装置自动提取满足要求的特征样本图像,从而提升了方案的便利性和实用性。
为便于理解,下面还可以以一个具体应用场景对本发明中图像处理的过程进行详细描述,本方案主要是基于样本图像进行调参,对背景影响较大而对其他的局部特征不影响或者影响较小的样本图像进行权重值和偏置值置零处理,从而达到背景白净化和参数减少的目标,请参阅图10,图10为本发明应用场景中特征样本图像调参模块流程设计图,具体为:
模型文件加载模块301用于加载图片数据库中至少一张目标输入图像,在图像输入模块302中提取其中一张目标输入图像,然后在特征图可视化模块303中,将目标输入图像进行可视化处理,具体处理方式为先通过Conv层计算出卷积后的样本图像,在利用Relu算法对卷积后的样本图像进行计算,得到可视化的样本图像。于是,用户可以通过兴趣区域定义模块304来选取样本图像中的RIO,最后,有观察者决定模块305筛选出符合要求的特征样本图像,并采用特征样本图像进行预置训练模型的训练。
其中,在特征图可视化模块303中,可以采用基于Relu算法的可视化分析技术,请参阅图11,图11为应用场景中基于非线性激活函数的可视化技术分析示意图,如图所示,可视化技术的分析主要包括四个步骤,分别为兴趣区域定义、基于Relu算法进行查找、迭代优化策略结果生成和观察者决定。如图11所示,黑色边框表示图像的感兴趣区域,即RIO,中间图为基于Relu算法进行查找,确定出样本图像中被激活RIO部分,然后将该样本图像的权重值和偏置值均设置为0,之后对下一个样本图像执行同样的操作,进而生成优化结果。
下面对本发明中的图像处理装置进行详细描述,请参阅图12,本发明实施例中的图像处理装置为应用于图像处理的方法中的图像处理装置,图像处理装置40包括:
第一获取模块401,用于获取待处理图像;
处理模块402,用于采用预置训练模型对所述第一获取模块401获取的所述待处理图像进行处理,其中,所述预置图像训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;
第二获取模块403,用于根据所述处理模块402通过所述预置训练模型处理得到的处理结果,获取所述待处理图像所对应的目标图像。
本实施例中,第一获取模块401获取待处理图像,处理模块402采用预置训练模型对所述第一获取模块401获取的所述待处理图像进行处理,其中,所述预置图像训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像,第二获取模块403根据所述处理模块402通过所述预置训练模型处理得到的处理结果,获取所述待处理图像所对应的目标图像。
本发明实施例中,提供了一种图像处理的方法,图像处理装置先获取待处理图像,然后采用预置训练模型对待处理图像进行处理,其中,预置图像训练模型为特征样本图像与特征样本图像的激活函数的函数关系模型,且特征样本图像中包含满足预设图像特征值提取条件的图像,最后图像处理装置根据预置训练模型的处理结果,获取待处理图像所对应的目标图像。通过上述方式,将一些不满足预设图像特征值提取条件的样本图像在训练模型时进行剔除,可以有效地减少计算冗余和和空间浪费,同时这类模型的压缩率较高,能够应用于移动终端的应用程序,从而提升方案的实用性。
可选地,在上述图12所对应的实施例的基础上,请参阅图13,本发明实施例提供的图像处理装置的另一实施例中,
所述图像处理装置40还包括:
第三获取模块404,用于所述处理模块402采用预置训练模型对所述待处理图像进行处理之前,获取待训练图像集合,其中,所述待训练图像集合中包含多个样本图像;
判断模块405,用于判断第三获取模块404获取的所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件;
确定模块406,用于若所述判断模块405判断得到所述样本图像满足所述预设图像特征值提取条件,则将所述样本图像确定为所述特征样本图像,所述特征样本图像用于进行所述预置训练模型的训练。
其次,本发明实施例中,说明了图像处理装置预先选取特征样本图像的方法,主要是先获取包含多个样本图像的待训练图像集合,然后根据预设图像特征值提取条件来提取可以作为训练样本的特征样本图像,只需要采用这部分特征样本图像即可训练得到预置训练模型。通过上述方式,限定了在训练预置训练模型的过程中,并非将所有的样本图像都进行训练,而且选择一部分价值较高的样本图像,以此提升了样本训练的准确性,同时也减少了样本训练的资源,进而提升方案的实用性。
可选地,在上述图13所对应的实施例的基础上,请参阅图14,本发明实施例提供的图像处理装置的另一实施例中,
所述图像处理装置40还包括:
删除模块407,用于所述判断模块405判断所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件之后,若所述样本图像不满足所述预设图像特征值提取条件,则从所述待训练图像集合中删除所述样本图像。
再次,本发明实施例中,在图像处理装置根据预设图像特征值提取条件提取特征样本图像的过程中,还可以把没有通过筛选的样本图像从待训练图像集合中删除。通过上述方式,能够剔除待训练图像集合中不满足要求的样本图像,以此来压缩待训练图像集合,从而降低样本训练过程中的计算复杂度以及节省网络中的计算资源。
可选地,在上述图13所对应的实施例的基础上,请参阅图15,本发明实施例提供的图像处理装置的另一实施例中,
所述第三获取模块404包括:
第一获取单元4041,用于获取目标输入图像;
卷积单元4042,用于采用线性滤波器对所述第一获取单元4041获取的所述目标输入图像进行卷积处理,并获取到多个卷积样本图像;
计算单元4043,用于采用非线性激活函数对经过所述卷积单元4042卷积处理得到的所述多个卷积样本图像进行计算,并获取到所述待训练图像集合中的多个样本图像。
再次,本发明实施例中,在图像处理装置训练特征样本图像之前,还需要预先对待训练图像集合中所有的样本图像进行预处理,即先获取至少一张目标输入图像,在该目标输入图像依次经过卷积计算和非线性激活函数之后,可以得到多个样本图像。通过上述方式,多个样本图像是经过了非线性激活函数计算而得到的,而采用非线性激活函数能够把有价值的激活信号都过滤处理,使得分析起来更加方便,且非线性激活函数本身页具有计算速度快,能够减轻梯度消失问题,以及激活率具有稀疏性的优势。
可选地,在上述图15所对应的实施例的基础上,请参阅图16,本发明实施例提供的图像处理装置的另一实施例中,
所述判断模块405包括:
第二获取单元4051,用于获取所述待训练图像集合中的所述样本图像的感兴趣区域ROI亮度值;
判断单元4052,用于判断所述第二获取单元4051获取的所述ROI亮度值是否小于或等于第一预置门限,若是,则确定所述样本图像满足所述预设图像特征值提取条件。
进一步地,本发明实施例中,图像处理装置还可以预先获取待训练图像集合中的样本图像的ROI亮度值,通过判断ROI亮度值是否小于或等于第一预置门限来确定是否满足预设图像特征值提取条件。通过上述方式,采用基于非线性激活函数来激活样本图像,通过获取ROI的亮度值来选择满足预设图像特征值提取条件的样本图像,亮度较高的ROI则是被非线性激活函数来激活的部分,这部分会造成图像输出不够干净,因此在训练模型的过程中将不采用这些样本图像,以此提升输出图像的白净化效果。
可选地,在上述图16所对应的实施例的基础上,请参阅图17,本发明实施例提供的图像处理装置的另一实施例中,
所述判断单元4052包括:
接收子单元40521,用于接收用户触发的样本提取指令,所述样本提取指令用于指示所述样本图像的ROI亮度值小于或等于所述第一预置门限;
确定子单元40522,用于根据所述接收子单元40521接收的所述样本提取指令确定所述样本图片的ROI亮度值小于或等于所述第一预置门限。
更进一步地,本发明实施例中,图像处理装置接收用户手动选择的样本图像,并将这些样本图像作为特征样本图像进行模型训练。通过上述方式,用户可以根据需预置训练模型的需求选取符合要求的特征样本图像,从而提升方案的灵活性和可行性。
可选地,在上述图16所对应的实施例的基础上,请参阅图18,本发明实施例提供的图像处理装置的另一实施例中,
所述判断单元4052包括:
获取子单元40523,用于获取ROI亮度值与目标RIO亮度值之间的亮度差值,其中,所述目标RIO亮度值为预先设定的;
判断子单元40524,判断所述获取子单元40523获取的所述亮度差值是否大于或等于第二预置门限,若是,则确定所述ROI亮度值小于或等于所述第一预置门限。
更进一步地,本发明实施例中,提供了一种自动选取样本图像的方式,即图像处理装置获取ROI亮度值与目标RIO亮度值之间的亮度差值,然后若亮度差值是否大于或等于第二预置门限,则确定样本图像满足预设图像特征值提取条件。通过上述方式,可以由图像处理装置自动提取满足要求的特征样本图像,从而提升了方案的便利性和实用性。
本发明实施例还提供了另一种图像处理装置,如图19所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该图像处理装置可以为包括手机、平板电脑、个人数字助理(英文全称:Personal DigitalAssistant,英文缩写:PDA)、销售终端(英文全称:Point of Sales,英文缩写:POS)、车载电脑等任意终端设备,以图像处理装置为手机为例:
图19示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图19,手机包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路510、存储器520、输入单元530、显示单元540、传感器550、音频电路560、无线保真(英文全称:wirelessfidelity,英文缩写:WiFi)模块570、处理器580、以及电源590等部件。本领域技术人员可以理解,图19中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图19对手机的各个构成部件进行具体的介绍:
RF电路510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器580处理;另外,将设计上行的数据发送给基站。通常,RF电路510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称:LowNoise Amplifier,英文缩写:LNA)、双工器等。此外,RF电路510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(英文全称:Global System of Mobile communication,英文缩写:GSM)、通用分组无线服务(英文全称:General Packet Radio Service,GPRS)、码分多址(英文全称:CodeDivision Multiple Access,英文缩写:CDMA)、宽带码分多址(英文全称:Wideband CodeDivision Multiple Access,英文缩写:WCDMA)、长期演进(英文全称:Long TermEvolution,英文缩写:LTE)、电子邮件、短消息服务(英文全称:Short Messaging Service,SMS)等。
存储器520可用于存储软件程序以及模块,处理器580通过运行存储在存储器520的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元530可包括触控面板531以及其他输入设备532。触控面板531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器580,并能接收处理器580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除了触控面板531,输入单元530还可以包括其他输入设备532。具体地,其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541,可选的,可以采用液晶显示器(英文全称:LiquidCrystal Display,英文缩写:LCD)、有机发光二极管(英文全称:Organic Light-EmittingDiode,英文缩写:OLED)等形式来配置显示面板541。进一步的,触控面板531可覆盖显示面板541,当触控面板531检测到在其上或附近的触摸操作后,传送给处理器580以确定触摸事件的类型,随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图19中,触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路560、扬声器561,传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号,传输到扬声器561,由扬声器561转换为声音信号输出;另一方面,传声器562将收集的声音信号转换为电信号,由音频电路560接收后转换为音频数据,再将音频数据输出处理器580处理后,经RF电路510以发送给比如另一手机,或者将音频数据输出至存储器520以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图19示出了WiFi模块570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器520内的软件程序和/或模块,以及调用存储在存储器520内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器580可包括一个或多个处理单元;优选的,处理器580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器580中。
手机还包括给各个部件供电的电源590(比如电池),优选的,电源可以通过电源管理系统与处理器580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本发明实施例中,该终端所包括的处理器580还具有以下功能:
获取待处理图像;
采用预置训练模型对所述待处理图像进行处理,其中,所述预置图像训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;
根据所述预置训练模型的处理结果,获取所述待处理图像所对应的目标图像。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种图像处理的方法,其特征在于,包括:
获取待处理图像;
采用预置训练模型对所述待处理图像进行处理,其中,所述预置训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;
根据所述预置训练模型的处理结果,获取所述待处理图像所对应的目标图像;
所述采用预置训练模型对所述待处理图像进行处理之前,所述方法还包括:
获取待训练图像集合,其中,所述待训练图像集合中包含多个样本图像;
判断所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件;
若所述样本图像满足所述预设图像特征值提取条件,则将所述样本图像确定为所述特征样本图像,所述特征样本图像用于进行所述预置训练模型的训练;
所述判断所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件,包括:
获取所述待训练图像集合中的所述样本图像的感兴趣区域ROI亮度值;
判断所述ROI亮度值是否小于或等于第一预置门限,若是,则确定所述样本图像满足所述预设图像特征值提取条件。
2.根据权利要求1所述的方法,其特征在于,所述判断所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件之后,所述方法还包括:
若所述样本图像不满足所述预设图像特征值提取条件,则从所述待训练图像集合中删除所述样本图像。
3.根据权利要求1所述的方法,其特征在于,所述获取待训练图像集合,包括:
获取目标输入图像;
采用线性滤波器对所述目标输入图像进行卷积处理,并获取到多个卷积样本图像;
采用非线性激活函数对所述多个卷积样本图像进行计算,并获取到所述待训练图像集合中的多个样本图像。
4.根据权利要求1所述的方法,其特征在于,所述判断所述ROI亮度值是否小于或等于第一预置门限,包括:
接收用户触发的样本提取指令,所述样本提取指令用于指示所述样本图像的ROI亮度值小于或等于所述第一预置门限;
根据所述样本提取指令确定所述样本图像的ROI亮度值小于或等于所述第一预置门限。
5.根据权利要求1所述的方法,其特征在于,所述判断所述ROI亮度值是否小于或等于第一预置门限,包括:
获取ROI亮度值与目标ROI亮度值之间的亮度差值,其中,所述目标ROI亮度值为预先设定的;
判断所述亮度差值是否大于或等于第二预置门限,若是,则确定所述ROI亮度值小于或等于所述第一预置门限。
6.一种图像处理装置,其特征在于,包括:
第一获取模块,用于获取待处理图像;
处理模块,用于采用预置训练模型对所述第一获取模块获取的所述待处理图像进行处理,其中,所述预置训练模型为特征样本图像与所述特征样本图像的激活函数的函数关系模型,所述特征样本图像中包含满足预设图像特征值提取条件的图像;
第二获取模块,用于根据所述处理模块通过所述预置训练模型处理得到的处理结果,获取所述待处理图像所对应的目标图像;
所述图像处理装置还包括:
第三获取模块,用于所述处理模块采用预置训练模型对所述待处理图像进行处理之前,获取待训练图像集合,其中,所述待训练图像集合中包含多个样本图像;
判断模块,用于判断第三获取模块获取的所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件;
确定模块,用于若所述判断模块判断得到所述样本图像满足所述预设图像特征值提取条件,则将所述样本图像确定为所述特征样本图像,所述特征样本图像用于进行所述预置训练模型的训练;
所述判断模块包括:
第二获取单元,用于获取所述待训练图像集合中的所述样本图像的感兴趣区域ROI亮度值;
判断单元,用于判断所述第二获取单元获取的所述ROI亮度值是否小于或等于第一预置门限,若是,则确定所述样本图像满足所述预设图像特征值提取条件。
7.根据权利要求6所述的图像处理装置,其特征在于,所述图像处理装置还包括:
删除模块,用于所述判断模块判断所述待训练图像集合中的样本图像是否满足所述预设图像特征值提取条件之后,若所述样本图像不满足所述预设图像特征值提取条件,则从所述待训练图像集合中删除所述样本图像。
8.根据权利要求6所述的图像处理装置,其特征在于,所述第三获取模块包括:
第一获取单元,用于获取目标输入图像;
卷积单元,用于采用线性滤波器对所述第一获取单元获取的所述目标输入图像进行卷积处理,并获取到多个卷积样本图像;
计算单元,用于采用非线性激活函数对经过所述卷积单元卷积处理得到的所述多个卷积样本图像进行计算,并获取到所述待训练图像集合中的多个样本图像。
9.根据权利要求6所述的图像处理装置,其特征在于,所述判断单元包括:
接收子单元,用于接收用户触发的样本提取指令,所述样本提取指令用于指示所述样本图像的ROI亮度值小于或等于所述第一预置门限;
确定子单元,用于根据所述接收子单元接收的所述样本提取指令确定所述样本图像的ROI亮度值小于或等于所述第一预置门限。
10.根据权利要求6所述的图像处理装置,其特征在于,所述判断单元包括:
获取子单元,用于获取ROI亮度值与目标ROI亮度值之间的亮度差值,其中,所述目标ROI亮度值为预先设定的;
判断子单元,判断所述获取子单元获取的所述亮度差值是否大于或等于第二预置门限,若是,则确定所述ROI亮度值小于或等于所述第一预置门限。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611191518.3A CN108230232B (zh) | 2016-12-21 | 2016-12-21 | 一种图像处理的方法以及相关装置 |
PCT/CN2017/114568 WO2018113512A1 (zh) | 2016-12-21 | 2017-12-05 | 图像处理方法以及相关装置 |
US16/356,346 US10956783B2 (en) | 2016-12-21 | 2019-03-18 | Image processing method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611191518.3A CN108230232B (zh) | 2016-12-21 | 2016-12-21 | 一种图像处理的方法以及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108230232A CN108230232A (zh) | 2018-06-29 |
CN108230232B true CN108230232B (zh) | 2021-02-09 |
Family
ID=62624369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611191518.3A Active CN108230232B (zh) | 2016-12-21 | 2016-12-21 | 一种图像处理的方法以及相关装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10956783B2 (zh) |
CN (1) | CN108230232B (zh) |
WO (1) | WO2018113512A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10664718B1 (en) * | 2017-09-11 | 2020-05-26 | Apple Inc. | Real-time adjustment of hybrid DNN style transfer networks |
WO2019074339A1 (ko) * | 2017-10-15 | 2019-04-18 | 알레시오 주식회사 | 신호 변환 시스템 및 신호 변환 방법 |
CN110751283B (zh) * | 2018-07-05 | 2022-11-15 | 第四范式(北京)技术有限公司 | 模型解释方法、装置、设备及存储介质 |
CN110163048B (zh) | 2018-07-10 | 2023-06-02 | 腾讯科技(深圳)有限公司 | 手部关键点的识别模型训练方法、识别方法及设备 |
CN110930302B (zh) * | 2018-08-30 | 2024-03-26 | 珠海金山办公软件有限公司 | 一种图片处理方法、装置、电子设备及可读存储介质 |
CN109685749B (zh) * | 2018-09-25 | 2023-04-18 | 平安科技(深圳)有限公司 | 图像风格转换方法、装置、设备和计算机存储介质 |
US11367163B2 (en) | 2019-05-31 | 2022-06-21 | Apple Inc. | Enhanced image processing techniques for deep neural networks |
CN110675312B (zh) * | 2019-09-24 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置、计算机设备以及存储介质 |
CN110827375B (zh) * | 2019-10-31 | 2023-05-30 | 湖北大学 | 一种基于微光图像的红外图像真彩着色方法及系统 |
CN111598808B (zh) * | 2020-05-18 | 2022-08-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及其训练方法 |
CN113435454B (zh) * | 2021-05-21 | 2023-07-25 | 厦门紫光展锐科技有限公司 | 一种数据处理方法、装置及设备 |
CN113920404A (zh) * | 2021-11-09 | 2022-01-11 | 北京百度网讯科技有限公司 | 训练方法、图像处理方法、装置、电子设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104215584A (zh) * | 2014-08-29 | 2014-12-17 | 华南理工大学 | 一种基于高光谱图像技术区分大米产地的检测方法 |
CN105528638A (zh) * | 2016-01-22 | 2016-04-27 | 沈阳工业大学 | 灰色关联分析法确定卷积神经网络隐层特征图个数的方法 |
CN105809704A (zh) * | 2016-03-30 | 2016-07-27 | 北京小米移动软件有限公司 | 识别图像清晰度的方法及装置 |
CN106204467A (zh) * | 2016-06-27 | 2016-12-07 | 深圳市未来媒体技术研究院 | 一种基于级联残差神经网络的图像去噪方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4257615B2 (ja) * | 2006-07-14 | 2009-04-22 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
JPWO2012046671A1 (ja) * | 2010-10-06 | 2014-02-24 | 日本電気株式会社 | 測位システム |
US9396621B2 (en) * | 2012-03-23 | 2016-07-19 | International Business Machines Corporation | Systems and methods for false alarm reduction during event detection |
US9208567B2 (en) * | 2013-06-04 | 2015-12-08 | Apple Inc. | Object landmark detection in images |
CN103559504B (zh) * | 2013-11-04 | 2016-08-31 | 北京京东尚科信息技术有限公司 | 图像目标类别识别方法及装置 |
JP6277818B2 (ja) * | 2014-03-26 | 2018-02-14 | 日本電気株式会社 | 機械学習装置、機械学習方法、及びプログラム |
KR20180024200A (ko) * | 2016-08-29 | 2018-03-08 | 오드컨셉 주식회사 | 영상 검색 정보 제공 방법, 장치 및 컴퓨터 프로그램 |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
-
2016
- 2016-12-21 CN CN201611191518.3A patent/CN108230232B/zh active Active
-
2017
- 2017-12-05 WO PCT/CN2017/114568 patent/WO2018113512A1/zh active Application Filing
-
2019
- 2019-03-18 US US16/356,346 patent/US10956783B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104215584A (zh) * | 2014-08-29 | 2014-12-17 | 华南理工大学 | 一种基于高光谱图像技术区分大米产地的检测方法 |
CN105528638A (zh) * | 2016-01-22 | 2016-04-27 | 沈阳工业大学 | 灰色关联分析法确定卷积神经网络隐层特征图个数的方法 |
CN105809704A (zh) * | 2016-03-30 | 2016-07-27 | 北京小米移动软件有限公司 | 识别图像清晰度的方法及装置 |
CN106204467A (zh) * | 2016-06-27 | 2016-12-07 | 深圳市未来媒体技术研究院 | 一种基于级联残差神经网络的图像去噪方法 |
Also Published As
Publication number | Publication date |
---|---|
US10956783B2 (en) | 2021-03-23 |
CN108230232A (zh) | 2018-06-29 |
WO2018113512A1 (zh) | 2018-06-28 |
US20190213444A1 (en) | 2019-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108230232B (zh) | 一种图像处理的方法以及相关装置 | |
CN111368934B (zh) | 图像识别模型训练方法、图像识别方法以及相关装置 | |
CN107995429B (zh) | 一种拍摄方法及移动终端 | |
CN107959883B (zh) | 视频编辑推送方法、系统及智能移动终端 | |
CN110175995B (zh) | 一种基于病理图像的图像状态确定方法、装置以及系统 | |
CN110163367B (zh) | 一种终端部署方法和装置 | |
CN108073437B (zh) | 一种应用推荐方法及移动终端 | |
CN111060514B (zh) | 缺陷检测方法、装置及终端设备 | |
CN108419145A (zh) | 一种视频摘要的生成方法和装置以及计算机可读存储介质 | |
CN111612093A (zh) | 一种视频分类方法、视频分类装置、电子设备及存储介质 | |
CN106856543B (zh) | 一种图片显示方法、装置及移动终端 | |
CN110163342B (zh) | 一种模型压缩方法、装置、设备及存储介质 | |
CN109495616B (zh) | 一种拍照方法及终端设备 | |
CN109145809A (zh) | 一种记谱处理方法和装置以及计算机可读存储介质 | |
CN112184548A (zh) | 图像超分辨率方法、装置、设备及存储介质 | |
CN113284142A (zh) | 图像检测方法、装置、计算机可读存储介质及计算机设备 | |
CN109246474B (zh) | 一种视频文件编辑方法及移动终端 | |
CN111476629A (zh) | 一种数据预测方法、装置、电子设备及存储介质 | |
CN110083742B (zh) | 一种视频查询方法和装置 | |
CN110784672B (zh) | 一种视频数据传输方法、装置、设备及存储介质 | |
CN107330867B (zh) | 图像合成方法、装置、计算机可读存储介质和计算机设备 | |
CN113421211A (zh) | 光斑虚化的方法、终端设备及存储介质 | |
CN108319412A (zh) | 一种照片删除方法、移动终端和计算机可读存储介质 | |
CN110543276B (zh) | 图片的筛选方法及其终端设备 | |
CN110443852B (zh) | 一种图像定位的方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |