CN114004968A - 图像处理方法、装置、电子设备及存储介质 - Google Patents
图像处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114004968A CN114004968A CN202010740717.5A CN202010740717A CN114004968A CN 114004968 A CN114004968 A CN 114004968A CN 202010740717 A CN202010740717 A CN 202010740717A CN 114004968 A CN114004968 A CN 114004968A
- Authority
- CN
- China
- Prior art keywords
- image processing
- model
- data
- training
- data type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 165
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 63
- 238000012937 correction Methods 0.000 claims abstract description 43
- 238000013135 deep learning Methods 0.000 claims abstract description 19
- 238000013136 deep learning model Methods 0.000 claims abstract description 17
- 230000015654 memory Effects 0.000 claims description 27
- 230000004044 response Effects 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 abstract description 12
- 230000008569 process Effects 0.000 abstract description 5
- 238000004590 computer program Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000007667 floating Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Neurology (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种图像处理方法、装置、电子设备及存储介质。该方法包括:响应于接收到的图像处理指令,获取训练数据;利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;转换所述初始模型的数据类型;向转换后的初始模型中加入修正层;训练所述修正层的权重以优化所述初始模型,得到图像处理模型;从所述图像处理指令中获取待处理图像;将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。本发明能够基于优化的图像处理模型进行图像处理,同时保证了数据处理速度与准确度。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种图像处理方法、装置、电子设备及存储介质。
背景技术
原始的深度学习框架Caffe(Convolutional Architecture for Fast FeatureEmbedding,快速特征嵌入的卷积结构)只支持float(单精度浮点型)数据类型和double(双精度浮点型)数据类型,且目前大部分的训练、测试以及应用过程都是基于float数据类型来完成的。
但是,对于一些大网络,耗时及显存消耗很严重,尤其是在嵌入式设备中,很多网络甚至无法直接使用。
而在目前的解决方案中,仍然无法实现数据处理速度与准确度间的平衡。
发明内容
鉴于以上内容,有必要提供一种图像处理方法、装置、电子设备及存储介质,能够基于优化的图像处理模型进行图像处理,同时保证了数据处理速度与准确度。
一种图像处理方法,所述图像处理方法包括:
响应于接收到的图像处理指令,获取训练数据;
利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;
转换所述初始模型的数据类型;
向转换后的初始模型中加入修正层;
训练所述修正层的权重以优化所述初始模型,得到图像处理模型;
从所述图像处理指令中获取待处理图像;
将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
根据本发明优选实施例,所述转换所述初始模型的数据类型包括:
从所述图像处理指令中获取需求数据;
根据所述需求数据确定目标数据类型;
将所述初始模型转换为所述目标数据类型。
根据本发明优选实施例,所述根据所述需求数据确定目标数据类型包括:
根据所述需求数据确定要求的数据处理速度及要求的准确度;
响应于所述要求的数据处理速度大于或者等于预设速度,确定所述目标数据类型为int8;或者
响应于所述要求的准确度大于或者等于预设准确度,确定所述目标数据类型为半精度。
根据本发明优选实施例,数据类型为int8的模型的数据处理速度高于数据类型为半精度的模型的数据处理速度,且数据类型为int8的模型的准确度低于数据类型为半精度的模型的准确度。
根据本发明优选实施例,所述训练所述修正层的权重以优化所述初始模型,得到图像处理模型包括:
固定所述初始模型中各个层的权重以训练所述修正层的权重;
响应于模型的准确度大于或者等于预设阈值,停止训练,得到所述图像处理模型。
根据本发明优选实施例,所述训练所述修正层的权重以优化所述初始模型,得到图像处理模型还包括:
以全精度作为数据类型训练所述修正层的权重,得到所述图像处理模型。
根据本发明优选实施例,所述图像处理方法还包括:
构建验证数据集;
以所述验证数据集中的数据对所述图像处理模型进行验证。
一种图像处理装置,所述图像处理装置包括:
获取单元,用于响应于接收到的图像处理指令,获取训练数据;
训练单元,用于利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;
转换单元,用于转换所述初始模型的数据类型;
加入单元,用于向转换后的初始模型中加入修正层;
优化单元,用于训练所述修正层的权重以优化所述初始模型,得到图像处理模型;
所述获取单元,还用于从所述图像处理指令中获取待处理图像;
处理单元,用于将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
根据本发明优选实施例,所述转换单元转换所述初始模型的数据类型包括:
从所述图像处理指令中获取需求数据;
根据所述需求数据确定目标数据类型;
将所述初始模型转换为所述目标数据类型。
根据本发明优选实施例,所述转换单元根据所述需求数据确定目标数据类型包括:
根据所述需求数据确定要求的数据处理速度及要求的准确度;
响应于所述要求的数据处理速度大于或者等于预设速度,确定所述目标数据类型为int8;或者
响应于所述要求的准确度大于或者等于预设准确度,确定所述目标数据类型为半精度。
根据本发明优选实施例,数据类型为int8的模型的数据处理速度高于数据类型为半精度的模型的数据处理速度,且数据类型为int8的模型的准确度低于数据类型为半精度的模型的准确度。
根据本发明优选实施例,所述优化单元具体用于:
固定所述初始模型中各个层的权重以训练所述修正层的权重;
响应于模型的准确度大于或者等于预设阈值,停止训练,得到所述图像处理模型。
根据本发明优选实施例,所述优化单元具体还用于:
以全精度作为数据类型训练所述修正层的权重,得到所述图像处理模型。
根据本发明优选实施例,所述图像处理装置还包括:
构建单元,用于构建验证数据集;
验证单元,用于以所述验证数据集中的数据对所述图像处理模型进行验证。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述图像处理方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述图像处理方法。
由以上技术方案可以看出,本发明能够基于优化的图像处理模型进行图像处理,同时保证了数据处理速度与准确度。
附图说明
图1是本发明图像处理方法的较佳实施例的流程图。
图2是本发明图像处理装置的较佳实施例的功能模块图。
图3是本发明实现图像处理方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明图像处理方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述图像处理方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital SignalProcessor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,响应于接收到的图像处理指令,获取训练数据。
其中,所述图像处理指令可以由相关工作人员触发,本发明不限制。
所述训练数据可以包括图像数据、影像数据等。
S11,利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型。
其中,所述预设的深度学习架构可以包括,但不限于:TensorFlow、Caffe(Convolutional Architecture for Fast Feature Embedding,快速特征嵌入的卷积结构)架构。
所述Caffe架构是一个兼具表达性、速度和思维模块化的深度学习框架,支持多种类型的深度学习架构,并面向图像分类和图像分割。
并且,原始的Caffe架构只支持支持float(单精度浮点型)数据类型和double(双精度浮点型)数据类型。
在本实施例中,所述预设深度学习模型可以包括所述Caffe架构支持的任意深度学习模型。
例如:所述预设深度学习模型可以是CNN(Convolutional Neural Networks,卷积神经网络)、RCNN(Regions with CNN features,区域卷积神经网络)、LSTM(Long Short-Term Memory,长短期记忆网络)和全连接神经网络等。
S12,转换所述初始模型的数据类型。
所述初始模型的数据类型为全精度,数据处理速度较慢,因此,为了提高模型的数据处理速度,转换所述初始模型的数据类型。
在本实施例中,所述转换所述初始模型的数据类型包括:
从所述图像处理指令中获取需求数据;
根据所述需求数据确定目标数据类型;
将所述初始模型转换为所述目标数据类型。
具体地,所述根据所述需求数据确定目标数据类型包括:
根据所述需求数据确定要求的数据处理速度及要求的准确度,进一步地:
(1)响应于所述要求的数据处理速度大于或者等于预设速度,确定所述目标数据类型为int8。
可以理解的是,数据类型为int8的模型的数据处理速度高于数据类型为半精度的模型的数据处理速度,因此,当对数据处理速度要求较高,即所述要求的数据处理速度大于或者等于所述预设速度时,可以优先将所述目标数据类型确定为int8。
其中,所述预设速度可以根据模型实际所能达到的速度进行配置,本发明不限制。
(2)或者,响应于所述要求的准确度大于或者等于预设准确度,确定所述目标数据类型为半精度。
可以理解的是,数据类型为int8的模型的准确度低于数据类型为半精度的模型的准确度,因此,当对准确度要求较高,即所述要求的准确度大于或者等于预设准确度时,可以优先将所述目标数据类型确定为半精度。
其中,所述预设准确度可以根据模型实际所能达到的准确度进行配置,本发明不限制。
在上述实施方式中,在将数据类型转换为int8或者半精度后,由于每个数据的内存占用降低了,整个网络的内存消耗也随之降低,带宽消耗同时减少,性能也就随之提高,因此,两种转换方式都能在一定程度上提高数据处理速度,但是,由于两种数据类型的模型的处理速度和准确度都不同,因此,可以根据不同的任务需求在两种转换方式中进行选择。
当然,对于除上述(1)(2)外的其他情况,可以在两种转换方式中任选其一,或者根据预先配置进行默认选择,本发明不限制。
需要说明的是,由于数据类型间的转换属于习知技术,在此不赘述。
S13,向转换后的初始模型中加入修正层。
其中,所述修正层可以是新增的所述初始模型中的任意一层。
例如:所述修正层可以是新增的卷积层,还可以是新增的全连接层等。
S14,训练所述修正层的权重以优化所述初始模型,得到图像处理模型。
可以理解的是,在对所述初始模型进行了数据类型的转换后,所述初始模型的准确度将会有所降低,因此,为了在提高数据处理速度的同时保证模型的准确度,还需要对所述初始模型进行优化处理。
具体地,所述训练所述修正层的权重以优化所述初始模型,得到图像处理模型包括:
固定所述初始模型中各个层的权重以训练所述修正层的权重;
响应于模型的准确度大于或者等于预设阈值,停止训练,得到所述图像处理模型。
其中,所述预设阈值可以根据实际需求进行配置,以保证模型的精度满足任务需求。
在本实施例中,所述训练所述修正层的权重以优化所述初始模型,得到图像处理模型还包括:
以全精度作为数据类型训练所述修正层的权重,得到所述图像处理模型。
通过在所述修正层以全精度作为数据类型进行多次运算,使模型的准确度不断提升,最终达到准确度要求,得到优化后的数据处理速度及准确度同时满足需求的所述图像处理模型。
在本实施例中,所述图像处理方法还包括:
构建验证数据集;
以所述验证数据集中的数据对所述图像处理模型进行验证。
其中,所述验证数据集可以从历史数据中获取,也可以由指定组织或工作人员提供,只要保证数据的可靠性,本发明不限制。
通过上述实施方式,能够对所述图像处理模型进行进一步地验证,以保证所述图像处理模型的正确性及可用性。
S15,从所述图像处理指令中获取待处理图像。
其中,所述待处理图像可以由相关人员上传,也可以通过网络爬虫技术进行获取,本发明不限制。
S16,将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
例如:所述图像处理结果可以是图像分类结果,或者是图像分割结果等。
需要说明的是,根据不同的训练得到的图像处理模型不同,对应的图像处理结果也将不同,进而满足各种类型的图像处理任务。
由以上技术方案可以看出,本发明能够响应于接收到的图像处理指令,获取训练数据,并利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型,进一步转换所述初始模型的数据类型,以提高模型的数据处理速度,向转换后的初始模型中加入修正层,训练所述修正层的权重以优化所述初始模型,得到图像处理模型,以进一步提高模型的准确度,从所述图像处理指令中获取待处理图像,并将所述待处理图像输入至所述图像处理模型中,输出图像处理结果,实现基于优化的图像处理模型进行图像处理,同时保证了数据处理速度与准确度。
如图2所示,是本发明图像处理装置的较佳实施例的功能模块图。所述图像处理装置11包括获取单元110、训练单元111、转换单元112、加入单元113、优化单元114、处理单元115、构建单元116及验证单元117。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
响应于接收到的图像处理指令,获取单元110获取训练数据。
其中,所述图像处理指令可以由相关工作人员触发,本发明不限制。
所述训练数据可以包括图像数据、影像数据等。
训练单元111利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型。
其中,所述预设的深度学习架构可以包括,但不限于:TensorFlow、Caffe(Convolutional Architecture for Fast Feature Embedding,快速特征嵌入的卷积结构)架构。
所述Caffe架构是一个兼具表达性、速度和思维模块化的深度学习框架,支持多种类型的深度学习架构,并面向图像分类和图像分割。
并且,原始的Caffe架构只支持支持float(单精度浮点型)数据类型和double(双精度浮点型)数据类型。
在本实施例中,所述预设深度学习模型可以包括所述Caffe架构支持的任意深度学习模型。
例如:所述预设深度学习模型可以是CNN(Convolutional Neural Networks,卷积神经网络)、RCNN(Regions with CNN features,区域卷积神经网络)、LSTM(Long Short-Term Memory,长短期记忆网络)和全连接神经网络等。
转换单元112转换所述初始模型的数据类型。
所述初始模型的数据类型为全精度,数据处理速度较慢,因此,为了提高模型的数据处理速度,转换所述初始模型的数据类型。
在本实施例中,所述转换单元112转换所述初始模型的数据类型包括:
从所述图像处理指令中获取需求数据;
根据所述需求数据确定目标数据类型;
将所述初始模型转换为所述目标数据类型。
具体地,所述转换单元112根据所述需求数据确定目标数据类型包括:
根据所述需求数据确定要求的数据处理速度及要求的准确度,进一步地:
(1)响应于所述要求的数据处理速度大于或者等于预设速度,确定所述目标数据类型为int8。
可以理解的是,数据类型为int8的模型的数据处理速度高于数据类型为半精度的模型的数据处理速度,因此,当对数据处理速度要求较高,即所述要求的数据处理速度大于或者等于所述预设速度时,可以优先将所述目标数据类型确定为int8。
其中,所述预设速度可以根据模型实际所能达到的速度进行配置,本发明不限制。
(2)或者,响应于所述要求的准确度大于或者等于预设准确度,确定所述目标数据类型为半精度。
可以理解的是,数据类型为int8的模型的准确度低于数据类型为半精度的模型的准确度,因此,当对准确度要求较高,即所述要求的准确度大于或者等于预设准确度时,可以优先将所述目标数据类型确定为半精度。
其中,所述预设准确度可以根据模型实际所能达到的准确度进行配置,本发明不限制。
在上述实施方式中,在将数据类型转换为int8或者半精度后,由于每个数据的内存占用降低了,整个网络的内存消耗也随之降低,带宽消耗同时减少,性能也就随之提高,因此,两种转换方式都能在一定程度上提高数据处理速度,但是,由于两种数据类型的模型的处理速度和准确度都不同,因此,可以根据不同的任务需求在两种转换方式中进行选择。
当然,对于除上述(1)(2)外的其他情况,可以在两种转换方式中任选其一,或者根据预先配置进行默认选择,本发明不限制。
需要说明的是,由于数据类型间的转换属于习知技术,在此不赘述。
加入单元113向转换后的初始模型中加入修正层。
其中,所述修正层可以是新增的所述初始模型中的任意一层。
例如:所述修正层可以是新增的卷积层,还可以是新增的全连接层等。
优化单元114训练所述修正层的权重以优化所述初始模型,得到图像处理模型。
可以理解的是,在对所述初始模型进行了数据类型的转换后,所述初始模型的准确度将会有所降低,因此,为了在提高数据处理速度的同时保证模型的准确度,还需要对所述初始模型进行优化处理。
具体地,所述优化单元114训练所述修正层的权重以优化所述初始模型,得到图像处理模型包括:
固定所述初始模型中各个层的权重以训练所述修正层的权重;
响应于模型的准确度大于或者等于预设阈值,停止训练,得到所述图像处理模型。
其中,所述预设阈值可以根据实际需求进行配置,以保证模型的精度满足任务需求。
在本实施例中,所述优化单元114训练所述修正层的权重以优化所述初始模型,得到图像处理模型还包括:
所述优化单元114以全精度作为数据类型训练所述修正层的权重,得到所述图像处理模型。
通过在所述修正层以全精度作为数据类型进行多次运算,使模型的准确度不断提升,最终达到准确度要求,得到优化后的数据处理速度及准确度同时满足需求的所述图像处理模型。
在本实施例中,构建单元116构建验证数据集;
验证单元117以所述验证数据集中的数据对所述图像处理模型进行验证。
其中,所述验证数据集可以从历史数据中获取,也可以由指定组织或工作人员提供,只要保证数据的可靠性,本发明不限制。
通过上述实施方式,能够对所述图像处理模型进行进一步地验证,以保证所述图像处理模型的正确性及可用性。
所述获取单元110从所述图像处理指令中获取待处理图像。
其中,所述待处理图像可以由相关人员上传,也可以通过网络爬虫技术进行获取,本发明不限制。
处理单元115将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
例如:所述图像处理结果可以是图像分类结果,或者是图像分割结果等。
需要说明的是,根据不同的训练得到的图像处理模型不同,对应的图像处理结果也将不同,进而满足各种类型的图像处理任务。
由以上技术方案可以看出,本发明能够响应于接收到的图像处理指令,获取训练数据,并利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型,进一步转换所述初始模型的数据类型,以提高模型的数据处理速度,向转换后的初始模型中加入修正层,训练所述修正层的权重以优化所述初始模型,得到图像处理模型,以进一步提高模型的准确度,从所述图像处理指令中获取待处理图像,并将所述待处理图像输入至所述图像处理模型中,输出图像处理结果,实现基于优化的图像处理模型进行图像处理,同时保证了数据处理速度与准确度。
如图3所示,是本发明实现图像处理方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如图像处理程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如图像处理程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行图像处理程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个图像处理方法实施例中的步骤,例如图1所示的步骤S10、S11、S12、S13、S14、S15、S16。
或者,所述处理器13执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如:
响应于接收到的图像处理指令,获取训练数据;
利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;
转换所述初始模型的数据类型;
向转换后的初始模型中加入修正层;
训练所述修正层的权重以优化所述初始模型,得到图像处理模型;
从所述图像处理指令中获取待处理图像;
将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成获取单元110、训练单元111、转换单元112、加入单元113、优化单元114、处理单元115、构建单元116及验证单元117。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述图像处理方法的部分。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种图像处理方法,所述处理器13可执行所述多个指令从而实现:
响应于接收到的图像处理指令,获取训练数据;
利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;
转换所述初始模型的数据类型;
向转换后的初始模型中加入修正层;
训练所述修正层的权重以优化所述初始模型,得到图像处理模型;
从所述图像处理指令中获取待处理图像;
将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种图像处理方法,其特征在于,所述图像处理方法包括:
响应于接收到的图像处理指令,获取训练数据;
利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;
转换所述初始模型的数据类型;
向转换后的初始模型中加入修正层;
训练所述修正层的权重以优化所述初始模型,得到图像处理模型;
从所述图像处理指令中获取待处理图像;
将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
2.如权利要求1所述的图像处理方法,其特征在于,所述转换所述初始模型的数据类型包括:
从所述图像处理指令中获取需求数据;
根据所述需求数据确定目标数据类型;
将所述初始模型转换为所述目标数据类型。
3.如权利要求2所述的图像处理方法,其特征在于,所述根据所述需求数据确定目标数据类型包括:
根据所述需求数据确定要求的数据处理速度及要求的准确度;
响应于所述要求的数据处理速度大于或者等于预设速度,确定所述目标数据类型为int8;或者
响应于所述要求的准确度大于或者等于预设准确度,确定所述目标数据类型为半精度。
4.如权利要求3所述的图像处理方法,其特征在于:
数据类型为int8的模型的数据处理速度高于数据类型为半精度的模型的数据处理速度,且数据类型为int8的模型的准确度低于数据类型为半精度的模型的准确度。
5.如权利要求1所述的图像处理方法,其特征在于,所述训练所述修正层的权重以优化所述初始模型,得到图像处理模型包括:
固定所述初始模型中各个层的权重以训练所述修正层的权重;
响应于模型的准确度大于或者等于预设阈值,停止训练,得到所述图像处理模型。
6.如权利要求1所述的图像处理方法,其特征在于,所述训练所述修正层的权重以优化所述初始模型,得到图像处理模型还包括:
以全精度作为数据类型训练所述修正层的权重,得到所述图像处理模型。
7.如权利要求1所述的图像处理方法,其特征在于,所述图像处理方法还包括:
构建验证数据集;
以所述验证数据集中的数据对所述图像处理模型进行验证。
8.一种图像处理装置,其特征在于,所述图像处理装置包括:
获取单元,用于响应于接收到的图像处理指令,获取训练数据;
训练单元,用于利用预设的深度学习架构,以所述训练数据训练预设深度学习模型,得到初始模型;
转换单元,用于转换所述初始模型的数据类型;
加入单元,用于向转换后的初始模型中加入修正层;
优化单元,用于训练所述修正层的权重以优化所述初始模型,得到图像处理模型;
所述获取单元,还用于从所述图像处理指令中获取待处理图像;
处理单元,用于将所述待处理图像输入至所述图像处理模型中,输出图像处理结果。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的图像处理方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的图像处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010740717.5A CN114004968A (zh) | 2020-07-28 | 2020-07-28 | 图像处理方法、装置、电子设备及存储介质 |
US17/386,326 US20220036192A1 (en) | 2020-07-28 | 2021-07-27 | Image processing method, electronic device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010740717.5A CN114004968A (zh) | 2020-07-28 | 2020-07-28 | 图像处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114004968A true CN114004968A (zh) | 2022-02-01 |
Family
ID=79920610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010740717.5A Pending CN114004968A (zh) | 2020-07-28 | 2020-07-28 | 图像处理方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220036192A1 (zh) |
CN (1) | CN114004968A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109375912A (zh) * | 2018-10-18 | 2019-02-22 | 腾讯科技(北京)有限公司 | 模型序列化方法、装置及存储介质 |
CN110147710A (zh) * | 2018-12-10 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 人脸特征的处理方法、装置和存储介质 |
US20190347553A1 (en) * | 2018-05-08 | 2019-11-14 | Microsoft Technology Licensing, Llc | Training neural networks using mixed precision computations |
WO2020008643A1 (ja) * | 2018-07-06 | 2020-01-09 | 日本電気株式会社 | データ処理装置、データ処理回路およびデータ処理方法 |
WO2020039493A1 (ja) * | 2018-08-21 | 2020-02-27 | 日本電気株式会社 | 演算最適化装置、方法およびプログラム |
US20200225996A1 (en) * | 2019-01-15 | 2020-07-16 | BigStream Solutions, Inc. | Systems, apparatus, methods, and architectures for a neural network workflow to generate a hardware acceletator |
-
2020
- 2020-07-28 CN CN202010740717.5A patent/CN114004968A/zh active Pending
-
2021
- 2021-07-27 US US17/386,326 patent/US20220036192A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190347553A1 (en) * | 2018-05-08 | 2019-11-14 | Microsoft Technology Licensing, Llc | Training neural networks using mixed precision computations |
WO2020008643A1 (ja) * | 2018-07-06 | 2020-01-09 | 日本電気株式会社 | データ処理装置、データ処理回路およびデータ処理方法 |
WO2020039493A1 (ja) * | 2018-08-21 | 2020-02-27 | 日本電気株式会社 | 演算最適化装置、方法およびプログラム |
CN109375912A (zh) * | 2018-10-18 | 2019-02-22 | 腾讯科技(北京)有限公司 | 模型序列化方法、装置及存储介质 |
CN110147710A (zh) * | 2018-12-10 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 人脸特征的处理方法、装置和存储介质 |
US20200225996A1 (en) * | 2019-01-15 | 2020-07-16 | BigStream Solutions, Inc. | Systems, apparatus, methods, and architectures for a neural network workflow to generate a hardware acceletator |
Also Published As
Publication number | Publication date |
---|---|
US20220036192A1 (en) | 2022-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740732B (zh) | 神经网络处理器、卷积神经网络数据复用方法及相关设备 | |
CN111738212B (zh) | 基于人工智能的交通信号灯识别方法、装置、设备及介质 | |
CN111639153A (zh) | 基于法律知识图谱的查询方法、装置、电子设备及介质 | |
CN111476225B (zh) | 基于人工智能的车内人脸识别方法、装置、设备及介质 | |
CN111931729B (zh) | 基于人工智能的行人检测方法、装置、设备及介质 | |
CN111949708A (zh) | 基于时序特征提取的多任务预测方法、装置、设备及介质 | |
CN111950621A (zh) | 基于人工智能的目标数据检测方法、装置、设备及介质 | |
CN113868528A (zh) | 资讯推荐方法、装置、电子设备及可读存储介质 | |
CN111882873B (zh) | 轨迹异常检测方法、装置、设备及介质 | |
CN115205225A (zh) | 医学图像识别模型的训练方法、装置、设备及存储介质 | |
CN111985545A (zh) | 基于人工智能的目标数据检测方法、装置、设备及介质 | |
CN115600644A (zh) | 多任务处理方法、装置、电子设备及存储介质 | |
CN109583579B (zh) | 计算装置及相关产品 | |
CN114864043A (zh) | 基于vr设备的认知训练方法、装置及介质 | |
CN113204698B (zh) | 新闻主题词生成方法、装置、设备及介质 | |
CN114022841A (zh) | 人员监控识别方法、装置、电子设备及可读存储介质 | |
CN111950707B (zh) | 基于行为共现网络的行为预测方法、装置、设备及介质 | |
CN112132037B (zh) | 基于人工智能的人行道检测方法、装置、设备及介质 | |
CN114004968A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116401602A (zh) | 事件检测方法、装置、设备及计算机可读介质 | |
CN115346095A (zh) | 视觉问答方法、装置、设备及存储介质 | |
CN115239958A (zh) | 基于人工智能的轮毂损伤检测方法及相关设备 | |
TWI807204B (zh) | 影像處理方法、裝置、電子設備及存儲介質 | |
CN112233194B (zh) | 医学图片优化方法、装置、设备及计算机可读存储介质 | |
CN114548114A (zh) | 文本情绪识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |