CN108205802A - 深度神经网络模型训练、图片处理方法及装置和设备 - Google Patents

深度神经网络模型训练、图片处理方法及装置和设备 Download PDF

Info

Publication number
CN108205802A
CN108205802A CN201611213478.8A CN201611213478A CN108205802A CN 108205802 A CN108205802 A CN 108205802A CN 201611213478 A CN201611213478 A CN 201611213478A CN 108205802 A CN108205802 A CN 108205802A
Authority
CN
China
Prior art keywords
samples pictures
training
scrambling
neural network
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611213478.8A
Other languages
English (en)
Inventor
任思捷
徐立
严琼
孙文秀
戴宇荣
张熠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN201611213478.8A priority Critical patent/CN108205802A/zh
Publication of CN108205802A publication Critical patent/CN108205802A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例提供了一种深度神经网络模型训练方法及装置、图片处理方法及装置和电子设备。该模型训练方法基于训练样本图片库,对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,对所述深度神经网络模型的至少一次训练过程包括:利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;根据所述特征差异调整所述深度神经网络模型的网络参数。通过本方案,可以解决现有技术适用范围较小,导致实用性较低的问题。

Description

深度神经网络模型训练、图片处理方法及装置和设备
技术领域
本发明涉及图片处理技术领域,特别是涉及一种深度神经网络模型训练方法及装置、图片处理方法及装置和电子设备。
背景技术
为了达到较好的图像应用效果,图像处理中对于图片的质量有较高的要求。而由于图片中的干扰会对图片中信息的识别产生非常大的影响,因此,存在对有干扰图片进行处理的需求,其中,有干扰图片包括但不限于存在人工干扰的图片,人工干扰的类型包括但不局限于遮挡干扰。
传统关于遮挡类型的图片处理方法所基于的处理思想为:首先剪切上述遮挡,然后对缺失部分进行填充。
发明内容
本发明实施例的目的在于提供一种深度神经网络模型训练方法及装置、图片处理方法及装置和电子设备,以解决现有技术适用范围较小,导致实用性较低的问题。具体技术方案如下:
第一方面,本发明实施例提供了一种深度神经网络模型训练方法,所述方法包括:
基于训练样本图片库对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,对所述深度神经网络模型的至少一次训练过程包括:
利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;
确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;
根据所述特征差异调整所述深度神经网络模型的网络参数。
可选的,所述方法还包括:获取创建所述训练样本图片库所需的加扰样本图片。
可选的,所述获取创建所述训练样本图片库所需的加扰样本图片的步骤,包括:
对无扰样本图片进行加扰,获得与所述无扰样本图片对应的至少一张加扰样本图片,将所得到的加扰样本图片作为创建所述训练样本图片库所需的加扰样本图片。
可选的,所述确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异的步骤,包括:
利用损失函数,计算所述去扰处理图片的特征与所述加扰样本图片对应的无扰样本图片的特征之间的损失值。
可选的,所述训练完成条件包括:
训练次数不小于预定训练次数阀值;或者
所述损失值小于预定容差范围和/或所述损失值不大于预定阀值。
可选的,所述方法包括的不同次训练过程输入到所述深度神经网络中的加扰样本图片数量相同。
可选的,所述方法包括的不同次训练过程输入到所述深度神经网络中的加扰样本图片至少一张不同。
可选的,所述深度神经网络模型包括:一个损失计算层和至少一个处理层;
其中,起始的处理层的输入内容为某一次训练的加扰样本图片,其余的每个处理层的输入内容为上一处理层的输出内容,终止的处理层的输出内容为该次训练的加扰图片所对应的去扰处理图片;所述损失计算层的输入内容为终止的处理层输出的去扰处理图片以及该次训练的加扰样本图片所对应的无扰样本图片,输出内容为去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异。
第二方面,本发明实施例还提供了一种图片处理方法,所述方法包括:
获得包括干扰信息的目标图片;
基于本发明所提供的深度神经网络模型训练方法训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
可选的,所述干扰信息的种类包括以下至少之一:噪声和遮挡。
第三方面,本发明实施例提供了一种深度神经网络模型训练装置,所述装置基于训练样本图片库对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,通过训练模块对所述深度神经网络模型进行至少一次训练,所述训练模块包括:
去扰单元,用于利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;
确定单元,用于确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;
调整单元,用于根据所述特征差异调整所述深度神经网络模型的网络参数。
可选的,所述装置还包括:获取模块,具体用于获取创建所述训练样本图片库所需的加扰样本图片。
可选的,所述获取模块包括:
加扰单元,用于对无扰样本图片进行加扰,获得与所述无扰样本图片对应的至少一张加扰样本图片,将所得到的加扰样本图片作为创建所述训练样本图片库所需的加扰样本图片。
可选的,所述确定单元具体用于:
利用损失函数计算所述去扰处理图片的特征与所述加扰样本图片对应的无扰样本图片的特征之间的损失值。
可选的,所述训练完成条件包括:
训练次数不小于预定训练次数阀值;或者
所述损失值小于预定容差范围和/或所述损失值不大于预定阀值。
可选的,所述装置包括的不同次训练过程输入到所述深度神经网络中的加扰样本图片数量相同。
可选的,所述装置包括的不同次训练过程输入到所述深度神经网络中的加扰样本图片至少一张不同。
可选的,所述深度神经网络模型包括:一个损失计算层和至少一个处理层;
其中,起始的处理层的输入内容为某一次训练的加扰样本图片,其余的每个处理层的输入内容为上一处理层的输出内容,终止的处理层的输出内容为该次训练的加扰图片所对应的去扰处理图片;所述损失计算层的输入内容为终止的处理层输出的去扰处理图片以及该次训练的加扰样本图片所对应的无扰样本图片,输出内容为去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异。
第四方面,本发明实施例提供了一种图片处理装置,所述装置包括:
获得模块,用于获得包括干扰信息的目标图片;
处理模块,用于基于本发明所提供的深度神经网络模型训练装置训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
可选的,所述干扰信息的种类包括以下至少之一:噪声和遮挡。
第五方面,本发明实施例提供了一种电子设备,包括:处理器、存储器、总线、通信部,其中,所述处理器与所述存储器通信以执行指令,通过所述总线与所述通信部相连接,并通过所述通信部与其他设备通信;
所述处理器通过读取所述存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以执行本发明实施例提供的深度神经网络模型训练方法或图片处理方法。
本发明实施例所提供的深度神经网络模型训练方法、装置及电子设备中,基于训练样本图片库优化训练得到深度神经网络模型。由于训练样本图片库基于大数据训练优化得到,可以通过训练得到的深度神经网络模型处理具有各类复杂的带有干扰的图片,因此,可以解决现有技术适用范围较小,导致实用性较低的问题。
另外,本发明实施例所提供的图片处理方法、装置及电子设备中,在获得待处理的具有干扰的目标图片后;将该目标图片输入预先训练完成的深度神经网络模型,得到处理后图片,该深度神经网络模型通过本发明实施例所提供的深度神经网络模型训练方法预先训练完成。可见,由于深度神经网络模型基于大数据训练优化得到,使得该图片处理方法可以适用于具有各类复杂的带有干扰信息的图片,因此,可以解决现有技术适用范围较小,导致实用性较低的问题。同时,由于使用优化训练得到深度神经网络模型来处理图片,无需人工干预,可以保证较高的图片处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1(a)为存在条纹遮挡干扰图片,图1(b)为存在字符遮挡干扰的图片;
图2为本发明实施例所提供的一种深度神经网络模型训练方法的流程图;
图3为本发明实施例所提供的一种深度神经网络模型训练方法的另一流程图;
图4为本发明实施例所提供的一种图片处理方法的流程图;
图5为本发明实施例所提供的一种深度神经网络模型训练装置的结构示意图;
图6为本发明实施例所提供的一种图片处理装置的结构示意图;
图7为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的图片处理方法仅仅适用于具有简单规律的干扰,无法适用于随机性较大的干扰,例如:图1(a)所示的没有规律的遮挡,以及图1(b)所示的属于字符的遮挡。因此,传统图片处理方法适用范围较小,导致实用性较低。
因此,本发明实施例提供了一种深度神经网络模型训练方法及装置、图片处理方法及装置和电子设备,以解决现有技术中图片处理方法适用范围较小,导致实用性较低的问题。
首先对本发明实施例的一种深度神经网络模型训练方法进行介绍,需要说明的是,本发明实施例所提供的一种深度神经网络模型训练方法的执行主体可以为一种深度神经网络模型训练装置,该深度神经网络模型训练装置可以应用于任意带有数据处理能力的电子设备,所述电子设备可以为台式计算机、个人笔记本电脑、平板电脑、智能手机等终端,甚至可以为服务器。另外,该深度神经网络模型训练装置可以为专门的功能软件,例如:专用的图像处理软件、专用的相机软件等;当然,该深度神经网络模型训练装置也可以为现有各种相关软件的功能插件,举例而言,现有软件可以为图片编辑类软件、相机类软件等等。
如图2所示,本发明实施例所提供的一种深度神经网络模型训练方法,基于训练样本图片库对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,对所述深度神经网络模型的至少一次训练过程可以包括如下步骤:
S201:利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;
其中,深度神经网络模型为训练之前构建的模型,可选的,本发明实施例所构建的深度神经网络模型所包括的处理层的层级可以与现有技术所存在的层级相同,当然,也可以是基于现有技术中的深度神经网络模型所自行设置的层级。例如:深度神经网络模型可以包括卷积层、非线性单元层、下采样层、反传迭代层等不同的处理层,当然并不局限于此。
需要说明的是,对于深度神经网络模型而言,其如果具有特定功能的处理层,那么,各个处理层所包括的参数类型是确定的,而构建初始的深度神经网络模型时,需要对各处理层所包括的参数进行初始值的设定,所有处理层的参数统称为网络参数。
可以理解的是,加扰样本图片所具有的干扰可以为遮挡类干扰或噪声类干扰,具体的,该遮挡类干扰可以为有规律的遮挡,当然也可以为无规律的杂乱遮挡,例如文字、网纹,如图1(a)、(b)所示;噪声类干扰包括但不限于高斯噪声、椒盐噪声、模糊等。并且,所谓的干扰包括但不局限于遮挡类干扰、噪声,还可以为对图片人工加入的其他干扰信息。
可选的,深度神经网络模型对加扰图片进行处理的过程具体可以为:从训练样本图片库中选取训练所需的加扰样本图片;获得当前加扰样本图片的特征数据;将当前加扰样本图片的特征数据输入上述深度神经网络模型进行处理以对深度神经网络模型进行训练,得到当前加扰样本图片对应的去扰处理图片。
可选的,加扰样本图片的选取方式可以按照一定规律,例如按样本图片的存储顺序、按照图片大小等等。当然,样本图片的选取方式也可以为随机提取。
深度神经网络模型处理上述特征数据的过程可以为:依次使深度神经网络模型中各处理层根据每一处理层所包括的参数对加扰样本图片的特征数据进行计算处理。
本发明实施例中所提及的特征数据的数据类型可以包括单通道像素数据、多通道像素数据或一阶差分后的多通道数据,等等,并且,通过特征数据可以唯一确定出加扰样本图片。其中,一阶差分后的多通道数据具体可以为做横向和纵向一阶差分后的多通道数据,当然并不局限于此。并且,多通道的图像,例如rgb图,每个像素点都有3个值表示,所以就是3通道,此时,特征数据为3通道像素数据;而单通道的图像,每个像素点只有1个值表示颜色,即灰度图。
需要说明的是,获得特征数据的具体实现方式可以采用现有技术中的任一种实现方式,在此不做限定。
S202:确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;
上述特征差异是判断是否结束训练的依据,并根据不同的判断结果执行不同的处理,具体的,判断上述特征差异是否符合预定的训练完成条件,若不符合,执行步骤S203,以完成本次训练;否则,结束训练。
可以理解的是,上述特征差异所反映的意义可以为上述去扰处理图片与上述无扰样本图片的差异,其具体体现可以是一个具体的数字也可以是百分数。进一步的,上述特征差异的计算依据可以是利用上述去扰处理图片与上述无扰样本图片的特征计算而得,进一步可以利用上述去扰处理图片和上述无扰样本图片的特征数据计算而得。
可选的,特征差异可以是去扰处理图片的特征数据与加扰样本图片的特征数据之间的特征差异。
可选的,可以通过损失计算层确定上述特征差异,具体的,当前去扰处理图片为损失计算层的主要输入信号,相应无扰样本图片作为附属监督信号与所述各个处理输出结果一起输入至上述损失计算层。损失计算层包括但不限于欧式距离损失函数(EuclideanLoss)层。
S203:根据所述特征差异调整所述深度神经网络模型的网络参数。
可选的,调整参数的过程可以为将参数增大或减小的过程。例如,特征差异不符合预定条件,经分析是由于某一处理层的参数较大,因此,调整参数的过程就是增大参数的过程;或者,经分析是由于某一处理层的参数较小导致特征差异不符合预定条件,因此,调整参数的过程就是减小参数的过程。当然,在实际情况下,参数调整过程中,可以不是针对某一个参数的调整,可以是针对多个参数的调整,那么在此时参数的调整过程既包括增大参数也包括减小参数。
可选地,在一种实现方式中,可以通过误差反向传播算法,调整所述神经网络模型的网络参数。具体的,误差反向传播算法将S202所得结果逐层带回,进而获取每一层的误差信号,进而调整每层参数,直至满足预定的训练完成条件。需要强调的是,通过误差反向传播算法调整模型参数仅仅作为示例性说明,并不应该构成对本发明实施例的限定,现有技术中其他能够调整模型参数的算法也可应用于本发明实施例。
本发明实施例所提供的深度神经网络模型训练方法中,基于训练样本图片库优化训练得到深度神经网络模型。由于训练样本图片库基于大数据训练优化得到,可以通过训练得到的深度神经网络模型处理具有各类带有干扰的图片,因此,可以解决现有技术适用范围较小,导致实用性较低的问题。
可选的,本发明实施例提供的深度神经网络模型训练方法还包括:获取创建所述训练样本图片库所需的加扰样本图片的步骤。
其中,获取上述加扰样本图片的方式存在多种,本发明实施例在此不做限定。例如,从互联网直接获取上述加扰样本图片;又如通过对无扰样本图片添加干扰的方式获取上述加扰样本图片,具体的,以添加干扰的方式获取上述加扰样本图片的步骤可以包括:对无扰样本图片进行加扰,获得与上述无扰样本图片对应的至少一张加扰样本图片,将所得到的加扰样本图片作为上述加扰样本图片。所添加的干扰可以包括:网纹、遮挡、水印。本发明实施例不限定网纹的形状、宽度,同时也不限定遮挡的类型、水印的形状、水印的透明度。
可选地,为了完善上述训练样本图片库的加扰样本图片与无扰样本图片的种类,在一种实现方式中,选取一定数量的加扰样本图片和上述加扰样本图片所对应的无扰样本图片,分别对上述加扰样本图片和上述无扰样本图片做相同的预定变化处理;将处理后的无扰样本图片和加扰样本图片存储至上述训练样本图片库。
具体的,预定变化处理包括:由镜像、平移、缩放和旋转中至少一种方式所构成的变化处理,当然并不局限于此。
以下针对变化处理举例进行解释说明:假设选取100张加扰样本图片和对应的100张无扰样本图片,对上述加扰样本图片和无扰样本图片执行如下处理:
处理步骤一:对100张加扰样本图片和相应的无扰样本图片分别进行预定方向的平移处理,得到平移后的100张加扰样本图片和相应无扰样本图片;
处理步骤二:对100张加扰样本图片和相应的无扰样本图片分别进行预定比例的缩小处理,得到缩小后的100张加扰样本图片和相应无扰样本图片;
处理步骤三:对100张加扰样本图片和相应的无扰样本图片分别进行预定方向的旋转处理,得到旋转后的100张加扰样本图片和相应无扰样本图片;
处理步骤四:对100张加扰样本图片和相应的无扰样本图片分别进行预定方向的旋转处理后再进行预定比例的放大处理,得到旋转及放大处理后的100张加扰样本图片和相应无扰样本图片;
处理步骤五:对100张加扰样本图片和相应的无扰样本图片分别进行预定方向的镜像(即折叠)处理,得到旋转后的100张加扰样本图片和相应无扰样本图片。
在处理完毕后,将经过处理步骤一、处理步骤二、处理步骤三和处理步骤四、处理步骤五所处理后的无扰样本图片和处理之前的无扰样本图片(总共600张)存储至上述训练样本图片库,将经过处理步骤一、处理步骤二、处理步骤三、处理步骤四和处理步骤五所处理后的无扰样本图片和处理之前的无扰样本图片(总共600张)存储至上述训练样本图片库。
在上述任一可选实施例的基础上,步骤S202可以包括:利用损失函数计算上述去扰处理图片的特征与所述加扰样本图片对应的无扰样本图片的特征之间的损失值。可选的,损失计算函数计算上述损失值的过程可以为:损失函数获取去扰处理图片的特征和上述无扰样本图片的特征,将去扰处理图片特征与无扰样本图片进行比对,将比对结果作为损失值。
在本发明实施例中,可选的,通过判断损失值是否满足预定的训练完成条件,以决定是否结束训练。预定的训练完成条件可以包括:损失值小于预定容差范围和/或所述损失值不大于预定阀值;或者,预定的训练完成条件可以为训练次数不小于预定训练次数阀值。
可选的,训练同一深度神经网络模型时,对于训练上述网络模型所利用的加扰样本图片,不同次训练过程输入到上述网络模型中的加扰样本图片数量相同。也就是说,当上述网络模型的结构确定后,训练中输入至上述网络模型的加扰样本图片的数量即被确定,上述数量不能因为训练次数的不同而被改变。对于上述数量的具体数值,可以由工作人员根据需求设定任意数值,本发明实施例在此不做限定。
可选的,不同次训练过程输入到上述网络模型中的加扰样本图片至少一张不同。也就是说不同次输入至上述网络模型的加扰样本图片需要不同,但是不同的图片数量在此不做限定,例如,不同次输入的加扰样本图片可以有1张不同、2张不同、3张不同、或者更多张不同。
对于深度神经网络模型的结构,可以包括:一个损失计算层和至少一个处理层;
其中,起始的处理层的输入内容为某一次训练的加扰样本图片,其余的每个处理层的输入内容为上一处理层的输出内容,终止的处理层的输出内容为该次训练的加扰图片所对应的去扰处理图片;所述损失计算层的输入内容为终止的处理层输出的去扰处理图片以及该次训练的加扰样本图片所对应的无扰样本图片,输出内容为上述去扰处理图片与上述无扰样本图片之间的特征差异。
具体的,在实际应用中,处理层可以为1个、2个、3个、4个、5个或者更多。在实际应用中,可以根据实际情况设置处理层的数量,本实施例并不对处理层的数量做限定。
可以理解的是,上述深度神经网络模型的处理层种类可以包括:用于对本层所输入内容进行滤波的卷积层、用于对本层的输入内容进行非线性运算的非线性运算层、用于对本层的输入进行采样的下采样层、用于为本层参数调整提供基础的上采样层,当然并不局限于此。具体的,上述卷积层的卷积核大小可以为1*1、3*3、6*6或9*9,等等,每一层卷积核的数量可以有3个、12个、16个或24个等等;上述的非线性运算层可以包括但不限于现有的relu(Rectified Linear Units,校正激活函数单元)层和强制非负校正函数(maxout)层;上述的下采样层包括但不限于pooling(池化单元)层和反卷积(deconvolution)层。
为了更加形象地介绍本发明实施例的深度神经网络模型,下面列举一种深度神经网络模型。具体如下:
如图3所示,该深度神经网络包括6个卷积层,卷积层之间是relu层(即校正激活函数单元)实现非线性运算,每个卷积层的参数如图3所示。其中每一个卷积层的卷积核尺寸代表卷积核大小;输出通道代表此卷积层的卷积核数量。例如卷积核尺寸:3,输出通道:12,则代表此层拥有12个卷积核,每一卷积核大小为3*3。这样的一个卷积层的输出内容为多通道图像,即由特征数据构成的图像特征图,其输出的结果是一个和输入内容长宽相同、12通道的图像特征图,然后将输出送入校正激活函数单元进行非线性运算,其中,relu实现的非线性操作为:当输入内容大于等于0,保持原值并输出;小于0时,将输入内容置为0并输出。
经过6次卷积与非线性运算之后,会得到一个和原图大小相同的三通道图像,即为去扰处理图片的图像特征图,在训练时将输出结果与无网纹三通道监督图像送入欧式距离损失函数层然后进行梯度反传,进而对深度神经网络模型进行优化训练。当欧式距离损失函数所计算出的损失值在预定范围内波动且其平均值小于预定阀值,则可以认定此模型优化完成。
更进一步的,本发明实施例还提供了一种图片处理方法,以利用本发明实施例所提供的一种深度模型训练方法训练而成的深度神经网络模型,来处理具有干扰的图片,从而解决现有技术适用范围较小,导致实用性较低的问题。
需要说明的是,本发明实施例所提供的一种图片处理方法的执行主体可以为一种图片处理装置,该图片处理装置可以应用于任一带有数据处理的电子设备,所述电子设备可以为台式计算机、个人笔记本电脑、平板电脑等终端,甚至可以为服务器。另外,该图片处理装置可以为专门的功能软件,例如:专用图像处理软件、专用相机软件等;当然,该图片处理装置也可以为现有各种相关软件的功能插件,举例而言,现有软件可以为图片编辑类软件、相机类软件等等。
如图4所示,本发明实施例提供的一种图片处理方法,包括:
S401:获得包括干扰信息的待处理的目标图片;
其中,上述目标图片可以为静态图像和/或视频帧图像。
S402:基于预先训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
其中,上述预先训练完成的深度神经网络模型为利用本发明提供的深度神经网络模型训练方法训练完成。
具体的,所述基于预先训练完成的深度神经网络模型去除所述目标图片中的干扰信息的步骤包括:提取步骤S401所获得的目标图片的目标特征数据;将所提取的目标特征数据输入预先训练完成的深度神经网络模型,得到目标输出结果;基于上述目标输出结果,得到所述目标图片所对应的去除干扰后的处理后图片。具体的,提取上述目标图片的目标特征数据的具体实现方式可以采用现有技术中的任一具体实现方式,在此不做限定。可以理解的是,目标特征数据的数据类型与所利用的深度神经网络模型具有相关性,即目标特征数据的数据类型与训练模型所利用加扰样本图片的特征数据的数据类型相同,本发明实施例不做限定。目标输出结果的数据类型与目标特征数据类型相同,对于不同数据类型的目标输出结果而言,基于目标输出结果,得到所述目标图片所对应的去除干扰后的处理后图片的实现方式不同,由现有技术实现。
需要说明的是,该图片处理方法为运行于终端中的客户端软件时,由于客户端本地的存储空间有限,深度神经网络模型通常存在客户端软件相关联的服务器中,因此,上述将所获得的目标特征数据输入预先训练完成的深度神经网络模型,得到目标输出结果的步骤,可以包括:将所述目标特征数据发送至相应的服务器,以使得该服务器获得上述目标特征数据,并将所述目标特征数据输入预先优化训练完成的深度神经网络模型,得到所述目标图片所对应的目标输出结果,并将所述目标图片所对应的目标输出结果反馈至该客户端软件,客户端接收到上述目标输出结果后,基于上述目标输出结果生成无干扰的处理后图片。
本发明实施例所提供的图片处理方法中,在获得待处理的具有干扰的目标图片后;将该目标图片输入预先训练完成的深度神经网络模型,得到处理后图片,该深度神经网络模型通过本发明实施例所提供的深度神经网络模型训练方法预先训练完成。可见,由于深度神经网络模型基于大数据训练优化得到,使得该图片处理方法可以适用于具有各类复杂的干扰的图片,因此,可以解决现有技术适用范围较小,导致实用性较低的问题。同时,由于使用优化训练得到深度神经网络模型来处理图片,无需人工干预,可以保证较高的图片处理效率。
可选的,上述的目标图片所具有的干扰信息可以包括噪声和遮挡中至少之一。也就是说,干扰信息可以为遮挡类干扰,或者为噪声,或者同时包括遮挡类干扰和噪声。具体的,该遮挡类干扰可以为有规律的遮挡,也可以为无规律的遮挡类干扰,具体的,该遮挡类干扰可以包括:网纹、图片遮挡、文字遮挡、水印等等,本发明实施例不限定网纹的形状、宽度,同时也不限定遮挡的类型、水印的形状、水印的透明度。对于上述噪声的类型,可以为高斯噪声、椒盐噪声、模糊等。并且,所谓的干扰包括但不局限于遮挡类干扰和噪声,还可以为对图片人工加入的其他干扰信息。
需要说明的是,利用深度神经网络模型所处理的图片的干扰的类型可以为多种,也可以为一种,具体能够处理的种类与训练深度神经模型时所利用的加扰样本图片相关,举例而言:当加扰样本图片中所存在的人工干扰仅仅为遮挡干扰时,利用该深度神经网络模型处理存在遮挡干扰的图片时所产生的处理效果最佳;当加扰样本图片中所存在的干扰为遮挡干扰以及其他干扰时,利用该深度神经网络模型可以处理存在遮挡干扰或该其他干扰的图片。
可选地,在一种实现方式中,S401中目标图片的目标特征数据以及S402中处理上述目标图片时所获得的目标输出结果的数据类型包括:单通道像素数据或多通道像素数据;此时,基于目标输出结果,得到目标图片所对应的去除干扰后的处理后图片的步骤,包括:根据目标输出结果生成图片;将所生成的图片确定为目标图片所对应的去除干扰后的处理后图片。其中,目标输出结果为所生成图片的唯一对应的特征数据。
可以理解的是,上述多通道的图像每个像素点有多个值表示。例如rgb图,每个像素点都有3个值表示,所以就是3通道,此时,特征数据为3通道像素数据。单通道的图像,每个像素点只有1个值表示颜色,即灰度图。
可选地,在另一种实现方式中,目标特征数据以及目标输出结果的数据类型包括:一阶差分后的多通道数据;此时,基于目标输出结果,得到目标图片所对应的去除干扰后的处理后图片的步骤,包括:对目标输出结果进行逆运算重构处理;其中,上述逆运算重构处理为:一阶差分后的多通道数据所对应的生成方式的逆过程;根据逆运算重构处理所得结果生成图片;将所生成的图片确定为上述目标图片所对应的去除干扰后的处理后图片。
其中,由于一阶差分后的多通道数据为对图片中的多通道像素数据的一阶差分处理,因此,在得到某一图片的一阶差分后的多通道数据后,需要执行一阶差分后的多通道数据所对应的生成方式的逆过程,得到多通道像素数据,进而基于所得到的多通道像素数据来生成该图片。
另一方面,相应于上述的深度神经网络训练方法,本发明实施例还提供了一种深度神经网络模型训练装置。如图5所示,本发明实施例提供的一种深度神经网络模型训练装置,基于训练样本图片库对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,通过训练模块对所述深度神经网络模型进行至少一次训练,所述训练模块包括:
去扰单元510,用于利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;
确定单元520,用于确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;
调整单元530,用于根据所述特征差异调整所述深度神经网络模型的网络参数。
可选的,所述装置还包括:获取模块,具体用于获取创建所述训练样本图片库所需的加扰样本图片。
可选的,所述获取模块包括:
加扰单元,用于对无扰样本图片进行加扰,获得与所述无扰样本图片对应的至少一张加扰样本图片,将所得到的加扰样本图片作为创建所述训练样本图片库所需的加扰样本图片。
可选的,所述确定单元520具体用于:
利用损失函数计算所述去扰处理图片的特征与所述加扰样本图片对应的无扰样本图片的特征之间的损失值。
可选的,所述训练完成条件包括:
训练次数不小于预定训练次数阀值;或者
所述损失值小于预定容差范围和/或所述损失值不大于预定阀值。
可选的,不同次训练过程输入到所述深度神经网络中的加扰样本图片数量相同。
可选的,不同次训练过程输入到所述深度神经网络中的加扰样本图片至少一张不同。
可选的,所述深度神经网络模型包括:一个损失计算层和至少一个处理层;
其中,起始的处理层的输入内容为某一次训练的加扰样本图片,其余的每个处理层的输入内容为上一处理层的输出内容,终止的处理层的输出内容为该次训练的加扰图片所对应的去扰处理图片;所述损失计算层的输入内容为终止的处理层输出的去扰处理图片以及该次训练的加扰样本图片所对应的无扰样本图片,输出内容为去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异。
本发明实施例所提供的深度神经网络模型训练装置中,基于训练样本图片库优化训练得到深度神经网络模型。由于训练样本图片库基于大数据训练优化得到,可以通过训练得到的深度神经网络模型处理具有各类复杂的带有干扰的图片,因此,可以解决现有技术适用范围较小,导致实用性较低的问题。
另一方面,相应于上述的图片处理方法,本发明实施例还提供了一种图片处理装置。如图6所示,本发明实施例所提供的一种图片处理装置,包括:
获得模块610,用于获得待处理的目标图片,其中,所述目标图片为具有干扰的图片;
处理模块620,用于基于本发明所提供的深度神经网络模型训练装置训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
可选的,所述干扰信息的种类包括以下至少之一:噪声和遮挡。
本发明实施例所提供的图片处理装置中,在获得待处理的具有干扰的目标图片后;将该目标图片输入预先训练完成的深度神经网络模型,得到处理后图片,该深度神经网络模型通过本发明实施例所提供的深度神经网络模型训练方法预先训练完成;最后输出处理后图片。可见,由于深度神经网络模型基于大数据训练优化得到,使得该图片处理装置可以适用于处理具有各类复杂的带有干扰的图片,因此,可以解决现有技术适用范围较小,导致实用性较低的问题。同时,由于使用优化训练得到深度神经网络模型来处理图片,无需人工干预,可以保证较高的图片处理效率。
本发明实施例还提供了一种电子设备,例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图7,其示出了适于用来实现本发明实施例的终端设备或服务器的电子设备700的结构示意图:如图7所示,电子设备700包括一个或多个处理器、通信部等,所述一个或多个处理器例如:一个或多个中央处理单元(CPU)701,和/或一个或多个图像处理器(GPU)713等,处理器可以根据存储在只读存储器(ROM)702中的可执行指令或者从存储部分708加载到随机访问存储器(RAM)703中的可执行指令而执行各种适当的动作和处理。通信部712可包括但不限于网卡,所述网卡可包括但不限于IB(Infiniband)网卡,处理器可与只读存储器702和/或随机访问存储器703中通信以执行可执行指令,通过总线704与通信部712相连、并经通信部712与其他目标设备通信,从而完成本申请实施例提供的任一项方法对应的操作,例如,利用预先训练完成的深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片,其中,所述深度神经网络模型基于训练样本图片库被多次训练,直至满足预定的训练完成条件训练而得,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片;确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;根据所述特征差异调整所述深度神经网络模型的网络参数。又如,获得包括干扰信息的目标图片;基于本发明所提供的深度神经网络模型训练方法训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
此外,在RAM 703中,还可存储有装置操作所需的各种程序和数据。CPU701、ROM702以及RAM703通过总线704彼此相连。在有RAM703的情况下,ROM702为可选模块。RAM703存储可执行指令,或在运行时向ROM702中写入可执行指令,可执行指令使处理器执行上述通信方法对应的操作。输入/输出(I/O)接口705也连接至总线704。通信部712可以集成设置,也可以设置为具有多个子模块(例如多个IB网卡),并在总线链接上。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
需要说明的,如图7所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图7的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如GPU713和CPU701可分离设置或者可将GPU713集成在CPU701上,通信部712可分离设置,也可集成设置在CPU701或GPU713上,等等。这些可替换的实施方式均落入本发明公开的保护范围。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码,程序代码可包括对应执行本申请实施例提供的方法步骤对应的指令,例如,利用预先训练完成的深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片,其中,所述深度神经网络模型基于训练样本图片库被多次训练,直至满足预定的训练完成条件训练而得,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片;确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;根据所述特征差异调整所述深度神经网络模型的网络参数。又如,获得包括干扰信息的目标图片;基于本发明所提供的深度神经网络模型训练方法训练完成的深度神经网络模型去除所述目标图片中的干扰信息。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被CPU701执行时,执行本申请的方法中限定的上述功能。
可能以许多方式来实现本发明的方法和装置、设备。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和装置、设备。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种深度神经网络模型训练方法,其特征在于,所述方法包括:
基于训练样本图片库对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,对所述深度神经网络模型的至少一次训练过程包括:
利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;
确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;
根据所述特征差异调整所述深度神经网络模型的网络参数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取创建所述训练样本图片库所需的加扰样本图片。
3.根据权利要求2所述的方法,其特征在于,所述获取创建所述训练样本图片库所需的加扰样本图片的步骤,包括:
对无扰样本图片进行加扰,获得与所述无扰样本图片对应的至少一张加扰样本图片,将所得到的加扰样本图片作为创建所述训练样本图片库所需的加扰样本图片。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异的步骤,包括:
利用损失函数计算所述去扰处理图片的特征与所述加扰样本图片对应的无扰样本图片的特征之间的损失值。
5.根据权利要求4所述的方法,其特征在于,所述训练完成条件包括:
训练次数不小于预定训练次数阀值;或者
所述损失值小于预定容差范围和/或所述损失值不大于预定阀值。
6.根据权利要求1所述的方法,其特征在于,所述深度神经网络模型包括:一个损失计算层和至少一个处理层;
其中,起始的处理层的输入内容为某一次训练的加扰样本图片,其余的每个处理层的输入内容为上一处理层的输出内容,终止的处理层的输出内容为该次训练的加扰图片所对应的去扰处理图片;所述损失计算层的输入内容为终止的处理层输出的去扰处理图片以及该次训练的加扰样本图片所对应的无扰样本图片,输出内容为去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异。
7.一种图片处理方法,其特征在于,所述方法包括:
获得包括干扰信息的目标图片;
基于如权利要求1-6任一所述的方法训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
8.一种深度神经网络模型训练装置,其特征在于,所述装置基于训练样本图片库对深度神经网络模型进行多次训练直至满足预定的训练完成条件,所述训练样本图片库包括多张无扰样本图片和多张加扰样本图片,每个无扰样本图片对应至少一张加扰样本图片,通过训练模块对所述深度神经网络模型进行至少一次训练,所述训练模块包括:
去扰单元,用于利用所述深度神经网络模型对加扰样本图片进行去扰处理,得到去扰处理图片;
确定单元,用于确定所述去扰处理图片与所述加扰样本图片对应的无扰样本图片之间的特征差异;
调整单元,用于根据所述特征差异调整所述深度神经网络模型的网络参数。
9.一种图片处理装置,其特征在于,所述装置包括:
获得模块,用于获得包括干扰信息的目标图片;
处理模块,用于基于如权利要求8所述的装置训练完成的深度神经网络模型去除所述目标图片中的干扰信息。
10.一种电子设备,其特征在于,包括:处理器、存储器、总线、通信部,其中,所述处理器与所述存储器通信以执行指令,通过所述总线与所述通信部相连接,并通过所述通信部与其他设备通信;
所述处理器通过读取所述存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以执行权利要求1-7任一项所述的方法。
CN201611213478.8A 2016-12-23 2016-12-23 深度神经网络模型训练、图片处理方法及装置和设备 Pending CN108205802A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611213478.8A CN108205802A (zh) 2016-12-23 2016-12-23 深度神经网络模型训练、图片处理方法及装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611213478.8A CN108205802A (zh) 2016-12-23 2016-12-23 深度神经网络模型训练、图片处理方法及装置和设备

Publications (1)

Publication Number Publication Date
CN108205802A true CN108205802A (zh) 2018-06-26

Family

ID=62603608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611213478.8A Pending CN108205802A (zh) 2016-12-23 2016-12-23 深度神经网络模型训练、图片处理方法及装置和设备

Country Status (1)

Country Link
CN (1) CN108205802A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740738A (zh) * 2018-12-29 2019-05-10 腾讯科技(深圳)有限公司 一种神经网络模型训练方法、装置、设备和介质
CN110738227A (zh) * 2018-07-20 2020-01-31 马上消费金融股份有限公司 模型训练方法及装置、识别方法、存储介质及电子设备
CN111274422A (zh) * 2018-12-04 2020-06-12 北京嘀嘀无限科技发展有限公司 模型训练方法、图像特征提取方法、装置及电子设备
CN111444255A (zh) * 2018-12-29 2020-07-24 杭州海康存储科技有限公司 一种数据模型的训练方法及装置
CN111860823A (zh) * 2019-04-30 2020-10-30 北京市商汤科技开发有限公司 神经网络训练、图像处理方法及装置、设备及存储介质
CN111918144A (zh) * 2020-08-12 2020-11-10 桂林电子科技大学 一种基于深度学习的去除视频水印的方法
CN113537484A (zh) * 2020-04-14 2021-10-22 中国人民银行数字货币研究所 神经网络训练方法、图像编码和解码方法及相关产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8345962B2 (en) * 2007-11-29 2013-01-01 Nec Laboratories America, Inc. Transfer learning methods and systems for feed-forward visual recognition systems
US20150063685A1 (en) * 2013-08-30 2015-03-05 National Central University Image distortion correction method and image distortion correction device using the same
CN105760859A (zh) * 2016-03-22 2016-07-13 中国科学院自动化研究所 基于多任务卷积神经网络的网纹人脸图像识别方法及装置
CN106204467A (zh) * 2016-06-27 2016-12-07 深圳市未来媒体技术研究院 一种基于级联残差神经网络的图像去噪方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8345962B2 (en) * 2007-11-29 2013-01-01 Nec Laboratories America, Inc. Transfer learning methods and systems for feed-forward visual recognition systems
US20150063685A1 (en) * 2013-08-30 2015-03-05 National Central University Image distortion correction method and image distortion correction device using the same
CN105760859A (zh) * 2016-03-22 2016-07-13 中国科学院自动化研究所 基于多任务卷积神经网络的网纹人脸图像识别方法及装置
CN106204467A (zh) * 2016-06-27 2016-12-07 深圳市未来媒体技术研究院 一种基于级联残差神经网络的图像去噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴洋威: "基于深度学习的图像去噪算法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738227A (zh) * 2018-07-20 2020-01-31 马上消费金融股份有限公司 模型训练方法及装置、识别方法、存储介质及电子设备
CN111274422A (zh) * 2018-12-04 2020-06-12 北京嘀嘀无限科技发展有限公司 模型训练方法、图像特征提取方法、装置及电子设备
CN109740738A (zh) * 2018-12-29 2019-05-10 腾讯科技(深圳)有限公司 一种神经网络模型训练方法、装置、设备和介质
CN111444255A (zh) * 2018-12-29 2020-07-24 杭州海康存储科技有限公司 一种数据模型的训练方法及装置
CN109740738B (zh) * 2018-12-29 2022-12-16 腾讯科技(深圳)有限公司 一种神经网络模型训练方法、装置、设备和介质
CN111444255B (zh) * 2018-12-29 2023-09-22 杭州海康存储科技有限公司 一种数据模型的训练方法及装置
CN111860823A (zh) * 2019-04-30 2020-10-30 北京市商汤科技开发有限公司 神经网络训练、图像处理方法及装置、设备及存储介质
CN111860823B (zh) * 2019-04-30 2024-06-11 北京市商汤科技开发有限公司 神经网络训练、图像处理方法及装置、设备及存储介质
CN113537484A (zh) * 2020-04-14 2021-10-22 中国人民银行数字货币研究所 神经网络训练方法、图像编码和解码方法及相关产品
CN113537484B (zh) * 2020-04-14 2024-01-02 中国人民银行数字货币研究所 用于数字水印的网络训练、编码和解码方法、装置及介质
CN111918144A (zh) * 2020-08-12 2020-11-10 桂林电子科技大学 一种基于深度学习的去除视频水印的方法

Similar Documents

Publication Publication Date Title
CN108205802A (zh) 深度神经网络模型训练、图片处理方法及装置和设备
CN104285239B (zh) 图像处理装置、图像处理方法、以及印刷介质
US10121072B1 (en) Unsupervised removal of text from form images
CN114913565B (zh) 人脸图像检测方法、模型训练方法、装置及存储介质
Fang et al. Bottom-up saliency detection model based on human visual sensitivity and amplitude spectrum
CN107507153B (zh) 图像去噪方法和装置
US20190287283A1 (en) User-guided image completion with image completion neural networks
CN109816612A (zh) 图像增强方法和装置、计算机可读存储介质
AU2011254040B2 (en) Method, apparatus and system for determining a saliency map for an input image
CN109829959B (zh) 基于人脸解析的表情编辑方法及装置
CN111275784B (zh) 生成图像的方法和装置
CN108805840A (zh) 图像去噪的方法、装置、终端及计算机可读存储介质
Yang et al. Non-local means theory based Perona–Malik model for image denosing
CN113077377B (zh) 一种基于生成对抗网络的彩色图像隐写方法
CN108230346A (zh) 用于分割图像语义特征的方法和装置、电子设备
CN113228061A (zh) 电子装置及其控制方法
CN111145311B (zh) 高分辨率人脸图像的多属性编辑方法、系统、装置
CN107633228A (zh) 视频数据处理方法及装置、计算设备
CN107908969A (zh) 一种基于空域特性的jpeg图像自适应隐写方法
CN105979283A (zh) 视频转码方法和装置
CN108154153A (zh) 场景分析方法和系统、电子设备
CN104781847B (zh) 视错觉分析装置及方法、参考视错觉的图像生成装置及方法
Han et al. Spatial steganalysis based on non-local block and multi-channel convolutional networks
CN103679645A (zh) 信号处理装置、信号处理方法、输出装置、输出方法及程序
CN109241930B (zh) 用于处理眉部图像的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180626

RJ01 Rejection of invention patent application after publication