CN104200224A - 基于深度卷积神经网络的无价值图像去除方法 - Google Patents

基于深度卷积神经网络的无价值图像去除方法 Download PDF

Info

Publication number
CN104200224A
CN104200224A CN201410431220.XA CN201410431220A CN104200224A CN 104200224 A CN104200224 A CN 104200224A CN 201410431220 A CN201410431220 A CN 201410431220A CN 104200224 A CN104200224 A CN 104200224A
Authority
CN
China
Prior art keywords
layer
theta
sigma
rho
valueless
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410431220.XA
Other languages
English (en)
Inventor
张艳宁
杨涛
屈冰欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201410431220.XA priority Critical patent/CN104200224A/zh
Publication of CN104200224A publication Critical patent/CN104200224A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度卷积神经网络的无价值图像去除方法,首先对图像样本集合白化预处理后,利用稀疏自编码器进行预训练,得到深度卷积网络参数的初始化结果;其次,构建多层深度卷积神经网络,逐层优化网络参数;最后实现多分类的softmax模型对多类问题进行分类,实现无价值图像的去除。由于稀疏自编码器自动学习图像特征,因而提高了本发明的分类正确率。在稀疏自编码器自动学习图像特征的基础之上,构建多层深度卷积神经网络,逐层优化网络参数,每层学习后的特征都是前一层特征的组合结果,训练多分类的softmax模型对图像进行判定,实现无价值图像的去除。

Description

基于深度卷积神经网络的无价值图像去除方法
技术领域
本发明涉及航拍图像处理方法,具体涉及为一种基于深度卷积神经网络的无价值图像去除方法。
背景技术
自动、准确地从航拍视频中检测到有价值的目标,去除无价值图像,具有非常重要的意义。现有的无价值图像去除方法主要有:基于统计分析的分类方法和人工神经网络的方法。文献“From Local Similarity to Global Coding;An Application to ImageClassification,CVPR,2013,p2794-2801”提出了一种将局部特性与全局结构信息相结合图像分类算法,以此来去除无价值图像。此方法采用手工选择局部特征的类型,同时构建所有数据在此类特征上的编码字典;对原始图像进行金字塔分解,在每一层金字塔对应的图像利用编码字典进行编码和池化;将各层的池化结果连接后输入到线性分类器进行判决,从而实现无价值图像的去除。但是,在手工选择局部特征类型的阶段,必须指定局部特征,不能完整地表达图像所包含的信息,具有局限性且抗噪性差。
发明内容
要解决的技术问题
为了避免现有的无价值图像去除方法大多易受特征提取的影响,且局部特征所包含的图像信息具有局限性,分类正确率低,本发明提出一种基于深度卷积神经网络的无价值图像去除方法。
技术方案
一种基于深度卷积神经网络的无价值图像去除方法,其特征在于步骤如下:
步骤1:对图像样本进行归一化后合并为矩阵patches,行数为row,row=m×n,m,n为归一化的大小,列数为样本数量k,对矩阵patches进行零均值化处理:
mean _ patch = Σ i = 1 row ( 1 k Σ j = 1 k patch ( i , j ) )
图像样本与均值矩阵相减存入patches,计算协方差矩阵sigma:
sigma = 1 k ( patches · patches T )
对协方差矩阵进行SVD分解得到U,S,V矩阵,计算ZCA白化矩阵:
ZCA = U * diag ( 1 sqrt ( diag ( S ) ) + eplison ) * U T
其中,diag()表示构造协方差矩阵的对角矩阵,sqrt表示求均方根,eplison为正则化参数,将patches与ZCA相乘得到白化预处理后的图像数据,作为稀疏自编码器的输入;
步骤2:计算稀疏自编码器的损失函数:
J sparse ( W , b ) = J ( W , b ) + β Σ j = 1 s 2 KL ( ρ | | ρ ^ j )
KL ( ρ | | ρ ^ J ) = ρ log ρ ρ ^ j + ( 1 - ρ ) log 1 - ρ 1 - ρ ^ j
其中,x为图像样本的输入特征,y为输出值,hW,b(x)是输入为x时的假设输出,是连接第l层j单元和第l+1层i单元的权值参数,是第l+1层i的偏置项,sl是第l层的单元数目,nl是网络中的层数,λ是权重衰减稀疏,ρ为稀疏值,为隐藏单元i的平均激活度,β是稀疏值惩罚项的权重;
对损失函数求偏导数,加入稀疏性的第l层第i个神经元节点的误差表达式为:
δ i ( l ) = ( ( Σ j = 1 s l W ji ( l ) δ j ( l + 1 ) ) + β ( - ρ ρ ^ i + 1 - ρ 1 - ρ ^ i ) ) f ′ ( z i ( l ) )
是激活函数f(z)=tanh(z)的求导,是第l层i单元所有输入的加权和;采用拟牛顿法中的BFGS优化出Jsparse(W,b)最小时的W和b,输出W和b作为多层深度卷积神经网络中卷积层的权重和偏置的初始化值;
步骤3:构建包含C1卷积层、S2降采样层、C3卷积层、S4降采样层和softmax分类层的多层深度卷积神经网络,输入图像在C1卷积层上进行卷积后产生特征映射图,然后特征映射图通过S2降采样层对像素进行求和、加权值、加偏置,之后再通过C3卷积层进行卷积和S4降采样层进行像素求和、加权值、加偏置,最终将得到的像素值光栅化连接成一个向量输入到softmax分类层;
所述的卷积使用的公式:
x j l = f ( Σ i ∈ M j x i l - 1 * W ij l + b j l )
Mj表示选择的输入映射图的集合,表示W的第l层第i个神经元节点到第l+1层第j个节点的权值,表示b的第l层到第l+1层第j个节点的偏置,是第l层的输出特征图的第j个分量;
所述的降采样层使用的公式:
x j l = f ( μ j l down ( x j l - 1 ) + b j l )
down(·)表示一个降采样函数,为乘性偏置,为加性偏置;
步骤4:利用softmax分类层的假设函数对特征向量x中的每一个类别j估算出概率值p(y=j|x),输出一个K维的向量表示这K个估计的概率值:
h θ ( x ( i ) ) = p ( y ( i ) = 1 | x ( i ) ; θ ) p ( y ( i ) = 2 | x ( i ) ; θ ) · · · p ( y ( i ) = K | x ( i ) ; θ ) = 1 Σ j = 1 K e θ j T x ( i ) e θ 1 T x ( i ) e θ 2 T x ( i ) · · · e θ K T x ( i )
其中,θ12,...,θK是训练模型参数,y(i)∈{1,2,...,K},表示对概率分布进行归一化;
计算特征向量x为类别j的概率:
p ( y ( i ) = j | x ( i ) ; θ ) = e θ j T x ( i ) Σ l = 1 K e θ l T x ( i )
添加一个权重衰减项来修改代价函数:
J ( θ ) = - 1 m [ Σ i = 1 m Σ j = 1 K 1 { y ( i ) = j } log e θ j T x ( i ) Σ l = 1 K e θ l T x ( i ) ] + λ 2 Σ i = 1 K Σ j = 0 n θ ij 2
n为特征向量x的维度,1{·}为示性函数,对代价函数求导得:
▿ θ j J ( θ ) = - 1 m Σ i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p ( y ( i ) = j | x ( i ) ; θ ) ) ] + λ θ j
用梯度下降法最小化J(θ)实现softmax分类模型,去除无价值图像。
所述的eplison取0.1。
所述的λ取值为0.003。
所述的ρ取值为0.035。
所述的β取值为5。
有益效果
本发明提出的一种基于深度卷积神经网络的无价值图像去除方法,采用深度卷积神经网络进行特征学习,因此分类效果好,包含了更多的图像信息,在无价值图像去除方面不易错判。
具体实施方式
本发明解决其技术问题所采用的技术方案是:基于深度卷积神经网络的无价值图像去除方法。
本发明的技术方案包括下述步骤:基于稀疏自动编码器的预训练、构建深度卷积神经网络和训练softmax分类模型。
(a)对航拍图像训练集合进行白化预处理,由于图像中相邻像素之间具有很强的相关性,白化的目的是降低输入的冗余性,在对数据进行白化前要进行特征零均值化,选取适当的正则化参数,对输入图像进行平滑,消除噪声;
稀疏自编码网络是一种无监督学习算法,将白化预处理后的图像训练集合输入到稀疏自编码网络,求出损失函数偏导数表达式,利用拟牛顿法中的BFGS优化方法求解该非线性优化问题,求出网络的最佳参数,输出网络的权值和偏置项;
(b)构建深度卷积神经网络,对训练集合的图像用预训练的均值和白化矩阵进行白化预处理,将预训练后的权值和偏置项初始化为深度卷积神经网络卷积层的卷积核参数;深度卷积神经网络的降采样层对卷积后的图像进行降采样,并计算图像一个区域上的某个特定特征的平均值或最大值来降低维度和防止过度拟合;
(c)将深度卷积神经网络降采样层输出的特征向量作为输入向量输入到softmax回归模型,标签设置为每张图像对应的类别标签。Softmax模型解决的是多分类问题,对给定的输入,利用假设函数对每一个类别估算出概率值,概率值最大的类别是该输入所属的类别。
现结合实施例对本发明作进一步描述:
1、基于稀疏自动编码器的预训练
由于图像信息存在冗余,在预训练前要进行白化预处理,采用随机向量的“零均值化”和“空间白化”。
设所有的样本大小归一化后合并为矩阵patches,行数为row,row=m×n,m,n为归一化的大小,列数为k,k为样本数量,零均值化如公式(1)所示:
mean _ patch = Σ i = 1 row ( 1 k Σ j = 1 k patch ( i , j ) ) - - - ( 1 )
原始数据与均值矩阵相减存入patches,计算其协方差矩阵sigma:
sigma = 1 k ( patches · patches T ) - - - ( 2 )
对协方差矩阵进行SVD分解得到U,S,V矩阵,计算ZCA白化矩阵:
ZCA = U * diag ( 1 sqrt ( diag ( S ) ) + eplison ) * U T - - - ( 3 )
其中,diag()表示构造该矩阵的对角矩阵,sqrt表示求均方根,eplison为正则化参数,取0.1。将patches与ZCA相乘得到白化预处理后的图像数据,作为稀疏自编码器的输入。
基于稀疏自编码器的网络构建,通过网络结构确定损失函数的表达式和损失函数导数的表达式,在稀疏编码中,其输出的理论值是本身输入的特征值,网络的隐含层较好地代替输入特征,准确地还原输入特征值。无稀疏约束网络的损失函数表达如下:
J ( W , b ) = [ 1 m Σ i = 1 m J ( W , b ; x ( i ) , y ( i ) ) ] + λ 2 Σ l = 1 n l - 1 Σ i = 1 s l Σ j = 1 s l + 1 ( W ji ( i ) ) 2 = [ 1 m Σ i = 1 m ( 1 2 | | h W , b ( x ( i ) ) - y ( i ) | | 2 ) ] + λ 2 Σ l = 1 n l - 1 Σ i = 1 s l Σ j = 1 s l + 1 ( W ji ( l ) ) 2 - - - ( 4 )
稀疏编码是对网络的隐含层的输出有了约束,即隐含层节点输出的平均值为0,稀疏自编码的损失函数表达式为:
J sparse ( W , b ) = J ( W , b ) + β Σ j = 1 s 2 KL ( ρ | | ρ ^ j ) - - - ( 5 )
后面一项为KL距离,表达式如下:
KL ( ρ | | ρ ^ J ) = ρ log ρ ρ ^ j + ( 1 - ρ ) log 1 - ρ 1 - ρ ^ j - - - ( 6 )
其中,x为图像样本的输入特征,y为输出值,hW,b(x)是输入为x时的假设输出,包含参数W,b该输出应当与目标值y具有相同的维数;是连接第l层j单元和第l+1层i单元的权值参数,是第l+1层i的偏置项,sl是第l层的单元数目,nl是网络中的层数,λ是权重衰减稀疏,取值为0.003,ρ为稀疏值,指定所需的稀疏程度,取值为0.035,隐藏单元i的平均激活度,而β是稀疏值惩罚项的权重,取值为5。
由损失函数求偏导数,加入稀疏性的第l层第i个神经元节点的误差表达式为:
δ i ( l ) = ( ( Σ j = 1 s l W ji ( l ) δ j ( l + 1 ) ) + β ( - ρ ρ ^ i + 1 - ρ 1 - ρ ^ i ) ) f ′ ( z i ( l ) ) - - - ( 7 )
f(·)为激活函数(式中是激活函数的求导),使用f(z)=tanh(z),是第l层i单元所有输入的加权和。用拟牛顿法中的BFGS优化,优化出Jsparse(W,b)最小时的W和b。该W和b用来初始化多层深度卷积神经网络中卷积层的权重和偏置,以加快训练速度。
2、构建深度卷积神经网络
构建多层深度卷积神经网络,2层卷积层,2层降采样层,1层分类层。深度卷积神经网络的C1卷积层,该卷积层包含n1个卷积核,取值为240,大小均为k×k,取值为8;S2降采样层进行降采样和池化,参数取值为19;C3卷积层有n2个卷积核,取值为300,大小为k×k,取值为8;S4降采样层的参数为19。
输入图像通过和n1个训练好的滤波器和偏置项进行卷积,卷积后在C1层产生n1个特征映射图,然后每个特征映射图通过S2层,每19×19个像素进行求和、加权值、加偏置通过激活函数产生n1个S2层的特征映射图;这些映射图再通过C3卷积层进行卷积和S4降采样层进行像素求和、加权值、加偏置得到S4层的特征映射图,最终这些像素值被光栅化,并连接成一个向量输入到分类层,这里是softmax分类模型。
在一个卷积层,上一层的特征映射图被一个卷积核进行卷积,并通过一个激活函数得到输出的特征映射图,每一个输出特征图是组合卷积多个输入特征图的值:
x j l = f ( Σ i ∈ M j x i l - 1 * W ij l + b j l ) - - - ( 8 )
Mj表示选择的输入映射图的集合,对于一个特定的输出映射图,卷积每个输入映射图的卷积核是不一样的,这里取稀疏自编码器优化得到的权值为卷积核。表示公式(5)中W的第l层第i个神经元节点到第l+1层第j个节点的权值,表示公式(5)中b的第l层到第l+1层第j个节点的偏置。是第l层的输出特征图的第j个分量。
对于降采样层,有N个输入特征映射图,就有N个输出特征映射图,其作用是将特征映射图变小:
x j l = f ( μ j l down ( x j l - 1 ) + b j l ) - - - ( 9 )
down(·)表示一个降采样函数,对输入图像不同的19×19的图像块的所有像素进行求和,每个输出特征映射图对应了一个自己的乘性偏置和加性偏置输出前通过激活函数。
3、训练softmax分类模型
输入图像经过多层深度卷积神经网络中卷积层和池化层的处理,得到S4层的特征映射图,最终这些像素值被光栅化,并连接成一个特征向量输入到分类层,分类层是softmax分类模型,输出为该图像所属类别,达到图像分类效果,去除无价值图像。该步骤训练这个解决多分类问题的Softmax模型。
Softmax分类模型解决的是多分类问题,假设函数如下:
h θ ( x ) = 1 1 + exp ( - θ T x ) - - - ( 10 )
训练模型参数θ,使其能够最小化代价函数:
J ( θ ) = - 1 m [ Σ i = 1 m y ( i ) log h θ ( x ( i ) ) + ( 1 - y ( i ) ) log ( 1 - h θ ( x ( i ) ) ) ] - - - ( 11 )
对于无价值图像去除问题,假设共有K类图像,y(i)∈{1,2,...,K},对给定的经过深度卷积神经网络处理后的特征向量x,用假设函数对每一个类别j估算出概率值p(y=j|x),假设函数要输出一个K维的向量(向量元素和为1)来表示这K个估计的概率值:
h θ ( x ( i ) ) = p ( y ( i ) = 1 | x ( i ) ; θ ) p ( y ( i ) = 2 | x ( i ) ; θ ) · · · p ( y ( i ) = K | x ( i ) ; θ ) = 1 Σ j = 1 K e θ j T x ( i ) e θ 1 T x ( i ) e θ 2 T x ( i ) · · · e θ K T x ( i ) - - - ( 12 )
其中,θ12,...,θK是模型的参数,这一项对概率分布进行归一化,使得所有概率之和为1。
代价函数中将特征向量x分类为类别j的概率为:
p ( y ( i ) = j | x ( i ) ; θ ) = e θ j T x ( i ) Σ l = 1 K e θ l T x ( i ) - - - ( 13 )
添加一个权重衰减项来修改代价函数,来惩罚过大的参数值:
J ( θ ) = - 1 m [ Σ i = 1 m Σ j = 1 K 1 { y ( i ) = j } log e θ j T x ( i ) Σ l = 1 K e θ l T x ( i ) ] + λ 2 Σ i = 1 K Σ j = 0 n θ ij 2 - - - ( 14 )
特征向量x的维度为n,λ为权重衰减参数,取值为0.003,1{·}为示性函数。对代价函数求导得:
▿ θ j J ( θ ) = - 1 m Σ i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p ( y ( i ) = j | x ( i ) ; θ ) ) ] + λ θ j - - - ( 15 )
用梯度下降法最小化J(θ)实现softmax分类模型。

Claims (5)

1.一种基于深度卷积神经网络的无价值图像去除方法,其特征在于步骤如下:
步骤1:对图像样本进行归一化后合并为矩阵patches,行数为row,row=m×n,m,n为归一化的大小,列数为样本数量k,对矩阵patches进行零均值化处理:
mean _ patch = Σ i = 1 row ( 1 k Σ j = 1 k patch ( i , j ) )
图像样本与均值矩阵相减存入patches,计算协方差矩阵sigma:
sigma = 1 k ( patches · patches T )
对协方差矩阵进行SVD分解得到U,S,V矩阵,计算ZCA白化矩阵:
ZCA = U * diag ( 1 sqrt ( diag ( S ) ) + eplison ) * U T
其中,diag()表示构造协方差矩阵的对角矩阵,sqrt表示求均方根,eplison为正则化参数,将patches与ZCA相乘得到白化预处理后的图像数据,作为稀疏自编码器的输入;
步骤2:计算稀疏自编码器的损失函数:
J sparse ( W , b ) = J ( W , b ) + β Σ j = 1 s 2 KL ( ρ | | ρ ^ j )
KL ( ρ | | ρ ^ J ) = ρ log ρ ρ ^ j + ( 1 - ρ ) log 1 - ρ 1 - ρ ^ j
其中,x为图像样本的输入特征,y为输出值,hW,b(x)是输入为x时的假设输出,是连接第l层j单元和第l+1层i单元的权值参数,是第l+1层i的偏置项,sl是第l层的单元数目,nl是网络中的层数,λ是权重衰减稀疏,ρ为稀疏值,为隐藏单元i的平均激活度,β是稀疏值惩罚项的权重;
对损失函数求偏导数,加入稀疏性的第l层第i个神经元节点的误差表达式为:
δ i ( l ) = ( ( Σ j = 1 s l W ji ( l ) δ j ( l + 1 ) ) + β ( - ρ ρ ^ i + 1 - ρ 1 - ρ ^ i ) ) f ′ ( z i ( l ) )
是激活函数f(z)=tanh(z)的求导,是第l层i单元所有输入的加权和;采用拟牛顿法中的BFGS优化出Jsparse(W,b)最小时的W和b,输出W和b作为多层深度卷积神经网络中卷积层的权重和偏置的初始化值;
步骤3:构建包含C1卷积层、S2降采样层、C3卷积层、S4降采样层和softmax分类层的多层深度卷积神经网络,输入图像在C1卷积层上进行卷积后产生特征映射图,然后特征映射图通过S2降采样层对像素进行求和、加权值、加偏置,之后再通过C3卷积层进行卷积和S4降采样层进行像素求和、加权值、加偏置,最终将得到的像素值光栅化连接成一个向量输入到softmax分类层;
所述的卷积使用的公式:
x j l = f ( Σ i ∈ M j x i l - 1 * W ij l + b j l )
Mj表示选择的输入映射图的集合,表示W的第l层第i个神经元节点到第l+1层第j个节点的权值,表示b的第l层到第l+1层第j个节点的偏置,是第l层的输出特征图的第j个分量;
所述的降采样层使用的公式:
x j l = f ( μ j l down ( x j l - 1 ) + b j l )
down(·)表示一个降采样函数,为乘性偏置,为加性偏置;
步骤4:利用softmax分类层的假设函数对特征向量x中的每一个类别j估算出概率值p(y=j|x),输出一个K维的向量表示这K个估计的概率值:
h θ ( x ( i ) ) = p ( y ( i ) = 1 | x ( i ) ; θ ) p ( y ( i ) = 2 | x ( i ) ; θ ) · · · p ( y ( i ) = K | x ( i ) ; θ ) = 1 Σ j = 1 K e θ j T x ( i ) e θ 1 T x ( i ) e θ 2 T x ( i ) · · · e θ K T x ( i )
其中,θ12,...,θK是训练模型参数,y(i)∈{1,2,...,K},表示对概率分布进行归一化;
计算特征向量x为类别j的概率:
p ( y ( i ) = j | x ( i ) ; θ ) = e θ j T x ( i ) Σ l = 1 K e θ l T x ( i )
添加一个权重衰减项来修改代价函数:
J ( θ ) = - 1 m [ Σ i = 1 m Σ j = 1 K 1 { y ( i ) = j } log e θ j T x ( i ) Σ l = 1 K e θ l T x ( i ) ] + λ 2 Σ i = 1 K Σ j = 0 n θ ij 2
n为特征向量x的维度,1{·}为示性函数,对代价函数求导得:
▿ θ j J ( θ ) = - 1 m Σ i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p ( y ( i ) = j | x ( i ) ; θ ) ) ] + λ θ j
用梯度下降法最小化J(θ)实现softmax分类模型,去除无价值图像。
2.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的eplison取0.1。
3.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的λ取值为0.003。
4.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的ρ取值为0.035。
5.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的β取值为5。
CN201410431220.XA 2014-08-28 2014-08-28 基于深度卷积神经网络的无价值图像去除方法 Pending CN104200224A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410431220.XA CN104200224A (zh) 2014-08-28 2014-08-28 基于深度卷积神经网络的无价值图像去除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410431220.XA CN104200224A (zh) 2014-08-28 2014-08-28 基于深度卷积神经网络的无价值图像去除方法

Publications (1)

Publication Number Publication Date
CN104200224A true CN104200224A (zh) 2014-12-10

Family

ID=52085514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410431220.XA Pending CN104200224A (zh) 2014-08-28 2014-08-28 基于深度卷积神经网络的无价值图像去除方法

Country Status (1)

Country Link
CN (1) CN104200224A (zh)

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462494A (zh) * 2014-12-22 2015-03-25 武汉大学 一种基于无监督特征学习的遥感图像检索方法及系统
CN105139028A (zh) * 2015-08-13 2015-12-09 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN105138973A (zh) * 2015-08-11 2015-12-09 北京天诚盛业科技有限公司 人脸认证的方法和装置
CN105512680A (zh) * 2015-12-02 2016-04-20 北京航空航天大学 一种基于深度神经网络的多视sar图像目标识别方法
CN105550713A (zh) * 2015-12-21 2016-05-04 中国石油大学(华东) 一种持续学习的视频事件检测方法
CN105590102A (zh) * 2015-12-30 2016-05-18 中通服公众信息产业股份有限公司 一种基于深度学习的前车车脸识别方法
CN105844653A (zh) * 2016-04-18 2016-08-10 深圳先进技术研究院 一种多层卷积神经网络优化系统及方法
CN105989368A (zh) * 2015-02-13 2016-10-05 展讯通信(天津)有限公司 一种目标检测方法及装置以及移动终端
CN106056595A (zh) * 2015-11-30 2016-10-26 浙江德尚韵兴图像科技有限公司 基于深度卷积神经网络自动识别甲状腺结节良恶性的方法
CN106203628A (zh) * 2016-07-11 2016-12-07 深圳先进技术研究院 一种增强深度学习算法鲁棒性的优化方法和系统
CN106227851A (zh) * 2016-07-29 2016-12-14 汤平 基于深度卷积神经网络端对端的通过分层深度搜索的图像检索方法
CN106250871A (zh) * 2016-08-16 2016-12-21 桂林电子科技大学 城市管理案件分类方法及装置
CN106295547A (zh) * 2016-08-05 2017-01-04 深圳市商汤科技有限公司 一种图像比对方法及图像比对装置
CN106408017A (zh) * 2016-09-13 2017-02-15 天津大学 基于深度学习的超生颈动脉内中膜厚度测量装置和方法
CN106454411A (zh) * 2016-10-27 2017-02-22 北京小米移动软件有限公司 台标处理方法和装置
CN106530227A (zh) * 2016-10-27 2017-03-22 北京小米移动软件有限公司 图像复原方法及装置
CN106782511A (zh) * 2016-12-22 2017-05-31 太原理工大学 修正线性深度自编码网络语音识别方法
WO2017124644A1 (zh) * 2016-01-20 2017-07-27 北京中科寒武纪科技有限公司 一种人工神经网络压缩编码装置和方法
WO2017124646A1 (zh) * 2016-01-20 2017-07-27 北京中科寒武纪科技有限公司 一种用于稀疏连接的人工神经网络计算装置和方法
CN107292322A (zh) * 2016-03-31 2017-10-24 华为技术有限公司 一种图像分类方法、深度学习模型及计算机系统
CN107315569A (zh) * 2016-04-27 2017-11-03 北京中科寒武纪科技有限公司 一种用于执行RMSprop梯度下降算法的装置及方法
CN107342962A (zh) * 2017-07-03 2017-11-10 北京邮电大学 基于卷积神经网络的深度学习智能星座图分析方法
CN107437100A (zh) * 2017-08-08 2017-12-05 重庆邮电大学 一种基于跨模态关联学习的图像位置预测方法
CN107480701A (zh) * 2017-07-19 2017-12-15 同济大学 基于多通道卷积神经网络的光学图像与雷达图像匹配方法
CN107533665A (zh) * 2015-04-28 2018-01-02 高通股份有限公司 经由偏置项在深度神经网络中纳入自顶向下信息
WO2018000309A1 (en) * 2016-06-30 2018-01-04 Intel Corporation Importance-aware model pruning and re-training for efficient convolutional neural networks
CN107690663A (zh) * 2015-06-05 2018-02-13 谷歌有限责任公司 白化神经网络层
CN107798349A (zh) * 2017-11-03 2018-03-13 合肥工业大学 一种基于深度稀疏自编码机的迁移学习方法
CN107992897A (zh) * 2017-12-14 2018-05-04 重庆邮电大学 基于卷积拉普拉斯稀疏编码的商品图像分类方法
CN107993210A (zh) * 2017-11-30 2018-05-04 北京小米移动软件有限公司 图像修复方法、装置及计算机可读存储介质
CN107992904A (zh) * 2017-12-22 2018-05-04 重庆邮电大学 基于多源信息融合的林业生态环境人机交互方法
CN108229347A (zh) * 2016-12-22 2018-06-29 Tcl集团股份有限公司 用于人识别的拟吉布斯结构采样的深层置换的方法和装置
CN108268993A (zh) * 2017-01-04 2018-07-10 阿里巴巴集团控股有限公司 基于自编码神经网络的电子业务风险识别方法和装置
CN108280451A (zh) * 2018-01-19 2018-07-13 北京市商汤科技开发有限公司 语义分割及网络训练方法和装置、设备、介质、程序
CN108351984A (zh) * 2015-11-05 2018-07-31 微软技术许可有限责任公司 硬件高效的深度卷积神经网络
CN108701210A (zh) * 2016-02-02 2018-10-23 北京市商汤科技开发有限公司 用于cnn网络适配和对象在线追踪的方法和系统
WO2018227801A1 (zh) * 2017-06-15 2018-12-20 北京图森未来科技有限公司 一种构建神经网络的方法及装置
CN109063750A (zh) * 2018-07-17 2018-12-21 西安电子科技大学 基于cnn和svm决策融合的sar目标分类方法
CN109308449A (zh) * 2018-08-06 2019-02-05 福州瑞芯微电子股份有限公司 一种基于深度学习的异物过滤视频编码芯片和方法
CN109341763A (zh) * 2018-10-10 2019-02-15 广东长盈科技股份有限公司 一种基于物联网的运输数据采集系统及方法
CN109670578A (zh) * 2018-12-14 2019-04-23 北京中科寒武纪科技有限公司 神经网络首层卷积层数据处理方法、装置及计算机设备
CN109684901A (zh) * 2017-10-19 2019-04-26 富士通株式会社 图像处理装置和图像处理方法
CN110082283A (zh) * 2019-05-23 2019-08-02 山东科技大学 一种大气颗粒物sem图像识别方法及系统
WO2019200735A1 (zh) * 2018-04-17 2019-10-24 平安科技(深圳)有限公司 牲畜特征向量的提取方法、装置、计算机设备和存储介质
CN110705621A (zh) * 2019-09-25 2020-01-17 北京影谱科技股份有限公司 基于dcnn的食物图像的识别方法和系统及食物热量计算方法
CN110866436A (zh) * 2019-08-29 2020-03-06 西安理工大学 基于卷积神经网络特征重构的眼镜自动去除方法
CN111275571A (zh) * 2020-01-14 2020-06-12 河海大学 考虑微气象与用户模式的居民负荷概率预测深度学习方法
CN111310794A (zh) * 2020-01-19 2020-06-19 北京字节跳动网络技术有限公司 目标对象的分类方法、装置和电子设备
CN111639544A (zh) * 2020-05-07 2020-09-08 齐齐哈尔大学 基于多分支跨连接卷积神经网络的表情识别方法
CN112102183A (zh) * 2020-09-02 2020-12-18 杭州海康威视数字技术股份有限公司 稀疏处理方法、装置及设备
CN113065640A (zh) * 2021-03-17 2021-07-02 西北工业大学 一种基于卷积核形状自动学习的图像分类网络压缩方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070047802A1 (en) * 2005-08-31 2007-03-01 Microsoft Corporation Training convolutional neural networks on graphics processing units
CN103996056A (zh) * 2014-04-08 2014-08-20 浙江工业大学 一种基于深度学习的纹身图像分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070047802A1 (en) * 2005-08-31 2007-03-01 Microsoft Corporation Training convolutional neural networks on graphics processing units
CN103996056A (zh) * 2014-04-08 2014-08-20 浙江工业大学 一种基于深度学习的纹身图像分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
宣森炎,等: ""基于联合卷积和递归神经网络的交通标志识别"", 《传感器与系统》 *
李映,等: ""基于信号稀疏表示的形态成分分析进展和展望"", 《电子学报》 *
杨逍: ""机器学习中隐式因子模型及其优化算法研究"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
钱民: ""基于机器学习方法的前列腺病例切片图像识别"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462494B (zh) * 2014-12-22 2018-01-12 武汉大学 一种基于无监督特征学习的遥感图像检索方法及系统
CN104462494A (zh) * 2014-12-22 2015-03-25 武汉大学 一种基于无监督特征学习的遥感图像检索方法及系统
CN105989368A (zh) * 2015-02-13 2016-10-05 展讯通信(天津)有限公司 一种目标检测方法及装置以及移动终端
CN107533665A (zh) * 2015-04-28 2018-01-02 高通股份有限公司 经由偏置项在深度神经网络中纳入自顶向下信息
CN107690663A (zh) * 2015-06-05 2018-02-13 谷歌有限责任公司 白化神经网络层
CN105138973A (zh) * 2015-08-11 2015-12-09 北京天诚盛业科技有限公司 人脸认证的方法和装置
CN105138973B (zh) * 2015-08-11 2018-11-09 北京天诚盛业科技有限公司 人脸认证的方法和装置
CN105139028A (zh) * 2015-08-13 2015-12-09 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN105139028B (zh) * 2015-08-13 2018-05-25 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN108351984A (zh) * 2015-11-05 2018-07-31 微软技术许可有限责任公司 硬件高效的深度卷积神经网络
CN108351984B (zh) * 2015-11-05 2022-03-29 微软技术许可有限责任公司 硬件高效的深度卷积神经网络
CN106056595A (zh) * 2015-11-30 2016-10-26 浙江德尚韵兴图像科技有限公司 基于深度卷积神经网络自动识别甲状腺结节良恶性的方法
CN105512680A (zh) * 2015-12-02 2016-04-20 北京航空航天大学 一种基于深度神经网络的多视sar图像目标识别方法
CN105550713A (zh) * 2015-12-21 2016-05-04 中国石油大学(华东) 一种持续学习的视频事件检测方法
CN105590102A (zh) * 2015-12-30 2016-05-18 中通服公众信息产业股份有限公司 一种基于深度学习的前车车脸识别方法
WO2017124644A1 (zh) * 2016-01-20 2017-07-27 北京中科寒武纪科技有限公司 一种人工神经网络压缩编码装置和方法
WO2017124646A1 (zh) * 2016-01-20 2017-07-27 北京中科寒武纪科技有限公司 一种用于稀疏连接的人工神经网络计算装置和方法
CN108701210A (zh) * 2016-02-02 2018-10-23 北京市商汤科技开发有限公司 用于cnn网络适配和对象在线追踪的方法和系统
CN108701210B (zh) * 2016-02-02 2021-08-17 北京市商汤科技开发有限公司 用于cnn网络适配和对象在线追踪的方法和系统
CN107292322A (zh) * 2016-03-31 2017-10-24 华为技术有限公司 一种图像分类方法、深度学习模型及计算机系统
CN105844653B (zh) * 2016-04-18 2019-07-30 深圳先进技术研究院 一种多层卷积神经网络优化系统及方法
CN105844653A (zh) * 2016-04-18 2016-08-10 深圳先进技术研究院 一种多层卷积神经网络优化系统及方法
CN107315569A (zh) * 2016-04-27 2017-11-03 北京中科寒武纪科技有限公司 一种用于执行RMSprop梯度下降算法的装置及方法
CN107315569B (zh) * 2016-04-27 2021-06-18 中科寒武纪科技股份有限公司 一种用于执行RMSprop梯度下降算法的装置及方法
WO2018000309A1 (en) * 2016-06-30 2018-01-04 Intel Corporation Importance-aware model pruning and re-training for efficient convolutional neural networks
CN106203628B (zh) * 2016-07-11 2018-12-14 深圳先进技术研究院 一种增强深度学习算法鲁棒性的优化方法和系统
CN106203628A (zh) * 2016-07-11 2016-12-07 深圳先进技术研究院 一种增强深度学习算法鲁棒性的优化方法和系统
CN106227851B (zh) * 2016-07-29 2019-10-01 汤一平 基于深度卷积神经网络的分层深度搜索的图像检索方法
CN106227851A (zh) * 2016-07-29 2016-12-14 汤平 基于深度卷积神经网络端对端的通过分层深度搜索的图像检索方法
CN106295547A (zh) * 2016-08-05 2017-01-04 深圳市商汤科技有限公司 一种图像比对方法及图像比对装置
CN106250871A (zh) * 2016-08-16 2016-12-21 桂林电子科技大学 城市管理案件分类方法及装置
CN106408017A (zh) * 2016-09-13 2017-02-15 天津大学 基于深度学习的超生颈动脉内中膜厚度测量装置和方法
CN106454411B (zh) * 2016-10-27 2020-06-02 北京小米移动软件有限公司 台标处理方法和装置
CN106530227A (zh) * 2016-10-27 2017-03-22 北京小米移动软件有限公司 图像复原方法及装置
CN106454411A (zh) * 2016-10-27 2017-02-22 北京小米移动软件有限公司 台标处理方法和装置
CN106530227B (zh) * 2016-10-27 2019-08-06 北京小米移动软件有限公司 图像复原方法及装置
CN108229347B (zh) * 2016-12-22 2022-01-18 Tcl科技集团股份有限公司 用于人识别的拟吉布斯结构采样的深层置换的方法和装置
CN108229347A (zh) * 2016-12-22 2018-06-29 Tcl集团股份有限公司 用于人识别的拟吉布斯结构采样的深层置换的方法和装置
CN106782511A (zh) * 2016-12-22 2017-05-31 太原理工大学 修正线性深度自编码网络语音识别方法
CN108268993A (zh) * 2017-01-04 2018-07-10 阿里巴巴集团控股有限公司 基于自编码神经网络的电子业务风险识别方法和装置
WO2018227801A1 (zh) * 2017-06-15 2018-12-20 北京图森未来科技有限公司 一种构建神经网络的方法及装置
CN111178520B (zh) * 2017-06-15 2024-06-07 北京图森智途科技有限公司 一种构建神经网络的方法及装置
CN111178520A (zh) * 2017-06-15 2020-05-19 北京图森智途科技有限公司 一种低计算能力处理设备的数据处理方法及装置
CN107342962A (zh) * 2017-07-03 2017-11-10 北京邮电大学 基于卷积神经网络的深度学习智能星座图分析方法
CN107480701A (zh) * 2017-07-19 2017-12-15 同济大学 基于多通道卷积神经网络的光学图像与雷达图像匹配方法
CN107480701B (zh) * 2017-07-19 2020-07-28 同济大学 基于多通道卷积神经网络的光学图像与雷达图像匹配方法
CN107437100A (zh) * 2017-08-08 2017-12-05 重庆邮电大学 一种基于跨模态关联学习的图像位置预测方法
CN109684901A (zh) * 2017-10-19 2019-04-26 富士通株式会社 图像处理装置和图像处理方法
CN109684901B (zh) * 2017-10-19 2023-06-06 富士通株式会社 图像处理装置和图像处理方法
CN107798349A (zh) * 2017-11-03 2018-03-13 合肥工业大学 一种基于深度稀疏自编码机的迁移学习方法
CN107798349B (zh) * 2017-11-03 2020-07-14 合肥工业大学 一种基于深度稀疏自编码机的迁移学习方法
CN107993210A (zh) * 2017-11-30 2018-05-04 北京小米移动软件有限公司 图像修复方法、装置及计算机可读存储介质
CN107992897A (zh) * 2017-12-14 2018-05-04 重庆邮电大学 基于卷积拉普拉斯稀疏编码的商品图像分类方法
CN107992904B (zh) * 2017-12-22 2020-04-07 重庆邮电大学 基于多源信息融合的林业生态环境人机交互方法
CN107992904A (zh) * 2017-12-22 2018-05-04 重庆邮电大学 基于多源信息融合的林业生态环境人机交互方法
CN108280451B (zh) * 2018-01-19 2020-12-29 北京市商汤科技开发有限公司 语义分割及网络训练方法和装置、设备、介质
CN108280451A (zh) * 2018-01-19 2018-07-13 北京市商汤科技开发有限公司 语义分割及网络训练方法和装置、设备、介质、程序
WO2019200735A1 (zh) * 2018-04-17 2019-10-24 平安科技(深圳)有限公司 牲畜特征向量的提取方法、装置、计算机设备和存储介质
CN109063750B (zh) * 2018-07-17 2022-05-13 西安电子科技大学 基于cnn和svm决策融合的sar目标分类方法
CN109063750A (zh) * 2018-07-17 2018-12-21 西安电子科技大学 基于cnn和svm决策融合的sar目标分类方法
CN109308449A (zh) * 2018-08-06 2019-02-05 福州瑞芯微电子股份有限公司 一种基于深度学习的异物过滤视频编码芯片和方法
CN109341763A (zh) * 2018-10-10 2019-02-15 广东长盈科技股份有限公司 一种基于物联网的运输数据采集系统及方法
CN109670578A (zh) * 2018-12-14 2019-04-23 北京中科寒武纪科技有限公司 神经网络首层卷积层数据处理方法、装置及计算机设备
CN110082283A (zh) * 2019-05-23 2019-08-02 山东科技大学 一种大气颗粒物sem图像识别方法及系统
CN110866436B (zh) * 2019-08-29 2023-04-07 西安理工大学 基于卷积神经网络特征重构的眼镜自动去除方法
CN110866436A (zh) * 2019-08-29 2020-03-06 西安理工大学 基于卷积神经网络特征重构的眼镜自动去除方法
CN110705621A (zh) * 2019-09-25 2020-01-17 北京影谱科技股份有限公司 基于dcnn的食物图像的识别方法和系统及食物热量计算方法
CN111275571A (zh) * 2020-01-14 2020-06-12 河海大学 考虑微气象与用户模式的居民负荷概率预测深度学习方法
CN111310794A (zh) * 2020-01-19 2020-06-19 北京字节跳动网络技术有限公司 目标对象的分类方法、装置和电子设备
CN111310794B (zh) * 2020-01-19 2021-04-20 北京字节跳动网络技术有限公司 目标对象的分类方法、装置和电子设备
CN111639544A (zh) * 2020-05-07 2020-09-08 齐齐哈尔大学 基于多分支跨连接卷积神经网络的表情识别方法
CN111639544B (zh) * 2020-05-07 2022-08-09 齐齐哈尔大学 基于多分支跨连接卷积神经网络的表情识别方法
CN112102183A (zh) * 2020-09-02 2020-12-18 杭州海康威视数字技术股份有限公司 稀疏处理方法、装置及设备
CN113065640A (zh) * 2021-03-17 2021-07-02 西北工业大学 一种基于卷积核形状自动学习的图像分类网络压缩方法
CN113065640B (zh) * 2021-03-17 2024-01-09 西北工业大学 一种基于卷积核形状自动学习的图像分类网络压缩方法

Similar Documents

Publication Publication Date Title
CN104200224A (zh) 基于深度卷积神经网络的无价值图像去除方法
AU2020104006A4 (en) Radar target recognition method based on feature pyramid lightweight convolutional neural network
CN108427920B (zh) 一种基于深度学习的边海防目标检测方法
CN107609601B (zh) 一种基于多层卷积神经网络的舰船目标识别方法
CN109086824B (zh) 一种基于卷积神经网络的海底底质声呐图像分类方法
CN105512289B (zh) 基于深度学习和哈希的图像检索方法
CN104809443B (zh) 基于卷积神经网络的车牌检测方法及系统
CN104182772B (zh) 一种基于深度学习的手势识别方法
CN108230302B (zh) 一种核电厂冷源海域入侵海洋生物探测及处置方法
CN107563433B (zh) 一种基于卷积神经网络的红外小目标检测方法
CN107145903A (zh) 一种基于卷积神经网络图片特征提取的船舶类型识别方法
CN108734171A (zh) 一种深度协同稀疏编码网络的合成孔径雷达遥感图像海洋浮筏识别方法
CN108647742A (zh) 基于轻量级神经网络的快速目标检测方法
CN107526785A (zh) 文本分类方法及装置
CN107451565B (zh) 一种半监督小样本深度学习图像模式分类识别方法
CN110874550A (zh) 数据处理方法、装置、设备和系统
CN106023065A (zh) 一种基于深度卷积神经网络的张量型高光谱图像光谱-空间降维方法
CN106407986A (zh) 一种基于深度模型的合成孔径雷达图像目标识别方法
CN110119707B (zh) 一种人体动作识别方法
CN104318246A (zh) 基于深度自适应脊波网络的极化sar图像分类
CN109359661B (zh) 一种基于卷积神经网络的Sentinel-1雷达图像分类方法
CN113408423A (zh) 适用于tx2嵌入式平台的水产品目标实时检测方法
Nguyen et al. Satellite image classification using convolutional learning
CN113807356B (zh) 一种端到端的低能见度图像语义分割方法
CN110991257A (zh) 基于特征融合与svm的极化sar溢油检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141210