CN104517122A - 一种基于优化卷积架构的图像目标识别方法 - Google Patents
一种基于优化卷积架构的图像目标识别方法 Download PDFInfo
- Publication number
- CN104517122A CN104517122A CN201410767043.2A CN201410767043A CN104517122A CN 104517122 A CN104517122 A CN 104517122A CN 201410767043 A CN201410767043 A CN 201410767043A CN 104517122 A CN104517122 A CN 104517122A
- Authority
- CN
- China
- Prior art keywords
- image
- convolution
- training
- neural networks
- optimized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于优化卷积架构的图像目标识别方法,该方法首先对输入图像进行采集和增强处理形成样本;然后基于优化的卷积架构对样本进行训练;最后用训练后的卷积架构对图像目标进行分类识别。其中,卷积架构的优化包括:ReLU激活函数;局部响应归一化;卷积区重叠合并;神经元连接Drop-out技术;启发式学习。与现有技术相比,本发明能够扩充带标签样本,支持较多对象分类并获得较快的训练收敛速度和较高的图像目标识别率,并具备更高的鲁棒性。
Description
技术领域
本发明属于图像分析识别技术领域,具体涉及一种基于优化卷积架构的图像目标识别方法。
背景技术
目前,模式识别作为机器学习中的热门研究领域,随着计算机网络图像数据的海量出现越来越受到重视。为了有效管理图像数据并更好的为用户服务,图像目标的自动识别变得尤为重要。
传统的图形识别方法如SVM(Support Vector Machine,支持向量机)、Boosting主要是通过提取图像的特征再进行分类识别。卷积神经网络则是一种基于监督的深度学习模型,实质是模拟人脑机制构建具有多隐层的学习网络,其“感受野”和权值共享的网络结构降低了模型复杂度,并对平移、缩放、倾斜等变形具有高度不变性。以图像直接作为网络输入,卷积神经网络通过逐层特征变换来学习更抽象的特征表达以达到分类识别的目的。
Yann LeCun提出卷积神经网络是一种基于监督的深度学习模型,实质是模拟人脑机制构建具有多隐层的学习网络,其“感受野”和权值共享的网络结构降低了模型复杂度,并对平移、缩放、倾斜等变形具有高度不变性。具体而言,卷积神经网络包括卷积层、采样层、全连接层和输出层。其中,卷积层以图像直接作为网络输入,通过与不同的卷积滤波器卷积得到多个特征图。特征图经降采样操作降低维数并通过激活函数得到采样层。采样层输出直接作为下一卷积层的输入,这一卷积、采样操作可重复多次。全连接层以最高卷积层的特征为输入并映射为向量输出。输出层则是一个C-类的softmax分类器。
卷积神经网络应用于手写数字开始,基于卷积神经网络的图像分类技术已经应用于车型、人脸等识别任务上,并在训练收敛速度和识别率取得了较好的效果。尽管如此,目前卷积神经网络在模式识别中的应用还存在以下缺陷:
第一,尽管当前图像数据海量,但由于基于监督的学习方式其训练数据需要带标签,使当前卷积神经网络应用的分类对象较少且受限于训练库。
第二,在对较多图像类别进行识别时,卷积神经网络规模相应增大,其待训练参数大幅增长,容易出现过拟合现象。
第三,卷积神经网络对新的对象识别任务的可移植性不强,即在面对未知复杂的图像识别对象时,训练收敛速度和目标识别率上很难以让用户满意。
发明内容
针对现有技术所存在的上述技术问题,本发明提供了一种基于优化卷积架构的图像目标识别方法,能够扩充带标签样本,支持较多对象分类并获得较快的训练收敛速度和较高的图像目标识别率。
一种基于优化卷积架构的图像目标识别方法,包括如下步骤:
(1)对输入的样本图像进行图像增强处理;
(2)利用处理后得到的样本图像对卷积神经网络进行优化训练;
(3)输入目标图像至训练好的卷积神经网络中,以对该目标图像进行分类识别。
所述的样本图像来自目前图像识别领域最大且语义学上分类最全的训练库ImageNet。
所述的步骤(1)中对样本图像进行图像增强处理的具体过程如下:
1.1图像平移和翻转:在样本图像四周和中心分别提取固定大小的图像块并做水平翻转,以得到扩增10倍的图像训练集;
1.2图像的RGB颜色通道强度变更:对于每一样本图像,在对图像RGB像素值做PCA处理后,通过以下算式将像素各通道主成份倍乘对应标准高斯随机量化的特征值,将结果添加到原始的RGB通道分量上,以改变像素的颜色强度:
Ixy=[Rxy,Gxy,Bxy]T+[PR,PG,PB][αRλR,αGλG,αBλB]T
其中:Ixy为任一像素变更后的颜色强度,Rxy、Gxy、Bxy对应为该像素变更前对应红色、绿色、蓝色三个通道上的颜色强度值,PR和λR分别为颜色强度值Rxy对应的3×3协方差矩阵的特征向量和特征值,PG和λG分别为颜色强度值Gxy对应的3×3协方差矩阵的特征向量和特征值,PB和λB分别为颜色强度值Bxy对应的3×3协方差矩阵的特征向量和特征值,αR、αG、αB均为标准正太分布下产生的随机变量值。
所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,通过卷积滤波器对输入进行卷积操作提取特征时,为使卷积架构充分利用同一特征核映射图邻近神经元的信息,采取减少降采样步进的方式,使降采样区域部分重叠的方法进行卷积。
所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,特征图在降采样处理后,对图像中神经元输出采用ReLU(修正线性单元)作为建模激活函数,函数的具体表达如下:
f(x)=max(0,x)
其中:x为函数的输入,f(x)表示为神经元输出。
所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,在卷积层根据以下算式对卷积滤波器输出得到的多个特征图进行归一化处理:
其中:ai和aj对应为第i个和第j个核函数在特征图任一像素位置的神经元响应,bi对应为ai归一化后的神经元响应,N为卷积层的核函数总数,k、n、α、β均为由验证集决定的参数。
所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,对于神经元采用Drop-out技术,将隐层神经元输出以50%的概率设为零,被丢弃神经元不再参与前向传递和后向传播。
所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,采取启发式算法更新学习速率。
本发明与现有技术相比,其显著优势在于:
第一,本发明在数据采集阶段,对带标签样本进行了数据增强,扩充了训练样本集并且减少了过拟合现象。
第二,本发明是基于ImageNet图像库做训练的,其依据WordNet层次结构的分类涵盖广。在面对未知复杂识别任务时,本发明的卷积架构具备移植通用性。
第三,本发明基于基础卷积神经网络架构作出了大量优化,具备更优的图像目标识别率和较高的计算效率。
附图说明
图1为本发明方法的流程框架示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
本发明基于优化卷积架构的图像目标识别方法,框架如图1所示,包括前端处理、模型训练和识别应用,具体展开为以下三大步骤:
第一步,前端处理:输入图像的采集与增强处理。
输入图像样本的采集可以通过拍摄获取和网络平台搜索获得。在获得初始样本后,为减少过拟合现象的出现,对采集的带标签样本进行以下增强处理:
(1)图像平移和翻转:在采集的原始图像四周和中心分别提取固定大小的图像块并做水平翻转,得到扩增10倍的训练集。
(2)图像的RGB颜色通道强度变更:对每一训练集图像,在对RGB像素值做PCA处理后,各通道主成份倍乘对应标准高斯随机量化的特征值,将结果添加到原始的RGB通道分量上,改变颜色强度。颜色通道变更计算具体为:
Ixy=[Ixy R,Ixy G,Ixy B]T+[P1,P2,P3][α1λ1,α2λ2,α3λ3]T
其中,PCA处理时由RGB像素值得到3X3协方差矩阵,Pi和λi分别对应其特征向量和特征值,αi是标准正态分布下产生的随机变量值。
第二步,基于优化的卷积架构对样本进行训练。
卷积架构的基础是8层卷积神经网络。训练样本来自目前图像识别领域最大且语义学上分类最全的训练库ImageNet。卷积神经网络是一种基于监督的深度学习模型,实质是模拟人脑机制构建具有多隐层的学习网络,其“感受野”和权值共享的网络结构降低了模型复杂度,并对平移、缩放、倾斜等变形具有高度不变性。
卷积神经网络结构包括卷积层、采样层、全连接层和输出层。具体而言,卷积层以图像直接作为网络输入,通过与不同的卷积滤波器卷积得到多个特征图。特征图经降采样操作降低维数并通过激活函数得到采样层,采样层输出直接作为下一卷积层的输入,这一卷积、采样操作可重复多次。全连接层以最高卷积层的特征为输入并映射为向量输出。输出层则是一个C-类的softmax分类器。
本实施方式对卷积架构的优化技术具体包括:
(1)卷积区重叠pooling:通过卷积滤波器对输入进行卷积操作提取特征时,为使卷积架构充分利用同一特征核映射图邻近神经元的信息,卷积架构中为充分利用同一特征核映射图邻近神经元的信息,采取减少Pooling步进,使Pooling区域部分重叠的方法进行卷积。
(2)局部响应归一化:在卷积层中,对滤波器卷积得到的多个特征图进行归一化处理,具体而言,选取卷积核映射在空间位置上的n"邻近"激励平方求和作为总“单位”,对每个神经元响应做归一化处理。归一化的神经元响应具体为:
其中,是核函数i在(x,y)位置的神经元响应,N是这一层的核函数总数,常数k,n,α,β是由验证集决定的超参数,此处分别设置为2,5,10-4,0.75。
(3)ReLU激活函数:特征图在降采样处理后,对神经元输出f的建模函数为ReLU(修正线性单元),激活函数具体为f(x)=max(0,x)。
(4)神经元连接Drop-out技术:卷积架构的隐层神经元并非全连接,而是采用Drop-out技术,将隐层神经元输出以50%的概率设为零,被丢弃神经元不再参与前向传递和后向传播。
(5)启发式学习:学习速率决定整个架构参数调整的步幅,在训练过程中采取启发式算法更新学习速率。
第三步,用训练好的卷积架构对图像目标进行分类识别。此处基于ImageNet训练的优化卷积架构既能对当前训练的1000类对象具备较高的图像目标识别率;同时对于未知的识别任务,此优化卷积架构的已训练的网络权重参数可以作为基础,将模型的特征表达迁移学习到其他图像目标识别上,加速训练的收敛并提高目标识别的准确率。
Claims (8)
1.一种基于优化卷积架构的图像目标识别方法,包括如下步骤:
(1)对输入的样本图像进行图像增强处理;
(2)利用处理后得到的样本图像对卷积神经网络进行优化训练;
(3)输入目标图像至训练好的卷积神经网络中,以对该目标图像进行分类识别。
2.根据权利要求1所述的图像目标识别方法,其特征在于:所述的样本图像来自目前图像识别领域最大且语义学上分类最全的训练库ImageNet。
3.根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(1)中对样本图像进行图像增强处理的具体过程如下:
1.1图像平移和翻转:在样本图像四周和中心分别提取固定大小的图像块并做水平翻转,以得到扩增10倍的图像训练集;
1.2图像的RGB颜色通道强度变更:对于每一样本图像,在对图像RGB像素值做PCA处理后,通过以下算式将像素各通道主成份倍乘对应标准高斯随机量化的特征值,将结果添加到原始的RGB通道分量上,以改变像素的颜色强度:
其中:Ixy为任一像素变更后的颜色强度,Rxy、Gxy、Bxy对应为该像素变更前对应红色、绿色、蓝色三个通道上的颜色强度值,PR和λR分别为颜色强度值Rxy对应的3×3协方差矩阵的特征向量和特征值,PG和λG分别为颜色强度值Gxy对应的3×3协方差矩阵的特征向量和特征值,PB和λB分别为颜色强度值Bxy对应的3×3协方差矩阵的特征向量和特征值,αR、αG、αB均为标准正态分布下产生的随机变量值。
4.根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,通过卷积滤波器对输入进行卷积操作提取特征时,为使卷积架构充分利用同一特征核映射图邻近神经元的信息,采取减少降采样步进的方式,使降采样区域部分重叠的方法进行卷积。
5.根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,特征图在降采样处理后,对图像中神经元输出采用ReLU(修正线性单元)作为建模激活函数,函数的具体表达如下:
f(x)=max(0,x)
其中:x为函数的输入,f(x)表示为神经元输出。
6.根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,在卷积层根据以下算式对卷积滤波器输出得到的多个特征图进行归一化处理:
其中:ai和aj对应为第i个和第j个核函数在特征图任一像素位置的神经元响应,bi对应为ai归一化后的神经元响应,N为卷积层的核函数总数,k、n、α、β均为由验证集决定的参数。
7.根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,对于神经元采用Drop-out技术,将隐层神经元输出以50%的概率设为零,被丢弃神经元不再参与前向传递和后向传播。
8.根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,采取启发式算法更新学习速率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410767043.2A CN104517122A (zh) | 2014-12-12 | 2014-12-12 | 一种基于优化卷积架构的图像目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410767043.2A CN104517122A (zh) | 2014-12-12 | 2014-12-12 | 一种基于优化卷积架构的图像目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104517122A true CN104517122A (zh) | 2015-04-15 |
Family
ID=52792388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410767043.2A Pending CN104517122A (zh) | 2014-12-12 | 2014-12-12 | 一种基于优化卷积架构的图像目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104517122A (zh) |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104952443A (zh) * | 2015-06-12 | 2015-09-30 | 深圳市车音网科技有限公司 | 一种语音信息识别方法和解码器 |
CN105373796A (zh) * | 2015-10-23 | 2016-03-02 | 北京天诚盛业科技有限公司 | 图像激活操作的方法、装置及其应用 |
CN105512674A (zh) * | 2015-11-25 | 2016-04-20 | 中国科学院自动化研究所 | 基于密集匹配子自适应相似性度量的rgb-d物体识别方法和装置 |
CN105550750A (zh) * | 2015-12-21 | 2016-05-04 | 长沙网动网络科技有限公司 | 提高卷积神经网络识别精度的方法 |
CN105787488A (zh) * | 2016-03-02 | 2016-07-20 | 浙江宇视科技有限公司 | 由全局向局部传递的图像特征提取方法及装置 |
CN105956626A (zh) * | 2016-05-12 | 2016-09-21 | 成都新舟锐视科技有限公司 | 基于深度学习的对车牌位置不敏感的车牌识别方法 |
CN106548201A (zh) * | 2016-10-31 | 2017-03-29 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法、图像识别方法及装置 |
CN106682592A (zh) * | 2016-12-08 | 2017-05-17 | 北京泛化智能科技有限公司 | 一种基于神经网络方法的图像自动识别系统及方法 |
CN106709421A (zh) * | 2016-11-16 | 2017-05-24 | 广西师范大学 | 一种基于变换域特征和cnn的细胞图像识别分类方法 |
CN106845440A (zh) * | 2017-02-13 | 2017-06-13 | 山东万腾电子科技有限公司 | 一种增强现实图像处理方法及系统 |
CN106875203A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种确定商品图片的款式信息的方法及装置 |
CN106874924A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种图片风格识别方法及装置 |
CN106910184A (zh) * | 2017-01-12 | 2017-06-30 | 杭州电子科技大学 | 基于深度卷积神经网络的内窥镜图像肠道出血检测方法 |
CN107247949A (zh) * | 2017-08-02 | 2017-10-13 | 北京智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
CN107480773A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 训练卷积神经网络模型的方法、装置及存储介质 |
CN107609503A (zh) * | 2017-09-05 | 2018-01-19 | 刘宇红 | 智能癌变细胞识别系统及方法、云平台、服务器、计算机 |
CN107702020A (zh) * | 2017-10-27 | 2018-02-16 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种多功能联动的智慧路灯控制方法 |
CN108009594A (zh) * | 2017-12-25 | 2018-05-08 | 北京航空航天大学 | 一种基于变分组卷积的图像识别方法 |
CN108021938A (zh) * | 2017-11-29 | 2018-05-11 | 中冶南方工程技术有限公司 | 一种冷轧带钢表面缺陷在线检测方法以及检测系统 |
CN108053836A (zh) * | 2018-01-18 | 2018-05-18 | 成都嗨翻屋文化传播有限公司 | 一种基于深度学习的音频自动化标注方法 |
CN108090399A (zh) * | 2016-11-22 | 2018-05-29 | 北京新唐思创教育科技有限公司 | 一种自动化光学图像识别方法及其装置 |
CN108090517A (zh) * | 2017-12-29 | 2018-05-29 | 美的集团股份有限公司 | 一种谷物识别方法、装置和计算机存储介质 |
CN108205701A (zh) * | 2016-12-20 | 2018-06-26 | 联发科技股份有限公司 | 一种执行卷积计算的系统及方法 |
CN108305243A (zh) * | 2017-12-08 | 2018-07-20 | 五邑大学 | 一种基于深度学习的磁瓦表面缺陷检测方法 |
CN108549910A (zh) * | 2018-04-17 | 2018-09-18 | 中国农业大学 | 一种基于卷积神经网络的玉米制种果穗图像初级分类方法 |
CN108921169A (zh) * | 2018-07-12 | 2018-11-30 | 珠海上工医信科技有限公司 | 一种眼底图像血管分割方法 |
CN109034184A (zh) * | 2018-06-07 | 2018-12-18 | 广西电网有限责任公司玉林供电局 | 一种基于深度学习的均压环检测识别方法 |
CN109196514A (zh) * | 2016-02-01 | 2019-01-11 | 西-奥特私人有限公司 | 图像分类和标记 |
CN109472359A (zh) * | 2018-10-23 | 2019-03-15 | 深圳和而泰数据资源与云技术有限公司 | 深度神经网络的网络结构处理方法及相关产品 |
CN109684922A (zh) * | 2018-11-20 | 2019-04-26 | 浙江大学山东工业技术研究院 | 一种基于卷积神经网络的多模型对成品菜的识别方法 |
CN109886933A (zh) * | 2019-01-25 | 2019-06-14 | 腾讯科技(深圳)有限公司 | 一种医学图像识别方法、装置和存储介质 |
CN110033035A (zh) * | 2019-04-04 | 2019-07-19 | 武汉精立电子技术有限公司 | 一种基于强化学习的aoi缺陷分类方法及装置 |
WO2019153908A1 (zh) * | 2018-02-11 | 2019-08-15 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和系统 |
CN110208660A (zh) * | 2019-06-05 | 2019-09-06 | 国网江苏省电力有限公司电力科学研究院 | 一种用于电力设备局部放电缺陷诊断的训练方法及装置 |
US10540768B2 (en) | 2015-09-30 | 2020-01-21 | Samsung Electronics Co., Ltd. | Apparatus and method to segment object from image |
WO2020082732A1 (zh) * | 2018-10-26 | 2020-04-30 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
CN111507378A (zh) * | 2020-03-24 | 2020-08-07 | 华为技术有限公司 | 训练图像处理模型的方法和装置 |
WO2021184466A1 (zh) * | 2020-03-17 | 2021-09-23 | 北京大学 | 一种基于偏微分算子的等变卷积网络模型的图像分类方法 |
CN114648479A (zh) * | 2022-05-23 | 2022-06-21 | 科大天工智能装备技术(天津)有限公司 | 一种夜间使用的红外与相机信息分层融合方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984959A (zh) * | 2014-05-26 | 2014-08-13 | 中国科学院自动化研究所 | 一种基于数据与任务驱动的图像分类方法 |
CN104077613A (zh) * | 2014-07-16 | 2014-10-01 | 电子科技大学 | 一种基于级联多级卷积神经网络的人群密度估计方法 |
CN104112113A (zh) * | 2013-04-19 | 2014-10-22 | 无锡南理工科技发展有限公司 | 一种基于改进型特征卷积神经网络图像识别方法 |
-
2014
- 2014-12-12 CN CN201410767043.2A patent/CN104517122A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112113A (zh) * | 2013-04-19 | 2014-10-22 | 无锡南理工科技发展有限公司 | 一种基于改进型特征卷积神经网络图像识别方法 |
CN103984959A (zh) * | 2014-05-26 | 2014-08-13 | 中国科学院自动化研究所 | 一种基于数据与任务驱动的图像分类方法 |
CN104077613A (zh) * | 2014-07-16 | 2014-10-01 | 电子科技大学 | 一种基于级联多级卷积神经网络的人群密度估计方法 |
Non-Patent Citations (1)
Title |
---|
ALEX KRIZHEVSKY ET AL.: ""ImageNet Classification with Deep Convolutional Neural Networks"", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》 * |
Cited By (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104952443A (zh) * | 2015-06-12 | 2015-09-30 | 深圳市车音网科技有限公司 | 一种语音信息识别方法和解码器 |
US10540768B2 (en) | 2015-09-30 | 2020-01-21 | Samsung Electronics Co., Ltd. | Apparatus and method to segment object from image |
CN105373796A (zh) * | 2015-10-23 | 2016-03-02 | 北京天诚盛业科技有限公司 | 图像激活操作的方法、装置及其应用 |
CN105373796B (zh) * | 2015-10-23 | 2019-01-25 | 河南眼神科技有限公司 | 图像激活操作的方法、装置及其应用 |
CN105512674A (zh) * | 2015-11-25 | 2016-04-20 | 中国科学院自动化研究所 | 基于密集匹配子自适应相似性度量的rgb-d物体识别方法和装置 |
CN105512674B (zh) * | 2015-11-25 | 2019-04-12 | 中国科学院自动化研究所 | 基于密集匹配子自适应相似性度量的rgb-d物体识别方法和装置 |
CN106874924A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种图片风格识别方法及装置 |
CN106874924B (zh) * | 2015-12-14 | 2021-01-29 | 阿里巴巴集团控股有限公司 | 一种图片风格识别方法及装置 |
CN106875203A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种确定商品图片的款式信息的方法及装置 |
CN105550750A (zh) * | 2015-12-21 | 2016-05-04 | 长沙网动网络科技有限公司 | 提高卷积神经网络识别精度的方法 |
CN105550750B (zh) * | 2015-12-21 | 2017-10-17 | 长沙网动网络科技有限公司 | 提高卷积神经网络识别精度的方法 |
CN109196514B (zh) * | 2016-02-01 | 2022-05-10 | 西-奥特私人有限公司 | 图像分类和标记 |
CN109196514A (zh) * | 2016-02-01 | 2019-01-11 | 西-奥特私人有限公司 | 图像分类和标记 |
CN105787488B (zh) * | 2016-03-02 | 2019-04-30 | 浙江宇视科技有限公司 | 由全局向局部传递的图像特征提取方法及装置 |
CN105787488A (zh) * | 2016-03-02 | 2016-07-20 | 浙江宇视科技有限公司 | 由全局向局部传递的图像特征提取方法及装置 |
CN105956626A (zh) * | 2016-05-12 | 2016-09-21 | 成都新舟锐视科技有限公司 | 基于深度学习的对车牌位置不敏感的车牌识别方法 |
CN106548201A (zh) * | 2016-10-31 | 2017-03-29 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法、图像识别方法及装置 |
CN106548201B (zh) * | 2016-10-31 | 2020-07-21 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法、图像识别方法及装置 |
CN106709421B (zh) * | 2016-11-16 | 2020-03-31 | 广西师范大学 | 一种基于变换域特征和cnn的细胞图像识别分类方法 |
CN106709421A (zh) * | 2016-11-16 | 2017-05-24 | 广西师范大学 | 一种基于变换域特征和cnn的细胞图像识别分类方法 |
CN108090399A (zh) * | 2016-11-22 | 2018-05-29 | 北京新唐思创教育科技有限公司 | 一种自动化光学图像识别方法及其装置 |
CN106682592B (zh) * | 2016-12-08 | 2023-10-27 | 北京泛化智能科技有限公司 | 一种基于神经网络方法的图像自动识别系统及方法 |
CN106682592A (zh) * | 2016-12-08 | 2017-05-17 | 北京泛化智能科技有限公司 | 一种基于神经网络方法的图像自动识别系统及方法 |
CN108205701B (zh) * | 2016-12-20 | 2021-12-28 | 联发科技股份有限公司 | 一种执行卷积计算的系统及方法 |
CN108205701A (zh) * | 2016-12-20 | 2018-06-26 | 联发科技股份有限公司 | 一种执行卷积计算的系统及方法 |
CN106910184B (zh) * | 2017-01-12 | 2020-10-09 | 杭州电子科技大学 | 基于深度卷积神经网络的内窥镜图像肠道出血检测方法 |
CN106910184A (zh) * | 2017-01-12 | 2017-06-30 | 杭州电子科技大学 | 基于深度卷积神经网络的内窥镜图像肠道出血检测方法 |
CN106845440B (zh) * | 2017-02-13 | 2020-04-10 | 山东万腾电子科技有限公司 | 一种增强现实图像处理方法及系统 |
CN106845440A (zh) * | 2017-02-13 | 2017-06-13 | 山东万腾电子科技有限公司 | 一种增强现实图像处理方法及系统 |
CN107247949A (zh) * | 2017-08-02 | 2017-10-13 | 北京智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
CN107480773B (zh) * | 2017-08-09 | 2020-11-13 | 北京小米移动软件有限公司 | 训练卷积神经网络模型的方法、装置及存储介质 |
CN107480773A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 训练卷积神经网络模型的方法、装置及存储介质 |
CN107609503A (zh) * | 2017-09-05 | 2018-01-19 | 刘宇红 | 智能癌变细胞识别系统及方法、云平台、服务器、计算机 |
CN107702020A (zh) * | 2017-10-27 | 2018-02-16 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种多功能联动的智慧路灯控制方法 |
CN108021938A (zh) * | 2017-11-29 | 2018-05-11 | 中冶南方工程技术有限公司 | 一种冷轧带钢表面缺陷在线检测方法以及检测系统 |
CN108305243B (zh) * | 2017-12-08 | 2021-11-30 | 五邑大学 | 一种基于深度学习的磁瓦表面缺陷检测方法 |
CN108305243A (zh) * | 2017-12-08 | 2018-07-20 | 五邑大学 | 一种基于深度学习的磁瓦表面缺陷检测方法 |
CN108009594B (zh) * | 2017-12-25 | 2018-11-13 | 北京航空航天大学 | 一种基于变分组卷积的图像识别方法 |
CN108009594A (zh) * | 2017-12-25 | 2018-05-08 | 北京航空航天大学 | 一种基于变分组卷积的图像识别方法 |
CN108090517A (zh) * | 2017-12-29 | 2018-05-29 | 美的集团股份有限公司 | 一种谷物识别方法、装置和计算机存储介质 |
CN108053836A (zh) * | 2018-01-18 | 2018-05-18 | 成都嗨翻屋文化传播有限公司 | 一种基于深度学习的音频自动化标注方法 |
CN108053836B (zh) * | 2018-01-18 | 2021-03-23 | 成都嗨翻屋科技有限公司 | 一种基于深度学习的音频自动化标注方法 |
WO2019153908A1 (zh) * | 2018-02-11 | 2019-08-15 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和系统 |
CN108549910A (zh) * | 2018-04-17 | 2018-09-18 | 中国农业大学 | 一种基于卷积神经网络的玉米制种果穗图像初级分类方法 |
CN109034184A (zh) * | 2018-06-07 | 2018-12-18 | 广西电网有限责任公司玉林供电局 | 一种基于深度学习的均压环检测识别方法 |
CN109034184B (zh) * | 2018-06-07 | 2022-03-11 | 广西电网有限责任公司玉林供电局 | 一种基于深度学习的均压环检测识别方法 |
CN108921169A (zh) * | 2018-07-12 | 2018-11-30 | 珠海上工医信科技有限公司 | 一种眼底图像血管分割方法 |
CN108921169B (zh) * | 2018-07-12 | 2019-05-24 | 珠海上工医信科技有限公司 | 一种眼底图像血管分割方法 |
CN109472359A (zh) * | 2018-10-23 | 2019-03-15 | 深圳和而泰数据资源与云技术有限公司 | 深度神经网络的网络结构处理方法及相关产品 |
CN109472359B (zh) * | 2018-10-23 | 2021-06-04 | 深圳和而泰数据资源与云技术有限公司 | 深度神经网络的网络结构处理方法及相关产品 |
WO2020082732A1 (zh) * | 2018-10-26 | 2020-04-30 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
CN109684922A (zh) * | 2018-11-20 | 2019-04-26 | 浙江大学山东工业技术研究院 | 一种基于卷积神经网络的多模型对成品菜的识别方法 |
CN109886933A (zh) * | 2019-01-25 | 2019-06-14 | 腾讯科技(深圳)有限公司 | 一种医学图像识别方法、装置和存储介质 |
CN109886933B (zh) * | 2019-01-25 | 2021-11-02 | 腾讯科技(深圳)有限公司 | 一种医学图像识别方法、装置和存储介质 |
CN110033035A (zh) * | 2019-04-04 | 2019-07-19 | 武汉精立电子技术有限公司 | 一种基于强化学习的aoi缺陷分类方法及装置 |
CN110208660B (zh) * | 2019-06-05 | 2021-07-27 | 国网江苏省电力有限公司电力科学研究院 | 一种用于电力设备局部放电缺陷诊断的训练方法及装置 |
CN110208660A (zh) * | 2019-06-05 | 2019-09-06 | 国网江苏省电力有限公司电力科学研究院 | 一种用于电力设备局部放电缺陷诊断的训练方法及装置 |
WO2021184466A1 (zh) * | 2020-03-17 | 2021-09-23 | 北京大学 | 一种基于偏微分算子的等变卷积网络模型的图像分类方法 |
WO2021190451A1 (zh) * | 2020-03-24 | 2021-09-30 | 华为技术有限公司 | 训练图像处理模型的方法和装置 |
CN111507378A (zh) * | 2020-03-24 | 2020-08-07 | 华为技术有限公司 | 训练图像处理模型的方法和装置 |
CN114648479A (zh) * | 2022-05-23 | 2022-06-21 | 科大天工智能装备技术(天津)有限公司 | 一种夜间使用的红外与相机信息分层融合方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104517122A (zh) | 一种基于优化卷积架构的图像目标识别方法 | |
CN111368896B (zh) | 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法 | |
CN107016405B (zh) | 一种基于分级预测卷积神经网络的害虫图像分类方法 | |
Kang et al. | Semantic segmentation model of cotton roots in-situ image based on attention mechanism | |
CN108304826A (zh) | 基于卷积神经网络的人脸表情识别方法 | |
CN106815604A (zh) | 基于多层信息融合的注视点检测方法 | |
CN110298387A (zh) | 融入像素级attention机制的深度神经网络目标检测方法 | |
CN104361313B (zh) | 一种基于多核学习异构特征融合的手势识别方法 | |
CN109241982A (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN108960404B (zh) | 一种基于图像的人群计数方法及设备 | |
CN106682569A (zh) | 一种基于卷积神经网络的快速交通标识牌识别方法 | |
CN105825511A (zh) | 一种基于深度学习的图片背景清晰度检测方法 | |
CN110009095A (zh) | 基于深度特征压缩卷积网络的道路行驶区域高效分割方法 | |
Zhang et al. | Vehicle color recognition using Multiple-Layer Feature Representations of lightweight convolutional neural network | |
CN106023224A (zh) | 一种中药材显微图像的pcnn自动分割方法 | |
CN107154048A (zh) | 一种脉冲耦合神经网络模型的遥感图像分割方法及装置 | |
CN112950780B (zh) | 一种基于遥感影像的网络地图智能生成方法及系统 | |
Chen et al. | Agricultural remote sensing image cultivated land extraction technology based on deep learning | |
CN110245602A (zh) | 一种基于深度卷积特征的水下静目标识别方法 | |
CN110096991A (zh) | 一种基于卷积神经网络的手语识别方法 | |
CN113435254A (zh) | 一种基于哨兵二号影像的耕地深度学习提取方法 | |
Wang et al. | High-resolution remote sensing images semantic segmentation using improved UNet and SegNet | |
Mhatre et al. | Cotton leaves disease detection and cure using deep learning | |
Ling et al. | A facial expression recognition system for smart learning based on YOLO and vision transformer | |
Liu et al. | A novel image segmentation algorithm based on visual saliency detection and integrated feature extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150415 |