CN106228177A - 基于卷积神经网络的日常生活物体图像识别方法 - Google Patents
基于卷积神经网络的日常生活物体图像识别方法 Download PDFInfo
- Publication number
- CN106228177A CN106228177A CN201610528629.2A CN201610528629A CN106228177A CN 106228177 A CN106228177 A CN 106228177A CN 201610528629 A CN201610528629 A CN 201610528629A CN 106228177 A CN106228177 A CN 106228177A
- Authority
- CN
- China
- Prior art keywords
- neural networks
- obtains
- convolutional neural
- training
- daily life
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于卷积神经网络的日常生活物体图像识别方法,其主要包括以下步骤:使用kinect相机对日常生活物体进行拍照,获取图像的颜色和深度信息,建立样本集。然后建立六层的卷积神经网络,得到训练好的模型。最后将此模型用于日常生活物体图片的识别测试。本发明的卷积网络结构用于日常生活物体识别,解决了传统图像识别方法中难以提取到优良特征的难题,同时利用了图片中的深度信息,有效提高了识别率。最终在大量图片上进行测试后的结果证明这种结构具有良好的泛化能力,可以用于家居机器人等众多家居场合的图像处理设备上。
Description
技术领域
本发明涉及图像识别领域,特别涉及一种基于卷积神经网络的日常生活物体图像识别方法。
背景技术
随着信息时代的全面发展,数字图像已经是传递信息非常重要的媒介。智能设备的发展使得我们希望电子设备具备类似于人的图像识别能力,这一点在家居机器人身上更是如此,如软银推出的Pepper,法国研制的Keecher和Buddy,这些都需要实现人与机器之间的交互,机器人具备人类视觉的识别能力就很重要了,至少能识别出日常生活中常见的物体。
但是传统的图像识别技术都严重依赖于手工设计的特征提取器,一方面这些特征提取器的设计耗时耗力,如非常著名的SIFT(尺度不变特征转换)就花费了多年的时间来研制;另一方面这些特征还是比较低级的特征,如SIFT只能用于提取一些粗浅的边缘信息。要研制高级特征的提取器是特征工程中的难题。
发明内容
为了克服上述传统特征提取的难题,本发明提供了一种基于卷积神经网络的日常生活物体图像识别方法,该方法不用手工提取特征,同时不仅利用了颜色信息还可以利用图片的深度信息,解决了传统图像识别方法中难以提取到优良特征的难题,同时利用了图片中的深度信息,有效提高了识别率。最终在大量图片上进行测试后的结果证明这种结构具有良好的泛化能力,可以用于家居机器人等众多家居场合的图像处理设备上。
本发明的目的可以通过以下的技术方法实现:一种基于卷积神经网络的日常生活物体图像识别方法,具体包括以下步骤:
(1)建立数据集,并进行预处理:
拍摄日常生活物体图片并建立数据集,所述图片包括颜色图像和深度图像,对得到的图片进行预处理,得到训练数据和测试数据;
(2)搭建卷积神经网络模型:
卷积神经网络模型包括C个卷积层、F个全连接层和一个softmax分类器,2≤C≤5,1≤F≤3;在每一个卷积层中进行卷积、池化和归一化处理;每个卷积层的卷积核大小是ci*ci,步长为sci*sci,其中1≤ci≤10,1≤sci≤5,1≤i≤C;对图像进行卷积处理得到ki种特征,1≤ki≤256;每个卷积层的池化处理使用最大池化,大小为pi*pi,步长为spi*spi,其中1≤pi≤10,1≤spi≤5,1≤i≤C;对池化处理后的图像进行归一化处理;图像经过上一个卷积层处理后得到的结果输入下一个卷积层;
在第C个卷积层之后,将得到的特征展开成一维向量输入到第一个全连接层中,然后将第一个全连接层的结果输入到第二个全连接层中,以此类推,在经过第F个全连接层之后得到logits值,最后将得到的logits值输入到softmax分类器中,得到该图片属于各个类别的概率值,由此概率值与真实的label计算得到交叉熵损失函数,从而完成了卷积神经网络模型的搭建;其中,每一个全连接层中含有的神经元个数为fj,其中1≤fj≤768,1≤j≤F;
(3)模型的训练:
将步骤(1)得到的训练数据输入到步骤(2)得到的卷积神经网络模型中开始训练;训练使用梯度下降法,学习率使用变动学习率,训练迭代次数在5万‐10万次之间;
(4)模型的测试:
将步骤(1)得到的测试数据输入到步骤(3)得到的训练完成后的模型中,得到预测的label,将预测的label和真实的label进行对比,可计算出识别率;如果识别率大于85%,则步骤(3)训练得到的训练模型合格;若识别率小于85%,则返回步骤(2);
(5)模型的使用:
将待识别的图片进行预处理后输入到合格的训练模型的前C+F层中,得到logits值,然后在logits值中选择最大值所在的下标,即为预测的label,从而完成识别。
进一步地,所述图片进行预处理具体为:对深度图像中缺失深度信息的像素进行线性和最邻近法进行插值,然后将深度图像和颜色图像的大小同时归一化为M*M像素,其中c1≤M≤256;然后对归一化后的两张图片进行随机裁剪、随机水平翻转、随机对比度和亮度的改变,最后进行白化操作,得到两张N*N像素的图片,其中1≤N<M;提取N*N像素的颜色图像中的RGB信息和深度图像中的深度信息,并将RGB信息和深度信息排列成一行,最后将label放于这一行的第一个字节,从而组成一个样本的数据。
进一步地,所述神经元均是修正线性单元(ReLU);为了防止过拟合,对两个全连接层使用weight decay。
与现有技术相比,本发明具有如下优点:
(1)本发明基于卷积神经网络,对原始图片进行操作,不需要设计复杂的特征提取器,减少了大量的时间和人力。
(2)在卷积网络的设计中相比传统的卷积网络使用了更小的卷积核,在不增加参数的情况下相比传统卷积网络增加了深度,使得提取特征的能力更强。
(3)本发明中不仅利用了图片的颜色信息还利用了图片的深度信息。不同物体有不同形状,在传统图像处理中形状只能通过平面的外形来表现,而在本发明中利用了图片的深度信息,意味着可以利用物体的三维外形信息,这对于识别率的提升有很大帮助。
附图说明
图1为本发明实施例中数据预处理的流程图;
图2为本发明实施例的卷积神经网络结构图;
图3为本发明实施例的卷积神经网络系统图。
具体实施方法
结合下面的实施例子,对本发明进行进一步的详细说明,但是本发明提出的方法并不限于这一种实施方法。
如图1‐3所示,本发明为基于卷积神经网络的日常生活物体图像识别方法,其一种实施例包括以下步骤:
(1)建立数据集,并进行预处理:
拍摄日常生活物体图片并建立数据集,所述图片包括颜色图像和深度图像,对得到的图片进行预处理,得到训练数据和测试数据。本发明中使用的数据集为华盛顿大学的RGB‐D ObjectDataset(链接:http://rgbd‐dataset.cs.washington.edu),本发明中使用其中的207000张图片,其中训练集180000张,测试27000张。预处理包括:对深度图像中缺失深度信息的像素进行线性和最邻近法进行插值,然后将深度图和颜色图的大小同时归一化为32*32。然后对图片进行随机裁剪、随机水平反转、随机对比度和亮度的改变,最后进行白化,得到24*24的图片,将其中的RGB信息提取出来和深度信息排列成一行,将label放于这一行的第一位,从而组成一张图片的数据。对于所有的图片均按照这种方式处理,得到训练数据和测试数据,整个流程如图1所示。
(2)搭建卷积神经网络模型:
实施例中卷积神经网络模型包括3个卷积层、2个全连接层和一个softmax分类器;在每一个卷积层中进行卷积、池化和归一化处理。整个网络结构示意图如图2所示。其中,第一卷积层的卷积核大小是5*5,步长为1*1,卷积完成后从图片中提取出64种特征;池化使用最大池化,大小为3*3,步长为1*1,第二和第三卷积层的设置是一样的,卷积核大小为3*3,步长为1*1,池化为最大池化,大小为3*3,步长为2*2。在卷积之后,将得到的特征展开输入到两个全连接层中,这两层的神经元分别为384、192个,最后将得到的logits值输入到softmax分类器中,与真实的label进行对比得到交叉熵损失函数。
交叉熵是信息论中的常用函数,用来衡量两种分布之间的差异。在本发明中,每张图片真实的label存在某种分布,建立模型后对每张图片的预测label构成另一个分布,好的模型就是要使得这两个分布尽可能地接近。具体来说,交叉熵的定义如下:
其中p(label)表示label的真实分布,q(label)表示label的预测分布。
模型中使用的神经元均是线性修正单元(ReLU)。为了防止过拟合,对两个全连接层使用weight decay,weight decay的系数设置为0.004。权重的初始化为均值为0的高斯分布,不同层的差异在于标准差不同,偏置初始化为常数,具体列表如下:
(3)模型的训练:
将步骤(1)得到的训练数据输入到步骤(2)得到的卷积神经网络模型中开始训练;训练使用梯度下降法,对(2)中的到的损失函数关于所有变量进行求导,将梯度逐层反向传播,对变量进行更新。学习率使用变动学习率,即初始学习率为0.1,设定约10000次之后,学习率衰减为之前的0.8,训练迭代次数在5万‐10万次之间,在本实验中为51000次。
(4)模型的测试:
将准备好的测试集输入到模型的前五层中,对于得到logits值,然后在logits值中选择最大值所在的下标,即为预测的label;将270000张图片预测的label和真实的label进行对比得到识别率;如果识别率大于85%,则步骤(3)训练得到的训练模型合格;若识别率小于85%,则返回步骤(2)。
(5)模型的使用:
将待识别的图片进行预处理后输入到合格的训练模型的前五层中,得到logits值,然后在logits值中选择最大值所在的下标,即为预测的label,从而完成识别。
Claims (3)
1.一种基于卷积神经网络的日常生活物体图像识别方法,其特征在于,具体包括以下步骤:
(1)建立数据集,并进行预处理:
拍摄日常生活物体图片并建立数据集,所述图片包括颜色图像和深度图像,对得到的图片进行预处理,得到训练数据和测试数据;
(2)搭建卷积神经网络模型:
卷积神经网络模型包括C个卷积层、F个全连接层和一个softmax分类器,2≤C≤5,1≤F≤3;在每一个卷积层中进行卷积、池化和归一化处理;每个卷积层的卷积核大小是ci*ci,步长为sci*sci,其中1≤ci≤10,1≤sci≤5,1≤i≤C;对图像进行卷积处理得到ki种特征,1≤ki≤256;每个卷积层的池化处理使用最大池化,大小为pi*pi,步长为spi*spi,其中1≤pi≤10,1≤spi≤5,1≤i≤C;对池化处理后的图像进行归一化处理;图像经过上一个卷积层处理后得到的结果输入下一个卷积层。
在第C个卷积层之后,将得到的特征展开成一维向量输入到第一个全连接层中,然后将第一个全连接层的结果输入到第二个全连接层中,以此类推,在经过第F个全连接层之后得到logits值,最后将得到的logits值输入到softmax分类器中,得到该图片属于各个类别的概率值,由此概率值与真实的label计算得到交叉熵损失函数,从而完成了卷积神经网络模型的搭建;其中,每一个全连接层中含有的神经元个数为fj,其中1≤fj≤768,1≤j≤F;
(3)模型的训练:
将步骤(1)得到的训练数据输入到步骤(2)得到的卷积神经网络模型中开始训练;训练使用梯度下降法,学习率使用变动学习率,训练迭代次数在5万‐10万次之间;
(4)模型的测试:
将步骤(1)得到的测试数据输入到步骤(3)得到的训练完成后的模型中,得到预测的label,将预测的label和真实的label进行对比,可计算出识别率;如果识别率大于85%,则步骤(3)训练得到的训练模型合格;若识别率小于85%,则返回步骤(2);
(5)模型的使用:
将待识别的图片进行预处理后输入到合格的训练模型的前C+F层中,得到logits值,然后在logits值中选择最大值所在的下标,即为预测的label,从而完成识别。
2.根据权利要求1所述的基于卷积神经网络的日常生活物体图像识别方法,其特征在于,所述图片进行预处理具体为:对深度图像中缺失深度信息的像素进行线性和最邻近法进行插值,然后将深度图像和颜色图像的大小同时归一化为M*M像素,其中c1≤M≤256;然后对归一化后的两张图片进行随机裁剪、随机水平翻转、随机对比度和亮度的改变,最后进行白化操作,得到两张N*N像素的图片,其中1≤N<M;提取N*N像素的颜色图像中的RGB信息和深度图像中的深度信息,并将RGB信息和深度信息排列成一行,最后将label放于这一行的第一个字节,从而组成一个样本的数据。
3.根据权利要求1所述的基于卷积神经网络的日常生活物体图像识别方法,其特征在于,所述神经元均是修正线性单元(ReLU);为了防止过拟合,对两个全连接层使用weightdecay。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610528629.2A CN106228177A (zh) | 2016-06-30 | 2016-06-30 | 基于卷积神经网络的日常生活物体图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610528629.2A CN106228177A (zh) | 2016-06-30 | 2016-06-30 | 基于卷积神经网络的日常生活物体图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106228177A true CN106228177A (zh) | 2016-12-14 |
Family
ID=57520169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610528629.2A Pending CN106228177A (zh) | 2016-06-30 | 2016-06-30 | 基于卷积神经网络的日常生活物体图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106228177A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092926A (zh) * | 2017-03-30 | 2017-08-25 | 哈尔滨工程大学 | 基于深度学习的服务机器人物体识别算法 |
CN107092883A (zh) * | 2017-04-20 | 2017-08-25 | 上海极链网络科技有限公司 | 物体识别追踪方法 |
CN107133578A (zh) * | 2017-04-19 | 2017-09-05 | 华南理工大学 | 一种基于文件传输的人脸表情识别方法及系统 |
CN107369291A (zh) * | 2017-07-13 | 2017-11-21 | 南京理工大学 | 基于深度学习的高压线路防外力破坏预警系统及方法 |
CN107463899A (zh) * | 2017-08-03 | 2017-12-12 | 北京金风科创风电设备有限公司 | 识别风力发电机部件的边缘的方法及装置 |
CN107480660A (zh) * | 2017-09-30 | 2017-12-15 | 深圳市锐曼智能装备有限公司 | 危险物品识别系统及其方法 |
CN107491733A (zh) * | 2017-07-19 | 2017-12-19 | 南京农业大学 | 一种基于深度神经网络的菊花识别方法 |
CN107590799A (zh) * | 2017-08-25 | 2018-01-16 | 山东师范大学 | 基于深度卷积神经网络的香蕉成熟期识别方法和装置 |
CN107609585A (zh) * | 2017-09-08 | 2018-01-19 | 湖南友哲科技有限公司 | 一种基于卷积神经网络的体液细胞显微图像识别方法 |
CN107886128A (zh) * | 2017-11-10 | 2018-04-06 | 广东工业大学 | 一种羽毛球识别方法、系统、介质及设备 |
CN107945353A (zh) * | 2017-11-14 | 2018-04-20 | 中国矿业大学 | 一种基于深度学习的自助导游系统 |
CN108062170A (zh) * | 2017-12-15 | 2018-05-22 | 南京师范大学 | 基于卷积神经网络和智能终端的多类别人体姿态识别方法 |
CN108256575A (zh) * | 2018-01-17 | 2018-07-06 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 图像识别方法、装置、计算机设备和存储介质 |
CN108596256A (zh) * | 2018-04-26 | 2018-09-28 | 北京航空航天大学青岛研究院 | 一种基于rgb-d物体识别分类器构造方法 |
CN108921218A (zh) * | 2018-06-29 | 2018-11-30 | 炬大科技有限公司 | 一种目标物体检测方法及装置 |
CN109086773A (zh) * | 2018-08-29 | 2018-12-25 | 电子科技大学 | 基于全卷积神经网络的断层面识别方法 |
CN109387521A (zh) * | 2017-08-04 | 2019-02-26 | 欧姆龙株式会社 | 图像处理系统 |
CN109452914A (zh) * | 2018-11-01 | 2019-03-12 | 北京石头世纪科技有限公司 | 智能清洁设备,清洁模式选择方法,计算机存储介质 |
CN109466725A (zh) * | 2018-10-11 | 2019-03-15 | 重庆邮电大学 | 一种基于神经网络和图像识别的智能水面漂浮物打捞系统 |
CN109492618A (zh) * | 2018-12-06 | 2019-03-19 | 复旦大学 | 基于分组扩张卷积神经网络模型的目标检测方法及装置 |
CN109543744A (zh) * | 2018-11-19 | 2019-03-29 | 南京邮电大学 | 一种基于龙芯派的多类别深度学习图像识别方法及其应用 |
CN109740965A (zh) * | 2019-01-22 | 2019-05-10 | 北京市天元网络技术股份有限公司 | 一种工程验证分析方法及装置 |
CN110945537A (zh) * | 2017-07-28 | 2020-03-31 | 索尼互动娱乐股份有限公司 | 训练装置、识别装置、训练方法、识别方法和程序 |
CN112329779A (zh) * | 2020-11-02 | 2021-02-05 | 平安科技(深圳)有限公司 | 一种基于mask提高证件识别准确率的方法和相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
CN105224942A (zh) * | 2015-07-09 | 2016-01-06 | 华南农业大学 | 一种rgb-d图像分类方法及系统 |
CN105512676A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 一种智能终端上的食物识别方法 |
CN105654103A (zh) * | 2014-11-12 | 2016-06-08 | 联想(北京)有限公司 | 一种图像识别方法及电子设备 |
-
2016
- 2016-06-30 CN CN201610528629.2A patent/CN106228177A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
CN105654103A (zh) * | 2014-11-12 | 2016-06-08 | 联想(北京)有限公司 | 一种图像识别方法及电子设备 |
CN105224942A (zh) * | 2015-07-09 | 2016-01-06 | 华南农业大学 | 一种rgb-d图像分类方法及系统 |
CN105512676A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 一种智能终端上的食物识别方法 |
Non-Patent Citations (3)
Title |
---|
EDER SANTANA ET AL.: "Learning joint features for color and depth images with Convolutional Neural Networks for object classification", 《ICASSP 2015》 * |
卢良锋 等: "基于RGB特征与深度特征融合的物体识别算法", 《计算机工程》 * |
卢良锋 等: "基于深度学习的RGB-D物体识别算法", 《设计与实现》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092926A (zh) * | 2017-03-30 | 2017-08-25 | 哈尔滨工程大学 | 基于深度学习的服务机器人物体识别算法 |
CN107133578A (zh) * | 2017-04-19 | 2017-09-05 | 华南理工大学 | 一种基于文件传输的人脸表情识别方法及系统 |
CN107133578B (zh) * | 2017-04-19 | 2020-05-22 | 华南理工大学 | 一种基于文件传输的人脸表情识别方法及系统 |
CN107092883A (zh) * | 2017-04-20 | 2017-08-25 | 上海极链网络科技有限公司 | 物体识别追踪方法 |
CN107369291A (zh) * | 2017-07-13 | 2017-11-21 | 南京理工大学 | 基于深度学习的高压线路防外力破坏预警系统及方法 |
CN107491733A (zh) * | 2017-07-19 | 2017-12-19 | 南京农业大学 | 一种基于深度神经网络的菊花识别方法 |
CN110945537A (zh) * | 2017-07-28 | 2020-03-31 | 索尼互动娱乐股份有限公司 | 训练装置、识别装置、训练方法、识别方法和程序 |
CN110945537B (zh) * | 2017-07-28 | 2023-09-22 | 索尼互动娱乐股份有限公司 | 训练装置、识别装置、训练方法、识别方法和程序 |
US11681910B2 (en) | 2017-07-28 | 2023-06-20 | Sony Interactive Entertainment Inc. | Training apparatus, recognition apparatus, training method, recognition method, and program |
CN107463899A (zh) * | 2017-08-03 | 2017-12-12 | 北京金风科创风电设备有限公司 | 识别风力发电机部件的边缘的方法及装置 |
US10885620B2 (en) | 2017-08-04 | 2021-01-05 | Omron Corporation | Neural network image processing system |
CN109387521A (zh) * | 2017-08-04 | 2019-02-26 | 欧姆龙株式会社 | 图像处理系统 |
CN107590799A (zh) * | 2017-08-25 | 2018-01-16 | 山东师范大学 | 基于深度卷积神经网络的香蕉成熟期识别方法和装置 |
CN107609585A (zh) * | 2017-09-08 | 2018-01-19 | 湖南友哲科技有限公司 | 一种基于卷积神经网络的体液细胞显微图像识别方法 |
CN107480660A (zh) * | 2017-09-30 | 2017-12-15 | 深圳市锐曼智能装备有限公司 | 危险物品识别系统及其方法 |
CN107886128A (zh) * | 2017-11-10 | 2018-04-06 | 广东工业大学 | 一种羽毛球识别方法、系统、介质及设备 |
CN107945353B (zh) * | 2017-11-14 | 2021-01-26 | 中国矿业大学 | 一种基于深度学习的自助导游系统 |
CN107945353A (zh) * | 2017-11-14 | 2018-04-20 | 中国矿业大学 | 一种基于深度学习的自助导游系统 |
CN108062170A (zh) * | 2017-12-15 | 2018-05-22 | 南京师范大学 | 基于卷积神经网络和智能终端的多类别人体姿态识别方法 |
CN108256575A (zh) * | 2018-01-17 | 2018-07-06 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 图像识别方法、装置、计算机设备和存储介质 |
CN108596256A (zh) * | 2018-04-26 | 2018-09-28 | 北京航空航天大学青岛研究院 | 一种基于rgb-d物体识别分类器构造方法 |
CN108596256B (zh) * | 2018-04-26 | 2022-04-01 | 北京航空航天大学青岛研究院 | 一种基于rgb-d物体识别分类器构造方法 |
CN108921218A (zh) * | 2018-06-29 | 2018-11-30 | 炬大科技有限公司 | 一种目标物体检测方法及装置 |
CN109086773A (zh) * | 2018-08-29 | 2018-12-25 | 电子科技大学 | 基于全卷积神经网络的断层面识别方法 |
CN109086773B (zh) * | 2018-08-29 | 2022-03-04 | 电子科技大学 | 基于全卷积神经网络的断层面识别方法 |
CN109466725A (zh) * | 2018-10-11 | 2019-03-15 | 重庆邮电大学 | 一种基于神经网络和图像识别的智能水面漂浮物打捞系统 |
CN109452914A (zh) * | 2018-11-01 | 2019-03-12 | 北京石头世纪科技有限公司 | 智能清洁设备,清洁模式选择方法,计算机存储介质 |
CN109543744A (zh) * | 2018-11-19 | 2019-03-29 | 南京邮电大学 | 一种基于龙芯派的多类别深度学习图像识别方法及其应用 |
CN109543744B (zh) * | 2018-11-19 | 2022-10-14 | 南京邮电大学 | 一种基于龙芯派的多类别深度学习图像识别方法及其应用 |
CN109492618A (zh) * | 2018-12-06 | 2019-03-19 | 复旦大学 | 基于分组扩张卷积神经网络模型的目标检测方法及装置 |
CN109740965A (zh) * | 2019-01-22 | 2019-05-10 | 北京市天元网络技术股份有限公司 | 一种工程验证分析方法及装置 |
CN112329779A (zh) * | 2020-11-02 | 2021-02-05 | 平安科技(深圳)有限公司 | 一种基于mask提高证件识别准确率的方法和相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106228177A (zh) | 基于卷积神经网络的日常生活物体图像识别方法 | |
Mascarenhas et al. | A comparison between VGG16, VGG19 and ResNet50 architecture frameworks for Image Classification | |
CN108154194B (zh) | 一种用基于张量的卷积网络提取高维特征的方法 | |
CN108171701B (zh) | 基于u网络和对抗学习的显著性检测方法 | |
CN104462494B (zh) | 一种基于无监督特征学习的遥感图像检索方法及系统 | |
CN108052881A (zh) | 一种实时检测施工现场图像中多类实体对象的方法及设备 | |
CN110929665B (zh) | 一种自然场景曲线文本检测方法 | |
CN111476249B (zh) | 多尺度大感受野卷积神经网络的构建方法 | |
CN108287904A (zh) | 一种基于社会化卷积矩阵分解的文档上下文感知推荐方法 | |
CN107871306B (zh) | 一种图片去噪的方法和装置 | |
Carlucci et al. | $^ 2$ CO: Deep depth colorization | |
CN108108751A (zh) | 一种基于卷积多特征和深度随机森林的场景识别方法 | |
CN103745201B (zh) | 一种节目识别方法及装置 | |
CN109740539B (zh) | 基于超限学习机和融合卷积网络的3d物体识别方法 | |
CN107239532B (zh) | 数据挖掘方法及装置 | |
CN112329771B (zh) | 一种基于深度学习的建筑材料样本识别方法 | |
Ji et al. | ColorFormer: Image colorization via color memory assisted hybrid-attention transformer | |
CN107463932A (zh) | 一种使用二进制瓶颈神经网络来抽取图片特征的方法 | |
CN116052016A (zh) | 基于深度学习的遥感图像云和云影的精细分割检测方法 | |
CN105550712A (zh) | 基于优化卷积自动编码网络的极光图像分类方法 | |
CN111160378A (zh) | 基于单张图像的多任务增强的深度估计系统 | |
Seo et al. | One-to-one example-based automatic image coloring using deep convolutional generative adversarial network | |
CN106355210A (zh) | 基于深度神经元响应模式的绝缘子红外图像特征表达方法 | |
Salem et al. | Semantic image inpainting using self-learning encoder-decoder and adversarial loss | |
CN116403063A (zh) | 基于多区域特征融合的无参考屏幕内容图像质量评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161214 |
|
RJ01 | Rejection of invention patent application after publication |