CN107578060A - 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 - Google Patents
一种基于可判别区域的深度神经网络用于菜品图像分类的方法 Download PDFInfo
- Publication number
- CN107578060A CN107578060A CN201710692917.6A CN201710692917A CN107578060A CN 107578060 A CN107578060 A CN 107578060A CN 201710692917 A CN201710692917 A CN 201710692917A CN 107578060 A CN107578060 A CN 107578060A
- Authority
- CN
- China
- Prior art keywords
- module
- pond
- layer
- image
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
该发明公开了一种基于可判别区域的深度神经网络用于菜品图像分类的方法,涉及图像处理领域。融合了显著谱池化操作,同时对底层特征、高层特征在网络中加以融合。采用了卷积核填充操作,有效保留特征谱上的重要信息的同时,匹配全连接层的数据维度,使其在训练阶段能够利用VGG‑16的预训练模型,提高训练效率和网络收敛速度。基于我们构建的数据库学习到的模型,对每一幅待分类图像进行归一化处理,利用训练好的卷积神经网络对该图像进行测试,采用Softmax损失衡量分类精度,得到该图像的分类结果,对比所有测试图像中目标的真实类别和预测类别,计算得到分类准确率。本发明提出的方法在自建的数据集CFOOD90上进行测试,验证了方法的有效性和实时性。
Description
技术领域
本发明涉及图像处理领域,特别是用于菜品图像分类的卷积神经网络的新型应用方法。
背景技术
近年来,健康饮食伴随着健身热潮成为社会焦点话题,准确地对菜品图像进行分类是智能健康饮食管理中的重要一环。尽管营养学专家可以针对健身人士、病患给出一些专业的饮食分析和咨询建议,指导他们管理卡路里和营养摄入,但其高昂的费用和时间成本限制了向大众的普及和发展。因此,迫切需要一种能直接对智能手机、平板电脑等移动设备拍摄的食物照片进行自动识别,进而对食物进行分类和管理个人饮食的方法。
基于深度卷神经网络的算法在图像分类上取得了突破性的成就,例如基于VggNet、GoogleNet、残差等深度卷积网络模型实现的图像分类都取得了不错的效果。深度卷积神经网络也被运用于菜品图像分类。一般基于深度网络的图像分类都是对整幅输入图像直接进行特征提取和分类,不仅浪费计算资源,而且增加卷积神经网络的训练时间,降低分类效率。根据菜品图像通常都居于图像中央这一特征,本发明提出基于可判别区域,结合深度卷积神经网络用于菜品图像分类。基于深度网络的可判别区域提取方法近年来取得了不错的效果,但在实时性上却不如传统方法。为了减少计算量提高运算效率,我们采用传统的基于最小障碍物距离的显著目标检测方法得到所有菜品图像的显著谱,对所得到的显著谱加权平均后进行归一化,得到一个模板,将这个模板作为提取可判别区域的参考。
中餐菜品类别丰富,食材千变万化,类间相似性高,类内差异性大,同时与目标检测不同的是,由于菜品缺少特定的空间特征以及结构信息可以作为辅助,因此,菜品分类具有很大难度。直观上看,菜品通常位于图片中央,本发明考虑提取图片的可判别区域来辅助完成菜品图像分类。通过去除与菜品无关的盘子和环境特征,将注意力集中在菜品的特征上,可以有效去除冗余信息,帮助分类具有较高类间相似性的菜品图像。
卷积神经网络是深度学习的核心,一个性能良好的卷积神经网络能在分割和其他计算机视觉任务中有非常突出的表现。低层的卷积神经网络可以提取颜色特征、边缘特征、纹理特征,高层卷积神经网络可以提取语义和上下文信息。为了提取更完备的特征,本发明采用多尺度特征融合的方式对网络进行改进,通过不同层的级联,可以提取一组完备的特征,帮助提高分类效果。同时在输入图像上也采用多尺度的方法,最终形成一组包含了多尺度输入和多尺度特征谱融合的多尺度策略。
神经网络中有数以百万计的参数,为了解决过拟合问题,先用一个大型的数据库来预训练一个模型,然后采用一个小规模的数据集在此模型上微调之外,同时采用dropout的方法,随机地让一些隐藏层节点在训练期间不工作,避免过拟合。
发明内容
本发明解决的技术问题包括:现有公开的中餐菜品图像训练数据库数量不充足的问题,现有技术中因网络参数过多而训练样本太少所产生的过拟合问题,从而准确对菜品图像进行分类。
本发明技术方案为一种基于可判别区域的深度神经网络用于菜品图像分类的方法,该方法包括:
步骤1:获取充足的训练中餐菜品图像数据,对获取的训练图像进行人工标注类别,将每一幅训练样本进行图像处理,获得额外的训练样本,对所有的训练样本进行归一化处理;
步骤2:建立一个特征提取网络,根据该特征提取网络提取出各训练样本的低层纹理特征、边缘特征和高层特征,并进行特征融合;
步骤3:将步骤2提取的融合特征输入Softmax分类器,对图像类别进行分类;
其特征在于,所述步骤2的特征提取网络包括2个输入模块,1个显著谱池化模块,第一至第五卷积模块,第一至第五池化模块,1个低层特征提取模块,1个高层特征提取模块,第一至第二特征融合模块,3个全连接层模块;所述括2个输入模块分别为待分类图像和预处理好的图像平均显著谱的模版,这2个输入模块的输出作为显著谱池化模块的输入;第一卷积模块、第一池化模,第二卷积模块、第二池化模块,第三卷积模块、第三池化模块依次级联;额外的,在第二池化模块后级联低层特征提取网络,低层特征提取网络的输出与第三池化模块的输出共同输入第一特征融合模块;第一特征融合模块后级联第四卷积模块、第四池化模块,第五卷积模块、第五池化模块;第四池化模块后同时级联高层特征提取网络,高层特征提取网络的输出与第五池化模块的输出共同输入第二特征融合模块;随后级联第一至第三全连接层模块,最后从第三全连接层模块输出。
进一步的,所述底层特征提取网络和层特征提取网络都包括:依次级联的一个卷积层、一个池化层、一个尺度层。
进一步的,第一卷积模块包含两个卷积层,顺次级联并且其参数设置一致,大小为3*3,步长为1,扩充为1;第一池化模块池化核大小为2*2,步长为2;第二卷积模块包含2个卷积层,顺次级联并且其参数设置一致,大小为3*3,步长为1,扩充为1;第二池化模块池化核大小为2*2,步长为2;所述第一、二卷积模块位于整个特征提取网络的前端,用于提取底层的边缘特征,选用较小的卷积核能够在更好地提取图像中的细节特征的同时,显著减少网络的参数,加快运行速度。第三卷积模块包含3个卷积层,顺次级联并且其参数设置一致,大小为3*3,步长为1,扩充为1;底层特征提取网络接收第二卷积模块的输出,包含一个卷积层、一个池化层、一个尺度层,其卷积层的卷积核大小为3*3,扩充为1,池化层的池化核大小为2*2,步长为2,尺度层的尺度比例为0.01;意为底层特征提取模块的输出按0.01的比例和原特征进行融合;第一特征融合模块对底层特征提取网络和第三卷积模块的输出进行融合,第三池化模块接收第一特征融合模块的输出,其池化核大小为为2*2,步长为2;第四卷积模块包含3个卷积层,顺次级联,各卷积层的卷积核大小均为3*3,步长均为1,扩充为1,其中的第三个卷积层采用卷积核填充,其填充大小为2;第四池化模块池化核大小为2*2,步长为2;第五卷积模块包含3个卷积层,顺次级联,各卷积层的卷积核大小均为3*3,步长均为1,扩充为1,卷积核填充大小为2;高层特征提取网络接收第四卷积模块的输出,包含一个卷积层、一个池化层、一个尺度层,卷积层的卷积核大小为3*3,扩充为5,池化层的池化核大小为3*3,步径为3,尺度层的尺度比例为0.0001;意为底层特征提取模块的输出按0.0001的比例和原特征进行融合。第二特征融合模块对高层特征提取模块和第五卷积模块的输出进行融合,第五池化模块池化核大小为为3*3,步长为3。
该网络的2个输入模块分别为待分类图像和预处理好的图像平均显著谱的模版图片,共同输入显著谱池化模块提取待分类图像的显著信息。这样做的目的是去除冗余信息,同时简化计算量,提高训练效率。
除了在特征谱上进行底层特征、高层特征的融合,本文还利用了多尺度输入图像信息进一步提升分类精度。VGG-16默认的输入图像尺寸为224×224,我们将输入图片的尺寸调整到448×448,以提高分类性能。输入维度的扩大意味着后续卷积层输出特征谱维度的扩大,例如VGG-16第五卷积模块第三个卷积层的默认输出维度是7×7,现在变成14×14。在卷积神经网络中,全连接层包含了大量的可学习参数,在预训练模型中占据30%-80%的比重,为了能利用这些参数,必须保证全连接层输入数据的维度和预训练模型的数据维度一致,即第13层的输出和预训练模型中的7×7一致。当在网络中进行卷积计算时,输入维度I,输出维度O,卷积核尺度Ki,卷积层填充参数P,卷积核步进参数S的关系如公式(1)所示:
O=(I+P*2-Ki)/S+1 (1)
可以看出,通过扩大卷积核尺度Ki,可以对输出特征谱进行降维。因此,我们采用了卷积核“添0”填充的方式对特征谱进行降维。卷积核尺度Ki,填充参数D,填充后的卷积核尺度Ko的关系如公示(2)所示:
Ko=D*(Ki-1)+1 (2)
例如,式(2)中Ki=3,D=2,则填充后的Ko=5,相比于原来3×3的卷积核,只需要在第一行、第二行、第一列、第二列之后添0即可完成填充操作。该层卷积核扩大,则输出特征谱会进行相应的降维。本文中在第四卷积模块的第三个卷积层、第五卷积模块的三个卷积层中运用了卷积核填充操作,填充大小均为2。
本发明提出一种VGG-16的特征提取网络,融合了显著谱池化操作,同时对底层特征、高层特征在网络中加以融合。采用了卷积核填充操作,有效保留特征谱上的重要信息的同时,匹配全连接层的数据维度,使其在训练阶段能够利用VGG-16的预训练模型,提高训练效率和网络收敛速度。基于我们构建的数据库学习到的模型,对每一幅待分类图像进行归一化处理,利用训练好的卷积神经网络对该图像进行测试,采用Softmax损失衡量分类精度,得到该图像的分类结果,对比所有测试图像中目标的真实类别和预测类别,计算得到分类准确率。本发明提出的方法在自建的数据集CFOOD90上进行测试,验证了方法的有效性和实时性。
附图说明
图1为获得的训练中餐菜品图像数据示意图;
图2为本发明网络结构图;
图3为卷积核填充示意图。
具体实施方式
本发明主要可以分为基于可判别区域的深度神经网络用于菜品图像分类的学习和测试两个部分,全部工作可以分为以下5个步骤:
步骤一、构建数据库:首先针对提出的问题,我们建立了一个包含红烧肉、排骨萝卜汤、回锅肉、炒土豆丝、番茄炒蛋、肉沫茄子、炒西蓝花等共计90类常见热门菜品的图片数据库,每类1500张,这些图像的样本都源自菜谱网站。我们随机选取其中的1200张作为训练样本,剩下300作为测试样本。所有的图像大小都归一化。由于网络参数较多而样本较少,为了避免过拟合,在训练时随机地从图像中裁剪的图像用以网络训练,以增加样本数。
步骤二、对训练图像的菜品分类:对数据库中的每一幅图像构建图像级标签,类别标签为0~89。
步骤三、预训练VGG-16模型:因为神经网络中包含大量参数,而我们数据库中的样本数偏少,用此数据库直接进行训练容易发生过拟合现象,故我们在ImageNet这一较大的数据库上预训练我们的模型。
步骤四、学习基于可判别区域的深度神经网络模型。此时将归一化的平均显著谱模板加到输入图片上,提取图片的显著信息,去除冗余信息,得到一个基准模型。
步骤五、学习多尺度的VGG-16模型。在步骤四的基础上,我们继续学习神经网络模型,进一步提高分裂精度。该过程可以分为以下几个关键步骤:
1.将步骤一中构建的人员图像库中的全部训练图像的大小进行归一化为448×448;
2.将多尺度的特征谱在网络中进行级联;
3.得到最终的神经网络模型。在该过程中,设定初始学习率为0.0001。
步骤六、用学习好的模型作测试:该步中,我们同样将测试图像的大小归一化,再输入到已经学习好的模型中,得到了测试图像中目标的类别。
在我们建立的数据库CFFOD90上,我们进行了大量的测试,对汤圆、皮蛋瘦肉粥、炒菜心、银耳汤、蒸螃蟹、玉米排骨汤、麻婆豆腐、泡椒鸡爪等一共90类常见中餐菜品达到了很高的平均识别精度。部分测试结果如图1所示;
在CFOOD90数据集上进行测试,对比AlexNet、VGG-16、Multi-Scale和本文方法的Top1、Top5分类精度,得到如下表所示的结果:
AlexNet | VGG-16 | Multi-Scale | 本文方法 | |
Top1 | 67.629% | 88.5966% | 89.586% | 91.1816 |
Top5 | 89.663% | 97.7851% | 98.1513% | 98.3443 |
对比结果表明,本文提出的方法能够明显提高分类精度。
Claims (3)
1.一种基于可判别区域的深度神经网络用于菜品图像分类的方法,该方法包括:
步骤1:获取充足的训练中餐菜品图像数据,对获取的训练图像进行人工标注类别,将每一幅训练样本进行图像处理,获得额外的训练样本,对所有的训练样本进行归一化处理;
步骤2:建立一个特征提取网络,根据该特征提取网络提取出各训练样本的低层纹理特征、边缘特征和高层特征,并进行特征融合;
步骤3:将步骤2提取的融合特征输入Softmax分类器,对图像类别进行分类;
其特征在于,所述步骤2的特征提取网络包括2个输入模块,1个显著谱池化模块,第一至第五卷积模块,第一至第五池化模块,1个低层特征提取模块,1个高层特征提取模块,第一至第二特征融合模块,3个全连接层模块;所述括2个输入模块分别为待分类图像和预处理好的图像平均显著谱的模版,这2个输入模块的输出作为显著谱池化模块的输入;第一卷积模块、第一池化模,第二卷积模块、第二池化模块,第三卷积模块、第三池化模块依次级联;额外的,在第二池化模块后级联低层特征提取网络,低层特征提取网络的输出与第三池化模块的输出共同输入第一特征融合模块;第一特征融合模块后级联第四卷积模块、第四池化模块,第五卷积模块、第五池化模块;第四池化模块后同时级联高层特征提取网络,高层特征提取网络的输出与第五池化模块的输出共同输入第二特征融合模块;随后级联第一至第三全连接层模块,最后从第三全连接层模块输出。
2.如权利要求1所述的一种基于可判别区域的深度神经网络用于菜品图像分类的方法,其特征在于所述底层特征提取网络和层特征提取网络都包括:依次级联的一个卷积层、一个池化层、一个尺度层。
3.如权利要求2所述的一种基于可判别区域的深度神经网络用于菜品图像分类的方法,其特征在于第一卷积模块包含两个卷积层,顺次级联并且其参数设置一致,大小为3*3,步长为1,扩充为1;第一池化模块池化核大小为2*2,步长为2;第二卷积模块包含2个卷积层,顺次级联并且其参数设置一致,大小为3*3,步长为1,扩充为1;第二池化模块池化核大小为2*2,步长为2;第三卷积模块包含3个卷积层,顺次级联并且其参数设置一致,大小为3*3,步长为1,扩充为1;底层特征提取网络接收第二卷积模块的输出,包含一个卷积层、一个池化层、一个尺度层,其卷积层的卷积核大小为3*3,扩充为1,池化层的池化核大小为2*2,步长为2,尺度层的尺度比例为0.01;第一特征融合模块对底层特征提取网络和第三卷积模块的输出进行融合,第三池化模块接收第一特征融合模块的输出,其池化核大小为为2*2,步长为2;第四卷积模块包含3个卷积层,顺次级联,各卷积层的卷积核大小均为3*3,步长均为1,扩充为1,其中的第三个卷积层采用卷积核填充,其填充大小为2;第四池化模块池化核大小为2*2,步长为2;第五卷积模块包含3个卷积层,顺次级联,各卷积层的卷积核大小均为3*3,步长均为1,扩充为1,卷积核填充大小为2;高层特征提取网络接收第四卷积模块的输出,包含一个卷积层、一个池化层、一个尺度层,卷积层的卷积核大小为3*3,扩充为5,池化层的池化核大小为3*3,步径为3,尺度层的尺度比例为0.0001;第二特征融合模块对高层特征提取模块和第五卷积模块的输出进行融合,第五池化模块池化核大小为为3*3,步长为3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710692917.6A CN107578060B (zh) | 2017-08-14 | 2017-08-14 | 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710692917.6A CN107578060B (zh) | 2017-08-14 | 2017-08-14 | 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107578060A true CN107578060A (zh) | 2018-01-12 |
CN107578060B CN107578060B (zh) | 2020-12-29 |
Family
ID=61034598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710692917.6A Active CN107578060B (zh) | 2017-08-14 | 2017-08-14 | 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107578060B (zh) |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256571A (zh) * | 2018-01-16 | 2018-07-06 | 佛山市顺德区中山大学研究院 | 一种基于卷积神经网络的中餐食物识别方法 |
CN108320786A (zh) * | 2018-02-06 | 2018-07-24 | 华南理工大学 | 一种基于深度神经网络的中餐菜品推荐方法 |
CN108416370A (zh) * | 2018-02-07 | 2018-08-17 | 深圳大学 | 基于半监督深度学习的图像分类方法、装置和存储介质 |
CN108416327A (zh) * | 2018-03-28 | 2018-08-17 | 京东方科技集团股份有限公司 | 一种目标检测方法、装置、计算机设备及可读存储介质 |
CN108460772A (zh) * | 2018-02-13 | 2018-08-28 | 国家计算机网络与信息安全管理中心 | 基于卷积神经网络的广告骚扰传真图像检测系统及方法 |
CN108491856A (zh) * | 2018-02-08 | 2018-09-04 | 西安电子科技大学 | 一种基于多尺度特征卷积神经网络的图像场景分类方法 |
CN108596256A (zh) * | 2018-04-26 | 2018-09-28 | 北京航空航天大学青岛研究院 | 一种基于rgb-d物体识别分类器构造方法 |
CN108647734A (zh) * | 2018-05-15 | 2018-10-12 | 上海达显智能科技有限公司 | 一种食物图像大数据采集方法、采集系统及食物识别方法 |
CN108985317A (zh) * | 2018-05-25 | 2018-12-11 | 西安电子科技大学 | 一种基于可分离卷积和注意力机制的图像分类方法 |
CN109190476A (zh) * | 2018-08-02 | 2019-01-11 | 福建工程学院 | 一种蔬菜识别的方法及装置 |
CN109447976A (zh) * | 2018-11-01 | 2019-03-08 | 电子科技大学 | 一种基于人工智能的医学图像分割方法及系统 |
CN110047069A (zh) * | 2019-04-22 | 2019-07-23 | 北京青燕祥云科技有限公司 | 一种图像检测装置 |
CN110188708A (zh) * | 2019-06-03 | 2019-08-30 | 西安工业大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN110389952A (zh) * | 2019-06-06 | 2019-10-29 | 口碑(上海)信息技术有限公司 | 一种菜品数据的处理方法及装置 |
GB2573363A (en) * | 2018-02-07 | 2019-11-06 | Winnow Solutions Ltd | A method and system for classifying food items |
CN110533041A (zh) * | 2019-09-05 | 2019-12-03 | 重庆邮电大学 | 基于回归的多尺度场景文本检测方法 |
CN110610184A (zh) * | 2018-06-15 | 2019-12-24 | 阿里巴巴集团控股有限公司 | 图像的显著目标的检测方法、装置及设备 |
CN110619358A (zh) * | 2019-08-30 | 2019-12-27 | 电子科技大学 | 基于多组k分类的卷积特征谱的图像可判别区域联合提取方法 |
CN110648332A (zh) * | 2019-09-12 | 2020-01-03 | 电子科技大学 | 基于多分支卷积神经网络特征正交的图像可判别区域提取方法 |
CN110674845A (zh) * | 2019-08-28 | 2020-01-10 | 电子科技大学 | 一种结合多感受野注意与特征再校准的菜品识别方法 |
CN110956201A (zh) * | 2019-11-07 | 2020-04-03 | 江南大学 | 一种基于卷积神经网络的图像失真类型分类方法 |
CN111046920A (zh) * | 2019-11-22 | 2020-04-21 | 中国科学院计算技术研究所 | 一种训练食品图像分类模型的方法及图像分类方法 |
CN111524106A (zh) * | 2020-04-13 | 2020-08-11 | 北京推想科技有限公司 | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 |
CN112183669A (zh) * | 2020-11-04 | 2021-01-05 | 北京航天泰坦科技股份有限公司 | 图像分类方法和装置、设备及存储介质 |
CN112232343A (zh) * | 2020-09-03 | 2021-01-15 | 国家粮食和物资储备局科学研究院 | 一种粮食霉变粒识别神经网络和识别方法 |
CN112660655A (zh) * | 2020-12-10 | 2021-04-16 | 成都工业学院 | 一种基于深度学习的智能分类垃圾桶 |
CN112699822A (zh) * | 2021-01-05 | 2021-04-23 | 浪潮云信息技术股份公司 | 一种基于深度卷积神经网络的餐厅菜品识别方法 |
CN113033706A (zh) * | 2021-04-23 | 2021-06-25 | 广西师范大学 | 基于视觉目标检测和重识别的多源两阶段菜品识别方法 |
CN113139587A (zh) * | 2021-03-31 | 2021-07-20 | 杭州电子科技大学 | 一种自适应交互结构学习的双二次池化模型 |
CN113435389A (zh) * | 2021-07-09 | 2021-09-24 | 大连海洋大学 | 基于图像特征深度学习的小球藻和金藻分类识别方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930542A (zh) * | 2012-10-31 | 2013-02-13 | 电子科技大学 | 一种基于全局对比度的矢量化显著检测方法 |
EP3029606A2 (en) * | 2014-11-14 | 2016-06-08 | Thomson Licensing | Method and apparatus for image classification with joint feature adaptation and classifier learning |
CN105825235A (zh) * | 2016-03-16 | 2016-08-03 | 博康智能网络科技股份有限公司 | 一种基于多特征图深度学习的图像识别方法 |
CN106529447A (zh) * | 2016-11-03 | 2017-03-22 | 河北工业大学 | 一种小样本人脸识别方法 |
CN106599883A (zh) * | 2017-03-08 | 2017-04-26 | 王华锋 | 一种基于cnn的多层次图像语义的人脸识别方法 |
CN106845527A (zh) * | 2016-12-29 | 2017-06-13 | 南京江南博睿高新技术研究院有限公司 | 一种菜品识别方法 |
CN106845381A (zh) * | 2017-01-16 | 2017-06-13 | 西北工业大学 | 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法 |
-
2017
- 2017-08-14 CN CN201710692917.6A patent/CN107578060B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930542A (zh) * | 2012-10-31 | 2013-02-13 | 电子科技大学 | 一种基于全局对比度的矢量化显著检测方法 |
EP3029606A2 (en) * | 2014-11-14 | 2016-06-08 | Thomson Licensing | Method and apparatus for image classification with joint feature adaptation and classifier learning |
CN105825235A (zh) * | 2016-03-16 | 2016-08-03 | 博康智能网络科技股份有限公司 | 一种基于多特征图深度学习的图像识别方法 |
CN106529447A (zh) * | 2016-11-03 | 2017-03-22 | 河北工业大学 | 一种小样本人脸识别方法 |
CN106845527A (zh) * | 2016-12-29 | 2017-06-13 | 南京江南博睿高新技术研究院有限公司 | 一种菜品识别方法 |
CN106845381A (zh) * | 2017-01-16 | 2017-06-13 | 西北工业大学 | 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法 |
CN106599883A (zh) * | 2017-03-08 | 2017-04-26 | 王华锋 | 一种基于cnn的多层次图像语义的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
原芳: "基于颜色和纹理的图像检索研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
杨钊: "面向图像分类和识别的视觉特征表达与学习的研究", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256571A (zh) * | 2018-01-16 | 2018-07-06 | 佛山市顺德区中山大学研究院 | 一种基于卷积神经网络的中餐食物识别方法 |
CN108320786A (zh) * | 2018-02-06 | 2018-07-24 | 华南理工大学 | 一种基于深度神经网络的中餐菜品推荐方法 |
CN108416370A (zh) * | 2018-02-07 | 2018-08-17 | 深圳大学 | 基于半监督深度学习的图像分类方法、装置和存储介质 |
GB2573363A (en) * | 2018-02-07 | 2019-11-06 | Winnow Solutions Ltd | A method and system for classifying food items |
CN108491856A (zh) * | 2018-02-08 | 2018-09-04 | 西安电子科技大学 | 一种基于多尺度特征卷积神经网络的图像场景分类方法 |
CN108460772A (zh) * | 2018-02-13 | 2018-08-28 | 国家计算机网络与信息安全管理中心 | 基于卷积神经网络的广告骚扰传真图像检测系统及方法 |
CN108416327A (zh) * | 2018-03-28 | 2018-08-17 | 京东方科技集团股份有限公司 | 一种目标检测方法、装置、计算机设备及可读存储介质 |
CN108596256A (zh) * | 2018-04-26 | 2018-09-28 | 北京航空航天大学青岛研究院 | 一种基于rgb-d物体识别分类器构造方法 |
CN108647734B (zh) * | 2018-05-15 | 2022-03-11 | 上海达显智能科技有限公司 | 一种食物图像大数据采集方法、采集系统及食物识别方法 |
CN108647734A (zh) * | 2018-05-15 | 2018-10-12 | 上海达显智能科技有限公司 | 一种食物图像大数据采集方法、采集系统及食物识别方法 |
CN108985317A (zh) * | 2018-05-25 | 2018-12-11 | 西安电子科技大学 | 一种基于可分离卷积和注意力机制的图像分类方法 |
CN108985317B (zh) * | 2018-05-25 | 2022-03-01 | 西安电子科技大学 | 一种基于可分离卷积和注意力机制的图像分类方法 |
CN110610184B (zh) * | 2018-06-15 | 2023-05-12 | 阿里巴巴集团控股有限公司 | 图像的显著目标的检测方法、装置及设备 |
CN110610184A (zh) * | 2018-06-15 | 2019-12-24 | 阿里巴巴集团控股有限公司 | 图像的显著目标的检测方法、装置及设备 |
CN109190476A (zh) * | 2018-08-02 | 2019-01-11 | 福建工程学院 | 一种蔬菜识别的方法及装置 |
CN109447976B (zh) * | 2018-11-01 | 2020-07-07 | 电子科技大学 | 一种基于人工智能的医学图像分割方法及系统 |
CN109447976A (zh) * | 2018-11-01 | 2019-03-08 | 电子科技大学 | 一种基于人工智能的医学图像分割方法及系统 |
CN110047069A (zh) * | 2019-04-22 | 2019-07-23 | 北京青燕祥云科技有限公司 | 一种图像检测装置 |
CN110188708A (zh) * | 2019-06-03 | 2019-08-30 | 西安工业大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN110389952A (zh) * | 2019-06-06 | 2019-10-29 | 口碑(上海)信息技术有限公司 | 一种菜品数据的处理方法及装置 |
CN110674845A (zh) * | 2019-08-28 | 2020-01-10 | 电子科技大学 | 一种结合多感受野注意与特征再校准的菜品识别方法 |
CN110674845B (zh) * | 2019-08-28 | 2022-05-31 | 电子科技大学 | 一种结合多感受野注意与特征再校准的菜品识别方法 |
CN110619358A (zh) * | 2019-08-30 | 2019-12-27 | 电子科技大学 | 基于多组k分类的卷积特征谱的图像可判别区域联合提取方法 |
CN110533041A (zh) * | 2019-09-05 | 2019-12-03 | 重庆邮电大学 | 基于回归的多尺度场景文本检测方法 |
CN110533041B (zh) * | 2019-09-05 | 2022-07-01 | 重庆邮电大学 | 基于回归的多尺度场景文本检测方法 |
CN110648332A (zh) * | 2019-09-12 | 2020-01-03 | 电子科技大学 | 基于多分支卷积神经网络特征正交的图像可判别区域提取方法 |
CN110648332B (zh) * | 2019-09-12 | 2022-03-15 | 电子科技大学 | 基于多分支卷积神经网络特征正交的图像可判别区域提取方法 |
CN110956201A (zh) * | 2019-11-07 | 2020-04-03 | 江南大学 | 一种基于卷积神经网络的图像失真类型分类方法 |
CN110956201B (zh) * | 2019-11-07 | 2023-07-25 | 江南大学 | 一种基于卷积神经网络的图像失真类型分类方法 |
CN111046920A (zh) * | 2019-11-22 | 2020-04-21 | 中国科学院计算技术研究所 | 一种训练食品图像分类模型的方法及图像分类方法 |
CN111524106A (zh) * | 2020-04-13 | 2020-08-11 | 北京推想科技有限公司 | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 |
CN111524106B (zh) * | 2020-04-13 | 2021-05-28 | 推想医疗科技股份有限公司 | 颅骨骨折检测和模型训练方法、装置、设备和存储介质 |
CN112232343B (zh) * | 2020-09-03 | 2023-11-21 | 国家粮食和物资储备局科学研究院 | 一种粮食霉变粒识别神经网络和识别方法 |
CN112232343A (zh) * | 2020-09-03 | 2021-01-15 | 国家粮食和物资储备局科学研究院 | 一种粮食霉变粒识别神经网络和识别方法 |
CN112183669A (zh) * | 2020-11-04 | 2021-01-05 | 北京航天泰坦科技股份有限公司 | 图像分类方法和装置、设备及存储介质 |
CN112183669B (zh) * | 2020-11-04 | 2024-02-13 | 航天科工(北京)空间信息应用股份有限公司 | 图像分类方法和装置、设备及存储介质 |
CN112660655A (zh) * | 2020-12-10 | 2021-04-16 | 成都工业学院 | 一种基于深度学习的智能分类垃圾桶 |
CN112699822A (zh) * | 2021-01-05 | 2021-04-23 | 浪潮云信息技术股份公司 | 一种基于深度卷积神经网络的餐厅菜品识别方法 |
CN112699822B (zh) * | 2021-01-05 | 2023-05-30 | 浪潮云信息技术股份公司 | 一种基于深度卷积神经网络的餐厅菜品识别方法 |
CN113139587A (zh) * | 2021-03-31 | 2021-07-20 | 杭州电子科技大学 | 一种自适应交互结构学习的双二次池化模型 |
CN113139587B (zh) * | 2021-03-31 | 2024-02-06 | 杭州电子科技大学 | 一种自适应交互结构学习的双二次池化模型 |
CN113033706B (zh) * | 2021-04-23 | 2022-04-29 | 广西师范大学 | 基于视觉检测和重识别的多源两阶段菜品识别方法 |
CN113033706A (zh) * | 2021-04-23 | 2021-06-25 | 广西师范大学 | 基于视觉目标检测和重识别的多源两阶段菜品识别方法 |
CN113435389A (zh) * | 2021-07-09 | 2021-09-24 | 大连海洋大学 | 基于图像特征深度学习的小球藻和金藻分类识别方法 |
CN113435389B (zh) * | 2021-07-09 | 2024-03-01 | 大连海洋大学 | 基于图像特征深度学习的小球藻和金藻分类识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107578060B (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107578060A (zh) | 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 | |
Min et al. | Ingredient-guided cascaded multi-attention network for food recognition | |
Chen et al. | A study of multi-task and region-wise deep learning for food ingredient recognition | |
CN109765462A (zh) | 输电线路的故障检测方法、装置和终端设备 | |
CN108694390A (zh) | 一种布谷鸟搜索改进灰狼优化支持向量机的调制信号分类方法 | |
CN105512676A (zh) | 一种智能终端上的食物识别方法 | |
CN108921198A (zh) | 基于深度学习的商品图像分类方法、服务器及系统 | |
CN108320786A (zh) | 一种基于深度神经网络的中餐菜品推荐方法 | |
Aslan et al. | Benchmarking algorithms for food localization and semantic segmentation | |
CN111400536B (zh) | 一种基于轻量化深度神经网络的低成本番茄叶片病害识别方法 | |
CN110033332A (zh) | 一种人脸识别方法、系统及电子设备和存储介质 | |
CN107330750A (zh) | 一种推荐产品配图方法及装置,电子设备 | |
CN109063719A (zh) | 一种联合结构相似性和类信息的图像分类方法 | |
CN110047081A (zh) | 胸部x光图像的实例分割方法、装置、设备及介质 | |
CN109165699A (zh) | 细粒度图像分类方法 | |
CN110110915A (zh) | 一种基于cnn-svr模型的负荷集成预测方法 | |
CN111046920A (zh) | 一种训练食品图像分类模型的方法及图像分类方法 | |
CN111737473A (zh) | 文本分类方法、装置及设备 | |
CN116543282A (zh) | 基于多尺度融合与CBAM-ResNet50的农作物病害分割方法、系统、设备及介质 | |
CN114445268A (zh) | 一种基于深度学习的服装风格迁移方法及系统 | |
CN109815478A (zh) | 基于卷积神经网络的药化实体识别方法及系统 | |
CN103996206A (zh) | 一种基于GraphCut的复杂背景遥感图像中交互式目标提取方法 | |
Chen et al. | Bilinear CNN models for food recognition | |
CN110457706A (zh) | 兴趣点名称选择模型训练方法、使用方法、装置及存储介质 | |
US20230222821A1 (en) | Methods and apparatus for visual-aware hierarchy-based object recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |