CN111274986B - 一种基于图像分析的菜品识别分类方法 - Google Patents

一种基于图像分析的菜品识别分类方法 Download PDF

Info

Publication number
CN111274986B
CN111274986B CN202010083962.3A CN202010083962A CN111274986B CN 111274986 B CN111274986 B CN 111274986B CN 202010083962 A CN202010083962 A CN 202010083962A CN 111274986 B CN111274986 B CN 111274986B
Authority
CN
China
Prior art keywords
dish
boundary
image
probability
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010083962.3A
Other languages
English (en)
Other versions
CN111274986A (zh
Inventor
纪刚
周粉粉
周萌萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Lianhe Chuangzhi Technology Co ltd
Original Assignee
Qingdao Lianhe Chuangzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Lianhe Chuangzhi Technology Co ltd filed Critical Qingdao Lianhe Chuangzhi Technology Co ltd
Priority to CN202010083962.3A priority Critical patent/CN111274986B/zh
Publication of CN111274986A publication Critical patent/CN111274986A/zh
Application granted granted Critical
Publication of CN111274986B publication Critical patent/CN111274986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/68Food, e.g. fruit or vegetables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像分析的菜品识别分类方法,包括如下步骤:(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框;(3)对菜品的分割框进行边界定位;(4)菜品特征识别模型的训练与推断,得到菜品特征图像;(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。本发明所公开的方法能够自动进行识别分类,识别效率高,结果准确,更加智能。

Description

一种基于图像分析的菜品识别分类方法
技术领域
本发明涉及一种菜品识别分类方法,特别涉及一种基于图像分析的菜品识别分类方法。
背景技术
随着人工智能和大数据时代的到来,传统食堂或者自助餐厅中人工结算不可避免的会造成结算错误、排队等候、工作效率低等多种问题,亟待一些先进技术应用在生活中并更好的用于服务行业。而市场上存在的菜品识别大多数采用特定的用餐工具,如圆形或者方形等餐具、或采用专门标记的餐具来区分菜品来达到识别菜品的目的,智能化程度低,且菜品识别的依赖性强,泛性差。
发明内容
为解决上述技术问题,本发明提供了一种基于图像分析的菜品识别分类方法,以达到更加智能、准确、高效地进行菜品识别分类的目的。
为达到上述目的,本发明的技术方案如下:
一种基于图像分析的菜品识别分类方法,包括如下步骤:
(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;
(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框;
(3)对菜品的分割框进行边界定位;
(4)菜品特征识别模型的训练与推断,得到菜品特征图像;
(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。
上述方案中,所述步骤(2)具体如下:
设餐盘中的菜品数量为a,对给定的菜品目标o,用φ(υo)∈R2×d×1×1来表示菜品目标特征集合,其中,υo表示菜品目标的特征,d代表维度,2代表图像的背景和前景;
将整幅图像的像素特征集合表示为ψ(U)∈R1×d×h×w,其中,U表示像素的特征,d代表维度,h和w代表图像ψ(U)的高度和宽度;
将图像中表示前景的像素拉向特征空间中对应表示的某一菜品的类别,实现菜品的分割,相关操作定义如下:
Mo=soft max(Ψ(U)*φ(υo)) (1)
其中,*表示卷积操作,相似映射图Mo∈R2×1×h×w,M0中包含两个通道,分别代表菜品目标o中每个像素的前景概率和背景概率。
上述方案中,所述步骤(3)具体如下:
将检测到的菜品分割框坐标看作一个离散的随机变量,菜品边界位置是边界所在坐标概率的自变量点集argmax,即:
Figure BDA0002381346580000025
其中,X是分割框边界水平坐标的离散随机变量,M′∈Rh×w代表公式(1)中Mo的前景通道概率,i表示边界上的点,P(X=i|M′)表示M′的后验概率;
以左边界的推导为例;
根据贝叶斯定理,可以得到:
Figure BDA0002381346580000021
其中,P(X=i)和P(M′|X=i)分别代表先验概率和似然概率;
假设某一菜品的分割框仅与M′中每一行的最大值有关,仅影响它的邻域像素,似然概率定义为:
Figure BDA0002381346580000022
其中,
Figure BDA0002381346580000023
s是超参数,描述菜品边界对其相邻像素的影响范围,理想情况下,边界上的像素只影响其最近的两个像素,边界框外的像素概率为0,边界内的像素概率为1;
对P(X=i)采用离散高斯分布:
Figure BDA0002381346580000024
其中,α代表归一化系数,μ表示高斯分布的均值,σx表示分布的方差,边界位置的分布与对象分割实例尺寸有关,设置为:
μ=xr,σx=γ·wb,其中,wb表示边界框的宽度,xr表示左边界的横坐标,γ表示回归边界的权重;
将公式(4)和公式(5)代入公式(3)中,得到P(X=i|M′),再将其代入公式(2)得到菜品的左边界,然后用同样的方法得到菜品的其它边界。
上述方案中,所述步骤(4)具体如下:
菜品特征识别模型是通过以下多任务损失函数进行训练的:
L=λrLregmLmask (6)
其中,Lreg采用均方误差MSE作为回归损失函数;
Figure BDA0002381346580000031
其中,s∈{±1},表示像素点是否属于边界内,若像素点在边界框内,s=1;p∈[0,1]表示当s=1时菜品识别的概率;
其中,L表示总的损失函数,Lreg表示对象回归检测器损失函数,Lmask表示像素方向交叉熵损失,与实际标注的边界框相匹配的边界框输入相关操作模块生成菜品对象的实例掩模,从扩展的实际标注的边界框裁剪得到的掩模用来计算Lmask;λr和λm代表损失函数Lreg和Lmask权重的系数;
在推断时,首先根据获得的目标边界框和像素实例掩模,然后经过非极大值抑制处理之后的边界框经公式(1)相关的卷积操作,之后用目标检测器获得的扩展框裁剪实例分割的掩码,为了获得准确的边界框,得到的实例分割掩码上采样得到与输入图像相同的尺寸w×h,然后输入到实例掩码的边界细化模块中,最后采用阈值为0.4大小进行二值化处理,得到菜品特征图像。
上述方案中,所述步骤(5)中,菜品特征分类网络采用神经架构搜索NAS的方法,具体实现方法如下:NASNet架构递归神经网络RNN作为控制器生成神经网络模型。
进一步的技术方案中,控制器RNN从搜索空间S={hidden_layer,select_operate,select_comb}中以概率p预测网络结构A的单元模块,通过学习单元得到准确性奖励R,最终将梯度p*R传递给RNN控制器进行梯度更新,当满足控制器RNN的目标函数J(θc)最大化时,终止学习,可选组合;
J(θc)=Ep(a1:T;θc)[R] (8)
其中,a1:T作为控制器RNN预测出的网络结构A的单元模块,p为a1:T被选中的概率,θc为控制器的权重数组,初始化为0,当RNN收敛时,单元a1:T会获得最终的准确性奖励R。
上述方案中,得到菜品分类网络后,新菜品自添加步骤为:
(a)将采集到的拟添加菜品多张图片添加到菜品库;
(b)根据设定的训练步长,步长不大于5000,调整菜品分类网络参数;
(c)完成菜品分类网络调整后,将添加菜品图像作为网络的输入进行识别测试,经过3~5次多角度测试后,最终得到菜品识别结果即为添加菜品名称,说明添加成功,如果识别不理想,将失败测试图像添加到菜品库中进一步调整网络,完成菜品自添加和识别功能。
通过上述技术方案,本发明提供的基于图像分析的菜品识别分类方法不会受餐具的选择以及菜品所处餐具的位置的影响,一旦菜品的种类确定,本方法直接对菜品图像进行分析,采用智能识别算法提取各个菜品的特征,并与数据库中的菜品种类进行对比,自动进行识别分类,识别效率高,结果准确,更加智能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为Normal layer网络单元结构示意图;
图2为Reduction Cell网络单元结构示意图;
图3为菜品特征分类网络示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提供了一种基于图像分析的菜品识别分类方法,包括如下步骤:
(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;
(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框,具体如下:
设餐盘中的菜品数量为a,对给定的菜品目标o,用φ(υo)∈R2×d×1×1来表示菜品目标特征集合,其中,υo表示菜品目标的特征,d代表维度,2代表图像的背景和前景;
将整幅图像的像素特征集合表示为ψ(U)∈R1×d×h×w,其中,U表示像素的特征,d代表维度,h和w代表图像ψ(U)的高度和宽度;
将图像中表示前景的像素拉向特征空间中对应表示的某一菜品的类别,实现菜品的分割,相关操作定义如下:
Mo=soft max(Ψ(U)*φ(υo)) (1)
其中,*表示卷积操作,相似映射图Mo∈R2×1×h×w,M0中包含两个通道,分别代表菜品目标o中每个像素的前景概率和背景概率。
(3)对菜品的分割框进行边界定位;
将检测到的菜品分割框坐标看作一个离散的随机变量,菜品边界位置是边界所在坐标概率的自变量点集argmax,即:
Figure BDA0002381346580000051
以左边界的推导为例;
根据贝叶斯定理,可以得到:
Figure BDA0002381346580000052
其中,P(X=i)和P(M′|X=i)分别代表先验概率和似然概率;
假设某一菜品的分割框仅与M′中每一行的最大值有关,仅影响它的邻域像素,似然概率定义为:
Figure BDA0002381346580000053
其中,
Figure BDA0002381346580000054
s是超参数,描述菜品边界对其相邻像素的影响范围,理想情况下,边界上的像素只影响其最近的两个像素,边界框外的像素概率为0,边界内的像素概率为1;
对P(X=i)采用离散高斯分布:
Figure BDA0002381346580000055
其中,α代表归一化系数,μ表示高斯分布的均值,σx表示分布的方差,边界位置的分布与对象分割实例尺寸有关,设置为:
μ=xr,σx=γ·wb,其中,wb表示边界框的宽度,xr表示左边界的横坐标,γ表示回归边界的权重;
将公式(4)和公式(5)代入公式(3)中,得到P(X=i|M′),再将其代入公式(2)得到菜品的左边界,然后用同样的方法得到菜品的其它边界。
(4)菜品特征识别模型的训练与推断,得到菜品特征图像;
菜品特征识别模型是通过以下多任务损失函数进行训练的:
L=λrLregmLmask (6)
其中,Lreg采用均方误差MSE作为回归损失函数;
Figure BDA0002381346580000061
其中,s∈{±1},表示像素点是否属于边界内,若像素点在边界框内,s=1;p∈[0,1]表示当s=1时菜品识别的概率;
其中,L表示总的损失函数,Lreg表示对象回归检测器损失函数,Lmask表示像素方向交叉熵损失,与实际标注的边界框相匹配的边界框输入相关操作模块生成菜品对象的实例掩模,从扩展的实际标注的边界框裁剪得到的掩模用来计算Lmask;λr和λm代表损失函数Lreg和Lmask权重的系数;
在推断时,首先根据获得的目标边界框和像素实例掩模,然后经过非极大值抑制处理之后的边界框经公式(1)相关的卷积操作,之后用目标检测器获得的扩展框裁剪实例分割的掩码,为了获得准确的边界框,得到的实例分割掩码上采样得到与输入图像相同的尺寸w×h,然后输入到实例掩码的边界细化模块中,最后采用阈值为0.4大小进行二值化处理,得到菜品特征图像。
(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。
菜品特征分类网络采用神经架构搜索NAS的方法,具体实现方法如下:NASNet架构递归神经网络RNN作为控制器生成神经网络模型。
控制器RNN从搜索空间S={hidden_layer,select_operate,select_comb}中以概率p预测网络结构A的单元模块,通过学习单元得到准确性奖励R,最终将梯度p*R传递给RNN控制器进行梯度更新,当满足控制器RNN的目标函数J(θc)最大化时,终止学习,可选组合;
J(θc)=Ep(a1:T;θc)[R] (8)
其中,a1:T作为控制器RNN预测出的网络结构A的单元模块,p为a1:T被选中的概率,θc为控制器的权重数组,初始化为0,当RNN收敛时,单元a1:T会获得最终的准确性奖励R。
据此,我们可以通过控制器RNN优化组合出两种类型的网络单元模块:即正常层Normal layer和还原层Reduction layer,规定:
Normal layer:输出和输入称为Feature Map且尺寸相同;
Reduction layer:输出和输入称为Feature Map,输出Feature Map对输入Feature Map进行一次降采样,在Reduction Cell中,对使用输入Feature Map作为输入的操作,默认步长为2,两个网络单元模块的示意图如图1和图2所示。
其中,hidden_layer为搜索空间S中的隐含层,add与concat为搜索空间S中的select_comb,其他为S中的select_operate。
最终得到基于网络单元模块的分类网络结构,示意图如图3所示。
上述方案中,得到菜品分类网络后,新菜品自添加步骤为:
(a)将采集到的拟添加菜品多张图片添加到菜品库;
(b)根据设定的训练步长,步长不大于5000,调整菜品分类网络参数;
(c)完成菜品分类网络调整后,将添加菜品图像作为网络的输入进行识别测试,经过3~5次多角度测试后,最终得到菜品识别结果即为添加菜品名称,说明添加成功,如果识别不理想,将失败测试图像添加到菜品库中进一步调整网络,完成菜品自添加和识别功能。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种基于图像分析的菜品识别分类方法,其特征在于,包括如下步骤:
(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;
(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框;
(3)对菜品的分割框进行边界定位;
(4)菜品特征识别模型的训练与推断,得到菜品特征图像;
(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中;
所述步骤(2)具体如下:
设餐盘中的菜品数量为a,对给定的菜品目标o,用φ(υo)∈R2×d×1×1来表示菜品目标特征集合,其中,υo表示菜品目标的特征,d代表维度,2代表图像的背景和前景;
将整幅图像的像素特征集合表示为ψ(U)∈R1×d×h×w,其中,U表示像素的特征,d代表维度,h和w代表图像ψ(U)的高度和宽度;
将图像中表示前景的像素拉向特征空间中对应表示的某一菜品的类别,实现菜品的分割,相关操作定义如下:
Mo=softmax(Ψ(U)*φ(υo)) (1)
其中,*表示卷积操作,相似映射图Mo∈R2×1×h×w,Mo中包含两个通道概率,分别代表菜品目标o中每个像素的前景概率和背景概率;
所述步骤(3)具体如下:
将检测到的菜品分割框坐标看作一个离散的随机变量,菜品边界位置是边界所在坐标概率的自变量点集argmax,即:
Figure FDA0003613536880000011
其中,X是分割框边界水平坐标的离散随机变量,M'∈Rh×w代表公式(1)中Mo的前景通道概率,i表示边界上的点,P(X=i|M')表示M'的后验概率;
以左边界的推导为例;
根据贝叶斯定理,可以得到:
Figure FDA0003613536880000012
其中,P(X=i)和P(M'|X=i)分别代表先验概率和似然概率;
假设某一菜品的分割框仅与M'中每一行的最大值有关,仅影响它的邻域像素,似然概率定义为:
Figure FDA0003613536880000021
其中,
Figure FDA0003613536880000022
s是超参数,描述菜品边界对其相邻像素的影响范围,理想情况下,边界上的像素只影响其最近的两个像素,边界框外的像素概率为0,边界内的像素概率为1;
对P(X=i)采用离散高斯分布:
Figure FDA0003613536880000023
其中,α代表归一化系数,μ表示高斯分布的均值,σx表示分布的方差,边界位置的分布与对象分割实例尺寸有关,设置为:
μ=xr,σx=γ·wb,其中,wb表示边界框的宽度,xr表示左边界的横坐标,γ表示回归边界的权重;
将公式(4)和公式(5)代入公式(3)中,得到P(X=i|M'),再将其代入公式(2)得到菜品的左边界,然后用同样的方法得到菜品的其它边界。
2.根据权利要求1所述的一种基于图像分析的菜品识别分类方法,其特征在于,所述步骤(4)具体如下:
菜品特征识别模型是通过以下多任务损失函数进行训练的:
L=λrLregmLmask (6)
其中,Lreg采用均方误差MSE作为回归损失函数;
Figure FDA0003613536880000024
其中,s∈{±1},表示像素点是否属于边界内,若像素点在边界框内,s=1;p∈[0,1]表示当s=1时菜品识别的概率;
其中,L表示总的损失函数,Lreg表示对象回归检测器损失函数,Lmask表示像素方向交叉熵损失,与实际标注的边界框相匹配的边界框输入相关操作模块生成菜品对象的实例掩模,从扩展的实际标注的边界框裁剪得到的掩模用来计算Lmask;λr和λm代表损失函数Lreg和Lmask权重的系数;
在推断时,首先根据获得的目标边界框和像素实例掩模,然后经过非极大值抑制处理之后的边界框经公式(1)相关的卷积操作,之后用目标检测器获得的扩展框裁剪实例分割的掩码,为了获得准确的边界框,得到的实例分割掩码上采样得到与输入图像相同的尺寸w×h,然后输入到实例掩码的边界细化模块中,最后采用阈值为0.4大小进行二值化处理,得到菜品特征图像。
3.根据权利要求1所述的一种基于图像分析的菜品识别分类方法,其特征在于,所述步骤(5)中,菜品特征分类网络采用神经架构搜索NAS的方法,具体实现方法如下:NASNet架构递归神经网络RNN作为控制器生成神经网络模型。
4.根据权利要求3所述的一种基于图像分析的菜品识别分类方法,其特征在于,控制器RNN从搜索空间S={hidden_layer,select_operate,select_comb}中以概率p预测网络结构A的单元模块,通过学习单元得到准确性奖励R,最终将梯度p*R传递给RNN控制器进行梯度更新,当满足控制器RNN的目标函数J(θc)最大化时,终止学习,可选组合;
J(θc)=Ep(a1:T;θc)[R] (8)
其中,a1:T作为控制器RNN预测出的网络结构A的单元模块,p为a1:T被选中的概率,θc为控制器的权重数组,初始化为0,当RNN收敛时,单元a1:T会获得最终的准确性奖励R。
5.根据权利要求1所述的一种基于图像分析的菜品识别分类方法,其特征在于,得到菜品分类网络后,新菜品自添加步骤为:
(a)将采集到的拟添加菜品多张图片添加到菜品库;
(b)根据设定的训练步长,步长不大于5000,调整菜品分类网络参数;
(c)完成菜品分类网络调整后,将添加菜品图像作为网络的输入进行识别测试,经过3~5次多角度测试后,最终得到菜品识别结果即为添加菜品名称,说明添加成功,如果识别不理想,将失败测试图像添加到菜品库中进一步调整网络,完成菜品自添加和识别功能。
CN202010083962.3A 2020-02-10 2020-02-10 一种基于图像分析的菜品识别分类方法 Active CN111274986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010083962.3A CN111274986B (zh) 2020-02-10 2020-02-10 一种基于图像分析的菜品识别分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010083962.3A CN111274986B (zh) 2020-02-10 2020-02-10 一种基于图像分析的菜品识别分类方法

Publications (2)

Publication Number Publication Date
CN111274986A CN111274986A (zh) 2020-06-12
CN111274986B true CN111274986B (zh) 2022-07-01

Family

ID=71003581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010083962.3A Active CN111274986B (zh) 2020-02-10 2020-02-10 一种基于图像分析的菜品识别分类方法

Country Status (1)

Country Link
CN (1) CN111274986B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052236A (zh) * 2021-03-22 2021-06-29 山西三友和智慧信息技术股份有限公司 一种基于NASNet的肺炎图像分类方法
CN113192084A (zh) * 2021-05-07 2021-07-30 中国公路工程咨询集团有限公司 一种基于机器视觉的公路边坡微小位移形变监测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845527A (zh) * 2016-12-29 2017-06-13 南京江南博睿高新技术研究院有限公司 一种菜品识别方法
CN110084642A (zh) * 2019-04-19 2019-08-02 哈尔滨新中新电子股份有限公司 基于目标检测和图像检索的菜品识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845527A (zh) * 2016-12-29 2017-06-13 南京江南博睿高新技术研究院有限公司 一种菜品识别方法
CN110084642A (zh) * 2019-04-19 2019-08-02 哈尔滨新中新电子股份有限公司 基于目标检测和图像检索的菜品识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Mask R-CNN的菜品图像识别和分割算法;李仁最;《中国优秀博硕士学位论文全文数据库(硕士) 工程科技1辑》;20200115;第二章至第三章 *

Also Published As

Publication number Publication date
CN111274986A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
US11429818B2 (en) Method, system and device for multi-label object detection based on an object detection network
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN108961235B (zh) 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
CN109241913B (zh) 结合显著性检测和深度学习的船只检测方法及系统
CN106096561B (zh) 基于图像块深度学习特征的红外行人检测方法
CN109684922B (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
CN110532970B (zh) 人脸2d图像的年龄性别属性分析方法、系统、设备和介质
CN112836713A (zh) 基于图像无锚框检测的中尺度对流系统识别与追踪方法
CN109685765B (zh) 一种基于卷积神经网络的x光片肺炎结果预测装置
CN111860106B (zh) 一种无监督的桥梁裂缝识别方法
CN112102229A (zh) 一种基于深度学习的工业ct检测缺陷的智能识别方法
CN108320306B (zh) 融合tld和kcf的视频目标跟踪方法
CN112633382A (zh) 一种基于互近邻的少样本图像分类方法及系统
CN107767416B (zh) 一种低分辨率图像中行人朝向的识别方法
CN109190458B (zh) 一种基于深度学习的小人头检测方法
CN116448019B (zh) 建筑节能工程质量平面度智能检测装置及方法
CN110443279B (zh) 一种基于轻量级神经网络的无人机图像车辆检测方法
CN111274986B (zh) 一种基于图像分析的菜品识别分类方法
CN111524132A (zh) 识别待检测样本中异常细胞的方法、装置和存储介质
CN111275010A (zh) 一种基于计算机视觉的行人重识别方法
CN111860587A (zh) 一种用于图片小目标的检测方法
CN116168240A (zh) 基于注意力增强的任意方向密集舰船目标检测方法
TW202347396A (zh) 用於晶圓之成像資料集中異常之偵測與分類的電腦實施方法以及使用此方法的系統
CN109145770B (zh) 一种基于多尺度特征融合网络与定位模型相结合的麦蜘蛛自动计数方法
Liu et al. A novel deep framework for change detection of multi-source heterogeneous images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant