CN111274986A - 一种基于图像分析的菜品识别分类方法 - Google Patents
一种基于图像分析的菜品识别分类方法 Download PDFInfo
- Publication number
- CN111274986A CN111274986A CN202010083962.3A CN202010083962A CN111274986A CN 111274986 A CN111274986 A CN 111274986A CN 202010083962 A CN202010083962 A CN 202010083962A CN 111274986 A CN111274986 A CN 111274986A
- Authority
- CN
- China
- Prior art keywords
- dish
- boundary
- image
- probability
- mask
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000010191 image analysis Methods 0.000 title claims abstract description 15
- 230000011218 segmentation Effects 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 7
- 235000003166 Opuntia robusta Nutrition 0.000 claims abstract description 4
- 244000218514 Opuntia robusta Species 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 238000013095 identification testing Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000001629 suppression Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 235000013311 vegetables Nutrition 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于图像分析的菜品识别分类方法,包括如下步骤:(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框;(3)对菜品的分割框进行边界定位;(4)菜品特征识别模型的训练与推断,得到菜品特征图像;(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。本发明所公开的方法能够自动进行识别分类,识别效率高,结果准确,更加智能。
Description
技术领域
本发明涉及一种菜品识别分类方法,特别涉及一种基于图像分析的菜品识别分类方法。
背景技术
随着人工智能和大数据时代的到来,传统食堂或者自助餐厅中人工结算不可避免的会造成结算错误、排队等候、工作效率低等多种问题,亟待一些先进技术应用在生活中并更好的用于服务行业。而市场上存在的菜品识别大多数采用特定的用餐工具,如圆形或者方形等餐具、或采用专门标记的餐具来区分菜品来达到识别菜品的目的,智能化程度低,且菜品识别的依赖性强,泛性差。
发明内容
为解决上述技术问题,本发明提供了一种基于图像分析的菜品识别分类方法,以达到更加智能、准确、高效地进行菜品识别分类的目的。
为达到上述目的,本发明的技术方案如下:
一种基于图像分析的菜品识别分类方法,包括如下步骤:
(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;
(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框;
(3)对菜品的分割框进行边界定位;
(4)菜品特征识别模型的训练与推断,得到菜品特征图像;
(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。
上述方案中,所述步骤(2)具体如下:
设餐盘中的菜品数量为a,对给定的菜品目标o,用φ(υo)∈R2×d×1×1来表示菜品目标特征集合,其中,υo表示菜品目标的特征,d代表维度,2代表图像的背景和前景;
将整幅图像的像素特征集合表示为ψ(U)∈R1×d×h×w,其中,U表示像素的特征,d代表维度,h和w代表图像ψ(U)的高度和宽度;
将图像中表示前景的像素拉向特征空间中对应表示的某一菜品的类别,实现菜品的分割,相关操作定义如下:
Mo=soft max(Ψ(U)*φ(υo)) (1)
其中,*表示卷积操作,相似映射图Mo∈R2×1×h×w,M0中包含两个通道,分别代表菜品目标o中每个像素的前景概率和背景概率。
上述方案中,所述步骤(3)具体如下:
将检测到的菜品分割框坐标看作一个离散的随机变量,菜品边界位置是边界所在坐标概率的自变量点集argmax,即:
其中,X是分割框边界水平坐标的离散随机变量,M′∈Rh×w代表公式(1)中Mo的前景通道概率,i表示边界上的点,P(X=i|M′)表示M′的后验概率;
以左边界的推导为例;
根据贝叶斯定理,可以得到:
其中,P(X=i)和P(M′|X=i)分别代表先验概率和似然概率;
假设某一菜品的分割框仅与M′中每一行的最大值有关,仅影响它的邻域像素,似然概率定义为:
对P(X=i)采用离散高斯分布:
其中,α代表归一化系数,μ表示高斯分布的均值,σx表示分布的方差,边界位置的分布与对象分割实例尺寸有关,设置为:
μ=xr,σx=γ·wb,其中,wb表示边界框的宽度,xr表示左边界的横坐标,γ表示回归边界的权重;
将公式(4)和公式(5)代入公式(3)中,得到P(X=i|M′),再将其代入公式(2)得到菜品的左边界,然后用同样的方法得到菜品的其它边界。
上述方案中,所述步骤(4)具体如下:
菜品特征识别模型是通过以下多任务损失函数进行训练的:
L=λrLreg+λmLmask (6)
其中,Lreg采用均方误差MSE作为回归损失函数;
其中,s∈{±1},表示像素点是否属于边界内,若像素点在边界框内,s=1;p∈[0,1]表示当s=1时菜品识别的概率;
其中,L表示总的损失函数,Lreg表示对象回归检测器损失函数,Lmask表示像素方向交叉熵损失,与实际标注的边界框相匹配的边界框输入相关操作模块生成菜品对象的实例掩模,从扩展的实际标注的边界框裁剪得到的掩模用来计算Lmask;λr和λm代表损失函数Lreg和Lmask权重的系数;
在推断时,首先根据获得的目标边界框和像素实例掩模,然后经过非极大值抑制处理之后的边界框经公式(1)相关的卷积操作,之后用目标检测器获得的扩展框裁剪实例分割的掩码,为了获得准确的边界框,得到的实例分割掩码上采样得到与输入图像相同的尺寸w×h,然后输入到实例掩码的边界细化模块中,最后采用阈值为0.4大小进行二值化处理,得到菜品特征图像。
上述方案中,所述步骤(5)中,菜品特征分类网络采用神经架构搜索NAS的方法,具体实现方法如下:NASNet架构递归神经网络RNN作为控制器生成神经网络模型。
进一步的技术方案中,控制器RNN从搜索空间S={hidden_layer,select_operate,select_comb}中以概率p预测网络结构A的单元模块,通过学习单元得到准确性奖励R,最终将梯度p*R传递给RNN控制器进行梯度更新,当满足控制器RNN的目标函数J(θc)最大化时,终止学习,可选组合;
J(θc)=Ep(a1:T;θc)[R] (8)
其中,a1:T作为控制器RNN预测出的网络结构A的单元模块,p为a1:T被选中的概率,θc为控制器的权重数组,初始化为0,当RNN收敛时,单元a1:T会获得最终的准确性奖励R。
上述方案中,得到菜品分类网络后,新菜品自添加步骤为:
(a)将采集到的拟添加菜品多张图片添加到菜品库;
(b)根据设定的训练步长,步长不大于5000,调整菜品分类网络参数;
(c)完成菜品分类网络调整后,将添加菜品图像作为网络的输入进行识别测试,经过3~5次多角度测试后,最终得到菜品识别结果即为添加菜品名称,说明添加成功,如果识别不理想,将失败测试图像添加到菜品库中进一步调整网络,完成菜品自添加和识别功能。
通过上述技术方案,本发明提供的基于图像分析的菜品识别分类方法不会受餐具的选择以及菜品所处餐具的位置的影响,一旦菜品的种类确定,本方法直接对菜品图像进行分析,采用智能识别算法提取各个菜品的特征,并与数据库中的菜品种类进行对比,自动进行识别分类,识别效率高,结果准确,更加智能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为Normal layer网络单元结构示意图;
图2为Reduction Cell网络单元结构示意图;
图3为菜品特征分类网络示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提供了一种基于图像分析的菜品识别分类方法,包括如下步骤:
(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;
(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框,具体如下:
设餐盘中的菜品数量为a,对给定的菜品目标o,用φ(υo)∈R2×d×1×1来表示菜品目标特征集合,其中,υo表示菜品目标的特征,d代表维度,2代表图像的背景和前景;
将整幅图像的像素特征集合表示为ψ(U)∈R1×d×h×w,其中,U表示像素的特征,d代表维度,h和w代表图像ψ(U)的高度和宽度;
将图像中表示前景的像素拉向特征空间中对应表示的某一菜品的类别,实现菜品的分割,相关操作定义如下:
Mo=soft max(Ψ(U)*φ(υo)) (1)
其中,*表示卷积操作,相似映射图Mo∈R2×1×h×w,M0中包含两个通道,分别代表菜品目标o中每个像素的前景概率和背景概率。
(3)对菜品的分割框进行边界定位;
将检测到的菜品分割框坐标看作一个离散的随机变量,菜品边界位置是边界所在坐标概率的自变量点集argmax,即:
以左边界的推导为例;
根据贝叶斯定理,可以得到:
其中,P(X=i)和P(M′|X=i)分别代表先验概率和似然概率;
假设某一菜品的分割框仅与M′中每一行的最大值有关,仅影响它的邻域像素,似然概率定义为:
对P(X=i)采用离散高斯分布:
其中,α代表归一化系数,μ表示高斯分布的均值,σx表示分布的方差,边界位置的分布与对象分割实例尺寸有关,设置为:
μ=xr,σx=γ·wb,其中,wb表示边界框的宽度,xr表示左边界的横坐标,γ表示回归边界的权重;
将公式(4)和公式(5)代入公式(3)中,得到P(X=i|M′),再将其代入公式(2)得到菜品的左边界,然后用同样的方法得到菜品的其它边界。
(4)菜品特征识别模型的训练与推断,得到菜品特征图像;
菜品特征识别模型是通过以下多任务损失函数进行训练的:
L=λrLreg+λmLmask (6)
其中,Lreg采用均方误差MSE作为回归损失函数;
其中,s∈{±1},表示像素点是否属于边界内,若像素点在边界框内,s=1;p∈[0,1]表示当s=1时菜品识别的概率;
其中,L表示总的损失函数,Lreg表示对象回归检测器损失函数,Lmask表示像素方向交叉熵损失,与实际标注的边界框相匹配的边界框输入相关操作模块生成菜品对象的实例掩模,从扩展的实际标注的边界框裁剪得到的掩模用来计算Lmask;λr和λm代表损失函数Lreg和Lmask权重的系数;
在推断时,首先根据获得的目标边界框和像素实例掩模,然后经过非极大值抑制处理之后的边界框经公式(1)相关的卷积操作,之后用目标检测器获得的扩展框裁剪实例分割的掩码,为了获得准确的边界框,得到的实例分割掩码上采样得到与输入图像相同的尺寸w×h,然后输入到实例掩码的边界细化模块中,最后采用阈值为0.4大小进行二值化处理,得到菜品特征图像。
(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。
菜品特征分类网络采用神经架构搜索NAS的方法,具体实现方法如下:NASNet架构递归神经网络RNN作为控制器生成神经网络模型。
控制器RNN从搜索空间S={hidden_layer,select_operate,select_comb}中以概率p预测网络结构A的单元模块,通过学习单元得到准确性奖励R,最终将梯度p*R传递给RNN控制器进行梯度更新,当满足控制器RNN的目标函数J(θc)最大化时,终止学习,可选组合;
J(θc)=Ep(a1:T;θc)[R] (8)
其中,a1:T作为控制器RNN预测出的网络结构A的单元模块,p为a1:T被选中的概率,θc为控制器的权重数组,初始化为0,当RNN收敛时,单元a1:T会获得最终的准确性奖励R。
据此,我们可以通过控制器RNN优化组合出两种类型的网络单元模块:即正常层Normal layer和还原层Reduction layer,规定:
Normal layer:输出和输入称为Feature Map且尺寸相同;
Reduction layer:输出和输入称为Feature Map,输出Feature Map对输入Feature Map进行一次降采样,在Reduction Cell中,对使用输入Feature Map作为输入的操作,默认步长为2,两个网络单元模块的示意图如图1和图2所示。
其中,hidden_layer为搜索空间S中的隐含层,add与concat为搜索空间S中的select_comb,其他为S中的select_operate。
最终得到基于网络单元模块的分类网络结构,示意图如图3所示。
上述方案中,得到菜品分类网络后,新菜品自添加步骤为:
(a)将采集到的拟添加菜品多张图片添加到菜品库;
(b)根据设定的训练步长,步长不大于5000,调整菜品分类网络参数;
(c)完成菜品分类网络调整后,将添加菜品图像作为网络的输入进行识别测试,经过3~5次多角度测试后,最终得到菜品识别结果即为添加菜品名称,说明添加成功,如果识别不理想,将失败测试图像添加到菜品库中进一步调整网络,完成菜品自添加和识别功能。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种基于图像分析的菜品识别分类方法,其特征在于,包括如下步骤:
(1)利用摄像机对盛有不同菜品的餐盘进行图像拍摄;
(2)对图像中的不同菜品进行检测分割,得到不同菜品的分割框;
(3)对菜品的分割框进行边界定位;
(4)菜品特征识别模型的训练与推断,得到菜品特征图像;
(5)建立菜品特征分类网络,将菜品特征图像输入菜品特征分类网络进行菜品的分类,并将新菜品添加到数据库中。
2.根据权利要求1所述的一种基于图像分析的菜品识别分类方法,其特征在于,所述步骤(2)具体如下:
设餐盘中的菜品数量为a,对给定的菜品目标o,用φ(υo)∈R2×d×1×1来表示菜品目标特征集合,其中,υo表示菜品目标的特征,d代表维度,2代表图像的背景和前景;
将整幅图像的像素特征集合表示为ψ(U)∈R1×d×h×w,其中,U表示像素的特征,d代表维度,h和w代表图像ψ(U)的高度和宽度;
将图像中表示前景的像素拉向特征空间中对应表示的某一菜品的类别,实现菜品的分割,相关操作定义如下:
Mo=soft max(Ψ(U)*φ(υo)) (1)
其中,*表示卷积操作,相似映射图Mo∈R2×1×h×w,Mo中包含两个通道概率,分别代表菜品目标o中每个像素的前景概率和背景概率。
3.根据权利要求2所述的一种基于图像分析的菜品识别分类方法,其特征在于,所述步骤(3)具体如下:
将检测到的菜品分割框坐标看作一个离散的随机变量,菜品边界位置是边界所在坐标概率的自变量点集argmax,即:
其中,X是分割框边界水平坐标的离散随机变量,M′∈Rh×w代表公式(1)中Mo的前景通道概率,i表示边界上的点,P(X=i|M′)表示M′的后验概率;
以左边界的推导为例;
根据贝叶斯定理,可以得到:
其中,P(X=i)和P(M′|X=i)分别代表先验概率和似然概率;
假设某一菜品的分割框仅与M′中每一行的最大值有关,仅影响它的邻域像素,似然概率定义为:
对P(X=i)采用离散高斯分布:
其中,α代表归一化系数,μ表示高斯分布的均值,σx表示分布的方差,边界位置的分布与对象分割实例尺寸有关,设置为:
μ=xr,σx=γ·wb,其中,wb表示边界框的宽度,xr表示左边界的横坐标,γ表示回归边界的权重;
将公式(4)和公式(5)代入公式(3)中,得到P(X=i|M′),再将其代入公式(2)得到菜品的左边界,然后用同样的方法得到菜品的其它边界。
4.根据权利要求3所述的一种基于图像分析的菜品识别分类方法,其特征在于,所述步骤(4)具体如下:
菜品特征识别模型是通过以下多任务损失函数进行训练的:
L=λrLreg+λmLmask (6)
其中,Lreg采用均方误差MSE作为回归损失函数;
其中,s∈{±1},表示像素点是否属于边界内,若像素点在边界框内,s=1;p∈[0,1]表示当s=1时菜品识别的概率;
其中,L表示总的损失函数,Lreg表示对象回归检测器损失函数,Lmask表示像素方向交叉熵损失,与实际标注的边界框相匹配的边界框输入相关操作模块生成菜品对象的实例掩模,从扩展的实际标注的边界框裁剪得到的掩模用来计算Lmask;λr和λm代表损失函数Lreg和Lmask权重的系数;
在推断时,首先根据获得的目标边界框和像素实例掩模,然后经过非极大值抑制处理之后的边界框经公式(1)相关的卷积操作,之后用目标检测器获得的扩展框裁剪实例分割的掩码,为了获得准确的边界框,得到的实例分割掩码上采样得到与输入图像相同的尺寸w×h,然后输入到实例掩码的边界细化模块中,最后采用阈值为0.4大小进行二值化处理,得到菜品特征图像。
5.根据权利要求1所述的一种基于图像分析的菜品识别分类方法,其特征在于,所述步骤(5)中,菜品特征分类网络采用神经架构搜索NAS的方法,具体实现方法如下:NASNet架构递归神经网络RNN作为控制器生成神经网络模型。
6.根据权利要求5所述的一种基于图像分析的菜品识别分类方法,其特征在于,控制器RNN从搜索空间S={hidden_layer,select_operate,select_comb}中以概率p预测网络结构A的单元模块,通过学习单元得到准确性奖励R,最终将梯度p*R传递给RNN控制器进行梯度更新,当满足控制器RNN的目标函数J(θc)最大化时,终止学习,可选组合;
J(θc)=Ep(a1:T;θc)[R] (8)
其中,a1:T作为控制器RNN预测出的网络结构A的单元模块,p为a1:T被选中的概率,θc为控制器的权重数组,初始化为0,当RNN收敛时,单元a1:T会获得最终的准确性奖励R。
7.根据权利要求1所述的一种基于图像分析的菜品识别分类方法,其特征在于,得到菜品分类网络后,新菜品自添加步骤为:
(a)将采集到的拟添加菜品多张图片添加到菜品库;
(b)根据设定的训练步长,步长不大于5000,调整菜品分类网络参数;
(c)完成菜品分类网络调整后,将添加菜品图像作为网络的输入进行识别测试,经过3~5次多角度测试后,最终得到菜品识别结果即为添加菜品名称,说明添加成功,如果识别不理想,将失败测试图像添加到菜品库中进一步调整网络,完成菜品自添加和识别功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010083962.3A CN111274986B (zh) | 2020-02-10 | 2020-02-10 | 一种基于图像分析的菜品识别分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010083962.3A CN111274986B (zh) | 2020-02-10 | 2020-02-10 | 一种基于图像分析的菜品识别分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111274986A true CN111274986A (zh) | 2020-06-12 |
CN111274986B CN111274986B (zh) | 2022-07-01 |
Family
ID=71003581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010083962.3A Active CN111274986B (zh) | 2020-02-10 | 2020-02-10 | 一种基于图像分析的菜品识别分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111274986B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052236A (zh) * | 2021-03-22 | 2021-06-29 | 山西三友和智慧信息技术股份有限公司 | 一种基于NASNet的肺炎图像分类方法 |
CN113192084A (zh) * | 2021-05-07 | 2021-07-30 | 中国公路工程咨询集团有限公司 | 一种基于机器视觉的公路边坡微小位移形变监测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106845527A (zh) * | 2016-12-29 | 2017-06-13 | 南京江南博睿高新技术研究院有限公司 | 一种菜品识别方法 |
CN110084642A (zh) * | 2019-04-19 | 2019-08-02 | 哈尔滨新中新电子股份有限公司 | 基于目标检测和图像检索的菜品识别方法 |
-
2020
- 2020-02-10 CN CN202010083962.3A patent/CN111274986B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106845527A (zh) * | 2016-12-29 | 2017-06-13 | 南京江南博睿高新技术研究院有限公司 | 一种菜品识别方法 |
CN110084642A (zh) * | 2019-04-19 | 2019-08-02 | 哈尔滨新中新电子股份有限公司 | 基于目标检测和图像检索的菜品识别方法 |
Non-Patent Citations (1)
Title |
---|
李仁最: "基于Mask R-CNN的菜品图像识别和分割算法", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技1辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052236A (zh) * | 2021-03-22 | 2021-06-29 | 山西三友和智慧信息技术股份有限公司 | 一种基于NASNet的肺炎图像分类方法 |
CN113192084A (zh) * | 2021-05-07 | 2021-07-30 | 中国公路工程咨询集团有限公司 | 一种基于机器视觉的公路边坡微小位移形变监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111274986B (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11380114B2 (en) | Target detection method and apparatus | |
US11429818B2 (en) | Method, system and device for multi-label object detection based on an object detection network | |
CN109241913B (zh) | 结合显著性检测和深度学习的船只检测方法及系统 | |
CN106096561B (zh) | 基于图像块深度学习特征的红外行人检测方法 | |
CN110532970B (zh) | 人脸2d图像的年龄性别属性分析方法、系统、设备和介质 | |
CN109684922B (zh) | 一种基于卷积神经网络的多模型对成品菜的识别方法 | |
CN112101278A (zh) | 基于k近邻特征提取和深度学习的宅基地点云分类方法 | |
CN107767416B (zh) | 一种低分辨率图像中行人朝向的识别方法 | |
CN108320306B (zh) | 融合tld和kcf的视频目标跟踪方法 | |
CN112633382A (zh) | 一种基于互近邻的少样本图像分类方法及系统 | |
CN111860106B (zh) | 一种无监督的桥梁裂缝识别方法 | |
CN110443279B (zh) | 一种基于轻量级神经网络的无人机图像车辆检测方法 | |
CN109190458B (zh) | 一种基于深度学习的小人头检测方法 | |
CN111524132A (zh) | 识别待检测样本中异常细胞的方法、装置和存储介质 | |
CN116448019B (zh) | 建筑节能工程质量平面度智能检测装置及方法 | |
CN111274986B (zh) | 一种基于图像分析的菜品识别分类方法 | |
WO2024032010A1 (zh) | 一种基于迁移学习策略的少样本目标实时检测方法 | |
CN113259883B (zh) | 一种面向手机用户的多源信息融合的室内定位方法 | |
CN112364747B (zh) | 一种有限样本下的目标检测方法 | |
CN112651381A (zh) | 基于卷积神经网络的视频图像中家畜识别方法及装置 | |
CN116168240A (zh) | 基于注意力增强的任意方向密集舰船目标检测方法 | |
Rudinac et al. | Saliency detection and object localization in indoor environments | |
Pillai et al. | Fine-Tuned EfficientNetB4 Transfer Learning Model for Weather Classification | |
CN113591735A (zh) | 一种基于深度学习的行人检测方法及系统 | |
WO2023222643A1 (en) | Method for image segmentation matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |