CN116503614A - 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 - Google Patents
餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 Download PDFInfo
- Publication number
- CN116503614A CN116503614A CN202310489002.0A CN202310489002A CN116503614A CN 116503614 A CN116503614 A CN 116503614A CN 202310489002 A CN202310489002 A CN 202310489002A CN 116503614 A CN116503614 A CN 116503614A
- Authority
- CN
- China
- Prior art keywords
- image
- dinner plate
- initial
- extraction network
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000003166 Opuntia robusta Nutrition 0.000 title claims abstract description 321
- 244000218514 Opuntia robusta Species 0.000 title claims abstract description 321
- 238000000605 extraction Methods 0.000 title claims abstract description 178
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 title claims abstract description 41
- 235000013305 food Nutrition 0.000 claims abstract description 194
- 238000005457 optimization Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 235000012054 meals Nutrition 0.000 claims description 4
- 230000000873 masking effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 27
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 235000008429 bread Nutrition 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本公开的实施例公开了餐盘形状特征提取网络训练方法和餐盘形状信息生成方法。该方法的一具体实施方式包括:生成针对食物图像集的组合食物图像数据集;生成针对餐盘图像集的截取后餐盘图像数据集;将目标组合食物图像数据集与目标截取后餐盘图像数据集组合为待训练图像数据集;将待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;根据图像特征损失值集,对初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。该实施方式提高了餐盘形状识别的准确率。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及餐盘形状特征提取网络训练方法和餐盘形状信息生成方法。
背景技术
餐盘形状特征提取网络可快速提取任意餐盘的形状特征,被广泛应用在餐饮行业领域。目前,餐盘形状特征提取网络的训练,通常采用的方式为:需要构造大量不同的餐盘类别数据来训练以提高准确率。
然而,当采用上述方式时,经常会存在如下技术问题:
第一,需要不同的餐盘类别数据来训练以提高准确率,由于传统的餐盘特征提取方法需要收集大量的餐盘类别数据,只有预先定义的餐盘类别数据,导致餐盘形状特征提取网络在识别时餐盘内存在不同食物类型时的识别准确率较低;
第二,采用大量餐盘类别数据来训练餐盘形状特征提取网络时,所需计算资源较大,通常情况下承载该提取网络的计算机具备的资源与所需资源相比有一定差异,导致计算的效率较低。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了餐盘形状特征提取网络训练方法和餐盘形状信息生成方法,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种餐盘形状特征提取网络训练方法,该方法包括:生成针对食物图像集的组合食物图像数据集;生成针对餐盘图像集的截取后餐盘图像数据集;从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集;从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集;将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集;将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组;确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集;确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集;基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集;根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。
第二方面,本公开的一些实施例提供了一种餐盘形状特征提取网络训练装置,装置包括:第一生成单元,被配置成生成针对食物图像集的组合食物图像数据集;第二生成单元,被配置成生成针对餐盘图像集的截取后餐盘图像数据集;第一选择单元,被配置成从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集;第二选择单元,被配置成从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集;组合单元,被配置成将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集;输入单元,被配置成将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;构建单元,被配置成基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组;第一确定单元,被配置成确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集;第二确定单元,被配置成确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集;第三确定单元,被配置成基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集;第一优化单元,被配置成根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。
第三方面,本公开的一些实施例提供了一种餐盘形状信息生成方法,该方法包括:获取待餐盘形状识别图像;将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,上述优化餐盘形状特征提取网络是基于本公开的第一方面对应的餐盘形状特征提取网络训练生成的;将上述目标图像特征信息进行分类处理,生成餐盘形状信息。
第四方面,本公开的一些实施例提供了一种餐盘形状信息生成装置,装置包括:获取单元,被配置成获取待餐盘形状识别图像;第二优化单元,被配置成将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,上述优化餐盘形状特征提取网络是基于本公开的第一方面对应的餐盘形状特征提取网络训练生成的;分类单元,被配置成将上述目标图像特征信息进行分类处理,生成餐盘形状信息。
第五方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第六方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的餐盘形状特征提取网络训练方法,提高了餐盘形状识别的准确率。具体来说,造成餐盘形状识别的准确率较低的原因在于:需要不同的餐盘类别数据来训练以提高准确率,由于传统的餐盘特征提取方法需要收集大量的餐盘类别数据,只有预先定义的餐盘类别数据,导致餐盘形状特征提取网络在识别时餐盘内存在不同食物类型时的识别准确率较低。基于此,本公开的一些实施例的餐盘形状特征提取网络训练方法,首先,生成针对食物图像集的组合食物图像数据集。由此,可以得到待处理的组合食物图像数据集。然后,生成针对餐盘图像集的截取后餐盘图像数据集。由此,可以得到待处理的截取后餐盘图像数据集。之后,从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集。由此,可以通过组合食物图像数据集挑选出适合本次训练的组合食物图像数据,从而可以得到目标组合食物图像数据集。其次,从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集。由此,可以通过截取后餐盘图像数据集挑选出适合本次训练的截取后餐盘图像数据,从而可以得到目标截取后餐盘图像数据集。再其次,将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集。由此,可以对每个参于训练的图像数据进行挑选并组合,得到最终参与训练的待训练图像数据集。接着,将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集。由此,可以通过初始餐盘形状特征提取网络将上述待训练图像数据集中的每个待训练图像数据的图像特征提取出来。再接着,基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组。由此,通过图像特征信息集构建三元组可以提高餐盘形状特征提取网络在识别时餐盘内存在不同食物类型时的准确率。之后,确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集。由此,避免了初始餐盘形状特征提取网络预测结果的准确率较差的结果,优化后的餐盘形状特征提取网络相比初始餐盘形状特征提取网络的性能更佳,提高了餐盘形状识别的准确率。然后,确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集。由此,对得到的图像特征信息组集进行了相似度确定,从而,提高了餐盘形状识别的准确率。之后,基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集。由此,可以得到三元组集对应的图像特征损失值集。最后,根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。由此,可以利用图像特征损失值集对初始餐盘形状特征提取网络进行参数优化,从而,提高了餐盘形状识别的准确率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的餐盘形状特征提取网络训练方法的一些实施例的流程图;
图2是根据本公开的餐盘形状信息生成方法的一些实施例的流程图;
图3是根据本公开的餐盘形状特征提取网络训练装置的一些实施例的结构示意图;
图4是根据本公开的餐盘形状信息生成装置的一些实施例的结构示意图;
图5是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1是本公开的餐盘形状特征提取网络训练方法的一些实施例的流程100。该餐盘形状特征提取网络训练方法,包括以下步骤:
步骤101,生成针对食物图像集的组合食物图像数据集。
在一些实施例中,餐盘形状特征提取网络训练方法的执行主体(例如计算设备)可以通过有线连接或无线连接的方式生成针对食物图像集的组合食物图像数据集。这里,上述食物图像集中的食物图像可以是一个随机食物的图像。例如,随机食物可以是油条。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤生成针对食物图像集的组合食物图像数据集:
第一步,获取食物图像集。
第二步,对于上述食物图像集中的每个食物图像,执行以下处理步骤:
1、对上述食物图像进行前景像素掩码处理,得到掩码食物图像。其中,掩码食物图像可以是指二值化图像,二值化的值为0或1,灰度值为1代表食物前景,灰度值为0代表非食物前景。
作为示例,上述执行主体可以对上述食物图像进行二值化处理,即将食物图像中的食物前景像素进行分割,得到分割食物图像,作为掩码食物图像。这里,食物前景像素可以是多个小方格。
2、根据上述掩码食物图像,生成目标食物前景图像。
作为示例,首先,上述执行主体可以从掩码食物图像中去除多个图像背景像素,得到去除后掩码食物图像。然后,生成针对去除后掩码食物图像的食物前景图像,作为目标食物前景图像。
3、对上述目标食物前景图像进行边缘截取处理,以生成截取后食物图像。
作为示例,上述执行主体可以通过canny边缘检测算法对输入的目标食物前景图像做平滑处理去噪,然后,检测目标食物前景图像的边缘区域,得到边缘食物前景图像,接着,将边缘食物前景图像从目标食物前景图像中截取出来,得到截取后边缘前景图像,作为截取后食物图像。
4、对上述截取后食物图像进行数据增强处理,以生成目标食物数据增强图像集。
作为示例,上述执行主体可以将上述截取后食物图像进行旋转、翻转、缩放、裁剪处理,以生成处理后的多个截取后食物图像,得到目标食物数据增强图像集。
5、将上述截取后食物图像和上述目标食物数据增强图像集进行图像数据组合,得到组合图像数据集。
在一些实施例中,上述执行主体可以将截取后食物图像作为目标食物数据增强图像,添加至目标食物数据增强图像集,得到添加后的目标食物数据增强图像集,作为组合图像数据集。例如,上述截取后食物图像集可以是{图像A,图像B,图像C},图像A可以是一张边缘截取后的油条边缘图像,图像B可以是一张边缘截取后的馒头边缘图像,图像C可以是一张边缘截取后的苹果边缘图像,上述目标食物数据增强图像集可以是对应截取后食物图像A的{图像a1,图像a2,图像a3,图像a4,图像a5},这里,图像a1可以是一张由图像A旋转得到的食物图像,图像a2可以是一张由图像A翻转得到的食物图像。则组合图像数据集可以是{图像A,图像a1,图像a2,图像a3,图像a4,图像a5}。
第三步,对得到的组合图像数据集组进行数据打包,以生成上述组合食物图像数据集。
在一些实施例中,上述执行主体可以将上述得到的组合图像数据集组中的每个的组合图像数据集进行合并,得到组合食物图像数据集。例如,组合食物图像数据集可以是{图像A,图像a1,图像a2,图像a3,图像a4,图像a5,图像B,图像b1,图像b2,图像C}。
步骤102,生成针对餐盘图像集的截取后餐盘图像数据集。
在一些实施例中,上述执行主体(例如计算设备)可以通过有线连接或无线连接的方式生成针对餐盘图像集的截取后餐盘图像数据集。这里,上述餐盘图像集中的每个餐盘图像可以是指在预设场景下随机的一个餐盘图像。例如,餐盘图像可以是指在餐厅吃饭时的一个圆形的餐盘图像。这里,上述截取后餐盘图像数据集中的每个截取后餐盘图像数据可以是指被边缘截取后的一个圆形餐盘图像。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤生成针对餐盘图像集的截取后餐盘图像数据集:
第一步,获取餐盘图像集。
第二步,对上述餐盘图像集中的每个餐盘图像进行边缘截取处理,以生成截取后餐盘图像,得到截取后餐盘图像集。例如,上述餐盘图像集可以是指{图像M,图像N,图像B,图像P},这里,M可以是指一个圆形的餐盘图像,图像N可以是指一个椭圆形的餐盘图像,图像B可以是指一个矩形的餐盘图像,图像M可以是指一个正方形的餐盘图像。则上述截取后餐盘图像集可以是指{图像M1,图像N1,图像B1,图像P1},这里,图像M1可以是指一张边缘截取后的圆形餐盘图像。
第三步,对上述截取后餐盘图像集进行分类处理,得到餐盘数据子集组。其中,上述对上述截取后餐盘图像集进行分类处理中的分类可以是指采用特征描述子算法将餐盘形状相似的餐盘图像划分为同一类。例如,边长为10厘米的正方形和边长为9厘米的正方形划分为同一类。这里,上述餐盘数据子集组中的每个餐盘数据子集可以是指一组形状相似的餐盘数据。例如,餐盘数据子集可以是一组包括边长为10厘米的正方形和边长为9厘米的正方形的餐盘数据。
第四步,根据上述真实餐盘数据子集组,生成截取后餐盘图像数据集。这里,上述截取后餐盘图像数据集中的每个截取后餐盘图像数据可以是指被边缘截取后的餐盘图像。
作为示例,上述执行主体可以检测真实餐盘数据子集组中每个真实餐盘数据子集中的每个真实餐盘数据的边缘区域,得到边缘真实餐盘数据,然后,将边缘真实餐盘数据从真实餐盘数据中截取出来,作为截取后餐盘图像数据,得到截取后餐盘图像数据集。
步骤103,从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集。
在一些实施例中,上述执行主体可以从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集。其中,上述预设食物类型可以是指预先设定的不同食物。例如,预设食物类型可以是指苹果类型、油条类型、馒头类型。
作为示例,上述执行主体可以将上述组合食物图像数据集中每个食物类型对应的食物图像个数至少为两个的组合食物图像数据确定为目标组合食物图像数据,得到目标组合食物图像数据集。例如,目标组合食物图像数据集可以是一个苹果图像、一个油条图像及由其旋转后的油条图像。
步骤104,从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集。
在一些实施例中,上述执行主体可以从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集。其中,上述预设餐盘类型可以是截取后餐盘图像数据对应的各个餐盘形状为预先设定的不同餐盘形状。
作为示例,上述执行主体可以将上述目标截取后餐盘图像数据集中每个餐盘类型对应的餐盘图像个数至少为两个的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集。例如,目标截取后餐盘图像数据集可以是指一个边长为10厘米的正方形餐盘、一个边长为9厘米的正方形餐盘及一个半径为5厘米的圆形餐盘。
步骤105,将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集。
在一些实施例中,上述执行主体可以将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集进行合并,得到待训练图像数据集。
步骤106,将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集。
在一些实施例中,上述执行主体可以将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集。其中,上述待训练图像数据集中的待训练图像数据对应上述图像特征信息集中的图像特征信息。这里,初始餐盘形状特征提取网络可以用来生成图像特征信息集。这里,初始餐盘形状特征提取网络可以是指预先训练好的CNN(Convolutional Neural Network,卷积神经网络)。
作为示例,上述执行主体可以将上述待训练图像数据集中的每个将上述待训练图像数据输入至初始餐盘形状特征提取网络中,以生成图像特征信息,得到图像特征信息集。上述初始餐盘形状特征提取网络可以包括但不限于以下至少一项:ResNet18(残差网路18层)、ResNet50(残差网络50层)、MobileNetV2(轻量级神经网络)。
可选地,上述初始餐盘形状特征提取网络是通过以下步骤训练得到的:
第一步,获取待训练图像数据样本集。
在一些实施例中,上述执行主体可以通过有线连接或无线连接的方式获取待训练图像数据样本集。
第二步,从上述待训练图像数据样本集中选择待训练图像数据样本。
在一些实施例中,上述执行主体可以从上述待训练图像数据样本集中选择待训练图像数据样本。
作为示例,上述执行主体可以从上述待训练图像数据样本集中随机选择待训练图像数据样本。
第三步,确定起始餐盘特征提取网络。
在一些实施例中,上述执行主体可以确定起始餐盘特征提取网络。其中,上述起始餐盘特征提取网络可以是未经训练的以图像数据为输入,以图像特征信息为输出的卷积神经网络。这里,上述起始餐盘特征提取网络可以包括:起始识别网络、起始第一餐盘特征提取网络、起始第二餐盘特征提取网络、起始第三餐盘特征提取网络、起始第四餐盘特征提取网络和起始拼接网络。
上述起始识别网络可以是以图像数据为输入,以起始识别信息为输出的神经网络网络。例如,上述起始识别网络可以是OCR(optical character recognition,光学字符识别)网络。这里,图像数据可以是表征图像的基本属性信息。起始识别信息可以是表征图像数据的基本信息。
上述起始第一餐盘特征提取网络可以是以起始识别信息为输入,以起始第一图像特征信息为输出的第一预定义网络。例如,第一预定义网络可以分为两层:第一层可以包括:以起始识别信息为输入,以起始第一图像特征信息为输出的第一识别网络,用于从起始识别信息中识别出与起始第一图像特征信息相关联的起始第一信息。第二层可以包括:以起始第一信息为输入,以起始第一图像特征信息为输出的拼接网络,用于将上述起始第一信息添加至预先设定的第一图像中。例如,上述起始第一信息可以包括但不限于以下至少一项:图像颜色、图像尺寸、图像形状、图像亮度、图像纹理等。预先设定的第一图像可以是未添加形状特征信息的图像。第一识别网络可以是注意力机制网络(Attention)。
上述起始第二餐盘特征提取网络可以是以起始识别信息为输入,以起始第二图像特征信息为输出的第二预定义网络。例如,第二预定义网络可以分为两层:第一层可以包括:以起始识别信息为输入,以起始第二图像特征信息为输出的第二识别网络,用于从起始识别信息中识别出与起始第二图像特征信息相关联的起始第二信息。第二层可以包括:以起始第二信息为输入,以起始第二图像特征信息为输出的拼接网络,用于将上述起始第二信息添加至预先设定的第二图像中。例如,上述起始第二信息可以包括但不限于以下至少一项:图像颜色、图像尺寸、图像形状、图像亮度、图像光照条件等。预先设定的第二图像可以是未添加颜色特征信息的图像。第二识别网络可以是注意力机制网络(Attention)。
上述起始第三餐盘特征提取网络可以是以起始识别信息为输入,以起始第三图像特征信息为输出的第三预定义网络。例如,第三预定义网络可以分为两层:第一层可以包括:以起始识别信息为输入,以起始第三图像特征信息为输出的第三识别网络,用于从起始识别信息中识别出与起始第三图像特征信息相关联的起始第三信息。第二层可以包括:以起始第三信息为输入,以起始第三图像特征信息为输出的拼接网络,用于将上述起始第三信息添加至预先设定的第三图像中。例如,上述起始第三信息可以包括但不限于以下至少一项:图像颜色、图像尺寸、图像形状、图像纹理、图像光照条件等。预先设定的第三图像可以是未添加尺寸特征信息的图像。第三识别网络可以是注意力机制网络(Attention)。
上述起始第四餐盘特征提取网络可以是以起始识别信息为输入,以起始第四图像特征信息为输出的第四预定义网络。例如,第四预定义网络可以分为两层:第一层可以包括:以起始识别信息为输入,以起始第四图像特征信息为输出的第四识别网络,用于从起始识别信息中识别出与起始第四图像特征信息相关联的起始第四信息。第二层可以包括:以起始第四信息为输入,以起始第四图像特征信息为输出的拼接网络,用于将上述起始第四信息添加至预先设定的第四图像中。例如,上述起始第四信息可以包括但不限于以下至少一项:图像颜色、图像尺寸、图像形状、图像亮度、图像纹理、图像光照条件等。预先设定的第四图像可以是未添加光照条件特征信息的图像。第四识别网络可以是注意力机制网络(Attention)。
第四步,将上述待训练图像数据样本输入至上述起始识别网络中,得到上述待训练图像数据样本的起始识别信息。
在一些实施例中,上述执行主体可以将待训练图像数据样本输入至上述起始识别网络中,得到上述待训练图像数据样本的起始识别信息。
第五步,将上述待训练图像数据样本的起始识别信息输入至上述起始第一餐盘特征提取网络中,得到起始第一图像特征信息;
在一些实施例中,上述执行主体可以将上述待训练图像数据样本的起始识别信息输入至上述起始第一餐盘特征提取网络中,得到起始第一图像特征信息。
第六步,将上述待训练图像数据样本的起始识别信息输入至上述起始第二餐盘特征提取网络中,得到起始第二图像特征信息;
在一些实施例中,上述执行主体可以将上述待训练图像数据样本的起始识别信息输入至上述起始第二餐盘特征提取网络中,得到起始第二图像特征信息。
第七步,将上述待训练图像数据样本的起始识别信息输入至上述起始第三餐盘特征提取网络中,得到起始第三图像特征信息;
在一些实施例中,上述执行主体可以将上述待训练图像数据样本的起始识别信息输入至上述起始第三餐盘特征提取网络中,得到起始第三图像特征信息。
第八步,将上述待训练图像数据样本的起始识别信息输入至上述起始第四餐盘特征提取网络中,得到起始第四图像特征信息;
在一些实施例中,上述执行主体可以。将上述待训练图像数据样本的起始识别信息输入至上述起始第四餐盘特征提取网络中,得到起始第四图像特征信息。
第九步,将上述起始第一图像特征信息、起始第二图像特征信息、起始第三图像特征信息、起始第四图像特征信息输入至上述起始拼接网络中,得到起始图像特征信息。
在一些实施例中,上述执行主体可以将上述起始第一图像特征信息、起始第二图像特征信息、起始第三图像特征信息、起始第四图像特征信息输入至上述起始拼接网络中,得到起始图像特征信息。
第十步,基于预设的图像特征数据损失函数,确定上述起始图像特征信息与上述待训练图像数据样本的起始识别信息之间的特征差异值。
在一些实施例中,基于预设的图像特征数据损失函数,上述执行主体可以确定上述起始图像特征信息与上述待训练图像数据样本的起始识别信息之间的特征差异值。其中,预设的图像特征数据损失函数可以是但不限于:均方误差损失函数(MSE)、绝对值损失函数、log对数损失函数、平方损失函数、指数损失函数等。
第十一步,响应于上述特征差异值大于等于预设特征阈值,调整上述初始餐盘特征提取网络的网络参数,以及再次执行上述步骤。
在一些实施例中,上述执行主体可以调整初始餐盘特征提取网络的网络参数。
作为示例,上述执行主体可以响应于上述特征差异值大于等于预设特征阈值,调整上述初始餐盘特征提取网络的网络参数,以及再次执行上述步骤。例如,可以对上述特征差异值与上述预设特征阈值求差值。在此基础上,利用反向传播、梯度下降等方法对上述起始餐盘特征提取网络的参数进行调整。需要说明的是,反向传播算法和梯度下降法是目前广泛研究和应用的公知技术,在此不再赘述。其中,对于预设特征阈值的设定,不作限定,例如,预设特征阈值可以是0.1。
上述第一步-第十一步中的相关内容作为本公开的一个发明点,解决了背景技术提及的技术问题二“导致计算的效率较低。”。导致计算的效率较低的因素往往如下:采用大量餐盘类别数据来训练餐盘形状特征提取网络时,所需计算资源较大,通常情况下承载该提取网络的计算机具备的资源与所需资源相比有一定差异。如果解决了上述因素,就能达到提高计算效率的效果。为了达到这一效果,本公开可以引入初始餐盘特征提取网络,通过初始餐盘特征提取网络,可以将表征图像的基本属性信息转换成图像特征信息。从而,降低了承载该提取网络的计算机具备的资源与所需资源之间的差异,因此,提高了计算的效率。
可选地,响应于上述特征差异值小于上述预设特征阈值,将上述起始餐盘特征提取网络确定为初始餐盘特征提取网络。
在一些实施例中,上述执行主体可以将上述起始餐盘特征提取网络确定为初始餐盘特征提取网络。
作为示例,上述执行主体可以响应于上述特征差异值小于上述预设特征阈值,将上述初始卷积神经网络确定为初始餐盘特征提取网络。这里,对于预设特征阈值的设定,不作限制。
步骤107,基于上述图像特征信息集,构建三元组集。
在一些实施例中,上述执行主体可以基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组。
作为示例,上述执行主体可以基于上述图像特征信息集,对图像特征信息集中的图像特征信息进行随机选取,以生成选取后的三元组,作为三元组集。例如,三元组可以是指(a,p,n),其中,a可以是指在一个旋转后的食物图像,p可以是指与a旋转角度不同的另一个食物图像,n可以是指另一组旋转后食物图像组中的一个食物图像。
步骤108,确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集。
在一些实施例中,上述执行主体可以确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集。
作为示例,上述执行主体可以确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集。例如,假设特征提取网络为N,对(a,p,n)提取的特征为(Na,Np,Nn),三元组损失函数要求Na和Np的距离比Na和Nn的距离小于某个预定义的阈值m。
步骤109,确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集。
在一些实施例中,上述执行主体可以确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集。这里,上述相似度可以是指余弦相似度。
步骤110,基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集。
在一些实施例中,上述执行主体可以基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集。
作为示例,上述预设的三元组损失函数可以包括但不限于以下至少一项:CrossEntropy Loss(交叉熵损失函数),Contrastive Loss(对比损失函数),Triplet Loss(三元组损失函数)。
步骤111,根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。
在一些实施例中,上述执行主体可以根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。这里,将图像特征损失值集传递给初始餐盘形状特征提取网络,初始餐盘形状特征提取网络收到图像特征损失值集之后,使用反向传播算法产生梯度,最后使用梯度更新初始餐盘形状特征提取网络的参数,得到优化餐盘形状特征提取网络。
在一些实施例的一些可选的实现方式中,上述执行主体可以通过以下步骤对上述初始餐盘形状特征提取网络进行参数优化:
第一步,确定上述图像特征损失值集中的各个图像特征损失值对应的平均值。
作为示例,上述执行主体可以选取三元组损失函数所有损失值的平均值作为上述待训练图像数据集的总损失值。
第二步,基于上述平均值,确定针对上述初始餐盘形状特征提取网络中参数集的梯度值。
在一些实施例中,上述执行主体可以基于上述平均值,确定针对上述初始餐盘形状特征提取网络中参数集的梯度值。这里,上述确定参数集的梯度值的算法可以包括但不限于以下至少一项:数值法、解析法、反向传播算法。
第三步,根据预设的优化器和上述梯度值,对上述初始餐盘形状特征提取网络进行优化,得到优化餐盘形状特征提取网络。
在一些实施例中,上述执行主体可以根据预设的优化器和上述梯度值,对上述初始餐盘形状特征提取网络进行优化,得到优化餐盘形状特征提取网络。上述预设的优化器可以包括但不限于以下至少一项:SGD(Stochastic Gradient Descent,随机梯度下降)、MBGD(Mini-Batch Gradient Descent,小批量梯度下降)。
作为示例,上述执行主体可以使用反向传播算法和预设的优化器进行参数调整,以生成优化餐盘形状特征提取网络。其中,经过优化后的上述初始餐盘形状特征提取网络,对于相同形状的餐盘图像提取的特征之间的距离较近,对于不同形状的餐盘图像提取的特征之间的距离较远。由此,可以有效的区分不同形状的餐盘。
在一些实施例的一些可选的实现方式中,上述优化餐盘形状特征提取网络可以通过以下步骤测试:
第一步,获取待餐盘形状识别图像集。这里,上述待餐盘形状识别图像集中的待餐盘形状识别图像可以是指一个新的食物图像,也可以是指一个新的餐盘图像。
第二步,将上述待餐盘形状识别图像集中的待餐盘形状识别图像输入至上述优化餐盘形状特征提取网络中,以生成图像特征信息,得到测试图像集,其中,上述测试图像集包括:图像特征信息集与餐盘图像特征信息集。这里,上述图像特征信息可以是指食物图像的形状特征。这里,上述餐盘图像特征信息可以是指餐盘图像的形状特征。
第三步,对于上述餐盘图像特征信息集中的每个餐盘图像特征信息,执行以下确定步骤:
1、确定上述餐盘图像特征信息与上述图像特征信息集中的每个图像特征之间的相似度,得到特征相似度集。
2、将上述特征相似度集中最小的特征相似度对应的图像特征确定为目标图像特征。这里,上述特征相似度可以是指图像特征之间的余弦相似度。这里,目标图像特征可以是指想要得到的图像特征。
3、确定针对上述目标图像特征与上述待餐盘形状识别图像集的测试指标信息。这里,上述测试指标信息可以是指准确率、精确率等。
作为示例,上述执行主体可以通过上述目标图像特征与上述待餐盘形状识别图像集对应的图像特征信息集的比值确定为测试指标信息。这里,上述待餐盘形状识别图像集中的待餐盘形状识别图像对应图像特征信息集中的图像特征信息。
第四步,将得到的测试指标信息集确定为上述优化餐盘形状特征提取网络对应的测试结果。
作为示例,上述执行主体可以通过选取测试指标信息集中各个测试指标信息的平均值,作为上述优化餐盘特征提取网络的测试结果。此外,可以通过i-way j-shot的测试方法确定上述餐盘特征提取网络的测试指标信息。其中,i-way表示每批次数据中包含餐盘类别的总数为i,j-shot表明每种餐盘的用于训练的图像数量。例如,A、B门店各1000个批次,每批次包含随机采样的5个类别共75张测试图像,最终的餐盘形状识别准确率为所有批次中餐盘形状识别准确率的平均值。
本公开的上述各个实施例中具有如下有益效果:通过本公开的一些实施例的餐盘形状特征提取网络训练方法,提高了餐盘形状识别的准确率。具体来说,造成餐盘形状识别的准确率较低的原因在于:需要不同的餐盘类别数据来训练以提高准确率,由于不同的餐盘类别数据并没有进行与食物组合等图像预处理,只有初始的餐盘类别数据,导致餐盘形状特征提取网络在识别时餐盘内存在不同食物类型时的识别准确率较低。基于此,本公开的一些实施例的餐盘形状特征提取网络训练方法,首先,生成针对食物图像集的组合食物图像数据集。由此,可以得到待处理的组合食物图像数据集。然后,生成针对餐盘图像集的截取后餐盘图像数据集。由此,可以得到待处理的截取后餐盘图像数据集。之后,从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集。由此,可以通过组合食物图像数据集挑选出适合本次训练的组合食物图像数据,从而可以得到目标组合食物图像数据集。其次,从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集。由此,可以通过截取后餐盘图像数据集挑选出适合本次训练的截取后餐盘图像数据,从而可以得到目标截取后餐盘图像数据集。再其次,将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集。由此,可以对每个参于训练的图像数据进行挑选并组合,得到最终参与训练的待训练图像数据集。接着,将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集。由此,可以通过初始餐盘形状特征提取网络将上述待训练图像数据集中的每个待训练图像数据的图像特征提取出来。再接着,基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组。由此,通过图像特征信息集构建三元组可以提高餐盘形状特征提取网络在识别时餐盘内存在不同食物类型时的准确率。之后,确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集。由此,避免了初始餐盘形状特征提取网络预测结果的准确率较差的结果,优化后的餐盘形状特征提取网络相比初始餐盘形状特征提取网络的性能更佳,提高了餐盘形状识别的准确率。然后,确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集。由此,对得到的图像特征信息组集进行了相似度确定,从而,提高了餐盘形状识别的准确率。之后,基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集。由此,可以得到三元组集对应的图像特征损失值集。最后,根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。由此,可以利用图像特征损失值集对初始餐盘形状特征提取网络进行参数优化,从而,提高了餐盘形状识别的准确率。
进一步参考图2,其示出了餐盘形状信息生成方法的一些实施例的流程200。该餐盘形状信息生成方法的流程200,包括以下步骤:
步骤201,获取待餐盘形状识别图像。
在一些实施例中,执行主体可以通过有线连接或无线连接的方式获取待餐盘形状识别图像。这里,上述待餐盘形状识别图像可以是指一个新的餐盘形状。
步骤202,将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息。
在一些实施例中,上述执行主体可以将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,上述优化餐盘形状特征提取网络是基于本公开的餐盘形状特征提取网络训练生成的。
步骤203,将上述目标图像特征信息进行分类处理,生成餐盘形状信息。
在一些实施例中,上述执行主体可以将上述目标图像特征信息进行分类处理,生成餐盘形状信息。这里,上述分类处理可以是指采用特征描述子算法将餐盘形状相似的餐盘图像划分为同一类。
本公开的上述各个实施例中用于生成餐盘形状信息的方法,首先,获取待餐盘形状识别图像。由此可以得到待输入的图像。之后,将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息。这样,将获取的待餐盘形状识别图像输入优化餐盘形状特征提取网络,便可以得到待餐盘形状识别图像的图像特征信息,即目标图像特征信息。最后,将上述目标图像特征信息进行分类处理,生成餐盘形状信息。这样,可以根据得到的目标图像特征信息得到餐盘形状信息,可以通过比较上述目标图像特征信息与餐盘形状信息之间的余弦相似度,如果得到的余弦相似度小于预设阈值,那么说明可以将该目标图像特征确定为餐盘形状信息。由于餐盘形状的任意性,而餐盘特征提取网络往往基于有限的餐盘形状种类进行训练,导致餐盘特征提取网络在训练时往往存在欠拟合的问题,然而,通过获取待餐盘形状识别图像作为输入,可以提高餐盘形状信息的准确度。
进一步参考图3,作为对上述各图所示方法的实现,本公开提供了一种餐盘形状特征提取网络训练装置的一些实施例,这些装置实施例与图1所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,一些实施例的餐盘形状特征提取网络训练装置300包括:第一生成单元301、第二生成单元302、第一选择单元303、第二选择单元304、组合单元305、输入单元306、构建单元307、第一确定单元308、第二确定单元309、第三确定单元310和第一优化单元311。其中,第一生成单元301,被配置成生成针对食物图像集的组合食物图像数据集;第二生成单元302,被配置成生成针对餐盘图像集的截取后餐盘图像数据集;第一选择单元303,被配置成从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集;第二选择单元304,被配置成从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集;组合单元305,被配置成将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集;输入单元306,被配置成将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;构建单元307,被配置成基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组;第一确定单元307,被配置成确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集;第二确定单元309,被配置成确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集;第三确定单元310,被配置成基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集;第一优化单元311,被配置成根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。
可以理解的是,该装置300中记载的诸单元与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置300及其中包含的单元,在此不再赘述。
进一步参考图4,作为对上述各图所示方法的实现,本公开提供了一种餐盘形状信息生成装置的一些实施例,这些装置实施例与图2所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,一些实施例的餐盘形状特征提取网络训练装置400包括:获取单元401、第二优化单元402和分类单元403。其中,获取单元401,被配置成获取待餐盘形状识别图像;第二优化单元402,被配置成将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,上述优化餐盘形状特征提取网络是基于本公开的餐盘形状特征提取网络训练生成的;分类单元403,被配置成将上述目标图像特征信息进行分类处理,生成餐盘形状信息。
可以理解的是,该装置400中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置400及其中包含的单元,在此不再赘述。
下面参考图5,其示出了适于用来实现本公开的一些实施例的电子设备(如计算设备)500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)505中的程序而执行各种适当的动作和处理。在RAM 505中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:生成针对食物图像集的组合食物图像数据集;生成针对餐盘图像集的截取后餐盘图像数据集;从上述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集;从上述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集;将上述目标组合食物图像数据集与上述目标截取后餐盘图像数据集组合为待训练图像数据集;将上述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;基于上述图像特征信息集,构建三元组集,其中,上述三元组集中的每个三元组是对应食物类型为至少两个的图像组;确定上述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集;确定上述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集;基于上述相似度集和预设的三元组损失函数,确定上述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集;根据上述图像特征损失值集,对上述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。获取待餐盘形状识别图像;将上述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,上述优化餐盘形状特征提取网络是基于餐盘形状特征提取网络训练生成的将上述目标图像特征信息进行分类处理,生成餐盘形状信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一生成单元、第二生成单元、第一选择单元、第二选择单元、组合单元、输入单元、构建单元、第一确定单元、第二确定单元、第三确定单元和第一优化单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一生成单元还可以被描述为“生成针对食物图像集的组合食物图像数据集的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种餐盘形状特征提取网络训练方法,包括:
生成针对食物图像集的组合食物图像数据集;
生成针对餐盘图像集的截取后餐盘图像数据集;
从所述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集;
从所述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集;
将所述目标组合食物图像数据集与所述目标截取后餐盘图像数据集组合为待训练图像数据集;
将所述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;
基于所述图像特征信息集,构建三元组集,其中,所述三元组集中的每个三元组是对应食物类型为至少两个的图像组;
确定所述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集;
确定所述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集;
基于所述相似度集和预设的三元组损失函数,确定所述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集;
根据所述图像特征损失值集,对所述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。
2.根据权利要求1所述的方法,其中,所述生成针对食物图像集的组合食物图像数据集,包括:
获取食物图像集;
对于所述食物图像集中的每个食物图像,执行以下处理步骤:
对所述食物图像进行前景像素掩码处理,得到掩码食物图像;
根据所述掩码食物图像,生成目标食物前景图像;
对所述目标食物前景图像进行边缘截取处理,以生成截取后食物图像;
对所述截取后食物图像进行数据增强处理,以生成目标食物数据增强图像集;
将所述截取后食物图像和所述目标食物数据增强图像集进行图像数据组合,得到组合图像数据集;
对得到的组合图像数据集组进行数据打包,以生成所述组合食物图像数据集。
3.根据权利要求1所述的方法,其中,所述生成针对餐盘图像集的截取后餐盘图像数据集,包括:
获取餐盘图像集;
对所述餐盘图像集中的每个餐盘图像进行边缘截取处理,以生成截取后餐盘图像,得到截取后餐盘图像集;
对所述截取后餐盘图像集进行分类处理,得到餐盘数据子集组;
根据所述餐盘数据子集组,生成截取后餐盘图像数据集。
4.根据权利要求1所述的方法,其中,所述根据所述图像特征损失值集,对所述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络,包括:
确定所述图像特征损失值集中的各个图像特征损失值对应的平均值;
基于所述平均值,确定针对所述初始餐盘形状特征提取网络中参数集的梯度值;
根据预设的优化器和所述梯度值,对所述初始餐盘形状特征提取网络进行优化,得到优化餐盘形状特征提取网络。
5.根据权利要求1所述的方法,其中,所述优化餐盘形状特征提取网络通过以下步骤测试:
获取待餐盘形状识别图像集;
将所述待餐盘形状识别图像集中的每个待餐盘形状识别图像输入至所述优化餐盘形状特征提取网络中,以生成特征信息,得到特征信息集,其中,所述特征信息集包括:图像特征信息集与餐盘图像特征信息集;
对于所述餐盘图像特征信息集中的每个餐盘图像特征信息,执行以下确定步骤:
确定所述餐盘图像特征信息与所述图像特征信息集中的每个图像特征之间的相似度,得到特征相似度集;
将所述特征相似度集中最小的特征相似度对应的图像特征确定为目标图像特征;
确定针对所述目标图像特征与所述待餐盘形状识别图像集的测试指标信息;
将得到的测试指标信息集确定为所述优化餐盘形状特征提取网络对应的测试结果。
6.一种餐盘形状信息生成方法,包括:
获取待餐盘形状识别图像;
将所述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,所述优化餐盘形状特征提取网络是基于权利要求1-4所述的方法生成的;
将所述目标图像特征信息进行分类处理,生成餐盘形状信息。
7.根据权利要求1所述的方法,其中,所述初始餐盘形状特征提取网络是通过以下步骤训练得到的:
获取待训练图像数据样本集;
从所述待训练图像数据样本集中选择待训练图像数据样本;
确定起始餐盘特征提取网络,其中,所述起始餐盘特征提取网络包括:起始识别网络、起始第一餐盘特征提取网络、起始第二餐盘特征提取网络、起始第三餐盘特征提取网络、起始第四餐盘特征提取网络和起始拼接网络;
将所述待训练图像数据样本输入至所述起始识别网络中,得到所述待训练图像数据样本的起始识别信息;
将所述待训练图像数据样本的起始识别信息输入至所述起始第一餐盘特征提取网络中,得到起始第一图像特征信息;
将所述待训练图像数据样本的起始识别信息输入至所述起始第二餐盘特征提取网络中,得到起始第二图像特征信息;
将所述待训练图像数据样本的起始识别信息输入至所述起始第三餐盘特征提取网络中,得到起始第三图像特征信息;
将所述待训练图像数据样本的起始识别信息输入至所述起始第四餐盘特征提取网络中,得到起始第四图像特征信息;
将所述起始第一图像特征信息、起始第二图像特征信息、起始第三图像特征信息、起始第四图像特征信息输入至所述起始拼接网络中,得到起始图像特征信息;
基于预设的图像特征数据损失函数,确定所述起始图像特征信息与所述待训练图像数据样本的起始识别信息之间的特征差异值;
响应于所述特征差异值大于等于预设特征阈值,调整所述初始餐盘特征提取网络的网络参数,以及再次执行所述步骤。
8.根据权利要求8所述的方法,其中,所述方法还包括:
响应于所述特征差异值小于所述预设特征阈值,将所述起始餐盘特征提取网络确定为初始餐盘特征提取网络。
9.一种餐盘形状特征提取网络训练装置,包括:
第一生成单元,被配置成生成针对食物图像集的组合食物图像数据集;
第二生成单元,被配置成生成针对餐盘图像集的截取后餐盘图像数据集;
第一选择单元,被配置成从所述组合食物图像数据集中选择满足预设食物类型的组合食物图像数据作为目标组合食物图像数据,得到目标组合食物图像数据集;
第二选择单元,被配置成从所述截取后餐盘图像数据集中选择满足预设餐盘类型的截取后餐盘图像数据作为目标截取后餐盘图像数据,得到目标截取后餐盘图像数据集;
组合单元,被配置成将所述目标组合食物图像数据集与所述目标截取后餐盘图像数据集组合为待训练图像数据集;
输入单元,被配置成将所述待训练图像数据集输入至初始餐盘形状特征提取网络中,以生成图像特征信息集;
构建单元,被配置成基于所述图像特征信息集,构建三元组集,其中,所述三元组集中的每个三元组是对应食物类型为至少两个的图像组;
第一确定单元,被配置成确定所述三元组集中每个三元组对应的图像特征信息组,得到图像特征信息组集;
第二确定单元,被配置成确定所述图像特征信息组集中的各个图像特征信息之间的相似度,得到相似度集;
第三确定单元,被配置成基于所述相似度集和预设的三元组损失函数,确定所述三元组集中每个三元组对应的图像特征损失值,得到图像特征损失值集;
第一优化单元,被配置成根据所述图像特征损失值集,对所述初始餐盘形状特征提取网络进行参数优化,得到优化餐盘形状特征提取网络。
10.一种餐盘形状信息生成装置,包括:
获取单元,被配置成获取待餐盘形状识别图像;
第二优化单元,被配置成将所述待餐盘形状识别图像输入至优化餐盘形状特征提取网络中,以生成图像特征信息,作为目标图像特征信息,其中,所述优化餐盘形状特征提取网络是基于权利要求1-4所述的方法生成的;
分类单元,被配置成将所述目标图像特征信息进行分类处理,生成餐盘形状信息。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至8中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1至8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310489002.0A CN116503614B (zh) | 2023-04-27 | 2023-04-27 | 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310489002.0A CN116503614B (zh) | 2023-04-27 | 2023-04-27 | 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116503614A true CN116503614A (zh) | 2023-07-28 |
CN116503614B CN116503614B (zh) | 2024-07-02 |
Family
ID=87326256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310489002.0A Active CN116503614B (zh) | 2023-04-27 | 2023-04-27 | 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116503614B (zh) |
Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976407A (zh) * | 2016-05-20 | 2016-09-28 | 重庆大学 | 一种适用于遮挡条件下的餐盘形状识别方法 |
CN107122730A (zh) * | 2017-04-24 | 2017-09-01 | 乐金伟 | 自选餐厅自动计价方法 |
CN108182688A (zh) * | 2018-01-19 | 2018-06-19 | 广州市派客朴食信息科技有限责任公司 | 一种食物图像分割办法 |
CN109447084A (zh) * | 2018-08-31 | 2019-03-08 | 广州市派客朴食信息科技有限责任公司 | 一种碗碟形状特征的提取方法 |
WO2019119525A1 (zh) * | 2017-12-21 | 2019-06-27 | 陕西伟景机器人科技有限公司 | 基于图像识别的餐厅自动结账方法 |
CN111582185A (zh) * | 2020-05-11 | 2020-08-25 | 北京百度网讯科技有限公司 | 用于识别图像的方法和装置 |
CN111640268A (zh) * | 2020-04-22 | 2020-09-08 | 深圳拓邦股份有限公司 | 一种基于餐盘形状和颜色的智能结算方法和系统 |
CN111680732A (zh) * | 2020-05-28 | 2020-09-18 | 浙江师范大学 | 一种基于深度学习注意力机制碗碟识别的训练方法 |
CN111753690A (zh) * | 2020-06-15 | 2020-10-09 | 神思电子技术股份有限公司 | 一种菜品托盘识别方法及基于该方法的菜品识别方法 |
WO2021184847A1 (zh) * | 2020-03-17 | 2021-09-23 | 平安科技(深圳)有限公司 | 一种遮挡车牌字符识别方法、装置、存储介质和智能设备 |
CN113505848A (zh) * | 2021-07-27 | 2021-10-15 | 京东科技控股股份有限公司 | 模型训练方法和装置 |
CN113838004A (zh) * | 2021-08-31 | 2021-12-24 | 青岛海尔科技有限公司 | 食物烘焙的控制方法和装置、存储介质及电子装置 |
WO2022002059A1 (zh) * | 2020-06-30 | 2022-01-06 | 北京灵汐科技有限公司 | 初始神经网络的训练方法、图像识别方法、装置、设备及介质 |
CN114359681A (zh) * | 2021-12-27 | 2022-04-15 | 广东电网有限责任公司 | 图像识别模型训练、图像识别方法、装置、设备及介质 |
CN114494319A (zh) * | 2022-03-17 | 2022-05-13 | 国交空间信息技术(北京)有限公司 | 基于遥感图像的沙丘形状提取方法和装置 |
US20220245923A1 (en) * | 2021-01-25 | 2022-08-04 | Tsinghua University | Image information detection method and apparatus and storage medium |
CN114882308A (zh) * | 2022-04-12 | 2022-08-09 | 北京旷视科技有限公司 | 生物特征提取模型训练方法和图像分割方法 |
CN115294396A (zh) * | 2022-08-12 | 2022-11-04 | 北京百度网讯科技有限公司 | 骨干网络的训练方法以及图像分类方法 |
CN115346110A (zh) * | 2022-10-20 | 2022-11-15 | 浪潮通信信息系统有限公司 | 餐盘识别方法、系统、电子设备和存储介质 |
WO2022252089A1 (zh) * | 2021-05-31 | 2022-12-08 | 京东方科技集团股份有限公司 | 对象检测模型的训练方法、对象检测方法及装置 |
CN115546542A (zh) * | 2022-09-29 | 2022-12-30 | 上海云从企业发展有限公司 | 目标识别方法、装置、电子设备及存储介质 |
CN115797990A (zh) * | 2021-09-09 | 2023-03-14 | 腾讯科技(深圳)有限公司 | 图像分类、图像处理方法、装置和存储介质 |
CN115909323A (zh) * | 2022-10-24 | 2023-04-04 | 湖北公众信息产业有限责任公司 | 一种基于深度学习的菜品识别方法及系统 |
-
2023
- 2023-04-27 CN CN202310489002.0A patent/CN116503614B/zh active Active
Patent Citations (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976407A (zh) * | 2016-05-20 | 2016-09-28 | 重庆大学 | 一种适用于遮挡条件下的餐盘形状识别方法 |
CN107122730A (zh) * | 2017-04-24 | 2017-09-01 | 乐金伟 | 自选餐厅自动计价方法 |
WO2019119525A1 (zh) * | 2017-12-21 | 2019-06-27 | 陕西伟景机器人科技有限公司 | 基于图像识别的餐厅自动结账方法 |
CN108182688A (zh) * | 2018-01-19 | 2018-06-19 | 广州市派客朴食信息科技有限责任公司 | 一种食物图像分割办法 |
CN109447084A (zh) * | 2018-08-31 | 2019-03-08 | 广州市派客朴食信息科技有限责任公司 | 一种碗碟形状特征的提取方法 |
WO2021184847A1 (zh) * | 2020-03-17 | 2021-09-23 | 平安科技(深圳)有限公司 | 一种遮挡车牌字符识别方法、装置、存储介质和智能设备 |
CN111640268A (zh) * | 2020-04-22 | 2020-09-08 | 深圳拓邦股份有限公司 | 一种基于餐盘形状和颜色的智能结算方法和系统 |
CN111582185A (zh) * | 2020-05-11 | 2020-08-25 | 北京百度网讯科技有限公司 | 用于识别图像的方法和装置 |
CN111680732A (zh) * | 2020-05-28 | 2020-09-18 | 浙江师范大学 | 一种基于深度学习注意力机制碗碟识别的训练方法 |
CN111753690A (zh) * | 2020-06-15 | 2020-10-09 | 神思电子技术股份有限公司 | 一种菜品托盘识别方法及基于该方法的菜品识别方法 |
WO2022002059A1 (zh) * | 2020-06-30 | 2022-01-06 | 北京灵汐科技有限公司 | 初始神经网络的训练方法、图像识别方法、装置、设备及介质 |
US20220245923A1 (en) * | 2021-01-25 | 2022-08-04 | Tsinghua University | Image information detection method and apparatus and storage medium |
WO2022252089A1 (zh) * | 2021-05-31 | 2022-12-08 | 京东方科技集团股份有限公司 | 对象检测模型的训练方法、对象检测方法及装置 |
WO2023005386A1 (zh) * | 2021-07-27 | 2023-02-02 | 京东科技控股股份有限公司 | 模型训练方法和装置 |
CN113505848A (zh) * | 2021-07-27 | 2021-10-15 | 京东科技控股股份有限公司 | 模型训练方法和装置 |
CN113838004A (zh) * | 2021-08-31 | 2021-12-24 | 青岛海尔科技有限公司 | 食物烘焙的控制方法和装置、存储介质及电子装置 |
CN115797990A (zh) * | 2021-09-09 | 2023-03-14 | 腾讯科技(深圳)有限公司 | 图像分类、图像处理方法、装置和存储介质 |
CN114359681A (zh) * | 2021-12-27 | 2022-04-15 | 广东电网有限责任公司 | 图像识别模型训练、图像识别方法、装置、设备及介质 |
CN114494319A (zh) * | 2022-03-17 | 2022-05-13 | 国交空间信息技术(北京)有限公司 | 基于遥感图像的沙丘形状提取方法和装置 |
CN114882308A (zh) * | 2022-04-12 | 2022-08-09 | 北京旷视科技有限公司 | 生物特征提取模型训练方法和图像分割方法 |
CN115294396A (zh) * | 2022-08-12 | 2022-11-04 | 北京百度网讯科技有限公司 | 骨干网络的训练方法以及图像分类方法 |
CN115546542A (zh) * | 2022-09-29 | 2022-12-30 | 上海云从企业发展有限公司 | 目标识别方法、装置、电子设备及存储介质 |
CN115346110A (zh) * | 2022-10-20 | 2022-11-15 | 浪潮通信信息系统有限公司 | 餐盘识别方法、系统、电子设备和存储介质 |
CN115909323A (zh) * | 2022-10-24 | 2023-04-04 | 湖北公众信息产业有限责任公司 | 一种基于深度学习的菜品识别方法及系统 |
Non-Patent Citations (5)
Title |
---|
HONGMIN SHAO; JIONG MU; RONG TANG; XIAO CHEN; MINGXIN LIU: "Research on Automatic Dish Recognition Algorithm Based on Deep Learning", 2020 INTERNATIONAL CONFERENCE ON COMPUTER VISION, IMAGE AND DEEP LEARNING (CVIDL), 30 November 2020 (2020-11-30) * |
PU, JING; ZHU, SHIPING; MIAO, YUJIE; HUANG, HUA: "Detection of dish waste degree based on image processing and convolutional neural networks", ENVIRONMENTAL PROGRESS & SUSTAINABLE ENERGY, 31 January 2023 (2023-01-31) * |
TIANRONG RAO; YIBO SUN; JIE LI; XIAOYU WANG: "5G based Cloud-Edge Collaboration for Canteen Self-Service Settlement Solution", 2021 7TH INTERNATIONAL CONFERENCE ON COMPUTER AND COMMUNICATIONS (ICCC), 17 January 2022 (2022-01-17) * |
吕永强;闵巍庆;段华;蒋树强;: "融合三元卷积神经网络与关系网络的小样本食品图像识别", 计算机科学, no. 01, 31 January 2020 (2020-01-31) * |
陈小娥;: "基于HSV空间和形状检测的餐盘识别智能算法研究", 西安文理学院学报(自然科学版), no. 06, 15 November 2017 (2017-11-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN116503614B (zh) | 2024-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488921B (zh) | 一种全景数字病理图像智能分析系统及方法 | |
US10599978B2 (en) | Weighted cascading convolutional neural networks | |
CN109472264B (zh) | 用于生成物体检测模型的方法和装置 | |
US20190311223A1 (en) | Image processing methods and apparatus, and electronic devices | |
US20190279088A1 (en) | Training method, apparatus, chip, and system for neural network model | |
CN112801164A (zh) | 目标检测模型的训练方法、装置、设备及存储介质 | |
US20190279043A1 (en) | Online machine learning system that continuously learns from data and human input | |
CN107330731B (zh) | 一种识别广告位点击异常的方法和装置 | |
CN111401516A (zh) | 一种神经网络通道参数的搜索方法及相关设备 | |
GB2553641B (en) | Techniques for selecting objects in images | |
CN108197652A (zh) | 用于生成信息的方法和装置 | |
CN111881944B (zh) | 图像鉴别的方法、电子设备和计算机可读介质 | |
CN115455471A (zh) | 提升隐私和鲁棒的联邦推荐方法、装置、设备及存储介质 | |
CN110633717A (zh) | 一种目标检测模型的训练方法和装置 | |
CN111062914B (zh) | 用于采集脸部图像的方法、装置、电子设备和计算机可读介质 | |
CN116503614B (zh) | 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 | |
CN111127481A (zh) | 基于tof图像联通区域的图像识别方法及装置 | |
CN116228010A (zh) | 信息调整方法、装置、电子设备和计算机可读介质 | |
US20220261998A1 (en) | Adaptive machine learning system for image-based biological sample constituent analysis | |
WO2022037452A1 (zh) | 信息生成方法、装置、电子设备和计算机可读介质 | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
JP6833135B2 (ja) | 電波画像識別装置、電波画像学習装置、及び、電波画像識別方法 | |
Gao et al. | Single image dehazing based on single pixel energy minimization | |
CN113642510A (zh) | 目标检测方法、装置、设备和计算机可读介质 | |
CN113537492A (zh) | 模型训练及数据处理方法、装置、设备、介质、产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |