CN112560713A - 图像识别方法、装置、设备以及烹饪系统 - Google Patents
图像识别方法、装置、设备以及烹饪系统 Download PDFInfo
- Publication number
- CN112560713A CN112560713A CN202011511610.XA CN202011511610A CN112560713A CN 112560713 A CN112560713 A CN 112560713A CN 202011511610 A CN202011511610 A CN 202011511610A CN 112560713 A CN112560713 A CN 112560713A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- area
- preset
- target area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000010411 cooking Methods 0.000 title claims abstract description 48
- 238000012216 screening Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims description 57
- 238000004590 computer program Methods 0.000 claims description 29
- 238000010586 diagram Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 235000013305 food Nutrition 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 239000004927 clay Substances 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 241000209094 Oryza Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47J—KITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
- A47J27/00—Cooking-vessels
- A47J27/002—Construction of cooking-vessels; Methods or processes of manufacturing specially adapted for cooking-vessels
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47J—KITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
- A47J27/00—Cooking-vessels
- A47J27/12—Multiple-unit cooking vessels
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47J—KITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
- A47J36/00—Parts, details or accessories of cooking-vessels
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47J—KITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
- A47J36/00—Parts, details or accessories of cooking-vessels
- A47J36/32—Time-controlled igniting mechanisms or alarm devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Food Science & Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Manufacturing & Machinery (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供一种图像识别方法、装置、设备以及烹饪系统,所述方法包括:获取第一图像;基于预设图像对第一图像进行目标识别,获得第一目标区域;在所述第一目标区域中进行搜索,获得多个待选区域;对所述多个待选区域进行筛选,确定第二目标区域;对所述第二目标区域进行像素点分类,确定第一类型像素点;基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
Description
技术领域
本申请涉及图像识别技术领域,特别涉及一种图像识别方法、装置、设备以及烹饪系统。
背景技术
在餐厅中,煲仔饭烹制主要依靠煲仔炉加热其上方的煲仔的形式完成。但是,由于目前操作流程及烹制工艺的影响,在烹制过程中,一部分食材(如玉米粒等)等异物可能会在煲仔中投料时落入煲仔炉中,易导致煲仔无法与煲仔炉的加热内壁保持良好的直接接触,造成热传递不良问题,进而可能引发烹制食材不熟等食品安全问题,影响用户用餐体验。
现有技术中,采用人工识别煲仔炉中是否落入食材等异物,若煲仔炉数量较多时,采用人工识别不仅耗时耗力,而且存在人为错检漏检等的问题。
发明内容
本申请提供了一种图像识别方法、装置、设备以及烹饪系统,能够对图像中的目标进行识别,避免人为错检漏检等问题的发生。
第一方面,本申请提供了一种图像识别方法,包括:
获取第一图像;
基于预设图像对第一图像进行目标识别,获得第一目标区域;
在所述第一目标区域中进行搜索,获得多个待选区域;
对所述多个待选区域进行筛选,确定第二目标区域;
对所述第二目标区域进行像素点分类,确定第一类型像素点;
基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
其中一种可能的实现方式中,所述预设图像包括目标边缘曲线,所述基于预设图像对第一图像进行目标识别,获得第一目标区域,包括:
对所述第一图像进行灰度处理,获得灰度图像;
以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述灰度图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
其中一种可能的实现方式中,所述对所述多个待选区域进行筛选,确定第二目标区域,包括:
判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
基于判断结果,从多个所述待选区域中确定第二目标区域。
其中一种可能的实现方式中,所述基于判断结果,从多个所述待选区域中确定第二目标区域,包括:
若所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
对所述第三目标区域进行筛选,确定第二目标区域。
其中一种可能的实现方式中,所述对所述第三目标区域进行筛选,确定第二目标区域,包括:
判断多个所述第三目标区域是否相重叠;
若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
其中一种可能的实现方式中,所述对所述第二目标区域进行像素点分类,确定第一类型像素点,包括:
判断所述第二目标区域中每个像素点的像素值是否小于或等于预设第一颜色阈值,且是否大于或等于预设第二颜色阈值;
基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
其中一种可能的实现方式中,在所述获取第一图像之后,所述方法还包括:
基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
其中一种可能的实现方式中,所述预设算子包括第一参数和第二参数,其中,所述第一参数与所述第二参数满足关系:a>0,b>0,b-4a=1,a为所述第一参数,b为所述第二参数。
第二方面,本申请提供了一种图像识别装置,包括:
图像获取模块,用于获取第一图像;
目标识别模块,用于基于预设图像对第一图像进行目标识别,获得与所述预设图像相匹配的第一目标区域;
搜索模块,用于在所述第一目标区域中进行搜索,获得多个待选区域;
筛选模块,用于所述多个待选区域进行筛选,确定第二目标区域;
像素点分类模块,用于对所述第二目标区域进行像素点分类,确定第一类型像素点;
输出模块,用于基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
其中一种可能的实现方式中,所述预设图像包括目标边缘曲线,所述目标识别模块包括:
灰度处理模块,用于对所述第一图像进行灰度处理,获得灰度图像;
变换处理模块,用于以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述灰度图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
第一目标区域确定模块,用于根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
其中一种可能的实现方式中,所述筛选模块包括:
第一判断模块,用于判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
第二目标区域确定模块,用于基于判断结果,从多个所述待选区域中确定第二目标区域。
其中一种可能的实现方式中,所述第二目标区域确定模块包括:
第三目标区域确定模块,用于若所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
第三目标区域筛选模块,用于对所述第三目标区域进行筛选,确定第二目标区域。
其中一种可能的实现方式中,所述第三目标区域筛选模块包括:
第二判断模块,用于判断多个所述第三目标区域是否相重叠;
第一选取模块,用于若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
第二选取模块,用于若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
其中一种可能的实现方式中,所述像素点分类模块包括:
第三判断模块,用于判断所述第二目标区域中每个像素点的像素值是否小于或等于预设第一颜色阈值,且是否大于或等于预设第二颜色阈值;
二值处理模块,用于基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
其中一种可能的实现方式中,所述装置还包括:
纹理增强模块,用于基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
第三方面,本申请提供了一种电子设备,包括:
一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行以下步骤:
获取第一图像;
基于预设图像对第一图像进行目标识别,获得第一目标区域;
在所述第一目标区域中进行搜索,获得多个待选区域;
对所述多个待选区域进行筛选,确定第二目标区域;
对所述第二目标区域进行像素点分类,确定第一类型像素点;
基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
其中一种可能的实现方式中,所述预设图像包括目标边缘曲线,当所述指令被所述设备执行时,使得所述设备执行所述基于预设图像对第一图像进行目标识别,获得第一目标区域,包括:
对所述第一图像进行灰度处理,获得灰度图像;
以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述灰度图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述对所述多个待选区域进行筛选,确定第二目标区域,包括:
判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
基于判断结果,从多个所述待选区域中确定第二目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述基于判断结果,从多个所述待选区域中确定第二目标区域,包括:
若所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
对所述第三目标区域进行筛选,确定第二目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述对所述第三目标区域进行筛选,确定第二目标区域,包括:
判断多个所述第三目标区域是否相重叠;
若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述对所述第二目标区域进行像素点分类,确定第一类型像素点,包括:
判断所述第二目标区域中每个像素点的像素值是否小于或等于预设第一颜色阈值,且是否大于或等于预设第二颜色阈值;
基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述在所述获取第一图像之后,所述设备还执行:
基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
第四方面,本申请提供一种烹饪系统,包括:
烹饪区;
摄像装置,用于对所述烹饪区进行拍摄,以获取得到第一图像;
控制装置,包含:
一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述系统执行时,使得所述系统执行如第一方面所述的方法;
执行装置,用于受控于所述控制装置输出的识别结果。
第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如第一方面所述的方法。
第六方面,本申请提供一种计算机程序,当所述计算机程序被计算机执行时,用于执行第一方面所述的方法。
在一种可能的设计中,第六方面中的程序可以全部或者部分存储在与处理器封装在一起的存储介质上,也可以部分或者全部存储在不与处理器封装在一起的存储器上。
附图说明
图1为本申请图像识别方法一个实施例的方法示意图;
图2为本申请图像识别方法一个实施例的流程示意图;
图3A为本申请图像识别方法一个实施例中第一图像示意图;
图3B为本申请图像识别方法一个实施例中预设图像示意图;
图3C为本申请图像识别方法一个实施例中第二图像示意图;
图3D为本申请图像识别方法一个实施例中第二图像中多个待选区域示意图;
图3E为本申请图像识别方法一个实施例中第二图像中第二目标区域示意图;
图3F为本申请图像识别方法一个实施例中第二图像中筛选后第二目标区域示意图;
图3G为本申请图像识别方法一个实施例中图像纹理增强前后对比示意图;
图4为本申请图像识别装置一个实施例的结构示意图;
图5A为本申请图像识别装置一个实施例中目标识别模块的结构示意图;
图5B为本申请图像识别装置一个实施例中筛选模块的结构示意图;
图5C为本申请图像识别装置一个实施例中第二目标区域确定模块的结构示意图;
图5D为本申请图像识别装置一个实施例中第三目标区域筛选模块的结构示意图;
图5E为本申请图像识别装置一个实施例中像素点分类模块的结构示意图;
图6为本申请烹饪系统一个实施例的结构示意图;
图7为本申请电子设备一个实施例的结构示意图。
具体实施方式
本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释,而非旨在限定本申请。
在餐厅中,煲仔饭烹制主要依靠煲仔炉加热其上方的煲仔的形式完成。但是,由于目前操作流程及烹制工艺的影响,在烹制过程中,一部分食材(如玉米粒等)等异物可能会在煲仔中投料时落入煲仔炉中,易导致煲仔无法与煲仔炉的加热内壁保持良好的直接接触,造成热传递不良问题,进而可能引发烹制食材不熟等食品安全问题,影响用户用餐体验。
现有技术中,采用人工识别煲仔炉中是否落入食材等异物,若煲仔炉数量较多时,采用人工识别不仅耗时耗力,而且存在人为错检漏检等的问题。
为此,本申请提出一种图像识别方法、装置、设备以及烹饪系统,能够对图像中的目标进行识别,避免人为错检漏检等问题的发生。
图1为本申请图像识别方法一个实施例的方法示意图。如图1和图2所示,上述图像识别方法可以包括:
S101、获取第一图像。
在本实施例中,步骤S101中,第一图像可以包括由相机(如工业相机等)拍摄煲仔炉图像,如三通道RGB图像(img-rgb)等。具体地,相机可以安装于煲仔炉的上方,可以拍摄煲仔炉的俯视图,因此,当煲仔炉中落入玉米粒等异物时,第一图像中可以包含该异物图像。
如图3A所示为本实施例第一图像示意图,在第一图像T1中,包含煲仔炉L所在的目标区域Q1(即第一目标区域Q1),以及煲仔炉中落入的异物Y。
S102、基于预设图像对第一图像进行目标识别,获得第一目标区域。
在本实施例中,所述预设图像可以包括不含异物的煲仔炉图像,如单通道灰度图(tem-gray)等。也就是说,预设图像可以提前采用相机对不含异物的煲仔炉进行拍摄获得,并转换为单通道灰度图。
在步骤S102中,所述第一目标区域可以包括第一图像中目标(如煲仔炉)的外接矩形顶点坐标(如左上角顶点坐标等)以及外接矩形尺寸(如长度和宽度)等。
如图3B所示为本实施例的预设图像示意图,在预设图像T2中包含煲仔炉L。
进一步地,预设图像可以包括目标边缘曲线(如煲仔炉边缘曲线等),具体地,预设图像可以通过灰度处理转换为单通道灰度图像,然后,基于边缘检测算子(如Canny算子等)对该单通道灰度图像进行边缘检测处理,获得目标边缘图像,该目标边缘图像中包含多条连续的边缘曲线,边缘曲线中包含组成该连续边缘的点集合,基于边缘曲线中的点数量,确定所述目标边缘曲线。举例地,选取点数量最多的边缘曲线作为该目标边缘曲线,即该预设图像中的煲仔炉边缘曲线。
在一种可能的实现方式中,步骤S102可以包括:
S201、对所述第一图像进行灰度处理,获得灰度图像;
S202、以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述第一图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
S203、根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
也就是说,第一图像被转换为单通道灰度图像(img-gray),以便于进行步骤S202中的广义霍夫变换处理。
优选地,该预设旋转偏差角可以在0到30度范围内,该预设缩放比例可以在0.9至1.1倍范围内。
步骤S202中,通过广义霍夫变换处理,对第一图像进行遍历,得到集合U1,该集合U1中包含多个匹配结果,每个匹配结果中包含匹配区域的当前点坐标、以该当前点坐标为外接矩形顶点(如左上角顶点坐标等)的匹配区域尺寸(如外接矩形的长度和宽度等)以及该匹配区域与所述目标边缘曲线的匹配度。该匹配度即为S(0<S<1),匹配度越大,表示该匹配区域与目标边缘曲线的匹配程度越高(即目标匹配程度越高)。
因此,步骤S203中,选取匹配度最大的匹配区域作为所述第一目标区域,即该匹配度最大的匹配区域的顶点坐标以及尺寸作为所述第一目标区域的顶点坐标以及尺寸,记为(X0,Y0,W0,H0),其中X0,Y0为外接矩形的顶点坐标,W0和H0分别为外接矩形的宽度与高度(或宽度与长度等)。
可以理解的是,所述方法通过广义霍夫变换从相机拍摄的第一图像中精准地定位目标(如煲仔炉)所在位置(如第一目标区域),本方法可以对第一目标区域中是否存在异物进行识别,防止目标以外的杂物带来的干扰,即落入第一目标区域以外的异物不在识别范围内,另外,该方法还可以防止镜头移动、光线变化带来的定位偏差,提高图像识别准确度。
S103、在所述第一目标区域中进行搜索,获得多个待选区域。
优选地,步骤S103中,可以对第一图像中的第一目标区域进行搜索,获得多个待选区域,该待选区域可以包括该第一目标区域中的多个选框(如矩形框等)的顶点坐标(x,y)以及尺寸(如宽度w与高度h等)。
其中一种可能的实现方式中,步骤S103可以包括:
S301、将所述第一目标区域输入预设图像处理软件库中,所述图像处理软件库中包含选择性搜索工具;
S302、通过所述选择性搜索工具对所述第一目标区域进行处理,获得多个待选区域。
所述图像处理软件库可以包括一种基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,如OpenCV。该图像处理软件库中可以存储多种实现图像处理和计算机视觉方面的算法或工具,如选择性搜索工具等。步骤S302中,该选择性搜索工具的具体功能或原理可以参考J.R.R.Uijlings发表在2012IJCV(International Journal of ComputerVision,计算机视觉国际期刊)上的一篇文章中介绍的选择性搜索方法的步骤或原理,在此不受限制。
也就是说,步骤S301中,通过上述顶点坐标以及尺寸(X0,Y0,W0,H0),从第一图像(img-rgb)中选取获得第二目标区域,即可以表示为第二图像(img-refine),该第二图像为三通道RGB图像。
如图3C所示为本实施例中第二图像示意图,在第二图像T3中,包含煲仔炉L,以及落入煲仔炉L中的异物Y。
如图3D所示为本实施例中第二图像中多个待选区域示意图,在第二图像T3中,包含多个待选区域K1。
可以理解的是,采用选择性搜索从第二图像中获得多个待选区域,比传统的滑窗法更加节省资源,有利于提高识别效率和识别精度。
S104、对所述多个待选区域进行筛选,获得第二目标区域。
优选地,筛选条件可以根据第一图像中异物(如玉米粒等)的尺寸进行预设。也就是说,该第二目标区域的尺寸范围可以与图像中异物的尺寸相对应,以去除无用的待选区域(即尺寸明显与异物尺寸不对应的待选取),即降低干扰,提高识别准确度,又缩短后续计算时间,提高计算效率。
其中一种可能的实现方式中,步骤S104可以包括:
S401、判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
S402、基于判断结果,从多个所述待选区域中确定第二目标区域。
优选地,对每个所述待选区域进行遍历,若所述待选区域的面积小于或等于该第一面积阈值A1且大于或等于该第二面积阈值A2,即所述待选区域的面积处于面积区间(A1,A2)内,且所述待选区域的长宽比小于该长宽比阈值T(T>1),则确定该待选区域为第三目标区域,否则,删除面积不处于该面积区间即区间(A1,A2)内或长宽比大于该长宽比阈值T的待选区域,得到第三目标区域的集合U2,集合U2中包含所述第三目标区域的顶点坐标以及尺寸。
进一步地,步骤S402可以包括:
S403、若每个所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
S404、对所述第三目标区域进行筛选,获得第二目标区域。
如图3E所示为本实施例中第二图像中第二目标区域的示意图,在第二图像T3中,包含多个第三目标区域K2。
进一步地,步骤S404包括:
S4041、判断多个所述第三目标区域是否相重叠;
S4042、若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
S4043、若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
也就是说,步骤S404中,对集合U2中的所有第三目标区域进行遍历,若多个第三目标区域(如第三目标区域A和B)之间存在交集(或交集大于预设阈值),则可以确定第三目标区域A和B之间相重叠。
优选地,步骤S405中,若多个第三目标区域之间相重叠,则比较相重叠的多个第三目标区域的面积大小,基于比较结果选取面积最小(或最大)的第三目标区域为第二目标区域。例如第三目标区域A和B之间相重叠,第三目标区域A的面积A1小于第三目标区域B的面积B1,则从集合U2中相重叠且删除面积较大的第三目标区域B,得到第二目标区域的集合U3。也就是说,集合U3中可以包含未重叠的第三目标区域以及相重叠且面积较小(或较大)的第三目标区域,即所述第二目标区域。
如图3F所示为本实施例中第二图像中第二目标区域示意图,在第二图像T3中,包含多个含有异物Y的第二目标区域K4以及多个未含有异物的第二目标区域K5。
S105、对所述第二目标区域进行像素点分类,确定第一类型像素点。
优选地,可以根据预设颜色阈值对所述第二目标区域进行像素点分类,颜色阈值可以根据第一图像中异物的颜色预设。例如颜色阈值可以包括预设第一颜色阈值Tmax和预设第二颜色阈值Tmin,第一颜色阈值包含三个阈值(Rmax,Gmax,Bmax),与第二颜色阈值包含三个阈值(Rmin,Gmin,Bmin),如第一颜色阈值Tmax=(Rmax,Gmax,Bmax)以及第二颜色阈值Tmin=(Rmin,Gmin,Bmin),第一颜色阈值的三个阈值分别代表RGB三通道的阈值,第二颜色阈值的三个阈值分别代表RGB三通道的阈值,例如红色,绿色以及蓝色等。
也就是说,当所述第二目标区域中的像素点的像素值(三通道像素值)小于或等于第一颜色阈值(Rmax,Gmax,Bmax),且大于或等于第二颜色阈值(Rmin,Gmin,Bmin)时,该像素点被分类为第一类型像素点,否则,该像素点被分类为第二类型像素点。换句话说,所述第一类型像素点用于表征所述第二目标区域中像素值小于或等于第一颜色阈值,且大于或等于第二颜色阈值的像素点。
其中一种可能的实现方式中,所述颜色阈值包括第一颜色阈值和第二颜色阈值,步骤S105可以包括:
S501、判断所述第二目标区域中每个像素点的像素值是否小于或等于所述第一颜色阈值,且是否大于或等于所述第二颜色阈值;
S502、基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
优选地,步骤S501中,可以根据集合U3中的多个第二目标区域分别对第一图像进行裁剪,得到多个第三图像,即为集合U4,该第二目标区域(即第三图像)为三通道RGB图像。
步骤S502中,对集合U4中所有第二目标区域中的每个像素点进行遍历,若其像素点的像素值小于或等于第一颜色阈值且大于或等于第二颜色阈值,即处于颜色区间(Tmax,Tmin)中,则将该像素点的灰度值置为0,即黑色像素点,否则将该像素点的灰度值置为255,即白色像素点,以此对所述第二目标区域中的每个像素点进行二值处理,即得到二值图像,记为集合U5。
也就是说,所述二值图像中的白像素点为所述第一类型像素点,黑色像素点为所述第二类型像素点。
S106、基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
可以理解的是,第二目标区域中的像素点总数量与所述二值图像中总像素点数量一致,因此,步骤S106中,可以根据所有所述第一类型像素点(如白像素点)占所述第二目标区域或所述二值图像中总像素点的比例,获得识别结果。
举例地,步骤S106中,可以对二值图像中所有像素点的像素值进行中值滤波,即可得到白色像素点的数量,然后统计得到白色像素点占总像素点的比例。若白色像素点的占比大于预设比值(优选为10%),则将该二值图像标记为含有异物,否则将该二值图像标记为不含有异物。
也就是说,若任意一个二值图像中白色像素点的占比大于或等于预设比值,则输出识别结果为第一图像的第一目标区域(或第二图像)中包含异物(即该煲仔炉中包含异物),若所有的二值图像中白色像素点的占比均小于预设比值,则输出识别结果为第一图像的第一目标区域(或第二图像)中不包含异物(即该煲仔炉中不包含异物)。
可以理解的是,所述方法还可以包括,当识别第一图像中包含异物时,发出提示信号,如语音提示、灯光提示或画面显示等,以提示用户煲仔炉中含有异物,需及时处理,从而无需人工检查,节省人力,实时性强,避免人为错检漏检等问题的发生。
因此,本实施例方法中,通过预设颜色范围对图像中是否存在异物进行识别,相比于采用传统的神经网络分类算法进行图像识别方法更加便捷,不需要大量训练数据支持,方法简单。
其中一种可能的实现方式中,在步骤S101、获取第一图像之后,所述方法还包括:
S107、基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
如图3G所示为本实施例中图像纹理增强前后对比示意图,其中,左图为纹理增强处理前图像T4,右图为纹理增强处理后图像T5。可以理解的是,本实施例中,还可以对第二图像或第三图像进行纹理增强处理,在此不受限制。
优选地,该算子可以包括二阶微分算子,如3x3的拉普拉斯纹理增强算子等。
具体地,该二阶微分算子可以由公式表示为:
在图像处理过程中,定义图像的中心点为f(x,y),即有3x3算子:
0 | f(x,y-1) | 0 |
f(x-1,y) | f(x,y) | f(x+1,y) |
0 | f(x,y+1) | 0 |
因此,可以计算得到坐标f(x,y)像素的拉普拉斯变换值为:
由此可以得到3x3拉普拉斯算子Op1:
0 | 1 | 0 |
1 | -4 | 1 |
0 | 1 | 0 |
引入算子Op2(保留原图信息,基本不产生变换):
0 | 0 | 0 |
0 | 1 | 0 |
0 | 0 | 0 |
将算子Op1和算子Op2加权相减,并且保持算子内部参数和为1(图片总体灰度不变),得到算子Op3:
0 | -a | 0 |
-a | b | -a |
0 | -a | 0 |
其中,在算子Op3中,a大于0,b大于0,b-4a=1。在本实施例中,在一定范围内以特定步长对a,b进行取值,分别计算其对该图像识别的影响,从而选取最优算子作为步骤S106中的该预设算子。
举例地,假定图像(如所述第一图像)中目标区域的像素值如下表分布:
X1 | X2 | X3 |
X4 | X5 | X6 |
X7 | X8 | X9 |
该像素值与算子Op3进行卷积计算,得到新的中心像素可以表示为:
Fcenter=b*X5-a*(X2+X4+X6+X8)
以此方法依次处理该图像的全部像素点,即可得到卷积计算后的图像。随着a或b的取值的改变,该图像的纹理细节也随着改变,例如,随着a取值的不断增加,该图像的纹理细节也不断增强,从人眼视觉视角来看,表现为更加清晰,以实现对该图像的纹理增强。也就是说,通过对a和b的取值的调整,确定图像纹理增强最佳时的a和b的取值,从而确定该预设算子,基于该预设算子对该第一图像进行纹理增强后,有利于提高计算机对该第一图像进行图像识别的准确度,从人眼视觉角度来看,表现为更加清晰。而传统图像识别方法在对目标多次卷积之后,会使其纹理特征淡化,导致模型泛化能力不足,识别率低,需要人为介入校准,降低系统效率。
可以理解的是,上述实施例中的部分或全部步骤骤或操作仅是示例,本申请实施例还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照上述实施例呈现的不同的顺序来执行,并且有可能并非要执行上述实施例中的全部操作。
图4所示为本申请图像识别装置100一个实施例的结构示意图。如图4所示,上述图像识别装置100可以包括:
图像获取模块10,用于获取第一图像;
目标识别模块20,用于基于预设图像对第一图像进行目标识别,获得与所述预设图像相匹配的第一目标区域;
搜索模块30,用于在所述第一目标区域中进行搜索,获得多个待选区域;
筛选模块40,用于所述多个待选区域进行筛选,确定第二目标区域;
像素点分类模块50,用于对所述第二目标区域进行像素点分类,确定第一类型像素点;
输出模块60,用于基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
其中一种可能的实现方式中,如图5A所示,所述预设图像包括目标边缘曲线,所述目标识别模块20包括:
灰度处理模块21,用于对所述第一图像进行灰度处理,获得灰度图像;
变换处理模块22,用于以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述灰度图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
第一目标区域确定模块23,用于根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
其中一种可能的实现方式中,如图5B所示,所述筛选模块40包括:
第一判断模块41,用于判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
第二目标区域确定模块42,用于基于判断结果,从多个所述待选区域中确定第二目标区域。
其中一种可能的实现方式中,如图5C所示,所述第二目标区域确定模块42包括:
第三目标区域确定模块421,用于若所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
第三目标区域筛选模块422,用于对所述第三目标区域进行筛选,确定第二目标区域。
其中一种可能的实现方式中,如图5D所示,所述第三目标区域筛选模块422包括:
第二判断模块4221,用于判断多个所述第三目标区域是否相重叠;
第一选取模块4222,用于若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
第二选取模块4223,用于若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
其中一种可能的实现方式中,如图5E所示,所述像素点分类模块50包括:
第三判断模块51,用于判断所述第二目标区域中每个像素点的像素值是否小于或等于预设第一颜色阈值,且是否大于或等于预设第二颜色阈值;
二值处理模块52,用于基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
其中一种可能的实现方式中,所述装置100还包括:
纹理增强模块70,用于基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
可以理解的是,图4所示实施例提供的图像识别装置可用于执行本申请图1所示方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
应理解以上图4~图5所示的图像识别装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块以软件通过处理元件调用的形式实现,部分模块通过硬件的形式实现。例如,目标识别模块可以为单独设立的处理元件,也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit;以下简称:ASIC),或,一个或多个微处理器(Digital Singnal Processor;以下简称:DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array;以下简称:FPGA)等。再如,这些模块可以集成在一起,以片上系统(System-On-a-Chip;以下简称:SOC)的形式实现。
图6为本申请烹饪系统200一个实施例的结构示意图。如图6所示,烹饪系统200可以包括烹饪区210、摄像装置220、控制装置230以及执行装置240。
本实施例中,烹饪系统200可以被应用餐厅中,如烹制煲仔饭等。
烹饪区210可以包括多个煲仔炉(如煲仔炉头等),每个煲仔炉可以用于烹饪煲仔,制作煲仔饭。在一些可能的实现方式中,烹饪系统200可以包括一个或多个烹饪区210,每个烹饪区210均可以包括一个或多个煲仔炉。
摄像装置220用于对所述烹饪区中的煲仔炉进行拍摄,以获取得到第一图像,并将所述第一图像发送至控制装置230。所述摄像装置220如摄像头,其可以被安装于烹饪区的上方。
控制装置230用于接收由所述摄像装置220发送的所述第一图像,并根据所述第一图像,向所述执行装置240输出识别结果。
进一步地,所述控制装置230可以包括一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述系统执行时,使得所述系统执行步骤:
获取第一图像;
基于预设图像对第一图像进行目标识别,获得第一目标区域;
在所述第一目标区域中进行搜索,获得多个待选区域;
对所述多个待选区域进行筛选,确定第二目标区域;
对所述第二目标区域进行像素点分类,确定第一类型像素点;
基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
也就是说,所述烹饪系统200可以用于执行如图1所示实施例的图像识别方法,其功能或原理可以参考上述图1所示实施例的图像识别方法,在此不再赘述。
执行装置240,用于受控于所述控制装置230输出的识别结果,执行相应的操作。
例如,所述执行装置240可以包括警报装置,所述警报装置用于接收所述识别结果,若所述识别结果为所述第一图像中第一目标区域(即煲仔炉)中含有异物,则发出警报信号提示用户。或者,所述执行装置240还可以包括异物清理装置,所述异物清理装置用于接收所述识别结果,若所述识别结果为所述第一图像中第一目标区域(即煲仔炉)中含有异物,则执行清理煲仔炉中的异物,例如所述异物清理装置被实施为夹爪,根据所述第一图像中异物的坐标或位置,通过伺服升降机构驱动夹爪夹取煲仔炉中的异物,并从该煲仔炉中移出,实现异物清理,等。
应理解,本实施例烹饪系统200中的执行装置240可以包括其他不同类型的操作机构,以根据所述控制装置230输出的识别结果,执行不同的操作,在此不受限制。
应理解,控制装置230可以被实施为控制电路,控制装置230中的处理器可以是片上系统SOC,该处理器中可以包括中央处理器(Central Processing Unit;以下简称:CPU),还可以进一步包括其他类型的处理器,例如:图像处理器(Graphics Processing Unit;以下简称:GPU)等。
图7为本申请电子设备一个实施例的结构示意图,如图7所示,上述电子设备可以包括:一个或多个处理器;存储器;以及一个或多个计算机程序。
其中,上述电子设备可以为移动终端(手机),收银设备,计算机,智慧屏,无人机,智能网联车(Intelligent Connected Vehicle;以下简称:ICV),智能(汽)车(smart/intelligent car)或车载设备等设备。
其中上述一个或多个计算机程序被存储在上述存储器中,上述一个或多个计算机程序包括指令,当上述指令被上述设备执行时,使得上述设备执行以下步骤:
获取第一图像;
基于预设图像对第一图像进行目标识别,获得第一目标区域;
在所述第一目标区域中进行搜索,获得多个待选区域;
对所述多个待选区域进行筛选,确定第二目标区域;
对所述第二目标区域进行像素点分类,确定第一类型像素点;
基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
其中一种可能的实现方式中,所述预设图像包括目标边缘曲线,当所述指令被所述设备执行时,使得所述设备执行所述基于预设图像对第一图像进行目标识别,获得第一目标区域,包括:
对所述第一图像进行灰度处理,获得灰度图像;
以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述灰度图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述对所述多个待选区域进行筛选,确定第二目标区域,包括:
判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
基于判断结果,从多个所述待选区域中确定第二目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述基于判断结果,从多个所述待选区域中确定第二目标区域,包括:
若所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
对所述第三目标区域进行筛选,确定第二目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述对所述第三目标区域进行筛选,确定第二目标区域,包括:
判断多个所述第三目标区域是否相重叠;
若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述对所述第二目标区域进行像素点分类,确定第一类型像素点,包括:
判断所述第二目标区域中每个像素点的像素值是否小于或等于预设第一颜色阈值,且是否大于或等于预设第二颜色阈值;
基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
其中一种可能的实现方式中,当所述指令被所述设备执行时,使得所述设备执行所述在所述获取第一图像之后,所述设备还执行:
基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
图7所示的电子设备可以是终端设备也可以是内置于上述终端设备的电路设备。该设备可以用于执行本申请图1所示实施例提供的图像识别方法中的功能/步骤。
如图7所示,电子设备900包括处理器910和存储器920。其中,处理器910和存储器920之间可以通过内部连接通路互相通信,传递控制和/或数据信号,该存储器920用于存储计算机程序,该处理器910用于从该存储器920中调用并运行该计算机程序。
上述存储器920可以是只读存储器(read-only memory,ROM)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(random access memory,RAM)或可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备,或者还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质等。
上述处理器910可以和存储器920可以合成一个处理装置,更常见的是彼此独立的部件,处理器910用于执行存储器920中存储的程序代码来实现上述功能。具体实现时,该存储器920也可以集成在处理器910中,或者,独立于处理器910。
除此之外,为了使得电子设备900的功能更加完善,该电子设备900还可以包括摄像头930、电源940、输入单元950等中的一个或多个。
可选地,电源950用于给电子设备中的各种器件或电路提供电源。
应理解,图7所示的电子设备900能够实现本申请图1所示实施例提供的方法的各个过程。电子设备900中的各个模块的操作和/或功能,分别为了实现上述方法实施例中的相应流程。具体可参见本申请图1所示方法实施例中的描述,为避免重复,此处适当省略详细描述。
应理解,图7所示的电子设备900中的处理器910可以是片上系统SOC,该处理器910中可以包括中央处理器(Central Processing Unit;以下简称:CPU),还可以进一步包括其他类型的处理器,例如:图像处理器(Graphics Processing Unit;以下简称:GPU)等。
总之,处理器910内部的各部分处理器或处理单元可以共同配合实现之前的方法流程,且各部分处理器或处理单元相应的软件程序可存储在存储器920中。
本申请还提供一种电子设备,所述设备包括存储介质和中央处理器,所述存储介质可以是非易失性存储介质,所述存储介质中存储有计算机可执行程序,所述中央处理器与所述非易失性存储介质连接,并执行所述计算机可执行程序以实现本申请图1所示实施例提供的方法。
以上各实施例中,涉及的处理器可以例如包括CPU、DSP、微控制器或数字信号处理器,还可包括GPU、嵌入式神经网络处理器(Neural-network Process Units;以下简称:NPU)和图像信号处理器(Image Signal Processing;以下简称:ISP),该处理器还可包括必要的硬件加速器或逻辑处理硬件电路,如ASIC,或一个或多个用于控制本申请技术方案程序执行的集成电路等。此外,处理器可以具有操作一个或多个软件程序的功能,软件程序可以存储在存储介质中。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行本申请图1所示实施例提供的方法。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,当其在计算机上运行时,使得计算机执行本申请图1所示实施例提供的方法。
本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a,b,c可以是单个,也可以是多个。
本领域普通技术人员可以意识到,本文中公开的实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory;以下简称:ROM)、随机存取存储器(Random Access Memory;以下简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种图像识别方法,其特征在于,包括:
获取第一图像;
基于预设图像对第一图像进行目标识别,获得第一目标区域;
在所述第一目标区域中进行搜索,获得多个待选区域;
对所述多个待选区域进行筛选,确定第二目标区域;
对所述第二目标区域进行像素点分类,确定第一类型像素点;
基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
2.根据权利要求1所述的方法,其特征在于,所述预设图像包括目标边缘曲线,所述基于预设图像对第一图像进行目标识别,获得第一目标区域,包括:
对所述第一图像进行灰度处理,获得灰度图像;
以所述目标边缘曲线作为参照,基于预设旋转偏差角和预设缩放比例对所述灰度图像进行广义霍夫变换处理,获得多个匹配区域及其对应的匹配度;
根据多个所述匹配区域的匹配度大小,确定所述第一目标区域。
3.根据权利要求1所述的方法,其特征在于,所述对所述多个待选区域进行筛选,确定第二目标区域,包括:
判断每个所述待选区域的面积是否小于或等于预设第一面积阈值,且是否大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比是否小于预设长宽比阈值;
基于判断结果,从多个所述待选区域中确定第二目标区域。
4.根据权利要求3所述的方法,其特征在于,所述基于判断结果,从多个所述待选区域中确定第二目标区域,包括:
若所述待选区域的面积小于或等于预设第一面积阈值,且大于或等于预设第二面积阈值,以及每个所述待选区域的长宽比小于预设长宽比阈值,则确定所述待选区域为第三目标区域;
对所述第三目标区域进行筛选,确定第二目标区域。
5.根据权利要求4所述的方法,其特征在于,所述对所述第三目标区域进行筛选,确定第二目标区域,包括:
判断多个所述第三目标区域是否相重叠;
若多个所述第三目标区域相重叠,则选取相重叠的多个所述第三目标区域中面积最小或最大的所述第三目标区域为第二目标区域;
若多个所述第三目标区域不重叠,则确定不重叠的多个所述第三目标区域为第二目标区域。
6.根据权利要求1所述的方法,其特征在于,所述对所述第二目标区域进行像素点分类,确定第一类型像素点,包括:
判断所述第二目标区域中每个像素点的像素值是否小于或等于预设第一颜色阈值,且是否大于或等于预设第二颜色阈值;
基于判断结果,对所述第二目标区域中的每个像素点进行二值处理,获得二值图像,其中,所述二值图像的每个像素点为白像素点或黑像素点,所述第一类型像素点为所述二值图像中的白像素点。
7.根据权利要求1至6任一项所述的方法,其特征在于,在所述获取第一图像之后,所述方法还包括:
基于预设算子对所述第一图像进行纹理增强处理,获得纹理增强后的第一图像。
8.根据权利要求7所述的方法,其特征在于,所述预设算子包括第一参数和第二参数,其中,所述第一参数与所述第二参数满足关系:a>0,b>0,b-4a=1,a为所述第一参数,b为所述第二参数。
9.一种图像识别装置,其特征在于,包括:
图像获取模块,用于获取第一图像;
目标识别模块,用于基于预设图像对第一图像进行目标识别,获得与所述预设图像相匹配的第一目标区域;
搜索模块,用于在所述第一目标区域中进行搜索,获得多个待选区域;
筛选模块,用于对所述多个待选区域进行筛选,确定第二目标区域;
像素点分类模块,用于对所述第二目标区域进行像素点分类,确定第一类型像素点;
输出模块,用于基于所有所述第一类型像素点占所述第二目标区域中总像素点的比例,获得识别结果。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行如权利要求1至8任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如权利要求1至8任一项所述的方法。
12.一种烹饪系统,其特征在于,包括:
烹饪区;
摄像装置,用于对所述烹饪区进行拍摄,以获取得到第一图像;
控制装置,包含:
一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述系统执行时,使得所述系统执行如权利要求1至8任一项所述的方法;
执行装置,用于受控于所述控制装置输出的识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011511610.XA CN112560713A (zh) | 2020-12-18 | 2020-12-18 | 图像识别方法、装置、设备以及烹饪系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011511610.XA CN112560713A (zh) | 2020-12-18 | 2020-12-18 | 图像识别方法、装置、设备以及烹饪系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560713A true CN112560713A (zh) | 2021-03-26 |
Family
ID=75030560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011511610.XA Pending CN112560713A (zh) | 2020-12-18 | 2020-12-18 | 图像识别方法、装置、设备以及烹饪系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560713A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114092822A (zh) * | 2022-01-24 | 2022-02-25 | 广东皓行科技有限公司 | 图像处理方法、移动控制方法以及移动控制系统 |
CN114417906A (zh) * | 2022-03-14 | 2022-04-29 | 深圳前海量子云码科技有限公司 | 微观图像标识的识别方法、装置、设备及存储介质 |
US11544925B1 (en) | 2021-09-01 | 2023-01-03 | GOPIZZA Inc. | Kitchen system with food preparation station |
CN116883392A (zh) * | 2023-09-05 | 2023-10-13 | 烟台金丝猴食品科技有限公司 | 基于图像处理的投料控制方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002005851A (ja) * | 2000-06-22 | 2002-01-09 | Nikon Corp | 表面検査装置および方法 |
RU2700737C1 (ru) * | 2019-03-07 | 2019-09-19 | Общество С Ограниченной Ответственностью "Конструкторское Бюро "Дорс" (Ооо "Кб "Дорс") | Способ обнаружения посторонних изображений на банкноте |
CN110874552A (zh) * | 2018-09-03 | 2020-03-10 | 佛山市顺德区美的电热电器制造有限公司 | 一种信息处理方法、装置和计算机存储介质 |
CN111402238A (zh) * | 2020-03-17 | 2020-07-10 | 苏州光领电子科技有限公司 | 一种通过机器视觉实现的缺陷标识系统 |
CN111915544A (zh) * | 2020-07-03 | 2020-11-10 | 三峡大学 | 基于图像融合的保护压板运行状态辨识方法 |
-
2020
- 2020-12-18 CN CN202011511610.XA patent/CN112560713A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002005851A (ja) * | 2000-06-22 | 2002-01-09 | Nikon Corp | 表面検査装置および方法 |
CN110874552A (zh) * | 2018-09-03 | 2020-03-10 | 佛山市顺德区美的电热电器制造有限公司 | 一种信息处理方法、装置和计算机存储介质 |
RU2700737C1 (ru) * | 2019-03-07 | 2019-09-19 | Общество С Ограниченной Ответственностью "Конструкторское Бюро "Дорс" (Ооо "Кб "Дорс") | Способ обнаружения посторонних изображений на банкноте |
CN111402238A (zh) * | 2020-03-17 | 2020-07-10 | 苏州光领电子科技有限公司 | 一种通过机器视觉实现的缺陷标识系统 |
CN111915544A (zh) * | 2020-07-03 | 2020-11-10 | 三峡大学 | 基于图像融合的保护压板运行状态辨识方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11544925B1 (en) | 2021-09-01 | 2023-01-03 | GOPIZZA Inc. | Kitchen system with food preparation station |
US12100208B2 (en) | 2021-09-01 | 2024-09-24 | GOPIZZA Inc. | Method for pizza preparation |
CN114092822A (zh) * | 2022-01-24 | 2022-02-25 | 广东皓行科技有限公司 | 图像处理方法、移动控制方法以及移动控制系统 |
CN114092822B (zh) * | 2022-01-24 | 2022-07-26 | 广东皓行科技有限公司 | 图像处理方法、移动控制方法以及移动控制系统 |
CN114417906A (zh) * | 2022-03-14 | 2022-04-29 | 深圳前海量子云码科技有限公司 | 微观图像标识的识别方法、装置、设备及存储介质 |
CN116883392A (zh) * | 2023-09-05 | 2023-10-13 | 烟台金丝猴食品科技有限公司 | 基于图像处理的投料控制方法及系统 |
CN116883392B (zh) * | 2023-09-05 | 2023-11-17 | 烟台金丝猴食品科技有限公司 | 基于图像处理的投料控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560713A (zh) | 图像识别方法、装置、设备以及烹饪系统 | |
CN108369650B (zh) | 标识校准图案的可能特征点的方法 | |
JP4528309B2 (ja) | オブジェクト検出方法、オブジェクト検出装置、およびオブジェクト検出プログラム | |
CA2867365C (en) | Method, system and computer storage medium for face detection | |
JP6216871B2 (ja) | 文書バウンダリ検知方法 | |
CN111612781A (zh) | 一种屏幕缺陷检测方法、装置及头戴显示设备 | |
US7639878B2 (en) | Shadow detection in images | |
US8805077B2 (en) | Subject region detecting apparatus | |
US6674904B1 (en) | Contour tracing and boundary detection for object identification in a digital image | |
US10043090B2 (en) | Information processing device, information processing method, computer-readable recording medium, and inspection system | |
CN107784669A (zh) | 一种光斑提取及其质心确定的方法 | |
US8923610B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
CN108256521B (zh) | 用于车身颜色识别的有效区域定位方法 | |
Zakaria et al. | Object shape recognition in image for machine vision application | |
CN115661110B (zh) | 一种透明工件识别与定位的方法 | |
CN113059560B (zh) | 机械臂控制方法、装置、电子设备以及烹饪系统 | |
US9628659B2 (en) | Method and apparatus for inspecting an object employing machine vision | |
CN113569859B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN117993406A (zh) | 一种二维条码自动识别读取方法及系统 | |
CN115830049B (zh) | 角点检测的方法和装置 | |
CN117501326A (zh) | 图像处理方法及装置、电子设备、计算机可读存储介质 | |
US9286695B2 (en) | Systems and methods for tracking points within an encasement | |
CN115019069A (zh) | 模板匹配方法、模板匹配装置以及存储介质 | |
CN113283262A (zh) | 一种二维码定位方法、装置、电子设备、机器可读介质 | |
CN112926594A (zh) | 图像处理方法、装置、电子设备以及烹饪系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |