CN109919211A - 商品识别方法、装置、系统和计算机可读介质 - Google Patents

商品识别方法、装置、系统和计算机可读介质 Download PDF

Info

Publication number
CN109919211A
CN109919211A CN201910141905.3A CN201910141905A CN109919211A CN 109919211 A CN109919211 A CN 109919211A CN 201910141905 A CN201910141905 A CN 201910141905A CN 109919211 A CN109919211 A CN 109919211A
Authority
CN
China
Prior art keywords
commodity
recognized
images
recognition method
semantic segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910141905.3A
Other languages
English (en)
Inventor
魏秀参
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuzhou Kuang Shi Data Technology Co Ltd
Nanjing Kuanyun Technology Co Ltd
Beijing Megvii Technology Co Ltd
Original Assignee
Xuzhou Kuang Shi Data Technology Co Ltd
Nanjing Kuanyun Technology Co Ltd
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuzhou Kuang Shi Data Technology Co Ltd, Nanjing Kuanyun Technology Co Ltd, Beijing Megvii Technology Co Ltd filed Critical Xuzhou Kuang Shi Data Technology Co Ltd
Priority to CN201910141905.3A priority Critical patent/CN109919211A/zh
Publication of CN109919211A publication Critical patent/CN109919211A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种商品识别方法、装置、系统和计算机可读介质,该商品识别方法包括:获取待识别图像;将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。本发明的商品识别方法、装置、系统和计算机可读介质基于语义分割进行商品识别,从而能够克服轻微遮挡、倾斜摆放或密集摆放等情况对商品识别所造成的影响。

Description

商品识别方法、装置、系统和计算机可读介质
技术领域
本发明涉及机器识别技术领域,更具体地涉及一种商品识别方法、装置、系统和计算机可读介质。
背景技术
自动识别在智慧零售领域有着广阔的市场前景。目前智慧零售领域主要采用基于RFID电子标签识别(Radio Frequency Identification,又称无线射频识别)的结算方式,即首先在数据库中为每个具有唯一ID的电子标签指定商品对应关系,然后将该电子标签张贴到所有在售的该类商品上。结算时通过读卡器读出电子标签唯一ID,据此ID在数据库中查询该商品的信息,从而完成“识别”商品,并进行结算。
然而,由于面包等食品的特殊性,其不适于张贴电子标签,因而无法使用RFID方案进行自动识别,因此,基于计算机视觉形式的非接触式识别方案受到越来越多的关注。
视觉识别方案中的常规做法是将其按照物体检测(detection)和物体识别(recognition)进行两阶段的任务划分。然而在现实场景下,遮挡、摆放密集等无法避免的情况会带给识别带来巨大挑战。
发明内容
为了解决上述问题,本发明提出了一种基于语义分割的商品识别方案。下面简要描述本发明提出的关于商品识别方案,更多细节将在后续结合附图在具体实施方式中加以描述。
根据本发明实施例一方面,提供了一种商品识别方法,所述方法包括:获取待识别图像;将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
在一个实施例中,所述语义分割神经网络包括全卷积神经网络。
在一个实施例中,所述语义分割神经网络的训练包括:获取训练样本图像;标注所述训练样本图像中每类商品的分割掩码;将标注后的训练样本图像输入到神经网络中进行训练,以获得所述训练好的语义分割神经网络。
在一个实施例中,所述标注所述训练图像中每类商品的分割掩码为像素级别的标注。
在一个实施例中,所述识别方法还包括:获取每类商品的单品所涵盖的标准像素个数。
在一个实施例中,所述确定所述待识别图像中所包含的各类商品的单品数目包括:将各个商品类别所涵盖的像素个数分别除以相应的所述标准像素个数,并进行四舍五入。
在一个实施例中,所述商品包括面包或蛋糕。
根据本发明实施例另一方面,提供了一种商品识别装置,所述商品识别装置包括:获取模块,用于获取待识别图像;语义分割模块,用于将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及计数模块,用于计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
根据本发明实施例再一方面,提供了一种商品识别系统,所述商品识别系统包括存储装置和处理器,所述存储装置上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行上述任一项所述的商品识别方法。
根据本发明实施例又一方面,提供了一种计算机可读介质,所述计算机可读介质上存储有计算机程序,所述计算机程序在运行时执行上述任一项所述的商品识别方法。
根据本发明实施例的商品识别方法、装置、系统和计算机可读介质基于语义分割进行商品识别,从而能够克服轻微遮挡、倾斜摆放或密集摆放等情况对商品识别所造成的影响。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出用于实现根据本发明实施例的商品识别方法、装置、系统和计算机可读介质的示例电子设备的示意性框图;
图2示出根据本发明实施例的商品识别方法的示意性流程图;
图3示出根据本发明实施例的商品识别装置的示意性框图;以及
图4示出根据本发明实施例的商品识别系统的示意性框图。
具体实施方式
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
首先,参照图1来描述用于实现本发明实施例的商品识别方法、装置、系统和计算机可读介质的示例电子设备100。
如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108以及图像传感器110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
所述图像传感器110可以拍摄用户期望的图像(例如照片、视频等),并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。
当注意,图1所示的电子设备100的组件和结构只是示例性的,尽管图1示出的电子设备100包括多个不同的装置,但是根据需要,其中的一些装置可以不是必须的,其中的一些装置的数量可以更多等等,本发明对此不限定。
下面,将参考图2描述根据本发明实施例的商品识别方法200。
首先,在步骤S210,获取待识别图像。
其中,所述待识别图像可以是任何针对商品实时采集的图像。所述商品包括面包、蛋糕、类似的无包装食品或其他不适于张贴RFID电子标签的商品。待识别图像可以是图像采集装置采集到的原始图像,也可以是对原始图像进行预处理之后获得的图像。所述预处理包括但不限于裁剪、缩放或去噪等处理。此外,待识别图像可以是单个的静态图像,也可以是视频流中的某一视频帧。
待识别图像可以由以电子设备100包括的图像传感器110采集并传送到处理器102进行物体检测。
示例性地,在进行商品识别时,要求用于将待识别商品放置于识别区域,由图像采集装置针对识别区域的商品采集图像。所述图像装置可以为一个或多个,例如,可以在识别区域上方设置一个摄像头,或者也可以使用多个摄像头围绕识别区域设置。
在步骤S220,将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的语义类别。
其中,所述语义分割(Semantic Segmentation)融合了传统的图像分割和目标识别两个任务,将图像分割成一组具有一定语义含义的块,并识别出每个分割块的类别,最终得到具有逐像素语义标注的图像。
在本发明的实施例中,所述语义分割神经网络为全卷积神经网络(FullyConvolutional networks,FCN)。与传统的卷积神经网络(CNN)在卷积层之后使用全连接层得到固定长度的特征向量进行分类不同,FCN网络将全连接层替换为卷积层,其输出的不再是类别而是热力图,其可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的特征图进行上采样,使其恢复到输入图像相同的尺寸,从而可以对图像中的像素进行预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。
示例性地,所述FCN语义分割神经网络的网络结构包括依次连接的5个卷积模块(每个卷积模块之后接一个池化层)、3个卷积层和1个反卷积层。待识别图像输入后先经过5个卷积模块,再经过所述3个卷积层和所述1个反卷积层,最后得到FCN语义分割结果(即FCN输出的包含语义信息的特征图)。当然,上述的网络结构仅是示例性的,所述语义分割神经网络可以具有任何合适的网络结构,其可以根据需要设定。
所述语义分割神经网络除了可以是FCN,还可以是其它常用的语义分割模型例如DeepLab、DilatedNet等,在此不作限制。
若要对一张图像进行语义分割,则需要得到该图像中每一个类别物体的分割掩码,而要得到分割掩码,则需要预先训练得到该类别物体对应的掩码参数,掩码参数可通过在训练样本集的图像中标注分割掩码并将训练样本集输入至深度网络模型中训练得到。以下将对根据本公开的实施例的用于图像语义分割的神经网络的训练方法进行描述。
首先,获取训练样本图像。具体地,构建训练样本集,所述训练样本集中包括大量的训练样本图像,每个所述训练样本图像中包括有多个商品类别。训练样本图像可以是图像采集设备采集到的原始图像,也可以是对原始图像进行标注处理和/或图像预处理之后获得的图像。
示例性地,若待训练的语义分割神经网络为用于进行面包识别的语义分割神经网络,则训练样本图像中包括待识别的面包类型。
接着,标注所述训练样本图像中每类商品的分割掩码(Segmentation Mask)。具体地,针对每张所述训练样本图像,采用相关的软件进行图像的像素级别的语义分割信息标注,标注部分或全部像素所属的类别信息。
接着,将标注后的训练样本图像输入到神经网络中进行训练,以获得所述训练好的语义分割神经网络。
其中,所述神经网络可以包括全卷积神经网络(Fully Convolutional networks,FCN),其具体结构可参照上文。所述神经网络也可以为其他可用于语义分割的神经网络。
在一个实施例中,所述方法还包括:获取每类商品的单品所涵盖的标准像素个数。例如,通过计算得到每个第一类别的商品所涵盖的标准像素个数为N个,该像素个数用于作为后续的计数标准。
在步骤S230,计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
如上所述,在步骤S220中确定了待识别图像中至少部分像素所属的商品类别,进而确定了各个商品类别所涵盖的像素数目,同时已知各类商品单品的标准像素个数,最后通过将每一类商品的像素个数除以该类单品的标准像素个数即可得出对应类别的商品的单品数目。
例如,计算得到第一类别的商品所涵盖的总的像素个数为M个,并且已知每个第一类别的商品所涵盖的标准像素个数为N个,则第一类别的商品数目为M/N,若求得的商值非整数,则对其进行四舍五入。
由于基于语义分割的识别方法的分类对象是图像像素,只需在最后统计单品数目时通过简单的四舍五入即可有效避免“轻微遮挡”、“倾斜摆放”、“密集摆放”等对于商品识别所带来的难题。
本发明实施例所提供的商品识别方法可用于商品的自动结算,尤其适用于面包、蛋糕等不适于张贴RFID电子标签的商品的自动结算。示例性地,顾客挑选商品后进入结算区域,自动结算系统使用前述的商品识别方法识别待结算的商品类型和数目。之后,自动结算系统根据商品类型和各类型的商品数目生成支付信息,顾客据此进行支付,示例性地,顾客可以采用手机APP或者第三方支付平台进行支付。
示例性地,根据本发明实施例的商品识别方法200可以在具有存储器和处理器的设备、装置或者系统中实现。
示例性地,根据本发明实施例的商品识别方法200可以部署在个人终端处,诸如超市或面包店、蛋糕店等的自动收银机等。
替代地,根据本发明实施例的商品识别方法200还可以部署在服务器端(或云端)。
替代地,根据本发明实施例的商品识别方法200还可以分布地部署在服务器端(或云端)和个人终端处。例如,在个人终端获取待识别图像,将所述待识别图像传递至服务器端(或云端),可以在服务器端(或云端)生成识别结果,服务器端(或云端)将所生成的识别结果传递给个人终端。
基于上面的描述,根据本发明实施例的商品识别方法基于语义分割进行商品识别,从而能够克服轻微遮挡、倾斜摆放或密集摆放等情况对商品识别所造成的影响。
以上示例性地描述了根据本发明实施例的商品识别方法所包括的示例性步骤流程。
下面结合图3描述本发明另一方面提供的商品识别装置。图3示出了根据本发明实施例的商品识别装置300的示意性框图。
如图3所示,根据本发明实施例的商品识别装置300包括获取模块310、语义分割模块320以及计数模块330。所述各个模块可分别执行上文中结合图2描述的商品识别方法的各个步骤/功能。
获取模块310用于获取待识别图像。
其中,所述待识别图像可以是任何针对商品实时采集的图像。所述商品包括面包、蛋糕、类似的无包装食品或其他不适于张贴RFID电子标签的商品。待识别图像可以是图像采集装置采集到的原始图像,也可以是对原始图像进行预处理之后获得的图像。所述预处理包括但不限于裁剪、缩放或去噪等处理。此外,待识别图像可以是单个的静态图像,也可以是视频流中的某一视频帧。
待识别图像可以由以电子设备100包括的图像传感器110采集并传送到处理器102进行物体检测。
示例性地,在进行商品识别时,要求用于将待识别商品放置于识别区域,由图像采集装置针对识别区域的商品采集图像。所述图像装置可以为一个或多个,例如,可以在识别区域上方设置一个摄像头,或者也可以使用多个摄像头围绕识别区域设置。
语义分割模块320用于将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的语义类别。
其中,所述语义分割(Semantic Segmentation)融合了传统的图像分割和目标识别两个任务,将图像分割成一组具有一定语义含义的块,并识别出每个分割块的类别,最终得到具有逐像素语义标注的图像。
在本发明的实施例中,所述语义分割神经网络为全卷积神经网络(FullyConvolutional networks,FCN)。与传统的卷积神经网络(CNN)在卷积层之后使用全连接层得到固定长度的特征向量进行分类不同,FCN网络将全连接层替换为卷积层,其输出的不再是类别而是热力图,其可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的特征图进行上采样,使其恢复到输入图像相同的尺寸,从而可以对部分或全部像素进行预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。
示例性地,所述FCN语义分割神经网络的网络结构包括依次连接的5个卷积模块(每个卷积模块之后接一个池化层)、3个卷积层和1个反卷积层。待识别图像输入后先经过5个卷积模块,再经过所述3个卷积层和所述1个反卷积层,最后得到FCN语义分割结果(即FCN输出的包含语义信息的特征图)。当然,上述的网络结构仅是示例性的,所述语义分割神经网络可以具有任何合适的网络结构,其可以根据需要设定。
所述语义分割神经网络除了可以是FCN,还可以是其它常用的语义分割模型例如DeepLab、DilatedNet等,在此不作限制。
若要对一张图像进行语义分割,则需要得到该图像中每一个类别物体的分割掩码,而要得到分割掩码,则需要预先训练得到该类别物体对应的掩码参数,掩码参数可通过在训练样本集的图像中标注分割掩码并将训练样本集输入至深度网络模型中训练得到。以下将对根据本公开的实施例的用于图像语义分割的神经网络的训练方法进行描述。
首先,获取训练样本图像。具体地,构建训练样本集,所述训练样本集中包括大量的训练样本图像,每个所述训练样本图像中包括有多个商品类别。训练样本图像可以是图像采集设备采集到的原始图像,也可以是对原始图像进行标注处理和/或图像预处理之后获得的图像。
示例性地,若待训练的语义分割神经网络为用于进行面包识别的语义分割神经网络,则训练样本图像中包括待识别的面包类型。
接着,标注所述训练样本图像中每类商品的分割掩码(Segmentation Mask)。具体地,针对每张所述训练样本图像,采用相关的软件进行图像的像素级别的语义分割信息标注,标注部分或全部像素所属的类别信息。
接着,将标注后的训练样本图像输入到神经网络中进行训练,以获得所述训练好的语义分割神经网络。
其中,所述神经网络可以包括全卷积神经网络(Fully Convolutional networks,FCN),其具体结构可参照上文。所述神经网络也可以为其他可用于语义分割的神经网络。
在一个实施例中,所述装置还用于:获取每类商品的单品所涵盖的标准像素个数。例如,通过计算得到每个第一类别的商品所涵盖的标准像素个数为N个,该像素个数用于作为后续的计数标准。
计数模块330用于根据所述语义类别及其像素个数确定所述待识别图像中所包含的商品的种类和各类商品的数量。
如上所述,由语义分割模块320确定了待识别图像中至少部分像素所属的商品类别,进而确定了各个商品类别所涵盖的像素数目,同时已知各类商品单品的标准像素个数,最后通过将每一类商品的像素个数,除以该类单品的标准像素个数即可得出对应类别的商品的单品数目。
例如,计算得到第一类别的商品所涵盖的总的像素个数为M个,并且已知每个第一类别的商品所涵盖的标准像素个数为N个,则第一类别的商品数目为M/N,若求得的商值非整数,则对其进行四舍五入。
由于基于语义分割的识别方法的分类对象是图像像素,只需在最后统计单品数目时通过简单的四舍五入即可有效避免“轻微遮挡”、“倾斜摆放”、“密集摆放”等对于商品识别所带来的难题。
本发明实施例所提供的商品识别装置可用于商品的自动结算,尤其适用于面包、蛋糕等不适于张贴RFID电子标签的商品的自动结算。示例性地,顾客挑选商品后进入结算区域,自动结算系统使用前述的商品识别方法识别待结算的商品类型和数目。之后,自动结算系统根据商品类型和各类型的商品数目生成支付信息,顾客据此进行支付,示例性地,顾客可以采用手机APP或者第三方支付平台进行支付。
根据本发明实施例的商品识别装置基于语义分割进行商品识别,从而能够克服轻微遮挡、倾斜摆放或密集摆放等情况对商品识别所造成的影响。
图4示出了根据本发明实施例的商品识别系统400的示意性框图。商品识别系统400包括存储装置410以及处理器420。
其中,存储装置410存储用于实现根据本发明实施例的商品识别方法中的相应步骤的程序代码。处理器420用于运行存储装置410中存储的程序代码,以执行根据本发明实施例的商品识别方法的相应步骤,并且用于实现根据本发明实施例的商品识别装置中的相应模块。
在一个实施例中,在所述程序代码被处理器420运行时使得商品识别系统400执行以下步骤:获取待识别图像;将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
在一个实施例中,所述语义分割神经网络包括全卷积神经网络。
在一个实施例中,所述语义分割神经网络的训练包括:获取训练样本图像;标注所述训练样本图像中每类商品的分割掩码;将标注后的训练样本图像输入到神经网络中进行训练,以获得所述训练好的语义分割神经网络。
在一个实施例中,所述标注所述训练图像中每类商品的分割掩码为像素级别的标注。
在一个实施例中,所述程序代码被处理器420运行时使得商品识别系统400执行:获取每类商品的单品所涵盖的标准像素个数。
在一个实施例中,所述确定所述待识别图像中所包含的各类商品的单品数目包括:将各个商品类别所涵盖的像素个数分别除以相应的所述标准像素个数,并进行四舍五入。
在一个实施例中,所述商品包括面包或蛋糕。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的商品识别方法的相应步骤,并且用于实现根据本发明实施例的商品识别装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。
在一个实施例中,所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的商品识别装置的各个功能模块,并且/或者可以执行根据本发明实施例的商品识别方法。
在一个实施例中,所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行以下步骤:获取待识别图像;将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
在一个实施例中,所述语义分割神经网络包括全卷积神经网络。
在一个实施例中,所述语义分割神经网络的训练包括:获取训练样本图像;标注所述训练样本图像中每类商品的分割掩码;将标注后的训练样本图像输入到神经网络中进行训练,以获得所述训练好的语义分割神经网络。
在一个实施例中,所述标注所述训练图像中每类商品的分割掩码为像素级别的标注。
在一个实施例中所述计算机程序指令在被计算机或处理器运行时还使计算机或处理器执行:获取每类商品的单品所涵盖的标准像素个数。
在一个实施例中,所述确定所述待识别图像中所包含的各类商品的单品数目包括:将各个商品类别所涵盖的像素个数分别除以相应的所述标准像素个数,并进行四舍五入。
在一个实施例中,所述商品包括面包或蛋糕。
根据本发明实施例的商品识别方法、装置、系统和计算机可读介质基于语义分割进行商品识别,从而能够克服轻微遮挡、倾斜摆放或密集摆放等情况对商品识别所造成的影响。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者其他合适的处理器来实现根据本发明实施例的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种商品识别方法,其特征在于,所述识别方法包括:
获取待识别图像;
将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及
计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
2.根据权利要求1所述的商品识别方法,其特征在于,所述语义分割神经网络包括全卷积神经网络。
3.根据权利要求1所述的商品识别方法,其特征在于,所述语义分割神经网络的训练包括:
获取训练样本图像;
标注所述训练样本图像中每类商品的分割掩码;
将标注后的训练样本图像输入到神经网络中进行训练,以获得所述训练好的语义分割神经网络。
4.根据权利要求3所述的商品识别方法,其特征在于,所述标注所述训练图像中每类商品的分割掩码为像素级别的标注。
5.根据权利要求1所述的商品识别方法,其特征在于,还包括:获取每类商品的单品所涵盖的标准像素个数。
6.根据权利要求5所述的商品识别方法,其特征在于,所述确定所述待识别图像中所包含的各类商品的单品数目包括:
将各个商品类别所涵盖的像素个数分别除以相应的所述标准像素个数,并进行四舍五入。
7.根据权利要求1所述的商品识别方法,其特征在于,所述商品包括面包或蛋糕。
8.一种商品识别装置,其特征在于,所述商品识别装置包括:
获取模块,用于获取待识别图像;
语义分割模块,用于将所述待识别图像输入到训练好的语义分割神经网络中,以确定所述待识别图像中至少部分像素所属的商品类别;以及
计数模块,用于计算各个商品类别所涵盖的像素个数,以确定所述待识别图像中所包含的各类商品的单品数目。
9.一种商品识别系统,其特征在于,所述商品识别系统包括存储方法和处理器,所述存储方法上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1-7中的任一项所述的商品识别方法。
10.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机程序,所述计算机程序在运行时执行如权利要求1-7中的任一项所述的商品识别方法。
CN201910141905.3A 2019-02-26 2019-02-26 商品识别方法、装置、系统和计算机可读介质 Pending CN109919211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910141905.3A CN109919211A (zh) 2019-02-26 2019-02-26 商品识别方法、装置、系统和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910141905.3A CN109919211A (zh) 2019-02-26 2019-02-26 商品识别方法、装置、系统和计算机可读介质

Publications (1)

Publication Number Publication Date
CN109919211A true CN109919211A (zh) 2019-06-21

Family

ID=66962348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910141905.3A Pending CN109919211A (zh) 2019-02-26 2019-02-26 商品识别方法、装置、系统和计算机可读介质

Country Status (1)

Country Link
CN (1) CN109919211A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334768A (zh) * 2019-07-08 2019-10-15 创新奇智(重庆)科技有限公司 一种冰柜陈列检测方法、系统及电子设备
CN110443118A (zh) * 2019-06-24 2019-11-12 上海了物网络科技有限公司 基于人造特征的商品识别方法、系统及介质
CN110569789A (zh) * 2019-09-06 2019-12-13 创新奇智(重庆)科技有限公司 商品组合型sku识别方法及其装置
CN110596121A (zh) * 2019-09-12 2019-12-20 南京旷云科技有限公司 键盘外观检测方法、装置和电子系统
CN110738123A (zh) * 2019-09-19 2020-01-31 创新奇智(北京)科技有限公司 识别密集陈列商品的方法及装置
CN111797896A (zh) * 2020-06-01 2020-10-20 锐捷网络股份有限公司 基于智慧烘焙的商品识别方法及装置
CN112149461A (zh) * 2019-06-27 2020-12-29 中科智云科技有限公司 用于识别对象的方法和设备
CN112257649A (zh) * 2020-11-03 2021-01-22 深圳创新奇智科技有限公司 一种物品识别方法、模型训练方法、装置及电子设备
CN113192022A (zh) * 2021-04-27 2021-07-30 长治学院 基于深度学习的病原孢子识别计数方法和装置
CN113627393A (zh) * 2021-09-09 2021-11-09 河北工业大学 基于双重神经网络的商品识别方法及智能售货系统
CN113762315A (zh) * 2021-02-04 2021-12-07 北京京东振世信息技术有限公司 图像检测方法、装置、电子设备和计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188743A (zh) * 2007-09-17 2008-05-28 深圳先进技术研究院 一种基于视频的智能数人系统及其处理方法
CN101877074A (zh) * 2009-11-23 2010-11-03 常州达奇信息科技有限公司 基于多元特征的结核杆菌目标识别计数算法
CN104778468A (zh) * 2014-01-15 2015-07-15 索尼公司 图像处理装置、图像处理方法以及监控设备
CN108961547A (zh) * 2018-06-29 2018-12-07 深圳和而泰数据资源与云技术有限公司 一种商品识别方法、无人售货机及计算机可读存储介质
CN109035558A (zh) * 2018-06-12 2018-12-18 武汉市哈哈便利科技有限公司 一种用于无人售货柜的商品识别算法在线学习系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188743A (zh) * 2007-09-17 2008-05-28 深圳先进技术研究院 一种基于视频的智能数人系统及其处理方法
CN101877074A (zh) * 2009-11-23 2010-11-03 常州达奇信息科技有限公司 基于多元特征的结核杆菌目标识别计数算法
CN104778468A (zh) * 2014-01-15 2015-07-15 索尼公司 图像处理装置、图像处理方法以及监控设备
CN109035558A (zh) * 2018-06-12 2018-12-18 武汉市哈哈便利科技有限公司 一种用于无人售货柜的商品识别算法在线学习系统
CN108961547A (zh) * 2018-06-29 2018-12-07 深圳和而泰数据资源与云技术有限公司 一种商品识别方法、无人售货机及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《云制造理论体系及实践应用》: "《云制造理论体系及实践应用》", 31 May 2018 *
陈兵旗等: "《实用数字图像处理与分析第2版》", 28 February 2014 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443118A (zh) * 2019-06-24 2019-11-12 上海了物网络科技有限公司 基于人造特征的商品识别方法、系统及介质
CN110443118B (zh) * 2019-06-24 2021-09-03 上海了物网络科技有限公司 基于人造特征的商品识别方法、系统及介质
CN112149461A (zh) * 2019-06-27 2020-12-29 中科智云科技有限公司 用于识别对象的方法和设备
CN110334768A (zh) * 2019-07-08 2019-10-15 创新奇智(重庆)科技有限公司 一种冰柜陈列检测方法、系统及电子设备
CN110334768B (zh) * 2019-07-08 2023-08-22 创新奇智(重庆)科技有限公司 一种冰柜陈列检测方法、系统及电子设备
CN110569789B (zh) * 2019-09-06 2023-05-05 创新奇智(重庆)科技有限公司 商品组合型sku识别方法及其装置
CN110569789A (zh) * 2019-09-06 2019-12-13 创新奇智(重庆)科技有限公司 商品组合型sku识别方法及其装置
CN110596121A (zh) * 2019-09-12 2019-12-20 南京旷云科技有限公司 键盘外观检测方法、装置和电子系统
CN110738123A (zh) * 2019-09-19 2020-01-31 创新奇智(北京)科技有限公司 识别密集陈列商品的方法及装置
CN110738123B (zh) * 2019-09-19 2020-10-23 创新奇智(北京)科技有限公司 识别密集陈列商品的方法及其装置
CN111797896A (zh) * 2020-06-01 2020-10-20 锐捷网络股份有限公司 基于智慧烘焙的商品识别方法及装置
CN112257649A (zh) * 2020-11-03 2021-01-22 深圳创新奇智科技有限公司 一种物品识别方法、模型训练方法、装置及电子设备
CN113762315A (zh) * 2021-02-04 2021-12-07 北京京东振世信息技术有限公司 图像检测方法、装置、电子设备和计算机可读介质
CN113192022A (zh) * 2021-04-27 2021-07-30 长治学院 基于深度学习的病原孢子识别计数方法和装置
CN113627393A (zh) * 2021-09-09 2021-11-09 河北工业大学 基于双重神经网络的商品识别方法及智能售货系统
CN113627393B (zh) * 2021-09-09 2024-03-29 河北工业大学 基于双重神经网络的商品识别方法及智能售货系统

Similar Documents

Publication Publication Date Title
CN109919211A (zh) 商品识别方法、装置、系统和计算机可读介质
CN109446883B (zh) 商品状态识别方法、装置、电子设备及可读存储介质
CN109146830A (zh) 用于生成训练数据的方法、装置、系统和存储介质
US9600829B2 (en) System and method for identifying a marketplace status
CN105247541B (zh) 改进的从卡的数字图像中提取金融账户信息
CN110175590A (zh) 一种商品识别方法及装置
CN108875932A (zh) 图像识别方法、装置和系统及存储介质
CN109508974B (zh) 一种基于特征融合的购物结账系统和方法
CN108875522A (zh) 人脸聚类方法、装置和系统及存储介质
CN108898109A (zh) 物品关注度的确定方法、装置和系统
CN108875546A (zh) 人脸身份验证方法、系统及存储介质
CN108256404A (zh) 行人检测方法和装置
CN108416902A (zh) 基于差异识别的实时物体识别方法和装置
CN108876504A (zh) 一种无人售卖系统及其控制方法
CN109741144B (zh) 商品核验方法、装置、主机及设备
CN106131405A (zh) 图像处理方法和装置及用于其的图像采集系统
CN108537166A (zh) 确定货架浏览量以及分析浏览量的方法和装置
CN111768553A (zh) 一种自动售货柜的售货方法及自动售货柜
CN108875517A (zh) 视频处理方法、装置和系统及存储介质
CN108805644A (zh) 贩售机的商品售卖方法以及贩售机
CN108875519A (zh) 对象检测方法、装置和系统及存储介质
CN109190706A (zh) 无人售货方法、装置及系统
CN110490058A (zh) 行人检测模型的训练方法、装置、系统和计算机可读介质
CN111612657A (zh) 一种客户类型识别方法、装置、电子设备及存储介质
CN110428394A (zh) 用于目标移动侦测的方法、装置及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination