CN106960214A - 基于图像的物体识别方法 - Google Patents

基于图像的物体识别方法 Download PDF

Info

Publication number
CN106960214A
CN106960214A CN201710088343.1A CN201710088343A CN106960214A CN 106960214 A CN106960214 A CN 106960214A CN 201710088343 A CN201710088343 A CN 201710088343A CN 106960214 A CN106960214 A CN 106960214A
Authority
CN
China
Prior art keywords
candidate frame
database
feature vector
classification
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710088343.1A
Other languages
English (en)
Other versions
CN106960214B (zh
Inventor
张凯琦
刘烨航
史皓天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing yiyixian Education Technology Co.,Ltd.
Original Assignee
Beijing One-Dimensional Chord Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing One-Dimensional Chord Technology Co Ltd filed Critical Beijing One-Dimensional Chord Technology Co Ltd
Priority to CN201710088343.1A priority Critical patent/CN106960214B/zh
Publication of CN106960214A publication Critical patent/CN106960214A/zh
Application granted granted Critical
Publication of CN106960214B publication Critical patent/CN106960214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Abstract

本发明提供一种基于图像的物体识别方法,包括:训练过程,其用于建立包括描述物体形状的第一特征向量的第一数据库和包括用于描述物体类别的第二特征向量的第二数据库;识别过程,包括:将图片输入到深度卷积神经网络中;在图片上生成至少一个候选框,对每个候选框对应的特征映射图进行池化处理以得到第三特征向量;将第三特征向量与第一数据库中的第一特征向量进行比对,计算两个向量之间的相关系数,在相关系数大于或等于特定阈值的情况下,将该第三特征向量所对应的候选框选定为有效候选框;将有效候选框中的图像输入到分类神经网络中以获取第四特征向量;基于第四特征向量、第二特征向量和第二数据库,执行k最近邻分类算法(KNN)以识别出物体的类别。

Description

基于图像的物体识别方法
技术领域
本发明涉及一种基于图像的物体识别方法。
背景技术
近些年来,深度卷积神经网络在物体识别,物体定位和图像分割领域已经取得了重大的进展。通过基于深度卷积神经网络的物体识别算法,在个别任务上,机器的识别准确率甚至已经超过了人类。
另外一些算法,在现有技术中公开的R-CNN算法、Faster R-CNN算法、YOLO(youonly look once)算法、SSD算法以及R-FCN算法在物体定位和图像分割领域也取得很大的成功,得到了较高的准确率。
然而这些方法普遍存在识别物体种类较少(20~80类),以及对于新的物体种类,需要大量带标签的训练集,花费大量时间重新训练神经网络,才能达到识别的效果。此外,绝大部分物体定位和识别算法缺乏对同类物品中不同个体的区分能力。
因此存在对如下的物体识别方法的需求,该方法无需重新训练神经网络,只需通过较为简单的步骤,即可识别新的物体。此外,该方法还需要具有识别精度高,定位准确,扩展性强,可快速扩展物体种类,区分物体个体差异强的特点。
发明内容
本发明的目的旨在解决现有技术中存在的上述问题和缺陷的至少一个方面。
在本发明的一个方面中,提供一种基于图像的物体识别方法,所述方法包括:
训练过程,所述训练过程用于建立第一数据库和第二数据库,所述第一数据库包括用于描述多个物体形状的第一特征向量,所述第二数据库包括用于描述多个物体类别的第二特征向量;以及
识别过程,所述识别过程包括如下的步骤:
S21:将包含物体的图片输入到深度卷积神经网络中;
S22:在图片上生成至少一个候选框,对至少一个候选框中的每个候选框对应的特征映射图进行池化处理以得到用于每个候选框的第三特征向量;
S23:将第三特征向量与第一数据库中的第一特征向量进行比对,计算两个向量之间的相关系数,在相关系数大于或等于特定阈值的情况下,将该第三特征向量所对应的候选框选定为有效候选框;
S24:将有效候选框中的图像输入到分类神经网络中以获取第四特征向量;
S25:基于第四特征向量、第二特征向量和第二数据库,执行k最近邻分类算法(KNN)以识别出物体的类别。
在根据本发明的一个优选实施例中,所述训练过程包括如下的步骤:
S11:以第一角度、第一距离和第一光照对至少一个物体进行拍摄以获取物体图片;
S12:将物体图片输入到深度卷积神经网络中以生成至少一个候选框;
S13:手动地确定物体在图片中的坐标并选取每个物体的目标候选框;
S14:对选取的目标候选框对应的图像进行池化处理,从而得到用于描述每个物体的第一特征向量,这些特征向量具有统一长度;
S15:将这些统一长度的第一特征向量存储至第一数据库;
S16:将目标候选框中的图像输入到分类神经网络中以获取描述每个物体的第二特征向量;
S17:将这些第二特征向量存储至第二数据库;
S18:以不同于第一角度、第一距离和第一光照的多个角度、多个距离和多个光照对至少一个物体进行拍摄以获取多个不同的图片:以及
S19:对多个不同的图片执行步骤S12-S18的处理,以在第一数据库中存储用于描述同一物体的多个第一特征向量,在第二数据库中存储用于描述同一物体的多个第二特征向量。
在根据本发明的一个优选实施例中,在步骤S21中使用的深度卷积神经网络是Faster-RCNN网络,在步骤S22中使用区域生成网络(Region Proposal Network)生成至少一个候选框,进行的池化处理是Region of Interest Pooling处理,以及在步骤S24中使用的分类神经网络是卷积神经网络(CNN)。
在根据本发明的一个优选实施例中,在步骤S12中使用的深度卷积神经网络是Fast-RCNN网络,在步骤S14中进行的池化处理是Region of Interest Pooling处理,以及在步骤S16中使用的分类神经网络是卷积神经网络(CNN)。
在根据本发明的一个优选实施例中,所述方法还包括如下的步骤:在步骤S23之后,执行非极大值抑制算法以进一步筛选有效候选框以将筛选出的有效候选框用在步骤S24中。
在根据本发明的一个优选实施例中,进行非极大值抑制所用的阈值位于0至0.6的范围内。
在根据本发明的一个优选实施例中,所述相关系数是欧式距离、余弦距离或皮尔森相关系数。
在根据本发明的一个优选实施例中,所述特定阈值位于0.5至1的范围之内。
在根据本发明的一个优选实施例中,CNN网络基于SqueezeNet模型、VGG模型和ResNet模型中的任一种。
在根据本发明的一个优选实施例中,k最近邻分类算法是基于投票委员会的k最近邻分类算法。
在根据本发明的物体识别方法中,在识别过程中,首先,通过深度卷积神经网络对图片中的候选框中的图像的特征进行提取,以得到第三特征向量,将该第三特征向量与第一特征向量进行对比,并计算相关系数,通过一阈值来过滤不匹配的目标框,例如从图片中去除表示不具有特定形状的候选框,例如表示图片的背景的候选框,从而初步地筛选出在其中包含了已知形状的物体的候选框,即,有效候选框(Bounding Box)。然后,将该有效候选框所对应的图像送入分类神经网络中以进一步得到候选框中的第四特征向量。最后基于第四特征向量和第二数据库(即,分类数据库)来执行第二级分类处理,从而对物体进行类别细分。在该识别过程中,通过初步筛选和第二级分类处理可以进行多级特征分类,从而提高分类和识别精度。
附图说明
图1是根据本发明的示例性实施例的一种物体识别方法的识别过程的流程图。
图2是是根据本发明的示例性实施例的一种物体识别方法的物体训练过程的流程图
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。下述参照附图对本发明实施方式的说明旨在对本发明的总体发明构思进行解释,而不应当理解为对本发明的一种限制。
另外,在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本披露实施例的全面理解。然而明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。
根据本发明的总的发明构思,本发明提供一种基于图像的物体识别方法,所述方法包括:训练过程以及识别过程。所述训练过程用于建立第一数据库和第二数据库,所述第一数据库包括用于描述多个物体形状的第一特征向量,所述第二数据库包括用于描述多个物体类别的第二特征向量。
如图1所示,所述识别过程包括如下的步骤:
S21:将包含物体的图片输入到深度卷积神经网络中;
S22:在图片上生成至少一个候选框,对至少一个候选框中的每个候选框对应的特征映射图进行池化处理以得到用于每个候选框的第三特征向量;
S23:将第三特征向量与第一数据库中的第一特征向量进行比对,计算两个向量之间的相关系数,在相关系数大于或等于特定阈值的情况下,将该第三特征向量所对应的候选框选定为有效候选框;
S24:将有效候选框中的图像输入到分类神经网络中以获取第四特征向量;
S25:基于第四特征向量、第二特征向量和第二数据库,执行k最近邻分类算法(KNN)以识别出物体的类别。
在根据本发明的物体识别方法中,同一物体在第一数据库中通过第一特征向量表示,以明确该物体的形状,在第二数据库中通过第二特征向量表示,以明确该物体的具体类别,例如在第一数据库中,某一第一特征向量表示杯子,那么在第二数据库中,某一第二特征向量可以表示具有某种颜色的杯子,归属于某用户的杯子等,因此多个第二特征向量可以表示不同颜色,归属于不同用户的杯子,但是应当理解具体的形状属性和类别属性可以根据实际需要而确定。
在根据本发明的物体识别方法中,在识别过程中,首先,通过深度卷积神经网络对图片中的候选框中的图像的特征进行提取,以得到第三特征向量,将该第三特征向量与第一特征向量进行对比,并计算相关系数,通过一阈值来过滤不匹配的目标框,例如从图片中去除表示不具有特定形状的候选框,例如表示图片的背景的候选框,从而初步地筛选出在其中包含了已知形状的物体的候选框,即,有效候选框(Bounding Box)。然后,将该有效候选框所对应的图像送入分类神经网络中以进一步得到候选框中的第四特征向量。最后基于第四特征向量和第二数据库(即,分类数据库)来执行第二级分类处理,从而对物体进行类别细分。在该识别过程中,通过初步筛选和第二级分类处理可以进行多级特征分类,从而提高分类和识别精度。
在本发明的一个示例性实施例中,该相关系数可以是欧式距离、余弦距离或皮尔森相关系数。如上仅仅列举出了相关系数的优选实施例,能够计算相关系数的所有计算方式均应落在本发明的保护范围之内。在本发明的优选实施例中,选用皮尔森相关系数,其计算公式如下:
相关系数的值域为-1到1,正数区间表示正相关,负数区间表示负相关,其绝对值越大表示相关程度越高。在根据本发明的物体识别方法中,对对比得到的相关系数设定一个阈值,低于该阈值的特征向量及其对应的Bounding Box将被过滤掉。在本发明的一个示例性实施例中,该阈值一般设定到0.5到1之间。
在对卷积神经网络(CNN)的普遍认知中,训练一个收敛且表现良好的网络需要大量良好的数据对网络进行大量迭代。基于Faster-RCNN的设计理念,训练所需的数据集要求标记出训练集图像中所有物体的详细Bounding Box信息以及分类信息。这一过程需要消耗大量的人力,且由于网络的复杂度高、迭代次数多的原因,Faster-RCNN的训练需要消耗大量的时间,在目前的硬件条件下,消耗的时间需要以天为单位。此外,受限于其设计理念和图像标注方式,Faster-RCNN仅仅能对物体的大类进行区分(例如,区分电脑和杯子等具有不同形状的大类),并不具备对物体进行区分描述的能力。可以总结为,Faster-RCNN的能力在于检索图像中特定形状的物体,但不能进行细分。
在本发明的一个示例性实施例中,由于认识到Faster-RCNN网络在识别特定形状的物体方面具有突出的能力,因此在步骤S21中使用的深度卷积神经网络是Faster-RCNN网络,以提取表示物体形状的第三特征向量,以更好地提取出在其中包含特定形状的物体的Bounding Box。在步骤S22中,通过Faster-RCNN中的区域生成网络(Region ProposalNetwork),根据图片的特征空间而生成相应数量的候选框,该网络的优点在本领域中是已知的,在此不再赘述。由于不同的候选框中的特征向量的长度可能不同,因此通过Regionof Interest Pooling处理,可以得到归一化长度的特征向量。由于卷积神经网络(CNN)可分类的物体种类多,并能达到相对理想的效果,该网络所具备的不仅仅是对原1000类物体进行分类的能力,而是具备对物体进行可区分性描述的能力。根据实际的测试结果表明,通过这种神经网络进行的物体描述,即CNN网络提取的物体图像特征,可以达到在同类物品中区别差异性个体(例如不同形状或颜色的杯子、桌子、书等等)的效果。因此,在步骤S24中,所述分类神经网络是卷积神经网络(CNN)。
考虑到当前的Faster-RCNN在训练过程中所耗费的时间之长,根据本发明的物体识别方法提出了如下的训练过程,如图2所示,所述训练过程包括:
S11:以第一角度、第一距离和第一光照对至少一个物体进行拍摄以获取物体图片;
S12:将物体图片输入到深度卷积神经网络中以生成至少一个候选框;
S13:手动地确定物体在图片中的坐标并选取每个物体的目标候选框并且;
S14:对选取的目标候选框对应的图像进行池化处理,从而得到用于描述每个物体的第一特征向量,这些特征向量具有统一长度;
S15:将这些统一长度的第一特征向量存储至第一数据库;
S16:将目标候选框中的图像输入到分类神经网络中以获取描述每个物体的第二特征向量;
S17:将这些第二特征向量存储至第二数据库;
S18:以不同于第一角度、第一距离和第一光照的多个角度、多个距离和多个光照对至少一个物体进行拍摄以获取多个不同的图片:以及
S19:对多个不同的图片执行步骤S12-S18的处理,以在第一数据库中存储用于描述同一物体的多个第一特征向量,在第二数据库中存储用于描述同一物体的多个第二特征向量。
因此,通过如上所述的根据本发明的物体训练过程,可以通过简单的步骤建立物体第一数据库(形状数据库)和第二数据库(分类数据库),并且在这些数据库中,物体特征的可扩展性很强,可以根据用户的需求灵活地设置,并且省去了重新训练神经网络的过程,节省了时间。
由于在训练过程中,手动地选取目标候选框,因此不需要使用区域生成网络(Region Proposal Network)来根据图片的特征空间而生成相应数量的候选框,并且考虑到Fast-RCNN网络识别特定形状的物体方面具有突出的能力,因此在步骤S12中使用的深度卷积神经网络是Fast-RCNN网络。但是,在步骤S14中进行的池化处理依旧是Region ofInterest Pooling处理,以及在步骤S16中使用的分类神经网络依旧是卷积神经网络(CNN)。具体的选择理由如上所述,在此不再赘述。
在步骤S23之后,即使通过相关系数的阈值过滤掉了一部分不匹配的候选框,但是同一个物体还是可能由多个候选框来标注,这些候选框之间存在一定的重叠,且每个候选框具有不同的置信值,因此在根据本发明的一个示例性实施例中,在步骤S23之后,执行非极大值抑制算法以进一步筛选有效候选框以将筛选出的有效候选框用在步骤S24中。在根据本发明的一个示例性实施例中,进行非极大值抑制所用的阈值位于0至0.6的范围内。
在根据本发明的一个示例性实施例中,CNN网络基于SqueezeNet模型、VGG模型和ResNet模型中的任一种。如上仅仅列举出了CNN所采用的分类模型的优选实施例,能够进行分类计算的模型均应落在本发明的保护范围之内。上述两种方案具有相同的特点。SqueezeNet模型和VGG模型的区别在于计算量具有一定的差距,故此对物体的描述能力有强弱之分。二者相较,SqueezeNet的计算量级更低,但相比于VGG描述能力相对较弱。在根据本发明的优选实施例中,考虑到计算速度的原因,选取更加经济合算的SqueezeNet模型。
对于k最近邻分类算法的选择可以采用传统的k最近邻分类算法,其中,传统KNN分类方法的做法是,将数据库中不同的类别形成一个特征空间,每个类别的特征向量单独形成一个独立的区域。当希望对表示某种物体的新得到的特征向量进行分类时,需计算新特征向量到每个类别的特征向量组成的区域的距离(设其距离为Dmin),当新特征向量到A类别的特征向量组成的区域的距离最小时,将该新特征向量所表述的物体归属于A类别。需要对Dmin进行衡量,为此需确定一个阈值,当Dmin大于该阈值时,分类结果将被舍弃,即认为新特征向量不属于原数据库中的任何一种类别。
但是,在数据库中类别较多或特征向量的描述性不够强时,利用基于投票委员会的k最近邻分类算法。在基于投票委员会的k最近邻分类算法,使用Pearson相关系数对特征向量与分类数据库中的所有特征向量进行比对,在得到若干组相关系数后,对每组中的相关系数进行排序。通常,在每组相关系数中,选取相关系数最高的T个值组成投票委员会,因此得到若干组投票委员会,并分别对每组中的T个值进行加权。加权方式可采用线性加权、指数加权、Sigmoid型加权等。
然后,对加权后的值进行归类相加,即把委员会中归属于同一类物体的T个相关系数进行求和得到一个加权和值。此外,设置两个阈值,第一个阈值称为差值阈值,即得分最高的类别的加权和值减去得分次高类别的加权和值的差须大于此阈值,将其设在0.3,但不排除其他值也是可行的。第二个阈值为决定阈值,即最高加权和值必须大于此门限,将其设在2,但不排除其他值也是可行的。当最高加权和值满足此上两个条件时,才认为分类结果真实有效。
本领域的技术人员可以理解,上面所描述的实施例都是示例性的,并且本领域的技术人员可以对其进行改进,各种实施例中所描述的结构在不发生结构或者原理方面的冲突的情况下可以进行自由组合。
虽然结合附图对本发明进行了说明,但是附图中公开的实施例旨在对本发明优选实施方式进行示例性说明,而不能理解为对本发明的一种限制。
虽然本总体发明构思的一些实施例已被显示和说明,本领域普通技术人员将理解,在不背离本总体发明构思的原则和精神的情况下,可对这些实施例做出改变,本发明的范围以权利要求和它们的等同物限定。
应注意,措词“包括”不排除其它元件或步骤,措词“一”或“一个”不排除多个。另外,权利要求的任何元件标号不应理解为限制本发明的范围。

Claims (10)

1.一种基于图像的物体识别方法,所述方法包括:
训练过程,所述训练过程用于建立第一数据库和第二数据库,所述第一数据库包括用于描述多个物体形状的第一特征向量,所述第二数据库包括用于描述多个物体类别的第二特征向量;以及
识别过程,所述识别过程包括如下的步骤:
S21:将包含物体的图片输入到深度卷积神经网络中;
S22:在图片上生成至少一个候选框,对至少一个候选框中的每个候选框对应的特征映射图进行池化处理以得到用于每个候选框的第三特征向量;
S23:将第三特征向量与第一数据库中的第一特征向量进行比对,计算两个向量之间的相关系数,在相关系数大于或等于特定阈值的情况下,将该第三特征向量所对应的候选框选定为有效候选框;
S24:将有效候选框中的图像输入到分类神经网络中以获取第四特征向量;
S25:基于第四特征向量、第二特征向量和第二数据库,执行k最近邻分类算法(KNN)以识别出物体的类别。
2.根据权利要求1所述的方法,其中,所述训练过程包括如下的步骤:
S11:以第一角度、第一距离和第一光照对至少一个物体进行拍摄以获取物体图片;
S12:将物体图片输入到深度卷积神经网络中以生成至少一个候选框;
S13:手动地确定物体在图片中的坐标并选取每个物体的目标候选框;
S14:对选取的目标候选框对应的图像进行池化处理,从而得到用于描述每个物体的第一特征向量,这些特征向量具有统一长度;
S15:将这些统一长度的第一特征向量存储至第一数据库;
S16:将目标候选框中的图像输入到分类神经网络中以获取描述每个物体的第二特征向量;
S17:将这些第二特征向量存储至第二数据库;
S18:以不同于第一角度、第一距离和第一光照的多个角度、多个距离和多个光照对至少一个物体进行拍摄以获取多个不同的图片:以及
S19:对多个不同的图片执行步骤S12-S18的处理,以在第一数据库中存储用于描述同一物体的多个第一特征向量,在第二数据库中存储用于描述同一物体的多个第二特征向量。
3.根据权利要求1所述的方法,其中,在步骤S21中使用的深度卷积神经网络是Faster-RCNN网络,在步骤S22中使用区域生成网络(Region Proposal Network)生成至少一个候选框,进行的池化处理是Region of Interest Pooling处理,以及在步骤S24中使用的分类神经网络是卷积神经网络(CNN)。
4.根据权利要求2所述的方法,其中,在步骤S12中使用的深度卷积神经网络是Fast-RCNN网络,在步骤S14中进行的池化处理是Region of Interest Pooling处理,以及在步骤S16中使用的分类神经网络是卷积神经网络(CNN)。
5.根据权利要求1所述的方法,还包括如下的步骤:在步骤S23之后,执行非极大值抑制算法以进一步筛选有效候选框以将筛选出的有效候选框用在步骤S24中。
6.根据权利要求5所述的方法,其中,其中进行非极大值抑制所用的阈值位于0至0.6的范围内。
7.根据权利要求1所述的方法,其中,所述相关系数是欧式距离、余弦距离或皮尔森相关系数。
8.根据权利要求1所述的方法,其中,所述特定阈值位于0.5至1的范围之内。
9.根据权利要求3或4所述的方法,其中,CNN网络基于SqueezeNet模型、VGG模型和ResNet模型中的任一种。
10.根据权利要求1所述的方法,其中,k最近邻分类算法是基于投票委员会的k最近邻分类算法。
CN201710088343.1A 2017-02-17 2017-02-17 基于图像的物体识别方法 Active CN106960214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710088343.1A CN106960214B (zh) 2017-02-17 2017-02-17 基于图像的物体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710088343.1A CN106960214B (zh) 2017-02-17 2017-02-17 基于图像的物体识别方法

Publications (2)

Publication Number Publication Date
CN106960214A true CN106960214A (zh) 2017-07-18
CN106960214B CN106960214B (zh) 2020-11-20

Family

ID=59481547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710088343.1A Active CN106960214B (zh) 2017-02-17 2017-02-17 基于图像的物体识别方法

Country Status (1)

Country Link
CN (1) CN106960214B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107481327A (zh) * 2017-09-08 2017-12-15 腾讯科技(深圳)有限公司 关于增强现实场景的处理方法、装置、终端设备及系统
CN107633529A (zh) * 2017-09-11 2018-01-26 中国地质大学(武汉) 一种深度卷积神经网单目标跟踪方法、设备及存储设备
CN107679483A (zh) * 2017-09-27 2018-02-09 北京小米移动软件有限公司 号牌识别方法及装置
CN108156519A (zh) * 2017-12-25 2018-06-12 深圳Tcl新技术有限公司 图像分类方法、电视设备及计算机可读存储介质
CN108269371A (zh) * 2017-09-27 2018-07-10 缤果可为(北京)科技有限公司 商品自动结算方法、装置、自助收银台
CN108268869A (zh) * 2018-02-13 2018-07-10 北京旷视科技有限公司 目标检测方法、装置及系统
CN108320404A (zh) * 2017-09-27 2018-07-24 缤果可为(北京)科技有限公司 基于神经网络的商品识别方法、装置、自助收银台
CN109359207A (zh) * 2018-12-24 2019-02-19 焦点科技股份有限公司 一种易于快速迭代更新的Logo检测方法
CN109508630A (zh) * 2018-09-27 2019-03-22 杭州朗澈科技有限公司 一种基于人工智能识别水尺水位的方法
CN109583421A (zh) * 2018-12-17 2019-04-05 中国科学院深圳先进技术研究院 人脸识别系统及方法
CN109753983A (zh) * 2017-11-07 2019-05-14 北京京东尚科信息技术有限公司 图像分类方法、装置和计算机可读存储介质
CN109766928A (zh) * 2018-12-21 2019-05-17 创新奇智(重庆)科技有限公司 一种基于图像的物体分类方法、系统和电子设备
CN109782368A (zh) * 2017-11-10 2019-05-21 富士通株式会社 物品检测方法和装置
CN110209865A (zh) * 2019-05-24 2019-09-06 广州市云家居云科技有限公司 一种基于深度学习的物体识别及匹配方法
CN110335265A (zh) * 2019-07-03 2019-10-15 金钱猫科技股份有限公司 一种基于人工智能图像识别的网络见证管理方法及装置
CN110570389A (zh) * 2018-09-18 2019-12-13 阿里巴巴集团控股有限公司 车辆损伤识别方法及装置
CN111024147A (zh) * 2019-12-26 2020-04-17 玳能科技(杭州)有限公司 基于CNNs的元件安装检测方法、装置、电子设备及存储介质
CN111127520A (zh) * 2019-12-26 2020-05-08 华中科技大学 一种基于视频分析的车辆跟踪方法和系统
WO2020134411A1 (zh) * 2018-12-29 2020-07-02 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
CN111507164A (zh) * 2019-01-30 2020-08-07 斯特拉德视觉公司 实时更新可检测类的类别的对象检测系统的方法和设备
CN111680733A (zh) * 2020-06-01 2020-09-18 北京建工资源循环利用投资有限公司 组分检测、样本库建立方法、装置、平台、系统及介质
WO2020215565A1 (zh) * 2019-04-26 2020-10-29 平安科技(深圳)有限公司 手部图像的分割方法、装置及计算机设备
CN111931557A (zh) * 2020-06-19 2020-11-13 广州图匠数据科技有限公司 瓶装饮品的规格识别方法、装置、终端设备及可读存介质
CN112200180A (zh) * 2019-07-08 2021-01-08 青岛海尔智能技术研发有限公司 用于瓶体检测分类的方法、装置及瓶体柜
CN111931557B (zh) * 2020-06-19 2024-05-10 广州图匠数据科技有限公司 瓶装饮品的规格识别方法、装置、终端设备及可读存介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306303A (zh) * 2011-09-16 2012-01-04 北京工业大学 一种基于小训练样本的脑电信号特征提取方法
CN102779267A (zh) * 2011-05-12 2012-11-14 株式会社理光 检测图像中特定对象区域的方法和设备
CN104504055A (zh) * 2014-12-19 2015-04-08 常州飞寻视讯信息科技有限公司 基于图像相似度的商品相似计算方法及商品推荐系统
CN105139013A (zh) * 2015-07-08 2015-12-09 河南科技大学 一种融合形状特征和兴趣点的物体识别方法
WO2016114960A1 (en) * 2015-01-12 2016-07-21 Ebay Inc. Joint-based item recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779267A (zh) * 2011-05-12 2012-11-14 株式会社理光 检测图像中特定对象区域的方法和设备
CN102306303A (zh) * 2011-09-16 2012-01-04 北京工业大学 一种基于小训练样本的脑电信号特征提取方法
CN104504055A (zh) * 2014-12-19 2015-04-08 常州飞寻视讯信息科技有限公司 基于图像相似度的商品相似计算方法及商品推荐系统
WO2016114960A1 (en) * 2015-01-12 2016-07-21 Ebay Inc. Joint-based item recognition
CN105139013A (zh) * 2015-07-08 2015-12-09 河南科技大学 一种融合形状特征和兴趣点的物体识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙俊: ""基于卷积神经网络的电商图片物体识别"", 《万方》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107481327A (zh) * 2017-09-08 2017-12-15 腾讯科技(深圳)有限公司 关于增强现实场景的处理方法、装置、终端设备及系统
CN107633529A (zh) * 2017-09-11 2018-01-26 中国地质大学(武汉) 一种深度卷积神经网单目标跟踪方法、设备及存储设备
CN107679483A (zh) * 2017-09-27 2018-02-09 北京小米移动软件有限公司 号牌识别方法及装置
CN108269371A (zh) * 2017-09-27 2018-07-10 缤果可为(北京)科技有限公司 商品自动结算方法、装置、自助收银台
CN108320404A (zh) * 2017-09-27 2018-07-24 缤果可为(北京)科技有限公司 基于神经网络的商品识别方法、装置、自助收银台
CN109753983A (zh) * 2017-11-07 2019-05-14 北京京东尚科信息技术有限公司 图像分类方法、装置和计算机可读存储介质
CN109782368A (zh) * 2017-11-10 2019-05-21 富士通株式会社 物品检测方法和装置
CN108156519A (zh) * 2017-12-25 2018-06-12 深圳Tcl新技术有限公司 图像分类方法、电视设备及计算机可读存储介质
CN108156519B (zh) * 2017-12-25 2020-12-11 深圳Tcl新技术有限公司 图像分类方法、电视设备及计算机可读存储介质
CN108268869A (zh) * 2018-02-13 2018-07-10 北京旷视科技有限公司 目标检测方法、装置及系统
CN108268869B (zh) * 2018-02-13 2021-11-16 北京旷视科技有限公司 目标检测方法、装置及系统
CN110570389A (zh) * 2018-09-18 2019-12-13 阿里巴巴集团控股有限公司 车辆损伤识别方法及装置
CN109508630A (zh) * 2018-09-27 2019-03-22 杭州朗澈科技有限公司 一种基于人工智能识别水尺水位的方法
CN109583421A (zh) * 2018-12-17 2019-04-05 中国科学院深圳先进技术研究院 人脸识别系统及方法
CN109766928A (zh) * 2018-12-21 2019-05-17 创新奇智(重庆)科技有限公司 一种基于图像的物体分类方法、系统和电子设备
CN109766928B (zh) * 2018-12-21 2020-04-17 创新奇智(重庆)科技有限公司 一种基于图像的物体分类方法、系统和电子设备
CN109359207B (zh) * 2018-12-24 2021-01-22 焦点科技股份有限公司 一种易于快速迭代更新的Logo检测方法
CN109359207A (zh) * 2018-12-24 2019-02-19 焦点科技股份有限公司 一种易于快速迭代更新的Logo检测方法
CN111382635B (zh) * 2018-12-29 2023-10-13 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
WO2020134411A1 (zh) * 2018-12-29 2020-07-02 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
CN111382635A (zh) * 2018-12-29 2020-07-07 杭州海康威视数字技术股份有限公司 一种商品类别识别方法、装置及电子设备
CN111507164A (zh) * 2019-01-30 2020-08-07 斯特拉德视觉公司 实时更新可检测类的类别的对象检测系统的方法和设备
CN111507164B (zh) * 2019-01-30 2023-11-07 斯特拉德视觉公司 实时更新可检测类的类别的对象检测系统的方法和设备
WO2020215565A1 (zh) * 2019-04-26 2020-10-29 平安科技(深圳)有限公司 手部图像的分割方法、装置及计算机设备
CN110209865B (zh) * 2019-05-24 2023-05-16 广州市云家居云科技有限公司 一种基于深度学习的物体识别及匹配方法
CN110209865A (zh) * 2019-05-24 2019-09-06 广州市云家居云科技有限公司 一种基于深度学习的物体识别及匹配方法
CN110335265A (zh) * 2019-07-03 2019-10-15 金钱猫科技股份有限公司 一种基于人工智能图像识别的网络见证管理方法及装置
CN112200180B (zh) * 2019-07-08 2023-11-21 青岛海尔智能技术研发有限公司 用于瓶体检测分类的方法、装置及瓶体柜
CN112200180A (zh) * 2019-07-08 2021-01-08 青岛海尔智能技术研发有限公司 用于瓶体检测分类的方法、装置及瓶体柜
CN111024147A (zh) * 2019-12-26 2020-04-17 玳能科技(杭州)有限公司 基于CNNs的元件安装检测方法、装置、电子设备及存储介质
CN111127520B (zh) * 2019-12-26 2022-06-14 华中科技大学 一种基于视频分析的车辆跟踪方法和系统
CN111127520A (zh) * 2019-12-26 2020-05-08 华中科技大学 一种基于视频分析的车辆跟踪方法和系统
CN111680733A (zh) * 2020-06-01 2020-09-18 北京建工资源循环利用投资有限公司 组分检测、样本库建立方法、装置、平台、系统及介质
CN111931557A (zh) * 2020-06-19 2020-11-13 广州图匠数据科技有限公司 瓶装饮品的规格识别方法、装置、终端设备及可读存介质
CN111931557B (zh) * 2020-06-19 2024-05-10 广州图匠数据科技有限公司 瓶装饮品的规格识别方法、装置、终端设备及可读存介质

Also Published As

Publication number Publication date
CN106960214B (zh) 2020-11-20

Similar Documents

Publication Publication Date Title
CN106960214A (zh) 基于图像的物体识别方法
CN105574505B (zh) 一种多摄像机间人体目标再识别的方法及系统
RU2648946C2 (ru) Способ и устройство распознавания категории объекта изображения
CN106886795A (zh) 基于图像中的显著物体的物体识别方法
CN110210555A (zh) 基于深度学习的钢轨鱼鳞伤损检测方法
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN112308158A (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN106897390A (zh) 基于深度度量学习的目标精确检索方法
CN104463128B (zh) 用于人脸识别的眼镜检测方法及系统
CN107392919B (zh) 基于自适应遗传算法的灰度阈值获取方法、图像分割方法
CN109101938B (zh) 一种基于卷积神经网络的多标签年龄估计方法
CN107341499A (zh) 一种基于无监督分割和elm的织物缺陷检测和分类方法
CN109858466A (zh) 一种基于卷积神经网络的人脸关键点检测方法及装置
CN110097060B (zh) 一种面向树干图像的开集识别方法
CN114841257B (zh) 一种基于自监督对比约束下的小样本目标检测方法
CN103544499B (zh) 一种基于机器视觉的表面瑕疵检测的纹理特征降维方法
CN106845528A (zh) 一种基于K‑means与深度学习的图像分类算法
CN105469080B (zh) 一种人脸表情识别方法
CN105931241B (zh) 一种自然场景图像的自动标注方法
CN109993100A (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN104834941A (zh) 基于计算机输入下的稀疏自编码的脱机手写体识别方法
CN104809469A (zh) 一种面向服务机器人的室内场景图像分类方法
CN109766935A (zh) 一种基于超图p-Laplacian图卷积神经网络的半监督分类方法
CN109871892A (zh) 一种基于小样本度量学习的机器人视觉认知系统
CN113743470B (zh) 自动破袋分类箱基于ai算法垃圾识别精度提升方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210818

Address after: 100016 room 2027, 2 / F, building 5, yard 5, Jiangtai Road, Chaoyang District, Beijing

Patentee after: Beijing yiyixian Education Technology Co.,Ltd.

Address before: 100086 16L, block B, building 1, Beijing Science and Technology Exhibition Center, No.48, North Third Ring Road West, Haidian District, Beijing

Patentee before: BEIJING EWAYBOT TECHNOLOGY LLC