CN109871891A - 一种物体识别方法、装置和存储介质 - Google Patents

一种物体识别方法、装置和存储介质 Download PDF

Info

Publication number
CN109871891A
CN109871891A CN201910112039.5A CN201910112039A CN109871891A CN 109871891 A CN109871891 A CN 109871891A CN 201910112039 A CN201910112039 A CN 201910112039A CN 109871891 A CN109871891 A CN 109871891A
Authority
CN
China
Prior art keywords
image
cluster
file
image file
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910112039.5A
Other languages
English (en)
Other versions
CN109871891B (zh
Inventor
陈海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenlan Robot Industry Development Henan Co ltd
Original Assignee
Deep Blue Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deep Blue Technology Shanghai Co Ltd filed Critical Deep Blue Technology Shanghai Co Ltd
Priority to CN201910112039.5A priority Critical patent/CN109871891B/zh
Publication of CN109871891A publication Critical patent/CN109871891A/zh
Application granted granted Critical
Publication of CN109871891B publication Critical patent/CN109871891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种物体识别方法、装置和存储介质,用以降低模型训练的时间复杂度,提高物体识别技术的灵活性。物体识别方法,包括:利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,其中,所述形态识别模型为利用带有标注的样本图像进行训练得到的;从所述形态图像中提取若干图像特征得到图像特征集合;从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,其中,所述图像特征文件中包含的图像特征为利用残差神经网络从所述样本图像中提取的;根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。

Description

一种物体识别方法、装置和存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种物体识别方法、装置和存储介质。
背景技术
图像识别技术是人工智能的一个重要领域,其以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。图像识别中的模式识别(PatternRecognition),是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别、评价的过程。模式识别包括两个阶段,即学习阶段和实现阶段,前者是对样本进行特征选择,寻找分类的规律,后者是根据分类规律对未知样本集进行分类和识别。
随着图像识别技术的发展,利用图像识别技术对物体进行识别将得到物体信息录入计算机中存储是图像识别技术的主要应用之一。但是在对物体图像进行识别的过程中,需要针对不同类别物体分别训练识别模型,既增加了模型训练的时间复杂度,而且由于不同类型的模型只能应用于其对应类别的物体识别,降低了物体识别技术的灵活性。
发明内容
本发明实施例提供一种图像识别方法、装置和存储介质,用以降低模型训练的时间复杂度,提高物体识别技术的灵活性。
第一方面,提供一种物体识别方法,包括:
利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,其中,所述形态识别模型为利用带有标注的样本图像进行训练得到的;
从所述形态图像中提取若干图像特征得到图像特征集合;
从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,其中,所述图像特征文件中包含的图像特征为利用残差神经网络从所述样本图像中提取的;
根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
在一个实施例中,采用K维树结构存储所述图像特征文件,其中,K为正整数;以及
按照以下流程获得所述K维树结构:
在第一次聚类时,利用聚类算法将所述图像特征文件划分为K类;以及
当K大于1时,在第K次聚类时,针对第K-1次迭代得到的每一聚类,利用聚类算法将每一聚类中包含的图像特征文件划分为K个子类;以及
将该聚类作为父节点存储,将该聚类对应的子类作为该聚类的子节点存储。
在一个实施例中,利用聚类算法将每一聚类中包含的图像特征文件划分为K类,具体包括:
针对每一聚类中心包含的图像特征文件,从所述图像特征文件中随机选择K个图像特征文件作为初始聚类中心;
在第K次迭代过程中,针对任一图像特征文件,分别确定该图像特征文件到K个聚类中心的距离;以及
确定该图像特征文件归属于距离最近的中心所在的聚类;
更新该聚类的中心后执行下一次迭代,直至该聚类的中心达到稳定状态。
在一个实施例中,按照以下方法判断该聚类的中心是否达到稳定状态:
确定本次聚类的中心点,判断本次聚类的中心点与上一次迭代后得到的聚类中心点之间的差值是否不大于预设阈值;
如果是,确定该聚类的中心达到稳定状态;
如果否,确定该聚类的中心未达到稳定状态。
在一个实施例中,从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,具体包括:
针对初次迭代得到的每一类图像特征文件,分别确定该类图像特征文件与所述图像特征集合之间的距离;
根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类;
分别确定所述目标图像特征文件聚类中包含的每一类图像特征文件与所述图像特征集合之间的距离,并返回执行根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类的步骤,直至从最后一次迭代得到的图像特征文件聚类中选择出目标图像特征文件聚类;
确定所述目标图像特征文件聚类为与所述图像特征集合中包含的图像特征匹配的图像特征文件。
在一个实施例中,针对聚类得到的每一类图像特征文件,按照以下方法确定该类图像特征文件与所述图像特征集合之间的距离:
分别确定该类图像特征文件的中心点和所述图像特征集合的中心点;
确定该类图像特征文件的中心点与所述图像特征集合的中心点之间的距离为该类图像特征文件与所述图像特征集合之间的距离。
第二方面,提供一种物体识别装置,包括:
形态识别单元,用于利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,其中,所述形态识别模型为利用带有标注的样本图像进行训练得到的;
特征提取单元,用于从所述形态图像中提取若干图像特征得到图像特征集合;
查找单元,从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,其中,所述图像特征文件中包含的图像特征为利用残差神经网络从所述样本图像中提取的;
确定单元,用于根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
在一个实施例中,采用K维树结构存储所述图像特征文件,其中,K为正整数;以及
所述装置,还包括:
聚类单元,用于在第一次聚类时,利用聚类算法将所述图像特征文件划分为K类;以及当K大于1时,在第K次聚类时,针对第K-1次迭代得到的每一聚类,利用聚类算法将每一聚类中包含的图像特征文件划分为K子类;
存储单元,用于将该聚类作为父节点存储,将该聚类对应的子类作为该聚类的子节点存储。
在一个实施例中,所述聚类单元,具体用于针对每一聚类中心包含的图像特征文件,从所述图像特征文件中随机选择K个图像特征文件作为初始聚类中心;在第K次迭代过程中,针对任一图像特征文件,分别确定该图像特征文件到K个聚类中心的距离;以及确定该图像特征文件归属于距离最近的中心所在的聚类;更新该聚类的中心后执行下一次迭代,直至该聚类的中心达到稳定状态。
在一个实施例中,所述聚类单元,具体用于按照以下方法判断该聚类的中心是否达到稳定状态:确定本次聚类的中心点,判断本次聚类的中心点与上一次迭代后得到的聚类中心点之间的差值是否不大于预设阈值;如果是,确定该聚类的中心达到稳定状态;如果否,确定该聚类的中心未达到稳定状态。
在一个实施例中,所述查找单元,具体用于针对初次迭代得到的每一类图像特征文件,分别确定该类图像特征文件与所述图像特征集合之间的距离;根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类;分别确定所述目标图像特征文件聚类中包含的每一类图像特征文件与所述图像特征集合之间的距离,并返回执行根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类的步骤,直至从最后一次迭代得到的图像特征文件聚类中选择出目标图像特征文件聚类;确定所述目标图像特征文件聚类为与所述图像特征集合中包含的图像特征匹配的图像特征文件。
在一个实施例中,所述查找单元,具体用于按照以下方法确定该类图像特征文件与所述图像特征集合之间的距离:分别确定该类图像特征文件的中心点和所述图像特征集合的中心点;确定该类图像特征文件的中心点与所述图像特征集合的中心点之间的距离为该类图像特征文件与所述图像特征集合之间的距离。
第三方面,提供一种计算装置,包括至少一个处理器、以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述物体识别方法所述的任一步骤。
第四方面,提供一种计算机可读介质,其存储有可由计算装置执行的计算机程序,当所述程序在计算装置上运行时,使得所述计算装置执行上述物体识别方法所述的任一步骤。
本发明实施例提供的物体识别方法、装置和存储介质,针对不同类别的物体训练一个通用的形态识别模型,利用该形态识别模型识别待识别物体的形态图像,之后从形态图像中提取图像特征与数据库中预先存储的图像特征进行匹配,并将匹配到的图像特征对应的类别确定待识别物体的类别,上述过程中,由于无需针对每一类别物体分别训练相应的识别模型,从而降低了模型训练的时间复杂度,另一发面,对于从不同类型物体图像中提取的图像特征分别存储为图像文件,使得后续应用过程中可以对不同的图像特征进行任意组合,提高了物体识别的灵活性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1a为本发明实施例中,第一种收集的样本图像示意图;
图1b为本发明实施例中,第二种收集的样本图像示意图;
图2为本发明实施例中,物体识别方法的实施流程示意图;
图3为本发明实施例中,K维树的立体结构示意图;
图4为本发明实施例中,获得K维树结构的流程示意图;
图5为本发明实施例中,其为K维树的树形存储结构示意图;
图6为本发明实施例中,将聚类中包含的图像特征文件划分为K类的流程示意图;
图7为本发明实施例中,查找与提取的图像特征集合匹配的图像特征文件的流程示意图;
图8为本发明实施例中,物体识别装置的结构示意图;
图9为本发明实施例中,计算装置的结构示意图。
具体实施方式
为了降低物体识别过程中模型训练的复杂度,提高物体识别的灵活性,本发明实施例提供了一种物体识别方法、装置和存储介质。
本发明实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明实施例中,为了降低物体识别过程中模型训练的时间复杂度,通过对不同类别物体图像进行训练,得到通用的形态识别模型。具体地,可以收集若干物体的图像作为样本图像,具体实施时,每一物体需要收集其不同角度拍摄的图像并进行标注,例如,可以收集1000个物体图像,对于每一物体收集3000张带有标注的图像,分别如图1a和图1b所示,其为收集的样本图像示意图。
具体实施时,可以采用RefineDET(改进的单路目标检测算法)对样本图像进行训练,当然也可以采用SSD(单路目标检测算法)对样本图像进行训练,相比于SSD,RefineDET具有更好的检测精度。在形态识别模型进行训练时,检测的目标可以设置为一个类别,例如,商品类,即所有的商品归为一个类型,通过RefineDET可以训练得到一个通用的形态识别模型。其中,商品的形态可以为商品的形状,例如,瓶装饮料和罐装饮料,两者属于不同的形态。
具体实施时,还需要训练一个特征提取模型用于从形态图像中提取能够表征待识别物体的图像特征。本发明实施例中,可以利用ResNet18(具有18个卷积单元的残差神经网络模型)对收集的样本图像进行训练得到特征提取模型,训练得到的特征提取模型具有强有力的特征提取器,用于提取待识别物体的图像特征。
本发明实施例中,为了提高物体识别的灵活性,针对从样本图像中提取的图像特征分别存储为一个文件,这样,在后续的物体识别过程中,不同的图像特征文件可以灵活组合进行识别。
基于上述训练得到的形态识别模型和特征提取模型,本发明实施例提供了一种物体识别方法,如图2所示,可以包括以下步骤:
S21、利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像。
具体实施时,本发明实施例提供的物体识别方法可以由安装于终端设备中的物体识别客户端实施,在需要对物体进行识别时,物体识别客户端调用终端设备的摄像头采集待识别物体图像,针对采集的待识别物体图像,利用预先训练的形态识别模型从中识别待识别物体的形态图像。
S22、从形态图像中提取若干图像特征得到图像特征集合。
本步骤中,利用训练得到的特征提取模型从识别出的形态图像中提取若干的图像特征得到的图像特征集合,具体实施时,提取特征的数量可以根据实际需要进行设置,本发明实施例对此不进行限定。例如,可以提取200个图像特征。
S23、从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件。
其中,图像特征文件中包含的图像特征为利用残差神经网络对样本图像进行训练得到的。
S24、根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
具体实施时,在步骤S23中,由于存储的图像特征文件较多,以一个样本图像中提取200个特征为例,则1000个样本图像,需要存储的图像特征文件为200*1000个,这样,在步骤S23中从图像特征文件中匹配相应的图像特征文件时,需要耗费较长时间,为了减少查找时间,提高查找效率,本发明实施例中,可以采用K维树结构存储从样本图像中提取的图像特征。如图3所示,其为K维树的立体结构示意图,K维树是通过把空间点进行区域划分,快速维护有关空间点的操作。对于物体识别,一个空间点即是提取的一个图像特征,本例中,其对应一个图像特征文件,通过对特征在高维空间进行划分后,实现快速的查找操作。
具体实施时,可以按照图4所示的流程获得K维树结构,包括以下步骤:
S41、在第一次聚类时,利用聚类算法将图像特征文件划分为K类。
具体实施时,可以采用K-means算法将图像特征文件划分为K类。具体地,对于图像特征集合A=[x1,x2,……xi],通过第一次k-means聚类,得到K个聚类中心,假设分别为C=[c1,c2,……ck]。
S42、当K大于1时,在第K次聚类时,针对第K-1次迭代得到的每一聚类,利用聚类算法将每一聚类中包含的图像特征文件划分为K个子类。
以第2次聚类为例,在1次聚类的基础上,对C个聚类中心分类得到的K个子类分别再进行一次聚类,每一子类划分为10个子类,依次类推,共进行K轮聚类。
S43、将该聚类作为父节点存储,将该聚类对应的子类作为该聚类的子节点存储。
针对得到的每一聚类,将该聚类作为父节点,将对该聚类进一步划分得到的K个子类作为该聚类的子节点进行存储。如图5所示,其为K维树的树形存储结构示意图。
具体实施时,针对每一聚类,可以按照以下流程将该聚类中包含的图像特征文件划分为K类,如图6所示,可以包括以下步骤:
S61、针对每一聚类中心包含的图像特征文件,从所述图像特征文件中随机选择K个图像特征文件作为初始聚类中心。
S62、在第K次迭代过程中,针对任一图像特征文件,分别确定该图像特征文件到K个聚类中心的距离。
S63、确定该图像特征文件归属于距离最近的中心所在的聚类。
S64、更新该聚类的中心后执行下一次迭代,直至该聚类的中心达到稳定状态。
具体实施时,可以按照以下方法判断该聚类的中心是否达到稳定状态:
确定本次聚类的中心点,判断本次聚类的中心点与上一次迭代后得到的聚类中心点之间的差值是否不大于预设阈值;如果是,确定该聚类的中心达到稳定状态;如果否,确定该聚类的中心未达到稳定状态。
需要说明的是,具体实施时,为了便于终端设备进行处理,可以将图像特征转换为特征向量后进行计算。
基于上述的存储结构,步骤S23中,可以按照以下流程查找与提取的图像特征集合匹配的图像特征文件,如图7所示,包括以下步骤:
S71、针对初次迭代得到的每一类图像特征文件,分别确定该类图像特征文件与所述图像特征集合之间的距离。
具体实施时,针对聚类得到的每一类图像特征文件,按照以下方法确定该类图像特征文件与所述图像特征集合之间的距离:分别确定该类图像特征文件的中心点和所述图像特征集合的中心点;确定该类图像特征文件的中心点与所述图像特征集合的中心点之间的距离为该类图像特征文件与所述图像特征集合之间的距离。
S72、根据确定出的距离,确定与图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类。
具体地,对于图5所示的树形结构中第一层的K个中心点查找最小距离节点N。
S73、分别确定目标图像特征文件聚类中包含的每一类图像特征文件与图像特征集合之间的距离。
S74、判断是否到达最后一次迭代得到的图像文件聚类,如果是,执行步骤S75,否则,执行步骤S72。
具体实施时,经过步骤S73和步骤S72的多次迭代,可以对目标图像特征文件聚类进行更新。
S75、确定目标图像特征文件聚类为与图像特征集合中包含的图像特征匹配的图像特征文件。
本例中,即对N节点查找其子节点中最小距离中心M,最后再到M子集中找到距离最小的样本序列S,直至到达叶子节点为止,即可找到与提取的待识别物体的图像特征集合匹配的类别,基于K维树的实现,检索时间消耗指数级降低,对于10000个样本,只需要比较120次即可完成检索。
本发明实施例提供的物体识别方法,针对不同类别的物体训练一个通用的形态识别模型,利用该形态识别模型识别待识别物体的形态图像,之后从形态图像中提取图像特征与数据库中预先存储的图像特征进行匹配,并将匹配到的图像特征对应的类别确定待识别物体的类别,上述过程中,由于无需针对每一类别物体分别训练相应的识别模型,从而降低了模型训练的时间复杂度,另一发面,对于从不同类型物体图像中提取的图像特征分别存储为图像文件,使得后续应用过程中可以对不同的图像特征进行任意组合,提高了物体识别的灵活性。
基于同一发明构思,本发明实施例中还提供了一种物体识别装置,由于上述装置解决问题的原理与物体识别方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图8所示,其为本发明实施例提供的物体识别装置的结构示意图,包括:
形态识别单元81,用于利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,其中,所述形态识别模型为利用带有标注的样本图像进行训练得到的;
特征提取单元82,用于从所述形态图像中提取若干图像特征得到图像特征集合;
查找单元83,从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,其中,所述图像特征文件中包含的图像特征为利用残差神经网络从所述样本图像中提取的;
确定单元84,用于根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
在一个实施例中,采用K维树结构存储所述图像特征文件,其中,K为正整数;以及
所述装置,还包括:
聚类单元,用于在第一次聚类时,利用聚类算法将所述图像特征文件划分为K类;以及当K大于1时,在第K次聚类时,针对第K-1次迭代得到的每一聚类,利用聚类算法将每一聚类中包含的图像特征文件划分为K子类;
存储单元,用于将该聚类作为父节点存储,将该聚类对应的子类作为该聚类的子节点存储。
在一个实施例中,所述聚类单元,具体用于针对每一聚类中心包含的图像特征文件,从所述图像特征文件中随机选择K个图像特征文件作为初始聚类中心;在第K次迭代过程中,针对任一图像特征文件,分别确定该图像特征文件到K个聚类中心的距离;以及确定该图像特征文件归属于距离最近的中心所在的聚类;更新该聚类的中心后执行下一次迭代,直至该聚类的中心达到稳定状态。
在一个实施例中,所述聚类单元,具体用于按照以下方法判断该聚类的中心是否达到稳定状态:确定本次聚类的中心点,判断本次聚类的中心点与上一次迭代后得到的聚类中心点之间的差值是否不大于预设阈值;如果是,确定该聚类的中心达到稳定状态;如果否,确定该聚类的中心未达到稳定状态。
在一个实施例中,所述查找单元,具体用于针对初次迭代得到的每一类图像特征文件,分别确定该类图像特征文件与所述图像特征集合之间的距离;根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类;分别确定所述目标图像特征文件聚类中包含的每一类图像特征文件与所述图像特征集合之间的距离,并返回执行根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类的步骤,直至从最后一次迭代得到的图像特征文件聚类中选择出目标图像特征文件聚类;确定所述目标图像特征文件聚类为与所述图像特征集合中包含的图像特征匹配的图像特征文件。
在一个实施例中,所述查找单元,具体用于按照以下方法确定该类图像特征文件与所述图像特征集合之间的距离:分别确定该类图像特征文件的中心点和所述图像特征集合的中心点;确定该类图像特征文件的中心点与所述图像特征集合的中心点之间的距离为该类图像特征文件与所述图像特征集合之间的距离。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本发明示例性实施方式的物体识别方法和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述描述的根据本发明各种示例性实施方式的物体识别方法中的步骤。例如,所述处理器可以执行如图2中所示的步骤S21、利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,和步骤S22、从形态图像中提取若干图像特征得到图像特征集合;以及步骤S23、从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件;步骤S24、根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
下面参照图9来描述根据本发明的这种实施方式的计算装置90。图9显示的计算装置90仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算装置90以通用计算设备的形式表现。计算装置90的组件可以包括但不限于:上述至少一个处理器91、上述至少一个存储器92、连接不同系统组件(包括存储器92和处理器91)的总线93。
总线93表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器92可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还可以包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置90也可以与一个或多个外部设备94(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置90交互的设备通信,和/或与使得该计算装置90能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,计算装置90还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器96通过总线93与用于计算装置90的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置90使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本发明提供的物体识别方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的物体识别方法中的步骤,例如,所述计算机设备可以执行如图2中所示的步骤S21、利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,和步骤S22、从形态图像中提取若干图像特征得到图像特征集合;以及步骤S23、从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件;步骤S24、根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的用于物体识别的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种物体识别方法,其特征在于,包括:
利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,其中,所述形态识别模型为利用带有标注的样本图像进行训练得到的;
从所述形态图像中提取若干图像特征得到图像特征集合;
从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,其中,所述图像特征文件中包含的图像特征为利用残差神经网络从所述样本图像中提取的;
根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
2.如权利要求1所述的方法,其特征在于,采用K维树结构存储所述图像特征文件,其中,K为正整数;以及
按照以下流程获得所述K维树结构:
在第一次聚类时,利用聚类算法将所述图像特征文件划分为K类;以及
当K大于1时,在第K次聚类时,针对第K-1次迭代得到的每一聚类,利用聚类算法将每一聚类中包含的图像特征文件划分为K个子类;以及
将该聚类作为父节点存储,将该聚类对应的子类作为该聚类的子节点存储。
3.如权利要求2所述的方法,其特征在于,利用聚类算法将每一聚类中包含的图像特征文件划分为K类,具体包括:
针对每一聚类中心包含的图像特征文件,从所述图像特征文件中随机选择K个图像特征文件作为初始聚类中心;
在第K次迭代过程中,针对任一图像特征文件,分别确定该图像特征文件到K个聚类中心的距离;以及
确定该图像特征文件归属于距离最近的中心所在的聚类;
更新该聚类的中心后执行下一次迭代,直至该聚类的中心达到稳定状态。
4.如权利要求3所述的方法,其特征在于,按照以下方法判断该聚类的中心是否达到稳定状态:
确定本次聚类的中心点,判断本次聚类的中心点与上一次迭代后得到的聚类中心点之间的差值是否不大于预设阈值;
如果是,确定该聚类的中心达到稳定状态;
如果否,确定该聚类的中心未达到稳定状态。
5.如权利要求2、3或4所述的方法,其特征在于,从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,具体包括:
针对初次迭代得到的每一类图像特征文件,分别确定该类图像特征文件与所述图像特征集合之间的距离;
根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类;
分别确定所述目标图像特征文件聚类中包含的每一类图像特征文件与所述图像特征集合之间的距离,并返回执行根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类的步骤,直至从最后一次迭代得到的图像特征文件聚类中选择出目标图像特征文件聚类;
确定所述目标图像特征文件聚类为与所述图像特征集合中包含的图像特征匹配的图像特征文件。
6.如权利要求5所述的方法,其特征在于,针对聚类得到的每一类图像特征文件,按照以下方法确定该类图像特征文件与所述图像特征集合之间的距离:
分别确定该类图像特征文件的中心点和所述图像特征集合的中心点;
确定该类图像特征文件的中心点与所述图像特征集合的中心点之间的距离为该类图像特征文件与所述图像特征集合之间的距离。
7.一种物体识别装置,其特征在于,包括:
形态识别单元,用于利用预先训练的形态识别模型,从采集的待识别物体图像中识别待识别物体的形态图像,其中,所述形态识别模型为利用带有标注的样本图像进行训练得到的;
特征提取单元,用于从所述形态图像中提取若干图像特征得到图像特征集合;
查找单元,从存储的图像特征文件查找与所述图像特征集合中包含的图像特征匹配的图像特征文件,其中,所述图像特征文件中包含的图像特征为利用残差神经网络从所述样本图像中提取的;
确定单元,用于根据查找到的图像特征文件对应的类别确定所述待识别物体对应的类别。
8.如权利要求7所述的装置,其特征在于,采用K维树结构存储所述图像特征文件,其中,K为正整数;以及
所述装置,还包括:
聚类单元,用于在第一次聚类时,利用聚类算法将所述图像特征文件划分为K类;以及当K大于1时,在第K次聚类时,针对第K-1次迭代得到的每一聚类,利用聚类算法将每一聚类中包含的图像特征文件划分为K子类;
存储单元,用于将该聚类作为父节点存储,将该聚类对应的子类作为该聚类的子节点存储。
9.如权利要求8所述的装置,其特征在于,
所述聚类单元,具体用于针对每一聚类中心包含的图像特征文件,从所述图像特征文件中随机选择K个图像特征文件作为初始聚类中心;在第K次迭代过程中,针对任一图像特征文件,分别确定该图像特征文件到K个聚类中心的距离;以及确定该图像特征文件归属于距离最近的中心所在的聚类;更新该聚类的中心后执行下一次迭代,直至该聚类的中心达到稳定状态。
10.如权利要求9所述的装置,其特征在于,
所述聚类单元,具体用于按照以下方法判断该聚类的中心是否达到稳定状态:确定本次聚类的中心点,判断本次聚类的中心点与上一次迭代后得到的聚类中心点之间的差值是否不大于预设阈值;如果是,确定该聚类的中心达到稳定状态;如果否,确定该聚类的中心未达到稳定状态。
11.如权利要求8、9或10所述的装置,其特征在于,
所述查找单元,具体用于针对初次迭代得到的每一类图像特征文件,分别确定该类图像特征文件与所述图像特征集合之间的距离;根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类;分别确定所述目标图像特征文件聚类中包含的每一类图像特征文件与所述图像特征集合之间的距离,并返回执行根据确定出的距离,确定与所述图像特征集合之间距离最近的一类图像特征文件为目标图像特征文件聚类的步骤,直至从最后一次迭代得到的图像特征文件聚类中选择出目标图像特征文件聚类;确定所述目标图像特征文件聚类为与所述图像特征集合中包含的图像特征匹配的图像特征文件。
12.如权利要求11所述的装置,其特征在于,
所述查找单元,具体用于按照以下方法确定该类图像特征文件与所述图像特征集合之间的距离:分别确定该类图像特征文件的中心点和所述图像特征集合的中心点;确定该类图像特征文件的中心点与所述图像特征集合的中心点之间的距离为该类图像特征文件与所述图像特征集合之间的距离。
13.一种计算装置,其特征在于,包括至少一个处理器、以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求1~6任一权利要求所述方法的步骤。
14.一种计算机可读介质,其特征在于,其存储有可由计算装置执行的计算机程序,当所述程序在计算装置上运行时,使得所述计算装置执行权利要求1~6任一所述方法的步骤。
CN201910112039.5A 2019-02-13 2019-02-13 一种物体识别方法、装置和存储介质 Active CN109871891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910112039.5A CN109871891B (zh) 2019-02-13 2019-02-13 一种物体识别方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910112039.5A CN109871891B (zh) 2019-02-13 2019-02-13 一种物体识别方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN109871891A true CN109871891A (zh) 2019-06-11
CN109871891B CN109871891B (zh) 2021-03-19

Family

ID=66918674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910112039.5A Active CN109871891B (zh) 2019-02-13 2019-02-13 一种物体识别方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN109871891B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110654740A (zh) * 2019-09-26 2020-01-07 五邑大学 自动进行垃圾分类的方法、装置及存储介质
CN111104936A (zh) * 2019-11-19 2020-05-05 泰康保险集团股份有限公司 文本图像识别方法、装置、设备及存储介质
CN112115906A (zh) * 2020-09-25 2020-12-22 广州市派客朴食信息科技有限责任公司 基于深度学习目标检测和度量学习的开放性菜品识别方法
CN116884045A (zh) * 2023-09-07 2023-10-13 腾讯科技(深圳)有限公司 身份识别方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345645A (zh) * 2013-06-27 2013-10-09 复旦大学 面向网购平台的商品图像类别预测方法
CN104615769A (zh) * 2015-02-15 2015-05-13 小米科技有限责任公司 图片分类方法及装置
CN105740882A (zh) * 2016-01-22 2016-07-06 苏州大学 一种基于多尺度不变量描述的目标识别方法及装置
CN106485686A (zh) * 2015-08-17 2017-03-08 西安电子科技大学 一种基于万有引力的谱聚类图像分割算法
US20180024726A1 (en) * 2016-07-21 2018-01-25 Cives Consulting AS Personified Emoji
CN109214349A (zh) * 2018-09-20 2019-01-15 天津大学 一种基于语义分割增强的物体检测方法
CN109308460A (zh) * 2018-09-06 2019-02-05 深兰科技(上海)有限公司 物品检测方法、系统及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345645A (zh) * 2013-06-27 2013-10-09 复旦大学 面向网购平台的商品图像类别预测方法
CN104615769A (zh) * 2015-02-15 2015-05-13 小米科技有限责任公司 图片分类方法及装置
CN106485686A (zh) * 2015-08-17 2017-03-08 西安电子科技大学 一种基于万有引力的谱聚类图像分割算法
CN105740882A (zh) * 2016-01-22 2016-07-06 苏州大学 一种基于多尺度不变量描述的目标识别方法及装置
US20180024726A1 (en) * 2016-07-21 2018-01-25 Cives Consulting AS Personified Emoji
CN109308460A (zh) * 2018-09-06 2019-02-05 深兰科技(上海)有限公司 物品检测方法、系统及计算机可读存储介质
CN109214349A (zh) * 2018-09-20 2019-01-15 天津大学 一种基于语义分割增强的物体检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KAIMING HE 等: "Deep Residual Learning for Image Recognition", 《ARXIV》 *
卓金武 等: "《MATLAB在数学建模中的应用(第2版)》", 30 September 2014 *
王欢欢 等: "物体特征的快速检测与识别方法", 《红外与激光工程》 *
肖金秀 等: "《多媒体技术及应用》", 31 December 2004 *
胡可云 等: "《数据挖掘理论与应用》", 30 April 2008 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110654740A (zh) * 2019-09-26 2020-01-07 五邑大学 自动进行垃圾分类的方法、装置及存储介质
CN111104936A (zh) * 2019-11-19 2020-05-05 泰康保险集团股份有限公司 文本图像识别方法、装置、设备及存储介质
CN112115906A (zh) * 2020-09-25 2020-12-22 广州市派客朴食信息科技有限责任公司 基于深度学习目标检测和度量学习的开放性菜品识别方法
CN116884045A (zh) * 2023-09-07 2023-10-13 腾讯科技(深圳)有限公司 身份识别方法、装置、计算机设备和存储介质
CN116884045B (zh) * 2023-09-07 2024-01-02 腾讯科技(深圳)有限公司 身份识别方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN109871891B (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN109871891A (zh) 一种物体识别方法、装置和存储介质
Cao et al. Landmark recognition with sparse representation classification and extreme learning machine
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
Ong et al. Sign language recognition using sequential pattern trees
CN110782015A (zh) 神经网络的网络结构优化器的训练方法、装置及存储介质
CN110598037B (zh) 一种图像搜索方法、装置和存储介质
CN110472675A (zh) 图像分类方法、图像分类装置、存储介质与电子设备
CN111382868A (zh) 神经网络结构搜索方法和神经网络结构搜索装置
CN110232373A (zh) 人脸聚类方法、装置、设备和存储介质
CN101305368A (zh) 语义可视搜索引擎
CN110390356B (zh) 视觉词典生成方法及装置、存储介质
CN112381227B (zh) 神经网络生成方法、装置、电子设备及存储介质
CN110502659A (zh) 图像特征提取及网络的训练方法、装置和设备
CN114419363A (zh) 基于无标注样本数据的目标分类模型训练方法及装置
CN111125396B (zh) 一种单模型多分支结构的图像检索方法
CN113806582A (zh) 图像检索方法、装置、电子设备和存储介质
CN113869398B (zh) 一种不平衡文本分类方法、装置、设备及存储介质
KR20200020107A (ko) 기계학습을 이용한 획 기반 수기 서명 인증 방법 및 시스템
CN111611395B (zh) 一种实体关系的识别方法及装置
CN114299340A (zh) 模型训练方法、图像分类方法、系统、设备及介质
CN110348581B (zh) 用户特征群中用户特征寻优方法、装置、介质及电子设备
CN114548262B (zh) 一种情感计算中多模态生理信号的特征级融合方法
CN115660001A (zh) 近场通信卡片确认方法及装置、存储介质和电子设备
Das et al. Image splicing detection based on deep convolutional neural network and transfer learning
Lustosa Filho et al. An analysis of diversity measures for the dynamic design of ensemble of classifiers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221031

Address after: 476000 shop 301, office building, northeast corner, intersection of Bayi Road and Pingyuan Road, Liangyuan District, Shangqiu City, Henan Province

Patentee after: Shenlan robot industry development (Henan) Co.,Ltd.

Address before: Unit 1001, 369 Weining Road, Changning District, Shanghai, 200336 (9th floor of actual floor)

Patentee before: DEEPBLUE TECHNOLOGY (SHANGHAI) Co.,Ltd.

TR01 Transfer of patent right