CN110222569B - 对象检测方法、装置、电子设备及可读存储介质 - Google Patents

对象检测方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110222569B
CN110222569B CN201910368598.2A CN201910368598A CN110222569B CN 110222569 B CN110222569 B CN 110222569B CN 201910368598 A CN201910368598 A CN 201910368598A CN 110222569 B CN110222569 B CN 110222569B
Authority
CN
China
Prior art keywords
detection
feature
target
preset
detection object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910368598.2A
Other languages
English (en)
Other versions
CN110222569A (zh
Inventor
罗钧峰
杨蒙昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910368598.2A priority Critical patent/CN110222569B/zh
Publication of CN110222569A publication Critical patent/CN110222569A/zh
Application granted granted Critical
Publication of CN110222569B publication Critical patent/CN110222569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开公开了一种对象检测方法,包括:通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。解决了现有的对象检测方案在每添加一个新品类时,都需要采集新品类的样本重新训练模型,扩展性较差,训练成本较高的技术问题。取得了提高模型适应性以及扩展性,降低检测成本的有益效果。

Description

对象检测方法、装置、电子设备及可读存储介质
技术领域
本公开涉及计算机技术领域,具体涉及一种对象检测方法、装置、电子设备及可读存储介质。
背景技术
随着AI(Artificial Intelligence,人工智能)技术的发展,市场上各种智能硬件涌现。在新零售领域下,基于计算机视觉技术的AI技术越来越多地被应用到商品识别中。例如在烘焙场景下,可以通过智能收银机,并应用深度学习及图像检索技术自动并快速的将面包品类识别出来。
现有的商品检测方案一般需要通过深度学习模型,针对每一种商品分别进行建模,这种方案的缺点在于每添加一个新品类时候,需要采集新品类的样本重新训练模型,扩展性较差。
发明内容
本公开提供一种对象检测方法、装置、电子设备及可读存储介质,以部分或全部解决现有技术中对象检测过程相关的上述问题。
依据本公开第一方面,提供了一种对象检测方法,包括:
通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;
根据所述检测对象的位置信息,提取所述检测对象的特征信息;
根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。
根据本公开的第二方面,提供了一种对象检测装置,包括:
检测对象获取模块,用于通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;
特征信息提取模块,用于根据所述检测对象的位置信息,提取所述检测对象的特征信息;
对象类别确认模块,用于根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。
根据本公开的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前述的对象检测方法。
根据本公开的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述的对象检测方法。
根据本公开的对象检测方法,可以通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。由此解决了现有的对象检测方案在每添加一个新品类时,都需要采集新品类的样本重新训练模型,扩展性较差,训练成本较高的技术问题。取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本公开实施例的一种对象检测方法的步骤流程图之一;
图1A示出了根据本公开实施例的一种外观形状检测模型识别出检测对象的示意图之一;
图1B示出了根据本公开实施例的一种外观形状检测模型识别出检测对象的示意图之二;
图2示出了根据本公开实施例的一种对象检测方法的步骤流程图之二;
图2A示出了根据本公开实施例的一种目标图片中各个检测对象的检测区域的示意图之一;
图2B示出了根据本公开实施例的一种对检测区域进行交叠抑制的示意图之一;
图3示出了根据本公开实施例的一种对象检测装置的结构示意图之一;以及
图4示出了根据本公开实施例的一种对象检测装置的结构示意图之二。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
详细介绍本公开实施例提供的一种对象检测方法。
参照图1,示出了本公开实施例中一种对象检测方法的步骤流程图。
步骤110,通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象。
由于形状具有通用性,可跨商家通用,且能检测任意对象。因此,在本公开实施例中,为了检测目标图片中包含的对象类别,则需要先确认目标图片中包含的检测对象。因此可以通过预先训练的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象。
其中,具体的外观性状类型可以根据需求进行预先设置,对此本公开实施例不加以限定。例如可以设置外观性状类型包括正方形、圆形、长方形、三角形、线条形、多边形,等等。
此时,由于形状具有通用性,因此在训练得到外观形状检测模型之后,可以将外观形状检测模型任意的迁移到其他检测场景中,而无需针对不同检测场景另外重新训练新的模型。
如图1A和1B分别为通过预先训练的同一外观形状检测模型对包含面包的图片和包含菜品的图片的检测结果,且该外观性状检测模型是基于面包数据训练的模型。但是由图1B的检测结果可以看出,该外观形状检测模型在餐饮数据中仍然适用,无需进行重新训练。
步骤120,根据所述检测对象的位置信息,提取所述检测对象的特征信息。
在识别得到目标图片中包含的检测对象之后,则可以获取得到每个检测对象在目标图片中为位置信息,进而根据检测对象的位置信息,提取各个检测对象的特征信息。
根据检测对象的位置信息,则可以确定检测对象在目标图片中的位置区域,进而则可以从检测对象对应的位置区域中提取得到该检测对象的特征信息。
其中,特征信息具体包含的内容可以根据需求进行预先设置,对此本公开实施例不加以限定。例如可以设置特征信息包括但不限于颜色特征、纹理特征、形状特征、空间关系特征,等等。而且,在本公开实施例中可以通过任何可用方式提取检测对象的特征信息,对此本公开实施例也不加以限定。
例如,可以通过特征提取模型提取检测对象的特征信息,也可以通过获取检测对象的原始图像统计特征作为其一种特征信息,原始图像统计特征具体可以包括但不限于检测对象所在区域的长宽参数、检测对象所在区域与相应目标图片的面积占比,等等。
步骤130,根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。
在实际应用中,不同类别的对象的特征信息一般会存在一些差别。因此,在本公开实施例中,可以预先收集不同类别的对象的特征数据构建特征数据库。那么在获取得到目标图片中包含的检测对象的特征信息之后,则可以根据检测对象的特征信息,以及预设的特征数据库,确定相应检测对象的所属类别。
其中,特征数据库中每个类别对应的特征数据中所包含的特征维度需要与步骤120中提取得到的特征信息中所包含的特征维度存在重合的部分,以方便确定检测对象的所属类别。
例如,如果预设的特征数据库中包含以下特征维度:颜色特征、纹理特征、形状特征和空间关系特征,那么经步骤120提取得到的特征信息则需要包含颜色特征、纹理特征、形状特征和空间关系特征中的至少一种。
具体的,根据检测对象的特征信息,可以获取预设的特征数据库中与相应检测对象的特征信息匹配度最高,且匹配度超过预设匹配度阈值的特征数据所对应的类别,作为相应检测对象的所属类别。当然,在本公开实施例中,也可以根据需求设置其他的类别匹配策略,对此本公开实施例不加以限定。
根据本公开的对象检测方法,可以通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。由此取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
实施例二
详细介绍本公开实施例提供的一种对象检测方法。
参照图2,示出了本公开实施例中一种对象检测方法的步骤流程图。
步骤210,根据至少一个已知检测对象的样本图片训练所述外观形状检测模型;其中,所述样本图片中包含至少一种所述外观形状类型下的至少一个样本对象。
为了基于外观检测模型进行检测对象的识别,则需要预先根据至少一个已知检测对象的样本图片训练相应的外观形状检测模型。而且,样本图片中包含至少一种外观形状类型下的至少一个样本对象。其中的样本对象也即样本图片中的已知检测对象。
需要说明的是,在本公开实施例中,由于形状的通用性,外观形状检测模型的训练过程可以只执行一次,而且可以将训练后的外观形状检测模型应用在不同的识别场景中。当然,也可以在将一已在某一识别场景中训练后的外观形状检测模型应用在另一识别场景中时,另外新识别场景中的样本图片对相应的外观形状检测模型进行优化训练,对此本公开实施例不加以限定。
步骤220,通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象。
步骤230,针对每个所述检测对象,获取所述检测对象的横坐标信息和纵坐标信息,作为所述检测对象的位置信息。
识别得到目标图片中包含的检测对象之后,为了提取检测对象的特征信息,则可以针对每个检测对象,确定其对应的检测区域,进而从检测区域中提取得到相应检测对象的特征信息。
因此,在本公开实施例中,针对每个检测对象,可以获取检测对象的横坐标信息和纵坐标信息,作为相应检测对象的位置信息。其中的横坐标信息和纵坐标信息可以理解为相应检测对象在目标图片中的横坐标信息和纵坐标信息。
步骤240,根据所述位置信息,获取所述检测对象所对应的检测区域。
在获取得到检测对象的位置信息之后,则可以获取检测对象在目标图片中所对应的检测区域。
例如,可以直接以检测对象的横坐标信息和纵坐标信息所对应的像素点构成的区域,作为相应检测对象的检测区域;或者,可以根据检测对象的位置信息,获取包含检测对象在内的最小矩形框所围成的区域作为相应检测对象的检测区域;或者,以检测对象的最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建的矩形框所包围的区域作为相应检测对象的检测区域;等等。具体的检测区域的确定方案可以根据需求进行预先设置,对此本公开实施例不加以限定。
可选地,在本公开实施例中,所述步骤240进一步可以包括:
子步骤241,根据所述位置信息,获取所述检测对象的最大横坐标、最小横坐标、最大纵坐标以及最小纵坐标。
子步骤242,根据所述最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建矩形框,并以所述矩形框所包围的区域作为所述检测对象的检测区域。
在实际应用中,为了避免遗漏检测对象的特征信息,提高提取得到的特征信息的全面性,可以设置检测区域包含检测对象在内,且大于检测对象自身的区域;另一方面,如果通过特征提取模型提取检测区域的特征信息,为了不影响特征提取模型的准确性,可以设置特征提取模型的输入数据为没有倾斜的矩形图片或者矩形区域。
因此,在本公开实施例中,可以根据检测对象的位置信息,获取相应检测对象的最大横坐标、最小横坐标、最大纵坐标以及最小纵坐标,进而根据最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建矩形框,并以所述矩形框所包围的区域作为相应检测对象的检测区域。如图1A和1B中每个面包或者菜品周围的矩形框所包围的区域即为相应面包或者菜品的检测区域。
步骤250,提取所述检测区域的图像特征,作为所述检测对象的特征信息。
在确定了各个检测对象的检测区域之后,则可提取相应检测区域的图像特征,作为相应检测对象的特征信息。
可选地,在本公开实施例中,所述特征信息包括通过预设的特征提取模型获取的特征向量、所述检测区域的原始图像统计特征;所述原始图像统计特征包括所述检测区域的长宽参数、所述检测区域相对于所述目标图片的面积占比中的至少一种。
在实际应用中,可能存在同款但大小不同的两个对象,例如同款但大小不同的面包,在实际售卖过程中的价格一般不同,而且是作为两种不同的商品进行出售。那么对于对象检测而言,如果检测准确性较高,则需要将上述情况的两个对象识别为两种不同类别。
因此,在本公开实施例中,可以设置提取的特征信息包括通过预设的特征提取模型获取的特征向量,以及相应检测对象所对应的检测区域的原始图像统计特征。其中的原始图像统计特征可以包括但不限于相应检测区域的长宽参数、检测区域相对于目标图片的面积占比中的至少一种。
相应地,在构建特征数据库时,在提取各个类别下的目标对象的特征数据时,也可以先获取目标对象所在图片的检测区域,进而通过预设的特征提取模型获取提取目标对象所对应检测区域的特征向量,以及相应目标对象所对应的检测区域的原始图像统计特征。对于目标对象而言,原始图片统计特征可以包括但不限于相应目标对象所对应的检测区域的长宽参数、目标对象所对应的检测区域相对于相应检测区域所在图片的面积占比中的至少一种。
可选地,在本公开实施例中,所述步骤250进一步可以包括:
子步骤251,针对每个所述检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例;
子步骤252,响应于所述交叠比例超出预设阈值,通过预设的背景颜色对所述当前检测区域中所述交叠比例对应的交叠区域进行重新赋值,得到所述当前检测区域对应的目标检测区域;
子步骤253,提取所述目标检测区域的图像特征,作为所述检测对象的特征信息。
在实际应用中,目标图片中包含的各个检测对象之间的间距可能较小,甚至可能存在多个检测对象存在部分重合的情况,那么此时针对各个检测对象确定的检测区域也会存在部分重合的情况。例如图2A所示的目标图片中各个检测对象的检测区域所示,中间位置的检测对象的检测区域分别于其四周的四个检测对象的检测区域部分重合,那么在根据中间位置的检测对象的检测区域提取相应检测对象的特征信息时,则会同时提取得到其他四个检测对象的部分特征信息,从而影响中间位置检测对象的检测效果。
因此,在本公开实施例中,为了避免上述问题,提高识别准确性,可以针对各个检测对象的检测区域进行交叠抑制处理。具体的,针对每个检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例,响应于所述交叠比例超出预设阈值,则通过预设的背景颜色对当前检测区域中交叠比例对应的交叠区域进行重新赋值,得到当前检测区域对应的目标检测区域,进而提取目标检测区域的图像特征,作为所述检测对象的特征信息。其中的预设阈值和背景颜色的具体设置都可以根据需求或经验进行预先设置,对此本公开实施例不加以限定。
例如,假设目标图片中包含N个检测对象,且每个检测对象的检测区域分别为B1,B2,…,Bn,对于其中的任意一个检测对象的检测区域Bi,分别计算检测区域Bi与其他每个检测区域Bj的交叠比例为两个检测区域的重合面积/检测区域Bj的面积;如果检测区域Bj与检测区域Bi的交叠比例超出预设阈值,则可以在检测区域Bi中,将交叠比例对应的交叠区域,也即检测区域Bj与检测区域Bi的交叠区域中的内容删除,并通过预设的背景颜色对在检测区域Bi中相应交叠比例对应的交叠区域进行重新赋值。其中,i和j的取值均为1,2,…,n,且i不等于j。
如图2B所示为针对图2A中间位置的检测对象的检测区域依次进行交叠抑制的示意图。从左至右,依次根据其他每个检测区域与中间位置的检测区域的交叠比例,对中间位置的检测对象的检测区域进行交叠抑制,随着交叠抑制越到位,基于未进行交叠抑制的检测区域提取得到的特征信息,以及依次交叠抑制后的检测区域提取得到的特征信息进行类别检测的相似度依次为0.59、0.66、0.68、0.71,可以看出经过交叠抑制可以明显提升检测结果的准确性,而且交叠抑制越完善,检测结果准确性越高。
而且,在本公开实施例中,为了避免在进行交叠抑制时出现混乱导致部分检测对象的检测区域没有完成交叠抑制,还可以根据各个检测对象的检测区域的面积大小进行排序,进而按照序列顺序依次针对每个检测对象的监测区域进行交叠抑制。
步骤260,针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库。
由于同一类别的面包、菜品等对象的特征基本是一致的,因此在本公开实施例中,可以基于特征信息进行匹配确定检测对象的所属类别,而为了识别从目标图片中检测得到的检测对象的所属类别,则可以预先针对不同类别下的目标对象构建一特征数据库。而且在实际应用中,由于面包、菜品等对象在实际环境中时立体的,但是在目标图片中的检测对象是平面的,而且从不同角度拍摄得到的目标图片中包含的对应同一对象的检测对象所展示的内容也可能会存在差别,那么提取得到的特征信息也会存在差别;或者针对同一商品的不同位置拍摄得到的目标图片中所包含的检测对象所展示的内容也可能会存在差别,那么提取得到的特征信息也会存在差别。但是在针对同一对象在不同拍摄角度和/或不同位置拍摄的目标图片中的检测对象而言,其所属类别应该是一致的。
因此,在本公开实施例中,为了提高特征数据库的完备性,可以针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库。
以面包为例,对于每一种面包,可以在摄像头视野内基于预设的深度学习模型提取不同角度和/或不同位置的面包的图像特征,离线存入嵌入式设备的特征数据库中,以备识别时调用;或者对于每一种面包,也可以先通过摄像头拍摄面包在不同角度和/或面包不同位置的图片,进而从图片中提取得到相应面包的特征数据,得到同一面包不同角度和/或不同位置对应的特征数据;等等。
此时,在特征数据库中,同一类别的对象可能对应多个特征数据向量,每个特征数据向量可能包括相应对象对应一个拍摄角度或者一个拍摄位置的全部特征数据。
例如,对于面包A,可以基于其正面拍摄角度下的特征数据构建得到一特征数据向量a1,基于其侧面位置的特征数据构建得到一特征数据向量a2,等等。此时,由于特征数据向量a1和a2对应的拍摄角度或者拍摄位置不一致,从而导致其中包含的特征数据也可能不一致,但是其中的特征数据都是面包A的全部特征数据的一部分。
此时如果目标图片中的某一检测对象的特征信息与面包A对应的其中一个特征数据向量的匹配度最高,且超过预设的匹配度阈值,则可以认定该检测对象的所属类别为面包A。
当然,在本公开实施例中,为了使得在特征数据库中每个类别下的目标对象对应一个特征数据向量,那么也可以将同一目标对象对应的不同角度和/或不同位置下的特征数据向量进行合并,具体的合并方式可以根据需求进行预先设置,对此本公开实施例不加以限定。
可选地,在本公开实施例中,所述步骤260进一步可以包括:
子步骤261,针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据;
子步骤262,针对每个所述目标对象,对所述目标对象同一特征维度下的特征值取平均,并基于所述目标对象每个特征维度下的特征平均值构建所述特征数据库。
经多次实验发现,将每个类别下的同一特征维度下的特征值取平均后,各个类别的类间差距更大,品类区分性更强。而且,将取平均的操作放在特征数据库的构建阶段,这样后续基于特征数据库的检索过程将加快很多。
因此,在本公开实施例中,在针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据之后,针对每个目标对象,可以对相应目标对象同一特征维度下的特征值取平均,并基于相应目标对象在每个特征维度下的特征平均值构建特征数据库。此时,在特征数据库中,每个类别下的每个目标对象对应于一个特征数据向量。
而且,如果同一类别下包含多个目标对象,那么此时的多个目标对象属于同一类别,那么如果在相应类别下的任意两个目标对象之间的差别很小,则可以将相应类别下的多个目标对象认定为一个目标对象,进而将同一类别下的多个目标对象对应的同一特征维度下的特征值取平均,从而得到相应类别下对应的一个特征数据向量。
当然,在本公开实施例中,也可以不将同一类别下的多个目标对象认定为同一目标对象,那么此时假设某一类别下包括N个目标对象,则可以相应得到N个特征数据向量,且一个特征数据向量对应一个目标对象。具体的可以根据需求进行预先设置,对此本公开实施例不加以限定。
步骤270,根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。
根据本公开的对象检测方法,可以通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。由此取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
其次,在本公开实施例中,还可以针对每个所述检测对象,获取所述检测对象的横坐标信息和纵坐标信息,作为所述检测对象的位置信息;根据所述位置信息,获取所述检测对象所对应的检测区域;提取所述检测区域的图像特征,作为所述检测对象的特征信息。并且,根据所述位置信息,获取所述检测对象的最大横坐标、最小横坐标、最大纵坐标以及最小纵坐标;根据所述最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建矩形框,并以所述矩形框所包围的区域作为所述检测对象的检测区域。通过设置包括检测对象在内的的水平矩形框作为检测区域以提取特征信息,提高了检测区域的有效性,进而提高提取得到的特性信息的准确性和有效性。
再次,在本公开实施例中,所述特征信息包括通过预设的特征提取模型获取的特征向量、所述检测区域的原始图像统计特征;所述原始图像统计特征包括所述检测区域的长宽参数、所述检测区域相对于所述目标图片的面积占比中的至少一种。可以分别出外观相同单尺寸不同的两类对象,提高了对象检测准确性。
而且,在本公开实施例中,针对每个所述检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例;响应于所述交叠比例超出预设阈值,通过预设的背景颜色对所述当前检测区域中所述交叠比例对应的交叠区域进行重新赋值,得到所述当前检测区域对应的目标检测区域;提取所述目标检测区域的图像特征,作为所述检测对象的特征信息。通过交叠抑制降低不同检测对象之间的互相干扰,提高检测结果的准确性。
另外,在本公开实施例中,还可以针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库。并且,针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据;针对每个所述目标对象,对所述目标对象同一特征维度下的特征值取平均,并基于所述目标对象每个特征维度下的特征平均值构建所述特征数据库。可以进一步提高特征数据库的完备性以及数据有效性,进而提高检测结果的准确性。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开实施例并不受所描述的动作顺序的限制,因为依据本公开实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开实施例所必须的。
实施例三
详细介绍本公开实施例提供的一种对象检测装置。
参照图3,示出了本公开实施例中一种对象检测装置的结构示意图。
检测对象获取模块310,用于通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象。
特征信息提取模块320,用于根据所述检测对象的位置信息,提取所述检测对象的特征信息。
对象类别确认模块330,用于根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。
根据本公开的对象检测方法,可以通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。由此取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
实施例四
详细介绍本公开实施例提供的一种对象检测装置。
参照图4,示出了本公开实施例中一种对象检测装置的结构示意图。
模型训练模块410,用于根据至少一个已知检测对象的样本图片训练所述外观形状检测模型;其中,所述样本图片中包含至少一种所述外观形状类型下的至少一个样本对象。
检测对象获取模块420,用于通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象。
特征信息提取模块430,用于根据所述检测对象的位置信息,提取所述检测对象的特征信息。
其中,所述特征信息提取模块430,进一步可以包括:
位置信息获取子模块431,用于针对每个所述检测对象,获取所述检测对象的横坐标信息和纵坐标信息,作为所述检测对象的位置信息;
检测区域获取子模块432,用于根据所述位置信息,获取所述检测对象所对应的检测区域;
可选地,在本公开实施例中,所述检测区域获取子模块432,进一步可以包括:
顶点坐标获取单元,用于根据所述位置信息,获取所述检测对象的最大横坐标、最小横坐标、最大纵坐标以及最小纵坐标;
检测区域构建单元,用于根据所述最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建矩形框,并以所述矩形框所包围的区域作为所述检测对象的检测区域。
特征信息提取子模块433,用于提取所述检测区域的图像特征,作为所述检测对象的特征信息。
可选地,在本公开实施例中,所述特征信息包括通过预设的特征提取模型获取的特征向量、所述检测区域的原始图像统计特征;所述原始图像统计特征包括所述检测区域的长宽参数、所述检测区域相对于所述目标图片的面积占比中的至少一种。
可选地,在本公开实施例中,所述特征信息提取子模块433,进一步可以包括:
交叠比例获取单元,用于针对每个所述检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例;
目标检测区域获取单元,用于响应于所述交叠比例超出预设阈值,通过预设的背景颜色对所述当前检测区域中所述交叠比例对应的交叠区域进行重新赋值,得到所述当前检测区域对应的目标检测区域;
特征信息提取单元,用于提取所述目标检测区域的图像特征,作为所述检测对象的特征信息。
特征数据库构建模块440,用于针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库。
可选地,在本公开实施例中,所述特征数据库构建模块440,进一步可以包括:
特征数据获取子模块,用于针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据;
特征值取平均子模块,用于针对每个所述目标对象,对所述目标对象同一特征维度下的特征值取平均,并基于所述目标对象每个特征维度下的特征平均值构建所述特征数据库。
对象类别确认模块450,用于根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。
根据本公开的对象检测方法,可以通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象;根据所述检测对象的位置信息,提取所述检测对象的特征信息;根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别。由此取得了提高模型适应性以及扩展性,降低检测成本的有益效果。
其次,在本公开实施例中,还可以针对每个所述检测对象,获取所述检测对象的横坐标信息和纵坐标信息,作为所述检测对象的位置信息;根据所述位置信息,获取所述检测对象所对应的检测区域;提取所述检测区域的图像特征,作为所述检测对象的特征信息。并且,根据所述位置信息,获取所述检测对象的最大横坐标、最小横坐标、最大纵坐标以及最小纵坐标;根据所述最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建矩形框,并以所述矩形框所包围的区域作为所述检测对象的检测区域。通过设置包括检测对象在内的的水平矩形框作为检测区域以提取特征信息,提高了检测区域的有效性,进而提高提取得到的特性信息的准确性和有效性。
再次,在本公开实施例中,所述特征信息包括通过预设的特征提取模型获取的特征向量、所述检测区域的原始图像统计特征;所述原始图像统计特征包括所述检测区域的长宽参数、所述检测区域相对于所述目标图片的面积占比中的至少一种。可以分别出外观相同单尺寸不同的两类对象,提高了对象检测准确性。
而且,在本公开实施例中,针对每个所述检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例;响应于所述交叠比例超出预设阈值,通过预设的背景颜色对所述当前检测区域中所述交叠比例对应的交叠区域进行重新赋值,得到所述当前检测区域对应的目标检测区域;提取所述目标检测区域的图像特征,作为所述检测对象的特征信息。通过交叠抑制降低不同检测对象之间的互相干扰,提高检测结果的准确性。
另外,在本公开实施例中,还可以针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库。并且,针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据;针对每个所述目标对象,对所述目标对象同一特征维度下的特征值取平均,并基于所述目标对象每个特征维度下的特征平均值构建所述特征数据库。可以进一步提高特征数据库的完备性以及数据有效性,进而提高检测结果的准确性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本公开实施例中还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现前述的任意一种对象检测方法。
在本公开实施例中还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述的任意一种对象检测方法的步骤。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的内容,并且上面对特定语言所做的描述是为了披露本公开的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本公开的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的对象检测设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (9)

1.一种对象检测方法,其特征在于,包括:
通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象,所述检测对象为任意对象,该任意对象的外观形状具有通用性;
根据所述检测对象的位置信息,获取所述检测对象所对应的检测区域,提取所述检测区域的图像特征,作为所述检测对象的特征信息,所述特征信息包括通过预设的特征提取模型获取的特征向量、所述检测对象对应的检测区域的原始图像统计特征;所述原始图像统计特征包括所述检测区域的长宽参数、所述检测区域相对于所述目标图片的面积占比中的至少一种;
根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别;
其中,所述提取所述检测区域的图像特征,作为所述检测对象的特征信息的步骤,包括:
针对每个所述检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例;
响应于所述交叠比例超出预设阈值,通过预设的背景颜色对所述当前检测区域中所述交叠比例对应的交叠区域进行重新赋值,得到所述当前检测区域对应的目标检测区域;
提取所述目标检测区域的图像特征,作为所述检测对象的特征信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对每个所述检测对象,获取所述检测对象的横坐标信息和纵坐标信息,作为所述检测对象的位置信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述位置信息,获取所述检测对象所对应的检测区域的步骤,包括:
根据所述位置信息,获取所述检测对象的最大横坐标、最小横坐标、最大纵坐标以及最小纵坐标;
根据所述最大横坐标、最小横坐标、最大纵坐标和最小纵坐标构建矩形框,并以所述矩形框所包围的区域作为所述检测对象的检测区域。
4.根据权利要求1所述的方法,其特征在于,在所述通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象的步骤之前,还包括:
根据至少一个已知检测对象的样本图片训练所述外观形状检测模型;
其中,所述样本图片中包含至少一种所述外观形状类型下的至少一个样本对象。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别的步骤之前,还包括:
针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库。
6.根据权利要求5所述的方法,其特征在于,所述针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据,并基于所述特征数据构建所述特征数据库的步骤,包括:
针对不同类别下的目标对象,提取所述目标对象不同角度和/或不同位置对应的特征数据;
针对每个所述目标对象,对所述目标对象同一特征维度下的特征值取平均,并基于所述目标对象每个特征维度下的特征平均值构建所述特征数据库。
7.一种对象检测装置,其特征在于,包括:
检测对象获取模块,用于通过预设的外观形状检测模型,检测目标图片中所包含的与预设的外观形状类型匹配的检测对象,所述检测对象为任意对象,该任意对象的外观形状具有通用性;
特征信息提取模块,用于获取所述检测对象所对应的检测区域,提取所述检测区域的图像特征,作为所述检测对象的位置信息,提取所述检测对象的特征信息,所述特征信息包括通过预设的特征提取模型获取的特征向量、所述检测对象对应的检测区域的原始图像统计特征;所述原始图像统计特征包括所述检测区域的长宽参数、所述检测区域相对于所述目标图片的面积占比中的至少一种;
对象类别确认模块,用于根据所述特征信息,以及预设的特征数据库,确定所述检测对象的所属类别;
其中,所述提取所述检测区域的图像特征,作为所述检测对象的特征信息的步骤,包括:
针对每个所述检测对象的检测区域,获取每个其他检测区域与当前检测区域的交叠比例;
响应于所述交叠比例超出预设阈值,通过预设的背景颜色对所述当前检测区域中所述交叠比例对应的交叠区域进行重新赋值,得到所述当前检测区域对应的目标检测区域;
提取所述目标检测区域的图像特征,作为所述检测对象的特征信息。
8.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6中的任一项所述的对象检测方法。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1-6中的任一项所述的对象检测方法。
CN201910368598.2A 2019-05-05 2019-05-05 对象检测方法、装置、电子设备及可读存储介质 Active CN110222569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910368598.2A CN110222569B (zh) 2019-05-05 2019-05-05 对象检测方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910368598.2A CN110222569B (zh) 2019-05-05 2019-05-05 对象检测方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN110222569A CN110222569A (zh) 2019-09-10
CN110222569B true CN110222569B (zh) 2021-04-23

Family

ID=67820390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910368598.2A Active CN110222569B (zh) 2019-05-05 2019-05-05 对象检测方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110222569B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751065B (zh) * 2019-09-30 2023-04-28 北京旷视科技有限公司 训练数据的采集方法及装置
CN110837789B (zh) * 2019-10-31 2023-01-20 北京奇艺世纪科技有限公司 一种检测物体的方法、装置、电子设备及介质
CN111027390B (zh) * 2019-11-11 2023-10-10 北京三快在线科技有限公司 对象类别的检测方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633516A (zh) * 2017-09-21 2018-01-26 武汉武大卓越科技有限责任公司 一种识别路面变形类病害的方法和装置
CN109145901A (zh) * 2018-08-14 2019-01-04 腾讯科技(深圳)有限公司 物品识别方法、装置、计算机可读存储介质和计算机设备
CN109255377A (zh) * 2018-08-30 2019-01-22 北京信立方科技发展股份有限公司 仪器识别方法、装置、电子设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271520A (zh) * 2008-04-01 2008-09-24 北京中星微电子有限公司 一种确定图像中的特征点位置的方法及装置
US8396287B2 (en) * 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
CN101833771B (zh) * 2010-06-03 2012-07-25 北京智安邦科技有限公司 解决多目标交汇遮挡的跟踪装置及方法
CN105957107A (zh) * 2016-04-27 2016-09-21 北京博瑞空间科技发展有限公司 行人检测与跟踪方法及装置
CN106157308A (zh) * 2016-06-30 2016-11-23 北京大学 矩形目标物检测方法
CN108022232B (zh) * 2016-11-01 2021-06-01 中国科学院沈阳自动化研究所 一种飞行器表面铆钉检测方法
CN107169496A (zh) * 2017-04-19 2017-09-15 北京三快在线科技有限公司 一种文字识别方法和装置
CN107563432A (zh) * 2017-08-29 2018-01-09 武汉交通职业学院 一种基于视觉形状模型的机器人多目标识别方法
CN108734214A (zh) * 2018-05-21 2018-11-02 Oppo广东移动通信有限公司 图像识别方法和装置、电子设备、存储介质
CN109145839A (zh) * 2018-08-29 2019-01-04 福建超汇信息技术有限公司 基于机器视觉识别的计价方法及计算机可读存储介质
CN109542562A (zh) * 2018-11-09 2019-03-29 浙江口碑网络技术有限公司 界面图片的识别方法及装置
CN109614947A (zh) * 2018-12-19 2019-04-12 深圳供电局有限公司 电力部件识别模型训练方法、装置和计算机设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633516A (zh) * 2017-09-21 2018-01-26 武汉武大卓越科技有限责任公司 一种识别路面变形类病害的方法和装置
CN109145901A (zh) * 2018-08-14 2019-01-04 腾讯科技(深圳)有限公司 物品识别方法、装置、计算机可读存储介质和计算机设备
CN109255377A (zh) * 2018-08-30 2019-01-22 北京信立方科技发展股份有限公司 仪器识别方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于SURF特征贡献度矩阵的图像ROI选取与检索方法;薛峰等;《计算机辅助设计与图形学学报》;20150731;第27卷(第7期);第1271-1277页 *

Also Published As

Publication number Publication date
CN110222569A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
CN109615611B (zh) 一种基于巡检影像的绝缘子自爆缺陷检测方法
CN110222569B (zh) 对象检测方法、装置、电子设备及可读存储介质
CN109271847B (zh) 无人结算场景中异常检测方法、装置及设备
CN108985199A (zh) 商品取放操作的检测方法、装置及存储介质
US11232589B2 (en) Object recognition device and object recognition method
CN112464697B (zh) 基于视觉和重力感应的商品与顾客的匹配方法和装置
CN110991261A (zh) 交互行为识别方法、装置、计算机设备和存储介质
CN108345912A (zh) 一种基于rgbd信息与深度学习的商品快速结算系统
CN108416902A (zh) 基于差异识别的实时物体识别方法和装置
US20190333242A1 (en) Method and apparatus for three-dimensional object pose estimation, device and storage medium
CN109974721A (zh) 一种基于高精度地图的视觉回环检测方法和装置
CN112883955A (zh) 货架布局检测方法、装置及计算机可读存储介质
CN112232368B (zh) 目标识别模型训练方法、目标识别方法及其相关装置
CN111161346A (zh) 将商品在货架中进行分层的方法、装置和电子设备
CN111222530A (zh) 一种细粒度图像分类方法、系统、装置和存储介质
TW202127372A (zh) 瑕疵等級判定的方法及存儲介質
CN111105351B (zh) 一种视频序列影像拼接方法及装置
US20200410275A1 (en) Product analysis system, product analysis method, and product analysis program
CN111428743B (zh) 商品识别方法、商品处理方法、装置及电子设备
CN111242094B (zh) 商品识别方法、智能货柜及智能货柜系统
CN109977965B (zh) 一种在遥感机场图像中确定检测目标的方法及装置
JP6403207B2 (ja) 情報端末装置
CN116385567A (zh) 获取色卡roi坐标信息的方法、装置和介质
KR101714131B1 (ko) 주차구획 인식 장치 및 방법
CN104349125A (zh) 一种区域监控方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant