CN112348778B - 一种物体识别方法、装置、终端设备及存储介质 - Google Patents

一种物体识别方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN112348778B
CN112348778B CN202011130384.0A CN202011130384A CN112348778B CN 112348778 B CN112348778 B CN 112348778B CN 202011130384 A CN202011130384 A CN 202011130384A CN 112348778 B CN112348778 B CN 112348778B
Authority
CN
China
Prior art keywords
target
target candidate
candidate frames
category
candidate frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011130384.0A
Other languages
English (en)
Other versions
CN112348778A (zh
Inventor
黄冠文
程骏
庞建新
谭欢
熊友军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubtech Robotics Corp
Original Assignee
Ubtech Robotics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubtech Robotics Corp filed Critical Ubtech Robotics Corp
Priority to CN202011130384.0A priority Critical patent/CN112348778B/zh
Priority to PCT/CN2020/140419 priority patent/WO2022082999A1/zh
Publication of CN112348778A publication Critical patent/CN112348778A/zh
Application granted granted Critical
Publication of CN112348778B publication Critical patent/CN112348778B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请适用于人工智能技术领域,提供了一种物体识别方法、装置、终端设备及存储介质,其中,方法包括:对目标图像进行物体识别,得到至少一个候选框、每个候选框中物体的类别以及置信度;获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;对所有第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个第二目标候选框中一个,得到第三目标候选框;获取中心位置与目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到目标图像中物体的识别结果并输出。本申请实施例可提高对目标物体识别的准确性和稳定性。

Description

一种物体识别方法、装置、终端设备及存储介质
技术领域
本申请属于人工智能技术领域,尤其涉及一种物体识别方法、装置、终端设备及存储介质。
背景技术
随着人工智能技术的快速发展,各种人工智能产品顺应而生,人工智能产品可对特定的物体进行物体识别,以识别出物体的类别和位置信息。
目前基于深度学习的物体识别大多数采用分类算法,容易把背景误识别成物体以及识别出画面中的多个物体,不能准确出的确定要识别目标物体,使得对目标物体识别的准确性和稳定性不高。
发明内容
本申请实施例提供了一种物体识别方法、装置、终端设备及存储介质,旨在解决现有对目标物体识别的准确性和稳定性不高的问题。
第一方面,本申请实施例提供了一种物体识别方法,包括:
获取目标图像,检测所述目标图像的图像质量;
当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;
从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;
对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框中的物体的类别不同;
对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框;
当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
第二方面,本申请实施例提供了一种物体识别装置,包括:
检测模块,用于获取目标图像,检测所述目标图像的图像质量;
识别模块,用于当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;
第一获取模块,用于从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;
过滤模块,用于对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框之间的物体的类别不同;
第二获取模块,用于对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框;
第三获取模块,用于当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述物体识别方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现上述物体识别方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述现上述物体识别方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例可获取目标图像,检测所述目标图像的图像质量;当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框中的物体的类别不同;对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框;当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。由于从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,可减少把背景误识别成物体的误判识别,且对同类别的第一目标候选框进行过滤,对不同类别的第二目标候选框,根据重合度进行过滤,得到第三目标候选框,再获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,从而得到识别结果,可提高对目标物体识别的准确性和稳定性。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的物体识别方法的流程示意图;
图2是本申请一实施例提供的物体识别方法的流程示意图
图3是本申请一实施例提供的步骤S105的一个具体流程示意图;
图4是本申请一实施例提供的物体识别装置的结构示意图;
图5是本申请一实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的物体识别方法,可以应用于机器人、相机、手机、平板电脑、可穿戴设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备,本申请实施例对终端设备的具体类型不作任何限制。摄像头可以是可转动、可自动对焦的摄像头,例如,兼具可转动和可自动聚焦功能的云台摄像头、球形摄像头等。机器人可以是服务机器人、娱乐机器人、军用机器人、农业机器人等,其中,服务机器人和娱乐机器人具体可以是人形机器人、机器狗、机器猫等仿生机器人,也可以是机械臂或机械手,本申请实施例对机器人的具体类型不作任何限制。
如在一种应用场景下,本申请实施例提供的物体识别方法应用于具有摄像头或与摄像头、相机等摄像设备通信连接的机器人,且执行所述物体识别方法的程序部署于所述机器人端,以使所述机器人处于离线状态时同样能执行所述物体识别方法。
为了说明本申请所述的技术方案,下面通过以下实施例来进行说明。
请参阅图1,本申请实施例提供的一种物体识别方法,包括:
步骤S101,获取目标图像,检测所述目标图像的图像质量。
具体的,所述目标图像可以是通过图像检测设备获取得到的图像,如所述图像检测设备可以是摄像头,可通过摄像头拍摄视频,从拍摄的视频流中获取目标图像。或者通过接收外部设备发送的视频或图像中获取到目标图像,获取到目标图像,对所述目标图像的图像质量进行检测,以检测目标图像的图像质量是否满足预设的要求,所述图像质量包括但不限于图像的清晰度、色度和亮度等图像质量特征。
在一个实施例中,所述检测所述目标图像的图像质量,包括:检测所述目标图像的清晰度、色度和亮度是否在各自对应的预设正常范围内;当所述清晰度、所述色度和所述亮度均在各自对应的预设正常范围内时,判定所述目标图像满足第一预设条件。预先分别设置正常清晰度范围、正常色度范围和正常亮度范围,分别检测目标图像的清晰度是否在预设的正常清晰度范围内、检测目标图像的色度是否在预设的正常色度范围内、以及检测目标图像的亮度是否在预设的正常亮度范围内。当目标图像的清晰度,亮度和色度均在各自预设的正常范围内时,判定目标图像是满足第一预设条件。
在一个实施例中,所述检测所述目标图像的清晰度、色度和亮度是否在各自对应的预设正常范围内之后,还包括:当所述亮度不在预设正常亮度范围且在预设处理亮度范围内时,通过高动态范围成像算法对所述目标图像进行处理,以使处理后的所述目标图像满足第一预设条件。预先设置正常亮度范围和处于能使用高动态范围成像算法调整的预设处理亮度范围,当目标图像的亮度不在预设正常范围内但处于预设处理范围内时,通过高动态范围成像算法对目标图像进行处理,将处理后的目标图像的亮度判定为满足预设正常亮度范围。
在一个实施例中,在检测所述目标图像是否满足第一预设条件之前,包括对所述目标图像进行预处理,如图2所示,对所述目标图像进行预处理包括步骤S201至步骤S203。
步骤S201,将所述目标图像转换至目标色域。
具体的,将所述目标图像转换至目标色域可以是将目标图像转换至RGB格式的图像。当然可根据实际应用将目标图像转换至YCbCr格式的图像,或者HSV格式的图像。
步骤S202,确定所述目标图像的中心位置,并根据所述中心位置以预设比例进行剪裁。
具体的,确定出所述目标图像的中心位置,并基于所述目标图像的中心位置以预设比例进行剪裁,以将图像的中心区域按一定比例裁剪出来,以预设比例进行剪裁可以是预设图像宽与高的比,根据该宽与高的比对目标图像进行剪裁,或者预设上下左右的像素值,基于所述目标图像的中心位置和上下左右的像素值进行剪裁。在一种应用场景中如是机器人进行目标识别,机器人只关心位于机器人视野中心的物体,基于所述目标图像的中心位置以预设比例进行剪裁,以将图像的中心区域按一定比例裁剪出来,去除无关的背景,可提高物体识别的准确率。
步骤S203,根据预设图像缩放算法将剪裁后的目标图像缩放至预设尺寸。
具体的,将裁剪后的目标图像根据预设图像缩放算法缩放至预设尺寸,以将图像的大小调整成后续步骤能处理的图像大小尺寸,所述预设图像缩放算法可以是基于插值的图像缩放算法,如最近邻插值算法、线性插值算法、二次插值算法或高斯插值算法等。
步骤S102,当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度。
具体的,当目标图像的图像质量满足第一预设条件时,则对目标图像进行物体识别。当目标图像的图像质量不满足第一预设条件时,不对目标图像进行物体识别,对下一个图像返回执行步骤S101及其后续步骤,如获取的数据是视频流数据,则对当前图像不进行后续步骤处理,对下一帧图像返回执行步骤S101及其后续步骤。对所述目标图像进行物体识别,当识别出至少一个物体时,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;当未识别出物体时,继续对下一个图像返回执行步骤S101及其后续步骤
在一个实施例中,所述当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度,包括:在所述目标图像的图像质量满足所述第一预设条件时,将所述目标图像输入至已训练的神经网络模型进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度。
具体的,可预先构建神经网络模型进行训练,根据训练完成后的神经网络模型对输入的目标图形进行物体识别,得到识别出物体对应的候选框,每个候选框中物体的类别以及每个候选框中物体的类别的置信度。如可通过轻量级的网络进行网络设计,从而能部署在执行目标识别算法的终端设备上,以在离线状态时亦可进行物体识别。上述神经网络训练的过程可以是,根据需要识别的多种物体类型准备大量的包含所述多种类型物体的样本图像,每个样本图片中包括对物体进行分类标注物体对应的候选框、候选框所属的物体类别以及每个候选框中物体的类别的置信度。将准备大量的样本图像对神经网络模型进行训练,直至神经网络模型的预设损失函数收敛为止,判定神经网络模型为已经训练好的神经网络模型。物体的类别的置信度用于表征所述候选框中物体的类别为所述真实的该物体的类别的可信程度,如物体的类别的置信度可表征所述候选框中物体的类别为所述真实的该物体的类别的概率。
步骤S103,从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框。
具体的,物体的类别的置信度越大,表示识别出对应物体类别的准确性越高,对应将背景识别成物体的可能性就越小,将所述候选框中对应物体的类别小于或等于第一预设阈值的候选框剔除,可提高物体识别的准确性。
步骤S104,对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框中的物体的类别不同。
具体的,可通过非极大值抑制算法对物体的类别为同一类别的第一目标候选框进行过滤,过滤掉物体所属类别为同一类别的第一目标候选框中置信度不是最大值的第一目标候选框,将过滤后剩下的第一候选框称为第二目标候选框,从而得到第二目标候选框,使得物体所属类别为同一类别的候选框保留置信度最大值的候选框,可以提高目标识别的准确率。
在一个实施例中,所述对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框,包括:过滤物体的类别为同一类别的第一目标候选框中物体的类别的置信度非最高的第一目标候选框,得到第二目标候选框。
步骤S105,对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框。
具体的,在得到所有的第二目标候选框后,得到的第二候选框所属类别不同,对所有第二目标候选框计算每两个目标候选框之间的重合度,并将所有重合度大于第二预设阈值的两个第二目标候选框中剔除一个,从而可以防止重复识别,提高识别的准确性,将所有重合度大于第二预设阈值的两个第二目标候选框中剔除一个后的所有第二目标候选框称为第三目标候选框。
在一个实施例中,如图3所示,所述对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框,包括步骤S1051至步骤S1052:
步骤S1051,对所有所述第二目标候选框两两计算交并比,得到所有所述第二目标候选框两两之间的重合度。
具体的,交并比(Intersection over Union,IoU)可表示两个候选框区域之间的交叠程度,对所有第二候选框中的两两之间计算交并比,从而得到所有第二候选目标框两两之间的重合度。
步骤S1052,剔除重合度大于第二预设阈值的两个所述第二目标候选框中的其中一个,得到第三目标候选框。
具体的,将所有重合度大于第二预设阈值的两个第二目标候选框中其中一个剔除,将剔除掉重合度大于第二阈值的两个第二目标候选框其中一个后的所有第二候选框称为第三目标候选框。具体可通过预先存储的目标物体的常见度剔除掉重合度大于第二阈值的两个第二目标候选框中对应物体常见度低的第二目标候选框,或者将重合度大于第二阈值的两个第二目标候选框对应置信度小的第二目标候选框剔除。
在一个实施例中,所述剔除重合度大于第二预设阈值的两个所述第二目标候选框中的其中一个,得到第三目标候选框,包括:获取重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别;剔除重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别的常见度满足第二预设条件的第二目标候选框,得到第三目标候选框。剔除重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别的常见度满足第二预设条件可以是:剔除重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别的常见度小的第二目标候选框。
步骤S106,当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
具体的,经过上述步骤得到的第三目标候选框有多个时,从所述多个第三目标候选框中选择一个作为对应要识别物体的候选框,可获取所述第三候选框的中心位置在所述目标图像中的坐标,再获取所述目标图像的预设中心位置的坐标,将第三目标候选框中心离目标图像中心的距离,按距离值由小到大排序,输出离目标图像中心最近的物体类别信息及位置信息。
在一个实施例中,所述对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框之后,还包括:当得到一个所述第三目标候选框时,获取一个所述第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
本申请实施例可从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,可减少把背景误识别成物体的误判识别,且对同类别的第一目标候选框进行过滤,对不同类别的第二目标候选框,根据重合度进行过滤,得到第三目标候选框,再获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,从而得到识别结果,可提高对目标物体识别的准确性和稳定性。
本申请实施例还提供一种物体识别装置,用于执行上述物体识别方法实施例中的步骤。物体识别装置可以是终端设备中的虚拟装置(virtual appliance),由终端设备的处理器运行,也可以是终端设备本身。
如图4所示,本申请实施例提供的物体识别装置400包括:
检测模块401,用于获取目标图像,检测所述目标图像的图像质量;
识别模块402,用于当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;
第一获取模块403,用于从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;
过滤模块404,用于对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框之间的物体的类别不同;
第二获取模块405,用于对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框;
第三获取模块406,用于当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
在一个实施例中,所述第二获取模块405包括:
计算单元,用于对所有所述第二目标候选框两两计算交并比,得到所有所述第二目标候选框两两之间的重合度;
剔除单元,用于剔除重合度大于第二预设阈值的两个所述第二目标候选框中的其中一个,得到第三目标候选框。
在一个实施例中,所述剔除单元包括:
获取子单元,用于获取重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别;
剔除子单元,用于剔除重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别的常见度满足第二预设条件的第二目标候选框,得到第三目标候选框。
在一个实施例中,所述过滤模块404具体用于:
过滤物体的类别为同一类别的第一目标候选框中物体的类别的置信度非最高的第一目标候选框,得到第二目标候选框。
在一个实施例中,所述识别模块402具体用于:
在所述目标图像的图像质量满足所述第一预设条件时,将所述目标图像输入至已训练的神经网络模型进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度。
在一个实施例中,所述物体识别装置400包括:
第四获取模块,用于在所述第二获取模块触发之后,当得到一个所述第三目标候选框时,获取一个所述第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
在一个实施例中,所述检测模块401还包括:
检测单元,用于检测所述目标图像的清晰度、色度和亮度是否在各自对应的预设正常范围内;
判定单元,用于当所述清晰度、所述色度和所述亮度均在各自对应的预设正常范围内时,判定所述目标图像满足第一预设条件。
在一个实施例中,所述物体识别装置400还包括:
处理模块,用于当所述亮度不在预设正常亮度范围且在预设处理亮度范围内时,通过高动态范围成像算法对所述目标图像进行处理,以使处理后的所述目标图像满足第一预设条件。
本申请实施例从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,可减少把背景误识别成物体的误判识别,且对同类别的第一目标候选框进行过滤,对不同类别的第二目标候选框,根据重合度进行过滤,得到第三目标候选框,再获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,从而得到识别结果,可提高对目标物体识别的准确性和稳定性。
如图5所示,本发明的一个实施例还提供一种终端设备500包括:处理器501,存储器502以及存储在所述存储器502中并可在所述处理器501上运行的计算机程序503,例如物体识别程序。所述处理器501执行所述计算机程序503时实现上述各个物体识别方法实施例中的步骤。所述处理器501执行所述计算机程序503时实现上述各装置实施例中各模块的功能,例如图4所示模块401至406的功能。
示例性的,所述计算机程序503可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器502中,并由所述处理器501执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序503在所述终端设备500中的执行过程。例如,所述计算机程序503可以被分割成检测模块,识别模块,第一获取模块,过滤模块,第二获取模块,第三获取模块,各模块具体功能在上述实施例中已有描述,此处不再赘述。
所述终端设备500可以是机器人,或者桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器501,存储器502。本领域技术人员可以理解,图5仅仅是终端设备500的示例,并不构成对终端设备500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器501可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器502可以是所述终端设备500的内部存储单元,例如终端设备500的硬盘或内存。所述存储器502也可以是所述终端设备500的外部存储设备,例如所述终端设备500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器502还可以既包括所述终端设备500的内部存储单元也包括外部存储设备。所述存储器502用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种物体识别方法,其特征在于,包括:
获取目标图像,检测所述目标图像的图像质量;
当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;
从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;
对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框中的物体的类别不同;
对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框;
当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
2.根据权利要求1所述的物体识别方法,其特征在于,所述对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框,包括:
对所有所述第二目标候选框两两计算交并比,得到所有所述第二目标候选框两两之间的重合度;
剔除重合度大于第二预设阈值的两个所述第二目标候选框中的其中一个,得到第三目标候选框。
3.根据权利要求2所述的物体识别方法,其特征在于,所述剔除重合度大于第二预设阈值的两个所述第二目标候选框中的其中一个,得到第三目标候选框,包括:
获取重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别;
剔除重合度大于第二预设阈值的两个所述第二目标候选框中物体的类别的常见度满足第二预设条件的第二目标候选框,得到第三目标候选框。
4.根据权利要求1所述的物体识别方法,其特征在于,所述对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框,包括:
过滤物体的类别为同一类别的第一目标候选框中物体的类别的置信度非最高的第一目标候选框,得到第二目标候选框。
5.根据权利要求1所述的物体识别方法,其特征在于,所述当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度,包括:
在所述目标图像的图像质量满足所述第一预设条件时,将所述目标图像输入至已训练的神经网络模型进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度。
6.根据权利要求1所述的物体识别方法,其特征在于,所述对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框之后,还包括:
当得到一个所述第三目标候选框时,获取一个所述第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
7.根据权利要求1至6任一项所述的物体识别方法,其特征在于,所述检测所述目标图像的图像质量,包括:
检测所述目标图像的清晰度、色度和亮度是否在各自对应的预设正常范围内;
当所述清晰度、所述色度和所述亮度均在各自对应的预设正常范围内时,判定所述目标图像满足第一预设条件。
8.根据权利要求7所述的物体识别方法,其特征在于,所述检测所述目标图像的清晰度、色度和亮度是否在各自对应的预设正常范围内之后,还包括:
当所述亮度不在预设正常亮度范围且在预设处理亮度范围内时,通过高动态范围成像算法对所述目标图像进行处理,以使处理后的所述目标图像满足第一预设条件。
9.一种物体识别装置,其特征在于,包括:
检测模块,用于获取目标图像,检测所述目标图像的图像质量;
识别模块,用于当所述目标图像的图像质量满足第一预设条件时,对所述目标图像进行物体识别,得到至少一个候选框、每个所述候选框中物体的类别以及每个所述候选框中物体的类别的置信度;
第一获取模块,用于从所有所述候选框中获取物体的类别的置信度大于第一预设阈值的候选框,得到第一目标候选框;
过滤模块,用于对物体的类别为同一类别的第一目标候选框进行过滤,得到第二目标候选框;其中,得到的每两个第二目标候选框之间的物体的类别不同;
第二获取模块,用于对所有所述第二目标候选框两两计算重合度,并获取重合度大于第二预设阈值的两个所述第二目标候选框中一个,得到第三目标候选框;
第三获取模块,用于当得到多个所述第三目标候选框时,获取中心位置与所述目标图像的预设中心位置之间的距离最短的第三目标候选框中物体的类别,得到所述目标图像中物体的识别结果并输出。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。
CN202011130384.0A 2020-10-21 2020-10-21 一种物体识别方法、装置、终端设备及存储介质 Active CN112348778B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011130384.0A CN112348778B (zh) 2020-10-21 2020-10-21 一种物体识别方法、装置、终端设备及存储介质
PCT/CN2020/140419 WO2022082999A1 (zh) 2020-10-21 2020-12-28 一种物体识别方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011130384.0A CN112348778B (zh) 2020-10-21 2020-10-21 一种物体识别方法、装置、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN112348778A CN112348778A (zh) 2021-02-09
CN112348778B true CN112348778B (zh) 2023-10-27

Family

ID=74359437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011130384.0A Active CN112348778B (zh) 2020-10-21 2020-10-21 一种物体识别方法、装置、终端设备及存储介质

Country Status (2)

Country Link
CN (1) CN112348778B (zh)
WO (1) WO2022082999A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158869A (zh) * 2021-04-15 2021-07-23 深圳市优必选科技股份有限公司 图像识别方法、装置、终端设备及计算机可读存储介质
CN113657333B (zh) * 2021-08-23 2024-01-12 深圳科卫机器人科技有限公司 警戒线识别方法、装置、计算机设备及存储介质
CN114677573B (zh) * 2022-05-30 2022-08-26 上海捷勃特机器人有限公司 视觉分类方法、系统、装置及计算机可读介质
CN116543189B (zh) * 2023-06-29 2023-09-26 天津所托瑞安汽车科技有限公司 一种目标检测方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557778A (zh) * 2016-06-17 2017-04-05 北京市商汤科技开发有限公司 通用物体检测方法和装置、数据处理装置和终端设备
CN106778835A (zh) * 2016-11-29 2017-05-31 武汉大学 融合场景信息和深度特征的遥感图像机场目标识别方法
CN109377508A (zh) * 2018-09-26 2019-02-22 北京字节跳动网络技术有限公司 图像处理方法和装置
CN110033424A (zh) * 2019-04-18 2019-07-19 北京迈格威科技有限公司 图像处理的方法、装置、电子设备及计算机可读存储介质
CN110852258A (zh) * 2019-11-08 2020-02-28 北京字节跳动网络技术有限公司 物体检测方法、装置、设备及存储介质
CN111047879A (zh) * 2019-12-24 2020-04-21 苏州奥易克斯汽车电子有限公司 一种车辆超速检测方法
CN111339839A (zh) * 2020-02-10 2020-06-26 广州众聚智能科技有限公司 一种密集型目标检测计量方法
CN111507204A (zh) * 2020-03-27 2020-08-07 北京百度网讯科技有限公司 倒计时信号灯的检测方法、装置、电子设备及存储介质
WO2020164282A1 (zh) * 2019-02-14 2020-08-20 平安科技(深圳)有限公司 基于yolo的图像目标识别方法、装置、电子设备和存储介质
CN111783863A (zh) * 2020-06-23 2020-10-16 腾讯科技(深圳)有限公司 一种图像处理方法、装置、设备以及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8553979B2 (en) * 2011-11-07 2013-10-08 Tandent Vision Science, Inc. Post processing for improved generation of intrinsic images
CN108776819A (zh) * 2018-06-05 2018-11-09 Oppo广东移动通信有限公司 一种目标识别方法、移动终端及计算机可读存储介质
CN111222419A (zh) * 2019-12-24 2020-06-02 深圳市优必选科技股份有限公司 一种物体识别方法、机器人以及计算机可读存储介质
CN111368698B (zh) * 2020-02-28 2024-01-12 Oppo广东移动通信有限公司 主体识别方法、装置、电子设备及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557778A (zh) * 2016-06-17 2017-04-05 北京市商汤科技开发有限公司 通用物体检测方法和装置、数据处理装置和终端设备
CN106778835A (zh) * 2016-11-29 2017-05-31 武汉大学 融合场景信息和深度特征的遥感图像机场目标识别方法
CN109377508A (zh) * 2018-09-26 2019-02-22 北京字节跳动网络技术有限公司 图像处理方法和装置
WO2020164282A1 (zh) * 2019-02-14 2020-08-20 平安科技(深圳)有限公司 基于yolo的图像目标识别方法、装置、电子设备和存储介质
CN110033424A (zh) * 2019-04-18 2019-07-19 北京迈格威科技有限公司 图像处理的方法、装置、电子设备及计算机可读存储介质
CN110852258A (zh) * 2019-11-08 2020-02-28 北京字节跳动网络技术有限公司 物体检测方法、装置、设备及存储介质
CN111047879A (zh) * 2019-12-24 2020-04-21 苏州奥易克斯汽车电子有限公司 一种车辆超速检测方法
CN111339839A (zh) * 2020-02-10 2020-06-26 广州众聚智能科技有限公司 一种密集型目标检测计量方法
CN111507204A (zh) * 2020-03-27 2020-08-07 北京百度网讯科技有限公司 倒计时信号灯的检测方法、装置、电子设备及存储介质
CN111783863A (zh) * 2020-06-23 2020-10-16 腾讯科技(深圳)有限公司 一种图像处理方法、装置、设备以及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融入帧间差分法的深度学习目标识别仿真研究;王辉;于立君;孙蓉;刘朝达;高天禹;;《实验技术与管理》;第36卷(第12期);第178-190页 *

Also Published As

Publication number Publication date
CN112348778A (zh) 2021-02-09
WO2022082999A1 (zh) 2022-04-28

Similar Documents

Publication Publication Date Title
CN112348778B (zh) 一种物体识别方法、装置、终端设备及存储介质
CN112528878B (zh) 检测车道线的方法、装置、终端设备及可读存储介质
CN110705405B (zh) 目标标注的方法及装置
CN109117773B (zh) 一种图像特征点检测方法、终端设备及存储介质
EP3709266A1 (en) Human-tracking methods, apparatuses, systems, and storage media
US11455831B2 (en) Method and apparatus for face classification
CN111191582B (zh) 三维目标检测方法、检测装置、终端设备及计算机可读存储介质
CN110781770B (zh) 基于人脸识别的活体检测方法、装置及设备
CN112085701A (zh) 一种人脸模糊度检测方法、装置、终端设备及存储介质
CN111898610B (zh) 卡片缺角检测方法、装置、计算机设备及存储介质
CN112069887A (zh) 一种人脸识别方法、装置、终端设备及存储介质
CN108805838B (zh) 一种图像处理方法、移动终端及计算机可读存储介质
CN108960246B (zh) 一种用于图像识别的二值化处理装置及方法
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
CN112488054B (zh) 一种人脸识别方法、装置、终端设备及存储介质
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN111507252A (zh) 人体跌倒检测装置、方法、电子终端及存储介质
CN108629219B (zh) 一种识别一维码的方法及装置
CN113705643B (zh) 一种目标物检测方法、装置以及电子设备
CN116246298A (zh) 一种空间占用人数统计方法、终端设备及存储介质
CN113840135A (zh) 色偏检测方法、装置、设备及存储介质
CN112069885A (zh) 人脸属性识别方法、装置及移动终端
CN112348905B (zh) 一种颜色识别方法、装置、终端设备及存储介质
CN112949423B (zh) 物体识别方法、物体识别装置及机器人
CN116071586A (zh) 图像筛选方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant