CN114821026A - 目标检索方法、电子设备和计算机可读介质 - Google Patents
目标检索方法、电子设备和计算机可读介质 Download PDFInfo
- Publication number
- CN114821026A CN114821026A CN202210325406.1A CN202210325406A CN114821026A CN 114821026 A CN114821026 A CN 114821026A CN 202210325406 A CN202210325406 A CN 202210325406A CN 114821026 A CN114821026 A CN 114821026A
- Authority
- CN
- China
- Prior art keywords
- candidate
- target
- feature information
- similarity
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了目标检索方法、电子设备和计算机可读介质。该方法的实施例包括:对待测图像进行目标检测,并基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象,候选对象与目标对象同类别,候选关联对象与目标对象关联的目标关联对象同类别;提取各候选对象以及各候选关联对象的特征信息;基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。该实施方式提高了目标检索的准确性。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及目标检索方法、电子设备和计算机可读介质。
背景技术
随着计算机视觉技术和深度学习技术的飞速发展,在越来越多的场景,需要使用目标检索技术查找具有指定特征的目标对象。通过目标检索,可快速查找到图像中的目标对象。
现有技术中,通常将待测图像中的对象的特征与目标对象的特征进行相似度比对,基于相似度比对结果检索待测图像中的目标对象。这种方式仅关注了目标对象本身的特征,考虑的特征较为单一,导致目标检索的准确性较低。
发明内容
本申请实施例提出了目标检索方法、电子设备和计算机可读介质,以解决现有技术中目标检索的准确性较低的技术问题。
第一方面,本申请实施例提供了一种目标检索方法,该方法包括:对待测图像进行目标检测,并基于检测结果确定所述待测图像中的候选对象以及候选对象关联的候选关联对象,所述候选对象与目标对象同类别,所述候选关联对象与所述目标对象关联的目标关联对象同类别;提取各候选对象以及各候选关联对象的特征信息;基于所提取的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,检索候选对象中的目标对象。
第二方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中所描述的方法。
第三方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所描述的方法。
第四方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面中所描述的方法。
本申请实施例提供的目标检索方法、电子设备和计算机可读介质,通过对待测图像进行目标检测,并基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象,而后提取各候选对象以及各候选关联对象的特征信息,从而基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。由此,可在目标检索过程中同时考虑目标对象的特征以及目标对象关联的目标关联对象的特征,融合了图像中与目标对象相关的更多信息,相较于仅使用单一特征,提高了目标检索的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的目标检索方法的一个实施例的流程图;
图2是根据本申请的目标检索方法中一种综合相似度确定过程的流程图;
图3是根据本申请的目标检索方法中又一种综合相似度确定过程的流程图;
图4是根据本申请的目标检索装置的一个实施例的结构示意图;
图5是用于实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要指出的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
近年来,基于人工智能的计算机视觉、深度学习、机器学习、图像处理、图像识别等技术研究取得了重要进展。人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸人的智能的理论、方法、技术及应用系统的新兴科学技术。人工智能学科是一门综合性学科,涉及芯片、大数据、云计算、物联网、分布式存储、深度学习、机器学习、神经网络等诸多技术种类。计算机视觉作为人工智能的一个重要分支,具体是让机器识别世界,计算机视觉技术通常包括人脸识别、活体检测、指纹识别与防伪验证、生物特征识别、人脸检测、行人检测、目标检测、行人识别、图像处理、图像识别、图像语义理解、图像检索、文字识别、视频处理、视频内容识别、行为识别、三维重建、虚拟现实、增强现实、同步定位与地图构建(SLAM)、计算摄影、机器人导航与定位等技术。随着人工智能技术的研究和进步,该项技术在众多领域展开了应用,例如安防、城市管理、交通管理、楼宇管理、园区管理、人脸通行、人脸考勤、物流管理、仓储管理、机器人、智能营销、计算摄影、手机影像、云服务、智能家居、穿戴设备、无人驾驶、自动驾驶、智能医疗、人脸支付、人脸解锁、指纹解锁、人证核验、智慧屏、智能电视、摄像机、移动互联网、网络直播、美颜、美妆、医疗美容、智能测温等领域。
对于目标检索领域,可结合人工智能技术实现目标的查找和确定。本申请提供了一种有利于提高目标检索的准确性的对焦方法。
请参考图1,其示出了根据本申请的目标检索方法的一个实施例的流程100。该目标检索方法可应用于各种电子设备,上述电子设备包括但不限于:智能手机、平板电脑、电子书阅读器、膝上型便携计算机、车载电脑、掌上电脑、台式计算机、机顶盒、智能电视机、相机、可穿戴设备等。该目标检索方法,包括以下步骤:
步骤101,对待测图像进行目标检测,并基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象。
在本实施例中,目标检索方法的执行主体可以首先获取待测图像。待测图像可以是任一待进行目标检索的图像,例如,可以由某个指定的图像采集装置(如摄像头)实时采集的图像,也可以是预先存储的某个图像,此处不作具体限定。
在获取到待测图像后,可采用目标检测技术对待测图像进行目标检测,得到检测结果。具体地,上述执行主体可存储有预先训练的目标检测模型。目标检测模型可用于对图像中的作为检测目标的对象的类别和位置进行检测。作为检测目标的对象可以包括但不限于人脸、人体、机动车、非机动车、车牌、动物、景物等一项或多项预先设定的对象。在利用目标检测模型对待测图像进行目标检测后,可得到检测结果。检测结果中可包括检测出的若干对象对应的检测框的位置信息和类别信息。其中,位置信息可包含所检测出的对象所在的检测框的坐标,类别信息可用于指示所检测出的对象的类别。
在本实施例中,可将待检测的目标作为目标对象,并将其关联对象称为目标关联对象。目标关联对象可在目标对象的检测过程中提供辅助作用。在得到检测结果后,上述执行主体可以基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象。其中,候选对象与候选关联对象的关联关系的类型,可以与目标对象与目标关联对象的关联关系的类型相同。例如,关联关系的类型可包括但不限于“人脸-人体”、“人体-机动车”、“人体-非机动车”、“车牌-机动车”、“车牌-非机动车”等。若目标对象与目标关联对象的关联关系的类型是“人脸-人体”,则候选标对象与候选关联对象的关联关系的类型也是“人脸-人体”。若目标对象与目标关联对象的关联关系的类型是“人体-非机动车”,则候选标对象与候选关联对象的关联关系的类型也是“人体-非机动车”。此处不再一一赘述。
由于候选对象与候选关联对象的关联关系的类型相同于目标对象与目标关联对象的关联关系的类型,因此,候选对象与目标对象具有相同类别,候选关联对象与目标对象关联的目标关联对象具有相同类别。作为示例,若目标对象是人脸,目标对象关联的目标关联对象是人体,则候选对象也是人脸,候选关联对象也是人体。若目标对象是人体,目标对象关联的目标关联对象是非机动车,则候选对象也是人体,候选关联对象也是非机动车。此处不再一一赘述。
需要说明的是,对于某个候选对象(如人体),待测图像中可以存在该候选对象关联的候选关联对象(如非机动车),也可以不存在该候选对象关联的候选关联对象(即该候选对象未乘坐任何交通工具等场景),此处不作具体限定。
步骤102,提取各候选对象以及各候选关联对象的特征信息。
在本实施例中,上述执行主体可以存储或调用有预先训练的若干识别模型。每个识别模型可用于识别至少一种类别的对象。每个识别模型可对图像进行特征提取,以得到特征信息。在确定出待测图像中的候选对象及其关联的候选关联对象后,上述执行主体可以基于候选对象的类别以及候选关联对象的类别,调用适用于识别候选对象以及候选关联对象的识别模型,通过所调用的识别模型,提取各候选对象以及各候选关联对象的特征信息。
具体地,上述执行主体可以首先截取每个候选对象的检测框内的子图像以及每个候选关联对象的检测框内的子图像。而后,可将每个候选对象的检测框内的子图像输入至用于识别相应类别对象的识别模型,以提取每个候选对象的特征信息。同理,可将每个候选关联对象的检测框内的子图像输入至用于识别相应类别对象的识别模型,以提取每个候选关联对象的特征信息。
作为示例,候选对象可以是车牌,候选关联对象可以是机动车。上述执行主体可以利用预先训练的车牌识别模型,提取待测图像中各车牌区域的子图像的特征信息。同理,可以利用预先训练的机动车识别模型,提取待测图像中各机动车区域的子图像的特征信息。
步骤103,基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。
在本实施例中,上述执行主体可预先存储或实时调用目标对象的特征信息以及目标关联对象的特征信息。目标对象的特征信息以及目标关联对象的特征信息可采用步骤102中的方式预先获取并存储,此处不再赘述。在提取各候选对象以及各候选关联对象的特征信息后,可以基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。
此处,可采用多种方式进行目标对象的检索。例如,可以先对候选对象及其候选关联对象进行特征信息融合,并将目标对象以及目标候选对象进行特征信息融合;而后将融合后的特征信息进行比对,基于比对结果检索目标对象。再例如,可以分别进行候选对象与目标对象的特征信息比对以及候选关联对象与目标关联对象的特征信息比对;而后将比对结果进行融合,进而基于融合结果检索目标对象。再例如,还可以先对候选对象与目标对象进行特征信息比对,而后基于比对结果对候选对象进行筛选,之后对筛选后的候选对象及其候选关联对象的特征信息进行融合,进而基于融合结果检索目标对象。
通过对待测图像进行目标检测,并基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象,而后提取各候选对象以及各候选关联对象的特征信息,从而基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。由此,可在目标检索过程中同时考虑目标对象的特征以及目标对象关联的目标关联对象的特征,融合了图像中与目标对象相关的更多信息,相较于仅使用单一特征,提高了目标检索的准确性。
在一些可选的实施例中,可以按照如下步骤确定待测图像中的候选对象以及候选关联对象:首先,将待测图像输入至预先训练的第一目标检测模型,得到第一检测结果。其中,第一目标检测模型可采用机器学习方法(如有监督学习方法)对卷积神经网络等结构的网络模型预先训练后得到。第一目标检测模型可用于检测图像中的第一类别对象、第二类别对象以及所述第一类别对象与第二类别对象的关联关系,第一类别为目标对象的类别,第二类别为所述目标对象关联的目标关联对象的类别。相应的,第一检测结果中可包括待测图像中的第一类别对象的检测框的位置信息、第二类别对象的检测框的位置信息、以及第一类别对象的检测框与第二类别对象的检测框之间的关联关系信息。例如,第一目标检测模型可以用于检测图像中的车牌、机动车以及车牌和机动车的关联关系。此时,第一检测结果中可包括图像中的车牌检测框的位置信息、机动车检测框的位置信息以及车牌检测框和机动车检测框的关联关系信息。之后,可将第一检测结果所指示的待测图像中的第一类别对象确定为候选对象,如上例中的车牌检测框内的对象。对于每个候选对象,可将待测图像中与该候选对象存在关联关系的第二类别对象确定为候选关联对象,如上例中与车牌检测框存在关联关系的机动车检测框内的对象。由此,可快速确定出待测图像中的候选对象以及候选关联对象。
在一些可选的实施例中,在确定待测图像中的候选对象以及候选对象关联的候选关联对象之后,所述执行主体还可以对候选关联对象的位置进行修正,以使得候选关联对象的位置更准确。具体地,可以首先将待测图像输入至预先训练的用于检测所述第二类别对象的第二目标检测模型,得到第二检测结果。第二检测结果中可包括待测图像中的第二类别对象的检测框的位置信息。继续上例,第二检测结果中可包括若干机动车检测框的位置信息。由于第一目标检测模型与第二目标检测模型不同,因此第二检测结果中的机动车检测框的位置信息与第一检测结果中的机动车检测框的位置信息可以不同。之后,对于每个候选关联对象,确定该候选关联对象的检测框与第二检测结果中各检测框的交并比,基于交并比确定第二检测结果中与该候选关联对象的检测框对应的目标检测框(如将交并比最大且大于目标值的检测框作为目标检测框),并基于所述目标检测框的位置,修正该候选关联对象的位置。由此,可使用更具有针对性的目标检测模型的检测结果更新候选关联对象的位置,提高了候选关联对象的位置的准确性,由此可使后续特征提取以及目标检索更为准确。
在一些可选的实施例中,可以按照如下步骤检索候选对象中的目标对象:
第一步,基于各候选对象的特征信息、各候选关联对象的特征信息、目标对象的特征信息以及目标关联对象的特征信息,确定各候选对象与目标对象的相似度。此处,可采用欧氏距离等相似度计算方式,确定特征信息之间的相似度,从而基于所确定出的相似度,确定候选对象与目标对象的相似度。
第二步,基于所确定出的相似度,从所确定的候选对象中检索目标对象。此处,可按照相似度由大到小的次序对候选对象进行排序,确定出相似度最大的候选对象。若该候选对象与目标对象的相似度大于预设阈值,可将该候选对象确定为目标对象。
在一些可选的实施例中,由于候选对象可能具有候选关联对象,也可能不具有候选关联对象,因此在上述第一步中,可首先将具有候选关联对象的候选对象作为第一候选对象,将不具有候选关联对象的候选对象作为第二候选对象。而后,基于各第一候选对象的特征信息、各第一候选对象关联的候选关联对象的特征信息、目标对象的特征信息以及目标关联对象的特征信息,确定各第一候选对象与目标对象的综合相似度。最后,基于各第二候选对象的特征信息和目标对象的特征信息,确定各第二候选对象与目标对象的单独相似度。在上述第二步中,可基于综合相似度和单独相似度,从所确定的候选对象中检索目标对象。例如,可以将综合相似度与单独相似度混排,基于混排结果检索目标对象。由此,可在候选对象不存在候选关联对象时,依然能够有效检索出候选对象中的目标对象,提高了目标检索的召回率。
在一些可选的实施例中,可采用融合特征信息的方式确定融合相似度。具体可参见图2以及如下子步骤S11至子步骤S13:
子步骤S11,将目标对象的特征信息和目标关联对象的特征信息进行融合,得到第一融合特征信息。此处,可直接将目标对象的特征信息和目标关联对象的特征信息进行拼接(concat),得到第一融合特征信息。
子步骤S12,对于每个第一候选对象,将该第一候选对象的特征信息与该第一候选对象关联的候选关联对象的特征信息进行融合,得到该第一候选对象对应的第二融合特征信息。此处,可直接将该第一候选对象的特征信息和该候选对象关联的候选关联对象的特征信息进行拼接(concat),得到该第一候选对象对应的第二融合特征信息。
子步骤S13,将各第一候选对象的第二融合特征信息与第一融合特征信息进行比对,得到各第一候选对象与目标对象的综合相似度。此处,可采用欧氏距离等相似度计算方式进行比对,确定各第一候选对象与目标对象的综合相似度。
由此,可以将第一候选对象以及图像中与该第一候选对象相关的信息相融合,相较于仅使用单一特征,提高了目标检索的准确性。
在一些可选的实施例中,可采用融合相似度的方式确定综合相似度。具体可参见图3以及如下子步骤S21至子步骤S23:
子步骤S21,确定各第一候选对象的特征信息与目标对象的特征信息的第一相似度。此处,也可采用欧氏距离等相似度计算方式进行比对,确定第一相似度。
子步骤S22,确定各候选对象关联的候选关联对象的特征信息与目标关联对象的特征信息的第二相似度。此处,也可采用欧氏距离等相似度计算方式进行比对,确定第二相似度。
子步骤S23,对于每个第一候选对象,将该第一候选对象对应的第一相似度和第二相似度加权求和,得到该第一候选对象与目标对象的综合相似度。其中,第一相似度与第二相似度的权重可根据需要进行预先设定,此处对其具体数值不作限定。
由此,可以将第一候选对象以及图像中与该第一候选对象相关的信息相融合,以关联对象的信息作为辅助,进行目标对象的检索。相较于仅使用单一特征,提高了目标检索的准确性。
在一些可选的本实施例中,在将具有候选关联对象的候选对象作为第一候选对象,将不具有候选关联对象的候选对象作为第二候选对象之前,上述执行主体还可以基于各候选对象的特征信息与预存的目标对象的特征信息,确定各候选对象与目标对象的第三相似度。而后,滤除第三相似度小于目标阈值的候选对象以及所滤除的候选对象关联的候选关联对象。从而基于剩余的候选对象的特征信息、候选关联对象的特征信息、目标对象的特征信息以及目标关联对象的特征信息,从剩余的候选对象中检索目标对象。由此,可在候选对象数量较多时,大大减少数据计算量,提高目标检索效率。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种目标检索装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的目标检索装置400包括:检测单元401,用于对待测图像进行目标检测,并基于检测结果确定上述待测图像中的候选对象以及候选对象关联的候选关联对象,上述候选对象与目标对象同类别,上述候选关联对象与上述目标对象关联的目标关联对象同类别;提取单元402,用于提取各候选对象以及各候选关联对象的特征信息;检索单元403,用于基于所提取的特征信息、上述目标对象的特征信息以及上述目标关联对象的特征信息,检索候选对象中的目标对象。
在本实施例的一些可选的实现方式中,上述检索单元403,进一步用于基于各候选对象的特征信息、各候选关联对象的特征信息、上述目标对象的特征信息以及上述目标关联对象的特征信息,确定各候选对象与上述目标对象的相似度;基于所确定出的相似度,从所确定的候选对象中检索目标对象。
在本实施例的一些可选的实现方式中,上述检索单元403,进一步用于将具有候选关联对象的候选对象作为第一候选对象,将不具有候选关联对象的候选对象作为第二候选对象;基于各第一候选对象的特征信息、各第一候选对象关联的候选关联对象的特征信息、上述目标对象的特征信息以及上述目标关联对象的特征信息,确定各第一候选对象与上述目标对象的综合相似度;基于各第二候选对象的特征信息和上述目标对象的特征信息,确定各第二候选对象与上述目标对象的单独相似度;以及,上述检索单元403,进一步用于基于所述综合相似度和所述单独相似度,从所确定的候选对象中检索目标对象。
在本实施例的一些可选的实现方式中,上述检索单元403,进一步用于将上述目标对象的特征信息和上述目标关联对象的特征信息进行融合,得到第一融合特征信息;对于每个第一候选对象,将该第一候选对象的特征信息与该第一候选对象关联的候选关联对象的特征信息进行融合,得到该第一候选对象对应的第二融合特征信息;将各第一候选对象的第二融合特征信息与上述第一融合特征信息进行比对,得到各第一候选对象与上述目标对象的综合相似度。
在本实施例的一些可选的实现方式中,上述检索单元403,进一步用于确定各第一候选对象的特征信息与上述目标对象的特征信息的第一相似度;确定各候选对象关联的候选关联对象的特征信息与上述目标关联对象的特征信息的第二相似度;对于每个第一候选对象,将该第一候选对象对应的第一相似度和第二相似度加权求和,得到该第一候选对象与上述目标对象的综合相似度。
在本实施例的一些可选的实现方式中,上述装置还包括:滤除单元,用于基于各候选对象的特征信息与预存的目标对象的特征信息,确定各候选对象与上述目标对象的第三相似度;滤除第三相似度小于目标阈值的候选对象以及所滤除的候选对象关联的候选关联对象。
在本实施例的一些可选的实现方式中,上述检测单元301,进一步用于将待测图像输入至预先训练的第一目标检测模型,得到第一检测结果,上述第一目标检测模型用于检测图像中的第一类别对象、第二类别对象以及上述第一类别对象与第二类别对象的关联关系,第一类别为目标对象的类别,第二类别为上述目标对象关联的目标关联对象的类别;将上述第一检测结果所指示的上述待测图像中的第一类别对象确定为候选对象;对于每个候选对象,将上述待测图像中与该候选对象存在关联关系的第二类别对象确定为候选关联对象。
在本实施例的一些可选的实现方式中,上述装置还包括修正单元,用于将上述待测图像输入至预先训练的用于检测上述第二类别对象的第二目标检测模型,得到第二检测结果;对于每个候选关联对象,确定该候选关联对象的检测框与上述第二检测结果中各检测框的交并比,基于上述交并比确定上述第二检测结果中与该候选关联对象的检测框对应的目标检测框,并基于上述目标检测框的位置,修正该候选关联对象的位置。
本申请的上述实施例提供的装置,通过对待测图像进行目标检测,并基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象,而后提取各候选对象以及各候选关联对象的特征信息,从而基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。由此,可在目标检索过程中同时考虑目标对象的特征以及目标对象关联的目标关联对象的特征,融合了图像中与目标对象相关的更多信息,相较于仅使用单一特征,提高了目标检索的准确性。
本申请实施例还提供了一种电子设备,包括一个或多个处理器,存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述目标检索方法。
下面参考图5,其示出了用于实现本申请的一些实施例的电子设备的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁盘、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述目标检索方法。
特别地,根据本申请的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本申请的一些实施例的方法中限定的上述功能。
本申请实施例还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现上述目标检索方法。
需要说明的是,本申请的一些实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperTextTransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:对待测图像进行目标检测,并基于检测结果确定待测图像中的候选对象以及候选对象关联的候选关联对象,候选对象与目标对象同类别,候选关联对象与目标对象关联的目标关联对象同类别;提取各候选对象以及各候选关联对象的特征信息;基于所提取的特征信息、目标对象的特征信息以及目标关联对象的特征信息,检索候选对象中的目标对象。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的一些实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++;还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接),上述网络包括局域网(LAN)或广域网(WAN)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一确定单元、第二确定单元、选取单元和第三确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类别的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本申请的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (11)
1.一种目标检索方法,其特征在于,所述方法包括:
对待测图像进行目标检测,并基于检测结果确定所述待测图像中的候选对象以及候选对象关联的候选关联对象,所述候选对象与目标对象同类别,所述候选关联对象与所述目标对象关联的目标关联对象同类别;
提取各候选对象以及各候选关联对象的特征信息;
基于所提取的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,检索候选对象中的目标对象。
2.根据权利要求1所述的方法,其特征在于,所述基于所提取的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,检索候选对象中的目标对象,包括:
基于各候选对象的特征信息、各候选关联对象的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,确定各候选对象与所述目标对象的相似度;
基于所确定出的相似度,从所确定的候选对象中检索目标对象。
3.根据权利要求2所述的方法,其特征在于,所述基于各候选对象的特征信息、各候选关联对象的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,确定各候选对象与所述目标对象的相似度,包括:
将具有候选关联对象的候选对象作为第一候选对象,将不具有候选关联对象的候选对象作为第二候选对象;
基于各第一候选对象的特征信息、各第一候选对象关联的候选关联对象的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,确定各第一候选对象与所述目标对象的综合相似度;
基于各第二候选对象的特征信息和所述目标对象的特征信息,确定各第二候选对象与所述目标对象的单独相似度;
所述基于所确定出的相似度,从所确定的候选对象中检索目标对象,包括:
基于所述综合相似度和所述单独相似度,从所确定的候选对象中检索目标对象。
4.根据权利要求3所述的方法,其特征在于,所述基于各第一候选对象的特征信息、各第一候选对象关联的候选关联对象的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,确定各第一候选对象与所述目标对象的综合相似度,包括:
将所述目标对象的特征信息和所述目标关联对象的特征信息进行融合,得到第一融合特征信息;
对于每个第一候选对象,将该第一候选对象的特征信息与该第一候选对象关联的候选关联对象的特征信息进行融合,得到该第一候选对象对应的第二融合特征信息;
将各第一候选对象的第二融合特征信息与所述第一融合特征信息进行比对,得到各第一候选对象与所述目标对象的综合相似度。
5.根据权利要求3所述的方法,其特征在于,所述基于各第一候选对象的特征信息、各第一候选对象关联的候选关联对象的特征信息、所述目标对象的特征信息以及所述目标关联对象的特征信息,确定各第一候选对象与所述目标对象的综合相似度,包括:
确定各第一候选对象的特征信息与所述目标对象的特征信息的第一相似度;
确定各候选对象关联的候选关联对象的特征信息与所述目标关联对象的特征信息的第二相似度;
对于每个第一候选对象,将该第一候选对象对应的第一相似度和第二相似度加权求和,得到该第一候选对象与所述目标对象的综合相似度。
6.根据权利要求3-5之一所述的方法,其特征在于,在所述将具有候选关联对象的候选对象作为第一候选对象,将不具有候选关联对象的候选对象作为第二候选对象之前,所述方法还包括:
基于各候选对象的特征信息与预存的目标对象的特征信息,确定各候选对象与所述目标对象的第三相似度;
滤除第三相似度小于目标阈值的候选对象以及所滤除的候选对象关联的候选关联对象。
7.根据权利要求1所述的方法,其特征在于,所述对待测图像进行目标检测,并基于检测结果确定所述待测图像中的候选对象以及候选对象关联的候选关联对象,包括:
将待测图像输入至预先训练的第一目标检测模型,得到第一检测结果,所述第一目标检测模型用于检测图像中的第一类别对象、第二类别对象以及所述第一类别对象与第二类别对象的关联关系,第一类别为目标对象的类别,第二类别为所述目标对象关联的目标关联对象的类别;
将所述第一检测结果所指示的所述待测图像中的第一类别对象确定为候选对象;
对于每个候选对象,将所述待测图像中与该候选对象存在关联关系的第二类别对象确定为候选关联对象。
8.根据权利要求7所述的方法,其特征在于,在确定所述待测图像中的候选对象以及候选对象关联的候选关联对象之后,所述方法还包括:
将所述待测图像输入至预先训练的用于检测所述第二类别对象的第二目标检测模型,得到第二检测结果;
对于每个候选关联对象,确定该候选关联对象的检测框与所述第二检测结果中各检测框的交并比,基于所述交并比确定所述第二检测结果中与该候选关联对象的检测框对应的目标检测框,并基于所述目标检测框的位置,修正该候选关联对象的位置。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210325406.1A CN114821026A (zh) | 2022-03-30 | 2022-03-30 | 目标检索方法、电子设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210325406.1A CN114821026A (zh) | 2022-03-30 | 2022-03-30 | 目标检索方法、电子设备和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114821026A true CN114821026A (zh) | 2022-07-29 |
Family
ID=82532248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210325406.1A Pending CN114821026A (zh) | 2022-03-30 | 2022-03-30 | 目标检索方法、电子设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114821026A (zh) |
-
2022
- 2022-03-30 CN CN202210325406.1A patent/CN114821026A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108520220B (zh) | 模型生成方法和装置 | |
KR20190072563A (ko) | 얼굴 라이브니스 검출 방법 및 장치, 그리고 전자 디바이스 | |
CN111444744A (zh) | 活体检测方法、装置以及存储介质 | |
CN113792871A (zh) | 神经网络训练方法、目标识别方法、装置和电子设备 | |
CN111078940B (zh) | 图像处理方法、装置、计算机存储介质及电子设备 | |
CN111523413A (zh) | 生成人脸图像的方法和装置 | |
CN111310770A (zh) | 目标检测方法和装置 | |
CN113177559B (zh) | 结合广度和密集卷积神经网络的图像识别方法、系统、设备及介质 | |
CN111723728A (zh) | 基于双向交互网络的行人搜索方法、系统、装置 | |
WO2024083121A1 (zh) | 一种数据处理方法及其装置 | |
CN115577768A (zh) | 半监督模型训练方法和装置 | |
CN114943937A (zh) | 行人重识别方法、装置、存储介质及电子设备 | |
CN112037305B (zh) | 对图像中的树状组织进行重建的方法、设备及存储介质 | |
CN116152938A (zh) | 身份识别模型训练和电子资源转移方法、装置及设备 | |
CN111310595B (zh) | 用于生成信息的方法和装置 | |
CN114387465A (zh) | 图像识别方法、装置、电子设备和计算机可读介质 | |
CN114677620A (zh) | 对焦方法、电子设备和计算机可读介质 | |
CN111291640B (zh) | 用于识别步态的方法和装置 | |
CN113869367A (zh) | 模型能力检测方法、装置、电子设备和计算机可读介质 | |
CN115131291A (zh) | 对象计数模型的训练方法、装置、设备以及存储介质 | |
CN114005017A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN114821026A (zh) | 目标检索方法、电子设备和计算机可读介质 | |
CN114373071A (zh) | 目标检测方法、装置及电子设备 | |
CN114842411A (zh) | 一种基于互补时空信息建模的群体行为识别方法 | |
CN114372580A (zh) | 模型训练方法、存储介质、电子设备和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |