CN111598164B - 识别目标对象的属性的方法、装置、电子设备和存储介质 - Google Patents

识别目标对象的属性的方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111598164B
CN111598164B CN202010413453.2A CN202010413453A CN111598164B CN 111598164 B CN111598164 B CN 111598164B CN 202010413453 A CN202010413453 A CN 202010413453A CN 111598164 B CN111598164 B CN 111598164B
Authority
CN
China
Prior art keywords
target object
attribute information
attribute
target
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010413453.2A
Other languages
English (en)
Other versions
CN111598164A (zh
Inventor
袁宇辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010413453.2A priority Critical patent/CN111598164B/zh
Publication of CN111598164A publication Critical patent/CN111598164A/zh
Application granted granted Critical
Publication of CN111598164B publication Critical patent/CN111598164B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请的实施例公开了用于识别目标对象的属性的方法、装置、电子设备以及存储介质,涉及图像识别技术领域。具体实现方案为:获取待识别图像和目标对象的待识别属性信息,采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征,采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征,将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征,基于第一融合后特征进行分类,得到目标对象的属性信息的识别结果。该方法能够针对目标对象进行指定待识别属性信息的识别,提高了属性信息识别的针对性和准确率。

Description

识别目标对象的属性的方法、装置、电子设备和存储介质
技术领域
本申请的实施例涉及计算机技术领域,进一步涉及图像识别技术领域,具体涉及用于识别目标对象的属性的方法、装置、电子设备以及存储介质。
背景技术
随着人工智能技术的不断发展,越来越多的场景需要借助图像识别技术进行图像中的目标对象的属性识别。
在应用场景中,根据识别出的目标对象的属性特征可以确定出目标对象的类别,例如可以确定出动物的品种、车辆的车型等。
发明内容
提供了一种用于识别目标对象的属性的方法、装置、设备以及存储介质。
根据第一方面,提供了一种用于识别目标对象的属性的方法,该方法包括:获取待识别图像和目标对象的待识别属性信息;采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征;采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征;将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征;基于第一融合后特征进行分类,得到目标对象的属性信息的识别结果。
根据第二方面,提供了一种用于识别目标对象的属性的装置,该装置包括:获取单元,被配置成获取待识别图像和目标对象的待识别属性信息;第一提取单元,被配置成采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征;第二提取单元,被配置成采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征;第一融合单元,被配置成将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征;识别单元,被配置成基于第一融合后特征进行分类,得到目标对象的属性信息的识别结果。
根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面描述的方法。
根据本申请的技术,能够针对目标对象进行指定待识别属性信息的识别,提高了属性信息识别的针对性和准确率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的用于识别目标对象的方法的一个实施例的流程图;
图3是根据本申请的用于识别目标对象的方法的又一个实施例的流程图;
图4是生成上述目标检测网络、目标对象特征提取网络、属性特征提取网络的一个实现方式的流程图;
图5是根据本申请的用于识别目标对象的属性的装置的一个实施例的结构示意图;
图6是适于用来实现本申请的实施例的电子设备的结构示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了可以应用本申请的用于识别目标对象的属性的方法或用于识别目标对象的属性的装置的示例性架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如图像编辑类应用、文本编辑类应用、浏览器类应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持互联网访问的各种电子设备,包括但不限于智能手机、平板电脑、笔记本电脑、和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如提供目标识别服务的服务器。服务器可以从终端设备101、102、103获取待识别图像以及目标对象的指定的待识别属性信息,利用训练完成的神经网络模型对待识别图像进行目标对象的属性的识别,还可以将识别结果反馈至终端设备101、102、103。
需要说明的是,本公开的实施例所提供的用于识别目标对象的属性的方法一般由服务器105执行,相应地,用于识别目标对象的属性的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于识别目标对象的属性的方法的一个实施例的流程200。该用于识别目标对象的属性的方法包括以下步骤:
步骤201,获取待识别图像和目标对象的待识别属性信息。
在本实施例中,上述用于识别目标对象的属性的方法的执行主体(例如图1所示的服务器105)可以从预先存储的图像库中获取待识别图像,上述执行主体也可以通过监测设备获取待识别图像,监测设备例如可以是摄像头或者道路监控探头等。
在这里,目标对象可以是待识别的实体,目标对象可以是位置可变的对象,例如动物、行人、车辆等,目标对象也可以是位置固定的对象,例如建筑物、景观等。上述目标对象的数量可以是一个,也可以是多个。待识别图像可以包含目标对象或其他的对象。目标对象的待识别属性信息可以是指定的、需要识别的目标对象的某一种特征,例如动物属性信息可以是动物某一部位的颜色等,车辆属性信息可以是车型、机动车号牌等。上述目标对象的待识别属性信息所归属的属性类别可以是一个,也可以是多个。该待识别属性信息可以是用户指定的并由上述执行主体通过用户设备获取。
步骤202,采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征。
在本实施例中,上述执行主体可以利用预先训练的目标检测网络检测待识别图像中的目标对象并确定出目标对象区域,再利用目标对象特征提取网络从目标对象区域中提取出目标对象的对象特征。上述执行主体可以使用目标检测算法R-CNN(Region-Convolutional Neural Networks,区域卷积神经网络)对样本图像进行目标对象的检测。目标对象特征提取网络可以是预先训练的用于提取图像中目标对象的特征的神经网络,其可以基于包含目标对象的样本图像预先训练,或者可以从用于识别目标对象的神经网络中抽取出其中的特征提取网络,作为目标对象特征提取网络。
在这里,目标对象区域可以是目标对象的矩形包围盒的区域,目标对象区域的位置可以用目标对象在待识别图像中的矩形包围盒的位置坐标来表示。对象特征是表征目标对象的形状、颜色、位置等属性的特征,可以是局部特征或全局特征。
在本实施的一些可选的实现方式中,上述用于识别目标对象的属性的方法还包括:响应于确定从待识别图像中检测出至少两个目标对象,将检测出的各目标对象的区域缩放至预设尺寸。
在该实现方式中,上述执行主体可以在从待识别图像中检测出至少两个目标对象后,将各目标对象的区域的尺寸进行统一,缩放至预设尺寸,例如上述执行主体可以对待识别图像中的各目标对象的区域进行减去均值除以方差的预处理。上述执行主体可以根据缩放后的目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征。
通过该实现方式,可以将不同尺寸的各目标对象的区域转换成统一尺寸的区域,统一进行目标对象的对象特征的提取。
步骤203,采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征。
在本实施例中,上述执行主体可以利用预先训练的属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征。在这里,待识别属性信息的属性特征可以用来表征待识别属性信息。
属性特征提取网络是用于提取指定的待识别属性信息的特征的网络。在这里,表征待识别属性信息的文本序列被转换为向量序列后,可以输入至属性特征提取网络,属性特征提取网络可以对输入的向量序列进行转换,输出的特征向量或特征矩阵,作为待识别属性信息的属性特征。
步骤204,将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征。
在本实施例中,上述执行主体可以将步骤202中的目标对象的对象特征与步骤203中的待识别属性信息的属性特征采用拼接、加权求和、平均值计算等融合方式进行融合,得到第一融合后特征。
步骤205,基于第一融合后特征进行分类,得到目标对象的属性信息的识别结果。
在本实施例中,上述执行主体可以将第一融合后特征输入至分类网络,确定出目标对象的属性信息的识别结果。目标对象的属性信息的识别结果可以是目标对象的属性信息为各预设属性的概率,或者可以是目标对象的属性信息是否为某一预设属性。
例如,目标对象为鸟,其待识别的属性信息为腹部颜色,对应的属性信息识别结果可以是待识别图像中鸟的腹部颜色分别为红色、白色、灰色、黑色的概率,或者可以是图像中鸟的腹部颜色为红色/不为红色。
本实施例的上述用于识别目标对象的属性的方法,通过分别利用目标对象特征提取网络提取待识别图图像中的目标对象的特征、利用属性特征提取网络提取待识别属性信息的属性特征,并对二者进行融合,能够生成包含待识别属性信息的目标对象的特征,从而基于融合特征进行分类时利用了待识别属性信息,使得分类器能够准确地针对目标对象的待识别属性信息进行分类。
在本实施的一些可选的实现方式中,上述执行主体可以按照如下方式将图像特征与第一融合后特征融合:对图像特征和第一融合后特征中尺寸较小的一个上采样后对二者进行特征拼接。
在该实现方式中,上述执行主体可以先确定图像特征和第一融合后特征的尺寸,然后对两者中尺寸较小的一个进行上采样,使得二者的尺寸相同,然后对二者进行特征拼接,完成特征融合。
通过该实现方式可以自适应地将两者中尺寸较小的特征进上采样,以满足两个特征进行特征拼接的需求,且拼接后形成的第二融合后特征不会丢失第一融合特征和图像特征中的有效信息,在满足拼接需求的情况下确保第二融合后特征的准确性。
继续参考图3,图3是根据本申请的用于识别目标对象的方法的又一个实施例的流程图。该用于识别目标对象的属性的方法包括以下步骤:
步骤301,获取待识别图像和目标对象的待识别属性信息。
步骤302,采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征。
步骤303,采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征。
步骤304,将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征。
上述步骤301-304分别与前述实施例中的步骤201-204一致,上文针对步骤201-204的描述也适用于步骤301-304,此处不再赘述。
步骤305,采用图像特征提取网络提取待识别图像的图像特征。
在本实施例中,上述执行主体可以利用预先训练的图像特征提取网络提取待识别图像的图像特征,图像特征可以是图像的颜色特征、纹理特征、形状特征,或者目标对象在图像中的空间特征。图像特征提取网络可以是预先训练的用于提取图像特征的神经网络。
步骤306,将图像特征与第一融合后特征融合,得到第二融合后特征。
在本实施例中,上述执行主体可以将步骤305中的图像特征与步骤304中的第一融合后特征采用拼接、加权求和、平均值计算等融合方式进行融合,得到第二融合后特征。
步骤307,利用属性分类器对第二融合后特征进行分类,得到目标对象的属性信息的识别结果。
在本实施例中,上述执行主体可以基于第二融合后特征,采用属性分类器获得目标对象的待识别属性信息的分类结果,从而得到目标对象的属性信息的识别结果。在这里,上述执行主体可以预先对目标对象的属性信息进行分类来训练属性分类器,使之可以对待识别的目标对象的属性信息进行分类。
本实施例中的用于识别目标对象的属性的方法流程300,通过将从待识别图像中提取出的图像特征与包含目标对象特征和待识别属性信息的属性特征的融合特征做进一步的融合,可以利用图像的全局特征进一步丰富特征空间,基于融入后的特征能够得到更准确的目标对象的属性信息的识别结果。
在上述实施例的一些可选的实现方式中,上述目标检测网络、目标对象特征提取网络、属性特征提取网络可以是通过基于样本图像对训练而生成的。
继续参考图4,图4是生成上述目标检测网络、目标对象特征提取网络、属性特征提取网络的一个实现方式的流程图。该生成上述目标检测网络、目标对象特征提取网络、属性特征提取网络的流程400可以包括以下步骤:
步骤401,获取包含目标对象的样本图像对和目标属性信息,目标属性信息包括第一子属性信息和第二子属性信息。
在本实施例中,上述执行主体可以从图像数据库获取包含目标对象的样本图像对,还可以获取预先指定的目标对象的目标属性信息。在这里,目标属性信息包括第一子属性信息和第二子属性信息,第一子属性信息和第二子属性信息所归属的属性类别可以是不同的。上述目标属性信息可以是第一子属性信息和第二子属性信息组合形成的组合属性信息。
样本图像对包括第一样本图像和第二样本图像,第一样本图像中的目标对象具有第一子属性信息,第二样本图像中的目标对象具有第二子属性信息,且样本图像对具有表征样本图像对具有目标属性信息的属性标注信息。
例如,目标属性信息可以为“腹部红色”,第一子属性信息可以为“腹部”,第二子属性信息可以为“红色”,样本图像对中的第一样本图像中的目标对象可以具有“腹部白色”的属性特征,即包含第一子属性信息“腹部”,第二样本图像中的目标对象可以具有“翅膀红色”的属性特征,即包含第二子属性信息“红色”。则可以利用由具有“腹部白色”属性的第一样本图像和具有“翅膀红色”属性的第二样本图像组成的样本图像对训练用于识别“腹部红色”目标属性的神经网络中的上述目标检测网络、目标对象特征提取网络和属性特征提取网络。。需要说明的是,本实施例的目标属性信息是上述待识别属性信息中的一种,可以是待识别属性信息的一种可选识别结果。例如目标对象是鸟,待识别属性信息是腹部颜色,目标属性信息是“腹部红色”;或者,待识别属性信息是颜色为红色的部位,目标属性信息是“颜色为红色的部位是腹部”。
步骤402,采用待训练的目标检测网络检测样本图像对中的目标对象,根据检测结果从样本图像对中提取出目标对象区域,采用待训练的目标对象特征提取网络分别提取出样本图像对中的目标对象的对象特征。
在本实施例中,上述执行主体可以利用待训练的目标检测网络检测待识别图像中的目标对象并确定出目标对象区域,再利用待训练的目标对象特征提取网络从目标对象区域中提取出目标对象的对象特征。
待训练的目标检测网络和待训练的目标对象特征提取网络可以基于卷积神经网络构建。可选地,可以采用经过预训练的用于检测目标对象的模型作为待训练的目标检测网络,采用经过预训练的用于识别目标对象的模型中的特征提取网络作为待训练的目标对象特征提取网络。
步骤403,采用待训练的属性特征提取网络对目标属性信息进行特征提取,得到目标属性信息的属性特征。
在本实施例中,上述执行主体可以利用待训练的属性特征提取网络对目标属性信息进行特征提取,得到目标属性信息的属性特征。目标属性信息包括第一子属性信息和第二子属性信息,则提取出的目标属性信息的属性特征包括第一子属性信息的特征和第二子属性信息的特征。
步骤404,将样本图像对中的目标对象的对象特征与目标属性信息的属性特征融合,得到融合后的第一样本特征。
在本实施例中,上述执行主体可以将步骤402中的样本图像对中的目标对象的对象特征与步骤403中的目标属性信息的属性特征采用拼接、加权求和、计算平均值等方式融合,得到融合后的第一样本特征。
步骤405,基于融合后的第一样本特征进行分类,得到样本图像对中的目标对象的目标属性信息的识别结果,基于样本图像对中的目标对象的目标属性信息的识别结果与样本图像对的属性标注信息之间的差异,迭代调整待训练的目标检测网络、待训练的目标对象特征提取网络、待训练的属性特征提取网络的参数。
在本实施例中,上述执行主体可以利用分类网络对融合后的第一样本特征进行分类,得到样本图像对中的目标对象的目标属性信息的识别结果,然后基于样本图像对中的目标对象的目标属性信息的识别结果与样本图像对的属性标注信息之间的差异计算损失值,根据损失值,通过反向传播对待训练的目标检测网络、待训练的目标对象特征提取网络、待训练的属性特征提取网络的参数进行调整,执行多次迭代操作,响应于损失值满足预设条件或者迭代操作的次数达到预设阈值,得到训练完成的目标检测网络、目标对象特征提取网络、属性特征提取网络。
通过上述训练步骤,可以通过具有与目标属性相关联属性信息的样本图像,学习到目标属性所包括的第一子属性信息和第二子属性信息,从而实现在样本图像中的目标对象不具有目标属性的情况下,实现目标对象的目标属性的识别。
在需要针对特殊的、样本数量较少组合属性进行识别的场景中,由于具有这种组合属性的样本的数量较少,直接使用少量的样本训练出用于识别该组合属性的神经网络模型难以达到较高的精度。例如,实践中,“腹部红色”的鸟类图片数量非常少,而“腹部白色”的鸟类图片和“翅膀红色”的鸟类图片数量较多且更容易获取。本实施例通过利用分别具有组合属性中的一种属性的样本来训练用于识别组合属性的神经网络模型,例如采用“腹部白色”的鸟类图片和“翅膀红色”的鸟类图片学习“腹部”属性和“红色”属性,降低了样本数据的获取难度,同时,由于加入了目标属性的属性特征进行学习,使得目标检测网络、目标对象特征提取网络、属性特征提取网络能够准确地学习到样本图像中的目标属性,从而训练得到更准确的目标检测网络、目标对象特征提取网络以及属性特征提取网络,进而可以提升目标对象的属性识别结果的准确性。
可选地,上述图像特征提取网络、属性分类器也可以与目标检测网络、目标对象特征提取网络以及属性特征提取网络一并训练,即在每一次训练中,同时迭代调整目标检测网络、目标对象特征提取网络以及属性特征提取网络、图像特征提取网络、属性分类器的参数,由此可以进一步提升目标对象的属性信息识别结果的准确性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了用于识别目标对象的属性的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例提供的用于识别目标对象的属性的装置500包括获取单元501、第一提取单元502、第二提取单元503、第一融合单元504以及识别单元505。其中,获取单元501,被配置成获取待识别图像和目标对象的待识别属性信息;第一提取单元502,被配置成采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征;第二提取单元503,被配置成采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征;第一融合单元504,被配置成将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征;识别单元505,被配置成基于第一融合后特征进行分类,得到目标对象的属性信息的识别结果。
在本实施例中,用于识别目标对象的属性的装置500中:获取单元501、第一提取单元502、第二提取单元503、第一融合单元504以及识别单元505的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203、步骤204和步骤205的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,该装置还包括:第三提取单元(图中未示出),被配置成采用图像特征提取网络提取待识别图像的图像特征;第二融合单元(图中未示出),被配置成将图像特征与第一融合后特征融合,得到第二融合后特征;以及识别单元进一步被配置成利用属性分类器对第二融合后特征进行分类。
在本实施例的一些可选的实现方式中,第二融合单元(图中未示出)进一步被配置成对图像特征和第一融合后特征中尺寸较小的一个上采样后对二者进行特征拼接。
在本实施例的一些可选的实现方式中,该装置还包括:缩放单元(图中未示出),被配置成响应于确定从待识别图像中检测出至少两个目标对象,将检测出的各目标对象的区域缩放至预设尺寸。
在本实施例的一些可选的实现方式中,该装置还包括训练单元(图中未示出),被配置成按照如下步骤训练得到所述目标检测网络、所述目标对象特征提取网络、所述属性特征提取网络:获取包含目标对象的样本图像对和目标属性信息,目标属性信息包括第一子属性信息和第二子属性信息,样本图像对包括第一样本图像和第二样本图像,第一样本图像中的目标对象具有第一子属性信息,第二样本图像中的目标对象具有第二子属性信息,且样本图像对具有表征样本图像对具有目标属性信息的属性标注信息;采用待训练的目标检测网络检测样本图像对中的目标对象,根据检测结果从样本图像对中提取出目标对象区域,采用待训练的目标对象特征提取网络分别提取出样本图像对中的目标对象的对象特征;采用待训练的属性特征提取网络对目标属性信息进行特征提取,得到目标属性信息的属性特征;将样本图像对中的目标对象的对象特征与目标属性信息的属性特征融合,得到融合后的第一样本特征;基于融合后的第一样本特征进行分类,得到样本图像对中的目标对象的目标属性信息的识别结果,基于样本图像对中的目标对象的目标属性信息的识别结果与样本图像对的属性标注信息之间的差异,迭代调整待训练的目标检测网络、待训练的目标对象特征提取网络、待训练的属性特征提取网络的参数。
本申请的上述实施例提供的装置,通过获取单元501获取待识别图像和目标对象的待识别属性信息,第一提取单元502采用目标检测网络检测待识别图像中的目标对象,根据检测结果从待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出目标对象的对象特征,第二提取单元503采用属性特征提取网络对待识别属性信息进行特征提取,得到待识别属性信息的属性特征,第一融合单元504将目标对象的对象特征与待识别属性信息的属性特征融合,得到第一融合后特征,识别单元505基于第一融合后特征进行分类,得到目标对象的属性信息的识别结果。该装置能够针对目标对象进行指定待识别属性信息的识别,提高了属性信息识别的针对性和准确率。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例的用于识别目标对象的属性的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线605互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线605与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的用于识别目标对象的属性的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用于识别目标对象的属性的方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用于识别目标对象的属性的方法对应的程序指令/模块(例如,附图5所示的获取单元501、第一提取单元502、第二提取单元503、第一融合单元504、识别单元505)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于识别目标对象的属性的方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于识别目标对象的属性的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至用于识别目标对象的属性的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于识别目标对象的属性的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线605或者其他方式连接,图6中以通过总线605连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与用于识别目标对象的属性的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,利用对象特征与属性特征融合后的特征进行属性信息的识别,从而提高了属性信息识别的准确率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (13)

1.一种用于识别目标对象的属性的方法,包括:
获取待识别图像和目标对象的待识别属性信息,所述待识别属性信息包括用户根据所述目标对象进行指定获取的文本序列;
采用目标检测网络检测所述待识别图像中的目标对象,根据检测结果从所述待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出所述目标对象的对象特征;
采用属性特征提取网络对所述待识别属性信息进行特征提取,得到待识别属性信息的属性特征;
将所述目标对象的对象特征与所述待识别属性信息的属性特征融合,得到第一融合后特征;
基于所述第一融合后特征进行分类,得到所述目标对象的属性信息的识别结果。
2.根据权利要求1所述的方法,其中,所述方法还包括:
采用图像特征提取网络提取所述待识别图像的图像特征;
将所述图像特征与所述第一融合后特征融合,得到第二融合后特征;以及
所述基于所述第一融合后特征进行分类,包括:
利用属性分类器对所述第二融合后特征进行分类。
3.根据权利要求2所述的方法,其中,所述将所述图像特征与所述第一融合后特征进行融合,包括:
对所述图像特征和所述第一融合后特征中尺寸较小的一个上采样后对二者进行特征拼接。
4.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定从所述待识别图像中检测出至少两个目标对象,将检测出的各目标对象的区域缩放至预设尺寸。
5.根据权利要求1-4任一项所述的方法,其中,所述目标检测网络、所述目标对象特征提取网络、所述属性特征提取网络是通过如下步骤训练得到的:
获取包含目标对象的样本图像对和目标属性信息,所述目标属性信息包括第一子属性信息和第二子属性信息,所述样本图像对包括第一样本图像和第二样本图像,所述第一样本图像中的目标对象具有所述第一子属性信息,所述第二样本图像中的目标对象具有所述第二子属性信息,且所述样本图像对具有表征所述样本图像对具有所述目标属性信息的属性标注信息;
采用待训练的目标检测网络检测所述样本图像对中的目标对象,根据检测结果从所述样本图像对中提取出目标对象区域,采用待训练的目标对象特征提取网络分别提取出所述样本图像对中的目标对象的对象特征;
采用待训练的属性特征提取网络对所述目标属性信息进行特征提取,得到目标属性信息的属性特征;
将所述样本图像对中的目标对象的对象特征与所述目标属性信息的属性特征融合,得到融合后的第一样本特征;
基于所述融合后的第一样本特征进行分类,得到所述样本图像对中的目标对象的目标属性信息的识别结果,基于所述样本图像对中的目标对象的目标属性信息的识别结果与所述样本图像对的属性标注信息之间的差异,迭代调整所述待训练的目标检测网络、所述待训练的目标对象特征提取网络、所述待训练的属性特征提取网络的参数。
6.一种用于识别目标对象的属性的装置,包括:
获取单元,被配置成获取待识别图像和目标对象的待识别属性信息,所述待识别属性信息包括用户根据所述目标对象进行指定获取的文本序列;
第一提取单元,被配置成采用目标检测网络检测所述待识别图像中的目标对象,根据检测结果从所述待识别图像中提取出目标对象区域,采用目标对象特征提取网络提取出所述目标对象的对象特征;
第二提取单元,被配置成采用属性特征提取网络对所述待识别属性信息进行特征提取,得到待识别属性信息的属性特征;
第一融合单元,被配置成将所述目标对象的对象特征与所述待识别属性信息的属性特征融合,得到第一融合后特征;
识别单元,被配置成基于所述第一融合后特征进行分类,得到所述目标对象的属性信息的识别结果。
7.根据权利要求6所述的装置,其中,所述装置还包括:
第三提取单元,被配置成采用图像特征提取网络提取所述待识别图像的图像特征;
第二融合单元,被配置成将所述图像特征与所述第一融合后特征融合,得到第二融合后特征;
以及所述识别单元进一步被配置成利用属性分类器对所述第二融合后特征进行分类。
8.根据权利要求7所述的装置,其中,所述第二融合单元进一步被配置成对所述图像特征和所述第一融合后特征中尺寸较小的一个上采样后对二者进行特征拼接。
9.根据权利要求6所述的装置,其中,所述装置还包括:
缩放单元,被配置成响应于确定从所述待识别图像中检测出至少两个目标对象,将检测出的各目标对象的区域缩放至预设尺寸。
10.根据权利要求6-9任一项所述的装置,其中,所述装置还包括训练单元,被配置成按照如下步骤训练得到所述目标检测网络、所述目标对象特征提取网络、所述属性特征提取网络:
获取包含目标对象的样本图像对和目标属性信息,所述目标属性信息包括第一子属性信息和第二子属性信息,所述样本图像对包括第一样本图像和第二样本图像,所述第一样本图像中的目标对象具有所述第一子属性信息,所述第二样本图像中的目标对象具有所述第二子属性信息,且所述样本图像对具有表征所述样本图像对具有所述目标属性信息的属性标注信息;
采用待训练的目标检测网络检测所述样本图像对中的目标对象,根据检测结果从所述样本图像对中提取出目标对象区域,采用待训练的目标对象特征提取网络分别提取出所述样本图像对中的目标对象的对象特征;
采用待训练的属性特征提取网络对所述目标属性信息进行特征提取,得到目标属性信息的属性特征;
将所述样本图像对中的目标对象的对象特征与所述目标属性信息的属性特征融合,得到融合后的第一样本特征;
基于所述融合后的第一样本特征进行分类,得到所述样本图像对中的目标对象的目标属性信息的识别结果,基于所述样本图像对中的目标对象的目标属性信息的识别结果与所述样本图像对的属性标注信息之间的差异,迭代调整所述待训练的目标检测网络、所述待训练的目标对象特征提取网络、所述待训练的属性特征提取网络的参数。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。
CN202010413453.2A 2020-05-15 2020-05-15 识别目标对象的属性的方法、装置、电子设备和存储介质 Active CN111598164B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010413453.2A CN111598164B (zh) 2020-05-15 2020-05-15 识别目标对象的属性的方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010413453.2A CN111598164B (zh) 2020-05-15 2020-05-15 识别目标对象的属性的方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN111598164A CN111598164A (zh) 2020-08-28
CN111598164B true CN111598164B (zh) 2023-06-23

Family

ID=72185674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010413453.2A Active CN111598164B (zh) 2020-05-15 2020-05-15 识别目标对象的属性的方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111598164B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580739B (zh) * 2020-12-28 2024-02-27 上海明略人工智能(集团)有限公司 一种训练样本集的确定方法和装置
CN112766349B (zh) * 2021-01-12 2021-08-24 齐鲁工业大学 一种基于机器视觉与触觉感知的物体描述生成方法
CN113255819B (zh) * 2021-06-11 2024-04-19 京东科技信息技术有限公司 用于识别信息的方法和装置
CN113762108A (zh) * 2021-08-23 2021-12-07 浙江大华技术股份有限公司 一种目标识别方法及装置
CN113822199B (zh) * 2021-09-23 2023-06-16 浙江大华技术股份有限公司 对象属性识别方法、装置、存储介质和电子装置
CN114170575A (zh) * 2022-02-11 2022-03-11 青岛海尔工业智能研究院有限公司 一种火焰识别方法、装置、电子设备及存储介质
CN114627470B (zh) * 2022-05-16 2022-08-05 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质
CN116108225A (zh) * 2023-04-13 2023-05-12 深圳开鸿数字产业发展有限公司 视频数据结构化方法、装置、终端设备及存储介质
CN116740714B (zh) * 2023-06-12 2024-02-09 北京长木谷医疗科技股份有限公司 一种基于无监督学习的髋关节疾病智能自标注方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886951A (zh) * 2019-02-22 2019-06-14 北京旷视科技有限公司 视频处理方法、装置及电子设备
CN109948709A (zh) * 2019-03-21 2019-06-28 南京斯玛唯得智能技术有限公司 一种目标对象的多任务属性识别系统
WO2020052169A1 (zh) * 2018-09-12 2020-03-19 深圳云天励飞技术有限公司 一种服饰属性识别检测方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018041273A (ja) * 2016-09-07 2018-03-15 キヤノン株式会社 画像認識装置、画像認識装置の制御方法およびプログラム
CN108510000B (zh) * 2018-03-30 2021-06-15 北京工商大学 复杂场景下行人细粒度属性的检测与识别方法
CN109522790A (zh) * 2018-10-08 2019-03-26 百度在线网络技术(北京)有限公司 人体属性识别方法、装置、存储介质及电子设备
CN110348387B (zh) * 2019-07-12 2023-06-27 腾讯科技(深圳)有限公司 一种图像数据处理方法、装置以及计算机可读存储介质
CN110555481A (zh) * 2019-09-06 2019-12-10 腾讯科技(深圳)有限公司 一种人像风格识别方法、装置和计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020052169A1 (zh) * 2018-09-12 2020-03-19 深圳云天励飞技术有限公司 一种服饰属性识别检测方法及装置
CN109886951A (zh) * 2019-02-22 2019-06-14 北京旷视科技有限公司 视频处理方法、装置及电子设备
CN109948709A (zh) * 2019-03-21 2019-06-28 南京斯玛唯得智能技术有限公司 一种目标对象的多任务属性识别系统

Also Published As

Publication number Publication date
CN111598164A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN111598164B (zh) 识别目标对象的属性的方法、装置、电子设备和存储介质
CN111860506B (zh) 识别文字的方法和装置
CN111931591B (zh) 用于构建关键点学习模型的方法、装置、电子设备及可读存储介质
CN112949710B (zh) 一种图像的聚类方法和装置
CN108229418B (zh) 人体关键点检测方法和装置、电子设备、存储介质和程序
CN112633276B (zh) 训练方法、识别方法、装置、设备、介质
CN112052186B (zh) 目标检测方法、装置、设备以及存储介质
CN112966742A (zh) 模型训练方法、目标检测方法、装置和电子设备
CN112381104A (zh) 一种图像识别方法、装置、计算机设备及存储介质
US20230041943A1 (en) Method for automatically producing map data, and related apparatus
CN111767831B (zh) 用于处理图像的方法、装置、设备及存储介质
CN115797736B (zh) 目标检测模型的训练和目标检测方法、装置、设备和介质
CN112241716B (zh) 训练样本的生成方法和装置
CN111753911A (zh) 用于融合模型的方法和装置
CN111832658B (zh) 兴趣点信息处理方法、装置、电子设备和存储介质
CN114898266B (zh) 训练方法、图像处理方法、装置、电子设备以及存储介质
CN112288699A (zh) 图像相对清晰度的评估方法、装置、设备和介质
CN111563541B (zh) 图像检测模型的训练方法和装置
CN113963186A (zh) 目标检测模型的训练方法、目标检测方法及相关装置
CN110738261B (zh) 图像分类和模型训练方法、装置、电子设备及存储介质
CN115482436B (zh) 图像筛选模型的训练方法、装置以及图像筛选方法
CN112529181A (zh) 用于模型蒸馏的方法和装置
CN113344121B (zh) 训练招牌分类模型和招牌分类的方法
CN111768007B (zh) 用于挖掘数据的方法和装置
CN113177545B (zh) 目标物体的检测方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant