CN112818826A - 目标识别方法及装置、电子设备及存储介质 - Google Patents

目标识别方法及装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112818826A
CN112818826A CN202110121333.XA CN202110121333A CN112818826A CN 112818826 A CN112818826 A CN 112818826A CN 202110121333 A CN202110121333 A CN 202110121333A CN 112818826 A CN112818826 A CN 112818826A
Authority
CN
China
Prior art keywords
appearance
semantic segmentation
sample
network
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110121333.XA
Other languages
English (en)
Inventor
胡含哲
甘伟豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN202110121333.XA priority Critical patent/CN112818826A/zh
Publication of CN112818826A publication Critical patent/CN112818826A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种目标识别方法及装置、电子设备及存储介质,其中,确定用于对对象的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;所述外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系;获取包括待识别对象的待处理图像;采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。

Description

目标识别方法及装置、电子设备及存储介质
技术领域
本申请实施例涉及图像处理技术领域,涉及但不限于一种目标识别方法及装置、电子设备及存储介质。
背景技术
近年来,共享单车成为新兴的城市交通产业,对于共享单车的管控已成为智慧城市的必需业务。在实际应用场景中,对共享单车进行识别时,由于受自然光的光照明暗、背景杂乱或视角场景变换等因素的影响,无法保证对共享单车的识别结果。
发明内容
本申请实施例提供一种目标识别技术方案。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种目标识别方法,所述方法包括:
确定用于对对象的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;所述外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系;
获取包括待识别对象的待处理图像;
采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。
第二方面,本申请实施例提供一种共享单车的颜色分割方法,所述方法包括:
确定用于对共享单车的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的共享单车已标注自身的外观颜色;所述外观标签库用于表征所述共享单车的品牌与外观颜色之间的对应关系;
获取包括待识别共享单车的待处理图像;
采用所述语义分割网络,对所述待识别共享单车的外观颜色进行语义分割,确定所述待识别共享单车的目标品牌。
第三方面,本申请实施例提供一种目标识别装置,所述装置包括:
第一确定模块,用于确定用于对对象的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;所述外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系;
第一获取模块,用于获取包括待识别对象的待处理图像;
第一分割模块,用于采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。
在上述装置中,所述语义分割网络包括用于对输入的图像进行特征提取的第一网络,和用于对所述第一网络提取的图像特征进行语义分割的第二网络,所述第一分割模块,包括:
第一提取子模块,用于采用所述第一网络对所述待处理图像进行特征提取,得到图像特征,并将所述图像特征输入所述第二网络;
第一分割子模块,用于采用所述第二网络,按照所述外观标签库,对所述图像特征进行语义分割,确定所述待识别对象的目标类别。
在上述装置中,所述装置还包括:
第二获取模块,用于获取包括样本对象的样本图像集合;
第二确定模块,用于确定所述样本对象所属的类别和所述样本对象的外观颜色;其中,所述外观颜色用于表征所述样本对象的主体颜色;
第一标注子模块,用于对每一类别的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签;其中,同一类别的样本对象的外观标签相同;
第一创建子模块,用于基于所述每一类别的样本对象的外观标签,创建所述外观标签库。
在上述装置中,所述装置还包括:
第三确定模块,用于确定所述样本图像中除所述样本对象之外的其他对象和背景区域;
第二标注子模块,用于采用不同的其他标签,分别对所述其他对象和所述背景区域进行标注;
第一加入子模块,用于将所述其他标签,加入所述外观标签库。
在上述装置中,所述第一分割子模块,包括:
第一分割单元,用于采用所述第二网络,基于所述图像特征和所述外观标签库,对所述待识别对象的外观颜色进行分割,得到语义分割图;
第一调整单元,用于基于所述待处理图像的尺寸,对所述语义分割图的尺寸进行调整,得到已调语义分割图;
第一确定单元,用于基于所述已调语义分割图,得到所述待识别对象的目标类别。
在上述装置中,所述第一分割单元,包括:
第一确定子单元,用于采用所述第二网络,在所述图像特征中,确定至少一个待识别对象的特征数据;
第一分割子单元,用于按照所述特征数据中的颜色分量和所述外观标签库,对所述至少一个待识别对象的外观颜色进行语义分割,得到包括至少一类所述外观颜色的语义分割图。
在上述装置中,所述第一确定单元,包括:
第一确定子单元,用于在所述已调语义分割图中,确定所述待识别对象的外观颜色为所述外观标签库中每一外观标签的概率值;
第二确定子单元,用于将概率值最大的外观标签,确定为目标标签;
第三确定子单元,用于基于所述外观标签库中对象的类别与外观颜色之间的对应关系,确定所述目标标签对应的类别,以得到所述待识别对象的目标类别。
在上述装置中,所述装置还包括:
第四确定模块,用于确定多个样本对象所属的品牌和外观颜色;
第一标注模块,用于对每一品牌的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签;
第一创建模块,用于基于所述每一品牌的样本对象的外观标签,创建所述外观标签库。
在上述装置中,在所述待识别对象的数量为多个的情况下,所述第一分割子模块,包括:
第二确定单元,用于采用所述第二网络,按照所述外观标签库中类别与外观颜色之间的对应关系,确定所述图像特征中每一种外观颜色对应的待识别对象的品牌;
第三确定单元,用于基于所述每一种外观颜色对应的待识别对象的品牌,确定所述多个待识别对象的目标品牌;
第四确定单元,用于将所述目标品牌,确定为所述目标类别。
第四方面,本申请实施例提供一种共享单车的颜色分割装置,所述装置包括:
第一网络确定模块,用于确定用于对共享单车的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的共享单车已标注自身的外观颜色;所述外观标签库用于表征所述共享单车的品牌与外观颜色之间的对应关系;
第一图像获取模块,用于获取包括待识别共享单车的待处理图像;
第一语义分割模块,用于采用所述语义分割网络,对所述待识别共享单车的外观颜色进行语义分割,确定所述待识别共享单车的目标品牌。
对应地,本申请实施例提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现上述的第一方面或第二方面方法的步骤。
本申请实施例提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时能够实现上述第一方面或第二方面的方法的步骤。
本申请实施例提供一种目标识别方法及装置、电子设备及存储介质,通过首先,获取创建的外观标签库以便于能够规范对象的标签定义,该外观标签库中包括多种外观颜色标签,以及该对象的类别与外观标签之间的对应关系;然后,对输入的待处理图像进行特征提取,并基于待识别对象的外观颜色对提取的图像特征进行语义分割,得到包括多种外观标签的分割结果;最后,分析分割结果中的外观标签,并结合对象的类别与外观颜色之间的对应关系,确定出待识别对象的目标类别;如此,通过创建的规范化的外观标签库,对待处理图像中的待识别对象进行分类,能够直接且快速输出待识别对象的分类结果。
附图说明
图1为本申请实施例提供的目标识别方法的实现流程示意图;
图2A为本申请实施例提供的目标识别方法的另一实现流程示意图;
图2B为本申请实施例提供的共享单车的颜色分割方法的实现流程示意图;
图3为本申请实施例提供的目标识别方法的另一实现流程示意图;
图4为本申请实施例提供的目标识别方法的应用场景示意图;
图5为本申请实施例目标识别装置的结构组成示意图;
图6为本申请实施例计算机设备的组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对发明的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)语义分割,将图片中的各类信息进行分割,例如人的轮廓标记为红色,马路标记为紫色,但是不同的人是没有办法区分的,相当的与将图片中的图片进行了大类的外部轮廓与标签的匹配。
2)残差神经网络(ResNet),由残差模块构建的,用梯度下降算法训练一个神经网络,随着层数增加,训练误差越来越减小,这种方式能够到达网络更深层,有助于解决梯度消失和梯度爆炸的问题,让训练更深网络的同时又能保证良好的性能。
下面说明本申请实施例提供的目标识别的设备的示例性应用,本申请实施例提供的设备可以实施为具有图像采集功能的笔记本电脑,平板电脑,台式计算机,相机,移动设备(例如,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的用户终端,也可以实施为服务器。下面,将说明设备实施为终端或服务器时示例性应用。
该方法可以应用于计算机设备,该方法所实现的功能可以通过计算机设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该计算机设备至少包括处理器和存储介质。
本申请实施例提供一种目标识别方法,如图1所示,结合如图1所示步骤进行说明:
步骤S101,确定用于对对象的外观颜色进行分割的语义分割网络。
在一些实施例中,该对象为能够采用颜色区分的对象,即不同类别的对象,外观颜色不同,可以是任意场景下的对象。比如,交通环境中路边摆放的单车、电动车或者汽车等。对象的外观颜色可以理解为是该对象主体的外观颜色,即该对象的外表面的主体部分的外观颜色。其中,不同类别的对象,外观颜色不同。外观标签库中包括不同类别的对象与该类别的对象对应的外观颜色的标签。在一些可能的实现方式中,通过统计大量不同类别的对象,并对每一类别的对象标注外观颜色标签,将同一类别的对象标注相同的外观颜色标签,不同类别的对象标注不同的外观颜色标签。以该对象为路边摆放的共享单车为例,首先统计共享单车的类别和主体的外观颜色,然后,对每一类别的共享单车采用其主体的外观颜色进行标注,最后,将标注的外观颜色标签和与之对应的共享单车的类别,创建该外观标签库。如此,创建了统一且规范的共享单车语义标签的定义。
语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系。该语义分割网络是通过采用鲁棒性较强的模型,对结构简单的待训练分割网络进行指导训练得到的,这样使得该语义分割网络在保持低复杂度的前提下,具有较高的性能。
步骤S102,获取包括待识别对象的待处理图像。
在一些实施例中,待处理图像为包括待识别对象的外观复杂的图像,还可以是包括待识别对象的外观简单的图像,待处理图像可以是任意采集设备采集到的图像,比如,以待识别对象为共享单车为例,相机采集到的城市场景下包括共享单车的图像。
步骤S103,采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。
在一些实施例中,待识别对象的外观颜色可以是任意类别,而且待识别对象可以是多个不同的对象,那么就包括多个类别的外观颜色,基于各自的外观颜色对图像特征中表征颜色分量的数据进行语义分割,得到分割结果。以对象为共享单车为例,不同类别的共享单车颜色不同,如果有10个类别的共享单车,那么每一类别对应一个外观颜色,有10个外观颜色,基于该10个外观颜色,对图像特征进行语义分割,得到包括10个外观颜色的分割结果。
在一些可能的实现方式中,该语义分割网络包括两个阶段的网络,即第一网络和第二网络,步骤S103可以通过以下步骤实现,如图2A所示,图2A为本申请实施例提供的目标识别方法的另一实现流程示意图,结合图1和2A所示的步骤进行以下说明:
步骤S201,采用语义分割网络的第一网络对所述待处理图像进行特征提取,得到图像特征,并将所述图像特征输入所述第二网络。
在一个具体例子中,第一网络可以采用残差网络来实现,即将待处理图像输入残差网络中进行特征提取,得到待处理图像的特征图,将该特征图输入第二网络。
步骤S202,采用语义分割网络的第二网络,按照所述外观标签库,对所述图像特征进行语义分割,确定所述待识别对象的目标类别。
在一些实施例中,第二网络对于输入的第一网络输出的图像特征,按照外观标签库中的外观颜色,对该图像特征进行语义分割,从而生成对图像中待识别图像的外观颜色进行分割的语义分割图。在一个具体例子中,第二网络可以采用Deeplab V3网络实现。如此,采用两阶段的网络实现语义分割网络,能够提高语义分割的准确度。
在一些实施例中,由于分割结果中包括按照该外观颜色对待处理图像进行分割的结果,比如,分割结果中包括基于该外观颜色对待处理图像中的待识别对象、其他对象和背景区域进行分割的结果,那么通过外观标签库对象的类别与外观颜色之间的对应关系,可以确定出待识别对象为每一类别对应的概率值,从而将概率值最大的类别确定为待识别对象的目标类别。
在一个具体例子中,以待识别对象为共享单车为例,外观标签库中包括10个外观标签,分割结果中包括采用这5个外观颜色对待处理图像进行语义分割的结果,即对于待处理图像中的与这5个外观颜色相匹配的区域标注上相应的外观颜色,比如,待识别对象为蓝色共享单车,其对应的外观颜色为蓝色,则将该待识别对象在待处理图像中的区域分割为蓝色,那么基于外观标签库中类别与外观颜色之间的对应关系,确定蓝色对应的单车的类别,将该类别作为待识别单车的目标类别。
在本申请实施例中,通过创建包括对象的类别与外观颜色标签之间的对应关系外观标签库,实现了外观标签库的规范化,从而基于该规范化的外观标签来对待处理图像中的待识别对象的外观颜色进行语义分割,能够直接且快速输出待处理图像中包括的待识别对象的类别。
在一些实施例中,基于该样本图像集对待训练第一网络和待训练第二网络进行训练,以得到语义分割网络,其中,训练过程包括以下步骤:
第一步,将所述样本图像集中的样本图像输入待训练第一网络,得到样本图像特征。
在一些实施例中,采用预设语义标签对画面中的待检测非机动车的不同摆放姿态进行标注,得到作为训练集的样本图像,基于该样本图像对待训练分割网络进行训练;该样本图像为在停放多辆非机动车的街道场景下采集的图像。将任意一张样本图像输入待训练分割网络中,以进行特征提取,得到样本图像特征。在一些可能的实现方式中,采用深度残差网络实现对样本图像的特征提取。
第二步,将样本图像特征输入待训练第二网络,采用待训练第二网络基于预设语义标签集合,对样本图像特征进行语义分割,得到预测分割结果。
在一些实施例中,基于待识别对象的类别与外观颜色的匹配关系,在样本图像中,确定出待识别对象占据的图像区域之后,即可确定与样本图像中包括的待识别对象的类别相匹配的语义标签。在一些可能的实现方式中,采用残差网络作为第一位网络对输入的图像进行特征提取,采用Deeplab v3网络作为第二网络,对图像特征中的待识别对象的类别进行预测,基于预测结果对该样本图像特征中的待识别对象的外观颜色进行分割,得到预测分割结果。
第三步,采用预测分割结果的损失,对第一待训练网络和第二待训练网络的网络参数进行调整,以使得到的第二待训练网络输出的预测分割结果的损失满足收敛条件。
在一些实施例中,通过比较该预测分割结果和样本图像中的真值标签,可以确定确定预测分割结果的损失。通过该预测分割结果的损失,对待训练分割网络的权重值和调整量进行调整,使得训练好的语义分割网络输出的预测分割结果的损失收敛。
在本申请实施例中,通过获取大量的包括不同类别的样本对象的待标注图像,然后,采用预设语义标签对待标注图像中的的样本对象的外观颜色进行标注,得到样本图像集,最后,基于该样本图像集对待训练分割网络进行训练,从而使得训练得到的语义分割网络能够有效对图像中的待识别对象的外观颜色进行分割,以确定待识别对象的类别。
在一些实施例中,通过分析大量不同类别的样本对象,以及每一种样本对象的外观颜色,创建统一且规范的共享单车语义标签的定义,即在上述步骤S101之前,还包括以下步骤:
步骤S111,获取包括样本对象的样本图像集合。
在一些实施例中,样本对象为能够采用颜色区分的对象,即不同类别的对象颜色不同,可以是任意场景下的对象。样本图像集合中不同的样本图像中呈现的样本对象的类别不同;在一些可能的实现方式中,可以是通过对不同类别的样本对象进行采集,得到样本图像集。还可以是通过对任意包括样本对象的场景进行采集,得到该样本图像集。
步骤S112,确定样本对象所属的类别和样本对象的外观颜色。
在一些实施例中,其中,所述外观颜色用于表征所述样本对象的主体颜色;比如,样本对象的大于预设占比的外表面的外观颜色。确定每一个样本图像中的样本对象所属的类别,并且针对每一个样本对象,确定该样本对象的外表面中大于预设占比(比如,大于百分之五十)的外表面的外观颜色,即该样本对象的主体的颜色。比如,样本对象为某一品牌的共享单车,其中,车身颜色为蓝色,车把颜色为白色,由于蓝色为该单车的主体颜色,那么确定该对象的外观颜色为蓝色。
步骤S113,对每一类别的样本对象,标注与样本对象的外观颜色相匹配的的外观标签。
在一些实施例中,同一类别的样本对象的外观标签相同。针对每一类别的样本对象,可以是采用该样本对象的外观颜色作为外观标签,对该样本对象进行标注。或者,采用任意类型的外观标签对每一类别的样本对象进行标注。比如,如果两个样本对象的颜色分别为红色和蓝色,那么分别采用红色标签和蓝色标签对该样本对象仅标注;或者,采用任意两个不同的标签对这两个样本对象进行标注。
步骤S114,基于所述每一类别的样本对象的外观标签,创建所述外观标签库。
在一些实施例中,基于样本对象的类别与外观颜色之间的对应关系和每一类别的样本对象的外观标签,创建外观标签库。
上述步骤S111至步骤S114提供了一种初步创建外观标签库的方式,在该方式中,对于每一样本对象来说,将该样本对象的外观标签及其类别,一一对应地存储在外观标签库中,从而得到对每一类别的样本对象都采用外观标签进行标注的外观标签库。
在一些实施例中,基于上述步骤S111至步骤S114初步创建外观标签库之后,还包括进一步优化外观标签库的过程:
步骤S115,确定样本图像中除样本对象之外的其他对象和背景区域。
在一些实施例中,获取样本图像之后,可以将样本对象划分为三部分,一部分是样本对象,一部分是其他对象,另一部分是背景区域。比如,样本图像是采集的城市场景下的街道图像,样本对象是该图像中的共享单车,其他对象包括该图像中除共享单车之外的其他对象,包括:普通自行车,即非共享单车的自行车、汽车、行人和建筑物等,背景区域即为采集该图像时的背景图像,比如,天空或者背景树木等。
步骤S117,采用不同的其他标签,分别对所述其他对象和所述背景区域进行标注。
在一些实施例中,在样本图像中确定出样本对象、其他对象和背景区域之后,针对每一类别的样本对象、其他对象和背景区域分别采用不同的标签进行标注。在一些可能的实现方式中,可以采用不同的颜色标签对不同类别的样本对象进行标注,然后,采用其他类型的标签(比如,数字标签)对其他对象和背景区域进行标注,如此,对于样本图像中的任意对象均进行了标签标注。
步骤S118,将其他标签,加入外观标签库。
在一些实施例中,采用其他标签对其他对象和背景区域进行标注之后,将这些标签也加入到外观标签库中,以丰富外观标签库中的标签类别,这样,对于待处理图像中的其他对象和背景区域均能进行分类。
在本申请实施例中,通过对样本图像的样本对象、其他对象和背景区域进行划分,并采用不同的标签分别进行标注,从而创建外观标签库,如此能够使得创建的外观标签库中的样本标签更加丰富,进而能够更加的准确的实现对待待处理图像中的对象进行分类。
在一些实施例中,对图像特征,按照外观标签进行语义分割之后,按照待处理图像的大小,对语义分割图的大小进行恢复,从而能够对缩小的图像进行比例放大,以恢复原始待处理图像的尺寸,即步骤S202可以通过以下步骤实现:
步骤S221,采用所述第二网络,基于所述图像特征和所述外观标签库,对所述待识别对象的外观颜色进行分割,得到语义分割图。
在一些实施例中,采用第二网络,按照外观标签中外观颜色与对象类别之间的对应关系,对图像特征中待识别对象的外观颜色进行语义分割,得到与图像特征大小一致语义分割图。
在一些实施例中,语义分割网络的第二网络,对于待识别对象的特征数据,能够将待识别对象按照颜色的不同,进行语义分割,即步骤S141可以通过以下步骤实现:
步骤S1411,采用所述第二网络,在所述图像特征中,确定至少一个待识别对象的特征数据。
在一些实施例中,对待处理图像进行特征提取之后,针对得到的图像特征,从中确定出待识别对象的特征数据,即至少一个对象的特征数据。比如,待处理对象为城市场景下的街道图像,待识别对象为共享单车,那么对该图像进行特征提取之后,在图像特征中,确定出画面内容为共享单车的图像区域对应的特征数据,即得到了至少一个待识别对象的特征数据。
步骤S1412,按照所述特征数据中的颜色分量和所述外观标签库,对所述至少一个待识别对象的外观颜色进行语义分割,得到包括至少一类所述外观颜色的语义分割图。
在一些实施例中,那么基于每一个待处理对象的主体的外观颜色,对这些待识别对象的特征数据进行语义分割,从而能够实现对待处理图像中每一类别的待识别对象,采用相应的外观颜色进行分割,并输出表示分割结果的二维矩阵。通过采用外观颜色标签对样本对象进行标注,创建外观标签库之后,确定出外观标签库中的外观颜色的类别,比如,该外观标签库中的外观颜色有10种,然后基于该二维矩阵,能够确定该待识别对象的外观颜色为这10种外观标签中每一种的概率,即得到10个概率值,将其中概率最大的的外观标签对应的类别作为目标类别。如此,通过对待识别对象的特征数据,按照外观标签库中的颜色标签进行语义分割,从而能够更加准确的从待处理图像中分割的出待识别对象。
步骤S222,基于所述待处理图像的尺寸,对所述语义分割图的尺寸进行调整,得到已调语义分割图。
在一些实施例中,由于采用第一网络对待处理图像进行特征提取时,进行了特征压缩,为使得输出结果的大小与输入的待处理图像的大小相同,所以第二网络输出的语义分割图进行恢复,以恢复至待处理图像的大小,从而得到与待处理图像大小一致的二维矩阵,即已调语义分割图。在一些可能的实现方式中,对语义分割图进行上采样,以恢复已调语义分割图的大小,从而得到已调语义分割图。
步骤S223,基于所述已调语义分割图,得到所述待识别对象的目标类别。
在一些实施例中,该上已调语义分割图可以是对语义分割图进行上采样得到的,已调语义分割图中仍然包含了对待处理对象按照外观颜色进行分割的结果,基于外观标签和对象的类别之间的对应关系,即可确定已调语义分割图中对待识别对象进行分割的外观颜色对应的类别,从而得到目标类别。
在一些可能的实现方式中,通过分析已调语义分割图中每一外观标签的概率值,从而确定最有可能为与待识别对象匹配的外观标签,可以通过以下过程实现:
第一步,在所述已调语义分割图中,确定所述待识别对象的外观颜色为所述外观标签库中每一外观标签的概率值。
在一些可能的实现方式中,已调语义分割图中包括采用外观标签对待处理图像进行分割的结果,所以能够在已调语义分割图中确定出待识别对象的外观颜色为每一外观标签的概率值。一个概率值对应一种外观颜色,表示该图像中的共享单车的主体颜色为该外观颜色的概率。
第二步,将概率值最大的外观标签,确定为目标标签。
在一些可能的实现方式中,概率值最大的外观标签,说明待识别对象的主体颜色为该外观标签的可能性最大,将该外观标签确定为目标标签。
第三步,基于所述外观标签库中对象的类别与外观颜色之间的对应关系,确定所述目标标签对应的类别,以得到所述待识别对象的目标类别。
在一些可能的实现方式中,基于外观标签库中类别与外观颜色之间的对应关系,确定所述目标标签对应的类别,以得到所述待识别对象的目标类别。确定出待识别对象的外观颜色为每一外观标签的概率值之后,通过对象的类别与外观颜色之间的对应关系,即可分析到目标标签所匹配的类别,将该类别作为待识别对象的目标类别。在一个具体例子中,外观标签为10个,分别确定待识别对象的外观颜色为每一外观标签的概率值,得到10个概率值,从中确定出最大的概率值,如果最大的概率值对应的外观标签为蓝色,那么将蓝色对应的类别,作为待识别对象的目标类别。
在一些实施例中,创建外观标签库的过程如下:
第一步,确定多个样本对象所属的品牌和外观颜色。
在一些可能的实现方式中,样本对象包括但不限于各种各样功能的车辆(如卡车、汽车、摩托车、自行车等)、各种轮数的车辆(如四轮车辆、两轮车辆等)和任意对象,比如,机器人、飞行器、导盲器、智能玩具、玩具汽车等。样本对象的外观颜色为该样本对象的主体颜色。在一个具体例子中,样本对象为共享单车,确定多个共享单车的品牌和主体的外观颜色,将共享单车的品牌和主体的外观颜色成对存储。
第二步,对每一品牌的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签。
在一些可能的实现方式中,得到多对品牌和外观颜色之后,对于每一品牌的样本对象采用外观标签进行标注,外观标签可以是该品牌的外观颜色,而且对于同一品牌的样本对象,采用相同的外观标签。比如,样本对象为共享单车,针对同一品牌的共享单车,采用该品牌的共享单车的主体外观颜色作为外观标签进行标注,从而对每一品牌的共享单车进行标注。
第三步,基于每一品牌的样本对象的外观标签,创建所述外观标签库。
在一些可能的实现方式中,对于每一样本对象来说,将该样本对象的外观标签及其类别,一一对应地存储在外观标签库中,从而得到对每一类别的样本对象都采用外观标签进行标注的外观标签库。
在一些实施例中,在待识别对象的数量为多个的情况下,采用所述第二网络,对这多个待识别对象进行语义分割的过程如下:
第一步,采用第二网络,按照所述外观标签库中类别与外观颜色之间的对应关系,确定所述图像特征中每一种外观颜色对应的待识别对象的品牌。
在一些可能的实现方式中,按照外观标签库中类别与外观颜色之间的对应关系,确定分割结果中每一种外观颜色对应的待识别对象的品牌。在待识别对象为多个的情况下,对待处理图像按照外观标签进行分割之后,得到采用外观标签对待识别对象象进行分割的结果,按照外观标签和品牌的对应关系,能够在分割结果中,确定出每一种外观颜色对应的待识别对象的品牌。
第二步,基于每一种外观颜色对应的待识别对象的品牌,确定多个待识别对象的目标品牌。
在一些可能的实现方式中,基于每一种外观颜色对应的待识别对象的品牌,确定出待识别对象的主体外观颜色为外观标签中每一种的概率,将概率最大的外观标签对应的外观颜色,确定为目标品牌该对应的外观颜色,即得到多个待识别对象的目标品牌。
第三步,将目标品牌,确定为目标类别。
在本申请实施例中,基于创建的外观标签库,针对待处理图像中的多个待识别对象进行分类,能够直接、快速且同时输出图像场景的标签的语义结果,进而得到分类结果。
本申请实施例提供一种共享单车的颜色分割方法,如图2B所示,结合如图2B所示步骤进行说明:
步骤S211,确定用于对共享单车的外观颜色进行分割的语义分割网络。
在一些实施例中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的共享单车已标注自身的外观颜色;所述外观标签库用于表征所述共享单车的品牌与外观颜色之间的对应关系。
步骤S212,获取包括待识别共享单车的待处理图像。
在一些实施例中,待处理图像为包括待识别共享单车的外观复杂的图像,还可以是包括待识别共享单车的外观简单的图像,待处理图像可以是任意采集设备采集到的图像,比如,相机采集到的城市场景下包括共享单车的图像。
步骤S213,采用所述语义分割网络,对所述待识别共享单车的外观颜色进行语义分割,确定所述待识别共享单车的目标品牌。
在一些实施例中,该语义分割网络包括第一网络和第二网络,其中,第一网络用于对待处理图像进行特征提取,将特征图输出至第二网络;第二网络用于对特征图,按照外观标签库中外观颜色和待识别共享单车的品牌之间的对应关系,对待识别共享单车的外观颜色进行语义分割,从而确定出待处理图像的待识别共享单车的目标品牌。
在本申请实施例中,通过首先,获取创建的外观标签库以便于能够规范共享单车的标签定义,该外观标签库中包括多种外观颜色标签,以及该共享单车的品牌与外观标签之间的对应关系;然后,对输入的待处理图像进行特征提取,并基于待识别共享单车的外观颜色对提取的图像特征进行语义分割,得到包括多种外观标签的分割结果;最后,分析分割结果中的外观标签,并结合共享单车的品牌与外观颜色之间的对应关系,确定出待识别共享单车的目标类别;如此,通过创建的规范化的外观标签库,对待处理图像中的待识别共享单车进行分类,能够直接且快速输出待识别共享单车的品牌。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用,以采用创建的标签库,对城市场景下的共享单车进行颜色分类为例,进行说明。
在相关技术中,共享单车是近年来新兴的城市交通产业,对于共享单车的管控已成为智慧城市的必需业务。新型的智能化城市管理,则能大大减少人力成本,实现全天候高效管理。场景分割是计算机视觉以及智能视频监控领域的重要问题,其目的是对场景中的语义元素进行定位。然而在实际应用中,受光照明暗、背景杂乱和视角场景变换等因素的影响,无法保证对共享单车的识别结果。
基于此,本申请实施例提供一种目标识别方法,通过提供统一且规范的共享单车语义标签的定义。并基于上述标签体系,设计轻量级的语义分割算法层级框架,对于给定的待处理图像,能够直接、快速且同时输出图像场景的标签的语义结果。目标识别方法的实现过程如下:
第一步,对语义类别和对应的输出结果进行定义,以得到类别标签库。
在一些实施例中,语义类别和对应的输出结果包括:
a)类别id为0,语义类别为背景区域,对应的输出结果为除单车外的区域。
b)类别id为1,语义类别为普通自行车,对应的输出结果为非共享单车的自行车区域。
c)类别id为2,语义类别为青色共享单车,对应的输出结果为品牌C单车。
d)类别id为3,语义类别为蓝色共享单车,对应的输出结果为品牌D单车。
e)类别id为4,语义类别为黄色橘色共享单车,对应的输出结果为品牌E单车。
f)类别id为5,语义类别为红色共享单车,对应的输出结果为品牌F单车。
g)类别id为6,语义类别为绿色共享单车,对应的输出结果为品牌G单车。
h)类别id为7,语义类别为浅蓝色共享单车,对应的输出结果为品牌H单车
i)类别id为8,语义类别为蓝白色相间共享单车,对应的输出结果为品牌H单车。
在一些可能的实现方式中,输出结果的格式可以为与原图大小一致的二维矩阵,用于表示语义分割图。
第二步,基于类别标签库,对输入的图像进行语义分割,得到语义分割图。
第三步,基于语义分割图,确定该图像中目标车辆的类别。
本申请实施例提供的目标识别方法,可以通过图3所示的步骤实现,图3为本申请实施例提供的目标识别方法的另一实现流程示意图,结合图3所示的步骤进行以下说明:
步骤S301,获取待处理图像。
步骤S302,将图像输入残差神经网络,以进行特征提取。
步骤S303,将提取的特征输入卷积网络模型,以进行语义分割,得到语义分割结果。
在一些可能的实现方式中,卷积网络模型可以是带有空洞卷积的空间金字塔结构模型(Atrous Spatial Pyramid Pooling,ASPP),该模型可以采用深度实验室v3(Deeplabv3)网络实现。
步骤S304,对语义分割结果进行上采样,得到已调语义分割图。
步骤S305,基于已调语义分割图,输出最终分类结果。
在一些可能的实现方式中,对语义分割结果进行上采样之后,即对语义分割结果进行放大,从而能够基于语义类别与输出结果的对应关系,得到该语义分割结果所对应的最终预测结果。如图4所示,图4为本申请实施例提供的目标识别方法的应用场景示意图,其中,图像401为采集的待处理图像,将图像401输入残差神经网络以进行特征提取,然后,将特征提取结果输入到Deeplab v3网络,以进行语义分割,得到语义分割结果,即图像402,基于语义类别与输出结果的对应关系,即可确定出图像402中每一种颜色对应的车的品牌,即在图像402中,按照外观标签库中的外观标签对图像401中的不同品牌的单车进行语义划分,对于每一品牌的共享单车均采用该单车的主体外观颜色进行语义分割,比如,品牌A采用该品牌的外观颜色403呈现,品牌B采用与该品牌的外观颜色404呈现,品牌C采用与该品牌的外观颜色405呈现,品牌D采用与该品牌的外观颜色406呈现;最后,基于颜色标签与品牌的对应关系(比如,外观颜色403所属的外观标签对应的类别是A,外观颜色403所属的外观标签对应的类别是B,外观颜色405所属的外观标签对应的类别是C,外观颜色406所属的外观标签对应的类别是D),即可确定每一个共享单车的品牌。
在本申请实施例中,通过综合分析共享单车种类,定义完备、独立且基础的语义分割标签体系,从而能够提供轻量级语义分割算法框架,易于快速使用,同时输出标准的语义分割结果。
本申请实施例提供一种目标识别装置,图5为本申请实施例目标识别装置的结构组成示意图,如图5所示,所述目标识别装置500包括:
第一确定模块501,用于确定用于对对象的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;所述外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系;
第一获取模块502,用于获取包括待识别对象的待处理图像;
第一分割模块503,用于采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。
在上述装置中,所述语义分割网络包括用于对输入的图像进行特征提取的第一网络,和用于对所述第一网络提取的图像特征进行语义分割的第二网络,所述第一分割模块503,包括:
第一提取子模块,用于采用所述第一网络对所述待处理图像进行特征提取,得到图像特征,并将所述图像特征输入所述第二网络;
第一分割子模块,用于采用所述第二网络,按照所述外观标签库,对所述图像特征进行语义分割,确定所述待识别对象的目标类别。
在上述装置中,所述装置还包括:
第二获取模块,用于获取包括样本对象的样本图像集合;
第二确定模块,用于确定所述样本对象所属的类别和所述样本对象的外观颜色;其中,所述外观颜色用于表征所述样本对象的主体颜色;
第一标注子模块,用于对每一类别的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签;其中,同一类别的样本对象的外观标签相同;
第一创建子模块,用于基于所述每一类别的样本对象的外观标签,创建所述外观标签库。
在上述装置中,所述装置还包括:
第三确定模块,用于确定所述样本图像中除所述样本对象之外的其他对象和背景区域;
第二标注子模块,用于采用不同的其他标签,分别对所述其他对象和所述背景区域进行标注;
第一加入子模块,用于将所述其他标签,加入所述外观标签库。
在上述装置中,所述第一分割子模块,包括:
第一分割单元,用于采用所述第二网络,基于所述图像特征和所述外观标签库,对所述待识别对象的外观颜色进行分割,得到语义分割图;
第一调整单元,用于基于所述待处理图像的尺寸,对所述语义分割图的尺寸进行调整,得到已调语义分割图;
第一确定单元,用于基于所述已调语义分割图,得到所述待识别对象的目标类别。
在上述装置中,所述第一分割单元,包括:
第一确定子单元,用于采用所述第二网络,在所述图像特征中,确定至少一个待识别对象的特征数据;
第一分割子单元,用于按照所述特征数据中的颜色分量和所述外观标签库,对所述至少一个待识别对象的外观颜色进行语义分割,得到包括至少一类所述外观颜色的语义分割图。
在上述装置中,所述第一确定单元,包括:
第一确定子单元,用于在所述已调语义分割图中,确定所述待识别对象的外观颜色为所述外观标签库中每一外观标签的概率值;
第二确定子单元,用于将概率值最大的外观标签,确定为目标标签;
第三确定子单元,用于基于所述外观标签库中对象的类别与外观颜色之间的对应关系,确定所述目标标签对应的类别,以得到所述待识别对象的目标类别。
在上述装置中,所述装置还包括:
第四确定模块,用于确定多个样本对象所属的品牌和外观颜色;
第一标注模块,用于对每一品牌的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签;
第一创建模块,用于基于所述每一品牌的样本对象的外观标签,创建所述外观标签库。
在上述装置中,在所述待识别对象的数量为多个的情况下,所述第一分割子模块,包括:
第二确定单元,用于采用所述第二网络,按照所述外观标签库中类别与外观颜色之间的对应关系,确定所述图像特征中每一种外观颜色对应的待识别对象的品牌;
第三确定单元,用于基于所述每一种外观颜色对应的待识别对象的品牌,确定所述多个待识别对象的目标品牌;
第四确定单元,用于将所述目标品牌,确定为所述目标类别。
本申请实施例提供一种共享单车的颜色分割装置,所述装置包括:
第一网络确定模块,用于确定用于对共享单车的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的共享单车已标注自身的外观颜色;所述外观标签库用于表征所述共享单车的品牌与外观颜色之间的对应关系;
第一图像获取模块,用于获取包括待识别共享单车的待处理图像;
第一语义分割模块,用于采用所述语义分割网络,对所述待识别共享单车的外观颜色进行语义分割,确定所述待识别共享单车的目标品牌。需要说明的是,以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的目标识别方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是终端、服务器等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、运动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例再提供一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,该计算机可执行指令被执行后,能够实现本申请实施例提供的目标识别方法中的步骤。
相应的,本申请实施例再提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行指令,所述该计算机可执行指令被处理器执行时实现上述实施例提供的目标识别方法的步骤。
相应的,本申请实施例提供一种计算机设备,图6为本申请实施例计算机设备的组成结构示意图,如图6所示,所述设备600包括:一个处理器601、至少一个通信总线、通信接口602、至少一个外部通信接口和存储器603。其中,通信接口602配置为实现这些组件之间的连接通信。其中,通信接口602可以包括显示屏,外部通信接口可以包括标准的有线接口和无线接口。其中所述处理器601,配置为执行存储器中图像处理程序,以实现上述实施例提供的目标识别方法的步骤。
以上目标识别装置、计算机设备和存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同相应方法实施例相似的技术描述和有益效果,限于篇幅,可案件上述方法实施例的记载,故在此不再赘述。对于本申请目标识别装置、计算机设备和存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ReadOnly Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (14)

1.一种目标识别方法,其特征在于,所述方法包括:
确定用于对对象的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;所述外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系;
获取包括待识别对象的待处理图像;
采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。
2.根据权利要求1所述的方法,其特征在于,所述语义分割网络包括用于对输入的图像进行特征提取的第一网络,和用于对所述第一网络提取的图像特征进行语义分割的第二网络,所述采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别,包括:
采用所述第一网络对所述待处理图像进行特征提取,得到图像特征,并将所述图像特征输入所述第二网络;
采用所述第二网络,按照所述外观标签库,对所述图像特征进行语义分割,确定所述待识别对象的目标类别。
3.根据权利要求1所述的方法,其特征在于,所述确定用于对对象的外观颜色进行分割的语义分割网络之前,所述方法还包括:
获取包括样本对象的样本图像集合;
确定所述样本对象所属的类别和所述样本对象的外观颜色;其中,所述外观颜色用于表征所述样本对象的主体颜色;
对每一类别的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签;其中,同一类别的样本对象的外观标签相同;
基于所述每一类别的样本对象的外观标签,创建所述外观标签库。
4.根据权利要求3所述的方法,其特征在于,所述获取包括样本对象的样本图像集合之后,所述方法还包括:
确定所述样本图像中除所述样本对象之外的其他对象和背景区域;
采用不同的其他标签,分别对所述其他对象和所述背景区域进行标注;
将所述其他标签,加入所述外观标签库。
5.根据权利要求2所述的方法,其特征在于,所述采用所述第二网络,按照所述外观标签库,对所述图像特征进行语义分割,确定所述待识别对象的目标类别,包括:
采用所述第二网络,基于所述图像特征和所述外观标签库,对所述待识别对象的外观颜色进行分割,得到语义分割图;
基于所述待处理图像的尺寸,对所述语义分割图的尺寸进行调整,得到已调语义分割图;
基于所述已调语义分割图,得到所述待识别对象的目标类别。
6.根据权利要求5所述的方法,其特征在于,所述采用所述第二网络,基于所述图像特征和所述外观标签库,对所述待识别对象的外观颜色进行分割,得到语义分割图,包括:
采用所述第二网络,在所述图像特征中,确定至少一个待识别对象的特征数据;
按照所述特征数据中的颜色分量和所述外观标签库,对所述至少一个待识别对象的外观颜色进行语义分割,得到包括至少一类所述外观颜色的语义分割图。
7.根据权利要求5所述的方法,其特征在于,所述基于所述已调语义分割图,得到所述待识别对象的目标类别,包括:
在所述已调语义分割图中,确定所述待识别对象的外观颜色为所述外观标签库中每一外观标签的概率值;
将概率值最大的外观标签,确定为目标标签;
基于所述外观标签库中对象的类别与外观颜色之间的对应关系,确定所述目标标签对应的类别,以得到所述待识别对象的目标类别。
8.根据权利要求2所述的方法,其特征在于,所述确定用于对对象的外观颜色进行分割的语义分割网络之前,所述方法还包括:
确定多个样本对象所属的品牌和外观颜色;
对每一品牌的样本对象,标注与所述样本对象的外观颜色相匹配的外观标签;
基于所述每一品牌的样本对象的外观标签,创建所述外观标签库。
9.根据权利要求8所述的方法,其特征在于,在所述待识别对象的数量为多个的情况下,所述采用所述第二网络,按照所述外观标签库,对所述图像特征进行语义分割,确定所述待识别对象的目标类别,包括:
采用所述第二网络,按照所述外观标签库中类别与外观颜色之间的对应关系,确定所述图像特征中每一种外观颜色对应的待识别对象的品牌;
基于所述每一种外观颜色对应的待识别对象的品牌,确定所述多个待识别对象的目标品牌;
将所述目标品牌,确定为所述目标类别。
10.一种共享单车的颜色分割方法,其特征在于,所述方法包括:
确定用于对共享单车的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的共享单车已标注自身的外观颜色;所述外观标签库用于表征所述共享单车的品牌与外观颜色之间的对应关系;
获取包括待识别共享单车的待处理图像;
采用所述语义分割网络,对所述待识别共享单车的外观颜色进行语义分割,确定所述待识别共享单车的目标品牌。
11.一种目标识别装置,其特征在于,所述装置包括:
第一确定模块,用于确定用于对对象的外观颜色进行分割的语义分割网络;其中,所述语义分割网络是采用样本图像集和外观标签库进行训练得到的;所述样本图像集中的样本对象已标注自身的外观颜色;所述外观标签库用于表征所述样本对象的类别与外观颜色之间的对应关系;
第一获取模块,用于获取包括待识别对象的待处理图像;
第一分割模块,用于采用所述语义分割网络,对所述待识别对象的外观颜色进行语义分割,确定所述待识别对象的目标类别。
12.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机可执行指令,该计算机可执行指令被执行后能够实现权利要求1至8任一项所述的方法步骤,或者,该计算机可执行指令被执行后能够实现权利要求9所述的方法步骤。
13.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时能够实现权利要求1至8任一项所述的方法步骤;或者,所述处理器运行所述存储器上的计算机可执行指令时能够实现权利要求9所述的方法步骤。
14.一种计算程序产品,其特征在于,所述计算机程序产品包括计算机可执行指令,该计算机可执行指令被执行后,能够实现权利要求1至8任一项所述的方法步骤;或者,该计算机可执行指令被执行后,能够实现权利要求9所述的方法步骤。
CN202110121333.XA 2021-01-28 2021-01-28 目标识别方法及装置、电子设备及存储介质 Pending CN112818826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110121333.XA CN112818826A (zh) 2021-01-28 2021-01-28 目标识别方法及装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110121333.XA CN112818826A (zh) 2021-01-28 2021-01-28 目标识别方法及装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112818826A true CN112818826A (zh) 2021-05-18

Family

ID=75859995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110121333.XA Pending CN112818826A (zh) 2021-01-28 2021-01-28 目标识别方法及装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112818826A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378668A (zh) * 2021-05-28 2021-09-10 上海商汤智能科技有限公司 积水类别的确定方法、装置、设备及存储介质
CN114155433A (zh) * 2021-11-30 2022-03-08 北京新兴华安智慧科技有限公司 一种违法土地的检测方法、装置、电子设备及存储介质
WO2023045691A1 (zh) * 2021-09-22 2023-03-30 腾讯科技(深圳)有限公司 对象识别方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107690672A (zh) * 2017-07-25 2018-02-13 深圳前海达闼云端智能科技有限公司 训练数据生成方法、生成装置及其图像语义分割方法
US20190163193A1 (en) * 2017-11-29 2019-05-30 GM Global Technology Operations LLC Systems and methods for detection, classification, and geolocation of traffic objects
US20200151497A1 (en) * 2018-11-12 2020-05-14 Sony Corporation Semantic segmentation with soft cross-entropy loss
CN111325256A (zh) * 2020-02-13 2020-06-23 上海眼控科技股份有限公司 车辆外观检测方法、装置、计算机设备和存储介质
US20200202128A1 (en) * 2018-12-21 2020-06-25 Samsung Electronics Co., Ltd. System and method for providing dominant scene classification by semantic segmentation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107690672A (zh) * 2017-07-25 2018-02-13 深圳前海达闼云端智能科技有限公司 训练数据生成方法、生成装置及其图像语义分割方法
US20190163193A1 (en) * 2017-11-29 2019-05-30 GM Global Technology Operations LLC Systems and methods for detection, classification, and geolocation of traffic objects
US20200151497A1 (en) * 2018-11-12 2020-05-14 Sony Corporation Semantic segmentation with soft cross-entropy loss
US20200202128A1 (en) * 2018-12-21 2020-06-25 Samsung Electronics Co., Ltd. System and method for providing dominant scene classification by semantic segmentation
CN111325256A (zh) * 2020-02-13 2020-06-23 上海眼控科技股份有限公司 车辆外观检测方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378668A (zh) * 2021-05-28 2021-09-10 上海商汤智能科技有限公司 积水类别的确定方法、装置、设备及存储介质
WO2023045691A1 (zh) * 2021-09-22 2023-03-30 腾讯科技(深圳)有限公司 对象识别方法、装置、电子设备及存储介质
CN114155433A (zh) * 2021-11-30 2022-03-08 北京新兴华安智慧科技有限公司 一种违法土地的检测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN106599773B (zh) 用于智能驾驶的深度学习图像识别方法、系统及终端设备
CN112818826A (zh) 目标识别方法及装置、电子设备及存储介质
CN107944450B (zh) 一种车牌识别方法及装置
CN111767878B (zh) 嵌入式设备中基于深度学习的交通标志检测方法及系统
CN112016556B (zh) 多类型车牌识别方法
CN113723377B (zh) 一种基于ld-ssd网络的交通标志检测方法
CN112581409B (zh) 一种基于端到端的多重信息蒸馏网络的图像去雾方法
CN113762209A (zh) 一种基于yolo的多尺度并行特征融合路标检测方法
CN108846387B (zh) 一种交警手势识别方法及装置
CN111931683B (zh) 图像识别方法、装置及计算机可读存储介质
CN109993806A (zh) 一种颜色识别方法、装置及电子设备
CN110348463A (zh) 用于识别车辆的方法和装置
CN112016545A (zh) 一种包含文本的图像生成方法及装置
CN113378668A (zh) 积水类别的确定方法、装置、设备及存储介质
CN115424217A (zh) 基于ai视觉的车辆智能识别方法、装置和电子设备
CN114596548A (zh) 目标检测方法、装置、计算机设备及计算机可读存储介质
CN113627477B (zh) 车辆多属性识别方法及系统
CN114764730A (zh) 基于车辆信息识别的广告精准投放方法
US20230386178A1 (en) Image recognition method, electronic device and readable storage medium
CN116433900A (zh) 一种基于双支路特征提取的语义分割方法
CN113378669A (zh) 车辆摆放姿态的确定方法、装置、设备及存储介质
CN115909276A (zh) 基于改进YOLOv5的复杂天气下小交通标志目标检测方法
Zhang et al. Contextual and Multi-Scale Feature Fusion Network for Traffic Sign Detection
CN112800930A (zh) 非机动车计数方法、装置、设备及存储介质
CN114296545A (zh) 一种基于视觉的无人机手势控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210518

RJ01 Rejection of invention patent application after publication