CN114387556A - 对象颜色识别方法、装置、可读存储介质及电子设备 - Google Patents
对象颜色识别方法、装置、可读存储介质及电子设备 Download PDFInfo
- Publication number
- CN114387556A CN114387556A CN202210058101.9A CN202210058101A CN114387556A CN 114387556 A CN114387556 A CN 114387556A CN 202210058101 A CN202210058101 A CN 202210058101A CN 114387556 A CN114387556 A CN 114387556A
- Authority
- CN
- China
- Prior art keywords
- color
- distribution information
- target object
- color distribution
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 11
- 239000003086 colorant Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种对象颜色识别方法、装置、可读存储介质及电子设备。该方法包括:获取待处理视频;从所述待处理视频中确定包括目标对象的连续视频帧;依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,其中,所述第一颜色分布信息包括颜色空间的各个通道的分布信息。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种对象颜色识别方法、装置、可读存储介质及电子设备。
背景技术
随着计算机视觉技术的发展,计算机视觉技术的应用越来越广,其中就包括通过计算机视觉技术进行颜色识别,即通过计算机视觉技术确定图像中的对象的颜色。但传统颜色识别技术的颜色识别准确度低。
发明内容
本申请提供一种对象颜色识别方法、装置、可读存储介质及电子设备。
第一方面,提供了一种颜色识别方法,所述方法包括:
获取待处理视频;
从所述待处理视频中确定包括目标对象的连续视频帧;
依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,其中,所述第一颜色分布信息包括颜色空间的各个通道的分布信息。
结合本申请任一实施方式,在所述获取待处理视频之后,在所述从所述待处理视频中确定包括目标对象的连续视频帧之前,所述方法还包括:
获取所述待处理视频的标注信息,所述标注信息包括所述待处理视频中所述目标对象的至少一个对象标识,所述待处理视频的任一段连续视频帧内出现的同一目标对象的对象标识相同且唯一;
所述从所述待处理视频中确定包括目标对象的连续视频帧,包括:
依据所述目标对象的对象标识,从所述待处理视频中确定包括所述目标对象的连续视频帧。
结合本申请任一实施方式,所述获取所述待处理视频的标注信息,包括:
对所述待处理视频的各个视频帧进行目标检测,得到所述各个视频帧中的各个对象;
为所述各个视频帧中的各个对象分别设置对象标识,其中,所述待处理视频的任一段连续视频帧内出现的同一对象的对象标识相同且唯一,所述各个视频帧中的各个对象包括所述目标对象。
结合本申请任一实施方式,所述依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,包括:
合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息;
依据所述目标对象的第二颜色分布信息,确定所述目标对象的颜色。
结合本申请任一实施方式,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息,包括:
获取预设的合并区间个数;
获取所述连续视频帧的长度;
根据所述合并区间个数和所述连续视频帧的长度,确定每个合并区间的长度;
根据所述每个合并区间的长度,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息。
结合本申请任一实施方式,所述目标对象的第一颜色分布信息包括所述目标对象的中心区域的第三颜色分布信息和所述目标对象的边缘区域的第四颜色分布信息;
所述合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息,包括:
合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息;
合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息;其中,所述目标对象的第二颜色分布信息包括所述第五颜色分布信息和所述第六颜色分布信息。
结合本申请任一实施方式,所述合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息,包括:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到所述第五颜色分布信息;
所述合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息,包括:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到所述第六颜色分布信息。
结合本申请任一实施方式,依据所述目标对象的第二颜色分布信息,确定所述目标对象的颜色,包括:
在各个合并区间的各个颜色空间的通道内,分别对所述第二颜色分布信息作归一化处理,得到第七颜色分布信息;
串联各个合并区间的各个通道内的所述第七颜色分布信息,得到第一向量;
依据所述第一向量,得到所述目标对象的颜色。
结合本申请任一实施方式,所述依据所述第一向量,得到所述目标对象的颜色,包括:
使用颜色分类器对所述第一向量进行处理,得到所述目标对象的颜色。
结合本申请任一实施方式,在使用颜色分类器对所述第一向量进行处理,得到所述目标对象的颜色之前,所述方法还包括:
获取待训练分类器和训练数据,所述训练数据包括第二向量与所述第二向量的标注信息,所述第二向量由一段连续视频帧内训练对象的颜色分布信息根据所述预设的合并区间个数合并、归一化处理、串联得到,所述第二向量的标注信息为所述训练对象的颜色;
使用所述训练数据训练所述待训练分类器,得到所述颜色分类器。
第二方面,提供了一种对象颜色识别装置,所述装置包括:
获取单元,用于获取待处理视频;
第一处理单元,用于从所述待处理视频中确定包括目标对象的连续视频帧;
第二处理单元,用于依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,其中,所述第一颜色分布信息包括颜色空间的各个通道的分布信息。
结合本申请任一实施方式,所述获取单元,还用于获取所述待处理视频的标注信息,所述标注信息包括所述待处理视频中所述目标对象的至少一个对象标识,所述待处理视频的任一段连续视频帧内出现的同一目标对象的对象标识相同且唯一;
所述第一处理单元,用于依据所述目标对象的对象标识,从所述待处理视频中确定包括所述目标对象的连续视频帧。
所述获取单元,用于:
对所述待处理视频的各个视频帧进行目标检测,得到所述各个视频帧中的各个对象;
为所述各个视频帧中的各个对象分别设置对象标识,其中,所述待处理视频的任一段连续视频帧内出现的同一对象的对象标识相同且唯一,所述各个视频帧中的各个对象包括所述目标对象。
结合本申请任一实施方式,所述第二处理单元,用于:
合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息;
依据所述目标对象的第二颜色分布信息,确定所述目标对象的颜色。
结合本申请任一实施方式,所述第二处理单元,用于:
获取预设的合并区间个数;
获取所述连续视频帧的长度;
根据所述合并区间个数和所述连续视频帧的长度,确定每个合并区间的长度;
根据所述每个合并区间的长度,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息。
结合本申请任一实施方式,所述目标对象的第一颜色分布信息包括所述目标对象的中心区域的第三颜色分布信息和所述目标对象的边缘区域的第四颜色分布信息;
所述第二处理单元,用于:
合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息;
合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息;其中,所述目标对象的第二颜色分布信息包括所述第五颜色分布信息和所述第六颜色分布信息。
结合本申请任一实施方式,所述第二处理单元,用于:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到所述第五颜色分布信息;
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到所述第六颜色分布信息。
结合本申请任一实施方式,所述第二处理单元,用于:
在各个合并区间的各个颜色空间的通道内,分别对所述第二颜色分布信息作归一化处理,得到第七颜色分布信息;
串联各个合并区间的各个通道内的所述第七颜色分布信息,得到第一向量;
依据所述第一向量,得到所述目标对象的颜色。
结合本申请任一实施方式,所述第二处理单元,用于:
使用颜色分类器对所述第一向量进行处理,得到所述目标对象的颜色。
结合本申请任一实施方式,所述获取单元,还用于获取待训练分类器和训练数据,所述训练数据包括第二向量与所述第二向量的标注信息,所述第二向量由一段连续视频帧内训练对象的颜色分布信息根据所述预设的合并区间个数合并、归一化处理、串联得到,所述第二向量的标注信息为所述训练对象的颜色;
所述第二处理单元,还用于使用所述训练数据训练所述待训练分类器,得到所述颜色分类器。
第三方面,提供了一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
第四方面,提供了另一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行如上述第一方面及其任意一种可能实现的方式的方法。
第六方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或指令,在所述计算机程序或指令在计算机上运行的情况下,使得所述计算机执行上述第一方面及其任一种可能的实现方式的方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请。
本申请实施例中,对象颜色识别装置依据待处理视频中的连续视频帧的颜色分布信息确定目标对象的颜色,可减小单张图像所携带的颜色分布信息对确定目标对象的颜色带来的误差,进而提高目标对象的颜色的准确度。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1为本申请实施例提供的一种对象颜色识别方法的流程示意图;
图2为本申请实施例提供的一种目标对象的中心区域和目标对象的边缘区域的示意图;
图3为本申请实施例提供的一种参考区域的示意图;
图4为本申请实施例提供的一种对象颜色识别装置的结构示意图;
图5为本申请实施例提供的一种对象颜色识别装置的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上,“至少两个(项)”是指两个或三个及三个以上,“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”可表示前后关联对象是一种“或”的关系,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。字符“/”还可表示数学运算中的除号,例如,a/b=a除以b;6/3=2。“以下至少一项(个)”或其类似表达。
本申请实施例中,[a,b]表示大于或等于a,且小于或等于b的取值区间。(a,b]表示大于a,且小于或等于b的取值区间。[a,b)表示大于或等于a,且小于b的取值区间。(a,b)表示大于a,且小于b的取值区间。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例的执行主体为对象颜色识别装置,其中,对象颜色识别装置可以是任意一种可执行本申请方法实施例所公开的技术方案的电子设备。可选的,对象颜色识别装置可以是以下中的一种:手机、计算机、平板电脑、可穿戴智能设备。
应理解,本申请方法实施例还可以通过处理器执行计算机程序代码的方式实现。下面结合本申请实施例中的附图对本申请实施例进行描述。请参阅图1,图1是本申请实施例提供的一种对象颜色识别方法的流程示意图。
101、获取待处理视频。
本申请实施例中,待处理视频可以是离线视频,也可以是在线视频。其中,离线视频可以是通过摄像头或移动智能设备采集获得的视频。在线视频可以是摄像头实时获得视频,例如,对象颜色识别装置可与一个或一个以上摄像头之间具有通信连接,对象颜色识别装置可将从摄像头获取的实时采集的视频作为待处理视频。
在一种获取待处理视频的实现方式中,对象颜色识别装置将用户通过输入组件输入的视频作为待处理视频。上述输入组件包括:键盘、鼠标、触控屏、触控板和音频输入器。
在另一种获取待处理视频的实现方式中,对象颜色识别装置接收终端发送的视频作为待处理视频。上述终端可以是以下任意一种:手机、计算机、平板电脑、服务器。
在又一种获取待处理视频的实现方式中,对象颜色识别装置与监控摄像头之间存在通信连接。对象颜色识别装置通过该通信连接获取监控摄像头采集到的视频流,作为待处理视频。
102、从上述待处理视频中确定包括目标对象的连续视频帧。
本申请实施例中,目标对象可以是任意物体。例如,目标对象可以是人;目标对象也可以是车辆;目标对象还可以是猫。
可选的,对象颜色识别装置通过对待处理视频进行目标检测处理,确定待处理视频中包括目标对象的至少两张图像,作为连续视频帧。
由于连续视频帧为待处理视频中的至少两张图像,任意两张连续视频帧中的图像的采集时间不同。
103、依据上述连续视频帧中各帧图像的第一颜色分布信息,确定上述目标对象的颜色。
本申请实施中,颜色分布信息(包括上述第一颜色分布信息和下文将要提及的第二颜色分布信息、第三颜色分布信息、第四颜色分布信息、第五颜色分布信息、第六颜色分布信息和第七颜色分布信息)包括颜色空间的各个通道的分布信息。
可选的,颜色分布信息可以是以下中的一种:以像素值为依据确定的像素的分布、以颜色值为依据确定的像素的分布。其中,颜色值为六角锥体模型((hue,saturation,value,HSV)的参数,该模型中颜色值的参数包括:色调,饱和度,亮度。
在一种可能实现的方式中,颜色识别装置统计目标对象的像素值的直方图,得到第一颜色分布信息。
本申请实施例中,第一颜色分布信息为连续视频帧中的图像的颜色分布信息。由于连续视频帧中的任意两张图像的采集时间不同,连续视频帧中的任意图像所携带的目标对象的颜色分布信息不同。
例如,第一目标为车辆,连续视频帧包括图像a和图像b。在图像a中,车辆处于阳光下。在图像b中,车辆处于树荫下。在图像a中,车辆的颜色为白色,由于树荫的存在,导致车辆的颜色产生色差,进而使图像b中的车辆的颜色为灰色。
但由于在连续视频帧中,不同图像所携带的目标对象的颜色分布信息之间存在相关性。因此,对象颜色识别装置依据连续视频帧中的各帧图像的目标对象的第一颜色分布信息,确定目标对象的颜色,可提高目标对象的颜色的准确度。
在一种可能实现的方式中,对象颜色识别装置对各张连续视频帧中的图像的目标对象的第一颜色分布信息进行融合处理,得到融合后的颜色分布信息。对象颜色识别装置依据融合后的颜色分布信息,确定目标对象的颜色。
在另一种可能实现的方式中,对象颜色识别装置分别确定连续视频帧中的各帧图像中,目标对象所处环境的类别。依据目标对象所处环境的类别,确定连续视频帧中各帧图像的目标对象的颜色置信度。依据颜色置信度最大的目标对象的第一颜色分布信息,确定目标对象的颜色。
例如,连续视频帧包括图像a和图像b。对象颜色识别装置确定在图像a中目标对象所处的环境为室内,在图像b中目标对象所述的环境为阳光下。依据所处的环境为室内,确定图像a中的目标对象的颜色置信度为0.7。依据所处的环境为阳光下,确定图像b中的目标对象的颜色置信度为0.9。由于图像b中的目标对象的颜色置信度比图像a中的目标对象的颜色置信度大,对象颜色识别装置依据图像b中的目标对象的第一颜色分布信息,确定目标对象的颜色。
在又一种可能实现的方式中,对象颜色识别装置分别依据连续视频帧中各帧图像的目标对象的第一颜色分布信息,确定目标对象的至少两个备选颜色。对象颜色识别装置确定至少两个备选颜色中占比最多的颜色为目标对象的颜色。
例如,连续视频帧包括图像a、图像b和图像c。对象颜色识别装置依据图像a确定第一备选颜色A,依据图像b确定备选颜色B,依据图像c确定备选颜色C。此时,至少两个第二备选颜色包括备选颜色A、备选颜色B和备选颜色C。
若备选颜色A为红色,备选颜色B为橙色,备选颜色C为红色。由于至少两个第二备选颜色中占比最多的颜色为红色,目标对象的颜色为红色。
本申请实施例中,对象颜色识别装置依据待处理视频中的连续视频帧的颜色分布信息确定目标对象的颜色,可减小单张图像所携带的颜色分布信息对确定目标对象的颜色带来的误差,进而提高目标对象的颜色的准确度。
作为一种可选的实施方式,对象颜色识别装置在执行步骤101之后,在执行步骤102之前,还执行以下步骤:
201、获取上述待处理视频的标注信息。
本申请实施中,标注信息包括待处理视频中目标对象的至少一个对象标识,待处理视频的任一段连续视频帧内出现的同一目标对象的对象标识相同且唯一。
例如,车辆a从待处理视频的第3帧图像开始出现在待处理视频中,且待处理视的第3帧图像至第100帧图像的每一帧图像均包括车辆。第3帧图像至第50帧图像均包括车辆a,第50帧图像至第100帧图像均包括车辆b。
那么,第3帧图像至第50帧图像内的对象标识均相同,即第3帧图像至第50帧图像内的对象标识均指示车辆a。第51帧图像至第100帧图像内的对象标识均相同,即第51帧图像至第100帧图像内的对象标识均指示车辆b。
又例如,车辆a从待处理视频的第3帧图像开始出现在待处理视频中,且待处理视的第3帧图像至第50帧图像的每一帧图像均包括车辆a。从第51帧图像开始从待处理视频中消失,且待处理视的第51帧图像至第100帧图像的每一帧图像均不包括车辆a。从待处理视频的第101帧图像开始又出现在待处理视频中,且待处理视的第101帧图像至第150帧图像的每一帧图像均包括车辆a。
那么,车辆a在第3帧图像至第50帧图像内的对象标识均相同,车辆a在第101帧图像至第150帧图像内的对象标识均相同,且车辆a在第3帧图像至第50帧图像内的对象标识与车辆a在第101帧图像至第150帧图像内的对象标识不同。
在执行完步骤1的情况下,对象颜色识别装置在执行步骤102的过程中执行以下步骤:
202、依据上述目标对象的对象标识,从上述待处理视频中确定包括上述目标对象的连续视频帧。
对象颜色识别装置从待处理视频中确定包括同一对象标识的待处理视频段,从待处理视频段中确定连续视频帧。
例如,待处理视频中第2帧图像至第30帧图像中的每一帧图像均包括对象标识A,那么,对象颜色识别装置从待处理视频中确定,第2帧图像至第30帧图像为待处理视频段,并可从第2帧图像至第30帧图像中确定至少两帧连续图像,作为包括对象标识A所指示的目标对象的连续视频帧。
由于不同目标对象的颜色可能不同,且同一目标对象在从待处理视频中消失并再次出现的过程中,颜色可能发生变化。而在本申请实施例中,在待处理视频的任一段连续视频帧内出现的同一目标对象的对象标识相同且唯一的情况下,对象颜色识别装置依据目标对象的对象标识,确定包括目标对象的连续视频帧。这样,可使连续视频帧内的目标对象的颜色不变,进而可提高目标对象的颜色的准确度。
作为一种可选的实施方式,对象颜色识别装置在执行步骤1的过程中执行以下步骤:
301、对上述待处理视频的各个视频帧进行目标检测,得到上述各个视频帧中的各个对象。
本申请实施例中,目标检测用于检测图像中的目标对象。通过对图像进行目标检测,可确定图像中是否包括目标对象,并在图像包括目标对象的情况下,确定目标对象的数量。
例如,目标对象为车辆。通过对图像进行目标检测,可确定图像是否包括车辆。在图像包括车辆a的情况下,确定图像包括1辆车。在图像包括车辆a和车辆b的情况下,确定图像中存在两辆车。
302、为上述各个视频帧中的各个对象分别设置对象标识,其中,上述待处理视频的任一段连续视频帧内出现的同一对象的对象标识相同且唯一,上述各个视频帧中的各个对象包括上述目标对象。
对象颜色识别装置在确定各帧图像中的各个对象的情况下,进一步确定目标对象的对象标识。
例如,目标对象为车辆。通过对图像进行目标检测,确定待处理视频的第5帧图像包括车辆a和车辆b,对象颜色识别装置确定车辆a的对象标识为1,确定车辆b的对象标识为1。
若待处理视频的第5帧图像至第50帧帧图像均包括车辆a,那么在第5帧图像至第50帧图像中,车辆a的对象标识均为1。若待处理视频的第5帧图像至第30帧帧图像均包括车辆b,那么在第5帧图像至第30帧图像中,车辆b的对象标识均为2。
又例如,目标对象为车辆。通过对图像进行目标检测,确定待处理视频的第5帧图像包括车辆。在第5帧图像包括车辆a的情况下,确定车辆a的对象标识为1。
若待处理视频的第5帧图像至第50帧帧图像均包括车辆a,那么在第5帧图像至第50帧图像中,车辆a的对象标识均为1。
若待处理视频的第5帧图像至第50帧帧图像均包括车辆a,从第51帧图像开始从待处理视频中消失,且待处理视的第51帧图像至第100帧图像的每一帧图像均不包括车辆a。从待处理视频的第101帧图像开始又出现在待处理视频中,且待处理视的第101帧图像至第150帧图像的每一帧图像均包括车辆a。
那么,车辆a在第5帧图像至第50帧图像内的对象标识均为1,车辆a在第101帧图像至第150帧图像内的对象标识为2。
作为一种可选的实施方式,对象颜色识别装置在执行步骤103的过程中执行以下步骤:
401、合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息。
在一种可能实现的方式中,第一颜色分布信息通过统计目标对象的像素值的直方图得到。对象颜色识别装置统计连续视频帧中目标对象的像素值的直方图,得到第二颜色分布信息。
例如,连续帧图像包括图像a和图像b。图像a的目标对象的第一颜色分布信息为,红色通道的灰度值处于[0,150)的像素数量为30,红色通道的灰度值处于[150,200)的像素数量为70。图像b的目标对象的第一颜色分布信息为,红色通道的灰度值处于[0,150)的像素数量为50,红色通道的灰度值处于[150,200)的像素数量为60。
此时,连续视频帧中目标对象的红色通道灰度值处于[0,150)的像素数量为80,红色通道灰度值处于[150,200)的像素数量为130。即,第二颜色分布信息为,红色通道灰度值处于[0,150)的像素数量为80,红色通道灰度值处于[150,200)的像素数量为130。
402、依据上述目标对象的第二颜色分布信息,确定上述目标对象的颜色。
在一种可能实现的方式中,对象颜色识别装置依据第二颜色分布信息,确定目标对象的颜色深度的概率分布信息。依据颜色深度的概率分布信息,确定目标对象的颜色。
在连续视频帧中,不同图像所携带的目标对象的颜色分布信息之间存在相关性,而第二颜色分布信息通过合并连续视频帧中各帧图像的目标对象的第一颜色分布信息得到,因此,对象颜色识别装置依据第二颜色分布信息,确定目标对象的颜色,可提高目标对象的颜色的准确度。
作为一种可选的实施方式,对象颜色识别装置在执行步骤401的过程中执行以下步骤:
501、获取预设的合并区间个数。
本申请实施例中,合并区间为图像的帧号区间。例如,合并区间为第1帧至第3帧,此时,对象颜色识别装置合并第1帧中目标对象的第一颜色分布信息、第2帧中目标对象的第一颜色分布信息和第3帧中目标对象的第一颜色分布信息。
502、获取所述连续视频帧的长度。
本申请实施例中,连续视频帧的长度为连续视频帧中图像的帧数。例如,连续视频帧包括5帧图像,此时连续视频帧的长度为5帧。
503、根据所述合并区间个数和所述连续视频帧的长度,确定每个合并区间的长度。
在一种可能实现的方式中,对象颜色识别装置计算连续视频帧的长度与合并区间的个数的商,作为合并区间的长度。
例如,连续视频帧的长度为30帧,合并区间的个数为3个,对象颜色识别装置计算连续视频帧的长度与合并区间的商为10,即每个合并区间的长度为10帧图像。
此时,对象颜色识别装置将连续视频帧分为三个合并区间,这三个合并区间分别为:第1帧至第10帧、第11帧至第20帧、第21帧至第30帧。
又例如,连续视频帧的长度为80帧,合并区间的个数为4个,对象颜色识别装置计算连续视频帧的长度与合并区间的商为20,即每个合并区间的长度为20帧图像。
此时,对象颜色识别装置将连续视频帧分为四个合并区间,这四个合并区间分别为:第1帧至第20帧、第21帧至第40帧、第41帧至第60帧、第61帧至第80帧。
504、根据所述每个合并区间的长度,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息。
对象颜色识别装置分别将各个合并区间内的目标对象的第一颜色分布信息合并,得到m个合并后的颜色分布信息,其中,m为合并区间的个数。对象颜色识别装置依据m个合并后的颜色分布信息,得到目标对象的第二颜色分布信息。
在一种可能实现的方式中,对象颜色识别装置对m个合并后的颜色分布信息进行拼接,得到目标对象的第二颜色分布信息。
例如,连续视频帧包括三个合并区间,这三个合并区间分别为:第1帧至第10帧、第11帧至第20帧、第21帧至第30帧。对象颜色识别装置通过合并第1帧至第10帧中目标对象的第一颜色分布信息,得到合并后的颜色分布信息A。对象颜色识别装置通过合并第11帧至第20帧中目标对象的第一颜色分布信息,得到合并后的颜色分布信息B。对象颜色识别装置通过合并第21帧至第30帧中目标对象的第一颜色分布信息,得到合并后的颜色分布信息C。
对象颜色识别装置拼接合并后的颜色分布信息A、合并后的颜色分布信息B和合并后的颜色分布信息C,得到目标对象的第二颜色分布信息。
本申请实施例中,对象颜色识别装置通过合并每个合并区间中各帧图像的目标对象的第一颜色分布信息,可将合并区间内的目标对象的第一颜色分布信息作为一个整体,这样,再依据合并后的颜色分布信息,得到目标对象的第二颜色分布信息,可减少数据处理量,提高处理速度。
作为一种可选的实施方式,所述目标对象的第一颜色分布信息包括所述目标对象的中心区域的第三颜色分布信息和所述目标对象的边缘区域的第四颜色分布信息。
本申请实施例中,目标对象的中心区域指目标对象所覆盖的像素区域的几何中心区域,该区域包括目标对象所覆盖的像素的概率大。目标对象的边缘区域指目标对象所覆盖的像素区域中除中心区域之外的区域,该区域包括目标对象所覆盖的像素的概率小。
例如,在图2所示的图像中,车辆为目标对象,椭圆a所包围的像素区域为目标对象的中心区域,除椭圆a包围的像素区域之外的像素区域为目标对象的边缘区域。
图2中除了车辆之外,还有道路。因此,图2不仅包括车辆所覆盖的像素还包括道路所覆盖的像素。将椭圆a所包围的像素区域作为目标对象的中心区域,可使中心区域中的像素为车辆所覆盖的像素的概率更大,并可使边缘区域中的像素为车辆所覆盖的像素的概率更小。
可选的,目标对象的边缘区域包括至少一个参考区域。例如,在图3所示的图像中,目标对象为狗,圆a内的区域为目标对象的中心区域(即图4中的1号区域),除1号区域之外的区域为目标对象的边缘区域。在图3中,将目标对象的边缘区域分为2号区域、3号区域、4号区域和5号区域四个参考区域。
可选的,目标对象的中心区域的几何中心为连续视频帧中的图像的几何中心。例如,目标对象的中心区域为,以连续视频帧中的图像的几何中心为圆心、半径为第一预设值的圆形区域。此时,连续视频帧中的图像中除圆形区域之外的像素区域为目标对象的边缘区域。又例如,目标对象的中心区域为,以连续视频帧中的图像的几何中心为几何中心、边长为第二预设值的正方形区域。此时,连续视频帧中的图像中除正方形区域之外的像素区域为目标对象的边缘区域。
应理解,上述目标对象的中心区域的形状为任意形状。例如,目标对象的中心区域的形状为矩形。又例如,目标对象的中心区域的形状为圆形。再例如,目标对象的中心区域的形状为椭圆形。
可选的,目标对象的中心区域在连续视频帧中的图像中的位置为预先设置的。
本申请实施例中,第三颜色分布信息为目标对象的中心区域的颜色分布信息,第四颜色分布信息为目标对象的边缘区域的颜色分布信息。
颜色识别装置在合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息的过程中,执行以下步骤:
601、合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息。
602、合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息。
本实施方式中,目标对象的第二颜色分布信息包括第五颜色分布信息和第六颜色分布信息。在一种可能实现的方式中,对象颜色识别装置对第五颜色分布信息和第六颜色分布信息进行拼接,得到第二颜色分布信息。
作为一种可选的实施方式,对象颜色识别装置在执行步骤601的过程中执行以下步骤:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到所述第五颜色分布信息。
本步骤中,连续视频帧中的图像包括至少两个通道。例如,连续视频帧的图像为RGB图像,此时,连续视频帧的图像包括红色通道、绿色通道和蓝色通道。
在一种可能实现的方式中,对象颜色识别装置依据第三颜色分布信息,确定颜色空间的各个通道的颜色分布信息。对象颜色识别装置分别合并各个通道的颜色分布信息,得到中心区域的至少两个通道颜色分布信息。对象颜色识别装置将中心区域的至少两个通道颜色分布信息,作为第五颜色分布信息。
例如,连续视频帧中的图像均包括红色通道、绿色通道和蓝色通道。连续视频帧包括图像a和图像b。
依据图像a中的目标对象的中心区域的第三颜色分布信息,确定图像a中的目标对象的中心区域的红色通道的颜色分布信息为:红色通道的灰度值处于[0,100]内的像素有126个,红色通道的灰度值处于(100,150]内的像素有150个,红色通道的灰度值处于(150,230]内的像素有79个。依据图像a中的目标对象的中心区域的第三颜色分布信息,确定图像a中的目标对象的中心区域的蓝色通道的颜色分布信息为:蓝色通道的灰度值处于[0,100]内的像素有66个,蓝色通道的灰度值处于(100,150]内的像素有203个,蓝色通道的灰度值处于(150,230]内的像素有86个。依据图像a中的目标对象的中心区域的第三颜色分布信息,确定图像a中的目标对象的中心区域的绿色通道的颜色分布信息为:绿色通道的灰度值处于[0,100]内的像素有86个,绿色通道的灰度值处于(100,150]内的像素有173个,绿色通道的灰度值处于(150,230]内的像素有96个。
依据图像b中的目标对象的中心区域的第三颜色分布信息,确定图像b中的目标对象的中心区域的红色通道的颜色分布信息为:红色通道的灰度值处于[0,100]内的像素有166个,红色通道的灰度值处于(100,150]内的像素有133个,红色通道的灰度值处于(150,230]内的像素有55个。依据图像b中的目标对象的中心区域的第三颜色分布信息,确定图像b中的目标对象的中心区域的蓝色通道的颜色分布信息为:蓝色通道的灰度值处于[0,100]内的像素有66个,蓝色通道的灰度值处于(100,150]内的像素有181个,蓝色通道的灰度值处于(150,230]内的像素有107个。依据图像b中的目标对象的中心区域的第三颜色分布信息,确定图像b中的目标对象的中心区域的绿色通道的颜色分布信息为:绿色通道的灰度值处于[0,100]内的像素有90个,绿色通道的灰度值处于(100,150]内的像素有143个,绿色通道的灰度值处于(150,230]内的像素有121个。
对象颜色识别装置合并中心区域的红色通道的颜色分布信息,得到的通道颜色分布信息A为:红色通道的灰度值处于[0,100]内的像素有292个,红色通道的灰度值处于(100,150]内的像素有283个,红色通道的灰度值处于(150,230]内的像素有134个。
对象颜色识别装置合并中心区域的蓝色通道的颜色分布信息,得到的通道颜色分布信息B为:蓝色通道的灰度值处于[0,100]内的像素有132个,蓝色通道的灰度值处于(100,150]内的像素有384个,蓝色通道的灰度值处于(150,230]内的像素有193个。
对象颜色识别装置合并中心区域的绿色通道的颜色分布信息,得到的通道颜色分布信息C为:绿色通道的灰度值处于[0,100]内的像素有176个,绿色通道的灰度值处于(100,150]内的像素有316个,绿色通道的灰度值处于(150,230]内的像素有217个。
此时,中心区域的至少两个通道颜色分布信息包括通道颜色分布信息A、颜色分布信息B和颜色分布信息C,即第五颜色分布信息包括通道颜色分布信息A、颜色分布信息B和颜色分布信息C。
作为一种可选的实施方式,对象颜色识别装置在执行步骤602的过程中执行以下步骤:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到所述第六颜色分布信息。
本步骤中,连续视频帧中的图像包括至少两个通道。例如,连续视频帧的图像为RGB图像,此时,连续视频帧的图像包括红色通道、绿色通道和蓝色通道。
在一种可能实现的方式中,对象颜色识别装置依据第四颜色分布信息,确定颜色空间的各个通道的颜色分布信息。对象颜色识别装置分别合并各个通道的颜色分布信息,得到边缘区域的至少两个通道颜色分布信息。对象颜色识别装置将边缘区域的至少两个通道颜色分布信息,作为第六颜色分布信息。
作为一种可选的实施方式,对象颜色识别装置在执行步骤402的过程中执行以下步骤:
701、在各个合并区间的各个颜色空间的通道内,分别对所述第二颜色分布信息作归一化处理,得到第七颜色分布信息。
对象颜色识别装置通过执行步骤701,可将各个合并区域的各个颜色空间的通道内的第二颜色分布信息,转换为同一数量级,进而有利于同时利用各个合并区域的各个颜色空间的通道内的第二颜色分布信息。
例如,连续视频帧包括合并区间a,对象颜色识别装置通过合并合并区间a中目标对象的第二颜色分布信息,得到颜色分布信息A。
颜色分布信息A为,红色通道的灰度值处于[0,100]内的像素有126个,红色通道的灰度值处于(100,150]内的像素有150个,红色通道的灰度值处于(150,230]内的像素有79个。蓝色通道的灰度值处于[0,100]内的像素有66个,蓝色通道的灰度值处于(100,150]内的像素有203个,蓝色通道的灰度值处于(150,230]内的像素有86个。绿色通道的灰度值处于[0,100]内的像素有86个,绿色通道的灰度值处于(100,150]内的像素有173个,绿色通道的灰度值处于(150,230]内的像素有96个。
在通过对颜色分布信息A进行归一化处理得到的合并区间A的第七颜色分布信息中,红色通道的灰度值处于[0,100]内的像素占比为35.5%,红色通道的灰度值处于(100,150]内的像素占比为42.3%,红色通道的灰度值处于(150,230]内的像素占比为22.2%。蓝色通道的灰度值处于[0,100]内的像素占比为18.6%,蓝色通道的灰度值处于(100,150]内的像素占比为57.1%,蓝色通道的灰度值处于(150,230]内的像素占比为24.3%。绿色通道的灰度值处于[0,100]内的像素占比为24.3%,绿色通道的灰度值处于(100,150]内的像素占比为48.7%,绿色通道的灰度值处于(150,230]内的像素占比为27%。
702、串联各个合并区间的各个通道内的所述第七颜色分布信息,得到第一向量。
对象颜色识别装置通过执行步骤702,可得到一个v*w*x*y的向量,即为第一向量,其中,v为合并区间的个数,w为连续视频帧内的图像的通道数,x为中心区域和参考区域的个数,y为颜色深度值。
例如,合并区间为10,连续视频帧内的图像均为RGB图像,即连续视频帧内的图像的通道数为3,中心区域的数量为1,参考区域的数量为4,颜色深度值为255。此时,第一向量是一个10*3*5*255的向量。
对象颜色识别装置通过执行步骤702,可使第一向量携带合并区间各个通道内的第七颜色分布信息,且第一向量的尺寸符合后续处理的要求。
703、依据所述第一向量,得到所述目标对象的颜色。
在一种可能实现的方式中,对象颜色识别装置使用颜色分类器对第一向量进行处理,得到目标对象的颜色,其中,颜色分类器的输入向量的尺寸为v*w*x*y。
本申请实施例中,颜色分类器可以是以下中的一种:颜色分类神经网络、颜色分类支持向量机(support vetor machine,SVM)。
其中,颜色分类神经网络或颜色SVM通过使用已标注数据集作为训练数据,对神经网络进行训练得到。已标注数据为携带标注信息的向量,标注信息包括颜色。
作为一种可选的实施方式,对象颜色识别装置在使用颜色分类器对第一向量进行处理之前,还通过执行以下步骤实现对颜色分类器的训练:
801、获取待训练分类器和训练数据。
本申请实施例中,待训练分类器是以下中的一个:SVM。神经网络。
本申请实施例中,训练数据包括第二向量与第二向量的标注信息,第二向量由一段连续视频帧内训练对象的颜色分布信息根据预设的合并区间个数合并、归一化处理、串联得到,第二向量的标注信息为训练对象的颜色。
例如,训练对象为车辆,预设合并区间的个数为10,样本连续视频帧内的图像均为RGB图像,且各个通道的颜色深度值为255。在样本连续视频帧的图像内,车辆的中心区域的数量为1,车辆的边缘区域的数量为4。第二向量为通过对样本连续视频帧内各个合并区间内的车辆的颜色分布信息进行串联以及归一化处理,得到的一个10*3*5*255的向量。
若在样本连续视频帧内,车辆的颜色为红色,那么第二向量的标注信息为红色。
802、使用所述训练数据训练所述待训练分类器,得到所述颜色分类器。
颜色识别装置使用待训练分类器对训练数据进行处理,得到训练数据的训练分类结果。计算训练数据的训练分类结果与训练数据的标注信息之间的差异,得到待训练分类器的损失。依据待训练分类器的损失调整待训练分类器的参数,得到颜色分类器。
本申请实施例中,对象颜色识别装置通过执行步骤801和步骤802,可训练得到颜色分类器,进而使用颜色分类器识别目标对象的颜色,可提高目标对象的颜色的准确度。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参阅图4,图4为本申请实施例提供的一种对象颜色识别装置的结构示意图,该对象颜色识别装置1包括:获取单元11、第一处理单元12、第二处理单元13,其中:
获取单元11,用于获取待处理视频;
第一处理单元12,用于从所述待处理视频中确定包括目标对象的连续视频帧;
第二处理单元13,用于依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,其中,所述第一颜色分布信息包括颜色空间的各个通道的分布信息。
结合本申请任一实施方式,所述获取单元11,还用于获取所述待处理视频的标注信息,所述标注信息包括所述待处理视频中所述目标对象的至少一个对象标识,所述待处理视频的任一段连续视频帧内出现的同一目标对象的对象标识相同且唯一;
所述第一处理单元12,用于依据所述目标对象的对象标识,从所述待处理视频中确定包括所述目标对象的连续视频帧。
所述获取单元11,用于:
对所述待处理视频的各个视频帧进行目标检测,得到所述各个视频帧中的各个对象;
为所述各个视频帧中的各个对象分别设置对象标识,其中,所述待处理视频的任一段连续视频帧内出现的同一对象的对象标识相同且唯一,所述各个视频帧中的各个对象包括所述目标对象。
结合本申请任一实施方式,所述第二处理单元13,用于:
合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息;
依据所述目标对象的第二颜色分布信息,确定所述目标对象的颜色。
结合本申请任一实施方式,所述第二处理单元13,用于:
获取预设的合并区间个数;
获取所述连续视频帧的长度;
根据所述合并区间个数和所述连续视频帧的长度,确定每个合并区间的长度;
根据所述每个合并区间的长度,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息。
结合本申请任一实施方式,所述目标对象的第一颜色分布信息包括所述目标对象的中心区域的第三颜色分布信息和所述目标对象的边缘区域的第四颜色分布信息;
所述第二处理单元13,用于:
合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息;
合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息;其中,所述目标对象的第二颜色分布信息包括所述第五颜色分布信息和所述第六颜色分布信息。
结合本申请任一实施方式,所述第二处理单元13,用于:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到所述第五颜色分布信息;
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到所述第六颜色分布信息。
结合本申请任一实施方式,所述第二处理单元13,用于:
在各个合并区间的各个颜色空间的通道内,分别对所述第二颜色分布信息作归一化处理,得到第七颜色分布信息;
串联各个合并区间的各个通道内的所述第七颜色分布信息,得到第一向量;
依据所述第一向量,得到所述目标对象的颜色。
结合本申请任一实施方式,所述第二处理单元13,用于:
使用颜色分类器对所述第一向量进行处理,得到所述目标对象的颜色。
结合本申请任一实施方式,所述获取单元11,还用于获取待训练分类器和训练数据,所述训练数据包括第二向量与所述第二向量的标注信息,所述第二向量由一段连续视频帧内训练对象的颜色分布信息根据所述预设的合并区间个数合并、归一化处理、串联得到,所述第二向量的标注信息为所述训练对象的颜色;
所述第二处理单元13,还用于使用所述训练数据训练所述待训练分类器,得到所述颜色分类器。
本申请实施例中,对象颜色识别装置依据待处理视频中的连续视频帧的颜色分布信息确定目标对象的颜色,可减小单张图像所携带的颜色分布信息对确定目标对象的颜色带来的误差,进而提高目标对象的颜色的准确度。
在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
图5为本申请实施例提供的一种对象颜色识别装置的硬件结构示意图。该对象颜色识别装置2包括处理器21,存储器22,输入装置23,输出装置24。该处理器21、存储器22、输入装置23和输出装置24通过连接器相耦合,该连接器包括各类接口、传输线或总线等等,本申请实施例对此不作限定。应当理解,本申请的各个实施例中,耦合是指通过特定方式的相互联系,包括直接相连或者通过其他设备间接相连,例如可以通过各类接口、传输线、总线等相连。
处理器21可以是一个或多个图形处理器(graphics processing unit,GPU),在处理器21是一个GPU的情况下,该GPU可以是单核GPU,也可以是多核GPU。可选的,处理器21可以是多个GPU构成的处理器组,多个处理器之间通过一个或多个总线彼此耦合。可选的,该处理器还可以为其他类型的处理器等等,本申请实施例不作限定。
存储器22可用于存储计算机程序指令,以及用于执行本申请方案的程序代码在内的各类计算机程序代码。可选地,存储器包括但不限于是随机存储记忆体(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasableprogrammable read only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置23用于输入数据和/或信号,以及输出装置24用于输出数据和/或信号。输入装置23和输出装置24可以是独立的器件,也可以是一个整体的器件。
可理解,本申请实施例中,存储器22不仅可用于存储相关指令,还可用于存储相关数据,如该存储器22可用于存储通过输入装置23获取的第一待处理视频,又或者该存储器22还可用于存储通过处理器21得到的目标对象的颜色等等,本申请实施例对于该存储器中具体所存储的数据不作限定。
可以理解的是,图5仅仅示出了一种对象颜色识别装置的简化设计。在实际应用中,对象颜色识别装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、存储器等,而所有可以实现本申请实施例的对象颜色识别装置都在本申请的保护范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员还可以清楚地了解到,本申请各个实施例描述各有侧重,为描述的方便和简洁,相同或类似的部分在不同实施例中可能没有赘述,因此,在某一实施例未描述或未详细描述的部分可以参见其他实施例的记载。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital versatiledisc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。
Claims (13)
1.一种对象颜色识别方法,其特征在于,所述方法包括:
获取待处理视频;
从所述待处理视频中确定包括目标对象的连续视频帧;
依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,其中,所述第一颜色分布信息包括颜色空间的各个通道的分布信息。
2.根据权利要求1所述的方法,其特征在于,在所述获取待处理视频之后,在所述从所述待处理视频中确定包括目标对象的连续视频帧之前,所述方法还包括:
获取所述待处理视频的标注信息,所述标注信息包括所述待处理视频中所述目标对象的至少一个对象标识,所述待处理视频的任一段连续视频帧内出现的同一目标对象的对象标识相同且唯一;
所述从所述待处理视频中确定包括目标对象的连续视频帧,包括:
依据所述目标对象的对象标识,从所述待处理视频中确定包括所述目标对象的连续视频帧。
3.根据权利要求2所述的方法,其特征在于,所述获取所述待处理视频的标注信息,包括:
对所述待处理视频的各个视频帧进行目标检测,得到所述各个视频帧中的各个对象;
为所述各个视频帧中的各个对象分别设置对象标识,其中,所述待处理视频的任一段连续视频帧内出现的同一对象的对象标识相同且唯一,所述各个视频帧中的各个对象包括所述目标对象。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,包括:
合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息;
依据所述目标对象的第二颜色分布信息,确定所述目标对象的颜色。
5.根据权利要求4项所述的方法,其特征在于,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息,包括:
获取预设的合并区间个数;
获取所述连续视频帧的长度;
根据所述合并区间个数和所述连续视频帧的长度,确定每个合并区间的长度;
根据所述每个合并区间的长度,合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息。
6.根据权利要求4或5所述的方法,其特征在于,所述目标对象的第一颜色分布信息包括所述目标对象的中心区域的第三颜色分布信息和所述目标对象的边缘区域的第四颜色分布信息;
所述合并所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,得到所述目标对象的第二颜色分布信息,包括:
合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息;
合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息;其中,所述目标对象的第二颜色分布信息包括所述第五颜色分布信息和所述第六颜色分布信息。
7.根据权利要求6所述的方法,其特征在于,所述合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到第五颜色分布信息,包括:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第三颜色分布信息,得到所述第五颜色分布信息;
所述合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到第六颜色分布信息,包括:
依次对于所述颜色空间的各个通道,合并所述连续视频帧中各帧图像的所述第四颜色分布信息,得到所述第六颜色分布信息。
8.根据权利要求5-7中任一项所述的方法,其特征在于,依据所述目标对象的第二颜色分布信息,确定所述目标对象的颜色,包括:
在各个合并区间的各个颜色空间的通道内,分别对所述第二颜色分布信息作归一化处理,得到第七颜色分布信息;
串联各个合并区间的各个通道内的所述第七颜色分布信息,得到第一向量;
依据所述第一向量,得到所述目标对象的颜色。
9.根据权利要求8所述的方法,其特征在于,所述依据所述第一向量,得到所述目标对象的颜色,包括:
使用颜色分类器对所述第一向量进行处理,得到所述目标对象的颜色。
10.根据权利要求9所述的方法,其特征在于,在使用颜色分类器对所述第一向量进行处理,得到所述目标对象的颜色之前,所述方法还包括:
获取待训练分类器和训练数据,所述训练数据包括第二向量与所述第二向量的标注信息,所述第二向量由一段连续视频帧内训练对象的颜色分布信息根据所述预设的合并区间个数合并、归一化处理、串联得到,所述第二向量的标注信息为所述训练对象的颜色;
使用所述训练数据训练所述待训练分类器,得到所述颜色分类器。
11.一种对象颜色识别装置,其特征在于,所述装置包括:
获取单元,用于获取待处理视频;
第二处理单元,用于从所述待处理视频中确定包括目标对象的连续视频帧;
第三处理单元,用于依据所述连续视频帧中各帧图像的所述目标对象的第一颜色分布信息,确定所述目标对象的颜色,其中,所述第一颜色分布信息包括颜色空间的各个通道的分布信息。
12.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如权利要求1至10中任意一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行权利要求1至10中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210058101.9A CN114387556A (zh) | 2022-01-19 | 2022-01-19 | 对象颜色识别方法、装置、可读存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210058101.9A CN114387556A (zh) | 2022-01-19 | 2022-01-19 | 对象颜色识别方法、装置、可读存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114387556A true CN114387556A (zh) | 2022-04-22 |
Family
ID=81203070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210058101.9A Withdrawn CN114387556A (zh) | 2022-01-19 | 2022-01-19 | 对象颜色识别方法、装置、可读存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114387556A (zh) |
-
2022
- 2022-01-19 CN CN202210058101.9A patent/CN114387556A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110544258B (zh) | 图像分割的方法、装置、电子设备和存储介质 | |
CN110705405B (zh) | 目标标注的方法及装置 | |
US9740967B2 (en) | Method and apparatus of determining air quality | |
CN110543892A (zh) | 一种基于多层随机森林的零部件识别方法 | |
CN112241714B (zh) | 图像中指定区域的识别方法、装置、可读介质和电子设备 | |
CN108596102B (zh) | 基于rgb-d的室内场景物体分割分类器构造方法 | |
CN109116129B (zh) | 终端检测方法、检测设备、系统及存储介质 | |
CN110443212B (zh) | 用于目标检测的正样本获取方法、装置、设备及存储介质 | |
CN112348778B (zh) | 一种物体识别方法、装置、终端设备及存储介质 | |
CN112861661B (zh) | 图像处理方法及装置、电子设备及计算机可读存储介质 | |
CN108960412B (zh) | 图像识别方法、装置及计算机可读存储介质 | |
CN111191582A (zh) | 三维目标检测方法、检测装置、终端设备及计算机可读存储介质 | |
CN115170792B (zh) | 红外图像处理方法、装置及设备、存储介质 | |
CN111738252B (zh) | 图像中的文本行检测方法、装置及计算机系统 | |
CN110866900A (zh) | 水体颜色识别方法及装置 | |
CN112052730B (zh) | 一种3d动态人像识别监控设备及方法 | |
CN112750162A (zh) | 一种目标识别定位方法和装置 | |
CN113222973A (zh) | 图像处理方法及装置、处理器、电子设备及存储介质 | |
CN109919164B (zh) | 用户界面对象的识别方法及装置 | |
CN117557784B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN114266893A (zh) | 烟火隐患识别方法和设备 | |
CN113840135A (zh) | 色偏检测方法、装置、设备及存储介质 | |
CN113269195A (zh) | 读数表图像字符识别方法和装置以及可读存储介质 | |
CN117237637A (zh) | 一种图像信号处理系统及方法 | |
CN117197479A (zh) | 一种应用玉米果穗外表面的图像分析方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220422 |