CN112257638A - 一种图像比对方法、系统、设备及计算机可读存储介质 - Google Patents

一种图像比对方法、系统、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN112257638A
CN112257638A CN202011187862.1A CN202011187862A CN112257638A CN 112257638 A CN112257638 A CN 112257638A CN 202011187862 A CN202011187862 A CN 202011187862A CN 112257638 A CN112257638 A CN 112257638A
Authority
CN
China
Prior art keywords
image
images
sub
recognized
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011187862.1A
Other languages
English (en)
Inventor
夏伟
陈婉婉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Unisinsight Technology Co Ltd
Original Assignee
Chongqing Unisinsight Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Unisinsight Technology Co Ltd filed Critical Chongqing Unisinsight Technology Co Ltd
Priority to CN202011187862.1A priority Critical patent/CN112257638A/zh
Publication of CN112257638A publication Critical patent/CN112257638A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Abstract

本发明提供了一种图像比对方法、系统、设备及计算机可读存储介质,该方法包括获取待识别对象图像集合,待识别对象图像集合包括若干张子图像,提取各子图像的单独特征及各子图像的质量分数,并根据单独特征和质量分数确定待识别对象融合特征,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果;解决了以一张最优时刻的图片在底库图像中确定目标图片的方式,受算法检出优选效果、天气、地形、光线、遮挡等干扰因素影响较大,目标图片确定的准确度不高的问题,降低了算法检出优选效果、天气、地形、光线、遮挡等干扰因素的影响,提升了目标图片确定的准确度。

Description

一种图像比对方法、系统、设备及计算机可读存储介质
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图像比对方法、装置、设备及计算机可读存储介质。
背景技术
当前,以图搜图技术越来越广泛的应用于安防领域。以图搜图,是通过输入图片来检索相似图片的一种技术,为用户提供相关图形图像资料检索的功能。
相关技术中,通常采用以一张最优时刻的图片在底库图像中确定目标图片,但在实际应用中,该方式受算法检出优选效果、天气、地形、光线、遮挡等干扰因素影响较大,目标图片确定的准确度不高。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种图像比对方法、系统、设备及计算机可读存储介质,用于解决以一张最优时刻的图片在底库图像中确定目标图片的方式,受算法检出优选效果、天气、地形、光线、遮挡等干扰因素影响较大,目标图片确定的准确度不高的问题。
为实现上述目的及其他相关目的,本发明提供一种图像比对方法,包括:
获取待识别对象图像集合,所述待识别对象图像集合包括若干张子图像;
提取各所述子图像的单独特征及各所述子图像的质量分数,并根据所述单独特征和所述质量分数确定待识别对象融合特征;
将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
可选的,若所述比对结果包括若干张目标图像,所述显示比对结果包括以下至少之一:
根据各所述目标图像生成目标图像互换格式图像,静态显示所述目标图像互换格式图像中的一个图像互换格式子图像;
根据各所述目标图像生成目标图像互换格式图像,动态显示所述目标图像互换格式图像;
显示各所述目标图像。
可选的,所述待识别对象图像集合的获取方式包括以下至少之一:
通过图像抓拍设备对所述待识别对象进行追踪抓拍,生成若干张所述子图像,根据所述子图像生成所述待识别对象图像集合;
获取多张包括所述待识别对象的图像,生成所述待识别对象图像集合;
获取包括所述待识别对象的视频,基于所述视频生成所述待识别对象图像集合。
可选的,所述待识别对象融合特征计算公式包括:
Figure BDA0002751849910000021
式中,T为待识别对象融合特征,Q为质量分数,T为单独特征,n为待识别对象图像集合中子图像数量;
所述质量分数根据所述子图像的拍摄角度参数、所述子图像的光线参数、所述子图像的清晰度参数、所述子图像的遮挡参数、所述子图像的分辨率参数中至少之一确定。
可选的,所述图像比对方法还包括以下任意之一:
若所述底库包括若干张数据源图像互换格式图像,所述底库图像特征包括所述数据源图像互换格式图像的融合特征,将所述待识别对象融合特征与所述底库图像特征进行比对,生成所述比对结果;
若所述底库包括若干张单张抓拍图像,所述底库图像特征包括所述单张抓拍图像的单独特征,将所述待识别对象融合特征与所述底库图像特征进行比对,生成所述比对结果;
若所述底库包括若干张数据源图像互换格式图像和若干张单张抓拍图像,所述底库图像特征包括所述数据源图像互换格式图像的融合特征和所述单张抓拍图像的单独特征,将所述待识别对象融合特征与所述底库图像特征进行比对,生成所述比对结果。
可选的,所述将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果包括以下任意之一:
将所述待识别对象融合特征与所述底库图像特征进行1:N比对,获取比对相似度超过预设相似度阈值的底库图像作为目标图像,显示所述目标图像;
将所述待识别对象融合特征与所述底库图像特征进行1:N比对,获取比对相似度排名前K个底库图像作为目标图像,显示所述目标图像,所述K大于或等于1。
可选的,还包括:
获取各所述子图像的单独结构化属性及各所述单独结构化属性的置信度,并确定待识别对象图像集合的综合结构化属性,以及待识别对象图像集合的综合结构化属性综合置信度;
存储所述待识别对象图像集合的综合结构化属性、所述待识别对象图像集合的综合结构化属性综合置信度、所述待识别对象融合特征。
本发明还提供了一种图像比对系统,包括:
获取模块,用于获取待识别对象图像集合,所述待识别对象图像集合包括若干张子图像;
确定模块,用于提取各所述子图像的单独特征及各所述子图像的质量分数,并根据所述单独特征和所述质量分数确定待识别对象融合特征;
生成模块,用于将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
本发明还提供了一种设备,包括处理器、存储器和通信总线;
所述通信总线用于将所述处理器和存储器连接;
所述处理器用于执行所述存储器中存储的计算机程序,以实现如上述各实施例中一个或多个所述的图像比对方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于使所述计算机执行如上述各实施例中任一项所述的图像比对方法。
如上所述,本发明提供的一种图像比对方法、系统、设备及计算机可读存储介质,具有以下有益效果:
获取待识别对象图像集合,待识别对象图像集合包括若干张子图像,提取各子图像的单独特征及各子图像的质量分数,并根据单独特征和质量分数确定待识别对象融合特征,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果;解决了以一张最优时刻的图片在底库图像中确定目标图片的方式,受算法检出优选效果、天气、地形、光线、遮挡等干扰因素影响较大,目标图片确定的准确度不高的问题,采用包括若干张子图像的待识别对象图像集合,降低了算法检出优选效果、天气、地形、光线、遮挡等干扰因素的影响,提升了目标图片确定的准确度。
附图说明
图1为实施例一提供的图像比对方法的一种流程示意图。
图2为实施例一提供的非机动车图像比对方法的一种流程示意图。
图3为实施例二提供的图像比对系统的一种结构示意图。
图4为一实施例提供的设备的硬件结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
实施例一
请参阅图1,本发明实施例提供一种图像比对方法,包括:
S101:获取待识别对象图像集合。
需要说明的是,待识别对象图像集合包括若干张子图像。
可选的,各子图像均包括待识别对象,该待识别对象包括但不限于人脸、人体、机动车和非机动车等中至少之一。
可选的,待识别对象图像集合包括图像互换格式动图,如GIF动图。
可选的,图像互换格式动图包括图像互换格式动态图片格式的场景大图,和图像互换格式动态图片格式的目标小图中至少之一。
图像互换格式动图相对于单张图片承载了更多的信息量,且相比信息量冗杂的视频文件格式,图像互换格式动图更加轻量级,因而根据图像互换格式动图来进行图像比对,一方面对于待识别对象的信息能够承载的更多,以便后续关于目标图片的查找更加准确,另一方面,也没有因此增加很多的存储、识别困难,图像比对效果更佳。
在一些实施例中,待识别对象图像集合的获取方式包括以下至少之一:
通过图像抓拍设备对待识别对象进行追踪抓拍,生成若干张子图像,根据子图像生成待识别对象图像集合;
获取多张包括待识别对象的图像,生成待识别对象图像集合;
获取包括待识别对象的视频,基于视频生成待识别对象图像集合。
可选的,若待识别对象当前处于可被拍摄状态,则可以通过图像抓拍设备对该待识别对象进行跟踪抓拍,获取若干张包括待识别对象的图像作为子图像,根据各子图像生成待识别对象图像集合。
可选的,若待识别对象图像集合包括图像互换格式动图,待识别对象包括非机动车,此时图像互换格式动图每一帧图片以下简称为图像互换格式动图成员,图像互换格式动图共n帧,图像互换格式动图包括目标非机动车从进入视频画面到离开画面过程中检测追踪的n帧图片,图像互换格式动图成员抓拍策略为尽可能抓拍目标不同角度的抓拍照。图像互换格式动图成员都包含目标非机动车。可选的,可以基于目标非机动车的唯一标识nonvehicle ID,来确认图像互换格式动图成员所包括的非机动车均是目标非机动车。
可选的,图像抓拍设备对待识别对象进行跟踪抓拍包括:
根据预设抓拍策略制定检测模型;
图像抓怕设备根据检测模型对待识别对象进行跟踪检测,并进行抓拍。
例如,图像互换格式动图成员抓拍策略为尽可能抓拍待识别对象的不同角度的抓拍照,此时,根据该策略训练检测模型。
可选的,通过对包括待识别对象的视频流进行目标跟踪,生成图像互换格式抓拍图,将该图像互换格式抓拍图作为待识别对象图像集合进行后续的图像比对,可以增加图像比对样本的信息量,解决单张图片进行图像比对带来的识别效果差的问题,提升识别效果。
可选的,获取多张包括待识别对象的图像,生成待识别对象图像集合的一种具体的实现方式包括:
确定多张包括待识别对象的图像,这些图像的角度、时间、监控场景等中存在至少一处不同,基于这些图像生成待识别对象图像集合。
可选的,也可以将这些包括待识别对象的图像合成图像互换格式合成图,作为待识别对象集合。
可选的,多张包括待识别对象的图像中至少一部分图像可以是由人工筛选确定的。
可选的,包括待识别对象的视频可以是在线视频或者录像文件等,在此不做限定。
可选的,获取包括待识别对象的视频,基于视频生成待识别对象图像集合的一种具体的实现方式可以是,提取视频中包括待识别对象的图片,从上述图片中确定若干张生成待识别对象图像集合。
S102:提取各子图像的单独特征及各子图像的质量分数,并根据单独特征和质量分数确定待识别对象融合特征。
需要说明的是,子图像的单独特征的提取方式可以采用本领域的现有手段得到,例如,采用机器学习的方式提取子图像的单独特征,机器学习可以采用卷积神经网络对子图像进行单独特征的提取。单独特征的提取方式还可以是本领域技术人员能够实现的其他方法,在此不再赘述。
在一些实施例中,待识别对象融合特征计算公式包括:
Figure BDA0002751849910000061
式中,T为待识别对象融合特征,Q为质量分数,T为单独特征,n为待识别对象图像集合中子图像数量;
所述质量分数根据子图像的拍摄角度参数、所述子图像的光线参数、所述子图像的清晰度参数、所述子图像的遮挡参数、所述子图像的分辨率参数中至少之一确定。
需要说明的是,拍摄角度参数、光线参数、清晰度参数、遮挡参数、分辨率参数可以通过现有的技术进行确定,在此不再赘述。拍摄角度参数、光线参数、清晰度参数、遮挡参数、分辨率参数也可以通过本领域技术人员预先设定的规则进行确定。
可选的,待识别对象融合特征的融合方式可以采用add方式或concat方式,上述待识别对象融合特征计算公式是基于add方式确定的,本领域技术人员也可以基于concat方式确定其他的待识别对象融合特征计算公式,在此不做限定。
其中,add方式将两个特征向量组合成复向量,对于两个输入特征x和y,输出特征z=x+iy,其中i是虚数单位。即描述图像本身的维数(特征数)没有增加,而每一特征下的信息增加。concat方式将两个特征进行连接,两个输入特征x和y的维数若为p和q,输出特征z的维数为p+q,即描述图像本身的维数(特征数)增加了,而每一特征下的信息没有增加。
可选的,单独特征包括基于待识别对象图像集合中子图像的特征向量。
S103:将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
在一些实施例中,图像比对方法还包括以下任意之一:
若底库包括若干张数据源图像互换格式图像,底库图像特征包括数据源图像互换格式图像的融合特征,将待识别对象融合特征与底库图像特征进行比对,生成比对结果;
若底库包括若干张单张抓拍图像,底库图像特征包括单张抓拍图像的单独特征,将待识别对象融合特征与底库图像特征进行比对,生成比对结果;
若底库包括若干张数据源图像互换格式图像和若干张单张抓拍图像,底库图像特征包括数据源图像互换格式图像的融合特征和单张抓拍图像的单独特征,将待识别对象融合特征与底库图像特征进行比对,生成比对结果。
可选的,底库包括若干张数据源图像互换格式图像,该数据源图像互换格式图像为图像互换格式,通过预先确定好底库中各数据源图像互换格式图像的融合特征,将数据源图像互换格式图像的融合特征与待识别对象融合特征进行比对,生成比对结果。由于待识别对象融合特征是基于多张图像确定的,准确性更佳,另一方面,数据源图像互换格式图像的融合特征也是基于多个图像确定的,因此,底库中的数据源图像互换格式图像的融合特征也更加准确,故,基于该方法确定的比对结果准确性大大提升。
可选的,对于底库中的图像的格式在此不做限定,底库中的图像格式可以是单张图像、图像互换格式图像、视频等中至少之一。
可选的,若底库中的图像为数据源图像互换格式图像,也即,底库中的图像为图像互换格式,此时可以预先确定各个数据源图像互换格式图像的融合特征,以供后续比对时可以直接使用,提升比对效率。
在一些实施例中,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果包括以下任意之一:
将待识别对象融合特征与底库图像特征进行1:N比对,获取比对相似度超过预设相似度阈值的底库图像作为目标图像,显示目标图像;
将待识别对象融合特征与底库图像特征进行1:N比对,获取比对相似度排名前K个底库图像作为目标图像,显示目标图像,K大于或等于1。
可选的,将待识别对象融合特征与底库图像特征进行1:N比对可以得到底库中的各个底库图像的相似度,基于该相似度确定底库中的某一底库图像是否是目标图像。
可选的,获取比对相似度排名前K个底库图像的方式可以是基于确定得到的底库中的各个底库图像的相似度,对各个底库图像进行从相似度高到相似度低进行排名,获取排名在前K的底库图像作为目标图像。
可选的,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果还包括:
将待识别对象融合特征与底库图像特征进行1:N比对,获取比对相似度超过预设相似度阈值,且相似度排名前K个的底库图像作为目标图像,显示目标图像。
也即,有时可能存在多个底库图像的相似度都相同,此时通过相似度阈值与排名两个维度可以确定到合理数量的目标图像。
在一些实施例中,若比对结果包括若干张目标图像,显示比对结果包括以下至少之一:
根据各目标图像生成目标图像互换格式图像,静态显示目标图像互换格式图像中的一个图像互换格式子图像;
根据各目标图像生成目标图像互换格式图像,动态显示目标图像互换格式图像;
显示各目标图像。
可选的,根据底库图像的格式不同,目标图像可能是单张图像、图像互换格式图像等中至少之一,此时,显示比对结果可以是以下至少之一:
将单张图像和图像互换格式的目标图像转化为一个图像互换格式图像进行显示;
将各个图像互换格式的目标图像转化为一个图像互换格式图像,将单张图像转化为另一个图像互换格式图像,将上述两个图像互换格式图像分别显示;
将各个单张图像转化为一个图像互换格式图像,与图像互换格式的目标图像分别直接显示。
可选的,本实施例中各个图像互换格式的图像的播放顺序可以根据其中的各个子图像的拍摄时间确定,例如拍摄时间较早的图像较早播放,拍摄较晚的图像较晚播放。
可选的,本实施例中各个图像互换格式的图像的播放顺序可以根据其中的各个子图像的拍摄时间确定,例如拍摄时间较晚的图像较早播放,拍摄较早的图像较晚播放。
可选的,本实施例中各个图像互换格式的图像的播放顺序可以根据其中的各个子图像的拍摄时间和拍摄地点确定,例如同一拍摄地点中,拍摄时间较早的图像较早播放,拍摄较晚的图像较晚播放。各个拍摄地点的播放顺序可以由本领域技术人员预先设定,在此不再赘述。
可选的,若比对结果为图像互换格式,此时根据比对结果中各个图像互换格式图像中子图像的拍摄时间、拍摄地点确定播放顺序,可以将比对结果更加直观立体的显示出来,例如,当待识别对象为非机动车时,比对结果包括在近一个月内多个路口拍摄的图像,通过将这些图像基于拍摄时间和拍摄地点排序,通过图像互换格式的图像显示比对结果,可以直观的确定该非机动车的行驶路径、行驶规律。
可选的,静态显示目标图像互换格式图像中的一个图像互换格式子图像中,该图像互换格式子图像为目标图像互换格式图像中各子图像中质量分数最高的图像。其中,质量分数的确定方式可以参照待识别对象融合特征计算公式中的质量分数的确定方式,该质量分数可以根据目标图像的拍摄角度参数、目标图像的光线参数、目标图像的清晰度参数、目标图像的遮挡参数、目标图像的分辨率参数中至少之一确定。
在一些实施例中,图像比对方法还包括:
获取各子图像的单独结构化属性及、单独结构化属性的置信度,并确定待识别对象图像集合的综合结构化属性,以及待识别对象图像集合的综合结构化属性综合置信度;
存储待识别对象图像集合的综合结构化属性、待识别对象图像集合的综合结构化属性综合置信度、待识别对象融合特征。
可选的,单独结构化属性根据待识别对象来对应设置,若待识别对象为人时,单独结构化属性包括但不限于性别,年龄,服饰特点等,其中服饰特点包括但不限于如是否佩戴帽子、是否戴口罩等。
可选的,单独结构化属性的置信度可以根据本领域的相关技术确定,在此不做限定。
可选的,待识别对象图像集合的综合结构化属性可以由各个单独结构化属性按照一定规则如平均、加权平均等方式计算得到。
可选的,待识别对象图像集合的综合结构化属性综合置信度可以由各个单独结构化属性的置信度按照一定规则如平均、加权平均等方式计算得到。
可选的,将待识别对象图像集合的综合结构化属性、待识别对象图像集合的综合结构化属性综合置信度存储于数据库中,可以供后续进行结构化属性筛选显示。
可选的,还包括,将单独特征、待识别对象融合特征中至少之一存储在显存、内存、硬盘至少之一中,供后续以图搜图使用。
可选的,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果之前,还包括:
根据待识别对象图像集合的综合结构化属性、待识别对象图像集合的综合结构化属性综合置信度对底库中的底库图像进行筛选,得到目标底库图像集合。
此时,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果包括:
将待识别对象融合特征与目标底库图像中的底库图像特征进行比对,生成并显示比对结果。
本发明实施例提供了一种图像比对方法,包括获取待识别对象图像集合,待识别对象图像集合包括若干张子图像,提取各子图像的单独特征及各子图像的质量分数,并根据单独特征和质量分数确定待识别对象融合特征,将待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果;解决以一张最优时刻的图片在底库图像中确定目标图片的方式,受算法检出优选效果、天气、地形、光线、遮挡等干扰因素影响较大,目标图片确定的准确度不高的问题,降低了算法检出优选效果、天气、地形、光线、遮挡等干扰因素的影响,提升了目标图片确定的准确度。
可选的,通过根据比对结果生成目标图像互换格式图像,静态或动态显示该目标图像互换格式图像,使得比对结果更加生动,信息显示更加全面。
可选的,底库中的底库图像为图像互换格式,此时,根据待识别对象融合特征与底库中若干个图像互换格式图像的融合特征进行比对,比对结果更加准确。
可选的,待识别对象图像集合采取图像互换格式动图模式时,会给出该待识别对象连续的行动轨迹,将待识别对象的多个角度均关联到该待识别对象,并且追踪该待识别对象进入画面时的来源直至离开画面时的去向,给客户带来有效的的实战价值;另一方面,传统单张图片形式的属性识别停留在某一时刻的状态,而采用图像互换格式动图形式时,可以在待识别对象移动的过程中,不断补充、完善该待识别对象的各个结构化属性,大大提高结构化属性识别准确率。并且通过在不同时间、不同空间对图像互换格式动图成员提取特征值,可以提高以图搜图的rank-n指标及mAP(平均精度均值)指标等。
可选的,本实施提供的图像比对方法可以应用于安防行业,识别对象图像集合采取图像互换格式动图模式时,将图像互换格式动图引入安防行业,有效提高属性识别准确率及以图搜图指标,给实战能力带来质的飞跃,有效解决客户实际问题。
下面,以待识别对象包括非机动车为例,通过一个具体的实施例,对本发明实施例提供的图像比对方法进行进一步示例性说明。参见图2,一种非机动车图像比对方法,包括:
S201:获取GIF非机动车动图。
可选的,该GIF非机动车动图包括若干张子图像。
GIF相对于单张图片承载了更多的信息量,且相比信息量冗杂的视频文件格式,GIF十分轻量级。
GIF动图包括GIF动态图片格式的场景大图或GIF动态图片格式的目标小图。
可选的,该GIF动图可以通过以下方式中至少之一获取:
通过对视频流中的目标非机动车跟踪检测,合成GIF动图抓拍照,生成GIF非机动车动图;
通过手动上传多张图片,图片格式不限,对上述多张图片融合生成GIF动态合成图,生成GIF非机动车动图;
通过GIF型抓拍摄像机,根据抓拍得到的GIF动态抓拍照生成GIF非机动车动图。
可选的,GIF动图包括目标非机动车从进入视频画面到离开画面过程中检测追踪的n帧图片,GIF动图成员抓拍策略为尽可能抓拍目标不同角度的抓拍照,可以按尽可能抓拍目标不同角度的抓拍照策略训练检测模型以实现对GIF动图成员(子图像)的抓拍。GIF动图成员都包含目标非机动车,目标非机动车有唯一标识nonvehicleID,可以确定GIF动图成员的目标非机动车的唯一标识都相同。
S202:识别GIF非机动车动图,确定非机动车融合特征。
可选的,可以通过对GIF非机动车动图中的每一子图像分别提取单独特征及各子图像的质量分数,根据单独特征和质量分数确定非机动车融合特征。
可选的,以下提供两种示例性的融合特征的确定方式:
1.add:将两个特征向量组合成复向量,对于两个输入特征x和y,输出特征z=x+iy,其中i是虚数单位。即描述图像本身的维数(特征数)没有增加,而每一特征下的信息增加了;
2.concat:将两个特征进行连接,两个输入特征x和y的维数若为p和q,输出特征z的维数为p+q,即描述图像本身的维数(特征数)增加了,而每一特征下的信息没有增加。
以下以上述第一种(add方式)融合特征的确方式提供一种融合特征参考公式:
Figure BDA0002751849910000111
其中T为融合特征,Q为质量分数,T为GIF动图成员的单独特征,n为GIF动图成员数。质量分数Q的参数包含:角度参数,光线参数,清晰度参数,遮挡参数,分辨率参数。
S203:将非机动车融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
其中,底库中的底库图像可以是单张图像或GIF格式的数据源GIF图像。
若待识别对象图像集合包括GIF动图,GIF动图作为探测集,若底库图像为单张图像,将非机动车融合特征与单张图像的特征进行1:N比对,将比对相似度最高的K个目标(Top K)返回,生成比对结果;若底库图像为数据源GIF图像,GIF动图作为探测集,将非机动车融合特征与数据源GIF图像的融合特征进行1:N比对,将比对相似度最高的K个目标(TopK)返回,生成比对结果。其中数据源GIF图像的融合特征的获取方式与非机动车融合特征相似,通过对数据源GIF图像每一帧子图像提取数据源单独特征及数据源质量分数,根据数据源单独特征及数据源质量分数确定融合特征。
由于探测目标与底库目标有基于不同空间、不同时间的多个单独特征相融合的融合特征,因此以图搜图准确率将大大提高。以下为非机动车GIF动图以图搜图和传统非机动车以图搜图实验结果对比:
表1
Figure BDA0002751849910000121
可以发现通过GIF动图以图搜图,在夜间场景下的mAP提升约12.67%,rank1提升约14.15%;白天搜图指标有略微提升。
可选的,比对结果包括若干张目标图像,根据各目标图像生成目标GIF图像。此时,显示比对结果包括以下任意之一:
将目标GIF图像动态显示;
静态显示目标GIF图像中的一个GIF子图像。
可选的,静态显示的GIF子图像可以是目标GIF图像的各子图像中质量分数最高的子图像。
S204:获取GIF非机动车动图的综合结构化属性、GIF非机动车动图的综合结构化属性综合置信度。
可选的,GIF非机动车动图的综合结构化属性可以通过识别GIF非机动车动图,分别获取GIF非机动车动图中各个子图像的结构化属性,根据预设规则、各个子图像的结构化属性来确定。
可选的,GIF非机动车动图的综合结构化属性综合置信度可以通过识别GIF非机动车动图,分别获取GIF非机动车动图中各个子图像的结构化属性置信度,根据预设规则、各个子图像的结构化属性置信度来确定。
可选的,结构化属性包括但不限于非机动车的类型(电动车、自行车)、非机动车的颜色、非机动车的车轮数量等。本领域技术人员也可以根据需要来设定需要获取的结构化属性。
可选的,获取GIF非机动车动图中各个子图像的结构化属性置信度、GIF非机动车动图中各个子图像的结构化属性的方式可以采用现有的相关技术(如图像识别等)来实现,在此不做限定。
需要说明的是,步骤S204与步骤S202、步骤S203的执行顺序在此不做限定。
S205:存储GIF非机动车动图的综合结构化属性、GIF非机动车动图的综合结构化属性综合置信度、非机动车融合特征、非机动车动图中的每一子图像的单独特征中至少之一。
可选的,还包括将目标GIF图像存储在云存储服务器中供后续应用显示。
可选的,本实施例中的云存储服务器,针对GIF动图读写速度进行性能优化,支持高效存储、检索GIF格式图片。
可选的,GIF非机动车动图的综合结构化属性、GIF非机动车动图的综合结构化属性综合置信度存储于数据库中,供进行结构化属性筛选显示。
非机动车融合特征、非机动车动图中的每一子图像的单独特征根据使用场景保存在显存、内存、硬盘至少之一中,可以作为底库图像供后续以图搜图使用。其中,非机动车动图中的每一子图像的单独特征是否保存本领域技术人员也可根据实际场景决定。
实施例二
请参阅图3,本发明实施例提供一种图像比对系统300,包括:
获取模块301,用于获取待识别对象图像集合,所述待识别对象图像集合包括若干张子图像;
确定模块302,用于提取各所述子图像的单独特征及各所述子图像的质量分数,并根据所述单独特征和所述质量分数确定待识别对象融合特征;
生成模块303,用于将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
在本实施例中,该图像比对系统执行上述任一实施例所述的图像比对方法,具体功能和技术效果参照上述实施例即可,此处不再赘述。
请参阅图4,本申请实施例还提供了一种设备400,该设备400包括处理器401、存储器402和通信总线403;
所述通信总线403用于将所述处理器401和存储器402连接;
所述处理器401用于执行所述存储器402中存储的计算机程序,以实现如上述任一实施例所述的图像比对方法。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例的实施例一所包含步骤的指令(instructions)。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序用于使所述计算机执行如实施例一中一个或多个所述的图像比对方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种图像比对方法,其特征在于,包括:
获取待识别对象图像集合,所述待识别对象图像集合包括若干张子图像;
提取各所述子图像的单独特征及各所述子图像的质量分数,并根据所述单独特征和所述质量分数确定待识别对象融合特征;
将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
2.根据权利要求1所述的图像比对方法,其特征在于,若所述比对结果包括若干张目标图像,所述显示比对结果包括以下至少之一:
根据各所述目标图像生成目标图像互换格式图像,静态显示所述目标图像互换格式图像中的一个图像互换格式子图像;
根据各所述目标图像生成目标图像互换格式图像,动态显示所述目标图像互换格式图像;
显示各所述目标图像。
3.根据权利要求1所述的图像比对方法,其特征在于,所述待识别对象图像集合的获取方式包括以下至少之一:
通过图像抓拍设备对所述待识别对象进行追踪抓拍,生成若干张所述子图像,根据所述子图像生成所述待识别对象图像集合;
获取多张包括所述待识别对象的图像,生成所述待识别对象图像集合;
获取包括所述待识别对象的视频,基于所述视频生成所述待识别对象图像集合。
4.根据权利要求1所述的图像比对方法,其特征在于,所述待识别对象融合特征计算公式包括:
Figure FDA0002751849900000011
式中,T为待识别对象融合特征,Q为质量分数,T为单独特征,n为待识别对象图像集合中子图像数量;
所述质量分数根据所述子图像的拍摄角度参数、所述子图像的光线参数、所述子图像的清晰度参数、所述子图像的遮挡参数、所述子图像的分辨率参数中至少之一确定。
5.根据权利要求1所述的图像比对方法,其特征在于,所述图像比对方法还包括以下任意之一:
若所述底库包括若干张数据源图像互换格式图像,所述底库图像特征包括所述数据源图像互换格式图像的融合特征,将所述待识别对象融合特征与所述底库图像特征进行比对,生成所述比对结果;
若所述底库包括若干张单张抓拍图像,所述底库图像特征包括所述单张抓拍图像的单独特征,将所述待识别对象融合特征与所述底库图像特征进行比对,生成所述比对结果;
若所述底库包括若干张数据源图像互换格式图像和若干张单张抓拍图像,所述底库图像特征包括所述数据源图像互换格式图像的融合特征和所述单张抓拍图像的单独特征,将所述待识别对象融合特征与所述底库图像特征进行比对,生成所述比对结果。
6.根据权利要求1-5任一项所述的图像比对方法,其特征在于,所述将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果包括以下任意之一:
将所述待识别对象融合特征与所述底库图像特征进行1:N比对,获取比对相似度超过预设相似度阈值的底库图像作为目标图像,显示所述目标图像;
将所述待识别对象融合特征与所述底库图像特征进行1:N比对,获取比对相似度排名前K个底库图像作为目标图像,显示所述目标图像,所述K大于或等于1。
7.根据权利要求1-5任一项所述的图像比对方法,其特征在于,还包括:
获取各所述子图像的单独结构化属性及各所述单独结构化属性的置信度,并确定待识别对象图像集合的综合结构化属性,以及待识别对象图像集合的综合结构化属性综合置信度;
存储所述待识别对象图像集合的综合结构化属性、所述待识别对象图像集合的综合结构化属性综合置信度、所述待识别对象融合特征。
8.一种图像比对系统,其特征在于,包括:
获取模块,用于获取待识别对象图像集合,所述待识别对象图像集合包括若干张子图像;
确定模块,用于提取各所述子图像的单独特征及各所述子图像的质量分数,并根据所述单独特征和所述质量分数确定待识别对象融合特征;
生成模块,用于将所述待识别对象融合特征与底库中的底库图像特征进行比对,生成并显示比对结果。
9.一种设备,其特征在于,包括处理器、存储器和通信总线;
所述通信总线用于将所述处理器和存储器连接;
所述处理器用于执行所述存储器中存储的计算机程序,以实现如权利要求1-7中一个或多个所述的图像比对方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序用于使所述计算机执行如权利要求1-7中任一项所述的图像比对方法。
CN202011187862.1A 2020-10-30 2020-10-30 一种图像比对方法、系统、设备及计算机可读存储介质 Pending CN112257638A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011187862.1A CN112257638A (zh) 2020-10-30 2020-10-30 一种图像比对方法、系统、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011187862.1A CN112257638A (zh) 2020-10-30 2020-10-30 一种图像比对方法、系统、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112257638A true CN112257638A (zh) 2021-01-22

Family

ID=74267784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011187862.1A Pending CN112257638A (zh) 2020-10-30 2020-10-30 一种图像比对方法、系统、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112257638A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191286A (zh) * 2021-05-08 2021-07-30 重庆紫光华山智安科技有限公司 图像数据质量检测调优方法、系统、设备及介质
CN113761241A (zh) * 2021-07-23 2021-12-07 北京旷视科技有限公司 图像搜索方法及装置、计算机可读存储介质及电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102055932A (zh) * 2009-10-30 2011-05-11 深圳Tcl新技术有限公司 电视节目搜索的方法及采用该方法的电视机
CN107925738A (zh) * 2015-08-12 2018-04-17 三星电子株式会社 用于提供图像的方法、电子设备和存储介质
CN108876758A (zh) * 2017-08-15 2018-11-23 北京旷视科技有限公司 人脸识别方法、装置及系统
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器
CN109740503A (zh) * 2018-12-28 2019-05-10 北京旷视科技有限公司 人脸认证方法、图像底库录入方法、装置及处理设备
CN109766925A (zh) * 2018-12-20 2019-05-17 深圳云天励飞技术有限公司 特征融合方法、装置、电子设备及存储介质
CN110110113A (zh) * 2019-05-20 2019-08-09 重庆紫光华山智安科技有限公司 图像搜索方法、系统及电子装置
CN110399799A (zh) * 2019-06-26 2019-11-01 北京迈格威科技有限公司 图像识别和神经网络模型的训练方法、装置和系统
CN110442806A (zh) * 2019-08-05 2019-11-12 百度在线网络技术(北京)有限公司 用于识别图像的方法和装置
CN110543582A (zh) * 2019-08-05 2019-12-06 百度在线网络技术(北京)有限公司 基于图像的查询方法和装置
CN111832494A (zh) * 2020-07-17 2020-10-27 中国联合网络通信集团有限公司 信息存储方法及设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102055932A (zh) * 2009-10-30 2011-05-11 深圳Tcl新技术有限公司 电视节目搜索的方法及采用该方法的电视机
CN107925738A (zh) * 2015-08-12 2018-04-17 三星电子株式会社 用于提供图像的方法、电子设备和存储介质
CN108876758A (zh) * 2017-08-15 2018-11-23 北京旷视科技有限公司 人脸识别方法、装置及系统
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器
CN109766925A (zh) * 2018-12-20 2019-05-17 深圳云天励飞技术有限公司 特征融合方法、装置、电子设备及存储介质
CN109740503A (zh) * 2018-12-28 2019-05-10 北京旷视科技有限公司 人脸认证方法、图像底库录入方法、装置及处理设备
CN110110113A (zh) * 2019-05-20 2019-08-09 重庆紫光华山智安科技有限公司 图像搜索方法、系统及电子装置
CN110399799A (zh) * 2019-06-26 2019-11-01 北京迈格威科技有限公司 图像识别和神经网络模型的训练方法、装置和系统
CN110442806A (zh) * 2019-08-05 2019-11-12 百度在线网络技术(北京)有限公司 用于识别图像的方法和装置
CN110543582A (zh) * 2019-08-05 2019-12-06 百度在线网络技术(北京)有限公司 基于图像的查询方法和装置
CN111832494A (zh) * 2020-07-17 2020-10-27 中国联合网络通信集团有限公司 信息存储方法及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191286A (zh) * 2021-05-08 2021-07-30 重庆紫光华山智安科技有限公司 图像数据质量检测调优方法、系统、设备及介质
CN113761241A (zh) * 2021-07-23 2021-12-07 北京旷视科技有限公司 图像搜索方法及装置、计算机可读存储介质及电子设备

Similar Documents

Publication Publication Date Title
US10719759B2 (en) System for building a map and subsequent localization
CN109272530B (zh) 面向空基监视场景的目标跟踪方法与装置
US8442307B1 (en) Appearance augmented 3-D point clouds for trajectory and camera localization
WO2004095374A1 (ja) 映像オブジェクト認識装置および認識方法、映像アノテーション付与装置および付与方法ならびにプログラム
CN112132197A (zh) 模型训练、图像处理方法、装置、计算机设备和存储介质
CN108388649B (zh) 处理音视频的方法、系统、设备及存储介质
CN111323024B (zh) 定位方法及装置、设备、存储介质
CN109902681B (zh) 用户群体关系确定方法、装置、设备及存储介质
CN112257638A (zh) 一种图像比对方法、系统、设备及计算机可读存储介质
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
CN112464775A (zh) 一种基于多分支网络的视频目标重识别方法
CN112215964A (zh) 基于ar的场景导览方法和设备
CN112861808B (zh) 动态手势识别方法、装置、计算机设备及可读存储介质
WO2022126529A1 (zh) 定位的方法、设备、无人机和存储介质
Zhang et al. Dynamic multi-video summarization of sensor-rich videos in geo-space
CN116563553B (zh) 一种基于深度学习的无人机图像分割方法和系统
CN112396831A (zh) 一种交通标识的三维信息生成方法和装置
Zhang et al. An automatic three-dimensional scene reconstruction system using crowdsourced Geo-tagged videos
Wang et al. 3D object detection algorithm for panoramic images with multi-scale convolutional neural network
CN112270748A (zh) 基于图像的三维重建方法及装置
Khan et al. A review of benchmark datasets and training loss functions in neural depth estimation
CN112257666B (zh) 目标图像内容的聚合方法、装置、设备及可读存储介质
Choudhary et al. Real time video summarization on mobile platform
CN110826432B (zh) 一种基于航空图片的输电线识别方法
Kundu et al. Vrt-net: Real-time scene parsing via variable resolution transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122

RJ01 Rejection of invention patent application after publication