CN113723272A - 基于多画面实时拼接的物体检测方法、系统、设备和介质 - Google Patents
基于多画面实时拼接的物体检测方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN113723272A CN113723272A CN202110989391.4A CN202110989391A CN113723272A CN 113723272 A CN113723272 A CN 113723272A CN 202110989391 A CN202110989391 A CN 202110989391A CN 113723272 A CN113723272 A CN 113723272A
- Authority
- CN
- China
- Prior art keywords
- image
- object detection
- images
- detection method
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 86
- 238000012544 monitoring process Methods 0.000 claims abstract description 32
- 230000009466 transformation Effects 0.000 claims abstract description 26
- 230000004927 fusion Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000005286 illumination Methods 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 238000013135 deep learning Methods 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000002146 bilateral effect Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 5
- 239000003086 colorant Substances 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005577 local transmission Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种基于多画面实时拼接的物体检测方法,包括:获取用于图像拼接的多幅原始图像,多幅原始图像分别由多个监控摄像头同步采集;根据预先生成的图像变换矩阵分别对多幅原始图像进行图像变换,得到多幅变换图像,图像变换矩阵基于所述多个监控摄像头同步采集的历史图像集生成;采用预设的光照补偿算法对多幅变换图像进行光照补偿;对光照补偿后的多幅图像进行图像拼接和融合,得到待检测图像;将待检测图像输入到预先生成的物体检测模型中进行物体检测,得到物体检测结果;其中,物体检测模型为基于深度学习算法建立、并预先训练的端到端小目标检测模型。本方法能有效提高物体检测的精度和速度。
Description
技术领域
本申请属于图像处理技术领域,具体涉及一种物体检测方法。
背景技术
随着模式识别技术、视频分析处理技术的发展,人们对日常活动场合的安全性的需求日益强烈,智能视频监控系统已广泛应用于安防领域,为人们的财产、生命安全提供保障。
基于视频序列的物体检测与识别是智能视频监控系统中的重要组成部分,并被应用于商场、停车场、银行、展览会、火车站等重要场所。通过物体检测识别其所处的状态来分析监控场景中是否有异常事件放生。
目前智能视频监控系统对物体检测时,对光照变换、遮挡问题、摄像头转移等干扰因素影响,容易出现误检和漏检,从而导致检测精度和速度较低。
发明内容
(一)要解决的技术问题
鉴于现有技术的上述缺点、不足,本申请提供一种基于多画面实时拼接的物体检测方法、系统、设备和存储介质。
(二)技术方案
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请实施例提供一种基于多画面实时拼接的物体检测方法,该方法包括:
S10、获取用于图像拼接的多幅原始图像,所述多幅原始图像分别由多个监控摄像头同步采集;
S20、根据预先生成的图像变换矩阵分别对所述多幅原始图像进行图像变换,得到多幅变换图像,所述图像变换矩阵基于所述多个监控摄像头同步采集的历史图像集生成;
S30、采用预设的光照补偿算法对所述多幅变换图像进行光照补偿;
S40、对光照补偿后的多幅图像进行图像拼接和融合,得到待检测图像;
S50、将所述待检测图像输入到预先生成的物体检测模型中进行物体检测,得到物体检测结果;其中,所述物体检测模型为基于深度学习算法建立、并预先训练的端到端小目标检测模型。
可选地,在S10之后、S20之前还包括对多幅原始图像进行预处理。
可选地,对多幅原始图像进行预处理包括:
利用直方图均衡化算法对所述原始图像进行处理,以减少因光线变化而产生的图像模糊现象;
采用双边滤波的方式对处理后的原始图像进行滤波处理,以抑制图像中的噪声。
可选地,在S10之前还包括生成图像变换矩阵,生成图像变换矩阵的步骤包括:
S01、提取所述历史图像集中每个历史图像的尺度不变特征变换(Scale-invariant feature transform,SIFT)特征;
S02、通过最近邻特征匹配算法进行特征匹配,得到特征匹配点;
S03、基于所述特征匹配点对各历史图像进行相机参数估计,生成图像变换矩阵。
可选地,预设的光照补偿算法为灰度世界色彩均衡算法,S30包括:
S31、针对每一幅变换图像,分别计算变换图像的三个颜色分量的平均值avgR、avgG、avgB,并令变换图像的平均灰度值为:
avgGray=(avgR+avgG+avgB)/3
S32、计算三个颜色分量的增益系数:
ar=avgGray/avgR
ag=avgGray/avgG
ab=avgGray/avgB
S33、对于变换图像中每个像素c,通过以下公式计算其红色R、绿色G、蓝色B调整分量c(R′)、c(G′)、c(B′):
c(R′)=c(R)*ar
c(G′)=c(G)*ar
c(B′)=c(B)*ar
可选地,S40包括:采用加权平均法对图像的重叠区域的原始颜色进行加权求平均值,使用加权平均后的数值对拼接后图像的重叠区域的像素点赋值。
可选地,所述端到端小目标检测模型为基于特征金字塔网络(Feature PyramidNetwork,FPN)有效融合因子的小目标检测模型,该模型的构建和训练步骤包括:
S51,构建骨干网络,并对其进行预训练;
S52,提取预训练权重用作目标数据集训练的网络初始化权值,在目标数据集进行训练,获得训练后的小目标检测模型;在训练过程中,采用骨干网络对图像进行多尺度特征提取,获得多个尺度的特征图;将FPN中相邻特征层的融合比例设定为融合因子α,基于融合因子确定相邻特征图之间的融合比例,将各尺度的特征图进行融合。
第二方面,本申请实施例提供一种智能视频监控系统,包括视频采集子系统、智能视频分析子系统和控制中心子系统,所述智能视频分析子系统采用如上第一方面任一项所述的基于多画面实时拼接的物体检测方法生成物体检测结果发送至控制中心子系统。
第三方面,本申请实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上第一方面任一项所述的基于多画面实时拼接的物体检测方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被所述处理器执行时实现如上第一方面任一项所述的基于多画面实时拼接的物体检测方法的步骤。
(三)有益效果
本申请的有益效果是:本申请提出了一种基于多画面实时拼接的物体检测方法,包括:获取用于图像拼接的多幅原始图像,多幅原始图像分别由多个监控摄像头同步采集;根据预先生成的图像变换矩阵分别对多幅原始图像进行图像变换,得到多幅变换图像,图像变换矩阵基于多个监控摄像头同步采集的历史图像集生成;采用预设的光照补偿算法对多幅变换图像进行光照补偿;对光照补偿后的多幅图像进行图像融合,得到待检测图像;将待检测图像输入到预先生成的物体检测模型中进行物体检测,得到物体检测结果;其中,物体检测模型提取所述待检测图像的方向梯度直方图特征,通过预先训练的支持向量机进行物体检测。本方法能有效提高物体检测的精度和速度。
附图说明
本申请借助于以下附图进行描述:
图1为本申请一个实施例中的基于多画面实时拼接的物体检测方法流程示意图;
图2为本申请另一实施例中的智能视频监控系统结构示意图;
图3为本申请又一实施例中的电子设备的架构示意图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。可以理解的是,以下所描述的具体的实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合;为了便于描述,附图中仅示出了与发明相关的部分。
实施例一
图1为本申请一个实施例中的基于多画面实时拼接的物体检测方法流程示意图,如图1所示,该方法的执行主体可以是智能视频分析子系统,该子系统可以由软件和/或硬件实现。
本实施例基于多画面实时拼接的物体检测方法包括以下步骤:
S10、获取用于图像拼接的多幅原始图像,多幅原始图像分别由多个监控摄像头同步采集;
S20、根据预先生成的图像变换矩阵分别对多幅原始图像进行图像变换,得到多幅变换图像,图像变换矩阵基于所述多个监控摄像头同步采集的历史图像集生成;
S30、采用预设的光照补偿算法对多幅变换图像进行光照补偿;
S40、对光照补偿后的多幅图像进行图像拼接和融合,得到待检测图像;
S50、将待检测图像输入到预先生成的物体检测模型中进行物体检测,得到物体检测结果;其中,物体检测模型为基于深度学习算法建立、并预先训练的端到端小目标检测模型。
本实施例的基于多画面实时拼接的物体检测方法,能够克服光照变换、遮挡问题、摄像头转移等干扰因素影响,避免出现误检和漏检,有效提高了物体检测的精度和速度。
为了更好地理解本发明,以下对本实施例中的各步骤进行展开说明。
本实施例通过对数张不同传感器获得的有重叠部分的图像拼成一幅无缝的全景图或高分辨率图像,基于拼接后的图像对监控区域进行遗留物体的检测,以便避免危害公共安全的事件发生。
在步骤S10中,监控摄像头可以设置于博物馆、火车站、广场等场所,如大门,闸机进出口,特定岗位,过道,走廊等,相应的监控区域就是大门,闸机进出口,特定区域,过道,走廊等。
具体地,监控摄像头实时拍摄监控区域内的监控视频,智能视频分析子系统实时获取视频连续视频帧中的图像数据。需要说明的是,在此步骤中,监控摄像头可以但不限制于采用网络监控摄像头进行监控视频的拍摄,先将网络监控摄像头安放在能够拍摄目标区域的位置,然后通过网络、本地传输等方式访问摄像头读取视频图像即可。
本实施例中,基于多画面实时拼接的物体检测方法的执行主体可以通过有线连接方式或者无线连接方式从图像采集装置获取视频图像。
本实施例中,在S10之后、S20之前还包括对多幅原始图像进行预处理,具体步骤包括:
利用直方图均衡化算法对原始图像进行处理,以减少因光线变化而产生的图像模糊现象;
采用双边滤波的方式对处理后的原始图像进行滤波处理,以抑制图像中的噪声。
步骤1401:采用双边滤波的方式对原始图像进行滤波处理,以抑制图像中的噪声;
双边滤波(Bilateralfilter)是一种非线性的滤波方法,是结合图像的空间邻近度和像素值相似度的一种折中处理,能够兼顾同时考虑空域信息和灰度相似性,达到保边去噪的目的,具有简单、非迭代、局部的特点。本发明实施例采用双边滤波的好处是可以做边缘保存,一般常用的维纳滤波或者高斯滤波去降噪,都会较明显地模糊边缘,对于高频细节的保护效果并不明显。双边滤波顾名思义比高斯滤波多了一个高斯方差sigma-d,它是基于空间分布的高斯滤波函数,因此在边缘附近,离的较远的像素不会太多影响到边缘上的像素值,这样就保证了边缘附近像素值的保存,具体算法在此不做赘述。
本实施例中,在S10之前还包括生成图像变换矩阵,生成图像变换矩阵的步骤包括:
S01、提取历史图像集中每个历史图像的SIFT特征;
S02、通过最近邻特征匹配算法进行特征匹配,得到特征匹配点;
S03、基于特征匹配点对各历史图像进行相机参数估计,生成图像变换矩阵。
本实施例中,预设的光照补偿算法为灰度世界色彩均衡算法,S30包括:
S31、针对每一幅变换图像,分别计算变换图像的三个颜色分量的平均值avgR、avgG、avgB,并令变换图像的平均灰度值为:
avgGray=(avgR+avgG+avgB)/3
S32、计算三个颜色分量的增益系数:
ar=avgGray/avgR
ag=avgGray/avgG
ab=avgGray/avgB
S33、对于变换图像中每个像素c,通过以下公式计算其红色R、绿色G、蓝色B调整分量c(R′)、c(G′)、c(B′):
c(R′)=c(R)*ar
c(G′)=c(G)*ar
c(B′)=c(B)*ar
对图像采用灰度世界色彩均衡算法进行光照补偿,调整图像的亮度和色彩,消除了图像之间的色彩偏差。灰度世界色彩均衡算法简单快速,有效提高了实时检测的效率。
本实施例中,S40包括图像拼接和图像融合。拼接后的监控图像可能由于不同角度的摄像头获取的图像的颜色存在差异,导致拼接后的图像存在明显的拼接缝隙,降低了用户的视觉体验,为了改善拼接效果,在拼接完成后,还可以进一步包括颜色融合,以使拼接区域的颜色过渡自然。
在一个优选的实施例中,采用加权平均法,将两幅图像重叠部分加权平均实现快速融合。对同步帧图像的重叠区域的原始颜色进行加权求平均值,使用加权平均后的数值对拼接后图像的重叠区域的像素点赋值。
S40包括:采用加权平均法对图像的重叠区域的原始颜色进行加权求平均值,使用加权平均后的数值对拼接后图像的重叠区域的像素点赋值。
需要说明的是,以上仅仅是对图像融合方法做示例性说明,并构成对图像融合方法的限定。
将待拼接图像的重合区域进行融合可得到拼接重构的平滑无缝全景图像。
步骤S50中,端到端小目标检测模型为基于FPN有效融合因子的小目标检测模型,该模型的构建和训练步骤包括:
S51,构建骨干网络,并对其进行预训练;
S52,提取预训练权重用作目标数据集训练的网络初始化权值,在目标数据集进行训练,获得训练后的小目标检测模型;在训练过程中,采用骨干网络对图像进行多尺度特征提取,获得多个尺度的特征图;将FPN中相邻特征层的融合比例设定为融合因子α,基于融合因子确定相邻特征图之间的融合比例,将各尺度的特征图进行融合。
需要说明的是,融合因子可以为一个可学习参数,通过损失函数优化获得。
在本发明中,骨干网络可以选择现有的多种结构的基于深度学习的神经网络,例如可以是ResNet(残差网络)或ResNeXt(多支路的残差网络)等。本实施例中,采用ResNet-50作为骨干网络。物体检测结果包括目标的类别和位置。
本发明提供的基于FPN的融合因子的小目标检测方法,通过在FPN中设置适当的融合因子,可以在小目标检测的基线上获得显著的性能提升。
实施例二
图2为本申请另一实施例中的智能视频监控系统结构示意图,请参阅图2,本申请第二方面通过实施例二提供一种智能视频监控系统,包括视频采集子系统、智能视频分析子系统和控制中心子系统,智能视频分析子系统采用如上实施例一中的基于多画面实时拼接的物体检测方法进行物体检测,并将检测结果发送至控制中心子系统。
视频采集子系统用于进行视频采集,包括摄像机。
智能视频分析子系统用于实现物体检测和人脸识别,并将物体检测结果发送至控制中心。
控制中心子系统用于与监控人员直接交互,在监控端可以进行报警准则的设定,也可以制定报警响应,并能对整个监控系统进行监视和管理。
通过采用实施例一中的基于多画面实时拼接的物体检测方法进行物体检测大大提高检测效率和速度,控制中心人员可及时发现异常物体并采取相应的措施。
实施例三
本申请第三方面通过实施例三提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现如上实施例一中任意一项所述的基于多画面实时拼接的物体检测方法的步骤。
图3为本申请又一实施例中的电子设备的架构示意图。
图3所示的电子设备可包括:至少一个处理器101、至少一个存储器102、至少一个网络接口104和其他的用户接口103。电子设备中的各个组件通过总线系统105耦合在一起。可理解,总线系统105用于实现这些组件之间的连接通信。总线系统105除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统105。
其中,用户接口103可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)或者触感板等。
可以理解,本实施例中的存储器102可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(StaticRAM,SRAM)、动态随机存取存储器(DynamicRAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM,DRRAM)。本文描述的存储器62旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器102存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统1021和应用程序1022。
其中,操作系统1021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序622,包含各种应用程序,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序1022中。
在本发明实施例中,处理器101通过调用存储器102存储的程序或指令,具体的,可以是应用程序1022中存储的程序或指令,处理器101用于执行第一方面所提供的方法步骤。
上述本发明实施例揭示的方法可以应用于处理器101中,或者由处理器101实现。处理器101可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器102,处理器101读取存储器102中的信息,结合其硬件完成上述方法的步骤。
另外,结合上述实施例中的基于多画面实时拼接的物体检测方法,本发明实施例可提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上方法实施例中的任意一种基于多画面实时拼接的物体检测方法。
应当注意的是,在权利要求中,不应将位于括号之间的任何附图标记理解成对权利要求的限制。词语“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的词语“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。词语第一、第二、第三等的使用,仅是为了表述方便,而不表示任何顺序。可将这些词语理解为部件名称的一部分。
此外,需要说明的是,在本说明书的描述中,术语“一个实施例”、“一些实施例”、“实施例”、“示例”、“具体示例”或“一些示例”等的描述,是指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管已描述了本发明的优选实施例,但本领域的技术人员在得知了基本创造性概念后,则可对这些实施例作出另外的变更和修改。所以,权利要求应该解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种修改和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也应该包含这些修改和变型在内。
Claims (10)
1.一种基于多画面实时拼接的物体检测方法,其特征在于,该方法包括:
S10、获取用于图像拼接的多幅原始图像,所述多幅原始图像分别由多个监控摄像头同步采集;
S20、根据预先生成的图像变换矩阵分别对所述多幅原始图像进行图像变换,得到多幅变换图像,所述图像变换矩阵基于所述多个监控摄像头同步采集的历史图像集生成;
S30、采用预设的光照补偿算法对所述多幅变换图像进行光照补偿;
S40、对光照补偿后的多幅图像进行图像拼接和融合,得到待检测图像;
S50、将所述待检测图像输入到预先生成的物体检测模型中进行物体检测,得到物体检测结果;其中,所述物体检测模型为基于深度学习算法建立、并预先训练的端到端小目标检测模型。
2.根据权利要求1所述的基于多画面实时拼接的物体检测方法,其特征在于,在S10之后、S20之前还包括对多幅原始图像进行预处理。
3.根据权利要求1所述的基于多画面实时拼接的物体检测方法,其特征在于,对多幅原始图像进行预处理包括:
利用直方图均衡化算法对所述原始图像进行处理,以减少因光线变化而产生的图像模糊现象;
采用双边滤波的方式对处理后的原始图像进行滤波处理,以抑制图像中的噪声。
4.根据权利要求1所述的基于多画面实时拼接的物体检测方法,其特征在于,在S10之前还包括生成图像变换矩阵,生成图像变换矩阵的步骤包括:
S01、提取所述历史图像集中每个历史图像的SIFT特征;
S02、通过最近邻特征匹配算法进行特征匹配,得到特征匹配点;
S03、基于所述特征匹配点对各历史图像进行相机参数估计,生成图像变换矩阵。
5.根据权利要求1所述的基于多画面实时拼接的物体检测方法,其特征在于,预设的光照补偿算法为灰度世界色彩均衡算法,S30包括:
S31、针对每一幅变换图像,分别计算变换图像的三个颜色分量的平均值avgR、avgG、avgB,并令变换图像的平均灰度值为:
avgGray=(avgR+avgG+avgB)/3
S32、计算三个颜色分量的增益系数:
ar=avgGray/avgR
ag=avgGray/avgG
ab=avgGray/avgB
S33、对于变换图像中每个像素c,通过以下公式计算其红色R、绿色G、蓝色B调整分量c(R′)、c(G′)、c(B′):
c(R′)=c(R)*ar
c(G′)=c(G)*ar
c(B′)=c(B)*ar。
6.根据权利要求1所述的基于多画面实时拼接的物体检测方法,其特征在于,S40包括:采用加权平均法对图像的重叠区域的原始颜色进行加权求平均值,使用加权平均后的数值对拼接后图像的重叠区域的像素点赋值。
7.根据权利要求1所述的基于多画面实时拼接的物体检测方法,其特征在于,所述端到端小目标检测模型为基于FPN有效融合因子的小目标检测模型,该模型的构建和训练步骤包括:
S51,构建骨干网络,并对其进行预训练;
S52,提取预训练权重用作目标数据集训练的网络初始化权值,在目标数据集进行训练,获得训练后的小目标检测模型;在训练过程中,采用骨干网络对图像进行多尺度特征提取,获得多个尺度的特征图;将FPN中相邻特征层的融合比例设定为融合因子α,基于融合因子确定相邻特征图之间的融合比例,将各尺度的特征图进行融合。
8.一种智能视频监控系统,包括视频采集子系统、智能视频分析子系统和控制中心子系统,其特征在于,所述智能视频分析子系统采用权利要求1至7中任一项所述的基于多画面实时拼接的物体检测方法进行物体检测,并将检测结果发送至所述控制中心子系统。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上权利要求1至7中任一项所述的基于多画面实时拼接的物体检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被所述处理器执行时实现如上权利要求1至7中任一项所述的基于多画面实时拼接的物体检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110989391.4A CN113723272A (zh) | 2021-08-26 | 2021-08-26 | 基于多画面实时拼接的物体检测方法、系统、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110989391.4A CN113723272A (zh) | 2021-08-26 | 2021-08-26 | 基于多画面实时拼接的物体检测方法、系统、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723272A true CN113723272A (zh) | 2021-11-30 |
Family
ID=78678184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110989391.4A Withdrawn CN113723272A (zh) | 2021-08-26 | 2021-08-26 | 基于多画面实时拼接的物体检测方法、系统、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723272A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114170421A (zh) * | 2022-02-10 | 2022-03-11 | 青岛海尔工业智能研究院有限公司 | 图像检测方法、装置、设备及存储介质 |
CN114596263A (zh) * | 2022-01-27 | 2022-06-07 | 阿丘机器人科技(苏州)有限公司 | 深度学习的主板外观检测方法、装置、设备及存储介质 |
CN115866213A (zh) * | 2023-03-01 | 2023-03-28 | 深圳市微浦技术有限公司 | 多摄像头协同监控方法、装置、设备及存储介质 |
-
2021
- 2021-08-26 CN CN202110989391.4A patent/CN113723272A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114596263A (zh) * | 2022-01-27 | 2022-06-07 | 阿丘机器人科技(苏州)有限公司 | 深度学习的主板外观检测方法、装置、设备及存储介质 |
CN114170421A (zh) * | 2022-02-10 | 2022-03-11 | 青岛海尔工业智能研究院有限公司 | 图像检测方法、装置、设备及存储介质 |
CN114170421B (zh) * | 2022-02-10 | 2022-06-17 | 卡奥斯工业智能研究院(青岛)有限公司 | 图像检测方法、装置、设备及存储介质 |
CN115866213A (zh) * | 2023-03-01 | 2023-03-28 | 深圳市微浦技术有限公司 | 多摄像头协同监控方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113723272A (zh) | 基于多画面实时拼接的物体检测方法、系统、设备和介质 | |
US11151723B2 (en) | Image segmentation method, apparatus, and fully convolutional network system | |
Ghosh et al. | A survey on image mosaicing techniques | |
US6999600B2 (en) | Video scene background maintenance using change detection and classification | |
AU2011201953B2 (en) | Fault tolerant background modelling | |
CN109685045B (zh) | 一种运动目标视频跟踪方法及系统 | |
Zhu et al. | Multiscale infrared and visible image fusion using gradient domain guided image filtering | |
Paul et al. | Application of HDR algorithms to solve direct sunlight problems when autonomous vehicles using machine vision systems are driving into sun | |
US10915755B2 (en) | Alignment-free video change detection using deep blind image region prediction | |
CN112257669A (zh) | 行人重识别方法、装置及电子设备 | |
JP6668514B1 (ja) | ディープランニング基盤陰影映像の時空間的な特性分析を活用した暴力検出用フレームワーキング方法およびその装置 | |
US20190147226A1 (en) | Method, system and apparatus for matching a person in a first image to a person in a second image | |
CN110390657B (zh) | 一种图像融合方法 | |
CN111582074A (zh) | 一种基于场景深度信息感知的监控视频树叶遮挡检测方法 | |
Ulhaq et al. | FACE: Fully automated context enhancement for night-time video sequences | |
Katramados et al. | Real-time visual saliency by division of gaussians | |
CN115880765A (zh) | 区域入侵异常行为检测方法、装置及计算机设备 | |
CN113159229B (zh) | 图像融合方法、电子设备及相关产品 | |
CN113298707B (zh) | 图像帧拼接方法、视频巡检方法、装置、设备及存储介质 | |
CN113158963A (zh) | 一种高空抛物的检测方法及装置 | |
CN111654747B (zh) | 弹幕显示方法及装置 | |
Ali et al. | Robust regularization for single image dehazing | |
Hu et al. | Video object segmentation in rainy situations based on difference scheme with object structure and color analysis | |
CN103903269B (zh) | 球机监控视频的结构化描述方法和系统 | |
CN116543014A (zh) | 一种融合全景的教师自动跟踪方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211130 |