CN110909712B - 运动目标检测方法、装置、电子设备及存储介质 - Google Patents

运动目标检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110909712B
CN110909712B CN201911231753.2A CN201911231753A CN110909712B CN 110909712 B CN110909712 B CN 110909712B CN 201911231753 A CN201911231753 A CN 201911231753A CN 110909712 B CN110909712 B CN 110909712B
Authority
CN
China
Prior art keywords
video frame
coefficient matrix
motion coefficient
matrix
structural similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911231753.2A
Other languages
English (en)
Other versions
CN110909712A (zh
Inventor
王磊
王�义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Unisinsight Technology Co Ltd
Original Assignee
Chongqing Unisinsight Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Unisinsight Technology Co Ltd filed Critical Chongqing Unisinsight Technology Co Ltd
Priority to CN201911231753.2A priority Critical patent/CN110909712B/zh
Publication of CN110909712A publication Critical patent/CN110909712A/zh
Application granted granted Critical
Publication of CN110909712B publication Critical patent/CN110909712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

本申请提出一种运动目标检测方法、装置、电子设备及存储介质,涉及视频监控技术领域,通过计算连续的第一视频帧与第二视频帧的结构相似度矩阵,从而根据该结构相似度矩阵,得到表征第一视频帧与第二视频帧在对应像素点坐标差异的运动系数矩阵,从而当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标,相比于现有技术,通过连续的两个视频帧中各个像素点坐标的运动信息来反映视频流的运动变化,能够利用较低的计算量,利用两个连续的视频帧的结构相似度对视频流中是否存在运动目标进行监测,提升视频流中运动目标的检测精度。

Description

运动目标检测方法、装置、电子设备及存储介质
技术领域
本申请涉及视频监控技术领域,具体而言,涉及一种运动目标检测方法、装置、电子设备及存储介质。
背景技术
计算机视觉技术的快速发展,使得各行各业逐步进行了智能化的应用阶段,采用图像处理和视频分析技术可以满足各行业的自动化和高精度的需求。
在视频监控和安防领域,对视频中运动目标的自动检测和预警可以有效减少人力和物力资源消耗,从而降低运营成本,如用于安防场景的入侵检测等。此外,提取视频中的运动信息有助于辅助后续的高阶分析任务,比如目标的识别和跟踪,关键区域提取以及动作分析等等。
然而,目前针对视频帧中运动目标的检测方案,受噪声干扰影响较大,检测精度较低。
发明内容
本申请的目的在于提供一种运动目标检测方法、装置、电子设备及存储介质,能够提升视频流中运动目标的检测精度。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供一种运动目标检测方法,所述方法包括:
计算第一视频帧与第二视频帧的结构相似度矩阵;其中,所述第一视频帧和所述第二视频帧为视频流中连续的两个视频帧,所述结构相似度矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构相似度;
根据所述结构相似度矩阵,得到运动系数矩阵;其中,所述运动系数矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构差异程度;
当所述运动系数矩阵中存在大于设定阈值的数值时,确定所述视频流中存在运动目标。
第二方面,本申请实施例提供一种运动目标检测装置,所述装置包括:
处理模块,用于计算第一视频帧与第二视频帧的结构相似度矩阵;其中,所述第一视频帧和所述第二视频帧为视频流中连续的两个视频帧,所述结构相似度矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构相似度;
所述处理模块还用于,根据所述结构相似度矩阵,得到运动系数矩阵;其中,所述运动系数矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构差异程度;
检测模块,用于当所述运动系数矩阵中存在大于设定阈值的数值时,确定所述视频流中存在运动目标。
第三方面,本申请实施例提供一种电子设备,所述电子设备包括存储器,用于存储一个或多个程序;处理器;当所述一个或多个程序被所述处理器执行时,实现上述的运动目标检测方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的运动目标检测方法。
本申请实施例提供的一种运动目标检测方法、装置、电子设备及存储介质,通过计算连续的第一视频帧与第二视频帧的结构相似度矩阵,从而根据该结构相似度矩阵,得到表征第一视频帧与第二视频帧在对应像素点坐标差异的运动系数矩阵,从而当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标,相比于现有技术,通过连续的两个视频帧中各个像素点坐标的运动信息来反映视频流的运动变化,能够利用较低的计算量,利用两个连续的视频帧的结构相似度对视频流中是否存在运动目标进行监测,提升视频流中运动目标的检测精度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1示出本申请实施例提供的电子设备的一种示意性结构框图;
图2示出本申请实施例提供的运动目标检测方法的一种示意性流程图;
图3示出本申请实施例提供的运动目标。检测方法的另一种示意性流程图;
图4示出本申请实施例提供的运动目标检测方法的再一种示意性流程图;
图5A示意一种第一视频帧;
图5B示出一种第二视频帧;
图5C示出一种运动目标检测结构示意图;
图6A示例另一种第一视频帧;
图6B示出另一种第二视频帧;
图6C示出另一种运动目标检测结果示意图;
图7示出本申请实施例提供的运动目标检测装置的一种示例性结构框图。
图中:100-电子设备;101-存储器;102-处理器;103-通信接口;300-运动目标检测装置;301-处理模块;302-检测模块;
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在例如上述的视频监控和安防领域中,目前针对视频中运动目标的自动检测方案包括基于背景建模的方案以及帧间差分法等。
以基于背景建模的方案为例,比如高斯混合模型、Codebook、SACON(SAmpleCONsensus)和VIBE(visual background extractor,视觉背景提取)等算法,这类方案通过建立背景样本集,在进行运动目标检测时,通过计算实时视频帧与背景模板的差值,来判断实时视频帧中是否存在运动目标。这类方案的缺陷是由于需要建立背景样本集,而视频流中的背景可能会出现变化,因此需要一段视频流进行背景初始化以及针对视频流进行不断更新,因此需要较大的计算量,效率较低。
而另一种基于帧间差分法进行运动目标检测的方案,其实现思路是计算连续的两帧的像素差值,当差值超过一个设定的阈值时,就可以判断视频流中出现了运动目标。这种方案虽然能解决前述基于背景建模的方案需要较低计算量的问题,但该方案受噪声干扰影响较大,检测结果中往往存在较多的误检,检测精度较低。
为此,基于上述缺陷,本申请实施例提供的一种可能的实现方式为:通过计算连续的第一视频帧与第二视频帧的结构相似度矩阵,从而根据该结构相似度矩阵,得到表征第一视频帧与第二视频帧在对应像素点坐标差异的运动系数矩阵,从而当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标,能够利用较低的计算量,利用两个连续的视频帧的结构相似度对视频流中是否存在运动目标进行监测,提升视频流中运动目标的检测精度。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1示出本申请实施例提供的电子设备100的一种示意性结构框图,比如该电子设备100可以是但不限于是IPC(IP CAMERA,网络摄像机)、个人电脑(personalcomputer,PC)、平板电脑、服务器等等。
电子设备100包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
存储器101可用于存储软件程序及模块,如本申请实施例提供的运动目标检测装置300对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理,进而执行本申请实施例提供的运动目标检测方法的步骤。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除可编程只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以理解,图1所示的结构仅为示意,电子设备100还可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
下面以图1所示的电子设备100作为示意性执行主体,对本申请实施例提供的运动目标检测方法进行示例性说明。
请参阅图2,图2示出本申请实施例提供的运动目标检测方法的一种示意性流程图,可以包括以下步骤:
步骤203,计算第一视频帧与第二视频帧的结构相似度矩阵;
步骤206,根据结构相似度矩阵,得到运动系数矩阵;
步骤209,当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标。
在对视频流进行运动目标检测时,首先可以取视频流中连续的两个视频帧第一视频帧和第二视频帧,以计算第一视频帧与第二视频帧对应像素点坐标的结构相似度,从而得到第一视频帧与第二视频帧的结构相似度矩阵,其中,该结构相似度矩阵中的每一数值表征第一视频帧与第二视频帧在对应像素点坐标的结构相似度。
然后,根据该结构相似度矩阵,计算得到运动系数矩阵,该运动系数矩阵中的每一数值表征第一视频帧与第二视频帧在对应像素点坐标的结构差异程度,运动系数矩阵中的数值越大,表征对应像素点坐标的像素值变化越剧烈,存在移动目标的概率越高。
因此,根据得到的运动系数矩阵,当运动系数矩阵中存在大于设定阈值的数值时,即可确定视频流中存在运动目标。
可见,基于上述设计,本申请实施例提供的一种运动目标检测方法,通过计算连续的第一视频帧与第二视频帧的结构相似度矩阵,从而根据该结构相似度矩阵,得到表征第一视频帧与第二视频帧在对应像素点坐标差异的运动系数矩阵,从而当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标,相比于现有技术,通过连续的两个视频帧中各个像素点坐标的运动信息来反映视频流的运动变化,能够利用较低的计算量,利用两个连续的视频帧的结构相似度对视频流中是否存在运动目标进行监测,提升视频流中运动目标的检测精度。
其中,在执行步骤204时,可以采用归一化计算的方案,归一化该结构相似度矩阵中的每一数值,从而得到运动系数矩阵。
比如,计算得到该运动系数矩阵的公式可以满足如下:
Figure BDA0002303748240000081
式中,MN(x,y)表示运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,SSIM_index(x,y)表示结构相似度矩阵,r×c表示视频帧的分辨率。
在一些可能的应用场景中,视频监控画面的目标往往存在远近之分,比如监控画面中相对远离摄像头的可以称之为远目标,而监控画面中相对靠近摄像头的可以称之为近目标。
由于远目标和近目标各自在视频监控画面中所占像素点的大小是不一致的,从而导致单一检测尺度并不能满足视频监控画面中远目标及近目标的检测需求。
为此,在图2的基础上,请参阅图3,图3示出本申请实施例提供的运动目标检测方法的另一种示意性流程图,可以包括以下步骤:
步骤202,在多个高斯核尺度中确定出目标高斯核尺度;
步骤203,根据目标高斯核尺度对应的高斯矩阵依次遍历第一视频帧与第二视频帧对应的所有像素点,获得结构相似度矩阵;
步骤206,根据结构相似度矩阵,得到运动系数矩阵;
步骤207,根据历史运动系数矩阵,更新运动系数矩阵;
步骤208,判断多个高斯核尺度是否遍历结束;若为否,则以多个高斯核尺度中目标高斯核尺度的下一高斯核尺度,返回继续执行步骤202;若为是,则执行步骤209;
步骤209,当更新后的运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标。
在本申请实施例中,可以通过设置高斯核尺度数组的方式,设置多个高斯核尺度,比如,该高斯核尺度数组可以表示为S={S1,S2,...,Sk,...,SN};在利用本申请实施例提供的运动目标检测方法对视频流进行运动目标检测时,可以将高斯核尺度数组中包括的多个高斯核尺度,依次作为目标高斯核尺度,从而对视频流进行多个尺度下的运动目标检测。
其中,需要说明的是,上述的多个高斯核尺度,可以是预先设置在电子设备内,也可以是电子设备接收用户的输入所获得的,本申请实施例对多个高斯核尺度的获取方式不进行限定。
另外,在一种可能的实现方式中,可以将多个高斯核尺度中的任意一个确定为目标高斯核尺度Sk,然后在执行步骤203时,可以根据该目标高斯核尺度Sk生成的长宽均为Sk的高斯矩阵依次遍历第一视频帧与第二视频帧对应的所有像素点,从而计算得到结构相似度矩阵。
比如,假定第一视频帧和第二视频帧分别表示为I1和I2,以I1和I2中的每个像素点坐标x、y为中心,选取邻域为高斯矩阵大小的子图像X、Y,计算两幅子图像X、Y的结构相似度,计算公式可以满足如下:
Figure BDA0002303748240000101
式中,SSIM(X,Y)表示同等输入大小的结构相似度,μX和μY分别表示子图像X和子图像Y各个像素点归一化后的像素值,σXY表示子图像X、Y对应像素点的标准差,C1和C2均为设定的参数。
由此,视频帧I1和I2的结构相似度矩阵的计算公式可以满足如下:
Figure BDA0002303748240000102
式中,SSIM_index(x,y)表示像素点坐标为x、y的结构相似度值,SSIM(X,Y)表示同等输入大小的结构相似度,Sk表示目标高斯核尺度。
另外,在执行步骤206之后,可以结合历史运动系数矩阵,更新该运动系数矩阵,其中,该历史运动系数矩阵为第一视频帧与第二视频帧在目标高斯核尺度的前一高斯核尺度时的运动系数矩阵。
也就是说,在设置多个高斯核尺度对视频流进行运动目标检测时,可以将每一高斯核尺度下计算得到的运动系数矩阵进行迭代,从而使运动目标的检测结果更精确。
另外,在更新该运动系数矩阵后,可以判断该多个高斯核尺度是否遍历结束;若未遍历结束,则可以将该多个高斯核尺度中目标高斯核尺度的下一高斯核尺度,返回继续执行步骤202;而若遍历结束,则可以执行步骤209,在判定更新后的运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标。
也就是说,在更新该运动系数矩阵后,可以通过判断该多个高斯核尺度是否遍历结束的方式,判断迭代是否结束;若未遍历结束,则说明未迭代结束,则可以将该多个高斯核尺度中目标高斯核尺度的下一高斯核尺度,返回继续执行步骤202;而若遍历结束,则说明迭代已结束,可以执行步骤209。
可见,基于上述设计,本申请实施例提供的一种运动目标检测方法,通过设置多个高斯核尺度,并计算第一视频帧和第二视频帧在每一高斯核尺度下的运动系数矩阵,从而迭代所有高斯核尺度下的运动系数矩阵,得到更新后的运动系数矩阵,进而根据该更新后的运动系数矩阵,在多个不同尺度下对视频流中是否存在运动目标进行检测,能够提升针对不同尺寸目标的检测精度。
其中,在执行步骤207时,可以采用多种方案利用历史运用系数矩阵对运动系数矩阵进行更新,比如求取均值或者是倍数变换后进行叠加等等。
作为其中一种可能的实现方式,在执行步骤207时,可以将历史运动系数矩阵与运动系数矩阵两者对应像素点坐标的数值中的较小者,作为更新后的运动系数矩阵中对应像素点坐标的数值。
示例性地,更新运动系数矩阵的公式可以满足如下:
Figure BDA0002303748240000111
式中,Mk(x,y)表示更新后的运动系数矩阵,Mk-1(x,y)表示历史运动系数矩阵,MNk(x,y)表示运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,r×c表示视频帧的分辨率。
也就是说,在本申请实施例中,可以通过遍历运动系数矩阵对应各个像素点坐标的数值,与历史运动系数矩阵中对应像素点坐标的数据进行比较,取两者中的较小者,作为更新后的运动系数矩阵中对应像素点坐标的数值。如此,便可降低更新后的运动系数矩阵对小的干扰信息的敏感程度,从而使检测结果更可靠。
另外,在一些应用场景中,受光照等因素的影响,视频帧图像中一般会存在光照和噪声的扰动,往往会导致检测结果存在误差。
为此,在图2的基础上,请参阅图4,图4示出本申请实施例提供的运动目标检测方法的再一种示意性流程图,在执行步骤203之前,该运动目标检测方法还可以包括以下步骤:
步骤201,对第一视频帧和第二视频帧均进行伽马变换。
在执行步骤203之前,可以利用伽马变换,将第一视频帧和第二视频帧均映射到统一的亮度空间,从而减小噪声对运动目标检测的影响。
示例性地,进行伽马变换的计算公式可以满足如下:
Figure BDA0002303748240000121
式中,Iout表示变换后的像素值,Imax和Imin分别表示视频帧I中的最大像素值和最小像素值,I的取值即为第一视频帧I1和第二视频帧I2,gamma表示设定的变换系数。
由此,在执行步骤203时,则计算伽马变换后的第一视频帧与伽马变换后的第二视频帧两者的结构相似度矩阵。
可见,基于上述设计,本申请实施例提供的一种运动目标检测方法,通过对第一视频帧和第二视频帧进行伽马变换,进而利用伽马变换后的第一视频帧和伽马变换后的第二视频帧进行运动目标的检测,能够减小光照等因素产生的噪声干扰,并且能够增强视频帧的对比度,从而加强目标边缘,提升运动目标的检测精度。
下面结合具体的示例,对本申请实施例提供的运动目标检测方法的检测效果进行示例。
以gamma=2,S={3,5,7,9,11,13,15},C1=0.03,C2=0.05为例,对连续的两个视频帧的检测结果可以如图5A、图5B、图5C所示。
另一种示例,gamma=2,S={3,5,7,9,11,13,15},C1=0.03,C2=0.05,此时对连续的两个视频帧的检测结果可以如图6A、图6B、图6C所示。
可见,利用本申请实施例所提供的运动目标检测方法,能够较高精度的检测出视频流中的运动目标,具有较好的检测效果。
基于与上述运动目标检测方法相同的发明沟通,请参阅图7,图7示出本申请实施例提供的运动目标检测装置300的一种示例性结构框图,该运动目标检测装置300包括处理模块301及检测模块302。其中:
处理模块301用于,计算第一视频帧与第二视频帧的结构相似度矩阵;其中,第一视频帧和第二视频帧为视频流中连续的两个视频帧,结构相似度矩阵中的每一数值表征第一视频帧与第二视频帧在对应像素点坐标的结构相似度;
处理模块301还用于,根据结构相似度矩阵,得到运动系数矩阵;其中,运动系数矩阵中的每一数值表征第一视频帧与第二视频帧在对应像素点坐标的结构差异程度;
检测模块302用于,当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标。
可选地,作为一种可能的实现方式,处理模块301在根据结构相似度矩阵,得到运动系数矩阵时,具体用于:
归一化结构相似度矩阵中的每一数值,得到运动系数矩阵。
可选地,作为一种可能的实现方式,计算得到运动系数矩阵的公式满足如下:
Figure BDA0002303748240000141
式中,MN(x,y)表示运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,SSIM_index(x,y)表示结构相似度矩阵,r×c表示视频帧的分辨率。
可选地,作为一种可能的实现方式,处理模块301在计算第一视频帧与第二视频帧的结构相似度矩阵之前,处理模块301还用于:
在多个高斯核尺度中确定出目标高斯核尺度;其中,目标高斯核尺度为多个高斯核尺度中的任意一个;
处理模块301在计算第一视频帧与第二视频帧的结构相似度矩阵时,具体用于:
根据目标高斯核尺度对应的高斯矩阵依次遍历第一视频帧与第二视频帧对应的所有像素点,获得结构相似度矩阵;
处理模块301在根据结构相似度矩阵,得到运动系数矩阵之后,处理模块301还用于:
根据历史运动系数矩阵,更新运动系数矩阵;其中,历史运动系数矩阵为第一视频帧与第二视频帧在目标高斯核尺度的前一高斯核尺度时的运动系数矩阵;
判断多个高斯核尺度是否遍历结束;
若为否,则以多个高斯核尺度中目标高斯核尺度的下一高斯核尺度,返回继续在多个高斯核尺度中确定出目标高斯核尺度;
若为是,则处理模块301在当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标时,具体用于:
当更新后的运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标。
可选地,作为一种可能的实现方式,处理模块301在根据历史运动系数矩阵,更新运动系数矩阵时,具体用于:
将历史运动系数矩阵与运动系数矩阵两者对应像素点坐标的数值中的较小者,作为更新后的运动系数矩阵中对应像素点坐标的数值。
可选地,作为一种可能的实现方式,更新运动系数矩阵的公式满足如下:
Figure BDA0002303748240000151
式中,Mk(x,y)表示更新后的运动系数矩阵,Mk-1(x,y)表示历史运动系数矩阵,MNk(x,y)表示运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,r×c表示视频帧的分辨率。
可选地,作为一种可能的实现方式,处理模块301在计算第一视频帧与第二视频帧的结构相似度矩阵之前,处理模块301还用于:
对第一视频帧和第二视频帧均进行伽马变换;
处理模块301在计算第一视频帧与第二视频帧的结构相似度矩阵时,具体用于:
计算伽马变换后的第一视频帧与伽马变换后的第二视频帧两者的结构相似度矩阵。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。
也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请实施例提供的一种运动目标检测方法、装置、电子设备及存储介质,通过计算连续的第一视频帧与第二视频帧的结构相似度矩阵,从而根据该结构相似度矩阵,得到表征第一视频帧与第二视频帧在对应像素点坐标差异的运动系数矩阵,从而当运动系数矩阵中存在大于设定阈值的数值时,确定视频流中存在运动目标,相比于现有技术,通过连续的两个视频帧中各个像素点坐标的运动信息来反映视频流的运动变化,能够利用较低的计算量,利用两个连续的视频帧的结构相似度对视频流中是否存在运动目标进行监测,提升视频流中运动目标的检测精度。
并且,还通过设置多个高斯核尺度,并计算第一视频帧和第二视频帧在每一高斯核尺度下的运动系数矩阵,从而迭代所有高斯核尺度下的运动系数矩阵,得到更新后的运动系数矩阵,进而根据该更新后的运动系数矩阵,在多个不同尺度下对视频流中是否存在运动目标进行检测,能够提升针对不同尺寸目标的检测精度。
并且,还通过对第一视频帧和第二视频帧进行伽马变换,进而利用伽马变换后的第一视频帧和伽马变换后的第二视频帧进行运动目标的检测,能够减小光照等因素产生的噪声干扰,并且能够增强视频帧的对比度,从而加强目标边缘,提升运动目标的检测精度。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (8)

1.一种运动目标检测方法,其特征在于,所述方法包括:
计算第一视频帧与第二视频帧的结构相似度矩阵;其中,所述第一视频帧和所述第二视频帧为视频流中连续的两个视频帧,所述结构相似度矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构相似度;
归一化所述结构相似度矩阵中的每一数值,得到运动系数矩阵;其中,所述运动系数矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构差异程度;
当所述运动系数矩阵中存在大于设定阈值的数值时,确定所述视频流中存在运动目标;
其中,计算得到所述运动系数矩阵的公式满足如下:
Figure FDA0002812780580000011
式中,MN(x,y)表示所述运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,SSIM_index(x,y)表示所述结构相似度矩阵,r×c表示视频帧的分辨率。
2.如权利要求1所述的方法,其特征在于,在计算第一视频帧与第二视频帧的结构相似度矩阵的步骤之前,所述方法还包括:
在多个高斯核尺度中确定出目标高斯核尺度;其中,所述目标高斯核尺度为所述多个高斯核尺度中的任意一个;
计算第一视频帧与第二视频帧的结构相似度矩阵的步骤,包括:
根据所述目标高斯核尺度对应的高斯矩阵依次遍历所述第一视频帧与所述第二视频帧对应的所有像素点,获得所述结构相似度矩阵;
在归一化所述结构相似度矩阵中的每一数值,得到运动系数矩阵的步骤之后,所述方法还包括:
根据历史运动系数矩阵,更新所述运动系数矩阵;其中,所述历史运动系数矩阵为所述第一视频帧与所述第二视频帧在所述目标高斯核尺度的前一高斯核尺度时的运动系数矩阵;
判断所述多个高斯核尺度是否遍历结束;
若为否,则以所述多个高斯核尺度中所述目标高斯核尺度的下一高斯核尺度,返回继续执行在多个高斯核尺度中确定出目标高斯核尺度的步骤;
若为是,则当所述运动系数矩阵中存在大于设定阈值的数值时,确定所述视频流中存在运动目标的步骤,包括:
当更新后的运动系数矩阵中存在大于设定阈值的数值时,确定所述视频流中存在运动目标。
3.如权利要求2所述的方法,其特征在于,根据历史运动系数矩阵,更新所述运动系数矩阵的步骤,包括:
将所述历史运动系数矩阵与所述运动系数矩阵两者对应像素点坐标的数值中的较小者,作为所述更新后的运动系数矩阵中对应像素点坐标的数值。
4.如权利要求3所述的方法,其特征在于,更新所述运动系数矩阵的公式满足如下:
Figure FDA0002812780580000021
式中,Mk(x,y)表示所述更新后的运动系数矩阵,Mk-1(x,y)表示所述历史运动系数矩阵,MNk(x,y)表示所述运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,r×c表示视频帧的分辨率。
5.如权利要求1-4中任一项所述的方法,其特征在于,在计算第一视频帧与第二视频帧的结构相似度矩阵的步骤之前,所述方法还包括:
对所述第一视频帧和所述第二视频帧均进行伽马变换;
计算第一视频帧与第二视频帧的结构相似度矩阵的步骤,包括:
计算伽马变换后的第一视频帧与伽马变换后的第二视频帧两者的结构相似度矩阵。
6.一种运动目标检测装置,其特征在于,所述装置包括:
处理模块,用于计算第一视频帧与第二视频帧的结构相似度矩阵;其中,所述第一视频帧和所述第二视频帧为视频流中连续的两个视频帧,所述结构相似度矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构相似度;
所述处理模块还用于,归一化所述结构相似度矩阵中的每一数值,得到运动系数矩阵;其中,所述运动系数矩阵中的每一数值表征所述第一视频帧与所述第二视频帧在对应像素点坐标的结构差异程度;
检测模块,用于当所述运动系数矩阵中存在大于设定阈值的数值时,确定所述视频流中存在运动目标;
其中,计算得到所述运动系数矩阵的公式满足如下:
Figure FDA0002812780580000031
式中,MN(x,y)表示所述运动系数矩阵,(x,y)表示视频帧中对应像素点的坐标,SSIM_index(x,y)表示所述结构相似度矩阵,r×c表示视频帧的分辨率。
7.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-6中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
CN201911231753.2A 2019-12-05 2019-12-05 运动目标检测方法、装置、电子设备及存储介质 Active CN110909712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911231753.2A CN110909712B (zh) 2019-12-05 2019-12-05 运动目标检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911231753.2A CN110909712B (zh) 2019-12-05 2019-12-05 运动目标检测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110909712A CN110909712A (zh) 2020-03-24
CN110909712B true CN110909712B (zh) 2021-04-16

Family

ID=69822422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911231753.2A Active CN110909712B (zh) 2019-12-05 2019-12-05 运动目标检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110909712B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101148B (zh) * 2020-08-28 2024-05-03 普联国际有限公司 一种运动目标检测方法、装置、存储介质及终端设备
CN113099217B (zh) * 2021-03-31 2022-11-25 苏州科达科技股份有限公司 一种视频帧连续性检测方法、装置、设备及存储介质
CN113838110B (zh) * 2021-09-08 2023-09-05 重庆紫光华山智安科技有限公司 目标检测结果的校验方法、装置、存储介质和电子设备
CN113792697B (zh) * 2021-09-23 2023-09-05 重庆紫光华山智安科技有限公司 目标检测方法、装置、电子设备及可读存储介质
CN114170227B (zh) * 2022-02-11 2022-05-31 北京阿丘科技有限公司 产品表面缺陷检测方法、装置、设备及存储介质
CN117252903B (zh) * 2023-11-10 2024-04-05 山东通广电子股份有限公司 基于图像处理的运动区域提取方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204658A (zh) * 2016-07-21 2016-12-07 北京邮电大学 运动图像跟踪方法及装置
US20190138813A1 (en) * 2016-03-11 2019-05-09 Gracenote, Inc. Digital Video Fingerprinting Using Motion Segmentation
CN109801279A (zh) * 2019-01-21 2019-05-24 京东方科技集团股份有限公司 图像中的目标检测方法及装置、电子设备、存储介质
CN110070050A (zh) * 2019-04-24 2019-07-30 厦门美图之家科技有限公司 目标检测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190138813A1 (en) * 2016-03-11 2019-05-09 Gracenote, Inc. Digital Video Fingerprinting Using Motion Segmentation
CN106204658A (zh) * 2016-07-21 2016-12-07 北京邮电大学 运动图像跟踪方法及装置
CN109801279A (zh) * 2019-01-21 2019-05-24 京东方科技集团股份有限公司 图像中的目标检测方法及装置、电子设备、存储介质
CN110070050A (zh) * 2019-04-24 2019-07-30 厦门美图之家科技有限公司 目标检测方法及系统

Also Published As

Publication number Publication date
CN110909712A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110909712B (zh) 运动目标检测方法、装置、电子设备及存储介质
US20150310297A1 (en) Systems and methods for computer vision background estimation using foreground-aware statistical models
CN111524112B (zh) 追钢识别方法、系统、设备及介质
CN108230352B (zh) 目标对象的检测方法、装置和电子设备
CN107220962B (zh) 一种隧道裂纹的图像检测方法和装置
CN111950543A (zh) 一种目标检测方法和装置
CN108229494B (zh) 网络训练方法、处理方法、装置、存储介质和电子设备
CN110866515A (zh) 厂房内对象行为识别方法、装置以及电子设备
CN110428394B (zh) 用于目标移动侦测的方法、装置及计算机存储介质
CN111582032A (zh) 行人检测方法、装置、终端设备及存储介质
CN111598913A (zh) 一种基于机器人视觉的图像分割方法和系统
CN112966654A (zh) 唇动检测方法、装置、终端设备及计算机可读存储介质
CN111832634A (zh) 异物检测方法、系统、终端设备及存储介质
CN109886864B (zh) 隐私遮蔽处理方法及装置
CN111680680B (zh) 一种目标码定位方法、装置、电子设备及存储介质
CN113052019A (zh) 目标跟踪方法及装置、智能设备和计算机存储介质
CN113505643A (zh) 违章目标物检测方法及相关装置
CN115953434B (zh) 轨迹匹配方法、装置、电子设备和存储介质
CN112837384A (zh) 车辆标记方法、装置和电子设备
CN111667450A (zh) 一种船只数量统计方法、装置及电子设备
CN110689556A (zh) 跟踪方法、装置及智能设备
CN113762027B (zh) 一种异常行为的识别方法、装置、设备及存储介质
CN113191202B (zh) 一种图像处理方法、装置及电子设备
CN115909151A (zh) 一种复杂工作条件下运动容器编号识别方法
CN112784691B (zh) 一种目标检测模型训练方法、目标检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant