CN110505480A - 一种面向监控场景的快速感知视频编码方法 - Google Patents

一种面向监控场景的快速感知视频编码方法 Download PDF

Info

Publication number
CN110505480A
CN110505480A CN201910712870.4A CN201910712870A CN110505480A CN 110505480 A CN110505480 A CN 110505480A CN 201910712870 A CN201910712870 A CN 201910712870A CN 110505480 A CN110505480 A CN 110505480A
Authority
CN
China
Prior art keywords
background
ctu
frame
threshold value
jnd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910712870.4A
Other languages
English (en)
Other versions
CN110505480B (zh
Inventor
王钢
舒振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Institute of Technology of ZJU
Original Assignee
Ningbo Institute of Technology of ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Institute of Technology of ZJU filed Critical Ningbo Institute of Technology of ZJU
Priority to CN201910712870.4A priority Critical patent/CN110505480B/zh
Publication of CN110505480A publication Critical patent/CN110505480A/zh
Application granted granted Critical
Publication of CN110505480B publication Critical patent/CN110505480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公布了一种面向监控场景的快速感知视频编码方法。该方法建立一种基于背景建模的快速感知视频编码框架,将背景建模技术与JND阈值计算结合,利用背景建模生成背景建模帧,并利用该背景建模帧对监控视频内容分类,然后对背景的内容复杂度估计值进行时域复用,从而利用监控视频背景稳定性特点实现JND阈值快速计算。本发明所提出的面向监控场景的快速感知视频编码方法可以进一步提高监控视频的压缩率,降低编码时间复杂度,并兼容现有监控视频编码标准框架,无需增加解码端的软硬件成本,满足监控视频快速编码的应用需求。

Description

一种面向监控场景的快速感知视频编码方法
技术领域
本发明涉及多媒体编码技术领域,特别涉及一种面向监控场景的,将基于背景建模的监控视频编码和基于感知模型的视频编码方法有效结合的快速感知视频编码方法。
背景技术
随着国家公共安全加强和智慧城市发展的需要,监控摄像机的数量、种类和清晰度正在不断增加,海量监控视频数据出现了“传不动”,相应的高昂成本也使得多数监控视频数据“存不起”。因此,对存储和传输带宽提出了更高的挑战。然而,监控视频在内容上、应用上均有明显的特殊性,通用的编码和传输方法无法满足面向海量监控视频的有效存储和高效率高精度分析研判需求。因此,研究高效监控视频编码技术与方法具有重要的意义。
目前基于背景预测的监控视频编码方法在监控视频编码领域已取得一定的性能增益,并成为该领域重要方法。基于背景预测的监控视频编码方法可主要分为两大类:第一类,将关键帧直接作为长期的背景参考帧,但此类方法由于前景污染背景问题,较难得到比较干净的背景参考帧,从而背景内容的编码性能提升有限;第二类,通过背景建模算法训练视频帧生成背景参考帧,由于通过背景建模生成背景参考帧,可以提升背景参考帧的干净程度,减少前景污染。
基于感知模型的视频编码方法是视频编码另一个重要优化方法,该类方法尝试建立人眼视觉模型,并利用该模型进行视频编码。根据感知阈值的计算模型分类,感知视频编码方法可以分为三类:基于ROI区域的方法,基于视觉显著性的方法和基于JND模型的方法。ROI区域的方法需要使用机器视觉方法进行ROI区域的检测,但是ROI区域检测本身仍然是比较困难的。视觉显著性方法需要依靠神经科学模型进行人类关注区域的预测,由于人脑的复杂工作机制,目前仍然缺乏比较有效的神经科学模型。基于JND模型的方法是依靠人类认知心理学实验的知识来计算感知阈值,JND阈值能体现HVS和视觉感知阈值关系,在编码效率上取得了一定进展。
基于背景建模监控视频编码方法和基于感知模型的视频编码方法对于提高视频编码效率都取得较为可观的编码性能。而目前对于将监控视频编码方法和感知编码方法结合的方法在国内外仍处于空白,因此,将两者有效结合,将有助于进一步提高监控视频编码效率。
本发明首先设计一种基于背景建模的快速感知视频编码框架,利用现有监控视频编码方法的背景建模技术,将背景建模技术与JND阈值计算结合,利用背景建模生成背景建模帧,并利用背景建模帧对监控视频内容分类。然后对背景部分内容复杂度估计值进行时域复用,从而利用监控视频背景稳定性特点实现JND阈值快速计算。
因此,如何设计一种提高监控视频的压缩率、降低编码复杂度的面向监控场景的快速感知视频编码方法是本领域技术人员亟需解决的问题。
发明内容
本发明提出一种面向监控场景的快速感知视频编码方法。首先设计一种基于背景建模的快速感知视频编码框架,利用现有监控视频编码方法的背景建模技术,将背景建模技术与JND阈值计算结合,利用背景建模生成背景建模帧,并利用背景建模帧对监控视频内容分类。然后对背景部分内容复杂度估计值进行时域复用,从而利用监控视频背景稳定性特点实现JND阈值快速计算。本发明一方面可以提高监控视频的压缩率,另一方面大幅降低编码复杂度,满足监控场景实时应用的需求。具体方案如下:
一种面向监控场景的快速感知视频编码方法,其特征在于,包括如下步骤:
步骤一,对输入监控视频进行背景建模,获得背景建模帧;
步骤二,将所述背景建模帧与输入监控视频的当前视频帧以CTU为单位进行比较分类,得到前景CTU和背景CTU;
步骤三,对前景CTU独立采用JND阈值估计方法计算JND模型,得到JND阈值一;
步骤四,对背景CTU采用复用背景建模帧的共享JND阈值估计方法计算JND模型,得到JND阈值二;
步骤五,将所述JND阈值一和所述JND阈值对残差值进行抑制。
根据权利要求1所述的一种面向监控场景的快速感知视频编码方法,其特征在于,所述步骤一中,对输入监控视频进行背景建模,对背景建模帧采用帧级的Sobel算子边缘检测,生成帧级边缘二值图。
根据权利要求2所述的一种面向监控场景的快速感知视频编码方法,其特征在于,所述步骤二具体包括:
对当前视频帧进行CTU选取,对不同CTU进行不同策略的JND阈值计算:对于前景CTU采用CTU级Sobel算子边缘检测,对于背景CTU复用背景建模帧的帧级边缘二值图结果;
将输入的当前视频帧与背景建模帧按CTU大小使用最小平方差准则进行背景差分,如果小于阈值则为背景CTU,反之则为前景CTU。
根据权利要求1所述的一种面向监控场景的快速感知视频编码方法,其特征在于,所述步骤四中共享JND阈值估计方法包括,在计算JND模型中的对比度掩蔽因子时,后续的视频帧复用已有的相同内容复杂度边缘标志,其中,
JND视觉敏感度阈值计算模型描述如下:
对比度掩蔽因子进行如下建模:
对比度掩蔽因子进行如下建模:
其中,ωi,j表示空间频率,τ表示内容复杂度,n表示当前变换块序号。
τ值的计算如下:
其中,edge(x,y)表示一个3×3 Sobel边缘检测算子在(x,y)处得到的边缘标志,0代表非边缘,1代表边缘。
本发明相较现有技术具有以下有益效果:
1、首次将基于感知模型的视频编码方法用于监控视频编码中,设计面向监控场景的快速感知视频编码框架,进一步提高监控视频编码效率。
2、充分利用监控视频的特点,在计算JND模型因子过程中,对CTU进行分类,对于背景CTU的内容复杂度复用对应背景建模帧上区域的内容复杂度,从而提高JND感知模型的计算效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明面向监控场景的快速感知视频编码原理框架图;
图2为本发明监控视频中背景内容相似性判别图;
图3为本发明利用背景稳定性特点的JND阈值快速计算方法图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种面向监控场景的快速感知视频编码方法。首先设计一种基于背景建模的快速感知视频编码框架,利用现有监控视频编码方法的背景建模技术,将背景建模技术与JND阈值计算结合,利用背景建模生成背景建模帧,并利用背景建模帧对监控视频内容分类。然后对背景部分内容复杂度估计值进行时域复用,从而利用监控视频背景稳定性特点实现JND阈值快速计算。实验证明本方法一方面可以提高监控视频的压缩率,另一方面大幅降低编码复杂度,满足监控场景实时应用的需求。
方法描述如下:
如图1所示,S1、利用背景建模技术对输入视频进行训练建模,从而生成背景建模帧。对输入监控视频进行背景建模,对背景建模帧采用帧级的Sobel算子边缘检测,生成帧级边缘二值图。
S2、然后当前视频帧和背景建模帧以CTU为单位进行比较,其中,视频帧由一系列的编码树单元(CTU,Coding Tree Unit)构成。对CTU进行前景CTU和背景CTU分类。
S21、对当前视频帧进行CTU选取,对不同CTU进行不同策略的JND阈值计算:对于前景CTU采用CTU级Sobel算子边缘检测,对于背景CTU复用背景建模帧的帧级边缘二值图结果;
S22、将输入的当前视频帧与背景建模帧按CTU大小使用最小平方差准则进行背景差分,如果小于阈值则为背景CTU,反之则为前景CTU。
S3、对于前景CTU沿用传统的每一帧独立JND阈值估计方法计算JND模型的每一个因子。
S4、而对于背景CTU采用背景共享JND阈值估计方法,在计算对比度掩蔽因子时,对于背景CTU的内容复杂度估计值复用背景建模帧上对应区域的估计值。
如图2所示,对于监控视频特点来说,背景内容是具有相当强的时域内容相关性,即内容复杂度相似性高,第1帧和第172帧的背景内容是一致的,因此,在计算JND模型中的对比度掩蔽因子,后续的视频帧可以复用已有的相同内容复杂度边缘标志,而不需要对内容相同的区域进行重复的内容复杂度估计,从而减少后续视频帧的JND阈值计算复杂度。
如图3所示,JND视觉敏感度阈值计算模型可描述如下
在(1)中s(M)表示M×M变换块尺寸空间块效应,其关于不同变换块大小造成的整体视觉失真效果,代表在空间频率ωi,j和方向角的基本阈值,其反映视频的空间频率视觉敏感性,TLM(n,μp)代表第n个变换块的亮度自适应掩蔽因子,其反映亮度μp对视觉感知的影响,TCM(n,ωi,j,τ)代表第n个变换块的对比度掩蔽因子,其反映视频对比度对视觉失真敏感度的影响。TTM(n,ωi,j,mv)代表第n个变换块时域掩蔽因子,其表示视频序列的前后帧的运动mv对视觉失真敏感度的影响。
在JND阈值计算模型中一个JND阈值的计算需要计算5个因子。在JND阈值计算中,对比度掩蔽因子CM计算复杂度所占比重较高,对对比度掩蔽因子进行如下建模
其中,ωi,j表示空间频率,τ表示内容复杂度,n表示当前变换块序号。
对每个空间频率ωi,j上对比度掩蔽因子的阈值计算需要得到τ值,而τ值的计算如下
其中edge(x,y)表示一个3×3 Sobel边缘检测算子在(x,y)处得到的边缘标志,0代表非边缘,1代表边缘。
为减少计算τ值的时间复杂度,利用背景帧已有的内容复杂度结果,采用背景差分法,快速复用背景CTU的内容复杂度估计值,用于JND阈值计算。
S5、最后,根据前述步骤获取的JND阈值一和JND阈值二,分别将前景和背景内容的预测残差变换后的值与JND阈值进行比较,如果该值小于阈值,则对该值置0,反之,则将该值与JND阈值作差获得缩小后的值,然后将新值根据标准编码中的量化方法进行量化操作。
以上对本发明所提供的一种面向监控场景的快速感知视频编码方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (4)

1.一种面向监控场景的快速感知视频编码方法,其特征在于,包括如下步骤:
步骤一,对输入监控视频进行背景建模,获得背景建模帧;
步骤二,将所述背景建模帧与输入监控视频的当前视频帧以CTU为单位进行比较分类,得到前景CTU和背景CTU;
步骤三,对前景CTU独立采用JND阈值估计方法计算JND模型,得到JND阈值一;
步骤四,对背景CTU采用复用背景建模帧的共享JND阈值估计方法计算JND模型,得到JND阈值二;
步骤五,将所述JND阈值一和所述JND阈值二对残差值进行抑制。
2.根据权利要求1所述的一种面向监控场景的快速感知视频编码方法,其特征在于,所述步骤一中,对输入监控视频进行背景建模,对背景建模帧采用帧级的Sobel算子边缘检测,生成帧级边缘二值图。
3.根据权利要求2所述的一种面向监控场景的快速感知视频编码方法,其特征在于,所述步骤二具体包括:
对当前视频帧进行CTU选取,对不同CTU进行不同策略的JND阈值计算:对于前景CTU采用CTU级Sobel算子边缘检测,对于背景CTU复用背景建模帧的帧级边缘二值图结果;
将输入的当前视频帧与背景建模帧按CTU大小使用最小平方差准则进行背景差分,如果小于阈值则为背景CTU,反之则为前景CTU。
4.根据权利要求1所述的一种面向监控场景的快速感知视频编码方法,其特征在于,所述步骤四中共享JND阈值估计方法包括,在计算JND模型中的对比度掩蔽因子时,后续的视频帧复用已有的相同内容复杂度边缘标志,其中,
JND视觉敏感度阈值计算模型描述如下:
对比度掩蔽因子进行如下建模:
其中,ωi,j表示空间频率,τ表示内容复杂度,n表示当前变换块序号。
τ值的计算如下:
其中,edge(x,y)表示一个3×3Sobel边缘检测算子在(x,y)处得到的边缘标志,0代表非边缘,1代表边缘。
CN201910712870.4A 2019-08-02 2019-08-02 一种面向监控场景的快速感知视频编码方法 Active CN110505480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910712870.4A CN110505480B (zh) 2019-08-02 2019-08-02 一种面向监控场景的快速感知视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910712870.4A CN110505480B (zh) 2019-08-02 2019-08-02 一种面向监控场景的快速感知视频编码方法

Publications (2)

Publication Number Publication Date
CN110505480A true CN110505480A (zh) 2019-11-26
CN110505480B CN110505480B (zh) 2021-07-27

Family

ID=68587775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910712870.4A Active CN110505480B (zh) 2019-08-02 2019-08-02 一种面向监控场景的快速感知视频编码方法

Country Status (1)

Country Link
CN (1) CN110505480B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113296984A (zh) * 2021-06-15 2021-08-24 杭州朗和科技有限公司 兼容性参数确定方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020031277A1 (en) * 1997-04-04 2002-03-14 Jeffrey Lubin Method and apparatus for assessing the visibility of differences between two signal sequences
US20110033130A1 (en) * 2009-08-10 2011-02-10 Eunice Poon Systems And Methods For Motion Blur Reduction
CN103002280A (zh) * 2012-10-08 2013-03-27 中国矿业大学 基于hvs&roi的分布式编解码方法及系统
CN105306954A (zh) * 2014-05-30 2016-02-03 西安电子科技大学 一种基于视差最小可察觉误差模型的感知立体视频编码
CN106056062A (zh) * 2016-05-27 2016-10-26 东南大学 一种基于自适应局部特征背景模型的车辆检测方法
CN106897984A (zh) * 2017-01-05 2017-06-27 浙江大学 一种面向静态相机的非线性背景模型更新方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020031277A1 (en) * 1997-04-04 2002-03-14 Jeffrey Lubin Method and apparatus for assessing the visibility of differences between two signal sequences
US20110033130A1 (en) * 2009-08-10 2011-02-10 Eunice Poon Systems And Methods For Motion Blur Reduction
CN103002280A (zh) * 2012-10-08 2013-03-27 中国矿业大学 基于hvs&roi的分布式编解码方法及系统
CN105306954A (zh) * 2014-05-30 2016-02-03 西安电子科技大学 一种基于视差最小可察觉误差模型的感知立体视频编码
CN106056062A (zh) * 2016-05-27 2016-10-26 东南大学 一种基于自适应局部特征背景模型的车辆检测方法
CN106897984A (zh) * 2017-01-05 2017-06-27 浙江大学 一种面向静态相机的非线性背景模型更新方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113296984A (zh) * 2021-06-15 2021-08-24 杭州朗和科技有限公司 兼容性参数确定方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110505480B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN110363716B (zh) 一种基于条件生成对抗网络复合降质图像高质量重建方法
Zhou et al. AGLNet: Towards real-time semantic segmentation of self-driving images via attention-guided lightweight network
CN112347859B (zh) 一种光学遥感图像显著性目标检测方法
CN110300977A (zh) 用于图像处理和视频压缩的方法
CN111798400A (zh) 基于生成对抗网络的无参考低光照图像增强方法及系统
CN110517329A (zh) 一种基于语义分析的深度学习图像压缩方法
CN101567964B (zh) 一种低码率视频应用中的预处理降噪去块效应方法
CN104954791A (zh) 矿井无线分布式视频编码中的关键帧实时选取方法
CN101184221A (zh) 基于视觉关注度的视频编码方法
CN110852964A (zh) 一种基于深度学习的图像比特增强方法
CN110992414B (zh) 一种基于卷积神经网络的室内单目场景深度估计的方法
CN105046664A (zh) 一种基于自适应epll算法的图像去噪方法
CN103826125B (zh) 用于已压缩监控视频的浓缩分析方法和装置
CN112597815A (zh) 一种基于Group-G0模型的合成孔径雷达图像舰船检测方法
CN102457724B (zh) 一种图像运动检测系统及方法
CN108347612A (zh) 一种基于视觉注意机制的监控视频压缩与重构方法
CN110443784A (zh) 一种有效的显著性预测模型方法
CN112040222A (zh) 一种视觉显著性预测方法及设备
CN104700405A (zh) 一种前景检测方法和系统
CN107027051A (zh) 一种基于线性动态系统的视频关键帧提取方法
CN116205962A (zh) 基于完整上下文信息的单目深度估计方法及系统
CN115131229A (zh) 图像降噪、滤波数据处理方法、装置和计算机设备
CN110505480A (zh) 一种面向监控场景的快速感知视频编码方法
CN114119694A (zh) 一种基于改进U-Net的自监督单目深度估计算法
CN117541505A (zh) 基于跨层注意力特征交互和多尺度通道注意力的去雾方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant