WO2016095696A1

WO2016095696A1 - 一种基于视频大纲的监控视频可伸缩编码方法

Info

Publication number: WO2016095696A1
Application number: PCT/CN2015/095913
Authority: WO
Inventors: 彭力
Original assignee: 江南大学
Priority date: 2014-12-15
Filing date: 2015-11-30
Publication date: 2016-06-23
Also published as: CN105898313A

Abstract

公开了一种基于视频大纲的监控视频可伸缩编码方法，对待编码的监控视频使用基于细节保留的视频大纲编码方法进行大纲分析，对主要的运动对象和背景图片提取、映射和重建，生成一个大纲视频，得到运动对象区域信息和运动对象映射信息；基于对象区域信息确定视频编码中的ROI区域，基于对象映射信息确定视频编码中的条带类型；然后对原始监控视频进行基于ROI的可伸缩视频编码，同时将运动对象标志位和运动区域标志位进行编码并合并为对象标志位；生成含有对象标志位的可伸缩码流，以实现监控视频码流的可伸缩传输和可伸缩浏览。

Description

[根据细则37.2由ISA制定的发明名称]　一种基于视频大纲的监控视频可伸缩编码方法

技术领域

本发明涉及视频信息压缩技术。

背景技术

目前国内外已经出现了车载带多路视频监控的控制终端，但多数只是监视，不能主动对车内外异常行为状况主动分析报警，比如司机打瞌睡、老人小孩孕妇摔倒等，通过架设在大巴车上的摄像头快速采集图像视频信息，能够进行关键帧提取、运动目标分析、视频信息压缩、图像融合重构，最终可以对车内、行李舱等关键部位进行定位和跟踪，利用人工智能技术，可以识别上车人数、乘客性别和大致年龄，进而更好地管理和控制车内一切情况。

随着视频应用的广泛普及，监控视频数量和清晰度的大幅增加造成的海量数据使得其浏览和存储成为非常棘手的问题。一方面，完整浏览长达几天的视频会耗费大量时间和人力，快进又容易导致重要信息的遗漏；另一方面，监控视频的大部分帧中并没有运动对象，很多浏览时间会被白白浪费，即使出现了运动对象，也往往分布非常稀疏，每帧的画面空间存在很大冗余。因此，视频的时空域冗余没有得到合理消除，视频编码的目标也由单纯追求高压缩率转向了适应更加多元化的网络带宽和不同终端的处理显示能力。可伸缩编码是一种可以很好适应终端多样性和网络动态异构性问题的方案，只需要对高质量视频源进行一次编码，得到最高层视频流，从该码流中提取特定的部分作为基本质量码流，当终端不支持高层码流或者网络拥堵时，就可以只传输基本质量码流到终端。现有的视频大纲技术无法对监控视频的大纲信息进行可伸缩浏览，对关键部分保真度的保护也不尽人意。因此，探索新的基于视频大纲技术的视频信息的可伸缩编码技术，并将其应用到车载智能监控系统中，具有重要的理论意义和应用价值。

发明内容

本发明主要目的是通过图像视频技术解决大巴车突发事件的检测识别和报警。关键任务是要提出一种实用的视频大纲技术，通过对完整视频的分析，对主要的运动对象和背景图片提取、映射和重建，生成一个大纲视频并尽最大可能保留原始信息。一方面，由于大纲视频去除了原始视频的时空域冗余，长度大大缩短，因此减轻了编码、传输和存储负担。另一方面，大纲视频保留了原始视频的主要运动信息，可以方便的对视频进行快速浏览和检索面对日益增长的海量视频数据，视频大纲技术如何在有限的存储空间内尽可能提高关键细节的保真度、如何满足用户越来越灵活的查询浏览需求、如何提高编解码的效率、如何进一步降低存储空间和传输网络的压力，这些问题已成为多媒体领域的热点问题，具有深远的研究意义和广泛的应用前景。

在对传统视频大纲技术、传统可伸缩视频编码技术和基于ROI的可伸缩视频编码技术的研究与分析的基础上，提出一种新的基于视频大纲的监控视频可伸缩编码技术。它是一种基于细节保留的视频大纲技术，对原始视频的关键部分和非关键部分采用不同的浓缩强度，并且相应地更新视频大纲中代价函数的计算方法，这样将有益于在相同存储代价下最大可能地表现关键信息，有望大幅提高图像压缩效率，整体监控视频压缩结构见图1。

如何在相同存储代价下最大可能地表现关键信息，大幅提高图像压缩效率这是项目的主要解决的难题。目前视频压缩方法计算量大、运算时间长、稳定性与特征提取性能差，不能满足车载运行时的可靠性、快速实时性要求。改变时空域映射关系可以获得更高压缩程度的浓缩视频。但是一段浓缩视频的长度一旦确定，大纲视频不可避免的会存在很多运动轨迹的断裂和细节丢失，其中不乏一些能够表现进入，走出，相遇等关键信息的时间细节，这种情况在很大程度上影响了大纲视频还原原始视频信息的能力。如何将细节考虑进去，提高压缩效率也是一个重要问题。

整个方案的编码流程如下：首先对待编码的监控视频用基于细节保留的视频大纲技术进行大纲分析，得到运动对象区域信息和运动对象映射信息；基于对象区域信息确定视频编码中的ROI区域，基于对象映射信息确定视频编码中的条带类型，本发明将映射到初始大纲视频中的运动对象及其背景编码为P slice，将初始化没映射到大纲视频中的运动对象及其背景编码为B slice；然后基于该编码方案对原始监控视频进行基于ROI的可伸缩视频编码，同时将运动对象标志位和运动区域标志位进行编码并合并为对象标志位；最终生成含有对象标志位的可伸缩码流，从而实现监控视频码流的可伸缩传输和可伸缩浏览，结构见图2。

基于运动对象的视频大纲最大的优势就是运动对象本身及其运动轨迹被作为一个完整的单元进行监测、分析和显示，因此运动对象提取的实时性、完整性和准确性是系统实现的关键。光流法、帧差法、背景消减法都曾被作为对象提取方法应用于视频大纲系统，但是综合考虑算法复杂度、提取精确度和完整性，本发明折中选择基于像素点的混合高斯模型背景建模方法提取。

运动对象跟踪是确定轨迹，行为分析和确定映射函数的基础。近年来常见的方法有由Fukunag提出的均值飘移和Gordon et al提出的粒子滤波器，其中Mean Shift属于确定性算法，计算复杂度低；粒子滤波器属于统计性算法，准确性高。但是考虑监控视频大纲分析对实时性的要求，本发明采用算法复杂度较低的Mean Shift算法。

基于视频压缩，本发明提出了一种基于细节保留的视频大纲技术，结构见图3。其核心思想是找到基于对象的关键细节进行处理和标记，然后引入细节代价和非细节代价代替原有的运动损失，来对传统代价函数进行更新，经模拟退火算法得到新代价函数的最小值。在本方法中，运动代价中细节代价和非细节代价的划分能够对关键细节进行有重点的保留，而对关键帧的滑动窗口处理技术则能很好的解决大纲视频中运动轨迹断裂等突变性问题。

附图说明

图1是可伸缩视频大纲框架。

图2是质量可伸缩编码框架。

图3是基于细节保留的监控视频可伸缩编码结构图。

Claims

本发明特征是要提出一种实用的视频大纲技术，通过对完整视频的分析，对主要的运动对象和背景图片提取、映射和重建，生成一个大纲视频并尽最大可能保留原始信息。
在对传统视频大纲技术、传统可伸缩视频编码技术和基于ROI的可伸缩视频编码技术的研究与分析的基础上，提出一种新的基于视频大纲的监控视频可伸缩编码技术。它是一种基于细节保留的视频大纲技术，对原始视频的关键部分和非关键部分采用不同的浓缩强度，并且相应地更新视频大纲中代价函数的计算方法，这样将有益于在相同存储代价下最大可能地表现关键信息，有望大幅提高图像压缩效率。
本发明其核心思想是找到基于对象的关键细节进行处理和标记，然后引入细节代价和非细节代价代替原有的运动损失，来对传统代价函数进行更新，经模拟退火算法得到新代价函数的最小值。在本方法中，运动代价中细节代价和非细节代价的划分能够对关键细节进行有重点的保留，而对关键帧的滑动窗口处理技术则能很好的解决大纲视频中运动轨迹断裂等突变性问题。