WO2016173277A1

WO2016173277A1 - 视频编码方法、解码方法及其装置

Info

Publication number: WO2016173277A1
Application number: PCT/CN2015/098060
Authority: WO
Inventors: 郭斌; 蔡巍伟
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2015-04-30
Filing date: 2015-12-21
Publication date: 2016-11-03
Also published as: EP3291558A1; WO2016173277A9; EP3291558A4; EP3291558B1; US10638142B2; CN106210612A; US20180131950A1

Abstract

本申请提供了一种视频编码方法、解码方法及其装置，该视频编码装置包括：视频采集单元，其用于采集视频图像；处理单元，其用于对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；数据传输单元，其用于传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。在运动目标的数量较多或尺寸较大的情况下，能够有效地降低视频数据量，缓解传输时网络带宽的限制。

Description

视频编码方法、解码方法及其装置

本申请要求于2015年4月30日提交中国专利局、申请号为201510216640.0发明名称为“视频编码方法、解码方法及其装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频监控领域，尤其涉及一种视频编码方法、解码方法及其装置。

背景技术

随着多媒体信息技术的不断发展，视频信息大量涌现，视频数据作为一种表达信息的综合媒体，已成为我们现实生活中一个重要的信息载体。

以监控采像设备为例，其所采集的图像越清晰则所产生的视频数据就越多，若不对这些视频数据进行任何处理，就传输这些视频数据则需要占用大量的网络带宽，并且存储这些视频数据所需的存储空间也就越大，这样，无论是进行网络传输还是进行数据存储，所耗费的成本都很高。因此在现有技术中，提出了如下这种方法，该方法通过对视频数据进行压缩编码，然后将压缩编码后的视频文件进行传输，进而降低视频数据传输时所占用的网络带宽，减小成本。

虽然，此方法在一定程度上减小了传输时所占用的网络带宽，然而，由于这种方法仍然采用传统的视频编码方法对视频数据整体进行编码，然后将编码后的数据传输出去，因此在视频图像的运动目标的数量较多，尺寸较大时仍然会占用较大的网络带宽。

因此，亟需提出一种方案，在运动目标的数量较多或尺寸较大的情况下，能够有效地降低视频数据量，缓解传输时网络带宽的限制。

发明内容

本申请所要解决的技术问题之一是需要提供一种视频编码装置，其在运动目标的数量较多或尺寸较大的情况下，能够有效地降低视频数据量，缓解传输时网络带宽的限制。

为了解决上述技术问题，本申请的实施例首先提供了一种视频编码装置，包括：视频采集单元，其用于采集视频图像；处理单元，其用于对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；数据传输单元，其用于传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。

在一个实施例中，所述处理单元还用于对视频图像进行背景建模，并基于建立的背景模型来检测所述前景运动目标，以分离当前帧视频图像中的背景图像和前景运动目标。

在一个实施例中，所述数据传输单元间隔设定时间段传输对应背景图像的视频压缩数据，并实时传输对应前景运动目标的前景目标元数据。

在一个实施例中，所述处理单元在对所述视频图像中的前景运动目标进行结构化处理时，采用的结构化算法包括不设定目标类型的结构化算法和设定类型目标的结构化算法。

根据本申请另一方面，还提供了一种视频解码装置，包括：数据接收单元，其用于接收视频压缩数据和前景目标元数据；处理单元，其用于对视频压缩数据进行解码，对前景目标元数据进行解读。

在一个实施例中，还包括：存储单元，其用于存储图像，所述处理单元进一步根据所述前景目标元数据的信息从所述存储单元中选择对应的前景目标图像作为前景运动目标，实现对前景目标元数据的解读。

在一个实施例中，所述处理单元，根据所述前景目标元数据的信息，利用显示绘图技术在解码后的背景图像上叠加绘制所述前景目标元数据所描述的前景运动目标，实现对前景目标元数据的解读。

在一个实施例中，还包括：视频显示单元，其用于对解码后得到的背景图像和解读后的前景运动目标进行合成显示。

根据本申请另一方面，还提供了一种视频传输显示系统，包括：如上所述的视频编码装置，以及如上所述的视频解码装置。

根据本申请另一方面，还提供了一种视频编码方法，包括：采集待传输的视频图像；对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。

在一个实施例中，还包括：对视频图像进行背景建模，并基于建立的背景模型来检测所述前景运动目标，以分离当前帧视频图像中的背景图像和前景运动目标。

在一个实施例中，间隔设定时间段传输对应背景图像的视频压缩数据，并实时传输对应前景运动目标的前景目标元数据。

在一个实施例中，在对所述视频图像中的前景运动目标进行结构化处理时，采用的结构化算法包括目标类型的结构化算法和设定类型目标的结构化算法。

根据本申请另一方面，还提供了一种视频解码方法，包括：接收视频压缩数据和前景目标元数据；对视频压缩数据进行解码，对前景目标元数据进行解读；对解码后得到的背景图像和解读后的前景运动目标进行合成显示。

在一个实施例中，在对解码后得到的背景图像和解读后的前景运动目标进行合成显示的步骤中，进一步包括：根据所述前景目标元数据的信息从预先存储的图像中选择对应的前景目标图像作为前景运动目标，将该前景目标图像与解码后的背景图像进行合成显示。

在一个实施例中，在对解码后得到的背景图像和解读后的前景运动目标进行合成显示的步骤中，进一步包括：根据所述前景目标元数据的信息，利用显示绘图技术在解码后的背景图像上叠加绘制所述前景目标元数据所描述的前景运动目标。

根据本申请另一方面，还提供了一种用于高速公路的视频编码方法，包括：采集高速公路上的视频图像；根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。

在一个实施例中，所述前景目标元数据至少包括：车辆类型、车辆颜色、车辆品牌、车辆型号、车牌号、前景目标在该帧视频图像中的位置、该帧视频图像的时间。

根据本申请另一方面，还提供了一种用于高速公路的视频解码方法，包括：解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。

在一个实施例中，在对前景目标元数据进行解读得到前景图像的步骤中，包括：根据所述前景目标元数据的信息选择对应的前景目标图像作为前景运动目标，或者，根据所述前景目标元数据的信息，利用显示绘图技术在解码后的背景图像上叠加绘制所述前景目标元数据所描述的前景运动目标。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种视频编码方法。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种视频解码方法。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种用于高速公路的视频编码方法。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种用于高速公路的视频解码方法。

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种视频编码方法。

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种视频解码方法。

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种用于高速公路的视频编码方法。

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种用于高速公路的视频解码方法。

为解决上述技术问题，本申请实施例还提供了一种编码设备，所述编码设备包括：处理器、存储器、通信接口和总线；

所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于：

采集待传输的视频图像；对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。

为解决上述技术问题，本申请实施例还提供了一种解码设备，所述解码设备包括：处理器、存储器、通信接口和总线；

所述存储器存储可执行程序代码；

接收视频压缩数据和前景目标元数据；对视频压缩数据进行解码，对前景目标元数据进行解读；对解码后得到的背景图像和解读后的前景运动目标进行合成显示。

所述存储器存储可执行程序代码；

采集高速公路上的视频图像；根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。

所述存储器存储可执行程序代码；

解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。

与现有技术相比，上述方案中的一个或多个实施例可以具有如下优点或有益效果。

本申请的方法是一种基于前景运动目标(或称前景目标)结构化的视频传输方法，其主要应用在对固定场景以及场景中的整体状况进行视频监控的情况中，例如监控高速公路的道路流量情况。通过对视频图像中的背景进行压缩编码，并对前景目标进行结构化处理，然后将处理后的视频压缩数据和元数据进行传输，进而能够有效降低数据流量，节省网络带宽等。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请的技术方案而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构和/或流程来实现和获得。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的视频编码装置的结构示意图；

图2为本申请实施例的视频编码方法的流程示意图；

图3为本申请实施例的进行前景检测处理的流程示意图；

图4为本申请实施例的进行图块标记处理的流程示意图；

图5为本申请实施例的进行大小归一化处理的流程示意图；

图6为本申请实施例的轮廓扫描线示意图；

图7为本申请实施例的视频解码装置的结构示意图；

图8(a)-(c)为对一视频图像进行合成的说明图；

图9为本申请实施例的视频解码方法的流程示意图；

图10(a)-(f)为对一视频图像进行传输和显示的说明图。

具体实施方式

以下将结合附图及实施例来详细说明本申请的实施方式，借此对本申请如何应用技术手段来解决技术问题，并达成相应技术效果的实现过程能充分理解并据以实施。本申请实施例以及实施例中的各个特征，在不相冲突前提下可以相互结合，所形成的技术方案均在本申请的保护范围之内。

另外，附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

下面对本申请所涉及到的用语进行说明。“背景”是指视频图像中相对于运动前景在一定时间内保持稳定的像素区域。“前景”是指视频图像中相对于运动背景发生了一定变化的像素区域。“结构化”是指将离散的数字图像阵列，通过视频内容分析处理提取其中存在的语义信息(如：针对一帧图像的结构化描述，“图像中有一辆红色的轿车”)。“元数据”是指存储了视频结构化信息的数据。

在本申请实施例中，所传输的视频数据可以是视频、静态图像或动画，或上述数据的组合，不做限定。

本申请的视频传输方法是一种基于前景运动目标结构化的视频传输方法，其主要应用在对固定场景以及场景中的整体状况进行视频监控的情况中，例如监控高速公路的道路流量情况。通过对视频图像中的背景图像进行压缩编码，并对前景目标进行结构化处理，然后将处理后得到的视频压缩编码和元数据进行传输，进而能够有效降低数据流量，节省网络带宽等。

(实施例一)

图1为本申请实施例的视频编码装置的结构示意图。本实施例的视频编码装置101可以将视频数据通过有线或无线的方式传输出去。

该装置101包括：视频采集单元101a、处理单元101b和数据传输单元101c。视频采集单元101a用于采集待传输的视频图像。处理单元101b对待传输的视频图像中的背景图像进行压缩编码得到视频压缩数据，并对该视频图像中的前景运动目标(或称前景目标)进行结构化处理得到前景目标元数据。数据传输单元101c传输视频压缩数据和前景目标元数据。

视频采集单元101a例如可以为视频采集卡，其主要是将视频监控装置例如模拟摄像机、录像机等输出的模拟视频通过模数转换器转换成二进制数字信息，以作为可编辑处理的数字视频文件保存下来。

为了对视频图像中的背景图像和前景目标分别进行处理，处理单元101b对视频图像进行背景建模，并基于建立的背景模型来检测前景运动目标，以分离当前帧视频图像中的背景图像和前景目标。

需要说明的是，背景与前景都是相对的概念，以高速公路为例，在人们关注高速公路上来来往往的汽车时，则这些车辆是前景，而路面以及周围的环境是背景；在人们关注闯入高速公路的行人时，则闯入者是前景，而包括汽车之类的其他东西又成了背景。

而且，检测前景目标是进行目标分析的基础，前景目标检测的常用方法是背景相减法，而背景相减法的关键是如何从视频序列中建立背景模型。针对不同的应用环境，已提出多种背景建模方法，常用的如基于单高斯模型的方法、基于混合高斯模型的方法、基于统计的背景建模方法、基于码本的建模方法等。

在本实施例中，处理单元101b优选使用基于码本的建模方法，它建模的基本思想是，先根据视频序列产生最初的码本，借助码字中的一个参数“最长未出现时间”进行时域滤波处理。这样做的目的是滤除码本中可能代表前景图像的那些码字。最后再经过空域滤波，将上一步错误删除的代表较少出现的背景状态的码字恢复到码本中，通过上述方法即可建立背景模型。

在处理单元101b建立好背景模型后，基于背景模型进行前景运动目标检测，即从当前帧视频图像中将运动的前景目标从背景图像中提取出来。

由于在本实施例中视频监控装置，例如模拟摄像机在整个监视过程中不发生移动，因此优选地处理单元101b采用背景差分法来检测前景目标。具体地，处理单元101b将当前帧视频图像与背景模型相减，如果像素插值大于某一阈值，则判断此像素属于前景运动目标，否则属于背景图像。利用当前帧视频图像与背景模型的差分来检测运动区域，一般能够提供比较完整的特征数据，而且这种方法操作简单，在固定背景下能够完整、精确地分割出运动目标。

容易理解，对于摄像机在监视过程中发生了移动，如平动、旋转或多自由度运动等的情况下，则可采用动态背景下的运动目标检测方法，例如匹配法、光流法或全局运动估计法等，在此不再赘述。

一般情况下，得到的前景目标会包含很多噪声，因此处理单元101b还可以通过对前景图像进行开运算及闭运算，然后再丢弃比较小的轮廓，进而消除噪声。处理单元101b通过上述操作就能够将当前帧视频图像的背景图像和前景目标很好地分割开。在此之后，处理单元101b对视频中的背景图像进行压缩编码，并对视频中的前景目标进行结构化处理。

关于对背景图像进行压缩编码的方法可以采用哈夫曼编码、预测编码、变换编码等，由于现有技术较为成熟，因而在此不再赘述。通过对背景图像进行压缩编码能够去除多余数据减少表示数字图像时需要的数据量，便于图像的存储和传输，减小了存储空间和传输带宽。

另一方面，处理单元101b还需要对视频中的前景目标进行结构化处理得到前景目标元数据。

需要说明的是，元数据并非是大量的视频数据，而是对视频中的前景目标进行语义化描述的信息。比如前景运动目标是道路上的一辆轿车，对此目标进行结构化获得的元数据可以如下表所示。

需要说明的是，对前景目标能进行什么程度的结构化，获得多少元数据，取决于视频环境，视频分辨率，清晰度，结构化分析的算法等多方面因素。对视频进行结构化的算法本身、以及元数据的具体定义并非本方案关注的重点，可以使用任何能获取上述类型元数据的结构化算法。

在处理单元101b对背景图像进行压缩编码处理的基础上，又对相比背景图像来说数据量较大的前景运动目标进行了结构化处理，这样，由于处理得到的元数据并非视频数据，而是结构化的语义信息，可以用文本或者设计数据结构以二进制数据的方式进行传输，因此相比现有的使用视频编码技术来压缩整个视频图像说，数据量被大大的降低，能够进一步降低网络带宽的消耗。

视频传输装置101的数据传输单元101c对视频压缩数据和前景目标元数据进行传输。在传输模式上可以将上述压缩编码后的视频压缩数据和结构化的前景目标元数据混合成新的视频数据，然后通过无线或有线的方式将新的视频数据传输出去。或者，数据传输单元101c通过无线或有线的方式直接将上述压缩编码后的视频压缩数据和结构化的前景目标元数据作为独立的两种数据分别进行传输。

需要说明的是，在传输模式为第二种时，即作为独立数据分别传输时，由于本实施例的视频场景固定不变，因此视频压缩数据只需要传输一次或者隔设定时间段传输一次即可。而前景运动目标在不同的帧图像中或多或少都会存在差异，因此前景目标元数据需要被实时进行传输。由于不需要实时对每帧视频图像的背景图像进行压缩编码和传输，因此不仅降低了处理单元的数据处理负担，还能够降低数据传输所占用的网络资源。

另外，本实施例的视频传输装置101还可以包括存储单元，该存储单元对背景视频压缩数据和前景目标元数据进行存储，待需要传输时，数据传输单元101c从该存储单元取出即可。此处不对该存储单元的具体类型进行限定。

图2示出了本申请实施例的视频编码方法的流程，该方法可以在上述装置中执行，方法包括如下步骤。

在步骤S210中，视频采集单元101a采集待传输的视频图像。

在步骤S220中，处理单元101b对待传输的视频图像中的背景图像进行压缩编码得到视频压缩数据，并对该视频图像中的前景运动目标(或称前景目标)进行结构化处理得到前景目标元数据。

下面以不设定目标类型的结构化算法为例，详细说明处理单元101b获得目标类型的元数据的处理流程。

首先，处理单元101b进行前景检测。

前景检测是指确定当前输入图像中的前景点(背景中发生运动的像素点)，要确定像素点是否存在运动，需要计算当前输入像素点与背景图像像素点之间的差异，当差异超过设定的范围以后，则认为该点为前景点。

具体地，设当前像素点为X，则：

x表示像素点X的像素值，b(x)表示像素点X对应背景图像的像素值，T表示设定阈值，若结果为1则表示该像素点X为前景点。

通过判断输入图像中每个像素点与其对应的背景像素之间的差异，我们可以确定输入图像中哪些点属于前景点，哪些点属于静止不动的背景点。

背景图像是通过维护一个结合多种图像信息的背景模型来获取，它可以吸收环境中的光照变化，可以滤除例如雨雪等带来的干扰。前景检测结果如图3所示，其中前景图中白色点表示前景点，黑色点表示背景点。

然后，处理单元101b进行前景点团块标记处理。

前景检测环节只能确定输入图像中像素点是否为前景点(运动点)，并未定义各个前景点的归属。通常运动目标所对应的前景点在空间上是连续的，在图像中表现为一个前景团块，这些团块的轮廓通常是闭合的。团块标记可以看作是一个轮廓搜索以及轮廓跟踪的过程，每一个团块对应一个唯一的轮廓，通过寻找这些轮廓可以标记前景图像中的各个前景团块。团块标记结果如图4所示，得到了团块1～5这五个团块。

接下来，处理单元101b进行目标跟踪及提取处理。

在实际应用中，不是所有的前景团块都为智能视频分析所关注的运动目标。在很多情况下，监控场景中的背景扰动都在前景检测输出中生成前景团块，如果不把这一部分虚假目标过滤，将会产生大量的虚假告警信息。判断一个前景团块是否为真实的运动目标，通常可以按照如下方式进行。

对生成的前景团块进行跟踪，记录团块的运动轨迹。如果团块对应的是一个真实的运动目标，则应满足：

1、轨迹的长度应符合要求，过短的轨迹表示它是背景中短时扰动。

2、团块的运动轨迹应符合正常运动目标的运动特性，轨迹应是规律的，而不应是杂乱的。

3、团块的运动速度不应过大。

在对前景团块进行干扰过滤后，开始对它进行目标跟踪，跟踪前需对目标进行初始化，初始化步骤包括如下：

保存团块的前15帧轨迹信息(目标在各个时间点中的位置信息)，更新目标对应的Kalman滤波器。

统计团块在当前图像区域内的YUV彩色直方图，保存该直方图为目标的特征模板。

通过团块检测及轨迹分析，我们在视频图像中定义了运动目标，目标跟踪的目的是为了建立目标在时序上的位置对应关系(轨迹)。确定目标在当前图像中的位置的过程描述如下：

利用目标对应的kalman滤波器，进行目标的运动位置预测。Kalman滤波器中保存了目标的速度，方向信息，可以预测目标在下一时刻的运动位置：

state_post＝T×state_pre

state_post表示当前预测位置，T表示kalman转换矩阵，

state_pre表示kalman滤波器上一时刻目标坐标，速度，加速度修正值

在目标的预测位置上，进行Mean Shift目标跟踪。在Mean Shift跟踪的最终位置上，搜索前景团块。如果该位置不存在前景团块，则跟踪失败。如果存在前景团块，则用该团块的大小及中心点位置作为目标跟踪的结果。

利用目标跟踪的结果位置信息修正kalman滤波器各参数及state_pre。统计目标当前所处范围内的YUV彩色直方图，利用它对目标特征模板进行更新，更新目标的大小。

在跟踪的结果位置上，在目标大小限定的范围内，提取前景图像，它代表目标的位置及形状信息。

其中YUV彩色直方图表示的是图像中各YUV值在图像中出现的概率，假设有YUV值(y，u，v)，则它在图像中出现的概率P(y，u，v)为：

其中

YUV(x，y)表示图像在位置(x，y)上的YUV值

M与N分别表示图像的高度与宽度

表示图像中各YUV值概率一共需要256x256x256＝16777216个存储位置，需要大量的存储空间。考虑到YUV空间中各个分量的独立性，在这里我们对彩色直方图进行一个近似的描述：

P(y，u，v)＝P(y)*P(u)*P(v)

其中

U(x，y)表示图像在位置(x，y)上的U分量值

其中

V(x，y)表示图像在位置(x，y)上的V分量值

M与N分别表示图像的高度与宽度

由此我们对彩色直方图进行了压缩，描述一个彩色直方图只需要256+256+256＝768个存储位置。目标的颜色直方图是利用联合概率分布计算得到的压缩直方图，比传统的颜色直方图占用更少的内存空间，运算过程中涉及的数据量大大降低。

接着，处理单元101b进行目标的大小归一化处理。

经过目标提取以及跟踪后得到的运动目标，大小会存在较大的差异，我们需要对目标进行大小归一化处理，将目标图像统一宽40像素，高40像素的目标模板。图像缩放过程中，为保留目标的宽高比例，采用一种特殊的缩放方法：根据目标的宽高比例，宽度与高度方向分别采用不同的缩放因子，保证大小归一化前后目标宽高比例的一致性。假设当前有目标，宽高分别为w，h，按照以下方式进行大小归一化处理：

scale_w＝40/w

if(w＞h)

scale_h＝40/w

scale_w＝40/h

if(w＜＝h)

scale_h＝40/h

scale_w，scale_h分别表示宽度与高度方向上的缩放比例

经过大小归一化处理后的结果可参见图5。

接下来，处理单元101b进行目标的轮廓特征提取处理。

从大小归一化的目标外接矩形框左上角开始，沿逆时针方向，在矩形边各点做垂直于矩形边的轮廓扫描线，记录扫描线从矩形边界到目标轮廓之间的距离，将这些距离作为目标的轮廓特征值，一共可以统计40+40+40+40＝160个特征值。在实际应用中，为减少特征数据的数量，可以每4个点保存一个特征值(4根轮廓扫描线长度的平均值)。这样不仅可以大大地减少数据量，而且可以滤除一些图像噪声点与特征数据的影响。图6为轮廓扫描线示意图，白线表示目标外接矩形框对应点的轮廓扫描线。

最后，处理单元101b利用SVM分类器进行分类运算。

将提取的轮廓特征进行数值归一化处理，将各特征值缩放至0-1之间，将特征值输入到实现训练好的SVM分类器进行分类运算，根据分类器输出的结果确定目标的类型。

需要说明的，除了上述的不设定目标类型结构化算法以外，根据具体的应用还包括如下设定类型目标的结构化算法：车辆目标结构化算法(包括车牌号码识别、车身颜色分类、车辆子品牌识别等)，人员目标结构化算法(包括身高、年龄段、性别、是否戴眼镜、衣着颜色等)，运动目标结构化算法(包括目标类型、运动速度、运动方向、位置等结构化算法)。

在步骤S230中，数据传输单元101c传输视频压缩数据和前景目标元数据。

综上所述，本实施例的视频传输装置101在对视频图像传输之前，分别对图像中的背景图像和前景运动目标进行处理，即对背景图像进行压缩编码得到视频压缩数据，对前景运动目标进行结构化处理得到前景目标元数据。由于元数据并非视频数据，而是结构化的语义信息，可以用文本或者设计数据结构以二进制数据的方式进行传输，因此能够大大的降低视频数据量，进一步的降低网络带宽的消耗。

(实施例二)

图7为本申请实施例的视频解码装置的结构示意图。本实施例的视频解码装置201可以将视频压缩数据和前景目标元数据进行解码和图像显示。

该装置201包括：视频显示单元201a、处理单元201b和数据接收单元201c。数据接收单元201c通过有线或无线的方式来接收来自数据传输单元101c传输的视频压缩数据和前景目标元数据。处理单元201b对视频压缩数据进行解码，对前景目标元数据进行解读。视频显示单元201a对解码后得到的背景图像和解读后的前景运动目标进行合成显示。

处理单元201b对背景视频数据进行解码得到背景图像，视频显示单元201a对解码得到的背景图像进行显示。需要说明的是，处理单元201b所使用的解码方法与对背景图像进行编码的方法相对应，具体涉及的解码过程和解码算法在此不再赘述。

处理单元201b对前景目标元数据进行解读得到前景图像。对于处理单元201b如何解读前景目标元数据，本实施例给出以下两种方法。

在方法1中，该装置201还包括存储单元201d，该存储单元201d事先预存各种类型的前景目标图片，例如，若监控高速公路上的车辆，那么存储单元201d中可以存储大量不同颜色、不同型号、不同品牌的车辆的图片。在处理单元201b对接收到的前景目标元数据进行解读分析时，根据元数据中提供的信息，可以从该存储单元201d的预存图片中找出符合或最接近元数据描述的前景目标图片，将该前景目标图片作为前景运动目标。视频显示单元201a根据元数据描述的目标位置以及目标出现的时间，把前景目标图片叠加至已解码并显示的背景图像上，实现背景图像与前景运动目标的合成显示。

例如，图8(a)为背景图像，假设在元数据中描述了某时刻，某矩形区域，有一辆黑色小型汽车，品牌为大众，子品牌为途安，运动方向为左上45 度。根据上述元数据的描述，在预存图片中找到了对应的图片(图8(b))，其最接近元数据中所描述的运动前景。然后把该图8(b)的车辆图片叠加至背景图像，获得图8(c)所示的效果图。

虽然此种方法所获得的前景目标图片与实际前景目标存在一定差异，但是该方法能够快速地对前景目标元数据进行解读，数据处理速度较快。在运动目标无需十分清楚的情况下，例如监控汽车流量，能够很快地得到所需要的结果。

或者，在方法2中，视频显示装置201的处理单元201b对接收到的前景目标元数据进行解读，根据元数据中提供的信息，使用显示绘图技术，直接在已解码并显示的背景图像上叠加绘制元数据所描述的前景运动目标，实现背景图像和前景图像的合成显示。此种方法无需存储大量的目标图片，虽然数据处理速度相较方法1来说慢一些，但是所得到的目标图片较为精确，能够准确地恢复出原始视频图像。

在显示绘图技术中，包括了DirectDraw，Direct3D，OpenGL等技术，在实际的操作中，就如影视特效一样，是可以绘制出较为贴近真实物体的2D/3D图像。

图9示出了本申请实施例的视频解码方法的流程。该方法可以在上述装置中执行，方法包括如下步骤。

在步骤S410中，数据接收单元201c接收视频压缩数据和前景目标元数据。

在步骤S420中，处理单元201b对视频压缩数据进行解码，对前景目标元数据进行解读。

在步骤S430中，数据传输单元201a对解码后得到的背景图像和解读后的前景运动目标进行合成显示。

(示例)

图10(a)-(f)为对一视频图像进行传输和显示的说明图。下面用该系列附图来描述如何对一视频图像进行传输和显示。

如图10(a)所示，该图像是在摄像机监控高速公路道路流量情况时所获取的一系列图像的其中一帧，监控高速公路道路流量情况主要是关注道路上有多少车，分别是什么车型等信息。该图10(a)的视频图像包含了静止场景(如树木、建筑物等)以及运动目标(例如小型客车和大型客车等)。

根据背景模型将该帧视频图像分离成仅包含静止场景的背景图像(如图10(b)的上图)以及仅包含运动目标小型客车和大型客车的前景图像(如图10(b)的下图)。

如图10(c)所示，将背景图像压缩编码成数字阵列模式的视频压缩数据。然后，分别对小型客车图像和大型客车图像进行结构化处理(参见图10(d))。在本应用场景中，前景目标元数据至少包括：车辆类型、车辆颜色、车辆品牌、车辆型号、车牌号、前景目标在该帧视频图像中的位置、该帧视频图像的时间。对于小型客车图像，结构化处理后得到的前景目标元数据为：车型：小型客车；颜色：红色；品牌：奥迪；型号：A4；车牌：xxxxx；位置：xxxxx；时间：xxxxxx。对于大型客车图像，结构化处理后得到的前景目标元数据为：车型：大型客车；颜色：红色；品牌：宇通；型号：xx；车牌：xxxxx；位置：xxxxx；时间：xxxxxx。

然后，参见图10(e)，将视频压缩数据A和前景目标元数据B+C进行混合得到带有元数据的视频数据混合流D，并将该混合流D进行传输或存储。

最后，如图10(f)所示，将带有元数据的视频数据混合流D进行解析得到视频压缩数据A和前景目标元数据B+C，然后对视频压缩数据B进行解码得到背景图像，对前景目标元数据B+C进行解读得到前景图像，最后根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。

综上所述，本申请在对视频图像传输之前，分别对图像中的背景图像和前景运动目标进行处理，即对背景图像进行压缩编码得到视频压缩数据，对前景运动目标进行结构化处理得到前景目标元数据。由于元数据并非视频数据，而是结构化的语义信息，可以用文本或者设计数据结构以二进制数据的方式进行传输，因此能够大大的降低视频数据量，进一步的降低网络带宽的消耗。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种视频编码方法。其中，本申请所述的一种视频编码方法，包括：

采集待传输的视频图像；

对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；

传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种视频解码方法。其中，本申请所述的一种视频解码方法，包括：

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

对解码后得到的背景图像和解读后的前景运动目标进行合成显示。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种用于高速公路的视频编码方法。其中，本申请所述的一种用于高速公路的视频编码方法，包括：

采集高速公路上的视频图像；

根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；

将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；

将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。

为解决上述技术问题，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储应用程序，所述应用程序用于在运行时执行本申请所述的一种用于高速公路的视频解码方法。其中，本申请所述的一种用于高速公路的视频解码方法，包括：

解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；

对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；

根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种视频编码方法。其中，本申请所述的一种视频编码方法，包括：

采集待传输的视频图像；

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种视频解码方法。其中，本申请所述的一种视频解码方法，包括：

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种用于高速公路的视频编码方法。其中，本申请所述的一种用于高速公路的视频编码方法，包括：

采集高速公路上的视频图像；

为解决上述技术问题，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请所述的一种用于高速公路的视频解码方法。其中，本申请所述的一种用于高速公路的视频解码方法，包括：

所述存储器存储可执行程序代码；

采集待传输的视频图像；

所述存储器存储可执行程序代码；

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

所述存储器存储可执行程序代码；

采集高速公路上的视频图像；

所述存储器存储可执行程序代码；

本领域的技术人员应该明白，上述的本申请实施例所提供的计算和/或打印机的各组成部分，以及方法中的各步骤，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上。可选地，它们可以用计算装置可执行的程序代码来实现。从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

需要说明的是，在本专利的权利要求和说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然本申请所揭露的实施方式如上，但所述的内容仅为便于理解本申请技术方案而采用的实施方式，并非用以限定本申请。任何本申请所属领域内的技术人员，在不脱离本申请所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本申请的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

一种视频编码装置，包括：

视频采集单元，其用于采集视频图像；

处理单元，其用于对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；

数据传输单元，其用于传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。
根据权利要求1所述的装置，其特征在于，

所述处理单元还用于对视频图像进行背景建模，并基于建立的背景模型来检测所述前景运动目标，以分离当前帧视频图像中的背景图像和前景运动目标。
根据权利要求1所述的装置，其特征在于，

所述数据传输单元间隔设定时间段传输对应背景图像的视频压缩数据，并实时传输对应前景运动目标的前景目标元数据。
根据权利要求1-3中任一项所述的装置，其特征在于，

所述处理单元在对所述视频图像中的前景运动目标进行结构化处理时，采用的结构化算法包括不设定目标类型的结构化算法和设定类型目标的结构化算法。
一种视频解码装置，包括：

数据接收单元，其用于接收视频压缩数据和前景目标元数据；

处理单元，其用于对视频压缩数据进行解码，对前景目标元数据进行解读。
根据权利要求5所述的装置，其特征在于，还包括：

存储单元，其用于存储图像，

所述处理单元进一步根据所述前景目标元数据的信息从所述存储单元中选择对应的前景目标图像作为前景运动目标，实现对前景目标元数据的解读。
根据权利要求5所述的装置，其特征在于，

所述处理单元，根据所述前景目标元数据的信息，利用显示绘图技术在解码后的背景图像上叠加绘制所述前景目标元数据所描述的前景运动目标，实现对前景目标元数据的解读。
根据权利要求5-7中任一项所述的装置，其特征在于，还包括：

视频显示单元，其用于对解码后得到的背景图像和解读后的前景运动目标进行合成显示。
一种视频传输显示系统，包括：

如权利要求1-4中任一项所述的视频编码装置，以及

如权利要求5-8中任一项所述的视频解码装置。
一种视频编码方法，包括：

采集待传输的视频图像；

对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；

传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。
根据权利要求10所述的方法，其特征在于，还包括：

对视频图像进行背景建模，并基于建立的背景模型来检测所述前景运动目标，以分离当前帧视频图像中的背景图像和前景运动目标。
根据权利要求10所述的方法，其特征在于，

间隔设定时间段传输对应背景图像的视频压缩数据，并实时传输对应前景运动目标的前景目标元数据。
根据权利要求10-12中任一项所述的方法，其特征在于，

在对所述视频图像中的前景运动目标进行结构化处理时，采用的结构化算法包括目标类型的结构化算法和设定类型目标的结构化算法。
一种视频解码方法，包括：

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

对解码后得到的背景图像和解读后的前景运动目标进行合成显示。
根据权利要求14所述的方法，其特征在于，在对解码后得到的背景图像和解读后的前景运动目标进行合成显示的步骤中，进一步包括：

根据所述前景目标元数据的信息从预先存储的图像中选择对应的前景目标图像作为前景运动目标，将该前景目标图像与解码后的背景图像进行合成显示。
根据权利要求14所述的方法，其特征在于，在对解码后得到的背景图像和解读后的前景运动目标进行合成显示的步骤中，进一步包括：

根据所述前景目标元数据的信息，利用显示绘图技术在解码后的背景图像上叠加绘制所述前景目标元数据所描述的前景运动目标。
一种用于高速公路的视频编码方法，包括：

采集高速公路上的视频图像；

根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；

将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；

将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。
根据权利要求17所述的方法，其特征在于，

所述前景目标元数据至少包括：车辆类型、车辆颜色、车辆品牌、车辆型号、车牌号、前景目标在该帧视频图像中的位置、该帧视频图像的时间。
一种用于高速公路的视频解码方法，包括：

解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；

对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；

根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。
根据权利要求19所述的方法，其特征在于，在对前景目标元数据进行解读得到前景图像的步骤中，包括：

根据所述前景目标元数据的信息选择对应的前景目标图像作为前景运动目标，或者，

根据所述前景目标元数据的信息，利用显示绘图技术在解码后的背景图像上叠加绘制所述前景目标元数据所描述的前景运动目标。
一种存储介质，其特征在于，所述存储介质用于存储应用程序，所述应用程序用于在运行时执行以下步骤：

采集待传输的视频图像；

对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；

传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。
一种存储介质，其特征在于，所述存储介质用于存储应用程序，所述应用程序用于在运行时执行以下步骤：

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

对解码后得到的背景图像和解读后的前景运动目标进行合成显示。
一种存储介质，其特征在于，所述存储介质用于存储应用程序，所述应用程序用于在运行时执行以下步骤：

采集高速公路上的视频图像；

根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；

将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；

将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。
一种存储介质，其特征在于，所述存储介质用于存储应用程序，所述应用程序用于在运行时执行以下步骤：

解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；

对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；

根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。
一种应用程序，其特征在于，所述应用程序用于在运行时执行以下步骤：

采集待传输的视频图像；

对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；

传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。
一种应用程序，其特征在于，所述应用程序用于在运行时执行以下步骤：

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

对解码后得到的背景图像和解读后的前景运动目标进行合成显示。
一种应用程序，其特征在于，所述应用程序用于在运行时执行以下步骤：

采集高速公路上的视频图像；

根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；

将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；

将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。
一种应用程序，其特征在于，所述应用程序用于在运行时执行以下步骤：

解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；

对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；

根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。
一种编码设备，其特征在于，所述编码设备包括：处理器、存储器、通信接口和总线；

所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于：

采集待传输的视频图像；

对所述视频图像中的背景图像进行压缩编码得到视频压缩数据，以及对所述视频图像中的前景运动目标进行结构化处理得到前景目标元数据；

传输所述视频压缩数据和所述前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据。
一种解码设备，其特征在于，所述解码设备包括：处理器、存储器、通信接口和总线；

所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于：

接收视频压缩数据和前景目标元数据；

对视频压缩数据进行解码，对前景目标元数据进行解读；

对解码后得到的背景图像和解读后的前景运动目标进行合成显示。
一种编码设备，其特征在于，所述编码设备包括：处理器、存储器、通信接口和总线；

所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于：

采集高速公路上的视频图像；

根据背景模型将一帧视频图像分离成包含静止场景的背景图像以及包含运动目标车辆的前景图像；

将背景图像压缩编码成数字阵列模式的视频压缩数据，对运动目标车辆的前景图像进行结构化处理得到的前景目标元数据，其中，所述前景目标元数据是存储了视频结构化语义信息的数据；

将视频压缩数据和前景目标元数据进行混合得到带有元数据的视频数据混合流，并将该混合流进行传输。
一种解码设备，其特征在于，所述解码设备包括：处理器、存储器、通信接口和总线；

所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于：

解析带有元数据的视频数据混合流得到视频压缩数据和前景目标元数据；

对视频压缩数据进行解码得到背景图像，对前景目标元数据进行解读得到前景图像；

根据元数据中的位置信息和时间信息，将前景图像叠加到背景图像的对应位置上，进行合成显示，重新复原所采集到的视频图像。