CN103049908B

CN103049908B - 生成立体视频文件的方法和装置

Info

Publication number: CN103049908B
Application number: CN201210530758.7A
Authority: CN
Inventors: 张志辉
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2012-12-10
Filing date: 2012-12-10
Publication date: 2016-08-03
Anticipated expiration: 2032-12-10
Also published as: CN103049908A

Abstract

本发明提出一种生成立体视频文件的方法和装置，其中所述方法包括以下步骤：对视频文件进行解析以获取视频文件的多个图像帧，并在多个图像帧中选择参考图像帧；根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域；分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像；将前景图像与背景图像合成为立体图像；以及根据多个图像帧对应的多个立体图像生成立体视频文件并输出。根据本发明实施例的方法，将普通资源转化成立体资源，充分满足了用户对立体资源的需求，该方法生成的立体视频文件图像质量高，并且算法简单，易于实现，从而能够节约大量系统资源，对终端的性能要求降低，用户体验好。

Description

生成立体视频文件的方法和装置

技术领域

本发明涉及图像处理技术领域，特别涉及一种生成立体视频文件的方法和装置。

背景技术

随着三维立体技术的发展，现有的具有立体效果的资源难以满足用户越来越大的需求，因此亟需将资源丰富的传统二维普通资源转换为立体资源来解决立体资源匮乏的问题。

目前，可以通过基于深度图的三维效果合成方法或者从多张多维度图片合成一张三维效果图的方法将普通的二维资源转换为三维立体资源。但是，对于移动终端来说，无法同时从不同角度拍摄同一个场景获得多个图片，然后合成三维立体图像，而基于深度图的三维效果合成方法算法复杂，需要占用大量的系统资源，一般的移动终端也无法实现。并且，这两种方法在图像转换过程中，不区分前景区域和背景区域，合成后的立体图像质量下降，因此，现有的将普通资源转换为立体资源的方法难以在移动终端上实现，使用非常不便，且转换效果不佳。

发明内容

本发明的目的旨在至少解决上述技术缺陷之一。

为此，本发明第一个目的在于提出一种生成立体视频文件的方法，该方法生成的立体视频文件图像质量高，并且算法简单，易于实现，从而能够节约大量系统资源，对终端的性能要求降低，用户体验好。

本发明第二个目的在于提出一种生成立体视频文件的装置。

为实现上述目的，根据本发明第一方面的实施例的生成立体视频文件的方法包括以下步骤：对视频文件进行解析以获取所述视频文件的多个图像帧，并在所述多个图像帧中选择参考图像帧；根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域；分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像；将所述前景图像与所述背景图像合成为立体图像；以及根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。

根据本发明实施例的生成立体视频文件的方法，通过区分图像的前景区域和背景区域，并分别进行图像处理后合成立体图像，将普通资源转化成立体资源，充分满足了用户对立体资源的需求，该方法生成的立体视频文件图像质量高，并且算法简单，易于实现，从而能够节约大量系统资源，对终端的性能要求降低，用户体验好。

为实现上述目的，根据本发明第二方面的实施例的生成立体视频文件的装置包括：获取模块，用于对视频文件进行解析以获取所述视频文件的多个图像帧，并在所述多个图像帧中选择参考图像帧；确定模块，用于根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域；图像处理模块，用于分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像；合成模块，用于将所述前景图像与所述背景图像合成为立体图像；以及输出模块，用于根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。

根据本发明实施例的生成立体视频文件的装置，通过确定模块确定图像的前景区域和背景区域，并分别进行图像处理后合成立体图像，将普通资源转化成立体资源，充分满足了用户对立体资源的需求，该方法生成的立体视频文件图像质量高，并且算法简单，易于实现，从而能够节约大量系统资源，对终端的性能要求降低，用户体验好。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明一个实施例的生成立体视频文件的方法的流程图；

图2为根据本发明一个具体实施例的生成立体视频文件的方法的流程图；

图3为根据本发明另一个具体实施例的生成立体视频文件的方法的流程图；

图4为根据本发明一个实施例的生成立体视频文件的装置的结构框图；

图5为根据本发明一个具体实施例的生成立体视频文件的装置的结构框图；

图6为根据本发明另一个具体实施例的生成立体视频文件的装置的结构框图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

下面参考附图描述根据本发明实施例的生成立体视频文件的方法和装置。

一种生成立体视频文件的方法，包括以下步骤：对视频文件进行解析以获取视频文件的多个图像帧，并在多个图像帧中选择参考图像帧；根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域；分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像；将前景图像与背景图像合成为立体图像；以及根据多个图像帧对应的多个立体图像生成立体视频文件并输出。

图1为根据本发明一个实施例的生成立体视频文件的方法的流程图。

如图1所示，根据本发明实施例的生成立体视频文件的方法包括下述步骤。

步骤S101，对视频文件进行解析以获取视频文件的多个图像帧。

在本发明的一个实施例中，对视频文件进行解码分析，从而得到多个YUV颜色空间的图像帧，便于后续对图像进行色度和亮度进行处理。

步骤S102，在多个图像帧中选择参考图像帧。

具体地，最初可以选择第一个图像帧作为初始参考图像帧，并根据第一个图像帧对第二个图像帧进行处理以生成第二图像帧的立体图像，然后再将第二个图像帧作为新的参考图像帧，对第三个图像帧进行处理以生成立体图像，依次类推，每个图像帧生成立体图像后都将作为新的参考图像帧。

步骤S103，根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域。

其中，前景区域为相对与参考图像帧产生相对运动的区域，背景区域为相对应参考图像帧没有产生相对运动的区域。

步骤S104，分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。

具体地，可以对前景区域进行细节增强、纹理的对比度增强以及直方图均衡、边缘提取等处理，对背景区域进行滤波平滑处理，如中值滤波等。

步骤S105，将前景图像与背景图像合成为立体图像，并根据多个图像帧对应的多个立体图像生成立体视频文件并输出。

具体地，将多个图像帧对应的多个立体图像进行压缩编码生成立体视频文件并输出至终端。

图2为根据本发明一个具体实施例的生成立体视频文件的方法的流程图。

如图2所示，根据本发明实施例的生成立体视频文件的方法包括下述步骤。

步骤S201，对视频文件进行解析以获取视频文件的多个图像帧。

步骤S202，在多个图像帧中选择参考图像帧。

步骤S203，将参考图像帧之后的图像帧划分为多个预定尺寸的图像块。

具体地，首先判断参考图像帧之后的图像帧的尺寸是否为预定尺寸的整数倍，如果是，可直接将图像帧划分为多个预定尺寸的图像块，如果否，则需要将图像帧扩展为所述预定尺寸的整数倍后，再将扩展后的图像帧划分为多个预定尺寸的图像块，其中，预定尺寸可以根据图像帧的尺寸进行设定，如果图像帧的尺寸较大，则预定尺寸可设为较大的值，如果图像帧的尺寸较小，则预定尺寸可设为较小的值。

例如，如果要将图像帧划分为尺寸为多个8×8的图像块，首先判断图像帧的长和宽是否为预定尺寸8的整数倍，当图像帧的尺寸为600×200时，长和宽是预定尺寸8的整数倍，则可直接将图像帧划分为1875个图像块，当图像帧的尺寸为600×300时，长和宽不是预定尺寸8的整数倍，则需要将图像帧扩展为600×304的图像帧，再将其划分为2850个图像块。

在本发明的一个实施例中，可以使用图像帧的最右边像素点和最下边的像素点分别对图像帧进行横向扩展和纵向扩展，也可以使用图像帧的最左边像素点和最上边像素点分别对图像帧进行横向和纵向扩展。

步骤S204，分别获取每个图像块在参考图像帧上的绝对误差和最小的块。

具体地，将参考图像帧为划分多个预定尺寸的参考图像块，其中预定尺寸与参考图像帧之后的图像帧划分的图像块的尺寸相同，对于每个图像块，计算参考图像帧上的所有参考图像块与该图像块的绝对误差和，其中最小绝对误差和对应的参考图像块为该图像块在参考图像帧上的绝对误差和最小的块。

步骤S205，分别根据每个图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个图像块的运动指数。

具体地，每个图像块的运动指数T_mv可按照以下公式计算：

T_{mv} = \sqrt{{(x - x^{'})}^{2} + {(y - y^{'})}^{2}}

其中，(x,y)为每个图像块的左上角像素点的位移，(x',y')为每个图像块相应的绝对误差和最小的块的左上角像素点的位移。

步骤S206，分别判断每个图像块的运动指数是否小于预定阈值。

其中，预定阈值可由系统设定，预定阈值的设定会影响图像背景区域和前景区域的确定，预定阈值越小，背景区域相对越小，前景区域相对越大，反之，背景区域相对越大，前景区域相对越小。

步骤S207，如果小于预定阈值，则确定相应的图像块为背景块。

步骤S208，如果不小于预定阈值，则确定相应的图像块为前景块。

步骤S209，将相邻的前景块连接为前景区域，和/或将相邻的背景块连接为背景区域。

步骤S210，分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。

步骤S211，将前景图像与背景图像合成为立体图像，并根据多个图像帧对应的多个立体图像生成立体视频文件并输出。

根据本发明实施例的生成立体视频文件的方法，通过将图像帧划分为多个图像块，并根据每个图像块的运动指数来确定前景区域和背景区域的范围，提高了前景区域和背景区域的区分度，从而提高了生成的立体图像的质量，提升用户体验。

图3为根据本发明另一个具体实施例的生成立体视频文件的方法的流程图。

如图3所示，根据本发明实施例的生成立体视频文件的方法包括下述步骤。

步骤S301，对视频文件进行解析以获取视频文件的多个图像帧。

步骤S302，在多个图像帧中选择参考图像帧。

步骤S303，将参考图像帧之后的图像帧划分为多个预定尺寸的图像块。

步骤S304，分别获取每个图像块在参考图像帧上的绝对误差和最小的块。

步骤S305，分别根据每个图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个图像块的运动指数。

具体地，每个图像块的运动指数T_mv可按照以下公式计算：

T_{mv} = \sqrt{{(x - x^{'})}^{2} + {(y - y^{'})}^{2}}

其中，(x,y)为每个图像块的左上角像素点的位移，(x',y′)为每个图像块相应的绝对误差和最小的块的左上角像素点的位移。

步骤S306，分别判断每个图像块的运动指数是否小于预定阈值。

步骤S307，如果小于预定阈值，则确定相应的图像块为背景块。

步骤S308，如果不小于预定阈值，则确定相应的图像块为前景块。

步骤S309，将相邻的前景块连接为前景区域，和/或将相邻的背景块连接为背景区域。

步骤S310，判断前景区域和/或背景区域的长宽和是否小于预定尺寸的预定倍数。

步骤S311，如果小于，则将前景区域和/或背景区域定义为非焦点区域。

例如，可以设预定倍数为2，如果预定尺寸为8，也就是将图像帧划分为多个8×8的图像块，则判断前景区域和/或背景区域的长宽和是否小于16，如果小于，则将长宽和小于16的前景区域和/或背景区域定义为非焦点区域，并且对非焦点区域不进行图像处理。

步骤S312，分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。

步骤S313，将前景图像与背景图像合成为立体图像，并根据多个图像帧对应的多个立体图像生成立体视频文件并输出。

根据本发明实施例的生成立体视频文件的方法，将面积较小的前景区域和/或背景区域定义为非焦点区域，不进行图像处理，提高了生成立体视频文件的效率，并且减小图像处理范围，进一步降低了对系统资源的需求，提升用户体验。

为了实现上述实例，本发明还提出一种生成立体视频文件的装置。

一种生成立体视频文件的装置，包括：获取模块，用于对视频文件进行解析以获取视频文件的多个图像帧，并在多个图像帧中选择参考图像帧；确定模块，用于根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域；图像处理模块，用于分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像；合成模块，用于将前景图像与背景图像合成为立体图像；以及输出模块，用于根据多个图像帧对应的多个立体图像生成立体视频文件并输出。

图4为根据本发明一个实施例的生成立体视频文件的装置的结构框图。

如图4所示，根据本发明实施例的生成立体视频文件的装置包括：获取模块100、确定模块200、图像处理模块300、合成模块400和输出模块500。

具体地，获取模块100用于对视频文件进行解析以获取视频文件的多个图像帧，并在多个图像帧中选择参考图像帧。

在本发明的一个实施例中，获取模块100首先通过对视频文件进行解码分析得到多个YUV颜色空间的图像帧，便于后续对图像进行色度和亮度进行处理。更具体地，获取模块100可以最初选择第一个图像帧作为初始参考图像帧，并根据第一个图像帧对第二个图像帧进行处理以生成第二图像帧的立体图像，然后再将第二个图像帧作为新的参考图像帧，对第三个图像帧进行处理以生成立体图像，依次类推，每个图像帧生成立体图像后都将作为新的参考图像帧。

确定模块200用于根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域。其中，前景区域为相对与参考图像帧产生相对运动的区域，背景区域为相对应参考图像帧没有产生相对运动的区域。

图像处理模块300用于分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。更具体地，图像处理模块300可以用于对前景区域进行细节增强、纹理的对比度增强以及直方图均衡、边缘提取等处理，对背景区域进行滤波平滑处理，如中值滤波等。

合成模块400用于将前景图像与背景图像合成为立体图像。

输出模块500用于根据多个图像帧对应的多个立体图像生成立体视频文件并输出。更具体地，输出模块500可将多个图像帧对应的多个立体图像进行压缩编码生成立体视频文件并输出至终端。

图5为根据本发明一个具体实施例的生成立体视频文件的装置的结构框图。

如图5所示，根据本发明实施例的生成立体视频文件的装置包括：获取模块100、确定模块200、图像处理模块300、合成模块400、输出模块500、分割单元210、第一获取单元220、第二获取模块230、第一判断单元240和确定单元250，其中确定模块200包括分割单元210、第一获取单元220、第二获取模块230、第一判断单元240和确定单元250。

具体地，分割单元210用于将参考图像帧之后的图像帧划分为多个预定尺寸的图像块。其中，预定尺寸可以根据图像帧的尺寸进行设定，如果图像帧的尺寸较大，则预定尺寸可设为较大的值，如果图像帧的尺寸较小，则预定尺寸可设为较小的值。

第一获取单元220用于分别获取每个图像块在参考图像帧上的绝对误差和最小的块。更具体地，首先分割单元210将参考图像帧为划分多个预定尺寸的参考图像块，其中预定尺寸与参考图像帧之后的图像帧划分的图像块的尺寸相同，然后第一获取单元220对于每个图像块，计算参考图像帧上的所有参考图像块与该图像块的绝对误差和，其中最小绝对误差和对应的参考图像块为该图像块在参考图像帧上的绝对误差和最小的块。

第二获取单元230用于分别根据每个图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个图像块的运动指数。更具体地，每个图像块的运动指数T_mv可按照以下公式计算：

T_{mv} = \sqrt{{(x - x^{'})}^{2} + {(y - y^{'})}^{2}}

其中，(x,y)为每个图像块的左上角像素点的位移，(x′,y′)为每个图像块相应的绝对误差和最小的块的左上角像素点的位移。

第一判断单元240用于分别判断每个图像块的运动指数是否小于预定阈值，如果小于则为背景块，否则为前景快。其中，预定阈值可由系统设定，预定阈值的设定会影响图像背景区域和前景区域的确定，预定阈值越小，背景区域相对越小，前景区域相对越大，反之，背景区域相对越大，前景区域相对越小。

确定单元250用于将相邻的前景块连接为前景区域，和/或将相邻的背景块连接为背景区域。

根据本发明实施例的生成立体视频文件的装置，通过分割单元将图像帧划分为多个图像块，并根据每个图像块的运动指数来确定前景区域和背景区域的范围，提高了前景区域和背景区域的区分度，从而提高了生成的立体图像的质量，提升用户体验。

图6为根据本发明又一个具体实施例的生成立体视频文件的装置的结构框图。

如图6所示，根据本发明实施例的生成立体视频文件的装置包括：获取模块100、确定模块200、图像处理模块300、合成模块400、输出模块500、分割单元210、第一获取单元220、第二获取模块230、第一判断单元240、确定单元250、第二判断单元260和扩展单元270，其中确定模块200包括分割单元210、第一获取单元220、第二获取模块230、第一判断单元240、确定单元250、第二判断单元260和扩展单元270。

具体地，第二判断单元260用于判断参考图像帧之后的图像帧的尺寸是否为预定尺寸的整数倍。如果是，分割单元210可直接将图像帧划分为多个预定尺寸的图像块，

扩展单元270用于在第二判断单元260确定参考图像帧之后的图像帧的尺寸不为预定尺寸的整数倍时，对图像帧进行扩展。更具体地，将图像帧扩展为所述预定尺寸的整数倍。

例如，如果要将图像帧划分为尺寸为多个8×8的图像块，首先第二判断单元260判断图像帧的长和宽是否为预定尺寸8的整数倍，当图像帧的尺寸为600×200时，长和宽是预定尺寸8的整数倍，则分割单元210可直接将图像帧划分为1875个图像块，当图像帧的尺寸为600×300时，长和宽不是预定尺寸8的整数倍，则需要扩展单元270将图像帧扩展为600×304的图像帧后，分割单元210再将其划分为2850个图像块。

根据本发明实施例的生成立体视频文件的装置，通过扩展单元将图像帧扩展为预定尺寸的整数倍后再进行划分，便于分割模块对图像帧进行划分，更加精确，从而提高了生成的立体图像的质量，进一步提升了用户体验。

在本发明的其他实施例中，所述生成立体视频文件的装置还可包括第三判断单元280，第三判断单元280用于判断所述前景区域和/或背景区域的长宽和是否小于所述预定尺寸的预定倍数，如果小于则将所述前景区域和/或背景区域定义为非焦点区域，其中图像处理模块300对非焦点区域不进行处理。例如，可以设预定倍数为2，如果预定尺寸为8，也就是将图像帧划分为多个8×8的图像块，则第三判断单元280判断前景区域和/或背景区域的长宽和是否小于16，如果小于，则将长宽和小于16的前景区域和/或背景区域定义为非焦点区域，并且不进行图像处理。由此，更提高了生成立体视频文件的效率，并且减小图像处理范围，进一步降低了对系统资源的需求，提升用户体验。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对所述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同限定。

Claims

1.一种生成立体视频文件的方法，其特征在于，包括以下步骤：

a、对视频文件进行解析以获取所述视频文件的多个图像帧，并在所述多个图像帧中选择参考图像帧；

b、根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域，其中，将所述参考图像帧之后的图像帧划分为多个预定尺寸的图像块，分别获取每个所述图像块在所述参考图像帧上的绝对误差和最小的块，分别根据每个所述图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个所述图像块的运动指数，分别判断每个所述图像块的运动指数是否小于预定阈值，如果小于预定阈值，则确定相应的图像块为背景块，否则为前景块，将相邻的前景块连接为前景区域，和/或将相邻的背景块连接为背景区域；

c、分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像；

d、将所述前景图像与所述背景图像合成为立体图像；以及

e、根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。

2.根据权利要求1所述的方法，其特征在于，所述将所述参考图像帧之后的图像帧划分为多个预定尺寸的图像块具体包括：

判断所述参考图像帧之后的图像帧的尺寸是否为所述预定尺寸的整数倍；

如果是，则直接将所述图像帧划分为多个预定尺寸的图像块；以及

如果否，则将所述图像帧扩展为所述预定尺寸的整数倍后，再将扩展后的图像帧划分为多个预定尺寸的图像块。

3.根据权利要求2所述的方法，其特征在于，扩展所述图像帧包括：使用所述图像帧的最右边像素点进行横向扩展，以及使用所述图像帧的最下边像素点进行纵向扩展。

4.根据权利要求1所述的方法，其特征在于，所述步骤b还包括以下步骤：

判断所述前景区域和/或背景区域的长宽和是否小于所述预定尺寸的预定倍数；以及

如果小于，则将所述前景区域和/或背景区域定义为非焦点区域。

5.根据权利要求4所述的方法，其特征在于，对所述非焦点区域不进行处理。

6.根据权利要求1所述的方法，其特征在于，所述步骤c具体包括：

对所述前景区域进行细节增强、纹理的对比度增强以及直方图均衡处理；以及

对所述背景区域进行滤波平滑处理。

7.一种生成立体视频文件的装置，其特征在于，包括：

获取模块，用于对视频文件进行解析以获取所述视频文件的多个图像帧，并在所述多个图像帧中选择参考图像帧；

确定模块，用于根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域，其中，所述确定模块具体包括：分割单元，用于将所述参考图像帧之后的图像帧划分为多个预定尺寸的图像块；第一获取单元，用于分别获取每个所述图像块在所述参考图像帧上的绝对误差和最小的块；第二获取单元，用于分别根据每个所述图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个所述图像块的运动指数；第一判断单元，用于分别判断每个所述图像块的运动指数是否小于预定阈值，如果小于则为背景块，否则为前景块；以及确定单元，用于将相邻的前景块连接为前景区域，和/或将相邻的背景块连接为背景区域；

图像处理模块，用于分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像；

合成模块，用于将所述前景图像与所述背景图像合成为立体图像；以及

输出模块，用于根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。

8.根据权利要求7所述的装置，其特征在于，所述分割单元具体用于：

判断所述参考图像帧之后的图像帧的尺寸是否为所述预定尺寸的整数倍；以及

在第二判断单元确定所述参考图像帧之后的图像帧的尺寸不为所述预定尺寸的整数倍时，对所述图像帧进行扩展。

9.根据权利要求8所述的装置，其特征在于，所述确定模块还包括：

扩展单元，用于使用所述图像帧的最右边像素点进行横向扩展，使用所述图像帧的最下边像素点进行纵向扩展。

10.根据权利要求7所述的装置，其特征在于，所述确定模块还包括：

第三判断单元，用于判断所述前景区域和/或背景区域的长宽和是否小于所述预定尺寸的预定倍数，如果小于则将所述前景区域和/或背景区域定义为非焦点区域。

11.根据权利要求10所述的装置，其特征在于，所述图像处理模块对所述非焦点区域不进行处理。

12.根据权利要求7所述的装置，其特征在于，所述图像处理模块具体用于：

对所述背景区域进行滤波平滑处理。