CN103049908B - 生成立体视频文件的方法和装置 - Google Patents

生成立体视频文件的方法和装置 Download PDF

Info

Publication number
CN103049908B
CN103049908B CN201210530758.7A CN201210530758A CN103049908B CN 103049908 B CN103049908 B CN 103049908B CN 201210530758 A CN201210530758 A CN 201210530758A CN 103049908 B CN103049908 B CN 103049908B
Authority
CN
China
Prior art keywords
image
frame
picture
picture frame
video file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210530758.7A
Other languages
English (en)
Other versions
CN103049908A (zh
Inventor
张志辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210530758.7A priority Critical patent/CN103049908B/zh
Publication of CN103049908A publication Critical patent/CN103049908A/zh
Application granted granted Critical
Publication of CN103049908B publication Critical patent/CN103049908B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出一种生成立体视频文件的方法和装置,其中所述方法包括以下步骤:对视频文件进行解析以获取视频文件的多个图像帧,并在多个图像帧中选择参考图像帧;根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域;分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像;将前景图像与背景图像合成为立体图像;以及根据多个图像帧对应的多个立体图像生成立体视频文件并输出。根据本发明实施例的方法,将普通资源转化成立体资源,充分满足了用户对立体资源的需求,该方法生成的立体视频文件图像质量高,并且算法简单,易于实现,从而能够节约大量系统资源,对终端的性能要求降低,用户体验好。

Description

生成立体视频文件的方法和装置
技术领域
本发明涉及图像处理技术领域,特别涉及一种生成立体视频文件的方法和装置。
背景技术
随着三维立体技术的发展,现有的具有立体效果的资源难以满足用户越来越大的需求,因此亟需将资源丰富的传统二维普通资源转换为立体资源来解决立体资源匮乏的问题。
目前,可以通过基于深度图的三维效果合成方法或者从多张多维度图片合成一张三维效果图的方法将普通的二维资源转换为三维立体资源。但是,对于移动终端来说,无法同时从不同角度拍摄同一个场景获得多个图片,然后合成三维立体图像,而基于深度图的三维效果合成方法算法复杂,需要占用大量的系统资源,一般的移动终端也无法实现。并且,这两种方法在图像转换过程中,不区分前景区域和背景区域,合成后的立体图像质量下降,因此,现有的将普通资源转换为立体资源的方法难以在移动终端上实现,使用非常不便,且转换效果不佳。
发明内容
本发明的目的旨在至少解决上述技术缺陷之一。
为此,本发明第一个目的在于提出一种生成立体视频文件的方法,该方法生成的立体视频文件图像质量高,并且算法简单,易于实现,从而能够节约大量系统资源,对终端的性能要求降低,用户体验好。
本发明第二个目的在于提出一种生成立体视频文件的装置。
为实现上述目的,根据本发明第一方面的实施例的生成立体视频文件的方法包括以下步骤:对视频文件进行解析以获取所述视频文件的多个图像帧,并在所述多个图像帧中选择参考图像帧;根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域;分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像;将所述前景图像与所述背景图像合成为立体图像;以及根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。
根据本发明实施例的生成立体视频文件的方法,通过区分图像的前景区域和背景区域,并分别进行图像处理后合成立体图像,将普通资源转化成立体资源,充分满足了用户对立体资源的需求,该方法生成的立体视频文件图像质量高,并且算法简单,易于实现,从而能够节约大量系统资源,对终端的性能要求降低,用户体验好。
为实现上述目的,根据本发明第二方面的实施例的生成立体视频文件的装置包括:获取模块,用于对视频文件进行解析以获取所述视频文件的多个图像帧,并在所述多个图像帧中选择参考图像帧;确定模块,用于根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域;图像处理模块,用于分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像;合成模块,用于将所述前景图像与所述背景图像合成为立体图像;以及输出模块,用于根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。
根据本发明实施例的生成立体视频文件的装置,通过确定模块确定图像的前景区域和背景区域,并分别进行图像处理后合成立体图像,将普通资源转化成立体资源,充分满足了用户对立体资源的需求,该方法生成的立体视频文件图像质量高,并且算法简单,易于实现,从而能够节约大量系统资源,对终端的性能要求降低,用户体验好。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的生成立体视频文件的方法的流程图;
图2为根据本发明一个具体实施例的生成立体视频文件的方法的流程图;
图3为根据本发明另一个具体实施例的生成立体视频文件的方法的流程图;
图4为根据本发明一个实施例的生成立体视频文件的装置的结构框图;
图5为根据本发明一个具体实施例的生成立体视频文件的装置的结构框图;
图6为根据本发明另一个具体实施例的生成立体视频文件的装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
下面参考附图描述根据本发明实施例的生成立体视频文件的方法和装置。
一种生成立体视频文件的方法,包括以下步骤:对视频文件进行解析以获取视频文件的多个图像帧,并在多个图像帧中选择参考图像帧;根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域;分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像;将前景图像与背景图像合成为立体图像;以及根据多个图像帧对应的多个立体图像生成立体视频文件并输出。
图1为根据本发明一个实施例的生成立体视频文件的方法的流程图。
如图1所示,根据本发明实施例的生成立体视频文件的方法包括下述步骤。
步骤S101,对视频文件进行解析以获取视频文件的多个图像帧。
在本发明的一个实施例中,对视频文件进行解码分析,从而得到多个YUV颜色空间的图像帧,便于后续对图像进行色度和亮度进行处理。
步骤S102,在多个图像帧中选择参考图像帧。
具体地,最初可以选择第一个图像帧作为初始参考图像帧,并根据第一个图像帧对第二个图像帧进行处理以生成第二图像帧的立体图像,然后再将第二个图像帧作为新的参考图像帧,对第三个图像帧进行处理以生成立体图像,依次类推,每个图像帧生成立体图像后都将作为新的参考图像帧。
步骤S103,根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域。
其中,前景区域为相对与参考图像帧产生相对运动的区域,背景区域为相对应参考图像帧没有产生相对运动的区域。
步骤S104,分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。
具体地,可以对前景区域进行细节增强、纹理的对比度增强以及直方图均衡、边缘提取等处理,对背景区域进行滤波平滑处理,如中值滤波等。
步骤S105,将前景图像与背景图像合成为立体图像,并根据多个图像帧对应的多个立体图像生成立体视频文件并输出。
具体地,将多个图像帧对应的多个立体图像进行压缩编码生成立体视频文件并输出至终端。
根据本发明实施例的生成立体视频文件的方法,通过区分图像的前景区域和背景区域,并分别进行图像处理后合成立体图像,将普通资源转化成立体资源,充分满足了用户对立体资源的需求,该方法生成的立体视频文件图像质量高,并且算法简单,易于实现,从而能够节约大量系统资源,对终端的性能要求降低,用户体验好。
图2为根据本发明一个具体实施例的生成立体视频文件的方法的流程图。
如图2所示,根据本发明实施例的生成立体视频文件的方法包括下述步骤。
步骤S201,对视频文件进行解析以获取视频文件的多个图像帧。
在本发明的一个实施例中,对视频文件进行解码分析,从而得到多个YUV颜色空间的图像帧,便于后续对图像进行色度和亮度进行处理。
步骤S202,在多个图像帧中选择参考图像帧。
具体地,最初可以选择第一个图像帧作为初始参考图像帧,并根据第一个图像帧对第二个图像帧进行处理以生成第二图像帧的立体图像,然后再将第二个图像帧作为新的参考图像帧,对第三个图像帧进行处理以生成立体图像,依次类推,每个图像帧生成立体图像后都将作为新的参考图像帧。
步骤S203,将参考图像帧之后的图像帧划分为多个预定尺寸的图像块。
具体地,首先判断参考图像帧之后的图像帧的尺寸是否为预定尺寸的整数倍,如果是,可直接将图像帧划分为多个预定尺寸的图像块,如果否,则需要将图像帧扩展为所述预定尺寸的整数倍后,再将扩展后的图像帧划分为多个预定尺寸的图像块,其中,预定尺寸可以根据图像帧的尺寸进行设定,如果图像帧的尺寸较大,则预定尺寸可设为较大的值,如果图像帧的尺寸较小,则预定尺寸可设为较小的值。
例如,如果要将图像帧划分为尺寸为多个8×8的图像块,首先判断图像帧的长和宽是否为预定尺寸8的整数倍,当图像帧的尺寸为600×200时,长和宽是预定尺寸8的整数倍,则可直接将图像帧划分为1875个图像块,当图像帧的尺寸为600×300时,长和宽不是预定尺寸8的整数倍,则需要将图像帧扩展为600×304的图像帧,再将其划分为2850个图像块。
在本发明的一个实施例中,可以使用图像帧的最右边像素点和最下边的像素点分别对图像帧进行横向扩展和纵向扩展,也可以使用图像帧的最左边像素点和最上边像素点分别对图像帧进行横向和纵向扩展。
步骤S204,分别获取每个图像块在参考图像帧上的绝对误差和最小的块。
具体地,将参考图像帧为划分多个预定尺寸的参考图像块,其中预定尺寸与参考图像帧之后的图像帧划分的图像块的尺寸相同,对于每个图像块,计算参考图像帧上的所有参考图像块与该图像块的绝对误差和,其中最小绝对误差和对应的参考图像块为该图像块在参考图像帧上的绝对误差和最小的块。
步骤S205,分别根据每个图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个图像块的运动指数。
具体地,每个图像块的运动指数Tmv可按照以下公式计算:
T mv = ( x - x ′ ) 2 + ( y - y ′ ) 2
其中,(x,y)为每个图像块的左上角像素点的位移,(x',y')为每个图像块相应的绝对误差和最小的块的左上角像素点的位移。
步骤S206,分别判断每个图像块的运动指数是否小于预定阈值。
其中,预定阈值可由系统设定,预定阈值的设定会影响图像背景区域和前景区域的确定,预定阈值越小,背景区域相对越小,前景区域相对越大,反之,背景区域相对越大,前景区域相对越小。
步骤S207,如果小于预定阈值,则确定相应的图像块为背景块。
步骤S208,如果不小于预定阈值,则确定相应的图像块为前景块。
步骤S209,将相邻的前景块连接为前景区域,和/或将相邻的背景块连接为背景区域。
步骤S210,分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。
具体地,可以对前景区域进行细节增强、纹理的对比度增强以及直方图均衡、边缘提取等处理,对背景区域进行滤波平滑处理,如中值滤波等。
步骤S211,将前景图像与背景图像合成为立体图像,并根据多个图像帧对应的多个立体图像生成立体视频文件并输出。
具体地,将多个图像帧对应的多个立体图像进行压缩编码生成立体视频文件并输出至终端。
根据本发明实施例的生成立体视频文件的方法,通过将图像帧划分为多个图像块,并根据每个图像块的运动指数来确定前景区域和背景区域的范围,提高了前景区域和背景区域的区分度,从而提高了生成的立体图像的质量,提升用户体验。
图3为根据本发明另一个具体实施例的生成立体视频文件的方法的流程图。
如图3所示,根据本发明实施例的生成立体视频文件的方法包括下述步骤。
步骤S301,对视频文件进行解析以获取视频文件的多个图像帧。
在本发明的一个实施例中,对视频文件进行解码分析,从而得到多个YUV颜色空间的图像帧,便于后续对图像进行色度和亮度进行处理。
步骤S302,在多个图像帧中选择参考图像帧。
具体地,最初可以选择第一个图像帧作为初始参考图像帧,并根据第一个图像帧对第二个图像帧进行处理以生成第二图像帧的立体图像,然后再将第二个图像帧作为新的参考图像帧,对第三个图像帧进行处理以生成立体图像,依次类推,每个图像帧生成立体图像后都将作为新的参考图像帧。
步骤S303,将参考图像帧之后的图像帧划分为多个预定尺寸的图像块。
具体地,首先判断参考图像帧之后的图像帧的尺寸是否为预定尺寸的整数倍,如果是,可直接将图像帧划分为多个预定尺寸的图像块,如果否,则需要将图像帧扩展为所述预定尺寸的整数倍后,再将扩展后的图像帧划分为多个预定尺寸的图像块,其中,预定尺寸可以根据图像帧的尺寸进行设定,如果图像帧的尺寸较大,则预定尺寸可设为较大的值,如果图像帧的尺寸较小,则预定尺寸可设为较小的值。
例如,如果要将图像帧划分为尺寸为多个8×8的图像块,首先判断图像帧的长和宽是否为预定尺寸8的整数倍,当图像帧的尺寸为600×200时,长和宽是预定尺寸8的整数倍,则可直接将图像帧划分为1875个图像块,当图像帧的尺寸为600×300时,长和宽不是预定尺寸8的整数倍,则需要将图像帧扩展为600×304的图像帧,再将其划分为2850个图像块。
在本发明的一个实施例中,可以使用图像帧的最右边像素点和最下边的像素点分别对图像帧进行横向扩展和纵向扩展,也可以使用图像帧的最左边像素点和最上边像素点分别对图像帧进行横向和纵向扩展。
步骤S304,分别获取每个图像块在参考图像帧上的绝对误差和最小的块。
具体地,将参考图像帧为划分多个预定尺寸的参考图像块,其中预定尺寸与参考图像帧之后的图像帧划分的图像块的尺寸相同,对于每个图像块,计算参考图像帧上的所有参考图像块与该图像块的绝对误差和,其中最小绝对误差和对应的参考图像块为该图像块在参考图像帧上的绝对误差和最小的块。
步骤S305,分别根据每个图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个图像块的运动指数。
具体地,每个图像块的运动指数Tmv可按照以下公式计算:
T mv = ( x - x ′ ) 2 + ( y - y ′ ) 2
其中,(x,y)为每个图像块的左上角像素点的位移,(x',y′)为每个图像块相应的绝对误差和最小的块的左上角像素点的位移。
步骤S306,分别判断每个图像块的运动指数是否小于预定阈值。
其中,预定阈值可由系统设定,预定阈值的设定会影响图像背景区域和前景区域的确定,预定阈值越小,背景区域相对越小,前景区域相对越大,反之,背景区域相对越大,前景区域相对越小。
步骤S307,如果小于预定阈值,则确定相应的图像块为背景块。
步骤S308,如果不小于预定阈值,则确定相应的图像块为前景块。
步骤S309,将相邻的前景块连接为前景区域,和/或将相邻的背景块连接为背景区域。
步骤S310,判断前景区域和/或背景区域的长宽和是否小于预定尺寸的预定倍数。
步骤S311,如果小于,则将前景区域和/或背景区域定义为非焦点区域。
例如,可以设预定倍数为2,如果预定尺寸为8,也就是将图像帧划分为多个8×8的图像块,则判断前景区域和/或背景区域的长宽和是否小于16,如果小于,则将长宽和小于16的前景区域和/或背景区域定义为非焦点区域,并且对非焦点区域不进行图像处理。
步骤S312,分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。
具体地,可以对前景区域进行细节增强、纹理的对比度增强以及直方图均衡、边缘提取等处理,对背景区域进行滤波平滑处理,如中值滤波等。
步骤S313,将前景图像与背景图像合成为立体图像,并根据多个图像帧对应的多个立体图像生成立体视频文件并输出。
具体地,将多个图像帧对应的多个立体图像进行压缩编码生成立体视频文件并输出至终端。
根据本发明实施例的生成立体视频文件的方法,将面积较小的前景区域和/或背景区域定义为非焦点区域,不进行图像处理,提高了生成立体视频文件的效率,并且减小图像处理范围,进一步降低了对系统资源的需求,提升用户体验。
为了实现上述实例,本发明还提出一种生成立体视频文件的装置。
一种生成立体视频文件的装置,包括:获取模块,用于对视频文件进行解析以获取视频文件的多个图像帧,并在多个图像帧中选择参考图像帧;确定模块,用于根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域;图像处理模块,用于分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像;合成模块,用于将前景图像与背景图像合成为立体图像;以及输出模块,用于根据多个图像帧对应的多个立体图像生成立体视频文件并输出。
图4为根据本发明一个实施例的生成立体视频文件的装置的结构框图。
如图4所示,根据本发明实施例的生成立体视频文件的装置包括:获取模块100、确定模块200、图像处理模块300、合成模块400和输出模块500。
具体地,获取模块100用于对视频文件进行解析以获取视频文件的多个图像帧,并在多个图像帧中选择参考图像帧。
在本发明的一个实施例中,获取模块100首先通过对视频文件进行解码分析得到多个YUV颜色空间的图像帧,便于后续对图像进行色度和亮度进行处理。更具体地,获取模块100可以最初选择第一个图像帧作为初始参考图像帧,并根据第一个图像帧对第二个图像帧进行处理以生成第二图像帧的立体图像,然后再将第二个图像帧作为新的参考图像帧,对第三个图像帧进行处理以生成立体图像,依次类推,每个图像帧生成立体图像后都将作为新的参考图像帧。
确定模块200用于根据参考图像帧确定参考图像帧之后的图像帧的前景区域和背景区域。其中,前景区域为相对与参考图像帧产生相对运动的区域,背景区域为相对应参考图像帧没有产生相对运动的区域。
图像处理模块300用于分别对前景区域和背景区域进行图像处理以获得前景图像和背景图像。更具体地,图像处理模块300可以用于对前景区域进行细节增强、纹理的对比度增强以及直方图均衡、边缘提取等处理,对背景区域进行滤波平滑处理,如中值滤波等。
合成模块400用于将前景图像与背景图像合成为立体图像。
输出模块500用于根据多个图像帧对应的多个立体图像生成立体视频文件并输出。更具体地,输出模块500可将多个图像帧对应的多个立体图像进行压缩编码生成立体视频文件并输出至终端。
根据本发明实施例的生成立体视频文件的装置,通过确定模块确定图像的前景区域和背景区域,并分别进行图像处理后合成立体图像,将普通资源转化成立体资源,充分满足了用户对立体资源的需求,该方法生成的立体视频文件图像质量高,并且算法简单,易于实现,从而能够节约大量系统资源,对终端的性能要求降低,用户体验好。
图5为根据本发明一个具体实施例的生成立体视频文件的装置的结构框图。
如图5所示,根据本发明实施例的生成立体视频文件的装置包括:获取模块100、确定模块200、图像处理模块300、合成模块400、输出模块500、分割单元210、第一获取单元220、第二获取模块230、第一判断单元240和确定单元250,其中确定模块200包括分割单元210、第一获取单元220、第二获取模块230、第一判断单元240和确定单元250。
具体地,分割单元210用于将参考图像帧之后的图像帧划分为多个预定尺寸的图像块。其中,预定尺寸可以根据图像帧的尺寸进行设定,如果图像帧的尺寸较大,则预定尺寸可设为较大的值,如果图像帧的尺寸较小,则预定尺寸可设为较小的值。
第一获取单元220用于分别获取每个图像块在参考图像帧上的绝对误差和最小的块。更具体地,首先分割单元210将参考图像帧为划分多个预定尺寸的参考图像块,其中预定尺寸与参考图像帧之后的图像帧划分的图像块的尺寸相同,然后第一获取单元220对于每个图像块,计算参考图像帧上的所有参考图像块与该图像块的绝对误差和,其中最小绝对误差和对应的参考图像块为该图像块在参考图像帧上的绝对误差和最小的块。
第二获取单元230用于分别根据每个图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个图像块的运动指数。更具体地,每个图像块的运动指数Tmv可按照以下公式计算:
T mv = ( x - x ′ ) 2 + ( y - y ′ ) 2
其中,(x,y)为每个图像块的左上角像素点的位移,(x′,y′)为每个图像块相应的绝对误差和最小的块的左上角像素点的位移。
第一判断单元240用于分别判断每个图像块的运动指数是否小于预定阈值,如果小于则为背景块,否则为前景快。其中,预定阈值可由系统设定,预定阈值的设定会影响图像背景区域和前景区域的确定,预定阈值越小,背景区域相对越小,前景区域相对越大,反之,背景区域相对越大,前景区域相对越小。
确定单元250用于将相邻的前景块连接为前景区域,和/或将相邻的背景块连接为背景区域。
根据本发明实施例的生成立体视频文件的装置,通过分割单元将图像帧划分为多个图像块,并根据每个图像块的运动指数来确定前景区域和背景区域的范围,提高了前景区域和背景区域的区分度,从而提高了生成的立体图像的质量,提升用户体验。
图6为根据本发明又一个具体实施例的生成立体视频文件的装置的结构框图。
如图6所示,根据本发明实施例的生成立体视频文件的装置包括:获取模块100、确定模块200、图像处理模块300、合成模块400、输出模块500、分割单元210、第一获取单元220、第二获取模块230、第一判断单元240、确定单元250、第二判断单元260和扩展单元270,其中确定模块200包括分割单元210、第一获取单元220、第二获取模块230、第一判断单元240、确定单元250、第二判断单元260和扩展单元270。
具体地,第二判断单元260用于判断参考图像帧之后的图像帧的尺寸是否为预定尺寸的整数倍。如果是,分割单元210可直接将图像帧划分为多个预定尺寸的图像块,
扩展单元270用于在第二判断单元260确定参考图像帧之后的图像帧的尺寸不为预定尺寸的整数倍时,对图像帧进行扩展。更具体地,将图像帧扩展为所述预定尺寸的整数倍。
例如,如果要将图像帧划分为尺寸为多个8×8的图像块,首先第二判断单元260判断图像帧的长和宽是否为预定尺寸8的整数倍,当图像帧的尺寸为600×200时,长和宽是预定尺寸8的整数倍,则分割单元210可直接将图像帧划分为1875个图像块,当图像帧的尺寸为600×300时,长和宽不是预定尺寸8的整数倍,则需要扩展单元270将图像帧扩展为600×304的图像帧后,分割单元210再将其划分为2850个图像块。
根据本发明实施例的生成立体视频文件的装置,通过扩展单元将图像帧扩展为预定尺寸的整数倍后再进行划分,便于分割模块对图像帧进行划分,更加精确,从而提高了生成的立体图像的质量,进一步提升了用户体验。
在本发明的其他实施例中,所述生成立体视频文件的装置还可包括第三判断单元280,第三判断单元280用于判断所述前景区域和/或背景区域的长宽和是否小于所述预定尺寸的预定倍数,如果小于则将所述前景区域和/或背景区域定义为非焦点区域,其中图像处理模块300对非焦点区域不进行处理。例如,可以设预定倍数为2,如果预定尺寸为8,也就是将图像帧划分为多个8×8的图像块,则第三判断单元280判断前景区域和/或背景区域的长宽和是否小于16,如果小于,则将长宽和小于16的前景区域和/或背景区域定义为非焦点区域,并且不进行图像处理。由此,更提高了生成立体视频文件的效率,并且减小图像处理范围,进一步降低了对系统资源的需求,提升用户体验。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对所述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。

Claims (12)

1.一种生成立体视频文件的方法,其特征在于,包括以下步骤:
a、对视频文件进行解析以获取所述视频文件的多个图像帧,并在所述多个图像帧中选择参考图像帧;
b、根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域,其中,将所述参考图像帧之后的图像帧划分为多个预定尺寸的图像块,分别获取每个所述图像块在所述参考图像帧上的绝对误差和最小的块,分别根据每个所述图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个所述图像块的运动指数,分别判断每个所述图像块的运动指数是否小于预定阈值,如果小于预定阈值,则确定相应的图像块为背景块,否则为前景块,将相邻的前景块连接为前景区域,和/或将相邻的背景块连接为背景区域;
c、分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像;
d、将所述前景图像与所述背景图像合成为立体图像;以及
e、根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。
2.根据权利要求1所述的方法,其特征在于,所述将所述参考图像帧之后的图像帧划分为多个预定尺寸的图像块具体包括:
判断所述参考图像帧之后的图像帧的尺寸是否为所述预定尺寸的整数倍;
如果是,则直接将所述图像帧划分为多个预定尺寸的图像块;以及
如果否,则将所述图像帧扩展为所述预定尺寸的整数倍后,再将扩展后的图像帧划分为多个预定尺寸的图像块。
3.根据权利要求2所述的方法,其特征在于,扩展所述图像帧包括:使用所述图像帧的最右边像素点进行横向扩展,以及使用所述图像帧的最下边像素点进行纵向扩展。
4.根据权利要求1所述的方法,其特征在于,所述步骤b还包括以下步骤:
判断所述前景区域和/或背景区域的长宽和是否小于所述预定尺寸的预定倍数;以及
如果小于,则将所述前景区域和/或背景区域定义为非焦点区域。
5.根据权利要求4所述的方法,其特征在于,对所述非焦点区域不进行处理。
6.根据权利要求1所述的方法,其特征在于,所述步骤c具体包括:
对所述前景区域进行细节增强、纹理的对比度增强以及直方图均衡处理;以及
对所述背景区域进行滤波平滑处理。
7.一种生成立体视频文件的装置,其特征在于,包括:
获取模块,用于对视频文件进行解析以获取所述视频文件的多个图像帧,并在所述多个图像帧中选择参考图像帧;
确定模块,用于根据所述参考图像帧确定所述参考图像帧之后的图像帧的前景区域和背景区域,其中,所述确定模块具体包括:分割单元,用于将所述参考图像帧之后的图像帧划分为多个预定尺寸的图像块;第一获取单元,用于分别获取每个所述图像块在所述参考图像帧上的绝对误差和最小的块;第二获取单元,用于分别根据每个所述图像块的左上角像素点的位移及其相应的绝对误差和最小的块的左上角像素点的位移获取每个所述图像块的运动指数;第一判断单元,用于分别判断每个所述图像块的运动指数是否小于预定阈值,如果小于则为背景块,否则为前景块;以及确定单元,用于将相邻的前景块连接为前景区域,和/或将相邻的背景块连接为背景区域;
图像处理模块,用于分别对所述前景区域和所述背景区域进行图像处理以获得前景图像和背景图像;
合成模块,用于将所述前景图像与所述背景图像合成为立体图像;以及
输出模块,用于根据多个所述图像帧对应的多个所述立体图像生成立体视频文件并输出。
8.根据权利要求7所述的装置,其特征在于,所述分割单元具体用于:
判断所述参考图像帧之后的图像帧的尺寸是否为所述预定尺寸的整数倍;以及
在第二判断单元确定所述参考图像帧之后的图像帧的尺寸不为所述预定尺寸的整数倍时,对所述图像帧进行扩展。
9.根据权利要求8所述的装置,其特征在于,所述确定模块还包括:
扩展单元,用于使用所述图像帧的最右边像素点进行横向扩展,使用所述图像帧的最下边像素点进行纵向扩展。
10.根据权利要求7所述的装置,其特征在于,所述确定模块还包括:
第三判断单元,用于判断所述前景区域和/或背景区域的长宽和是否小于所述预定尺寸的预定倍数,如果小于则将所述前景区域和/或背景区域定义为非焦点区域。
11.根据权利要求10所述的装置,其特征在于,所述图像处理模块对所述非焦点区域不进行处理。
12.根据权利要求7所述的装置,其特征在于,所述图像处理模块具体用于:
对所述前景区域进行细节增强、纹理的对比度增强以及直方图均衡处理;以及
对所述背景区域进行滤波平滑处理。
CN201210530758.7A 2012-12-10 2012-12-10 生成立体视频文件的方法和装置 Active CN103049908B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210530758.7A CN103049908B (zh) 2012-12-10 2012-12-10 生成立体视频文件的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210530758.7A CN103049908B (zh) 2012-12-10 2012-12-10 生成立体视频文件的方法和装置

Publications (2)

Publication Number Publication Date
CN103049908A CN103049908A (zh) 2013-04-17
CN103049908B true CN103049908B (zh) 2016-08-03

Family

ID=48062537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210530758.7A Active CN103049908B (zh) 2012-12-10 2012-12-10 生成立体视频文件的方法和装置

Country Status (1)

Country Link
CN (1) CN103049908B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2536830B (en) * 2014-01-08 2017-11-29 Fujitsu Ltd Apparatus for image contrast enhancement and method, electronic equipment
CN107241646B (zh) * 2017-07-12 2020-08-14 北京奇虎科技有限公司 多媒体视频的编辑方法及装置
CN110782417B (zh) * 2019-11-08 2022-12-02 恒信东方文化股份有限公司 一种自动摄影方法及其相应的摄影装置
CN111127342B (zh) * 2019-12-05 2023-08-08 Oppo广东移动通信有限公司 一种图像处理方法、装置、存储介质以及终端设备
CN111243088A (zh) * 2020-01-08 2020-06-05 长春工程学院 工程地质勘察中的真三维航空遥感地质解译方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1878229A (zh) * 2006-07-14 2006-12-13 杭州国芯科技有限公司 生成预览图像的方法
CN102104788A (zh) * 2009-12-17 2011-06-22 美国博通公司 一种用于视频处理的方法和系统
CN102724532A (zh) * 2012-06-19 2012-10-10 清华大学 一种平面视频立体化转化方法及使用该方法的系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009533993A (ja) * 2006-04-20 2009-09-17 エヌエックスピー ビー ヴィ データ要約システム及びデータストリーム要約方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1878229A (zh) * 2006-07-14 2006-12-13 杭州国芯科技有限公司 生成预览图像的方法
CN102104788A (zh) * 2009-12-17 2011-06-22 美国博通公司 一种用于视频处理的方法和系统
CN102724532A (zh) * 2012-06-19 2012-10-10 清华大学 一种平面视频立体化转化方法及使用该方法的系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于视差和阈值分割的立体视频对象提取;安平 等;《中国图象图形学报》;20061130;第11卷(第11期);1669-1672 *

Also Published As

Publication number Publication date
CN103049908A (zh) 2013-04-17

Similar Documents

Publication Publication Date Title
US20230377100A1 (en) Image processing apparatus and image processing method
CN103049908B (zh) 生成立体视频文件的方法和装置
CN102741879B (zh) 由单眼图像产生深度图的方法及其系统
US9525858B2 (en) Depth or disparity map upscaling
JP5996013B2 (ja) 立体画像の視差マップ推定のための方法,装置及びコンピュータプログラム製品
KR101775253B1 (ko) 2차원 이미지 또는 비디오의 3차원 스테레오 이미지 또는 비디오로의 실시간 자동 변환
CN111433821B (zh) 用于重建表示3d对象的点云的方法和装置
EP2639761B1 (en) Depth information generator, depth information generation method, and stereoscopic image converter
EP2947627B1 (en) Light field image depth estimation
US9167232B2 (en) System for converting 2D video into 3D video
CN103051908B (zh) 一种基于视差图的空洞填充装置
US9961330B2 (en) Device and method of generating multi-view immersive content
KR101198320B1 (ko) 2차원에서 3차원으로의 영상 변환 방법 및 장치
KR20090080556A (ko) 복잡성-적응형 2차원-대-3차원 비디오 시퀀스 변환
CN102098528B (zh) 一种平面图像的立体转换方法及装置
EP3105738A1 (en) Method, apparatus and computer program product for image-driven cost volume aggregation
CN102982828B (zh) 生成视频文件的预览文件的方法及装置
EP3652940A1 (en) A method and apparatus for encoding/decoding a colored point cloud representing the geometry and colors of a 3d object
US20150097927A1 (en) 2D to 3D Image Conversion Device and Method
CN103686139B (zh) 帧图像转换方法、帧视频转换方法及装置
US9736449B1 (en) Conversion of 2D image to 3D video
EP2608554B1 (en) Method and apparatus of determining perspective model for depth map generation by utilizing region-based analysis and/or temporal smoothing
CN108833925B (zh) 一种基于深度神经网络的帧间预测方法
EP3467777A1 (en) A method and apparatus for encoding/decoding the colors of a point cloud representing a 3d object
CN105007494B (zh) 一种3d视频深度图像的帧内楔形分割模式选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant