CN114650406B - 视频处理方法、视频处理装置和计算机存储可读介质 - Google Patents
视频处理方法、视频处理装置和计算机存储可读介质 Download PDFInfo
- Publication number
- CN114650406B CN114650406B CN202210294022.8A CN202210294022A CN114650406B CN 114650406 B CN114650406 B CN 114650406B CN 202210294022 A CN202210294022 A CN 202210294022A CN 114650406 B CN114650406 B CN 114650406B
- Authority
- CN
- China
- Prior art keywords
- image
- images
- frames
- video
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/302—Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/122—Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/128—Adjusting depth or disparity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/272—Means for inserting a foreground image in a background image, i.e. inlay, outlay
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
- H04N2013/0081—Depth or disparity estimation from stereoscopic image signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申请公开了图像处理领域中一种视频处理方法、视频处理装置和计算机存储可读介质。本申请提供的技术方案中,获取待处理视频,待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数;从待处理视频中获取视频片段,视频片段包括待处理视频中的N帧第一图像,N为小于或等于M的正整数;获取背景图像,背景图像中包含第一框体元素,第一框体元素用于播放待处理视频;对N帧第一图像进行抠像处理,得到N帧第二图像;对N帧第二图像和背景图像进行叠加处理,得到N帧第三图像;对N帧第三图像进行图像编码,得到目标视频。本申请的技术方案可以得到裸眼即可感受到3D立体效果的视频,即可以使得视频的显示效果更逼真。
Description
技术领域
本申请涉及图像处理领域,尤其涉及一种视频处理方法、视频处理装置和计算机存储可读介质。
背景技术
当下,一种播放视频(例如广告视频)的方式如下:设置背景图像,在背景图像中内嵌一个框体,在该框体中播放视频。
但是,人们对视频的播放效果需求的越来越高。因此如何提高视频的播放效果,成为亟待解决的技术问题。
发明内容
本申请提供了一种视频处理方法、视频处理装置和计算机存储可读介质,提高了视频的播放效果。
第一方面,本申请提供一种视频处理方法,包括:获取待处理视频,所述待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数;从所述待处理视频中获取视频片段,所述视频片段包括所述待处理视频中的N帧第一图像,N为小于或等于M的正整数;获取背景图像,所述背景图像中包含第一框体元素,所述第一框体元素用于播放所述待处理视频;对所述N帧第一图像进行抠像处理,得到与所述N帧第一图像一一对应的N帧第二图像,所述N帧第二图像中每帧第二图像是对所述N帧第一图像中对应的第一图像进行抠像处理得到的;对所述N帧第二图像和所述背景图像进行叠加处理,得到与所述N帧第二图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧第二图像中对应的第二图像和所述背景图像进行叠加处理得到的;对所述N帧第三图像进行图像编码,得到目标视频。
本方法中,从待处理视频中获取视频片段,对视频片段中的N帧第一图像进行抠像处理,得到与N帧第一图像一一对应的N帧第二图像,对N帧第二图像与获取的背景图像进行叠加处理,得到N帧第三图像,其中,获取的背景图像中包含第一框体元素,第一框体元素用于播放待处理视频;再将N帧第三图像进行图像编码,得到目标视频,使得目标视频具有裸眼3D视觉效果,提高了目标视频的播放效果。
在一种可能的实现方式中,所述N帧第一图像为所述待处理视频中时间连续的N帧图像。
该实现方式中,N帧第一图像为待处理视频中时间连续的N帧图像,时间连续的图像情节也是连续的,最终得到的目标视频的情节也是连续的,使得目标视频的播放效果更好。
在一种可能的实现方式中,所述N帧第一图像中的每帧第一图像包含第一图像元素,所述每帧第一图像中的所述第一图像元素的图像深度大于或等于预设图像深度阈值。
该实现方式中,N帧第一图像中每帧第一图像包含的第一图像元素的图像深度大于或等于预设图像深度阈值,图像深度大的图像元素通常是图像中想要重点呈现给用户的内容,因此对图像深度大的图像元素进行破框播放,更能提高视频的播放效果。
在一种可能的实现方式中,所述N帧第一图像中的所述第一图像元素的图像深度的变化率大于或等于预设变化率阈值。
该实现方式中,N帧第一图像中的第一图像元素的图像深度的变化率大于或等于预设变化率阈值,图像深度的变化率大的图像元素具有更好的视觉破框效果,使得目标视频的裸眼3D视觉效果更好,进一步提高了目标视频的播放效果。
在一种可能的实现方式中,所述N帧第一图像中的所述第一图像元素的图像深度的变化率,包括:第一图像深度与第二图像深度的差值的绝对值与所述第一图像深度的比值,所述第一图像深度为所述第一图像元素在所述N帧第一图像中的最大图像深度,所述第二图像深度为所述第一图像元素在所述N帧第一图像中的最小图像深度。
该实现方式中,N帧第一图像中的第一图像元素的图像深度的变化率可以为第一图像元素在N帧第一图像中的最大图像深度与第一图像元素在N帧第一图像中的最小图像深度的差值的绝对值与第一图像元素在N帧第一图像中的最大图像深度的比值,提高了第一图像元素的图像深度的变化率的准确度,使得第一图像元素的选择更加准确,进一步提高了目标视频的播放效果。
在一种可能的实现方式中,所述对所述N帧第二图像和所述背景图像进行叠加处理,得到与所述N帧第二图像一一对应的N帧第三图像,包括:对所述N帧第二图像进行羽化处理,得到与所述N帧第二图像一一对应的N帧羽化图像,所述N帧羽化图像中每帧羽化图像是对所述N帧第二图像中对应的第二图像进行羽化处理得到的;对所述N帧羽化图像和所述背景图像进行叠加处理,得到与所述N帧羽化图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧羽化图像中对应的羽化图像和所述背景图像进行叠加处理得到的。
该实现方式中,对N帧第二图像进行羽化处理,得到与N帧第二图像一一对应的N帧羽化图像,再对N帧羽化图像和背景图像进行叠加处理,得到与N帧羽化图像一一对应的N帧第三图像,N帧第三图像中每帧第三图像是对N帧羽化图像中对应的羽化图像和背景图像进行叠加处理得到的,经羽化处理得到的N帧羽化图像的边缘能够产生透明渐变层,使得N帧羽化图像与背景图像进行叠加处理时能够更加自然的融合,进一步提高了目标视频的播放效果。
第二方面,本申请提供一种视频处理装置,包括:获取模块,用于获取待处理视频,所述待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数;所述获取模块,还用于从所述待处理视频中获取视频片段,所述视频片段包括所述待处理视频中的N帧第一图像,N为小于或等于M的正整数;所述获取模块,还用于获取背景图像,所述背景图像中包含第一框体元素,所述第一框体元素用于播放所述待处理视频;处理模块,用于对所述N帧第一图像进行抠像处理,得到与所述N帧第一图像一一对应的N帧第二图像,所述N帧第二图像中每帧第二图像是对所述N帧第一图像中对应的第一图像进行抠像处理得到的;所述处理模块,还用于对所述N帧第二图像和所述背景图像进行叠加处理,得到与所述N帧第二图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧第二图像中对应的第二图像和所述背景图像进行叠加处理得到的;编码模块,用于对所述N帧第三图像进行图像编码,得到目标视频。
在一种可能的实现方式中,所述N帧第一图像为所述待处理视频中时间连续的N帧图像。
在一种可能的实现方式中,所述N帧第一图像中的每帧第一图像包含第一图像元素,所述每帧第一图像中的所述第一图像元素的图像深度大于或等于预设图像深度阈值。
在一种可能的实现方式中,所述N帧第一图像中的所述第一图像元素的图像深度的变化率大于或等于预设变化率阈值。
在一种可能的实现方式中,所述N帧第一图像中的所述第一图像元素的图像深度的变化率,包括:第一图像深度与第二图像深度的差值的绝对值与所述第一图像深度的比值,所述第一图像深度为所述第一图像元素在所述N帧第一图像中的最大图像深度,所述第二图像深度为所述第一图像元素在所述N帧第一图像中的最小图像深度。
在一种可能的实现方式中,所述处理模块具体用于:对所述N帧第二图像进行羽化处理,得到与所述N帧第二图像一一对应的N帧羽化图像,所述N帧羽化图像中每帧羽化图像是对所述N帧第二图像中对应的第二图像进行羽化处理得到的;对所述N帧羽化图像和所述背景图像进行叠加处理,得到与所述N帧羽化图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧羽化图像中对应的羽化图像和所述背景图像进行叠加处理得到的。
第二方面及第二方面的各种可能的实现方式中的有益效果可参见第一方面及第一方面的各种可能的实现方式中的有益效果,此处不再赘述。
第三方面,本申请提供一种视频处理装置。该装置可以包括与存储器耦合的处理器。其中,该存储器用于存储程序代码,该处理器用于执行该存储器中的程序代码,以实现第一方面或其中任意一种实现方式中的方法。
可选地,该装置还可以包括该存储器。
第四方面,本申请提供一种芯片,包括至少一个处理器和通信接口,所述通信接口和所述至少一个处理器通过线路互联,所述至少一个处理器用于运行计算机程序或指令,以执行如第一方面或其中任意一种可能的实现方式所述的方法。
第五方面,本申请提供一种计算机可读介质,该计算机可读介质存储用于设备执行的程序代码,该程序代码包括用于执行如第一方面或其中任意一种可能的实现方式所述的方法。
第六方面,本申请提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行如第一方面或其中任意一种可能的实现方式所述的方法。
第七方面,本申请提供一种计算设备,包括至少一个处理器和通信接口,所述通信接口和所述至少一个处理器通过线路互联,所述通信接口与目标系统通信,所述至少一个处理器用于运行计算机程序或指令,以执行如第一方面或其中任意一种可能的实现方式所述的方法。
第八方面,本申请提供一种计算系统,包括至少一个处理器和通信接口,所述通信接口和所述至少一个处理器通过线路互联,所述通信接口与目标系统通信,所述至少一个处理器用于运行计算机程序或指令,以执行如第一方面或其中任意一种可能的实现方式所述的方法。
附图说明
图1为本申请的实施例的一种应用场景的示意图;
图2为本申请的实施例的一种视频处理方法的流程示意图;
图3为本申请的实施例的一种第一图像元素的标记的示意图;
图4为本申请的实施例的一种N帧第二图像的示意图;
图5为本申请的实施例的一种第三图像的示意图;
图6为本申请一个实施例的一种视频处理方法的流程示意图;
图7为本申请一个实施例的视频处理装置的示意性结构图;
图8为本申请一个实施例提供的视频处理装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,首先介绍本申请实施例中涉及到的若干术语。
裸眼三维(3dimensions,3D)技术:指不借助特殊外部硬件实现立体视觉效果的技术。
破框:是指视频元素从一个限制框内突破,以产生3D景深变化的视觉感受。
抠像:是指将视频/图像中的部分元素分离出来。
羽化:是指将图像元素外衔接部分虚化,作为透明渐变层,以达到与背景图像自然衔接的效果。
图像深度:是指图像中各个图像元素(景物)距离相机的距离。
图1为本申请的实施例的一种应用场景的示意图。如图1所示,背景图像101中包含框体102,待播放视频103在框体元素102包含的范围内播放。其中,框体102内包含背景图像101中的一块区域。
随着人们对视频播放效果的需求的提高,本申请提出了一种视频处理方法。本申请提出的视频处理方法对待播放视频进行处理之后,可以得到带有裸眼3D效果的目标视频。
本申请的技术方案中,通过对待播放视频中满足要求的图像元素进行抠像处理,得到图像元素的带透明通道的便携式网络图形(portable network graphics,PNG)图序列;将图像元素的带透明通道的PNG图序列叠加在背景图像上层,使得视频在播放的过程中,图像元素能够达到从框体中破框而出的视觉效果,使用户产生裸眼3D的视觉感受。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请的实施例的一种视频处理方法的流程示意图。如图2所示,该方法至少包括S201至S206。
S201,获取待处理视频,待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数。
作为一种示例,待处理视频可以为广告视频等。
作为一种示例,待处理视频包括按照时间先后顺序排序的M帧第一图像,M帧第一图像中的每帧第一图像可以包括前景图像和后图,前景图像中的元素可以称为主体物。
S202,从待处理视频中获取视频片段,视频片段包括待处理视频中的N帧第一图像,N为小于或等于M的正整数。
在一种可能的实现方式中,对待处理视频中的主体物进行图像深度估计,得到每个主体物的图像深度,再根据每个主体物的图像深度确定第一图像元素和视频片段。
作为一种示例,凭借人工直觉对待处理视频中的主体物进行深度估计,得到每个主体物的图像深度估计值。
作为另一种示例,使用深度学习算法对待处理视频中的主体物进行图像深度估计,得到每个主体物的图像深度。
在一种可能的实现方式中,第一图像元素的图像深度大于或等于预设图像深度阈值。
作为一种示例,将待处理视频中图像深度大于或等于预设图像深度阈值的主体物作为第一图像元素。
在另一种可能的实现方式中,第一图像元素的图像深度的变化率大于或等于预设变化率阈值。
作为一种示例,主体物的图像深度的变化率可以为第一图像深度与第二图像深度的差值的绝对值与第一图像深度的比值,其中,第一图像深度为主体物在M帧第一图像中的最大图像深度,第二图像深度为主体物在M帧第一图像中的最小图像深度。
作为另一种示例,主体物的图像深度的变化率可以为第一图像深度与第二图像深度的差值的绝对值。
作为一种示例,将待处理视频中图像深度的变化率大于或等于预设变化率阈值的主体物作为第一图像元素。
在一种可能的实现方式中,视频片段的N帧第一图像为待处理视频中时间连续的N帧图像,即N帧第一图像中的任意两帧第一图像在待处理视频的M帧第一图像中也是相邻的。
作为一种示例,从M帧第一图像中获取第一图像元素的图像深度的最大值所在的帧与最小值所在的帧之间连续的N帧第一图像作为视频片段,N帧第一图像中的每帧第一图像包含该第一图像元素。
示例性的,若待处理视频中存在多个第一图像元素,则将多个第一图像元素对应的图像深度的最大值所在的帧与最小值所在的帧之间连续的最大帧数第一图像作为视频片段,将该连续的最大帧数记为N。
S203,获取背景图像,背景图像中包含第一框体元素,第一框体元素用于播放待处理视频。
在一种可能的实现方式中,第一框体元素是透明的,不包含图像内容。
作为一种示例,对背景图像中的第一框体元素进行透明处理,将视频片段嵌于背景图像的下层,得到一个基底广告视频,仅把视频片段中的第一图像元素叠在背景图像的上层,此时视频片段仅在第一框体元素内可见。
示例性的,背景图像可以为广告底图等。
示例性的,可以根据需要在背景图像中添加其它图像内容,例如半透明广告角标等。
S204,对N帧第一图像进行抠像处理,得到与N帧第一图像一一对应的N帧第二图像,N帧第二图像中每帧第二图像是对N帧第一图像中对应的第一图像进行抠像处理得到的。
在一种可能的实现方式中,对N帧第一图像的任意一帧第一图像中的第一图像元素进行标记,对标记的第一图像元素进行前后帧跟踪并进行抠像处理,得到N帧第二图像。
作为一种示例,对第一图像元素进行标记可以为对第一图像元素的边缘进行标记,例如,为第一图像元素标上轮廓。
示例性的,图3为本申请的实施例的一种第一图像元素的标记的示意图。如图3所示,为第一图像元素301的轮廓进行标记,得到标记302。
作为一种示例,使用图像跟踪算法对标记的第一图像元素进行前后帧跟踪。
作为一种示例,得到的N帧第二图像可以为带透明通道的第一图像元素的PNG图序列。
示例性的,图4为本申请的实施例的一种N帧第二图像的示意图。如图4所示,N帧第二图像为N张带有透明通道的第一图像元素401的PNG图序列。
S205,对N帧第二图像和背景图像进行叠加处理,得到与N帧第二图像一一对应的N帧第三图像,N帧第三图像中每帧第三图像是对N帧第二图像中对应的第二图像和背景图像进行叠加处理得到的。
在一种可能的实现方式中,将N帧第二图像叠加在背景图像的上层,得到N帧第三图像。
作为一种示例,对N帧第二图像进行羽化处理,得到与N帧第二图像一一对应的N帧羽化图像,N帧羽化图像中每帧羽化图像是对N帧第二图像中对应的第二图像进行羽化处理得到的;再对N帧羽化图像和背景图像进行叠加处理,得到与N帧羽化图像一一对应的N帧第三图像,N帧第三图像中每帧第三图像是对N帧羽化图像中对应的羽化图像与背景图像进行叠加处理得到的。
示例性的,N帧第三图像中任意一帧第三图像的图像透明度满足下列公式:
alpha2=alpha1*rgb1+(1-alpha1)*rgb2
其中,alpha2表示N帧第三图像中任意一帧第三图像的图像透明度,alpha1表示与alpha2中表示的第三图像对应的羽化图像的图像透明度,rgb1表示与alpha2中表示的第三图像对应的羽化图像的图像颜色值,rgb2表示背景图像的图像颜色值,其中,与alpha2中表示的第三图像对应的羽化图像用于指示与背景图像进行叠加处理得到alpha2中表示的第三图像的羽化图像。
示例性的,图5为本申请的实施例的一种第三图像的示意图。如图5所示,将第二图像503叠加在背景图像501的上层,使得第二图像503中的第一图像元素具有突破框体502的效果。
S206,对N帧第三图像进行图像编码,得到目标视频。
在一种可能的实现方式中,通过图像编码技术对N帧第三图像进行图像编码,得到目标视频。
示例性的,编码技术可以包括使用ffmpeg库进行图像编码等。
本申请提供的技术方案,从待处理视频中获取视频片段,对视频片段中的N帧第一图像进行抠像处理,得到与N帧第一图像一一对应的N帧第二图像,对N帧第二图像与获取的背景图像进行叠加处理,得到N帧第三图像,其中,获取的背景图像中包含第一框体元素,第一框体元素用于播放待处理视频;再将N帧第三图像进行图像编码,得到目标视频,使得目标视频具有裸眼3D视觉效果,提高了目标视频的播放效果。
图6为本申请一个实施例的一种视频处理方法的流程示意图。如图6所示,该方法至少包括S601至S608。
S601,获取待处理视频,待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数。
需要说明的是,S601可以参考S201,此处不再进行赘述。
S602,对待处理视频中的主体物进行图像深度估计,得到每个主体物的图像深度。
在一种可能的实现方式中,凭借人工直觉对待处理视频中的主体物进行深度估计,得到每个主体物的图像深度估计值。
在另一种可能的实现方式中,使用深度学习算法对待处理视频中的主体物进行图像深度估计,得到每个主体物的图像深度。
S603,根据每个主体物的图像深度,确定破框元素和待处理视频片段,待处理视频片段包括待处理视频中的N帧第一图像,N为小于或等于M的正整数。
在一种可能的实现方式中,将待处理视频中图像深度大于或等于预设图像深度阈值的主体物作为破框元素。
在另一种可能的实现方式中,将待处理视频中图像深度的变化率大于或等于预设变化率阈值的主体物作为破框元素。
作为一种示例,主体物的图像深度的变化率可以为第一图像深度与第二图像深度的差值的绝对值与第一图像深度的比值,其中,第一图像深度为主体物在M帧第一图像中的最大图像深度,第二图像深度为主体物在M帧第一图像中的最小图像深度。
作为另一种示例,主体物的图像深度的变化率可以为第一图像深度与第二图像深度的差值的绝对值。
在一种可能的实现方式中,待处理视频片段中的N帧第一图像为待处理视频中时间连续的N帧图像,即N帧第一图像中的任意两帧第一图像在待处理视频的M帧第一图像中也是相邻的。
作为一种示例,从M帧第一图像中获取破框元素的图像深度的最大值所在的帧与最小值所在的帧之间连续的N帧第一图像作为待处理视频片段,N帧第一图像中的每帧第一图像包含该破框元素。
示例性的,若待处理视频中存在多个破框元素,则将多个破框元素对应的图像深度的最大值所在的帧与最小值所在的帧之间连续的最大帧数第一图像作为待处理视频片段,将该连续的最大帧数记为N。
S604,对待处理视频片段中的破框元素进行抠像处理,得到N帧第二图像。
在一种可能的实现方式中,对待处理视频片段中N帧第一图像的任意一帧第一图像中的破框元素进行标记,对标记的破框元素进行前后帧跟踪和抠像处理,得到N帧第二图像。
作为一种示例,对破框元素进行标记可以为对破框元素的边缘进行标记,例如,为破框元素标上轮廓。
示例性的,破框元素的标记的一种示例可以参考图3。
作为一种示例,使用图像跟踪算法对标记的破框元素进行前后帧跟踪。
作为一种示例,得到的N帧第二图像可以为带透明通道的破框元素的PNG图序列。
示例性的,N帧第二图像的一种示例可以参考图4。
S605,对N帧第二图像进行羽化处理,得到N帧羽化图像。
在一种可能的实现方式中,对N帧第二图像进行羽化处理,得到与N帧第二图像一一对应的N帧羽化图像,N帧羽化图像中每帧羽化图像是对N帧第二图像中对应的第二图像进行羽化处理得到的。
S606,获取背景图像,背景图像中包含第一框体元素,第一框体元素用于播放待处理视频。
在一种可能的实现方式中,第一框体元素是透明的,不包含图像内容。
作为一种示例,对背景图像中的第一框体元素进行透明处理,将待处理视频片段嵌于背景图像的下层,得到一个基底广告视频,仅把视频片段中的破框元素叠在背景图像的上层,此时待处理视频片段仅在第一框体元素内可见。
示例性的,背景图像可以为广告底图等。
示例性的,可以根据需要在背景图像中添加其它图像内容,例如半透明广告角标等。
S607,对N帧羽化图像和背景图像进行叠加处理,得到N帧第三图像。
在一种可能的实现方式中,将N帧羽化图像叠加在背景图像的上层,得到N帧第三图像。
作为一种示例,N帧第三图像中任意一帧第三图像的图像透明度满足下列公式:
alpha2=alpha1*rgb1+(1-alpha1)*rgb2
其中,alpha2表示N帧第三图像中任意一帧第三图像的图像透明度,alpha1表示与alpha2中表示的第三图像对应的羽化图像的图像透明度,rgb1表示与alpha2中表示的第三图像对应的羽化图像的图像颜色值,rgb2表示背景图像的图像颜色值,其中,与alpha2中表示的第三图像对应的羽化图像用于指示与背景图像进行叠加处理得到alpha2中表示的第三图像的羽化图像。
示例性的,第三图像的一种示例可以参考图5。
S608,对N帧第三图像进行图像编码,得到目标视频。
需要说明的是,S608可以参考S206,此处不再进行赘述。
本申请提供的技术方案,利用破框元素在破框时的景深变化产生裸眼3D的视错觉效果,使高曝光的标版、前情类广告视频等产生更好的播放效果,可明显提高广告的转化率,降低广告的跳播率;通过深度估计、图像跟踪、抠像算法等实现破框元素的高效准确分离,从而实现了将破框元素透明叠加于基底视频上,提高了视频的播放效果;利用边缘羽化来降低生硬抠像造成的视觉瑕疵感,羽化可形成透明渐变层,使得破框元素与背景图像的融合更为自然,3D效果更佳。
图7为本申请一个实施例的视频处理装置的示意性结构图。如图7所示,装置700可以包括获取模块701、处理模块702和编码模块703。
本申请实施例中的获取模块、处理模块和编码模块中任意模块可以全部或部分通过软件和/硬件方式实现。其中,通过软件实现的部分可以在处理器上运行以实现相应的功能,通过硬件方式实现的部分可以是处理器的构成部分。
在一种实现方式中,装置700可以用于实现上述图2所示的方法,例如,获取模块701用于实现S201、S202和S203,处理模块702用于实现S204和S205,编码模块703用于实现S206。
在另一种实现方式中,装置700还可以包括图像深度估计模块和确定模块,该实现方式中的装置700可以用于实现上述图6所示的方法,例如,获取模块701用于实现S601和S606,处理模块702用于实现S604、S605和S607,编码模块703用于实现S608,图像深度估计模块用于实现S602,确定模块用于实现S603。
图8为本申请一个实施例提供的视频处理装置的结构示意图。图8所示的装置800可以用于执行前述任意一个实施例所述的方法。
如图8所示,本实施例的装置800包括:存储器801、处理器802、通信接口803以及总线804。其中,存储器801、处理器802、通信接口803通过总线804实现彼此之间的通信连接。
存储器801可以是只读存储器(read only memory,ROM),静态存储设备,动态存储设备或者随机存取存储器(random access memory,RAM)。存储器801可以存储程序,当存储器801中存储的程序被处理器802执行时,处理器802可以用于执行图2或图6所示的方法的各个步骤。
处理器802可以采用通用的中央处理器(central processing unit,CPU),微处理器,应用专用集成电路(application specific integrated circuit,ASIC),或者一个或多个集成电路,用于执行相关程序,以实现本申请方法实施例的视频处理方法。
处理器802还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本申请各个实施例的方法的各个步骤可以通过处理器802中的硬件的集成逻辑电路或者软件形式的指令完成。
上述处理器802还可以是通用处理器、数字信号处理器(digital signalprocessing,DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gatearray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器801,处理器802读取存储器801中的信息,结合其硬件完成本申请实施例中各个方法所需执行的功能,例如,可以执行图2或图6所示实施例的各个步骤/功能。
通信接口803可以使用但不限于收发器一类的收发装置,来实现装置800与其他设备或通信网络之间的通信。
总线804可以包括在装置800各个部件(例如,存储器801、处理器802、通信接口803)之间传送信息的通路。
应理解,本申请实施例所示的装置800可以是电子设备,或者,也可以是配置于电子设备中的芯片。
还应理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)。当该计算机程序被运行时,使得计算机执行如图2或图6所示实施例的各个步骤/功能。
本说明书中使用的术语“单元”、“模块”等,可用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step),能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。在本申请所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
该作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,各功能单元的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令(程序)。在计算机上加载和执行该计算机程序指令(程序)时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solidstate disk,SSD))等。
该功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种视频处理方法,其特征在于,包括:
获取待处理视频,所述待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数;
从所述待处理视频中获取视频片段,所述视频片段包括所述待处理视频中的N帧第一图像,N为小于或等于M的正整数;所述N帧第一图像中的每帧第一图像包含第一图像元素,所述每帧第一图像中的所述第一图像元素的图像深度大于或等于预设图像深度阈值;获取背景图像,所述背景图像中包含第一框体元素,所述第一框体元素用于播放所述待处理视频;
对所述N帧第一图像中的第一图像元素进行抠像处理,得到与所述N帧第一图像一一对应的N帧第二图像,所述N帧第二图像中每帧第二图像是对所述N帧第一图像中对应的第一图像进行抠像处理得到的;
将所述N帧第二图像叠加在所述背景图像的上层,得到与所述N帧第二图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧第二图像中对应的第二图像和所述背景图像进行叠加处理得到的;
对所述N帧第三图像进行图像编码,得到目标视频。
2.根据权利要求1所述的方法,其特征在于,所述N帧第一图像为所述待处理视频中时间连续的N帧图像。
3.根据权利要求2所述的方法,其特征在于,所述N帧第一图像中的所述第一图像元素的图像深度的变化率大于或等于预设变化率阈值。
4.根据权利要求3所述的方法,其特征在于,所述N帧第一图像中的所述第一图像元素的图像深度的变化率,包括:第一图像深度与第二图像深度的差值的绝对值与所述第一图像深度的比值,所述第一图像深度为所述第一图像元素在所述N帧第一图像中的最大图像深度,所述第二图像深度为所述第一图像元素在所述N帧第一图像中的最小图像深度。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述对所述N帧第二图像和所述背景图像进行叠加处理,得到与所述N帧第二图像一一对应的N帧第三图像,包括:
对所述N帧第二图像进行羽化处理,得到与所述N帧第二图像一一对应的N帧羽化图像,所述N帧羽化图像中每帧羽化图像是对所述N帧第二图像中对应的第二图像进行羽化处理得到的;
对所述N帧羽化图像和所述背景图像进行叠加处理,得到与所述N帧羽化图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧羽化图像中对应的羽化图像和所述背景图像进行叠加处理得到的。
6.一种视频处理装置,其特征在于,包括:
获取模块,用于获取待处理视频,所述待处理视频包括按照时间先后顺序排序的M帧第一图像,M为正整数;
所述获取模块还用于从所述待处理视频中获取视频片段,所述视频片段包括所述待处理视频中的N帧第一图像,N为小于或等于M的正整数;所述N帧第一图像中的每帧第一图像包含第一图像元素,所述每帧第一图像中的所述第一图像元素的图像深度大于或等于预设图像深度阈值;
所述获取模块还用于获取背景图像,所述背景图像中包含第一框体元素,所述第一框体元素用于播放所述待处理视频;
处理模块,用于对所述N帧第一图像中的第一图像元素进行抠像处理,得到与所述N帧第一图像一一对应的N帧第二图像,所述N帧第二图像中每帧第二图像是对所述N帧第一图像中对应的第一图像进行抠像处理得到的;
所述处理模块还用于将所述N帧第二图像叠加在所述背景图像的上层,得到与所述N帧第二图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧第二图像中对应的第二图像和所述背景图像进行叠加处理得到的;
编码模块,用于对所述N帧第三图像进行图像编码,得到目标视频。
7.根据权利要求6所述的装置,其特征在于,所述N帧第一图像为所述待处理视频中时间连续的N帧图像。
8.根据权利要求7所述的装置,其特征在于,所述N帧第一图像中的所述第一图像元素的图像深度的变化率大于或等于预设变化率阈值。
9.根据权利要求8所述的装置,其特征在于,所述N帧第一图像中的所述第一图像元素的图像深度的变化率,包括:第一图像深度与第二图像深度的差值的绝对值与所述第一图像深度的比值,所述第一图像深度为所述第一图像元素在所述N帧第一图像中的最大图像深度,所述第二图像深度为所述第一图像元素在所述N帧第一图像中的最小图像深度。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述处理模块具体用于:
对所述N帧第二图像进行羽化处理,得到与所述N帧第二图像一一对应的N帧羽化图像,所述N帧羽化图像中每帧羽化图像是对所述N帧第二图像中对应的第二图像进行羽化处理得到的;
对所述N帧羽化图像和所述背景图像进行叠加处理,得到与所述N帧羽化图像一一对应的N帧第三图像,所述N帧第三图像中每帧第三图像是对所述N帧羽化图像中对应的羽化图像和所述背景图像进行叠加处理得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210294022.8A CN114650406B (zh) | 2022-03-23 | 2022-03-23 | 视频处理方法、视频处理装置和计算机存储可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210294022.8A CN114650406B (zh) | 2022-03-23 | 2022-03-23 | 视频处理方法、视频处理装置和计算机存储可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114650406A CN114650406A (zh) | 2022-06-21 |
CN114650406B true CN114650406B (zh) | 2022-12-30 |
Family
ID=81996457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210294022.8A Active CN114650406B (zh) | 2022-03-23 | 2022-03-23 | 视频处理方法、视频处理装置和计算机存储可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114650406B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116389817A (zh) * | 2023-04-18 | 2023-07-04 | 北京优酷科技有限公司 | 一种数据展示方法、装置、电子设备及计算机存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101827258A (zh) * | 2010-02-05 | 2010-09-08 | 北京水晶石数字科技有限公司 | 一种实时抠像及视频监视和采集系统 |
CN108848325A (zh) * | 2018-06-26 | 2018-11-20 | 蒋大武 | 一种基于自然图像抠像的视频合成方法 |
CN109840949A (zh) * | 2017-11-29 | 2019-06-04 | 深圳市掌网科技股份有限公司 | 基于光学定位的增强现实图像处理方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7675540B2 (en) * | 2003-08-19 | 2010-03-09 | Kddi Corporation | Concealed regions complementing system of free viewpoint video images |
US9628722B2 (en) * | 2010-03-30 | 2017-04-18 | Personify, Inc. | Systems and methods for embedding a foreground video into a background feed based on a control input |
-
2022
- 2022-03-23 CN CN202210294022.8A patent/CN114650406B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101827258A (zh) * | 2010-02-05 | 2010-09-08 | 北京水晶石数字科技有限公司 | 一种实时抠像及视频监视和采集系统 |
CN109840949A (zh) * | 2017-11-29 | 2019-06-04 | 深圳市掌网科技股份有限公司 | 基于光学定位的增强现实图像处理方法和装置 |
CN108848325A (zh) * | 2018-06-26 | 2018-11-20 | 蒋大武 | 一种基于自然图像抠像的视频合成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114650406A (zh) | 2022-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10008021B2 (en) | Parallax compensation | |
US9866815B2 (en) | 3D object segmentation | |
US11050994B2 (en) | Virtual reality parallax correction | |
US9324184B2 (en) | Image three-dimensional (3D) modeling | |
CN109478344B (zh) | 用于合成图像的方法和设备 | |
US20160198097A1 (en) | System and method for inserting objects into an image or sequence of images | |
US20130215220A1 (en) | Forming a stereoscopic video | |
US20090219383A1 (en) | Image depth augmentation system and method | |
US20130127988A1 (en) | Modifying the viewpoint of a digital image | |
WO2014178966A1 (en) | Diminished and mediated reality effects from reconstruction | |
US20140028794A1 (en) | Video communication with three dimensional perception | |
CN106897648A (zh) | 识别二维码位置的方法及其系统 | |
CN103582893A (zh) | 用于增强现实表示的二维图像获取 | |
CN109644280B (zh) | 生成场景的分层深度数据的方法 | |
CN105611267B (zh) | 现实世界和虚拟世界图像基于深度和色度信息的合并 | |
CN105612742A (zh) | 重新映射深度图以用于3d观看 | |
CN114650406B (zh) | 视频处理方法、视频处理装置和计算机存储可读介质 | |
CN103150729A (zh) | 一种虚拟视图渲染方法 | |
US9760793B2 (en) | Apparatus and computer-implemented method for generating a three-dimensional scene and non-transitory tangible computer readable medium thereof | |
US20140293018A1 (en) | Method and Device for Generating an Image View for 3D Display | |
US20150256819A1 (en) | Method, program and apparatus for reducing data size of a plurality of images containing mutually similar information | |
KR20120118462A (ko) | 이미지 기반의 비주얼 헐에서의 오목 표면 모델링 | |
US20190005736A1 (en) | Method and apparatus for calculating a 3d density map associated with a 3d scene | |
EP3716217A1 (en) | Techniques for detection of real-time occlusion | |
CN118075442A (zh) | 基于视差的裸眼3d显示方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 554, 5 / F, building 3, 969 Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba (China) Co.,Ltd. Address before: 310056 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou, Zhejiang Applicant before: Alibaba (China) Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |