CN113436072A - 一种视频画幅裁剪方法及装置 - Google Patents
一种视频画幅裁剪方法及装置 Download PDFInfo
- Publication number
- CN113436072A CN113436072A CN202110704744.1A CN202110704744A CN113436072A CN 113436072 A CN113436072 A CN 113436072A CN 202110704744 A CN202110704744 A CN 202110704744A CN 113436072 A CN113436072 A CN 113436072A
- Authority
- CN
- China
- Prior art keywords
- image
- frame
- scene
- coordinate
- barycentric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000005520 cutting process Methods 0.000 claims abstract description 29
- 230000005484 gravity Effects 0.000 claims abstract description 6
- 238000009499 grossing Methods 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/66—Analysis of geometric attributes of image moments or centre of gravity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20224—Image subtraction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种视频画幅裁剪方法及装置,其中,所述方法包括:将待处理视频分割为多个场景片段;其中,每个场景片段由多帧包含相同场景画面的图像组成;分别检测出每个场景片段的首帧图像中的显著性对象;针对每个场景片段,确定显著性对象在场景片段的每帧图像中的坐标参数;利用跟踪到的每帧图像中的显著性对象的坐标参数,计算得到每帧图像对应的重心坐标;其中,坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标;针对每帧图像,以图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至目标宽高比进行裁剪,从而可以有效保证裁剪后的图像中包含有主体内容。
Description
技术领域
本申请涉及画幅裁剪技术领域,特别涉及一种视频画幅裁剪方法及装置。
背景技术
标准制作的视频的画幅的宽高比一般为16:9、4:3或21:9。但随着视频播放终端设备的和终端播放形式的不断增加,出现了18:9、19:9、3:2等宽高比的显示屏的宽屏收集或平板电脑,以及竖屏播放等形式,从而会出现视频源和显示屏的画幅不匹配的情况,进而导致播放效果不佳。
为了解决视频源和显示屏的画幅不匹配的情况,现今通常会通过机器裁剪或人工裁剪的方式,将视频源的画幅裁剪为需要输出的目标宽高比。但是由于人工裁剪存在效率低,成本高等问题。所以现今主要采用机器裁剪的方式进行采集。现今的机器裁剪的方式,主要是基于图像中的某个区域坐标,裁剪出目标宽高比的固定区域。
但是,由于机器裁剪只能以取某个区域的坐标的固定规则来裁剪,缺乏对视频内容的识别和裁剪的自适应判断能力,所以容易出现主体内容脱离裁剪窗口的情况,从而导致裁剪出的图像中不包含有原本图像中的主体内容,即视频中主观感兴趣的关键人物或物体对象被裁剪掉,影响裁剪后视频的播放效果。
发明内容
基于上述现有技术的不足,本申请提供了一种视频画幅裁剪方法及装置,以解决现有的裁剪方法容易出现主体内容脱离裁剪窗口的问题。
为了实现上述目的,本申请提供了以下技术方案:
本申请第一方面提供了一种视频画幅裁剪方法,包括:
将待处理视频分割为多个场景片段;其中,每个所述场景片段由多帧包含相同场景画面的图像组成;
分别检测出每个所述场景片段的首帧图像中的显著性对象;
针对每个所述场景片段,确定所述显著性对象在所述场景片段的每帧图像中的坐标参数;其中,所述坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标;
利用跟踪到的每帧所述图像中的显著性对象的坐标参数,计算得到每帧所述图像对应的重心坐标;
针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
可选地,在上述的方法中,所述利用跟踪到的每帧所述图像中的显著性对象的坐标参数,计算得到每帧所述图像对应的重心坐标之后,还包括:
对每帧所述图像对应的重心坐标进行时序平滑处理,得到处理后的每帧所述对应的重心坐标;
其中,所述针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪,包括:
针对每帧所述图像,以处理后的所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
可选地,在上述的方法中,所述对每帧所述图像对应的重心坐标进行时序平滑处理,得到处理后的每帧所述对应的重心坐标,包括:
确定出每帧所述图像对应的目标图像;其中,一帧所述图像及其对应的目标图像属于同一所述场景片段,且对应的时间戳是连续;一帧所述图像对应的目标帧包括位于所述图像前的N帧图像,以及位于所述图像后的N帧图像;
计算每帧所述图像对应的重心坐标的横坐标,与其对应的各帧所述目标图像对应的重心坐标的横坐标的均值,以及计算每帧所述图像对应的重心坐标的纵坐标,与其对应的各帧所述目标图像对应的重心坐标的纵坐标的均值,得到处理后的每帧所述图像对应的重心坐标。
可选地,在上述的方法中,所述将待处理视频分割为多个场景片段,包括:
通过场景变换算法检测出所述待处理视频中发生场景画面切换的各个时间戳;
从各个所述时间戳对应的位置对所述待处理视频进行分割,得到多个场景片段。
可选地,在上述的方法中,所述针对每个所述场景片段,跟踪所述场景片段的首帧图像中的显著性对象,在所述场景片段的每帧图像中的坐标参数,包括:
分别针对每个所述场景片段,以所述场景片段的首帧图像中的显著性对象作为跟踪对象;
以所述场景片段的首帧图像为起始图像,逐帧检测所述场景片段的每帧图像中的所述跟踪对象的坐标参数。
本申请第二方面提供了一种视频画幅裁剪装置,包括:
分割单元,用于将待处理视频分割为多个场景片段;其中,每个所述场景片段由多帧包含相同场景画面的图像组成;
对象检测单元,用于分别检测出每个所述场景片段的首帧图像中的显著性对象;
跟踪单元,用于针对每个所述场景片段,确定所述显著性对象在所述场景片段的每帧图像中的坐标参数;其中,所述坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标;
坐标确定单元,用于利用跟踪到的每帧所述图像中的显著性对象的坐标参数,计算得到每帧所述图像对应的重心坐标;
裁剪单元,用于针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
可选地,在上述的装置中,还包括:
平滑处理单元,用于对每帧所述图像对应的重心坐标进行时序平滑处理,得到处理后的每帧所述对应的重心坐标;
其中,所述裁剪单元执行所述针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪时,用于:
针对每帧所述图像,以处理后的所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
可选地,在上述的装置中,所述平滑处理单元,包括:
目标图像确定单元,用于确定出每帧所述图像对应的目标图像;其中,一帧所述图像及其对应的目标图像属于同一所述场景片段,且对应的时间戳是连续;一帧所述图像对应的目标帧包括位于所述图像前的N帧图像,以及位于所述图像后的N帧图像;
平滑处理子单元,用于计算每帧所述图像对应的重心坐标的横坐标,与其对应的各帧所述目标图像对应的重心坐标的横坐标的均值,以及计算每帧所述图像对应的重心坐标的纵坐标,与其对应的各帧所述目标图像对应的重心坐标的纵坐标的均值,得到处理后的每帧所述图像对应的重心坐标。
可选地,在上述的装置中,所述分割单元,包括:
场景检测单元,用于通过场景变换算法检测出所述待处理视频中发生场景画面切换的各个时间戳;
分割子单元,用于从各个所述时间戳对应的位置对所述待处理视频进行分割,得到多个场景片段。
可选地,在上述的装置中,所述跟踪单元,包括:
跟踪对象确定单元,用于分别针对每个所述场景片段,以所述场景片段的首帧图像中的显著性对象作为跟踪对象;
跟踪子单元,用于以所述场景片段的首帧图像为起始图像,逐帧检测所述场景片段的每帧图像中的所述跟踪对象的坐标参数。
本申请提供的一种视频画幅裁剪方法,通过将待处理视频分割为场景片段,每个场景片段是由多帧包含相同场景画面的图像组成的,以便对图像中的显著性对象进行准确的检测和跟踪。然后先分别检测出每个场景片段的首帧图像中的显著性对象,并跟踪场景片段的首帧图像中的显著性对象,确定其在场景片段中的每帧图像中的坐标参数。然后利用显著性对象的坐标参数,计算得到每帧图像对应的重心坐标,由于图像对应的重心坐标是基于图像中的显著性对象对应的左右边界坐标以及对应的上下边界坐标计算得到,所以在针对每帧图像,以图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至不同的目标宽高比进行裁剪时,可以有效的保证所裁剪出得到图像中包含有显著性对象,从而避免了裁剪出的图像中的内容不包含有原图像的主体内容的情况。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种视频画幅裁剪方法的流程图;
图2为本申请实施例提供的一种场景片段的分割示意图;
图3为本申请实施例提供的一种分割场景片段的方法的流程图;
图4为本申请实施例提供的跟踪的图像中的显著性对象的示意图;
图5为本申请实施例提供的一种跟踪显著性对象的方法的流程图;
图6为本申请另一实施例提供的另一种视频画幅裁剪方法的流程图;
图7为本申请另一实施例提供的一种对坐标进行时序平滑处理的方法的流程图;
图8为本申请另一实施例提供的一种视频画幅裁剪装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种视频画幅裁剪方法,如图1所示,具体包括以下步骤:
S101、将待处理视频分割为多个场景片段。
其中,每个场景片段由多帧包含相同场景画面的图像组成。所以,如图2所示,可以基于待处理视频中场景画面的变化,将待处理视频分割为多个场景片段。
可选地,本申请另一实施例中,步骤S101的一种具体实施方式,如图3所示,包括以下步骤:
S301、通过场景变换算法检测出待处理视频中发生场景画面切换的各个时间戳。
S302、从各个时间戳对应的位置对待处理视频进行分割,得到多个场景片段。
具体的,可以是检测出场景画面变换后的第一帧图像的时间戳,后续从每个时间戳对应的图像及其上一帧图像的位置处进行分割,即两帧图像分别属于两个场景片段。
S102、分别检测出每个场景片段的首帧图像中的显著性对象。
需要说明的是,人类在观察一个场景时,视觉系统会接收大量的视觉信号数据,但是人脑并不能同时处理这些信息,所以其会优先选择感兴趣区域处理。即人类视觉系统对一个场景中的每个对象,并不是都有相同强度的注意力,而是有选择性地、快速地检测出场景中的显著的对象,从而快速获取有价值的视觉信息,这种能力称为视觉注意力机制,而这些能快速吸引人注意的对象被称为显著性对象。
通常显著性对象在颜色、形状、亮度等特征上,会明显区别于图像中不属于显著性对象的区域,所以具体可以基于显著性对象的特征,如颜色、光照、形状、方向,先对图像中的显著性对象进行检测。
还需要说明的是,本申请实施例中,只需要检测每个场景片段的首帧图像中的显著性对象。由于,每个场景片段是由具有相同场景画面的图像组成的,所以一个场景片段包含的显著性对象是一致,因此后续可以将检测出的显著性对象作为跟踪目标,跟踪出场景片段的所有图像中的显著性对象。并且,采用先检测场景片段的首帧图像中的显著性对象,再利用跟踪算法进行跟踪的方式,可以有效避免视频淡入淡出等变化,对显著性对象检测的误判的情况的发生。
S103、针对每个场景片段,确定显著性对象在所述场景片段的每帧图像中的坐标参数。
其中,坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标。左右边界坐标具体包括左边界坐标和右边界坐标,上下边界坐标包括上边界坐标和下边界坐标。
需要说明的是,在对显著性对象跟踪时通常为对显著性对象所处的一个区域进行跟踪,例如,如图4所示,虚线表示图像,“A”为图像中的显著性对象,而虚线部分即为显著性对象所处的区域。所以,坐标参数通常指的是显著性对象所处的区域的坐标参数,而不是显著性对象的轮廓的坐标参数。而该区域可以大于或小于显著性对象的轮廓。
可选地,坐标参数中还可以包括有图像的时间戳,以能根据时间戳确定坐标参数与图像的对应关系。
可选地,步骤S103的一种具体实施方式,如图5所示,包括以下步骤:
S501、分别针对每个场景片段,以场景片段的首帧图像中的显著性对象作为跟踪对象。
S502、以场景片段的首帧图像为起始图像,逐帧检测场景片段的每帧图像中的跟踪对象的坐标参数。
S104、利用跟踪到的每帧图像中的显著性对象的坐标参数,计算得到每帧图像对应的重心坐标。
需要说明的是,由于每帧图像对应的重新坐标是基于每帧图像中的显著性对象的坐标参数计算得到,所以每帧图像对应的重心坐标即为每帧图像中的显著性对象的重心坐标。所以,一帧图像对应的重心坐标并不是一帧对象的正中心的位置坐标,其更趋近于或等于人在观看该帧图像时的注视点的坐标,即在注视图像中的显著性对象时的注视点的坐标。例如,图4中的a点的坐标。
可选地,可以通过过滤掉显著性对象的所处区域中的弱显著性区域的方式,与其他方式相结合,例如当显著性对象通常为人物,可以结合说话人物检测技术,确定出图像的重心,然后再基于显著性对象的坐标参数计算得到重心坐标。
S105、针对每帧图像,以图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至目标宽高比进行裁剪。
需要说明的是,通常裁剪后的图像不仅尺寸为目标宽高比,并且裁剪后的图像对应的重心坐标应该不变,从而可以达到最佳的展示效果。
可选地,由于裁剪过程中,通常在保证裁剪尺寸为目标宽高比的情况,尽可能裁剪出最大的图像,所以在裁剪过程中通常存在只需要裁剪水平方向或垂直方式的情况,如图4所示,只需要裁剪垂直方式即可。所以先确定图像的水平方向或垂直方向达到最大边界,即是否不需要进行裁剪,然后对于需要裁剪的方向,再是以图像对应的重心坐标所处位置为基准点,进行调整直至宽高比为目标宽高比。
本申请实施例的一种视频画幅裁剪方法,通过将待处理视频分割为场景片段,以便对图像中的显著性对象进行准确的检测和跟踪。然后先分别检测出每个场景片段的首帧图像中的显著性对象,由于每个场景片段是由多帧包含相同场景画面的图像组成的,所以可以针对每个场景片段,跟踪场景片段的首帧图像中的显著性对象,在场景片段的每帧图像中的坐标参数。然后利用跟踪到的每帧图像中的显著性对象的坐标参数,计算得到每帧图像对应的重心坐标,由于图像对应的重心坐标是基于图像中的显著性对象对应的左右边界坐标以及对应的上下边界坐标计算得到,所以最后可以针对每帧图像,以图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至不同的目标宽高比进行裁剪时,都可以有效的保证所裁剪出得到图像中包含有显著性对象,从而避免了裁剪出的图像中的内容不符合视频的原始创造意图的问题。
本申请另一实施例提供了另一种视频画幅裁剪方法,如图6所示,具体包括以下步骤:
S601、将待处理视频分割为多个场景片段。
其中,每个场景片段由多帧包含相同场景画面的图像组成。
需要说明的是,步骤S601的具体实施方式可相应地参考步骤S101,此处不再赘述。
S602、分别检测出每个场景片段的首帧图像中的显著性对象。
需要说明的是,步骤S602的具体实施方式可相应地参考步骤S101,此处不再赘述。
S603、针对每个场景片段,跟踪场景片段的首帧图像中的显著性对象,在场景片段的每帧图像中的坐标参数。
需要说明的是,步骤S603的具体实施方式可相应地参考步骤S102,此处不再赘述。
S604、利用跟踪到的每帧图像中的显著性对象的坐标参数,计算得到每帧图像对应的重心坐标。
其中,坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标。
需要说明的是,步骤S604的具体实施方式可相应地参考步骤S104,此处不再赘述。
S605、对每帧图像对应的重心坐标进行时序平滑处理,得到处理后的每帧对应的重心坐标。
由于目标跟踪算法可能存在抖动问题、位移坐标在时序可能存在颤动现象,以及跟踪的目标正常的小幅运动等情况的发生,所以需要进行时序平滑处理,以解决画面颤动问题,提高裁剪后的视频的观看体验。
具体的,可以针对每帧图像,计算该帧图像对应重心坐标与其前后的属于同一场景片断的多帧图像对应的重心坐标求平均值,得到处理后的该帧图像对应的重心坐标。
可选地,步骤S505的一种具体实施方式,如图7所示,包括以下步骤:
S701、确定出每帧图像对应的目标图像。
其中,一帧图像及其对应的目标图像属于同一场景片段,且对应的时间戳是连续。一帧图像对应的目标帧包括位于图像前的N帧图像,以及位于图像后的N帧图像。针对一个场景片段中的图像,以一帧图像为中心,向前依次选取N帧图像,以及向后依次选取N帧图像,作为该帧对象对应的目标图像。可选地,若先前选取不到N帧图像,即该帧图像前的该场景片段的图像的帧数小于N,则可以复制该场景片段的首帧图像,凑到N帧图像。同理,对于向后选取不同N帧图像的情况,可以通过复制该场景片段的最后一帧图像,凑足N帧图像。当然,这只是其中一种可选的方式,可以采用其他的策略补齐目标图像。
S702、计算每帧图像对应的重心坐标的横坐标,与其对应的各帧目标图像对应的重心坐标的横坐标的均值,以及计算每帧图像对应的重心坐标的纵坐标,与其对应的各帧目标图像对应的重心坐标的纵坐标的均值,得到处理后的每帧图像对应的重心坐标。
具体的,分别计算一帧图像与其对应的目标图像对应的重心坐标的横坐标的均值,以及计算一帧图像与其对应的目标图像对应的重心坐标的纵坐标的均值,然后将横坐标的均值和纵坐标的均值组合,即得到处理后的该帧图像对应的重心坐标。
对于t时刻的图像,计算该帧图像对应的重心坐标的横坐标,与其对应的各帧目标图像对应的重心坐标的横坐标的均值,可以表示为:
其中,n为t时刻的图像前或后的目标图像的数量;xt表示t时刻的图像对应的重心坐标的横坐标;xt-i表示(t-i)时刻的图像对应的重心坐标的横坐标;xt+i表示(t+i)时刻的图像对应的重心坐标的横坐标。
同理,对于t时刻的图像,计算每帧图像对应的重心坐标的纵坐标,与其对应的各帧目标图像对应的重心坐标的纵坐标的均值,可以表示为:
其中,n为t时刻的图像前或后的目标图像的数量;yt表示t时刻的图像对应的重心坐标的纵坐标;yt-i表示(t-i)时刻的图像对应的重心坐标的纵坐标;yt+i表示(t+i)时刻的图像对应的重心坐标的纵坐标。
S606、针对每帧图像,以处理后的图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至目标宽高比进行裁剪。
需要说明的是,步骤S606的具体实施方式可相应地参考步骤S105,此处不再赘述。
本申请另一实施例提供了一种视频画幅裁剪装置,如图8所示,包括以下单元:
分割单元801,用于将待处理视频分割为多个场景片段。
其中,每个场景片段由多帧包含相同场景画面的图像组成。
对象检测单元802,用于分别检测出每个场景片段的首帧图像中的显著性对象。
跟踪单元803,用于针对每个场景片段,确定显著性对象在场景片段的每帧图像中的坐标参数。
其中,坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标。
坐标确定单元804,用于利用跟踪到的每帧图像中的显著性对象的坐标参数,计算得到每帧图像对应的重心坐标。
裁剪单元805,用于针对每帧图像,以图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至目标宽高比进行裁剪。
可选地,在本申请另一实施例提供的视频画幅裁剪装置中,还进一步包括:
平滑处理单元,用于对每帧图像对应的重心坐标进行时序平滑处理,得到处理后的每帧对应的重心坐标。
其中,本申请实施例中的裁剪单元执行针对每帧图像,以图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至目标宽高比进行裁剪时,用于:
针对每帧图像,以处理后的图像对应的重心坐标所处位置为基准点,将每帧图像的尺寸调整至目标宽高比进行裁剪。
可选地,在本申请另一实施例提供的视频画幅裁剪装置中,平滑处理单元,包括:
目标图像确定单元,用于确定出每帧图像对应的目标图像。
其中,一帧图像及其对应的目标图像属于同一场景片段,且对应的时间戳是连续。一帧图像对应的目标帧包括位于图像前的N帧图像,以及位于图像后的N帧图像。
平滑处理子单元,用于计算每帧图像对应的重心坐标的横坐标,与其对应的各帧目标图像对应的重心坐标的横坐标的均值,以及计算每帧图像对应的重心坐标的纵坐标,与其对应的各帧目标图像对应的重心坐标的纵坐标的均值,得到处理后的每帧图像对应的重心坐标。
可选地,在本申请另一实施例提供的视频画幅裁剪装置中,分割单元,包括:
场景检测单元,用于通过场景变换算法检测出待处理视频中发生场景画面切换的各个时间戳。
分割子单元,用于从各个时间戳对应的位置对待处理视频进行分割,得到多个场景片段。
可选地,在本申请另一实施例提供的视频画幅裁剪装置中,跟踪单元,包括:
跟踪对象确定单元,用于分别针对每个场景片段,以场景片段的首帧图像中的显著性对象作为跟踪对象。
跟踪子单元,用于以场景片段的首帧图像为起始图像,逐帧检测场景片段的每帧图像中的跟踪对象的坐标参数。
需要说明的是,本申请上述实施例提供的各个单元的具体工作过程,可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种视频画幅裁剪方法,其特征在于,包括:
将待处理视频分割为多个场景片段;其中,每个所述场景片段由多帧包含相同场景画面的图像组成;
分别检测出每个所述场景片段的首帧图像中的显著性对象;
针对每个所述场景片段,确定所述显著性对象在所述场景片段的每帧图像中的坐标参数;其中,所述坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标;
利用跟踪到的每帧所述图像中的显著性对象的坐标参数,计算得到每帧所述图像对应的重心坐标;
针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
2.根据权利要求1所述的方法,其特征在于,所述利用跟踪到的每帧所述图像中的显著性对象的坐标参数,计算得到每帧所述图像对应的重心坐标之后,还包括:
对每帧所述图像对应的重心坐标进行时序平滑处理,得到处理后的每帧所述对应的重心坐标;
其中,所述针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪,包括:
针对每帧所述图像,以处理后的所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
3.根据权利要求2所述的方法,其特征在于,所述对每帧所述图像对应的重心坐标进行时序平滑处理,得到处理后的每帧所述对应的重心坐标,包括:
确定出每帧所述图像对应的目标图像;其中,一帧所述图像及其对应的目标图像属于同一所述场景片段,且对应的时间戳是连续;一帧所述图像对应的目标帧包括位于所述图像前的N帧图像,以及位于所述图像后的N帧图像;
计算每帧所述图像对应的重心坐标的横坐标,与其对应的各帧所述目标图像对应的重心坐标的横坐标的均值,以及计算每帧所述图像对应的重心坐标的纵坐标,与其对应的各帧所述目标图像对应的重心坐标的纵坐标的均值,得到处理后的每帧所述图像对应的重心坐标。
4.根据权利要求1所述的方法,其特征在于,所述将待处理视频分割为多个场景片段,包括:
通过场景变换算法检测出所述待处理视频中发生场景画面切换的各个时间戳;
从各个所述时间戳对应的位置对所述待处理视频进行分割,得到多个场景片段。
5.根据权利要求1所述的方法,其特征在于,所述针对每个所述场景片段,确定所述显著性对象在所述场景片段的每帧图像中的坐标参数,包括:
分别针对每个所述场景片段,以所述场景片段的首帧图像中的显著性对象作为跟踪对象;
以所述场景片段的首帧图像为起始图像,逐帧检测所述场景片段的每帧图像中的所述跟踪对象的坐标参数。
6.一种视频画幅裁剪装置,其特征在于,包括:
分割单元,用于将待处理视频分割为多个场景片段;其中,每个所述场景片段由多帧包含相同场景画面的图像组成;
对象检测单元,用于分别检测出每个所述场景片段的首帧图像中的显著性对象;
跟踪单元,用于针对每个所述场景片段,确定所述显著性对象在所述场景片段的每帧图像中的坐标参数;其中,所述坐标参数至少包括显著性对象对应的左右边界坐标以及显著性对象对应的上下边界坐标;
坐标确定单元,用于利用跟踪到的每帧所述图像中的显著性对象的坐标参数,计算得到每帧所述图像对应的重心坐标;
裁剪单元,用于针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
7.根据权利要求6所述的装置,其特征在于,还包括:
平滑处理单元,用于对每帧所述图像对应的重心坐标进行时序平滑处理,得到处理后的每帧所述对应的重心坐标;
其中,所述裁剪单元执行所述针对每帧所述图像,以所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪时,用于:
针对每帧所述图像,以处理后的所述图像对应的重心坐标所处位置为基准点,将每帧所述图像的尺寸调整至目标宽高比进行裁剪。
8.根据权利要求7所述的装置,其特征在于,所述平滑处理单元,包括:
目标图像确定单元,用于确定出每帧所述图像对应的目标图像;其中,一帧所述图像及其对应的目标图像属于同一所述场景片段,且对应的时间戳是连续;一帧所述图像对应的目标帧包括位于所述图像前的N帧图像,以及位于所述图像后的N帧图像;
平滑处理子单元,用于计算每帧所述图像对应的重心坐标的横坐标,与其对应的各帧所述目标图像对应的重心坐标的横坐标的均值,以及计算每帧所述图像对应的重心坐标的纵坐标,与其对应的各帧所述目标图像对应的重心坐标的纵坐标的均值,得到处理后的每帧所述图像对应的重心坐标。
9.根据权利要求6所述的装置,其特征在于,所述分割单元,包括:
场景检测单元,用于通过场景变换算法检测出所述待处理视频中发生场景画面切换的各个时间戳;
分割子单元,用于从各个所述时间戳对应的位置对所述待处理视频进行分割,得到多个场景片段。
10.根据权利要求6所述的装置,其特征在于,所述跟踪单元,包括:
跟踪对象确定单元,用于分别针对每个所述场景片段,以所述场景片段的首帧图像中的显著性对象作为跟踪对象;
跟踪子单元,用于以所述场景片段的首帧图像为起始图像,逐帧检测所述场景片段的每帧图像中的所述跟踪对象的坐标参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110704744.1A CN113436072A (zh) | 2021-06-24 | 2021-06-24 | 一种视频画幅裁剪方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110704744.1A CN113436072A (zh) | 2021-06-24 | 2021-06-24 | 一种视频画幅裁剪方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113436072A true CN113436072A (zh) | 2021-09-24 |
Family
ID=77754060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110704744.1A Pending CN113436072A (zh) | 2021-06-24 | 2021-06-24 | 一种视频画幅裁剪方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113436072A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114302226A (zh) * | 2021-12-28 | 2022-04-08 | 北京中科大洋信息技术有限公司 | 一种视频画幅智能裁剪方法 |
CN116612122A (zh) * | 2023-07-20 | 2023-08-18 | 湖南快乐阳光互动娱乐传媒有限公司 | 图像显著性区域的检测方法及装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189378A (zh) * | 2019-05-23 | 2019-08-30 | 北京奇艺世纪科技有限公司 | 一种视频处理方法、装置及电子设备 |
CN111815645A (zh) * | 2020-06-23 | 2020-10-23 | 广州筷子信息科技有限公司 | 一种广告视频画面裁剪的方法和系统 |
CN112135188A (zh) * | 2020-09-16 | 2020-12-25 | 咪咕文化科技有限公司 | 视频裁剪方法、电子设备及计算机可读存储介质 |
CN112492388A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 视频处理方法、装置、设备以及存储介质 |
-
2021
- 2021-06-24 CN CN202110704744.1A patent/CN113436072A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189378A (zh) * | 2019-05-23 | 2019-08-30 | 北京奇艺世纪科技有限公司 | 一种视频处理方法、装置及电子设备 |
CN111815645A (zh) * | 2020-06-23 | 2020-10-23 | 广州筷子信息科技有限公司 | 一种广告视频画面裁剪的方法和系统 |
CN112135188A (zh) * | 2020-09-16 | 2020-12-25 | 咪咕文化科技有限公司 | 视频裁剪方法、电子设备及计算机可读存储介质 |
CN112492388A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 视频处理方法、装置、设备以及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114302226A (zh) * | 2021-12-28 | 2022-04-08 | 北京中科大洋信息技术有限公司 | 一种视频画幅智能裁剪方法 |
CN116612122A (zh) * | 2023-07-20 | 2023-08-18 | 湖南快乐阳光互动娱乐传媒有限公司 | 图像显著性区域的检测方法及装置、存储介质及电子设备 |
CN116612122B (zh) * | 2023-07-20 | 2023-10-10 | 湖南快乐阳光互动娱乐传媒有限公司 | 图像显著性区域的检测方法及装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104796594B (zh) | 一种预览界面特殊效果即时呈现方法及终端设备 | |
US8654181B2 (en) | Methods for detecting, visualizing, and correcting the perceived depth of a multicamera image sequence | |
JP5592006B2 (ja) | 三次元画像処理 | |
US9628837B2 (en) | Systems and methods for providing synchronized content | |
US10762653B2 (en) | Generation apparatus of virtual viewpoint image, generation method, and storage medium | |
CN113436072A (zh) | 一种视频画幅裁剪方法及装置 | |
US8817020B2 (en) | Image processing apparatus and image processing method thereof | |
KR20130029779A (ko) | 비디오 스크린 디스플레이 방법 및 장치 | |
US20010055059A1 (en) | Teleconferencing system, camera controller for a teleconferencing system, and camera control method for a teleconferencing system | |
GB2358098A (en) | Method of segmenting a pixelled image | |
US8514219B2 (en) | 3D image special effects apparatus and a method for creating 3D image special effects | |
CN107636728B (zh) | 用于确定图像的深度图的方法和装置 | |
JP2008117305A (ja) | 画像処理装置 | |
KR101897549B1 (ko) | 휴대 단말기에서 카메라 뷰 영역을 표시하는 장치 및 방법 | |
CN111866437B (zh) | 一种用于视频会议双摄像头的自动切换方法、装置、终端设备以及存储介质 | |
KR101900471B1 (ko) | 반응 효과가 삽입된 방송 시스템 | |
CN110248147B (zh) | 一种图像显示方法及装置 | |
US20120182391A1 (en) | Determining a stereo image from video | |
CN112529778B (zh) | 多摄像头设备的图像拼接方法及装置、存储介质、终端 | |
CN112752110B (zh) | 视频呈现方法及装置、计算设备、存储介质 | |
Chamaret et al. | Video retargeting for stereoscopic content under 3D viewing constraints | |
CN112085002A (zh) | 人像分割方法、装置、存储介质及电子设备 | |
JP3625935B2 (ja) | 動画像の重要画像抽出装置および重要画像抽出方法 | |
CN105227863A (zh) | 一种基于人像特征信息采集的视频图像处理方法 | |
CN102487447B (zh) | 调整物件三维深度的方法与装置、以及检测物件三维深度的方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210924 |