CN110830846B - 一种视频裁剪方法及服务器 - Google Patents

一种视频裁剪方法及服务器 Download PDF

Info

Publication number
CN110830846B
CN110830846B CN201810888728.0A CN201810888728A CN110830846B CN 110830846 B CN110830846 B CN 110830846B CN 201810888728 A CN201810888728 A CN 201810888728A CN 110830846 B CN110830846 B CN 110830846B
Authority
CN
China
Prior art keywords
target area
current frame
video
width
height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810888728.0A
Other languages
English (en)
Other versions
CN110830846A (zh
Inventor
汪锦武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201810888728.0A priority Critical patent/CN110830846B/zh
Publication of CN110830846A publication Critical patent/CN110830846A/zh
Application granted granted Critical
Publication of CN110830846B publication Critical patent/CN110830846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects

Abstract

本申请实施方式公开了一种视频裁剪方法及服务器,其中,所述方法提供有视频中的目标对象;所述方法包括:确定目标对象在视频的当前帧中的对象轮廓;基于对象轮廓,在当前帧中确定目标区域,并将目标区域内的图像确定为当前帧的裁剪帧;其中,在视频中,当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且当前帧中的目标区域中包含的对象轮廓的部分所占比例大于或等于指定比例;根据从视频中确定的裁剪帧,生成视频对应的裁剪视频。本申请实施例提供的技术方案,能够防止裁剪后的视频出现抖动现象,从而提高裁剪后的视频的观看效果。

Description

一种视频裁剪方法及服务器
技术领域
本申请涉及互联网技术领域,特别涉及一种视频裁剪方法及服务器。
背景技术
随着互联网技术的快速发展,针对比较感兴趣的视频,用户往往希望从这个视频中裁剪出某一感兴趣的特征对象在该视频中运动轨迹的视频,例如,从一段街舞视频中裁剪出舞者的视频,可以给用户带来不同的观看体验。
然而,通常情况下,由于特征对象在视频中的位置和大小总是在不断变化的,所以该特征对象在视频中的运动轨迹是跳动的。这样,可能会导致裁剪出的视频中出现比较明显的抖动现象。
发明内容
本申请实施方式的目的是提供一种视频裁剪方法及服务器,能够防止裁剪后的视频出现抖动现象,从而提高裁剪后的视频的观看效果。
为实现上述目的,本申请实施方式提供一种视频裁剪方法,提供有所述视频中的目标对象;所述方法包括:确定所述目标对象在所述视频的当前帧中的对象轮廓;基于所述对象轮廓,在所述当前帧中确定目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例;根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
为实现上述目的,本申请实施方式还提供一种服务器,所述服务器包括存储器和处理器,所述存储器用于存储计算机程序和视频中的目标对象;所述计算机程序被所述处理器执行时,实现以下步骤:确定所述目标对象在所述视频的当前帧中的对象轮廓;基于所述对象轮廓,在所述当前帧中确定目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例;根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
由上可见,在本申请中,针对待裁剪的视频,所述视频中包括用户感兴趣的目标对象。可以先确定所述目标对象在所述视频的当前帧中的对象轮廓。接着可以基于所述对象轮廓,在所述当前帧中确定目标区域,并可以将所述目标区域内的图像确定为所述当前帧的裁剪帧。其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。那么,针对所述视频中的不同帧,可以分别确定这些帧的裁剪帧,其中,在这些裁剪帧中,相邻两个裁剪帧分别对应的目标区域在所述视频中的中心坐标之间的偏移度较小,这样,便可以有效防止根据这些裁剪帧生成的裁剪视频出现抖动现象,从而可以提高所述视频对应的裁剪视频的观看效果。
附图说明
为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施方式中视频裁剪方法的流程图;
图2是本申请实施方式中确定目标区域的尺寸的一种实施例的示意图;
图3是本申请实施方式中确定目标区域的尺寸的另一种实施例的示意图;
图4是本申请实施方式中确定目标区域的尺寸的另一种实施例的示意图;
图5是本申请实施方式中确定目标区域的中心坐标的示意图;
图6是本申请实施方式中服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。
本申请实施方式提供一种视频裁剪方法,所述视频裁剪方法可以应用于客户端和服务器的系统架构中。所述服务器可以是存储视频数据的设备。具体地,所述服务器可以是能够提供视频服务的网站的后台业务服务器。所述网站例如可以是爱奇艺、搜狐视频、Acfun等。在本实施方式中,所述服务器可以为一个具有数据运算、存储功能以及网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件。在本实施方式中并不具体限定所述服务器的数量。所述服务器可以为一个服务器,还可以为几个服务器,或者,若干服务器形成的服务器集群。
在本实施方式中,所述客户端可以是用于播放视频裁剪后的视频的电子设备。具体地,所述客户端例如可以是台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、具有网络访问功能的电视机等。或者,所述客户端也可以为能够运行于上述电子设备中的软件。具体的,所述客户端可以为电子设备中的浏览器,所述浏览器中可以加载视频网站平台提供的访问入口。所述视频网站平台例如可以是爱奇艺、搜狐视频、Acfun等,所述访问入口可以是上述网站平台的首页。所述客户端还可以是视频网站平台提供的在智能终端中运行的应用。
本申请实施方式提供一种视频裁剪方法,所述裁剪方法可以应用于上述的服务器中。所述方法可以提供所述视频中的目标对象。
在本实施方式中,所述视频可以是用户当前观看的视频,还可以是存储在所述服务器中视频数据表征的视频。在本实施方式中,所述视频可以是待裁剪的视频。例如,所述待裁剪的视频还可以是一个完整视频中指定时间段内的视频片段。其中,所述指定时间段可以是根据用户自己的意愿设定的,也可以是根据视频内容来设定的,此处不作限定。
在本实施方式中,所述目标对象可以是所述视频的帧中出现频率最高的对象,例如,该对象可以是视频帧中出现频率最高的人物、动物或植物等等。所述目标对象也可以是根据用户自己的意愿选定的对象,例如,针对关于某位舞者跳舞的视频,该对象可以是该视频中这位舞者,也可以是该视频中的一位舞伴,或者观众等等。
在本实施方式中,所述目标对象中可以包括用于表征所述目标对象的目标对象特征。例如,可以在播放所述视频的客户端上展示某视频帧,这时,用户可以通过所述客户端上的截图工具在该视频帧上选定包含所述目标对象的区域,以将该区域内的图像作为所述目标图像,并通过所述客户端,向所述服务器发送包含所述目标图像的视频裁剪请求。其中,所述视频处理请求可以中携带所述视频对应的视频数据的标识。在接收到所述视频裁剪请求后,所述服务器可以从所述视频裁剪请求中提取所述视频数据的标识。在提取所述视频数据的标识之后,所述服务器可以读取具备所述标识的视频数据,并可以识别所述目标图像中的与所述目标对象相对应的目标对象特征,以根据所述对象特征进行后续视频裁剪处理。在本实施方式中,所述视频处理请求可以是按照预设规则进行编写的字符串。其中,所述预设规则可以是所述客户端与所述服务器之间遵循的网络通信协议。例如,所述视频加载请求可以是按照HTTP协议进行编写的字符串。所述预设规则可以限定视频加载请求中的各个组成部分以及各个组成部分之间的排列顺序。
在本实施方式中,所述服务器识别所述目标图像中的与所述目标对象相对应的目标对象特征,具体可以包括,所述服务器可以预先采用设计的图像识别算法构建用于识别图像中人物、动物或植物等目标对象的识别模型。该识别模型经过前期的样本训练后,可以识别出所述目标图像中、动物或植物等目标对象。本实施方式中,所述的图像识别算法可以包括采用深度神经网络的一些网络模型算法以及变种,经过样本训练后构建生成的识别模型的处理算法。具体的一个示例中,可以基于卷积神经网络(Convolutional NeuralNetwork,CNN)和区域建议网络(Region Proposal Network,RPN),结合池化层、全连接层等构建图像识别的算法模型,服务器获取所述目标图像后,可以利用该算法模型对所述目标图像进行识别,识别出目标图像中用于表征人物、动物或植物等目标对象的目标对象特征。
请参阅图1,所述视频裁剪方法可以包括以下步骤。
S11:确定所述目标对象在所述视频的当前帧中的对象轮廓。
在本实施方式中,在本实施方式中,所述当前帧可以是指所述视频中当前正在处理的帧,也可以是指所述视频中的任意一帧。
在本实施方式中,为了便于在后续视频裁剪过程中确定准确的裁剪区域,所述服务器可以确定所述目标对象在所述视频的当前帧中的对象轮廓,以便根据对象轮廓来准备确定合适的裁剪区域。具体地,在识别出与所述目标对象相对应的目标对象特征之后,所述服务器可以采用上述识别目标对象特征的方法,识别所述当前帧中的至少一种对象特征。针对识别出的至少一种对象特征,所述服务器可以确定其中与所述目标对象特征相匹配的对象特征,并将该对象特征表征的对象轮廓,作为所述目标对象在所述当前帧中的对象轮廓。在本实施方式中,与所述目标对象特征相匹配的对象特征可以是指与所述目标对象特征之间的相似度大于或等于指定相似度的对象特征。其中,所述指定相似度的取值范围例如可以包括80~100百分比(%),具体可以根据实际应用情况来设定,此处不作限定。与所述目标对象特征相匹配的对象特征表征的对象轮廓可以指该对象特征表征的对象在所述当前帧中的多个边界像素构成的轮廓。
S13:基于所述对象轮廓,在所述当前帧中确定目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
在本实施方式中,在确定所述目标对象在所述当前帧中的对象轮廓之后,为了后续生成所述视频对应的裁剪视频,所述服务器可以基于所述对象轮廓,在所述当前帧中确定目标区域,并可以将所述目标区域内的图像确定为所述当前帧的裁剪帧。其中,所述目标区域中可以至少包含所述对象轮廓的一部分。这样,所述服务器便可以从所述视频中分别确定不同视频帧的裁剪帧,以便后续根据确定的这些裁剪帧,生成所述视频的裁剪视频。
在一个具体示例中,针对所述视频,从不同的视频帧中分别确定的对应的目标区域的尺寸可以是相同的。这样,在不同的视频帧中确定对应的目标区域之后,便可以直接将对应的目标区域内的图像确定为对应帧的裁剪帧,无需再对裁剪帧的尺寸进行调整,从而可以便于后续根据这些帧的裁剪帧,直接生成所述视频的裁剪视频。在分别确定所述目标对象在不同视频帧中的对象轮廓之后,所述服务器可以基于这些不同视频帧中的对象轮廓,确定目标区域的尺寸。具体地,在分别确定所述目标对象在不同视频帧中的对象轮廓之后,所述服务器可以统计在这些包含所述目标对象的视频帧中,所述目标对象的对象轮廓的宽度和高度,以得到所述目标对象的对象轮廓的宽度最大值和高度最大值。在确定这些对象轮廓的宽度最大值和高度最大值之后,所述服务器可以根据所述宽度最大值和所述高度最大值,确定所述目标区域的宽度和高度,以使得所述目标区域的宽度与高度的比值为指定长度比值,且所述目标区域的宽度小于或等于所述视频的初始宽度,以及所述目标区域的高度小于或等于所述视频的初始高度。从而可以尽量保证所述目标区域中可以包含整个对象轮廓。其中,所述指定长度比值例如可以是9/16,具体可以根据用户自己的意愿来设定,也可以根据实际应用情况来设定。
具体地,例如,在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,所述服务器可以将所述宽度最大值作为所述目标区域的宽度,并可以将所述宽度最大值与所述指定长度比值的倒数的乘积作为所述目标区域的高度。其中,所述宽度最大值与所述指定长度比值的倒数的乘积小于或等于所述初始高度。在所述宽度最大值与所述高度最大值的比值等于所述指定长度比值的情况下,所述服务器可以将所述宽度最大值和所述高度最大值分别作为所述目标区域的宽度和高度。在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,所述服务器可以将所述高度最大值作为所述目标区域的高度,并可以将所述高度最大值与所述指定长度比值的乘积作为所述目标区域的宽度。其中,所述高度最大值与所述指定长度比值的乘积小于或等于所述初始宽度。例如,所述指定长度比值例如可以是9/16。所述宽度最大值与所述高度最大值分别为X和Y,所述视频的初始宽度和初始高度分别为W1和H1。如图2中(a)所示,在所述宽度最大值与所述高度最大值的比值X/Y大于所述指定长度比值9/16的情况下,所述服务器可以将所述宽度最大值X作为所述目标区域的宽度W,并可以将所述宽度最大值与所述指定长度比值的倒数的乘积16X/9作为所述目标区域的高度H,以使得所述目标区域的宽度与高度的比值为指定长度比值9/16。其中,所述宽度最大值与所述指定长度比值的倒数的乘积16X/9小于或等于所述初始高度H1。如图2中(b)所示,在所述宽度最大值与所述高度最大值的比值X/Y小于所述指定长度比值9/16的情况下,所述服务器可以将所述高度最大值Y作为所述目标区域的高度H,并可以将所述高度最大值与所述指定长度比值的乘积9Y/16作为所述目标区域的宽度W。其中,所述高度最大值与所述指定长度比值的乘积9Y/16小于所述初始宽度W1。
在另一个具体示例中,针对一些特殊情况,例如,在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,若所述宽度最大值与所述指定长度比值的倒数的乘积大于所述初始高度,所述服务器可以将所述初始高度作为所述目标区域的高度,并将所述初始高度与所述指定长度比值的乘积作为所述目标区域的宽度。例如,所述指定长度比值例如可以是9/16。所述宽度最大值与所述高度最大值分别为X和Y,所述视频的初始宽度和初始高度分别为W1和H1。如图3所示,在所述宽度最大值与所述高度最大值的比值X/Y大于所述指定长度比值9/16的情况下,若所述宽度最大值与所述指定长度比值的倒数的乘积16X/9大于所述初始高度W1,所述服务器可以将所述初始高度W1作为所述目标区域的高度H,并将所述初始高度与所述指定长度比值的乘积9H1/16作为所述目标区域的宽度H。或者,在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,若所述高度最大值与所述指定长度比值的乘积大于所述初始宽度,所述服务器可以将所述初始宽度作为所述目标区域的宽度,并将所述初始宽度与所述指定长度比值的倒数的乘积作为所述目标区域的高度。例如,所述指定长度比值例如可以是16/9。所述宽度最大值与所述高度最大值分别为X和Y,所述视频的初始宽度和初始高度分别为W1和H1。如图4所示,在所述宽度最大值与所述高度最大值的比值X/Y小于所述指定长度比值16/9的情况下,若所述高度最大值与所述指定长度比值的乘积16Y/9大于所述初始宽度,所述服务器可以将所述初始宽度W1作为所述目标区域的宽度W,并将所述初始宽度与所述指定长度比值的倒数的乘积9W1/16作为所述目标区域的高度H。
在另一个具体示例中,在从所述视频的当前帧中识别目标对象,并确定所述目标对象在所述当前帧中的对象轮廓之后,所述服务器可以确定所述对象轮廓的中心坐标。在分别确定所述视频中不同视频帧对应的对象轮廓之后,所述服务器可以通过对比相邻两个视频帧中的对象轮廓的中心坐标之间的偏移度,来确定下一个帧中的目标区域的中心坐标,以避免相邻两个帧中的目标区域的中心坐标之间的偏移度过大,从而可以避免后续根据确定的裁剪帧生成的裁剪视频中出现明显的抖动现象。其中,相邻两个视频帧中的对象轮廓的中心坐标之间的偏移度可以是指相邻两个视频帧的对象轮廓的中心坐标分别在平面坐标系中两个相互垂直的坐标轴方向上的差值的绝对值,例如,在以x和y两个相互垂直的坐标轴的平面坐标系中,相邻两个视频帧中的对象轮廓的中心坐标之间的偏移度可以是指相邻两个视频帧中的对象轮廓的中心坐标之间分别在x轴方向和y轴方向上的差值的绝对值。具体地,在分别确定所述视频中不同视频帧对应的对象轮廓之后,所述服务器可以在所述视频中,基于所述当前帧中的对象轮廓的中心坐标和上一帧中的目标区域的中心坐标,确定所述当前帧中的目标区域的中心坐标,以使得所述上一帧中的目标区域的中心坐标与所述当前帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。其中,所述指定偏移度阈值可以是指两个中心坐标之间沿x轴方向或沿y轴方向上的指定差异值,所述指定差异值的取值范围可以包括3~5个像素,具体可以根据视频中运动对象的实际情况来设定。
在另一个具体示例中,在分别确定所述视频中不同视频帧对应的对象轮廓之后,所述服务器可以在所述视频中,确定所述当前帧中的对象轮廓的中心坐标与上一帧中的目标区域的中心坐标之间的第二偏移度。在所述第二偏移度小于或等于所述指定偏移度阈值的情况下,所述服务器可以直接将所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标。在所述第二偏移度大于所述指定偏移度阈值的情况下,所述服务器可以将所述上一帧中的目标区域的中心坐标或者所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标,并对所述当前帧中的目标区域的中心坐标进行调整,以使得调整后的第一偏移度小于或等于所述指定偏移度阈值,且调整后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。其中,所述指定比例的取值范围例如可以为40~60百分比,具体可以根据视频中运动对象的实际运动情况来设定。具体地,例如,在所述第二偏移度中沿x轴方向的差值的绝对值大于所述指定偏移度阈值的情况下,所述服务器可以将所述上一帧中的目标区域的中心坐标作为所述当前帧中的目标区域的中心坐标,并将所述当前帧中的目标区域的中心点沿x轴向靠近所述当前帧中的对象轮廓的中心点的方向移动,以使得移动后的第一偏移度小于或等于指定偏移度阈值,且移动后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。类似地,在所述第二偏移度中沿y轴方向的差值的绝对值大于所述指定偏移度阈值的情况下,所述服务器可以将所述上一帧中的目标区域的中心坐标作为所述当前帧中的目标区域的中心坐标,并将所述当前帧中的目标区域的中心点沿y轴向靠近所述当前帧中的对象轮廓的中心点的方向移动,以使得移动后的第一偏移度小于或等于指定偏移度阈值,且移动后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
在另一个具体示例中,针对一些特殊情况,例如,在所述第二偏移度大于所述指定偏移度阈值的情况下,若调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离小于所述目标区域的宽度的一半,所述服务器可以再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离等于所述目标区域的宽度的一半。类似地,若调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离小于所述目标区域的高度的一半,所述服务器可以再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离等于所述目标区域的高度的一半。例如,如图5所示,在所述第二偏移度大于所述指定偏移度阈值的情况下,若调整后的所述当前帧中的目标区域的中心位置A1与所述视频的左边界之间的距离小于所述目标区域的宽度的一半,所述服务器可以再将调整后的所述当前帧中的目标区域的中心位置A1向右平移至位置A2处,这样,平移后的所述当前帧中的目标区域的中心位置A2与所述视频的左边界之间的距离等于所述目标区域的宽度的一半。在本实施方式中,“上”、“下”、“左”、“右”以及类似的表述可以是用于说明所述视频或所述目标区域在某种特定状态下的位置关系,当所述视频或所述目标区域的状态发生变化时,对象的位置关系也会随之变化,因此,这些位置关系的表述并不表示是唯一的实施方式。
S15:根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
在本实施方式中,所述服务器可以根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。具体地,在从所述视频中确定不同视频帧的裁剪帧之后,所述服务器可以按照这些视频帧的时间序列将这些视频帧的裁剪帧进行合并,便可以生成所述视频对应的裁剪视频。例如,所述服务器可以采用FFMPEG(Fast Forward Mpeg)将这些视频帧的裁剪帧合并为所述裁剪视频。
在一个具体应用场景中,是所述客户端可以是智能手机。例如,该智能手机上正在播放某个舞者跳舞的视频。这时,用户可以通过按下该智能手机上暂停键,以使得在该智能手机上展示的当前视频帧中包含该舞者的整体。接着用户可以通过该智能手机上的截图工具在该视频帧上选定包含该舞者的区域,以将该区域内的图像作为目标图像,并通过该智能手机,向所述服务器发送包含该目标图像的视频裁剪请求。其中,所述视频裁剪请求可以中携带该视频对应的视频数据的标识。在接收到所述视频裁剪请求后,所述服务器可以从所述视频裁剪请求中提取所述视频数据的标识。在提取所述视频数据的标识之后,所述服务器可以读取具备所述标识的视频数据,并可以识别所述目标图像中的与所述目标对象相对应的目标对象特征。在识别出与所述目标对象相对应的目标对象特征之后,所述服务器可以确定所述目标对象在对应的视频帧中的对象轮廓。然后,所述服务器可以基于所述对象轮廓,在对应的视频帧中确定目标区域,并将所述目标区域内的图像确定为对应视频帧的裁剪帧;其中,所述目标区域中至少包含所述对象轮廓的一部分。这样,所述服务器便可以从该视频中分别确定不同视频帧的裁剪帧,并可以根据这些裁剪帧生成该视频对应的裁剪视频。由于在这些裁剪帧中,相邻两个裁剪帧分别对应的目标区域在所述视频中的中心坐标之间的偏移度较小,这样,便可以有效防止根据这些裁剪帧生成的裁剪视频出现抖动现象,从而可以提高所述视频对应的裁剪视频的观看效果。
在本申请一个实施方式中,在播放服务器生成的所述视频对应的裁剪视频时,为了避免裁剪视频的前几个帧出现抖动现象,所述服务器可以结合所述视频中前几个帧的对象轮廓的中心坐标来确定所述视频的起始帧中的目标区域的中心坐标。具体地,在所述当前帧为所述视频的起始帧的情况下,所述服务器可以将当前帧以及所述视频中与所述当前帧相邻的指定数量帧构成的集合作为目标帧集合。其中,由于所述当前帧为所述视频的起始帧,与所述当前帧相邻的指定数量帧可以是指从所述视频的第二个帧开始的指定数量帧。接着所述服务器可以分别确定所述目标帧集合中帧的对象轮廓的中心坐标,并可以将所述目标帧集合中帧的对象轮廓的中心坐标的平均坐标作为所述当前帧中的目标区域的中心坐标。如此,可以防止后续得到的裁剪视频的起始帧中的目标对象与相邻几个帧中的目标对象之间移动幅度过大,从而可以避免裁剪视频的前几个帧出现抖动现象。其中,所述指定数量具体可以根据实际应用情况来设定,此处不作限定。
在本实施方式中,上述方法步骤中实现的功能,可以由计算机程序实现,所述计算机程序可以被存储于计算机存储介质中。具体的,所述计算机存储介质可以与处理器进行耦合,处理器从而可以读取计算机存储介质中的计算机程序。所述计算机存储介质可以用于存储视频中的目标对象。所述计算机程序被处理器执行时,可以实现以下功能:
S11:确定所述目标对象在所述视频的当前帧中的对象轮廓;
S13:基于所述对象轮廓,在所述当前帧中确定目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例;
S15:根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定目标区域的尺寸包括以下步骤:
在包含所述目标对象的视频帧中,确定所述目标对象的对象轮廓的宽度最大值和高度最大值;
根据所述宽度最大值和所述高度最大值,确定所述目标区域的宽度和高度,以使得所述目标区域的宽度与高度的比值为指定长度比值,且所述目标区域的宽度小于或等于所述视频的初始宽度,以及所述目标区域的高度小于或等于所述视频的初始高度。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定所述目标区域的宽度和高度包括以下步骤:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,将所述宽度最大值作为所述目标区域的宽度,并将所述宽度最大值与所述指定长度比值的倒数的乘积作为所述目标区域的高度;其中,所述宽度最大值与所述指定长度比值的倒数的乘积小于或等于所述初始高度;
在所述宽度最大值与所述高度最大值的比值等于所述指定长度比值的情况下,将所述宽度最大值和所述高度最大值分别作为所述目标区域的宽度和高度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,将所述高度最大值作为所述目标区域的高度,并将所述高度最大值与所述指定长度比值的乘积作为所述目标区域的宽度;其中,所述高度最大值与所述指定长度比值的乘积小于或等于所述初始宽度。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定所述目标区域的宽度和高度还包括以下步骤:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,若所述宽度最大值与所述指定长度比值的倒数的乘积大于所述初始高度,将所述初始高度作为所述目标区域的高度,并将所述初始高度与所述指定长度比值的乘积作为所述目标区域的宽度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,若所述高度最大值与所述指定长度比值的乘积大于所述初始宽度,将所述初始宽度作为所述目标区域的宽度,并将所述初始宽度与所述指定长度比值的倒数的乘积作为所述目标区域的高度。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定目标区域的中心坐标包括以下步骤:
确定所述当前帧中的对象轮廓的中心坐标,基于所述当前帧中的对象轮廓的中心坐标和上一帧中的目标区域的中心坐标,确定所述当前帧中的目标区域的中心坐标,以使得所述第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定所述当前帧中的目标区域的中心坐标包括以下步骤:
在所述视频中,确定所述当前帧中的对象轮廓的中心坐标与上一帧中的目标区域的中心坐标之间的第二偏移度;
在所述第二偏移度小于或等于所述指定偏移度阈值的情况下,将所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标;
在所述第二偏移度大于所述指定偏移度阈值的情况下,将所述上一帧中的目标区域的中心坐标或者所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标,并对所述当前帧中的目标区域的中心坐标进行调整,以使得调整后的第一偏移度小于或等于指定偏移度阈值,且调整后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
在一个实施方式中,所述计算机程序被所述处理器执行时,在所述第二偏移度大于所述指定偏移度阈值的情况下,确定所述当前帧中的目标区域的中心坐标还包括以下步骤:
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离小于所述目标区域的宽度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离等于所述目标区域的宽度的一半;
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离小于所述目标区域的高度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离等于所述目标区域的高度的一半。
在一个实施方式中,所述计算机程序被所述处理器执行时,在所述当前帧为所述视频的起始帧的情况下,确定所述当前帧中的目标区域的中心坐标包括以下步骤:
将当前帧以及所述视频中与所述当前帧相邻的指定数量帧构成的集合作为目标帧集合;
分别确定所述目标帧集合中帧的对象轮廓的中心坐标,并将所述目标帧集合中帧的对象轮廓的中心坐标的平均坐标作为所述当前帧中的目标区域的中心坐标。
需要说明的是,上述计算机存储介质中的计算机程序所能实现的功能,均可以参照前述的方法实施实施方式,实现的技术效果也与前述方法实施方式中实现的技术效果类似,这里便不再赘述。
请参阅图6,本申请还提供一种服务器。所述服务器包括存储器和处理器,所述存储器可以用于存储计算机程序和视频中的目标对象;所述计算机程序被所述处理器执行时,实现以下步骤:
S11:确定所述目标对象在所述视频的当前帧中的对象轮廓;
S13:基于所述对象轮廓,在所述当前帧中确定目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例;
S15:根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
在本实施方式中,所述存储器可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的存储器又可以包括:利用电能方式存储信息的装置,如RAM、ROM等;利用磁能方式存储信息的装置,如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置,如CD或DVD。当然,还有其他方式的存储器,例如量子存储器、石墨烯存储器等等。
在本实施方式中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定目标区域的尺寸包括以下步骤:
在包含所述目标对象的视频帧中,确定所述目标对象的对象轮廓的宽度最大值和高度最大值;
根据所述宽度最大值和所述高度最大值,确定所述目标区域的宽度和高度,以使得所述目标区域的宽度与高度的比值为指定长度比值,且所述目标区域的宽度小于或等于所述视频的初始宽度,以及所述目标区域的高度小于或等于所述视频的初始高度。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定所述目标区域的宽度和高度包括以下步骤:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,将所述宽度最大值作为所述目标区域的宽度,并将所述宽度最大值与所述指定长度比值的倒数的乘积作为所述目标区域的高度;其中,所述宽度最大值与所述指定长度比值的倒数的乘积小于或等于所述初始高度;
在所述宽度最大值与所述高度最大值的比值等于所述指定长度比值的情况下,将所述宽度最大值和所述高度最大值分别作为所述目标区域的宽度和高度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,将所述高度最大值作为所述目标区域的高度,并将所述高度最大值与所述指定长度比值的乘积作为所述目标区域的宽度;其中,所述高度最大值与所述指定长度比值的乘积小于或等于所述初始宽度。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定所述目标区域的宽度和高度还包括以下步骤:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,若所述宽度最大值与所述指定长度比值的倒数的乘积大于所述初始高度,将所述初始高度作为所述目标区域的高度,并将所述初始高度与所述指定长度比值的乘积作为所述目标区域的宽度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,若所述高度最大值与所述指定长度比值的乘积大于所述初始宽度,将所述初始宽度作为所述目标区域的宽度,并将所述初始宽度与所述指定长度比值的倒数的乘积作为所述目标区域的高度。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定目标区域的中心坐标包括以下步骤:
确定所述当前帧中的对象轮廓的中心坐标,基于所述当前帧中的对象轮廓的中心坐标和上一帧中的目标区域的中心坐标,确定所述当前帧中的目标区域的中心坐标,以使得所述第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
在一个实施方式中,所述计算机程序被所述处理器执行时,确定所述当前帧中的目标区域的中心坐标包括以下步骤:
在所述视频中,确定所述当前帧中的对象轮廓的中心坐标与上一帧中的目标区域的中心坐标之间的第二偏移度;
在所述第二偏移度小于或等于所述指定偏移度阈值的情况下,将所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标;
在所述第二偏移度大于所述指定偏移度阈值的情况下,将所述上一帧中的目标区域的中心坐标或者所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标,并对所述当前帧中的目标区域的中心坐标进行调整,以使得调整后的第一偏移度小于或等于指定偏移度阈值,且调整后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
在一个实施方式中,所述计算机程序被所述处理器执行时,在所述第二偏移度大于所述指定偏移度阈值的情况下,确定所述当前帧中的目标区域的中心坐标还包括以下步骤:
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离小于所述目标区域的宽度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离等于所述目标区域的宽度的一半;
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离小于所述目标区域的高度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离等于所述目标区域的高度的一半。
在一个实施方式中,所述计算机程序被所述处理器执行时,在所述当前帧为所述视频的起始帧的情况下,确定所述当前帧中的目标区域的中心坐标包括以下步骤:
将当前帧以及所述视频中与所述当前帧相邻的指定数量帧构成的集合作为目标帧集合;
分别确定所述目标帧集合中帧的对象轮廓的中心坐标,并将所述目标帧集合中帧的对象轮廓的中心坐标的平均坐标作为所述当前帧中的目标区域的中心坐标。
本说明书实施方式提供的服务器,其存储器和处理器实现的具体功能,可以与本说明书中的前述实施方式相对照解释,并能够达到前述实施方式的技术效果,这里便不再赘述。
由上可见,在本申请中,针对待裁剪的视频,所述视频中包括用户感兴趣的目标对象。可以先确定所述目标对象在所述视频的当前帧中的对象轮廓。接着可以基于所述对象轮廓,在所述当前帧中确定目标区域,并可以将所述目标区域内的图像确定为所述当前帧的裁剪帧。其中,在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。那么,针对所述视频中的不同帧,可以分别确定这些帧的裁剪帧,其中,在这些裁剪帧中,相邻两个裁剪帧分别对应的目标区域在所述视频中的中心坐标之间的偏移度较小,这样,便可以有效防止根据这些裁剪帧生成的裁剪视频出现抖动现象,从而可以提高所述视频对应的裁剪视频的观看效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现客户端、服务器以外,完全可以通过将方法步骤进行逻辑编程来使得客户端、服务器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种客户端、服务器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。尤其,针对计算机存储介质、服务器和客户端的实施方式来说,均可以参照前述方法的实施方式的介绍对照解释。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施方式描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims (16)

1.一种视频裁剪方法,其特征在于,提供有所述视频中的目标对象;所述方法包括:
确定所述目标对象在所述视频的当前帧中的对象轮廓;基于所述对象轮廓,在所述当前帧中确定目标区域的尺寸;
根据所述目标对象的对象轮廓在当前帧中的中心坐标相对上一帧的偏移度,确定所述当前帧中的目标区域的中心坐标,以使得在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例;
根据所述目标区域的尺寸以及中心坐标,定位所述当前帧中的目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;
根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
2.根据权利要求1所述的方法,其特征在于,按照以下方式确定目标区域的尺寸:
在包含所述目标对象的视频帧中,确定所述目标对象的对象轮廓的宽度最大值和高度最大值;
根据所述宽度最大值和所述高度最大值,确定所述目标区域的宽度和高度,以使得所述目标区域的宽度与高度的比值为指定长度比值,且所述目标区域的宽度小于或等于所述视频的初始宽度,以及所述目标区域的高度小于或等于所述视频的初始高度。
3.根据权利要求2所述的方法,其特征在于,确定所述目标区域的宽度和高度,包括:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,将所述宽度最大值作为所述目标区域的宽度,并将所述宽度最大值与所述指定长度比值的倒数的乘积作为所述目标区域的高度;其中,所述宽度最大值与所述指定长度比值的倒数的乘积小于或等于所述初始高度;
在所述宽度最大值与所述高度最大值的比值等于所述指定长度比值的情况下,将所述宽度最大值和所述高度最大值分别作为所述目标区域的宽度和高度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,将所述高度最大值作为所述目标区域的高度,并将所述高度最大值与所述指定长度比值的乘积作为所述目标区域的宽度;其中,所述高度最大值与所述指定长度比值的乘积小于或等于所述初始宽度。
4.根据权利要求3所述的方法,其特征在于,确定所述目标区域的宽度和高度,还包括:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,若所述宽度最大值与所述指定长度比值的倒数的乘积大于所述初始高度,将所述初始高度作为所述目标区域的高度,并将所述初始高度与所述指定长度比值的乘积作为所述目标区域的宽度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,若所述高度最大值与所述指定长度比值的乘积大于所述初始宽度,将所述初始宽度作为所述目标区域的宽度,并将所述初始宽度与所述指定长度比值的倒数的乘积作为所述目标区域的高度。
5.根据权利要求2所述的方法,其特征在于,按照下述方式确定目标区域的中心坐标:
确定所述当前帧中的对象轮廓的中心坐标,基于所述当前帧中的对象轮廓的中心坐标和上一帧中的目标区域的中心坐标,确定所述当前帧中的目标区域的中心坐标,以使得所述第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
6.根据权利要求5所述的方法,其特征在于,确定所述当前帧中的目标区域的中心坐标,包括:
在所述视频中,确定所述当前帧中的对象轮廓的中心坐标与上一帧中的目标区域的中心坐标之间的第二偏移度;
在所述第二偏移度小于或等于所述指定偏移度阈值的情况下,将所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标;
在所述第二偏移度大于所述指定偏移度阈值的情况下,将所述上一帧中的目标区域的中心坐标或者所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标,并对所述当前帧中的目标区域的中心坐标进行调整,以使得调整后的第一偏移度小于或等于指定偏移度阈值,且调整后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
7.根据权利要求6所述的方法,其特征在于,在所述第二偏移度大于所述指定偏移度阈值的情况下,确定所述当前帧中的目标区域的中心坐标,还包括:
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离小于所述目标区域的宽度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离等于所述目标区域的宽度的一半;
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离小于所述目标区域的高度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离等于所述目标区域的高度的一半。
8.根据权利要求5所述的方法,其特征在于,在所述当前帧为所述视频的起始帧的情况下,确定所述当前帧中的目标区域的中心坐标,包括:
将当前帧以及所述视频中与所述当前帧相邻的指定数量帧构成的集合作为目标帧集合;
分别确定所述目标帧集合中帧的对象轮廓的中心坐标,并将所述目标帧集合中帧的对象轮廓的中心坐标的平均坐标作为所述当前帧中的目标区域的中心坐标。
9.一种服务器,其特征在于,所述服务器包括存储器和处理器,所述存储器用于存储计算机程序和视频中的目标对象;所述计算机程序被所述处理器执行时,实现以下步骤:
确定所述目标对象在所述视频的当前帧中的对象轮廓;
基于所述对象轮廓,在所述当前帧中确定目标区域的尺寸;
根据所述目标对象的对象轮廓在当前帧中的中心坐标相对上一帧的偏移度,确定所述当前帧中的目标区域的中心坐标,以使得在所述视频中,所述当前帧中的目标区域的中心坐标与上一帧中的目标区域的中心坐标之间的第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例;
根据所述目标区域的尺寸以及中心坐标,定位所述当前帧中的目标区域,并将所述目标区域内的图像确定为所述当前帧的裁剪帧;
根据从所述视频中确定的裁剪帧,生成所述视频对应的裁剪视频。
10.根据权利要求9所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,确定目标区域的尺寸包括以下步骤:
在包含所述目标对象的视频帧中,确定所述目标对象的对象轮廓的宽度最大值和高度最大值;
根据所述宽度最大值和所述高度最大值,确定所述目标区域的宽度和高度,以使得所述目标区域的宽度与高度的比值为指定长度比值,且所述目标区域的宽度小于或等于所述视频的初始宽度,以及所述目标区域的高度小于或等于所述视频的初始高度。
11.根据权利要求10所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,确定所述目标区域的宽度和高度包括以下步骤:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,将所述宽度最大值作为所述目标区域的宽度,并将所述宽度最大值与所述指定长度比值的倒数的乘积作为所述目标区域的高度;其中,所述宽度最大值与所述指定长度比值的倒数的乘积小于或等于所述初始高度;
在所述宽度最大值与所述高度最大值的比值等于所述指定长度比值的情况下,将所述宽度最大值和所述高度最大值分别作为所述目标区域的宽度和高度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,将所述高度最大值作为所述目标区域的高度,并将所述高度最大值与所述指定长度比值的乘积作为所述目标区域的宽度;其中,所述高度最大值与所述指定长度比值的乘积小于或等于所述初始宽度。
12.根据权利要求11所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,确定所述目标区域的宽度和高度还包括以下步骤:
在所述宽度最大值与所述高度最大值的比值大于所述指定长度比值的情况下,若所述宽度最大值与所述指定长度比值的倒数的乘积大于所述初始高度,将所述初始高度作为所述目标区域的高度,并将所述初始高度与所述指定长度比值的乘积作为所述目标区域的宽度;
在所述宽度最大值与所述高度最大值的比值小于所述指定长度比值的情况下,若所述高度最大值与所述指定长度比值的乘积大于所述初始宽度,将所述初始宽度作为所述目标区域的宽度,并将所述初始宽度与所述指定长度比值的倒数的乘积作为所述目标区域的高度。
13.根据权利要求10所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,确定目标区域的中心坐标包括以下步骤:
确定所述当前帧中的对象轮廓的中心坐标,基于所述当前帧中的对象轮廓的中心坐标和上一帧中的目标区域的中心坐标,确定所述当前帧中的目标区域的中心坐标,以使得所述第一偏移度小于或等于指定偏移度阈值,且所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
14.根据权利要求13所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,确定所述当前帧中的目标区域的中心坐标包括以下步骤:
在所述视频中,确定所述当前帧中的对象轮廓的中心坐标与上一帧中的目标区域的中心坐标之间的第二偏移度;
在所述第二偏移度小于或等于所述指定偏移度阈值的情况下,将所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标;
在所述第二偏移度大于所述指定偏移度阈值的情况下,将所述上一帧中的目标区域的中心坐标或者所述当前帧中的对象轮廓的中心坐标作为所述当前帧中的目标区域的中心坐标,并对所述当前帧中的目标区域的中心坐标进行调整,以使得调整后的第一偏移度小于或等于指定偏移度阈值,且调整后的所述当前帧中的目标区域中包含的所述对象轮廓的部分所占比例大于或等于指定比例。
15.根据权利要求14所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,在所述第二偏移度大于所述指定偏移度阈值的情况下,确定所述当前帧中的目标区域的中心坐标还包括以下步骤:
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离小于所述目标区域的宽度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的左边界/右边界之间的距离等于所述目标区域的宽度的一半;
若调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离小于所述目标区域的高度的一半,再对调整后的所述当前帧中的目标区域的中心坐标进行调整,以使得再次调整后的所述当前帧中的目标区域的中心坐标与所述视频的上边界/下边界之间的距离等于所述目标区域的高度的一半。
16.根据权利要求13所述的服务器,其特征在于,所述计算机程序被所述处理器执行时,在所述当前帧为所述视频的起始帧的情况下,确定所述当前帧中的目标区域的中心坐标包括以下步骤:
将当前帧以及所述视频中与所述当前帧相邻的指定数量帧构成的集合作为目标帧集合;
分别确定所述目标帧集合中帧的对象轮廓的中心坐标,并将所述目标帧集合中帧的对象轮廓的中心坐标的平均坐标作为所述当前帧中的目标区域的中心坐标。
CN201810888728.0A 2018-08-07 2018-08-07 一种视频裁剪方法及服务器 Active CN110830846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810888728.0A CN110830846B (zh) 2018-08-07 2018-08-07 一种视频裁剪方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810888728.0A CN110830846B (zh) 2018-08-07 2018-08-07 一种视频裁剪方法及服务器

Publications (2)

Publication Number Publication Date
CN110830846A CN110830846A (zh) 2020-02-21
CN110830846B true CN110830846B (zh) 2022-02-22

Family

ID=69533702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810888728.0A Active CN110830846B (zh) 2018-08-07 2018-08-07 一种视频裁剪方法及服务器

Country Status (1)

Country Link
CN (1) CN110830846B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113766175A (zh) * 2020-06-04 2021-12-07 杭州萤石软件有限公司 目标监控方法、装置、设备及存储介质
CN112311966A (zh) * 2020-11-13 2021-02-02 深圳市前海手绘科技文化有限公司 一种短视频中动态镜头制作的方法和装置
CN112528079A (zh) * 2020-12-22 2021-03-19 北京百度网讯科技有限公司 系统检测方法、装置、电子设备、存储介质和程序产品
CN113269790A (zh) * 2021-03-26 2021-08-17 北京达佳互联信息技术有限公司 视频裁剪方法、装置、电子设备、服务器及存储介质
CN113840172B (zh) * 2021-09-28 2023-01-03 北京奇艺世纪科技有限公司 视频裁剪方法、装置、终端设备以及可读存储介质
CN114339031A (zh) * 2021-12-06 2022-04-12 深圳市金九天视实业有限公司 画面调节方法、装置、设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301596A (zh) * 2013-07-11 2015-01-21 炬芯(珠海)科技有限公司 一种视频处理方法及装置
CN104574403A (zh) * 2015-01-12 2015-04-29 飞天诚信科技股份有限公司 一种智能裁剪方法
CN105263049A (zh) * 2015-10-28 2016-01-20 努比亚技术有限公司 一种基于帧坐标的视频裁剪装置、方法及移动终端
CN107274433A (zh) * 2017-06-21 2017-10-20 吉林大学 基于深度学习的目标跟踪方法、装置及存储介质
CN107454303A (zh) * 2016-05-31 2017-12-08 宇龙计算机通信科技(深圳)有限公司 一种视频防抖方法及终端设备
CN107610131A (zh) * 2017-08-25 2018-01-19 百度在线网络技术(北京)有限公司 一种图像裁剪方法和图像裁剪装置
CN107872639A (zh) * 2017-11-14 2018-04-03 维沃移动通信有限公司 通信视频的传输方法、装置和移动终端

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394546B (zh) * 2007-09-17 2010-08-25 华为技术有限公司 视频目标轮廓跟踪方法及装置
US9240056B2 (en) * 2008-04-02 2016-01-19 Microsoft Technology Licensing, Llc Video retargeting
CN102348046B (zh) * 2010-07-30 2014-08-27 富士通株式会社 一种视频去抖动方法和视频去抖动装置
CN102074021A (zh) * 2011-01-07 2011-05-25 北京理工大学 一种基于协方差匹配的核跟踪方法
JP6119991B2 (ja) * 2013-08-23 2017-04-26 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
CN103679749B (zh) * 2013-11-22 2018-04-10 北京奇虎科技有限公司 一种基于运动目标跟踪的图像处理方法及装置
CN107644429B (zh) * 2017-09-30 2020-05-19 华中科技大学 一种基于强目标约束视频显著性的视频分割方法
CN108010052A (zh) * 2017-10-13 2018-05-08 西安天和防务技术股份有限公司 复杂场景中的目标跟踪方法及系统、存储介质及电子终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301596A (zh) * 2013-07-11 2015-01-21 炬芯(珠海)科技有限公司 一种视频处理方法及装置
CN104574403A (zh) * 2015-01-12 2015-04-29 飞天诚信科技股份有限公司 一种智能裁剪方法
CN105263049A (zh) * 2015-10-28 2016-01-20 努比亚技术有限公司 一种基于帧坐标的视频裁剪装置、方法及移动终端
CN107454303A (zh) * 2016-05-31 2017-12-08 宇龙计算机通信科技(深圳)有限公司 一种视频防抖方法及终端设备
CN107274433A (zh) * 2017-06-21 2017-10-20 吉林大学 基于深度学习的目标跟踪方法、装置及存储介质
CN107610131A (zh) * 2017-08-25 2018-01-19 百度在线网络技术(北京)有限公司 一种图像裁剪方法和图像裁剪装置
CN107872639A (zh) * 2017-11-14 2018-04-03 维沃移动通信有限公司 通信视频的传输方法、装置和移动终端

Also Published As

Publication number Publication date
CN110830846A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN110830846B (zh) 一种视频裁剪方法及服务器
US11367282B2 (en) Subtitle extraction method and device, storage medium
JP6984840B2 (ja) リアルタイムコメント表示方法及び電子機器
CN111010590B (zh) 一种视频裁剪方法及装置
CN109040780A (zh) 一种视频处理方法及服务器
Betancourt et al. The evolution of first person vision methods: A survey
CN108694217B (zh) 视频的标签确定方法及装置
US10410679B2 (en) Producing video bits for space time video summary
KR102124466B1 (ko) 웹툰 제작을 위한 콘티를 생성하는 장치 및 방법
CN110351607B (zh) 一种全景视频场景切换的方法、计算机存储介质及客户端
US20210365749A1 (en) Image data processing method and apparatus, electronic device, and storage medium
US9268794B2 (en) Representative motion flow extraction for effective video classification and retrieval
TWI777185B (zh) 機器人圖像增強方法、處理器、電子設備、電腦可讀儲存介質
CN108882018B (zh) 虚拟场景中的视频播放、数据提供方法、客户端及服务器
JP2009042876A (ja) 画像処理装置及びその方法
CN109299734B (zh) 侵权图片的识别方法、装置和计算机可读存储介质
CN110287877B (zh) 视频目标的处理方法及装置
WO2016000536A1 (zh) 一种激活应用程序的方法、用户终端和服务器
CN111416991A (zh) 特效处理方法和设备,及存储介质
KR102200317B1 (ko) 디지털 비디오 컨텐츠 수정
KR102572986B1 (ko) 사용자 지정 초기화 포인트에 기반한 개체 추적
CN112235520A (zh) 一种图像处理方法、装置、电子设备及存储介质
US20160359937A1 (en) Contextual video content adaptation based on target device
US20230057963A1 (en) Video playing method, apparatus and device, storage medium, and program product
CN113689440A (zh) 一种视频处理方法、装置、计算机设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200512

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 100102 No. 4 Building, Wangjing Dongyuan District, Chaoyang District, Beijing

Applicant before: BEIJING YOUKU TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant