CN111372136A - 批量视频场景内容编辑方法和装置 - Google Patents

批量视频场景内容编辑方法和装置 Download PDF

Info

Publication number
CN111372136A
CN111372136A CN202010127465.9A CN202010127465A CN111372136A CN 111372136 A CN111372136 A CN 111372136A CN 202010127465 A CN202010127465 A CN 202010127465A CN 111372136 A CN111372136 A CN 111372136A
Authority
CN
China
Prior art keywords
target
editing
key frames
frame
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010127465.9A
Other languages
English (en)
Inventor
胡飞
胡波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Wanmian Intelligent Technology Co Ltd
Original Assignee
Shanghai Wanmian Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Wanmian Intelligent Technology Co Ltd filed Critical Shanghai Wanmian Intelligent Technology Co Ltd
Priority to CN202010127465.9A priority Critical patent/CN111372136A/zh
Publication of CN111372136A publication Critical patent/CN111372136A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440245Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本申请提供了一种批量视频场景内容编辑方法和装置,涉及计算机技术领域。该方法包括:预先确定待编辑视频内容中的多个关键帧,并对所述多个关键帧进行聚类,将所述多个关键帧聚类为多个聚类集合;在进行编辑时,在接收针对所述多个关键帧中的目标关键帧的编辑指令后,确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;将所述待替换图像信息应用在所述目标帧图像的编辑区域中。以此可以实现批量的进行视频编辑,提升了视频编辑的效率。

Description

批量视频场景内容编辑方法和装置
技术领域
本申请涉及计算机技术领域,尤其是涉及一种批量视频场景内容编辑方法和装置。
背景技术
对于电影或电视剧,在剪辑完毕后,有进行后处理的需求,比如,因为出于内容编辑目的,需要更换部分画面上的内容;或者出于商业目的,需要植入广告及商业推广内容,通常采用视频后处理方式进行处理:针对需要处理的每一个视频片段,进行逐片段编辑;针对片段里的每一帧,进行逐帧处理。这种处理方式的缺点是:
在处理一个片段时的结果,在处理另一个片段时难以复用,导致处理效率低下;
由于主要依赖人工查找与处理,在处理长视频或多集电视剧时,如果一个场景在视频或电视剧中出现了多次,很容易遗漏需要处理的场景。
发明内容
本申请的目的在于提供一种批量视频场景内容编辑方法和装置,以缓解了在视频编辑时工作量大,效率低的问题。
第一方面,实施例提供一种批量视频场景内容编辑方法,所述方法包括:
确定待编辑视频内容中的多个关键帧,其中所述待编辑视频内容包括具有时间顺序的多个初始帧图像,所述多个关键帧根据预设规则从所述多个初始帧图像中选择得到;
对所述多个关键帧进行聚类,将所述多个关键帧聚类为多个聚类集合;
接收针对所述多个关键帧中的目标关键帧的编辑指令,所述目标关键帧包括编辑区域,所述编辑区域对应有待替换图像信息,所述编辑指令用于指示将所述待替换图像信息应用在所述编辑区域中;
确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;
将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
在可选的实施方式中,所述待编辑视频内容包括至少一个视频文件,每个所述视频文件包括具有时间顺序的多个初始帧图像,所述预设规则为在所述多个初始帧图像中每隔指定时间间隔选择一个作为关键帧。
在可选的实施方式中,对所述多个关键帧进行聚类的步骤,包括:
基于感知哈希聚类算法对所述多个关键帧进行聚类,其中,不同聚类集合中的关键帧之间存在明暗变换和/或镜头变化的差异。
在可选的实施方式中,确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像的步骤,包括:
针对所述目标关键帧所属的目标聚类集合中所有的关键帧中的每一个,均在所述多个初始帧图像中确定与当前关键帧在预设时间范围内的初始帧图像为目标图像帧。
在可选的实施方式中,将所述待替换图像信息应用在所述目标帧图像的编辑区域中的步骤,包括:
基于图像配准算法确定所述目标帧图像和所述目标关键帧的编辑区域映射关系;
基于所述编辑区域映射关系,将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
第二方面,实施例提供一种批量视频场景内容编辑装置,所述装置包括:
第一确定单元,用于确定待编辑视频内容中的多个关键帧,其中所述待编辑视频内容包括具有时间顺序的多个初始帧图像,所述多个关键帧根据预设规则从所述多个初始帧图像中选择得到;
聚类单元,用于对所述多个关键帧进行聚类,将所述多个关键帧聚类为多个聚类集合;
接收单元,用于接收针对所述多个关键帧中的目标关键帧的编辑指令,所述目标关键帧包括编辑区域,所述编辑区域对应有待替换图像信息,所述编辑指令用于指示将所述待替换图像信息应用在所述编辑区域中;
第二确定单元,用于确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;
替换单元,用于将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
在可选的实施方式中,所述待编辑视频内容包括至少一个视频文件,每个所述视频文件包括具有时间顺序的多个初始帧图像,所述预设规则为在所述多个初始帧图像中每隔指定时间间隔选择一个作为关键帧。
在可选的实施方式中,所述聚类单元具体用于:
基于感知哈希聚类算法对所述多个关键帧进行聚类,其中,不同聚类集合中的关键帧之间存在明暗变换和/或镜头变化的差异。
在可选的实施方式中,所述第二确定单元具体用于:
针对所述目标关键帧所属的目标聚类集合中所有的关键帧中的每一个,均在所述多个初始帧图像中确定与当前关键帧在预设时间范围内的初始帧图像为目标图像帧。
在可选的实施方式中,所述替换单元具体用于:
基于图像配准算法确定所述目标帧图像和所述目标关键帧的编辑区域映射关系;
基于所述编辑区域映射关系,将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
第三方面,本申请实施例又提供了一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的第一方面所述的游戏应用的启动方法的步骤。
第四方面,本申请实施例又提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的第一方面所述的游戏应用的启动方法的步骤。
本申请实施例带来了以下有益效果:
本申请实施例提供了本申请提供的一种批量视频场景内容编辑方法和装置。通过预先确定待编辑视频内容中的多个关键帧,并对所述多个关键帧进行聚类,将所述多个关键帧聚类为多个聚类集合;在进行编辑时,在接收针对所述多个关键帧中的目标关键帧的编辑指令后,确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;将所述待替换图像信息应用在所述目标帧图像的编辑区域中。以此可以实现批量的进行视频编辑,提升了视频编辑的效率。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种批量视频场景内容编辑方法流程示意图;
图2为本申请实施例提供的另一种批量视频场景内容编辑方法流程示意图;
图3为本申请实施例提供的一种批量视频场景内容编辑装置结构示意图;
图4本申请实施例提供的一种计算机设备结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
图1为本申请实施例提供的一种批量视频场景内容编辑方法流程示意图。该方法可以应用于计算机设备中,如图1所示,该方法包括:
S110,确定待编辑视频内容中的多个关键帧。
其中,该待编辑视频内容包括具有时间顺序的多个初始帧图像,该多个关键帧根据预设规则从多个初始帧图像中选择得到。
在于一些实施例中,该待编辑视频内容包括至少一个视频文件,每个视频文件包括具有时间顺序的多个初始帧图像。
作为一个示例,假定每一个视频内容由若干视频文件组成,每个视频文件由V1,V2,V3……Vm……Vn来代表。每一部视频由若干帧图像组成,以视频文件Vm为例,以Vm1,Vm2,Vm3……Vmk……Vms来代表它的每一帧图像。
在一些实施例中,上述预设规则可以包括多种实现方式。作为一个示例,该预设规则可以为在多个初始帧图像中每隔指定时间间隔选择一个作为关键帧。例如,对于每一个镜头(一个镜头可以对应一个视频文件),每隔t秒选择1帧做为关键帧,该t可以在0.02-120秒之间,典型值为1秒;得到的关键帧记为f(m,s),代表该关键帧位于第m个视频文件里的第s秒。
S120,对多个关键帧进行聚类,将多个关键帧聚类为多个聚类集合。
在本申请实施例中,具体的聚类方式可以包括多种。其中,聚类的主要目的是,将明暗变换和镜头变化不存在较大差异的关键帧分为一组。
作为一个示例,可以基于感知哈希聚类算法对多个关键帧进行聚类,其中,不同聚类集合中的关键帧之间存在明暗变换和/或镜头变化的差异。换句话说,不同聚类集合中的关键帧之间可以存在明暗变换、也可以存在镜头变换,还可以是既存在明暗变换也存在镜头变换。其中,对所有的关键帧图像进行感知哈希聚类可以得到H类。每一类由若干关键帧构成。选择适当的阈值,对每一个聚类按照关键帧图像数量多少进行排序,得到聚类集合,可以计为:H1,H2……。每一个聚类可视为相同镜头在视频文件里出现的片段里关键帧的集合,其中,关键帧图像间存在明暗变化、镜头变化等差异。
S130,接收针对多个关键帧中的目标关键帧的编辑指令。
其中,该目标关键帧包括编辑区域,该编辑区域对应有待替换图像信息,该编辑指令用于指示将待替换图像信息应用在所述编辑区域中。
可以选取某个聚类中的某关键帧图片,进行图像编辑,举例,将该图像中的某个编辑区域里的像素,替换为另一幅图像里的内容。此时,可以触发编辑指令,以便将该种编辑方式应用在全部相关的帧图像中,从而实现批量编辑。
S140,确定多个初始帧图像中与目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像。
假定所编辑的关键帧图像为f,该聚类中的其他关键帧图像f(m,s)。其中,f(m,s)是视频文件Vm中位于第s秒的帧图像。可以从该关键帧图像f(m,s)起,在视频文件Vm中向前与向后进行逐帧扫描,扫描时间窗口为T,将该视频文件Vm中该时间窗口T中的所有初始帧图像确定为目标帧图像。
S150,将待替换图像信息应用在目标帧图像的编辑区域中。
可以基于代替换图像信息,对目标帧图像中的编辑区域进行修改或替换。例如,可以对编辑区域的像素值进行修改或替换为其他图像,以此可以实现内容的植入。
通过本申请实施例,可以预先确定待编辑视频内容中的多个关键帧,并对多个关键帧进行聚类,将多个关键帧聚类为多个聚类集合;在进行编辑时,在接收针对所述多个关键帧中的目标关键帧的编辑指令后,确定多个初始帧图像中与目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;将待替换图像信息应用在所述目标帧图像的编辑区域中。以此可以实现批量的进行视频编辑,提升了视频编辑的效率。
在一些实施例中,上述步骤S140具体可以包括如下步骤:
步骤1.1),针对目标关键帧所属的目标聚类集合中所有的关键帧中的每一个,均在多个初始帧图像中确定与当前关键帧在预设时间范围内的初始帧图像为目标图像帧。其中,该预设时间范围可以为前述的时间窗口。
在一些实施例中,上述步骤S150具体可以包括如下步骤:
步骤2.1),基于图像配准算法确定目标帧图像和目标关键帧的编辑区域映射关系;
步骤2.2),基于编辑区域映射关系,将待替换图像信息应用在目标帧图像的编辑区域中。
作为一个示例,结合图2所示,假定所编辑的关键帧图像为f,该聚类中的其他关键帧图像f(m,s)。其中,f(m,s)是视频文件Vm中位于第s秒的帧图像。上述步骤S150具体可以通过如下步骤实现:
S210,针对该聚类中的其他关键帧图像f(m,s),采用图像配准算法,对两个图像进行匹配映射并虚拟拼接。由拼接参数,便可以计算f和f(m,s)之间的区域映射关系。
S220,将f中的编辑区域转换为在f(m,s)中的编辑区域,将f中所编辑的新内容粘贴到f(m,s)中作为新内容。
S230,从该f(m,s)帧图像起,在视频文件Vm中向前与向后进行逐帧扫描,扫描时间窗口为0.5秒,对于扫描到的每一帧,均进行与步骤S220中f(m,s)相同的处理。
重复执行上述步骤,直至该聚类中的其他关键帧图像f(m,s)全部执行完成。
在本申请实施例中,图像配准可以是确定两个图像的像素点的位置关系,该位置关系可以包括偏移、旋转以及缩放等等,该图像配准可以包括多种实现方式。作为一个示例,上述步骤2.1)可以包括如下步骤:
步骤3.1),采用局部特征提取算法(例如,SUFT、SIFT、ORB等等算法)检测目标帧图像和目标关键帧的特征点;
步骤3.2),采用随机采样一致性算法(例如,RANSAC等算法)计算目标帧图像和目标关键帧匹配的投影变换的单应性矩阵。其中,单应性矩阵描述了幅图像间的映射关系,可以将目标关键帧的坐标转换为目标帧图像的坐标,从而实现两副图像间的配准。
对于上述步骤3.1),首先,我们需要加载2个图像(也即目标帧图像和目标关键帧),从两者中提取关键点和描述符。可以通过使用OpenCVdetectAndCompute()函数实现。为了使用detectAndCompute(),需要一个关键点检测器和描述符对象的实例,它可以是ORB,SIFT或SURF等。另外,在将图像馈送到detectAndCompute()之前,可以将其转换为灰度。对目标帧图像和目标关键帧都运行detectAndCompute(),分别得到提供了一组关键点和描述子。另外,在使用SIFT作为特征提取器时,关键点对应128维特征向量。如果使用SURF,关键点对应64维特征向量。
基于上述过程可以从目标帧图像和目标关键帧中都有大量的特征。接下来,可以比较对应于该两个图像的两组特征并确定相似性的特征点对。例如,使用OpenCV功能匹配需要Matcher对象。可以通过多种方法来实现:例如,采用Brute Force Matcher(暴力匹配法)或KNN(k-最近邻)等算法来实现。其中,BruteForce(BF)Matcher的匹配器计算两点之间的欧几里德距离,对于集合A中的每个特征,它返回集合B中最接近的特征。对于SIFT和SURF,OpenCV建议使用欧几里德距离。对于其他特征提取器,如ORB和BRISK,建议使用汉明距离。要使用OpenCV创建BruteForce Matcher,我们只需要指定2个参数距离度量和crossCheck布尔参数。crossCheck bool参数指示两个特征是否必须相互匹配才能被视为有效。换句话说,对于被认为有效的一对特征(f1,f2),f1需要匹配f2,并且f2也必须匹配f1作为最接近的匹配。
另外在考虑多个候选匹配的情况,可以使用基于KNN的匹配过程。为了确保KNN返回的特征具有良好的可比性,可以采用基于比率测试(Ratio Testing)的技术。通过迭代KNN返回的每个对并执行距离测试。对于每对特征(f1,f2),如果f1和f2之间的距离在一定比例内,保留它,否则,将它丢弃。此外,可以预先设置选择比率值。
对于上述步骤3.2),在确定两个图像中最好的(更相似的)特征集后,可以额获取这些点并找到基于匹配点将2个图像拼接在一起的变换矩阵。这种转换可以称为Homography matrix(单应性矩阵)。简而言之,如果Homography是3x3矩阵,可用于许多应用,例如相机姿态估计,透视校正和图像拼接。如果Homography是2D变换。它将点从一个平面(图像)映射到另一个平面。
RANdomSAmple Consensus或RANSAC是一种适合线性模型的迭代算法。RANSAC设计为对异常值具有鲁棒性。通过RANSAC来估计Homography矩阵。该算法(RANSAC)可以过滤明显不属于数据分布的点。一旦我们得到estimated Homography,我们需要将其中一个图像变换到一个共同的平面。
例如可以对其中一个图像应用透视变换。该透视变换可以组合一个或多个操作,例如旋转,缩放,平移或剪切等等。为此,我们可以使用OpenCVwarpPerspective()函数。它采用图像和homography作为输入。然后,它根据homography将源图像变换到目的平面上。
图3为本申请实施例提供的一种批量视频场景内容编辑装置结构示意图。如图3所示,该装置包括:
第一确定单元301,用于确定待编辑视频内容中的多个关键帧,其中待编辑视频内容包括具有时间顺序的多个初始帧图像,多个关键帧根据预设规则从多个初始帧图像中选择得到;
聚类单元302,用于对多个关键帧进行聚类,将多个关键帧聚类为多个聚类集合;
接收单元303,用于接收针对多个关键帧中的目标关键帧的编辑指令,目标关键帧包括编辑区域,编辑区域对应有待替换图像信息,编辑指令用于指示将待替换图像信息应用在编辑区域中;
第二确定单元304,用于确定多个初始帧图像中与目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;
替换单元305,用于将待替换图像信息应用在目标帧图像的编辑区域中。
在一些实施例中,待编辑视频内容包括至少一个视频文件,每个视频文件包括具有时间顺序的多个初始帧图像,预设规则为在多个初始帧图像中每隔指定时间间隔选择一个作为关键帧。
在一些实施例中,聚类单元302具体用于:
基于感知哈希聚类算法对多个关键帧进行聚类,其中,不同聚类集合中的关键帧之间存在明暗变换和/或镜头变化的差异。
在一些实施例中,第二确定单元304具体用于:
针对目标关键帧所属的目标聚类集合中所有的关键帧中的每一个,均在多个初始帧图像中确定与当前关键帧在预设时间范围内的初始帧图像为目标图像帧。
在一些实施例中,替换单元305具体用于:
基于图像配准算法确定目标帧图像和目标关键帧的编辑区域映射关系;
基于编辑区域映射关系,将待替换图像信息应用在目标帧图像的编辑区域中。
本申请实施例提供的批量视频场景内容编辑装置,与上述实施例提供的批量视频场景内容编辑方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
如图4所示,本申请实施例提供的一种计算机设备700,包括:处理器701、存储器702和总线,所述存储器702存储有所述处理器701可执行的机器可读指令,当电子设备运行时,所述处理器701与所述存储器702之间通过总线通信,所述处理器701执行所述机器可读指令,以执行如上述批量视频场景内容编辑方法的步骤。
具体地,上述存储器702和处理器701能够为通用的存储器和处理器,这里不做具体限定,当处理器701运行存储器702存储的计算机程序时,能够执行上述批量视频场景内容编辑方法。
对应于上述批量视频场景内容编辑方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述批量视频场景内容编辑方法的步骤。
本申请实施例所提供的批量视频场景内容编辑装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述移动控制方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种批量视频场景内容编辑方法,其特征在于,所述方法包括:
确定待编辑视频内容中的多个关键帧,其中所述待编辑视频内容包括具有时间顺序的多个初始帧图像,所述多个关键帧根据预设规则从所述多个初始帧图像中选择得到;
对所述多个关键帧进行聚类,将所述多个关键帧聚类为多个聚类集合;
接收针对所述多个关键帧中的目标关键帧的编辑指令,所述目标关键帧包括编辑区域,所述编辑区域对应有待替换图像信息,所述编辑指令用于指示将所述待替换图像信息应用在所述编辑区域中;
确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;
将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
2.根据权利要求1所述的方法,其特征在于,所述待编辑视频内容包括至少一个视频文件,每个所述视频文件包括具有时间顺序的多个初始帧图像,所述预设规则为在所述多个初始帧图像中每隔指定时间间隔选择一个作为关键帧。
3.根据权利要求1所述的方法,其特征在于,对所述多个关键帧进行聚类的步骤,包括:
基于感知哈希聚类算法对所述多个关键帧进行聚类,其中,不同聚类集合中的关键帧之间存在明暗变换和/或镜头变化的差异。
4.根据权利要求1所述的方法,其特征在于,确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像的步骤,包括:
针对所述目标关键帧所属的目标聚类集合中所有的关键帧中的每一个,均在所述多个初始帧图像中确定与当前关键帧在预设时间范围内的初始帧图像为目标图像帧。
5.根据权利要求4所述的方法,其特征在于,将所述待替换图像信息应用在所述目标帧图像的编辑区域中的步骤,包括:
基于图像配准算法确定所述目标帧图像和所述目标关键帧的编辑区域映射关系;
基于所述编辑区域映射关系,将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
6.一种批量视频场景内容编辑装置,其特征在于,所述装置包括:
第一确定单元,用于确定待编辑视频内容中的多个关键帧,其中所述待编辑视频内容包括具有时间顺序的多个初始帧图像,所述多个关键帧根据预设规则从所述多个初始帧图像中选择得到;
聚类单元,用于对所述多个关键帧进行聚类,将所述多个关键帧聚类为多个聚类集合;
接收单元,用于接收针对所述多个关键帧中的目标关键帧的编辑指令,所述目标关键帧包括编辑区域,所述编辑区域对应有待替换图像信息,所述编辑指令用于指示将所述待替换图像信息应用在所述编辑区域中;
第二确定单元,用于确定所述多个初始帧图像中与所述目标关键帧所属的目标聚类集合中所有的关键帧所对应的目标帧图像;
替换单元,用于将所述待替换图像信息应用在所述目标帧图像的编辑区域中。
7.根据权利要求6所述的装置,其特征在于,所述待编辑视频内容包括至少一个视频文件,每个所述视频文件包括具有时间顺序的多个初始帧图像,所述预设规则为在所述多个初始帧图像中每隔指定时间间隔选择一个作为关键帧。
8.根据权利要求6所述的装置,其特征在于,所述聚类单元具体用于:
基于感知哈希聚类算法对所述多个关键帧进行聚类,其中,不同聚类集合中的关键帧之间存在明暗变换和/或镜头变化的差异。
9.一种计算机设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至5任一项所述的方法。
CN202010127465.9A 2020-02-28 2020-02-28 批量视频场景内容编辑方法和装置 Pending CN111372136A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010127465.9A CN111372136A (zh) 2020-02-28 2020-02-28 批量视频场景内容编辑方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010127465.9A CN111372136A (zh) 2020-02-28 2020-02-28 批量视频场景内容编辑方法和装置

Publications (1)

Publication Number Publication Date
CN111372136A true CN111372136A (zh) 2020-07-03

Family

ID=71210155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010127465.9A Pending CN111372136A (zh) 2020-02-28 2020-02-28 批量视频场景内容编辑方法和装置

Country Status (1)

Country Link
CN (1) CN111372136A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240191A (zh) * 2013-06-24 2014-12-24 厦门美图网科技有限公司 一种批量图像增强处理的方法
US20150262338A1 (en) * 2014-03-14 2015-09-17 Xerox Corporation Compensating for motion during real-time batch processing of video for physiological function assessment
US20160042605A1 (en) * 2004-07-06 2016-02-11 Igt Methods and systems for determining a batch run of sessions
CN106101771A (zh) * 2016-06-27 2016-11-09 乐视控股(北京)有限公司 视频处理方法、装置及终端
CN106648372A (zh) * 2016-12-29 2017-05-10 北京小米移动软件有限公司 图像管理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160042605A1 (en) * 2004-07-06 2016-02-11 Igt Methods and systems for determining a batch run of sessions
CN104240191A (zh) * 2013-06-24 2014-12-24 厦门美图网科技有限公司 一种批量图像增强处理的方法
US20150262338A1 (en) * 2014-03-14 2015-09-17 Xerox Corporation Compensating for motion during real-time batch processing of video for physiological function assessment
CN106101771A (zh) * 2016-06-27 2016-11-09 乐视控股(北京)有限公司 视频处理方法、装置及终端
CN106648372A (zh) * 2016-12-29 2017-05-10 北京小米移动软件有限公司 图像管理方法及装置

Similar Documents

Publication Publication Date Title
US10410397B2 (en) Picture presentation method and apparatus
US8126206B2 (en) Image processing apparatus, image processing method, and program
US9008366B1 (en) Bio-inspired method of ground object cueing in airborne motion imagery
US9092868B2 (en) Apparatus for detecting object from image and method therefor
US20110311100A1 (en) Method, Apparatus and Computer Program Product for Providing Object Tracking Using Template Switching and Feature Adaptation
WO2010084739A1 (ja) 映像識別子抽出装置
EP2660753B1 (en) Image processing method and apparatus
CN111612696B (zh) 图像拼接方法、装置、介质及电子设备
US9235779B2 (en) Method and apparatus for recognizing a character based on a photographed image
CN110083740B (zh) 视频指纹提取及视频检索方法、装置、终端及存储介质
CN112257595A (zh) 视频匹配方法、装置、设备及存储介质
KR20140045897A (ko) 시각적 이미지 매칭을 기반으로 한 미디어 스트림 식별 장치 및 방법
WO2010079559A1 (ja) クレジット情報区間検出方法、クレジット情報区間検出装置及びクレジット情報区間検出プログラム
CN112802033B (zh) 图像处理方法及装置、计算机可读存储介质和电子设备
Fan et al. Matching slides to presentation videos using sift and scene background matching
US20190005347A1 (en) Information processing apparatus, program, and information processing method
Ling et al. Image quality assessment for DIBR synthesized views using elastic metric
US10872263B2 (en) Information processing apparatus, information processing method and storage medium
CN114267029A (zh) 一种车道线检测方法、装置、设备及存储介质
JP6511950B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN111372136A (zh) 批量视频场景内容编辑方法和装置
CN110599525A (zh) 图像补偿方法和装置、存储介质及电子装置
Lee et al. Robust bilayer video segmentation by adaptive propagation of global shape and local appearance
US8300926B2 (en) Image processing apparatus and image processing method
CN112807689B (zh) 游戏视频处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200703

RJ01 Rejection of invention patent application after publication