CN110019880A - 视频剪辑方法和装置 - Google Patents

视频剪辑方法和装置 Download PDF

Info

Publication number
CN110019880A
CN110019880A CN201710831148.3A CN201710831148A CN110019880A CN 110019880 A CN110019880 A CN 110019880A CN 201710831148 A CN201710831148 A CN 201710831148A CN 110019880 A CN110019880 A CN 110019880A
Authority
CN
China
Prior art keywords
label
segment
editing
key frame
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710831148.3A
Other languages
English (en)
Inventor
狄杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Youku Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Youku Network Technology Beijing Co Ltd filed Critical Youku Network Technology Beijing Co Ltd
Publication of CN110019880A publication Critical patent/CN110019880A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本公开涉及视频剪辑方法和装置。该方法包括:接收剪辑索引;确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段;合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。根据本公开能够大大节省了视频剪辑的工作量,为视频剪辑提供了极大便利。

Description

视频剪辑方法和装置
技术领域
本公开涉及视频剪辑领域,尤其涉及视频剪辑方法和装置。
背景技术
现有技术中,通常通过人工标记、搜索和截取视频片段,再对其进行拼接合成。人力成本巨大。
发明内容
有鉴于此,本公开提出了一种能够根据用户要求自动获取剪辑素材的方法。本公开还提出了相应的装置。
根据本公开的一方面,提供了一种视频剪辑方法,所述方法包括:接收剪辑索引;确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段;合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。
在一种可能的实现方式中,所述剪辑索引包括文字和图片中的至少一者。
在一种可能的实现方式中,所述标签包括文字和图片中的至少一者。
在一种可能的实现方式中,所述标签包括文字;所述方法还包括:将所述视频切分为所述多个片段;确定所述片段中的关键帧;对所述关键帧进行图像识别,以得到与包括所述关键帧的片段对应的标签中的所述文字。
在一种可能的实现方式中,所述标签包括图片;所述方法还包括:将所述视频切分为所述多个片段;确定所述片段中的关键帧,并将所述关键帧作为与包括所述关键帧的片段对应的标签中的所述图片。
根据本公开的另一方面,提供了一种视频剪辑装置,所述装置包括:剪辑索引接收模块,用于接收剪辑索引;匹配标签确定模块,用于确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段;片段合并模块,用于合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。
在一种可能的实现方式中,所述剪辑索引包括文字和图片中的至少一者。
在一种可能的实现方式中,所述标签包括文字和图片中的至少一者。
在一种可能的实现方式中,所述标签包括文字;所述装置还包括:第一视频切分模块,用于将所述视频切分为所述多个片段;第一关键帧确定模块,用于确定所述片段中的关键帧;图像识别模块,用于对所述关键帧进行图像识别,以得到与包括所述关键帧的片段对应的标签中的所述文字。
在一种可能的实现方式中,所述标签包括图片;所述装置还包括:第二视频切分模块,用于将所述视频切分为所述多个片段;第二关键帧确定模块,用于确定所述片段中的关键帧,并将所述关键帧作为与包括所述关键帧的片段对应的标签中的所述图片。
根据本公开的另一方面,提供了一种用于视频剪辑的装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
根据本公开的各方面能够自动根据剪辑索引得到相应的剪辑成片,大大节省了视频剪辑的工作量,为视频剪辑提供了极大便利。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开的一个示例性实施例的视频剪辑方法的流程图。
图2(a)、图2(b)和图2(c)示出根据本公开的一个示例性应用示例的示意图。
图3示出根据本公开的一个示例性实施例的视频剪辑装置的结构框图。
图4示出根据本公开的一个示例性实施例的用于视频剪辑的装置的结构框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开的一个示例性实施例的视频剪辑方法的流程图。该方法可应用于服务器或终端设备。如图1所示,该方法包括下列步骤。
步骤102,接收剪辑索引。
例如,可从客户端接收该剪辑索引。
在一种可能的实现方式中,所述剪辑索引包括文字。
在一种可能的实现方式中,所述剪辑索引包括图片。
在一种可能的实现方式中,所述剪辑索引包括文字和图片这两者。
步骤104,确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段。
在一种可能的实现方式中,所述标签包括文字,例如人物名称,例如建筑物的名称(诸如“纪念碑”等),例如行为描述(诸如“投篮”等),例如背景描述(诸如“大海”等),例如场景描述(诸如“室内”等)等等。
在一种可能的实现方式中,所述标签包括图片,例如,对应片段中的一个或多个图像帧,例如以出现的某个人物为主体的图片,例如特定场景的图片等等。
在一种可能的实现方式中,所述标签包括文字和图片二者。
例如,前述剪辑索引包括某个演员的名字,则如果某个标签中包括该演员的名字,或者包括该演员所扮演的角色的名字,或者包括出现了该演员的图片等等,则可认为该标签与所述剪辑索引匹配。
例如,前述剪辑索引包括以某个人物为主体的图片,则如果某个标签中包括以该人物为主体的图片,或者包括该人物的名称,则可认为该标签与所述剪辑索引匹配。
在一种可能的实现方式中,一个视频片段对应的标签可匹配于不同的剪辑索引。例如,某个片段对应的标签包括某人物名称和某场景描述,则当剪辑索引包括该人物名称或出现该人物的图片时,或当剪辑索引包括该场景描述或出现该场景的图片时,均可确定该标签与该剪辑索引匹配。例如,某个片段对应的标签包括某人物位于某场景的图片,则当剪辑索引包括该人物名称或出现该人物的图片时,或当剪辑索引包括该场景描述或出现该场景的图片时,均可确定该标签与该剪辑索引匹配。以上仅用于示例性说明,不用于对本公开进行任何限定。本领域技术人员可根据自己的需要来确定标签和剪辑索引是否匹配。
步骤106,合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。
在一种可能的实现方式中,可自动合并与所述剪辑索引匹配的标签对应的所有片段,例如,可以按照各个片段的时间戳的先后顺序将这些片段合并成一个剪辑成片。在本实现方式的一个示例中,将该剪辑成片发送给用户后,用户可自由编辑该剪辑成片,例如,从中删除一个或多个片段、插入其他的视频片段或调整片段的顺序等等。
在上述实施例中,可自动根据剪辑索引得到相应的剪辑成片,极大地节省了视频剪辑的人力成本,为视频剪辑提供了很大便利。
在应用本公开的一个示例中,上述实施例应用于服务器。用户对某个电视连续剧的一集进行剪辑,希望得到该剧集中某个人物的出现片段集锦。则用户可在客户端触发针对该剧集、以该人物名称为剪辑索引的剪辑请求。服务器收到该剪辑请求后,可确定该剧集的标签中与该人物名称匹配的10个标签,并根据标签与片段的对应关系确定对应的10个片段,例如,包括位于1分05秒~1分12秒的片段、3分10秒~4分20秒的片段、9分10秒~11分20秒的片段……,然后合并这10个片段以得到剪辑成片,并发送该剪辑成片给客户端。同时发送给客户端的还有相应的拼接信息,以便后续用户对该剪辑成片进行编辑,例如删除其中的一个或多个片段、插入其他的视频片段或调整片段的顺序等。
在一种可能的实现方式中,在接收到剪辑索引后,可向用户展示初步匹配的标签信息,以便于用户进行筛选以确定最符合期望的剪辑素材。例如,当用户输入的针对某视频的剪辑索引包括某人物名称时,可在客户端向用户展示显示该视频的多个标签中与所述人物名称初步匹配的若干标签,这些匹配的标签中的部分或全部除包括与该人物名称匹配的信息外,还包括相应片段的其他信息,例如场景描述信息、行为描述信息等。所展示的每个标签均可配置有对应的选中控件和/或删除控件。用户可通过该选择控件选择这些标签中的部分或全部作为最终确定的与所述剪辑索引匹配的标签。进一步地,可合并用户所选择的标签对应的片段以得到剪辑成片。
图2(a)、图2(b)和图2(c)示出根据本公开的一个示例性应用示例的示意图。图2(a)示出终端设备的客户端中用于接收用户输入的剪辑索引的页面示意图。用户可在视频A的展示区域下方的方框中输入针对视频A的剪辑索引,在本示例性示例中,用户输入“人物M”作为剪辑索引。然后,用户可点击剪辑索引输入框右侧的剪刀图标以触发剪辑操作。
终端设备可将该剪辑索引发送至服务器。服务器接收该剪辑索引,并向终端设备中的相应客户端返回视频A的多个标签中与该剪辑索引初步匹配的若干标签的完整信息。如图2(b)所示,这些标签可通过显示屏展示给用户,不同标签可换行显示。在展示标签时,还可展示该标签对应的片段的时间戳信息,例如,该片段在视频A中的起始时刻和结束时刻。每个标签中与该剪辑索引匹配的信息(如本示例中的“人物M”字段)可着重显示,例如,用特殊颜色/字体显示。图2(b)中的X1、X2、Y1和Y2用于指代相应标签中的其他信息。
在一个示例中,用户还可通过针对图2(b)中标签的操作获得对应片段的进一步信息。例如,可点击某标签,以请求服务器发送该标签对应的片段。服务器可响应于该请求,将该片段发送至终端设备上的相应客户端,该客户端可播放该片段以便于用户预览。
图2(b)中每个标签的左侧有一个选中控件,每个标签的右侧有一个删除控件,用户可根据每个片段对应的标签的完整信息过滤掉明显不符合期望的素材,并点击页面右下角的“下一步”控件,以请求服务器将选中的标签对应的片段合成剪辑成品并返回给该客户端。
如图2(c)所示,用户可标识该剪辑成片。在一个示例中,用户点击该剪辑成片的展示区域来播放该剪辑成片。还可设置针对该剪辑成片的下载、上传等空间,在此不再一一赘述。
需要说明的是,图2(a)~图2(c)所示的客户端页面示意图仅用于示例,不用于在任何方面限定页面的显示内容、显示方式和排布方式。本领域技术人员可根据需要设置合适的显示内容、显示方式和排布方式。
在一种可能的实现方式中,服务器/终端设备可预先得到各个片段对应的标签。在接收到剪辑请求时,根据如图1所示的方式得到剪辑成片。
在一种可能的实现方式中,服务器/终端设备可在接收到剪辑请求后,实时对视频进行分析,以得到与多个视频片段对应的标签,然后确定与剪辑请求所携带的剪辑索引匹配的标签,并合并对应的片段以得到剪辑成片。
以下给出了如何得到视频的片段对应的标签的几个示例。
在一种可能的实现方式中,在所述标签包括文字的情况下,图1所述的方法还包括:将所述视频切分为所述多个片段;确定所述片段中的关键帧;对所述关键帧进行图像识别,以得到与包括所述关键帧的片段对应的标签中的所述文字。
例如,在一个示例中,可通过检测视频帧的物理参数(例如特征值)来识别视频中的不同镜头,从而按照镜头切换的时间戳将所述视频切分为所述多个片段;在一个示例中,可先将视频按照镜头切分为多个小片段,再对小片段进行聚类,将属于同一聚类的多个小片段聚合在一起作为一个场景,从而按照场景切换的时间戳将所述视频切分为所述多个片段;在一个示例中,可按照时间等分的原则将所述视频切分为多个片段,等等。本领域技术人员可采用任意适用的手段将所述视频切分为多个片段,本公开对此不作限定。
例如,在一个示例中,可采用静态帧提取手段来确定所述片段中的关键帧,诸如首帧法、尾帧法、首尾帧法、像素帧平均法或直方图平均法等等;在一个示例中,可采用动态关键帧提取手段来确定所述片段中的关键帧,例如基于聚类分析的关键帧提取算法、基于运动分析的关键帧提取方法、基于语义内容的关键帧提取方法(例如针对采用MPEG-7编码标准的视频)等等。本领域技术人员可采用任意适用的手段确定片段中的关键帧,本公开对此不作限定。
例如,在进行图像识别时,可识别关键帧中的主体(诸如人物、动物、植物、建筑物等),和/或可识别关键帧中主体的行为和/或表情,和/或识别关键帧中的文字信息(诸如字幕)和/或符号信息,和/或可识别关键帧的背景,和/或可识别关键帧的场景等等,并提供与识别出的对象相关的文字信息,以作为标签或标签的一部分。本领域技术人员可采用任意适用的图像识别手段,本公开对此不作限定。
在一种可能的实现方式中,在所述标签包括图片的情况下,图1所述的方法还包括:将所述视频切分为所述多个片段;确定所述片段中的关键帧,并将所述关键帧作为与包括所述关键帧的片段对应的标签中的所述图片。
如上所示,本领域技术人员可采用任意适用的技术手段来切分视频以及确定关键帧,本公开对此不作限定。
通过上述实现方式,可自动得到与各个片段对应的文字/图片标签,为获取视频的片段对应的标签提供了极大的便利。
图3示出根据本公开的一个示例性实施例的视频剪辑装置300的结构框图。该装置可应用于服务器或终端设备。如图3所示,该装置300包括剪辑索引接收模块302、匹配标签确定模块304、片段合并模块306。剪辑索引接收模块302用于接收剪辑索引。匹配标签确定模块304用于确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段。片段合并模块306用于合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。
在一种可能的实现方式中,所述剪辑索引包括文字和图片中的至少一者。
在一种可能的实施方式中,所述标签包括文字和图片中的至少一者。
在一种可能的实施方式中,所述标签包括文字;所述装置300还包括:第一视频切分模块(未示出),用于将所述视频切分为所述多个片段;第一关键帧确定模块(未示出),用于确定所述片段中的关键帧;图像识别模块(未示出),用于对所述关键帧进行图像识别,以得到与包括所述关键帧的片段对应的标签中的所述文字。
在一种可能的实施方式中,所述标签包括图片;所述装置300还包括:第二视频切分模块(未示出),用于将所述视频切分为所述多个片段;第二关键帧确定模块(未示出),用于确定所述片段中的关键帧,并将所述关键帧作为与包括所述关键帧的片段对应的标签中的所述图片。
图4是根据一示例性实施例示出的一种用于视频剪辑的装置400的框图。例如,装置400可以被提供为一服务器或一终端设备。参照图4,装置400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述方法。
装置400还可以包括一个电源组件426被配置为执行装置400的电源管理,一个有线或无线网络接口450被配置为将装置400连接到网络,和一个输入输出(I/O)接口458。装置400可以操作基于存储在存储器432的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器432,上述计算机程序指令可由装置400的处理组件422执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (12)

1.一种视频剪辑方法,其特征在于,所述方法包括:
接收剪辑索引;
确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段;
合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。
2.根据权利要求1所述的方法,其特征在于,所述剪辑索引包括文字和图片中的至少一者。
3.根据权利要求1所述的方法,其特征在于,所述标签包括文字和图片中的至少一者。
4.根据权利要求3所述的方法,其特征在于,所述标签包括文字;
所述方法还包括:
将所述视频切分为所述多个片段;
确定所述片段中的关键帧;
对所述关键帧进行图像识别,以得到与包括所述关键帧的片段对应的标签中的所述文字。
5.根据权利要求3所述的方法,其特征在于,所述标签包括图片;
所述方法还包括:
将所述视频切分为所述多个片段;
确定所述片段中的关键帧,并将所述关键帧作为与包括所述关键帧的片段对应的标签中的所述图片。
6.一种视频剪辑装置,其特征在于,所述装置包括:
剪辑索引接收模块,用于接收剪辑索引;
匹配标签确定模块,用于确定视频的多个标签中与所述剪辑索引匹配的标签,所述多个标签对应于所述视频的多个片段;
片段合并模块,用于合并与所述剪辑索引匹配的标签对应的所述片段,得到剪辑成片。
7.根据权利要求6所述的装置,其特征在于,所述剪辑索引包括文字和图片中的至少一者。
8.根据权利要求6所述的装置,其特征在于,所述标签包括文字和图片中的至少一者。
9.根据权利要求8所述的装置,其特征在于,所述标签包括文字;
所述装置还包括:
第一视频切分模块,用于将所述视频切分为所述多个片段;
第一关键帧确定模块,用于确定所述片段中的关键帧;
图像识别模块,用于对所述关键帧进行图像识别,以得到与包括所述关键帧的片段对应的标签中的所述文字。
10.根据权利要求8所述的装置,其特征在于,所述标签包括图片;
所述装置还包括:
第二视频切分模块,用于将所述视频切分为所述多个片段;
第二关键帧确定模块,用于确定所述片段中的关键帧,并将所述关键帧作为与包括所述关键帧的片段对应的标签中的所述图片。
11.一种用于视频剪辑的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1-5中任意一项所述的方法。
12.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至5中任意一项所述的方法。
CN201710831148.3A 2017-09-04 2017-09-15 视频剪辑方法和装置 Pending CN110019880A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2017107877107 2017-09-04
CN201710787710 2017-09-04

Publications (1)

Publication Number Publication Date
CN110019880A true CN110019880A (zh) 2019-07-16

Family

ID=65526161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710831148.3A Pending CN110019880A (zh) 2017-09-04 2017-09-15 视频剪辑方法和装置

Country Status (2)

Country Link
CN (1) CN110019880A (zh)
WO (1) WO2019042341A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110381371A (zh) * 2019-07-30 2019-10-25 维沃移动通信有限公司 一种视频剪辑方法及电子设备
CN110534113A (zh) * 2019-08-26 2019-12-03 深圳追一科技有限公司 音频数据脱敏方法、装置、设备和存储介质
CN110611846A (zh) * 2019-09-18 2019-12-24 安徽石轩文化科技有限公司 一种短视频自动剪辑方法
CN111182327A (zh) * 2020-02-12 2020-05-19 北京达佳互联信息技术有限公司 一种视频剪辑方法、装置、视频分发服务器及终端
CN111246289A (zh) * 2020-03-09 2020-06-05 Oppo广东移动通信有限公司 视频生成方法及装置、电子设备、存储介质
CN112423115A (zh) * 2020-11-20 2021-02-26 广州欢网科技有限责任公司 一种花絮视频剪辑方法及系统
CN112423113A (zh) * 2020-11-20 2021-02-26 广州欢网科技有限责任公司 电视节目打点方法、装置及电子终端
CN114302253A (zh) * 2021-11-25 2022-04-08 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、设备及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110401878A (zh) * 2019-07-08 2019-11-01 天脉聚源(杭州)传媒科技有限公司 一种视频剪辑方法、系统及存储介质
CN113992942A (zh) * 2019-12-05 2022-01-28 腾讯科技(深圳)有限公司 视频的拼接方法及装置、计算机存储介质
CN111538896B (zh) * 2020-03-12 2021-04-27 成都云帆数联科技有限公司 基于深度学习的新闻视频细粒度标签智能提取方法
CN111639228B (zh) * 2020-05-29 2023-07-18 北京百度网讯科技有限公司 视频检索方法、装置、设备及存储介质
CN111695505B (zh) * 2020-06-11 2024-05-24 北京市商汤科技开发有限公司 视频处理方法及装置、电子设备和存储介质
CN113709560B (zh) * 2021-03-31 2024-01-02 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质
CN113905274B (zh) * 2021-09-30 2024-05-17 安徽尚趣玩网络科技有限公司 一种基于ec标识的视频素材拼接方法及装置
CN115396627A (zh) * 2022-08-24 2022-11-25 易讯科技股份有限公司 一种录屏视频会议的定位管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101048799A (zh) * 2004-10-25 2007-10-03 惠普开发有限公司 通过实时视频动作分析理解视频内容
CN101620629A (zh) * 2009-06-09 2010-01-06 中兴通讯股份有限公司 一种提取视频索引的方法、装置及视频下载系统
US9620168B1 (en) * 2015-12-21 2017-04-11 Amazon Technologies, Inc. Cataloging video and creating video summaries
US20170220869A1 (en) * 2016-02-02 2017-08-03 Verizon Patent And Licensing Inc. Automatic supercut creation and arrangement

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101646050B (zh) * 2009-09-09 2011-04-06 中国电信股份有限公司 视频文件的文本注释方法和系统、播放方法和系统
US9852769B2 (en) * 2013-05-20 2017-12-26 Intel Corporation Elastic cloud video editing and multimedia search
US10242007B2 (en) * 2015-07-14 2019-03-26 Verizon Patent And Licensing Inc. Automated media clipping and combination system
CN105657537B (zh) * 2015-12-23 2018-06-19 小米科技有限责任公司 视频剪辑方法及装置
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101048799A (zh) * 2004-10-25 2007-10-03 惠普开发有限公司 通过实时视频动作分析理解视频内容
CN101620629A (zh) * 2009-06-09 2010-01-06 中兴通讯股份有限公司 一种提取视频索引的方法、装置及视频下载系统
US9620168B1 (en) * 2015-12-21 2017-04-11 Amazon Technologies, Inc. Cataloging video and creating video summaries
US20170220869A1 (en) * 2016-02-02 2017-08-03 Verizon Patent And Licensing Inc. Automatic supercut creation and arrangement

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110381371A (zh) * 2019-07-30 2019-10-25 维沃移动通信有限公司 一种视频剪辑方法及电子设备
CN110381371B (zh) * 2019-07-30 2021-08-31 维沃移动通信有限公司 一种视频剪辑方法及电子设备
CN110534113A (zh) * 2019-08-26 2019-12-03 深圳追一科技有限公司 音频数据脱敏方法、装置、设备和存储介质
CN110534113B (zh) * 2019-08-26 2021-08-24 深圳追一科技有限公司 音频数据脱敏方法、装置、设备和存储介质
CN110611846A (zh) * 2019-09-18 2019-12-24 安徽石轩文化科技有限公司 一种短视频自动剪辑方法
CN111182327A (zh) * 2020-02-12 2020-05-19 北京达佳互联信息技术有限公司 一种视频剪辑方法、装置、视频分发服务器及终端
CN111182327B (zh) * 2020-02-12 2022-04-22 北京达佳互联信息技术有限公司 一种视频剪辑方法、装置、视频分发服务器及终端
CN111246289A (zh) * 2020-03-09 2020-06-05 Oppo广东移动通信有限公司 视频生成方法及装置、电子设备、存储介质
CN112423115A (zh) * 2020-11-20 2021-02-26 广州欢网科技有限责任公司 一种花絮视频剪辑方法及系统
CN112423113A (zh) * 2020-11-20 2021-02-26 广州欢网科技有限责任公司 电视节目打点方法、装置及电子终端
CN114302253A (zh) * 2021-11-25 2022-04-08 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、设备及存储介质
CN114302253B (zh) * 2021-11-25 2024-03-12 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2019042341A1 (zh) 2019-03-07

Similar Documents

Publication Publication Date Title
CN110019880A (zh) 视频剪辑方法和装置
CN110119711B (zh) 一种获取视频数据人物片段的方法、装置及电子设备
JP7123122B2 (ja) 認知的洞察を使用したビデオ・シーンの移動
CN109756751B (zh) 多媒体数据处理方法及装置、电子设备、存储介质
CN106686404B (zh) 一种视频分析平台、匹配方法、精准投放广告方法及系统
CN111866585A (zh) 一种视频处理方法及装置
CN113301430B (zh) 视频剪辑方法、装置、电子设备以及存储介质
KR20210053825A (ko) 비디오를 처리하기 위한 방법 및 장치
US8879788B2 (en) Video processing apparatus, method and system
US20160004911A1 (en) Recognizing salient video events through learning-based multimodal analysis of visual features and audio-based analytics
CN107704525A (zh) 视频搜索方法和装置
CN108632541B (zh) 一种多视频片段合并方法及装置
CN113709561A (zh) 视频剪辑方法、装置、设备及存储介质
CN110309353A (zh) 视频索引方法及装置
CN112733660B (zh) 一种视频拆条的方法和装置
CN111901536B (zh) 基于场景识别的视频剪辑方法、系统、设备及存储介质
CN110121033A (zh) 视频编目方法及装置
KR20090093904A (ko) 장면 변화에 강인한 멀티미디어 영상 분석 장치 및 그 방법과, 그를 이용한 객체 기반 멀티미디어 편집 시스템
CN102231820A (zh) 一种监控图像处理的方法、装置和系统
CN104331437A (zh) 生成图片描述信息的方法和装置
CN112784078A (zh) 一种基于语义识别的视频自动剪辑方法
CN112000024B (zh) 用于控制家电设备的方法及装置、设备
Husa et al. HOST-ATS: automatic thumbnail selection with dashboard-controlled ML pipeline and dynamic user survey
CN114845149A (zh) 视频片段的剪辑方法、视频推荐方法、装置、设备及介质
CN109002522A (zh) 一种影视数据库的更新方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200603

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Applicant before: Youku network technology (Beijing) Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190716

RJ01 Rejection of invention patent application after publication