CN108769733A - 视频剪辑方法和视频剪辑装置 - Google Patents

视频剪辑方法和视频剪辑装置 Download PDF

Info

Publication number
CN108769733A
CN108769733A CN201810650132.7A CN201810650132A CN108769733A CN 108769733 A CN108769733 A CN 108769733A CN 201810650132 A CN201810650132 A CN 201810650132A CN 108769733 A CN108769733 A CN 108769733A
Authority
CN
China
Prior art keywords
video
label
user
file
clipped
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810650132.7A
Other languages
English (en)
Inventor
何健
柳瑞超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics China R&D Center
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics China R&D Center
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics China R&D Center, Samsung Electronics Co Ltd filed Critical Samsung Electronics China R&D Center
Priority to CN201810650132.7A priority Critical patent/CN108769733A/zh
Publication of CN108769733A publication Critical patent/CN108769733A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明提供一种视频剪辑方法和视频剪辑装置,所述视频剪辑方法包括:(A)从待剪辑的视频内容中解析至少一个标签;(B)基于所述至少一个标签确定用户感兴趣的标签;(C)从待剪辑的视频内容中截取与所述用户感兴趣的标签对应的视频帧;(D)根据截取的视频帧生成剪辑视频。本发明的视频剪辑方法和视频剪辑装置,通过用户感兴趣的标签对待剪辑的视频内容进行视频剪辑处理,可以显著提高剪辑视频的效率,快速方便地得到用户感兴趣的视频内容,极大地提升了用户体验。

Description

视频剪辑方法和视频剪辑装置
技术领域
本发明总体说来涉及通信领域,更具体地讲,涉及一种视频剪辑方法和视频剪辑装置。
背景技术
连续的图像变化每秒超过24帧画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频。目前,视频剪辑技术的应用越来越广泛,剪辑人员通常采用专业的剪辑软件对视频进行剪辑处理,以得到用户期望的视频内容。
然而,现有的视频剪辑技术主要采用人工手动的方式,从原始视频(即,已有的视频)中截取需要的视频片段,然后再进行拼接处理,这会造成在操作上耗费大量的时间,并且视频剪辑工作非常繁琐,导致视频剪辑的速度变慢,进而降低了剪辑视频的效率。
发明内容
本发明的目的在于提供一种视频剪辑方法和视频剪辑装置,可以显著提高剪辑视频的效率,快速方便地得到用户感兴趣的视频内容。
本发明的一方面提供一种视频剪辑方法,包括:(A)从待剪辑的视频内容中解析至少一个标签;(B)基于所述至少一个标签确定用户感兴趣的标签;(C)从待剪辑的视频内容中截取与所述用户感兴趣的标签对应的视频帧;(D)根据截取的视频帧生成剪辑视频。
可选地,所述至少一个标签包括:人物标签、物体标签和动作标签。
可选地,步骤(A)包括:识别待剪辑的视频内容中的人脸;将识别出的相同的人脸映射到同一个人物标签;输出映射得到的人物标签,和/或,步骤(A)包括:识别待剪辑的视频内容中的物体;输出用于指示识别出的物体的物体标签,和/或,步骤(A)包括:识别待剪辑的视频内容中的动作;输出用于指示识别出的动作的动作标签。
可选地,步骤(D)包括:对截取的视频帧进行编码以得到编码的视频文件;生成与编码的视频文件对应的字幕文件;生成与所述字幕文件对应的音频文件;对编码的视频文件、所述字幕文件和所述音频文件进行合成,以生成所述剪辑视频。
可选地,步骤(D)还包括:同步编码的视频文件和所述音频文件的时间戳。
可选地,所述视频剪辑方法还包括:接收用于生成剪辑视频的预定参数,其中,对编码的视频文件、所述字幕文件和所述音频文件进行合成的步骤包括:根据所述预定参数对编码的视频文件、所述字幕文件和所述音频文件进行合成。
可选地,所述预定参数包括:视频的格式和/或每秒传输帧数。
可选地,步骤(B)包括:响应于用户对所述至少一个标签的选择而将选择的标签确定为所述用户感兴趣的标签。
可选地,步骤(B)包括:基于用户的历史观看习惯从所述至少一个标签中确定所述用户感兴趣的标签,其中,所述历史观看习惯为从所述用户的互联网数据分析得到的反映所述用户观看视频的习惯的规律信息。
本发明的另一方面还提供一种视频剪辑装置,包括:解析单元,被配置为:从待剪辑的视频内容中解析至少一个标签;确定单元,被配置为:基于所述至少一个标签确定用户感兴趣的标签;截取单元,被配置为:从待剪辑的视频内容中截取与所述用户感兴趣的标签对应的视频帧;生成单元,被配置为:根据截取的视频帧生成剪辑视频。
可选地,所述至少一个标签包括:人物标签、物体标签和动作标签。
可选地,解析单元还被配置为:识别待剪辑的视频内容中的人脸,并将识别出的相同的人脸映射到同一个人物标签,输出映射得到的人物标签,和/或,解析单元还被配置为:识别待剪辑的视频内容中的物体,并输出用于指示识别出的物体的物体标签,和/或,解析单元还被配置为:识别待剪辑的视频内容中的动作,并输出用于指示识别出的动作的动作标签。
可选地,生成单元还被配置为:对截取的视频帧进行编码以得到编码的视频文件;生成与编码的视频文件对应的字幕文件;生成与所述字幕文件对应的音频文件;对编码的视频文件、所述字幕文件和所述音频文件进行合成,以生成所述剪辑视频。
可选地,生成单元还被配置为:同步编码的视频文件和所述音频文件的时间戳。
可选地,所述视频剪辑装置还包括:接收单元,被配置为:接收用于生成剪辑视频的预定参数,其中,生成单元还被配置为:根据所述预定参数对编码的视频文件、所述字幕文件和所述音频文件进行合成。
可选地,所述预定参数包括:视频的格式和/或每秒传输帧数。
可选地,确定单元还被配置为:响应于用户对所述至少一个标签的选择而将选择的标签确定为所述用户感兴趣的标签。
可选地,确定单元还被配置为:基于用户的历史观看习惯从所述至少一个标签中确定所述用户感兴趣的标签,其中,所述历史观看习惯为从所述用户的互联网数据分析得到的反映所述用户观看视频的习惯的规律信息。
本发明的另一方面还提供一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时实现如上所述的视频剪辑方法。
本发明的另一方面还提供一种计算装置,其特征在于,包括:处理器;存储器,用于存储当被处理器执行使得处理器执行如上所述的视频剪辑方法的计算机程序。
本发明的视频剪辑方法和视频剪辑装置,通过用户感兴趣的标签对待剪辑的视频内容进行视频剪辑处理,可以显著提高剪辑视频的效率,快速方便地得到用户感兴趣的视频内容,极大地提升了用户体验。
附图说明
通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:
图1示出根据本发明的实施例的视频剪辑方法的流程图;
图2示出根据本发明的实施例的生成剪辑视频的步骤的流程图;
图3示出根据本发明的实施例的视频剪辑装置的框图。
具体实施方式
现在,将参照附图更充分地描述不同的示例实施例,其中,一些示例性实施例在附图中示出。
下面参照图1至图3描述根据本发明的实施例的视频剪辑方法和视频剪辑装置。
图1示出根据本发明的实施例的视频剪辑方法的流程图。
在步骤S10,从待剪辑的视频内容中解析至少一个标签。
作为示例,至少一个标签可包括:人物标签、物体标签和动作标签等。
例如,人物标签可包括指示张三的标签和指示李四的标签等,物体标签可包括指示骆驼的标签、指示沙漠的标签和指示足球的标签等,动作标签可包括指示骑骆驼的标签、指示流水的标签、指示走路的标签和指示踢足球的标签等。
在一个实施例中,识别待剪辑的视频内容中的人脸;将识别出的相同的人脸映射到同一个人物标签;输出映射得到的人物标签。
应当理解,可通过各种能够从待剪辑的视频内容中识别出人脸的方法进行人脸识别,本发明对此不作限定。作为示例,可通过人脸识别技术识别待剪辑的视频内容中的人脸。
在另一实施例中,识别待剪辑的视频内容中的物体;输出用于指示识别出的物体的物体标签。
应当理解,可通过各种能够从待剪辑的视频内容中识别出物体的方法进行物体识别,本发明对此不作限定。作为示例,可通过使用卷积神经网络VGG16来识别待剪辑的视频内容中的物体。
在又一实施例中,识别待剪辑的视频内容中的动作;输出用于指示识别出的动作的动作标签。
应当理解,可通过各种能够从待剪辑的视频内容中识别出动作的方法进行动作识别,本发明对此不作限定。作为示例,可通过使用卷积神经网络CNN和长短时记忆网络LSTM来识别待剪辑的视频内容中的动作。
在步骤S20,基于至少一个标签确定用户感兴趣的标签。
在一个实施例中,响应于用户对至少一个标签的选择而将选择的标签确定为该用户感兴趣的标签。
也就是说,接收用户从至少一个标签之中选择的标签,并将接收到的选择的标签作为该用户感兴趣的标签。
例如,当标签包括指示张三的标签、指示李四的标签、指示骆驼的标签、指示沙漠的标签、指示骑骆驼的标签和指示走路的标签时,将用户选择的指示李四的标签和指示走路的标签作为该用户感兴趣的标签。
在另一实施例中,基于用户的历史观看习惯从至少一个标签中确定该用户感兴趣的标签。
历史观看习惯可为从用户的互联网数据分析得到的反映该用户观看视频的习惯的规律信息。
例如,可从用户在社交网络中的好友印象、自我介绍、用户习惯等数据,分析出该用户的历史观看习惯,从而根据该历史观看习惯确定该用户感兴趣的标签。
在步骤S30,从待剪辑的视频内容中截取与用户感兴趣的标签对应的视频帧。
应当理解,可通过各种能够截取视频帧的方法从待剪辑的视频内容中截取与用户感兴趣的标签对应的视频帧,本发明对此不作限定。
作为示例,可从待剪辑的视频内容中截取与“指示李四的标签”对应的视频帧和与“指示走路的标签”对应的视频帧。
在步骤S40,根据截取的视频帧生成剪辑视频。
也就是说,基于截取的视频帧生成用户感兴趣的视频内容,从而显著提高剪辑视频的效率,快速方便地得到用户感兴趣的视频内容。
下面结合图2详细描述生成剪辑视频的步骤。
图2示出根据本发明的实施例的生成剪辑视频的步骤的流程图。
参照图2,在步骤S410,对截取的视频帧进行编码以得到编码的视频文件。
作为示例,对与“指示李四的标签”对应的视频帧和与“指示走路的标签”对应的视频帧进行编码,以得到显示“李四正在走路”编码的视频文件。
优选地,可将截取的视频帧编码成图像互换格式(Gif)的视频文件或无字幕和音频的视频文件。
作为示例,可通过开源计算机程序(例如,FFMPEG)对截取的视频帧进行编码以得到编码的视频文件。
在步骤S420,生成与编码的视频文件对应的字幕文件。
应当理解,可通过各种能够生成与编码的视频文件对应的字幕文件的方法来进行字幕文件的生成,本发明对此不作限定。作为示例,可使用卷积神经网络CNN和长短时记忆网络LSTM来生成该字幕文件。
在一个实施例中,可采用参数共享和增加标签属性来对用户感兴趣的标签进行细分,从而解决语法多义性的问题。
作为示例,如果编码的视频文件显示“李四正在走路”,可能会生成字幕文件:“李四正在走路”、“李四正在跑步”和“李四正在散步”等。可通过对用户感兴趣的标签进行细分,准确生成字幕文件“李四正在走路”。
在步骤S430,生成与该字幕文件对应的音频文件。
应当理解,可通过各种能够生成与字幕文件对应的音频文件的方法来进行音频文件的生成,本发明对此不作限定。作为示例,可使用文字语音合成技术(TTS)来生成该音频文件。
作为示例,可生成“李四正在走路”的配音。
在步骤S440,对编码的视频文件、该字幕文件和该音频文件进行合成,以生成该剪辑视频。
作为示例,对显示“李四正在走路”的编码的视频文件、“李四正在走路”的字幕文件和“李四正在走路”的配音进行合成,生成用户感兴趣的剪辑视频。
应当理解,可通过各种能够合成视频文件、字幕文件和音频文件的方法来生成剪辑视频,本发明对此不作限定。
优选地,步骤S440还包括:同步编码的视频文件和该音频文件的时间戳。
也就是说,使编码的视频文件和该音频文件的时间戳保持一致。
例如,在编码的视频文件中,第一帧到第100帧对应的画面是李四正在走路,如果每秒传输帧数(FPS)为50,则对应的时长为2秒,那么,“李四正在走路”的配音的时间戳为0秒至2秒。
此外,所述视频剪辑方法还包括:接收用于生成剪辑视频的预定参数。
作为示例,预定参数可包括:视频的格式和/或每秒传输帧数等。
在此情况下,步骤S440可根据该预定参数对编码的视频文件、该字幕文件和该音频文件进行合成。
作为一个示例,可根据接收的视频的格式对编码的视频文件、该字幕文件和该音频文件进行合成,以得到该格式的剪辑视频。
作为又一示例,可根据接收的每秒传输帧数对编码的视频文件、该字幕文件和该音频文件进行合成,以得到具有该每秒传输帧数的剪辑视频。
下面结合具体示例来详细描述根据本发明的实施例的视频剪辑方法。
从待剪辑的视频内容中解析出指示张三的标签、指示李四的标签、指示骆驼的标签、指示沙漠的标签、指示骑骆驼的标签和指示流水的标签,然后将用户选择的“指示张三的标签”和“指示骑骆驼的标签”作为该用户感兴趣的标签。接着,从待剪辑的视频内容中截取与“指示张三的标签”对应的视频帧和与“指示骑骆驼的标签”对应的视频帧,并将截取的视频帧编码成显示“张三正在骑骆驼”的视频文件。然后,生成“张三正在骑骆驼”的字幕文件和配音文件,最后合成该视频文件、该字幕文件和该配音文件,并同步该视频文件和该配音文件的时间戳,得到用户感兴趣的剪辑视频。
下面结合图3来详细描述本发明的实施例的视频剪辑装置。
图3示出根据本发明的实施例的视频剪辑装置的框图。
参照图3,根据本发明的实施例的视频剪辑装置包括:解析单元100、确定单元200、截取单元300和生成单元400。
解析单元100从待剪辑的视频内容中解析至少一个标签。
作为示例,至少一个标签可包括:人物标签、物体标签和动作标签等。
例如,人物标签可包括指示张三的标签和指示李四的标签等,物体标签可包括指示骆驼的标签、指示沙漠的标签和指示足球的标签等,动作标签可包括指示骑骆驼的标签、指示流水的标签、指示走路的标签和指示踢足球的标签等。
在一个实施例中,解析单元100识别待剪辑的视频内容中的人脸,并将识别出的相同的人脸映射到同一个人物标签,输出映射得到的人物标签。
应当理解,解析单元100可通过各种能够从待剪辑的视频内容中识别出人脸的方法进行人脸识别,本发明对此不作限定。作为示例,解析单元100可通过人脸识别技术识别待剪辑的视频内容中的人脸。
在另一实施例中,解析单元100识别待剪辑的视频内容中的物体,并输出用于指示识别出的物体的物体标签。
应当理解,解析单元100可通过各种能够从待剪辑的视频内容中识别出物体的方法进行物体识别,本发明对此不作限定。作为示例,解析单元100可通过使用卷积神经网络VGG16来识别待剪辑的视频内容中的物体。
在又一实施例中,解析单元100识别待剪辑的视频内容中的动作,并输出用于指示识别出的动作的动作标签。
应当理解,解析单元100可通过各种能够从待剪辑的视频内容中识别出动作的方法进行动作识别,本发明对此不作限定。作为示例,解析单元100可通过使用卷积神经网络CNN和长短时记忆网络LSTM来识别待剪辑的视频内容中的动作。
确定单元200基于至少一个标签确定用户感兴趣的标签。
在一个实施例中,确定单元200响应于用户对所述至少一个标签的选择而将选择的标签确定为该用户感兴趣的标签。
也就是说,确定单元200接收用户从至少一个标签之中选择的标签,并将接收到的选择的标签作为该用户感兴趣的标签。
例如,当标签包括指示张三的标签、指示李四的标签、指示骆驼的标签、指示沙漠的标签、指示骑骆驼的标签和指示走路的标签时,确定单元200将用户选择的指示李四的标签和指示走路的标签确定为该用户感兴趣的标签。
在另一实施例中,确定单元200基于用户的历史观看习惯从至少一个标签中确定该用户感兴趣的标签。
历史观看习惯为从用户的互联网数据分析得到的反映该用户观看视频的习惯的规律信息。
例如,确定单元200可从用户在社交网络中的好友印象、自我介绍、用户习惯等数据,分析出该用户的历史观看习惯,从而根据该历史观看习惯确定该用户感兴趣的标签。
截取单元300从待剪辑的视频内容中截取与该用户感兴趣的标签对应的视频帧。
作为示例,截取单元300可从待剪辑的视频内容中截取与“指示李四的标签”对应的视频帧和与“指示走路的标签”对应的视频帧。
生成单元400根据截取的视频帧生成剪辑视频。
也就是说,生成单元400基于截取的视频帧生成用户感兴趣的视频内容。
在一个实施例中,生成单元400对截取的视频帧进行编码以得到编码的视频文件,生成与编码的视频文件对应的字幕文件,生成与该字幕文件对应的音频文件,对编码的视频文件、该字幕文件和该音频文件进行合成,以生成剪辑视频。
作为示例,生成单元400对与“指示李四的标签”对应的视频帧和与“指示走路的标签”对应的视频帧进行编码,以得到显示“李四正在走路”编码的视频文件,生成字幕文件“李四正在走路”,并生成“李四正在走路”的配音,然后,对显示“李四正在走路”的编码的视频文件、“李四正在走路”的字幕文件和“李四正在走路”的配音进行合成,生成用户感兴趣的剪辑视频。
此外,生成单元400还同步编码的视频文件和该音频文件的时间戳。
优选地,生成单元400可将截取的视频帧编码成图像互换格式(Gif)的视频文件或无字幕和音频的视频文件。
作为示例,生成单元400可使用开源计算机程序(例如,FFMPEG)对截取的视频帧进行编码以得到编码的视频文件。
优选地,生成单元400可使用卷积神经网络CNN和长短时记忆网络LSTM来生成字幕文件。
优选地,生成单元400可使用文字语音合成技术来生成音频文件。
此外,所述视频剪辑装置还包括:接收单元(未示出)。
接收单元接收用于生成剪辑视频的预定参数。
作为示例,预定参数可包括:视频的格式和/或每秒传输帧数。
在此情况下,生成单元400可根据该预定参数对编码的视频文件、该字幕文件和该音频文件进行合成。
作为一个示例,生成单元400可根据接收的视频的格式对编码的视频文件、该字幕文件和该音频文件进行合成,以得到该格式的剪辑视频。
作为又一示例,生成单元400可根据接收的每秒传输帧数对编码的视频文件、该字幕文件和该音频文件进行合成,以得到具有该每秒传输帧数的剪辑视频。
此外,本发明的实施例的视频剪辑方法和视频剪辑装置,通过用户感兴趣的标签对待剪辑的视频内容进行视频剪辑处理,可以显著提高剪辑视频的效率,快速方便地得到用户感兴趣的视频内容,极大地提升了用户体验。
根据本发明的实施例还提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被处理器执行时实现如上所述的视频剪辑方法。
根据本发明的实施例还提供一种计算装置。该计算装置包括处理器和存储器。存储器用于存储当被处理器执行使得处理器执行如上所述的视频剪辑方法的计算机程序。
此外,应该理解,根据本发明示例性实施例的视频剪辑装置中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理,可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个单元。
尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。

Claims (12)

1.一种视频剪辑方法,其特征在于,包括:
(A)从待剪辑的视频内容中解析至少一个标签;
(B)基于所述至少一个标签确定用户感兴趣的标签;
(C)从待剪辑的视频内容中截取与所述用户感兴趣的标签对应的视频帧;
(D)根据截取的视频帧生成剪辑视频。
2.如权利要求1所述的视频剪辑方法,其特征在于,所述至少一个标签包括:人物标签、物体标签和动作标签。
3.如权利要求2所述的视频剪辑方法,其特征在于,
步骤(A)包括:
识别待剪辑的视频内容中的人脸;
将识别出的相同的人脸映射到同一个人物标签;
输出映射得到的人物标签,
和/或,步骤(A)包括:
识别待剪辑的视频内容中的物体;
输出用于指示识别出的物体的物体标签,
和/或,步骤(A)包括:
识别待剪辑的视频内容中的动作;
输出用于指示识别出的动作的动作标签。
4.如权利要求1所述的视频剪辑方法,其特征在于,步骤(D)包括:
对截取的视频帧进行编码以得到编码的视频文件;
生成与编码的视频文件对应的字幕文件;
生成与所述字幕文件对应的音频文件;
对编码的视频文件、所述字幕文件和所述音频文件进行合成,以生成所述剪辑视频。
5.如权利要求4所述的视频剪辑方法,其特征在于,步骤(D)还包括:
同步编码的视频文件和所述音频文件的时间戳。
6.如权利要求4所述的视频剪辑方法,其特征在于,所述视频剪辑方法还包括:
接收用于生成剪辑视频的预定参数,
其中,对编码的视频文件、所述字幕文件和所述音频文件进行合成的步骤包括:
根据所述预定参数对编码的视频文件、所述字幕文件和所述音频文件进行合成。
7.如权利要求6所述的视频剪辑方法,其特征在于,所述预定参数包括:视频的格式和/或每秒传输帧数。
8.如权利要求1所述的视频剪辑方法,其特征在于,步骤(B)包括:
响应于用户对所述至少一个标签的选择而将选择的标签确定为所述用户感兴趣的标签。
9.如权利要求1所述的视频剪辑方法,其特征在于,步骤(B)包括:
基于用户的历史观看习惯从所述至少一个标签中确定所述用户感兴趣的标签,
其中,所述历史观看习惯为从所述用户的互联网数据分析得到的反映所述用户观看视频的习惯的规律信息。
10.一种视频剪辑装置,其特征在于,包括:
解析单元,被配置为:从待剪辑的视频内容中解析至少一个标签;
确定单元,被配置为:基于所述至少一个标签确定用户感兴趣的标签;
截取单元,被配置为:从待剪辑的视频内容中截取与所述用户感兴趣的标签对应的视频帧;
生成单元,被配置为:根据截取的视频帧生成剪辑视频。
11.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时实现如权利要求1至9中的任意一项所述的视频剪辑方法。
12.一种计算装置,其特征在于,包括:
处理器;
存储器,用于存储当被处理器执行使得处理器执行如权利要求1至9中任意一项所述的视频剪辑方法的计算机程序。
CN201810650132.7A 2018-06-22 2018-06-22 视频剪辑方法和视频剪辑装置 Pending CN108769733A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810650132.7A CN108769733A (zh) 2018-06-22 2018-06-22 视频剪辑方法和视频剪辑装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810650132.7A CN108769733A (zh) 2018-06-22 2018-06-22 视频剪辑方法和视频剪辑装置

Publications (1)

Publication Number Publication Date
CN108769733A true CN108769733A (zh) 2018-11-06

Family

ID=63976198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810650132.7A Pending CN108769733A (zh) 2018-06-22 2018-06-22 视频剪辑方法和视频剪辑装置

Country Status (1)

Country Link
CN (1) CN108769733A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035330A (zh) * 2019-04-16 2019-07-19 威比网络科技(上海)有限公司 基于在线教育的视频生成方法、系统、设备及存储介质
CN110166650A (zh) * 2019-04-29 2019-08-23 北京百度网讯科技有限公司 视频集的生成方法及装置、计算机设备与可读介质
CN110381371A (zh) * 2019-07-30 2019-10-25 维沃移动通信有限公司 一种视频剪辑方法及电子设备
CN110401878A (zh) * 2019-07-08 2019-11-01 天脉聚源(杭州)传媒科技有限公司 一种视频剪辑方法、系统及存储介质
CN110856039A (zh) * 2019-12-02 2020-02-28 新华智云科技有限公司 视频处理方法及装置、存储介质
CN111835985A (zh) * 2019-04-16 2020-10-27 阿里巴巴集团控股有限公司 视频剪辑方法、设备、装置及存储介质
CN111866585A (zh) * 2020-06-22 2020-10-30 北京美摄网络科技有限公司 一种视频处理方法及装置
CN112399251A (zh) * 2020-12-02 2021-02-23 武汉四牧传媒有限公司 一种基于互联网云大数据视频剪辑方法及装置
CN113099299A (zh) * 2021-03-10 2021-07-09 北京蜂巢世纪科技有限公司 视频剪辑方法及装置
CN113132752A (zh) * 2019-12-30 2021-07-16 阿里巴巴集团控股有限公司 视频处理方法及装置
CN113163272A (zh) * 2020-01-07 2021-07-23 海信集团有限公司 视频剪辑方法、计算机设备及存储介质
WO2022017451A1 (zh) * 2020-07-23 2022-01-27 北京字节跳动网络技术有限公司 视频配音方法、装置、设备及存储介质
CN114302253A (zh) * 2021-11-25 2022-04-08 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、设备及存储介质
WO2022184117A1 (zh) * 2021-03-04 2022-09-09 腾讯科技(深圳)有限公司 基于深度学习的视频剪辑方法、相关设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101909161A (zh) * 2009-12-17 2010-12-08 新奥特(北京)视频技术有限公司 一种视频剪辑方法及装置
CN103531218A (zh) * 2013-04-17 2014-01-22 Tcl集团股份有限公司 一种在线多媒体文件编辑方法及系统
CN104135628A (zh) * 2013-05-03 2014-11-05 安凯(广州)微电子技术有限公司 一种视频编辑方法及终端
CN105187795A (zh) * 2015-09-14 2015-12-23 博康云信科技有限公司 一种基于视图库的视频标签定位方法及装置
CN105657537A (zh) * 2015-12-23 2016-06-08 小米科技有限责任公司 视频剪辑方法及装置
US20160309204A1 (en) * 2015-04-20 2016-10-20 Disney Enterprises, Inc. System and Method for Creating and Inserting Event Tags into Media Content
CN107820138A (zh) * 2017-11-06 2018-03-20 广东欧珀移动通信有限公司 视频播放方法、装置、终端及存储介质
CN107832724A (zh) * 2017-11-17 2018-03-23 北京奇虎科技有限公司 从视频文件中提取人物关键帧的方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101909161A (zh) * 2009-12-17 2010-12-08 新奥特(北京)视频技术有限公司 一种视频剪辑方法及装置
CN103531218A (zh) * 2013-04-17 2014-01-22 Tcl集团股份有限公司 一种在线多媒体文件编辑方法及系统
CN104135628A (zh) * 2013-05-03 2014-11-05 安凯(广州)微电子技术有限公司 一种视频编辑方法及终端
US20160309204A1 (en) * 2015-04-20 2016-10-20 Disney Enterprises, Inc. System and Method for Creating and Inserting Event Tags into Media Content
CN105187795A (zh) * 2015-09-14 2015-12-23 博康云信科技有限公司 一种基于视图库的视频标签定位方法及装置
CN105657537A (zh) * 2015-12-23 2016-06-08 小米科技有限责任公司 视频剪辑方法及装置
CN107820138A (zh) * 2017-11-06 2018-03-20 广东欧珀移动通信有限公司 视频播放方法、装置、终端及存储介质
CN107832724A (zh) * 2017-11-17 2018-03-23 北京奇虎科技有限公司 从视频文件中提取人物关键帧的方法及装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035330A (zh) * 2019-04-16 2019-07-19 威比网络科技(上海)有限公司 基于在线教育的视频生成方法、系统、设备及存储介质
CN111835985A (zh) * 2019-04-16 2020-10-27 阿里巴巴集团控股有限公司 视频剪辑方法、设备、装置及存储介质
CN110035330B (zh) * 2019-04-16 2021-11-23 上海平安智慧教育科技有限公司 基于在线教育的视频生成方法、系统、设备及存储介质
CN110166650A (zh) * 2019-04-29 2019-08-23 北京百度网讯科技有限公司 视频集的生成方法及装置、计算机设备与可读介质
CN110401878A (zh) * 2019-07-08 2019-11-01 天脉聚源(杭州)传媒科技有限公司 一种视频剪辑方法、系统及存储介质
CN110381371A (zh) * 2019-07-30 2019-10-25 维沃移动通信有限公司 一种视频剪辑方法及电子设备
CN110381371B (zh) * 2019-07-30 2021-08-31 维沃移动通信有限公司 一种视频剪辑方法及电子设备
CN110856039A (zh) * 2019-12-02 2020-02-28 新华智云科技有限公司 视频处理方法及装置、存储介质
CN113132752B (zh) * 2019-12-30 2023-02-24 阿里巴巴集团控股有限公司 视频处理方法及装置
CN113132752A (zh) * 2019-12-30 2021-07-16 阿里巴巴集团控股有限公司 视频处理方法及装置
CN113163272A (zh) * 2020-01-07 2021-07-23 海信集团有限公司 视频剪辑方法、计算机设备及存储介质
CN113163272B (zh) * 2020-01-07 2022-11-25 海信集团有限公司 视频剪辑方法、计算机设备及存储介质
CN111866585A (zh) * 2020-06-22 2020-10-30 北京美摄网络科技有限公司 一种视频处理方法及装置
WO2022017451A1 (zh) * 2020-07-23 2022-01-27 北京字节跳动网络技术有限公司 视频配音方法、装置、设备及存储介质
US11817127B2 (en) 2020-07-23 2023-11-14 Beijing Bytedance Network Technology Co., Ltd. Video dubbing method, apparatus, device, and storage medium
CN112399251A (zh) * 2020-12-02 2021-02-23 武汉四牧传媒有限公司 一种基于互联网云大数据视频剪辑方法及装置
WO2022184117A1 (zh) * 2021-03-04 2022-09-09 腾讯科技(深圳)有限公司 基于深度学习的视频剪辑方法、相关设备及存储介质
CN113099299A (zh) * 2021-03-10 2021-07-09 北京蜂巢世纪科技有限公司 视频剪辑方法及装置
CN114302253A (zh) * 2021-11-25 2022-04-08 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、设备及存储介质
CN114302253B (zh) * 2021-11-25 2024-03-12 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108769733A (zh) 视频剪辑方法和视频剪辑装置
JP7228682B2 (ja) 動画解析のためのゲーティングモデル
CN107124624B (zh) 视频数据生成的方法和装置
CN107251006B (zh) 具有共享兴趣的消息的图库
CN105975581B (zh) 媒体信息的展示方法、客户端及服务器
CN107222795B (zh) 一种多特征融合的视频摘要生成方法
US8582952B2 (en) Method and apparatus for identifying video transitions
US9271035B2 (en) Detecting key roles and their relationships from video
EP3815042B1 (en) Image display with selective depiction of motion
US20220377412A1 (en) Modifying digital video content
WO2017097174A1 (zh) 媒体文件处理方法和装置、社交应用中的媒体文件分享方法和装置
KR20120091033A (ko) 비디오 컨텐츠-인지 광고 배치 방법
US10798425B1 (en) Personalized key object identification in a live video stream
US20180077455A1 (en) Attentiveness-based video presentation management
US20220368979A1 (en) Non-occluding video overlays
CN109379639A (zh) 视频内容对象的推送方法及装置、电子设备
CN113870133A (zh) 多媒体显示及匹配方法、装置、设备及介质
Fearghail et al. Director’s cut-analysis of VR film cuts for interactive storytelling
WO2010045736A1 (en) Reduced-latency rendering for a text-to-movie system
CN108989905A (zh) 媒体流控制方法、装置、计算设备及存储介质
CN107959861A (zh) 一种数据处理方法、相关设备及系统
JP2003219355A (ja) ムービー編集システム及びムービー編集サービスサーバ
EP0841610A2 (en) Hot areas in interactive movies
Barbierato et al. Second order fluid performance evaluation models for interactive 3D multimedia streaming
Saini et al. Automated Video Mashups: Research and Challenges

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181106

RJ01 Rejection of invention patent application after publication