CN112423023A - 一种智能化视频自动混剪的方法 - Google Patents
一种智能化视频自动混剪的方法 Download PDFInfo
- Publication number
- CN112423023A CN112423023A CN202011426599.7A CN202011426599A CN112423023A CN 112423023 A CN112423023 A CN 112423023A CN 202011426599 A CN202011426599 A CN 202011426599A CN 112423023 A CN112423023 A CN 112423023A
- Authority
- CN
- China
- Prior art keywords
- video
- text
- algorithm
- segments
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000005520 cutting process Methods 0.000 title claims abstract description 15
- 238000009877 rendering Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 4
- 239000012634 fragment Substances 0.000 claims description 16
- 239000000463 material Substances 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000010845 search algorithm Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 210000004556 brain Anatomy 0.000 abstract description 2
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000010008 shearing Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23424—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
- G06F16/784—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44016—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
一种智能化视频自动混剪的方法,包括步骤1:对目标文本进行语义分析,筛选匹配视频库中相应的视频片段;步骤2:对视频片段进行相关性、相似性分析,同时进行细节对比;步骤3:视频片段组合成品预览展示,人工修改或调整;步骤4:将多个视频片段无缝拼接渲染,导出所需视频;与现有技术相比,本发明具备以下有益效果:减少了人工环节,降低了生产成本;将人由原先的参与剪辑,改为参与到协助算法学习;算法检索的时间更短,推荐算法准确和召回会高于人脑;在最终质量上,视频的一致性会更好,不会出现人为因素导致的不稳定。
Description
技术领域
本发明涉及视频剪辑技术领域,具体是一种智能化视频自动混剪的方法。
背景技术
视频混剪,是一种把单个或多个视频分割,抽取其中目标片段,然后重新组合在一起,生成新视频的过程;现有的视频混剪的方法,主要是人工剪辑和机器辅助剪辑。
人工剪辑是传统方式,由人对一个或多个目标视频进行剪辑,将需要的视频片段合成在一起,其剪辑、添加文字素材、添加动画素材以及视频合成都要使用特定的一个或多个软件来完成;机器辅助剪辑,比人工剪辑要智能,是由机器对人提供的一段或多段目标视频进行解析,分离出音轨和画面,将语音音轨转成文字,再分析文字里的关键词,基于关键词推荐相关的视频片段,最后由人来对视频进行剪辑和编辑,合成时机器会按照既定的模版对视频进行渲染,例如增加背景音乐,增加固定的片头和结束语;但上述方法,存在检索视频片段效率低,关键词匹配时推荐方式粗糙,截取多长的片段难以界定导致视频片段粒度粗糙,视频剪辑质量完全靠剪辑人员导致质量不稳定的缺点,不能高效的完成命题作文式的视频混剪;目前的具有的一种技术方案是,输入文字或文章链接,自动转成视频,但是这种方案的主要应用领域是娱乐短视频,其文章和视频的相关性、相似性都比较低,视频与文本内容可能不一致;而在专业领域中,对片段和文本的专业权威有很高的要求,需要文本与目标片段具有较高的相关性,文本与目标片段一一对应。
发明内容
本发明提供一种智能化视频自动混剪的方法,可以有效解决上述背景技术中提出的问题。
为解决上述问题,本发明所采取的技术方案是:一种智能化视频自动混剪的方法,包括以下步骤:
步骤1:通过视频片段检索算法对目标文本进行语义分析,重新组织语言,根据重组后的语言台本,与视频库里的视频片段做对比,筛选匹配相应视频片段;
步骤2:视频片段推荐算法对筛选出的视频片段进行相关性、相似性分析;同时片段细节比对算法进行细节一致性对比,选出最佳视频片段组合方式;
步骤3:视频片段组合成品预览展示,人工干预修改或调整;
步骤4:将多个视频片段无缝拼接渲染,导出最终视频成品。
作为本发明的进一步优选方案,步骤1中视频库内视频文件通过预处理得到视频片段,其预处理包括针对视频内容生成相应类别标签,视频分割成视频片段并打上相应的标签。
作为本发明的进一步优选方案,步骤1中通过视频片段检索算法重新组织语言内容,找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签。
作为本发明的进一步优选方案,视频片段检索算法根据重组后语言文本中的标签信息,与数据库中的内容进行比对,检索匹配出符合度较高的视频片段;其中匹配方式为精确匹配或模糊匹配。
作为本发明的进一步优选方案,步骤2中的相关性分为分析筛选出的视频片段与文本内容的相关度;相似性分析为判断筛选出的视频片段的文本内容与目标文本的相似度,以及判断语意、语法、内容是否相似。
作为本发明的进一步优选方案,步骤2中片段细节比对算法对比筛选出的视频片段一致性,推荐细节一致性高的视频;其中对比内容包括视频中出现的人物穿着、位置、光线、背景、环境、噪音。
作为本发明的进一步优选方案,步骤3中将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习。
作为本发明的进一步优选方案,步骤4中合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连,并合成渲染输出编码格式为H.264或H.265的视频文件。
与现有技术相比,本发明提供了一种智能化视频自动混剪的方法,具备以下有益效果:
1. 减少了人工剪辑环节,降低了人工成本和时间成本,并且算法可以24小时工作,提高工作效率。
2. 将人由原先的参与剪辑,改为参与到协助本发明中各算法学习优秀剪辑人员的视频处理方式,帮助算法不断迭代和完善。
3. 算法检索的时间更短,推荐算法准确和召回会高于人脑;在最终质量上,视频的一致性会更好,不会出现人为因素导致的不稳定。
4.相比原先的机器辅助,更加智能,本发明的智能视频自动混剪完成了从目标分析-检索-推荐-合成-自我学习的全流程。
附图说明
图1为本发明的视频混剪流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明提供一种智能化视频自动混剪的方法,包括以下步骤:
步骤1:通过视频片段检索算法对目标文本进行语义分析,重新组织语言,根据重组后的语言台本,与视频库里的视频片段做对比,筛选匹配相应视频片段;
步骤2:视频片段推荐算法对筛选出的视频片段进行相关性、相似性分析;同时片段细节比对算法进行细节一致性对比,选出最佳视频片段组合方式;
步骤3:视频片段组合成品预览展示,人工干预修改或调整;
步骤4:将多个视频片段无缝拼接渲染,导出最终视频成品。
作为本发明的进一步优选方案,步骤1中视频库内视频文件通过预处理得到视频片段,其预处理包括针对视频内容生成相应类别标签,视频分割成视频片段并打上相应的标签。
作为本发明的进一步优选方案,步骤1中通过视频片段检索算法重新组织语言内容,找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签。
作为本发明的进一步优选方案,视频片段检索算法根据重组后语言文本中的标签信息,与数据库中的内容进行比对,检索匹配出符合度较高的视频片段;其中匹配方式为精确匹配或模糊匹配。
作为本发明的进一步优选方案,步骤2中的相关性分为分析筛选出的视频片段与文本内容的相关度;相似性分析为判断筛选出的视频片段的文本内容与目标文本的相似度,以及判断语意、语法、内容是否相似。
作为本发明的进一步优选方案,步骤2中片段细节比对算法对比筛选出的视频片段一致性,推荐细节一致性高的视频;其中对比内容包括视频中出现的人物穿着、位置、光线、背景、环境、噪音。
作为本发明的进一步优选方案,步骤3中将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习。
作为本发明的进一步优选方案,步骤4中合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连,并合成渲染输出编码格式为H.264或H.265的视频文件。
作为本发明的一个具体实施例:
以医学类视频作为例子,先得到视频题目与视频的描述文本后,目标视频的处理步骤包括:
针对视频库内医学类视频,通过标签算法,生成与医疗相关的标签,具体标签划分如下:疾病、科室、疾病阶段,概述、症状、病因、治疗、日常、预后、预防;
其中标签算法具有多级别分类,可以分为一级或多级标签;例如一级标签日常中可包括二级标签饮食习惯、生活习惯;并且标签算法支持扩充和修改,支持自我学习,根据长期的语意分析不断修正和迭代。
通过视频片段分割算法将视频库内所有医疗视频按台词进行最小粒度的分割,分割后的视频片段生成相应的时间序列文件与字幕文本标记;对每一个字幕文本的语意进行分析,然后结合前后字幕文本的语意内容,为字幕片段选择合适的标签。
对目标文本进行语义分析,重新组织语言找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签;根据重组后语言文本中的标签信息,与数据库中的内容进行比对,采用精确匹配或模糊匹配的方式检索匹配出符合度较高的视频片段。
视频片段推荐算法对筛选出的视频片段进行分析,分析其相关性、相似性,并判断细节一致性;其中相关性分析为视频片段与目标文本的相关度如何,相关度越高越值得推荐;相似性分析是分析视频片段与目标文本的相似性如何,语意、语法和内容是否相似;通过细节对比算法进行关键指标的细节对比,对比内容包括视频片段中的人物穿着、位置、光线、背景、环境、噪音,细节一致性高的视频更值得推荐。
将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习;合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连达到无缝拼接,并合成渲染输出编码格式为H.264或H.265的视频文件。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
Claims (8)
1.一种智能化视频自动混剪的方法,包括以下步骤:
步骤1:通过视频片段检索算法对目标文本进行语义分析,重新组织语言,根据重组后的语言台本,与视频库里的视频片段做对比,筛选匹配相应视频片段;
步骤2:视频片段推荐算法对筛选出的视频片段进行相关性、相似性分析;同时片段细节比对算法进行细节一致性对比,选出最佳视频片段组合方式;
步骤3:视频片段组合成品预览展示,人工干预修改或调整;
步骤4:将多个视频片段无缝拼接渲染,导出最终视频成品。
2.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤1中视频库内视频文件通过预处理得到视频片段,其预处理包括针对视频内容生成相应类别标签,视频分割成视频片段并打上相应的标签。
3.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤1中通过视频片段检索算法重新组织语言内容,找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签。
4.根据权利要求3所述的一种智能化视频自动混剪的方法,其方法在于,视频片段检索算法根据重组后语言文本中的标签信息,与数据库中的内容进行比对,检索匹配出符合度较高的视频片段;其中匹配方式为精确匹配或模糊匹配。
5.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤2中的相关性分为分析筛选出的视频片段与文本内容的相关度;相似性分析为判断筛选出的视频片段的文本内容与目标文本的相似度,以及判断语意、语法、内容是否相似。
6.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤2中片段细节比对算法对比筛选出的视频片段一致性,推荐细节一致性高的视频;其中对比内容包括视频中出现的人物穿着、位置、光线、背景、环境、噪音。
7.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤3中将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习。
8.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤4中合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连,并合成渲染输出编码格式为H.264或H.265的视频文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011426599.7A CN112423023A (zh) | 2020-12-09 | 2020-12-09 | 一种智能化视频自动混剪的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011426599.7A CN112423023A (zh) | 2020-12-09 | 2020-12-09 | 一种智能化视频自动混剪的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112423023A true CN112423023A (zh) | 2021-02-26 |
Family
ID=74776020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011426599.7A Pending CN112423023A (zh) | 2020-12-09 | 2020-12-09 | 一种智能化视频自动混剪的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112423023A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190712A (zh) * | 2021-04-02 | 2021-07-30 | 深圳市福田区吨吨文化工作室 | 一种基于大数据和机器学习算法创作短视频的系统和方法 |
CN113656643A (zh) * | 2021-08-20 | 2021-11-16 | 珠海九松科技有限公司 | 一种使用ai分析观影心情的算法 |
CN114979705A (zh) * | 2022-04-12 | 2022-08-30 | 杭州电子科技大学 | 一种基于深度学习、自注意力机制与符号推理的自动剪辑方法 |
CN115052201A (zh) * | 2022-05-17 | 2022-09-13 | 阿里巴巴(中国)有限公司 | 视频剪辑方法及电子设备 |
WO2024046484A1 (zh) * | 2022-09-02 | 2024-03-07 | 北京字跳网络技术有限公司 | 视频生成方法、装置、设备、存储介质和程序产品 |
CN117830910A (zh) * | 2024-03-05 | 2024-04-05 | 沈阳云翠通讯科技有限公司 | 一种用于视频检索的自动混剪视频方法、系统及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110225136A1 (en) * | 2009-08-18 | 2011-09-15 | Industrial Technology Research Institute | Video search method, video search system, and method thereof for establishing video database |
US20120323897A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Query-dependent audio/video clip search result previews |
CN108986186A (zh) * | 2018-08-14 | 2018-12-11 | 山东师范大学 | 文字转化视频的方法和系统 |
CN109756751A (zh) * | 2017-11-07 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 多媒体数据处理方法及装置、电子设备、存储介质 |
CN110996017A (zh) * | 2019-10-08 | 2020-04-10 | 清华大学 | 一种生成剪辑视频的方法及装置 |
CN111711855A (zh) * | 2020-05-27 | 2020-09-25 | 北京奇艺世纪科技有限公司 | 视频生成方法及装置 |
-
2020
- 2020-12-09 CN CN202011426599.7A patent/CN112423023A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110225136A1 (en) * | 2009-08-18 | 2011-09-15 | Industrial Technology Research Institute | Video search method, video search system, and method thereof for establishing video database |
US20120323897A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Query-dependent audio/video clip search result previews |
CN109756751A (zh) * | 2017-11-07 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 多媒体数据处理方法及装置、电子设备、存储介质 |
CN108986186A (zh) * | 2018-08-14 | 2018-12-11 | 山东师范大学 | 文字转化视频的方法和系统 |
CN110996017A (zh) * | 2019-10-08 | 2020-04-10 | 清华大学 | 一种生成剪辑视频的方法及装置 |
CN111711855A (zh) * | 2020-05-27 | 2020-09-25 | 北京奇艺世纪科技有限公司 | 视频生成方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190712A (zh) * | 2021-04-02 | 2021-07-30 | 深圳市福田区吨吨文化工作室 | 一种基于大数据和机器学习算法创作短视频的系统和方法 |
CN113190712B (zh) * | 2021-04-02 | 2024-05-03 | 深圳市福田区吨吨文化工作室 | 一种基于大数据和机器学习算法创作短视频的系统和方法 |
CN113656643A (zh) * | 2021-08-20 | 2021-11-16 | 珠海九松科技有限公司 | 一种使用ai分析观影心情的算法 |
CN113656643B (zh) * | 2021-08-20 | 2024-05-03 | 珠海九松科技有限公司 | 一种使用ai分析观影心情的方法 |
CN114979705A (zh) * | 2022-04-12 | 2022-08-30 | 杭州电子科技大学 | 一种基于深度学习、自注意力机制与符号推理的自动剪辑方法 |
CN115052201A (zh) * | 2022-05-17 | 2022-09-13 | 阿里巴巴(中国)有限公司 | 视频剪辑方法及电子设备 |
WO2024046484A1 (zh) * | 2022-09-02 | 2024-03-07 | 北京字跳网络技术有限公司 | 视频生成方法、装置、设备、存储介质和程序产品 |
CN117830910A (zh) * | 2024-03-05 | 2024-04-05 | 沈阳云翠通讯科技有限公司 | 一种用于视频检索的自动混剪视频方法、系统及存储介质 |
CN117830910B (zh) * | 2024-03-05 | 2024-05-31 | 沈阳云翠通讯科技有限公司 | 一种用于视频检索的自动混剪视频方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112423023A (zh) | 一种智能化视频自动混剪的方法 | |
US6473778B1 (en) | Generating hypermedia documents from transcriptions of television programs using parallel text alignment | |
US9992556B1 (en) | Automated creation of storyboards from screenplays | |
CN109756751B (zh) | 多媒体数据处理方法及装置、电子设备、存储介质 | |
WO2022121181A1 (zh) | 新闻智能播报方法、装置、设备及存储介质 | |
Schmidt | EXMARaLDA and the FOLK tools-two toolsets for transcribing and annotating spoken language. | |
CN108780653A (zh) | 音频内容制作、音频排序和音频混合的系统和方法 | |
CN111432140B (zh) | 一种利用人工神经网络进行电视新闻拆条的方法 | |
CN111432289B (zh) | 基于视频调节的视频生成方法 | |
CN111432290B (zh) | 基于音频调节的视频生成方法 | |
JP2007336106A (ja) | 映像編集支援装置 | |
CN114297440A (zh) | 视频自动生成方法、装置、计算机设备及存储介质 | |
CN115272533A (zh) | 一种基于视频结构化数据的智能图文转视频的方法及系统 | |
CN112199932A (zh) | Ppt生成方法、装置、计算机可读存储介质及处理器 | |
CN115883935A (zh) | 视频剪辑方法及装置 | |
US20110243447A1 (en) | Method and apparatus for synthesizing speech | |
Wang et al. | Generation of personalized music sports video using multimodal cues | |
CN114938473A (zh) | 评论视频生成方法及装置 | |
CN113676772A (zh) | 视频生成方法及装置 | |
CN111353077B (zh) | 基于智能创作算法的融媒体采编发系统 | |
CN111402919B (zh) | 一种基于多尺度多视图的戏曲唱腔风格识别方法 | |
DE102006027720A1 (de) | Verfahren zur automatischen Aufbereitung von als Video vorliegenden sowie aus Bild- und/oder Scriptinhalten generierten Multimediapräsentationen für eine inhaltsbasierte Suche in diesen Videos | |
KR102586580B1 (ko) | 자연어처리 인공지능 언어 모델을 이용한 뉴스 편집 업무 지원 시스템 | |
Haloi et al. | Unsupervised story segmentation and indexing of broadcast news video | |
Gibbon | Generating hypermedia documents from transcriptions of television programs using parallel text alignment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210226 |
|
RJ01 | Rejection of invention patent application after publication |