CN112423023A - 一种智能化视频自动混剪的方法 - Google Patents

一种智能化视频自动混剪的方法 Download PDF

Info

Publication number
CN112423023A
CN112423023A CN202011426599.7A CN202011426599A CN112423023A CN 112423023 A CN112423023 A CN 112423023A CN 202011426599 A CN202011426599 A CN 202011426599A CN 112423023 A CN112423023 A CN 112423023A
Authority
CN
China
Prior art keywords
video
text
algorithm
segments
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011426599.7A
Other languages
English (en)
Inventor
白志勇
王宇廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Jiusong Technology Co ltd
Original Assignee
Zhuhai Jiusong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Jiusong Technology Co ltd filed Critical Zhuhai Jiusong Technology Co ltd
Priority to CN202011426599.7A priority Critical patent/CN112423023A/zh
Publication of CN112423023A publication Critical patent/CN112423023A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种智能化视频自动混剪的方法,包括步骤1:对目标文本进行语义分析,筛选匹配视频库中相应的视频片段;步骤2:对视频片段进行相关性、相似性分析,同时进行细节对比;步骤3:视频片段组合成品预览展示,人工修改或调整;步骤4:将多个视频片段无缝拼接渲染,导出所需视频;与现有技术相比,本发明具备以下有益效果:减少了人工环节,降低了生产成本;将人由原先的参与剪辑,改为参与到协助算法学习;算法检索的时间更短,推荐算法准确和召回会高于人脑;在最终质量上,视频的一致性会更好,不会出现人为因素导致的不稳定。

Description

一种智能化视频自动混剪的方法
技术领域
本发明涉及视频剪辑技术领域,具体是一种智能化视频自动混剪的方法。
背景技术
视频混剪,是一种把单个或多个视频分割,抽取其中目标片段,然后重新组合在一起,生成新视频的过程;现有的视频混剪的方法,主要是人工剪辑和机器辅助剪辑。
人工剪辑是传统方式,由人对一个或多个目标视频进行剪辑,将需要的视频片段合成在一起,其剪辑、添加文字素材、添加动画素材以及视频合成都要使用特定的一个或多个软件来完成;机器辅助剪辑,比人工剪辑要智能,是由机器对人提供的一段或多段目标视频进行解析,分离出音轨和画面,将语音音轨转成文字,再分析文字里的关键词,基于关键词推荐相关的视频片段,最后由人来对视频进行剪辑和编辑,合成时机器会按照既定的模版对视频进行渲染,例如增加背景音乐,增加固定的片头和结束语;但上述方法,存在检索视频片段效率低,关键词匹配时推荐方式粗糙,截取多长的片段难以界定导致视频片段粒度粗糙,视频剪辑质量完全靠剪辑人员导致质量不稳定的缺点,不能高效的完成命题作文式的视频混剪;目前的具有的一种技术方案是,输入文字或文章链接,自动转成视频,但是这种方案的主要应用领域是娱乐短视频,其文章和视频的相关性、相似性都比较低,视频与文本内容可能不一致;而在专业领域中,对片段和文本的专业权威有很高的要求,需要文本与目标片段具有较高的相关性,文本与目标片段一一对应。
发明内容
本发明提供一种智能化视频自动混剪的方法,可以有效解决上述背景技术中提出的问题。
为解决上述问题,本发明所采取的技术方案是:一种智能化视频自动混剪的方法,包括以下步骤:
步骤1:通过视频片段检索算法对目标文本进行语义分析,重新组织语言,根据重组后的语言台本,与视频库里的视频片段做对比,筛选匹配相应视频片段;
步骤2:视频片段推荐算法对筛选出的视频片段进行相关性、相似性分析;同时片段细节比对算法进行细节一致性对比,选出最佳视频片段组合方式;
步骤3:视频片段组合成品预览展示,人工干预修改或调整;
步骤4:将多个视频片段无缝拼接渲染,导出最终视频成品。
作为本发明的进一步优选方案,步骤1中视频库内视频文件通过预处理得到视频片段,其预处理包括针对视频内容生成相应类别标签,视频分割成视频片段并打上相应的标签。
作为本发明的进一步优选方案,步骤1中通过视频片段检索算法重新组织语言内容,找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签。
作为本发明的进一步优选方案,视频片段检索算法根据重组后语言文本中的标签信息,与数据库中的内容进行比对,检索匹配出符合度较高的视频片段;其中匹配方式为精确匹配或模糊匹配。
作为本发明的进一步优选方案,步骤2中的相关性分为分析筛选出的视频片段与文本内容的相关度;相似性分析为判断筛选出的视频片段的文本内容与目标文本的相似度,以及判断语意、语法、内容是否相似。
作为本发明的进一步优选方案,步骤2中片段细节比对算法对比筛选出的视频片段一致性,推荐细节一致性高的视频;其中对比内容包括视频中出现的人物穿着、位置、光线、背景、环境、噪音。
作为本发明的进一步优选方案,步骤3中将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习。
作为本发明的进一步优选方案,步骤4中合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连,并合成渲染输出编码格式为H.264或H.265的视频文件。
与现有技术相比,本发明提供了一种智能化视频自动混剪的方法,具备以下有益效果:
1. 减少了人工剪辑环节,降低了人工成本和时间成本,并且算法可以24小时工作,提高工作效率。
2. 将人由原先的参与剪辑,改为参与到协助本发明中各算法学习优秀剪辑人员的视频处理方式,帮助算法不断迭代和完善。
3. 算法检索的时间更短,推荐算法准确和召回会高于人脑;在最终质量上,视频的一致性会更好,不会出现人为因素导致的不稳定。
4.相比原先的机器辅助,更加智能,本发明的智能视频自动混剪完成了从目标分析-检索-推荐-合成-自我学习的全流程。
附图说明
图1为本发明的视频混剪流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明提供一种智能化视频自动混剪的方法,包括以下步骤:
步骤1:通过视频片段检索算法对目标文本进行语义分析,重新组织语言,根据重组后的语言台本,与视频库里的视频片段做对比,筛选匹配相应视频片段;
步骤2:视频片段推荐算法对筛选出的视频片段进行相关性、相似性分析;同时片段细节比对算法进行细节一致性对比,选出最佳视频片段组合方式;
步骤3:视频片段组合成品预览展示,人工干预修改或调整;
步骤4:将多个视频片段无缝拼接渲染,导出最终视频成品。
作为本发明的进一步优选方案,步骤1中视频库内视频文件通过预处理得到视频片段,其预处理包括针对视频内容生成相应类别标签,视频分割成视频片段并打上相应的标签。
作为本发明的进一步优选方案,步骤1中通过视频片段检索算法重新组织语言内容,找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签。
作为本发明的进一步优选方案,视频片段检索算法根据重组后语言文本中的标签信息,与数据库中的内容进行比对,检索匹配出符合度较高的视频片段;其中匹配方式为精确匹配或模糊匹配。
作为本发明的进一步优选方案,步骤2中的相关性分为分析筛选出的视频片段与文本内容的相关度;相似性分析为判断筛选出的视频片段的文本内容与目标文本的相似度,以及判断语意、语法、内容是否相似。
作为本发明的进一步优选方案,步骤2中片段细节比对算法对比筛选出的视频片段一致性,推荐细节一致性高的视频;其中对比内容包括视频中出现的人物穿着、位置、光线、背景、环境、噪音。
作为本发明的进一步优选方案,步骤3中将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习。
作为本发明的进一步优选方案,步骤4中合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连,并合成渲染输出编码格式为H.264或H.265的视频文件。
作为本发明的一个具体实施例:
以医学类视频作为例子,先得到视频题目与视频的描述文本后,目标视频的处理步骤包括:
针对视频库内医学类视频,通过标签算法,生成与医疗相关的标签,具体标签划分如下:疾病、科室、疾病阶段,概述、症状、病因、治疗、日常、预后、预防;
其中标签算法具有多级别分类,可以分为一级或多级标签;例如一级标签日常中可包括二级标签饮食习惯、生活习惯;并且标签算法支持扩充和修改,支持自我学习,根据长期的语意分析不断修正和迭代。
通过视频片段分割算法将视频库内所有医疗视频按台词进行最小粒度的分割,分割后的视频片段生成相应的时间序列文件与字幕文本标记;对每一个字幕文本的语意进行分析,然后结合前后字幕文本的语意内容,为字幕片段选择合适的标签。
对目标文本进行语义分析,重新组织语言找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签;根据重组后语言文本中的标签信息,与数据库中的内容进行比对,采用精确匹配或模糊匹配的方式检索匹配出符合度较高的视频片段。
视频片段推荐算法对筛选出的视频片段进行分析,分析其相关性、相似性,并判断细节一致性;其中相关性分析为视频片段与目标文本的相关度如何,相关度越高越值得推荐;相似性分析是分析视频片段与目标文本的相似性如何,语意、语法和内容是否相似;通过细节对比算法进行关键指标的细节对比,对比内容包括视频片段中的人物穿着、位置、光线、背景、环境、噪音,细节一致性高的视频更值得推荐。
将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习;合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连达到无缝拼接,并合成渲染输出编码格式为H.264或H.265的视频文件。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (8)

1.一种智能化视频自动混剪的方法,包括以下步骤:
步骤1:通过视频片段检索算法对目标文本进行语义分析,重新组织语言,根据重组后的语言台本,与视频库里的视频片段做对比,筛选匹配相应视频片段;
步骤2:视频片段推荐算法对筛选出的视频片段进行相关性、相似性分析;同时片段细节比对算法进行细节一致性对比,选出最佳视频片段组合方式;
步骤3:视频片段组合成品预览展示,人工干预修改或调整;
步骤4:将多个视频片段无缝拼接渲染,导出最终视频成品。
2.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤1中视频库内视频文件通过预处理得到视频片段,其预处理包括针对视频内容生成相应类别标签,视频分割成视频片段并打上相应的标签。
3.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤1中通过视频片段检索算法重新组织语言内容,找出文本中对于问题描述的文本框架,并根据文本框架重组语言文本以及设定标签。
4.根据权利要求3所述的一种智能化视频自动混剪的方法,其方法在于,视频片段检索算法根据重组后语言文本中的标签信息,与数据库中的内容进行比对,检索匹配出符合度较高的视频片段;其中匹配方式为精确匹配或模糊匹配。
5.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤2中的相关性分为分析筛选出的视频片段与文本内容的相关度;相似性分析为判断筛选出的视频片段的文本内容与目标文本的相似度,以及判断语意、语法、内容是否相似。
6.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤2中片段细节比对算法对比筛选出的视频片段一致性,推荐细节一致性高的视频;其中对比内容包括视频中出现的人物穿着、位置、光线、背景、环境、噪音。
7.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤3中将多个筛选对比后的视频按目标文本的文本框架顺序进行排列,并将视频画面通过显示器预览播放,通过人工将不合适的视频素材进行调整或替换;其中视频片段推荐算法对调整方式进行记录和学习。
8.根据权利要求1所述的一种智能化视频自动混剪的方法,其方法在于,步骤4中合成渲染视频包括增加片头片尾、背景音乐、音效、人物简介;其中任意两个视频片段之间衔接时,视频起始帧与上一视频片段结束帧相连,并合成渲染输出编码格式为H.264或H.265的视频文件。
CN202011426599.7A 2020-12-09 2020-12-09 一种智能化视频自动混剪的方法 Pending CN112423023A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011426599.7A CN112423023A (zh) 2020-12-09 2020-12-09 一种智能化视频自动混剪的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011426599.7A CN112423023A (zh) 2020-12-09 2020-12-09 一种智能化视频自动混剪的方法

Publications (1)

Publication Number Publication Date
CN112423023A true CN112423023A (zh) 2021-02-26

Family

ID=74776020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011426599.7A Pending CN112423023A (zh) 2020-12-09 2020-12-09 一种智能化视频自动混剪的方法

Country Status (1)

Country Link
CN (1) CN112423023A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190712A (zh) * 2021-04-02 2021-07-30 深圳市福田区吨吨文化工作室 一种基于大数据和机器学习算法创作短视频的系统和方法
CN113656643A (zh) * 2021-08-20 2021-11-16 珠海九松科技有限公司 一种使用ai分析观影心情的算法
CN114979705A (zh) * 2022-04-12 2022-08-30 杭州电子科技大学 一种基于深度学习、自注意力机制与符号推理的自动剪辑方法
CN115052201A (zh) * 2022-05-17 2022-09-13 阿里巴巴(中国)有限公司 视频剪辑方法及电子设备
WO2024046484A1 (zh) * 2022-09-02 2024-03-07 北京字跳网络技术有限公司 视频生成方法、装置、设备、存储介质和程序产品
CN117830910A (zh) * 2024-03-05 2024-04-05 沈阳云翠通讯科技有限公司 一种用于视频检索的自动混剪视频方法、系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110225136A1 (en) * 2009-08-18 2011-09-15 Industrial Technology Research Institute Video search method, video search system, and method thereof for establishing video database
US20120323897A1 (en) * 2011-06-14 2012-12-20 Microsoft Corporation Query-dependent audio/video clip search result previews
CN108986186A (zh) * 2018-08-14 2018-12-11 山东师范大学 文字转化视频的方法和系统
CN109756751A (zh) * 2017-11-07 2019-05-14 腾讯科技(深圳)有限公司 多媒体数据处理方法及装置、电子设备、存储介质
CN110996017A (zh) * 2019-10-08 2020-04-10 清华大学 一种生成剪辑视频的方法及装置
CN111711855A (zh) * 2020-05-27 2020-09-25 北京奇艺世纪科技有限公司 视频生成方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110225136A1 (en) * 2009-08-18 2011-09-15 Industrial Technology Research Institute Video search method, video search system, and method thereof for establishing video database
US20120323897A1 (en) * 2011-06-14 2012-12-20 Microsoft Corporation Query-dependent audio/video clip search result previews
CN109756751A (zh) * 2017-11-07 2019-05-14 腾讯科技(深圳)有限公司 多媒体数据处理方法及装置、电子设备、存储介质
CN108986186A (zh) * 2018-08-14 2018-12-11 山东师范大学 文字转化视频的方法和系统
CN110996017A (zh) * 2019-10-08 2020-04-10 清华大学 一种生成剪辑视频的方法及装置
CN111711855A (zh) * 2020-05-27 2020-09-25 北京奇艺世纪科技有限公司 视频生成方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190712A (zh) * 2021-04-02 2021-07-30 深圳市福田区吨吨文化工作室 一种基于大数据和机器学习算法创作短视频的系统和方法
CN113190712B (zh) * 2021-04-02 2024-05-03 深圳市福田区吨吨文化工作室 一种基于大数据和机器学习算法创作短视频的系统和方法
CN113656643A (zh) * 2021-08-20 2021-11-16 珠海九松科技有限公司 一种使用ai分析观影心情的算法
CN113656643B (zh) * 2021-08-20 2024-05-03 珠海九松科技有限公司 一种使用ai分析观影心情的方法
CN114979705A (zh) * 2022-04-12 2022-08-30 杭州电子科技大学 一种基于深度学习、自注意力机制与符号推理的自动剪辑方法
CN115052201A (zh) * 2022-05-17 2022-09-13 阿里巴巴(中国)有限公司 视频剪辑方法及电子设备
WO2024046484A1 (zh) * 2022-09-02 2024-03-07 北京字跳网络技术有限公司 视频生成方法、装置、设备、存储介质和程序产品
CN117830910A (zh) * 2024-03-05 2024-04-05 沈阳云翠通讯科技有限公司 一种用于视频检索的自动混剪视频方法、系统及存储介质
CN117830910B (zh) * 2024-03-05 2024-05-31 沈阳云翠通讯科技有限公司 一种用于视频检索的自动混剪视频方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN112423023A (zh) 一种智能化视频自动混剪的方法
US6473778B1 (en) Generating hypermedia documents from transcriptions of television programs using parallel text alignment
US9992556B1 (en) Automated creation of storyboards from screenplays
CN109756751B (zh) 多媒体数据处理方法及装置、电子设备、存储介质
WO2022121181A1 (zh) 新闻智能播报方法、装置、设备及存储介质
Schmidt EXMARaLDA and the FOLK tools-two toolsets for transcribing and annotating spoken language.
CN108780653A (zh) 音频内容制作、音频排序和音频混合的系统和方法
CN111432140B (zh) 一种利用人工神经网络进行电视新闻拆条的方法
CN111432289B (zh) 基于视频调节的视频生成方法
CN111432290B (zh) 基于音频调节的视频生成方法
JP2007336106A (ja) 映像編集支援装置
CN114297440A (zh) 视频自动生成方法、装置、计算机设备及存储介质
CN115272533A (zh) 一种基于视频结构化数据的智能图文转视频的方法及系统
CN112199932A (zh) Ppt生成方法、装置、计算机可读存储介质及处理器
CN115883935A (zh) 视频剪辑方法及装置
US20110243447A1 (en) Method and apparatus for synthesizing speech
Wang et al. Generation of personalized music sports video using multimodal cues
CN114938473A (zh) 评论视频生成方法及装置
CN113676772A (zh) 视频生成方法及装置
CN111353077B (zh) 基于智能创作算法的融媒体采编发系统
CN111402919B (zh) 一种基于多尺度多视图的戏曲唱腔风格识别方法
DE102006027720A1 (de) Verfahren zur automatischen Aufbereitung von als Video vorliegenden sowie aus Bild- und/oder Scriptinhalten generierten Multimediapräsentationen für eine inhaltsbasierte Suche in diesen Videos
KR102586580B1 (ko) 자연어처리 인공지능 언어 모델을 이용한 뉴스 편집 업무 지원 시스템
Haloi et al. Unsupervised story segmentation and indexing of broadcast news video
Gibbon Generating hypermedia documents from transcriptions of television programs using parallel text alignment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210226

RJ01 Rejection of invention patent application after publication