CN117176981A - 混剪视频的生成方法、装置、计算机设备和介质 - Google Patents
混剪视频的生成方法、装置、计算机设备和介质 Download PDFInfo
- Publication number
- CN117176981A CN117176981A CN202310918800.0A CN202310918800A CN117176981A CN 117176981 A CN117176981 A CN 117176981A CN 202310918800 A CN202310918800 A CN 202310918800A CN 117176981 A CN117176981 A CN 117176981A
- Authority
- CN
- China
- Prior art keywords
- video
- task
- cutting
- instruction
- clipping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000005520 cutting process Methods 0.000 claims abstract description 180
- 239000000463 material Substances 0.000 claims abstract description 151
- 230000011218 segmentation Effects 0.000 claims abstract description 20
- 238000010008 shearing Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000002156 mixing Methods 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000009354 mixed cropping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
本公开提供一种混剪视频的生成方法、装置、计算机设备和介质,包括:获取视频裁剪素材,视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令;基于与任务裁剪指令关联的裁剪信息,对视频裁剪素材进行混剪,得到由视频裁剪素材组成的混剪视频;其中,任务裁剪指令关联的裁剪信息包括:切分规则、音频数据以及标签,标签用于描述视频裁剪素材基于切分规则切分后得到的视频片段对应的标识,音频数据用于描述视频片段的背景音乐。从而,有效节省视频剪裁时间和资源,提升视频裁剪效率。
Description
技术领域
本公开的实施例涉及视频裁剪技术领域,具体地,涉及适用于一种混剪视频的生成方法、装置、计算机设备和介质。
背景技术
随着视频内容和平台的快速发展,越来越多的个人和企业都希望制作高质量和吸引力强的视频,以此来吸引观众和提高品牌知名度。
相关技术中,市场上的视频制作软件大多只能动手进行视频制作,同时,视频制作软件自身功能会有很多限制,以及,不同的视频制作人员的技巧水平差异较大。
然而,采用现有方式,视频生成效率低下。
发明内容
本文中描述的实施例提供了一种混剪视频的生成方法、装置、计算机设备和介质,克服了上述问题。
第一方面,根据本公开的内容,提供了一种混剪视频的生成方法,包括:
获取视频裁剪素材,所述视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;
基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令;
基于与所述任务裁剪指令关联的裁剪信息,对所述视频裁剪素材进行混剪,得到由所述视频裁剪素材组成的混剪视频;
其中,所述任务裁剪指令关联的所述裁剪信息包括:切分规则、音频数据以及标签,所述标签用于描述所述视频裁剪素材基于所述切分规则切分后得到的视频片段对应的标识,所述音频数据用于描述所述视频片段的背景音乐。
第二方面,根据本公开的内容,提供了一种混剪视频的生成装置,包括:
获取模块,用于获取视频裁剪素材,所述视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;
确定模块,用于基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令;
混剪模块,用于基于与所述任务裁剪指令关联的裁剪信息,对所述视频裁剪素材进行混剪,得到由所述视频裁剪素材组成的混剪视频;
其中,所述任务裁剪指令关联的所述裁剪信息包括:切分规则、音频数据以及标签,所述标签用于描述所述视频裁剪素材基于所述切分规则切分后得到的视频片段对应的标识,所述音频数据用于描述所述视频片段的背景音乐。
第三方面,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现如以上任意一个实施例中混剪视频的生成方法的步骤。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如以上任意一个实施例中混剪视频的生成方法的步骤。
本申请实施例提供的混剪视频的生成方法,获取视频裁剪素材,视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令;基于与任务裁剪指令关联的裁剪信息,对视频裁剪素材进行混剪,得到由视频裁剪素材组成的混剪视频;其中,任务裁剪指令关联的裁剪信息包括:切分规则、音频数据以及标签,标签用于描述视频裁剪素材基于切分规则切分后得到的视频片段对应的标识,音频数据用于描述视频片段的背景音乐。如此,通过预先设置的任务指令库中的裁剪指令实现对视频裁剪素材的智能裁剪,无需大量人工剪辑,有效节省视频剪裁时间和资源,提升视频裁剪效率。
上述说明仅是本申请实施例技术方案的概述,为了能够更清楚了解本申请实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对实施例的附图进行简要说明,应当知道,以下描述的附图仅仅涉及本公开的一些实施例,而非对本公开的限制,其中:
图1是本公开提供的一种混剪视频的生成方法的流程示意图。
图2是本公开提供的一种系统架构图。
图3是本公开提供的一种混剪视频的生成装置的结构示意图。
图4是本公开提供的一种计算机设备的结构示意图。
需要注意的是,附图中的元素是示意性的,没有按比例绘制。
具体实施方式
为了使本公开的实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本公开的实施例的技术方案进行清楚、完整的描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域技术人员在无需创造性劳动的前提下所获得的所有其它实施例,也都属于本公开保护的范围。
除非另外定义,否则在此使用的所有术语(包括技术和科学术语)具有与本公开主题所属领域的技术人员所通常理解的相同含义。进一步将理解的是,诸如在通常使用的词典中定义的那些的术语应解释为具有与说明书上下文和相关技术中它们的含义一致的含义,并且将不以理想化或过于正式的形式来解释,除非在此另外明确定义。如在此所使用的,将两个或更多部分“连接”或“耦接”到一起的陈述应指这些部分直接结合到一起或通过一个或多个中间部件结合。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语“实施例”并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:存在A,同时存在A和B,存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。诸如“第一”和“第二”的术语仅用于将一个部件(或部件的一部分)与另一个部件(或部件的另一部分)区分开。
在本申请的描述中,除非另有说明,“多个”的含义是指两个以上(包括两个),同理,“多组”指的是两组以上(包括两组)。
随着大语言模型训练对话模型ChatGPT、ChatGLM等的发展,将其作为智能体扮演agent,能够实现对输入命令的自动思考,并实现任务编排与调度工具的逻辑,进而完成用户的需求,如相关的开源工具Langchain、HuggingGPT等,目前这种工具仅仅是对单个简单的任务能够实现编排。
其中,agent可以针对用户的需求,自动进行方案的设计与优化,并针对优化的方案进行提供工具的编排与实际调用,返回给用户需要的结果。
本实施例能够针对内容营销领域中常见的视频混剪需求,结合大语言训练模型与一系列人工智能工具,帮助用户实现内容素材的自动拆分与混剪。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
图1是本公开实施例提供的一种混剪视频的生成方法的流程示意图。如图1所示,混剪视频的生成方法的具体过程包括:
S110、获取视频裁剪素材。
其中,视频裁剪素材可为用户预先输入,如可包括包括:用户输入的视频数据和/或用户输入的文本数据。
视频数据可为一个或多个完整的独立视频,或者,视频数据也可为一个或多个不完整的片段视频。文本数据可为一段或多段文本描述,或者,文本数据也可为一篇或多篇具有完整结构的文章/段落。
需要说明的是,在用户没有提前输入视频裁剪素材,但用户具有视频裁剪需求时,视频裁剪素材可从预先设置的素材库中选取得到,素材库中包括多个素材。
获取视频裁剪素材可包括:获取用户的视频裁剪需求,基于用户的视频裁剪需求,从素材库中匹配出与用户的视频裁剪需求相对应的多个视频数据和/或文本数据,组成视频裁剪素材。从而,在用户没有预先设置视频裁剪素材时,能够为用户匹配出与其适配的数据作为视频裁剪素材,以满足用户的视频裁剪需求。
S120、基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令。
其中,视频裁剪素材的任务类型可基于用户的视频裁剪需求确定。如视频裁剪素材的任务类型可包括但不限于是:宣传、营销、点映等。
一些实施例中,视频裁剪素材可为用户输入的视频数据。
在视频裁剪素材为用户输入的视频数据时,基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令,包括:
从任务指令库中确定视频裁剪素材的任务类型对应的多个候选预设指令;从多个候选预设指令中匹配用户对应的第一预设指令;确定第一预设指令为视频裁剪素材对应的任务裁剪指令。
其中,任务指令库中包括多个预设指令,任务类型与预设指令的对应关系为一对多,也即是,每个预设指令会对应一个任务类型,一个任务类型会对应一个或多个预设指令。同时,一个任务类型下对应的多个预设指令可为实现不同功能的需求指令,也可为实现相同功能但不属于不同操作系统/体系的需求指令。
第一预设指令为用于裁剪视频数据的指令,多个候选预设指令中的每个候选预设指令可分别对应一个标识,用于表示该指令的所属用户。从多个候选预设指令中匹配用户对应的第一预设指令可包括:分别匹配每个候选预设指令对应的标识与用户对应的标识,将与用户对应的标识匹配的标识所对应的候选预设指令确定为第一预设指令。其中,候选预设指令对应的标识与用户对应的标识可相同,如均为A,或者,候选预设指令对应的标识与用户对应的标识可相对应,如相互具有所属关系,即候选预设指令对应的标识A1,用户对应的标识为A。
从而,能够通过从任务指令库中确定视频裁剪素材的任务类型对应的多个候选预设指令,并从多个候选预设指令中匹配用户对应的第一预设指令,以此确定出第一预设指令为视频裁剪素材对应的任务裁剪指令,便于有效确定视频裁剪素材对应的任务裁剪指令。
另一些实施例中,视频裁剪素材可为用户输入的文本数据。
在视频裁剪素材为用户输入的文本数据时,基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令,包括:
从任务指令库中确定视频裁剪素材的任务类型对应的多个候选预设指令;从多个候选预设指令中匹配用户对应的第二预设指令;确定第二预设指令为视频裁剪素材对应的任务裁剪指令。
其中,任务指令库中包括多个预设指令,任务类型与预设指令的对应关系为一对多,也即是,每个预设指令会对应一个任务类型,一个任务类型会对应一个或多个预设指令。同时,一个任务类型下对应的多个预设指令可为实现不同功能的需求指令,也可为实现相同功能但不属于不同操作系统/体系的需求指令。
第二预设指令为用于裁剪文本数据的指令,多个候选预设指令中的每个候选预设指令可分别对应一个标识,用于表示该指令的所属用户。从多个候选预设指令中匹配用户对应的第二预设指令可包括:分别匹配每个候选预设指令对应的标识与用户对应的标识,将与用户对应的标识匹配的标识所对应的候选预设指令确定为第二预设指令。其中,候选预设指令对应的标识与用户对应的标识可相同,如均为B,或者,候选预设指令对应的标识与用户对应的标识可相对应,如相互具有所属关系,即候选预设指令对应的标识B1,用户对应的标识为B。
从而,能够从任务指令库中确定视频裁剪素材的任务类型对应的多个候选预设指令;从多个候选预设指令中匹配用户对应的第二预设指令;确定第二预设指令为视频裁剪素材对应的任务裁剪指令,便于有效确定视频裁剪素材对应的任务裁剪指令。
其中,基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令之前,还包括:
基于历史裁剪任务确定预设任务指令;将预设任务指令进行类别划分,得到视频任务指令和文本任务指令,视频任务指令用于裁剪视频数据,文本任务指令用于裁剪文本数据;基于视频任务指令和文本任务指令,确定任务指令库。
如图2所示,agent中包括initial模块,initial模块中可包括:task-instruct单元、media-input单元、tools-pool单元与database单元,task-instruct单元可以为用户提供多种预设任务指令,且提供用户自定义任务指令模板,可通过在task-instruct模块中建立任务指令库,用来保存一些预设任务指令,便于用户调用。
预设任务指令中可包括:行业背景、用户需求以及任务实现方案。如下为一个预设任务指令的样例展示。
---------------------------------------------------------------------
你是一个资深算法工程师,有一个复杂需求需要你来设想合理解决方案。
行业背景:
-你所在的行业为营销内容管理,需要帮助用户进行优质内容的生成,例如营销视频等。
用户需求:
-基于给定参考视频,需要利用用户素材库中的白底图素材生成一个类似的营销视频。
-需要多方面考虑,包括参考视频中的文案、商品、整体风格等等所有可以参考的维度。
-你的输入只有一个本地参考视频。
你有权限使用工具:{tool_name_with_description}
现在,你要仔细思考,然后给出3个设计方案。
每个方案使用如下格式:
初始方案:xxx
工具链:xxx
反思:xxx
方案优化:xxx
工具链优化:xxx
---------------------------------------------------------------------
用户可以更改以上样例中的“用户需求”部分具体内容配置新的指令模板。模板中的'{tool_name_with_description}'为占位符。
通过该指令,结合LLM(Large Language Model,大语言模型),agent能够得到具体设计方案与优化之后的方案。
本实施例方法还可以包括:
接收用户上传的用于裁剪视频数据的自定义任务指令;接收用户上传的用于裁剪文本数据的自定义任务指令;基于用于裁剪视频数据的自定义任务指令以及用于裁剪文本数据的自定义任务指令,更新任务指令库中的预设任务指令。
其中,可根据用户上传的自定义指令,更改预设指令样例中的任务详情。若用户上传的自定义任务指令为文件格式,在对文件格式的数据进行输入时,可通过media-input模块实现,如上文预设指令样例中涉及用户输入为本地视频文件,该模块需要传入该文件的可访问地址,用于后续实际执行时调用。
另外,tools-pool模块具有预置工具的功能,可用于agent进行实际调用对素材进行各种任务处理,每个tool为一个具体函数类,类定义中包含工具的名称与描述,其中描述既包含该工具的功能说明,同时包含工具的输入输出说明。在进行实际调用时,可通过这些预置工具实现。预置工具可以为本地服务,也可以调用远端服务,只需要封装好调用入口即可。
S130、基于与任务裁剪指令关联的裁剪信息,对视频裁剪素材进行混剪,得到由视频裁剪素材组成的混剪视频。
其中,任务裁剪指令关联的裁剪信息包括:切分规则、音频数据以及标签,标签用于描述视频裁剪素材基于切分规则切分后得到的视频片段对应的标识,音频数据用于描述视频片段的背景音乐。
initial模块中的database模块可为用户预设底库处理模块,用于存储背景音乐、图片与视频切段、及其对应的标签数据。
举例而言,切分规则可包括:直接切分和asr切分。直接切分为通过视频转场的图像算法对原始底库进行切分保存;asr切分为通过对视频语音提取,并对语音内容进行段落划分,基于划分的段落时间点,对原始视频进行切分。
在进行切分后,可基于llm-prompt设计,针对切分好的视频片段逐个进行打标签,打标签的维度可包含如下方面:开头、结尾标志、视频风格、含量、材料、质地、痛点、效果、用户反馈、品牌、SKU、型号、规格、品牌大类、SKU品类、等等各类可基于模型提取的标签。
针对背景音乐,需要存储其对应的风格标签与时长信息。agent内置专有的tool对database数据进行提取,如调用ocr的tool可以提取视频切段中存在的文本信息,调用asr的tool可以得到视频段中的语音信息。痛点提取的tool基于LLM可以针对ocr和asr文本信息提取该段素材的具体痛点内容等。
对视频片段进行打标签,可以丰富用户需求,如用户想相生成某品类且包含某痛点及产品效果的混剪视频,并匹配某种感觉的背景音乐,agent可通过调用tool来查找匹配,最大程度贴合用户需求。
经过initial模块中的task-instruct单元,agent可得到3个经过优化过的工具链,其中涉及了具体调用的tool集合与顺序。通过更广泛的预置工具,结合LLM的指令优化,可以得到更为详细且合理的实现方案。
图2中所示的solution模块,人工根据方案描述可以按照其指导手动执行任务,agent自动对方案进行选择,根据方案涉及的具体tool以及用户的任务,首先进行最优方案的选择,选定方案之后,进行执行程序的任务编排,指定每个工具的入参和结果。
经过solution模块,可以得到一个具体用于解析执行的链路。execute模块会对以上文本进行解析,完成任务执行的编排,逐个tool进行调用并保存对应的结果。最后得到执行编排任务的结果,由result模块针对输出进行混剪视频的输出展示。
本实施例中,获取视频裁剪素材,视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;基于视频裁剪素材的任务类型,从任务指令库中确定视频裁剪素材对应的任务裁剪指令;基于与任务裁剪指令关联的裁剪信息,对视频裁剪素材进行混剪,得到由视频裁剪素材组成的混剪视频;其中,任务裁剪指令关联的裁剪信息包括:切分规则、音频数据以及标签,标签用于描述视频裁剪素材基于切分规则切分后得到的视频片段对应的标识,音频数据用于描述视频片段的背景音乐。如此,通过预先设置的任务指令库中的裁剪指令实现对视频裁剪素材的智能裁剪,无需大量人工剪辑,有效节省视频剪裁时间和资源,提升视频裁剪效率。
一些实施例中,基于与任务裁剪指令关联的裁剪信息,对视频裁剪素材进行混剪,得到由视频裁剪素材组成的混剪视频,包括:
获取与任务裁剪指令对应的裁剪信息;在视频裁剪素材为用户输入的视频数据时,基于裁剪信息中的切分规则对视频数据进行片段切分,得到多个视频片段;在视频裁剪素材为用户输入的文本数据时,基于预设的视频生成模版将文本数据转化为视频数据,并基于裁剪信息中的切分规则对转化后的视频数据进行片段切分,得到多个视频片段;基于每个视频片段对应的标签,确定每个视频片段对应的背景音乐;基于每个视频片段对应的背景音乐,为每个视频片段制定视频播放音乐,得到视频裁剪素材对应的混剪视频。
其中,预设的视频生成模版可为,能够将文本数据转化为视频数据的一个转化模版,被预先配置在系统中,以实现文本数据和视频数据的有效转换。
基于每个视频片段对应的背景音乐,为每个视频片段制定视频播放音乐,可通过获取得到的每个视频片段的展示时长,从与此视频片段对应的背景音乐中截取适配展示时长的音乐片段,作为此视频片段的播放内容的辅助播放音乐。
再将每个视频片段的播放内容进行顺序排布,并依次关联好每个视频片段的背景音乐,顺序连接每个视频片段的背景音乐,从而,保证最终得到的混剪视频的内容连贯性。
一些实施例中,本实施例方法还包括:
接收视频展示指令,视频展示指令中包括待播放视频的标识信息,待播放视频包括由视频裁剪素材组成的混剪视频;响应于视频展示指令,基于待播放视频的标识信息播放视频裁剪素材对应的混剪视频;若确定视频裁剪素材对应的混剪视频播放异常,则生成异常提示消息,以使得通过异常提示消息对生成的混剪视频进行解析处理。
其中,result模块在进行混剪视频的输出展示时,如果执行过程出现错误,针对错误提示,agent对提示进行解析,并将任务失败提示以及针对此次任务失败的分析原因和解决方案同时返回,用于向用户反馈。
图3为本实施例提供的一种混剪视频的生成装置的结构示意图。混剪视频的生成装置可以包括:获取模块310、确定模块320和混剪模块330。
获取模块310,用于获取视频裁剪素材,所述视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据。
确定模块320,用于基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令。
混剪模块330,用于基于与所述任务裁剪指令关联的裁剪信息,对所述视频裁剪素材进行混剪,得到由所述视频裁剪素材组成的混剪视频。
其中,所述任务裁剪指令关联的所述裁剪信息包括:切分规则、音频数据以及标签,所述标签用于描述所述视频裁剪素材基于所述切分规则切分后得到的视频片段对应的标识,所述音频数据用于描述所述视频片段的背景音乐。
在本实施例中,可选的,所述视频裁剪素材为所述用户输入的所述视频数据。
确定模块320,具体用于:
从任务指令库中确定所述视频裁剪素材的任务类型对应的多个候选预设指令,所述任务指令库中包括多个预设指令,任务类型与预设指令的对应关系为一对多;从多个所述候选预设指令中匹配所述用户对应的第一预设指令,所述第一预设指令为用于裁剪视频数据的指令;确定所述第一预设指令为所述视频裁剪素材对应的所述任务裁剪指令。
在本实施例中,可选的,所述视频裁剪素材为所述用户输入的所述文本数据。
确定模块320,具体用于:
从任务指令库中确定所述视频裁剪素材的任务类型对应的多个候选预设指令,所述任务指令库中包括多个预设指令,任务类型与预设指令的对应关系为一对多;从多个所述候选预设指令中匹配所述用户对应的第二预设指令,所述第二预设指令为用于裁剪文本数据的指令;确定所述第二预设指令为所述视频裁剪素材对应的所述任务裁剪指令。
在本实施例中,可选的,确定模块320,还用于基于历史裁剪任务确定预设任务指令;将所述预设任务指令进行类别划分,得到视频任务指令和文本任务指令,所述视频任务指令用于裁剪视频数据,所述文本任务指令用于裁剪文本数据;基于所述视频任务指令和所述文本任务指令,确定所述任务指令库。
在本实施例中,可选的,还包括:接收模块和更新模块。
接收模块,用于接收用户上传的用于裁剪视频数据的自定义任务指令。
接收模块,还用于接收用户上传的用于裁剪文本数据的自定义任务指令。
更新模块,用于基于所述用于裁剪视频数据的所述自定义任务指令以及所述用于裁剪文本数据的所述自定义任务指令,更新所述任务指令库中的预设任务指令。
在本实施例中,可选的,混剪模块330,具体用于:
获取与所述任务裁剪指令对应的所述裁剪信息;在所述视频裁剪素材为所述用户输入的视频数据时,基于所述裁剪信息中的切分规则对所述视频数据进行片段切分,得到多个视频片段;在所述视频裁剪素材为所述用户输入的文本数据时,基于预设的视频生成模版将所述文本数据转化为视频数据,并基于所述裁剪信息中的切分规则对转化后的视频数据进行片段切分,得到多个视频片段;基于每个所述视频片段对应的标签,确定每个所述视频片段对应的背景音乐;基于每个所述视频片段对应的背景音乐,为每个所述视频片段制定视频播放音乐,得到所述视频裁剪素材对应的所述混剪视频。
在本实施例中,可选的,还包括:播放模块和生成模块。
接收模块,还用于接收视频展示指令,所述视频展示指令中包括待播放视频的标识信息,所述待播放视频包括由所述视频裁剪素材组成的所述混剪视频;
播放模块,用于响应于所述视频展示指令,基于所述待播放视频的标识信息播放所述视频裁剪素材对应的所述混剪视频;
生成模块,用于若确定所述视频裁剪素材对应的所述混剪视频播放异常,则生成异常提示消息,以使得通过所述异常提示消息对生成的所述混剪视频进行解析处理。
本公开提供的混剪视频的生成装置,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本公开此处不再赘述。
本申请实施例还提供了一种计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
计算机设备包括通过系统总线相互通信连接存储器410和处理器420。需要指出的是,图中仅示出了具有组件410-420的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
存储器410至少包括一种类型的可读存储介质,可读存储介质包括非易失性存储器(non-volatile memory)或易失性存储器,例如,闪存(flashmemory)、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦写可编程只读存储器(erasable programmable read-onlymemory,EPROM)、电可擦写可编程只读存储器(electrically erasable programmableread-onlymemory,EEPROM)、可编程只读存储器(programmable read-only memory,PROM)、磁性存储器、磁盘、光盘等,RAM可以包括静态RAM或动态RAM。在一些实施例中,存储器410可以是计算机设备的内部存储单元,例如,该计算机设备的硬盘或内存。在另一些实施例中,存储器410也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡或闪存卡(FlashCard)等。当然,存储器410还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器410通常用于存储安装于计算机设备的操作系统和各类应用软件,例如上述方法的程序代码等。此外,存储器410还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器420通常用于执行计算机设备的总体操作。本实施例中,存储器410用于存储程序代码或指令,程序代码包括计算机操作指令,处理器420用于执行存储器410存储的程序代码或指令或者处理数据,例如运行上述方法的程序代码。
本文中,总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。该总线系统可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请的另一实施例还提供一种计算机可读介质,计算机可读介质可以是计算机可读信号介质或者计算机可读介质。计算机中的处理器读取存储在计算机可读介质中的计算机可读程序代码,使得处理器能够执行在上述方法中每个步骤、或各步骤的组合中规定的功能动作;生成实施在框图的每一块、或各块的组合中规定的功能动作的装置。
计算机可读介质包含但不限于电子、磁性、光学、电磁、红外的存储器或半导体系统、设备或者装置,或者前述的任意适当组合,存储器用于存储程序代码或指令,程序代码包括计算机操作指令,处理器用于执行存储器存储的上述方法的程序代码或指令。
存储器和处理器的定义,可以参考前述计算机设备实施例的描述,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
在本申请各个实施例中的各功能单元或模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。本申请描述的“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了装置若干的单元权利要求中,这些装置中的若干个单元可以是通过同一个硬件项来具体体现。第一、第二、以及第三等的使用不表示任何顺序,可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种混剪视频的生成方法,其特征在于,包括:
获取视频裁剪素材,所述视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;
基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令;
基于与所述任务裁剪指令关联的裁剪信息,对所述视频裁剪素材进行混剪,得到由所述视频裁剪素材组成的混剪视频;
其中,所述任务裁剪指令关联的所述裁剪信息包括:切分规则、音频数据以及标签,所述标签用于描述所述视频裁剪素材基于所述切分规则切分后得到的视频片段对应的标识,所述音频数据用于描述所述视频片段的背景音乐。
2.根据权利要求1所述的方法,其特征在于,所述视频裁剪素材为所述用户输入的所述视频数据;
所述基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令,包括:
从任务指令库中确定所述视频裁剪素材的任务类型对应的多个候选预设指令,所述任务指令库中包括多个预设指令,任务类型与预设指令的对应关系为一对多;
从多个所述候选预设指令中匹配所述用户对应的第一预设指令,所述第一预设指令为用于裁剪视频数据的指令;
确定所述第一预设指令为所述视频裁剪素材对应的所述任务裁剪指令。
3.根据权利要求1所述的方法,其特征在于,所述视频裁剪素材为所述用户输入的所述文本数据;
所述基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令,包括:
从任务指令库中确定所述视频裁剪素材的任务类型对应的多个候选预设指令,所述任务指令库中包括多个预设指令,任务类型与预设指令的对应关系为一对多;
从多个所述候选预设指令中匹配所述用户对应的第二预设指令,所述第二预设指令为用于裁剪文本数据的指令;
确定所述第二预设指令为所述视频裁剪素材对应的所述任务裁剪指令。
4.根据权利要求1所述的方法,其特征在于,所述基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令之前,还包括:
基于历史裁剪任务确定预设任务指令;
将所述预设任务指令进行类别划分,得到视频任务指令和文本任务指令,所述视频任务指令用于裁剪视频数据,所述文本任务指令用于裁剪文本数据;
基于所述视频任务指令和所述文本任务指令,确定所述任务指令库。
5.根据权利要求4所述的方法,其特征在于,还包括:
接收用户上传的用于裁剪视频数据的自定义任务指令;
接收用户上传的用于裁剪文本数据的自定义任务指令;
基于所述用于裁剪视频数据的所述自定义任务指令以及所述用于裁剪文本数据的所述自定义任务指令,更新所述任务指令库中的预设任务指令。
6.根据权利要求1所述的方法,其特征在于,所述基于与所述任务裁剪指令关联的裁剪信息,对所述视频裁剪素材进行混剪,得到由所述视频裁剪素材组成的混剪视频,包括:
获取与所述任务裁剪指令对应的所述裁剪信息;
在所述视频裁剪素材为所述用户输入的视频数据时,基于所述裁剪信息中的切分规则对所述视频数据进行片段切分,得到多个视频片段;在所述视频裁剪素材为所述用户输入的文本数据时,基于预设的视频生成模版将所述文本数据转化为视频数据,并基于所述裁剪信息中的切分规则对转化后的视频数据进行片段切分,得到多个视频片段;
基于每个所述视频片段对应的标签,确定每个所述视频片段对应的背景音乐;
基于每个所述视频片段对应的背景音乐,为每个所述视频片段制定视频播放音乐,得到所述视频裁剪素材对应的所述混剪视频。
7.根据权利要求1所述的方法,其特征在于,还包括:
接收视频展示指令,所述视频展示指令中包括待播放视频的标识信息,所述待播放视频包括由所述视频裁剪素材组成的所述混剪视频;
响应于所述视频展示指令,基于所述待播放视频的标识信息播放所述视频裁剪素材对应的所述混剪视频;
若确定所述视频裁剪素材对应的所述混剪视频播放异常,则生成异常提示消息,以使得通过所述异常提示消息对生成的所述混剪视频进行解析处理。
8.一种混剪视频的生成装置,其特征在于,包括:
获取模块,用于获取视频裁剪素材,所述视频裁剪素材包括:用户输入的视频数据和/或用户输入的文本数据;
确定模块,用于基于所述视频裁剪素材的任务类型,从任务指令库中确定所述视频裁剪素材对应的任务裁剪指令;
混剪模块,用于基于与所述任务裁剪指令关联的裁剪信息,对所述视频裁剪素材进行混剪,得到由所述视频裁剪素材组成的混剪视频;
其中,所述任务裁剪指令关联的所述裁剪信息包括:切分规则、音频数据以及标签,所述标签用于描述所述视频裁剪素材基于所述切分规则切分后得到的视频片段对应的标识,所述音频数据用于描述所述视频片段的背景音乐。
9.一种计算机设备,其特征在于,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现如权利要求1~7中任一所述的混剪视频的生成方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现如权利要求1~7中任一所述的混剪视频的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310918800.0A CN117176981A (zh) | 2023-07-25 | 2023-07-25 | 混剪视频的生成方法、装置、计算机设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310918800.0A CN117176981A (zh) | 2023-07-25 | 2023-07-25 | 混剪视频的生成方法、装置、计算机设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117176981A true CN117176981A (zh) | 2023-12-05 |
Family
ID=88928822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310918800.0A Pending CN117176981A (zh) | 2023-07-25 | 2023-07-25 | 混剪视频的生成方法、装置、计算机设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117176981A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830910A (zh) * | 2024-03-05 | 2024-04-05 | 沈阳云翠通讯科技有限公司 | 一种用于视频检索的自动混剪视频方法、系统及存储介质 |
-
2023
- 2023-07-25 CN CN202310918800.0A patent/CN117176981A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830910A (zh) * | 2024-03-05 | 2024-04-05 | 沈阳云翠通讯科技有限公司 | 一种用于视频检索的自动混剪视频方法、系统及存储介质 |
CN117830910B (zh) * | 2024-03-05 | 2024-05-31 | 沈阳云翠通讯科技有限公司 | 一种用于视频检索的自动混剪视频方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9135234B1 (en) | Collaborative generation of digital content with interactive reports | |
CN117176981A (zh) | 混剪视频的生成方法、装置、计算机设备和介质 | |
CN112632950A (zh) | Ppt生成方法、装置、设备及计算机可读存储介质 | |
CN104239067B (zh) | 微型客户端的制作方法及装置 | |
CN110532449B (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
JP7309811B2 (ja) | データ注釈方法、装置、電子機器および記憶媒体 | |
CN110708423A (zh) | 消息内容展示方法、装置及存储介质 | |
WO2019149065A1 (zh) | 绘文字兼容显示方法、装置、终端及计算机可读存储介质 | |
CN118070072A (zh) | 基于人工智能的问题处理方法、装置、设备及存储介质 | |
CN117670487A (zh) | 跨平台商品发布方法、装置、设备和存储介质 | |
US11783123B1 (en) | Generating a dynamic template for transforming source data | |
CN117195886A (zh) | 基于人工智能的文本数据处理方法、装置、设备及介质 | |
CN114880498B (zh) | 事件信息展示方法及装置、设备和介质 | |
CN115796816A (zh) | 邮件客服系统实现方法及其装置、设备、介质、产品 | |
CN110532391B (zh) | 一种文本词性标注的方法及装置 | |
CN111079399B (zh) | 图文数据处理方法、装置、计算机设备和存储介质 | |
CN114022300A (zh) | 社交动态信息的发布方法、装置、存储介质和电子设备 | |
CN113988020A (zh) | 工程技术标标书编制方法、装置、设备及存储介质 | |
CN110990571A (zh) | 一种讨论占比的获取方法、装置、存储介质及电子设备 | |
CN116303287B (zh) | 一种基于nlp的文件命名方法 | |
CN112445910B (zh) | 一种信息分类方法及系统 | |
CN109376554A (zh) | 基于标签和视图的多终端电子文档审签方法及审签系统 | |
US12039262B1 (en) | Transforming source data based on performance indicators associated with templates | |
CN117934146A (zh) | 一种贷后管理系统中表单的生成方法 | |
CN117453225A (zh) | 新闻流生成方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |