CN111541938A - 视频生成方法、装置及电子设备 - Google Patents
视频生成方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111541938A CN111541938A CN202010363660.1A CN202010363660A CN111541938A CN 111541938 A CN111541938 A CN 111541938A CN 202010363660 A CN202010363660 A CN 202010363660A CN 111541938 A CN111541938 A CN 111541938A
- Authority
- CN
- China
- Prior art keywords
- video
- action
- target
- target video
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47205—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
Abstract
本申请提供了一种视频生成方法、装置及电子设备,属于通信技术领域。该方法包括:接收用户对目标视频的第一输入;响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。本申请上述方案,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息,能够自动生成带有动作指导信息的动作分解视频,节省制作动作分解视频的时间,提高效率。
Description
技术领域
本申请属于通信技术领域,具体涉及一种视频生成方法、装置及电子设备。
背景技术
当用户在手机上看到一段舞蹈视频时,有时候会想去学习里面的舞蹈,这时候用户只能去搜索对应歌曲的舞蹈教学视频,但很多情况下搜索不到对应的歌曲,即使搜索到了也没有相应的教学视频,对于没有舞蹈功底的人而言,只看着原有的舞蹈视频是很难学会的。
因此,现在要想学习视频里的舞蹈,只能去搜索对应的教学视频,一方面可能搜索不到相应的资源,另一方面也需要舞者花时间去制作出这样的教学视频,而制作舞蹈教学视频只能通过舞者一点点去解析录制,并且加上后期剪辑才可呈现出来,消耗大量的精力且十分耗时。
发明内容
本申请实施例的目的是提供一种视频生成方法、装置和电子设备,能够解决现有技术制作教学视频消耗大量的精力且十分耗时的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种视频生成方法,包括:
接收用户对目标视频的第一输入;
响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
第二方面,本申请实施例提供了一种视频生成装置,包括:
第一接收模块,用于接收用户对目标视频的第一输入;
第一响应模块,用于响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
在本申请实施例中,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息,能够自动生成带有动作指导信息的动作分解视频,节省制作动作分解视频的时间,提高效率。
附图说明
图1是本申请实施例的视频生成方法流程示意图;
图2是本申请实施例的制作动作分解视频示意图之一;
图3是本申请实施例的制作动作分解视频示意图之二;
图4是本申请实施例的制作动作分解视频示意图之三;
图5是本申请实施例的制作动作分解视频示意图之四;
图6是本申请实施例的制作动作分解视频示意图之五;
图7是本申请实施例的制作动作分解视频示意图之六;
图8表示本申请实施例的视频生成装置的结构示意图;
图9表示本申请实施例的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
在进行本发明实施例的说明时,首先对下面描述中所用到的一些概念进行解释说明。
舞蹈dance:使用身体来完成各种优雅或高难度动作的表演艺术。
人像分割Portrait segmentation:识别图像中的人体轮廓,与背景进行分离。
骨骼点检测Bone point detection:检测人体的一些关键点,如关节,五官等,通过关键点描述人体骨骼信息。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的视频生成方法、装置及电子设备进行详细地说明。
如图1所示,本申请实施例提供了一种视频生成方法,包括:
步骤101,接收用户对目标视频的第一输入。
具体的,所述目标视频可以为本地相册中的视频,或者用户在线观看的视频,无需下载到本地。
需要说明的是,所述第一输入为用户对目标视频的点击、按压、滑动等输入,所述第一输入也可以为第一操作,在此不做具体限定。
步骤102,响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
具体的,响应于所述第一输入,可以自动识别所述目标视频中目标视频对象的动作,还可以通过用户的选择操作选择目标视频中的目标视频对象,根据用户选择的目标视频对象,识别目标视频中目标视频对象的动作。如图2所示,在识别目标视频中目标视频对象的动作的过程中,可以通过正在进行舞蹈动作解析21的提示信息提示用户正在进行识别操作,用于可以通过点击取消按键曲线识别过程。生成的动作分解视频即为教学视频,便于用户根据动作分解视频进行舞蹈动作的学习,所述动作分解视频中包含文字的动作指导信息,便于用户通过动作指导信息进一步了解并学习每一个动作。
在本申请上述实施例中,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息,能够自动生成带有动作指导信息的动作分解视频,节省制作动作分解视频的时间,提高效率。
可选的,所述目标视频包括至少两个视频对象;
所述识别所述目标视频中目标视频对象的动作之前,所述方法还包括:
接收用户对所述两个视频对象中的第一视频对象的第二输入;
响应于所述第二输入,将所述第一视频对象确定为目标视频对象。
具体的,用户可以在本地相册中的至少两个视频对象中选择第一视频对象,即第一视频对象即为目标视频对象。其中,所述第二输入为用户对至少两个视频对象的选择输入,即在至少两个视频对象中选择其中一个视频对象作为目标视频对象。
需要说明的是,所述第二输入为用户对第一视频对象的点击、按压、滑动输入等,所述第二输入也可以为第二操作,在此不做具体限定。
例如:用户进行本地相册,本地相册中包括至少两个视频对象,用户选择其中一个视频对象(即第一视频对象),进入视频编辑界面,用户通过点击“舞蹈教学”的功能按键,可以直接进入自动生成舞蹈教学视频功能界面。在进入舞蹈教学视频功能界面后,可以自动播放目标视频,当预览界面出现视频对象后,可以根据人像分割技术,自动识别目标视频中的视频对象,同时可以在目标视频中给每一个视频对象动态添加高亮轮廓线或者加粗轮廓线等,以提示用户目标视频中识别出的每一个视频对象,便于用户在视频对象中选择目标视频对象。用户通过点击高亮轮廓线等操作,使播放暂停,同时可以弹出提示框,提示用户是否需要识别所述目标视频中目标视频对象的动作,如果可以根据需要选择识别或者不识别,如果用户选择不识别,则继续播放目标视频。
需要说明的是,视频对象为目标视频中的人物,目标视频对象为人物中的目标人物。在用户仅想需学习一个人物(即目标人物)的舞蹈动作时,可以通过用户对目标人物的选择,仅生成用户选择的目标人物的动作的动作分解视频。
可选的,所述步骤102,包括:
识别所述目标视频中目标视频对象的每个动作;
对识别到的所述目标视频对象的每个动作进行动作解析,生成动作指导信息;
将每个动作对应的动作指导信息添加至每个动作对应的视频帧中,生成动作分解视频。
具体的,可以通过人体骨骼检测技术,识别目标视频中目标视频对象的每一个动作,并在识别结束后,对识别出来的每一个动作进行动作解析,生成每一个动作对应的动作指导信息。所述动作指导信息可以以字幕的形式添加至每一个动作对应的视频帧中,以便用户查看每一个动作的详细的动作指导信息。
例如:第一动作为一个持续1分钟的动作,则第一动作对应有该动作的动作指导信息,如果该第一动作所在的视频帧为50个,则在50个视频帧中,该第一动作对应的动作指导信息一直持续显示。
例如:第一动作为转体拧腰的动作,转体拧腰的动作需要进行1分钟,则转体拧腰的动作过程均有转体拧腰的详细的动作指导信息,如:转体拧腰的动作的动作指导信息为:双臂由两侧抬起屈向双肩,两手五指并拢,指尖自然地搭在双肩上。接着,用肩部的力量带动上身先向左后,再向右后往返转体,拧动腰部的同时头随肩走。如果转体拧腰的动作所在的视频帧为50个,则在50个视频帧中会持续显示转体拧腰的动作的动作指导信息。
可选的,所述步骤102之前,所述方法还包括:
在所述目标视频的目标区域,显示目标控件。
具体的,通过用户对目标视频的第一输入,在目标视频的目标区域,显示用于控制动作解析进度的目标控件。其中,所述目标区域的显示位置和显示形式可以根据用户需要设定。
例如:如图3所示,如果目标视频为在线观看的视频,用户可以通过点击播放按键播放目标视频。用户通过对功能按键的点击等操作,弹出功能选择框31,功能选择框31中可以包括:识别背景音乐、识别界面图形、生成舞蹈教学视频等按键。如果用户选择生成舞蹈教学视频的按键,则目标视频停止播放,如图4所示,此时在目标视频的右上方(即目标区域)显示目标控件(即显示“开始播放视频”的圆形悬浮球43)。
需要说明的是,功能按键可以为设置在目标视频预览界面上的虚拟按键,也可以为实体按键,在此不做具体限定。
所述对识别到的所述目标视频对象的每个动作进行动作解析的步骤,包括:
接收用户对所述目标控件的第三输入;
响应于所述第三输入,更新所述目标控件上的识别进度时间信息,并以所述目标视频的进度条的滑块当前位置所指示的视频帧为起始视频帧,对所述目标视频中目标视频对象的动作进行动作解析;
接收用户对所述目标控件的第四输入;
响应于所述第四输入,结束对所述目标视频中目标视频对象的动作的动作解析。
具体的,如图4所示,用户可以移动所述目标视频的进度条41的滑块42当前所在位置,滑块当前位置改变,即滑块当前位置所指示的视频帧改变,即起始视频帧改变,以此可以确定目标视频的动作解析时间起点。用户通过对目标控件的第三输入,可以更新目标控件上的识别进度时间信息,即用户可以直观的得知从开始进行动作解析到当前时间的解析程度的相关时间信息,用户可以根据识别进度时间信息得知动作解析的时间和程度,方便用户控制动作解析的进程。
需要说明的是,所述第三输入为用户对目标控件的点击、按压、滑动输入等,所述第三输入也可以为第三操作,在此不做具体限定。所述第四输入为用户对目标控件的点击、按压、滑动输入等,所述第四输入也可以为第四操作,在此不做具体限定。
例如:如图5所示,通过用户对所述目标控件的第三输入,所述目标控件有圆形悬浮球变为长条形的悬浮窗51,所述悬浮窗51的作用与录制屏幕的作用类似,所述悬浮窗51中显示控制动作解析开始或暂停的第一控制按键52以及控制动作解析结束的第二控制按键54,在所述第一控制按键52与第二控制按键54之间显示识别进度时间信息53,即动作解析的进度的时间(如00:15表示动作解析开始进行了15秒钟)。
可选的,所述步骤102之后,所述方法还包括:
接收用户对所述动作分解视频的第五输入;
响应于所述第五输入,将所述动作分解视频中包含的动作指导信息转换为语音指导信息;
接收用户对所述语音指导信息的第六输入;
响应于所述六输入,播放所述语音指导信息。
具体的,在生成与所述目标视频对象的动作相关联的动作分解视频之后,通过用户对动作分解视频的第五输入,可以将所述动作分解视频中包含的动作指导信息,通过文字转语音的技术转换为语音指导信息;并且,在转换过程中,可以通过进度条或者多点加载动效提示的形式提示用户正在进行语音指导信息的转换。在语音指导信息转换完成后,可以将语音指导信息自动保存。如果用户下次再对所述动作分解视频的第五输入,如果之前生成过语音指导信息则可以进行弹框提示,提示用户已生成过语音指导信息,是否重新生成,以便用户根据需求进行选择是否需要重新生成。在生成语音指导信息之后,可以通过用户对所述语音指导信息的第六输入,根据动作分解视频的播放实时播放相应动作的语音指导信息,不需要用户一一查看相关动作的动作指导信息,方便用户使用。
例如:如图6所示,通过用户对所述动作分解视频的第五输入,可以显示如图6所示界面,用户点击语音指导61的按键,则会自动将所述动作分解视频中包含的动作指导信息,通过文字转语音的技术转换为语音指导信息,在动作分解视频播放过程中,实时播放相关动作的语音指导信息,更加方便,不需要用户一一查看相关动作的动作指导信息。
需要说明的是,所述第五输入为用户对动作分解视频的点击、按压、滑动输入等,所述第五输入也可以为第五操作,在此不做具体限定。所述第六输入为用户对语音指导信息的点击、按压、滑动输入等,所述第六输入也可以为第四操作,在此不做具体限定。
可选的,在步骤102中的识别所述目标视频中目标视频对象的动作的过程中,所述方法还包括:
记录所述目标视频中的N个关键动作时间节点,所述关键动作时间节点指示动作变化幅度大于预设阈值的视频时间点,N为正整数。
具体的,识别所述目标视频中目标视频对象的动作的过程中,通过人体骨骼检测技术,分析目标视频对象的动作,并记录所述目标视频中的关键动作时间节点。如果未检测到动作变化幅度大于预设阈值的视频时间点,则用户可以根据需要设定每隔第一时长(如:20s)记录一个时间节点。如果检测到动作变化幅度大于预设阈值的视频时间点(即目标视频中的目标视频对象的动作变化的幅度大于预设阈值的一个或多个时间节点),则每一个动作变化幅度大于预设阈值的视频时间点均为关键动作时间节点。
需要说明的是,所述预设阈值可以为判定目标视频对象大幅度的位移、大幅度的身体翻转的阈值。所述预设阈值可以根据用户需要进行设定。
所述步骤102之后,所述方法还包括:
接收用户对所述动作分解视频的第七输入;
响应于所述第七输入,根据所述N个关键动作时间节点,将所述动作分解视频剪辑为M个视频片段;
显示M个视频标识,每个视频标识指示所述动作分解视频中的一个视频片段,M为正整数。
具体的,通过用户对所述动作分解视频的第七输入,根据所述N个关键动作时间节点,以每一个关键动作时间作为将动作分解视频剪辑的时间节点,即将动作分解视频在每一个关键动作时间处剪辑并分段,将所述动作分解视频剪辑为M个视频片段。
例如:关键动作时间节点数量为2,则可以将动作分解视频在每一个关键动作时间节点进行分段,可以分成3个视频片段,即M等于3。在动作分解视频的预览界面可以显示M个视频标识,每一个视频标识指示所述动作分解视频中的其中一个视频片段,使得用户可以根据视频片段分段学习,节省时间。
例如:如图6所示,通过用户对所述动作分解视频的第七输入,可以显示如图6所示界面,用户点击分段学习62的按键,则会自动将所述动作分解视频根据关键动作时间节点剪辑为M个视频片段,并显示M个视频标识(包括片段A、片段B、片段C、片段D等),片段A、片段B、片段C、片段D分别指示所述动作分解视频中的其中一个视频片段,用户可以点击其中一个视频标识,即可播放该视频标识指示的一个视频片段。
需要说明的是,如果目标视频为在线观看视频,则可以通过自动转换为语音指导信息并根据所述N个关键动作时间节点,将所述动作分解视频剪辑为M个视频片段,也可以按照上述语音指导61和分段学习62两个按键上的输入操作,分别进行语音指导信息转换以及剪辑视频片段。
需要说明的是,所述第七输入为用户对动作分解视频的点击、按压、滑动输入等,所述第七输入也可以为第七操作,在此不做具体限定。
可选的,所述显示M个视频标识的步骤之后,所述方法还包括:
接收用户对所述M个视频标识中的第一视频标识的第八输入;
响应于所述第八输入,将所述第一视频标识指示的第一视频片段按照预设的播放速度播放预设次数。
具体的,通过用户对第一视频标识的第八输入,可以将所述第一视频片段按照预设的播放速度播放预设次数,便于用户的观看和学习。例如:可以带有视频原声的原有速度播放一遍,然后在以慢速(如0.8倍速)的形式播放至少一遍,即可以采用不同的速度重复播放,播放的预设次数可以根据用户需要进行设定。如果该第一视频片段生成过语音指导信息,则可以在播放时去除视频原声,避免视频原声干扰语音指导信息。如果该第一视频片段未生成过语音指导信息,则可以在播放时保留视频原声,在播放第一视频片段时同时播放第一视频片段对应的动作指导信息。
可选的,如果该第一视频片段未生成过语音指导信息,可以在预览界面上显示提示信息,提示用户生成语音指导信息效果更好的相关信息。在第一视频片段按照预设的播放速度播放预设次数之后,可以经过第二时长之后自动播放下一段视频片段,如果用户中途选择其他视频片段,可直接跳转至其他视频片段进行播放。其中,所述第二时长可以根据需要进行设定,如设定第二时长为5s。
需要说明的是,所述第八输入为用户对M个视频标识中的第一视频标识的点击、按压、滑动输入等,所述第八输入也可以为第八操作,在此不做具体限定。
可选的,所述步骤102之后,所述方法还包括:
存储所述动作分解视频;
在所述动作分解视频对应的视频缩略图上,显示目标标识,所述目标标识用于指示所述动作分解视频为包含动作指导信息的视频。
具体的,在生成所述动作分解视频之后,可以自动保存动作分解视频或者通过点击保存按键保存动作分解视频;并且可以提示用户动作分解视频已生成或者已保存的相关信息。并且,在所述动作分解视频对应的视频缩略图上,显示目标标识,所述目标标识用于指示所述动作分解视频为包含动作指导信息的视频。
例如:目标标识可以为舞蹈标识或者教学标识等,在所述动作分解视频对应的视频缩略图的右上角显示“舞蹈”字样,以便提示用户该视频为保存的动作分解视频。如果用户点击该带有“舞蹈”字样的视频,则该视频可以全屏显示,如图7所示,可以在当前显示界面右侧的1/8列宽的位置,将多个视频标识以缩略图形式显示,并且还可以在当前显示界面的左侧显示播放或暂停按键,便于用户对动作分解视频的操作。
需要说明的是,上述目标标识的具体显示形式、显示位置、以及视频标识的显示形式和显示位置等仅为示例性说明,并不进行限定。
综上所述,本申请实施例中,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,自动生成与所述目标视频对象的动作相关联的带有动作指导信息的动作分解视频,节省搜索、制作并剪辑动作分解视频的时间,提高效率。
需要说明的是,本申请实施例提供的视频生成方法,执行主体可以为视频生成装置,或者该视频生成装置中的用于执行加载视频生成方法的控制模块。本申请实施例中以视频生成装置执行加载视频生成方法为例,说明本申请实施例提供的视频生成方法。
如图8所示,本申请实施例还提供了一种视频生成装置80,包括:
第一接收模块81,用于接收用户对目标视频的第一输入;
第一响应模块82,用于响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
可选的,所述目标视频包括至少两个视频对象;
所述装置还包括:
第二接收模块,用于接收用户对所述两个视频对象中的第一视频对象的第二输入;
第二响应模块,用于响应于所述第二输入,将所述第一视频对象确定为目标视频对象。
可选的,所述第一响应模块82,包括:
第一识别单元,用于识别所述目标视频中目标视频对象的每个动作;
第一处理单元,用于对识别到的所述目标视频对象的每个动作进行动作解析,生成动作指导信息;
第二处理单元,用于将每个动作对应的动作指导信息添加至每个动作对应的视频帧中,生成动作分解视频。
可选的,所述装置还包括:
第一显示模块,用于在所述目标视频的目标区域,显示目标控件;
所述第一处理单元,包括:
第一接收子单元,用于接收用户对所述目标控件的第三输入;
第一响应子单元,用于响应于所述第三输入,更新所述目标控件上的识别进度时间信息,并以所述目标视频的进度条的滑块当前位置所指示的视频帧为起始视频帧,对所述目标视频中目标视频对象的动作进行动作解析;
第二接收子单元,用于接收用户对所述目标控件的第四输入;
第二响应子单元,用于响应于所述第四输入,结束对所述目标视频中目标视频对象的动作的动作解析。
可选的,所述装置还包括:
第三接收模块,用于接收用户对所述动作分解视频的第五输入;
第三响应模块,用于响应于所述第五输入,将所述动作分解视频中包含的动作指导信息转换为语音指导信息;
第四接收模块,用于接收用户对所述语音指导信息的第六输入;
第四响应模块,用于响应于所述六输入,播放所述语音指导信息。
可选的,在所述第一响应模块82识别所述目标视频中目标视频对象的动作的过程中,所述装置还包括:
第一记录模块,用于记录所述目标视频中的N个关键动作时间节点,所述关键动作时间节点指示动作变化幅度大于预设阈值的视频时间点;
所述装置还包括:
第五接收模块,用于接收用户对所述动作分解视频的第七输入;
第五响应模块,用于响应于所述第七输入,根据所述N个关键动作时间节点,将所述动作分解视频剪辑为M个视频片段;
第二显示模块,用于显示M个视频标识,每个视频标识指示所述动作分解视频中的一个视频片段,M、N均为正整数。
可选的,所述装置还包括:
第六接收模块,用于接收用户对所述M个视频标识中的第一视频标识的第八输入;
第六响应模块,用于响应于所述第八输入,将所述第一视频标识指示的第一视频片段按照预设的播放速度播放预设次数。
可选的,所述装置还包括:
第一存储模块,用于存储所述动作分解视频;
第三显示模块,用于在所述动作分解视频对应的视频缩略图上,显示目标标识,所述目标标识用于指示所述动作分解视频为包含动作指导信息的视频。
本申请实施例中的视频生成装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的视频生成装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的视频生成装置能够实现图1至图7的方法实施例中视频生成装置实现的各个过程,为避免重复,这里不再赘述。
综上所述,本申请实施例中,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,自动生成与所述目标视频对象的动作相关联的带有动作指导信息的动作分解视频,节省制作动作分解视频的时间,提高效率。
可选的,本申请实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的程序或指令,该程序或指令被处理器执行时实现上述视频生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图9为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备90包括但不限于:射频单元91、网络模块92、音频输出单元93、输入单元94、传感器95、显示单元96、用户输入单元97、接口单元108、存储器99、以及处理器910等部件。
本领域技术人员可以理解,电子设备90还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器910逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图9中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,用户输入单元97,用于接收用户对目标视频的第一输入;
处理器910,用于响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
本申请上述实施例中,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,自动生成与所述目标视频对象的动作相关联的带有动作指导信息的动作分解视频,节省制作动作分解视频的时间,提高效率。
可选的,所述目标视频包括至少两个视频对象;
所述用户输入单元97还用于:
接收用户对所述两个视频对象中的第一视频对象的第二输入;
所述处理器910,还用于:响应于所述第二输入,将所述第一视频对象确定为目标视频对象。
可选的,所述处理器910具体用于:
识别所述目标视频中目标视频对象的每个动作;
对识别到的所述目标视频对象的每个动作进行动作解析,生成动作指导信息;
将每个动作对应的动作指导信息添加至每个动作对应的视频帧中,生成动作分解视频。
可选的,所述显示单元96,用于:
在所述目标视频的目标区域,显示目标控件;
所述用户输入单元97还用于:
接收用户对所述目标控件的第三输入;
所述处理器910具体还用于:
响应于所述第三输入,更新所述目标控件上的识别进度时间信息,并以所述目标视频的进度条的滑块当前位置所指示的视频帧为起始视频帧,对所述目标视频中目标视频对象的动作进行动作解析;
所述用户输入单元97还用于:
接收用户对所述目标控件的第四输入;
所述处理器910具体还用于:
响应于所述第四输入,结束对所述目标视频中目标视频对象的动作的动作解析。
可选的,所述用户输入单元97还用于:
接收用户对所述动作分解视频的第五输入;
所述处理器910具体还用于:
响应于所述第五输入,将所述动作分解视频中包含的动作指导信息转换为语音指导信息;
可选的,所述用户输入单元97还用于:
接收用户对所述语音指导信息的第六输入;
所述处理器910具体还用于:
响应于所述六输入,播放所述语音指导信息。
可选的,在识别所述目标视频中目标视频对象的动作的过程中,所述处理器910具体还用于:
记录所述目标视频中的N个关键动作时间节点,所述关键动作时间节点指示动作变化幅度大于预设阈值的视频时间点;
所述用户输入单元97还用于:
接收用户对所述动作分解视频的第七输入;
所述处理器910具体还用于:
响应于所述第七输入,根据所述N个关键动作时间节点,将所述动作分解视频剪辑为M个视频片段;
所述显示单元96,还用于:
显示M个视频标识,每个视频标识指示所述动作分解视频中的一个视频片段,M、N均为正整数。
可选的,所述用户输入单元97还用于:
接收用户对所述M个视频标识中的第一视频标识的第八输入;
所述处理器910具体还用于:
响应于所述第八输入,将所述第一视频标识指示的第一视频片段按照预设的播放速度播放预设次数。
可选的,所述存储器99,用于:
存储所述动作分解视频;
所述显示单元96,还用于:
在所述动作分解视频对应的视频缩略图上,显示目标标识,所述目标标识用于指示所述动作分解视频为包含动作指导信息的视频。
综上所述,本申请实施例中,通过用户对目标视频的第一输入,识别所述目标视频中目标视频对象的动作,自动生成与所述目标视频对象的动作相关联的带有动作指导信息的动作分解视频,节省制作动作分解视频的时间,提高效率。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述视频生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述视频生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (11)
1.一种视频生成方法,其特征在于,包括:
接收用户对目标视频的第一输入;
响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
2.根据权利要求1所述的方法,其特征在于,所述目标视频包括至少两个视频对象;
所述识别所述目标视频中目标视频对象的动作之前,所述方法还包括:
接收用户对所述两个视频对象中的第一视频对象的第二输入;
响应于所述第二输入,将所述第一视频对象确定为目标视频对象。
3.根据权利要求1所述的方法,其特征在于,所述识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,包括:
识别所述目标视频中目标视频对象的每个动作;
对识别到的所述目标视频对象的每个动作进行动作解析,生成动作指导信息;
将每个动作对应的动作指导信息添加至每个动作对应的视频帧中,生成动作分解视频。
4.根据权利要求3所述的方法,其特征在于,所述识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频之前,所述方法还包括:
在所述目标视频的目标区域,显示目标控件;
所述对识别到的所述目标视频对象的每个动作进行动作解析,包括:
接收用户对所述目标控件的第三输入;
响应于所述第三输入,更新所述目标控件上的识别进度时间信息,并以所述目标视频的进度条的滑块当前位置所指示的视频帧为起始视频帧,对所述目标视频中目标视频对象的动作进行动作解析;
接收用户对所述目标控件的第四输入;
响应于所述第四输入,结束对所述目标视频中目标视频对象的动作的动作解析。
5.根据权利要求1所述的方法,其特征在于,所述识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频之后,所述方法还包括:
接收用户对所述动作分解视频的第五输入;
响应于所述第五输入,将所述动作分解视频中包含的动作指导信息转换为语音指导信息;
接收用户对所述语音指导信息的第六输入;
响应于所述六输入,播放所述语音指导信息。
6.根据权利要求1所述的方法,其特征在于,在识别所述目标视频中目标视频对象的动作的过程中,所述方法还包括:
记录所述目标视频中的N个关键动作时间节点,所述关键动作时间节点指示动作变化幅度大于预设阈值的视频时间点;
所述生成与所述目标视频对象的动作相关联的动作分解视频之后,所述方法还包括:
接收用户对所述动作分解视频的第七输入;
响应于所述第七输入,根据所述N个关键动作时间节点,将所述动作分解视频剪辑为M个视频片段;
显示M个视频标识,每个视频标识指示所述动作分解视频中的一个视频片段,M、N均为正整数。
7.根据权利要求6所述的方法,其特征在于,所述显示M个视频标识之后,所述方法还包括:
接收用户对所述M个视频标识中的第一视频标识的第八输入;
响应于所述第八输入,将所述第一视频标识指示的第一视频片段按照预设的播放速度播放预设次数。
8.根据权利要求1所述的方法,其特征在于,所述识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频之后,所述方法还包括:
存储所述动作分解视频;
在所述动作分解视频对应的视频缩略图上,显示目标标识,所述目标标识用于指示所述动作分解视频为包含动作指导信息的视频。
9.一种视频生成装置,其特征在于,包括:
第一接收模块,用于接收用户对目标视频的第一输入;
第一响应模块,用于响应于所述第一输入,识别所述目标视频中目标视频对象的动作,生成与所述目标视频对象的动作相关联的动作分解视频,所述动作分解视频中包含动作指导信息。
10.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的视频生成方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的视频生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010363660.1A CN111541938B (zh) | 2020-04-30 | 2020-04-30 | 视频生成方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010363660.1A CN111541938B (zh) | 2020-04-30 | 2020-04-30 | 视频生成方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111541938A true CN111541938A (zh) | 2020-08-14 |
CN111541938B CN111541938B (zh) | 2023-04-07 |
Family
ID=71977366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010363660.1A Active CN111541938B (zh) | 2020-04-30 | 2020-04-30 | 视频生成方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111541938B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464847A (zh) * | 2020-12-07 | 2021-03-09 | 北京邮电大学 | 视频中人体动作切分方法及装置 |
CN112711368A (zh) * | 2020-12-21 | 2021-04-27 | 维沃移动通信(深圳)有限公司 | 操作指导方法、装置及电子设备 |
WO2022161027A1 (zh) * | 2021-01-30 | 2022-08-04 | 华为技术有限公司 | 动作提示图标序列生成方法、电子设备和可读存储介质 |
CN116226453A (zh) * | 2023-05-10 | 2023-06-06 | 北京小糖科技有限责任公司 | 识别跳舞教学视频片段的方法、装置及终端设备 |
TWI812247B (zh) * | 2022-05-30 | 2023-08-11 | 誠屏科技股份有限公司 | 動作引導方法、系統、電子裝置及伺服器 |
CN116980717A (zh) * | 2023-09-22 | 2023-10-31 | 北京小糖科技有限责任公司 | 基于视频分解处理的交互方法、装置、设备及存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103807899A (zh) * | 2014-02-12 | 2014-05-21 | 张世界 | 一种带视频菜谱讲解指导烹饪的油烟机及工作方法 |
WO2014205658A1 (zh) * | 2013-06-25 | 2014-12-31 | 东莞宇龙通信科技有限公司 | 数据处理方法和数据处理系统 |
JP2016062277A (ja) * | 2014-09-18 | 2016-04-25 | 泰章 岩井 | 仮想現実提示システム、仮想現実提示装置、仮想現実提示方法 |
CN106022208A (zh) * | 2016-04-29 | 2016-10-12 | 北京天宇朗通通信设备股份有限公司 | 人体动作识别方法及装置 |
CN107506577A (zh) * | 2017-08-03 | 2017-12-22 | 重庆飞豹健身管理有限公司 | 用于自助健身的App及安装该App的终端 |
CN107707931A (zh) * | 2016-08-08 | 2018-02-16 | 阿里巴巴集团控股有限公司 | 根据视频数据生成解释数据、数据合成方法及装置、电子设备 |
CN108256432A (zh) * | 2017-12-20 | 2018-07-06 | 歌尔股份有限公司 | 一种指导化妆的方法及装置 |
WO2019090479A1 (zh) * | 2017-11-07 | 2019-05-16 | 郑永利 | 一种互动型视频授课方法及系统 |
CN109847308A (zh) * | 2019-02-14 | 2019-06-07 | 山西大同大学 | 一种基于大数据的体育训练系统 |
CN110012311A (zh) * | 2019-05-08 | 2019-07-12 | 江苏康兮运动健康研究院有限公司 | 一种动作指导音视频播放方法、装置和系统 |
CN110166827A (zh) * | 2018-11-27 | 2019-08-23 | 深圳市腾讯信息技术有限公司 | 视频片段的确定方法、装置、存储介质及电子装置 |
CN110751050A (zh) * | 2019-09-20 | 2020-02-04 | 郑鸿 | 一种基于ai视觉感知技术的运动教学系统 |
CN111031398A (zh) * | 2019-12-10 | 2020-04-17 | 维沃移动通信有限公司 | 一种视频控制方法及电子设备 |
-
2020
- 2020-04-30 CN CN202010363660.1A patent/CN111541938B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014205658A1 (zh) * | 2013-06-25 | 2014-12-31 | 东莞宇龙通信科技有限公司 | 数据处理方法和数据处理系统 |
CN103807899A (zh) * | 2014-02-12 | 2014-05-21 | 张世界 | 一种带视频菜谱讲解指导烹饪的油烟机及工作方法 |
JP2016062277A (ja) * | 2014-09-18 | 2016-04-25 | 泰章 岩井 | 仮想現実提示システム、仮想現実提示装置、仮想現実提示方法 |
CN106022208A (zh) * | 2016-04-29 | 2016-10-12 | 北京天宇朗通通信设备股份有限公司 | 人体动作识别方法及装置 |
CN107707931A (zh) * | 2016-08-08 | 2018-02-16 | 阿里巴巴集团控股有限公司 | 根据视频数据生成解释数据、数据合成方法及装置、电子设备 |
CN107506577A (zh) * | 2017-08-03 | 2017-12-22 | 重庆飞豹健身管理有限公司 | 用于自助健身的App及安装该App的终端 |
WO2019090479A1 (zh) * | 2017-11-07 | 2019-05-16 | 郑永利 | 一种互动型视频授课方法及系统 |
CN108256432A (zh) * | 2017-12-20 | 2018-07-06 | 歌尔股份有限公司 | 一种指导化妆的方法及装置 |
CN110166827A (zh) * | 2018-11-27 | 2019-08-23 | 深圳市腾讯信息技术有限公司 | 视频片段的确定方法、装置、存储介质及电子装置 |
CN109847308A (zh) * | 2019-02-14 | 2019-06-07 | 山西大同大学 | 一种基于大数据的体育训练系统 |
CN110012311A (zh) * | 2019-05-08 | 2019-07-12 | 江苏康兮运动健康研究院有限公司 | 一种动作指导音视频播放方法、装置和系统 |
CN110751050A (zh) * | 2019-09-20 | 2020-02-04 | 郑鸿 | 一种基于ai视觉感知技术的运动教学系统 |
CN111031398A (zh) * | 2019-12-10 | 2020-04-17 | 维沃移动通信有限公司 | 一种视频控制方法及电子设备 |
Non-Patent Citations (1)
Title |
---|
李丁辛: "高动态舞蹈视频中特定动作片段检索系统设计", 《现代电子技术》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464847A (zh) * | 2020-12-07 | 2021-03-09 | 北京邮电大学 | 视频中人体动作切分方法及装置 |
CN112711368A (zh) * | 2020-12-21 | 2021-04-27 | 维沃移动通信(深圳)有限公司 | 操作指导方法、装置及电子设备 |
CN112711368B (zh) * | 2020-12-21 | 2023-09-22 | 维沃移动通信(深圳)有限公司 | 操作指导方法、装置及电子设备 |
WO2022161027A1 (zh) * | 2021-01-30 | 2022-08-04 | 华为技术有限公司 | 动作提示图标序列生成方法、电子设备和可读存储介质 |
TWI812247B (zh) * | 2022-05-30 | 2023-08-11 | 誠屏科技股份有限公司 | 動作引導方法、系統、電子裝置及伺服器 |
CN116226453A (zh) * | 2023-05-10 | 2023-06-06 | 北京小糖科技有限责任公司 | 识别跳舞教学视频片段的方法、装置及终端设备 |
CN116226453B (zh) * | 2023-05-10 | 2023-09-26 | 北京小糖科技有限责任公司 | 识别跳舞教学视频片段的方法、装置及终端设备 |
CN116980717A (zh) * | 2023-09-22 | 2023-10-31 | 北京小糖科技有限责任公司 | 基于视频分解处理的交互方法、装置、设备及存储介质 |
CN116980717B (zh) * | 2023-09-22 | 2024-01-23 | 北京小糖科技有限责任公司 | 基于视频分解处理的交互方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111541938B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111541938B (zh) | 视频生成方法、装置及电子设备 | |
CN110020411B (zh) | 图文内容生成方法及设备 | |
CN110968736B (zh) | 视频生成方法、装置、电子设备及存储介质 | |
US20240107127A1 (en) | Video display method and apparatus, video processing method, apparatus, and system, device, and medium | |
JP2018036621A (ja) | 情報入力方法および装置 | |
CN110602516A (zh) | 基于视频直播的信息交互方法、装置及电子设备 | |
CN112437353B (zh) | 视频处理方法、视频处理装置、电子设备和可读存储介质 | |
CN111757175A (zh) | 视频处理方法及装置 | |
CN112367551A (zh) | 视频编辑的方法及装置、电子设备和可读存储介质 | |
CN111526427B (zh) | 视频生成方法、装置及电子设备 | |
CN112269898A (zh) | 背景音乐获取方法、装置、电子设备以及可读存储介质 | |
CN111770386A (zh) | 视频处理方法、视频处理装置及电子设备 | |
CN108614872A (zh) | 课程内容展示方法及装置 | |
US20240079002A1 (en) | Minutes of meeting processing method and apparatus, device, and medium | |
CN112181252B (zh) | 截屏方法、装置及电子设备 | |
CN113992972A (zh) | 一种字幕显示方法、装置、电子设备和可读存储介质 | |
CN113542797A (zh) | 视频播放中的互动方法、装置及计算机可读存储介质 | |
CN114139525A (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
CN111638787A (zh) | 用于展示信息的方法和装置 | |
CN103853463A (zh) | 语音操控方法及装置 | |
CN111736799A (zh) | 基于人机交互的语音交互方法、装置、设备和介质 | |
CN112653919B (zh) | 字幕添加方法及装置 | |
CN113593614A (zh) | 图像处理方法及装置 | |
CN114238684A (zh) | 一种资源搜索方法及电子设备 | |
CN113573096A (zh) | 视频处理方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |