CN111914102A - 编辑多媒体数据的方法、电子设备和计算机存储介质 - Google Patents

编辑多媒体数据的方法、电子设备和计算机存储介质 Download PDF

Info

Publication number
CN111914102A
CN111914102A CN202010881391.8A CN202010881391A CN111914102A CN 111914102 A CN111914102 A CN 111914102A CN 202010881391 A CN202010881391 A CN 202010881391A CN 111914102 A CN111914102 A CN 111914102A
Authority
CN
China
Prior art keywords
edited
image frame
multimedia data
frame
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010881391.8A
Other languages
English (en)
Inventor
胡晨鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhangmen Science and Technology Co Ltd
Original Assignee
Shanghai Zhangmen Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhangmen Science and Technology Co Ltd filed Critical Shanghai Zhangmen Science and Technology Co Ltd
Priority to CN202010881391.8A priority Critical patent/CN111914102A/zh
Publication of CN111914102A publication Critical patent/CN111914102A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本申请提供一种编辑多媒体数据的方法、电子设备和计算机存储介质,所述方法包括:获取待处理多媒体数据;提取所述待处理多媒体数据中的关键帧,作为待编辑图像帧;根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果;利用所述待编辑图像帧的裁剪结果,得到所述待处理多媒体数据的编辑结果。本申请能够简化多媒体数据编辑的步骤,实现多媒体数据编辑的自适应,从而提升多媒体数据编辑的准确性以及效率。

Description

编辑多媒体数据的方法、电子设备和计算机存储介质
【技术领域】
本申请涉及图像处理技术领域,尤其涉及一种编辑多媒体数据的方法、电子设备和计算机存储介质。
【背景技术】
随着智能终端设备的广泛应用,用户可以使用安装在智能终端设备上的各种社交应用进行多媒体数据的发布。但是不同的社交平台会限制用户所发布多媒体数据的尺存或者比例。因此用户在完成多媒体数据的采集之后,要想在不同社交平台上发布该多媒体数据时,需要手动来对多媒体数据进行编辑,例如对多媒体数据所包含的图像帧进行裁剪。
但是用户在手动编辑多媒体数据时,尤其是对图像帧进行裁剪时,需要耗费较长的时间,导致多媒体数据编辑的效率较低;且用户手动进行裁剪,不同图像帧之间存在一定的操作误差,导致多媒体数据编辑的准确性较低。
【发明内容】
有鉴于此,本申请提供了一种编辑多媒体数据的方法、电子设备和计算机存储介质,用于简化多媒体数据编辑的步骤,提升多媒体数据编辑的准确性以及效率。
本申请为解决技术问题所采用的技术方案是提供一种编辑多媒体数据的方法,所述方法包括:获取待处理多媒体数据;提取所述待处理多媒体数据中的关键帧,作为待编辑图像帧;根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果;利用所述待编辑图像帧的裁剪结果,得到所述待处理多媒体数据的编辑结果。
由以上技术方案可以看出,本申请在获取待处理多媒体数据之后,首先确定待处理多媒体数据中的关键帧作为待编辑图像帧,然后再根据编辑参数信息来裁剪待编辑图像帧以得到待编辑图像帧的裁剪结果,最后利用待编辑图像帧的裁剪结果得到待处理多媒体数据的编辑结果,无需用户手动操作,简化了多媒体数据编辑的步骤,实现了多媒体数据编辑的自适应,且能够确保对多媒体数据中的关键图像帧进行编辑,提升了多媒体数据编辑的准确性以及效率。
【附图说明】
图1是根据本申请第一实施例的示意图;
图2是根据本申请第二实施例的示意图;
图3是根据本申请一实施例提供的计算机系统/服务器的框图。
【具体实施方式】
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1是根据本申请第一实施例的示意图。如图1中所示,本实施例的编辑多媒体数据的方法,具体可以包括如下步骤:
S101、获取待处理多媒体数据;
S102、提取所述待处理多媒体数据中的关键帧,作为待编辑图像帧;
S103、根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果;
S104、利用所述待编辑图像帧的裁剪结果,得到所述待处理多媒体数据的编辑结果。
本实施例的编辑多媒体数据的方法,根据编辑参数信息对待处理多媒体数据中作为待编辑图像帧的关键帧进行裁剪,从而利用待编辑图像帧的裁剪结果得到待处理多媒体数据的编辑结果,无需用户手动操作,简化了多媒体数据编辑的步骤,实现了多媒体数据编辑的自适应,且能够确保对多媒体数据中的关键图像帧进行编辑,提升了多媒体数据编辑的准确性以及效率。
本实施例在执行S101获取待处理多媒体数据时,可以获取终端设备实时拍摄的多媒体数据作为待处理多媒体数据,也可以获取保存在终端设备本地的多媒体数据作为待处理多媒体数据。其中,本实施例中的多媒体数据可以为视频,例如横屏视频或者竖屏视频;也可以为至少一张图像。
本实施例在执行S101获取了待处理多媒体数据之后,执行S102提取待处理多媒体数据中的关键帧,作为待编辑图像帧。其中,本实施例从待处理多媒体数据中所提取的关键帧可以为待处理多媒体数据所包含的全部图像帧,也可以为待处理多媒体数据所包含的部分图像帧;所得到的待编辑图像帧可以为一个,也可以为多个。
本实施例在执行S102提取待处理多媒体数据中的关键帧时,可以采用的可选实现方式为:计算待处理多媒体数据中相邻两个图像帧之间的相似度,例如根据所包含的内容计算图像帧之间的图像相似度;确定两个图像帧之间相似度的计算结果是否超过第一预设阈值;若是,则保留其中一个图像帧作为关键帧,否则保留两个图像帧作为关键帧。
也就是说,本实施例若确定两个图像帧包含的内容发生较大差别,表明两个图像帧分别包含了不同的视觉信息,则保留该两个图像帧作为关键帧;本实施例若确定两个图像帧包含的内容没有发生较大差别,表明两个图像帧包含了相似的视觉信息,则仅保留其中一个图像帧作为关键帧即可。
另外,本实施例在执行S102提取待处理多媒体数据中的关键帧时,可以采用的可选实现方式为:对待处理多媒体数据包含的至少一个图像帧进行目标检测,分别得到至少一个图像帧对应的目标数量,其中本实施例可以检测图像帧中的特定目标,例如人脸、位于拍摄焦点的物体等;分别确定至少一个图像帧对应的目标数量是否超过第二预设阈值;保留目标数量超过第二预设阈值的图像帧作为关键帧,舍弃目标数量未超过第二预设阈值的图像帧。
也就是说,当本实施例确定图像帧中包含目标的数量较多时,表明该图像帧包含较为丰富的视觉信息,则保留该图像帧作为关键帧;当本实施例确定图像帧中包含目标的数量较少时,表明该图像帧所包含的视觉信息较为有限,则舍弃该图像帧。
本实施例通过上述方法从待处理多媒体数据中提取关键帧,可以确保仅对待处理多媒体数据中的重要图像帧进行编辑,避免了对重复、包含内容较少的图像帧进行编辑所导致的资源浪费、编辑速度较慢的问题,并进一步提升多媒体数据编辑的准确性。
由于不同的社交平台还会限制用户所发布多媒体数据(例如视频)的时长,为了提升多媒体数据编辑的准确性,确保待处理多媒体数据的编辑结果能够成功发布,本实施例在执行S102提取待处理多媒体数据中的关键帧,作为待编辑图像帧时,可以采用的可选实现方式为:确定所提取关键帧的时长是否超过播放要求时长,该播放要求时长可以为社交平台限制的视频播放时长,也可以为目标用户根据实际需求自行设置的视频播放时长;若是,则选取部分关键帧作为待编辑图像帧,否则选取全部关键帧作为待编辑图像帧。
可以理解的是,本实施例在执行S102选取部分关键帧作为待编辑图像帧时,可以根据视频内容对各关键帧进行评分之后,依次删除评分较低的关键帧,直至所选取的关键帧的时长小于等于播放要求时长,将剩余的关键帧作为待编辑图像帧。
通过本实施例提供的上述方法,在对待处理多媒体数据中的关键帧进行裁剪的同时,还能够对多媒体数据的编辑结果的时长进行优化,避免编辑结果中中包含冗余的图像帧,从而提升编辑速度,节省存储资源。
本实施例在执行S102得到待编辑图像帧之后,执行S103根据编辑参数信息对待编辑图像帧进行裁剪,得到待编辑图像帧的裁剪结果。可以理解的是,本实施例中的编辑参数信息可以包括但不限于编辑要求尺寸、编辑要求比例等。
具体地,本实施例在执行S103根据编辑参数信息对待编辑图像帧进行裁剪,得到待编辑图像帧的裁剪结果时,可以采用的可选实现方式为:确定待处理多媒体数据将要发布的至少一个社交平台;获取至少一个社交平台对应的多媒体数据的编辑参数信息;根据所获取的编辑参数信息对待编辑图像帧进行裁剪,得到待编辑图像帧的裁剪结果。
若所获取的对应至少一个社交平台的编辑参数信息不同,则本实施例可以根据不同的编辑参数信息分别对待编辑图像帧进行裁剪,从而得到同一个待编辑图像帧分别对应不同社交平台的裁剪结果。
本实施例在执行S103确定待处理多媒体数据将要发布的至少一个社交平台包括以下至少任一项:基于目标用户对至少一个社交平台的选择操作,确定待处理多媒体数据将要发布的至少一个社交平台;或者基于目标用户的历史选择信息,确定待处理多媒体数据将要发布的至少一个社交平台。
也就是说,本实施例可以基于目标用户的实时选择来确定待处理多媒体数据将要发布的至少一个社交平台,也可以基于目标用户的历史选择来自动地确定待处理多媒体数据将要发布的至少一个社交平台。
因此,本实施例能够根据对应不同社交平台的编辑参数信息来自动地对待编辑图像帧进行裁剪,使得待编辑图像帧的裁剪结果能够满足相应社交平台的发布需求,从而实现在不同社交平台上发布多媒体数据的自适应。
本实施例在执行S103根据编辑参数信息对待编辑图像帧进行裁剪,得到待编辑图像帧的裁剪结果时,可以采用的可选实现方式为:生成待编辑图像帧对应的目标检测框,所生成的目标检测框可以框选出待编辑图像帧中的一个或者多个目标;根据编辑参数信息对待编辑图像帧对应的目标检测框进行调整,得到待编辑图像帧对应的裁剪框;根据裁剪框对待编辑图像帧进行裁剪,得到待编辑图像帧的裁剪结果。
本实施例在执行S103生成待编辑图像帧对应的目标检测框时,可以采用的可选实现方式为:对待编辑图像帧进行目标检测,确定待编辑图像帧中的特定目标;生成包围待编辑图像帧中全部特定目标的最小矩形框,作为待编辑图像帧对应的目标检测框。
其中,本实施例中的特定目标为视频帧中的主要内容,因此本实施例在执行S103确定待编辑图像帧中的特定目标时,包含但不限于以下中的至少一种:确定待编辑图像帧中的人脸;确定待编辑图像帧中位于拍摄焦点的物体;若待编辑图像帧为多个,则确定在多个待编辑图像帧中都出现的物体。
也就是说,本实施例执行S103生成的待编辑图像帧对应的目标检测框会对待编辑图像帧中的特定目标进行框选,避免所生成的目标检测框包含有待编辑图像帧中的无关内容,从而提升了多媒体数据裁剪的准确性。
可以理解的是,本实施例在执行S103生成待编辑图像帧对应的目标检测框时,可以采用的可选实现方式为:将待编辑图像帧输入预先训练得到的目标检测模型;根据目标检测模型的输出结果,确定待编辑图像帧对应的目标检测框。
其中,本实施例中的目标检测模型为对神经网络模型进行预先训练所得到的,该目标检测模型能够根据所输入的图像帧,来生成包围所输入的图像帧中全部特定目标的目标检测框。
本实施例执行S103生成待编辑图像帧对应的目标检测框之后,根据编辑参数信息来调整待编辑图像帧对应的目标检测框,从而得到待编辑图像帧对应的裁剪框。其中,本实施例所得到的裁剪框对应的区域即为待编辑图像帧所保留的区域。
由于本实施例所生成的目标检测框仅能够确保其包含待编辑图像帧中的全部特定目标,而并不能够确保目标检测框对应的区域能够适应于不同社交平台的播放尺寸要求或者播放尺寸比例。
为了避免由于目标检测框所覆盖区域的过大或者过小,影响多媒体数据的编辑结果在社交平台上的正常发布,本实施例在执行S103根据编辑参数信息对待编辑图像帧对应的目标检测框进行调整,得到待编辑图像帧对应的裁剪框时,可以采用的可选实现方式为:根据编辑参数信息确定图像帧裁剪后的标准面积,例如根据图像帧的图像长度、图像宽度以及编辑参数信息,来确定图像帧裁剪后的标准面积;将待编辑图像帧中目标检测框所覆盖区域的面积调整为与标准面积相同之后,将目标检测框的调整结果作为待编辑图像帧的裁剪框。
也就是说,在目标检测框所覆盖区域的面积小于标准面积时,本实施例对目标检测框进行扩大,从而将扩大之后的目标检测框作为裁剪框;在目标检测框所覆盖区域的面积大于标准面积时,待编辑对目标检测框进行缩小,从而将缩小之后的目标检测框作为裁剪框。
另外,本实施例在执行S103根据编辑参数信息来调整待编辑图像帧对应的目标检测框时,也可以将待编辑图像帧的目标检测框以及编辑参数信息向目标用户进行展示,由目标用户对目标检测框的大小进行手动调整,进而将目标检测框的调整结果作为待编辑图像帧的裁剪框。
本实施例在执行S103得到对应待编辑图像帧的裁剪框之后,根据裁剪框对待编辑图像帧进行裁剪,得到待编辑图像帧的裁剪结果。其中,本实施例在根据裁剪框对待编辑图像帧进行裁剪时,可以对待编辑图像帧中裁剪框内的视频内容进行保留,去除待编辑图像帧中裁剪框之外的视频内容。
本实施例在执行S103得到待编辑图像帧的裁剪结果之后,执行S104利用待编辑图像帧的裁剪结果,得到待处理多媒体数据的编辑结果。
本实施例在得到待处理多媒体数据的编辑结果之后,还可以向至少一个社交平台发布所得到的编辑结果。而由于在发布之前便对多媒体数据进行了自适应的编辑处理,本实施例能够提高多媒体数据在社交平台发布的成功率。
另外,若本实施例中的待处理多媒体数据为视频,则在执行S104利用待编辑图像帧的裁剪结果,得到多媒体数据的编辑结果时,可以采用的可选实现方式为:组合待编辑图像帧的裁剪结果,得到对应待处理多媒体数据的目标视频。
其中,本实施例在执行S104组合待编辑图像帧的裁剪结果时,可以根据待编辑图像帧在待处理多媒体数据中的先后顺序,依次组合各待编辑图像帧的裁剪结果,从而得到对应待处理多媒体数据的目标视频。
通过本实施例提供的上述方法,在进行多媒体数据的编辑时,无需用户进行手动操作,结合编辑参数信息即可自动地对多媒体数据中的关键图像帧进行裁剪,实现了多媒体数据编辑的自适应,简化了多媒体数据编辑的步骤,提升了多媒体数据编辑的准确性以及效率。
图2是根据本申请第二实施例的示意图。如图2中所示,本实施例的编辑多媒体数据的方法,具体可以包括如下步骤:
S201、获取待处理多媒体数据;
S202、提取所述待处理多媒体数据中的关键帧,作为待编辑图像帧;
S203、根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果;
S204、确定所述待编辑图像帧的裁剪结果中的字幕区域;
S205、将所述待编辑图像帧包含的字幕放置在所述待编辑图像帧的裁剪结果中的字幕区域之后,组合所述待编辑图像帧的裁剪结果,得到对应所述待处理多媒体数据的目标视频。
由于待处理多媒体数据还可能包含对应各图像帧的字幕,而在将待编辑图像帧进行裁剪之后,由于字幕通常位于图像帧的最下方,因此极有可能将图像帧中的字幕一同裁剪掉,导致图像帧中的字幕丢失。
因此,本实施例在对待编辑图像帧进行裁剪之后,还会将待编辑图像帧中的字幕放置到待编辑图像帧的裁剪结果所确定的字幕区域,避免了在编辑待处理多媒体数据时丢失字幕的问题,从而提升多媒体数据编辑的准确性。
本实施例在执行S203确定待编辑图像帧的裁剪结果中的字幕区域时,可以采用的可选实现方式为:识别待编辑图像帧的裁剪结果中的特定目标,其中特定目标可以为人脸、位于拍摄焦点的物体、在多个视频帧中都出现的物体等中的一种;将与所识别的特定目标对应的预设区域作为字幕区域。
可以理解的是,本实施例中与特定目标对应的预设区域为特定目标的上方区域,也可以为特定目标的下方区域,还可以为特定目标的上方区域以及下方区域。
图3示出了适于用来实现本申请的一些实施方式的示例性计算机系统/服务器012的框图。图3显示的计算机系统/服务器012仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于:一个或者多个处理器或者处理单元016,系统存储器028,连接不同系统组件(包括系统存储器028和处理单元016)的总线018。
总线018表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器028可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统034可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块042的程序/实用工具040,可以存储在例如存储器028中,这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信,在本发明的一些实施例中,计算机系统/服务器012与外部雷达设备进行通信,还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信,和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且,计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器012使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元016通过运行存储在系统存储器028中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的方法流程。
上述的计算机程序可以设置于计算机存储介质中,即该计算机存储介质被编码有计算机程序,该程序在被一个或多个计算机执行时,使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如,被上述一个或多个处理器执行本发明实施例所提供的方法流程。
随着时间、技术的发展,介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
由以上技术方案可以看出,根据编辑参数信息对待处理多媒体数据中作为待编辑图像帧的关键帧进行裁剪,从而利用待编辑图像帧的裁剪结果得到待处理多媒体数据的编辑结果,无需用户手动操作,简化了多媒体数据编辑的步骤,实现了多媒体数据编辑的自适应,且能够确保对多媒体数据中的关键图像帧进行编辑,提升了多媒体数据编辑的准确性以及效率。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (16)

1.一种编辑多媒体数据的方法,包括:
获取待处理多媒体数据;
提取所述待处理多媒体数据中的关键帧,作为待编辑图像帧;
根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果;
利用所述待编辑图像帧的裁剪结果,得到所述待处理多媒体数据的编辑结果。
2.根据权利要求1所述的方法,其中,所述根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果包括:
确定所述待处理多媒体数据将要发布的至少一个社交平台;
获取所述至少一个社交平台对应的多媒体数据的编辑参数信息;
根据所述编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果。
3.根据权利要求2所述的方法,其中,所述确定所述待处理多媒体数据将要发布的至少一个社交平台包括以下至少任一项:
基于目标用户对至少一个社交平台的选择操作,确定所述待处理多媒体数据将要发布的至少一个社交平台;
基于目标用户的历史选择信息,确定所述待处理多媒体数据将要发布的至少一个社交平台。
4.根据权利要求2或3所述的方法,还包括:
在得到所述待处理多媒体数据的编辑结果之后,向对应的至少一个社交平台发布所述编辑结果。
5.根据权利要求1所述的方法,其中,所述根据编辑参数信息对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果包括:
生成所述待编辑图像帧对应的目标检测框;
根据编辑参数信息对所述待编辑图像帧对应的目标检测框进行调整,得到所述待编辑图像帧对应的裁剪框;
根据所述裁剪框对所述待编辑图像帧进行裁剪,得到所述待编辑图像帧的裁剪结果。
6.根据权利要求5所述的方法,其中,所述生成所述待编辑图像帧对应的目标检测框包括:
对所述待编辑图像帧进行目标检测,确定所述待编辑图像帧中的特定目标;
生成包围所述待编辑图像帧中全部特定目标的最小矩形框,作为所述待编辑图像帧对应的目标检测框。
7.根据权利要求6所述的方法,其中,所述确定所述待编辑图像帧中的特定目标包括但不限于以下中的至少一种;
确定所述待编辑图像帧中的人脸;
确定所述待编辑图像帧中位于拍摄焦点的物体;
若所述待编辑图像帧为多个,则确定在多个待编辑图像帧中都出现的物体。
8.根据权利要求5所述的方法,其中,所述根据编辑参数信息对所述待编辑图像帧对应的目标检测框进行调整,得到所述待编辑图像帧对应的裁剪框包括:
根据编辑参数信息确定图像帧裁剪后的标准面积;
将所述待编辑图像帧中目标检测框所覆盖区域的面积调整为与标准面积相同之后,将目标检测框的调整结果作为所述待编辑图像帧的裁剪框。
9.根据权利要求1所述的方法,其中,所述利用所述待编辑图像帧的裁剪结果,得到所述多媒体数据的编辑结果包括:
组合所述待编辑图像帧的裁剪结果,得到对应所述待处理多媒体数据的目标视频。
10.根据权利要求9所述的方法,其中,所述组合所述待编辑图像帧的裁剪结果包括:
确定所述待编辑图像帧的裁剪结果中的字幕区域;
将所述待编辑图像帧包含的字幕放置在所述待编辑图像帧的裁剪结果中的字幕区域之后,组合所述待编辑图像帧的裁剪结果。
11.根据权利要求10所述的方法,其中,所述确定所述待编辑图像帧的裁剪结果中的字幕区域包括:
识别所述待编辑图像帧的裁剪结果中的特定目标;
将与所识别的特定目标对应的预设区域作为字幕区域。
12.根据权利要求1所述的方法,其中,所述提取所述待处理多媒体数据中的关键帧包括:
计算所述待处理多媒体数据中相邻两个图像帧之间的相似度;
确定相似度的计算结果是否超过第一预设阈值;
若是,保留其中一个图像帧作为关键帧,否则保留两个图像帧作为关键帧。
13.根据权利要求1所述的方法,其中,所述提取所述待处理多媒体数据中的关键帧包括:
对所述待处理多媒体数据包含的至少一个图像帧进行目标检测,分别得到所述至少一个图像帧对应的目标数量;
分别确定所述至少一个图像帧对应的目标数量是否超过第二预设阈值;
保留目标数量超过第二预设阈值的图像帧作为关键帧。
14.根据权利要求1所述的方法,其中,所述提取所述待处理多媒体数据中的关键帧,作为待编辑图像帧包括:
确定所提取关键帧的时长是否超过播放要求时长;
若是,则选取部分关键帧作为待编辑图像帧,否则选取全部关键帧作为待编辑图像帧。
15.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-14中任一所述的方法。
16.一种存储有计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-14中任一所述的方法。
CN202010881391.8A 2020-08-27 2020-08-27 编辑多媒体数据的方法、电子设备和计算机存储介质 Pending CN111914102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010881391.8A CN111914102A (zh) 2020-08-27 2020-08-27 编辑多媒体数据的方法、电子设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010881391.8A CN111914102A (zh) 2020-08-27 2020-08-27 编辑多媒体数据的方法、电子设备和计算机存储介质

Publications (1)

Publication Number Publication Date
CN111914102A true CN111914102A (zh) 2020-11-10

Family

ID=73266141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010881391.8A Pending CN111914102A (zh) 2020-08-27 2020-08-27 编辑多媒体数据的方法、电子设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN111914102A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967288A (zh) * 2021-02-03 2021-06-15 咪咕文化科技有限公司 一种多媒体数据处理方法、通信设备及可读存储介质
CN113645483A (zh) * 2021-08-20 2021-11-12 珠海九松科技有限公司 一种跨平台自动化剪辑视频的方法
CN114627036A (zh) * 2022-03-14 2022-06-14 北京有竹居网络技术有限公司 多媒体资源的处理方法、装置、可读介质和电子设备
CN116486077A (zh) * 2023-04-04 2023-07-25 中国科学院地理科学与资源研究所 遥感影像语义分割模型样本集生成方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060228029A1 (en) * 2005-03-29 2006-10-12 Microsoft Corporation Method and system for video clip compression
US20120087561A1 (en) * 2010-10-12 2012-04-12 Siemens Corporation Interaction method for regions of-interest in time series images
CN106339694A (zh) * 2016-09-14 2017-01-18 北京金山安全软件有限公司 一种图像处理方法、装置及电子设备
CN108900896A (zh) * 2018-05-29 2018-11-27 深圳天珑无线科技有限公司 视频剪辑方法及装置
CN109819338A (zh) * 2019-02-22 2019-05-28 深圳岚锋创视网络科技有限公司 一种视频自动剪辑方法、装置及便携式终端
CN110062279A (zh) * 2019-04-22 2019-07-26 努比亚技术有限公司 视频裁剪方法、可穿戴设备以及计算机可读存储介质
CN110163932A (zh) * 2018-07-12 2019-08-23 腾讯数码(天津)有限公司 图像处理方法、装置、计算机可读介质及电子设备
CN110189378A (zh) * 2019-05-23 2019-08-30 北京奇艺世纪科技有限公司 一种视频处理方法、装置及电子设备
US20190377956A1 (en) * 2018-06-08 2019-12-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for processing video
CN111428660A (zh) * 2020-03-27 2020-07-17 腾讯科技(深圳)有限公司 视频剪辑方法和装置、存储介质及电子装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060228029A1 (en) * 2005-03-29 2006-10-12 Microsoft Corporation Method and system for video clip compression
US20120087561A1 (en) * 2010-10-12 2012-04-12 Siemens Corporation Interaction method for regions of-interest in time series images
CN106339694A (zh) * 2016-09-14 2017-01-18 北京金山安全软件有限公司 一种图像处理方法、装置及电子设备
CN108900896A (zh) * 2018-05-29 2018-11-27 深圳天珑无线科技有限公司 视频剪辑方法及装置
US20190377956A1 (en) * 2018-06-08 2019-12-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for processing video
CN110163932A (zh) * 2018-07-12 2019-08-23 腾讯数码(天津)有限公司 图像处理方法、装置、计算机可读介质及电子设备
CN109819338A (zh) * 2019-02-22 2019-05-28 深圳岚锋创视网络科技有限公司 一种视频自动剪辑方法、装置及便携式终端
CN110062279A (zh) * 2019-04-22 2019-07-26 努比亚技术有限公司 视频裁剪方法、可穿戴设备以及计算机可读存储介质
CN110189378A (zh) * 2019-05-23 2019-08-30 北京奇艺世纪科技有限公司 一种视频处理方法、装置及电子设备
CN111428660A (zh) * 2020-03-27 2020-07-17 腾讯科技(深圳)有限公司 视频剪辑方法和装置、存储介质及电子装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967288A (zh) * 2021-02-03 2021-06-15 咪咕文化科技有限公司 一种多媒体数据处理方法、通信设备及可读存储介质
CN113645483A (zh) * 2021-08-20 2021-11-12 珠海九松科技有限公司 一种跨平台自动化剪辑视频的方法
CN114627036A (zh) * 2022-03-14 2022-06-14 北京有竹居网络技术有限公司 多媒体资源的处理方法、装置、可读介质和电子设备
CN114627036B (zh) * 2022-03-14 2023-10-27 北京有竹居网络技术有限公司 多媒体资源的处理方法、装置、可读介质和电子设备
CN116486077A (zh) * 2023-04-04 2023-07-25 中国科学院地理科学与资源研究所 遥感影像语义分割模型样本集生成方法和装置
CN116486077B (zh) * 2023-04-04 2024-04-30 中国科学院地理科学与资源研究所 遥感影像语义分割模型样本集生成方法和装置

Similar Documents

Publication Publication Date Title
CN111914102A (zh) 编辑多媒体数据的方法、电子设备和计算机存储介质
CN108683937B (zh) 智能电视的语音交互反馈方法、系统及计算机可读介质
CN108959257B (zh) 一种自然语言解析方法、装置、服务器及存储介质
CN110232340B (zh) 建立视频分类模型以及视频分类的方法、装置
CN108182211B (zh) 视频舆情获取方法、装置、计算机设备及存储介质
US20160284344A1 (en) Speech data recognition method, apparatus, and server for distinguishing regional accent
CN107516526B (zh) 一种声源跟踪定位方法、装置、设备和计算机可读存储介质
EP3709212A1 (en) Image processing method and device for processing image, server and storage medium
CN110633033A (zh) 任务显示的方法、设备和计算机存储介质
CN109815481B (zh) 对文本进行事件抽取的方法、装置、设备和计算机存储介质
CN107948730B (zh) 基于图片生成视频的方法、装置、设备及存储介质
CN109561212B (zh) 一种发布信息的合并方法、装置、设备和存储介质
CN113762455A (zh) 检测模型训练方法、单字检测方法、装置、设备及介质
CN110162729B (zh) 建立浏览器指纹以及识别浏览器类型的方法、装置
CN110377885B (zh) 转换pdf文件的方法、装置、设备和计算机存储介质
CN109657127B (zh) 一种答案获取方法、装置、服务器及存储介质
CN110677482A (zh) 一种推送信息的方法、设备和计算机存储介质
CN106959945B (zh) 基于人工智能的为新闻生成短标题的方法和装置
CN114791524A (zh) 车辆测试报告生成方法及装置
CN108304080B (zh) 输入法换算货币的方法、装置、设备和计算机存储介质
CN114356475A (zh) 一种显示处理方法、装置、设备及存储介质
CN113449542B (zh) 一种换脸识别方法、装置、设备和介质
CN111400342A (zh) 数据库更新方法、装置、设备及存储介质
CN110704593B (zh) 一种数据处理方法、装置、设备及介质
CN114401419B (zh) 基于视频的内容生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination