CN114817585A - 多媒体资源处理方法、装置、电子设备及存储介质 - Google Patents
多媒体资源处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114817585A CN114817585A CN202210271574.7A CN202210271574A CN114817585A CN 114817585 A CN114817585 A CN 114817585A CN 202210271574 A CN202210271574 A CN 202210271574A CN 114817585 A CN114817585 A CN 114817585A
- Authority
- CN
- China
- Prior art keywords
- multimedia resource
- processing
- processing node
- candidate
- multimedia
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/483—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开关于多媒体资源处理方法、装置、电子设备及存储介质,涉及多媒体技术领域,该方法包括:响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源;在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息;所述候选处理节点信息表征通过对所述多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源。利用本公开实施例提供的技术方案可以提升处理节点定位的准确性,且可以提高多媒体资源处理效率。
Description
技术领域
本公开涉及多媒体技术领域,尤其涉及多媒体资源处理方法、装置、电子设备及存储介质。
背景技术
目前,多媒体的流行让更多的用户参与到视频、音频等的采集与编辑中。当用户对视频、音频等多媒体资源进行编辑处理时,时间节点的选择尤为重要。相关技术中,通过提供多媒体资源的时间轴,由用户自主选择并定位至待编辑处理部分对应的时间节点或节点区间,但仍会因节点的选择不合适或定位不准确而造成多媒体资源的关键信息丢失或视听效果不佳等问题。
发明内容
本公开提供多媒体资源处理方法、装置、电子设备及存储介质,以至少解决相关技术中多媒体资源处理节点难确定的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体资源处理方法,包括:
响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源;
在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息;所述候选处理节点信息表征通过对所述多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;
响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源。
可选的,所述展示所述多媒体资源的候选处理节点信息包括:
根据所述候选处理节点对应的处理类型指示信息,确定所述候选处理节点对应的展示样式;
按照对应的所述展示样式,展示所述候选处理节点。
可选的,所述展示所述多媒体资源的候选处理节点信息还包括:
在所述候选处理节点关联的展示区域展示所述候选处理节点对应的处理类型指示信息。
可选的,所述响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源,包括:
响应于基于所述候选处理节点触发的选择指令,在所述多媒体资源处理页面中展示所述多媒体资源中与所述候选处理节点对应的图像帧;
响应于基于所述多媒体资源处理页面执行的图像处理操作,对所述图像帧进行处理,得到第一目标多媒体资源。
可选的,所述响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源,还包括:
响应于基于所述候选处理节点触发的选择指令,在所述多媒体资源处理页面中展示所述多媒体资源中与所述候选处理节点对应的图像帧;
响应于基于所述候选处理节点对应的处理类型指示信息触发的处理指令,对所述图像帧进行处理,得到第二目标多媒体资源。
可选的,所述方法还包括:
在当前处理节点不为所述候选处理节点时,确定与所述当前处理节点关联的目标候选处理节点,所述候选处理节点包括所述目标候选处理节点;
在所述多媒体资源处理页面中展示所述多媒体资源中与所述目标候选处理节点对应的图像帧。
可选的,在响应于多媒体资源处理指令之前,所述方法还包括:
获取所述多媒体资源;
对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
基于所述至少一个候选处理节点,得到所述候选处理节点信息;
将所述候选处理节点信息保存至本地。
可选的,所述在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息,包括:
响应于所述多媒体资源处理指令,从本地读取所述多媒体资源的所述候选处理节点信息;
在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的所述候选处理节点信息。
可选的,在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息,还包括:
响应于所述多媒体资源处理指令,获取所述待处理的多媒体资源;
对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
基于所述至少一个候选处理节点,得到所述候选处理节点信息;
在所述多媒体资源处理页面展示所述待处理的多媒体资源,并在所述多媒体资源处理页面的所述处理节点提示区域,展示所述多媒体资源的候选处理节点信息。
可选的,所述对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;以及根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点,包括:
对所述多媒体资源进行语音识别,得到语音识别文本;
对所述语音识别文本进行分割,确定所述语音识别文本的目标分割节点;
确定与所述目标分割节点对应的第一候选处理节点。
可选的,所述对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;以及根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点,还包括:
对所述多媒体资源进行目标检测,得到目标检测结果;所述目标检测结果包括目标对象以及所述目标对象所在的图像帧;
确定与所述图像帧对应的第二候选处理节点。
可选的,所述方法还包括:
根据所述目标对象,确定所述第二候选处理节点对应的处理类型指示信息。
根据本公开实施例的第二方面,提供一种多媒体资源处理装置,包括:
第一展示模块,被配置为执行响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源;
第二展示模块,被配置为执行在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息;所述候选处理节点信息表征通过对所述多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;
处理模块,被配置为执行响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源。
可选的,所述第二展示模块包括:
样式确定单元,被配置为执行根据所述候选处理节点对应的处理类型指示信息,确定所述候选处理节点对应的展示样式;
第一展示单元,被配置为执行按照对应的所述展示样式,展示所述候选处理节点。
可选的,所述第二展示模块还包括:
第二展示单元,被配置为执行在所述候选处理节点关联的展示区域展示所述候选处理节点对应的处理类型指示信息。
可选的,所述处理模块包括:
第一图像帧展示单元,被配置为执行响应于基于所述候选处理节点触发的选择指令,在所述多媒体资源处理页面中展示所述多媒体资源中与所述候选处理节点对应的图像帧;
第一处理单元,被配置为执行响应于基于所述多媒体资源处理页面执行的图像处理操作,对所述图像帧进行处理,得到第一目标多媒体资源。
可选的,所述处理模块还包括:
第二图像帧展示单元,被配置为执行响应于基于所述候选处理节点触发的选择指令,在所述多媒体资源处理页面中展示所述多媒体资源中与所述候选处理节点对应的图像帧;
第二处理单元,被配置为执行响应于基于所述候选处理节点对应的处理类型指示信息触发的处理指令,对所述图像帧进行处理,得到第二目标多媒体资源。
可选的,所述装置还包括:
关联节点确定单元,被配置为执行在当前处理节点不为所述候选处理节点时,确定与所述当前处理节点关联的目标候选处理节点,所述候选处理节点包括所述目标候选处理节点;
第三图像帧展示单元,被配置为执行在所述多媒体资源处理页面中展示所述多媒体资源中与所述目标候选处理节点对应的图像帧。
可选的,所述装置还包括:
第一获取单元,被配置为执行获取所述多媒体资源;
第一识别单元,被配置为执行对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
第一节点确定单元,被配置为执行根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
第一信息确定单元,被配置为执行基于所述至少一个候选处理节点,得到所述候选处理节点信息;
信息保存单元,被配置为执行将所述候选处理节点信息保存至本地。
可选的,所述第二展示模块还包括:
信息读取单元,被配置为执行响应于所述多媒体资源处理指令,从本地读取所述多媒体资源的所述候选处理节点信息;
第三展示单元,被配置为执行在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的所述候选处理节点信息。
可选的,所述第二展示模块还包括:
第二获取单元,被配置为执行响应于所述多媒体资源处理指令,获取所述待处理的多媒体资源;
第二识别单元,被配置为执行对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
第二节点确定单元,被配置为执行根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
第二信息确定单元,被配置为执行基于所述至少一个候选处理节点,得到所述候选处理节点信息;
第四展示单元,被配置为执行在所述多媒体资源处理页面展示所述待处理的多媒体资源,并在所述多媒体资源处理页面的所述处理节点提示区域,展示所述多媒体资源的候选处理节点信息。
可选的,所述第一识别单元与第一节点确定单元,或者所述第二识别单元与所述第二节点确定单元,包括:
语音识别子单元,被配置为执行对所述多媒体资源进行语音识别,得到语音识别文本;
文本分割子单元,被配置为执行对所述语音识别文本进行分割,确定所述语音识别文本的目标分割节点;
第一节点确定子单元,被配置为执行确定与所述目标分割节点对应的第一候选处理节点。
可选的,所述第一识别单元与第一节点确定单元,或者所述第二识别单元与所述第二节点确定单元,还包括:
目标检测子单元,被配置为执行对所述多媒体资源进行目标检测,得到目标检测结果;所述目标检测结果包括目标对象以及所述目标对象所在的图像帧;
第二节点确定子单元,被配置为执行确定与所述图像帧对应的第二候选处理节点。
可选的,所述第一节点确定单元或所述第二节点确定单元,还包括:
节点类型确定子单元,被配置为执行根据所述目标对象,确定所述第二候选处理节点对应的处理类型指示信息。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现本公开实施例第一方面中任一项所述的一种多媒体资源处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如本公开实施例第一方面中任一项所述的一种多媒体资源处理方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如本公开实施例第一方面中任一项所述的一种多媒体资源处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
在响应于多媒体资源处理指令时,除了在多媒体资源处理页面展示待处理的多媒体资源,还会在多媒体资源处理页面的处理节点提示区域为用户提供并展示该多媒体资源的候选处理节点信息,该候选处理节点信息可以表征通过对该多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;从而可以响应于用户基于该候选处理节点信息对该多媒体资源执行的处理操作,得到目标多媒体资源。通过主动对多媒体资源的媒体元素进行识别处理,得到候选处理节点,并在多媒体处理页面推荐给用户,可以方便用户快速确定并定位到可编辑处理的节点,提高多媒体资源的处理效率,同时相比于用户自主定位处理节点,本公开实施例提供的技术方案还能提升处理节点选择、定位的准确性,从而可以避免多媒体资源关键信息的丢失,也可以提升处理后的目标多媒体资源的视听效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图;
图2是根据一示例性实施例示出的一种多媒体资源处理方法的流程图;
图3是根据一示例性实施例示出的一种展示候选处理节点信息的示意图;
图4是根据一示例性实施例示出的另一种展示候选处理节点信息的示意图;
图5是根据一示例性实施例示出的另一种多媒体资源处理方法的流程图;
图6是根据一示例性实施例示出的另一种多媒体资源处理方法的流程图;
图7是根据一示例性实施例示出的一种多媒体资源处理装置的框图;
图8是根据一示例性实施例示出的用于实现一种多媒体资源处理方法的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
请参阅图1,其所示为根据一示例性实施例示出的一种多媒体资源处理方法的应用环境示意图,该应用环境可以包括终端110和服务器120,该终端110和服务器120之间可以通过有线网络或者无线网络连接。
终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110中可以安装有应用程序(Application,简称为App),该应用程序可以是独立的应用程序,也可以是独立应用程序中的子程序,终端110的用户可以通过预先注册的用户信息登录应用程序,该用户信息可以包括账号和密码。服务器120可以是为终端110中的应用程序提供后台服务的服务器,也可以是与应用程序的后台服务器连接通信的其它服务器,可以是一台服务器,也可以是由多台服务器组成的服务器集群。
在本公开的实施例中,终端110可以将待处理的多媒体资源发送至服务器120,由服务器120对该多媒体资源的至少一种媒体元素进行识别处理,得到该多媒体资源的至少一个候选处理节点,服务器120将表征至少一个候选处理节点的候选处理节点信息发送至终端110。终端110中的应用程序响应于多媒体资源处理指令,在多媒体资源处理页面展示该待处理的多媒体资源,并在多媒体资源处理页面的处理节点提示区域展示从服务器120接收到的该多媒体资源的候选处理节点信息。终端110中的应用程序响应于用户基于该候选处理节点信息对该多媒体资源执行的处理操作,得到目标多媒体资源。在多媒体处理页面为用户推荐可编辑处理的节点,方便用户快速定位,提高了处理效率,同时节点定位更为准确,能够优化多媒体资源的处理效果。
此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以为其他应用环境,例如应用环境中仅包括终端110,由终端110的应用程序在响应于多媒体资源处理指令之前或是之后,对该多媒体资源的至少一种媒体元素进行识别处理得到至少一个候选处理节点,并显示在多媒体资源处理页面。
图2是根据一示例性实施例示出的一种多媒体资源处理方法的流程图,应用于终端,如图2所示,所述方法可以包括以下步骤:
在步骤S201中,响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源。
可行的,在终端上展示应用程序所提供的初始的多媒体资源处理页面,响应于用户基于该初始的多媒体资源处理页面触发的多媒体资源处理指令,导入用户所选择的待处理的多媒体资源并展示在初始的多媒体资源处理页面中。
在步骤S203中,在多媒体资源处理页面的处理节点提示区域,展示多媒体资源的候选处理节点信息;候选处理节点信息表征通过对多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点。
在本公开实施例中,在多媒体资源处理页面中设有处理节点提示区域,用于展示多媒体资源的候选处理节点信息。该处理节点提示区域可以为多媒体资源处理页面中的时间轴区域,从而可以在时间轴区域上一并展示候选处理节点信息;或者该处理节点提示区域可以是以时间轴区域为基础的改进,以不同于时间进度的标识表示候选处理节点。本公开实施例对处理节点提示区域的展示形式不作限定。
在本公开实施例中,所展示的候选处理节点信息可以表征通过对多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点。多媒体资源中的媒体元素可以包括但不限于文字、图片、声音、动画和视频等。具体地,对待处理的多媒体资源中的至少一种媒体元素进行智能识别,根据识别结果进行处理得到可以推荐给用户的至少一个候选处理节点。可以理解的是,相比于用户的手动选择和定位,本公开实施例中的候选处理节点对多媒体资源可编辑处理部分的划分更为准确。
上述候选处理节点是针对该多媒体资源识别出的可编辑处理部分对应的时间节点。
在本公开实施例中,所述候选处理节点信息还可以包括候选处理节点对应的处理类型指示信息,该处理类型指示信息指示在该候选处理节点处可采取的处理操作。例如,在不同候选处理节点处可采取的处理操作包括但不限于内容裁剪、画面定格、人脸打码、增加特效等。
在一个具体的实施例中,上述展示多媒体资源的候选处理节点信息可以包括:
在步骤S2031中,根据候选处理节点对应的处理类型指示信息,确定候选处理节点对应的展示样式。
具体地,可以根据处理类型指示信息,对至少一个候选处理节点进行分类,可以使用不同展示样式的标识来表示不同类别的候选处理节点。
在步骤S2033中,按照对应的展示样式,展示候选处理节点。
示例性的,如图3所示,处理节点提示区域也即为时间轴区域,在该区域中的时间轴上,剪刀样式的图标所标识的候选处理节点表征可执行裁剪操作的时间节点,方块样式的图标所标识的候选处理节点表征可执行图像打码操作的时间节点,星星样式的图标所标识的候选处理节点表征可执行增加特效操作的时间节点。以上仅是本公开的一种示例展示。
在步骤S2035中,或者在候选处理节点关联的展示区域展示候选处理节点对应的处理类型指示信息。
示例性的,如图4所示,处理节点提示区域也即为多媒体资源的缩略预览区域,在该区域中,统一以圆点样式的图标标识所有的候选处理节点,并在各圆点图标的下方以文字格式显示该候选处理节点对应的处理类型指示信息。以上仅是本公开的一种示例展示。
在上述实施例中,除了展示推荐给用户的该多媒体资源的候选处理节点,还可以通过不同的展示样式区分不同处理指示类型,或者直接展示候选处理节点的处理类型指示信息,可以方便用户快速了解在各候选处理节点可采取的处理操作,从而可以提升多媒体资源的处理效率。
在步骤S205中,响应于基于候选处理节点信息对多媒体资源执行的处理操作,得到目标多媒体资源。
在本公开实施例中,用户基于所展示的候选处理节点信息,可以快速了解该多媒体资源中待编辑处理部分对应的时间节点,同时可以快速定位至该时间节点处以执行处理操作,应用程序响应于该处理操作,对该多媒体资源执行对应的具体的编辑处理,得到目标多媒体资源。
进一步地,可以在多媒体展示页面中展示目标多媒体资源。
在一个具体的实施例中,所述响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源,可以包括以下步骤:
在步骤S2051中,响应于基于候选处理节点触发的选择指令,在多媒体资源处理页面中展示多媒体资源中与候选处理节点对应的图像帧。
在步骤S2053中,响应于基于多媒体资源处理页面执行的图像处理操作,对图像帧进行处理,得到第一目标多媒体资源。
在上述实施例中,用户可以通过对候选处理节点的选择,定位到多媒体资源中与该候选处理节点对应的图像帧,进而可以基于多媒体资源处理页面所提供的处理功能执行用户所需的图像处理操作,应用程序响应于该图像处理操作,对当前图像帧进行相应的编辑处理,得到第一目标多媒体资源。图像处理操作可以包括但不限于裁剪、人脸打码、增加特效、导入音频等。利用本公开实施例中的候选处理节点,可以节省用户自主确定、定位处理节点的时间,提升多媒体资源的处理效率。
在另一个具体的实施例中,所述响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源,还可以包括以下步骤:
在步骤S2052中,响应于基于候选处理节点触发的选择指令,在多媒体资源处理页面中展示多媒体资源中与候选处理节点对应的图像帧;
在步骤S2054中,响应于基于候选处理节点对应的处理类型指示信息触发的处理指令,对图像帧进行处理,得到第二目标多媒体资源。
在上述实施例中,用户可以通过对候选处理节点的选择,定位到多媒体资源中与该候选处理节点对应的图像帧,在多媒体资源处理页面中所展示的候选处理节点对应的处理类型指示信息可以为与处理类型对应的功能控件,当该功能控件被点击时可以触发相应的处理指令,应用程序响应于该处理指令执行对图像帧的处理,得到第二目标多媒体资源。利用本公开实施例中的候选处理节点,可以方便用户快速确定并定位到待处理的图像帧;处理类型指示信息被设计为功能控件,进一步节省了用户的操作时间,有效提升多媒体资源的处理效率。
此外,还可以对两个相邻候选处理节点所限定的区间对应的部分多媒体资源,执行统一的处理操作。
在另一个具体的实施例中,所述方法还可以包括以下步骤:
在步骤S2061中,在当前处理节点不为候选处理节点时,确定与当前处理节点关联的目标候选处理节点,候选处理节点包括目标候选处理节点。
在步骤S2063中,在多媒体资源处理页面中展示多媒体资源中与目标候选处理节点对应的图像帧。
在上述实施例中,若当前处理节点为用户自主选择的在候选处理节点之外的一个时间节点,则可以为当前处理节点匹配一个关联的目标候选处理节点,该目标候选处理节点可以是距离当前处理节点最近的一个候选处理节点。进而可以将所展示的图像帧调整至与目标候选处理节点对应的图像帧,以便用户可以在准确定位的基础上执行处理操作。可以理解的是,相比于用户的手动选择和定位,本公开实施例中的候选处理节点是通过对媒体元素进行智能识别、处理得到的,其对媒体元素可编辑处理部分的划分更为准确。
由以上本说明书实施例提供的技术方案可见,本说明书实施例在响应于多媒体资源处理指令时,除了在多媒体资源处理页面展示待处理的多媒体资源,还会在多媒体资源处理页面的处理节点提示区域为用户提供并展示该多媒体资源的候选处理节点信息,该候选处理节点信息可以表征通过对该多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;从而可以响应于用户基于该候选处理节点信息对该多媒体资源执行的处理操作,得到目标多媒体资源。通过主动对多媒体资源的媒体元素进行识别处理,得到候选处理节点,并在多媒体处理页面推荐给用户,可以方便用户快速确定并定位到可编辑处理的节点,提高多媒体资源的处理效率,同时相比于用户自主定位处理节点,本公开实施例提供的技术方案还能提升处理节点选择、定位的准确性,从而可以避免多媒体资源处理过程中关键信息的丢失,也可以提升处理后的目标多媒体资源的视听效果。
图5是根据一示例性实施例示出的另一种多媒体资源处理方法的流程图,如图5所示,所述方法可以包括以下步骤:
在步骤S301中,获取多媒体资源。
在步骤S302中,对多媒体资源进行至少一种媒体元素的识别,得到多媒体资源的媒体元素识别信息。
媒体元素识别信息可以包括语音识别结果、图像识别结果、人脸识别结果、动作追踪结果等。
在步骤S303中,根据媒体元素识别信息,确定多媒体资源的至少一个候选处理节点。
在步骤S304中,基于至少一个候选处理节点,得到候选处理节点信息。
在步骤S305中,将候选处理节点信息保存至本地。
在步骤S306中,响应于多媒体资源处理指令,从本地读取多媒体资源的候选处理节点信息。
在步骤S307中,在多媒体资源处理页面的处理节点提示区域,展示多媒体资源的候选处理节点信息。
在上述实施例中,可以预先对终端本地的多媒体资源进行识别处理,得到候选处理节点信息,以便在响应多媒体资源处理指令展示多媒体资源时能快速地同步展示该多媒体资源的候选处理节点信息,提升用户的使用体验。
关于上述实施例中的方法,其中各个步骤的具体实现方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图6是根据一示例性实施例示出的另一种多媒体资源处理方法的流程图,如图6所示,所述方法可以包括以下步骤:
在步骤S401中,响应于多媒体资源处理指令,获取待处理的多媒体资源。
在步骤S402中,对多媒体资源进行至少一种媒体元素的识别,得到多媒体资源的媒体元素识别信息。
在步骤S403中,根据媒体元素识别信息,确定多媒体资源的至少一个候选处理节点。
在步骤S404中,基于至少一个候选处理节点,得到候选处理节点信息。
在步骤S405中,在多媒体资源处理页面展示待处理的多媒体资源,并在多媒体资源处理页面的处理节点提示区域,展示多媒体资源的候选处理节点信息。
在上述实施例中,在响应多媒体资源处理指令展示多媒体资源的同时,对待处理的多媒体资源进行识别处理,避免因采用预先确定候选处理节点信息的方式而造成的大量计算。为了提升识别处理的速率,还可以基于图1所示的实施环境示意图,采用终端与服务器交互的方式来获取候选处理节点信息,此处不再赘述。
关于上述实施例中的方法,其中各个步骤的具体实现方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
在一种具体可行的实施方式中,步骤S302-303或者步骤S402-403可以包括:
在步骤S501中,对多媒体资源进行语音识别,得到语音识别文本。
在步骤S502中,对语音识别文本进行分割,确定语音识别文本的目标分割节点。
可选的,可以对语音识别文本进行以单词为最小粒度的分割,或者结合文本语义进行以句子为最小粒度的分割,将分割点作为上述目标分割节点。
可选的,基于预先配置的过滤条件,对分割点进行过滤筛选,得到目标分割点。如可以将划分主语、宾语之间的分割点进行过滤。
在步骤S503中,确定与目标分割节点对应的第一候选处理节点。
也即,将该目标分割节点在多媒体资源中对应的时间节点作为对应的第一候选处理节点。
在上述实施例中,对多媒体资源中语音这一媒体元素进行识别,获得语音识别文本,进而通过文本分割确定文本的可分割节点,进而根据文本-语音-多媒体资源在时间维度的对应关系,确定与可分割节点对应的第一候选处理节点。通过语音识别和文本分割确定候选处理节点,可以提示用户该多媒体资源中的关键文本信息或关键语音信息,避免在对多媒体资源编辑处理时造成语音、文本信息不完整。
在另一种可行的实施方式中,步骤S302-303或者步骤S402-403还可以包括:
在步骤S601中,对多媒体资源进行目标检测,得到目标检测结果;目标检测结果包括目标对象以及目标对象所在的图像帧。
在步骤S603中,确定与图像帧对应的第二候选处理节点。
进一步地,根据目标对象,确定第二候选处理节点对应的处理类型指示信息。
示例性的,对多媒体资源的图像帧进行儿童脸部识别,确定包含儿童脸部区域的图像帧;将包含儿童脸部区域的图像帧对应的时间节点作为第二候选处理节点。通过对儿童脸部的识别,可以展示候选处理节点信息时展示第二候选处理节点,并提示用户可以在关联的图像帧中执行脸部区域的打码处理以保护儿童隐私。
在上述实施例中,对多媒体资源中视频图像这一媒体元素进行识别,获得目标检测结果,根据目标检测结果中包含目标对象的图像帧,确定对应的第二候选处理节点,可以提示用户对多媒体资源中的目标对象执行编辑处理,提升处理效率。
图7是根据一示例性实施例示出的一种多媒体资源处理装置框图。参照图7,该装置可以包括:
第一展示模块710,被配置为执行响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源;
第二展示模块720,被配置为执行在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息;所述候选处理节点信息表征通过对所述多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;
处理模块730,被配置为执行响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源。
可选的,所述第二展示模块720可以包括:
样式确定单元,被配置为执行根据所述候选处理节点对应的处理类型指示信息,确定所述候选处理节点对应的展示样式;
第一展示单元,被配置为执行按照对应的所述展示样式,展示所述候选处理节点。
可选的,所述第二展示模块720还可以包括:
第二展示单元,被配置为执行在所述候选处理节点关联的展示区域展示所述候选处理节点对应的处理类型指示信息。
可选的,所述处理模块730可以包括:
第一图像帧展示单元,被配置为执行响应于基于所述候选处理节点触发的选择指令,在所述多媒体资源处理页面中展示所述多媒体资源中与所述候选处理节点对应的图像帧;
第一处理单元,被配置为执行响应于基于所述多媒体资源处理页面执行的图像处理操作,对所述图像帧进行处理,得到第一目标多媒体资源。
可选的,所述处理模块730还可以包括:
第二图像帧展示单元,被配置为执行响应于基于所述候选处理节点触发的选择指令,在所述多媒体资源处理页面中展示所述多媒体资源中与所述候选处理节点对应的图像帧;
第二处理单元,被配置为执行响应于基于所述候选处理节点对应的处理类型指示信息触发的处理指令,对所述图像帧进行处理,得到第二目标多媒体资源。
可选的,所述装置还可以包括:
关联节点确定单元,被配置为执行在当前处理节点不为所述候选处理节点时,确定与所述当前处理节点关联的目标候选处理节点,所述候选处理节点包括所述目标候选处理节点;
第三图像帧展示单元,被配置为执行在所述多媒体资源处理页面中展示所述多媒体资源中与所述目标候选处理节点对应的图像帧。
可选的,所述装置还可以包括:
第一获取单元,被配置为执行获取所述多媒体资源;
第一识别单元,被配置为执行对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
第一节点确定单元,被配置为执行根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
第一信息确定单元,被配置为执行基于所述至少一个候选处理节点,得到所述候选处理节点信息;
信息保存单元,被配置为执行将所述候选处理节点信息保存至本地。
可选的,所述第二展示模块720还可以包括:
信息读取单元,被配置为执行响应于所述多媒体资源处理指令,从本地读取所述多媒体资源的所述候选处理节点信息;
第三展示单元,被配置为执行在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的所述候选处理节点信息。
可选的,所述第二展示模块720还可以包括:
第二获取单元,被配置为执行响应于所述多媒体资源处理指令,获取所述待处理的多媒体资源;
第二识别单元,被配置为执行对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
第二节点确定单元,被配置为执行根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
第二信息确定单元,被配置为执行基于所述至少一个候选处理节点,得到所述候选处理节点信息;
第四展示单元,被配置为执行在所述多媒体资源处理页面展示所述待处理的多媒体资源,并在所述多媒体资源处理页面的所述处理节点提示区域,展示所述多媒体资源的候选处理节点信息。
可选的,所述第一识别单元与第一节点确定单元,或者所述第二识别单元与所述第二节点确定单元,包括:
语音识别子单元,被配置为执行对所述多媒体资源进行语音识别,得到语音识别文本;
文本分割子单元,被配置为执行对所述语音识别文本进行分割,确定所述语音识别文本的目标分割节点;
第一节点确定子单元,被配置为执行确定与所述目标分割节点对应的第一候选处理节点。
可选的,所述第一识别单元与第一节点确定单元,或者所述第二识别单元与所述第二节点确定单元,还包括:
目标检测子单元,被配置为执行对所述多媒体资源进行目标检测,得到目标检测结果;所述目标检测结果包括目标对象以及所述目标对象所在的图像帧;
第二节点确定子单元,被配置为执行确定与所述图像帧对应的第二候选处理节点。
可选的,所述第一节点确定单元或所述第二节点确定单元,还包括:
节点类型确定子单元,被配置为执行根据所述目标对象,确定所述第二候选处理节点对应的处理类型指示信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于实现一种多媒体资源处理方法的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图8所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体资源处理方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的一种多媒体资源处理方法。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例中的一种多媒体资源处理方法。
在示例性实施例中,还提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现本公开实施例中的一种多媒体资源处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种多媒体资源处理方法,其特征在于,所述方法包括:
响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源;
在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息;所述候选处理节点信息表征通过对所述多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;
响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源。
2.根据权利要求1所述的方法,其特征在于,所述展示所述多媒体资源的候选处理节点信息,包括:
根据所述候选处理节点对应的处理类型指示信息,确定所述候选处理节点对应的展示样式;
按照对应的所述展示样式,展示所述候选处理节点。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在当前处理节点不为所述候选处理节点时,确定与所述当前处理节点关联的目标候选处理节点,所述候选处理节点包括所述目标候选处理节点;
在所述多媒体资源处理页面中展示所述多媒体资源中与所述目标候选处理节点对应的图像帧。
4.根据权利要求1所述的方法,其特征在于,在响应于多媒体资源处理指令之前,所述方法还包括:
获取所述多媒体资源;
对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;
根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点;
基于所述至少一个候选处理节点,得到所述候选处理节点信息;
将所述候选处理节点信息保存至本地。
5.根据权利要求4所述的方法,其特征在于,所述对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;以及根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点,包括:
对所述多媒体资源进行语音识别,得到语音识别文本;
对所述语音识别文本进行分割,确定所述语音识别文本的目标分割节点;
确定与所述目标分割节点对应的第一候选处理节点。
6.根据权利要求4所述的方法,其特征在于,所述对所述多媒体资源进行至少一种媒体元素的识别,得到所述多媒体资源的媒体元素识别信息;以及根据所述媒体元素识别信息,确定所述多媒体资源的至少一个候选处理节点,还包括:
对所述多媒体资源进行目标检测,得到目标检测结果;所述目标检测结果包括目标对象以及所述目标对象所在的图像帧;
确定与所述图像帧对应的第二候选处理节点。
7.一种多媒体资源处理装置,其特征在于,所述装置包括:
第一展示模块,被配置为执行响应于多媒体资源处理指令,在多媒体资源处理页面展示待处理的多媒体资源;
第二展示模块,被配置为执行在所述多媒体资源处理页面的处理节点提示区域,展示所述多媒体资源的候选处理节点信息;所述候选处理节点信息表征通过对所述多媒体资源的至少一种媒体元素进行识别处理得到的至少一个候选处理节点;
处理模块,被配置为执行响应于基于所述候选处理节点信息对所述多媒体资源执行的处理操作,得到目标多媒体资源。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的一种多媒体资源处理方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至6中任一项所述的一种多媒体资源处理方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至6中任一项所述的一种多媒体资源处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210271574.7A CN114817585A (zh) | 2022-03-18 | 2022-03-18 | 多媒体资源处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210271574.7A CN114817585A (zh) | 2022-03-18 | 2022-03-18 | 多媒体资源处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114817585A true CN114817585A (zh) | 2022-07-29 |
Family
ID=82530131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210271574.7A Pending CN114817585A (zh) | 2022-03-18 | 2022-03-18 | 多媒体资源处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114817585A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116506691A (zh) * | 2023-06-14 | 2023-07-28 | 北京达佳互联信息技术有限公司 | 多媒体资源的处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-03-18 CN CN202210271574.7A patent/CN114817585A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116506691A (zh) * | 2023-06-14 | 2023-07-28 | 北京达佳互联信息技术有限公司 | 多媒体资源的处理方法、装置、电子设备及存储介质 |
CN116506691B (zh) * | 2023-06-14 | 2023-10-27 | 北京达佳互联信息技术有限公司 | 多媒体资源的处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140164900A1 (en) | Appending content with annotation | |
CN117668402A (zh) | 用于将布局应用于文档的系统和方法 | |
CN111666740A (zh) | 流程图生成方法、装置、计算机设备和存储介质 | |
CN114766093A (zh) | 一种录屏方法、装置及计算机可读存储介质 | |
CN114924815B (zh) | 页面渲染方法、装置、电子设备及存储介质 | |
CN114817585A (zh) | 多媒体资源处理方法、装置、电子设备及存储介质 | |
CN111739136B (zh) | 渲染方法、计算机设备和存储介质 | |
CN110659435A (zh) | 页面数据采集处理方法、装置、计算机设备和存储介质 | |
CN111428464A (zh) | 报告文件生成方法、装置、计算机设备和存储介质 | |
CN109213668B (zh) | 操作记录方法、装置及终端 | |
CN113722638B (zh) | 页面展示方法、装置、电子设备及存储介质 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN113992784B (zh) | 音视频通话方法、装置、计算机设备和存储介质 | |
CN113438532B (zh) | 视频处理、视频播放方法、装置、电子设备及存储介质 | |
CN114157881A (zh) | 多媒体处理方法、装置、电子设备及存储介质 | |
CN114428899A (zh) | 多媒体资源推送方法、装置、电子设备及存储介质 | |
CN115019231A (zh) | 视频帧识别方法、装置、电子设备及存储介质 | |
CN113868516A (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN110222290B (zh) | 页面生成方法、装置、计算机设备和存储介质 | |
Krieter | Looking inside-mobile screen recordings as a privacy friendly long-term data source to analyze user behavior | |
CN110958172B (zh) | 一种用于推荐好友的方法、设备和计算机存储介质 | |
CN114862996A (zh) | 动画渲染方法、装置、电子设备及存储介质 | |
CN118075561A (zh) | 一种视频编辑方法及设备 | |
CN115714707A (zh) | 一种基于页面引擎的数据提取方法及系统 | |
CN114861094A (zh) | 天气信息展示方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |