CN110149551A - 媒体文件播放方法和装置、存储介质及电子装置 - Google Patents

媒体文件播放方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN110149551A
CN110149551A CN201811313939.8A CN201811313939A CN110149551A CN 110149551 A CN110149551 A CN 110149551A CN 201811313939 A CN201811313939 A CN 201811313939A CN 110149551 A CN110149551 A CN 110149551A
Authority
CN
China
Prior art keywords
frame picture
terminal
mentioned
filter array
media file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811313939.8A
Other languages
English (en)
Other versions
CN110149551B (zh
Inventor
刘玉杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811313939.8A priority Critical patent/CN110149551B/zh
Publication of CN110149551A publication Critical patent/CN110149551A/zh
Application granted granted Critical
Publication of CN110149551B publication Critical patent/CN110149551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种媒体文件播放方法和装置、存储介质及电子装置。其中,该方法包括:对从待播放的媒体文件中提取出的帧画面进行场景识别;在帧画面中识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵,其中,滤镜矩阵用于确定与关键场景对应的滤镜效果;利用滤镜矩阵确定与帧画面对应的目标纹理特征;按照目标纹理特征绘制帧画面,以播放具有滤镜效果的媒体文件。本发明解决了相关技术中对视频的处理效率低、灵活性差的技术问题。

Description

媒体文件播放方法和装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种媒体文件播放方法和装置、存储介质及电子装置。
背景技术
为了使媒体文件在播放过程中可以呈现出各种特殊的显示效果,用户常常会在其播放之前,为其配置不同的滤镜效果。目前,常用的配置方式是由用户直接从滤镜效果备选栏中手动选择一种滤镜效果,并将该滤镜效果以附加图层的形式叠加在视频文件的原画面上,从而使媒体文件在播放时呈现出所选中的滤镜效果。
然而,相关技术所提供的上述方式往往需要用户手动配置滤镜效果。也就是说,若要确定与媒体文件相适配的滤镜效果,则需用户多次重复手动配置操作,操作复杂度增加,从而导致媒体文件出现严重的播放延迟的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种媒体文件播放方法和装置、存储介质及电子装置,以至少解决相关技术中对视频的处理效率低、灵活性差的技术问题。
根据本发明实施例的一个方面,提供了一种媒体文件播放方法,包括:对从待播放的媒体文件中提取出的帧画面进行场景识别;在上述帧画面中识别出关键场景的情况下,获取与上述关键场景相匹配的滤镜矩阵,其中,上述滤镜矩阵用于确定与上述关键场景对应的滤镜效果;利用上述滤镜矩阵确定与上述帧画面对应的目标纹理特征;按照上述目标纹理特征绘制上述帧画面,以播放具有上述滤镜效果的上述媒体文件。
根据本发明实施例的另一方面,还提供了一种媒体文件播放装置,包括:识别单元,用于对从待播放的媒体文件中提取出的帧画面进行场景识别;获取单元,用于在上述帧画面中识别出关键场景的情况下,获取与上述关键场景相匹配的滤镜矩阵,其中,上述滤镜矩阵用于确定与上述关键场景对应的滤镜效果;确定单元,用于利用上述滤镜矩阵确定与上述帧画面对应的目标纹理特征;播放单元,用于按照上述目标纹理特征绘制上述帧画面,以播放具有上述滤镜效果的上述媒体文件。
作为一种可选的示例,上述识别模块包括:输入子模块,用于将上述帧画面输入对象识别模型中,其中,上述对象识别模型用于利用从上述帧画面中提取的画面特征进行对象识别,上述对象识别模型为利用多个样本图片进行机器训练后得到。
作为一种可选的示例,上述识别模块包括:第一获取子模块,用于获取上述媒体文件中连续多帧的帧画面;提取子模块,用于从上述连续多帧的帧画面中提取对象特征;识别子模块,用于根据上述对象特征进行对象识别。
作为一种可选的示例,上述提取子模块还用于执行以下至少之一的步骤:提取上述连续多帧的帧画面中所包含的对象的移动轨迹,其中,上述对象特征包括上述移动轨迹;提取上述连续多帧的帧画面中所包含的对象的轮廓变化,其中,上述对象特征包括上述轮廓变化;提取上述连续多帧的帧画面中所包含的对象的运动频率,其中,上述对象特征包括上述运动频率。
作为一种可选的示例,上述确定模块包括:第二获取子模块,用于获取上述目标对象的对象属性信息,其中,上述对象属性信息包括:上述目标对象在上述帧画面中的位置、上述目标对象的分类标签;确定子模块,用于根据上述对象属性信息确定上述关键场景。
作为一种可选的示例,上述处理模块包括:处理子模块,用于对上述源纹理特征与上述滤镜矩阵进行正交变换,得到上述目标纹理特征,其中,上述目标纹理特征用于指示具有上述滤镜效果的上述帧画面中每个像素点的颜色和透明度。
根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述媒体文件播放方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的媒体文件播放方法。
在本发明实施例中,采用了对待播放的媒体文件中提取出的帧画面进行场景识别,在识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵,并根据滤镜矩阵确定的目标纹理特征绘制上述提取出的帧画面的方法。在上述方法中,在播放媒体文件的过程中,由于对提取出的帧画面进行了场景识别,并根据识别出的关键场景获取滤镜矩阵。也就是说,在上述方法中,可以根据媒体文件中的关键场景确定滤镜矩阵,以决定使用何种目标纹理特征对提取出的帧画面进行绘制,从而实现按照该目标纹理特征来对提取出的帧画面进行绘制,以播放具有上述滤镜矩阵所确定出的滤镜效果的媒体文件。在提高为媒体文件配置滤镜效果的效率的同时,也提高了滤镜效果配置的灵活性,并解决了相关技术中对视频的处理效率低、灵活性差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的媒体文件播放方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的媒体文件播放方法的流程示意图;
图3是根据本发明实施例的一种可选的媒体文件播放方法的示意图;
图4是根据本发明实施例的另一种可选的媒体文件播放方法的示意图;
图5是根据本发明实施例的又一种可选的媒体文件播放方法的示意图;
图6是根据本发明实施例的又一种可选的媒体文件播放方法的示意图;
图7是根据本发明实施例的又一种可选的媒体文件播放方法的示意图;
图8是根据本发明实施例的一种可选的媒体文件播放装置的结构示意图;
图9是根据本发明实施例的另一种可选的媒体文件播放装置的结构示意图;
图10是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种媒体文件播放方法。可选地,作为一种可选的实施方式,上述媒体文件播放方法可以但不限于应用于如图1所示的网络环境中。用户102与终端104之间可以进行人机交互。终端104中包括存储器106,用于缓存待播放的媒体文件,以及处理器108,用于提取媒体文件中的帧画面并进行场景识别。服务器112通过网络110执行步骤S102向终端104传输待播放的媒体文件。服务器112中包含有数据库114,用于存储待播放媒体文件以及传输引擎116,用于将待播放媒体文件传输给终端104。终端104在接收到服务器112所发送的待播放媒体文件之后,对从待播放的媒体文件中提取出的帧画面进行场景识别;在帧画面中识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵;利用滤镜矩阵确定与帧画面对应的目标纹理特征;按照目标纹理特征绘制帧画面,以播放具有滤镜效果的媒体文件。
需要说明的是,相关技术中,为了在播放媒体文件的过程中呈现一种指定的滤镜效果,通常是由用户直接从滤镜效果备选栏中手动选中上述指定的滤镜效果。其中,上述滤镜效果备选栏中的多个滤镜效果都是在播放之前预先配置的。然而,上述配置滤镜效果的方式中需要依赖用户手动操作,而且一次手动操作只能选择一种滤镜效果,从而使得在对媒体文件配置滤镜效果时,会出现配置效率较低,配置灵活性较差的问题。而在本实施例中,在播放媒体文件的过程中,通过对媒体文件中提取出的帧画面进行关键场景的场景识别,利用与识别出的关键场景相匹配的滤镜矩阵,来快速确定出与提取出的帧画面对应的目标纹理特征,从而实现按照该目标纹理特征来对提取出的帧画面进行绘制,以播放具有上述滤镜矩阵所确定出的滤镜效果的媒体文件。从而在提高为媒体文件配置滤镜效果的效率的同时,也提高了滤镜效果配置的灵活性。
可选地,上述终端104可以但不限于为可以计算数据的终端设备,例如手机、平板电脑、笔记本电脑、PC机等终端上。此外,通过上述终端104实现上述媒体文件播放方法是一种示例,实现上述执行操作的执行主体还可以包括但不限于业务服务器或其他处理设备,该业务服务器或其他处理设备中配置有与上述终端104具备相同功能的存储器和处理器,以实现上述步骤的。
可选地,上述网络110可以包括但不限于有线网络。其中,上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器112可以包括但不限于任何具有较大处理计算能力的硬件设备。
可选地,作为一种可选的实施方式,如图2所示,上述媒体文件播放方法包括:
S202,终端对从待播放的媒体文件中提取出的帧画面进行场景识别;
S204,在帧画面中识别出关键场景的情况下,终端获取与关键场景相匹配的滤镜矩阵,其中,滤镜矩阵用于确定与关键场景对应的滤镜效果;
S206,终端利用滤镜矩阵确定与帧画面对应的目标纹理特征;
S208,终端按照目标纹理特征绘制帧画面,以播放具有滤镜效果的媒体文件。
可选地,上述媒体文件播放方法可以但不限于应用于终端所安装的播放客户端中,其中,该播放客户端可以包括但不限于直播客户端、视频播放客户端、音频播放客户端等其他用于播放媒体文件的客户端。
上述仅是一种示例,本实施例中对此不做任何限定。上述播放客户端可以通过调用终端中的存储器获取服务器所发送的待播放的媒体文件,利用终端屏幕接口与用户之间实现人机交互,以获取控制操作指令,来为当前所要播放的媒体文件配置滤镜效果。例如,通过对直播客户端中主播所播放的画面进行场景识别,以为识别出的关键场景准确配置对应的滤镜效果,从而实现通过播放客户端的控制在终端屏幕中快速高效地呈现出配置有滤镜效果的播放画面。
可选地,在本实施例中,在播放媒体文件的过程中,由于终端对提取出的帧画面进行了场景识别,并根据识别出的关键场景获取滤镜矩阵。也就是说,在上述方法中,终端可以根据媒体文件中的关键场景确定滤镜矩阵,以决定使用何种目标纹理特征对提取出的帧画面进行绘制,从而提高了对媒体文件中的帧画面进行绘制的绘制灵活性,同时由于终端自动对帧画面进行了场景识别并确定滤镜矩阵,进而提高了对媒体文件进行处理的处理效率。
可选地,上述终端从待播放的媒体文件中提取出帧画面可以但不限于为,终端从待播放的媒体文件中提取出每一帧图像,将每一帧图像分别作为上述帧画面进行场景识别。
可选地,在终端提取出上述每一帧画面后,对上述帧画面中进行对象识别,在识别出目标对象的情况下,终端根据上述目标对象确定关键场景。
可选地,上述在帧画面中进行对象识别包括:终端将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,对象识别模型为利用多个样本图片进行机器训练后得到。
例如,以上述目标对象为红花为例,在提取出帧画面后,帧画面中包含有红花的图像。将上述帧画面输入到训练好的对象识别模型中,并通过对象识别模型对上述帧画面进行识别,识别到上述帧画面中包含有红花的图像。从而可以根据帧画面中所包含的红花确定关键场景。
可选地,在提取到目标对象之后,终端根据目标对象确定关键场景包括:终端获取目标对象的对象属性信息,其中,对象属性信息可以包括但不限于:目标对象在帧画面中的位置、目标对象的分类标签;根据对象属性信息确定关键场景。
可选地,可以但不限于将目标对象划分为不同的类别,每一个类别对应一个分类标签。
可选地,上述类别可以但不限于为预先设定的类别。例如,可以按照颜色、形状、特性等目标对象的任意一种或者多种特征进行类别的划分。例如,类别可以划分为植物、动物、自然现象、地理位置、纹理效果、非生命物品等。在识别出目标对象后,根据目标对象所归属的类别和目标对象在帧画面中的位置来确定关键场景。
可选地,可以但不限于以帧画面为平面建立平面直角坐标系,则帧画面中的目标对象在平面直角坐标系中对应有坐标,通过获取坐标从而获取目标对象在帧画面中的位置。
例如,结合图3进行说明。如图3所示,图3包括图3a、图3b、图3c,图3a为媒体文件的播放界面。从媒体文件中提取出帧画面,图3b为一个可选的帧画面,帧画面中包含有目标对象302与目标对象304。如图3c所示,以目标对象302为例,以帧画面为平面建立平面直角坐标系,平面直角坐标系包含x轴与y轴,则目标对象302在平面直角坐标系中对应一个坐标。使用上述坐标表示目标对象302在帧画面中的位置。
可选地,上述目标对象的坐标可以但不限于为目标对象中心点的坐标。或者上述目标对象的坐标可以但不限于为目标对象最左侧、最右侧、最上边、最下边的点的坐标。
例如,以上述目标对象的坐标为目标对象最左侧、最右侧、最上边、最下边的点的坐标为例,如图4所示,图4包括图4a与图4b。图4a为一张可选的帧画面,获取图4a中的目标对象402的位置坐标,则如图4b所示,获取目标对象402的最上方、最下方、最左侧、最右侧的四个点在x轴与y轴上的坐标,使用上述四个点的坐标表示目标对象402在帧画面中的位置。
可选地,在终端识别出的目标对象存在多个的情况下,可以但不限于确定出每一个目标对象的位置与目标对象的分类标签,并根据每一个目标对象的位置与每一个目标对象的分类标签确定出关键场景。
例如,帧画面中存在多个目标对象,则确定出每一个目标对象的分类标签与每一个目标对象的位置,并根据每一个目标对象的分类标签和位置确定出关键场景。
可选地,在帧画面中进行对象识别还可以包括:获取媒体文件中的连续多帧的帧画面,从连续多帧的帧画面中提取对象特征,根据对象特征进行对象识别。
例如,以上述目标对象为飞机为例,飞机在视频中并不是静止不动的。在多帧视频中,飞机的位置与形态都发生了变化。因此,需要获取飞机所在的多帧图像,并从多帧图像中提取对象特征,根据对象特征对多帧图像进行识别。
如图5所示,图5包含有图5a、图5b、图5c、图5d。图5a、图5b、图5c、图5d中包含有帧画面502、帧画面504、帧画面506与帧画面508,帧画面502、帧画面504、帧画面506与帧画面508为从媒体文件中提取出的连续多帧帧画面,在每一个帧画面中飞机的位置与形态都发生了变化。因此,从多帧图像中提取出对象特征进行对象识别更加准确。
可选地,上述终端从连续多帧的帧画面中提取特征对象包括以下至少之一:
(1)终端提取连续多帧的帧画面中所包含的对象的移动轨迹,其中,对象特征包括移动轨迹;
(2)终端提取连续多帧的帧画面中所包含的对象的轮廓变化,其中,对象特征包括轮廓变化;
(3)终端提取连续多帧的帧画面中所包含的对象的运动频率,其中,对象特征包括运动频率。
可选地,上述终端利用滤镜矩阵确定与帧画面对应的目标纹理特征包括:生成帧画面的源纹理特征,其中,源纹理特征用于指示帧画面中每个像素点的原始颜色和原始透明度;终端利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征。
可选地,上述终端利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征包括:终端对源纹理特征与滤镜矩阵进行正交变换,得到目标纹理特征,其中,目标纹理特征用于指示具有滤镜效果的帧画面中每个像素点的颜色和透明度。
可选地,上述滤镜矩阵可以但不限于存储在场景库中。终端在获取到关键场景后,根据关键场景的场景标识,从场景库中查找到与关键场景的场景标识匹配的滤镜矩阵。
例如,结合图6对上述媒体文件播放方法进行说明。如图6所示,用户602在终端604上观看视频的时候,终端604通过步骤S602提取视频中的帧画面606。例如,帧画面606中包含有飞机的坐标与形态。终端604通过步骤S604对提取出的帧画面606进行识别,识别出帧画面606中的飞机的坐标与分类标签,根据上述坐标与分类标签确定出关键场景,从场景库610中获取到确定出的关键场景,并通过步骤S606获取与关键场景相匹配的滤镜矩阵608,并根据滤镜矩阵608获取到的目标纹理特征对帧画面606进行绘制。终端604通过步骤S608播放具有滤镜效果的媒体文件。
通过本实施例,通过使用在识别出关键场景的情况下,终端获取与关键场景相匹配的滤镜矩阵,并根据滤镜矩阵确定的目标纹理特征绘制上述提取出的帧画面的方法。在上述方法中,在播放媒体文件的过程中,由于对提取出的帧画面进行了场景识别,并根据识别出的关键场景获取滤镜矩阵。也就是说,在上述方法中,终端可以根据媒体文件中的关键场景确定滤镜矩阵,以决定使用何种目标纹理特征对提取出的帧画面进行绘制,从而提高了对媒体文件中的帧画面进行绘制的绘制灵活性。
作为一种可选的实施方案,终端对从待播放的媒体文件中提取出的帧画面进行场景识别包括:
S1,终端在帧画面中进行对象识别;
S2,在帧画面中识别出目标对象的情况下,终端根据目标对象确定关键场景。
可选地,上述终端从待播放的媒体文件中提取出帧画面可以但不限于为,终端从待播放的媒体文件中提取出每一帧图像,将每一帧图像分别作为上述帧画面进行场景识别。
可选地,终端在提取出上述每一帧画面后,在上述帧画面中进行对象识别,在识别出目标对象的情况下,终端根据上述目标对象确定关键场景。
例如,以上述目标对象为猫为例,在提取出帧画面后,帧画面中包含有猫的图像。将上述帧画面输入到训练好的对象识别模型中,并通过对象识别模型对上述帧画面进行识别,识别到上述帧画面中包含有猫的图像。从而可以根据猫的图像确定关键场景。
通过本实施例,通过终端在帧画面中进行对象识别;在帧画面中识别出目标对象的情况下,终端根据目标对象确定关键场景,从而可以根据帧画面中的对象确定关键场景,进而可以使得到的滤镜效果是与帧画面中的目标对象相关联的。从而使为媒体文件添加的滤镜效果更灵活。
作为一种可选的实施方案,终端在帧画面中进行对象识别包括:
S1,终端将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,对象识别模型为利用多个样本图片进行机器训练后得到。
可选地,上述对象识别模型可以但不限于为智能学习模型。通过输入大量的样本数据对智能学习模型进行训练,得到一个成熟的智能学习模型,从而在获取到帧画面后,将获取到的帧画面输入到智能学习模型中,通过智能学习模型识别帧画面中的对象,并根据对象确定关键场景。
通过本实施例,通过在获取到帧画面之后,终端将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,从而可以保证识别过程的准确与高效,提高了对帧画面进行识别的识别效率。
作为一种可选的实施方案,终端在帧画面中进行对象识别包括:
S1,终端获取媒体文件中连续多帧的帧画面;
S2,终端从连续多帧的帧画面中提取对象特征;
S3,终端根据对象特征进行对象识别。
可选地,上述获取媒体文件中的连续多帧的帧画面可以但不限于在获取帧画面中的一个对象所存在的连续多帧的帧画面。
例如,媒体文件中在第3帧到第7帧中出现了一只猫,则将第3帧到第7帧的媒体文件提取出来,作为帧画面。
例如,以上述目标对象为飞机为例,飞机在视频中并不是静止不动的。在多帧视频中,飞机的位置与形态都发生了变化。因此,需要获取飞机所在的多帧图像,并从多帧图像中提取对象特征,根据对象特征对多帧图像进行识别。
如图5所示,图5包含有图5a、图5b、图5c、图5d。图5a、图5b、图5c、图5d中包含有帧画面502、帧画面504、帧画面506与帧画面508,帧画面502、帧画面504、帧画面506与帧画面508为从媒体文件中提取出的连续多帧帧画面,在每一个帧画面中飞机的位置与形态都发生了变化。因此,从多帧图像中提取出对象特征进行对象识别更加准确。
通过本实施例,通过在获取帧画面时,获取媒体文件中的连续多帧的帧画面,并从连续多帧的帧画面中提取对象特征,从而在提高为媒体文件配置滤镜效果的效率的同时,也提高了滤镜效果配置的灵活性。
作为一种可选的实施方案,终端从连续多帧的帧画面中提取对象特征包括以下至少之一:
(1)终端提取连续多帧的帧画面中所包含的对象的移动轨迹,其中,对象特征包括移动轨迹。
例如,可以但不限于基于光流法或者高斯分布的方法对帧画面中的前景与背景进行分离,并根据分离后的画面得到提取对象。
(2)终端提取连续多帧的帧画面中所包含的对象的轮廓变化,其中,对象特征包括轮廓变化。
例如,以获取到的多帧图像中包含一只鸟为例,在获取到上述多帧图像后,上述多帧图像中的鸟有不同的形态,用于表示鸟所发生的行为变化。此时,通过鸟的行为的动静变化,获取到鸟的轮廓的变化,从而提取出目标对象为鸟。
(3)终端提取连续多帧的帧画面中所包含的对象的运动频率,其中,对象特征包括运动频率。
例如,继续以上述获取到多帧图像中包含一只鸟为例,由于不同的鸟的运动频率不同,例如,扇翅膀的频率不同,则根据不同的频率,确定出鸟的品种。
通过本实施例,通过上述方法终端获取到多帧的帧画面中的对象的移动轨迹、轮廓变化、运动频率,从而识别出目标对象,从而提高了识别目标对象的识别准确率。
作为一种可选的实施方案,终端根据目标对象确定关键场景包括:
S1,终端获取目标对象的对象属性信息,其中,对象属性信息包括:目标对象在帧画面中的位置、目标对象的分类标签;
S2,终端根据对象属性信息确定关键场景。
可选地,可以但不限于将目标对象划分为不同的类别,每一个类别对应一个分类标签。
可选地,上述类别可以但不限于为预先设定的类别。例如,可以按照颜色、形状、特性等目标对象的任意一种或者多种特征进行类别的划分。例如,类别可以划分为植物、动物、自然现象、地理位置、纹理效果、非生命物品等。在识别出目标对象后,根据目标对象根据目标对象所属的类别和目标对象在帧画面中的位置来确定关键场景。
可选地,可以但不限于以帧画面为平面建立平面直角坐标系,则帧画面中的目标对象在平面直角坐标系中对应有坐标,通过获取坐标从而获取目标对象在帧画面中的位置。
例如,结合图3进行说明。如图3所示,图3包括图3a、图3b、图3c,图3a为媒体文件的播放界面。从媒体文件中提取出帧画面,图3b为一个可选的帧画面,帧画面中包含有目标对象302与目标对象304。如图3c所示,以目标对象302为例,以帧画面为平面建立平面直角坐标系,平面直角坐标系包含x轴与y轴,则目标对象302在平面直角坐标系中对应一个坐标。使用上述坐标表示目标对象302在帧画面中的位置。
可选地,上述目标对象的坐标可以但不限于为目标对象中心点的坐标。或者上述目标对象的坐标可以但不限于为目标对象最左侧、最右侧、最上边、最下边的点的坐标。
例如,以上述目标对象的坐标为目标对象最左侧、最右侧、最上边、最下边的点的坐标为例,如图4所示,图4包括图4a与图4b。图4a为一张可选的帧画面,获取图4a中的目标对象402的位置坐标,则如图4b所示,获取目标对象402的最上方、最下方、最左侧、最右侧的四个点在x轴与y轴上的坐标,使用上述四个点的坐标表示目标对象402在帧画面中的位置。
通过本实施例,通过终端获取目标对象的对象属性信息,并根据上述对象属性信息确定关键场景,从而可以根据目标对象位于帧画面中的位置与目标对象的分类标签确定出关键场景,提高了确定关键场景的确定效率。
作为一种可选的实施方案,终端利用滤镜矩阵确定与帧画面对应的目标纹理特征包括:
S1,终端生成帧画面的源纹理特征,其中,源纹理特征用于指示帧画面中每个像素点的原始颜色和原始透明度;
S2,终端利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征。
例如,如图7所示,终端通过步骤S702提取帧画面,在提取到帧画面之后,终端通过步骤S704获取帧画面中的每一个像素的原始颜色和原始透明度,从而得到源纹理特征,然后,终端通过步骤S706对每一个像素的原始颜色与原始透明度进行变换处理,并通过步骤S708确定出目标纹理特征,以及通过步骤S710将目标纹理特征绘制到屏幕的帧画面中。由于目标纹理特征中的像素已经经过了转化,因此在对帧画面进行绘制后实现了对原始帧画面添加滤镜的效果。
通过本实施例,通过获取帧画面的源纹理特征,并利用滤镜矩阵对源纹理特征进行变换处理,进而得到目标纹理特征,并使用目标纹理特征,并使用目标纹理特征控制帧画面的播放,从而提高了对帧画面配置滤镜效果的效率,同时提高了滤镜效果配置的灵活性。
作为一种可选的实施方案,终端利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征包括:
S1,终端对源纹理特征与滤镜矩阵进行正交变换,得到目标纹理特征,其中,目标纹理特征用于指示具有滤镜效果的帧画面中每个像素点的颜色和透明度。
可选地,在获取到每一个像素点的颜色与透明度后,可以但不限于根据所有限速点的排列,得到画面帧的源纹理特征,并得到源纹理特征矩阵。在获取到滤镜效果后,根据滤镜效果矩阵对源纹理特征矩阵进行正交变换,得到目标纹理特征矩阵,并根据目标纹理特征矩阵得到目标纹理特征。
通过本实施例,通过上述方法获取到目标纹理特征,从而提高了对帧画面配置滤镜效果的效率,同时提高了滤镜效果配置的灵活性。
作为一种可选的实施方案,终端获取与关键场景相匹配的滤镜矩阵包括:
S1,终端在场景库中查找与关键场景的场景标识对应的滤镜矩阵;
S2,在查找到滤镜矩阵的情况下,终端获取滤镜矩阵。
可选地,可以但不限于在场景库中预存滤镜矩阵,从而在获取到关键场景后,根据关键场景的标识查找滤镜矩阵。
可选地,上述关键场景的标识可以但不限于通过字符标识。例如,以关键场景的标识为0001为例,在获取到上述关键场景的标识后,从场景库中查找上述标识对应的滤镜矩阵。
通过本实施例,通过采用关键场景的标识查找滤镜矩阵,从而提高了对帧画面配置滤镜效果的效率,同时提高了滤镜效果配置的灵活性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述媒体文件播放方法的媒体文件播放装置。如图8所示,该装置包括:
(1)识别单元802,用于对从待播放的媒体文件中提取出的帧画面进行场景识别;
(2)获取单元804,用于在帧画面中识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵,其中,滤镜矩阵用于确定与关键场景对应的滤镜效果;
(3)确定单元806,用于利用滤镜矩阵确定与帧画面对应的目标纹理特征;
(4)播放单元808,用于按照目标纹理特征绘制帧画面,以播放具有滤镜效果的媒体文件。
可选地,上述文件播放装置可以但不限于应用于图1所示的网络环境中,如应用于图1所示的终端104中,在接收到服务器112发送的媒体文件之后,对关键成精进行场景识别,并使用与识别出的关键场景对应的滤镜矩阵所确定出的目标纹理特征来绘制媒体文件中提取出的帧画面,从而实现快速高效地为媒体文件配置对应的滤镜效果,进而达到提高媒体文件的播放效率的效果。
可选地,上述媒体文件播放方法可以但不限于应用于终端所安装的播放客户端中,其中,该播放客户端可以包括但不限于直播客户端、视频播放客户端、音频播放客户端等其他用于播放媒体文件的客户端。
上述仅是一种示例,本实施例中对此不做任何限定。上述播放客户端可以通过调用终端中的存储器获取服务器所发送的待播放的媒体文件,利用终端屏幕接口与用户之间实现人机交互,以获取控制操作指令,来为当前所要播放的媒体文件配置滤镜效果。例如,通过对直播客户端中主播所播放的画面进行场景识别,以为识别出的关键场景准确配置对应的滤镜效果,从而实现通过播放客户端的控制在终端屏幕中快速高效地呈现出配置有滤镜效果的播放画面。
可选地,在本实施例中,在播放媒体文件的过程中,由于对提取出的帧画面进行了场景识别,并根据识别出的关键场景获取滤镜矩阵。也就是说,在上述方法中,可以根据媒体文件中的关键场景确定滤镜矩阵,以决定使用何种目标纹理特征对提取出的帧画面进行绘制,从而提高了对媒体文件中的帧画面进行绘制的绘制灵活性,同时由于自动对帧画面进行了场景识别并确定滤镜矩阵,进而提高了对媒体文件进行处理的处理效率。
可选地,上述从待播放的媒体文件中提取出帧画面可以但不限于为,从待播放的媒体文件中提取出每一帧图像,将每一帧图像分别作为上述帧画面进行场景识别。
可选地,在提取出上述每一帧画面后,对上述帧画面中进行对象识别,在识别出目标对象的情况下,根据上述目标对象确定关键场景。
可选地,上述在帧画面中进行对象识别包括:将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,对象识别模型为利用多个样本图片进行机器训练后得到。
例如,以上述目标对象为红花为例,在提取出帧画面后,帧画面中包含有红花的图像。将上述帧画面输入到训练好的对象识别模型中,并通过对象识别模型对上述帧画面进行识别,识别到上述帧画面中包含有红花的图像。从而可以根据帧画面中所包含的红花确定关键场景。
可选地,在提取到目标对象之后,根据目标对象确定关键场景包括:获取目标对象的对象属性信息,其中,对象属性信息可以包括但不限于:目标对象在帧画面中的位置、目标对象的分类标签;根据对象属性信息确定关键场景。
可选地,可以但不限于将目标对象划分为不同的类别,每一个类别对应一个分类标签。
可选地,上述类别可以但不限于为预先设定的类别。例如,可以按照颜色、形状、特性等目标对象的任意一种或者多种特征进行类别的划分。例如,类别可以划分为植物、动物、自然现象、地理位置、纹理效果、非生命物品等。在识别出目标对象后,根据目标对象根据目标对象所属的类别和目标对象在帧画面中的位置来确定关键场景。
可选地,可以但不限于以帧画面为平面建立平面直角坐标系,则帧画面中的目标对象在平面直角坐标系中对应有坐标,通过获取坐标从而获取目标对象在帧画面中的位置。
例如,结合图3进行说明。如图3所示,图3包括图3a、图3b、图3c,图3a为媒体文件的播放界面。从媒体文件中提取出帧画面,图3b为一个可选的帧画面,帧画面中包含有目标对象302与目标对象304。如图3c所示,以目标对象302为例,以帧画面为平面建立平面直角坐标系,平面直角坐标系包含x轴与y轴,则目标对象302在平面直角坐标系中对应一个坐标。使用上述坐标表示目标对象302在帧画面中的位置。
可选地,上述目标对象的坐标可以但不限于为目标对象中心点的坐标。或者上述目标对象的坐标可以但不限于为目标对象最左侧、最右侧、最上边、最下边的点的坐标。
例如,以上述目标对象的坐标为目标对象最左侧、最右侧、最上边、最下边的点的坐标为例,如图4所示,图4包括图4a与图4b。图4a为一张可选的帧画面,获取图4a中的目标对象402的位置坐标,则如图4b所示,获取目标对象402的最上方、最下方、最左侧、最右侧的四个点在x轴与y轴上的坐标,使用上述四个点的坐标表示目标对象402在帧画面中的位置。
可选地,在帧画面中进行对象识别还可以包括:获取媒体文件中的连续多帧的帧画面,从连续多帧的帧画面中提取对象特征,根据对象特征进行对象识别。
例如,以上述目标对象为飞机为例,飞机在视频中并不是静止不动的。在多帧视频中,飞机的位置与形态都发生了变化。因此,需要获取飞机所在的多帧图像,并从多帧图像中提取对象特征,根据对象特征对多帧图像进行识别。
如图5所示,图5包含有图5a、图5b、图5c、图5d。图5a、图5b、图5c、图5d中包含有帧画面502、帧画面504、帧画面506与帧画面508,帧画面502、帧画面504、帧画面506与帧画面508为从媒体文件中提取出的连续多帧帧画面,在每一个帧画面中飞机的位置与形态都发生了变化。因此,从多帧图像中提取出对象特征进行对象识别更加准确。
可选地,上述从连续多帧的帧画面中提取特征对象包括以下至少之一:
(1)提取连续多帧的帧画面中所包含的对象的移动轨迹,其中,对象特征包括移动轨迹;
(2)提取连续多帧的帧画面中所包含的对象的轮廓变化,其中,对象特征包括轮廓变化;
(3)提取连续多帧的帧画面中所包含的对象的运动频率,其中,对象特征包括运动频率。
可选地,上述利用滤镜矩阵确定与帧画面对应的目标纹理特征包括:生成帧画面的源纹理特征,其中,源纹理特征用于指示帧画面中每个像素点的原始颜色和原始透明度;利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征。
可选地,上述利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征包括:对源纹理特征与滤镜矩阵进行正交变换,得到目标纹理特征,其中,目标纹理特征用于指示具有滤镜效果的帧画面中每个像素点的颜色和透明度。
可选地,上述滤镜矩阵可以但不限于存储在场景库中。在获取到关键场景后,根据关键场景的场景标识,从场景库中查找到与关键场景的场景标识匹配的滤镜矩阵。
例如,结合图6对上述媒体文件播放方法进行说明。如图6所示,用户602在终端604上观看视频的时候,终端604通过步骤S602提取视频中的帧画面606。例如,帧画面606中包含有飞机的坐标与形态。终端604通过步骤S604对提取出的帧画面606进行识别,识别出帧画面606中的飞机的坐标与分类标签,根据上述坐标与分类标签确定出关键场景,从场景库610中获取到确定出的关键场景,并通过步骤S606获取与关键场景相匹配的滤镜矩阵608,并根据滤镜矩阵608获取到的目标纹理特征对帧画面606进行绘制。终端604通过步骤S608播放具有滤镜效果的媒体文件。
通过本实施例,通过使用在识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵,并根据滤镜矩阵确定的目标纹理特征绘制上述提取出的帧画面的方法。在上述方法中,在播放媒体文件的过程中,由于对提取出的帧画面进行了场景识别,并根据识别出的关键场景获取滤镜矩阵。也就是说,在上述方法中,可以根据媒体文件中的关键场景确定滤镜矩阵,以决定使用何种目标纹理特征对提取出的帧画面进行绘制,从而提高了对媒体文件中的帧画面进行绘制的绘制灵活性。
作为一种可选的实施方案,如图9所示,上述识别单元802包括:
(1)识别模块902,用于在帧画面中进行对象识别;
(2)确定模块904,用于在帧画面中识别出目标对象的情况下,根据目标对象确定关键场景。
可选地,上述从待播放的媒体文件中提取出帧画面可以但不限于为,从待播放的媒体文件中提取出每一帧图像,将每一帧图像分别作为上述帧画面进行场景识别。
可选地,在提取出上述每一帧画面后,在上述帧画面中进行对象识别,在识别出目标对象的情况下,根据上述目标对象确定关键场景。
例如,以上述目标对象为猫为例,在提取出帧画面后,帧画面中包含有猫的图像。将上述帧画面输入到训练好的对象识别模型中,并通过对象识别模型对上述帧画面进行识别,识别到上述帧画面中包含有猫的图像。从而可以根据猫的图像确定关键场景。
通过本实施例,通过在帧画面中进行对象识别;在帧画面中识别出目标对象的情况下,根据目标对象确定关键场景,从而可以根据帧画面中的对象确定关键场景,进而可以使得到的滤镜效果是与帧画面中的目标对象相关联的。从而使为媒体文件添加的滤镜效果更灵活。
作为一种可选的实施方案,上述识别模块902包括:
(1)输入子模块,用于将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,对象识别模型为利用多个样本图片进行机器训练后得到。
可选地,上述对象识别模型可以但不限于为智能学习模型。通过输入大量的样本数据对智能学习模型进行训练,得到一个成熟的智能学习模型,从而在获取到帧画面后,将获取到的帧画面输入到智能学习模型中,通过智能学习模型识别帧画面中的对象,并根据对象确定关键场景。
通过本实施例,通过在获取到帧画面之后,将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,从而可以保证识别过程的准确与高效,提高了对帧画面进行识别的识别效率。
作为一种可选的实施方案,上述识别模块902包括:
(1)第一获取子模块,用于获取媒体文件中连续多帧的帧画面;
(2)提取子模块,用于从连续多帧的帧画面中提取对象特征;
(3)识别子模块,用于根据对象特征进行对象识别。
可选地,上述获取媒体文件中的连续多帧的帧画面可以但不限于在获取帧画面中的一个对象所存在的连续多帧的帧画面。
例如,媒体文件中在第3帧到第7帧中出现了一只猫,则将第3帧到第7帧的媒体文件提取出来,作为帧画面。
例如,以上述目标对象为飞机为例,飞机在视频中并不是静止不动的。在多帧视频中,飞机的位置与形态都发生了变化。因此,需要获取飞机所在的多帧图像,并从多帧图像中提取对象特征,根据对象特征对多帧图像进行识别。
如图5所示,图5包含有图5a、图5b、图5c、图5d。图5a、图5b、图5c、图5d中包含有帧画面502、帧画面504、帧画面506与帧画面508,帧画面502、帧画面504、帧画面506与帧画面508为从媒体文件中提取出的连续多帧帧画面,在每一个帧画面中飞机的位置与形态都发生了变化。因此,从多帧图像中提取出对象特征进行对象识别更加准确。
通过本实施例,通过在获取帧画面时,获取媒体文件中的连续多帧的帧画面,并从连续多帧的帧画面中提取对象特征,从而在提高为媒体文件配置滤镜效果的效率的同时,也提高了滤镜效果配置的灵活性。
作为一种可选的实施方案,上述提取子模块还用于执行以下至少之一的步骤:
(1)提取连续多帧的帧画面中所包含的对象的移动轨迹,其中,对象特征包括移动轨迹。
例如,可以但不限于基于光流法或者高斯分布的方法对帧画面中的前景与背景进行分离,并根据分离后的画面得到提取对象。
(2)提取连续多帧的帧画面中所包含的对象的轮廓变化,其中,对象特征包括轮廓变化。
例如,以获取到的多帧图像中包含一只鸟为例,在获取到上述多帧图像后,上述多帧图像中的鸟有不同的形态,用于表示鸟所发生的行为变化。此时,通过鸟的行为的动静变化,获取到鸟的轮廓的变化,从而提取出目标对象为鸟。
(3)提取连续多帧的帧画面中所包含的对象的运动频率,其中,对象特征包括运动频率。
例如,继续以上述获取到多帧图像中包含一只鸟为例,由于不同的鸟的运动频率不同,例如,扇翅膀的频率不同,则根据不同的频率,确定出鸟的品种。
通过本实施例,通过上述方法获取到多帧的帧画面中的对象的移动轨迹、轮廓变化、运动频率,从而识别出目标对象,从而提高了识别目标对象的识别准确率。
作为一种可选的实施方案,上述确定模块904包括:
(1)第二获取子模块,用于获取目标对象的对象属性信息,其中,对象属性信息包括:目标对象在帧画面中的位置、目标对象的分类标签;
(2)确定子模块,用于根据对象属性信息确定关键场景。
可选地,可以但不限于将目标对象划分为不同的类别,每一个类别对应一个分类标签。
可选地,上述类别可以但不限于为预先设定的类别。例如,可以按照颜色、形状、特性等目标对象的任意一种或者多种特征进行类别的划分。例如,类别可以划分为植物、动物、自然现象、地理位置、纹理效果、非生命物品等。在识别出目标对象后,根据目标对象根据目标对象所属的类别和目标对象在帧画面中的位置来确定关键场景。
可选地,可以但不限于以帧画面为平面建立平面直角坐标系,则帧画面中的目标对象在平面直角坐标系中对应有坐标,通过获取坐标从而获取目标对象在帧画面中的位置。
例如,结合图3进行说明。如图3所示,图3包括图3a、图3b、图3c,图3a为媒体文件的播放界面。从媒体文件中提取出帧画面,图3b为一个可选的帧画面,帧画面中包含有目标对象302与目标对象304。如图3c所示,以目标对象302为例,以帧画面为平面建立平面直角坐标系,平面直角坐标系包含x轴与y轴,则目标对象302在平面直角坐标系中对应一个坐标。使用上述坐标表示目标对象302在帧画面中的位置。
可选地,上述目标对象的坐标可以但不限于为目标对象中心点的坐标。或者上述目标对象的坐标可以但不限于为目标对象最左侧、最右侧、最上边、最下边的点的坐标。
例如,以上述目标对象的坐标为目标对象最左侧、最右侧、最上边、最下边的点的坐标为例,如图4所示,图4包括图4a与图4b。图4a为一张可选的帧画面,获取图4a中的目标对象402的位置坐标,则如图4b所示,获取目标对象402的最上方、最下方、最左侧、最右侧的四个点在x轴与y轴上的坐标,使用上述四个点的坐标表示目标对象402在帧画面中的位置。
通过本实施例,通过获取目标对象的对象属性信息,并根据上述对象属性信息确定关键场景,从而可以根据目标对象位于帧画面中的位置与目标对象的分类标签确定出关键场景,提高了确定关键场景的确定效率。
作为一种可选的实施方案,上述确定单元806包括:
(1)生成模块,用于生成帧画面的源纹理特征,其中,源纹理特征用于指示帧画面中每个像素点的原始颜色和原始透明度;
(2)处理模块,用于利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征。
例如,如图7所示,终端通过步骤S702提取帧画面,在提取到帧画面之后,终端通过步骤S704获取帧画面中的每一个像素的原始颜色和原始透明度,从而得到源纹理特征,然后,终端通过步骤S706对每一个像素的原始颜色与原始透明度进行变换处理,并通过步骤S708确定出目标纹理特征,以及通过步骤S710将目标纹理特征绘制到屏幕的帧画面中。由于目标纹理特征中的像素已经经过了转化,因此在对帧画面进行绘制后实现了对原始帧画面添加滤镜的效果。
通过本实施例,通过获取帧画面的源纹理特征,并利用滤镜矩阵对源纹理特征进行变换处理,进而得到目标纹理特征,并使用目标纹理特征,并使用目标纹理特征控制帧画面的播放,从而提高了对帧画面配置滤镜效果的效率,同时提高了滤镜效果配置的灵活性。
作为一种可选的实施方案,上述处理模块包括:
(1)处理子模块,用于对源纹理特征与滤镜矩阵进行正交变换,得到目标纹理特征,其中,目标纹理特征用于指示具有滤镜效果的帧画面中每个像素点的颜色和透明度。
可选地,在获取到每一个像素点的颜色与透明度后,可以但不限于根据所有限速点的排列,得到画面帧的源纹理特征,并得到源纹理特征矩阵。在获取到滤镜效果后,根据滤镜效果矩阵对源纹理特征矩阵进行正交变换,得到目标纹理特征矩阵,并根据目标纹理特征矩阵得到目标纹理特征。
通过本实施例,通过上述方法获取到目标纹理特征,从而提高了对帧画面配置滤镜效果的效率,同时提高了滤镜效果配置的灵活性。
作为一种可选的实施方案,上述获取单元804包括:
(1)查找模块,用于在场景库中查找与关键场景的场景标识对应的滤镜矩阵;
(2)获取模块,用于在查找到滤镜矩阵的情况下,获取滤镜矩阵。
可选地,可以但不限于在场景库中预存滤镜矩阵,从而在获取到关键场景后,根据关键场景的标识查找滤镜矩阵。
可选地,上述关键场景的标识可以但不限于通过字符标识。例如,以关键场景的标识为0001为例,在获取到上述关键场景的标识后,从场景库中查找上述标识对应的滤镜矩阵。
通过本实施例,通过采用关键场景的标识查找滤镜矩阵,从而提高了对帧画面配置滤镜效果的效率,同时提高了滤镜效果配置的灵活性。
需要说明的是,上述装置所包含的单元模块之间可以但不限于为耦合关系,例如,播放装置中的识别单元802、获取单元804、确定单元806及播放单元808相互耦合连接,用于标识的(1)、(2)、(3)、(4)等序号仅仅为了区分上述媒体文件播放装置中的不同的单元,并不对各个单元所要实现的功能步骤造成顺序限定。又例如,上述识别单元中的识别模块902与确定模块904二者之间相互耦合连接,用于标识的(1)、(2)等序号仅仅为了区分上述单元中的不同模块,不对模块中所要实现的功能步骤造成顺序限定。
根据本发明实施例的又一个方面,还提供了一种用于实施上述媒体文件播放方法的电子装置,如图10所示,该电子装置包括存储器1002和处理器1004,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,对从待播放的媒体文件中提取出的帧画面进行场景识别;
S2,在帧画面中识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵,其中,滤镜矩阵用于确定与关键场景对应的滤镜效果;
S3,利用滤镜矩阵确定与帧画面对应的目标纹理特征;
S4,按照目标纹理特征绘制帧画面,以播放具有滤镜效果的媒体文件。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的媒体文件播放方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的媒体文件播放方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储帧画面等信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述媒体文件播放装置中的识别单元802、获取单元804、确定单元806、播放单元808。此外,还可以包括但不限于上述媒体文件播放装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器1008,用于显示媒体文件;和连接总线1010,用于连接上述电子装置中的各个模块部件。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,对从待播放的媒体文件中提取出的帧画面进行场景识别;
S2,在帧画面中识别出关键场景的情况下,获取与关键场景相匹配的滤镜矩阵,其中,滤镜矩阵用于确定与关键场景对应的滤镜效果;
S3,利用滤镜矩阵确定与帧画面对应的目标纹理特征;
S4,按照目标纹理特征绘制帧画面,以播放具有滤镜效果的媒体文件。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在帧画面中进行对象识别;
S2,在帧画面中识别出目标对象的情况下,根据目标对象确定关键场景。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,将帧画面输入对象识别模型中,其中,对象识别模型用于利用从帧画面中提取的画面特征进行对象识别,对象识别模型为利用多个样本图片进行机器训练后得到。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取媒体文件中连续多帧的帧画面;
S2,从连续多帧的帧画面中提取对象特征;
S3,根据对象特征进行对象识别。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
(1)提取连续多帧的帧画面中所包含的对象的移动轨迹,其中,对象特征包括移动轨迹。
(2)提取连续多帧的帧画面中所包含的对象的轮廓变化,其中,对象特征包括轮廓变化。
(3)提取连续多帧的帧画面中所包含的对象的运动频率,其中,对象特征包括运动频率。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标对象的对象属性信息,其中,对象属性信息包括:目标对象在帧画面中的位置、目标对象的分类标签;
S2,根据对象属性信息确定关键场景。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,生成帧画面的源纹理特征,其中,源纹理特征用于指示帧画面中每个像素点的原始颜色和原始透明度;
S2,利用滤镜矩阵对源纹理特征进行变换处理,得到目标纹理特征。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,对源纹理特征与滤镜矩阵进行正交变换,得到目标纹理特征,其中,目标纹理特征用于指示具有滤镜效果的帧画面中每个像素点的颜色和透明度。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在场景库中查找与关键场景的场景标识对应的滤镜矩阵;
S2,在查找到滤镜矩阵的情况下,获取滤镜矩阵。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种媒体文件播放方法,其特征在于,包括:
终端对从待播放的媒体文件中提取出的帧画面进行场景识别;
在所述帧画面中识别出关键场景的情况下,所述终端获取与所述关键场景相匹配的滤镜矩阵,其中,所述滤镜矩阵用于确定与所述关键场景对应的滤镜效果;
所述终端利用所述滤镜矩阵确定与所述帧画面对应的目标纹理特征;
所述终端按照所述目标纹理特征绘制所述帧画面,以播放具有所述滤镜效果的所述媒体文件。
2.根据权利要求1所述的方法,其特征在于,所述终端对从待播放的媒体文件中提取出的帧画面进行场景识别包括:
所述终端在所述帧画面中进行对象识别;
在所述帧画面中识别出目标对象的情况下,所述终端根据所述目标对象确定所述关键场景。
3.根据权利要求2所述的方法,其特征在于,所述终端在所述帧画面中进行对象识别包括:
所述终端将所述帧画面输入对象识别模型中,其中,所述对象识别模型用于利用从所述帧画面中提取的画面特征进行对象识别,所述对象识别模型为利用多个样本图片进行机器训练后得到。
4.根据权利要求2所述的方法,其特征在于,所述终端在所述帧画面中进行对象识别包括:
所述终端获取所述媒体文件中连续多帧的帧画面;
所述终端从所述连续多帧的帧画面中提取对象特征;
所述终端根据所述对象特征进行对象识别。
5.根据权利要求4所述的方法,其特征在于,所述终端从所述连续多帧的帧画面中提取对象特征包括以下至少之一:
所述终端提取所述连续多帧的帧画面中所包含的对象的移动轨迹,其中,所述对象特征包括所述移动轨迹;
所述终端提取所述连续多帧的帧画面中所包含的对象的轮廓变化,其中,所述对象特征包括所述轮廓变化;
所述终端提取所述连续多帧的帧画面中所包含的对象的运动频率,其中,所述对象特征包括所述运动频率。
6.根据权利要求2所述的方法,其特征在于,所述终端根据所述目标对象确定所述关键场景包括:
所述终端获取所述目标对象的对象属性信息,其中,所述对象属性信息包括:所述目标对象在所述帧画面中的位置、所述目标对象的分类标签;
所述终端根据所述对象属性信息确定所述关键场景。
7.根据权利要求1所述的方法,其特征在于,所述终端利用所述滤镜矩阵确定与所述帧画面对应的目标纹理特征包括:
所述终端生成所述帧画面的源纹理特征,其中,所述源纹理特征用于指示所述帧画面中每个像素点的原始颜色和原始透明度;
所述终端利用所述滤镜矩阵对所述源纹理特征进行变换处理,得到所述目标纹理特征。
8.根据权利要求7所述的方法,其特征在于,所述终端利用所述滤镜矩阵对所述源纹理特征进行变换处理,得到所述目标纹理特征包括:
所述终端对所述源纹理特征与所述滤镜矩阵进行正交变换,得到所述目标纹理特征,其中,所述目标纹理特征用于指示具有所述滤镜效果的所述帧画面中每个像素点的颜色和透明度。
9.根据权利要求1所述的方法,其特征在于,所述终端获取与所述关键场景相匹配的滤镜矩阵包括:
所述终端在场景库中查找与所述关键场景的场景标识对应的所述滤镜矩阵;
在查找到所述滤镜矩阵的情况下,所述终端获取所述滤镜矩阵。
10.一种媒体文件播放装置,其特征在于,包括:
识别单元,用于对从待播放的媒体文件中提取出的帧画面进行场景识别;
获取单元,用于在所述帧画面中识别出关键场景的情况下,获取与所述关键场景相匹配的滤镜矩阵,其中,所述滤镜矩阵用于确定与所述关键场景对应的滤镜效果;
确定单元,用于利用所述滤镜矩阵确定与所述帧画面对应的目标纹理特征;
播放单元,用于按照所述目标纹理特征绘制所述帧画面,以播放具有所述滤镜效果的所述媒体文件。
11.根据权利要求10所述的装置,其特征在于,所述识别单元包括:
识别模块,用于在所述帧画面中进行对象识别;
确定模块,用于在所述帧画面中识别出目标对象的情况下,根据所述目标对象确定所述关键场景。
12.根据权利要求10所述的装置,其特征在于,所述确定单元包括:
生成模块,用于生成所述帧画面的源纹理特征,其中,所述源纹理特征用于指示所述帧画面中每个像素点的原始颜色和原始透明度;
处理模块,用于利用所述滤镜矩阵对所述源纹理特征进行变换处理,得到所述目标纹理特征。
13.根据权利要求10所述的装置,其特征在于,所述获取单元包括:
查找模块,用于在场景库中查找与所述关键场景的场景标识对应的所述滤镜矩阵;
获取模块,用于在查找到所述滤镜矩阵的情况下,获取所述滤镜矩阵。
14.一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至9任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至9任一项中所述的方法。
CN201811313939.8A 2018-11-06 2018-11-06 媒体文件播放方法和装置、存储介质及电子装置 Active CN110149551B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811313939.8A CN110149551B (zh) 2018-11-06 2018-11-06 媒体文件播放方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811313939.8A CN110149551B (zh) 2018-11-06 2018-11-06 媒体文件播放方法和装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN110149551A true CN110149551A (zh) 2019-08-20
CN110149551B CN110149551B (zh) 2022-02-22

Family

ID=67588416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811313939.8A Active CN110149551B (zh) 2018-11-06 2018-11-06 媒体文件播放方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN110149551B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110933489A (zh) * 2019-11-01 2020-03-27 青岛海尔多媒体有限公司 视频播放控制的方法及装置、视频播放设备
CN111107392A (zh) * 2019-12-31 2020-05-05 北京百度网讯科技有限公司 视频处理方法、装置和电子设备
CN111416950A (zh) * 2020-03-26 2020-07-14 腾讯科技(深圳)有限公司 视频处理方法、装置、存储介质及电子设备
CN113099295A (zh) * 2020-01-09 2021-07-09 袁芬 配乐音量自适应调节平台
CN113392238A (zh) * 2020-03-13 2021-09-14 北京字节跳动网络技术有限公司 媒体文件处理方法、装置、计算机可读介质和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160067886A (ko) * 2013-10-04 2016-06-14 퀄컴 인코포레이티드 오브젝트 검출 및 추적을 위한 맵 데이터의 동적 확장
CN106407984A (zh) * 2015-07-31 2017-02-15 腾讯科技(深圳)有限公司 目标对象识别方法及装置
CN106657810A (zh) * 2016-09-26 2017-05-10 维沃移动通信有限公司 一种视频图像的滤镜处理方法和装置
CN108537867A (zh) * 2018-04-12 2018-09-14 北京微播视界科技有限公司 根据用户肢体运动的视频渲染方法和装置
CN108734214A (zh) * 2018-05-21 2018-11-02 Oppo广东移动通信有限公司 图像识别方法和装置、电子设备、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160067886A (ko) * 2013-10-04 2016-06-14 퀄컴 인코포레이티드 오브젝트 검출 및 추적을 위한 맵 데이터의 동적 확장
CN106407984A (zh) * 2015-07-31 2017-02-15 腾讯科技(深圳)有限公司 目标对象识别方法及装置
CN106657810A (zh) * 2016-09-26 2017-05-10 维沃移动通信有限公司 一种视频图像的滤镜处理方法和装置
CN108537867A (zh) * 2018-04-12 2018-09-14 北京微播视界科技有限公司 根据用户肢体运动的视频渲染方法和装置
CN108734214A (zh) * 2018-05-21 2018-11-02 Oppo广东移动通信有限公司 图像识别方法和装置、电子设备、存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110933489A (zh) * 2019-11-01 2020-03-27 青岛海尔多媒体有限公司 视频播放控制的方法及装置、视频播放设备
CN110933489B (zh) * 2019-11-01 2024-04-02 青岛海尔多媒体有限公司 视频播放控制的方法及装置、视频播放设备
CN111107392A (zh) * 2019-12-31 2020-05-05 北京百度网讯科技有限公司 视频处理方法、装置和电子设备
CN113099295A (zh) * 2020-01-09 2021-07-09 袁芬 配乐音量自适应调节平台
CN113392238A (zh) * 2020-03-13 2021-09-14 北京字节跳动网络技术有限公司 媒体文件处理方法、装置、计算机可读介质和电子设备
CN111416950A (zh) * 2020-03-26 2020-07-14 腾讯科技(深圳)有限公司 视频处理方法、装置、存储介质及电子设备
CN111416950B (zh) * 2020-03-26 2023-11-28 腾讯科技(深圳)有限公司 视频处理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN110149551B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN110149551A (zh) 媒体文件播放方法和装置、存储介质及电子装置
CN109255346A (zh) 点读方法、装置及电子设备
CN109685202A (zh) 数据处理方法及装置、存储介质和电子装置
CN108171257A (zh) 细粒度图像识别模型训练及识别方法、装置及存储介质
CN108416003A (zh) 一种图片分类方法和装置、终端、存储介质
CN108319723A (zh) 一种图片分享方法和装置、终端、存储介质
CN103116754B (zh) 基于识别模型的批量图像分割方法及系统
CN110380954A (zh) 数据分享方法和装置,存储介质及电子装置
CN106485196A (zh) 视觉搜索方法、对应的系统、设备和计算机程序产品
CN105022487A (zh) 基于增强现实的阅读方法及装置
CN115357748A (zh) 头戴式装置
CN109840793A (zh) 推广信息的推送方法和装置、存储介质、电子装置
CN108712644A (zh) 一种tw_ar智能导览系统及导览方法
CN104063701B (zh) 基于surf词汇树和模板匹配的快速电视台台标识别系统及其实现方法
CN113011403B (zh) 手势识别方法、系统、介质及设备
US20200211413A1 (en) Method, apparatus and terminal device for constructing parts together
CN108959323A (zh) 视频分类方法和装置
CN110414001A (zh) 语句生成方法和装置、存储介质及电子装置
CN108737487A (zh) 数据同步方法和装置、存储介质及电子装置
CN106682014A (zh) 游戏展示数据的生成方法和装置
CN105144193A (zh) 用于估计成像设备的姿态的方法和设备
CN111062470A (zh) 一种ai处理方法及装置
WO2015159289A1 (en) Marker-based pixel replacement
CN105282520A (zh) 增强现实讲解设施的芯片及增强现实信息传递和互动方法
CN105069064B (zh) 词汇的获取方法及装置、推送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant