CN105786995A - 筛选多媒体素材的方法和装置 - Google Patents

筛选多媒体素材的方法和装置 Download PDF

Info

Publication number
CN105786995A
CN105786995A CN201610091257.1A CN201610091257A CN105786995A CN 105786995 A CN105786995 A CN 105786995A CN 201610091257 A CN201610091257 A CN 201610091257A CN 105786995 A CN105786995 A CN 105786995A
Authority
CN
China
Prior art keywords
picture frame
screened
eigenvalue
picture
media material
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610091257.1A
Other languages
English (en)
Inventor
刘辉
邓玥琳
罗祥凤
丁飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610091257.1A priority Critical patent/CN105786995A/zh
Publication of CN105786995A publication Critical patent/CN105786995A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种筛选多媒体素材的方法和装置。所述方法的一具体实施方式包括:从待筛选的多媒体素材中获取待筛选的各图像帧;对各图像帧提取特征值;基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像组中的各图像帧。该实施方式可以提高筛选多媒体素材的效率。

Description

筛选多媒体素材的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及筛选多媒体素材的方法和装置。
背景技术
随着互联网的普及,各网站呈现的页面内容越来越丰富,包括文字、多媒体信息等。这些内容在呈现给用户之前,往往需要进行筛选,以免将有害内容(例如黄赌毒等低俗内容)传播向用户,或者包含侵权内容(如名人肖像侵权、商标侵权)等。在现有的多媒体素材筛选过程中,往往依赖于人工,对单个画面进行审核,筛选出审核通过的画面。对于包括多个显示画面的内容,如动画、视频等,则需要人工逐个画面观看进行审核和筛选。因此,这种筛选多媒体素材的方法,依赖于人工逐个画面进行审核,筛选效率较低。
发明内容
本申请的目的在于提出一种改进的筛选多媒体素材的方法和装置,来解决以上背景技术部分提到的技术问题。
一方面,本申请提供了一种筛选多媒体素材的方法,所述方法包括:从待筛选的多媒体素材中获取待筛选的各图像帧;对各图像帧提取特征值;基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。
在一些实施例中,所述多媒体素材包括以下至少一项:图片、动画、视频;以及,所述从待筛选的多媒体素材中获取待筛选的各图像帧包括:获取待筛选的多媒体素材;如果所述待筛选的多媒体素材是图片,将一张图片作为一个待筛选的图像帧;如果所述待筛选的多媒体素材是动画或视频,将动画或视频进行分解得到多个待筛选的图像帧。
在一些实施例中,所述对各图像帧提取特征值包括:将各图像帧灰度化;根据图像帧中各像素点的灰度值生成各图像帧的特征值。
在一些实施例中,所述根据各像素点的灰度值生成所述图像帧的特征值包括:将所述图像帧分区域;对每个图像帧根据各区域在至少一个预设灰度值范围内的像素点数量的平均值生成所述图像帧的特征值。
在一些实施例中,所述根据各像素点的灰度值生成各图像帧的特征值包括:统计各图像帧中至少一个预设灰度值范围对应的像素点个数;判断每个预设灰度值范围对应的像素点个数与预设个数阈值的大小关系;将所述大小关系通过二进制数表示,生成各图像帧的特征值。
在一些实施例中,基于特征值的对比,将至少满足下列条件之一的图像帧作为相似度属于预设相似度范围的图像帧:图像帧的特征值中不相同的数字位数不超过预设位数;图像帧的相似度数值属于预设的数值范围。
在一些实施例中,所述预设条件包括以下至少一项:不包含预设图案;不包含预设文字。
第二方面,本申请提供了一种筛选多媒体素材的装置,所述装置包括:获取模块,配置用于从待筛选的多媒体素材中获取待筛选的各图像帧;提取模块,配置用于对各图像帧提取特征值;对比模块,配置用于基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;筛选模块,配置用于对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像组中的各图像帧。
在一些实施例中,所述多媒体素材包括以下至少一项:图片、动画、视频;以及,所述获取模块包括:获取单元,配置用于获取待筛选的多媒体素材;确定单元,配置用于如果所述待筛选的多媒体素材是图片,将一个图片作为一个待筛选的图像帧;如果所述待筛选的多媒体素材是动画或视频,将动画或视频进行分解得到多个待筛选的图像帧。
在一些实施例中,所述提取模块包括:灰度化单元,配置用于将各图像帧灰度化;生成单元,配置用于根据图像帧中各像素点的灰度值生成各图像帧的特征值。
在一些实施例中,所述生成单元进一步配置用于:将所述图像帧分区域;对每个图像帧根据各区域在至少一个预设灰度值范围内的像素点数量的平均值生成所述图像帧的特征值。
在一些实施例中,所述生成单元进一步配置用于:统计各图像帧中至少一个预设灰度值范围对应的像素点个数;判断每个预设灰度值范围对应的像素点个数与预设个数阈值的大小关系;将所述大小关系通过二进制数表示,生成各图像帧的特征值。
在一些实施例中,所述对比模块基于特征值的对比,将至少满足下列条件之一的图像帧作为相似度属于预设相似度范围的图像帧:图像帧的特征值中不相同的数字位数不超过预设位数;图像帧的相似度数值属于预设的数值范围。
在一些实施例中,所述预设条件包括以下至少一项:不包含预设图案;不包含预设文字。
本申请提供的筛选多媒体素材的方法和装置,通过从待筛选的多媒体素材中获取待筛选的各图像帧,接着,对各图像帧提取特征值,然后基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组,接着对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像组中的各图像帧。由于先将待筛选的多媒体素材按照图像帧分组,对每一待筛选图像帧组只需考虑其中任一图像帧是否满足预设条件,即可将判断结果适用于一组图像帧,因此,这种筛选多媒体素材的方法和装置可以提高筛选效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了可以应用本申请实施例的示例性系统架构;
图2是根据本申请的筛选多媒体素材的方法的一个实施例的流程图;
图3是根据本申请的筛选多媒体素材的方法的一个应用场景的示意图;
图4是根据本申请的筛选多媒体素材的方法的另一个实施例的流程图;
图5是根据本申请的筛选多媒体素材的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102可以通过网络103与服务器104交互,以接收或发送消息等。终端设备101、102上可以安装有各种通讯客户端应用,例如浏览器应用、购物类应用、搜索类应用、理财类应用、地图类应用、社交平台应用、邮箱客户端、即时通信工具等等。
终端设备101、102可以是支持浏览器应用等安装于其上的各种电子设备,包括但不限于智能手机、智能手表、平板电脑、个人数字助理、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器104可以是提供各种服务的服务器。例如服务器104可以是对终端设备101、102的浏览器应用、购物类应用等提供支持的后台服务器等。服务器可以对接收到的数据进行存储、生成等处理,并将处理结果反馈给终端设备。
需要说明的是,本申请实施例所提供的筛选多媒体素材的方法一般通过服务器104执行,但不排除可以通过终端设备101、102执行。举例而言,在本申请实施例所提供的筛选多媒体素材的方法的一种实现中,用户可以通过终端设备101或102运行的浏览器应用、购物类应用等上传多媒体素材,服务器104可以通过本申请的筛选多媒体素材的方法对接收到的多媒体素材进行筛选,并将筛选出的图像帧发送到终端设备101、102,由终端设备101、102上运行的浏览器应用、购物类应用等进行展示。相应地,本申请实施例所提供的筛选多媒体素材的装置一般设于服务器104中,但不排除可以设于终端设备101、102中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,其示出了筛选多媒体素材的方法的一个实施例的流程200。本实施例主要以该方法应用于有一定运算能力的电子设备中来举例说明,该电子设备例如可以是图1示出的服务器104。该筛选多媒体素材的方法,包括以下步骤:
步骤201,从待筛选的多媒体素材中获取待筛选的各图像帧。
在本实施例中,电子设备可以从本地或远程地获取多媒体素材,对待筛选的多媒体素材进行解析,从中获取待筛选的各图像帧。具体地,多媒体素材可以预先存储在电子设备上,则电子设备可以从本地获取多媒体素材,多媒体素材可以预先存储在其他终端(例如图1中的终端设备101、102)或由其他终端上传至本地电子设备(例如图1中的服务器104),此时,电子设备可以通过有线连接方式或者无线连接方式从其他终端远程地获取多媒体素材。上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。
其中,多媒体(Multimedia)是多种媒体的总称,一般可以包括储存、呈现、处理、传递信息的文本、声音和图像等。例如,多媒体素材可以包括但不限于以下至少一项:图片、动画(如flash)、视频等等。可以理解,动画是采用逐帧拍摄对象并连续播放而形成的运动的影像,而视频是静态影像以一定速率(如每秒24图像帧)播放形成的动态影像,因此,动画和视频可以被分解成多个图像帧。实践中,如果多媒体素材包括图片,则电子设备可以一张图片作为一个待筛选的图像帧;如果待筛选的多媒体素材包括动画或视频,则电子设备可以将动画或视频进行分解得到多个待筛选的图像帧。
步骤202,对各图像帧提取特征值。
在本实施例中,电子设备可以对步骤201中获取的图像帧进行各种分析,以提取各图像帧的特征值。这里,特征值可以是一个数值,也可以是一系列数值组成的数组或向量,本申请对此不做限定。
特征值可以是用于表征图像帧的某一个或多个特征或属性特点的数值,例如,假设一个图像帧包括1024×960个像素点,则表征该图像帧的特征“像素点个数”的特征值可以为“1024×960”。作为一个示例,电子设备可以将图像帧的每个像素点的颜色作为特征,进一步地,各个像素点的RGB颜色值形成的数值序列作为该图像帧的特征值。本领域技术人员可以理解,现有的显示器可以采用RGB颜色标准,即在显示器上,通过电子枪打在屏幕的红(R)、绿(G)、蓝(B)三色发光极上来产生色彩,其中,RGB颜色标准可以通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。因此,图像帧每个像素点的颜色值可以由R、G、B三个颜色通道上的分量数值来表示,如一个像素点为红色,红色在R、G、B三个颜色通道上的分量数值分别为255、0、0,分别用16进制表示为FF、00、00,则该像素点的颜色值可以表示为FF0000。
步骤203,基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组。
在本实施例中,电子设备可以将各图像帧的特征值进行对比,并基于对比结果,对图像帧分组,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组。
其中,相似度可以用于表征图像帧的特征值之间的相似程度或接近程度。相似度可以通过一个数值来表示,如80%,也可以通过图像帧的特征值之间的差别来衡量,如特征值相差5位(有5位数字不同),等等,本申请对此不做限定。如果相似度通过一个数值来表示,其可以是两个数值的比值,也可以是采用余弦相似度(cosinesimilarity)算法、Jaccard系数之类的公知的相似度计算方法来对一系列数值进行计算得到的相似度。具体地,当特征值是一个数值时,两个图像帧的相似度可以通过其特征值的比值来表示,例如,一个图像帧的特征“像素点个数”的特征值为“1024×960”,另一个图像帧的特征“像素点个数”的特征值为“1024×480”,则电子设备可以计算这两个图像帧的相似度为(1024×480)/(1024×960)=50%。当特征值是一系列数值组成的数组或向量时,两个图像帧的相似度可以采用上述公知的相似度计算方法来计算,以Jaccard系数方法为例,假设图像帧A的特征值对应的一系列数值个数为a,图像帧B的特征值对应的一系列数值个数为b,a和b相比,代表相同含义的数值若相同,该数值称为相同数值,如果a和b相同数值的个数为c,则电子设备可以采用如下的公式计算图像帧A与图像帧B之间的相似度:c/(a+b)。
这里,相似度范围可以是一个阈值范围,例如,特征值相差位数的阈值为5,则电子设备可以将特征值相差位数不超过5位的图像帧加入同一待筛选图像帧组;相似度范围也可以是一个数值区间表示的范围,例如,预设的相似度的数值范围80%-100%,则电子设备可以将由特征值计算得到的相似度在80%-100%之间的图像帧加入同一待筛选图像帧组。
值得说明的是,一个待筛选图像帧组可以包括一个图像帧,也可以包括多个图像帧。例如,如果一个图像帧和其他任何图像帧的相似度都不属于预设相似度范围,则电子设备可以将该图像帧作为一个待筛选图像帧组。
一个待筛选图像帧组可以通过集合的方式表示,也可以通过添加标记的方式(例如在同一待筛选图像帧组的图像帧名称中添加后缀-a等)表示,还可以通过其他任意可区分不同组的方式表示,本申请对此不做限定。通过该步骤,电子设备可以查找出待筛选的多媒体素材中内容相似或相近的图像帧。
步骤204,对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。
在本实施例中,电子设备可以对步骤203确定的至少一个待筛选图像帧组中的每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。
这里,预设条件可以是预先设定的对多媒体素材进行筛选的条件。例如,对于在某网站公开发表的内容,预设条件可以是:不包含有害内容(例如黄、赌、毒等低俗内容)、不包含侵权内容(如名人肖像侵权、商标侵权等),等等。其中,这些筛选条件中涉及的内容可以是图案形式的内容,也可以是文字形式的内容(如文字形式的商标等),还可以是声音形式的内容,本申请对此不做限定。相应地,预设条件可以包括但不限于以下至少一项:不包含预设图案、不包含预设文字、不包含预设声音等等。预设条件可以预先存储在电子设备中,也可以由人工确定,本申请对此不做限定。以预设条件预先存储在电子设备中为例,电子设备例如可以对大量包含有害内容的多媒体素材数据样本进行分析,从得到的各图像帧中提取共同图案或者统计包含有害内容的各像素点颜色值范围内像素点的比例(如图像帧中包含80%的颜色值在FFFF50-FFFFA0范围内的像素点等)等作为筛除条件,也可以将大量名人肖像、商标等作为筛除条件,预设条件可以是待筛选的多媒体素材不包括任意筛除条件之一。即,电子设备可以将每一待筛选图像帧组中的任一图像帧与上述筛除条件进行匹配,如果匹配到任意筛除条件,确定图像帧不满足预设条件;如果匹配不到所有筛除条件,则确定图像帧满足预设条件。可以理解,上述筛选过程以筛选出可以在网站公开发表的多媒体素材为例,实际执行中,也可以筛选出不可以在网站公开发表的多媒体素材,将筛除的多媒体素材确定为可以在网站公开发表的多媒体素材,其过程与上述过程相反,在此不再赘述。
其中,电子设备判断每一待筛选图像帧组的任一个图像帧是否满足预设条件时,该任一个图像帧可以是从待筛选图像帧组中指定的一个图像帧,例如指定加入该待筛选图像帧组的第一个图像帧或最后一个图像帧,也可以是从待筛选图像帧组中随机取出的一个图像帧,本申请对此不做限定。通过该步骤,电子设备可以通过对内容相似或相近的图像帧中的任意一个图像帧进行筛选,进而将筛选结果应用于同组的其他图像帧,从而提高筛选效率。
参考图3,作为一个应用场景,图3给出了本实施例的筛选多媒体素材的方法应用于购物类网站的后台服务器,商家可以通过客户端向后台服务器上传需发布于该购物类网站上的商品图片,后台服务器可以应用本申请实施例的筛选多媒体素材的方法对上述商品图片进行筛选,并允许筛选通过的图片发布于该购物类网站的页面上。如图3所示,在标号301中,列出了后台服务器从客户端获取的多个图片,这多个图片是后台服务器待筛选的多媒体素材,后台服务器可以将每个图片作为一个图像帧进行分析,如提取特征值,基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;接着,如标号302所示,后台服务器得到了第一图像帧组(如包含3张图片:图片1、图片4、图片7)、第二图像帧组(如包含4张图片:图片2、图片3、图片5、图片6),等等;然后,如标号303所示,后台服务器分别判断第一图像帧组中的图片1、第二图像帧组中的图片3……是否符合预设条件,这里,预设条件例如可以是没有商标侵权;接着,如标号304所示,由于图片1符合预设条件,则第一图像帧组(可以包括图片1、图片4、图片7)被筛选出来,而由于图片3不符合预设条件,则第二图像帧组(可以包括图片2、图片3、图片5、图片6)被筛除……。进一步地,后台服务器可以允许第一图像帧组中的图片(例如图片1、图片4、图片7)发布于该购物类网站的页面上,而不允许第二图像帧组中的图片(例如图片2、图片3、图片5、图片6)发布于该购物类网站的页面上。
本申请的上述实施例通过将多媒体素材的不同图像帧中相似或相近的图像帧加入相同的图像帧组,对每个图像帧组仅判断其中一个图像帧是否符合预设条件,并将判断结果应用于在整个图像帧组,从而可以提高筛选多媒体素材的效率。
进一步参考图4,其示出了本申请的筛选多媒体素材的方法的又一个实施例的流程400。该流程400包括以下步骤:
步骤401,从待筛选的多媒体素材中获取待筛选的各图像帧。
在本实施例中,电子设备可以从本地或远程地获取多媒体素材,对待筛选的多媒体素材进行解析,从中获取待筛选的各图像帧。其中,多媒体素材可以包括但不限于以下至少一项:图片、动画、视频等等。实践中,如果多媒体素材包括图片,则电子设备可以一张图片作为一个待筛选的图像帧;如果待筛选的多媒体素材包括动画或视频,则电子设备可以将动画或视频进行分解得到多个待筛选的图像帧。
步骤402,将各图像帧灰度化。
在本实施例中,电子设备可以进一步将所得到的各图像帧进行灰度化处理。
在RGB模型中,如果R、G、B分量的值相同,则彩色表示为一种灰度颜色,其中该相同的值可以称为灰度值,灰度值的范围为0-255。将彩色图像表示为灰度图像的过程即为图像的灰度化过程。电子设备可以通过分量法、最大值法、平均值法、加权平均法等公知的方法对各图像帧进行灰度化处理。以加权平均法为例,电子设备可以根据重要性等,将R、G、B三个分量以不同的权值进行加权平均。例如,人眼对绿色的敏感最高,可以分配较高的权值,对蓝色敏感最低,可以分配较低的权值。如,电子设备可以通过按下式对R、G、B三分量进行加权平均得到灰度图像:Y=0.30r+0.59g+0.11b,其中,Y表示各像素点的灰度值,r、g、b分别为相应像素点在R、G、B三个分量上的值。
图像帧被灰度化后,每个像素点可以具有一个“灰度值”。该灰度值的取值范围为0-255。
步骤403,根据图像帧中各像素点的灰度值生成各图像帧的特征值。
在本实施例中,电子设备可以进一步根据对图像帧中各像素点的灰度值的各种处理生成各图像帧的特征值。
例如,电子设备可以将一个图像帧的各像素点的灰度值分别以16进制表示,得到灰度值序列作为该图像帧的特征值。电子设备还可以统计一个图像帧中0-255共256个灰度值对应的像素点的个数,并将该个数组成的数值序列作为该图像帧的特征值。电子设备也可以通过其他合理的处理方式对图像帧中各像素点的灰度值进行处理生成各图像帧的特征值,本申请对此不做限定。
在本实施例的一些可选实现方式中,电子设备可以统计各图像帧中至少一个预设灰度值范围对应的像素点个数,例如,每4个灰度值对应一个预设灰度值范围(0-3、4-7、8-11……252-255),共有64个预设灰度值范围,统计一个图像帧中灰度值属于每个灰度值范围的像素点的个数;接着,电子设备可以判断每个预设灰度值范围对应的像素点个数与预设个数阈值(如75)的大小关系;然后,电子设备可以将上述大小关系通过二进制数表示,生成各图像帧的特征值,例如预设灰度值范围对应的像素点个数大于预设个数阈值,用“1”表示,否则,用“0”表示。则电子设备可以对每个图像帧可以得到64个二进制数表示的值,电子设备可以将这64位二进制数作为相应图像帧的特征值,也可以将64位二进制数表示为16位16进制数作为相应图像帧的特征值,本申请对此不做限定。
在本实施例的另一些可选实现方式中,电子设备还可以先将每个图像帧分区域,例如根据像素值大小等分成预定个数的区域,如对于像素大小为1024×960的图像帧,可以将其分成4×4个像素值大小为“(1024/4)×(960/4)”=256×240的区域;然后,电子设备可以对每个图像帧统计各区域(例如4×4=16个区域)内在至少一个预设灰度值范围内的像素点数量,并计算每个预设灰度值范围内的像素点数量的平均值(例如对每个图像帧对其所划分成的16个区域计算每个预设灰度值范围内的像素点数量的平均值),进而根据该平均值生成图像帧的特征值。其中,电子设备可以将该平均值与预设个数阈值进行比较,判断其大小关系,并将上述大小关系通过二进制数表示,生成各图像帧的特征值。具体方法如前所述,在此不再赘述。
步骤404,基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组。
在本实施例中,电子设备可以将各图像帧的特征值进行对比,并基于对比结果,对图像帧分组,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组。其中,相似度可以用于表征图像帧的特征值之间的相似程度或接近程度,其可以通过一个数值来表示,如80%,也可以通过图像帧的特征值之间的差别来衡量,如特征值相差5位(有5位数字不同),等等,本申请对此不做限定。这里,相似度范围可以是一个阈值范围,也可以是一个区间范围。
一个待筛选图像帧组可以包括一个图像帧,也可以包括多个图像帧。例如,如果一个图像帧和其他任何图像帧的相似度都不属于预设相似度范围,则电子设备可以将该图像帧作为一个待筛选图像帧组。一个待筛选图像帧组可以通过集合的方式表示,也可以通过添加标记的方式(例如在同一待筛选图像帧组的图像帧名称中添加后缀-a等)表示,还可以通过其他任意可区分不同组的方式表示,本申请对此不做限定。
步骤405,对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。
在本实施例中,电子设备可以对步骤404确定的至少一个待筛选图像帧组中的每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。其中,预设条件可以是预先设定的对多媒体素材进行筛选的条件,其可以预先存储在电子设备中,也可以由人工确定,本申请对此不做限定。
在本实施例中,上述实现流程中的步骤401、步骤404、步骤405分别与前述实施例中的步骤201、步骤203、步骤204基本相同,在此不再赘述。
从图4中可以看出,与图2对应的实施例不同的是,本实施例中的筛选多媒体素材的方法的流程400通过步骤402、403代替了步骤202。通过增加的步骤402、403,本实施例进一步限定了提取图像帧的特征值的方法,通过将各图像帧灰度化,根据图像帧中各像素点的灰度值生成各图像帧的特征值,简化了特征值的提取过程。进一步地,在一些实现中,可以先将图像帧分区域,根据每个图像帧各区域在至少一个预设灰度值范围内的像素点数量的平均值生成所述图像帧的特征值,使各图像帧的特征值具有相同的表示方法和位数,避免了由于图像帧的像素大小不同引起的对比混乱。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种筛选多媒体素材的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于电子设备中。
如图5所示,本实施例所述的筛选多媒体素材的装置500包括:获取模块501、提取模块502、对比模块503及筛选模块504。其中,获取模块501可以配置用于从待筛选的多媒体素材中获取待筛选的各图像帧;提取模块502可以配置用于对各图像帧提取特征值;对比模块503可以配置用于基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;筛选模块504可以配置用于对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像组中的各图像帧。
值得说明的是,筛选多媒体素材的装置500中记载的诸模块或单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于筛选多媒体素材的装置500及其中包含的模块或单元,在此不再赘述。
本领域技术人员可以理解,上述筛选多媒体素材的装置500还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图5中未示出。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、提取模块、对比模块及筛选模块。其中这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“配置用于从待筛选的多媒体素材中获取待筛选的各图像帧的模块”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上程序,当所述程序被一个或者一个以上的处理器执行时,使得所述设备:从待筛选的多媒体素材中获取待筛选的各图像帧;对各图像帧提取特征值;基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种筛选多媒体素材的方法,其特征在于,所述方法包括:
从待筛选的多媒体素材中获取待筛选的各图像帧;
对各图像帧提取特征值;
基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;
对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像帧组中的各图像帧。
2.根据权利要求1所述的方法,其特征在于,所述多媒体素材包括以下至少一项:图片、动画、视频;以及
所述从待筛选的多媒体素材中获取待筛选的各图像帧包括:
获取待筛选的多媒体素材;
如果所述待筛选的多媒体素材是图片,将一张图片作为一个待筛选的图像帧;
如果所述待筛选的多媒体素材是动画或视频,将动画或视频进行分解得到多个待筛选的图像帧。
3.根据权利要求1所述的方法,其特征在于,所述对各图像帧提取特征值包括:
将各图像帧灰度化;
根据图像帧中各像素点的灰度值生成各图像帧的特征值。
4.根据权利要求3所述的方法,其特征在于,所述根据各像素点的灰度值生成所述图像帧的特征值包括:
将所述图像帧分区域;
对每个图像帧根据各区域在至少一个预设灰度值范围内的像素点数量的平均值生成所述图像帧的特征值。
5.根据权利要求3所述的方法,其特征在于,所述根据各像素点的灰度值生成各图像帧的特征值包括:
统计各图像帧中至少一个预设灰度值范围对应的像素点个数;
判断每个预设灰度值范围对应的像素点个数与预设个数阈值的大小关系;
将所述大小关系通过二进制数表示,生成各图像帧的特征值。
6.根据权利要求1所述的方法,其特征在于,基于特征值的对比,将至少满足下列条件之一的图像帧作为相似度属于预设相似度范围的图像帧:
图像帧的特征值中不相同的数字位数不超过预设位数;
图像帧的相似度数值属于预设的数值范围。
7.根据权利要求1-6中任一所述的方法,其特征在于,所述预设条件包括以下至少一项:
不包含预设图案;
不包含预设文字。
8.一种筛选多媒体素材的装置,其特征在于,所述装置包括:
获取模块,配置用于从待筛选的多媒体素材中获取待筛选的各图像帧;
提取模块,配置用于对各图像帧提取特征值;
对比模块,配置用于基于特征值的对比,将相似度属于预设相似度范围的图像帧加入同一待筛选图像帧组;
筛选模块,配置用于对每一待筛选图像帧组,判断其中任一个图像帧是否满足预设条件,如果是,筛选出该图像帧所在的待筛选图像组中的各图像帧。
9.根据权利要求8所述的装置,其特征在于,所述多媒体素材包括以下至少一项:图片、动画、视频;以及
所述获取模块包括:
获取单元,配置用于获取待筛选的多媒体素材;
确定单元,配置用于如果所述待筛选的多媒体素材是图片,将一个图片作为一个待筛选的图像帧;如果所述待筛选的多媒体素材是动画或视频,将动画或视频进行分解得到多个待筛选的图像帧。
10.根据权利要求8所述的装置,其特征在于,所述提取模块包括:
灰度化单元,配置用于将各图像帧灰度化;
生成单元,配置用于根据图像帧中各像素点的灰度值生成各图像帧的特征值。
11.根据权利要求10所述的装置,其特征在于,所述生成单元进一步配置用于:
将所述图像帧分区域;
对每个图像帧根据各区域在至少一个预设灰度值范围内的像素点数量的平均值生成所述图像帧的特征值。
12.根据权利要求10所述的装置,其特征在于,所述生成单元进一步配置用于:
统计各图像帧中至少一个预设灰度值范围对应的像素点个数;
判断每个预设灰度值范围对应的像素点个数与预设个数阈值的大小关系;
将所述大小关系通过二进制数表示,生成各图像帧的特征值。
13.根据权利要求8所述的装置,其特征在于,所述对比模块基于特征值的对比,将至少满足下列条件之一的图像帧作为相似度属于预设相似度范围的图像帧:
图像帧的特征值中不相同的数字位数不超过预设位数;
图像帧的相似度数值属于预设的数值范围。
14.根据权利要求8-13中任一所述的装置,其特征在于,所述预设条件包括以下至少一项:
不包含预设图案;
不包含预设文字。
CN201610091257.1A 2016-02-18 2016-02-18 筛选多媒体素材的方法和装置 Pending CN105786995A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610091257.1A CN105786995A (zh) 2016-02-18 2016-02-18 筛选多媒体素材的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610091257.1A CN105786995A (zh) 2016-02-18 2016-02-18 筛选多媒体素材的方法和装置

Publications (1)

Publication Number Publication Date
CN105786995A true CN105786995A (zh) 2016-07-20

Family

ID=56402229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610091257.1A Pending CN105786995A (zh) 2016-02-18 2016-02-18 筛选多媒体素材的方法和装置

Country Status (1)

Country Link
CN (1) CN105786995A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874186A (zh) * 2016-12-29 2017-06-20 努比亚技术有限公司 一种应用启动速度的测试装置、终端及方法
CN113032602A (zh) * 2021-04-29 2021-06-25 深圳飞蝶虚拟现实科技有限公司 一种基于3d图像的vr课程编辑方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216976A (zh) * 2014-09-01 2014-12-17 广东欧珀移动通信有限公司 一种移动终端图片分组查看方法及系统
CN104540004A (zh) * 2015-01-27 2015-04-22 深圳市中兴移动通信有限公司 视频截图方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216976A (zh) * 2014-09-01 2014-12-17 广东欧珀移动通信有限公司 一种移动终端图片分组查看方法及系统
CN104540004A (zh) * 2015-01-27 2015-04-22 深圳市中兴移动通信有限公司 视频截图方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874186A (zh) * 2016-12-29 2017-06-20 努比亚技术有限公司 一种应用启动速度的测试装置、终端及方法
CN113032602A (zh) * 2021-04-29 2021-06-25 深圳飞蝶虚拟现实科技有限公司 一种基于3d图像的vr课程编辑方法及系统

Similar Documents

Publication Publication Date Title
Zhou et al. Coverless image steganography using partial-duplicate image retrieval
Liu et al. Image retargeting quality assessment
CN115997207B (zh) 使用引导信号来检测在图像中的感兴趣子图像区域
CN106777177A (zh) 检索方法和装置
CN111275784B (zh) 生成图像的方法和装置
CN108236784B (zh) 模型的训练方法和装置、存储介质、电子装置
CN107534796A (zh) 检测视频节目的片段
CN105306495B (zh) 用户识别方法和装置
CN106911943A (zh) 一种视频展示方法及其装置
JPWO2011148858A1 (ja) コンテンツ表示装置、コンテンツ表示方法、コンテンツ表示プログラム、記録媒体、サーバ装置、コンテンツ提供方法及びコンテンツ提供プログラム
CN108806638B (zh) 一种图像的显示方法及其装置
CN110599554A (zh) 人脸肤色的识别方法和装置、存储介质及电子装置
CN109389096A (zh) 检测方法和装置
CN103854019A (zh) 图像中的字段提取方法及装置
CN105975861A (zh) 应用检测方法和装置
CN112839223A (zh) 图像压缩方法、装置、存储介质及电子设备
CN107305677A (zh) 产品信息推送方法和装置
CN106503112A (zh) 视频检索方法和装置
US20210183105A1 (en) System, Device, and Method for Determining Color Ambiguity of an Image or Video
CN105786995A (zh) 筛选多媒体素材的方法和装置
Caron et al. Use of power law models in detecting region of interest
CN111767492B (zh) 图片加载方法、装置、计算机设备及存储介质
CN113538304A (zh) 图像增强模型的训练方法及装置、图像增强方法及装置
CN111626922A (zh) 图片生成方法、装置、电子设备及计算机可读存储介质
CN105956173A (zh) 页面内容获取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160720

RJ01 Rejection of invention patent application after publication