WO2017092127A1

WO2017092127A1 - 视频归类方法及装置

Info

Publication number: WO2017092127A1
Application number: PCT/CN2015/099610
Authority: WO
Inventors: 陈志军; 侯文迪; 龙飞
Original assignee: 小米科技有限责任公司
Priority date: 2015-12-01
Filing date: 2015-12-29
Publication date: 2017-06-08
Also published as: RU2016136707A3; KR101952486B1; CN105426515B; JP2018502340A; RU2016136707A; KR20180081637A; RU2667027C2; CN105426515A; MX2016005882A; US20170154221A1; US10115019B2; EP3176709A1; JP6423872B2

Abstract

本公开是关于视频归类方法及装置。该方法包括：获取视频中包括人脸的关键帧；获取所述关键帧中的人脸特征；获取图片类别对应的人脸特征；根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别；将所述视频分配至所述视频所归属的图片类别中。上述技术方案，可以智能自动地将视频归入参与该视频的人对应的图片类别中，不仅不需要用户手动归类，而且分类准确性高。

Description

视频归类方法及装置

本申请基于申请号为2015108674365、申请日为2015年12月01日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及多媒体聚类技术领域，尤其涉及视频归类方法及装置。

背景技术

目前，用户可使用拍摄装置拍摄到视频、照片等多媒体数据。对于照片，目前已经有人脸聚类技术，可以将同一个人参与拍摄的照片归入该人对应的照片集中。但是，目前缺少将同一个人参与拍摄的视频和照片进行人脸聚类的技术，用户只能手动将视频分类，智能化低，效率低。

发明内容

本公开实施例提供视频归类方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种视频归类方法，包括：

获取视频中包括人脸的关键帧；

获取所述关键帧中的人脸特征；

获取图片类别对应的人脸特征；

根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别；

将所述视频分配至所述视频所归属的图片类别中。

在一个实施例中，所述获取视频中包括人脸的关键帧，包括：

从所述视频中获取包括人脸的至少一个视频帧；

确定所述至少一个视频帧中，每个视频帧中的人脸参数，所述人脸参数包括人脸数目、人脸位置中的任一项或两项；

根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧。

在一个实施例中，上述根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧，包括：

根据所述每个视频帧中的所述人脸参数，确定所述人脸参数未重复出现在其它视频帧中的非重复视频帧；

将至少一个所述非重复视频帧确定为所述关键帧。

根据所述每个视频帧中的所述人脸参数，确定所述人脸参数相同的至少一组重复视频帧，每组所述重复视频帧中包括至少两个视频帧，每组所述重复视频帧中摄取时间最晚的视频帧与摄取时间最早的视频帧之间的摄取时间之差小于或等于预设时长，每组所述重复视频帧中所有视频帧的人脸参数相同；

将每组所述重复视频帧中的任一视频帧确定为所述关键帧。

在一个实施例中，所述根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别，包括：当所述视频的数目为至少两个时，确定每个视频的所述关键帧中的人脸特征；根据每个视频的所述关键帧中的人脸特征，对所述至少两个视频进行人脸聚类处理，获得至少一个视频类别；根据所述至少一个视频类别各自对应的人脸特征和所述图片类别对应的人脸特征，确定对应相同人脸特征的视频类别和图片类别；

所述将所述视频分配至所述视频所归属的图片类别中，包括：将所述每个视频类别中的视频分配至对应相同人脸特征的图片类别中。

在一个实施例中，所述根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别，包括：

在所述图片类别对应的人脸特征中，确定与所述关键帧中的人脸特征匹配的图片类别；

将所述匹配的图片类别确定为所述视频所归属的图片类别。

在一个实施例中，所述方法还包括：

获取所述视频的拍摄时间和拍摄地点；

确定与所述视频的拍摄时间和拍摄地点相同的目的图片；

将所述视频分配至所述目的图片所归属的图片类别中。

根据本公开实施例的第二方面，提供一种视频归类装置，包括：

第一获取模块，用于获取视频中包括人脸的关键帧；

第二获取模块，用于获取所述第一获取模块获取到的所述关键帧中的人脸特征；

第三获取模块，用于获取图片类别对应的人脸特征；

第一确定模块，用于根据所述第二获取模块获取到的所述关键帧中的人脸特征和所述第三获取模块获取到的所述图片类别对应的人脸特征，确定所述视频所归属的图片类别；

第一分配模块，用于将所述视频分配至所述第一确定模块确定出的所述视频所归属的图片类别中。

在一个实施例中，所述第一获取模块，包括：

获取子模块，用于从所述视频中获取包括人脸的至少一个视频帧；

第一确定子模块，用于确定所述获取子模块获取到的所述至少一个视频帧中，每个视频帧中的人脸参数，所述人脸参数包括人脸数目、人脸位置中的任一项或两项；

第二确定子模块，用于根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧。

在一个实施例中，所述第二确定子模块，还用于根据所述每个视频帧中的所述人脸参数，确定所述人脸参数未重复出现在其它视频帧中的非重复视频帧；将至少一个所述非重复视频帧确定为所述关键帧。

在一个实施例中，所述第二确定子模块，还用于根据所述每个视频帧中的所述人脸参数，确定所述人脸参数相同的至少一组重复视频帧，每组所述重复视频帧中包括至少两个视频帧，每组所述重复视频帧中摄取时间最晚的视频帧与摄取时间最早的视频帧之间的摄取时间之差小于或等于预设时长，每组所述重复视频帧中所有视频帧的人脸参数相同；将每组所述重复视频帧中的任一视频帧确定为所述关键帧。

在一个实施例中，所述第一确定模块，包括：

第三确定子模块，用于当所述视频的数目为至少两个时，确定每个视频的所述关键帧中的人脸特征；根据每个视频的所述关键帧中的人脸特征，对所述至少两个视频进行人脸聚类处理，获得至少一个视频类别；根据所述至少一个视频类别各自对应的人脸特征和所述图片类别对应的人脸特征，确定对应相同人脸特征的视频类别和图片类别；

所述第一分配模块，包括：

第一分配子模块，用于将所述第三确定子模块确定出的每个视频类别中的视频分配至对应相同人脸特征的图片类别中。

在一个实施例中，所述第一确定模块，包括：

第四确定子模块，用于在所述图片类别对应的人脸特征中，确定与所述关键帧中的人脸特征匹配的图片类别；

第二分配子模块，用于将所述第四确定子模块确定出的所述匹配的图片类别确定为所述视频所归属的图片类别。

在一个实施例中，所述装置还包括：

第四获取模块，用于获取所述视频的拍摄时间和拍摄地点；

第二确定模块，用于确定与所述第四获取模块获取到的所述视频的拍摄时间和拍摄地点相同的目的图片；

第二分配模块，用于将所述视频分配至所述第二确定模块确定出的所述目的图片所归属的图片类别中。

根据本公开实施例的第三方面，提供一种视频分类装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取视频中包括人脸的关键帧；

获取所述关键帧中的人脸特征；

获取图片类别对应的人脸特征；

将所述视频分配至所述视频所归属的图片类别中。

本公开的实施例提供的技术方案可以包括以下有益效果：

上述技术方案，可以智能自动地将视频归入参与该视频的人对应的图片类别中，不仅不需要用户手动归类，而且分类准确性高。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种视频归类方法的流程图。

图2是根据一示例性实施例示出的另一种视频归类方法的流程图。

图3是根据一示例性实施例示出的再一种视频归类方法的流程图。

图4是根据一示例性实施例示出的一种视频归类装置的框图。

图5是根据一示例性实施例示出的另一种视频归类装置的框图。

图6是根据一示例性实施例示出的再一种视频归类装置的框图。

图7是根据一示例性实施例示出的又一种视频归类装置的框图。

图8是根据一示例性实施例示出的又一种视频归类装置的框图。

图9是根据一示例性实施例示出的适用于网络连接装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开实施例提供了一种视频归类技术，该技术可以智能自动地将视频归入参与该视频的人对应的图片类别中，不仅不需要用户手动归类，而且分类准确性高。

在说明本公开实施例提供的方法之前，先说明一下图片类别及其生成方法。一个图片类别对应一个人脸，每个图片类别中的图片中都有同一张人脸，也可以说是一个图片类别对应一个人，因此，每个图片类别下包括具有同一人脸特征的一组图片。本公开实施例可采用以下人脸聚类方法生成图片类别，但不限于以下方法。

在人脸聚类方法中，通常，第一次聚类的时候采用全量的聚类方法初始化，后续聚类一般是采用增量聚类的方法。人脸聚类方法可包括如下步骤A1-A5：

步骤A1、获取N个图片各自包含的人脸特征，获得N个人脸特征，N大于或等于2。在聚类初始时，每个人脸当成一个类，那么，初始时是有N个类的。

步骤A2、在N个类中，计算类与类之间的距离，类与类之间的距离就是两个类各自所包含的人脸之间的距离。

步骤A3、预先设定一个距离阈值θ，当两个类之间的距离小于θ时，则认为这两个类是对应同一个人的，这一轮迭代将这两个类合并成一个新的类。

步骤A4、重复执行步骤A3以进行重复迭代，直到在一轮迭代中没有新的类产生，则迭代终止。

步骤A5、结果共产生M个类，每个类至少包含一个人脸，一个类表示一个人。

图1所示为本公开实施例提供的一种视频归类方法的流程图。该方法的执行主体可以是用于管理多媒体文件的应用程序，此时，该方法中涉及到的视频、图片类别以及图片类别下的图片，是指上述应用程序所在设备中存储的视频、图片类别以及图片类别下的图片。另外，该方法的执行主体也可以是存储有多媒体文件的电子设备，此时，该方法中涉及到的视频、图片类别以及图片类别下的图片，是指存储于该电子设备中的视频、图片类别以及图片类别下的图片。上述应用程序或电子设备可以是周期性地自动触发该方法，也可以是在接收到用户的指示时触发该方法，还可以是在监测到产生了至少一个新视频时自动触发该方法，触发该方法的时机可以有多种，并不限于以上例举的几种，其最终目的是利用该方法对视频进行智能归类，节省人力。如图1所示，该方法包括步骤S101-S105：

在步骤S101中，获取视频中包括人脸的关键帧。

在一个实施例中，可以从视频中选择任意一个或多个包括人脸的视频帧作为关键帧，也可以按照图2所示方式获取关键帧，如图2所示，步骤S101可实施为以下步骤S201-S203：

在步骤S201中，从视频中获取包括人脸的至少一个视频帧。

在步骤S202中，确定至少一个视频帧中，每个视频帧中的人脸参数，人脸参数包括人脸数目、人脸位置中的任一项或两项。

在步骤S203中，根据每个视频帧中的人脸参数，确定视频中的关键帧。

其中，步骤S203可以实施为以下方式一、方式二中的任一种或者两种。方式一：根据每

个视频帧中的人脸参数，确定人脸参数未重复出现在其它视频帧中的非重复视频帧；将至少一个非重复视频帧确定为关键帧。

即，非重复视频帧是指人脸参数与其它任何一个视频帧都不相同的视频帧，也就是人脸画面并未重复出现在其它视频帧中，因此，可以任意选择一个或多个非重复视频帧作为关键帧。

方式二：根据每个视频帧中的人脸参数，确定人脸参数相同的至少一组重复视频帧，每组重复视频帧中包括至少两个视频帧，每组重复视频帧中摄取时间最晚的视频帧与摄取时间最早的视频帧之间的摄取时间之差小于或等于预设时长，每组重复视频帧中所有视频帧的人脸参数相同；将每组重复视频帧中的任一视频帧确定为关键帧。

其中，预设时长可预先设定，由于通常视频内相同画面不会持续太长时间，因此，预设时长不宜太长，考虑到视频是一秒钟播放24帧的，所以可将预设时长控制于N/24秒内，N大于等于1、且小于或等于24(或36、或者其他数值，可根据需要来定)，预设时长越短，最后选取的关键帧越准确。即，每组重复视频帧中的每个视频帧的人脸画面是相同的，也就是相同的人脸画面出现在了多个视频帧中。因此，可以在每组重复视频帧中选择任意一个视频帧作为关键帧，实现了去重效果，提高了选择关键帧的效率。

以上方式一、方式二可以单独实施，也可以结合实施。

在步骤S102中，获取关键帧中的人脸特征。

在步骤S103中，获取图片类别对应的人脸特征。

在步骤S104中，根据关键帧中的人脸特征和图片类别对应的人脸特征，确定视频所归属的图片类别。

在步骤S105中，将视频分配至视频所归属的图片类别中。

本公开实施例提供的上述方法，可以智能自动地将视频与图片进行归类，不仅不需要用户手动归类，而且依据人脸特征来进行分类，准确性高。

在一个实施例中，步骤S104可实施为步骤B1-B2：步骤B1、在图片类别对应的人脸特征中，确定与关键帧中的人脸特征匹配的图片类别；例如，可以执行前述步骤A1-A5，通过人脸聚类处理，根据关键帧中的人脸特征来确定关键帧所归属的图片类别，关键帧所归属的图片类别即为与关键帧中的人脸特征匹配的图片类别；步骤B2、将上述步骤B1确定出的匹配的图片类别确定为视频所归属的图片类别。

在另一个实施例中，步骤S104可实施为步骤C1-C3：

步骤C1、当视频的数目为至少两个时，确定每个视频的关键帧中的人脸特征；步骤C2、根据每个视频的关键帧中的人脸特征，对至少两个视频进行人脸聚类处理，获得至少一个视频类别，一个视频类别对应一个人脸；具体地，可使用前述步骤A1-A5所示人脸聚类方法，对每个关键帧进行人脸聚类处理，获得至少一个类；一个类就是一个视频类别，从而每个视频类别对应一个人脸特征；视频的关键帧所属的视频类别，就是该视频所属的视频类别；步骤C3、根据至少一个视频类别各自对应的人脸特征和图片类别对应的人脸特征，确定对应相同人脸特征的视频类别和图片类别；即，确定出对应相同人脸特征的视频类别和图片类别。相应地，上述步骤S105可实施为：将每个视频类别中的视频分配至对应相同人脸特征的图片类别中。此种方式，是先将视频进行人脸聚类处理，获得视频类别，然后再将视频类别和图片类别进行人脸聚类处理，确定出对应相同人脸的视频类别和图片类别，将每个视频类别中的视频分配至对应相同人脸特征的图片类别中，从而实现了对视频的归类处理。

在一个实施例中，上述方法还可以利用如下方式进行视频归类，这种方式不需要进行人脸聚类处理，而是粗略地认为只要是拍摄时间和拍摄地点相同的视频和图片，就认为它们是同一个人参与的，可将它们归入一类，此种方式具有一定的准确性，并且归类速度快。如图3所示，上述方法还可包括步骤S301-S303：步骤S301，获取视频的拍摄时间和拍摄地点；步骤S302，确定与视频的拍摄时间和拍摄地点相同的目的图片；步骤S303，将视频分配至目的图片所归属的图片类别中。

本公开实施例的第二方面，提供一种视频归类装置，该装置可用于管理多媒体文件的应用程序，此时，该装置中涉及到的视频、图片类别以及图片类别下的图片，是指上述应用程序所在设备中存储的视频、图片类别以及图片类别下的图片。另外，该装置也可以用于存储有多媒体文件的电子设备，此时，该装置中涉及到的视频、图片类别以及图片类别下的图片，是指存储于该电子设备中的视频、图片类别以及图片类别下的图片。上述应用程序或电子设备可以是周期性地自动触发该装置执行操作，也可以是在接收到用户的指示时触发该装置执行操作，还可以是在监测到产生了至少一个新视频时自动触发该该装置执行操作，触发时机可以有多种，并不限于以上例举的几种，其最终目的是利用该装置对视频进行智能归类，节省人力。如图4所示，该装置包括：

第一获取模块41，被配置为获取视频中包括人脸的关键帧；

第二获取模块42，被配置为获取第一获取模块41获取到的关键帧中的人脸特征；

第三获取模块43，被配置为获取图片类别对应的人脸特征；

第一确定模块44，被配置为根据第二获取模块42获取到的关键帧中的人脸特征和第三获取模块43获取到的图片类别对应的人脸特征，确定视频所归属的图片类别；

第一分配模块45，被配置为将视频分配至第一确定模块41确定出的视频所归属的图片类别中。

本公开实施例提供的上述装置，可以智能自动地将视频与图片进行归类，不仅不需要用户手动归类，而且依据人脸特征来进行分类，准确性高。

在一个实施例中，如图5所示，第一获取模块41，包括：

获取子模块51，被配置为从视频中获取包括人脸的至少一个视频帧；

第一确定子模块52，被配置为确定获取子模块51获取到的至少一个视频帧中，每个视频帧中的人脸参数，人脸参数包括人脸数目、人脸位置中的任一项或两项；

第二确定子模块53，被配置为根据每个视频帧中的人脸参数，确定视频中的关键帧。

在一个实施例中，第二确定子模块53，还被配置为根据每个视频帧中的人脸参数，确定人脸参数未重复出现在其它视频帧中的非重复视频帧；将至少一个非重复视频帧确定为关键帧。即，非重复视频帧是指人脸参数与其它任何一个视频帧都不相同的视频帧，也就是人脸画面并未重复出现在其它视频帧中，因此，可以任意选择一个或多个非重复视频帧作为关键帧。

在一个实施例中，第二确定子模块53，还被配置为根据每个视频帧中的人脸参数，确定人脸参数相同的至少一组重复视频帧，每组重复视频帧中包括至少两个视频帧，每组重复视频帧中摄取时间最晚的视频帧与摄取时间最早的视频帧之间的摄取时间之差小于或等于预设时长，每组重复视频帧中所有视频帧的人脸参数相同；将每组重复视频帧中的任一视频帧确定为关键帧。

在一个实施例中，如图6所示，第一确定模块44，包括：

第三确定子模块61，被配置为当视频的数目为至少两个时，确定每个视频的关键帧中的人脸特征；根据每个视频的关键帧中的人脸特征，对至少两个视频进行人脸聚类处理，获得至少一个视频类别；一个视频类别对应一个人脸；具体地，可使用前述步骤A1-A5所示人脸聚类方法，对每个关键帧进行人脸聚类处理，获得至少一个类；一个类就是一个视频类别，从而每个视频类别对应一个人脸特征；视频的关键帧所属的视频类别，就是该视频所属的视频类别；根据至少一个视频类别各自对应的人脸特征和图片类别对应的人脸特征，确定对应相同人脸特征的视频类别和图片类别；即，确定出对应相同人脸特征的视频类别和图片类别。

第一分配模块45，包括：

第一分配子模块62，被配置为将第三确定子模61确定出的每个视频类别中的视频分配至对应相同人脸特征的图片类别中。

上述装置，是先将视频进行人脸聚类处理，获得视频类别，然后再将视频类别和图片类别进行人脸聚类处理，确定出对应相同人脸的视频类别和图片类别，将每个视频类别中的视频分配至对应相同人脸特征的图片类别中，从而实现了对视频的归类处理。

在一个实施例中，如图7所示，第一确定模块44，包括：

第四确定子模块71，被配置为在图片类别对应的人脸特征中，确定与关键帧中的人脸特征匹配的图片类别；

第二分配子模块72，被配置为将第四确定子模块71确定出的匹配的图片类别确定为视频所归属的图片类别。

在一个实施例中，如图8所示，上述装置还包括：

第四获取模块81，被配置为获取视频的拍摄时间和拍摄地点；

第二确定模块82，被配置为确定与第四获取模块81获取到的视频的拍摄时间和拍摄地点相同的目的图片；

第二分配模块83，被配置为将视频分配至第二确定模块82确定出的目的图片所归属的图片类别中。

上述装置不需要进行人脸聚类处理，而是粗略地认为只要是拍摄时间和拍摄地点相同的视频和图片，就认为它们是同一个人参与的，可将它们归入一类，此种方式具有一定的准确性，并且归类速度快。

处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为：

获取视频中包括人脸的关键帧；

获取关键帧中的人脸特征；

获取图片类别对应的人脸特征；

根据关键帧中的人脸特征和图片类别对应的人脸特征，确定视频所归属的图片类别；

将视频分配至视频所归属的图片类别中。

图9是根据一示例性实施例示出的一种用于视频归类的装置800的框图。例如，装置800可以是移动设备，如移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图9，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种视频归类方法，所述方法包括：

获取视频中包括人脸的关键帧；

获取所述关键帧中的人脸特征；

获取图片类别对应的人脸特征；

将所述视频分配至所述视频所归属的图片类别中。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种视频归类方法，其特征在于，包括：

获取视频中包括人脸的关键帧；

获取所述关键帧中的人脸特征；

获取图片类别对应的人脸特征；

根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别；

将所述视频分配至所述视频所归属的图片类别中。
如权利要求1所述的方法，其特征在于，所述获取视频中包括人脸的关键帧，包括：

从所述视频中获取包括人脸的至少一个视频帧；

确定所述至少一个视频帧中，每个视频帧中的人脸参数，所述人脸参数包括人脸数目、人脸位置中的任一项或两项；

根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧。
根据权利要求2所述的方法，其特征在于，所述根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧，包括：

根据所述每个视频帧中的所述人脸参数，确定所述人脸参数未重复出现在其它视频帧中的非重复视频帧；

将至少一个所述非重复视频帧确定为所述关键帧。
根据权利要求2所述的方法，其特征在于，所述根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧，包括：

根据所述每个视频帧中的所述人脸参数，确定所述人脸参数相同的至少一组重复视频帧，每组所述重复视频帧中包括至少两个视频帧，每组所述重复视频帧中摄取时间最晚的视频帧与摄取时间最早的视频帧之间的摄取时间之差小于或等于预设时长，每组所述重复视频帧中所有视频帧的人脸参数相同；

将每组所述重复视频帧中的任一视频帧确定为所述关键帧。
如权利要求1所述的方法，其特征在于，

所述根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别，包括：

当所述视频的数目为至少两个时，确定每个视频的所述关键帧中的人脸特征；

根据每个视频的所述关键帧中的人脸特征，对所述至少两个视频进行人脸聚类处理，获得至少一个视频类别；

根据所述至少一个视频类别各自对应的人脸特征和所述图片类别对应的人脸特征，确定对应相同人脸特征的视频类别和图片类别；

所述将所述视频分配至所述视频所归属的图片类别中，包括：

将所述每个视频类别中的视频分配至对应相同人脸特征的图片类别中。
如权利要求1所述的方法，其特征在于，所述根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别，包括：

在所述图片类别对应的人脸特征中，确定与所述关键帧中的人脸特征匹配的图片类别；

将所述匹配的图片类别确定为所述视频所归属的图片类别。
如权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述视频的拍摄时间和拍摄地点；

确定与所述视频的拍摄时间和拍摄地点相同的目的图片；

将所述视频分配至所述目的图片所归属的图片类别中。
一种视频归类装置，其特征在于，包括：

第一获取模块，用于获取视频中包括人脸的关键帧；

第二获取模块，用于获取所述第一获取模块获取到的所述关键帧中的人脸特征；

第三获取模块，用于获取图片类别对应的人脸特征；

第一确定模块，用于根据所述第二获取模块获取到的所述关键帧中的人脸特征和所述第三获取模块获取到的所述图片类别对应的人脸特征，确定所述视频所归属的图片类别；

第一分配模块，用于将所述视频分配至所述第一确定模块确定出的所述视频所归属的图片类别中。
如权利要求8所述的装置，其特征在于，所述第一获取模块，包括：

获取子模块，用于从所述视频中获取包括人脸的至少一个视频帧；

第一确定子模块，用于确定所述获取子模块获取到的所述至少一个视频帧中，每个视频帧中的人脸参数，所述人脸参数包括人脸数目、人脸位置中的任一项或两项；

第二确定子模块，用于根据所述每个视频帧中的人脸参数，确定所述视频中的关键帧。
如权利要求9所述的装置，其特征在于，

所述第二确定子模块，还用于根据所述每个视频帧中的所述人脸参数，确定所述人脸参数未重复出现在其它视频帧中的非重复视频帧；将至少一个所述非重复视频帧确定为所述关键帧。
如权利要求9所述的装置，其特征在于，

所述第二确定子模块，还用于根据所述每个视频帧中的所述人脸参数，确定所述人脸参数相同的至少一组重复视频帧，每组所述重复视频帧中包括至少两个视频帧，每组所述重复视频帧中摄取时间最晚的视频帧与摄取时间最早的视频帧之间的摄取时间之差小于或等于预设时长，每组所述重复视频帧中所有视频帧的人脸参数相同；将每组所述重复视频帧中的任一视频帧确定为所述关键帧。
如权利要求8所述的装置，其特征在于，

所述第一确定模块，包括：

第三确定子模块，用于当所述视频的数目为至少两个时，确定每个视频的所述关键帧中的人脸特征；根据每个视频的所述关键帧中的人脸特征，对所述至少两个视频进行人脸聚类处理，获得至少一个视频类别；根据所述至少一个视频类别各自对应的人脸特征和所述图片类别对应的人脸特征，确定对应相同人脸特征的视频类别和图片类别；

所述第一分配模块，包括：

第一分配子模块，用于将所述第三确定子模块确定出的所述每个视频类别中的视频分配至对应相同人脸特征的图片类别中。
如权利要求8所述的装置，其特征在于，所述第一确定模块，包括：

第四确定子模块，用于在所述图片类别对应的人脸特征中，确定与所述关键帧中的人脸特征匹配的图片类别；

第二分配子模块，用于将所述第四确定子模块确定出的所述匹配的图片类别确定为所述视频所归属的图片类别。
如权利要求8所述的装置，其特征在于，所述装置还包括：

第四获取模块，用于获取所述视频的拍摄时间和拍摄地点；

第二确定模块，用于确定与所述第四获取模块获取到的所述视频的拍摄时间和拍摄地点相同的目的图片；

第二分配模块，用于将所述视频分配至所述第二确定模块确定出的所述目的图片所归属的图片类别中。
一种视频分类装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取视频中包括人脸的关键帧；

获取所述关键帧中的人脸特征；

获取图片类别对应的人脸特征；

根据所述关键帧中的人脸特征和所述图片类别对应的人脸特征，确定所述视频所归属的图片类别；

将所述视频分配至所述视频所归属的图片类别中。