CN106874170B

CN106874170B - 兴趣内容识别方法及装置

Info

Publication number: CN106874170B
Application number: CN201710074305.0A
Authority: CN
Inventors: 蒋化冰; 孙斌; 吴礼银; 康力方; 李小山; 张干; 赵亮; 邹武林; 徐浩明; 廖凯
Original assignee: Shanghai Mumu Jucong Robot Technology Co ltd
Current assignee: SHANGHAI MUMU JUCONG ROBOT TECHNOLOGY Co.,Ltd.
Priority date: 2017-02-10
Filing date: 2017-02-10
Publication date: 2020-11-03
Anticipated expiration: 2037-02-10
Also published as: CN106874170A

Abstract

本申请实施例提供一种兴趣内容识别方法及装置。方法包括：根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间；根据至少一个被浏览内容块各自的浏览时间以及数据量，计算至少一个被浏览内容块各自的单位浏览时间；根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容。本申请实施例可以更加精确识别用户感兴趣的内容。

Description

兴趣内容识别方法及装置

技术领域

本申请涉及移动互联网技术领域，尤其涉及一种兴趣内容识别方法及装置。

背景技术

随着移动互联网技术的发展，出现了基于互动的多媒体电子产品。在这些产品的使用过程中，允许通过触摸方式与用户进行互动。

在互动过程中，一般将用户点击浏览的内容视为用户感兴趣的内容，但这种方式比较粗略，无法精确识别用户感兴趣的内容。

发明内容

本申请实施例提供一种兴趣内容识别方法及装置，用以更加精确识别用户感兴趣的内容。

本申请实施例提供一种兴趣内容识别方法，包括：

根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间；

根据所述至少一个被浏览内容块各自的浏览时间以及数据量，计算所述至少一个被浏览内容块各自的单位浏览时间；

根据所述至少一个被浏览内容块各自的单位浏览时间，确定所述用户的兴趣内容。

在一可选实施方式中，所述根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间，包括：

在所述内容浏览过程中，按照预设的采集间隔，采集所述用户的面部朝向；

根据采集到的所述用户的面部朝向，确定所述至少一个被浏览内容块；

根据所述至少一个被浏览内容块各自对应的面部朝向被连续采集的次数以及所述采集间隔，确定所述至少一个被浏览内容块各自的浏览时间。

在一可选实施方式中，所述根据所述至少一个被浏览内容块各自的浏览时间以及数据量，计算所述至少一个被浏览内容块各自的单位浏览时间，包括：

计算所述至少一个被浏览内容块各自的浏览时间与数据量的比值，以作为所述至少一个被浏览内容块各自的单位浏览时间。

在一可选实施方式中，所述根据所述至少一个被浏览内容块各自的单位浏览时间，确定所述用户的兴趣内容，包括：

归一化处理所述至少一个被浏览内容块各自的单位浏览时间，以获得所述至少一个被浏览内容块各自的归一化浏览时间；

根据所述至少一个被浏览内容块各自的归一化浏览时间，从所述至少一个被浏览内容块中确定所述用户的兴趣内容。

在一可选实施方式中，所述归一化处理所述至少一个被浏览内容块各自的单位浏览时间，以获得所述至少一个被浏览内容块各自的归一化浏览时间，包括：

根据所述至少一个被浏览内容块各自的单位浏览时间，确定最大单位浏览时间和最小单位浏览时间；

将所述至少一个被浏览内容块各自的单位浏览时间与所述最小单位浏览时间之差，除以所述最大单位浏览时间与所述最小单位浏览时间之差，以获得所述至少一个被浏览内容块各自的归一化浏览时间。

在一可选实施方式中，所述根据所述至少一个被浏览内容块各自的归一化浏览时间，从所述至少一个被浏览内容块中确定所述用户的兴趣内容，包括：

建立所述至少一个被浏览内容块各自的索引、内容摘要以及归一化浏览时间之间的映射关系；

根据所述至少一个被浏览内容块各自的归一化浏览时间，计算平均归一化浏览时间；

从所述射关系中，确定归一化浏览时间大于所述平均归一化浏览时间的被浏览内容块的内容摘要，作为所述用户的兴趣内容。

在一可选实施方式中，所述根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间之前，还包括：

对待浏览的内容页进行区域化识别；

根据所述区域化识别的结果，确定所述内容页或所述内容页中的内容区域作为内容块，并统计作为内容块的所述内容页或所述内容区域的数据量。

本申请实施例还提供一种兴趣内容识别装置，包括：

识别单元，用于根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间；

计算单元，用于根据所述至少一个被浏览内容块各自的浏览时间以及数据量，计算所述至少一个被浏览内容块各自的单位浏览时间；

确定单元，用于根据所述至少一个被浏览内容块各自的单位浏览时间，确定所述用户的兴趣内容。

在一可选实施方式中，所述识别单元具体用于：

在一可选实施方式中，所述计算单元具体用于：

在本申请实施例中，基于用户在内容浏览过程中的面部朝向，识别被浏览内容块以及被浏览内容块的浏览时间，充分考虑浏览时间与用户兴趣程度之间的正相关性，基于被浏览内容块的浏览时间，确定用户的兴趣内容，有利于更加精确地识别用户感兴趣的内容。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请一实施例提供的兴趣内容识别方法的流程示意图；

图2为本申请另一实施例提供的兴趣内容识别方法的流程示意图；

图3为本申请另一实施例提供的兴趣内容识别结果的示意图；

图4为本申请又一实施例提供的人机交互系统的结构示意图；

图5为本申请又一实施例提供的兴趣内容识别装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在识别用户兴趣内容时，现有技术无法精确地识别用户的兴趣内。针对该问题，本申请实施例提供一种解决方案，主要原理是：结合用户在内容浏览过程中的面部朝向，识别用户浏览的内容块以及对内容块的浏览时间，进一步利用浏览时间与用户兴趣程度之间的正相关性，基于用户对内容块的浏览时间，确定用户的兴趣内容，有利于更加精确地识别用户感兴趣的内容。

下面通过具体实施例对本申请实施例的技术方案进行详细说明。

图1为本申请一实施例提供的兴趣内容识别方法的流程示意图。如图1所示，所述方法包括：

101、根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间。

102、根据至少一个被浏览内容块各自的浏览时间以及数据量，计算至少一个被浏览内容块各自的单位浏览时间。

103、根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容。

在本实施例中，将用户需要浏览的内容称为内容块。根据应用场景的不同，内容块的粒度可适应性设置。例如，可以将整个内容页作为一个内容块，也可以将内容页中的部分内容(例如某个内容区域)作为一个内容块。在本实施例中，对内容块的粒度不做限定。

在用户进行内容浏览的过程中，用户头部一般会跟随浏览位置而动作。例如，当用户从页面左侧浏览到页面右侧时，用户头部会向右侧转动；当用户从页面顶部浏览到页面底部时，用户头部会产生低头动作。基于用户的面部朝向，可识别出用户浏览的内容块。因此，在本实施例中，可结合用户的面部朝向识别用户的兴趣内容。

另外，用户对某一内容块的浏览时间与用户对该内容块的兴趣度具有一定程度的正相关性。简单来说，用户对某一内容块的浏览时间越长，一定程度上说明用户对该内容块的兴趣度较高；反之，用户对某一内容块的浏览时间越短，一定程度上说明用户对该内容块的兴趣度较低。因此，在本实施例中，可以结合用户对内容块的浏览时间识别用户的兴趣内容。

一般来说，用户对某一内容块的浏览时间越长，用户头部在该内容块所在位置方向停留时间越长；反之，用户对某一内容块的浏览时间越短，用户头部在该内容块所在位置方向停留时间越短。这意味着用户面部朝向的改变一定程度上可以反映用户对某内容块的浏览时间。

基于上述分析，在本实施例中，采集用户在内容浏览过程中的面部朝向；基于用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块以及至少一个被浏览内容块各自的浏览时间。其中，被浏览内容块是指被用户浏览过的内容块(可根据用户的面部朝向来识别)；被浏览内容块的浏览时间是指用户对被浏览内容块的浏览时间。本实施例并不限定被浏览内容块的数量，其可以是至少一个(一个或一个以上)。

进一步，考虑到不同被浏览内容块的数据量一般不同，理论上，数据量越多，浏览时间越长，所以被浏览内容块的浏览时间的长短并不能直接决定用户对该内容块的兴趣度。因此，在本实施例中，根据至少一个被浏览内容块各自的浏览时间以及数据量，计算至少一个被浏览内容块各自的单位浏览时间；进而根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容。

值得说明的是，本实施例不对上述“单位浏览时间”中的“单位”做限定。例如，可以以1个字符为单位，则单位浏览时间实际上是指用户对1个字符的平均浏览时间。又例如，可以以连续10个字符为单位，则单位浏览时间实际上是指用户对连续10个字符的平均浏览时间。又例如，可以以一行字符为单位，则单位浏览时间实际上是指用户对一行字符的平均浏览时间。又例如，可以以1秒为单位，则单位浏览时间实际上是指用户1秒钟能够浏览的字符数。又例如，可以以5秒为单位，则单位浏览时间实际上是指用户5秒钟能够浏览的字符数。

在本实施例中，结合用户在内容浏览过程中的面部朝向，识别用户浏览的内容块以及对内容块的浏览时间，进一步利用浏览时间与用户兴趣程度之间的正相关性，基于用户对内容块的浏览时间，确定用户的兴趣内容，有利于更加精确地识别用户感兴趣的内容。

在上述实施例或下述实施例中，步骤101，即根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间的实施方式，可以为：

首先，在内容浏览过程中，按照预设的采集间隔，采集用户的面部朝向。其中，根据应用场景的不同，采集间隔可适应性设置，例如可以是0.2秒，0.5秒，10秒，30秒等。然后，根据采集到的用户的面部朝向，确定至少一个被浏览内容块。例如，可以预先建立用户的面部朝向与内容块之间的映射关系，基于该映射关系，将用户的面部朝向对应的内容块作为被浏览内容块。最后，将用户在被浏览内容块的停留时间近似为用户对所述被浏览内容块的浏览时间，则可以根据至少一个被浏览内容块各自对应的面部朝向被采集到的次数以及采集间隔，确定至少一个被浏览内容块各自的浏览时间。

可选地，采集用户的面部朝向的实施方式可以为：在内容浏览过程中，可以按照预设的采集间隔，对用户的脸部区域进行图像采集，以获得人脸图像帧；在获得人脸图像帧后，可以使用OpenFace开源的面部行为分析工具，调用voidoutputAllFeatures获得检测结果数据，其中包括了面部朝向的坐标数据pose_estimate，进而可以根据pose_estimate数据的变化识别用户的面部朝向。其中，OpenFace是一个基于深度神经网络的开源人脸识别系统，其原理可参见现有技术，在此不再赘述。

可选的，在对用户的面部行为进行分析的过程中，可以通过OpenFace/FeatureExtraction/FeatureExtraction.cpp中Void outputAllFeatures()函数将每个人脸图像帧的检测结果记录到一个文件中。基于此，可以利用constcv::Vec6d&pose_estimate从所述文件中获得用户的面部朝向信息，进而基于用户的面部朝向确定被浏览内容块。其中，将面部朝向对应的内容块视为用户浏览的内容块，即被浏览内容块。

优选地，在具体实施过程中，可以通过一数据文档，记录采集用户的面部朝向过程中的相关数据。为便于区分和描述，将该数据文档命名为time_index_region.csv，但不限于该名称。在名称为time_index_region.csv的数据文档中，对应记录各个采集时间、在各采集时间采集到的用户的面部朝向以及面部朝向对应的内容块的索引。例如，名称为time_index_region.csv的数据文档的一种记录格式如表1所示：

表1

在上述表1所示应用场景中，将内容页划分为左中右三个区域，每个区域作为一个内容块，不同区域的索引为内容页的标识+区域位置。基于此，在表1中，ID_1_L表示标识为ID_1的内容页的左侧区域；ID_1_M表示标识为ID_1的内容页的中间区域。相应地，标识为ID_1的内容页的右侧区域可表示为ID_1_R。当然，如果还有标识为ID_2的内容页，则其左侧区域、中间区域以及右侧区域可分别表示为ID_2_L、ID_2_M、ID_2_R。

基于上述表1，上述根据至少一个被浏览内容块各自对应的面部朝向被连续采集的次数以及采集间隔，确定至少一个被浏览内容块各自的浏览时间的实施方式，可以为：根据名称为time_index_region.csv的数据文档，对任一被浏览内容块的索引，统计该索引对应的面部朝向的个数，该个数即为该索引所标识被浏览内容块对应的面部朝向被连续采集的次数，将统计到的个数乘以采集间隔，作为该索引所标识被浏览内容块的浏览时间。

可选地，可以通过一数据文档，对应记录被浏览内容块的索引与浏览时间。为便于描述和区分，将该数据文档命名为index_time.csv，但不限于此。例如，结合表1，名称为index_time.csv的数据文档的一种记录格式如表2所示：

表2

内容块的索引(index)	浏览时间(单位为s)
		ID_1_L	20
ID_1_M	30
		ID_1_R	90
…	…

在上述实施例或下述实施例中，在获得至少一个被浏览内容块各自的浏览时间后，可以根据至少一个被浏览内容块各自的浏览时间以及数据量，计算至少一个被浏览内容块各自的单位浏览时间，以便于基于至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容。

可选地，步骤102，即根据至少一个被浏览内容块各自的浏览时间以及数据量，计算至少一个被浏览内容块各自的单位浏览时间的一种实施方式，可以为：计算至少一个被浏览内容块各自的浏览时间与数据量的比值，以作为至少一个被浏览内容块各自的单位浏览时间。在该可选实施方式中，单位浏览时间是指单位数据量的浏览时间。

在一种具体实施过程中，可以结合表2，根据至少一个被浏览内容块的索引，获取至少一个被浏览内容块各自的浏览时间，利用至少一个被浏览内容块各自的浏览时间除以各自的数据量，以获得至少一个被浏览内容块各自的单位浏览时间。例如，假设索引为ID_1_L的内容块的数据量为10，浏览时间20.0，索引为ID_1_L的内容块的单位浏览时间为20/10＝2。

在上述实施例或下述实施例中，在获得至少一个被浏览内容块各自的单位浏览时间后，可以根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容。

可选地，步骤103，即根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容的一种实施方式，可以为：直接根据至少一个被浏览内容块各自的单位浏览时间，从至少一个被浏览内容块中确定用户的兴趣内容。

例如，可以获取最大单位浏览时间对应的内容块，作为用户的兴趣内容。或者，可以将至少一个被浏览内容块各自的单位浏览时间与预设时间阈值进行比较；选择单位浏览时间大于预设时间阈值的内容块，作为用户的兴趣内容。

可选地，步骤103，即根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容的另一种实施方式，可以为：归一化处理至少一个被浏览内容块各自的单位浏览时间，以获得至少一个被浏览内容块各自的归一化浏览时间；根据至少一个被浏览内容块各自的归一化浏览时间，从至少一个被浏览内容块中确定用户的兴趣内容。

上述归一化处理的步骤为：根据至少一个被浏览内容块各自的单位浏览时间，确定最大单位浏览时间和最小单位浏览时间；将至少一个被浏览内容块各自的单位浏览时间与最小单位浏览时间之差，除以最大单位浏览时间与最小单位浏览时间之差，以获得至少一个被浏览内容块各自的归一化浏览时间。在该实施方式中，通过归一化处理，可以将至少一个被浏览内容块的单位浏览时间位于指定时间范围内，便于分析和比较。

可选地，可以通过一数据文档，对应记录被浏览内容块的索引与归一化浏览时间。所述数据文档可以是上述名称为index_time.csv的数据文档，也可以是一独立的数据文档。

上述根据归一化浏览时间确定用户的兴趣内容，可以采用但不限于以下实施方式：

实施方式一：获取最大归一化浏览时间对应的内容块，作为用户的兴趣内容。

实施方式二：将至少一个被浏览内容块各自的归一化浏览时间与预设时间阈值进行比较，选择归一化浏览时间大于预设时间阈值的内容块，作为用户的兴趣内容。

实施方式三：建立至少一个被浏览内容块各自的索引、内容摘要以及归一化浏览时间之间的映射关系；根据至少一个被浏览内容块各自的归一化浏览时间，计算平均归一化浏览时间；从至少一个被浏览内容块各自的索引、内容摘要以及归一化浏览时间之间的映射关系中，确定归一化浏览时间大于平均归一化浏览时间的被浏览内容块的内容摘要，作为用户的兴趣内容。

在具体实施过程中，可以分别从至少一个被浏览内容块中提取内容摘要，并通过一数据文档，对应记录被浏览内容块的索引与内容摘要。为便于描述和区分，将该数据文档命名为index_abstract.csv，但不限于此。例如，名称为index_abstract.csv的数据文档的一种记录格式如表3所示：

表3

内容块的索引	内容摘要
		ID_1_L	abstract_1
ID_1_M	abstract_2
		ID_1_R	abstract_3
…	…

进一步，结合上述记录被浏览内容块的索引与归一化浏览时间的数据文档(例如表2所示数据文档)和表3所示数据文档，可建立至少一个被浏览内容块各自的索引、内容摘要以及归一化浏览时间之间的映射关系。

可选地，在基于上述映射关系确定用户的兴趣内容的过程中，可以对归一化浏览时间进行排序，可以是从大到小排序，也可以是从小到大排序；基于排序结果，确定大于平均归一化浏览时间的被浏览内容块，进而选择所确定的被浏览内容块的内容摘要，作为用户的兴趣内容。

在上述实施方式三中，根据至少一个被浏览内容块各自的归一化浏览时间，计算平均归一化浏览时间，以平均归一化浏览时间作为时间阈值来识别用户的兴趣内容。该平均归一化浏览时间属于自动调节的阈值，适应不同用户的阅读习惯，有利于提高识别效果。

在上述实施例或下述实施例中，在识别至少一个被浏览内容块各自的浏览时间之前，可以对待浏览的内容页进行区域化识别；根据区域化识别的结果，确定内容页或内容页中的内容区域作为内容块，并统计作为内容块的内容页或内容区域的数据量。

简单来说，在进行兴趣内容识别之前，先判断内容页是否被划分为不同区域；如果识别出内容页被划分为不同区域，则将内容区域作为内容块，即以内容区域为粒度进行兴趣内容识别；如果未识别出内容页被划分不同区域或识别出内容页未进行区域划分，则将内容页作为内容块，即以内容页为粒度进行兴趣内容识别。所述内容页可以是包含任何内容、任何形式的页面，例如可以是产品宣传页、新闻页、网页等。

当然，上述区域化识别的步骤为可选步骤。对于预先已经知道是否进行区域划分的内容页，则无需执行上述区域化识别步骤，可直接确定内容块的粒度，然后进入兴趣内容识别流程。

值得说明的是，上述各种可选实施方式可以相互组合实施，以形成更为具体的实施方式。下面以一最优组合方式为例进行举例说明。

图2为本申请另一实施例提供的兴趣内容识别方法的流程示意图。在图2所示实施例中，可为内容页设置标识，例如用ID_1，ID_2，ID_3……分别表示内容页1，内容页2，内容页3……。另外，各内容页包含内容区域，且不同内容区域可通过其在内容页中的位置来区分，例如内容页1可以包括左侧区域、中间区域和右侧区域。在本实施例中，以内容区域视为内容块，即以内容区域为粒度进行兴趣内容识别，并且可将内容页的标识和内容区域在内容页中的位置相结合，以标识内容区域。例如，内容页1的左侧区域、中间区域和右侧区域可以分别表示为ID_1_L、ID_1_M和ID_1_R。在此基础上，如图2所示，所述方法包括以下步骤：

201、获取待浏览的至少一个内容页中作为内容块的内容区域的数据量。

在本步骤中，可以统计各内容页包含的各内容区域中的数据量。值得说明的是，对于不同形式的内容页，数据量的定义可以有所不同。对于纯文本内容页，所述数据量主要是指文字数目；对于图文结合的内容页，所述数据量可以综合考虑文字数目和图片包含的信息量大小，等等。

以数据量为文字数目为例，一种统计结果为：内容页1的左侧区域所包含的字数是10，内容页1的中间区域所包含的字数是15，内容页1的右侧区域所包含的字数是20……。

可选地，可以通过一数据文档，对应存储各内容页包含的内容区域以及内容区域所包含的文字数目。为便于描述和区分，可以将该数据文档命名为index_wordsCount.csv，但不限于此。例如，名称为index_wordsCount.csv的数据文档的一种存储格式，如表4所示：

表4

内容区域的索引	文字数目
		ID_1_L	10
ID_1_M	15
		ID_1_R	20
…	…

在步骤201中，预先统计出各内容块的数据量，可为后续步骤中单位浏览时间的计算提供条件。

202、在浏览至少一个内容页的过程中，按照预设的采集间隔，采集用户的面部朝向。

203、根据采集到的用户的面部朝向，确定至少一个被浏览内容块。

204、根据至少一个被浏览内容块各自对应的面部朝向被连续采集的次数以及采集间隔，确定至少一个被浏览内容块各自的浏览时间。

205、计算至少一个被浏览内容块各自的浏览时间与数据量的比值，以作为至少一个被浏览内容块各自的单位浏览时间。

206、归一化处理至少一个被浏览内容块各自的单位浏览时间，以获得至少一个被浏览内容块各自的归一化浏览时间。

207、建立至少一个被浏览内容块各自的索引、内容摘要以及归一化浏览时间之间的映射关系。

208、根据至少一个被浏览内容块各自的归一化浏览时间，计算平均归一化浏览时间。

209、从映射关系中，确定归一化浏览时间大于平均归一化浏览时间的被浏览内容块的内容摘要，作为用户的兴趣内容。

关于本实施例中其余各步骤，可参见上述实施例或实施方式中的描述，在此不再赘述。

另外，图3给出了一种兴趣内容识别示意图，有利于更加直观地理解本实施例识别到的用户的兴趣内容。在图3中，横轴表示被浏览内容块的索引，分别为ID_1_L、ID_1_M、ID_1_R、ID_2_L、ID_2_M、ID_2_R、ID_3_L、ID_3_M、ID_3_R、ID_4_L、ID_4_M、ID_5_M、ID_5_R、ID_6_M；纵轴表示被浏览内容块的归一化浏览时间，中间的横线表示平均归一化浏览时间。通过图3可直观的看出用户的兴趣内容为索引ID_1_L、ID_1_M、ID_2_L、ID_3_M、ID_4_L以及ID_4_M所标识内容块的内容摘要。

在本实施例中，基于用户在内容浏览过程中的面部朝向，识别被浏览内容块以及被浏览内容块的浏览时间，充分考虑浏览时间与用户兴趣程度之间的正相关性，基于被浏览内容块的浏览时间，计算被浏览内容块的归一化浏览时间，进而基于归一化浏览时间从被浏览内容块中确定用户的兴趣内容，有利于更加精确地识别用户感兴趣的内容。

本申请上述实施例提供的兴趣内容识别方法可由具有图像采集和识别、信息显示以及处理能力的设备实施，例如可由智能手机、平板电脑、台式电脑等设备实施。或者，本申请上述实施例提供的兴趣内容识别方法也可基于图4所示的人机交互系统实现，但并不限于此。如图4所示，所述人机交互系统包括：显示器10、图像采集设备20以及交互控制设备30。

其中，显示器10以及图像采集设备20分别与交互控制设备30连接。显示器10或图像采集设备20与交互控制设备30之间可以是无线或有线网络连接。

例如，显示器10或图像采集设备20可以通过移动网络与交互控制设备30通信连接。该移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。

又例如，显示器10或图像采集设备20可以通过WiFi、蓝牙、红外等无线网络与交互控制设备30通信连接。

在本系统中，显示器10主要用于显示人机交互界面，所述人机交互界面用于向用户显示待浏览的内容页。可选地，内容页包含多个内容区域，一个内容区域作为一个内容块。例如，内容页可以划分为左中右三个内容区域，但不限于此。

在本系统中，图像采集设备20主要用于对用户的脸部区域进行图像采集，以获得人脸图像帧。根据应用需求的不同，图像采集设备20可以实时或者在用户进行内容浏览的过程中采集一个或多个人脸图像帧。

可选的，图像采集设备20可架设于显示器10的某一部位，或者置于显示器10内部实现。

可选的，图像采集设备20可以是摄像头或摄像机等任何具有图像采集功能的设备。优选的，图像采集设备20可以选用普通的摄像头或摄像机，以降低整个人机交互系统的实现成本。

在本系统中，交互控制设备30连接于显示器10和图像采集设备20，主要用于根据图像采集设备20在用户进行内容浏览过程中采集到的人脸图像帧，识别用户的头部动，进而根据用户在内容浏览过程中的面部朝向，识别用户浏览的内容块以及用户对所述识别到的内容块的浏览时间；进而基于识别到的信息，从用户浏览的内容块中确定用户的兴趣内容。交互控制设备30识别用户的兴趣内容的过程可参见前述方法实施例，在此不再赘述。

可选的，交互控制设备30可以是任何具有一定处理能力的设备，例如可以是计算机、智能终端、平板电脑、服务器等。优选的，交互控制设备30可以选用成本较低的计算机，以降低整个人机交互系统的实现成本。

需要说明的是，上述实施例所提供方法的各步骤的执行主体均可以是同一设备，或者，该方法也由不同设备作为执行主体。比如，步骤101至步骤103的执行主体可以为设备A；又比如，步骤101和102的执行主体可以为设备A，步骤103的执行主体可以为设备B；等等。

图5为本申请又一实施例提供的兴趣内容识别装置的结构示意图。如图5所示，所述装置包括：识别单元51、计算单元52和确定单元53。

识别单元51，用于根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间。

计算单元52，用于根据至少一个被浏览内容块各自的浏览时间以及数据量，计算至少一个被浏览内容块各自的单位浏览时间。

确定单元53，用于根据至少一个被浏览内容块各自的单位浏览时间，确定用户的兴趣内容。

在一可选实施方式中，识别单元51具体用于：在内容浏览过程中，按照预设的采集间隔，采集用户的面部朝向；根据采集到的用户的面部朝向，确定至少一个被浏览内容块；根据至少一个被浏览内容块各自对应的面部朝向被连续采集的次数以及采集间隔，确定至少一个被浏览内容块各自的浏览时间。

在一可选实施方式中，计算单元52具体用于：计算至少一个被浏览内容块各自的浏览时间与数据量的比值，以作为至少一个被浏览内容块各自的单位浏览时间。

在一可选实施方式中，确定单元53具体用于：归一化处理至少一个被浏览内容块各自的单位浏览时间，以获得至少一个被浏览内容块各自的归一化浏览时间；根据至少一个被浏览内容块各自的归一化浏览时间，从至少一个被浏览内容块中确定用户的兴趣内容。

进一步，确定单元53在归一化处理至少一个被浏览内容块各自的单位浏览时间时，具体用于：根据至少一个被浏览内容块各自的单位浏览时间，确定最大单位浏览时间和最小单位浏览时间；将至少一个被浏览内容块各自的单位浏览时间与最小单位浏览时间之差，除以最大单位浏览时间与最小单位浏览时间之差，以获得至少一个被浏览内容块各自的归一化浏览时间。

进一步，确定单元53在基于归一化浏览时间确定用户的兴趣内容时，具体用于：建立至少一个被浏览内容块各自的索引、内容摘要以及归一化浏览时间之间的映射关系；根据至少一个被浏览内容块各自的归一化浏览时间，计算平均归一化浏览时间；从映射关系中，确定归一化浏览时间大于平均归一化浏览时间的被浏览内容块的内容摘要，作为用户的兴趣内容。

在一可选实施方式中，兴趣内容识别装置还包括：获取单元。

识别单元51，还用于在识别至少一个被浏览内容块各自的浏览时间之前，对待浏览的内容页进行区域化识别。获取单元，用于根据识别单元51的区域化识别结果，确定内容页或内容页中的内容区域作为内容块，并统计作为内容块的内容页或内容区域的数据量。

本实施例提供的兴趣内容识别装置，可用于执行上述方法实施例的流程，详细过程不再赘述。

本实施例提供的兴趣内容识别装置，基于用户在内容浏览过程中的面部朝向，识别被浏览内容块以及被浏览内容块的浏览时间，充分考虑浏览时间与用户兴趣程度之间的正相关性，基于被浏览内容块的浏览时间，确定用户的兴趣内容，有利于更加精确地识别用户感兴趣的内容。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种兴趣内容识别方法，其特征在于，包括：

根据所述至少一个被浏览内容块各自的单位浏览时间，确定所述用户的兴趣内容；

根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间，包括：

在数据文档中，对应记录各个采集时间、在各采集时间采集到的用户的面部朝向以及面部朝向对应的内容块的索引；

统计该索引对应的面部朝向的个数，该个数即为该索引所标识被浏览内容块对应的面部朝向被连续采集的次数，将统计到的个数乘以采集间隔，作为该索引所标识被浏览内容块的浏览时间。

2.根据权利要求1所述的方法，其特征在于，所述根据所述至少一个被浏览内容块各自的浏览时间以及数据量，计算所述至少一个被浏览内容块各自的单位浏览时间，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述至少一个被浏览内容块各自的单位浏览时间，确定所述用户的兴趣内容，包括：

4.根据权利要求3所述的方法，其特征在于，所述归一化处理所述至少一个被浏览内容块各自的单位浏览时间，以获得所述至少一个被浏览内容块各自的归一化浏览时间，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述至少一个被浏览内容块各自的归一化浏览时间，从所述至少一个被浏览内容块中确定所述用户的兴趣内容，包括：

从所述映射关系中，确定归一化浏览时间大于所述平均归一化浏览时间的被浏览内容块的内容摘要，作为所述用户的兴趣内容。

6.根据权利要求1-3任一项所述的方法，其特征在于，所述根据用户在内容浏览过程中的面部朝向，识别至少一个被浏览内容块各自的浏览时间之前，还包括：

对待浏览的内容页进行区域化识别；

7.一种兴趣内容识别装置，其特征在于，包括：

确定单元，用于根据所述至少一个被浏览内容块各自的单位浏览时间，确定所述用户的兴趣内容；

所述识别单元，具体用于在所述内容浏览过程中，按照预设的采集间隔，采集所述用户的面部朝向；

在数据文档中，对应记录各个采集时间、在各采集时间采集到的用户的面部朝向以及面部朝向对应的内容快的索引；

8.根据权利要求7所述的装置，其特征在于，所述计算单元具体用于：