CN109819282B

CN109819282B - 一种视频用户类别识别方法、装置和介质

Info

Publication number: CN109819282B
Application number: CN201711175744.7A
Authority: CN
Inventors: 杨文强
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-11-22
Filing date: 2017-11-22
Publication date: 2021-04-23
Anticipated expiration: 2037-11-22
Also published as: CN109819282A

Abstract

本发明提供一种视频用户类别识别方法、装置和介质，提高用户类别识别的通用性和识别效率的同时，降低网络带宽的开销。视频用户类别识别方法，包括：针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量；利用自动编码器对所述特征向量进行编码得到第一特征编码向量，其中，所述自动编码器的编码参数为利用第一历史观影样本数据进行训练得到的；根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别，其中，所述聚类模型的聚类数量为利用所述帐号下的第二历史观影样本数据进行训练得到的。

Description

一种视频用户类别识别方法、装置和介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种视频用户类别识别方法、装置和介质。

背景技术

网络视频，是指由网络视频服务商提供的、以流媒体为播放格式的、可以在线直播或点播的声像文件。网络视频一般需要独立的播放器，文件格式主要是基于P2P(Point toPoint，点对点)技术的占用客户端资源较少的FLV流媒体格式。用户通过向视频服务器注册获得账号，利用帐号用户可以观看视频服务器提供的网络视频。视频服务器针对每一帐号记录相应用户的观看数据，通过对记录的观看数据进行分析可以得到用户的观看偏好，视频服务器据此向用户推荐其喜欢观看的视频内容。

但是，实际应用中，还存在多个用户使用同一帐号登录视频服务器观看视频的情况，例如，针对TV端提供的网络视频业务，很多场景下都是家人在不同的时间段观看不同的视频。而如何识别同一帐号下不同的用户类别以进行个性化的视频内容推荐成为现有技术中亟待解决的技术问题之一。

为了解决这个问题，现有技术采用如下的技术方案：在用户观看视频的同时开启摄像头以采集当前用户图像，并将采集的图像通过网络传输到视频服务器，视频服务器采用人脸识别技术来识别当前观看视频的用户类别。

上述方法中，需要开启摄像头，很多情况下用户由于隐私、安全等原因并不愿意开启摄像头，这种情况下无法有效识别出当前观看视频的用户类别，降低了用户类别识别的通用性；另外，每次都需要将摄像头采集的图像发送给视频服务器进行人脸识别处理，一方面，网络传输图像所带来的网络带宽开销比较大；另一方面，视频服务器进行图像处理的时延也比较长，降低了用户类别识别的效率。

发明内容

本发明实施例提供一种视频用户类别识别方法、装置和介质，提高用户类别识别的通用性和识别效率的同时，降低网络带宽的开销。

第一方面，提供一种视频用户类别识别方法，包括：

针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量；

利用自动编码器对所述特征向量进行编码得到第一特征编码向量，其中，所述自动编码器的编码参数为利用第一历史观影样本数据进行训练得到的；

根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别，其中，所述聚类模型的聚类数量为利用所述帐号下的第二历史观影样本数据进行训练得到的。

可选地，利用第一历史观影样本数据按照以下方法进行训练得到所述自动编码器的编码参数：

分别从每一第一历史观影样本数据中提取至少一个原始特征组成第一源特征向量；

确定对应于每一第一历史观影样本数据的第一源特征向量组成第一源特征向量集；

利用候选编码参数对所述第一源特征向量集进行迭代训练，输出满足迭代终止条件时所使用的候选编码参数作为所述自动编码器的编码参数。

可选地，利用候选编码参数对所述第一源特征向量集进行迭代训练，输出满足迭代终止条件时所使用的候选编码参数作为所述自动编码器的编码参数，具体包括：

利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集，其中，候选编码参数的初始值为随机设定的；并利用候选解码参数对所述第一特征编码向量集进行解码得到目标特征向量集，其中，所述候选解码参数的初始值为随机设定的；

判断是否满足迭代终止条件，所述迭代终止条件包括以下任一条件：迭代次数达到预设的次数阈值、所述目标特征向量集与所述第一源特征向量集之间的误差不大于预设的第一误差阈值、最后一次迭代得到的目标特征向量集与相邻的上一次迭代得到的目标特征向量集之间的误差不大于预设的第二误差阈值；

如果判断出不满足迭代终止条件，则调整所述候选编码参数和所述候选解码参数，并返回执行利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的步骤；

如果判断出满足预设的迭代终止条件，输出最后一次迭代所使用的候选编码参数作为所述自动编码器的编码参数。

可选地，确定对应于每一第一历史观影样本数据的第一源特征向量组成第一源特征向量集之前，还包括：

针对每一第一源特征向量，利用该第一源特征向量中包含的至少一个原始特征进行特征组合得到至少一个组合特征；

将得到的组合特征添加至该第一源特征向量中。

可选地，在利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的同时，还包括：

利用所述候选编码参数对所述第一源特征向量集进行降维处理。

可选地，利用所述第二历史观影样本数据按照以下方法进行训练得到所述聚类模型的聚类数量：

从每一第二历史观影样本数据中提取至少一个原始特征组成第二源特征向量；

确定对应于每一第二历史观影样本数据的第二源特征向量组成第二源特征向量集；

利用所述自动编码器对所述第二源特征向量集进行编码得到第二特征编码向量集；

分别计算所述第二特征编码向量集中包含的任两类第二特征编码向量之间的欧式距离，初始时，每一第二特征编码向量组成一类；

选择欧式距离最短的两类第二特征编码向量合并以更新所述第二特征编码向量集；

判断聚类结果是否满足预设的聚类停止条件，所述聚类停止条件包括随着聚类数量的变化，聚类效果度量指标商的变化值达到预设的稳定条件；

如果是，则根据更新后的第二特征编码向量集中包含的类的数量确定聚类数量；

如果否，则返回执行分别计算所述第二特征编码向量集中包含的任两类第二特征编码向量之间的欧式距离的步骤。

可选地，按照以下方法确定所述聚类效果度量指标商：

SSB＝∑n_i(M_i-GM)²，SST＝(X_j-GM)²，其中：

PVE为聚类效果度量指标商；

i为类别标识；

j为第二特征编码向量标识

n_i为第i类第二特征编码向量中包含的第二特征编码向量的数量；

M_i为第i类第二特征编码向量的中心点向量；

X_j为第j个第二特征向量；

GM为第二特征编码向量集的中心点向量。

第二方面，提供一种视频用户类别识别装置，包括：

第一提取单元，用于针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量；

编码单元，用于利用自动编码器对所述特征向量进行编码得到第一特征编码向量，其中，所述自动编码器的编码参数为利用第一历史观影样本数据进行训练得到的；

聚类单元，用于根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别，其中，所述聚类模型的聚类数量为利用所述帐号下的第二历史观影样本数据进行训练得到的。

可选地，所述视频用户类别识别装置，还包括：

第二提取单元，用于分别从每一第一历史观影样本数据中提取至少一个原始特征组成第一源特征向量；

第一确定单元，用于确定对应于每一第一历史观影样本数据的第一源特征向量组成第一源特征向量集；

训练单元，用于利用候选编码参数对所述第一源特征向量集进行迭代训练，输出满足迭代终止条件时所使用的候选编码参数作为所述自动编码器的编码参数。

可选地，所述训练单元，包括：

编解码子单元，用于利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集，其中，候选编码参数的初始值为随机设定的；并利用候选解码参数对所述第一特征编码向量集进行解码得到目标特征向量集，其中，所述候选解码参数的初始值为随机设定的；

判断子单元，用于判断是否满足迭代终止条件，所述迭代终止条件包括以下任一条件：迭代次数达到预设的次数阈值、所述目标特征向量集与所述第一源特征向量集之间的误差不大于预设的第一误差阈值、最后一次迭代得到的目标特征向量集与相邻的上一次迭代得到的目标特征向量集之间的误差不大于预设的第二误差阈值；

执行子单元，用于如果所述判断子单元判断出不满足迭代终止条件，则调整所述候选编码参数和所述候选解码参数，并返回执行利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的步骤；如果如果所述判断子单元判断出满足预设的迭代终止条件，输出最后一次迭代所使用的候选编码参数作为所述自动编码器的编码参数。

可选地，所述视频用户类别识别装置，还包括：

特征组合单元，用于在所述第一确定单元确定对应于每一第一历史观影样本数据的第一源特征向量组成第一源特征向量集之前，针对每一第一源特征向量，利用该第一源特征向量中包含的至少一个原始特征进行特征组合得到至少一个组合特征；

添加单元，用于将得到的组合特征添加至该第一源特征向量中。

可选地，所述编解码子单元，还用于在利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的同时，利用所述候选编码参数对所述第一源特征向量集进行降维处理。

可选地，所述视频用户类别识别装置，还包括：

第三提取单元，用于从每一第二历史观影样本数据中提取至少一个原始特征组成第二源特征向量；

第二确定单元，用于确定对应于每一第二历史观影样本数据的第二源特征向量组成第二源特征向量集；

第三编码单元，用于利用所述自动编码器对所述第二源特征向量集进行编码得到第二特征编码向量集；

计算单元，用于分别计算所述第二特征编码向量集中包含的任两类第二特征编码向量之间的欧式距离，初始时，每一第二特征编码向量组成一类；

合并单元，用于选择欧式距离最短的两类第二特征编码向量合并以更新所述第二特征编码向量集；

判断单元，用于判断聚类结果是否满足预设的聚类停止条件，所述聚类停止条件包括随着聚类数量的变化，聚类效果度量指标商的变化值达到预设的稳定条件；

执行单元，用于如果所述判断单元的判断结果为是，则根据更新后的第二特征编码向量集中包含的类的数量确定聚类数量；如果所述判断单元的判断结果为否，则返回执行分别计算所述第二特征编码向量集中包含的任两类第二特征编码向量之间的欧式距离的步骤。

可选地，所述视频用户类别识别装置，还包括：

聚类效果度量单元，用于按照以下方法确定所述聚类效果度量指标商：

SSB＝∑n_i(M_i-GM)²，SST＝(X_j-GM)²，其中：

PVE为聚类效果度量指标商；

i为类别标识；

j为第二特征编码向量标识；

M_i为第i类第二特征编码向量的中心点向量；

X_j为第j个第二特征编码向量；

GM为所述第二特征编码向量集的中心点向量。

第三方面，提供一种计算装置，包括至少一个处理单元、以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行上述任一方法所述的步骤。

第四方面，提供一种计算机可读介质，其存储有可由计算装置执行的计算机程序，当所述程序在计算装置上运行时，使得所述计算装置执行上述任一方法所述的步骤。

本发明实施例提供的视频用户类别识别方法、装置和介质中，通过对不同帐号下不同用户的历史观影样本数据进行训练得到自动编码器的编码参数，利用得到的编码参数对从任一帐号下正在观影用户所产生的观影数据中提取的原始特征向量进行编码得到特征编码向量，进一步地利用针对该帐号训练得到的聚类模型确定当前正在观影用户所属的类别，由于上述过程对于用户来说是无感知的，从而提高了视频用户类别识别方法的通用性，而且，由于无需传输图像观影数据以外的额外数据，因此，节约了网络带宽开销，降低了服务器的处理时延，提高了用户类别识别的效率。

附图说明

图1a为本发明实施例的应用场景示意图；

图1b为本发明实施例的实施原理示意图；

图2a为本发明实施例中，自动编码器的编码参数训练流程示意图；

图2b为本发明实施例中，利用候选编码参数对所述第一源特征向量集进行迭代训练的实施流程示意图；

图3为本发明实施例中，聚类模型的训练流程示意图；

图4为本发明实施例中，AL层次聚类原理示意图；

图5为本发明实施例中，随着聚类个数的增加，PVE变化示意图；

图6为本发明实施例中，视频用户类别识别流程示意图；

图7为本发明实施例中，视频用户类别识别装置的结构示意图；

图8为根据本发明实施方式的计算装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，并不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

首先参考图1a，其为本发明实施例提供的视频用户类别识别方法的应用场景示意图。包括终端11和服务器12，其中，用户1～用户N使用同一帐号分别通过终端11～终端1N中安装的视频播放客户端观看服务器12提供的视频内容。其中，终端11中的客户端可以为网页的浏览器，也可以为安装于移动终端，如手机，平板电脑等中的客户端。

终端11与服务器12之间通过网络进行通信连接，该网络可以为局域网、广域网等。终端11可以为便携设备(例如：手机、平板、笔记本电脑等)，也可以为个人电脑(PC，Personal Computer)，服务器12可以为任何能够提供互联网服务的设备。

需要说明的是，本发明实施例提供的视频用户类别识别方法可以由服务器实施。

下面结合图1a的应用场景，参考图1b～图6来描述根据本发明示例性实施方式的视频用户类别识别方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

如图1b所示，其为本发明实施例的实施原理示意图。针对任一帐号，每一用户的每一次观影(从检测到用户打开视频播放客户端到用户退出视频播放客户端为止)都会产生相应的观影数据。

在原始特征准备阶段，获得不同帐号下、所有用户的观影数据，针对获得的每一观影数据，从中提取能够表征用户类别的多个原始特征。从每一观影数据中提取的多个原始特征可以组成原始特征向量，所有观影数据对应的原始特征向量组成原始特征向量集。利用候选编码参数对所述第一源特征向量集进行迭代训练，输出满足迭代终止条件时所使用的候选编码参数作为所述自动编码器的编码参数。

本发明实施例中，为了识别使用同一帐号的不同观影用户的类别，以根据识别得到的用户类别有针对性的进行视频内容推荐，首先需要收集不同帐号下、所有用户的观影数据对自动编码器进行训练，以得到原始特征的准确表示。

其中，自动编码器可以利用构建的多层深度神经网络模型来进行训练，解码器是相同的一个逆向的多层深度神经网络模型，当然，本发明实施例中，对于自动编码器的训练模型，并不进行限制。如果给定一个神经网络，假设其输出与输入是相同的，然后调整其参数，得到每一层中的权重，就可以得到输入的几种不同表示(每一层代表一种表示)，这些表示能够表征原始特征。若在原始特征中加入这些自动学习得到的特征可以大大提高精确度，在分类时也可以获得较好的效果，这种方法称为AutoEncoder(自动编码器)。自动编码器就是一种尽可能复现输入的神经网络，为了实现这种复现，自动编码器就必须捕捉可以代表输入的最重要的因素，找到可以代表原输入信息的主要成分。

具体实施时，可以利用自动编码器的深度学习方法，训练一组潜在的特征编码，将用户的原始特征向量输入到该自动编码器，自动编码器就会根据预先学习到的编码方式，对输入的原始特征向量进行分析和编码，得到相应的编码，该编码就是本发明实施例中的潜在的语义特征表示。

在特征训练阶段，自动编码器训练的输入即为所有观影数据对应的原始特征向量集，其可以表示为一个N*M的矩阵，其中，M为观影数据的数量，N为提取的原始特征的数量，针对其中包含的每一原始特征向量，根据提取的原始特征数量初始化编码参数，编码参数可以表示一个N*N的矩阵，这样，经过编码参数编码(Encode)后，即将编码参数矩阵与原始特征向量矩阵相乘，得到特征编码向量集，其可以表示为一个N*M的矩阵，N和M均为整数。

特别地，为了获得更多表征用户类别的信息，本发明实施中，还可以对提取的原始特征进行组合得到组合特征，例如将原始特征1和原始特征2相乘得到组合特征3，采用这样的方法，可以丰富原始特征向量中包含的特征数量，但是，如果原始特征向量维度很大，可能会有部分信息冗余，也会增加处理时延，降低用户类别识别的效率。

有鉴于此，本发明实施例中，在对原始特征向量集进行编码的同时对原始特征向量集进行降维处理。具体地，可以通过编码参数实现，在初始化编码参数时，可以初始化一个维度小于原始特征向量集维度的编码参数，假设为L*N，其中，L小于N，L为整数。这样，将原始特征向量集输入自动编码器后，输出的特征编码向量集可以表示为L*M，由此实现了对原始特征向量集的降维处理。

为了评价自动编码器输出的特征编码向量集是否能够准确表征原始特征向量集，本发明实施例中，引入了解码器，利用解码器对自动编码器输出的特征编码向量集进行解码(Encode)得到目标特征向量集，计算原始特征向量集和目标特征向量集之间的重构误差，如果该误差不大于预设的第一误差阈值；或者相邻两次迭代得到的目标特征向量集之间的误差不大于第二误差阈值(即目标特征向量集之间的误差趋于稳定)，则训练结束；否则，调整编码参数和解码参数重复上述过程，直至满足上述任一条件。具体实施时，迭代停止的条件也可以为迭代次数达到预设阈值。

至此，完成了自动编码器的训练。

进一步地，为了识别同一帐号下不同用户对应的用户类别，本发明实施例中，可以通过任一帐号下产生的观影数据进行聚类以得到该帐号下包含的不同用户类别，即针对任一帐号，利用该帐号下观影用户所产生的历史观影数据训练得到该帐号对应的聚类模型。

在聚类模型训练阶段，其输入数据为自动编码器得到的特征编码向量集，需要说明的是，训练聚类模型使用的数据为同一帐号下观影用户所产生的历史观影数据，分别从该帐号对应的每一历史观影数据中提取原始特征得到原始特征向量，该帐号下所有历史观影数据对应的原始特征向量可以组成该帐号对应的原始特征向量集，将该原始特征向量集输入训练好的自动编码器中可以得到相应的特征编码向量集。通过对特征编码向量集进行聚类训练，得到该帐号对应的聚类模型。聚类的数量可以预先指定，也可以通过聚类效果评价指标确定。

在识别实时观影用户对应的用户类别时，针对某一帐号，从实时观影用户所产生的观影数据中提取原始特征得到原始特征向量，将提取的原始特征向量输入到训练好的自动编码器中，则可以得到对应的特征编码向量。将实时观影用户对应的特征编码向量输入聚类模型，便可以确定其所属的用户类别。

为了更好地理解本发明，以下结合具体的实施例对本发明的实施过程进行说明。

需要说明的是，为了与聚类模型训练所使用的历史观影样本数据相区分，本发明实施例中，称用于训练自动编码器的历史观影样本数据为第一历史观影样本数据，称用于训练聚类模型的历史观影样本数据为第二历史观影样本数据。

基于获得的第一历史观影样本数据，可以按照图2a所示的流程对自动编码器进行训练：

S21、分别从每一第一历史观影样本数据中提取至少一个原始特征组成源特征向量。

用户观影所产生的观影数据中包含有一些表征用户类别的特征信息，例如，地理位置，观看时间，观看视频内容的主题，观看视频内容的数量等等。基于此，本发明实施例中，针对获得的每一份第一历史观影样本数据，从中可以提取表征用户类别的原始特征。提取的每一原始特征可以组成特征向量，为了便于区分，本发明实施例中称从第一历史观影样本数据中提取的原始特征所组成的特征向量为第一源特征向量。第一源特征向量是一个由若干个原始特征组成的列向量，例如，从第一历史观影样本数据中提取10个原始特征，则第一源特征向量为一个10*1的列向量，其维数为10。

需要说明的是，具体实施时，为了提高用户类别识别结果的准确性，在提取原始特征时，尽可能提取与观看时间长度无关的特征，如观看时长，因为这类特征对于用户类别的区分度不高。

S22、确定对应于每一第一历史观影样本数据的第一源特征向量组成第一源特征向量集。

假设共有1000份第一历史观影样本数据，从每一份第一历史观影样本数据中均可以提取若干个原始特征得到相应的第一源特征向量，1000份第一历史观影样本数据可以获得1000个第一源特征向量，这1000个第一源特征向量组成第一源特征向量集，即第一源特征向量集是一个N*M的矩阵，其中，M为第一历史观影样本数据的数量，N为提取的原始特征的个数，M和N均为整数。

S23、利用候选编码参数对所述第一源特征向量集进行迭代训练，输出满足迭代终止条件时所使用的候选编码参数作为所述自动编码器的编码参数。

具体实施时，步骤S23可以按照图2b所示的流程实施，包括以下步骤：

S231、利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集。

本步骤中，根据第一源特征向量的维数初始化一个维数相同的矩阵作为候选编码参数，例如，第一源特征向量的维数为10，则可以初始化一个10*10的矩阵作为候选编码参数，初始时，矩阵中包含的各个候选编码参数可以为随机设定的。利用候选编码参数对第一源特征向量集进行编码得到对应的第一特征编码向量集。例如，将候选编码参数和第一源特征向量集相乘可以得到对应的第一特征编码向量集，假设第一源特征向量集为N*M，候选编码参数为N*N，则得到的第一特征编码向量集为N*M。

S232、利用候选解码参数对所述第一特征编码向量集进行解码得到目标特征向量集。

具体实施时，为了判断得到的第一特征编码向量集中包含的第一特征编码向量是否能够准确表征相应的第一源特征向量，本发明实施例中，进一步根据第一源特征向量的维数初始化一个维数相同的矩阵作为候选解码参数，例如，第一源特征向量的维数为10，则可以初始化一个10*10的矩阵作为候选解码参数，初始时，该候选解码参数中的各个值同样可以为随机设定的。其中，解码过程是编码的逆向过程。

利用候选解码参数对步骤S23得到的第一特征编码向量集进行解码得到目标特征向量集，例如，可以将候选解码参数和第一特征编码向量集相乘得到目标特征向量，以解码矩阵为N*N矩阵为例，第一特征编码向量集为N*M为例，则解码后可以得到N*M的目标特征向量。

S233、判断是否满足预设的迭代终止条件，如果是，则执行步骤S234，如果否，则执行步骤S235。

其中，终止条件可以包括以下任一条件：迭代次数达到预设的次数阈值、所述目标特征向量集与所述第一源特征向量集之间的误差不大于预设的第一误差阈值、最后一次迭代得到的目标特征向量集与相邻的上一次迭代得到的目标特征向量集之间的误差不大于预设的第二误差阈值。其中，两个特征向量集之间的误差可以表示为两个特征向量集所包含的对应特征向量之间的误差之和，即对应于同一样本数据的第一源特征向量和目标特征向量的误差之和；或者对应于同一样本数据的最后两次迭代得到的目标特征向量的误差之和。

本发明实施例中，针对任两个特征向量，可以采用欧式距离来衡量该两个特征向量之间的误差，具体地，可以按照以下公式计算两个特征向量之间的误差：sqrt(r₁ ²+r₂ ²-2*r₁r₂)，其中，r₁和r₂分别表示对应于同一样本数据的第一源特征向量和目标特征向量；或者，r₁和r₂分别表示对应于同一样本数据的最后两次迭代得到的目标特征向量。

S234、输出最后一次迭代所使用的候选编码参数作为所述自动编码器的编码参数，流程结束。

S235、调整所述候选编码参数和所述候选解码参数，并执行步骤S231。

为了提高自动编码器编码参数训练结果的准确性，本发明实施例中，针对每一第一源特征向量，还可以进一步的对提取的原始特征进行组合，例如原始特征1和原始特征2相乘构建组合特征3，这样，利用提取的多个原始特征进行组合可以得到若干个组合特征，将组合特征添加到第一源特征向量中。这样，多维度的信息可以更好的表征用户的观影信息。但是由于组合后的特征维数高，引入了数据噪音，因此，具体实施时，在执行步骤S23的同时，可以利用候选编码参数对第一源特征向量进行降维处理。

具体地，可以通过减少候选编码参数维数的方式实现对第一源特征向量的降维，例如，第一源特征向量为N*1，则候选编码参数可以设置为K*N，K小于N，这样，候选编码参数与第一源特征向量相乘后可以得到K*1的第一特征编码向量，由此，减少了第一源特征向量的维数，对于第一源特征向量集来说，如果第一源特征向量集为N*M，则候选编码参数与第一源特征向量集相乘后得到的第一特征编码向量集为K*M。相应地，候选解码矩阵可以设置为N*K，这样，对第一特征编码向量集进行解码后得到的目标向量集与第一源特征向量集维数。

通过上述过程，可以得到一个较佳的自动编码器的编码参数。

为了准确识别同一帐号下不同的用户类别，本发明实施例中，还需要根据从同一帐号下所产生的第二历史观影样本数据中提取的原始特征，对不同的样本数据进行聚类，得到同一帐号下可能包含的用户类别数量，即确定出有几个用户使用同一帐号。

如图3所示，其为本发明实施例中，针对任一帐号，确定该帐号对应的聚类模型的流程示意图，可以包括以下步骤：

S31、从每一第二历史观影样本数据中提取至少一个原始特征组成第二源特征向量。

针对任一帐号，获得该注册账户下所产生的第二历史观影样本数据，例如，可以提取该帐号下一年内所生成的观影数据作为第二历史观影样本数据。

步骤S31中从第二历史观影样本数据中提取至少一个原始特征组成第二源特征向量的实施方式与步骤S21中从第一历史观影样本数据中提取至少一个原始特征组成第一原始特征向量的实施方式相同，这里不再赘述。

针对每一第二历史观影样本数据，同样可以得到一个N*1的列向量，其中，N为提取的原始特征的数量。

S32、确定对应于每一第二历史观影样本数据的第二源特征向量组成第二源特征向量集。

本步骤中，假设有L份第二历史观影样本数据，则得到的第二源特征向量集可以表示为N*L。

S33、利用所述自动编码器对所述第二源特征向量集进行编码得到第二特征编码向量集。

本步骤中，可以利用上述训练得到的自动编码器对第二源特征向量集进行编码得到第二特征编码向量集。具体地，利用图2a训练得到的编码参数对对第二源特征向量集进行编码得到第二特征编码向量集。

S34、分别计算所述第二特征编码向量集中包含的任两类第二特征编码向量之间的欧式距离。

S35、选择欧式距离最短的两类第二特征编码向量合并以更新所述第二特征编码向量集。

在步骤S33得到第二特征编码向量集之后，从步骤S34开始，对第二特征编码向量集中包含的第二特征向量进行聚类以确定其中包含的用户类别数量。

具体实施时，步骤S34中可以采用基于层次的聚类方案对第二特征编码向量集中包含的第二特征向量进行聚类，例如，AL(Average Linkage)层次聚类法，SL(SingleLinkage)层次聚类法，CL(Complete Linkage)层次聚类法等等，相比于SL层次聚类法和CL层次聚类法，AL层次聚类法具有更好的鲁棒性，因此，本发明实施例中以AL层次聚类法为例进行说明。

AL层次聚类原理为从下而上地合并类，最开始每一个第二特征编码向量单独组成一类。每次选择欧式距离最短的两个类进行合并，如图4所示，逐渐合并为一个大类，整个过程就是建立一个树结构。

对于本发明实施例来说，根据第二特征编码向量集中包含的各第二特征编码向量，按照上述方式依次合并两个欧式距离最短的两类第二特征编码向量，初始时，每一第二特征编码向量组成一类。假设共有L份第二历史样本数据，这样，初始时可以得到L个第二特征编码向量，即第二特征编码向量集中包含的类的数量为L，每一第二特征编码向量中包含N个第二特征编码，分别计算两两第二特征编码向量之间的欧式距离。

具体实施时，可以按照以下公式计算两个特征编码向量之间的欧式距离：

其中，d为第二特征编码向量中包含的特征编码的数量。每次选择两个欧式距离最小的两个第二特征编码向量为一类，直至处理完成第二特征编码向量集包含的第二特征编码向量集，第一次合并后，每一类第二特征编码向量中包含两个第二特征编码向量，第一次合并后第二特征编码向量中包含的类的数量为L/2。

S36、判断聚类结果是否满足预设的聚类停止条件，如果是，则执行步骤S37，如果否，执行步骤S34。

具体实施时，预设的聚类停止条件可以为预先设置聚类数量，即达到第二特征编码向量集中包含的类的个数达到预先设置的聚类数量时确定达到预设的聚类停止条件。针对同一帐号下包含的用户数量这一应用场景，通常，使用同一账号的用户数量不超过5个，因此，本发明实施例中，可以设置聚类停止条件为聚类数量达到5。

另外，本发明实施例中，所述聚类停止条件还可以设置为随着聚类数量的变化，聚类效果度量指标商的变化值达到预设的稳定条件。

具体地，可以按照以下公式确定所述聚类效果度量指标商：

SSB＝∑n_i(M_i-GM)²，SST＝(X_j-GM)²，其中：

PVE为聚类效果度量指标商；

i为类别标识；

j为第二特征编码向量标识

M_i为第i类第二特征编码向量的中心点向量；

X_j为第j个第二特征向量；

GM为第二特征编码向量集的中心点向量。

需要说明的是，每一类特征编码向量的中心点向量可以由该类特征向量包含的每一行的均值组成的列向量，例如，假设某一类特征编码向量包含4个特征编码向量，每一个特征编码向量中包含6个特征编码，则其可以使用如下的矩阵表示：

则该类特征编码向量对应的中心点可以表示为：

采用相同的方法，可以确定出第二特征编码向量集的中心点向量。

聚类效果度量指标商的变化值达到预设的稳定条件，即随着聚类个数的增加，PVE的增长开始明显下降时，即PVE趋于稳定，即可确定达到预设的聚类停止条件。如图5所示，当聚类数量从4变化为5时，PVE的增益开始明显下降(图5中聚类数量从4变化为5所对应的折线斜率明显减小)，因此，针对图5所示的应用场景，合适的聚类数量为4。

如果判断出为不满足预设的聚类停止条件，则需要继续对第二特征编码向量集中包含的若干类第二特征编码向量进行第二次合并，对于第二次合并，每一类第二特征向量中包含两个第二特征编码向量。

针对包含有两个第二特征编码向量的类，可以按照以下公式计算任两类第二特征编码向量之间的欧式距离：

其中，A类第二特征编码向量中包含的两个第二特征编码向量分别为a和x，B类第二特征编码向量中包含的两个第二特征编码向量分别为b和y。

类似地，可以计算第三次合并时，任两类第二特征向量之间的欧式距离，第三次合并时，每一类第二特征向量中包含4个第二特征编码向量，以此类推，可以计算出第R次合并时，任两类第二特征向量之间的欧式距离，直至满足预设的聚类停止条件。

S37、根据更新后的第二特征编码向量集中包含的类的数量确定聚类数量。

将最后一次聚类得到的第二特征编码向量集中包含的类的数量确定为聚类数量。这样，针对任一帐号，可以将该帐号下产生的观影数据聚为一定数量的类，每一类数据可以认为其对应于一个用户，假设最终聚类数量为4，则说明共有4个用户使用该帐号。

其中，聚类后，每一类第二特征编码向量由若干个第二特征编码向量组成。

基于此，本发明实施例中，针对使用任一帐号实时观影的用户可以按照图6所示的流程识别其对应的用户类别：

S61、针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量。

本步骤中，从该当前观影用户产生的观影数据中提取至少一个原始特征组成特征向量，该特征向量为一列向量。

S62、利用自动编码器对所述特征向量进行编码得到第一特征编码向量。

本步骤中，利用上述训练得到的自动编码器对步骤S61中得带的特征向量进行编码得到对应的第一特征编码向量。

S63、根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别。

本步骤中，可以利用针对该帐号进行训练得到的聚类模型，计算第一特征编码向量与图3得到的每一类第二特征编码向量的中心向量之间的欧式距离，选择欧式距离最短的一类第二特征编码向量为当前观影用户所属的用户类别。

以实时观影用户对应的特征向量为

为例，经过自动编码器编码后得到的第一特征编码向量为

假设该帐号下包含的用户类别共有4类，每一用户类别对应的第二特征编码向量分别为：

分别计算每一第二特征编码向量对应的中心点向量，即将每一类第二特征编码向量按行就均值可以得到该类第二特征编码向量的中心点向量，最后分别计算第一特征编码向量与每一类第二特征编码向量的中心点向量之间的欧式距离，选择距离最短的第二类特征编码向量对应的用户类别为当前观影用户的用户类别。

进一步地，具体实施时，根据识别出的用户类别，可以针对性的向该观影用户推荐视频内容，这能够极大的提升视频内容推荐的准确率，当用户退出视频播放客户端时，也可以根据识别出的用户类别，提供针对性的挽救策略来挽回用户，更进一步地，还可以根据识别出的用户类别，如果其属于未成年人观影，则可以提供一些观影限制策略等等，本发明实施例中不再一一列举。

如图7所示，其为本发明实施例提供的视频用户类别识别装置的结构示意图，包括：

第一提取单元71，用于针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量；

编码单元72，用于利用自动编码器对所述特征向量进行编码得到第一特征编码向量，其中，所述自动编码器的编码参数为利用第一历史观影样本数据进行训练得到的；

聚类单元73，用于根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别，其中，所述聚类模型的聚类数量为利用所述帐号下的第二历史观影样本数据进行训练得到的。

可选地，所述视频用户类别识别装置，还包括：

可选地，所述训练单元，包括：

可选地，所述视频用户类别识别装置，还包括：

SSB＝∑n_i(M_i-GM)²，SST＝(X_j-GM)²，其中：

PVE为聚类效果度量指标商；

i为类别标识；

j为第二特征编码向量标识；

M_i为第i类第二特征编码向量的中心点向量；

X_j为第j个第二特征编码向量；

GM为所述第二特征编码向量集的中心点向量。

为了描述的方便，以上各部分按照功能划分为各模块(或单元)分别描述。当然，在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。

在介绍了本发明示例性实施方式的视频用户类别死别方法和装置之后，接下来，介绍根据本发明的另一示例性实施方式的计算装置。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本发明的计算装置可以至少包括至少一个处理单元、以及至少一个存储单元。其中，所述存储单元存储有程序代码，当所述程序代码被所述处理单元执行时，使得所述处理单元执行本说明书上述描述的根据本发明各种示例性实施方式视频用户类型识别方法中的步骤。例如，所述处理单元可以执行如图6中所示的步骤S61、针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量，和步骤S62、利用自动编码器对所述特征向量进行编码得到第一特征编码向量，以及步骤S63、根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别。

下面参照图8来描述根据本发明的这种实施方式的计算装置80。图8显示的计算装置80仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图8所示，计算装置80以通用计算设备的形式表现。计算装置80的组件可以包括但不限于：上述至少一个处理单元81、上述至少一个存储单元82、连接不同系统组件(包括存储单元82和处理单元81)的总线83。

总线83表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元82可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)821和/或高速缓存存储器822，还可以进一步包括只读存储器(ROM)823。

存储单元82还可以包括具有一组(至少一个)程序模块824的程序/实用工具825，这样的程序模块824包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算装置80也可以与一个或多个外部设备84(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与计算装置80交互的设备通信，和/或与使得该计算装置80能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口85进行。并且，计算装置80还可以通过网络适配器86与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器86通过总线83与用于计算装置80的其它模块通信。应当理解，尽管图中未示出，可以结合计算装置80使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

在一些可能的实施方式中，本发明提供的视频用户类别识别方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的视频用户类别识别方法中的步骤，例如，所述计算机设备可以执行如图6中所示的步骤S61、针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量，和步骤S62、利用自动编码器对所述特征向量进行编码得到第一特征编码向量，以及步骤S63、根据所述第一特征编码向量，利用针对所述帐号训练得到的聚类模型确定所述当前观影用户的类别。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本发明的实施方式的用于视频用户类型识别的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算设备上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种视频用户类别识别方法，其特征在于，包括：

针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量，其中该账号用于至少两个观影用户使用；

2.如权利要求1所述的方法，其特征在于，利用第一历史观影样本数据按照以下方法进行训练得到所述自动编码器的编码参数：

3.如权利要求2所述的方法，其特征在于，利用候选编码参数对所述第一源特征向量集进行迭代训练，输出满足迭代终止条件时所使用的候选编码参数作为所述自动编码器的编码参数，具体包括：

4.如权利要求2或3所述的方法，其特征在于，确定对应于每一第一历史观影样本数据的第一源特征向量组成第一源特征向量集之前，还包括：

将得到的组合特征添加至该第一源特征向量中。

5.如权利要求3所述的方法，其特征在于，在利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的同时，还包括：

6.如权利要求1～3或5任一权利要求所述的方法，其特征在于，利用所述第二历史观影样本数据按照以下方法进行训练得到所述聚类模型的聚类数量：

7.如权利要求4所述的方法，其特征在于，利用所述第二历史观影样本数据按照以下方法进行训练得到所述聚类模型的聚类数量：

8.一种视频用户类别识别装置，其特征在于，包括：

第一提取单元，用于针对任一帐号，从使用该帐号观影的当前观影用户所产生的观影数据中提取所述当前观影用户的至少一个原始特征组成特征向量，其中该账号用于至少两个观影用户使用；

9.如权利要求8所述的装置，其特征在于，还包括：

10.如权利要求9所述的装置，其特征在于，所述训练单元，包括：

第一执行子单元，用于如果所述判断子单元判断出不满足迭代终止条件，则调整所述候选编码参数和所述候选解码参数，并返回执行利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的步骤；如果所述判断子单元判断出满足预设的迭代终止条件，输出最后一次迭代所使用的候选编码参数作为所述自动编码器的编码参数。

11.如权利要求9或10所述的装置，其特征在于，还包括：

12.如权利要求11所述的装置，其特征在于，

所述编解码子单元，还用于在利用候选编码参数对所述第一源特征向量集进行编码得到第一特征编码向量集的同时，利用所述候选编码参数对所述第一源特征向量集进行降维处理。

13.如权利要求8～10或12任一权利要求所述的装置，其特征在于，还包括：

14.如权利要求11所述的装置，其特征在于，还包括：

15.一种计算装置，其特征在于，包括至少一个处理单元、以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行权利要求1～7任一权利要求所述方法的步骤。

16.一种计算机可读介质，其特征在于，其存储有可由计算装置执行的计算机程序，当所述程序在计算装置上运行时，使得所述计算装置执行权利要求1～7任一所述方法的步骤。