CN106021314B

CN106021314B - 一种多媒体数据处理方法及其设备

Info

Publication number: CN106021314B
Application number: CN201610294256.7A
Authority: CN
Inventors: 黄安埠
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-05-05
Filing date: 2016-05-05
Publication date: 2021-05-28
Anticipated expiration: 2036-05-05
Also published as: CN106021314A

Abstract

本发明实施例公开一种多媒体数据处理方法及其设备，其中方法包括如下步骤：基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息；采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出；其中，所述第一多媒体数据为已操作的多媒体数据，所述第二多媒体数据为未操作的多媒体数据。采用本发明，可以最大化还原原始的输入数据，提高求解结果的稳定性。

Description

一种多媒体数据处理方法及其设备

技术领域

本发明涉及计算机技术领域，尤其涉及一种多媒体数据处理方法及其设备。

背景技术

协同过滤在音乐个性化领域中被广泛应用于挖掘用户对歌曲的喜好评分，但基于Item-Based和User-Based的最近邻协同过滤方法仅仅应用于在浅层次中比较观察听歌流水和操作数据，然后显示求取用户的相似偏好，无法挖掘深层次的用户关系数据，即无法获取数据内部的潜因子。

而采用奇异值分解(Singular Value Decomposition，SVD)的协同过滤方法，通过利用矩阵分解技术可以将User-Item矩阵分解为两个小矩阵，每个小矩阵分别对应于用户和物品的隐特征向量矩阵，以此求取数据内部的潜因子。然而，由于模型的输入数据较为稀疏，从而导致优化的目标函数退化为一个非凸优化问题，所求解的结果是局部最优解，同时也容易产生过拟合现象，导致所求取的潜因子与用户的实际情况有较大的偏差。

发明内容

本发明实施例提供一种多媒体数据处理方法及其设备，可以最大化还原原始的输入数据，提高求解结果的稳定性。

本发明实施例第一方面提供了一种多媒体数据处理方法，可包括：

基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息；

采用受限玻尔兹曼机神经网络(Restricted Boltzmann Machine，RBM)模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出；

其中，所述第一多媒体数据为已操作的多媒体数据，所述第二多媒体数据为未操作的多媒体数据。

本发明实施例第二方面提供了一种多媒体数据处理设备，可包括：

第一信息获取单元，用于基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息；

第二信息获取单元，还用于采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

第一数据输出单元，用于根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出；

在本发明实施例中，通过将目标用户的已操作的多媒体数据的数据信息作为输入数据，并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取，并最终实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM模型对未操作的多媒体数据的数据信息进行求取，能够最大化还原原始的输入数据，克服了非凸优化问题的局部最优解，降低稀疏的输入数据对求解结果的影响，提高了求解结果的稳定性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种多媒体数据处理方法的流程示意图；

图2是本发明实施例提供的另一种多媒体数据处理方法的流程示意图；

图3是本发明实施例提供的一种RBM模型的举例示意图；

图4是本发明实施例提供的一种多媒体数据处理设备的结构示意图；

图5是本发明实施例提供的另一种多媒体数据处理设备的结构示意图；

图6是本发明实施例提供的第一数据输出单元的结构示意图；

图7是本发明实施例提供的又一种多媒体数据处理设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的多媒体数据处理方法可以应用于对多媒体交互应用的多媒体数据进行数据信息求取以及数据输出的场景，例如：多媒体数据处理设备基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息，所述多媒体数据处理设备采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息，所述多媒体数据处理设备根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出的场景等。通过采用RBM模型对未操作的多媒体数据的数据信息进行求取，能够最大化还原原始的输入数据，克服了非凸优化问题的局部最优解，降低稀疏的输入数据对求解结果的影响，提高了求解结果的稳定性。

本发明实施例涉及的多媒体数据处理设备可以为多媒体交互应用对应的后台服务器，用于存储多媒体数据库、获取具备多媒体交互应用的用户终端上传的多媒体数据的数据信息、向所述用户终端推送多媒体数据等；所述用户终端可以包括：平板电脑、智能手机、掌上电脑以及移动互联网设备(MID)等终端设备；所述多媒体数据可以包括图片、视频、音乐等数据，优选的，多媒体数据存在对应的数据标识，针对每一个用户终端，可以使用预先分配的用户标识登录所述多媒体交互应用，以对多媒体数据库中的多媒体数据进行操作，同时，针对每一个用户标识，所述多媒体数据库中的多媒体数据可以分类为第一多媒体数据和第二多媒体数据，其中，所述第一多媒体数据为已操作的多媒体数据，所述第二多媒体数据为未操作的多媒体数据，操作包括但不限于数据浏览、数据下载、数据删除、数据收藏等。

下面将结合附图1和附图2，对本发明实施例提供的一种多媒体数据处理方法进行详细介绍。

请参见图1，为本发明实施例提供了一种多媒体数据处理方法的流程示意图。如图1所示，本发明实施例的所述方法可以包括以下步骤S101-步骤S103。

S101，基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息；

具体的，多媒体数据处理设备可以基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息，所述数据信息优选为根据目标用户标识记录的对多媒体数据的操作情况所确定的评分数值，所述多媒体数据处理设备可以预先获取目标用户标识对应记录的对多媒体数据的操作情况，并根据所述对多媒体数据的操作情况确定所述目标用户标识对所述多媒体数据的数据信息，例如：针对数据下载的操作对应的数据信息为4分、针对数据删除的操作对应的数据信息为0分、针对数据收藏的操作对应的数据信息为3分等。

S102，采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

具体的，所述多媒体数据处理设备可以采用预先训练好的RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息。

对所述RBM模型进行训练的过程可以为：所述多媒体数据处理设备基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息，优选的，所述多媒体数据处理设备获取的至少一个用户标识为所述多媒体交互应用下的所有用户标识，当然，为了保证在进行RBM模型训练时的输入数据的可靠性，以及提高RBM模型训练的效率，所述多媒体数据处理设备获取的至少一个用户标识也可以为所述多媒体数据处理设备基于活跃用户条件在所述所有用户标识中筛选出的至少一个用户标识。所述多媒体数据处理设备可以根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值，可以理解的是，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量，进一步的，所述多媒体数据处理设备可以将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点，所述多媒体数据处理设备可以将所述每个用户标识对应的第一多媒体数据的数据信息转化为一个数组，以此作为RBM模型训练的初始的输入数据。所述多媒体数据处理设备可以采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理，可以理解的是，所述可视层结点的个数是由所述每个用户标识对应的第一多媒体数据的数量决定的，所述隐藏层结点的个数为经验值，当迭代编解码处理后得到的处理结果满足预设条件时，所述多媒体数据处理设备可以获取迭代编解码处理后的所述RBM模型的权重参数值，所述多媒体数据处理设备将所述权重参数值添加至所述RBM模型中。

当训练好所述RBM模型后，所述多媒体数据处理设备可以将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点，对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量，所述多媒体数据处理设备对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点，此时需要按照多媒体数据的数量进行解码处理，所述多媒体数据处理设备在所述目标用户标识对应的每个多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒体数据的数据信息。

S103，根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出；

具体的，所述多媒体数据处理设备可以根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出，优选的，所述多媒体数据处理设备可以对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据，所述多媒体数据处理设备对所述预设数量的多媒体数据进行输出，优选的，所述多媒体数据处理设备将所述预设数量的多媒体数据输出至使用所述目标用户标识登录所述多媒体交互应用的用户终端。

请参见图2，为本发明实施例提供了另一种多媒体数据处理方法的流程示意图。如图2所示，本发明实施例的所述方法可以包括以下步骤S201-步骤S209。

S201，基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息；

具体的，多媒体数据处理设备基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息，所述数据信息优选为根据目标用户标识记录的对多媒体数据的操作情况所确定的评分数值，优选的，所述多媒体数据处理设备获取的至少一个用户标识为所述多媒体交互应用下的所有用户标识，当然，为了保证在进行RBM模型训练时的输入数据的可靠性，以及提高RBM模型训练的效率，所述多媒体数据处理设备获取的至少一个用户标识也可以为所述多媒体数据处理设备基于活跃用户条件在所述所有用户标识中筛选出的至少一个用户标识，例如：所述多媒体数据处理设备可以获取所述多媒体交互应用下的所有用户标识的多媒体数据的流水数据，提取在3个月内，至少有10天进行过数据浏览的操作，且每天浏览的多媒体数据不少于10个的至少一个用户标识等。所述多媒体数据处理设备可以预先获取所有用户标识中每个用户标识对应记录的对多媒体数据的操作情况，并根据所述对多媒体数据的操作情况确定所述每个用户标识对所述多媒体数据的数据信息。

S202，根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值；

具体的，所述多媒体数据处理设备可以根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值，可以理解的是，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量，优选的，所述可视层结点用于表述所述每个用户标识对应的第一多媒体数据的数据信息，所述隐藏层结点用于表述所述每个用户标识对应的第一多媒体数据对应的抽象的隐形特征，例如：音乐数据的旋律、曲风、音律等抽象特征。进一步的，所述多媒体数据处理设备可以将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点，所述多媒体数据处理设备可以将所述每个用户标识对应的第一多媒体数据的数据信息转化为一个数组，例如：评分数值的取值区间为0-4分，假设某用户标识s对数据标识为1的第一多媒体数据的评分数值为3分，则对应转换的可视层结点为(0，1，0，0，0)，对数据标识为4的第一多媒体数据的评分数值为1分，则对应转换的可视层结点为(0，0，0，1，0)，对数据标识为5的第一多媒体数据的评分数值为4分，则对应转换的可视层结点为(1，0，0，0，0)等，所述多媒体数据处理设备可以将上述得到的可视层结点转化为一个数组(例如：矩阵)，以此作为RBM模型训练的初始的输入数据。当然，上述评分数值的取值区间以及可视层结点的维数的表达方式仅为举例，可以根据实际的应用需求，对取值区间进行调整，同时对应调整可视层结点的维数等，针对不同取值区间以及不同的可视层结点的维数，均可以执行本发明实施例的RBM模型的训练过程。

所述多媒体数据处理设备可以采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理，可以理解的是，所述可视层结点的个数是由所述每个用户标识对应的第一多媒体数据的数量决定的，所述隐藏层结点的个数为经验值，假设连接可视层结点和隐藏层结点的权重值为w、可视层结点间的偏移量visbias以及隐藏层结点间的偏移量hidbias，则可以得到下述公式：

公式1：

公式2：

公式3：

其中，w为一个a*b*c的三维矩阵，a是第一多媒体数据的数量，b是评分数值的取值范围，c是隐藏层结点的个数；

表示可视层结点的数组中第i列第j行的子结点与隐藏层结点中的第k个结点的连线的权重；t和t+1可以表示连续两次迭代编解码处理的迭代次数；s的取值范围为1到m，表示用户标识为s，m为所述至少一个用户标识的数量；v^s表示用户标识为s的第一多媒体数据的数据信息(即初始的输入数据，初始的输入数据为5*a维的矩阵)，v^st表示用户标识为s的第一多媒体数据在经过t次迭代编解码处理后得到的数据信息(即第t次迭代所需的输入数据，同样也为5*a维的矩阵)，v_ij ^s具体表示用户标识为s的可视层结点的数组中第i列第j行的子结点数值(1或0)；v_ij ^st具体表示用户标识为s的可视层结点的数组中第i列第j行的子结点在经过t次迭代编解码处理后得到的子结点数值(1或0)。

请一并参见图3，h(隐藏层)包含的3个结点为隐藏层结点，v(可视层)包含的5个结点为可视层结点，w表示h与v之间的各结点间的权重值，

表示可视层结点的数组中第i列第j行的子结点与隐藏层结点中的第k个结点的连线的权重，v_ij ^s具体表示用户标识为s的可视层结点的数组中第i列第j行的子结点数值(1或0)，h_k具体表示隐藏层中的第k个隐藏层结点，例如：针对音乐数据，可视层结点可以为针对每首音乐数据的评分数值(具体用数组表现)，其中“Missing rating”表示当前的音乐数据未被进行任何操作(例如：下载、收藏、删除等)，h中每个隐藏层结点可以表示为音乐数据中的抽象隐形特征(例如：旋律、曲风、音律等)，可以理解的是，由于可视层结点的数量要远远大于隐藏层结点的数量，当对可视层结点进行迭代编解码处理后，经过可视层结点编码到隐藏层结点的降维处理，再经过隐藏层结点到可视层结点的升维处理，容易出现数值的丢失，因此需要在进行RBM训练的过程中，迭代计算出稳定的

以弥补数值丢失的可能性。

可以理解的是，迭代编解码处理中的第一次迭代过程可以包括将初始的输入数据与隐藏层中的隐藏层结点编码为c维的潜因子向量，再由c维潜因子向量解码为第二次迭代过程所需的输入数据，以此类推，则第t次迭代过程可以包括将第t-1次迭代编解码处理后得到的输入数据与隐藏层中的隐藏层结点进行编码为c维的潜因子向量，再由c维的潜因子向量解码为第t+1次迭代过程所需的输入数据，直至满足预设条件为止，其中，潜因子向量的求取公式为：

公式4：

公式5：

其中，公式4为第一次迭代过程中编码后得到的潜因子向量，公式5为第t次迭代过程中得到的潜因子向量，所述预设条件具体表示为连续两次迭代编解码处理后得到的输入数据与初始的输入数据之间的值满足预设阈值，或者，所述预设条件为预设迭代次数等，例如：t+1＝100。

当迭代编解码处理后得到的处理结果满足预设条件时，所述多媒体数据处理设备可以获取迭代编解码处理后的所述RBM模型的权重参数值。

S203，将所述权重参数值添加至所述RBM模型中；

具体的，所述多媒体数据处理设备将所述权重参数值添加至所述RBM模型中。

S204，基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息；

S205，采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

具体的，所述多媒体数据处理设备可以采用预先训练好的RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息。当训练好所述RBM模型后，所述多媒体数据处理设备可以将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点，对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量，所述多媒体数据处理设备对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点，此时需要按照多媒体数据的数量进行解码处理，依据上述举例，假设多媒体数据库中存在n个多媒体数据，a₁为所述目标用户标识对应的第一多媒体数据的数量，a₁小于或等于n，则第一可视层结点转化的矩阵为5*a₁维矩阵，经过编码处理后生成c维的第一隐藏层结点对应的潜因子向量，再经过解码处理后生成第二可视层结点对应的5*n维矩阵，并将5*n维矩阵转化为所述目标用户标识对应的每个多媒体数据的数据信息，所述多媒体数据处理设备在所述目标用户标识对应的每个多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒体数据的数据信息。

S206，对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据；

S207，对所述预设数量的多媒体数据进行输出；

具体的，所述多媒体数据处理设备可以对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据，所述多媒体数据处理设备对所述预设数量的多媒体数据进行输出，优选的，所述多媒体数据处理设备将所述预设数量的多媒体数据输出至使用所述目标用户标识登录所述多媒体交互应用的用户终端。

S208，根据所述目标用户标识的第一隐藏层结点对应的潜因子向量，匹配所述目标用户标识的相似用户标识，并获取所述相似用户标识的多媒体数据列表；

S209，在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据，并对所述第三多媒体数据进行输出；

具体的，所述多媒体数据处理设备在获取到所述目标用户标识的第一隐藏层结点对应的潜因子向量时，还可以根据所述目标用户标识的第一隐藏层结点对应的潜因子向量，匹配所述目标用户标识的相似用户标识，并获取所述相似用户标识的多媒体数据列表，所述多媒体数据处理设备在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据，并对所述第三多媒体数据进行输出，例如：输出至使用所述目标用户标识登录所述多媒体交互应用的用户终端，其中，所述第三多媒体数据为属于所述多媒体数据列表且属于所述目标用户标识对应的第二多媒体数据的多媒体数据。

在本发明实施例中，通过将目标用户的已操作的多媒体数据的数据信息作为输入数据，并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取，并最终实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM模型对未操作的多媒体数据的数据信息进行求取，能够最大化还原原始的输入数据，克服了非凸优化问题的局部最优解，降低稀疏的输入数据对求解结果的影响，提高了求解结果的稳定性；通过依据活跃用户条件选取至少一个用户标识对应的多媒体数据的数据信息，作为对RBM模型进行训练的输入数据，可以保证RBM模型训练时的输入数据的可靠性，同时无需使用所有用户标识的数据信息，提高了RBM模型训练的效率。

下面将结合附图4-附图6，对本发明实施例提供的多媒体数据处理设备进行详细介绍。需要说明的是，附图4-附图6所示的多媒体数据处理设备，用于执行本发明图1-图3所示实施例的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明图1-图3所示的实施例。

请参见图4，为本发明实施例提供了一种应用状态检测设备的结构示意图。如图4所示，本发明实施例的所述多媒体数据处理设备1可以包括：第一信息获取单元11、第二信息获取单元12和第一数据输出单元13。

第一信息获取单元11，用于基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息；

具体实现中，所述第一信息获取单元11可以基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息，所述数据信息优选为根据目标用户标识记录的对多媒体数据的操作情况所确定的评分数值，所述多媒体数据处理设备1可以预先获取目标用户标识对应记录的对多媒体数据的操作情况，所述第一信息获取单元11根据所述对多媒体数据的操作情况确定所述目标用户标识对所述多媒体数据的数据信息，例如：针对数据下载的操作对应的数据信息为4分、针对数据删除的操作对应的数据信息为0分、针对数据收藏的操作对应的数据信息为3分等。

第二信息获取单元12，用于采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

具体实现中，所述第二信息获取单元12可以采用预先训练好的RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息。

对所述RBM模型进行训练的过程可以为：所述多媒体数据处理设备1基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息，优选的，所述多媒体数据处理设备1获取的至少一个用户标识为所述多媒体交互应用下的所有用户标识，当然，为了保证在进行RBM模型训练时的输入数据的可靠性，以及提高RBM模型训练的效率，所述多媒体数据处理设备1获取的至少一个用户标识也可以为所述多媒体数据处理设备1基于活跃用户条件在所述所有用户标识中筛选出的至少一个用户标识。所述多媒体数据处理设备1可以根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值，可以理解的是，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量，进一步的，所述多媒体数据处理设备1可以将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点，所述多媒体数据处理设备1可以将所述每个用户标识对应的第一多媒体数据的数据信息转化为一个数组，以此作为RBM模型训练的初始的输入数据。所述多媒体数据处理设备1可以采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理，可以理解的是，所述可视层结点的个数是由所述每个用户标识对应的第一多媒体数据的数量决定的，所述隐藏层结点的个数为经验值，当迭代编解码处理后得到的处理结果满足预设条件时，所述多媒体数据处理设备1可以获取迭代编解码处理后的所述RBM模型的权重参数值，所述多媒体数据处理设备1将所述权重参数值添加至所述RBM模型中。

当训练好所述RBM模型后，所述第二信息获取单元12可以将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点，对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量，所述第二信息获取单元12对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点，此时需要按照多媒体数据的数量进行解码处理，所述第二信息获取单元12在所述目标用户标识对应的每个多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒体数据的数据信息。

第一数据输出单元13，用于根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出；

具体实现中，所述第一数据输出单元13可以根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出，优选的，所述第一数据输出单元13可以对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据，所述第一数据输出单元13对所述预设数量的多媒体数据进行输出，优选的，所述第一数据输出单元13将所述预设数量的多媒体数据输出至使用所述目标用户标识登录所述多媒体交互应用的用户终端。

请参见图5，为本发明实施例提供了另一种多媒体数据处理设备的结构示意图。如图5所示，本发明实施例的所述多媒体数据处理设备1可以包括：第一信息获取单元11、第二信息获取单元12、第一数据输出单元13、第三信息获取单元14、参数值计算单元15、参数值添加单元16、列表获取单元17和第二数据输出单元18。

第三信息获取单元14，用于基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息；

具体实现中，所述第三信息获取单元14基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息，所述数据信息优选为根据目标用户标识记录的对多媒体数据的操作情况所确定的评分数值，优选的，所述第三信息获取单元14获取的至少一个用户标识为所述多媒体交互应用下的所有用户标识，当然，为了保证在进行RBM模型训练时的输入数据的可靠性，以及提高RBM模型训练的效率，所述第三信息获取单元14获取的至少一个用户标识也可以为所述第三信息获取单元14基于活跃用户条件在所述所有用户标识中筛选出的至少一个用户标识，例如：所述第三信息获取单元14可以获取所述多媒体交互应用下的所有用户标识的多媒体数据的流水数据，提取在3个月内，至少有10天进行过数据浏览的操作，且每天浏览的多媒体数据不少于10个的至少一个用户标识等。所述多媒体数据处理设备1可以预先获取所有用户标识中每个用户标识对应记录的对多媒体数据的操作情况，所述第三信息获取单元14根据所述对多媒体数据的操作情况确定所述每个用户标识对所述多媒体数据的数据信息。

参数值计算单元15，用于根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值；

具体实现中，所述参数值计算单元15可以根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值，可以理解的是，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量，优选的，所述可视层结点用于表述所述每个用户标识对应的第一多媒体数据的数据信息，所述隐藏层结点用于表述所述每个用户标识对应的第一多媒体数据对应的抽象的隐形特征，例如：音乐数据的旋律、曲风、音律等抽象特征。进一步的，所述参数值计算单元15可以将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点，所述参数值计算单元15可以将所述每个用户标识对应的第一多媒体数据的数据信息转化为一个数组，例如：评分数值的取值区间为0-4分，假设某用户标识s对数据标识为1的第一多媒体数据的评分数值为3分，则对应转换的可视层结点为(0，1，0，0，0)，对数据标识为4的第一多媒体数据的评分数值为1分，则对应转换的可视层结点为(0，0，0，1，0)，对数据标识为5的第一多媒体数据的评分数值为4分，则对应转换的可视层结点为(1，0，0，0，0)等，所述多媒体数据处理设备1可以将上述得到的可视层结点转化为一个数组(例如：矩阵)，以此作为RBM模型训练的初始的输入数据。当然，上述评分数值的取值区间以及可视层结点的维数的表达方式仅为举例，可以根据实际的应用需求，对取值区间进行调整，同时对应调整可视层结点的维数等，针对不同取值区间以及不同的可视层结点的维数，均可以执行本发明实施例的RBM模型的训练过程。

所述参数值计算单元15可以采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理，可以理解的是，所述可视层结点的个数是由所述每个用户标识对应的第一多媒体数据的数量决定的，所述隐藏层结点的个数为经验值，假设连接可视层结点和隐藏层结点的权重值为w、可视层结点间的偏移量visbias以及隐藏层结点间的偏移量hidbias，则可以得到下述公式：

公式1：

公式2：

公式3：

公式4：

公式5：

当迭代编解码处理后得到的处理结果满足预设条件时，所述参数值计算单元15可以获取迭代编解码处理后的所述RBM模型的权重参数值。

参数值添加单元16，用于将所述权重参数值添加至所述RBM模型中；

具体实现中，所述参数值添加单元16将所述权重参数值添加至所述RBM模型中。

具体实现中，所述第二信息获取单元12可以采用预先训练好的RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息。当训练好所述RBM模型后，所述第二信息获取单元12可以将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点，对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量，所述第二信息获取单元12对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点，此时需要按照多媒体数据的数量进行解码处理，依据上述举例，假设多媒体数据库中存在n个多媒体数据，a₁为所述目标用户标识对应的第一多媒体数据的数量，a₁小于或等于n，则第一可视层结点转化的矩阵为5*a₁维矩阵，经过编码处理后生成c维的第一隐藏层结点对应的潜因子向量，再经过解码处理后生成第二可视层结点对应的5*n维矩阵，并将5*n维矩阵转化为所述目标用户标识对应的每个多媒体数据的数据信息，所述第二信息获取单元12在所述目标用户标识对应的每个多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒体数据的数据信息。

具体的，请一并参见图6，为本发明实施例提供了第一数据输出单元的结构示意图。如图6所示，所述第一数据输出单元13可以包括：

数据选取子单元131，用于对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据；

数据输出子单元132，用于对所述预设数量的多媒体数据进行输出。

列表获取单元17，用于根据所述目标用户标识的第一隐藏层结点对应的潜因子向量，匹配所述目标用户标识的相似用户标识，并获取所述相似用户标识的多媒体数据列表；

第二数据输出单元18，用于在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据，并对所述第三多媒体数据进行输出；

具体实现中，所述第二信息获取单元12在获取到所述目标用户标识的第一隐藏层结点对应的潜因子向量时，所述列表获取单元17可以根据所述目标用户标识的第一隐藏层结点对应的潜因子向量，匹配所述目标用户标识的相似用户标识，并获取所述相似用户标识的多媒体数据列表，所述第二数据输出单元18在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据，并对所述第三多媒体数据进行输出，例如：输出至使用所述目标用户标识登录所述多媒体交互应用的用户终端，其中，所述第三多媒体数据为属于所述多媒体数据列表且属于所述目标用户标识对应的第二多媒体数据的多媒体数据。

请参见图7，为本发明实施例提供了又一种多媒体数据处理设备的结构示意图。如图7所示，所述多媒体数据处理设备1000可以包括：至少一个处理器1001，例如CPU，至少一个网络接口1004，用户接口1003，存储器1005，至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图7所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据处理应用程序。

在图7所示的多媒体数据处理设备1000中，用户接口1003主要用于为用户提供输入的接口，获取用户输入的数据；网络接口1004主要用于与用户终端进行连接，与用户终端进行数据交互；而处理器1001可以用于调用存储器1005中存储的数据处理应用程序，并具体执行以下操作：

采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

在一个实施例中，所述处理器1001在执行基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息之前，还执行以下操作：

基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息；

根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值；

将所述权重参数值添加至所述RBM模型中。

在一个实施例中，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量；

所述处理器1001在执行根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值时，具体执行以下操作：

将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点；

采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理；

当迭代编解码处理后得到的处理结果满足预设条件时，获取迭代编解码处理后的所述RBM模型的权重参数值。

在一个实施例中，所述处理器1001在执行采用受限玻尔兹曼机神经网络RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息时，具体执行以下操作：

将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点，对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量；

对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点；

在所述第二可视层结点中获取所述目标用户标识对应的第二多媒体数据的数据信息。

在一个实施例中，所述处理器1001在执行根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出时，具体执行以下操作：

对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据；

对所述预设数量的多媒体数据进行输出。

在一个实施例中，所述处理器1001还执行以下操作：

根据所述目标用户标识的第一隐藏层结点对应的潜因子向量，匹配所述目标用户标识的相似用户标识，并获取所述相似用户标识的多媒体数据列表；

在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据，并对所述第三多媒体数据进行输出；

其中，所述第三多媒体数据为属于所述多媒体数据列表且属于所述目标用户标识对应的第二多媒体数据的多媒体数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种多媒体数据处理方法，其特征在于，包括：

采用受限玻尔兹曼机神经网络RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

其中，所述第一多媒体数据为已操作的多媒体数据，所述第二多媒体数据为未操作的多媒体数据；

所述采用受限玻尔兹曼机神经网络RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息，包括：

将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点，对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量；所述第一可视层结点的个数是由所述目标用户标识对应的第一多媒体数据的数量决定；

对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点，将所述第二可视化层结点对应的矩阵，转化为所述目标用户标识对应的n个多媒体数据的数据信息；所述n个多媒体数据存在于多媒体数据库中，n大于所述第一多媒体数据的数量；

在n个多媒体数据的数据信息中获取所述目标用户标识对应的第二多媒体数据的数据信息。

2.根据权利要求1所述的方法，其特征在于，所述基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息之前，还包括：

将所述权重参数值添加至所述RBM模型中。

3.根据权利要求2所述的方法，其特征在于，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量；

所述根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标用户标识对应的第二多媒体数据的数据信息，对所述目标用户标识对应的第二多媒体数据进行输出，包括：

对所述预设数量的多媒体数据进行输出。

5.根据权利要求1所述的方法，其特征在于，还包括：

6.一种多媒体数据处理设备，其特征在于，包括：

第二信息获取单元，用于采用RBM模型，并根据所述目标用户标识对应的第一多媒体数据的数据信息，获取所述目标用户标识对应的第二多媒体数据的数据信息；

所述第二信息获取单元具体用于：

7.根据权利要求6所述的设备，其特征在于，还包括：

第三信息获取单元，用于基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息；

参数值计算单元，用于根据所述每个用户标识对应的第一多媒体数据的数据信息，计算RBM模型的权重参数值；

参数值添加单元，用于将所述权重参数值添加至所述RBM模型中。

8.根据权利要求7所述的设备，其特征在于，所述RBM模型包括可视层结点和隐藏层结点，所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量以及隐藏层结点间的偏移量；

所述参数值计算单元具体用于：

9.根据权利要求6所述的设备，其特征在于，所述第一数据输出单元包括：

数据选取子单元，用于对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序，在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据；

数据输出子单元，用于对所述预设数量的多媒体数据进行输出。

10.根据权利要求6所述的设备，其特征在于，还包括：

列表获取单元，用于根据所述目标用户标识的第一隐藏层结点对应的潜因子向量，匹配所述目标用户标识的相似用户标识，并获取所述相似用户标识的多媒体数据列表；

第二数据输出单元，用于在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据，并对所述第三多媒体数据进行输出；

11.一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如权利要求1-5任一项所述的方法。

12.一种计算机设备，其特征在于，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1-5任意一项的方法。