CN111444687A

CN111444687A - 一种标签生成方法、装置、服务器及存储介质

Info

Publication number: CN111444687A
Application number: CN202010203166.9A
Authority: CN
Inventors: 张志伟; 吴丽军; 王希爱
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-03-20
Filing date: 2020-03-20
Publication date: 2020-07-24

Abstract

本申请实施例公开了一种标签生成方法、装置、服务器及存储介质，用于生成多媒体数据的作品标签。该方法可以包括：服务器获取用户上传的第一多媒体数据和与第一多媒体数据对应的第一文本信息，根据第一文本信息生成至少一个文字标签，通过文字标签和预先生成的多个第一用户标签，生成与第一多媒体数据对应的作品标签。通过第一用户标签和多媒体数据中的文本信息，生成与多媒体数据对应的作品标签，可以准确的描述用户上传的多媒体数据，同时可以避免使用深度学习生成作品标签时，耗费的计算资源较多，耗时较长，难以满足实时性需求的问题。

Description

一种标签生成方法、装置、服务器及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种标签生成方法、装置、服务器及存储介质。

背景技术

在UGC(User-Generated Content，用户原创内容)平台中，针对用户上传的多媒体数据，需要生成与多媒体数据对应的标签，以方便服务器对多媒体数据进行处理，例如根据多媒体数据的标签，将多媒体数据推送给不同的人群。

现有技术中，主要采用深度学习生成与多媒体数据对应的标签，即在用户上传多媒体数据后，采用深度学习对用户上传的多媒体数据进行识别，根据识别结果生成与多媒体数据对应的至少一个标签。但是，采用深度学习生成标签时，需要耗费较多的计算资源，并且标签的生成速度比较慢，难以满足实时性需求。

发明内容

本申请实施例提供了一种标签生成方法、装置、服务器及存储介质，以解决多媒体数据的标签生成过程中，耗费的计算资源较多，标签生成速度较慢的问题。

有鉴于此，本申请第一方面提供了一种标签生成方法，包括：

获取用户上传的第一多媒体数据，以及与所述第一多媒体数据对应的第一文本信息；

根据所述第一文本信息生成至少一个文字标签；

根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签，生成至少一个与所述第一多媒体数据对应的作品标签。

可选的，所述根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签，生成至少一个与所述第一多媒体数据对应的作品标签之前，还包括：

生成与所述用户对应的至少一个第二用户标签；

获取每个所述第二用户标签的关联标签，将所有所述第二用户标签和所述关联标签作为所述第一用户标签。

可选的，所述获取每个所述第二用户标签的关联标签，包括：

通过词向量模型确定目标用户标签对应的目标词向量，所述目标用户标签为所述至少一个第二用户标签中的任意一个；

计算所述目标词向量与所述词向量模型对应的词向量空间中除所述目标词向量之外的其他词向量之间的距离值；

根据所述距离值，从所述词向量空间中确定与所述目标词向量相关联的关联词向量；

从与所述词向量模型对应的单词集合中确定每个所述关联词向量对应的第一词汇，将所述第一词汇作为所述目标用户标签的关联标签。

可选的，所述根据所述距离值，从所述词向量空间中确定与所述目标词向量相关联的关联词向量，包括：

从所述词向量空间中确定与所述目标词向量之间的距离值小于预设距离值的词向量作为所述关联词向量；或者，

从所有所述距离值中的最小距离值对应的词向量开始，依次从所述其他词向量中确定预设个数的词向量作为所述关联词向量，最小距离值对应的一个词向量为所述其他词向量中的词向量。

可选的，所述生成与所述用户对应的至少一个第二用户标签，包括：

获取所述用户上传的多个第二多媒体数据；

根据所述多个第二多媒体数据的上传顺序，从所述多个第二多媒体数据中确定至少一个目标多媒体数据；

获取每个所述目标多媒体数据对应的第二文本信息；

根据所有所述第二文本信息，生成至少一个所述第二用户标签。

可选的，所述根据所有所述第二文本信息，生成至少一个所述第二用户标签，包括：

对所有所述第二文本信息进行分词，得到多个第二词汇；

根据每个所述第二词汇出现的频率，从所述多个第二词汇中确定至少一个目标词汇，将所述目标词汇作为所述第二用户标签。

本申请实施例第二方面提供了一种标签生成装置，包括：

第一获取模块，被配置为获取用户上传的第一多媒体数据，以及与所述第一多媒体数据对应的第一文本信息；

第一生成模块，被配置为根据所述第一文本信息生成至少一个文字标签；

第二生成模块，被配置为根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签，生成至少一个与所述第一多媒体数据对应的作品标签。

可选的，还包括：

第三生成模块，被配置为生成与所述用户对应的至少一个第二用户标签；

第二获取模块，被配置为获取每个所述第二用户标签的关联标签，将所有所述第二用户标签和所述关联标签作为所述第一用户标签。

可选的，所述第二获取模块包括：

第一确定单元，被配置为通过词向量模型确定目标用户标签对应的目标词向量，所述目标用户标签为所述至少一个第二用户标签中的任意一个；

计算单元，被配置为计算所述目标词向量与所述词向量模型对应的词向量空间中除所述目标词向量之外的其他词向量之间的距离值；

第二确定单元，被配置为根据所述距离值，从所述词向量空间中确定与所述目标词向量相关联的关联词向量；

第三确定单元，被配置为从与所述词向量模型对应的单词集合中确定每个所述关联词向量对应的第一词汇，将所述第一词汇作为所述目标用户标签的关联标签。

可选的，所述第二确定单元，具体被配置为从所述词向量空间中确定与所述目标词向量之间的距离值小于预设距离值的词向量作为所述关联词向量；或者，从所有所述距离值中的最小距离值对应的词向量开始，依次从所述其他词向量中确定预设个数的词向量作为所述关联词向量，最小距离值对应的一个词向量为所述其他词向量中的词向量。

可选的，所述第三生成模块包括：

第一获取单元，被配置为获取所述用户上传的多个第二多媒体数据；

确定单元，被配置为根据所述多个第二多媒体数据的上传顺序，从所述多个第二多媒体数据中确定至少一个目标多媒体数据；

第二获取单元，被配置为获取每个所述目标多媒体数据对应的第二文本信息；

生成单元，被配置为根据所有所述第二文本信息，生成至少一个所述第二用户标签。

可选的，所述生成单元，具体被配置为对所有所述第二文本信息进行分词，得到多个第二词汇；根据每个所述第二词汇出现的频率，从所述多个第二词汇中确定至少一个目标词汇，将所述目标词汇作为所述第二用户标签。

本申请实施例第三方面提供一种服务器，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行如本申请第一方面或第一方面任一可选实现方式中所述的标签生成方法。

本申请实施例第四方面提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得所述服务器能够执行如本申请第一方面或第一方面任一可选实现方式中所述的标签生成方法。

本申请实施例第五方面提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行如本申请第一方面或第一方面任一可选实现方式中所述的标签生成方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

在本申请实施例中，服务器获取用户上传的第一多媒体数据和与第一多媒体数据对应的第一文本信息，根据第一文本信息生成至少一个文字标签，通过文字标签和预先生成的多个第一用户标签，生成与第一多媒体数据对应的作品标签。通过第一用户标签和多媒体数据中的文本信息，生成与多媒体数据对应的作品标签，可以准确的描述用户上传的多媒体数据，同时可以避免使用深度学习生成作品标签时，耗费的计算资源较多，耗时较长，难以满足实时性需求的问题。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，还可以根据这些附图获得其它的附图。

图1是根据一示例性实施例示出的一种标签生成方法的步骤流程图；

图2是根据一示例性实施例示出的另一种标签生成方法的步骤流程图；

图3是根据一示例性实施例示出的一种标签生成装置的结构框图；

图4是根据一示例性实施例示出的一种服务器的结构框图；

图5是根据一示例性实施例示出的又一种标签生成装置的框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，都应当属于本申请保护的范围。

图1是根据一示例性实施例示出的一种标签生成方法的步骤流程图，参照图1，本实施例提供的标签生成方法可以适应于多媒体数据的标签生成，以解决现有的标签生成方法中，使用的计算资源较多，标签生成速度较慢的问题。本实施例提供的标签生成方法可以由标签生成装置执行，标签生成装置通常以软件和/或硬件的方式实现，标签生成装置可以设置于服务器，该方法可以包括以下步骤：

101、获取用户上传的第一多媒体数据，以及与第一多媒体数据对应的第一文本信息。

其中，第一多媒体数据可以是用户通过电子设备，例如手机上传的音频、视频、图片和图集等多媒体数据。第一文本信息可以是用户在上传第一多媒体数据时，与第一多媒体数据同时上传的文本信息，例如第一多媒体数据的名称、主题和内容简介等，也可以是第一多媒体数据中携带的文本信息，例如视频文件封面中的标题。或者，第一文本信息也可以是用户直接设置的与第一多媒体数据对应的标签。第一多媒体数据的种类，以及第一文本信息的来源可以根据需求设置，本实施例对此不做限制。

本实施例中，服务器在获取用户通过电子设备上传的第一多媒体数据的同时，可以获取与第一多媒体数据对应的第一文本信息。例如，服务器可以获取与视频文件同时上传的名称、主题和内容简介等文本信息，以及用户设置的标签，也可以在获取到视频文件后，读取视频文件的封面中的标题。

需要说明的是，为了便于理解，本实施例选取视频文件作为第一多媒体数据进行解释说明，当第一多媒体数据为音频、图片和图集等多媒体数据时，服务器获取第一文本信息的方法可以根据第一多媒体数据的种类，以及第一文本信息的具体来源选择设置，本实施对此不做限制。

102、根据第一文本信息生成至少一个文字标签。

其中，文字标签是服务器根据第一文本信息生成的，用于描述第一多媒体数据的标签。

本实施例中，服务器在获取到第一文本信息后，可以根据第一文本信息生成与第一多媒体数据对应的文字标签。例如，在获取到第一文本信息后，可以使用分词工具对第一文本信息进行分词，得到多个词汇，从多个词汇中选择其中的至少一个词汇作为第一多媒体数据的文字标签。

结合步骤101，若用户在上传视频文件时，同时上传了视频文件的内容简介:“王俊凯跳街舞的视频”，服务器可以对内容简介(第一文本信息)进行分词，得到分词结果：“王俊凯/跳/街舞/的/视频”,服务器可以选择词汇“王俊凯”和“街舞”，作为视频文件的文字标签。与此同时，若用户在上传视频文件的同时，设置了与视频文件对应“街舞”标签，或者在视频文件的封面中设置了标题“王俊凯”，服务器可以直接将标签“街舞”作为文字标签，或者将视频文件封面中的标题“王俊凯”作为文字标签。

实际使用时，服务器可以根据第一文本信息生成一个或多个文字标签，根据第一文本信息生成文字标签的方法可以根据需求设置，本实施例对此不做限制。

103、根据至少一个文字标签和预先生成的用户的多个第一用户标签，生成至少一个与第一多媒体数据对应的作品标签。

其中，作品标签是服务器根据文字标签和第一用户标签生成的，用于描述第一多媒体数据的标签，以方便服务器对第一多媒体数据进行管理和使用。作品标签的具体使用方法，可以参考现有技术中标签的使用方法，本实施例在此不做详细描述。第一用户标签为预先生成的用于描述用户的标签，例如，若用户为喜欢街舞和唱歌的用户，则可以设置用户的第一用户标签为“街舞”和“音乐”，具体生成第一用户标签的方法可参考现有技术，本实施例对此不做限制。

本实施例中，服务器可以根据文字标签和多个第一用户标签生成第一多媒体数据的作品标签。结合前述举例，根据第一文本信息生成的文字标签中包括“王俊凯”和“街舞”，第一用户标签为“街舞”和“音乐”，则可以将多个文字标签和第一用户标签中相同的标签作为第一多媒体数据的作品标签，如将标签“街舞”作为第一多媒体数据的作品标签。具体根据至少一个文字标签和多个第一用户标签生成作品标签的方法可以根据需求设置，本实施例对此不做限制。

现有技术中，主要使用深度学习生成与多媒体数据对应的作品标签，为了提高作品标签的准确率，必须使用大规模、复杂的神经网络模型进行作品标签的生成。而大规模、复杂的神经网络模型必须依赖大量的计算资源，在计算资源有限的情况下，大规模、复杂神经网络模型的运行速度缓慢，难以满足实时性的需求。并且在使用深度学习生成作品标签的过程中，若生成的作品标签错误，由于作品标签是神经网络模型通过学习生成的，开发人员无法快速准确的解读具体的生成过程，导致无法快速准确的确定生成错误标签的原因，无法对作品标签的生成过程进行调整。

而实际使用时，用户在上传多媒体数据时上传的文本信息，可以比较准确的描述多媒体数据，并且用户标签与用户上传的多媒体数据的相关性较高，因此根据文本信息生成文字标签，根据文字标签和用户标签可以生成准确描述多媒体数据的作品标签。同时，若生成错误的作品标签，开发人员可以快速的对作品标签生成过程中，获取文本信息、生成文字标签，以及生成作品标签的过程进行解读，快速准确的确定生成错误标签的原因，对标签生成方法进行调整，提高作品标签的准确性。

本实施例中，服务器获取用户上传的第一多媒体数据和与第一多媒体数据对应的第一文本信息，根据第一文本信息生成至少一个文字标签，通过文字标签和预先生成的多个第一用户标签，生成与第一多媒体数据对应的作品标签。通过第一用户标签和多媒体数据中的文本信息，生成与多媒体数据对应的作品标签，可以准确的描述用户上传的多媒体数据，同时可以避免使用深度学习生成作品标签时，耗费的计算资源较多，耗时较长，难以满足实时性需求的问题。

图2是根据一示例性实施例示出的另一种标签生成方法的步骤流程图，参照图2，该方法可以包括：

步骤201、生成与用户对应的至少一个第二用户标签。

其中，第二用户标签用于描述用户，对第二用户标签的理解可参考第一用户标签，本实施例在此不做赘述。

可选的，生成与用户对应的至少一个第二用户标签的步骤，可以包括：

获取用户上传的多个第二多媒体数据；

根据多个第二多媒体数据的上传顺序，从多个第二多媒体数据中确定至少一个目标多媒体数据；

获取每个目标多媒体数据对应的第二文本信息；

根据所有第二文本信息，生成至少一个第二用户标签。

其中，对第二多媒体数据和第二文本信息的理解，可参考第一多媒体数据和第一文本信息，本实施例在此不做赘述。

本实施例中，服务器可以依次获取用户上传的多个第二多媒体数据，并确定多个第二多媒体数据上传的先后顺序，根据上传顺序，从多个第二多媒体数据中确定目标多媒体数据，根据每个目标多媒体数据对应的第二文本信息，生成第二用户标签。例如，若用户在不同的时间点分别上传了视频文件1、视频文件2、视频文件3和视频文件4。视频文件1的上传时间早于视频文件2、视频文件2的上传时间早于视频文件3、视频文件3的上传时间早于视频文件4。服务器在确定多个第二多媒体数据的上传顺序后，可以选择靠近当前时刻的一个或多个的第二多媒体数据作为目标多媒体数据，如选择靠近当前时刻的2个第二多媒体数据，即视频文件3和视频文件4作为目标多媒体数据。目标多媒体数据的具体个数可以根据需求设置，本实施例对此不做限制。

服务器在确定目标多媒体数据后，可以获取每个目标多媒体数据对应的第二文本信息，根据所有第二文本信息生成第二用户标签。例如，若视频文件3对应的第二文本信息为：“王俊凯跳街舞的视频”，视频文件4对应的第二文本信息为：“王源唱歌的视频”，结合前述举例，可以对每个第二文本信息进行分词，根据分词结果选择词汇“王俊凯”、“街舞”、“王源”和“唱歌”，作为第二用户标签。具体根据第二文本信息生成第二用户标签的过程，可以根据需求设置，本实施对此不做限制。

可选的，根据所有第二文本信息，生成至少一个第二用户标签，可以包括：对所有第二文本信息进行分词，得到多个第二词汇；根据每个第二词汇出现的频率，从多个第二词汇中确定至少一个目标词汇，将目标词汇作为第二用户标签。

本实施例中，可以根据每个第二词汇出现的频率从多个第二词汇中确定目标词汇，将目标词汇作为第二用户标签。具体的，可以选择频率最高的第二词汇作为目标词汇，或者根据每个第二词汇出现的频率，从频率最高的第二词汇开始，依次选择多个第二词汇作为目标词汇。例如，若多个第二词汇中“街舞”出现的频率最高，可以将“街舞”作为目标词汇，并将“街舞”(目标词汇)作为第二用户标签。或者从“街舞”开始，根据每个第二词汇出现频率的高低，依次选择多个第二词汇作为目标词汇，如选择“街舞”和“唱歌”作为目标词汇，并将“街舞”和“唱歌”作为第二用户标签。实际使用时，根据第二词汇出现的频率确定目标词汇，可以提高第二用户标签的准确性。

可选的，在确定目标词汇之后，还可以将目标词汇发送至标注系统，在标注系统接收到用户对目标词汇的确定操作后，响应于确定操作，将目标词汇作为第二用户标签。其中，由用户通过标注系统对目标词汇进行确认，可以避免生成错误的第二用户标签。

本实施例中，根据多个第二多媒体数据的上传顺序，确定靠近当前时刻的至少一个第二多媒体数据作为目标多媒体数据，根据目标多媒体数据对应的第二文本信息生成第二用户标签。由于越靠近当前时刻的第二文本信息与用户的相关性越高，所以根据目标多媒体数据对应的第二文本信息生成的第二用户标签，对用户的描述比较准确，可以提高第二用户标签的准确性。

需要说明的是，生成第二用户标签的方法，可以包括但不限于根据第二文本信息生成第二用户标签。

步骤202、获取每个第二用户标签的关联标签，将所有第二用户标签和关联标签作为第一用户标签。

可选的，获取每个第二用户标签的关联标签，可以通过如下步骤实现：

步骤2021、通过词向量模型确定目标用户标签对应的目标词向量，目标用户标签为至少一个第二用户标签中的任意一个。

本实施中，可以通过词向量模型分别确定每个第二用户标签对应的目标词向量。具体的，可以预先确定语料库，对语料库中的语料进行分词后得到单词集合，使用单词集合中的词汇训练得到词向量模型和对应的词向量空间。具体确定语料库，对语料库中的语料进行分词得到单词集合，通过单词集合中的词汇训练得到词向量模型和词向量空间的过程可参考现有技术，本实施例对此不做详细描述。实际使用时，也可以直接使用现有的词向量模型，以及对应的单词集合和词向量空间，如直接使用中文文本词向量模型(Chinese WordVectors)，以及中文文本词向量模型对应的单词集合和词向量空间，本实施例对此不做限制。

其中，通过词向量模型确定每个第二用户标签对应的目标词向量的过程可参考现有技术中通过词向量模型确定词汇对应的词向量的过程，本实施例在此不做详细描述。

步骤2022、计算目标词向量与词向量模型对应的词向量空间中除目标词向量之外的其他词向量之间的距离值。

本实施例中，在通过词向量模型确定每个第二用户标签分别对应的目标词向量后，可以计算每个第二用户标签对应的目标词向量与词向量空间中除目标词向量之外的其他词向量之间的距离值。例如，针对第二用户标签“街舞”(目标用户标签)，在使用中文文本词向量模型确定词向量空间(中文文本词向量模型对应的词向量空间)中与第二用户标签“街舞”对应的词向量后，可以计算第二用户标签“街舞”对应的词向量与词向量空间中，除第二用户标签“街舞”和“唱歌”对应的词向量之外的其他每个词向量之间的距离值。具体计算词向量之间的距离值的过程可参考现有技术，本实施例在此不做详细描述。

步骤2023、根据距离值，从词向量空间中确定与目标词向量相关联的关联词向量。

步骤2024、从与词向量模型对应的单词集合中确定每个关联词向量对应的第一词汇，将第一词汇作为目标用户标签的关联标签。

其中，单词集合中的词汇与词向量空间中的词向量一一对应，例如，若中文文本词向量模型对应的单词集合中包括词汇“歌手”、“少年”、“唱歌”、“街舞”、“音乐”和“乐团”等词汇，中文文本词向量模型对应的词向量空间中包括词汇“歌手”、“少年”、“街舞”、唱歌”、“音乐”和“乐团”分别对应的词向量。

本实施例中，在计算得到目标用户标签对应的目标词向量与词向量空间中除目标词向量之外的其他词向量之间的距离值之后，可以根据目标词向量与词向量空间中除目标词向量之外的其他词向量之间的距离值确定目标词向量的关联词向量。例如，针对第二用户标签“街舞”，在分别计算得到目标用户标签“街舞”对应的词向量与词向量空间中除“街舞”和“唱歌”对应的词向量之外的其他词向量(词汇“歌手”、“少年”、“音乐”和“乐团”分别对应的词向量)之间的距离值后，可以根据目标用户标签“街舞”对应的词向量与其他词向量之间的距离值确定与“街舞”对应的词向量相关联的关联词向量。

可选的，可以从词向量空间中确定与目标词向量之间的距离值小于预设距离值的词向量作为关联词向量。例如，可以设置预设距离值为1，从词向量空间中除“街舞”和“唱歌”对应的词向量之外的其他词向量中，确定与第二用户标签“街舞”对应的词向量之间的距离值小于1的词向量作为目标词向量，如词汇“少年”对应的词向量与第二用户标签“街舞”对应的词向量之间的距离值小于1，则可以确定词汇“少年”对应的词向量为目标词向量的关联词向量。预设距离值可以根据需求设置，本实施例对此不做限制。根据预设距离值确定目标词向量的关联词向量，可以通过预设距离值的设置，控制关联词向量的选取范围，灵活的选取关联词向量，进一步的可以控制关联标签的准确性。

可选的，可以从所有距离值中的最小距离值对应的词向量开始，依次从其他词向量中确定预设个数的词向量作为关联词向量，最小距离值对应的一个词向量为其他词向量中的词向量。例如，可以设置预设个数为2，在计算得到第二用户标签“街舞”与其他词向量之间的距离值后，根据距离值的大小对除目标词向量之外的其他词向量进行排序，从距离值最小的词向量开始，依次选择2个(预设个数)词向量为关联词向量，如词汇“少年”对应的词向量与第二用户标签“街舞”对应的词向量之间的距离值最小，词汇“乐团”对应的词向量与第二用户标签“街舞”对应的词向量之间的距离值大于词汇“少年”对应的词向量与第二用户标签“街舞”对应的词向量之间的距离值，并且小于其他词汇对应的词向量与第二用户标签“街舞”对应的词向量之间的距离值，则可以依次选取词汇“少年”和“乐团”对应的词向量作为目标词向量(第二用户标签“街舞”对应的词向量)的关联词向量。在确定关联词向量之后，确定关联词向量对应的第一词汇，如可以将第一词汇“少年”和“乐团”作为第二用户标签“街舞”的关联标签。从最小距离值开始，依次确定预设个数的词向量作为关联词向量，可以准确控制关联词向量的数量，并选取关联度最高的词向量作为关联词向量，进一步的可以准确控制关联标签的数量，提高关联标签的准确性。

实际使用时，通过用户上传的与第二多媒体数据对应的第二文本信息确定第二用户标签，由于第二文本信息的数量有限，导致生成的第二用户标签的数量较少。在确定第二用户标签之后，确定第二用户标签的关联标签，将第二用户标签和关联标签作为第一用户标签，可以实现对用户标签的扩展，扩大用户标签的数量，在生成作品标签的过程中，可以生成更多的与第一多媒体数据对应的作品标签。并且，通过词向量模型确定第二用户标签对应的词向量，根据词向量之间的距离值确定第二用户标签的关联标签，得到的关联标签与第二用户标签的相关性较高，可以得到准确的用户标签，进一步的可以提高作品标签的准确性。

需要说明的是，确定第二用户标签的关联标签的方法可以包括但不限于通过词向量模型的方法。

步骤203、获取用户上传的第一多媒体数据，以及与第一多媒体数据对应的第一文本信息。

步骤204、根据第一文本信息生成至少一个文字标签。

步骤205、根据至少一个文字标签和预先生成的用户的多个第一用户标签，生成至少一个与第一多媒体数据对应的作品标签。

对步骤203至步骤205的理解可参考实施例一，本实施例在此不做赘述。

本实施例中，首先根据与用户上传的第二多媒体数据对应的第二文本信息生成第二用户标签，根据第二用户标签扩展得到多个第一用户标签，在生成作品标签的过程中，根据扩展得到的多个第一用户标签和文字标签生成用于描述第一多媒体数据的作品标签。通过扩展得到的多个第一用户标签，可以得到更多的作品标签，提高作品标签的数量。并且，通过词向量模型扩展得到的第一用户标签与用户的相关性较高，可以提高作品标签的准确性。

图3是根据一示例性实施例示出的一种标签生成装置的结构框图，如图3所示，标签生成装置可以包括：第一获取模块301、第一生成模块302和第二生成模块303。

第一获取模块301被配置为获取用户上传的第一多媒体数据，以及与第一多媒体数据对应的第一文本信息。

第一生成模块302被配置为根据第一文本信息生成至少一个文字标签。

第二生成模块303被配置为根据至少一个文字标签和预先生成的用户的多个第一用户标签，生成至少一个与第一多媒体数据对应的作品标签。

可选的，标签生成装置还可以包括：第三生成模块和第二获取模块。

第三生成模块被配置为生成与用户对应的至少一个第二用户标签。

第二获取模块被配置为获取每个第二用户标签的关联标签，将所有第二用户标签和关联标签作为第一用户标签。

可选的，第二获取模块可以包括：第一确定单元、计算单元、第二确定单元和第三确定单元。

第一确定单元被配置为通过词向量模型确定目标用户标签对应的目标词向量，目标用户标签为至少一个第二用户标签中的任意一个。

计算单元被配置为计算目标词向量与词向量模型对应的词向量空间中除目标词向量之外的其他词向量之间的距离值。

第二确定单元被配置为根据距离值，从词向量空间中确定与目标词向量相关联的关联词向量。

第三确定单元被配置为从与词向量模型对应的单词集合中确定每个关联词向量对应的第一词汇，将第一词汇作为目标用户标签的关联标签。

可选的，第二确定单元具体被配置为从词向量空间中确定与目标词向量之间的距离值小于预设距离值的词向量作为关联词向量。或者从所有距离值中的最小距离值对应的词向量开始，依次从其他词向量中确定预设个数的词向量作为关联词向量，最小距离值对应的一个词向量为其他词向量中的词向量。

可选的，第三生成模块可以包括：第一获取单元、确定单元、第二获取单元和生成单元。

第一获取单元被配置为获取用户上传的多个第二多媒体数据。

确定单元被配置为根据多个第二多媒体数据的上传顺序，从多个第二多媒体数据中确定至少一个目标多媒体数据。

第二获取单元被配置为获取每个目标多媒体数据对应的第二文本信息。

生成单元被配置为根据所有第二文本信息，生成至少一个第二用户标签。

可选的，生成单元具体被配置为对所有第二文本信息进行分词，得到多个第二词汇；根据每个第二词汇出现的频率，从多个第二词汇中确定至少一个目标词汇，将目标词汇作为第二用户标签。

图4是根据一示例性实施例示出的一种服务器的结构框图，可以包括：

处理器401；

用于存储所述处理器401可执行指令的存储器402；

其中，所述处理器401被配置为执行图1或图2所示实施例中所述的方法。

在示例性实施例中，还提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得所述服务器能够执行图1或图2所示实施例中所述的方法。

在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得所述计算机能够执行图1或图2所示实施例中所述的方法。

图5是根据一示例性实施例示出的又一种标签生成装置的框图，装置500可以包括以下一个或多个组件：处理组件502，存储器504，电源组件506，多媒体组件508，音频组件510，输入/输出(I/O)的接口513，传感器组件514，以及通信组件516。

处理组件502通常控制装置500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述的音频数据处理方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为装置500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当装置500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

I/O接口513为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为装置500提供各个方面的状态评估。例如，传感器组件514可以检测到装置500的打开/关闭状态，组件的相对定位，例如所述组件为装置500的显示器和小键盘，传感器组件514还可以检测装置500或装置500一个组件的位置改变，用户与装置500接触的存在或不存在，装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述音频数据处理方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器504，上述指令可由装置500的处理器520执行以完成上述音频数据处理方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种标签生成方法，其特征在于，包括：

根据所述第一文本信息生成至少一个文字标签；

2.根据权利要求1所述的方法，其特征在于，所述根据所述至少一个文字标签和预先生成的所述用户的多个第一用户标签，生成至少一个与所述第一多媒体数据对应的作品标签之前，还包括：

生成与所述用户对应的至少一个第二用户标签；

3.根据权利要求2所述的方法，其特征在于，所述获取每个所述第二用户标签的关联标签，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述距离值，从所述词向量空间中确定与所述目标词向量相关联的关联词向量，包括：

5.根据权利要求2所述的方法，其特征在于，所述生成与所述用户对应的至少一个第二用户标签，包括：

获取所述用户上传的多个第二多媒体数据；

获取每个所述目标多媒体数据对应的第二文本信息；

6.根据权利要求5所述的方法，其特征在于，所述根据所有所述第二文本信息，生成至少一个所述第二用户标签，包括：

对所有所述第二文本信息进行分词，得到多个第二词汇；

7.一种标签生成装置，其特征在于，包括：

8.一种服务器，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行如权利要求1至6中任一项所述的标签生成方法。

9.一种非临时性计算机可读存储介质，其特征在于，当所述存储介质中的指令由服务器的处理器执行时，使得所述服务器能够执行如权利要求1至6中任一项所述的标签生成方法。

10.一种包含指令的计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得所述计算机执行如权利要求1至6中任一项所述的标签生成方法。