数据处理方法、装置、计算机设备和存储介质
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种数据处理方法、装置、计算机设备和存储介质。
背景技术
多媒体视频观看应用可用于观看多媒体内容,但是,多媒体视频观看应用为用户呈现的多媒体内容之间的关联性比较差,比如,用户当前正在观看A主题的多媒体内容,下个观看的视频可能是B主题的多媒体内容,又如,用户在多媒体视频观看应用中输入搜索主题后,搜索结果显示的多媒体内容可能仅包括与搜索主题相关的字眼,多媒体内容之间的关联性比较差。
发明内容
本公开实施例至少提供一种数据处理方法、装置、计算机设备和存储介质,以提高存储的多媒体内容之间的关联度。
第一方面,本公开实施例提供了一种数据处理方法,所述方法包括:
从至少两个维度,提取多媒体内容对应的多个文本信息;
基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;
根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;
将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。
在一种实施方式中,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度,包括:
根据所述多媒体内容对应的文本信息,确定所述多媒体内容的核心信息;
根据所述多媒体内容的核心信息,对所述多个多媒体内容进行聚类,得到聚类后的至少一个多媒体群体;
基于每个所述多媒体群体中的多个多媒体内容对应的文本信息,确定该多媒体群体中的不同多媒体内容之间的相似度。
在一种实施方式中,从至少两个维度,提取多媒体内容对应的多个文本信息,包括:
基于音频识别技术,将所述多媒体内容对应的音频内容转换为第一文本信息;
基于视频识别技术,将所述多媒体内容对应的视频内容转换为第二文本信息;
基于所述多媒体内容对应的描述信息确定第三文本信息;
将所述第一文本信息、所述第二文本信息和所述第三文本信息中至少两个,作为所述多媒体内容对应的多个文本信息。
在一种实施方式中,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度,包括:
针对每个多媒体内容,基于该多媒体内容对应的每个文本信息,生成与该文本信息对应的特征向量;
对该多媒体内容对应的多个特征向量进行拼接处理,得到该多媒体内容对应的拼接特征向量;
基于每个多媒体内容对应的拼接特征向量,计算多个多媒体内容中不同多媒体内容之间的相似度。
在一种实施方式中,生成至少一个多媒体内容集合之后,还包括:
针对生成的任一多媒体内容集合,若该任一多媒体内容集合中的多媒体内容的数目大于预设阈值,则根据各所述多媒体内容的用户标识,从该任一多媒体内容集合中,确定多个多媒体内容子集;
将所述任一多媒体内容集合对应的关键信息、所述多个多媒体内容子集以及每个多媒体内容子集对应的用户标识进行关联存储。
在一种实施方式中,生成至少一个多媒体内容集合之后,还包括:
根据所述相似度,对各个所述多媒体内容集合中的多媒体内容进行排序;或者,
根据多媒体内容的内容标识,对各个所述多媒体内容集合中的多媒体内容进行排序。
在一种实施方式中,将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储之后,还包括:
在接收到用户端发起的与所述关键信息相关的搜索请求时,将与所述关键信息关联存储的多媒体内容集合推送给所述用户端。
在一种实施方式中,将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储之后,还包括:
当检测到目标用户在推荐流页面浏览多媒体内容时,获取目标用户的浏览数据;
基于所述浏览数据,确定所述目标用户当前浏览的多媒体内容对应的关键信息;
将与确定的关键信息对应的多媒体内容集合推送给所述目标用户的用户端。
第二方面,本公开实施例提供了一种数据处理装置,所述装置包括:
提取模块,用于从至少两个维度,提取多媒体内容对应的多个文本信息;
确定模块,用于基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;
生成模块,用于根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;
存储模块,用于将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。
第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述任一方面,或任一方面中任一种可能的实施方式中的步骤。
第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一方面,或任一方面中任一种可能的实施方式中的步骤。
本公开实施例提供了一种数据处理方法,从至少两个维度,提取多媒体内容对应的多个文本信息,基于多媒体内容对应的文本信息,确定多个多媒体内容之间的相似度,根据多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值,使得选择的多媒体内容集合中多媒体内容的关联性比较强,这样,存储的多媒体内容之间的关联性比较强,在将多媒体内容集合与对应的关键信息进行关联存储后,可以将关联性较强的多媒体内容集中推送给用户,用户可以集中查看关联性强的多个多媒体内容,相比不考虑多媒体内容之间的关联性进行推送的方式,提高了用户获取到关联性强的多个多媒体内容的效率。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种数据处理方法的流程示意图;
图2示出了本公开实施例所提供的一种搜索结果展示界面的示意图;
图3示出了本公开实施例所提供的一种数据处理装置的第一种结构示意图;
图4示出了本公开实施例所提供的一种数据处理装置的第二种结构示意图;
图5示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
用户在视频观看应用中的搜索页面输入感兴趣的搜索主题后,搜索结果展示页面展示与搜索主题对应的大量的多媒体内容,用户需要从大量的多媒体内容中查找与搜索主题关联性比较强的多媒体内容,也就是,用户需要从大量的多媒体内容中找出自己感兴趣的多媒体内容,这样,增加了用户查看多媒体内容的成本,降低了用户获取关联性强的多媒体内容的效率。
当用户在推荐流页面中浏览多媒体内容时,用户当前浏览的多媒体内容与之后浏览的多媒体内容之间的关联性比较差,比如,用户当前浏览的多媒体内容为主题A,之后浏览的多媒体内容为另一主题B,在用户浏览完当前多媒体内容之后,为用户推荐的多媒体内容可能不是用户感兴趣的多媒体内容,降低了用户的体验度。
基于上述研究,本公开实施例提供了一种数据处理方法,从至少两个维度,提取多媒体内容对应的多个文本信息,基于多媒体内容对应的文本信息,确定多个多媒体内容之间的相似度,根据多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值,使得选择的多媒体内容集合中多媒体内容的关联性比较强,这样,存储的多媒体内容之间的关联性比较强,在将多媒体内容集合与对应的关键信息进行关联存储后,可以将关联性较强的多媒体内容集中推送给用户,用户可以集中查看关联性强的多个多媒体内容,相比不考虑多媒体内容之间的关联性进行推送的方式,提高了用户获取到关联性强的多个多媒体内容的效率。
需要说明的是,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人对本公开做出的贡献。
下面将结合本公开中附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开的组件可以以各种不同的配置来布置和设计。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种数据处理方法进行详细介绍,本公开实施例所提供的数据处理方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、蜂窝电话、无绳电话、个人数字处理(PersonalDigital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该数据处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为终端设备为例对本公开实施例提供的数据处理方法加以说明。
参见图1所示,为本公开实施例提供了一种数据处理方法的流程图,具体包括以下步骤:
S101,从至少两个维度,提取多媒体内容对应的多个文本信息;
S102,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;
S103,根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;
S104,将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。
在S101中,多媒体内容可以为视频内容、小说内容、新闻内容等,多媒体内容包括多媒体内容的描述信息、多媒体内容的画面信息、多媒体内容包括的音频等,维度可以是视频维度、音频维度、和文本维度等。
以多媒体内容为视频内容为例对媒体内容进行说明,多媒体内容的描述信息为视频内容的简介信息,多媒体内容的画面信息为视频画面中包括的文字信息和字幕信息,音频可以为视频中插入的背景音乐,或者视频中插入的用于介绍视频内容的语音信息。
多媒体内容为吉他教学视频为例对上述信息进行示例,视频内容的描述信息可以为对吉他学习课程进行介绍的信息,视频内容的画面信息包括吉他教学画面中用于指示琴弦的文字,以及对课程进行介绍的字幕,视频内容中的音频可以为课程进行过程中的背景音乐,或者为讲解人员的讲解音频。
针对每个维度,可以从多媒体内容提取该维度下的至少一个文本信息,维度不同提取到的文本信息的条数可以相同,也可以不同。
在维度为音频维度时,可以基于音频识别技术,将多媒体内容对应的音频内容转换为第一文本信息,即,将多媒体内容中的音频内容转换为文本信息(文字信息)。其中,音频识别技术为语音识别(Automatic Speech Recognition,ASR)技术,此处不进行详细介绍。
例如,在多媒体内容为吉他教学视频内容时,吉他教学视频内容中插入了吉他教学的介绍音频为“今天为吉他教学第一课……”,利用ASR技术将介绍音频转换为第一文本信息,即,第一文本信息为“今天为吉他教学第一课……”。
在维度为视频维度时,可以基于视频识别技术,将多媒体内容对应的视频内容转换为第二文本信息,即,将多媒体内容中的视频内容转换为文本信息,在多媒体内容为视频内容时,第二多媒体文本信息中包括至少一种文本信息,比如,从视频内容中识别字幕信息和视频画面中识别的文本信息。其中,视频识别技术可以为光学字符识别(OpticalCharacter Recognition,OCR)技术,此处不进行详细说明。
例如,在多媒体内容为吉他教学视频内容时,吉他教学视频中的画面包含的文字为“琴弦……”,且对应的字幕为“图示中指示的琴弦为……|”,从该其他教学视频中提取到两条文本信息,一条文本信息为“琴弦……”,另一条文本信息为“图示中指示的琴弦为……”。
在维度为文本维度时,基于多媒体内容对应的描述信息确定第三文本信息,其中,描述信息为针对多媒体内容的简介信息,用于介绍多媒体内容的概要。可以直接将多媒体内容对应的介绍信息作为在文本维度下的第三文本信息,也可以从多媒体内容对应的描述信息中提取部分与多媒体主题相关的信息作为文本维度下的第三文本信息,可以根据实际情况确定;比如,在多媒体内容为吉他教学视频内容时,简介信息为“这节课讲述如何看懂吉他乐谱”,第三文本信息可以为“这节课讲述如何看懂吉他乐谱”,也可以为从“这节课讲述如何看懂吉他乐谱”中提取的信息。
在具体应用过程中,多媒体内容对应的多个文本信息可以包括文本维度对应的文本信息、视频维度对应的文本信息和音频维度对应的文本信息中的至少两条信息。比如,多媒体内容中的音频为不包含歌词的背景音乐,那么,该多媒体内容可以提取到文本维度和视频维度对应的文本信息,此时,多媒体内容对应的多个文本信息为文本维度对应的文本信息和视频维度对应的文本信息;又如,多媒体内容中的音频为针对多媒体的介绍音频,该多媒体可以提取到文本维度、视频维度和音频维度分别对应的内容。因此。
在S102中,相似度表征多媒体内容与多媒体内容之间的接近程度,接近程度越高,表征多媒体内容与多媒体内容之间的相似程度越高;相似度可以通过以下算法中任一种相似度计算算法计算得到:欧几里得距离、名可夫斯基距离、曼哈顿距离、和切比雪夫距离等,可以根据实际情况确定,此处不针对每种算法进行详细介绍。
在执行S102时,可以根据以下步骤确定多个多媒体内容中不同多媒体内容之间的相似度:
针对每个多媒体内容,基于该多媒体内容对应的每个文本信息,生成与该文本信息对应的特征向量,对该多媒体内容对应的多个特征向量进行拼接处理,得到该多媒体内容对应的拼接特征向量,基于每个多媒体内容对应的拼接特征向量,计算多个多媒体内容中不同多媒体内容之间的相似度。
这里,文本信息对应的特征向量表征文本语义特征向量,文本信息可以为不定长文本信息,也就是,文本信息的长度不是固定的,可以是任意自然语言文本。
在具体实施过程中,针对每个多媒体内容,对该多媒体内容对应的每个文本信息进行分词处理,得到该文本信息对应的词语序列,并为词语序列中的每个词语生成词向量,得到词向量矩阵。其中,对应上述词语序列可以使用词向量word embedding进行编码可以得到词向量矩阵。
将词向量矩阵输入到双向循环神经网络进行处理,采用长短期记忆网络(Long-Short Term Memory,LSTM)算子进行计算,通过前向处理得到各词向量与上文的语义依赖关系,通过后向处理得到个词向量与下文的语义依赖关系,将各词向量与上、下文的语义依赖关系作为输出向量,得到用于表征词语上下文语义关系的特征向量,也就是,得到文本信息对应的特征向量。
当多媒体内容对应多个文本信息时,该多媒体内容对应多个语义特征向量,利用预设的拼接函数对该多媒体内容对应的多个语义特征向量进行拼接,得到该多媒体内容对应的拼接特征向量。其中,拼接函数可以为append函数、extend函数或concatenate函数等,可以根据实际情况确定。
利用预设的相似度计算算法,和各个多媒体内容对应的拼接特征向量,计算不同多媒体内容之间的相似度,即,将每两个多媒体内容对应的拼接特征向量输入到预设的相似度计算算法中,得到每两个多媒体内容之间的相似度。其中,通过相似度计算算法计算相似度的过程此处的不进行详述。
例如,多媒体内容包括3个,分别为A、B和C,得到多媒体内容A、多媒体内容B和多媒体内容C分别对应的拼接特征向量后,可以将多媒体内容A的拼接特征向量和多媒体内容B的拼接特征向量输入到相似度计算公式,计算多媒体内容A和多媒体内容B之间的相似度,将多媒体内容A的拼接特征向量和多媒体内容C的拼接特征向量输入到相似度计算公式,多媒体内容A和多媒体内容C之间的相似度,将多媒体内容B的拼接特征向量和多媒体内容C的拼接特征向量输入到相似度计算公式,多媒体内容B和多媒体内容C之间的相似度。
当多媒体内容的数量比较大时,计算不同多媒体内容之间的相似度的处理量也比较大,为了减少计算量,在计算不同多媒体内容之间的相似度之前,可以多媒体内容进行聚类,计算聚类中不同多媒体内容之间的相似度,这样,可以大大减少计算量,提高计算效率,以下详述。
在基于提取的所述多个多媒体内容分别对应的文本信息,确定不同所述多媒体内容之间的相似度时,可以包括以下步骤:
根据所述多媒体内容对应的文本信息,确定所述多媒体内容的核心信息;根据所述多媒体内容的核心信息,对所述多个多媒体内容进行聚类,得到聚类后的至少一个多媒体群体;基于每个所述多媒体群体中的多个多媒体内容对应的文本信息,确定该多媒体群体中的不同多媒体内容之间的相似度。
这里,核心信息可以为能够表征多媒体内容的主题的至少一个核心词汇,比如,在多媒体内容为吉他教学视频时,核心信息可以为“吉他”、“教学”等。
在具体实施过程中,针对每个多媒体内容,从该多媒体内容对应的文本信息中,提取该多媒体内容对应的核心词汇。在提取核心词汇时,可以利用词汇提取工具(如jieba、刨丁解牛)从文本信息中提取,此处不进行详细介绍。
在利用多媒体内容对应的核心词汇对多个多媒体内容进行聚类分析时,首先,确定每个多媒体内容对应的核心词汇的词汇特征向量,利用各个核心词汇对应的词汇特征向量,计算每两个核心词汇之间的距离,比如,将每两个核心词汇的词汇特征向量输入到距离计算模型(如欧式距离)中,得到对应核心词汇之间的距离,将距离小于预设距离阈值对应的核心词汇所对应的多媒体内容确定为一个多媒体群体。其中,可以利用词向量wordembedding、word2vec生成词汇特征向量。
由于从多媒体平台获取的多媒体内容的数量比较多,因此,可能得到多个多媒体群体,在计算多媒体内容之间的相似度时,可以计算每个多媒体群体中多媒体内容之间的相似度,相似度的计算过程可以参考上文,此处不进行过多介绍。
在S103中,相似度阈值可以为预先确定的。
在得到多个多媒体内容中不同多媒体内容之间的相似度后,比对多媒体内容之间的相似度和相似度阈值,从大量的多媒体内容中,确定相似度大于相似度阈值的多媒体内容,将相似度大于相似度阈值的多媒体内容确定为多媒体内容集合。比如,多媒体内容包括N个,其中,大于相似度阈值的多媒体内容有M(M小于或者等于N)个,则M个多媒体内容形成一个多媒体内容集合。
在得到多媒体内容集合后,可以从多媒体内容集合中的多媒体内容对应的文本信息中,提取表征多媒体内容集合中多媒体内容主题的关键信息,在存储空间中,关联存储多媒体内容集合和对应的关键信息,以便于在用户搜索场景或推荐流场景为用户推荐相关的多媒体内容集合,下文详述。其中,可以利用词汇提取工具(如jieba、刨丁解牛等)从文本信息中提取关键信息,此处不进行详细叙述。
在得到至少一个多媒体内容集合之后,可以根据相似度,对各个多媒体内容集合中的多媒体内容进行排序,比如,按照相似度由高到低的顺序对多媒体内容集合中的多媒体内容进行排序。这样,在为用户推送给多媒体内容集合时,优先推送相似度高的多媒体内容集合,可以提高用户的观看体验。
除了根据相似度进行排序外,还可以根据多媒体内容的内容标识,对多媒体内容集合中的多媒体内容进行排序,内容标识可以为从多媒体内容中提取的词汇,也可以是为多媒体内容设置的编码。
在内容标识为词汇时,可以按照词汇的首字母由A到Z的顺序对多媒体内容集合中的多媒体内容进行排序;在内容标识为编码时,可以按照编码由小到大的顺序对多媒体内容集合中的多媒体内容进行排序。
在生成的多媒体内容集合时,生成的多媒体内容集合中包括的多媒体内容的数量可能会比较多,可以进一步对此类对媒体内容集合进行划分,得到多个多媒体内容子集,可以根据以下步骤对多媒体内容集合进行划分:
针对生成的任一多媒体内容集合,若该任一多媒体内容集合中的多媒体内容的数目大于预设阈值,则根据各所述多媒体内容的用户标识,从该任一多媒体内容集合中,确定多个多媒体内容子集;将所述任一多媒体内容集合对应的关键信息、所述多个多媒体内容子集以及每个多媒体内容子集对应的用户标识进行关联存储。
这里,用户标识用于标识上传多媒体内容的账户,该用户标识可以为账号昵称、账号标识号码(Identity,ID)等;预设阈值可以为预先设置的,可以根据历史数据确定。
在具体实施过程中,在得到至少一个多媒体内容集合后,针对每个多媒体内容集合,判断该多媒体内容集合包括的多媒体内容的数目是否大于预设阈值,在该多媒体内容集合包括的多媒体内容的数目大于预设阈值时,获取该多媒体内容集合中包括的每个多媒体内容的用户标识,将该多媒体内容集合中,具有相同用户标识的多媒体内容确定为一个多媒体内容子集。当最终确定的多媒体内容子集中仅包括一个多媒体内容时,该多媒体内容子集可以忽略。
例如,多媒体内容集合中包括20个多媒体内容,10个多媒体内容对应为用户A发布的,5个多媒体内容为用户B发布的,5个多媒体内容为用户C发布的,则得到多媒体内容子集包括3个,用户A发布的10个多媒体内容为一个多媒体内容子集,用户B发布的5个多媒体内容为一个多媒体内容子集,用户C发布的5个多媒体内容为一个多媒体内容子集。
在任一多媒体内容集合对应的多媒体内容子集后,可以在关键信息和多媒体内容集合的关系表中,关联存储多媒体内容子集和对应的用户标识,即,关联存储该任一多媒体内容集合对应的关键信息、对应的多个多媒体内容子集以及每个多媒体内容子集对应的用户标识。
例如,多媒体内容集合Q,对应的关键信息为T,多媒体内容集合对应的多媒体内容子集包括Q1和Q2,多媒体内容子集Q1对应的用户标识为A,多媒体内容子集Q2对应的用户标识为B,关联存储关键信息T、多媒体内容子集Q1和用户标识A,以及关联存储关键信息T、多媒体内容子集Q2和用户标识B。
当任一多媒体内容集合被划分为多个多媒体内容子集后,可以根据多媒体内容子集对应的用户的等级,对多个多媒体内容子集进行排序,比如,按照等级由高到低的顺序对多媒体内容子集进行排序;或者,可以根据多媒体内容子集包括的多媒体内容的数目,对多个多媒体内容子集进行排序,比如,按照数目由高到低的顺序对多媒体内容子集进行排序;或者,根据多媒体内容子集对应的用户标识的粉丝数量,对多个多媒体内容子集进行排序,比如,按照粉丝数量由高到低的顺序对多媒体内容子集进行排序。其中,用户等级可以根据用户粉丝数量、发布作品数量、作品的被点赞数量确定的。
在本公开应用于搜索场景中时,服务器在接收到用户端发起的与关键信息相关的搜索请求时,可以将与关键信息关联存储的多媒体内容集合推送给用户端,用户端在展示接收到的多媒体内容集合,可以按照多媒体内容集合中的排序对多媒体内容进行展示,比如,用户输入的搜索请求为吉他教程,用户端展示的搜索结果页面可以参考图2。
当与关键信息关联存储的多媒体内容集合包括多个多媒体内容子集时,可以任意选择一个多媒体内容子集推送给用户端,也可以按照多媒体内容子集的排序,将排序靠前的预设数目个多媒体内容子集推送给用户端,也可以将排序最靠前的多媒体内容子集推送给用户端。这样,用户端仅展示接收到多媒体内容子集。
当本公开应用于推荐流场景中时,比如,用户在推荐流页面浏览多媒体内容时,当检测到目标用户在推荐流页面浏览多媒体内容时,获取目标用户的浏览数据,基于所述浏览数据,确定所述目标用户当前浏览的多媒体内容对应的关键信息,将与确定的关键信息对应的多媒体内容集合推送给所述目标用户的用户端。
这里,浏览数据可以为用户浏览多媒体内容的主题、浏览时长、是否点赞、评论内容等数据。
在具体实现过程中,当目标用户在推荐流页面浏览多媒体内容时,服务器实时获取目标用户已经浏览过的多媒体内容的浏览数据,比如,当前时间点之前的预设时间段浏览的多媒体内容对应的主题以及分别对应的时长,根据目标用于已经浏览过的多媒体内容的浏览数据,确定目标用户正在浏览的多媒体内容对应的关键信息;或者,服务器实时获取目标用户正在浏览的多媒体内容的浏览数据,比如,获取当前正在浏览的多媒体内容的浏览主题和浏览时长,根据目标用户的当前浏览数据,确定目标用户当前正在浏览的多媒体内容的关键信息;或者,可以结合目标用户已浏览过的多媒体内容的浏览数据和当前正在浏览的多媒体内容的浏览数据,确定目标用户当前浏览的多媒体内容对应的关键信息。
从关联存储的关键信息和多媒体内容集合之间的对应关系中,查找与当前多媒体内容的关键信息匹配的关键信息,将查找到的关键信息对应的多媒体内容集合推送给目标用户,目标用户在浏览完当前多媒体内容后,为用户推送多媒体内容集合中的多媒体内容,这样,用户可以连续观看自己感兴趣的多媒体内容,提高了用户的体验度。
例如,目标用户正在浏览视频A,通过目标用户之前浏览过的视频的浏览内容和视频A的浏览内容,确定目标用户当前浏览的多媒体内容对应的关键信息为美食,则从关键信息和多媒体内容集合之间的对应关系中,查找与美食对应的多媒体内容集合,在查找到美食对应的多媒体内容集合为T后,将该多媒体内容集合T推送给目标用户,这样,目标用户在浏览完视频A之后,为用户展示该多媒体内容集合T中的多媒体内容。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与数据处理方法对应的请求处理装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述数据处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参考图3,本公开实施例提供了一种数据处理装置的示意图,所述装置包括:
提取模块31,用于从至少两个维度,提取多媒体内容对应的多个文本信息;
确定模块32,用于基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;
生成模块33,用于根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;
存储模块34,用于将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。
在一种实施方式中,所述确定模块32用于根据以下步骤确定不同所述多媒体内容之间的相似度:
根据所述多媒体内容对应的文本信息,确定所述多媒体内容的核心信息;
根据所述多媒体内容的核心信息,对所述多个多媒体内容进行聚类,得到聚类后的至少一个多媒体群体;
基于每个所述多媒体群体中的多个多媒体内容对应的文本信息,确定该多媒体群体中的不同多媒体内容之间的相似度。
在一种实施方式中,所述提取模块31用于根据以下步骤提取多媒体内容对应的多个文本信息:
基于音频识别技术,将所述多媒体内容对应的音频内容转换为第一文本信息;
基于视频识别技术,将所述多媒体内容对应的视频内容转换为第二文本信息;
基于所述多媒体内容对应的描述信息确定第三文本信息;
将所述第一文本信息、所述第二文本信息和所述第三文本信息中至少两个,作为所述多媒体内容对应的多个文本信息。
在一种实施方式中,所述确定模块32用于根据以下步骤确定多个所述多媒体内容之间的相似度:
针对每个多媒体内容,基于该多媒体内容对应的每个文本信息,生成与该文本信息对应的特征向量;
对该多媒体内容对应的多个特征向量进行拼接处理,得到该多媒体内容对应的拼接特征向量;
基于每个多媒体内容对应的拼接特征向量,计算多个多媒体内容中不同多媒体内容之间的相似度。
在一种实施方式中,所述确定模块32还用于:
针对生成的任一多媒体内容集合,若该任一多媒体内容集合中的多媒体内容的数目大于预设阈值,则根据各所述多媒体内容的用户标识,从该任一多媒体内容集合中,确定多个多媒体内容子集;
将所述任一多媒体内容集合对应的关键信息、所述多个多媒体内容子集以及每个多媒体内容子集对应的用户标识进行关联存储。
本公开实施例又提供了一种数据处理装置,参考图4,该装置与图3中的装置相比,还包括:排序模块35、推送模块36和获取模块37,所述排序模块35用于:
根据所述相似度,对各个所述多媒体内容集合中的多媒体内容进行排序;或者,
根据多媒体内容的内容标识,对各个所述多媒体内容集合中的多媒体内容进行排序。
在一种实施方式中,所述推送模块36用于:
在接收到用户端发起的与所述关键信息相关的搜索请求时,将与所述关键信息关联存储的多媒体内容集合推送给所述用户端。
在一种实施方式中,所述获取模块37用于:
当检测到目标用户在推荐流页面浏览多媒体内容时,获取目标用户的浏览数据;
所述确定模块32还用于:
基于所述浏览数据,确定所述目标用户当前浏览的多媒体内容对应的关键信息;
所述推送模块36还用于:
将与确定的关键信息对应的多媒体内容集合推送给所述目标用户的用户端。
对应于图1中的数据处理方法,本公开实施例还提供了一种计算机设备50,如图5所示,为本公开实施例提供的计算机设备50结构示意图,包括:
处理器51、存储器52、和总线53;存储器52用于存储执行指令,包括内存521和外部存储器522;这里的内存521也称内存储器,用于暂时存放处理器51中的运算数据,以及与硬盘等外部存储器522交换的数据,处理器51通过内存521与外部存储器522进行数据交换,当所述计算机设备50运行时,所述处理器51与所述存储器52之间通过总线53通信,使得所述处理器51在用户态执行以下指令:
从至少两个维度,提取多媒体内容对应的多个文本信息;
基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;
根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;
将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。
一种可能的实施方式中,处理器51执行的指令中,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度,包括:
根据所述多媒体内容对应的文本信息,确定所述多媒体内容的核心信息;
根据所述多媒体内容的核心信息,对所述多个多媒体内容进行聚类,得到聚类后的至少一个多媒体群体;
基于每个所述多媒体群体中的多个多媒体内容对应的文本信息,确定该多媒体群体中的不同多媒体内容之间的相似度。
一种可能的实施方式中,处理器51执行的指令中,从至少两个维度,提取多媒体内容对应的多个文本信息,包括:
基于音频识别技术,将所述多媒体内容对应的音频内容转换为第一文本信息;
基于视频识别技术,将所述多媒体内容对应的视频内容转换为第二文本信息;
基于所述多媒体内容对应的描述信息确定第三文本信息;
将所述第一文本信息、所述第二文本信息和所述第三文本信息中至少两个,作为所述多媒体内容对应的多个文本信息。
一种可能的实施方式中,处理器51执行的指令中,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度,包括:
针对每个多媒体内容,基于该多媒体内容对应的每个文本信息,生成与该文本信息对应的特征向量;
对该多媒体内容对应的多个特征向量进行拼接处理,得到该多媒体内容对应的拼接特征向量;
基于每个多媒体内容对应的拼接特征向量,计算多个多媒体内容中不同多媒体内容之间的相似度。
一种可能的实施方式中,处理器51执行的指令中,生成至少一个多媒体内容集合之后,还包括:
针对生成的任一多媒体内容集合,若该任一多媒体内容集合中的多媒体内容的数目大于预设阈值,则根据各所述多媒体内容的用户标识,从该任一多媒体内容集合中,确定多个多媒体内容子集;
将所述任一多媒体内容集合对应的关键信息、所述多个多媒体内容子集以及每个多媒体内容子集对应的用户标识进行关联存储。
一种可能的实施方式中,处理器51执行的指令中,生成至少一个多媒体内容集合之后,还包括:
根据所述相似度,对各个所述多媒体内容集合中的多媒体内容进行排序;或者,
根据多媒体内容的内容标识,对各个所述多媒体内容集合中的多媒体内容进行排序。
一种可能的实施方式中,处理器51执行的指令中,将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储之后,还包括:
在接收到用户端发起的与所述关键信息相关的搜索请求时,将与所述关键信息关联存储的多媒体内容集合推送给所述用户端。
一种可能的实施方式中,处理器51执行的指令中,将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储之后,还包括:
当检测到目标用户在推荐流页面浏览多媒体内容时,获取目标用户的浏览数据;
基于所述浏览数据,确定所述目标用户当前浏览的多媒体内容对应的关键信息;
将与确定的关键信息对应的多媒体内容集合推送给所述目标用户的用户端。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的数据处理方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例所提供的评论信息获取方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的数据处理方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。