CN109165302A - 多媒体文件推荐方法及装置 - Google Patents

多媒体文件推荐方法及装置 Download PDF

Info

Publication number
CN109165302A
CN109165302A CN201810846919.0A CN201810846919A CN109165302A CN 109165302 A CN109165302 A CN 109165302A CN 201810846919 A CN201810846919 A CN 201810846919A CN 109165302 A CN109165302 A CN 109165302A
Authority
CN
China
Prior art keywords
multimedia
multimedia file
file
history
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810846919.0A
Other languages
English (en)
Other versions
CN109165302B (zh
Inventor
徐涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810846919.0A priority Critical patent/CN109165302B/zh
Publication of CN109165302A publication Critical patent/CN109165302A/zh
Application granted granted Critical
Publication of CN109165302B publication Critical patent/CN109165302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及了一种多媒体文件推荐方法及装置,所述多媒体文件推荐方法包括:获取历史播放信息,所述历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件;通过所述历史播放信息获取所述历史多媒体文件的多媒体属性;在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件;根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件;通过所述索引文件中多媒体属性与多媒体标识之间的索引关系,为所述用户提供多媒体文件推荐服务。采用本发明所提供的多媒体文件推荐方法及装置解决了现有技术中多媒体文件推荐的相关性不高的问题。

Description

多媒体文件推荐方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种多媒体文件推荐方法及装置。
背景技术
随着互联网技术的发展,数以百万计的信息能够借由互联网被推送给用户,例如,用户阅读某条新闻时,向用户推荐与该条新闻内容相近的资讯,或者,用户收听某首歌曲时,向用户推荐与该首歌曲相似的歌曲,又或者,用户观看某个电视剧时,向用户推荐与该电视剧主演相关的电视剧,从而方便用户获取更多的信息。
针对音频(例如歌曲等)、视频(例如影视节目等)、图片等多媒体文件,现有一种推荐方法是基于多媒体文件的点击分布进行推荐,即根据不同用户在各自用户设备中播放多媒体文件的次数来计算各多媒体文件之间的相似度,进而向用户推荐相似度较高的多媒体文件。
然而,即使是播放次数相近的多媒体文件,也可能存在多媒体文件的实际内容差异较大,或者所表达的情绪完全不同的问题,而造成所推荐的多媒体文件并非用户实际期望的,缺乏相关性。
发明内容
为了解决上述技术问题,本发明的一个目的在于提供一种多媒体文件推荐方法及装置。
其中,本发明所采用的技术方案为:
第一方面,一种多媒体文件推荐方法,包括:获取历史播放信息,所述历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件;通过所述历史播放信息获取所述历史多媒体文件的多媒体属性;在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件;根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件;通过所述索引文件中多媒体属性与多媒体标识之间的索引关系,为所述用户提供多媒体文件推荐服务。
第二方面,一种多媒体文件推荐装置,包括:信息获取模块,用于获取历史播放信息,所述历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件;属性获取模块,用于通过所述历史播放信息获取所述历史多媒体文件的多媒体属性;文件搜索模块,用于在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件;索引建立模块,用于根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件;推荐服务模块,用于通过所述索引文件中多媒体属性与多媒体标识之间的索引关系,为所述用户提供多媒体文件推荐服务。
在一示例性实施例中,所述属性获取模块包括:文本描述信息获取单元,用于如果所述历史播放信息中不存在所述历史多媒体文件的多媒体属性,则获取用于描述所述历史多媒体文件的文本描述信息;概率计算单元,用于通过词向量模型的前向传播计算所述文本描述信息中词条的条件概率;属性定义单元,用于将所述条件概率满足指定阈值的词条作为所述历史多媒体文件的多媒体属性。
在一示例性实施例中,所述文本描述信息获取单元包括:第一信息获取子单元,用于获取用户针对所述历史多媒体文件发布的社交信息,以所述社交信息作为所述历史多媒体文件相关的文本描述信息;和/或第二信息获取子单元,用于所述历史多媒体文件为歌曲时,对所述歌曲进行歌词检索,以检索到的歌词作为所述歌曲相关的文本描述信息。
在一示例性实施例中,所述属性获取模块包括:属性提取单元,用于如果所述历史多媒体文件中存在所述历史多媒体文件的多媒体属性,则从所述历史播放信息中提取得到所述历史多媒体文件的多媒体属性。
在一示例性实施例中,所述文件搜索模块包括:词向量获取单元,用于遍历所述媒体库中的多媒体文件,获取遍历到多媒体文件所表示的词向量与所述历史多媒体文件所表示的词向量,词向量是通过词向量模型的反向传播生成的;距离计算单元,用于计算遍历到多媒体文件所表示词向量与所述历史多媒体文件所表示词向量之间的欧式距离;文件定义单元,用于将所述欧式距离小于距离阈值的多媒体文件作为所述历史多媒体文件相同或者相似的多媒体文件。
在一示例性实施例中,所述装置还包括词向量模型训练模块,所述词向量模型训练模块包括:样本描述信息获取单元,用于将对应于所述多媒体文件的多媒体标识作为所述词向量模型的输入样本,获取用于描述所述输入样本的文本描述信息;模型训练单元,用于将所述文本描述信息中的词条作为所述输入样本的上下文信息,引导所述词向量模型进行模型训练。在一示例性实施例中,所述装置还包括:属性传播模块,用于向搜索到的多媒体文件传播所述历史多媒体文件的多媒体属性。
在一示例性实施例中,所述索引建立模块包括:倒排索引配置单元,用于将所述历史多媒体文件的多媒体属性作为倒排索引的键,将对应于所述多媒体文件的多媒体标识作为倒排索引的键值;倒排索引建立单元,用于根据所述键与键值之间的索引关系为所述用户建立所述索引文件。
在一示例性实施例中,所述推荐服务模块包括:请求接收单元,用于接收多媒体推荐请求,从所述多媒体推荐请求中获取所述用户请求推荐多媒体文件的多媒体属性;标识获取单元,用于根据获取到的多媒体属性在所述索引文件中查找具有索引关系的多媒体标识,得到候选多媒体标识;集合生成单元,用于对所述候选多媒体标识对应的多媒体文件进行筛选,生成多媒体推荐集合;文件推送单元,用于推送所述多媒体推荐集合中的多媒体文件。
在一示例性实施例中,所述请求接收单元包括:信息提取子单元,用于从所述多媒体推荐请求中提取得到所述用户设备采集的音频信息;信息转换子单元,用于将所述音频信息转换为文本信息;命名实体识别子单元,用于对所述文本信息进行命名实体识别,将识别得到的命名实体作为所述用户请求推荐多媒体文件的多媒体属性。
在一示例性实施例中,所述多媒体属性有多个;所述标识获取单元包括:标识集合生成子单元,用于遍历获取到的多个多媒体属性,根据遍历到的多媒体属性在所述索引文件中查找具有索引关系的多媒体标识,生成多媒体标识集合;集合相交子单元,用于由多个多媒体标识集合的交集得到所述候选多媒体标识,每个多媒体标识集合对应一个多媒体属性。
在一示例性实施例中,所述集合生成单元包括:播放频次获取子单元,用于获取所述候选多媒体标识对应的多媒体文件的播放次数;次数比较子单元,用于进行获取到的播放次数与播放阈值之间的比较,通过所述比较确定满足播放阈值的多媒体文件;推荐集合生成子单元,用于由满足播放阈值的多媒体文件生成所述多媒体推荐集合。
第三方面,一种多媒体文件推荐装置,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的多媒体文件推荐方法。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的多媒体文件推荐方法。
在上述技术方案中,针对用户曾经在用户设备中播放的历史多媒体文件,获取对应的历史播放信息,以通过历史播放信息获取历史多媒体文件的多媒体属性,并在媒体库中搜索与历史多媒体文件相同或者相似的多媒体文件,进而根据历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为用户建立索引文件,从而通过索引文件中多媒体属性与多媒体标识之间的索引关系,为用户提供多媒体文件推荐服务,由于历史多媒体文件的多媒体属性反映了用户自身的兴趣偏好,而搜索到的多媒体文件与历史多媒体文件相同或者相似,为此,通过索引文件为用户提供的多媒体文件推荐服务,结合了用户自身的兴趣偏好和多媒体文件的相似性,充分地保证了所推荐多媒体文件与用户实际期望的相关性,避免现有技术中多媒体文件推荐的相关性不高的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据本发明所涉及的实施环境的示意图一。
图2是根据本发明所涉及的实施环境的示意图二。
图3是根据一示例性实施例示出的一种电子设备的硬件结构框图。
图4是根据一示例性实施例示出的一种多媒体文件推荐方法的流程图。
图5是图4对应实施例中步骤330在一个实施例的流程图。
图6是根据一示例性实施例示出的另一种多媒体文件推荐方法的流程图。
图7是图6对应实施例所涉及的词向量模型的示意图。
图8是图4对应实施例中步骤350在一个实施例的流程图。
图9是图4对应实施例中步骤370在一个实施例的流程图。
图10是图9对应实施例所涉及的索引文件的结构示意图。
图11是图4对应实施例中步骤390在一个实施例的流程图。
图12是图11对应实施例中步骤391在一个实施例的流程图。
图13是图12对应实施例中涉及的采用条件随机场进行命名实体识别的示意图。
图14是图11对应实施例中步骤393在一个实施例的流程图。
图15是图11对应实施例中步骤395在一个实施例的流程图。
图16是一应用场景中一种多媒体文件推荐方法的具体实现示意图。
图17是根据一示例性实施例示出的一种多媒体文件推荐装置的框图。
图18是根据一示例性实施例示出的一种多媒体文件推荐装置的硬件结构框图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
如前所述,现有的多媒体文件推荐方法,根据不同用户在各自用户设备中播放多媒体文件的次数来计算各多媒体文件之间的相似度,容易造成所推荐的多媒体文件并非用户实际期望的,缺乏相关性。
举例来说,用户期望收听歌曲A,在进行多媒体文件推荐时,首先考虑歌曲A的点击分布,即此歌曲A在不同用户设备中播放的次数,然后在媒体库中查找相似歌曲,即在不同用户设备中播放次数差不多,与歌曲A具有类似点击分布的歌曲,假设歌曲A在用户A所在用户设备中播放的次数与歌曲B在用户B所在用户设备中播放的次数差不多,便认为歌曲A与歌曲B具有类似的点击分布,即视为歌曲B与歌曲A相似度较高,使得歌曲B被推荐给用户A。
换而言之,歌曲之间的相似度是基于不同用户对歌曲的喜好来定义的,然而,不同用户所喜好的歌曲A与歌曲B所表达的情绪可能完全不同,例如,歌曲A表达悲伤的情绪,歌曲B表达的却是欢快的情绪,而表达悲伤情绪的歌曲A1由于在各用户设备中播放的次数较少,而未能推荐给用户A,此时的推荐则可视为缺乏相关性。
为此,本发明特提出了一种多媒体文件推荐方法,不仅有利于增强推荐的相关性,而且能够有效地提高推荐效率,相应地,该种多媒体文件推荐方法适用于多媒体文件推荐装置,此多媒体文件推荐装置部署于具备冯诺依曼体系结构的电子设备中,例如,智能手机、台式电脑、服务器等等。
图1为一种多媒体文件推荐方法所涉及的实施环境的示意图。该实施环境包括用户设备110、推荐服务端130和媒体服务端150。
其中,用户设备110可以是台式电脑、笔记本电脑、平板电脑、智能手机或者其他可供多媒体文件播放的电子设备,例如,智能音箱、智能电视等,在此不进行限定。
用户设备110分别与推荐服务端130、媒体服务端150之间建立无线或者有线的网络连接,以通过此网络连接实现与推荐服务端130、媒体服务端150之间的数据传输。例如,数据包括但不限于多媒体文件等等。
无论是推荐服务端130,还是媒体服务端150,服务端可以是一台服务器,也可以是由多台服务器构成的服务器集群,甚至是由多台服务器构成的云计算中心。此服务器是为用户提供后台服务的电子设备,例如,后台服务包括但不限于多媒体文件推荐服务、多媒体文件存储服务等等。
当然,根据实际营运的需要,推荐服务端130和媒体服务端150也可以整合在同一服务器集群,以使多媒体推荐由该同一服务器集群完成。
通过用户设备110与推荐服务端130、媒体服务端150的交互,用户设备110向推荐服务端130发起多媒体推荐请求,以使推荐服务端130为用户提供多媒体文件推荐服务,获得候选多媒体标识,并基于媒体服务端150中部署的媒体库,从媒体库中将候选多媒体标识对应的多媒体文件推送至用户设备110,那么,用户设备110便可借助多媒体播放器进行多媒体文件的播放。
图2为一种多媒体文件推荐方法所涉及的另一实施环境的示意图。该实施环境包括用户设备170和媒体服务端190。
区别于图1所示出的实施环境,该实施环境中,多媒体文件推荐服务由用户设备170独立完成。
具体地,当用户请求推荐多媒体文件时,用户设备170为用户提供多媒体文件推荐服务以获得候选多媒体标识,并根据获得的候选多媒体标识请求媒体服务端190推送对应的多媒体文件,进而基于多媒体播放器播放接收到的多媒体文件。
图3是根据一示例性实施例示出的一种电子设备的硬件结构框图。此电子设备适用于图1或者图2所示出实施环境中的用户设备、推荐服务端、或者媒体服务端。
需要说明的是,该电子设备只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。该电子设备也不能解释为需要依赖于或者必须具有图3中示出的示例性的电子设备200中的一个或者多个组件。
该电子设备200的硬件结构可因配置或者性能的不同而产生较大的差异,如图3所示,电子设备200包括:电源210、接口230、至少一存储器250、以及至少一中央处理器(CPU,Central Processing Units)270。
其中,电源210用于为电子设备200上的各硬件设备提供工作电压。
接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等,用于与外部设备通信。
存储器250作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统251、应用程序253及数据255等,存储方式可以是短暂存储或者永久存储。其中,操作系统251用于管理与控制电子设备200上的各硬件设备以及应用程序253,以实现中央处理器270对海量数据255的计算与处理,其可以是WindowsServerTM、MacOS XTM、UnixTM、LinuxTM、FreeBSDTM等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图3中并未示出),每个模块都可以分别包含有对电子设备200的一系列计算机可读指令。数据255可以是存储于磁盘中的照片、图片等。
中央处理器270可以包括一个或多个以上的处理器,并设置为通过总线与存储器250通信,用于运算与处理存储器250中的海量数据255。
如上面所详细描述的,适用本发明的电子设备200将通过中央处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成多媒体文件推荐方法。
此外,通过硬件电路或者硬件电路结合软件也能同样实现本发明,因此,实现本发明并不限于任何特定硬件电路、软件以及两者的组合。
请参阅图4,在一示例性实施例中,一种多媒体文件推荐方法适用于图1所示实施环境的推荐服务端,该推荐服务端的结构可以如图3所示。
该种多媒体文件推荐方法可以由推荐服务端执行,也可以理解为是由部署于推荐服务端的多媒体文件推荐装置执行。在下述方法实施例中,为了便于描述,以各步骤的执行主体为多媒体文件推荐装置加以说明,但对此不构成限定。
该种多媒体文件推荐方法可以包括以下步骤:
步骤310,获取历史播放信息,历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件。
首先,历史多媒体文件,实际为曾经在用户设备中播放的多媒体文件。
多媒体文件可以是音频、视频、图片等等,本实施例并不对多媒体文件的形式作具体限定。相应地,由于多媒体文件的不同形式可对应不同的应用场景,例如,音频推荐可对应用户点播歌曲场景,视频推荐可对应用户点播影视节目场景,图片推荐则对应于用户浏览图片场景,因此,本实施例所提供的多媒体推荐方法可根据多媒体文件的不同形式而适用于不同的应用场景。
补充说明的是,多媒体文件,存储于媒体服务端中部署的媒体库,并通过多媒体标识唯一地表示,此多媒体标识可以唯一地表示多媒体文件在媒体库中的存储位置,也可以是唯一地表示多媒体文件的名称,本实施例并未对此构成限定。例如,多媒体文件为歌曲时,歌曲ID视为歌曲的多媒体标识,此歌曲ID唯一地表示歌曲的名称、演唱者、时长、链接地址(即在媒体库中的存储位置)等等。
随着多媒体文件在用户设备中播放,即视为历史多媒体文件,相应地,用户设备便为该历史多媒体文件存储对应的历史播放信息,以此记录用户的多媒体文件播放行为,并上传至推荐服务端,进而向推荐服务端真实地反映用户自身的兴趣偏好。
也就是说,历史播放信息,用于记录用户的多媒体文件播放行为,包括但不限于:多媒体文件的名称、类型、参与者、时长、播放次数等等。
例如,历史多媒体文件为歌曲,历史播放信息可以是歌曲ID,以此表示歌曲的名称、演唱者、时长、链接地址等等。
对于推荐服务端而言,便可接收到用户设备上传的历史多媒体文件对应的历史播放信息。
历史播放信息的获取,可以来源于用户设备实时上传的历史播放信息,也可以来源于预先存储在推荐服务端中的历史播放信息,即通过读取一历史时间段内由用户设备上传的历史播放信息,在此不进行限定。
换而言之,在一实施例中,历史播放信息是用户设备实时上传的历史播放信息,以便于推荐服务端对该历史播放信息进行实时处理。在另一实施例中,历史播放信息为预先存储于推荐服务端的历史播放信息,以便于充分保障推荐服务端的处理效率。例如,在推荐服务端内存占用率较少的时候处理。
步骤330,通过历史播放信息获取历史多媒体文件的多媒体属性。
多媒体属性包括但不限于:多媒体文件的名称、类型、参与者等等。
其中,类型可以是指多媒体文件的表现类型,还可以是指多媒体文件所表达的情绪类型。以多媒体文件为歌曲为例,歌曲类型则包括摇滚、民族、流行、通俗、美声、说唱等表现类型,或者,悲伤、欢快、忧郁等情绪类型。
参与者则根据多媒体文件形式的不同而有所区别,例如,多媒体文件为歌曲时,参与者可以是演唱者、词曲创作者等,而多媒体文件为图片时,参与者可以是创作者等,当多媒体文件为影视节目时,参与者则可以是指主演、导演等。
由上可知,多媒体属性,实质反映了用户自身的兴趣偏好,例如,通过多媒体属性,反映了用户喜欢的歌曲类型,或者,用户喜欢浏览哪个创作者的图片,又或者,用户喜欢观看哪个导演的电影等等。
可以理解,如果用户喜爱某个多媒体文件,便会在用户设备中播放该多媒体文件,也就是说,历史多媒体文件及对应的历史播放信息能够反映用户自身的兴趣偏好。例如,假设用户喜爱播放某种歌曲类型的歌曲,便会在用户设备中播放该种歌曲类型的歌曲,由此产生对应于该种歌曲类型的歌曲的历史播放信息。
由此,本实施例中,历史多媒体文件的多媒体属性与对应于此历史多媒体文件的历史播放信息有关,也可以理解为,如果历史多媒体文件存在多媒体属性,则历史播放信息包含此多媒体属性。
具体地,如果历史播放信息中存在历史多媒体文件的多媒体属性,则直接从历史播放信息中提取得到历史多媒体文件的多媒体属性。
例如,历史多媒体文件为歌曲,历史播放信息包括演唱者,则从历史播放信息中可直接提取得到演唱者,以此作为歌曲的多媒体属性。
如果历史播放信息中不存在历史多媒体文件的多媒体属性,则由此触发生成历史多媒体文件的多媒体属性。
例如,历史多媒体文件为歌曲,则可通过对歌曲进行歌词检索,将检索到歌词中的某个关键字、词、词条等作为歌曲的多媒体属性。
步骤350,在媒体库中搜索与历史多媒体文件相同或者相似的多媒体文件。
如前所述,历史多媒体文件能够反映用户自身的兴趣偏好,那么,在进行多媒体文件推荐时,为了保证推荐的相关性,本实施例中,优先推荐符合用户自身兴趣偏好的多媒体文件,即与历史多媒体文件相同或者相似的多媒体文件。
与历史多媒体文件相同或者相似的多媒体文件,可以是指与历史多媒体文件具有相一致多媒体属性的多媒体文件,还可以是指与历史多媒体文件相似度较高的多媒体文件。
值得一提的是,历史多媒体文件是曾经在用户设备中播放的多媒体文件,其来源于媒体库,因此,媒体库中与历史多媒体文件相同的多媒体文件,即是指曾经在用户设备中播放的多媒体文件。
步骤370,根据历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为用户建立索引文件。
索引文件,建立了历史多媒体文件的多媒体属性与搜索到多媒体文件所对应多媒体标识之间的索引关系。此索引文件可以是正排索引文件,也可以是倒排索引文件。
其中,正排索引文件,通过多媒体标识查找多媒体属性。倒排索引文件,通过多媒体属性查找多媒体标识。
那么,只要获得用户请求推荐多媒体文件的多媒体属性,便可根据此多媒体属性在索引文件中搜索到具有索引关系的多媒体标识,以进行此多媒体标识对应多媒体文件的推荐。
步骤390,通过索引文件中多媒体属性与多媒体标识之间的索引关系,为用户提供多媒体文件推荐服务。
在为用户提供多媒体文件推荐服务时,假设多媒体属性为A,对于正排索引文件而言,则在正排索引文件中遍历多媒体标识,如果与遍历到多媒体标识具有索引关系的多媒体属性为A,则以遍历到多媒体标识对应的多媒体文件进行推荐。
对于倒排索引文件而言,则在倒排索引文件中遍历多媒体属性,如果遍历到的多媒体属性为A,则获取与遍历到多媒体属性具有索引关系的多媒体标识,并以此多媒体标识对应的多媒体文件进行推荐。
通过如上所述的过程,实现了一种结合用户自身的兴趣偏好和多媒体文件相似性的多媒体推荐方案,即通过索引文件建立多媒体属性与多媒体标识之间的索引关系,此多媒体属性反映了用户自身的兴趣偏好,具有索引关系的多媒体标识则反映了符合用户自身兴趣偏好的多媒体文件,由此充分地保证了推荐的相关性。
请参阅图5,在一示例性实施例中,步骤330可以包括以下步骤:
步骤331,如果历史播放信息中存在历史多媒体文件的多媒体属性,则从历史播放信息中提取得到历史多媒体文件的多媒体属性。
可以理解,媒体库中的多媒体文件,可能具有多媒体属性,也可能不存在任何多媒体属性。相应地,来源于媒体库而在用户设备中播放的历史多媒体文件,也未必具有多媒体属性。
如果历史多媒体文件具有多媒体属性,即可由历史播放信息中直接提取得到。
如果历史多媒体文件不存在多媒体属性,而通过人工进行多媒体属性的标注,不仅效率低下,而且将耗费巨大的人力成本。为此,本实施例中,针对不存在多媒体属性的历史多媒体文件,利用词向量模型实现历史多媒体文件的多媒体属性的自定义,即跳转执行步骤333。
步骤333,如果历史播放信息中不存在历史多媒体文件的多媒体属性,则获取用于描述历史多媒体文件的文本描述信息。
文本描述信息用于描述历史多媒体文件,也可以理解为,是以文字形式对历史多媒体文件的准确描述。
例如,当用户在社交圈发布了关于某个歌曲的评价,或者,发布了关于某个电视剧的观后感等等,那么,评价或者观后感即可视为在文字上对歌曲或者电视剧的准确描述,即相关的文本描述信息。
又或者,当多媒体文件为歌曲或者电视剧时,歌词或者电视剧详情介绍等均可视为在文字上对歌曲或者电视剧的准确描述,即相关的文本描述信息。
步骤335,通过词向量模型的前向传播计算文本描述信息中词条的条件概率。
首先,对词向量模型的构建过程加以说明。
如图6所示,词向量模型的构建过程可以包括以下步骤:
步骤410,以媒体库中多媒体文件的多媒体标识作为词向量模型的输入样本,获取用于描述输入样本的文本描述信息。
此文本描述信息用于描述输入样本,也可以理解为,是以文字形式对输入样本的准确描述。
例如,用户设备针对媒体库中多媒体文件发布的社交信息、或者互联网上传播的歌词、电视剧详情介绍等等,均可作为此多媒体文件相关的文本描述信息。
步骤430,将文本描述信息中的词条作为输入样本的上下文信息,引导词向量模型进行模型训练。
上下文信息,包括用于描述输入样本的若干词条,相应地,此若干词条可由文本描述信息中提取得到,例如,若干词条是文本描述信息所包含的若干关键词等。
值得一提的是,词条可以是指一个词语、多个词语、或者字、词语组成的短语等等,本实施例并未对此加以限定。
以图7所示为例进行说明,假设多媒体文件为歌曲,则歌曲ID(Music id)视为词向量模型700的输入样本710,相应地,用于描述此歌曲的文本描述信息中多个词条{W1,W2,W3,W4},作为输入样本710的上下文信息750。
那么,通过词向量模型700的前向传播,即可计算得到上下文信息750中各词条{W1,W2,W3,W4}的条件概率,例如,词条W1的条件概率为P1。
然后,基于各词条的条件概率定义损失函数,如果词向量模型700的模型参数使得损失函数的损失达到最小,则视为词向量模型700完成模型训练。
反之,则更换输入样本710及相应的文本描述信息750,同时更新词向量模型700的模型参数,以基于更换后词条的条件概率和更新的模型参数重新计算损失函数的损失,直至词向量模型700完成模型训练。
在完成词向量模型的模型训练之后,便可利用词向量模型700的反向传播,得到准确地词向量730。
由上可知,基于词向量模型的前向传播,以对应于历史多媒体文件的多媒体标识作为词向量模型的输入,用于描述历史多媒体文件的文本描述信息中的各词条作为输入的上下文信息,即可得到各词条的条件概率。
步骤337,将条件概率满足指定阈值的词条作为历史多媒体文件的多媒体属性。
也就是说,词条的条件概率越高,则以词条作为上下文信息来描述历史多媒体文件就越准确,由此便生成了历史多媒体文件的多媒体属性。
例如,用户在社交圈针对歌曲A进行了“伤感”的评价,假设“伤感”的条件概率高于指定阈值,则“伤感”即可作为歌曲A的多媒体属性。
通过上述实施例的配合,实现了多媒体属性的自定义,避免依赖于人工实现,不仅有利于提高标注效率,而且有效地减少了人工标注的花费。
请参阅图8,在一示例性实施例中,步骤350可以包括以下步骤:
步骤351,遍历媒体库中的多媒体文件,获取遍历到多媒体文件所表示的词向量与历史多媒体文件所表示的词向量。
其中,词向量,用于实现对多媒体文件的准确描述,进而在数字上唯一地表示多媒体文件。
具体地,词向量是通过词向量模型的反向传播生成的。
如图7所示,基于词向量模型的反向传播,以对应于多媒体文件的多媒体标识作为词向量模型的输入,用于描述多媒体文件的文本描述信息中的各词条作为输入的上下文信息,即可得到多媒体文件的词向量。
步骤353,计算遍历到多媒体文件所表示词向量与历史多媒体文件所表示词向量之间的欧式距离。
步骤355,将欧式距离小于距离阈值的多媒体文件作为历史多媒体文件相同或者相似的多媒体文件。
通过上述过程,实现了多媒体文件的词向量表示,建立了多媒体文件与文本描述信息中各词条之间的联系,进而有利于更加准确地反映多媒体文件之间的相似度,充分地保证推荐的相关性和准确性。
在一示例性实施例中,步骤350之后,如上所述的方法还可以包括以下步骤:
向搜索到的多媒体文件传播历史多媒体文件的多媒体属性。
如前所述,媒体库中的多媒体文件,可能具有多媒体属性,也可能不存在任何多媒体属性。针对不存在多媒体属性的多媒体文件,如果通过人工进行多媒体属性的标注,不仅效率低下,而且将耗费巨大的人力成本。
进一步地,由于索引文件是基于多媒体属性建立的,可以理解,如果多媒体文件的多媒体属性越丰富,则越有利于提高推荐的相关性和准确性。
为此,本实施例中,利用相似度实现不同多媒体文件之间的多媒体属性传播。
具体地,当在媒体库中搜索到与历史多媒体文件相同或者相似的多媒体文件时,针对其中不存在多媒体属性的多媒体文件,将历史多媒体文件的多媒体属性配置为此多媒体文件的多媒体属性。
举例来说,假设多媒体文件M的多媒体属性为M1,多媒体文件N不存在多媒体属性,而历史多媒体文件L的多媒体属性包括M1、N1、L1。
假设历史多媒体文件L与多媒体文件M的相似度为m,历史多媒体文件L与多媒体文件N的相似度为n,如果相似度m和相似度n均超过相似度阈值,则视为历史多媒体文件L与多媒体文件M、多媒体文件N相似或者相同。换而言之,历史多媒体文件L与多媒体文件M、多媒体文件N可以具备相一致的多媒体属性。
由此,基于历史多媒体文件L的多媒体属性M1、N1、L1,多媒体文件M的多媒体属性即可由M1扩展至M1、N1、L1,多媒体文件N的多媒体属性则由无扩展至M1、N1、L1,从而实现了多媒体属性在相似多媒体文件之间的传播。
上述过程中,实现了多媒体属性的自动扩散,避免依赖于人工实现,不仅有利于提高标注效率,而且有效地减少了人工标注的花费。
此外,通过多媒体属性的传播,有效地丰富了多媒体文件的多媒体属性,有利于增强推荐的相关性和准确性。
请参阅图9,在一示例性实施例中,步骤370可以包括以下步骤:
步骤371,将历史多媒体文件的多媒体属性作为倒排索引的键,将对应于多媒体文件的多媒体标识作为倒排索引的键值。
步骤373,根据键与键值之间的索引关系为用户建立索引文件。
本实施例中,索引文件为倒排索引文件,以此保证推荐效率。
下面以多媒体文件为歌曲举例说明倒排索引文件的建立过程。
如图10所示,假设倒排索引文件510中已经为歌手2与歌曲Id4建立了索引关系,而歌曲Id2在倒排索引文件510中尚不存在索引关系。
假设历史多媒体文件1的多媒体属性包括:歌曲类型1、歌曲类型3以及歌手2,与历史多媒体文件1相同或者相似的多媒体文件为歌曲Id2所对应的歌曲。
在倒排索引文件510中添加此歌曲对应的歌曲Id2,即建立歌曲类型1、歌曲类型3、歌手2与歌曲Id2之间的索引关系,将歌曲Id2分别插入至倒排索引链表5131、5132、5133的末尾。其中,倒排索引链表5131、5132是基于歌曲Id2的歌曲而新形成的,而倒排索引链表5133则是基于歌曲Id4的歌曲已经形成的。
需要说明的是,倒排索引链表是由若干个多媒体标识组成的。
进一步地,假设歌曲Id9也不存在索引关系于倒排索引文件510中。
假设历史多媒体文件2的多媒体属性为歌曲类型1,与历史多媒体文件2相同或者相似的多媒体文件为歌曲Id9所对应的歌曲。
在倒排索引文件510中添加此歌曲对应的歌曲Id9,即建立歌曲类型1与歌曲Id9之间的索引关系,将歌曲Id9插入至已形成倒排索引链表5131的末尾。
由上可知,所有与历史多媒体文件相同或者相似的多媒体文件都基于历史多媒体文件的多媒体属性,而逐渐插入至已形成倒排索引链表的末尾,或者,新形成一个倒排索引链表。
进一步地,针对倒排索引链表中存储的多媒体标识,排列顺序可以是基于插入时间进行,即后插入的排在倒排索引链表的末尾,还可以基于多媒体标识所对应多媒体文件的点击分布进行,即对于同一倒排索引链表而言,对应于播放次数较多的多媒体文件的多媒体标识排在对应于播放次数较少的多媒体文件的多媒体标识之前,又或者基于多媒体文件之间的相似度进行,本实施例并未对此加以限定。
通过上述过程,对于倒排索引文件中的倒排索引链表而言,实质上存储了具有相一致多媒体属性的多个相同或者相似的多媒体文件,充分保障了推荐的相关性。
此外,基于倒排索引文件中建立的多媒体属性与多媒体标识之间的索引关系,由多媒体属性即可在倒排索引文件中快速查找到相应的多媒体标识,有效地提高了推荐效率。
值得一提的是,倒排索引文件由单个用户历史播放的历史多媒体文件的多媒体属性构建,由此完成的多媒体推荐强调了推荐的个性化,即所推荐的多媒体文件更加贴合于该单个用户自身喜爱的多媒体文件。
请参阅图11,在一示例性实施例中,步骤390可以包括以下步骤:
步骤391,接收多媒体推荐请求,从多媒体推荐请求中获取用户请求推荐多媒体文件的多媒体属性。
首先说明的是,多媒体推荐请求是为了进行多媒体文件推荐而发起的。
对于用户设备而言,用户设备可为用户提供一个请求发起入口,如果用户期望进行多媒体文件推荐时,便可在此请求发起入口中触发相关操作,使得用户设备检测到此操作,并由此生成多媒体推荐请求。
针对用户设备所配置的输入组件(例如鼠标、键盘、麦克风、屏幕、遥控器)不同,请求发起入口有所区别,在此请求发起入口中触发的相关操作也各不相同。例如,相关操作包括但不限于点击、移动、拖拽、滑动等等。
举例来说,用户设备为智能电视,则请求发起入口可以是此智能电视所配置遥控器的语音输入按键,用户将通过按压此语音输入按键输入一段语音,以此向智能电视发起多媒体推荐请求。其中,按压操作即为请求发起入口触发的相关操作。
或者,用户设备为智能音箱,请求发起入口可以是此智能音箱配置的麦克风,用户通过语音输入使得麦克风采集到一段语音,进而向智能音箱发起多媒体推荐请求。其中,语音输入操作即为请求发起入口触发的相关操作。
又或者,用户设备为台式电脑,请求发起入口可以是此台式电脑所配置屏幕中呈现的文本输入对话框,用户通过在此文本输入对话框中输入文本,使得台式电脑为此生成多媒体推荐请求。其中,输入操作即为请求发起入口触发的相关操作。
那么,对于推荐服务端中部署的多媒体文件推荐装置来说,便可在用户设备发送多媒体推荐请求之后,接收到此多媒体推荐请求,进而为用户提供多媒体推荐服务。
其次,从多媒体推荐请求中获取用户请求推荐多媒体文件的多媒体属性。
如前所述,多媒体推荐请求是用户期望进行多媒体文件推荐所发起的,例如,多媒体文件为歌曲时,用户期望进行歌曲推荐时,可以针对其所希望收听的歌曲的名称、演唱者进行点播,或者,多媒体文件为电视剧时,用户期望进行电视剧推荐时,可以针对其所希望观看的电视剧的名称、主演进行点播。那么,多媒体文件推荐装置便可基于用户所点播内容进行相应的多媒体文件推荐。
换而言之,多媒体推荐请求中至少携带了用户请求推荐多媒体文件的多媒体属性。
那么,在接收到多媒体推荐请求之后,便可由此多媒体推荐请求中提取得到相应的多媒体属性,进而根据此多媒体属性触发进行后续的多媒体文件推荐。
步骤393,根据获取到的多媒体属性在索引文件中查找具有索引关系的多媒体标识,得到候选多媒体标识。
以多媒体文件为歌曲举例说明,如图10所示,倒排索引文件510包含具有索引关系的多媒体属性511和倒排索引链表513。
其中,多媒体属性511可以是歌手、歌曲类型等,倒排索引链表513中存储的多媒体标识则为歌曲ID。
由此,在获得多媒体属性511之后,便可在倒排索引文件510中查找到具有索引关系的倒排索引链表513中存储的多媒体标识,此多媒体标识即视为候选多媒体标识。例如,与歌手3具有索引关系的倒排索引链表中存储的歌曲ID为Id1,即候选多媒体标识。
在查找到候选多媒体标识之后,便可从媒体库530中获得对应的多媒体文件,即候选多媒体标识Id1唯一表示的多媒体文件。
步骤395,对候选多媒体标识对应的多媒体文件进行筛选,生成多媒体推荐集合。
可以理解,候选多媒体标识对应的多媒体文件不止一个,没有必要将全部多媒体文件推荐给用户。
为此,在得到候选多媒体标识对应的多媒体文件之后,还将对得到的多媒体文件进行筛选,筛选依据可以是发布时间、热门程度等等。
步骤397,推送多媒体推荐集合中的多媒体文件。
对于用户设备而言,在媒体服务端从媒体库中推送了多媒体文件之后,便可借助多媒体播放器进行多媒体推荐集合中多媒体文件的播放。
多媒体文件可以是与用户期望直接相关的,还可以是与用户期望类似的,在此并不进行限定。例如,用户期望播放歌曲A,则多媒体文件可以就是歌曲A本身,也可以是与歌曲A类似的歌曲A1、A2、A3等等,其中,歌曲A与歌曲A1、A2、A3具有相同的多媒体属性,例如,由相同的歌手演唱、或者具有相同的表现类型、或者表达相同的情绪。
在一实施例的具体实现中,针对用户期望播放歌曲A,在用户设备中优先播放歌曲A,随着用户设备进行歌曲A的播放,多媒体文件推荐装置执行多媒体文件推荐过程,得到多媒体文件为歌曲A1、A2、A3,当歌曲A在用户设备中完成播放,则按照多媒体文件相应的点击分布播放,例如,依次播放歌曲A1、A2、A3。由此,多媒体文件推荐过程并未影响歌曲A在用户设备中的播放,对于用户而言,并无感知多媒体文件推荐过程,有效地提升了用户的娱乐体验。
当然,多媒体文件的播放顺序还可以是随机播放,或者按照与歌曲A的相似度播放,也可以按照多媒体文件的名称拼读规则播放,本实施例并非对此构成限定。
通过如上所述的过程,实现了实时与历史相结合,即多媒体文件不仅符合用户实时请求推荐的多媒体文件,而且与历史多媒体文件具有相一致的多媒体属性,使得多媒体文件更贴切于用户的实际需求,以此增强了推荐相关性。
请参阅图12,在一示例性实施例中,步骤391可以包括以下步骤:
步骤3911,从多媒体推荐请求中提取得到用户设备采集的音频信息。
如前所述,当用户期望进行多媒体文件推荐时,将输入一段语音,那么,用户设备便可借助麦克风采集到此段语音,进而形成音频信息,并以此发起多媒体推荐请求。
由此,对于多媒体文件推荐装置而言,便可由多媒体推荐请求中得到此音频信息。
步骤3913,将音频信息转换为文本信息。
转换,可通过语音识别技术实现。
步骤3915,对文本信息进行命名实体识别,将识别得到的命名实体作为用户请求推荐多媒体文件的多媒体属性。
命名实体,用于表示人名、机构名、地名或者专用名词。具体地,命名实体识别可以采用词典法、监督学习法等等。
例如,词典法是基于词法规则、语法规则、语义规则建立词典库,进而通过词典库对文本信息进行识别。
监督学习法是调用命名实体识别模型对文本信息进行识别,此命名实体识别模型则是根据大量训练样本对指定模型进行模型训练得到的,训练样本是指进行了命名实体标注的文本信息。
其中,指定模型包括但不限于:隐马尔可夫模型、最大熵模型、支持向量机模型、条件随机场模型、神经网络模型等等,本实施例并未对此加以限定。
由此,在完成命名实体识别,即得到指示了多媒体属性的多媒体属性信息。例如,识别出的命名实体包括歌曲名称、歌手、表达情绪的专用名词等等,则相应的多媒体属性即为歌曲名称、歌手、表达情绪的专用名词等等。
举例来说,调用由条件随机场模型训练得到的命名实体识别模型,对文本信息“去看谭咏麟演出”进行识别。
如图13所示,使用状态B、I、E、O来标注文本信息,状态B表示命名实体的开头,状态I表示命名实体的中间,状态E表示命名实体的结尾,状态O表示不属于命名实体,由此,基于文本信息中每个字所属的不同状态而构建的概率无向图,统计文本信息中每个字属于每个状态的概率,进而查找出一条概率和最大的路径(如图13中示出的由灰色圆圈连接形成的路径),由此识别得到此文本信息中包含的命名实体“谭咏麟”。
进一步地,结合词典法和监督学习法进行命名实体识别,以此提高命名实体识别的准确性,有效地避免口语化表达中过多不规则或者无意义的成分。
具体地,首先,分别根据词典法和监督学习法识别文本信息中的命名实体,得到第一识别结果和第二识别结果。
进行第一识别结果和第二识别结果之间的匹配,如果完全匹配,则由完全匹配的命名实体作为多媒体属性。
反之,如果不完全匹配,则调用分类模型分别对第一识别结果和第二识别结果进行合法标签预测,合法标签用于指示识别结果中的命名实体是否符合语法规则,进而即可根据合法标签确定多媒体属性。
假设预测得到的第一合法标签指示第一识别结果中的命名实体符合语法规则,而预测得到的第二合法标签指示第二识别结果中的命名实体不符合语法规则,则以第一识别结果中的命名实体作为多媒体属性。
其中,分类模型是根据大量训练样本对指定模型进行模型训练得到的,训练样本是指进行了合法标签标注的命名实体。指定模型包括但不限于:隐马尔可夫模型、最大熵模型、支持向量机模型、条件随机场模型、神经网络模型等等,在此并未对此加以限定。
上述过程中,实现了文本信息中命名实体的识别,为后续加强推荐的相关性提供了充分的依据,即被推荐的候选媒体文件与用户请求推荐的多媒体文件具有相一致的命名实体,即多媒体属性。
此外,通过词典法和监督学习法相结合,更加精确地定位到用户的真实意图,进一步有利于增强推荐的相关性。
补充说明的是,如果文本信息中不存在命名实体,此时可随机从索引文件中获取一候选多媒体标识,进而完成多媒体文件的推荐。
请参阅图14,在一示例性实施例中,多媒体属性有多个。相应地,步骤393可以包括以下步骤:
步骤3931,遍历多个多媒体属性,根据遍历到的多媒体属性在索引文件中查找具有索引关系的多媒体标识,生成多媒体标识集合。
步骤3933,由多个多媒体标识集合的交集得到所述候选多媒体标识,每个多媒体标识集合对应一个多媒体属性。
以图10所示为例,假设多媒体属性包括歌曲类型1和歌手2。
那么,针对歌曲类型1,在倒排索引文件510中查找到的多媒体标识集合,即为倒排索引链表5131中存储的具有索引关系的若干歌曲Id:Id2、Id5、Id9。
而针对歌手2,在倒排索引文件510中查找到的多媒体标识集合,即为倒排索引链表5133中存储的具有索引关系的若干歌曲Id:Id4、Id2。
基于前述两个多媒体标识集合,二者的交集即为歌曲Id2,也就是说,歌曲Id2所表示歌曲同时符合了多个多媒体属性,与用户请求推荐的多媒体文件最相关。
由此,便可将歌曲Id2所对应的歌曲进行推送。
上述过程中,通过交集方式获取与用户请求推荐的多媒体文件最相关的多媒体文件,以此进一步地增强了推荐的相关性。
请参阅图15,在一示例性实施例中,步骤395可以包括以下步骤:
步骤3951,获取候选多媒体标识对应的多媒体文件的播放次数。
步骤3953,进行获取到的播放次数与播放阈值之间的比较,通过比较确定满足播放阈值的多媒体文件。
步骤3955,由满足播放阈值的多媒体文件生成多媒体推荐集合。
可以理解,如果播放次数越多,则说明此多媒体文件越受用户的喜爱,越热门。
为此,本实施例中,结合用户的喜爱程度,播放次数越多的多媒体文件优先被推送,以此进一步地增强了推荐的相关性。
在上述实施例的配合下,所推荐的多媒体文件不仅是与用户期望最相关的,而且是眼下较为热门的,更容易被用户所喜爱,由此进一步增强了推荐的相关性,有利于提升用户的娱乐体检。
图16是一应用场景中一种多媒体文件推荐方法的具体实现示意图。该应用场景中,多媒体推荐过程是基于用户设备、推荐服务端和媒体服务端交互完成的。其中,如果用户设备为智能音箱,则所推荐的多媒体文件为歌曲,如果用户设备为智能电视,则所推荐的多媒体文件为影视节目,例如,电视剧或者电影等,在此并不构成限定。
具体地,多媒体文件的推荐过程包括线上和线下两部分。
线上部分,由用户设备与推荐服务端、媒体服务端交互完成,包括基于用户请求的多媒体属性提取、基于索引文件的多媒体标识查找、多媒体文件排序、推荐等。
线下部分,由推荐服务端完成,包括文本描述信息的获取、词向量模型的模型训练、词向量表示、基于多媒体属性与多媒体标识的索引文件建立等。
在本应用场景中,实现了用户实时请求和用户播放历史相结合的多媒体推荐方案,不仅有效地提高了推荐的相关性,而且在满足用户个性化需求的同时,实现了细粒度的多媒体文件推荐。
此外,基于多媒体文件的词向量表示,实现了多媒体文件相似度的精准计算,尤其避免了高频歌曲和低频歌曲可能存在的相似度差异,有利于提高推荐的准确度。
下述为本发明装置实施例,可以用于执行本发明所涉及的多媒体文件推荐方法。对于本发明装置实施例中未披露的细节,请参照本发明所涉及的多媒体文件推荐方法的方法实施例。
请参阅图17,在一示例性实施例中,一种多媒体文件推荐装置900包括但不限于:信息获取模块910、属性获取模块930、文件搜索模块950、索引建立模块970和推荐服务模块990。
其中,信息获取模块910用于获取历史播放信息,所述历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件;
属性获取模块930用于通过所述历史播放信息获取所述历史多媒体文件的多媒体属性;
文件搜索模块950用于在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件;
索引建立模块970用于根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件;
推荐服务模块990用于通过所述索引文件中多媒体属性与多媒体标识之间的索引关系,为所述用户提供多媒体文件推荐服务。
需要说明的是,上述实施例所提供的多媒体文件推荐装置在进行多媒体文件推荐处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即多媒体文件推荐装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的多媒体文件推荐装置与多媒体文件推荐方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
请参阅图18,在一示例性实施例中,一种多媒体文件推荐装置1000,包括至少一处理器1001、至少一存储器1002、以及至少一通信总线1003。
其中,存储器1002上存储有计算机可读指令,处理器1001通过通信总线1003读取存储器1002中存储的计算机可读指令。
该计算机可读指令被处理器执行时实现上述各实施例中的多媒体文件推荐方法。
在一示例性实施例中,一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例中的多媒体文件推荐方法。
上述内容,仅为本发明的较佳示例性实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。

Claims (15)

1.一种多媒体文件推荐方法,其特征在于,包括:
获取历史播放信息,所述历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件;
通过所述历史播放信息获取所述历史多媒体文件的多媒体属性;
在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件;
根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件;
通过所述索引文件中多媒体属性与多媒体标识之间的索引关系,为所述用户提供多媒体文件推荐服务。
2.如权利要求1所述的方法,其特征在于,所述通过所述历史播放信息获取所述历史多媒体文件的多媒体属性,包括:
如果所述历史播放信息中不存在所述历史多媒体文件的多媒体属性,则获取用于描述所述历史多媒体文件的文本描述信息;
通过词向量模型的前向传播计算所述文本描述信息中词条的条件概率;
将所述条件概率满足指定阈值的词条作为所述历史多媒体文件的多媒体属性。
3.如权利要求2所述的方法,其特征在于,所述获取用于描述所述历史多媒体文件的文本描述信息,包括:
获取用户针对所述历史多媒体文件发布的社交信息,以所述社交信息作为所述历史多媒体文件相关的文本描述信息;和/或
所述历史多媒体文件为歌曲时,对所述歌曲进行歌词检索,以检索到的歌词作为所述歌曲相关的文本描述信息。
4.如权利要求2所述的方法,其特征在于,所述通过所述历史播放信息获取所述历史多媒体文件的多媒体属性,还包括:
如果所述历史播放信息中存在所述历史多媒体文件的多媒体属性,则从所述历史播放信息中提取得到所述历史多媒体文件的多媒体属性。
5.如权利要求1所述的方法,其特征在于,所述在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件,包括:
遍历所述媒体库中的多媒体文件,获取遍历到多媒体文件所表示的词向量与所述历史多媒体文件所表示的词向量,词向量是通过词向量模型的反向传播生成的;
计算遍历到多媒体文件所表示词向量与所述历史多媒体文件所表示词向量之间的欧式距离;
将所述欧式距离小于距离阈值的多媒体文件作为所述历史多媒体文件相同或者相似的多媒体文件。
6.如权利要求5所述的方法,其特征在于,所述词向量是通过词向量模型的反向传播生成的之前,所述方法还包括:
将对应于所述多媒体文件的多媒体标识作为所述词向量模型的输入样本,获取用于描述所述输入样本的文本描述信息;
将所述文本描述信息中的词条作为所述输入样本的上下文信息,引导所述词向量模型进行模型训练。
7.如权利要求1所述的方法,其特征在于,所述在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件之后,所述方法还包括:
向搜索到的多媒体文件传播所述历史多媒体文件的多媒体属性。
8.如权利要求1所述的方法,其特征在于,所述根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件,包括:
将所述历史多媒体文件的多媒体属性作为倒排索引的键,将对应于所述多媒体文件的多媒体标识作为倒排索引的键值;
根据所述键与键值之间的索引关系为所述用户建立所述索引文件。
9.如权利要求1至8任一项所述的方法,其特征在于,所述通过所述索引文件中多媒体属性与多媒体文件之间的索引关系,为用户提供多媒体文件推荐服务,包括:
接收多媒体推荐请求,从所述多媒体推荐请求中获取所述用户请求推荐多媒体文件的多媒体属性;
根据获取到的多媒体属性在所述索引文件中查找具有索引关系的多媒体标识,得到候选多媒体标识;
对所述候选多媒体标识对应的多媒体文件进行筛选,生成多媒体推荐集合;
推送所述多媒体推荐集合中的多媒体文件。
10.如权利要求9所述的方法,其特征在于,所述从所述多媒体推荐请求中获取所述用户请求推荐多媒体文件的多媒体属性,包括:
从所述多媒体推荐请求中提取得到所述用户设备采集的音频信息;
将所述音频信息转换为文本信息;
对所述文本信息进行命名实体识别,将识别得到的命名实体作为所述用户请求推荐多媒体文件的多媒体属性。
11.如权利要求9所述的方法,其特征在于,所述多媒体属性有多个;
所述根据获取到的多媒体属性在所述索引文件中查找具有索引关系的多媒体标识,得到候选多媒体标识,包括:
遍历获取到的多个多媒体属性,根据遍历到的多媒体属性在所述索引文件中查找具有索引关系的多媒体标识,生成多媒体标识集合;
由多个多媒体标识集合的交集得到所述候选多媒体标识,每个多媒体标识集合对应一个多媒体属性。
12.如权利要求9所述的方法,其特征在于,所述对所述候选多媒体标识对应的多媒体文件进行筛选,生成多媒体推荐集合,包括:
获取所述候选多媒体标识对应的多媒体文件的播放次数;
进行获取到的播放次数与播放阈值之间的比较,通过所述比较确定满足播放阈值的多媒体文件;
由满足播放阈值的多媒体文件生成所述多媒体推荐集合。
13.一种多媒体文件推荐装置,其特征在于,包括:
信息获取模块,用于获取历史播放信息,所述历史播放信息对应于用户曾经在用户设备中播放的历史多媒体文件;
属性获取模块,用于通过所述历史播放信息获取所述历史多媒体文件的多媒体属性;
文件搜索模块,用于在媒体库中搜索与所述历史多媒体文件相同或者相似的多媒体文件;
索引建立模块,用于根据所述历史多媒体文件的多媒体属性和搜索到多媒体文件所对应的多媒体标识,为所述用户建立索引文件;
推荐服务模块,用于通过所述索引文件中多媒体属性与多媒体标识之间的索引关系,为所述用户提供多媒体文件推荐服务。
14.一种多媒体文件推荐装置,其特征在于,包括:
处理器;及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至12中任一项所述的多媒体文件推荐方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的多媒体文件推荐方法。
CN201810846919.0A 2018-07-27 2018-07-27 多媒体文件推荐方法及装置 Active CN109165302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810846919.0A CN109165302B (zh) 2018-07-27 2018-07-27 多媒体文件推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810846919.0A CN109165302B (zh) 2018-07-27 2018-07-27 多媒体文件推荐方法及装置

Publications (2)

Publication Number Publication Date
CN109165302A true CN109165302A (zh) 2019-01-08
CN109165302B CN109165302B (zh) 2023-04-11

Family

ID=64898558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810846919.0A Active CN109165302B (zh) 2018-07-27 2018-07-27 多媒体文件推荐方法及装置

Country Status (1)

Country Link
CN (1) CN109165302B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069615A (zh) * 2019-04-30 2019-07-30 百度在线网络技术(北京)有限公司 一种音乐知识推荐方法、装置以及终端
CN110795660A (zh) * 2019-09-26 2020-02-14 北京大米科技有限公司 数据分析方法、装置、电子设备及介质
CN110825891A (zh) * 2019-10-31 2020-02-21 北京小米移动软件有限公司 多媒体信息的识别方法及装置、存储介质
CN110990600A (zh) * 2019-12-04 2020-04-10 腾讯科技(深圳)有限公司 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN111274819A (zh) * 2020-02-13 2020-06-12 北京声智科技有限公司 资源获取方法及装置
CN111368025A (zh) * 2020-02-24 2020-07-03 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质
CN111737501A (zh) * 2020-06-22 2020-10-02 北京百度网讯科技有限公司 一种内容推荐方法及装置、电子设备、存储介质
CN111858970A (zh) * 2019-04-30 2020-10-30 北京达佳互联信息技术有限公司 多媒体内容推荐方法、装置、电子设备及可读存储介质
CN112015922A (zh) * 2020-08-26 2020-12-01 北京达佳互联信息技术有限公司 多媒体文件的检索方法、装置、设备及存储介质
CN112241486A (zh) * 2019-07-17 2021-01-19 北京达佳互联信息技术有限公司 多媒体信息获取方法及装置
CN113220929A (zh) * 2021-04-06 2021-08-06 辽宁工程技术大学 一种基于时间驻留与状态驻留混合模型的音乐推荐方法
CN113569126A (zh) * 2020-04-29 2021-10-29 北京达佳互联信息技术有限公司 多媒体文件推荐方法、装置及服务器
CN113781087A (zh) * 2021-01-29 2021-12-10 北京沃东天骏信息技术有限公司 推荐对象的召回方法及装置、存储介质、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500235A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
WO2015043549A1 (zh) * 2013-09-30 2015-04-02 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及电子设备
CN106446135A (zh) * 2016-09-19 2017-02-22 北京搜狐新动力信息技术有限公司 一种多媒体数据标签生成方法和装置
CN107943894A (zh) * 2017-11-16 2018-04-20 百度在线网络技术(北京)有限公司 用于推送多媒体内容的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015043549A1 (zh) * 2013-09-30 2015-04-02 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及电子设备
CN103500235A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
CN106446135A (zh) * 2016-09-19 2017-02-22 北京搜狐新动力信息技术有限公司 一种多媒体数据标签生成方法和装置
CN107943894A (zh) * 2017-11-16 2018-04-20 百度在线网络技术(北京)有限公司 用于推送多媒体内容的方法和装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858970A (zh) * 2019-04-30 2020-10-30 北京达佳互联信息技术有限公司 多媒体内容推荐方法、装置、电子设备及可读存储介质
CN111858970B (zh) * 2019-04-30 2024-01-02 北京达佳互联信息技术有限公司 多媒体内容推荐方法、装置、电子设备及可读存储介质
CN110069615A (zh) * 2019-04-30 2019-07-30 百度在线网络技术(北京)有限公司 一种音乐知识推荐方法、装置以及终端
CN112241486A (zh) * 2019-07-17 2021-01-19 北京达佳互联信息技术有限公司 多媒体信息获取方法及装置
CN110795660A (zh) * 2019-09-26 2020-02-14 北京大米科技有限公司 数据分析方法、装置、电子设备及介质
CN110825891A (zh) * 2019-10-31 2020-02-21 北京小米移动软件有限公司 多媒体信息的识别方法及装置、存储介质
CN110825891B (zh) * 2019-10-31 2023-11-14 北京小米移动软件有限公司 多媒体信息的识别方法及装置、存储介质
CN110990600A (zh) * 2019-12-04 2020-04-10 腾讯科技(深圳)有限公司 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN110990600B (zh) * 2019-12-04 2023-04-18 腾讯科技(深圳)有限公司 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN111274819A (zh) * 2020-02-13 2020-06-12 北京声智科技有限公司 资源获取方法及装置
CN111368025A (zh) * 2020-02-24 2020-07-03 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质
CN111368025B (zh) * 2020-02-24 2023-12-22 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质
CN113569126A (zh) * 2020-04-29 2021-10-29 北京达佳互联信息技术有限公司 多媒体文件推荐方法、装置及服务器
CN111737501A (zh) * 2020-06-22 2020-10-02 北京百度网讯科技有限公司 一种内容推荐方法及装置、电子设备、存储介质
CN112015922A (zh) * 2020-08-26 2020-12-01 北京达佳互联信息技术有限公司 多媒体文件的检索方法、装置、设备及存储介质
CN112015922B (zh) * 2020-08-26 2023-09-26 北京达佳互联信息技术有限公司 多媒体文件的检索方法、装置、设备及存储介质
CN113781087A (zh) * 2021-01-29 2021-12-10 北京沃东天骏信息技术有限公司 推荐对象的召回方法及装置、存储介质、电子设备
CN113220929B (zh) * 2021-04-06 2023-12-05 辽宁工程技术大学 一种基于时间驻留与状态驻留混合模型的音乐推荐方法
CN113220929A (zh) * 2021-04-06 2021-08-06 辽宁工程技术大学 一种基于时间驻留与状态驻留混合模型的音乐推荐方法

Also Published As

Publication number Publication date
CN109165302B (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
CN109165302A (zh) 多媒体文件推荐方法及装置
JP7335062B2 (ja) 音声サービス提供方法および装置
US10643610B2 (en) Voice interaction based method and apparatus for generating multimedia playlist
CN107918653B (zh) 一种基于喜好反馈的智能播放方法和装置
US9824150B2 (en) Systems and methods for providing information discovery and retrieval
CN105659230B (zh) 使用媒体消费历史的查询响应
WO2017096877A1 (zh) 一种推荐方法和装置
US10055493B2 (en) Generating a playlist
CN110430476B (zh) 直播间搜索方法、系统、计算机设备和存储介质
JP6192714B2 (ja) 自然言語処理を可能にするシステム及び方法
US9576050B1 (en) Generating a playlist based on input acoustic information
US11157542B2 (en) Systems, methods and computer program products for associating media content having different modalities
CN105335414B (zh) 音乐推荐方法、装置及终端
US20170242861A1 (en) Music Recommendation Method and Apparatus
KR20130055748A (ko) 콘텐츠 추천 시스템 및 방법
US11609738B1 (en) Audio segment recommendation
CN111753126B (zh) 用于视频配乐的方法和装置
CN111883131B (zh) 语音数据的处理方法及装置
CN113746875A (zh) 一种语音包推荐方法、装置、设备及存储介质
Yang Research on music content recognition and recommendation technology based on deep learning
JP5013161B2 (ja) 情報処理装置および情報処理方法、提供装置および提供方法、並びにプログラム
EP3985669A1 (en) Methods and systems for automatically matching audio content with visual input
US20220350838A1 (en) Methods and systems for organizing music tracks
CN110569447B (zh) 一种网络资源的推荐方法、装置及存储介质
Jannach et al. Music Recommendations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant