CN113688310A - 一种内容推荐方法、装置、设备及存储介质 - Google Patents

一种内容推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113688310A
CN113688310A CN202110839324.4A CN202110839324A CN113688310A CN 113688310 A CN113688310 A CN 113688310A CN 202110839324 A CN202110839324 A CN 202110839324A CN 113688310 A CN113688310 A CN 113688310A
Authority
CN
China
Prior art keywords
target
content
multimedia content
sensitivity
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110839324.4A
Other languages
English (en)
Other versions
CN113688310B (zh
Inventor
朱晓航
郝艳妮
张翔宇
王璋盛
刘春阳
曹家
王鹏
陈志鹏
曲宝玉
解峥
罗引
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoke Zhian Beijing Technology Co ltd
Beijing Zhongke Wenge Technology Co ltd
National Computer Network and Information Security Management Center
Original Assignee
Guoke Zhian Beijing Technology Co ltd
Beijing Zhongke Wenge Technology Co ltd
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoke Zhian Beijing Technology Co ltd, Beijing Zhongke Wenge Technology Co ltd, National Computer Network and Information Security Management Center filed Critical Guoke Zhian Beijing Technology Co ltd
Priority to CN202110839324.4A priority Critical patent/CN113688310B/zh
Publication of CN113688310A publication Critical patent/CN113688310A/zh
Application granted granted Critical
Publication of CN113688310B publication Critical patent/CN113688310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。

Description

一种内容推荐方法、装置、设备及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种内容推荐方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展,越来越多的用户可以在不同的网络平台上查看感兴趣的内容。例如,用户可以从媒体平台、社交平台、门户网站等网络平台查看感兴趣的内容。
一般情况下,网络平台会为用户推荐其可能感兴趣的内容,以供用户进行快速查看。然而,在相关技术中,在为用户推荐内容时,往往仅基于单一的互动因素进行推荐,导致用户可能对所推荐的内容的不感兴趣,降低了内容推荐的准确性。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了了一种内容推荐方法、装置、设备及存储介质。
本公开提供了一种内容推荐方法,该方法包括:
获取多媒体内容;
确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度;
基于推荐度影响参数,确定多媒体内容的目标推荐度;
在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。
本公开提供了一种内容推荐装置,该装置包括:
多媒体内容获取模块,用于获取多媒体内容;
推荐度影响数据确定模块,用于确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度;
目标推荐度确定模块,用于基于推荐度影响参数,确定多媒体内容的目标推荐度;
多媒体内容推荐模块,用于在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。
本发明实施例还提供了一种内容推荐设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明任意实施例所提供的内容推荐方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明任意实施例所提供的内容推荐方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例的内容推荐方法、装置、设备及存储介质,能够在获取到多媒体内容之后,基于该多媒体内容的推荐度影响参数,确定该多媒体内容的目标推荐度,由于用于确定目标推荐度的目标推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,使得目标推荐度可以受到包括互动因素和主题因素的多维因素的影响,进而在目标推荐度大于或等于预设推荐度阈值的情况下,可以将基于互动因素和主题因素所推荐的多媒体内容推荐至目标用户,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本开实施例提供的一种内容推荐方法的架构图;
图2为本公开实施例提供的一种内容推荐方法的流程示意图;
图3为本公开实施例提供的一种内容推荐方法的流程示意图;
图4为本公开实施例提供的一种内容推荐装置的结构示意图;
图5为本发明实施例提供的一种内容推荐设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前,内容推荐存在诸多问题,影响内容推荐度的因素有很多,并且很多因素不易量化。在相关技术中,一般仅针对多媒体内容的转发数、评论数、点赞数等互动因素进行内容推荐,导致用户可能对所推荐的内容的不感兴趣,降低了内容推荐的准确性。
另外,在很多情况下,推荐热度较高的多媒体内容中可能存在一些对社交媒体舆情研究相关度不高的内容。例如,股票基金、粉丝追星、抽奖活动以及电影宣传等。推荐热度不高的多媒体内容中却存在用户感兴趣的信息,例如,含有国庆、春节、爱国、暴力等敏感信息。
由上述描述可知,现有的内容推荐方法仅基于单一的互动因素进行推荐,导致用户可能对所推荐的内容的不感兴趣,降低了内容推荐的准确性。
为了解决上述问题,本公开实施例提供了一种能够提高内容推荐度计算精度的内容推荐方法、装置、设备及存储介质。
图1示出了本公开实施例提供的一种内容推荐方法的架构图。
如图1所示,该架构图可以包括发布设备101、查看设备102和服务器103。
发布设备101和查看设备102均可以通过网络协议如超文本传输安全协议(HyperText Transfer Protocol over Secure Socket Layer,HTTPS)与服务器103建立连接并进行信息交互。其中,发布设备101和查看设备102可以包括移动电话、平板电脑、台式计算机、笔记本电脑、车载终端、可穿戴设备、一体机、智能家居设备等具有通信功能的设备,也可以包括虚拟机或者模拟器模拟的设备。服务器103可以是云服务器或者服务器集群等具有存储及计算功能的设备。
其中,发布设备101可以获取发布者发布的多媒体内容,并将多媒体内容发送至服务器103,以使服务器103根据多媒体内容进行内容推荐,以向查看设备102推荐内容。查看设备102可以接收服务器103所推荐的内容,并将所推荐的内容展示给目标用户,供目标用户查看推荐的内容。
基于上述架构,当进行内容推荐时,服务器103可以获取发布设备101发送的多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至查看设备102,查看设备102可以将服务器103所推荐的内容展示给目标用户,供目标用户查看推荐的内容。
在其他实施例中,本公开实施例提供的一种内容推荐方法的架构可以包括服务器、数据库和查看设备。
其中,数据库也可以通过网络协议如超文本传输安全协议(Hyper Text TransferProtocol over Secure Socket Layer,HTTPS)与服务器103建立连接并进行信息交互。
可选的,数据库可以包括关系数据库、非关系型数据库等具有大数据存储功能的数据集合。
基于上述架构,当进行内容推荐时,服务器可以从数据库中获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至查看设备,查看设备可以将服务器所推荐的内容展示给目标用户,供目标用户查看推荐的内容。
在本公开实施例中,由于互动热度和内容热度是目标推荐度的不同影响因素,因此,基于互动热度和内容热度可以准确的计算目标推荐度,进一步提高多媒体内容推荐的准确度。
根据上述架构,下面结合图2至图3对本公开实施例提供的内容推荐方法进行说明。在本公开实施例中,该内容推荐方法可以由服务器执行。在本公开实施例中,该服务器可以为图1中所示的服务器103。服务器103可以是云服务器或者服务器集群等具有存储及计算功能的设备。
图2示出了本公开实施例提供的一种内容推荐方法的流程示意图。
S210、获取多媒体内容。
在本公开一些实施例中,服务器可以获取新发布的多媒体内容。
以图1所示的架构为例,当发布者通过发布设备发布新的多媒体内容后,发布设备可以将该多媒体内容发送至服务器,以使服务器获取新发布的多媒体内容并确定是否向目标用户推荐该多媒体内容,如果服务器确定将多媒体内容进行推荐,将该多媒体内容推荐至查看设备,查看设备可以将服务器所推荐的多媒体内容展示给目标用户,供目标用户查看所推荐的多媒体内容。
在本公开另一些实施例中,服务器可以获取数据库中已存储的多媒体内容。
具体地,服务器可以每隔预设时间间隔从数据库中提取已存储的多媒体内容,并确定是否向目标用户推荐该多媒体内容,如果服务器确定将多媒体内容进行推荐,将该多媒体内容推荐至查看设备,查看设备可以将服务器所推荐的多媒体内容展示给目标用户,供目标用户查看所推荐的多媒体内容。
在本公开实施例中,多媒体内容可以包括:视频、音频、图片、文章以及文本等,在此不作限值。
S220、确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度。
在本公开实施例中,服务器获取到多媒体内容之后,可以对多媒体内容进行分析,以确定多媒体内容的推荐度影响参数。
其中,推荐度影响参数可以是能够影响信息推荐度大小的参数,推荐度影响参数可以包括互动热度和内容热度。
具体地,服务器在获取到多媒体内容之后,可以基于多媒体内容所接收到的各种类型的互动的情况确定多媒体内容的互动热度,并且基于多媒体内容所属的目标主题的热度确定多媒体内容的内容热度。
在一些实施例中,互动热度可以用于表征针对多媒体内容的互动程度。
具体地,互动热度可以基于多媒体内容所接收到的各种类型的互动的情况确定。
在另一些实施例中,内容热度可以用于表征多媒体内容所属的目标主题的受关注程度。
具体地,目标主题可以是对多媒体内容进行主题分析确定的主题。内容热度可以基于多媒体内容所属的目标主题的热度确定。
在本公开实施例中,互动热度和内容热度为推荐度的不同影响因素的定量化信息,因此,可以基于互动热度和内容热度来确定多媒体内容的目标推荐度。
S230、基于推荐度影响参数,确定多媒体内容的目标推荐度。
在本公开实施例中,服务器在确定互动热度和内容热度之后,可以根据互动热度和内容热度计算用于判断是否向目标用户推荐该多媒体内容的目标推荐度。
在本公开实施例中,目标推荐度可以用于表征向目标用户推荐该多媒体内容的可能性。
在本公开一些实施例中,基于推荐度影响参数,确定多媒体内容的目标推荐度,可以包括:
对互动热度和内容热度进行加权计算,得到多媒体内容的目标推荐度。
具体地,服务器可以预先设置互动热度对应的互动权重和内容热度对应的内容权重,可以将互动热度与互动权重相乘,得到第一推荐度,将内容热度与内容权重相乘,得到第二推荐度,然后将第一推荐度和第二推荐度相加,得到多媒体内容的目标推荐度。
S240、在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。
在本公开实施例中,预设推荐度阈值可以是预先设置的用于进行内容推荐的推荐度最小值。可选地,预设推荐度阈值可以是0.85、0.9等数值,在此不作限制。
具体的,服务器计算目标推荐度之后,可以将目标推荐度与预设推荐度阈值进行比较,如果目标推荐度大于或等于预设推荐度阈值,确定可以对多媒体内容进行内容推荐,则将多媒体内容推荐至目标用户。
在本公开实施例中,能够在获取到多媒体内容之后,基于该多媒体内容的推荐度影响参数,确定该多媒体内容的目标推荐度,由于用于确定目标推荐度的目标推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,使得目标推荐度可以受到包括互动因素和主题因素的多维因素的影响,进而在目标推荐度大于或等于预设推荐度阈值的情况下,可以将基于互动因素和主题因素所推荐的多媒体内容推荐至目标用户,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
在本公开另一种实施方式中,为了提高推荐度影响参数的计算准确度,可以根据以下方式确定推荐度影响参数。
在本公开实施例中,可以通过多媒体内容的互动参数确定互动热度,并且基于预设的主题模型,确定内容热度。
其中,互动参数可以为表征针对多媒体内容的各种类型的互动的互动程度的参数。可选地,互动参数包括浏览数、转发数、评论数和点赞数中的至少一种。
其中,主题模型可以是以非监督学习的方式对文集的隐含语义结构进行聚类的统计模型。主题模型可以为:隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型、概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)模型,在此不作限值。
可选地,确定多媒体内容的推荐度影响参数可以包括:
根据多媒体内容的互动参数,确定互动热度;
确定多媒体内容对应的目标主题权重、多媒体内容对应的目标主题词权重和多媒体内容对应的目标次数,目标主题权重为目标主题在多媒体内容中的权重,目标主题词权重为目标主题所涉及的目标主题词在多媒体内容中的权重,目标次数为目标主题词在多媒体内容中出现的次数;
根据目标主题权重、目标主题词权重和目标次数,计算内容热度。
在一些实施例中,在互动参数包括转发数、评论数和点赞数的情况下,根据多媒体内容的互动参数,确定互动热度,可以包括:
对转发数、评论数和点赞数进行加权计算,得到互动热度。
具体地,服务器可以预先设置评论数对应的评论权重、点赞数对应的点赞权重以及转发数对应的转发权重,服务器可以将评论数与评论权重相乘,得到第一热度值,将点赞数与点赞权重相乘,得到第二热度值,将转发数与转发权重相乘,得到第三热度值,然后将第一热度值、第二热度值和第三热度值相加,得到多媒体内容的互动热度。
具体地,可以通过如下公式确定多媒体内容的互动热度:
Hint=wcom*Qcom+wlike*Qlike+wfor*Qfor
其中,Hint为互动热度,Qcom为评论数,wcom为评论权重,Qlike为点赞数,wlike为点赞权重,Qfor为转发数,wfor为转发权重。
在另一些实施例中,可以通过LDA模型确定多媒体内容对应的目标主题权重、多媒体内容对应的目标主题词权重和多媒体内容对应的目标次数。
具体地,确定多媒体内容对应的目标主题权重、多媒体内容对应的目标主题词权重和多媒体内容对应的目标次数,可以包括:
将多媒体内容对应的文本信息输入至预先训练的主题模型,得到文本信息的主题分析结果,主题分析结果包括文档主题矩阵、主题词语矩阵和文档词语矩阵;
根据文档主题矩阵,确定目标主题权重,目标主题权重为目标主题在文本信息中的权重;
根据主题词语矩阵,确定目标主题词权重,目标主题词权重为目标主题词在文本信息中的权重;
根据文档词语矩阵,确定目标次数,目标次数为目标主题词在文本信息中出现的次数。
具体的,服务器获取多媒体内容后,可以将多媒体内容对应的文本信息直接输入至主题模型,或者,将多媒体内容转化为文本,并将文本对应的文本信息输入至主题模型,根据预先设置的主题数和主题词数,得到文档主题矩阵、主题词语矩阵和文档词语矩阵,根据文档主题矩阵,确定目标主题权重,并根据主题词语矩阵,确定目标主题词权重,以及根据文档词语矩阵,确定目标次数。
在一些实施例中,在多媒体内容为视频的情况下,服务器可以提取视频中的各个图像帧,并分别识别每个图像帧中的文本内容,将识别到的全部文本内容作为多媒体内容对应的文本信息。
在另一些实施例中,在多媒体内容为音频的情况下,服务器将音频转化为文本内容,得到多媒体内容对应的文本信息。
在又一些实施例中,在多媒体内容为文本的情况下,服务器可以识别该文本的文本内容,得到多媒体内容对应的文本信息。
在本公开实施例中,可以根据文档主题矩阵中每个主题出现的概率确定文本信息的目标主题和目标主题权重,并根据主题词语矩阵中每个主题词出现的概率确定目标主题词权重,以及根据文档词语矩阵出中每个主题词出现的概率和主题词总数确定目标次数。
其中,文档主题矩阵可以包括每个文本信息中每个主题的概率;主题词语矩阵可以包括每个主题中每个主题词出现的概率;文档词语矩阵可以包括每个文本信息中每个主题词出现的概率。
在本实施例中,可选地,根据文档主题矩阵,确定目标主题权重,可以包括:
将文档主题矩阵中每个文本信息中最大概率对应的主题作为每个文本信息的目标主题,并将文档主题矩阵中每个目标主题在每个文本信息中的概率相加,得到目标主题权重。
具体的,服务器确定文档主题矩阵后,提取文档主题矩阵中每列最大概率对应的主题作为每个文本的最大主题,即提取每个文本信息中最大概率对应的主题作为每个文本信息的目标主题,并且,将文档主题矩阵中每行目标主题的概率相加,即将文档主题矩阵中每个目标主题在每个文本信息中的概率相加,得到目标主题权重。
在本实施例中,可选地,根据主题词语矩阵,确定目标主题词权重,可以包括:
将主题词语矩阵中每个目标主题词对应的概率作为目标主题词权重。
具体的,服务器确定主题词语矩阵后,提取属于目标主题的每个目标主题词对应的概率,将目标主题词对应的概率作为目标主题词权重。
在本实施例中,可选地,根据文档词语矩阵,确定目标次数,可以包括:
提取文档词语矩阵中的目标主题词;
将文档词语矩阵中文本信息的主题词总数和目标主题词出现的概率相乘,得到目标主题词的目标次数。
具体的,服务器确定文档词语矩阵后,提取文档词语矩阵中的目标主题词,确定文档词语矩阵中文本信息的总词数,以及目标主题词出现的概率,将目标主题词出现的概率与文本信息的总词数相乘,得到目标主题词的目标次数。
在本公开一些实施例中,根据目标主题权重、目标主题词权重和目标次数,计算所容热度,可以包括:
将目标主题权重、目标主题词权重和目标次数相乘,得到内容热度。
具体的,服务器确定目标主题权重、目标主题词权重和目标次数之后,将每个目标主题的所有目标主题词对应的目标主题词权重和目标次数相乘,得到所有目标主题的目标主题词权重和目标次数的乘积,将乘积与目标主题权重再次相乘,得到内容热度。
具体地,可以通过如下公式确定多媒体内容的内容热度:
Figure BDA0003178367180000121
其中,Hcon为内容热度,wtopic为目标主题权重,wi为目标主题词权重,ni为目标次数,i为目标敏感词的当前词语数,m为目标主题词的总数。
由此,在本公开实施例中,根据浏览数、转发数、评论数和点赞数中的至少一种,可以准确的计算互动热度,并且,通过主题模型可以确定文档主题矩阵、主题词语矩阵以及文档词语矩阵,以根据上述矩阵准确的确定多媒体内容对应的目标主题权重、多媒体内容对应的目标主题词权重和多媒体内容对应的目标次数,进一步根据目标主题权重、目标主题词权重和目标次数,准确的计算内容热度。
在本公开另一种实施方式中,为了进一步提高内容推荐的准确性,还可以结合内容敏感度计算目标推荐度。
在本公开一些实施例中,推荐度影响参数还包括内容敏感度。
其中,内容敏感度可以用于表征多媒体内容的敏感程度。
相应的,S220还可以包括:
确定多媒体内容所涉及的目标敏感词;
根据目标敏感词,确定内容敏感度。
相应的,S230可以包括:
根据内容敏感度、互动热度和内容热度,确定目标推荐度。
其中,目标敏感词可以为预设敏感词。预设敏感词可以是目标用户在目标主题下重点关注的词语。
在本公开实施例中,为了计算多媒体内容的内容敏感度,可以预先对预先确定的敏感词进行等级划分,将每个预先确定的敏感词对应的等级作为预设敏感词的敏感度。
可选的,内容敏感度可以基于多媒体内容中目标敏感词的敏感度确定。目标敏感词的敏感度可以表征目标敏感词的敏感程度。
以目标主题为春节主题为例,目标敏感词语可以包括:春运、团圆饭、春节联欢晚会等敏感词。
在本公开实施例中,可以通过对多媒体内容对应的文本信息进行分词,得到多个文本词语,并根据预先存储的敏感词匹配或者预设敏感词,确定多媒体内容所涉及的目标敏感词。
其中,文本词语可以为文本信息中的词语。预先存储的敏感词可以为预先存储在数据库中的敏感词或者为预先存储在服务器中的敏感词。预设敏感词可以为目标用户在目标主题下重点关注的词语。
在一些实施例中,确定多媒体内容所涉及的目标敏感词,可以包括:
对多媒体内容对应的文本信息进行分词,得到多个文本词语;
将文本词语与预先存储的敏感词匹配,将匹配度大于或者等于预设匹配度阈值的文本词语作为目标敏感词。
其中,匹配度阈值可以为预先设置的用于筛选目标敏感词的最小匹配值,匹配度阈值可以为0.9、0.95等数值,在此不作限定。
具体的,服务器获取到多媒体内容对应的文本信息后,可以基于最大匹配分词算法、生成式模型分词算法等分词算法,对文本信息进行分词,得到多个文本词语,并将文本词语与预先存储的敏感词语匹配,将匹配度大于或者等于预设匹配度阈值的文本词语作为目标敏感词。
在一些实施例中,根据目标敏感词,确定内容敏感度,可以包括:
将目标敏感词对应的敏感权重值和目标敏感词在文本信息出现的次数相乘,得到目标敏感词对应的内容敏感度。
具体的,服务器确定目标敏感词后,可以从预先存储的信息中确定目标敏感词对应的敏感权重值,将每个目标敏感词对应的敏感权重值和目标敏感词在文本信息出现的次数相乘,得到每个目标敏感词对应的内容敏感度,将所有目标敏感词对应的内容敏感度相加,得到多媒体内容的内容敏感度。
具体地,可以通过如下公式确定多媒体内容的内容敏感度:
Figure BDA0003178367180000141
其中,Scon为内容敏感度,wi为敏感权重值,ni为目标敏感词在文本信息出现的次数,i为目标敏感词的当前词语数,和m为目标敏感词的总数。
由此,在本公开实施例中,根据目标敏感词对应的敏感权重值和目标敏感词在文本信息出现的次数相乘,可以准确的计算目标敏感词对应的内容敏感度,由此,基于内容敏感度、互动热度和内容热度,可以提高目标推荐度的计算准确度,进一步提高多媒体内容推荐的准确度。
在另一些实施例中,确定多媒体内容所涉及的目标敏感词,可以包括:
对多媒体内容对应的文本信息进行分词,得到多个文本词语;
针对每个文本词语,在多个预设敏感词中选择文本词语的相似敏感词;
将各个相似敏感词分别作为目标敏感词。
其中,相似敏感词可以是与预设敏感词相似的文本词语。
在本公开实施例中,文本词语可以是利用词向量生成模型对多媒体内容对应的文本信息进行分词得到的。可选地,词向量生成模型可以是word2vec模型。
在本公开实施例中,针对每个文本词语,在多个预设敏感词中选择文本词语的相似敏感词的方法可以包括:将每个文本词语与预设敏感词匹配,确定每个文本词语与预设敏感词的相似度,并将相似度超过预设相似度阈值的预设敏感词作为文本词语的相似敏感词,或者,将最大相似度对应的预设敏感词作为文本词语的相似敏感词,将各个相似敏感词分别作为目标敏感词。
其中,预设相似度阈值可以是预先设置的用于选择相似敏感词的最小相似度。可选的,相似度可以是余弦相似度。
可选地,预设相似度阈值可以是0.9,0.95,在此不作限值。
具体的,服务器获取多媒体内容对应的文本信息后,可以利用词向量生成模型对多媒体内容对应的文本信息进行分词,得到多个文本词语,并将每个文本词语与预设敏感词匹配,选择文本词语的相似敏感词,并将各个相似敏感词分别作为目标敏感词。
在另一些实施例中,根据目标敏感词,确定内容敏感度,可以包括:
根据各个目标敏感词对应的文本词语在文本信息中的词语权重、各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度和文本信息的词语总数,确定内容敏感度。
其中,词语权重可以用于表征目标敏感词对应的文本词语在文本信息中重要程度或者关键度。
在本公开实施例中,词语权重可以是利用自然语言处理方法对文本信息进行处理得到的。可选地,自然语言处理方法可以是利用词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)算法。
其中,词语相似度可以用于表征目标敏感词与对应的文本词语的相似程度。
其中,敏感程度可以用于表征目标敏感词的敏感等级。敏感等级可以是对敏感词预先划分的等级。
可选的,敏感等级可以包括五个等级。
其中,词语总数可以为文本信息中词语的总数。
在本公开实施例中,可选的,根据各个目标敏感词对应的文本词语在文本信息中的词语权重、各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度和文本信息的词语总数,确定内容敏感度,可以包括:
将各个目标敏感词对应的词语权重、各个目标敏感词对应的词语相似度和各个目标敏感词的敏感程度相乘;
将乘积与文本信息的词语总数相除,得到内容敏感。
具体的,服务器确定目标敏感词对应的词语权重、各个目标敏感词对应的词语相似度和各个目标敏感词的敏感程度之后,可以将目标敏感词对应的词语权重、各个目标敏感词对应的词语相似度和各个目标敏感词的敏感程度相乘,得到所有目标敏感词对应的词语权重、所有目标敏感词对应的词语相似度和所有目标敏感词的敏感程度的乘积,将乘积与文本信息的词语总数相除,得到内容敏感。
具体地,可以通过如下公式确定多媒体内容的内容敏感度:
Figure BDA0003178367180000161
其中,Scon为内容敏感度,si为词语相似度,li为敏感等级,ki为词语权重,N为词语总数,i为当前词语数。
在又一些实施例中,根据目标敏感词,确定内容敏感度,可以包括:
将各个目标敏感词与对应的文本词语之间的词语相似度和文本信息的词语总数相除,得到内容敏感度。
具体的,服务器确定各个目标敏感词与对应的文本词语之间的词语相似度和文本信息的词语总数之后,可以将所有目标敏感词与对应的文本词语之间的词语相似度和文本信息的词语总数相除,得到内容敏感。
具体地,可以通过如下公式确定多媒体内容的内容敏感度:
Figure BDA0003178367180000162
在再一些实施例中,根据目标敏感词,确定内容敏感度,可以包括:
将各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度相乘,得到所有目标敏感词与对应的文本词语之间的词语相似度的乘积;
将乘积与文本信息的词语总数相除,得到内容敏感度。
具体的,服务器确定各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度之后,将各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度相乘,得到所有目标敏感词与对应的文本词语之间的词语相似度的乘积,再将乘积与文本信息的词语总数相除,得到内容敏感度。
具体地,可以通过如下公式确定多媒体内容的内容敏感度:
Figure BDA0003178367180000171
在又一些实施例中,根据目标敏感词,确定内容敏感度,可以包括:
将各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感等级相乘,得到所有目标敏感词与对应的文本词语之间的词语相似度和所有目标敏感词的敏感等级的乘积;
将乘积与文本信息的词语总数相除,得到内容敏感度。
具体的,服务器确定各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感等级之后,将各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感等级相乘,得到所有目标敏感词与对应的文本词语之间的词语相似度和所有目标敏感词的敏感等级的乘积,再将乘积与文本信息的词语总数相除,得到内容敏感度。
具体地,可以通过如下公式确定多媒体内容的内容敏感度:
Figure BDA0003178367180000172
由此,在本公开实施例中,根据各个目标敏感词对应的文本词语在文本信息中的词语权重、各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度和文本信息的词语总数,可以灵活且准确的计算内容敏感度,并且,由于敏感词对应的等级能够减少文档敏感度计算的误差,有利于文档的敏感度区分,词语权重可以用于确定目标敏感词在文本信息中的重要程度或敏感度,以用于区分不同的文本信息,词语相似度用于确定词语的相似程度,可以进一步提高内容敏感度的计算准确度,并基于内容敏感度、互动热度和内容热度,可以提高目标推荐度的计算准确度,以提高内容推荐的准确度,进一步满足用户快速发现感兴趣的信息的需求。
在本公开另一种实施方式中,为了进一步提高内容推荐的准确性,还可以结合发布敏感度计算目标推荐度。
在本公开一些实施例中,推荐度影响参数还包括发布敏感度。
其中,发布敏感度可以用于表征多媒体内容的发布者的敏感程度。
相应的,S220还可以包括:
获取发布者的敏感参数,敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度中的至少一种;
根据发布者敏感参数,确定发布者敏感度。
相应的,S230可以包括:
根据发布者敏感度、互动热度和内容热度,确定目标推荐度。
其中,发布者的敏感程度可以用于表征发布者的受关注程度。
在一些实施例中,服务器可以从敏感用户库中直接获取发布者的敏感参数,具体可以获取发文数、粉丝数、敏感用户权重和历史内容敏感度中的至少一种,并根据发布者敏感参数,确定发布者敏感度。
在另一些实施例中,服务器根据发布者之间的相互关系,计算敏感用户权重,并从敏感用户库中直接获取发文数、粉丝数和历史内容敏感度中的至少一种。
其中,相互关系可以包括不同发布者之间的关注关系或被关注关系。
在本公开实施例中,可以根据网页排序算法(PageRank,PR)根据发布者之间的相互关系,计算各个发布者的重要性得分值(PR值),根据重要性得分值确定敏感用户权重。
具体地,重要性得分值的计算公式可以为:
Figure BDA0003178367180000191
其中,
Figure BDA0003178367180000192
是pi发布者所有的粉丝用户集合,L(pj)是发布者pj的关注的用户数,N是发布者总数,q是阻尼系数,q可以为预先设置的任意值,例如为0.85,PR(pj)为发布者pj的重要性得分值。
通过上述方式,可以计算发布者pi的重要性得分值,并对所有发布者的重要性得分值进行迭代,当每个发布者的重要性得分值达到稳定,将每个发布者的重要性得分值作为该发布者的敏感用户权重。
在本公开实施例中,敏感参数可以包括发文数、粉丝数、敏感用户权重和历史内容敏感度。
在一些实施例中,在敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度的情况下,根据用户敏感参数,确定发布者敏感度,可以包括:
计算粉丝数、敏感用户权重和历史内容敏感度的乘积;
将乘积与发文数的比值作为发布者敏感度。
具体地,服务器确定粉丝数、敏感用户权重和历史内容敏感度之后,可以计算粉丝数、敏感用户权重和历史内容敏感度的乘积,并将乘积与发文数相除,将得到的比值作为发布者敏感度。
具体地,可以通过如下公式确定发布者敏感度:
Figure BDA0003178367180000193
其中,Suser为发布者敏感度,Nfol为粉丝数,wuser为敏感用户权重,Scon为历史内容敏感度,N为发文数,i为当前值。
在另一些实施例中,在敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度的情况下,根据用户敏感参数,确定发布者敏感度,可以包括:
计算粉丝数和敏感用户权重的乘积;
将乘积与发文数相除,得到第一敏感度;
将历史内容敏感度与历史发文数相除,得到第二敏感度;
将第一敏感度与第二敏感度相加,得到发布者敏感度。
具体地,服务器确定粉丝数、敏感用户权重和历史内容敏感度之后,可以计算粉丝数和敏感用户权重的乘积,将乘积与发文数相除,得到第一敏感度,并将历史内容敏感度与历史发文数相除,得到第二敏感度,将第一敏感度与第二敏感度相加,得到发布者敏感度。
具体地,可以通过如下公式确定发布者敏感度:
Figure BDA0003178367180000201
其中,m为历史内容敏感度对应的文本信息的历史发文数。
由此,在本公开实施例中,根据发文数、粉丝数、敏感用户权重和历史内容敏感度,可以准确的计算发布者敏感度,并基于发布者敏感度、互动热度和内容热度,可以提高目标推荐度的计算准确度,进一步提高内容推荐的准确度。
在本公开再一种实施方式中,为了进一步提高内容推荐的准确性,还可以结合发布敏感度和内容敏感度计算目标推荐度。
在本公开一些实施例中,推荐度影响参数还包括内容敏感度和发布者敏感度。
其中,内容敏感度可以用于表征多媒体内容的敏感程度,发布者敏感度可以用于表征多媒体内容的发布者的敏感程度。
其中,S230可以包括:
根据互动热度和内容热度,计算多媒体内容的综合热度;
根据内容敏感度和发布者敏感度,计算多媒体内容的综合敏感度;
根据综合热度和综合敏感度,计算目标推荐度。
在一些实施例中,根据互动热度和内容热度,计算多媒体内容的综合热度,可以包括:
对互动热度和内容热度进行加权计算,得到多媒体内容的综合热度。
具体地,服务器可以预先设置互动热度对应的互动权重以及内容热度对应的内容权重,将互动热度与互动权重相乘,得到第一推荐度,将内容热度与内容权重相乘,得到第二推荐度,然后将第一推荐度和第二推荐度相加,得到多媒体内容的综合热度。
具体地,可以通过如下公式计算多媒体内容的综合热度:
Hsyn=Hint*wint+Hcon*wcon
其中,Hsyn为综合热度,Hint为互动热度,wint为互动热度对应的权重,Hcon为内容热度,wcon为内容热度对应的权重。
在一些实施例中,根据内容敏感度和发布者敏感度,计算多媒体内容的综合敏感度,可以包括:
对内容敏感度和发布者敏感度进行加权计算,得到多媒体内容的综合敏感度。
具体地,服务器可以预先设置内容敏感度对应的内容敏感度权重以及发布者敏感度对应的发布者敏感度权重,将内容敏感度与内容敏感度权重相乘,得到第三推荐度,将发布者敏感度与发布者敏感度权重相乘,得到第四推荐度,然后将第三推荐度和第四推荐度相加,得到多媒体内容的综合敏感度。
具体地,可以通过如下公式计算多媒体内容的综合敏感度:
Ssyn=Scon*wcon+Suser*wuser
其中,Ssyn为综合敏感度,Scon为内容敏感度,wcon为内容敏感度权重,Suser为发布者敏感度,wuser为发布者敏感度权重。
在一些实施例中,根据综合热度和综合敏感度,计算目标推荐度,可以包括:
对综合热度和综合敏感度进行加权计算,得到目标推荐度。
具体地,服务器可以预先设置综合敏感度对应的综合敏感度权重以及综合热度对应的综合热度权重,将综合敏感度与综合敏感度权重相乘,得到第五推荐度,将综合热度与综合热度权重相乘,得到第六推荐度,将第五推荐度与第六推荐度相加,得到目标推荐度。
具体地,可以通过如下公式计算多媒体内容的目标推荐度:
Rsyn=Ssyn*wsen+Hsyn*whot
其中,Rsyn为目标推荐度,wsen为综合敏感度权重,whot为综合热度权重。
下面,结合图3解释服务器确定目标推荐度的过程。如图3所示,目标推荐度的计算方法的流程具体可以包括如下步骤。
S310、获取互动参数。
其中,互动参数可以包括浏览数、转发数、评论数和点赞数中的至少一种。
S320、根据互动参数,确定多媒体内容的互动热度。
在本公开实施例中,服务器可以对转发数、评论数、点赞数,以及转发权重、评论权重和点赞权重分别对应的权重进行加权计算,得到互动热度。
S330、将多媒体内容对应的文本信息输入至主题模型,得到多媒体内容的内容热度。
在本公开实施例中,服务器可以将多媒体内容对应的文本信息输入至主题模型,得到文档主题矩阵、主题词语矩阵和文档词语矩阵,根据文档主题矩阵,确定目标主题权重,并根据主题词语矩阵,确定目标主题词权重,以及根据文档词语矩阵,确定目标次数,并根据目标主题权重、目标主题词权重和目标次数,计算内容热度。
S340、确定多媒体内容所涉及的目标敏感词。
在本公开实施例中,服务器获取到多媒体内容对应的文本信息后,可以对文本信息进行分词,得到多个文本词语,并将文本词语与预先存储的敏感词语匹配,将匹配度大于或者等于预设匹配度阈值的文本词语作为目标敏感词,或者,针对每个文本词语,在多个预设敏感词中选择文本词语的相似敏感词,将各个相似敏感词分别作为目标敏感词。
S350、根据目标敏感词,确定内容敏感度。
在本公开实施例中,可以根据各个目标敏感词对应的文本词语在文本信息中的词语权重、各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度和文本信息的词语总数,确定内容敏感度。
S360、获取发布者的敏感参数。
在本公开实施例中,服务器可以从敏感用户库中直接获取发文数、粉丝数、敏感用户权重和历史内容敏感度中的至少一种,或者,服务器根据发布者之间的关注关系或被关注关系,计算敏感用户权重,并从敏感用户库中直接获取发文数、粉丝数和历史内容敏感度中的至少一种。
S370、根据发布者敏感参数,确定发布者敏感度。
在本公开实施例中,服务器可以计算粉丝数、敏感用户权重和历史内容敏感度的乘积,将乘积与发文数的比值作为发布者敏感度。
S380、根据互动热度和内容热度,计算多媒体内容的综合热度。
在本公开实施例中,服务器可以对互动热度和内容热度进行加权计算,得到多媒体内容的综合热度。
S390、根据内容敏感度和发布者敏感度,计算多媒体内容的综合敏感度。
在本公开实施例中,服务器对内容敏感度和发布者敏感度进行加权计算,得到多媒体内容的综合敏感度。
S400、根据综合热度和综合敏感度,计算目标推荐度。
在本公开实施例中,服务器对综合热度和综合敏感度进行加权计算,得到目标推荐度。
由此,在本公开实施例中,可以根据互动热度、内容热度、发布敏感度和内容敏感度计算目标推荐度,使得计算得到的目标推荐度更准确,进一步提高内容推荐的准确度。
本公开实施例还提供了一种用于实现上述的内容推荐方法的内容推荐装置,下面结合图4进行说明。在本公开实施例中,该内容推荐装置可以为服务器。其中,服务器可以包括可以是云服务器或者服务器集群等具有存储及计算功能的设备。
图4示出了本公开实施例提供的一种内容推荐装置的结构示意图。
如图4所示,内容推荐装置可以包括:多媒体内容获取模块401、推荐度影响数据确定模块402、目标推荐度确定模块403以及内容推荐模块404。
其中,多媒体内容获取模块401,用于获取多媒体内容;
推荐度影响数据确定模块402,用于确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度;
目标推荐度确定模块403,用于基于推荐度影响参数,确定多媒体内容的目标推荐度;
内容推荐模块404,用于在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。
在本公开实施例中,能够在获取到多媒体内容之后,基于该多媒体内容的推荐度影响参数,确定该多媒体内容的目标推荐度,由于用于确定目标推荐度的目标推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,使得目标推荐度可以受到包括互动因素和主题因素的多维因素的影响,进而在目标推荐度大于或等于预设推荐度阈值的情况下,可以将基于互动因素和主题因素所推荐的多媒体内容推荐至目标用户,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
在本公开一些实施例中,推荐度影响数据确定模块402具体用于,根据多媒体内容的互动参数,确定互动热度;
确定多媒体内容对应的目标主题权重、多媒体内容对应的目标主题词权重和多媒体内容对应的目标次数,目标主题权重为目标主题在多媒体内容中的权重,目标主题词权重为目标主题所涉及的目标主题词在多媒体内容中的权重,目标次数为目标主题词在多媒体内容中出现的次数;
根据目标主题权重、目标主题词权重和目标次数,计算内容热度。
在本公开一些实施例中,推荐度影响数据确定模块402具体用于,将多媒体内容对应的文本信息输入至预先训练的主题模型,得到文本信息的主题分析结果,主题分析结果包括文档主题矩阵、主题词语矩阵和文档词语矩阵;
根据文档主题矩阵,确定目标主题权重,目标主题权重为目标主题在文本信息中的权重;
根据主题词语矩阵,确定目标主题词权重,目标主题词权重为目标主题词在文本信息中的权重;
根据文档词语矩阵,确定目标次数,目标次数为目标主题词在文本信息中出现的次数。
在本公开一些实施例中,推荐度影响数据确定模块402具体用于,将目标主题权重、目标主题词权重和目标次数相乘,得到内容热度。
在本公开一些实施例中,互动参数包括浏览数、转发数、评论数和点赞数中的至少一种。
在本公开一些实施例中,推荐度影响参数还包括内容敏感度,内容敏感度用于表征多媒体内容的敏感程度。
在本公开一些实施例中,推荐度影响数据确定模块402还用于,确定多媒体内容所涉及的目标敏感词;
根据目标敏感词,确定内容敏感度。
在本公开一些实施例中,推荐度影响数据确定模块402具体用于,对多媒体内容对应的文本信息进行分词,得到多个文本词语;
针对每个文本词语,在多个预设敏感词中选择文本词语的相似敏感词;
将各个相似敏感词分别作为目标敏感词。
在本公开一些实施例中,推荐度影响数据确定模块402具体用于,根据各个目标敏感词对应的文本词语在文本信息中的词语权重、各个目标敏感词与对应的文本词语之间的词语相似度、各个目标敏感词的敏感程度和文本信息的词语总数,确定内容敏感度。
在本公开一些实施例中,推荐度影响参数还包括发布者敏感度,发布者敏感度用于表征多媒体内容的发布者的敏感程度。
在本公开一些实施例中,推荐度影响数据确定模块402还用于,获取发布者的敏感参数,敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度中的至少一种;
根据发布者敏感参数,确定发布者敏感度。
在本公开一些实施例中,敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度;相应的,推荐度影响数据确定模块402具体用于,计算粉丝数、敏感用户权重和历史内容敏感度的乘积;
将乘积与发文数的比值作为发布者敏感度。
在本公开一些实施例中,推荐度影响参数还包括内容敏感度和发布者敏感度,内容敏感度用于表征多媒体内容的敏感程度,发布者敏感度用于表征多媒体内容的发布者的敏感程度;相应的,目标推荐度确定模块403具体用于,根据互动热度和内容热度,计算多媒体内容的综合热度;
根据内容敏感度和发布者敏感度,计算多媒体内容的综合敏感度;
根据综合热度和综合敏感度,计算目标推荐度。
需要说明的是,图4所示的内容推荐装置可以执行图2至图3所示的方法实施例中的各个步骤,并且实现图2至图3所示的方法实施例中的各个过程和效果,在此不做赘述。
本公开实施例还提供了一种内容推荐设备,该内容推荐设备可以包括处理器和存储器,存储器可以用于存储可执行指令。其中,处理器可以用于从存储器中读取可执行指令,并执行可执行指令以实现上述实施例中的内容推荐方法。
图5示出了本公开实施例提供的一种内容推荐设备的结构示意图。下面具体参考图5,其示出了适于用来实现本公开实施例中的内容推荐设备500的结构示意图。
本公开实施例中的内容推荐设备500可以为图1中的服务器。其中,服务器可以是云服务器或者服务器集群等具有存储及计算功能的设备。
需要说明的是,图5示出的内容推荐设备500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,该内容推荐设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有内容推荐设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许内容推荐设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的内容推荐设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
本公开实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现上述实施例中的内容推荐方法。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的内容推荐方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述内容推荐设备中所包含的;也可以是单独存在,而未装配入该内容推荐设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该内容推荐设备执行时,使得该内容推荐设备执行:
获取多媒体内容;
确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度;
基于推荐度影响参数,确定多媒体内容的目标推荐度;
在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。
在本公开实施例中,可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (16)

1.一种内容推荐方法,其特征在于,包括:
获取多媒体内容;
确定所述多媒体内容的推荐度影响参数,所述推荐度影响参数包括互动热度和内容热度,所述互动热度用于表征针对所述多媒体内容的互动程度,所述内容热度用于表征所述多媒体内容所属的目标主题的受关注程度;
基于所述推荐度影响参数,确定所述多媒体内容的目标推荐度;
在所述目标推荐度大于或等于预设推荐度阈值的情况下,将所述多媒体内容推荐至目标用户。
2.根据权利要求1所述的方法,其特征在于,所述确定所述多媒体内容的推荐度影响参数,包括:
根据所述多媒体内容的互动参数,确定所述互动热度;
确定所述多媒体内容对应的目标主题权重、所述多媒体内容对应的目标主题词权重和所述多媒体内容对应的目标次数,所述目标主题权重为所述目标主题在所述多媒体内容中的权重,所述目标主题词权重为所述目标主题所涉及的目标主题词在所述多媒体内容中的权重,所述目标次数为所述目标主题词在所述多媒体内容中出现的次数;
根据所述目标主题权重、所述目标主题词权重和所述目标次数,计算所述内容热度。
3.根据权利要求2所述的方法,其特征在于,所述确定所述多媒体内容对应的目标主题权重、所述多媒体内容对应的目标主题词权重和所述多媒体内容对应的目标次数,包括:
将所述多媒体内容对应的文本信息输入至预先训练的主题模型,得到所述文本信息的主题分析结果,所述主题分析结果包括文档主题矩阵、主题词语矩阵和文档词语矩阵;
根据所述文档主题矩阵,确定所述目标主题权重,所述目标主题权重为所述目标主题在所述文本信息中的权重;
根据所述主题词语矩阵,确定所述目标主题词权重,所述目标主题词权重为所述目标主题词在所述文本信息中的权重;
根据所述文档词语矩阵,确定所述目标次数,所述目标次数为所述目标主题词在所述文本信息中出现的次数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标主题权重、所述目标主题词权重和所述目标次数,计算所述内容热度,包括:
将所述目标主题权重、所述目标主题词权重和所述目标次数相乘,得到所述内容热度。
5.根据权利要求2所述的方法,其特征在于,所述互动参数包括浏览数、转发数、评论数和点赞数中的至少一种。
6.根据权利要求1所述的方法,其特征在于,所述推荐度影响参数还包括内容敏感度,所述内容敏感度用于表征所述多媒体内容的敏感程度。
7.根据权利要求6所述的方法,其特征在于,所述确定所述多媒体内容的推荐度影响参数,还包括:
确定所述多媒体内容所涉及的目标敏感词;
根据所述目标敏感词,确定所述内容敏感度。
8.根据权利要求7所述的方法,其特征在于,所述确定所述多媒体内容所涉及的目标敏感词,包括:
对所述多媒体内容对应的文本信息进行分词,得到多个文本词语;
针对每个所述文本词语,在多个预设敏感词中选择所述文本词语的相似敏感词;
将各个所述相似敏感词分别作为所述目标敏感词。
9.根据权利要求8所述的方法,其特征在于,所述根据所述目标敏感词,确定所述内容敏感度,包括:
根据各个所述目标敏感词对应的文本词语在所述文本信息中的词语权重、各个所述目标敏感词与对应的文本词语之间的词语相似度、各个所述目标敏感词的敏感程度和所述文本信息的词语总数,确定所述内容敏感度。
10.根据权利要求1或6所述的方法,其特征在于,所述推荐度影响参数还包括发布者敏感度,所述发布者敏感度用于表征所述多媒体内容的发布者的敏感程度。
11.根据权利要求10所述的方法,其特征在于,所述确定所述多媒体内容的推荐度影响参数,还包括:
获取所述发布者的敏感参数,所述敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度中的至少一种;
根据所述发布者敏感参数,确定所述发布者敏感度。
12.根据权利要求11所述的方法,其特征在于,所述敏感参数包括发文数、粉丝数、敏感用户权重和历史内容敏感度;
其中,所述根据所述用户敏感参数,确定所述发布者敏感度,包括:
计算所述粉丝数、所述敏感用户权重和所述历史内容敏感度的乘积;
将所述乘积与所述发文数的比值作为所述发布者敏感度。
13.根据权利要求1所述的方法,其特征在于,所述推荐度影响参数还包括内容敏感度和发布者敏感度,所述内容敏感度用于表征所述多媒体内容的敏感程度,所述发布者敏感度用于表征所述多媒体内容的发布者的敏感程度;
其中,所述基于所述推荐度影响参数,确定所述多媒体内容的目标推荐度,包括:
根据所述互动热度和所述内容热度,计算所述多媒体内容的综合热度;
根据所述内容敏感度和所述发布者敏感度,计算所述多媒体内容的综合敏感度;
根据所述综合热度和所述综合敏感度,计算所述目标推荐度。
14.一种内容推荐装置,其特征在于,包括:
多媒体内容获取模块,用于获取多媒体内容;
推荐度影响数据确定模块,用于确定所述多媒体内容的推荐度影响参数,所述推荐度影响参数包括互动热度和内容热度,所述互动热度用于表征针对所述多媒体内容的互动程度,所述内容热度用于表征所述多媒体内容所属的目标主题的受关注程度;
目标推荐度确定模块,用于基于所述推荐度影响参数,确定所述多媒体内容的目标推荐度;
内容推荐模块,用于在所述目标推荐度大于或等于预设推荐度阈值的情况下,将所述多媒体内容推荐至目标用户。
15.一种内容推荐设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至13中任一项所述的内容推荐方法。
16.一种存储介质,当所述存储介质中的指令由计算设备的处理器执行时,使得所述计算设备能够执行如权利要求1至13中任一项所述的内容推荐方法。
CN202110839324.4A 2021-07-23 2021-07-23 一种内容推荐方法、装置、设备及存储介质 Active CN113688310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110839324.4A CN113688310B (zh) 2021-07-23 2021-07-23 一种内容推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110839324.4A CN113688310B (zh) 2021-07-23 2021-07-23 一种内容推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113688310A true CN113688310A (zh) 2021-11-23
CN113688310B CN113688310B (zh) 2023-08-29

Family

ID=78577824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110839324.4A Active CN113688310B (zh) 2021-07-23 2021-07-23 一种内容推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113688310B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003826A (zh) * 2021-12-31 2022-02-01 思创数码科技股份有限公司 资源目录推荐方法、装置、可读存储介质及电子设备
CN114297489A (zh) * 2021-12-28 2022-04-08 北京百度网讯科技有限公司 一种内容推荐方法、装置、电子设备及存储介质
CN114302242A (zh) * 2022-01-25 2022-04-08 聚好看科技股份有限公司 一种媒资推荐方法、显示设备及服务器
CN114417174A (zh) * 2022-03-23 2022-04-29 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191742A1 (en) * 2009-01-27 2010-07-29 Palo Alto Research Center Incorporated System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
US20140164476A1 (en) * 2012-12-06 2014-06-12 At&T Intellectual Property I, Lp Apparatus and method for providing a virtual assistant
KR20170037709A (ko) * 2015-09-25 2017-04-05 충북대학교 산학협력단 사용자 영향력 및 시간 변화를 고려한 소셜 네트워크 핫 토픽 결정 방법 및 시스템
CN107894994A (zh) * 2017-10-18 2018-04-10 北京京东尚科信息技术有限公司 一种检测热点话题类别的方法和装置
CN109275031A (zh) * 2018-09-25 2019-01-25 有米科技股份有限公司 一种视频的热度评估方法、装置及电子设备
CN112749341A (zh) * 2021-01-22 2021-05-04 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191742A1 (en) * 2009-01-27 2010-07-29 Palo Alto Research Center Incorporated System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes
US20140164476A1 (en) * 2012-12-06 2014-06-12 At&T Intellectual Property I, Lp Apparatus and method for providing a virtual assistant
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
KR20170037709A (ko) * 2015-09-25 2017-04-05 충북대학교 산학협력단 사용자 영향력 및 시간 변화를 고려한 소셜 네트워크 핫 토픽 결정 방법 및 시스템
CN107894994A (zh) * 2017-10-18 2018-04-10 北京京东尚科信息技术有限公司 一种检测热点话题类别的方法和装置
CN109275031A (zh) * 2018-09-25 2019-01-25 有米科技股份有限公司 一种视频的热度评估方法、装置及电子设备
CN112749341A (zh) * 2021-01-22 2021-05-04 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YUNPENG XIAO等: "user behavior prediction of social hotspots based on multimessage interaction and neural network", IEEE TRANSACTIONS ON COMPUTATIONAL SOCIAL SYSTEMS, vol. 7, no. 2, pages 536 - 545, XP011781731, DOI: 10.1109/TCSS.2020.2969484 *
张燕;尹琰;韦欣宜;: "《人民日报》抖音号短视频传播热度影响因素实证研究", 中国传媒大学学报(自然科学版), vol. 27, no. 03, pages 6 - 17 *
彭泽环等: "社区热点微博推荐研究", 计算机研究与发展, vol. 52, no. 5, pages 1014 - 1021 *
朱烨行;张明杰;李艳玲;: "基于字符串权重的热点话题发现设计与实现", 电脑编程技巧与维护, no. 20, pages 16 - 18 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297489A (zh) * 2021-12-28 2022-04-08 北京百度网讯科技有限公司 一种内容推荐方法、装置、电子设备及存储介质
CN114003826A (zh) * 2021-12-31 2022-02-01 思创数码科技股份有限公司 资源目录推荐方法、装置、可读存储介质及电子设备
CN114302242A (zh) * 2022-01-25 2022-04-08 聚好看科技股份有限公司 一种媒资推荐方法、显示设备及服务器
CN114302242B (zh) * 2022-01-25 2023-10-31 聚好看科技股份有限公司 一种媒资推荐方法、显示设备及服务器
CN114417174A (zh) * 2022-03-23 2022-04-29 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及计算机存储介质

Also Published As

Publication number Publication date
CN113688310B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
US11182564B2 (en) Text recommendation method and apparatus, and electronic device
US20180285700A1 (en) Training Image-Recognition Systems Using a Joint Embedding Model on Online Social Networks
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
US9785888B2 (en) Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information
WO2017020451A1 (zh) 信息推送方法和装置
CN110069698B (zh) 信息推送方法和装置
JP6745384B2 (ja) 情報をプッシュするための方法及び装置
CN107526718B (zh) 用于生成文本的方法和装置
US20180089542A1 (en) Training Image-Recognition Systems Based on Search Queries on Online Social Networks
JP6415619B2 (ja) 解析装置、解析方法、およびプログラム
WO2022041982A1 (zh) 数据推荐方法、装置、计算机设备以及存储介质
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
CN110278447B (zh) 基于连续特征的视频推送方法、装置及电子设备
CN113204691B (zh) 一种信息展示方法、装置、设备及介质
CN110737824B (zh) 内容查询方法和装置
CN110019948B (zh) 用于输出信息的方法和装置
CN113569129A (zh) 点击率预测模型处理方法、内容推荐方法、装置及设备
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
US10339559B2 (en) Associating social comments with individual assets used in a campaign
CN110300329B (zh) 基于离散特征的视频推送方法、装置及电子设备
CN107483595B (zh) 信息推送方法和装置
CN110852078A (zh) 生成标题的方法和装置
US10223728B2 (en) Systems and methods of providing recommendations by generating transition probability data with directed consumption
CN114139059A (zh) 资源推荐模型的训练方法、资源推荐方法及装置
CN109408725B (zh) 用于确定用户兴趣的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant