CN111737582A - 一种内容推荐方法及装置 - Google Patents

一种内容推荐方法及装置 Download PDF

Info

Publication number
CN111737582A
CN111737582A CN202010740623.8A CN202010740623A CN111737582A CN 111737582 A CN111737582 A CN 111737582A CN 202010740623 A CN202010740623 A CN 202010740623A CN 111737582 A CN111737582 A CN 111737582A
Authority
CN
China
Prior art keywords
content
feature
interest
target user
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010740623.8A
Other languages
English (en)
Other versions
CN111737582B (zh
Inventor
郝晓波
刘雨丹
葛凯凯
唐琳瑶
张旭
林乐宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yayue Technology Co ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010740623.8A priority Critical patent/CN111737582B/zh
Publication of CN111737582A publication Critical patent/CN111737582A/zh
Application granted granted Critical
Publication of CN111737582B publication Critical patent/CN111737582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例中提供了一种内容推荐方法及装置,涉及计算机技术领域,该方法包括:在接收到针对目标应用的推荐内容获取请求时,确定推荐内容获取请求对应的目标用户;基于获取的目标用户的历史应用数据,确定目标用户的已知兴趣内容特征;基于已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征;获得目标应用中,与未知兴趣内容特征匹配的待推荐内容集合;基于待推荐内容集合,在目标应用中对目标用户进行内容推荐。提升了用户体验,提高了移动互联网的资源利用率。

Description

一种内容推荐方法及装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种内容推荐方法及装置。
背景技术
随着网络的迅猛发展,人们可以通过终端设备进行新闻浏览、书籍阅读、视频收看、音乐聆听、以及社会交流等活动。随着网上各种资讯内容(例如新闻、文章以及视频内容等)的爆炸性增长,用户越来越难以从众多的资讯内容中挑选自己喜欢的资讯内容,因此,如何给用户推荐用户最需要的资讯内容,是本领域技术人员亟待解决的技术问题。
发明内容
本申请实施例提供一种内容推荐方法及装置,用以确定用户最需要的资讯内容,提升了用户体验,提高了移动互联网的资源利用率。
一方面,本申请实施例提供一种内容推荐方法,包括:
在接收到针对目标应用的推荐内容获取请求时,确定推荐内容获取请求对应的目标用户;
基于获取的目标用户的历史应用数据,确定目标用户的已知兴趣内容特征;
基于已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征;
获得目标应用中,与未知兴趣内容特征匹配的待推荐内容集合;
基于待推荐内容集合,在目标应用中对目标用户进行内容推荐。
一方面,本申请实施例提供一种内容推荐装置,包括:
目标用户确定单元,用于在接收到针对目标应用的推荐内容获取请求时,确定推荐内容获取请求对应的目标用户;
已知兴趣内容特征确定单元,用于基于获取的目标用户的历史应用数据,确定目标用户的已知兴趣内容特征;
未知兴趣内容特征确定单元,用于基于已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征;
待推荐内容确定单元,用于获得目标应用中,与未知兴趣内容特征匹配的待推荐内容集合;
推荐单元,用于基于待推荐内容集合,在目标应用中对目标用户进行内容推荐。
可选的,每个属性类别已知兴趣内容特征中包括多个子特征,未知兴趣内容特征确定单元具体用于:
基于内容推荐模型的预处理单元确定各属性类别中每个子特征的重要度,并根据各属性类别特征向量中每个子特征的重要度将各属性类别已知兴趣内容特征转换为各属性类别特征向量。
可选的,历史应用数据中还包括各属性类别已知兴趣内容特征向量的时间信息,未知兴趣内容特征确定单元具体用于:
对各时间信息进行连续性处理,得到具有连续序列关系的各连续时间信息;
根据各连续时间信息确定各属性类别特征向量之间的时间相关性;
根据各属性类别特征向量之间的时间相关性以及各属性类别特征向量确定推荐内容特征向量。
可选的,推荐单元具体用于:
在目标应用的推荐界面中,按照待推荐内容集合中各推荐内容特征与已知兴趣内容特征之间的相似度由高至低的顺序显示给目标用户。
可选的,历史应用数据中包括目标应用的第一历史应用数据以及与目标应用不同的其它应用的第二历史应用数据,已知兴趣内容特征确定单元具体用于:
基于获取的第一历史应用数据以及第二历史应用数据,确定目标用户在目标应用中的第一已知兴趣内容特征以及其它应用中的第二已知兴趣内容特征;
根据第一已知兴趣内容特征以及第二已知兴趣内容特征,确定目标用户的已知第一已知兴趣内容特征以及第二已知兴趣内容特征;
未知兴趣内容特征确定单元具体用于:
确定和第一已知兴趣内容特征以及第二已知兴趣内容特征的相似度都大于设定相似度阈值的未知兴趣内容特征。
可选的,历史应用数据中还包括目标用户的属性数据,待推荐内容确定单元还用于:
若确定不能获取目标用户的第一历史应用数据以及第二历史应用数据,则基于目标用户的属性数据,确定待推荐内容集合。
一方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述内容推荐方法的步骤。
一方面,本申请实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当程序在计算机设备上运行时,使得计算机设备执行上述内容推荐方法的步骤。
本申请实施例提供的内容推荐方法,能够根据目标用户在与目标应用以及与目标应用不同的其它应用中的历史应用数据,确定出目标用户在使用应用时,目标用户的已知兴趣内容特征,也就是说,目标用户在与目标应用在历史时刻已经根据目标用户的已知兴趣内容特征确定了推送给目标用户的推荐内容;在确定了目标用户的已知兴趣内容特征后,需要确定用户的未知兴趣内容特征,且用户的已知兴趣内容特征与用户的未知兴趣内容特征是相似的,所以基于未知兴趣内容特征确定的推荐内容是未推荐给目标用户的,并且还是用户感兴趣的内容,所以目标用户在目标应用中能够查看未出现过的推荐内容,提升了用户体验,并进一步地提高了移动互联网的资源利用率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种内容推荐方法的应用场景示意图;
图2为本申请实施例提供的一种内容推荐方法的流程示意图;
图3为本申请实施例提供的一种训练方法的流程示意图;
图4为本申请实施例提供的一种散度处理方法的示意图;
图5为本申请实施例提供的一种训练方法的流程示意图;
图6为本申请实施例提供的一种目标应用界面的示意图;
图7为本申请实施例提供的一种内容推荐方法的流程示意图;
图8为本申请实施例提供的一种内容推荐方法的流程示意图;
图9为本申请实施例提供的一种内容推荐装置的流程示意图;
图10为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了方便理解,下面对本申请实施例中涉及的名词进行解释:
目标用户:是指应用的使用用户。比如,目标用户可以是指当前在应用上注册、登陆和/或获取产品服务的用户。例如,目标用户可以是当前正在访问应用的用户、当前登陆该应用的用户,等等。
历史应用数据:指的是目标用户在使用应用时产生的数据资料,例如用户行为信息和用户关联信息,具体的,可以为目标用户在使用应用时生成的历史浏览记录、目标用户在应用中的常用联系人等等。
目标用户的属性特征:指的是目标用户的用户描述信息,例如目标用户的属性特征可以是目标用户的性别、年龄、目标用户的职业等特征。
推荐内容:指所有的被发布到互联网上可以被查看、读取的信息的统称,也可称作网络内容,例如视频、新闻、电子书籍、网络文章、资讯以及论坛帖子等,还可以指商品。本申请实施例中的内容主要分为待推荐内容和已推荐内容。其中,待推荐内容是指还未向目标用户进行推荐的网络内容,已推荐内容是指已经向目标用户推荐过的网络内容。
已知兴趣内容特征:是用于描述已经向目标用户推荐的各内容信息的属性,在本申请实施例中,若待推荐内容为文章,则用于描述文章的标题(切词)、类别、作者等属性的信息都属于已知兴趣内容特征。
人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。在本申请实施例中,可以通过人工智能技术确定目标用户的已知兴趣内容特征,并基于已知兴趣内容特征,确定目标用户在目标应用中的推荐内容。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在本申请实施例中,通过人工智能技术中具体的机器学习模型或者算法确定目标用户的已知兴趣内容特征,并基于已知兴趣内容特征,确定目标用户在目标应用中的推荐内容。
注意力机制:模仿了生物观察行为的内部过程,即一种将内部经验和外部感觉对齐从而增加部分区域的观察精细度的机制,简单地说就是从大量信息中快速筛选出高价值信息。这种机制主要有两个方面:决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。在神经网络中,基于注意力机制可以使得神经网络具备专注于其输入(或特征)子集的能力,选择特定的输入。在本申请实施例中,能够根据注意力机制确定已知兴趣内容特征中的重要特征。
自注意力机制:自注意力机制是注意力机制的改进,其减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性。
Transformer:一种来源于自然语言处理中的一种注意力机制的神经网络模型,该模型是一种使用了自注意力制,使得模型可以并行化训练,而且能够拥有全局信息。所以在本申请实施例中,可以通过Transformer模型,将已知兴趣内容特征转换为具有全局信息的已知兴趣内容特征向量。
在具体实践过程中,本申请的发明人发现,由于网络技术的快速发展,用户使用各种终端设备浏览不同的资讯,由于网络中存在海量的资讯内容,所以需要主动向用户推荐内容。所推荐的内容可以包括但不限于新闻、文章、图文结合的长文或短文等文本类内容以及各种视频类内容。
由于不同的用户对于资讯的偏好是不一样的,例如,有些用户较为喜欢浏览新闻资讯,而有些用户则不太关心新闻资讯而比较喜爱浏览影视点评,更有新闻资讯和影视点评都喜欢浏览的用户等等。因此,需要针对不同用户的偏好有针对性地提供用户偏好的推荐内容。
目前,为了能够基于用户的偏好给用户推荐较为精准的内容,在用户对提供方所提供的内容进行阅读的时候,后台服务器会根据用户当前阅读的文章中的一些关键词或者是文章预先标注好的标签,为用户匹配一些该用户可能感兴趣的相关的文章供用户选择,也就是说,后台服务器会根据用户阅读过的一些文章,为用户推荐一些与他阅读过的文章具有一定相关性的文章。
但是这种内容推荐的方式具有较大的弊端,容易为用户反复推荐过量雷同的内容,推荐内容的多样性较差,很容易引起用户的反感。例如,用户浏览的资讯为关于疫情方面的新闻,在对用户进行推荐内容展示时,会持续为用户推荐与疫情方面相关的新闻,例如是不同的编辑社或者是工作室所编辑的疫情方面的新闻。
这样一来,用户在浏览这些内容会有较强的单一性,用户点开不同的新闻资讯也可能会阅读到较为相似的内容,所以现有技术中用户的体验较差,并且将这些用户已经不需要了解的咨询作为推荐内容展示给用户,也造成了移动互联网的资源利用率低的问题,即不能将用户实际感兴趣的内容展示给用户。
基于上述问题,本申请的发明人首先发明了一种内容推荐方法,在本申请实施例中,根据目标用户已推荐内容,来确定目标应用中的待推荐内容,并将待推荐内容展示给目标用户。
具体的,在本申请实施例中,获取目标用户的历史应用数据,这些历史应用数据中包括目标应用以及其它应用针对目标用户的已推荐内容,并根据已推荐内容确定目标用户的已知兴趣内容特征,已知兴趣内容特征作为目标用户的一种感兴趣内容的表征,可以得知目标用户的感兴趣内容,所以基于已知兴趣内容特征能够确定出该目标用户感兴趣的推荐内容。
但是由于已推荐内容都是目标用户已经查看的信息,所以目标用户希望能够看到更多新的感兴趣内容信息,所以在本申请实施例中,根据已知兴趣内容特征,预测和已推荐内容相似的未知兴趣内容特征,也就是说,在本申请实施例中,根据目标用户的已知兴趣内容特征,确定目标用户未知兴趣内容特征,未知兴趣内容特征是与已知兴趣内容特征相似且不同的,所以在目标应用中推荐给目标用户的内容也是目标用户感兴趣的内容。
同时,在确定了未知兴趣内容特征后,在目标应用中确定与未知兴趣内容特征匹配的各待推荐内容,将各待推荐内容展示给目标用户,完成了筛选有效的推荐内容信息推荐给目标用户的过程。
与现有技术相比,首先可以确定目标用户的已推荐内容特征确,而不是基于目标用户在目标应用中的历史推荐内容确定目标用户的感兴趣内容,可以避免目标应用中出现的推荐内容都是相似内容的问题;其次,在本申请实施例中,确定的是与已推荐内容特征相似的未知兴趣内容特征,所以丰富了目标用户画像,扩展了目标用户的兴趣,所以本申请实施例中的内容推荐方法,可以提升目标用户的用户体验,并将目标用户希望展示的待推荐内容显示在目标应用中,也进一步提高了网络资源的利用率。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。
参考图1,其为本申请实施例适用的一种系统架构图,该系统架构至少包括M个终端设备101以及服务器102,M个终端设备101即图1中所示的终端设备101~1至终端设备101~M,M为正整数,M的值本申请实施例并不进行限制。
终端设备101中安装有客户端,该客户端由服务器102提供推荐内容。终端设备101中的客户端可以是浏览器客户端、视频应用客户端等。终端设备101中的客户端是各应用的客户端,即可以通过终端设备101运行各应用,并通过各应用将服务器102提供推荐内容显示给目标用户。
终端设备101可以包括一个或多个处理器1011、存储器1012、与服务器102交互的I/O接口1013以及显示面板1014等。终端设备101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
服务器102为提供数据计算能力的终端设备,服务器102根据终端设备101上传的目标用户在各应用中的历史应用数据,确定针对目标应用的推荐内容,服务器102可以包括一个或多个处理器1021、存储器1022以及与终端设备101交互的I/O接口1023等。此外,服务器102还可以配置数据库1024。服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备101与服务器102可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
用户可以通过终端设备101内安装的客户端来访问服务器102,从而能够接收服务器102确定的推荐内容。例如,该终端设备101可以通过即时聊天应用客户端来访问服务器102,还可以通过浏览器客户端中即时聊天应用的门户网站来访问服务器102。终端设备101中的客户端向服务器102请求推荐内容时,服务器102根据终端设备101上传的目标用户使用各应用的历史应用数据,确定目标用户的已推荐内容,并确定已推荐内容的已知兴趣内容特征,基于已知兴趣内容特征,确定针对目标用户的未知兴趣内容特征,基于未知兴趣内容特征,从服务器102中待推荐内容中选择匹配的推荐内容,发送给终端设备101,并显示在终端设备101的客户端中。
示例性的,终端设备101中的客户端为第一应用的客户端,第一应用的客户端向服务器102请求推荐内容时,服务器102根据终端设备101上传的目标用户使用第二应用、第三应用以及第四应用的历史应用数据,确定目标用户的已推荐内容,具体为电影资讯以及游戏资讯,并确定已推荐内容的已知兴趣内容特征,即目标用户对于娱乐资讯感兴趣,所以基于已知兴趣内容特征,确定针对目标用户的未知兴趣内容特征,确定的未推荐特征为娱乐特征,且该娱乐特征与电影资讯、音乐资讯以及游戏资讯对应的各特征不同,基于未知兴趣内容特征,从服务器102中待推荐内容中选择匹配的推荐内容,待推荐内容包括艺术资讯、政治资讯、体育资讯以及音乐资讯,匹配的推荐内容为音乐资讯,所以将音乐资讯发送给终端设备101,并显示在终端设备101的客户端中。
当然,本申请实施例提供的方法并不限用于图1所示的应用场景中,还可以用于其它可能的应用场景,本申请实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
下面结合图1所示的应用场景,对本申请实施例提供的技术方案进行说明,如图2所示,具体包括:
步骤S201,在接收到针对目标应用的推荐内容获取请求时,确定推荐内容获取请求对应的目标用户。
具体的,在本申请实施例中,针对目标应用的推荐内容获取请求,可以是目标用户在触发目标应用时触发的,也可以是目标应用在目标用户使用与目标应用关联的其它应用时,周期性触发的,也就是说,目标用户还未使用目标应用时,目标应用就可以发送推荐内容获取请求。
示例性的,目标用户在开始使用目标应用时,触发了推荐内容获取请求,进一步具体化,目标应用为即时聊天应用中的一个子应用,在目标用户从一个子应用跳转到该子应用时,触发了针对目标用户在该子应用中的推荐内容获取请求。
另一种可选的实施例中,当目标用户在使用其它子应用时,目标应用就触发了针对目标用户在该子应用中的推荐内容获取请求,在目标用户从其他子应用跳转到该子应用时,可以直接显示对目标用户的推荐内容。
在本申请实施例中,推荐内容获取请求中携带了目标用户信息,该信息可以是目标用户在该目标应用中注册的账号信息,也可以是目标用户在其他相关联的应用中注册的账号信息。
示例性的,目标用户触发了目标应用,所以目标用户登录了目标应用,能够获取目标用户在目标应用中的注册账号信息,通过注册账号信息确定该目标用户。
另一种可选的实施例中,目标应用与第一应用为关联应用,可以根据目标用户在第一应用中使用的登录账号信息确定目标用户。
也就是说,在本申请实施例中,可以通过用户触发目标应用,确定目标用户信息,也可以通过目标应用的关联应用,确定目标用户信息。
具体的,获取的目标用户的信息表征了目标用户的唯一性,可以是目标用户的身份标识,例如身份证信息、银行卡信息等,也可以是目标用户的其它信息。
步骤S202,基于获取的所述目标用户的历史应用数据,确定所述目标用户的已知兴趣内容特征。
具体的,在本申请实施例中,获取目标用户使用目标应用以及其它应用时产生的应用数据,这些历史应用数据是在目标用户使用时产生的。在本申请实施例中,目标应用于其它应用具有关联关系。
一种可选的实施例中,目标应用与其它应用为一个综合应用中的两个子应用,示例性的,目标应用为内容推荐应用,其它应用为聊天应用,目标应用与其它应用都是即时聊天应用中的两个子应用,目标应用与其它应用为不同的功能应用。
还有一种可选的实施例中,目标应用与其它应用为独立的两个应用,可以通过目标用户在目标应用的账号信息授权登录到其它应用中,也可以通过目标用户在其它应用的账号信息授权登录目标应用。
示例性的,目标应用为视频应用,其它应用为购物应用,目标用户在目标应用中具有第一账号,在目标应用登录其它应用时,可以通过第一账号进行登录,所以目标应用与其它应用具有关联关系。
在本申请实施例中,在确定了目标用户的信息后,可以根据目标用户的唯一标识获取目标用户的历史应用数据,一种可选的实施例中,可以通过云存储服务器获取目标用户的历史应用数据,云存储服务器根据目标用户的身份证信息查询到该目标用户的历史应用数据。
在本申请实施例中,历史应用数据记录了目标用户在使用目标应用以及其它应用时的操作行为,也记录了目标应用以及其它应用展示给目标用户的推荐内容的数据信息。
具体的,历史应用数据,可以是目标用户在使用目标应用以及其它应用时的通讯关系数据,例如目标用户在使用目标应用以及其它应用时,添加了其它用户为好友,或者与某个用户解除了好友关系;历史应用数据还可以是用户的浏览内容数据,例如目标用户在目标应用以及其它应用中浏览了哪些文章或者浏览了哪些视频,并且确定浏览的时间等信息;或者历史应用数据还可以是目标用户的行为数据,例如,对其它应用的设置操作数据等。
在本申请实施例中,已推荐内容的具体内容数据是与目标用户使用的目标应用以及其它应用的类型相对应的,例如,目标应用为视频软件,则已推荐内容至少为视频推荐内容,其它应用为购物软件,则已推荐内容至少为待购买商品信息,其它应用为音乐软件,则已推荐内容至少为音乐推荐内容。
也就是说,在本申请实施例中,目标应用以及其它应用中的已推荐内容,可以表征目标用户的感兴趣内容,这些感兴趣内容可以作为目标用户的用户画像,基于用户画像,确定目标应用中针对该目标用户的推荐内容。由于其它应用都已经向目标用户展示了已推荐内容,若基于同样的用户画像,则在目标应用中向目标用户推荐的推荐内容与其它应用中的已推荐内容存在重叠的可能性,所以在本申请实施例中,需要扩展用户画像,确定出与其它应用中的已推荐内容不同的推荐内容。
当然,上述实施例中的历史应用数据只是一种示例,本申请实施例中的历史应用数据还可以包括其它数据,在此不做赘述。
在本申请实施例中,在获取了目标用户的历史应用数据后,可以确定目标用户的已知兴趣内容特征。
一种可选的实施例中,可以通过对各已推荐内容进行标签化,然后将各标签组合为已知兴趣内容特征,示例性的,规定已推荐内容为新闻文本内容时,文本内容的标签为1,规定已推荐内容为娱乐文本内容时,文本内容的标签为2,规定已推荐内容为金融文本内容时,文本内容的标签为3,规定已推荐内容为娱乐视频内容时,视频内容的标签为4,规定已推荐内容为体育文本内容时,文本内容的标签为5。确定针对目标用户在其它应用中的已推荐内容为娱乐文本内容、娱乐视频内容以及体育文本内容,所以针对目标用户确定的已知兴趣内容特征为245,进一步地,还可以通过各标签的计算过程,得到已知兴趣内容特征,例如,根据各已推荐内容的权重值以及各已推荐的标签,得到加权的标签和,将加权的标签和作为目标用户确定的已知兴趣内容特征。
另一种可选的特征化方法,例如,将各已推荐内容中的部分信息提取出来,作为该已推荐内容的特征,并将各特征统一在同一维度下,将同一维度下的各已推荐内容的特征组合为针对该目标用户的已知兴趣内容特征。
示例性的,确定针对目标用户的已推荐内容为娱乐文本内容、娱乐视频内容以及体育文本内容,将娱乐文本内容中的部分文字作为娱乐文本内容的已知兴趣内容特征,将娱乐视频内容中的部分视频帧中的文字信息作为娱乐视频内容的已知兴趣内容特征,将体育文本中的部分文字作为体育文本内容的已知兴趣内容特征,然后根据娱乐文本内容的已知兴趣内容特征、娱乐视频内容的已知兴趣内容特征以及体育文本内容的已知兴趣内容特征确定针对目标用户的已知兴趣内容特征。
还有一种可选的实施例中,将已推荐内容的属性信息作为已推荐内容的特征,例如已推荐内容为娱乐文本内容、娱乐视频内容以及体育文本内容,将娱乐文本内容的作者、娱乐视频内容的作者以及体育文本内容的作者作为各已推荐内容的已知兴趣内容特征。
当然,上述实施例中只是几种示例性确定已推荐内容的已知兴趣内容特征的方法,还有其它确定已推荐内容的已知兴趣内容特征的方法,在此不做赘述。
在本申请实施例中,为了更加全面的确定目标用户的已知兴趣内容特征,还可以参考目标用户的其它数据,来确定目标用户的已知兴趣内容特征。例如,可以将目标用户的属性数据加入计算已知兴趣内容特征的计算过程中,通过提取目标用户的属性数据特征,进一步完善针对目标用户的已知兴趣内容特征。
目标用户的属性数据可以包括年龄、性别、工作单位、居住地等信息,当然还可以包括其它属性数据,在此不做赘述。
步骤S203,基于所述已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征。
具体的,在本申请实施例中,根据已知兴趣内容特征,确定针对目标用户的与已知兴趣内容特征相似但不同的未知兴趣内容特征。
一种可选的实施例中,在确定目标用户的已知兴趣内容特征后,确定目标应用中待推荐内容的待推荐内容特征,例如,待推荐内容特征为政治特征、体育特征、娱乐特征等,而已知兴趣内容特征为游戏特征以及体育特征,则确定待推荐内容特征中与已知兴趣内容特征不同的特征,为政治特征以及娱乐特征。
并确定政治特征与游戏特征中与已知兴趣内容特征的相似度大于设定相似度阈值的特征,政治特征与娱乐特征中,与已知兴趣内容提特征的相似度大于设定相似度阈值的特征为娱乐特征,则将娱乐特征作为目标用户的未知兴趣内容特征。
当然,上述只是一种可选的确定未知内容特征的方法,由于上述方法还需要实时计算待推荐内容特征,且在计算过程中,若存在待推荐内容特征都是与已知兴趣内容特征不同的特征,且相似度都没有满足设定相似度阈值的要求,所以会造成确定的未知兴趣内容特征不准确的问题。
所以在本申请实施例中,为了更加全面准确的确定和已知兴趣内容特征相似的未知兴趣内容特征,可以结合人工智能技术,具体的可以通过深度神经网络模型,预测和已知兴趣内容特征相似的未知兴趣内容特征。由于深度神经网络模型具有强拟合功能,所以能够全面准确的预测和已知兴趣内容特征相似的未知兴趣内容特征。
具体的,在本申请实施例中,可以基于内容推荐模型以及已知兴趣内容特征,预测未知兴趣内容特征,内容推荐模型就是一种深度神经网络模型,将针对目标用户的已知兴趣内容特征输入至内容推荐模型中,通过内容推荐模型提取已知兴趣内容特征中可以表征目标用户的特征信息,并将特征信息进行综合处理,得到未知兴趣内容特征,通过内容推荐模型输出未知兴趣内容特征。
具体的,通过内容推荐模型,确定已知兴趣内容特征对应的已知兴趣内容特征向量,并根据所述已知兴趣内容特征向量确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征,也就是说,通过内容推荐模型,将已知兴趣内容进行向量转换,并通过该向量来表征目标用户的未知兴趣内容特征,通过内容推荐模型的处理,可以直接将已知兴趣内容特征输入至内容推荐模型,得到未知兴趣内容特征,且确定的未知兴趣内容特征更加准确全面,有利于对目标用户进行推荐内容的精准推送。
在本申请实施例中,内容推荐模型提取已知兴趣内容特征中可以表征目标用户的特征信息,并将特征信息进行综合处理,得到未知兴趣内容特征,通过内容推荐模型输出未知兴趣内容特征的能力,是通过内容推荐模型的训练过程获得的,为了能够更好的理解实际应用中内容推荐模型的处理过程,首先介绍内容推荐模型的训练过程。
在对内容推荐模型的训练过程中,需要使用训练样本,在训练样本中包括训练目标用户在使用训练应用时产生的历史应用训练数据,训练应用包括训练目标应用以及其它训练应用,历史应用训练数据中包括已知兴趣内容样本特征。在训练过程中,训练目标应用与目标应用可以相同,也可以不同,同样的,其它训练应用与其它应用可以相同,也可以不同,在本申请中不做限定。
在针对待训练内容推荐模型的训练过程中,基于待训练内容推荐模型以及已推荐训练内容特征得到针对目标应用的预测训练内容特征,根据预测训练内容特征能够确定预测训练内容,根据预测训练内容以及模型训练目标,调整待训练内容模型的模型参数。
在本申请实施例中,模型训练目标为希望模型输出的预测训练内容是训练目标感兴趣的,并且是未推荐的内容,这样可以提升训练目标的体验,也可以提高网络中资源利用率。
所以在本申请实施例中,在模型训练过程中得到了预测训练内容后,确定预测训练特征中与已知兴趣内容样本特征不同的未知兴趣内容样本特征,并根据散度处理方法确定未知兴趣内容样本特征与已知兴趣内容样本特征之间的相似度,根据相似度调整待训练内容推荐模型的模型参数。也就是说,在本申请实施例中,若未知兴趣内容样本特征与已知兴趣内容样本特征之间的相似度差异较大时,则需要调整待训练内容推荐模型的模型参数,若未知兴趣内容样本特征与已知兴趣内容样本特征之间的相似度差异满足训练迭代终止条件时,则确定完成训练过程,得到内容推荐模型。
通过上述训练过程,训练得到的内容推荐模型,能够根据训练目标用户的已知兴趣内容样本特征确定出未知兴趣内容样本特征,所以在实际应用中,可以通过已训练的内容推荐模型以及已知兴趣内容特征,确定出针对目标用户的未知兴趣内容特通知,使得目标用户在目标应用中可以获得与已展示的已知兴趣内容不同的未推荐内容。
在本申请实施例中,训练样本中的已知兴趣内容样本可以是新闻资讯,影视点评,旅游攻略等文本类数据,也可以是各种视频资讯,已知兴趣内容特征样本特征可以是文章发表时间,文章发表单位,文章的类目、文章的题目,文章的标签等等,同样的,已知兴趣内容样本特征可以是视频发表时间,视频发表单位,视频的类目、视频的题目,视频的标签等等。也可以是内容发表时间、内容发表单位、内容题目等特征,具体的特征限定方式不做赘述。
下面结合具体模型,描述上述训练过程,并且针对一次迭代训练过程,训练过程分为正向处理过程以及反向处理过程两个部分,具体如图3所示。
首先描述训练过程中的正向处理过程,将已知兴趣内容样本特征输入至待训练内容推荐模型,通过待训练内容推荐模型确定出能够表征训练目标用户特征的特征信息,并综合特征信息得到预测训练内容特征。
也就是说,在训练过程中,通过正向处理过程中,将已知兴趣内容样本特征转换为预测训练内容特征,该特征能够表征训练目标用户对于推荐内容的偏好,也就是说,该预测训练内容特征可以是训练目标用户的用户画像,通过预测训练内容特征能够全面准确的确定预测训练内容。
其次,介绍反向处理过程,在确定了预测训练内容后,还需要根据模型训练目标进行反向处理过程,所以需要确定预测训练内容特征与已知兴趣内容样本特征之间的差异,得到未知兴趣内容样本特征。因为已知兴趣内容样本特征能够表征训练目标用户的部分兴趣,所以在确定通过模型预测的未知兴趣内容样本特征后,还需要确定符合训练目标用户兴趣的未知兴趣内容样本特征。
具体的,在本申请实施例中,通过散度处理方法,确定未知兴趣内容样本特征与已知兴趣内容样本特征之间的相似度,根据相似度调整待训练内容推荐模型的模型参数。
由于散度处理方法能够确定各特征之间的概率分布相似度,所以通过本申请实施例中的散度处理方法,可以得到未知兴趣内容样本特征与已知兴趣内容样本特征概率分布,通过概率分布的相似度,确定符合训练目标用户兴趣的未知兴趣内容样本特征。
示例性的,已知兴趣内容样本特征为电影特征、音乐特征,通过散度处理方法,确定与已知兴趣内容样本特征概率分布相似,但是特征的具体表现形式与已知兴趣内容样本特征的具体表现形式不同的未知兴趣内容样本特征为娱乐特征,如图4所示,已知兴趣内容样本特征在图4中表现为对称轴下方的部分,未知兴趣内容样本特征为对称轴上方的部分,图4中的每个圆形结构表征一个特征,通过对称轴表征这些特征具有相似度,且这些特征的特征内容不同。
在本申请实施例中,确定相似度使用的是散度处理方法,在传统的模型训练中,常常使用交叉熵作为模型的优化目标。除了计算更简单高效外,交叉熵其实是等价于相对熵的,原因是样本的分布是固定的常量。但是针对本申请实施例中对推荐内容样本进行相似度计算时,交叉熵无法对推荐内容进行计算,并且训练目标用户的样本是随机分布的,所以可以通过散度处理方法确定两个随机分布样本之间的距离。
一种可选的实施例中,可以使用相对熵KL散度处理方法确定未知兴趣内容样本特征与已知兴趣内容特征样本之间的相似度。KL散度处理方法能够确定未知兴趣内容样本特征概率分布P和已知兴趣内容特征样本概率分布Q 之间的差别,KL散度处理方法的值始终大于0,并且当且仅当P和Q分布相同时,KL散度处理方法的结果等于0。当P和Q分布相似度越高,KL散度处理结果越小。
另一种可选的实施例中,由于KL散度处理方法具有不对称问题,即通过KL散度处理方法在确定P和Q之间的概率分布差异时得到的结果和通过KL散度处理方法在确定Q和P之间的概率分布差异时得到的结果不同,所以可以使用KL散度处理方法的改进方法JS散度处理方法来确定未知兴趣内容样本特征与已知兴趣内容特征样本之间的相似度。
具体的,JS散度表示为公式1:
Figure 221157DEST_PATH_IMAGE001
公式1
通过上述过程,解释了训练模型过程中的正向处理过程以及反向处理过程。下面详细介绍正向处理过程的具体流程。
在对内容推荐模型的训练过程中,每次迭代计算都是内容推荐模型对向量的处理过程,所以在本申请实施例中,还需要将已知兴趣内容样本特征进行向量化,所以内容推荐模型中,至少包括向量转换单元,将已知兴趣内容样本特征转换已知兴趣内容特征样本向量。
一种可选的实施例中,若确定已知兴趣内容样本特征是通过文本来描述的,向量转换单元则可以通过词嵌入的方式,将已知兴趣内容样本特征转换已知兴趣内容特征样本向量,一般情况下会将一个文本词语映射到一个高维的向量来代表这个文本词语,具体的词嵌入的方式不做限定,可以是从文本语料库中学习到独立词嵌入的统计方法 Word2Vec,也可以是通过独热码one-hot将每个文本词语转化成one-hot形式的编码,实现将已知兴趣内容样本特征转换已知兴趣内容特征样本向量的过程。
另一种可选的实施例中,若确定已知兴趣内容样本特征是通过其它方式来描述的,例如标签或者数字的形式进行描述的,向量转换单元可以将标签或者数字进行向量化,实现了将已知兴趣内容样本特征转换已知兴趣内容特征样本向量的过程。
上述只是几种示例性的已知兴趣内容样本特征转换已知兴趣内容特征样本向量的处理方法,还有其它将特征转换为向量的方式,在此不做赘述。
在通过向量转换单元将已知兴趣内容样本特征转换已知兴趣内容特征样本向量后,确定已知兴趣内容特征样本向量中的重要特征信息,这些特征信息表征训练目标用户的感兴趣内容。
一种可选的实施例中,待训练内容推荐模型中还包括向量处理单元,通过向量处理单元确定已知兴趣内容特征样本向量中的重要特征信息,并根据这些特征信息确定预测训练内容特征。
通过上述内容可知,在正向处理过程中,待训练内容推荐模型包括向量转换单元以及向量处理单元。
另一种可选的实施例中,由于考虑到训练目标用户的已知兴趣内容样本特征的多样性,所以训练样本中包括各属性类别已知兴趣内容样本特征,例如,针对目标用户,训练样本中包括训练目标用户的属性数据特征、操作特征、联系人特征以及浏览内容特征等多属性类别的特征,所以首先通过向量转换单元将各属性类别已知兴趣内容样本特征转换为各属性类别特征样本向量,然后将各属性类别特征样本向量输入至通过向量处理单元,通过向量处理单元确定各属性类别特征样本向量中的重要特征信息,并根据这些特征信息确定预测训练内容特征。
进一步地,每个属性类别已知兴趣内容样本特征中包括多个子已知兴趣内容样本特征,所以还需要考虑每个子已知兴趣内容样本特征,在本申请实施例中,通过向量转换单元确定每个子已知兴趣内容样本特征对应的各子特征样本向量。
由于每个属性类别已推荐训练内容中包括的多个子已知兴趣内容样本特征的重要度不同,所以还需要通过向量转换单元确定每个子已知兴趣内容样本特征的重要度,在实际处理过程中,向量转换单元确定的是各子特征样本向量的重要度。
示例性的,针对联系人特征向量中存在的第一联系人特征向量、第二联系人特征向量、第三联系人特征向量以及第四联系人特征向量中,确定每个联系人特征向量的重要度,即哪个联系人特征向量对训练目标用户具有更重要的意义;另一种可选的示例中,针对浏览内容特征向量中存在的文本内容特征向量、视频内容特征向量以及图像内容特征向量,确定文本内容特征向量、视频内容特征向量以及图像内容特征向量的重要度,即哪个内容特征向量对训练目标用户具有更重要的意义。
在本申请实施例中,向量转换单元根据注意力机制,确定各子特征样本向量的重要度,然后基于各子特征样本向量的重要度以及各子特征样本向量,确定每个属性类别已知兴趣内容样本特征向量。
在本申请实施例中,向量转换单元基于注意力机制确定各子特征样本向量的重要度的过程具体为,首先针对任一子特征样本向量,确定该子特征样本向量与其它子特征样本向量之间的相似度,并基于该相似度得到针对该子特征样本向量的权重,常用的相似度函数有点积,拼接,感知机等;然后针对所有子特征样本向量的权重进行归一化处理;最后将各子特征样本向量归一化后的权重值以及各子特征样本向量进行加权求和,得到针对该属性类别已知兴趣内容样本特征向量。
当然,上述只是一种可选的向量转换单元根据注意力机制,确定各子特征样本向量的重要度的方法,还有其它可选的处理方法,例如还可以通过自注意力机制或者注意力机制模型来确定各子特征样本向量的重要度,在此不做赘述。
在向量转换单元确定了每个属性类别已知兴趣内容样本特征向量后,将每个属性类别已知兴趣内容样本特征向量输入至向量处理单元中,得到预测训练内容特征。
进一步地,由于各个属性类别已知兴趣内容样本特征向量之间具有相关性,所以向量处理单元在根据各属性类别已知兴趣内容样本特征向量确定预测训练内容特征的过程中,需要确定各个属性类别预测训练内容特征向量之间的关联关系。
一种可选的实施例中,可以通过循环神经网络RNN模型确定各个属性类别已知兴趣内容样本特征向量的特征之间的关联关系,并计算预测训练内容特征,具体的,将各个属性类别已知兴趣内容样本特征向量依次输入至RNN模型中,经过RNN模型的计算,能够确定各个属性类别已知兴趣内容样本特征向量之间的关联关系,并基于各个属性类别已知兴趣内容样本特征向量之间的关联关系以及定各个属性类别已知兴趣内容样本特征向量,得到预测训练内容特征向量,基于预测训练内容特征向量,确定预测训练内容特征向量特征,根据预测训练内容特征向量特征确定预测训练内容。
另一种可选的实施例中,可以通过Transformer模型确定各个属性类别已知兴趣内容样本特征向量之间的关联关系,并计算预测训练内容特征向量,具体的,Transformer模型基于自注意力机制,不仅能够确定各个属性类别已知兴趣内容样本特征向量之间的关联关系,还可以确定各个属性类别已知兴趣内容样本特征向量的重要度,所以通过Transformer模型能够得到更准确的预测训练内容特征向量特征。
在使用Transformer模型确定各个属性类别已知兴趣内容样本特征向量之间的关联关系时,需要确定各个属性类别已知兴趣内容样本特征向量的时间信息,这样才可以在计算过程中,确定各属性类别已知兴趣内容样本特征向量之间的时序相关关系,然后根据时序相关关系更准确的确定各属性类别已知兴趣内容样本特征向量之间的关联关系。
在本申请实施例中,各个属性类别各属性类别已知兴趣内容样本特征向量的时间信息可是根据训练目标用户的操作时间确定的,例如,可以通过训练目标用户点击在其它训练应用的中各已推荐训练内容的时间作为各个属性类别已知兴趣内容特征的时间信息,另一种可选的实施例中,针对每个属性类别各属性类别已知兴趣内容样本特征中的各子特征样本对应的不同时间信息,可以通过平均处理的方式,得到各属性类别已知兴趣内容样本特征向量的时间信息。
进一步地,由于各属性类别已知兴趣内容样本特征向量的时间信息都是离散的,若不经过处理,直接输入到Transformer模型中,则会形成稀疏时间向量信息,不利于Transformer模型计算,所以在本申请实施例中,需要对各属性类别已知兴趣内容样本特征向量的时间信息进行连续性处理,得到具有连续序列关系的各连续时间信息。
可选的,在本申请实施例中,可以将离散的时间向量信息通过正弦函数、余弦函数或者正切函数处理,得到连续时间信息,即由于正弦函数、余弦函数或者正切函数具有连续性,可以将离散的时间向量信息处理为连续时间信息。
但是由于上述函数处理过程中,函数的区间范围较大,所以通过上述函数进行处理后,仍存在稀疏时间向量信息的问题。
所以进一步地,在本申请实施例中,通过正弦函数以及余弦函数的综合处理过程,将离散的时间向量信息处理为连续时间信息。
具体的,如公式2所示:
Figure 823784DEST_PATH_IMAGE002
公式2
其中,
Figure 744466DEST_PATH_IMAGE003
表示的是任一属性类别已知兴趣内容样本特征向量的连续性时间 信息,
Figure 326626DEST_PATH_IMAGE004
表示的是任一属性类别已知兴趣内容样本特征向量的日期时间信息,
Figure 344261DEST_PATH_IMAGE005
表示 的是当前日期时间信息。
从公式2可知,在获取了任一属性类别已知兴趣内容样本特征向量后,若不是31 日,则确定
Figure 432302DEST_PATH_IMAGE006
的值为
Figure 387751DEST_PATH_IMAGE007
,可以确定
Figure 524334DEST_PATH_IMAGE007
的值大于等于-1小于等 于29,若日期为31日,则
Figure 380164DEST_PATH_IMAGE008
的值为
Figure 576790DEST_PATH_IMAGE009
,可以确定
Figure 751026DEST_PATH_IMAGE007
的值大于 等于0小于等于30。
所以通过公式2能够将离散的时间信息转换为连续的且时间信息的取值范围在小的取值空间内的连续时间信息。并且,通过正弦函数以及预先函数的计算,可以对于不同的各属性类别已知兴趣内容样本特征向量的时间信息进行区分,也不会造成所有各属性类别已知兴趣内容样本特征向量的连续性时间信息过于集中,不好区分的问题。
当然,上述实施例只是几种示例性确定各属性类别已知兴趣内容样本特征向量的特征之间的关联关系,并计算预测训练内容特征向量的过程,还有其它方法,在此不做赘述。
总结上述实施例,如图5所示,在模型训练过程中,获取针对训练目标用户的各属性类别已知兴趣内容特征,确定各属性类别已知兴趣内容样本特征中的各子特征样本向量以及各子特征样本向量的时间信息,将各子特征样本向量的时间信息输入至公式2中,得到连续的时间信息。将各子特征样本向量输入至向量转换单元,转换为,并通过注意力机制,确定各子特征样本向量的重要度,基于各子特征样本向量的重要度以及各子特征样本向量,确定每个属性类别已知兴趣内容样本特征向量。
将每个属性类别已知兴趣内容样本特征向量以及对应的连续时间信息输入至向量处理单元中,并通过Transformer模型确定各属性已知兴趣内容样本特征向量之间的相关性,并根据各属性已知兴趣内容样本特征向量之间的相关性以及各属性类别已知兴趣内容样本特征向量确定针对目标用户的预测训练内容特征向量,并根据预测训练内容特征向量确定预测训练内容特征。
确定预测训练内容特征与已知兴趣内容样本特征不同的未知兴趣内容样本特征,并根据JS散度处理方法,计算未知兴趣内容样本特征与已知兴趣内容样本特征之间的相似度,根据该相似度调整模型参数。
在介绍了内容推荐模型的训练过程后,在实际应用过程中,与训练过程中的处理方式类似,区别点在于,由于内容推荐模型已经训练完成,所以不需要通过JS散度进行相似度计算,而是通过内容推荐模型得到未知兴趣内容特征。
具体的,在本申请实施例中,目标用户的历史应用数据中包括已知兴趣内容特征包括各属性类别已知兴趣内容特征,所以通过内容推荐模型,确定已知兴趣内容特征对应的已知兴趣内容特征向量时,需要基于内容推荐模型的预处理单元,将各属性类别已知兴趣内容特征转换为各属性类别特征向量;根据已知兴趣内容特征向量确定未知兴趣内容特征时,需要基于内容推荐模型的向量处理单元,确定各属性类别特征向量之间的相关性,并根据各属性类别特征向量之间的相关性以及各属性类别特征向量确定针对目标用户的推荐内容特征向量;基于内容推荐模型的特征转换单元,将推荐内容特征向量转换为未知兴趣内容特征。
基于内容推荐模型的向量处理单元,确定各属性类别特征向量之间的相关性,并根据各属性类别特征向量之间的相关性以及各属性类别特征向量确定针对目标用户的推荐内容特征向量,并根据推荐内容特征向量预测未知兴趣内容特征。
进一步地,每个所述属性类别已知兴趣内容特征中包括多个子特征,所以在将所述各属性类别已知兴趣内容特征转换为各属性类别特征向量时,基于内容推荐模型的所述预处理单元确定所述各属性类别中每个子特征的重要度,并根据所述各属性类别特征向量中所述每个子特征的重要度将所述各属性类别已知兴趣内容特征转换为各属性类别特征向量。
同样的,在实际应用过程中,还需要确定各属性类别已知兴趣内容特征向量的时间信息,并基于公式2对各时间信息进行连续性处理,得到具有连续序列关系的各连续时间信息,根据各属性类别已知兴趣内容特征向量的各连续时间信息确定各属性类别已知兴趣内容特征向量之间的时间相关性,并根据各属性类别已知兴趣内容特征向量之间的时间相关性以及各属性类别已知兴趣内容特征向量确定推荐内容特征向量。
在本申请实施例中,确定推荐内容特征向量可以转换为未知兴趣内容特征,具体的转换方法可以是特征转向量的逆操作,在此不做赘述。
进一步地,在本申请实施例中,由于历史应用数据中包括目标应用的历史数据以及其它应用的历史数据,所以确定的特征也是目标用户在目标应用中的第一已知兴趣内容特征以在其它应用中的第二已知兴趣内容特征,在确定未知兴趣内容特征时,确定和第一已知兴趣内容特征以及第二已知兴趣内容特征的相似度都大于设定相似度阈值的未知兴趣内容特征。
步骤S204,获得目标应用中,与未知兴趣内容特征匹配的待推荐内容集合。
具体的,在本申请实施例中,目标应用中有许多待推荐内容,每个待推荐内容具有特征,所以可以确定目标应用中待推荐内容的特征。
在本申请实施例中,可以实时确定目标应用中待推荐内容的特征,也可以周期性的确定待推荐内容的特征,具体的确定待推荐内容的特征的方法不做限定,可以与确定已知兴趣内容特征的方法相同,也可以不同。
在本申请实施例中,在确定了目标应用中待推荐内容的特征后,可以通过相似度算法,确定未知兴趣内容特征与目标应用中待推荐内容的特征的相似度。
一种可选的实施例中,可以通过欧式距离的方法确定未知兴趣内容特征与目标应用中待推荐内容的特征的相似度。
另一种可选的实施例中,可以通过散度处理方法确定未知兴趣内容特征与目标应用中待推荐内容的特征的相似度,例如KL散度处理方法或者JS散度处理方法。
在本申请实施例中,与未知兴趣内容特征匹配的待推荐内容指的是与未知兴趣内容特征之间的相似度大于设定相似度阈值的待推荐内容特征对应的待推荐内容,所以在将目标应用中大量的待推荐内容中选取了目标用户真正感兴趣的内容。
在本申请实施例中,该设定相似度阈值,可以与确定目标用户的未知兴趣内容特征时使用的设定相似度阈值相同,也可以不同,在此不做限定。
上述实施例介绍的是基于目标用户的历史应用数据确定待推荐内容集合的过程,若不能获取到目标用户的历史应用数据,则基于目标用户的属性数据,确定待推荐内容集合。
示例性的,目标用户是初次使用目标应用的用户,目标用户也没有使用与目标应用相关联的其它应用,则基于目标用户的属性数据来确定针对目标用户的待推荐内容集合。例如,基于目标用户的性别、年龄、职业等数据来确定待推荐内容集合。
步骤S205,基于待推荐内容集合,在目标应用中对目标用户进行内容推荐。
在本申请实施例中,确定了待推荐内容集合,则在目标应用中显示待推荐内容集合,便于目标用户查看。
在本申请实施例中,按照待推荐内容集合中各推荐内容特征与已知兴趣内容特征之间的相似度由高至低的顺序显示给目标用户,所以在目标应用中,首先展示相似度较高的待推荐内容,其次依次显示相似度递减的待推荐内容。
具体的,如图6所示,图6为一种目标应用的界面示意图,目标应用中与未知兴趣内容特征匹配的待推荐内容为电影视频、电影文本以及电影图片,且与已知兴趣内容特征之间的相似度由高至低的待推荐内容分别为电影图片、电影视频以及电影文本,所以在界面中的最上方,显示电影图片,然后在电影图片的下方显示的是电影视频,在电影视频的下方显示的是电影文本。
为了更好的解释本申请实施例,下面结合一种具体的实施场景描述本申请实施例提供的内容推荐方法,在本申请实施例中,包括离线训练内容推荐模型的过程以及在线对目标用户进行内容推荐的过程。
具体的,如图7所示,在线进行内容推荐的过程是,当用户触发了目标应用——即时聊天软件中的“看一看”功能应用时,当从用户数据库中,获取用户的历史应用数据,确定用户的已知兴趣内容特征;从模型库中获取了已训练的内容推荐模型,通过内容推荐模型,将用户的已知兴趣内容特征转换为未知兴趣内容特征。
通过拉取“看一看”功能应用的数据,确定“看一看”功能应用中的内容特征,即待推荐给用户的内容的特征,通过内容特征以及未知兴趣内容特征的匹配,确定了匹配内容特征,并确定每个匹配内容特征与未知兴趣内容特征之间的相似度,进行相似度排序,按照相似度由高至低的顺序显示在“看一看”功能应用中。
在本申请实施例中,用户的历史应用数据特征可以是用户在“看一看”功能应用中已浏览内容特征、即时聊天软件中用户使用的小程序的特征、用户的朋友圈特征、用户关注的公众号特征、用户的联系人特征以及用户的属性数据特征等,在此不做限定。
在介绍了在线处理过程后,下面介绍离线处理的过程,在用户点击了“看一看”功能应用的各推荐内容后,可以将用户对于推荐内容的操作保存在用户数据库中,便于更新内容推荐模型,即通过用户点击日志模块,将用户对于推荐内容的操作进行数据拉取,通过样本处理模块,对拉取的数据进行处理。
样本处理模块可以统计用户对推荐内容的浏览时间,是否有转发行为等,并根据处理的后的用户操作数据,更新用户兴趣内容特征,例如,更新了用户的感兴趣内容为选秀节目、电影短视频等。
所以在对内容推荐模型进行训练的过程中,可以从不断更新的用户已知兴趣内容特征中获取样本,并基于样本更新内容推荐模型。
具体的,在本申请实施例中,内容推荐模型的处理过程如图8所示。由于用户的属性数据特征不会随着用户的任何操作行为发生变化,是固有存在的,所以本申请实施例中,将用户的属性数据特征与用户在“看一看”功能应用中已浏览内容特征、即时聊天软件中用户使用的小程序的特征、用户的朋友圈特征、用户关注的公众号特征、用户的联系人特征的分别输入到内容推荐模型中。
示例性的,用户在“看一看”功能应用中已浏览内容特征、即时聊天软件中用户使用的小程序的特征、用户的朋友圈特征、用户关注的公众号特征、用户的联系人特征中都包括N个子特征,所以每个特征都是由N个子特征构成N维向量,将多个N维向量以及经过连续性处理得到的N个子特征的时间信息,一起输入至内容推荐模型中。
通过注意力机制处理单元确定每个N维向量中各子特征向量的重要度,并将注意力机制处理后的N维向量输入至Transformer单元中,Transformer单元将多个N维向量进行综合处理,得到第一特征向量。
对于用户的属性数据特征,将特征进行向量化,得到第二特征向量。
通过特征合并操作,将第一特征向量以及第二特征向量结合,得到针对用户的目标向量,并通过全连接层,将目标向量转换为未知兴趣内容特征,未知兴趣内容特征为特征1、特征2、特征3、……、特征m。
在本申请实施例中,在线确定推荐内容时,若该用户为即时聊天应用的新用户,不能获取到该用户的历史应用数据时,则可以根据该用户的属性数据特征确定待推荐内容集合,具体的方法与图8相似,将属性数据特征输入至内容推荐模型中,在内容推荐模型中缺省了历史应用数据的特征,并通过内容推荐模型确定了用户的推荐内容特征。
也就是说,在离线训练内容推荐模型时,需要考虑上述特殊情况,所以在训练时,可以缺省了历史应用数据的特征,然后根据模型的训练输出的推荐内容与该实际已经推荐的内容之间的差异,调整内容推荐模型。
基于相同的技术构思,本申请实施例提供了一种内容推荐装置,如图9所示,包括:
目标用户确定单元901,用于在接收到针对目标应用的推荐内容获取请求时,确定推荐内容获取请求对应的目标用户;
已知兴趣内容特征确定单元902,用于基于获取的目标用户的历史应用数据,确定目标用户的已知兴趣内容特征;
未知兴趣内容特征确定单元903,用于基于已知兴趣内容特征,确定与已知兴趣内容特征相似度大于设定相似度阈值的目标用户的未知兴趣内容特征;
待推荐内容确定单元904,用于获得目标应用中,与未知兴趣内容特征匹配的待推荐内容集合;
推荐单元905,用于基于待推荐内容集合,在目标应用中对目标用户进行内容推荐。
可选的,历史应用数据中还包括目标用户在目标应用中的历史应用数据;
未知兴趣内容特征确定单元903具体用于:
通过内容推荐模型,确定已知兴趣内容特征对应的已知兴趣内容特征向量,并根据已知兴趣内容特征向量确定与已知兴趣内容特征相似度大于设定相似度阈值的目标用户的未知兴趣内容特征,其中,内容推荐模型是基于训练目标用户的已知兴趣内容样本特征与未知兴趣内容样本特征之间的相似度训练得到的,未知兴趣内容样本特征是内容推荐模型基于已知兴趣内容样本特征、训练目标用户的历史应用数据样本确定的。
可选的,装置还包括:
训练单元906,用于在每次迭代训练过程中,基于历史应用数据样本以及待训练内容推荐模型,得到预测训练内容特征,将预测训练内容特征与已知兴趣内容样本特征不同的特征作为未知兴趣内容样本特征;
根据散度处理方法,确定未知兴趣内容样本特征与已知兴趣内容样本特征之间的相似度,根据相似度调整待训练内容推荐模型的模型参数,得到内容推荐模型。
可选的,已知兴趣内容特征包括各属性类别已知兴趣内容特征,已知兴趣内容特征确定单元902具体用于:
基于内容推荐模型的预处理单元,将各属性类别已知兴趣内容特征转换为各属性类别特征向量;
基于内容推荐模型的向量处理单元,确定各属性类别特征向量之间的相关性,并根据各属性类别特征向量之间的相关性以及各属性类别特征向量确定针对目标用户的推荐内容特征向量;
基于内容推荐模型的特征转换单元,将推荐内容特征向量转换为未知兴趣内容特征。
可选的,每个属性类别已知兴趣内容特征中包括多个子特征,未知兴趣内容特征确定单元903具体用于:
基于内容推荐模型的向量转换单元,将各属性类别已知兴趣内容特征转换为各属性类别特征向量,包括:
基于内容推荐模型的预处理单元确定各属性类别中每个子特征的重要度,并根据各属性类别特征向量中每个子特征的重要度将各属性类别已知兴趣内容特征转换为各属性类别特征向量。
可选的,历史应用数据中还包括各属性类别已知兴趣内容特征向量的时间信息,未知兴趣内容特征确定单元903具体用于:
对各时间信息进行连续性处理,得到具有连续序列关系的各连续时间信息;
根据各连续时间信息确定各属性类别特征向量之间的时间相关性;
根据各属性类别特征向量之间的时间相关性以及各属性类别特征向量确定推荐内容特征向量。
可选的,推荐单元905具体用于:
在目标应用的推荐界面中,按照待推荐内容集合中各推荐内容特征与已知兴趣内容特征之间的相似度由高至低的顺序显示给目标用户。
可选的,历史应用数据中包括目标应用的第一历史应用数据以及与目标应用不同的其它应用的第二历史应用数据,已知兴趣内容特征确定单元902具体用于:
基于获取的第一历史应用数据以及第二历史应用数据,确定目标用户在目标应用中的第一已知兴趣内容特征以及其它应用中的第二已知兴趣内容特征;
根据第一已知兴趣内容特征以及第二已知兴趣内容特征,确定目标用户的已知第一已知兴趣内容特征以及第二已知兴趣内容特征;
未知兴趣内容特征确定单元903具体用于:
确定和第一已知兴趣内容特征以及第二已知兴趣内容特征的相似度都大于设定相似度阈值的未知兴趣内容特征。
可选的,历史应用数据中还包括目标用户的属性数据,待推荐内容确定单元904还用于:
若确定不能获取目标用户的第一历史应用数据以及第二历史应用数据,则基于目标用户的属性数据,确定待推荐内容集合。
基于相同的技术构思,本申请实施例提供了一种计算机设备,如10所示,包括至少一个处理器1001,以及与至少一个处理器连接的存储器1002,本申请实施例中不限定处理器1001与存储器1002之间的具体连接介质,图10中处理器1001和存储器1002之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本申请实施例中,存储器1002存储有可被至少一个处理器1001执行的指令,至少一个处理器1001通过执行存储器1002存储的指令,可以执行前述视频播放控制方法中所包括的步骤。
其中,处理器1001是计算机设备的控制中心,可以利用各种接口和线路连接计算机设备的各个部分,通过运行或执行存储在存储器1002内的指令以及调用存储在存储器1002内的数据,从而对视频播放进行控制。可选的,处理器1001可包括一个或多个处理单元,处理器1001可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1001中。在一些实施例中,处理器1001和存储器1002可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器1001可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1002作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1002可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器1002是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1002还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于同一发明构思,本申请实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当程序在计算机设备上运行时,使得计算机设备执行上述视频播放控制方法的步骤。
基于相同的技术构思,本申请实施例提供了一种计算机设备,如10所示,包括至少一个处理器1001,以及与至少一个处理器连接的存储器1002,本申请实施例中不限定处理器1001与存储器1002之间的具体连接介质,图10中处理器1001和存储器1002之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本申请实施例中,存储器1002存储有可被至少一个处理器1001执行的指令,至少一个处理器1001通过执行存储器1002存储的指令,可以执行前述内容推荐方法中所包括的步骤。
其中,处理器1001是计算机设备的控制中心,可以利用各种接口和线路连接计算机设备的各个部分,通过运行或执行存储在存储器1002内的指令以及调用存储在存储器1002内的数据,从而对视频播放进行控制。可选的,处理器1001可包括一个或多个处理单元,处理器1001可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1001中。在一些实施例中,处理器1001和存储器1002可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器1001可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1002作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1002可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器1002是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1002还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于同一发明构思,本申请实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当程序在计算机设备上运行时,使得计算机设备执行上述内容推荐方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种内容推荐方法,其特征在于,所述方法包括:
在接收到针对目标应用的推荐内容获取请求时,确定所述推荐内容获取请求对应的目标用户;
基于获取的所述目标用户的历史应用数据,确定所述目标用户的已知兴趣内容特征;
基于所述已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征;
获得所述目标应用中,与所述未知兴趣内容特征匹配的待推荐内容集合;
基于所述待推荐内容集合,在所述目标应用中对所述目标用户进行内容推荐。
2.根据权利要求1所述的方法,其特征在于,所述基于所述已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征,包括:
通过内容推荐模型,确定已知兴趣内容特征对应的已知兴趣内容特征向量,并根据所述已知兴趣内容特征向量确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征,其中,所述内容推荐模型是基于训练目标用户的已知兴趣内容样本特征与未知兴趣内容样本特征之间的相似度训练得到的,所述未知兴趣内容样本特征是所述内容推荐模型基于所述已知兴趣内容样本特征、所述训练目标用户的历史应用数据样本确定的。
3.根据权利要求2所述的方法,其特征在于,所述未知兴趣内容样本特征是所述内容推荐模型基于所述已知兴趣内容样本特征、所述训练目标用户的历史应用数据样本确定的,包括:
在每次迭代训练过程中,基于所述历史应用数据样本以及待训练内容推荐模型,得到预测训练内容特征,将所述预测训练内容特征与所述已知兴趣内容样本特征不同的特征作为未知兴趣内容样本特征;
所述内容推荐模型是基于训练目标用户的已知兴趣内容样本特征与未知兴趣内容样本特征之间的相似度训练得到的,包括:
根据散度处理方法,确定所述未知兴趣内容样本特征与所述已知兴趣内容样本特征之间的相似度,根据所述相似度调整所述待训练内容推荐模型的模型参数,得到所述内容推荐模型。
4.根据权利要求2所述的方法,其特征在于,所述已知兴趣内容特征包括各属性类别已知兴趣内容特征,所述通过内容推荐模型,确定已知兴趣内容特征对应的已知兴趣内容特征向量,包括:
基于所述内容推荐模型的预处理单元,将所述各属性类别已知兴趣内容特征转换为各属性类别特征向量;
所述根据所述已知兴趣内容特征向量确定所述未知兴趣内容特征,包括:
基于所述内容推荐模型的向量处理单元,确定所述各属性类别特征向量之间的相关性,并根据所述各属性类别特征向量之间的相关性以及所述各属性类别特征向量确定针对所述目标用户的推荐内容特征向量;
基于所述内容推荐模型的特征转换单元,将所述推荐内容特征向量转换为所述未知兴趣内容特征。
5.根据权利要求4所述的方法,其特征在于,每个所述属性类别已知兴趣内容特征中包括多个子特征;
所述基于所述内容推荐模型的向量转换单元,将所述各属性类别已知兴趣内容特征转换为各属性类别特征向量,包括:
基于所述内容推荐模型的所述预处理单元确定所述各属性类别中每个所述子特征的重要度,并根据所述各属性类别特征向量中每个所述子特征的重要度将所述各属性类别已知兴趣内容特征转换为各属性类别特征向量。
6.根据权利要求4所述的方法,其特征在于,所述历史应用数据中还包括各属性类别已知兴趣内容特征向量的时间信息,所述基于所述内容推荐模型的向量处理单元,根据所述各属性类别特征向量之间的相关性以及所述各属性类别特征向量确定针对所述目标用户的推荐内容特征向量,包括:
对各时间信息进行连续性处理,得到具有连续序列关系的各连续时间信息;
根据所述各连续时间信息确定所述各属性类别特征向量之间的时间相关性;
根据所述各属性类别特征向量之间的时间相关性以及所述各属性类别特征向量确定所述推荐内容特征向量。
7.根据权利要求1所述的方法,其特征在于,所述基于所述待推荐内容集合,在所述目标应用中对所述目标用户进行内容推荐,包括:
在所述目标应用的推荐界面中,按照待推荐内容集合中各推荐内容特征与所述已知兴趣内容特征之间的相似度由高至低的顺序显示给所述目标用户。
8.根据权利要求1所述的方法,其特征在于,所述历史应用数据中包括所述目标应用的第一历史应用数据以及与所述目标应用不同的其它应用的第二历史应用数据,所述基于获取的所述目标用户的历史应用数据,确定所述目标用户的已知兴趣内容特征,包括:
基于获取的所述第一历史应用数据以及所述第二历史应用数据,确定所述目标用户在所述目标应用中的第一已知兴趣内容特征以及所述其它应用中的第二已知兴趣内容特征;
根据所述第一已知兴趣内容特征以及所述第二已知兴趣内容特征,确定所述目标用户的已知第一已知兴趣内容特征以及第二已知兴趣内容特征;
所述基于所述已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征,包括:
确定和所述第一已知兴趣内容特征以及所述第二已知兴趣内容特征的相似度都大于设定相似度阈值的未知兴趣内容特征。
9.根据权利要求8所述的方法,其特征在于,所述历史应用数据中还包括所述目标用户的属性数据,所述方法还包括:
若确定不能获取所述目标用户的所述第一历史应用数据以及所述第二历史应用数据,则基于所述目标用户的属性数据,确定所述待推荐内容集合。
10.一种内容推荐装置,其特征在于,包括:
目标用户确定单元,用于在接收到针对目标应用的推荐内容获取请求时,确定所述推荐内容获取请求对应的目标用户;
已知兴趣内容特征确定单元,用于基于获取的所述目标用户的历史应用数据,确定所述目标用户的已知兴趣内容特征;
未知兴趣内容特征确定单元,用于基于所述已知兴趣内容特征,确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征;
待推荐内容确定单元,用于获得所述目标应用中,与所述未知兴趣内容特征匹配的待推荐内容集合;
推荐单元,用于基于所述待推荐内容集合,在所述目标应用中对所述目标用户进行内容推荐。
11.根据权利要求10所述的装置,其特征在于,所述未知兴趣内容特征确定单元具体用于:
通过内容推荐模型,确定已知兴趣内容特征对应的已知兴趣内容特征向量,并根据所述已知兴趣内容特征向量确定与所述已知兴趣内容特征相似度大于设定相似度阈值的所述目标用户的未知兴趣内容特征,其中,所述内容推荐模型是基于训练目标用户的已知兴趣内容样本特征与未知兴趣内容样本特征之间的相似度训练得到的,所述未知兴趣内容样本特征是所述内容推荐模型基于所述已知兴趣内容样本特征、所述训练目标用户的历史应用数据样本确定的。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
训练单元,用于在每次迭代训练过程中,基于所述历史应用数据样本以及待训练内容推荐模型,得到预测训练内容特征,将所述预测训练内容特征与所述已知兴趣内容样本特征不同的特征作为未知兴趣内容样本特征;
根据散度处理方法,确定所述未知兴趣内容样本特征与所述已知兴趣内容样本特征之间的相似度,根据所述相似度调整所述待训练内容推荐模型的模型参数,得到所述内容推荐模型。
13.根据权利要求11所述的装置,其特征在于,所述已知兴趣内容特征包括各属性类别已知兴趣内容特征,所述已知兴趣内容特征确定单元具体用于:
基于所述内容推荐模型的预处理单元,将所述各属性类别已知兴趣内容特征转换为各属性类别特征向量;
基于所述内容推荐模型的向量处理单元,确定所述各属性类别特征向量之间的相关性,并根据所述各属性类别特征向量之间的相关性以及所述各属性类别特征向量确定针对所述目标用户的推荐内容特征向量;
基于所述内容推荐模型的特征转换单元,将所述推荐内容特征向量转换为所述未知兴趣内容特征。
14.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1~9任一权利要求所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行权利要求1~9任一所述方法的步骤。
CN202010740623.8A 2020-07-29 2020-07-29 一种内容推荐方法及装置 Active CN111737582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010740623.8A CN111737582B (zh) 2020-07-29 2020-07-29 一种内容推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010740623.8A CN111737582B (zh) 2020-07-29 2020-07-29 一种内容推荐方法及装置

Publications (2)

Publication Number Publication Date
CN111737582A true CN111737582A (zh) 2020-10-02
CN111737582B CN111737582B (zh) 2020-12-08

Family

ID=72656379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010740623.8A Active CN111737582B (zh) 2020-07-29 2020-07-29 一种内容推荐方法及装置

Country Status (1)

Country Link
CN (1) CN111737582B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364244A (zh) * 2020-11-16 2021-02-12 广州酷狗计算机科技有限公司 多媒体数据推荐方法、装置、服务器及存储介质
CN112733034A (zh) * 2021-01-21 2021-04-30 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN113111268A (zh) * 2021-04-30 2021-07-13 百度在线网络技术(北京)有限公司 用户特征提取模型的训练方法、内容推荐方法及装置
CN113298283A (zh) * 2020-10-19 2021-08-24 阿里巴巴集团控股有限公司 一种内容对象预测方法和装置以及内容对象推荐方法
CN113407849A (zh) * 2021-07-15 2021-09-17 百果园技术(新加坡)有限公司 一种粗排序的方法及装置
CN115689616A (zh) * 2022-12-20 2023-02-03 陕西长锦网络科技有限公司 基于大数据特征分析的云端内容推送方法及系统
CN112685637B (zh) * 2020-12-30 2023-04-14 青岛海信智慧生活科技股份有限公司 一种智能设备的智能交互方法及智能设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181966A (ja) * 2009-02-03 2010-08-19 Ntt Docomo Inc レコメンド情報評価装置およびレコメンド情報評価方法
US20120259852A1 (en) * 2011-04-06 2012-10-11 Nterop Corporation Method and apparatus for pushing situationally relevant data
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN106445969A (zh) * 2015-08-11 2017-02-22 北京字节跳动科技有限公司 一种全局兴趣探索推荐方法和装置
CN107180111A (zh) * 2017-06-13 2017-09-19 深圳市宇数科技有限公司 一种信息推荐方法、电子设备、存储介质及系统
CN110008292A (zh) * 2019-04-11 2019-07-12 北京妙医佳信息技术有限公司 数据融合方法、装置、电子设备及可读存储介质
CN111291261A (zh) * 2020-01-21 2020-06-16 江西财经大学 融合标签和注意力机制的跨领域推荐方法及其实现系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181966A (ja) * 2009-02-03 2010-08-19 Ntt Docomo Inc レコメンド情報評価装置およびレコメンド情報評価方法
US20120259852A1 (en) * 2011-04-06 2012-10-11 Nterop Corporation Method and apparatus for pushing situationally relevant data
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN106445969A (zh) * 2015-08-11 2017-02-22 北京字节跳动科技有限公司 一种全局兴趣探索推荐方法和装置
CN107180111A (zh) * 2017-06-13 2017-09-19 深圳市宇数科技有限公司 一种信息推荐方法、电子设备、存储介质及系统
CN110008292A (zh) * 2019-04-11 2019-07-12 北京妙医佳信息技术有限公司 数据融合方法、装置、电子设备及可读存储介质
CN111291261A (zh) * 2020-01-21 2020-06-16 江西财经大学 融合标签和注意力机制的跨领域推荐方法及其实现系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈明毅: "基于深度学习的用户画像技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298283A (zh) * 2020-10-19 2021-08-24 阿里巴巴集团控股有限公司 一种内容对象预测方法和装置以及内容对象推荐方法
CN112364244A (zh) * 2020-11-16 2021-02-12 广州酷狗计算机科技有限公司 多媒体数据推荐方法、装置、服务器及存储介质
CN112685637B (zh) * 2020-12-30 2023-04-14 青岛海信智慧生活科技股份有限公司 一种智能设备的智能交互方法及智能设备
CN112733034A (zh) * 2021-01-21 2021-04-30 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN112733034B (zh) * 2021-01-21 2023-08-01 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN113111268A (zh) * 2021-04-30 2021-07-13 百度在线网络技术(北京)有限公司 用户特征提取模型的训练方法、内容推荐方法及装置
CN113407849A (zh) * 2021-07-15 2021-09-17 百果园技术(新加坡)有限公司 一种粗排序的方法及装置
CN115689616A (zh) * 2022-12-20 2023-02-03 陕西长锦网络科技有限公司 基于大数据特征分析的云端内容推送方法及系统
CN115689616B (zh) * 2022-12-20 2023-11-17 北京国联视讯信息技术股份有限公司 基于大数据特征分析的云端内容推送方法及系统

Also Published As

Publication number Publication date
CN111737582B (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN111737582B (zh) 一种内容推荐方法及装置
Gabriel De Souza et al. Contextual hybrid session-based news recommendation with recurrent neural networks
Balaji et al. Machine learning algorithms for social media analysis: A survey
US11893071B2 (en) Content recommendation method and apparatus, electronic device, and storage medium
CN111898031B (zh) 一种获得用户画像的方法及装置
CN111708950B (zh) 内容推荐方法、装置及电子设备
CN111444428A (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN112231569B (zh) 新闻推荐方法、装置、计算机设备及存储介质
US20230017667A1 (en) Data recommendation method and apparatus, computer device, and storage medium
CN112434151A (zh) 一种专利推荐方法、装置、计算机设备及存储介质
CN111818370B (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
CN112149604A (zh) 视频特征提取模型的训练方法、视频推荐方法及装置
Rawat et al. A comprehensive study on recommendation systems their issues and future research direction in e-learning domain
Li et al. From edge data to recommendation: A double attention-based deformable convolutional network
CN116823410A (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN113408282B (zh) 主题模型训练和主题预测方法、装置、设备及存储介质
CN115439770A (zh) 一种内容召回方法、装置、设备及存储介质
CN113076453A (zh) 域名分类方法、设备及计算机可读存储介质
US20200226159A1 (en) System and method of generating reading lists
CN114827654B (zh) 一种视频搜索方法、装置、设备及存储介质
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
Nedjah et al. Client profile prediction using convolutional neural networks for efficient recommendation systems in the context of smart factories

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40031302

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221117

Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518,101

Patentee after: Shenzhen Yayue Technology Co.,Ltd.

Address before: 35th floor, Tencent building, Keji Zhongyi Road, high tech Zone, Nanshan District, Shenzhen City, Guangdong Province

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.