CN110263242A - 内容推荐方法、装置、计算机可读存储介质和计算机设备 - Google Patents
内容推荐方法、装置、计算机可读存储介质和计算机设备 Download PDFInfo
- Publication number
- CN110263242A CN110263242A CN201910009086.7A CN201910009086A CN110263242A CN 110263242 A CN110263242 A CN 110263242A CN 201910009086 A CN201910009086 A CN 201910009086A CN 110263242 A CN110263242 A CN 110263242A
- Authority
- CN
- China
- Prior art keywords
- recommendation
- user
- target
- history
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种内容推荐方法、装置、计算机可读存储介质和计算机设备,方法包括:获取目标推荐内容的第一特征;第一特征根据目标推荐内容的种子用户的用户特征数据得到;根据第一特征确定目标推荐内容在类别集合中所属的目标类别;类别集合中的类别,根据历史推荐内容的第二特征对历史推荐内容聚类得到;第二特征根据历史推荐内容的点击用户的用户特征数据得到;确定目标类别下的推荐预测模型;推荐预测模型根据目标类别下的历史推荐内容的第二特征训练得到;根据候选用户集合中各候选用户的用户特征数据,通过推荐预测模型从候选用户集合中筛选目标用户,推荐目标推荐内容。本申请提供的方案可以提高推荐准确率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种内容推荐方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着计算机技术的飞速发展,越来越多的内容需要通过计算机处理来获取,再通过网络进行传输,而且越来越多的场景下需要对用户进行内容推荐。比如新闻、视频或者广告的推荐。
然而,目前的内容推荐方式依赖于内容提供方对待推荐内容的描述,来选择目标用户进行推荐,在待推荐内容描述不够详尽的时候往往准确地进行推荐,导致内容推荐的准确率低下。
发明内容
基于此,有必要针对目前内容推荐的准确率低下的技术问题,提供一种内容推荐方法、装置、计算机可读存储介质和计算机设备。
一种内容推荐方法,包括:
获取目标推荐内容的第一特征;所述第一特征根据所述目标推荐内容的种子用户的用户特征数据得到;
根据所述第一特征确定所述目标推荐内容在类别集合中所属的目标类别;所述类别集合中的类别,根据历史推荐内容的第二特征对所述历史推荐内容聚类得到;所述第二特征根据所述历史推荐内容的点击用户的用户特征数据得到;
确定所述目标类别下的推荐预测模型;所述推荐预测模型根据所述目标类别下的历史推荐内容的第二特征训练得到;
根据候选用户集合中各候选用户的用户特征数据,通过所述推荐预测模型从所述候选用户集合中筛选目标用户,推荐所述目标推荐内容。
一种内容推荐装置,包括:
获取模块,用于获取目标推荐内容的第一特征;所述第一特征根据所述目标推荐内容的种子用户的用户特征数据得到;
确定模块,用于根据所述第一特征确定所述目标推荐内容在类别集合中所属的目标类别;所述类别集合中的类别,根据历史推荐内容的第二特征对所述历史推荐内容聚类得到;所述第二特征根据所述历史推荐内容的点击用户的用户特征数据得到;确定所述目标类别下的推荐预测模型;所述推荐预测模型根据所述目标类别下的历史推荐内容的第二特征训练得到;
推荐模块,用于根据候选用户集合中各候选用户的用户特征数据,通过所述推荐预测模型从所述候选用户集合中筛选目标用户,推荐所述目标推荐内容。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述内容推荐方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述内容推荐方法的步骤。
上述内容推荐方法、装置、计算机可读存储介质和计算机设备,对于一个待推荐的目标推荐内容,通过该目标推荐内容的种子用户的用户特征数据来表征该目标推荐内容的特征,不再依赖于内容提供方提供的描述信息;继而根据该特征确定目标推荐内容在类别集合中所属的目标类别,再确定目标类别下的推荐预测模型,以根据候选用户集合中各候选用户的用户特征数据,通过这些推荐预测模型从候选用户集合中筛选目标用户进行推荐,提高了内容推荐的准确性。而且,其中类别集合包括的类别,根据历史推荐内容的第二特征对历史推荐内容聚类得到,推荐预测模型也是根据目标类别下的历史推荐内容的第二特征训练得到,该第二特征是根据历史推荐内容的点击用户的用户特征数据得到,也就是说分类类别和模型训练都是根据实际用户而非种子用户的特征得到,实际用户更能够反映推荐内容在实际推荐中的受众特征,从而提高了推荐内容分类的准确性,进一步提高了内容推荐的准确性。
附图说明
图1为一个实施例中内容推荐方法的应用环境图;
图2为一个实施例中内容推荐方法的流程示意图;
图3为一个实施例中对历史推荐内容进行聚类的原理示意图;
图4为一个实施例中训练类别预测模型的原理示意图;
图5为一个实施例中进行推荐预测的原理示意图;
图6为一个实施例中内容推荐方法的原理示意图;
图7为一个实施例中展示推荐内容的界面示意图;
图8为一个实施例中内容推荐装置的结构框图;
图9为另一个实施例中内容推荐装置的结构框图;
图10为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中内容推荐方法的应用环境图。参照图1,该内容推荐方法应用于内容推荐系统。该内容推荐系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端110和服务器120均可独立用于执行该内容推荐方法,终端110和服务器120也可协同用于执行该内容推荐方法。
如图2所示,在一个实施例中,提供了一种内容推荐方法。本实施例主要以该方法应用于计算机设备来举例说明,该计算机设备具体可以是上述图1中的终端110或服务器120。参照图2,该内容推荐方法具体包括如下步骤:
S202,获取目标推荐内容的第一特征;第一特征根据目标推荐内容的种子用户的用户特征数据得到。
其中,目标推荐内容是待向用户推荐的内容。内容具体可以是推广信息、应用程序、视频、音频、新闻或者商品等。其中,推广信息具体可以是广告等。举例说明,目标推荐内容具体可以是目标广告,目标广告是指尚未进行投放而正在挑选目标用户来进行投放的广告。
目标推荐内容的种子用户是专门为目标推荐内容挑选的相关度高的用户。理论上认为目标推荐内容曝光给目标推荐内容的种子用户时,目标推荐内容的种子用户大概率会进一步点击查看该目标推荐内容。其中,曝光是指用户收到目标推荐内容的推荐并且浏览到该目标推荐内容的场景,进一步点击查看是指用户在浏览目标推荐内容的基础上点击查看该目标推荐内容的场景。
用户特征数据是反映用户特性的数据。用户特征数据包括用户行为数据。用户行为数据是反映用户行为特征的数据。用户行为数据比如社交行为数据等。社交行为数据比如社交会话数据、社交消息发布数据或者社交消息评论信息等。用户特征数据还可包括用户基础数据。用户基础数据是反映用户基础属性的数据。用户基础数据比如性别、年龄或者学历等。
具体地,计算机设备可确定目标推荐内容的种子用户,获取这些种子用户的用户特征数据,根据这些用户特征数据计算得到一个特征数据,将该特征数据作为目标推荐内容的第一特征,来表征目标推荐内容的特性。
可以理解,由于目标推荐内容的种子用户,是还未推荐该目标推荐内容时,根据先验知识和经验挑选出来的、大概率会对该目标推荐内容感兴趣,也就是大概率会进一步点击查看该目标推荐内容的用户。那么在该目标推荐内容的描述信息不准确或者没有描述信息的场景下,该目标推荐内容的种子用户的特征能够在一定程度上反映出该目标推荐内容的特征,故在本实施例中根据目标推荐内容的种子用户的用户特征数据得到目标推荐内容的第一特征。
S204,根据第一特征确定目标推荐内容在类别集合中所属的目标类别;类别集合中的类别,根据历史推荐内容的第二特征对历史推荐内容聚类得到;第二特征根据历史推荐内容的点击用户的用户特征数据得到。
可以理解,类别集合是对历史推荐内容进行分类得到的类别的集合。对目标推荐内容的分类即为将目标推荐内容分类为该类别集合中的其中一个类别。
其中,历史推荐内容是指已经进行过推荐且收集到用户反馈的推荐内容。对历史推荐内容进行分类的依据是历史推荐内容的第二特征,历史推荐内容的第二特征则根据历史推荐内容的点击用户的用户特征数据得到。历史推荐内容的点击用户,是历史推荐内容在推荐后点击查看该历史推荐内容的用户。历史推荐内容的点击用户是该历史推荐内容的实际用户。
可以理解,虽然历史推荐内容的种子用户的特征可以在一定程度上反映历史推荐内容的特征,但是历史推荐内容的种子用户是在历史推荐内容尚未推荐时挑选的用户,并非实际的用户,故种子用户还是可能存在一定的偏差。
举例说明,1)目标广告为租房网站时,种子用户可能为该网站会员,然而往往这些用户已经租到房子进而不再对该广告感兴趣;2)目标广告为汽车广告时,广告方可能收集多家汽车维修店的会员作为种子用户,由于线下的收集受到了地理位置的影响,可能所有的种子用户均来自一个城市,城市信息构成一个极具区分度的特征,导致最终我们找到的与种子用户相似的用户只是该城市的居民,而与汽车无关。类似的偏差导致人工挑选的种子用户不能准确反映出对目标广告感兴趣的人群从而导致与种子用户相似的人群也不一定对目标广告感兴趣。
而历史推荐内容的点击用户是历史推荐内容在推荐后真实的受众,那么可以认为历史推荐内容的点击用户的特征更能反映历史推荐内容的特征,故本实施例中,对历史推荐内容进行分类的依据是历史推荐内容的第二特征,历史推荐内容的第二特征则根据历史推荐内容的点击用户的用户特征数据得到。
具体地,计算机设备可通过训练完成的、具有分类能力的机器学习模型对目标推荐内容进行分类。通过机器学习模型进行分类的具体步骤,以及机器学习模型的训练步骤可参考后续实施例。
在另外的实施例中,计算机设备还可对类别集合中的每个类别分别设置相应的类别特征,将目标推荐内容的第一特征与各类别的类别特征进行特征比较,以从这些类别中找出目标推荐内容所属的目标类别,也就是特征相似度最高的那个类别。
S206,确定目标类别下的推荐预测模型;推荐预测模型根据目标类别下的历史推荐内容的第二特征训练得到。
其中,推荐预测模型是通过样本学习具备推荐预测能力的机器学习模型。机器学习英文全称为Machine Learning,简称ML。机器学习模型可采用神经网络模型、支持向量机、逻辑回归模型、随机森林模型或者梯度提升树模型等。
可以理解,在根据历史推荐内容的第二特征对历史推荐内容聚类后,会得到多个历史推荐内容组,每个历史推荐内容组对应一种类别。那么,在一个类别下,存在至少一个的历史推荐内容,而每个历史推荐内容均存在点击用户和浏览用户,即可根据该类别下的历史推荐内容的点击用户和浏览用户的用户特征数据,训练推荐预测模型来预测用户是否会点击查看属于该类别的推荐内容。
其中,历史推荐内容的点击用户,是历史推荐内容在推荐后点击查看该历史推荐内容的用户。历史推荐内容的浏览用户,是历史推荐内容在推荐后仅浏览而未点击查看该历史推荐内容的用户。
具体地,计算机设备对于每个类别,根据该类别下所有历史推荐内容的点击用户和浏览用户统一训练一个推荐预测模型。这样,计算机设备在确定目标类别下的推荐预测模型时,即查找该类别对应训练的推荐预测模型。
计算机设备也可对于每个类别,根据该类别下各历史推荐内容的点击用户和浏览用户,分别训练各历史推荐内容相应的推荐预测模型。这样,计算机设备在确定目标类别下的推荐预测模型时,即查找该类别对应训练的推荐预测模型,也就是属于该类别的各历史推荐内容各自对应的推荐预测模型。
S208,根据候选用户集合中各候选用户的用户特征数据,通过推荐预测模型从候选用户集合中筛选目标用户,推荐目标推荐内容。
其中,候选用户集合中的候选用户是待确定是否对其推荐目标推荐内容的用户。候选用户可以是任意的用户或者以任意方式挑选的用户。候选用户也可以是与目标推荐内容的种子用户存在社交关系的用户。
具体地,计算机设备可直接将候选用户的用户特征数据输入推荐预测模型,通过推荐预测模型对用户特征数据进行处理,得到该候选用户的点击概率,也就是候选用户会点击查看目标推荐内容的概率;计算机设备可将候选用户的用户特征数据向量化后输入推荐预测模型,通过推荐预测模型对用户特征数据进行处理,得到该候选用户的点击概率。输入推荐预测模型的数据的格式取决于模型训练时输入数据的格式。
进一步地,计算机设备在通过推荐预测模型得到候选用户集合中各候选用户的点击概率后,可筛选出点击概率达到预设概率阈值的候选用户作为目标用户,向这些目标用户推荐目标推荐内容。预设概率阈值是预先设置的概率分界值,并认为当候选用户的点击概率小于该预设概率阈值,候选用户不太可能会点击查看目标推荐内容。
计算机设备也可将候选用户集合中各候选用户按照相应的点击概率顺序排序,相应的点击概率高的候选用户排序靠前,相应的点击概率低的用户排序靠后。再从排序的候选用户的首个候选用户起选取预设比例的候选用户作为目标用户,向这些目标用户推荐目标推荐内容。
上述内容推荐方法,对于一个待推荐的目标推荐内容,通过该目标推荐内容的种子用户的用户特征数据来表征该目标推荐内容的特征,不再依赖于内容提供方提供的描述信息;继而根据该特征确定目标推荐内容在类别集合中所属的目标类别,再确定目标类别下的推荐预测模型,以根据候选用户集合中各候选用户的用户特征数据,通过这些推荐预测模型从候选用户集合中筛选目标用户进行推荐,提高了内容推荐的准确性。而且,其中类别集合包括的类别,根据历史推荐内容的第二特征对历史推荐内容聚类得到,推荐预测模型也是根据目标类别下的历史推荐内容的第二特征训练得到,该第二特征是根据历史推荐内容的点击用户的用户特征数据得到,也就是说分类类别和模型训练都是根据实际用户而非种子用户的特征得到,实际用户更能够反映推荐内容在实际推荐中的受众特征,从而提高了推荐内容分类的准确性,进一步提高了内容推荐的准确性。
在一个实施例中,获取目标推荐内容的第一特征,包括:确定目标推荐内容和为目标推荐内容挑选的种子用户;将各种子用户的用户特征数据向量化,得到各种子用户的特征向量;根据各特征向量计算得到目标推荐内容的第一特征。
其中,向量是用于将其他形式的数据以数学形式表达的数据。比如,文本形式的“XXX”表示为数学形式“[0 0 0 1 0 0 0 0 0 0 0...]”,此时,“[0 0 0 1 0 0 0 0 0 00...]”即为“XXX”的向量。可以理解,这里不限定将其他形式的数据转换为何种表示的向量,只要能够将其他形式的数据进行数学化表示即可。
可以理解,目标推荐内容的提供者在提供目标推荐内容时,会同时提供该目标推荐内容的种子用户。当然,目标推荐内容的提供者在提供目标推荐内容时,也可提供该目标推荐内容的描述信息,计算机设备再选取与该描述信息相关度高的用户作为目标推荐内容的种子用户。
具体地,计算机设备可获取目标推荐内容和为目标推荐内容挑选的种子用户,再收集各种子用户的用户特征数据,这些用户特征数据具体可以是文本形式的数据。计算机设备再将文本形式的用户特征数据向量化,得到特征向量。
进一步地,计算机设备可根据各种子用户的特征向量计算得到一个目标特征向量,作为目标推荐内容的第一特征。其中,可以是对各特征向量求取平均向量作为目标特征向量;也可对各特征向量求取加权平均向量作为目标向量;还可以是对各特征向量求取平均向量并进行线性运算后作为目标特征向量等。
在一个具体的实施例中,目标推荐内容为at,该目标推荐内容的种子用户的集合为Z(at),每个种子用户的特征向量为Vu(为u∈Z(at)),那么目标推荐内容的第一特征为:
上述公式(1)的意义在于用目标推荐内容所有种子用户的平均特征向量来表征该目标推荐内容的特征。
在本实施例中,通过目标推荐内容所有种子用户的平均特征向量来表征该目标推荐内容的特征,由于种子用户的特征向量总是可以通过用户特征数据计算出来,在目标推荐内容的描述信息不够详尽的情况下,也能够表示目标推荐内容的特征,从而进行后续的精确推荐。
在一个实施例中,根据第一特征确定目标推荐内容在类别集合中所属的目标类别,包括:将第一特征输入类别预测模型;类别预测模型以历史推荐内容的第一特征为模型输入、以历史推荐内容所属的类别为训练标签训练得到;历史推荐内容所属的类别根据历史内容的第二特征得到;通过类别预测模型对第一特征进行处理,得到目标推荐内容在类别集合中所属的目标类别。
其中,类别预测模型是通过样本学习具备类别预测能力的机器学习模型。机器学习英文全称为Machine Learning,简称ML。机器学习模型可采用神经网络模型、支持向量机、逻辑回归模型、随机森林模型或者梯度提升树模型等。
可以理解,按照历史推荐内容的第二特征对历史推荐内容进行分类,可以更准确地对历史推荐内容进行分类。但是,由于目标推荐内容是尚未进行推荐,也就不存在点击用户,那么需要以历史推荐内容的第一特征为模型输入、以历史推荐内容所属的类别为训练标签训练得到类别预测模型,通过该类别预测模型来根据目标推荐内容的第一特征对目标推荐类型进行分类。
在一个实施例中,类别预测模型的训练步骤包括:获取历史推荐内容集合;根据历史推荐内容集合中各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;类别集合为多个类别的集合;将各历史推荐内容的第一特征作为训练样本,并将各历史推荐内容在聚类后所属的类别作为相应的训练标签;根据训练样本和相应的训练标签,训练得到类别预测模型。
其中,历史推荐内容集合包括的历史推荐内容均是已经进行过推荐且收集到用户反馈的推荐内容。历史推荐内容比如历史推荐的新闻、视频或者广告等。那么可以理解,对于历史推荐内容,能够确定该历史推荐内容的点击用户,从而可以得到历史推荐内容的第二特征。
具体地,计算机设备可事先收集多个历史推荐内容,得到历史推荐内容集合;再确定历史推荐内容集合中各历史推荐内容的第二特征,根据历史推荐内容集合中各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个历史推荐内容组。这样,每个历史推荐内容组对应一种类别,那么计算机设备也就得到了对历史推荐内容聚类的多个类别。从而,计算机设备可以认为各历史推荐内容划分至的历史推荐内容组的类别,即为该历史推荐内容所属的类别。
进一步地,计算机设备可将各历史推荐内容的第一特征作为训练样本,并将各历史推荐内容在聚类后所属的类别作为相应的训练标签;根据训练样本和相应的训练标签,训练得到根据第一特征进行分类的类别预测模型。以用于对目标推荐内容进行分类。
其中,历史推荐内容的第一特征和第二特征都是历史推荐内容的特征,但是基于不同的角度反映的特征。历史推荐内容的第一特征是从种子用户的角度反映的特征,根据历史推荐内容的种子用户的用户特征数据得到;历史推荐内容的第二特征是从点击用户的角度反映的特征,根据历史推荐内容的点击用户的用户特征数据得到。
在一个实施例中,根据历史推荐内容集合中各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别,包括:确定历史推荐内容集合中各历史推荐内容的点击用户;将各点击用户的用户特征数据向量化,得到各点击用户的特征向量;由各历史推荐内容的点击用户的特征向量得到各历史推荐内容的第二特征;根据各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;每个类别至少包括一个历史推荐内容。
其中,历史推荐内容的点击用户,是历史推荐内容在推荐后点击查看该历史推荐内容的用户。可以理解,历史推荐内容被推荐至用户后,用户即可浏览该历史推荐内容,当用户浏览该历史推荐内容后对该历史推荐内容感兴趣进一步点击查看该历史推荐内容,那么该用户即为该历史推荐内容的点击用户。
比如,将广告A投放至用户1的社交平台,用户1在浏览广告A,并对广告A产生兴趣,点击广告A进一步查看,那么用户1即为广告A的点击用户。
具体地,计算机设备可对历史推荐内容集合中的每一个历史推荐内容,分别确定其相应的点击用户,然后获取这些点击用户各自的用户特征数据,将各点击用户的用户特征数据向量化,得到各点击用户的特征向量。
进一步地,对于每个历史推荐内容,计算机设备可根据该历史推荐内容的点击用户的特征向量得到一个目标特征向量,作为该历史推荐内容的第二特征。其中,可以是对各特征向量求取平均向量作为目标特征向量;也可对各特征向量求取加权平均向量作为目标向量;还可以是对各特征向量求取平均向量并进行线性运算后作为目标特征向量等。计算机设备再采用聚类算法根据各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;每个类别至少包括一个历史推荐内容。其中,聚类算法比如无监督分类算法K-Means等。
在一个具体的实施例中,历史推荐内容为ai,该历史推荐内容的点击用户的集合为U1(ai),每个种子用户的特征向量为Vu(为u∈U1(ai)),那么目标推荐内容的第二特征为:
上述公式(2)的意义在于用历史推荐内容所有点击用户的平均特征向量来表征该历史推荐内容的特征。
举例说明,图3示出了一个实施例中对历史推荐内容进行聚类的原理示意图。参考图3,假设存在n个历史推荐内容a1、a2、a3…an;历史推荐内容a1的点击用户的集合为U1(a1),历史推荐内容a2的点击用户的集合为U1(a2),历史推荐内容a3的点击用户的集合为U1(a3)…历史推荐内容an的点击用户的集合为U1(an)。利用前述公式(2)计算出每个历史推荐内容的第二特征然后通过K-Means无监督学习得到历史推荐内容的分类,得到K个类别,每个类别包含至少一个历史推荐内容。这里采用C(ai)表示历史推荐内容ai所对应的类别且C(ai)∈[1,K]。在本实施例中,C(a1)=1、C(a2)=2、C(a3)=1…C(an)=2,也就是历史推荐内容a1和a3被归为类别1,而历史推荐内容a2和an被归为类别2。
在本实施例中,通过历史推荐内容所有点击用户的平均特征向量来表征该历史推荐内容的特征,再基于该特征对历史推荐内容进行分类。这样,由于点击用户的特征向量总是可以通过用户特征数据计算出来,而且点击用户是历史推荐内容的实际用户,能够更准确地反映历史推荐内容的受众特征,从而使得历史推荐内容的分类更准确。
计算机设备在训练类别预测模型时,将历史推荐内容的第一特征作为训练样本,也就是将历史推荐内容的第一特征作为类别预测模型的输入数据;将历史推荐内容在聚类后所属的类别作为相应的训练标签,也就是将历史推荐内容的实际类别作为训练标签;根据类别预测模型的输出得到历史推荐内容的预测类别,然后按照最小化预测类别与实际类别的差异的方向调整类别预测模型的模型参数,直至满足模型训练结束条件为止。
举例说明,图4示出了一个实施例中训练类别预测模型的原理示意图。参考图4,假设存在n个历史推荐内容a1、a2、a3…an,历史推荐内容a1和a3被归为类别1,而历史推荐内容a2和an被归为类别2;历史推荐内容a1的种子用户的集合为Z(a1),历史推荐内容a2的种子用户的集合为Z(a2),历史推荐内容a3的种子用户的集合为Z(a3)…历史推荐内容an的种子用户的集合为Z(an);利用前述公式(1)计算出每个历史推荐内容的第一特征将每个历史推荐内容的第一特征作为模型训练输入数据,将该历史推荐内容所属的类别作为训练标签,构成<输入,标签>组:再根据这些<输入,标签>组基于随机森林分类训练得到类别预测模型Mrf。
上述实施例中,基于历史推荐内容点击用户的特征来进行聚类,将聚类后所属的类别作为实际类别,继而将历史推荐内容种子用户的特征作为模型训练的输入,以训练出对推荐内容种子用户的特征进行分类的模型,从而可以更好的对没有点击用户的目标推荐内容进行分类,从而使得后续的推荐更准确。
具体地,计算机设备可获取训练完成的类别预测模型,将目标推荐内容的第一特征输入类别预测模型,通过类别预测模型对第一特征进行处理,得到目标推荐内容在类别集合中所属的目标类别。其中,类别预测模型可直接输出预测的目标类别,比如类别1;也可以输出目标推荐内容在类别集合中属于各目标类别的概率,然后选取对应概率最大的类别作为目标类别。
举例说明,图5示出了一个实施例中进行推荐预测的原理示意图。参考图5,对于目标推荐内容目标推荐内容的种子用户的集合为Z(at),利用前述公式(1)计算出目标推荐内容的第一特征将目标推荐内容的第一特征输入训练得到类别预测模型Mrf,得到目标推荐内容所属的目标类别C(at)=1。
上述实施例中,利用基于机器学习训练得到的类别预测模型对目标推荐内容进行类别预测,利用机器学习模型强大的学习和表示能力进行分类学习,所训练得到的机器学习模型对目标推荐内容进行类别预测,较传统方法对目标推荐内容进行类别预测的效果更好。
在一个实施例中,确定目标类别下的推荐预测模型,包括:查询属于目标类别的历史推荐内容;确定查询到的历史推荐内容所对应的推荐预测模型;其中,查询到的历史推荐内容所对应的推荐预测模型,根据查询到的历史推荐内容的浏览用户和点击用户的用户特征数据训练得到。
具体地,计算机设备在确定目标推荐内容所属的目标类别后,可查询属于该目标类别的历史推荐内容,再获取这些历史推荐内容各自相应的推荐预测模型。在本实施例中,计算机设备事先对每个历史推荐内容,分别根据该历史推荐内容的浏览用户和点击用户的用户特征数据训练得到该历史推荐内容对应的推荐预测模型。
可以理解,历史推荐内容被推荐至用户后,用户在浏览后,要么点击查看,要么不点击查看,也就对应了该历史推荐内容的浏览用户和点击用户这两类用户。根据这两类用户的用户特征进行模型训练,训练得到的模型可以用于预测用户对与该历史推荐内容相类似的推荐内容的点击行为,那么也就可以认为该模型可以用于预测用户对该历史推荐内容所属类别下的推荐内容的点击行为。
在一个实施例中,历史推荐内容所对应的推荐预测模型的训练步骤包括:确定历史推荐内容的浏览用户和点击用户;将浏览用户的用户特征数据作为负训练样本,并将点击用户的用户特征数据作为正训练样本;根据负训练样本和正训练样本,训练得到历史推荐内容所对应的推荐预测模型。
其中,推荐预测模型为二分类机器学习模型。具体地,计算机设备可对历史推荐内容集合中的每一个历史推荐内容,分别确定其相应的点击用户,然后获取这些点击用户各自的用户特征数据,将各点击用户的用户特征数据向量化,得到各点击用户的特征向量。对历史推荐内容集合中的每一个历史推荐内容,分别确定其相应的浏览用户,然后获取这些浏览用户各自的用户特征数据,将各浏览用户的用户特征数据向量化,得到各浏览用户的特征向量。
进一步地,对于每个历史推荐内容,计算机设备可将该历史推荐内容的浏览用户的特征向量作为负训练样本,并将该历史推荐内容的点击用户的特征向量作为正训练样本,根据负训练样本和正训练样本,训练得到该历史推荐内容所对应的推荐预测模型。
继续参考图3,历史推荐内容a1的浏览用户的集合为U0(a1),历史推荐内容a2的浏览用户的集合为U0(a2),历史推荐内容a3的浏览用户的集合为U0(a3)…历史推荐内容an的浏览用户的集合为U0(an)。对于历史推荐内容a1,将U0(a1)中各浏览用户的特征向量作为负样本,将U1(a1)中各点击用户的特征向量作为正样本,基于LR(Linear Regression,线性回归)模型训练得到历史推荐内容a1相应的推荐预测模型M1;对于历史推荐内容a2,将U0(a2)中各浏览用户的特征向量作为负样本,将U1(a2)中各点击用户的特征向量作为正样本,基于LR模型训练得到历史推荐内容a2相应的推荐预测模型M2;对于历史推荐内容a3,将U0(a3)中各浏览用户的特征向量作为负样本,将U1(a3)中各点击用户的特征向量作为正样本,基于LR模型训练得到历史推荐内容a3相应的推荐预测模型M3…对于历史推荐内容an,将U0(an)中各浏览用户的特征向量作为负样本,将U1(an)中各点击用户的特征向量作为正样本,基于LR模型训练得到历史推荐内容an相应的推荐预测模型Mn。
在本实施例中,基于历史推荐内容的实际用户的用户特征来训练用户点击行为预测的机器学习模型,从而可以对候选用户的点击行为进行预测,以提高推荐的准确率。
继续参考图5,计算机设备在得到目标推荐内容所属的目标类别C(at)=1后,可查询属于C(at)=1的历史推荐内容a1、a3…am,再查询a1、a3…am相应的推荐预测模型M1、M3…Mm,以通过这模型对候选用户进行点击行为预测。
上述实施例中,对于每历史推荐内容均会相应训练一个推荐预测模型,这样再得到目标推荐内容的分类结果以后,即找到属于该分类结果的历史推荐内容,以获得相应的推荐预测模型,后续即可通过这些推荐预测模型对候选用户进行预测,通过机器学习模型对候选用户进行点击行为预测,较传统方法对候选用户进行点击行为预测的效果更好。
在一个实施例中,根据候选用户集合中各候选用户的用户特征数据,通过推荐预测模型从候选用户集合中筛选目标用户,推荐目标推荐内容,包括:获取候选用户集合中各候选用户的用户特征数据;将各候选用户的用户特征数据向量化后输入推荐预测模型,得到各候选用户的点击目标推荐内容的概率;根据各候选用户的概率从候选用户集合中筛选出目标用户;向目标用户推荐目标推荐内容。
可以理解,计算机设备可对每个待推荐的内容挑选候选用户,构成该内容相应的候选用户集合。比如,基于目标推荐内容的种子用户的社交关系链进行社交扩散,将与种子用户存在社交关系的用户作为候选用户。与种子用户存在社交关系的用户,比如,基于某个社交平台与种子用户存在好友关系的用户。
具体地,对于目标推荐内容,计算机设备获取该目标推荐内容候选用户集合中各候选用户的用户特征数据,将各候选用户的用户特征数据向量化,然后将向量化得到的特征向量输入推荐预测模型,得到各候选用户的点击目标推荐内容的概率。
在一个实施例中,目标类别下的推荐预测模型的数量为一个。每个候选用户对应存在一个概率,那这个概率即为该候选用户的点击目标推荐内容的概率。
在一个实施例中,目标类别下的推荐预测模型的数量多余一个。将各候选用户的用户特征数据输入推荐预测模型,得到各候选用户的点击目标推荐内容的概率,包括:对于每个候选用户,将候选用户的用户特征数据分别输入多个推荐预测模型,得到多个预测子概率;将多个预测子概率的平均概率,作为候选用户的点击目标推荐内容的概率。
具体地,目标类别下的推荐预测模型的数量多余一个,那么对于每个候选用户对应存在多个概率,计算机设备可对这些概率求取平均概率作为该候选用户的点击目标推荐内容的概率。
继续参考图5,计算机设备基于目标推荐内容的种子用户进行社交扩散,得到候选用户集合{u1、u2…un},对于每个候选用户ui,将其特征向量分别输入目标类别下的多个推荐预测模型M1、M3…Mm,得到概率 再对这些概率求取平均值,得到候选用户的点击目标推荐内容的概率,也就是候选用户对目标推荐内容感兴趣的得分:
进一步地,计算机设备在通过推荐预测模型得到候选用户集合中各候选用户的概率后,可筛选出概率达到预设概率阈值的候选用户作为目标用户,向这些目标用户推荐目标推荐内容。预设概率阈值是预先设置的概率分界值,并认为当候选用户的概率小于该预设概率阈值,候选用户不太可能会点击查看目标推荐内容。
在本实施例中,在目标类别下存在多个推荐预测模型的数量时,对于多个预测概率求取平均后作为候选用户点击目标推荐内容的概率,提提高了预测的准确率。
当然,在另外的实施例中,计算机设备也可对各候选用户的多个概率求取加权平均值作为点击目标推荐内容的概率;还可以是对各候选用户的多个概率求取平均值并进行线性运算后作为点击目标推荐内容的概率等。
上述实施例中,在找到属于该目标类别的推荐预测模型后,即通过这些推荐预测模型对候选用户进行预测,通过机器学习模型对候选用户进行点击行为预测,较传统方法对候选用户进行点击行为预测的效果更好。
图6示出了一个实施例中内容推荐方法的原理示意图。参考图6,该内容推荐方法包括三个阶段:历史推荐内容分类阶段、目标推荐内容分类模型训练阶段以及候选用户预测阶段。其中前两个阶段可以是离线完成的准备阶段,第三个阶段为线上进行的阶段。
具体地,在历史推荐内容分类阶段,计算机设备可获取历史推荐内容集合,一方面对历史推荐内容集合中的每个历史推荐内容,根据该历史推荐内容的点击用户的用户特征数据求取历史推荐内容的第二特征,再依据历史推荐内容的第二特征对历史推荐内容进行聚类,得到多个类别,以及每个历史推荐内容所属的类别。另一方面对历史推荐内容集合中的每个历史推荐内容,将该历史推荐内容的点击用户的用户特征数据作为正样本,将该历史推荐内容的浏览用户的用户特征数据作为负样本,训练该历史推荐内容相应的推荐预测模型。
在目标推荐内容分类模型训练阶段,计算机设备对历史推荐内容集合中的每个历史推荐内容,根据该历史推荐内容的种子用户的用户特征数据求取历史推荐内容的第一特征,将各历史推荐内容的第一特征作为训练样本,将各历史推荐内容在历史推荐内容分类阶段确定的类别作为训练标签,训练类别预测模型。
在候选用户预测阶段,计算机设备根据目标推荐内容的种子用户的用户特征数据求取目标推荐内容的第一特征,将目标推荐内容的第一特征输入目标推荐内容分类模型训练阶段训练得到的类别预测模型,得到目标推荐内容所属的目标类别,确定该目标类别下的推荐预测模型,通过这些推荐预测模型对候选用户进行打分,该分数即为候选用户对目标推荐内容感兴趣的概率,也就是候选用户点击该目标推荐内容的概率。
在本申请实施例中,通过公式(1)和公式(2)计算的特征向量来表示推荐内容的特征,这在推荐内容描述不充分时,也能够较为准确的把推荐内容抽象为可计算的特征向量表示。通过候选用户预测阶段的分类并采用对应类别的历史推荐内容相应的推荐预测模型计算候选用户的分数,避免了直接拟合种子用户,从而绕开种子用户可能对目标推荐内容不感兴趣的偏差。
通过本申请实施例的方案可以更为精准的找到对目标推荐内容感兴趣进而会点击目标推荐内容的用户。在线上测试的82次目标推荐内容投放中,本申请实施例中的方案相较于现有技术的方案点击率提升约13%。而且,由于本申请实施例中的机器学习模型训练阶段均离线完成,线上仅应用训练好的模型进行分类和打分,故线上计算效率较高,可用于在线目标推荐内容投放任务的计算。
在一个具体的实施例中,本申请实施例中的内容推荐方法应用于社交应用中的内容推荐。向用户推荐的内容展示于社交应用的用户社交页面中供用户浏览以及点击查看。用户社交页面用于展示在社交中产生的内容。在社交中产生的内容具体可以是用户发布内容。用户发布内容具体可以是用户发表的内容,也可以是用户对发表的内容的评论内容,还可以是用户对评论内容的回复内容。
举例说明,社交应用的用户社交页面如微信应用中的朋友圈,朋友圈中可展示用户发表的内容还可展示服务器推荐的广告;社交应用的用户社交页面如QQ应用中的QQ空间,QQ空间中可展示用户发表的内容还可展示服务器推荐的广告;等等。
具体地,对于社交应用的注册用户,在新增推荐内容时(比如广告方发布新广告后),服务器可根据上述实施例中的内容推荐方法,对各注册用户对新增的推荐内容的感兴趣的概率进行预测,以向各注册用户推荐其感兴趣的内容。这样,在注册用户通过终端登录社交应用并浏览用户社交页面时,在用户社交页面展示服务器推荐的内容。比如,在朋友圈的两条用户发布内容之间展示推荐的广告等。当然,服务器也可以在注册用户通过终端登录社交应用并浏览用户社交页面时,实时根据上述实施例中的内容推荐方法,对各注册用户对新增的推荐内容的感兴趣的概率进行预测,以向各注册用户推荐其感兴趣的内容。
举例说明,图7示出了一个实施例中展示推荐内容的界面示意图。参考图7,该界面为用户社交页面,在用户社交页面中展示有用户发布内容710和推荐的内容720。可以理解,当前登录的用户是根据前述实施例中的内容推荐方法,将推荐的内容720作为目标推荐内容筛选出的目标用户,也就就预测当前登录的用户对推荐的内容720感兴趣的概率较大,从而向其推荐并展示。
当然,推荐的内容的展示,也可以是在启动社交应用时的等待界面中进行。或者是通过社交应用提供的推荐内容入口进入的推荐内容页面。该推荐内容页面可专用于展示推荐的内容。
在另外的实施例中,本申请实施例中的内容推荐方法也可以应用于非社交应用的其他应用中的内容推荐。比如游戏应用,在游戏开始页面或者游戏结束页面展示推荐内容。
应该理解的是,虽然上述各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图8所示,在一个实施例中,提供了一种内容推荐装置800。参照图8,该内容推荐装置800包括:获取模块801、确定模块802和推荐模块803。
获取模块801,用于获取目标推荐内容的第一特征;第一特征根据目标推荐内容的种子用户的用户特征数据得到。
确定模块802,用于根据第一特征确定目标推荐内容在类别集合中所属的目标类别;类别集合中的类别,根据历史推荐内容的第二特征对历史推荐内容聚类得到;第二特征根据历史推荐内容的点击用户的用户特征数据得到;确定目标类别下的推荐预测模型;推荐预测模型根据目标类别下的历史推荐内容的第二特征训练得到。
推荐模块803,用于根据候选用户集合中各候选用户的用户特征数据,通过推荐预测模型从候选用户集合中筛选目标用户,推荐目标推荐内容。
在一个实施例中,获取模块801还用于确定目标推荐内容和为目标推荐内容挑选的种子用户;将各种子用户的用户特征数据向量化,得到各种子用户的特征向量;根据各特征向量计算得到目标推荐内容的第一特征。
在一个实施例中,确定模块802还用于将第一特征输入类别预测模型;类别预测模型以历史推荐内容的第一特征为模型输入、以历史推荐内容所属的类别为训练标签训练得到;历史推荐内容所属的类别根据历史内容的第二特征得到;通过类别预测模型对第一特征进行处理,得到目标推荐内容在类别集合中所属的目标类别。
如图9所示,在一个实施例中,内容推荐装置800还包括:训练模块804,用于获取历史推荐内容集合;根据历史推荐内容集合中各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;类别集合为多个类别的集合;将各历史推荐内容的第一特征作为训练样本,并将各历史推荐内容在聚类后所属的类别作为相应的训练标签;根据训练样本和相应的训练标签,训练得到类别预测模型。
在一个实施例中,训练模块804还用于确定历史推荐内容集合中各历史推荐内容的点击用户;将各点击用户的用户特征数据向量化,得到各点击用户的特征向量;由各历史推荐内容的点击用户的特征向量得到各历史推荐内容的第二特征;根据各历史推荐内容的第二特征,对历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;每个类别至少包括一个历史推荐内容。
在一个实施例中,确定模块802还用于查询属于目标类别的历史推荐内容;确定查询到的历史推荐内容所对应的推荐预测模型;其中,查询到的历史推荐内容所对应的推荐预测模型,根据查询到的历史推荐内容的浏览用户和点击用户的用户特征数据训练得到。
在一个实施例中,训练模块804还用于确定历史推荐内容的浏览用户和点击用户;将浏览用户的用户特征数据作为负训练样本,并将点击用户的用户特征数据作为正训练样本;根据负训练样本和正训练样本,训练得到历史推荐内容所对应的推荐预测模型。
在一个实施例中,推荐模块803还用于获取候选用户集合中各候选用户的用户特征数据;将各候选用户的用户特征数据向量化后输入推荐预测模型,得到各候选用户的点击目标推荐内容的概率;根据各候选用户的概率从候选用户集合中筛选出目标用户;向目标用户推荐目标推荐内容。
在一个实施例中,推荐预测模型的数量多余一个。推荐模块803还用于对于每个候选用户,将候选用户的用户特征数据分别输入多个推荐预测模型,得到多个预测子概率;将多个预测子概率的平均概率,作为候选用户的点击目标推荐内容的概率。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图10所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现内容推荐方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行内容推荐方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的内容推荐装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该内容推荐装置的各个程序模块,比如,图8所示的获取模块801、确定模块802和推荐模块803。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的内容推荐方法中的步骤。
例如,图10所示的计算机设备可以通过如图8所示的内容推荐装置800中的获取模块801获取目标推荐内容的第一特征;第一特征根据目标推荐内容的种子用户的用户特征数据得到。通过确定模块802根据第一特征确定目标推荐内容在类别集合中所属的目标类别;类别集合中的类别,根据历史推荐内容的第二特征对历史推荐内容聚类得到;第二特征根据历史推荐内容的点击用户的用户特征数据得到;确定目标类别下的推荐预测模型;推荐预测模型根据目标类别下的历史推荐内容的第二特征训练得到。通过推荐模块803根据候选用户集合中各候选用户的用户特征数据,通过推荐预测模型从候选用户集合中筛选目标用户,推荐目标推荐内容。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述内容推荐方法的步骤。此处内容推荐方法的步骤可以是上述各个实施例的内容推荐方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述内容推荐方法的步骤。此处内容推荐方法的步骤可以是上述各个实施例的内容推荐方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种内容推荐方法,包括:
获取目标推荐内容的第一特征;所述第一特征根据所述目标推荐内容的种子用户的用户特征数据得到;
根据所述第一特征确定所述目标推荐内容在类别集合中所属的目标类别;所述类别集合中的类别,根据历史推荐内容的第二特征对所述历史推荐内容聚类得到;所述第二特征根据所述历史推荐内容的点击用户的用户特征数据得到;
确定所述目标类别下的推荐预测模型;所述推荐预测模型根据所述目标类别下的历史推荐内容的第二特征训练得到;
根据候选用户集合中各候选用户的用户特征数据,通过所述推荐预测模型从所述候选用户集合中筛选目标用户,推荐所述目标推荐内容。
2.根据权利要求1所述的方法,其特征在于,所述获取目标推荐内容的第一特征,包括:
确定目标推荐内容和为所述目标推荐内容挑选的种子用户;
将各种子用户的用户特征数据向量化,得到各种子用户的特征向量;
根据各所述特征向量计算得到所述目标推荐内容的第一特征。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征确定所述目标推荐内容在类别集合中所属的目标类别,包括:
将所述第一特征输入类别预测模型;所述类别预测模型以历史推荐内容的第一特征为模型输入、以所述历史推荐内容所属的类别为训练标签训练得到;所述历史推荐内容所属的类别根据所述历史内容的第二特征得到;
通过所述类别预测模型对所述第一特征进行处理,得到所述目标推荐内容在类别集合中所属的目标类别。
4.根据权利要求3所述的方法,其特征在于,所述类别预测模型的训练步骤包括:
获取历史推荐内容集合;
根据所述历史推荐内容集合中各历史推荐内容的第二特征,对所述历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;所述类别集合为所述多个类别的集合;
将各所述历史推荐内容的第一特征作为训练样本,并将各所述历史推荐内容在聚类后所属的类别作为相应的训练标签;
根据所述训练样本和相应的训练标签,训练得到类别预测模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述历史推荐内容集合中各历史推荐内容的第二特征,对所述历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别,包括:
确定所述历史推荐内容集合中各历史推荐内容的点击用户;
将各点击用户的用户特征数据向量化,得到各点击用户的特征向量;
由各历史推荐内容的点击用户的特征向量得到各历史推荐内容的第二特征;
根据各历史推荐内容的第二特征,对所述历史推荐内容集合中的历史推荐内容进行聚类,得到多个类别;每个类别至少包括一个历史推荐内容。
6.根据权利要求1所述的方法,其特征在于,所述确定所述目标类别下的推荐预测模型,包括:
查询属于所述目标类别的历史推荐内容;
确定查询到的所述历史推荐内容所对应的推荐预测模型;
其中,所述查询到的所述历史推荐内容所对应的推荐预测模型,根据查询到的所述历史推荐内容的浏览用户和点击用户的用户特征数据训练得到。
7.根据权利要求6所述的方法,其特征在于,所述历史推荐内容所对应的推荐预测模型的训练步骤包括:
确定所述历史推荐内容的浏览用户和点击用户;
将所述浏览用户的用户特征数据作为负训练样本,并将所述点击用户的用户特征数据作为正训练样本;
根据所述负训练样本和所述正训练样本,训练得到所述历史推荐内容所对应的推荐预测模型。
8.根据权利要求1所述的方法,其特征在于,所述根据候选用户集合中各候选用户的用户特征数据,通过所述推荐预测模型从所述候选用户集合中筛选目标用户,推荐所述目标推荐内容,包括:
获取候选用户集合中各候选用户的用户特征数据;
将各候选用户的用户特征数据向量化后输入所述推荐预测模型,得到各候选用户的点击所述目标推荐内容的概率;
根据各候选用户的概率从候选用户集合中筛选出目标用户;
向所述目标用户推荐所述目标推荐内容。
9.根据权利要求8所述的方法,其特征在于,所述推荐预测模型的数量多余一个;所述将各候选用户的用户特征数据输入所述推荐预测模型,得到各候选用户的点击所述目标推荐内容的概率,包括:
对于每个候选用户,将所述候选用户的用户特征数据分别输入多个所述推荐预测模型,得到多个预测子概率;
将所述多个预测子概率的平均概率,作为所述候选用户的点击所述目标推荐内容的概率。
10.一种内容推荐装置,包括:
获取模块,用于获取目标推荐内容的第一特征;所述第一特征根据所述目标推荐内容的种子用户的用户特征数据得到;
确定模块,用于根据所述第一特征确定所述目标推荐内容在类别集合中所属的目标类别;所述类别集合中的类别,根据历史推荐内容的第二特征对所述历史推荐内容聚类得到;所述第二特征根据所述历史推荐内容的点击用户的用户特征数据得到;确定所述目标类别下的推荐预测模型;所述推荐预测模型根据所述目标类别下的历史推荐内容的第二特征训练得到;
推荐模块,用于根据候选用户集合中各候选用户的用户特征数据,通过所述推荐预测模型从所述候选用户集合中筛选目标用户,推荐所述目标推荐内容。
11.根据权利要求10所述的装置,其特征在于,所述确定模块还用于将所述第一特征输入类别预测模型;所述类别预测模型以历史推荐内容的第一特征为模型输入、以所述历史推荐内容所属的类别为训练标签训练得到;所述历史推荐内容所属的类别根据所述历史内容的第二特征得到;通过所述类别预测模型对所述第一特征进行处理,得到所述目标推荐内容在类别集合中所属的目标类别。
12.根据权利要求10所述的装置,其特征在于,所述确定模块还用于查询属于所述目标类别的历史推荐内容;确定查询到的所述历史推荐内容所对应的推荐预测模型;其中,所述查询到的所述历史推荐内容所对应的推荐预测模型,根据查询到的所述历史推荐内容的浏览用户和点击用户的用户特征数据训练得到。
13.根据权利要求10所述的装置,其特征在于,所述推荐模块还用于获取候选用户集合中各候选用户的用户特征数据;将各候选用户的用户特征数据输入所述推荐预测模型,得到各候选用户的点击所述目标推荐内容的概率;根据各候选用户的概率从候选用户集合中筛选出目标用户;向所述目标用户推荐所述目标推荐内容。
14.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至9中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至9中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910009086.7A CN110263242B (zh) | 2019-01-04 | 2019-01-04 | 内容推荐方法、装置、计算机可读存储介质和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910009086.7A CN110263242B (zh) | 2019-01-04 | 2019-01-04 | 内容推荐方法、装置、计算机可读存储介质和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263242A true CN110263242A (zh) | 2019-09-20 |
CN110263242B CN110263242B (zh) | 2023-10-20 |
Family
ID=67911650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910009086.7A Active CN110263242B (zh) | 2019-01-04 | 2019-01-04 | 内容推荐方法、装置、计算机可读存储介质和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263242B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008332A (zh) * | 2019-12-03 | 2020-04-14 | 腾讯科技(深圳)有限公司 | 内容项推荐方法、装置、服务器以及存储介质 |
CN111010595A (zh) * | 2019-12-25 | 2020-04-14 | 广州欢聊网络科技有限公司 | 一种新节目推荐的方法及装置 |
CN111079000A (zh) * | 2019-11-25 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 内容处理方法、装置、设备及存储介质 |
CN111353825A (zh) * | 2020-03-10 | 2020-06-30 | 北京爱笔科技有限公司 | 一种消息传输方法及装置 |
CN111680219A (zh) * | 2020-06-09 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 内容推荐方法、装置、设备及可读存储介质 |
CN111737305A (zh) * | 2020-05-27 | 2020-10-02 | 上海晶赞融宣科技有限公司 | 信息推送中人群特征确定方法及装置、可读存储介质 |
CN112150199A (zh) * | 2020-09-21 | 2020-12-29 | 北京小米松果电子有限公司 | 垂类特征的确定方法及装置、存储介质 |
CN112148973A (zh) * | 2020-09-04 | 2020-12-29 | 京东数字科技控股股份有限公司 | 一种信息推送的数据处理方法及装置 |
CN112287236A (zh) * | 2020-11-19 | 2021-01-29 | 每日互动股份有限公司 | 文本消息的推送方法、装置、计算机设备及存储介质 |
CN112364937A (zh) * | 2020-11-30 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 用户类别确定方法及装置、推荐内容确定方法、电子设备 |
WO2021081914A1 (zh) * | 2019-10-31 | 2021-05-06 | 深圳市欢太科技有限公司 | 推送对象确定方法、装置、终端设备及存储介质 |
CN112765478A (zh) * | 2021-03-12 | 2021-05-07 | 北京百度网讯科技有限公司 | 用于推荐内容的方法、装置、设备、介质和程序产品 |
CN112967100A (zh) * | 2021-04-02 | 2021-06-15 | 杭州网易云音乐科技有限公司 | 相似人群扩展方法、装置、计算设备以及介质 |
CN113407772A (zh) * | 2020-03-16 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 视频推荐模型的生成方法、视频推荐方法、装置 |
CN113420222A (zh) * | 2021-07-08 | 2021-09-21 | 咪咕文化科技有限公司 | 内容推荐方法及装置 |
CN113449177A (zh) * | 2020-03-27 | 2021-09-28 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
CN113672804A (zh) * | 2021-08-02 | 2021-11-19 | 上海浦东发展银行股份有限公司 | 推荐信息生成方法、系统、计算机设备及存储介质 |
EP3916587A1 (en) * | 2020-05-27 | 2021-12-01 | Beijing Baidu Netcom Science And Technology Co. Ltd. | Method and apparatus for recommending multimedia resource, electronic device and storage medium |
CN114764603A (zh) * | 2022-05-07 | 2022-07-19 | 支付宝(杭州)信息技术有限公司 | 针对用户分类模型、业务预测模型确定特征的方法及装置 |
CN116596576A (zh) * | 2023-07-17 | 2023-08-15 | 深圳须弥云图空间科技有限公司 | 目标推荐方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965890A (zh) * | 2015-06-17 | 2015-10-07 | 深圳市腾讯计算机系统有限公司 | 广告推荐的方法和装置 |
EP3136265A1 (en) * | 2015-08-28 | 2017-03-01 | Yandex Europe AG | Method and apparatus for generating a recommended content list |
-
2019
- 2019-01-04 CN CN201910009086.7A patent/CN110263242B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965890A (zh) * | 2015-06-17 | 2015-10-07 | 深圳市腾讯计算机系统有限公司 | 广告推荐的方法和装置 |
EP3136265A1 (en) * | 2015-08-28 | 2017-03-01 | Yandex Europe AG | Method and apparatus for generating a recommended content list |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021081914A1 (zh) * | 2019-10-31 | 2021-05-06 | 深圳市欢太科技有限公司 | 推送对象确定方法、装置、终端设备及存储介质 |
CN111079000A (zh) * | 2019-11-25 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 内容处理方法、装置、设备及存储介质 |
CN111008332B (zh) * | 2019-12-03 | 2023-04-07 | 深圳市雅阅科技有限公司 | 内容项推荐方法、装置、服务器以及存储介质 |
CN111008332A (zh) * | 2019-12-03 | 2020-04-14 | 腾讯科技(深圳)有限公司 | 内容项推荐方法、装置、服务器以及存储介质 |
CN111010595A (zh) * | 2019-12-25 | 2020-04-14 | 广州欢聊网络科技有限公司 | 一种新节目推荐的方法及装置 |
CN111353825A (zh) * | 2020-03-10 | 2020-06-30 | 北京爱笔科技有限公司 | 一种消息传输方法及装置 |
CN111353825B (zh) * | 2020-03-10 | 2024-01-12 | 北京爱笔科技有限公司 | 一种消息传输方法及装置 |
CN113407772B (zh) * | 2020-03-16 | 2023-12-26 | 北京达佳互联信息技术有限公司 | 视频推荐模型的生成方法、视频推荐方法、装置 |
CN113407772A (zh) * | 2020-03-16 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 视频推荐模型的生成方法、视频推荐方法、装置 |
CN113449177A (zh) * | 2020-03-27 | 2021-09-28 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
EP3916587A1 (en) * | 2020-05-27 | 2021-12-01 | Beijing Baidu Netcom Science And Technology Co. Ltd. | Method and apparatus for recommending multimedia resource, electronic device and storage medium |
CN111737305A (zh) * | 2020-05-27 | 2020-10-02 | 上海晶赞融宣科技有限公司 | 信息推送中人群特征确定方法及装置、可读存储介质 |
CN111737305B (zh) * | 2020-05-27 | 2024-03-15 | 上海晶赞融宣科技有限公司 | 信息推送中人群特征确定方法及装置、可读存储介质 |
CN111680219A (zh) * | 2020-06-09 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 内容推荐方法、装置、设备及可读存储介质 |
CN111680219B (zh) * | 2020-06-09 | 2023-10-20 | 深圳市雅阅科技有限公司 | 内容推荐方法、装置、设备及可读存储介质 |
CN112148973B (zh) * | 2020-09-04 | 2023-11-07 | 京东科技控股股份有限公司 | 一种信息推送的数据处理方法及装置 |
CN112148973A (zh) * | 2020-09-04 | 2020-12-29 | 京东数字科技控股股份有限公司 | 一种信息推送的数据处理方法及装置 |
CN112150199A (zh) * | 2020-09-21 | 2020-12-29 | 北京小米松果电子有限公司 | 垂类特征的确定方法及装置、存储介质 |
CN112287236A (zh) * | 2020-11-19 | 2021-01-29 | 每日互动股份有限公司 | 文本消息的推送方法、装置、计算机设备及存储介质 |
CN112364937B (zh) * | 2020-11-30 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 用户类别确定方法及装置、推荐内容确定方法、电子设备 |
CN112364937A (zh) * | 2020-11-30 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 用户类别确定方法及装置、推荐内容确定方法、电子设备 |
CN112765478A (zh) * | 2021-03-12 | 2021-05-07 | 北京百度网讯科技有限公司 | 用于推荐内容的方法、装置、设备、介质和程序产品 |
CN112967100B (zh) * | 2021-04-02 | 2024-03-15 | 杭州网易云音乐科技有限公司 | 相似人群扩展方法、装置、计算设备以及介质 |
CN112967100A (zh) * | 2021-04-02 | 2021-06-15 | 杭州网易云音乐科技有限公司 | 相似人群扩展方法、装置、计算设备以及介质 |
CN113420222A (zh) * | 2021-07-08 | 2021-09-21 | 咪咕文化科技有限公司 | 内容推荐方法及装置 |
CN113672804A (zh) * | 2021-08-02 | 2021-11-19 | 上海浦东发展银行股份有限公司 | 推荐信息生成方法、系统、计算机设备及存储介质 |
CN114764603A (zh) * | 2022-05-07 | 2022-07-19 | 支付宝(杭州)信息技术有限公司 | 针对用户分类模型、业务预测模型确定特征的方法及装置 |
CN116596576A (zh) * | 2023-07-17 | 2023-08-15 | 深圳须弥云图空间科技有限公司 | 目标推荐方法及装置 |
CN116596576B (zh) * | 2023-07-17 | 2024-04-16 | 深圳须弥云图空间科技有限公司 | 目标推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110263242B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263242A (zh) | 内容推荐方法、装置、计算机可读存储介质和计算机设备 | |
CN109345302B (zh) | 机器学习模型训练方法、装置、存储介质和计算机设备 | |
WO2021081962A1 (zh) | 推荐模型的训练方法、推荐方法、装置及计算机可读介质 | |
WO2020135535A1 (zh) | 一种推荐模型训练方法及相关装置 | |
US20190272553A1 (en) | Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks | |
CN108596695B (zh) | 实体推送方法及系统 | |
CN111444395B (zh) | 获取实体间关系表达的方法、系统和设备、广告召回系统 | |
CN108205766A (zh) | 信息推送方法、装置及系统 | |
GB2547395A (en) | User maintenance system and method | |
JP6911603B2 (ja) | ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置 | |
WO2018192348A1 (zh) | 数据处理方法、装置及服务器 | |
CN108885624A (zh) | 信息推荐系统及方法 | |
CN108429776B (zh) | 网络对象的推送方法、装置、客户端、交互设备以及系统 | |
CN108960912A (zh) | 用于确定目标位置的方法和装置 | |
US20160275806A1 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
WO2021208535A1 (zh) | 基于自动特征分组的推荐方法及装置 | |
CN107153656A (zh) | 一种信息搜索方法和装置 | |
CN112241489A (zh) | 信息推送方法、装置、可读存储介质和计算机设备 | |
CN111008335A (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN114417174B (zh) | 内容推荐方法、装置、设备及计算机存储介质 | |
CN111680213B (zh) | 信息推荐方法、数据处理方法及装置 | |
Kim et al. | Evaluating audience loyalty and authenticity in influencer marketing via multi-task multi-relational learning | |
CN111931069B (zh) | 用户兴趣确定方法、装置及计算机设备 | |
CN113269232B (zh) | 模型训练方法、向量化召回方法、相关设备及存储介质 | |
CN110096609A (zh) | 房源搜索方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |