CN112395499B - 信息推荐方法及装置、电子设备、存储介质 - Google Patents

信息推荐方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN112395499B
CN112395499B CN202011213080.0A CN202011213080A CN112395499B CN 112395499 B CN112395499 B CN 112395499B CN 202011213080 A CN202011213080 A CN 202011213080A CN 112395499 B CN112395499 B CN 112395499B
Authority
CN
China
Prior art keywords
user
preliminary
recommended
score
candidate information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011213080.0A
Other languages
English (en)
Other versions
CN112395499A (zh
Inventor
钟子宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011213080.0A priority Critical patent/CN112395499B/zh
Publication of CN112395499A publication Critical patent/CN112395499A/zh
Application granted granted Critical
Publication of CN112395499B publication Critical patent/CN112395499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的实施例揭示了一种信息推荐方法及装置,该方法包括:根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分;基于预测得到的所述初步意向得分构建初步得分矩阵,所述初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分;对所述初步得分矩阵进行协同过滤处理,得到用户得分矩阵,所述用户得分矩阵中含有所述待推荐用户对于所有候选信息的用户意向得分;根据所述用户得分矩阵,向所述待推荐用户进行所述候选信息的推荐。本申请实施例的技术方案能够极大地提升候选信息推荐的准确性。

Description

信息推荐方法及装置、电子设备、存储介质
技术领域
本申请涉及人工智能技术领域,具体涉及一种信息推荐方法及装置、电子设备、计算机可读存储介质。
背景技术
随着互联网技术的快速发展,越来越多的信息能够借由信息推荐系统被推荐给用户。目前,信息推荐系统是根据用户历史行为数据来推荐用户可能感兴趣的信息的,但在实际应用中,存在大量的新用户没有用户历史行为数据以及大量新的信息也没有相应的用户数据的情况,导致信息推荐的准确度较低。
发明内容
为解决上述技术问题,本申请的实施例提供一种信息推荐方法及装置、电子设备、计算机可读存储介质,以基于本实施例进行的信息推荐来有效提升信息推荐的准确度。
根据本申请实施例的一个方面,提供了一种信息推荐方法,包括:根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分;基于预测得到的所述初步意向得分构建初步得分矩阵,所述初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分;对所述初步得分矩阵进行协同过滤处理,得到用户得分矩阵,所述用户得分矩阵中含有所述待推荐用户对于所有候选信息的用户意向得分;根据所述用户得分矩阵,向所述待推荐用户进行所述候选信息的推荐。
根据本申请实施例的一个方面,提供了一种信息推荐装置,包括:意向得分预测模块,配置为根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分;得分矩阵构建模块,配置为基于预测得到的所述初步意向得分构建初步得分矩阵,所述初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分;协同过滤处理模块,配置为对所述初步得分矩阵进行协同过滤处理,得到用户得分矩阵,所述用户得分矩阵中含有所述待推荐用户对于所有候选信息的用户意向得分;候选信息推荐模块,配置为根据所述用户得分矩阵,向所述待推荐用户进行所述候选信息的推荐。
根据本申请实施例的一个方面,提供了一种电子设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的信息推荐方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的信息推荐方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的信息推荐方法。
在本申请的实施例提供的技术方案中,首先根据候选信息的信息特征和推荐用户的用户特征预测得到待推荐用户对于候选信息的初步意向得分,然后基于预测的初步意向得分构建初步得分矩阵,并对初步得分矩阵进行协同过滤处理,以对初步得分矩阵中缺失的待推荐用户对于某些候选信息的意向得分数据进行填充,使得所得到的用户得分矩阵中含有待推荐用户对于所有候选信息的用户意向得分,能够避免出现由于候选信息缺失用户数据而无法得到用户对于候选信息的用户意向得分,进而导致的候选信息推荐不准确的问题,极大地提升了候选信息推荐的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请涉及的一种实施环境的示意图;
图2是根据一示例性实施例示出的一种信息推荐方法的流程图;
图3是图2所示实施例中步骤S110在一示例性实施例中的流程图;
图4是图2所示实施例中的步骤S130在一示例性实施例的流程图;
图5是本申请涉及的一种示例性的业务场景界面示意图;
图6是本申请实施例示出的一种示例性的信息推荐应用场景的流程图;
图7是根据一示例性实施例示出的一种信息推荐装置的框图;
图8是适于用来实现本申请实施例的电子设备的一种示例性计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
本申请所提出的信息推荐方法及装置、设备以及计算机可读存续介质涉及人工智能领域,以下将通过具体的实施例对这些方法、装置、设备和计算机可读存储介质进行详细说明。
此外,作为一种示例性的应用方式,本申请所提出的信息推荐方法及装置、设备以及计算机可读存续介质可以具体部署在云服务器上,以使云服务器能够对外提供信息推荐的业务功能。例如,通过调用云服务器所提供的应用接口,即可方便地获取用户对于若干候选信息的用户意向得分,基于这些用户意向得分即可向用户进行候选信息的推荐,例如优先向用户推荐用户意向得分高的候选信息。并且,获取用户对于候选信息的用户意向得分的过程对于用户来说是不可见的,由此能够保证代码数据的隐私性和安全性。
请参阅图1,图1是本申请涉及的一种实施环境的示意图。
该实施环境具体实现为一种信息推荐系统,如图1所示,该信息推荐系统包括用户终端10和信息推荐服务器20,用户终端10和信息推荐服务器20之间通过有线或者无线的网络进行通信。
信息推荐服务器20用于预测待推荐用户对于候选信息的用户意向得分,用户意向得分用于表征待推荐用户对于候选信息的接纳程度,并基于预测得到的用户意向得分,向用户终端10发送候选信息,例如优先向用户终端10发送用户意向得分高的候选信息,以向用户终端10准确地进行候选信息的推荐。
需要说明的是,本实施环境中的用户终端10具体可以是智能手机、平板、笔记本电脑、计算机等终端设备,并且用户终端10的数量可以是一个或者多个,本处不进行限制。
本实施环境中的信息推荐服务器20具体可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处也不对此进行限制。
图2是根据一示例性实施例示出的一种信息推荐方法的流程图。
该方法可以应用于图1所示的实施环境,并由图1所示实施环境中的信息推荐服务器20具体执行。或者在一些其它的实施环境中,该方法还可以由其它的服务器或终端设备具体执行,本处不对此进行限制。
如图2所示,该信方法可以包括步骤S110至步骤S170,详细介绍如下:
步骤S110,根据候选信息的信息特征以及待推荐用户的用户特征,预测待推荐用户对于候选信息的初步意向得分。
首先需要说明的是,候选信息是待向用户进行推荐的信息,在不同的应用场景中,候选信息所属的信息类型可能不同,例如候选信息可以是互联网上的广告、商品、优惠券等信息。候选信息的数量通常是大量的,以实现大量候选信息面向用户的准确推荐。
候选信息的信息特征是用于描述候选信息的属性的相关信息,例如候选信息的信息特征可以从候选信息的属性数据中提取得到。示例性的,若候选信息为商品,候选信息的信息特征则可以包括商品的点击率、费率、收藏率、平均付费金额、平均活跃时长等。需要理解的是,商品的平均付费金额是指商品的总付费金额与付费用户数量的商,商品的平均活跃时长是指商品总活跃时长与活跃用户数量的商。
待推荐用户则是需要接收推荐的候选信息的用户。通常而言,待推荐用户的数量也是大量的,以实现互联网信息推荐的便捷性和准确性。需要说明的是,待推荐用户在互联网中通常是以用户标识的形式存在的,因此本实施例所指的待推荐用户可以理解为是指相应的用户标识,例如是指待推荐用户在互联网应用中注册的用户账号等信息。
待推荐用户的用户特征是用于描述待推荐用户在互联网上的行为记录的相关信息,例如可以从待推荐用户在互联网上的行为记录数据提取得到的待推荐用户的用户特征。示例性的,待推荐用户的用户特征通常可以包括待推荐用户的性别、年龄、地域等基础属性信息,还可以包括活跃时长、活跃天数、活跃功能数量、注册时间距离当前时间的天数间隔等活跃属性信息,还可以包括用户功能点击、收藏等属性信息。在不同的应用场景中,待推荐用户的用户特征也可能不同,实施例不对此一一进行举例。
在本实施例中,根据候选信息的信息特征以及待推荐用户的用户特征来预测待推荐用户对于候选信息的初步意向得分,实质上是基于候选信息的属性信息和待推荐用户的历史行为属性信息来预测待推荐用户可能对候选信息感兴趣的程度的过程,待推荐用户对候选信息越感兴趣,待推荐用户对于候选信息的初步意向得分也越高,若将候选信息推荐至待推荐用户,待推荐用户接纳所推荐的候选信息的可能性也就越大。
在实际应用中,通常容易存在待推荐用户为新用户而导致无法获得待推荐用户对于候选信息的历史行为数据的情况,也容易存在候选信息为新出现的互联网信息而导致无法获得待用户对于候选信息的历史行为数据的情况,例如候选信息为商家新上架的商品,也即在实际应用中容易出现候选信息缺失用户数据的问题,导致基于步骤S110可能无法预测得到待推荐用户对于某个或者某几个候选信息的初步意向得分。
为解决此问题,本实施例还需要根据预测得到的待推荐用户对于候选信息的初步意向得分,进一步预测待推荐用户对于缺失了用户数据的候选信息的用户意向得分。
还需要理解的是,本实施例通过“初步意向得分”以及“用户意向得分”来描述待推荐用户对于候选信息的感兴趣程度,是为了清楚地描述不同步骤中的执行过程,二者所表征的实质含义并无区别。
步骤S130,基于预测得到的初步意向得分构建初步得分矩阵,初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分。
在本实施例中,初步得分矩阵是将预测得到的初步意向得分进行阵列排列所得到的矩阵,基于步骤S110所预测得到的初步意向得分具体位于矩阵中行列交叉的位置上。
示例性的,可以设定初步得分矩阵的不同行对应表示不同的待推荐用户,不同列对应表示不同的候选信息,因此初步得分矩阵中含有的行列交叉的各个数据用于表征数据所在行对应的待推荐用户对于数据所在列对应的候选信息的初步意向得分。
在其它的实施例中,也可以设定初步得分矩阵的不同列对应表示不同的待推荐用户,不同行对应表示不同的候选信息,因此初步得分矩阵中含有的行列交叉的各个数据用于表征数据所在列对应的待推荐用户对于数据所在行对应的候选信息的初步意向得分。
如前所述的,由于步骤S110可能无法预测得到待推荐用户对于某个或者某几个候选信息的初步意向得分,使得步骤S130所构建得到的初步得分矩阵中行列交叉的位置可能存在缺失数据的情况。
若确定初步得分矩阵缺失数据,则根据步骤S150所描述的内容进一步预测缺失数据的位置所对应的待推荐用户对于此位置所对应的候选信息的初步意向得分。
若确定初步得分矩阵中未缺失数据,则表示步骤S110中预测得到待推荐用户对于所有候选信息的初步意向得分,此时根据初步得分矩阵向待推荐用户进行候选信息的推荐即可。例如,基于初步得分矩阵能够获知待推荐用户对于每个候选信息的感兴趣程度,通过优先向待推荐用户推荐感兴趣程度高的候选信息,即可以实现候选信息对于待推荐用户的准确推荐。
步骤150,对初步得分矩阵进行协同过滤处理,得到用户得分矩阵,用户得分矩阵中含有待推荐用户对于候选信息的用户意向得分。
首先说明的是,协同过滤处理是通过分析各个用户的兴趣,并在用户群中找到与指定用户具有相似兴趣的用户,综合这些相似用户对于候选信息的评价所形成对指定用户对此候选信息的感兴趣程度预测的过程。
在本实施例中,用户群可以是初步得分矩阵所对应表征的待推荐用户群,指定用户可以是初步得分矩阵中缺失的数据位置所对应的待推荐用户。本实施例基于对初步得分矩阵进行协同过滤处理,则可以是在待推荐用户群中找到与初步得分矩阵中缺失的数据位置所对应的待推荐用户具有相似兴趣的待推荐用户,并综合这些待推荐用户对于初步得分矩阵中缺失的数据位置所对应的候选信息的评价,预测得到初步得分矩阵中缺失的数据位置所对应的待推荐用户对于该数据位置所对应的候选信息的用户意向得分。
由此可知,本实施例所得到的用户得分矩阵中并不含有缺失数据的位置,因此用户得分矩阵中含有各个待推荐用户对于所有候选信息的用户意向得分,相当于本实施例基于对初步得分矩阵进行协同过滤处理,对初步得分矩阵所缺失的数据进行了预测和填充。
示例性的,本实施例对初步得分矩阵进行协同过滤处理,具体可以包括对初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵,然后将用户兴趣得分矩阵与信息属性得分矩阵相乘,由此得到用户得分矩阵的过程。
需要说明的是,本实施例对初步得分矩阵进行矩阵分解处理具体可以通过SVD(Singular Value Decomposition,奇异值分解)矩阵分解方式实现;本实施例也可以使用CF(Collaborative Filterin,协同过滤)模型实现对初步得分矩阵进行协同过滤处理。
由于本实施例预测的待推荐用户对于缺失了用户数据的候选信息的用户意向得分,是根据与该待推荐用户具有相似兴趣的待推荐用户对于相应候选信息的评价数据预测得到的,在极大程度上保证了所预测得到的用户意向得分的准确性。
步骤170,根据用户得分矩阵,向待推荐用户进行候选信息的推荐。
如上所述的,用户得分矩阵中含有待推荐用户对于所有候选信息的用户意向得分,因此在从用户得分矩阵中确定得到各个待推荐用户对于所有候选信息的用户意向得分后,可以基于用户意向得分进行相应候选信息面向待推荐用户的推荐。
示例性的,可以按照各个待推荐用户对于所有候选信息的用户意向得分由大到小的排序,向各个待推荐用户依次进行相应候选信息的推荐。例如,可以先按照用户意向得分由大到小的排序选择指定数量的候选信息作为目标候选信息,将目标候选信息推荐给相应的待推荐用户。推荐至待推荐用户的目标候选信息可以在待推荐用户所在用户终端的终端界面中进行任意形式的展示,例如周期性地逐个显示目标候选信息,或者将目标候选信息以列表形式展示在终端界面中,本处对不此进行限制。
需要说明的是,根据待推荐用户对于所有候选信息的用户意向得分,选取目标候选信息向待推荐用户进行推荐的过程可以根据具体的应用场景具体设置,例如在某些应用场景中,可能并不要求待推荐用户对于接收到的目标候选信息具有很高的感兴趣程度,因此本实施例并不对候选信息面向待推荐用户的推荐过程进行具体限制。
由上可知,在本实施例提供的方法中,根据候选信息的信息特征和推荐用户的用户特征预测待推荐用户对于候选信息的初步意向得分,由于这些初步意向得分充分考虑了信息特征和用户特征之间的关联性,因此这些初步意向得分能够较为准确地反映出待推荐用户对于候选信息的感兴趣程度。
本实施例还基于预测的初步意向得分构建初步得分矩阵,并对初步得分矩阵进行协同过滤处理,以对初步得分矩阵中缺失的待推荐用户对于某些候选信息的意向得分数据进行填充,所填充的用户意向得分也能够准确地反映出待推荐用户对于候选信息的感兴趣程度,因此基于本实施例所得到的用户得分矩阵,不仅能够得到待推荐用户对于所有候选信息的用户意向得分,还能保证所得到的用户意向得分的准确性,能够避免出现由于候选信息缺失用户数据而无法得到用户对于候选信息的用户意向得分,进而导致的候选信息推荐不准确的问题。因此,本实施例基于用户得分矩阵向待推荐用户进行候选信息的推荐过程具有极高的准确性。
图3是图2所示实施例中步骤S110在一示例性实施例中的流程图。
如图3所示,在一示例性实施例中,根据候选信息的信息特征以及待推荐用户的用户特征,预测待推荐用户对于所述候选信息的初步意向得分,可以包括步骤S111至步骤S115,详细介绍如下:
步骤S111,获取稀疏特征集合和稠密特征集合,稀疏特征集合由信息特征以及用户特征中含有的稀疏特征组成,稠密特征集合由信息特征以及用户特征中含有的稠密特征组成。
首先需要说明的是,在本实施例中,“特征”理解为是一种对数据的表达,若将每个数据点作为一个向量,各个数据点对应的特征则可以用另一个向量来表示,因此稀疏特征可以理解为这个特征向量中含有很多为零的向量,而非零向量的维度远小于特征向量的维度,稀疏特征一般为离散类型的特征。稠密特征则与稀疏特征相对,稠密特征一般为连续类型的特征。例如以用户特征作为示例,用户性别、年龄等用户特征都是稀疏特征,用户活跃天数、用户活跃时长等用户特征都是稠密特征。
候选信息的信息特征以及待推荐用户的用户特征均可以划分为稀疏特征或者稠密特征,本实施例将信息特征中含有稀疏特征以及用户特征中含有的稀疏特征的组合获取为稀疏特征集合,以及将信息特征中含有稠密特征以及用户特征中含有的稠密特征的组合获取为稠密特征集合。
步骤S113,对稀疏特征集合中含有的稀疏特征进行特征提取,得到稀疏特征所对应的特征表示。
本实施例对稀疏特征集合中含有的稀疏特征进行特征提取,是将稀疏特征集合中的稀疏特征转换为连续特征表示的过程,由此得到与稀疏特征集合相对应的高阶特征集合。
示例性的,可以将稀疏特征集合输入深度学习模型中,深度学习模型用于提取稀疏特征集合的特征表示,因此通过获取深度学习模型的输出信号,即可得到稀疏特征集合中含有的稀疏特征所对应的特征表示。
深度学习模型可以是DNN(Deep Neural Networks,深度神经网络)模型,例如深度学习模型为采用5层网络架构的DNN模型,该模型在稀疏特征数量较多的情况下具有较好的模型效果。而在稀疏特征数量较少的情况下,深度学习模型也可以采用单层网络模型。在另外的一些实施例中,深度学习模型还可以结合FM(Factorization Machine,因子分解机)、DeepFM(Deep Factorization Machine,深度因子分解机)等模型实现,在实际应用中可以根据具体需求选取深度学习模型的模型结构,本处不进行限制。
步骤S115,将稀疏特征所对应的特征表示与稠密特征集合进行组合,得到特征样本数据,基于特征样本数据预测待推荐用户对于候选信息的初步意向得分。
如前所述的,稀疏特征所对应的特征表示是对稀疏特征进行连续特征表示的转换所得到的高阶特征,因此本实施例将稀疏特征集合中含有的稀疏特征对应的特征表示与稠密特征集合进行组合,所得到的特征样本数据实质为连续型的特征样本数据。
由此,本实施例基于这些连续型的特征样本数据对待推荐用户对于候选信息的初步意向得分进行预测,增加了初步意向得分预测过程中所能够依赖的特征信息,使得本实施例预测得到的待推荐用户对于候选信息的初步意向得分具有更高的准确性。
示例性的,本实施例可以将特征样本数据输入分类模型,以使分类模型基于特征样本数据预测待推荐用户对于所述候选信息的初步意向得分,从而可以直接获取分类模型输出的待推荐用户对于候选信息的初步意向得分,使得初步意向得分的获取过程十分方便。其中,分类模型可以采用LR(Logistic Regression,逻辑回归)等常见的分类模型,本实施例不对此进行限制。
由此可知,在本实施例所提供的方法基于稀疏特征与稠密特征的结合来预测待推荐用户对于候选信息的初步意向得分,能够使得所预测得到的初步意向得分具有更高的准确性。
图4是图2所示实施例中的步骤S130在一示例性实施例的流程图。如图4所示,基于预测得到的初步意向得分构建初步得分矩阵,可以包括步骤S131至步骤S133,详细介绍如下:
步骤S131,基于分数间隔相等的多个得分区间,对待推荐用户对于候选信息的初步意向得分进行得分区间的划分处理,得到各个得分区间内所含有的初步意向得分。
在本实施例中,考虑到对初步得分矩阵进行协同滤波处理的过程是基于具有相似兴趣的待推荐用户对于缺失了用户数据的候选信息的评价,来对待推荐用户对于该缺失了用户数据的候选信息的用户意向得分进行预测的,若基于这些相似性进行初步得分矩阵的构建,将会使得对初步得分矩阵进行协同滤波处理的效果更佳。
基于此,本实施例通过对步骤S110所预测得到的待推荐用户对于候选信息的初步意向得分进行得分区间的划分,然后按照得分区间之间的排序将各个得分区间内所含有的初步意向得分转化为初步得分矩阵中的数据,以使得初步得分矩阵中含有的数据能够按照待推荐用户之间的兴趣相似性而呈阵列排列,有利于提升步骤S150中预测得到待推荐用户对于缺失了用户数据的候选信息的用户意向得分的准确性。
在一些实施例中,可以确定最大的初步意向得分和最小的初步意向得分,然后将最大的初步意向得分与最小的初步意向得分之差作为分数总间隔,将此分数总间隔划分为多个分数间隔相等的得分区间。或者,也可以将满分的初步意向得分与零之间的分数差作为分数总间隔,将此分数总间隔划分为多个分数间隔相等的得分区间,本实施例并不对此进行限制。
在得到多个得分区间后,通过判断各个初步意向得分具体位于某个得分区间,并将各个初步意向得分划分为相应的得分区间中,即可实现对待推荐用户对于候选信息的初步意向得分进行得分区间的划分处理,所得到的各个得分区间内则含有一个或者多个初步意向得分。
步骤S133,按照各个得分区间之间的排序,依次将各个得分区间内所含有的初步意向得分转化为初步得分矩阵中的数据。
在本实施例中,各个得分区间之间的排序可以是得分值由大至小的排序,也可以是得分值由小到大的排序,本处不对此进行具体限制。
本实施例按照各个得分区间之间的排序,依次将各个得分区间内所含有的初步意向得分转化为初步得分矩阵中的数据,可以使得初步得分矩阵中行列交叉的数据能够按照待推荐用户之间的兴趣相似性而呈阵列排列,从而有利于提升预测待推荐用户对于缺失了用户数据的候选信息的用户意向得分的准确性。
而在另外的实施例中,考虑到基于分类模型预测得到的初步意向得分通常是小于1的非整数,不利于进行初步得分矩阵的协同过滤处理,因此需要对步骤S110所预测得到的初步意向得分进行整数化处理,以得到初步意向得分对应的整数得分,然后再根据初步意向得分对应的整数得分构建初步得分矩阵。
需要理解的是,本实施例对初步意向得分进行的整数化处理可以是将初步意向得分乘以指定常数,以得到一个整数分值,例如,若最小的初步意向得分为0.00038,指定常数可以设为100000,以保证初步意向得分与指定常数的乘积为整数。可以看出,本实施例所得到的整数得分能够用于对初步意向得分进行整数化的分数表达。
因此,本实施例提出的方法能够进一步提升步骤S150中对于初步得分矩阵的协同处理效率。
在另外的示例性实施例中,图2所示的步骤S110至步骤S150的过程可以基于机器学习模型实现,例如该机器学习模型可以由深度学习模型(例如DNN模型)、分类模型(例如LR模型)和协同过滤模型(例如CF模型)依次组合得到,以使得用户得分矩阵的获取过程十分方便,从而能够提升信息推荐的效率。
机器学习模型需要预先进行训练和测试,如果训练得到的机器学习模型通过测试,则表示训练得到的机器学习模型能够达到预测的模型效果,因此可以用于进行实际的信息推荐。
在机器学习模型需要预先进行训练和测试的过程中,需要先获取数据样本集,数据样本集中含有历史用户的用户特征、历史信息的信息特征和历史用户标签。其中,历史用户标签用于表征历史信息是否被历史用户接受,若历史信息被用户接收,该用户标签可以表示为“1”,若不被用户接收,该用户标签则表示为“0”。
然后,需要将数据样本集随机划分为训练样本集和测试样本集。例如可以按照一定比例对数据样本集进行随机划分,例如训练样本与测试样本之间的数据量比值可以为8∶2。其中,本实施例对数据样本集的随机划分可以保证训练样本集合测试样本集不会存在数据差异性,以确保机器学习模型的训练和测试过程是同步的。
在得到训练样本集和测试样本集之后,则根据训练样本集对机器学习模型进行训练,并根据测试样本集对训练得到的机器学习模型进行测试。具体来说,先将训练样本集划分为稀疏训练样本子集和稠密训练样本子集,以及将测试样本集划分为稀疏测试样本子集和稠密测试样本子集,然后根据稀疏训练样本子集和稠密训练样本子集对机器学习模型进行训练,并根据稀疏测试样本子集和稠密测试样本子集对训练得到的机器学习模型进行测试。
具体来说,在根据稀疏训练样本子集和稠密训练样本子集对机器学习模型进行训练的过程中,稀疏训练样本子集中的稀疏训练样本用于训练深度学习模型,分类模型则是通过深度学习模型的输出信号结合稠密训练样本子集进行训练,协同过滤模型基于分类模型的输出信号进行训练。其中,根据测试样本集对训练得到的机器学习模型进行测试的过程与上述的训练过程相似,本处不对此进行赘述。
对于深度学习模型和分类模型的训练过程,在对深度学习模型和分类模型进行每轮训练后,通过计算训练损失值来判断是否达到训练标准,例如判断训练损失值是否小于或等于较小的损失阈值,若确定本次训练未达到训练标准,则采用梯度下降等方式对深度学习模型和分类模型进行模型参数更新,并基于更新后的模型参数进行下一轮训练,直至所得到的训练损失值达到训练标准。
而对于深度学习模型和分类模型的测试过程,则可以通过获取查全率、查准率、精确率等测评指标,来具体判定训练好的深度学习模型和分类模型是否达标。
对于协同过滤模型的训练过程,在对协同过滤模型进行每轮训练后,可以通过协同过滤模型输出的用户得分矩阵与输入协同过滤模型中的初步得分矩阵之间的方差,来具体判断模型是否达到训练标准,例如判断方差是否小于或等于较小的方差阈值,若确定模型本次训练未达到训练标准,则对模型参数进行调整后,继续进行下一轮训练,直至所得到的训练方差符合要求。
在协同过滤模型的测试过程中,也可以通过获取查全率、查准率、精确率等测评指标,来具体判定训练好的协同过滤模型是否达标。
若训练得到的机器学习模型通过测试,则保存训练得到的机器学习模型,以将保存的机器学习模型用于进行实际的信息推荐,例如将保存的机器学习模型配置到图1所示的信息推荐服务器20中,以基于机器学习模型获得待推荐用户对于所有候选信息的用户意向得分,信息推荐服务器20则基于所获得的用户意向得分向用户终端10推荐相应的候选信息。
本申请实施例所提出的信息推荐方法可以应用于数字化营销、精细化运营等业务场景中。例如图5所示,在向用户进行优惠券推荐的业务场景中,需要具体向“出行服务”的业务场景下向用户推荐优惠加油优惠券,以防止用户流失。
图6是本申请实施例示出的一种示例性的信息推荐应用场景的流程图。如图6所示,首先将T期的用户特征、T期向用户推荐的优惠券的信息特征、以及用户在T期下载优惠券的标签数据作为数据源,将数据源所含有的特征按照8∶2的比例划分为训练样本集以及测试样本集,并将训练样本集中含有的特征划分为稀疏特征、稠密特征和用户标签,以及将测试样本集中含有的特征也划分为稀疏特征、稠密特征和用户标签。
T期的用户特征可以包括用户性别、年龄、地域等基础属性数据,以及包括活跃天数、活跃时长、活跃功能数量、注册时间距离当前时间的天数间隔的活跃属性数据,还可以包括充值金额、消费金额、充值次数、首次充值距离当前时间的天数间隔等充值属性数据,也可以包括用户功能点击、用户领取礼包/优惠券类型(例如包括数量、次数和价值)、使用礼包/优惠券类型、过期礼包/优惠券类型等优惠券属性数据。用户标签即是用户在T期下载优惠券的标签数据,包括“标签0”和“标签1”,“标签0”表示表示用户在T期未下载优惠券,“标签1”表示表示用户在T期下载了优惠券。
在第一阶段,使用训练样本集中的稀疏特征进行深度学习模型的训练,得到稀疏特征对应的高阶特征表示,然后将这些高阶特征表示与训练样本集中的稠密特征、用户标签组合成训练样本数据对分类模型进行训练,得到分类模型针对训练样本数据所输出的初步意向得分结果。
然后,使用测试样本集代入训练好的深度学习模型和分类模型进行测试,相应得到分类模型针对测试样本数据所输出的初步意向得分结果。如果确认训练好的深度学习模型和分类模型的训练效果符合预期,所训练好的深度学习模型和分类模型即通过评估,接下来进入第二阶段的协同过滤模型训练。如果深度学习模型和分类模型没有通过评估,则继续进行第一阶段的训练过程,直到深度学习模型和分类模型通过评估。
在第二阶段,利用第一阶段的针对训练样本数据得到的初步意向得分结果构建初步得分矩阵,对协同过滤模型进行训练。并利用第一阶段的针对测试样本数据得到的初步意向得分结果构建初步得分矩阵,对训练好的协同过滤模型进行测试。如果协同过滤模型没有通过测试评估,则继续训练和测试协同过滤模型,直至训练得到的协同过滤模型通过测试评估。
在得到通过测试评估的深度学习模型、分类模型和协同过滤模型后,通过深度学习模型和分类模型基于T期的用户特征预测T+1期用户下载优惠券的初步意向得分,然后基于预测得到的T+1期的初步意向得分构建初步得分矩阵,使用协同过滤模型对初步得分矩阵中缺失了数据的位置进行数据填充,得到数据完整的用户得分矩阵。
需要理解的是,本实施例所提及的“T期”可以理解为当前的一段时间,在这段时间内,用户特征、优惠券的信息特征、以及用户标签均是已知数据,便于获取。本实施例所提及的“T+1期”则可以理解为是当前时期的未来一段时间,在未来的一段时间中,需要向用户推荐的优惠券可能是新出现的优惠券,由于历史时期并未对这些优惠券进行推荐,无法获得用户对于这些优惠券的历史评价数据。
而基于本实施例所获得的用户得分矩阵,可以得到各个用户对于T+1期需要推荐的所有优惠券的用户意向得分,用户意向得分用于表征用户对相应优惠券的感兴趣程度,也用于表征用户下载T+1期所推荐的优惠券的可能性,因此可以按照用户意向得分从大到小的排序,依次选择指定数量的优惠券向用户进行推荐,由此实现优惠券面向用户的准确推荐。
图7是根据一示例性实施例示出的一种信息推荐装置的框图。
该信息推荐装置可以应用于图1所示的实施环境,例如可以具体配置在图1所示实施环境中的信息推荐服务器20中。或者在一些其它的实施环境中,该信息推荐装置还可以配置在其它的服务器或终端设备中,本处也不对此进行限制。
如图7所示,在一示例性实施例中,该信息推荐装置可以包括:
意向得分预测模块210,配置为根据候选信息的信息特征以及待推荐用户的用户特征,预测待推荐用户对于候选信息的初步意向得分;得分矩阵构建模块230,配置为基于预测得到的初步意向得分构建初步得分矩阵,初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分;协同过滤处理模块250,配置为对初步得分矩阵进行协同过滤处理,得到用户得分矩阵,用户得分矩阵中含有待推荐用户对于所有候选信息的用户意向得分;候选信息推荐模块270,配置为根据用户得分矩阵,向待推荐用户进行候选信息的推荐。
在另一示例性实施例中,意向得分预测模块210包括:
特征区分单元,配置为获取稀疏特征集合和稠密特征集合,稀疏特征集合由信息特征以及用户特征中含有的稀疏特征组成,稠密特征集合由信息特征以及用户特征中含有的稠密特征组成;特征提取单元,配置为对稀疏特征集合中含有的稀疏特征进行特征提取,得到稀疏特征所对应的特征表示;得分预测单元,配置为将稀疏特征所对应的特征表示与稠密特征集合进行组合,得到特征样本数据,基于特征样本数据预测待推荐用户对于候选信息的初步意向得分。
在另一示例性实施例中,特征提取单元包括:
第一模型输入子单元,配置为将稀疏特征集合输入深度学习模型,深度学习模型用于提取稀疏特征集合的特征表示,深度学习模型是基于稀疏样本数据进行训练得到的;特征获取子单元,配置为深度学习模型针对稀疏特征集合中含有的稀疏特征所输出的特征表示。
在另一示例性实施例中,得分预测单元包括:
第二模型输入子单元,配置为将特征样本数据输入分类模型,以使分类模型基于特征样本数据预测待推荐用户对于候选信息的初步意向得分;得分获取子单元,配置为获取分类模型输出的待推荐用户对于候选信息的初步意向得分。
在另一示例性实施例中,得分矩阵构建模块230包括:
得分区间划分单元,配置为基于分数间隔相等的多个得分区间,对待推荐用户对于候选信息的初步意向得分进行得分区间的划分处理,得到各个得分区间内所含有的初步意向得分;矩阵转化单元,配置为按照各个得分区间之间的排序,依次将各个得分区间内所含有的初步意向得分转化为初步得分矩阵中的数据。
在另一示例性实施例中,得分矩阵构建模块230包括:
整数化处理单元,配置为对预测得到的待推荐用户对于候选信息的初步意向得分进行整数化处理,得到初步意向得分对应的整数得分,整数得分用于对初步意向得分进行整数化的分数表达;矩阵构建单元,配置为根据初步意向得分对应的整数得分构建初步得分矩阵。
在另一示例性实施例中,协同过滤处理模块250包括:
矩阵分解单元,配置为对初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵;矩阵内积单元,配置为将用户兴趣得分矩阵与信息属性得分矩阵相乘,得到用户得分矩阵。
在另一示例性实施例中,该信息推荐装置还包括:
数据缺失判断模块,配置为确定初步得分矩阵中行列交叉的位置是否缺失数据,若确定初步得分矩阵缺失数据,则执行对初步得分矩阵进行协同过滤处理,得到用户得分矩阵的过程,若确定初步得分矩阵中行列交叉的位置未缺失数据,则根据初步得分矩阵向待推荐用户进行候选信息的推荐。
在另一示例性实施例中,候选信息推荐模块270包括:
得分获取单元,配置为从用户得分矩阵中确定待推荐用户对于所有候选信息的用户意向得分;排序推荐单元,配置为按照待推荐用户对于所有候选信息的用户意向得分由大到小的排序,向待推荐用户依次进行相应候选信息的推荐。
在另一示例性实施例中,意向得分预测模块210、得分矩阵构建模块230以及协同过滤处理模块250基于机器学习模型执行;该信息推荐装置还包括:
数据样本获取模块,配置为获取数据样本集,数据样本集中含有历史用户的用户特征、历史信息的信息特征和历史用户标签,历史用户标签用于表征历史信息是否被历史用户接受;数据样本划分模块,配置为将数据样本集随机划分为训练样本集和测试样本集;模型训练和测试模块,配置为根据训练样本集对机器学习模型进行训练,并根据测试样本集对训练得到的机器学习模型进行测试;模型保存模块,配置为若训练得到的机器学习模型通过测试,则保存训练得到的机器学习模型。
在另一示例性实施例中,模型训练和测试模块包括:
数据子集划分单元,配置为将训练样本集划分为稀疏训练样本子集和稠密训练样本子集,以及将测试样本集划分为稀疏测试样本子集和稠密测试样本子集;子集训练和测试单元,配置为根据稀疏训练样本子集和稠密训练样本子集对机器学习模型进行训练,并根据稀疏测试样本子集和稠密测试样本子集对训练得到的机器学习模型进行测试。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
本申请的实施例还提供了一种电子设备,包括处理器和存储器,其中,存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如前所述的信息推荐方法。
图8示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图8示出的电子设备的计算机系统1600仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统1600包括中央处理单元(Central Processing Unit,CPU)1601,其可以根据存储在只读存储器(Read-Only Memory,ROM)1602中的程序或者从存储部分1608加载到随机访问存储器(Random Access Memory,RAM)1603中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1603中,还存储有系统操作所需的各种程序和数据。CPU 1601、ROM 1602以及RAM 1603通过总线1604彼此相连。输入/输出(Input/Output,I/O)接口1605也连接至总线1604。
以下部件连接至I/O接口1605:包括键盘、鼠标等的输入部分1606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1607;包括硬盘等的存储部分1608;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1609。通信部分1609经由诸如因特网的网络执行通信处理。驱动器1610也根据需要连接至I/O接口1605。可拆卸介质1611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1610上,以便于从其上读出的计算机程序根据需要被安装入存储部分1608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1609从网络上被下载和安装,和/或从可拆卸介质1611被安装。在该计算机程序被中央处理单元(CPU)1601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前所述的信息推荐方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的信息推荐方法。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。

Claims (13)

1.一种信息推荐方法,其特征在于,包括:
根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分;
基于分数间隔相等的多个得分区间,对所述待推荐用户对于所述候选信息的初步意向得分进行得分区间的划分处理,得到各个得分区间内所含有的初步意向得分;
按照所述各个得分区间之间的排序,依次将所述各个得分区间内所含有的初步意向得分转化为初步得分矩阵中的数据,以构建得到所述初步得分矩阵,其中,所述初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分,并且所述多个数据按照待推荐用户之间的兴趣相似性而呈阵列排列;
对所述初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵,并将所述用户兴趣得分矩阵与所述信息属性得分矩阵相乘,得到用户得分矩阵,其中,所述用户得分矩阵中含有所述待推荐用户对于所有候选信息的用户意向得分,并且所述初步得分矩阵中缺失的数据位置所对应的待推荐用户对于该数据位置所对应的候选信息的用户意向得分,是综合具有相似兴趣的待推荐用户对于该数据位置所对应候选信息的评价所预测得到的;
根据所述用户得分矩阵,向所述待推荐用户进行所述候选信息的推荐。
2.根据权利要求1所述的方法,其特征在于,根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分,包括:
获取稀疏特征集合和稠密特征集合,所述稀疏特征集合由所述信息特征以及所述用户特征中含有的稀疏特征组成,所述稠密特征集合由所述信息特征以及所述用户特征中含有的稠密特征组成;
对所述稀疏特征集合中含有的稀疏特征进行特征提取,得到所述稀疏特征所对应的特征表示;
将所述稀疏特征所对应的特征表示与所述稠密特征集合进行组合,得到特征样本数据,基于所述特征样本数据预测所述待推荐用户对于所述候选信息的初步意向得分。
3.根据权利要求2所述的方法,其特征在于,对所述稀疏特征集合中含有的稀疏特征进行特征提取,得到所述稀疏特征所对应的特征表示,包括:
将所述稀疏特征集合输入深度学习模型,所述深度学习模型用于提取所述稀疏特征集合的特征表示,所述深度学习模型是基于稀疏样本数据进行训练得到的;
获取所述深度学习模型针对所述稀疏特征集合中含有的稀疏特征所输出的特征表示。
4.根据权利要求2所述的方法,其特征在于,基于所述特征样本数据预测所述待推荐用户对于所述候选信息的初步意向得分,包括:
将所述特征样本数据输入分类模型,以使所述分类模型基于特征样本数据预测所述待推荐用户对于所述候选信息的初步意向得分;
获取分类模型输出的所述待推荐用户对于所述候选信息的初步意向得分。
5.根据权利要求1所述的方法,其特征在于,基于预测得到的所述初步意向得分构建初步得分矩阵,包括:
对预测得到的所述待推荐用户对于所述候选信息的初步意向得分进行整数化处理,得到所述初步意向得分对应的整数得分,所述整数得分用于对所述初步意向得分进行整数化的分数表达;
根据所述初步意向得分对应的整数得分构建所述初步得分矩阵。
6.根据权利要求1所述的方法,其特征在于,在对所述初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵之前,所述方法还包括:
确定所述初步得分矩阵中行列交叉的位置是否缺失数据;
若确定所述初步得分矩阵缺失数据,则执行对所述初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵的步骤。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若确定所述初步得分矩阵中行列交叉的位置未缺失数据,则根据所述初步得分矩阵向所述待推荐用户进行所述候选信息的推荐。
8.根据权利要求1所述的方法,其特征在于,根据所述用户得分矩阵,向所述待推荐用户进行所述候选信息的推荐,包括:
从所述用户得分矩阵中确定所述待推荐用户对于所有候选信息的用户意向得分;
按照所述待推荐用户对于所有候选信息的用户意向得分由大到小的排序,向所述待推荐用户依次进行相应候选信息的推荐。
9.根据权利要求1所述的方法,其特征在于,基于机器学习模型根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分,基于预测得到的所述初步意向得分构建初步得分矩阵,对所述初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵;所述方法还包括:
获取数据样本集,所述数据样本集中含有历史用户的用户特征、历史信息的信息特征和历史用户标签,所述历史用户标签用于表征所述历史信息是否被所述历史用户接受;
将所述数据样本集随机划分为训练样本集和测试样本集;
根据所述训练样本集对所述机器学习模型进行训练,并根据所述测试样本集对训练得到的机器学习模型进行测试;
若所述训练得到的机器学习模型通过测试,则保存所述训练得到的机器学习模型。
10.根据权利要求9所述的方法,其特征在于,根据所述训练样本集对所述机器学习模型进行训练,并根据所述测试样本集对训练得到的机器学习模型进行测试,包括:
将所述训练样本集划分为稀疏训练样本子集和稠密训练样本子集,以及将所述测试样本集划分为稀疏测试样本子集和稠密测试样本子集;
根据所述稀疏训练样本子集和所述稠密训练样本子集对所述机器学习模型进行训练,并根据所述稀疏测试样本子集和稠密测试样本子集对训练得到的机器学习模型进行测试。
11.一种信息推荐装置,其特征在于,包括:
意向得分预测模块,配置为根据候选信息的信息特征以及待推荐用户的用户特征,预测所述待推荐用户对于所述候选信息的初步意向得分;
得分区间划分单元,配置为基于分数间隔相等的多个得分区间,对所述待推荐用户对于所述候选信息的初步意向得分进行得分区间的划分处理,得到各个得分区间内所含有的初步意向得分;
得分矩阵构建模块,配置为按照所述各个得分区间之间的排序,依次将所述各个得分区间内所含有的初步意向得分转化为初步得分矩阵中的数据,以构建得到所述初步得分矩阵,其中,所述初步得分矩阵中含有行列交叉的多个数据,各个数据用于表征所在位置对应的待推荐用户对于相应候选信息的初步意向得分,并且所述多个数据按照待推荐用户之间的兴趣相似性而呈阵列排列;
协同过滤处理模块,配置为对所述初步得分矩阵进行矩阵分解处理,得到用户兴趣得分矩阵和信息属性得分矩阵,并将所述用户兴趣得分矩阵与所述信息属性得分矩阵相乘,得到用户得分矩阵,其中,所述用户得分矩阵中含有所述待推荐用户对于所有候选信息的用户意向得分,并且所述初步得分矩阵中缺失的数据位置所对应的待推荐用户对于该数据位置所对应的候选信息的用户意向得分,是综合具有相似兴趣的待推荐用户对于该数据位置所对应候选信息的评价所预测得到的;
候选信息推荐模块,配置为根据所述用户得分矩阵,向所述待推荐用户进行所述候选信息的推荐。
12.一种电子设备,其特征在于,包括:
存储器,存储有计算机可读指令;
处理器,读取存储器存储的计算机可读指令,以执行权利要求1-10中的任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1-10中的任一项所述的方法。
CN202011213080.0A 2020-11-03 2020-11-03 信息推荐方法及装置、电子设备、存储介质 Active CN112395499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011213080.0A CN112395499B (zh) 2020-11-03 2020-11-03 信息推荐方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011213080.0A CN112395499B (zh) 2020-11-03 2020-11-03 信息推荐方法及装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN112395499A CN112395499A (zh) 2021-02-23
CN112395499B true CN112395499B (zh) 2022-08-12

Family

ID=74598086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011213080.0A Active CN112395499B (zh) 2020-11-03 2020-11-03 信息推荐方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN112395499B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742572B (zh) * 2021-08-03 2024-09-06 杭州网易云音乐科技有限公司 一种数据的推荐方法、装置、电子设备及存储介质
CN114417174B (zh) * 2022-03-23 2022-06-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及计算机存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016191959A1 (zh) * 2015-05-29 2016-12-08 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN108038629A (zh) * 2017-12-30 2018-05-15 北京工业大学 一种基于协同过滤的优化方法
CN109389447A (zh) * 2017-08-04 2019-02-26 北京京东尚科信息技术有限公司 项目推荐方法、项目推荐系统以及计算机可读介质
CN110110226A (zh) * 2019-04-18 2019-08-09 国家电网有限公司 一种推荐算法、推荐系统及终端设备
CN111460316A (zh) * 2020-03-20 2020-07-28 南京邮电大学 一种面向知识系统的个性化推荐方法及计算机存储介质
CN111709810A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于推荐模型的对象推荐方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10255628B2 (en) * 2015-11-06 2019-04-09 Adobe Inc. Item recommendations via deep collaborative filtering
CN106055713B (zh) * 2016-07-01 2019-10-18 华南理工大学 基于用户兴趣和社交主题提取的社交网络用户推荐方法
CN108763314B (zh) * 2018-04-26 2021-01-19 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN109460512B (zh) * 2018-10-25 2022-04-22 腾讯科技(北京)有限公司 推荐信息处理方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016191959A1 (zh) * 2015-05-29 2016-12-08 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN109389447A (zh) * 2017-08-04 2019-02-26 北京京东尚科信息技术有限公司 项目推荐方法、项目推荐系统以及计算机可读介质
CN108038629A (zh) * 2017-12-30 2018-05-15 北京工业大学 一种基于协同过滤的优化方法
CN110110226A (zh) * 2019-04-18 2019-08-09 国家电网有限公司 一种推荐算法、推荐系统及终端设备
CN111460316A (zh) * 2020-03-20 2020-07-28 南京邮电大学 一种面向知识系统的个性化推荐方法及计算机存储介质
CN111709810A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于推荐模型的对象推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的推荐系统研究综述;黄立威等;《计算机学报》;20180731;第41卷(第7期);第1619-1647页 *

Also Published As

Publication number Publication date
CN112395499A (zh) 2021-02-23

Similar Documents

Publication Publication Date Title
CN110008973B (zh) 一种模型训练方法、基于模型确定目标用户的方法及装置
CN112380449B (zh) 信息推荐方法、模型训练方法及相关装置
CN109933699A (zh) 一种学术画像模型的构建方法及装置
EP4083857A1 (en) Information prediction model training method and apparatus, information prediction method and apparatus, storage medium, and device
CN106600052A (zh) 一种基于时空轨迹的用户属性与社会网络检测系统
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN105225135B (zh) 潜力客户识别方法以及装置
CN112395499B (zh) 信息推荐方法及装置、电子设备、存储介质
CN112288554B (zh) 商品推荐方法和装置、存储介质及电子装置
CN104993962A (zh) 获取终端使用状态的方法和系统
CN111552835A (zh) 文件推荐方法、装置及服务器
CN113592535A (zh) 一种广告推荐方法、装置、电子设备和存储介质
CN111062774B (zh) 活动投放方法、装置、电子设备和计算机可读介质
CN112989174A (zh) 信息推荐方法及装置、介质和设备
CN112269943B (zh) 一种信息推荐系统及方法
CN113032676A (zh) 基于微反馈的推荐方法和系统
CN116955805A (zh) 业务目标预测模型的训练方法、信息推荐方法及相关装置
CN114357242A (zh) 基于召回模型的训练评估方法及装置、设备、存储介质
CN117196744A (zh) 商品推荐方法、装置、设备及计算机可读存储介质
CN114429384A (zh) 基于电商平台的产品智能推荐方法及系统
CN115700550A (zh) 标签分类模型训练和对象筛选方法、设备及存储介质
CN114764472A (zh) 一种内容推送方法及装置
CN113919893B (zh) 信息推送方法、装置、电子设备和可读介质
WO2022004399A1 (ja) 操作予測装置及びそのモデル学習方法、操作予測方法
CN114510638B (zh) 信息处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40038266

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant