CN117591745A - 融合多路召回算法的信息推荐方法、装置、设备及介质 - Google Patents
融合多路召回算法的信息推荐方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117591745A CN117591745A CN202311775509.9A CN202311775509A CN117591745A CN 117591745 A CN117591745 A CN 117591745A CN 202311775509 A CN202311775509 A CN 202311775509A CN 117591745 A CN117591745 A CN 117591745A
- Authority
- CN
- China
- Prior art keywords
- user
- candidate
- users
- alternative
- time period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 43
- 230000006399 behavior Effects 0.000 claims description 188
- 230000003993 interaction Effects 0.000 claims description 47
- 238000000605 extraction Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 15
- 230000002452 interceptive effect Effects 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000003542 behavioural effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种融合多路召回算法的信息推荐方法、装置、设备及介质。该方法包括:获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据;将历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,第一时间段先于第二时间段;根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户;根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户;获取备选对象的推送信息发送至备选对象对应的推送用户。本发明实施例的技术方案可以提高信息推送的准确率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及融合多路召回算法的信息推荐方法、装置、设备及介质。
背景技术
随着国内科技的发展,各个科技产品被应用在了人们生活的方方面面,人们可以通过科技产品获取各类信息。
若想将消息发送至用户,可通过传统的信息推送的方式。运营人员或产品经理等可根据经验将信息推送给目标用户群体。
但是传统的凭经验进行信息推送方式,可能会将无效或者错误的信息推送给用户。
发明内容
本发明提供了融合多路召回算法的信息推荐方法、装置、设备及介质,本发明实施例的技术方案可以提高信息推送的准确性。
第一方面,本发明实施例提供了一种基于行为数据的信息推送方法,该方法包括:
获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据;
将历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,第一时间段先于第二时间段;
根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户;
根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户;
获取备选对象的推送信息发送至备选对象对应的推送用户。
第二方面,本发明实施例还提供了融合多路召回算法的信息推荐装置,该装置包括:
数据获取模块,用于获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据;
时间划分模块,用于将历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,第一时间段先于第二时间段;
推送用户确定模块,用于根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户;
用户融合模块,用于根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户;
信息发送模块,用于获取备选对象的推送信息发送至备选对象对应的推送用户。
第三方面,本发明实施例还提供了融合多路召回算法的信息推荐设备,设备包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的融合多路召回算法的信息推荐方法。
根据本发明的另一方面,提供了一种计算机可读介质,计算机存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的融合多路召回算法的信息推荐方法。
本发明实施例的技术方案,通过对第一时间段的行为数据采用多个方式得到多个方式对应的推送用户,通过多维方式进行推送用户的获取,有利于提升获取推送用户的全面性,通过第二时间段的行为数据对第一时间段获取的推送用户融合,对推送用户进行进一步地细化处理,获取最终的推送用户,有利于减少数据量,提升信息推送的效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的融合多路召回算法的信息推荐方法的流程图;
图2是根据本发明实施例二提供的融合多路召回算法的信息推荐方法的流程图;
图3是根据本发明实施例二提供的融合多路召回算法的信息推荐方法的流程图;
图4是根据本发明实施例提供的融合多路召回算法的信息推荐装置的结构图;
图5是实现本发明实施例提供的融合多路召回算法的信息推荐设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例的技术方案中,所涉及的用户集合在历史时间段内的行为数据等的获取、存储和应用等,通过用户触发,经过用户授权得到,均符合相关法律法规的规定,且不违背公序良俗。
实施例一
图1为本发明实施例一提供的融合多路召回算法的信息推荐方法的流程图。本发明实施例可适用于信息推送的情况,该方法可以由基于融合多路召回算法的信息推荐装置来执行,该融合多路召回算法的信息推荐装置可以采用硬件和/或软件的形式实现。
参见图1所示的融合多路召回算法的信息推荐方法,包括:
S101、获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据。
其中,待推荐对象集合可以是推送给用户的对象的集合,可以用I表示,待推荐对象可以用ITEMID表示,ITEMID∈I。每个待推荐对象存在至少一个属性信息,不同业务场景的待推荐对象的属性信息不同。示例性的,业务场景为新闻,则待推荐对象的属性信息包括但不限于:新闻标题、新闻事件发生时间、新闻事件发生地点和新闻事件涉及人物等。业务场景为商品,则待推荐对象的属性信息包括但不限于:商品唯一身份标识号(IdentityDocument,ID)、商品名称、商品标签、商品描述、商品品牌及商品价格等。
用户集合可以是待筛选出进行信息推送的用户的集合,可以用U表示;每个用户存在至少一个属性信息,包括用户唯一标识ID(userid)、年龄、地域及性别等。历史时间段可以是预设的一个过去的时间段,可以是过去一年或者几个月,具体时间选择视业务场景而定。行为数据可以是某个用户和某个对象在某个时间点发生了某个行为的信息。行为数据包括用户唯一身份标识号ID、物品唯一身份标识号ID、行为类型和行为发生时间等属性信息。行为数据可以通过T表示。行为类型随着业务场景差异而不同,比如点击、点赞或收藏等。考虑到评判用户对推送信息是否感兴趣,往往是看用户对推送信息是否有行为数据。需要说明的是,用户的信息以及行为数据等与用户相关的数据,均经过用户授权后获取。
具体的,获取方式包括但不限于:爬虫获取、用户输入或查询数据日志等。通过获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据,便于确定待推荐对象和所需信息推送的用户数量,分别表示为:ITEMID和N。
在一个例子中,预设的历史时间段为XX年01月01日00时00分00秒到XX年08月31日24时00分00秒。通过用户输入获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据;待推荐对象集合包括短袖、裤子和鞋;用户集合包括用户1、用户2和用户3;用户集合在XX年01月01日00时00分00秒到XX年08月31日24时00分00秒内的行为数据包括:用户1在XX年01月01日01时01分01秒对裤子进行收藏,用户2在XX年05月05日05时05分05秒对短袖进行收藏及用户3在XX年08月08时08分08秒对鞋进行收藏。
在一个具体的例子中,预设的历史时间段为XX年02月01日00时00分00秒到XX年07月31日24时00分00秒。通过用户输入获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据;待推荐对象集合包括时政新闻和娱乐新闻;用户集合包括用户1和用户2;用户集合在XX年02月01日00时00分00秒到XX年07月31日24时00分00秒内的行为数据包括:用户1在XX年02月02日02时02分02秒对时政新闻进行收藏,用户2在XX年03月03日03时03分03秒对娱乐新闻进行收藏。
S102、将历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,第一时间段先于第二时间段。
其中,历史时间段可以是当前时间之前的某个时间段,历史时间段包括第一时间段和第二时间段。第一时间段的时长可以和第二时间段的时长相同,也可以不同,本实施例对此不进行限制。第一时间段和第二时间段的时长的总和等于预设的历史时间段。
具体的,对I、U及T中的数据进行清洗,包括空值检查、字段取值类型判断和范围判断等,不符合项删除。将T按照某个时间点进行数据切分,示例的,分别是过往一段时间(如半年)的数据d和最近一段时间(如一个月)的数据DA。D的长度也就是行为数据的条数,记为|D|。
在一个例子中,预设的历史时间段为XX年01月01日00时00分00秒到XX年08月31日24时00分00秒。将历史时间段划分为第一时间段和第二时间段,第一时间段为XX年01月01日00时00分00秒到XX年06月30日24时00分00秒,第二时间段为XX年07月01日00时00分00秒到XX年08月31日24时00分00秒。将XX年01月01日00时00分00秒到XX年06月30日24时00分00秒的行为数据作为第一时间段的行为数据;将XX年07月01日00时00分00秒到XX年08月31日24时00分00秒的行为数据作为第二时间段的行为数据。
S103、根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户。
其中,备选对象可以是待进行推送的对象,待推荐对象集合由备选对象组成。推送用户可以是被推送备选对象的用户。
具体的,获取用户集合中每一个用户在第一时间段的行为数据,通过多个方式,获取通过多个方式获得的待推荐对象集合中各备选对象的推送用户,生成候选用户列表,可以用表示。各方式获得的各备选对象对应的推送用户可能相同,也可能不同。对于待推送对象ITEMID和所需信息推荐的用户数量N,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户。
在一个例子中,用户集合包括:用户1和用户2;待推荐对象集合中备选对象包括:短袖和裤子。根据用户集合在第一时间段的行为数据,通过方式1获取短袖对应的推送用户为用户3;通过方式2获取短袖对应的推送用户为用户4;通过方式1获取裤子对应的推送用户为用户5;通过方式2获取裤子对应的推送用户为用户6。
例如新闻场景中,用户集合包括:用户A和用户B;待推荐对象集合中备选对象包括:时政新闻和娱乐新闻。根据用户集合在第一时间段的行为数据,通过方式1获取时政新闻对应的推送用户为用户C;通过方式2获取时政新闻对应的推送用户为用户D;通过方式1获取娱乐新闻对应的推送用户为用户E;通过方式2获取娱乐新闻对应的推送用户为用户F。
S104、根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户。
其中,融合用于对推送用户进行清洗,例如,可以是对同一推送用户进行去重。
具体的,设置预取数量K,如果通过每一种方式生成的K个用户-待推送对象对中的每一项<useridi,ITEMID>在第二时间段DA有对应的行为数据,如收藏,则记数加1,否则不将记数加1,最终计数为P,则P≤K,得到各备选对象对应的推送用户。
在一个例子中,设置预取数量1,ITEMID表示短袖,根据用户集合在第一时间段的行为数据,通过方式1获取短袖对应的推送用户1,生成的用户-待推送对象对为<userid1,ITEMID>;通过方式2获取短袖对应的推送用户2,生成的用户-待推送对象对为<userid2,ITEMID>。第二时间段的行为数据包括用户1在XX年08月08时08分08秒对短袖进行收藏,则<userid1,ITEMID>记数加1。
S105、获取备选对象的推送信息发送至备选对象对应的推送用户。
其中,推送信息可以是预备推送的备选对象的信息,例如备选对象的属性信息或者描述信息。
具体的,获取到推送用户后,按照预设方式将备选对象的属性信息发送至推送用户。预设方式包括但不限于:在某个时间点发送、按规定频率发送或按推送用户数量发送。
在一个例子中,预设推送用户数量为100个,获取到推送用户后,按照预设推送用户数量将推送的备选对象的属性信息发送至推送用户。
本发明实施例的技术方案,通过对第一时间段的行为数据采用多个方式得到多个方式对应的推送用户,通过多维方式进行推送用户的获取,有利于提升获取推送用户的全面性,通过第二时间段的行为数据对第一时间段获取的推送用户融合,对推送用户进行进一步地细化处理,获取最终的推送用户,有利于减少数据量,提升信息推送的效率。
可选的,备选对象,包括:新闻、文章、网页、视频、直播间或产品。
具体的,可将新闻、文章、网页、视频、直播间或产品的图像、视频或文档等发送至推送用户。
在一个例子中,将短袖的产地、颜色及衣长信息发送至推送用户;将娱乐新闻的新闻事件发生时间、新闻事件涉及人物和新闻事件发生地点信息发送至推送用户;将小说的文章标题、文章内容或文章作者信息发送至推送用户;将网页的网页地址和网页标题信息发送至推送用户;将视频的视频标题、视频内容介绍和视频作者信息发送至推送用户;将直播间的直播间标题和直播间链接信息发送至推送用户;将玩具汽车的材质和玩具产地信息发送至推送用户。
通过将新闻、文章、网页、视频、直播间或产品的信息发送至推送用户,有利于将信息推送至对其感兴趣的用户,提升信息推送范围和推送效率。
实施例二
图2为本发明实施例二提供的融合多路召回算法的信息推荐方法的流程图。本发明实施例在上述实施例的基础上,对融合多路召回算法的信息推荐的操作进行了优化改进。
进一步地,将“根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户”细化为“根据用户集合中备选用户在第一时间段的行为数据,确定待推荐对象集合中备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的行为数量;根据用户集合中备选用户在第一时间段的行为数据,以及各备选用户针对各备选对象的行为数量,确定各备选用户针对各备选对象的交互权重;根据各备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的交互权重,确定在行为数据方式下,待推荐对象集合中备选对象对应的推送用户”,以完善对信息推送的操作。
需要说明的是,在本发明实施例中未详述的部分,可参见其他实施例的表述。
参见图2所示的融合多路召回算法的信息推荐方法,包括:
S201、获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据。
S202、将历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,第一时间段先于第二时间段。
S203、根据用户集合中备选用户在第一时间段的行为数据,确定待推荐对象集合中备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的行为数量。
具体的,备选用户可以是对备选对象存在交互操作的用户。行为数量为备选用户对备选对象的交互行为的行为条数。根据用户集合中备选用户在第一时间段的行为数据,遍历D的所有数据,对于itemidi,统计对应的任意一个备选用户useridp的行为数量countp。
在一个例子中,对于备选对象ITEMID为短袖,用户集合D包括:userid1及userid2。根据用户集合中备选用户在第一时间段的行为数据,遍历D中的所有数据,统计userid1的行为数量count1的值为2,userid2的行为数量count2的值为1。
S204、根据用户集合中备选用户在第一时间段的行为数据,以及各备选用户针对各备选对象的行为数量,确定各备选用户针对各备选对象的交互权重。
其中,备选对象的交互权重用于确定备选用户对备选对象产生交互行为的概率。
具体的,根据用户集合U中备选用户在第一时间段D的行为数据T,以及各备选用户针对各备选对象的行为数量,遍历D的所有数据,对于各备选对象ITEMID,统计对应的任意一个备选用户useridp的行为数量countp,进而得到各备选用户针对各备选对象的交互权重,交互权重计算公式如下所示:
则ITEMID对应的有行为数据的用户列表如下:
DITEMID=[userid1:weight1,userid2:weight2,…,useridr:weightr]
在一个例子中,对于备选对象ITEMID为短袖,共有1个属性信息,属性信息itemid1为颜色。用户集合D包括:userid1及userid2。根据用户集合中备选用户在第一时间段的行为数据,遍历D中的所有数据,统计userid1的行为发生次数count1的值为2,userid2的行为发生次数count2的值为1。
对于短袖,统计userid1及行为发生次数count1的值为1,userid2的行为发生次数count2的值为2,进而得到交互权重,userid1的交互权重为userid2的交互权重为/>则短袖对应的有行为数据的备选用户列表如下:
S205、根据各备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的交互权重,确定在行为数据方式下,待推荐对象集合中备选对象对应的推送用户。
具体的,根据用户集合U中各备选用户在第一时间段D的行为数据T,以及各备选用户针对各备选对象的行为数量,遍历D的所有数据,对于各备选对象ITEMID,统计对应的任意一个备选用户useridp行为数量countp,进而得到各备选对象的交互权重,则ITEMID对应的候选用户列表如下:
DITeMID=[userid1:weight1,userid2:weight2,…,useridt:weightt]
在一个例子中,对于备选对象ITEMID为短袖,用户集合U包括:userid1及userid2。根据用户集合中各备选用户在第一时间段的行为数据,遍历D中的所有数据,统计userid1的行为数量count1的值为2,userid2的行为数量count2的值为1,进而得到各备选对象的交互权重,则ITEMID对应的候选用户列表为根据候选用户列表选取备选对象对应的推送用户。
S206、根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户。
S207、获取备选对象的推送信息发送至备选对象对应的推送用户。
本发明实施例通过计算备选用户针对备选对象的交互权重,判断备选用户对备选对象的产生行为的概率,以及感兴趣程度,提升信息推送的准确性。
可选的,根据各备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的交互权重,确定在行为数据方式下,待推荐对象集合中备选对象对应的推送用户,包括:根据各备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的交互权重,确定各备选用户的特征信息;根据各备选用户的特征信息,确定各备选用户与其他备选用户之间的相似度值;根据各备选对象存在交互行为的备选用户,各备选用户针对各备选对象的交互权重,以及各备选用户与其他备选用户之间的相似度值,确定各备选对象对各备选用户的推送概率;根据各备选对象对各备选用户的推送概率,确定各备选对象对应的推送用户。
其中,特征信息用于描述用户,可以用候选用户列表中用户信息组成的字符串表征。相似度值可以是各备选用户与其他备选用户之间的相似程度数值。推送概率可以是各备选对象对各备选用户推送的概率。
具体的,对任意的ITEMID,其候选用户列表进一步地处理成STRITEMID=“userid1userid2…useridr”,也就是转化成字符串的形式,以空格进行分割得到的值确定为各备选用户的特征信息。将I中所有ITEMID的备选用户的特征信息,输入至生成相似度(Generate Similarity,Gensim)库中的单词转换向量(word to vector,word2vec)模型进行处理,进而对于任意的ITEMID∈U,调用训练好的word2vec模型,可以得到v个相似用户列表,记为SIMITEMID=[userid1:sim1,userid2:sim2,…,useridv:simv],其中v为常数,可提前设置,而simv为userid和useridv的相似度值。进而,对于任意的ITEMID∈I,可以得到ITEMID对userid的推送概率,记为bias(userid,ITEMID)。
进一步地,得到归一化后的推送概率,记为norm_bias(userid,ITEMID)。
按照norm_bias从高到到底排序,进而得到对ITEMID有推送概率的推送用户列表。
Bitemid=[userid1:weight1,userid2:weight2,…,useridx:weightx]
其中weightx表示useridx对ITEMID的归一化的推送概率,即norm_bias(useridx,ITEMID)。
在一个例子中,保底候选用户列表的值为Dbd=[userid1:2,userid2:1]。ITEMID对应的候选用户列表为进一步地处理成STRITEMID=“userid1userid2”,确定为备选用户的特征信息。将I中所有ITEMID的备选用户的特征信息,输入至Gensim库中的word2vec模型进行处理,进而对于任意的ITEMID∈U,调用训练好的word2vec模型,可以得到2个相似用户列表,记为SIMITEMID=[userid1:0.8,userid2:0.2],进而,对于任意的ITEMID∈I,可以得到userid对ITEMID的推送概率,记为bias(userid,ITEMID),进一步地,可以的到归一化后的推送概率,记为norm_bias(userid,ITEMID),按照norm_bias从高到到底排序,进而得到对ITEMID有推送概率的推送用户列表BITEMID。
BITEMID=[userid1:weight1,userid2:weight2]
通过根据各备选用户的特征信息,确定各备选用户与其他备选用户之间的相似度值,有利于确定各备选对象对各备选用户的推送概率,获取推送概率较大的推送用户,提升信息推送的准确性。
可选的,根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户,包括:根据用户集合中备选用户在第一时间段的行为数据,获取各备选用户的行为次数;根据各备选用户的行为次数,在各备选用户中筛选各备选对象对应的推送用户。
其中,行为次数可以是用户针对同一备选对象存在的行为数据的条数。
具体的,根据用户集合中备选用户在第一时间段的行为数据,遍历D的所有数据,对于ITEMID,统计对应的任意一个备选用户useridp的行为次数countp,按照备选用户行为发生次数从高到低进行排序,进而可以生成保底候选用户列表Dbd,根据保底候选用户列表Dbd中各备选用户的行为次数,在保底候选用户列表Dbd的各备选用户中筛选各备选对象对应的推送用户。
Dbd=[userid1:count1,userid2:count2,…userids:counts]
在一个例子中,对于备选对象ITEMID为短袖,用户集合D包括:userid1及userid2。根据用户集合中备选用户在第一时间段的行为数据,遍历D中的所有数据,统计userid1的行为次数count1的值为2,userid2的行为次数count2的值为1。按照用户行为次数从高到低进行排序,进而可以生成保底候选用户列表的值为Dbd=[userid1:2,userid2:1]。
通过对备选用户的行为次数进行统计,便于确定对于同一备选对象,不同备选用户对其的感兴趣程度。
可选的,根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户,包括:根据用户集合中备选用户在第一时间段的行为数据,以及待推荐对象集合中备选对象的至少一个属性信息,确定各属性信息存在交互行为的备选用户,以及各备选用户针对各属性信息的行为数量;根据用户集合中备选用户在第一时间段的行为数据,以及各备选用户针对各属性信息的行为数量,确定各备选用户针对各属性信息的交互权重;根据各备选对象的至少一个属性信息,以及各备选用户针对各属性信息的交互权重,确定在对象属性信息方式下,待推荐对象集合中备选对象对应的推送用户。
其中,属性信息的交互权重可以是用户对属性的产生行为的概率。
具体的,根据用户集合U中备选用户在第一时间段D的行为数据T,以及待推荐对象集合中备选对象的至少一个属性信息,结合备选对象的不同属性信息,比如标签、类别及所属地域等信息。对于任意的备选对象ITEMID,共有m个属性信息,其第i个属性信息为itemidi,确定各属性信息存在交互行为的备选用户。示例的,备选对象ITEMID为短袖,共有2个属性信息,其第1个属性信息itemid1为颜色,第2个属性信息itemid2为所属地域。
遍历D的所有数据,对于itemidi,统计对应的任意一个备选用户useridp及各备选用户针对各属性信息的行为数量countp,进而得到各备选用户针对各属性信息的交互权重,交互权重计算公式如下所示:
则itemidi对应的候选用户列表为
Ditemidi=[userid1:weight1,userid2:weight2,…,useridt:weightt]
这样基于m个属性信息,可以得到m个候选用户列表。如果属性信息的取值有多个,可以针对每一个属性信息进行计算。示例性的,一个待推荐对象的属性信息有“属性信息1;属性信息2;属性信息3”,可以按照“;”切成三个属性信息,然后分别对属性信息1、属性信息2和属性信息3进行累加计数。
在一个例子中,对于备选对象ITEMID为短袖,共有1个属性信息,属性信息itemid1为颜色。用户集合D包括:userid1及userid2。根据用户集合中备选用户在第一时间段的行为数据,遍历D中的所有数据,统计userid1的行为数量count1的值为2,userid2的行为数量count2的值为1。按照用户行为数量从高到低进行排序,进而可以生成保底候选用户列表的值为Dbd=[userid1:2,userid2:1]。
对于短袖,统计userid1及行为数量count1的值为1,userid2的行为数量count2的值为2,进而得到交互权重,则itemid1对应的候选用户列表为这样基于1个属性,可以得到1个候选用户列表。
通过对各用户对各备选对象的不同属性信息的交互权重进行计算,有利于获取用户对属性的产生行为的概率,提升信息推送的准确性。
可选的,根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户,包括:针对各备选对象,按照各方式对应的抽取比例,从各方式下对应的推送用户中抽取目标用户,形成备选对象与目标用户的对象用户组;根据用户集合中备选用户在第二时间段的行为数据,对各对象用户组进行统计;根据各对象用户组的统计结果,调整各方式对应的抽取比例;针对各备选对象,根据各方式对应的抽取比例,分别从备选对象在各方式下对应的推送用户中抽取推送用户,并进行融合,得到备选对象对应的推送用户。
其中,抽取比例可以是从通过各方式获取的推送用户中选取推送用户的数量占全部数量的比例。统计结果可以是用户在第二时间段是否产生相同行为的检测结果。
具体的,获取用户集合中每一个备选用户在第一时间段的行为数据,通过多个方式,获取通过多个方式获得的待推荐对象集合中各备选对象的推送用户,生成候选用户列表,可以用DITEMID表示。各方式获得的各备选对象对应的推送用户可能相同,也可能不同。对于待推送对象ITEMID和所需信息推荐的用户数量N,采用多个方式,按照各方式对应的抽取比例,从各方式下对应的推送用户中抽取目标用户,确定在各方式下,形成备选对象与目标用户的对象用户组。设置预取数量K,通过三种方式进行预取。通过第一种方式可以是从中取K个目标用户,形成备选对象与目标用户的对象用户组;通过第二种方式可以是根据ITEMID的m个属性信息分别从对应的候选用户列表/>中取K个目标用户,形成备选对象与目标用户的对象用户组;通过第三种方式可以是从Bitemid中取K个目标用户。上述共有m+2路预取目标用户方式,对于每一种方式可以形成K个备选对象与目标用户的对象用户组,即:<userid1,ITEMID>,<userid2,ITEMID>,…,<useridK,ITEMID>。
如果<useridi,ITEMID>在DA有行为数据,如收藏,则记数加1,否则不记数,最终计数为P,则P≤K,得到统计结果,则可以计算每一路预取方式的预取命中率Hit@K,预取命中率计算公式如下所示。
设置候选结果数量M=α*N,其中α是增量系数可能有重合,是预设的大于1的常数值。N预设的推送人数,基于m+2路预取用户方式,则第j路获取候选结果数量Qj是M和其预取命中率的乘积,即Qj=M*Hit@Kj,对应的用户列表为:
对m+2路获取用户的列表进行融合,则userid对ITEMID的抽取比例为:
合并后最终的用户列表为
R=[userid1:weight1,userid2:weight2,…,useridz:weightz]
其中z为合并后的用户数量如果z≥N,则取R最前面的N个用户作为推送用户集合S,否则走到保量处理,从Dbd从前到后依次取用户,如果用户不在S中则将其加入S中,存在的话则删除,直到S中用户数量为N或者Dbd取完则终止。
在一个例子中,如图3所示,确定待推送对象,进行数据获取及预处理,预设K的值为3,对于备选对象ITEMID为短袖,共有1个属性信息,属性信息itemid1为颜色。用户集合D包括:userid1及userid2。根据用户集合中备选用户在第一时间段的行为数据,遍历D中的所有数据,统计userid1的行为数量count1的值为2,userid2的行为数量count2的值为1。按照用户行为数量从高到低进行排序,基于行为数据生成保底候选用户列表的值为Dbd=[userid1:2,userid2:1]。基于行为数据生成保底候选用户列表获取推送用户。<userid1,ITEMID>在DA有行为数据,则count1的值为3,userid1的count1的最终计数P为3,则P≤K。则可以计算每一路预取方式的预取命中率Hit@K。设置候选结果数量M=α*N,其中α是增量系数可能有重合,大于1的常数值。N预设的推送人数,基于前述的m+2路预取用户方式,则第j路获取候选结果数量Qj是M和其预取命中率的乘积,即Qj=M*Hit@Kj,对应的用户列表为:
Rj=[userid1:weight1,userid2:weight2]
对m+2路获取用户的列表进行合并,则userid对ITEMID的抽取比例为:
合并后最终的用户列表为
R=[userid1:weight1,userid2:weight2],其中z为合并后的用户数量,z≥N,则走到保量处理。
通过各对象用户组的统计结果,调整各方式对应的抽取比例,根据各方式对应的抽取比例,分别从备选对象在各方式下对应的推送用户中抽取推送用户,有利于调整抽取用户的数量及抽取方式,便于获取更准确的推送用户集合,提高了信息推送的准确性。
实施例三
图4为本发明实施例四提供的融合多路召回算法的信息推荐装置的结构示意图。本发明实施例可适用于信息推送的情况,该装置可以执行融合多路召回算法的信息推荐方法,该装置可以采用硬件和/或软件的形式实现。
参见图4所示的融合多路召回算法的信息推荐装置,包括:数据获取模块401、时间划分模块402、推送用户确定模块403、用户融合模块404和信息发送模块405,其中,
数据获取模块401,用于获取待推荐对象集合、用户集合和用户集合在历史时间段内的行为数据;
时间划分模块402,用于将历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,第一时间段先于第二时间段;
推送用户确定模块403,用于根据用户集合在第一时间段的行为数据,采用多个方式,确定在各方式下,待推荐对象集合中备选对象对应的推送用户;
用户融合模块404,用于根据用户集合在第二时间段的行为数据,对各备选对象在不同方式下对应的推送用户进行融合,得到各备选对象对应的推送用户;
信息发送模块405,用于获取备选对象的推送信息发送至备选对象对应的推送用户。
本发明实施例的技术方案,通过对第一时间段的行为数据采用多个方式得到多个方式对应的推送用户,通过多维方式进行推送用户的获取,有利于提升获取推送用户的全面性,通过第二时间段的行为数据对第一时间段获取的推送用户融合,对推送用户进行进一步地细化处理,获取最终的推送用户,有利于减少数据量,提升信息推送的效率。
可选的,推送用户确定模块403,包括:
用户确定单元,用于根据用户集合中备选用户在第一时间段的行为数据,确定待推荐对象集合中备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的行为数量;
权重确定单元,用于根据用户集合中备选用户在第一时间段的行为数据,以及各备选用户针对各备选对象的行为数量,确定各备选用户针对各备选对象的交互权重;
用户推荐单元,用于根据各备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的交互权重,确定在行为数据方式下,待推荐对象集合中备选对象对应的推送用户。
可选的,用户推荐单元,具体用于:
根据各备选对象存在交互行为的备选用户,以及各备选用户针对各备选对象的交互权重,确定各备选用户的特征信息;
根据各备选用户的特征信息,确定各备选用户与其他备选用户之间的相似度值;
根据各备选对象存在交互行为的备选用户,各备选用户针对各备选对象的交互权重,以及各备选用户与其他备选用户之间的相似度值,确定各备选对象对各备选用户的推送概率;
根据各备选对象对各备选用户的推送概率,确定各备选对象对应的推送用户。
可选的,推送用户确定模块403,具体用于:
根据用户集合中备选用户在第一时间段的行为数据,以及待推荐对象集合中备选对象的至少一个属性信息,确定各属性信息存在交互行为的备选用户,以及各备选用户针对各属性信息的行为数量;
根据用户集合中备选用户在第一时间段的行为数据,以及各备选用户针对各属性信息的行为数量,确定各备选用户针对各属性信息的交互权重;
根据各备选对象的至少一个属性信息,以及各备选用户针对各属性信息的交互权重,确定在对象属性信息方式下,待推荐对象集合中备选对象对应的推送用户。
可选的,推送用户确定模块403,具体用于:
根据用户集合中备选用户在第一时间段的行为数据,获取各备选用户的行为次数;
根据各备选用户的行为次数,在各备选用户中筛选各备选对象对应的推送用户。
可选的,用户融合模块404,具体用于:
针对各备选对象,按照各方式对应的抽取比例,从各方式下对应的推送用户中抽取目标用户,形成备选对象与目标用户的对象用户组;
根据用户集合中备选用户在第二时间段的行为数据,对各对象用户组进行统计;
根据各对象用户组的统计结果,调整各方式对应的抽取比例;
针对各备选对象,根据各方式对应的抽取比例,分别从备选对象在各方式下对应的推送用户中抽取推送用户,并进行融合,得到备选对象对应的推送用户。
可选的,备选对象,包括:新闻、文章、网页、视频、直播间或产品。
本发明实施例所提供的基于行为数据的信息推送装置可执行本发明任意实施例所提供的融合多路召回算法的信息推荐方法,具备执行融合多路召回算法的信息推荐方法相应的功能模块和有益效果。
实施例四
图5示出了可以用来实施本发明的实施例的融合多路召回算法的信息推荐设备500的结构示意图。
如图5所示,融合多路召回算法的信息推荐设备500包括至少一个处理器501,以及与至少一个处理器501通信连接的存储器,如只读存储器(ROM)502、随机访问存储器(RAM)503等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器501可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM503中,还可存储信息推送设备500操作所需的各种程序和数据。处理器501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
融合多路召回算法的信息推荐设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许融合多路召回算法的信息推荐设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器501可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器501执行上文所描述的各个方法和处理,例如融合多路召回算法的信息推荐方法。
在一些实施例中,融合多路召回算法的信息推荐方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM502和/或通信单元509而被载入和/或安装到融合多路召回算法的信息推荐设备500上。当计算机程序加载到RAM503并由处理器501执行时,可以执行上文描述的融合多路召回算法的信息推荐方法的一个或多个步骤。备选地,在其他实施例中,处理器501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行融合多路召回算法的信息推荐方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在融合多路召回算法的信息推荐设备上实施此处描述的系统和技术,该融合多路召回算法的信息推荐设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给融合多路召回算法的信息推荐设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS(VirtualPrivate Server,虚拟专用服务器)服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.融合多路召回算法的信息推荐方法,其特征在于,所述方法包括:
获取待推荐对象集合、用户集合和所述用户集合在历史时间段内的行为数据;
将所述历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,所述第一时间段先于所述第二时间段;
根据所述用户集合在第一时间段的行为数据,采用多个方式,确定在各所述方式下,所述待推荐对象集合中备选对象对应的推送用户;
根据所述用户集合在第二时间段的行为数据,对各所述备选对象在不同方式下对应的推送用户进行融合,得到各所述备选对象对应的推送用户;
获取所述备选对象的推送信息发送至所述备选对象对应的推送用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户集合在第一时间段的行为数据,采用多个方式,确定在各所述方式下,所述待推荐对象集合中备选对象对应的推送用户,包括:
根据所述用户集合中备选用户在第一时间段的行为数据,确定所述待推荐对象集合中备选对象存在交互行为的备选用户,以及各所述备选用户针对各所述备选对象的行为数量;
根据所述用户集合中备选用户在第一时间段的行为数据,以及各所述备选用户针对各所述备选对象的行为数量,确定各所述备选用户针对各所述备选对象的交互权重;
根据各所述备选对象存在交互行为的备选用户,以及各所述备选用户针对各所述备选对象的交互权重,确定在行为数据方式下,所述待推荐对象集合中备选对象对应的推送用户。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述备选对象存在交互行为的备选用户,以及各所述备选用户针对各所述备选对象的交互权重,确定在行为数据方式下,所述待推荐对象集合中备选对象对应的推送用户,包括:
根据各所述备选对象存在交互行为的备选用户,以及各所述备选用户针对各所述备选对象的交互权重,确定各所述备选用户的特征信息;
根据各所述备选用户的特征信息,确定各所述备选用户与其他备选用户之间的相似度值;
根据各所述备选对象存在交互行为的备选用户,各所述备选用户针对各所述备选对象的交互权重,以及各所述备选用户与其他备选用户之间的相似度值,确定各所述备选对象对各所述备选用户的推送概率;
根据各所述备选对象对各所述备选用户的推送概率,确定各所述备选对象对应的推送用户。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户集合在第一时间段的行为数据,采用多个方式,确定在各所述方式下,所述待推荐对象集合中备选对象对应的推送用户,包括:
根据所述用户集合中备选用户在第一时间段的行为数据,以及所述待推荐对象集合中备选对象的至少一个属性信息,确定各所述属性信息存在交互行为的备选用户,以及各所述备选用户针对各所述属性信息的行为数量;
根据所述用户集合中备选用户在第一时间段的行为数据,以及各所述备选用户针对各所述属性信息的行为数量,确定各所述备选用户针对各所述属性信息的交互权重;
根据各所述备选对象的至少一个属性信息,以及各所述备选用户针对各所述属性信息的交互权重,确定在对象属性信息方式下,所述待推荐对象集合中备选对象对应的推送用户。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用户集合在第一时间段的行为数据,采用多个方式,确定在各所述方式下,所述待推荐对象集合中备选对象对应的推送用户,包括:
根据所述用户集合中备选用户在第一时间段的行为数据,获取各所述备选用户的行为次数;
根据各所述备选用户的行为次数,在各所述备选用户中筛选各所述备选对象对应的推送用户。
6.根据权利要求1所述的方法,其特征在于,所述根据所述用户集合在第二时间段的行为数据,对各所述备选对象在不同方式下对应的推送用户进行融合,得到各所述备选对象对应的推送用户,包括:
针对各所述备选对象,按照各所述方式对应的抽取比例,从各所述方式下对应的推送用户中抽取目标用户,形成所述备选对象与目标用户的对象用户组;
根据所述用户集合中备选用户在第二时间段的行为数据,对各所述对象用户组进行统计;
根据各所述对象用户组的统计结果,调整各所述方式对应的抽取比例;
针对各所述备选对象,根据各所述方式对应的抽取比例,分别从所述备选对象在各所述方式下对应的推送用户中抽取推送用户,并进行融合,得到所述备选对象对应的推送用户。
7.根据权利要求1所述的方法,其特征在于,所述备选对象,包括:新闻、文章、网页、视频、直播间或产品。
8.融合多路召回算法的信息推荐装置,其特征在于,所述装置包括:
数据获取模块,用于获取待推荐对象集合、用户集合和所述用户集合在历史时间段内的行为数据;
时间划分模块,用于将所述历史时间段的行为数据划分为第一时间段的行为数据和第二时间段的行为数据;其中,所述第一时间段先于所述第二时间段;
推送用户确定模块,用于根据所述用户集合在第一时间段的行为数据,采用多个方式,确定在各所述方式下,所述待推荐对象集合中备选对象对应的推送用户;
用户融合模块,用于根据所述用户集合在第二时间段的行为数据,对各所述备选对象在不同方式下对应的推送用户进行融合,得到各所述备选对象对应的推送用户;
信息发送模块,用于获取所述备选对象的推送信息发送至所述备选对象对应的推送用户。
9.融合多路召回算法的信息推荐设备,其特征在于,所述融合多路召回算法的信息推荐设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的融合多路召回算法的信息推荐方法。
10.一种计算机可读介质,其特征在于,所述计算机可读介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的融合多路召回算法的信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311775509.9A CN117591745A (zh) | 2023-12-21 | 2023-12-21 | 融合多路召回算法的信息推荐方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311775509.9A CN117591745A (zh) | 2023-12-21 | 2023-12-21 | 融合多路召回算法的信息推荐方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117591745A true CN117591745A (zh) | 2024-02-23 |
Family
ID=89920263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311775509.9A Pending CN117591745A (zh) | 2023-12-21 | 2023-12-21 | 融合多路召回算法的信息推荐方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117591745A (zh) |
-
2023
- 2023-12-21 CN CN202311775509.9A patent/CN117591745A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909176B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN106156127B (zh) | 选择数据内容向终端推送的方法及装置 | |
CN106503014B (zh) | 一种实时信息的推荐方法、装置和系统 | |
CN109033408B (zh) | 信息推送方法及装置、计算机可读存储介质、电子设备 | |
CN109325182B (zh) | 基于会话的信息推送方法、装置、计算机设备及存储介质 | |
CN106649681B (zh) | 一种数据处理方法、装置及设备 | |
CN112632405B (zh) | 一种推荐方法、装置、设备及存储介质 | |
CN107870984A (zh) | 识别搜索词的意图的方法和装置 | |
CN111597446A (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN113392329A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN110598126B (zh) | 基于行为习惯的跨社交网络用户身份识别方法 | |
CN112861963A (zh) | 训练实体特征提取模型的方法、装置和存储介质 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN105190619B (zh) | 终端装置以及装置的程序 | |
CN115858815A (zh) | 确定映射信息的方法、广告推荐方法、装置、设备及介质 | |
CN113365138B (zh) | 内容展示方法、装置、电子设备、存储介质 | |
CN111723201A (zh) | 一种用于文本数据聚类的方法和装置 | |
CN103312584A (zh) | 一种在网络社区中发布信息的方法与设备 | |
CN117591745A (zh) | 融合多路召回算法的信息推荐方法、装置、设备及介质 | |
CN115329078A (zh) | 文本数据处理方法、装置、设备以及存储介质 | |
CN113076450A (zh) | 一种目标推荐列表的确定方法和装置 | |
CN114218480A (zh) | 信息展示方法、装置、电子设备和可读介质 | |
CN114117221A (zh) | 信息推荐方法、装置以及计算机可读存储介质 | |
CN116150470A (zh) | 内容推荐方法、装置、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |