CN112800325B - 物料推荐方法、系统、电子设备和存储介质 - Google Patents
物料推荐方法、系统、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112800325B CN112800325B CN202110055687.9A CN202110055687A CN112800325B CN 112800325 B CN112800325 B CN 112800325B CN 202110055687 A CN202110055687 A CN 202110055687A CN 112800325 B CN112800325 B CN 112800325B
- Authority
- CN
- China
- Prior art keywords
- recall
- data
- frequency filtering
- materials
- scheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000463 material Substances 0.000 title claims abstract description 203
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 91
- 230000006399 behavior Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010992 reflux Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 235000019633 pungent taste Nutrition 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种物料推荐方法、系统、电子设备和存储介质,其中,该方法包括:基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;对第一召回数据集合中的第一召回数据进行频次过滤,获得第二召回数据,并判断第二召回数据的数量是否达到一预设请求数量;当第二召回数据的数量达到预设请求数量,依据各关注参数对第二召回数据进行加权,并对加权后的第二召回数据进行排序;当第二召回数据的数量未达到预设请求数量,则重复数据召回步骤和频次过滤步骤,直至所有的第二召回数据的数据量之和达到预设请求数量。通过本申请,解决了推荐物料冗余和物料类型单一的问题,实现了推荐物料的多样性。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及物料推荐方法、系统、电子设备和存储介质。
背景技术
推荐系统广泛的支撑了整个互联网的各种应用和系统,比如今日头条实现千人千面的推荐功能,背后就需要推荐系统的支撑。很多互联网上的内容展示都来自推荐系统的推荐结果返回。而随着推荐系统的不断完善和发展,一些功能的实现却依旧庞杂而繁琐。就推荐的物料而言,众多物料在每次召回的过程中难免会有一些物料是相同的,这就导致用户体验很差,每次得到的推荐时一样的,这样推荐的效果也不会好。所以需要一种行之有效的方式使多次召回的物料避免出现相同的内容。
现有技术中,部分方案为物料只推荐一次,将推送过的物料按用户存储到mysql等存储介质中,每次训练模型时,将推荐过的物料过滤掉,然后按用户进行存储,这样推荐过的物料就不会再次推荐。
这样做对于存储空间浪费很大,要为每一个用户保存一份可推荐的物料表,且新建立的用户会无物料可推,对于模型的训练也压力很大。
现有技术中部分方案通过大量物料来规避该问题,当物料足够时,每次推荐时重复的几率就会很小。但对于物料量少的用户而言,该问题仍会出现。
目前针对相关技术中物料重复的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种物料推荐方法、系统、电子设备和存储介质,以至少解决相关技术中物料重复的问题。
第一方面,本申请实施例提供了一种物料推荐方法,包括以下步骤:
数据召回步骤,基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;
频次过滤步骤,对所述第一召回数据集合中的第一召回数据进行频次过滤,获得第二召回数据,并判断所述第二召回数据的数量是否达到一预设请求数量;
加权排序步骤,当所述第二召回数据的数量达到所述预设请求数量,依据各关注参数对所述第二召回数据进行加权,并对加权后的所述第二召回数据进行排序;
返回召回步骤,当所述第二召回数据的数量未达到所述预设请求数量,则重复所述数据召回步骤和所述频次过滤步骤,直至所有的第二召回数据的数据量之和达到所述预设请求数量;
物料推荐步骤,基于排序后的所述第二召回数据进行推荐;
在其中一些实施例中,所述频次过滤的具体方式包括日期频次过滤、次数频次过滤和分钟级频次过滤中其一或组合。
在其中一些实施例中,所述频次过滤步骤具体包括:
参数准备步骤,将所述第一召回数据中的用户数据、推荐位,以及以下至少一种:物料和日期组成key,并存入redis;
日期频次过滤步骤,通过设置一过期策略,根据所述过期策略,将在预设过期时间内在同一推荐位上推荐给同一个用户的所述物料过滤;
次数频次过滤步骤,将所述key的值作为一个当前游标的初始游标值,设置预设间隔数量,每次存入均将所述当前游标的值加1,当所述当前游标的值与所述初始游标值的差值小于所述预设间隔数量时,将该所述物料过滤;
分钟级频次过滤步骤,通过设置一过期时间,从所述key存入redis时开始计时,在所述过期时间内将对应所述物料过滤。
在其中一些实施例中,所述加权排序步骤具体包括以下步骤:
关注参数设置步骤,基于所述第二召回数据的曝光几率设置关注参数;
物料打分步骤,对所述第二召回数据进行打分,并将打分结果依据所述关注参数进行加权;
物料排序步骤,依据加权后的所述打分结果对所述第二召回数据进行排序。
在其中一些实施例中,所述召回方案包括随机召回方案、模型召回方案、城市召回方案、热度召回方案、最新时间召回方案和标签召回方案所组成的任意组合方案,根据行为数据量、应用模型和召回效果参数对各召回方案的组合方式进行调整。
在其中一些实施例中,根据各召回方案分别确定至少一个第一召回数据:
基于随机召回方案,将物料表保存为一npy文件,通过random随机函数从所述物料中获取至少一个所述第一召回数据;
基于模型召回方案,根据一用户回流日志离线训练模型,通过调用所述模型返回至少一个所述第一召回数据;
基于城市召回方案,根据所述用户回流日志获取用户所在城市,将所述物料依据其城市属性进行分类,并根据所述城市属性召回至少一个所述第一召回数据;
基于热度召回方案,采用威尔逊得分算法每分钟对物料进行打分获得物料热度值并依据所述物料热度值进行排序,召回位于热度排序序列中一定位次的至少一个所述第一召回物料;
基于最新时间召回方案,从redis中获取物料,并将所述物料按时间属性进行排序,召回位于时间排序序列中一定位次的至少一个所述第一召回物料;
基于标签召回方案,通过预先配置标签,召回对应所述标签的属性相同的至少一个所述第一召回物料。
第二方面,本申请实施例提供了一种物料推荐系统,应用第一方面所述的物料推荐方法,包括:
数据召回模块,基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;
频次过滤模块,对所述第一召回数据集合中的第一召回数据进行频次过滤,获得第二召回数据,并判断所述第二召回数据的数量是否达到一预设请求数量;
加权排序模块,当所述第二召回数据的数量达到所述预设请求数量,依据各关注参数对所述第二召回数据进行加权,并对加权后的所述第二召回数据进行排序;
返回召回模块,当所述第二召回数据的数量未达到所述预设请求数量,则重复所述数据召回步骤和所述频次过滤步骤,直至所有的第二召回数据的数据量之和达到所述预设请求数量;
物料推荐模块,基于排序后的所述第二召回数据进行推荐;
在其中一些实施例中,所述频次过滤模块包括日期频次过滤单元、次数频次过滤单元和分钟级频次过滤单元,其中,
日期频次过滤单元,通过设置一过期策略,根据所述过期策略,将在预设过期时间内在同一推荐位上推荐给同一个用户的所述物料过滤;
次数频次过滤单元,将所述key的值作为一个当前游标的初始游标值,设置预设间隔数量,每次存入均将所述当前游标的值加1,当所述当前游标的值与所述初始游标值的差值小于所述预设间隔数量时,将该所述物料过滤;
分钟级频次过滤单元,通过设置一过期时间,从所述key存入redis时开始计时,在所述过期时间内将对应所述物料过滤。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的物料推荐方法。
第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的物料推荐方法。
相比于相关技术,本申请实施例提供的一种物料推荐方法、系统、电子设备和存储介质,通过多种召回方案对物料进行召回,并对召回的物料进行频次过滤和加权排序,解决了推荐物料冗余和物料类型单一的问题,实现了推荐物料的多样性。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的物料推荐方法的流程图;
图2是根据本申请实施例的频次过滤步骤的流程图;
图3是根据本申请实施例的加权排序步骤的流程图;
图4为本申请实施例中所采用的召回方案的示意图;
图5是根据本申请优选实施例的物料推荐方法的流程图;
图6是根据本申请实施例的物料推荐系统的结构框图;
图7为根据本申请实施例的电子设备的硬件结构示意图。
附图说明:
数据召回模块1; 频次过滤模块2; 加权排序模块3;
返回召回模块4; 日期频次过滤单元21; 次数频次过滤单元22;
分钟级频次过滤单元23; 关注参数设置单元31; 物料推荐模块5
物料打分单元32; 物料排序单元33; 处理器81;
存储器82;通信接口83; 总线80。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本实施例提供了一种物料推荐方法。图1是根据本申请实施例的物料推荐方法的流程图,如图1所示,该流程包括如下步骤:
数据召回步骤S1,基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;
频次过滤步骤S2,对第一召回数据集合中的第一召回数据进行频次过滤,获得第二召回数据,并判断第二召回数据的数量是否达到一预设请求数量;
加权排序步骤S3,当第二召回数据的数量达到预设请求数量,依据各关注参数对第二召回数据进行加权,并对加权后的第二召回数据进行排序;
返回召回步骤S4,当第二召回数据的数量未达到预设请求数量,则重复数据召回步骤和频次过滤步骤,直至所有的第二召回数据的数据量之和达到预设请求数量;
物料推荐步骤S5,基于排序后的所述第二召回数据进行推荐;
上述步骤可以根据实际需要进行调整,例如,当一次召回的符合要求的数量符合预设请求数量,将不执行S4步骤。
这里需要指出,关注参数表示用户方对想要曝光几率的物料预设的值,根据关注参数进行加权排序,可以使得最终排序可以更加贴合用户需求。
通过上述步骤,利用频次过滤步骤可以有效解决物料重复问题,而且物料统一存储,模型统一训练无需冗余存储,而多路召回可以有效解决物料类型单一问题,即使冷启动也能有效改善由于行为数据少导致的模型推送物料单一等问题。
在其中一些实施例中,频次过滤的具体方式包括日期频次过滤、次数频次过滤和分钟级频次过滤中其一或组合。
图2是根据本申请实施例的频次过滤步骤的流程图,如图2所示,在其中一些实施例中,频次过滤步骤S2具体包括:
参数准备步骤S21,将第一召回数据中的用户数据、推荐位,以及以下至少一种:物料和日期组成key,并存入redis;
在实际的应用中,第一召回数据包括从用户回流日志中获得的用户查看物料和点击物料的行为数据,将其中的用户数据、推荐位,以及以下至少一种:物料和日期组成key,并将其存入redis;
日期频次过滤步骤S221,通过设置一过期策略,根据过期策略,将在预设过期时间内在同一推荐位上推荐给同一个用户的物料过滤;
次数频次过滤步骤S222,将key的值作为一个当前游标的初始游标值,设置预设间隔数量,每次存入均将当前游标的值加1,当当前游标的值与初始游标值的差值小于预设间隔数量时,将该物料过滤;
在实际应用中,将key的值作为一个当前游标的初始值,每次存入时将当前游标值更新加1,根据当前游标得到当前物料的次序,根据物料数据的总量和当前游标的数据的差值获取该物料后剩余物料的数量,设置预设间隔数量,每次当前游标的值增加时,均将当前游标的值和总量进行比较,记录差值,当总量与当前游标值的差值同初始的差值相比小于预设间隔数量时,将该物料被过滤,当当前差值与初始差值的差值大于预设间隔数量时,该物料可以再次被推荐。
分钟级频次过滤步骤S223,通过设置一过期时间,从key存入redis时开始计时,在过期时间内将对应物料过滤。
利用分钟级频次过滤可以有效弥补按次数和日期控频时回流日志延迟问题。
当总量和当前游标值的两次差值小于预设间隔数量时,该物料被过滤;当物料数据和游标数据的两次差值大于预设间隔数量时,该物料可再次被推荐。
图3是根据本申请实施例的加权排序步骤的流程图,如图3所示,在其中一些实施例中,加权排序步骤S3具体包括以下步骤:
关注参数设置步骤S31,基于第二召回数据的曝光几率设置关注参数;
物料打分步骤S32,对第二召回数据进行打分,并将打分结果依据关注参数进行加权;
物料排序步骤S33,依据加权后的打分结果对第二召回数据进行排序。
加权排序的目的是对召回的物料进行排序,使更符合用户预期的物料排在列表的前面,从而增加曝光几率。
在其中一些实施例中,召回方案包括随机召回方案、模型召回方案、城市召回方案、热度召回方案、最新时间召回方案和标签召回方案所组成的任意组合方案,根据行为数据量、应用模型和召回效果参数对各召回方案的组合方式进行调整。
图4为本申请实施例中所采用的召回方案的示意图,如图4所示,多种召回方案包括:基于随机召回方案、基于模型召回方案、基于城市召回方案、基于热度召回方案、基于最新时间召回方案和基于标签召回方案。
在其中一些实施例中,根据各召回方案分别确定至少一个第一召回数据:
基于随机召回方案,将物料表保存为一npy文件,通过random随机函数从物料中获取至少一个第一召回数据;
基于模型召回方案,根据一用户回流日志离线训练模型,通过调用模型返回至少一个第一召回数据;
基于城市召回方案,根据用户回流日志获取用户所在城市,将物料依据其城市属性进行分类,并根据城市属性召回至少一个第一召回数据;
基于热度召回方案,采用威尔逊得分算法每分钟对物料进行打分获得物料热度值并依据物料热度值进行排序,召回位于热度排序序列中一定位次的至少一个第一召回物料;
基于最新时间召回方案,从redis中获取物料,并将物料按时间属性进行排序,召回位于时间排序序列中一定位次的至少一个第一召回物料;
基于标签召回方案,通过预先配置标签,召回对应标签的属性相同的至少一个第一召回物料。
在实际应用中,多路召回方案之间的组合方式存在改进点,比如在冷启动时(用户行为数据不足),适当增加随机召回方案的物料比例,在根据回流日志对模型进行训练,逐步增加模型召回的比例,在不同的城市适当调整按城市召回的比例也会有一定的效果。总之按不同场景进行不同的召回方式的比例可以提高推荐效果。
同时,部分单个召回存在改进点,比如模型训练过程中合适的参数可以提高召回的效果,热度计算中更加科学的算法也可以提高召回的效果。
需要说明的是,上述为多路召回方案的部分组合参考方式,本发明并不以此为限。
下面通过优选实施例对本申请实施例进行描述和说明。
图5是根据本申请优选实施例的物料推荐方法的流程图。
S501、采用多种召回方案对物料进行召回
通过多路召回方案来增加物理的多样性,可以有效改善一种场景召回导致的物料类型单一问题。各路召回的实现方式如下:
基于随机的召回:
将物料表保存为npy文件,取用时用random随机数获取物料做召回。
基于模型的召回:
根据用户行为离线训练模型,每日凌晨1点加载新模型,召回时调用模型返回物料。
基于城市的召回:
根据用户行为,获取用户所在城市,根据物料的城市属性,将物料分类,召回时返回相同城市的物料。
基于热度的召回:
采用威尔逊得分算法每分钟对物料进行打分来计算物料热度值并排序,召回时返回热度值高的物料。
基于最新时间的召回:
从redis中获取物料,按时间属性排序,选取靠前的物料进行召回。
基于标签的召回:
redis中物料有标签属性,通过预先配置的标签,在召回时选取标签属性相同的物料进行召回。
S502、对召回的物料进行控频过滤
对召回的物料进行频率过滤(即同一物料推送n次后隔一段时间在进行推送),如果过滤后的物料不足请求的数量,则重复召回和过滤步骤直到数量足够。
上述频率过滤分为三种:
第一种,按照日期进行控频,在用户回流日志中获取用户查看物料和点击物料的行为,将用户、推荐位、物料和日期组合成key,次数为值存入redis,并设置过期策略,同一物料在过期时间内不会在同一推荐位重复推荐给同一个人;
第二种,按照次数进行控频,在用户回流日志中获取用户查看物料和点击物料的行为,将用户、推荐位和物料作为key,并存入redis,key的值取一个当前游标,按用户和推荐位组合key存入redis,每次存入时值更新加一,比较的时候物料值与游标值相减即可知道当前物料推荐后有多少物料被推出,超过设置的间隔次数才可以再次推荐;
第三种,分钟级的控频,推出物料时即将用户、推荐位和物料组合为key存入redis,过期时间1分钟,即一分钟内不再推荐该物料。
S503、加权排序
对过滤后的物料进行加权排序,加权的值来自物料预设的一个加权值,将召回的物料打分后,用所得的分数乘以该加权值,得出一个加权后的分数,对加权后的分数进行排序后即可进行推荐,使分数高的物料排在前面,可以增加曝光概率。加权的依据就是用户方对想要增加曝光几率的物料预设的值。
S504、按照加权排序后的次序,对物料进行推荐。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种物料推荐系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本申请实施例的物料推荐系统的结构框图,如图6所示,该系统包括:
数据召回模块1,基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;
频次过滤模块2,对第一召回数据集合中的第一召回数据进行频次过滤,获得第二召回数据,并判断第二召回数据的数量是否达到一预设请求数量;
加权排序模块3,当第二召回数据的数量达到预设请求数量,依据各关注参数对第二召回数据进行加权,并对加权后的第二召回数据进行排序;(关注参数表示用户方对想要曝光几率的物料预设的值,使得最终排序可以更加贴合用户需求)
返回召回模块4,当第二召回数据的数量未达到预设请求数量,则重复数据召回步骤和频次过滤步骤,直至所有的第二召回数据的数据量之和达到预设请求数量;
物料推荐模块5,基于排序后的所述第二召回数据进行推荐。
数据召回模块1中,第一召回数据包括从用户回流日志中获得的用户查看物料和点击物料的行为数据,将其中的用户数据、推荐位,以及以下至少一种:物料和日期组成key,并将其存入redis。
在其中一些实施例中,频次过滤模块2包括日期频次过滤单元21、次数频次过滤单元22和分钟级频次过滤单元23,其中,
日期频次过滤单元21,通过设置一过期策略,根据过期策略,将在预设过期时间内在同一推荐位上推荐给同一个用户的物料过滤;
次数频次过滤单元22,将key的值作为一个当前游标的初始游标值,设置预设间隔数量,每次存入均将当前游标的值加1,当当前游标的值与初始游标值的差值小于预设间隔数量时,将该物料过滤;
分钟级频次过滤单元23,通过设置一过期时间,从key存入redis时开始计时,在过期时间内将对应物料过滤。
加权排序模块3具体包括关注参数设置单元31、物料打分单元32和物料排序单元33,其中:
关注参数设置单元31,基于第二召回数据的曝光几率设置关注参数;
物料打分单元32,对第二召回数据进行打分,并将打分结果依据关注参数进行加权;
物料排序单元33,依据加权后的打分结果对第二召回数据进行排序。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
另外,结合图1描述的本申请实施例物料推荐方法可以由电子设备来实现。图7为根据本申请实施例的电子设备的硬件结构示意图。
电子设备可以包括处理器81以及存储有计算机程序指令的存储器82。
具体地,上述处理器81可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器82可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器82可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器82可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器82可在数据处理装置的内部或外部。在特定实施例中,存储器82是非易失性(Non-Volatile)存储器。在特定实施例中,存储器82包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器82可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器81所执行的可能的计算机程序指令。
处理器81通过读取并执行存储器82中存储的计算机程序指令,以实现上述实施例中的任意一种物料推荐方法。
在其中一些实施例中,电子设备还可包括通信接口83和总线80。其中,如图7所示,处理器81、存储器82、通信接口83通过总线80连接并完成相互间的通信。
通信接口83用于实现本申请实施例中各模块、系统、单元和/或设备之间的通信。通信端口83还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线80包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总线80包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线80可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以基于召回的物料,执行本申请实施例中的频次过滤步骤和加权排序步骤,从而实现结合图1描述的物料推荐方法。
另外,结合上述实施例中的物料推荐方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种物料推荐方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (7)
1.一种物料推荐方法,其特征在于,包括以下步骤:
数据召回步骤,基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;
频次过滤步骤,对所述第一召回数据集合中的第一召回数据进行频次过滤,获得第二召回数据,并判断所述第二召回数据的数量是否达到一预设请求数量;所述频次过滤的具体方式包括日期频次过滤、次数频次过滤和分钟级频次过滤中其一或组合;
加权排序步骤,当所述第二召回数据的数量达到所述预设请求数量,依据各关注参数对所述第二召回数据进行加权,对加权后的所述第二召回数据进行排序;
返回召回步骤,当所述第二召回数据的数量未达到所述预设请求数量,则重复所述数据召回步骤和所述频次过滤步骤,直至所有的第二召回数据的数据量之和达到所述预设请求数量;
物料推荐步骤,基于排序后的所述第二召回数据进行推荐;
其中,所述频次过滤步骤具体包括:
参数准备步骤,将所述第一召回数据中的用户数据、推荐位,以及以下至少一种:物料和日期组成key,并存入redis;
日期频次过滤步骤,通过设置一过期策略,根据所述过期策略,将在预设过期时间内在同一推荐位上推荐给同一个用户的所述物料过滤;
次数频次过滤步骤,将所述key的值作为一个当前游标的初始游标值,设置预设间隔数量,每次存入均将所述当前游标的值加1,当所述当前游标的值与所述初始游标值的差值小于所述预设间隔数量时,将该所述物料过滤;
分钟级频次过滤步骤,通过设置一过期时间,从所述key存入redis时开始计时,在所述过期时间内将对应所述物料过滤。
2.根据权利要求1所述的物料推荐方法,其特征在于,所述加权排序步骤具体包括以下步骤:
关注参数设置步骤,基于所述第二召回数据的曝光几率设置关注参数;
物料打分步骤,对所述第二召回数据进行打分,并将打分结果依据所述关注参数进行加权;
物料排序步骤,依据加权后的所述打分结果对所述第二召回数据进行排序。
3.根据权利要求1所述的物料推荐方法,其特征在于,所述召回方案包括随机召回方案、模型召回方案、城市召回方案、热度召回方案、最新时间召回方案和标签召回方案所组成的任意组合方案,根据行为数据量、应用模型和召回效果参数对各召回方案的组合方式进行调整。
4.根据权利要求3所述的物料推荐方法,其特征在于,根据各召回方案分别确定至少一个第一召回数据:
基于随机召回方案,将物料表保存为一npy文件,通过random随机函数从所述物料中获取至少一个所述第一召回数据;
基于模型召回方案,根据一用户回流日志离线训练模型,通过调用所述模型返回至少一个所述第一召回数据;
基于城市召回方案,根据所述用户回流日志获取用户所在城市,将所述物料依据其城市属性进行分类,并根据所述城市属性召回至少一个所述第一召回数据;
基于热度召回方案,采用威尔逊得分算法每分钟对物料进行打分获得物料热度值并依据所述物料热度值进行排序,召回位于热度排序序列中一定位次的至少一个第一召回物料;
基于最新时间召回方案,从redis中获取物料,并将所述物料按时间属性进行排序,召回位于时间排序序列中一定位次的至少一个所述第一召回物料;
基于标签召回方案,通过预先配置标签,召回对应所述标签的属性相同的至少一个所述第一召回物料。
5.一种物料推荐系统,应用权利要求1-4任意一项所述的物料推荐方法,其特征在于,包括:
数据召回模块,基于推荐场景,采用多种召回方案对物料进行召回,并获得一第一召回数据集合;
频次过滤模块,对所述第一召回数据集合中的第一召回数据进行频次过滤,
获得第二召回数据,并判断所述第二召回数据的数量是否达到一预设请求数量;
加权排序模块,当所述第二召回数据的数量达到所述预设请求数量,依据各关注参数对所述第二召回数据进行加权,并对加权后的所述第二召回数据进行排序;
返回召回模块,当所述第二召回数据的数量未达到所述预设请求数量,则
重复所述数据召回步骤和所述频次过滤步骤,直至所有的第二召回数据的数据量之和达到所述预设请求数量;
物料推荐模块,基于排序后的所述第二召回数据进行推荐;
其中,所述频次过滤模块包括日期频次过滤单元、次数频次过滤单元和分钟级频次过滤单元,其中,
日期频次过滤单元,通过设置一过期策略,根据所述过期策略,将在预设过期时间内在同一推荐位上推荐给同一个用户的所述物料过滤;
次数频次过滤单元,将物料和日期组成的key的值作为一个当前游标的初始游标值,设置预设间隔数量,每次存入均将所述当前游标的值加1,当所述当前游标的值与所述初始游标值的差值小于所述预设间隔数量时,将该所述物料过滤;
分钟级频次过滤单元,通过设置一过期时间,从所述key存入redis时开始计时,在所述过期时间内将对应所述物料过滤。
6.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的物料推荐方法。
7.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任一项所述的物料推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110055687.9A CN112800325B (zh) | 2021-01-15 | 2021-01-15 | 物料推荐方法、系统、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110055687.9A CN112800325B (zh) | 2021-01-15 | 2021-01-15 | 物料推荐方法、系统、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112800325A CN112800325A (zh) | 2021-05-14 |
CN112800325B true CN112800325B (zh) | 2024-02-27 |
Family
ID=75809695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110055687.9A Active CN112800325B (zh) | 2021-01-15 | 2021-01-15 | 物料推荐方法、系统、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112800325B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097412A (zh) * | 2018-01-31 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 物品推荐方法、装置、设备以及存储介质 |
CN110765310A (zh) * | 2019-10-09 | 2020-02-07 | 上海麦克风文化传媒有限公司 | 一种基于参数配置的音频专辑推荐方法及系统 |
CN110990695A (zh) * | 2019-11-22 | 2020-04-10 | 厦门美柚股份有限公司 | 推荐系统内容召回方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11334596B2 (en) * | 2018-04-27 | 2022-05-17 | Dropbox, Inc. | Selectively identifying and recommending digital content items for synchronization |
-
2021
- 2021-01-15 CN CN202110055687.9A patent/CN112800325B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097412A (zh) * | 2018-01-31 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 物品推荐方法、装置、设备以及存储介质 |
CN110765310A (zh) * | 2019-10-09 | 2020-02-07 | 上海麦克风文化传媒有限公司 | 一种基于参数配置的音频专辑推荐方法及系统 |
CN110990695A (zh) * | 2019-11-22 | 2020-04-10 | 厦门美柚股份有限公司 | 推荐系统内容召回方法及装置 |
Non-Patent Citations (1)
Title |
---|
协同过滤在个性化推荐中的应用;王宇航等;应用研究;101 * |
Also Published As
Publication number | Publication date |
---|---|
CN112800325A (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170083965A1 (en) | Item Recommendation Method and Apparatus | |
CN108833458B (zh) | 一种应用推荐方法、装置、介质及设备 | |
CN109344314B (zh) | 一种数据处理方法、装置及服务器 | |
CN106649647B (zh) | 基于人工智能的搜索结果排序方法和装置 | |
CN113642659B (zh) | 一种训练样本集生成的方法、装置、电子设备及存储介质 | |
CN108491540B (zh) | 文本信息推送方法、装置及智能终端 | |
CN111339416A (zh) | 热度召回方法、装置、电子设备及存储介质 | |
CN108363788B (zh) | 帖子智能排位方法、装置以及计算机可读存储介质 | |
CN103870553B (zh) | 一种输入资源推送方法及系统 | |
CN106326297B (zh) | 一种应用程序推荐方法及装置 | |
CN109245996A (zh) | 邮件推送方法、装置、计算机设备和存储介质 | |
CN110309410B (zh) | 一种资讯推荐方法、平台及计算机可读存储介质 | |
KR20220004692A (ko) | 데이터 증강 정책의 업데이트 방법, 장치, 기기 및 저장 매체 | |
CN108334626B (zh) | 新闻栏目的生成方法、装置和计算机设备 | |
CN112800325B (zh) | 物料推荐方法、系统、电子设备和存储介质 | |
CN108228598B (zh) | 媒体信息排序方法、服务器和系统 | |
CN106815285A (zh) | 基于视频网站的视频推荐的方法、装置及电子设备 | |
CN110312164A (zh) | 视频处理方法、装置及计算机存储介质和终端设备 | |
CN113038242B (zh) | 直播卡片展示位置的确定方法、装置、设备及存储介质 | |
CN112445978A (zh) | 电子书的推送方法、电子设备及存储介质 | |
CN115599801A (zh) | 一种数据查询方法、系统、电子设备和存储介质 | |
CN105659232B (zh) | 用于呈现媒体项目的着陆页 | |
CN111599449B (zh) | 电子图像的自动播放方法、装置、设备及存储介质 | |
CN114647782A (zh) | 书架页面的书籍推荐方法、计算设备及存储介质 | |
CN109582863B (zh) | 一种推荐方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |