CN111870958A - 一种道具推荐方法、装置、电子设备和存储介质 - Google Patents
一种道具推荐方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111870958A CN111870958A CN202010790182.2A CN202010790182A CN111870958A CN 111870958 A CN111870958 A CN 111870958A CN 202010790182 A CN202010790182 A CN 202010790182A CN 111870958 A CN111870958 A CN 111870958A
- Authority
- CN
- China
- Prior art keywords
- prop
- recommended
- sequence
- item
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000005457 optimization Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 21
- 230000008901 benefit Effects 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 106
- 238000010586 diagram Methods 0.000 description 9
- 101100521345 Mus musculus Prop1 gene Proteins 0.000 description 7
- 108700017836 Prophet of Pit-1 Proteins 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/79—Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种道具推荐方法、装置、电子设备和存储介质,其中,该方法包括:将待推荐道具的标识、待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到该待推荐道具的编码,将各待推荐道具的编码作为输入参数,输入到序列编码器进行编码,得到第一个推荐位置上的道具编码;将第N个推荐位置上的道具编码作为输入参数,输入到序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码;对于每个推荐位置上的道具编码,从待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列,通过上述方法有利于提高道具推荐序列的购买率。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种道具推荐方法、装置、电子设备和存储介质。
背景技术
在网络游戏中有大量的道具序列推荐场景,在推荐的道具序列中推荐何种道具,会直接影响到玩家对推荐道具的购买情况,例如:在一次道具序列推荐中,如果推荐的道具都是时装的上衣时,那么用户可能只购买一件时装上衣,但是如果推荐的道具中包括一套时装的上衣和裤子时,那么用户有很大概率同时购买该套时装的上衣和裤子,因此推荐的道具序列包括何种推荐道具会直接影响到道具的购买率。
在现有技术中,给用户推荐的道具序列都是根据用户的个性化需求来进行推荐的,即:都是根据用户的用户偏好来进行推荐的,因此推荐的道具序列中会存在相同类型的道具,在出现相同类型的道具时,用户大概率只会对其中一个道具进行购买,从而降低了道具推荐序列的购买率。
发明内容
有鉴于此,本申请实施例提供了一种道具推荐方法、装置、电子设备和存储介质,以提高道具推荐序列的购买率。
第一方面,本申请实施例提供了一种道具推荐方法,包括:
将待推荐道具的标识、所述待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到所述待推荐道具的编码,其中,所述当前道具偏好信息为目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息;
将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,得到推荐序列中第一个推荐位置上的道具编码;
将第N个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量;
对于每个推荐位置上的道具编码,从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的所述推荐序列。
可选地,所述方法还包括:
获取所述虚拟角色对应的第一历史特征数据,其中,所述第一历史特征数据包括:用户当前在所述虚拟角色下的用户画像信息、所述虚拟角色的道具购买记录信息、所述虚拟角色的道具使用记录信息;
将所述第一历史特征数据作为输入参数,输入到兴趣偏好模型中,得到所述当前道具偏好信息。
可选地,所述从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列,包括:
计算该推荐位置上的道具编码与各待推荐道具的编码的相似度;
依据概率采样算法从所述相似度中确定出一个相似度对应的推荐道具,以作为该推荐位置上的道具编码对应的推荐道具;
根据得到的推荐道具和该推荐道具对应的推荐位置的先后顺序,生成所述道具的推荐序列;
其中,任意两个推荐位置上的推荐道具均不相同。
可选地,所述方法还包括:
获取目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型、在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型、所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型;
将所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型,以及在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型作为样本参数,输入到所述兴趣偏好模型中,得到所述虚拟角色对应的历史道具偏好信息;
将所述目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型,以及所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型作为样本参数,输入到道具曝光模型中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息;
将所述虚拟角色对应的历史道具偏好信息和所述道具曝光特征作为样本参数,输入到购买概率模型中,得到所述目标推荐道具的购买概率;
计算所述虚拟角色对所述目标推荐道具的购买情况对应的值与所述目标推荐道具的购买概率的差值的平方值,得到第一目标优化值;
使用所述第一目标优化值,对所述兴趣偏好模型、所述道具曝光模型,以及购买概率模型中可学习的参数进行训练,直至使得到的所述第一目标优化值小于第一预设阈值为止。
可选地,在将所述道具的推荐序列发送给所述目标客户端后,所述方法还包括:
针对所述道具的推荐序列中的各推荐道具,构建该推荐道具与所述兴趣偏好模型对应的第一样本参数,以及与所述道具曝光模型对应的第二样本参数;
将所述第一样本参数输入到所述兴趣偏好模型,得到所述虚拟角色在该推荐道具下对应的道具偏好信息;
将所述第二样本参数输入到所述道具曝光模型中,得到该推荐道具对应的道具曝光特征信息;
将所述虚拟角色在该推荐道具下对应的道具偏好信息和该推荐道具对应的道具曝光特征信息作为样本参数,输入到所述购买概率模型中,得到该推荐道具对应的购买概率,以将该推荐道具对应的购买概率作为该推荐道具的期望收益;
计算各推荐道具的期望收益之和,以将所述之和作为所述道具的推荐序列的期望收益;
计算所述道具的推荐序列的期望收益和所述道具推荐序列的整体交叉熵的第二乘积,以将所述第二乘积作为第二目标优化值;
使用所述第二目标优化值对所述编码器、所述序列编码器和所述序列解码器中可学习的参数进行训练。
可选地,所述虚拟角色下的用户画像信息,包括:
所述虚拟角色的平均在线时长信息、所述用户在所述虚拟角色下消费水平信息、所述用户的性别信息和所述用户的年龄信息。
第二方面,本申请实施例提供了一种道具推荐装置,包括:
第一编码单元,用于将待推荐道具的标识、所述待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到所述待推荐道具的编码,其中,所述当前道具偏好信息为目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息;
第二编码单元,用于将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,得到推荐序列中第一个推荐位置上的道具编码;
解码单元,用于将第N个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量;
生成单元,用于对于每个推荐位置上的道具编码,从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的所述推荐序列。
可选地,所述装置还包括:
偏好单元,用于获取所述虚拟角色对应的第一历史特征数据,其中,所述第一历史特征数据包括:用户当前在所述虚拟角色下的用户画像信息、所述虚拟角色的道具购买记录信息、所述虚拟角色的道具使用记录信息;以及,用于将所述第一历史特征数据作为输入参数,输入到兴趣偏好模型中,得到所述当前道具偏好信息。
可选地,所述生成单元的配置在用于从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列时,包括:
计算该推荐位置上的道具编码与各待推荐道具的编码的相似度;
依据概率采样算法从所述相似度中确定出一个相似度对应的推荐道具,以作为该推荐位置上的道具编码对应的推荐道具;
根据得到的推荐道具和该推荐道具对应的推荐位置的先后顺序,生成所述道具的推荐序列;
其中,任意两个推荐位置上的推荐道具均不相同。
可选地,所述装置还包括:
第一训练单元,用于获取目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型、在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型、所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型;将所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型,以及在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型作为样本参数,输入到所述兴趣偏好模型中,得到所述虚拟角色对应的历史道具偏好信息;将所述目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型,以及所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型作为样本参数,输入到道具曝光模型中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息;将所述虚拟角色对应的历史道具偏好信息和所述道具曝光特征作为样本参数,输入到购买概率模型中,得到所述目标推荐道具的购买概率;计算所述虚拟角色对所述目标推荐道具的购买情况对应的值与所述目标推荐道具的购买概率的差值的平方值,得到第一目标优化值;使用所述第一目标优化值,对所述兴趣偏好模型、所述道具曝光模型,以及购买概率模型中可学习的参数进行训练,直至使得到的所述第一目标优化值小于第一预设阈值为止。
可选地,所述装置还包括:
第二训练单元,用于在将所述道具的推荐序列发送给所述目标客户端后,针对所述道具的推荐序列中的各推荐道具,构建该推荐道具与所述兴趣偏好模型对应的第一样本参数,以及与所述道具曝光模型对应的第二样本参数;以及,用于将所述第一样本参数输入到所述兴趣偏好模型,得到所述虚拟角色在该推荐道具下对应的道具偏好信息;以及,用于将所述第二样本参数输入到所述道具曝光模型中,得到该推荐道具对应的道具曝光特征信息;以及,用于将所述虚拟角色在该推荐道具下对应的道具偏好信息和该推荐道具对应的道具曝光特征信息作为样本参数,输入到所述购买概率模型中,得到该推荐道具对应的购买概率,以将该推荐道具对应的购买概率作为该推荐道具的期望收益;以及,用于计算各推荐道具的期望收益之和,以将所述之和作为所述道具的推荐序列的期望收益;以及,用于计算所述道具的推荐序列的期望收益和所述道具推荐序列的整体交叉熵的第二乘积,以将所述第二乘积作为第二目标优化值;以及,用于使用所述第二目标优化值对所述编码器、所述序列编码器和所述序列解码器中可学习的参数进行训练。
可选地,所述虚拟角色下的用户画像信息,包括:
所述虚拟角色的平均在线时长信息、所述用户在所述虚拟角色下消费水平信息、所述用户的性别信息和所述用户的年龄信息。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面中任一项所述的道具推荐方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面中或第二方面中任一项所述的道具方法的步骤。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请中,预先设定多个待推荐道具,需要从多个待推荐道具中确定出一定数量的推荐道具,以得到道具的推荐序列,在得到道具的推荐序列之前,对于每个待推荐道具,将该待推荐道具的标识、该待推荐道具的类型和目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到该待推荐道具的编码,得到的该待推荐道具的编码结合了该虚拟角色当前的道具偏好信息和该待推荐道具本身,在得到所有的待推荐道具的编码后,将各待推荐道具的编码作为输入参数,输入到序列编码器进行编码,得到第一个推荐位置上的道具编码,然后将第N个推荐位置上的道具编码作为输入参数,输入到序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量,通过上述方式得到的各推荐位置上的道具编码不仅考虑到了该虚拟角色当前的道具偏好,还考虑到了各推荐位置上的道具编码之间的相互关联,然后对于每个推荐位置上的道具编码,从待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列,因此通过上述方法得到的道具的推荐序列不仅是该虚拟角色当前偏好的道具,还兼顾了道具之间的相互关联,有利于提高道具推荐序列的购买率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例一提供的一种道具推荐方法的流程示意图;
图2为本申请实施例一提供的另一种道具推荐方法的流程示意图;
图3为本申请实施例一提供的另一种道具推荐方法的流程示意图;
图4为本申请实施例一提供的另一种道具推荐方法的流程示意图;
图5为本申请实施例一提供的另一种道具推荐方法的流程示意图;
图6为本申请实施例二提供的一种道具推荐装置的结构示意图;
图7为本申请实施例二提供的另一种道具推荐装置的结构示意图;
图8为本申请实施例二提供的另一种道具推荐装置的结构示意图;
图9为本申请实施例二提供的另一种道具推荐装置的结构示意图;
图10为本申请实施例三提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要提前说明的是,本申请中涉及到的道具均为游戏场景中的虚拟游戏道具,待推荐道具包括当前游戏中能够在道具商城中为虚拟角色推荐的所有道具,关于待推荐道具包括的种类和数量可以根据实际需要进行设置,在此不做具体限定。
需要再次说明的是,本申请中涉及到道具作为输入参数或者通过道具得到二元组数据等情况时,均是指该道具的标识,道具的标识可以为该道具设置的道具编码,本申请中涉及到的道具标识和道具类型在作为输入时,均是使用道具的标识和道具类型在道具词典中对应的ID标识。
在网络游戏中有大量的道具序列推荐场景,如:商城首页道具推荐(所有出现的道具可以任意进行购买)和解锁式商城道具推荐(不同位置上的道具的购买条件是不同的,只有在满足一定购买条件时才可以购买某些道具,例如:当前包括九个道具,且分为三组,第一组道具可以任意购买,玩家在购买了第一组道具中的所有道具后,才可以购买第二组道具,玩家在购买了第二组道具中的所有道具后,才可以购买第三组道具,当然解锁式商城道具推荐的推荐规则还可以是其他方式)等,但是无论在何种推荐场景中,推荐的道具序列中包括的推荐道具会直接影响到玩家对推荐道具的购买情况,例如:在一次道具推荐序列中,如果推荐的道具中出现了多个功能类似的道具(如:推荐的道具都是时装的上衣)时,玩家可能只会选择其中一个道具进行购买,如果推荐的道具中出现了功能具有关联的道具(如:推荐的道具中包括一套时装的上衣和裤子)时,玩家可能会同时购买这两件道具,因此推荐的道具序列包括何种推荐道具会直接影响到道具序列的购买率,同时,玩家在某一虚拟角色下的偏好(玩家的一个账号下可能会建立多个虚拟角色,玩家在使用不同虚拟角色该买道具时,偏向的道具种类也可能存在差距,如:玩家在一个账号下建立了两个虚拟角色,玩家在第一虚拟角色下,比较偏向增加虚拟角色战斗力的道具,玩家在第二虚拟角色下,比较偏向材料类的道具),也会影响到道具序列的购买率。
在现有技术中,在为某一虚拟角色推荐道具序列时是根据该虚拟角色的道具偏好来确定的,这样会导致为该虚拟角色推荐的道具序列中存在多个相同类型的道具,例如:玩家在某一虚拟角色下的道具偏好为时装上衣,那么为该虚拟角色推荐的道具序列中可能会包括多个时装上衣,但是在出现多种相同类型的道具时,玩家大概率只会购买其中一个道具,如:只会购买一件时装上衣,从而降低了道具推荐序列的购买率。
在为某一虚拟角色推荐道具序列时,不仅要考虑玩家在该虚拟角色下的道具偏好,还需要考虑道具序列包括的道具之间的关联关系,为此,本申请实施例提供了一种道具推荐方法、装置、电子设备和存储介质,以提高道具推荐序列的购买率。
实施例一
图1为本申请实施例一提供的一种道具推荐方法的流程示意图,如图1所示,该道具推荐方法包括以下步骤:
步骤101、将待推荐道具的标识、所述待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到所述待推荐道具的编码,其中,所述当前道具偏好信息为目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息。
步骤102、将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,得到推荐序列中第一个推荐位置上的道具编码。
步骤103、将第N个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量。
步骤104、对于每个推荐位置上的道具编码,从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列。
具体的,玩家在一个账号下可以创建多个虚拟角色,玩家可以选择其中一个虚拟角色进入游戏场景,虚拟角色在进入游戏场景后,玩家可以通过游戏指令控制该虚拟角色执行相应的动作(当游戏终端为触控终端时,可以通过触控操作控制该虚拟角色执行相应的动作)。玩家可以在游戏中购买道具,在购买道具时,玩家需要打开游戏中的游戏商城,此时,该游戏终端作为目标客户端向服务器发送道具推荐请求,服务器在接收到道具推荐请求后会根据本次道具推荐的数量从待推荐道具中选择对应数量的道具,以形成道具的推荐序列(包含至少两个推荐的道具),然后将道具的推荐序列返回给目标客户端,目标客户端在接收到道具的推荐序列后,在游戏商城的显示页面上显示推荐序列对应的道具。例如:待推荐道具的数量为100个,本次道具推荐的数量为9个,服务器在接收到目标客户端发送的道具推荐请求后,从100个待推荐道具中选择9个道具作为道具的推荐序列,然后将该9个道具构成的道具的推荐序列返回给目标客户端,目标客户端会在游戏商城的显示页面显示该9个道具,其中,在显示该9个道具时,可以根据设定的道具推荐方式来进行显示,关于具体的显示方式在此不做具体限定。
为了保证服务器返回的道具的推荐序列既满足玩家在该虚拟角色下的偏好,有满足道具的推荐序列包括的道具之间具有关联关系,在确定道具的推荐序列时,需要获取玩家在该虚拟角色下当前对应的道具偏好信息,此时得到数据包括:各待推荐道具的标识、各待推荐道具的类型,以及玩家在该虚拟角色下当前对应的道具偏好信息,在获得上述数据后,为了确定出符合上述要求的道具的推荐序列,对于每个待推荐道具的标识,将该待推荐道具的标识、该待推荐道具的类型和上述的道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到该待推荐道具的编码(一种用于表示该待推荐道具的嵌入向量,该编码能够体现出上述的道具偏好信息和该待推荐道具的相关信息)。例如:待推荐道具包括:待推荐道具1、待推荐道2和待推荐道具3时,对于待推荐道具1,将待推荐道具1的标识、待推荐道具1的类型和上述的道具偏好信息作为一组输入数据,输入到编码器1中进行编码,得到待推荐道具1的编码;对于待推荐道具2,将待推荐道具2的标识、待推荐道具2的类型和上述的道具偏好信息作为一组输入数据,输入到编码器2中进行编码,得到待推荐道具2的编码;对于待推荐道具3,将待推荐道具3的标识、待推荐道具3的类型和上述的道具偏好信息作为一组输入数据,输入到编码器3中进行编码,得到待推荐道具3的编码。
在得到各待推荐道具的编码后,需要根据各待推荐道具的编码确定将哪几个待推荐道具作为推荐位置上的道具,例如:本次推荐的道具的数量为9个,则推荐位置为9个,在确定出各待推荐道具的编码,需要确定出这个9个推荐位置上对应的道具,从而确定出道具的推荐序列。在确定各推荐位置上的道具时,可以先确定出推荐序列中第一个推荐位置上的道具,在确定第一个推荐位置上的道具时,可以将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,将编码结果第一个推荐位置上的道具编码,道具编码能够表示与该推荐位置相匹配的道具的相关信息,为了使确定出来的各推荐位置上的道具具有关联关系,可以将第一个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第二个推荐位置上的道具编码,然后将第二个推荐位置上的道具编码作为输入参数,输入到序列解码器进行解码,将解码结果作为第三个推荐位置上的道具编码,以此类推,直至得到所有推荐位置上的道具编码为止。
在得到各推荐位置上的道具编码后,可以确定与各推荐位置相匹配的道具的相关信息,然后基于设定的选择方法从待推荐道具中确定与各推荐位置上的道具编码对应的推荐道具,从而得到道具的推荐序列。
通过上述方法得到的道具的推荐序列不仅是该虚拟角色当前偏好的道具,还兼顾了道具之间的相互关联,从而有利于提高道具推荐序列的购买率。
需要说明的是,某一待推荐道具的标识和该待推荐道具的类型可以构成二元组数据,然后将当前道具偏好信息与该待推荐道具对应的二元组数据进行拼接后,可以得到该待推荐道具对应的三元组数据,然后将各三元组数据输入到编码器(此时使用的编码器可以为三元组编码器)中进行编码。
在一个可行的实施方案中,图2为本申请实施例一提供的另一种道具推荐方法的流程示意图,如图2所示,该方法还包括以下步骤:
步骤201、获取所述虚拟角色对应的第一历史特征数据,其中,所述第一历史特征数据包括:用户当前在所述虚拟角色下的用户画像信息、所述虚拟角色的道具购买记录信息、所述虚拟角色的道具使用记录信息。
步骤202、将所述第一历史特征数据作为输入参数,输入到兴趣偏好模型中,得到所述当前道具偏好信息。
具体的,为了使图1中使用到的当前道具偏好信息更加准确,可以获取用户当前在该虚拟角色下的用户画像信息、该虚拟角色的道具购买记录信息、该虚拟角色的道具使用记录信息,然后将上述信息作为输入参数,输入到兴趣偏好模型中,得到当前道具偏好信息,其中,该虚拟角色的道具购买记录信息是指在本次道具推荐之前该虚拟角色的所有道具购买记录信息,道具购买记录信息包括购买的道具的标识和该道具的类型,该虚拟角色的道具使用记录信息是指在本次道具推荐之前该虚拟角色的所有道具使用记录信息,道具使用记录信息包括使用的道具的标识和该道具的类型。举例说明,在本次道具推荐之前该虚拟角色的所有道具购买记录信息包括:道具1的标识和道具1的类型、道具2的标识和道具2的类型,以及道具3的标识和道具3的类型,则将这三组数据作为该虚拟角色的道具购买记录信息;在本次道具推荐之前该虚拟角色的所有道具使用记录信息包括:道具4的标识和道具4的类型、道具5的标识和道具5的类型,以及道具6的标识和道具6的类型,则将这三组数据作为该虚拟角色的道具使用记录信息。
在一个可行的实施方案中,图3为本申请实施例一提供的另一种道具推荐方法的流程示意图,如图3所示,在执行步骤104时,可以通过以下步骤实现:
步骤301、计算该推荐位置上的道具编码与各待推荐道具的编码的相似度。
步骤302、依据概率采样算法从所述相似度中确定出一个相似度对应的推荐道具,以作为该推荐位置上的道具编码对应的推荐道具。
步骤303、根据得到的推荐道具和该推荐道具对应的推荐位置的先后顺序,生成所述道具的推荐序列;其中,任意两个推荐位置上的推荐道具均不相同。
具体的,在得到各推荐位置上的道具编码后,在每个推荐位置上,计算该推荐位置上的道具编码与各待推荐道具的编码的相似度,例如:推荐位置包括9个,待推荐道具为100个,以第一个推荐位置为例,需要计算第一个推荐位置上的道具编码分别和这100个待推荐道具的编码的相似度,在第一位推荐位置上可以得到100个相似度,后续八个推荐位置上,每个推荐位置上均会得到100个相似度,其中,相似度用于表示道具和推荐位置的匹配程度,然后依据概率采样算法,确定出各推荐位置上的道具编码对应的推荐道具,如果推荐位置包括9个,则可以得到9个推荐道具,此时可以生成道具的推荐序列,其中,得到9个推荐道具中的任意一个道具仅包括一个,然后将得到的推荐序列发送给目标客户端,以供用户购买。
需要说明的是,在计算相似度时,可以通过Softmax网络进行处理,得到归一化的相似度,归一化的相似度的特点是,某一推荐位置上的相似度的和为1。根据归一化相似度进行概率采样,就可以得到该推荐位置上对应的道具。
在一个可行的实施方案中,图4为本申请实施例一提供的另一种道具推荐方法的流程示意图,如图4所示,为了使图2对应的兴趣偏好模型得到的结果更加准确,需要对兴趣偏好模型进行训练,因此,该道具推荐方法还包括以下步骤:
步骤401、获取目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型、在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型、所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型。
步骤402、将所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型,以及在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型作为样本参数,输入到所述兴趣偏好模型中,得到所述虚拟角色对应的历史道具偏好信息。
步骤403、将所述目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型,以及所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型作为样本参数,输入到道具曝光模型中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息。
步骤404、将所述虚拟角色对应的历史道具偏好信息和所述道具曝光特征作为样本参数,输入到购买概率模型中,得到所述目标推荐道具的购买概率。
步骤405、计算所述虚拟角色对所述目标推荐道具的购买情况对应的值与所述目标推荐道具的购买概率的差值的平方值,得到第一目标优化值。
步骤406、使用所述第一目标优化值,对所述兴趣偏好模型、所述道具曝光模型,以及购买概率模型中可学习的参数进行训练,直至使得到的所述第一目标优化值小于第一预设阈值为止。
具体的,每次响应该虚拟角色的道具推荐请求后,都会为该虚拟角色提供道具的推荐序列,在本次道具推荐之前的任一推荐序列中的一个推荐道具均可以作为一个目标推荐道具,该目标推荐道具所归属的推荐序列则作为目标历史推荐序列,由于不同时刻该虚拟角色对应的数据是不同的,因此在确定出一个目标推荐道具后,还需要获得以下几种数据:
第一种:该目标推荐道具所属归的目标历史推荐序列所在时刻用户在虚拟角色下的用户画像信息。
第二种:在该目标历史推荐序列之前虚拟角色购买过的道具的标识以及该道具的类型(例如:在该目标历史推荐序列之前虚拟角色购买过的道具包括道具A和道具B,然后确定道具A的类型和道具B的类型,其中,道具A标识和道具A的类型构成一个二元组数据,道具B的标识和道具B的类型构成一个二元组数据)。
第三种:在该目标历史推荐序列之前虚拟角色使用过的道具的标识以及该道具的类型(例如:在该目标历史推荐序列之前虚拟角色使用过的道具包括道具C和道具D,然后确定道具C的类型和道具D的类型,其中,道具C的标识和道具C的类型构成一个二元组数据,道具D的标识和道具D的类型构成一个二元组数据,需要说明的是,第二种数据和第三种数据中可能存在相同道具对应的二元组数据,也可能存在不同道具对应的二元组数据)。
第四种:该目标历史推荐序列包括的道具的标识以及该道具的类型(例如:目标历史推荐序列包括的道具E、道具F和道具G时,需要确定道具E的类型、道具F的类型和道具G的类型,其中,道具E的标识和道具E的类型构成一个二元组数据,道具F的标识和道具F的类型构成一个二元组数据,道具G的标识和道具G的类型构成一个二元组数据)。
第五种:该目标历史推荐序列中在该目标推荐道具之前被该虚拟角色购买的道具的标识以及该道具的类型(例如:目标历史推荐序列包括的道具E、道具F和道具G,且该虚拟角色在购买道具E之前还购买了道具F和道具G,如果将道具E作为目标推荐道具,则该目标历史推荐序列中在该目标推荐道具之前被该虚拟角色购买的道具包括道具F和道具G,并且还需要确定道具F和道具G,其中,道具E的标识和道具E的类型构成一个二元组数据,道具F的标识和道具F的类型构成一个二元组数据,需要说明的是,任一道具被购买时,都会生成该道具的购买记录,购买记录包括购买时间,通过购买时间可以确定出该目标历史推荐序列中在该目标推荐道具之前被该虚拟角色购买的道具)。
在确定出上述数据后,需要将第一种数据、第二种数据中包括的二元组数据和第三种数据中包括的二元组数据作为样本参数,输入到兴趣偏好模型中,得到该虚拟角色对应的历史道具偏好信息,即:该虚拟角色在该目标历史推荐序列所在时刻对应的道具偏好信息。在兴趣偏好模型中,第一种数据输入到全连接网络1中,得到全连接网络1的输出结果,第二种数据中包括的二元组数据输入到序列网络1中,得到序列网络1的输出结果,第三种数据中包括的二元组数据输入到序列网络2中,得到序列网络2的输出结果,然后将上述的三种输出结果进行拼接后作为输入参数,输入到全连接网络2中,得到该虚拟角色对应的历史道具偏好信息,上述仅是对兴趣偏好模型的处理过程的简要说明,在兴趣偏好模型中还包括其他处理过程,关于兴趣偏好模型中的具体处理过程在此不再详细说明。
同时,将目标推荐道具的标识以及道具类型构成的二元组数据,以及第四种数据中包括的二元组数据和第五种数据中包括的二元组数据作为样本参数输入到道具曝光模型中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息。在道具曝光模型中,目标推荐道具输入到全连接网络3中,得到全连接网络3的输出结果,第四种数据中包括的二元组数据输入到序列网络3中,得到序列网络3的输出结果,第五种数据中包括的二元组数据输入到序列网络4中,得到序列网络4的输出结果,然后将上述的三种输出结果进行拼接后作为输入参数,输入到全连接网络4中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息,上述仅是对道具曝光模型的处理过程的简要说明,在道具曝光模型中还包括其他处理过程,关于道具曝光模型中的具体处理过程在此不再详细说明。
需要说明的是,在将上述数据中包括的二元组数据作为输入参数输入到序列网络之前,需要将二元组数据输入到二元组编码器中,以得到各二元组数据对应的编码,然后将各二元组数据对应的编码作为输入参数输入到道具曝光模型和兴趣偏好模型中。
在得到该虚拟角色对应的历史道具偏好信息和道具曝光特征后,将这两个数据作为样本参数输入到购买概率模型中,得到该目标推荐道具的购买概率,例如:对上述两个参数进行拼接处理,然后经过全连接网络5和Sigmoid网络处理,得到上述的购买概率。同时,在该虚拟角色的历史购买记录中可以查询到该虚拟角色对该目标推荐道具的购买情况,其中,被购买对应的值为1,未被购买对应的值为0,然后计算该虚拟角色对该目标推荐道具的购买情况对应的值与该目标推荐道具的购买概率的差值的平方值,得到第一目标优化值,在使用该第一目标优化值对上述的兴趣偏好模型、道具曝光模型,以及购买概率模型中可学习的参数进行训练,此时完成了对兴趣偏好模型的训练。
然后选择在本次道具推荐之前的任一推荐序列中的一个推荐道具作为另一个目标推荐道具,然后按照上述方式对兴趣偏好模型的训练,直至得到的第一目标优化值小于第一预设阈值为止,此时兴趣偏好模型完成收敛。
需要说明的是,当目标推荐道具的数量较多时,每个目标推荐道具可以只是用一次,当目标推荐道具的数量较少时,一个目标推荐道具可以循环使用,上述涉及到的序列网络的实现方法可以有很多种,如:一维卷积网络、循环神经网络、Self-Attention网络等都可以完成序列网络的功能。
在一个可行的实施方案中,图5为本申请实施例一提供的另一种道具推荐方法的流程示意图,在将本次道具的推荐序列发送给目标客户端后,该方法还包括以下步骤:
步骤501、针对所述道具的推荐序列中的各推荐道具,构建该推荐道具与所述兴趣偏好模型对应的第一样本参数,以及与所述道具曝光模型对应的第二样本参数。
步骤502、将所述第一样本参数输入到所述兴趣偏好模型,得到所述虚拟角色在该推荐道具下对应的道具偏好信息。
步骤503、将所述第二样本参数输入到所述道具曝光模型中,得到该推荐道具对应的道具曝光特征信息。
步骤504、将所述虚拟角色在该推荐道具下对应的道具偏好信息和该推荐道具对应的道具曝光特征信息作为样本参数,输入到所述购买概率模型中,得到该推荐道具对应的购买概率,以将该推荐道具对应的购买概率作为该推荐道具的期望收益。
步骤505、计算各推荐道具的期望收益之和,以将所述之和作为所述道具的推荐序列的期望收益。
步骤506、计算所述道具的推荐序列的期望收益和所述道具推荐序列的整体交叉熵的第二乘积,以将所述第二乘积作为第二目标优化值。
步骤507、使用所述第二目标优化值对所述编码器、所述序列编码器和所述序列解码器中可学习的参数进行训练。
具体的,图1中对应的编码器、序列编码器和序列解码器等都属于道具的推荐序列模型,为了使道具的推荐序列模型推荐的推荐序列更加准确,需要对道具的推荐序列模型进行训练,在对道具的推荐序列模型进行训练时,可以使用当前一段时间内产生的购买记录进行训练,例如:在将本次道具的推荐序列发送给目标客户端后,玩家可以对推荐序列中的道具进行购买,并产生购买记录(包括:购买的道具的记录和未购买的道具的记录),在经过一段时间后,可以采集到该玩家在该虚拟角色下的多个购买记录,然后针对每个购买记录,构建该购买记录下的推荐道具与兴趣偏好模型对应的第一样本参数,以及与道具曝光模型对应的第二样本参数,即:将该推荐道具作为一个目标推荐道具来构建第一样本参数和第二样本参数,构建出来的第一样本参数可参考步骤402中的参数,构建出来的第二样本参数可参考步骤403中的参数。
在得到第一样本参数和第二样本参数后,将第一样本参数输入到兴趣偏好模型中,得到该虚拟角色在该推荐道具下对应的道具偏好信息(具体可参考步骤402),将第二样本参数输入到道具曝光模型中,得到该推荐道具对应的道具曝光特征信息(具体可参考步骤403)。然后将该虚拟角色在该推荐道具下对应的道具偏好信息和该推荐道具对应的道具曝光特征信息作为样本参数,输入到上述的购买概率模型中,得到该推荐道具对应的购买概率(具体可参考步骤404)。
在得到该推荐道具对应的购买概率后,将该推荐道具对应的购买概率作为该推荐道具的期望收益,然后计算该推荐道具所在推荐序列包括的推荐道具的期望收益之和,从而得到该推荐道具所在推荐序列的期望收益,再计算该推荐道具所在推荐序列的期望收益和该推荐道具所在推荐序列的整体交叉熵的第二乘积,然后使用第二乘积对推荐序列模型中的可学习的参数进行训练,此时完成了对推荐序列模型中的可学习的参数的一次训练。其中,在对推荐序列模型中的可学习的参数进行训练时,可以利用反向传播和梯度下降技术对推荐序列模型中的可学习的参数进行训练。
在对推荐序列模型进行训练时,可以将最近一段时间内任一推荐序列中的一个推荐道具作为目标推荐道具来实现对推荐序列模型的训练,通过上述方法不断训练出来的推荐序列模型可以为推荐的道具序列中的推荐道具的价格设置提供参考,以便提高推荐的道具序列的总体收益。
需要说明的是,推荐道具所在推荐序列的整体交叉熵是通过计算该推荐道具所在推荐序列中包括的各推荐道具的交叉熵之和得到的,在对推荐序列模型中的可学习的参数进行训练时,可以是对上述的编码器、序列编码器和序列解码器中的可学习的参数进行训练,当然在训练时还可以对推荐序列模型中的其他可学习的参数进行训练。
在一个可行的实施方案中,所述虚拟角色下的用户画像信息,包括:所述虚拟角色的平均在线时长信息、所述用户在所述虚拟角色下消费水平信息、所述用户的性别信息和所述用户的年龄信息。
具体的,该虚拟角色下的用户画像信息为本次构建样本参数时使用的推荐道具所归属的推荐序列所在时刻用户在该虚拟角色下的用户画像信息。
在一个可行的实施方案中,目标客户端在接收到道具的推荐序列后,如果道具序列推荐场景为解锁式商城道具推荐时,可以按照解锁式商城道具推荐的推荐方式对推荐序列中的推荐道具进行设置,例如:将推荐序列中的九个推荐道具分为三组,第一组道具可以任意购买,玩家在购买了第一组道具中的所有道具后,才可以购买第二组道具,玩家在购买了第二组道具中的所有道具后,才可以购买第三组道具,关于目标客户端在接收到道具的推荐序列后,推荐序列中的推荐道具的推荐规则可以根据实际需要进行设置,在此不做具体限定。
实施例二
图6为本申请实施例二提供的一种道具推荐装置的结构示意图,如图6所示,该推荐装置包括:
第一编码单元61,用于将待推荐道具的标识、所述待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到所述待推荐道具的编码,其中,所述当前道具偏好信息为目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息;
第二编码单元62,用于将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,得到推荐序列中第一个推荐位置上的道具编码;
解码单元63,用于将第N个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量;
生成单元64,用于对于每个推荐位置上的道具编码,从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列。
可选地,图7为本申请实施例二提供的另一种道具推荐装置的结构示意图,如图7所示,所述装置还包括:
偏好单元65,用于获取所述虚拟角色对应的第一历史特征数据,其中,所述第一历史特征数据包括:用户当前在所述虚拟角色下的用户画像信息、所述虚拟角色的道具购买记录信息、所述虚拟角色的道具使用记录信息;以及,用于将所述第一历史特征数据作为输入参数,输入到兴趣偏好模型中,得到所述当前道具偏好信息。
可选地,所述生成单元64的配置在用于从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的推荐序列时,包括:
计算该推荐位置上的道具编码与各待推荐道具的编码的相似度;
依据概率采样算法从所述相似度中确定出一个相似度对应的推荐道具,以作为该推荐位置上的道具编码对应的推荐道具;
根据得到的推荐道具和该推荐道具对应的推荐位置的先后顺序,生成所述道具的推荐序列;
其中,任意两个推荐位置上的推荐道具均不相同。
可选地,图8为本申请实施例二提供的另一种道具推荐装置的结构示意图,如图8所示,所述装置还包括:
第一训练单元66,用于获取目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型、在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型、所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型;将所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型,以及在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型作为样本参数,输入到所述兴趣偏好模型中,得到所述虚拟角色对应的历史道具偏好信息;将所述目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型,以及所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型作为样本参数,输入到道具曝光模型中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息;将所述虚拟角色对应的历史道具偏好信息和所述道具曝光特征作为样本参数,输入到购买概率模型中,得到所述目标推荐道具的购买概率;计算所述虚拟角色对所述目标推荐道具的购买情况对应的值与所述目标推荐道具的购买概率的差值的平方值,得到第一目标优化值;使用所述第一目标优化值,对所述兴趣偏好模型、所述道具曝光模型,以及购买概率模型中可学习的参数进行训练,直至使得到的所述第一目标优化值小于第一预设阈值为止。
可选地,图9为本申请实施例二提供的另一种道具推荐装置的结构示意图,如图9所示,所述装置还包括:
第二训练单元67,用于在将所述道具的推荐序列发送给所述目标客户端后,针对所述道具的推荐序列中的各推荐道具,构建该推荐道具与所述兴趣偏好模型对应的第一样本参数,以及与所述道具曝光模型对应的第二样本参数;以及,用于将所述第一样本参数输入到所述兴趣偏好模型,得到所述虚拟角色在该推荐道具下对应的道具偏好信息;以及,用于将所述第二样本参数输入到所述道具曝光模型中,得到该推荐道具对应的道具曝光特征信息;以及,用于将所述虚拟角色在该推荐道具下对应的道具偏好信息和该推荐道具对应的道具曝光特征信息作为样本参数,输入到所述购买概率模型中,得到该推荐道具对应的购买概率,以将该推荐道具对应的购买概率作为该推荐道具的期望收益;以及,用于计算各推荐道具的期望收益之和,以将所述之和作为所述道具的推荐序列的期望收益;以及,用于计算所述道具的推荐序列的期望收益和所述道具推荐序列的整体交叉熵的第二乘积,以将所述第二乘积作为第二目标优化值;以及,用于使用所述第二目标优化值对所述编码器、所述序列编码器和所述序列解码器中可学习的参数进行训练。
可选地,所述虚拟角色下的用户画像信息,包括:
所述虚拟角色的平均在线时长信息、所述用户在所述虚拟角色下消费水平信息、所述用户的性别信息和所述用户的年龄信息。
通过上述方法得到的道具的推荐序列不仅是该虚拟角色当前偏好的道具,还兼顾了道具之间的相互关联,有利于提高道具推荐序列的购买率。
实施例三
图10为本申请实施例三提供的一种电子设备的结构示意图,包括:处理器1001、存储介质1002和总线1003,所述存储介质1002存储有所述处理器1001可执行的机器可读指令,当电子设备运行上述的道具推荐的方法时,所述处理器1001与所述存储介质1002之间通过总线1003通信,所述处理器1001执行所述机器可读指令,以执行实施例一中所述的方法,关于具体执行的方法步骤和原理参见上述的说明,在此不再详细赘述。
实施例四
本申请实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一中所述的方法,关于具体执行的方法步骤和原理参见上述的说明,在此不再详细赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种道具推荐方法,其特征在于,包括:
将待推荐道具的标识、所述待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到所述待推荐道具的编码,其中,所述当前道具偏好信息为目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息;
将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,得到推荐序列中第一个推荐位置上的道具编码;
将第N个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量;
对于每个推荐位置上的道具编码,从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的所述推荐序列。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述虚拟角色对应的第一历史特征数据,其中,所述第一历史特征数据包括:用户当前在所述虚拟角色下的用户画像信息、所述虚拟角色的道具购买记录信息、所述虚拟角色的道具使用记录信息;
将所述第一历史特征数据作为输入参数,输入到兴趣偏好模型中,得到所述当前道具偏好信息。
3.如权利要求1所述的方法,其特征在于,所述从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的所述推荐序列,包括:
计算该推荐位置上的道具编码与各待推荐道具的编码的相似度;
依据概率采样算法从所述相似度中确定出一个相似度对应的推荐道具,以作为该推荐位置上的道具编码对应的推荐道具;
根据得到的推荐道具和该推荐道具对应的推荐位置的先后顺序,生成所述道具的推荐序列;
其中,任意两个推荐位置上的推荐道具均不相同。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型、在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型、所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型;
将所述目标历史推荐序列所在时刻用户在所述虚拟角色下的用户画像信息、在所述目标历史推荐序列之前所述虚拟角色购买过的道具的标识以及该道具的类型,以及在所述目标历史推荐序列之前所述虚拟角色使用过的道具的标识以及该道具的类型作为样本参数,输入到所述兴趣偏好模型中,得到所述虚拟角色对应的历史道具偏好信息;
将所述目标历史推荐序列中的目标推荐道具的标识以及该道具的类型、所述目标历史推荐序列包括的道具的标识以及该道具的类型,以及所述目标历史推荐序列中在所述目标推荐道具之前被所述虚拟角色购买的道具的标识以及该道具的类型作为样本参数,输入到道具曝光模型中,得到用于表示所述目标历史推荐序列中包括的推荐道具对所述目标推荐道具的影响的道具曝光特征信息;
将所述虚拟角色对应的历史道具偏好信息和所述道具曝光特征作为样本参数,输入到购买概率模型中,得到所述目标推荐道具的购买概率;
计算所述虚拟角色对所述目标推荐道具的购买情况对应的值与所述目标推荐道具的购买概率的差值的平方值,得到第一目标优化值;
使用所述第一目标优化值,对所述兴趣偏好模型、所述道具曝光模型,以及购买概率模型中可学习的参数进行训练,直至使得到的所述第一目标优化值小于第一预设阈值为止。
5.如权利要求4所述的方法,其特征在于,在将所述道具的所述推荐序列发送给所述目标客户端后,所述方法还包括:
针对所述道具的推荐序列中的各推荐道具,构建该推荐道具与所述兴趣偏好模型对应的第一样本参数,以及与所述道具曝光模型对应的第二样本参数;
将所述第一样本参数输入到所述兴趣偏好模型,得到所述虚拟角色在该推荐道具下对应的道具偏好信息;
将所述第二样本参数输入到所述道具曝光模型中,得到该推荐道具对应的道具曝光特征信息;
将所述虚拟角色在该推荐道具下对应的道具偏好信息和该推荐道具对应的道具曝光特征信息作为样本参数,输入到所述购买概率模型中,得到该推荐道具对应的购买概率,以将该推荐道具对应的购买概率作为该推荐道具的期望收益;
计算各推荐道具的期望收益之和,以将所述之和作为所述道具的推荐序列的期望收益;
计算所述道具的推荐序列的期望收益和所述道具推荐序列的整体交叉熵的第二乘积,以将所述第二乘积作为第二目标优化值;
使用所述第二目标优化值对所述编码器、所述序列编码器和所述序列解码器中可学习的参数进行训练。
6.如权利要求2或4所述的方法,其特征在于,所述虚拟角色下的用户画像信息,包括:
所述虚拟角色的平均在线时长信息、所述用户在所述虚拟角色下消费水平信息、所述用户的性别信息和所述用户的年龄信息。
7.一种道具推荐装置,其特征在于,包括:
第一编码单元,用于将待推荐道具的标识、所述待推荐道具的类型和当前道具偏好信息作为一组输入数据,输入到编码器中进行编码,得到所述待推荐道具的编码,其中,所述当前道具偏好信息为目标客户端中进入游戏场景的虚拟角色当前对应的道具偏好信息;
第二编码单元,用于将各待推荐道具的编码作为输入参数,输入到用于对序列中的编码的特征进行组合的序列编码器进行编码,得到推荐序列中第一个推荐位置上的道具编码;
解码单元,用于将第N个推荐位置上的道具编码作为输入参数,输入到用于进行编码空间映射的序列解码器进行解码,将解码结果作为第N+1个推荐位置上的道具编码,其中,N为大于1的正整数,N的最大值为预设的推荐道具的数量;
生成单元,用于对于每个推荐位置上的道具编码,从所述待推荐道具中确定该推荐位置上的道具编码对应的推荐道具,以得到道具的所述推荐序列。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
偏好单元,用于获取所述虚拟角色对应的第一历史特征数据,其中,所述第一历史特征数据包括:用户当前在所述虚拟角色下的用户画像信息、所述虚拟角色的道具购买记录信息、所述虚拟角色的道具使用记录信息;以及,用于将所述第一历史特征数据作为输入参数,输入到兴趣偏好模型中,得到所述当前道具偏好信息。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至6中任一项所述的道具推荐的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6中任一项所述的道具推荐的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010790182.2A CN111870958B (zh) | 2020-08-07 | 2020-08-07 | 一种道具推荐方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010790182.2A CN111870958B (zh) | 2020-08-07 | 2020-08-07 | 一种道具推荐方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111870958A true CN111870958A (zh) | 2020-11-03 |
CN111870958B CN111870958B (zh) | 2024-02-23 |
Family
ID=73211945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010790182.2A Active CN111870958B (zh) | 2020-08-07 | 2020-08-07 | 一种道具推荐方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111870958B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113101655A (zh) * | 2021-05-12 | 2021-07-13 | 腾讯科技(深圳)有限公司 | 一种虚拟道具推荐方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299355A (zh) * | 2018-08-09 | 2019-02-01 | 咪咕数字传媒有限公司 | 一种推荐书单展示方法、装置及存储介质 |
US20190197058A1 (en) * | 2017-10-18 | 2019-06-27 | International Business Machines Corporation | Determining apparel-based recommendations for a user |
CN109999504A (zh) * | 2019-04-22 | 2019-07-12 | 腾讯科技(上海)有限公司 | 一种游戏道具推荐方法、装置、服务器及存储介质 |
CN110052033A (zh) * | 2019-04-26 | 2019-07-26 | 腾讯科技(深圳)有限公司 | 一种游戏装备请求方法、装置、服务器及存储介质 |
CN110335107A (zh) * | 2019-05-28 | 2019-10-15 | 西安万像电子科技有限公司 | 商品推荐方法、装置及系统 |
-
2020
- 2020-08-07 CN CN202010790182.2A patent/CN111870958B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190197058A1 (en) * | 2017-10-18 | 2019-06-27 | International Business Machines Corporation | Determining apparel-based recommendations for a user |
CN109299355A (zh) * | 2018-08-09 | 2019-02-01 | 咪咕数字传媒有限公司 | 一种推荐书单展示方法、装置及存储介质 |
CN109999504A (zh) * | 2019-04-22 | 2019-07-12 | 腾讯科技(上海)有限公司 | 一种游戏道具推荐方法、装置、服务器及存储介质 |
CN110052033A (zh) * | 2019-04-26 | 2019-07-26 | 腾讯科技(深圳)有限公司 | 一种游戏装备请求方法、装置、服务器及存储介质 |
CN110335107A (zh) * | 2019-05-28 | 2019-10-15 | 西安万像电子科技有限公司 | 商品推荐方法、装置及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113101655A (zh) * | 2021-05-12 | 2021-07-13 | 腾讯科技(深圳)有限公司 | 一种虚拟道具推荐方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111870958B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109754317B (zh) | 融合评论的可解释性服装推荐方法、系统、设备及介质 | |
CN111310050B (zh) | 一种基于多层注意力的推荐方法 | |
CN107562787B (zh) | 一种poi编码方法及装置、poi推荐方法,电子设备 | |
CN111259222B (zh) | 物品推荐方法、系统、电子设备及存储介质 | |
CN110288513B (zh) | 用于改变人脸属性的方法、装置、设备和存储介质 | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN113538101B (zh) | 一种基于人工智能的家装定制方法、系统及存储介质 | |
CN111061945A (zh) | 推荐方法、装置、电子设备,存储介质 | |
CN111260449A (zh) | 一种模型训练的方法、商品推荐的方法、装置及存储介质 | |
CN112107866A (zh) | 用户行为数据处理方法、装置、设备及存储介质 | |
CN109598578A (zh) | 业务对象数据的推送方法及装置、存储介质、计算机设备 | |
CN113283238B (zh) | 文本数据处理的方法和装置、电子设备和存储介质 | |
CN111870959A (zh) | 一种游戏中的资源推荐方法及装置 | |
CN110706055A (zh) | 商品信息推送方法及装置、存储介质、计算机设备 | |
CN107506479B (zh) | 一种对象推荐方法和装置 | |
KR20210028365A (ko) | 인공지능 기반의 기계학습을 통한 사용자 맞춤형 상품 추천 장치 | |
CN111870958A (zh) | 一种道具推荐方法、装置、电子设备和存储介质 | |
CN111651679A (zh) | 基于强化学习的推荐方法及装置 | |
CN116186403A (zh) | 一种推荐方法、装置、电子设备及可读存储介质 | |
CN112434527B (zh) | 一种关键词的确定方法、装置、电子设备及存储介质 | |
CN113254788B (zh) | 一种基于大数据的推荐方法、系统及可读存储介质 | |
CN115269919A (zh) | 一种短视频质量的确定方法、装置、电子设备及存储介质 | |
CN112801076B (zh) | 基于自注意力机制的电子商务视频高光检测方法及系统 | |
CN108848152A (zh) | 一种对象推荐的方法及服务器 | |
CN112488355A (zh) | 基于图神经网络预测用户评级的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |