CN111729310B

CN111729310B - 游戏道具的整理方法、装置和电子设备

Info

Publication number: CN111729310B
Application number: CN202010594918.9A
Authority: CN
Inventors: 冯潞潞; 邹哲讷; 尚悦; 陶建容; 范长杰; 胡志鹏
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2020-06-24
Filing date: 2020-06-24
Publication date: 2024-02-09
Anticipated expiration: 2040-06-24
Also published as: CN111729310A

Abstract

本发明提供了一种游戏道具的整理方法、装置和电子设备，响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；从道具集合中获取至少一对道具对；针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。该方式中，通过道具顺序模型，自动学习背包中各个道具的顺序关系，基于该顺序关系对玩家背包中的道具进行排序，无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

Description

游戏道具的整理方法、装置和电子设备

技术领域

本发明涉及游戏道具技术领域，尤其是涉及一种游戏道具的整理方法、装置和电子设备。

背景技术

游戏世界中有丰富的道具，游戏玩家在游戏体验过程中会不断获取到各种道具；玩家获取到的道具放置在玩家的道具背包中。由于道具背包的空间有限，需要经常对背包中的道具进行整理。相关技术中，游戏策划为每种道具设置道具编号，在整理道具的过程中，根据道具编号的顺序对背包中的道具进行排序。但是，当游戏中的道具不断增加时，为道具设置编号的任务变得更加繁琐易出错，如果编号设置错误，易导致道具整理过程中道具排序发生混乱；另外，这种基于道具编号整理道具的方式，使得背包中道具的排列顺序相对固化，难以与玩家的个人习惯和游戏场景的实际需求相匹配，降低了玩家的游戏体验度。

发明内容

有鉴于此，本发明的目的在于提供一种游戏道具的整理方法、装置和电子设备，以提升用户的游戏体验度。

第一方面，本发明实施例提供了一种游戏道具的整理方法，该方法包括：响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；从道具集合中获取至少一对道具对；针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；其中，道具信息根据当前游戏场景和/或当前玩家确定；根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。

进一步的，道具信息通过下述方式获得：获取待处理道具的原始信息；其中，原始信息包括待处理道具的道具标识、道具类型、当前游戏场景信息和当前玩家信息；将原始信息输入至预先训练完成的信息编码器中，得到待处理道具的道具信息。

进一步的，信息编码器通过下述方式训练得到：获取包含有多个道具的训练样本；将训练样本中的每个道具输入至信息编码器中，输出每个道具的初始道具信息；将每个道具的初始道具信息输入至辅助训练模型中，以基于辅助训练模型对信息编码器进行训练，得到训练后的信息编码器。

进一步的，训练样本包括：样本道具集合中目标道具、比对道具、第一标签信息以及使用道具序列；其中，目标道具为已经发生位置变化的道具；第一标签信息包括：目标道具与比对道具的前后位置关系、以及目标道具与比对道具是否具有相邻关系；使用道具序列为：自从目标道具发生位置变化后，样本道具集合中被玩家使用的道具序列；使用道具序列中的道具按照被使用的时间顺序排列。

进一步的，辅助训练模型包括第一辅助模型和第二辅助模型；将每个道具的初始道具信息输入至辅助训练模型中，以基于辅助训练模型对信息编码器进行训练，得到训练后的信息编码器的步骤，包括：将每个道具的初始道具信息输入至第一辅助模型中，输出目标道具和比对道具前面的第二排序信息；基于第一标签信息和第二排序信息，对信息编码器和第一辅助模型进行训练，直至第一辅助模型收敛，得到信息编码器的中间训练结果；将训练样本中的每个道具输入至中间训练结果中，输出每个道具的中间道具信息；将每个道具的中间道具信息输入至第二辅助模型中，输出指示目标道具与比对道具是否相邻的位置信息；基于第一标签信息和位置信息，对信息编码器和第二辅助模型进行训练，直至第二辅助模型收敛，得到训练后的信息编码器。

进一步的，第一辅助模型包括：第一全连接网络、第二全连接网络、第一序列网络和第三全连接网络；将每个道具的初始道具信息输入至第一辅助模型中，输出目标道具和比对道具的第二排序信息的步骤，包括：将目标道具的初始道具信息输入至第一全连接网络中，输出第一中间信息；将比对道具的初始道具信息输入至第二全连接网络中，输出第二中间信息；将使用道具序列的初始道具信息输入至第一序列网络中，输出第三中间信息；将第一中间信息、第二中间信息和第三中间信息输入至第三全连接网络中，得到第一输出结果，基于第一输出结果确定目标道具和比对道具的第二排序信息；第二排序信息包括：目标道具排列在比对道具前面的概率。

进一步的，第二辅助模型包括：第四全连接网络、第五全连接网络、第二序列网络和第六全连接网络；将每个道具的中间道具信息输入至第二辅助模型中，输出指示目标道具与比对道具是否相邻的位置信息的步骤，包括：将目标道具的中间道具信息输入至第四全连接网络中，输出第四中间信息；将比对道具的中间道具信息输入至第五全连接网络中，输出第五中间信息；将使用道具序列的中间道具信息输入至第二序列网络中，输出第六中间信息；将第四中间信息、第五中间信息和第六中间信息输入至第六全连接网络中，得到第二输出结果，基于第二输出结果确定指示目标道具与比对道具是否相邻的位置信息；位置信息包括：目标道具与比对道具相邻的概率。

进一步的，道具顺序模型包括第七全连接网络、第八全连接网络和第九全连接网络；将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息的步骤，包括：将第一道具的道具信息输入至第七全连接网络，输出第七中间信息；将第二道具的道具信息输入至第八全连接网络，输出第八中间信息；将第七中间信息和第八中间信息输入至第九全连接网络，得到第三输出结果；基于第三输出结果确定第一道具和第二道具的第一排序信息；其中，第一排序信息包括：第一道具排列在第二道具前面的概率，或者，第一道具和第二道具的排序结果。

进一步的，道具顺序模型，通过下述方式训练得到：获取样本道具对和第二标签信息；样本道具对包括样本道具集合中的目标道具和比对道具；其中，目标道具为已经发生位置变化的道具；第二标签信息包括：目标道具与比对道具的前后位置关系；将目标道具的道具信息输入至第七全连接网络中，输出第七中间信息；将比对道具的道具信息输入至第八全连接网络中，输出第八中间信息；将第七中间信息和第八中间信息输入至第九全连接网络中，得到第三输出结果，基于第三输出结果得到目标道具和比对道具的第三排序信息；基于第二标签信息和第三排序信息，对道具顺序模型进行训练，直至道具顺序模型收敛，得到训练后的道具训练模型。

进一步的，从道具集合中获取至少一对道具对的步骤，包括：对道具集合中的道具进行聚类处理，得到至少一个道具类簇；其中，每个道具类簇中包括道具集合中的至少一个道具；针对每个道具类簇，如果当前道具类簇中包括多个道具，基于多个道具，生成至少一对道具对；根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序的步骤，包括：根据当前道具类簇中每对道具对对应的第一排序信息，统计当前道具类簇中每个道具在各个道具对中排在前面的次数；基于每个道具在各个道具对中排在前面的次数，对当前道具类簇中的道具进行排序。

进一步的，基于每个道具在各个道具对中排在前面的次数，对当前道具类簇中的道具进行排序的步骤之后，方法还包括：将当前道具类簇中，每个道具的道具信息中的当前场景信息置为零，得到每个道具的临时道具信息；针对当前道具类簇中的每对道具对，将道具对中的第一道具的临时道具信息和第二道具的临时道具信息输入至道具顺序模型，输出第一道具和第二道具的临时排序信息；根据每对道具对对应的临时排序信息，对道具集合中的道具进行排序，得到临时排序结果；基于临时排序结果，确定当前道具类簇中与当前场景相关的道具。

进一步的，基于每个道具在各个道具对中排在前面的次数，对当前道具类簇中的道具进行排序的步骤之后，方法还包括：针对每个道具类簇，将当前道具类簇中、在各个道具对中排在前面的次数最多的道具，确定为当前道具类簇中的代表道具；基于每个道具类簇的代表道具，生成至少一对代表道具对；根据每对代表道具对对应的第一排序信息，统计每个代表道具在各个代表道具对中排在前面的次数；基于每个代表道具在各个代表道具对中排在前面的次数，对每个道具类簇进行排序。

进一步的，根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序的步骤之后，方法还包括：响应于道具调整指令，获取道具调整指令对应的待调整道具和目标位置；将道具集合中的待调整道具调整至目标位置。

第二方面，本发明实施例提供了一种游戏道具的整理装置，该装置包括：道具集合获取模块，用于响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；道具对获取模块，用于从道具集合中获取至少一对道具对；排序信息输出模型，用于针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；其中，道具信息根据当前游戏场景和/或当前玩家确定；道具排序模块，用于根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。

第三方面，本发明实施例提供了一种电子设备，包括处理器和存储器，存储器存储有能够被处理器执行的机器可执行指令，处理器执行机器可执行指令以实现上述游戏道具的整理方法。

第四方面，本发明实施例提供了一种机器可读存储介质，机器可读存储介质存储有机器可执行指令，机器可执行指令在被处理器调用和执行时，机器可执行指令促使处理器实现上述游戏道具的整理方法。

本发明实施例带来了以下有益效果：

本发明实施例提供了一种游戏道具的整理方法、装置和电子设备，响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；然后从道具集合中获取至少一对道具对；针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。该方式中，通过道具顺序模型，自动学习背包中各个道具的顺序关系，基于该顺序关系对玩家背包中的道具进行排序，无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种游戏道具的整理方法的流程图；

图2为本发明实施例提供的一种信息编码器的训练方法的流程图；

图3为本发明实施例提供的一种样本道具集合中道具的移动示意图；

图4为本发明实施例提供的一条完整的训练样本的结构示意图；

图5为本发明实施例提供的一种信息编码器的训练方式的流程示意图；

图6为本发明实施例提供的另一种信息编码器的训练方法的流程图；

图7为本发明实施例提供的一种第一辅助模型的训练方法的流程示意图；

图8为本发明实施例提供的一种第二辅助模型的训练方法的流程示意图；

图9为本发明实施例提供的一种道具顺序模型的训练方法的流程示意图；

图10为本发明实施例提供的一种聚类处理结果示意图；

图11为本发明实施例提供的一种具体的游戏道具的整理方法的时序图；

图12为本发明实施例提供的一种游戏道具的整理装置的结构示意图；

图13为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前传统的背包中道具的整理方式，通常由策划事先为每种道具配置编号，当用户有一键整理道具的需求时，系统把用户所有的道具按照道具的编号进行排序，展现给用户；当游戏中不断增加新道具时，策划需要手动为新道具配置编号，当道具数量很多时，策划很难做出合适的配置；另外，不同玩家对道具分类的存放方式有着不同的习惯，使用固定顺序的道具编号不能不满足部分用户的个性化需求，玩家的游戏体验度不高。基于此，本发明实施例提供的一种游戏道具的整理方法、装置和电子设备，可以应用于多种游戏场景中，尤其可以应用于对游戏道具进行整理的游戏场景中。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种游戏道具的整理方法进行详细介绍，该方法可以应用于终端设备，通过在终端设备的处理器上执行软件应用，并在终端设备的显示器上渲染得到图形用户界面，图形用户界面中设置有技能控件；其中，该软件应用可以是游戏应用；该图形用户界面可以是游戏中当前正在展示的游戏场景；该图像用户界面中的技能控件，可以用于一键整理背包中的道具。

如图1所示，该方法包括如下步骤：

步骤S102，响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；

上述道具整理指令可以由用户通过道具整理控件触发；该道具整理控件通常设置在游戏场景中的相对固定的位置；在手机、平板电脑等通过触摸屏控制的设备中，游戏玩家可以通过手指点击道具整理控件；在台式电脑、笔记本等终端设备中，游戏玩家可以通过鼠标、外置触摸屏等点击道具整理控件；在通过语音控制的设备中，游戏玩家还可以通过麦克风等语音输入设备等控制道具整理控件触发。上述道具集合通常是指游戏玩家背包中的所有道具的信息，该道具集合可以包括道具序列、当前游戏场景、用户画像等信息；还可以包括道具标识、道具类型、当前游戏场景、用户画像等信息；还可以包括道具标识编码、道具类型编码、当前游戏场景编码、用户画像编码等；其中，用户画像包括用户的性别、年龄、在线时长、消费水平等信息。

具体的，当响应于道具整理指令后，可以通过客户端将道具整理指令对应的玩家背包中的道具序列，当前场景、用户画像等信息，发送至服务器，可以利用数据处理等方式，将该玩家背包中的道具进行编码处理，得到上述道具集合。

步骤S104，从道具集合中获取至少一对道具对；

上述道具集合中通常包含有多个道具；上述道具对可以是功能相似的两个道具，也可以是相同类型的两个道具，还可以是完全不同的两个道具等；该道具对可以从道具集合中随机提取，也可以通过聚类的方式选取相同或者不同类型的两个道具。如果获取到多对道具对，每对道具对之间可以有重复的道具，也可以是没有重复的道具。

步骤S106，针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；其中，道具信息根据当前游戏场景和/或当前玩家确定；

上述道具信息通常包括道具、道具类型、使用道具的场景、用户画像等信息；上述当前游戏场景包括多种，比如，在副本中与小怪对战的场景、在副本中与大怪对战的场景、正在锻造头盔的场景、正在锻造衣服的场景等；另外，同样是副本中的对战，有的游戏需要区分与不同敌人对战的场景，有的游戏不做区分；同时，有的游戏需要对不同的副本进行区分，有的游戏则认为所有的副本属于同一个场景。

为了使预先训练完成的道具顺序模型能够理解输入的数据，因此上述道具信息通常包括道具编码、道具类型编码、使用道具的场景编码、用户编码；上述预先训练完成的道具顺序模型可以是各种网络模型，比如，CNN(Convolutional Neural Networks，卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)和DNN(Deep Neural Network，深度神经网络)等模型；该道具顺序模型可以根据已经训练完成的网络参数，判断输入的第一道具和第二道具的顺序，输出的第一道具和第二道具的第一排序信息，可以是第一道具相对于第二道具排列在前面的概率，可以根据该概率的大小确定第一道具与第二道具在背包中的顺序；也可以是第一道具和第二道具的具体排列结果，例如该具体排列结果可以为：第一道具排列在第二道具前面，或者，第二道具排列在第一道具前面。

由于各个道具可以用于各种游戏场景中，因此每个道具在不同的游戏场景以及不同的游戏玩家中，其道具信息有所不同。因此每个道具的道具信息可以根据当前游戏场景和当前玩家确定，或者根据当前游戏场景确定，或者根据当前玩家确定；比如，道具a在当前玩家为k的场景b中的道具信息通常包括有当前玩家为k的信息和游戏场景b的信息等，比如，可以为在场景b中道具a相对于玩家k的信息；该信息可以是各种信息编码等。

步骤S108，根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。

通常道具集合中包含有多个道具，可以根据每对道具对对应的第一排序信息确定每对道具对的排列顺序，当每对道具对中有重复的道具时，可以利用重复的道具，对每对道具对之间进行排序，最终将道具集合中的所有道具进行排序。如果每对道具对中没有重复的道具，可以根据道具对中每个道具的类型，对道具对之间的道具进行排序，最终将道具集合中的所有道具进行排序。

本发明实施例提供了一种游戏道具的整理方法，响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；然后从道具集合中获取至少一对道具对；针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。该方式中，通过道具顺序模型，自动学习背包中各个道具的顺序关系，基于该顺序关系对玩家背包中的道具进行排序，无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

上述实施例描述了道具信息可以根据当前游戏场景和当前玩家确定，或者也可以基于二者之一确定；下述继续描述道具信息的具体获取方式，该方式中，道具信息不仅需要参考当前游戏场景和当前玩家的相关信息，还需要参考道具本身的相关信息，具体的道具信息获得方式通过下述方式实现：

步骤A1，获取待处理道具的原始信息；其中，原始信息包括待处理道具的道具标识、道具类型、当前游戏场景信息和当前玩家信息；

上述待处理道具可以是当前玩家游戏背包中的各个道具；上述道具标识通常是不具有数值意义的ID((IdentityDocument，身份标识号)数据，比如，“3001”、“3002”、“3003”分别代表了游戏中三个道具标识；上述道具类型和当前游戏场景的信息与道具标识类型相同，也是一种ID数据，比如，“A001”、“A002”分别代表了游戏中两个道具类型；再如，“P001”、“P002”分别代表了游戏中不同的两个游戏场景；上述当前玩家信息包括性别、年龄、在线时长、消费水平等信息；该当前玩家信息可以为数值类数据，比如，玩家性别可以为，“00”和“01”，其中“00”表示女性，“01”表示男性；玩家年龄可以直接根据年龄数值表示；在线时长也可以直接根据时间数值表示；消费水平可以根据消费的具体数值表示。

举例说明，玩家通过点击道具整理控件，客户端响应于道具整理指令，从日志数据中获取的待处理道具的原始信息。

步骤A2，将原始信息输入至预先训练完成的信息编码器中，得到待处理道具的道具信息。

具体的，对于从客户端的日志数据中获取的待处理道具的原始信息，道具顺序模型可能无法直接识别，需要对该原始信息进行预处理；可以通过服务器等设备，将原始信息输入至预先训练完成的信息编码器中，通过该信息编码器，将原始信息中的道具标识、道具类型、当前游戏场景信息和当前玩家信息进行编号；比如，可以将道具标识、道具类型、当前游戏场景信息等ID类数据根据字典顺序进行排序，并按照1、2、3、…N进行编号；用户画像信息一般为数值类数据，在此不需做特殊处理并进行编号。

该方式中，提供了在线服务模块中生成道具信息的方法，通过预先训练完成的信息编码模型，将其应用于在线服务模块，将原始信息输入至预先训练完成的信息编码器中，得到待处理道具的道具信息，以使进行后续道具整理的模型进行道具整理的操作。

本实施例还提供另一种游戏道具的整理方法，该方法中描述上述信息编码器训练的具体实现方式。如图2所示的一种信息编码器的训练方法的流程图，该方式包括如下步骤：

步骤S202，获取包含有多个道具的训练样本；

上述多个道具的训练样本可以是在离线的状态下，收集的当前游戏中所有用户的用户数据；具体的，在离线状态下，从日志数据库中获取训练样本，包括，玩家使用道具序列、用户画像信息、玩家移动道具数据、玩家背包数据等信息；其中，使用道具序列表示从某一时刻开始，玩家使用的道具按时间顺序进行排列，形成的序列；比如，从t时刻开始的序列称为t时刻的使用道具序列；户画像信息包括，性别、年龄、在线时长、消费水平等；玩家移动道具数据，包括被移动的道具、移动前的位置、移动后的位置、移动时的场景；玩家背包数据包括，背包中每个道具的位置。

优选的一种实施方式，上述训练样本包括：样本道具集合中目标道具、比对道具、第一标签信息以及使用道具序列；其中，目标道具为已经发生位置变化的道具；第一标签信息包括：目标道具与比对道具的前后位置关系、以及目标道具与比对道具是否具有相邻关系；使用道具序列为：自从目标道具发生位置变化后，样本道具集合中被玩家使用的道具序列；使用道具序列中的道具按照被使用的时间顺序排列。

通常服务器会将用户的每次移动道具的数据进行记录，根据每次移动道具的记录，可以构建一组训练数据。其中移动道具一般可以分为两种情况：第一、将道具移动到一个空的位置；第二、将道具和另外一个道具家换位置；道具交换位置的记录可以处理为两条训练数据，即分别将两个道具移动到空的位置；由此，上述移动道具即为上述目标道具。

上述比对道具可以是用户背包中除目标道具以外的任意一个道具；上述第一标签信息可以用“0”、“1”、“2”和“3”表示，比如，目标道具在比对道具的前面位置，此时第一标签信息可以为“1”、目标道具在比对道具的后面位置，此时第一标签信息可以为“0”，以及目标道具与比对道具相邻，此时第一标签信息可以为“3”，目标道具与比对道具不相邻，此时第一标签信息可以为“2”。

用户的背包中每个道具的位置可以是矩阵排列的方式，上述相邻关系可以包括两个道具在背包中距离三个位置以内；该三个位置的距离可以是曼哈顿距离(ManhattanDistance)，即横向距离加上纵向距离小于等于三，此时可以认为两个道具相邻。

举例说明，参见图3所示的一种样本道具集合中道具的移动示意图；该样本集合中将道具a移动至一个空位置，将道具b和道具c交换位置，构成了移动道具序列分别为道具a、道具b、道具c；使用道具序列为道具a、道具b、道具c发生位置变化后，样本道具集合中被玩家使用的道具序列包括道具d、道具e、道具f和道具g。本实施例以用户X移动道具a后，构建训练样本为例；首先，移动道具a为已经发生位置变化的道具，即目标道具；移动道具a以后，用户只使用了道具d、道具e、道具f、道具g，因此将道具d、道具e、道具f、道具g确定为使用道具序列；比对道具为除道具a以外的任意一个道具，可以是道具d、道具e、道具f、道具b、道具g、道具c其中的任意一个道具；第一标签信息可以通过比较目标道具和比对道具的关系，对于目标道具与比对道具的前后位置关系，第一标签信息可为“1”或“0”；对于目标道具与比对道具是否具有相邻关系，第一标签信息可为“2”或“3”。

所以用户X移动道具a后，对于目标道具与比对道具的前后位置关系，可以构成6条训练样本：

目标道具：a，比对道具：d，使用道具序列：d、e、f、g，标签：0；

目标道具：a，比对道具：e，使用道具序列：d、e、f、g，标签：0；

目标道具：a，比对道具：f，使用道具序列：d、e、f、g，标签：1；

目标道具：a，比对道具：b，使用道具序列：d、e、f、g，标签：1；

目标道具：a，比对道具：g，使用道具序列：d、e、f、g，标签：1；

目标道具：a，比对道具：c，使用道具序列：d、e、f、g，标签：1；

同理用户X交换道具b、c后，可以拆分成目标道具b和目标道具c，分别生成6条训练数据；其中，用户X移动道具b后，对于目标道具与比对道具的前后位置关系，可以构成6条训练样本：

目标道具：b，比对道具：a，使用道具序列：f、g，标签：0；

目标道具：b，比对道具：d，使用道具序列：f、g，标签：0；

目标道具：b，比对道具：e，使用道具序列：f、g，标签：0；

目标道具：b，比对道具：f，使用道具序列：f、g，标签：1；

目标道具：b，比对道具：g，使用道具序列：f、g，标签：1；

目标道具：b，比对道具：c，使用道具序列：f、g，标签：1；

用户X移动道具c后，对于目标道具与比对道具的前后位置关系，可以构成6条训练样本：

目标道具：c，比对道具：a，使用道具序列：f、g，标签：0；

目标道具：c，比对道具：b，使用道具序列：f、g，标签：1；

目标道具：c，比对道具：d，使用道具序列：f、g，标签：0；

目标道具：c，比对道具：e，使用道具序列：f、g，标签：0；

目标道具：c，比对道具：f，使用道具序列：f、g，标签：0；

目标道具：c，比对道具：g，使用道具序列：f、g，标签：1；

最终用户X的样本道具集合中一共生成了18条训练样本；另外，在构建训练样本的时候，每个道具需要添加三个额外的道具信息，构成道具四元组，分别为道具的类型、道具的场景和用户画像；对于目标道具和比对道具，其场景为移动道具时的场景，对于使用道具，其场景为使用道具时的场景；以“目标道具：a，比对道具：d，使用道具序列：d、e、f、g，标签：0”这条训练样本为例，参见图4所示的一条完整的训练样本的结构示意图，其中包括每个道具的四元组信息，还包括有第一标签信息。

构建训练样本的伪代码可以表示为：

For所有用户：

获取用户画像

For所有的移动道具记录：

获取使用道具序列

获取目标道具(被移动的道具)

For所有没移动的道具：

获取比对道具(其他道具)

获得第一标签信息(判断目标道具和比对道具的位置关系)

构建一条训练数据。

另外，在信息编码模型的使用阶段，针对某一用户，还在不断采集该用户的道具调整记录，基于该道具调整记录继续训练信息编码模型，以使该信息编码模型能够学习该用户的道具收纳习惯；针对不同用户对道具进行个性化的整理，进而满足了不同玩家的个性化需求。

步骤S204，将训练样本中的每个道具输入至信息编码器中，输出每个道具的初始道具信息；

上述每个道具的初始道具信息可以表示为，在场景中道具相对于用户的编码，参见图5所示的一种信息编码器的训练方式的流程示意图，分别将道具、道具的类型、场景和用户画像，使用道具编码器、道具类型编码器、场景编码器和用户编码器进行编码；将编码后的道具编码、道a类型编码、场景编码和用户编码进行拼接，使用全连接网络进行处理，即可得到在场景中道具相对于用户的编码。其中，信息编码器中的道具编码器、道具类型编码器、场景编码器可以由Embedding网络实现，用户编码器可以由全连接网络实现；其中Embedding网络表示输入一个ID数据，输出对ID编码后的一个向量表示；Embedding网络需要经过训练才能得到有含义的向量。

以上述步骤中构成的18条训练样本为例，玩家X在场景A中使用了道具a；将“目标道具：a，比对道具：d，使用道具序列：d、e、f、g，标签：0”这条训练样本中的每个道具输入至信息编码器中，输出每个道具的初始道具信息为，在场景A中道具a相对于用户X的编码，该编码可以为数值、字母等数据。

步骤S206，将每个道具的初始道具信息输入至辅助训练模型中，以基于辅助训练模型对信息编码器进行训练，得到训练后的信息编码器。

上述辅助训练模型可以是一个或者多个，不同的辅助训练模型具有不同道具训练功能；可以将每个道具的初始道具信息输入至一个辅助训练模型中，利用辅助训练模型和信息编码器的输出结果，对信息编码器中的参数进行训练。比如，可以利用反向传播算法、前向传播算法等，训练信息编码器，以使训练后的信息编码器具有不同的信息编码方式。另外，对信息编码模型进行训练可以理解为对道具、道具类型、场景、用户对应的四种编码器以及第一全连接网络中的，这5个部分的参数进行训练。

该方式中，将用户每次移动道具的数据进行记录，根据记录的数据可以构建游戏中所有用户的道具的训练样本，其中，包括目标道具、比对道具、第一标签信息以及使用道具序列的信息；将每个道具的道具信息输入至信息编码模型以及辅助模型，基于辅助模型训练信息编码模型，以使训练完成的信息编码模型能够学习到最佳的编码方式；提高了背包中道具的排列顺序的灵活性，从而使得玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

本实施例还提供了另一种游戏道具的整理方法，该方法中描述将每个道具的初始道具信息输入至辅助训练模型中，以基于辅助训练模型对信息编码器进行训练，得到训练后的信息编码器的步骤具体实现方式。上述辅助训练模型包括第一辅助模型和第二辅助模型。

如图6所示，该方式包括如下步骤：

步骤S602，将每个道具的初始道具信息输入至第一辅助模型中，输出目标道具和比对道具的第二排序信息；基于第一标签信息和第二排序信息，对信息编码器和第一辅助模型进行训练，直至第一辅助模型收敛，得到信息编码器的中间训练结果；

上述第一辅助模型可以是各种网络模型，比如，CNN(Convolutional NeuralNetworks，卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)和DNN(DeepNeural Network，深度神经网络)等模型；该第一辅助模型通常是没有训练完成的模型；另外，由于在预测某一时刻道具的顺序时，利用了该时刻之后的使用道具的数据，该第一辅助模型也可以称为后验道具顺序模型；由此，上述输入至第一辅助模型的每个道具的初始道具信息中的第一标签信息为目标道具与比对道具的前后位置关系，可以用“0”和“1”表示。上述第二排序信息可以是目标道具排列在比对道具前面的概率，也可以是目标道具和比对道具的排列结果，例如，目标道具排列在比对道具前面，或者，比对道具排列在目标道具前面。

具体的，将该第一标签信息和第一辅助模型输出的第二排列信息进行比较，利用反向传播技术等对第一辅助模型和信息编码模型中可学习的参数进行训练，该可学习的参数包括：信息编码模型和第一辅助模型中的科学系参数，直到第一辅助模型收敛，使得第一辅助模型可以对背包中道具的先后关系进行排序；在第一辅助模型收敛后，可以得到信息编码器的中间训练结果，该中间训练结果可以理解为，在第一辅助模型训练的同时，信息编码模型可以从道具的先后顺序的数据中，学习到一种最佳的编码方式；通过这种编码方式，可以区分背包中不同位置的道具；即得到信息编码模型的中间训练结果。

另外，第一辅助模型收敛可以是第一辅助模型在训练前和训练后性能没有明显差别，即认为第一辅助模型已经收敛；还可以是将该第一辅助模型设置一个损失值，当对于每次输入的数据，输出的损失值为固定，或者十分接近某一固定值时，则认为模型已经收敛；还可以将损失值满足预设的损失阈值作为第一辅助模型的收敛的条件。

一种优选的实施方式，上述第一辅助模型包括：第一全连接网络、第二全连接网络、第一序列网络和第三全连接网络；针对上述将每个道具的初始道具信息输入至第一辅助模型中，输出目标道具和比对道具的第二排序信息的步骤，包括：

步骤B1，将目标道具的初始道具信息输入至第一全连接网络中，输出第一中间信息；将比对道具的初始道具信息输入至第二全连接网络中，输出第二中间信息；

参见图7所示的一种第一辅助模型的训练方法的流程示意图，其中，第一全连接网络、第二全连接网络、和信息编码模型中的编码器中的参数需要学习；图中的信息编码模型为正在训练的信息编码模型。实际实现时，可以将信息编码模型与第一辅助模型进行拼接，将输入数据中的所有道具四元组都用信息编码模型进行编码，然后将信息编码模型的输出结果，即初始道具信息作为第一辅助模型的输入，其中包括目标道具编码、比对道具编码、以及使用道具序列中每个使用道具的编码。具体地，将目标道具编码输入至第一全连接网络，经过各个参数的计算，输出第一中间结果信息，该第一中间结果信息包括目标道具的中间向量；将比对道具编码输入至第二全连接网络，经过各个参数的计算，输出第二中间结果信息，该第二中间结果信息包括比对道具的中间向量。

步骤B2，将使用道具序列的初始道具信息输入至第一序列网络中，输出第三中间信息；

上述第一序列网络的实现方法可以有很多种，比如，1D CNN(One-DimensionalConvolutional Neural Networks，一维卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)、和Transformer(谷歌的开源深度学习模型)等模型，其中Transformer主要应用于NLP(Natural Language Processing，自然语言处理)领域，擅长处理序列类型的数据；具体的，将使用道具序列中包括的使用道具编码输入至第一序列网络中，经过各个参数的计算，输出第三中间结果信息，该第三中间结果信息包括各个使用道具的中间向量。

步骤B3，将第一中间信息、第二中间信息和第三中间信息输入至第三全连接网络中，得到第一输出结果，基于第一输出结果确定目标道具和比对道具的第二排序信息；第二排序信息包括：目标道具排列在比对道具前面的概率。

具体的，可以将第一中间信息、第二中间信息和第三中间信息进行拼接，将拼接结果输入至第三全连接网络，经过第三全连接网络中各个参数的计算，得到第一输出结果，该第一输出结果包含目标道具排列在比对道具前面的概率信息，将该概率信息输入至Sigmoid网络，可以将概率信息映射到(0，1)的区间，代表满足目标条件的概率，即可以得到目标道具排列在比对道具前面的概率。

需要说明的是，通过对第一辅助模型进行训练，第一辅助模型可以对背包中道具的先后关系进行排序。但是第一辅助模型用到了未来的数据，该未来数据是指，对于每一次移动(交换)道具，都会产生一条训练样本，未来的数据就是移动(交换)时刻对应的使用道具序列，即这个时刻之后的用户的使用道具序列；因此线上服务的时候是无法获取到未来数据的，所以第一辅助模型是无法直接应用于线上服务的。

步骤S604，将训练样本中的每个道具输入至中间训练结果中，输出每个道具的中间道具信息；

上述中间训练结果为完成道具顺序训练后的信息编码模型，为了继续训练信息编码模型的编码方式，以使通过训练完成后的信息编码模型能够区分背包中不同位置和衡量道具的相邻关系，可以将训练样本中的每个道具输入至中间训练结果中，输出每个道具的中间道具信息，该中间道具信息包括目标道具编码、比对道具编码、使用道具序列编码。

步骤S606，将每个道具的中间道具信息输入至第二辅助模型中，输出指示目标道具与比对道具是否相邻的位置信息；基于第一标签信息和位置信息，对信息编码器和第二辅助模型进行训练，直至第二辅助模型收敛，得到训练后的信息编码器。

上述第二辅助模型可以是各种网络模型，比如，CNN(Convolutional NeuralNetworks，卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)和DNN(DeepNeural Network，深度神经网络)等模型；该第二辅助模型通常是没有训练完成的模型；另外，由于在预测某一时刻道具的顺序时，利用了该时刻之后的使用道具的数据，该第二辅助模型也可以称为后验道具相邻模型；由此，上述输入至第二辅助模型的每个道具的中间道具信息中的第一标签信息为目标道具与比对道具的相邻关系，可以用“2”和“3”表示。上是指示目标道具与比对道具是否相邻的位置信息，可以是目标道具与比对道具的相邻概率，也可以是目标道具与比对道的具体位置信息，比如目标道具与比对道具相邻，或者，目标道具与比对道具不相邻。

具体的，将该第一标签信息和第二辅助模型输出的位置信息进行比较，利用反向传播技术等对第二辅助模型和信息编码模型中可学习的参数进行训练，该可学习的参数包括：信息编码模型和第二辅助模型中的科学系参数，直到第二辅助模型收敛，使得第二辅助模型可以对背包中道具的相邻关系进行判断；在第二辅助模型收敛后，可以得到训练后的信息编码器，在第二辅助模型训练的同时，信息编码模型可以从道具的相邻关系的数据中，学习到一种最佳的编码方式；通过这种编码方式，可以衡量道具的相邻关系。编码越相似的道具，其相邻的可能性就越大，用户同时使用他们的可能性就越大。比如，对于用户A而言，在游戏场景B下，倾向于使用与用户A和场景B的编码近似的道具。

另外，第二辅助模型收敛可以是第二辅助模型在训练前和训练后性能没有明显差别，即认为第二辅助模型已经收敛；还可以是将该第二辅助模型设置一个损失值，当对于每次输入的数据，输出的损失值为固定，或者十分接近某一固定值时，则认为模型已经收敛；还可以将损失值满足预设的损失阈值作为第二辅助模型的收敛的条件。

需要说明的是，上述步骤S602和步骤S606在实际的执行过程中，不限定先后顺序，也可以先执行步骤S606中将每个道具的初始道具信息输入至第二辅助模型中的过程。

一种优选的实施方式，上述第二辅助模型包括：第四全连接网络、第五全连接网络、第二序列网络和第六全连接网络；针对上述将每个道具的中间道具信息输入至第二辅助模型中，输出目标道具与比对道具是否相邻的位置信息的步骤，包括：

步骤C1，将目标道具的中间道具信息输入至第四全连接网络中，输出第四中间信息；将比对道具的中间道具信息输入至第五全连接网络中，输出第五中间信息；

参见图8所示的一种第二辅助模型的训练方法的流程示意图，其中，第四全连接网络、第五全连接网络、和信息编码模型的中间训练结果的编码器中的参数需要学习。实际实现时，可以将中间训练结果与第二辅助模型进行拼接，将输入数据中的所有道具四元组都用已经完成道具顺序训练的信息编码模型，即中间训练结果进行编码，然后将中间训练结果的输出结果，即中间道具信息作为第二辅助模型的输入，其中包括目标道具编码、比对道具编码、以及使用道具序列中每个使用道具的编码。具体地，将目标道具编码输入至第四全连接网络，经过各个参数的计算，输出第四中间结果信息，该第四中间结果信息包括目标道具的中间向量；将比对道具编码输入至第五全连接网络，经过各个参数的计算，输出第五中间结果信息，该第五中间结果信息包括比对道具的中间向量。

步骤C2，将使用道具序列的中间道具信息输入至第二序列网络中，输出第六中间信息；

上述第二序列网络的实现方法可以有很多种，比如，1D CNN(One-DimensionalConvolutional Neural Networks，一维卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)、和Transformer(谷歌的开源深度学习模型)等模型，其中Transformer主要应用于NLP(Natural Language Processing，自然语言处理)领域，擅长处理序列类型的数据；具体的，将使用道具序列的中间道具信息包括的使用道具编码输入至第二序列网络中，经过各个参数的计算，输出第六中间结果信息，该第六中间结果信息包括各个使用道具的中间向量。

步骤C3，将第四中间信息、第五中间信息和第六中间信息输入至第六全连接网络中，得到第二输出结果，基于第二输出结果确定指示目标道具与比对道具是否相邻的位置信息；位置信息包括：目标道具与比对道具相邻的概率。

具体的，可以将第四中间信息、第五中间信息和第六中间信息进行拼接，将拼接结果输入至第六全连接网络，经过第六全连接网络中各个参数的计算，得到第二输出结果，该第二输出结果包含目标道具与比对道具相邻的概率信息，将该概率信息输入至Sigmoid网络，可以将概率信息映射到(0，1)的区间，代表满足目标条件的概率，即可以得到目标道具与比对道具相邻的概率。

需要说明的是，通过对第二辅助模型进行训练，第二辅助模型可以对背包中道具的相邻关系进行学习。但是第二辅助模型用到了未来的数据，该未来数据是指，对于每一次移动(交换)道具，都会产生一条训练样本，未来的数据就是移动(交换)时刻对应的使用道具序列，即这个时刻之后的用户的使用道具序列；因此线上服务的时候是无法获取到未来数据的，所以第二辅助模型是无法直接应用于线上服务的。

该方式中，通过训练样本对第一辅助模型和信息编码模型进行训练，得到信息编码模型的中间训练结果，然后将训练样本输入至中间训练结果，利用输出的中间道具信息对第二辅助模型和信息编码模型进行训练，其目的都是要使信息编码模型得到一种最佳的编码方式，其中，第一辅助模型能够使得信息编码模型区分道具的先后顺序；第二辅助模型能够使得信息编码模型具有衡量道具的相邻关系，将第一辅助模型和第二辅助模型都进行训练，使得信息编码模型能够同时具有以上两种功能；该方式不依赖游戏策划手动配置道具编码，而是通过机器学习模型自动学习道具的位置关系，减少了游戏策划的压力，同时避免了道具编码配置错误导致的不良后果；该方式中，信息编码模型的使用阶段，还可以针对用户不断的学习用户对于不同道具的收纳习惯，针对不同用户，对道具进行个性化的整理，满足了不同玩家的个性化需求。

本实施例还提供了另一种游戏道具的整理方法，该方法中描述将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息的步骤的具体实现方式，上述道具顺序模型包括第七全连接网络、第八全连接网络和第九全连接网络；具体包括如下步骤：

步骤D1，将所第一道具的道具信息输入至第七全连接网络，输出第七中间信息；将第二道具的道具信息输入至第八全连接网络，输出第八中间信息；

上述第七全连接网络、第八全连接网络和第九全连接网络中包括的参数为预先训练完成的网络；上述第一道具的道具信息包括在场景中第一道具相当对于用户的编码，将该编码输入至第七全连接网络，通过第七全连接网络中各个参数的计算，输出第七中间信息，该第七中间信息包括第一道具的中间向量；第二道具的道具信息包括在场景中第二道具相对于用户的编码，将该编码输入至第八全连接网络，通过第八全连接网络中各个参数的计算，输出第八中间信息，该第八中间信息包括第二道具的中间向量。

步骤D2，将第七中间信息和第八中间信息输入至第九全连接网络，得到第三输出结果；基于第三输出结果确定第一道具和第二道具的第一排序信息；其中，第一排序信息包括：第一道具排列在第二道具前面的概率，或者，第一道具和第二道具的排序结果。

具体的，将第七中间信息和第八中间信息进行拼接，输入至第九全连接网络，通过第九全连接网络中的各个参数计算，得到第三输出结果，该输出结果可以包括第一道具排列在第二道具前面的概率信息，将该概率信息输入至Sigmoid网络，可以将概率信息映射到(0，1)的区间，代表满足目标条件的概率，即可以得到第一道具排列在第二道具前面的概率；或者，通过输出结果还可以包括第一道具和第二道具的排序结果，可以直接根据排序结果，确定第一道具和第二道具的排列顺序。

参见图9所示的一种道具顺序模型的训练方法的流程示意图，上述道具顺序模型，通过如下步骤训练得到：

步骤E1，获取样本道具对和第二标签信息；样本道具对包括样本道具集合中的目标道具和比对道具；其中，目标道具为已经发生位置变化的道具；第二标签信息包括：目标道具与比对道具的前后位置关系；

上述第二标签信息可以利用数值进行表示，比如，目标道具在比对道具的前面位置，则用标签“1”表示；目标道具在比对道具的后面位置，则用标签“0”表示。实际实现时，通过已经训练完成的信息编码模型，将目标道具和比对道具进行编码，得到在场景中目标道具相对于用户的编码，以及在场景中比对道具相对于用户的编码。

步骤E2，将目标道具的道具信息输入至第七全连接网络中，输出第七中间信息；将比对道具的道具信息输入至第八全连接网络中，输出第八中间信息；

上述目标道具的道具信息即前述在场景中目标道具相对于用户的编码，将该目标道具的道具信息输入至第七全连接网络，经过各个参数的计算，输出第七中间结果信息，该第七中间结果信息包括目标道具的中间向量；将比对道具的道具信息输入至第八全连接网络，经过各个参数的计算，输出第八中间结果信息，该第八中间结果信息包括比对道具的中间向量。

步骤E3，将第七中间信息和第八中间信息输入至第九全连接网络中，得到第三输出结果，基于第三输出结果得到目标道具和比对道具前面的第三排序信息；

上述第三排序信息可以是目标道具排列在比对道具前面的概率信息，也可以是目标道具和比对道具的排序结果。具体的，将第七中间信息和第八中间信息进行拼接，将拼接结果输入至第九全连接网络，经过第九全连接网络中各个参数的计算，得到第三输出结果，该第三输出结果包含目标道具和比对道具前面的第三排序信息，即目标道具排列在比对道具前面的概率信息，或者，目标道具和比对道具的排序结果，将该概率信息输入至Sigmoid网络，可以将概率信息映射到(0，1)的区间，代表满足目标条件的概率，即可以得到目标道具排列在比对道具前面的概率。

步骤E4，基于第二标签信息和第三排序信息，对道具顺序模型进行训练，直至道具顺序模型收敛，得到训练后的道具训练模型。

将第二标签信息与第三排序信息进行比较，利用反向传播技术对道具顺序模型中可学习的参数进行训练，其中可学习的参数包括第七全连接网络、第八全连接网络和第九全连接网络中的所有参数；直至道具顺序模型收敛，得到训练后的道具训练模型。训练好的道具顺序模型可以在在线服务模块使用。

另外，道具顺序模型收敛可以是道具顺序模型在训练前和训练后性能没有明显差别，即认为道具顺序模型已经收敛；还可以是将该道具顺序模型设置一个损失值，当对于每次输入的数据，输出的损失值为固定，或者十分接近某一固定值时，则认为模型已经收敛；还可以将损失值满足预设的损失阈值作为道具顺序模型的收敛的条件。

该方式中，通过已经训练完成的信息编码模型，对道具顺序模型进行训练，以使道具顺序模型能够识别出道具的位置关系；能够不依赖游戏策划手动配置道具编码，而是通过机器学习模型自动学习道具的先后关系。减少了游戏策划的压力，同时避免了道具编码配置错误导致的不良后果；通过道具顺序模型可以学习道具之间的位置关系，根据用户对不同道具的收纳习惯，对用户的道具进行个性化整理，无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

本实施例还提供了另一种游戏道具的整理方法，该方法中描述从道具集合中获取至少一对道具对的步骤的具体实现方式，以及根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序的步骤的具体实现方式；

首先，描述从道具集合中获取至少一对道具对的步骤的具体实现方式，包括：对道具集合中的道具进行聚类处理，得到至少一个道具类簇；其中，每个道具类簇中包括道具集合中的至少一个道具；针对每个道具类簇，如果当前道具类簇中包括多个道具，基于多个道具，生成至少一对道具对；

上述聚类处理可以通过聚类模型，对道具集合中的道具进行聚类处理；其中，聚类模型可以是基于密度峰值的聚类算法(Clustering by fast search and find ofdensity peaks)，该种方法是一种成熟的聚类算法。因此聚类模型不需要进行参数训练，可以直接在在线服务模块中根据道具的编码进行分类。各个道具类簇中包括的道具可以是编码相似道具、不常用道具、功能类似或玩家经常同时使用的道具等。具体的，可以将道具集合中的道具经过信息编码器进行编码，然后通过聚类模型中密度峰值聚类算法进行聚类处理，编码相近的道具会被聚类为一个类簇；例如图10所示的一种聚类处理结果，道具会被分为4个类簇。每个类簇中包括的道具个数可以不同，其中道具a、道具f、道具h、道具i分别为每个类簇的中心。

其次，描述根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序的步骤，包括：根据当前道具类簇中每对道具对对应的第一排序信息，统计当前道具类簇中每个道具在各个道具对中排在前面的次数；基于每个道具在各个道具对中排在前面的次数，对当前道具类簇中的道具进行排序。

具体的，每个道具类簇内的所有道具两两配对，将道具信息输入道具顺序模型，可以得到每个道具类簇内任意两个道具的先后顺序关系。统计当前道具类簇中每个道具在其他道具前面的次数，按照次数的多少对当前道具类簇中各个道具进行排序，即可得到簇内每个道具在簇内的排名，排名第一的道具作为簇内代表。

另外，通过聚类处理的方式可以将相似或经常使用的道具放在一起。

该方式中，通过聚类处理的方式可以将将功能类似或玩家经常同时使用的道具放在一起；提升了玩家连续使用道具时的游戏体验；同时，可以自动识别不常使用的道具，将它们放在一起，置于背包靠后的位置，能够更加有效地利用有效的背包空间；无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

本实施还提供了基于每个道具在各个道具对中排在前面的次数，对当前道具类簇中的道具进行排序的步骤之后，上述方法还包括如下步骤：

步骤F1，将当前道具类簇中，每个道具的道具信息中的当前场景信息置为零，得到每个道具的临时道具信息；

在实际的游戏过程中，游戏在不同场景中，玩家对于道具整理有着不同的需求；比如在副本中打小怪的时候，玩家对基本药品有比较大的需求；在副本中打BOSS的时候，玩家对高级药品以及增益药品有较大的需求；而当玩家在锻造装备的时候，会对矿物、设计图纸等有较大的需求；因此，在进行一键整理道具的过程中能够根据当前场景特色高亮显示道具；以使玩家能够快速得到当前场景需要的道具。

实际实现时，为了得到与当前场景相关的道具，可以将当前道具类簇中，每个道具的道具信息中的当前场景信息置为零，得到每个道具的临时道具信息。

步骤F2，针对当前道具类簇中的每对道具对，将道具对中的第一道具的临时道具信息和第二道具的临时道具信息输入至道具顺序模型，输出第一道具和第二道具的临时排列信息；

步骤F3，根据每对道具对对应的临时排序信息，对道具集合中的道具进行排序，得到临时排序结果；

步骤F4，基于临时排序结果，确定当前道具类簇中与当前场景相关的道具。

具体的，该过程与在线整理道具的过程相似，再次不在赘述，当得到最后的临时排序结果后，可以将临时排序结果与原道具类簇的排序结果进行比较，簇内临时排序结果的排名位数与原道具类簇的排序结果的排名为数相差超过3的道具，即认为是与场景相关的道具。

该方式中，通过每个道具的道具信息中的当前场景信息置为零的方式，识别当前用户的游戏场景，利用在线服务模块确定出与当前场景相关的道具，并将其高亮显示，减少了用户寻找场景相关道具所需的时间，提升了用户的游戏体验。

进一步的，完成道具类簇内道具的排名后，上述方法还包括：

针对每个道具类簇，将当前道具类簇中、在各个道具对中排在前面的次数最多的道具，确定为当前道具类簇中的代表道具；基于每个道具类簇的代表道具，生成至少一对代表道具对；根据每对代表道具对对应的第一排序信息，统计每个代表道具在各个代表道具对中排在前面的次数；基于每个代表道具在各个代表道具对中排在前面的次数，对每个道具类簇进行排序。

举例说明，参见图10所示的聚类处理结果，前道具类簇中、在各个道具对中排在前面的次数最多的道具，即图中四个道具类簇中的代表道具分别为道具a、道具f、道具h、道具i；基于这四个代表道具，生成一对，或者多对代表道具对，可以是道具a和道具f、道具a和道具i、道具a和道具h、道具f和道具h等，将每个道具对的道具信息输入至道具顺序模型，根据输出的概率，确定道具a排在其他道具前面的次数、道具f排在其他道具前面的次数、道具h排在其他道具前面的次数、道具i排在其他道具前面的次数，按照次数的多少，有大到小的顺序将道具a所在的道具类簇、道具f所在的道具类簇、道具h所在的道具类簇、道具i所在的道具类簇进行排序。

进一步的，根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序的步骤之后，上述方法还包括：响应于道具调整指令，获取道具调整指令对应的待调整道具和目标位置；将道具集合中的待调整道具调整至目标位置。

上述待调整道具可以是背包中的任何一个道具；实际实现时，响应于道具整理指令，将整理后的道具进行展示，同时提供微调界面，该界面中包括待调整道具和目标位置，可以根据玩家自己的意愿，对道具集合中的待调整道具进行调整，以使待调整道具调整至目标位置。具体的交互过程包括，客户端接收服务器返回的道具序列，展示在游戏界面，并提供微调的界面，玩家可以在微调界面中对道具的摆放进行调整；客户端接收‘调整’的请求，客户端发送记录‘调整’的请求，服务器记录玩家调整记录，并返回响应；客户端接收服务器的响应，展示调整后的道具。

该方式中，首先通过道具顺序模型，利用道具类簇的代表道具进行道具类簇件的排序，能够根据用户的收纳习惯将背包中的道具进行排序，然后将排列好的道具进行显示，同时提供便于用户调整的游戏界面，让用户可以对一键整理的结果进行调整；无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

本实施例提供了一种具体的游戏道具的整理方法的时序图，参见图11所示，该道具整理方案主要由三个部分组成：数据模块、模型训练模块、在线服务模块。其中，M0模型对应前述信息编码模型；M1模型对应前述第一辅助模型；M2模型对应前述第二辅助模型；M3模型对应前述聚类模型；M4模型对应前述道具顺序模型。

数据模块，主要分为三个步骤，第一离线数据收集，从日志数据库中获取玩家使用道具序列、用户画像信息、玩家移动道具数据，包括被移动的道具、移动前的位置、移动后的位置、移动时的场景、玩家背包数据，包括背包中每个道具的位置。第二数据预处理，该过程对应前述道具信息生成方式，将数据处理成网络模型可以理解的数据；第三构建训练数据集对应前述训练样本，其中，M1、M2、M4模型的训练数据略有差别，体现在数据的标签不同。M1、M4模型使用的训练数据集为道具顺序数据集；M2模型使用的训练数据集为道具相邻数据集。

模型训练模块，主要分为网格步骤，第一步将M0：编码器模型和M1：后验道具顺序模型进行拼接，使用道具顺序数据集对两个模型进行训练；第二步，将M0：编码器模型和M2：后验道具相邻模型进行拼接，使用道具相邻数据集对两个模型进行训练；第三步，判断M1模型和M2模型是否已经收敛，如收敛进入下一步骤，反之返回第一步；第四步，将M1模型和M2模型中的M0模型取出，第五步，将M0：编码器模型和M4：道具顺序模型进行拼接，使用道具顺序数据集对M4模型进行训练，此时不对M0模型进行训练。

在线服务模块，1、玩家点击‘一键整理’按钮；2、客户端接收玩家点击‘一键整理’的请求；3、客户端向服务器发送‘一键整理’的请求，参数为背包道具序列，当前场景，用户画像；4、服务器获取参数，将背包道具序列中的所有道具处理成四元组，并使用M0模型进行编码，得到道具编码；5、调用M3模型，根据道具编码对背包中的道具进行聚类，得到k个类簇；6、调用M4模型，获取每个类簇内道具的排序，每个类簇之间的排序，以及高亮的道具；该高亮的道具标识与当前场景相关的道具。据此返回整理后的道具序列；7、客户端接收服务器返回的道具序列，展示在游戏界面，并提供微调的界面；8、玩家在微调界面中对道具的摆放进行调整；9、客户端接收‘调整’的请求；10、客户端发送记录‘调整’的请求；11、服务器记录玩家调整记录，并返回响应；12、客户端接收服务器的响应，展示调整后的道具。

本实施例提供的具体的游戏道具的整理方法，与上述实施例提供的游戏道具的整理方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

对应于上述方法实施例，参见图12所示的一种游戏道具的整理装置的结构示意图，该装置包括：

道具集合获取模块121，用于响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；

道具对获取模块122，用于从道具集合中获取至少一对道具对；

排序信息输出模型123，用于针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；其中，道具信息根据当前游戏场景和/或当前玩家确定；

道具排序模块124，用于根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。

本发明实施例提供了一种游戏道具的整理装置，响应于道具整理指令，获取道具整理指令对应的玩家的道具集合；然后从道具集合中获取至少一对道具对；针对每对道具对，将道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出第一道具和第二道具的第一排序信息；根据每对道具对对应的第一排序信息，对道具集合中的道具进行排序。该方式中，通过道具顺序模型，自动学习背包中各个道具的顺序关系，基于该顺序关系对玩家背包中的道具进行排序，无需根据道具的编号进行排序，提高了背包中道具的排列顺序的灵活性，同时使得道具的排列顺序与玩家的个人习惯和游戏场景的实际需求相匹配，提高了玩家的游戏体验度。

进一步的，上述装置还包括道具信息获得模块，用于获取待处理道具的原始信息；其中，原始信息包括待处理道具的道具标识、道具类型、当前游戏场景信息和当前玩家信息；将原始信息输入至预先训练完成的信息编码器中，得到待处理道具的道具信息。

进一步的，上述装置还包括信息编码器训练模块，用于获取包含有多个道具的训练样本；将训练样本中的每个道具输入至信息编码器中，输出每个道具的初始道具信息；将每个道具的初始道具信息输入至辅助训练模型中，以基于辅助训练模型对信息编码器进行训练，得到训练后的信息编码器。

进一步的，上述训练样本包括：样本道具集合中目标道具、比对道具、第一标签信息以及使用道具序列；其中，目标道具为已经发生位置变化的道具；第一标签信息包括：目标道具与比对道具的前后位置关系、以及目标道具与比对道具是否具有相邻关系；使用道具序列为：自从目标道具发生位置变化后，样本道具集合中被玩家使用的道具序列；使用道具序列中的道具按照被使用的时间顺序排列。

进一步的，上述辅助训练模型包括第一辅助模型和第二辅助模型；上述信息编码器训练模块还用于：将每个道具的初始道具信息输入至第一辅助模型中，输出目标道具和比对道具的第二排列信息；基于第一标签信息和第二排列信息，对信息编码器和第一辅助模型进行训练，直至第一辅助模型收敛，得到信息编码器的中间训练结果；将训练样本中的每个道具输入至中间训练结果中，输出每个道具的中间道具信息；将每个道具的中间道具信息输入至第二辅助模型中，输出指示目标道具与比对道具是否相邻的位置信息；基于第一标签信息和位置信息，对信息编码器和第二辅助模型进行训练，直至第二辅助模型收敛，得到训练后的信息编码器。

进一步的，第一辅助模型包括：第一全连接网络、第二全连接网络、第一序列网络和第三全连接网络；上述信息编码器训练模块还用于：将目标道具的初始道具信息输入至第一全连接网络中，输出第一中间信息；将比对道具的初始道具信息输入至第二全连接网络中，输出第二中间信息；将使用道具序列的初始道具信息输入至第一序列网络中，输出第三中间信息；将第一中间信息、第二中间信息和第三中间信息输入至第三全连接网络中，得到第一输出结果，基于第一输出结果确定目标道具和比对道具的第二排序信息；第二排序信息包括：目标道具排列在比对道具前面的概率。

进一步的，第二辅助模型包括：第四全连接网络、第五全连接网络、第二序列网络和第六全连接网络；上述信息编码器训练模块还用于：将目标道具的中间道具信息输入至第四全连接网络中，输出第四中间信息；将比对道具的中间道具信息输入至第五全连接网络中，输出第五中间信息；将使用道具序列的中间道具信息输入至第二序列网络中，输出第六中间信息；将第四中间信息、第五中间信息和第六中间信息输入至第六全连接网络中，得到第二输出结果，基于第二输出结果确定指示目标道具与比对道具是否相邻的位置信息；位置信息包括：目标道具与比对道具相邻的概率。

进一步的，道具顺序模型包括第七全连接网络、第八全连接网络和第九全连接网络；上述排序信息输出模型还用于：将第一道具的道具信息输入至第七全连接网络，输出第七中间信息；将第二道具的道具信息输入至第八全连接网络，输出第八中间信息；将第七中间信息和第八中间信息输入至第九全连接网络，得到第三输出结果；基于第三输出结果确定第一道具和第二道具的第一排序信息；其中，第一排序信息包括：第一道具排列在第二道具前面的概率，或者，第一道具和第二道具的排序结果。

进一步的，上述装置还包括道具顺序模型训练模块，用于获取样本道具对和第二标签信息；样本道具对包括样本道具集合中的目标道具和比对道具；其中，目标道具为已经发生位置变化的道具；第二标签信息包括：目标道具与比对道具的前后位置关系；将目标道具的道具信息输入至第七全连接网络中，输出第七中间信息；将比对道具的道具信息输入至第八全连接网络中，输出第八中间信息；将第七中间信息和第八中间信息输入至第九全连接网络中，得到第三输出结果，基于第三输出结果得到目标道具和比对道具相邻的第三排序信息；基于第二标签信息和第三排序信息，对道具顺序模型进行训练，直至道具顺序模型收敛，得到训练后的道具训练模型。

进一步的，上述道具对获取模块还用于：对道具集合中的道具进行聚类处理，得到至少一个道具类簇；其中，每个道具类簇中包括道具集合中的至少一个道具；针对每个道具类簇，如果当前道具类簇中包括多个道具，基于多个道具，生成至少一对道具对；上述道具排序模块还用于：根据当前道具类簇中每对道具对对应的第一排序信息，统计当前道具类簇中每个道具在各个道具对中排在前面的次数；基于每个道具在各个道具对中排在前面的次数，对当前道具类簇中的道具进行排序。

进一步的，上述装置还用于：将当前道具类簇中，每个道具的道具信息中的当前场景信息置为零，得到每个道具的临时道具信息；针对当前道具类簇中的每对道具对，将道具对中的第一道具的临时道具信息和第二道具的临时道具信息输入至道具顺序模型，输出第一道具和第二道具的临时排序信息；根据每对道具对对应的临时排序信息，对道具集合中的道具进行排序，得到临时排序结果；基于临时排序结果，确定当前道具类簇中与当前场景相关的道具。

进一步的，上述装置还用于：针对每个道具类簇，将当前道具类簇中、在各个道具对中排在前面的次数最多的道具，确定为当前道具类簇中的代表道具；基于每个道具类簇的代表道具，生成至少一对代表道具对；根据每对代表道具对对应的第一排序信息，统计每个代表道具在各个代表道具对中排在前面的次数；基于每个代表道具在各个代表道具对中排在前面的次数，对每个道具类簇进行排序。

进一步的，上述装置还用于：响应于道具调整指令，获取道具调整指令对应的待调整道具和目标位置；将道具集合中的待调整道具调整至目标位置。

本发明实施例提供的游戏道具的整理装置，与上述实施例提供的游戏道具的整理方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

本实施例还提供了一种电子设备，包括处理器和存储器，存储器存储有能够被处理器执行的机器可执行指令，处理器执行机器可执行指令以实现上述游戏道具的整理方法。

参见图13所示，该电子设备包括处理器100和存储器101，该存储器101存储有能够被处理器100执行的机器可执行指令，该处理器100执行机器可执行指令以实现上述游戏道具的整理方法。

进一步地，图13所示的电子设备还包括总线102和通信接口103，处理器100、通信接口103和存储器101通过总线102连接。

其中，存储器101可能包含高速随机存取存储器(RAM，Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口103(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线102可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图13中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器100可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器100中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器100可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DigitalSignal Processor，简称DSP)、专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器101，处理器100读取存储器101中的信息，结合其硬件完成前述实施例的方法的步骤。

本实施例还提供一种机器可读存储介质，机器可读存储介质存储有机器可执行指令，机器可执行指令在被处理器调用和执行时，机器可执行指令促使处理器实现上述游戏道具的整理方法。

本发明实施例所提供的游戏道具的整理方法、装置和电子设备的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种游戏道具的整理方法，其特征在于，所述方法包括：

响应于道具整理指令，获取所述道具整理指令对应的玩家的道具集合；

从所述道具集合中获取至少一对道具对；

针对每对所述道具对，将所述道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出所述第一道具和所述第二道具的第一排序信息；其中，所述道具信息根据当前游戏场景和/或当前玩家确定；

根据每对所述道具对对应的第一排序信息，对所述道具集合中的道具进行排序；

所述道具信息通过下述方式获得：

获取待处理道具的原始信息；其中，所述原始信息包括所述待处理道具的道具标识、道具类型、当前游戏场景信息和当前玩家信息；

将所述原始信息输入至预先训练完成的信息编码器中，得到所述待处理道具的道具信息；

所述信息编码器通过下述方式训练得到：

获取包含有多个道具的训练样本；

将所述训练样本中的每个道具输入至信息编码器中，输出每个道具的初始道具信息；

将所述每个道具的初始道具信息输入至辅助训练模型中，以基于所述辅助训练模型对所述信息编码器进行训练，得到训练后的信息编码器；

所述训练样本包括：样本道具集合中目标道具、比对道具、第一标签信息以及使用道具序列；

其中，目标道具为已经发生位置变化的道具；

所述第一标签信息包括：所述目标道具与所述比对道具的前后位置关系、以及所述目标道具与所述比对道具是否具有相邻关系；

所述使用道具序列为：自从所述目标道具发生位置变化后，所述样本道具集合中被玩家使用的道具序列；所述使用道具序列中的道具按照被使用的时间顺序排列。

2.根据权利要求1所述的方法，其特征在于，所述辅助训练模型包括第一辅助模型和第二辅助模型；

所述将所述每个道具的初始道具信息输入至辅助训练模型中，以基于所述辅助训练模型对所述信息编码器进行训练，得到训练后的信息编码器的步骤，包括：

将所述每个道具的初始道具信息输入至第一辅助模型中，输出所述目标道具和所述比对道具的第二排序信息；基于所述第一标签信息和所述第二排序信息，对所述信息编码器和所述第一辅助模型进行训练，直至所述第一辅助模型收敛，得到所述信息编码器的中间训练结果；

将所述训练样本中的每个道具输入至所述中间训练结果中，输出所述每个道具的中间道具信息；

将所述每个道具的中间道具信息输入至第二辅助模型中，输出指示所述目标道具与所述比对道具是否相邻的位置信息；基于所述第一标签信息和所述位置信息，对所述信息编码器和第二辅助模型进行训练，直至所述第二辅助模型收敛，得到训练后的所述信息编码器。

3.根据权利要求2所述的方法，其特征在于，所述第一辅助模型包括：第一全连接网络、第二全连接网络、第一序列网络和第三全连接网络；

所述将所述每个道具的初始道具信息输入至第一辅助模型中，输出所述目标道具和所述比对道具的第二排序信息的步骤，包括：

将所述目标道具的初始道具信息输入至所述第一全连接网络中，输出第一中间信息；将所述比对道具的初始道具信息输入至所述第二全连接网络中，输出第二中间信息；

将所述使用道具序列的初始道具信息输入至所述第一序列网络中，输出第三中间信息；

将所述第一中间信息、所述第二中间信息和所述第三中间信息输入至所述第三全连接网络中，得到第一输出结果，基于所述第一输出结果确定所述目标道具和所述比对道具的第二排序信息；所述第二排序信息包括：所述目标道具排列在所述比对道具前面的概率。

4.根据权利要求2所述的方法，其特征在于，所述第二辅助模型包括：第四全连接网络、第五全连接网络、第二序列网络和第六全连接网络；

所述将所述每个道具的中间道具信息输入至第二辅助模型中，输出指示所述目标道具与所述比对道具是否相邻的位置信息的步骤，包括：

将所述目标道具的中间道具信息输入至所述第四全连接网络中，输出第四中间信息；将所述比对道具的中间道具信息输入至所述第五全连接网络中，输出第五中间信息；

将所述使用道具序列的中间道具信息输入至所述第二序列网络中，输出第六中间信息；

将所述第四中间信息、所述第五中间信息和所述第六中间信息输入至所述第六全连接网络中，得到第二输出结果，基于所述第二输出结果确定指示所述目标道具与所述比对道具是否相邻的位置信息；所述位置信息包括：所述目标道具与所述比对道具相邻的概率。

5.根据权利要求1所述的方法，其特征在于，所述道具顺序模型包括第七全连接网络、第八全连接网络和第九全连接网络；

所述将所述道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出所述第一道具和所述第二道具的第一排序信息的步骤，包括：

将所述第一道具的道具信息输入至所述第七全连接网络，输出第七中间信息；将所述第二道具的道具信息输入至所述第八全连接网络，输出第八中间信息；

将所述第七中间信息和所述第八中间信息输入至所述第九全连接网络，得到第三输出结果；基于所述第三输出结果确定所述第一道具和所述第二道具的第一排序信息；其中，所述第一排序信息包括：所述第一道具排列在所述第二道具前面的概率，或者，所述第一道具和所述第二道具的排序结果。

6.根据权利要求5所述的方法，其特征在于，所述道具顺序模型，通过下述方式训练得到：

获取样本道具对和第二标签信息；所述样本道具对包括样本道具集合中的目标道具和比对道具；其中，目标道具为已经发生位置变化的道具；所述第二标签信息包括：所述目标道具与所述比对道具的前后位置关系；

将所述目标道具的道具信息输入至所述第七全连接网络中，输出第七中间信息；将所述比对道具的道具信息输入至所述第八全连接网络中，输出第八中间信息；

将所述第七中间信息和所述第八中间信息输入至所述第九全连接网络中，得到第三输出结果，基于所述第三输出结果得到所述目标道具和所述比对道具的第三排序信息；

基于所述第二标签信息和所述第三排序信息，对所述道具顺序模型进行训练，直至所述道具顺序模型收敛，得到训练后的所述道具顺序模型。

7.根据权利要求1所述的方法，其特征在于，所述从所述道具集合中获取至少一对道具对的步骤，包括：

对所述道具集合中的道具进行聚类处理，得到至少一个道具类簇；其中，每个所述道具类簇中包括所述道具集合中的至少一个道具；针对每个所述道具类簇，如果当前道具类簇中包括多个道具，基于所述多个道具，生成至少一对道具对；

所述根据每对所述道具对对应的第一排序信息，对所述道具集合中的道具进行排序的步骤，包括：

根据所述当前道具类簇中每对所述道具对对应的第一排序信息，统计所述当前道具类簇中每个道具在各个道具对中排在前面的次数；基于每个道具在各个道具对中排在前面的次数，对所述当前道具类簇中的道具进行排序。

8.根据权利要求7所述的方法，其特征在于，基于每个道具在各个道具对中排在前面的次数，对所述当前道具类簇中的道具进行排序的步骤之后，所述方法还包括：

将所述当前道具类簇中，每个道具的道具信息中的当前场景信息置为零，得到每个道具的临时道具信息；

针对所述当前道具类簇中的每对所述道具对，将所述道具对中的第一道具的临时道具信息和第二道具的临时道具信息输入至所述道具顺序模型，输出所述第一道具和所述第二道具的临时排序信息；

根据每对所述道具对对应的临时排序信息，对所述道具集合中的道具进行排序，得到临时排序结果；

基于所述临时排序结果，确定所述当前道具类簇中与当前场景相关的道具。

9.根据权利要求8所述的方法，其特征在于，基于每个道具在各个道具对中排在前面的次数，对所述当前道具类簇中的道具进行排序的步骤之后，所述方法还包括：

针对每个道具类簇，将当前道具类簇中、在各个道具对中排在前面的次数最多的道具，确定为所述当前道具类簇中的代表道具；

基于每个所述道具类簇的代表道具，生成至少一对代表道具对；

根据每对所述代表道具对对应的第一排序信息，统计每个代表道具在各个代表道具对中排在前面的次数；

基于每个代表道具在各个代表道具对中排在前面的次数，对每个所述道具类簇进行排序。

10.根据权利要求1所述的方法，其特征在于，根据每对所述道具对对应的第一排序信息，对所述道具集合中的道具进行排序的步骤之后，所述方法还包括：

响应于道具调整指令，获取所述道具调整指令对应的待调整道具和目标位置；将所述道具集合中的所述待调整道具调整至所述目标位置。

11.一种游戏道具的整理装置，其特征在于，所述装置包括：

道具集合获取模块，用于响应于道具整理指令，获取所述道具整理指令对应的玩家的道具集合；

道具对获取模块，用于从所述道具集合中获取至少一对道具对；

排序信息输出模型，用于针对每对所述道具对，将所述道具对中的第一道具的道具信息和第二道具的道具信息输入至预先训练完成的道具顺序模型，输出所述第一道具和所述第二道具的第一排序信息；其中，所述道具信息根据当前游戏场景和/或当前玩家确定；

道具排序模块，用于根据每对所述道具对对应的第一排序信息，对所述道具集合中的道具进行排序；

所述装置还包括道具信息获得模块，用于获取待处理道具的原始信息；其中，原始信息包括待处理道具的道具标识、道具类型、当前游戏场景信息和当前玩家信息；将原始信息输入至预先训练完成的信息编码器中，得到待处理道具的道具信息；

所述装置还包括信息编码器训练模块，用于获取包含有多个道具的训练样本；将训练样本中的每个道具输入至信息编码器中，输出每个道具的初始道具信息；将每个道具的初始道具信息输入至辅助训练模型中，以基于辅助训练模型对信息编码器进行训练，得到训练后的信息编码器；

所述训练样本包括：样本道具集合中目标道具、比对道具、第一标签信息以及使用道具序列；其中，目标道具为已经发生位置变化的道具；第一标签信息包括：目标道具与比对道具的前后位置关系、以及目标道具与比对道具是否具有相邻关系；使用道具序列为：自从目标道具发生位置变化后，样本道具集合中被玩家使用的道具序列；使用道具序列中的道具按照被使用的时间顺序排列。

12.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器执行所述机器可执行指令以实现权利要求1-10任一项所述的游戏道具的整理方法。

13.一种机器可读存储介质，其特征在于，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被处理器调用和执行时，所述机器可执行指令促使所述处理器实现权利要求1-10任一项所述的游戏道具的整理方法。