CN116077942B

CN116077942B - 一种交互式内容推荐的实现方法

Info

Publication number: CN116077942B
Application number: CN202310360374.3A
Authority: CN
Inventors: 黄新通
Original assignee: Shenzhen Shang Mi Network Technology Co ltd
Current assignee: Shenzhen Shang Mi Network Technology Co ltd
Priority date: 2023-04-06
Filing date: 2023-04-06
Publication date: 2023-06-27
Anticipated expiration: 2043-04-06
Also published as: CN116077942A

Abstract

本发明提出了一种交互式内容推荐的实现方法，所述方法包括：收集游戏数据及用户行为数据；基于所述游戏数据及所述用户行为数据，借助GPT模型及分类模型训练语言模型及游戏分类模型，得到游戏内容推荐模型；获取用户输入文本；将所述用户输入文本输入所述游戏内容推荐模型，得到游戏特征结果；根据所述游戏特征结果，从游戏数据库中检索出符合所述游戏特征结果的游戏数据，生成游戏推荐列表；对所述生成游戏推荐列表中的游戏数据按照用户偏好进行排序，得到游戏推荐结果；将所述游戏推荐结果推送至用户端进行展示；借由上述方法可实现以对话交互的方式实现游戏内容推荐，能够精准分析步骤用户需求，满足用户的新兴趣点。

Description

一种交互式内容推荐的实现方法

技术领域

本发明涉及计算机技术领域，具体涉及一种交互式内容推荐的实现方法。

背景技术

传统的游戏内容推荐通常依靠用户自行选定的偏好标签进行推荐，或者根据用户历史行为分析得出的用户画像进行推荐，二者均存在一定的局限性。用户偏好标签往往在用户初次使用时由用户自行设定，后期变更时也需要用户手动修改，操作便利性欠佳且内容推荐的实时性差；而根据用户历史行为分析进行内容推荐尽管能够做到较好的实时性，但由于基于历史数据的分析，缺乏对用户新兴趣点的捕捉，面对用户新的兴趣点无法得到符合用户期待的结果。

上述局限性导致了游戏内容推荐结果的用户满意度低，推荐效果较差，进一步可能带来用户流失、口碑下降等不利影响，故需要一种提升内容推荐用户满意度的游戏内容推荐方法，提升游戏内容的推荐效果。

发明内容

针对上述存在的拘束局限性，本发明提出了一种交互式内容推荐的实现方法，利用GPT模型及分类模型，生成游戏内容推荐模型，结合自然语言处理方法对用户输入的自然语言文本进行分析处理，以对话交互的方式实现游戏内容推荐。

为实现上述目的，本发明采用了以下技术方案：

一种交互式内容推荐的实现方法，所述方法包括以下步骤：

步骤1、收集游戏数据及用户行为数据；

步骤2、基于所述游戏数据及所述用户行为数据，借助GPT模型及分类模型训练语言模型及游戏分类模型，得到游戏内容推荐模型；

所述游戏内容推荐模型为语言模型与游戏分类模型的组合模型；

步骤3、当用户在对话界面输入对话文本时，获取用户输入文本；

步骤4、将所述用户输入文本输入所述游戏内容推荐模型，得到游戏特征结果；根据所述游戏特征结果，从游戏数据库中检索出符合所述游戏特征结果的游戏数据，生成游戏推荐列表；

步骤5、对所述生成游戏推荐列表中的游戏数据按照用户偏好进行排序，得到游戏推荐结果；

步骤6、将所述游戏推荐结果推送至用户端进行展示。

本发明与现有技术相对比，本发明具有以下优点：

（1）基于交互方式进行内容推荐，操作便利，推荐的实时性强；

（2）能够根据用户需求描述，精准分析步骤用户需求，给出满意度高的推荐结果；且能够满足用户的新兴趣点；

（3）以自然语言交互方式进行内容推荐，能够满足用户的个性化需求。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图，详细说明如下。

附图说明

图1为本发明实施例提供的一种交互式游戏内容推荐实现方法的步骤图。

图2为本发明实施例提供的一种游戏内容推荐模型训练方法的步骤图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。为了进一步了解本发明，下面结合最佳实施例对本发明作进一步的详细说明。

如下为本发明实施例中涉及名词术语的解释：

GPT：GPT（Generative Pre-trainedTransformer）即生成型预训练变换模型，由OpenAI提出，是一种基于Transformer架构的预训练语言模型。GPT可以在大规模语料库上进行无监督学习，从而提取文本中的语义信息和上下文信息，实现文本的生成和理解。

在GPT模型中，主要包括了两个组件：Transformer编码器和解码器。其中编码器负责对输入文本进行编码，解码器则负责生成连续的文本。具体地，编码器主要由多层自注意力机制和前馈神经网络组成，它们可以学习到输入文本中的词语之间的语义关系。解码器则由多层自注意力机制和前馈神经网络组成，它们可以生成下一个词语，并将其添加到当前生成的文本中，从而生成连续的文本。

下面结合前述名词术语具体介绍本发明的实现方式：

本发明的发明点是提供一种交互式内容推荐的实现方法，所述方法利用基于自注意力机制的深度神经网络模型GPT，生成游戏内容推荐模型，结合自然语言处理方法对用户输入的自然语言文本进行分析处理，以对话交互的方式实现游戏内容推荐。

参考图1，所述方法包括以下步骤：

步骤1、游戏数据及用户行为数据收集；

所述游戏数据包括游戏名称、类型、语言、运行环境、游戏配置、描述、评分数据；

所述用户行为数据包括用户基本信息、历史游戏名称、历史游戏评分、游戏评论；

所述游戏推荐列表由游戏名称、游戏特征数据组成；

步骤6、将所述游戏推荐结果推送至用户端进行展示。

参考图2，步骤2中，游戏内容推荐模型的训练方法具体包括以下步骤：

步骤21、收集大规模文本数据并进行自然语言处理，得到大规模文本数据集；以所述大规模文本数据集作为输入，按照GPT模型训练方法进行语言模型训练并对模型进行微调，得到语言模型；

步骤22、根据所述游戏数据与用户行为数据训练游戏分类模型，所述游戏分类模型用于将用户语言特征映射到游戏类别特征；

步骤23、利用损失函数计算误差，并通过反向传播算法更新所述语言模型及所述游戏分类模型的参数；

步骤24、利用所述游戏分类模型的输出结果作为标签对所述语言模型进行微调，微调达到预设效果后得到游戏内容推荐模型；所述游戏内容推荐模型为语言模型与游戏分类模型的组合模型。

步骤21中，进行语言模型训练的具体方法包括：

步骤211、从互联网上收集大规模文本数据；并对所收集的大规模文本数据进行自然语言处理，得到大规模文本数据集；并将所述大规模文本数据集拆分为文本数据训练集及文本训练测试集；

步骤212、构建GPT模型，具体包括：定义GPT模型结构、配置模型参数、定义损失函数、定义优化器；

步骤213、在所述文本数据训练集上按照所构建的GPT模型进行训练，并计算损失函数，优化模型准确率；

步骤214、使用所述文本训练测试集进行模型评估，计算损失函数和准确率，并进行模型优化；

步骤215、保存模型参数，得到语言模型。

步骤22中，进行游戏分类模型训练的具体方法包括：

步骤221、对所述用户行为数据进行文本加工，并结合所述游戏数据，得到用户自然语言与对应的游戏特征数据；

步骤222、将所述用户自然语言输入所述语言模型中，得到预测文本向量；

步骤223、将预测文本向量与其对应输入数据相应的游戏内容数据组合形成分类模型训练数据，并拆分成分类模型训练集与分类模型测试集；

步骤223、在所述分类模型训练集上通过分类模型算法进行训练，并依靠所述分类模型测试集进行测试评估、模型优化，得到游戏分类模型。

除步骤1-6外，所述方法还包括：

步骤7、收集用户反馈数据；当用户反馈数据量达到预设值时，对用户反馈数据进行集中分析，并根据分析结果进行游戏内容推荐模型优化。

作为一种实施例，所述游戏数据通过游戏官方网站、游戏运营平台、游戏评分网站、游戏社区论坛渠道获得；所述用户行为数据通过游戏在游戏平台的数据记录获得。

作为一种实施例，步骤211中对所收集的大规模文本数据进行自然语言处理方法包括以下方式：

（1）文本清洗：去除文本中的噪声和冗余信息，如HTML标签、非文本字符、停用词等。

（2）分词：将长的文本句子切割成较短的词语，以方便后续处理和分析。在中文文本中，通常需要使用中文分词算法，如jieba分词、HanLP等。在英文文本中，可以使用空格或标点符号作为分隔符来进行分词。

（3）词性标注：给分词后的每个词语打上相应的词性标签，以便后续进行语义分析和处理。词性标注通常采用基于规则、统计的方法。

（4）命名实体识别：在文本中识别出人名、地名、组织机构等实体信息，以提供更加精细的语义分析和推理支持。

（5）词向量表示：将文本中的每个词语转换成向量形式，以便进行计算和比较。常见的词向量表示方法包括Word2Vec、GloVe、FastText等。

（6）文本转换：将文本转换成统一的格式，如将文本转换成小写形式、转换成拼音形式、转换成数字等。

所述自然语言处理可以使用自然语言处理工具库，如NLTK、spaCy等实现，均为已公开的成熟技术，在此不再赘述。

作为一种实施例，步骤212中，构建GPT模型可借助深度学习框架PyTorch完成，具体构建方式包括：

（1）定义GPT模型结构：继承PyTorch提供的nn.Module基类并重写forward方法；所述模型结构包括embedding层、多个Transformer编码器、线性输出层等。

（2）配置模型参数：

所述模型参数包括模型层数、隐藏向量维度、学习率、batch_size、epoch；

一般地，模型层数选择12层或24层，隐藏向量维度选择768或1024，学习率选择为0.0001或0.00001，batch_size为16，epoch数量为5。

（3）定义损失函数：所述损失函数用于评估模型预测结果和实际标签之间的差异，本方案中采用交叉熵损失函数，具体调用CrossEntropyLoss方法即可。

（4）定义优化器：采用Adam方法，具体调用torch.optim.Adam方法，传模型参数即可。

作为一种实施例，步骤213中，可采用dropout或梯度裁剪方法优化准确率。

作为一种实施例，步骤221中，进行文本加工是指将用户行为数据中的游戏评论均改写为“问题-答案”形式。

例如：用户的游戏评论“A游戏画面精致、运行流畅，是M类游戏类型中不可多得的佳作”，改写成“问题-答案”形式后，可以得到如下形式的若干文本数据：

a、“Q：请推荐一款画面精致的M类游戏；A：A游戏画面精致，值得推荐”；

b、“Q：能够流畅运行的M类游戏有哪些；A：A游戏运行起来非常流畅，且画面精美”。

当得到“问题-答案”形式的若干数据后，再按照游戏名称或游戏类型，将该“问题-答案”数据与所述游戏数据进行关联，并拆分成用户自然语言及对应的游戏特征数据；

即，“问题-答案”数据中的“问题”部分作为当前数据对中的用户自然语言；对应的游戏数据作为游戏特征数据。

作为一种实施例，步骤223中，所述分类模型可选择朴素贝叶斯、逻辑回归、支持向量机、决策树、随机森林，KNN算法中的一种或多种算法的组合实现。上述分类模型的训练方法均为成熟的技术，本领域技术人员根据实施例描述完全可以顺利实现，故在此不再赘述。

作为一种实施例，步骤5中，按照用户偏好进行排序通过以下方式实现：

对步骤4得到的游戏推荐列表中的每一游戏借助评分函数计算推荐评分，并按照推荐评分结果由高到低进行排序，并筛选出评分高于预设评分阈值的游戏名称及对应游戏特征数据，得到游戏推荐结果。

所述评分函数以游戏特征数据为输入，计算当前用户对相应游戏的评分预测值并输出。

作为一种实施例，所述评分函数的构建方式如下：

（1）对用户行为数据进行预处理和特征提取，得到用户特征数据集。

（2）根据用户的历史游戏评分及游戏特征数据，得到评分数据集和游戏特征数据集。

（3）构建机器学习模型，依靠所述用户特征数据集、所述评分数据集、所述游戏特征数据集进行评分模型训练。

（4）将所述评分模型打包形成评分函数。

作为一种实施例，所述机器学习模型采用矩阵分解模型实现；评分模型训练具体包括以下内容：

（3-1）根据评分数据集构建评分矩阵，评分矩阵为m*n型矩阵，其形式为：

其中，评分矩阵中第（i，j）个元素s _ij代表编号为i的用户对编号为j的游戏的评分。

需要说明的是，若m不等于n，即评分矩阵不为方型矩阵，则需要对评分矩阵进行补全（即采用扩展矩阵分解进行矩阵扩展），得到一个方型矩阵；最终得到的评分矩阵为：

（3-2）采用奇异值分解（SVD）方法进行矩阵分解，即将评分矩阵近似拆分成用户因素矩阵、奇异值矩阵和游戏因素矩阵的乘积，即：

其中U为用户因素矩阵，R为奇异值矩阵，G为游戏因素矩阵。

用户因素矩阵为w*p形矩阵，其具体形式为：

用户因素矩阵中第（i，j）个元素u _ij代表编号为i的用户的第j个特征值。

游戏因素矩阵为w*q形矩阵，其具体形式为：

游戏因素矩阵中第（i，j）个元素g _ij代表编号为i的游戏的第j个特征值；

所述奇异值矩阵为w*w形矩阵。

（3-3）采用用户特征数据集、游戏特征数据集进行模型训练，评估模型性能并优化模型，最终得到评分模型。

所述用户特征数据集用于构建所述用户因素矩阵，所述游戏特征数据集用于构建所述游戏因素矩阵。

上述采用矩阵分解模型进行模型训练的方法为成熟的技术，本领域技术人员根据实施例描述完全可以顺利实现，故在此不再赘述。

作为一种实施例，步骤7中，收集用户反馈数据可通过以下方式实现：

a、在游戏推荐结果的展示行下方设置反馈按钮，用户按下反馈按钮时，收集对应的反馈结果；

所述反馈按钮由支持按钮和不支持按钮组成，分别代表用户认同或不认同游戏推荐结果。

b、根据用户在获得推荐后预设评价时间段内的行为数据并进行行为分析；具体而言，若出现对推荐游戏的下载、好评行为，则认为用户认同游戏推荐结果，反之则认为用户不认同。

作为一种实施例，步骤7中，对用户反馈数据进行集中分析是指分析平均用户满意度及用户满意度标准差。

用户满意度标准差小于预设标准差阈值，且平均用户满意度小于预设满意度阈值时，需要进行游戏内容推荐模型优化。

作为一种实施例，本发明所述方法可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用计算机或任何其他类似硬件设备来实现。

本发明所述的方法可以软件程序的形式实施，所述软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，所述软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。

另外，本发明所述方法的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本发明所述的方法的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。而调用本发明所述方法的程序指令，可被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。

作为一种实施例，本发明还提供一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述的多个实施例的方法和/或技术方案。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

最后，需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明,任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种交互式内容推荐的实现方法，其特征在于，所述方法包括以下步骤：

步骤1、收集游戏数据及用户行为数据；

步骤6、将所述游戏推荐结果推送至用户端进行展示；

在所述步骤2中，游戏内容推荐模型的训练方法具体包括以下步骤：

步骤21、以大规模文本数据集作为输入，按照GPT模型训练方法进行语言模型训练并对模型进行微调，得到语言模型；

步骤22、根据游戏数据与用户行为数据训练游戏分类模型，所述游戏分类模型用于将用户语言特征映射到游戏类别特征；

步骤23、更新所述语言模型及所述游戏分类模型的参数；

步骤24、利用所述游戏分类模型的输出结果作为标签对所述语言模型进行微调，微调达到预设效果后得到游戏内容推荐模型。

2.根据权利要求1所述的方法，其特征在于，

所述用户行为数据包括历史游戏名称、历史游戏评分、游戏评论。

3.根据权利要求1所述的方法，其特征在于，

步骤21中，进行语言模型训练的具体方法包括：

步骤211、收集大规模文本数据并进行自然语言处理，得到大规模文本数据集；并将所述大规模文本数据集拆分为文本数据训练集及文本训练测试集；

步骤215、保存模型参数，得到语言模型。

4.根据权利要求1所述的方法，其特征在于，

步骤22中，进行游戏分类模型训练的具体方法包括：

步骤221、对用户行为数据进行文本加工，并结合所述游戏数据，得到用户自然语言与对应的游戏特征数据；

5.根据权利要求3所述的方法，其特征在于，

步骤211中对所收集的大规模文本数据进行自然语言处理方法包括以下方式中的一种或多种方式：文本清洗、分词、词性标注、命名实体识别、词向量表示、文本转换。

6.根据权利要求3所述的方法，其特征在于，

构建GPT模型借助深度学习框架PyTorch完成，具体构建方式包括：

（1）定义GPT模型结构：

继承PyTorch提供的nn.Module基类并重写forward方法；

（2）配置模型参数：

模型层数选择12层或24层，隐藏向量维度选择768或1024，学习率选择为0.0001或0.00001，batch_size为16，epoch数量为5；

（3）定义损失函数：采用交叉熵损失函数；

（4）定义优化器：采用Adam方法。

7.根据权利要求4所述的方法，其特征在于，

步骤221中，进行文本加工是指将用户行为数据中的游戏评论均改写为“问题-答案”形式。

8.根据权利要求4所述的方法，其特征在于，

步骤223中，所述分类模型可选择朴素贝叶斯、逻辑回归、支持向量机、决策树、随机森林，KNN算法中的一种或多种算法的组合实现。

9.根据权利要求1所述的方法，其特征在于,

步骤5中，按照用户偏好进行排序通过以下方式实现：