CN117122927A

CN117122927A - Npc交互方法、装置及存储介质

Info

Publication number: CN117122927A
Application number: CN202311077534.XA
Authority: CN
Inventors: 谢振新; 李梦婷; 何凯雯; 胡启明
Original assignee: Yidianlingxi Information Technology Guangzhou Co ltd
Current assignee: Yidianlingxi Information Technology Guangzhou Co ltd
Priority date: 2023-08-24
Filing date: 2023-08-24
Publication date: 2023-11-28

Abstract

本申请提供了一种NPC交互方法、装置及存储介质，涉及游戏技术领域。所述方法包括：接收客户端针对NPC的输入信息，在游戏文本库中查找得到与输入信息匹配的知识点，根据NPC的属性信息生成人设提示词，对输入信息、知识点和人设提示词进行融合得到指令，将指令输入游戏模型，游戏模型进行含义理解后按照人设提示词对应的人设生成针对输入信息的回复信息，将回复信息发送给客户端，所述游戏模型为使用包括人设信息的语料训练后的游戏模型。依据本申请实施例，实现了NPC的智能交互，降低了NPC开发成本，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。

Description

NPC交互方法、装置及存储介质

技术领域

本申请涉及游戏技术领域，尤其涉及一种NPC交互方法、装置及存储介质。

背景技术

NPC(Non-Player Character，非角色玩家)是游戏中的一种角色类型，是指不受真人玩家操纵的游戏角色。NPC可以为玩家提供一些游戏信息或触发剧情，也可以具有对话的功能，在游戏中具有关键作用。目前，NPC需要游戏设计者根据游戏世界观、角色、对话或剧情等多种因素来设计开发，需要游戏设计者熟悉游戏世界观、剧情以及角色定位等相关知识，人工成本较高。另外，NPC交互功能基于固定模版实现，如只能实现对话模版内的问答，交互单一，缺乏个性化特点，造成游戏玩家体验欠佳。

发明内容

本申请实施例提供一种NPC交互方法、装置、电子设备及存储介质，以降低NPC开发成本，提升交互丰富性及用户体验。

在第一方面，本申请实施例提供了一种NPC交互方法，包括：

接收客户端针对非角色玩家NPC的输入信息；

在游戏文本库中查找得到与所述输入信息匹配的知识点；

根据所述NPC的属性信息生成人设提示词；

对所述输入信息、知识点和人设提示词进行融合得到指令；

将所述指令输入游戏模型，所述游戏模型进行含义理解后按照所述人设提示词对应的人设生成针对所述输入信息的回复信息；

将所述回复信息发送给所述客户端；

其中，所述游戏模型为使用包括人设信息的语料训练后的游戏模型。

在第二方面，本申请实施例提供了一种NPC交互方法，所述方法包括：

接收来自用户的针对非角色玩家NPC的输入信息；

将所述输入信息发送给服务器；

接收所述服务器返回的针对所述输入信息的回复信息；

呈现所述回复信息给所述用户；

其中，所述回复信息是所述服务器基于所述输入信息、与所述输入信息匹配的知识点和人设提示词融合得到的指令且使用游戏模型生成的，所述游戏模型为使用包括人设信息的语料训练后的游戏模型。

在第三方面，本申请实施例提供了一种NPC交互装置，包括：

接收模块，用于接收客户端针对非角色玩家NPC的输入信息；

匹配模块，用于在游戏文本库中查找得到与所述输入信息匹配的知识点；

提示模块，用于根据所述NPC的属性信息生成人设提示词；

融合模块，用于对所述输入信息、知识点和人设提示词进行融合得到指令；

处理模块，用于将所述指令输入游戏模型，所述游戏模型进行含义理解后按照所述人设提示词对应的人设生成针对所述输入信息的回复信息；

发送模块，用于将所述回复信息发送给所述客户端；

在第四方面，本申请实施例提供了一种NPC交互装置，所述装置包括：

第一接收模块，用于接收来自用户的针对非角色玩家NPC的输入信息；

发送模块，用于将所述输入信息发送给服务器；

第二接收模块，用于接收所述服务器返回的针对所述输入信息的回复信息；

呈现模块，用于呈现所述回复信息给所述用户；

在第五方面，本申请实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器在执行所述计算机程序时实现上述任一项所述的方法。

在第六方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法。

与现有技术相比，本申请具有如下优点：

通过接收客户端针对NPC的输入信息，在游戏文本库中查找得到与输入信息匹配的知识点，根据NPC的属性信息生成人设提示词，对输入信息、知识点和人设提示词进行融合得到指令并输入游戏模型，由游戏模型进行含义理解后按照人设提示词对应的人设生成回复信息，然后将回复信息发送给客户端，实现了NPC的智能交互，无需依赖游戏设计者的知识储备进行开发，降低了NPC开发成本。由于游戏模块使用包括人设信息的语料训练过，因此能够得到具有人设特点的回复信息，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，可依照说明书的内容予以实施，并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本申请的一些实施方式，而不应将其视为是对本申请范围的限制。

图1为本申请提供的NPC交互方法的应用场景示意图；

图2为本申请一实施例的NPC交互方法流程图；

图3是本申请另一实施例的NPC交互方法流程图；

图4是本申请另一实施例的服务器处理流程示意图；

图5是本申请另一实施例的NPC交互方法流程图；

图6是本申请一实施例的NPC交互装置的结构框图；

图7是本申请一实施例的NPC交互装置的结构框图；

图8为用来实现本申请实施例的电子设备的框图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本申请的构思或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的，而非限制性的。

为便于理解本申请实施例的技术方案，以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合，其均属于本申请实施例的保护范围。

首先对本申请所涉及的名词进行解释。

LLM(Large Language Model，大语言模型)：一种基于深度学习的自然语言处理模型，它使用大规模的语料库进行训练，通常拥有数十亿到数万亿个参数，能够处理各种自然语言任务，如自然语言生成、文本分类、文本摘要、问答、对话、机器翻译或语音识别等。

NPC：游戏中的一种角色类型即非玩家角色，是指电子游戏中不受真人玩家操纵的游戏角色。NPC通常由计算机的人工智能控制，是拥有自身行为模式的角色。NPC可以为玩家提供一些游戏信息或触发剧情。

SFT(Supervised Fine-Tuning，有监督的微调)：一种模型优化技术，使用预训练模型作为初始状态，在目标任务的训练集上进行微调，使模型能够更好地适应目标任务。SFT可以提高模型的精度和泛化能力，并且可以大大减少训练时间和计算资源的消耗。

图1为示例性的用于实现本申请实施例的NPC交互方法的一个应用场景的示意图。云端的服务器可以为多个客户端提供游戏的相关服务，包括NPC交互服务。其中，客户端的类型可以有多种，如计算机、手机、平板电脑或笔记本电脑等等。云端的服务器可以根据需要部署，包括集中式部署或分布式部署。例如，可以在云端部署多个服务器或者也可以部署一个服务器，具体不限定。图中仅以部署一个服务器为例进行示意。

本申请实施例提供的NPC交互方法，可以应用于任何游戏中，具体的应用场景可以有多种，包括但不限于游戏内指引、NPC对话以及助手型NPC等场景。本申请实施例中，NPC在游戏中承担着剧情性和功能性两类重要任务，不仅仅起到推动游戏剧情发展的作用，更是游戏设计者和玩家的交互桥梁。NPC交互包括但不限于知识问答或闲聊，其中，知识问答是指有关游戏世界观的知识问答。

游戏世界观是指对游戏故事发生地的世界的认知，包括但不限于自然环境和社会环境。自然环境指游戏世界的山川河流、植被荒漠，以及各种普通生物的生存和分布。社会环境包括游戏世界的经济和文化环境，以及各种智慧生物的生活方式、生存状态、信仰存在、集群规则、力量体系和阵营分布等多种情况。

本申请实施例还涉及游戏文本库，用于存储与游戏世界观有关的各种知识点，存储的类型可以是文本或语音等，具体不限定。当客户端发送玩家的输入信息时，服务器可以根据该输入信息在游戏文本库中搜索，得到与其匹配的知识点，以便游戏模型基于知识点对输入信息进行处理得到回复信息。

本申请实施例提供了一种NPC交互方法，应用于服务器，如图2所示为本申请一实施例的NPC交互方法流程图，该方法可以包括如下步骤。

S201：接收客户端针对NPC的输入信息。

本申请实施例的应用场景为游戏过程中，游戏界面上存在一个NPC，玩家和NPC之间进行单轮对话或者多轮对话。其中，单轮对话或多轮对话，均可以由NPC触发开始，也可以由玩家触发开始，具体不限定。上述步骤S201中的输入信息可以是单轮对话中的触发语句，或者也可以是多轮对话中的任一条语句。客户端可以接收玩家在游戏过程中输入的文本或语音形式的语句，玩家可以在游戏界面上以键盘或手写等方式输入文本，也可以直接语音说出语句。

S202：在游戏文本库中查找得到与输入信息匹配的知识点。

其中，游戏文本库中存储有多个知识点，具体可以为与游戏世界观有关的知识点，存储的形式包括但不限于：文件、段落或语句等，语句的类型包括但不限于文本或语音。

上述查找匹配的知识点可以采用相似度计算的方式来实现，具体地，上述步骤S202可以包括：计算输入信息与游戏文本库中各知识点的相似度，对得到的相似度按照从高到低的顺序，选出指定个数的相似度，将选出的相似度对应的知识点作为与输入信息匹配的知识点。

另外，在一种实施方式下，还可以先对NPC是否与游戏世界观有关进行判断，具体地，上述步骤S202可以包括：判断NPC是否为具有游戏世界观知识的NPC，如果是，则在游戏文本库中查找得到与输入信息匹配的知识点；否则，直接将输入信息输入使用包括人设信息的语料训练后的游戏模型中进行处理得到回复信息，并将回复信息发送给客户端。

S203：根据NPC的属性信息生成人设提示词。

其中，NPC的属性信息用于表征NPC的基本信息和性格特点等，包括但不限于：姓名、年龄、职业、性格或神态等，具体不限定。

本申请实施例中，人设提示词为NPC交互中针对人设信息的提示词，以提示按照人设信息对应的人设进行NPC交互，即交互内容需要符合人设信息。例如，获取NPC的属性信息包括姓名A，年龄B，职业C，则生成的人生提示词可以为“人设是姓名A，年龄B和职业C”，从而起到按照该人设提示词对应的人设进行交互的作用。

S204：对输入信息、知识点和人设提示词进行融合得到指令。

上述融合可以采用提示词模型来实现，具体地，上述步骤S204可以包括：将输入信息、知识点和人设提示词输入提示词模型，由提示词模型按照指定的语句逻辑和顺序，将输入信息、知识点和人设提示词组织为指令，以指示参考知识点并按照人设提示词对应的人设回复输入信息。

S205：将指令输入使用包括人设信息的语料训练后的游戏模型，游戏模型进行含义理解后按照人设提示词对应的人设生成针对输入信息的回复信息。

本申请实施例中，游戏模型可以预先使用包括人设信息的语料进行训练，其中包括人设信息的语料包括但不限于：个性化的语料和/或风格化的语料。游戏模型可以采用多种模型来实现，包括但不限于LLM等。

在一种实施方式下，上述步骤S201之前还可以包括：获取使用初始语料进行预训练之后的游戏模型，使用包括人设信息的语料，对获取的游戏模型进行有监督的微调SFT训练，以使游戏模型具有按照指定人设生成回复信息的能力。

本申请实施例中，风格化的语料可以至少包括以下一种信息：性别、年龄、职业或阶级；个性化的语料可以至少包括以下一种信息：角色、性格、神态或语调。游戏模型得到的回复信息可以为文本或语音，本申请实施例对此不做具体限定。

S206：将回复信息发送给客户端。

在一种实施方式下，上述方法还可以包括：判断回复信息是否属于游戏知识问答领域，如果是，则存储回复信息以用于后续多轮对话。

本实施例提供的上述方法，通过接收客户端针对NPC的输入信息，在游戏文本库中查找得到与输入信息匹配的知识点，根据NPC的属性信息生成人设提示词，对输入信息、知识点和人设提示词进行融合得到指令并输入游戏模型，游戏模型进行含义理解后按照人设提示词对应的人设生成针对输入信息的回复信息，将回复信息发送给客户端，实现了NPC的智能交互，无需依赖游戏设计者的知识储备进行开发，降低了NPC开发成本。由于游戏模型使用包括人设信息的语料训练过，因此能够得到符合人设的回复信息，具有个性化和/或风格化特点，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。

本申请另一实施例提供了一种NPC交互方法，应用于服务器，如图3所示为本申请另一实施例的NPC交互方法流程图，该方法可以包括如下步骤。

S301：获取使用初始语料进行预训练之后的游戏模型。

本申请实施例中，游戏模型的训练可以包括两个阶段，预训练阶段和微调阶段。其中，预训练使用的是初始语料进行训练，该过程通常是通过无监督学习完成的，经过大量甚至海量的初始语料来训练游戏模型学习人类语言的结构、语法和语义，以使游戏模型具有处理自然语言的各种任务的能力。游戏模型的预训练过程本申请实施例不做过多说明。预训练后的游戏模型能够学习到一般的语言模式和表征，具备响应问句的能力，针对输入信息能够输出相应的回复信息，完成对话功能。示例性地，游戏模型可以采用LLM来实现，本申请实施例对此不做具体限定。

S302：使用包括人设信息的语料，对获取的游戏模型进行有监督的微调SFT训练。

本申请实施例中的初始语料是多样化的数据集，可以包括各种对话语料，来源不限，如可以是网站、书籍和文章等。但是，初始语料通常不具有个性化和/或风格化特性，因此，为了提高游戏模型的个性化和/或风格化能力，还可以进一步对预训练后的游戏模型进行微调。

在微调阶段，可以对预训练后的游戏模型，使用与目标任务或领域相关的数据集进行训练，从而有助于微调模型的理解并适应目标任务的需求。该数据集与初始语料相比可以更具体，数量也可以更少，但是需要具有个性化和/或风格化。具体地，可以采用SFT技术来进行微调训练，即使用个性化和/或风格化的语料，对预训练后的游戏模型进行SFT训练。

本申请实施例中，上述包括人设信息的语料包括但不限于：风格化的语料和/或个性化的语料。风格化的语料至少包括以下一种信息：性别、年龄、职业或阶级。使用风格化的语料进行SFT训练后的游戏模型，能够输出具有风格特点的回复信息，如具有女性或男性风格的回复信息，具有武侠或药师风格的回复信息，或者具有少年或长者风格的回复信息等。

本申请实施例中，个性化的语料至少包括以下一种信息：角色、性格、神态或语调。使用个性化的语料进行SFT训练后的游戏模型，能够输出具有个性化特点的回复信息，如具有温柔性格或冷酷性格的回复信息，具有高兴神态或谦虚神态的回复信息，或者具有撒娇语调或卡通语调的回复信息等。

通过使用SFT训练后的游戏模型，生成的对话在个性化和/或风格化方面与预设的NPC较为相符，进一步提升了生成对话的真实性和可信度。

S303：接收客户端针对非角色玩家NPC的输入信息。

其中，输入信息可以为文本或语音，本申请实施例对此不做具体限定。

S304：判断NPC是否为具有游戏世界观知识的NPC，如果是，则在游戏文本库中查找得到与输入信息匹配的知识点。

本实施例中，NPC是否具有游戏世界观知识可以预先设置好，具体可以通过标识来区分，如标识为1代表当前NPC具有游戏世界观知识，标识为0代表当前NPC不具有游戏世界观知识，当然也可以采用其他方式，具体不限定。

本申请实施例中，游戏文本库中的语句也可以采用向量的形式进行存储，如将文本语句转换为数字序列的向量，从而方便搜索和匹配，不仅能够有效地减少搜索时间，而且还能够提高搜索结果的准确性。

在一种实施方式下，上述步骤S304中在游戏文本库中查找得到与输入信息匹配的知识点，可以具体包括以下步骤：

计算输入信息与游戏文本库中各语句的相似度，对得到的相似度按照从高到低的顺序，选出指定个数的相似度，将选出的相似度对应的语句作为与输入信息匹配的知识点。

示例性地，游戏文本库包括N条语句，计算输入信息与这N条语句中每条语句的相似度，可以得到N个相似度。然后按照相似度从高到低的顺序对这N个相似度进行排序，再选出排序靠前的K个相似度。其中，指定个数K可以根据需要设定，如3个、5个或10个等，具体数值不限定。最后，将选出的K个相似度对应的K个语句作为与输入信息匹配的知识点，即得到K个知识点。

S305：根据NPC的属性信息生成人设提示词。

S306：将输入信息、知识点和人设提示词输入提示词模型，提示词模型按照指定的语句逻辑和顺序，将输入信息、知识点和人设提示词组织为指令，以指示参考知识点并按照人设提示词对应的人设回复输入信息。

本申请实施例中，提示词模型的作用是利用自然语言来指导或激发游戏模型完成目标任务，其核心思想是，按照指定的语句逻辑和顺序得到指令，该指令作为游戏模型的输入可以控制游戏模型的输出符合期望，达到更佳的效果。这种使用提示词模型的方式，可以引导游戏模型完成多种任务，无需每个特定任务都对游戏模型进行训练和微调，从而可以节省大量的时间、资源和数据，提升游戏模型的性能，而且游戏模型给出的答案不仅准确性更高，而且还具有更好的语言表达能力，可以更灵活地满足用户需求。另外，与传统的通过词嵌入的方法指定语言风格的方式相比，上述方式可以避免出现对话逻辑错误、风格化不明显或生成文本质量较差等情况发生，极大地提高了对话的准确性，优化了对话效果。

例如，输入信息为“question”、知识点为“knowledge”、人设提示词为“人设为姓名是name，职业是job，年龄是age”。则进行融合后得到的指令可以如下：“你的姓名是name，职业是job，年龄是age，请参考以下知识点knowledge，以符合你人设的语气和性格，回答question”，从而可以将该指令输入游戏模型得到回复信息。

S307：将指令输入上述游戏模型，游戏模型进行含义理解后按照人设提示词对应的人设生成针对输入信息的回复信息。

S308：判断回复信息是否属于游戏知识问答领域，如果是，则存储回复信息以用于后续多轮对话。

其中，判断回复信息是否属于游戏知识问答领域的目的是，确定当前回复信息是否对后续多轮对话有帮助。对于当前回复信息属于游戏知识问答领域的场景，可以确定当前回复信息对后续多轮对话有帮助，即起到上下文可以提示的作用。因此，存储当前回复信息，从而在后续多轮对话中可以借助已存储的回复信息来响应，从而进一步地提高后续多轮对话的准确性。对于当前回复信息不属于游戏知识问答领域的场景，如天气的话题等闲聊场景，与游戏世界观无关，则可以确定当前回复信息对后续多轮对话没有任何影响，因此，无需存储当前回复信息，从而可以节省存储资源。上述机制可以增强对话的连贯性和流畅性，同时提高对话系统的学习能力和自适应性。

本申请实施例中，上述方法还可以包括：在存储有历史回复信息的情况下，将输入信息、知识点、历史回复信息和人设提示词输入提示词模型，提示词模型按照指定的语句逻辑和顺序，将输入信息、知识点、历史回复信息和人设提示词组织为指令，以指示参考知识点和历史回复信息并按照人设提示词对应的人设回复输入信息。进而游戏模型可以根据该指令生成回复信息，该回复信息发送给客户端后，客户端呈现给用户，从而完成NPC交互。

例如，输入信息为“question”、知识点为“knowledge”、历史回复信息为“history”、人设提示词为“人设为姓名是name，职业是job，年龄是age”。则进行融合后得到的指令可以如下：“你的姓名是name，职业是job，年龄是age，请参考以下知识点knowledge和历史回复信息history，以符合你人设的语气和性格，回答question”，从而可以将该指令输入游戏模型得到回复信息。

S309：将回复信息发送给客户端。

本申请实施例中，回复信息可以具体为文本或语音。将当前的回复信息发送给客户端后，完成了当前与NPC的一轮对话。如果后续还有其他轮对话，则可以重复上述方法，此处不做过多说明。

本实施例提供的上述方法，通过接收客户端针对NPC的输入信息，在游戏文本库中查找得到与输入信息匹配的知识点，根据NPC的属性信息生成人设提示词，对输入信息、知识点和人设提示词进行融合得到指令并输入游戏模型，由游戏模型进行含义理解后按照人设提示词对应的人设生成回复信息，然后将回复信息发送给客户端，无需依赖游戏设计者的知识储备进行开发，在降低NPC开发成本的同时，使NPC交互更具智能化和个性化，满足不同类型、不同场景的游戏需求，实现了NPC的世界观塑造。相较于传统问答系统依赖结构化数据库(如图谱、问答库等)的缺陷，实现了非结构化文本的对话。由于游戏模型使用包括人设信息的语料训练过，因此在保证对话性能的同时，回复内容具备更强的逻辑性，且增强了个性化和/或风格化，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。存储当前回复信息的方式，使得多轮对话在记忆力上表现更优，不仅保证了对话的连贯性，而且提高了游戏的互动性和娱乐性。

图4为本申请一实施例的服务器处理流程示意图。如图4所示，服务器收到客户端发来的输入信息，在游戏文本库中查找得到与输入信息匹配的知识点。将输入信息和该知识点输入至提示词模型进行融合得到指令。将该指令输入至经预训练和SFT训练后的LLM，得到针对输入信息的回复信息。其中，SFT训练使用具有个性化和/或风格化的对话语料对LLM进行微调。在判断回复信息属于游戏知识问答领域后进行记忆存储，然后发送给客户端，完成当前对话流程。

本申请另一实施例提供了一种NPC交互方法，应用于客户端，如图5所示为本申请另一实施例的NPC交互方法流程图，该方法可以包括如下步骤。

S501：接收来自用户的针对NPC的输入信息。

其中，输入信息可以是文本、语音、图片或视频，本申请实施例对此不做具体限定。

S502：将输入信息发送给服务器。

S503：接收服务器返回的针对输入信息的回复信息。

其中，回复信息是服务器基于输入信息、与输入信息匹配的知识点和人设提示词融合得到的指令且使用游戏模型生成的，该游戏模型为使用包括人设信息的语料训练后的游戏模型。

S504：呈现回复信息给用户。

其中，呈现的方式有多种，包括但不限于：显示、语音播放或视频播放等，具体不限定。

本实施例提供的上述方法，通过客户端接收来自用户的针对NPC的输入信息，将输入信息发送给服务器，接收服务器返回的回复信息并呈现给用户，实现了NPC的智能交互，无需依赖游戏设计者的知识储备进行开发，降低了NPC开发成本。由于服务器的游戏模型使用包括人设信息的语料训练过，因此能够得到符合人设的回复信息，具有个性化和/或风格化特点，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。

与本申请实施例提供的方法的应用场景以及方法相对应地，本申请实施例还提供一种NPC交互装置，应用于服务器。如图6所示为本申请一实施例的NPC交互装置的结构框图，该装置可以包括：

接收模块601，用于接收客户端针对非角色玩家NPC的输入信息；

匹配模块602，用于在游戏文本库中查找得到与输入信息匹配的知识点；

提示模块603，用于根据NPC的属性信息生成人设提示词；

融合模块604，用于对输入信息、知识点和人设提示词进行融合得到指令；

处理模块605，用于将指令输入游戏模型，由游戏模型进行含义理解后按照人设提示词对应的人设生成针对输入信息的回复信息；

发送模块606，用于将回复信息发送给客户端；

其中，游戏模型为使用包括人设信息的语料训练后的游戏模型，包括但不限于LLM。

在一种实施方式下，上述装置还包括：

获取模块，用于获取使用初始语料进行预训练之后的游戏模型；

微调模块，用于使用包括人设信息的语料，对获取的游戏模型进行有监督的微调SFT训练，以使游戏模型具有按照指定人设生成回复信息的能力。

在一种实施方式下，融合模块用于：将所述输入信息、知识点和人设提示词输入提示词模型，提示词模型按照指定的语句逻辑和顺序，将输入信息、知识点和人设提示词组织为指令，以指示参考知识点并按照人设提示词对应的人设回复输入信息。

在一种实施方式下，上述装置还包括：

存储模块，用于判断回复信息是否属于游戏知识问答领域，如果是，则存储回复信息以用于后续多轮对话。

在一种实施方式下，融合模块还用于：在存储有历史回复信息的情况下，将输入信息、知识点、历史回复信息和人设提示词输入提示词模型，提示词模型按照指定的语句逻辑和顺序，将输入信息、知识点、历史回复信息和人设提示词组织为指令，以指示参考知识点和历史回复信息并按照人设提示词对应的人设回复输入信息。

在一种实施方式下，匹配模块用于：计算输入信息与游戏文本库中各知识点的相似度，对得到的相似度按照从高到低的顺序，选出指定个数的相似度，将选出的相似度对应的知识点作为与输入信息匹配的知识点。

在一种实施方式下，匹配模块用于：判断NPC是否为具有游戏世界观知识的NPC，如果是，则在游戏文本库中查找得到与输入信息匹配的知识点。

本实施例中，包括人设信息的语料包括但不限于风格化的语料和/或个性化的语料，风格化的语料至少包括以下一种信息：性别、年龄、职业或阶级；个性化的语料至少包括以下一种信息：角色、性格、神态或语调。上述输入信息和回复信息可以为文本、语音、图片或视频。

本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述，并具备相应的有益效果，在此不再赘述。

本实施例提供的上述装置，通过接收客户端针对NPC的输入信息，在游戏文本库中查找得到与输入信息匹配的知识点，根据NPC的属性信息生成人设提示词，对输入信息、知识点和人设提示词进行融合得到指令并输入游戏模型，由游戏模型进行含义理解后按照人设提示词对应的人设生成回复信息，然后将回复信息发送给客户端，实现了NPC的智能交互，无需依赖游戏设计者的知识储备进行开发，降低了NPC开发成本。由于游戏模型使用包括人设信息的语料训练过，因此能够得到具有人设特点如个性化和/或风格化的回复信息，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。

与本申请实施例提供的方法的应用场景以及方法相对应地，本申请实施例还提供一种NPC交互装置，应用于客户端。如图7所示为本申请一实施例的NPC交互装置的结构框图，该装置可以包括：

第一接收模块701，用于接收来自用户的针对非角色玩家NPC的输入信息。

发送模块702，用于将输入信息发送给服务器。

第二接收模块703，用于接收服务器返回的针对输入信息的回复信息。

呈现模块704，用于呈现回复信息给用户。

其中，回复信息是服务器基于输入信息、与输入信息匹配的知识点和人设提示词融合得到的指令且使用游戏模型生成的，游戏模型为使用包括人设信息的语料训练后的游戏模型。

本实施例提供的上述装置，通过客户端接收来自用户的针对NPC的输入信息，将输入信息发送给服务器，接收服务器返回的回复信息并呈现给用户，实现了NPC的智能交互，无需依赖游戏设计者的知识储备进行开发，降低了NPC开发成本。由于服务器的游戏模型使用包括人设信息的语料训练过，因此能够得到符合人设的回复信息，具有个性化和/或风格化特点，克服了基于固定模版交互单一的缺陷，提升了交互的丰富性，增强了游戏玩家的体验。

图8为用来实现本申请实施例的电子设备的框图。如图8所示，该电子设备包括：存储器810和处理器820，存储器810内存储有可在处理器820上运行的计算机程序。处理器820执行该计算机程序时实现上述实施例中的方法。存储器810和处理器820的数量可以为一个或多个。

该电子设备还包括：通信接口830，用于与外界设备进行通信，进行数据交互传输。

如果存储器810、处理器820和通信接口830独立实现，则存储器810、处理器820和通信接口830可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture，EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器810、处理器820及通信接口830集成在一块芯片上，则存储器810、处理器820及通信接口830可以通过内部接口完成相互间的通信。

本申请实施例提供了一种计算机可读存储介质，其存储有计算机程序，该程序被处理器执行时实现本申请实施例中提供的方法。

本申请实施例还提供了一种芯片，该芯片包括处理器，用于从存储器中调用并运行存储器中存储的指令，使得安装有芯片的通信设备执行本申请实施例提供的方法。

本申请实施例还提供了一种芯片，包括：输入接口、输出接口、处理器和存储器，输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连，处理器用于执行存储器中的代码，当代码被执行时，处理器用于执行申请实施例提供的方法。

应理解的是，上述处理器可以是中央处理器(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(FieldProgrammable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是，处理器可以是支持进阶精简指令集机器(Advanced RISC Machines，ARM)架构的处理器。

进一步地，可选的，上述存储器可以包括只读存储器和随机访问存储器。该存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以包括只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以包括随机访问存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM均可用。例如，静态随机访问存储器(Static RAM，SRAM)、动态随机访问存储器(Dynamic Random Access Memory，DRAM)、同步动态随机访问存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机访问存储器(Double Data RateSDRAM，DDR SDRAM)、增强型同步动态随机访问存储器(Enhanced SDRAM，ESDRAM)、同步链接动态随机访问存储器(Sync link DRAM，SLDRAM)和直接内存总线随机访问存储器(DirectRambus RAM，DR RAM)。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生依照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中描述的或在此以其他方式描述的任何过程或方法可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能。

在流程图中描述的或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。

应理解的是，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器，磁盘或光盘等。

需要说明的是，本申请实施例中可能会涉及到对用户数据的使用，在实际应用中，可以在符合所在国的适用法律法规要求的情况下(例如，用户明确同意，对用户切实通知，等)，在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。

以上所述，仅为本申请的示例性实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请记载的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种NPC交互方法，其特征在于，所述方法包括：

接收客户端针对非角色玩家NPC的输入信息；

在游戏文本库中查找得到与所述输入信息匹配的知识点；

根据所述NPC的属性信息生成人设提示词；

对所述输入信息、知识点和人设提示词进行融合得到指令；

将所述回复信息发送给所述客户端；

2.根据权利要求1所述的方法，其特征在于，接收客户端针对非角色玩家NPC的输入信息之前，还包括：

获取使用初始语料进行预训练之后的游戏模型；

使用包括人设信息的语料，对获取的所述游戏模型进行有监督的微调SFT训练，以使所述游戏模型具有按照指定人设生成回复信息的能力。

3.根据权利要求1所述的方法，其特征在于，对所述输入信息、知识点和人设提示词进行融合得到指令，包括：

将所述输入信息、知识点和人设提示词输入提示词模型；

所述提示词模型按照指定的语句逻辑和顺序，将所述输入信息、知识点和人设提示词组织为指令，以指示参考所述知识点并按照所述人设提示词对应的人设回复所述输入信息。

4.根据权利要求1所述的方法，其特征在于，还包括：

判断所述回复信息是否属于游戏知识问答领域，如果是，则存储所述回复信息以用于后续多轮对话。

5.根据权利要求4所述的方法，其特征在于，还包括：

在存储有历史回复信息的情况下，将所述输入信息、知识点、历史回复信息和人设提示词输入提示词模型；

所述提示词模型按照指定的语句逻辑和顺序，将所述输入信息、知识点、历史回复信息和人设提示词组织为指令，以指示参考所述知识点和历史回复信息并按照所述人设提示词对应的人设回复所述输入信息。

6.根据权利要求1所述的方法，其特征在于，在游戏文本库中查找得到与所述输入信息匹配的知识点，包括：

计算所述输入信息与游戏文本库中各知识点的相似度；

对得到的相似度按照从高到低的顺序，选出指定个数的相似度；

将选出的相似度对应的知识点作为与所述输入信息匹配的知识点。

7.根据权利要求1所述的方法，其特征在于，在游戏文本库中查找得到与所述输入信息匹配的知识点，包括：

判断所述NPC是否为具有游戏世界观知识的NPC，如果是，则在游戏文本库中查找得到与所述输入信息匹配的知识点。

8.根据权利要求1所述的方法，其特征在于，所述包括人设信息的语料至少包括以下一种信息：性别、年龄、职业、阶级、角色、性格、神态或语调。

9.根据权利要求1所述的方法，其特征在于，所述输入信息和回复信息中的任一个包括以下至少一种：文本、语音、图片或视频。

10.一种NPC交互方法，其特征在于，所述方法包括：