CN117972040A

CN117972040A - 交互信息处理方法、设备和存储介质

Info

Publication number: CN117972040A
Application number: CN202311827294.0A
Authority: CN
Inventors: 刘博�; 陈文清; 毛肖肖; 吕昱君; 张自强
Original assignee: Zhejiang Tmall Technology Co Ltd
Current assignee: Zhejiang Tmall Technology Co Ltd
Priority date: 2023-12-27
Filing date: 2023-12-27
Publication date: 2024-05-03

Abstract

本申请提供一种交互信息处理方法、设备和存储介质，其中方法包括：响应于用户的初始输入信息，展示基于所述初始输入信息确定的需求提示信息；获取所述用户基于所述需求提示信息输入的回复信息；根据所述回复信息和所述初始输入信息，确定所述用户的目标需求类型；根据所述目标需求类型返回对应的推荐信息给所述用户。本申请实现了通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

Description

交互信息处理方法、设备和存储介质

技术领域

本申请涉及信息处理技术领域，尤其涉及一种交互信息处理方法、设备和存储介质。

背景技术

随着互联网的发展，用户越来越青睐通过电商平台在线购买商品。传统电商平台一般给用户提供搜索功能，以使用户可以通过电商平台搜索感兴趣的商品信息。

传统的电商搜索功能通常只能用关键词搜索，用户的需求表达是经过概括的关键词，而实际场景中用户往往不知道如何描述自己的需求，加上用户对商品的专业/场景知识欠缺，根本更无法准确提炼出关键词，故难以了解到用户真正需求以及挖掘用户潜在需求。比如传统搜索一般只能满足结构化的用户需求，如通过具体的品牌词或者品类词进行搜索，对于一些需求量大的偏口话化表达的用户需求难以承接。此外，对于用户来说，传统搜索路径一般包括：输入关键词，然后浏览商品，然后不断的改写关键词来重新搜索，整个交互过程是不连续的，导致通过电商平台的搜索体验较差。

发明内容

本申请实施例的主要目的在于提供一种交互信息处理方法、设备和存储介质，实现了通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

第一方面，本申请实施例提供一种交互信息处理方法，包括：响应于用户的初始输入信息，展示基于所述初始输入信息确定的需求提示信息；获取所述用户基于所述需求提示信息输入的回复信息；根据所述回复信息和所述初始输入信息，确定所述用户的目标需求类型；根据所述目标需求类型返回对应的推荐信息给所述用户。

于一实施例中，所述响应于用户的初始输入信息，包括：响应于所述用户在交互界面的录入信息，获取与所述录入信息匹配的候选需求信息；响应于所述用户对所述候选需求信息的选定指令，将所述选定指令对应的需求信息确定为所述初始输入信息。

于一实施例中，在所述展示基于所述初始输入信息确定的需求提示信息之前，还包括：响应于用户的初始输入信息，根据所述初始输入信息在预设知识库中搜索；若在所述预设知识库中搜索到与所述初始输入信息匹配的预设答复信息，根据所述预设答复信息返回对应的推荐信息给所述用户；若在所述预设知识库中未搜索到与所述初始输入信息匹配的预设答复信息，执行所述展示基于所述初始输入信息确定的需求提示信息的步骤。

于一实施例中，所述根据所述预设答复信息返回对应的推荐信息给所述用户，包括：根据所述预设答复信息生成预设大语言模型的提示词，以使所述预设大语言模型对所述预设答复信息总结后输出所述推荐信息；返回所述推荐信息给所述用户。

于一实施例中，在所述展示基于所述初始输入信息确定的需求提示信息之前，还包括：判断所述初始输入信息是否包括预设需求类型；若所述初始输入信息包括所述预设需求类型，将所述预设需求类型确定为所述用户的目标需求类型；若所述初始输入信息不包括所述预设需求类型，执行所述展示基于所述初始输入信息确定的需求提示信息的步骤。

于一实施例中，所述需求提示信息包括预设次数发出的需求提示；所述获取所述用户基于所述需求提示信息输入的回复信息，包括：响应于所述用户对已发出需求提示的第一回复信息，根据所述第一回复信息再次发出需求提示，直至获取到所述用户对所述预设次数的需求提示的回复信息。

于一实施例中，所述根据所述回复信息和所述初始输入信息，确定所述用户的目标需求类型，包括：将所述回复信息和所述初始输入信息输入预设大语言模型，以使所述预设大语言模型根据预设提示词对所述回复信息和所述初始输入信息进行上下文分析推理，输出所述用户的目标需求类型。

于一实施例中，所述目标需求类型包括目标物品品类、目标店铺类型、目标榜单数据、目标知识内容中的一个或多个。

于一实施例中，所述根据所述目标需求类型返回对应的推荐信息给所述用户，包括：确定所述目标需求类型匹配的目标搜索引擎；基于所述目标搜索引擎获取与所述目标需求类型匹配的搜索结果信息；根据所述搜索结果信息返回对应的推荐信息给所述用户。

于一实施例中，所述根据所述搜索结果信息返回对应的推荐信息给所述用户，包括：若所述搜索结果信息包括目标对象的预设信息卡，根据所述目标对象的标题生成对所述目标对象的描述文本，将所述预设信息卡和/或所述描述文本作为推荐信息返回给所述用户。

于一实施例中，所述根据所述搜索结果信息返回对应的推荐信息给所述用户，包括：若所述搜索结果信息中不存在目标对象的预设信息卡，根据所述搜索结果信息生成预设大语言模型的提示词，以使所述预设大语言模型对所述搜索结果信息总结后输出所述推荐信息；返回所述推荐信息给所述用户。

于一实施例中，在返回所述推荐信息给所述用户之前，还包括：标记所述推荐信息中包含的预设关键词；在返回所述推荐信息给所述用户之后，还包括：将所述推荐信息中包含的预设关键词突出显示；响应于所述用户对所述预设关键词的确定指令，跳转到基于所述预设关键词的搜索结果页面。

于一实施例中，基于所述初始输入信息确定所述需求提示信息，包括：将所述初始输入信息输入预设大语言模型，所述预设大语言模型用于抽取所述初始输入信息中包含的需求关键词，根据所述需求关键词和预设提示词，确定与所述关键词相关的所述需求提示信息。

于一实施例中，所述预设大语言模型是通过对预训练的大语言模型进行有监督微调后得到的。

第二方面，本申请实施例提供一种交互信息处理方法，包括：响应于用户输入的初始问题信息，展示基于所述初始问题信息确定的相关商品和/或相关店铺的询问信息；获取所述用户基于所述询问信息输入的回复信息；根据所述回复信息和所述初始问题信息，确定所述用户关注的目标商品和/或目标店铺；根据目标商品和/或目标店铺返回对应的推荐信息给所述用户。

第三方面，本申请实施例提供一种交互信息处理装置，包括：

展示模块，用于响应于用户的初始输入信息，展示基于所述初始输入信息确定的需求提示信息；

获取模块，用于获取所述用户基于所述需求提示信息输入的回复信息；

确定模块，用于根据所述回复信息和所述初始输入信息，确定所述用户的目标需求类型；

返回模块，用于根据所述目标需求类型返回对应的推荐信息给所述用户。

于一实施例中，还包括：响应模块，用于响应于所述用户在交互界面的录入信息，获取与所述录入信息匹配的候选需求信息；响应于所述用户对所述候选需求信息的选定指令，将所述选定指令对应的需求信息确定为所述初始输入信息。

于一实施例中，还包括：搜索模块，用于在所述展示基于所述初始输入信息确定的需求提示信息之前，响应于用户的初始输入信息，根据所述初始输入信息在预设知识库中搜索；若在所述预设知识库中搜索到与所述初始输入信息匹配的预设答复信息，根据所述预设答复信息返回对应的推荐信息给所述用户；若在所述预设知识库中未搜索到与所述初始输入信息匹配的预设答复信息，指示所述展示模块执行所述展示基于所述初始输入信息确定的需求提示信息的步骤。

于一实施例中，所述搜索模块，还用于根据所述预设答复信息生成预设大语言模型的提示词，以使所述预设大语言模型对所述预设答复信息总结后输出所述推荐信息；返回所述推荐信息给所述用户。

于一实施例中，还包括：判断模块，用于在所述展示基于所述初始输入信息确定的需求提示信息之前，判断所述初始输入信息是否包括预设需求类型；若所述初始输入信息包括所述预设需求类型，将所述预设需求类型确定为所述用户的目标需求类型；若所述初始输入信息不包括所述预设需求类型，指示所述展示模块执行所述展示基于所述初始输入信息确定的需求提示信息的步骤。

于一实施例中，所述需求提示信息包括预设次数发出的需求提示；所述获取模块，用于响应于所述用户对已发出需求提示的第一回复信息，根据所述第一回复信息再次发出需求提示，直至获取到所述用户对所述预设次数的需求提示的回复信息。

于一实施例中，所述确定模块，用于将所述回复信息和所述初始输入信息输入预设大语言模型，以使所述预设大语言模型根据预设提示词对所述回复信息和所述初始输入信息进行上下文分析推理，输出所述用户的目标需求类型。

于一实施例中，所述返回模块，用于确定所述目标需求类型匹配的目标搜索引擎；基于所述目标搜索引擎获取与所述目标需求类型匹配的搜索结果信息；根据所述搜索结果信息返回对应的推荐信息给所述用户。

于一实施例中，所述返回模块，用于若所述搜索结果信息包括目标对象的预设信息卡，根据所述目标对象的标题生成对所述目标对象的描述文本，将所述预设信息卡和/或所述描述文本作为推荐信息返回给所述用户。

于一实施例中，所述返回模块，用于若所述搜索结果信息中不存在目标对象的预设信息卡，根据所述搜索结果信息生成预设大语言模型的提示词，以使所述预设大语言模型对所述搜索结果信息总结后输出所述推荐信息；返回所述推荐信息给所述用户。

于一实施例中，还包括：标记模块，用于在返回所述推荐信息给所述用户之前，标记所述推荐信息中包含的预设关键词；该装置还包括：显示模块，用于在返回所述推荐信息给所述用户之后，将所述推荐信息中包含的预设关键词突出显示；跳转模块，用于响应于所述用户对所述预设关键词的确定指令，跳转到基于所述预设关键词的搜索结果页面。

于一实施例中，还包括：分析模块，用于将所述初始输入信息输入预设大语言模型，所述预设大语言模型用于抽取所述初始输入信息中包含的需求关键词，根据所述需求关键词和预设提示词，确定与所述关键词相关的所述需求提示信息。

第四方面，本申请实施例提供一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述电子设备执行上述任一方面所述的方法。

第五方面，本申请实施例提供一种云设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述云设备执行上述任一方面所述的方法。

第六方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现上述任一方面所述的方法。

第七方面，本申请实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任一方面所述的方法。

本申请实施例提供的交互信息处理方法、设备和存储介质，根据用户的初始输入信息，在交互界面展示对应的需求提示信息，以使用户根据提示对自己的需求进一步描述，并输入回复信息，结合用户的初始输入信息以及用户根据需求提示的回复信息，分析上下文，确定用户真实的目标需求类型，进而向用户返回符合目标需求类型的推荐信息，如此，给用户带来全新的对话交互式搜索体验，通过对话式交互沟通，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种电子设备的结构示意图；

图2为本申请实施例提供的一种交互信息处理系统的应用场景示意图；

图3A为本申请实施例提供的一种交互信息处理系统的框架流程示意图；

图3B为本申请实施例提供的一种交互信息处理系统的架构示意图；

图4为本申请实施例提供的一种交互信息处理方法的流程示意图；

图5为本申请实施例提供的一种交互式搜索页面交互示意图；

图6为本申请实施例提供的一种推荐信息展示页面示意图；

图7为本申请实施例提供的一种具体场景的交互搜索流程示意图；

图8A为本申请实施例提供的一种推荐信息展示页面示意图；

图8B为本申请实施例提供的一种开放式聊天展示页面示意图；

图9为本申请实施例提供的一种交互信息处理方法的流程示意图；

图10为本申请实施例提供的一种交互信息处理方法的流程示意图；

图11为本申请实施例提供的一种交互信息处理装置的结构示意图；

图12为本申请实施例提供的一种云设备的结构示意图。

通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。

本文中术语“和/或”，用于描述关联对象的关联关系，具体表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。

为了清楚地描述本申请实施例的技术方案，首先对本申请所涉及的名词进行释义：

AI：Artificial Intelligence，人工智能。

LLM：Large Language Model，大语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等，是通向人工智能的一条重要途径。

SFT：Supervised Fine Tuning，有监督的方式进行微调学习，一种深度学习策略，通常在预训练的大语言模型上使用，利用标记好的数据对模型进行微调，以使其适应特定的任务或领域。API：Application Programming Interface，应用程序编程接口。

LangChain：是一个帮助在应用程序中使用大型语言模型(LLM)的编程框架，即大语言模型与外部计算和数据来源、API结合应用的框架。

Prompt：提示词，是一种自然语言输入，类似于命令或指令，可以让AI模型知道它需要做什么。

ChatGPT：Chat Generative Pre-trained Transformer，是OpenAI研发的一款聊天机器人程序。

RLHF：Reinforcement Learning from Human Feedback，人类反馈强化学习。

Transformer模型：一种基于自注意力机制的神经网络模型。

GPT：Generative Pre-Trained Transformer，生成式预训练Transformer模型，是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。

NLP：Natural Language Processing，自然语言处理模型。token：在NLP中，一个“token”可以是一个词、一个字或一个标点符号。比如一个句子“我爱祖国”可以被切成3个tokens，“我”，“爱”，“祖国”。

SKU：Stock Keeping Unit，最小存货单位。

pad：padding，填充，用于填充输入序列中的空缺部分。在NLP任务中，输入序列的长度通常是不同的，为了使这些序列能够被处理和计算，通常需要将它们对齐到相同的长度。这时就需要用pad token来填充序列中的空缺部分，以使所有序列的长度一致。

embedding：向量化，embedding是指将高维度的数据(例如文字、图片、音频)映射到低维度空间的过程。embedding向量通常是一个由实数构成的向量，它将输入的数据表示成一个连续的数值空间中的点。

epoch：训练轮次，当一个完整的数据集通过了神经网络一次并且返回了一次，这个过程称为一次epoch。也就是说，所有训练样本在神经网络中都进行了一次正向传播和一次反向传播。

如图1所示，本实施例提供一种电子设备1，包括：至少一个处理器11和存储器12，图1中以一个处理器为例。处理器11和存储器12通过总线10连接。存储器12存储有可被处理器11执行的指令，指令被处理器11执行，以使电子设备1可执行下述的实施例中方法的全部或部分流程，以实现通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

于一实施例中，电子设备1可以是手机、平板电脑、笔记本电脑、台式计算机或者多个计算机组成的大型运算系统。

图2为本申请实施例提供的一种交互信息处理系统应用场景200的示意图。如图2所示，该系统包括：服务器210和终端220，其中：

服务器210可以是提供交互信息处理服务的数据平台，比如可以是电商场景的线上购物平台。实际场景中，一个线上购物平台可能有多个服务器210，图2中以1个服务器210为例。

终端220可以是用户登录线上购物平台时使用的电脑、手机、平板等设备，终端220也可以有多个，图2中以2个终端220为例进行示意。

终端220与服务器210之间可以通过互联网进行信息传输，以使终端220可以访问服务器210上的数据。上述终端220和/或者服务器210均可以由电子设备1来实现。

本申请实施例的交互信息处理方案可以部署在服务器210上，也可以部署在终端220上，或者部分部署在服务器210上，部分部署在终端220上。实际场景中可以基于实际需求选择，本实施例不做限定。

当交互信息处理方案全部或者部分部署在服务器210上时，可以对终端220开放调用接口，以对终端220提供算法支持。

本申请实施例提供的方法可由电子设备1执行相应的软件代码实现，通过和服务器进行数据交互来实现。其中，电子设备1可以为本地终端设备。当该方法运行于服务器时，该方法则可以基于云交互系统来实现与执行，其中，云交互系统包括服务器和客户端设备。

在一种可能的实施方式中，本申请实施例提供的方法，通过终端设备提供图形用户界面，其中，终端设备可以是前述提到的本地终端设备，也可以是前述提到的云交互系统中的客户端设备。

本申请实施例的交互信息处理方式可以应用于任意需要人机交互处理的领域。

以电商场景为例，传统电商平台一般给用户提供搜索功能，以使用户可以通过电商平台搜索感兴趣的商品信息。传统的电商搜索功引擎通常是基于用户提供的关键词进行搜索，并返回与关键词相关的结果。可见用户的需求表达是经过概括的关键词，而实际场景中用户往往不知道如何描述自己的需求，加上用户对商品的专业/场景知识欠缺，根本更无法准确提炼出关键词，故难以了解到用户真正需求以及挖掘用户潜在需求。

传统的电商搜索通过有两类重要问题一直没有解决，1)语义理解能力差：传统搜索只能用关键词。2)专业/场景知识欠缺：用户对内容搜索的需求旺盛且知识获取的成本门槛较高，基本都是在其他内容平台完成内容或商品的了解，电商平台的工具属性越来越强。

比如传统搜索一般只能满足结构化的用户需求，如通过具体的品牌词或者品类词进行搜索，对于一些需求量大的偏口话化表达的用户需求难以承接。此外，对于用户来说，传统搜索路径一般包括：输入关键词，然后浏览商品，然后不断的改写关键词来重新搜索，整个交互过程是不连续的，导致通过电商平台的搜索体验较差。

为了解决上述问题，本申请实施例提供一种交互信息处理方案，根据用户的初始输入信息，在交互界面展示对应的需求提示信息，以使用户根据提示对自己的需求进一步描述，并输入回复信息，结合用户的初始输入信息以及用户根据需求提示的回复信息，分析上下文，确定用户真实的目标需求类型，进而向用户返回符合目标需求类型的推荐信息，如此，给用户带来全新的对话交互式搜索体验，通过对话式交互沟通，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

如图3A所示，为本申请一实施例的交互信息处理系统的架构流程示意图，以电商场景中买家用户通过电商平台进行信息搜索的场景为例，其中：

买家用户通过终端221录入初始输入信息，服务器210根据初始输入信息返回对应的需求提示信息，在终端的交互界面展示对应的需求提示信息，用户可以针对需求提示进行交互回复，交互过程可以为多次，服务器210基于大语言模型的能力，结合用户的回复信息和初始输入信息进行上下文分析，确定用户真实的目标需求类型，进而向用户终端221返回符合用户真实需求的推荐信息，如此，给用户带来全新的对话交互式搜索体验，通过对话式交互沟通，引导用户描述自己真实的意图，在电商购物场景下，能够给不知道怎么描述自己的需求以及不知道怎么挑选商品的用户提供个性化的购物推荐建议。不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

如图3B所示，为本申请一实施例的交互信息处理系统的架构示意图，以电商搜索场景为例，包括在线和离线两部分，其中：

在线部分：部署搜索前端、在线LLM模型、查询(query)理解模块、知识引擎和安全管控模块，其中：

用户通过搜索前端输入：对话query，搜索前端将对话query传递给查询理解模块，集合LLM模型进行用户意图理解，查询理解模块输入如下内容给知识引擎：1.用户query。2.上下文增强信息。

知识引擎包括：商品搜索引擎、榜单引擎和商品引擎(店铺)，知识引擎将搜索到的信息进行卡片封装后返回给搜索前端。

搜索前端向用户输出：图文内容+商品卡片。

安全管控包括：电商运营干预模块和风险数据中台，用于对这个交互数据处理过程进行信息安全管控，保证信息安全性。

离线部分：部署有标注数据、通用LLM大模型、微调LLM大模型和基础数据，其中：

基础数据包括大规模购物数据，比如可以包括电商客户端内的“搜索、首猜”等模块的数据，其中首猜是指电商的首页中配置的一种与用户答题交互的功能。另外也可以包括电商客户端外的数据，比如微博等其他社交平台的购物数据。基础数据可以为在线部分的知识引擎提供相关数据。

标注数据包括人工标注的高质量数据，比如商品结构化数据、导购内容数据和多轮对话语料等数据。通过基础数据的大规模训练，结合标注数据的RLHF处理，可以得到LLM模型。

于一实施例中，LLM模型的基本推理机制可以如下：

1、预处理文本：输入文本需要进行预处理。

2、输入编码：将经过预处理的文本输入到神经网络中进行编码处理，可以使用多层transformer编码器结构。

3、预测输出：LLM模型通过对输入进行逐个token预测，输出下一个最可能出现的token序列，具体可以使用softmax函数进行概率预测。

4、输出解码：LLM模型将预测的token序列作为输入，经过多层transformer解码器结构进行解码处理，最终输出模型的回答。

5、重复步骤3和4：LLM在处理输入时会持续输出预测的token序列，直到遇到停止符号或达到设定的最大输出长度为止。

于一实施例中，LLM模型的底座选取，可以经过公开数据集评测各个底座模型在知识问答、推理、中英文、学科百科等方面的能力，选取合适的模型底座，比如可以选取开源Qwen-14b(一款支持多种语言的高性能开源模型)作为模型底座。

于一实施例中，基础数据模块包括业务语料收集，可以在电商客户端端内会话日志挖掘电商领域种子问题，明确场景问题定义，通过电商平台核心query、种子问题等，设计对应的模型提示词prompt，通过GPT补充收集问题。另外标注数据模块，可以通过人工标注少量高质量语料，运用self-instruction(自生成指令框架)技术，通过prompt的few-shot(小样本学习)方法根据已有人工标注扩充新的instruction(指令)。通过GPT获取更多训练语料，解决标注人效瓶颈。

于一实施例中，关于LLM模型训练，可以基于Qwen-14b模型底座，业务语料和通用语料共同作为训练语料，使用bf16(一种为深度学习而优化的新数字格式)精度进行SFT训练，提升训练吞吐量。SFT训练可以使用有标签的训练预料来调整一个已预训练好的语言模型(LLM)，使其更适应某一特定任务。通常LLM的预训练是无监督的，但微调过程往往是有监督的。当进行有监督微调时，LLM模型权重会根据与训练预料中真实标签的差异进行调整。通过这个微调过程，模型能够捕捉到标签数据中特定于某一任务的模式和特点。使得模型更加精确，更好地适应某一特定任务。

因此采用SFT微调，可以引入角色个性化语料，比如品牌、品类、店铺等知识，通过self-instruction方法补充高质量业务语料进一步SFT微调，提升模型电商领域知识。通用LLM大模型经过微调后，得到微调LLM大模型。微调LLM大模型效果既要保证模型原有的知识回复能力，减少遗忘性，也能学到电商业务相关的知识。

于一实施例中，LLM模型部署支持8k tokens(token可以被理解为文本中的最小单位，在语言模型中，每一个token约可以写1个英文字)上下文，使用flash-attention(一种重新排序注意力计算的算法)技术，提升模型推理速度。上述交互信息处理系统，基于Qwen-14b的LLM模型底座微调，探索构建大语言模型与知识库、知识搜索引擎、商品检索引擎结合的工具运用能力，提升对电商知识理解能力。以LLM大语言模型为底座，基于业务场景prompt设计，优化对用户偏口语化表达的需求理解，以文本融合导购卡的产品方式满足用户购物诉求，缩短用户导购步骤。

下面结合附图，对本申请的一些实施方式作详细说明。在各实施例之间不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。另外，下述各方法实施例中的步骤时序仅为一种举例，而非严格限定。

请参看图4，其为本申请一实施例的交互信息处理方法，该方法可由图1所示的电子设备1来执行，并可以应用于图2-图3B中所示的信息搜索的应用场景中，以实现通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。本实施例以终端220为执行端为例，该方法包括如下步骤：

步骤401：响应于用户的初始输入信息，展示基于初始输入信息确定的需求提示信息。

在本步骤中，用户可以是发起交互式搜索的用户，比如电商场景的买家用户。初始输入信息可以是用户通过电商客户端录入的第一个搜索需求表达信息，需求表达信息可以采用询问的方式描述，比如电商场景，用户想要在端午节送亲友礼物，但是不知道送什么好，就可以在录入第一个搜索需求表达：“端午节送什么礼物好呢？”或者“端午节除了送粽子还有什么合适的礼物送亲友？”，这种询问信息就是初始输入信息。响应于用户的初始输入，可以展示与初始输入信息匹配的需求提示信息。此处需求提示信息是与初始输入信息相关联的提示信息，用于引导用户进一步清楚的描述自己的搜索需求。需求提示信息也可以采用询问的方式展示，以前述电商场景为例，比如需求提示信息可以包括“请告诉我，礼物要送给谁呢？”，提示用户对询问进行回答，进一步清楚用户送礼物的对象，如此，采用聊天沟通的方式给用户提供交互式搜索体验。

于一实施例中，步骤401中响应于用户的初始输入信息，可以包括：响应于用户在交互界面的录入信息，获取与录入信息匹配的候选需求信息。响应于用户对候选需求信息的选定指令，将选定指令对应的需求信息确定为初始输入信息。

在本实施例中，用户可以通过交互界面录入信息，录入信息可以采用文字、语音等形式，用户录入信息的过程中，可以实时检测用户的录入信息，并根据录入信息实时展示与录入信息匹配的候选需求信息，候选需求信息不仅内容上与用户的录入信息匹配，而且形式上更加符合标准语句的表达方式，进而可以对用户的录入信息进行改错纠正，用户可以从候选需求信息中选一个作为自己的初始输入信息，如此可以保证用户的初始输入信息具备标准的句式，减少错误描述，提高后续语言处理的准确性。

如图5所示，为本申请实施例提供的一种交互式搜索页面交互示意图，以电商场景为例，用户可以在电商平台搜索“购物助理”或者其他预设名称进入如图5中(a)所示的交互式搜索的服务首页，可以在交互式搜索的服务首页，配置录入框，如图5中(a)所示，录入框上可以展示提示信息“在这里输入你的问题”等提示语，便于用户手动录入需要咨询的问题。

于一实施例中，服务页面中还可以配置其他服务的入口，比如“盯降价”服务功能的入口、“找优惠”服务功能的入口、“和商家讲价”服务功能的入口，多种服务功能入口集中展示，可以便于用户灵活选择。另外可以配置虚拟形象，以虚拟形象的口吻展示系统提示语，比如提示语“我是你的购物助理”，让用户有一种沉浸式对话的体验感。

如图5中(b)所示，比如用户在录入框内录入信息为“如何买空调”，获取到与该录入信息匹配的候选需求信息可以包括两个候选问题：1.立式空调和挂机空调哪个更好？2.大家都在买的客厅立式空调？用户可以从中选择与自己需求更加贴切的一个问题作为自己初始输入信息，避免手动输入的繁琐，提高交互体验。用户也可以不在候选需求信息中选择，而是自己手动输入要询问的问题。

于一实施例中，系统提供的虚拟形象还可以提示用户其他服务功能，比如以虚拟形象的口吻提示“除了帮你跟商家讲价，我还可以帮你盯降价哦”，提示用户还有其他的功能可以使用，让用户及时了解服务功能信息，按需选择使用。

于一实施例中，步骤401中，基于初始输入信息确定需求提示信息，包括：将初始输入信息输入预设大语言模型，预设大语言模型用于抽取初始输入信息中包含的需求关键词，根据需求关键词和预设提示词，确定与需求关键词相关的需求提示信息。

在本实施例中，可以将用户初始输入信息输入预设大语言模型，比如图3B中所示的LLM模型，采用预设大语言模型充分理解上下文意图，抽取初始输入信息中的需求关键词，结合定制化prompt(预设提示词)，来确定该需求提示词应该给出什么样的需求提示信息，此处需求提示信息可以采用询问句的方式呈现，以使用户可以给予提示的问题回答相关需求信息，模拟对话式的提示，增强用户体验感。

于一实施例中，预设大语言模型是通过对预训练的大语言模型进行有监督微调后得到的。

在本实施例中，预训练的大语言模型以LLM模型为例，由于通用LLM模型可能无法充分理解不同场景的知识，直接使用通用LLM模型可能无法准确输出需求提示信息。以电商场景为例，实际场景中当用户购物需求不明确时，希望LLM给出用户一些引导问题(即需求提示信息)，帮助用户更精准的找到想要购买的商品。比如用户query(初始输入信息)：“春节买点礼物送人”，如果不进行模型微调，LLM可能简单地回答：“尝试买点补品或糖果送人”。然而一个好的回答应该是充分明确用户意图，给出推荐商品以及专业的导购意见。因此在使用预设大语言模型之前，可以先对预训练的通用LLM模型进行有关的SFT微调训练，让大语言模型能够学习到在电商场景如何给出准确的需求提示信息。

经过有监督微调后，LLM可以提供更加符合特定指导原则的答案。如“春节买点礼物送人”，可以设定一个反问提示的环节，帮助更好的理解用户意图。如询问送礼对象(亲人，好友，同事等)，预算范围(500元左右，2000元以上等)，能够更加精准的找到适合推荐的商品范围，减少用户选购的困惑。这时候，有监督的微调就显得尤为重要。

以电商场景为例，对LLM模型的SFT微调过程可以包括：预设提示词prompt设计、收集问题-答案对作为训练语料、模型训练等内容，具体过程举例如下：

1)预设提示词prompt设计：当用户购物需求不明确时，反问1-3个必要、且高质量的问题，收集更多的商品需求条件。prompt中可以有3个要素：a)需要明确任务需求，作为指令描述在prompt中；b)需要举1-3个例子(few-shots，少样本)，让LLM模型知道什么样的结果才是符合预期的；c)包含上下文对话历史拼接在prompt中，让LLM知道上下文对话场景是什么。

2)根据1中的预设提示词prompt收集问题-答案对作为训练语料，SFT的每一条样本一般可以包括两部分：提示词样本prompt(instruction)+答案样本answer，其中instruction表示指令。举例SFT的一条样本可以如下：

提示词样本prompt可以如下：

instruction＝”'任务背景：用户购物需求不明确时，导购人员难以从海量商品库中找到匹配商品，通常需要反问逐步明确用户需求。

任务定义：你需要帮助导购人员，产出最应该要反问的内容。

请按下面步骤一步一步执行：

步骤1：请理解用户意图，如果用户有选购/购买/搭配等问题，请继续执行步骤2，如果与选购/购买/搭配等问题无关请跳转到步骤4。

步骤2：请抽取用户query(初始输入信息)中购物需求关键词，根据下述**反问必要性**的说明，判断是否有必要反问，有必要请继续执行步骤3，否则请跳转到步骤4。

步骤3：当用户购物需求不明确，请产出1到3个必要的、高质量的反问，问题尽可能差异化，层层递进，不要涉及品牌相关问题。请注意以下3个要点：

a)请不要明知故问

b)请优先反问**最必要**的问题

c)请优先反问**高质量**的问题

d)请避免反问**不必要**的问题

步骤4：返回结果输出json格式

关于

**反问必要性**的说明：

*当用户购物需求中明确了商品品牌型号的时候，则不必要反问；

*当用户的购物需求带有明显的价格带信息或者某个明星的同款信息时，则不必要反问；

*当用户的购物需求是带有限定词的品牌推荐时，则不必要反问；

*当用户的购物需求目的是为了送礼，可以继续反问；

**高质量反问**的说明：

*高质量反问必须是简洁明确的反问，不要一个句子中包含多个问题，不要对问题进行补充说明和举例；

*高质量反问是最必要的反问，有机会将用户购物需求缩小到最小范围内；

*高质量反问是关于用户最关心、最影响用户选购决策的反问；

*高质量反问不要通过例如、比如等去举例，不要询问身高、体重和胸围等用户隐私问题；

**不必要问题**说明：

*禁止提问品牌相关问题，除非品牌是重要因素；

*禁止提问价格相关问题，除非价格是重要因素；

*禁止提问性别相关问题，除非性别男女是重要因素；

*任务是定位商品，禁止提问比商品粒度更细的SKU相关的问题；

*禁止举例；

*禁止明知顾问，禁止提问用户已明确的商品、品牌、品类范围；

SFT的样本还可以定输出json格式的具体样式，给出可以参考的样例，供大语言模型请参照样例学习输出格式。

以“送礼”为需求关键词为例，样本答案answer可以如下：

候选1反问问题:请问您的送礼对象是谁呢？

候选2反问问题:请问您的送礼预算是多少？

候选3反问问题:请问您想要送什么类型的礼物呢？3)收集训练语料：通过收集的一些种子问题，经过gpt4接口批量获取或人工生产一批问答对。叠加一部分通用语料，可保证模型在训练拟合业务知识的同时，保留模型基础能力，不至于过拟合。

4)模型训练：希望模型关注answer部分的预测，这可以通过生成一个mask(掩膜)向量来屏蔽不希望计算loss(损失)的部分。举例示意如下：

通过拼接prompt和answer，并在answer两侧添加一个开始和结束的符号，计算prompt/instruction的长度，以及后面需要pad(padding，填充)的长度，然后根据计算出来的长度生成一个mask向量。可以预先配置answer部分为1，其他部分为0。构造好输入后，token转为embedding(向量化)，经过transformer的过程可以与LLM模型预训练时完全一样，可以得到输出，进一步就可以计算answer部分的loss了，通过mask把不希望考虑的地方乘以0，保留answer部分loss。有了loss之后，进行反向传播更新模型参数，达到指定epoch(训练轮次)完成迭代，更新模型参数完成，生成微调后的预设大语言模型文件。

于一实施例中，在步骤401中展示基于初始输入信息确定的需求提示信息之前，还包括：响应于用户的初始输入信息，根据初始输入信息在预设知识库中搜索。若在预设知识库中搜索到与初始输入信息匹配的预设答复信息，根据预设答复信息返回对应的推荐信息给用户。若在预设知识库中未搜索到与初始输入信息匹配的预设答复信息，执行展示基于初始输入信息确定的需求提示信息的步骤。

在本实施例中，预设知识库中配置了不同场景下用户可能会询问的问题以及对应的答案，以电商场景为例，预设知识库可以是电商运营根据电商平台的购物数据，统计出来的用户经常会问到的问题，以及相关的答案，形成问题-答案对，问题-答案对可以采用向量的形式存储在预设知识库中，比如LLM大模型与知识库结合，将运营干预的问题-答案对向量化处理存入知识库。在给用户提示之前可以先将用户的初始输入信息在预设知识库中进行搜索，比如采用初始输入信息的向量进行搜索，如果能够搜索到匹配的预设问题-答案对，则说明用户的初始输入信息已经预先配置了预设答复信息，可以根据该预设答复信息给用户返回推荐信息，如此快速给用户搜索结果反馈，不再需要后续的交互沟通，提高搜索效率。

如果在预设知识库中搜索无结果，可以执行步骤401中的展示基于初始输入信息确定的需求提示信息的步骤，以便于与用户进行沟通交互。

如图6所示，为本申请实施例提供的一种推荐信息展示页面示意图，假设用户的初始输入信息为“如何自制面膜？”，该问题在预设知识库中存在匹配的问题-答案对，可以直接返回对应的答案作为推荐信息，如下：

“以下是自制面膜的步骤：

1.选择适合自己肤质的面膜配方：不同肤质适合不同的面膜，如油性皮肤适合使用收缩毛孔的面膜，干性皮肤则需要滋润保湿面膜。面部，避开眼部和嘴部，均匀涂抹即可。

2.放松心情：等待面膜在面部停留一段时间，按照面膜配方的要求，通常为10-20分钟。

3.清洗面部：用温水洗掉面膜，最后用冷水冲洗面部。

总之，放松心情并享受其中是最重要的！”

另外，可以在推荐信息展示页面中配置“重新提问”按钮，便于用户重新录入提问信息。还可以配置用户评价按钮，并配置提示信息“我会努力成长”，提供用户可以对本次推荐信息进行评价，协助大模型改进。用户也可以直接通过页面下方录入框(向我提问)直接录入需要提问的内容。

于一实施例中，前述根据预设答复信息返回对应的推荐信息给用户，具体包括：根据预设答复信息生成预设大语言模型的提示词，以使预设大语言模型对预设答复信息总结后输出推荐信息。返回推荐信息给用户。

在本实施例中，如果在预设知识库中经过向量检索后，存在与初始输入信息匹配的预设答复信息，可以根据预设答复信息生成预设大语言模型的提示词prompt，与初始输入信息匹配的预设答复信息可以为多个，可以按照与初始输入信息的匹配度从大到小排序，选取排在前预设名次的预设答复信息填入prompt模板中，生成预设大语言模型的提示词，以使预设大语言模型对预设答复信息总结后输出推荐信息，并返回推荐信息给用户。检索出来的预设答复信息可能表达上不连贯，经过预设大语言模型总结后，可以生成更加符合自然聊天对话场景的推荐信息，提高用户交互体验。

在可选实施例中，预设大语言模型是通过对预训练的大语言模型进行有监督微调后得到的。具体微调过程可以参见前述实施例的描述，此处不再赘述。

于一实施例中，步骤401中在展示基于初始输入信息确定的需求提示信息之前，还包括：判断初始输入信息是否包括预设需求类型。若初始输入信息包括预设需求类型，将预设需求类型确定为用户的目标需求类型。若初始输入信息不包括预设需求类型，执行展示基于初始输入信息确定的需求提示信息的步骤。

在本实施例中，在给用户发需求提示之前，可以基于大语言模型对用户的初始输入信息进行识别，识别初始输入信息是否已经精准的表达了用户的搜索意图，比如可以判断初始输入信息是否包括预设需求类型。预设需求类型是已经明确了用户实际意图的需求类型，比如对某种商品的搜索意图、对某个店铺的搜索意图、或者对某种知识内容的搜索需求。若初始输入信息包括预设需求类型，说明初始输入信息已经能够精准表达用户的实际需求，则将预设需求类型确定为用户的目标需求类型。若初始输入信息不包括预设需求类型，说明初始输入信息不能精准表达用户的实际需求，则需要执行步骤401中的展示基于初始输入信息确定的需求提示信息的步骤，进一步与用户沟通，结合沟通上下文判定用户实际需求。

步骤402：获取用户基于需求提示信息输入的回复信息。

在本步骤中，在展示给用户需求提示信息后，用户可以根据提示再次描述自己的实际搜索需求，回复信息中携带用户针对需求提示信息的答复内容，可以协助进一步识别用户的真实需求。

于一实施例中，需求提示信息包括预设次数发出的需求提示。步骤402具体可以包括：响应于用户对已发出需求提示的第一回复信息，根据第一回复信息再次发出需求提示，直至获取到用户对预设次数的需求提示的回复信息。

在本实施例中，预设次数是指大语言模型向用户发出需求提示信息的次数，可以给予实际需求设定，比如可以为3次，表示对用户进行3轮的需求提示交互，进而收集3轮交互中的回复信息。向用户提供多轮需求提示，可以提高意图识别结果的准确性。

需求提示信息可以包括针对初始输入信息设定的问题和对应的候选答案，比如初始输入信息中表达了用户想要送礼物，需求提示信息可以包括询问礼物接收对象、询问接收对象的兴趣爱好。

如图7所示，为本申请实施例提供的一种具体场景的交互搜索流程示意图，其中图7中(a)和(b)为需求提示信息展示示意图，假设预设次数为2，图7中(a)中为第一次需求提示，可以采用虚拟形象的口吻向用户提示“可以告诉我具体送礼物对象”，并剔除问题“没问题，请告诉我，礼物送给谁呢？”，并在候选框内给出候选答案如“老婆、长辈、朋友”，当然用户也可以直接手动录入送礼物的对象。如果用户选择礼物送给“老婆”，进入图7中(b)所示的第二次需求提示页面，提示用户“可以告诉我她的兴趣爱好”，并提出问题“你的老婆是个什么样的仙女？”，在候选框中给出候选答案如“爱美妆、设计师、爱咖啡……”，当然用户也可以直接手动录入送礼物对象的具体兴趣爱好。如果用户选择“爱美妆”，则可以将这两次问题用户选择的答案作为用户的回复信息。

于一实施例中，如果初始输入信息中表达了用户想要买冰箱，则需求提示信息可以包括询问冰箱的规格尺寸、询问用户对冰箱的预算等问题。具体场景可以设定符合业务需求的需求提示信息。

步骤403：根据回复信息和初始输入信息，确定用户的目标需求类型。

在本步骤中，结合用户初始输入信息以及用户对需求提示信息的回复信息，分析与用户交互的上下文，确定用户真实的搜索需求，进而向用户返回符合真实需求的推荐信息，如此，给用户带来全新的对话交互式搜索体验，不仅减少搜索过程对用户专业知识的要求，而且提高推荐结果的准确性。

于一实施例中，步骤403具体可以包括：将回复信息和初始输入信息输入预设大语言模型，以使预设大语言模型根据预设提示词对回复信息和初始输入信息进行上下文分析推理，输出用户的目标需求类型。

在本实施例中，可以将用户初始输入信息以及用户对需求提示信息的回复信息输入预设大语言模型，比如图3B中所示的LLM模型，采用大语言模型充分理解上下文意图，结合定制化prompt(预设提示词)，精准的生成用户的目标需求类型。在可选实施例中，预设大语言模型是通过对预训练的大语言模型进行有监督微调后得到的。具体微调过程可以参见前述实施例的描述，此处不再赘述。

其中预设提示词是指可以根据业务需求定制化的prompt，以电商场景为例，基于定制化prompt可以使大语言模型在微调训练后，具备角色风格话术回复、收敛提问、推荐理由、导购卡检索词等业务算法能力，以及知识库归纳、生成式聊天、格式输出、关键词生成等通用算法能力。结合prompt设计，挖掘大模型理解、指令遵循、格式化输出能力，满足业务诉求。

关于上下文分析，大语言模型在位置编码、FFN(Feedforward Neural Network，前馈神经网络)激活函数和normalization(归一化)的实现方式上，LLM模型支持上下文8ktoken长度，并使用flash-attention技术，提升模型推理速度。

于一实施例中，目标需求类型包括目标物品品类、目标店铺类型、目标榜单数据、目标知识内容中的一个或多个。

在本实施例中，目标需求类型是指用户的真实搜索意图所属的类型，包含但不限于目标物品品类、目标店铺类型、目标榜单数据、目标知识内容。也就是说，大语言模型可以根据与用户的多轮交互沟通，对用户的真实搜索意图进行分类，以便于针对不同意图类别进行针对性的搜索过程，提高搜索准确度。

步骤404：根据目标需求类型返回对应的推荐信息给用户。

在本步骤中，确定了用户的真实搜索意图后，可以针对不同意图类别进行针对性的搜索过程，获得对应的推荐信息，并将推荐信息返回给用户。

于一实施例中，步骤404具体可以包括：确定目标需求类型匹配的目标搜索引擎。基于目标搜索引擎获取与目标需求类型匹配的搜索结果信息。根据搜索结果信息返回对应的推荐信息给用户。

在本实施例中，可以预先构建大语言模型与不同知识库或者不同搜索引擎之间的接口能力，确定了用户的真实搜索意图后，确定与用户真实搜索意图类型匹配的目标搜索引擎，然后通过目标搜索引擎获取与真实搜索意图匹配的搜索结果信息。比如预设的搜索引擎可以包括运营知识库、知识搜索引擎、商品检索引擎、电商平台以外的搜索引擎等等，假设用户的目标需求类型是对某个确定商品的搜索意图，则可以直接调用该商品所属的目标搜索引擎进行搜索，返回该商品的搜索结果信息。实现了构建大语言模型与知识库、知识搜索引擎、商品检索引擎结合能力，运用langchain框架思想，通过检索增强方案补充大模型缺乏时效性高的知识短板。

比如LLM模型与电商主搜引擎、店铺引擎等结合，LLM模型充分理解上下文意图，结合定制化prompt，生成搜索关键词、品牌词、类目词，以提升检索效果。

比如LLM与夸克搜索引擎结合，对于目标需求类型为天气、新品发布、新闻等时效性高的问题，引入外部夸克检索，实现了通过检索增强方案补充大模型缺乏时效性高的知识短板。

于一实施例中，根据搜索结果信息返回对应的推荐信息给用户，包括：若搜索结果信息包括目标对象的预设信息卡，根据目标对象的标题生成对目标对象的描述文本，将预设信息卡和/或描述文本作为推荐信息返回给用户。

在本实施例中，目标对象是指用户要搜索的对象，比如可以是某一类商品或店铺。预设信息卡是指预先给目标对象配置好的信息展示卡，比如电商场景中的商品信息卡、店铺信息卡、榜单信息卡等。预设信息卡中会包含目标对象的基本信息介绍，比如商品信息卡会包含商品名称、标题、商品主图以及商品链接等信息，榜单信息卡中可以包括某类商品的排行榜信息。如果基于用户真实意图搜索出来的搜索结果中包含某个商品A的商品信息卡，则可以根据商品标题生成对该商品A的描述文本，此处描述文本可以用于表达推荐理由。可以基于大语言模型来生成商品A的描述文本，将商品A的信息卡和推荐理由一起作为推荐信息返回给用户，以使用推荐信息更加直观，提高交互体验。

如图7所示，根据图7中(a)和(b)所示的提示信息，获取到用户的回复信息，假设结合回复信息确定用户实际意图是要给爱美妆的老婆送礼物，可以推荐“香水”这种商品，LLM模型与电商主搜引擎结合，经过搜索后，得到搜索结果信息中包括香水1的信息卡和商品2的信息卡，可以基于大语言模型来生成香水1和香水2的推荐理由，比如“凸显甜美”。香水1与香水2的推荐理由可以相同也可以不同。然后将推荐理由与香水1、香水2的信息卡一起作为推荐信息展示在如图7中(c)所示的用户界面。用户可以从中选取自己喜欢的香水信息卡进行购买，比如用户点击香水2的信息卡，跳转到图7中(d)所示的香水2的商品详情页，进行购买。

如图8A所示，假设结合回复信息确定用户实际意图是要搜索的“香水”这种商品的榜单，如果搜索结果信息中包括榜单信息卡“小众香水热销榜单”，可以直接将该榜单信息卡在推荐信息展示页面中展示，榜单信息卡包括排名信息，比如排名1的香水1、排名2的香水2等等。

如果未能搜索到榜单信息，可以基于大语言模型根据用户的回复信息生成对应的推荐信息给用户。

于一实施例中，有时候即使经过与用户多轮次交互沟通后，用户的实际需求依然是模糊的，比如只能确定用户想要搜素商品或者店铺，但是具体是什么类型的商品或店铺，并不清楚，次吃可以将用户意图归为“泛商品推荐需求”类别，基于大语言模型为用户生成推荐信息，推荐信息可以结合商品信息卡、店铺信息卡以及推荐理由等信息，尽量为用户提供有效的推荐信息。

于一实施例中，根据搜索结果信息返回对应的推荐信息给用户，还可以包括：若搜索结果信息中不存在目标对象的预设信息卡，根据搜索结果信息生成预设大语言模型的提示词，以使预设大语言模型对搜索结果信息总结后输出推荐信息。返回推荐信息给用户。

在本实施例中，如果搜索结果信息中不存在目标对象的预设信息卡，比如用户意图是商品对比、询问生活小技巧等知识内容类搜，搜索结果中可能包含一些知识文本，不是像商品、店铺这样的信息卡，如图6所示的“如何自制面膜？”的搜索结果就是纯文本形式，则可以采用大模型对搜索结果进行总结后答复，以使推荐信息更加人性化，提高交互体验。在可选实施例中，预设大语言模型是通过对预训练的大语言模型进行有监督微调后得到的。具体微调过程可以参见前述实施例的描述，此处不再赘述。

在可选实施例中，如果用户意图是对天气、新品发布、新闻等问题进行搜索，对于这类时效性高的问题，引入外部夸克搜索引擎检索，LLM模型与夸克搜索引擎结合，将用户输入的问题以及交互中对问题的回复信息处理改写后，通过夸克搜索引擎获取TopK(排名前K，其中K为自然数)检索结果进行解析，将TopK检索结果填入prompt模板中，由大模型进行总结回答，弥补模型的时效局限性。

于一实施例中，在返回推荐信息给用户之前，还包括：标记推荐信息中包含的预设关键词。在返回推荐信息给用户之后，还包括：将推荐信息中包含的预设关键词突出显示。响应于用户对预设关键词的确定指令，跳转到基于预设关键词的搜索结果页面。

在本实施例中，在确定了推荐信息后，可以查看推荐信息中是否包含预设关键词，预设关键词比如电商场景中的商品名称、商品型号、商品种类、店铺名称等，可以结合电商数据库对推荐信息进行预设关键词识别并标记，在返回推荐信息给用户之后，将推荐信息中包含的预设关键词突出显示，比如在推荐信息展示页面高亮显示预设关键词。预设关键词可以配置搜索入口，如果用户点击高亮显示的预设关键词，可以跳转到以该预设关键词搜索出来的结果页面，供用户参考。

于一实施例中，用户的目标需求类型也可以是开放式聊天，如图8B所示，比如用户输入问题“帮我规划一个3天的杭州旅行计划”，经过大语言模型对搜索结果总结后，可以返回如下推荐信息：

“当然可以！以下是我为您准备的杭州三天旅行计划：

第一天：

上午：游览西湖，欣赏美丽的风景，并且可以参观西湖十景之一的雷峰塔。

中午：在西湖周边品尝杭州传统美食，如东坡肉、叫花鸡等。

下午：参观南宋御街，了解杭州的历史文化。

晚上：前往西湖音乐喷泉观赏喷泉表演。

第二天：

上午：参观灵隐寺，体验佛教文化。

中午：在附近品尝杭州特色小吃，如叫化童子鸡、片儿川面等。

下午：游览千岛湖，欣赏美丽的湖景。晚上：返回市区，在市中心品尝杭州特色美食，如葱包桧、猫耳朵等。

第三天……”

并可以提示用户“如果不满意的话，可以告诉我你的需求哦～”，便于用户修正自己的实际需求。

于一实施例中，也可以预设配置大量不同应用场景问题，加以泛化，离线通过大模型生成对应的答案，或者通过人工配置对应的答案，形成问题-答案对，存储在知识库内。在用户搜索阶段，在线通过向量化检索知识库中的离线数据，选取TopK作为输出的推荐信息给用户。

上述交互信息处理方法，根据用户的初始输入信息，在交互界面展示对应的需求提示信息，以使用户根据提示对自己的需求进一步描述，并输入回复信息，结合用户的初始输入信息以及用户根据需求提示的回复信息，分析上下文，确定用户真实的目标需求类型，进而向用户返回符合目标需求类型的推荐信息，如此，给用户带来全新的对话交互式搜索体验，通过对话式交互沟通，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。

请参看图9，其为本申请一实施例的交互信息处理方法，该方法可由图1所示的电子设备1来执行，并可以应用于图2-图3B中所示的信息搜索的应用场景中，以实现通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。本实施例以终端220为执行端为例，该方法包括如下步骤：

步骤901：响应于用户在交互界面的录入信息，获取与录入信息匹配的候选需求信息。

步骤902：响应于用户对候选需求信息的选定指令，将选定指令对应的需求信息确定为初始输入信息。

步骤903：响应于用户的初始输入信息，根据初始输入信息在预设知识库中搜索。有结果进入步骤904，无结果进入步骤905。

步骤904：若在预设知识库中搜索到与初始输入信息匹配的预设答复信息，根据预设答复信息生成预设大语言模型的提示词，以使预设大语言模型对预设答复信息总结后输出推荐信息。然后进入步骤913。

步骤905：若在预设知识库中未搜索到与初始输入信息匹配的预设答复信息，判断初始输入信息是否包括预设需求类型。若是，进入步骤906，否则进入步骤907。

步骤906：若初始输入信息包括预设需求类型，将预设需求类型确定为用户的目标需求类型。然后进入步骤910。

步骤907：若初始输入信息不包括预设需求类型，展示初始输入信息对应的第一个需求提示问题。

步骤908：响应于用户对第一个需求提示问题的第一回复信息，根据第一回复信息再次发出第二个需求提示问题，直至获取到用户对预设次数的需求提示问题的回复信息。大语言模型确定需求收敛因子，比如用户送礼物对象是谁？用户预算多少等等。

步骤909：将回复信息和初始输入信息输入预设大语言模型，以使预设大语言模型根据预设提示词对回复信息和初始输入信息进行上下文分析推理，输出用户的目标需求类型。

步骤910：确定目标需求类型匹配的目标搜索引擎，基于目标搜索引擎获取与目标需求类型匹配的搜索结果信息。

步骤911：若搜索结果信息包括目标对象的预设信息卡，根据目标对象的标题生成对目标对象的描述文本，将预设信息卡和/或描述文本作为推荐信息返回给用户。

步骤912：若搜索结果信息中不存在目标对象的预设信息卡，根据搜索结果信息生成预设大语言模型的提示词，以使预设大语言模型对搜索结果信息总结后输出推荐信息。

步骤913：返回推荐信息给用户。

上述交互信息处理方法的各个步骤，详细可以参阅上述实施例的相关描述，此处不再赘述。

请参看图10，其为本申请一实施例的交互信息处理方法，该方法可由图1所示的电子设备1来执行，并可以应用于图2-图3B中所示的信息搜索的应用场景中，以实现通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。本实施例以终端220为执行端为例，与前述实施例相比，本实施例以电商场景为用户提供关于商品或店铺的交互式搜索为例，该方法包括如下步骤：

步骤1001：响应于用户输入的初始问题信息，展示基于初始问题信息确定的相关商品和/或相关店铺的询问信息。

在本步骤中，询问信息可以包括询问商品的适用对象、询问适用对象的兴趣爱好，询问用户预算，询问对商品规格尺寸的要求等等。

步骤1002：获取用户基于询问信息输入的回复信息。

步骤1003：根据回复信息和初始问题信息，确定用户关注的目标商品和/或目标店铺。

步骤1004：根据目标商品和/或目标店铺返回对应的推荐信息给用户。

上述交互信息处理方法，利用大模型的语义理解能力，承接用户用自然语言来表达的需求，给用户带来全新的对话交互式搜索体验。同时，利用大模型的全网知识学习，丰富电商领域知识及趋势洞察，以及基于对用户历史行为、多轮自然语言输入等信息的分析，形成电商领域专业的、懂用户的AI导购员，提高交互体验。

请参看图11，其为本申请一实施例的交互信息处理装置1100，该装置可应用于图1所示的电子设备1，并可以应用于图2-图3B中所示的信息搜索的应用场景中，以实现通过交互式沟通搜索，引导用户描述自己真实的意图，不仅提高推荐结果的准确性，而且减少搜索过程对用户专业知识的要求，提高交互体验。该装置包括：展示模块1101、获取模块1102、确定模块1103和返回模块1104，各个模块的功能原理如下：

展示模块1101，用于响应于用户的初始输入信息，展示基于初始输入信息确定的需求提示信息。

获取模块1102，用于获取用户基于需求提示信息输入的回复信息。

确定模块1103，用于根据回复信息和初始输入信息，确定用户的目标需求类型。

返回模块1104，用于根据目标需求类型返回对应的推荐信息给用户。

于一实施例中，还包括：响应模块，用于响应于用户在交互界面的录入信息，获取与录入信息匹配的候选需求信息。响应于用户对候选需求信息的选定指令，将选定指令对应的需求信息确定为初始输入信息。

于一实施例中，还包括：搜索模块，用于在展示基于初始输入信息确定的需求提示信息之前，响应于用户的初始输入信息，根据初始输入信息在预设知识库中搜索。若在预设知识库中搜索到与初始输入信息匹配的预设答复信息，根据预设答复信息返回对应的推荐信息给用户。若在预设知识库中未搜索到与初始输入信息匹配的预设答复信息，指示展示模块1101执行展示基于初始输入信息确定的需求提示信息的步骤。

于一实施例中，搜索模块，还用于根据预设答复信息生成预设大语言模型的提示词，以使预设大语言模型对预设答复信息总结后输出推荐信息。返回推荐信息给用户。

于一实施例中，还包括：判断模块，用于在展示基于初始输入信息确定的需求提示信息之前，判断初始输入信息是否包括预设需求类型。若初始输入信息包括预设需求类型，将预设需求类型确定为用户的目标需求类型。若初始输入信息不包括预设需求类型，指示展示模块1101执行展示基于初始输入信息确定的需求提示信息的步骤。

于一实施例中，需求提示信息包括预设次数发出的需求提示。获取模块1102，用于响应于用户对已发出需求提示的第一回复信息，根据第一回复信息再次发出需求提示，直至获取到用户对预设次数的需求提示的回复信息。

于一实施例中，确定模块1103，用于将回复信息和初始输入信息输入预设大语言模型，以使预设大语言模型根据预设提示词对回复信息和初始输入信息进行上下文分析推理，输出用户的目标需求类型。

于一实施例中，返回模块1104，用于确定目标需求类型匹配的目标搜索引擎。基于目标搜索引擎获取与目标需求类型匹配的搜索结果信息。根据搜索结果信息返回对应的推荐信息给用户。

于一实施例中，返回模块1104，用于若搜索结果信息包括目标对象的预设信息卡，根据目标对象的标题生成对目标对象的描述文本，将预设信息卡和/或描述文本作为推荐信息返回给用户。

于一实施例中，返回模块1104，用于若搜索结果信息中不存在目标对象的预设信息卡，根据搜索结果信息生成预设大语言模型的提示词，以使预设大语言模型对搜索结果信息总结后输出推荐信息。返回推荐信息给用户。

于一实施例中，还包括：标记模块，用于在返回推荐信息给用户之前，标记推荐信息中包含的预设关键词。该装置还包括：显示模块，用于在返回推荐信息给用户之后，将推荐信息中包含的预设关键词突出显示。跳转模块，用于响应于用户对预设关键词的确定指令，跳转到基于预设关键词的搜索结果页面。

于一实施例中，还包括：分析模块，用于将初始输入信息输入预设大语言模型，预设大语言模型用于抽取初始输入信息中包含的需求关键词，根据需求关键词和预设提示词，确定与关键词相关的需求提示信息。

上述交互信息处理装置1100的详细描述，请参见上述实施例中相关方法步骤的描述，其实现原理和技术效果类似，本实施例此处不再赘述。

图12为本申请示例性实施例提供的一种云设备120的结构示意图。该云设备120可以用于运行上述任一实施例所提供的方法。如图12所示，该云设备120可以包括：存储器1204和至少一个处理器1205，图12中以一个处理器为例。

存储器1204，用于存储计算机程序，并可被配置为存储其它各种数据以支持在云设备120上的操作。该存储器1204可以是对象存储(Object Storage Service，OSS)。

存储器1204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

处理器1205，与存储器1204耦合，用于执行存储器1204中的计算机程序，以用于实现上述任一方法实施例所提供的方案，具体功能和所能实现的技术效果此处不再赘述。

进一步地，如图12，该云设备还包括：防火墙1201、负载均衡器1202、通信组件1206、电源组件1203等其它组件。图12中仅示意性给出部分组件，并不意味着云设备只包括图12所示组件。

于一实施例中，上述图12中的通信组件1206被配置为便于通信组件1206所在设备和其他设备之间有线或无线方式的通信。通信组件1206所在设备可以接入基于通信标准的无线网络，如WiFi，2G、3G、4G、LTE(Long Term Evolution，长期演进，简称LTE)、5G等移动通信网络，或它们的组合。在一个示例性实施例中，通信组件1206经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件1206还包括近场通信(Near Field Communication，简称NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(Radio Frequency Identification，简称RFID)技术，红外数据协会(Infrared Data Association，简称IrDA)技术，超宽带(Ultra Wide Band，简称UWB)技术，蓝牙(bluetooth，简称BT)技术和其他技术来实现。

于一实施例中，上述图12的电源组件1203，为电源组件1203所在设备的各种组件提供电力。电源组件1203可以包括电源管理系统，一个或多个电源，及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当处理器执行计算机执行指令时，实现前述任一实施例的方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现前述任一实施例的方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器执行本申请各个实施例方法的部分步骤。

应理解，上述处理器可以是中央处理单元(Central Processing Unit，简称CPU)，还可以是其它通用处理器、数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。存储器可能包含高速RAM(Random Access Memory，随机存取存储器)存储器，也可能还包括非易失性存储NVM(Nonvolatile memory，简称NVM)，例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(Static Random-Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable read only memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable read-only memory，简称PROM)，只读存储器(Read-OnlyMemory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits，简称ASIC)中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、服饰或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、服饰或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、服饰或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例的方法。

本申请的技术方案中，所涉及的用户数据等信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种交互信息处理方法，其特征在于，包括：

响应于用户的初始输入信息，展示基于所述初始输入信息确定的需求提示信息；

获取所述用户基于所述需求提示信息输入的回复信息；

根据所述回复信息和所述初始输入信息，确定所述用户的目标需求类型；

根据所述目标需求类型返回对应的推荐信息给所述用户。

2.根据权利要求1所述的方法，其特征在于，所述响应于用户的初始输入信息，包括：

响应于所述用户在交互界面的录入信息，获取与所述录入信息匹配的候选需求信息；

响应于所述用户对所述候选需求信息的选定指令，将所述选定指令对应的需求信息确定为所述初始输入信息。

3.根据权利要求1所述的方法，其特征在于，在所述展示基于所述初始输入信息确定的需求提示信息之前，还包括：

响应于用户的初始输入信息，根据所述初始输入信息在预设知识库中搜索；

若在所述预设知识库中搜索到与所述初始输入信息匹配的预设答复信息，根据所述预设答复信息返回对应的推荐信息给所述用户；

若在所述预设知识库中未搜索到与所述初始输入信息匹配的预设答复信息，执行所述展示基于所述初始输入信息确定的需求提示信息的步骤。

4.根据权利要求3所述的方法，其特征在于，所述根据所述预设答复信息返回对应的推荐信息给所述用户，包括：

根据所述预设答复信息生成预设大语言模型的提示词，以使所述预设大语言模型对所述预设答复信息总结后输出所述推荐信息；

返回所述推荐信息给所述用户。

5.根据权利要求1所述的方法，其特征在于，在所述展示基于所述初始输入信息确定的需求提示信息之前，还包括：

判断所述初始输入信息是否包括预设需求类型；

若所述初始输入信息包括所述预设需求类型，将所述预设需求类型确定为所述用户的目标需求类型；

若所述初始输入信息不包括所述预设需求类型，执行所述展示基于所述初始输入信息确定的需求提示信息的步骤。

6.根据权利要求1所述的方法，其特征在于，所述需求提示信息包括预设次数发出的需求提示；所述获取所述用户基于所述需求提示信息输入的回复信息，包括：

响应于所述用户对已发出需求提示的第一回复信息，根据所述第一回复信息再次发出需求提示，直至获取到所述用户对所述预设次数的需求提示的回复信息。

7.根据权利要求1所述的方法，其特征在于，所述根据所述回复信息和所述初始输入信息，确定所述用户的目标需求类型，包括：

将所述回复信息和所述初始输入信息输入预设大语言模型，以使所述预设大语言模型根据预设提示词对所述回复信息和所述初始输入信息进行上下文分析推理，输出所述用户的目标需求类型。

8.根据权利要求7所述的方法，其特征在于，所述目标需求类型包括目标物品品类、目标店铺类型、目标榜单数据、目标知识内容中的一个或多个。

9.根据权利要求1-8中任一项所述的方法，其特征在于，所述根据所述目标需求类型返回对应的推荐信息给所述用户，包括：

确定所述目标需求类型匹配的目标搜索引擎；

基于所述目标搜索引擎获取与所述目标需求类型匹配的搜索结果信息；

根据所述搜索结果信息返回对应的推荐信息给所述用户。

10.根据权利要求9所述的方法，其特征在于，所述根据所述搜索结果信息返回对应的推荐信息给所述用户，包括：

若所述搜索结果信息包括目标对象的预设信息卡，根据所述目标对象的标题生成对所述目标对象的描述文本，将所述预设信息卡和/或所述描述文本作为推荐信息返回给所述用户。

11.根据权利要求9所述的方法，其特征在于，所述根据所述搜索结果信息返回对应的推荐信息给所述用户，包括：

若所述搜索结果信息中不存在目标对象的预设信息卡，根据所述搜索结果信息生成预设大语言模型的提示词，以使所述预设大语言模型对所述搜索结果信息总结后输出所述推荐信息；

返回所述推荐信息给所述用户。

12.根据权利要求1所述的方法，其特征在于，在返回所述推荐信息给所述用户之前，还包括：

标记所述推荐信息中包含的预设关键词；

在返回所述推荐信息给所述用户之后，还包括：

将所述推荐信息中包含的预设关键词突出显示；

响应于所述用户对所述预设关键词的确定指令，跳转到基于所述预设关键词的搜索结果页面。

13.根据权利要求1所述的方法，其特征在于，基于所述初始输入信息确定所述需求提示信息，包括：

将所述初始输入信息输入预设大语言模型，所述预设大语言模型用于抽取所述初始输入信息中包含的需求关键词，根据所述需求关键词和预设提示词，确定与所述关键词相关的所述需求提示信息。

14.根据权利要求4或7或11或13中任一项所述的方法，其特征在于，所述预设大语言模型是通过对预训练的大语言模型进行有监督微调后得到的。

15.一种交互信息处理方法，其特征在于，包括：

响应于用户输入的初始问题信息，展示基于所述初始问题信息确定的相关商品和/或相关店铺的询问信息；

获取所述用户基于所述询问信息输入的回复信息；

根据所述回复信息和所述初始问题信息，确定所述用户关注的目标商品和/或目标店铺；

根据目标商品和/或目标店铺返回对应的推荐信息给所述用户。

16.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述电子设备执行权利要求1-15任一项所述的方法。

17.一种云设备，其特征在于，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述云设备执行权利要求1-15任一项所述的方法。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1-15任一项所述的方法。