CN117273868A

CN117273868A - 店铺推荐方法、装置、电子设备与存储介质

Info

Publication number: CN117273868A
Application number: CN202311549649.4A
Authority: CN
Inventors: 胡盼盼
Original assignee: Zhejiang Koubei Network Technology Co Ltd
Current assignee: Zhejiang Koubei Network Technology Co Ltd
Priority date: 2023-11-20
Filing date: 2023-11-20
Publication date: 2023-12-22

Abstract

本申请实施例提供一种店铺推荐方法、装置、电子设备与存储介质，该方法包括：通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，从店铺集合中获取与关键实体相关联的候选店铺，基于预设的推理过程描述文本、点餐描述数据和候选店铺，生成大语言模型的提示指令，推理过程描述文本用于描述大语言模型的推理逻辑，基于提示指令，采用大语言模型生成店铺推荐结果。使用大语言模型进行端到端的生成式的推荐工作流程，能够承接复杂的点餐描述数据，提高推荐的泛化能力，解决规则无法覆盖的问题，提高店铺推荐的准确性。

Description

店铺推荐方法、装置、电子设备与存储介质

技术领域

本申请涉及互联网技术领域，尤其涉及店铺推荐方法、装置、电子设备与存储介质。

背景技术

随着人民生活水平的提高和外卖配送服务的普及，用户可以在线上点餐时拥有越来越丰富的选择。面临大量可选择的店铺和商品，很多用户在就餐时都会面临选择困难的问题，无法选择出自己喜欢的餐品。

为了解决上述问题，相关技术中通常是基于用户偏好信息进行餐品推荐，然而采用这种方式所得到的推荐菜品或店铺种类单一，还需要用户一一进行筛选。又或者是根据用户输入的需求信息来与各个餐品或店铺进行匹配，采用规则推荐的方式，因为无法理解用户输入的复杂问题或者需求信息，导致无法为用户推荐出合适的餐品。因此，亟待提出一种店铺推荐方式能够推荐出与用户需求更加吻合的店铺。

发明内容

本申请的主要目的在于提供一种店铺推荐方法、装置、电子设备与存储介质，旨在提高店铺推荐准确率。所述技术方案如下：

第一方面，本申请实施例提供了一种店铺推荐方法，包括：

基于点餐推荐场景获取所输入的点餐描述数据；

确认所述点餐描述数据中包含的关键实体类型，根据所述关键实体类型从所述点餐描述数据中确认关键实体；

从店铺集合中获取与所述关键实体相关联的候选店铺；

基于预设的推理过程描述文本、所述点餐描述数据和所述候选店铺，生成大语言模型的提示指令，所述推理过程描述文本用于描述大语言模型的推理逻辑；

基于所述提示指令，采用所述大语言模型生成店铺推荐结果。

第二方面，本申请实施例提供了一种大语言模型训练方法，包括：

获取样本点餐描述数据；

基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息；

将所述样本点餐描述数据和所述样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，所述预设提示指令模板中至少包括推理过程描述文本，所述推理过程描述文本用于描述大语言模型的推理逻辑；

将所述样本提示指令输入至初始大语言模型中，采用所述初始大语言模型输出所述样本点餐描述数据对应的样本店铺推荐结果；

基于所述样本店铺推荐结果和预设评测标准，生成所述初始大语言模型的评测结果，基于所述评测结果对所述初始大语言模型进行迭代训练，直至所述评测结果满足预设评测要求，得到训练好的大语言模型。

第三方面，本申请实施例提供一种店铺推荐装置，包括：

问题获取模块，用于获取点餐推荐场景下的点餐描述数据；

实体确认模块，用于确认所述点餐描述数据中包含的关键实体类型，根据所述关键实体类型从所述点餐描述数据中确认关键实体；

店铺选择模块，用于从店铺集合中获取与所述关键实体相关联的候选店铺；

提示生成模块，用于基于预设的推理过程描述文本、所述点餐描述数据和所述候选店铺，生成大语言模型的提示指令，其中，所述推理过程描述文本用于描述大语言模型推理逻辑；

推荐模块，用于基于所述提示指令，采用所述大语言模型生成店铺推荐结果。

第四方面，本申请实施例提供一种店铺推荐装置，包括：

样本数据获取模块，用于获取样本点餐描述数据；

样本店铺获取模块，用于基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息；

样本提示生成模块，用于将所述样本点餐描述数据和所述样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，所述预设提示指令模板中至少包括推理过程描述文本，所述推理过程描述文本用于描述大语言模型推理逻辑；

模型预测模块，用于将所述样本提示指令输入至初始大语言模型中，采用所述初始大语言模型输出所述样本点餐描述数据对应的样本店铺推荐结果；

训练模块，用于基于所述样本店铺推荐结果和预设评测标准，生成所述初始大语言模型的评测结果，基于所述评测结果对所述初始大语言模型进行迭代训练，直至所述评测结果满足预设评测要求，得到训练好的大语言模型。

第五方面，本申请实施例提供一种电子设备，所述电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上述方法的步骤。

第六方面，本申请实施例提供一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述方法的步骤。

在本申请实施例中，通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，从店铺集合中获取与关键实体相关联的候选店铺，基于预设的推理过程描述文本、点餐描述数据和候选店铺，生成大语言模型的提示指令，推理过程描述文本用于描述大语言模型的推理逻辑，基于提示指令，采用大语言模型生成店铺推荐结果。通过获取用户输入的点餐描述数据，确认候选店铺，根据候选店铺、点餐描述数据和预设的推理过程描述文本生成提示指令，将提示指令输入至大语言模型，使用大语言模型进行端到端的生成式的推荐工作流程，能够承接复杂的点餐描述数据，提高推荐的泛化能力，解决规则无法覆盖的问题，提高店铺推荐的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种店铺推荐方法的举例示意图；

图2是本申请实施例提供的一种店铺推荐方法的流程示意图；

图3是本申请实施例提供的一种店铺推荐方法的页面示意图；

图4是本申请实施例提供的一种店铺推荐方法的页面示意图；

图5是本申请实施例提供的一种店铺推荐方法的流程示意图；

图6是本申请实施例提供的一种大语言模型训练方法的流程示意图；

图7是本申请实施例提供的一种大语言模型训练方法的流程示意图；

图8是本申请实施例提供的一种大语言模型训练方法的流程示意图；

图9是本申请实施例提供的一种店铺推荐方法的页面示意图；

图10是本申请实施例提供的一种店铺推荐方法的页面示意图；

图11是本申请实施例提供的一种店铺推荐装置的结构示意图；

图12是本申请实施例提供的一种店铺推荐装置的结构示意图；

图13是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

在本说明书的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。在本说明书的描述中，需要说明的是，除非另有明确的规定和限定，“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本说明书中的具体含义。此外，在本说明书的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

店铺推荐装置可以为手机、电脑、平板电脑、智能手表或车载设备等终端设备，也可以为终端设备中用于实现店铺推荐方法的模块，店铺推荐装置可以通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，从店铺集合中获取与关键实体相关联的候选店铺，基于预设的推理过程描述文本、点餐描述数据和候选店铺，生成大语言模型的提示指令，推理过程描述文本用于描述大语言模型的推理逻辑，基于提示指令，采用大语言模型生成店铺推荐结果。

可选的，店铺推荐装置还可以获取样本点餐描述数据，基于样本点餐描述数据，获取样本候选店铺以及样本候选店铺的店铺信息，将样本点餐描述数据和样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，预设提示指令模板中至少包括推理过程描述文本，推理过程描述文本用于描述大语言模型的推理逻辑，将样本提示指令输入至初始大语言模型中，采用初始大语言模型输出样本点餐描述数据对应的样本店铺推荐结果，基于样本店铺推荐结果和预设评测标准，生成初始大语言模型的评测结果，基于评测结果对初始大语言模型进行迭代训练，直至评测结果满足预设评测要求，得到训练好的大语言模型。

请一并参见图1，为本申请实施例提供了一种店铺推荐方法的举例示意图，店铺推荐装置可以为服务器，用户在用户端输入点餐描述数据后，服务器获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，从店铺集合中获取与关键实体相关联的候选店铺，基于预设的推理过程描述文本、点餐描述数据和候选店铺，生成大语言模型的提示指令，推理过程描述文本用于描述大语言模型的推理逻辑，基于提示指令，采用大语言模型生成店铺推荐结果。

下面结合具体的实施例对本说明书提供的店铺推荐方法进行详细说明。

请参见图2，为本申请实施例提供了一种店铺推荐方法的流程示意图。如图2所示，本申请实施例的所述方法可以包括以下步骤S101-步骤S105。

S101，基于点餐推荐场景获取所输入的点餐描述数据；

一实施例中，点餐描述数据为描述用户点餐条件的数据，可以是用户根据自身用餐需求所输入描述内容。描述内容可以是文本形式、图片形式、语音形式等。文本形式也即用户输入的描述文本；图片形式可以是用户所拍摄的照片，或者是绘制的图片，通过识图可以获取到描述图片中的关键信息以生成点餐描述数据；语音形式也即用户通过语音输入的描述音频。为了便于处理可以将用户输入的描述内容均转换为文本形式，得到点餐描述数据（点餐描述文本）。描述内容根据用户习惯语气不同可以为不同的句式，比如可以是疑问句：我想吃不辣的麻辣烫有吗？；又如陈述句：我想要最新上市的，热门的奶茶。

请参见图3，为本申请实施例提供了一种店铺推荐方法的页面示意图，用户可以在与智能点餐助手的聊天界面中输入点餐描述数据，如图3左所示，可以为文本形式的点餐描述数据，也可以是如图3右所示的语音形式的点餐描述数据。同理，智能助手所生成的店铺推荐结果可以为语音或者文字形式具体不做限定。

请参见图4，为本申请实施例提供了一种店铺推荐方法的页面示意图，用户可以在点餐应用软件的应用主界面中输入点餐描述数据，如图4左所示，可以在搜索栏中输入点餐描述数据，当用户点击搜索时可以跳转至如图4右所示推荐结果页面，其中可以展示店铺推荐结果，如推荐店铺和推荐理由。

S102，确认所述点餐描述数据中包含的关键实体类型，根据所述关键实体类型从所述点餐描述数据中确认关键实体；

一实施例中，点餐描述数据中可能包含以下一种或多种实体类型：类目/菜品、功效、口味、时段、送餐时间、月销、配送费、价格。举例来说，类目/菜品相关的点餐描述数据可以是“想吃炸鸡汉堡好多好多好吃”、“我想吃粉但不知道吃什么”；功效相关的点餐描述数据可以是“我牙疼有什么推荐的吗”、“没什么想吃的有点上火”；口味相关的点餐描述数据可以是“肠胃炎犯了想吃清淡点”、“我想吃点清淡又管饱的”；时段相关的点餐描述数据可以是“不知道下午茶吃点什么”、“推荐点美味的早餐”；送餐时间相关的点餐描述数据可以是“送餐时间最好在半小时内，快一点”、“时间快点的，最多1小时”；月销相关的点餐描述数据可以是“人气高的店”、“销量高的店铺”；配送费相关的点餐描述数据可以是“不要配送费的”、“配送费不高于5元的”；价格相关的点餐描述数据可以是“价格便宜点的”、“量大实惠的，不超过30元的套餐有没有？”。

关键实体类型为其中某一类或者某几类与用户点餐需求更加相关的实体类型，例如类目/菜品。从点餐描述数据中确认出其中所包含的关键实体类型，将关键实体类型对应的实体（字段）确认为关键实体。举例来说，关键实体类型为类目/菜品，对点餐描述数据“我想喝奶茶，茶底为茉莉花茶的”进行实体检测，则确认出其中包含了菜品“奶茶”，则可以将“奶茶”确认为关键实体。可以理解的是，当点餐描述数据中不包含“类目/菜品”的时候，例如用户输入点餐描述数据为“我想吃甜的、热的食物”，此时，关键实体还可以为口味，也即可以对实体类型进行优先级排序，先查询有无优先级高的实体类型，如类目/菜品，如果没有则搜寻下一优先级的实体类型，如口味，以从点餐描述数据中确认出关键实体。

S103，从店铺集合中获取与所述关键实体相关联的候选店铺；

一实施例中，店铺集合可以为当前点餐平台中能提供餐品的所有商铺。具体的，店铺集合可以根据当前用户所选择的地理位置确认为某一区域范围内的所有商户，例如用户的地理位置在上海，则可以将上海市内的所有商铺确认为候选店铺。根据关键实体，可以从店铺集合中搜索得到相关联的候选店铺。例如，关键实体为“奶茶”，则可以通过在点餐应用软件中搜索“奶茶”，以得到售卖“奶茶”的店铺，将这些售卖奶茶的店铺作为候选店铺。可以理解的是，在根据关键实体在得到与关键实体相关的店铺搜索结果时，为了提高所选择候选店铺的准确性以及相关性，可以进一步地根据店铺集合中各个店铺与用户的距离、店铺的评分、店铺的销量对店铺集合进行筛选和排序，将预设数量的排序靠前的店铺确认为候选店铺。

S104，基于预设的推理过程描述文本、所述点餐描述数据和所述候选店铺，生成大语言模型的提示指令，所述推理过程描述文本用于描述大语言模型的推理逻辑；

一实施例中，采用大语言模型进行生成式店铺推荐，能够生成个性化和上下文感知的推荐结果。可以理解的是，在推荐应用中，应用大型语言模型可以通过模型训练进行端到端优化，避免中间过程积累产生的错误，并且泛化能力强，推荐结果不受预定义规则的限制，可以生成自然语言文本或图像。其中，提示指令也即Prompt，在自然语言处理中，Prompt通常指的是为大型语言模型提供的一段文本或问题，用于指导模型生成特定类型的文本或回答。使用Prompt，可以控制生成式预训练模型（GPT）等大型语言模型生成特定类型的文本。具体的，有了点餐描述数据和店铺信息，需要将两者内嵌到Prompt中，并且Prompt中加入了对于模型输出的要求，也即推理过程描述文本，可以根据预设的推理过程描述文本、点餐描述数据和候选店铺生成提示指令。其中，推理过程描述文本为指导大语言模型在生成店铺推荐结果的过程中需要进行推理的Prompt。推理过程描述文本为基于思维链（cot）预先设置的适应于点餐推荐场景的提示文本。思维链是一种改进的提示策略，用于提高大语言模型在复杂推理任务中的性能，如算术推理、常识推理和符号推理。在大模型的输出过程中，要求其输出推理过程，由二元组<input,output>变成三元组<input,chain ofthought,output>。示例性的，推理过程描述文本可以为：请一步步地说明推理的过程，解析用户的条件，依次查看各店铺是否满足要求，获取满足要求的店铺，最多三家；1、提取用户的要求，分析用户的要求；2、依次查看每家店铺，根据用户的要求，分析是否满足条件。然后再将推理过程描述文本与点餐描述数据以及候选店铺以及候选店铺的店铺信息拼接得到提示指令。

示例性的，输入大语言模型的提示指令可以为：“请根据以下的【用户问题】以及【店铺列表】在文本末尾为用户选择一家或多家合适的店铺。

用户问题：点餐描述数据

店铺列表：候选店铺

请以以下格式进行回复

推理过程：请一步步地说明推理的过程，解析用户的条件，依次查看各店铺是否满足要求，获取满足要求的店铺，最多三家；1、提取用户的要求，分析用户的要求；2、依次查看每家店铺，根据用户的要求，分析是否满足条件

推荐店铺：对满足条件的店铺进行输出”。

S105，基于所述提示指令，采用所述大语言模型生成店铺推荐结果。

一实施例中，当拼接得到生成提示指令后，调用大语言模型根据所输入的提示指令生成店铺推荐结果。店铺推荐结果可以包括推荐店铺的店铺名称、推荐店铺的推荐理由等等。其中，大语言模型在训练过程中不同于传统的<input-output>作为模型的输入输出，而是利用<input-cot-output>这种三元组的形式，通过引入基于思维链设计的推理过程描述文本，提升了对复杂点餐描述数据的理解程度，进而有助于大语言模型给出正确的店铺推荐结果。

为了便于理解，提出了在以下实际应用场景中的实现方法，如下所示：

点餐描述数据：我想吃地道的农家菜，酸甜口味的，比较受欢迎的，价格小于30元的，有推荐的吗？

候选店铺：

1.店铺1，运送时间：47分钟，月销量：6000，店铺主营类目：中式菜系-农家菜，销售商品：干锅香辣虾，价格：31.8

2.店铺2,运送时间：45分钟，月销量：5000，店铺主营类目：中式菜系-川湘菜-农家菜，销售商品：爆炒小鱼小虾，价格：42.0

3.店铺3，运送时间：43分钟，月销量：700，店铺主营类目：中式菜系-川湘菜，销售商品：椒盐基尾虾，价格：40.0

4.店铺4，运送时间：49分钟，月销量：2000，店铺主营类目：中式菜系-江浙菜-本帮菜，销售商品：糖醋排骨，价格：32.8

在以上内容中，点餐描述数据（用户问题）为“我想吃地道的农家菜，比较受欢迎的，价格小于30元的，有推荐的吗？”，在后续的候选店铺中，罗列了一系列店铺的相关信息，目标是希望输出满足用户条件的店铺。如果基于规则推荐，按照关键词抽取及硬匹配的方式，选不出满足条件的店铺，因此将无法为用户提供点餐推荐。但通过大语言模型的生成推荐可以得到的店铺推荐结果为：“虽然目前无满足您价格要求的店铺，但是为你推荐了一家非常实惠的农家菜馆，1.店铺1，价位在30元多一点，其中的招牌商品糖醋排骨，口味酸甜，因此，建议您可以选择这家店铺进行购买”。通过基于端到端的生成式推荐，在理解用户条件的基础上，可以选出合适的店铺并提供推理过程，相比于硬规则推荐的方式，更加地灵活、人性化。

在本申请实施例中，通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，从店铺集合中获取与关键实体相关联的候选店铺，基于预设的推理过程描述文本、点餐描述数据和候选店铺，生成大语言模型的提示指令，推理过程描述文本用于描述大语言模型的推理逻辑，基于提示指令，采用大语言模型生成店铺推荐结果，通过大语言模型的提示指令中增加基于思维链的推理过程描述文本，能够使大语言模型在进行生成式推荐时，能够按照给定的推理过程进行推理，使得模型的输出不再黑盒，提高了推荐可解释性以及准确性。

请参见图5，为本申请实施例提供的一种店铺推荐方法的流程示意图。如图5所示，本申请实施例的所述方法可以包括以下步骤S201-步骤S208。

S201，基于点餐推荐场景获取所输入的点餐描述数据；

S202，确认所述点餐描述数据中包含的关键实体类型，根据所述关键实体类型从所述点餐描述数据中确认关键实体；

具体的，请参见上述实施例步骤S101-步骤S102，在此不加赘述。

S203，以所述关键实体为搜索词，获取点餐推荐场景下的高频店铺搜索结果数据；

一实施例中，当从点餐描述数据中确认出关键实体后，可以以关键实体为搜索词，在点餐推荐场景下进行搜索，例如在当前具有点餐推荐功能的点餐应用软件中采用上述搜索词进行搜索，以得到店铺搜索结果数据。店铺搜索结果数据中至少包括一个与搜索词相关的店铺名称。根据店铺搜索结果数据确认其中的高频店铺搜索结果数据，例如，可以是相关程度最大的预设数量的店铺确认为高频店铺搜索结果数据，又比如相关程度最高的五个店铺。需要说明的是，在确认店铺与搜索词的相关程度时，可以根据历史用户输入该搜索词后，对各搜索结果的点击频率统计得到，将点击频率高的展示在店铺搜索结果展示页面的靠前位置，或者是确认其相关程度更高。

S204，将所述高频店铺搜索结果数据中包含的店铺确认为候选店铺；

具体的，高频店铺搜索结果数据中包含店铺名称，因此可以将其中包含的店铺确认为候选店铺。

S205，将模型风格描述文本、所述点餐描述数据、所述候选店铺及所述推理过程描述文本拼接为大语言模型的提示指令；

一实施例中，在确认出候选店铺后，将候选店铺、点餐描述数据、推理过程描述文本和模型风格描述文本一起拼接得到大语言模型的提示指令。其中，模型风格描述文本用于描述模型在回答问题或者是生成推荐结果时的文本风格、语言风格等，以适应不同用户的个性化需求，例如不同的语言、对话风格。

可选的，所述模型风格描述文本包括模型答案格式描述文本、模型运作方式描述文本、模型角色描述文本中的一种或多种。

其中，模型答案格式描述文本用于针对店铺推荐任务，对输出的最终答案、格式描述相关的要求。示例性的，可以包括：“推荐店铺：对满足条件的店铺进行输出，只需要列举店铺名称即可，不能编造店铺名称，以顿号分隔，若没有相关店铺，请写“无”；推荐理由：若没有推荐店铺，请写“无”，总分总结构，请根据店铺列表中的店铺推荐语生成，分别编写每个店铺的推荐理由，每家店铺字数30字左右”。

模型运作方式描述文本中定义了一些基本要求，也即期望模型的运作方式。示例性的，可以包括：“深度：大学；学习方式：循序渐进；沟通方式：友好；语气方式：温和；推理框架：逻辑推理；表情符号：无；语言：简体中文”。

模型角色描述文本用于给模型设定一个角色，期望模型具备这些能力。示例性的，可以包括：“角色：你懂美食，懂养生，擅长推荐美食，并且擅长推理”。

需要说明的是，可以提供给用户定制提示指令的功能，也即用户除了输入点餐描述数据之外，还可以自定义模型风格描述文本，增强用户对结果多样性的参与和满意度。

S206，按照所述推理过程描述文本，采用所述大语言模型从所述点餐描述数据中提取用户需求；

具体的，在得到提示指令后，将提示指令给到大语言模型，大语言模型按照提示指令中的推理过程描述文本，首先从点餐描述数据中提取出用户需求，例如点餐描述数据为“我感觉有点累想提提神喝杯奶茶”，则模型推理得到用户需求为“用户要求寻找能够抗疲劳的奶茶”。

可选的，所述按照所述推理过程描述文本，采用所述大语言模型从所述点餐描述数据中提取用户需求，包括：

确认所述点餐描述数据中所包含的实体类型，从所述实体类型中确认出目标实体类型；

根据所述目标实体类型对应的目标实体生成用户需求。

在一种可行的实施方式中，大语言模型在分析点餐描述数据时可以先确认点餐描述数据中所包含的实体类型，在实体类型中确认其包含的目标实体类型，目标实体类型也即为所关注的用户点餐条件（实体类型），例如，配送费、类目/菜品、价格、功效等。将目标实体类型对应的实体确认为用户需求。例如，“我感觉有点累想提提神喝杯奶茶”，其中，“提提神”为目标实体类型：功效，“奶茶”为目标实体类型：菜品，则提取出用户需求为“用户要求寻找能够抗疲劳的奶茶”。

S207，根据所述用户需求确认筛选条件；

具体的，根据从点餐描述数据中分析出的用户需求确认筛选条件，例如，用户需求为“用户要求寻找能够抗疲劳的奶茶”，则可以确认出筛选条件为“需要查看店铺的招牌商品中是否有能够抗疲劳的奶茶或类似的饮品”。

S208，根据所述提示指令中候选店铺的店铺信息，生成所述候选店铺与所述筛选条件的匹配分析结果，根据所述匹配分析结果生成店铺推荐结果。

具体的，对于每个候选店铺可以获取的店铺信息，例如从每家店铺的详情页中获取店铺名称、主营类目、送餐时间、月销、配送费、客单价、招牌商品及商品的口味、功效、时段相关信息，进行格式处理后，可以得到如下所示的店铺信息：

将店铺信息与筛选条件进行匹配分析，确认该店铺是否符合筛选条件，进而生成店铺推荐结果。其中，店铺推荐结果中至少包括推荐店铺，如：推荐店铺1，或者是：无推荐店铺。例如筛选条件“需要查看店铺的招牌商品中是否有能够抗疲劳的奶茶或类似的饮品”，则查看候选店铺的店铺信息中的招牌商品是否包括抗疲劳功能的奶茶或其他饮品，以生成匹配分析结果。

可选的，所述根据所述匹配分析结果生成店铺推荐结果，包括：

根据所述匹配分析结果确认满足所述用户需求的推荐店铺；

基于所述推荐店铺生成店铺推荐结果。

具体的，店铺推荐结果中可以仅包括推荐店铺，对应的在提示指令中可以指示大语言模型的输出格式为输出推荐店铺。

可选的，所述基于所述推荐店铺生成店铺推荐结果，包括：

基于所述匹配分析结果确认所述推荐店铺的推荐理由；

基于所述推荐理由和所述推荐店铺生成店铺推荐结果。

具体的，店铺推荐结果中还可以包括推荐店铺的推荐理由，对应的在提示指令中可以指示大语言模型的输出格式为输出推荐店铺和推荐理由。其中，推荐理由可以根据匹配分析结果得到。

可选的，所述基于所述推荐店铺生成店铺推荐结果，包括：

根据所述用户需求、所述推理逻辑、所述候选店铺的店铺信息和所述匹配分析结果生成所述推荐店铺的推理过程；

基于所述推理过程和所述推荐店铺生成所述店铺推荐结果。

具体的，店铺推荐结果中还可以包括推理过程，也即生成推荐店铺的推理过程，对应的在提示指令中可以指示大语言模型的输出格式为输出推荐店铺和推理过程。

可选的，还可以基于推理过程、推荐理由和推荐店铺生成店铺推荐结果。

以点餐描述数据为“我感觉有点累想提提神喝杯奶茶”为例，对大语言模型的输入输出过程进行说明，其中，提示指令中指示输出答案格式为：“推理过程：请一步步地说明推理的过程，解析用户的条件，依次查看各店铺是否满足要求，获取满足要求的店铺，最多三家；1、提取用户的要求，分析用户的要求；2、依次查看每家店铺，根据用户的要求，分析是否满足条件\n\

推荐店铺：对满足条件的店铺进行输出，只需要列举店铺名称即可，不能编造店铺名称，以顿号分隔，若没有相关店铺，请写“无”\n\

推荐理由：若没有推荐店铺，请写“无”，总分总结构，请根据店铺列表中的店铺推荐语生成，分别编写每个店铺的推荐理由，每家店铺字数30字左右”，期望模型输出推理过程、推荐店铺以及推荐理由”。

输出店铺推荐结果如下所示：

“推理过程：

由问题可知，用户要求寻找能够抗疲劳的奶茶，因此需要查看店铺的招牌商品中是否有能够抗疲劳的奶茶或类似的饮品。

根据店铺列表中的信息，可以发现店铺1推出了抗疲劳的冰鲜柠檬水，能够满足用户的需求，因此推荐该店铺。

同时，店铺2也推出了能够开胃、抗氧化、降血脂的山楂草莓饮品，也能够缓解疲劳，因此也可以作为备选。

最后，店铺3和店铺4的招牌商品中没有针对抗疲劳的饮品，不符合用户的需求。

推荐店铺：店铺1、店铺2

推荐理由：

店铺1：推荐他们家的冰鲜柠檬水，非常适合需要抗疲劳的用户，喝上一杯能够让你重新充满活力。

店铺2：推荐他们家的山楂草莓饮品，能够开胃、抗氧化、降血脂，非常适合需要缓解疲劳的用户”。

在本申请实施例中，通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，以关键实体为搜索词，获取点餐推荐场景下的高频店铺搜索结果数据，将高频店铺搜索结果数据中包含的店铺确认为候选店铺，通过筛选高频搜索结果数据能提高候选店铺与点餐描述数据的相关性，并将模型推理范围限制在一定范围内，提高模型推理的效率；将模型风格描述文本、点餐描述数据、候选店铺及推理过程描述文本拼接为大语言模型的提示指令，通过在提示指令中加入模型风格描述文本，可以控制模型的输出风格，增加模型输出结果的可控性，使大语言模型更加人性化；然后按照推理过程描述文本，采用大语言模型从点餐描述数据中提取用户需求，根据用户需求确认筛选条件，根据提示指令中候选店铺的店铺信息，生成候选店铺与筛选条件的匹配分析结果，根据匹配分析结果生成店铺推荐结果，店铺推荐结果中可以包括推荐店铺、推荐理由和推理过程。基于大语言模型能够根据其语言生成能力提供解释（推理过程），帮助用户理解影响推荐的因素，有助于提高推荐的可解释性。

请参见图6，为本申请实施例提供的一种大语言模型训练方法的流程示意图。如图6所示，本申请实施例的所述方法可以包括以下步骤S301-步骤S305。

S301，获取样本点餐描述数据；

一实施例中，提供了一种用于点餐推荐的大语言模型的训练方法。具体的，先选择大语言模型的底座模型，例如可以选择Alpaca、chatm6、chatglm等。设置大语言模型的参数，例如超参数：学习率、批量大小、层数等。这些参数的选择对模型的性能和收敛速度有很大影响。可以使用交叉验证或其他调优技术来确定优选的超参数组合。然后获取样本点餐描述数据用于构建训练数据集，样本点餐描述数据可以根据历史的用户搜索记录生成样本点餐描述数据，或者是自定义生成点餐推荐场景中常见问题。

S302，基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息；

一实施例中，基于样本点餐描述数据获取样本候选店铺的方式可以参见如上述实施例中步骤S102-S103的说明，可以采用基于样本点餐描述数据中的关键样本实体来搜索得到样本候选店铺。

S303，将所述样本点餐描述数据和所述样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，所述预设提示指令模板中至少包括推理过程描述文本，所述推理过程描述文本用于描述大语言模型的推理逻辑；

一实施例中，将样本点餐描述数据和样本候选店铺添加至预设提示指令模板中，以生成样本提示指令。预设提示指令模板可以为一段文字模板，例如可以为：

“点餐描述数据：[ ]

候选店铺：[ ]

推理过程描述文本：请一步步地说明推理的过程，解析用户的条件，依次查看各店铺是否满足要求，获取满足要求的店铺，最多三家；1、提取用户的要求，分析用户的要求；2、依次查看每家店铺，根据用户的要求，分析是否满足条件”。

将获取到的样本点餐描述数据填入“[ ]”中，将样本候选店铺填入“[ ]”中，得到样本提示指令。需要说明的是，训练过程中采用的推理过程描述文本需要和使用过程中的一致，从而使模型能根据训练过程中学习到基于该推理过程描述文本所描述的推理逻辑对实际接收到的点餐描述数据进行推理。

S304，将所述样本提示指令输入至初始大语言模型中，采用所述初始大语言模型输出所述样本点餐描述数据对应的样本店铺推荐结果；

具体的，基于样本点餐描述数据可以构建得到训练数据集，对应的可以获取到多个样本提示指令，将样本提示指令分别输入至初始大语言模型，由模型输出样本店铺推荐结果。

S305，基于所述样本店铺推荐结果和预设评测标准，生成所述初始大语言模型的评测结果，基于所述评测结果对所述初始大语言模型进行迭代训练，直至所述评测结果满足预设评测要求，得到训练好的大语言模型。

具体的，对于输出的样本店铺推荐结果可以通过预设评测标准进行评估，得到评测结果，根据模型评测结果，可以进行迭代和改进，调整模型架构、数据预处理步骤或训练策略，以提高模型的性能，当评测结果满足预设的评测要求时，例如评测结果为分数，则可以是达到分数阈值时，得到训练好的大语言模型。可以理解的是，样本店铺推荐结果中可以包括样本推荐店铺和样本店铺推荐结果，因而预设评测标准可以从输出的样本推荐店铺和样本店铺推荐理由两部分来设置，一方面从推荐店铺的相关性、店铺名称准确性和格式准确性来评估，相关性也即对于有推荐店铺结果的情况根据强相关、弱相关、不相关来评价，对于零少结果的情况需满足弱相关要求；店铺名称准确性也即推荐的店铺是否保持原名称，是：1 否：0；格式准确性也即是否满足格式要求，是：1、否：0。另一方面从推荐理由的购买欲、语言通顺程度和是否符合事实来评估，购买欲也即结合用户问题，推荐理由是否激起你的购买欲，分成三档：很想买：2、犹犹豫豫：1、不想买：0；语言通顺程度也即语句是否通顺，没有奇怪的字符或者不通畅的表达，通顺：1、不通顺：0；是否符合事实也即推荐的理由是否存在事实性的错误，是否为无中生有或有中生无，无幻觉：1、有幻觉：0。

在本申请实施例中，通过获取样本点餐描述数据，基于样本点餐描述数据，获取样本候选店铺以及样本候选店铺的店铺信息，将样本点餐描述数据和样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，预设提示指令模板中至少包括推理过程描述文本，推理过程描述文本用于描述大语言模型的推理逻辑，将样本提示指令输入至初始大语言模型中，采用初始大语言模型输出样本点餐描述数据对应的样本店铺推荐结果，基于样本店铺推荐结果和预设评测标准，生成初始大语言模型的评测结果，基于评测结果对初始大语言模型进行迭代训练，直至评测结果满足预设评测要求，得到训练好的大语言模型。通过预先训练大语言模型，在提示指令中基于思维链加入推理过程描述文本，在大模型的输出过程中要求其输出推理过程，以得到能够在点餐推荐场景下准确生成店铺推荐结果的大语言模型。

请参见图7，为本申请实施例提供的一种大语言模型训练方法的流程示意图。如图7所示，本申请实施例的所述方法可以包括以下步骤S401-步骤S404。

S401，对点餐推荐场景下的历史搜索记录进行统计，以得到历史高频实体；

具体的，在构建样本点餐描述数据时，可以通过对点餐推荐场景下的历史搜索记录进行统计，以得到历史高频实体，历史高频实体为用户的历史高频搜索词，对于这些高频搜索词，可以对应的设计样本点餐描述数据，从而使得模型能够具备理解或推理这些高频实体的能力。例如，通过统计历史搜索记录，得到被搜索频率最高的实体为“奶茶”、“快餐”和“面”，则将这些确认为历史高频实体。

S402，根据所述历史高频实体对应的实体类型选取问题构建模板，将所述历史高频实体添加入所述问题构建模板中以生成样本点餐描述数据；

在一实施例中，根据历史高频实体对应的实体类型，选取对应的问题构建模板。同理，在构建样本点餐描述数据时，常见的实体类型同样可以包括类目/菜品、功效、口味、时段、送餐时间、月销、配送费、价格，因此，可以根据历史高频实体对应的实体类型，结合其他实体类型生成问题构建模板。例如，针对历史高频实体“奶茶”，其实体类型为饮品类目，则问题构建模板可以为“1、想喝{饮品类目}，配送时间{数字}分以内，有推荐的吗？”。同理，根据“快餐”还可以生成“2、推荐下{美食类目}，{口味}味的，价格低于{数字}元？3、想尝尝{美食类目}，人气高的，能够{功效}的，有吗？”这两种问题构建模板。对于模板1，可以选择任意的饮品类目下的具体实体填入其中，也可以将历史高频实体填入其中，示例性的，根据模板1得到“想喝奶茶，配送时间30分以内，有推荐的吗？”。

S403，确认所述样本点餐描述数据中包含的样本关键实体类型，根据所述样本关键实体类型从所述样本点餐描述数据中确认样本关键实体；

具体的，样本关键实体类型为其中某一类或者某几类与用户点餐需求更加相关的实体类型，例如类目/菜品。从样本点餐描述数据中确认出其中所包含的样本关键实体类型，将样本关键实体类型对应的实体确认为样本关键实体。例如，样本点餐描述数据为“想喝奶茶，配送时间30分以内，有推荐的吗？”，则样本关键实体为奶茶。可选的，样本关键实体类型还可以为配送时间，则样本关键实体还可以为配送时间30分钟。样本关键实体类型可以根据实际需求进行选择。

S404，获取与所述样本关键实体相关联的样本候选店铺以及所述样本候选店铺的店铺信息。

具体的，根据样本关键实体，可以从店铺集合中搜索得到相关联的样本候选店铺，并获取样本候选店铺的店铺信息。店铺集合可以为当前点餐平台中能提供餐品的所有商铺。其中，根据样本关键实体从店铺集合中搜索样本候选店铺的实现方式可以与实施过程中从店铺集合中获取与关键实体相关联的候选店铺的步骤实现方式相同，在此不加赘述。

在本申请实施例中，在生成样本点餐描述数据时，可以通过对点餐推荐场景下的历史搜索记录进行统计，以得到历史高频实体，根据历史高频实体对应的实体类型选取问题构建模板，将历史高频实体添加入问题构建模板中以生成样本点餐描述数据。然后再确认样本点餐描述数据中包含的样本关键实体类型，根据样本关键实体类型从样本点餐描述数据中确认样本关键实体，获取与样本关键实体相关联的样本候选店铺以及样本候选店铺的店铺信息。基于历史搜索记录生成训练样本数据，可以使模型具备对常见的条件进行推理分析的能力。

请参见图8，为本申请实施例提供的一种大语言模型训练方法的流程示意图。如图8所示，本申请实施例的所述方法可以包括以下步骤S501-步骤S506。

S501，基于点餐推荐场景下的实体类型和实体筛选条件，生成实体问题模板；

具体的，在生成样本点餐描述数据时，可以通过点餐推荐场景下的实体类型和实体筛选条件，生成实体问题模板，再确认实体问题模板中的实体，根据实体类型和实体筛选条件生成样本点餐描述数据。其中，实体类型可以为点餐推荐场景中所特指的几种实体类型。

在一种可行的实施方式中，样本点餐描述数据中除了任务相关的问题外，为了提高模型的数学推理能力，还加入数学题目，比如：“问题：以下选项中，距离小于1383米的是？选项：1.距离：80米，2.距离：2616米，3.距离：2897米，4.距离：408米”，在用户的点餐条件中，送餐时间、月销、配送费、价格这四个实体类型涉及到数字推理，因此基于此四个维度，分别设计数学题目作为样本点餐描述数据。实体筛选条件为与实体类型对应的，例如，对应于“送餐时间”，实体筛选条件可以为“阈值类”，“最值类”，根据阈值类可以构建出实体问题模板“送餐时间小于{}分钟”，最值类实体问题模板“送餐时间最小的店铺推荐”；对应于实体类型“月销”，实体筛选条件可以为“topk类”和“最值类”，topk类的实体问题模板可以为“月销较高的”，最值类实体问题模板“月销最高的”；对应于实体类型“配送费”，实体筛选条件可以为“免费类”，“阈值类”，如免费类“不要配送费的”，

阈值类“配送费小于{}元”；对应于实体类型“价格”，实体筛选条件可以为“topk类”和“阈值类”，如topk类实体问题模板“价格比较优惠的”，阈值类实体问题模板“价格小于{}元的”。

S502，根据所述实体类型和所述实体筛选条件确认所述实体问题模板中的实体，根据所述实体和实体问题模板生成样本点餐描述数据；

具体的，在得到实体问题模板后，可以在实体问题模板中填入实体，填入实体时根据模板对应的实体类型和实体筛选条件来决定，例如实体问题模板为“配送费小于{}元”，则可以根据配送费通常的价格范围确认在其中数值，例如填入10；又如，实体问题模板为“送餐时间小于{}分钟”，实体筛选条件为阈值，则可以根据送餐时间的时长范围选择一个稍微高一些时长填入实体，例如可以选择30。可以理解的是，通常用户不会要求过于极端的送餐时间，例如送餐时间小于1分钟，因此，可以不需要浪费资源去生成训练数据，可以根据实际应用场景需求确定。

S503，基于所述样本点餐描述数据从店铺集合中获取所述样本候选店铺；

具体的，根据构建出的样本点餐描述数据从店铺集合中获取样本候选店铺。可以理解的是，对于基于实体问题模板生成的样本点餐描述数据，可以根据其模板中包含的实体类型进行候选店铺的搜索，或者是随机进行店铺选择，具体不做限定。

S504，基于所述实体类型获取店铺信息模板；

具体的，根据样本点餐描述数据中所关注的实体类型，可以确认要从店铺的详情页中获取哪些店铺信息，例如实体类型为“送餐时间、月销、配送费、价格”，则店铺信息模板可以为“店铺名称，送餐时间{}分钟，月销{}，配送费{}，价格{}”。

S505，根据所述店铺信息模板获取所述样本候选店铺的店铺信息；

具体的，针对店铺信息模板中缺失的信息，可以从样本候选店铺的店铺详情页中获取，将缺失信息填入店铺信息模板中得到店铺信息。

S506，基于所述实体类型和所述实体筛选条件，生成推理过程描述文本。

具体的，有了数学问题（样本点餐描述数据）和店铺信息后，可以相应地为每一种模式，用程序构建出与数学问题相关的cot过程以及答案格式，作为推理过程描述文本，以送餐时间，最值类为例，推理过程描述文本如下：

“推理过程：

1、已知用户关注送餐时间，且需要送餐时间最小的店铺

2、由店铺信息可知，店铺1，送餐时间{}分钟，店铺2，送餐时间{}分钟，店铺3，送餐时间{}分钟，店铺4，送餐时间{}分钟，其中，送餐时间最小的为店铺{}。”

可选的，预设提示指令模板中还包括模型风格描述文本，所述模型风格描述文本包括模型运作方式描述文本、模型角色描述文本、模型答案格式描述文本中的一种或多种。

请参见图9，为本申请实施例提供了一种店铺推荐方法的页面示意图，如图9所示，用户与具备店铺推荐能力的智能助手之间可以是单轮对话的形式进行问答，也即用户一次性输入点餐描述数据，智能助手根据用户输入的点餐描述数据输出店铺推荐结果，其中可以包括用户要求，推理过程，推荐店铺和推荐原因。

请再参见图10，为本申请实施例提供了一种店铺推荐方法的页面示意图，用户与智能助手之间可以是多轮对话的形式，其中，用户的第一次发送的点餐描述数据为“胃不太舒服，想喝粥有推荐吗”，则大语言模型可以根据推理过程描述文本输出推理过程“用户需要喝粥，且胃不太舒服，因此需要选择一家提供养胃粥品的店铺。根据店铺列表中的主营类目和招牌商品,筛选出提供粥类的店铺,并查看其招牌商品属性是否包含“养胃”和“清淡”等关键词,找出满足要求的店铺。根据以上信息，推荐的店铺为：茶餐厅1、粥铺2、粥店3”，接着用户再次输入点餐描述数据“我要配送最快的”，则可以调用与配送时长以及最值类相关的推理过程描述文本，拼接得到提示文本，从而使模型输出配送时长相关的店铺推荐推理过程，如图10中所示的“已知用户关注送餐时间，且需要送餐时间最小的店铺。由店铺信息可知，茶餐厅1，送餐时间30分钟，粥铺2，送餐时间25分钟，粥店3，送餐时间45分钟，其中，送餐时间最小的为粥铺2，推荐店铺：粥铺2，推荐理由：粥铺2有卖养胃粥，并且配送时间最短。”。

在本申请实施例中，通过基于点餐推荐场景下的实体类型和实体筛选条件，生成实体问题模板，根据实体类型和实体筛选条件确认实体问题模板中的实体，根据实体和实体问题模板生成样本点餐描述数据，基于样本点餐描述数据从店铺集合中获取样本候选店铺，基于实体类型获取店铺信息模板，根据店铺信息模板获取样本候选店铺的店铺信息。基于实体类型和实体筛选条件，生成推理过程描述文本。在模型的训练数据中，针对性地设计任务相关的数学题目，并且从多个维度出发设计数学应用题目，有效地提高了模型的数据计算能力。

下面将结合图11-图12，对本申请实施例提供的店铺推荐装置进行详细介绍。需要说明的是，附图11中的店铺推荐装置，用于执行本说明书图2-图6所示实施例的方法，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本说明书图2-图6所示的实施例。

请参见图11，其示出了本申请一个示例性实施例提供的店铺推荐装置的结构示意图。该店铺推荐装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置1问题获取模块11、实体确认模块12、店铺选择模块13、提示生成模块14、推荐模块15。

问题获取模块11，用于获取点餐推荐场景下的点餐描述数据；

实体确认模块12，用于确认所述点餐描述数据中包含的关键实体类型，根据所述关键实体类型从所述点餐描述数据中确认关键实体；

店铺选择模块13，用于从店铺集合中获取与所述关键实体相关联的候选店铺；

提示生成模块14，用于基于预设的推理过程描述文本、所述点餐描述数据和所述候选店铺，生成大语言模型的提示指令，其中，所述推理过程描述文本用于描述大语言模型推理逻辑；

推荐模块15，用于基于所述提示指令，采用所述大语言模型生成店铺推荐结果。

可选的，所述店铺选择模块13具体用于以所述关键实体为搜索词，获取点餐推荐场景下的高频店铺搜索结果数据；

将所述高频店铺搜索结果数据中包含的店铺确认为候选店铺。

可选的，所述提示生成模块14具体用于将模型风格描述文本、所述点餐描述数据、所述候选店铺及所述推理过程描述文本拼接为大语言模型的提示指令。

可选的，所述推荐模块15具体用于按照所述推理过程描述文本，采用所述大语言模型从所述点餐描述数据中提取用户需求；

根据所述用户需求确认筛选条件；

根据所述提示指令中候选店铺的店铺信息，生成所述候选店铺与所述筛选条件的匹配分析结果，根据所述匹配分析结果生成店铺推荐结果。

可选的，所述推荐模块15具体用于确认所述点餐描述数据中所包含的实体类型，从所述实体类型中确认出目标实体类型；

根据所述目标实体类型对应的目标实体生成用户需求。

可选的，所述推荐模块15具体用于根据所述匹配分析结果确认满足所述用户需求的推荐店铺；

基于所述推荐店铺生成店铺推荐结果。

可选的，所述推荐模块15具体用于基于所述匹配分析结果确认所述推荐店铺的推荐理由；

基于所述推荐理由和所述推荐店铺生成店铺推荐结果。

可选的，所述推荐模块15具体用于根据所述用户需求、所述推理逻辑、所述候选店铺的店铺信息和所述匹配分析结果生成所述推荐店铺的推理过程；

基于所述推理过程和所述推荐店铺生成所述店铺推荐结果。

进一步地，参照附图12示出的店铺推荐装置，附图12中的店铺推荐装置，用于执行本说明书图7-图10所示实施例的方法，为了便于说明，仅示出了与本说明书实施例相关的部分，具体技术细节未揭示的，请参照本说明书图7-图10所示的实施例。

请参见图12，其示出了本说明书一个示例性实施例提供的店铺推荐装置的结构示意图。该店铺推荐装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置2包括样本数据获取模块21、样本店铺获取模块22、样本提示生成模块23、模型预测模块24、训练模块25。

样本数据获取模块21，用于获取样本点餐描述数据；

样本店铺获取模块22，用于基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息；

样本提示生成模块23，用于将所述样本点餐描述数据和所述样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，所述预设提示指令模板中至少包括推理过程描述文本，所述推理过程描述文本用于描述大语言模型推理逻辑；

模型预测模块24，用于将所述样本提示指令输入至初始大语言模型中，采用所述初始大语言模型输出所述样本点餐描述数据对应的样本店铺推荐结果；

训练模块25，用于基于所述样本店铺推荐结果和预设评测标准，生成所述初始大语言模型的评测结果，基于所述评测结果对所述初始大语言模型进行迭代训练，直至所述评测结果满足预设评测要求，得到训练好的大语言模型。

可选的，所述样本数据获取模块21具体用于对点餐推荐场景下的历史搜索记录进行统计，以得到历史高频实体；

根据所述历史高频实体对应的实体类型选取问题构建模板，将所述历史高频实体添加入所述问题构建模板中以生成样本点餐描述数据。

可选的，所述样本店铺获取模块22具体用于确认所述样本点餐描述数据中包含的样本关键实体类型，根据所述样本关键实体类型从所述样本点餐描述数据中确认样本关键实体；

获取与所述样本关键实体相关联的样本候选店铺以及所述样本候选店铺的店铺信息。

可选的，所述样本数据获取模块21具体用于基于点餐推荐场景下的实体类型和实体筛选条件，生成实体问题模板；

根据所述实体类型和所述实体筛选条件确认所述实体问题模板中的实体，根据所述实体和实体问题模板生成样本点餐描述数据。

可选的，所述样本店铺获取模块22具体用于基于所述样本点餐描述数据从店铺集合中获取所述样本候选店铺；

基于所述实体类型获取店铺信息模板；

根据所述店铺信息模板获取所述样本候选店铺的店铺信息。

可选的，所述样本提示生成模块23还用于基于所述实体类型和所述实体筛选条件，生成推理过程描述文本。

可选的，所述预设提示指令模板中还包括模型风格描述文本，所述模型风格描述文本包括模型运作方式描述文本、模型角色描述文本、模型答案格式描述文本中的一种或多种。

需要说明的是，上述实施例提供的店铺推荐装置在执行店铺推荐方法或大语言模型训练方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的店铺推荐装置与店铺推荐方法以及大语言模型训练方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本申请实施例还提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述图2-图10所示实施例的所述方法，具体执行过程可以参见图2-图10所示实施例的具体说明，在此不进行赘述。

请参考图13，其示出了本说明书一个示例性实施例提供的电子设备的结构示意图。本说明书中的电子设备可以包括一个或多个如下部件：处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。

处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个电子设备内的各个部分，通过运行或执行存储在存储器120内的指令、程序、代码集或指令集，以及调用存储在存储器120内的数据，执行终端100的各种功能和处理数据。可选地，处理器110可以采用数字信号处理（Digital Signal Processing，DSP）、现场可编程门阵列（Field－Programmable Gate Array，FPGA）、可编程逻辑阵列（Programmable LogicArray，PLA）中的至少一种硬件形式来实现。处理器110可集成中央处理器（CentralProcessing Unit，CPU）、图像处理器（Graphics Processing Unit，GPU）和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户页面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。

存储器120可以包括随机存储器（Random Access Memory，RAM），也可以包括只读存储器（Read-OnlyMemory，ROM）。可选地，该存储器120包括非瞬时性计算机可读介质（Non-Transitory Computer-Readable Storage Medium）。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等，该操作系统可以是安卓（Android）系统，包括基于Android系统深度开发的系统、苹果公司开发的IOS系统，包括基于IOS系统深度开发的系统或其他系统。

存储器120可分为操作系统空间和用户空间，操作系统即运行于操作系统空间，原生及第三方应用程序即运行于用户空间。为了保证不同第三方应用程序均能够达到较好的运行效果，操作系统针对不同第三方应用程序为其分配相应的系统资源。然而，同一第三方应用程序中不同应用场景对系统资源的需求也存在差异，比如，在本地资源加载场景下，第三方应用程序对磁盘读取速度的要求较高；在动画渲染场景下，第三方应用程序则对GPU性能的要求较高。而操作系统与第三方应用程序之间相互独立，操作系统往往不能及时感知第三方应用程序当前的应用场景，导致操作系统无法根据第三方应用程序的具体应用场景进行针对性的系统资源适配。

为了使操作系统能够区分第三方应用程序的具体应用场景，需要打通第三方应用程序与操作系统之间的数据通信，使得操作系统能够随时获取第三方应用程序当前的场景信息，进而基于当前场景进行针对性的系统资源适配。

其中，输入装置130用于接收输入的指令或数据，输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据，输出装置140包括但不限于显示设备和扬声器等。在一个示例中，输入装置130和输出装置140可以合设，输入装置130和输出装置140为触摸显示屏。

所述触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合，异型屏与曲面屏的结合，本申请实施例对此不加以限定。

除此之外，本领域技术人员可以理解，上述附图所示出的电子设备的结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。比如，电子设备中还包括射频电路、输入单元、传感器、音频电路、WiFi模块、电源、蓝牙模块等部件，在此不再赘述。

在图13所示的电子设备中，处理器110可以用于调用存储器120中存储的计算机应用程序，并具体执行以下操作：

基于点餐推荐场景获取所输入的点餐描述数据；

从店铺集合中获取与所述关键实体相关联的候选店铺；

在一个实施例中，所述处理器110在执行从店铺集合中获取与所述关键实体相关联的候选店铺时，具体执行以下操作：

以所述关键实体为搜索词，获取点餐推荐场景下的高频店铺搜索结果数据；

在一个实施例中，所述处理器110在执行基于预设的推理过程描述文本、所述点餐描述数据和所述候选店铺，生成大语言模型的提示指令时，具体执行以下操作：

将模型风格描述文本、所述点餐描述数据、所述候选店铺及所述推理过程描述文本拼接为大语言模型的提示指令。

在一个实施例中，所述模型风格描述文本包括模型答案格式描述文本、模型运作方式描述文本、模型角色描述文本中的一种或多种。

在一个实施例中，所述处理器110在执行基于所述提示指令，采用所述大语言模型生成店铺推荐结果时，具体执行以下操作：

按照所述推理过程描述文本，采用所述大语言模型从所述点餐描述数据中提取用户需求；

根据所述用户需求确认筛选条件；

在一个实施例中，所述处理器110在执行按照所述推理过程描述文本，采用所述大语言模型从所述点餐描述数据中提取用户需求时，具体执行以下操作：

根据所述目标实体类型对应的目标实体生成用户需求。

在一个实施例中，所述处理器110在执行根据所述匹配分析结果生成店铺推荐结果时，具体执行以下操作：

根据所述匹配分析结果确认满足所述用户需求的推荐店铺；

基于所述推荐店铺生成店铺推荐结果。

在一个实施例中，所述处理器110在执行基于所述推荐店铺生成店铺推荐结果时，具体执行以下操作：

基于所述匹配分析结果确认所述推荐店铺的推荐理由；

基于所述推荐理由和所述推荐店铺生成店铺推荐结果。

基于所述推理过程和所述推荐店铺生成所述店铺推荐结果。

在一个实施例中，所述处理器110在调用存储器120中存储的计算机应用程序时，具体执行以下操作：

获取样本点餐描述数据；

在一个实施例中，所述处理器110在执行获取样本点餐描述数据时，具体执行以下操作：

对点餐推荐场景下的历史搜索记录进行统计，以得到历史高频实体；

在一个实施例中，所述处理器110在执行基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息时，具体执行以下操作：

确认所述样本点餐描述数据中包含的样本关键实体类型，根据所述样本关键实体类型从所述样本点餐描述数据中确认样本关键实体；

基于点餐推荐场景下的实体类型和实体筛选条件，生成实体问题模板；

基于所述样本点餐描述数据从店铺集合中获取所述样本候选店铺；

基于所述实体类型获取店铺信息模板；

根据所述店铺信息模板获取所述样本候选店铺的店铺信息。

在一个实施例中，所述处理器110还用于执行：

基于所述实体类型和所述实体筛选条件，生成推理过程描述文本。

在一个实施例中，所述预设提示指令模板中还包括模型风格描述文本，所述模型风格描述文本包括模型运作方式描述文本、模型角色描述文本、模型答案格式描述文本中的一种或多种。

在本申请实施例中，通过通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，从店铺集合中获取与关键实体相关联的候选店铺，基于预设的推理过程描述文本、点餐描述数据和候选店铺，生成大语言模型的提示指令，推理过程描述文本用于描述大语言模型的推理逻辑，基于提示指令，采用大语言模型生成店铺推荐结果。通过获取用户输入的点餐描述数据，确认候选店铺，根据候选店铺、点餐描述数据和预设的推理过程描述文本生成提示指令，将提示指令输入至大语言模型，使用大语言模型进行端到端的生成式的推荐工作流程，能够承接复杂的点餐描述数据，提高推荐的泛化能力，解决规则无法覆盖的问题，提高店铺推荐的准确性。

进一步地，通过基于点餐推荐场景获取所输入的点餐描述数据，确认点餐描述数据中包含的关键实体类型，根据关键实体类型从点餐描述数据中确认关键实体，以关键实体为搜索词，获取点餐推荐场景下的高频店铺搜索结果数据，将高频店铺搜索结果数据中包含的店铺确认为候选店铺，通过筛选高频搜索结果数据能提高候选店铺与点餐描述数据的相关性，并将模型推理范围限制在一定范围内，提高模型推理的效率；将模型风格描述文本、点餐描述数据、候选店铺及推理过程描述文本拼接为大语言模型的提示指令，通过在提示指令中加入模型风格描述文本，可以控制模型的输出风格，增加模型输出结果的可控性，使大语言模型更加人性化；然后按照推理过程描述文本，采用大语言模型从点餐描述数据中提取用户需求，根据用户需求确认筛选条件，根据提示指令中候选店铺的店铺信息，生成候选店铺与筛选条件的匹配分析结果，根据匹配分析结果生成店铺推荐结果，店铺推荐结果中可以包括推荐店铺、推荐理由和推理过程。基于大语言模型能够根据其语言生成能力提供解释（推理过程），帮助用户理解影响推荐的因素，有助于提高推荐的可解释性。

进一步地，通过获取样本点餐描述数据，基于样本点餐描述数据，获取样本候选店铺以及样本候选店铺的店铺信息，将样本点餐描述数据和样本候选店铺添加至预设提示指令模板中，以生成样本提示指令，预设提示指令模板中至少包括推理过程描述文本，推理过程描述文本用于描述大语言模型的推理逻辑，将样本提示指令输入至初始大语言模型中，采用初始大语言模型输出样本点餐描述数据对应的样本店铺推荐结果，基于样本店铺推荐结果和预设评测标准，生成初始大语言模型的评测结果，基于评测结果对初始大语言模型进行迭代训练，直至评测结果满足预设评测要求，得到训练好的大语言模型。通过预先训练大语言模型，在提示指令中基于思维链加入推理过程描述文本，在大模型的输出过程中要求其输出推理过程，以得到能够在点餐推荐场景下准确生成店铺推荐结果的大语言模型。

进一步地，在生成样本点餐描述数据时，可以通过对点餐推荐场景下的历史搜索记录进行统计，以得到历史高频实体，根据历史高频实体对应的实体类型选取问题构建模板，将历史高频实体添加入问题构建模板中以生成样本点餐描述数据。然后再确认样本点餐描述数据中包含的样本关键实体类型，根据样本关键实体类型从样本点餐描述数据中确认样本关键实体，获取与样本关键实体相关联的样本候选店铺以及样本候选店铺的店铺信息。基于历史搜索记录生成训练样本数据，可以使模型具备对常见的条件进行推理分析的能力。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存储记忆体（Random AccessMemory，RAM）等。

以上所揭露的仅为本说明书较佳实施例而已，当然不能以此来限定本说明书之权利范围，因此依本说明书权利要求所作的等同变化，仍属本说明书所涵盖的范围。

Claims

1.一种店铺推荐方法，其特征在于，包括：

基于点餐推荐场景获取所输入的点餐描述数据；

从店铺集合中获取与所述关键实体相关联的候选店铺；

2.如权利要求1所述的方法，其特征在于，所述从店铺集合中获取与所述关键实体相关联的候选店铺，包括：

3.如权利要求1所述的方法，其特征在于，所述基于预设的推理过程描述文本、所述点餐描述数据和所述候选店铺，生成大语言模型的提示指令，包括：

4.如权利要求3所述的方法，其特征在于，所述模型风格描述文本包括模型答案格式描述文本、模型运作方式描述文本、模型角色描述文本中的一种或多种。

5.如权利要求1所述的方法，其特征在于，所述基于所述提示指令，采用所述大语言模型生成店铺推荐结果，包括：

根据所述用户需求确认筛选条件；

6.如权利要求5所述的方法，其特征在于，所述按照所述推理过程描述文本，采用所述大语言模型从所述点餐描述数据中提取用户需求，包括：

根据所述目标实体类型对应的目标实体生成用户需求。

7.如权利要求5所述的方法，其特征在于，所述根据所述匹配分析结果生成店铺推荐结果，包括：

根据所述匹配分析结果确认满足所述用户需求的推荐店铺；

基于所述推荐店铺生成店铺推荐结果。

8.如权利要求7所述的方法，其特征在于，所述基于所述推荐店铺生成店铺推荐结果，包括：

基于所述匹配分析结果确认所述推荐店铺的推荐理由；

基于所述推荐理由和所述推荐店铺生成店铺推荐结果。

9.如权利要求7所述的方法，其特征在于，所述基于所述推荐店铺生成店铺推荐结果，包括：

基于所述推理过程和所述推荐店铺生成所述店铺推荐结果。

10.一种大语言模型训练方法，其特征在于，包括：

获取样本点餐描述数据；

11.如权利要求10所述的方法，其特征在于，所述获取样本点餐描述数据，包括：

12.如权利要求10所述的方法，其特征在于，所述基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息，包括：

13.如权利要求10所述的方法，其特征在于，所述获取样本点餐描述数据，包括：

14.如权利要求13所述的方法，其特征在于，所述基于所述样本点餐描述数据，获取样本候选店铺以及所述样本候选店铺的店铺信息，包括：

基于所述实体类型获取店铺信息模板；

根据所述店铺信息模板获取所述样本候选店铺的店铺信息。

15.如权利要求13所述的方法，其特征在于，所述方法还包括：

16.如权利要求10所述的方法，其特征在于，所述预设提示指令模板中还包括模型风格描述文本，所述模型风格描述文本包括模型运作方式描述文本、模型角色描述文本、模型答案格式描述文本中的一种或多种。

17.一种店铺推荐装置，其特征在于，所述装置包括：

问题获取模块，用于获取点餐推荐场景下的点餐描述数据；

18.一种店铺推荐装置，其特征在于，所述装置包括：

样本数据获取模块，用于获取样本点餐描述数据；

19.一种电子设备，其特征在于，包括：处理器和存储器；其中存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1至16中任一项所述方法的步骤。

20.一种存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至16中任一项所述方法的步骤。