CN116663647A

CN116663647A - 基于网页搜索的意图分析大模型训练方法及相关设备

Info

Publication number: CN116663647A
Application number: CN202310436424.1A
Authority: CN
Inventors: 王玉龙; 苏森; 朱昊
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2023-04-21
Filing date: 2023-04-21
Publication date: 2023-08-29

Abstract

本申请提供一种基于网页搜索的意图分析大模型训练方法及相关设备，包括：获取原始数据集及神经网络模型；根据所述原始数据对所述神经网络模型进行自监督训练，得到预训练模型；获取搜索记录，并进行标注，生成训练数据；根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型。该方法通过标注合格的搜索动作数据，并将合格的搜索动作数据作为训练数据，利用训练数据及预设反馈数据对模型进行训练，使得目标训练模型的意图分析过程更加准确，预测结果更加准确，从而提高了网页搜索意图分析和预测的准确性和高效性。

Description

基于网页搜索的意图分析大模型训练方法及相关设备

技术领域

本申请涉及深度学习技术领域，尤其涉及一种基于网页搜索的意图分析大模型训练方法及相关设备。

背景技术

随着深度学习技术的发展，各种大自然语言模型已经在意图分析领域取得了广泛应用。然而，传统的意图分析方法无法即时获取互联网中的信息，进行网页搜索的意图分析。且传统的意图分析方法往往需要大量的人力和时间，效率较低，意图分析和预测的准确性和高效性较低，难以实现对大规模数据的实时分析。

发明内容

有鉴于此，本申请的目的在于提出一种基于网页搜索的意图分析大模型训练方法及相关设备，以解决现有的意图分析方法无法即时获取互联网中的信息，进行网页搜索的意图分析的问题，提高了网页搜索意图分析和预测的准确性和高效性。

基于上述目的，本申请提供了一种基于网页搜索的意图分析大模型训练方法，包括：

获取原始数据集及神经网络模型；

根据所述原始数据对所述神经网络模型进行自监督训练，得到预训练模型；

获取搜索记录，并进行标注，生成训练数据；

根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型。

进一步地，所述搜索记录包括多个搜索动作数据；

所述获取搜索记录，并进行标注，生成训练数据，包括：

获取多个搜索动作数据，将多个搜索动作数据与预设搜索动作数据对比，得到对比结果；

响应于对比结果达到预设阈值，则将搜索动作数据进行标注，并作为合格的搜索动作数据；其中，每个所述合格的搜索动作数据均包括搜索数据和至少一个动作数据；

将所有所述合格的搜索动作数据作为训练数据。

进一步地，所述根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型，包括：

根据所述训练数据对所述预训练模型进行训练，得到第一训练模型；

根据预设反馈数据对所述预训练模型进行训练，得到第二训练模型；

利用强化学习算法将所述第一训练模型和第二训练模型合并训练；

将所述第一训练模型、第二训练模型和将两个模型合并训练的过程迭代训练，响应于迭代轮数达到迭代轮数阈值，停止迭代训练，生成目标训练模型。

利用强化学习算法将所述第一训练模型、第二训练模型合并训练；

将所述第一训练模型、第二训练模型和将两个模型合并训练的过程迭代训练，响应于接收到结束指令，停止得带训练，生成目标训练模型。

进一步地，所述根据所述训练数据对所述预训练模型进行训练，包括：

所述动作数据包括带有时间标签的多个动作子数据，所述多个动作子数据中包括一当前时刻数据，位于该当前时刻数据之后的至少一动作子数据则为下一时刻数据；

将一动作子数据作为当前时刻数据输入至所述预训练模型中；

将当前时刻数据对应的下一时刻数据作为作为预训练模型的输出结果，所述动作子数据为引用、上翻、下翻的一种。

将所述合格的搜索动作数据的搜索数据输入至所述预训练模型中；

将至少一所述动作数据作为预训练模型的输出结果，所述动作数据包括引用、上翻、下翻中的至少一种。

进一步地，所述根据预设反馈数据对所述预训练模型进行训练，包括：

将所述合格的搜索动作数据的搜索数据或所述动作数据输入至所述预训练模型中；

将预设的动作数据作为预训练模型的输出结果，所述预设的动作数据包括引用、上翻、下翻中的至少一种。

进一步地，所述方法还包括：基于预设测试数据及预设答案对所述目标训练模型进行验证，确定所述目标训练模型是否合格。

进一步地，所述基于预设测试数据及预设答案对所述目标训练模型进行验证，确定所述目标训练模型是否合格，包括：

将预设测试数据输入至目标训练模型中，得到输出结果；

将所述输出结果与所述预设答案对比，得到对比值；

响应于所述对比值达到预设对比值，则确定所述目标训练模型合格。

基于上述目的，本申请二方面提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任意一项所述的方法。

基于上述目的，本申请第三方面提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行如上述任意一项所述的方法。

从上面所述可以看出，本申请提供的一种基于网页搜索的意图分析大模型训练方法，首先获取原始数据集及神经网络模型；之后根据所述原始数据对所述神经网络模型进行自监督训练，得到预训练模型；再获取搜索记录，并进行标注，生成训练数据；之后根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型。该方法通过标注合格的搜索动作数据，并将合格的搜索动作数据作为训练数据，利用训练数据及预设反馈数据对模型进行训练，使得目标训练模型的意图分析过程更加准确，预测结果更加准确，从而提高了网页搜索意图分析和预测的准确性和高效性。

附图说明

为了更清楚地说明本申请或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的一种基于网页搜索的意图分析大模型训练方法流程示意图；

图2为本申请实施例的一种基于网页搜索的意图分析大模型训练装置结构示意图；

图3为本申请实施例的电子设备硬件结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本申请进一步详细说明。

需要说明的是，除非另外定义，本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

参考图1，本申请提供了一种基于网页搜索的意图分析大模型训练方法，包括：

步骤S100、获取原始数据集及神经网络模型。

在本步骤中，根据不同的场景需求获取原始数据集，原始数据集可为互联网公开的数据集或者上传的自定义数据集。

所述原始数据集示例性的可为文字或文章，例如：大量的文字或文字解释，文字相关的文章(例如维基百科中的文章)。所述神经网络模型为大模型，该大模型包括GPT-2，GPT-3中的至少一种。

步骤S200、根据所述原始数据对所述神经网络模型进行自监督训练，得到预训练模型。

在本步骤中，根据使用场景选择现有的公开及或上传的自定义数据集输入至GPT网络(GPT-2，GPT-3中的至少一种)中进行自监督训练，得到预训练模型。

步骤S300、获取搜索记录，并进行标注，生成训练数据。

在本步骤中，搜索记录是根据需求在互联网上使用爬虫程序抓取的新闻社交媒体、论坛等舆论数据，也可以选择使用谷歌和Bing等搜索引擎提供的API接口实时获取数据。获取到的数据需要进行数据清洗、去重、筛选等操作，标注，来确定合格的搜索记录，并将合格的搜索记录作为训练数据，使预训练模型学习的数据更加准确。

步骤S400、根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型。

在本步骤中，通过训练数据对预训练模型进行训练，得到一个训练模型，然后通过预设反馈数据对预训练模型进行训练，得到另一个训练模型，然后对两个训练模型进行合并训练，得到目标训练模型，该目标训练模型通过强化学习算法利用两个不同的训练模型合并训练，该目标训练模型的意向分析的能力更强。

具体地，通过上述步骤S100-S400生成的目标训练模型，通过标注的合格的搜索数据作为训练数据，通过预设反馈数据对预训练模型进行训练，得到两个不同的训练模型，通过强化学习算法对两个训练模型合并训练，使目标训练模型的意向分析能力更强，意向分析的过程更加准确，预测结果更加准确。

在一些实施例中，所述搜索记录包括多个搜索动作数据；

所述获取搜索记录，并进行标注，生成训练数据，包括：

将所有所述合格的搜索动作数据作为训练数据。

具体地，预设搜索动作数据包括预先设定的搜索数据，与搜索数据对应的至少一种预先设定的动作数据(引用、上翻、下翻中的至少一种)，预设阈值为100％。例如，输入搜索内容(例如，4G)，执行动作数据下翻，下一个动作数据为引用(例如，引用的网页示出的是第二条记录)；预设搜索动作数据的搜索词为4G，预设动作数据为下翻，下一预设动作数据为引用(例如，引用的网页示出的是第二条记录)。将多个搜索动作数据与预设搜索动作数据对比，对比结果为100％，对比结果达到预设阈值，说明该搜索动作数据为合格，则将该搜索动作数据进行标注。通过合格的搜索动作数据训练预训练模型，可使预训练模型的意图分析能力更强，意图分析过程更准确。

在一些实施例中，所述根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型；

具体地，示例性的，所述训练数据包括一个搜索数据(即一个搜索词)，多个动作数据(下翻、上翻、引用)，将搜索词输入至预训练模型中，将下翻动作作为训练模型的输出结果的第一答案，将上翻动作作为第二答案，将引用作为第三答案，得到第一训练模型。

示例性的，预设反馈数据包括一个搜索数据(即一个搜索词)，多个动作数据(下翻、上翻、引用)，将搜索词输入至预训练模型中，将引用动作作为训练模型的输出结果的第一答案，将上翻动作作为第二答案，将下翻动作作为第三答案，得到第二训练模型。

利用强化学习算法(即PPO算法)将第一训练模型和第二训练模型进行合并训练；

重复迭代上述步骤，直至迭代轮数达到迭代轮数阈值，则停止训练，生成目标训练模型。即利用多个搜索数据对第一训练模型和第二训练模型进行训练，且利用强化学习算法将第一训练模型和第二训练模型的过程迭代训练，生成的目标训练模型意图分析过程更加准确。

重复迭代上述步骤，直至接收到结束迭代指令，则停止训练，生成目标训练模型。即利用多个搜索数据对第一训练模型和第二训练模型进行训练，且利用强化学习算法将第一训练模型和第二训练模型的过程迭代训练，生成的目标训练模型意图分析过程更加准确。

在一些实施例中，所述根据所述训练数据对所述预训练模型进行训练，包括：

具体地，示例性的，当前时刻数据(当前的动作子数据为下翻)的时间为13:04:50，下一时刻数据(下一个动作子数据为下翻)的时间为13:05:20，再下一时刻数据(下一个动作子数据为上翻)的时间为13:05:50，在下一时刻数据(下一个动作子数据为引用)的时间为13:06:30。

将动作子数据(下翻)输入至预设训练模型中；将下翻动作作为预训练模型的输出结果的第一答案，将上翻动作作为第二答案，将引用作为第三答案。

具体地，示例性的，将搜索数据(搜索词4G)输入至预训练模型中；将下翻动作作为预训练模型的输出结果的第一答案，将上翻动作作为第二答案，将引用作为第三答案。

在一些实施例中，所述根据预设反馈数据对所述预训练模型进行训练，包括：

具体地，示例性的，将搜索数据(搜索词4G)输入至预训练模型中；将预先设定好的答案(引用动作为第一答案，上翻为第二答案，引用为第三答案)，作为训练模型的输出结果。

或，将搜索数据对应的动作数据(下翻)输入至预设训练模型中；将预先设定好的答案(引用动作为第一答案，上翻为第二答案，引用为第三答案)，作为训练模型的输出结果。

在一些实施例中，所述方法还包括：基于预设测试数据及预设答案对所述目标训练模型进行验证，确定所述目标训练模型是否合格。

具体地，示例性的，预设测试数据包括搜索词为4G，动作数据为下翻、引用。预设答案包括搜索词4G，动作数据包括下翻、引用。将预设测试数据输入至目标训练模型中，所述目标训练模型输出结果与预设答案对比，得到对比值，根据对比值确定目标训练模型是否合格。

在一些实施例中，所述基于预设测试数据及预设答案对所述目标训练模型进行验证，确定所述目标训练模型是否合格，包括：

将预设测试数据输入至目标训练模型中，得到输出结果；

将所述输出结果与所述预设答案对比，得到对比值；

具体地，示例性的，预设测试数据的搜索词4G输入至目标训练模型中，得到输出结果为下翻、引用；将输出结果与预设答案对比(下翻、引用)，得到对比值为100％，对比值等于预设阈值，因此，目标训练模型的输出结果与预设答案一致，确定目标训练模型合格。

进一步地，上翻、下翻指页面的上下滚动窗口的动作。引用指的是点击页面示出的相关文章。

需要说明的是，本申请的实施例还可以以下方式进一步描述：

选定意图分析的目标对象，生成关键词，将关键词输入至目标训练模型中，进行意图分析：

目标训练模型根据输入的关键词不断的输出结果(其输出结果为搜索引擎的过程，即每个动作数据，示例性的上滚动窗口、下滚动窗口、引用文章中的至少一种)，待目标训练模型输出最终结果。

需要说明的是，本申请实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。

需要说明的是，上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

基于同一发明构思，与上述任意实施例方法相对应的，本申请还提供了一种基于网页搜索的意图分析大模型训练装置。

参考图2，所述一种基于网页搜索的意图分析大模型训练装置，包括：

获取模块201，用于获取原始数据集及神经网络模型；

第一训练模块202，用于根据所述原始数据对所述神经网络模型进行自监督训练，得到预训练模型；

生成模块203，用于获取搜索记录，并进行标注，生成训练数据；

第二训练模块204，用于根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

上述实施例的装置用于实现前述任一实施例中相应的一种基于网页搜索的意图分析大模型训练方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

基于同一发明构思，与上述任意实施例方法相对应的，本申请还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上任意一实施例所述的一种基于网页搜索的意图分析大模型训练方法。

图3示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(Random AccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

上述实施例的电子设备用于实现前述任一实施例中相应的一种基于网页搜索的意图分析大模型训练方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

基于同一发明构思，与上述任意实施例方法相对应的，本申请还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机执行如上任一实施例所述的一种基于网页搜索的意图分析大模型训练方法。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的一种基于网页搜索的意图分析大模型训练方法，并且具有相应的方法实施例的有益效果，在此不再赘述。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本申请的范围(包括权利要求)被限于这些例子；在本申请的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本申请实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。

另外，为简化说明和讨论，并且为了不会使本申请实施例难以理解，在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本申请实施例难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本申请的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此，这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本申请的具体实施例对本申请进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态RAM(DRAM))可以使用所讨论的实施例。

本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本申请实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于网页搜索的意图分析大模型训练方法，其特征在于，包括：

获取原始数据集及神经网络模型；

获取搜索记录，并进行标注，生成训练数据；

2.根据权利要求1所述的方法，其特征在于，所述搜索记录包括多个搜索动作数据；

所述获取搜索记录，并进行标注，生成训练数据，包括：

响应于对比结果到达预设阈值，则将搜索动作数据进行标注，并作为合格的搜索动作数据；其中，每个合格的搜索动作数据均包括搜索数据和至少一个动作数据；

将所有所述合格的搜索动作数据作为训练数据。

3.根据权利要求2所述的方法，其特征在于，所述根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型，包括：

根据所述训练数据对所述预训练模型进行迭代训练，得到第一训练模型；

根据预设反馈数据对所述预训练模型进行迭代训练，得到第二训练模型；

4.根据权利要求2所述的方法，其特征在于，所述根据所述训练数据及预设反馈数据对所述预训练模型训练，得到目标训练模型，包括：

将所述第一训练模型、第二训练模型和将两个模型合并训练的过程迭代训练，响应于接收到结束指令，停止迭代训练，生成目标训练模型。

5.根据权利要求3或4所述的方法，其特征在于，所述根据所述训练数据对所述预训练模型进行训练，包括：

6.根据权利要求3或4所述的方法，其特征在于，所述根据所述训练数据对所述预训练模型进行训练，包括：

7.根据权利要求3或4所述的方法，其特征在于，所述根据预设反馈数据对所述预训练模型进行训练，包括：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

基于预设测试数据及预设答案对所述目标训练模型进行验证，确定所述目标训练模型是否合格。

9.根据权利要求8所述的方法，其特征在于，所述基于预设测试数据及预设答案对所述目标训练模型进行验证，确定所述目标训练模型是否合格，包括：

将预设测试数据输入至目标训练模型中，得到输出结果；

将所述输出结果与所述预设答案对比，得到对比值；

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至9任一所述的方法。