CN117474598A

CN117474598A - 广告搜索方法、模型训练方法及装置

Info

Publication number: CN117474598A
Application number: CN202311337193.5A
Authority: CN
Inventors: 戴琳; 黄飞; 贺登武
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2023-10-16
Filing date: 2023-10-16
Publication date: 2024-01-30

Abstract

本公开提出了一种广告搜索方法、模型训练方法及装置，涉及人工智能技术领域，具体为深度学习、自然语言处理和大模型等技术领域，可应用于智能搜索等场景，方法包括：获取用户搜索词；将所述用户搜索词输入至大模型，通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主；基于所述广告主，从所述候选广告中确定待搜索的目标广告，由此，本公开通过大模型，可以确定与候选广告关联的广告主，在广告主的限制下，确定待搜索的目标广告，提高了广告搜索的效率，并保证了广告搜索结果的精度，提升了用户体验。

Description

广告搜索方法、模型训练方法及装置

技术领域

本公开涉及人工智能技术领域，具体为深度学习、自然语言处理和大模型等技术领域，尤其涉及一种广告搜索方法、模型训练方法、装置、电子设备、存储介质和计算机程序产品。

背景技术

目前，随着人工智能技术的不断发展，大语言模型具有泛化性好等优点，在信息提取、文本可信度评估、机器翻译等领域中得到了广泛应用。然而，相关技术中的广告搜索方法，存在广告搜索过程中存在的精度和效率较低的问题。

发明内容

本公开提出了一种广告搜索方法、模型训练方法、装置、电子设备、存储介质和计算机程序产品。

根据本公开的第一方面，提出了一种广告搜索方法，包括：获取用户搜索词；将所述用户搜索词输入至大模型，通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主；基于所述广告主，从所述候选广告中确定待搜索的目标广告。

根据本公开的第二方面，提出了一种模型训练方法，包括：获取训练样本，其中，所述训练样本包括样本广告信息和样本广告主；根据所述训练样本，对大模型进行训练。

根据本公开的第三方面，提出了一种广告搜索装置，包括：获取模块，用于获取用户搜索词；第一确定模块，用于将所述用户搜索词输入至大模型，通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主；第二确定模块，用于基于所述广告主，从所述候选广告中确定待搜索的目标广告。

根据本公开的第四方面，提出了一种模型训练装置，包括第一获取模块，用于获取训练样本，其中，所述训练样本用于样本广告信息和样本广告主；训练模块，用于根据所述训练样本，对大模型进行训练。

根据本公开的第五方面，提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的广告搜索方法，或者执行上述第二方面提出的模型训练方法。

根据本公开的第六方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述第一方面提出的广告搜索方法，或者执行上述第二方面提出的模型训练方法。

根据本公开的第七方面，提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面提出的广告搜索方法，或者实现上述第二方面提出的模型训练方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1为本公开一实施例的广告搜索方法的流程示意图；

图2为本公开另一实施例的广告搜索方法的流程示意图；

图3为本公开另一实施例的广告搜索方法的流程示意图；

图4为本公开另一实施例的模型训练方法的流程示意图；

图5为本公开另一实施例的模型训练方法的流程示意图；

图6为本公开另一实施例的模型训练方法的流程示意图；

图7为本公开另一实施例的模型训练方法的流程示意图；

图8为本公开一实施例的模型训练装置的结构示意图；

图9为本公开一实施例的电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

人工智能(Artificial Intelligence，简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。目前，AI技术具有自动化程度高、精确度高、成本低的优点，得到了广泛的应用。

深度学习(Deep Learning，简称DL)是机器学习(Machine Learning，简称ML)领域中一个新的研究方向，是学习样本数据的内在规律和表示层次，使得机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据的一门科学，广泛应用于语音和图像识别。

自然语言处理(Natural Language Processing，简称NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型，需要大量的计算资源和存储空间来训练和存储，并且往往需要进行分布式计算和特殊的硬件加速技术，大模型具有更强的泛化能力和表达能力。

图1为本公开一实施例的广告搜索方法的流程示意图。如图1所示，该方法包括：

S101，获取用户搜索词。

需要说明的是，本公开实施例的广告搜索方法的执行主体可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选地，执行主体可包括工作站、服务器，计算机、用户终端及其他智能设备。其中，用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。

需要说明的是，用户搜索词(query)是用户在终端设备输入的搜索信息，例如：用户在手机上输入的搜索信息、用户在电脑上输入的搜索信息等。

需要说明的是，当用户在终端设备输入搜索信息(用户搜索词)后，可以直接获取用户搜索词。

需要说明的是，本公开对于用户搜索词的形式不作限定。例如：用户搜索词可以为词语、句子、一个文字段落等。

举例而言，用户搜索词可以为“耳机”；用户搜索词还可以为“X考试的报名时间”。

S102，将用户搜索词输入至大模型，通过大模型基于用户搜索词，确定与候选广告关联的广告主。

其中，广告主为是指为推销商品或者提供服务，自行或者委托他人设计、制作、发布广告的法人、其他经济组织或者个人，广告主是广告活动的发起者，是在网上销售或宣传自己产品和服务的商家，是联盟营销广告的提供者。任何推广、销售其产品或服务的商家都可以作为广告主。

需要说明的是，大模型为采用深度学习算法进行预先训练完成的，在将输入用户搜索词输入至大模型，可以通过大模型基于用户搜索词，输出与候选广告关联的广告主。

可选地，可以选取一个底座大模型，对选取的底座大模型的进行模型训练。

举例而言，可以采用监督微调(Supervised Fine-Tuning，简称SFT)策略，对大模型进行训练。

需要说明的是，对于候选广告关联的广告主的数量往往为多个。

S103，基于广告主，从候选广告中确定待搜索的目标广告。

在本公开实施例中，在获取到广告主后，可以基于广告主，从候选广告中确定待搜索的目标广告。

可选地，可以获取广告主的业务信息，基于用户搜索词和业务信息，从候选广告中确定目标广告。

可选地，可以获取用户搜索词和业务信息之间的相似度，根据相似度，从候选广告中确定目标广告。

本公开提出的广告搜索方法，通过获取用户搜索词，将用户搜索词输入至大模型，通过大模型基于用户搜索词，确定与候选广告关联的广告主，基于广告主，从候选广告中确定待搜索的目标广告，由此，本公开通过大模型，可以确定与候选广告关联的广告主，在广告主的限制下，确定待搜索的目标广告，提高了广告搜索的效率，并保证了广告搜索结果的精度，提升了用户体验。

图2是根据本公开第二实施例的广告搜索方法的流程示意图。

如图2所示，在图1所示实施例的基础上，本公开实施例的图案生成方法具体可包括以下步骤：

S201，获取用户搜索词。

步骤S201的相关内容，可参见上述实施例，这里不再赘述。

S202，将用户搜索词输入至大模型，通过大模型基于用户搜索词，确定与候选广告关联的广告主。

在本公开实施例中，通过大模型识别用户搜索词为第一类用户搜索词，基于第一类用户搜索词，确定第一广告主，其中，第一广告主为真实广告主。

其中，第一广告主为真实广告主，即真实存在的广告主。

需要说明的是，第一类用户搜索词的资源价值(商业价值)往往高于第二类用户搜索词，即“高商”样本搜索词。

在本公开实施例中，通过大模型识别用户搜索词为第二类用户搜索词，基于第二类用户搜索词，确定第二广告主并生成指示信息，其中，第二广告主为虚拟广告主，指示信息用于指示第二类用户搜索词不存在待搜索的目标广告。

其中，第二广告主为虚拟广告主，即并未真实存在的广告主，预先构建虚拟的广告主。

需要说明的是，第二类样本搜索词的资源价值(商业价值)往往较低，即“低商”样本搜索词。

进一步地，在识别到用户搜索词为第二类用户搜索词后，可以向第二类用户搜索词的来源客户端发送指示信息。

上述实施例中的步骤S103“基于广告主，从候选广告中确定待搜索的目标广告”具体可包括以下步骤S203和S203。

S203，获取广告主的业务信息。

需要说明的是，不同的广告主对应的业务信息可能相同或不相同，广告主的业务信息可能存在一个或多个。

举例而言，广告主1的业务信息为教育类、金融类；广告主2的业务信息为教育类、医疗类等。

可选地，在获取到广告主的业务信息后，可以构建广告主业务信息数据库。

S204，基于用户搜索词和业务信息，从候选广告中确定目标广告。

上述实施例中的步骤S204“基于用户搜索词和业务信息，从候选广告中确定目标广告”具体可包括以下步骤S205和S206。

S205，获取用户搜索词和业务信息之间的相似度。

在本公开实施例中，在获取到广告主业务信息数据库后，可以获取用户搜索词和业务信息之间的相似度。

需要说明的是，本公开对于获取用户搜索词和业务信息之间的相似度的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以通过近似最近邻搜索算法(Approximate Nearest Neighbor，简称ANN)，获取用户搜索词和业务信息之间的相似度。

S206，根据相似度，从候选广告中确定目标广告。

在本公开实施例中，在获取到用户搜索词和业务信息之间的相似度后，可以根据用户搜索词和业务信息之间的相似度，从候选广告中确定目标广告。

可选地，若用户搜索词和业务信息之间的相似度大于相似度阈值，将业务信息对应的候选广告确定为目标广告。

需要说明的是，本公开对于相似度阈值的设置不作限定，可以根据实际情况进行设定。例如：可以设定相似度阈值为80％；又例如：可以设定相似度阈值为85％。

举例而言，针对相似度阈值为80％，若用户搜索词和业务信息之间的相似度大于80％，则将该部分业务信息对应的候选广告确定为目标广告。

可选地，可以对多个候选广告按照相似度降序排序，将排序前N个的候选广告确定为目标广告，其中，N为正整数。

需要说明的是，本公开对于N的数量的设置不作限定，可以根据实际情况进行设定。例如：可以设定N为500；又例如：可以设定N为200。

举例而言，针对N为500，可以对多个候选广告按照相似度降序排序，根据排序结果将排序前500个的候选广告确定为目标广告。

综上，本公开提出的广告搜索方法，通过获取用户搜索词，将用户搜索词输入至大模型，通过大模型基于用户搜索词，确定与候选广告关联的广告主，并获取广告主的业务信息，获取用户搜索词和业务信息之间的相似度，根据相似度，从候选广告中确定目标广告，通过大模型，提升了对用户搜索词的理解，进而提升了搜索结果精度，通过大模型基于用户搜索词生成广告主，保证了广告的多样性，进而提升了广告搜索的效率，实现了端到端的广告定向。

图3为本公开一实施例的模型训练方法的流程示意图。如图3所示，该方法包括：

S301，获取训练样本，其中，训练样本包括样本广告信息和样本广告主。

需要说明的是，本公开实施例的模型训练方法的执行主体可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选地，执行主体可包括工作站、服务器，计算机、用户终端及其他智能设备。其中，用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。

需要说明的是，本申请对于获取训练样本的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以获取样本广告信息，将样本广告信息和样本广告主进行关联，以得到训练样本。

在本公开实施例中，样本广告信息可以为样本广告关键词和/或样本广告落地页信息。

举例而言，可以将样本广告关键词a1和样本广告落地页信息b1与样本广告主甲进行关联，获取训练样本1。

在本公开实施例中，样本广告信息还可以为样本用户搜索词，可以对样本用户搜索词进行分类，将样本用户搜索词划分为第一类样本用户搜索词和第二类样本用户搜索词，根据不同类型的用户搜索词，确定对应的样本广告主。

可选地，针对第一类样本用户搜索词，对应的样本广告主为真实广告主，可以将第一类样本用户搜索词和真实广告主进行关联，获取训练样本。

举例而言，可以第一类将用户搜索词query1与样本广告主乙进行关联，获取训练样本2。

可选地，针对第二类样本用户搜索词，对应的样本广告主为虚拟广告主，将第二类样本用户搜索词与虚拟广告主和指示信息进行关联，获取训练样本，其中，指示信息用于指示第二类样本用户搜索词不存在待搜索的目标广告。

举例而言，可以第二类将用户搜索词query2与样本广告主A和指示信息进行关联，获取训练样本3。

S302，根据训练样本，对大模型进行训练。

在本公开实施例中，在获取到训练样本后，可以根据训练样本，对大模型进行训练。

需要说明的是，针对大模型的类型，可以根据实际情况进行选取，这里不做过多限定。

需要说明的是，针对大模型的训练方法，可以采用监督微调SFT策略，对大模型进行训练。

可选地，可以根据获取的多个训练样本，将训练样本中的样本广告信息输入至大模型中，由大模型输出预测广告主，基于预测广告主和训练样本中的样本广告主，对大模型进行训练。

举例而言，可以基于预测广告主和样本广告主，获取大模型的损失函数，基于损失函数对大模型的模型参数进行更新，并返回采用下一个训练样本，继续对调整模型参数后的大模型进行训练，直至满足模型训练结束条件。

需要说明的是，本公开对于模型训练结束条件的设置不作限定，可以根据实际情况进行设置模型训练结束条件。

可选地，可以设置模型训练结束条件为损失函数值小于预设的损失阈值；可选地，还可以置模型训练结束条件为大模型的模型参数的调整次数达到预设次数阈值。

本公开提出的模型训练方法，获取训练样本，其中，训练样本包括样本广告信息和样本广告主，根据训练样本，对大模型进行训练，由此，通过获取的多种训练样本对大模型进行训练，提高了训练样本的全面性和准确性，提高了大模型训练过程中的准确性和可靠性，为基于大模型进行广告搜索处理奠定了基础。

图4为本公开另一实施例的模型训练方法的流程示意图。如图4所示，该方法包括：

上述实施例中的步骤S301“获取训练样本”具体可包括以下步骤S401和S402。

S401，获取样本广告关键词和/或样本广告落地页信息，作为第一样本广告信息。

需要说明的是，样本广告主可以根据不同的广告，设定样本广告关键词和/或样本广告落地页信息，其中，样本广告关键词和样本广告落地页可以用于反映广告内容。

其中，广告落地页信息，是指当用户通过点击广告或者利用搜索引擎搜索后跳转显示给用户的网页信息。

举例而言，样本广告关键词可以为X考试的报名时间，样本广告落地页信息2023年X考试备考辅导中心，第一样本广告主为{gMASK1}。

S402，对第一样本广告信息和第一样本广告主进行关联，生成第一训练样本。

在本申请公开实施例中，在获取到第一样本广告信息和第一样本广告主后，可以将第一样本广告信息和第一样本广告主进行关联，生成第一训练样本。

上述实施例中的步骤S302“根据训练样本，对大模型进行训练”具体可包括以下步骤S403和S404。

S403，将第一样本广告信息输入至大模型，通过大模型基于第一样本广告信息确定第一预测广告主。

举例而言，针对第一样本广告信息为(样本广告关键词为X考试的报名时间以及样本广告落地页信息2023年X考试备考辅导中心)，通过将上述第一样本广告信息输入至大模型中，可以输出第一预测广告主为“Y教育培训有限公司”

S404，基于第一预测广告主和第一样本广告主，对大模型进行训练。

举例而言，可以基于第一预测广告主和第一样本广告主，获取大模型的损失函数，基于损失函数对大模型的模型参数进行更新，并返回采用下一个训练样本，继续对调整模型参数后的大模型进行训练，直至满足模型训练结束条件。

本公开提出的模型训练方法，获取样本广告关键词和/或样本广告落地页信息，作为第一样本广告信息，对第一样本广告信息和第一样本广告主进行关联，生成第一训练样本，将第一样本广告信息输入至大模型，通过大模型基于第一样本广告信息确定第一预测广告主，基于第一预测广告主和第一样本广告主，对大模型进行训练，通过获取的样本广告关键词和/或样本广告落地页信息作为样本广告信息，对大模型进行训练，可以使大模型学习广告内容和广告主之间的映射关系，为基于大模型进行广告搜索处理奠定了基础。

图5为本公开另一实施例的模型训练方法的流程示意图。如图5所示，该方法包括：

上述实施例中的步骤S301“获取训练样本”具体可包括以下步骤S501和S502。

S501，获取第一类样本用户搜索词，作为第二样本广告信息。

在本公开实施例中，对于获取第一类样本用户搜索词的具体方式不作限定，可以根据实际情况进行选取。

在本公开实施例中，可以获取用户的点击搜索行为日志，根据点击搜索行为日志，确定第一类样本用户搜索词。

可选地，可以获取用户的历史点击搜索行为，生成用户的点击搜索行为日志，并对点击搜索行为日志进行特征提取，确定第一类样本用户搜索词，即第二样本广告信息。

需要说明的是，本公开对于根据点击搜索行为日志，确定第一类样本用户搜索词的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以通过预设的特征提取模型从点击搜索行为日志提取第一类样本用户搜索词，以得到第二样本广告信息。

需要说明的是，第一类样本搜索词的资源价值(商业价值)往往高于第二类样本搜索词，即“高商”样本搜索词。

S502，对第二样本广告信息和第二样本广告主进行关联，生成第二训练样本，其中，第二样本广告主为真实广告主。

在本申请公开实施例中，在获取到第二样本广告信息和第二样本广告主后，可以将第二样本广告信息和第二样本广告主进行关联，生成第二训练样本。

其中，第二样本广告主为真实广告主，即真实存在的广告主。

上述实施例中的步骤S502“根据训练样本，对大模型进行训练”具体可包括以下步骤S503和S504。

S503，将第二样本广告信息输入至大模型，通过大模型基于第二样本广告信息确定第二预测广告主。

举例而言，针对第二样本广告信息(第一类样本用户搜索词query1)为“X考试的报名时间和报名条件”，通过将上述第一类样本用户搜索词query1输入至大模型中，可以输出第二预测广告主为“Z教育培训有限公司。

S504，基于第二预测广告主和第二样本广告主，对大模型进行训练。

举例而言，可以基于第二预测广告主和第二样本广告主，获取大模型的损失函数，基于损失函数对大模型的模型参数进行更新，并返回采用下一个训练样本，继续对调整模型参数后的大模型进行训练，直至满足模型训练结束条件。

本公开提出的模型训练方法，获取第一类样本用户搜索词，作为第二样本广告信息，对第二样本广告信息和第二样本广告主进行关联，生成第二训练样本，其中，第二样本广告主为真实广告主，将第二样本广告信息输入至大模型，通过大模型基于第二样本广告信息确定第二预测广告主，基于第二预测广告主和第二样本广告主，对大模型进行训练，通过获取的第一类样本用户搜索词作为样本广告信息，对大模型进行训练，可以使大模型对用户搜索词的类型进行识别，并使大模型学习第一类用户搜索词和广告主之间的映射关系，为基于大模型进行广告搜索处理奠定了基础。

图6为本公开另一实施例的模型训练方法的流程示意图。如图6所示，该方法包括：

上述实施例中的步骤S301“获取训练样本”具体可包括以下步骤S601和S602。

S601，获取第二类样本用户搜索词，作为第三样本广告信息。

需要说明的是，为了提高大模型的召回精度，通过增加第二类样本用户搜索词，作为第三样本广告信息，其中，第二类样本搜索词的资源价值(商业价值)往往较低，即“低商”样本用户搜索词。

举例而言，针对第三样本广告信息(第二类样本用户搜索词query2)为“介甫是什么意思”。

S602，将第三样本广告信息与第三样本广告主和指示信息进行关联，生成第三训练样本，其中，第三样本广告主为虚拟广告主，指示信息用于指示第二类样本用户搜索词不存在待搜索的目标广告。

在本申请公开实施例中，在获取到第三样本广告信息与第三样本广告主和指示信息后，可以将第三样本广告信息与第三样本广告主和指示信息进行关联，生成第三训练样本。

其中，第三样本广告主为虚拟广告主，即并未真实存在的广告主，预先构建虚拟的广告主。

在本公开实施例中，通过指示信息可以指示第二类样本用户搜索词不存在待搜索的目标广告。

上述实施例中的步骤S302“根据训练样本，对大模型进行训练”具体可包括以下步骤S603和S604。

S603，将第三样本广告信息输入至大模型，通过大模型基于第三样本广告信息确定第三预测广告主。

举例而言，针对第三样本广告信息(第二类样本用户搜索词query2)为“介甫是什么意思”，通过将上述第二类样本用户搜索词query2输入至大模型中，可以输出第三预测广告主为“M”。

S604，基于第三预测广告主、第三样本广告主和指示信息，对大模型进行训练。

本公开提出的模型训练方法，获取第二类样本用户搜索词，作为第三样本广告信息，将第三样本广告信息与第三样本广告主和指示信息进行关联，生成第三训练样本，其中，第三样本广告主为虚拟广告主，指示信息用于指示第二类样本用户搜索词不存在待搜索的目标广告，将第三样本广告信息输入至大模型，通过大模型基于第三样本广告信息确定第三预测广告主，基于第三预测广告主、第三样本广告主和指示信息，对大模型进行训练，通过获取的第二类样本用户搜索词作为样本广告信息，对大模型进行训练，可以使大模型对用户搜索词的类型进行识别，并使大模型学习第二类用户搜索词、虚拟广告主和指示信息之间的映射关系，为基于大模型进行广告搜索处理奠定了基础。

综上所述，本本公开提出的模型训练方法，通过获取的多种训练样本对大模型进行训练，提高了训练样本的全面性和准确性，提高了大模型训练过程中的准确性和可靠性，为基于大模型进行广告搜索处理奠定了基础。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种广告搜索装置，用于实现上述的广告搜索方法。

图7是根据本公开一实施例的广告搜索装置的框图。

如图7所示，广告搜索装置700，包括：获取模块701、第一确定模块702和第二确定模块703。

获取模块701，用于获取用户搜索词；

第一确定模块702，用于将所述用户搜索词输入至大模型，通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主；

第二确定模块703，用于基于所述广告主，从所述候选广告中确定待搜索的目标广告。

在本公开的一个实施例中，第二确定模块703，用于：获取所述广告主的业务信息；基于所述用户搜索词和所述业务信息，从所述候选广告中确定所述目标广告。

在本公开的一个实施例中，所述第二确定模块703，用于：获取所述用户搜索词和所述业务信息之间的相似度；根据所述相似度，从所述候选广告中确定所述目标广告。

在本公开的一个实施例中，所述第二确定模块703，用于：若所述用户搜索词和所述业务信息之间的相似度大于所述相似度阈值，将所述业务信息对应的候选广告确定为所述目标广告。

在本公开的一个实施例中，所述第二确定模块703，用于：对多个候选广告按照所述相似度降序排序，将排序前N个的候选广告确定为所述目标广告，其中，所述N为正整数。

在本公开的一个实施例中，所述第一确定模块702，用于：通过所述大模型识别所述用户搜索词为第一类用户搜索词，基于所述第一类用户搜索词，确定第一广告主，其中，所述第一广告主为真实广告主。

在本公开的一个实施例中，所述第一确定模块702，用于：通过所述大模型识别所述用户搜索词为第二类用户搜索词，基于所述第二类用户搜索词，确定第二广告主并生成指示信息，其中，所述第二广告主为虚拟广告主，所述指示信息用于指示所述第二类用户搜索词不存在待搜索的目标广告。

在本公开的一个实施例中，所述装置700还用于：向所述用户搜索词的来源客户端发送所述指示信息。

本公开提出的广告搜索装置，通过获取用户搜索词，将用户搜索词输入至大模型，通过大模型基于用户搜索词，确定与候选广告关联的广告主，基于广告主，从候选广告中确定待搜索的目标广告，由此，本公开通过大模型，可以确定与候选广告关联的广告主，在广告主的限制下，确定待搜索的目标广告，提高了广告搜索的效率，并保证了广告搜索结果的精度，提升了用户体验。

根据本公开的实施例，本公开还提供了一种模型训练装置，用于实现上述的模型训练方法。

图8是根据本公开一实施例的模型训练装置的框图。

如图8所示，模型训练装置800，包括：第一获取模块801和训练模块802。

第一获取模块801，用于获取训练样本，其中，所述训练样本用于样本广告信息和样本广告主；

训练模块802，用于根据所述训练样本，对大模型进行训练。

在本公开的一个实施例中，所述第一获取模块801，用于：获取样本广告关键词和/或样本广告落地页信息，作为第一样本广告信息；对所述第一样本广告信息和第一样本广告主进行关联，生成第一训练样本。

在本公开的一个实施例中，所述训练模块802，用于：将所述第一样本广告信息输入至所述大模型，通过所述大模型基于所述第一样本广告信息确定第一预测广告主；基于所述第一预测广告主和所述第一样本广告主，对所述大模型进行训练。

在本公开的一个实施例中，所述第一获取模块801，用于：获取第一类样本用户搜索词，作为第二样本广告信息；对所述第二样本广告信息和第二样本广告主进行关联，生成第二训练样本，其中，所述第二样本广告主为真实广告主。

在本公开的一个实施例中，所述第一获取模块801，用于：获取用户的点击搜索行为日志；根据所述点击搜索行为日志，确定所述第一类样本用户搜索词。

在本公开的一个实施例中，所述训练模块802，用于：将所述第二样本广告信息输入至所述大模型，通过所述大模型基于所述第二样本广告信息确定第二预测广告主；基于所述第二预测广告主和所述第二样本广告主，对所述大模型进行训练。

在本公开的一个实施例中，所述第一获取模块801，用于：获取第二类样本用户搜索词，作为第三样本广告信息；将所述第三样本广告信息与第三样本广告主和指示信息进行关联，生成第三训练样本，其中，所述第三样本广告主为虚拟广告主，所述指示信息用于指示所述第二类样本用户搜索词不存在待搜索的目标广告。

在本公开的一个实施例中，所述训练模块802，还用于：将所述第三样本广告信息输入至所述大模型，通过所述大模型基于所述第三样本广告信息确定第三预测广告主；基于所述第三预测广告主、所述第三样本广告主和所述指示信息，对所述大模型进行训练。

本公开提出的模型训练装置，通过获取训练样本，其中，训练样本包括样本广告信息和样本广告主，根据训练样本，对大模型进行训练，由此，通过获取的多种训练样本对大模型进行训练，提高了训练样本的全面性和准确性，提高了大模型训练过程中的准确性和可靠性，为基于大模型进行广告搜索处理奠定了基础。

根据本公开的实施例，本公开还提出了一种电子设备、一种可读存储介质和一种计算机程序产品。

图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图9所示，设备900包括计算单元901，其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序，来执行各种适当的动作和处理。在RAM 903中，还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

设备900中的多个部件连接至I/O接口905，包括：输入单元906，例如键盘、鼠标等；输出单元906，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理，例如广告搜索方法、模型训练方法。例如，在一些实施例中，广告搜索方法、模型训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时，可以执行上文描述的广告搜索方法、模型训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行广告搜索方法、模型训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提出给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提出与用户账号的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户账号显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户账号可以通过该键盘和该指向装置来将输入提出给计算机。其它种类的装置还可以用于提出与用户账号的交互；例如，提出给用户账号的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户账号的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户账号界面或者网络浏览器的用户账号计算机，用户账号可以通过该图形用户账号界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

根据本公开的实施例，本公开还提供了一种计算机程序产品，包括计算机程序，其中，所述计算机程序被处理器执行时实现本公开上述实施例所述的广告搜索方法、模型训练方法的步骤。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种广告搜索方法，包括：

获取用户搜索词；

将所述用户搜索词输入至大模型，通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主；

基于所述广告主，从所述候选广告中确定待搜索的目标广告。

2.根据权利要求1所述的搜索方法，其中，所述基于所述广告主，从所述候选广告中确定待搜索的目标广告，包括：

获取所述广告主的业务信息；

基于所述用户搜索词和所述业务信息，从所述候选广告中确定所述目标广告。

3.根据权利要求2所述的搜索方法，其中，所述基于所述用户搜索词和所述业务信息，从所述候选广告中确定所述目标广告，包括：

获取所述用户搜索词和所述业务信息之间的相似度；

根据所述相似度，从所述候选广告中确定所述目标广告。

4.根据权利要求3所述的搜索方法，其中，所述根据所述相似度，从所述候选广告中确定所述目标广告，包括：

若所述用户搜索词和所述业务信息之间的相似度大于所述相似度阈值，将所述业务信息对应的候选广告确定为所述目标广告。

5.根据权利要求3所述的搜索方法，其中，所述根据所述相似度，从所述候选广告中确定所述目标广告，包括：

对多个候选广告按照所述相似度降序排序，将排序前N个的候选广告确定为所述目标广告，其中，所述N为正整数。

6.根据权利要求1-5中任一项所述的搜索方法，其中，所述通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主，包括：

通过所述大模型识别所述用户搜索词为第一类用户搜索词，基于所述第一类用户搜索词，确定第一广告主，其中，所述第一广告主为真实广告主。

7.根据权利要求1-5中任一项所述的搜索方法，其中，所述通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主，包括：

通过所述大模型识别所述用户搜索词为第二类用户搜索词，基于所述第二类用户搜索词，确定第二广告主并生成指示信息，其中，所述第二广告主为虚拟广告主，所述指示信息用于指示所述第二类用户搜索词不存在待搜索的目标广告。

8.根据权利要求7所述的搜索方法，其中，所述方法还包括：

向所述用户搜索词的来源客户端发送所述指示信息。

9.一种模型训练方法，包括：

获取训练样本，其中，所述训练样本包括样本广告信息和样本广告主；

根据所述训练样本，对大模型进行训练。

10.根据权利要求9所述的训练方法，其中，所述获取训练样本，包括：

获取样本广告关键词和/或样本广告落地页信息，作为第一样本广告信息；

对所述第一样本广告信息和第一样本广告主进行关联，生成第一训练样本。

11.根据权利要求10所述的训练方法，其中，所述根据所述训练样本，对大模型进行训练，包括：

将所述第一样本广告信息输入至所述大模型，通过所述大模型基于所述第一样本广告信息确定第一预测广告主；

基于所述第一预测广告主和所述第一样本广告主，对所述大模型进行训练。

12.根据权利要求9所述的训练方法，其中，所述获取训练样本，包括：

获取第一类样本用户搜索词，作为第二样本广告信息；

对所述第二样本广告信息和第二样本广告主进行关联，生成第二训练样本，其中，所述第二样本广告主为真实广告主。

13.根据权利要求12所述的训练方法，其中，所述第一类样本用户搜索词的获取过程，包括：

获取用户的点击搜索行为日志；

根据所述点击搜索行为日志，确定所述第一类样本用户搜索词。

14.根据权利要求12所述的训练方法，其中，所述根据所述训练样本，对大模型进行训练，包括：

将所述第二样本广告信息输入至所述大模型，通过所述大模型基于所述第二样本广告信息确定第二预测广告主；

基于所述第二预测广告主和所述第二样本广告主，对所述大模型进行训练。

15.根据权利要求9所述的训练方法，其中，所述获取训练样本，包括：

获取第二类样本用户搜索词，作为第三样本广告信息；

将所述第三样本广告信息与第三样本广告主和指示信息进行关联，生成第三训练样本，其中，所述第三样本广告主为虚拟广告主，所述指示信息用于指示所述第二类样本用户搜索词不存在待搜索的目标广告。

16.根据权利要求15所述的训练方法，其中，所述根据所述训练样本，对大模型进行训练，包括：

将所述第三样本广告信息输入至所述大模型，通过所述大模型基于所述第三样本广告信息确定第三预测广告主；

基于所述第三预测广告主、所述第三样本广告主和所述指示信息，对所述大模型进行训练。

17.一种广告搜索装置，包括：

获取模块，用于获取用户搜索词；

第一确定模块，用于将所述用户搜索词输入至大模型，通过所述大模型基于所述用户搜索词，确定与候选广告关联的广告主；

第二确定模块，用于基于所述广告主，从所述候选广告中确定待搜索的目标广告。

18.根据权利要求17所述的搜索装置，其中，所述第二确定模块，用于：

获取所述广告主的业务信息；

19.根据权利要求18所述的搜索装置，其中，所述第二确定模块，用于：

获取所述用户搜索词和所述业务信息之间的相似度；

根据所述相似度，从所述候选广告中确定所述目标广告。

20.根据权利要求19所述的搜索装置，其中，所述第二确定模块，用于：

21.根据权利要求19所述的搜索装置，其中，所述第二确定模块，用于：

22.根据权利要求17-21中任一项所述的搜索装置，其中，所述第一确定模块，用于：

23.根据权利要求17-21中任一项所述的搜索装置，其中，所述第一确定模块，用于：

24.根据权利要求23所述的搜索装置，其中，所述装置还用于：

向所述用户搜索词的来源客户端发送所述指示信息。

25.一种模型训练装置，用于：

第一获取模块，用于获取训练样本，其中，所述训练样本用于样本广告信息和样本广告主；

训练模块，用于根据所述训练样本，对大模型进行训练。

26.根据权利要求25所述的训练装置，其中，所述第一获取模块，用于：

27.根据权利要求26所述的训练装置，其中，所述训练模块，用于：

28.根据权利要求25所述的训练装置，其中，所述第一获取模块，用于：

获取第一类样本用户搜索词，作为第二样本广告信息；

29.根据权利要求28所述的训练装置，其中，所述第一获取模块，用于：

获取用户的点击搜索行为日志；

30.根据权利要求29所述的训练装置，其中，所述训练模块，用于：

31.根据权利要求25所述的训练装置，其中，所述第一获取模块，用于：

获取第二类样本用户搜索词，作为第三样本广告信息；

32.根据权利要求31所述的训练装置，其中，所述训练模块，还用于：

33.一种电子设备，其特征在于，包括处理器和存储器；

其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如权利要求1-8或权利要求9-16中任一项所述的方法。

34.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8或权利要求9-16中任一项所述的方法。

35.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8或权利要求9-16中任一项所述的方法。