CN114610914A

CN114610914A - 一种信息处理方法、装置及电子设备

Info

Publication number: CN114610914A
Application number: CN202210236853.XA
Authority: CN
Inventors: 王臻烨; 程涛远; 姚珺珺
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-03-11
Filing date: 2022-03-11
Publication date: 2022-06-10

Abstract

本公开提供一种信息处理方法、装置及电子设备，尤其涉及智能推荐技术。方案为：对查询信息进行意图识别，得到查询信息的意图识别结果；基于查询信息确定第一多媒体信息集，对第一多媒体信息集中的N个多媒体信息的标题进行意图识别，得到N个多媒体信息的意图识别结果；基于查询信息的意图识别结果以及N个多媒体信息的标题的意图识别结果，从第一多媒体信息集中确定目标多媒体信息，并输出目标多媒体信息。确定目标多媒体信息的过程中，不但考虑了查询信息的意图识别结果，还考虑了第一多媒体信息集中多媒体信息的标题的意图识别结果，这样可使确定的目标多媒体信息更加符合查询信息的意图需求，从而提高目标多媒体信息的准确性。

Description

一种信息处理方法、装置及电子设备

技术领域

本公开涉及人工智能领域，尤其涉及智能推荐技术，尤其涉及一种信息处理方法、装置及电子设备。

背景技术

一个对象(例如，某商品等)的多媒体信息(例如，广告创意等)中一般包括标题、描述内容、图片以及统一资源定位符(Uniform Resource Locator，URL)等，多媒体信息输出是提高对象的点击率的重要的一环，多媒体信息在网页中输出展现之后，多媒体信息的好坏直接影响用户进行行为(例如，点击)的欲望，而标题是多媒体信息中重要的信息。

目前，在收到查询信息后，主要是根据查询信息的关键字从供查询的多媒体信息中查询对应的多媒体信息，输出给用户查看。

发明内容

本公开提供一种信息处理方法、装置及电子设备。

第一方面，本公开一个实施例提供一种信息处理方法，所述方法包括：

获取查询信息；

对所述查询信息进行意图识别，得到所述查询信息的意图识别结果；

基于所述查询信息确定第一多媒体信息集，所述第一多媒体信息集包括N个多媒体信息，N为正整数；

对所述N个多媒体信息的标题进行意图识别，得到所述N个多媒体信息的意图识别结果；

基于所述查询信息的意图识别结果以及所述N个多媒体信息的标题的意图识别结果，从所述第一多媒体信息集中确定目标多媒体信息，并输出所述目标多媒体信息

在本公开实施例的信息处理方法中，第一多媒体信息集是在考虑查询信息的基础上确定的多媒体信息集，而且从第一多媒体信息集中确定目标多媒体信息的过程中，不但考虑了查询信息的意图识别结果，还考虑了第一多媒体信息集中N个多媒体信息的标题的意图识别结果，这样可使确定的目标多媒体信息更加符合查询信息的意图需求，从而提高得到的目标多媒体信息的准确性。

第二方面，本公开一个实施例提供一种信息处理装置，所述装置包括：

第一获取模块，用于获取查询信息；

第一识别模块，用于对所述查询信息进行意图识别，得到所述查询信息的意图识别结果；

第一确定模块，用于基于所述查询信息确定第一多媒体信息集，所述第一多媒体信息集包括N个多媒体信息，N为正整数；

第二识别模块，用于对所述N个多媒体信息的标题进行意图识别，得到所述N个多媒体信息的意图识别结果；

第二确定模块，用于基于所述查询信息的意图识别结果以及所述N个多媒体信息的标题的意图识别结果，从所述第一多媒体信息集中确定目标多媒体信息，并输出所述目标多媒体信息。

第三方面，本公开一个实施例还提供一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开如第一方面提供的信息处理方法。

第四方面，本公开一个实施例还提供一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开如第一方面提供的信息处理方法。

第五方面，本公开一个实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开如第一方面提供的信息处理方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开提供的一个实施例的信息处理方法的流程示意图之一；

图2是本公开提供的一个实施例的信息处理方法中更新第二多媒体信息集的原理图

图3是本公开提供的一个实施例的信息处理方法的原理图；

图4本公开提供的一个实施例的信息处理装置的结构图；

图5用来实现本公开实施例的信息处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

如图1所示，根据本公开的实施例，本公开提供一种信息处理方法，可应用于电子设备，该方法包括：

步骤S101：获取查询信息。

查询(query)信息可以是用户在信息输入界面中输入的查询信息，也可以理解是搜索信息或检索信息，查询信息可以包括文本查询信息或语音查询信息等。

步骤S102：对查询信息进行意图识别，得到查询信息的意图识别结果。

意图识别可看作是一个分类问题，可以理解是意图分类，意图识别结果可以看作是识别的意图类别。

步骤S103：基于查询信息确定第一多媒体信息集，第一多媒体信息集包括N个多媒体信息，N为正整数。

可以理解第一多媒体信息集是与查询信息匹配的，例如，可对查询信息进行分词确定其对应的关键词，可通过关键词进行查找，得到匹配的第一多媒体信息集。需要说明的是，本公开实施例中的任一多媒体信息可包括描述内容以及标题，该标题可以是该描述内容对应的标题，另外也还可包括图片、URL等。

步骤S104：对N个多媒体信息的标题进行意图识别，得到N个多媒体信息的意图识别结果。

即可对N个多媒体信息中每个多媒体信息的标题进行意图识别，如此，可得到N个意图识别结果，与N个多媒体信息一一对应。

步骤S105：基于查询信息的意图识别结果以及N个多媒体信息的标题的意图识别结果，从第一多媒体信息集中确定目标多媒体信息，并输出目标多媒体信息。

结合查询信息的意图识别结果以及N个多媒体信息的标题的意图识别结果，从第一多媒体信息集中筛选出目标多媒体信息，输出目标多媒体信息，可以理解是得到与查询信息相关的目标多媒体信息并输出。本公开实施例的信息处理方法也可以理解是信息输出、推荐或推送方法，输出目标多媒体信息，即实现目标多媒体信息的推送或推荐，以便用户对目标多媒体信息的查看。

在本公开实施例的信息处理方法中，第一多媒体信息集是在考虑查询信息的基础上确定的多媒体信息集，而且从第一多媒体信息集中确定目标多媒体信息的过程中，不但考虑了查询信息的意图识别结果，还考虑了第一多媒体信息集中N个多媒体信息的标题的意图识别结果，这样可使确定的目标多媒体信息更加符合查询信息的意图需求，从而提高得到的目标多媒体信息的准确性。与此同时，输出目标多媒体信息，即针对查询信息实现多媒体信息的推荐，从而可提高多媒体信息推荐的效果。

在一个实施例中，目标多媒体信息的标题的意图识别结果与查询信息的意图识别结果匹配。

目前，相关方案根据查询信息输出的多媒体信息一般存在与查询信息的意图不匹配的情况，而本公开实施例中，是通过述查询信息的意图识别结果以及所述N个多媒体信息的标题的意图识别结果，从所述第一多媒体信息集中确定目标多媒体信息，输出所述目标多媒体信息，其中，目标多媒体信息的标题的意图识别结果与查询信息的意图识别结果匹配，也即是从第一多媒体信息集的N个多媒体信息中查询标题的意图与查询信息的意图识别结果匹配的目标多媒体信息，这样能使目标多媒体信息更加满足查询信息的意图需求，提高得到的目标多媒体信息的准确性，输出目标多媒体信息，实现多媒体信息推荐，从而可提高多媒体信息推荐的效果。

在一个实施例中，基于查询信息确定第一多媒体信息集，包括：

通过查询信息进行查询，确定第一多媒体单元，第一多媒体单元的名称与查询信息匹配，第一多媒体单元中包括第二多媒体信息集；

基于第二多媒体信息集中多媒体信息的描述内容，生成第二多媒体信息集中多媒体信息的目标标题；

使用第二多媒体信息集中多媒体信息的目标标题，对第二多媒体信息集中多媒体信息的原标题进行更新，得到第一多媒体信息集。

多媒体单元可以理解是多媒体信息目录，也可以称为单元多媒体，一般情况下，供查询的多媒体信息目录可以有多个，即可以有多个多媒体单元，每个多媒体单元有对应的名称，在每个多媒体信息目录下可包括至少一个多媒体信息。在获取查询信息后，可利用查询信息在多个多媒体单元的名称中进行查询，从中确定名称与查询信息匹配的第一多媒体单元。作为一个示例，可先对查询信息进行分词，得到其对应的关键词，进行分词确定关键词的方式有多种，在本公开实施例中不作限定，然后利用关键词查询多个多媒体单元的名称，得到的第一多媒体单元的名称与关键词匹配。

可利用第二多媒体信息集中任一多媒体信息的描述内容，生成该多媒体信息的目标标题，可对所述第二多媒体信息集中每个多媒体信息，生成对应的目标标题，从而可得到第二多媒体信息集中多媒体信息的目标标题，目标标题可以理解是新标题，标题更新前，原本第二多媒体信息集中多媒体信息的标题可以理解是原标题。由于目前多媒体单元中多媒体信息的原标题可能是人工撰写得到，与人工的主观意识有较大关系，容易导致得到的标题准确性较低，在本所公开实施例中，得到目标标题后，即可利用所述第二多媒体信息集中多媒体信息的目标标题，对所述第二多媒体信息集中多媒体信息的原标题进行更新，例如，对于第二多媒体信息集中的参考多媒体信息(第二多媒体信息集中的任一多媒体信息)，是将参考多媒体信息的原标题更新为该参考多媒体信息的目标标题，针对第二多媒体信息集中每个多媒体信息的原标题，采用对应的目标标题进行更新，从而实现对第二多媒体信息集中多媒体信息的更新，得到所述第一多媒体信息集。

在本实施例中，对于与查询信息匹配的第一多媒体单元中的多媒体信息，可生成新标题，利用多媒体信息的描述内容生成新标题，并替换多媒体信息的原标题，实现对第一多媒体单元中第二多媒体信息集的更新，得到第一多媒体信息集，这样可提高得到的第一多媒体信息集中多媒体信息的标题的准确性。后续利用述查询信息的意图识别结果以及所述N个多媒体信息的标题的意图识别结果，从所述第一多媒体信息集中确定目标多媒体信息，从而可进一步提高得到的目标多媒体信息的准确性，输出多媒体信息，实现多媒体信息推荐，可提高多媒体信息推荐效果。

在一个实施例中，基于所述第二多媒体信息集中多媒体信息的描述内容，生成第二多媒体信息集中多媒体信息的目标标题之前，还包括：

对第二多媒体信息集中多媒体信息的标题进行意图识别，得到第二多媒体信息集中多媒体信息的标题的意图识别结果；

在第二多媒体信息集中多媒体信息的标题的意图识别结果中不包括查询信息的意图识别结果的情况下，生成K个多媒体信息，K为正整数，K个多媒体信息的标题的意图与查询信息的意图识别结果匹配；

将K个多媒体信息添加至第二多媒体信息集中，以更新第二多媒体信息集。

可以理解，更新第二多媒体信息集后，后续用到的第二多媒体信息集即为更新后的第二多媒体信息集，例如，后续基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题的过程中，是采用的更新后的第二多媒体信息集。

需要说明的是，根据历史统计，输出的与查询意图匹配的多媒体信息，相比与查询意图不匹配的多媒体信息，平均点击率(CTR)一般要高，从而在本实施例中，可将查询信息的意图识别结果与第二多媒体信息集中多媒体信息的标题的意图识别结果进行对比，检测第二多媒体信息集中多媒体信息的标题的意图识别结果中是否包括查询信息的意图识别结果，若包括，表示第二多媒体信息集中多媒体信息的标题的意图识别结果中存在与查询信息的意图识别结果匹配的意图识别结果，可维持第二多媒体信息集的数量不变，即不往第二多媒体信息集中添加额外的多媒体信息，若不包括，表示第二多媒体信息集中多媒体信息的标题的意图识别结果中不存在与查询信息的意图识别结果匹配的意图识别结果，可生成标题的意图与查询信息的意图识别结果匹配的K个多媒体信息，并将其添加至所述第二多媒体信息集中，以更新所述第二多媒体信息集。需要说明的是，作为一个示例，本公开实施例中的匹配，可以是相同或一致等。另外，作为一个示例，本公开实施例中的意图识别，可采用已训练的意图识别模型进行意图识别，意图识别模型的种类有多种，在本公开实施例中不作限定，例如，可采用用于文本分类的卷积神经网络(TextCNN)。

在本实施例中，可在所述第二多媒体信息集中多媒体信息的标题的意图识别结果中不包括所述查询信息的意图识别结果的情况下，生成标题的意图与查询信息的意图识别结果匹配的K个多媒体信息，并将其添加至所述第二多媒体信息集中，以更新所述第二多媒体信息集，使更新后的第二多媒体信息集中增加与查询信息的意图识别结果匹配的多媒体信息，使更新后的第二多媒体信息集更加满足查询信息的意图需求，然后对更新后的第二多媒体信息集的多媒体信息的原标题进行更新，得到第一多媒体信息集，可使第一多媒体信息集更加满足查询信息的意图需求，从中确定目标多媒体信息，提高目标多媒体信息的准确性，输出目标多媒体信息，实现多媒体信息的推荐，从而可提高多媒体信息的推荐的效果。

在一个实施例中，基于第二多媒体信息集中多媒体信息的描述内容，生成第二多媒体信息集中多媒体信息的目标标题，包括：

通过已训练的目标语言模型，生成第二多媒体信息集中多媒体信息的描述内容的目标标题；

其中，目标语言模型通过训练样本集训练得到，训练样本集中包括多条样本多媒体信息，且多条样本多媒体信息中的每一条样本多媒体信息的点击率大于预设点击率阈值。

需要说明的是，语言模型的种类较多，在本公开实施例中对其不作限定，例如，目标语言模型可以采用生成预训练转换器(Generative Pre-trained Transformer 2，GPT2)等。

一个多媒体信息的标题的意图越接近用户查询意图，输出该多媒体信息后，被用户点击的可能性越大，从而在本公开实施例中，生成目标标题采用的目标语言模型可通过包括多个点击率大于预设点击率阈值的样本多媒体信息的训练样本集进行训练得到，如此，可提高目标语言模型的性能，通过目标语言模型，生成第二多媒体信息集中多媒体信息的描述内容的目标标题，这样可提高得到的目标标题的准确性。作为一个示例，可通过训练样本即对预训练语言模型进行训练得到目标语言模型。

在一个实施例中，使用第二多媒体信息集中多媒体信息的目标标题，对第二多媒体信息集中多媒体信息的原标题进行更新，得到第一多媒体信息集之前，还包括：

对第二多媒体信息集中多媒体信息的目标标题进行目标处理，以更新第二多媒体信息集中多媒体信息的目标标题，其中，目标处理包括以下至少一项：

语法调整；

通顺度调整；

敏感词过滤。

可以理解，进行目标处理后，实现对第二多媒体信息集中多媒体信息的目标标题的更新，后续使用第二多媒体信息集中多媒体信息的目标标题，对第二多媒体信息集中多媒体信息的原标题进行更新的过程中，采用的是更新后的第二多媒体信息集中多媒体信息的目标标题。

标题的通顺度可以是指标题的每个字连起来是通顺的程度，得到的目标标题可能存在通顺度较低的情况，例如，第一预设通顺度，可通过对目标标题的调整，实现目标标题的通顺度的调整。得到的目标标题也可能存在语法问题，通过对目标标题进行语法检测，对存在语法问题的目标标题进行语法调整，使调整后的目标标题语法正确。另外，得到的目标标题中可能存在敏感词，例如，存在品牌、地域的敏感词，可通过判断目标标题中是否包括预设敏感词中的任一敏感词，若包括，则可将目标标题中的敏感词过滤。

在本实施例中，通过对第二多媒体信息集中多媒体信息的目标标题进行语法调整、通顺度调整以及敏感词过滤中任一项处理，实现对第二多媒体信息集中多媒体信息的目标标题的更新，提高更新后的第二多媒体信息集中多媒体信息的目标标题合理性。

下面以具体实施例对上述信息处理方法的过程进行具体说明。

本公开实施例的技术方案，基于预训练语言模型(Pre-trained Models，PTMs)，通过配置一个文本摘要微调任务来训练得到目标语言模型，目标语言模型可以从多媒体信息的描述内容中抽取出新标题，即目标标题，从而生成新多媒体信息。本公开实施例的信息处理方法可包括基于意图识别的多媒体信息处理(诊断)过程、标题生成模型(语言模型)的训练与调用过程以及新标题校验过程等。

对于基于意图识别的多媒体信息处理过程：

针对普遍存在的流量意图和多媒体信息意图不符的情况，设计了相关的多媒体信息处理模块。需要说明的是，用户(例如，网民)进行query，每个query信息有对应的query意图，而用户的query可视为流量，从而可形成流量意图。对用户的query信息进行意图识别，是指分析用户的核心查询需求。用户往往在其查询意图与多媒体信息内容一致的时候点击相关多媒体信息的可能性越大，比如用户输入的query信息为“北京挖掘机多少钱”，说明用户着重关注价格，类似“北京2021小型挖掘机多少钱？价格一览表”的价格类多媒体信息在统计意义上将更有机会比“挖掘机十大名牌排名榜“这样的口碑意向类多媒体信息的CTR高，较差的多媒体信息推送几乎可以确定不能满足用户查询意图需求的多媒体信息，导致产生较差的用户查询体验，因此提高查询信息的意图识别非常重要。统计相关多媒体信息的表现，query信息的意图与多媒体信息的标题的意图一致情况下的平均CTR比不一致时可高出29.6％。因此，本公开实施例，可对客户的多媒体信息进行意图识别，推送相应意图的具有新标题的多媒体信息。

意图识别在很大程度上可以理解为文本分类问题，目前将多媒体信息的标题可分为9类，例如分别为'疑问咨询'类、'价格费用'类、'联系方式'类、'公司机构'类、'解决方法'类、'批发定制'类、'品牌'类、'直接效果'类、'口碑评价'类。

可使用TextCNN模型作为意图识别模型，该模型的结构超参数设置可以为：

词向量维度：256；

序列长度：50；

类别数：9；

卷积核数目：256；

卷积核尺寸：4；

词汇表大小：5000；

全连接层神经元：256。

可选用多条带有意图类别标签的上万个多媒体信息作为意图识别模型的训练数据，最终训练得到的意图识别模型在测试集上的准确率可达到88％。

使用该意图识别模型对单元内多媒体信息(即上述根据查询信息确定的第二多媒体信息集)的意图作识别，以及对查询信息进行意图识别，将与进单元的查询信息的意图不相关的多媒体信息进行改写，例如，比较查询信息的意图与第二多媒体信息集中多媒体信息的标题的意图，若第二多媒体信息集中多媒体信息的标题的意图不包括与查询信息的意图相同的意图，则生成标题的意图与所述查询信息的意图识别结果相同的K个多媒体信息，向第二多媒体信息集中添加K个多媒体信息，即修改第二多媒体信息集中的多媒体信息，若包括，则表示第二多媒体信息集中包括标题的意图与查询信息的意图相同的意图，则可保留第二多媒体信息集中的多媒体信息即可，无需添加额外的多媒体信息，总体逻辑如图2所示。后续目标多媒体信息确定阶段也会调用该意图识别模型，挑选出与查询信息的意图匹配的目标多媒体信息。

如图3所示，对于标题生成模型的训练与调用过程：

近年来在自然语言处理(Natural Language Processing，NLP)领域中，使用语言模型预训练方法在多项NLP任务上都获得了不错的提升，广泛受到了各界的关注。在本公开实施例中，使用较为适合于标题生成任务的GPT2LMHeadModel作为预训练语言模型，使用文本摘要提取任务对模型进行微调。在模型调用阶段，通过输入多媒体信息的描述内容生成该描述内容的摘要标题，该标题提取了描述内容的核心信息并结合了预训练语言模型中学习到的通用知识，相比抽取式结果更加流畅和丰富。

在训练样本集准备部分，挑选了上百万条较高CTR的样本多媒体信息(CTR>5％)，足够的训练样本保证了多媒体信息的行业覆盖全面，使得模型能够学习到各行业的知识。作为一个示例，可先对获取的训练样本进行清洗，例如，删除内容过短的样本、删除预设符号(例如，“##”等特殊符号)、合并内容中过多的空格、过滤掉样本中的品牌、地域等信息以及内容去重等，最终得到用于训练的训练样本集。

在语言模型设计部分，输入嵌入(embedding)可包括词embedding，段(segment)embedding以及位置(position)embedding。

训练阶段，词嵌入的格式为："[CLS]描述内容[SEP]标题[SEP]"

另外，增加了segment embedding，用于让语言模型区分描述和标题，分为描述内容(content)的embedding以及标题(title)的embedding。位置嵌入的标记从1计数至len(content+title)+3。

由于预训练语言模型的下游任务被设置为文本摘要提取任务(可以理解是文本标题生成任务)，损失函数只计算预测的标题部分的损失，损失函数可选择交叉熵损失函数(CrossEntropyLoss)，以计算预测的下一个令牌(tokens)的概率向量与标签的损失，例如，损失函数如下：

其中y为被标记(mask)的标签，p为预训练语言模型输出的词表概率分布中相关词x的概率，x是title中的词，n为title的长度。

在语言模型的训练阶段，使用了中文通用预训练语言模型,即对预训练语言模型进行训练得到目标语言模型，该预训练语言模型使用CLUECorpusSmall(一种开源中文语料库)语料训练所得，优化函数选择了transformers包中的AdamW(一种优化器)，微调训练阶段的核心超参数设置如下：

激活函数："gelu_new"，一种高斯误差线性单元激活函数；

预训练模型："GPT2LMHeadModel"；

注意力机制的神经元丢掉概率(attention的dropout率)：0.1；

embeddings的dropout率：0.1；

初始化范围(initializer_range):0.02；

归一化层的一个参数(epsilon)：1e-05；

模型类别：:"gpt2"；

context向量的长度：1024

embeddings维度：768；

注意力头(head)个数：12；

层数：12；

最大序列长度：1024；

全连接层dropout率：0.1；

词表大小：21131。

其中context向量的长度为1024，词向量长度为768，位置向量的长度为1024,选用了21131版中文词典,12个自注意力头(self-attention head)，层数为12,训练10轮,训练时长可为两周。

在目标语言模型的调用阶段，输入为“[CLS]描述内容[SEP]”,从[SEP]的下一个token开始，预测描述内容的标题，作为输出。

目标语言模型的输出结果举例如下表1所示：

表1

其中{}括号中的内容为默认关键词，由上表1所示，新标题的结果语句通顺，相比原标题内容新颖，能够输出诸如“2021全新报价单”，“我们是认真的！”等原描述中没有的信息，此内容为模型学习到的行业知识或可以理解为同行优质多媒体信息的特征，这使得结果更加多样新颖，体现企业优势,丰富内容，比较适合作为标题。

对于新标题校验过程：

多媒体信息属于用户可以直接感知的部分，所以对于模型生成的新标题，需经过严格的校验，主要包含品牌、地域等敏感词校验、语法校验和通顺度校验等。其中品牌校验部分可使用了品牌库对新标题中的品牌敏感词过滤，地域的敏感词校验使用了开源的地域检测工具进行校验并过滤。经过校验的新标题替代对应的原标题，更新多媒体信息，即对第二多媒体信息集中的原标题更新为新标题，得到第一多媒体信息集，第一多媒体信息集中多媒体信息将会在排序阶段被识别意图，将会使用上述意图识别模型进行识别，优先推送与查询信息的意图一致的多媒体信息。

在本公开的信息处理方法中，基于后验数据，挑选了上百万条较高CTR的样本多媒体信息作为训练样本集，使得预训练语言模型学习到了优质多媒体信息的共性或特征，保证了生成的标题结果的效果。其次，由于训练样本集数量较大，语言模型能生成的相比抽取式摘要或人工编写更为多样的结果，解决了客户标题不会写，内容千篇一律的问题。

为了防止输出结果出现不相关的业务信息，可通过在语言模型训练阶段设置了可控文本生成中常用的复制(copy)机制，通过每次迭代输出的隐藏层状态(hidden state)的交互，增加描述内容中的原有核心词在输出中产生的概率，一定程度上避免产生额外的业务词。其次，设计了的校验规则，对品牌，地域等敏感词汇进行校验，并进行语法校验和通顺读的校验，可过滤语法不准确和不通顺的标题。

针对进站的检索信息的意图与多媒体信息的额标题的意图不匹配的问题，设计了上述意图识别模型，对于每一条多媒体信息的标题，模型可以生成多条备选新标题，生成新的多媒体信息，使用意图识别模型识别出备选标题的意图，作为最重要的排序特征。经过排序模型的排序，将排序靠前，同时一般也是意图最匹配的多媒体信息推送给广告主。

本技术方案能基于多媒体信息的描述内容批量生成新标题从而得到新多媒体信息。首先设计了多媒体信息处理模块，使用意图识别模型挑选出与查询信息的恶意图不匹配多媒体信息单元，对其中的多媒体信息进行改写，例如，生成与查询信息的意图匹配的新的多媒体信息，添加新的多媒体信息，保证新生成的多媒体信息意图匹配。其次使用了GPT2作为预训练语言模型，设计了巧妙的微调任务，改写了模型的输入，增加了segmentembedding这一输入，同时改进了模型的损失函数，使之更适合于微调任务。在使用大量优质样本多媒体信息的训练下，能够生成内容多样又吸引眼球的优质标题，生成的标题的质量和通顺度又可通过大量规则和风控接口保证。该基于意图识别与GPT2的标题生成方法解决了搜索广告主不会写创意的问题，同时能够做到大批量生成，解决了人力成本的问题，利用新标题更新的多媒体信息也可提高了广告投放的CTR。本公开实施例的方法可用于搜索平台、信息流平台等。

如图4所示，根据本公开的实施例，本公开还提供一种信息处理装置400，装置包括：

第一获取模块401，用于获取查询信息；

第一识别模块402，用于对查询信息进行意图识别，得到查询信息的意图识别结果；

第一确定模块403，用于基于查询信息确定第一多媒体信息集，第一多媒体信息集包括N个多媒体信息，N为正整数；

第二识别模块404，用于对N个多媒体信息的标题进行意图识别，得到N个多媒体信息的意图识别结果；

第二确定模块405，用于基于查询信息的意图识别结果以及N个多媒体信息的标题的意图识别结果，从第一多媒体信息集中确定目标多媒体信息，并输出目标多媒体信息。

在一个实施例中，第一确定模块403，包括：

多媒体确定模块，用于通过查询信息进行查询，确定第一多媒体单元，第一多媒体单元的名称与查询信息匹配，第一多媒体单元中包括第二多媒体信息集；

第一生成模块，用于基于第二多媒体信息集中多媒体信息的描述内容，生成第二多媒体信息集中多媒体信息的目标标题；

更新模块，用于使用第二多媒体信息集中多媒体信息的目标标题，对第二多媒体信息集中多媒体信息的原标题进行更新，得到第一多媒体信息集。

在一个实施例中，装置400还包括：

第三识别模块，用于第一生成模块执行基于第二多媒体信息集中多媒体信息的描述内容，生成第二多媒体信息集中多媒体信息的目标标题之前，对第二多媒体信息集中多媒体信息的标题进行意图识别，得到第二多媒体信息集中多媒体信息的标题的意图识别结果；

第二生成模块，用于在第二多媒体信息集中多媒体信息的标题的意图识别结果中不包括查询信息的意图识别结果的情况下，生成K个多媒体信息，K为正整数，K个多媒体信息的标题的意图与查询信息的意图识别结果匹配；

添加模块，用于将K个多媒体信息添加至第二多媒体信息集中，以更新第二多媒体信息集。

其中，目标语言模型通过训练样本集训练得到，训练样本集中包括多条样本多媒体信息，且每一条样本多媒体信息的点击率大于预设点击率阈值。

在一个实施例中，装置400还包括：

目标处理模块，用于更新模块执行使用第二多媒体信息集中多媒体信息的目标标题，对第二多媒体信息集中多媒体信息的原标题进行更新，得到第一多媒体信息集之前，对第二多媒体信息集中多媒体信息的目标标题进行目标处理，以更新第二多媒体信息集中多媒体信息的目标标题，其中，目标处理包括以下至少一项：

语法调整；

通顺度调整；

敏感词过滤。

上述各实施例的信息处理装置为实现上述各实施例的信息处理方法的装置，技术特征对应，技术效果对应，在此不再赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质以及一种计算机程序产品。

本公开实施例的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本公开所提供的信息处理方法。

本公开实施例的计算机程序产品，包括计算机程序，所述计算机程序用于使计算机执行本公开各实施例提供的信息处理方法。

图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图5所示，电子设备500包括计算单元501，其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序，来执行各种适当的动作和处理。在RAM503中，还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

电子设备500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许电子设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(I)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理，例如信息处理方法。例如，在一些实施例中，信息处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM503并由计算单元501执行时，可以执行上文描述的信息处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行信息处理方法。本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种信息处理方法，所述方法包括：

获取查询信息；

基于所述查询信息的意图识别结果以及所述N个多媒体信息的标题的意图识别结果，从所述第一多媒体信息集中确定目标多媒体信息，并输出所述目标多媒体信息。

2.根据权利要求1所述的方法，其中，所述目标多媒体信息的标题的意图识别结果与所述查询信息的意图识别结果匹配。

3.根据权利要求1所述的方法，其中，所述基于所述查询信息确定第一多媒体信息集，包括：

通过所述查询信息进行查询，确定第一多媒体单元，所述第一多媒体单元的名称与所述查询信息匹配，所述第一多媒体单元中包括第二多媒体信息集；

基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题；

使用所述第二多媒体信息集中多媒体信息的目标标题，对所述第二多媒体信息集中多媒体信息的原标题进行更新，得到所述第一多媒体信息集。

4.根据权利要求3所述的方法，其中，所述基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题之前，还包括：

对所述第二多媒体信息集中多媒体信息的标题进行意图识别，得到所述第二多媒体信息集中多媒体信息的标题的意图识别结果；

在所述第二多媒体信息集中多媒体信息的标题的意图识别结果中不包括所述查询信息的意图识别结果的情况下，生成K个多媒体信息，K为正整数，所述K个多媒体信息的标题的意图与所述查询信息的意图识别结果匹配；

将所述K个多媒体信息添加至所述第二多媒体信息集中，以更新所述第二多媒体信息集。

5.根据权利要求3所述的方法，其中，所述基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题，包括：

通过已训练的目标语言模型，生成所述第二多媒体信息集中多媒体信息的描述内容的目标标题；

其中，所述目标语言模型通过训练样本集训练得到，所述训练样本集中包括多条样本多媒体信息，且每一条样本多媒体信息的点击率大于预设点击率阈值。

6.根据权利要求3所述的方法，其中，所述使用所述第二多媒体信息集中多媒体信息的目标标题，对所述第二多媒体信息集中多媒体信息的原标题进行更新，得到所述第一多媒体信息集之前，还包括：

对所述第二多媒体信息集中多媒体信息的目标标题进行目标处理，以更新第二多媒体信息集中多媒体信息的目标标题，其中，所述目标处理包括以下至少一项：

语法调整；

通顺度调整；

敏感词过滤。

7.一种信息处理装置，所述装置包括：

第一获取模块，用于获取查询信息；

8.根据权利要求7所述的装置，其中，所述目标多媒体信息的标题的意图识别结果与所述查询信息的意图识别结果匹配。

9.根据权利要求7所述的装置，其中，所述第一确定模块，包括：

多媒体确定模块，用于通过所述查询信息进行查询，确定第一多媒体单元，所述第一多媒体单元的名称与所述查询信息匹配，所述第一多媒体单元中包括第二多媒体信息集；

第一生成模块，用于基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题；

更新模块，用于使用所述第二多媒体信息集中多媒体信息的目标标题，对所述第二多媒体信息集中多媒体信息的原标题进行更新，得到所述第一多媒体信息集。

10.根据权利要求9所述的装置，其中，还包括：

第三识别模块，用于所述第一生成模块执行基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题之前，对所述第二多媒体信息集中多媒体信息的标题进行意图识别，得到所述第二多媒体信息集中多媒体信息的标题的意图识别结果；

第二生成模块，用于在所述第二多媒体信息集中多媒体信息的标题的意图识别结果中不包括所述查询信息的意图识别结果的情况下，生成K个多媒体信息，K为正整数，所述K个多媒体信息的标题的意图与所述查询信息的意图识别结果匹配；

添加模块，用于将所述K个多媒体信息添加至所述第二多媒体信息集中，以更新所述第二多媒体信息集。

11.根据权利要求9所述的装置，其中，所述基于所述第二多媒体信息集中多媒体信息的描述内容，生成所述第二多媒体信息集中多媒体信息的目标标题，包括：

12.根据权利要求9所述的装置，其中，还包括：

目标处理模块，用于所述更新模块执行使用所述第二多媒体信息集中多媒体信息的目标标题，对所述第二多媒体信息集中多媒体信息的原标题进行更新，得到所述第一多媒体信息集之前，对所述第二多媒体信息集中多媒体信息的目标标题进行目标处理，以更新第二多媒体信息集中多媒体信息的目标标题，其中，所述目标处理包括以下至少一项：

语法调整；

通顺度调整；

敏感词过滤。

13.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6任一所述的信息处理方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-6任一所述的信息处理方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一所述的信息处理方法。