CN113722422A

CN113722422A - 模型训练方法、文本标签生成方法、装置、设备及介质

Info

Publication number: CN113722422A
Application number: CN202110399762.3A
Authority: CN
Inventors: 牟文晶
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-04-14
Filing date: 2021-04-14
Publication date: 2021-11-30

Abstract

本申请提供了一种模型训练方法、文本标签生成、装置、设备及介质，属于自然语言处理领域。所述方法包括：获取搜索行为信息；对所述搜索行为信息进行数据清洗，得到训练数据；以所述训练数据中的搜索结果数据为输入信息，所述搜索输入数据为监督信息，训练得到目标模型。通过获取搜索过程中的输入行为和点击行为，将输入行为对应的搜索输入数据以及点击行为对应的搜索结果数据作为训练数据，得到不需要分词即可提取文本的关键信息的目标模型，从而基于该目标模型获取文本标签的准确率更高，从而能够基于该文本标签更好的对文本进行推荐。

Description

模型训练方法、文本标签生成方法、装置、设备及介质

技术领域

本申请涉及自然语言处理领域，特别涉及一种模型训练方法、文本标签生成方法、装置、设备及介质。

背景技术

“召回”是推荐策略的一个重要内容，“召回”指从全量信息集合中触发极可能多正确的结果。例如，用文本标签来召回新闻是一种普遍的做法。

由于文本摘要是将源文本进行精简提炼后得到的一个短语或一段语句，能够包含源文本的关键信息，如新闻标题相当于新闻正文的摘要。因此能够通过对文本摘要进行分词，然后基于分词得到的词语的词性，来获取文本标签。然而，由于分词工具的效果不佳，导致获取到的文本标签的准确率较低。

发明内容

本申请实施例提供了一种模型训练方法、文本标签生成方法、装置、设备及介质，能够得到不需要分词即可提取文本的关键信息的目标模型，从而基于该目标模型获取文本标签的准确率更高。所述技术方案如下：

一方面，提供了一种模型训练方法，所述方法包括：

获取搜索行为信息，所述搜索行为信息用于表示搜索过程中与输入行为对应的搜索输入数据以及与点击行为对应的搜索结果数据；

对所述搜索行为信息进行数据清洗，得到训练数据，所述训练数据包括清洗后的至少一条搜索输入数据和每条搜索输入数据对应的至少一条搜索结果数据；

以所述训练数据中的搜索结果数据为输入信息，所述搜索输入数据为监督信息，训练得到目标模型，所述目标模型用于提取文本的文本标签。

另一方面，提供了一种文本标签生成方法，所述方法包括：

获取待推荐的目标文本；

基于目标模型对所述目标文本进行处理，得到目标文本标签；

其中，所述目标模型基于上述模型训练方法训练得到。

另一方面，提供了一种模型训练装置，所述装置包括：

信息获取模块，用于获取搜索行为信息，所述搜索行为信息用于表示搜索过程中与输入行为对应的搜索输入数据以及与点击行为对应的搜索结果数据；

数据清洗模块，用于对所述搜索行为信息进行数据清洗，得到训练数据，所述训练数据包括清洗后的至少一条搜索输入数据和每条搜索输入数据对应的至少一条搜索结果数据；

训练模块，用于以所述训练数据中的搜索结果数据为输入信息，所述搜索输入数据为监督信息，训练得到目标模型，所述目标模型用于提取文本的文本标签。

在一种可选的实现方式中，所述信息获取模块，用于响应于第一输入行为，获取与所述第一输入行为对应的第一输入数据；响应于对展示的搜索结果的第一点击行为，获取与所述第一点击行为对应的至少一个第一结果数据；响应于第二输入行为，将所述第一输入行为、所述第一输入数据、所述第一点击行为以及所述至少一个第一结果数据，获取为一条搜索行为信息。

在一种可选的实现方式中，对所述搜索行为信息进行数据清洗的方式，包括下述至少一项：

响应于任一条搜索行为信息中的搜索输入数据不满足词性条件，移除所述任一条搜索行为信息，所述词性条件用于指示至少一种词性；

响应于任一条搜索行为信息中的搜索输入数据包括第一词语库中的任一词语，移除所述任一条搜索行为信息，所述第一词语库用于存储至少一个词语；

响应于任一条搜索行为信息中的搜索输入数据的语义不完整，移除所述任一条搜索行为信息；

响应于任一条搜索行为信息中的搜索输入数据与搜索结果数据之间的关联度小于关联度阈值，移除所述任一条搜索行为信息。

在一种可选的实现方式中，所述训练模块，用于对于所述训练数据中的任一搜索结果数据，使用至少一个目标符号分别替换所述任一搜索结果数据中属于第二词语库的至少一个词语，得到所述任一搜索结果数据对应的替换结果数据，一个目标符号用于代表一个词语；基于本次迭代过程对应的第一模型对所述替换结果数据进行处理，得到包括所述至少一个目标符号的第一输出结果；将所述第一输出结果中的目标符号替换为对应的词语，得到第二输出结果；基于所述第二输出结果和所述任一搜索结果数据对应的搜索输入数据之间的差异，调整所述第一模型的参数，得到下次迭代过程对应的第二模型；基于所述第二模型进行迭代，直到得到训练完毕的所述目标模型。

另一方面，提供了一种文本标签生成装置，其特征在于，所述装置包括：

文本获取模块，用于获取待推荐的目标文本；

标签生成模块，用于基于目标模型对所述目标文本进行处理，得到目标文本标签；

其中，所述目标模型基于上述模型训练方法训练得到。

在一种可选的实现方式中，所述标签生成模块，用于使用至少一个目标符号分别替换所述目标文本中属于第二词语库的词语，得到替换文本；基于所述目标模型对所述替换文本进行处理，得到包括所述至少一个目标符号的替换文本标签；将所述替换文本标签中的目标符号替换为对应的词语，得到所述目标文本标签。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的模型训练方法所执行的操作，或者执行以实现本申请实施例中的文本标签生成方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一段计算机程序，所述至少一段计算机程序由处理器加载并执行以实现本申请实施例中的模型训练方法所执行的操作，或者执行以实现本申请实施例中的文本标签生成方法所执行的操作。

再一方面，提供了一种计算机程序产品，所述计算机程序产品包括计算机程序代码，所述计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行所述计算机程序代码，使得所述计算机设备实现如上述方面所述的模型训练方法中所执行的操作，或者实现如上述方面所述的文本标签生成方法中所执行的操作。

本申请实施例提供的技术方案带来的有益效果是：

在本申请实施例中，通过获取搜索过程中的输入行为和点击行为，将输入行为对应的搜索输入数据以及点击行为对应的搜索结果数据作为训练数据，得到不需要分词即可提取文本的关键信息的目标模型，从而基于该目标模型获取文本标签的准确率更高。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的一种模型训练方法的实施环境示意图；

图2是根据本申请实施例提供的一种模型训练方法的流程图；

图3是根据本申请实施例提供的另一种模型训练方法的流程图；

图4是根据本申请实施例提供的一种模型结果的示意图；

图5是根据本申请实施例提供的一种替换词语的示意图；

图6是根据本申请实施例提供的一种文本标签生成方法的流程图；

图7是根据本申请实施例提供的一种模型训练装置的框图；

图8是根据本申请实施例提供的一种文本标签生成装置的框图；

图9是根据本申请实施例提供的一种终端的结构框图；

图10是根据本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

以下对本申请实施例所涉及的一些技术进行解释。

区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。例如，在本申请实施例中获取的搜索行为信息为存储在区块链中的数据。

大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临，大数据也吸引了越来越多的关注，大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。例如，本申请实施例基于大数据技术，在经过用户授权的前提先，获取用户的搜索行为信息。

自然语言处理(Nature Language processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

指针生成网络(Pointer Generator Network)，在基于seq2seq(Sequence toSequence，序列到序列)和Attention(注意力机制)构建的模型的基础上引入pointer(指针)机制，解决未登陆词(OOV，Out-Of-Vocabulary)的问题。

本申请实施例提供的模型训练方法，能够由计算机设备执行。可选地，该计算机设备为终端或服务器。下面首先以计算机设备为服务器为例，介绍一下本申请实施例提供的模型训练方法的实施环境，图1是根据本申请实施例提供的一种模型训练方法的实施环境示意图。参见图1，该实施环境包括终端101和服务器102。

终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

可选的，服务器102是独立的物理服务器，也能够是多个物理服务器构成的服务器集群或者分布式系统，还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

在该实施环境中，服务器通过模型训练方法能够应用于新闻领域、购物领域以及文学领域等。

例如，训练得到的目标模型，用于提取新闻的新闻标签。通过本申请实施例提供的模型训练方法，服务器获取用户搜索新闻内容时的搜索行为信息，然后对该搜索行为信息进行数据清洗，将用户搜索新闻时输入的内容作为训练用的搜索输入数据，将用户搜索新闻时点击的新闻标题作为训练用的搜索结果数据，基于训练数据进行模型训练，得到该目标模型。

在另一种可选的实现方式中，以计算机设备为终端为例。可选的，终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。本领域技术人员可以知晓，终端101的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。

例如，训练得到的目标模型，用于提取商品信息的商品标签。通过本申请实施例提供的模型训练方法，终端获取用户搜索商品时的搜索行为信息，然后对该搜索行为信息进行数据清洗，将用户搜索商品时输入的内容作为训练用的搜索输入数据，将用户搜索商品时点击的商品介绍链接的文字内容作为训练用的搜索结果数据，基于训练数据进行模型训练，得到该目标模型。

需要说明的是，上述实施环境还能够用于实施文本标签生成方法，实施方式与模型训练方法类似，在此不再赘述。

图2是根据本申请实施例提供的一种模型训练方法的流程图，如图2所示，在本申请实施例中以计算机设备为服务器为例进行说明。该模型训练方法包括以下步骤：

201、服务器获取搜索行为信息，该搜索行为信息用于表示搜索过程中与输入行为对应的搜索输入数据以及与点击行为对应的搜索结果数据。

在本申请实施例中，服务器能够获取基于大数据技术已采集的搜索行为信息，还能够根据用户的搜索行为，在用户已授权的情况下，实时获取用户的搜索行为信息。

202、服务器对该搜索行为信息进行数据清洗，得到训练数据，该训练数据包括清洗后的至少一条搜索输入数据和每条搜索输入数据对应的至少一条搜索结果数据。

在本申请实施例中，由于服务器获取到的搜索行为信息中通常会包括无法用于训练的数据，如用户输入了错别字、用户输入的内容不完整或者用户搜索的内容和点击的内容关联度不高等。服务器通过对搜索行为信息进行数据清洗，能够保留用于训练的训练数据。

203、服务器以该训练数据中的搜索结果数据为输入信息，该搜索输入数据为监督信息，训练得到目标模型，该目标模型用于提取文本的文本标签。

在本申请实施例中，服务器采用有监督学习的方式进行模型训练，在训练过程中，将搜索结果数据作为模型的输入信息，将该搜索结果数据对应的搜索输入数据作为模型的监督信息，通过多次迭代得到训练完毕的目标模型。

图3是根据本申请实施例提供的另一种模型训练方法的流程图，如图3所示，在本申请实施例中以计算机设备为服务器为例进行说明为例进行说明。该方法包括以下步骤：

301、服务器获取搜索行为信息，该搜索行为信息用于表示搜索过程中与输入行为对应的搜索输入数据以及与点击行为对应的搜索结果数据。

在本申请实施例中，用户有多种搜索行为，如在浏览器中搜索网页、在购物程序中搜索商品或者在文学网站进行搜索小说等。对于任一搜索行为，通常是用户通过输入行为输入要搜索的内容，也即用户期望搜索到的内容，然后从搜索到的多个内容中，通过点击行为来查看符合预期的内容。因此，搜索行为包括输入行为和点击行为，服务器通过获取一次搜索过程中的输入行为对应的搜索输入数据以及点击行为对应的搜索结果数据，即可得到一条搜索行为信息。

在一种可选的实现方式中，服务器能够根据搜索行为，实时获取搜索行为信息。响应于第一输入行为，服务器获取与该第一输入行为对应的第一输入数据。然后，响应于对展示的搜索结果的第一点击行为，服务器获取与该第一点击行为对应的至少一个第一结果数据。然后，响应于第二输入行为，服务器将第一输入行为、第一输入数据、第一点击行为以及至少一个第一结果数据，获取为一条搜索行为信息。也即，服务器将一次输入行为和对应的至少一次点击行为确定为一次搜索行为。通过基于搜索行为来获取搜索行为信息，使得服务器能够根据用户的搜索行为，实时的获取对应的搜索行为信息，由于搜索行为能够真实的反映用户的关注点和期望结果，因此能够将搜索行为信息用于模型的训练。

例如，用户在浏览器的搜索框中输入“螺蛳粉做法”，服务器检测到该第一输入行为时，获取用户标识、输入时间以及“螺蛳粉做法”等内容作为第一输入数据。服务器展示多条与“螺蛳粉做法”相关的网页，各网页对应有与“螺蛳粉做法”相关的标题，标题的展示形式为文字链接。用户通过点击任一文字链接来查看对应的网页内容，服务器检测到点击行为时，获取用户标识、点击时间以及标题文本等内容作为第一结果数据。用户再次在浏览器的搜索框中输入内容，服务器检测到该第二输入行为，则确定一次搜索行为结束，服务器将上述第一输入行为、第一输入数据、第一点击行为以及第一结果数据，获取为一条搜索行为信息。然后服务器基于该第二输入行为，获取对应的第二输入数据，服务器检测到第二点击行为时，获取对应的第二点击数据。然后服务器在检测到第三输入行为时，将上述第二输入行为、第二输入数据、第二点击行为以及第二结果数据，获取为另一条搜索行为信息。

可选的，服务器在检测到第二输入行为之前，如果用户点击任一文字链接后，又点击了另一文字链接，则服务器将上述两个文字链接对应的文本内容确定为第一结果数据；或者服务器将最后一次点击的文字链接对应的文本内容，确定为第一结果数据；或者服务器还能够获取各文字链接被点击后，用户在对应的网页停留的时间，然后获取点击后在对应的网页停留时间最长的文字链接，将该文字链接所对应的文本内容，确定为第一结果数据。

在一种可选的实现方式中，服务器还能够获取基于大数据技术已采集的搜索行为信息。可选的，该搜索行为信息存储在服务器维护的数据库中，或者该搜索行为信息存储在区块链系统中，本申请实施例对此不进行限制。

需要说明的是，服务器还能够根据模型的应用领域，获取不同应用领域对应的搜索行为信息。如服务器在训练应用于新闻领域的模型时，获取在新闻领域的搜索行为信息；服务器在训练应用于购物领域的模型时，获取在购物领域的搜索行为信息；服务器在训练应用于文学领域的模型时，获取在文学领域的搜索行为信息。

302、服务器对该搜索行为信息进行数据清洗，得到训练数据，该训练数据包括清洗后的至少一条搜索输入数据和每条搜索输入数据对应的至少一条搜索结果数据。

在本申请实施例中，服务器在获取到搜索行为信息之后，会对该搜索行为信息进行数据清洗，以剔除对训练过程无用的数据，以提高模型的训练效果。

在一种可选的实现方式中，对于任一条搜索行为信息，响应于该任一条搜索行为信息中的搜索输入数据不满足词性条件，则服务器移除该任一条搜索行为信息，该词性条件用于指示至少一种词性。可选地，搜索输入数据的词性为<名词+动词>、<动词+名词>以及<人名+动词>等词性组合，如果搜索输入数据不满足上述任意一种词性组合，则确定该搜索输入数据不满足词性条件。

例如，服务器获取到一条搜索行为信息中的搜索输入数据为“仙人掌能治烫伤”，搜索结果数据为“为什么仙人掌能治疗烫伤？”，由于该搜索输入数据的词性为<名词+动词+动词+名词>，不满足词性条件，则服务器移除该条搜索行为信息。

在一种可选的实现方式中，对于任一条搜索行为信息，响应于该任一条搜索行为信息中的搜索输入数据包括第一词语库中的任一词语，服务器移除任一条搜索行为信息，该第一词语库用于存储至少一个词语。可选地，该第一词语库用于存储实体名称词语，如小说名称、公司名称、电视剧名称以及电影名称等。

例如，服务器获取到一条搜索行为信息中的搜索输入数据为“XX修仙”，搜索结果数据为“重生之修仙YY”，显然该“XX修仙”为一部小说的名称，而“重生之修仙YY”为另一部小说的名称，不符合模型训练的需求，服务器移除该条搜索行为信息。

在一种可选的实现方式中，对于任一条搜索行为信息，响应于该任一条搜索行为信息中的搜索输入数据的语义不完整，服务器移除该任一条搜索行为信息。其中，服务器能够对搜索输入数据进行语义识别，判断搜索输入数据的包含的语义要素是否完整，如果语义不完整，如语句不通顺、语句不完整等，则服务器移除该条搜索行为信息。

例如，服务器获取到的一条搜索行为信息中的搜索输入数据为“天秤喜欢”，搜索结果数据为“十二星座会用什么奇葩理由拒绝不喜欢的人？天秤：我配不上你”。由于“天秤喜欢”的语句不完整，因此服务器移除该搜索行为信息。

在一种可选的实现方式中，对于任一条搜索行为信息，响应于任一条搜索行为信息中的搜索输入数据与搜索结果数据之间的关联度小于关联度阈值，服务器移除该任一条搜索行为信息。其中，服务器能够判断搜索输入数据以搜索结果数据之间的关联度，如果搜索输入数据和搜索结果数据之间的关联度较高，表示用户搜索到的内容是其期望的内容；如果搜索输入数据和搜索结果数据之间的关联度较低，则表示用户搜索到的内容不是其期望的内容。服务器设置有关联度阈值，在搜索输入数据与搜索结果数据之间的关联度小于关联度阈值时，移除对应的搜索行为信息。

例如，服务器获取到的一条搜索行为信息中的搜索输入数据为“揩油女星”，搜索结果数据为“国内一线女星的片酬”。由于搜索输入数据和搜索结果数据之间的关联度很低，因此服务器移除该条搜索行为信息。

需要说明的是，服务器还能够采用其他方式对搜索行为信息进行数据清洗，本申请实施例对此不进行限制。

303、服务器对于该训练数据中的任一搜索结果数据，使用至少一个目标符号分别替换该任一搜索结果数据中属于第二词语库的至少一个词语，得到该任一搜索结果数据对应的替换结果数据，一个目标符号用于代表一个词语。

在本申请实施例中，服务器还能够通过符号来替换搜索结果数据中的部分词语，来减少模型的学习难度。，该第二词语库用于存储至少一个需要被替换的词语，如汽车品牌、公司名称、人名以及地名等，本申请实施例对此不进行限制。

在一种可选的实现方式中，服务器获取第二词语库，对于任一搜索结果数据，服务器遍历该搜索结果数据中的词语，如果该任一搜索结果数据中包括第二词语库中的一个或者多个词语，则服务器使用各词语对应的目标符号来替换对应的词语，得到该任一搜索结果数据对应的替换结果数据。

例如，以第二词语库中存储的汽车品牌为例，该第二词语库中有“福特福克斯、兰博基尼、大众朗逸、玛莎拉蒂…”等汽车品牌，搜索结果数据为“小伙自制布加迪威龙，拥有豪车不是梦，成本只花了1万”，服务器以目标符号“[entity]”替换“布加迪威龙”，则替换结果数据为“小伙自制[entity]，拥有豪车不是梦，成本只花了1万”。

304、服务器基于本次迭代过程对应的第一模型对该替换结果数据进行处理，得到包括该至少一个目标符号的第一输出结果。

在本申请实施例中，服务器通过多次迭代过程来训练模型。以一次迭代过程为例，本次迭代过程对应的模型为第一模型，服务器将上述替换结果数据输入该第一模型，由该第一模型中的编码器(Encoder)对该替换结果数据进行编码，然后对编码结果进行处理后在通过解码器(Dceoder)进行解码，得到第一输出结果。

在一种可选的实现方式中，编码器对该替换结果数据中的每个字进行编码，也即从字粒度对模型的输入数据进行处理，避免了对分词工具效果的依赖。

例如，该第一模型为指针生成网络，该指针生成网络包括编码器、解码器以及注意力层。参见图4所示，图4是根据本申请实施例提供的一种模型结果的示意图。如图4所示，搜索输入数据为“猪肝瘦肉粥的做法”，搜索结果数据为“广东人爱吃的猪肝瘦肉粥，学会这1中做法，在家轻易…”。首先通过编码器对该搜索结果数据中的每个字进行编码，得到结果字向量。然后，基于解码器对搜索输入数据中的每个字进行编码，得到输入字向量。然后，基于注意力机制对该结果字向量和输入字向量进行处理，得到上下文向量。然后，基于上下文向量和输入字向量确定模型权重，以及增加字向量，该增加字向量表示需要增加的字。然后基于模型权重、输入字向量以及增加字向量，确定目标字向量。也即模型在解码时，不但可以从预设词表中生成最终的结果，还能够从输入中复制某个词最为解码的结果，该预设词表用于生成模型输出。

305、服务器将该第一输出结果中的目标符号替换为对应的词语，得到第二输出结果。

在本申请实施例中，服务器在得到第一输出结果之后，按照使用目标符号替换词语的反向过程，将第一输出结果中的目标符号，替换为该目标符号对应的词语。

例如，参见图5所示，图5是根据本申请实施例提供的一种替换词语的示意图。如图5所示，第二词语库中有“福特福克斯、兰博基尼、大众朗逸、玛莎拉蒂…”等汽车品牌，目标符号为[entity]，模型为第一模型，搜索结果数据为“小伙自制布加迪威龙，拥有豪车不是梦，成本只花了1万”，替换结果数据为“小伙自制[entity]，拥有豪车不是梦，成本只花了1万”，第一输出结果为“自制[entity]”，第二输出结果为“自制布加迪威龙”。

306、服务器基于该第二输出结果和该任一搜索结果数据对应的搜索输入数据之间的差异，调整该第一模型的参数，得到下次迭代过程对应的第二模型。

在本申请实施例中，服务器能够根据模型输出的第二输出结果和作为监督信息的搜索输入数据，计算损失函数，基于损失函数来调整第一模型的参数，得到下次迭代过程对应的第二模型。可选地，如果第二输出结果和该任一搜索结果数据对应的搜索输入数据之间的差异小于差异阈值，则服务器将该第一模型确定为训练完毕的目标模型。

307、服务器基于该第二模型进行迭代，直到得到训练完毕的该目标模型。

需要说明的是，服务器还能够获取预训练模型，基于预训练模型来训练得到该目标模型。可选地，服务器获取预训练模型，该预训练模型用于进行文本识别，服务器基于上述训练数据对该预训练模型进行训练，调整该预训练模型的参数，得到该目标模型。可选地，服务器将训练数据输入于进行文本识别预训练模型，将该预训练模型的输出作为上述第一模型的输入，来训练得到该目标模型。通过使用预训练模型来训练目标模型，能够使目标模型学习到丰富的语义信息，提高该目标模型输出的结果的准确率。其中，该预训练模型为transformer(一种模型)、BERT(Bidirectional Encoder Representations fromTransformers，一种模型)、MASS(Masked Sequence to Sequence Pre-training，一种模型)中的任意一种。

图6是根据本申请实施例提供的一种文本标签生成方法的流程图，如图6所示，在本申请实施例中以计算机设备为终端为例进行说明。该方法包括以下步骤：

601、终端获取待推荐的目标文本。

在本申请实施例中，该目标文本为待推荐的新闻标题、商品间接以及文本摘要等，本申请实施例对此不进行限制。

602、终端基于目标模型对该目标文本进行处理，得到目标文本标签，该目标模型基于上述模型训练方法训练得到。

在本申请实施例中，终端从服务器获取该目标模型，然后将上述目标文本输入该目标模型，由该目标模型对该目标文本进行处理，得到该目标文本对应的目标文本标签。

例如，目标文本为“小伙自制布加迪威龙，拥有豪车不是梦，成本只花了1万”，目标模型对该目标文本处理后输出的目标文本标签为“自制布加迪威龙”。

在一种可选的实现方式中，终端使用至少一个目标符号分别替换该目标文本中属于第二词语库的词语，得到替换文本。然后终端基于该目标模型对该替换文本进行处理，得到包括该至少一个目标符号的替换文本标签。然后，终端将替换文本标签中的目标符号替换为对应的词语，得到目标文本标签。

例如，以第二词语库中存储的汽车品牌为例，该第二词语库中有“福特福克斯、兰博基尼、大众朗逸、玛莎拉蒂…”等汽车品牌，目标文本为“小伙自制布加迪威龙，拥有豪车不是梦，成本只花了1万”，终端以目标符号“[entity]”替换“布加迪威龙”，则替换文本为“小伙自制[entity]，拥有豪车不是梦，成本只花了1万”。终端基于目标模型对替换文本进行处理，得到替换文本标签“自制[entity]”，最后终端将目标符号替换为对应的词语，得到目标文本标签“自制布加迪威龙”。

在本申请实施例中，通过使用目标模型对目标文本进行处理，使得不需要分词即可提取文本的关键信息，得到对应的目标文本标签，能够提高获取文本标签的准确率。

图7是根据本申请实施例提供的一种模型训练装置的框图。该装置用于执行上述模型训练方法中的步骤，参见图7，装置包括：信息获取模块701、数据清洗模块702以及训练模块703。

信息获取模块701，用于获取搜索行为信息，该搜索行为信息用于表示搜索过程中与输入行为对应的搜索输入数据以及与点击行为对应的搜索结果数据；

数据清洗模块702，用于对该搜索行为信息进行数据清洗，得到训练数据，该训练数据包括清洗后的至少一条搜索输入数据和每条搜索输入数据对应的至少一条搜索结果数据；

训练模块703，用于以该训练数据中的搜索结果数据为输入信息，该搜索输入数据为监督信息，训练得到目标模型，该目标模型用于提取文本的文本标签。

在一种可选的实现方式中，该信息获取模块701，用于响应于第一输入行为，获取与该第一输入行为对应的第一输入数据；响应于对展示的搜索结果的第一点击行为，获取与该第一点击行为对应的至少一个第一结果数据；响应于第二输入行为，将该第一输入行为、该第一输入数据、该第一点击行为以及该至少一个第一结果数据，获取为一条搜索行为信息。

在一种可选的实现方式中，对该搜索行为信息进行数据清洗的方式，包括下述至少一项：

响应于任一条搜索行为信息中的搜索输入数据不满足词性条件，移除该任一条搜索行为信息，该词性条件用于指示至少一种词性；

响应于任一条搜索行为信息中的搜索输入数据包括第一词语库中的任一词语，移除该任一条搜索行为信息，该第一词语库用于存储至少一个词语；

响应于任一条搜索行为信息中的搜索输入数据的语义不完整，移除该任一条搜索行为信息；

响应于任一条搜索行为信息中的搜索输入数据与搜索结果数据之间的关联度小于关联度阈值，移除该任一条搜索行为信息。

在一种可选的实现方式中，该训练模块703，用于对于该训练数据中的任一搜索结果数据，使用至少一个目标符号分别替换该任一搜索结果数据中属于第二词语库的至少一个词语，得到该任一搜索结果数据对应的替换结果数据，一个目标符号用于代表一个词语；基于本次迭代过程对应的第一模型对该替换结果数据进行处理，得到包括该至少一个目标符号的第一输出结果；将该第一输出结果中的目标符号替换为对应的词语，得到第二输出结果；基于该第二输出结果和该任一搜索结果数据对应的搜索输入数据之间的差异，调整该第一模型的参数，得到下次迭代过程对应的第二模型；基于该第二模型进行迭代，直到得到训练完毕的该目标模型。

需要说明的是：上述实施例提供的模型训练装置在训练模型时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的模型训练装置与模型训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图8是根据本申请实施例提供的一种文本标签生成装置的框图。该装置用于执行上述文本标签生成方法中的步骤，参见图8，装置包括：文本获取模块801和标签生成模块802。

文本获取模块801，用于获取待推荐的目标文本；

标签生成模块802，用于基于目标模型对所述目标文本进行处理，得到目标文本标签；

其中，所述目标模型基于上述模型训练方法训练得到。

在一种可选的实现方式中，所述标签生成模块802，用于使用至少一个目标符号分别替换所述目标文本中属于第二词语库的词语，得到替换文本；基于所述目标模型对所述替换文本进行处理，得到包括所述至少一个目标符号的替换文本标签；将所述替换文本标签中的目标符号替换为对应的词语，得到所述目标文本标签。

需要说明的是：上述实施例提供的文本标签生成装置在生成文本标签时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的文本标签生成装置与文本标签生成方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在本申请实施例中，计算机设备能够为终端或者服务器，当计算机设备被配置为终端时，可以由终端作为执行主体来实施本申请实施例提供的技术方案，当计算机设备被配置为服务器时，可以由服务器作为执行主体来实施本申请实施例提供的技术方案，也可以通过终端和服务器之间的交互来实施本申请提供的技术方案，本申请实施例对此不作限定。

计算机设备为终端时，图9是根据本申请实施例提供的一种终端900的结构框图。该终端900可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving PictureExperts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端900包括有：处理器901和存储器902。

处理器901可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器901可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器901可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器901还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器902可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器902中的非暂态的计算机可读存储介质用于存储至少一个计算机程序，该至少一个计算机程序用于被处理器901所执行以实现本申请中方法实施例提供的模型训练方法，或者实现本申请中方法实施例提供的文本标签生成方法。

在一些实施例中，终端900还可选包括有：外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地，外围设备包括：射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。

外围设备接口903可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中，处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上；在一些其他实施例中，处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路904用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路904包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路904还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏905用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时，显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时，显示屏905还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏905可以为一个，设置在终端900的前面板；在另一些实施例中，显示屏905可以为至少两个，分别设置在终端900的不同表面或呈折叠设计；在另一些实施例中，显示屏905可以是柔性显示屏，设置在终端900的弯曲表面上或折叠面上。甚至，显示屏905还可以设置成非矩形的不规则图形，也即异形屏。显示屏905可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件906用于采集图像或视频。可选地，摄像头组件906包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器901进行处理，或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路907还可以包括耳机插孔。

定位组件908用于定位终端900的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件908可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源909用于为终端900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于：加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。

加速度传感器911可以检测以终端900建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号，控制显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器912可以检测终端900的机体方向及转动角度，陀螺仪传感器912可以与加速度传感器911协同采集用户对终端900的3D动作。处理器901根据陀螺仪传感器912采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器913可以设置在终端900的侧边框和/或显示屏905的下层。当压力传感器913设置在终端900的侧边框时，可以检测用户对终端900的握持信号，由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在显示屏905的下层时，由处理器901根据用户对显示屏905的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器914用于采集用户的指纹，由处理器901根据指纹传感器914采集到的指纹识别用户的身份，或者，由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器901授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置在终端900的正面、背面或侧面。当终端900上设置有物理按键或厂商Logo时，指纹传感器914可以与物理按键或厂商Logo集成在一起。

光学传感器915用于采集环境光强度。在一个实施例中，处理器901可以根据光学传感器915采集的环境光强度，控制显示屏905的显示亮度。具体地，当环境光强度较高时，调高显示屏905的显示亮度；当环境光强度较低时，调低显示屏905的显示亮度。在另一个实施例中，处理器901还可以根据光学传感器915采集的环境光强度，动态调整摄像头组件906的拍摄参数。

接近传感器916，也称距离传感器，通常设置在终端900的前面板。接近传感器916用于采集用户与终端900的正面之间的距离。在一个实施例中，当接近传感器916检测到用户与终端900的正面之间的距离逐渐变小时，由处理器901控制显示屏905从亮屏状态切换为息屏状态；当接近传感器916检测到用户与终端900的正面之间的距离逐渐变大时，由处理器901控制显示屏905从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图9中示出的结构并不构成对终端900的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

计算机设备为服务器时，图10是根据本申请实施例提供的一种服务器的结构示意图，该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)1001和一个或一个以上的存储器1002，其中，该存储器1002中存储有至少一条计算机程序，该至少一条计算机程序由该处理器1001加载并执行以实现上述各个方法实施例提供的模型训练方法，或者实现上述各个方法实施例提供的文本标签生成方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一段计算机程序，该至少一段计算机程序由计算机设备的处理器加载并执行以实现本申请实施例中的模型训练方法中计算机设备所执行的操作，或者实现本申请实施例中的文本标签生成方法中计算机设备所执行的操作。

本申请实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各种可选实现方式中提供的模型训练方法，或者使得该计算机设备执行上述各种可选实现方式中提供的文本标签生成方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取搜索行为信息，包括：

响应于第一输入行为，获取与所述第一输入行为对应的第一输入数据；

响应于对展示的搜索结果的第一点击行为，获取与所述第一点击行为对应的至少一个第一结果数据；

响应于第二输入行为，将所述第一输入行为、所述第一输入数据、所述第一点击行为以及所述至少一个第一结果数据，获取为一条搜索行为信息。

3.根据权利要求1所述的方法，其特征在于，所述对所述搜索行为信息进行数据清洗的方式，包括下述至少一项：

4.根据权利要求1所述的方法，其特征在于，所述以所述训练数据中的搜索结果数据为输入信息，所述搜索输入数据为监督信息，训练得到目标模型，包括：

对于所述训练数据中的任一搜索结果数据，使用至少一个目标符号分别替换所述任一搜索结果数据中属于第二词语库的至少一个词语，得到所述任一搜索结果数据对应的替换结果数据，一个目标符号用于代表一个词语；

基于本次迭代过程对应的第一模型对所述替换结果数据进行处理，得到包括所述至少一个目标符号的第一输出结果；

将所述第一输出结果中的目标符号替换为对应的词语，得到第二输出结果；

基于所述第二输出结果和所述任一搜索结果数据对应的搜索输入数据之间的差异，调整所述第一模型的参数，得到下次迭代过程对应的第二模型；

基于所述第二模型进行迭代，直到得到训练完毕的所述目标模型。

5.一种文本标签生成方法，其特征在于，所述方法包括：

获取待推荐的目标文本；

其中，所述目标模型基于权利要求1至4任一项训练得到。

6.根据权利要求5所述的方法，其特征在于，所述基于目标模型对所述目标文本进行处理，得到目标文本标签，包括：

使用至少一个目标符号分别替换所述目标文本中属于第二词语库的词语，得到替换文本；

基于所述目标模型对所述替换文本进行处理，得到包括所述至少一个目标符号的替换文本标签；

将所述替换文本标签中的目标符号替换为对应的词语，得到所述目标文本标签。

7.一种模型训练装置，其特征在于，所述装置包括：

8.一种文本标签生成装置，其特征在于，所述装置包括：

文本获取模块，用于获取待推荐的目标文本；

其中，所述目标模型基于权利要求1至4任一项训练得到。

9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行权利要求1至4任一项所述的模型训练方法，或者执行权利要求5-6任一项所述的文本标签生成方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储至少一段计算机程序，所述至少一段计算机程序用于执行权利要求1至4任一项所述的模型训练方法，或者执行权利要求5-6任一项所述的文本标签生成方法。