WO2023155304A1

WO2023155304A1 - 关键词推荐模型训练方法、推荐方法和装置、设备、介质

Info

Publication number: WO2023155304A1
Application number: PCT/CN2022/090746
Authority: WO
Inventors: 刘羲; 舒畅; 陈又新
Original assignee: 平安科技（深圳）有限公司
Priority date: 2022-02-16
Filing date: 2022-04-29
Publication date: 2023-08-24
Also published as: CN114492669B; CN114492669A

Abstract

本申请实施例提供关键词推荐模型训练方法、推荐方法和装置、设备、介质，涉及人工智能技术领域。该关键词推荐模型训练方法，包括：获取索引样本，根据索引样本构建关键词训练数据集，根据索引样本得到单词的词向量，根据词向量得到初级环境词向量，然后根据初级环境词向量得到输入环境词向量，再根据输入环境词向量和词向量生成关键词向量，将关键词向量输入预测分类层，得到推荐预测值，根据推荐预测值与分类标签之间的检测误差，对参数进行调整，得到关键词推荐模型。本实施例通过获取词向量相关的输入环境词向量，结合关键词本身学习难度以及关键词对应的环境信息，使得选取的关键词符合用户的学习需求，提升关键词推荐的关联性以及准确性。

Description

关键词推荐模型训练方法、推荐方法和装置、设备、介质

本申请要求于2022年02月16日提交中国专利局、申请号为202210143648.9，发明名称为“关键词推荐模型训练方法、推荐方法和装置、设备、介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及关键词推荐模型训练方法、推荐方法和装置、设备、介质。

背景技术

随着外语在人们生活工作中应用越来越广泛，快速、便捷、高效的进行语言学习成为人们的不断追求，伴随着人工智能的发展，出现越来越多利用人工智能提升语言学习效率的研究成果。例如对于英语学习来说，单词学习是基础，当用户阅读完一篇英文文本后，利用人工智能系统，自动提取该文本的重点单词(即关键词)供用户进行学习，根据对用户群体的英语阅读历史信息研究，提供20个用户最有可能学习的单词，并按照学习概率从大到小进行推荐排序。

相关技术中有两种解决方案，第一种为无监督学习方案得到推荐模型，通过统计所有文本的词频，得到每个单词的逆文本频率IDF(inverse document frequency)，用IDF代表单词的难易程度，IDF从高到低排序后推荐给用户，发明人意识到虽然该方案得到的推荐模型计算比较便捷，IDF可以反映单词难度趋势，但IDF较高的单词往往是非常罕见的单词，不适合一般用户学习。另一种为监督式学习方案得到推荐模型，例如序列标注方案，输入为一篇文本的所有单词，通过长短期记忆人工神经网络或注意力机制网络结构，试图寻找每个单词与其他单词的关系度，从而找到用户最意愿学习的单词。发明人意识到这种方案得到的推荐模型处理长文本时，参数量较大，且引入了过多无关单词的影响，导致关键词推荐效果大大下降。又比如对单个单词直接预测，不考虑单词间的关系，此方案简单快捷，但由于缺乏与其他单词的交互作用，不能准确的找到最适合学习的单词。

技术问题

以下是发明人意识到的现有技术的技术问题：采用无监督学习方案得到推荐模型，计算比较便捷，IDF可以反映单词难度趋势，但IDF较高的单词往往是非常罕见的单词，不适合一般用户学习；采用监督式学习方案得到推荐模型处理长文本时，参数量较大，且引入了过多无关单词的影响，导致关键词推荐效果大大下降。因此，如何提升关键词推荐的关联性以及准确性，成为了亟待解决的技术问题。

技术解决方案

第一方面，本申请实施例提出了一种关键词推荐模型训练方法，包括：

获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；

根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；

将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；

将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；

根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；

将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；

根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理。

第二方面，本申请实施例提出了一种关键词推荐模型训练装置，包括：

文本样本获取模块，用于获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；

训练数据集构建模块，用于根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；

词向量处理模块，用于将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；

初级环境词向量计算模块，用于将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

输入环境词向量计算模块，用于利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；

关键词向量生成模块，用于根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；

分类预测模块，用于将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；

参数调整模块，用于根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理。

第三方面，本申请实施例提出了一种电子设备，包括：至少一个存储器；至少一个处理器；至少一个程序；所述程序被存储在存储器中，处理器执行所述至少一个程序以实现一种关键词推荐模型训练方法，或一种关键词推荐方法；其中，所述一种关键词推荐模型训练方法包括：获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理；其中，所述一种关键词推荐方法包括：获取待推荐文本；根据所述待推荐文本生成索引文本；将所述索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，所述关键词推荐模型利用如所述一种关键词推荐模型训练方法训练得到。

第四方面，本申请实施例提出了一种存储介质，所述存储介质为计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行一种关键词推荐模型训练方法，或一种关键词推荐方法；其中，所述一种关键词推荐模型训练方法包括：获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理；其中，所述一种关键词推荐方法包括：获取待推荐文本；根据所述待推荐文本生成索引文本；将所述索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，所述关键词推荐模型利用如所述一种关键词推荐模型训练方法训练得到。

有益效果

本申请实施例提出的关键词推荐模型训练方法、推荐方法和装置、设备、介质，获取索引样本，根据索引样本构建关键词训练数据集，将索引样本输入关键词推荐模型的词嵌入处理层，得到单词的词向量，将词向量输入初级环境信息提取层，得到初级环境词向量，然后将初级环境词向量输入输入环境信息提取层，得到输入环境词向量，再根据输入环境词向量和词向量生成关键词向量，将关键词向量输入预测分类层，得到推荐预测值，根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，得到关键词推荐模型。本实施例关键词推荐模型训练方法训练得到的关键词推荐模型通过获取词向量相关的输入环境词向量，结合关键词本身的学习难度以及关键词对应的环境信息，使得选取的关键词符合用户的学习需求，提升关键词推荐的关联性以及准确性。

附图说明

附图用来提供对本申请技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请的技术方案，并不构成对本申请技术方案的限制。

图1是本申请实施例提供的关键词推荐模型训练方法的流程图。

图2是本申请实施例提供的关键词推荐模型训练方法的又一流程图。

图3是本申请实施例提供的关键词推荐模型训练方法的预选词选择方法示意图。

图4是本申请实施例提供的关键词推荐模型训练方法的又一流程图。

图5是本申请实施例提供的关键词推荐模型训练方法的根据位移结构获取预选词示意图。

图6是本申请实施例提供的关键词推荐模型训练方法的关键词推荐模型结构示意图。

图7是本申请实施例提供的关键词推荐模型训练方法的预测流程示意图。

图8是本申请实施例提供的关键词推荐模型训练方法的又一流程图。

图9是本申请实施例提供的键词推荐方法的流程图。

图10是本申请实施例提供的关键词推荐模型训练装置的结构框图。

图11是本申请实施例提供的关键词推荐装置的结构框图。

图12是本申请实施例提供的电子设备的硬件结构示意图。

本发明的实施方式

首先，对本申请中涉及的若干名词进行解析：

逆文本频率IDF(inverse document frequency)：即TF-IDF(Term Frequency–Inverse Document Frequency)，是一种分词算法，由两部分构成：TF(Term Frequency，特性项频率即词频)和IDF(Inverse Document Frequency，逆文本频率)。其中，词频TF指的是特征词在所选取的文本中出现的次数，这就说明当计算词频时，需要对文本中的词语组合进行划分，划分后再统计词语的个数。IDF指的是特征词普遍重要性的度量。估量特征词的逆文本频率是通过对建立的语料库统计特征词出现的程度。IDF可以有效降低作用较小的高频特征词的权值，从而削弱对文本分类的影响，同时也对词频比较低而作用比较大的特征词进行评估赋予较大权值，提高文本分类的准确性。

相关技术中有两种解决方案，第一种为无监督学习方案得到推荐模型，通过统计所有文本的词频，得到每个单词的IDF，用IDF代表单词的难易程度，IDF从高到低排序后推荐给用户，虽然该方案得到的推荐模型计算比较便捷，IDF可以反映单词难度趋势，但IDF较高的单词往往是非常罕见的单词，不适合一般用户学习。另一种为监督式学习方案得到推荐模型，例如序列标注方案，输入为一篇文本的所有单词，通过长短期记忆人工神经网络或注意力机制网络结构，试图寻找每个单词与其他单词的关系度，从而找到用户最意愿学习的单词。这种方案得到的推荐模型处理长文本时，参数量较大，且引入了过多无关单词的影响，导致关键词推荐效果大大下降。又比如对单个单词直接预测，不考虑单词间的关系，此方案简单快捷，但由于缺乏与其他单词的交互作用，不能准确的找到最适合学习的单词。

基于此，本申请实施例提供一种关键词推荐模型训练方法、推荐方法和装置、电子设备、存储介质，可以实现对文本中关键词的自动提取，提升关键词推荐的关联性以及准确性。

本申请实施例提供关键词推荐模型训练方法、推荐方法和装置、电子设备、存储介质，具体通过如下实施例进行说明，首先描述本申请实施例中的关键词推荐模型训练方法、推荐方法。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的关键词推荐模型训练方法、推荐方法，涉及人工智能技术领域，尤其涉及人工智能技术领域。本申请实施例提供的关键词推荐模型训练方法、推荐方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机或者智能手表等；服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现关键词推荐模型训练方法、推荐方法的应用等，但并不局限于以上形式。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

图1是本申请实施例提供的关键词推荐模型训练方法的一个可选的流程图，图1中的方法可以包括但不限于包括步骤S101至步骤S108。

步骤S101，获取至少一个文本样本，并根据文本样本生成包含单词的索引信息的索引样本。

在一实施例中，以英语学习为例，训练关键词推荐模型需要大量的文本样本，文本样本即英文文章，英文文章由单词构成，因此根据该英文文章生成每个单词的索引信息，根据该索引信息能够定位到该英文文章中的所有单词。例如，可生成单词数据库，然后将文本样本转化为索引样本，索引样本中用单词在数据库中的位置代表该单词，提高样本的处理效率。

步骤S102，根据索引样本构建关键词训练数据集，关键词训练数据集包含索引样本和分类标签。

在一实施例中，利用大量的索引样本构成关键词训练数据集，训练的目的是使得训练后的关键词推荐模型，在输入一篇待推荐文本对应的索引文本后，能够输出该待推荐文本中所有单词为关键词的推荐概率。基于此训练目标，该实施例中构建的关键词训练数据集包括：索引样本和分类标签，该分类标签即对索引样本中每个单词作为关键词的概率，例如用“01”表示，“0”表示该单词不会被选中作为关键词，“1”表示该单词被选中作为关键词。

步骤S103，将索引样本输入关键词推荐模型的词嵌入处理层进行词嵌入操作，得到单词的词向量。

在一实施例中，训练关键词推荐模型时，将索引样本输入到关键词推荐模型中的词嵌入处理层，对索引样本中的所有单词进行词嵌入操作得到对应的单词的词向量。词嵌入操作是将单词进行向量化表示，将单个单词在预定义的向量空间中表示为实数向量，每个单词都映射到一个词向量。

在一实施例中，例如一个文本中包含“cat”、“dog”、“love”等若干单词，而这若干单词映射到向量空间中，cat对应的词向量为(0.1,0.2,0.3)，“dog”对应的词向量为(0.2,0.2,0.4)，“love”对应的词向量为(-0.4,-0.5,-0.2)等，上述词向量表示仅作示意。本实施例将单词进行向量化得到词向量，能够提高计算机对单词处理的效率和准确率，例如“cat”、“dog”表示动物，“love”表示一种情感，但是对于计算机而言，这三个词都是用0,1表示成二进制的字符串而已，无法对其直接进行计算。因此本实施例通过词嵌入这种方式将单词转变为词向量，机器计算机便可对单词进行直接计算。这种将单词映射成向量表示的过程即本实施例中的词嵌入操作，利用关键词推荐模型中的词嵌入处理层实现对索引样本中所有单词的词嵌入操作。

步骤S104，将词向量输入关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量。

由于实际语言学习过程中，用户选取一篇文章中的单词进行学习时，补光考虑单词本身的难度，也会根据当前的视觉感受野中的相关单词进行选择，即用户会将看到的单词与该单词周围前后几个单词进行比较，来确定是否选择该单词学习。

例如：A单词本身难度不高，但该单词周围几个单词难度都偏低，用户大概率会选择该单词；反之，B单词本身难度较高，但该单词周围单词难度也较高，则用户大概率不会选择该单词。因此，在一实施例中，通过用户的视觉感受野范围，将词向量输入关键词推荐模型的初级环境信息提取层，得到初级环境词向量，用于反映该单词(即词向量)的周围单词信息，，作为初级环境影响因素，以决定该单词是否会被选择为学习单词，结合关键词本身的学习难度以及关键词对应的环境信息，使得选取的关键词符合用户的学习需求，提升关键词推荐的关联性以及准确性。

在一实施例中，将词向量输入关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量，参照图2，包括但不限于步骤S1041至步骤S1043：

步骤S1041，利用初级环境信息提取层根据索引信息获取词向量的预选词。

在一实施例中，预选词即该单词的周围单词，例如预选词可以是与词向量对应的单词邻接的第一数量的单词，单词周围可以是该单词的前后位置或者前后上下位置，即前后设定第一数量的滑动窗口，截取以该单词位置为中心的前后各第一数量的单词作为预选词，或者以该单词位置为中心，以第一数量为半径，截取前后上下位置的单词作为预选词，在此不对预选词的选取方式做具体限定，其目的主要是选取单词视觉感受野范围内的单词作为初级环境影响因素。其中，预选词对应的词向量为预选词向量。

参照图3，为本申请一实施例中预选词的选择方法示意图。

图中以第一数量为5，且选取方式为前后位置进行示例，即以该单词为中心，选取其左右各5各单词作为预选词。例如图中单词“shot”，前面五个单词分别是“Surgeon”、“Genaral”、“defends”、“US”和“booster”，后面五个单词分别是“plan”、“as”、“much”、“of”和“the”，则“Surgeon”、“Genaral”、“defends”、“US”、“booster”、“plan”、“as”、“much”、“of”和“the”为单词“shot”的预选词。

本申请一实施例中，由于需要对于索引样本中每个单词均选取其对应的预选词，例如第一数量为5时，以每个单词为中心，以5个单词为半径进行选取，例如文本的平军单词长度为1000个单词，则需要处理1000次，当文本数量较多，或者文本较长时，计算的时间复杂度较高，计算性能较低，因此为了进一步提高选取预选词的效率，本实施例提供一种根据位移结构获取预选词，参照图4，包括但不限于步骤S401至步骤S404：

步骤S401，将索引样本的单词进行复制，得到第二数量的复制单词。

在一实施例中，第二数量由第一数量计算得到，例如第二数量＝第一数量*2+1。参照图5，为本申请一实施例中根据位移结构获取预选词示意图，图中以数字表示单词和复制单词，第一数量为5时，第二数量为11，即将文本的所有单词复制11次。

步骤S402，将所述第二数量的复制单词逐列进行位移操作，得到位移单词矩阵。

在一实施例中，参照图5，将复制得到的复制单词逐列进行位移，即后一个文本的第一个单词与前一个文本中该单词对应的前一个单词进行对齐，以此类推，得到逐列位移后的位移单词矩阵，若文本的单词长度为1000个，即每个文本均可表示为1*1000的行向量，得到的位移单词矩阵的长度为11*1000。

步骤S403，获取位移单词矩阵的列单词。

在一实施例中，将位移单词矩阵按列进行划分，得到对应每一列的列单词。

步骤S404，根据索引信息获取词向量所在列对应的列单词作为预选词。

参照图5，由于第一数量的值是5，因此选取第6行的单词，按列取值，每一个单词对应的列单词即该单词的预选词，例如“6”的预选词为“1”、“2”、“3”、“4”和“5”以及“7”、“8”、“9”、“10”和“11”，则第6行的“6”在位移单词矩阵中对应的列，即是“6”的预选词，以此类推。按照这样的方法，能够明显降低时间复杂度，对于每个单词选取预选词只需要将其复制第二数量即可。

步骤S1042，获取预选词的逆文本频率。

在一实施例中，对于一单词W的IDF，可以由语料库(例如关键词训练数据集)中总文本数目除以包含该词语的文本的数目，再将得到的商取对数得到，如果包含单词W的文本越少,而IDF越大，则说明单词W具有很好的类别区分能力。

本实施例中，计算预选词的IDF，表示为：

其中，IDF _w表示单词W的逆文本频率，|D|表示关键词训练数据集中文本总数，M表示包含单词W的文本数量，分母加1的目的是避免该词语不在语料库中导致的分母为0的情况。

步骤S1043，根据预选词向量和逆文本频率计算词向量对应的初级环境词向量。

在一实施例中，可以将预选词向量乘以对应的逆文本频率，然后进行加权求和，即可得到词向量对应的初级环境词向量。

步骤S105，利用关键词推荐模型的输入环境信息提取层将初级环境词向量和词向量进行第一拼接处理，生成单词对应的输入环境词向量。

在一实施例中，为了进一步提取环境信息，针对初级环境词向量进一步提取得到输入环境词向量。例如利用输入环境信息提取层将初级环境词向量和词向量进行第一拼接处理，生成单词对应的输入环境词向量，该实施例中，将初级环境词向量、初级环境词向量的平方、词向量和词向量的平方进行拼接得到输入环境词向量。

步骤S106，根据输入环境词向量和词向量进行第二拼接处理，得到关键词向量。

在一实施例中，为了引入词向量本身的词频信息，首先获取词向量的逆文本频率，然后将输入环境词向量、词向量和该词向量对应的IDF进行第二拼接处理，生成关键词向量，用于后续分类预测。

步骤S107，将关键词向量输入关键词推荐模型的预测分类层，得到推荐预测值。

步骤S108，根据推荐预测值与分类标签之间的检测误差，直至损失函数满足收敛条件，对关键词推荐模型中的参数进行调整，得到关键词推荐模型。

在一实施例中，将关键词向量输入关键词推荐模型的预测分类层，得到推荐预测值y’，推荐预测值y’和该单词对应的分类标签(即真实值y)进行比较，得到推荐预测值与分类标签之间的检测误差。其中推荐预测值y’和真实值y均可以用数字序列表示，例如该文本样本中包干单词个数的数字序列，每个单词是否作为关键词用“0”或“1”表示，“0”表示该单词不会被选中作为关键词，“1”表示该单词被选中作为关键词，例如一文本样本中包含1000个单词，则推荐预测值y’和真实值y均表示为1000个“0”或“1”组成的数字序列。

该实施例中，根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，直至损失函数达到收敛条件，收敛条件可以是损失函数的损失值小于预设的阈值，得到关键词推荐模型，可以选用的损失函数为交叉熵损失函数。交叉熵损失函数是一种对数似然函数，常用的激活函数为sigmoid激活函数，该损失函数能够解决权重更新过慢的问题，误差大的时候，权重更新快，误差小的时候，权重更新慢，可用于二分类和多分类任务中。

参照图6，为本申请一实施例中关键词推荐模型结构示意图。

图中可见，该实施例的关键词推荐模型至少包括：

一个词嵌入处理层：接收索引样本，对其进行词嵌入操作，输出该索引样本中单词的词向量；

一个初级环境信息提取层：接收索引样本中单词的词向量，对其进行初级环境信息提取，得到初级环境词向量；

一个输入环境信息提取层：接收初级环境词向量，对其进行输入环境信息提取，得到输入环境词向量；

一个拼接层：输入输入环境词向量和词向量，生成关键词向量；

一个预测分类层：可以是二预测分类层，也可以是进行其他类型预测的分类层，接收关键词向量，输出推荐预测值。

训练过程中，根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，最终得到关键词推荐模型。

参照图7，为本申请一实施例中预测流程示意图。

图中假设文本样本中单词序列是：“Surgeon”、“Genaral”、“defends”、“US”、“booster”、“shot”、“plan”、“as”、“much”、“of”、“the”、“world”、“awaits”、“vaccines”...，首先利用词嵌入处理层得到该文本样本中每个单词的词向量，然后输入初级环境信息提取层。利用设定的第一数量(图中以5为例进行说明)的滑动窗口进行预选词的提取，例如对于单词“shot”，前面五个单词分别是“Surgeon”、“Genaral”、“defends”、“US”和“booster”，后面五个单词分别是“plan”、“as”、“much”、“of”和“the”，则“Surgeon”、“Genaral”、“defends”、“US”、“booster”、“plan”、“as”、“much”、“of”和“the”为单词“shot”的预选词。通过计算每个预选词的IDF，将预选词向量乘以对应的逆文本频率，然后进行加权求和，即可得到词向量对应的初级环境词向量(见图中示意)。然后将初级环境词向量输入关键词推荐模型的输入环境信息提取层，得到输入环境词向量，例如图中示意的初级环境词向量、初级环境词向量的平方、词向量和词向量的平方进行拼接得到输入环境词向量。再将输入环境词向量、词向量和该词向量对应的IDF进行拼接，生成关键词向量，用于分类预测，得到推荐预测值，图中以“0”或“1”表示预测结果，“0”表示该单词不会被选中作为关键词，“1”表示该单词被选中作为关键词。

在一实施例中，为了提高关键词预测模型的训练效率，对文本样本进行数据压缩处理，参照图8，具体包括步骤S801至S804：

步骤S801，获取至少一个用户关键词样本和对应的分类标签，所述分类标签为目标标签或者非目标标签。

在一实施例中，同一个文本样本中，不同用户选取的关键词是不同的，即每一个文本样本均对应多个不同用户的用户关键词样本(区别仅在于每个单词对应的分类标签)。

步骤S802，计算每一分类标签是目标标签的概率，得到标签概率分布。

在一实施例中，对该文本样本中每个单词的分类标签进行概率计算，例如某篇文章的第一个单词，被10个用户阅读过，被3个人选中了，则该单词真实关键词概率为0.3。按照这种方式根据用户关键词样本的分类标签得到标签概率分布，即包含该文本样本中每个单词被选为关键词的概率。

步骤S803，利用标签概率分布对用户关键词样本进行合并，得到文本样本对应的索引样本。

步骤S804，根据索引样本构建关键词训练数据集。

在一实施例中，将同一文本样本中所有的用户关键词样本根据概率分类标签合并成一个文本样本，并得到该文本样本的索引样本，即一个文本样本不考虑其用户，仅对应一个索引样本，再根据索引样本生成关键词训练数据集。该数据集中的分类标签就不再是上述的“0”或“1”序列，而是该单词作为关键词的概率值。可以理解的是，即使分类标签的表现形式不同，但是模型训练方法相同。该实施例中，例如有2万篇文本，选取1000个用户的关键词选择信息，生成2000万个文本样本，按照该方法将2000万份数据压缩成2万份数据，即最终得到2万个文本样本(分类标签是单词作为关键词的概率值)，按照该实施例的方法在数学上损失等价，能够减少样本数量，加速训练的同时，不损失处理精度。

在一实施例中，为了加速关键词预测模型的推理过程，使得关键词预测模型能够对文本样本进行批量处理。由于不同文本的单词长度不同，将其输入到关键词预测模型中会导致模型参数和输出都进行变动，只能支持单篇文章的输入与预测，因此本实施例在关键词预测模型中增加文本掩模层，获取文本掩模，根据文本掩模对索引样本进行长度填充处理(例如长度不足的利用0进行补全等，在此不做具体限定)，得到关键词训练数据集；其中关键词训练数据集中索引样本的文本长度一致，使得关键词预测模型支持多篇文本的批量输入，加速关键词预测模型的推理过程。

本申请实施例提出的关键词推荐模型训练方法，获取索引样本，根据索引样本构建关键词训练数据集，将索引样本输入关键词推荐模型的词嵌入处理层，得到单词的词向量，将词向量输入初级环境信息提取层，得到初级环境词向量，然后将初级环境词向量输入输入环境信息提取层，得到输入环境词向量，再根据输入环境词向量和词向量生成关键词向量，将关键词向量输入预测分类层，得到推荐预测值，根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，得到关键词推荐模型。本实施例通过获取词向量相关的输入环境词向量，结合关键词本身的学习难度以及关键词对应的环境信息，使得选取的关键词符合用户的学习需求，提升关键词推荐的关联性以及准确性。

在本申请一实施例中，还提供一种关键词推荐方法，参照图9，包括但不限于步骤S901至步骤S903：

步骤S901，获取待推荐文本；

步骤S902，根据待推荐文本生成索引文本；

步骤S903，将索引文本输入关键词推荐模型，得到关键词推荐的分类结果，关键词推荐模型利用上述实施例中描述的关键词推荐模型训练方法训练得到。也可以根据用户学习单词的需求，将该索引文本中得到的关键词按照分类概率进行排序，例如将排序前20个单词推荐给用户进行学习。利用该关键词推荐模型选取的关键词符合用户的学习需求，提升关键词推荐的关联性以及准确性。

本申请实施例还提供一种关键词推荐模型训练装置，可以实现上述关键词推荐模型训练方法，参照图10，该装置包括：

文本样本获取模块101，用于获取至少一个文本样本，并根据文本样本生成包含单词的索引信息的索引样本；

训练数据集构建模块102，用于根据索引样本构建关键词训练数据集，关键词训练数据集包含索引样本和分类标签；

词向量处理模块103，用于将索引样本输入关键词推荐模型的词嵌入处理层进行词嵌入操作，得到单词的词向量；

初级环境词向量计算模块104，用于将词向量输入关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

输入环境词向量计算模块105，用于利用关键词推荐模型的输入环境信息提取层将初级环境词向量和词向量进行第一拼接处理，生成单词对应的输入环境词向量；

关键词向量生成模块106，用于根据输入环境词向量和词向量进行第二拼接处理，得到关键词向量；

分类预测模块107，用于将关键词向量输入关键词推荐模型的预测分类层，得到推荐预测值；

参数调整模块108，用于根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到关键词推荐模型。

在一实施例中，关键词推荐模型训练装置的初级环境词向量计算模块104利用初级环境信息提取层，根据索引信息获取词向量的预选词，然后获取预选词的逆文本频率，最后根据预选词向量和逆文本频率计算词向量对应的初级环境词向量。

在一实施例中，关键词推荐模型训练装置的初级环境词向量计算模块104还用于将索引样本中单词按照第二数量进行复制，将复制得到的单词逐列进行位移操作，得到位移单词矩阵，获取位移单词矩阵的列单词，最后根据索引信息获取词向量对应的列单词作为预选词。

在一实施例中，关键词推荐模型训练装置的输入环境词向量计算模块105利用输入环境信息提取层将初级环境词向量和词向量进行第一拼接处理，生成单词对应的输入环境词向量。

在一实施例中，关键词推荐模型训练装置的关键词向量生成模块106获取词向量的逆文本频率，将输入环境词向量、词向量和词向量的逆文本频率进行第二拼接处理，生成关键词向量。

本实施例的关键词推荐模型训练装置的具体实施方式与上述关键词推荐模型训练方法的具体实施方式基本一致，在此不再赘述。

本申请实施例还提供一种关键词推荐装置，可以实现上述关键词推荐方法，参照图11，该装置包括：

待推荐文本获取模块111，用于获取待推荐文本；

索引文本生成模块112，用于根据待推荐文本生成索引文本；

关键词推荐模块113，用于将索引文本输入关键词推荐模型，得到关键词推荐的分类结果，关键词推荐模型利用上述实施例中描述的关键词推荐模型训练方法训练得到。

本实施例的关键词推荐装置的具体实施方式与上述关键词推荐方法的具体实施方式基本一致，在此不再赘述。

本申请实施例还提供了一种电子设备，包括：

至少一个存储器；

至少一个处理器；

至少一个程序；

所述程序被存储在存储器中，处理器执行所述至少一个程序以实现一种关键词推荐模型训练方法，或一种关键词推荐方法；其中，所述一种关键词推荐模型训练方法包括：获取至少一个文本样本，并根据文本样本生成包含单词的索引信息的索引样本；根据索引样本构建关键词训练数据集，关键词训练数据集包含索引样本和分类标签；将索引样本输入关键词推荐模型的词嵌入处理层进行词嵌入操作，得到单词的词向量；将词向量输入关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；利用关键词推荐模型的输入环境信息提取层将初级环境词向量和词向量进行第一拼接处理，生成单词对应的输入环境词向量；根据输入环境词向量和词向量进行第二拼接处理，得到关键词向量；将关键词向量输入关键词推荐模型的预测分类层，得到推荐预测值；根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到关键词推荐模型，关键词推荐模型用于进行关键词推荐处理；其中，所述一种关键词推荐方法包括：获取待推荐文本；根据待推荐文本生成索引文本；将索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，关键词推荐模型利用如一种关键词推荐模型训练方法训练得到。

该电子设备可以为包括手机、平板电脑、个人数字助理(Personal Digital Assistant，简称PDA)、车载电脑等任意智能终端。

请参阅图12，图12示意了另一实施例的电子设备的硬件结构，电子设备包括：

处理器1201，可以采用通用的CPU(CentralProcessingUnit，中央处理器)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的技术方案；

存储器1202，可以采用ROM(ReadOnlyMemory，只读存储器)、静态存储设备、动态存储设备或者RAM(RandomAccessMemory，随机存取存储器)等形式实现。存储器1202可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1202中，并由处理器1201来调用执行一种关键词推荐模型训练方法、推荐方法；

输入/输出接口1203，用于实现信息输入及输出；

通信接口1204，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；和

总线1205，在设备的各个组件(例如处理器1201、存储器1202、输入/输出接口1203和通信接口1204)之间传输信息；

其中处理器1201、存储器1202、输入/输出接口1203和通信接口1204通过总线1205实现彼此之间在设备内部的通信连接。

本申请实施例还提供了一种存储介质，该存储介质是计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令用于使计算机执行一种关键词推荐模型训练方法，或一种关键词推荐方法；其中，所述一种关键词推荐模型训练方法包括：获取至少一个文本样本，并根据文本样本生成包含单词的索引信息的索引样本；根据索引样本构建关键词训练数据集，关键词训练数据集包含索引样本和分类标签；将索引样本输入关键词推荐模型的词嵌入处理层进行词嵌入操作，得到单词的词向量；将词向量输入关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；利用关键词推荐模型的输入环境信息提取层将初级环境词向量和词向量进行第一拼接处理，生成单词对应的输入环境词向量；根据输入环境词向量和词向量进行第二拼接处理，得到关键词向量；将关键词向量输入关键词推荐模型的预测分类层，得到推荐预测值；根据推荐预测值与分类标签之间的检测误差，对关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到关键词推荐模型，关键词推荐模型用于进行关键词推荐处理；其中，所述一种关键词推荐方法包括：获取待推荐文本；根据待推荐文本生成索引文本；将索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，关键词推荐模型利用如一种关键词推荐模型训练方法训练得到。

所述计算机可读存储介质可以是非易失性，也可以是易失性。

本申请实施例提出的关键词推荐模型训练方法和装置、关键词推荐方法和装置、电子设备、存储介质，关键词推荐模型通过获取词向量相关的输入环境词向量，结合关键词本身的学习难度以及关键词对应的环境信息，使得选取的关键词符合用户的学习需求，提升关键词推荐的关联性以及准确性。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图1-9中示出的技术方案并不构成对本申请实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上参照附图说明了本申请实施例的优选实施例，并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本申请实施例的权利范围之内。

Claims

一种关键词推荐模型训练方法，其中，包括：

获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；

根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；

将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；

将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；

根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；

将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；

根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理。
根据权利要求1所述的关键词推荐模型训练方法，其中，所述将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量，包括：

利用所述初级环境信息提取层，根据所述索引信息获取所述词向量的预选词，所述预选词是与所述词向量对应的所述单词邻接的第一数量的单词，所述预选词对应的词向量为预选词向量；

获取所述预选词的逆文本频率；

根据所述预选词向量和所述逆文本频率计算所述词向量对应的初级环境词向量。
根据权利要求1所述的关键词推荐模型训练方法，其中，所述根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量，包括：

获取所述词向量的逆文本频率；

将所述输入环境词向量、所述词向量和所述词向量的逆文本频率进行第二拼接处理，生成所述关键词向量。
根据权利要求2所述的关键词推荐模型训练方法，其中，所述利用所述初级环境信息提取层，根据所述索引信息获取所述词向量的预选词，包括：

将所述索引样本的单词进行复制，得到第二数量的复制单词，所述第二数量由所述第一数量计算得到；

将所述第二数量的复制单词逐列进行位移操作，得到位移单词矩阵；

获取所述位移单词矩阵的列单词；

根据所述索引信息获取所述词向量对应的所述列单词作为所述预选词。
根据权利要求1至4任一项所述的关键词推荐模型训练方法，其中，所述根据所述索引样本构建关键词训练数据集，包括：

获取至少一个用户关键词样本和对应的分类标签，所述分类标签为目标标签或者非目标标签

计算每一分类标签是目标标签的概率，得到标签概率分布；

根据所述标签概率分布对所述用户关键词样本进行合并处理，得到所述文本样本对应的所述索引样本；

根据所述索引样本构建关键词训练数据集。
根据权利要求1至4任一项所述的关键词推荐模型训练方法，其中，所述根据所述索引样本构建关键词训练数据集，包括：

获取文本掩模；

根据所述文本掩模对所述索引样本进行长度填充处理，得到所述关键词训练数据集；其中所述关键词训练数据集中所述索引样本的文本长度一致。
一种关键词推荐方法，其中，包括：

获取待推荐文本；

根据所述待推荐文本生成索引文本；

将所述索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，所述关键词推荐模型利用如权利要求1至6任一项所述的关键词推荐模型训练方法训练得到。
一种关键词推荐模型训练装置，其中，包括：

文本样本获取模块，用于获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；

训练数据集构建模块，用于根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；

词向量处理模块，用于将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；

初级环境词向量计算模块，用于将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

输入环境词向量计算模块，用于利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；

关键词向量生成模块，用于根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；

分类预测模块，用于将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；

参数调整模块，用于根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理。
一种电子设备，其中，包括：

至少一个存储器；

至少一个处理器；

至少一个程序；

所述程序被存储在存储器中，处理器执行所述至少一个程序以实现一种关键词推荐模型训练方法，或一种关键词推荐方法；

其中，所述一种关键词推荐模型训练方法包括：

获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；

根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；

将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；

将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；

根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；

将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；

根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理；

其中，所述一种关键词推荐方法包括：

获取待推荐文本；

根据所述待推荐文本生成索引文本；

将所述索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，所述关键词推荐模型利用如所述一种关键词推荐模型训练方法训练得到。
根据权利要求9所述的一种电子设备，其中，所述将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量，包括：

利用所述初级环境信息提取层，根据所述索引信息获取所述词向量的预选词，所述预选词是与所述词向量对应的所述单词邻接的第一数量的单词，所述预选词对应的词向量为预选词向量；

获取所述预选词的逆文本频率；

根据所述预选词向量和所述逆文本频率计算所述词向量对应的初级环境词向量。
根据权利要求9所述的一种电子设备，其中，所述根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量，包括：

获取所述词向量的逆文本频率；

将所述输入环境词向量、所述词向量和所述词向量的逆文本频率进行第二拼接处理，生成所述关键词向量。
根据权利要求10所述的一种电子设备，其中，所述利用所述初级环境信息提取层，根据所述索引信息获取所述词向量的预选词，包括：

将所述索引样本的单词进行复制，得到第二数量的复制单词，所述第二数量由所述第一数量计算得到；

将所述第二数量的复制单词逐列进行位移操作，得到位移单词矩阵；

获取所述位移单词矩阵的列单词；

根据所述索引信息获取所述词向量对应的所述列单词作为所述预选词。
根据权利要求9至12任一项所述的一种电子设备，其中，所述根据所述索引样本构建关键词训练数据集，包括：

获取至少一个用户关键词样本和对应的分类标签，所述分类标签为目标标签或者非目标标签

计算每一分类标签是目标标签的概率，得到标签概率分布；

根据所述标签概率分布对所述用户关键词样本进行合并处理，得到所述文本样本对应的所述索引样本；

根据所述索引样本构建关键词训练数据集。
根据权利要求9至12任一项所述的一种电子设备，其中，所述根据所述索引样本构建关键词训练数据集，包括：

获取文本掩模；

根据所述文本掩模对所述索引样本进行长度填充处理，得到所述关键词训练数据集；其中所述关键词训练数据集中所述索引样本的文本长度一致。
一种存储介质，所述存储介质为计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行一种关键词推荐模型训练方法，或一种关键词推荐方法；

其中，所述一种关键词推荐模型训练方法包括：

获取至少一个文本样本，并根据所述文本样本生成包含单词的索引信息的索引样本；

根据所述索引样本构建关键词训练数据集，所述关键词训练数据集包含所述索引样本和分类标签；

将所述索引样本输入所述关键词推荐模型的词嵌入处理层进行词嵌入操作，得到所述单词的词向量；

将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量；

利用所述关键词推荐模型的输入环境信息提取层将所述初级环境词向量和所述词向量进行第一拼接处理，生成所述单词对应的所述输入环境词向量；

根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量；

将所述关键词向量输入所述关键词推荐模型的预测分类层，得到推荐预测值；

根据所述推荐预测值与所述分类标签之间的检测误差，对所述关键词推荐模型中的参数进行调整，直至损失函数满足收敛条件，得到所述关键词推荐模型，所述关键词推荐模型用于进行关键词推荐处理；

其中，所述一种关键词推荐方法包括：

获取待推荐文本；

根据所述待推荐文本生成索引文本；

将所述索引文本输入关键词推荐模型进行关键词推荐处理，得到目标关键词，所述关键词推荐模型利用如所述一种关键词推荐模型训练方法训练得到。
根据权利要求15所述的一种存储介质，其中，所述将所述词向量输入所述关键词推荐模型的初级环境信息提取层进行初级环境信息提取，得到初级环境词向量，包括：

利用所述初级环境信息提取层，根据所述索引信息获取所述词向量的预选词，所述预选词是与所述词向量对应的所述单词邻接的第一数量的单词，所述预选词对应的词向量为预选词向量；

获取所述预选词的逆文本频率；

根据所述预选词向量和所述逆文本频率计算所述词向量对应的初级环境词向量。
根据权利要求15所述的一种存储介质，其中，所述根据所述输入环境词向量和所述词向量进行第二拼接处理，得到关键词向量，包括：

获取所述词向量的逆文本频率；

将所述输入环境词向量、所述词向量和所述词向量的逆文本频率进行第二拼接处理，生成所述关键词向量。
根据权利要求16所述的一种存储介质，其中，所述利用所述初级环境信息提取层，根据所述索引信息获取所述词向量的预选词，包括：

将所述索引样本的单词进行复制，得到第二数量的复制单词，所述第二数量由所述第一数量计算得到；

将所述第二数量的复制单词逐列进行位移操作，得到位移单词矩阵；

获取所述位移单词矩阵的列单词；

根据所述索引信息获取所述词向量对应的所述列单词作为所述预选词。
根据权利要求15至18任一项所述的一种存储介质，其中，所述根据所述索引样本构建关键词训练数据集，包括：

获取至少一个用户关键词样本和对应的分类标签，所述分类标签为目标标签或者非目标标签

计算每一分类标签是目标标签的概率，得到标签概率分布；

根据所述标签概率分布对所述用户关键词样本进行合并处理，得到所述文本样本对应的所述索引样本；

根据所述索引样本构建关键词训练数据集。
根据权利要求15至18任一项所述的一种存储介质，其中，所述根据所述索引样本构建关键词训练数据集，包括：

获取文本掩模；

根据所述文本掩模对所述索引样本进行长度填充处理，得到所述关键词训练数据集；其中所述关键词训练数据集中所述索引样本的文本长度一致。