CN108319668A

CN108319668A - 生成文本摘要的方法及设备

Info

Publication number: CN108319668A
Application number: CN201810061577.1A
Authority: CN
Inventors: 章乐; 舒畅; 何永; 李传丰; 武拥珍; 李竹桥
Original assignee: Yi Language Intelligent Technology (shanghai) Co Ltd
Current assignee: Yiyu Intelligent Technology (Jiaxing) Co.,Ltd.
Priority date: 2018-01-23
Filing date: 2018-01-23
Publication date: 2018-07-24
Anticipated expiration: 2038-01-23
Also published as: CN108319668B

Abstract

本发明的目的是提供一种生成文本摘要的方法及设备，本发明通过导入一段文章和标题，从文章中抽取与所述标题最相似的一个代表性句子和关键词，另外加上文章标题通过深度学习生成式模型，从而自动生成高质量的文本摘要。

Description

生成文本摘要的方法及设备

技术领域

本发明涉及计算机领域，尤其涉及一种生成文本摘要的方法及设备。

背景技术

现有的方案只能根据文章的内容得到简单的摘要，对整篇文章概括不够充分，读者无法根据该摘要的内容准确了解文章的主要内容。

发明内容

本发明的一个目的是提供一种生成文本摘要的方法，能够解决现有方案的生成的摘要对整篇文章概括不充分，读者无法根据摘要的内容准确了解文章的主要内容的问题。采用此方法生成的摘要能够充当副标题的作用

根据本发明的一个方面，提供了一种生成文本摘要的方法，该方法包括：

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

从所述标准化处理后的文章中提取关键词和与所述标题最相似的一个句子；

将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

进一步的，上述方法中，从所述标准化处理后的文章中提取关键词和与所述标题最相似的一个句子，包括：

将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词。

进一步的，上述方法中，将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词，包括：

将所述标准化处理后的文章进行分句；

对每个句子再用jieba等分词工具进行分词，用tf-idf算法给所述分词后的每个词语打分，并把每个词语转换成预先训练好的词向量；

用每个句子的每个词语的tf-idf分数乘以该词语的词向量得到对应乘积，以句子为单位对乘积做累加作为该句子的句向量；

以每个句子为节点，并以每个句子的句向量的余弦值作为边用k-means算法将所述文章的句子聚成若干类；

在每个类中用textrank算法以相同的节点和边的方式用对每个句子排序，根据所述排序从每个类取一个最优句子；

将每个类的最优句子和所述标题分别作相似度计算，获取与所述标题最相似的的某个类的最优句子；

把其余每个类中的所述排序第一的句子中的关键词提取出来。

进一步的，上述方法中，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要，包括：

将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

进一步的，上述方法中，将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要，包括：

将所述标题输入第一个编码器进行编码；

将与所述标题最相似的一个句子输入第二个编码器进行编码；

对第一个编码器的输出用一个卷积神经网络cnn进行语义抽象，并用一个循环神经网络rnn进行语法提取；

对第二个编码器的编码输出用一个卷积神经网络cnn进行语义抽象，并用一个循环神经网络rnn进行语法提取；

将第一个编码器和第二个编码器的卷积神经网络cnn的语义抽象的输出合并，将第一个编码器和第二个编码器的循环神经网络rnn的语法提取的输出合并；

将合并后的语法提取的输出加上所述关键词转化得到的词向量作为attention的输入传到所述解码器decoder，并将合并后的语法提取的输出和合并后的语义抽象的输出输入到所述解码器，其中，所述解码器包括一个attention和copy-mechanism。

进一步的，上述方法中，所述深度学习生成式模型还包括一基于卷积神经网络cnn的判别器，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型之前，还包括：

利用所述判别器对所述两个编码器和一个解码器进行优化。

进一步的，上述方法中，对所述文章进行标准化处理，包括：

对所述文章得标点和字符进行标准化；

删除所述文章中的不需要的多余字符；

将所述文章中包含预设关键字或者与预设结构相符合的句子删除。

根据本发明的另一方面，还提供了一种生成文本摘要的设备，该设备包括：

获取装置，用于获取待提取文本摘要的文章和标题；

标准化装置，用于对所述文章进行标准化处理；

抽取装置，用于从所述标准化处理后的文章中提取关键词和与所述标题最相似的一个句子；

生成装置，用于将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

进一步的，上述设备中，所述抽取装置，用于将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词。

进一步的，上述设备中，所述抽取装置，用于将所述标准化处理后的文章进行分句；对每个句子再用jieba等分词工具进行分词，用tf-idf算法给所述分词后的每个词语打分，并把每个词语转换成预先训练好的词向量；用每个句子的每个词语的tf-idf分数乘以该词语的词向量得到对应乘积，以句子为单位对乘积做累加作为该句子的句向量；以每个句子为节点，并以每个句子的句向量的余弦值作为边用k-means算法将所述文章的句子聚成若干类；在每个类中用textrank算法以相同的节点和边的方式用对每个句子排序，根据所述排序从每个类取一个最优句子；将每个类的最优句子和所述标题分别作相似度计算，获取与所述标题最相似的的某个类的最优句子；把其余每个类中的所述排序第一的句子中的关键词提取出来。

进一步的，上述设备中，所述生成装置，用于将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

进一步的，上述设备中，所述生成装置，用于将所述标题输入第一个编码器进行编码；将与所述标题最相似的一个句子输入第二个编码器进行编码；对第一个编码器的输出用一个卷积神经网络cnn进行语义抽象，并用一个循环神经网络rnn进行语法提取；对第二个编码器的编码输出用一个卷积神经网络cnn进行语义抽象，并用一个循环神经网络rnn进行语法提取；将第一个编码器和第二个编码器的卷积神经网络cnn的语义抽象的输出合并，将第一个编码器和第二个编码器的循环神经网络rnn的语法提取的输出合并；将合并后的语法提取的输出加上所述关键词转化得到的词向量作为attention的输入传到所述解码器decoder，并将合并后的语法提取的输出和合并后的语义抽象的输出输入到所述解码器，其中，所述解码器包括一个attention和copy-mechanism。

进一步的，上述设备中，所述深度学习生成式模型还包括一基于卷积神经网络cnn的判别器，所述生成装置，还用于在将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型之前，利用所述判别器对所述两个编码器和一个解码器进行优化。

进一步的，上述设备中，所述标准化装置，用于对所述文章得标点和字符进行标准化；删除所述文章中的不需要的多余字符；将所述文章中包含预设关键字或者与预设结构相符合的句子删除。

根据本发明的另一方面，还提供一种基于计算的设备，其中，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

根据本发明的另一方面，还提供一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

与现有技术相比，本发明通过导入一段文章和标题，从文章中抽取与所述标题最相似的一个代表性句子和关键词，另外加上文章标题通过深度学习生成式模型，从而自动生成高质量的文本摘要。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出根据本发明一实施例的生成文本摘要的方法的流程图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

在本申请一个典型的配置中，终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本发明提供一种生成文本摘要的方法，包括：

步骤S1，获取待提取文本摘要的文章和标题；

在此，本发明的语料可以采用黑马等新闻数据，具体可以从黑马等网站爬取大量文本，包括标题，副标题还有文章内容；

步骤S2，对所述文章进行标准化处理；

在此，对每篇爬取文章做处理：包括去除不可能是文章重要内容的句子，比如包含“**报道”，“请联系”，“责任编辑”等等；把数字转换为*号，对日期做标准化处理等；

步骤S3，从所述标准化处理后的文章中提取关键词和与所述标题最相似的一个句子；

步骤S4，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

在此，本发明通过导入一段文章和标题，从文章中抽取与所述标题最相似的一个代表性句子和关键词，另外加上文章标题通过深度学习生成式模型，从而自动生成高质量的文本摘要。

本发明的生成文本摘要的方法一实施例中，步骤S3，从所述标准化处理后的文章中提取关键词和与所述标题最相似的一个句子，包括：

本发明的生成文本摘要的方法一实施例中，将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词，包括：

将所述标准化处理后的文章进行分句；

以每个句子为节点，并以每个句子的句向量的余弦值(cos)作为边用k-means算法将所述文章的句子聚成若干类；

在此，本实施例采用基于词向量的计算法，能够很大程度的提高准确度。

具体的，首先可以通过收集的12G语料用word2vec算法计算每个常用词的词向量。然后通过tf-idf算法在文本中找出两句话的关键字，然后通过查找每个关键词的词向量再用ifidf值相加取平均值作为该句子的句向量，然后计算两个句向量的余弦值得到任意两句话的相似度。然后通过k-means聚类算法把所述文章分为若干类，然后在每一个类中通过textrank算法给每个句子打分，每个类别取分数最高的句子作为该类别的代表。然后把这些得到的句子和文章的标题的句向量(同样通过前述关键字词向量方法得到)进行相似度计算，把最相似的句子作为该文本的抽取式摘要。

本发明的生成文本摘要的方法一实施例中，步骤S3，从所述标准化处理后的文章中提取与所述标题最相似的一个句子，包括：

采用textrank算法，在textrank算法中通过所述文章中任意两个句子间重叠的字数来计算句子相似度，取textrank算法中排序最高分的一个句子作为与所述标题最相似的一个句。

在此，可以通过抽取式的方式提取与所述标题最相似的一个句。一般采用textrank算法，在其算法中计算句子相似度的方法是采用字重叠计算法，即通过任意两个句子间重叠的字数来计算文本相似度，直接排序取最高分的一个句子作为与所述标题最相似的一个句。

本发明的生成文本摘要的方法一实施例中，所述生成式模型，采用seq2seq加上copy mechanism和attention mechanism训练输出文本摘要，输入为与所述标题最相似的一个句子。

在此，可以通过生成式的方式生成文本摘要，具体可采用seq2seq加上copymechanism和attention mechanism训练生成文本摘要，输入为整个文本或者用常用抽取式算法抽取的摘要生成标题。

本发明的生成文本摘要的方法一实施例中，步骤S4，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要，包括：

本发明的生成文本摘要的方法一实施例中，将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要，包括：

将所述标题输入第一个编码器进行编码；

将合并后的语法提取的输出加上所述关键词转化得到的词向量作为attention的输入传到所述解码器decoder，并将合并后的语法提取的输出和合并后的语义抽象的输出输入到所述解码器，其中，所述解码器decoder包括一个attention(注意力机制)和copy-mechanism(复制机制)。

在此，所述深度学习生成式模型包括两个编码器(encoder)和一个解码器(decoder)，第一个encoder编码文章的标题，第二个编码与所述标题最相似的一个句子。两个encoder经过第一次编码之后再用一个卷积神经网络cnn进行“语义抽象”，用一个循环神经网络rnn进行“语法提取”，然后把两个层的输出合并，把rnn的output加上从其他句子中得到的关键词转化得到的词向量作为attention的输入传到decoder，decoder为一个普通的attention和copy-mechanism的decoder。

本发明的encoder能够从两个方面抽取文章和标题的语义和语法，还考虑了其他关键句中的关键词丰富输出的多样性，能够生成更有质量的副标题。

所述深度学习生成式模型训练完以后，只要输入一篇文章和一个标题就可以生成通顺准确的文本摘要，具有很高的效率和很好的效果。

本发明的生成文本摘要的方法一实施例中，所述深度学习生成式模型还包括一基于卷积神经网络cnn的判别器，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型之前，还包括：

利用所述判别器对所述两个编码器和一个解码器进行优化。

在此，采用所述深度学习生成式模型的两个编码器和一个解码器生成大量样本，作为负样本结合原有的副标题训练一个基于卷积神经网络cnn的判别器。

训练能得到较好的副标题以后把生成的sample在进行multinomial的采样解码，然后用训练decoder的同样方式得到loss然后用一个采样器rollout把该sample从第一个字开始逐词生成一句话，把每句句生成的话输入判别器进行打分，得到每一步的一个分数。重复该过程若干次，比如4次得到每步的平均值作为该步骤的反馈值，乘以该步骤的loss值用back propagation反向传播更新模型，从而能让生成的样本更好。

本实施例采用强化学习方法对所述深度学习生成式模型进行微调，可以让生成的文本摘要更加通顺准确。

本发明的生成文本摘要的方法一实施例中，步骤S2，对所述文章进行标准化处理，包括：

对所述文章得标点和字符进行标准化；

删除所述文章中的不需要的多余字符；

在此，标准化即文本清洗分为三个方面，第一方面是文本的正规化，也就是对一些标点和字符进行标准化，比如单位英文名称等。第二个方面是文本的清洗，删除文本中的不需要的多余字符，比如数字，标点，括号中的字符等。第三方面是筛选，把一些包含某些预设关键字或者与某些预设结构相符合的句子删除。这三种处理方法的先后顺序会影响到整体的结果的效果，所以需要做非常仔细的调整。

本实施例对文本进行清洗，可以使后期生成文本摘要的工作更高效更准确的进行。

本发明还提供一种生成文本摘要的设备，其中，该设备包括：

获取装置，用于获取待提取文本摘要的文章和标题；

标准化装置，用于对所述文章进行标准化处理；

本发明的生成文本摘要的设备一实施例中，所述抽取装置，用于将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词。

本发明的生成文本摘要的设备一实施例中，所述抽取装置，用于将所述标准化处理后的文章进行分句；对每个句子再用jieba等分词工具进行分词，用tf-idf算法给所述分词后的每个词语打分，并把每个词语转换成预先训练好的词向量；用每个句子的每个词语的tf-idf分数乘以该词语的词向量得到对应乘积，以句子为单位对乘积做累加作为该句子的句向量；以每个句子为节点，并以每个句子的句向量的余弦值作为边用k-means算法将所述文章的句子聚成若干类；在每个类中用textrank算法以相同的节点和边的方式用对每个句子排序，根据所述排序从每个类取一个最优句子；将每个类的最优句子和所述标题分别作相似度计算，获取与所述标题最相似的的某个类的最优句子；把其余每个类中的所述排序第一的句子中的关键词提取出来。

本发明的生成文本摘要的设备一实施例中，所述生成装置，用于将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

12.根据权利要求11所述的设备，其中，所述生成装置，用于将所述标题输入第一个编码器进行编码；将与所述标题最相似的一个句子输入第二个编码器进行编码；对第一个编码器的输出用一个卷积神经网络cnn进行语义抽象，并用一个循环神经网络rnn进行语法提取；对第二个编码器的编码输出用一个卷积神经网络cnn进行语义抽象，并用一个循环神经网络rnn进行语法提取；将第一个编码器和第二个编码器的卷积神经网络cnn的语义抽象的输出合并，将第一个编码器和第二个编码器的循环神经网络rnn的语法提取的输出合并；将合并后的语法提取的输出加上所述关键词转化得到的词向量作为attention的输入传到所述解码器decoder，并将合并后的语法提取的输出和合并后的语义抽象的输出输入到所述解码器，其中，所述解码器包括一个attention和copy-mechanism。

本发明的生成文本摘要的设备一实施例中，所述深度学习生成式模型还包括一基于卷积神经网络cnn的判别器，所述生成装置，还用于在将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型之前，利用所述判别器对所述两个编码器和一个解码器进行优化。

本发明的生成文本摘要的设备一实施例中，所述标准化装置，用于对所述文章得标点和字符进行标准化；删除所述文章中的不需要的多余字符；将所述文章中包含预设关键字或者与预设结构相符合的句子删除。

本发明还提供一种基于计算的设备，其中，包括：

处理器；以及

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

本发明还提供一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

上述设备和计算机可读存储介质各实施例的详细内容具体可参见各方法实施例的对应部分，在此不再赘述。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本发明的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此，根据本发明的一个实施例包括一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种生成文本摘要的方法，其中，该方法包括：

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

2.根据权利要求1所述的方法，其中，从所述标准化处理后的文章中提取关键词和与所述标题最相似的一个句子，包括：

3.根据权利要求2所述的方法，其中，将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词，包括：

将所述标准化处理后的文章进行分句；

4.根据权利要求1所述的方法，其中，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要，包括：

5.根据权利要求4所述的方法，其中，将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要，包括：

将所述标题输入第一个编码器进行编码；

6.根据权利要求4所述的方法，其中，所述深度学习生成式模型还包括一基于卷积神经网络cnn的判别器，将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型之前，还包括：

利用所述判别器对所述两个编码器和一个解码器进行优化。

7.根据权利要求1所述的方法，其中，对所述文章进行标准化处理，包括：

对所述文章得标点和字符进行标准化；

删除所述文章中的不需要的多余字符；

8.一种生成文本摘要的设备，其中，该设备包括：

获取装置，用于获取待提取文本摘要的文章和标题；

标准化装置，用于对所述文章进行标准化处理；

9.根据权利要求8所述的设备，其中，所述抽取装置，用于将所述标准化处理后的文章中的句子进行聚类，从其中一个类中获取与所述标题最相似的一个句子，从剩余的其它类的句子中提取关键词。

10.根据权利要求9所述的设备，其中，所述抽取装置，用于将所述标准化处理后的文章进行分句；对每个句子再用jieba等分词工具进行分词，用tf-idf算法给所述分词后的每个词语打分，并把每个词语转换成预先训练好的词向量；用每个句子的每个词语的tf-idf分数乘以该词语的词向量得到对应乘积，以句子为单位对乘积做累加作为该句子的句向量；以每个句子为节点，并以每个句子的句向量的余弦值作为边用k-means算法将所述文章的句子聚成若干类；在每个类中用textrank算法以相同的节点和边的方式用对每个句子排序，根据所述排序从每个类取一个最优句子；将每个类的最优句子和所述标题分别作相似度计算，获取与所述标题最相似的的某个类的最优句子；把其余每个类中的所述排序第一的句子中的关键词提取出来。

11.根据权利要求8所述的设备，其中，所述生成装置，用于将所述标题、关键词和与所述标题最相似的一个句子输入包含两个编码器和一个解码器的深度学习生成式模型，以获取所述深度学习生成式模型输出的文本摘要。

13.根据权利要求11所述的设备，其中，所述深度学习生成式模型还包括一基于卷积神经网络cnn的判别器，所述生成装置，还用于在将所述标题、关键词和与所述标题最相似的一个句子输入深度学习生成式模型之前，利用所述判别器对所述两个编码器和一个解码器进行优化。

14.根据权利要求8所述的设备，其中，所述标准化装置，用于对所述文章得标点和字符进行标准化；删除所述文章中的不需要的多余字符；将所述文章中包含预设关键字或者与预设结构相符合的句子删除。

15.一种基于计算的设备，其中，包括：

处理器；以及

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；

16.一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：

获取待提取文本摘要的文章和标题；

对所述文章进行标准化处理；