CN113312448B

CN113312448B - 一种诗歌生成方法、系统及可读存储介质

Info

Publication number: CN113312448B
Application number: CN202110363291.0A
Authority: CN
Inventors: 王家逸; 何学智; 余训兴
Original assignee: Newland Digital Technology Co ltd
Current assignee: Newland Digital Technology Co ltd
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2022-11-08
Anticipated expiration: 2041-04-02
Also published as: CN113312448A

Abstract

本发明公开了一种诗歌生成方法、系统及可读存储介质，涉及AI自然语言处理领域。本发明提供了一种诗歌生成方法，所述方法包括：获取待生成的目标诗歌的主题信息；获取待生成的目标诗歌的类型信息，所述类型信息包括诗歌的格律或词牌信息；将所述主题信息以及所述类型信息输入预训练AI写诗模型，生成目标诗歌。用户输入用于生成诗歌的主题信息以及诗歌的类型信息，本方案能够根据输入的信息，自动生成符合要求的诗歌；并且，诗歌生成过程中，采用全局最优算法来对解码结果进行优化，防止出现局部最优解，从而实现改善诗歌质量的作用。

Description

一种诗歌生成方法、系统及可读存储介质

技术领域

本发明涉及AI自然语言处理领域，特别涉及一种诗歌生成方法、系统及可读存储介质。

背景技术

AI(人工智能)作为一门新兴科学技术，可以利用深度学习网络，通过海量的数据进行训练以达到自动学习的目的。当前，人工智能写诗便是在教育领域用于辅助教学的一种实际应用，AI+学科融合，既可让学生在实际案例中学习到人工智能的知识，同时可以学习到作诗的乐趣，提高文学水平，这种寓教于乐的方式必定会大受欢迎。因此，如何根据用户提供的诗歌主题等信息，自动生成高质量的诗歌，是本领域技术人员关注的焦点。

发明内容

本发明提供一种根据诗歌主题、类型，自动生成高质量的诗歌的方法、系统及可读存储介质，本发明的方案如下：

第一方面，本发明提供了一种诗歌生成方法，所述方法包括：

获取待生成的目标诗歌的主题信息；

获取待生成的目标诗歌的类型信息，所述类型信息包括诗歌的格律或词牌信息；

将所述主题信息以及所述类型信息输入预训练AI写诗模型，生成目标诗歌。

其中，所述将所述主题信息以及所述类型信息输入AI写诗模型，生成目标诗歌，包括：

将所述主题信息和所述类型信息按预定的规则预处理成输入序列，而后输入AI写诗模型进行预测，生成候选诗歌；

计算每个候选诗歌的输出概率，选取最大输出概率的候选诗歌作为目标诗歌。

其中，所述将输入序列输入到AI写诗模型进行预测，生成候选诗歌的具体方法包括：

将所述输入序列按字进行切分，构建出多个不同长度的子输入序列；

分别将每个子输入序列依次输入编码网络以及解码网络进行预测下一个输出的字，将所述输出的字加入到对应的子输入序列中作为新的输入预测下一个输出的字，直至预测出目标诗歌最后一个字，生成候选诗歌。

其中，将每个子输入序列依次输入编码网络以及解码网络进行预测下一个输出的字，具体包括：

将子输入序列输入编码网络以及解码网络，输出当前时刻输出概率topN的字构成概率候选集，而后，将当前时刻的概率候选集作为输入，输出下一时刻输出概率topN的字构成概率候选集，重复以上步骤，直至输出候选诗歌最后一个字对应的概率候选集。

其中，所述计算每个候选诗歌的输出概率，选取最大输出概率的候选诗歌作为目标诗歌，包括：

将候选诗歌中预测每个字的输出概率进行累加，累加结果作为该候选诗歌的输出概率。

其中，所述AI写诗模型包括：

词嵌入网络，用于将输入序列处理成词向量；

编码网络，用于将所述词向量处理成表征向量；

解码网络，用于将所述表征向量进行解码，所述解码过程采用全局最优算法寻找出最优解，作为输出的目标诗歌。

第二方面，本发明提供一种诗歌生成系统，包括：

第一输入模块，用于获取待生成的目标诗歌的主题信息；

第二输入模块，用于获取待生成的目标诗歌的类型信息，所述类型信息包括诗歌的格律或词牌信息；

诗歌生成模块，用于将所述主题信息以及所述类型信息输入预训练AI写诗模型，生成目标诗歌。

第三方面，本发明还提供一种可读存储介质，包括处理器，所述处理器用于加载并执行存储介质中的指令以实现上述的诗歌生成方法。

本发明的有益效果如下：

用户输入用于生成诗歌的主题信息以及诗歌的类型信息，本方案能够根据输入的信息，自动生成符合要求的诗歌；并且，诗歌生成过程中，采用全局最优算法来对解码结果进行优化，防止出现局部最优解，从而实现改善诗歌质量的作用。

附图说明

图1为本发明实施例提供的诗歌生成方法的流程图；

图2为本发明实施例诗歌生成方法技术路径示意图；

图3为本发明实施例中AI写诗模型解码网络结构示意图；

图4为本发明实施例中输入序列引入解码优化器后输入输出过程示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是，对于这些实施方式的说明用于帮助理解本发明，但并不构成对本发明的限定。此外，下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。

参见图1及图2，对本发明一种实施例提供一种诗歌生成方法，所述方法包括：

S1：获取待生成的目标诗歌的主题信息，本实施例中，用户键入的目标诗歌的主题为“夏竹”。

S2：获取上述步骤中的待生成的目标诗歌的类型信息，所述类型信息包括诗歌的格律或词牌信息；本实施例中，用户所要创作的的诗歌类型为“七言绝句”，由此，便限定了诗歌的格律以及词牌。

S3：将前文确定下的主题信息以及所述类型信息输入预训练AI写诗模型，生成目标诗歌。

其中，上文中所述的将所述主题信息以及所述类型信息输入AI写诗模型，生成目标诗歌，具体实现步骤包括：

S31：将所述主题信息和所述类型信息按预定的规则预处理成输入序列，本实施例中，首先将主题信息以及类型信息进行拼接，生成一个句子“夏荷七言绝句”，而后输入AI写诗模型进行预测，生成候选诗歌；

其中，以上步骤中将输入序列输入到AI写诗模型进行预测，生成候选诗歌的具体方法包括：

S32：将所述输入序列按字进行切分，构建出多个不同长度的子输入序列；切分后的子输入序列分别为：“夏”、“夏荷”、“夏荷七”、“夏荷七言”、“夏荷七言绝”、“夏荷七言绝句”这几组。

S33：分别将上述列出的每个子输入序列依次输入编码网络以及解码网络进行预测下一个输出的字，将所述输出的字加入到对应的子输入序列中作为新的输入预测下一个输出的字，直至预测出目标诗歌最后一个字，生成候选诗歌。

其中，以上步骤中，将每个子输入序列依次输入编码网络以及解码网络进行预测下一个输出的字，具体包括：

将子输入序列输入编码网络以及解码网络，输出当前时刻输出概率topN的字构成概率候选集，而后，将当前时刻的概率候选集作为输入，输出下一时刻输出概率topN的字构成概率候选集，重复以上步骤，直至输出候选诗歌最后一个字对应的概率候选集。本实施例中，输出概率为：将候选诗歌中预测每个字的输出概率进行累加，累加结果作为该候选诗歌的输出概率。其中，该步骤中N取值为20。

S34：计算每个候选诗歌的输出概率，选取最大输出概率的候选诗歌作为目标诗歌。

本发明实施例中，预训练AI写诗模型包括：

词嵌入网络，用于将输入序列处理成词向量；本实施例中采用bert的tokenizer进行向量化处理；

编码网络，用于将所述词向量处理成表征向量；这里使用的是Roberta-WWM预训练模型,经过编码器处理后的句子会生成一个表征向量；

解码网络参见图3，用于将所述表征向量进行解码，所述解码过程采用全局最优算法寻找出最优解，作为输出的目标诗歌。

其中，解码网络可以选用transformer，上一时刻的结果Si-1以及中间时态作为输入，经过解码网络后输出下一时刻预测的结果Si，即Si-1紧跟其后的词。上述解码过程引入解码优化器进行优化，可以选用搜索算法beam search来实现，具体为，在第一个时间步长，即第一字的预测，选取当前条件概率最大的N个词，即输出概率topN的字，当做候选输出序列的第一个词。之后的每个时间步长，基于上个步长的输出序列，挑选出所有组合中条件概率最大的N个，作为该时间步长下的候选输出序列。始终保持N个候选。最后从N个候选中挑出最优的。

上述步骤参见图4，输入序列o经过预测后，第一个时间步长输出“A、B、C、D、E”,选取top2的输出概率的2个词“A、C”,构成概率候选集,将当前时刻的概率候选集“A、C”作为输入，加入中间时态向量，输出下一时间步长的结果，选取top2的输出概率的2个词“B、E”,加入中间时态向量，此时的候选输出序列为“AB、CE”，构成概率候选集,重复上述步骤，直至最后一个时间步长的输出。

在另一个实施例中，本发明提供一种诗歌生成系统，包括：

第一输入模块，用于获取待生成的目标诗歌的主题信息；

在另一个实施例中，本发明还提供一种可读存储介质，包括处理器，所述处理器用于加载并执行存储介质中的指令以实现上述的诗歌生成方法。

以上结合附图对本发明的实施方式作了详细说明，但本发明不限于所描述的实施方式。对于本领域的技术人员而言，在不脱离本发明原理和精神的情况下，对这些实施方式进行多种变化、修改、替换和变型，仍落入本发明的保护范围内。

Claims

1.一种诗歌生成方法，其特征在于：所述方法包括：

获取待生成的目标诗歌的主题信息；

将所述主题信息以及所述类型信息输入预训练AI写诗模型，生成目标诗歌；

其中，

所述将所述主题信息以及所述类型信息输入AI写诗模型，生成目标诗歌，包括：

计算每个候选诗歌的输出概率，选取最大输出概率的候选诗歌作为目标诗歌；

所述将输入序列输入到AI写诗模型进行预测，生成候选诗歌的具体方法包括：

2.如权利要求1所述的一种诗歌生成方法，其特征在于：将每个子输入序列依次输入编码网络以及解码网络进行预测下一个输出的字，具体包括：

3.如权利要求1所述的一种诗歌生成方法，其特征在于：所述计算每个候选诗歌的输出概率，选取最大输出概率的候选诗歌作为目标诗歌，包括：

4.如权利要求1所述的一种诗歌生成方法，其特征在于：所述AI写诗模型包括：

词嵌入网络，用于将输入序列处理成词向量；

编码网络，用于将所述词向量处理成表征向量；

5.一种诗歌生成系统，其特征在于，包括：

第一输入模块，用于获取待生成的目标诗歌的主题信息；

诗歌生成模块，用于将所述主题信息以及所述类型信息输入预训练AI写诗模型，生成目标诗歌;

所述诗歌生成模块包括：

第一子模块，用于将所述主题信息和所述类型信息按预定的规则预处理成输入序列，而后输入AI写诗模型进行预测，生成候选诗歌；

第二子模块，用于计算每个候选诗歌的输出概率，选取最大输出概率的候选诗歌作为目标诗歌；

所述第一子模块包括：

第一层，用于将所述输入序列按字进行切分，构建出多个不同长度的子输入序列；

第二层，用于分别将每个子输入序列依次输入编码网络以及解码网络进行预测下一个输出的字，将所述输出的字加入到对应的子输入序列中作为新的输入预测下一个输出的字，直至预测出目标诗歌最后一个字，生成候选诗歌。

6.一种可读存储介质，其特征在于，包括处理器，所述处理器用于加载并执行存储介质中的指令以实现权利要求1至4中任一权利要求所述的诗歌生成方法。