CN111949761A

CN111949761A - 考虑情感和主题的对话问题生成方法和系统、存储介质

Info

Publication number: CN111949761A
Application number: CN202010642828.2A
Authority: CN
Inventors: 孙晓; 雷盼盼; 汪萌
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2020-07-06
Filing date: 2020-07-06
Publication date: 2020-11-17
Anticipated expiration: 2040-07-06
Also published as: CN111949761B

Abstract

本发明提供一种考虑情感和主题的对话问题生成方法和系统、存储介质，涉及对话问题生成领域。本发明实施例首先将文章P分割成N个段落块P_c，并将段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i；然后在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

最后根据所述情感关键词

和主题关键词

最终生成对话问题q。本发明实施例将文章P的情感和主题纳入对话问题生成的环节中，与现有的对话问题生成模型只考虑根据对话历史记录相比，进一步提高了对话问题生成的连贯性，且生成的问题的认知水平不再局限于浅层级，而是达到了生成了更具逻辑性和深层意义的问题的有益效果。

Description

考虑情感和主题的对话问题生成方法和系统、存储介质

技术领域

本发明涉及对话问题生成领域，具体涉及一种考虑情感和主题的对话问题生成方法和系统、存储介质。

背景技术

对话问题生成是近几年新兴的一个任务。在该任务中给定一篇文章和一段基于文章的历史问答对来生成下一个问题，而生成的问题应与历史对话连贯且与文章的主题关联。对话式问题生成可用于人机对话，辅导系统，儿童故事机童话提问，问诊系统等。

目前，对话问题生成，旨在通过多轮对话逐渐地接收和传递文章信息。例如，申请号为CN201910267076.3的发明专利：一种基于强化动态推理的对话式问题生成方法。该发明专利提供的对话问题生成模型根据段落和对话历史记录生成问题，提出了一种称为强化动态推理网络的新方法，该方法基于通用的编码器-解码器框架，但以动态方式并入了推理过程，以更好地理解所询问的内容和接下来要询问的内容。

但是，上述模型只考虑了根据对话历史记录来提高对话问题生成的连贯性，而没有考虑到文章的情感和主题。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种考虑情感和主题的对话问题生成方法和系统、存储介质，解决了现有的对话问题生成模型只考虑根据对话历史记录来提高对话问题生成的连贯性，而没有考虑到文章的情感和主题的技术问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

一种考虑情感和主题的对话问题生成方法，包括

获取文章P和与文章P相关的对话历史记录H_i；

将文章P分割成N个段落块P_c，将段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i；

在问题焦点段落块F_i中预测情感关键词

和主题关键词

根据情感关键词

和主题关键词

最终生成对话问题q。

优选的，预先训练的问题焦点预测模型包括嵌入层，上下文层，注意力层，建模层和输出层；

嵌入层将段落块P_c映射成第一词向量序列

将对话历史记录H_i映射成第二词向量序列

上下文层对第一词向量序列

进行编码得到段落块上下文表示

对第二词向量序列

进行编码得到对话历史记录上下文表示

注意力层根据段落块上下文表示

和对话历史记录上下文表示

得到历史信息增强的上下文表示

建模层根据历史信息增强的上下文表示

得到结合了对话历史记录H_i中的相关信息的段落块

输出层根据段落块

将预测的最符合的块索引指定为问题焦点段落块F_i。

优选的，在问题焦点段落块F_i中预测情感关键词

和主题关键词

之前，方法还包括：

对问题焦点段落块F_i进行编码，得到问题焦点段落块隐藏状态序列 h。

优选的，在问题焦点段落块F_i中预测情感关键词

和主题关键词

之前，方法还包括：

用预训练的LDA模型预测焦点段落块F_i的情感类别，用情感迁移网络模型预测焦点段落块F_i的主题类别。

优选的，在问题焦点段落块F_i中预测情感关键词

和主题关键词

具体包括：

采用GloVe模型处理情感类别和主题类别中的所有关键词，得到关键词嵌入k＝{k^et,k^tp}，其中k^et表示情感关键词嵌入，k^tp表示主题关键词嵌入；

采用注意力机制求出关键词嵌入k与问题焦点段落块F_i的相关性 c＝{c^et,c^tp}，其中c^et表示情感关键词相关性，c^tp表示主题关键词相关性；

求得情感类别的所有关键词条件概率p₁：

和主题类别中的所有关键词条件概率p₂：

其中，w₁表示情感类别中的关键词，w₂表示主题类别中的关键词，

是可训练参数，softmax函数用于多分类过程；

情感类别的所有关键词条件概率的最大值，即为预测的情感关键词

主题类别中的所有关键词条件概率的最大值，即为预测的主题关键词

优选的，对话问题q内容上包括情感关键词

主题关键词

关键词之间的中间序列q^md，情感关键词和主题关键词两侧的部分q^ce，q^ct。

优选的，根据情感关键词

和主题关键词

最终生成对话问题包括：

由双向异步解码器根据情感关键词

和主题关键词

最终生成对话问题，双向异步解码器采用通用的句法约束从情感关键词

和主题关键词

所在的位置异步生成问题。

优选的，情感类别包括七个类别：快乐，喜欢，悲伤，愤怒，恐惧，厌恶和惊奇。

一种考虑情感和主题的对话问题生成系统，包括：

获取模块，用于获取文章P和与文章P相关的对话历史记录H_i；

确定模块，用于将文章P分割成N个段落块P_c，将段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块 F_i；

预测模块，用于在问题焦点段落块F_i中预测情感关键词

和主题关键词

生成模块，用于根据情感关键词

和主题关键词

最终生成对话问题q。

一种计算机可读存储介质，其上存储有计算机程序，在处理器执行计算机程序时可实现上述任一项的方法。

(三)有益效果

本发明提供了一种考虑情感和主题的对话问题生成方法和系统、存储介质。与现有技术相比，具备以下有益效果：

本发明首先将文章P分割成N个段落块P_c，并将段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块 F_i；然后在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

最后根据所述情感关键词

和主题关键词

最终生成对话问题q。本发明将文章P的情感和主题纳入对话问题生成的环节中，与现有的对话问题生成模型只考虑根据对话历史记录相比，进一步提高了对话问题生成的连贯性，且生成的问题的认知水平不再局限于浅层级，而是达到了生成了更具逻辑性和深层意义的问题的有益效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种考虑情感和主题的对话问题生成方法流程示意图；

图2为本发明实施例中对话问题生成的流程图；

图3为本发明实施例中一种考虑情感和主题的对话问题生成系统的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例通过提供一种考虑情感和主题的对话问题生成方法和系统、存储介质，解决了现有的对话问题生成模型只考虑根据对话历史记录来提高对话问题生成的连贯性，而没有考虑到文章的情感和主题的技术问题，实现生成更具连贯性、逻辑性和深层意义的问题的有益效果。

本申请实施例中的技术方案为解决所述技术问题，总体思路如下：

本发明实施例首先将文章P分割成N个段落块P_c，并将段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i；然后在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

最后根据所述情感关键词

和主题关键词

最终生成对话问题q。由此，将文章P的情感和主题纳入对话问题生成的环节中，与现有的对话问题生成模型只考虑根据对话历史记录相比，进一步提高了对话问题生成的连贯性，且生成的问题的认知水平不再局限于浅层级，而是达到了生成了更具逻辑性和深层意义的问题的有益效果。

为了更好的理解所述技术方案，下面将结合说明书附图以及具体的实施方式对所述技术方案进行详细的说明。

实施例：

如图1所示，本发明实施例提供了一种考虑情感和主题的对话问题生成方法，包括:

获取文章P和与所述文章P相关的对话历史记录H_i；

将所述文章P分割成N个段落块P_c，将所述段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i；

在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

根据所述情感关键词

和主题关键词

最终生成对话问题q。

由此，将文章P的情感和主题纳入对话问题生成的环节中，与现有的对话问题生成模型只考虑根据对话历史记录相比，进一步提高了对话问题生成的连贯性，且生成的问题的认知水平不再局限于浅层级，而是达到了生成了更具逻辑性和深层意义的问题的有益效果。

具体包括：

步骤一：获取文章P和对话历史记录H_i。

获取文章P和与文章P相关的对话历史记录H_i，所述文章P和对话历史记录H_i可以从网络，书籍或者其他任意可以获取的地方获取。

步骤二：将所述文章P分割成N个段落块P_c，将所述段落块P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i。

上述问题焦点预测模型包括：嵌入层，上下文层，注意力层，建模层和输出层。

2.1嵌入层

计算机处理文本为了得到单词之间的语义信息，需要将文本表示成由实数组成的向量，这样可以通过统计学和数学公式来计算单词间的语义信息。

嵌入层对每个单词进行处理，采用的词向量工具是Glove，基于全局词频统计的词表征工具。它可以把一个单词表示成一个由实数组成的向量，向量可以捕捉单词之间的一些语义特性，如相似性、类比性。

将文章P分割成N个段落块P_c，则文章P可表示为P＝ (P₁,…,P_N)，其中P_c表示文章P中的第C个段落块，C∈(1,…,N)。采用GloVe(d＝300)向量作为词嵌入，将段落块P_c映射成第一词向量序列

其中

表示第一词向量序列

中第i个词的d维词嵌入向量，m表示段落块P_c包含m个词。

同理，将对话历史记录H_i映射成第二词向量序列

其中

表示第二词向量序列

中第i 个词的d维词嵌入向量，n表示对话历史记录H_i包含n个词。

2.2上下文层

上下文层采用Bi-GRU模型，Bi-GRU是GRU模型从两个相反的方向对序列进行编码，然后链接两个GRU的状态，形成自身的状态。

使用Bi-GRU对上述第一词向量序列

进行编码得到文章段落块上下文层，对上述第二词向量序列

进行编码得到对话历史记录上下文层。

对于文章段落块上下文层的输入包含

和

这里

用来传递上一轮问题焦点段落块信息，其中，QF表示上一轮历史对话的问题焦点段落块。若上一轮问题焦点段落块与段落块P_c重复则

全为1，否则全为0。

对于对话历史记录上下文层的输入为

通过编码后得到段落块上下文表示

和对话历史记录上下文表示

其中v表示Bi-GRU模型隐藏层的维度。

2.3注意力层

将上述段落块上下文表示

和对话历史记录上下文表示

输入到注意力层。

注意力层可以捕捉每个段落块与对话历史记录的相关性，其相关性用注意力机制求出，即通过使用注意力机制对于段落块P_c的每个词t 生成历史信息增强的上下文表示

计算过程如公式(1)-(4)所示。

其中，

表示第i轮对话时，对第c个段落块编码后隐藏状态序列中的第t个词，t＝1,…,m；

表示第i轮对话时，对对话历史记录H_i编码后隐藏序列中的第j个词，j＝1,…,n；

是可训练参数。将

与

合并输入公式(1)中能够度量

与

的相关性，即得到注意力权值

tanh函数可以将一个实数，映射到(0,1)的区间。

求得注意力权值

占

与对话历史记录H_i中每个词注意力权值之和的比重，即对注意力权值进行归一化得到注意力权重

将注意力权重

与对话历史记录隐藏状态序列

来加权求和，得到的结果为

与每一轮历史对话记录的相关性之和

由

和

得到历史信息增强的上下文表示

其中

是可训练参数。

2.4建模层

建模层采用Bi-GRU模型实现，Bi-GRU可以捕获历史增强的上下文表示

之间的交互。将历史信息增强的上下文表示

输入建模层中，得到结合了对话历史记录H_i中的相关信息的段落块

其中i＝(1,…,N)。

2.5输出层

两个线性层组成，预测最符合的块索引，将指定的块估计为当前问题焦点段落块F_i。这层的输入是建模层产生的联合了对话历史信息的段落块

步骤三：在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

本步骤确定最终生成的问题中需要的关键词，所述关键词包括情感关键词和主题关键词，从相应的词典中匹配获得。

上述相应的词典分为情感词典和主题词典。其中，本发明实施例使用的情感词典是《大连理工大学情感本体库》，其中包含27,466个情感关键词，包括七个类别：快乐，喜欢，悲伤，愤怒，恐惧，厌恶和惊奇；主题词典使用预训练潜在狄利克雷分配(LDA)获得，包括十个类别，其中每个类别包括100个关键词。

较一般的关键词预测方法直接使用编码器预测关键词的隐藏序列不同，本发明实施例采用基于先验知识的序列注意机制来补充编码器中的信息不足。由于类别(情感或主题)是知识表示的高级抽象，因此将上述词典中的类别信息用作此处提到的先验知识。具体包括：

3.1段落编码

将上述问题焦点段落块F_i进行编码，编码器中使用的RNN是Bi- LSTM，Bi-LSTM是LSTM模型从两个相反的方向对序列进行编码，然后链接两个LSTM的状态，形成自身的状态。

将问题焦点段落块序列F_i＝(f₁，f₂，...，f_T)输入到Bi-LSTM编码器中，其中f表示序列中的一个词，T表示序列总长度。序列中第k个词f_k的隐藏状态将更新为:

是f_k通过LSTM前向传播在第k个时间步得到的隐藏状态，

是 f_k通过LSTM后向传播在第T-k+1个时间步得到的隐藏状态，这里

都初始化为零向量。得到第k个词的隐藏状态

此时h_k包含了上下文信息。将编码后得到的问题焦点段落块隐藏状态序列表示为h＝(h₁，h₂，...，h_T)。循环神经网络每个循环单元当前时间步的隐藏状态h_k由该时间步的输入f_k和上一个时间步的隐藏状态决定。

3.2问题结构预测：

本步骤旨在检测字典中的情感关键词和主题关键词是否应出现在对话问题q中。本发明实施例定义了以下四种特定情况：

q^s＝0：没有关键词，采用常规的编码器-解码器模型。

q^s＝1：只有主题关键词，用异步编码器从主题关键词开始生成问题。

q^s＝2：只有情感关键词，用异步编码器从情感关键词开始生成问题。

q^s＝3：有主题关键词和情感关键词。用本发明实施例提出的双向异步解码器生成问题。

其中，q^s表示问题结构的状态信号变量。

用预训练的LDA模型预测主题类别。模型是根据主题词典训练得到,将问题焦点段落块F_i输入上述LDA模型预测主题类别。

用情感迁移网络模型预测情感类别，该模型基于情感词典构建和训练词典匹配卷积神经网络，将问题焦点段落块F_i和情感词典输入训练好的词典匹配卷积神经网络，得到情感类别。

根据两个模型判断问题焦点段落块是否有主题类别和情感类别从而预测问题的结构，获得主题类别和情感类别中的所有关键词。

3.3关键词预测

3.3.1计算相关性

为了将先验知识整合到关键词预测的过程中，将上一步得到的主题类别和情感类别中的所有关键词用GloVe(d＝300)向量作为关键词嵌入k＝{k^et,k^tp}，其中k^et表示情感关键词嵌入，k^tp表示主题关键词嵌入。并采用注意力机制求出关键词嵌入k与问题焦点段落块F_i的相关性，具体的相关性计算过程如公式(7)-(9)所示。

其中，*∈{et，tp}代表情感关键词或主题关键词，公式中的参数其右上角加星号表示其代表情感关键词或主题关键词的参数。k表示关键词嵌入，当求上式求情感关键词与问题焦点段落块的相关性时，k^*就表示情感关键词或者主题关键词嵌入。V_α,W_α,U_α是可训练参数。h_i表示编码后的问题焦点段落块隐藏状态序列中的单词。由k^*和h_i预测两者的相关性，得到注意力权值e_i。

对注意力权值e_i进行归一化得到关键词注意力权重α_i。

将关键词注意力权重α_i与编码后的问题焦点段落块隐藏状态序列中的单词h_i加权求和，此时得到的结果就是关键词嵌入k＝{k^et,k^tp}) 与问题焦点段落块F_i的相关性c。

3.3.2预测关键词

求出关键词嵌入k＝{k^et,k^tp})与问题焦点段落块F_i的相关性c后，预测问题焦点段落块F_i中的关键词，其关键词的条件概率分别通过公式 (10)和(11)来计算。

公式(10)和(11)都可以看作一个多类分类器，其中，h是编码后的问题焦点段落块隐藏状态序列，w₁表示所述情感类别中的关键词，，w₂表示所述主题类别中的关键词，c^et和c^tp是由公式(9)计算出的关键词嵌入k＝{k^et,k^tp})与问题焦点段落块F_i的相关性。

是可训练参数，softmax用于多分类过程中，它将多个神经元的输出映射到(0,1)区间内，可以看成概率来理解从而进行多分类。

将所述情感类别的所有关键词条件概率的最大值，预测为所述情感关键词

将所述主题类别中的所有关键词条件概率的最大值，预测为主题关键词

步骤四：根据所述情感关键词

和主题关键词

最终生成对话问题q。

最终的问题同时具有情感关键词和主题关键词，因此一个至关重要的问题是如何基于两个关键词实现问题生成。

对于有两个关键词的情况时，需要考虑情感关键词和主题关键词是位于中间序列的哪一侧，有两种情况：一种是主题关键词位于中间序列左侧，情感关键词位于中间序列右侧；一种是情感关键词位于中间序列左侧，主题关键词位于中间序列右侧。这里使用双向异步解码器，该解码器利用情感和主题都通用的句法约束从两侧的关键词异步生成问题。假设问题是

其中q^md是两个关键词的中间序列，q^ce,q^ct表示通过情感关键词和主题关键词两侧的部分。

4.1中间序列的生成

中间序列

的生成分为两步异步策略。首先处理情感关键词以形成包含情感信息的序列。然后使用了情感注意力机制，使用隐序列来控制下一步的生成。

表示情感关键词和主题关键词。

表示引入情感关键词后在第i个时间步的解码状态。

表示引入主题关键词后在第j个时间步的解码状态。

中间序列的生成如公式(12)所示，依次从j＝1到j＝K生成中间序列q^md。中间序列的第j个时间步生成的词

由上一个时间步生成的词

第j个时间步的主题关键词解码状态

和第j个时间步的情感注意力单元

输入解码器中求得。

其中，

是第j个时间步的情感注意力单元，由注意力控制函数

计算，其中输入上个时间步的主题关键词解码状态

和包含情感信息的序列

具体的计算过程如公式(14)～(16)所示。

其中，

表示第i个时间步的情感关键词解码状态

对第j-1 个时间步的主题关键词解码状态

的影响，求得

对

的注意力权值

是函数中可训练参数。

把每个时间步求得的注意力权重与对应时间步的情感关键词解码状态加权求和得到了情感注意力单元。

4.2关键词两侧序列的生成

生成中间序列后，将中间序列和情感关键词连接起来形成一个新的序列y^md,f,

将中间序列和主题关键词连接起来形成新的序列，且去对这个新序列进行反向排序生成一个反向序列y^md,b,

然后分别解码正向序列和反向序列得到q^ce,q^ct。

其中，q^md,f,q^md,b分别是中间部分的前向形式和反向形式。h是编码后的问题焦点段落块隐藏状态序列。

p^f，p^b代表用LSTM网络来解码从编码器输出的序列来生成前向序列和反向序列,具体公式如下：

其中，W_s，W_k是可训练参数，c_k是在第k个时间步的基于注意力解码状态。

b_k是循环神经网络在第k个时间步的状态变量，由如下公式得到：

b_k＝LSTM₂(q_k-1,b_k-1) (21)

为了得到在解码时候的注意力系数，需要有上下文依赖的词表示

其中h_k是在2.1段落编码处通过Bi-LSTM编码得到的。然后求h_k在(k＝1,…,T)的加权平均值c_k。

c_k＝∑_i＝1,…,T a_i,kh_i (22)

加权系数a_i,k由如下公式求得,其中W_h是可训练参数。

4.3方向的选择

因为得到的q^ct是反向序列，所以再重新对q^ct进行反向排序得到正向序列q^ct,f。将q^ce和q^ct,f连接起来形成一个序列。当主题关键词在中间序列左侧，情感关键词在中间序列右侧时形成序列q^f。当情感关键词在中间序列左侧，主题关键词在中间序列右侧时形成序列q^b生成的序列q^f，q^f和序列q^b长度均为T′。

将序列q^f和序列q^b通过两个GRU网络编码，生成隐藏状态

将编码后生成的隐藏状态

连接起来形成决策网络的输入。

这里的决策网络使用的是具有sigmoid功能的全层来选择问题的方向，Sigmoid函数单增以及反函数单增等性质，其常被用作神经网络的激活函数，将变量映射到0,1之间。由此最终生成同时考虑主题和情感关键词的问题，其中W^d为可训练参数。具体公式如下所示：

基于上述对步骤四的介绍，本发明实施例最终生成同时考虑主题和情感关键词的问题，生成的问题更具有深层语义。以下给出步骤四的一个具体示例，具体内容如下所述：

问题焦点段落块：他用两手攀着上面，两脚再向上缩；他肥胖的身子向左微倾，显出努力的样子。这时我看见他的背影，我的泪很快地流下来了。

主题关键词：背影

情感关键词：泪水

对话问题生成的流程图如图2所示。

最终生成的问题：为什么此时我看见他的背影会使我的泪水很快地流下来？

如图3所示，本发明实施例还提供一种考虑情感和主题的对话问题生成系统，具体包括：

获取模块，用于获取文章P和与所述文章P相关的对话历史记录 H_i；

确定模块，用于将所述文章P分割成N个段落块P_c，将所述段落块 P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i；

预测模块，用于在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

生成模块，用于根据所述情感关键词

和主题关键词

最终生成对话问题q。

可理解的是，本发明实施例提供的考虑情感和主题的对话问题生成系统与本发明实施例提供的考虑情感和主题的对话问题生成方法相对应，其有关内容的解释、举例和有益效果等部分可以参考考虑情感和主题的对话问题生成方法中的相应部分，此处不再赘述。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，在处理器执行所述计算机程序时可实现上述对话问题生成方法。

综上所述，与现有技术相比，具备以下有益效果：

1、本发明实施例首先将文章P分割成N个段落块P_c，并将段落块 P_c和对话历史记录H_i输入预先训练的问题焦点预测模型，确定问题焦点段落块F_i；然后在所述问题焦点段落块F_i中预测情感关键词

和主题关键词

最后根据所述情感关键词

和主题关键词

最终生成对话问题q。如此一来，将文章P的情感和主题纳入对话问题生成的环节中，与现有的对话问题生成模型只考虑根据对话历史记录相比，进一步提高了对话问题生成的连贯性，且生成的问题的认知水平不再局限于浅层级，而是达到了生成了更具逻辑性和深层意义的问题的有益效果。

2、本发明实施例考虑对话问题生成中的主题，有利于生成更有意义的问题；考虑对话问题生成中的情感，一方面能够调动回答者的积极性，另一方面也能提出反映文章段落中想突出表达重点的问题。

3、本发明实施例由于引用了先验知识，能够产生不同表达形式的对话问题，同时由于采用主题词典和情感词典预测文章段落块的主题和情感，基于先验知识能够生成具有推理性的问题。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。