CN110321417B

CN110321417B - 一种对话生成方法、系统、可读存储介质及计算机设备

Info

Publication number: CN110321417B
Application number: CN201910464111.0A
Authority: CN
Inventors: 陈竹敏; 徐铭鸿; 杨浩然; 李丕绩; 任昭春; 马军
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2019-05-30
Filing date: 2019-05-30
Publication date: 2021-06-11
Anticipated expiration: 2039-05-30
Also published as: CN110321417A

Abstract

本发明公开了一种对话生成方法、系统、可读存储介质及计算机设备，对个性信息进行扩展和挖掘。该方法包括以下步骤：获取用户的多轮对话上下文信息和个性信息，将最后一句上下文信息作为当前询问语句信息；基于神经网络的主题模型进行个性信息扩展；采用双向循环神经网络分别对个性信息、上下文信息和当前询问语句信息进行编码，得到对个性信息、上下文信息和当前询问语句信息的句子向量表示；将个性信息、上下文信息以及当前询问语句信息的句子向量表示进行融合，得到所有信息的整体向量表示；基于所有信息的整体表示向量，采用注意力机制分别对上下文信息、个性信息、扩展个性信息的每个词向量表示进行解码，生成目标对话回复。

Description

一种对话生成方法、系统、可读存储介质及计算机设备

技术领域

本公开涉及自然语言处理技术领域，具体涉及一种基于个性信息扩展和挖掘的对话生成方法、系统、可读存储介质及计算机设备。

背景技术

对话系统是自然语言处理中具有挑战性的任务，近年来吸引力大量研究者的注意。对话系统分为任务导向型对话系统和非任务导向型对话系统，其中，任务导向型对话系统旨在帮助用户完成实际具体的任务，例如帮助用户找寻商品，预订酒店餐厅等；非任务导向型对话系统与人类交互，提供合理的回复和娱乐消遣功能，通常情况下主要集中在开放的领域与人交谈，虽然非任务导向的系统似乎在进行聊天，但是它在许多实际应用程序中都发挥了作用，比如阿里小蜜，QQ小冰等。

针对开放域对话系统，很多研究者提出来各种方法和模型，但是仍然存在很多局限和挑战，比如内容缺乏一致性等。因此，目前出现了基于个性的对话系统，像人一样来生成个性化一致的回复。基于个性的对话系统中，个性信息有两种存储方式，一种是结构化的键值对，比如<性别，男>，另一种是非结构化的句子形式的表述，比如“我喜欢弹钢琴”。两种个性信息的表达方式各有优缺点，结构化的键-值对可以让模型更加简单的并且准确的捕捉到个性信息，非结构化的句子可以提供更多的更加灵活的个性信息，但是增加了模型准确捕捉到个性信息的难度。发明人在研究过程中发现，现有很多模型只是基于数据原有的个性信息训练，这可能导致模型过分依赖当前个性信息，反而导致生成的回复信息不够丰富。

目前基于个性的开放域多轮对话系统技术主要使用编码器-解码器框架，即先将上下文信息和个性信息编码成向量，再将各部分信息拼接后传入解码器，最后生成回复。发明人在研究过程中发现，目前的方法大部分是利用单个数据集(包括用户个性信息，对话信息)来进行训练。但是这种单一的数据集训练方法对于个性的扩展和挖掘是不足的，这也直接导致了很难产生拥有丰富个性信息的对话。

发明内容

为了克服上述现有技术的不足，本公开提供了一种基于个性信息扩展和挖掘的对话生成方法、系统、可读存储介质及计算机设备，对个性信息进行扩展并充分应用到对话生成过程中，以此来获得更具个性化和多样性的回复。

本公开第一方面提供的一种基于个性信息扩展和挖掘的对话生成方法的技术方案是：

一种基于个性信息扩展和挖掘的对话生成方法，该方法包括以下步骤：

获取用户的多轮对话上下文信息和个性信息，将最后一句上下文信息作为当前询问语句信息；

基于神经网络的主题模型进行个性信息扩展；

采用双向循环神经网络分别对个性信息、上下文信息和当前询问语句信息进行编码，得到对个性信息、上下文信息和当前询问语句信息的句子向量表示；

将个性信息、上下文信息以及当前询问语句信息的句子向量表示进行融合，得到所有信息的整体向量表示；

基于所有信息的整体表示向量，采用注意力机制分别对上下文信息、个性信息、扩展个性信息的每个词向量表示进行解码，生成目标对话回复。

本公开第二方面提供的一种基于个性信息扩展和挖掘的对话生成系统的技术方案是：

一种基于个性信息扩展和挖掘的对话生成系统，该系统包括：

信息获取模块，用于获取用户的多轮对话上下文信息和个性信息，将最后一句上下文信息作为当前询问语句信息；

个性扩展模块，用于基于神经网络的主题模型进行个性信息扩展；

个性挖掘模块，用于采用双向循环神经网络分别对个性信息、上下文信息和当前询问语句信息进行编码，得到对个性信息、上下文信息和当前询问语句信息的句子向量表示；将个性信息、上下文信息和当前询问语句信息的句子向量表示进行融合，得到所有信息的整体向量表示；基于所有信息的整体表示向量，采用注意力机制分别对上下文信息、个性信息、扩展个性信息的每个词向量表示进行解码，生成目标对话回复。

本公开第三方面提供的一种计算机可读存储介质的技术方案是：

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的基于个性信息扩展和挖掘的对话生成方法中的步骤。

本公开第四方面提供的一种计算机设备的技术方案是：

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述的基于个性信息扩展和挖掘的对话生成方法中的步骤。

通过上述技术方案，本公开的有益效果是：

(1)本公开使用基于神经网络的主题模型来实现个性信息的扩展，将有限的个性信息充分地利用，并将其自然地融入到解码器的解码过程中；

(2)本公开还提出了信息融合模块，单独使用当前询问语句，更充分地融合上下文信息和个性信息，并使用具有个性化的词袋损失函数监督生成；

(3)本公开设计了两种个性挖掘方法：在编码器部分，设计了注意力机制来整合和提取重要的信息，在解码器部分使用了基于注意力机制的个性信息检索模型并且提出了基于词袋模型的损失函数；这两种方法可以整合不同种类的信息并且产生更加个性相关的回复。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本申请，并不构成对本公开的不当限定。

图1是实施例一基于个性信息扩展和挖掘的对话生成方法的流程图；

图2是实施例一信息融合流程图。

图3是实施例二基于个性信息扩展和挖掘的对话生成系统的结构图。

具体实施方式

下面结合附图与实施例对本公开作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本公开提供进一步的说明。除非另有指明，本公开使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一

本实施例提供了一种基于个性信息扩展和挖掘的对话生成方法，利用神经主题模型来扩充个性的信息，将有限的个性信息充分地利用，并将其自然地融入到解码器的解码过程中；采用多源编码器对个性信息(persona)，上下文信息(context)和当前询问语句进行编码，采用信息融合模块融合各部分信息，利用带有注意力机制的解码器生成对话回复。

请参阅附图1，所述对话生成方法包括以下步骤：

S101，获取用户的多轮对话上下文信息、个性信息和当前询问语句信息。

在本实施例中，所述多轮对话上下文信息为C＝(C₁,C₂,...,C_K-1)；第i个上下文信息可表示成如下形式：

所述个性信息的句子序列

第j个个性信息可表示成如下形式：

每一句上下文信息都描述了用户的一个特征。因为最后一句上下文信息包含了更重要的信息，本实施例将最后一句对话的上下文信息C_k-1作为用户的当前询问语句信息，称之为Q。

S102，采用神经主题模型扩展用户的个性信息。

每一个用户的个性信息是由几个句子组成的，也就是非结构化的个性信息。如果只利用这几个句子，生成的回复很可能会平淡无奇并且很难进行话题的转移，因此本实施例采用基于神经网络的主题模型来充分扩展个性信息从而产生更加富有信息的回复。与传统的方法相比，基于神经网络的主题模型训练起来消耗的时间更少，更重要的是当有新数据时，可以在之前的基础上进行训练而不需要重新训练因此更加具有扩展性。

为了更好的学习到词和主题之间的关系，本实施例引入了基准数据集DailyDialog，将基准数据集DailyDialog和个性对话数据集Persona-Chat这两个数据集中的每一段对话作为一个文本(document)，采用基于神经网络的主题模型(NTM)对文本所有进行训练，从而得到了主题-词汇矩阵B^K×|V|，K是主题的个数，|V'|是词表的大小。

具体地，所述个性信息的扩展方法为：

(1)引入基准数据集DailyDialog和个性对话数据集Persona-Chat。

个性对话数据集Persona-Chat中对每个用户会提供3-5句话描述其个人信息。

DailyDialog是另一个日常聊天记录的数据集(包含多段对话，每段对话包含两个人之间的多轮交流)。其聊天内容与persona-chat类似，都是日常闲聊的聊天记录，所以存在很多共同词汇。该数据集的引入是为了用更多数据更好地训练主题模型。

(2)从主题模型的词表中查找个性对话数据集和基准数据集中每句个性信息的个性主题词。

具体地，对于每句个性信息，根据其是否出现在主题模型的词表里来找到其该个性信息的个性主题词W_P，一般是名词，去掉了停用词等没有用的词。

(3)采用基于神经网络的主题模型对两个数据集一起进行训练，得到主题-词汇矩阵B^K×|V|'，K是主题的个数，|V'|是词表的大小，对于每一个个性主题词，根据矩阵B中每个主题词词对应的主题向量，计算每一个扩展主题词和对应的个性主题词的余弦距离，从而得到m个与个性主题词的余弦距离最近的扩展主题词。

主题-词汇矩阵B是主题模型中解码器的神经网络的最后一层的参数，属于主题模型中的一部分。

(4)根据相似度重新排列所有扩展的主题语，筛选得到N_W个主题词

在本实施例中，根据每一个扩展主题词和对应的个性主题词的相似度，即步骤(2)计算的扩展主题词与对应的个性主题词的余弦距离，进行筛选。每个扩展主题词被选出时，都有一个对应的余弦距离。

本实施例会将扩展出的主题词应用在模型解码器中，来丰富生成回复的内容。

S103，采用多源编码器对个性信息、上下文信息和当前询问语句信息进行编码，得到对个性信息、上下文信息和当前询问语句信息的词向量表示。

为了融合不同种类的信息，本实施例使用了三个独立的编码器，分别为：上下文编码器、个性信息编码器和当前询问语句编码器。个性信息编码器学习关于个性信息句子的向量表示e^P，个性信息编码器是一个单层的循环神经网络，利用单层神经网络学习每句个性信息的表示向量

从而学习到个性信息中所有句子的整体向量表示。层级的上下文信息编码器学习上下文信息的表示向量

是第i个上下文隐含状态向量。层级的上下文编码器是一个双层的循环神经网络，第一层学习到上下文信息中单个句子的表示，第二层是根据句子间顺序和关系，更新每个句子的表示并学习到上下文信息中所有句子的整体表示。为了突出当前查询语句信息Q的重要性，本实施例单独使用了一个当前询问语句编码器，当前询问语句编码器学习得到当前查询语句信息Q的向量表示e^Q，当前询问语句编码器也是一个单层的循环神经网络，利用单层循环神经网络学习到当前查询语句信息中单个句子的表示，从而学习到当前查询语句信息中所有句子的整体表示。

在本实施例中，多源编码器使用的是双向GRU神经网络而不是LSTM神经网络，因为GRU和LSTM的性能在很多任务上不分伯仲，但GRU参数更少所以更容易收敛，更加高效。

S104，将个性信息表示向量、上下文信息表示向量和当前询问语句信息表示向量进行融合，得到所有信息的整体表示向量。

得到个性信息表示e^P，上下文信息表示e^C和当前询问语句表示e^Q之后，需要将这些表示融合成一个向量表示。

请参阅附图2，将个性信息表示向量、上下文信息表示向量和当前询问语句信息表示向量进行融合，其具体实现方式如下：

对个性信息、上下文信息和当前询问语句信息中的每一个句子选择主题词，在主题-词汇矩阵B中寻找这些主题词对应的向量，然后将所有主题词对应向量相加并求平均，从而得到每个句子的主题向量表示

和z^Q。最后，分别将其拼接到个性信息、上下文信息和当前询问语句信息对应句子表示向量的后边，更新个性信息、上下文信息和当前询问语句信息的句子向量表示为

和

通常情况下，当前查询语句信息Q对对话回复的生成是起决定性作用的，所以本实施例利用当前查询语句信息对其他信息做抽取(也叫注意力机制)，本实施例用新的当前询问语句信息的向量表示

对新的上下文信息的向量表示

做注意力学习，得到权重α_t，之后用

对新的上下文信息的向量表示

中的向量用α_t做加权求和，得到抽取后的上下文信息向量表示v^C。

然后，根据当前查询语句信息来选择相关的个性信息，将新的当前查询语句信息向量表示

和相关上下文信息向量表示v^C拼接，用拼接后向量对个性信息的向量表示

做注意力学习，得到权重α_t′，之后用拼接后的向量对个性信息的向量表示

中的向量用α_t′做加权求和，得到抽取后的个性信息向量表示v^P。

权重和向量v^P表示如下：

其中，V_P∈R^ds，W_e ^QC∈R^2ds×ds和W_e ^P∈R^ds×ds都是要训练的参数，ds是向量

的维度。

最后，采用一个全连接层来将向量

v^C和v^P融合成向量s₀，将向量s₀作为所有信息的整体向量表示，并输入到解码器中作为初始隐藏向量。

S105，基于所有信息的整体表示，采用注意力机制对上下文信息、个性信息、扩展个性信息进行解码，生成目标对话回复的词概率分布。

当前时间步的隐藏向量s_t，t-1时刻的词语y_t-1，问题表示e^Q，上下文信息

个性信息

外部扩展的个性信息

其中

和

分别由不同的注意力机制计算得到。

具体地，基于所有信息的整体表示，采用注意力机制对上下文信息、个性信息、扩展个性信息进行解码，其具体实现方式如下：

(1)将所有信息的整体向量表示s₀作为初始隐藏向量，通过门控循环网络(GRU)，得到当前时间步的隐藏向量s_t，其表达式为：

s_t＝GRU(y_t-1,s_t-1) (4)

其中，s_t-1为t-1时刻的隐藏向量，初始时刻隐藏向量为s₀；y_t-1为t-1时刻的生成的词语。每一步t时刻最终的目的是生成t时刻的词语，也就是回复的句子中的第t个词。

(2)采用上下文注意力机制，利用隐藏向量对上下文信息中每一个词语做注意力学习，产生上下文信息的注意力向量。

具体地，采用上下文注意力机制对上下文信息中每一个词语解码，利用隐藏向量s_t对上下文信息中每个词语向量表示

(上下文编码器中第一层的输出)做注意力学习，产生上下文注意力向量

是上下文中第i句话的第j个词语的表示向量。

(3)采用个性信息注意力机制，利用隐藏向量对个性信息中每一个词语做注意力学习，产生个性信息的注意力向量。

具体地，采用个性信息注意力机制对个性信息中每一个词语解码，利用隐藏向量s_t对个性信息中每个词语表示向量

(个性信息编码器的输出)做注意力学习，产生个性信息注意力向量

代表个性信息中第i句话的第j个单词的向量表示。

(4)采用外部个性信息注意力机制，利用隐藏向量对扩展个性信息中每一个相关主题词的主题向量表示做注意力学习，产生外部个性信息注意力向量。

具体地，采用外部个性信息注意力机制对扩展个性信息中每一个相关主题词的主题向量进行解码时，利用隐藏向量s_t对主题模型扩展出来个性信息的词语向量表示

做注意力学习，产生外部个性信息注意力向量

其中

是第i个通过基于神经网络的主题模型(NTM)扩展出的个性信息相关主题词的主题向量表示。该注意力机制通过选择最相关的扩展主题信息来鼓励生成信息更加丰富的个性化回复。

外部个性信息注意力向量的计算公式如下所示：

其中，V_w∈R^ds，W_s ^w∈R^2ds×ds和W_w∈R^ds×ds都是要训练的参数。

(5)利用上下文信息的注意力向量、个性信息的注意力向量和外部个性信息注意力向量，通过softmax激活函数进行处理，得到当前时刻目标对话回复的词语概率分布

需要生成的目标对话回复可表示成如下形式：

该目标对话回复的每个词语概率分布

的计算公式如下所示：

其中，

和b_o∈R^|V|是解码器中要训练的参数，|V|是词表大小。

(6)选取当前时刻t目标对话回复的词语概率分布

最大对应的词语，作为当前时刻t生成的词语。

(7)重复步骤(1)-(7)，得到回复的句子中的所有词语。

S106，损失函数。

在本实施例中有两个目标值，一个是目标对话回复，一个是个性化词袋向量。词袋向量是一个|V|维向量，每一维是0或者1，0表示这个单词没有出现在参照回复中，1则表示这个单词出现在参照回复中，这个可以归结为多分类问题。

在本实施例中，个性词袋向量是词袋向量的一个加权版本，当该单词出现在用户的个性信息中时，对应的维度要加λ(λ的具体值通过实验验证得到)。所以，个性化词袋向量目标b包含0,1和1+λ。本实施例使用多类别分类器，通过求和解码器每一步生成的分数

来生成词袋模型的表示p_b，公式表示如下：

其中M_y是生成句子中的词语数量。

最终的损失函数分为以下两部分：

总的损失函数为：

L＝L₁+γL₂ (13)

其中，γ是权重系数。

该模型存在很多参数，需要训练得到参数的最优值才可以应用。训练过程是指给出真实的答案监督模型，也就是让模型生成的答案和真实的答案相近。损失函数是衡量真实结果和生成结果的标准，该领域常用的损失函数有NLL(Negative log-likehood，公式11)，交叉熵(公式12)等。模型根据损失函数做反向传播来调整模型参数，也就是训练模型。

目前的方法大部分是利用单个数据集(包括用户个性信息，对话信息)来进行训练，利用用户个性信息的时候只考虑给出的用户个性信息，但是给出的个性信息非常有限，没考虑去扩展用户的个性化信息，所以应用比较困难。但是这种单一的数据集训练方法对于个性的扩展和挖掘是不足的，这也直接导致了很难产生拥有丰富个性信息的对话。针对这个问题，本实施例提出了基于个性扩展和挖掘的对话生成方法，该方法使用基于神经网络的主题模型来进行个性信息进行扩展，然后用到了若干个注意力机制来融合各种不同的信息并且引入了基于词袋模型的损失函数实现了个性挖掘。

本实施例对给出的用户个性化信息进行扩展和挖掘，从而能更好地利用用户的个性化信息，通过引入新的数据集是更好地扩展和挖掘用户个性化信息。

实施例二

本实施例提供了一种基于个性信息扩展和挖掘的对话生成系统，请参阅附图3，该系统包括：

信息获取模块201，用于获取用户的多轮对话上下文信息、个性信息和当前询问语句信息；

个性扩展模块202，用于采用神经主题模型扩展用户的个性信息；

个性挖掘模块203，用于分别对个性信息、上下文信息和当前询问语句信息进行编码，得到对个性信息、上下文信息和当前询问语句信息的表示向量；将个性信息表示向量、上下文信息表示向量和当前询问语句信息表示向量进行融合，得到所有信息的整体表示向量；基于所有信息的整体表示，采用注意力机制对上下文信息、个性信息、扩展个性信息进行解码，生成目标对话回复的词概率分布。

在本实施例中，所述信息获取模块201具体用于：

获取用户的多轮对话上下文信息C＝(C₁,C₂,...,C_K-1)，第i个上下文信息可表示成如下形式：

获取用户个性信息的句子序列

第j个个性信息可表示成如下形式：

将最后一句对话的上下文信息C_k-1作为用户的当前询问语句信息Q。

在本实施例中，所述信息扩展模块202具体用于：

引入基准数据集DailyDialog和个性对话数据集Persona-Cha；

从主题模型的词表中查找个性对话数据集和基准数据集中每句个性信息的个性主题词；

对于每一个个性主题词，采用基于神经网络的主题模型训练得到从而得到主题-词汇矩阵B^K×|V'|，K是主题的个数，|V'|是词表的大小，根据矩阵B中每个主题词词对应的主题向量，计算每一个扩展主题词和对应的个性主题词的余弦距离，从而得到m个与个性主题词的余弦距离最近的扩展主题词。

根据相似度重新排列所有扩展的主题语，筛选得到N_W个主题词

在本实施例中，所述个性挖掘模块203包括多源编码器、信息融合模块和基于多个注意力机制的解码器。

具体地，所述多源编码器包括上下文编码器、个性信息编码器和当前询问语句编码器，其中：

所述上下文编码器，用于利用单层神经网络学习每句个性信息的表示向量

从而学习到个性信息中所有句子的整体表示e^P。

所述个性信息编码器，用于利用双层神经网络学习到上下文信息中单个句子的表示向量

并根据句子间顺序和关系，更新每个句子的表示向量，并学习到上下文信息中所有句子的整体表示向量e^C。

所述当前询问语句编码器，用于利用单层神经网络学习到当前查询语句信息中单个句子的表示，从而学习到当前查询语句信息中所有句子的整体表示向量e^Q。

在本实施例中，所述信息融合模块具体用于：

对个性信息、上下文信息和当前询问语句信息中的每一个句子选择主题词，在主题-词汇矩阵B中寻找这些主题词对应的向量，然后将所有主题词向量相加并取平均值从而得到每个句子的主题表示

和z^Q。最后，分别将其拼接到个性信息、上下文信息和当前询问语句信息对应句子表示向量的后边，更新个性信息、上下文信息和当前询问语句信息的句子表示向量为

和

利用新的当前询问语句信息的

对新的上下文信息的表示向量

做注意力学习，得到权重α_t，之后里用

对新的上下文信息的表示向量

中的向量用α_t做加权求和，得到抽取后的上下文信息表示向量v^C。

根据当前查询语句信息来选择相关的个性信息，将新的当前查询语句信息表示向量

和相关上下文信息表示向量v^C拼接，用拼接后向量对个性信息的表示向量

做注意力学习，得到权重α_t，之间用拼接后的向量对对个性信息的表示向量

中的向量用α_t做加权求和，得到抽取后的个性信息表示向量v^P。

采用一个全连接层来将向量

v^C和v^P融合成向量s₀，将向量s₀作为所有信息的整体表示，并输入到解码器中作为初始隐藏向量。

在本实施例中，所述编码器具体用于：

将所有信息的整体s₀作为初始隐藏向量，通过门控循环网络(GRU)，得到当前时间时刻的隐藏向量；

采用上下文注意力机制，利用隐藏向量对上下文信息中每一个词语做注意力学习，产生上下文信息的注意力向量；

采用个性信息注意力机制，利用隐藏向量对个性信息中每一个词语做注意力学习，产生个性信息的注意力向量；

采用外部个性信息注意力机制，利用隐藏向量对扩展个性信息中每一个相关主题词的主题向量表示做注意力学习，产生外部个性信息注意力向量；

利用上下文信息的注意力向量、个性信息的注意力向量和外部个性信息注意力向量，通过softmax激活函数进行处理，得到目标对话回复的词语概率分布

选取当前时刻t目标对话回复的词语概率分布

最大对应的词语，作为当前时刻t生成的词语。

本实施例提出的基于个性信息扩展和挖掘的对话生成系统，通过个性扩展模块利用神经主题模型来扩充个性的信息，将有限的个性信息充分地利用，并将其自然地融入到解码器的解码过程中；采用多源编码器对个性信息(persona)，上下文信息(context)和当前询问语句进行编码，采用信息融合模块融合各部分信息，通过带有注意力机制的解码器生成目标对话回复。

实施例三

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如图1所示的基于个性信息扩展和挖掘的对话生成方法中的步骤。

实施例四

本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如图1所示的基于个性信息扩展和挖掘的对话生成方法中的步骤。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(RandomAccessMemory，RAM)等。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims

1.一种基于个性信息扩展和挖掘的对话生成方法，其特征是，该方法包括以下步骤：

基于神经网络的主题模型进行个性信息扩展；

基于所有信息的整体表示向量，采用注意力机制分别对上下文信息、个性信息、扩展个性信息的每个词向量表示进行解码，生成目标对话回复；

所述将个性信息、上下文信息以及当前询问语句信息的句子向量表示进行融合的步骤包括：

选择每句个性信息、上下文信息和当前询问语句信息中主题词，并从主题-词汇矩阵中寻找主题词对应的向量，并将每句个性信息、上下文信息和当前询问语句信息的主题词向量相加并求平均，得到每句个性信息、上下文信息和当前询问语句信息的主题向量表示，并将每句个性信息、上下文信息和当前询问语句信息的主题向量表示与个性信息、上下文信息和当前询问语句信息对应的每句向量表示相结合，得到新的个性信息、上下文信息和当前询问语句信息的所有句子的向量表示

和

采用新的当前询问语句信息的向量表示

对新的上下文信息的向量表示

进行注意力学习，得到权重α_t，再采用新的当前询问语句信息的向量表示

对新的上下文信息的向量表示

中的向量与权重α_t进行加权求和，得到相关上下文信息向量表示v^C；

将新的当前查询语句信息向量表示

与相关上下文信息向量表示v^C拼接，利用拼接后向量对新的个性信息的向量表示

进行注意力学习，得到权重α_t′，再利用拼接后的向量对新的个性信息的向量表示

中的向量与权重α_t′进行加权求和，得到相关个性信息向量表示v^P；

采用全连接层来将向量

v^C和v^P融合成向量s₀，将向量s₀作为所有信息的整体向量表示。

2.根据权利要求1所述的基于个性信息扩展和挖掘的对话生成方法，其特征是，所述基于神经网络的主题模型进行个性信息扩展的步骤包括：

引入基准数据集和个性对话数据集；

采用基于神经网络的主题模型对每个个性主题词进行训练，得到主题-词汇矩阵，根据主题-词汇矩阵中每个扩展主题词对应的主题向量，计算每一个扩展主题词和对应的个性主题词的相似度，得到若干个与个性主题词相似的扩展主题词；

根据扩展主题词与个性主题词的相似度，重新排列每句个性信息的所有扩展主题词，筛选出每句个性信息的多个扩展主题词。

3.根据权利要求1所述的基于个性信息扩展和挖掘的对话生成方法，其特征是，所述对个性信息、上下文信息和当前询问语句信息进行编码的步骤包括：

采用单层循环神经网络学习每句个性信息中每个词语向量表示，得到每句个性信息的向量表示，从而学习到个性信息中所有句子的整体向量表示e^P；

采用双层循环神经网络学习每句上下文信息中每个词语向量表示，得到每句上下文信息的向量表示，并根据上下文信息的句子间顺序和关系，更新每句上下文信息的向量表示，学习到上下文信息中所有句子的整体向量表示e^C；

采用单层循环神经网络学习每句当前查询语句信息中每个词语向量表示，得到每句当前查询语句信息的向量表示，从而学习到当前查询语句信息中所有句子的整体向量表示e^Q。

4.根据权利要求1所述的基于个性信息扩展和挖掘的对话生成方法，其特征是，所述对上下文信息、个性信息、扩展个性信息的每个词向量表示进行解码的步骤包括：

将所有信息的整体向量表示s₀作为初始隐藏向量，通过门控循环网络，得到当前时刻的隐藏向量s_t；

采用上下文注意力机制，利用隐藏向量s_t对上下文信息中每一个词语向量表示进行注意力学习，产生上下文信息的注意力向量；

采用个性信息注意力机制，利用隐藏向量s_t对个性信息中每一个词语向量表示进行注意力学习，产生个性信息的注意力向量；

采用外部个性信息注意力机制从扩展出的个性信息中选取最相关的扩展主题词，利用隐藏向量对每一个相关的扩展主题词的主题向量表示进行注意力学习，产生外部个性信息注意力向量；

通过激活函数对上下文信息注意力向量、个性信息注意力向量和外部个性信息注意力向量进行处理，得到当前时刻目标对话回复的词语概率分布，选取词语概率分布最大的词，作为当前时刻生成的词语；

重复上述步骤，直到得到回复的句子中所有词语。

5.一种基于个性信息扩展和挖掘的对话生成系统，其特征是，该系统包括：

个性挖掘模块，用于采用双向循环神经网络分别对个性信息、上下文信息和当前询问语句信息进行编码，得到对个性信息、上下文信息和当前询问语句信息的句子向量表示；将个性信息、上下文信息和当前询问语句信息的句子向量表示进行融合，得到所有信息的整体向量表示；基于所有信息的整体表示向量，采用注意力机制分别对上下文信息、个性信息、扩展个性信息的每个词向量表示进行解码，生成目标对话回复；

和

采用新的当前询问语句信息的向量表示

对新的上下文信息的向量表示

对新的上下文信息的向量表示

将新的当前查询语句信息向量表示

采用全连接层来将向量

6.根据权利要求5所述的基于个性信息扩展和挖掘的对话生成系统，其特征是，所述个性扩展模块具体用于：

引入基准数据集和个性对话数据集；

7.根据权利要求6所述的基于个性信息扩展和挖掘的对话生成系统，其特征是，所述个性挖掘模块包括多源编码器，所述多源编码器包括上下文编码器、个性信息编码器和当前询问语句编码器，所述上下文编码器、个性信息编码器和当前询问语句编码器分别利用双向循环神经网络学习个性信息中所有句子的整体向量表示、上下文信息中所有句子的整体向量表示以及当前查询语句信息中所有句子的整体向量表示。

8.根据权利要求6所述的基于个性信息扩展和挖掘的对话生成系统，所述个性挖掘模块还包括解码器，所述解码器用于：

通过激活函数对上下文信息注意力向量、个性信息注意力向量和外部个性信息注意力向量进行处理，得到当前时刻目标对话回复的词语概率分布，选取词语概率分布最大的词，作为当前时刻生成的词语。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征是，该程序被处理器执行时实现如权利要求1-4中任一项所述的基于个性信息扩展和挖掘的对话生成方法中的步骤。

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征是，所述处理器执行所述程序时实现如权利要求1-4中任一项所述的基于个性信息扩展和挖掘的对话生成方法中的步骤。