CN112115247A

CN112115247A - 一种基于长短时记忆信息的个性化对话生成方法和系统

Info

Publication number: CN112115247A
Application number: CN202010927235.0A
Authority: CN
Inventors: 窦志成; 李小禾
Original assignee: Renmin University of China
Current assignee: Renmin University of China
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2020-12-22
Anticipated expiration: 2040-09-07
Also published as: CN112115247B

Abstract

本发明涉及一种基于长短时记忆信息的个性化对话生成方法和系统，包括以下步骤：将输入文本和用户对话历史的文本表示为句子向量；将输入文本进行编码获得感知记忆信息；在用户对话历史的文本中筛选出与输入文本最相似的历史作为当前输入下用户的长时记忆，将长时记忆进行编码得到长时记忆信息；将与输入文本时间上最为接近的用户对话历史进行编码得到用户的短时记忆信息；将感知记忆信息、长时记忆信息和短时记忆信息在每个生成时刻更新并与之前时刻的输出信息一同进行解码，从而生成具有用户个性的对话。其针对不同内容和不同时刻的输入区别对待对话历史，提供不同维度的记忆信息作为动态的隐式人设，生成结果更加符合真实对话场景。

Description

一种基于长短时记忆信息的个性化对话生成方法和系统

技术领域

本发明涉及一种基于长短时记忆信息的个性化对话生成方法和系统，属于人工智能技术领域。

背景技术

伴随着由数据驱动的端到端对话系统的发展，个性化对话系统开始出现。闲聊型个性化对话系统，即是针对开放领域下输入给出合适回复的同时，输出的结果能具有人的角色信息。在应用中，无论是虚拟的社交机器人还是智能个人代理回复，都要求对话模型给出的回复具备人物角色信息，因此需要赋予模型人物设定(本文中简称为人设)来维持人物角色信息的统一。目前为个性化对话系统构建人设的方法主要分为显式人设和隐式人设两种。显式人设主要通过预先设定的属性关键词或句子描述等来作为模型个性化的人设信息，在模型输出结果时利用这些显式的文本信息来控制模型的生成或选择过程。相对地，隐式人设则没有任何显式定义的文本来作为角色信息，模型通过用户对话历史为每个用户构建隐式的个性向量，以此作为用户的人设加入到生成过程中，来维持输出结果的人设一致性。

显式人设的方法为了构建大规模与人设相关的训练数据，需要投入大量的人力资源，来模拟相关对话场景或者构造规则。而且，由于显式人设能够预先给出人设信息有限，如PERSONA-CHAT数据集中，仅用5句话作为人设信息，因此面对设定之外的输入，模型仍倾向于给出设定相关的回复，从而降低了回复质量。在实际应用中，面对新的人物或者新的属性设定均需要重复之前的步骤。因此，显式人设的方法只适用于固定且小规模的场景范围。对应地，隐式人设的方法则自动从对话历史中学习用户的角色信息，将用户个性化的角色信息转换为向量来表示用户的人设，通过隐式的个性向量来引导模型生成或选择个性化的回复。因此，隐式人设的方法避免了为每个用户配置人设的过程，可以在大规模的用户群体上构建用户特有的个性化对话模型，面对同样的输入根据不同用户的特点给出个性化回复，可作为用户的代理回复助手。隐式人设的方式虽然可以通过隐式的个性向量来学习用户对话历史中的人物性格和语言习惯等个性化特征。然而现有的研究工作大多从全局层面来构建用户个性向量，这样不加区别地使用用户历史，最终得到的静态个性向量包含了对话历史中用户所有的个性化特征，在面对不同的输入时，模型难以表达出用户具体某个方面的个性特征。Li等人(Li，Piji，et al.“Persona-Aware Tips Generation.”The WorldWide Web Conference.2019)利用用户历史为每个用户构建与个性化相关的关键词，在关键词生成的不同时刻，通过注意力机制将关键词加权求得表示用户个性的个性向量，而非通过模型训练得到用户个性向量。这在一定程度上使得隐式人设从静态的向量转变为动态的向量，可以在生成的不同阶段进行调整，然而该方法仅关注了显著的个性化关键词而忽略了用户个人语言习惯等细微的个性化特征。

发明内容

针对上述问题，本发明的目的是提供一种基于长短时记忆信息的个性化对话生成方法和系统，其通过模拟人的记忆类型提出了基于长、短时记忆信息的个性化对话生成模型，针对不同内容和不同时刻的输入区别对待对话历史，在解码过程中提供不同维度的记忆信息作为动态的隐式人设，使生成的结果更加符合真实多变的对话场景。

为实现上述目的，本发明采取以下技术方案：一种基于长短时记忆信息的个性化对话生成方法，包括以下步骤：S1将输入文本和用户对话历史的文本表示为句子向量；S2将输入文本进行编码获得感知记忆信息；S3在用户对话历史的文本中筛选出与输入文本最相似的历史作为当前输入下用户的长时记忆，将长时记忆进行编码得到长时记忆信息；S4将与输入文本时间上最为接近的用户对话历史进行编码得到用户的短时记忆信息；S5将感知记忆信息、长时记忆信息和短时记忆信息在每个生成时刻更新并与之前时刻的输出信息一同进行解码，从而生成具有用户个性的对话。

进一步，步骤S2中获得感知记忆信息的方法为：输入文本进入Seq2Seq模型进行编码得到用户对输入文本的感知信息，并将感知信息带入注意力机制，将其合并为解码过程生成回复的不同时刻的感知记忆信息。

进一步，感知记忆编码模块的公式为：

其中，

表示在编码器的不同时刻i输入信息的中间隐含状态向量，

n为输入的长度；x_i为在时刻i输入的词；φ(·)表示获取单词词向量的函数；

表示在解码j时刻模型关于输入的感知记忆信息；s_j表示解码j时刻解码器的隐含状态，GRU(·)为门控循环单元函数，Attn(·)为注意力机制函数。

进一步，步骤S3中用户对话历史的文本与输入文本的相似性的判断方法为：将输入文本映射到与用户对话历史的文本相同的向量空间中，以单词的逆文档频率来衡量输入文本与用户对话历史的文本的相似性，单词的逆文档频率idf的计算公式为：

其中，a、b、c分别表示词表中单词的序号，文档集合中文档的序号和句子w中单词的序号；D＝{d₁,d₂,…}为整个文档集合；{b:w_a∈d_b}为包含单词w_a的文档d_b的集合；∈(·)表示计算句子w的句子向量的函数；φ(·)表示获取单词词向量的函数。

进一步，步骤S3中得到长时记忆信息的方法为：将输入文本映射到与用户对话历史的文本相同的向量空间中，分别计算输入文本与用户的历史回复以及与历史回复对应的其他用户的输入的句子的相似度，其计算公式为：

其中，p_l和r_l分别表示用户对话历史数据的其他用户输入历史和用户回复历史，L为对话历史的数目；

表示输入文本X与其他用户输入历史p_l的相似度；

表示输入文本X与该用户回复历史r_l的相似度；sc_l表示输入文本与第l条用户对话历史整体的相似度，通过平衡因子α来调整

和

的权重；得到输入文本X与用户对话历史相似度分布sc＝{sc₁,sc₂,…,sc_L}后，取相似度最高的前K个对话历史，保留其时间顺序，将当前用户的回复历史R_long＝{r₁,r₂,…,r_K}作为长时记忆信息。

进一步，步骤S4中得到短时记忆信息的方法为：直接提取用户最近的T条对话回复历史，作为短时记忆输入数据R_short＝{r₁,r₂,…,r_T}，其计算公式为：

其中，

表示在编码器的不同时刻k长时记忆信息的中间隐含状态向量，

GRU(·)为门控循环单元函数。

进一步，编码后的长时记忆信息和短时记忆信息的隐含向量H^l、H^s，通过注意力机制确定其在解码过程的不同时刻的权重，加权得到在每个解码时刻的用户的长时记忆信息和短时记忆信息，使用遮蔽注意力机制，对于权重小于阈值的长时记忆信息和短时记忆信息，在加权时进行遮蔽，遮蔽注意力机制的公式为：

其中，s_j表示在解码j时刻的中间隐含状态；H表示编码器的隐含状态序列；a_jk表示原始的注意力机制的权重；

为遮蔽后的注意力机制的权重；I(·)为遮蔽函数，当权重a_jk低于注意力阈值γ时返回0，反之为1。

进一步，在步骤S5中，解码的公式为：

p(y_j|s_j)＝softmax(W_os_j)

其中，s_j表示在解码过程中j时刻的中间隐含状态；GRU(·)为门控循环单元函数；

分别表示感知记忆向量、短时记忆向量和长时记忆向量；φ(·)表示获取单词词向量的函数；[·,·]表示向量拼接操作；W_o是在输出过程中将s_j映射到词表空间的参数矩阵；y_j表示解码过程在j时刻输出的词；p(y_j|s_j)为在解码过程在时刻j下，词典中词的生成概率，选择概率最大的词作为当前生成的词y_j。

进一步，选择概率最大的词作为当前生成的词y_j通过使损失函数最小化实现，损失函数为：

其中，θ为模型中所有能够学习的参数，V为解码器端的生成词表，y′_v,j为词v在j时刻的真实概率，若在j时刻原始回复中是词v则为1，否则为0，p(y_v,j)为词v在j时刻的生成概率。

本发明还公开了一种基于长短时记忆信息的个性化对话生成系统，包括：句子向量模块，用于将输入文本和用户对话历史的文本表示为句子向量；感知模块，用于将输入文本进行编码获得感知记忆信息；长时记忆模块，用于在用户对话历史的文本中筛选出与输入文本最相似的历史作为当前输入下用户的长时记忆，将长时记忆进行编码得到长时记忆信息；短时记忆模块，用于将与输入文本时间上最为接近的用户对话历史进行编码得到用户的短时记忆信息；解码模块，用于将感知记忆信息、长时记忆信息和短时记忆信息进行解码，从而生成具有用户个性的对话。

本发明由于采取以上技术方案，其具有以下优点：

1、本发明通过模拟人的记忆类型提出了基于长、短时记忆信息的个性化对话生成模型，针对不同内容和不同时刻的输入区别对待对话历史，在解码过程中提供不同维度的记忆信息作为动态的隐式人设，使生成的结果更加符合真实多变的对话场景。

2、本发明提出了记忆编码模块来模拟人的记忆类型，针对不同的输入提取相关的记忆信息，并在生成过程动态地构建用户的隐式人设，并通过遮蔽注意力机制来减少记忆向量中的噪音，强化最相关的用户回复历史中的个性化特征，这使得模型能更灵活地表达用户局部的个性化特征，更加符合复杂多变的真实对话场景，具有一定的实用价值。

附图说明

图1是本发明一实施例中基于长短时记忆信息的个性化对话生成方法的示意图；

图2是本发明一实施例中长时记忆信息生成方法的示意图；

图3是本发明一实施例中短时记忆信息生成方法的示意图。

具体实施方式

为了使本领域技术人员更好的理解本发明的技术方向，通过具体实施例对本发明进行详细的描绘。然而应当理解，具体实施方式的提供仅为了更好地理解本发明，它们不应该理解成对本发明的限制。在本发明的描述中，需要理解的是，所用到的术语仅仅是用于描述的目的，而不能理解为指示或暗示相对重要性。

心理学中将人的记忆分为了感知记忆、短时记忆和长时记忆三种类型。为了保留用户对话历史中丰富的个性化信息，本发明通过模拟人的记忆类型提出了基于长、短时记忆信息的个性化对话生成模型，针对不同内容和不同时刻的输入文本区别对待对话历史的文本，在解码过程中提供不同维度的记忆信息作为动态的隐式人设，更加符合真实多变的对话场景。

个性化对话生成的回复的问题可以描述为：对于给定一段文本X＝(x₁,x₂,…,x_n)和用户的回复历史，生成满足指定用户个性化特征的回复Y＝(y₁,y₂,…,y_m)。个性化特征包括用户偏好、语言风格等。生成的回复Y除了满足语法通顺性、语义连贯性，还需要具备一定信息量体现出个性化特征。

实施例一

本实施例公开了一种基于长短时记忆信息的个性化对话生成方法，如图1所示，包括以下步骤：

S1将输入文本和用户对话历史的文本表示为句子向量。

S2将输入文本进行编码获得感知记忆信息。

当给定一段输入文本，需要将输入文本转化为可计算的向量信息，以便在后续过程中进行计算生成合适的回复。这个过程与人感知原始信息、处理加工信息的过程类似，因此感知记忆编码主要基于Seq2Seq模型和注意力机制对输入文本进行处理。Seq2Seq模型对输入文本进行编码得到用户对输入的感知信息，该感知信息通过注意力机制合并为解码过程生成回复的不同时刻的感知记忆，由此来提供动态的记忆信息，关注输入文本在每个解码时刻的不同重点。

Seq2Seq模型通常由编码器和解码器组成。编码器的作用是对输入文本X进行表示，将输入文本X转化为一个中间状态的稠密向量H＝(h₁,h₂,…,h_n)。而解码器的作用则是将这个中间状态向量h_n解码为最终输出的文本Y。通常使用长短时依赖记忆单元(LSTM)或者门控循环单元(GRU)作为编码器、解码器的基本单元。在本实施例中采用GRU作为编码器、解码器的基本单元。GRU在每个时刻t，通过更新门和重置门进行控制，其计算过程如下：

z＝σ(W_zx_t+U_zh_t-1)

r＝σ(W_rx_t+U_rh_t-1)

其中，z是更新门输出结果；r是重置门输出结果；s是输入细胞状态向量；tanh(·)和σ(·)是激活函数；

表示向量的点积；W_z，W_r，W_s，U_z，U_r，U_s分别为不同门下的参数矩阵，用于将t时刻输入向量x_t和上一时刻中间状态h_t-1映射到同一语义空间。为了减少与后文的符号冗余，将GRU的计算公式进行简化，令h_t＝GRU(h_t-1，x_t)，x_t表示GRU在t时刻的输入向量，h_t表示GRU在t时刻的隐含向量。

因此，编码器和解码器的计算过程可以分别表示为：

h_t＝GRU_encoder(h_t-1，φ(x_t))

s_t＝GRU_decoder(s_t-1，φ(y_t-1))

其中，门控循环单元函数GRU(·)使用不同参数初始化分别得到编码单元GRU_encoder(·)和解码单元GRU_decoder(·)；φ(·)表示获取单词词向量的函数；h_t，s_t分别是编码器和解码器在t时刻的中间隐含状态；y_t表示解码器在t时刻输出的词。

由于，编码过程中仅使用编码器的最后一个输出h_n作为输入语句的表示；同时，在解码过程中，每个时刻t解码器的输出值只依赖于上一个时刻的状态s_t-1和上一个生成词的词向量y_t，输入语句的其他信息没有得到充分的利用，也没有被充分表达。所以需要引入注意力机制，来丰富解码过程的输入信息。引入注意力机制后，解码器采用如下公式进行解码：

s_i＝GRU_decoder(s_i-1，[φ(y_i-1)，c_i])

其中，[·，·]表示向量拼接操作；i是解码器的不同时刻；j是编码器的不同时刻；s_i是解码器在解码过程中每个时刻i的隐含状态；h_j是编码器编码过程中的中间状态稠密向量H在j时刻的向量；e_ij是上一个时刻的解码器隐含状态s_i-1和在不同时刻j与编码器中间状态h_j计算得到的注意力重要度，W_a为学习的参数矩阵；α_ij是注意力机制将重要度归一化后得到的分配给编码器不同时刻中间向量的加权权重；n是输入的长度；m为个性化回复的长度；c_i是通过注意力机制权重对编码器所有中间状态加权求和计算得到的上下文信息的向量表示；y_i是在时刻i生成词的词向量。为了减少后文符号冗余，将注意力机制的公式进行简化，令c_i＝Attn(s_i-1,H)，其中H为编码器的中间隐含状态序列。

因此，感知记忆信息的获取公式为：

其中，

表示在编码器的不同时刻j输入信息的中间隐含状态向量，

n为输入的长度；x_j表示在时刻j输入的词；φ(·)表示获取单词词向量的函数；

表示在解码i时刻模型关于输入的感知记忆信息；s_i表示解码过程i时刻解码器的隐含状态。

S3在用户对话历史的文本中筛选出与输入文本最相似的历史作为当前输入下用户的长时记忆，将长时记忆进行编码得到长时记忆信息。

目前用于构建隐式人设的个性向量通常是通过模型训练得出的静态向量，对话历史中用户不同的个性化特征仍然是不加区分地考虑，由于用户兴趣爱好的多样性，面对不同的输入，全局的角色信息难以在特定的话题领域对回复生成的过程进行很好地引导。因此，通过对人的记忆类型的模拟，本实施例通过对长时记忆信息进行编码模来捕获用户对话历史的文本中，与当前输入文本相关的长时记忆信息。当人们回复其他人给出的问题时，若要给出有信息量的回复，往往会在记忆中回想自己曾经的回复历史中与当前输入最为相关的，或者以前遇到过的类似的问题，根据当时的回复再重构出符合当前问题的回答。所以，如图2所示，为了模拟这个过程，输入的文本信息会被映射到与对话历史句子表示相同的向量空间，以单词的逆文档频率来衡量输入文本与用户对话历史的文本的相似性，单词的逆文档频率idf的计算公式为：

其中，a、b、c分别表示词表中单词的序号，文档集合中文档的序号和句子w中单词的序号；D＝{d₁,d₂,…}为整个文档集合；{b:w_a∈d_b}为包含单词w_a的文档d_b的集合；∈(·)表示计算句子w的句子向量的函数；φ(·)表示获取单词词向量的函数。在idf的计算公式中，若包含单词w_i的文档数越多，说明该词越常见，对于句子的重要性就越小，其idf值也越小，以此来衡量单词的重要性。因此，在句子表示∈(w)公式中，使用每个单词的idf值作为其词向量的权重进行加权得到句子的向量表示，为了避免长句带来的影响，通过句子的长度进行平均。

步骤S3中得到长时记忆信息的方法为：将输入文本映射到与用户对话历史的文本相同的向量空间中，分别计算输入文本与用户的历史回复以及与历史回复对应的其他用户的输入的句子的相似度，其计算公式为：

表示输入文本X与其他用户输入历史p_l的相似度；

和

的权重；得到输入文本X与用户对话历史相似度分布sc＝{sc₁,sc₂,…,sc_L}后，取相似度最高的前K个对话历史，保留其时间顺序，将当前用户的回复历史R_long＝{r₁,r₂,…,r_K}作为长时记忆信息。编码当前用户的回复历史R_long＝{r₁,r₂,…,r_K}的时序信息。则其计算公式可表示为：

其中，

r_k表示长时记忆数据R_long中当前用户的第k条回复。

S4将与输入文本时间上最为接近的用户对话历史进行编码得到用户的短时记忆信息。

短时记忆(Short-term Memory,STM)作为被看做是处于长时记忆和感知记忆中间的一个阶段，记录了人在最近一段时间的记忆信息，对人在复述近期感知的内容和巩固记忆向长时记忆转化都有着重要作用。同时，在真实场景中，用户的角色个性化特征会随着时间变化，因此，通过提取用户在当前输入时刻之前的最近的历史信息，将其作为用户的短时记忆，来强化用户在最近时期的个性化特征信息，即使用户个性化特征随着时间而改变，也能及时地为模型提供其短期内最新的个性化信息。如图3所示，步骤S4中得到短时记忆信息的方法为：直接提取用户最近的T条对话回复历史，作为短时记忆输入数据R_short＝{r₁,r₂,…,r_T}，其计算公式为：

其中，

GRU(·)为门控循环单元函数。

因此，在解码不同时刻，长、短时记忆编码模块计算的记忆向量的公式可表示为：

其中，

分别表示解码时刻j的长时记忆向量和短时记忆向量；H^l、H^s分别表示长时记忆编码模块和短时记忆编码模块通过提取记忆信息后编码得到的中间隐含状态序列；s_j表示在解码j时刻的中间隐含状态。

编码后的长时记忆信息和短时记忆信息的隐含向量H^l、H^s，通过注意力机制确定其在解码过程的不同时刻的权重，加权得到在每个解码时刻的用户的长时记忆信息和短时记忆信息，但这个过程并不是完全可靠，因为注意力机制会根据记忆信息与解码隐含状态的相似性衡量其权重大小，相似度会被归一化，于是所有提取出的记忆信息都会被考虑到记忆向量中进行计算，这显然会给模拟记忆得到向量表示的过程带来噪音。由于与输入最相似的长时记忆信息和与输入时间最相近的短时记忆信息的提取过程可能存在偏差，这些信息中可能只有少数是与输入真正相关的，其他不相关的信息应该在构建记忆向量的过程中被忽略，避免在解码的每个时刻影响生成结果的个性化表达。因此，为了得到最相关的用户个性化记忆信息，减少记忆信息中的噪音，本实施例中引入了遮蔽注意力机制，在通过注意力机制权重加权得到长时记忆向量的过程中，对于权重小于阈值的信息，在加权时进行遮蔽，从而只关注记忆信息中真正相关的部分。因此，遮蔽注意力机制的公式为：

S5将感知记忆信息、长时记忆信息和短时记忆信息在每个生成时刻更新并与之前时刻的输出信息一同进行解码，从而生成具有用户个性的对话。

在解码过程中，感知记忆提供感知接收的输入信息，长、短时记忆提取与输入相关的用户对话历史信息作为动态的隐式人设，一同促进个性化回复的生成。解码模块利用感知记忆模块得到的对于当前输入的感知信息和长、短时记忆模块得到的用户动态的记忆信息来生成个性化回复，解码的公式为：

p(y_j|s_j)＝softmax(W_os_j)

训练过程中通过使用解码器生成的句子与原始回复的交叉熵作为损失函数，选择概率最大的词作为当前生成的词y_j通过使损失函数最小化实现，损失函数为：

其中，θ为模型中所有能够学习的参数，V为解码器端的生成词表，y′_v,_j为词v在j时刻的真实概率，若在j时刻原始回复中是词v则为1，否则为0，p(y_v,j)为词v在j时刻的生成概率。

不同于通过用户历史训练得到的静态向量作为隐式人设，长、短时记忆编码模块会根据输入内容和时刻的不同，动态地提取到用户的个性化记忆信息。此外，为了更好地提取长、短时记忆中与生成过程相关的局部信息，本发明还引入了一种遮蔽注意力机制，通过对注意力权重低于阈值的记忆信息进行遮蔽，来降低动态提取的局部个性化记忆信息中的噪音。

实施例二

基于相同的发明构思，本实施例公开了一种基于长短时记忆信息的个性化对话生成系统，包括：

句子向量模块，用于将输入文本和用户对话历史的文本表示为句子向量；

感知模块，用于将输入文本进行编码获得感知记忆信息；

长时记忆模块，用于在用户对话历史的文本中筛选出与输入文本最相似的历史作为当前输入下用户的长时记忆，将长时记忆进行编码得到长时记忆信息；

短时记忆模块，用于将与输入文本时间上最为接近的用户对话历史进行编码得到用户的短时记忆信息；

解码模块，用于将感知记忆信息、长时记忆信息和短时记忆信息进行解码，从而生成具有用户个性的对话。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。上述内容仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于长短时记忆信息的个性化对话生成方法，其特征在于，包括以下步骤：

S1将输入文本和用户对话历史的文本表示为句子向量；

S2将所述输入文本进行编码获得感知记忆信息；

S3在所述用户对话历史的文本中筛选出与所述输入文本最相似的历史作为当前输入下用户的长时记忆，将所述长时记忆进行编码得到长时记忆信息；

S4将与所述输入文本时间上最为接近的所述用户对话历史进行编码得到用户的短时记忆信息；

S5将所述感知记忆信息、长时记忆信息和短时记忆信息在每个生成时刻更新并与之前时刻的输出信息一同进行解码，从而生成具有用户个性的对话。

2.如权利要求1所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，所述步骤S2中获得感知记忆信息的方法为：所述输入文本进入Seq2Seq模型进行编码得到用户对所述输入文本的感知信息，并将所述感知信息带入注意力机制，将其合并为解码过程生成回复的不同时刻的感知记忆信息。

3.如权利要求2所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，所述感知记忆编码模块的公式为：

其中，

表示在编码器的不同时刻i输入信息的中间隐含状态向量，

4.如权利要求1所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，所述步骤S3中用户对话历史的文本与输入文本的相似性的判断方法为：将所述输入文本映射到与所述用户对话历史的文本相同的向量空间中，以单词的逆文档频率来衡量输入文本与用户对话历史的文本的相似性，所述单词的逆文档频率idf的计算公式为：

其中，a、b、c分别表示词表中单词的序号，文档集合中文档的序号和句子w中单词的序号；D＝{d₁，d₂，...}为整个文档集合；{b：w_a∈d_b}为包含单词w_a的文档d_b的集合；∈(·)表示计算句子w的句子向量的函数；φ(·)表示获取单词词向量的函数。

5.如权利要求4所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，所述步骤S3中得到长时记忆信息的方法为：将所述输入文本映射到与所述用户对话历史的文本相同的向量空间中，分别计算所述输入文本与用户的历史回复以及与所述历史回复对应的其他用户的输入的句子的相似度，其计算公式为：

表示输入文本X与其他用户输入历史p_l的相似度；

和

的权重；

得到输入文本X与用户对话历史相似度分布sc＝{sc₁，sc₂，...，sc_L}后，取相似度最高的前K个对话历史，保留其时间顺序，将当前用户的回复历史R_long＝{r₁，r₂，...，r_K}作为长时记忆信息。

6.如权利要求5所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，所述步骤S4中得到短时记忆信息的方法为：直接提取用户最近的T条对话回复历史，作为短时记忆输入数据R_short＝{r₁，r₂，...，r_T}，其计算公式为：

其中，

GRU(·)为门控循环单元函数。

7.如权利要求6所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，编码后的所述长时记忆信息和短时记忆信息的隐含向量H^l、H^s，通过注意力机制确定其在解码过程的不同时刻的权重，加权得到在每个解码时刻的用户的所述长时记忆信息和短时记忆信息，使用遮蔽注意力机制，对于权重小于阈值的所述长时记忆信息和短时记忆信息，在加权时进行遮蔽，遮蔽注意力机制的公式为：

8.如权利要求1-7任一项所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，在所述步骤S5中，所述解码的公式为：

p(y_j|s_j)＝softmax(W_os_j)

分别表示感知记忆向量、短时记忆向量和长时记忆向量；φ(·)表示获取单词词向量的函数；[·，·]表示向量拼接操作；W_o是在输出过程中将s_j映射到词表空间的参数矩阵；y_j表示解码过程在j时刻输出的词；p(y_j|s_j)为在解码过程在时刻j下，词典中词的生成概率，选择概率最大的词作为当前生成的词y_j。

9.如权利要求8所述的基于长短时记忆信息的个性化对话生成方法，其特征在于，所述选择概率最大的词作为当前生成的词y_j通过使损失函数最小化实现，所述损失函数为：

其中，θ为模型中所有能够学习的参数，V为解码器端的生成词表，y′_v，j为词v在j时刻的真实概率，若在j时刻原始回复中是词v则为1，否则为0，p(y_v，j)为词v在j时刻的生成概率。

10.一种基于长短时记忆信息的个性化对话生成系统，其特征在于，包括：

感知模块，用于将所述输入文本进行编码获得感知记忆信息；

长时记忆模块，用于在所述用户对话历史的文本中筛选出与所述输入文本最相似的历史作为当前输入下用户的长时记忆，将所述长时记忆进行编码得到长时记忆信息；

短时记忆模块，用于将与所述输入文本时间上最为接近的所述用户对话历史进行编码得到用户的短时记忆信息；

解码模块，用于将所述感知记忆信息、长时记忆信息和短时记忆信息进行解码，从而生成具有用户个性的对话。