CN113806506B

CN113806506B - 一种面向常识推理的生成式人机对话回复生成方法

Info

Publication number: CN113806506B
Application number: CN202111083577.XA
Authority: CN
Inventors: 卢国明; 康昭; 陈爱国; 罗光春; 穆亚侨; 姚娴
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-09-15
Filing date: 2021-09-15
Publication date: 2023-04-18
Anticipated expiration: 2041-09-15
Also published as: CN113806506A

Abstract

一种面向常识推理的生成式人机对话回复生成方法，属于自然语言处理技术领域。本发明通过上下文搜索引入知识实体，对知识向量与对话向量共同解码生成回复，这样的回复采用了已有的知识和推断技术对上下文进行判断，有效提升了对话的回复质量。

Description

一种面向常识推理的生成式人机对话回复生成方法

技术领域

本发明属于自然语言处理技术领域，具体涉及一种面向常识推理的生成式人机对话回复生成方法。

背景技术

使用自然语言与机器沟通是长久以来计算机科学研究的目标之一。随着现代人工智能和深度学习技术的大幅发展，以及全球互联网与移动设备普及带来的对话语料的大幅增加，之前由于词义多样、语法复杂而难以获得进展的自然语言处理领域研究与对话系统领域也得到了快速发展。

人机对话是指能够让机器通过人类语言与人进行交互的系统。生成式对话系统是在深度学习等技术较为成熟之后才逐渐具有可用性的技术，生成式对话系统需要在一个没有语料库作为直接参考的情况下，使用纯数据驱动的端到端方式进行回复生成。同时其中引入背景知识为使用一个机器推理过程将与对话相关的知识引入到对话过程当中，使对话更有活力。

目前的生成式对话回复较多使用序列到序列模型及其变种，其使用循环神经网络作为模型的编码与解码器，编码器将输入序列中具体任务所需要的信息通过编码器部分提取出来作为中间向量，解码器将中间向量转化为人类可理解的所需输出序列。现有的生成对话方式存在以下不足：

1.缺乏对于对话的理解，导致对话系统粗犷地生成相似、模糊不清的回复，使对话准确性较差。

2.缺乏对于知识的处理，难以获得与使用相关的知识，使对话的回复信息多样性较低。

发明内容

本发明的目的在于，针对背景技术存在的不足，提出了一种面向常识推理的生成式人机对话回复生成方法。本发明通过上下文搜索引入知识实体，对知识向量与对话向量共同解码生成回复，这样的回复采用了已有的知识和推断技术对上下文进行判断，有效提升了对话的回复质量。

为实现上述目的，本发明采用的技术方案如下：

一种面向常识推理的生成式人机对话回复生成方法，其特征在于，包括以下步骤：

S1.对对话上下文文本信息数据进行预处理；

S11.对对话上下文文本信息数据进行数据清洗处理；

S12.将S11清洗处理后的上下文文本信息数据根据说话人进行句子分隔；

S2.对步骤S1预处理后的对话上下文信息数据进行编码，得到上下文向量W_context；

S3.对步骤S1预处理后的对话上下文信息数据进行知识推理；

S31.采用词表的方法将步骤S1预处理后的对话上下文信息数据中的字转化为整型标志符，得到以整型数字表示的上下文标志符序列input＝{w₁，w₂，...，w_t，...，w_N}，其中，N为对话上下文信息数据的总字数，w_t为第t个字的数字表示；

S32.将S31得到的上下文标志符序列进行编码向量化，得到编码矩阵W＝{h₁，h₂，...，h_t，...，h_N}，h_t为第t个字的编码结果，h_t＝Embedding(w_t)；然后，采用自注意力机制进行计算，得到output，output＝NN(M)，其中，NN为神经网络计算函数，中间量M＝[head₁，head₂，...，head_i，...，head_H]，head_i＝selfAttention(Q_iW，K_iW，V_iW)，H代表多头自注意力机制模型中模块头的个数，head_i为多头自注意力中第i个头的计算结果，Q_i、K_i、V_i分别为第i个头中计算Q、K、V所用的训练变量参数，Q、K、V分别为自注意力计算中的询、键、值矩阵；采用Sigmoid函数计算每个词的重要性，对重要性过滤，得到对话上下文文本信息数据中需要关注的相关知识实体序列knowledge＝{K₁，K₂，...，K_m}，其中K_m为第m个以词语形式存在的知识实体，m代表对话上下文文本信息数据中的知识实体的数量；

S33.将S32输出的知识实体序列knowledge在文档知识库中进行检索，得到文档知识输出K_documents＝{K_d1，K_d2，...，K_dn}，其中，K_dn为第n个知识实体相关文字序列，n为检索到的相关文字序列的数量；

S34.将S32输出的知识实体序列knowledge在知识图谱知识库中进行推理，得到结构化知识输出K_graph＝{K_g1，K_g2，...，K_gp}，其中K_gp为第p个三元组的文字序列，p为根据知识图谱知识库得到的三元组的数量；

S35.将S34输出的结构化知识K_graph转化为Trans-E向量，得到K_trans＝{K_t1，K_t2，...，K_tp}，其中K_tp为转化成的第p个Trans-E向量；

S4.进行知识融合，得到知识向量W_knowledge；

S41.将S33输出的K_documents与S34输出的K_graph拼接、转化为整型标志符序列，得到拼接后的以整型数字表示的输入序列I＝{w₁′，w₂′，...，w_t′，...，w_N′′}，其中，N′为拼接后的以整型数字表示的输入序列的总字数，w_t′为第t个字的数字表示；

S42.对S41输出的序列I进行编码，并与K_trans进行拼接，得到输入向量W_k；然后，采用自注意力机制对输入向量W_k进行计算，得到中间向量W_z；

S43.对S42输出的中间向量W_z与S2得到的上下文向量W_context进行自注意力计算，上下文向量W_context作为注意力计算的Q向量，中间向量W_z作为注意力计算的K、V向量，计算得到知识向量W_knowledge；

S5.对上下文向量W_context与知识向量W_knowledge进行解码，进行回复生成；

S51.将上下文向量W_context与知识向量W_knowledge拼接，得到联合向量W_union＝[W_context，W_knowledge]；

S52.将第j次的回复向量W_j进行自注意力计算，得到第一中间向量W_aj，其中，第0次的回复向量为预设的初始回复向量W₀；

S53.将S52得到的第一中间向量W_aj与S51得到的联合向量W_union进行自注意力计算，第一中间向量W_aj作为注意力计算的Q向量，联合向量W_union作为注意力计算的K、V向量，计算得到第二中间向量W_bj；

S54.将S53输出的第二中间向量W_bj输入神经网络进行计算，然后通过softmax函数得到one-hot编码，并对one-hot编码查表得到目标文字，将之前所有的文字编码，得到回复向量W_j+1；

S55.重复步骤S52-S54，直到生成的字符为终止符，输出回复向量，并采用查表的方法将回复向量转化为文字回复。

本发明的有益效果为：

本发明提出了一种面向常识推理的生成式人机对话回复生成方法，能够将更全面的知识更有效地引入到生成式对话回复中，有效提升了对话的回复质量。

附图说明

图1为本发明提供的一种面向常识推理的生成式人机对话回复生成方法的流程图。

具体实施方式

一种面向常识推理的生成式人机对话回复生成方法，具体包括以下步骤：

S1.对对话上下文文本信息数据进行预处理；具体过程为：

S11.对对话上下文文本信息数据进行数据清洗处理，包括分词、大小写转换、全角半角格式转换；

S12.将S11清洗处理后的上下文文本信息数据根据说话人进行句子分隔；具体为，在说话人1的句子前标注[speaker1]，说话人2的句子前标注[speaker2]；

S2.采用多头自注意力机制的编码方法，利用Transformer Encoder(编码器)对步骤S1预处理后的对话上下文信息数据进行编码，得到上下文向量W_context；

S3.对步骤S1预处理后的对话上下文信息数据进行知识推理；具体过程为：

S31.采用词表的方法将步骤S1预处理后的对话上下文信息数据中的每个字转化为整型标志符TOKEN，得到以整型数字表示的上下文标志符序列input＝{w₁，w₂，...，w_t，...，w_N}，其中，N为对话上下文信息数据的总字数，w_t为第t个字的数字表示；

S32.将S31得到的上下文标志符序列输入基于BERT的实体选择器中，通过一个Embedding编码器进行编码向量化，得到编码矩阵W＝{h₁，h₂，...，h_t，...，h_N}，其中，h_t为第t个字的编码结果，h_t＝Embedding(w_t)；然后，采用自注意力机制进行计算，得到output，output＝NN(M)，其中，NN为神经网络计算函数，中间量M＝[head₁，head₂，...，head_i，...，head_H]，head_i＝selfAttention(Q_iW，K_iW，V_iW)，H代表多头自注意力机制模型中模块头的个数，head_i为多头自注意力中第i个头的计算结果，Q_i、K_i、V_i分别为第i个头中计算Q、K、V所用的训练变量参数，Q、K、V分别为自注意力计算中的询、键、值矩阵；采用Sigmoid函数计算自注意力计算得到的output中每个词的重要性，通过预设的重要性阈值对重要性过滤，得到对话上下文文本信息数据中需要关注(需要关注的知识实体是指重要性超过预设的重要性阈值的知识实体)的相关知识实体序列knowledge＝{K₁，K₂，...，K_m}，其中K_m为第m个以词语形式存在的知识实体，m代表对话上下文文本信息数据中的知识实体的数量；

S33.将S32输出的知识实体序列knowledge在预先设置的文档知识库中根据预先设置的检索匹配规则进行检索，得到文档知识输出K_documents＝{K_d1，K_d2，...，K_dn}，其中，K_dn为第n个知识实体相关文字序列，n为检索到的相关文字序列的数量；该相关文字序列是根据预先构建的相关关联关系选择的；

S34.将S32输出的知识实体序列knowledge在预先设置的、采用三元组描述的知识图谱知识库中进行推理，提取与{K₁，K₂，...，K_m}中各知识实体相关的实体在预设范围内的三元组，作为结构化知识输出K_graph＝{K_g1，K_g2，...，K_gp}，其中K_gp为第p个三元组的文字序列，p为根据知识图谱知识库得到的三元组的数量；具体地，与各知识实体相关的实体可以是各知识实体的同义词、近义词等；

S35.将S34输出的结构化知识K_graph转化为Trans-E向量，即K_trans＝{K_t1，K_t2，...，K_tp}，其中K_tp为三元组转化成的第p个Trans-E向量，p为根据知识图谱知识库得到的三元组的数量；

S4.进行知识融合，得到知识向量W_knowledge；具体过程为：

S41.将S33输出的K_documents与S34输出的K_graph拼接、转化为整型标志符序列TOKEN，得到拼接后的以整型数字表示的输入序列I＝{w₁′，w₂′，...，w_t′，...，w_N′′}，其中，N′为拼接后的以整型数字表示的输入序列的总字数，w_t′为第t个字的数字表示；

S42.对S41输出的序列I进行编码使得其格式与K_trans格式匹配以实现与K_trans的拼接，然后与K_trans进行拼接，得到输入向量W_k；然后，采用自注意力机制对输入向量W_k进行计算，得到中间向量W_z，W_z＝NN(M)，其中，NN为神经网络计算函数，M＝[head₁，head₂，...，head_i，...，head_H]，head_i＝selfAttention(Q_iW_k，K_iW_k，V_iW_k)，H代表多头自注意力机制模型中模块头的个数，head_i为多头自注意力中第i个头的计算结果，Q_i、K_i、V_i分别为第i个头中计算Q、K、V所用的训练变量参数，Q、K、V分别为自注意力计算中的询、键、值矩阵；

S43.对S42输出的中间向量W_z与S2得到的上下文向量W_context进行自注意力计算，上下文向量W_context作为注意力计算的Q向量，中间向量W_z作为注意力计算的K、V向量，计算得到知识向量W_knowledge，W_knowledge＝NN(M)，其中，NN为神经网络计算函数，M＝[head₁，head₂，...，head_i，...，head_H]，head_i＝selfAttention(Q_iW_context，K_iW_z，V_iW_z)，H代表多头自注意力机制模型中单个模块头的个数，head_i为多头自注意力中第i个头的计算结果，Q_i、K_i、V_i分别为第i个头中计算Q、K、V所用的训练变量参数；

S5.对上下文向量W_context与知识向量W_knowledge进行解码，进行回复生成；具体过程为：

S51.将S2得到的上下文向量W_context与S4得到的知识向量W_knowledge拼接，得到联合向量W_union＝[W_context，W_knowledge]；

S52.将第j次的回复向量W_j进行自注意力计算，得到第一中间向量W_aj，其中，j＝0，1，2，…，第0次的回复向量为预设的初始回复向量W₀；W_aj＝NN(M)，其中，NN为神经网络计算函数，M＝[head₁，head₂，...，head_i，...，head_H]，head_i＝selfAttention(Q_iW_j，K_iW_j，V_iW_j)，H代表多头自注意力机制模型中单个模块头的个数，head_i为多头自注意力中第i个头的计算结果，Q_i、K_i、V_i分别为第i个头中计算Q、K、V所用的训练变量参数，Q、K、V分别为自注意力计算中的询、键、值矩阵；

S53.将S52得到的第一中间向量W_aj与S51得到的联合向量W_union进行自注意力计算，第一中间向量W_aj作为注意力计算的Q向量，联合向量W_union作为注意力计算的K、V向量，计算得到第二中间向量W_bj，W_bj＝NN(M)，其中，NN为神经网络计算函数，M＝[head₁，head₂，...，head_i，...，head_H]，head_i＝selfAttention(Q_iW_aj，K_iW_union，V_iW_union)，H代表多头自注意力机制模型中单个模块头的个数，head_i为多头自注意力中第i个头的计算结果，Q_i、K_i、V_i分别为第i个头中计算Q、K、V所用的训练变量参数；

S54.将S53输出的第二中间向量W_bj输入神经网络进行计算，然后通过softmax函数得到one-hot编码，并对one-hot编码查表得到目标文字，将之前所有的文字(截止目前为止得到的所有文字)输出组合编码，得到回复向量W_j+1；

S55.判断是否得到终止符，若生成的字符为终止符，则输出回复向量，并采用查表的方法将回复向量转化为文字回复；若生成的字符不是终止符，则令i＝i+1，进入步骤S52。

Claims

1.一种面向常识推理的生成式人机对话回复生成方法，其特征在于，包括以下步骤：

S1.对对话上下文文本信息数据进行预处理；

S11.对对话上下文文本信息数据进行数据清洗处理；

S3.对步骤S1预处理后的对话上下文信息数据进行知识推理；

S4.进行知识融合，得到知识向量W_knowledge；