CN115422329A - 一种基于知识驱动的多路筛选融合对话生成方法 - Google Patents

一种基于知识驱动的多路筛选融合对话生成方法 Download PDF

Info

Publication number
CN115422329A
CN115422329A CN202210429373.5A CN202210429373A CN115422329A CN 115422329 A CN115422329 A CN 115422329A CN 202210429373 A CN202210429373 A CN 202210429373A CN 115422329 A CN115422329 A CN 115422329A
Authority
CN
China
Prior art keywords
knowledge
information
context
semantic vector
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210429373.5A
Other languages
English (en)
Inventor
马廷淮
张峥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202210429373.5A priority Critical patent/CN115422329A/zh
Publication of CN115422329A publication Critical patent/CN115422329A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种知识驱动的多路筛选融合对话生成方法,包括:对当前对话的上下文进行预处理,由双向GRU组成的话语编码器中对上下文信息进行编码,获取相应的语义向量;基于多路知识筛选机制,通过计算语义向量信息与知识集合中每条知识的相似度,选择与当前对话最相关的知识信息,融合得到筛选后的知识信息;采用知识融合模块将知识信息与上下文的语义信息融合,借助注意力机制计算得到中间语义向量;将中间语义向量和知识信息一同送入解码器中进行响应的生成。本发明能充分利用上下文的语义信息,筛选与之高度相关的背景知识信息,将所筛选的知识信息融入对话生成的过程,提高了对话生成的质量。

Description

一种基于知识驱动的多路筛选融合对话生成方法
技术领域
本发明属于自然语言处理中对话生成领域,具体涉及一种基于知识驱动的多路筛选融合对话生成方法。
背景技术
对话生成的作用是将机器的语言转化为用户能够理解的自然语言。随着社交媒体的迅速普及积累了海量的对话语料以及计算机算力的迅速提升,引发了深度学习技术的热潮,深度学习技术近年来在人工智能多个领域都取得了非常好的成绩,利用深度学习技术让模型从海量的对话语料中自动学习语言特征,掌握语言能力成为当前对话生成技术研究的热门方向。基于深度学习的对话生成方法不需要提前准备模板或者语料库,而是从大量的对话语料中自动归纳总结对话信息,学习语言能力来生成回复。
近年来,许多研究致力于在对话系统中引入外部知识改善生成效果。该任务分为两个重要的子任务:知识选择以及响应生成,恰当的知识对响应生成起到推动作用,不恰当的知识不仅不会提高响应生成的质量甚至会对响应生成起到反作用,因此,如何选择合适的知识是至关重要的一步。Zhou等人在2018年提出一种图注意力机制将结构化三元组知识与生成式对话模型结合,通过静态注意力机制融合知识增强编码器语义向量,通过动态注意力机制增强解码器生成效果。Lian等人在2019年提出了利用后验知识帮助指导选择合适的知识。Zhang 等人在2019年提出一种基于上下文感知的知识预选模型(CaKe),该模型引入了动态双向注意预选过程,利用历史上下文作为先验信息来选择最相关的背景材料。Liu等人在2019年提出了一种知识发散网络,通过事实匹配和事实发散机制来选择知识。
专利号为CN113656569A的发明中提及一种基于上下文信息推理的生成式对话方法,首先对获取的输入信息进行数据清洗,并处理为后续模型需要的输入格式,然后引入自注意力机制分别对历史上下文中的重要单词和重要句子进行关注权重计算,得到相应的语义向量表示,并使用该语义向量表示选取与历史上下文相关的外部知识,在解码过程中通过两步解码,分别将筛选的历史上下文信息和选取的外部知识融入回复的成过程中,得到更加准确的高质量回复。然而该发明是根据历史上下文中的重要单词和重要句子来得到外部知识,知识筛选的准确度不高,另外,无法将知识信息与语义信息直接融合。
发明内容
解决的技术问题:本发明提出一种基于知识驱动的多路筛选融合对话生成方法,通过设计多路知识筛选模块选择与对话上下文更相关知识使得响应包含更多的信息;另外,利用双向GRU将知识信息与语义信息融合,以一种更高效的方式进行响应生成。
技术方案:。
一种基于知识驱动的多路筛选融合对话生成方法,所述生成方法包括以下步骤:
S10,对当前对话的上下文进行包括分词、词嵌入在内的预处理,将预处理结果送入由双向GRU组成的话语编码器中对上下文信息进行编码,获取相应的语义向量{hi};i=1,2,…,n;
S20,基于多路知识筛选机制,通过计算步骤S10得到的语义向量信息与知识集合{ki}中每条知识的相似度,从知识集合中选择与当前对话最相关的知识信息ka和kb,融合得到筛选后的知识信息k′i
S30,基于双向GRU神经网络构建知识融合模块,采用知识融合模块将步骤S20得到的知识信息k′i与步骤S10中获取的上下文的语义信息{hi}融合,借助注意力机制计算得到中间语义向量ct
S40,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成。
进一步地,步骤S10中,获取相应的语义向量{hi}的过程包括以下步骤:
S11,利用NLTK工具将包含上下文信息的相关数据进行分词后,借助Glove转换成固定维度的词向量;
S12,基于双向GRU单元构成源句子编码器,将步骤S11的转换结果输送到源句子编码器中,将对话上下文编码成固定维度向量,编码的每一步输出该时间步的隐藏状态,最后一时刻时间步用以表示该上下文的语义信息,将输入上下文编码成一固定长度的语义向量,得到上下文的隐层状态h={h1,h2,…,hn}。
进一步地,步骤S20中,从知识集合中选择与当前对话最相关的知识信息ka和kb的过程包括以下步骤:
S21,利用余弦相似度,获取上下文信息对应的语义向量与知识集合中每条知识的相似度得分,获取得分最高的知识信息记为ka
S22,根据后验知识信息获取后验知识分布,利用后验知识分布与先验知识分布进行知识的筛选;采用KL散度拉近先验知识分布与后验分布之间的距离,使先验分布不断逼近后验分布,借助先验分布获取相关的知识,将该知识记为kb;其中,根据如下公式获取先验知识分布和后验知识分布:
Figure RE-GDA0003924179530000031
Figure RE-GDA0003924179530000032
其中,ki为知识集合中的每条知识,x为输入的上下文信息,y为数据集中真实响应信息, kj代表知识集合中的全部知识,j为知识的序列号,N代表知识集合中知识的条数。
进一步地,步骤S30中,计算得到中间语义向量ct的过程包括以下步骤:
S31,根据每条知识信息的相关系数,加权求和获取最终的知识信息表达形式;
S32,采用双向GRU神经网络对步骤S31获取的知识信息和步骤S10获取的上下文的语义信息{hi}共同进行编码,将筛选后的知识表示k′i作为双向GRU神经网络的初始状态,同时将每一时刻的隐藏状态hi作为双向GRU神经网络的每一步输入,得到双向GRU的最终状态作为中间语义向量ct
进一步地,步骤S40中,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成的过程包括以下步骤:
基于知识语义表达k′i和中间语义向量ct,将每一时间步的解码状态通过全连接网络映射到词表大小的维度,并通过softmax函数计算出候选回复词的概率分布,选择概率最大的词作为当前时间步的回复yt,将所有时间步的预测回复联合起来得到最终的预测回复序列Y。
有益效果:
本发明的基于知识驱动的多路筛选融合对话生成方法,针对基于背景知识的对话生成任务,同时考虑知识筛选与响应生成。考虑真实响应中使用的实际知识有助于提高知识筛选的准确性。本发明考虑到先验知识分布和后验分布之间的暴露偏差问题,利用余弦相似度计算源句子与各知识句子的相似度,提高模型的泛化能力。同时,为更好利用所选知识信息,对选择的知识信息和源句子共同进行编码。两方面的结合,既能提高知识筛选的准确性,又能更好的利用所选知识以生成高质量的回复。。
附图说明
图1为本发明实施例的基于知识驱动的多路筛选融合对话生成方法流程图;
图2为本发明实施例的多路筛选融合对话生成方法对应的网络模型总体架构图。
具体实施方式
下面的实施例可使本专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
图1为本发明实施例的基于知识驱动的多路筛选融合对话生成方法流程图。参见图1,该生成方法包括以下步骤:
S1,对当前对话的上下文进行包括分词、词嵌入在内的预处理,将预处理结果送入由双向GRU组成的话语编码器中对上下文信息进行编码,获取相应的语义向量{hi};i=1,2,…,n。
S2,基于多路知识筛选机制,通过计算步骤S10得到的语义向量信息与知识集合{ki}中每条知识的相似度,从知识集合中选择与当前对话最相关的知识信息ka和kb,融合得到筛选后的知识信息k′i
S3,基于双向GRU神经网络构建知识融合模块,采用知识融合模块将步骤S20得到的知识信息k′i与步骤S10中获取的上下文的语义信息{hi}融合,借助注意力机制计算得到中间语义向量ct
S4,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成。
本实施案例同时考虑知识筛选与响应生成的重要性,设计基于后验知识分布与基于注意力机制组成的知识筛选模块进行知识选择,此外设计知识融合模块,以更好的利用所获取的知识进行对话生成。如图1所示,本方法包含如下步骤:
步骤1),根据任务要求,对数据进行预处理,利用双向GRU单元组成的编码器将输入上下文编码成一固定长度的语义向量。
对数据集进行分词后,经过去停用词,再经过Bert获取词嵌入;输送到双向GRU中对预处理好的上下文信息进行编码得到上下文的隐层状态h={h1,h2,…,hn}。具体的,包括以下子步骤:
步骤101),利用NLTK工具将数据进行分词后借助Glove转换成固定维度的词向量。
步骤102),根据GRU组成的双向编码器将对话上下文编码成固定维度向量,编码的每一步输出该时间步的隐藏状态,最后一时刻时间步用以表示该上下文的语义信息。
步骤2),根据上一步得到的文件访问频率,计算该上下文语义信息与知识集合中每条知识信息的相似度。
步骤2)中根据步骤1)得到的语义向量,通过多路筛选模块获取相关知识;首先利用余弦相似度,获取上下文向量与知识集合中每条知识的相似度得分,获取得分最高的知识信息记为ka;其次利用后验知识信息获取后验知识分布,再利用KL散度拉近先验知识分布与后验分布之间的距离,使得在实际使用情况下也可以获取相关的知识,将该知识记为kb。具体的,包括以下子步骤:
步骤201),利用后验知识分布与先验知识分布进行知识的筛选,在模型训练过程中,利用KL散度让先验分布不断逼近后验分布,以期在无法获取真实响应的训练阶段借助先验分布获取恰当的知识信息。
步骤202),利用注意力机制计算步骤1)所获取的语义向量与知识集合中知识信息的相似程度,弥补先验知识分布与后验知识分布间的暴露偏差,提高知识筛选的准确度。
对于先验知识分布和后验知识分布,根据如下公式获取,其中ki为知识集合中的每条知识,x为输入的上下文信息,y为数据集中真实响应信息;
Figure RE-GDA0003924179530000051
Figure RE-GDA0003924179530000052
步骤3),根据上一步得到的与上下文相关的知识信息,通过知识融合模块将知识语义融入上下文用以生成响应回复。
步骤3)根据步骤2)得到的知识信息,为了更好的使用筛选后的知识,相比于直接拼接两个向量,使用了一种更加柔和的方式对知识筛选和源句子进行融合,即采用双向GRU神经网络对知识信息和源句子共同进行编码,将筛选后的知识表示ki作为双向GRU神经网络的初始状态,同时将源句子编码器得到的隐层状态h={h1,h2,…,hn}作为双向GRU神经网络的每一步输入,得到双向GRU的最终状态作为中间语义向量ct。具体的,包括以下子步骤:
步骤301),根据上一步获取的结果,根据每条知识信息的相关系数,加权求和获取最终的知识信息表达形式。
步骤302),将步骤301)的结果与上下文语义信息利用双向GRU组成的编码器进行共同编码,将知识语义信息作为该编码器的初始状态,将步骤1)中每一时刻的隐藏状态作为该编码器的每一步输入,获取最后的隐藏状态。
步骤4),将步骤3)所获取的融入知识信息的上下文语义表达输入解码器,利用注意力机制进行响应回复生成。
步骤4)中根据步骤3)得到的中间语义向量ct以及知识表示ki,将每一时间步的解码状态通过全连接网络映射到词表大小的维度,并通过softmax函数计算出候选回复词的概率分布。选择概率最大的词作为当前时间步的回复yt,所有时间步的预测回复联合起来即为最终的预测回复序列Y。具体的,包括以下子步骤:
步骤401),设计知识感知解码器灵活的整合知识信息,知识感知GRU包括两部分,将知识语义表达,上一时刻输出预测词汇信息、隐藏状态以及步骤3)的结果作为该GRU的输入,获取当前时刻隐藏状态St
步骤402),将每一时间步的解码状态通过全连接网络映射到词表大小的维度并通过 softmax函数计算出候选回复词的概率分布,选择概率最大的词作为当前时间步的回复yt,将所有时间步的预测回复联合起来即为最终的预测回复序列s。
与前述对话生成方法相应的,参见图2,本实施例还公开了一种基于知识驱动的多路筛选融合对话生成网络模型。
在本实施例中,知识驱动的对话生成包括两个重要子任务:1.从知识集合中选择与当前对话上下文有关的知识信息,即知识选择;2.利用所选的知识生成与上下文一致且蕴含更多信息的响应。对于第一个任务,本实施例提出了一种基于背景知识的多通路知识筛选机制来有效准确的进行知识的选择。对于第二个任务,本实施例设计一种动态解码器,在解码过程中对知识进行二次筛选,避免了知识筛选的单一性,以此提高产生回复的多样性以及相关性。本实施例能充分利用上下文的语义信息,筛选与之高度相关的背景知识信息,将所筛选的知识信息融入对话生成的过程,提高了对话生成的质量。

Claims (5)

1.一种基于知识驱动的多路筛选融合对话生成方法,其特征在于,所述生成方法包括以下步骤:
S10,对当前对话的上下文进行包括分词、词嵌入在内的预处理,将预处理结果送入由双向GRU组成的话语编码器中对上下文信息进行编码,获取相应的语义向量{hi};i=1,2,…,n;
S20,基于多路知识筛选机制,通过计算步骤S10得到的语义向量信息与知识集合{ki}中每条知识的相似度,从知识集合中选择与当前对话最相关的知识信息ka和kb,融合得到筛选后的知识信息k′i
S30,基于双向GRU神经网络构建知识融合模块,采用知识融合模块将步骤S20得到的知识信息k′i与步骤S10中获取的上下文的语义信息{hi}融合,借助注意力机制计算得到中间语义向量ct
S40,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成。
2.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S10中,获取相应的语义向量{hi}的过程包括以下步骤:
S11,利用NLTK工具将包含上下文信息的相关数据进行分词后,借助Glove转换成固定维度的词向量;
S12,基于双向GRU单元构成源句子编码器,将步骤S11的转换结果输送到源句子编码器中,将对话上下文编码成固定维度向量,编码的每一步输出该时间步的隐藏状态,最后一时刻时间步用以表示该上下文的语义信息,将输入上下文编码成一固定长度的语义向量,得到上下文的隐层状态h={h1,h2,…,hn}。
3.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S20中,从知识集合中选择与当前对话最相关的知识信息ka和kb的过程包括以下步骤:
S21,利用余弦相似度,获取上下文信息对应的语义向量与知识集合中每条知识的相似度得分,获取得分最高的知识信息记为ka
S22,根据后验知识信息获取后验知识分布,利用后验知识分布与先验知识分布进行知识的筛选;采用KL散度拉近先验知识分布与后验分布之间的距离,使先验分布不断逼近后验分布,借助先验分布获取相关的知识,将该知识记为kb;其中,根据如下公式获取先验知识分布和后验知识分布:
Figure RE-FDA0003924179520000021
Figure RE-FDA0003924179520000022
其中,ki为知识集合中的每条知识,x为输入的上下文信息,y为数据集中真实响应信息,kj代表知识集合中的全部知识,j为知识的序列号,N代表知识集合中知识的条数。
4.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S30中,计算得到中间语义向量ct的过程包括以下步骤:
S31,根据每条知识信息的相关系数,加权求和获取最终的知识信息表达形式;
S32,采用双向GRU神经网络对步骤S31获取的知识信息和步骤S10获取的上下文的语义信息{hi}共同进行编码,将筛选后的知识表示k′i作为双向GRU神经网络的初始状态,同时将每一时刻的隐藏状态hi作为双向GRU神经网络的每一步输入,得到双向GRU的最终状态作为中间语义向量ct
5.根据权利要求1所述的基于知识驱动的多路筛选融合对话生成方法,其特征在于,步骤S40中,将步骤S30得到的中间语义向量ct和步骤S20中得到的知识信息k′i一同送入解码器中进行响应的生成的过程包括以下步骤:
基于知识语义表达k′i和中间语义向量ct,将每一时间步的解码状态通过全连接网络映射到词表大小的维度,并通过softmax函数计算出候选回复词的概率分布,选择概率最大的词作为当前时间步的回复yt,将所有时间步的预测回复联合起来得到最终的预测回复序列Y。
CN202210429373.5A 2022-04-22 2022-04-22 一种基于知识驱动的多路筛选融合对话生成方法 Pending CN115422329A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210429373.5A CN115422329A (zh) 2022-04-22 2022-04-22 一种基于知识驱动的多路筛选融合对话生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210429373.5A CN115422329A (zh) 2022-04-22 2022-04-22 一种基于知识驱动的多路筛选融合对话生成方法

Publications (1)

Publication Number Publication Date
CN115422329A true CN115422329A (zh) 2022-12-02

Family

ID=84197358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210429373.5A Pending CN115422329A (zh) 2022-04-22 2022-04-22 一种基于知识驱动的多路筛选融合对话生成方法

Country Status (1)

Country Link
CN (1) CN115422329A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432605A (zh) * 2023-06-14 2023-07-14 山东大学 融入先验知识的作文评语生成方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432605A (zh) * 2023-06-14 2023-07-14 山东大学 融入先验知识的作文评语生成方法及装置
CN116432605B (zh) * 2023-06-14 2023-09-22 山东大学 融入先验知识的作文评语生成方法及装置

Similar Documents

Publication Publication Date Title
CN110750959B (zh) 文本信息处理的方法、模型训练的方法以及相关装置
CN109933808B (zh) 一种基于动态配置解码的神经机器翻译方法
CN110516530A (zh) 一种基于非对齐多视图特征增强的图像描述方法
CN112307168A (zh) 基于人工智能的问诊会话处理方法、装置和计算机设备
Jiang et al. Large ai model-based semantic communications
CN114020900B (zh) 基于融合空间位置注意力机制的图表英语摘要生成方法
CN115310560A (zh) 一种基于模态空间同化和对比学习的多模态情感分类方法
CN111027681B (zh) 时序数据处理模型训练方法、数据处理方法、装置及存储介质
CN118193683A (zh) 一种基于语言大模型的文本推荐方法及系统
CN116701996A (zh) 基于多元损失函数的多模态情感分析方法、系统、设备及介质
CN117196908A (zh) 基于认知神经科学的多模态混合教学资源构建方法及系统
CN116521857A (zh) 基于图形增强的问题驱动抽象式多文本答案摘要方法与装置
Chaudhary et al. Signnet ii: A transformer-based two-way sign language translation model
CN113743095B (zh) 基于词格和相对位置嵌入的中文问题生成统一预训练方法
Vedantam the survey: Advances in natural language processing using deep learning
CN115129807A (zh) 基于自注意的社交媒体主题评论的细粒度分类方法及系统
CN115422329A (zh) 一种基于知识驱动的多路筛选融合对话生成方法
CN116863920B (zh) 基于双流自监督网络的语音识别方法、装置、设备及介质
Xu et al. CNN-based skip-gram method for improving classification accuracy of chinese text
Jiang et al. Hadamard product perceptron attention for image captioning
CN116070025A (zh) 一种基于联合评分预测和理由生成的可解释推荐方法
CN114239575B (zh) 语句分析模型的构建方法、语句分析方法、装置、介质和计算设备
CN113792550B (zh) 预测答案的确定方法及装置、阅读理解方法及装置
CN115270917A (zh) 一种两阶段处理多模态服装图像生成方法
CN112287690A (zh) 基于条件句子生成和跨模态重排的手语翻译方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination