CN114461749A

CN114461749A - 对话内容的数据处理方法、装置、电子设备和介质

Info

Publication number: CN114461749A
Application number: CN202210139509.9A
Authority: CN
Inventors: 徐俊; 王海峰; 牛正雨; 吴华
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-02-15
Filing date: 2022-02-15
Publication date: 2022-05-10
Anticipated expiration: 2042-02-15
Also published as: CN114461749B

Abstract

本公开提供了一种对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法、对话方法、装置、设备、介质和产品，涉及人工智能技术领域，具体为自然语言处理、深度学习等技术领域。对话内容的数据处理方法包括：从对话内容中提取答案数据；基于对话内容和答案数据，生成针对答案数据的问题数据；基于对话内容、答案数据和问题数据，确定对话内容包含的知识信息。

Description

对话内容的数据处理方法、装置、电子设备和介质

技术领域

本公开涉及人工智能技术领域，具体为自然语言处理、深度学习等技术领域，更具体地，涉及一种对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法、对话方法、装置、电子设备、介质和程序产品。

背景技术

在人机对话场景中，机器可以自动给出对话内容，对话内容所包含的知识的丰富程度对人机对话效果起到至关重要的作用，因此需要评价对话内容包含的知识信息。相关技术评价对话内容包含的知识信息的效果较差。

发明内容

本公开提供了一种对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法、对话方法、装置、电子设备、存储介质以及程序产品。

根据本公开的一方面，提供了一种对话内容的数据处理方法，包括：从对话内容中提取答案数据；基于所述对话内容和所述答案数据，生成针对所述答案数据的问题数据；基于所述对话内容、所述答案数据和所述问题数据，确定所述对话内容包含的知识信息。

根据本公开的另一方面，提供了一种对话系统的训练方法，包括：获取多个候选对话内容；利用上述的对话内容的数据处理方法，确定所述多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；基于所述确定结果，从所述多个候选对话内容中选择训练样本；利用所述训练样本训练所述对话系统。

根据本公开的另一方面，提供了一种对话系统的评价方法，包括：获取所述对话系统输出的对话内容；利用上述的对话内容的数据处理方法，确定所述对话内容包含的知识信息，得到确定结果；基于所述确定结果，评价所述对话系统。

根据本公开的另一方面，提供了一种对话方法，包括：响应于接收到第一对话内容，利用上述的对话内容的数据处理方法，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；基于所述确定结果，从所述多个候选对话内容中选择第二对话内容；输出所述第二对话内容。

根据本公开的另一方面，提供了一种对话内容的数据处理装置，包括：提取模块、生成模块以及确定模块。提取模块，用于从对话内容中提取答案数据；生成模块，用于基于所述对话内容和所述答案数据，生成针对所述答案数据的问题数据；确定模块，用于基于所述对话内容、所述答案数据和所述问题数据，确定所述对话内容包含的知识信息。

根据本公开的另一方面，提供了一种对话系统的训练装置，包括：获取模块、确定模块、选择模块以及训练模块。获取模块，用于获取多个候选对话内容；确定模块，用于利用上述对话内容的数据处理装置，确定所述多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；选择模块，用于基于所述确定结果，从所述多个候选对话内容中选择训练样本；训练模块，用于利用所述训练样本训练所述对话系统。

根据本公开的另一方面，提供了一种对话系统的评价装置，包括：获取模块、确定模块以及评价模块。获取模块，用于获取所述对话系统输出的对话内容；确定模块，用于利用上述对话内容的数据处理装置，确定所述对话内容包含的知识信息，得到确定结果；评价模块，用于基于所述确定结果，评价所述对话系统。

根据本公开的另一方面，提供了一种对话装置，包括：确定模块、选择模块以及输出模块。确定模块，用于响应于接收到第一对话内容，利用上述对话内容的数据处理装置，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；选择模块，用于基于所述确定结果，从所述多个候选对话内容中选择第二对话内容；输出模块，用于输出所述第二对话内容。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器和与所述至少一个处理器通信连接的存储器。其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个方法或多个方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行上述的对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个方法或多个方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个方法或多个方法的步骤。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1示意性示出了根据本公开一实施例的对话内容的数据处理方法的流程图；

图2示意性示出了根据本公开一实施例的对话内容的数据处理方法的原理图；

图3示意性示出了根据本公开一实施例的获取问题生成模型的训练样本的示意图；

图4示意性示出了根据本公开一实施例的对话系统的训练方法的流程图；

图5示意性示出了根据本公开一实施例的对话系统的评价方法的流程图；

图6示意性示出了根据本公开一实施例的对话方法的流程图；

图7示意性示出了根据本公开一实施例的对话内容的数据处理装置的框图；

图8示意性示出了根据本公开一实施例的对话系统的训练装置的框图；

图9示意性示出了根据本公开一实施例的对话系统的评价装置的框图；

图10示意性示出了根据本公开一实施例的对话装置的框图；以及

图11是用来实现本公开实施例的用于执行对话内容的数据处理、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个或多个的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/ 或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

开放域对话系统(Open-Domain Dialog System)是指以自然语言为载体，用户通过与计算机在不限定领域的情况下展开通顺的、有知识内容的对话，进而获取信息和获得服务的智能系统。

一个好的对话系统需要具备良好的知识性，知识性表征了知识丰富程度。在交互过程中，对话系统需要能够较为频繁地生成有知识内容的对话内容(也称为回复句)。为了构建这样的对话系统，研究人员需要找到一种能够自动评价生成回复句的知识性的方法，回复句的知识性表征了回复句的知识丰富程度。当前，研究人员主要依赖于人工来评价回复句的知识性。在一般情况下，通常通过信息丰富度、困惑度、信息抽取等方式来评价回复句的知识性。

信息丰富度主要用于评价生成的回复句的多样性，即对话系统应该能够根据不同的对话上文来生成不同的回复句。虽然丰富度和知识性之间有一定的关联关系，但信息丰富度并没有直接体现出回复句的知识性。

困惑度(Perplexity)是衡量句子信息量的一种方式。一般而言，越常见的句子的困惑度越低。然而，使用困惑度来评价回复句的知识性有三个问题。首先，对话系统往往以低困惑度为优化目标，而知识性越高的句子往往困惑度越高；其次，导致高困惑度的因素除了知识之外，还可能有其他因素，比如语法因素；最后，困惑度并没有直接体现回复句的知识性。

信息抽取(Information Extraction)技术可以被用来直接评价回复句的知识性。直观地，如果能够从回复句中抽取出知识三元组或者事件三元组，那么通常可以表示回复句是有知识或内容的。知识三元组更多表征动作信息，例如“小明打了小红”是一个知识三元组，事件三元组更多表征属性信息，例如“A国的首都B地”是一个事件三元组。

然而，基于是否能从回复句中抽取出知识三元组或事件三元组，来评价对话回复句中是否包含知识，会导致明显的召回问题。首先。对话回复句往往比较随意，存在大量的省略指代现象。因此，有大量含有知识的回复句并不能被抽取出完整的三元组，进而被认为是没有知识的；其次，很多包含知识的回复句本身并不不能被三元组这种形式覆盖。比如，在回复句“电影C的打斗场景真精彩啊”中，并不能抽取出三元组，但是这样的回复句显然也是有知识内容的。

综上，信息丰富度和困惑度并不能直接评价回复句中的知识性。因此，本公开主要参考信息抽取技术来实现本公开的技术方案。以知识三元组抽取为例，信息抽取一般包含实体识别和关系识别两大关键技术。实体识别任务是要找到回复句中提到的每个命名实体(Named-entity)，并标记其类型。其中，命名实体一般包括人名、地名、组织名。关系抽取用于发现和分类命名实体之间的语义关系。这些关系一般是二元关系，比如子女关系、就业关系等。

实体识别一般采用序列标注算法来处理，基于大规模预训练模型的实体识别技术可以取得不错的效果。关系抽取一般采用分类算法来处理，基于大规模预训练模型的实体识别技术可以取得比较好的性能。

然而，基于信息抽取技术来直接评价回复句的知识型，通常具有以下三大问题。

首先，除了知识三元组和事件三元组，对话回复句中还包括很多其他形式的知识内容。比如，诗词“春眠不觉晓，处处闻啼鸟”，美文“俯身细看，由于前一天刚下了雨，有的叶上还有几颗晶莹的水珠，有一朵嫩白的小花上还停着一只不知名的小飞虫”，评论“电影C打斗场景真精彩啊”。

其次，对话回复句中广泛存在的省略和指代现象，使得很难在一个回复句中抽取出完整的知识三元组或事件三元组。

最后，关系识别往往依赖很多人工标注的高质量数据，但是很多实际场景中这样的数据资源是很稀缺的。这就使得在这些实际场景下，基于信息抽取技术难以自动评价回复句知识性。

有鉴于此，本公开的实施例提出了一种对话内容的数据处理方法，用于自动评价对话内容(回复句)否含有知识内容的方法。直观地，如果一个回复句中包含有意义的知识内容，那么通常应该能够针对这个知识内容提出至少一个合理的问题，该问题的答案就是这个知识内容。比如对于回复句“我最喜欢歌手D的专辑是《E》”，可以提问“专辑《E》是哪位歌手的作品”；对于回复句“春眠不觉晓，处处闻啼鸟”，就可以提出这样一个问题“诗句处处闻啼鸟的上一句是什么”；对于回复句“俯身细看，由于前一天刚下了雨，有的叶上还有几颗晶莹的水珠，有一朵嫩白的小花上还停着一只不知名的小飞虫”，可以提问“怎么描述刚下雨后的田野美景”；对于回复句“电影C打斗场景真精彩啊”，可以提问“你知道有什么打斗场景很精彩的电影么”。

下面参考图1～图3来描述根据本公开示例性实施方式的对话内容的数据处理方法。

图1示意性示出了根据本公开一实施例的对话内容的数据处理方法的流程图。

如图1所示，本公开实施例的对话内容的数据处理方法100例如可以包括操作S110～操作S130。

在操作S110，从对话内容中提取答案数据。

在操作S120，基于对话内容和答案数据，生成针对答案数据的问题数据。

在操作S130，基于对话内容、答案数据和问题数据，确定对话内容包含的知识信息。

示例性地，针对一个对话内容(回复句)，可以通过信息抽取技术抽取对话内容中的人名、地名、实体名、时间、表征颜色等特征的形容词，以作为答案数据。

得到答案数据之后，基于答案数据和对话内容生成问题数据，该问题数据对应于答案数据。

在生成问题数据之后，可以基于对话内容、答案数据和问题数据来确定对话内容包含的知识信息，包含的知识信息表征了对话内容的知识丰富程度。换言之，基于对话内容、答案数据和问题数据可以评价对话内容的知识丰富程度。

根据本公开的实施例，从对话内容中提取答案数据，然后基于对话内容和答案数据生成问题数据，接下来基于对话内容、答案数据和问题数据来评价对话内容的知识丰富程度，提高了评价准确性和评价效率。

图2示意性示出了根据本公开一实施例的对话内容的数据处理方法的原理图。

如图2所示，从对话内容P中提取多个答案数据，多个答案数据包括答案数据A1、答案数据A2、答案数据A3。

接下来，将对话内容P和答案数据A1、A2、A3输入问题生成模型 210中，输出针对答案数据A1、A2、A3的问题数据。例如，将对话内容 P和答案数据A1输入问题生成模型210中，输出针对答案数据A1的问题数据Q1；将对话内容P和答案数据A2输入问题生成模型210中，输出针对答案数据A2的问题数据Q2；将对话内容P和答案数据A3输入问题生成模型210中，输出针对答案数据A3的问题数据Q3。可以理解，基于每个对话内容和每个答案数据可以输出一个或多个答案数据。

在得到多个问题数据Q1、Q2、Q3之后，针对多个问题数据Q1、Q2、 Q3中的每个问题数据，需要确定对话内容P和每个问题数据之间的关联性。

例如，可以通过相关性模型220来预测问题数据作为查询语句的情况下对话内容被点击的概率，并基于概率确定对话内容和问题数据之间的关联性。

例如，将对话内容P和问题数据Q1输入相关性模型220中，输出对话内容P和问题数据Q1的关联性；将对话内容P和问题数据Q2输入相关性模型220中，输出对话内容P和问题数据Q2的关联性；将对话内容 P和问题数据Q3输入相关性模型220中，输出对话内容P和问题数据Q3 的关联性。

在训练相关性模型220时，可以利用多个查询语句和对应的网页标题作为训练样本。针对每个查询语句，其对应的网页标题的点击率越高，表示该查询语句和对应的网页标题之间的关联性越高。

在训练得到相关性模型220之后，利用训练好的相关性模型220确定对话内容和问题数据之间的关联性。例如，将问题数据作为查询语句输入相关性模型220中，相关性模型220预测对话内容被点击的概率，概率越高，表示对话内容和问题数据之间的关联性越高。

在得到对话内容和每个问题数据之间的关联性之后，基于关联性从多个问题数据Q1、Q2、Q3中确定目标问题数据，目标问题数据与对话内容之间的关联性高于剩余问题数据与对话内容之间的关联性，剩余问题数据为多个问题数据中除目标问题数据之外的问题数据。例如，从多个问题数据Q1、Q2、Q3中确定目标问题数据Q1、Q2。

在得到目标问题数据Q1、Q2之后，针对每个目标问题数据，对对话内容和每个目标问题数据进行语义理解处理，得到答案数据和目标问题数据之间的匹配度，然后，基于匹配度确定对话内容包含的知识信息。

例如，可以通过阅读理解模型230对对话内容和每个目标问题数据进行语义理解。示例性地，可以将对话内容、答案数据和目标问题数据输入阅读理解模型230中，输出答案数据和目标问题数据之间的匹配度。例如，将对话内容P、答案数据A1、目标问题数据Q1输入阅读理解模型230中，输出答案数据A1为问题数据Q1的正确答案的概率，将概率作为匹配度，当概率超过概率阈值，表示匹配度较高；将对话内容P、答案数据A2、目标问题数据Q2输入阅读理解模型230中，输出答案数据A2为问题数据 Q2的正确答案的概率，将概率作为匹配度，当概率超过概率阈值，表示匹配度较高。

可以理解，也可以将对话内容P、答案数据A1、目标问题数据Q2输入阅读理解模型230中，输出答案数据A1为问题数据Q2的正确答案的概率，或者将对话内容P、答案数据A2、目标问题数据Q1输入阅读理解模型230中，输出答案数据A2为问题数据Q1的正确答案的概率。

针对多个目标问题数据Q1、Q2，当具有一个或多个目标问题数据和答案数据之间的匹配度较高时，表示对话内容P值得被提出问题，进而确定对话内容P包含的知识信息较丰富。

根据本公开的实施例，基于问题生成模型生成针对对话内容的问题数据，提高了问题生成的效率。

另外，考虑到问题生成模型所生成的问题并非全部是合适的，因此可以进一步确定对话内容和问题数据之间的相关性，基于相关性从生成的问题数据中筛选出合适的目标问题数据，过滤不合适的问题数据，提高了目标问题数据的准确性。

另外，在得到目标问题数据之后，对目标问题数据和对话内容进行阅读理解，以确定从对话内容中提取的答案数据是否和目标问题数据相匹配，如果相匹配，表示对话内容值得被提出问题，进而确定对话内容包含的知识信息较丰富，以此提高了对话内容的知识丰富程度的评价准确性。

图3示意性示出了根据本公开一实施例的获取问题生成模型的训练样本的示意图。

如图3所示，用于训练问题生成模型的每个训练样本包括对话内容、答案数据、问题数据。

示例性地，可以从知识库310中获取第一参考对话内容P1，然后从第一参考对话内容P1中提取参考答案A4、A5。

然后，基于预设规则处理参考答案得到参考问题。基于预设规则处理参考答案包括将参考答案输入问题模板320中，以得到参考问题。例如，将参考答案A4输入问题模板320，生成一个或多个参考问题，例如生成参考问题Q4；将参考答案A5输入问题模板320，生成参考问题Q5。

接下来，基于第一参考对话内容、参考答案以及参考问题，得到训练样本。例如，将第一参考对话内容P1、参考答案A4、参考问题Q4作为一个训练样本；将第一参考对话内容P1、参考答案A5、参考问题Q5作为一个训练样本。

根据本公开的实施例，基于问题模板快速生成参考问题，提高了训练样本的生成效率。

通过以上方法可以得到初始的训练样本，接下来，可以基于初始的训练样本扩充更多的训练样本。

示例性，将初始训练样本中的参考问题作为查询语句进行查询，得到多个候选参考对话内容。例如，将参考问题Q4作为查询语句输入搜索引擎330中，搜索得到多个候选参考对话内容P2、P3、P4；将参考问题Q5 作为查询语句输入搜索引擎330中，搜索得到多个候选参考对话内容P5、 P6。

考虑到多个候选参考对话内容P2、P3、P4、P5、P6中并非均是合适的，因此需要进一步进行筛选。例如，从多个候选参考对话内容中选择第二参考对话内容，第二参考对话内容包括参考答案。例如，第二参考对话内容P2、P3包含参考答案A4，第二参考对话内容P5包含参考答案A5。

在得到第二参考对话内容P2、P3、P5之后，基于第二参考对话内容、参考答案以及参考问题，得到训练样本。例如，将第二参考对话内容P2、参考答案A4、参考问题Q4作为一个训练样本；将第二参考对话内容P3、参考答案A4、参考问题Q4作为一个训练样本；将第二参考对话内容P5、参考答案A5、参考问题Q5作为一个训练样本。由此，可以扩充得到更多的训练样本。

根据本公开的实施例，将参考问题作为查询语句进行查询得到更多的训练样本，提高了训练样本的丰富程度，进而提高问题生成模型的训练精度。

在另一示例中，可以将数据集340中的对话内容、答案数据、问题数据作为问题生成模型的训练样本，以此扩充训练样本。数据集340中的对话内容、答案数据、问题数据是通过经验或人工干预得到的精度较高的样本，基于数据集340的样本训练问题生成模型，提高了问题生成模型的训练精度。

在训练问题生成模型时，可以将训练样本中的问题数据作为标签，将训练样本中的对话内容和答案数据输入模型中，输出问题数据，基于输出的问题数据和训练样本中的问题数据(标签)确定损失值，并基于损失值调整模型的参数，从而训练得到问题生成模型。

另外，由于数据集340中样本的精度较高，因此可以基于数据集340 中的样本来训练上文的阅读理解模型，以此提高阅读理解模型的精度。示例性地，问题生成模型、阅读理解模型可以包括深度学习模型。

可以理解，信息抽取技术往往过于依赖人工标注的高质量数据，在很多实际场景中这样的数据资源是很稀缺的。本公开的实施例大量利用未标注的搜索引擎数据作为训练样本来训练模型，进而缓解了数据稀缺的问题。

在本公开的另一示例中，提出了一种对话系统的训练方法。下面参考图4来描述根据本公开示例性实施方式的对话系统的训练方法。

图4示意性示出了根据本公开一实施例的对话系统的训练方法的流程图。

如图4所示，本公开实施例的对话系统的训练方法400例如可以包括操作S410～操作S440。

在操作S410，获取多个候选对话内容。

在操作S420，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果。

在操作S430，基于确定结果，从多个候选对话内容中选择训练样本。

在操作S440，利用训练样本训练对话系统。

示例性地，对话系统可以包括对话模型，对话模型可以是深度学习模型。可以利用上文提及的对话内容的数据处理方法来确定多个候选对话内容中每个候选对话内容包含的知识信息。然后，从多个候选对话内容中选择包含丰富知识的候选对话内容作为训练样本，利用知识丰富的训练样本来训练对话系统，提高了对话系统的准确性。

在训练好对话系统之后，可以利用对话系统和用户进行对话交互，对话系统接收到用户的对话之后，可以自动输出包含丰富知识的对话内容 (回复句)。对话交互可以包括语音交互，也可以包括文本交互。

在本公开的另一示例中，提出了一种对话系统的评价方法。下面参考图5来描述根据本公开示例性实施方式的对话系统的评价方法。

图5示意性示出了根据本公开一实施例的对话系统的评价方法的流程图。

如图5所示，本公开实施例的对话系统的评价方法500例如可以包括操作S510～操作S530。

在操作S510，获取对话系统输出的对话内容。

在操作S520，确定对话内容包含的知识信息，得到确定结果。

在操作S530，基于确定结果，评价对话系统。

示例性地，可以利用对话系统和用户进行对话交互，对话系统接收到用户的对话之后，可以自动输出对话内容(回复句)。对话交互可以包括语音交互，也可以包括文本交互。

例如，可以利用上文提及的对话内容的数据处理方法来确定对话内容包含的知识信息。然后，基于对话内容包含的知识丰富程度来评价对话系统，对话内容包含的知识越丰富，对话系统的评价越高，以此提高了评价准确性。

在本公开的另一示例中，提出了一种对话方法。下面参考图6来描述根据本公开示例性实施方式的对话方法。

图6示意性示出了根据本公开一实施例的对话方法的流程图。

如图6所示，本公开实施例的对话方法600例如可以包括操作S610～操作S630。

在操作S610，响应于接收到第一对话内容，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果。

在操作S620，基于确定结果，从多个候选对话内容中选择第二对话内容。

在操作S630，输出第二对话内容。

示例性地，对话系统在和用户进行对话交互时，如果对话系统接收到来自用户的第一对话内容，可以利用上文提及的对话内容的数据处理方法来确定多个候选对话内容中每个候选对话内容包含的知识信息。然后，从多个候选对话内容中选择包含丰富知识的候选对话内容作为第二对话内容，并输出第二对话内容以回应用户，提高了对话的效果。

图7示意性示出了根据本公开一实施例的对话内容的数据处理装置的框图。

如图7所示，本公开实施例的对话内容的数据处理装置700例如包括提取模块710、生成模块720以及确定模块730。

提取模块710可以用于从对话内容中提取答案数据。根据本公开实施例，提取模块710例如可以执行上文参考图1描述的操作S110，在此不再赘述。

生成模块720可以用于基于对话内容和答案数据，生成针对答案数据的问题数据。根据本公开实施例，生成模块720例如可以执行上文参考图 1描述的操作S120，在此不再赘述。

确定模块730可以用于基于对话内容、答案数据和问题数据，确定对话内容包含的知识信息。根据本公开实施例，确定模块730例如可以执行上文参考图1描述的操作S130，在此不再赘述。

根据本公开实施例，问题数据包括多个问题数据；确定模块730包括：第一确定子模块、第二确定子模块、处理子模块和第三确定子模块。第一确定子模块，用于针对多个问题数据中的每个问题数据，确定对话内容和问题数据之间的关联性；第二确定子模块，用于基于关联性，从多个问题数据中确定目标问题数据，其中，目标问题数据与对话内容之间的关联性高于剩余问题数据与对话内容之间的关联性，剩余问题数据为多个问题数据中除目标问题数据之外的问题数据；处理子模块，用于对对话内容和目标问题数据进行语义理解处理，得到答案数据和目标问题数据之间的匹配度；第三确定子模块，用于基于匹配度，确定对话内容包含的知识信息。

根据本公开实施例，第一确定子模块包括：预测单元和确定单元。预测单元，用于预测问题数据作为查询语句的情况下对话内容被点击的概率；确定单元，用于基于概率，确定对话内容和问题数据之间的关联性。

根据本公开实施例，生成模块720还用于：将对话内容和答案数据输入问题生成模型中，输出针对答案数据的问题数据。

根据本公开实施例，用于训练问题生成模型的训练样本是通过以下方式得到的：从第一参考对话内容中提取参考答案；基于预设规则处理参考答案，得到参考问题；基于第一参考对话内容、参考答案以及参考问题，得到训练样本。

根据本公开实施例，用于训练问题生成模型的训练样本是还通过以下方式得到：将参考问题作为查询语句进行查询，得到多个候选参考对话内容；从多个候选参考对话内容中选择第二参考对话内容，其中，第二参考对话内容包括参考答案；基于第二参考对话内容、参考答案以及参考问题，得到训练样本。

图8示意性示出了根据本公开一实施例的对话系统的训练装置的框图。

如图8所示，本公开实施例的对话系统的训练装置800例如包括获取模块810、确定模块820、选择模块830以及训练模块840。

获取模块810可以用于获取多个候选对话内容。根据本公开实施例，获取模块810例如可以执行上文参考图4描述的操作S410，在此不再赘述。

确定模块820可以用于利用上述对话内容的数据处理装置，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果。根据本公开实施例，确定模块820例如可以执行上文参考图4描述的操作S420，在此不再赘述。

选择模块830可以用于基于确定结果，从多个候选对话内容中选择训练样本。根据本公开实施例，选择模块830例如可以执行上文参考图4描述的操作S430，在此不再赘述。

训练模块840可以用于利用训练样本训练对话系统。根据本公开实施例，训练模块840例如可以执行上文参考图4描述的操作S440，在此不再赘述。

图9示意性示出了根据本公开一实施例的对话系统的评价装置的框图。

如图9所示，本公开实施例的对话系统的评价装置900例如包括获取模块810、确定模块920以及评价模块930。

获取模块910可以用于获取对话系统输出的对话内容。根据本公开实施例，获取模块910例如可以执行上文参考图5描述的操作S510，在此不再赘述。

确定模块920可以用于利用上述对话内容的数据处理装置，确定对话内容包含的知识信息，得到确定结果。根据本公开实施例，确定模块920 例如可以执行上文参考图5描述的操作S520，在此不再赘述。

评价模块930可以用于基于确定结果，评价对话系统。根据本公开实施例，评价模块930例如可以执行上文参考图5描述的操作S530，在此不再赘述。

图10示意性示出了根据本公开一实施例的对话装置的框图。

如图10所示，本公开实施例的对话装置1000例如包括确定模块1010、选择模块1020以及输出模块1030。

确定模块1010可以用于响应于接收到第一对话内容，利用上述对话内容的数据处理装置，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果。根据本公开实施例，确定模块1010例如可以执行上文参考图6描述的操作S610，在此不再赘述。

选择模块1020可以用于基于确定结果，从多个候选对话内容中选择第二对话内容。根据本公开实施例，选择模块1020例如可以执行上文参考图6描述的操作S620，在此不再赘述。

输出模块1030可以用于输出第二对话内容。根据本公开实施例，输出模块1030例如可以执行上文参考图6描述的操作S630，在此不再赘述。

在本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理，均符合相关法律法规的规定，采取了必要保密措施，且不违背公序良俗。

在本公开的技术方案中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图11示出了可以用来实施本公开实施例的示例电子设备1100的示意性框图。电子设备1100旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示，设备1100包括计算单元1101，其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序，来执行各种适当的动作和处理。在RAM 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个或多个。例如，在一些实施例中，对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个或多个可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/ 或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101 执行时，可以执行上文描述的对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个或多个的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行对话内容的数据处理方法、对话系统的训练方法、对话系统的评价方法以及对话方法中的任意一个或多个。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/ 或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程对话内容的数据处理装置、对话系统的训练装置、对话系统的评价装置以及对话装置中的任意一个或多个的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入) 来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种对话内容的数据处理方法，包括：

从对话内容中提取答案数据；

基于所述对话内容和所述答案数据，生成针对所述答案数据的问题数据；以及

基于所述对话内容、所述答案数据和所述问题数据，确定所述对话内容包含的知识信息。

2.根据权利要求1所述的方法，其中，所述问题数据包括多个问题数据；所述基于所述对话内容、所述答案数据和所述问题数据，确定所述对话内容包含的知识信息包括：

针对所述多个问题数据中的每个问题数据，确定所述对话内容和所述问题数据之间的关联性；

基于所述关联性，从所述多个问题数据中确定目标问题数据，其中，所述目标问题数据与所述对话内容之间的关联性高于剩余问题数据与所述对话内容之间的关联性，所述剩余问题数据为所述多个问题数据中除所述目标问题数据之外的问题数据；

对所述对话内容和所述目标问题数据进行语义理解处理，得到所述答案数据和所述目标问题数据之间的匹配度；以及

基于所述匹配度，确定所述对话内容包含的知识信息。

3.根据权利要求2所述的方法，其中，所述针对所述多个问题数据中的每个问题数据，确定所述对话内容和所述问题数据之间的关联性包括：

预测所述问题数据作为查询语句的情况下所述对话内容被点击的概率；以及

基于所述概率，确定所述对话内容和所述问题数据之间的关联性。

4.根据权利要求1所述的方法，其中，所述基于所述对话内容和所述答案数据，生成针对所述答案数据的问题数据包括：

将所述对话内容和所述答案数据输入问题生成模型中，输出针对所述答案数据的问题数据。

5.根据权利要求4所述的方法，其中，用于训练所述问题生成模型的训练样本是通过以下方式得到的：

从第一参考对话内容中提取参考答案；

基于预设规则处理所述参考答案，得到参考问题；以及

基于所述第一参考对话内容、参考答案以及所述参考问题，得到所述训练样本。

6.根据权利要求5所述的方法，其中，用于训练所述问题生成模型的训练样本是还通过以下方式得到：

将所述参考问题作为查询语句进行查询，得到多个候选参考对话内容；

从所述多个候选参考对话内容中选择第二参考对话内容，其中，所述第二参考对话内容包括所述参考答案；以及

基于所述第二参考对话内容、所述参考答案以及所述参考问题，得到所述训练样本。

7.一种对话系统的训练方法，包括：

获取多个候选对话内容；

利用根据权利要求1-6中任意一项所述的方法，确定所述多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；

基于所述确定结果，从所述多个候选对话内容中选择训练样本；以及

利用所述训练样本训练所述对话系统。

8.一种对话系统的评价方法，包括：

获取所述对话系统输出的对话内容；

利用根据权利要求1-6中任意一项所述的方法，确定所述对话内容包含的知识信息，得到确定结果；以及

基于所述确定结果，评价所述对话系统。

9.一种对话方法，包括：

响应于接收到第一对话内容，利用根据权利要求1-6中任意一项所述的方法，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；

基于所述确定结果，从所述多个候选对话内容中选择第二对话内容；以及

输出所述第二对话内容。

10.一种对话内容的数据处理装置，包括：

提取模块，用于从对话内容中提取答案数据；

生成模块，用于基于所述对话内容和所述答案数据，生成针对所述答案数据的问题数据；以及

确定模块，用于基于所述对话内容、所述答案数据和所述问题数据，确定所述对话内容包含的知识信息。

11.根据权利要求10所述的装置，其中，所述问题数据包括多个问题数据；所述确定模块包括：

第一确定子模块，用于针对所述多个问题数据中的每个问题数据，确定所述对话内容和所述问题数据之间的关联性；

第二确定子模块，用于基于所述关联性，从所述多个问题数据中确定目标问题数据，其中，所述目标问题数据与所述对话内容之间的关联性高于剩余问题数据与所述对话内容之间的关联性，所述剩余问题数据为所述多个问题数据中除所述目标问题数据之外的问题数据；

处理子模块，用于对所述对话内容和所述目标问题数据进行语义理解处理，得到所述答案数据和所述目标问题数据之间的匹配度；以及

第三确定子模块，用于基于所述匹配度，确定所述对话内容包含的知识信息。

12.根据权利要求11所述的装置，其中，所述第一确定子模块包括：

预测单元，用于预测所述问题数据作为查询语句的情况下所述对话内容被点击的概率；以及

确定单元，用于基于所述概率，确定所述对话内容和所述问题数据之间的关联性。

13.根据权利要求10所述的装置，其中，所述生成模块还用于：

14.根据权利要求13所述的装置，其中，用于训练所述问题生成模型的训练样本是通过以下方式得到的：

从第一参考对话内容中提取参考答案；

基于预设规则处理所述参考答案，得到参考问题；以及

15.根据权利要求14所述的装置，其中，用于训练所述问题生成模型的训练样本是还通过以下方式得到：

16.一种对话系统的训练装置，包括：

获取模块，用于获取多个候选对话内容；

确定模块，用于利用根据权利要求10-15中任意一项所述的装置，确定所述多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；

选择模块，用于基于所述确定结果，从所述多个候选对话内容中选择训练样本；以及

训练模块，用于利用所述训练样本训练所述对话系统。

17.一种对话系统的评价装置，包括：

获取模块，用于获取所述对话系统输出的对话内容；

确定模块，用于利用根据权利要求10-15中任意一项所述的装置，确定所述对话内容包含的知识信息，得到确定结果；以及

评价模块，用于基于所述确定结果，评价所述对话系统。

18.一种对话装置，包括：

确定模块，用于响应于接收到第一对话内容，利用根据权利要求10-15中任意一项所述的装置，确定多个候选对话内容中每个候选对话内容包含的知识信息，得到确定结果；

选择模块，用于基于所述确定结果，从所述多个候选对话内容中选择第二对话内容；以及

输出模块，用于输出所述第二对话内容。

19.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现根据权利要求1-9中任一项所述方法的步骤。