CN112905763B - 会话系统开发方法、装置、计算机设备及存储介质 - Google Patents
会话系统开发方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112905763B CN112905763B CN202110166155.2A CN202110166155A CN112905763B CN 112905763 B CN112905763 B CN 112905763B CN 202110166155 A CN202110166155 A CN 202110166155A CN 112905763 B CN112905763 B CN 112905763B
- Authority
- CN
- China
- Prior art keywords
- reply
- sentence
- sentences
- prediction
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000033772 system development Effects 0.000 title claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000011161 development Methods 0.000 claims abstract description 10
- 230000018109 developmental process Effects 0.000 claims abstract description 10
- 230000004044 response Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 79
- 238000011156 evaluation Methods 0.000 claims description 29
- 238000012216 screening Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种会话系统开发方法,包括:在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;基于所述预测回复语句设置判断条件,所述判断条件用于会话处理。该会话系统开发方法,通过利用回答预测模型可以自动生成多个预测回复语句,不但提高了预测的覆盖率,并且在准确度方面可以持续改进。此外,还提出了一种会话系统开发装置、计算机设备及存储介质。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种会话系统开发方法、装置、计算机设备及存储介质。
背景技术
智能多轮对话系统往往有上百个节点,节点之间存在复杂的连接关系。在开发这样的对话系统(又称“会话系统”)时,为了保证较高的会话覆盖率,开发者需要列举出每个节点所有可能的下跳节点,并设计相应的话术来覆盖对应的跳转,这个任务有一定的难度且工作量很大。一般的应对方法是让开发者设计出来几句典型的回复,使用相似句扩展方法将一句变为多句,从而提高覆盖率。但是这种扩展方式能够覆盖的句式有限,忽略了上下文,所以导致不但覆盖率低,而且准确率是固定的,不能提高。
发明内容
基于此,有必要针对上述问题,提出一种覆盖率高且准确度可以持续改进的会话系统开发方法、装置、计算机设备及存储介质。
一种会话系统开发方法,包括:
在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
基于所述预测回复语句设置判断条件,所述判断条件用于会话处理。
一种会话系统开发装置,包括:
输出模块,用于在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
设置模块,用于基于所述预测回复语句设置判断条件,所述判断条件用于会话处理。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
基于所述预测回复语句设置判断条件,所述判断条件用于会话处理。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
基于所述预测回复语句设置判断条件,所述判断条件用于会话处理。
上述会话系统开发方法、装置、计算机设备及存储介质,在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句,基于该预测回复语句设置判断条件,所述判断条件用于会话处理。该会话系统开发方法,通过利用回答预测模型可以自动生成多个预测回复语句,相对于需要人工来预测回复语句的方式,该方法不仅减少了人工编写的工作量,且提高了预测的覆盖率,并且该会话系统开发方式在准确度方面可以持续改进。另外,基于预测回复语句设置判断条件,有利于在会话处理阶段,快速地根据用户的实际回复语句进行准确地处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1是一个实施例中会话系统开发方法的流程图;
图2是另一个实施例中会话系统开发方法的流程图;
图3是一个实施例中得到预测回复语句的方法流程图;
图4是另一个实施例中得到预测回复语句的方法流程图;
图5是一个实施例中话题相关性模型的训练方法流程图;
图6是一个实施例中会话系统开发装置的结构框图;
图7是另一个实施例中会话系统开发装置的结构框图;
图8是一个实施例中计算机设备的内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,提出了一种会话系统开发方法,该会话系统开发方法可以应用于终端,本实施例以应用于终端举例说明。该会话系统开发方法具体包括以下步骤:
步骤102,在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句。
其中,回答预测模型用于根据预先设置的语句生成与之对应的预测回复语句。其中,预测回复语句是指根据预先设置的语句预测的用户的回复语句。预先设置的语句可以是开发者根据实际情况设计的语句,也可以是根据实际情况预先通过统计或学习得到的。预先设置的语句可以是一个语句,也可以是一组语句。在一个实施例中,预先设置的话还可能是一个或一组句子模板,中间可以填入一些变量值。将预先设置的语句作为回答预测模型的输入时,可以给模板填入变量后输入模型,也可以直接把句子模板输入模型。
在一个会话应用场景中,会存在很多个节点,每个节点,BOT(机器人)都会说一些话(比如,一句或多句),希望用户回应一些话(比如,一句话),然后BOT再说一些话,用户再回一些话,如此反复。在会话系统开发阶段,目的是可以根据预先设置的话,来预测用户可能会回应哪些话,进而在实际的会话处理中,可以根据用户实际的话,来跳转到下一个节点。
步骤104,基于预测回复语句设置判断条件,判断条件用于会话处理。
其中,基于预测回复语句设置判断条件,判断条件的设置可以是自动设置,也可以是半自动设置,还可以是人工设置。在一个实施例中,可以将预测回复语句作为判断条件,即将获取到的用户的实际回复语句和预测回复语句进行匹配,将匹配到的预测回复语句对应的处理作为该实际回复语句的处理操作。由于同一意思可能有多种表达,所以可以将表达同一意思的多个预设回复语句设为一组,然后每一组对应一个判断条件。举个例子,假设,预测回复语句有3组,那么相应的判断条件有三种,如果是第一种则跳转到a节点进行处理,如果是第二种则跳转到b节点进行处理,如果是第三种则跳转到c节点进行处理。那么当匹配到的预测回复语句为第一种时,则跳转到a节点进行处理。
在另一个实施例中,提取每一预测回复语句的语义信息,然后基于语义信息设置判断条件。由于同一意思有多种表述方法,所以为了更准确地设置判断条件,根据提取到的预测回复语句的语义信息来设置判断条件,同一语义信息对应一个判断条件,当有多个语义信息时,相应设置多个判断条件。
上述会话系统开发方法,在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句,基于该预测回复语句设置判断条件,所述判断条件用于会话处理。该会话系统开发,通过利用回答预测模型可以自动生成多个预测回复语句,大大提高了预测回复语句的生成效率,且相对于需要人工来预测回复语句的方式,该方法大大提高了开发效率,且有利于降低成本。另外,基于预测回复语句设置判断条件,有利于在会话处理阶段,根据用户的实际回复语句更加准确地处理,从而提高用户的满意度。
在一个实施例中,所述基于所述预测回复语句设置判断条件,包括:基于会话系统预设的语义提取模块,提取每个所述预测回复语句的语义信息,根据所述语义信息自动设置或半自动设置判断条件。
其中,语义提取模块用于进行语义信息的提取。语义信息包括:语义关系和语义内容。语义信息往往用来表示用户意图的意图信息。在一个具体的实施例中,意图信息以三元组、三元组的组合、意图三元组或意图三元组的组合形式展示。
自动设置是指计算机根据提取到的语义信息自动设置判断条件,而半自动是指计算机提取到语义信息时,人为辅助设置判断条件。
在一个实施例中,所述语义信息包括三元组或三元组的组合。
其中,三元组指的是(x,y,z)形式下的结构数据,用以标识x、y、z以及对应的关系。在本实施例中,三元组由一个句法/语义关系以及两个概念、实体、词或词组组成。意图三元组为以三元组的形式存储的用户意图,为标识完整意图中的一个小的单元,可以标识为(subject,relation,object),其中,subject为第一实体,relation表示subject和object之间的关系,object表示第二实体。举个例子,比如,为什么她这么开心?采用三元组表示(她,rule-mood-reason,开心)。
如图2所示,在一个实施例中,上述会话系统开发方法还包括:
步骤106,在使用会话系统阶段,获取实际回复语句,判断实际回复语句是否满足判断条件,若是,则根据满足的判断条件进行相应的处理。
其中,在会话系统开发完成之后,在使用会话系统阶段,即在应用阶段,通过获取实际回复语句,然后判断实际回复语句是否满足设置的判断条件,若满足,则根据满足的判断条件进行相应的处理。
在一个实施例中,所述判断条件有N个,N为正整数;所述获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理,包括:当所述实际回复语句满足第M个判断条件时,确定与所述第M个判断条件对应的处理操作,其中,M为小于或等于N的正整数。
其中,由于预测回复语句有多个,基于预测回复语句设置的判断条件也有多个,比如,判断条件为N个,那么判断实际回复语句是否满足判断条件,是指判断实际回复语句是否满足其中一个条件,即有多个判断条件,只要满足一个判断条件即可,假设满足的是第M个判断条件,则确定第M个判断条件对应的处理操作为对应的处理操作。具体的处理操作可以是跳转操作,对应于不同的判断条件,跳转到不同的节点。基于上述设置的判断条件,在实际对话应用中,只需要根据实际回复语句匹配判断条件即可,简单方便,且准确度高。
在一个实施例中,所述获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理,包括:基于语义提取模块提取所述实际回复语句的语义信息,判断所述实际回复语句的语义信息是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理。
其中,语义提取模型用于进行语义的提取,在获取到实际回复语句后,对实际回复语句进行语义信息提取,根据实际回复语句的语义信息来判断是否满足设置的判断条件,因为判断条件设置时是根据预测回复语句的语义信息来设置,且同一意思的表达往往有多种表述方式,所以通过比较实际回复语句的语义信息是否满足判断条件能够更加准确地匹配。
在一个实施例中,所述回答预测模型包括:回复生成模型;所述将预先设置的节点语句作为回答预测模型的输入,获取输出的预测回复语句,包括:将所述预先设置的语句作为回复生成模型的输入,获取输出的多个回复语句,根据所述输出的多个回复语句确定预测回复语句。
其中,回复生成模型用于根据预先设置的语句生成多个回复语句。得到多个回复语句后,可以对多个回复语句进行筛选得到预测回复语句。在一个实施例中,可以针对每个回复语句进行流畅度和内容多样性的评价,得到评价得分。其中,根据评价得分来筛选出预测回复语句,比如,将大于预设分值的回复语句作为预测回复语句,或者将多个回复语句按照得分进行排序,将排在前N个的回复语句作为预测回复语句。
在另一个实施例中,将多个回复语句作为话题相关性模型的输入,获取所述话题相关性模型输出的每个回复语句对应的相关性得分,然后根据每个回复语句对应的相关性得分筛选出预测回复语句。话题相关项模型是预先训练得到的,用于预测回复语句与话题的相关度。上述回答预测模型中包括回复生成模型,该回复生成模型可以根据预先设置的语句生成多个回复语句,相对于传统的扩展语句的方式,该回复生产模型生成多个回复语句的方式更丰富,且有利于提高效率,节约成本。
在一个实施例中,所述根据所述输出的多个回复语句确定预测回复语句,包括:对多个所述回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值;根据所述评价值从所述多个回复语句中筛选出所述预测回复语句。
其中,流畅度是指语句是否能够连接上一句,即上下文的关联度。多样性是指多个回复语句是否具有内容上的多样性,如果几个回复语句虽然都不同,但是表达的意思基本上一致,那么这几个回复语句对应的多样性得分低,反之,如果某个回复语句与其他语句都不同,则该回复语句的对应的多样性得分就会高。根据每个回复语句的流畅度和多样性得到每个回复语句的评价值,按照评价值的高低筛选出预测回复语句。
在一个实施例中,所述回答预测模型还包括:话题相关性模型;所述根据所述输出的多个回复语句确定预测回复语句,包括:将所述多个回复语句作为话题相关性模型的输入,所述话题相关性模型用于对每个回复语句进行评分,根据评分筛选出所述预测回复语句。
其中,话题相关性模型是预先训练得到的用于评价回复语句与相应话题的相关度。在一个实施例中,话题相关性模型可以是只用于预测每个回复语句与话题相关度的评分,然后根据评分来筛选出预测回复语句。在另一个实施例中,话题相关性模型直接根据对每个语句的评分输出合格的预测回复语句。也就是说,筛选的步骤可以在话题相关性模型内部完成,也可以在话题相关性模型外部完成。通过采用话题相关性模型进行筛选可以筛选出更加贴近用户真实回复的回复语句,从而有利于提高预测回复语句的准确度,进而提高会话开发系统的准确度。
如图3所示,在一个实施例中,所述回答预测模型包括:回复生成模型和话题相关性模型;
在所述将所述预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句,包括:
步骤102A,将预先设置的语句作为回复生成模型的输入,获取输出的多个回复语句。
其中,回复生成模型用于根据预先设置的语句生成多个回复语句。
步骤102B,对多个回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值。
其中,通过进行流畅度和多样性评价得到每个回复语句的评价值,评价值的高低代表该回复语句的价值。
步骤102C,根据评价值从多个回复语句中筛选出多个候选回复语句。
其中,根据评价值的高低从多个回复语句中筛选出评价值较高的回复语句作为候选回复语句。具体地,比如,可以挑选从排名前预设个数(比如,前10)的回复语句作为候选回复语句。
步骤102D,将多个候选回复语句作为话题相关性模型的输入,获取话题相关性模型输出的每个候选回复语句对应的评分,根据评分筛选出预测回复语句。
其中,话题相关性模型用于分别对多个候选回复语句进行评分,然后根据评分筛选出预测回复语句。
上述回答预测模型中的回复生成模型和话题相关型模型用来共同筛选出预测回复语句,有利于提高预测回复语句的准确度。
如图4所示,在一个实施例中,所述回答预测模型包括:话题相关性模型;所述将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句,包括:
步骤102a,根据预先设置的语句从对话记录中查找与预先设置的语句对应的多个回复语句;
步骤102b,将多个回复语句作为话题相关性模型的输入,获取话题相关性模型输出的每个回复语句对应的评分,根据评分筛选出预测回复语句。
其中,回答预测模型中只包含有话题相关性模型时,可以先根据预先设置的话语在对话记录中查找对应的多个回复语句,然后基于多个回复语句进行话题相关性的评分,从而筛选得到预测回复语句。
在一个实施例中,所述语义信息包括:语义关系;所述提取每个所述预测回复语句的语义信息,根据所述语义信息设置判断条件,包括:提取每个所述预测回复语句的语义关系,根据所述语义关系设置判断条件。
其中,语义关系是指能够表示句子含义的关系。举个例子,句子为:为什么她会感到难过?相应的语义关系为:采用三元组表示(她,rule-mood-reason,难过)。当然,一个句子中可以包含有多个语义关系,且一对实体之间也可能有多个语义关系。比如,《电影A》的主演和导演都是演员A,相应的语义关系有两个:(电影A,rule-director,演员A),(电影A,rule-lead-actor,演员A),两个三元组,只有关系不一样,词是一样的。
语义信息可以理解为使用多个三元组来表示的句子含义,有些内容是需要推理的。比如“《鲁迅自传》”这几个字,虽然没有明确说这本书的作者是谁,但是它包含了这个信息。可以说,语义信息=多个三元组,这些三元组可以来自于用户输入的字面意思,或者隐含意思。当然,还可以来自会话历史记录,用户个性化信息等等。
在一个实施例中,所述回复生成模型的训练步骤如下:获取会话历史记录;根据所述会话历史记录构建第一目标训练数据,所述第一目标训练数据包括:会话历史和与所述会话历史对应的回复语句;基于所述第一目标训练数据训练得到所述回复生成模型。
其中,会话历史记录是指记录的之前的会话历史,可以理解为之前的聊天记录。根据会话历史记录构建目标训练数据,为了和下面提到的话题相关性模型的训练数据进行区分,这里将回复生成模型的训练数据称为“第一目标训练数据”。第一目标训练数据是由很多组训练数据组成的,每一组数据包括:会话历史+会话历史对应的回复语句。举个例子,假设会话历史记录中有十句话,该十句话是一问一答的形式。假设将第1句话作为会话历史,第2句话就是该会话历史对应的回复语句。将前3句话作为会话历史,第4句话就是该会话历史对应的回复语句,将前5句话作为会话历史,第6句就是该会话历史对应的回复语句,以此类推,所以一个会话历史记录其实可以构成多组训练数据,利用构建的第一目标训练数据进行训练得到回复生成模型。
在一个实施例中,所述根据所述会话历史记录构建第一目标训练数据包括:从所述会话历史记录中提取出每一回复语句对应的会话历史,得到多组训练数据,每一组训练数据包括:会话历史和会话历史对应的回复语句;对所述构建的多组训练数据进行预处理,得到第一目标训练数据,所述预处理包括:去掉非法字符、敏感信息加密以及句子长度标准化中的至少一种。
其中,第一目标训练数据包括多组训练数据,每一组训练数据包括:会话历史以及对应的回复语句。具体构建的方法,可以先确定回复语句,然后只要提取该回复语句之前的会话历史即可得到一组训练数据。获取得到多组训练数据后,为了得到更准确的训练数据,对该训练数据进行预处理,预处理包括:去掉非法字符、敏感信息加密以及句子长度标准化。其中,敏感信息加密是对涉及到个人信息的内容进行加密处理,比如,对姓名、年龄、身高等信息进行加密,加密的方式是按照预设的规则,将涉及到名字、年龄的地方改成设定的标签。比如,涉及到名字的,直接用标签name来替代,不显示用户具体姓名。句子长度标准化是指将太长的句子截短。通过对第一目标训练数据进行预处理有利于提高训练数据的准确度,从而有利于提高训练得到的回复生成模型的准确度。
如图5所示,在一个实施例中,所述话题相关性模型的训练步骤如下:
步骤502,获取多个回复语句。
步骤504,获取对多个回复语句的选择结果,根据多个回复语句的选择结果构建用于训练话题相关性模型的第二目标训练数据。
步骤506,基于第二目标训练数据训练得到话题相关性模型。
其中,话题相关性模型的训练也是先要构建训练数据,其训练数据是由回复语句以及对回复语句的选择得到的。回复语句的获取,有两种方式。在一个实施例中,是根据查找会话记录得到的,根据预先设置的话语在历史会话记录中查找与之对应的回复语句。在另个实施例中,回复语句是通过上述回复生成模型得到的,通过将预先设置的语句作为回复生成模型的输入,得到多个回复语句。
在得到回复语句后,可以由开发人员人工选择与话题锲合度高的回复语句,会话开发系统记录每次开发人员的选择结果,根据该选择结果构建用于训练话题相关性模型的第二目标训练数据。具体地,将开发人员选择的回复语句作为高相关的回复语句,将开发人员没有选择的回复语句默认为低相关的回复语句。
在一个实施例中,所述根据所述多个回复语句的选择结果构建用于训练所述话题相关性模型的第二目标训练数据,包括:确定每个回复语句的选择结果,所述选择结果为选中或未选中;根据每个回复语句和每个回复语句对应的选择结果构建所述第二目标训练数据。
其中,回复语句的选择结果就分为两种,选中以及未选中。将被选中的回复语句默认为高相关的回复语句,将未选中的回复语句作为低相关的回复语句来构建第二目标训练数据。
在一个实施例中,所述回复生成模型生成的回复语句是基于单个字生成的回复语句或者是从指定的句子集中选择的回复语句。
其中,回复生成模型生成的回复语句可以是基于单个字生成的回复语句,比如,以字为单位生成一句话,一个或多个句子合成一个回复语句,也可以是从指定的句子集中选择一句或多句话作为回复语句。
如图6所示,提出了一种会话系统开发装置,包括:
输出模块602,用于在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
设置模块604,用于基于所述预测回复语句设置判断条件,所述判断条件用于会话处理。
在一个实施例中,设置模块还用于基于会话系统预设的语义提取模块,提取每个所述预测回复语句的语义信息,根据所述语义信息自动设置或半自动设置判断条件。
在一个实施例中,所述语义信息包括三元组或三元组的组合。
如图7所示,在一个实施例中,上述会话系统开发装置还包括:
判断模块606,在使用会话系统阶段,获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的所述判断条件进行相应的处理。
在一个实施例中,所述判断条件有N个,N为正整数;判断模块606还用于当所述实际回复语句满足第M个判断条件时,确定与所述第M个判断条件对应的处理操作,其中,M为小于或等于N的正整数。
在一个实施例中,判断模块606还用于基于语义提取模块提取所述实际回复语句的语义信息,判断所述实际回复语句的语义信息是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理。
在一个实施例中,所述回答预测模型包括:回复生成模型;输出模块还用于将所述预先设置的语句作为回复生成模型的输入,获取输出的多个回复语句,根据所述输出的多个回复语句确定预测回复语句。
在一个实施例中,输出模块还用于对多个所述回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值;根据所述评价值从所述多个回复语句中筛选出所述预测回复语句。
在一个实施例中,所述回答预测模型还包括:话题相关性模型;输出模块还用于将所述多个回复语句作为话题相关性模型的输入,所述话题相关性模型用于对每个回复语句进行评分,根据评分筛选出所述预测回复语句。
在一个实施例中,所述回答预测模型包括:回复生成模型和话题相关性模型;
输出模块还用于将预先设置的语句作为所述回复生成模型的输入,获取输出的多个回复语句;对多个所述回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值;根据所述评价值从所述多个回复语句中筛选出多个候选回复语句;将所述多个候选回复语句作为话题相关性模型的输入,获取所述话题相关性模型输出的每个候选回复语句对应的评分,根据所述评分筛选出所述预测回复语句。
在一个实施例中,所述回答预测模型包括:话题相关性模型;输出模块还用于根据所述预先设置的语句从对话记录中查找与所述预先设置的语句对应的多个回复语句;将所述多个回复语句作为话题相关性模型的输入,获取所述话题相关性模型输出的每个回复语句对应的评分,根据所述评分筛选出所述预测回复语句。
在一个实施例中,所述语义信息包括:语义关系;设置模块604还用于提取每个所述预测回复语句的语义关系,根据所述语义关系设置判断条件。
在一个实施例中,上述装置还包括:第一训练模块,用于获取会话历史记录;根据所述会话历史记录构建第一目标训练数据,所述第一目标训练数据包括:会话历史和与所述会话历史对应的回复语句;基于所述第一目标训练数据训练得到所述回复生成模型。
在一个实施例中,第一训练模块还用于从所述会话历史记录中提取出每一回复语句对应的会话历史,得到多组训练数据,每一组训练数据包括:会话历史和会话历史对应的回复语句;对所述构建的多组训练数据进行预处理,得到第一目标训练数据,所述预处理包括:去掉非法字符、敏感信息加密以及句子长度标准化中的至少一种。
在一个实施例中,上述会话系统开发装置包括:第二训练模块,用于获取多个回复语句;获取对所述多个回复语句的选择结果,根据所述多个回复语句的选择结果构建用于训练所述话题相关性模型的第二目标训练数据;基于所述第二目标训练数据训练得到所述话题相关性模型。
在一个实施例中,第二训练模块还用于确定每个回复语句的选择结果,所述选择结果为选中或未选中;根据每个回复语句和每个回复语句对应的选择结果构建所述第二目标训练数据。
在一个实施例中,所述回复生成模型生成的回复语句是基于单个字生成的回复语句或者是从指定的句子集中选择的回复语句。
图8示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图8所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有处理系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述的会话系统开发方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行上述的会话系统开发方法。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述会话系统开发方法的步骤。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述会话系统开发方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种会话系统开发方法,其特征在于,包括:
在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
基于所述预测回复语句设置判断条件,所述判断条件用于会话处理;
其中,所述基于所述预测回复语句设置判断条件,包括:
基于会话系统预设的语义提取模块,提取每个所述预测回复语句的语义信息,根据所述语义信息自动设置或半自动设置判断条件;
所述方法还包括:
在使用会话系统阶段,获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的所述判断条件进行相应的处理;
其中,所述获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理,包括:
基于语义提取模块提取所述实际回复语句的语义信息,判断所述实际回复语句的语义信息是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理;
其中,所述回答预测模型包括:回复生成模型和话题相关性模型;
在所述将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句,包括:
将预先设置的语句作为所述回复生成模型的输入,获取输出的多个回复语句;
对多个所述回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值;
根据所述评价值从所述多个回复语句中筛选出多个候选回复语句;
将所述多个候选回复语句作为话题相关性模型的输入,获取所述话题相关性模型输出的每个候选回复语句对应的评分,根据所述评分筛选出所述预测回复语句。
2.根据权利要求1所述的方法,其特征在于,所述语义信息包括三元组或三元组的组合。
3.根据权利要求1所述的方法,其特征在于,所述判断条件有N个,N为正整数;
所述获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理,包括:
当所述实际回复语句满足第M个判断条件时,确定与所述第M个判断条件对应的处理操作,其中,M为小于或等于N的正整数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述输出的多个回复语句确定预测回复语句,包括:
对多个所述回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值;
根据所述评价值从所述多个回复语句中筛选出所述预测回复语句。
5.根据权利要求1所述的方法,其特征在于,所述回答预测模型还包括:话题相关性模型;所述根据所述输出的多个回复语句确定预测回复语句,包括:
将所述多个回复语句作为话题相关性模型的输入,所述话题相关性模型用于对每个回复语句进行评分,根据评分筛选出所述预测回复语句。
6.根据权利要求1所述的方法,其特征在于,所述回答预测模型包括:话题相关性模型;所述将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句,包括:
根据所述预先设置的语句从对话记录中查找与所述预先设置的语句对应的多个回复语句;
将所述多个回复语句作为话题相关性模型的输入,获取所述话题相关性模型输出的每个回复语句对应的评分,根据所述评分筛选出所述预测回复语句。
7.根据权利要求1所述的方法,其特征在于,所述语义信息包括:语义关系;
所述提取每个所述预测回复语句的语义信息,根据所述语义信息设置判断条件,包括:
提取每个所述预测回复语句的语义关系,根据所述语义关系设置判断条件。
8.根据权利要求1所述的方法,其特征在于,所述回复生成模型的训练步骤如下:
获取会话历史记录;
根据所述会话历史记录构建第一目标训练数据,所述第一目标训练数据包括:会话历史和与所述会话历史对应的回复语句;
基于所述第一目标训练数据训练得到所述回复生成模型。
9.根据权利要求8所述的方法,其特征在于,所述根据所述会话历史记录构建第一目标训练数据包括:
从所述会话历史记录中提取出每一回复语句对应的会话历史,得到多组训练数据,每一组训练数据包括:会话历史和会话历史对应的回复语句;
对所述多组训练数据进行预处理,得到第一目标训练数据,所述预处理包括:去掉非法字符、敏感信息加密以及句子长度标准化中的至少一种。
10.根据权利要求1所述的方法,其特征在于,所述话题相关性模型的训练步骤如下:
获取多个回复语句;
获取对所述多个回复语句的选择结果,根据所述多个回复语句的选择结果构建用于训练所述话题相关性模型的第二目标训练数据;
基于所述第二目标训练数据训练得到所述话题相关性模型。
11.根据权利要求10所述的方法,其特征在于,所述根据所述多个回复语句的选择结果构建用于训练所述话题相关性模型的第二目标训练数据,包括:
确定每个回复语句的选择结果,所述选择结果为选中或未选中;
根据每个回复语句和每个回复语句对应的选择结果构建所述第二目标训练数据。
12.根据权利要求1所述的方法,其特征在于,所述回复生成模型生成的回复语句是基于单个字生成的回复语句或者是从指定的句子集中选择的回复语句。
13.一种会话系统开发装置,其特征在于,包括:
输出模块,用于在会话系统开发阶段,将预先设置的语句作为回答预测模型的输入,获取输出的预测回复语句;
设置模块,用于基于所述预测回复语句设置判断条件,所述判断条件用于会话处理;
所述设置模块还用于基于会话系统预设的语义提取模块,提取每个所述预测回复语句的语义信息,根据所述语义信息自动设置或半自动设置判断条件;
判断模块,用于在使用会话系统阶段,获取实际回复语句,判断所述实际回复语句是否满足所述判断条件,若是,则根据满足的所述判断条件进行相应的处理;
判断模块,还用于基于语义提取模块提取所述实际回复语句的语义信息,判断所述实际回复语句的语义信息是否满足所述判断条件,若是,则根据满足的判断条件进行相应的处理;
其中,所述回答预测模型包括:回复生成模型和话题相关性模型;
所述输出模块还用于将预先设置的语句作为所述回复生成模型的输入,获取输出的多个回复语句;
对多个所述回复语句进行流畅度和多样性评价,得到每个回复语句对应的评价值;
根据所述评价值从所述多个回复语句中筛选出多个候选回复语句;
将所述多个候选回复语句作为话题相关性模型的输入,获取所述话题相关性模型输出的每个候选回复语句对应的评分,根据所述评分筛选出所述预测回复语句。
14.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述的会话系统开发方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述的会话系统开发方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110166155.2A CN112905763B (zh) | 2021-02-03 | 2021-02-03 | 会话系统开发方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110166155.2A CN112905763B (zh) | 2021-02-03 | 2021-02-03 | 会话系统开发方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112905763A CN112905763A (zh) | 2021-06-04 |
CN112905763B true CN112905763B (zh) | 2023-10-24 |
Family
ID=76123490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110166155.2A Active CN112905763B (zh) | 2021-02-03 | 2021-02-03 | 会话系统开发方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112905763B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779214B (zh) * | 2021-08-17 | 2022-10-18 | 深圳市人马互动科技有限公司 | 跳转条件的自动生成方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002169804A (ja) * | 2000-12-01 | 2002-06-14 | Namco Ltd | 模擬会話システム、模擬会話方法、および情報記憶媒体 |
WO2018036555A1 (zh) * | 2016-08-25 | 2018-03-01 | 腾讯科技(深圳)有限公司 | 会话处理方法及装置 |
CN108170749A (zh) * | 2017-12-21 | 2018-06-15 | 北京百度网讯科技有限公司 | 基于人工智能的对话方法、装置及计算机可读介质 |
CN110489519A (zh) * | 2019-07-05 | 2019-11-22 | 深圳追一科技有限公司 | 基于会话预测模型的会话方法及相关产品 |
CN111611365A (zh) * | 2020-05-19 | 2020-09-01 | 上海鸿翼软件技术股份有限公司 | 一种对话系统的流程控制方法、装置、设备及存储介质 |
CN112131367A (zh) * | 2020-09-24 | 2020-12-25 | 民生科技有限责任公司 | 自审核的人机对话方法、系统及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4888996B2 (ja) * | 2005-10-21 | 2012-02-29 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
-
2021
- 2021-02-03 CN CN202110166155.2A patent/CN112905763B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002169804A (ja) * | 2000-12-01 | 2002-06-14 | Namco Ltd | 模擬会話システム、模擬会話方法、および情報記憶媒体 |
WO2018036555A1 (zh) * | 2016-08-25 | 2018-03-01 | 腾讯科技(深圳)有限公司 | 会话处理方法及装置 |
CN108170749A (zh) * | 2017-12-21 | 2018-06-15 | 北京百度网讯科技有限公司 | 基于人工智能的对话方法、装置及计算机可读介质 |
CN110489519A (zh) * | 2019-07-05 | 2019-11-22 | 深圳追一科技有限公司 | 基于会话预测模型的会话方法及相关产品 |
CN111611365A (zh) * | 2020-05-19 | 2020-09-01 | 上海鸿翼软件技术股份有限公司 | 一种对话系统的流程控制方法、装置、设备及存储介质 |
CN112131367A (zh) * | 2020-09-24 | 2020-12-25 | 民生科技有限责任公司 | 自审核的人机对话方法、系统及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112905763A (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377632B (zh) | 诉讼结果预测方法、装置、计算机设备和存储介质 | |
CN109815491B (zh) | 答题评分方法、装置、计算机设备及存储介质 | |
CN112328762A (zh) | 基于文本生成模型的问答语料生成方法和装置 | |
CN109902301B (zh) | 基于深度神经网络的关系推理方法、装置及设备 | |
CN109543007A (zh) | 提问数据生成方法、装置、计算机设备和存储介质 | |
CN109829629A (zh) | 风险分析报告的生成方法、装置、计算机设备和存储介质 | |
US20150379087A1 (en) | Apparatus and method for replying to query | |
CN110569356A (zh) | 基于智能面试交互系统的面试方法、装置和计算机设备 | |
CN111324713A (zh) | 对话自动回复方法、装置、存储介质和计算机设备 | |
CN115309910B (zh) | 语篇要素和要素关系联合抽取方法、知识图谱构建方法 | |
CN114218379A (zh) | 一种面向智能问答系统的无法回答问题的归因方法 | |
KR20210095609A (ko) | 회의록 열람 문서 생성 방법 및 그 장치 | |
CN112905763B (zh) | 会话系统开发方法、装置、计算机设备及存储介质 | |
CN110362798B (zh) | 裁决信息检索分析方法、装置、计算机设备和存储介质 | |
CN113779214B (zh) | 跳转条件的自动生成方法、装置、计算机设备及存储介质 | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN112667791A (zh) | 潜在事件预测方法、装置、设备及存储介质 | |
CN112069818A (zh) | 三元组预测模型生成方法、关系三元组提取方法和装置 | |
CN111538898B (zh) | 基于组合特征提取的Web服务包推荐方法及系统 | |
CN114328895A (zh) | 新闻摘要的生成方法、装置以及计算机设备 | |
CN112580365A (zh) | 篇章解析方法及电子设备、存储装置 | |
CN113408263A (zh) | 刑期预测方法、装置、存储介质及电子设备 | |
Bernal et al. | Saber Pro success prediction model using decision tree based learning | |
CN112989042B (zh) | 热点话题的提取方法、装置、计算机设备及存储介质 | |
KR102550790B1 (ko) | 온라인 입시 컨설팅과 학습 관리 플랫폼 시스템, 이에 포함되는 운영 서버 및 운영 서버의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |