CN116467421A - 多轮对话方法、装置、电子设备、存储介质和程序产品 - Google Patents
多轮对话方法、装置、电子设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN116467421A CN116467421A CN202310453287.2A CN202310453287A CN116467421A CN 116467421 A CN116467421 A CN 116467421A CN 202310453287 A CN202310453287 A CN 202310453287A CN 116467421 A CN116467421 A CN 116467421A
- Authority
- CN
- China
- Prior art keywords
- user
- language information
- input
- slots
- slot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 230000004044 response Effects 0.000 claims abstract description 22
- 238000004590 computer program Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 10
- 238000012790 confirmation Methods 0.000 claims description 5
- 238000012015 optical character recognition Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 19
- 238000010586 diagram Methods 0.000 description 11
- 230000015654 memory Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 235000013361 beverage Nutrition 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
Abstract
本公开提供了一种多轮对话方法,可用数据处理技术领域或金融领域,该方法包括:获取用户的第一输入语言信息,确定第一用户意图;根据第一用户意图确定M个槽位;根据M个槽位中的至少一个槽位,生成询问指令;根据用户输入的第二输入语言信息,确定用于填充至M个槽位的至少一个槽值;根据第一输入语言信息和第二输入语言信息,确定M个槽位中的未填充槽位;根据每次更新后的询问指令执行多轮对话的至少一轮,判断与第一用户意图相关联的M个槽位的槽值是否完全填充;响应与第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。还提供了一种多轮对话装置、电子设备、存储介质和程序产品。
Description
技术领域
本公开涉及数据处理技术领域,更具体地,涉及一种多轮对话方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
自然语言处理(NLP,Natural Language Processing)是使用自然语言同计算机进行通讯的技术。因为处理自然语言的关键是要让计算机理解自然语言,所以自然语言处理又叫做自然语言理解(NLU,Natural Language Understanding)。
在相关技术中,一般采用FAQ检索式问答系统,通过文本相似度计算方法,将用户输入的问题与知识库中的问题相匹配,找到与用户所提问题最相似、最接近的标准问题,并检索标准问题的对应答案回应给用户。此外还有单轮对话的问答系统是基于知识图谱实现的,需要了解客户的需求,构建企业的知识图谱。上述的技术中,采用FAQ的问答系统,无法有效提供给客户准确的答案,效率较低。而单轮对话系统中,无法结合上下文语境,处理的业务有限,并且需要客户针对问题进行详尽描述,无法满足快速准确的为用户提供预期的服务。
发明内容
鉴于上述问题,本公开提供了多轮对话方法、装置、电子设备、可读存储介质及计算机程序产品,可以实现多轮对话,准确获取用户意图,并根据用户意图生成输出信息,完成智能对话,提高信息处理的效率和灵活性。
本公开的一个方面提供了一种多轮对话方法,包括但不限于:获取用户的第一输入语言信息,确定与所述第一输入语言信息关联的第一用户意图;根据所述第一用户意图确定与所述第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数;根据所述M个槽位中的至少一个槽位,生成询问指令;根据用户输入的第二输入语言信息,确定用于填充至所述M个槽位的至少一个槽值,所述第二输入语言信息与所述询问指令相关联;根据所述第一输入语言信息和所述第二输入语言信息,确定M个槽位中的未填充槽位,所述未填充槽位用于更新所述询问指令;根据每次更新后的所述询问指令执行多轮对话的至少一轮,判断与所述第一用户意图相关联的M个槽位的槽值是否完全填充;响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。
在本公开的一些示例性实施例中,所述的方法还包括:基于所述询问指令,接收用户输入的语言信息;将与所述询问指令相关联的语言信息确定为第二输入语言信息。
在本公开的一些示例性实施例中,根据所述第一输入语言信息和所述第二输入语言信息,确定M个槽位中的未填充槽位,包括:根据第-输入语言信息中包括的至少一个第一槽值,确定至少一个第一槽位;根据第二输入语言信息中包括的至少一个第二槽值,确定至少一个第二槽位;以及根据所述M个槽位、所述第一槽位和所述第二槽位,确定未填充槽位。
在本公开的一些示例性实施例中,所述的方法还包括:在根据每次更新后的所述询问指令执行多轮对话的至少一轮之前,根据所述第一用户意图、第一输入语言信息、第二语言输入信息以及所述未填充槽位更新所述询问指令。
在本公开的一些示例性实施例中,响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息,包括:响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,根据所述M个槽位以及填充至所述M个槽位的槽值,生成槽位槽值对;根据所述第一用户意图、所述槽位槽值对生成服务调用指令;基于所述服务调用指令的响应结果,生成与所述第一输入语言信息相关的第一输出语言信息。
在本公开的一些示例性实施例中,获取用户的第一输入语言信息包括:接收用户输入的文本;接收用户输入的语音,将所述语音转化为文本;和/或接收用户输入的图像,通过光学字符识别将所述图像转化为文本;将所述文本确定为第一输入语言信息。
在本公开的一些示例性实施例中,所述的方法还包括:判断用户输入的语言信息中是否包括第二用户意图,若用户输入的语言信息中包括第二用户意图,生成第一用户意图结束指令;响应第一用户意图结束指令的确认操作,将包括第二用户意图的语言信息作为新的第一输入语言信息。
在本公开的一些示例性实施例中,获取用户的第一输入语言信息,确定与所述第一输入语言信息关联的第一用户意图包括:获取用户的第一输入语言信息,根据自然语言理解模块确定用户的潜在意图,所述自然语言理解模块是根据用户与人工客服的对话内容训练得到的;以及根据第一输入语言信息包括的上下文信息以及所述潜在意图,确定与所述第一输入语言信息关联的第一用户意图。
本公开的另一方面提供给了一种多轮对话装置,包括但不限于:第一模块,配置为获取用户的第一输入语言信息,确定与所述第一输入语言信息关联的第一用户意图;第二模块,配置为根据所述第一用户意图确定与所述第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数;第三模块,配置为根据所述M个槽位中的至少一个槽位,生成询问指令;第四模块,配置为根据用户输入的第二输入语言信息,确定用于填充至所述M个槽位的至少一个槽值,所述第二输入语言信息与所述询问指令相关联;第五模块,配置为根据所述第一输入语言信息和所述第二输入语言信息,确定M个槽位中的未填充槽位,所述未填充槽位用于更新所述询问指令;第六模块,配置为根据每次更新后的所述询问指令执行多轮对话的至少一轮,判断与所述第一用户意图相关联的M个槽位的槽值是否完全填充;第七模块,配置为响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。
在本公开的一些示例性实施例中,所述的多轮对话装置还包括确定模块,所述确定模块配置为:基于所述询问指令,接收用户输入的语言信息;将与所述询问指令相关联的语言信息确定为第二输入语言信息。
在本公开的一些示例性实施例中,第五模块还被配置为:根据第一输入语言信息中包括的至少一个第一槽值,确定至少一个第一槽位;根据第二输入语言信息中包括的至少一个第二槽值,确定至少一个第二槽位;以及根据所述M个槽位、所述第一槽位和所述第二槽位,确定未填充槽位。
在本公开的一些示例性实施例中,所述的多轮对话装置还包括更新模块,所述更新模块被配置为:在根据每次更新后的所述询问指令执行多轮对话的至少一轮之前,根据所述第一用户意图、第一输入语言信息、第二语言输入信息以及所述未填充槽位更新所述询问指令。
在本公开的一些示例性实施例中,所述第七模块还被配置为:响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,根据所述M个槽位以及填充至所述M个槽位的槽值,生成槽位槽值对;根据所述第一用户意图、所述槽位槽值对生成服务调用指令;基于所述服务调用指令的响应结果,生成与所述第一输入语言信息相关的第一输出语言信息。
在本公开的一些示例性实施例中,第一模块包括获取单元,所述获取单元被配置为:接收用户输入的文本;接收用户输入的语音,将所述语音转化为文本;和/或接收用户输入的图像,通过光学字符识别将所述图像转化为文本;将所述文本确定为第一输入语言信息。
在本公开的一些示例性实施例中,所述多轮对话装置还包括响应模块,所述响应模块被配置为:判断用户输入的语言信息中是否包括第二用户意图,若用户输入的语言信息中包括第二用户意图,生成第一用户意图结束指令;响应第一用户意图结束指令的确认操作,将包括第二用户意图的语言信息作为新的第一输入语言信息。
在本公开的一些示例性实施例中,所述第一模块还被配置为:获取用户的第一输入语言信息,根据自然语言理解模块确定用户的潜在意图,所述自然语言理解模块是根据用户与人工客服的对话内容训练得到的;以及根据第一输入语言信息包括的上下文信息以及所述潜在意图,确定与所述第一输入语言信息关联的第一用户意图。
本公开的另一方面提供了一种电子设备,包括一个或多个处理器以及存储装置,其中,存储装置用于存储可执行指令,可执行指令在被处理器执行时,实现如上的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,指令在被执行时用于实现如上的方法。
本公开的另一方面提供了一种计算机程序,计算机程序包括计算机可执行指令,指令在被执行时用于实现如上的方法。
根据本公开的实施例,通过根据用户的第一输入语言信息确定第一用户意图和M个槽位,并根据槽位中的至少一个生成询问指令,以保持与用户对话的连贯性,从而有效获取与第一用户意图相关的槽值信息,通过用户输入的第一输入语言信息和第二输入语言信息来确定未填充槽位以及更新询问指令,直至M个槽位完全填充,并生成第一输出语言信息,通过多轮对话的方法输出针对用户的第一用户意图的第一输出信息,提高输出信息的准确性,同时采用根据每次更新后的询问指令执行多轮对话的至少一轮,以提高多轮对话的效率。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开实施例的多轮对话方法的系统架构的示意图;
图2示意性示出了根据本公开实施例的多轮对话方法的流程图;
图3示意性示出了根据本公开实施例的多轮对话方法中获取用户的第一输入语言信息的流程图;
图4示意性示出了根据本公开实施例的多轮对话方法在操作S210中的流程图;
图5示意性示出了根据本公开实施例的多轮对话方法还包括的流程图;
图6示意性示出了根据本公开实施例的多轮对话方法在操作S250中的流程图;
图7示意性示出了根据本公开实施例的多轮对话方法在操作S260之前的流程图;
图8示意性示出了根据本公开实施例的多轮对话方法在操作S270的流程图;
图9示意性示出了根据本公开实施例的多轮对话方法还包括的另一流程图;
图10示意性示出了根据本公开实施例的多轮对话装置的方框图;以及
图11示意性示出了根据本公开实施例的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。
在本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等操作,均获得了用户的授权。
在本文中,术语“第一输入语言信息”、“第二输入语言信息”例如是指自然发展而来,经过长期使用和演化的语言,能够被自然人所理解的语言,例如英语、汉语、俄语等语言。第一输入语言信息例如可以是在第一时刻输入的语言信息,第二输入语言信息例如可以是在第一时刻之后输入的一个或多个语言信息。在本文中,第一输入语言信息和第二输入语言信息例如可以是被自然语言理解模块进行识别的输入。
在本文中,术语“自然语言理解模块”例如是具有意图分类和槽填充的联合模型(BERT+Bi-LSTM+CRF模型)经过训练得到的,经训练后,可以对用户输入的文本语言进行识别解析,实现序列标注,并转换成计算机可理解的“用户意图和槽值”的语句表示。
在本文中,术语“询问指令”例如可以是根据已填充槽位、未填充槽位、用户意图等一个或多个内容生成的自然语言的指令,该询问指令可以被用户所理解,用户根据该询问语句输入语言信息。
现有的一些技术中,针对用户输入的咨询信息等内容,一般采用如下的方法实现针对客户咨询信息的回答,包括采用FAQ检索式问答系统,通过基于业界常见问题FAQ的知识库,知识库是标准的问题与答案的集合。FAQ检索式问答系统的一种做法是系统通过文本相似度计算方法,将用户输入的问题与知识库中的问题相匹配,找到与用户所提问题最相似、最接近的标准问题,并检索标准问题的对应答案回应给用户。另一种做法是,直接计算用户问题与知识库中答案的相似度,将相似度最高的答案返回给用户。所用技术为文本匹配计算,如:BM25、Jaccord、SimHash、Levenshtein、VSM算法等。此方案的问题在于,当用户提供的信息较少时,无法准确针对用户咨询信息进行准确回答,从而导致效率较低。此外,现有的技术中,针对用户输入的咨询信息等内容,也有基于单轮对话设计和流程实现针对咨询信息的回答,然而单轮对话无法结合上下文语境的对话,能处理的业务有限,对话效率低,并且无法准确定位客户的问题,在用户进行咨询时,需要输入尽量多的咨询信息,导致效率较低,并且准确率也较低,无法快速准确提供用户想要的答案。
为了解决上述的问题,本公开的实施例提供了多轮对话方法、装置、电子设备、可读存储介质及计算机程序产品,可以通过多轮对话的方法确定用户意图以及引导用户输入与用户意图相关的槽值,可以有效提高对话系统的准确率和效率,提高用户的满意度。本公开的多轮对话方法包括但不限于:获取用户的第一输入语言信息,确定与第一输入语言信息关联的第一用户意图;根据第一用户意图确定与第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数;根据M个槽位中的至少一个槽位,生成询问指令;根据用户输入的第二输入语言信息,确定用于填充至M个槽位的至少一个槽值,第二输入语言信息与询问指令相关联;根据第一输入语言信息和第二输入语言信息,确定M个槽位中的未填充槽位,未填充槽位用于更新询问指令;根据每次更新后的询问指令执行多轮对话的至少一轮,判断与第一用户意图相关联的M个槽位的槽值是否完全填充;响应与第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。
根据本公开的实施例,通过根据用户的第一输入语言信息确定第一用户意图和M个槽位,并根据槽位中的至少一个生成询问指令,以保持与用户对话的连贯性,从而有效获取与第一用户意图相关的槽值信息,通过用户输入的第一输入语言信息和第二输入语言信息来确定未填充槽位以及更新询问指令,直至M个槽位完全填充,并生成第一输出语言信息,通过多轮对话的方法输出针对用户的第一用户意图的第一输出信息,提高输出信息的准确性,同时采用根据每次更新后的询问指令执行多轮对话的至少一轮,以提高多轮对话的效率。采用本公开实施例的多轮对话方法,可以实现对负责对话场景的支持,通过准确定位用户意图以及输出客户需要的信息,提高用户满意度。
图1示意性示出了可以应用本公开实施例的多轮对话方法的系统架构的示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。需要说明的是,本公开实施例提供的多轮对话方法可用于数据处理技术领域、金融领域在数据处理的相关方面,也可用于除金融领域之外的任意领域,本公开实施例提供的多轮对话方法和装置对应用领域不做限定。
如图1所示,可以应用多轮对话方法的示例性系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如邮件客户端应用、文件处理类应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持数据输入、文件发送、数据分析、数据处理、网页浏览等功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所获取的数据或浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。也可以是对用户发送的文件等进行分析或处理,并基于处理结果对终端设备进行控制等,例如限制终端设备的访问等。
需要说明的是,本公开实施例所提供的多轮对话方法一般可以由服务器105执行。相应地,本公开实施例所提供的多轮对话装置一般可以设置于服务器105中。本公开实施例所提供的多轮对话方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的多轮对话装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将通过图2至图9对公开实施例的多轮对话方法进行详细描述。
图2示意性示出了根据本公开实施例的多轮对话方法的流程图。
如图2所示,本公开的多轮对话方法的流程200包括操作S210至操作S270。
在操作S210中,获取用户的第一输入语言信息,确定与第一输入语言信息关联的第一用户意图。
示例性地,用户在进行咨询时,输入要咨询的内容,该内容经过处理最终转化为第一输入语言信息,第一输入语言信息为可以被计算机识别并进行处理的文本信息。例如,用户输入的内容包括语音、文字、图片中的一个或多个。
在本公开的一些实施例中,在获取了用户的第一输入语言信息后,可以通过对该第一输入语言信息进行处理,例如包括分词、词性标注、实体识别等,以更好的理解用户的输入。在对第一输入语言信息处理后,进一步通过自然语言理解模型准确确定用户意图,即确定与第一输入语言信息关联的第一用户意图。对于操作S210的具体流程,将在下文进行具体描述。
根据操作S210,可以准确的确定用户意图,便于在后续操作中更好地为用户提供服务和响应,提高人机交互的效率和准确性。
在操作S220中,根据第一用户意图确定与第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数。
在本公开的一些实施例中,在确定第一用户意图后,进一步确定与第一用户意图相关的槽位。与一个用户意图相关联的槽位可以是一个或多个,例如确定的用户意图是购买饮料,则饮料类型可以确定为一个槽位,饮料品牌可以确定为另一个槽位。每个槽位可以用于填充对应的槽值,例如饮料类型中可以填充的槽值包括咖啡、牛奶等,饮料品牌可以确定的槽值包括品牌A、品牌B等。
示例性地,通过第一用户意图确定相关联的M个槽位,例如可以是基于规则的方法确定M个槽位,如事先定义一些规则,根据确定的第一用户意图匹配相应的规则,并根据规则提取对应的槽位信息。又例如,基于统计的方法确定M个槽位,如利用机器学习技术,训练分类器,根据确定的第一用户意图从已知的语料库中标注数据统计该用户意图下的常用槽位。又例如,结合上述的规则方法以及统计方法,结合人工经验和自动化模型,确定与第一用户意图相关联的槽位,进一步提高用户意图的槽位的准确定。
在操作S230中,根据M个槽位中的至少一个槽位,生成询问指令。
在本公开的一些示例性实施例中,M个槽位是与确定的第一用户意图相关联的。从M个槽位中选择一个或多个槽位生成询问指令,从而便于后续过程中针对确定的第一用户意图生成输出信息,以满足用户的咨询。
示例性地,当确定的第一用户意图为汇率查询时,则根据该第一用户意图确定的槽位包括第一币种、第二币种、时间3个槽位,则可以选择上述3个槽位中的一个或多个,结合自然语言生成技术,生成询问指令。例如生成的询问指令可以是“请输入需要查询的第一币种和第二币种”、“请输入需要查询的汇率的时间”或者“请输入需要查询的币种以及时间”等。
通过操作S230,可以实验对用户的正确引导,帮助用户提供更准确和完整的信息,从而提高对话的效率和质量。
在操作S240中,根据用户输入的第二输入语言信息,确定用于填充至M个槽位的至少一个槽值,第二输入语言信息与询问指令相关联。
在本公开的一些实施例中,第二输入语言信息是指用户输入的语言信息中与询问指令相关联的内容。例如,用户输入的语言信息中与询问指令不相关联,则不作为第二输入语言信息。
示例性地,若多轮对话系统生成询问指令后,用户基于询问指令输入语言信息,则将该输入作为第二输入语言信息。例如,询问指令为“请输入需要查询的汇率的时间”,用户输入的内容为“查询AA年BB月CC日的汇率”,则可以确定用户输入的内容为与查询指令相关联的第二输入语言信息。若用户在询问指令之后输入的内容为“查询余额”,则用户输入的该语言信息不作为第二输入语言信息。
在本公开的一些实施例中,根据第二输入语言信息,确定槽值,该槽值用于填充至M个槽位中。例如,询问指令为“请输入需要查询的汇率的时间”,用户输入的内容为“查询AA年BB月CC日的汇率”,则将“AA年BB月CC日”作为时间槽位中的槽值,并最终填充至时间槽位中。如上文所述,通过第二输入语言信息确定的槽值更加准确,可以防止其他无关内容的干扰。
根据操作S240,通过将第二输入语言信息与询问指令相关联,同时根据第二语言输入信息来确定填充至M个槽位中的至少一个槽值,可以有效防止用户在多轮对话中输入其他的无关内容对确定第一用户意图的槽位对应的槽值造成的干扰。
在操作S250中,根据第一输入语言信息和第二输入语言信息,确定M个槽位中的未填充槽位,未填充槽位用于更新询问指令。
在本公开的实施例中,第一输入语言信息中包括第一用户意图,还包括除第一用户意图之外的其他信息,例如包括与第一用户意图的相关联的槽位的一个或多个槽值。根据操作S240,从第二输入语言信息中确定一个或多个槽值。此时,若M个槽位中的槽值未被全部填充,则确定M个槽位中的未填充槽位,并根据未填充槽位更新询问指令,有效减少用户需要输入的信息量,快速准确的获取第一用户意图所需的槽值,提高对话的效率。
例如,第一输入语言信息为“查询美元的汇率”,根据操作S210确定用户意图为“查询汇率”,根据操作S220确定的M个槽位包括第一币种、第二币种、时间。根据第一输入语言信息确定M个槽位中填充的第一币种槽位的槽值为美元,第二输入语言信息为“2020年11月08日的汇率”,根据第二输入语言信息确定M个槽位中填充的时间槽位的槽值为2020年11月08日。则可以确定M个槽位中未填充的槽位为第二币种对应的槽位。则根据第二币种对应的槽位更新询问指令,例如更新后的询问指令为“请输入第二币种,以更准确的查询汇率”。
根据操作S250,可以更准确的理解用户意图,通过基于未填充槽位,更新询问指令,可以极大地提高对话的流畅性和准确性,减少用户需要输入的信息量,提高对话效率,同时提高用户满意度。
在操作S260中,根据每次更新后的询问指令执行多轮对话的至少一轮,判断与第一用户意图相关联的M个槽位的槽值是否完全填充。
在本公开的实施例中,第二输入语言信息例如可以是一次性输入多个内容,也可以是在多轮对话中分别输入的内容,第二输入语言信息中可以包括一个或多个用于填充至M各槽位的槽值。当第一用户意图的槽位较多时,则获取该槽位的对应槽值可以是经过多轮对话实现。每执行一轮对话,则对M各槽位的槽值进行判断,若未完全填充,则基于未填充的槽位更新询问指令,使用户可以根据更新后的询问指令准确的输入槽位需要的槽值,直至槽位所需的槽值完全填充。
在操作S260中,通过更新后的询问指令执行多轮对话中的至少一轮,可以在多轮对话中,更全面地了解用户需求和用户意图,逐步提高交互的精度和质量。此外,可以减少用户的重复提问,降低交互成本,提高多轮对话的智能化程度。
在操作S270中,响应与第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。
当第一用户意图相关联的槽位的槽值完全填充时,表明已经完全确定用户的意图以及用户想要知晓的内容,此时可以采用调用与上述确定的内容对应的服务器,并针对服务器中调取的信息进行处理,生成用户可以识别理解的自然语言或者其他内容,以向用户展示。
根据操作S270,可以提高多轮对话的效率和准确性,增强用户体验。
图3示意性示出了根据本公开实施例的多轮对话方法中获取用户的第一输入语言信息的流程图。
如图3所示,在本公开的一些实施例中,获取用户的第一输入语言信息的流程300包括操作S310、S320、S330以及S340。
在操作S310中,接收用户输入的文本。
在操作S320中,接收用户输入的语音,将语音转化为文本。
在操作S330中,接收用户输入的图像,通过光学字符识别将图像转化为文本。
在操作S340中,将文本确定为第一输入语言信息。
其中,操作S310、S320、S330可以是同步执行,也可以是择一执行,或者混合执行。并且操作S310、S320、S330的执行顺序没有限定。即用户可以通过文本输入,语音输入或者图像输入。在操作S340中,将输入的内容转化为第一输入语言信息,该第一语言输入信息可以被自然人理解,并且可以被自然语言理解模块识别。
图4示意性示出了根据本公开实施例的多轮对话方法在操作S210中的流程图。
如图4所示,操作S210例如可以包括操作S211至操作S212。
在操作S211中,获取用户的第一输入语言信息,根据自然语言理解模块确定用户的潜在意图,自然语言理解模块是根据用户与人工客服的对话内容训练得到的。
在本公开的一些实施例中,通过对自然语言理解模块进行训练,以使自然语言理解模块在处理用户输入的语言信息时,能够更准确的识别用户的意图以及针对意图进行分类,为后续的多轮对话方法提高较高的处理效率以及较准确的处理结果。根据用户与人工客户的对话内容生成的训练集和验证集,对自然语言理解模块进行训练,从而得到能够处理该场景下的对话,通过上述的训练数据训练自然语言理解模块,能够得到等价准确的处理结果。
示例性地,由于用户输入的第一输入语言信息中可能存在一个或多个用户意图,即确定用户的潜在意图,通过自然语言理解模块,可以对第一输入语言信息所包含的多个潜在意图进行分类。
根据操作S210,可以实现在后续的操作流程中更准确地理解用户的意图,提高自然语言理解的准确率。
在操作S2 12中,根据第一输入语言信息包括的上下文信息以及潜在意图,确定与第一输入语言信息关联的第一用户意图。
示例性地,第一输入语言信息中还包括上下文信息,根据上下文信息以及潜在意图,从多个潜在意图中确定第一用户意图,即结合上下文进一步从多个潜在意图中确定用户的真实意图,即确定第一用户意图。由此,可以准确识别用户的真实意图,便于在后续多轮对话中针对用户的真实意图获取槽位对应的槽值。
例如,在智能客服机器人为银行用户提供服务时,用户的第一输入语言信息为“咨询如何将取款的现金转账给其他用户”,则可以判断潜在用户意图包括“取款”以及“转账”。结合第一输入语言信息包括的上下文信息,可以确定用户的真实意图为“转账”。
根据操作S212,通过结合第一输入语言信息包括的上下文信息,来确定用户的第一用户意图(即真实意图),从而减少其他潜在意图的干扰,更加准确的为用户提供基于第一用户意图而生成的询问语句以及获取与第一用户意图相关联的槽位对应的槽值,提高多轮对话的准确率以及效率。
图5示意性示出了根据本公开实施例的多轮对话方法还包括的流程图。
如图5所示,多轮对话方法还包括流程400。流程400可以包括操作S410至操作S420。
在操作S410中,基于询问指令,接收用户输入的语言信息。
通过向用户显示询问指令,用户在阅读或接收到询问指令后的设定时间段内先输入语言信息,则将该语言信息确定为基于询问指令输入的语言信息,若在设定时间段外输入的语言信息,可以不作为用户输入的语言信息,可以直接定义为干扰信息或其他无关信息。
在操作S420中,将与询问指令相关联的语言信息确定为第二输入语言信息。
示例性地,询问指令中例如可以包含有第一用户意图,或者与第一用户意图关联且未被填充槽值的槽位,输入的语言信息中例如也可以包含有第一用户意图,或者槽值,该槽值与第一用户意图关联且未被填充槽值的槽位对应,则将语言信息确定为第二输入语言信息。
根据本公开的实施例,通过流程400可以围绕确定的第一用户意图进行多轮对话,直至对话结束,有效防止因其他无关内容干扰,或其他用户意图插入导致的获取的槽值数据不准确的问题。例如,当用户输入多个语言信息时,当语言信息中不包括与询问指令相关联的内容,则不进行处理,可以降低数据处理量,同时仅对与询问指令相关联的语言信息进行处理,可以提高槽值获取的准确率。
图6示意性示出了根据本公开实施例的多轮对话方法在操作S250中的流程图。
如图6所示,操作S250可以包括操作S251至操作S253。
在操作S251中,根据第一输入语言信息中包括的至少一个第一槽值,确定至少一个第一槽位。
在本公开的一些实施例中,第一输入语言信息中包括有第一用户意图以及与第一用户意图相关联的槽位(即第一槽位)对应的槽值(即第一槽值)。第一输入语言信息中也可以包括多个第一槽值以及多个第一槽位。
在操作S252中,根据第二输入语言信息中包括的至少一个第二槽值,确定至少一个第二槽位。
在本公开的一些实施例中,第二输入语言信息中可以包括有一个或多个与第二槽位对应的第二槽值,第二槽值可以填充至第二槽位中。
在操作S253中,根据M个槽位、第一槽位和第二槽位,确定未填充槽位。
在本公开的一些实施例中,M个槽位由第一槽位、第二槽位以及未填充的槽位组成,由此,通过将M个槽位中的第一槽位、第二槽位去除后,可以确定未填充槽位。
在操作S253后续的操作中,通过基于未填充槽位更新询问指令,从而更快更准确的获取用于填充至第一用户意图关联的槽位的槽值,可以提高多轮对话的准确度和对话效率。
图7示意性示出了根据本公开实施例的多轮对话方法在操作S260之前的流程图。
如图7所示,本公开实施例的多轮对话方法在操作S260之前还包括操作S500。
在操作S500中,在根据每次更新后的询问指令执行多轮对话的至少一轮之前,根据第一用户意图、第一输入语言信息、第二语言输入信息以及未填充槽位更新询问指令。
示例性地,通过第一输入语言信息的上下文内容、第二语言输入信息的上下文内容以及第一用户意图和未填充槽位来对询问指令进行更新,从而使用户可以明确与第一用户意图的槽值,同时该槽值用于填充至未填充槽位内容,同时基于第一输入语言信息和第二输入语言信息的上下文信息,以使多轮对话能够更加紧密,有效排除其他信息的干扰。
图8示意性示出了根据本公开实施例的多轮对话方法在操作S270的流程图。
如图8所示,操作S270的流程包括操作S271至操作S273。
在操作S271中,响应与第一用户意图相关联的M个槽位的槽值完全填充的指令,根据M个槽位以及填充至M个槽位的槽值,生成槽位槽值对。
示例性地,每一个槽位填充对应的槽值,根据确定的M个槽位以及每个槽位中填充的槽值,生成槽位槽值对,才槽位槽值对便于后续操作的执行。
在操作S272中,根据第一用户意图、槽位槽值对生成服务调用指令。例如,将槽位槽值对以及第一用户意图组装,以生成针对特定服务的API进行调用的服务调用指令。
在操作S273中,基于服务调用指令的响应结果,生成与第一输入语言信息相关的第一输出语言信息。
示例性地,服务器接收到服务调用指令后,返回一个JSON对象作为响应结果。对返回的响应结果进行解析,以获得需要的信息,并将该信息进行组装形成文本信息作为第一输出语言信息,该第一输出语言信息可以被用户识别或理解。
根据本公开的实施例,通过将上述的操作与操作S270进行结合,从而可以更加快速和准确的返回用户所需的信息,保证多轮对话的效率和准确率。
图9示意性示出了根据本公开实施例的多轮对话方法还包括的另一流程图。
如图9所示,本公开实施例的多轮对话方法还包括流程600。流程600包括操作S610至操作S630。
在操作S610中,判断用户输入的语言信息中是否包括第二用户意图。
示例性地,用户在输入语言信息过程中,会存在其他的用户意图,若不进行区分,将更新后的询问指令无法准确获取用户的槽位对应的槽值。因此通过判断输入的语言信息中是否包括第二用户意图,若包括则进行后续的操作,从而防止用户输入的其他用户意图的干扰。同时,若用户改变用户意图,则可以满足用户实时调整的需要,提高多轮对话方法的灵活性。
在操作S620中,若用户输入的语言信息中包括第二用户意图,生成第一用户意图结束指令。
示例性地,若用户再次输入的语言信息中包括第二用户意图,即用户可能要更改意图,或者用户输入的无效意图。此时,生成第一用户意图结束指令,即向用户确认是否结束第一用户意图,从而排除在多轮对话过程中因多个用户意图导致填充至槽位的槽值获取不准确的问题。
在操作S630中,响应第一用户意图结束指令的确认操作,将包括第二用户意图的语言信息作为新的第一输入语言信息。
在本公开的实施例中,当用户确认第一用户意图结束指令后,将原有的第一用户意图结束,将此时包括第二用户意图的语言信息作为第一输入语言信息,即重新开始本公开实施例的多轮对话方法,并基于该包括第二用户意图的语言信息进行后续的对话操作,可以避免多个意图交叉导致的干扰问题,同时满足用户随时调整用户意图的需求。
图10示意性示出了根据本公开实施例的多轮对话装置的方框图。
本公开的另一方面提供了一种多轮对话装置。如图10所示,本公开实施例的多轮对话装置700包括第一模块701、第二模块702、第三模块703、第四模块704、第五模块705、第六模块706以及第七模块707。
第一模块701,配置为获取用户的第一输入语言信息,确定与第一输入语言信息关联的第一用户意图。在一实施例中,第一模块701可以用于执行前文描述的操作S210,在此不再赘述。
第二模块702,配置为根据第一用户意图确定与第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数。第二模块702可以用于执行前文描述的操作S220,在此不再赘述。
第三模块703,配置为根据M个槽位中的至少一个槽位,生成询问指令。第三模块703可以用于执行前文描述的操作S230,在此不再赘述。
第四模块704,配置为根据用户输入的第二输入语言信息,确定用于填充至M个槽位的至少一个槽值,第二输入语言信息与询问指令相关联。第四模块704可以用于执行前文描述的操作S240,在此不再赘述。
第五模块705,配置为根据第一输入语言信息和第二输入语言信息,确定M个槽位中的未填充槽位,未填充槽位用于更新询问指令。第五模块705可以用于执行前文描述的操作S250,在此不再赘述。
第六模块706,配置为根据每次更新后的询问指令执行多轮对话的至少一轮,判断与第一用户意图相关联的M个槽位的槽值是否完全填充。第六模块706可以用于执行前文描述的操作S260,在此不再赘述。
第七模块707,配置为响应与第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。第七模块707可以用于执行前文描述的操作S270,在此不再赘述。
在本公开的一些示例性实施例中,多轮对话装置还包括确定模块,确定模块配置为:基于询问指令,接收用户输入的语言信息;将与询问指令相关联的语言信息确定为第二输入语言信息。
在本公开的一些示例性实施例中,第五模块还被配置为:根据第一输入语言信息中包括的至少一个第一槽值,确定至少一个第一槽位;根据第二输入语言信息中包括的至少一个第二槽值,确定至少一个第二槽位;以及根据M个槽位、第一槽位和第二槽位,确定未填充槽位。
在本公开的一些示例性实施例中,多轮对话装置还包括更新模块,更新模块被配置为:在根据每次更新后的询问指令执行多轮对话的至少一轮之前,根据第一用户意图、第一输入语言信息、第二语言输入信息以及未填充槽位更新询问指令。
在本公开的一些示例性实施例中,第七模块还被配置为:响应与第一用户意图相关联的M个槽位的槽值完全填充的指令,根据M个槽位以及填充至M个槽位的槽值,生成槽位槽值对;根据第一用户意图、槽位槽值对生成服务调用指令;基于服务调用指令的响应结果,生成与第一输入语言信息相关的第一输出语言信息。
在本公开的一些示例性实施例中,第一模块包括获取单元,获取单元被配置为:接收用户输入的文本;接收用户输入的语音,将语音转化为文本;和/或接收用户输入的图像,通过光学字符识别将图像转化为文本;将文本确定为第一输入语言信息。
在本公开的一些示例性实施例中,多轮对话装置还包括响应模块,响应模块被配置为:判断用户输入的语言信息中是否包括第二用户意图,若用户输入的语言信息中包括第二用户意图,生成第一用户意图结束指令;响应第一用户意图结束指令的确认操作,将包括第二用户意图的语言信息作为新的第一输入语言信息。
在本公开的一些示例性实施例中,第一模块还被配置为:获取用户的第一输入语言信息,根据自然语言理解模块确定用户的潜在意图,自然语言理解模块是根据用户与人工客服的对话内容训练得到的;以及根据第一输入语言信息包括的上下文信息以及潜在意图,确定与第一输入语言信息关联的第一用户意图。
根据本公开的实施例,第一模块701、第二模块702、第三模块703、第四模块704、第五模块705、第六模块706以及第七模块707中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一模块701、第二模块702、第三模块703、第四模块704、第五模块705、第六模块706以及第七模块707中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一模块701、第二模块702、第三模块703、第四模块704、第五模块705、第六模块706以及第七模块707中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的电子设备的方框图。图11示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,根据本公开实施例的电子设备800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、ROM802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM802和/或RAM803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的方法。
在该计算机程序被处理器801执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分809被下载和安装,和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (12)
1.一种多轮对话方法,其中,包括:
获取用户的第一输入语言信息,确定与所述第一输入语言信息关联的第一用户意图;
根据所述第一用户意图确定与所述第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数;
根据所述M个槽位中的至少一个槽位,生成询问指令;
根据用户输入的第二输入语言信息,确定用于填充至所述M个槽位的至少一个槽值,所述第二输入语言信息与所述询问指令相关联;
根据所述第一输入语言信息和所述第二输入语言信息,确定M个槽位中的未填充槽位,所述未填充槽位用于更新所述询问指令;
根据每次更新后的所述询问指令执行多轮对话的至少一轮,判断与所述第一用户意图相关联的M个槽位的槽值是否完全填充;
响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。
2.根据权利要求1所述的方法,其中,还包括:
基于所述询问指令,接收用户输入的语言信息;
将与所述询问指令相关联的语言信息确定为第二输入语言信息。
3.根据权利要求1所述的方法,其中,根据所述第一输入语言信息和所述第二输入语言信息,确定M个槽位中的未填充槽位,包括:
根据第一输入语言信息中包括的至少一个第一槽值,确定至少一个第一槽位;
根据第二输入语言信息中包括的至少一个第二槽值,确定至少一个第二槽位;以及
根据所述M个槽位、所述第一槽位和所述第二槽位,确定未填充槽位。
4.根据权利要求1所述的方法,其中,还包括:
在根据每次更新后的所述询问指令执行多轮对话的至少一轮之前,根据所述第一用户意图、第一输入语言信息、第二语言输入信息以及所述未填充槽位更新所述询问指令。
5.根据权利要求1所述的方法,其中,
响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息,包括:
响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,根据所述M个槽位以及填充至所述M个槽位的槽值,生成槽位槽值对;
根据所述第一用户意图、所述槽位槽值对生成服务调用指令;
基于所述服务调用指令的响应结果,生成与所述第一输入语言信息相关的第一输出语言信息。
6.根据权利要求1所述的方法,其中,获取用户的第一输入语言信息包括:
接收用户输入的文本;
接收用户输入的语音,将所述语音转化为文本;和/或
接收用户输入的图像,通过光学字符识别将所述图像转化为文本;
将所述文本确定为第一输入语言信息。
7.根据权利要求1所述的方法,其中,还包括:
判断用户输入的语言信息中是否包括第二用户意图,
若用户输入的语言信息中包括第二用户意图,生成第一用户意图结束指令;
响应第一用户意图结束指令的确认操作,将包括第二用户意图的语言信息作为新的第一输入语言信息。
8.根据权利要求1所述的方法,其中,
获取用户的第一输入语言信息,确定与所述第一输入语言信息关联的第一用户意图包括:
获取用户的第一输入语言信息,根据自然语言理解模块确定用户的潜在意图,所述自然语言理解模块是根据用户与人工客服的对话内容训练得到的;以及
根据第一输入语言信息包括的上下文信息以及所述潜在意图,确定与所述第一输入语言信息关联的第一用户意图。
9.一种多轮对话装置,包括:
第一模块,配置为获取用户的第一输入语言信息,确定与所述第一输入语言信息关联的第一用户意图;
第二模块,配置为根据所述第一用户意图确定与所述第一用户意图相关联的M个槽位,每个槽位用于填充对应的槽值,M为正整数;
第三模块,配置为根据所述M个槽位中的至少一个槽位,生成询问指令;
第四模块,配置为根据用户输入的第二输入语言信息,确定用于填充至所述M个槽位的至少一个槽值,所述第二输入语言信息与所述询问指令相关联;
第五模块,配置为根据所述第一输入语言信息和所述第二输入语言信息,确定M个槽位中的未填充槽位,所述未填充槽位用于更新所述询问指令;
第六模块,配置为根据每次更新后的所述询问指令执行多轮对话的至少一轮,判断与所述第一用户意图相关联的M个槽位的槽值是否完全填充;
第七模块,配置为响应与所述第一用户意图相关联的M个槽位的槽值完全填充的指令,生成与第一输入语言信息相关的第一输出语言信息。
10.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现根据权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时,实现根据权利要求1至8中任一项所述的方法。
12.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310453287.2A CN116467421A (zh) | 2023-04-25 | 2023-04-25 | 多轮对话方法、装置、电子设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310453287.2A CN116467421A (zh) | 2023-04-25 | 2023-04-25 | 多轮对话方法、装置、电子设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116467421A true CN116467421A (zh) | 2023-07-21 |
Family
ID=87175150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310453287.2A Pending CN116467421A (zh) | 2023-04-25 | 2023-04-25 | 多轮对话方法、装置、电子设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116467421A (zh) |
-
2023
- 2023-04-25 CN CN202310453287.2A patent/CN116467421A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11681924B2 (en) | Training neural networks using a variational information bottleneck | |
CN109522483B (zh) | 用于推送信息的方法和装置 | |
US10963316B2 (en) | Artificial intelligence-powered cloud for the financial services industry | |
US11699074B2 (en) | Training sequence generation neural networks using quality scores | |
KR20180017342A (ko) | 머신러닝을 활용한 정해진 시나리오로 고객과 상담하는 로봇 자동 상담 방법 및 시스템 | |
CN114756122A (zh) | 确定用于执行动作的代理的方法、计算设备和存储介质 | |
US11392776B2 (en) | Systems and methods of generating responses associated with natural language input | |
CN110187780B (zh) | 长文本预测方法、装置、设备和存储介质 | |
CN116127020A (zh) | 生成式大语言模型训练方法以及基于模型的搜索方法 | |
CN110377733A (zh) | 一种基于文本的情绪识别方法、终端设备及介质 | |
CN110737824B (zh) | 内容查询方法和装置 | |
WO2020042164A1 (en) | Artificial intelligence systems and methods based on hierarchical clustering | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
CN110705308A (zh) | 语音信息的领域识别方法、装置、存储介质及电子设备 | |
CN116467421A (zh) | 多轮对话方法、装置、电子设备、存储介质和程序产品 | |
CN114297380A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CA3200541C (en) | Systems and methods of generating responses associated with natural language input | |
CN111258687A (zh) | 用于优化数字页面的工作识别 | |
CN111857935B (zh) | 文字生成方法和装置 | |
CN116933800B (zh) | 一种基于模版的生成式意图识别方法及装置 | |
CN114265938A (zh) | 风险识别模型的训练方法、使用方法、装置、设备和介质 | |
CN111274853B (zh) | 图像处理方法和装置 | |
WO2022221379A1 (en) | Intent detection via multi-hop unified syntactic graph | |
CN114254644A (zh) | 信息识别方法、装置、电子设备及存储介质 | |
CN117435471A (zh) | 测试案例的推荐方法、装置、设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |