CN115577092B - 用户话句处理方法、装置、电子设备及计算机存储介质 - Google Patents

用户话句处理方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN115577092B
CN115577092B CN202211576180.9A CN202211576180A CN115577092B CN 115577092 B CN115577092 B CN 115577092B CN 202211576180 A CN202211576180 A CN 202211576180A CN 115577092 B CN115577092 B CN 115577092B
Authority
CN
China
Prior art keywords
semantic information
user
machine
intention
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211576180.9A
Other languages
English (en)
Other versions
CN115577092A (zh
Inventor
顾蓝笛
徐俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Renma Interactive Technology Co Ltd
Original Assignee
Shenzhen Renma Interactive Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Renma Interactive Technology Co Ltd filed Critical Shenzhen Renma Interactive Technology Co Ltd
Priority to CN202211576180.9A priority Critical patent/CN115577092B/zh
Publication of CN115577092A publication Critical patent/CN115577092A/zh
Application granted granted Critical
Publication of CN115577092B publication Critical patent/CN115577092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种用户话句处理方法、装置、电子设备及计算机存储介质,涉及互联网产业的一般数据处理技术领域。该方法包括:获取长对话文本;将长对话文本拆解成至少两个短句,并对至少两个短句进行信息抽取,获取与人机对话剧本对应的第一语义信息集合,将第一语义信息集合中的第一语义信息与预设跳转条件集合中的跳转条件进行条件匹配;确定与第一语义信息集合匹配的目标跳转条件集合,获取目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级;根据响应优先级和特征数据,确定与目标跳转条件集合中的跳转条件对应的机器响应策略,并执行机器响应策略。本方法可以减少遗漏用户长句中的信息,提高长句中用户意图识别和答复的准确度。

Description

用户话句处理方法、装置、电子设备及计算机存储介质
技术领域
本发明涉及互联网产业的一般数据处理技术领域,尤其涉及一种用户话句处理方法、装置、电子设备及计算机存储介质。
背景技术
随着互联网产业的发展,智能语音互动系统越来越受到人们的欢迎。智能语音互动系统可以识别用户输入的语句并分析该语句所表达的意图,然后通过智能对话和即时问答的交互方式,向用户输出对话文本。
目前,当用户输入的语句为长句时,智能语音交互系统通常会采用长句压缩的方式,按照该长句对应的文本信息类型,提取该长句中的核心句,并对该核心句进行意图识别,以代替该长句所表达的用户意图,然后按照与该核心句对应的固定话术,输出相应的机器答复。
但当长句包含多个用户意图时,上述方法在提取核心句的过程中可能会遗漏信息,导致用户意图识别和答复的准确度较低。
发明内容
本申请实施例公开了一种用户话句处理方法、装置、电子设备及计算机存储介质,以期提高长句中用户意图识别和答复的准确度。
第一方面,本申请实施例提供了一种用户话句处理方法,应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统,所述对话处理系统包括语义识别引擎和人机对话引擎,所述人机对话引擎根据预设的人机对话剧本确定,所述人机对话剧本包含预设跳转条件集合,所述预设跳转条件集合包括至少两个跳转条件,所述跳转条件用于表示预设的在与所述人机对话剧本关联的服务场景下的用户意图;所述方法包括:
调用所述人机对话引擎获取用户输入的语音信息对应的长对话文本;
调用所述语义识别引擎将所述长对话文本拆解成至少两个短句,并对所述至少两个短句进行信息抽取,获取与所述人机对话剧本对应的第一语义信息集合,所述第一语义信息集合包括至少两个第一语义信息,所述第一语义信息用于表示所述至少两个短句中的短句对应的用户意图;
将所述第一语义信息集合中的所述第一语义信息与所述预设跳转条件集合中的所述跳转条件进行条件匹配;
若匹配到与所述第一语义信息对应相同或等同语义的第一跳转条件,则根据所述第一语义信息,确定与所述第一语义信息所表示的用户意图对应的特征数据;
若未匹配到与所述第一语义信息对应相同或等同语义的所述第一跳转条件,则根据与所述人机对话剧本关联的知识库对所述第一语义信息进行想象推理,获取与所述第一语义信息匹配的语义知识;
根据所述第一语义信息和所述语义知识,确定第二语义信息,所述第二语义信息与所述第一语义信息对应相同或等同语义;
将所述第二语义信息与所述跳转条件进行条件匹配,若匹配到与所述第二语义信息对应相同或等同语义的第二跳转条件,则根据所述第二语义信息,确定与所述第一语义信息所表示的用户意图对应的所述特征数据;
根据所述第一跳转条件或所述第二跳转条件,确定与所述第一语义信息集合匹配的目标跳转条件集合,所述目标跳转条件集合包括至少两个所述跳转条件;
获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级;
根据所述响应优先级和所述特征数据,确定与所述目标跳转条件集合中的跳转条件对应的机器响应策略,并调用所述人机对话引擎执行所述机器响应策略。
可理解,若第一语义信息或第二语义信息与跳转条件对应等同语义,则表示通过逻辑推导可以将第一语义信息或第二语义信息对应的用户意图与该跳转条件对应的预测用户意图视为相同。
在本申请实施例中,相较于现有方案中通过压缩提取长句中的核心句确定长句对应的用户意图的方法,本方案通过将长句中的、与预设人机对话剧本对应的短句的第一语义信息与人机对话剧本中预设的跳转条件进行匹配,可以识别到多个短句对应的多个用户意图,避免信息遗漏,提高长句中用户意图识别的准确度。进一步的,根据该多个用户意图对应的响应优先级和表示用户意图的特征数据,可以建立起多个用户意图之间的逻辑架构并确定相应的机器响应策略,以便于为用户解决多用户意图形成的复杂逻辑下的实际用户需求,提高用户意图答复的准确度。
在第一方面一个可能的实施方式中,在所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级之前,所述方法还包括:
根据与所述人机对话剧本对应的剧情任务,确定完成所述剧情任务需要采集的第一服务信息;
根据所述特征数据,确定所述长对话文本所包含的用于完成所述剧情任务的第二服务信息;
在所述第二服务信息与所述第一服务信息匹配的情况下,执行所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级。
在本实施例中,若上述第二服务信息与上述第一服务信息匹配,则表示从上述长对话文本获取的上述特征数据包含完成上述剧情任务所需的信息。此时上述对话处理系统可以根据上述第二服务信息所对应的特征数据完成上述人机对话剧本对应的剧情任务。若否,则向用户的终端设备输出用于获取缺失信息的机器语句,用户可根据该机器语句的指示补充该确实信息。可理解,在答复用户意图之前,判断当前采集的特征数据是否满足完成该人机对话剧本中剧情任务所需采集的信息,可进一步提高用户意图答复的准确度。
在第一方面一个可能的实施方式中,所述对所述至少两个短句进行信息抽取,获取与所述人机对话剧本对应的第一语义信息集合包括:
对所述至少两个短句中的单个短句进行语义分析,确定所述单个短句的第三语义信息;
根据所述第三语义信息,从所述至少两个短句中提取与所述单个短句对应的关联信息;
根据第三语义信息和所述关联信息,确定所述第一语义信息,并根据所述第一语义信息,确定与所述人机对话剧本对应的所述第一语义信息集合。
在本实施例中,上述第三语义信息为从上述单个短句中分析得到的关键信息,用于表示上述单个短句对应的语义。可理解的,上述关联信息可以是从上述单个短句中提取得到的信息,也可以是从上述至少两个短句中的除上述单个短句之外的其它短句中提取得到的信息。本方法在对每个短句进行信息抽取时,结合该短句中的关键信息(第三语义信息)和上述至少两个短句中包含的该短句的关联信息,可以进一步提高用户意图识别的准确度。
在第一方面一个可能的实施方式中,所述根据所述第一语义信息,确定与所述人机对话剧本对应的所述第一语义信息集合包括:
将所述第一语义信息与所述人机对话剧本对应的关键词库进行关键词比对,确定比对结果,所述关键词库中的关键词根据所述人机对话剧本关联的服务场景确定;
若所述比对结果指示所述第一语义信息与所述人机对话剧本关联,则将所述第一语义信息加入与所述人机对话剧本对应的所述第一语义信息集合。
在本实施例中,示例性的,上述关键词库中的关键词可以是在上述服务场景下发生的自然语言对话过程中可能出现的高频词汇,上述比对结果可以包含与上述第一语义信息比对成功的关键词信息,如该关键词信息可以包含关键词、关键词数量、关键词在上述关键词库中的占比,或者也可以包含其它形式的、能够表现出上述第一语义信息与上述人机对话剧本关联性的信息。本方法通过关键词比对,筛选出与当前人机对话剧本的服务场景关联的第一语义信息,减少其它与该服务场景无关的第一语义信息对当前用户意图识别的影响,提高用户意图识别和答复效率。
在第一方面一个可能的实施方式中,在所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级之前,所述方法还包括:
根据所述特征数据,判断所述目标跳转条件集合中的跳转条件所表示的用户意图是否发生意图冲突;
若是,则根据所述至少两个短句,对发生意图冲突的用户意图对应的第一语义信息进行上下文分析,并根据分析结果更新所述目标跳转条件集合。
在本实施例中,可理解的,上述特征数据可以是从上述第一语义信息或上述第二语义信息中提取到的词语,可以区分上述长对话文本中对应的不同的用户意图,并且上述目标跳转条件集合中的跳转条件所表示的预测用户意图是与上述长对话文本所包含的用户意图相互匹配的,因此根据该特征数据可以判断上述目标跳转条件集合中的跳转条件所表示的预设的用户意图是否发生意图冲突,进一步的,可判断出在上述长对话文本中是否发生意图冲突。具体的,若未发生意图冲突,则可执行获取上述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级的操作,若发生意图冲突,则可通过对发生意图冲突的第一语义信息进行上下文分析,实现结合上下文信息精准确定用户意图,并根据分析结果更新上述目标跳转条件集合,减少因意图冲突导致的用户意图识别错误,进一步提高用户意图识别和答复的准确度,提高用户体验。
示例性的,在更新上述目标跳转条件集合时,也同步更新上述目标跳转条件集合中发生意图冲突的跳转条件对应的特征数据。具体的,更新上述目标跳转条件集合的过程可以包括在上述目标跳转条件集合中,对上述发生意图冲突的第一语义信息对应的一个或多个跳转条件进行删除、修正、增加、替换等更新操作中的任意一种操作或多种操作的组合。可理解的,更新之后的上述目标跳转条件集合与更新前的目标跳转条件集合所包含的跳转条件可以是不同的。
在第一方面一个可能的实施方式中,所述响应优先级满足如下任意一项:
所述响应优先级根据所述目标跳转条件集合中的跳转条件所表示的用户意图对应的逻辑关系确定;
所述响应优先级根据与所述目标跳转条件集合中的跳转条件匹配的第一语义信息对应的短句在所述长对话文本中的语序位置确定;
所述响应优先级根据所述目标跳转条件集合中的跳转条件所表示的用户意图对应的服务场景和在所述人机对话剧本中预设的服务场景优先级确定。
在本实施例中,在根据上述逻辑关系确定上述响应优先级时,有助于根据上述逻辑关系确定用户在多意图叠加的情况下产生的更深层次的用户意图,有助于提高用户意图答复的逻辑性,提升交互体验。上述语序位置即为上述长对话文本(或上述至少两个短句)对应的用户陈述语序,在根据上述语序位置确定上述响应优先级时,对于多个用户意图,可以实现“先问先答”的用户意图答复效果,与用户表达意图的思路保持一致,提高用户体验感。上述服务场景优先级用于表示与上述人机对话剧本关联的不同服务场景对应的服务顺序,在多个用户意图对应不同的服务场景的情况下,按照上述服务场景优先级所指示的服务顺序确定上述响应优先级,可以更好地协调不同服务场景对应的剧情任务的完成顺序,可以缩减因某个/些特定的服务场景对应的用户意图响应不及时产生的用户耐心消耗。
在第一方面一个可能的实施方式中,所述调用所述人机对话引擎执行所述机器响应策略包括如下至少一项:
调用所述人机对话引擎输出所述机器响应策略对应的机器语句;
调用所述人机对话引擎执行所述机器响应策略对应的业务操作。
在本实施例中,示例性的,上述机器语句可以是上述人机对话剧本中预设的答复语句,也可以是基于上述预设的答复语句和相应的特征数据衍生的语句。上述业务操作可以是在上述用户许可的情况下,与上述用户关联的第三方平台(如部署在该用户的终端设备上应用程序)进行交互,以使该第三方平台为上述用户提供相应的业务服务。
在第一方面一个可能的实施方式中,所述跳转条件包含意图三元组,所述意图三元组包括意图关联关系、第一意图对象和第二意图对象,所述意图关联关系用于表示所述第一意图对象与所述第二意图对象之间的语义关系和/或语法关系,所述意图对象对应至少一个词语;所述第一语义信息包含原始三元组,所述原始三元组包括原始关联关系、第一原始对象和第二原始对象,所述原始关联关系用于表示所述第一原始对象与所述第二原始对象之间的语义关系和/或语法关系,所述原始对象对应一个词语;
所述第一跳转条件包含第一意图三元组,所述第一意图三元组与所述原始三元组对应相同或等同语义,所述第一意图三元组满足如下至少一项:
所述第一意图三元组包含的第一意图对象和第二意图对象分别与所述原始三元组包含的第一原始对象和第二原始对象具有共同指代关系,所述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,所述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
所述第二意图三元组包含的意图关联关系与所述原始三元组包含的原始关联关系对应的关系类型相同。
在本实施例中,以上对象(如上述原始对象或上述意图对象)对应的词语可以是概念、实体、词或词组。示例性的,上述同义关系可对应相同含义,上述近义关系、上述整体与部分关系、上述上位概念与下位概念关系可对应等同含义。在上述第一意图三元组中的一个意图对象对应多个词语时,若其中有至少一个词语与上述原始三元组中的一个原始对象所对应的词语为相同含义或等同含义,则可认为该意图对象与该原始对象之间具有共同指代关系。
在第一方面一个可能的实施方式中,所述语义知识包括第一推理对象和第二推理对象,所述第一推理对象与所述第一原始对象之间存在关联关系,以及所述第一推理对象与所述第二原始对象之间不存在关联关系,所述第二推理对象与所述第二原始对象之间存在关联关系,以及所述第二推理对象与所述第一原始对象之间不存在关联关系;
所述根据所述第一语义信息和所述语义知识,确定第二语义信息包括:
根据所述第一原始对象和所述第一推理对象,确定第一拓展对象,并根据所述第二原始对象和所述第二推理对象,确定第二拓展对象;
建立所述第一拓展对象与所述第二拓展对象之间的拓展关联关系,所述拓展关联关系用于表示所述第一拓展对象和所述第二拓展对象之间的语义关系和/或语法关系;并根据所述第一拓展对象、所述第二拓展对象和所述拓展关联关系,确定所述拓展三元组,所述第二语义信息包含所述拓展三元组;
所述第二跳转条件包含所述第二意图三元组,所述第二意图三元组与所述拓展三元组对应相同或等同语义,所述第二意图三元组满足如下至少一项:
所述第二意图三元组包含的第一意图对象和第二意图对象分别与所述拓展三元组包含的第一拓展对象和第二拓展对象具有共同指代关系,所述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,所述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
所述第二意图三元组包含的意图关联关系与所述拓展三元组包含的拓展关联关系对应的关系类型相同。
在本实施例中,可理解,上述关联关系用于表示推理对象与原始对象之间的语义关系和/或语法关系。通过三元组表示用户意图,可以降低用户意图提取和匹配过程中的计算量,提高用户意图识别效率。
第二方面,本申请实施例提供了一种用户话句处理装置,应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统,所述对话处理系统包括语义识别引擎和人机对话引擎,所述人机对话引擎根据预设的人机对话剧本确定,所述人机对话剧本包含预设跳转条件集合,所述预设跳转条件集合包括至少两个跳转条件,所述跳转条件用于表示预设的在与所述人机对话剧本关联的服务场景下的用户意图;所述装置包括:
第一获取单元,用于调用所述人机对话引擎获取用户输入的语音信息对应的长对话文本;
抽取单元,用于调用所述语义识别引擎将所述长对话文本拆解成至少两个短句,并对所述至少两个短句进行信息抽取,获取与所述人机对话剧本对应的第一语义信息集合,所述第一语义信息集合包括至少两个第一语义信息,所述第一语义信息用于表示所述至少两个短句中的短句对应的用户意图;
匹配单元,用于将所述第一语义信息集合中的所述第一语义信息与所述预设跳转条件集合中的所述跳转条件进行条件匹配;
所述匹配单元,还用于若匹配到与所述第一语义信息对应相同或等同语义的第一跳转条件,则根据所述第一语义信息,确定与所述第一语义信息所表示的用户意图对应的特征数据;
所述匹配单元,还用于若未匹配到与所述第一语义信息对应相同或等同语义的所述第一跳转条件,则根据与所述人机对话剧本关联的知识库对所述第一语义信息进行想象推理,获取与所述第一语义信息匹配的语义知识;
所述匹配单元,还用于根据所述第一语义信息和所述语义知识,确定第二语义信息,所述第二语义信息与所述第一语义信息对应相同或等同语义;
所述匹配单元,还用于将所述第二语义信息与所述跳转条件进行条件匹配,若匹配到与所述第二语义信息对应相同或等同语义的第二跳转条件,则根据所述第二语义信息,确定与所述第一语义信息所表示的用户意图对应的所述特征数据;
第一确定单元,用于根据所述第一跳转条件或所述第二跳转条件,确定与所述第一语义信息集合匹配的目标跳转条件集合,所述目标跳转条件集合包括至少两个所述跳转条件;
第二获取单元,用于获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级;
执行单元,用于根据所述响应优先级和所述特征数据,确定与所述目标跳转条件集合中的跳转条件对应的机器响应策略,并调用所述人机对话引擎执行所述机器响应策略。
在第二方面一个可能的实施方式中,所述装置还包括:
第二确定单元,用于根据与所述人机对话剧本对应的剧情任务,确定完成所述剧情任务需要采集的第一服务信息;
第三确定单元,用于根据所述特征数据,确定所述长对话文本所包含的用于完成所述剧情任务的第二服务信息;
所述执行单元,还用于在所述第二服务信息与所述第一服务信息匹配的情况下,执行所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级。
在第二方面一个可能的实施方式中,所述抽取单元,还具体用于对所述至少两个短句中的单个短句进行语义分析,确定所述单个短句的第三语义信息;
所述抽取单元,还具体用于根据所述第三语义信息,从所述至少两个短句中提取与所述单个短句对应的关联信息;
所述抽取单元,还具体用于根据第三语义信息和所述关联信息,确定所述第一语义信息,并根据所述第一语义信息,确定与所述人机对话剧本对应的所述第一语义信息集合。
在第二方面一个可能的实施方式中,所述抽取单元,还具体用于将所述第一语义信息与所述人机对话剧本对应的关键词库进行关键词比对,确定比对结果,所述关键词库中的关键词根据所述人机对话剧本关联的服务场景确定;
所述抽取单元,还具体用于若所述比对结果指示所述第一语义信息与所述人机对话剧本关联,则将所述第一语义信息加入与所述人机对话剧本对应的所述第一语义信息集合。
在第二方面一个可能的实施方式中,所述装置还包括:
判断单元,用于根据所述特征数据,判断所述目标跳转条件集合中的跳转条件所表示的用户意图是否发生意图冲突;
若是,则所述第一确定单元还用于根据所述至少两个短句,对发生意图冲突的用户意图对应的第一语义信息进行上下文分析,并根据分析结果更新所述目标跳转条件集合。
在第二方面一个可能的实施方式中,所述响应优先级满足如下任意一项:
所述响应优先级根据所述目标跳转条件集合中的跳转条件所表示的用户意图对应的逻辑关系确定;
所述响应优先级根据与所述目标跳转条件集合中的跳转条件匹配的第一语义信息对应的短句在所述长对话文本中的语序位置确定;
所述响应优先级根据所述目标跳转条件集合中的跳转条件所表示的用户意图对应的服务场景和在所述人机对话剧本中预设的服务场景优先级确定。
在第二方面一个可能的实施方式中,所述执行单元,还具体用于调用所述人机对话引擎输出所述机器响应策略对应的机器语句;所述执行单元,还具体用于调用所述人机对话引擎执行所述机器响应策略对应的业务操作。
在第二方面一个可能的实施方式中,所述第一语义信息包含原始三元组,所述原始三元组包括原始关联关系、第一原始对象和第二原始对象,所述原始关联关系用于表示所述第一原始对象与所述第二原始对象之间的语义关系和/或语法关系,所述原始对象对应一个词语;
所述跳转条件包含意图三元组,所述意图三元组包括意图关联关系、第一意图对象和第二意图对象,所述意图关联关系用于表示所述第一意图对象与所述第二意图对象之间的语义关系和/或语法关系,所述意图对象对应至少一个词语;
所述第一跳转条件包含第一意图三元组,所述第一意图三元组与所述原始三元组对应相同或等同语义,所述第一意图三元组满足如下至少一项:
所述第一意图三元组包含的第一意图对象和第二意图对象分别与所述原始三元组包含的第一原始对象和第二原始对象具有共同指代关系,所述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,所述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
所述第二意图三元组包含的意图关联关系与所述原始三元组包含的原始关联关系对应的关系类型相同。
在第二方面一个可能的实施方式中,所述语义知识包括第一推理对象和第二推理对象,所述第一推理对象与所述第一原始对象之间存在关联关系,以及所述第一推理对象与所述第二原始对象之间不存在关联关系,所述第二推理对象与所述第二原始对象之间存在关联关系,以及所述第二推理对象与所述第一原始对象之间不存在关联关系;
所述匹配单元503,还具体用于根据所述第一原始对象和所述第一推理对象,确定第一拓展对象,并根据所述第二原始对象和所述第二推理对象,确定第二拓展对象;
所述匹配单元503,还具体用于建立所述第一拓展对象与所述第二拓展对象之间的拓展关联关系,所述拓展关联关系用于表示所述第一拓展对象和所述第二拓展对象之间的语义关系和/或语法关系;并根据所述第一拓展对象、所述第二拓展对象和所述拓展关联关系,确定所述拓展三元组,所述第二语义信息包含所述拓展三元组;
所述第二跳转条件包含所述第二意图三元组,所述第二意图三元组与所述拓展三元组对应相同或等同语义,所述第二意图三元组满足如下至少一项:
所述第二意图三元组包含的第一意图对象和第二意图对象分别与所述拓展三元组包含的第一拓展对象和第二拓展对象具有共同指代关系,所述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,所述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
所述第二意图三元组包含的意图关联关系与所述拓展三元组包含的拓展关联关系对应的关系类型相同。
关于第二方面以及第二方面中任意一个可能的实施方式所带来的技术效果,可参考对应于第一方面以及第一方面中相应的实施方式的技术效果的介绍。
第三方面,本申请实施例提供了一种电子设备,上述电子设备包括:
存储器,用于存储程序;
处理器,用于执行上述存储器存储的上述程序,在上述程序被上述处理器执行的情况下,上述处理器执行如第一方面中任意一个可能的实施方式中的方法。
第四方面,本申请实施例提供了一种计算机存储介质,上述计算机存储介质中存储有计算机程序,上述计算机程序包括程序指令,在上述程序指令被处理器执行的情况下,上述处理器执行如第一方面以及第一方面中任意一个可能的实施方式中的方法。
第五方面,本申请实施例提供了一种计算机程序产品,上述计算机程序产品包括:指令或计算机程序;在上述指令或上述计算机程序被执行的情况下,使如第一方面以及第一方面中任意一个可能的实施方式中的方法实现。
第六方面,本申请实施例提供了一种芯片,上述芯片包括处理器,上述处理器用于执行指令,在上述处理器执行上述指令的情况下,使得上述芯片执行如第一方面以及第一方面中任意一个可能的实施方式中的方法。可选的,上述芯片还包括输入/输出接口,上述输入/输出接口用于接收信号或发送信号。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1a为本申请实施例提供的第一种对话处理系统的架构示意图;
图1b为本申请实施例提供的第二种对话处理系统的架构示意图;
图1c为本申请实施例提供的第三种对话处理系统的架构示意图;
图2为本申请实施例提供的第一种用户话句处理方法的流程示意图;
图3为本申请实施例提供的一种用户话句处理方法的应用场景示意图;
图4为本申请实施例提供的构建拓展三元组的流程示意图;
图5为本申请实施例提供的一种用户话句处理装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例进行描述。
本申请的说明书、权利要求书及附图中的术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备等,没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元等,或可选地还包括对于这些过程、方法、产品或设备等固有的其它步骤或单元。
在本文中提及的“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员可以显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上,“至少两个(项)”是指两个或三个及三个以上,“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
目前,在智能识别用户输入的长句对应的用户意图时,通常会采用长句压缩的方式,提取该长句中的核心句,并对该核心句进行意图识别,以代替该长句所表达的用户意图,然后按照与该核心句对应的固定话术,输出相应的机器答复。但若该长句包含多个用户意图,则在压缩长句获取核心句的过程中,可能会遗漏长句中的语义信息,导致用户意图识别错误或识别不完全,使得基于上述方法进行的用户意图识别和答复的准确度较低。
针对以上问题,本申请实施例提供了一种用户话句处理方法、装置、电子设备及计算机存储介质,以期提高长句中用户意图识别和答复的准确度。
本申请实施例提供的用户话句处理方法可应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统。下面将结合本申请实施例提供的图1a至图1c,对上述对话处理系统进行介绍。
请参阅图1a,图1a为本申请实施例提供的第一种对话处理系统的架构示意图。如图1a所示,对话处理系统101可以是服务器,该服务器设置有语义识别引擎104和人机对话引擎105。该服务器与终端设备102之间建立有通信连接,该终端设备102可采集用户103输入的语音信息。基于如图1a所示的系统架构,在实施上述用户话句处理方法时,终端设备102可采集用户103输入的语音信息,并对该语音信息进行转文本操作,以获取该语音信息对应的长对话文本。然后通过终端设备102与该服务器之间的通信连接(如通过连接该服务器与终端设备102的云端设备提供的数据传输通道)将该长对话文本传输给该服务器。对应的,该服务器可调用人机对话引擎105接收该长对话文本,并调用语义识别引擎104对该长对话文本进行处理,包括将该长对话文本拆分成多个短句(图中以小矩形示出)、识别该多个短句对应的用户意图(图中以小圆形示出)、输出相应的机器响应策略等处理过程。对应的,该服务器调用人机对话引擎105通过上述通信连接向终端设备102输出该机器响应策略,与用户103进行语音互动。其中,关于该长对话文本涉及的处理流程,后续会进行详细介绍,在此先不做进一步说明。
请参阅图1b,图1b为本申请实施例提供的第二种对话处理系统的架构示意图。如图1b所示,对话处理系统106可以是终端设备,该终端设备可以识别用户107的语音指令,采集并处理用户107输入的语音信息。该终端设备设置有语义识别引擎108和人机对话引擎109。基于如图1b所示的系统架构,在实施上述用户话句处理方法时,该终端设备可调用人机对话引擎109采集用户107输入的语音信息,并对该语音信息进行转文本操作,生成与该语音信息对应的场对话文本,并传递给语义识别引擎108。然后该终端设备可调用语义识别引擎108对该长对话文本进行处理,以确定上述机器响应策略,最后该终端设备可调用人机对话引擎109执行该机器响应策略,也可基于该机器响应策略与用户107进行语音互动。
请参阅图1c,图1c为本申请实施例提供的第三种对话处理系统的架构示意图。如图1c所示,对话处理系统110可以是服务器111与终端设备112的结合,终端设备112可识别用户113的语音指令,采集用户113输入的语音信息,并对该语音信息进行转文本操作。基于如图1c所示的系统架构,在实施上述用户话句处理方法时,该终端设备112可调用人机对话引擎115采集用户113输入的语音信息,并对该语音信息进行转文本操作,生成与该语音信息对应的长对话文本,并通过服务器111与终端设备112之间的通信连接(如图1a中所介绍的通信方式)将该长对话文本传递给语义识别引擎114。然后该服务器111可调用语义识别引擎114对该长对话文本进行处理,以确定上述机器响应策略并通过上述通信连接传递给终端设备112。最后该终端设备112可调用人机对话引擎115执行该机器响应策略,也可基于该机器响应策略与用户113进行语音互动。
下面将结合本申请实施例提供的图2至图3,对上述用户话句处理方法进行介绍。
请参阅图2,图2为本申请实施例提供的第一种用户话句处理方法的流程示意图。上述用户话句处理方法应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统,上述对话处理系统包括语义识别引擎和人机对话引擎,上述人机对话引擎根据预设的人机对话剧本确定,上述人机对话剧本包含预设跳转条件集合,上述预设跳转条件集合包括至少两个跳转条件,上述跳转条件用于表示预设的在与上述人机对话剧本关联的服务场景下的用户意图。
示例性的,上述对话处理系统可以是如图1a至图1c中所示的任意一种对话处理系统。上述预设的人机对话剧本可以是根据在上述服务场景下的对话故事构思得到,按照上述对话故事构思创建用自然语言描述的人机对话过程,并对不同的人机对话过程设定预测的用户输入语句,然后按照该预测的用户输入语句创建其对应的跳转条件可得到上述人机对话剧本所包含的预设跳转条件集合。此外,上述服务场景包括生活服务类场景和/或内容服务类场景,上述生活服务类场景包括天气查询、语言翻译、知识问答或智慧出行,上述内容服务类场景包括歌曲点读、新闻播报或影视播放。
如图2所示,上述用户话句处理方法包括如下步骤:
S201、对话处理系统调用人机对话引擎获取用户输入的语音信息对应的长对话文本。
示例性的,上述长对话文本为长句,可以通过句子形体长度、词语数量、结构复杂度等角度界定句子是否为长句。
S202、对话处理系统调用语义识别引擎将上述长对话文本拆解成至少两个短句,并对上述至少两个短句进行信息抽取,获取与人机对话剧本对应的第一语义信息集合。
上述第一语义信息集合包括至少两个第一语义信息,上述第一语义信息用于表示上述至少两个短句中的短句对应的用户意图。示例性的,对于上述至少两个短句来说,单个短句可以对应无意图、单意图或多意图的语义信息,多个短句也可对应同一个或一组语义信息,因此,上述第一语义信息集合中的第一语义信息与上述至少两个短句中的短句之间的对应关系可以是一对一、一对多、多对一或多对多,在此不做限定。
示例性的,若在上述至少两个短句中的一个或多个短句对应的语义信息与上述人机对话剧本关联的服务场景无关联,则可将其视为无意图短句,在识别用户意图的过程中舍弃该无意图短句对应的语义信息,可理解,此时上述第一语义信息集合中可不包含该无意图短句对应的语义信息,以减少计算量。此外,若在上述至少两个短句中有对应多意图的短句,则可先通过与该多意图短句对应的上下文信息确定该多意图短句对应的实际语义信息,并将该实际语义信息作为该多意图短句对应的第一语义信息加入上述第一语义信息集合中,或者将所有可能的语义信息均加入上述第一语义信息集合中,后续再基于与跳转条件的匹配结果或可能发生的意图冲突筛选得到该多意图短句对应的实际用户意图。
示例性的,可通过对上述长对话文本的句法结构和/或语法结构进行分析,将上述长对话文本拆分成至少两个短句,或者,也可以按照长对话文本中的文字分隔符号(如空格、特殊字符、标点符号等)将上述长对话文本拆分成至少两个短句,使得拆分得到的短句为形体较短、词语较少、结构较简单的句子,以便于提取其对应的语义信息。示例性的,拆分得到的短句可以是由短语或词语组成的具有特定语调并能独立表达一定语义的句子,拆分得到的多个短句之间也可以是语义上相互关联,但结构上互相不作句法成分。
此外,在本方法中,对上述至少两个短句进行信息抽取,可实现从短句对应的非结构化数据中提取结构化信息或半结构化信息,便于后续与跳转条件进行条件匹配。例如,提取出的结构化信息或半结构化信息可以是上述第一语义信息,可理解,该第一语义信息所包含的信息内容可以是该短句对应的词语,也可以是在上述至少两个短句中除该短句之外的其它短句所包含的词语。
在S202之后,对上述第一语义信息集合中的每个第一语义信息执行如下S203至S204或S203至S207,以识别上述第一语义信息所表示的用户意图。
S203、对话处理系统将上述第一语义信息集合中的第一语义信息与预设跳转条件集合中的跳转条件进行条件匹配。
S204、若匹配到与上述第一语义信息对应相同或等同语义的第一跳转条件,则对话处理系统根据上述第一语义信息,确定与上述第一语义信息所表示的用户意图对应的特征数据。
可理解,上述第一跳转条件可对应一个或多个上述预设跳转条件集合中的跳转条件。示例性的,该特征数据可以是上述第一语义信息中的包含的全部或部分词语,也可以是基于上述第一语义信息中包含的词语衍生的关联数据,用于描述上述第一语义信息所表示的用户意图。在本实施例中,若在预设跳转条件集合中匹配到与上述第一语义信息匹配的第一跳转条件,则可说明上述第一语义信息对应的表达用户意图的方式可以被上述人机对话引擎中的跳转条件(即上述第一跳转条件)识别,否则执行S205。
S205、若未匹配到与上述第一语义信息对应相同或等同语义的第一跳转条件,则对话处理系统根据与上述人机对话剧本关联的知识库对上述第一语义信息进行想象推理,获取与上述第一语义信息匹配的语义知识。
示例性的,上述知识库可基于在上述服务场景下可能发生的自然语言对话语句创建。在对上述第一语义信息进行想象推理时,可从中筛选出与上述第一语义信息匹配的语义知识,实现上述第一语义信息中的词语的语义拓展。
S206、对话处理系统根据上述第一语义信息和上述语义知识,确定第二语义信息。
上述第二语义信息与上述第一语义信息对应相同或等同语义,即二者可表示相同或等同的用户意图。可理解的,此时上述第二语义信息表达该用户意图的方式与上述第一语义信息是不同的,因此,S206可视为转换上述第一语义信息表达用户意图的方式的过程,通过转换语义信息的表达方式,降低在识别用户意图时信息丢失的可能性,提高用户意图识别的准确度。
示例性的,假设上述语义知识是上述第一语义信息所包含的部分词语的语义拓展,则可建立该语义知识与该词语之间的关联关系,得到上述第二语义信息。
S207、将上述第二语义信息与上述跳转条件进行条件匹配,若匹配到与上述第二语义信息对应相同或等同语义的第二跳转条件,则对话处理系统根据上述第二语义信息,确定与上述第一语义信息所表示的用户意图对应的特征数据。
同样的,上述第二跳转条件可对应一个或多个上述预设跳转条件集合中的跳转条件。上述特征数据可以是上述第二语义信息中的包含的全部或部分词语,也可以是基于上述第二语义信息中包含的词语衍生的关联数据,用于描述上述第一语义信息所表示的用户意图。在本实施例中,若在预设跳转条件集合中匹配到与上述第二语义信息匹配的第二跳转条件,则可说明对于通过对上述第一语义信息进行想象推理得到的上述第二语义信息而言,其对应的表达用户意图的方式可以被上述人机对话引擎中的跳转条件(即上述第一跳转条件)识别,否则可将上述第一语义信息丢弃,处理下一第一语义信息。
S208、对话处理系统根据上述第一跳转条件或上述第二跳转条件,确定与上述第一语义信息集合匹配的目标跳转条件集合。
上述目标跳转条件集合包含至少两个预设跳转条件中的跳转条件。示例性的,在具体实现S208时,可在每个第一语义信息对应的匹配过程中,依次将其对应的第一跳转条件或第二跳转条件加入上述目标跳转条件集合中,直至处理完上述第一语义信息集合中的每个第一语义信息。或者,在获取到上述对于第一语义信息集合中的每个第一语义信息对应的第一跳转条件或第二跳转条件之后,汇总上述第一跳转条件和上述第二跳转条件,得到上述目标跳转条件集合。可理解,上述目标跳转条件集合中可仅包含第一跳转条件、或仅包含第二跳转条件,或同时包含第一跳转条件和第二跳转条件。
S209、对话处理系统获取上述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级。
可理解的,上述响应优先级越高,在答复用户意图时对应的答复顺序越靠前。
S210、对话处理系统根据上述响应优先级和上述特征数据,确定与上述目标跳转条件集合中的跳转条件对应的机器响应策略,并调用上述人机对话引擎执行上述机器响应策略。
可选的,执行上述机器响应策略可包括如下至少一项:输出上述机器响应策略对应的机器语句,执行上述机器响应策略对应的业务操作。
上述机器语句可以是上述人机对话剧本中预设的答复语句,也可以是基于上述预设的答复语句和相应的特征数据衍生的语句,例如天气查询结果、语言翻译文本、百科问答结果。上述业务操作可以是在上述用户许可的情况下,与上述用户关联的第三方平台(如部署在该用户的终端设备上应用程序)进行交互,以使该第三方平台为上述用户提供相应的业务服务,如播放歌曲、播放新闻、播放影视作品、导航、订票等。
示例性的,在上述人机对话剧本中可预设完成该人机对话剧本对应的剧情任务时的剧情终点,上述目标跳转条件集合中的跳转条件与上述剧情终点对应,即在获取到与上述第一语义信息集合匹配的上述目标跳转条件之后,对话处理系统可调用上述人机对话引擎跳转到上述剧情终点处,并根据上述特征数据和上述响应优先级,有序生成并输出与该剧情终点对应的机器响应策略。
在本申请实施例中,相较于现有方案中通过压缩提取长句中的核心句确定长句对应的用户意图的方法,本方案通过将长句中的、与预设人机对话剧本对应的短句的第一语义信息与人机对话剧本中预设的跳转条件进行匹配,可以识别到多个短句对应的多个用户意图,避免信息遗漏,提高长句中用户意图识别的准确度。进一步的,根据该多个用户意图对应的响应优先级和表示用户意图的特征数据,可以建立起多个用户意图之间的逻辑架构并确定相应的机器响应策略,以便于为用户解决多用户意图形成的复杂逻辑下的实际用户需求,提高用户意图答复的准确度。
基于如图2所示的用户话句处理方法,在一些可选的实施例中,在S209之前,上述方法还包括:
S2091、对话处理系统根据与上述人机对话剧本对应的剧情任务,确定完成上述剧情任务需要采集的第一服务信息。
S2092、对话处理系统根据上述特征数据,确定上述长对话文本所包含的用于完成上述剧情任务的第二服务信息。
S2093、在上述第二服务信息与上述第一服务信息匹配的情况下,对话处理系统执行S209。
示例性的,可以将上述第一服务信息视为多个参数,对应的,可将上述第二服务信息视为该多个参数对应的参数值,然后可根据上述第二服务信息,确定上述第一服务信息中是否有参数缺失对应的参数值。若不缺失,则表示上述第二服务信息与上述第一服务信息匹配,此时上述对话处理系统可以根据上述第二服务信息所对应的特征数据完成上述人机对话剧本对应的剧情任务。若缺失,则表示上述第二服务信息与上述第一服务信息不匹配,可以向用户的终端设备输出用于获取缺失信息的机器语句,此时可跳过执行剩余步骤,以减少用户等待时间。对应的,用户可根据该机器语句的指示补充该确实信息。
在本实施例中,可理解,在答复用户意图之前,判断当前采集的特征数据是否满足完成该人机对话剧本中剧情任务所需采集的信息,可进一步提高用户意图答复的准确度。
在一些可选的实施例中,S202中获取第一语义信息集合的过程可以包括如下步骤:
S2021、对话处理系统对上述至少两个短句中的单个短句进行语义分析,确定上述单个短句的第三语义信息。
上述第三语义信息为从上述单个短句中分析得到的关键信息,用于表示上述单个短句对应的语义。
可理解的,上述关联信息可以是从上述单个短句中提取得到的信息,也可以是从上述至少两个短句中的除上述单个短句之外的其它短句中提取得到的信息。
S2022、对话处理系统根据上述第三语义信息,从上述至少两个短句中提取与上述单个短句对应的关联信息。
S2023、对话处理系统根据第三语义信息和上述关联信息,确定上述第一语义信息,并根据上述第一语义信息,确定与上述人机对话剧本对应的上述第一语义信息集合。
示例性的,该关联信息所属的信息类型可基于当前的服务场景确定,如,若当前服务场景为订机票,则在上述第三语义信息包含目的地的情况下,该关联信息可以是时间相关的信息或航空公司名称的信息。本方法在对每个短句进行信息抽取时,结合该短句中的关键信息(第三语义信息)和上述至少两个短句中包含的该短句的关联信息,可以进一步提高用户意图识别的准确度。
可选的,在S202或S2023中,确定与上述人机对话剧本对应的上述第一语义信息集合包括如下步骤:
S2024、对话处理系统将上述第一语义信息与上述人机对话剧本对应的关键词库进行关键词比对,确定比对结果,上述关键词库中的关键词根据上述人机对话剧本关联的服务场景确定。
示例性的,上述关键词库中的关键词可以是在上述服务场景下发生的自然语言对话过程中可能出现的高频词汇,上述比对结果可以包含与上述第一语义信息比对成功的关键词信息,如该关键词信息可以包含关键词、关键词数量、关键词在上述关键词库中的占比,或者也可以包含其它形式的、能够表现出上述第一语义信息与上述人机对话剧本关联性的信息。
S2025、若上述比对结果指示上述第一语义信息与上述人机对话剧本关联,则对话处理系统将上述第一语义信息加入与上述人机对话剧本对应的上述第一语义信息集合。
本方法通过关键词比对,筛选出与当前人机对话剧本的服务场景关联的第一语义信息,减少其它与该服务场景无关的第一语义信息对当前用户意图识别的影响,提高用户意图识别和答复效率。
在一些可选的实施例中,在S209之前,上述方法还包括:
S2094、对话处理系统根据上述特征数据,判断上述目标跳转条件集合中的跳转条件所表示的用户意图是否发生意图冲突。
可理解的,上述特征数据可以是从上述第一语义信息或上述第二语义信息中提取到的词语,可以区分上述长对话文本中对应的不同的用户意图,并且上述目标跳转条件集合中的跳转条件所表示的预测用户意图是与上述长对话文本所包含的用户意图相互匹配的,因此根据该特征数据可以判断上述目标跳转条件集合中的跳转条件所表示的预设的用户意图是否发生意图冲突,进一步的,可判断出在上述长对话文本中是否发生意图冲突。
S2095、若是,则根据上述至少两个短句,对话处理系统对发生意图冲突的用户意图对应的第一语义信息进行上下文分析,并根据分析结果更新上述目标跳转条件集合。
具体的,若未发生意图冲突,则可执行S206,若发生意图冲突,则可通过对发生意图冲突的第一语义信息进行上下文分析,实现结合上下文信息精准确定用户意图,并根据分析结果更新上述目标跳转条件集合,减少因意图冲突导致的用户意图识别错误,进一步提高用户意图识别和答复的准确度,提高用户体验。
示例性的,在更新上述目标跳转条件集合时,也同步更新上述目标跳转条件集合中发生意图冲突的跳转条件对应的特征数据。具体的,更新上述目标跳转条件集合的过程可以包括在上述目标跳转条件集合中,对上述发生意图冲突的第一语义信息对应的一个或多个跳转条件进行删除、修正、增加、替换等更新操作中的任意一种操作或多种操作的组合。可理解的,更新之后的上述目标跳转条件集合与更新前的目标跳转条件集合所包含的跳转条件可以是不同的。
可选的,对于本申请提供的任意一种实施例,其中的响应优先级可满足如下任意一项:
上述响应优先级根据上述目标跳转条件集合中的跳转条件所表示的用户意图对应的逻辑关系确定;上述响应优先级根据与上述目标跳转条件集合中的跳转条件匹配的第一语义信息对应的短句在上述长对话文本中的语序位置确定;上述响应优先级根据上述目标跳转条件集合中的跳转条件所表示的用户意图对应的服务场景和在上述人机对话剧本中预设的服务场景优先级确定。
在本实施例中,对于具有逻辑关系的多个用户意图,逻辑靠前的用户意图的响应 优先级较高,其对应的跳转条件的优先级也较高,反之,其对应的跳转条件的优先级越低。 可选的,若多个用户意图之中有用户意图对应的短句的句类为疑问句,则可判断上述多个 用户意图之间是否存在逻辑关系,若存在则按照该逻辑关系应答,若不存在则依次回答。如 用户询问应该买葡萄汁还是苹果汁
Figure 838706DEST_PATH_IMAGE001
葡萄汁和苹果汁哪个更有营养
Figure 5377DEST_PATH_IMAGE001
则用户同时包括两个 意图,且逻辑关系是购买更有营养的,因此可以先获取第二个用户意图对应的内容,再根据 第二个意图的回答内容回答第一个意图。
可理解,在根据上述逻辑关系确定上述响应优先级时,有助于根据上述逻辑关系确定用户在多意图叠加的情况下产生的更深层次的用户意图,有助于提高用户意图答复的逻辑性,提升交互体验。
上述语序位置即为上述长对话文本(或上述至少两个短句)对应的用户陈述语序,在根据上述语序位置确定上述响应优先级时,对于多个用户意图,可以实现“先问先答”的用户意图答复效果,与用户表达意图的思路保持一致,提高用户体验感。如,若多个用户意图对应的短句的句类均为陈述句的情况下,上述响应优先级可根据每个用户意图对应的短句在长对话文本中上述语序位置确定。
上述服务场景优先级用于表示与上述人机对话剧本关联的不同服务场景对应的服务顺序,在多个用户意图对应不同的服务场景的情况下,按照上述服务场景优先级所指示的服务顺序确定上述响应优先级,可以更好地协调不同服务场景对应的剧情任务的完成顺序,可以缩减因某个/些特定的服务场景对应的用户意图响应不及时产生的用户耐心消耗。如,若上述多个用户意图对应订票场景和导航场景,且订票场景高于导航场景的优先级,则此时优先回答用户的订票需求。
在一些可选的实施例中,上述跳转条件包含意图三元组,上述意图三元组包括意图关联关系、第一意图对象和第二意图对象,上述意图关联关系用于表示上述第一意图对象与上述第二意图对象之间的语义关系和/或语法关系,上述意图对象对应至少一个词语;上述第一语义信息包含原始三元组,上述原始三元组包括原始关联关系、第一原始对象和第二原始对象,上述原始关联关系用于表示上述第一原始对象与上述第二原始对象之间的语义关系和/或语法关系,上述原始对象对应一个词语;
上述第一跳转条件包含第一意图三元组,上述第一意图三元组与上述原始三元组对应相同或等同语义,上述第一意图三元组满足如下至少一项:
上述第一意图三元组包含的第一意图对象和第二意图对象分别与上述原始三元组包含的第一原始对象和第二原始对象具有共同指代关系,上述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,上述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;上述第二意图三元组包含的意图关联关系与上述原始三元组包含的原始关联关系对应的关系类型相同。
在本实施例中,以上对象(如上述原始对象或上述意图对象)对应的词语可以是概念、实体、词或词组。示例性的,上述同义关系可对应相同含义,上述近义关系、上述整体与部分关系、上述上位概念与下位概念关系可对应等同含义。在上述第一意图三元组中的一个意图对象对应多个词语时,若其中有至少一个词语与上述原始三元组中的一个原始对象所对应的词语为相同含义或等同含义,则可认为该意图对象与该原始对象之间具有共同指代关系。
在一些可选的实施例中,上述语义知识包括第一推理对象和第二推理对象,上述第一推理对象与上述第一原始对象之间存在关联关系,以及上述第一推理对象与上述第二原始对象之间不存在关联关系,上述第二推理对象与上述第二原始对象之间存在关联关系,以及上述第二推理对象与上述第一原始对象之间不存在关联关系;
S206包括如下步骤:
S2061、对话处理系统根据上述第一原始对象和上述第一推理对象,确定第一拓展对象,并根据上述第二原始对象和上述第二推理对象,确定第二拓展对象。
S2062、对话处理系统建立上述第一拓展对象与上述第二拓展对象之间的拓展关联关系,上述拓展关联关系用于表示上述第一拓展对象和上述第二拓展对象之间的语义关系和/或语法关系;并根据上述第一拓展对象、上述第二拓展对象和上述拓展关联关系,确定上述拓展三元组,上述第二语义信息包含上述拓展三元组。
可理解,上述第二跳转条件包含上述第二意图三元组,上述第二意图三元组与上述拓展三元组对应相同或等同语义,上述第二意图三元组满足如下至少一项:
上述第二意图三元组包含的第一意图对象和第二意图对象分别与上述拓展三元组包含的第一拓展对象和第二拓展对象具有共同指代关系,上述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,上述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
上述第二意图三元组包含的意图关联关系与上述拓展三元组包含的拓展关联关系对应的关系类型相同。
在本实施例中,可理解,上述关联关系用于表示推理对象与原始对象之间的语义关系和/或语法关系。通过三元组表示用户意图,可以降低用户意图提取和匹配过程中的计算量,提高用户意图识别效率。
基于以上实施例所示的用户话句处理方法的介绍,为使计算过程更加简洁,其中的语义信息还可以用三元组表示。下面将结合本申请实施例提供的图3和图4进行介绍。
图3为本申请实施例提供的一种用户话句处理方法的应用场景示意图,如图3所示,在该应用场景示意图中,用户在终端设备侧输入语音数据“这是一个测试,我明天想飞A市,虽然用户不会这样讲话,但我想试一下在有一些无关意图出现得到时候机器人能否理解我在表达什么,我想从B市出发,我想要晚上的,哦,算了,还是上午出发吧”。
上述语音数据对应的长对话文本对应的服务场景为订机票,对上述长对话文本进行拆分并对拆分得到的短句进行信息提取,可获取其包含的原始三元组。可以看出,结合该服务场景下的剧情任务,对该第一语义信息集合中的原始三元组进行关键词匹配,可确定“虽然用户不会这样讲话,但我想试一下在有一些无关意图出现得到时候机器人能否理解我在表达什么”对应与上述剧情任务无关,则可舍弃该部分内容,剩余短句对应的原始三元组可以包括原始三元组1(动宾关系,飞,A市)、原始三元组1(动宾关系,出发,B市),可理解的,此时前述实施例中的第三语义信息可对应以上原始三元组。示例性的,此时还可以获取与每个原始三元组包含的原始对象对应的关联信息,如“明天”对应的实体为“A市”,“上午”对应的实体为“B市”,因此结合上述原始三元组可知,用户意图为“今天上午要从B市出发飞A市”。
因此基于该用户意图,机器可理解到“为用户选择今天上午从B市飞A市的机票”。 此时对话处理系统可基于以上识别的用户意图生成对应的机器响应策略,如,人机对话引 擎输出机器语言答复“查到上午出发的航班,比较合适的是11月23日8点10分从B市机场出 发,10点25分到达A市机场,经济舱单价约449元,H航空H001次航班。要订这张票吗
Figure 69148DEST_PATH_IMAGE001
”,并将 机票链接呈现在终端设备的操作界面上。在机器语言答复的下方设置有用户反馈区域,用 户可通过该用户反馈区域对上述机器语言答复做出评价。应当说明的是,为了便于理解,图 3中用户语音数据和机器语言答复均以文字形式展示,不应对本申请构成限定。
可选的,基于图3所示的应用场景,上述用户话句处理方法中的跳转条件包含意图三元组,上述意图三元组包括意图关联关系、第一意图对象和第二意图对象,上述意图关联关系用于表示上述第一意图对象与上述第二意图对象之间的语义关系和/或语法关系,上述意图对象对应至少一个词语。
可理解,对话处理系统中的人机对话引擎的对话逻辑由人机对话剧本创建,假设该人机对话剧本包括多个剧情节点,每个剧情节点包括预设的机器引导话术、跳转条件以及满足该跳转条件情况下所跳转的目标剧情节点。示例性的,假设上述人机对话剧本关联的服务场景为买手机,则在该服务场景下,不同剧情节点对应的跳转条件可以如下表1所示:
表1,剧情节点对应的跳转条件
Figure 736889DEST_PATH_IMAGE002
根据表1所示的内容,可理解,每个剧情节点对应的意图三元组可通过在该剧情节点下机器预测的用户语句得到。将剧情节点1-1至剧情节点1-4的跳转条件分别记为跳转条件1至4,则跳转条件1至4分别包含的意图三元组可以记为:意图三元组1(陈述动宾关系,想要类动词,品牌),意图三元组2(陈述动宾关系,想要类动词,价格),意图三元组3(陈述动宾关系,想要类动词,颜色),意图三元组4(陈述动宾关系,想要类动词,型号)。可理解的,上述人机对话剧本中还可以包含其它服务场景对应的剧情节点,其对应的意图三元组可以记为意图三元组n(其它关联关系,第一意图对象,第二意图对象),为了方便描述在此不作一一示出。
可选的,上述第一语义信息包含原始三元组,上述原始三元组包括原始关联关系、第一原始对象和第二原始对象,上述原始关联关系用于表示上述第一原始对象与上述第二原始对象之间的语义关系和/或语法关系,上述原始对象对应一个词语。根据表1所示的上述人机对话剧本设定的情节可知,跳转条件1对应的下一个剧情节点为1-2,跳转条件2对应的下一个剧情节点为1-3,跳转条件3对应的下一个剧情节点为1-4。当用户输入语句(相当于前述实施例中的长对话文本)为“我想要买白色的A牌P50。”时,根据该用户输入语句的句法结构和/或语法结构进行分析,可将该用户输入语句拆分成多个短句,如“想要买白色手机”、“想要买A牌手机”、“想要买P50手机”,此时,对以上短句进行信息提取,可得到各自对应的原始三元组,如(陈述动宾关系,想要买,白色手机)、(陈述动宾关系,想要买,A牌手机)、(陈述动宾关系,想要买,P50手机)。
然后将以上原始三元组分别与表1中跳转条件所对应的意图三元组进行匹配,可依次匹配到第一意图三元组分别为意图三元组1、意图三元组2、意图三元组4。具体的,以原始三元组(陈述动宾关系,想要买,白色手机)和意图三元组1(陈述动宾关系,想要类动词,品牌)为例,原始三元组包含的原始关联关系和意图三元组包含的意图关联关系均为陈述动宾关系,且原始三元组包含的第一原始对象和意图三元组包含的第一意图对象具有共同指代关系(“想要买”属于想要类动词,即对应下位概念与上位概念关系),同理原始三元组包含的第二原始对象和意图三元组包含的第二意图对象也具有共同指代关系,因此可将意图三元组1视为与该原始三元组对应相同或等同语义的第一意图三元组。
进一步的,根据上述第一意图三元组,可确定与第一语义信息集合匹配的目标跳转条件集合,该目标跳转条件集合中包含意图三元组1、意图三元组2、意图三元组4。示例性的,在每个原始三元组匹配完成后,可根据匹配成功的原始三元组,确定其对应的用户意图的特征数据,同样以原始三元组(陈述动宾关系,想要买,白色手机)和意图三元组1(陈述动宾关系,想要类动词,品牌)为例,根据原始三元组可确定上述特征数据为“白色”,即从中提取到买手机时所需的颜色信息。
最后,若以上匹配成功的信息可以满足当前买手机的需求,则可跳转至剧情终点处,该剧情终端是上述人机对话剧本中的一个或多个剧情节点,其功能包括基于以上匹配成功的信息,为用户提供相应的服务(对应前述实施例中的机器响应策略),如输出推荐手机链接、下单推荐手机等。
示例性的,若未匹配到与以上原始三元组对应相同或等同语义的第一意图三元组时,可对该原始三元组所包含的第一原始对象和第二原始对象进行想象推理,转换原始三元组表达用户意图的方式,再进行匹配。为了更清楚地介绍该想象推理的过程,本申请实施例还提供了一种构建拓展三元组的流程示意图,请参阅图4。
如图4所示,与人机对话剧本关联的知识库中存储有多个知识节点Sub1至Sub6、Xa、Xb、Ya、Yb,以及该多个知识节点所对应的连接关系r12、r23、r34、r45、r56、r2和r3。为了便于理解,图4中以节点和关系线的形式简单示意其存储的语义知识,实际上还可以有其它形式,如通过关系型数据库、二维表结构等,在此不作限定。
在对原始三元组(r1,Xa,Xb)想象推理的过程中,从上述知识库中查找与第一原始对象Xa之间存在关联关系、且与第二原始对象Xb之间不存在关联关系的知识节点Ya作为第一推理对象,查找与第二原始对象Xb之间存在关联关系、且与第一原始对象Xa之间不存在关联关系的知识节点Yb作为第二推理对象,可得到第一拓展对象(Ya,Xa)和第二拓展对象(Xb,Yb),然后将第一拓展对象(Ya,Xa)和第二拓展对象(Xb,Yb)连接,可得到拓展三元组,该拓展三元组所包含的拓展对象和连接关系如图4右下方图所示。
下面举一个简单的例子,以便于理解上述推理过程。如,用户输入语句为“小明是谁的儿子”,则对该用户输入语句进行信息提取,可获取原始三元组为(人物角色关系,小明,儿子),从知识库中获取与“小明”存在关联关系且与“儿子”不存在关联关系的知识节点,得到包含第一拓展对象的语义知识(爸爸,小明),同样,获取与“儿子”存在关联关系且与“小明”不存在关联关系的知识节点,得到包含第二拓展对象的语义知识(儿子,小日),进一步可得到拓展三元组所包含的拓展对象和关联关系为:{(爸爸)ß(小明)ß(儿子)ß(小日)},其中箭头“ß”用于表示人名角色关系。若在上述意图三元组匹配到第二意图三元组为{(人名角色关系),(爸爸),(小明)},则可根据该第二意图三元组,确定原始三元组(人物角色关系,小明,儿子)对应的用户意图的特征数据,即上述用户输入语句经过转换处理之后,可确定其对应的用户意图可用“小明的爸爸是谁”表示,至此完成上述用户输入语句对应的用户意图识别过程。后续用户意图答复的过程可对应参考前述实施例中的相关介绍,在此不作赘述。可理解,通过三元组表示用户意图,可以降低用户意图识别过程中的计算量,提高用户意图识别效率。
本申请实施例还提供了一种用户话句处理装置,下面将结合本申请实施例中的图5对上述用户话句处理装置进行介绍,请参阅图5,图5是本申请实施例提供的一种用户话句处理装置的结构示意图。
如图5所示,上述用户话句处理装置500,应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统,上述对话处理系统包括语义识别引擎和人机对话引擎,上述人机对话引擎根据预设的人机对话剧本确定,上述人机对话剧本包含预设跳转条件集合,上述预设跳转条件集合包括至少两个跳转条件,上述跳转条件用于表示预设的在与上述人机对话剧本关联的服务场景下的用户意图;上述用户话句处理装置500包括:
第一获取单元501,用于调用上述人机对话引擎获取用户输入的语音信息对应的长对话文本;
抽取单元502,用于调用上述语义识别引擎将上述长对话文本拆解成至少两个短句,并对上述至少两个短句进行信息抽取,获取与上述人机对话剧本对应的第一语义信息集合,上述第一语义信息集合包括至少两个第一语义信息,上述第一语义信息用于表示上述至少两个短句中的短句对应的用户意图;
匹配单元503,用于将上述第一语义信息集合中的上述第一语义信息与上述预设跳转条件集合中的上述跳转条件进行条件匹配;
上述匹配单元503,还用于若匹配到与上述第一语义信息对应相同或等同语义的第一跳转条件,则根据上述第一语义信息,确定与上述第一语义信息所表示的用户意图对应的特征数据;
上述匹配单元503,还用于若未匹配到与上述第一语义信息对应相同或等同语义的上述第一跳转条件,则根据与上述人机对话剧本关联的知识库对上述第一语义信息进行想象推理,获取与上述第一语义信息匹配的语义知识;
上述匹配单元503,还用于根据上述第一语义信息和上述语义知识,确定第二语义信息,上述第二语义信息与上述第一语义信息对应相同或等同语义;
上述匹配单元503,还用于将上述第二语义信息与上述跳转条件进行条件匹配,若匹配到与上述第二语义信息对应相同或等同语义的第二跳转条件,则根据上述第二语义信息,确定与上述第一语义信息所表示的用户意图对应的上述特征数据;
第一确定单元504,用于根据上述第一跳转条件或上述第二跳转条件,确定与上述第一语义信息集合匹配的目标跳转条件集合,上述目标跳转条件集合包括至少两个上述跳转条件;
第二获取单元505,用于获取上述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级;
执行单元506,用于根据上述响应优先级和上述特征数据,确定与上述目标跳转条件集合中的跳转条件对应的机器响应策略,并调用上述人机对话引擎执行上述机器响应策略。
在一种可能的实施方式中,上述用户话句处理装置500还包括:
第二确定单元507,用于根据与上述人机对话剧本对应的剧情任务,确定完成上述剧情任务需要采集的第一服务信息;
第三确定单元508,用于根据上述特征数据,确定上述长对话文本所包含的用于完成上述剧情任务的第二服务信息;
上述执行单元506,还用于在上述第二服务信息与上述第一服务信息匹配的情况下,执行上述获取上述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级。
在一种可能的实施方式中,上述抽取单元502,还具体用于对上述至少两个短句中的单个短句进行语义分析,确定上述单个短句的第三语义信息;
上述抽取单元502,还具体用于根据上述第三语义信息,从上述至少两个短句中提取与上述单个短句对应的关联信息;
上述抽取单元502,还具体用于根据第三语义信息和上述关联信息,确定上述第一语义信息,并根据上述第一语义信息,确定与上述人机对话剧本对应的上述第一语义信息集合。
在一种可能的实施方式中,上述抽取单元502,还具体用于将上述第一语义信息与上述人机对话剧本对应的关键词库进行关键词比对,确定比对结果,上述关键词库中的关键词根据上述人机对话剧本关联的服务场景确定;
上述抽取单元502,还具体用于若上述比对结果指示上述第一语义信息与上述人机对话剧本关联,则将上述第一语义信息加入与上述人机对话剧本对应的上述第一语义信息集合。
在一种可能的实施方式中,上述用户话句处理装置500还包括:
判断单元509,用于根据上述特征数据,判断上述目标跳转条件集合中的跳转条件所表示的用户意图是否发生意图冲突;
若是,则上述第一确定单元504还用于根据上述至少两个短句,对发生意图冲突的用户意图对应的第一语义信息进行上下文分析,并根据分析结果更新上述目标跳转条件集合。
在一种可能的实施方式中,上述响应优先级满足如下任意一项:
上述响应优先级根据上述目标跳转条件集合中的跳转条件所表示的用户意图对应的逻辑关系确定;
上述响应优先级根据与上述目标跳转条件集合中的跳转条件匹配的第一语义信息对应的短句在上述长对话文本中的语序位置确定;
上述响应优先级根据上述目标跳转条件集合中的跳转条件所表示的用户意图对应的服务场景和在上述人机对话剧本中预设的服务场景优先级确定。
在一种可能的实施方式中,上述执行单元506,还具体用于调用上述人机对话引擎输出上述机器响应策略对应的机器语句;上述执行单元506,还具体用于调用上述人机对话引擎执行上述机器响应策略对应的业务操作。
在一种可能的实施方式中,上述跳转条件包含意图三元组,上述意图三元组包括意图关联关系、第一意图对象和第二意图对象,上述意图关联关系用于表示上述第一意图对象与上述第二意图对象之间的语义关系和/或语法关系,上述意图对象对应至少一个词语;上述第一语义信息包含原始三元组,上述原始三元组包括原始关联关系、第一原始对象和第二原始对象,上述原始关联关系用于表示上述第一原始对象与上述第二原始对象之间的语义关系和/或语法关系,上述原始对象对应一个词语;
上述第一跳转条件包含第一意图三元组,上述第一意图三元组与上述原始三元组对应相同或等同语义,上述第一意图三元组满足如下至少一项:
上述第一意图三元组包含的第一意图对象和第二意图对象分别与上述原始三元组包含的第一原始对象和第二原始对象具有共同指代关系,上述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,上述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
上述第二意图三元组包含的意图关联关系与上述原始三元组包含的原始关联关系对应的关系类型相同。
在一种可能的实施方式中,上述语义知识包括第一推理对象和第二推理对象,上述第一推理对象与上述第一原始对象之间存在关联关系,以及上述第一推理对象与上述第二原始对象之间不存在关联关系,上述第二推理对象与上述第二原始对象之间存在关联关系,以及上述第二推理对象与上述第一原始对象之间不存在关联关系;
上述匹配单元503,还具体用于根据上述第一原始对象和上述第一推理对象,确定第一拓展对象,并根据上述第二原始对象和上述第二推理对象,确定第二拓展对象;
上述匹配单元503,还具体用于建立上述第一拓展对象与上述第二拓展对象之间的拓展关联关系,上述拓展关联关系用于表示上述第一拓展对象和上述第二拓展对象之间的语义关系和/或语法关系;并根据上述第一拓展对象、上述第二拓展对象和上述拓展关联关系,确定上述拓展三元组,上述第二语义信息包含上述拓展三元组;
上述第二跳转条件包含上述第二意图三元组,上述第二意图三元组与上述拓展三元组对应相同或等同语义,上述第二意图三元组满足如下至少一项:
上述第二意图三元组包含的第一意图对象和第二意图对象分别与上述拓展三元组包含的第一拓展对象和第二拓展对象具有共同指代关系,上述共同指代关系用于表示相同含义或等同含义的指代对象的指代关系,上述共同指代关系包括同义关系、近义关系、整体与部分关系、上位概念与下位概念关系;
上述第二意图三元组包含的意图关联关系与上述拓展三元组包含的拓展关联关系对应的关系类型相同。
关于上述用户话句处理装置500及其任意一种可能的实施方式所带来的技术效果,可对应参考前述实施例中用户话句处理方法的技术效果的介绍,在此不作赘述。
根据本申请实施例,图5中所示的装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。
本申请实施例还提供了一种电子设备,下面将结合本申请实施例中的图6对上述电子设备进行介绍,请参阅图6,图6是本申请实施例提供的一种电子设备的结构示意图。
如图6所示,上述电子设备600可以包括:一个或多个处理器601、一个或多个存储器602、一个或多个通信接口603以及总线604,上述处理器601、存储器602、通信接口603通过总线604连接。上述电子设备600可以是前述说明中的用户话句处理装置500。
其中,存储器602,用于存储程序;处理器601用于执行上述存储器存储的上述程序,在上述程序被执行的情况下,上述处理器601执行如上述用户话句处理方法中任意一种可能的实施方式中的方法。
应当理解,在本申请实施例中,上述存储器602包括但不限于是随机存储器(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmable read only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CDROM),以及除计算机内存及处理器缓存之外的外存储器,上述存储器602的一部分还可以包括非易失性随机存取存储器,例如,存储器602还可以存储设备类型的信息。
上述处理器601可以是一个或多个中央处理单元(central processing unit,CPU),在处理器601是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU;上述处理器601还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
前述实施例中所执行的步骤可以基于上述图6所示的电子设备600的结构实现,处理器601可执行本申请实施例中提供的用户话句处理方法的任意一个可选的实施例中所描述的实现方式,也可执行本申请实施例中所描述的用户话句处理装置500的实现方式,具体的,处理器601可实现图5中所示装置中的第一获取单元501、抽取单元502、匹配单元503、第一确定单元504、第二获取单元505、执行单元506、第二确定单元507、第三确定单元508或判断单元509的功能。通信接口603可支持实现图5中所示装置中的各单元之间的数据传递,以及在执行单元506输出机器语句。存储器602可在上述处理器601执行本申请实施例中所描述的用户话句处理装置500的实现方式时提供缓存,也可存储上述处理器601执行本申请实施例中所描述的用户话句处理装置500的实现方式所需要的计算机程序。
本申请实施例还提供了一种计算机存储介质,上述计算机存储介质中存储有计算机程序,上述计算机程序包括程序指令,在上述程序指令被处理器执行的情况下,上述处理器可以实现上述图2至图4中所示的方法。
本申请实施例还提供了一种计算机程序产品,上述计算机程序产品包括:指令或计算机程序;在上述指令或上述计算机程序被执行的情况下,可以实现上述图2至图4中所示的方法。
本申请实施例还提供了一种芯片,上述芯片包括处理器,上述处理器用于执行指令,在上述处理器执行上述指令的情况下,使得上述芯片可以实现上述图2至图4中所示的方法。可选的,上述芯片还包括通信接口,上述通信接口用于接收信号或发送信号。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以由计算机程序相关的硬件完成,上述计算机程序可存储于计算机存储介质中,上述计算机程序在执行时,可实现如上述各方法实施例的流程。而前述的计算机存储介质包括:只读存储器ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储计算机程序代码的介质。

Claims (10)

1.一种用户话句处理方法,其特征在于,应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统,所述对话处理系统包括语义识别引擎和人机对话引擎,所述人机对话引擎根据预设的人机对话剧本确定,所述人机对话剧本包含预设跳转条件集合,所述预设跳转条件集合包括至少两个跳转条件,所述跳转条件用于表示预设的在与所述人机对话剧本关联的服务场景下的用户意图;所述方法包括:
调用所述人机对话引擎获取用户输入的语音信息对应的长对话文本;
调用所述语义识别引擎将所述长对话文本拆解成至少两个短句,并对所述至少两个短句进行信息抽取,获取与所述人机对话剧本对应的第一语义信息集合,所述第一语义信息集合包括至少两个第一语义信息,所述第一语义信息用于表示所述至少两个短句中的短句对应的用户意图;
将所述第一语义信息集合中的所述第一语义信息与所述预设跳转条件集合中的所述跳转条件进行条件匹配;
若匹配到与所述第一语义信息对应相同或等同语义的第一跳转条件,则根据所述第一语义信息,确定与所述第一语义信息所表示的用户意图对应的特征数据;
若未匹配到与所述第一语义信息对应相同或等同语义的所述第一跳转条件,则根据与所述人机对话剧本关联的知识库对所述第一语义信息进行想象推理,获取与所述第一语义信息匹配的语义知识;
根据所述第一语义信息和所述语义知识,确定第二语义信息,所述第二语义信息与所述第一语义信息对应相同或等同语义;
将所述第二语义信息与所述跳转条件进行条件匹配,若匹配到与所述第二语义信息对应相同或等同语义的第二跳转条件,则根据所述第二语义信息,确定与所述第一语义信息所表示的用户意图对应的所述特征数据;
根据所述第一跳转条件或所述第二跳转条件,确定与所述第一语义信息集合匹配的目标跳转条件集合,所述目标跳转条件集合包括至少两个所述跳转条件;
获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级;
根据所述响应优先级和所述特征数据,确定与所述目标跳转条件集合中的跳转条件对应的机器响应策略,并调用所述人机对话引擎执行所述机器响应策略。
2.根据权利要求1所述的方法,其特征在于,在所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级之前,所述方法还包括:
根据与所述人机对话剧本对应的剧情任务,确定完成所述剧情任务需要采集的第一服务信息;
根据所述特征数据,确定所述长对话文本所包含的用于完成所述剧情任务的第二服务信息;
在所述第二服务信息与所述第一服务信息匹配的情况下,执行所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述至少两个短句进行信息抽取,获取与所述人机对话剧本对应的第一语义信息集合包括:
对所述至少两个短句中的单个短句进行语义分析,确定所述单个短句的第三语义信息;
根据所述第三语义信息,从所述至少两个短句中提取与所述单个短句对应的关联信息;
根据第三语义信息和所述关联信息,确定所述第一语义信息,并根据所述第一语义信息,确定与所述人机对话剧本对应的所述第一语义信息集合。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一语义信息,确定与所述人机对话剧本对应的所述第一语义信息集合包括:
将所述第一语义信息与所述人机对话剧本对应的关键词库进行关键词比对,确定比对结果,所述关键词库中的关键词根据所述人机对话剧本关联的服务场景确定;
若所述比对结果指示所述第一语义信息与所述人机对话剧本关联,则将所述第一语义信息加入与所述人机对话剧本对应的所述第一语义信息集合。
5.根据权利要求4所述的方法,其特征在于,在所述获取所述目标跳转条件集合中的跳转条件所表示的用户意图的响应优先级之前,所述方法还包括:
根据所述特征数据,判断所述目标跳转条件集合中的跳转条件所表示的用户意图是否发生意图冲突;
若是,则根据所述至少两个短句,对发生意图冲突的用户意图对应的第一语义信息进行上下文分析,并根据分析结果更新所述目标跳转条件集合。
6.根据权利要求4或5所述的方法,其特征在于,所述响应优先级满足如下任意一项:
所述响应优先级根据所述目标跳转条件集合中的跳转条件所表示的用户意图对应的逻辑关系确定;
所述响应优先级根据与所述目标跳转条件集合中的跳转条件匹配的第一语义信息对应的短句在所述长对话文本中的语序位置确定;
所述响应优先级根据所述目标跳转条件集合中的跳转条件所表示的用户意图对应的服务场景和在所述人机对话剧本中预设的服务场景优先级确定。
7.根据权利要求6所述的方法,其特征在于,所述调用所述人机对话引擎执行所述机器响应策略包括如下至少一项:
调用所述人机对话引擎输出所述机器响应策略对应的机器语句;
调用所述人机对话引擎执行所述机器响应策略对应的业务操作。
8.一种用户话句处理装置,其特征在于,应用于包含识别用户语音指令以及执行语音互动功能的对话处理系统,所述对话处理系统包括语义识别引擎和人机对话引擎,所述人机对话引擎根据预设的人机对话剧本确定,所述人机对话剧本包含预设跳转条件集合,所述预设跳转条件集合包括至少两个跳转条件,所述跳转条件用于表示预设的在与所述人机对话剧本关联的服务场景下的用户意图;所述装置包括:用于执行如权利要求1至7中任意一项所述方法的单元。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述处理器存储的所述程序,在所述程序被所述处理器执行的情况下,所述处理器执行如权利要求1至7中任意一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,所述处理器执行如权利要求1至7中任意一项所述的方法。
CN202211576180.9A 2022-12-09 2022-12-09 用户话句处理方法、装置、电子设备及计算机存储介质 Active CN115577092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211576180.9A CN115577092B (zh) 2022-12-09 2022-12-09 用户话句处理方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211576180.9A CN115577092B (zh) 2022-12-09 2022-12-09 用户话句处理方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN115577092A CN115577092A (zh) 2023-01-06
CN115577092B true CN115577092B (zh) 2023-03-24

Family

ID=84590729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211576180.9A Active CN115577092B (zh) 2022-12-09 2022-12-09 用户话句处理方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN115577092B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097886A (zh) * 2019-04-29 2019-08-06 贵州小爱机器人科技有限公司 意图识别方法及装置、存储介质、终端
CN111177310A (zh) * 2019-12-06 2020-05-19 广西电网有限责任公司 电力服务机器人智能场景会话方法及装置
WO2022116436A1 (zh) * 2020-12-01 2022-06-09 平安科技(深圳)有限公司 长短句文本语义匹配方法、装置、计算机设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9280520B2 (en) * 2012-08-02 2016-03-08 American Express Travel Related Services Company, Inc. Systems and methods for semantic information retrieval

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097886A (zh) * 2019-04-29 2019-08-06 贵州小爱机器人科技有限公司 意图识别方法及装置、存储介质、终端
CN111177310A (zh) * 2019-12-06 2020-05-19 广西电网有限责任公司 电力服务机器人智能场景会话方法及装置
WO2022116436A1 (zh) * 2020-12-01 2022-06-09 平安科技(深圳)有限公司 长短句文本语义匹配方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN115577092A (zh) 2023-01-06

Similar Documents

Publication Publication Date Title
CN110111780B (zh) 数据处理方法和服务器
KR20200108775A (ko) 트레이닝 말뭉치를 생성하는 방법, 장치, 기기 및 저장 매체
WO2021139243A1 (zh) 基于人机交互的数据处理方法、装置、设备及存储介质
US20180075014A1 (en) Conversational artificial intelligence system and method using advanced language elements
CN111177338B (zh) 一种基于上下文的多轮对话方法
CN106407393B (zh) 一种用于智能设备的信息处理方法及装置
CN108538294B (zh) 一种语音交互方法及装置
CN112562640A (zh) 多语言语音识别方法、装置、系统及计算机可读存储介质
CN107908743B (zh) 人工智能应用构建方法和装置
CN112100339A (zh) 用于智能语音机器人的用户意图识别方法、装置和电子设备
CN111368145A (zh) 一种知识图谱的创建方法、创建系统及终端设备
CN112541109B (zh) 答案摘要抽取方法及装置、电子设备、可读介质、产品
US20220277740A1 (en) Methods and apparatus for improving search retrieval using inter-utterance context
CN116522905B (zh) 文本纠错方法、装置、设备、可读存储介质及程序产品
CN113220854A (zh) 机器阅读理解的智能对话方法及装置
CN115577092B (zh) 用户话句处理方法、装置、电子设备及计算机存储介质
CN114299955B (zh) 语音交互的方法、装置、电子设备及存储介质
CN114171016B (zh) 语音交互的方法、装置、电子设备及存储介质
CN116108918A (zh) 对话预训练模型的训练方法及相关装置
CN115658875A (zh) 基于聊天服务的数据处理方法及相关产品
CN114860910A (zh) 智能对话方法及系统
JP2018159729A (ja) 対話システム構築支援装置、方法、及びプログラム
CN113434631A (zh) 基于事件的情感分析方法、装置、计算机设备及存储介质
CN112163078A (zh) 智能应答方法、装置、服务器及存储介质
CN114078478B (zh) 语音交互的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant