CN114168723A - 一种用于解决多轮对话中虚槽值的方法、设备及介质 - Google Patents
一种用于解决多轮对话中虚槽值的方法、设备及介质 Download PDFInfo
- Publication number
- CN114168723A CN114168723A CN202111434028.2A CN202111434028A CN114168723A CN 114168723 A CN114168723 A CN 114168723A CN 202111434028 A CN202111434028 A CN 202111434028A CN 114168723 A CN114168723 A CN 114168723A
- Authority
- CN
- China
- Prior art keywords
- slot
- node
- slot value
- question
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000004044 response Effects 0.000 claims abstract description 34
- 230000004913 activation Effects 0.000 claims abstract description 19
- 230000003213 activating effect Effects 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000001960 triggered effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 17
- 238000012797 qualification Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000009191 jumping Effects 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种用于解决多轮对话中虚槽值的方法、设备及介质,用以解决现有的多轮对话系统在存在虚槽值时,难以给出准确答案的技术问题。其中,根据用户的输入问题,激活对应的多轮对话场景;确定输入问题中是否存在槽值;若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id;根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态;在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案;确定输入问题对应的应答信息,并将应答信息返回给用户。
Description
技术领域
本发明涉及智能问答技术领域,具体是一种用于解决多轮对话中虚槽值的方法、设备及介质。
背景技术
随着自然语言理解技术、人机交互技术以及智能计算技术的发展,智能问答技术得到迅速发展,进而融入到各行各业。在税务、政务、审批等领域的很多业务场景都需要智能设备与用户进行多轮交互。多轮对话作为智能对话的重要组成部分,因其交互的灵活性,被广泛研究与应用。
现有的多轮对话难以应对人们越来越多的需求,尤其是存在虚槽值的情况下,多轮对话系统不能按照人们的意愿给出相应的结果。现有的解决策略一般有两种情况:一是必须填充某一链条上的所有槽值才能给出答案;二是将虚槽值省略,直接录入下一级槽值。第一种情况造成交互不灵活;第二种情况则会使得槽结构混乱。因此如何完善多轮问答中虚槽值的处理方法,成为多轮问答技术中面临的一大挑战。
发明内容
本申请实施例提供了一种用于解决多轮对话中虚槽值的方法、设备及介质,用以解决现有的多轮对话系统在存在虚槽值时,难以给出准确答案的技术问题。
本申请实施例提供了一种用于解决多轮对话中虚槽值的方法,方法包括:根据用户的输入问题,激活对应的多轮对话场景;尝试提取输入问题中的槽值实体,以确定输入问题中是否存在槽值;若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id;根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态;在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案;根据激活槽值id和补齐后的槽答案以及槽结构,确定输入问题对应的应答信息,并将应答信息返回给用户。
在本申请的一种实现方式中,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,具体包括:根据激活槽值id,在槽结构中定位相应的激活槽值节点;将激活槽值节点作为起点,反向遍历槽结构,以确定出激活槽值节点的父节点及对应的父节点id;正向遍历槽结构和多轮对话场景对应的槽答案,分别确定其对应的各节点id及各节点之间的邻接关系;根据槽结构和槽答案分别对应的各节点id及各节点之间的邻接关系,确定父节点id在槽答案中是否存在;若不存在,则确定父节点为虚节点。
在本申请的一种实现方式中,确定输入问题对应的应答信息,并将应答信息返回给用户,具体包括:根据激活槽值id,确定是否能够从补齐后的槽答案中获取到答案;若无法获取到答案,则根据槽结构获取激活槽值id所在节点的下一级槽值;根据下一级槽值,确定针对输入问题的反问信息,并将反问信息及下一级槽值发送至用户,以通过返回的下一级槽值触发针对输入问题的新一轮对话问答。
在本申请的一种实现方式中,尝试提取输入问题中的槽值实体之前,所述方法还包括:获取用户的历史问答信息,并对历史问答信息进行实例提取,确定对应的问答实例;提取各问答实例中的问题数据,将各问题数据输入至预设的意图识别模型中去,以得到各问题数据对应的意图词;根据意图词,对各问题数据对应的问答实例进行聚类,并对处于同一类别下的问答实例进行语料标注。
在本申请的一种实现方式中,方法还包括:确定输入问题的意图词,并确定意图词所在类别下的其他问答实例的问题语料;在输入问题被认定为噪音的次数超过预设阈值的情况下,根据其他问答实例的问题语料,对输入问题对应的槽值进行替换。
在本申请的一种实现方式中,根据用户的输入问题,激活对应的多轮对话场景,具体包括:根据用户的输入问题,确定输入问题对应的业务场景,并激活业务场景对应的多轮对话场景;其中,业务场景至少包括以下一项或多项:税务、政务、审批。
本申请实施例还提供了一种用于解决多轮对话中虚槽值的设备,设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:根据用户的输入问题,激活对应的多轮对话场景;尝试提取输入问题中的槽值实体,以确定输入问题中是否存在槽值;若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id;根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态;在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案;根据激活槽值id和补齐后的槽答案以及槽结构,确定输入问题对应的应答信息,并将应答信息返回给用户。
本申请实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:根据用户的输入问题,激活对应的多轮对话场景;尝试提取输入问题中的槽值实体,以确定输入问题中是否存在槽值;若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id;根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态;在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案;根据激活槽值id和补齐后的槽答案以及槽结构,确定输入问题对应的应答信息,并将应答信息返回给用户。
本申请实施例提供的一种用于解决多轮对话中虚槽值的方法、设备及介质,至少具备以下有益效果:
通过在槽结构中引入虚节点,能够使得槽结构更加规整,不会出现某一级槽值数量过多且杂乱的情况;在多轮对话存在虚节点的情况下,用户在进行对话交互的过程中既可以主动激活虚节点,也可以忽略虚节点(对话系统通过槽结构主动补齐槽答案并激活虚节点),使用户得到符合其意愿的问答结果,灵活性更高。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的用于解决多轮对话中虚槽值的方法流程图;
图2为本申请实施例提供的多轮对话槽结构示意图;
图3为本申请实施例提供的多轮对话槽答案结构示意图;
图4为本申请实施例提供的用于解决多轮对话中虚槽值的方法详细流程图;
图5为本申请实施例提供的审批多轮对话示例结构图;
图6为本申请实施例提供的用于解决多轮对话中虚槽值的设备结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
多轮对话系统用于实现人机对话,在初步明确用户意图之后,需获取必要信息从而明确用户的最终指令。比如,订阅车票这一行为,需要用户提供乘车时间、出发地和到达地等信息。槽值是多轮对话过程中将初步用户意图转化为明确指令所需补全的信息,但是,若存在虚槽值,槽答案在不完整的情况下难以按照人们的意愿给出相应的答案。
本申请实施例提供了一种用于解决多轮对话中虚槽值的方法、设备及介质,用以解决现有的多轮对话系统在存在虚槽值时,难以给出准确答案的技术问题。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
如图1所示,本申请实施例提供的用于解决多轮对话中虚槽值的方法流程图主要包括以下步骤:
S101:根据用户的输入问题,激活对应的多轮对话场景。
用户可通过应用平台输入文字,或是通过终端设备以语音的形式提出问题,从而激活该问题对应的多轮对话场景,以及该多轮对话场景下对应的槽值。其中,语音需经过语音识别将其转换为文字形式。图2为本申请实施例提供的多轮对话槽结构示意图。如图2所示,槽结构中存在多个节点,其中,A节点为激活语,其他节点代表槽值。
在一个实施例中,服务器可根据用户的输入问题,确定输入问题对应的业务场景,从而激活该业务场景对应的对话场景。业务场景至少包括以下一项或多项:税务、政务、审批。比如,用户提出的问题为“教师资格证在哪里认定”,此问题对应的业务场景为审批领域,因此需激活政务业务场景下教师资格证这一对话场景。
S102:尝试提取输入问题中的槽值实体,以确定输入问题中是否存在槽值。
每个多轮对话场景都存在对应的多轮对话场景模板,也就是槽结构,通过将用户的输入问题与对应的多轮对话场景模板进行匹配,可尝试提取出输入问题中的槽值实体。若能提取到槽值实体,则说明当前输入问题中存在相匹配的槽值,可进一步确定出应答信息;若未提取到槽值实体,说明输入问题中不存在与此多轮对话场景对应的槽结构中相匹配的槽值,无法给出该输入问题的答案,那么该输入问题则被认定为噪音,将此结果反馈给用户,并记录噪音次数。
在一个实施例中,用户的输入问题被认定为噪音后,可更改问题表述继续激活对应的多轮对话场景。在噪音次数超过预设阈值的情况下,表明用户的问题始终无法与多轮对话场景模板匹配上,此时,在不更改语义的前提下,可对槽结构中的各槽值进行相应的更改。
具体地,服务器需对各槽值进行意图识别,以便于能够对相同意图下的槽值进行等义更换。首先,获取用户的历史问答信息,并对历史问答信息进行实例提取,确定对应的问答实例。问答实例包括用户的问题数据和答案数据。然后,提取各所述问答实例中的问题数据,将各所述问题数据输入至预设的意图识别模型中去,得到各问题数据对应的意图词。最后根据意图词,对各问题数据对应的问答实例进行聚类,并对处于同一类别下的问答实例进行语料标注。
进一步地,在输入问题被认定为噪音的次数超过预设阈值时,通预设的意图识别模型,确定用户输入问题的意图词,然后根据意图词,确定此意图词所在类别下的其他问答实例的问题语料。对其他问答实例的问题语料进行关键词提取,并根据提取到的问题关键词,对槽结构中相应的槽值进行替换。
例如,用户历史问答信息中对于教师资格证认定条件这一问题存在以下两种问答实例,一是提问“教师资格证认定有什么要求吗”,二是提问“教师资格证认定必须具备什么条件”,以上两种问题得到的答案均是“取得教师资格证,且教师资格证获得时间至今未超出三年”。上述问答实例意图均为查询教师资格证认定条件,因此,可将“查询教师资格证认定条件”作为意图词,对以上两种问答实例进行聚类和标注。这样在进行查询时,通过以上两种提问方式均可得到理想的答案。若多轮对话场景模板中针对该问题的槽值为“申请教师资格认定的条件”,而用户在具有相同意图的情况下,经过多轮输入问题后仍无法匹配到该槽值,那么可将槽值更改为“申请教师资格认定的要求”,以使多轮对话场景模板能够符合用户的表述习惯,有助于查询到符合其意愿的结果。
S103:若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id。
若能够提取到槽值,服务器需将提取到的槽值与多轮对话场景对应的槽结构进行完全匹配,进而得到该槽值在槽结构中对应的id。
S104:根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态。
槽答案指的是,答案以及答案对应的槽值条件。在进行问答时,个别槽值可以不填充,因此槽答案结构中可能存在虚节点(也可以将其称作虚槽值)。而若要获取问题的答案,需按照槽结构的等级顺序,依次定位槽值,最终才可确定问题中槽值所对应的答案。因此,在槽答案结构中存在虚节点的情况下,可通过槽结构将缺失节点的槽答案结构补齐。
在一个实施例中,服务器能够根据S103中获得的激活槽值id,在槽结构中定位到此id对应的激活槽值节点。然后由激活槽值节点作为起点,反向遍历槽结构,从而确定出激活槽值节点的父节点及对应的父节点id。在确定激活槽值的父节点后,正向遍历槽结构和多轮对话场景对应的槽答案,分别确定其对应的各节点id及各节点之间的邻接关系。依次比对槽结构和槽答案中存在的各节点以及各节点的邻接关系,便可确定出父节点id是否在槽答案中存在,若不存在,则此父节点为虚节点。
若父节点为虚节点,则需进一步确定该父节点是否为激活状态,确定多轮对话场景中所有激活槽值id,据此判断其中是否包括父节点id。若父节点id不存在,则说明父节点还未被激活,在进行问答时无法进行响应,需激活此父节点。若父节点不为虚节点,且处于激活状态,此时可直接通过所述激活槽值id、槽答案和槽结构,确定出输入问题对应的应答信息并返给用户。
例如,如图2提供的多轮对话槽结构示意图,以及图3提供的多轮对话槽答案结构示意图所示,图2中槽值B、槽值F为虚节点。在槽值C已经被激活的前提下,若用户输入问题对应的激活槽值id为H,将该激活槽值H作为起点,反向遍历出父节点为槽值F。正向遍历槽结构和槽答案,槽结构中存在槽值A-I,槽值H的邻接关系为槽值H-F-I,而槽答案中仅存在槽值A、D、E、C、H、I、G,且槽值H的邻接关系为H-C-I-G,由此可得知槽答案中父节点F并不存在,为虚节点。根据图2中的槽结构将图3中的槽答案补齐后,用户便能根据A-C-F-H定位到问题所对应的槽值,并从槽答案中找到对应的答案。
S105:在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案。
比对槽结构和槽答案中的各节点id以及各节点之间的邻接关系,根据槽结构将槽答案中的虚节点补齐。
S106:根据激活槽值id和补齐后的槽答案以及槽结构,确定输入问题对应的应答信息(应答信息可能是最终答案也可能是反问信息+下一级槽值),并将应答信息返回给用户。
若槽答案中不存在虚节点,或是通过槽结构将槽答案补齐后,可通过所有激活槽值id、槽答案和槽结构,确定应答信息。应答信息分为两种,一是能够根据所有激活槽值id直接定位到相应的答案,可直接将问题答案返给用户,比如在槽值C已经激活的情况下,输入问题中的槽值为G,则可以直接根据槽答案分支A-C-G返回答案;二是根据激活槽值id无法确定出最终答案,此时需获取输入问题槽值所对应的激活槽值id所在节点的下一级槽值,根据下一级槽值确定相应的反问信息,并将反问信息及下一级槽值返给用户,从而触发新一轮的对话问答。比如,输入问题中的槽值为C,通过槽结构可以得出槽值C的下一级槽值为槽值F和槽值G,此时,根据用户输入的问题无法准确确定出用户的询问意图,可通过反问“您想要了解的是F还是G?”以及槽值F、G来进一步明确用户的意图。
图4为提供的用于解决多轮对话中虚槽值的方法详细流程图。主要包括以下步骤:
S401:用户输入问题。
人机交互的多轮对话系统以用户为中心,用户通过平台输入文字信息或者通过设备输入语音信息作为输入问题,并激活相应的多轮对话场景。
S402:尝试提取槽值实体。
通过将输入问题与该多轮对话场景模板中各槽值匹配,尝试将问题中包含的槽值实体提取出来。
S403:判断问题是否包含槽值。
判断S402中输入问题是否提取到槽值,如果提取到槽值信息则跳转到S404,如果未提取到槽值信息则跳转到步骤S404’;
S404:确定激活槽值id。
用提取的槽值直接与相应多轮对话场景各槽值进行完全匹配,进而得到该槽值对应的id。
S404’:噪音。
若在用户输入的问题中在相应的多轮对话场景模板中未匹配到槽值,该输入问题则被认为是噪音,记录噪音次数,并将结果反馈给用户。
S405:获取该激活槽值的父节点id。
根据槽结构与该激活槽值id,获取该激活槽值的父节点id。
S406:判断该激活槽值父节点id是否是虚节点。
根据槽答案与槽结构,确定该激活槽值的父节点id是否是虚节点。若该激活槽值父节点是虚节点,则跳转到步骤S407,如果该激活槽值父节点不是虚节点,则跳转到步骤S410。
S407:判断该激活槽值父节点是否激活。
根据该场景所有已激活槽值id判断该激活槽值父节点是否激活,若没有激活则跳转到步骤S409,若已激活则跳转到步骤S410。
S408:激活该父节点。
若该激活槽值父节点是虚节点,且处于未激活的状态,则激活该父节点。
S409:补齐槽答案。
根据槽结构,将槽答案中的虚节点补齐。
S410:获取应答信息。
根据补齐后的槽答案与已激活所有槽值id,获取应答信息。
S411:判断是否获得返回答案。
根据当前已激活槽值判断是否能够获得最终答案,若返回答案则跳转到步骤S412’,若未获得返回答案则跳转到步骤S412。
S412:获取反问信息。
根据槽结构与已激活槽值获取反问信息(反问+槽值)。
S412’:将应答信息返回给用户。
将返回的最终答案或反问信息返回给用户。
图5为本申请实施例提供的审批多轮对话示例结构图。假设用户输入的问题为“教师资格证认定的地点在哪里”,教师资格证为激活语,通过该词可激活教师资格证对应的多轮对话场景。该问题对应的槽值为教师资格证认定与认定地点,因此,可定位到槽结构中教师资格证-教师资格证认定-办事流程-证书认定地点这一分支。查找证书认定地点这一槽值的父节点,父节点为办事流程,该节点为虚节点,则需根据图5中所示的槽结构将相应的槽答案中的虚节点补齐。补齐槽答案后,便可通过此前提到的分支,返回给用户认定地点具体在何处。
以上为本申请提出的方法实施例。基于同样的思路,本申请的一些实施例还提供了上述方法对应的设备和非易失性计算机存储介质。
图6为本申请实施例提供的用于解决多轮对话中虚槽值的设备结构示意图,设备包括:至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
根据用户的输入问题,激活对应的多轮对话场景;
尝试提取输入问题中的槽值实体,以确定输入问题中是否存在槽值;
若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id;
根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态;
在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案;
根据激活槽值id和补齐后的槽答案以及槽结构,确定输入问题对应的应答信息,并将应答信息返回给用户。
本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:
根据用户的输入问题,激活对应的多轮对话场景;
尝试提取输入问题中的槽值实体,以确定输入问题中是否存在槽值;
若存在,则将槽值与知识库中多轮对话场景对应的槽结构进行匹配,以确定槽值对应的激活槽值id;
根据槽结构、激活槽值id、多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断父节点是否为虚节点,以及是否处于激活状态;
在确定父节点为虚节点且处于激活状态的情况下,根据槽结构,向槽答案中填充缺失的虚节点,得到补齐后的槽答案;
根据激活槽值id和补齐后的槽答案以及槽结构,确定输入问题对应的应答信息,并将应答信息返回给用户。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种用于解决多轮对话中虚槽值的方法,其特征在于,所述方法包括:
根据用户的输入问题,激活对应的多轮对话场景;
尝试提取所述输入问题中的槽值实体,以确定所述输入问题中是否存在槽值;
若存在,则将所述槽值与知识库中所述多轮对话场景对应的槽结构进行匹配,以确定所述槽值对应的激活槽值id;
根据所述槽结构、所述激活槽值id、所述多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断所述父节点是否为虚节点,以及是否处于激活状态;
在确定所述父节点为虚节点且处于激活状态的情况下,根据所述槽结构,向所述槽答案中填充缺失的虚节点,得到补齐后的槽答案;
根据所述激活槽值id和所述补齐后的槽答案以及所述槽结构,确定所述输入问题对应的应答信息,并将所述应答信息返回给用户。
2.根据权利要求1所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,确定激活槽值所在节点的父节点,并判断所述父节点是否为虚节点,具体包括:
根据所述激活槽值id,在所述槽结构中定位相应的激活槽值节点;
将所述激活槽值节点作为起点,反向遍历所述槽结构,以确定出所述激活槽值节点的父节点及对应的父节点id;
正向遍历所述槽结构和所述多轮对话场景对应的槽答案,分别确定其对应的各节点id及各节点之间的邻接关系;
根据所述槽结构和所述槽答案分别对应的各节点id及各节点之间的邻接关系,确定所述父节点id在所述槽答案中是否存在;
若不存在,则确定所述父节点为虚节点。
3.根据权利要求1所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,确定所述输入问题对应的应答信息,并将所述应答信息返回给用户,具体包括:
根据所述激活槽值id,确定是否能够从所述补齐后的槽答案中获取到答案;
若无法获取到答案,则根据所述槽结构获取所述激活槽值id所在节点的下一级槽值;
根据所述下一级槽值,确定针对所述输入问题的反问信息,并将所述反问信息以及所述激活槽值id所在节点的下一级槽值发送至用户,以通过返回的下一级槽值触发针对所述输入问题的新一轮对话问答。
4.根据权利要求1所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,尝试提取所述输入问题中的槽值实体之前,所述方法还包括:
获取所述用户的历史问答信息,并对所述历史问答信息进行实例提取,确定对应的问答实例;
提取各所述问答实例中的问题数据,将各所述问题数据输入至预设的意图识别模型中去,以得到各所述问题数据对应的意图词;
根据所述意图词,对各所述问题数据对应的问答实例进行聚类,并对处于同一类别下的问答实例进行语料标注。
5.根据权利要求4所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,所述方法还包括:
确定所述输入问题的意图词,并确定所述意图词所在类别下的其他问答实例的问题语料;
在所述输入问题被认定为噪音的次数超过预设阈值的情况下,根据所述其他问答实例的问题语料,对所述输入问题对应的槽值进行替换。
6.根据权利要求1所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,根据用户的输入问题,激活对应的多轮对话场景,具体包括:
根据用户的输入问题,确定所述输入问题对应的业务场景,并激活所述业务场景对应的多轮对话场景;其中,所述业务场景至少包括以下一项或多项:税务、政务、审批。
7.根据权利要求1所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,判断所述父节点是否为虚节点,以及是否处于激活状态之后,所述方法还包括:
在所述父节点为虚节点且处于未激活状态的情况下,激活所述父节点;
在所述父节点不为虚节点且处于激活状态的情况下,根据所述激活槽值id、所述槽答案以及所述槽结构,确定所述输入问题对应的应答信息,并将所述应答信息返回给用户。
8.根据权利要求1所述的一种用于解决多轮对话中虚槽值的方法,其特征在于,确定所述输入问题中是否存在槽值之后,所述方法还包括:
若不存在槽值,则将所述输入问题作为噪音,并反馈给所述用户。
9.一种用于解决多轮对话中虚槽值的设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据用户的输入问题,激活对应的多轮对话场景;
尝试提取所述输入问题中的槽值实体,以确定所述输入问题中是否存在槽值;
若存在,则将所述槽值与知识库中所述多轮对话场景对应的槽结构进行匹配,以确定所述槽值对应的激活槽值id;
根据所述槽结构、所述激活槽值id、所述多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断所述父节点是否为虚节点,以及是否处于激活状态;
在确定所述父节点为虚节点且处于激活状态的情况下,根据所述槽结构,向所述槽答案中填充缺失的虚节点,得到补齐后的槽答案;
根据所述激活槽值id和所述补齐后的槽答案以及所述槽结构,确定所述输入问题对应的应答信息,并将所述应答信息返回给用户。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
根据用户的输入问题,激活对应的多轮对话场景;
尝试提取所述输入问题中的槽值实体,以确定所述输入问题中是否存在槽值;
若存在,则将所述槽值与知识库中所述多轮对话场景对应的槽结构进行匹配,以确定所述槽值对应的激活槽值id;
根据所述槽结构、所述激活槽值id、所述多轮对话场景对应的槽答案,确定激活槽值所在节点的父节点,并判断所述父节点是否为虚节点,以及是否处于激活状态;
在确定所述父节点为虚节点且处于激活状态的情况下,根据所述槽结构,向所述槽答案中填充缺失的虚节点,得到补齐后的槽答案;
根据所述激活槽值id和所述补齐后的槽答案以及所述槽结构,确定所述输入问题对应的应答信息,并将所述应答信息返回给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111434028.2A CN114168723A (zh) | 2021-11-29 | 2021-11-29 | 一种用于解决多轮对话中虚槽值的方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111434028.2A CN114168723A (zh) | 2021-11-29 | 2021-11-29 | 一种用于解决多轮对话中虚槽值的方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114168723A true CN114168723A (zh) | 2022-03-11 |
Family
ID=80481512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111434028.2A Pending CN114168723A (zh) | 2021-11-29 | 2021-11-29 | 一种用于解决多轮对话中虚槽值的方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114168723A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932044A (zh) * | 2024-03-22 | 2024-04-26 | 深圳市鸿普森科技股份有限公司 | 基于ai的心理辅导助手自动对话生成方法及系统 |
-
2021
- 2021-11-29 CN CN202111434028.2A patent/CN114168723A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932044A (zh) * | 2024-03-22 | 2024-04-26 | 深圳市鸿普森科技股份有限公司 | 基于ai的心理辅导助手自动对话生成方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108153780B (zh) | 一种人机对话装置及其实现人机对话的方法 | |
CN108900726B (zh) | 基于语音机器人的人工客服转接方法 | |
CN111984779B (zh) | 一种对话文本分析方法、装置、设备和可读介质 | |
CN111223485A (zh) | 智能交互方法、装置、电子设备及存储介质 | |
CN113159901B (zh) | 融资租赁业务会话的实现方法和装置 | |
CN106599317A (zh) | 问答系统的测试数据处理方法、装置及终端 | |
CN111680133A (zh) | 直播问答方法及装置 | |
CN112529585A (zh) | 风险交易的交互唤醒方法、装置、设备及系统 | |
CN111666388B (zh) | 对话数据处理方法、装置、计算机设备和存储介质 | |
CA3026936A1 (en) | Systems and methods for performing automated interactive conversation with a user | |
CN117521625A (zh) | 问答方法、装置、电子设备及介质 | |
CN114168723A (zh) | 一种用于解决多轮对话中虚槽值的方法、设备及介质 | |
CN116739004B (zh) | 一种意图识别方法、装置、设备及可读存储介质 | |
CN111309882B (zh) | 用于实现智能客服问答的方法和装置 | |
CN110347921B (zh) | 一种多模态数据信息的标签抽取方法及装置 | |
CN116522905A (zh) | 文本纠错方法、装置、设备、可读存储介质及程序产品 | |
CN110931017A (zh) | 一种充电桩用充电交互方法及充电桩用充电交互装置 | |
CN115293159A (zh) | 一种对话关键词提取方法、设备及介质 | |
CN114676677A (zh) | 信息处理方法、装置、服务器及存储介质 | |
CN114862242A (zh) | 人工客服分配方法及装置、存储介质及电子设备 | |
CN113609268A (zh) | 基于知识图谱的智能心理知识问答方法和装置 | |
CN111552782A (zh) | 一种题目搜索处理方法和装置 | |
CN106682221B (zh) | 问答交互的响应方法、装置及问答系统 | |
CN117640829A (zh) | 对话方法及装置、存储介质和电子设备 | |
CN113744066B (zh) | 信息推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |