CN115129828A - 人机交互方法、装置、智能机器人和存储介质 - Google Patents
人机交互方法、装置、智能机器人和存储介质 Download PDFInfo
- Publication number
- CN115129828A CN115129828A CN202110321758.5A CN202110321758A CN115129828A CN 115129828 A CN115129828 A CN 115129828A CN 202110321758 A CN202110321758 A CN 202110321758A CN 115129828 A CN115129828 A CN 115129828A
- Authority
- CN
- China
- Prior art keywords
- named entity
- statement
- interactive
- predicate
- triple
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000003993 interaction Effects 0.000 title claims abstract description 41
- 230000002452 interceptive effect Effects 0.000 claims abstract description 137
- 230000004044 response Effects 0.000 claims abstract description 34
- 239000013598 vector Substances 0.000 claims description 47
- 238000002372 labelling Methods 0.000 claims description 13
- 238000013145 classification model Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 abstract description 11
- 230000000694 effects Effects 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 5
- 230000009466 transformation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000010985 leather Substances 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 240000007087 Apium graveolens Species 0.000 description 2
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 2
- 235000010591 Appio Nutrition 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供一种人机交互方法、装置、智能机器人和存储介质,该方法包括:智能机器人获取交互语句中的第一命名实体。再根据交互语句,从包含此第一命名实体的三元组关系中确定目标谓词,根据第一命名实体和目标谓词,确定第二命名实体。最终,根据包含第一命名实体和第二命名实体以及目标谓词的三元组关系,生成用于应答交互语句的应答语句。对于应答语句中的命名实体和谓词的确定,上述方法中,目标谓词和第二命名实体的分步确定方式能够减少应答语句生成过程中的计算量,进一步保证交互语句的应答效率,保证人机对话效果。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种人机交互方法、装置、智能机器人和存储介质。
背景技术
随着人工智能技术的发展,各种智能机器人越来越多地进入人们的生活,比如服务机器人、自移动售货机器人、商用机器人等等。为了方便用户的使用,智能机器人通常都支持多种人机交互方式,比如支持以文字或者语音形式实现人机对话。
在实际应用中,对于用户输入的对话内容,智能机器可以借助预设建立的知识图谱实现人机对话,也可以借助预先建立的常见问题解答(Frequently Asked Questions,简称FAQ)集合实现人机对话。
发明内容
本发明实施例提供一种人机交互方法、装置、智能机器人和存储介质,用以保证人机对话的效果。
本发明实施例提供一种人机交互方法,包括:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
本发明实施例提供一种人机交互装置,包括:
获取模块,用于获取交互语句中的第一命名实体;
谓词确定模块,用于根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
实体确定模块,用于根据所述第一命名实体和所述目标谓词,确定第二命名实体;
应答模块,用于根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
本发明实施例提供一种智能机器人,包括:处理器和存储器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
本发明实施例提供了一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器至少执行以下的动作:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
本发明提供的人机交互方法,智能机器人获取用户输入的交互语句并提取其中的第一命名实体。再根据交互语句,从包含此第一命名实体的三元组关系中确定目标谓词。进一步根据第一命名实体和目标谓词,确定第二命名实体。最终,根据包含第一命名实体和第二命名实体以及目标谓词的三元组关系,生成应答语句,以应答交互语句。
上述方法中,智能机器人先在众多三元组关系中确定目标谓词,并以目标谓词为条件对众多三元组关系进行筛选,再在剩余的三元组关系中确定第二命名实体。目标谓词和第二命名实体的分步确定方式能够减少应答语句生成过程中的计算量,保证交互语句的应答效率,进一步保证人机对话效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种人机交互方法的流程图;
图2为本发明实施例提供的另一种人机交互方法的流程图;
图3为本发明实施例提供的又一种人机交互方法的流程图;
图4为本发明实施例提供的人机交互方法应用在家居场景中的示意图;
图5为本发明实施例提供的人机交互方法应用在商场场景中的示意图;
图6为本发明实施例提供的一种人机交互装置的结构示意图;
图7为与图6所示实施例提供的人机交互装置对应的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式。除非上下文清楚地表示其他含义,“多个”一般包含至少两个。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
正如背景技术中提及的,智能机器人可以借助预设建立的知识图谱实现人机对话,也可以借助预先建立的FAQ集合实现人机对话,也可以借助预先训练好的对话模型实现人机对话。
其中,知识图谱中包含的知识可以从预先收集的众多语句中抽取出来。知识图谱中的每条知识都可以认为是语句中不同命名实体各自对应的主谓宾(Subject,Predict,Object,简称SPO)三元组关系。其中,SPO三元组关系中的Subject可以称为命名实体1,Predict可以称为谓词,Object可以称为命名实体2。下述描述中均将SPO三元组关系简称为三元组关系。
在实际中,发明人发现,随着时间的累积,用户产生的交互语句的内容越来越丰富,因此,实现人机对话所使用的知识图谱、FAQ集合或者对话模型也都需要不断更新。对于更新过程,相较于重新收集样本并重新训练模型或者在FAQ集合中新增问答对,在知识图谱中新增三元组关系所需要人工成本最小。因此,发明人可以选择借助知识图谱实现人机对话。此时,可以使用本发明下述各实施例中提供的人机交互方法。
并且可选地,本发明各实施例提供的人机交互方法可以应用在诸如公共服务机器人、自移动售货机器人等等的智能机器人上。人机交互方法还可以应用在由诸如在线购物系统、公共服务系统中集成的人机对话插件(或者称为人机对话接口、人机对话功能模块)中;人机交互方法还可以应用在如智能家电、智能穿戴设备等智能终端上。泛泛而言,人机交互方法可以应用在任何支持人机对话的设备、系统中。可选地,下述各实施例均将智能机器人作为人机交互方法的执行主体进行说明。
基于上述描述,下面结合附图对本发明的一些实施方式作详细说明。在各实施例之间不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
图1为本发明实施例提供的一种人机交互方法的流程图。如图1所示,该方法包括如下步骤:
101,获取交互语句中的第一命名实体。
可选地,智能机器人上可以配置供用户输入对话语句的操作屏幕或键盘,此时,用户输入的交互语句表现为文字形式。可选地,智能机器人上还可以安装有诸如麦克风等拾音器件,当用户对说出交互语句时,智能机器人可以通过此拾音器件采集到语音形式的交互语句。之后,智能机器人便可以识别交互语句中包含的第一命名实体。
一种可选地识别方式,智能机器人可以对交互语句进行分词,并将分词结果中的各词语与预设词语集合中的词语进行比对。词语集合中包含预先收集的命名实体。分词结果中包含于预设词语集合中的词语也即是第一命名实体。
可选地,另一种更常见的识别方式,智能机器人还可以借助自身配置的序列标注模型识别第一命名实体。即将交互语句输入序列标注模型,以根据序列标注模型输出标注序列识别第一命名实体。
其中,序列标注模型可以是隐马尔科夫模型(Hidden Markov Model,简称HMM)、最大熵模型、条件随机场(conditional random field,简称CRF)模型以及基于双向变换编码(Bidirectional Encoder Representation from Transformers,简称BERT)的CRF模型中的任一种。
并且可选地,上述各种序列标注模型还可以采用BIO标注方式(Begin,Inside,Outside,简称BIO)或者BIOE标注方式(B-begin,I-inside,O-outside,E-end,S-single,简称BIOE)等等。以BIO标注方式为例,假设交互语句为“西游记的作者是谁”,则序列标注模型输出的标注序列为BII00000,标注序列中“BII”对应的“西游记”即为第一命名实体。
102,根据交互语句和包含第一命名实体的三元组关系,确定目标谓词。
接着,智能机器人可以从图形数据库中得到包含第一命名实体的M条三元组关系。可选地,智能机器人再对此M条三元组关系中包含的谓词与交互语句进行字符串匹配,并将匹配度最高的N条三元组关系中包含的K个谓词确定为目标谓词。其中,M大于N,N≥K≥1。可选地,智能机器人也可以从非关系型数据库中获取上述的M条三元组关系。
可见,步骤102也即是以第一命名实体为条件,对图形数据库中的三元组关系进行筛选;再借助交互语句,对M条三元组关系包含的谓词进行二次筛选,以最终得到目标谓词的过程。
可选地,图形数据库可以是Neo4j,非关系型数据库可以是Elasticsearch数据库。并且两种数据库是以不同的形式保存预先建立的命名实体与谓词之间的关系的。命名实体与谓词之间的关系在图形数据库中以三元组关系的形式存在,在非关系型数据库中以键值对的形式存在。并且图形数据库中的三元组关系或者非关系型数据库中保存的键值对,与发生人机交互的场景直接相关。
对于非关系型数据库中的键值对,举例来说,假设命名实体与谓词之间的关系可以描述为下述的多条三元组关系:三元组关系1【命名实体1,谓词1,命名实体2】、三元组关系2【命名实体1,谓词2,命名实体3】、三元组关系3【命名实体4,谓词3,命名实体1】。其中,命名实体1在三元组关系1和三元组关系2中位于谓词的正向,命名实体1在三元组关系3中位于谓词的反向。则在非关系型数据库中,命名实体1对应的键值对可以表现为:key-命名实体1;value-正向关系谓词1、谓词2;反向关系谓词3。
步骤102中是考虑到了交互语句与谓词在语义上的联系从而得到目标谓词。在此基础上,还可以进一步考虑交互语句与整个三元组关系在语义上的联系,此时即可执行下述步骤103。
103,根据第一命名实体和目标谓词,确定第二命名实体。
接着,智能机器人还可以从图形数据库中,获取包含同时包含第一命名实体和目标谓词的三元组关系,并计算每个三元组关系与交互语句之间的相似度,再确定最高相似度对应的三元组关系为目标三元组关,则目标三元组中除了第一命名实体之外的另一命名实体即为第二命名实体。其中,三元组关系和交互语句之间相似度具体可以表现为二者之间的余弦距离。
104,根据包含第一命名实体、目标谓词和第二命名实体的三元组关系,应答交互语句。
最终,智能机器人可以根据第一命名实体、目标三元组中的谓词以及第二命名实体生成应答语句,从而实现对交互语句的应答。
可选地,可以将第一命名实体、目标三元组中的谓词以及第二命名实体按照预设语句模板生成应答语句。语句模板可以为:“我来回答你,‘命名实体1’的‘谓词’是‘命名实体2’”。
但需要说明的有,由于生成的应答语句对应的三元组关系是一条预先建立的三元组关系,因此,在得到第一命名实体和第二命名实体后,还要考虑二者相对于谓词的位置。若句式模板中的命名实体1可以为交互语句中的第一命名实体,则命名实体2即为步骤103确定出的第二命名实体,反之亦然。
本实施例中,智能机器人获取交互语句中的第一命名实体。然后,先根据交互语句,从包含此第一命名实体的三元组关系中确定目标谓词,再根据第一命名实体和目标谓词,确定第二命名实体。最终,根据包含第一命名实体和第二命名实体以及目标谓词的三元组关系,生成交互语句对应的应答语句。
上述方法中,智能机器人先在众多三元组关系中确定目标谓词,并以目标谓词为条件对众多三元组关系进行筛选,再在剩余的三元组关系中确定第二命名实体。目标谓词和第二命名实体的分步确定方式能够减少应答语句生成过程中的计算量,保证交互语句的应答效率,进一步保证人机对话效果。
一种常见的方式,按照预设语句模板,将预先建立的众多三元组关系拼接成完整语句,进一步计算每个拼接语句与交互语句之间的相似度,根据相似度确定应答语句。这种方式下,相似度计算的计算量大,并进一步影响对话效果。
另一种常见的方式,还可以将每个拼接语句和交互语句组成语句对,借助分类模型对语句对中两语句的匹配性进行判断。这种方式下,分类模型的计算量同样很大。并且若一个语句对的分类结果为匹配,表明此语句对中的两语句在语义上关联,则可以直接用此语句对中的拼接语句应答交互语句。但在实际中,通常出现有多个语句对的分类结果都为匹配的情况,此时,则无法唯一确定应答语句,同样也会影响对话效果。
可见,上述常见的方式均不能实现本发明提供的各实施例具有的计算量小,交互语句的应答效率高,人机对话流畅性的效果。
上述实施例步骤102中公开了通过字符串匹配确定目标谓词的方式。除此之外,可选地,还可以采用计算交互语句和三元组关系中谓词之间的相似度的方式确定目标谓词。此时,图2为本发明实施例提供的另一种人机交互方法的流程图,如图2所示,该方法可以包括如下步骤:
201,获取交互语句中的第一命名实体。
上述步骤201的具体实现过程可以参见图1所示实施例中的相关描述,在此不再赘述。
202,确定包含第一命名实体的三元组关系中的备选谓词。
203,根据交互语句与备选谓词之间的相似度,确定目标谓词。
与上述实施例类似的,智能机器人在识别出的第一命名实体后,可以从图形数据库中得到包含第一命名实体的M条三元组关系,此M条三元组关系中包含的谓词即为备选谓词,备选谓词的数量可以为P个。之后,可以再计算P个备选谓词分别与交互语句之间的相似度,并将相似度最高的K个备选谓词确定为目标谓词。其中,P≥K≥1。
对于相似度的计算,可选地,可以将交互语句和备选谓词分别输入智能机器人自身配置的向量转换模型,以由向量转换模型输出交互语句对应的句向量以及备选谓词的词向量。接着,计算交互语句的句向量与备选谓词的词向量之间的相似度,并将相似度最高的预设数量个备选谓词确定为目标谓词。其中,向量之间的相似度可以具体为余弦距离。
对于向量转换的过程,一种可选地方式,可以使用句向量转换模型对交互语句进行向量转换,使用词向量转换模型对备选谓词进行向量转换。可选地,可以使用语句嵌入模型实现交互语句的向量转换。其中,语句嵌入模型比如可以是InferSent模型、Sentence-Bert模型等等。可选地,可以使用词嵌入模型、Fasttext模型和Bert模型等等实现备选谓词的向量转换。其中,词嵌入模型可以是word2vec模型、GloVe模型等等。
另一种可选地方式,交互语句和备选谓词也可以使用相同的词向量转换模型进行向量转换。其中,可以将交互语句的分词结果中的各词语输入词向量转换模型,再将各词语的词向量的均值确定为此交互语句的句向量。
又一种可选地方式,交互语句和备选谓词也可以使用相同句向量转换模型进行向量转换,尤其可以使用上述的Sentence-Bert模型。该模型沿用了孪生网络结构,使得交互语句和备选语句可以同时输入Sentence-Bert模型中的不同网络,从而提高向量转换的效率。另外,又由于Sentence-Bert模型中的两个网络共享权重,因此,使用该模型得到的交互语句的句向量以及备选谓词中的目标谓词的词向量之间的余弦距离更近,交互语句的句向量与备选谓词中的剩余谓词的词向量之间的余弦距离更远,从而使得目标谓词和剩余谓词的区分更加容易。
上述步骤202和步骤203也可以认为是步骤102一种可选地实现方式。
204,根据第一命名实体和目标谓词,确定第二命名实体。
205,根据包含第一命名实体、目标谓词和第二命名实体的三元组关系,应答交互语句。
上述步骤204~205的具体实现过程可以参见图1所示实施例中的相关描述,在此不再赘述。
本实施例中,通过使用向量转换模型以得到句向量和词向量,并且交互语句的句向量与目标谓词的词向量之间的相似度更高,与非目标谓词的词向量之间的相似度更低,也能够更容易、更准确地从备选谓词中确定出目标谓词。另外,本实施例未详细描述的部分以及所能实现的技术效果,均可参考对图1所示实施例的相关说明,在此不再赘述。
图3为本发明实施例提供的又一种人机交互方法的流程图,如图3所示,该方法可以包括如下步骤:
301,获取交互语句中的第一命名实体。
302,根据交互语句和包含第一命名实体的三元组关系,确定目标谓词。
上述步骤301~302的具体实现过程可以参见图1或图2所示实施例中的相关描述,在此不再赘述。
303,根据包含第一命名实体和目标谓词的三元组关系生成拼接语句,拼接语句具有第一句式。
304,根据交互语句和拼接语句,从拼接语句中抽取第二命名实体。
智能机器人可以将同时包含第一命名实体和目标谓词的每个三元组关系,按照预设语句模板进行拼接,以得到具有第一句式的拼接语句。语句模板可以为:“‘命名实体1’的‘谓词’是‘命名实体2’”。其中,命名实体1、命名实体2与第一命名实体、第二命名实体之间的关系可以参见步骤104中的相关描述。
基于拼接语句,一种可选地方式,智能机器人可以进一步计算拼接语句与交互语句之间的相似度,并将最高相似度的拼接语句对应的三元组关系为目标三元组关系,再从目标三元组关系中确定第二命名实体。
另一种可选地方式,智能机器人还可以将交互语句作为问题,将拼接语句作为文章输入自身配置的阅读理解模型,以由阅读理解模型输出第二命名实体在拼接语句中的起止位置,以及此起止位置的置信度。智能机器人可以根据起止位置抽取第二命名实体。
在实际中,若阅读理解模型输出的起止位置重合,表明模型从拼接语句中抽取出第二命名实体为空,则智能机器人将预设应答语句来应答交互语句。举例来说,预设应答语句可以为“对不起,我不明白呢”。
另外,上述使用的阅读理解模型是抽取式的,其的训练过程可以为:将预先收集的文章和问题作为一组训练样本输入模型,模型可以对每组训练样本进行向量转换和编码,借助注意力机制确定并输出答案在文章中的起止位置。再根据人工标注的答案在文章中的位置调整模型参数。可见,抽取式阅读理解模型训练的过程能够使模型学习到文章和问题之间丰富的语义关联,从而使得抽取出的第二命名实体更加准确。
可选地,智能机器人也可以使用生成式的阅读理解模型,即将交互语句和拼接语句输入模型,以由阅读理解模型根据输入的语句的语义生成第二命名实体。
上述步骤303和步骤304也可以认为是步骤103一种可选地实现方式。
305,根据包含第一命名实体、目标谓词和第二命名实体的三元组关系,应答交互语句。
与图1所示实施例相同的,智能机器人可以根据第一命名实体、目标三元组中的谓词以及第二命名实体生成应答语句,从而实现对交互语句的应答。可选地,可以将第一命名实体、目标三元组中的谓词以及第二命名实体按照预设句式模板生成应答语句。应答语句可以具有第二句式,即“我来回答你,‘命名实体1’的‘谓词’是‘命名实体2’”。当然,此第二句式也可以与第一句式相同,即“‘命名实体1’的‘谓词’是‘命名实体2’”。
其中,命名实体1、命名实体2和第一命名实体、第二命名实体之间的关系的可以参见图1所示实施例中的描述。
另外,需要说明的有,在实际中,步骤302确定出的目标谓词通常为多个,则步骤303中得到的拼接语句的数量也为多个。此时,可以根据阅读理解模型输出的起止位置的置信度,唯一确定第二命名实体,以进一步得到唯一的应答语句。其中,起止位置的置信度越大,抽取的第二命名实体的置信度也越高。
本实施例中,智能机器人可以将三元组关系进行拼接,得到拼接语句。再借助阅读理解模型,将交互语句作为问题,将拼接语句作为待理解的文章,从文章中抽取第二命名实体,由于阅读理解模型能够理解充分交互语句和拼接语句之间的语义联系,因此,能够保证第二命名实体抽取的准确性,从而进一步保证人机对话效果。另外,本实施例未详细描述的部分以及所能实现的技术效果,均可参考对图1所示实施例的相关说明,在此不再赘述。
基于上述各实施例,可选地,智能机器人可以直接输出同时包含第一命名实体、目标谓词和第二命名实体的应答语句。为了进一步保证应答语句的准确性,即应答语句与交互语句在语义上的关联性,还可以将交互语句和应答语句输入预设的分类模型,以由分类模型输出分类结果。
若分类结果表明交互语句和应答语句在语义上匹配,则直接输出应答语句即可。若分类结果表明交互语句和应答语句在语义上不匹配,则输出预设应答语句。举例来说,与阅读理解模型从拼接语句中抽取的第二命名实体为空的情况相同,此时,智能机器人输出的应答语句也可以为“对不起,我不明白呢”。
综上所述,图1所示实施例提供了通过字符串匹配确定目标谓词。图2所示实施例提供了计算基于孪生网络的Sentence-Bert输出的向量的相似度,根据此相似度确定目标谓词。图3所示实施例提供借助阅读理解模型确定第二命名实体,也提供了通过计算拼接语句和交互语句之间的相似度确定第二命名实体。另外,除了上述提供的方法之外,智能机器人也可以采用其他任何能够实现的方式来确定目标谓词和第二命名实体,并发明并不限定具体实现方式。
需要说明的还有,若用户输入的交互语句中存在多个第一命名实体,则每个第一命名实体都可以按照上述各实施例提供的方式得到对应一个应答语句,最终,将每个第一命名实体对应的应答语句一并输出出来。
为便于理解,结合如下场景对以上提供的人机交互方法的具体实现过程进行示例性说明。
(1)家居场景,用户可以向智能机器人发出交互语句“吴承恩是谁”。此语句输入序列标注模型后,模型输出的标注序列为BII00,则从中提取出第一命名实体为“吴承恩”。
假设图形数据库中包含的三元组关系有:三元组关系1【红楼梦,作者,曹雪芹】、三元组关系2【曹雪芹,字,梦阮】、三元组关系3【西游记,作者,吴承恩】、三元组关系4【吴承恩,字,汝忠】、三元组关系5【吴承恩,号,射阳居士】以及三元组关系6【吴承恩,号,射阳山人】。则智能机器人可以从图形数据库中筛选出包含“吴承恩”的三元组关系,即三元组关系3~三元组关系6。则三元组关系3~三元组关系6各自包含的谓词“作者”、“字”以及“号”即为备选谓词。
智能机器人可以将交互语句以及备选谓词输入基于孪生网络的Sentence-Bert模型,以得到交互语句的句向量以及多个备选谓词各自的词向量。再分别计算句向量与词向量之间的余弦距离,可以将余弦距离最高的2个备选谓词确定为目标谓词。则目标谓词可以确定为“作者”以及“字”。其中,目标谓词的数量可以自由设定。
之后,智能机器人可以将谓词为“作者”的三元组关系3,拼接成具有第一句式的拼接语句“西游记的作者是吴承恩”。同样的,也将谓词为“字”的三元组关系4拼接成“吴承恩的字是汝忠”。将拼接语句“西游记的作者是吴承恩”作为文章,将“吴承恩是谁”作为问题输入阅读理解模型,以由阅读理解模型从拼接语句中抽取出“西游记”,阅读理解还可以输出抽取结果对应的置信度为0.8。同样的,将拼接语句“吴承恩的字是汝忠”作为文章,将“吴承恩是谁”作为问题输入阅读理解模型,以由阅读理解模型从拼接语句中抽取出“汝忠”,阅读理解还可以输出抽取结果对应的置信度为0.2。则智能机器人可以将“西游记”确定为第二命名实体。
最终,智能机器人根据第一命名实体“吴承恩”第二命名实体“西游记”以及第二命名实体所属的三元组关系3中的目标谓词“作者”生成具有第二句式的应答语句“我来回答你,西游记的作者是吴承恩”。
可选地,在得到上述应答语句后,还可以将其和交互语句输入分类模型,以由分类模型确定二者在语义上是否匹配。此时,分类模型输出的分类结果为1,表明二者在语义上是匹配的,智能机器人可以直接输出此应答语句,也即是实现了人机对话。
上述内容可以结合图4理解。
(2)商场场景,用户可以向位于商场大厅的智能机器人发出交互语句“店铺A在几楼”。此语句输入序列标注模型后,模型输出的标注序列为BII00O,则从中提取出第一命名实体为“店铺A”。
假设图形数据库中包含的三元组关系有:三元组关系1【店铺A,售卖,服装】、三元组关系2【店铺A,销售,皮鞋】、三元组关系3【店铺B,位于,1楼】以及三元组关系4【店铺B,销售,服装】。则智能机器人可以从图形数据库中筛选出包含“店铺A”的三元组关系,即三元组关系1、三元组关系2。则三元组关系1和三元组关系2各自包含的谓词“售卖”以及“销售”即为备选谓词。
智能机器人可以将交互语句以及备选谓词输入基于孪生网络的Sentence-Bert模型,以得到交互语句的句向量以及多个备选谓词各自的词向量。再分别计算句向量与词向量之间的余弦距离,可以将余弦距离最高的2个备选谓词确定为目标谓词。则目标谓词可以为“售卖”以及“销售”。
之后,智能机器人可以将谓词为“售卖”的三元组关系1,拼接成具有第一句式的拼接语句“店铺A售卖服装”。同样的,也将谓词为“销售”的三元组关系2拼接成“店铺A销售皮鞋”。
将拼接语句“店铺A售卖服装”作为文章,将“店铺A在几楼”作为问题输入阅读理解模型,以由阅读理解模型从拼接语句中抽取出“服装”,阅读理解还可以输出抽取结果对应的置信度为0.5。同样的,将拼接语句“店铺A销售皮鞋”作为文章,将“店铺A在几楼”作为问题输入阅读理解模型,以由阅读理解模型从拼接语句中抽取出“皮鞋”,阅读理解还可以输出抽取结果对应的置信度为0.2。则智能机器人可以将“服装”确定为第二命名实体。
最终,智能机器人根据第一命名实体“店铺A”、第二命名实体“服装”以及第二命名实体所属的三元组关系1中的目标谓词“售卖”生成具有第二句式的应答语句“我来回答你,店铺A售卖服装”。
可选地,还可以将交互语句和应答语句输入分类模型,以由分类模型确定二者在语义上是否匹配。此时,分类模型输出的分类结果为0,表明二者在语义上不匹配,智能机器人可以输出预设应答语句“对不起,我不知道呢”,也即是实现了人机对话。
上述内容可以结合图5理解。
以下将详细描述本发明的一个或多个实施例的人机交互装置。本领域技术人员可以理解,这些人机交互装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图6为本发明实施例提供的一种人机交互装置的结构示意图,如图6所示,该装置包括:
获取模块11,用于获取交互语句中的第一命名实体。
谓词确定模块12,用于根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词。
实体确定模块13,用于根据所述第一命名实体和所述目标谓词,确定第二命名实体。
应答模块14,用于根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
可选地,所述谓词确定模块12包括:
第一确定单元121,用于确定包含所述第一命名实体的三元组关系中的备选谓词。
第二确定单元122,用于根据所述交互语句与所述备选谓词之间的相似度,确定所述目标谓词。
可选地,所述第二确定单元122具体用于:将所述交互语句和所述备选谓词分别输入向量转换模型;计算所述交互语句的句向量与所述备选谓词的词向量之间的相似度;以及将相似度最高的预设数量的备选谓词确定为所述目标谓词。
可选地,所述实体确定模块13包括:
拼接单元131,用于根据包含所述第一命名实体和所述目标谓词的三元组关系生成拼接语句,所述拼接语句具有第一句式。
抽取单元132,用于根据所述交互语句和拼接语句,从所述拼接语句中抽取所述第二命名实体。
可选地,所述抽取单元132具体用于:将所述交互语句作为问题将所述拼接语句作为文章输入阅读理解模型,以由所述阅读理解模型输出所述第二命名实体在所述拼接语句中的起止位置;以及根据所述起止位置,抽取所述第二命名实体。
可选地,所述应答模块14,还用于:若所述起止位置重合,则用预设应答语句应答所述交互语句。
可选地,所述应答模块14具体用于:根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,生成所述交互语句对应的应答语句,所述应答语句具有第二句式。
可选地,所述装置还包括:输入模块21,用于将所述交互语句和所述应答语句输入分类模型。
所述应答模块14,还用于若分类结果表明所述交互语句和所述应答语句在语义上不匹配,则输出预设应答语句。
可选地,所述获取模块11具体用于:将所述交互语句输入序列标注模型,以由所述序列标注模型输出标注序列;以及根据所述标注序列提取所述第一命名实体。
图6所示的装置可以执行前述图1至图3所示实施例提供的人机交互方法,本实施例未详细描述的部分以及所能实现的技术效果,均可参考对图1至图3所示实施例的相关说明,在此不再赘述。
以上描述了人机交互装置的内部功能和结构,在一个可能的设计中,人机交互装置的结构可实现为一电子设备,如图7所示,该电子设备可以包括:处理器31和存储器32。其中,所述存储器32用于存储支持该电子设备执行前述图1至图3所示实施例中提供的人机交互方法的程序,所述处理器31被配置为用于执行所述存储器32中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器31执行时能够实现如下步骤:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
可选地,所述处理器31还用于执行前述图1至图3所示实施例中的全部或部分步骤。
其中,所述电子设备的结构中还可以包括通信接口33,用于与其他设备或通信网络通信。
另外,本发明实施例提供了一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器至少执行以下的动作:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种人机交互方法,其特征在于,包括:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
2.根据权利要求1所述的方法,其特征在于,所述根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词,包括:
确定包含所述第一命名实体的三元组关系中的备选谓词;
根据所述交互语句与所述备选谓词之间的相似度,确定所述目标谓词。
3.根据权利要求2所述的方法,其特征在于,所述根据所述交互语句与所述备选谓词之间的相似度,确定所述目标谓词,包括:
将所述交互语句和所述备选谓词分别输入向量转换模型;
计算所述交互语句的句向量与所述备选谓词的词向量之间的相似度;
将相似度最高的预设数量的备选谓词确定为所述目标谓词。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一命名实体和所述目标谓词,确定第二命名实体,包括:
根据包含所述第一命名实体和所述目标谓词的三元组关系生成拼接语句,所述拼接语句具有第一句式;
根据所述交互语句和拼接语句,从所述拼接语句中抽取所述第二命名实体。
5.根据权利要求4所述的方法,其特征在于,所述根据所述交互语句和拼接语句,从所述拼接语句中抽取所述第二命名实体,包括;
将所述交互语句作为问题将所述拼接语句作为文章输入阅读理解模型,以由所述阅读理解模型输出所述第二命名实体在所述拼接语句中的起止位置;
根据所述起止位置,抽取所述第二命名实体。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述起止位置重合,则用预设应答语句应答所述交互语句。
7.根据权利要求1所述的方法,其特征在于,所述根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句,包括:
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,生成所述交互语句对应的应答语句,所述应答语句具有第二句式。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
将所述交互语句和所述应答语句输入分类模型;
若分类结果表明所述交互语句和所述应答语句在语义上不匹配,则输出预设应答语句。
9.根据权利要求1所述的方法,其特征在于,所述获取交互语句中的第一命名实体,包括:
将所述交互语句输入序列标注模型,以由所述序列标注模型输出标注序列;
根据所述标注序列提取所述第一命名实体。
10.一种人机交互装置,其特征在于,包括:
获取模块,用于获取交互语句中的第一命名实体;
谓词确定模块,用于根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
实体确定模块,用于根据所述第一命名实体和所述目标谓词,确定第二命名实体;
应答模块,用于根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
11.一种智能机器人,其特征在于,包括:处理器和存储器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
12.一种存储计算机指令的计算机可读存储介质,其特征在于,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器至少执行以下的动作:
获取交互语句中的第一命名实体;
根据所述交互语句和包含所述第一命名实体的三元组关系,确定目标谓词;
根据所述第一命名实体和所述目标谓词,确定第二命名实体;
根据包含所述第一命名实体、所述目标谓词和所述第二命名实体的三元组关系,应答所述交互语句。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110321758.5A CN115129828A (zh) | 2021-03-25 | 2021-03-25 | 人机交互方法、装置、智能机器人和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110321758.5A CN115129828A (zh) | 2021-03-25 | 2021-03-25 | 人机交互方法、装置、智能机器人和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115129828A true CN115129828A (zh) | 2022-09-30 |
Family
ID=83374760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110321758.5A Pending CN115129828A (zh) | 2021-03-25 | 2021-03-25 | 人机交互方法、装置、智能机器人和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115129828A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017092380A1 (zh) * | 2015-12-03 | 2017-06-08 | 华为技术有限公司 | 用于人机对话的方法、神经网络系统和用户设备 |
CN108717441A (zh) * | 2018-05-16 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
WO2019173085A1 (en) * | 2018-03-06 | 2019-09-12 | Microsoft Technology Licensing, Llc | Intelligent knowledge-learning and question-answering |
CN112100351A (zh) * | 2020-09-11 | 2020-12-18 | 陕西师范大学 | 一种通过问题生成数据集构建智能问答系统的方法及设备 |
CN112182178A (zh) * | 2020-09-25 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 智能问答方法、装置、设备及可读存储介质 |
WO2021000676A1 (zh) * | 2019-07-03 | 2021-01-07 | 平安科技(深圳)有限公司 | 问答方法、问答装置、计算机设备及存储介质 |
-
2021
- 2021-03-25 CN CN202110321758.5A patent/CN115129828A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017092380A1 (zh) * | 2015-12-03 | 2017-06-08 | 华为技术有限公司 | 用于人机对话的方法、神经网络系统和用户设备 |
WO2019173085A1 (en) * | 2018-03-06 | 2019-09-12 | Microsoft Technology Licensing, Llc | Intelligent knowledge-learning and question-answering |
CN110309271A (zh) * | 2018-03-06 | 2019-10-08 | 微软技术许可有限责任公司 | 智能知识学习及问答技术 |
CN108717441A (zh) * | 2018-05-16 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
WO2021000676A1 (zh) * | 2019-07-03 | 2021-01-07 | 平安科技(深圳)有限公司 | 问答方法、问答装置、计算机设备及存储介质 |
CN112100351A (zh) * | 2020-09-11 | 2020-12-18 | 陕西师范大学 | 一种通过问题生成数据集构建智能问答系统的方法及设备 |
CN112182178A (zh) * | 2020-09-25 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 智能问答方法、装置、设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
高昆等: "高分辨光学遥感影像复原与目标检测技术", 31 December 2020, 长春:吉林大学出版社, pages: 186 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107846350B (zh) | 一种语境感知网络聊天的方法、计算机可读介质和系统 | |
AU2019200437B2 (en) | A method to build an enterprise-specific knowledge graph | |
US10089364B2 (en) | Item recommendation device, item recommendation method, and computer program product | |
CN104915340B (zh) | 自然语言问答方法及装置 | |
WO2019084810A1 (zh) | 一种信息处理方法及终端、计算机存储介质 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN116795973B (zh) | 基于人工智能的文本处理方法及装置、电子设备、介质 | |
CN108536807B (zh) | 一种信息处理方法及装置 | |
KR20210070904A (ko) | 다중 문서 질의 응답을 위한 방법 및 장치 | |
CN112685550B (zh) | 智能问答方法、装置、服务器及计算机可读存储介质 | |
CN109933792A (zh) | 基于多层双向lstm和验证模型的观点型问题阅读理解方法 | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
CN111026840A (zh) | 文本处理方法、装置、服务器和存储介质 | |
CN113821588A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN116974554A (zh) | 代码数据处理方法、装置、计算机设备和存储介质 | |
CN116127348A (zh) | 文本标签生成、模型训练、文本分类方法及相关设备 | |
CN115374259A (zh) | 一种问答数据挖掘方法、装置及电子设备 | |
CN115033661A (zh) | 一种基于垂直领域知识图谱的自然语言语义理解方法和装置 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN116186219A (zh) | 一种人机对话交互方法方法、系统及存储介质 | |
CN114048319B (zh) | 基于注意力机制的幽默文本分类方法、装置、设备、介质 | |
CN115688758A (zh) | 一种语句意图识别方法、装置和存储介质 | |
CN115129828A (zh) | 人机交互方法、装置、智能机器人和存储介质 | |
CN112052320B (zh) | 一种信息处理方法、装置及计算机可读存储介质 | |
CN115062136A (zh) | 基于图神经网络的事件消歧方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |