CN115905497A - 确定答复语句的方法、装置、电子设备和存储介质 - Google Patents
确定答复语句的方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN115905497A CN115905497A CN202211671950.8A CN202211671950A CN115905497A CN 115905497 A CN115905497 A CN 115905497A CN 202211671950 A CN202211671950 A CN 202211671950A CN 115905497 A CN115905497 A CN 115905497A
- Authority
- CN
- China
- Prior art keywords
- sentence
- information
- query
- clarification
- statement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000004044 response Effects 0.000 claims abstract description 24
- 238000005352 clarification Methods 0.000 claims description 144
- 238000012545 processing Methods 0.000 claims description 19
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005067 remediation Methods 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种确定答复语句的方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及自然语言处理、知识图谱和智能问答等技术领域。确定答复语句的方法的具体实现方案为:响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息;关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词;根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句;以及根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。
Description
技术领域
本公开涉及人工智能领域,具体涉及自然语言处理、知识图谱和智能问答等技术领域,尤其涉及一种确定答复语句的方法、装置、设备和饥饿值。
背景技术
随着计算机技术的提高,智能问答技术得到快速发展,旨在智能的与用户进行语音交互,提高生活的智能化水平。
通常借助知识图谱进行知识存储,以在智能问答时更好地获取有关联的知识。
发明内容
本公开旨在提供一种利于提高答复语句的准确性和智能问答水平的确定答复语句的方法、装置、电子设备和存储介质。
根据本公开的一个方面,提供了一种确定答复语句的方法,包括:响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息;关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词;根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句;以及根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。
根据本公开的另一个方面,提供了一种确定答复语句的装置,包括:关键信息获取模块,用于响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息;关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词;语句调整模块,用于根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句;以及图谱查询模块,用于根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。
根据本公开的另一个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的确定答复语句的方法。
根据本公开的另一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的确定答复语句的方法。
根据本公开的另一个方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令存储于可读存储介质和电子设备其中至少之一上,所述计算机程序/指令在被处理器执行时实现本公开提供的确定答复语句的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的确定答复语句的方法和装置的应用场景示意图;
图2是根据本公开实施例的确定答复语句的方法的流程示意图;
图3是根据本公开实施例的得到调整后查询语句的原理示意图;
图4是根据本公开实施例的确定答复语句的原理示意图;
图5是根据本公开实施例的确定答复语句的装置的结构框图;以及
图6是用来实施本公开实施例的确定答复语句的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
知识图谱,是一种基于有向图的数据结构,由节点(point)及有向边(edge)组成。每个节点称为实体,边代表实体间的逻辑关系。知识图谱是为了准确地阐述人、事、物之间的关系,描述文本语义,在自然界建立实体关系的知识数据库。在自然语言处理的视角下,知识图谱可以表示从文本中抽取的语义和结构化的数据。在知识表示的视角下,知识图谱是采用计算机符号表示和处理知识的方法。在人工智能的视角下,知识图谱是利用知识库来辅助理解语言的工具。在数据库的视角下,知识图谱是利用图的方式存储知识的方法。
基于知识图谱的问答技术是通过先前挖掘的实体之间的关系建立知识,随后通过对用户提供的查询语句(query)进行解析,并根据解析结果从知识图谱中查询得到关键的实体与关系,从而整理得到答复。
在基于知识图谱的问答技术中,通常采用基于规则的方法或基于监督学习的方法来实现多轮问答。
基于规则的方法可以在多轮对话中,设定多个对话规则,并通过将上轮对话中得到的实体、属性等继承到下一轮问答对话中,来实现多轮对话。但该基于规则的方法泛化能力差,需要付出很大的人力成本和人为经验来制定规则,问答系统的智能程度与规则数量成正比,很难制定全量的规则来覆盖所有可能的问答情况,且制定的规则不具有迁移性,若将问答系统应用于新场景中,则需要重新制定新的规则。
基于监督学习的方法通过构建相应任务场景的历史对话和标签,使用人工智能模型的方式来学习指代、澄清、继承等逻辑。但该基于监督学习的方法通常只能针对单个对话场景来训练人工智能模型,训练得到的人工智能模型不具备场景间的迁移能力。再者,该方法需要大量的带标注的数据来对模型进行训练,模型训练的效果通常与数据量的大小成正比。但数据标注难度通常较大,需要投入较多的人力,且冷启动困难。再者,对于复杂的场景,训练模型的样本存在样本分布不均的情况,这在一定程度上会使得训练得到的模型的鲁棒性较差。
为了解决该问题,本公开提供了一种确定答复语句的方法、装置、设备和介质。以下先结合图1对本公开提供的方法和装置的应用场景进行描述。
图1是根据本公开实施例的确定答复语句的方法和装置的应用场景示意图。
如图1所示,该实施例的应用场景100可以包括终端设备110,该终端设备110可以为具有处理功能并集成有智能问答系统的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、智能音箱、智能可穿戴设备等等。
例如,终端设备110可以接收用户120提出问题的语音信号,并将语音信号转化为查询语句。随后,该终端设备110可以对查询语句进行处理,并输出答复语句130。例如,终端设备110可以经过与用户120的多轮对话,输出与查询语句对应的答复语句130。
在一实施例中,该应用场景100中还可以包括数据库140,该数据库140中存储有知识图谱150。终端设备110例如可以通过查询知识图谱150来确定答复语句130。其中,知识图谱150可以是根据历史问答语料不断更新维护得到的。其中,历史问答语料可以包括各个场景和领域的语料。
在一实施例中,该应用场景100中还包括服务器160,该服务器160可以为支持终端设备110中安装的客户端应用运行的各种后台管理服务器,本公开对此不做限定。在一实施例中,服务器160例如可以抽取历史问答语料中的知识,并根据抽取的知识来构建知识图谱150和不断更新维护知识图谱150,并将构建和更新维护后的知识图谱150存储至数据库140中。
需要说明的是,本公开提供的确定答复语句的方法可以由终端设备110执行。相应地,本公开提供的确定答复语句的装置可以设置在终端设备110中。
应该理解,图1中的终端设备110、数据库140和服务器160的数目和类型仅仅是示意性的。根据实现需要,可以具有任意数目和类型的终端设备110、数据库140和服务器160。
以下将结合图2~图4对本公开提供的确定答复语句的方法进行详细描述。
图2是根据本公开实施例的确定答复语句的方法的流程示意图。
如图2所示,该实施例的确定答复语句的方法200可以包括操作S210~操作S230。
在操作S210,响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息。
根据本公开的实施例,预定知识图谱可以由上文描述的服务器构建和更新维护得到。该实施例中,可以对查询语句进行解析,得到查询语句中的实体词和属性词。随后根据该实体词和属性词查询预定知识图谱,若查询得到与实体词之间经由指示属性词的边连接的唯一的属性值,则可以根据实体词、属性词和属性值整理得到答复语句,确定得到了答复语句。
根据本公开的实施例,若未查询得到属性值或查询得到多个属性值,则可以判定为无法确定答复语句,确定未得到答复语句。此种情况,该实施例可以将解析查询语句得到的实体词(可以作为第一关键词)及查询得到的与第一关键词关联的第二关键词(例如可以包括查询得到的属性和属性值)作为关键信息。或者,若解析查询语句未得到实体词或属性词,则可以确定查询得到的属性值不唯一,从而可以判定为无法确定答复语句。
该实施例中,还可以在查询预定知识图谱时,以预定知识图谱中查询语句中的关键词所在的节点为起始点,确定与该起始点连接的所有边指示的属性词及与该起始点经由单个边连接的连接节点,将属性词、连接节点表示的词和查询语句中的关键词均作为关键信息。其中,属性词和连接节点表示的词为查询得到的第二关键词。
在操作S220,根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句。
根据本公开的实施例,查询语句的上下文语句例如可以包括在问答场景中,在查询语句之前或之后用户提供的语句和问答系统提供的语句。
例如,该实施例可以结合关键信息和上下文语句确定查询语句的实际意图,根据实际意图来调整查询语句。例如可以将关键信息和上下文语句拼接后输入预先训练得到的意图识别模型,由意图识别模型输出实际意图。随后,根据实际意图对查询语句进行补充或修改。例如,若查询语句为“猪八戒呢”,根据关键词和上下文语句确定的实际意图为查询猪八戒的年龄,则可以将查询语句补充为“猪八戒的年龄是多少呢?”。
例如,该实施例可以根据关键信息确定是否存在需要澄清的信息。例如,若关键信息中包括至少两个属性词,则需要澄清的信息可以为该至少两个属性词。若关键信息中包括待澄清的信息,则可以确定指示该待澄清的信息的澄清问句。例如,可以将待澄清的信息代入预定的澄清问句的模板中,得到澄清问句。随后根据问答系统接收到的答复该澄清问句的澄清语句来调整查询语句。此实施例中,澄清问句和澄清语句为上下文信息。例如,若查询语句为“贾敏”,关键信息中的属性词包括“母亲”、“祖父”、“父亲”等,则澄清问句可以为“您想咨询的是贾敏的母亲、祖父还是父亲?”,若澄清语句为“贾敏的母亲”,则可以根据澄清语句将查询语句更改为“贾敏的母亲是谁?”。通过该实施例的确定澄清问句,并根据答复澄清问句的澄清语句来调整查询语句的方案,可以实现与用户的多轮对话,且可以进一步明确用户的查询意图,提高根据调整后的查询语句确定的答复语句的准确性,提高问答系统的使用体验。
在操作S230,根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。
该实施例可以根据调整后的查询语句重新查询预定知识图谱。具体可以解析得到调整后查询语句中的实体词和属性词。随后,根据该实体词和属性词查询预定知识图谱,得到与实体词之间经由指示属性词的边连接的唯一的属性值。随后可以根据实体词、属性词和查询得到的属性值整理得到答复语句。
本公开实施例的技术方案,在根据查询语句未得到答复语句的情况下,通过根据关键信息和上下文语句调整查询语句,可以使得调整后的查询语句更能表征用户的查询意图,并因此可以提高确定的答复语句的精度。本公开实施例的技术方案相较于相关技术,由于无需预先设定规则,也无需采用带标注的数据进行模型训练,而仅根据查询预定知识图谱得到的关键信息和上下文信息来调整查询语句即可得到准确的答复语句,即该技术方案借由预定知识图谱中维护的知识进行了答复语句的调整,因此该技术方案相较于现有技术不存在冷启动困难、迁移能力弱的问题,并因此具有较高的鲁棒性和准确性。
根据本公开的实施例,在多轮问答的场景中,存在单个查询语句表达不明确的情形,若仅根据该单个查询语句无法从预定知识图谱中查询得到唯一的属性值。例如,若单个查询语句中仅能解析出实体词(例如查询语句“猪八戒呢”中仅能解析出“猪八戒”),而未解析出属性词,查询预定知识图谱能够得到与实体词经由指示多个属性值的边连接的多个属性值。此种情况无法准确地确定答复语句。例如,若单个查询语句中仅能解析出属性词“技能”,而无法解析出实体词,则在查询预定知识图谱时,无法确定查询哪个实体的技能,因此无法准确地确定答复语句。
为了解决该问题,该实施例可以结合上文语句理解该单个查询语句的情形。例如,该实施例可以根据实时的对话维护全局关键信息。该全局关键信息可以包括实体词、属性词等信息。该实施例可以在未查询得到答复语句时,根据获取的关键信息更新全局关键信息。随后,根据更新后的全局关键信息来调整查询语句。
例如,该实施例可以在关键信息中包括实体词,而不包括属性词的情况下,采用关键信息中的实体词替换全局关键信息中的实体词,将全局关键信息中的属性词作为针对当前问答轮次中查询语句的属性词。随后,根据该更新后的全局关键信息中的实体词和属性词,对查询语句进行调整。
例如,对于查询语句“猪八戒呢”,若根据查询语句的上文语句“孙悟空的年龄是多少”维护的全局关键信息包括:实体词-孙悟空,属性词-年龄,则更新后的全局关键信息包括:实体词-猪八戒,属性词-年龄。根据该更新后的全局关键信息可以确定当前问答轮次中查询语句需要查询的是实体猪八戒的年龄(即属性为年龄),则调整得到的调整后查询语句可以为“猪八戒的年龄是多少”。
通过该实施例的方法,无需复杂的规则即可实现对话的继承关系,解决多轮对话中单个查询语句表达意图不明确的情况下,无法确定答复语句的问题。从而可以提高多轮对话的智能性和确定的答复语句的准确性。
可以理解的是,对话的继承关系例如可以包括实体词的继承、属性的继承、针对实体的极值的继承等。
例如,在针对上文描述的查询语句“猪八戒呢”确定查询语句时,继承了上文的查询语句中的属性词“年龄”。
例如,对于查询语句“身高呢”,根据其上文的查询语句“孙悟空的年龄”维护的全局关键信息包括:实体词-孙悟空,属性词-年龄,则更新后的全局关键信息包括:实体词-孙悟空,属性词-身高。该过程中,继承了上文的查询语句中的实体词“孙悟空”,调整后的查询语句可以为“孙悟空的身高是多少”。
例如,对于查询语句“贾政和贾赫呢”,根据其上文的查询语句“贾敏、贾政、贾赫年龄最高的是”维护的全局关键信息包括:实体词-贾敏、贾政、贾赫,属性词-年龄,实体的极值-最高,则更新后的全局关键信息包括:实体词-贾政、贾赫,属性词-年龄,实体的极值-最高。该过程中,继承了上文的查询语句中的属性词“年龄”和实体的极值“最高”,调整后的查询语句可以为“贾政和贾赫中年龄最高的是”。
图3是根据本公开实施例的得到调整后查询语句的原理示意图。
在一实施例中,在得到更新后的全局关键信息的情况下,例如还可能存在全局关键信息中包括需要澄清的信息的情况。此种情况下,无法确定准确的答复语句。为了解决该问题,该实施例还可以先根据更新后的全局关键信息确定是否存在待澄清的信息,若存在,可以确定指示待澄清的信息的澄清问句。随后,可以根据问答系统接收到的答复该澄清问句的澄清语句来调整查询语句。
例如,如图3所示,该实施例300在调整查询语句时,可以先获取根据查询语句310查询预定知识图谱320得到的关键信息330。随后根据该关键信息330更新全局关键信息340。随后,通过操作S311判定更新后的全局关键信息中是否包括待澄清的信息,若包括,则确定指示待澄清的信息的澄清问句350。若不包括,则可以直接根据更新后的全局关键信息调整查询语句。随后,问答系统可以输出该澄清问句350。问答系统可以将输出澄清问句350后接收到的用户语音360转化为语句,作为答复澄清问句的澄清语句370。
在得到澄清语句370后,该实施例300可以先通过操作S312判定根据澄清语句370是否可以得到澄清结果,若可以得到,则可以根据澄清结果调整查询语句310。若无法得到澄清结果,则该实施例300中,问答系统可以继续接收用户语音,并对后续接收的用户语音进行语句转化和解析。
在一实施例中,在根据澄清语句370未得到澄清结果的情况下,问答系统还可以再次输出澄清问句350,并根据再次接收到的答复待澄清问句350的澄清语句执行操作S312。直至在输出预定次数的待澄清问句350均未得到澄清结果的情况下,再确定答复失败。以使得问答系统继续接收用户语音,并对后续接收的用户语音进行语句转化和解析。
根据本公开的实施例,在操作S312中,可以解析澄清语句370,提取澄清语句370中的关键词,随后确定澄清问句350中是否包括该关键词。若包括,则可以确定根据该澄清语句370可以得到澄清结果,并将关键词作为澄清结果。该实施例可以将澄清结果补充到查询语句中,从而得到调整后查询语句。
根据本公开的实施例,在操作S312中,还可以先确定澄清语句370中是否包括指代词,若包括指代词,则可以根据指代词和澄清问句中待澄清的信息的排列顺序,来确定澄清结果。例如,若查询语句310为“XX的年龄是?”,通过查询预定知识图谱320得到的关键信息包括:XX、年龄、演员、球星等。则可以确定实体词“XX”对应两个不同身份的人,相应地应有两个年龄,则确定答复语句中的年龄,则需要先澄清用户查询的是哪个“XX”。因此,需要澄清的信息包括演员和球星。相应地,澄清问句350可以为“您要咨询的是演员XX还是球星XX的年龄”。若澄清语句370为“第一个的XX”,则可以确定澄清问句中排在第一位的待澄清的信息“演员”为澄清结果。
例如,在得到澄清语句370后,例如还可以对澄清语句370中的指代词进行归一化处理,得到归一化后的词。随后,根据归一化后的词和澄清语句中待澄清的信息的排列顺序,来确定澄清结果。例如,澄清语句370中的指代词可能为“第一个”、“一”、“首个”等,该实施例可以将该些可能的指代词根据指代词的语义归一化为归一化后的词“第一个”,作为表示澄清语句的词槽。随后根据该归一化后的词来确定澄清语句中待澄清的信息中排在第一个信息,作为澄清信息。该实施例的方法,可以解决因澄清语句的表达不标准,导致无法准确确定澄清结果的技术问题,并因此利于提高确定的澄清结果的精度,提高确定的答复语句的精度。
例如,该实施例中,对指代词对归一化处理可以通过调用预定归一化模块提供的接口来实现。例如可以将澄清语句作为该预定归一化模块提供的接口的输入,由预定归一化模块提供的接口反馈归一化后的词。
根据本公开的实施例,在操作S312中,可以将澄清语句与澄清问句所指示的待澄清的信息进行匹配,根据匹配结果来确定澄清结果。例如,可以确定澄清语句与澄清问句中待澄清的信息之间的匹配度。随后根据匹配度确定澄清结果。例如,可以将待澄清的信息中与澄清语句之间的匹配度最高的目标信息作为澄清结果。或者,可以将待澄清的信息中与澄清语句之间的匹配度高于预定阈值的目标信息作为澄清结果。其中,可以采用n-gram句子相似度或句子向量的余弦相似度等来表示匹配度。本公开实施例的根据匹配度确定澄清结果的技术方案,相较于根据字词之间是否相同的方式确定澄清结果的技术方案,可以提高对澄清语句的兼容性,可以在保证确定的澄清结果的精度的同时,提高该实施例的方法的泛化能力。
例如,该实施例中,可以通过调用预定匹配度计算模块提供的接口来实现。例如,可以将澄清语句和澄清问句作为该预定匹配度计算模块提供的接口的输入,由预定匹配度计算模块提供的接口反馈匹配度。
根据本公开的实施例,获取的关键信息例如还可以包括各关键词的词性及实体词的类别。其中,关键词的词性可以包括实体词、属性词、属性值等。对实体词的类别的设置是为了有效识别可以指示多个实体的实体词,该实体词的类别例如可以是根据属性值等进行划分的,本公开对此不做限定。
在判定上文描述的关键信息和更新后的全局关键信息中的任一信息是否包括待澄清的信息时,可以通过以下方式中的至少之一来确定是否包括待澄清的信息:
在任一信息中包括第一实体词及第一实体词归属的至少两个不同类别时,确定第一实体的类别为待澄清的信息。例如,对于第一实体词“XX”,归属的类别包括演员和运动员,则可以确定演员“XX”和运动员“XX”为待澄清的信息。
在任一信息中包括第二实体词及与第二实体词对应的至少两个不同属性值,则可以确定与第二实体词对应的该至少两个不同属性值为待澄清的信息。需要说明的是,在该种方式中,至少两个不同属性值是归属于同一目标属性的。其中,目标属性例如可以为性别、年龄、身高等只能唯一对应一个属性值的属性,而身份、职业、毕业院校等属性不属于目标属性。例如,对于第二实体词“贾宝玉”,对应的至少两个不同属性值包括归属于属性“身高”的属性值“180cm”和“120cm”,则可以确定身高180cm的“贾宝玉”和身高120cm的“贾宝玉”为待澄清的信息。
响应于任一信息中包括第三实体词及与第三实体词关联的至少两个属性,则确定至少两个属性为待澄清的信息。例如,对于第三实体词“贾敏”,因查询语句中不包括属性词,则通过查询预定知识图谱得到的关键词中包括与实体词“贾敏”所在的节点连接的表示属性“母亲”、“父亲”、“女儿”、“年龄”等的多个边,则可以确定“贾敏”的母亲、“贾敏”的父亲、“贾敏”的女儿、“贾敏”的年龄等为待澄清的信息,确定的澄清问句可以为“你想咨询的是贾敏的母亲、父亲、女儿还是年龄”。
可以理解的是,上述确定待澄清的信息的方式仅作为示例以利于理解本公开,本公开对此不做限定。
图4是根据本公开实施例的确定答复语句的原理示意图。
在一实施例中,可以通过调用预定查询接口来查询预定知识图谱。例如,可以根据查询语句(也可以为上文描述的调整后查询语句)调用预定查询接口,获得预定查询接口反馈的查询结果。具体地,可以将查询语句作为预定查询接口的输入,由提供预定查询接口的查询服务对该查询语句进行解析,并根据解析得到的关键词查询预定知识图谱。随后根据查询预定知识图谱的结果确定反馈的查询结果。例如,若查询服务解析查询语句得到的关键词包括实体词和属性词,查询预定知识图谱得到的关键词中仅包括与实体词所在节点经由指示属性词的边连接的一个属性值时,则可以将实体词、属性词和属性值连接成语句,得到答复语句,并经由预定查询接口向问答系统反馈答复语句。若查询服务无法确定答复语句,例如可以将查询得到的关键词和解析查询语句得到的关键词作为关键信息,经由预定查询接口将该关键信息反馈给问答系统。
如此,提供预定查询接口的查询服务经由预定查询接口反馈的查询结果包括以下至少之一:查询语句的答复语句,与查询语句对应的关键信息。
通过该实施例的方法,可以将确定答复语句的处理逻辑与查询知识图谱的处理逻辑解耦,使得查询知识图谱的查询服务反馈的信息可以根据实际需求进行定制化设置,同时可以降低确定答复语句的处理逻辑的复杂性。
在一实施例中,可以采用如图4所示的对话流程400的方式来定义每轮对话中确定答复语句的各操作的流转,实现实体词、属性词等的继承以及澄清等功能。该对话流程主要由dst结点、policy结点和link连线组成。
dst结点主要用于实现查询语句中实体词、属性词等的继承、澄清结果的获取,以及查询知识图谱的查询服务的调用等。其中,dst:10001入口结点401用于接收用户语音,并根据用户语音转换得到语句,并根据得到的查询语句来调用预定知识图谱的查询服务接口查询预定知识图谱。
若查询服务接口未反馈答复语句而仅反馈了关键信息的情况下及查询服务接口反馈了答复语句的情况下,则经由link:1099连线跳转至dst:2结点402。其中,dst:2结点402为默认dst结点,在多轮对话中,每轮对话中针对查询语句的关键信息中的实体词和属性词都会存在全局变量(即全局关键信息)之中。该dst:2结点402用于维护更新全局关键信息,以继承之前对话中的关键信息。该dst:2结点402同时也会根据更新后的全局关键信息确定需要跳转的下一结点。
例如,若更新后的全局关键信息包含不需要澄清的实体词和唯一的属性词,但不包括属性值时,可以经由link:4连线跳转至dst:100结点403,以调用查询预定知识图谱的查询服务接口(即kg接口),获取与实体词所在节点经由指示属性词的边连接的属性值,并对查询服务接口反馈的查询结果进行重新解析。若更新后的全局关键信息包含不需要澄清的实体词唯一的属性词和与该唯一的属性词对应的属性值,或者查询服务接口反馈了答复语句,则可以确定答复语句唯一,并经由link:3连接跳转至policy:1结点404,以输出答复语句。
例如,若更新后的全局关键信息中包括前述的第一实体词及第一实体词归属的至少两个类别,则可以经由link:5连接跳转至policy:400结点405,确定待澄清的信息为至少两个类别c,并根据该待澄清的信息输出澄清问句。在接收到答复澄清问句的澄清语句后,则经由link:401连接跳转至dst:302结点406,由该dst:302结点406采用上文描述的方法确定根据澄清语句是否可以得到澄清结果,并获取澄清结果。若获取到澄清结果,则根据澄清结果调整查询语句,并经由link:303连接返回至dst:10001结点401。若未获取到澄清结果,则可以再次输出澄清问句。
例如,若更新后的全局关键信息中包括前述的第二实体词及与第二实体词对应的至少两个不同属性值,则可以经由link:20连接跳转至policy:200结点407,确定待澄清的信息为至少两个不同属性值,并根据待澄清的信息输出澄清问句。可以理解的是,在该实施例中,待澄清的信息例如还可以理解为是属于同一类别、且具有相同实体词的两个不同实体,该两个不同实体的目标属性不同。在接收到答复澄清问句的澄清语句后,则经由link:201跳转至dst:302结点406,由该dst:302结点406采用上文描述的方法确定根据澄清语句是否可以得到澄清结果,并获取澄清结果。若获取到澄清结果,则根据澄清结果调整查询语句,并经由link:303连接返回至dst:10001结点401。若未获取到澄清结果,则可以再次输出澄清问句。
例如,若更新后的全局关键信息中包括前述的第三实体词及与第三实体词关联的至少两个属性,则可以经由link:30连接跳转至policy:300结点408,确定待澄清的信息为至少两个不同属性p,并根据待澄清的信息输出澄清问句。在接收到答复澄清问句的澄清语句后,则经由link:301跳转至dst:302结点406,由该dst:302结点406采用上文描述的方法确定根据澄清语句是否可以得到澄清结果,并获取澄清结果。若获取到澄清结果,则根据澄清结果调整查询语句,并经由link:303连接返回至dst:10001结点401。若未获取到澄清结果,则可以再次输出澄清问句。
在一实施例中,若在输出预定次数的澄清问句均未得到澄清结果的情况下,则可以经由link:997连接跳转至policy:999结点409,默认答复失败,并返回dst:10001结点401。
可以理解的是,上述各policy结点是具体处理逻辑的实现节点,主要用于实现相关属性或实体的澄清功能和结果唯一时的答复功能,具体执行时机由对应的连线所确定。各link连线实现的是条件判断逻辑,可以根据当前对话状态的判断结果,引导走向不同的结点分支。
可以理解的是,dst:302结点406例如还可以采用上文描述的方法对指代词进行归一化处理,确定澄清语句与澄清问句中待澄清的信息之间的匹配度等。
可以理解的是,仅在查询预定知识图谱的查询服务正常运行的情况下,查询服务才能解析查询语句并根据解析结果查询预定知识图谱,并相应地反馈答复语句和/或关键信息。而在查询服务无法正常运行的情况下,则无法查询预定知识图谱并得到关键信息,此种情况下,查询服务例如还可以将异常信息作为查询结果反馈给问答系统,以便于问答系统的维护人员知晓查询服务的运行情况。相应地,该实施例中,例如还可以在根据任一查询语句查询预定知识图谱获得异常信息的情况下,根据异常信息输出异常提示信息,以起到对问答系统的维护人员的提示作用。
在一实施例中,查询服务无法得到关键信息和答复语句的原因可能包括查询预定知识图谱的鉴权权限异常、因预定知识图谱异常而无法查询、查询服务运行异常及预定知识图谱中不包括指示第一关键词的节点等。相应地,查询服务例如可以根据不同原因反馈不同类型的异常信息,则输出的异常提示信息可以根据异常信息的类型来确定,以使得输出的异常提示信息可以反应异常类型,以便于维护人员根据异常类型进行相应的补救。
例如,在对话流程400中,若查询预定知识图谱得到了预定知识图谱鉴权异常的类型的异常信息,则可以经由link:1000连接跳转至policy:1001结点410,以输出指示知识图谱鉴权失败的异常提示信息。若查询预定知识图谱得到了查询服务运行异常的类型的异常信息,则可以经由link:1002连接跳转至policy:1003结点411,以输出指示知识图谱查询异常的异常提示信息。其中,查询服务运行异常例如可以包括服务未启动和服务未正常连通等异常情况,本公开对此不做限定。若查询预定知识图谱得到了预定知识图谱异常的类型的异常信息,则可以经由link:1004连接跳转至policy:1005结点412,以输出指示知识图谱异常(即kg error)的异常提示信息。若查询预定知识图谱得到了预定知识图谱中不包括指示第一关键词的节点的类型的异常信息,则可以经由link:1010连接跳转至policy:1011结点413,以输出指示知识图谱未包括查询语句中的关键词的异常提示信息。
基于本公开实施例的对话流程400,可以解决多轮对话中的澄清问题、指代问题,且由于该对话流程400将各处理逻辑进行了模块结点化,因此泛化能力强,可以针对不同应用场景进行灵活调整。
基于本公开提供的确定答复语句的方法,本公开还提供了一种确定答复语句的装置,以下将结合图5对该装置进行详细描述。
图5是根据本公开实施例的确定答复语句的装置的结构框图。
如图5所示,该实施例的确定答复语句的装置500可以包括关键信息获取模块510、语句调整模块520和图谱查询模块530。
关键信息获取模块510用于响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息。其中,关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词。在一实施例中,关键信息获取模块510可以用于执行上文描述的操作S210,再次不再赘述。
语句调整模块520用于根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句。在一实施例中,语句调整模块520可以用于执行上文描述的操作S220,再次不再赘述。
图谱查询模块530用于根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。在一实施例中,图谱查询模块530可以用于执行上文描述的操作S230,再次不再赘述。
根据本公开的实施例,上述语句调整模块520可以包括澄清问句确定子模块和第一调整子模块。澄清问句确定子模块用于响应于关键信息中包括待澄清的信息,确定指示待澄清的信息的澄清问句。第一调整子模块用于响应于根据答复澄清问句的澄清语句得到澄清结果,根据澄清结果调整查询语句,得到调整后查询语句。
根据本公开的实施例,上述语句调整模块520可以包括全局信息更新子模块和第二调整子模块。全局信息更新子模块用于根据关键信息更新全局关键信息;全局关键信息是根据查询语句的上文语句维护的。第二调整子模块用于根据更新后的全局关键信息调整查询语句,得到调整后查询语句。
根据本公开的实施例,第二调整子模块可以包括澄清问句确定单元和语句调整单元。澄清问句确定单元用于响应于更新后的全局关键信息中包括待澄清的信息,确定指示待澄清的信息的澄清问句。语句调整单元用于响应于根据答复澄清问句的澄清语句得到澄清结果,根据澄清结果调整查询语句,得到调整后查询语句。
根据本公开的实施例,上述确定答复语句的装置500还可以包括归一化模块和第一结果确定模块。归一化模块用于响应于澄清语句中包括指代词,对指代词进行归一化处理,得到归一化后的词。第一结果确定模块用于根据归一化后的词和澄清问句中待澄清的信息的排列顺序,确定澄清结果。
根据本公开的实施例,上述确定答复语句的装置500还可以包括匹配度确定模块和第二结果确定模块。匹配度确定模块用于确定澄清语句与澄清问句中待澄清的信息之间的匹配度。第二结果确定模块用于根据匹配度,确定待澄清的信息中的目标信息为澄清结果。
根据本公开的实施例,上述确定答复语句的装置500还可以包括澄清信息确定模块,用于针对关键信息和更新后的全局关键信息中的任一信息;通过以下方式中的至少之一确定任一信息中包括待澄清的信息:响应于任一信息中包括第一实体词及第一实体词归属的至少两个不同类别,确定第一实体词的类别为待澄清的信息;响应于任一信息中包括第二实体词及与第二实体词对应的至少两个不同属性值,确定与第二实体词对应的至少两个不同属性值为待澄清的信息;至少两个不同属性值归属于同一目标属性;响应于任一信息中包括第三实体词及与第三实体词关联的至少两个属性,确定至少两个属性为待澄清的信息。
根据本公开的实施例,上述图谱查询模块530具体用于针对查询语句和调整后查询语句中的任一语句,根据任一语句调用预定查询接口,获得预定查询接口反馈的查询结果。其中,在提供预定查询接口的查询服务正常运行的情况下,查询结果包括以下至少之一:任一语句的答复语句、与任一语句对应的关键信息。
根据本公开的实施例,在查询服务非正常运行的情况下,查询结果包括异常信息。上述确定答复语句的装置500还可以包括提示信息输出模块,用于响应于根据任一语句查询预定知识图谱获得异常信息,根据异常信息的类型,输出异常提示信息。其中,异常信息的类型包括以下类型中的至少之一:预定知识图谱鉴权异常的类型、预定知识图谱异常的类型、查询服务运行异常的类型、预定知识图谱中不包括指示第一关键词的节点的类型。
根据本公开的实施例,上述确定答复语句的装置500还可以包括澄清语句输出模块和答复失败确定模块。澄清语句输出模块用于响应于根据答复澄清问句的澄清语句未得到澄清结果,再次输出澄清问句。答复失败确定模块,用于响应于输出预定次数的澄清问句均未得到澄清结果,确定答复失败。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开实施例的确定答复语句的方法的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如确定答复语句的方法。例如,在一些实施例中,确定答复语句的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的确定答复语句的方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行确定答复语句的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。其中,服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(″Virtual PrivateServer″,或简称″VPS″)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (23)
1.一种确定答复语句的方法,包括:
响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询所述预定知识图谱得到的关键信息;所述关键信息包括所述查询语句中的第一关键词及查询所述预定知识图谱得到的与所述第一关键词关联的第二关键词;
根据所述关键信息和所述查询语句的上下文语句调整所述查询语句,得到调整后查询语句;以及
根据所述调整后查询语句查询所述预定知识图谱,得到与所述查询语句对应的答复语句。
2.根据权利要求1所述的方法,其中,所述根据所述关键信息和所述查询语句的上下文语句调整所述查询语句,得到调整后查询语句包括:
响应于所述关键信息中包括待澄清的信息,确定指示所述待澄清的信息的澄清问句;以及
响应于根据答复所述澄清问句的澄清语句得到澄清结果,根据所述澄清结果调整所述查询语句,得到所述调整后查询语句。
3.根据权利要求1所述的方法,其中,所述根据所述关键信息和所述查询语句的上下文语句调整所述查询语句,得到调整后查询语句包括:
根据所述关键信息更新全局关键信息;所述全局关键信息是根据所述查询语句的上文语句维护的;以及
根据更新后的全局关键信息调整所述查询语句,得到所述调整后查询语句。
4.根据权利要求3所述的方法,其中,所述根据更新后的全局关键信息调整所述查询语句,得到所述调整后查询语句包括:
响应于所述更新后的全局关键信息中包括待澄清的信息,确定指示所述待澄清的信息的澄清问句;以及
响应于根据答复所述澄清问句的澄清语句得到澄清结果,根据所述澄清结果调整所述查询语句,得到所述调整后查询语句。
5.根据权利要求2或4所述的方法,还包括:
响应于所述澄清语句中包括指代词,对所述指代词进行归一化处理,得到归一化后的词;以及
根据所述归一化后的词和所述澄清问句中待澄清的信息的排列顺序,确定澄清结果。
6.根据权利要求2或4所述的方法,还包括:
确定所述澄清语句与所述澄清问句中待澄清的信息之间的匹配度;以及
根据所述匹配度,确定所述待澄清的信息中的目标信息为所述澄清结果。
7.根据权利要求2或4所述的方法,还包括:针对关键信息和更新后的全局关键信息中的任一信息;通过以下方式中的至少之一确定所述任一信息中包括待澄清的信息;
响应于所述任一信息中包括第一实体词及所述第一实体词归属的至少两个不同类别,确定所述第一实体词的类别为所述待澄清的信息;
响应于所述任一信息中包括第二实体词及与所述第二实体词对应的至少两个不同属性值,确定与所述第二实体词对应的所述至少两个不同属性值为所述待澄清的信息;所述至少两个不同属性值归属于同一目标属性;
响应于所述任一信息中包括第三实体词及与所述第三实体词关联的至少两个属性,确定所述至少两个属性为所述待澄清的信息。
8.根据权利要求1所述的方法,其中,针对所述查询语句和所述调整后查询语句中的任一语句,根据所述任一语句查询所述预定知识图谱包括:
根据所述任一语句调用预定查询接口,获得所述预定查询接口反馈的查询结果,
其中,在提供所述预定查询接口的查询服务正常运行的情况下,所述查询结果包括以下至少之一:所述任一语句的答复语句、与所述任一语句对应的关键信息。
9.根据权利要求8所述的方法,其中,在所述查询服务非正常运行的情况下,所述查询结果包括异常信息;所述方法还包括:
响应于根据所述任一语句查询所述预定知识图谱获得异常信息,根据所述异常信息的类型,输出异常提示信息,
其中,所述异常信息的类型包括以下类型中的至少之一:所述预定知识图谱鉴权异常的类型、所述预定知识图谱异常的类型、所述查询服务运行异常的类型、所述预定知识图谱中不包括指示所述第一关键词的节点的类型。
10.根据权利要求2或4所述的方法,还包括:
响应于根据答复所述澄清问句的澄清语句未得到澄清结果,再次输出所述澄清问句;以及
响应于输出预定次数的所述澄清问句均未得到澄清结果,确定答复失败。
11.一种确定答复语句的装置,包括:
关键信息获取模块,用于响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询所述预定知识图谱得到的关键信息;所述关键信息包括所述查询语句中的第一关键词及查询所述预定知识图谱得到的与所述第一关键词关联的第二关键词;
语句调整模块,用于根据所述关键信息和所述查询语句的上下文语句调整所述查询语句,得到调整后查询语句;以及
图谱查询模块,用于根据所述调整后查询语句查询所述预定知识图谱,得到与所述查询语句对应的答复语句。
12.根据权利要求11所述的装置,其中,所述语句调整模块包括:
澄清问句确定子模块,用于响应于所述关键信息中包括待澄清的信息,确定指示所述待澄清的信息的澄清问句;以及
第一调整子模块,用于响应于根据答复所述澄清问句的澄清语句得到澄清结果,根据所述澄清结果调整所述查询语句,得到所述调整后查询语句。
13.根据权利要求11所述的装置,其中,所述语句调整模块包括:
全局信息更新子模块,用于根据所述关键信息更新全局关键信息;所述全局关键信息是根据所述查询语句的上文语句维护的;以及
第二调整子模块,用于根据更新后的全局关键信息调整所述查询语句,得到所述调整后查询语句。
14.根据权利要求13所述的装置,其中,所述第二调整子模块包括:
澄清问句确定单元,用于响应于所述更新后的全局关键信息中包括待澄清的信息,确定指示所述待澄清的信息的澄清问句;以及
语句调整单元,用于响应于根据答复所述澄清问句的澄清语句得到澄清结果,根据所述澄清结果调整所述查询语句,得到所述调整后查询语句。
15.根据权利要求12或14所述的装置,还包括:
归一化模块,用于响应于所述澄清语句中包括指代词,对所述指代词进行归一化处理,得到归一化后的词;以及
第一结果确定模块,用于根据所述归一化后的词和所述澄清问句中待澄清的信息的排列顺序,确定澄清结果。
16.根据权利要求12或14所述的装置,还包括:
匹配度确定模块,用于确定所述澄清语句与所述澄清问句中待澄清的信息之间的匹配度;以及
第二结果确定模块,用于根据所述匹配度,确定所述待澄清的信息中的目标信息为所述澄清结果。
17.根据权利要求12或14所述的装置,还包括:
澄清信息确定模块,用于针对关键信息和更新后的全局关键信息中的任一信息;通过以下方式中的至少之一确定所述任一信息中包括待澄清的信息:
响应于所述任一信息中包括第一实体词及所述第一实体词归属的至少两个不同类别,确定所述第一实体词的类别为所述待澄清的信息;
响应于所述任一信息中包括第二实体词及与所述第二实体词对应的至少两个不同属性值,确定与所述第二实体词对应的所述至少两个不同属性值为所述待澄清的信息;所述至少两个不同属性值归属于同一目标属性;
响应于所述任一信息中包括第三实体词及与所述第三实体词关联的至少两个属性,确定所述至少两个属性为所述待澄清的信息。
18.根据权利要求11所述的装置,其中,所述图谱查询模块用于:
针对所述查询语句和所述调整后查询语句中的任一语句,根据所述任一语句调用预定查询接口,获得所述预定查询接口反馈的查询结果,
其中,在提供所述预定查询接口的查询服务正常运行的情况下,所述查询结果包括以下至少之一:所述任一语句的答复语句、与所述任一语句对应的关键信息。
19.根据权利要求18所述的装置,其中,在所述查询服务非正常运行的情况下,所述查询结果包括异常信息;所述装置还包括:
提示信息输出模块,用于响应于根据所述任一语句查询所述预定知识图谱获得异常信息,根据所述异常信息的类型,输出异常提示信息,
其中,所述异常信息的类型包括以下类型中的至少之一:所述预定知识图谱鉴权异常的类型、所述预定知识图谱异常的类型、所述查询服务运行异常的类型、所述预定知识图谱中不包括指示所述第一关键词的节点的类型。
20.根据权利要求12或14所述的装置,还包括:
澄清语句输出模块,用于响应于根据答复所述澄清问句的澄清语句未得到澄清结果,再次输出所述澄清问句;以及
答复失败确定模块,用于响应于输出预定次数的所述澄清问句均未得到澄清结果,确定答复失败。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~10中任一项所述的方法。
23.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令存储于可读存储介质和电子设备其中至少之一上,所述计算机程序/指令在被处理器执行时实现根据权利要求1~10中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211671950.8A CN115905497B (zh) | 2022-12-23 | 2022-12-23 | 确定答复语句的方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211671950.8A CN115905497B (zh) | 2022-12-23 | 2022-12-23 | 确定答复语句的方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115905497A true CN115905497A (zh) | 2023-04-04 |
CN115905497B CN115905497B (zh) | 2024-03-19 |
Family
ID=86474580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211671950.8A Active CN115905497B (zh) | 2022-12-23 | 2022-12-23 | 确定答复语句的方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115905497B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251557A (zh) * | 2023-11-20 | 2023-12-19 | 中信证券股份有限公司 | 法规咨询语句答复方法、装置、设备和计算机可读介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920497A (zh) * | 2018-05-23 | 2018-11-30 | 北京奇艺世纪科技有限公司 | 一种人机交互方法及装置 |
CN111046154A (zh) * | 2019-11-20 | 2020-04-21 | 泰康保险集团股份有限公司 | 信息检索方法、装置、介质及电子设备 |
CN111159376A (zh) * | 2019-12-30 | 2020-05-15 | 深圳追一科技有限公司 | 会话处理方法、装置、电子设备以及存储介质 |
CN112989002A (zh) * | 2021-03-31 | 2021-06-18 | 中国工商银行股份有限公司 | 一种基于知识图谱的问答处理方法、装置及设备 |
CN113094467A (zh) * | 2019-12-23 | 2021-07-09 | 中兴通讯股份有限公司 | 一种知识图谱的查询方法、电子设备及存储介质 |
WO2021213314A1 (zh) * | 2020-04-20 | 2021-10-28 | 北京京东拓先科技有限公司 | 数据处理方法、装置及计算机可读存储介质 |
CN114548110A (zh) * | 2021-12-29 | 2022-05-27 | 北京百度网讯科技有限公司 | 语义理解方法、装置、电子设备及存储介质 |
-
2022
- 2022-12-23 CN CN202211671950.8A patent/CN115905497B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920497A (zh) * | 2018-05-23 | 2018-11-30 | 北京奇艺世纪科技有限公司 | 一种人机交互方法及装置 |
CN111046154A (zh) * | 2019-11-20 | 2020-04-21 | 泰康保险集团股份有限公司 | 信息检索方法、装置、介质及电子设备 |
CN113094467A (zh) * | 2019-12-23 | 2021-07-09 | 中兴通讯股份有限公司 | 一种知识图谱的查询方法、电子设备及存储介质 |
CN111159376A (zh) * | 2019-12-30 | 2020-05-15 | 深圳追一科技有限公司 | 会话处理方法、装置、电子设备以及存储介质 |
WO2021213314A1 (zh) * | 2020-04-20 | 2021-10-28 | 北京京东拓先科技有限公司 | 数据处理方法、装置及计算机可读存储介质 |
CN112989002A (zh) * | 2021-03-31 | 2021-06-18 | 中国工商银行股份有限公司 | 一种基于知识图谱的问答处理方法、装置及设备 |
CN114548110A (zh) * | 2021-12-29 | 2022-05-27 | 北京百度网讯科技有限公司 | 语义理解方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251557A (zh) * | 2023-11-20 | 2023-12-19 | 中信证券股份有限公司 | 法规咨询语句答复方法、装置、设备和计算机可读介质 |
CN117251557B (zh) * | 2023-11-20 | 2024-02-27 | 中信证券股份有限公司 | 法规咨询语句答复方法、装置、设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115905497B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11392775B2 (en) | Semantic recognition method, electronic device, and computer-readable storage medium | |
CN112507706B (zh) | 知识预训练模型的训练方法、装置和电子设备 | |
CN116737908A (zh) | 知识问答方法、装置、设备和存储介质 | |
CN114840671A (zh) | 对话生成方法、模型的训练方法、装置、设备及介质 | |
CN116521841B (zh) | 用于生成回复信息的方法、装置、设备及介质 | |
US20220005461A1 (en) | Method for recognizing a slot, and electronic device | |
CN116501960B (zh) | 内容检索方法、装置、设备及介质 | |
US20230094730A1 (en) | Model training method and method for human-machine interaction | |
CN114595686A (zh) | 知识抽取方法、知识抽取模型的训练方法及装置 | |
CN116615727A (zh) | 用于自然语言处理的关键词数据扩充工具 | |
CN113407677A (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN115481229A (zh) | 一种应答话术推送方法、装置、电子设备及存储介质 | |
CN115905497B (zh) | 确定答复语句的方法、装置、电子设备和存储介质 | |
CN111966781A (zh) | 数据查询的交互方法及装置、电子设备和存储介质 | |
CN111428011B (zh) | 词语的推荐方法、装置、设备及存储介质 | |
EP4092538A1 (en) | Method and apparatus for testing electronic map, and electronic device and storage medium | |
CN114116997A (zh) | 知识问答方法、装置、电子设备及存储介质 | |
EP3843090B1 (en) | Method and apparatus for outputting analysis abnormality information in spoken language understanding | |
CN114490709B (zh) | 文本生成方法、装置、电子设备及存储介质 | |
CN115719066A (zh) | 基于人工智能的搜索文本理解方法、装置、设备和介质 | |
CN115292506A (zh) | 应用于办公领域的知识图谱本体构建方法和装置 | |
CN112148751B (zh) | 用于查询数据的方法和装置 | |
CN111625706A (zh) | 信息检索方法、装置、设备及存储介质 | |
CN114861639B (zh) | 提问信息生成方法、装置、电子设备及存储介质 | |
CN113344405B (zh) | 基于知识图谱生成信息的方法、装置、设备、介质和产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |