CN117235234B - 对象信息获取方法、装置、计算机设备和存储介质 - Google Patents
对象信息获取方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117235234B CN117235234B CN202311476117.2A CN202311476117A CN117235234B CN 117235234 B CN117235234 B CN 117235234B CN 202311476117 A CN202311476117 A CN 202311476117A CN 117235234 B CN117235234 B CN 117235234B
- Authority
- CN
- China
- Prior art keywords
- entity
- text
- question
- label
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000002452 interceptive effect Effects 0.000 claims abstract description 137
- 239000013598 vector Substances 0.000 claims description 82
- 238000000605 extraction Methods 0.000 claims description 60
- 238000004590 computer program Methods 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 16
- 238000012512 characterization method Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 11
- 230000003993 interaction Effects 0.000 description 21
- 238000005516 engineering process Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 238000012549 training Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 235000014443 Pyrus communis Nutrition 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000033748 Device issues Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229940036051 sojourn Drugs 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Machine Translation (AREA)
Abstract
本申请涉及一种对象信息获取方法、装置、计算机设备和存储介质。方法涉及人工智能技术,所述方法包括:在预设标签体系中存在未填充标签时,发出与未填充标签相关的交互问句;识别关于交互问句的答复文本的文本意图;当文本意图与交互问句的问句类型匹配时,提取答复文本包括的实体;基于问句类型、文本意图与实体,识别实体关系;根据的实体关系与预设标签体系中各个标签之间的文本相似度,为实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至预设标签体系;在预设标签体系中的标签均填充目标对象的对象信息时,获得目标对象对应预设标签体系的对象信息。这样,能够提高对象信息获取的准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种对象信息获取方法、装置、计算机设备和存储介质。
背景技术
对象信息提取在很多领域上都有重要的应用,一般而言,会先根据具体的应用场景,建立与该应用场景相符的标签体系,而后再利用对象数据来提取对象在该标签体系下每个标签的信息,以供进一步的实际应用与分析。
在相关技术中,通常利用联合抽取模型对输入的内容进行信息抽取。然而,该联合抽取模型需要同时处理多个任务,可能会在某个任务上出现过拟合,从而影响另一任务的性能,进而,影响了联合抽取模型的模型性能,无法确保对象信息获取的准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高对象信息获取的准确性的对象信息获取方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种对象信息获取方法。所述方法包括:
在预设标签体系中存在未填充标签时,向目标对象发出与所述未填充标签相关的交互问句,所述未填充标签是所述预设标签体系中未填充关于所述目标对象的对象信息的标签;
获取关于所述交互问句的答复文本,并识别所述答复文本的文本意图;
当所述答复文本的文本意图与所述交互问句的问句类型匹配时,对所述答复文本进行实体提取,得到所述答复文本所包括的实体;
基于所述问句类型、所述答复文本的文本意图与所述实体,识别实体关系;
根据识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度,为所述实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至所述预设标签体系;
在所述预设标签体系中的标签均填充所述目标对象的对象信息时,获得所述目标对象对应所述预设标签体系的对象信息。
第二方面,本申请还提供了一种对象信息获取装置。所述装置包括:
交互问句发出模块,用于在预设标签体系中存在未填充标签时,向目标对象发出与所述未填充标签相关的交互问句,所述未填充标签是所述预设标签体系中未填充关于所述目标对象的对象信息的标签;
意图识别模块,用于获取关于所述交互问句的答复文本,并识别所述答复文本的文本意图;
实体提取模块,用于当所述答复文本的文本意图与所述交互问句的问句类型匹配时,对所述答复文本进行实体提取,得到所述答复文本所包括的实体;
实体关系识别模块,用于基于所述问句类型、所述答复文本的文本意图与所述实体,识别实体关系;
标签匹配模块,用于根据识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度,为所述实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至所述预设标签体系;
信息获取模块,用于在所述预设标签体系中的标签均填充所述目标对象的对象信息时,获得所述目标对象对应所述预设标签体系的对象信息。
在一些实施例中,所述交互问句发出模块,用于在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与所述预设标签体系相关的标准问句,并发出所述标准问句;在预设标签体系中存在未填充标签时,若为非首次向目标对象发出交互问句,则根据所述预设标签体系中的已填充标签,确定未填充标签,所述已填充标签是所述预设标签体系中已填充了关于所述目标对象的对象信息的标签,查询与所述未填充标签相关的交互问句,并发出所述交互问句。
在一些实施例中,所述意图识别模块,用于获取意图识别模型;调用所述意图识别模型,对所述答复文本进行意图识别,得到文本意图。
在一些实施例中,所述意图识别模块,用于将所述答复文本输入至所述意图识别模型,通过所述意图识别模型的向量提取层,确定所述答复文本的语义特征,并通过所述意图识别模型的分类层,确定所述答复文本的文本意图分别属于各意图类型的概率,根据各概率,确定所述答复文本的文本意图。
在一些实施例中,所述装置还包括检查模块,所述检查模块,用于获取问句类型和意图类型的映射关系;根据所述映射关系,检查所述交互问句的问句类型与所述答复文本的文本意图是否匹配。
在一些实施例中,所述实体提取模块,用于调用所述实体识别模型;基于所述实体识别模型的特征提取网络,对所述答复文本进行特征提取,得到所述答复文本中各字的语义向量;基于所述实体识别模型的实体定位网络,根据所述答复文本中各字的语义向量,输出所述答复文本所包括的实体。
在一些实施例中,所述实体定位网络包括用于标注实体起始位置的第一网络和用于标注实体结束位置的第二网络;所述实体提取模块,用于通过所述第一网络,根据各字的语义向量标注出所述答复文本中每个实体的实体类型和实体起始位置,通过所述第二网络,根据各字的语义向量标注出所述答复文本中每个实体的实体类型和实体结束位置;根据每个实体的实体起始位置和实体结束位置,确定所述答复文本所包括的实体。
在一些实施例中,所述实体关系识别模块,用于在识别到所述答复文本中包括多个实体时,根据每个实体各自的实体类型、实体起始位置和实体结束位置,获得每个实体的实体标识符;获取所述问句类型的标识符与所述文本意图的意图类型的标识符;根据所述答复文本、每个实体的实体标识符、所述问句类型的标识符与所述意图类型的标识符,获得用于实体关系识别的输入信息;调用实体关系识别模型,基于所述输入信息识别出所述答复文本中的实体关系。
在一些实施例中,所述实体关系识别模块,用于根据每个实体在所述答复文本中的位置,确定相应实体标识符的拼接顺序;按相应实体标识符的拼接顺序,在所述答复文本之后依次拼接每个实体的实体标识符,以及在末尾实体标识符之后继续拼接所述问句类型的标识符与所述意图类型的标识符,得到用于实体关系识别的输入信息。
在一些实施例中,所述标签匹配模块,用于分别计算识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度;选取最高的文本相似度所对应的标签,作为与所述实体关系中的实体匹配的标签。
在一些实施例中,所述标签匹配模块,用于分别确定识别出的实体关系的语义向量与所述预设标签体系中各个标签的语义向量,根据识别出的实体关系的语义向量与所述预设标签体系中各个标签的语义向量,计算识别出的实体关系分别与所述预设标签体系中各个标签之间的文本相似度。
在一些实施例中,所述标签匹配模块,用于从所述未填充标签中,筛选出所述答复文本的文本意图与所述交互问句的问句类型所指向的标签;若最高的文本相似度所对应的标签与所述所指向的标签相同,则将最高的文本相似度所对应的标签,作为所述实体关系中的实体匹配的标签。
在一些实施例中,所述标签匹配模块,用于调用语义相似度表征模型,基于所述实体输出与所述实体匹配的归一化实体,将所述归一化实体作为所匹配的标签对应的对象信息填充至所述预设标签体系。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述对象信息获取方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述对象信息获取方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述对象信息获取方法的步骤。
上述对象信息获取方法、装置、计算机设备和存储介质,在预设标签体系中存在未填充标签时,需要进一步向目标对象发起会话,此时,通过向目标对象发出与未填充标签相关的交互问句,以开启本轮会话,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。获取关于交互问句的答复文本,并识别答复文本的文本意图。当答复文本的文本意图与交互问句的问句类型匹配时,则说明答复文本符合交互问句的答复要求,基于此,才会对答复文本进行实体提取,得到答复文本所包括的实体。这样,避免了对回复错误的答复文本进行实体识别,确保了实体识别的有效性,也提高了后续标签识别的准确性。在具有上下文信息的会话场景下,基于问句类型、答复文本的文本意图与实体,识别实体关系,能够充分捕捉答复文本中实体与实体间复杂语义的关联关系,从而,提高了实体关系识别的准确性。根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,评估实体关系与各标签间的匹配程度。这样,能够从预设标签体系中为实体关系中的实体匹配相应的标签,提高标签识别的准确性。然后,将实体作为所匹配的标签对应的对象信息填充至预设标签体系;在预设标签体系中的标签均填充目标对象的对象信息时,确定会话结束。此时,基于多轮会话所确定的各标签的对象信息,能够全面且准确的获得与目标对象精准对应预设标签体系的对象信息,从而,提高了对象信息获取的准确性。
附图说明
图1为一个实施例中对象信息获取方法的应用环境图;
图2为一个实施例中对象信息获取方法的流程示意图;
图3为一个实施例中实体关系识别的示意图;
图4为一个实施例中预设意图体系的示意图;
图5为一个实施例中意图识别的示意图;
图6为一个实施例中实体识别模型的结构示意图;
图7为另一个实施例中实体关系识别的示意图;
图8为一个实施例中对象信息获取的流程示意图;
图9为一个实施例中对象信息获取装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的对象信息获取方法,涉及人工智能(ArtificialIntelligence,AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等技术。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本申请实施例提供的对象信息获取方法,具体涉及人工智能的自然语言处理技术。
相关技术中,在进行对象信息抽取时,通常利用联合抽取模型对输入的内容进行信息抽取。其中,联合抽取模型涉及到与信息抽取相关的多个任务,例如,联合抽取模型需要并行进行实体识别任务和实体关系识别任务,此时,将这些任务视为整体。在获取到输入内容后,基于联合抽取模型,直接输出对象信息,因此,这种信息抽取方法可认为是端到端的方式。然而,联合抽取模型需要同时处理多个任务,这就需要更多的训练数据和计算资源。此外,在联合抽取模型处理的过程中,如果实体识别和实体关系识别的性能差异很大,可能会在某个任务上出现过拟合,从而影响另一任务的性能,进而,影响了联合抽取模型的模型性能,无法确保对象信息获取的准确性。
本申请实施例提供的对象信息获取方法,在预设标签体系中存在未填充标签时,需要进一步向目标对象发起会话,此时,通过向目标对象发出与未填充标签相关的交互问句开启本轮会话,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。获取关于交互问句的答复文本,并识别答复文本的文本意图。当答复文本的文本意图与交互问句的问句类型匹配时,则说明答复文本符合交互问句的答复要求,基于此,才会对答复文本进行实体提取,得到答复文本所包括的实体。这样,避免了对回复错误的答复文本进行实体识别,确保了实体识别的有效性,也提高了后续标签识别的准确性。在具有上下文信息的会话场景下,基于问句类型、答复文本的文本意图与实体,识别实体关系,能够充分捕捉答复文本中实体与实体间复杂语义的关联关系,从而,提高了实体关系识别的准确性。根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,评估实体关系与各标签间的匹配程度。这样,能够从预设标签体系中为实体关系中的实体匹配相应的标签,提高标签识别的准确性。然后,将实体作为所匹配的标签对应的对象信息填充至预设标签体系;在预设标签体系中的标签均填充目标对象的对象信息时,确定会话结束。此时,基于多轮会话所确定的各标签的对象信息,能够全面且准确的获得与目标对象精准对应预设标签体系的对象信息,从而,提高了对象信息获取的准确性。
本申请实施例提供的对象信息获取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。终端102和服务器104均可单独执行该对象信息获取方法,终端102和服务器104也可协同执行该对象信息获取方法。
在一些实施例中,在预设标签体系中存在未填充标签时,服务器104向目标对象所在的终端102发出与未填充标签相关的交互问句,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。终端102将关于交互问句的答复文本发送给服务器104,服务器104识别答复文本的文本意图。当答复文本的文本意图与交互问句的问句类型匹配时,服务器104对答复文本进行实体提取,得到答复文本所包括的实体。服务器104基于问句类型、答复文本的文本意图与实体,识别实体关系。服务器104根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,为实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至预设标签体系。在预设标签体系中的标签均填充目标对象的对象信息时,服务器104获得目标对象对应预设标签体系的对象信息。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在一个实施例中,如图2所示,提供了一种对象信息获取方法,以该方法应用于计算机设备(可以是图1中的服务器104,也可以是终端102)为例进行说明,包括以下步骤:
步骤S202,在预设标签体系中存在未填充标签时,向目标对象发出与未填充标签相关的交互问句,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。
其中,对象信息是指对象在目标场景下的信息,包含多个维度的信息,例如,属性信息、对象行为信息等。标签是用于描述和归纳特定对象群体特征的关键词或短语,例如,标签为“姓名”。预设标签体系是依据目标场景建立的标签体系。例如,在进行流调数据的采集的场景下,为了能够及时应对突发公共事件的发生,依据突发公共事件的需求,需要构建相应的预设标签体系,基于预设标签体系和对象信息来分析并指定相应措施。又例如,在导医会话场景下,依据目标对象的就医需求,为该目标对象建立对应的预设标签体系,并通过多轮会话来填充预设标签体系,以此来辅助诊断。需要说明的是,对象信息是基于多轮交互会话、且经过同意获取到的,而非直接获取。
预设标签体系包括不同的多个标签。示例性地,在进行流调数据的采集的场景下,建立相应场景的预设标签体系,该预设标签体系包含的标签,分别是“基础信息”、“发病情况”和“暴露史”。其中,每个标签都包含多个子标签,例如,“基础信息”包含“姓名”、“年龄”、“性别”和“工作类型”等子标签。“发病情况”包括“当前状态”、“是否不适”等子标签。“暴露史”包括“旅居情况”、“疫区居住”和“密接情况”等子标签。当然,还可以进一步根据实际情况进行扩充。
按照一定的填充顺序,依次填充预设标签体系中的标签,这样,后续能够在询问过程中获取与标签相关的信息,确保了对象信息获取的正确性。示例性地,根据对象信息采集的复杂程度,从简单到复杂,依次填充预设标签体系中的各标签。以前述示例中预设标签体系为例,按照先采集“基本信息”,再采集“发病情况”,最后采集“暴露史”的顺序,开启相应的会话,以获取相应的信息来填充相应的标签。
交互问句是指在进行会话交互时,用于获取未填充标签的对象信息的问句,因此,可以理解的是,交互问句是与未填充标签相关的,例如,未填充标签为工作地点,则相应的交互问句1是“请您输入您工作所在的地点?”。
可选地,计算机设备获取预先为某个场景构建的预设标签体系,并根据预设标签体系中各标签的填充状态,确定填充进度,并根据填充进度确定未填充标签,根据未填充标签开启当前交互会话,并确定当前交互会话的交互问句,并通过智能账号在目标对象的终端中展示交互问句。填充进度反映了当前预设标签体系是否开始填充,以及是否填充完成。其中,所涉及到的场景是有信息采集需求的场景,例如,进行流调数据的采集的场景,又例如,导医场景等。
示例性地,计算机设备在确定了填充进度之后,从预先存储的问句集合中,获取与未填充标签相关的交互问句。问句集合中存储了预设标签体系所涉及到的所有交互问句以及每个交互问句的问句类型。该问句集合是与目标场景相关联的。
步骤S204,获取关于交互问句的答复文本,并识别答复文本的文本意图。
其中,答复文本是通过目标对象的账号回复的文本,文本意图是指答复文本中蕴含的主题或目的。
可选地,计算机设备获取通过目标对象的账号所输入的输入内容,并根据输入内容,确定关于交互问句的答复文本,并对答复文本进行意图识别,得到答复文本的文本意图。其中,输入内容的形式可以是文本、也可以是语音、也可以是图片等,具体不作限定。
示例性地,若输入内容的形式为文本,则计算机设备直接将该输入内容确定为答复文本,或者,计算机设备对该输入内容进行预处理,将预处理后的内容确定为答复文本。计算机设备对答复文本进行意图识别,得到答复文本的文本意图。预处理可以是无效词处理等。
示例性地,若输入内容的形式为语音,或者多模态,则计算机设备调用语音识别模型或者多模态识别模型,根据输入内容,确定关于交互问句的答复文本。对答复文本进行意图识别,得到答复文本的文本意图。其中,多模态的输入内容是指文本与语音结合的内容。当然,在语音识别或者多模态识别的过程中,还可以增加对不同地区方言的自适应识别,即,预先对输入内容进行自适应识别,得到标准语音,再调用语音识别模型或者多模态识别模型,对标准语音进行处理。这样,能够扩展语音识别的范围,确保了语音识别的准确性。
示例性地,若输入内容的形式为图片,则计算机设备调用图片识别模型,将输入内容转换为答复文本。计算机设备再对答复文本进行意图识别,得到答复文本的文本意图。例如,图片识别模型可以是OCR(Optical Character Recognition,光学字符识别)识别模型。举例说明,在交互问句为“请问您的名字?”。输入内容是由目标对象发送的包含身份信息的图片,该图片包含目标对象的名称信息,因此,可以根据图像识别模型自动识别该图片中的身份信息,得到对应的答复文本,即答复文本为目标对象的名称。
步骤S206,当答复文本的文本意图与交互问句的问句类型匹配时,对答复文本进行实体提取,得到答复文本所包括的实体。
其中,实体是指具有特定含义的概念或者对象。可以理解为命名实体,实体提取可理解为实体识别。
可选地,计算机设备校验文本意图与交互问句的问句类型是否匹配,若匹配,则计算机设备调用实体识别模型,提取答复文本中的具备关键要素的实体。具备关键要素的实体是指与预设标签体系匹配的实体,例如,出现时间、出现地点等。
示例性地,计算机设备校验文本意图的意图类型与问句类型是否匹配,若匹配,则确定文本意图与问句类型匹配。或者,计算机设备预先为问句集合中各交互问句分别提供预设的标准答复文本,并预先确定标准答复文本的答复意图。对于当前发出的交互问句,计算发出的交互问句对应的答复意图与文本意图间的相似度。若相似度超过相似度阈值,或者答复意图与文本意图一致,则确定文本意图与问句类型匹配。
若匹配,则返回计算机设备调用实体识别模型步骤继续执行,若不匹配,则计算机设备再次向目标对象发出该交互问句,返回步骤S204继续执行。若计算机设备重复发送该交互问句的次数达到预设次数,则保存该答复文本,并重新确定未填充标签,开启下一轮的交互会话。
步骤S208,基于问句类型、答复文本的文本意图与实体,识别实体关系。
其中,实体关系是指任意两个实体间的联系,例如,实体“工作”和实体“画家”,则说明两个实体间的实体关系是:工作类型-画家。
可选地,在识别到答复文本中包括多个实体时,计算机设备基于问句类型、答复文本的文本意图和各实体,调用实体关系识别模型,识别任意两个实体间的实体关系。
下面介绍实体关系识别模型的识别过程,如图3所示,为一个实施例中实体关系识别的示意图。计算机设备确定答复文本的Token序列(字序列),该Token序列包括每个字,分别是Tok1、Tok2、…、TokN,并在Token序列的首个字之前添加特殊标记[CLS],其中,Tok1和Tok2对应实体1,Tok3和Tok4对应实体2,计算机设备在Token序列之前拼接特殊字符[CLS]后,得到拼接序列,再根据拼接序列、意图类型和问句类型,确定用于关系识别的输入信息,并将该输入信息输入至实体关系识别模型中,分别得到[CLS]的嵌入E[CLS]、以及各字分别对应的嵌入,各字分别对应的嵌入分别是、/>、…、/>和意图类型的嵌入/>和问句类型的嵌入/>,在基于得到的各嵌入,分别确定各字的向量,依次是/>、/>、…、/>、意图类型的向量/>和问句类型的向量/>,基于各向量,确定该输入信息对应的语义表征/>,并根据该语义表征,识别出答复文本中的实体1和实体2之间的实体关系。
示例性地,在识别到答复文本中包括多个实体时,计算机设备根据问句类型、文本意图和各实体的实体类型和在答复文本中的位置,调用实体关系识别模型,确定任意两个实体间的实体关系。计算机设备从至少一个实体关系,筛选出与交互问句匹配的实体关系,该筛选出的实体关系用于进行下述步骤S210。例如,交互问句为“你从何时到达目的地?”;对应的答复文本为“我是10点10分出发,12点到达的”。对应的实体分别有“10点10分”、“出发”、“12点”、“到达”。此时,实体关系识别模型会识别出任意两个实体间的实体关系,再利用分类层,确定任意一个实体关系与交互问句之间的概率,概率越大,则相应的实体关系与交互问句间的匹配程度越高,此时,选取最大的概率对应的实体关系。例如,相较于其他实体关系,实体关系为“到达时间-12点”是与交互问句的匹配程度最高的。其中,分类层可以是进行了softmax(指数归一化)函数处理。
步骤S210,根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,为实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至预设标签体系。
其中,识别出的实体关系与某个标签之间的文本相似度越高,则识别出的实体关系与该标签的匹配程度越高。
可选地,计算机设备计算识别出的实体关系分别与预设标签体系中各标签之间的文本相似度,根据最高的文本相似度来确定与实体匹配的标签,并将该实体作为所匹配的标签对应的对象信息,并将该实体填充到预设标签体系中该标签对应的槽位内。
当然,若识别出答复文本的实体为1个,则计算机设备根据问句类型和答复文本中实体的实体类型,为识别出的实体匹配相应的标签。
当然,在另一些实施例中,该方法还包括:计算机设备通过聚类,确定识别出的实体关系所属哪个标签的类,这样,为实体关系中的实体匹配相应的标签。在该实施例中,通过聚类处理,能够为实体关系中的实体精准匹配相应的标签。
示例性地,计算机设备确定未填充标签所属的标签,计算机设备计算识别出的实体关系分别与该标签下各子标签之间的文本相似度。如前所述,预设标签体系中包含有多个标签,如“基础信息”、“发病情况”和“暴露史。若当前标签为“姓名”,则无需计算实体关系与预设标签体系内所有标签间的文本相似度,此时,仅需要计算“基础信息”这个标签下所有子标签分别与该实体关系间的文本相似度,极大的减少了计算量,提高了对象信息获取的效率。
步骤S212,在预设标签体系中的标签均填充目标对象的对象信息时,获得目标对象对应预设标签体系的对象信息。
可选地,计算机设备确定预设标签体系的填充进度,若填充进度为填充完成,则表征预设标签体系中的标签均填充了目标对象的对象信息,此时,计算机设备根据预设标签体系中各标签所填充的信息,确定目标对象对应的该预设标签体系的对象信息。
若填充进度为未填充完成,则表征预设标签体系中还存在未填充标签,计算机设备开启下一轮的交互会话,并根据预设标签体系中已填充标签,确定下一轮的交互会话的交互问句,并返回步骤S204继续执行。
上述对象信息获取方法,在预设标签体系中存在未填充标签时,需要进一步向目标对象发起会话,此时,通过向目标对象发出与未填充标签相关的交互问句开启本轮会话,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。获取关于交互问句的答复文本,并识别答复文本的文本意图;当答复文本的文本意图与交互问句的问句类型匹配时,则说明答复文本符合交互问句的答复要求,基于此,才会对答复文本进行实体提取,得到答复文本所包括的实体。这样,避免了对回复错误的答复文本进行实体识别,确保了实体识别的有效性,也提高了后续标签识别的准确性。在具有上下文信息的会话场景下,基于问句类型、答复文本的文本意图与实体,识别实体关系,能够充分捕捉答复文本中实体与实体间复杂语义的关联关系,从而,提高了实体关系识别的准确性。根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,评估实体关系与各标签间的匹配程度。这样,能够从预设标签体系中为实体关系中的实体匹配相应的标签,提高标签识别的准确性。然后,将实体作为所匹配的标签对应的对象信息填充至预设标签体系;在预设标签体系中的标签均填充目标对象的对象信息时,确定会话结束。此时,基于多轮会话所确定的各标签的对象信息,能够全面且准确的获得与目标对象精准对应预设标签体系的对象信息,从而,提高了对象信息获取的准确性。
在一些实施例中,在预设标签体系中存在未填充标签时,向目标对象发出与未填充标签相关的交互问句,包括:在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与预设标签体系相关的标准问句,并发出标准问句;在预设标签体系中存在未填充标签时,若为非首次向目标对象发出交互问句,则根据预设标签体系中的已填充标签,确定未填充标签,已填充标签是预设标签体系中已填充了关于目标对象的对象信息的标签,查询与未填充标签相关的交互问句,并发出交互问句。
其中,标准问句是预设标签体系相关的、且预先设置好的第一个交互问句,即为固定问句。
可选地,在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则计算机设备直接获取与预设标签体系相关的标准问句,并向目标对象发出该标准问句。若为非首次向目标对象发出交互问句,则计算机设备基于预设标签体系中会话状态和已填充标签,确定当前交互会话对应的未填充标签,并从数据库中的问句集合中,查询出与未填充标签相关联的交互问句,并向目标对象发出该交互问句。会话状态用于表征当前对象信息填充至的位置。
示例性地,若为首次向目标对象发出交互问句,则计算机设备确定标准问句,例如,标准问句为“请问您的名字?”。若为非首次向目标对象发出交互问句,则计算机设备按照预设标签体系中的各标签的填充顺序,根据目标对象相关的已填充标签的对象信息,开展符合目标对象实际状况的交互问句。当然,基于已填充的对象信息,若存在特殊工作类型,则可以通过个性化询问,获取更加细节信息。如下表1所示,示意了交互问句生成的模版:
表1交互问句生成模版表
在本实施例中,在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与预设标签体系相关的标准问句,并发出标准问句,以发起关于预设标签体系的对象信息获取的交互会话。在预设标签体系中存在未填充标签时,若为非首次向目标对象发出交互问句,则根据预设标签体系中的已填充标签,确定未填充标签,已填充标签是预设标签体系中已填充了关于目标对象的对象信息的标签,查询与未填充标签相关的交互问句,并发出交互问句。也就是说,若为非首次向目标对象发出交互问句,联合以往的已填充的对象信息,个性化展开与目标对象匹配的会话,以引导目标对象更准确的回答后续所需的信息,确保了对象信息获取的准确性。
在一些实施例中,识别答复文本的文本意图,包括:获取意图识别模型;调用意图识别模型,对答复文本进行意图识别,得到文本意图。
其中,意图识别模型是事先训练好的神经网络模型。
可选地,计算机设备获取意图识别模型,并将答复文本输入至意图识别模型,对答复文本进行多意图分类,确定答复文本对应的意图类型,将确定的意图类型确定为答复文本的文本意图。
在一些实施例中,调用意图识别模型,对答复文本进行意图识别,得到文本意图,包括:将答复文本输入至意图识别模型,通过意图识别模型的向量提取层,确定答复文本的语义特征,并通过意图识别模型的分类层,确定答复文本的文本意图分别属于各意图类型的概率,根据各概率,确定答复文本的文本意图。
可选地,计算机设备将答复文本输入至意图识别模型,并通过意图识别模型的向量提取层,提取答复文本的语义,得到答复文本的语义表征。计算机设备通过意图识别模型的分类层,输出预设意图体系中各意图类型对应的概率,根据各概率,确定答复文本的文本意图。
其中,预设意图体系是与预设标签体系相关联的意图体系。如图4所示,为一个实施例中预设意图体系的示意图。预设意图体系包括多个意图类型,例如,姓名描述意图、地点描述意图、工作类型描述意图、年龄描述意图、…、肯定意图、否定意图、交通方式描述意图等。根据实际需求,可以进一步增加相关的意图类型。
示例性地,如图5所示,为一个实施例中意图识别的示意图。计算机设备确定答复文本的Token序列(字序列),该Token序列包括每个字,分别是Tok1、Tok2、…、TokN,并在Token序列的首个字之前添加特殊标记[CLS],得到答复文本的输入序列,将答复文本的输入序列输入到意图识别模型中,进行多意图分类,得到对应的文本意图。具体地,计算机设备确定输入序列中[CLS]的嵌入、以及各字分别对应的嵌入,各字分别对应的嵌入依次为/>、/>、…、/>。基于各嵌入,确定各字分别对应的向量,分别是/>、/>、…、/>,并基于各向量确定答复文本的语义表征C,并根据语义表征C,通过分类层进行意图分类任务,确定答复文本分别属于各意图类型对应的概率,根据各概率,确定答复文本的文本意图。举例说明,答复文本1为“我10点10分去的”;该答复文本1的意图是回答时间,对应的文本意图为出发时间。
当然,在另一些示例中,答复文本中包括多个短句,如图5所示,答复文本2为“10点10分,我去购物”,包含两个短句,分别是“10点10分”和“我去购物”。此时,意图识别模型识别出各短句的意图类型,各意图类型都视为答复文本的文本意图,因此,答复文本2的意图是回答时间、回答事件,对应的答复文本2的文本意图是出发时间和出发事件。此时,若答复文本中存在多个短句,且识别出了多个文本意图后,在进行步骤S206之前,需要将识别出的每个文本意图都与问句类型进行匹配,若存在一个文本意图与问句类型匹配,则基于该文本意图,执行步骤S206。
上述提及的意图识别模型可以是基于BERT(Bidirectional EncoderRepresentation from Transformers,基于Transformers的双向编码)模型进行的意图分类任务的微调得到的。在BERT模型预训练好后,利用预设意图体系中各意图类型进行微调。具体地,计算机设备构造输入的语句序列,并输入至BERT模型中,利用语句序列对应的Token序列,通过向量提取层,确定语句序列的语义表征,并根据该语句序列的语义表征,通过分类层输出意图体系中各意图类型对应的概率,并通过交叉熵损失函数来微调,以得到微调好的意图识别模型。
基于此,通过将答复文本输入至意图识别模型,利用意图识别模型的向量提取层,以正确理解答复文本的语义,得到答复文本的语义特征(即语义表征)。再通过意图识别模型的分类层,确定答复文本的文本意图分别属于各意图类型的概率,根据各概率,准确识别出答复文本的文本意图,确保了文本意图识别的准确性。
在本实施例中,通过获取意图识别模型,能够对答复文本进行意图识别,得到文本意图。这样,后续能够基于文本意图类识别目标对象的意图或者答复是否符合当前询问的交互问句,确保了对象信息获取的准确性。
在一些实施例中,方法还包括:获取问句类型和意图类型的映射关系;根据映射关系,检查交互问句的问句类型与答复文本的文本意图是否匹配。
可选地,计算机设备获取问句类型和意图类型的映射关系,并根据该映射关系,查询出与交互问句的问句类型匹配的意图类型,若查询出的意图类型与答复文本的文本意图的意图类型一致,则计算机设备确定答复文本的文本意图与交互问句的问句类型匹配。若查询出的意图类型与答复文本的文本意图的意图类型不一致,则计算机设备确定答复文本的文本意图与交互问句的问句类型不匹配。
其中,计算机设备预先将问句集合所包含的每个问句类型与意图体系中的意图类型进行映射,并存储在数据库中。
示例性地,若交互问句为“请问您的姓名?”,对应的问句类型为询问姓名的类型;对应的交互问句为“今天天气很好”,对应的意图类别为天气描述意图的类型。此时,问句类型与文本意图不匹配。
在本实施例中,通过先获取问句类型和意图类型的映射关系,再根据映射关系,能够精准检查出交互问句的问句类型与答复文本的文本意图是否匹配,筛选出答非所问的答复文本,保障了对象信息获取的准确性。
在一些实施例中,对答复文本进行实体提取,得到答复文本所包括的实体,包括:调用实体识别模型;基于实体识别模型的特征提取网络,对答复文本进行特征提取,得到答复文本中各字的语义向量;基于实体识别模型的实体定位网络,根据答复文本中各字的语义向量,输出答复文本所包括的实体。
其中,特征提取网络用于抽取考虑上下文的文本信息并形成语义向量。实体定位网络用于定位出文本中实体的位置以及实体类型。
可选地,计算机设备调用实体识别模型,将答复文本输入到实体识别模型的特征提取网络,得到答复文本中各字的语义向量。计算机设备将各字的语义向量输入到实体识别模型的实体定位网络,识别答复文本中各实体的位置和实体类型,基于各实体的位置,确定答复文本所包括的实体并输出。
在一些实施例中,实体定位网络包括用于标注实体起始位置的第一网络和用于标注实体结束位置的第二网络;基于实体识别模型的实体定位网络,根据答复文本中各字的语义向量,输出答复文本所包括的实体,包括:通过第一网络,根据各字的语义向量标注出答复文本中每个实体的实体类型和实体起始位置,通过第二网络,根据各字的语义向量标注出答复文本中每个实体的实体类型和实体结束位置;根据每个实体的实体起始位置和实体结束位置,确定答复文本所包括的实体。
其中,实体起始位置为实体的首个字在答复文本中的位置,实体结束位置为实体的最后一个字在答复文本中的位置。第一网络和第二网络可理解为是两个指针,分别记录每一个实体的开始和结束的位置,并在记录位置的同时,都能识别并标注实体类型,因此,可以理解的是,实体定位网络是半指针半标注的结构。
可选地,计算机设备将各字的语义向量分别输入到第一网络和第二网络中,通过第一网络,根据各字的语义向量,定位出答复文本所包括的每个实体的实体类型和每个实体的实体起始位置。通过第二网络,根据各字的语义向量,定位出答复文本所包括的每个实体的实体类型和每个实体的实体结束位置。计算机设备根据同一个实体的实体起始位置和实体结束位置,从答复文本中定位对应的实体。
示例性地,如图6所示,为一个实施例中实体识别模型的结构示意图。以答复文本为“水果梨子”举例说明,答复文本存在“水果”和“梨子”两个实体,计算机设备分别在答复文本之前和之后添加两个特殊字符“CLS”和“SEP”,其中,特殊字符“SEP”是一种分隔字符。将该添加后的文本输入到特征提取网络中,得到答复文本对应的语义向量序列,该语义向量序列包括答复文本中各字的语义向量。计算机设备将语义向量序列分别输入到第一网络和第二网络,通过第一网络分别标注出两个实体的实体类型,以数字3和数字8分别代表两个实体的实体类型,对于每个实体,计算机设备以该实体的实体类型,标注出该实体的实体起始位置,例如,第一网络标注结果为“030800”。其中,第二个位置和第四个位置分别是添加后的文本中“水果”和“梨子”的首个字,因此,在相应的位置处标注出该实体类型。第二网络标注结果为“003080”。其中,第三个位置和第五个位置分别是添加后的文本中“水果”和“梨子”的最后一个字,因此,在相应的位置处标注出该实体类型。
其中,实体识别模型在训练过程中,第一网络和第二网络各自对应一个损失函数,例如,交叉熵损失。联合第一网络的损失和第二网络的损失、以及特征提取网络的损失,确定目标损失,根据目标损失对实体识别模型进行迭代训练。
基于此,通过第一网络,能够根据各字的语义向量,准确标注出答复文本中每个实体的实体类型和实体起始位置。通过第二网络,能够根据各字的语义向量,准确标注出答复文本中每个实体的实体类型和实体结束位置。由此,根据每个实体的实体起始位置和实体结束位置,能够精准定位出每个实体在答复文本中的位置,也就能够准确识别出答复文本所包括的实体,确保了实体识别的准确性。
在本实施例中,在调用了实体识别模型以后,基于实体识别模型的特征提取网络,结合上下文进行语义理解,以对答复文本进行特征提取,得到答复文本中各字的语义向量。然后,基于实体识别模型的实体定位网络,根据答复文本中各字的语义向量,能够精准定位出答复文本所包括的实体,确保了实体识别的准确性。
在一些实施例中,基于问句类型、答复文本的文本意图与实体,识别实体关系,包括:在识别到答复文本中包括多个实体时,根据每个实体各自的实体类型、实体起始位置和实体结束位置,获得每个实体的实体标识符;获取问句类型的标识符与文本意图的意图类型的标识符;根据答复文本、每个实体的实体标识符、问句类型的标识符与意图类型的标识符,获得用于实体关系识别的输入信息;调用实体关系识别模型,基于输入信息识别出答复文本中的实体关系。
其中,标识符是用于标识的符号,可以理解的是,实体标识符为用于标识实体的符号,问句类型的标识符是用于标识问句类型的符号,意图类型的标识符是用于标识意图类型的符号。
可选地,在计算机设备到答复文本中包括多个实体时,对于每个实体,计算机设备根据该实体的实体类型和实体起始位置,确定与该实体起始位置对应的第一实体标识符,计算机设备根据该实体的实体类型和实体结束位置,确定与该实体结束位置对应的第二实体标识符。
计算机设备根据答复文本的文本意图确定对应的文本意图的意图类型,并根据该意图类型生成意图类型的标识符,并根据答复文本对应的交互问句的问句类型,生成问句类型的标识符。
计算机设备按一定的拼接顺序,拼接各实体各自的第一实体标识符、第二实体标识符、意图类型的标识符和问句类型的标识符,确定用于实体关系识别的输入信息。计算机设备调用实体关系识别模型,基于输入信息识别出答复文本中的实体关系。
示例性地,以答复问句“我是10点出发的。”为例进行说明,该答复问句中涉及到两个实体,分别是“10点”和“出发”。对于实体“10点”,对应的第一实体标识符和第二实体标识符分别:和/>,其中,字母“O”表征这个实体为对象,进一步地,用“ti”表征这个实体为时间,即均表示了实体类型为“时间”的对象,同样地,对于实体“出发”,对应的第一实体标识符和第二实体标识符分别:/>和/>,其中,字母“M”表征这个实体为事件,进一步地,用“go”表征这个实体为出发,即均表示了实体类型为“出发”的事件。其中,用“/”来区分该实体中的第一个字和最后一个字。由此,该答复问句中实体关系为“出发时间-10点”。
需要说明的是,每个实体标识符都关联了所对应的实体和位置相关信息,即基于实体标识符能够确定出该实体标识符对应答复文本中的哪个实体,以及对应该实体中字的位置信息,即关联出对应的实体起始位置或者实体结束位置。
除此之外,需要说明的是,每个答复问句,都会有一对意图类型的标识符对,即第一意图标识符和第二意图标识符。并且,针对对应的交互问句,也会有一对问句类型的标识符对,即第一问句标识符和第二问句标识符。其中,第一意图标识符和第一问句标识符是指插入在答复问句之前的意图类型的标识符和问句类型的标识符,例如,第一意图标识符为,其中,字母I表征意图,ti表示时间相关的意图类型;第一问句标识符为/>,其中,字母Q表征问句,bg表示出发时间相关的问句类型;第二意图标识符和第二问句标识符是指插入在答复问句之后的意图类型的标识符和问句类型的标识符,例如,第二意图标识符为/>;第二问句标识符为/>。
示例性地,该拼接顺序可以是基于各实体在答复文本中的位置确定,此时,计算机设备从答复文本中首个实体开始,在该实体的前后分别插入对应的第一实体标识符和第二实体标识符,并在答复文本的首个字之前,依次插入第一问句标识符和第一意图标识符,并在答复文本的最后一个字之后,依次插入第二问句标识符和第二意图标识符,得到输入信息。
当然,还可以是在答复文本之前或者之后,按照标识符的顺序,顺次插入各标识符,得到输入信息。
在本实施例中,在识别到答复文本中包括多个实体时,根据每个实体各自的实体类型、实体起始位置和实体结束位置,获得每个实体的实体标识符。这样,根据实体标识符,在后续实体关系识别时,不仅能够确定实体间的位置,而且还能够结合实体间的前后位置以及实体类型,准确理解实体间的语义上关联。除此之外,为进一步提高准确性,还获取问句类型的标识符与意图类型的标识符。根据答复文本、每个实体的实体标识符、问句类型的标识符与意图类型的标识符,获得用于实体关系识别的输入信息。这样,该输入信息中不仅包含了该答复文本中实体信息,还包含了答复文本整体上的意图信息和对应问句的信息,增加了信息量。这样,通过调用实体关系识别模型,基于输入信息,能够更紧密关联当前的交互会话过程,准确识别出答复文本中的实体关系,以供后续更准确的完成标签填充,提高对象信息获取的准确性。
在一些实施例中,根据答复文本、每个实体的实体标识符、问句类型的标识符与意图类型的标识符,获得用于实体关系识别的输入信息,包括:根据每个实体在答复文本中的位置,确定相应实体标识符的拼接顺序;按相应实体标识符的拼接顺序,在答复文本之后依次拼接每个实体的实体标识符,以及在末尾实体标识符之后继续拼接问句类型的标识符与意图类型的标识符,得到用于实体关系识别的输入信息。
可选地,计算机设备根据每个实体的实体标识符,确定该实体在答复文本中的实体起始位置或者实体结束位置,计算机设备根据各实体的实体起始位置或者实体结束位置,确定各实体各自的实体标识符的拼接顺序。计算机设备按相应实体标识符的拼接顺序,在答复文本之后依次拼接每个实体的第一实体标识符、第二实体标识符,以及在最后一个实体的第二实体标识符之后,继续拼接问句类型的第一问句标识符和第二问句标识符、以及意图类型的第一意图标识符和第二意图标识符,得到用于实体关系识别的输入信息。
当然,在拼接问句类型的标识符和意图类型的标识符时,也可以是在最后一个实体的第二实体标识符之后,继续拼接意图类型的第一意图标识符和第二意图标识符、以及问句类型的第一问句标识符和第二问句标识符,得到用于实体关系识别的输入信息。
需要说明的是,在答复文本之前、之后和之中,插入不同的标识符,可能会对实体关系识别模型的识别带来巨大的时间开销,无法提高识别效率。由此,采用本实施例的拼接方式,将答复文本和标识符区分开来,能够节省识别时间,以此,提高识别效率。此外,在实体关系识别模型训练时,利用有监督的训练方式进行训练,例如,在预训练好的BERT模型的基础上进行微调训练,通过分类层(如softmax)进行预测,得到预测的实体关系后,利用样本文本的实际实体关系和预测实体关系,通过交叉熵损失进行微调训练,得到微调好的实体关系识别模型。在实体关系识别模型的训练过程中,由于问句类型和意图类型在前述阶段已经确定,因此,在实体关系识别模型训练阶段,实体关系识别模型无需学习问句类型的标识符和意图类型的标识符。
示例性地,如图7所示,为另一个实施例中实体关系识别的示意图。交互问句为“请问你何时出发?”,对应的答复问句为“我是10点出发的”。为了后续区分不同元素,图中以不同形状的文本框框出不同类型,在实际识别中也可以用不同的颜色示意。将答复文本中与实体关系无关的元素,用椭圆形框示意,如“我”、“是”、“的”。将两个实体分别用矩形框和平行四边形框框出,实体“10点”中各字用矩形框框出,实体“出发”中各字用平行四边形框框出。问句类型:出发时间,以及意图识别:出发描述意图,进一步,将问句类型的第一问句标识符和第二问句标识符/>用于梯形框框出、将意图类型的第一意图标识符/>和第二意图标识符/>用六边形框框出。
由此,基于答复文本、意图类型和问句类型进行输入处理,即将第一问句标识符、第一意图标识符顺次拼接在答复文本的首个字“我”之前,分别在每个实体的实体起始位置和实体结束位置添加相应的第一实体标识符和第二实体标识符。在答复文本的最后一个字“的”之后顺次插入第二意图标识符和第二问句标识符,即,输入信息为(各元素的文本框形状如图7所述,此处不示意):
当然,也可以在答复文本的最后一个字“的”之后顺次插入第二问句标识符和第二意图标识符,具体不作限定。
为了进一步提高识别效率,将进行输入优化,即在答复文本之后依次按各实体在答复文本的顺序,拼接各实体的第一实体标识符和第二实体标识符、并在末尾实体标识符之后继续拼接问句类型的第一问句标识符、第二问句标识符、第一意图标识符和第二意图标识符,得到优化后的输入信息:
/>
此时,将该输入信息传入实体关系识别模型,通过该实体关系识别模型中的语义特征提取和分类层分类后,得到分类后的结果,即确定实体关系“出发时间-10点”。
在本实施例中,首先,根据每个实体在答复文本中的位置,确定相应实体标识符的拼接顺序。然后按相应实体标识符的拼接顺序,在答复文本之后依次拼接每个实体的第一实体标识符和第二实体标识符,以及在最后一个实体的第二实体标识符之后继续拼接问句类型的第一问句标识符、第二问句标识符、意图类型的第一意图标识符和第二意图标识符,得到用于实体关系识别的输入信息。这样,不仅能够确保输入信息包含实体信息、答复文本的意图信息和相应问句信息,增加了信息量,确保识别准确,还通过将答复文本和相关的标识符区分开,以节省识别时间。基于此,提高了实体关系识别的效率。
在一些实施例中,根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,为实体关系中的实体匹配相应的标签,包括:分别计算识别出的实体关系与预设标签体系中各个标签之间的文本相似度;选取最高的文本相似度所对应的标签,作为与实体关系中的实体匹配的标签。
其中,文本相似度越高,则对应的标签与实体关系间越匹配。
当然,在另一些实施例中,计算机设备在分别确定了识别出的实体关系分别与各标签之间的文本相似度之后,利用分类处理,例如,通过softmax函数,分别确定各文本相似度对应的概率,选取最大的概率所对应的标签,作为与实体关系中实体匹配的标签。这样,能够直观反映各标签分别与实体关系是匹配的概率。
在一些实施例中,分别计算识别出的实体关系与预设标签体系中各个标签之间的文本相似度,包括:分别确定识别出的实体关系的语义向量与预设标签体系中各个标签的语义向量,根据识别出的实体关系的语义向量与预设标签体系中各个标签的语义向量,计算识别出的实体关系分别与预设标签体系中各个标签之间的文本相似度。
示例性地,计算机设备利用语义特征提取模型,分别提取出识别出的实体关系的语义向量、各个标签的语义向量。根据识别出的实体关系的语义向量和每个标签的语义向量,计算余弦相似度,确定对应的文本相似度。其中,文本相似度还可以利用欧氏距离等进行计算,具体不做限定。
由此,基于识别出的实体关系和各标签的语义向量,计算文本相似度,能够区分出实体关系与标签是否是匹配的,从而,提高标签匹配的准确性。
在本实施例中,通过计算识别出的实体关系分别与预设标签体系中各个标签之间的文本相似度,能够反映出实体关系分别与各标签间的匹配程度。因此,通过选取最高的文本相似度所对应的标签,作为与实体关系中的实体匹配的标签,能够确保标签匹配的准确性,也确保了对象信息的准确性。
在一些实施例中,选取最高的文本相似度所对应的标签,作为与实体关系中的实体匹配的标签,包括:从未填充标签中,筛选出答复文本的文本意图与交互问句的问句类型所指向的标签;若最高的文本相似度所对应的标签与所指向的标签相同,则将最高的文本相似度所对应的标签,作为实体关系中的实体匹配的标签。
可选地,计算机设备从未填充标签中,筛选出与问句类型所匹配的预设标签体系的标签,并从筛选出的标签中确定未填充标签,计算机设备从确定出的未填充标签中,再次筛选与文本意图对应的标签,得到文本意图与问句类型所指向的标签。计算机设备比较该最高的文本相似度所对应的标签是否为所指向的标签,若是,则将最高的文本相似度所对应的标签,作为实体关系中的实体匹配的标签。若否,则向目标对象发出确认语句,以指示目标对象输入关于实体关系的确认内容。
需要说明的是,若最高的文本相似度所对应的标签与所指向的标签不同,则说明当前目标对象的答复文本模糊,无法提取高置信度的对象信息。此时,需要让目标对象直接对实体关系是否正确进行确认回复,若确认回复表示实体关系不正确,则需要重新输入关于交互问句的答复文本。
在本实施例中,从未填充标签中,筛选出答复文本的文本意图与交互问句的问句类型所指向的标签。若最高的文本相似度所对应的标签与所指向的标签相同,则反映了目标对象的答复文本中信息清晰,答复文本的意图符合交互问句的答复要求,说明该最高的文本相似度所对应的标签是准确的,因此,能够将最高的文本相似度所对应的标签,作为实体关系中的实体匹配的标签。这样,确保了对象信息获取的准确性。
在一些实施例中,将实体作为所匹配的标签对应的对象信息填充至预设标签体系,包括:调用语义相似度表征模型,基于实体输出与实体匹配的归一化实体,将归一化实体作为所匹配的标签对应的对象信息填充至预设标签体系。
其中,语义相似度表征模型用于对实体的表达方式进行归一化,例如,答复问句为:开货车的;或者,答复问句为:开车拉货的。此时,可以利用语义相似度表征模型将该实体归一化为货车司机。
示例性地,计算机设备根据识别出的实体关系,确定需要填充到所匹配的标签中的实体,并调用语义相似度表征模型,将该实体输入至该语义相似度表征模型,对该实体进行归一化处理,得到归一化实体。计算机设备将归一化实体作为所匹配的标签对应的对象信息,并将归一化实体填充至预设标签体系中对应标签的槽位,得到填充后的预设标签体系。若该填充后的预设标签体系中还存在未填充标签,则返回步骤S202继续执行,若该填充后的预设标签体系中不存在未填充标签,则基于已填充标签中对象信息,确定该目标对象对应的预设标签体系的对象信息。
在本实施例中,通过调用语义相似度表征模型,基于实体输出与实体匹配的归一化实体,以统一实体的表达方式,由此,将归一化实体作为所匹配的标签对应的对象信息填充至预设标签体系。这样,规范了预设标签体系中填充的对象信息,更加直观且简洁的反映目标对象对应的预设标签体系的对象信息,确保了对象信息获取的准确性。
本申请还提供一种应用场景,该应用场景应用于上述的对象信息获取方法。具体地,该对象信息获取方法在该应用场景的应用例如:在关于流调数据采集场景中,需要基于不同对象的对象信息来对突发公共事件进行及时应对,例如,指定流行病的应对措施。由此,可以采用本申请实施例的对象信息获取方法准确获取每个目标对象对应预设标签体系的对象信息,确保后续应对措施的正确性。具体地,在预设标签体系中存在未填充标签时,计算机设备向目标对象发出与未填充标签相关的交互问句,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签;获取关于交互问句的答复文本,并识别答复文本的文本意图;当答复文本的文本意图与交互问句的问句类型匹配时,对答复文本进行实体提取,得到答复文本所包括的实体;基于问句类型、答复文本的文本意图与实体,识别实体关系;根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,为实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至预设标签体系;在预设标签体系中的标签均填充目标对象的对象信息时,获得目标对象对应预设标签体系的对象信息。
当然并不局限于此,本申请提供的对象信息获取方法还可以应用在其他应用场景中,例如在导医场景中,可以利用本申请实施例的对象信息获取方法来了解目标对象的情况,以填充目标对象对应的预设标签体系的标签,以进行辅助诊断。
上述应用场景仅为示意性的说明,可以理解,本申请各实施例所提供的对象信息获取方法的应用不局限于上述场景。
在一个具体的实施例中,如图8所示,为一个实施例中对象信息获取的流程示意图。在本实施例中实施主体为计算机设备。具体过程如下:
步骤1:计算机设备向目标对象发出交互问句。
可选地,计算机设备为目标对象构建预设标签体系,在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与预设标签体系相关的标准问句,并发出标准问句。若为非首次向目标对象发出交互问句,则根据预设标签体系中的已填充标签,确定未填充标签,已填充标签是预设标签体系中已填充了关于目标对象的对象信息的标签。计算机设备查询与未填充标签相关的交互问句,并发出交互问句。未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。
步骤2:计算机设备获取针对交互问句的答复文本。
可选地,计算机设备针对目标对象输入的输入内容,获取针对交互问句的答复文本。
步骤3:计算机设备根据答复文本进行意图识别,得到答复文本的文本意图。
可选地,计算机设备获取意图识别模型,将答复文本输入至意图识别模型,通过意图识别模型的向量提取层,确定答复文本的语义特征,并通过意图识别模型的分类层,确定答复文本的文本意图分别属于各意图类型的概率,根据各概率,确定答复文本的文本意图。计算机设备获取问句类型和意图类型的映射关系。根据映射关系,检查交互问句的问句类型与答复文本的文本意图是否匹配。若不匹配,则计算机设备返回步骤1继续执行,即返回发出交互问句步骤继续执行。
步骤4:计算机设备对答复文本进行实体识别。
可选地,当答复文本的文本意图与交互问句的问句类型匹配时,计算机设备调用实体识别模型。其中,实体识别模型包括特征提取网络和实体定位网络,实体定位网络包括用于标注实体起始位置的第一网络和用于标注实体结束位置的第二网络。计算机设备基于实体识别模型的特征提取网络,对答复文本进行特征提取,得到答复文本中各字的语义向量。通过第一网络,根据各字的语义向量标注出答复文本中每个实体的实体类型和实体起始位置,通过第二网络,根据各字的语义向量标注出答复文本中每个实体的实体类型和实体结束位置。根据每个实体的实体起始位置和实体结束位置,确定答复文本所包括的实体。
步骤5:计算机设备根据识别出的多个实体、答复文本的文本意图和相应的交互问句的问句类型进行实体关系识别。
可选地,计算机设备根据每个实体各自的实体类型、实体起始位置和实体结束位置,获得每个实体的实体标识符。获取问句类型的标识符与文本意图的意图类型的标识符;根据每个实体在答复文本中的位置,确定相应实体标识符的拼接顺序。按相应实体标识符的拼接顺序,在答复文本之后依次拼接每个实体的实体标识符,以及在末尾实体标识符之后继续拼接问句类型的标识符与意图类型的标识符,得到用于实体关系识别的输入信息。调用实体关系识别模型,基于输入信息识别出答复文本中的实体关系。
步骤6:计算机设备基于识别出的实体关系,进行标签匹配,将实体作为所匹配的标签对应的对象信息填充至预设标签体系。
可选地,计算机设备分别确定识别出的实体关系的语义向量与预设标签体系中各个标签的语义向量,根据识别出的实体关系的语义向量与预设标签体系中各个标签的语义向量,计算识别出的实体关系分别与预设标签体系中各个标签之间的文本相似度。计算机设备选取最高的文本相似度所对应的标签,作为与实体关系中的实体匹配的标签。从未填充标签中,筛选出答复文本的文本意图与交互问句的问句类型所指向的标签。若最高的文本相似度所对应的标签与所指向的标签相同,则将最高的文本相似度所对应的标签,作为实体关系中的实体匹配的标签。调用语义相似度表征模型,基于实体输出与实体匹配的归一化实体,将归一化实体作为所匹配的标签对应的对象信息填充至预设标签体系。
若该填充后的预设标签体系中还存在未填充标签,则返回步骤1继续执行。在预设标签体系中的标签均填充目标对象的对象信息时,获得目标对象对应预设标签体系的对象信息。
在本实施例中,在预设标签体系中存在未填充标签时,需要进一步向目标对象发起会话,此时,通过向目标对象发出与未填充标签相关的交互问句开启本轮会话,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签。获取关于交互问句的答复文本,并识别答复文本的文本意图;当答复文本的文本意图与交互问句的问句类型匹配时,则说明答复文本符合交互问句的答复要求,基于此,才会对答复文本进行实体提取,得到答复文本所包括的实体。这样,避免了对回复错误的答复文本进行实体识别,确保了实体识别的有效性,也提高了后续标签识别的准确性。在具有上下文信息的会话场景下,基于问句类型、答复文本的文本意图与实体,识别实体关系,能够充分捕捉答复文本中实体与实体间复杂语义的关联关系,从而,提高了实体关系识别的准确性。根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,评估实体关系与各标签间的匹配程度。这样,能够从预设标签体系中为实体关系中的实体匹配相应的标签,提高标签识别的准确性。然后,将实体作为所匹配的标签对应的对象信息填充至预设标签体系;在预设标签体系中的标签均填充目标对象的对象信息时,确定会话结束。此时,基于多轮会话所确定的各标签的对象信息,能够全面且准确的获得与目标对象精准对应预设标签体系的对象信息,从而,提高了对象信息获取的准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的对象信息获取方法的对象信息获取装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个对象信息获取装置实施例中的具体限定可以参见上文中对于对象信息获取方法的限定,在此不再赘述。
在一个实施例中,如图9所示,提供了一种对象信息获取装置900,包括:交互问句发出模块902、意图识别模块904、实体提取模块906、实体关系识别模块908、标签匹配模块910和信息获取模块912,其中:
交互问句发出模块902,用于在预设标签体系中存在未填充标签时,向目标对象发出与未填充标签相关的交互问句,未填充标签是预设标签体系中未填充关于目标对象的对象信息的标签;
意图识别模块904,用于获取关于交互问句的答复文本,并识别答复文本的文本意图;
实体提取模块906,用于当答复文本的文本意图与交互问句的问句类型匹配时,对答复文本进行实体提取,得到答复文本所包括的实体;
实体关系识别模块908,用于基于问句类型、答复文本的文本意图与实体,识别实体关系;
标签匹配模块910,用于根据识别出的实体关系与预设标签体系中各个标签之间的文本相似度,为实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至预设标签体系;
信息获取模块912,用于在预设标签体系中的标签均填充目标对象的对象信息时,获得目标对象对应预设标签体系的对象信息。
在一些实施例中,交互问句发出模块902,用于在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与预设标签体系相关的标准问句,并发出标准问句;在预设标签体系中存在未填充标签时,若为非首次向目标对象发出交互问句,则根据预设标签体系中的已填充标签,确定未填充标签,已填充标签是预设标签体系中已填充了关于目标对象的对象信息的标签,查询与未填充标签相关的交互问句,并发出交互问句。
在一些实施例中,意图识别模块904,用于获取意图识别模型;调用意图识别模型,对答复文本进行意图识别,得到文本意图。
在一些实施例中,意图识别模块904,用于将答复文本输入至意图识别模型,通过意图识别模型的向量提取层,确定答复文本的语义特征,并通过意图识别模型的分类层,确定答复文本的文本意图分别属于各意图类型的概率,根据各概率,确定答复文本的文本意图。
在一些实施例中,装置还包括检查模块,检查模块,用于获取问句类型和意图类型的映射关系;根据映射关系,检查交互问句的问句类型与答复文本的文本意图是否匹配。
在一些实施例中,实体提取模块906,用于调用实体识别模型;基于实体识别模型的特征提取网络,对答复文本进行特征提取,得到答复文本中各字的语义向量;基于实体识别模型的实体定位网络,根据答复文本中各字的语义向量,输出答复文本所包括的实体。
在一些实施例中,实体定位网络包括用于标注实体起始位置的第一网络和用于标注实体结束位置的第二网络;实体提取模块906,用于通过第一网络,根据各字的语义向量标注出答复文本中每个实体的实体类型和实体起始位置,通过第二网络,根据各字的语义向量标注出答复文本中每个实体的实体类型和实体结束位置;根据每个实体的实体起始位置和实体结束位置,确定答复文本所包括的实体。
在一些实施例中,实体关系识别模块908,用于在识别到答复文本中包括多个实体时,根据每个实体各自的实体类型、实体起始位置和实体结束位置,获得每个实体的实体标识符;获取问句类型的标识符与文本意图的意图类型的标识符;根据答复文本、每个实体的实体标识符、问句类型的标识符与意图类型的标识符,获得用于实体关系识别的输入信息;调用实体关系识别模型,基于输入信息识别出答复文本中的实体关系。
在一些实施例中,实体关系识别模块908,用于根据每个实体在答复文本中的位置,确定相应实体标识符的拼接顺序;按相应实体标识符的拼接顺序,在答复文本之后依次拼接每个实体的实体标识符,以及在末尾实体标识符之后继续拼接问句类型的标识符与意图类型的标识符,得到用于实体关系识别的输入信息。
在一些实施例中,标签匹配模块910,用于分别计算识别出的实体关系与预设标签体系中各个标签之间的文本相似度;选取最高的文本相似度所对应的标签,作为与实体关系中的实体匹配的标签。
在一些实施例中,标签匹配模块910,用于分别确定识别出的实体关系的语义向量与预设标签体系中各个标签的语义向量,根据识别出的实体关系的语义向量与预设标签体系中各个标签的语义向量,计算识别出的实体关系分别与预设标签体系中各个标签之间的文本相似度。
在一些实施例中,标签匹配模块910,用于从未填充标签中,筛选出答复文本的文本意图与交互问句的问句类型所指向的标签;若最高的文本相似度所对应的标签与所指向的标签相同,则将最高的文本相似度所对应的标签,作为实体关系中的实体匹配的标签。
在一些实施例中,标签匹配模块910,用于调用语义相似度表征模型,基于实体输出与实体匹配的归一化实体,将归一化实体作为所匹配的标签对应的对象信息填充至预设标签体系。
上述对象信息获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,也可以是终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对象信息获取方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (26)
1.一种对象信息获取方法,其特征在于,所述方法包括:
在预设标签体系中存在未填充标签时,向目标对象发出与所述未填充标签相关的交互问句,所述未填充标签是所述预设标签体系中未填充关于所述目标对象的对象信息的标签;
获取关于所述交互问句的答复文本,并识别所述答复文本的文本意图;
当所述答复文本的文本意图与所述交互问句的问句类型匹配时,对所述答复文本进行实体提取,得到所述答复文本所包括的实体;
在识别到所述答复文本中包括多个实体时,根据每个实体各自的实体类型和实体起始位置,确定与所述实体起始位置对应的第一实体标识符,并根据每个实体各自的实体类型和实体结束位置,确定与所述实体结束位置对应的第二实体标识符;
根据所述文本意图的意图类型生成所述意图类型的标识符,并根据所述交互问句的问句类型,生成所述问句类型的标识符;
拼接各实体各自的第一实体标识符、第二实体标识符、意图类型的标识符和问句类型的标识符,确定用于实体关系识别的输入信息,并调用实体关系识别模型,基于所述输入信息识别出所述答复文本中的实体关系;
根据识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度,为所述实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至所述预设标签体系;
在所述预设标签体系中的标签均填充所述目标对象的对象信息时,获得所述目标对象对应所述预设标签体系的对象信息。
2.根据权利要求1所述的方法,其特征在于,所述在预设标签体系中存在未填充标签时,向目标对象发出与所述未填充标签相关的交互问句,包括:
在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与所述预设标签体系相关的标准问句,并发出所述标准问句;
在预设标签体系中存在未填充标签时,若为非首次向目标对象发出交互问句,则根据所述预设标签体系中的已填充标签,确定未填充标签,所述已填充标签是所述预设标签体系中已填充了关于所述目标对象的对象信息的标签,查询与所述未填充标签相关的交互问句,并发出所述交互问句。
3.根据权利要求1所述的方法,其特征在于,所述识别所述答复文本的文本意图,包括:
获取意图识别模型;
调用所述意图识别模型,对所述答复文本进行意图识别,得到文本意图。
4.根据权利要求3所述的方法,其特征在于,所述调用所述意图识别模型,对所述答复文本进行意图识别,得到文本意图,包括:
将所述答复文本输入至所述意图识别模型,通过所述意图识别模型的向量提取层,确定所述答复文本的语义特征,并通过所述意图识别模型的分类层,确定所述答复文本的文本意图分别属于各意图类型的概率,根据各概率,确定所述答复文本的文本意图。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取问句类型和意图类型的映射关系;
根据所述映射关系,检查所述交互问句的问句类型与所述答复文本的文本意图是否匹配。
6.根据权利要求1所述的方法,其特征在于,所述对所述答复文本进行实体提取,得到所述答复文本所包括的实体,包括:
调用实体识别模型;
基于所述实体识别模型的特征提取网络,对所述答复文本进行特征提取,得到所述答复文本中各字的语义向量;
基于所述实体识别模型的实体定位网络,根据所述答复文本中各字的语义向量,输出所述答复文本所包括的实体。
7.根据权利要求6所述的方法,其特征在于,所述实体定位网络包括用于标注实体起始位置的第一网络和用于标注实体结束位置的第二网络;
所述基于所述实体识别模型的实体定位网络,根据所述答复文本中各字的语义向量,输出所述答复文本所包括的实体,包括:
通过所述第一网络,根据各字的语义向量标注出所述答复文本中每个实体的实体类型和实体起始位置,通过所述第二网络,根据各字的语义向量标注出所述答复文本中每个实体的实体类型和实体结束位置;
根据每个实体的实体起始位置和实体结束位置,确定所述答复文本所包括的实体。
8.根据权利要求1所述的方法,其特征在于,所述意图类型的标识符和包括第一意图标识符和第二意图标识符,所述问句类型的标识符包括第一问句标识符和第二问句标识符,所述第一意图标识符和第一问句标识符是插入在答复问句之前的意图类型的标识符和问句类型的标识符,所述第二意图标识符和第二问句标识符是插入在所述答复问句之后的意图类型的标识符和问句类型的标识符;
所述拼接各实体各自的第一实体标识符、第二实体标识符、意图类型的标识符和问句类型的标识符,确定用于实体关系识别的输入信息,包括:
在所述答复文本之后,按各所述实体在所述答复文本的顺序,依次拼接各所述实体的所述第一实体标识符和所述第二实体标识符,并在末个实体的第二实体标识符之后继续拼接所述第一问句标识符、所述第二问句标识符、所述第一意图标识符和所述第二意图标识符,得到用于实体关系识别的输入信息。
9.根据权利要求1所述的方法,其特征在于,所述根据识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度,为所述实体关系中的实体匹配相应的标签,包括:
分别计算识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度;
选取最高的文本相似度所对应的标签,作为与所述实体关系中的实体匹配的标签。
10.根据权利要求9所述的方法,其特征在于,所述分别计算识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度,包括:
分别确定识别出的实体关系的语义向量与所述预设标签体系中各个标签的语义向量,根据识别出的实体关系的语义向量与所述预设标签体系中各个标签的语义向量,计算识别出的实体关系分别与所述预设标签体系中各个标签之间的文本相似度。
11.根据权利要求9所述的方法,其特征在于,所述选取最高的文本相似度所对应的标签,作为与所述实体关系中的实体匹配的标签,包括:
从所述未填充标签中,筛选出所述答复文本的文本意图与所述交互问句的问句类型所指向的标签;
若最高的文本相似度所对应的标签与所述所指向的标签相同,则将最高的文本相似度所对应的标签,作为所述实体关系中的实体匹配的标签。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述将实体作为所匹配的标签对应的对象信息填充至所述预设标签体系,包括:
调用语义相似度表征模型,基于所述实体输出与所述实体匹配的归一化实体,将所述归一化实体作为所匹配的标签对应的对象信息填充至所述预设标签体系。
13.一种对象信息获取装置,其特征在于,所述装置包括:
交互问句发出模块,用于在预设标签体系中存在未填充标签时,向目标对象发出与所述未填充标签相关的交互问句,所述未填充标签是所述预设标签体系中未填充关于所述目标对象的对象信息的标签;
意图识别模块,用于获取关于所述交互问句的答复文本,并识别所述答复文本的文本意图;
实体提取模块,用于当所述答复文本的文本意图与所述交互问句的问句类型匹配时,对所述答复文本进行实体提取,得到所述答复文本所包括的实体;
实体关系识别模块,用于在识别到所述答复文本中包括多个实体时,根据每个实体各自的实体类型和实体起始位置,确定与所述实体起始位置对应的第一实体标识符,并根据每个实体各自的实体类型和实体结束位置,确定与所述实体结束位置对应的第二实体标识符;根据所述文本意图的意图类型生成所述意图类型的标识符,并根据所述交互问句的问句类型,生成所述问句类型的标识符;拼接各实体各自的第一实体标识符、第二实体标识符、意图类型的标识符和问句类型的标识符,确定用于实体关系识别的输入信息,并调用实体关系识别模型,基于所述输入信息识别出所述答复文本中的实体关系;
标签匹配模块,用于根据识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度,为所述实体关系中的实体匹配相应的标签,并将实体作为所匹配的标签对应的对象信息填充至所述预设标签体系;
信息获取模块,用于在所述预设标签体系中的标签均填充所述目标对象的对象信息时,获得所述目标对象对应所述预设标签体系的对象信息。
14.根据权利要求13所述的装置,其特征在于,所述交互问句发出模块,用于在预设标签体系中存在未填充标签时,若为首次向目标对象发出交互问句,则获取与所述预设标签体系相关的标准问句,并发出所述标准问句;在预设标签体系中存在未填充标签时,若为非首次向目标对象发出交互问句,则根据所述预设标签体系中的已填充标签,确定未填充标签,所述已填充标签是所述预设标签体系中已填充了关于所述目标对象的对象信息的标签,查询与所述未填充标签相关的交互问句,并发出所述交互问句。
15.根据权利要求13所述的装置,其特征在于,所述意图识别模块,用于获取意图识别模型;调用所述意图识别模型,对所述答复文本进行意图识别,得到文本意图。
16.根据权利要求15所述的装置,其特征在于,所述意图识别模块,用于将所述答复文本输入至所述意图识别模型,通过所述意图识别模型的向量提取层,确定所述答复文本的语义特征,并通过所述意图识别模型的分类层,确定所述答复文本的文本意图分别属于各意图类型的概率,根据各概率,确定所述答复文本的文本意图。
17.根据权利要求13所述的装置,其特征在于,所述装置还包括检查模块,所述检查模块,用于获取问句类型和意图类型的映射关系;根据所述映射关系,检查所述交互问句的问句类型与所述答复文本的文本意图是否匹配。
18.根据权利要求13所述的装置,其特征在于,所述实体提取模块,用于调用实体识别模型;基于所述实体识别模型的特征提取网络,对所述答复文本进行特征提取,得到所述答复文本中各字的语义向量;基于所述实体识别模型的实体定位网络,根据所述答复文本中各字的语义向量,输出所述答复文本所包括的实体。
19.根据权利要求18所述的装置,其特征在于,所述实体定位网络包括用于标注实体起始位置的第一网络和用于标注实体结束位置的第二网络;所述实体提取模块,用于通过所述第一网络,根据各字的语义向量标注出所述答复文本中每个实体的实体类型和实体起始位置,通过所述第二网络,根据各字的语义向量标注出所述答复文本中每个实体的实体类型和实体结束位置;根据每个实体的实体起始位置和实体结束位置,确定所述答复文本所包括的实体。
20.根据权利要求13所述的装置,其特征在于,所述意图类型的标识符和包括第一意图标识符和第二意图标识符,所述问句类型的标识符包括第一问句标识符和第二问句标识符,所述第一意图标识符和第一问句标识符是插入在答复问句之前的意图类型的标识符和问句类型的标识符,所述第二意图标识符和第二问句标识符是插入在所述答复问句之后的意图类型的标识符和问句类型的标识符,所述实体关系识别模块,用于在所述答复文本之后,按各所述实体在所述答复文本的顺序,依次拼接各所述实体的所述第一实体标识符和所述第二实体标识符,并在末个实体的第二实体标识符之后继续拼接所述第一问句标识符、所述第二问句标识符、所述第一意图标识符和所述第二意图标识符,得到用于实体关系识别的输入信息。
21.根据权利要求13所述的装置,其特征在于,所述标签匹配模块,用于分别计算识别出的实体关系与所述预设标签体系中各个标签之间的文本相似度;选取最高的文本相似度所对应的标签,作为与所述实体关系中的实体匹配的标签。
22.根据权利要求21所述的装置,其特征在于,所述标签匹配模块,用于分别确定识别出的实体关系的语义向量与所述预设标签体系中各个标签的语义向量,根据识别出的实体关系的语义向量与所述预设标签体系中各个标签的语义向量,计算识别出的实体关系分别与所述预设标签体系中各个标签之间的文本相似度。
23.根据权利要求21所述的装置,其特征在于,所述标签匹配模块,用于从所述未填充标签中,筛选出所述答复文本的文本意图与所述交互问句的问句类型所指向的标签;若最高的文本相似度所对应的标签与所述所指向的标签相同,则将最高的文本相似度所对应的标签,作为所述实体关系中的实体匹配的标签。
24.根据权利要求13至23中任一项所述的装置,其特征在于,所述标签匹配模块,用于调用语义相似度表征模型,基于所述实体输出与所述实体匹配的归一化实体,将所述归一化实体作为所匹配的标签对应的对象信息填充至所述预设标签体系。
25.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
26.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311476117.2A CN117235234B (zh) | 2023-11-08 | 2023-11-08 | 对象信息获取方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311476117.2A CN117235234B (zh) | 2023-11-08 | 2023-11-08 | 对象信息获取方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117235234A CN117235234A (zh) | 2023-12-15 |
CN117235234B true CN117235234B (zh) | 2024-03-01 |
Family
ID=89082869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311476117.2A Active CN117235234B (zh) | 2023-11-08 | 2023-11-08 | 对象信息获取方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117235234B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086351A (zh) * | 2018-07-17 | 2018-12-25 | 北京光年无限科技有限公司 | 一种获取用户标签的方法及用户标签系统 |
CN109344253A (zh) * | 2018-09-18 | 2019-02-15 | 平安科技(深圳)有限公司 | 添加用户标签的方法、装置、计算机设备和存储介质 |
CN111339284A (zh) * | 2020-02-13 | 2020-06-26 | 深圳壹账通智能科技有限公司 | 产品智能匹配方法、装置、设备及可读存储介质 |
CN112417891A (zh) * | 2020-11-29 | 2021-02-26 | 中国科学院电子学研究所苏州研究院 | 一种基于开放式信息抽取的文本关系自动标注方法 |
WO2021232725A1 (zh) * | 2020-05-22 | 2021-11-25 | 百度在线网络技术(北京)有限公司 | 基于语音交互的信息核实方法、装置、设备和计算机存储介质 |
CN115358241A (zh) * | 2022-10-20 | 2022-11-18 | 科大讯飞股份有限公司 | 基于人机交互的标注方法及相关装置、设备和介质 |
CN115600596A (zh) * | 2022-10-10 | 2023-01-13 | 中国电信股份有限公司(Cn) | 命名实体识别方法、装置、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005348055A (ja) * | 2004-06-02 | 2005-12-15 | Toshiba Corp | ユーザプロファイル編集装置及びユーザプロファイル編集方法並びにプログラム |
US9875296B2 (en) * | 2015-03-25 | 2018-01-23 | Google Llc | Information extraction from question and answer websites |
-
2023
- 2023-11-08 CN CN202311476117.2A patent/CN117235234B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086351A (zh) * | 2018-07-17 | 2018-12-25 | 北京光年无限科技有限公司 | 一种获取用户标签的方法及用户标签系统 |
CN109344253A (zh) * | 2018-09-18 | 2019-02-15 | 平安科技(深圳)有限公司 | 添加用户标签的方法、装置、计算机设备和存储介质 |
CN111339284A (zh) * | 2020-02-13 | 2020-06-26 | 深圳壹账通智能科技有限公司 | 产品智能匹配方法、装置、设备及可读存储介质 |
WO2021232725A1 (zh) * | 2020-05-22 | 2021-11-25 | 百度在线网络技术(北京)有限公司 | 基于语音交互的信息核实方法、装置、设备和计算机存储介质 |
CN112417891A (zh) * | 2020-11-29 | 2021-02-26 | 中国科学院电子学研究所苏州研究院 | 一种基于开放式信息抽取的文本关系自动标注方法 |
CN115600596A (zh) * | 2022-10-10 | 2023-01-13 | 中国电信股份有限公司(Cn) | 命名实体识别方法、装置、电子设备及存储介质 |
CN115358241A (zh) * | 2022-10-20 | 2022-11-18 | 科大讯飞股份有限公司 | 基于人机交互的标注方法及相关装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117235234A (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112100349B (zh) | 一种多轮对话方法、装置、电子设备及存储介质 | |
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
CN108694225B (zh) | 一种图像搜索方法、特征向量的生成方法、装置及电子设备 | |
CN110717514A (zh) | 会话意图识别方法、装置、计算机设备和存储介质 | |
WO2021190259A1 (zh) | 一种槽位识别方法及电子设备 | |
CN110457689B (zh) | 语义处理方法及相关装置 | |
CN111651992A (zh) | 命名实体标注方法、装置、计算机设备和存储介质 | |
CN111428504B (zh) | 一种事件抽取方法和装置 | |
CN110704586A (zh) | 一种信息处理方法及系统 | |
CN112287095A (zh) | 确定问题答案的方法、装置、计算机设备及存储介质 | |
CN113326702B (zh) | 语义识别方法、装置、电子设备及存储介质 | |
CN113051380B (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN113836303A (zh) | 一种文本类别识别方法、装置、计算机设备及介质 | |
CN114398881A (zh) | 基于图神经网络的交易信息识别方法、系统及介质 | |
CN113254613A (zh) | 对话问答方法、装置、设备及存储介质 | |
CN115544303A (zh) | 用于确定视频的标签的方法、装置、设备及介质 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN116522905B (zh) | 文本纠错方法、装置、设备、可读存储介质及程序产品 | |
CN111783425B (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
CN117093687A (zh) | 问题应答方法和装置、电子设备、存储介质 | |
CN117235234B (zh) | 对象信息获取方法、装置、计算机设备和存储介质 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN116127013A (zh) | 一种个人敏感信息知识图谱查询方法和装置 | |
CN113836950B (zh) | 商品标题文本翻译方法及其装置、设备与介质 | |
WO2022262080A1 (zh) | 一种对话关系处理方法、计算机及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |