CN113240438A - 意图识别方法、设备、存储介质及程序产品 - Google Patents

意图识别方法、设备、存储介质及程序产品 Download PDF

Info

Publication number
CN113240438A
CN113240438A CN202110510666.1A CN202110510666A CN113240438A CN 113240438 A CN113240438 A CN 113240438A CN 202110510666 A CN202110510666 A CN 202110510666A CN 113240438 A CN113240438 A CN 113240438A
Authority
CN
China
Prior art keywords
single sentence
recognized
intention
sentence
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110510666.1A
Other languages
English (en)
Inventor
吴良庆
邱立坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN202110510666.1A priority Critical patent/CN113240438A/zh
Publication of CN113240438A publication Critical patent/CN113240438A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供一种意图识别方法、设备、存储介质及程序产品,通过接收用户输入的待识别单句;根据待识别单句及第一预设模型,获取待识别单句的预测意图以及对应的置信度;若置信度不高于第一预设阈值,则根据待识别单句及第二预设模型,判断待识别单句是否与上一单句存在依赖关系;若确定待识别单句与上文存在依赖关系,则根据上一单句的意图确定待识别单句的最终意图;若确定待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。本发明实施例第一预设模型只需进行单句意图识别,不需对上下文长句进行意图识别,降低维护运营成本,通过第二模型判断是否依赖上文,提高最终所确定的意图的准确性,提升用户体验。

Description

意图识别方法、设备、存储介质及程序产品
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种意图识别方法、设备、存储介质及程序产品。
背景技术
在智能客服等场景中,需要对用户输入的问题进行意图识别,智能客服再基于所识别到的意图进行相应的处理,使得用户的问题得到解决。
由于用户通常每一轮输入的问题通常为单句,现有技术中通常需要结合用户的上文信息,采用文本分类模型进行意图识别,但是对于结合用户的上文信息进行意图识别的文本分类模型,其模型训练过程中需要大量的标注数据,且后期数据清洗的规模较大,不利于维护,运营成本较高;并且,结合用户的上文信息进行意图识别中,对于上下文长句的语义理解难度较大,尤其是用户每一轮输入单句并不都是完整的,可能存在省略或断句的现象,增加了意图识别的难度。
发明内容
本发明实施例提供一种意图识别方法、设备、存储介质及程序产品,意图识别时不需要每个单句都结合上文,降低意图识别的维护和运营成本。
第一方面,本发明实施例提供一种意图识别方法,包括:
接收用户输入的待识别单句;
根据所述待识别单句以及第一预设模型,获取所述待识别单句的预测意图以及对应的置信度;
若所述置信度不高于第一预设阈值,则根据所述待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系;
若确定所述待识别单句与上文存在依赖关系,则根据上一单句的意图确定所述待识别单句的最终意图;或者
若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。
第二方面,本发明实施例提供一种意图识别设备,包括:
接收单元,用于接收用户输入的待识别单句;
意图识别单元,用于根据所述待识别单句以及第一预设模型,获取所述待识别单句的预测意图以及对应的置信度;
依赖关系识别单元,用于若所述置信度不高于第一预设阈值,则根据所述待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系;
处理单元,用于若确定所述待识别单句与上文存在依赖关系,则根据上一单句的意图确定所述待识别单句的最终意图;或者,若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。
第三方面,本发明实施例提供一种电子设备,包括:至少一个处理器;以及存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面所述的方法。
第五方面,本发明实施例提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第一方面所述的方法。
本发明实施例提供的意图识别方法、设备、存储介质及程序产品,通过接收用户输入的待识别单句;根据待识别单句以及第一预设模型,获取待识别单句的预测意图以及对应的置信度;若所述置信度不高于第一预设阈值,则根据待识别单句以及第二预设模型,判断待识别单句是否与上一单句存在依赖关系;若确定待识别单句与上文存在依赖关系,则根据上一单句的意图确定待识别单句的最终意图;或者,若确定待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。本发明实施例中第一预设模型只需要进行单句的意图识别即可,不需要对上下文长句进行意图识别,降低了维护和运营成本,通过第二模型进行是否依赖上文的判断,可以有效的提高最终所确定的意图的准确性,提升用户体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明一实施例提供的意图识别方法的应用场景图;
图2为本发明一实施例提供的意图识别方法的流程图;
图3为本发明一实施例提供的意图识别方法的第一预设模型的示意图;
图4为本发明另一实施例提供的意图识别方法的流程图;
图5为本发明一实施例提供的意图识别设备的结构图;
图6为本发明一实施例提供的电子设备的结构图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在智能客服等场景中,需要对用户输入的问题进行意图识别,智能客服再基于所识别到的意图进行相应的处理,使得用户的问题得到解决。
由于用户通常每一轮输入的问题通常为单句,现有技术中通常需要结合用户的上文信息,采用文本分类模型进行意图识别,也即在识别当前一轮输入的单句时,需要将上文信息也即上一轮或上几轮输入的单句以及当前的单句都输入到文本分类模型中。
但是对于结合用户的上文信息进行意图识别的文本分类模型,其模型训练过程中需要大量的标注数据,尤其是对于同一种意图的单句,其上文可能有不同的情况,为了在不同情况中结合上文时对于该意图的单句都能准确的确定出同一种意图,因此需要对该意图的单句准备多种不同的上文,作为训练数据,才能够准确的训练文本分类模型;并且,由于训练数据的数据量比较大,可能存在一些不准确的训练数据,后期数据清洗的规模较大,不利于维护,运营成本较高;并且,结合用户的上文信息进行意图识别中,对于上下文长句的语义理解难度较大,尤其是用户每一轮输入单句并不都是完整的,可能存在省略或断句的现象,通过文本分类模型无法准确得到意图识别结果,增加了意图识别的难度。
针对上述技术问题,本发明实施例中在接收到用户输入的待识别单句后,可通过第一预设模型获取待识别单句的预测意图以及对应的置信度,若置信度高于第一预设阈值,可直接将预测意图作为待识别单句的最终意图;若置信度不高于第一预设阈值,则通过第二预设模型判断所述待识别单句是否与上一单句存在依赖关系,进一步的,若确定待识别单句与上一单句存在依赖关系,则根据上一单句的意图确定待识别单句的最终意图;若确定待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。本发明实施例中第一预设模型只需要进行单句的意图识别即可,不需要对上下文长句进行意图识别,降低了维护和运营成本,通过第二模型进行是否依赖上文的判断,可以有效的提高最终所确定的意图的准确性。
本发明实施例具体的应用场景如图1所示,包括用户终端101和服务器102,用户终端101可以将单句形式的问题发送给服务器,服务器102接收用户输入的待识别单句;根据待识别单句以及第一预设模型,获取待识别单句的预测意图以及对应的置信度;判断置信度是否高于第一预设阈值,若置信度高于第一预设阈值,可直接将预测意图作为待识别单句的最终意图;若置信度不高于第一预设阈值,则根据待识别单句以及第二预设模型,判断待识别单句是否与上一单句存在依赖关系;若确定待识别单句与上文存在依赖关系,则根据上一单句的意图确定待识别单句的最终意图;或者,若确定待识别单句与上文不存在依赖关系,则通过与用户交互确定待识别单句的最终意图。进一步的,服务器102还可根据待识别单句的最终意图,向用户终端101发送应答信息。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明实施例提供的意图识别方法流程图。本实施例提供了一种意图识别方法,其执行主体可以为服务器、智能机器人等任意电子设备,该意图识别方法具体步骤如下:
S201、接收用户输入的待识别单句。
在本实施例中,在一些应用场景中,用户可通过在手机、平板电脑等终端输入待识别单句,并由终端发送给服务器,例如电商平台用户与智能客服交互场景,用户可以将问题等内容发送给服务器中的智能客服,其中用户输入的问题通常表现为单句。在其他应用场景中,也可以是用户与智能机器人进行交互过程,例如语音交互,智能机器人可以采集到用户问题的语音,并转换为待识别单句。当然本发明实施例也可应用于其他应用场景中,进而用户可采取相应的方式输入待识别的单句,此处不再一一赘述。
S202、根据所述待识别单句以及第一预设模型,获取所述待识别单句的预测意图以及对应的置信度。
在本实施例中,第一预设模型可以为任意能够实现单句意图识别的模型,通过将待识别单句输入到第一预设模型中,输出待识别单句的预测意图以及对应的置信度。
在一可选实施例中,所述第一预设模型为BERT模型编码器(BidirectionalEncoder Representation from Transformers,双向Transformer编码器)。通过BERT模型编码器,自动对文本输入进行分词,初始化模型参数,进而可对下游的分类任务(即单句意图分类)进行预测。如图3所示,用户输入待识别单句后,进入BERT编码器,对待识别单句进行分词,得到每一个词的token-id,输入到BERT编码器网络层中,E表示词的嵌入表示,经过多层Transformer变换后,得到最终的句子表示T[CLS],可以直接用于文本分类,得到待识别单句的意图类别。其中,BERT编码器用分词工具来进行分词,并插入特殊的分离符([CLS],用来分隔样本)和分隔符([SEP],用来分隔样本内的不同句子)。
本实施例中的BERT模型为预训练模型(Pretrained Model),相较于其他语言模型,例如基于机器学习的方法,如朴素贝叶斯以及支持向量机等,或者基于神经网络的方法,如Text-CNN(文本卷积神经网络)、HAN(Hierarchical Attention Network,层次注意力机制网络)等,大多需要是对网络参数进行随机初始化,再通过反向传播算法进行训练,而预训练模型不再需要对模型的参数进行随机初始化,通过设计特定的任务,利用海量的无标注语料数据即可学习到通用的网络模型参数。接着对于下游任务,直接采用这套参数对模型进行初始化,从而加快对模型的训练并提升下游任务的效果。其中对于第一预设模型的训练可以在服务器上实现,也可在其他设备上训练完成后部署在服务器上。
当然,需要说明的是,本实施例中也可采用其他任意能够实现单句意图识别的模型,此处不再一一赘述。
S203、若所述置信度不高于第一预设阈值,则根据所述待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系。
在本实施例中,若置信度较高,例如高于第一预设阈值,可以直接将待识别单句的预测意图确定为所述待识别单句的最终意图,可结束意图识别方法;若置信度不高于第一预设阈值,则将待识别单句输入第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系。
其中,第二预设模型可用于判断待识别单句是否与上一单句存在依赖关系,也即判断待识别单句是否依赖上一单句。
在一可选实施例中,所述第二预设模型为二分类模型,也即输入为待识别单句,输出为是否依赖上文的判断结果,例如,若确定所述待识别单句与上文存在依赖关系,则可输出“1”,若确定所述待识别单句与上文不存在依赖关系,则可输出“0”。可选的,所述第二预设模型也可为BERT模型编码器。
进一步的,对于第二预设模型,可通过如下过程训练:
获取正例样本和负例样本,根据所述正例样本和所述负例样本,对所述二分类模型的初始模型进行训练,得到训练后的所述第二预设模型;
其中,所述正例样本包括通过所述第一预设模型获取预测意图时置信度不高于第二预设阈值、且能够根据其上一单句的意图确定最终意图的单句;所述负例样本包括通过所述第一预设模型获取预测意图时置信度高于第二预设阈值的单句,和/或,通过所述第一预设模型获取预测意图时置信度不高于第二预设阈值、且不能根据其上一单句的意图确定最终意图的单句。将上述正例样本和负例样本作为第二预设模型的训练数据,进行模型训练,具体的训练过程此处不再赘述。
其中对于第二预设模型的训练可以在服务器上实现,也可在其他设备上训练完成后部署在服务器上。
在其他实施例中,也可通过第二预设模型判断待识别单句是否与上文多个单句存在依赖关系,可通过对第二预设模型的训练实现。
在上述实施例的基础上,若确定所述待识别单句与上文存在依赖关系,则执行S204,若确定所述待识别单句与上文不存在依赖关系,则执行S205。
S204、若确定所述待识别单句与上文存在依赖关系,则根据上一单句的意图确定所述待识别单句的最终意图。
在本实施例中,若确定待识别单句与上文存在依赖关系,则说明待识别单句的预测意图可能存在一定的不准确性,可结合上一单句的意图来确定所述待识别单句的最终意图。
在一可选实施例中,可直接将将上一单句的意图确定为所述待识别单句的最终意图,使得待识别单句继承上一单句的意图。
在其他可选实施例中,也可将上一单句以及当前单句融合后重新输入到第一预设模型中,得到预测意图,作为待识别单句的意图。
或者,也可通过其他任意途径根据上一单句的意图确定所述待识别单句的最终意图,此处不再一一赘述。
S205、若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。
在本实施例中,若确定待识别单句与上文不存在依赖关系,包括待识别单句与上文无任何关联,或者,上一单句的意图不可信(也即上一单句的不意图高于第一预设阈值),本实施例中可进一步通过与用户进行交互,来确定待识别单句的最终意图。例如,可以根据预定数量的上文单句的意图确定待识别单句的备选意图,并展示给用户;在接收到用户对任一备选意图的选择指令后,根据选择指令确定待识别单句的最终意图;或者,向用户发送信息补充请求;在接收到用户输入的补充信息后,根据待识别单句以及补充信息确定待识别单句的最终意图。
当然确定最终意图的方式并不限于上述列举的可选实施例,其他可能的方式亦可。
在上述实施例的基础上,在确定所述待识别单句的最终意图后,还可根据所述待识别单句的最终意图,向用户发送应答信息。例如在电商平台用户与智能客服交互场景,智能客服可以向用户发送应答信息;在用户与智能机器人进行语音交互过程,智能机器人可通过语音播放应答信息或屏幕显示应答信息。
本实施例提供的图识别方法,通过接收用户输入的待识别单句;根据待识别单句以及第一预设模型,获取待识别单句的预测意图以及对应的置信度;若所述置信度不高于第一预设阈值,则根据待识别单句以及第二预设模型,判断待识别单句是否与上一单句存在依赖关系;若确定待识别单句与上文存在依赖关系,则根据上一单句的意图确定待识别单句的最终意图;或者,若确定待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。本发明实施例中第一预设模型只需要进行单句的意图识别即可,不需要对上下文长句进行意图识别,降低了维护和运营成本,通过第二模型进行是否依赖上文的判断,可以有效的提高最终所确定的意图的准确性,提升用户体验。
在上述任一实施例的基础上,在S202获取所述待识别单句的预测意图以及对应的置信度后,所述方法还可包括:
若所述置信度高于第一预设阈值、且所述待识别单句不属于省略句或断句,则将所述待识别单句的预测意图确定为所述待识别单句的最终意图。
在本实施例中,对于一些省略句或断句,可能仅仅为一些名词短语等,对于一些省略句或断句通过第一预设模型可能得到一个预测意图,且置信度高于第一预设阈值,但实际上该些省略句或断句意图可能并不完整,第一预设模型得到的预设意图并不准确,因此可以筛除这些省略句和断句。而除了这些省略句和断句外,若第一预设模型得到的置信度高于第一预设阈值、且待识别单句不属于省略句或断句,则说明在不是省略句或者断句的情况下,通过第一预设模型的得到的待识别单句的预测意图相对较为准确,因此将通过第一预设模型的得到的待识别单句的预测意图确定为所述待识别单句的最终意图,可不再根据待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系。
在另外的可选实施例中,如图4所示,S205所述的若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图,具体可包括:
S401、根据预定数量的上文单句的意图确定所述待识别单句的备选意图,并展示给用户;
S402、在接收到用户对任一备选意图的选择指令后,根据选择指令确定所述待识别单句的最终意图。
在本实施例中,在通过第二预设模型判断出待识别单句与上文不存在依赖关系的情况下,对于一些省略句或断句通过第一预设模型可能得到一个预测意图,且置信度低于第一预设阈值,因此可以筛除这些省略句和断句。在与上文不存在依赖关系的情况下,在根据待识别单句的预测意图以及置信度确定所述待识别单句的最终意图时,若置信度低于第一预设阈值、且待识别单句不属于省略句或断句,则说明在不是省略句或者断句的情况下,通过第一预设模型的得到的待识别单句的预测意图不准确,此时可通过向用户询问或者由用户补充信息,来进一步确定待识别单句的最终意图。在一种可选实施例中,可将预定数量的上文单句的意图确定待识别单句的备选意图,并展示给用户,由用户从备选意图中选择最终意图,当然,若备选意图中没有用户所需的意图,用户还可再次输入新的单句,在接收到用户输入的新的单句后,可重新执行上述实施例的方法流程。
在其他可选实施例中,还可向用户发送信息补充请求,例如向用户发送一些预设语料,来提示用户补充信息,例如“这句话是什么意思”、“请您重新输入”“请问您有什么需要咨询的”等等。在接收到用户输入的补充信息后,根据待识别单句以及所述补充信息确定待识别单句的最终意图。
在上述任一实施例的基础上,所述方法还可包括:
若所述待识别单句属于省略句,则向用户发送信息补充请求,在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图。
在本实施例中,可以识别待识别单句是否属于省略句,可选的,可以通过预设语料库来判断,预设语料库中可包括各种可能的省略句或省略句规则等,通过匹配来最终确定待识别单句是否属于省略句,当然也可通过一些模型来确定待识别单句是否属于省略句,此处不再一一赘述。当确定待识别单句属于省略句,则可向用户发送信息补充请求,例如向用户发送一些预设语料,来提示用户补充信息,例如用户输入的待识别单句为“发票”,可以向用户发送“您好,请问您需要咨询发票的什么问题”,以请求用户补充信息;再如用户输入的待识别单句为“发票开错了”,可以向用户发送“您好,请问是发票的什么信息开错了”,以请求用户补充信息等等,用户可以输入补充信息,例如针对省略句补充新的信息,或者输入新的单句,在接收到用户输入的补充信息后,可根据待识别单句以及补充信息确定所述待识别单句的最终意图,或者直接基于用户输入的新的单句重新执行上述实施例的方法流程,确定用户的意图。
在上述任一实施例的基础上,所述方法还可包括:
若所述待识别单句属于断句,则等待预定时间或向用户发送信息补充请求,在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图。
在上述实施例的基础上,可以识别待识别单句是否属于断句,可选的,可以通过预设语料库来判断,预设语料库中可包括各种可能的断句或断句规则等,通过匹配来最终确定待识别单句是否属于断句,当然也可通过一些模型来确定待识别单句是否属于断句,此处不再一一赘述。当确定待识别单句属于断句,用户可能将一句话拆分成多个断句,当前的断句可能是其中的一部分,因此可以等待预定时间,若用户输入补充信息,则根据该断句以及后面的补充信息确定待识别单句的最终意图,例如,将断句和后面的补充信息融合为一句话后再执行上述实施例中的方法流程;或者也可向用户发送信息补充请求,例如向用户发送一些预设语料,来提示用户补充信息,例如“这句话是什么意思”、“请您重新输入”等等,用户可以输入补充信息;此外,若在等待预定时间后未接收到用户输入的补充信息,也可向用户发送信息补充请求。
通过上述实施例,可以对省略句、断句等现象进行特定处理,更好的获取用户意图,提升用户体验。
图5为本发明实施例提供的意图识别设备的结构图。本实施例提供的意图识别设备可以执行方法实施例提供的处理流程,如图5所示,所述意图识别设备500包括接收单元501、意图识别单元502、依赖关系识别单元503、处理单元504。
接收单元501,用于接收用户输入的待识别单句;
意图识别单元502,用于根据所述待识别单句以及第一预设模型,获取所述待识别单句的预测意图以及对应的置信度;
依赖关系识别单元503,用于若所述置信度不高于第一预设阈值,则根据所述待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系;
处理单元504,用于若确定所述待识别单句与上文存在依赖关系,则根据上一单句的意图确定所述待识别单句的最终意图;或者,若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。
在上述任一实施例的基础上,所述处理单元504在根据上一单句的意图确定所述待识别单句的最终意图时,用于:
若上一单句对应的置信度高于第一预设阈值,则将上一单句的意图确定为所述待识别单句的最终意图。
在上述任一实施例的基础上,所述处理单元504在通过与用户交互确定所述待识别单句的最终意图时,用于:
根据预定数量的上文单句的意图确定所述待识别单句的备选意图,并展示给用户;在接收到用户对任一备选意图的选择指令后,根据选择指令确定所述待识别单句的最终意图;或者
向用户发送信息补充请求;在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图。
在上述任一实施例的基础上,所述处理单元504在根据所述待识别单句的预测意图以及所述置信度确定所述待识别单句的最终意图时,用于:
若所述置信度高于第一预设阈值、且所述待识别单句不属于省略句或断句,则将所述待识别单句的预测意图确定为所述待识别单句的最终意图。
在上述任一实施例的基础上,所述处理单元504还用于:
若所述待识别单句属于省略句,则向用户发送信息补充请求,在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图;或者
若所述待识别单句属于断句,则等待预定时间或向用户发送信息补充请求,在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图。
在上述任一实施例的基础上,所述第一预设模型为BERT模型编码器。
在上述任一实施例的基础上,所述第二预设模型为二分类模型;所述第二预设模型通过如下过程训练:
获取正例样本和负例样本,
根据所述正例样本和所述负例样本,对所述二分类模型的初始模型进行训练,得到训练后的所述第二预设模型;
其中,所述正例样本包括通过所述第一预设模型获取预测意图时置信度不高于第二预设阈值、且能够根据其上一单句的意图确定最终意图的单句;所述负例样本包括通过所述第一预设模型获取预测意图时置信度高于第二预设阈值的单句,和/或,通过所述第一预设模型获取预测意图时置信度不高于第二预设阈值、且不能根据其上一单句的意图确定最终意图的单句。
在上述任一实施例的基础上,所述第二预设模型为BERT模型编码器。
在上述任一实施例的基础上,在所述处理单元504确定所述待识别单句的最终意图后,还用于:
根据所述待识别单句的最终意图,向用户发送应答信息。
本实施例提供的意图识别设备可以具体用于执行上述图2或4所提供的方法实施例,具体功能此处不再赘述。
本实施例提供的意图识别设备,通过接收用户输入的待识别单句;根据待识别单句以及第一预设模型,获取待识别单句的预测意图以及对应的置信度;若所述置信度不高于第一预设阈值,则根据待识别单句以及第二预设模型,判断待识别单句是否与上一单句存在依赖关系;若确定待识别单句与上文存在依赖关系,则根据上一单句的意图确定待识别单句的最终意图;或者,若确定待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。本发明实施例中第一预设模型只需要进行单句的意图识别即可,不需要对上下文长句进行意图识别,降低了维护和运营成本,通过第二模型进行是否依赖上文的判断,可以有效的提高最终所确定的意图的准确性,提升用户体验。
图6为本发明实施例提供的电子设备的结构示意图。本发明实施例提供的电子设备可以执行意图识别方法实施例提供的处理流程,如图6所示,电子设备60包括存储器61、处理器62、计算机程序;其中,计算机程序存储在存储器61中,并被配置为由处理器62执行以上实施例所述的意图识别方法。此外,电子设备60还可具有通讯接口63,通讯接口63可用于传输指令和/或数据。
图6所示实施例的电子设备可用于执行上述意图识别方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
另外,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行以实现上述实施例所述的意图识别方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明实施例各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上各实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的范围。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (13)

1.一种意图识别方法,其特征在于,包括:
接收用户输入的待识别单句;
根据所述待识别单句以及第一预设模型,获取所述待识别单句的预测意图以及对应的置信度;
若所述置信度不高于第一预设阈值,则根据所述待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系;
若确定所述待识别单句与上文存在依赖关系,则根据上一单句的意图确定所述待识别单句的最终意图;或者
若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。
2.根据权利要求1所述的方法,其特征在于,所述根据上一单句的意图确定所述待识别单句的最终意图,包括:
若上一单句对应的置信度高于第一预设阈值,则将上一单句的意图确定为所述待识别单句的最终意图。
3.根据权利要求1所述的方法,其特征在于,所述通过与用户交互确定所述待识别单句的最终意图,包括:
根据预定数量的上文单句的意图确定所述待识别单句的备选意图,并展示给用户;在接收到用户对任一备选意图的选择指令后,根据选择指令确定所述待识别单句的最终意图;或者
向用户发送信息补充请求;在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述置信度高于第一预设阈值、且所述待识别单句不属于省略句或断句,则将所述待识别单句的预测意图确定为所述待识别单句的最终意图。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述待识别单句属于省略句,则向用户发送信息补充请求,在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图;或者
若所述待识别单句属于断句,则等待预定时间或向用户发送信息补充请求,在接收到用户输入的补充信息后,根据所述待识别单句以及所述补充信息确定所述待识别单句的最终意图。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第一预设模型为BERT模型编码器。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述第二预设模型为二分类模型;所述第二预设模型通过如下过程训练:
获取正例样本和负例样本,
根据所述正例样本和所述负例样本,对所述二分类模型的初始模型进行训练,得到训练后的所述第二预设模型;
其中,所述正例样本包括通过所述第一预设模型获取预测意图时置信度不高于第二预设阈值、且能够根据其上一单句的意图确定最终意图的单句;所述负例样本包括通过所述第一预设模型获取预测意图时置信度高于第二预设阈值的单句,和/或,通过所述第一预设模型获取预测意图时置信度不高于第二预设阈值、且不能根据其上一单句的意图确定最终意图的单句。
8.根据权利要求7所述的方法,其特征在于,所述第二预设模型为BERT模型编码器。
9.根据权利要求1-5任一项所述的方法,其特征在于,在确定所述待识别单句的最终意图后,还包括:
根据所述待识别单句的最终意图,向用户发送应答信息。
10.一种意图识别设备,其特征在于,包括:
接收单元,用于接收用户输入的待识别单句;
意图识别单元,用于根据所述待识别单句以及第一预设模型,获取所述待识别单句的预测意图以及对应的置信度;
依赖关系识别单元,用于若所述置信度不高于第一预设阈值,则根据所述待识别单句以及第二预设模型,判断所述待识别单句是否与上一单句存在依赖关系;
处理单元,用于若确定所述待识别单句与上文存在依赖关系,则根据上一单句的意图确定所述待识别单句的最终意图;或者,若确定所述待识别单句与上文不存在依赖关系,则通过与用户交互确定所述待识别单句的最终意图。
11.一种电子设备,其特征在于,包括:至少一个处理器;以及存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-9任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-9任一项所述的方法。
13.一种计算机程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-9任一项所述的方法。
CN202110510666.1A 2021-05-11 2021-05-11 意图识别方法、设备、存储介质及程序产品 Pending CN113240438A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110510666.1A CN113240438A (zh) 2021-05-11 2021-05-11 意图识别方法、设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110510666.1A CN113240438A (zh) 2021-05-11 2021-05-11 意图识别方法、设备、存储介质及程序产品

Publications (1)

Publication Number Publication Date
CN113240438A true CN113240438A (zh) 2021-08-10

Family

ID=77133545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110510666.1A Pending CN113240438A (zh) 2021-05-11 2021-05-11 意图识别方法、设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN113240438A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069470A (zh) * 2015-07-29 2015-11-18 腾讯科技(深圳)有限公司 分类模型训练方法及装置
CN107977183A (zh) * 2017-11-16 2018-05-01 百度在线网络技术(北京)有限公司 语音交互方法、装置及设备
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN110442870A (zh) * 2019-08-02 2019-11-12 深圳市珍爱捷云信息技术有限公司 文本纠错方法、装置、计算机设备和存储介质
CN110517672A (zh) * 2018-05-03 2019-11-29 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
CN110555096A (zh) * 2018-06-01 2019-12-10 深圳狗尾草智能科技有限公司 用户意图识别方法、系统、终端及介质
WO2020143844A1 (zh) * 2019-01-10 2020-07-16 深圳Tcl新技术有限公司 意图分析方法、装置、显示终端及计算机可读存储介质
CN111737987A (zh) * 2020-06-24 2020-10-02 深圳前海微众银行股份有限公司 意图识别方法、装置、设备及存储介质
CN112732911A (zh) * 2020-12-30 2021-04-30 平安科技(深圳)有限公司 基于语义识别的话术推荐方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069470A (zh) * 2015-07-29 2015-11-18 腾讯科技(深圳)有限公司 分类模型训练方法及装置
CN107977183A (zh) * 2017-11-16 2018-05-01 百度在线网络技术(北京)有限公司 语音交互方法、装置及设备
CN110517672A (zh) * 2018-05-03 2019-11-29 阿里巴巴集团控股有限公司 用户意图识别方法、用户指令执行方法、系统及设备
CN110555096A (zh) * 2018-06-01 2019-12-10 深圳狗尾草智能科技有限公司 用户意图识别方法、系统、终端及介质
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
WO2020143844A1 (zh) * 2019-01-10 2020-07-16 深圳Tcl新技术有限公司 意图分析方法、装置、显示终端及计算机可读存储介质
CN110442870A (zh) * 2019-08-02 2019-11-12 深圳市珍爱捷云信息技术有限公司 文本纠错方法、装置、计算机设备和存储介质
CN111737987A (zh) * 2020-06-24 2020-10-02 深圳前海微众银行股份有限公司 意图识别方法、装置、设备及存储介质
CN112732911A (zh) * 2020-12-30 2021-04-30 平安科技(深圳)有限公司 基于语义识别的话术推荐方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US10991366B2 (en) Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query
CN111651996B (zh) 摘要生成方法、装置、电子设备及存储介质
JP2023520416A (ja) ドメイン外(ood)検出のための改良された技術
US11928430B2 (en) Detecting unrelated utterances in a chatbot system
CN111858843B (zh) 一种文本分类方法及装置
CN114757176A (zh) 一种获取目标意图识别模型的方法以及意图识别方法
CN106997342B (zh) 基于多轮交互的意图识别方法和装置
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
CN110415679A (zh) 语音纠错方法、装置、设备和存储介质
EP4128010A1 (en) Noise data augmentation for natural language processing
CN112286485B (zh) 通过语音控制应用的方法、装置、电子设备与存储介质
CN109492085B (zh) 基于数据处理的答案确定方法、装置、终端及存储介质
CN116547676A (zh) 用于自然语言处理的增强型logit
CN116635862A (zh) 用于自然语言处理的域外数据扩充
CN116615727A (zh) 用于自然语言处理的关键词数据扩充工具
CN113836303A (zh) 一种文本类别识别方法、装置、计算机设备及介质
US11423219B2 (en) Generation and population of new application document utilizing historical application documents
CN116662555B (zh) 一种请求文本处理方法、装置、电子设备及存储介质
CN117520497A (zh) 大模型交互处理方法、系统、终端、设备及介质
CN112069786A (zh) 文本信息处理方法、装置、电子设备及介质
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN113505293B (zh) 信息推送方法、装置、电子设备及存储介质
CN115906797A (zh) 文本实体对齐方法、装置、设备及介质
CN115759048A (zh) 一种剧本文本处理方法及装置
WO2023076754A1 (en) Deep learning techniques for extraction of embedded data from documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, 100176

Applicant before: Jingdong Digital Technology Holding Co.,Ltd.

CB02 Change of applicant information