CN114357994A - 意图识别处理和置信度判断模型的生成方法及装置 - Google Patents
意图识别处理和置信度判断模型的生成方法及装置 Download PDFInfo
- Publication number
- CN114357994A CN114357994A CN202210009752.9A CN202210009752A CN114357994A CN 114357994 A CN114357994 A CN 114357994A CN 202210009752 A CN202210009752 A CN 202210009752A CN 114357994 A CN114357994 A CN 114357994A
- Authority
- CN
- China
- Prior art keywords
- sample
- result
- intention recognition
- confidence
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 title claims abstract description 31
- 238000003672 processing method Methods 0.000 claims abstract description 22
- 230000015654 memory Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 description 2
- 101150041570 TOP1 gene Proteins 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 101150104012 TOP2 gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本申请提出一种意图识别处理和置信度判断模型的生成方法及装置,其中,意图识别处理方法包括:将待识别文本输入至意图识别模型,以得到意图识别结果;获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成;获取待识别文本的句子结构特征;将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。本申请提出的意图识别处理方法,综合了最终结果特征、中间结果特征和句子结构特征三个方面的特征对意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
Description
技术领域
本申请涉及人工智能领域,尤其涉及一种意图识别处理和置信度判断模型的生成方法及装置。
背景技术
目前,智能外呼系统作为人工智能的一个重要应用,已经出现在我们生活的各个方面,如智能回访、智能预约等,在智能外呼系统中,判断用户意图是一个非常重要的步骤,关系着每一步的系统流程。
相关技术中,往往是根据机器学习或深度学习模型自身的输出结果判定意图识别结果是否可信,准确度低,误差较大。
发明内容
本申请提出一种意图识别处理和置信度判断模型的生成方法及装置。
本申请第一方面实施例提出了一种意图识别处理方法,包括:将待识别文本输入至意图识别模型,以得到意图识别结果;获取所述意图识别模型的最终结果特征和中间结果特征,其中,所述最终结果特征根据所述意图识别结果生成;获取所述待识别文本的句子结构特征;将所述最终结果特征、所述中间结果特征和所述句子结构特征输入至置信度判断模型,以得到所述意图识别结果对应的置信结果。
本申请实施例的意图识别处理方法,将待识别文本输入至意图识别模型,以得到意图识别结果,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成,获取待识别文本的句子结构特征,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。本实施例中,将待识别文本输入至意图识别模型获取最终结果特征和中间结果特征,并和句子结构特征一起构成三个方面的特征输入置信度判断模型得到意图识别结果的置信结果,由于综合了三个方面的特征对意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
本申请第二方面实施例提出了一种置信度判断模型的生成方法,包括:将样本文本输入至意图识别模型,以得到样本意图识别结果;获取所述意图识别模型的样本最终结果特征和样本中间结果特征,其中,所述样本最终结果特征根据所述样本意图识别结果生成;获取所述样本文本的样本句子结构特征;将所述样本最终结果特征、所述样本中间结果特征和所述样本句子结构特征输入至待训练的置信度判断模型,以得到所述样本意图识别结果对应的样本置信结果;根据所述样本置信结果、所述样本意图识别结果和所述样本文本对应的实际意图识别结果,对所述待训练的置信度判断模型的参数进行训练,得到所述置信度判断模型。
本申请实施例的置信度判断模型的生成方法,将样本文本输入至意图识别模型,以得到样本意图识别结果,获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成,获取样本文本的样本句子结构特征,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。本实施例中,将样本文本输入至意图识别模型获取样本最终结果特征和样本中间结果特征,并和样本句子结构特征一起构成三个方面的特征输入待训练的置信度判断模型得到样本意图识别结果的样本置信结果,并结合样本文本的实际意图识别结果对待训练的置信度判断模型的参数进行训练,得到置信度判断模型,由于综合了三个方面的特征对样本意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
本申请第三方面实施例提出一种意图识别处理装置,包括:第一输入模块,被配置为将待识别文本输入至意图识别模型,以得到意图识别结果;第一获取模块,被配置为获取所述意图识别模型的最终结果特征和中间结果特征,其中,所述最终结果特征根据所述意图识别结果生成;第二获取模块,被配置为获取所述待识别文本的句子结构特征;第二输入模块,被配置为将所述最终结果特征、所述中间结果特征和所述句子结构特征输入至置信度判断模型,以得到所述意图识别结果对应的置信结果。
本申请第四方面实施例提出一种置信度判断模型的生成装置,包括:第三输入模块,被配置为将样本文本输入至意图识别模型,以得到样本意图识别结果;第三获取模块,被配置为获取所述意图识别模型的样本最终结果特征和样本中间结果特征,其中,所述样本最终结果特征根据所述样本意图识别结果生成;第四获取模块,被配置为获取所述样本文本的样本句子结构特征;第四输入模块,被配置为将所述样本最终结果特征、所述样本中间结果特征和所述样本句子结构特征输入至待训练的置信度判断模型,以得到所述样本意图识别结果对应的样本置信结果;训练模块,被配置为根据所述样本置信结果、所述样本意图识别结果和所述样本文本对应的实际意图识别结果,对所述待训练的置信度判断模型的参数进行训练,得到所述置信度判断模型。
本申请第五方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述第一方面实施例所述的意图识别处理方法,或者执行如上述第二方面实施例所述的置信度判断模型的生成方法。
本申请第六方面实施例提出了一种存储有计算机指令的计算机可读存储介质,所述计算机指令用于使所述计算机执行如上述第一方面实施例所述的意图识别处理方法,或者执行如上述第二方面实施例所述的置信度判断模型的生成方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一实施例提供的意图识别处理方法的流程示意图;
图2为本申请一实施例提供的意图识别处理方法的特征组成的示意图;
图3为本申请另一实施例提供的意图识别处理方法的流程示意图;
图4为本申请一实施例提供的置信度判断模型的生成方法的流程示意图;
图5为本申请另一实施例提供的置信度判断模型的生成方法的流程示意图;
图6为本申请另一实施例提供的意图识别处理和置信度判断模型的生成方法的整体流程示意图;
图7为本申请一实施例提供的意图识别处理装置的结构示意图;
图8为本申请一实施例提供的置信度判断模型的生成装置的结构示意图;
图9为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的意图识别处理和置信度判断模型的生成方法及装置。
图1为本申请一实施例提供的意图识别处理方法的流程示意图。本申请实施例的意图识别处理方法,可由本申请实施例提供的意图识别处理装置执行,该意图识别处理装置可以设置在智能外呼系统中。如图1所示,本申请实施例的意图识别处理方法具体可包括以下步骤:
S101,将待识别文本输入至意图识别模型,以得到意图识别结果。
本申请实施例的意图识别处理方法在构建意图识别模型之前,首先要确定意图类别,即对意图有明确的分类、定义,再确定意图识别模型,例如机器学习模型中的逻辑回归(Logistic Regression)模型,深度学习模型中的文本分类卷积神经网络(TextConvolutional Neural Networks,TextCNN)模型等。
具体的,待识别文本即当前待识别意图的文本。将待识别文本输入至预先构建的意图识别模型,意图识别模型通过自然语言处理(Natural Language Processing,NLP)对待识别文本进行处理,得到意图识别结果。其中,意图识别结果具体可包括但不限于各类意图(例如意图1、意图2、意图3)和每类意图对应的概率,例如意图1和意图1对应的概率0.6、意图2和意图2对应的概率0.3、意图3和意图3对应的概率0.1。
S102,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成。
具体的,获取意图识别模型的最终结果特征和中间结果特征,最终结果特征根据步骤 S101中得到的意图识别结果生成。其中,最终结果特征具体可包括但不限于以下至少一种:意图识别结果对应的意图识别向量、意图识别结果对应的最高得分top1,和意图识别结果对应的最高得分top1和次高得分top2之间的差值(top1-top2)等,中间结果特征具体可包括但不限于意图识别模型隐藏层输出的向量等。
S103,获取待识别文本的句子结构特征。
具体的,获取步骤S101中输入的待识别文本的句子结构特征。其中,句子结构特征具体可包括但不限于以下至少一种:句子长度、句子困惑度和句子分析结果等。
S104,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。
具体的,将步骤S102中获取的最终结果特征、中间结果特征和步骤S103中获取的句子结构特征拼接起来,组成的最终特征输入至训练好的置信度判断模型,置信度判断模型输出意图识别结果对应的置信结果,即步骤S101中得到的意图识别结果是否可信。输入至置信度判断模型的特征组成的示意图如图2所示。置信度判断模型可通过下述实施例的置信度判断模型的生成方法训练得到。
本申请实施例的意图识别处理方法,将待识别文本输入至意图识别模型,以得到意图识别结果,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成,获取待识别文本的句子结构特征,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。本实施例中,将待识别文本输入至意图识别模型获取最终结果特征和中间结果特征,并和句子结构特征一起构成三个方面的特征输入置信度判断模型得到意图识别结果的置信结果,由于综合了三个方面的特征对意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
图3为本申请另一实施例提供的意图识别处理方法的流程示意图。如图3所示,在上述图1所示实施例的基础上,本申请实施例的意图识别处理方法具体可包括以下步骤:
S301,输出第一询问语音。
具体的,本申请实施例中将图1所示实施例的意图识别处理方法应用于智能外呼系统中。智能外呼系统可通过电话等语音控制装置输出第一询问语音。
S302,获取用户针对第一询问语音的回答语音。
具体的,获取用户针对步骤S301中输出的第一询问语音的回答语音。回答语音具体可包括但不限于用户通过电话说出的语音流等。
S203,根据回答语音生成待识别文本。
具体的,智能外呼系统根据步骤S303中获取的回答语音通过自动语音识别技术(Automatic Speech Recognition,ASR)转化为文本,生成待识别文本。
S304,将待识别文本输入至意图识别模型,以得到意图识别结果。
S305,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成。
S306,获取待识别文本的句子结构特征。
S307,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。
具体的,本申请实施例中的步骤S304-S307与上述实施例中的步骤S101-S104相同,此处不再赘述。
作为一种可行的实施方式,本申请实施例提供的意图识别处理方法还可包括以下步骤:
S308,置信结果为是,则将意图识别结果确认为目标意图识别结果,并根据目标意图识别结果输出第二询问语音。
具体的,若步骤S307中得到的置信结果为是,则步骤S304得到的意图识别结果可信,将意图识别结果确认为目标意图识别结果,并根据目标意图识别结果继续输出下一询问语音即第二询问语音,进行后续流程。
S309,置信结果为否,则重新输出第一询问语音。
具体的,若步骤S307中得到的置信结果为否,则步骤S304得到的意图识别结果不可信,重新输出第一询问语音,重复一遍流程。在本申请实施例中,可以设定同一流程最多重复进入3次,以免影响用户体验。
本申请实施例的意图识别处理方法,将待识别文本输入至意图识别模型,以得到意图识别结果,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成,获取待识别文本的句子结构特征,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。本实施例中,通过自动语音识别技术ASR转化用户回答语音为待识别文本,将待识别文本输入至意图识别模型获取最终结果特征和中间结果特征,并和句子结构特征一起构成三个方面的特征输入置信度判断模型得到意图识别结果的置信结果,由于综合了三个方面的特征对意图识别结果是否可信进行判断,因此提高了准确度,减小了误差,通过对意图识别置信度较低的待识别文本进行重问,重新确定意图识别结果,进一步提高了准确度,减小了误差。
图4为本申请一实施例提供的置信度判断模型的生成方法的流程示意图。本申请实施例的置信度判断模型的生成方法,可由本申请实施例提供的置信度判断模型的生成装置执行,该置信度判断模型的生成装置可以设置在智能外呼系统中。如图4所示,本申请实施例的置信度判断模型的生成方法具体可包括以下步骤:
S401,将样本文本输入至意图识别模型,以得到样本意图识别结果。
具体的,将样本文本输入至预先构建的意图识别模型,意图识别模型通过自然语言处理NLP对样本文本进行处理,以得到样本意图识别结果。在本申请实施例中,进行意图识别之后,会对样本文本的实际意图进行人工标注,获得样本文本对应的实际意图识别结果。
S402,获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成。
S403,获取样本文本的样本句子结构特征。
S404,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果。
具体的,本申请实施例中的步骤S402-S404与上述实施例中的步骤S102-S104相似,此处不再赘述。
S405,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。
具体的,根据步骤S404中获取的样本置信结果、步骤S401中获取的样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。其中,置信度判断模型具体可包括但不限于支持向量机(SupportVector Regression,简称SVR)、极端梯度提升(eXtreme Gradient Boosting,简称XGBoost)等。
在本申请实施例中,如果样本意图识别结果和实际意图识别结果一致,则样本文本和实际意图识别结果构成负样本,其对应(0,1),例如样本置信结果为(0.6,0.4),则证明样本置信结果为0(否)的概率为0.6,样本置信结果为1(是)的概率为0.4,根据0.4与 1计算损耗,并根据损耗调整置信度判断模型的参数。如果样本意图识别结果和实际意图识别结果不一致,则样本文本和实际意图识别结果构成正样本,其对应(1,0),例如样本置信结果为(0.6,0.4),则证明样本置信结果为1(是)的概率为0.6,样本置信结果为0 (否)的概率为0.4,根据0.4与0计算损耗,并根据所损耗调整置信度判断模型的参数。
本申请实施例的置信度判断模型的生成方法,将样本文本输入至意图识别模型,以得到样本意图识别结果,获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成,获取样本文本的样本句子结构特征,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。本实施例中,将样本文本输入至意图识别模型获取样本最终结果特征和样本中间结果特征,并和样本句子结构特征一起构成三个方面的特征输入待训练的置信度判断模型得到样本意图识别结果的样本置信结果,并结合样本文本的实际意图识别结果对待训练的置信度判断模型的参数进行训练,得到置信度判断模型,由于综合了三个方面的特征对样本意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
图5为本申请另一实施例提供的置信度判断模型的生成方法的流程示意图。如图5所示,在上述图4所示实施例的基础上,本申请实施例的置信度判断模型的生成方法具体可包括以下步骤:
S501,输出样本询问语音。
S502,获取用户针对样本询问语音的样本回答语音。
S503,根据样本回答语音生成样本文本。
具体的,本申请实施例中的步骤S501-S503与上述实施例中的步骤S301-S303相似,此处不再赘述。
S504,将样本文本输入至意图识别模型,以得到样本意图识别结果。
S505,获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成。
S506,获取样本文本的样本句子结构特征。
S507,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果。
S508,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。
具体的,本申请实施例中的步骤S505-S508与上述实施例中的步骤S401-S405相似,此处不再赘述。
本申请实施例的置信度判断模型的生成方法,将样本文本输入至意图识别模型,以得到样本意图识别结果,获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成,获取样本文本的样本句子结构特征,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。本实施例中,在构建置信度判断模型之前通过自动语音识别技术ASR转化用户样本回答语音为样本文本,提供训练数据,将样本文本输入至意图识别模型获取样本最终结果特征和样本中间结果特征,并和样本句子结构特征一起构成三个方面的特征输入待训练的置信度判断模型得到样本意图识别结果的样本置信结果,并结合样本文本的实际意图识别结果对待训练的置信度判断模型的参数进行训练,得到置信度判断模型,由于综合了三个方面的特征对样本意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
图6是本申请实施例的意图识别处理和置信度判断模型的生成方法的整体流程图。如图6所示,本申请实施例的意图识别处理和置信度判断模型的生成方法具体可包括以下步骤:
S601,输出样本询问语音。
S602,获取用户针对样本询问语音的样本回答语音。
S603,根据样本回答语音生成样本文本。
S604,将样本文本输入至意图识别模型得到样本意图识别结果。
S605,获取意图识别模型的样本最终结果特征和样本中间结果特征。
S606,获取样本文本的样本句子结构特征。
S607,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果。
S608,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型
S609,输出第一询问语音
S610,获取用户针对第一询问语音的回答语音。
S611,根据回答语音生成待识别文本。
S612,将待识别文本输入至意图识别模型,以得到意图识别结果。
S613,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成。
S614,获取待识别文本的句子结构特征。
S615,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。
若置信结果为是,则执行步骤S616;若置信结果为否,则执行步骤S609。
S616,将意图识别结果确认为目标意图识别结果,并根据目标意图识别结果输出第二询问语音。
为了实现上述实施例,本申请实施例还提出一种意图识别处理装置。图7为本申请一实施例的意图识别处理装置的结构示意图。如图7所示,本申请实施例的意图识别处理装置700具体可包括:第一输入模块701、第一获取模块702、第二获取模块703和第二输入模块704。
第一输入模块701,被配置为将待识别文本输入至意图识别模型,以得到意图识别结果。
第一获取模块702,被配置为获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成。
第二获取模块703,被配置为获取待识别文本的句子结构特征。
第二输入模块704,被配置为将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。
在本申请的一个实施例中,最终结果特征包括以下至少一种:意图识别结果对应的意图识别向量、意图识别结果对应的最高得分,和意图识别结果对应的最高得分和次高得分之间的差值。
在本申请的一个实施例中,中间结果特征包括意图识别模型隐藏层输出的向量。
在本申请的一个实施例中,句子结构特征包括以下至少一种:句子长度、句子困惑度和句子分析结果。
在本申请的一个实施例中,意图识别处理装置700还包括:第一输出模块705,被配置为输出第一询问语音;第五获取模块706,被配置为获取用户针对第一询问语音的回答语音;第一生成模块707,被配置为根据回答语音生成待识别文本。
在本申请的一个实施例中,意图识别处理装置700还包括:第二输出模块708,被配置为置信结果为是,则将意图识别结果确认为目标意图识别结果,并根据目标意图识别结果输出第二询问语音;第三输出模块709,被配置为置信结果为否,则重新输出第一询问语音。
需要说明的是,上述对意图识别处理方法实施例的解释说明,也适用于本公开实施例的意图识别处理装置,具体过程此处不再赘述。
本申请实施例的意图识别处理装置,将待识别文本输入至意图识别模型,以得到意图识别结果,获取意图识别模型的最终结果特征和中间结果特征,其中,最终结果特征根据意图识别结果生成,获取待识别文本的句子结构特征,将最终结果特征、中间结果特征和句子结构特征输入至置信度判断模型,以得到意图识别结果对应的置信结果。本实施例中,将待识别文本输入至意图识别模型获取最终结果特征和中间结果特征,并和句子结构特征一起构成三个方面的特征输入置信度判断模型得到意图识别结果的置信结果,由于综合了三个方面的特征对意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
为了实现上述实施例,本申请实施例还提出一种置信度判断模型的生成装置。图8为本申请一实施例的置信度判断模型的生成装置的结构示意图。如图8所示,本申请实施例的置信度判断模型的生成装置800具体可包括:第三输入模块801、第三获取模块802、第四获取模块803、第四输入模块804和训练模块805。
第三输入模块801,被配置为将样本文本输入至意图识别模型,以得到样本意图识别结果。
第三获取模块802,被配置为获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成。
第四获取模块803,被配置为获取样本文本的样本句子结构特征。
第四输入模块804,被配置为将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果。
训练模块805,被配置为根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。
在本申请的一个实施例中,样本最终结果特征包括以下至少一种:样本意图识别结果对应的意图识别向量、样本意图识别结果对应的最高得分,和样本意图识别结果对应的最高得分和次高得分之间的差值。
在本申请的一个实施例中,样本中间结果特征包括意图识别模型隐藏层输出的向量。
在本申请的一个实施例中,样本句子结构特征包括以下至少一种:句子长度、句子困惑度和句子分析结果。
在本申请的一个实施例中,置信度判断模型的生成装置800还包括:第四输出模块806,被配置为输出样本询问语音;第六获取模块807,被配置为获取用户针对样本询问语音的样本回答语音;第二生成模块,被配置为根据样本回答语音生成样本文本。
需要说明的是,上述对置信度判断模型的生成方法实施例的解释说明,也适用于本公开实施例的置信度判断模型的生成装置,具体过程此处不再赘述。
本申请实施例的置信度判断模型的生成装置,将样本文本输入至意图识别模型,以得到样本意图识别结果,获取意图识别模型的样本最终结果特征和样本中间结果特征,其中,样本最终结果特征根据样本意图识别结果生成,获取样本文本的样本句子结构特征,将样本最终结果特征、样本中间结果特征和样本句子结构特征输入至待训练的置信度判断模型,以得到样本意图识别结果对应的样本置信结果,根据样本置信结果、样本意图识别结果和样本文本对应的实际意图识别结果,对待训练的置信度判断模型的参数进行训练,得到置信度判断模型。本实施例中,将样本文本输入至意图识别模型获取样本最终结果特征和样本中间结果特征,并和样本句子结构特征一起构成三个方面的特征输入待训练的置信度判断模型得到样本意图识别结果的样本置信结果,并结合样本文本的实际意图识别结果对待训练的置信度判断模型的参数进行训练,得到置信度判断模型,由于综合了三个方面的特征对样本意图识别结果是否可信进行判断,因此提高了准确度,减小了误差。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的文件转换方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,智能语音交互设备、个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器901可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的意图识别处理和置信度判断模型的生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的意图识别处理和置信度判断模型的生成方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的文件转换方法对应的程序指令/模块 (例如,附图7所示的第一输入模块701、第一获取模块702、第二获取模块703和第二输入模块704,附图8所示的第三输入模块801、第三获取模块802、第四获取模块803、第四输入模块804和训练模块805)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的文件转换方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据风险控制方法的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至风险控制方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
意图识别处理和置信度判断模型的生成方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与文件转换方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (15)
1.一种意图识别处理方法,其特征在于,包括:
将待识别文本输入至意图识别模型,以得到意图识别结果;
获取所述意图识别模型的最终结果特征和中间结果特征,其中,所述最终结果特征根据所述意图识别结果生成;
获取所述待识别文本的句子结构特征;
将所述最终结果特征、所述中间结果特征和所述句子结构特征输入至置信度判断模型,以得到所述意图识别结果对应的置信结果。
2.根据权利要求1所述的意图识别处理方法,其特征在于,所述最终结果特征包括以下至少一种:
所述意图识别结果对应的意图识别向量、所述意图识别结果对应的最高得分,和所述意图识别结果对应的最高得分和次高得分之间的差值。
3.根据权利要求1所述的意图识别处理方法,其特征在于,所述中间结果特征包括所述意图识别模型隐藏层输出的向量。
4.根据权利要求1所述的意图识别处理方法,其特征在于,所述句子结构特征包括以下至少一种:
句子长度、句子困惑度和句子分析结果。
5.根据权利要求1所述的意图识别处理方法,其特征在于,还包括:
输出第一询问语音;
获取用户针对所述第一询问语音的回答语音;
根据所述回答语音生成所述待识别文本。
6.根据权利要求5所述的意图识别处理方法,其特征在于,还包括:
所述置信结果为是,则将所述意图识别结果确认为目标意图识别结果,并根据所述目标意图识别结果输出第二询问语音;
所述置信结果为否,则重新输出所述第一询问语音。
7.一种置信度判断模型的生成方法,其特征在于,包括:
将样本文本输入至意图识别模型,以得到样本意图识别结果;
获取所述意图识别模型的样本最终结果特征和样本中间结果特征,其中,所述样本最终结果特征根据所述样本意图识别结果生成;
获取所述样本文本的样本句子结构特征;
将所述样本最终结果特征、所述样本中间结果特征和所述样本句子结构特征输入至待训练的置信度判断模型,以得到所述样本意图识别结果对应的样本置信结果;
根据所述样本置信结果、所述样本意图识别结果和所述样本文本对应的实际意图识别结果,对所述待训练的置信度判断模型的参数进行训练,得到所述置信度判断模型。
8.根据权利要求7所述的生成方法,其特征在于,所述样本最终结果特征包括以下至少一种:
所述样本意图识别结果对应的意图识别向量、所述样本意图识别结果对应的最高得分,和所述样本意图识别结果对应的最高得分和次高得分之间的差值。
9.根据权利要求7所述的生成方法,其特征在于,所述样本中间结果特征包括所述意图识别模型隐藏层输出的向量。
10.根据权利要求7所述的生成方法,其特征在于,所述样本句子结构特征包括以下至少一种:
句子长度、句子困惑度和句子分析结果。
11.根据权利要求1所述的生成方法,其特征在于,还包括:
输出样本询问语音;
获取用户针对所述样本询问语音的样本回答语音;
根据所述样本回答语音生成所述样本文本。
12.一种意图识别处理装置,其特征在于,包括:
第一输入模块,被配置为将待识别文本输入至意图识别模型,以得到意图识别结果;
第一获取模块,被配置为获取所述意图识别模型的最终结果特征和中间结果特征,其中,所述最终结果特征根据所述意图识别结果生成;
第二获取模块,被配置为获取所述待识别文本的句子结构特征;
第二输入模块,被配置为将所述最终结果特征、所述中间结果特征和所述句子结构特征输入至置信度判断模型,以得到所述意图识别结果对应的置信结果。
13.一种置信度判断模型的生成装置,其特征在于,包括:
第三输入模块,被配置为将样本文本输入至意图识别模型,以得到样本意图识别结果;
第三获取模块,被配置为获取所述意图识别模型的样本最终结果特征和样本中间结果特征,其中,所述样本最终结果特征根据所述样本意图识别结果生成;
第四获取模块,被配置为获取所述样本文本的样本句子结构特征;
第四输入模块,被配置为将所述样本最终结果特征、所述样本中间结果特征和所述样本句子结构特征输入至待训练的置信度判断模型,以得到所述样本意图识别结果对应的样本置信结果;
训练模块,被配置为根据所述样本置信结果、所述样本意图识别结果和所述样本文本对应的实际意图识别结果,对所述待训练的置信度判断模型的参数进行训练,得到所述置信度判断模型。
14.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-6中任一项所述的方法,或者执行如权利要求7-11中任一项所述的方法。
15.一种存储有计算机指令的计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行如权利要求1-6中任一项所述的方法,或者执行如权利要求7-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009752.9A CN114357994A (zh) | 2022-01-06 | 2022-01-06 | 意图识别处理和置信度判断模型的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009752.9A CN114357994A (zh) | 2022-01-06 | 2022-01-06 | 意图识别处理和置信度判断模型的生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114357994A true CN114357994A (zh) | 2022-04-15 |
Family
ID=81106536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210009752.9A Pending CN114357994A (zh) | 2022-01-06 | 2022-01-06 | 意图识别处理和置信度判断模型的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114357994A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
CN109522556A (zh) * | 2018-11-16 | 2019-03-26 | 北京九狐时代智能科技有限公司 | 一种意图识别方法及装置 |
CN109657232A (zh) * | 2018-11-16 | 2019-04-19 | 北京九狐时代智能科技有限公司 | 一种意图识别方法 |
CN110287283A (zh) * | 2019-05-22 | 2019-09-27 | 中国平安财产保险股份有限公司 | 意图模型训练方法、意图识别方法、装置、设备及介质 |
CN110555096A (zh) * | 2018-06-01 | 2019-12-10 | 深圳狗尾草智能科技有限公司 | 用户意图识别方法、系统、终端及介质 |
CN112560505A (zh) * | 2020-12-09 | 2021-03-26 | 北京百度网讯科技有限公司 | 一种对话意图的识别方法、装置、电子设备及存储介质 |
CN112699213A (zh) * | 2020-12-23 | 2021-04-23 | 平安普惠企业管理有限公司 | 语音意图识别方法、装置、计算机设备及存储介质 |
CN113515594A (zh) * | 2021-04-28 | 2021-10-19 | 京东数字科技控股股份有限公司 | 意图识别方法、意图识别模型训练方法、装置及设备 |
CN113627197A (zh) * | 2021-08-11 | 2021-11-09 | 未鲲(上海)科技服务有限公司 | 文本的意图识别方法、装置、设备及存储介质 |
CN113674732A (zh) * | 2021-08-16 | 2021-11-19 | 北京百度网讯科技有限公司 | 语音置信度检测方法、装置、电子设备和存储介质 |
CN113722492A (zh) * | 2021-09-09 | 2021-11-30 | 国网电子商务有限公司 | 一种意图识别方法及装置 |
US20220068277A1 (en) * | 2020-12-01 | 2022-03-03 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus of performing voice interaction, electronic device, and readable storage medium |
-
2022
- 2022-01-06 CN CN202210009752.9A patent/CN114357994A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
CN110555096A (zh) * | 2018-06-01 | 2019-12-10 | 深圳狗尾草智能科技有限公司 | 用户意图识别方法、系统、终端及介质 |
CN109522556A (zh) * | 2018-11-16 | 2019-03-26 | 北京九狐时代智能科技有限公司 | 一种意图识别方法及装置 |
CN109657232A (zh) * | 2018-11-16 | 2019-04-19 | 北京九狐时代智能科技有限公司 | 一种意图识别方法 |
CN110287283A (zh) * | 2019-05-22 | 2019-09-27 | 中国平安财产保险股份有限公司 | 意图模型训练方法、意图识别方法、装置、设备及介质 |
US20220068277A1 (en) * | 2020-12-01 | 2022-03-03 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus of performing voice interaction, electronic device, and readable storage medium |
CN112560505A (zh) * | 2020-12-09 | 2021-03-26 | 北京百度网讯科技有限公司 | 一种对话意图的识别方法、装置、电子设备及存储介质 |
CN112699213A (zh) * | 2020-12-23 | 2021-04-23 | 平安普惠企业管理有限公司 | 语音意图识别方法、装置、计算机设备及存储介质 |
CN113515594A (zh) * | 2021-04-28 | 2021-10-19 | 京东数字科技控股股份有限公司 | 意图识别方法、意图识别模型训练方法、装置及设备 |
CN113627197A (zh) * | 2021-08-11 | 2021-11-09 | 未鲲(上海)科技服务有限公司 | 文本的意图识别方法、装置、设备及存储介质 |
CN113674732A (zh) * | 2021-08-16 | 2021-11-19 | 北京百度网讯科技有限公司 | 语音置信度检测方法、装置、电子设备和存储介质 |
CN113722492A (zh) * | 2021-09-09 | 2021-11-30 | 国网电子商务有限公司 | 一种意图识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021197137A (ja) | モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN111241819B (zh) | 词向量生成方法、装置及电子设备 | |
CN111177355B (zh) | 基于搜索数据的人机对话交互方法、装置和电子设备 | |
CN112926306B (zh) | 文本纠错方法、装置、设备以及存储介质 | |
CN111767359B (zh) | 兴趣点分类方法、装置、设备以及存储介质 | |
CN114612749B (zh) | 神经网络模型训练方法及装置、电子设备和介质 | |
CN111563593B (zh) | 神经网络模型的训练方法和装置 | |
CN111862987B (zh) | 语音识别方法和装置 | |
CN111241810B (zh) | 标点预测方法及装置 | |
CN112466280B (zh) | 语音交互方法、装置、电子设备和可读存储介质 | |
CN111767833A (zh) | 模型生成方法、装置、电子设备及存储介质 | |
CN116303962A (zh) | 对话生成方法、深度学习模型的训练方法、装置和设备 | |
CN114547244A (zh) | 用于确定信息的方法和装置 | |
CN112559715B (zh) | 态度的识别方法、装置、设备及存储介质 | |
CN112650844B (zh) | 对话状态的追踪方法、装置、电子设备和存储介质 | |
CN112382291B (zh) | 语音交互的处理方法、装置、电子设备及存储介质 | |
US12079215B2 (en) | Query rewriting method and apparatus, device and storage medium | |
CN112597288B (zh) | 人机交互方法、装置、设备及存储介质 | |
CN112270169B (zh) | 对白角色预测方法、装置、电子设备及存储介质 | |
CN112328896B (zh) | 用于输出信息的方法、装置、电子设备和介质 | |
EP3843090B1 (en) | Method and apparatus for outputting analysis abnormality information in spoken language understanding | |
CN111582476A (zh) | 自动量化策略搜索方法、装置、设备以及存储介质 | |
CN111782979B (zh) | 兴趣点的品牌分类方法、装置、设备以及存储介质 | |
CN112559714B (zh) | 对话生成方法、装置、电子设备及存储介质 | |
CN112614479B (zh) | 训练数据的处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |