CN111274797A - 用于终端的意图识别方法、装置、设备及存储介质 - Google Patents

用于终端的意图识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111274797A
CN111274797A CN202010031613.7A CN202010031613A CN111274797A CN 111274797 A CN111274797 A CN 111274797A CN 202010031613 A CN202010031613 A CN 202010031613A CN 111274797 A CN111274797 A CN 111274797A
Authority
CN
China
Prior art keywords
intention
corpus
representative
linguistic data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010031613.7A
Other languages
English (en)
Inventor
孙思
曹锋铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Saiante Technology Service Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202010031613.7A priority Critical patent/CN111274797A/zh
Publication of CN111274797A publication Critical patent/CN111274797A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及语义解析领域,具体使用了基于卷积神经网络训练的意图识别模型识别意图,并公开了一种用于终端的意图识别方法、装置、设备及存储介质,所述方法包括:采集用户的语音信息以得到待识别语料,并获取多个意图代表语料;将待识别语料分别与多个意图代表语料进行组合,得到多个对比组;将对比组输入语言模型,分别得到对比组中待识别语料和意图代表语料对应的编码向量;将待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,得到待识别语料对应的多个相似度;确定多个相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于目标意图向用户显示匹配的内容。

Description

用于终端的意图识别方法、装置、设备及存储介质
技术领域
本申请涉及信息提取领域,尤其涉及一种用于终端的意图识别方法、装置、设备及存储介质。
背景技术
对话系统是人工智能领域最重要的应用之一,意图识别是对话系统的核心,随着深度学习和自然语言技术的发展,可以使用自然语言处理模型对用户意图进行识别。
但目前,在训练用于意图识别的自然语言处理模型时,需要预先准备大量与该领域相关的语料数据。而对于某些特殊领域,例如,对于老年人领域,由于老年人不习惯电子设备等原因导致已知语料数据较少,在利用这些已知语料数据训练自然语言处理模型时,训练得到的模型的意图预测的准确性不高。
因此,如何提高训练得到的意图预测模型的意图预测准确率成为亟待解决的问题。
发明内容
本申请提供了一种用于终端的意图识别方法、装置、设备及存储介质,以提高训练得到的意图预测模型的意图预测准确率。
第一方面,本申请提供了一种用于终端的意图识别方法,所述方法包括:
采集用户的语音信息以得到待识别语料,并获取多个意图代表语料;
将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组,每个所述对比组中包括所述待识别语料和一个所述意图代表语料;
将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量;
将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度,其中,所述意图识别模型是基于卷积神经网络预先训练得到的;
确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于所述目标意图向所述用户显示与所述目标意图匹配的内容。
第二方面,本申请还提供了一种用于终端的意图识别装置,所述装置包括:
语料获取模块,用于采集用户的语音信息以得到待识别语料,并获取多个意图代表语料;
语料组合模块,用于将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组,每个所述对比组中包括所述待识别语料和一个所述意图代表语料;
向量转换模块,用于将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量;
相似度计算模块,用于将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度,其中,所述意图识别模型是基于卷积神经网络预先训练得到的;
意图确定模块,用于确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于所述目标意图向所述用户显示与所述目标意图匹配的内容。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的用于终端的意图识别方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的用于终端的意图识别方法。
本申请公开了一种用于终端的意图识别方法、装置、设备及存储介质,通过采集用户的语音信息以得到待识别语料,并且获取多个意图代表语料,并基于获取到的待识别语料和多个意图代表语料建立多个对比组,再利用语言模型将各个对比组中的待识别语料和意图代表语料转换为编码向量,随即将编码向量输入预先训练的意图识别模型,得到待识别语料对应的多个相似度,最终从多个相似度中确定最大值所对应的意图代表语料的意图为目标意图,最终基于该目标意图向用户显示与目标意图匹配的内容。通过将语料信息转换为编码向量来对意图进行判断,提高意图识别的准确率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种意图识别模型的训练方法的示意流程图;
图2是图1中提供的一种意图识别模型的训练方法的子步骤示意流程图;
图3是本申请实施例提供的一种用于终端的意图识别方法的示意流程图;
图4是图3中提供的一种用于终端的意图识别方法的子步骤示意流程图;
图5是本申请的实施例还提供一种意图识别模型训练装置的示意性框图;
图6是本申请的实施例还提供一种用于终端的意图识别装置的示意性框图;
图7为本申请一实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种用于终端的意图识别方法、装置、计算机设备及存储介质。该用于终端的意图识别方法可在语料较少的场景下,完成对用户意图的识别,满足对于垂直场景的需求。为了便于描述,本申请以智慧养老场景进行详细说明。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种意图识别模型的训练方法的示意流程图。该意图识别模型是基于卷积神经网络进行模型训练得到的。
如图1所示,该意图识别模型的训练方法,用于训练出意图识别模型以便应用在用于终端的意图识别方法上。其中,该训练方法包括步骤S101至步骤S104。
S101、获取多个样本数据。
具体地,所述样本数据包括所述样本数据所代表的意图,所述样本数据是指作为样本的样本语料信息,样本语料信息为文本信息。其中,样本数据具体的是指当前能够获取到的与智慧养老领域相关的已知语料信息。
例如,意图类别可以为养老院、糖尿病、高血压等老年人有关的词语。样本语料信息可以如:“老年人糖尿病会导致便秘么?”。
S102、对所述样本数据进行两两分组,以得到多个训练集。
具体地,对样本数据进行分组,具体的可以是从多个样本数据中任意取出两个样本数据,从而将取出的样本数据作为一个训练集。在具体实施过程中,训练集的个数为从多个样本数据中取出两个样本数据的组合数。
例如,当作为训练集的样本语料信息共有100条时,从100条样本语料信息中选择2条样本语料信息分为一组作为训练集,得到训练集的总个数为
Figure BDA0002364513160000041
在一些实施例中,该意图识别模型的训练方法,还可以包括:
对所述样本数据进行两两分组,以得到多个测试集,根据所述测试集对训练得到的所述意图识别模型进行测试。
具体地,对样本数据进行分组,得到测试集,使用测试集对训练得到的意图识别模型进行测试,以对训练得到的意图识别模型的相似度计算的准确率进行测试,以根据测试结果对意图识别模型进行训练和参数调整,提高意图识别模型对于两个样本数据所代表的意图的相似度计算的准确率。
在一些实施例中,该意图识别模型的训练方法,在获取训练集和测试集时,还可以根据样本数据所代表的意图从样本数据中不放回的抽取若干样本作为训练集合,并将未被抽取到的样本数据作为测试集合。
在具体实施过程中,训练集合是由多个训练集组成的集合,测试集合是由多个测试集组成的集合。根据样本数据所代表的意图从样本数据中不放回的抽取若干样本,具体可以是对于每一个意图而言,均抽取等量的样本数据作为训练集合中的元素,也即,使得训练集合和测试集合中的各个意图均有对应的样本数据,并且每个意图对应的样本数据的数量相同。
例如,样本数据中对应的意图共有10类,每类意图下有15个样本语料信息,也即,样本语料信息共有150条。在从150条数据中抽取训练集样本时,可以从10个意图类别下,每个意图类别选择10个样本语料信息,将选出的10*10=100共100条样本语料信息作为训练集合。而将余下的150-100=50条样本语料信息作为测试集合。对测试集合进行分组得到测试集的数量为
Figure BDA0002364513160000051
对训练集合进行分组得到训练集的数量为
Figure BDA0002364513160000052
S103、将所述训练集分别输入语言模型,以得到每个所述训练集对应的两个编码向量。
具体地,所述语言模型可以采用开源的预训练模型,例如BERT模型。为便于描述,本申请以语言模型为BERT模型为例进行详细说明。
其中,编码向量实质上是训练集中的样本数据的每个字在BERT模型中的嵌入层(也即embedding层)的输出向量的累加,也即,将样本数据一句话中所有字的输出向量进行累加,从而得到样本数据对应的编码向量。
例如,当样本语料信息为:老年人糖尿病会导致便秘么?将该样本语料信息输入BERT模型后,得到的文本向量可以为:(a1,a2,a3,…,an),其中,a1,a2,a3,…,an分别表示该样本语料信息中的每个字的字向量。
S104、将两个所述编码向量和所述样本数据所代表的意图输入卷积神经网络进行训练,以得到意图识别模型。
具体地,获取到训练集中的两个样本数据对应的两个编码向量,以及两个样本数据代表的意图,将两个样本数据对应的编码向量和意图分别输入卷积神经网络,对卷积神经网络进行训练,得到意图识别模型,以根据该意图识别模型计算两个意图的相似度。
在一些实施例中,请参考图2,步骤S104具体包括:
S1041、将两个所述编码向量输入卷积神经网络的卷积层进行特征提取,以得到两个与所述编码向量对应的样本特征。
具体地,在对编码向量进行特征提取时,利用卷积神经网络的卷积层,通过卷积操作对输入的编码向量进行降维和特征提取。
例如,当BERT模型输出的文本向量为(a1,a2,…an)时,利用CNN网络的卷积层对该文本向量进行特征提取,从而得到与该文本向量对应的样本特征,得到的样本特征为(m1,m2,…mi)。
S1042、将两个所述样本特征和所述样本数据所代表的意图输入卷积神经网络进行训练。
具体地,将两个样本数据对应的样本特征和意图输入卷积神经网络中,利用卷积神经网络进行训练,过前向传播步骤(卷积,ReLU激活和池化操作以在全连接层中的前向传播)进行迭代训练,最终得到输入的两个样本数据的相似度,使用交叉熵计算损失函数,对于模型选择合适的批处理参数和Adam优化策略,经过反向传播,多次迭代来得到最终的模型,完成意图识别模型的训练,使意图识别模型能够输出两个样本所代表的意图的相似度。
例如,A样本数据中的样本特征所述的意图为糖尿病,B样本数据中的样本特征所述的类别为养老院,则两个意图的相似度为10%,A样本数据中的样本特征所述的意图为高血脂,B样本数据中的样本特征所述的类别为高血压,则两个意图的相似度为40%。
上述实施例提供的意图识别模型的训练方法,通过将样本数据转换为编码向量,从而将编码向量和对应的意图输入卷积神经网络进行训练,从而得到意图识别模型以应用于意图识别方法中,以对输入意图识别模型的两个语料数据的意图相似度进行判断,从而提高意图识别的准确率。
请参阅图3,图3是本申请实施例提供的一种用于终端的意图识别方法的示意流程图。该用于终端的意图识别方法通过从已有的少数语料中提取词向量,实现对样本集的扩充,以提高意图识别模型的相似度判断的准确率,进而提高用户意图识别的准确度。其中,所述终端包括但不限于智能手机、平板电脑、便携计算机和机器人等。为了便于理解,本方案以终端为智能手机为例进行详细说明。
如图3所示,该用于终端的意图识别方法,具体包括:步骤S201至步骤S205。
S201、采集用户的语音信息以得到待识别语料,并获取多个意图代表语料。
具体地,待识别语料和意图代表语料均为文本语料。其中,意图代表语料可以预先保存在智能手机的云端,所述意图代表语料是指预先保存的某个意图的代表文本,例如,意图的代表文本可以为:保健品对心脏病有好处么?其所代表的意图为:心脏病。其中,多个意图代表语料是指对于每一个不同的意图而言,均有一个代表语料。
在一些实施例中,采集用户的语音信息以得到待识别语料,具体包括:采集用户的语音信息,并对所述语音信息进行文本转换,以得到待识别语料。
通过智能手机上的麦克风采集用户的语音信息,并且将采集到的语音信息进行语音识别和文本转换,从而将采集到的用户的语音信息转换为需要的文本形式的待识别语料。具体地,对语音语料进行语音识别可以采用隐马尔科夫模型、ANN神经网络或者概率语法分析法。
S202、将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组。
其中,每个所述对比组中包括所述待识别语料和一个所述意图代表语料。将待识别语料分别与多个意图代表语料进行组合,得到对比组,以判断每个对比组中,待识别语料与意图代表语料的意图相似度。
在一些实施例中,请参阅图4,步骤S202包括:
S2021、对多个所述意图代表语料进行多次不放回抽样。S2022、将每次抽样得到的一个所述意图代表语料与所述待识别语料组合,得到对比组。
其中,所述对比组的数量与所述意图代表语料的数量相等。对意图代表语料进行多次不放回抽样,并将每次抽样得到的意图代表语料与待识别语料组合,以保证每一个意图代表语料均与待识别语料组合,且得到的对比组中的意图代表语料互不重复。
S203、将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量。
具体地,将一个对比组输入语言模型,从而根据语言模型得到该对比组中包括的待识别语料和意图代表语料对应的编码向量。其中,所述语言模型可以采用开源的预训练模型,例如BERT模型。重复该步骤直到获取到所有对比组中包括的待识别语料和意图代表语料对应的编码向量。
在一些实施例中,在将对比组输入语言模型之前,还包括:基于向量表将所述对比组中包括的所述待识别语料和一个所述意图代表语料中分别转换为一维向量。
具体地,BERT模型的输入为文本中每个字对应的一维向量,也即字向量,而BERT模型的输出则是各字所对应的融合了全文语义信息后的向量表示,因此,在将对比组输入语言模型之前,可以通过查询字向量表将文本中的每个字转换为对应的一维向量,将得到的一维向量输入语言模型,以得到对比组中所述待识别语料和意图代表语料对应的编码向量。
此外,BERT模型的输入除了字向量外,还可以包括文本向量和位置向量。将字向量、文本向量和位置向量的加和作为模型的输入。
S204、将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度。
其中,所述意图识别模型是基于卷积神经网络预先训练得到的。根据预先训练的意图识别模型,识别每个对比组中待识别语料和意图代表语料的相似度,从而获得待识别语料对应的多个相似度。
S205、确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于所述目标意图向所述用户显示与所述目标意图匹配的内容。
具体地,在得到待识别语料对应的多个相似度后,从多个相似度中确定相似度的最大值,并将该最大值所对应的意图代表语料的意图作为目标意图,完成用户意图的识别。在得到目标意图后,智能手机即可基于该目标意图查找与该目标意图相关的内容,并将查找到的内容在智能手机上向用户显示。在具体实施过程中,智能手机可以通过联网,在互联网上查找与目标意图相关的内容,并将查找到的内容在智能手机的屏幕上向用户显示。
在一些实施例中,步骤S205包括:从多个所述相似度中确定最大相似度对应的对比组;根据所述对比组确定意图代表语料,并将所述意图代表语料所代表的意图作为目标意图。
具体地,相似度越大,则说明待识别语料对应的意图与意图代表语料所代表的意图越相似。因此,在得到待识别语料对应的多个相似度后,从多个相似度中确定相似度的最大值,并基于该相似度的最大值确定该相似度的最大值所对应的对比组。在确定对比组后,根据对比组确定对比组中的意图代表语料所代表的意图,并将该意图作为目标意图。
上述实施例提供的用于终端的意图识别方法,通过采集用户的语音信息以得到待识别语料,并且获取多个意图代表语料,并基于获取到的待识别语料和多个意图代表语料建立多个对比组,再利用语言模型将各个对比组中的待识别语料和意图代表语料转换为编码向量,随即将编码向量输入预先训练的意图识别模型,得到待识别语料对应的多个相似度,最终从多个相似度中确定最大值所对应的意图代表语料的意图为目标意图,最终基于该目标意图向用户显示与目标意图匹配的内容。通过将语料信息转换为编码向量来对意图进行判断,提高意图识别的准确率。
请参阅图5,图5是本申请的实施例还提供一种意图识别模型训练装置的示意性框图,该意图识别模型训练装置用于执行前述的意图识别模型的训练方法。其中,该意图识别模型训练装置可以配置于终端中。
其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
如图5所示,意图识别模型训练装置300包括:样本数据模块301、样本分组模块302、编码向量模块303和模型训练模块304。
样本数据模块301,用于获取多个样本数据。
样本分组模块302,用于对所述样本数据进行两两分组,以得到多个训练集。
编码向量模块303,用于将所述训练集分别输入语言模型,以得到每个所述训练集对应的两个编码向量。
模型训练模块304,用于将两个所述编码向量和所述样本数据所代表的意图输入卷积神经网络进行训练,以得到意图识别模型。
其中,模型训练模块304包括样本特征子模块3041和网络训练子模块3042。
具体地,样本特征子模块3041,用于将两个所述编码向量输入卷积神经网络的卷积层进行特征提取,以得到两个与所述编码向量对应的样本特征;网络训练子模块3042,用于将两个所述样本特征和所述样本数据所代表的意图输入卷积神经网络进行训练。
请参阅图6,图6是本申请的实施例还提供一种用于终端的意图识别装置的示意性框图,该用于终端的意图识别装置用于执行前述的用于终端的意图识别方法。
如图6所示,该用于终端的意图识别装置400,包括:语料获取模块401、语料组合模块402、向量转换模块403、相似度计算模块404和意图确定模块405。
语料获取模块401,用于获取待识别语料和多个意图代表语料。
语料组合模块402,用于将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组。
其中,语料组合模块402包括语料抽样子模块4021和对比组子模块4022。
具体地,语料抽样子模块4021,用于对多个所述意图代表语料进行多次不放回抽样;对比组子模块4022,用于将每次抽样得到的一个所述意图代表语料与所述待识别语料组合,得到对比组。
向量转换模块403,用于将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量。
相似度计算模块404,用于将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度。
意图确定模块405,用于确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的用于终端的意图识别装置和各模块的具体工作过程,可以参考前述用于终端的意图识别方法实施例中的对应过程,在此不再赘述。
上述的用于终端的意图识别装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。
参阅图7,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种用于终端的意图识别方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种用于终端的意图识别方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
采集用户的语音信息以得到待识别语料,并获取多个意图代表语料;
将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组,每个所述对比组中包括所述待识别语料和一个所述意图代表语料;
将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量;
将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度,其中,所述意图识别模型是基于卷积神经网络预先训练得到的;
确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于所述目标意图向所述用户显示与所述目标意图匹配的内容。
在一个实施例中,所述处理器还用于实现:
获取多个样本数据,所述样本数据包括所述样本数据所代表的意图;
对所述样本数据进行两两分组,以得到多个训练集;
将所述训练集分别输入语言模型,以得到每个所述训练集对应的两个编码向量;
将两个所述编码向量和所述样本数据所代表的意图输入卷积神经网络进行训练,以得到意图识别模型。
在一个实施例中,所述处理器在实现所述将两个所述编码向量和所述样本数据所代表的意图输入卷积神经网络进行训练时,用于实现:
将两个所述编码向量输入卷积神经网络的卷积层进行特征提取,以得到两个与所述编码向量对应的样本特征;
将两个所述样本特征和所述样本数据所代表的意图输入卷积神经网络进行训练。
在一个实施例中,所述处理器还用于实现:
对所述样本数据进行两两分组,以得到多个测试集,根据所述测试集对训练得到的所述意图识别模型进行测试。
在一个实施例中,所述处理器在实现所述将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组时,用于实现:
对多个所述意图代表语料进行多次不放回抽样;
将每次抽样得到的一个所述意图代表语料与所述待识别语料组合,得到对比组,其中,所述对比组的数量与所述意图代表语料的数量相等。
在一个实施例中,所述处理器在实现所述采集用户的语音信息以得到待识别语料时,用于实现:
采集用户的语音信息,并对所述语音信息进行文本转换,以得到待识别语料。
在一个实施例中,所述处理器在实现所述确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图时,用于实现:
从多个所述相似度中确定最大相似度对应的对比组;
根据所述对比组确定意图代表语料,并将所述意图代表语料所代表的意图作为目标意图。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项用于终端的意图识别方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用于终端的意图识别方法,其特征在于,包括:
采集用户的语音信息以得到待识别语料,并获取多个意图代表语料;
将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组,每个所述对比组中包括所述待识别语料和一个所述意图代表语料;
将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量;
将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度,其中,所述意图识别模型是基于卷积神经网络预先训练得到的;
确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于所述目标意图向所述用户显示与所述目标意图匹配的内容。
2.根据权利要求1所述的用于终端的意图识别方法,其特征在于,还包括:
获取多个样本数据,所述样本数据包括所述样本数据所代表的意图;
对所述样本数据进行两两分组,以得到多个训练集;
将所述训练集分别输入语言模型,以得到每个所述训练集对应的两个编码向量;
将两个所述编码向量和所述样本数据所代表的意图输入卷积神经网络进行训练,以得到意图识别模型。
3.根据权利要求2所述的用于终端的意图识别方法,其特征在于,所述将两个所述编码向量和所述样本数据所代表的意图输入卷积神经网络进行训练,包括:
将两个所述编码向量输入卷积神经网络的卷积层进行特征提取,以得到两个与所述编码向量对应的样本特征;
将两个所述样本特征和所述样本数据所代表的意图输入卷积神经网络进行训练。
4.根据权利要求2所述的用于终端的意图识别方法,其特征在于,还包括:
对所述样本数据进行两两分组,以得到多个测试集,根据所述测试集对训练得到的所述意图识别模型进行测试。
5.根据权利要求1所述的用于终端的意图识别方法,其特征在于,所述将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组,包括:
对多个所述意图代表语料进行多次不放回抽样;
将每次抽样得到的一个所述意图代表语料与所述待识别语料组合,得到对比组,其中,所述对比组的数量与所述意图代表语料的数量相等。
6.根据权利要求1所述的用于终端的意图识别方法,其特征在于,所述采集用户的语音信息以得到待识别语料,包括:
采集用户的语音信息,并对所述语音信息进行文本转换,以得到待识别语料。
7.根据权利要求1所述的用于终端的意图识别方法,其特征在于,所述确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,包括:
从多个所述相似度中确定最大相似度对应的对比组;
根据所述对比组确定意图代表语料,并将所述意图代表语料所代表的意图作为目标意图。
8.一种用于终端的意图识别装置,其特征在于,包括:
语料获取模块,用于采集用户的语音信息以得到待识别语料,并获取多个意图代表语料;
语料组合模块,用于将所述待识别语料分别与多个所述意图代表语料进行组合,得到多个对比组,每个所述对比组中包括所述待识别语料和一个所述意图代表语料;
向量转换模块,用于将所述对比组输入语言模型,以分别得到所述对比组中所述待识别语料和意图代表语料对应的编码向量;
相似度计算模块,用于将所述待识别语料和意图代表语料对应的编码向量分别输入预先训练的意图识别模型中,以得到所述待识别语料对应的多个相似度,其中,所述意图识别模型是基于卷积神经网络预先训练得到的;
意图确定模块,用于确定多个所述相似度中的最大相似度对应意图代表语料的意图为目标意图,并基于所述目标意图向所述用户显示与所述目标意图匹配的内容。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的用于终端的意图识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的用于终端的意图识别方法。
CN202010031613.7A 2020-01-13 2020-01-13 用于终端的意图识别方法、装置、设备及存储介质 Pending CN111274797A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010031613.7A CN111274797A (zh) 2020-01-13 2020-01-13 用于终端的意图识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010031613.7A CN111274797A (zh) 2020-01-13 2020-01-13 用于终端的意图识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111274797A true CN111274797A (zh) 2020-06-12

Family

ID=71001857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010031613.7A Pending CN111274797A (zh) 2020-01-13 2020-01-13 用于终端的意图识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111274797A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401071A (zh) * 2019-01-02 2020-07-10 百度在线网络技术(北京)有限公司 模型的训练方法、装置、计算机设备和可读存储介质
CN111914936A (zh) * 2020-08-05 2020-11-10 平安科技(深圳)有限公司 语料数据的数据特征增强方法、装置及计算机设备
CN111986653A (zh) * 2020-08-06 2020-11-24 杭州海康威视数字技术股份有限公司 一种语音意图识别方法、装置及设备
CN112163074A (zh) * 2020-09-11 2021-01-01 北京三快在线科技有限公司 用户意图识别方法、装置、可读存储介质及电子设备
CN112232068A (zh) * 2020-09-30 2021-01-15 和美(深圳)信息技术股份有限公司 一种意图识别方法、装置、电子设备及存储介质
CN112257432A (zh) * 2020-11-02 2021-01-22 北京淇瑀信息科技有限公司 一种自适应意图识别方法、装置及电子设备
CN114357973A (zh) * 2021-12-10 2022-04-15 马上消费金融股份有限公司 意图识别方法、装置、电子设备及存储介质
CN114398903A (zh) * 2022-01-21 2022-04-26 平安科技(深圳)有限公司 意图识别方法、装置、电子设备及存储介质
WO2023231285A1 (zh) * 2022-05-30 2023-12-07 青岛海尔科技有限公司 语料识别方法、装置、设备及存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401071A (zh) * 2019-01-02 2020-07-10 百度在线网络技术(北京)有限公司 模型的训练方法、装置、计算机设备和可读存储介质
CN111914936A (zh) * 2020-08-05 2020-11-10 平安科技(深圳)有限公司 语料数据的数据特征增强方法、装置及计算机设备
CN111914936B (zh) * 2020-08-05 2023-05-09 平安科技(深圳)有限公司 语料数据的数据特征增强方法、装置及计算机设备
CN111986653A (zh) * 2020-08-06 2020-11-24 杭州海康威视数字技术股份有限公司 一种语音意图识别方法、装置及设备
CN112163074A (zh) * 2020-09-11 2021-01-01 北京三快在线科技有限公司 用户意图识别方法、装置、可读存储介质及电子设备
CN112232068A (zh) * 2020-09-30 2021-01-15 和美(深圳)信息技术股份有限公司 一种意图识别方法、装置、电子设备及存储介质
CN112232068B (zh) * 2020-09-30 2023-05-05 和美(深圳)信息技术股份有限公司 一种意图识别方法、装置、电子设备及存储介质
CN112257432A (zh) * 2020-11-02 2021-01-22 北京淇瑀信息科技有限公司 一种自适应意图识别方法、装置及电子设备
CN114357973A (zh) * 2021-12-10 2022-04-15 马上消费金融股份有限公司 意图识别方法、装置、电子设备及存储介质
CN114398903A (zh) * 2022-01-21 2022-04-26 平安科技(深圳)有限公司 意图识别方法、装置、电子设备及存储介质
CN114398903B (zh) * 2022-01-21 2023-06-20 平安科技(深圳)有限公司 意图识别方法、装置、电子设备及存储介质
WO2023231285A1 (zh) * 2022-05-30 2023-12-07 青岛海尔科技有限公司 语料识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111274797A (zh) 用于终端的意图识别方法、装置、设备及存储介质
CN109241524B (zh) 语义解析方法及装置、计算机可读存储介质、电子设备
CN109408526B (zh) Sql语句生成方法、装置、计算机设备及存储介质
WO2020232861A1 (zh) 命名实体识别方法、电子装置及存储介质
CN109471945B (zh) 基于深度学习的医疗文本分类方法、装置及存储介质
CN110334110A (zh) 自然语言分类方法、装置、计算机设备以及存储介质
CN111368049A (zh) 信息获取方法、装置、电子设备及计算机可读存储介质
CN111967264B (zh) 一种命名实体识别方法
US20210390370A1 (en) Data processing method and apparatus, storage medium and electronic device
WO2021204017A1 (zh) 文本意图识别方法、装置以及相关设备
CN112699686B (zh) 基于任务型对话系统的语义理解方法、装置、设备及介质
CN112528637A (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
CN115599901B (zh) 基于语义提示的机器问答方法、装置、设备及存储介质
CN113239169A (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN111985243B (zh) 情感模型的训练方法、情感分析方法、装置及存储介质
CN113722438A (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN112084752A (zh) 基于自然语言的语句标注方法、装置、设备及存储介质
CN111126084B (zh) 数据处理方法、装置、电子设备和存储介质
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN111046674B (zh) 语义理解方法、装置、电子设备和存储介质
CN112417878A (zh) 实体关系抽取方法、系统、电子设备及存储介质
CN110969005B (zh) 一种确定实体语料之间的相似性的方法及装置
CN113326383B (zh) 一种短文本实体链接方法、装置、计算设备与存储介质
CN113220828B (zh) 意图识别模型处理方法、装置、计算机设备及存储介质
CN112818096A (zh) 对话生成方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20210210

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant after: Shenzhen saiante Technology Service Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination