CN111027667B - 意图类别的识别方法和装置 - Google Patents

意图类别的识别方法和装置 Download PDF

Info

Publication number
CN111027667B
CN111027667B CN201911245030.8A CN201911245030A CN111027667B CN 111027667 B CN111027667 B CN 111027667B CN 201911245030 A CN201911245030 A CN 201911245030A CN 111027667 B CN111027667 B CN 111027667B
Authority
CN
China
Prior art keywords
vector
operation instruction
model
intention category
vector model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911245030.8A
Other languages
English (en)
Other versions
CN111027667A (zh
Inventor
王玉昕
郑祺星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201911245030.8A priority Critical patent/CN111027667B/zh
Publication of CN111027667A publication Critical patent/CN111027667A/zh
Application granted granted Critical
Publication of CN111027667B publication Critical patent/CN111027667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour

Abstract

本申请提出一种意图类别的识别方法和装置,其中,方法包括:获取用户输入的操作指令;向多个向量模型中的每个向量模型输入操作指令,获取每个向量模型输出的向量值;根据每个向量模型输出的向量值,确定与每个向量模型对应的第一识别结果;根据所有的第一识别结果确定操作指令对应的意图类别。由此,基于多个模型识别操作指令对应的意图类别,在对应的意图类别下响应操作指令,提高了操作指令的响应准确率和服务质量。

Description

意图类别的识别方法和装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种意图类别的识别方法和装置。
背景技术
随着人工智能技术的发展,催生了基于人工智能机器人,智能机器人可以拟人化与用户交互,代替了部分人工服务,大大节约了企业成本,提高了服务效率。作为一种重要的服务形式,机器人根据用户的操作指令来提供有关服务。
相关技术中,智能机器人根据用户的操作指令中包含的关键词进行指令的识别,这种依赖于人工规则来识别指令的方法,受限于人工规则的覆盖面过窄的问题,导致操作指令响应准确率不高,服务质量较差。
发明内容
本申请提出一种意图类别的识别方法和装置,以解决现有技术中,依赖于人工规则识别用户操作指令,导致响应用户操作指令不准确,从而影响服务质量的技术问题。
本申请一方面实施例提出了一种意图类别的识别方法,包括以下步骤:获取用户输入的操作指令;向多个向量模型中的每个向量模型输入所述操作指令,获取所述每个向量模型输出的向量值;根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果;根据每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别。
另外,本申请实施例的意图类别的识别方法,还包括如下附加的技术特征:
在本申请实施例一种可能的实现方式中,所述根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果,包括:根据预设的对应关系获取与所述每个向量模型对应的识别算法;将所述每个向量模型输出的向量值输入对应的识别算法,获取与所述每个向量模型对应的第一识别结果。在本申请实施例一种可能的实现方式中,在所述获取所述每个向量模型输出的向量值之后,还包括:在所述多个向量模型中确定目标向量模型,并将所述目标向量模型输出的向量值输入预设深度模型;获取所述深度模型输出的意图类别的第二识别结果。
在本申请实施例一种可能的实现方式中,所述在所述多个向量模型中确定目标向量模型,包括:判断所述多个向量模型中是否包含预设的向量模型;若包含所述预设的向量模型,则将所述预设向量模型确定为所述目标向量模型;若不包含所述预设的向量模型,则在所述多个向量模型中随机确定一个模型为所述目标向量模型。
在本申请实施例一种可能的实现方式中,所述根据每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别,包括:确定所述每个向量模型对应的第一识别结果和所述第二识别结果分别对应的权重;根据所述每个向量模型对应的第一识别结果及其对应的权重,以及所述第二识别结果及其对应的权重确定所述意图类别。
在本申请实施例一种可能的实现方式中,所述第一识别结果包括多个意图类别中每个意图类别对应的概率,则所述根据每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别,包括:提取所述每个向量模型对应的第一识别结果中相同意图类别对应的所有的概率;计算所述相同意图类别对应的所有的概率的均值,获取每个意图类别的概率;根据所述每个意图类别的概率确定所述操作指令对应的意图类别。
在本申请实施例一种可能的实现方式中,在所述向多个向量模型中的每个向量模型输入所述操作指令之前,还包括:提取所述操作指令中的关键字;将所述关键字与每个意图类别对应的预设关键字匹配,并获知所述关键字与所述预设关键字不匹配。
本申请一方面实施例提出了一种意图类别的识别装置,包括:第一获取模块,用于获取用户输入的操作指令;第二获取模块,用于向多个向量模型中的每个向量模型输入所述操作指令,获取所述每个向量模型输出的向量值;第一确定模块,用于根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果;第二确定模块,用于根据每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别。
另外,本申请实施例的意图类别的识别装置,还包括如下附加的技术特征:
在本申请实施例一种可能的实现方式中,还包括:输入模块,用于在所述多个向量模型中确定目标向量模型,并将所述目标向量模型输出的向量值输入预设深度模型;所述第三获取模块,还用于获取所述深度模型输出的意图类别的第二识别结果。
在本申请实施例一种可能的实现方式中,所述第二确定模块,用于:确定所述第一识别结果和所述第二识别结果分别对应的权重;根据所述第一识别结果及其对应的权重,以及所述第二识别结果及其对应的权重确定所述意图类别。
在本申请实施例一种可能的实现方式中,所述第一识别结果包括多个意图类别中每个意图类别对应的概率,所述第二确定模块,具体用于:提取所述每个向量模型对应的第一识别结果中相同意图类别对应的所有的概率;计算所述相同意图类别对应的所有的概率的均值,获取每个意图类别的概率;根据所述每个意图类别的概率确定所述操作指令对应的意图类别。
在本申请实施例一种可能的实现方式中,还包括:提取模块,用于提取所述操作指令中的关键字;匹配模块,用于将所述关键字与每个意图类别对应的预设关键字匹配,并获知所述关键字与所述预设关键字不匹配。
本申请另一方面实施例提出了一种电子设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述实施例所述的意图类别的识别方法。
本申请另一方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述实施例所述的意图类别的识别方法。
本申请提供的技术方案,至少包括如下有益技术效果:
获取用户输入的操作指令,向多个向量模型中的每个向量模型输入操作指令,获取每个向量模型输出的向量值,根据与多个向量模型对应的向量值确定操作指令对应的目标向量值,根据每个向量模型输出的向量值,确定与每个向量模型对应的第一识别结果,进而,根据每个向量模型对应的第一识别结果确定操作指令对应的意图类别。由此,基于多个模型识别操作指令对应的意图类别,在对应的意图类别下响应操作指令,提高了操作指令的响应准确率和服务质量。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种意图类别的识别方法的流程示意图;
图2为本申请实施例所提供的第一种意图类别的识别流程示意图;
图3-1为本申请实施例所提供的第二种意图类别的识别流程示意图;
图3-2为本申请实施例所提供的第三种意图类别的识别流程示意图;
图3-3为本申请实施例所提供的第四种意图类别的识别流程示意图;
图4是根据本申请另一个实施例的意图类别的识别方法的流程图;
图5-1为本申请实施例所提供的第五种意图类别的识别流程示意图;
图5-2为本申请实施例所提供的第六种意图类别的识别流程示意图;
图6为本申请实施例所提供的第七种意图类别的识别流程示意图;
图7是根据本申请一个实施例的意图类别的识别装置的结构示意图;
图8是根据本申请另一个实施例的意图类别的识别装置的结构示意图;
图9是根据本申请又一个实施例的意图类别的识别装置的结构示意图;
图10是根据本申请一个实施例的电子设备的结示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
针对上述背景技术中提到的,依赖人工规则识别操作指令,导致操作指令的响应准确率不高的技术问题,本申请提出了一种优化的识别方法,在该方法中,一方面,对操作指令进行所属的意图类别进行识别,在对应的意图类别下响应,从而提高响应准确率,避免在不同的意图下同样的操作指令导致的误判;其中,意图类别可以根据实际需要设定,作为一种可能的示例,意图类别其一可以包括常用指令类别,代表了针对机器人本身功能的用户操作指令,如引领,查询天气等;其二是场景特有类别,代表在当前特有场景下用户对机器人提问的操作指令,如酒店场景下,用户提问查询入住流程;其三是闲聊类别,代表了用户与机器人进行娱乐性质的互动,相比前两类,这类对话一般没有很强烈的目的性,用户只是单纯与机器人聊天;另一方面,本申请中结合多个模型进行意图类别的识别,提高了意图类别的识别精确性,相对于人工规则,鲁棒性更高。
下面参考附图描述本申请实施例的意图类别的识别方法和装置。本申请实施例的意图类别的识别方法的执行主体,可以为任意包含语音识别功能设备的设备。
图1为本申请实施例所提供的一种意图类别的识别方法的流程示意图。
如图1所示,该意图类别的识别方法包括以下步骤:
步骤101,获取用户输入的操作指令。
本实施例中,操作指令可以包括手势指令、文字操作指令、语音操作指令等,其中,语音操作指令的获取方式可以为用过麦克风等拾音设备主动监测得到的,也可是用户触发机器人界面上的操作指令输入控件后,机器人实时采集的。
步骤102,向多个向量模型中的每个向量模型输入操作指令,获取每个向量模型输出的向量值。
应当理解的是,本实施例中引入多个向量模型,在训练阶段,可以通过多个向量模型对样本数据的交叉验证来优化模型,进而,在训练完成后,如图2所示,向多个向量模型中的每个向量模型输入操作指令,进而,获取每个向量模型输出的向量值,该向量值此时可以体现操作指令对应的句向量等。
具体而言,可以将操作指令转换为文本数据,进而,将文本数据输入到每个向量模型,其中,为了进一步提高识别准确率,可以在将文本数据输入到对应的向量模型之前,对其进行去噪处理等。
在实际应用中,上述多个向量模型可以包括但不限于TFIDF,DOC2EV和BERT模型。
步骤103,根据每个向量模型输出的向量值,确定与每个向量模型对应的第一识别结果。
在本申请的一个实施例中,根据每个向量模型输出的向量值,确定与每个向量模型对应的第一识别结果,其中,该第一识别结果可以包括每个意图类别对应的概率,比如,第一识别结果中包括:(意图类别1,概率为0.5),(意图类别2,概率为0.3)等。
作为一种可能的实现方式,预先根据大量实验数据,确定与每一种向量模型适配的识别功能较好的识别算法,并预设设置对应关系,该对应关系中,包括向量模型和识别算法的对应关系,如图3-1所示,对于向量模型TFEDF,匹配得到的识别算法为随机森林算法,对于向量模型DOC2EV,匹配得到的识别算法为回归算法,对于向量模型BERT,匹配得到的识别算法为机器学习算法,将向量输入到对应的识别算法后,获取每个算法输出的与每个向量模型对应的第一识别结果。
在实际执行过程中,也可以使用其他方式来计算获取第一识别结果,在本申请的一个实施例中,考虑到每个向量值可能体现了对应的操作指令的句向量,因而,而不同的向量模型识别的句向量可能彼此之间具有侧重点的差异性,因此,结合多个向量模型输出的所有的向量值确定操作指令对应的目标向量值,根据目标向量值获取意图类别的第一识别结果。
需要说明的是,在不同的应用场景下,根据每个向量模型对应的向量值确定操作指令对应的目标向量值的方式不同,示例说明如下:
示例一:
在本示例中,取所有的向量值的算术平均值作为目标向量值。
示例二:
在本示例中,根据每个向量模型对意图分类结果的准确率反馈信息,确定每个向量模型对应的权重值,进而,将每个向量模型对应的权重值与对应的向量值乘积后,将所有的乘积值之和作为目标向量值。
步骤104,根据每个向量模型对应的第一识别结果确定操作指令对应的意图类别。
具体的,正如以上提到的,第一识别结果可包括多个意图类别中每个意图类别对应的概率,因此,可根据所有的第一识别结果确定操作指令对应的意图类别,比如,筛选出多个意图类别对应的多个概率中的最大概率,确定最大概率对应的意图类别为操作指令对应的意图类别,进而,在对应的意图类别下响应操作指令,从而,提高了响应的准确率,比如,当识别意图类别为闲聊意图,在对用户的操作指令“给我唱首歌呗”,响应人工智能语音的歌曲,或者,响应“我不给你唱”等聊天信息,当意图类别为场景特有时,如用户在音乐播放场景,则对用户的操作指令“给我唱首歌呗”,响应播放音乐播放应用中的流行歌曲等。在实际应用中,在对应的意图类别下应用对应的操作指令的实现方式可以是为每个意图类别匹配不同的响应指令识别算法等。
作为一种可能的示例方式,提取每个向量模型对应的第一识别结果中相同意图类别对应的所有的概率,计算相同意图类别对应的所有的概率的均值,获取每个意图类别的概率,即如图3-2所示,对每个识别算法得到的第一识别结果,取算术平均值得到每个意图类别的概率均值。进而,根据每个意图类别的概率确定操作指令对应的意图类别,比如,将所有意图类别下概率最大的意图类别,确定为操作指令对应的意图类别。
当然,若是该第一识别结果为上述示例提到的根据目标向量值获取意图类别的第一识别结果,则也可以采用对应的方式来识别操作指令对应的意图类别。下面结合具体的应用场景进行说明,其中在,在该场景下,多个向量模型包括TFIDF,DOC2EV和BERT模型,获取目标向量值的方式为获取所有向量值的算术平均值。
如图3-3所示,在获取到操作指令后,将操作指令分别输入TFIDF,DOC2EV和BERT模型,将三个模型输出的向量值求算术平均值得到目标向量值,进而,将目标向量值输入到分类模型得到第一识别结果。
由此,本申请实施例的意图类别的识别方法,结合多个向量模型的识别结果识别意图类别,提高了意图类别的识别准确率,并且在意图类别下响应用户说我操作指令,提高了响应准确率。
综上,本申请实施例的意图类别的识别方法,获取用户输入的操作指令,向多个向量模型中的每个向量模型输入操作指令,获取每个向量模型输出的向量值,根据每个向量模型输出的向量值,确定与每个向量模型对应的第一识别结果,进而,根据第一识别结果确定操作指令对应的意图类别,以便于在意图类别下响应操作指令。由此,基于多个模型识别操作指令对应的意图类别,在对应的意图类别下响应操作指令,提高了操作指令的响应准确率和服务质量。
为了进一步提高意图类别的识别方法,在本申请的一个实施例中,引入当下流行的深度学习模型参与意图类别的识别,并且,考虑到现有技术中,深度学习模型的训练效率较低,本申请的实施例中,对深度学习模型的数据输入提供了向量值作为数据支撑。
具体的,图4是根据本申请另一个实施例的意图类别的识别方法的流程图,如图4所示,在上述步骤102之后,该方法还包括:
步骤201,在多个向量模型中确定目标向量模型,并将目标向量模型输出的向量值输入预设深度模型。
为了兼顾意图类别识别的准确率和效率,在本实施例中,在多个向量模型中确定目标向量模型,复用多个向量模型中的目标向量模型输出的向量,以该目标向量模型输出的向量值输入预设深度模型。
根据大量实验数据,确定出预设的向量模型,该预设的响铃模型的向量值输入到深度学习模型后,可以得到较高的分类结果。
具体而言,判断多个向量模型中是否包含预设的向量模型,若包含预设的向量模型,则将预设向量模型确定为目标向量模型,当然,若是不包含预设的向量模型,则在多个向量模型中随机确定一个模型为目标向量模型,以便于保持深度学习模型的引入。
步骤202,获取深度模型输出的意图类别的第二识别结果。
具体地,获取深度模型输出的意图类别的第二识别结果,其中,该第二识别结果可以和第一识别结果相同,包含每个意图类别及其对应的概率。
从而,在本申请的一个实施例中,确定每个向量模型对应的第一识别结果和第二识别结果分别对应的权重,进而,根据所有的第一识别结果及其对应的权重以及第二识别结果及其对应的权重确定意图类别,比如,确定所有的第一识别结果中,每个意图类别对应的概率均值,计算每个意图类别对应的概率均值和权重的第一乘积值,并计算第二识别结果中每个意图类别的概率值和对应权重值的第二乘积值,将第一乘积值和第二乘积值求取平均值得到每个意图类别对应的概率,进而,将最大概率值对应的意图类别作为最后识别出的意图类别。
举例而言,对应如图3-1所示的实施例,如图5-1所示,当预设的目标向量模型为BERT模型时,可以将BERT模型输出的向量值作为深度学习模型的嵌入层的输入,进而,将深度模型输出的第二识别结果对应的概率值乘以第二权重0.6,将第一识别结果中计算每个意图类别下所有的概率值的概率均值,根据得到的概率均值乘以第一权重0.4,基于两个乘积值之和确定最后的意图类别。又举例而言,如图5-2所示,对应于图3-3所示的实施例,当预设的目标向量模型为BERT模型时,可以将BERT模型输出的向量值作为深度学习模型的嵌入层的输入,进而,将深度模型输出的第二识别结果对应的概率值乘以第二权重0.6,将第一识别结果对应的概率值乘以第一权重0.4,基于两个乘积值之和确定最后的意图类别。
当然,在本申请的一个实施例中,为了进一步提高意图类别的识别效率,还可以结合人工规则识别常用的意图类别,在向多个向量模型中的每个向量模型输入操作指令之前,提取操作指令中的关键字,将关键字与每个意图类别对应的预设关键字匹配,若获知关键字与预设关键字不匹配,则进一步向多个向量模型中的每个向量模型输入操作指令,若是匹配,则直接匹配到对应的意图类别。
作为一种可能的实施例,如图6所示,为了降低实施难度,也可以仅仅根据某一类意图类别设置关键词,比如针对常用指令类设置对应的关键字,当匹配不成功后,再根据向量模型识别闲聊类别以及场景特有的意图类别等。
综上,本申请实施例的意图类别的识别方法,引入了深度学习模型来进行意图识别,进一步提高了模型的识别泛化能力,且深度学习模型的输入以对应向量模型的输出为数据支撑,降低了深度学习模型的引入难度,由此,采用了多种向量识别意图类别,提高了意图类别的预测准确率,进一步提高了服务质量。
为了实现上述实施例,本申请还提出一种意图类别的识别装置。
图7为本申请实施例提供的一种意图类别的识别装置的结构示意图。
如图7所示,该意图类别的识别装置包括:第一获取模块10、第二获取模块20、第三获取模块30和确定模块40。
其中,第一获取模块10,用于获取用户输入的操作指令。
第二获取模块20,用于向多个向量模型中的每个向量模型输入操作指令,获取每个向量模型输出的向量值。
第一确定模块30,用于根据每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果。
第二确定模块40,用于根据每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别。
进一步地,在本申请实施例的一种可能的实现方式中,如图8所示,在如图7所示的基础上,该装置还包括:输入模块50。
其中,输入模块50,用于在多个向量模型中确定目标向量模型,并将目标向量模型输出的向量值输入预设深度模型。
在本实施例中,第三获取模块30,还用于获取深度模型输出的意图类别的第二识别结果。
在本实施例中,第二确定模块40,用于确定第一识别结果和第二识别结果分别对应的权重;
根据第一识别结果及其对应的权重,以及第二识别结果及其对应的权重确定意图类别。
在本申请的一个可能的实施例中,第一识别结果包括多个意图类别中每个意图类别对应的概率,第二确定模块40,具体用于:
提取每个向量模型对应的第一识别结果中相同意图类别对应的所有的概率;
计算相同意图类别对应的所有的概率的均值,获取每个意图类别的概率;
根据每个意图类别的概率确定操作指令对应的意图类别。
进一步地,在本申请实施例的一种可能的实现方式中,如图9所示,在如图7所示的基础上,该装置还包括:提取模块60和匹配模块70,其中,
提取模块60,用于提取操作指令中的关键字。
匹配模块70,用于将关键字与每个意图类别对应的预设关键字匹配,并获知关键字与预设关键字不匹配。
需要说明的是,前述对意图类别的识别方法实施例的解释说明也适用于该实施例的意图类别识别装置,此处不再赘述。
为了实现上述实施例,本申请实施例还提出一种电子设备,包括处理器和存储器;
其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如上述实施例描述的意图类别的识别方法。
图10示出了适于用来实现本申请实施方式的示例性电子设备的框图。图10显示的电子设备120仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图10所示,电子设备120以通用计算设备的形式表现。电子设备120的组件可以包括但不限于:一个或者多个处理器或者处理单元160,系统存储器280,连接不同系统组件(包括系统存储器280和处理单元160)的总线180。
总线180表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备120典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备120访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器280可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)300和/或高速缓存存储器3200。电子设备120可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统3400可以用于读写不可移动的、非易失性磁介质(图10未显示,通常称为“硬盘驱动器”)。尽管图10中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc ReadOnly Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多数量据介质接口与总线180相连。存储器280可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块420的程序/实用工具400,可以存储在例如存储器280中,这样的程序模块420包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块420通常执行本申请所描述的实施例中的功能和/或方法。
电子设备120也可以与一个或多个外部设备140(例如键盘、指向设备、显示器240等)通信,还可与一个或者多个使得用户能与该电子设备120交互的设备通信,和/或与使得该电子设备120能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口220进行。并且,电子设备120还可以通过网络适配器200与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器200通过总线180与电子设备120的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备120使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元160通过运行存储在系统存储器280中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
为了实现上述实施例,本申请实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的意图类别的识别方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (7)

1.一种意图类别的识别方法,其特征在于,包括以下步骤:
获取用户输入的操作指令,其中,所述操作指令包括手势指令、文字操作指令、语音操作指令;
向多个向量模型中的每个向量模型输入所述操作指令,获取所述每个向量模型输出的向量值,其中,所述向量值为体现操作指令对应的句向量;
根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果;
根据所述每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别;
其中,所述根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果,包括:
根据预设的对应关系获取与所述每个向量模型对应的识别算法;
将所述每个向量模型输出的向量值输入对应的识别算法,获取与所述每个向量模型对应的第一识别结果;
在所述获取所述每个向量模型输出的向量值之后,还包括:
在所述多个向量模型中确定目标向量模型,并将所述目标向量模型输出的向量值输入预设深度模型,其中,所述目标向量模型输出的向量值为所述预设深度模型的嵌入层的输入;
获取所述深度模型输出的意图类别的第二识别结果;
所述根据所述每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别,包括:
确定所述每个向量模型对应的第一识别结果和所述第二识别结果分别对应的权重;
根据所述每个向量模型对应的第一识别结果及其对应的权重,以及所述第二识别结果及其对应的权重确定所述意图类别;
在所述向多个向量模型中的每个向量模型输入所述操作指令之前,还包括:
提取所述操作指令中的关键字;
将所述关键字与每个意图类别对应的预设关键字匹配,若获知关键字与预设关键字不匹配,则进一步向多个向量模型中的每个向量模型输入操作指令,若匹配,则将匹配到关键字对应的意图类别作为所述操作指令对应的意图类别。
2.如权利要求1所述的方法,其特征在于,所述在所述多个向量模型中确定目标向量模型,包括:
判断所述多个向量模型中是否包含预设的向量模型;
若包含所述预设的向量模型,则将所述预设向量模型确定为所述目标向量模型;
若不包含所述预设的向量模型,则在所述多个向量模型中随机确定一个模型为所述目标向量模型。
3.如权利要求1所述的方法,其特征在于,所述第一识别结果包括多个意图类别中每个意图类别对应的概率,则所述根据所述每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别,包括:
提取所述每个向量模型对应的第一识别结果中相同意图类别对应的所有的概率;
计算所述相同意图类别对应的所有的概率的均值,获取每个意图类别的概率;
根据所述每个意图类别的概率确定所述操作指令对应的意图类别。
4.一种意图类别的识别装置,其特征在于,包括:
第一获取模块,用于获取用户输入的操作指令,其中,所述操作指令包括手势指令、文字操作指令、语音操作指令;
第二获取模块,用于向多个向量模型中的每个向量模型输入所述操作指令,获取所述每个向量模型输出的向量值,其中,所述向量值为体现操作指令对应的句向量;
第一确定模块,用于根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果;
第二确定模块,用于根据所述每个向量模型对应的第一识别结果确定所述操作指令对应的意图类别;
其中,所述根据所述每个向量模型输出的向量值,确定与所述每个向量模型对应的第一识别结果,包括:
根据预设的对应关系获取与所述每个向量模型对应的识别算法;
将所述每个向量模型输出的向量值输入对应的识别算法,获取与所述每个向量模型对应的第一识别结果;
所述装置,还包括:
输入模块,用于在所述多个向量模型中确定目标向量模型,并将所述目标向量模型输出的向量值输入预设深度模型,其中,所述目标向量模型输出的向量值为所述预设深度模型的嵌入层的输入;
所述第一确定模块,还用于获取所述深度模型输出的意图类别的第二识别结果;
所述第二确定模块,还用于:
确定所述第一识别结果和所述第二识别结果分别对应的权重;
根据所述第一识别结果及其对应的权重,以及所述第二识别结果及其对应的权重确定所述意图类别
所述装置,还包括:
提取所述操作指令中的关键字;
将所述关键字与每个意图类别对应的预设关键字匹配,若获知关键字与预设关键字不匹配,则进一步向多个向量模型中的每个向量模型输入操作指令,若匹配,则将关键字对应的意图类别作为所述操作指令对应的意图类别。
5.如权利要求4所述的装置,其特征在于,所述第一识别结果包括多个意图类别中每个意图类别对应的概率,所述第二确定模块,具体用于:
提取所述每个向量模型对应的第一识别结果中相同意图类别对应的所有的概率;
计算所述相同意图类别对应的所有的概率的均值,获取每个意图类别的概率;
根据所述每个意图类别的概率确定所述操作指令对应的意图类别。
6.一种电子设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-3中任一所述的意图类别的识别方法。
7.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3中任一所述的意图类别的识别方法。
CN201911245030.8A 2019-12-06 2019-12-06 意图类别的识别方法和装置 Active CN111027667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911245030.8A CN111027667B (zh) 2019-12-06 2019-12-06 意图类别的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911245030.8A CN111027667B (zh) 2019-12-06 2019-12-06 意图类别的识别方法和装置

Publications (2)

Publication Number Publication Date
CN111027667A CN111027667A (zh) 2020-04-17
CN111027667B true CN111027667B (zh) 2023-10-17

Family

ID=70207550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911245030.8A Active CN111027667B (zh) 2019-12-06 2019-12-06 意图类别的识别方法和装置

Country Status (1)

Country Link
CN (1) CN111027667B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763510A (zh) * 2018-05-30 2018-11-06 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN109388793A (zh) * 2017-08-03 2019-02-26 阿里巴巴集团控股有限公司 实体标注方法、意图识别方法及对应装置、计算机存储介质
CN109522556A (zh) * 2018-11-16 2019-03-26 北京九狐时代智能科技有限公司 一种意图识别方法及装置
CN109514586A (zh) * 2019-01-30 2019-03-26 第四范式(北京)技术有限公司 实现智能客服机器人的方法及系统
CN109684626A (zh) * 2018-11-16 2019-04-26 深思考人工智能机器人科技(北京)有限公司 语义识别方法、模型、存储介质和装置
CN109727598A (zh) * 2018-12-28 2019-05-07 浙江省公众信息产业有限公司 大噪音语境下的意图识别方法
CN110147445A (zh) * 2019-04-09 2019-08-20 平安科技(深圳)有限公司 基于文本分类的意图识别方法、装置、设备及存储介质
CN110209805A (zh) * 2018-04-26 2019-09-06 腾讯科技(深圳)有限公司 文本分类方法、装置、存储介质和计算机设备
CN110377911A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 对话框架下的意图识别方法和装置
CN110414005A (zh) * 2019-07-31 2019-11-05 深圳前海达闼云端智能科技有限公司 意图识别方法、电子设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109388793A (zh) * 2017-08-03 2019-02-26 阿里巴巴集团控股有限公司 实体标注方法、意图识别方法及对应装置、计算机存储介质
CN110209805A (zh) * 2018-04-26 2019-09-06 腾讯科技(深圳)有限公司 文本分类方法、装置、存储介质和计算机设备
CN108763510A (zh) * 2018-05-30 2018-11-06 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN109522556A (zh) * 2018-11-16 2019-03-26 北京九狐时代智能科技有限公司 一种意图识别方法及装置
CN109684626A (zh) * 2018-11-16 2019-04-26 深思考人工智能机器人科技(北京)有限公司 语义识别方法、模型、存储介质和装置
CN109727598A (zh) * 2018-12-28 2019-05-07 浙江省公众信息产业有限公司 大噪音语境下的意图识别方法
CN109514586A (zh) * 2019-01-30 2019-03-26 第四范式(北京)技术有限公司 实现智能客服机器人的方法及系统
CN110147445A (zh) * 2019-04-09 2019-08-20 平安科技(深圳)有限公司 基于文本分类的意图识别方法、装置、设备及存储介质
CN110377911A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 对话框架下的意图识别方法和装置
CN110414005A (zh) * 2019-07-31 2019-11-05 深圳前海达闼云端智能科技有限公司 意图识别方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN111027667A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN110021308B (zh) 语音情绪识别方法、装置、计算机设备和存储介质
CN107492379B (zh) 一种声纹创建与注册方法及装置
CN107622770B (zh) 语音唤醒方法及装置
CN106683680B (zh) 说话人识别方法及装置、计算机设备及计算机可读介质
CN108922564B (zh) 情绪识别方法、装置、计算机设备及存储介质
CN109003624B (zh) 情绪识别方法、装置、计算机设备及存储介质
WO2018149209A1 (zh) 语音识别方法、电子设备以及计算机存储介质
CN110197658B (zh) 语音处理方法、装置以及电子设备
CN111401071A (zh) 模型的训练方法、装置、计算机设备和可读存储介质
CN110363220B (zh) 行为类别检测方法、装置、电子设备和计算机可读介质
CN110544473B (zh) 语音交互方法和装置
US11120802B2 (en) Diarization driven by the ASR based segmentation
CN109616101B (zh) 声学模型训练方法、装置、计算机设备和可读存储介质
CN110675862A (zh) 语料获取方法、电子装置及存储介质
US20210142819A1 (en) Method, apparatus, device and computer-readable storage medium for voice interaction
CN111883122A (zh) 语音识别方法及装置、存储介质、电子设备
CN112825249A (zh) 语音处理方法和设备
CN112232276B (zh) 一种基于语音识别和图像识别的情绪检测方法和装置
KR20190024148A (ko) 음성 인식 장치 및 음성 인식 방법
CN111243604B (zh) 支持多唤醒词的说话人识别神经网络模型的训练方法、说话人识别方法及系统
CN112863496B (zh) 一种语音端点检测方法以及装置
CN112148844B (zh) 机器人的信息回复方法及装置
CN111027667B (zh) 意图类别的识别方法和装置
CN110188327B (zh) 文本去口语化方法及装置
EP3161689B1 (en) Derivation of probabilistic score for audio sequence alignment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant