CN111128129B

CN111128129B - 基于语音识别的权限管理方法及装置

Info

Publication number: CN111128129B
Application number: CN201911419422.1A
Authority: CN
Inventors: 黄文强; 季蕴青; 张懂; 胡玮; 易念; 胡传杰; 浮晨琪; 胡路苹; 黄雅楠; 李蚌蚌; 申亚坤; 王畅畅; 徐晨敏
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2022-06-03
Anticipated expiration: 2039-12-31
Also published as: CN111128129A

Abstract

本申请提供了一种基于语音识别的权限管理方法及装置，通过从获取的目标用户的语音信息中提取多个语音特征的特征值，并判断各个特征值，是否落在目标用户的日常语音或被挟持语音的对应的特征值范围内。其中，目标用户的日常语音和被挟持语音的各个特征值范围，预先基于在目标用户未知情的情况下获取到的目标用户的语音信息得到。若判断出落在任意一类日常语音的各个对应的特征值范围内的特征值的数量满足预设数量，则直接为目标用户授权；若判断出落在被挟持语音的各个对应的特征值范围内的特征值的数量满足预设数量，或者判断出落在每个日常语音和被挟持语音的各个对应的特征值范围内的特征值的数量都不满足预设数量，则向上一级发送授权请求。

Description

基于语音识别的权限管理方法及装置

技术领域

本申请涉及权限管理技术领域，特别涉及一种基于语音识别的权限管理方法及装置。

背景技术

现在许多的场所、设备和系统等，用户都需要在被授权后，才能进入或者使用，以保证场所、设备以及系统的安全性。

现在，最常用的一种方式就是通过语音识别的方式，确定是否给用户授权。这种方式通过获取用户当前输入的语音信息，然后将当前的语音信息与预先存储的具有权限的用户的语音信息进行对比，确定当前用户是否为具有权限的用户，并在当前用户为具有权限的用户时进行授权，以让用户进入场所或者系统中。例如，金库通常会通过语音识别的方式判断用户是否为管理员，并在确定用户为管理员后进行授权，以让用户打开金库门，并且不会触发报警。

但是现有在采用语音识别进行授权的方式时，大部分都没考虑到具有权限的用户被挟持的情况。对于部分考虑到被挟持情况的技术，采用的方式是目标用户在被挟持时，可以发出某个预先设定的语音，从而触发报警，但是在被挟持的紧急情况下用户无法控制自己的声音，所以现有技术中通过挟持用户的方式可以很轻易的实现授权。并且，现有在采用语音识别进行授权时，都没有考虑到具有权限的用户监守自盗的情况，从而无法避免具有权限的用户在无其他人或设备的监控时，或与其他监管人员合伙时轻易获得授权，从而造成财物或者数据的损失。所以，现有采用语音识别进行授权的方式存在有缺陷，并不能提供很好的安全保障。

发明内容

基于上述现有技术的不足，本申请提供了一种基于语音识别的权限管理方法及装置，以解决现有技术中采用语音识别的进行鉴权的方式，在具有权限的用户被挟持或者监守自盗的情况下可以轻易授权，从而无法提供很好的安全保障的问题。

为了实现上述目的，本发明提供了以下技术方案：

本申请第一方面提供了一种基于语音识别的权限管理方法，包括：

在目标用户请求授权时，获取所述目标用户的语音信息；

提取所述目标用户的语音信息中的多个语音特征的特征值；

分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；其中，所述目标用户的所述日常语音和所述被挟持语音的各个特征值范围，预先基于在所述目标用户未知情的情况下获取到的所述目标用户的语音信息得到；

若判断出落在任意一类所述日常语音的各个对应的特征值范围内的所述特征值的数量满足预设数量，则直接为所述目标用户授权；

若判断出落在所述被挟持语音的各个对应的特征值范围内的所述特征值的数量满足所述预设数量，或者判断出落在每类所述日常语音和所述被挟持语音的各个对应的特征值范围内的所述特征值的数量都不满足所述预设数量，则向上一级发送授权请求。

可选地，在上述的方法中，所述目标用户的所述日常语音和所述被挟持语音的各个特征值范围的获取方法，包括：

获取所述目标用户的多个日常语音信息以及多个被挟持语音信息；其中，所述日常语音信息为在所述目标用户未知情的情况下，获取的所述目标用户正常工作时输入的与预设文本对应的语音信息；所述被挟持语音信息为在未通知所述目标用户情况下，进行挟持模拟时，获得的所述目标用户被挟持时输入的与所述预设文本对应的语音信息；

分别从每个所述日常语音信息以及每个所述被挟持语音信息中，提取出指定语音特征的特征值；

从提取到的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值，以及确定出所述被挟持语音对应的每个所述指定语音特征的特征值的最大值和最小值。

可选地，在上述的方法中，所述从提取到的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值，包括：

通过对比每个所述日常语音信息的各个所述指定语音特征的特征值，将所述日常语音信息划分为多类所述日常语音；

从属于同一类所述日常语音的所述日常语音信息对应的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值。

可选地，在上述的方法中，所述通过对比每个所述日常语音信息的各个所述指定语音特征的特征值，将所述日常语音信息划分为多类所述日常语音之后，还包括：

分别针对每个所述日常语音信息以及每个所述被挟持语音信息，计算每个所述特征值乘以相应权重值的乘积的总和，得到每个所述日常语音信息以及每个所述被挟持语音信息的整体特征值；

计算每类所述日常语音的对应所述日常语音信息的整体特征值的平均值，得到每类所述日常语音的整体特征值，以及计算所有被挟持语音信息的整体特征值的平均值，得到所述被挟持语音的整体特征值。

可选地，在上述的方法中，所述判断提取到的各个所述特征值，是否落在所述目标用户的日常语音或被挟持语音的各个对应的特征值范围内之前，还包括：

计算提取到的各个所述特征值乘以相应的所述权重值的乘积的总和，得到所述目标用户的当前语音的整体特征值；

判断所有所述日常语音的整体特征值和所述被挟持语音中是否存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值；

其中，若判断出所有所述日常语音的整体特征值和所述被挟持语音中存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值，则执行所述分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；

若判断出所有所述日常语音的整体特征值和所述被挟持语音中不存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值，则执行所述向上一级发送授权请求。

本申请另一方面提供了一种基于语音识别的权限管理装置，包括：

第一获取单元，用于在目标用户请求授权时，获取所述目标用户的语音信息；

第一提取单元，用于提取所述目标用户的语音信息中的多个语音特征的特征值；

第一判断单元，用于分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；其中，所述目标用户的所述日常语音和所述被挟持语音的各个特征值范围，预先基于在所述目标用户未知情的情况下获取到的所述目标用户的语音信息得到；

授权单元，用于在所述第一判断单元判断出落在任意一类所述日常语音的各个对应的特征值范围内的所述特征值的数量满足预设数量时，直接为所述目标用户授权；

上报单元，用于在所述第一判断单元判断出落在所述被挟持语音的各个对应的特征值范围内的所述特征值的数量满足所述预设数量，或者判断出落在每类所述日常语音和所述被挟持语音的各个对应的特征值范围内的所述特征值的数量都不满足所述预设数量时，向上一级发送授权请求。

可选地，在上述的装置中，还包括构建单元，所述构建单元，包括：

第二获取单元，用于获取所述目标用户的多个日常语音信息以及多个被挟持语音信息；其中，所述日常语音信息为在所述目标用户未知情的情况下，获取的所述目标用户正常工作时输入的与预设文本对应的语音信息；所述被挟持语音信息为在未通知所述目标用户情况下，进行挟持模拟时，获得的所述目标用户被挟持时输入的与所述预设文本对应的语音信息；

第二提取单元，用于分别从每个所述日常语音信息以及每个所述被挟持语音信息中，提取出指定语音特征的特征值；

确定单元，用于从提取到的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值，以及确定出所述被挟持语音对应的每个所述指定语音特征的特征值的最大值和最小值。

可选地，在上述的装置中，所述确定单元执行所述从提取到的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值时，用于：通过对比每个所述日常语音信息的各个所述指定语音特征的特征值，将所述日常语音信息划分为多类所述日常语音，以及从属于同一类所述日常语音的所述日常语音信息对应的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值。

可选地，在上述的装置中，还包括：

第一计算单元，用于分别针对每个所述日常语音信息以及每个所述被挟持语音信息，计算每个所述特征值乘以相应权重值的乘积的总和，得到每个所述日常语音信息以及每个所述被挟持语音信息的整体特征值；

第二计算单元，用于计算每类所述日常语音的对应所述日常语音信息的整体特征值的平均值，得到每类所述日常语音的整体特征值，以及计算所有被挟持语音信息的整体特征值的平均值，得到所述被挟持语音的整体特征值。

可选地，在上述的装置中，还包括：

第三计算单元，用于计算提取到的各个所述特征值乘以相应的所述权重值的乘积的总和，得到所述目标用户的当前语音的整体特征值；

第二判断单元，用于判断所有所述日常语音的整体特征值和所述被挟持语音中是否存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值；

其中，在所述第二判断单元判断出所有所述日常语音的整体特征值和所述被挟持语音中存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，所述第一判断单元执行所述分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；

在所述第二判断单元判断出所有所述日常语音的整体特征值和所述被挟持语音中不存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，所述上报单元执行所述向上一级发送授权请求。

本申请提供的一种基于语音识别的权限管理装置，预先在目标用户未知情的情况下获取目标用户的语音信息，然后基于目标用户的语音信息得到目标用户的多类日常语音和被挟持语音的各个语音特征的特征值范围。在目标用户申请授权时，从获取到的目标用户的语音信息中，提取出多个语音特征的特征值，并提取到的各个特征值，是否落在目标用户的日常语音或被挟持语音的各个特征值范围内。若判断出落在任意一类日常语音的各个特征值范围内的特征值的数量满足预设数量，则可以说明目标用户在正常进行语音识别，所以直接为目标用户授权。若判断出落在被挟持语音的各个特征值范围内的特征值的数量满足预设数量，则说明目标用户当前极有可能处于被挟持状态下，所以为了保证安全此时需要向上一级系统发送授权请求，以便有上一级系统在确认后授权，从而避免了出现目标用户在被挟持时进行授权的情况。同样，在判断出落在日常语音和被挟持语音的特征值范围内的特征值的数量都不满足预设数量，说明目标用户的既不是在正常进行语音识别授权，也不是被挟持下请求授权，所以有很大概率说明目标用户可能在监守自盗，所以此时需要向上一级发送授权请求，以便有上一级再次进行确认后授权，避免了出现目标用户在监守自盗时，为目标用户授权的情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种目标用户的日常语音和被挟持语音的各个特征值范围的获取方法的流程示意图；

图2为本申请另一实施例提供的另一种目标用户的日常语音和被挟持语音的各个特征值范围的获取方法的流程示意图；

图3为本申请另一实施例提供的一种基于语音识别的权限管理方法的流程示意图；

图4为本申请另一实施例提供的另一种基于语音识别的权限管理方法的流程示意图；

图5为本申请另一实施例提供的一种基于语音识别的权限管理装置的结构示意图；

图6为本申请另一实施例提供的一种构建单元的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本申请实施例提供了一种基于语音识别的权限管理方法，以解决现有技术中采用语音识别的进行鉴权的方式，在具有权限的用户被挟持或者监守自盗的情况下可以轻易授权，从而无法提供很好的安全保障的问题。

首先需要说明的是，要实现本申请实施例提供的基于语音识别的权限管理方法，需要预先构建目标用户的语音库。其中，目标用户指的是具有权限的用户，例如金库的管理员、维护公司后台资源系统的程序员等具有权限进入到需要授权才能进入的系统、应用或场所中的用户。

在本发明实施例中权限用户的语音库中至少包括每个目标用户的日常语音和被挟持语音的各个特征值范围。可选地，本申请的另一实施例提供了一种目标用户的日常语音和被挟持语音的各个特征值范围的获取方法，如图1所示，包括：

S101、获取目标用户的多个日常语音信息以及多个被挟持语音信息。

其中，日常语音信息为在目标用户未知情的情况下，获取的目标用户正常工作时输入的与预设文本对应的语音信息。被挟持语音信息为在未通知目标用户情况下，进行挟持模拟时，获得的目标用户被挟持时输入的与预设文本对应的语音信息。

具体的，预设文本指的是预设的用于授权时用户必须以语音的方式输入的与该文本对应的语音，即我们通俗所理解的暗号。所以用户在授权时，需要读出该预设文本，以输入与预设文本对应的语音信息。

需要说明是，在目标用户未知情的情况下，获取目标用户的语音信息，是为了避免目标用户在知情的情况下，所发出的语音不自然也不真实，从而无法反映用户在日常情况下语音或真正被挟持时的语音。同样也为了避免目标用户刻意发出某种语音，从而在后续进行违规的授权操作。

其中，日常语音信息指的是目标用户在日常的正常授权过程中，进行语音识别授权时所输入的语音信息。由于，人的心情、所处的环境以及人的喉咙的健康状态都会在一定程度上影响声音的语速、语调等。所以目标用户在日常的工作生活中，每次授权时输入的语音会存在多样的声音，因此为了能获得目标用户的每样声音的各个特征值范围，所获取的目标用户的日常语音信息的数量需要足够的多，并且时间的跨度也应该足够的长。

被挟持语音信息则指的是目标用户在被挟持情况下进行授权时，输入的与预设文本对应的语音信息。由于，人在被挟持时无法控制自己的语速、语调等，所以只会本能的发出一种类型的声音。

具体的，目标用户的日常语音信息从目标用户在日常每次进行语音识别授权时，通过麦克风获取到。对于目标用户的被挟持语音信息，可以在用户不知情的情况下，进行挟持演练，然后获取目标用户被挟持进行语音识别授权时，所录到的目标用户的多个语音信息。

S102、分别从每个日常语音信息以及每个被挟持语音信息中，提取出指定语音特征的特征值。

具体的，指定语音特征可以包括基频、能量、语速、语调、共振峰频率、单个音节的持续时间、音节间的停顿时间，以及需要计算得到的线性预测系数、梅尔频率倒谱系数等关于语音的特征。

需要说明的是，对于每个语音信息需要提取相同的指定语音特征的特征值。

S103、从提取到的指定语音特征的特征值中，确定出每类日常语音对应的每个指定语音特征的特征值的最大值和最小值，以及确定出被挟持语音的每个指定语音特征对应的特征值的最大值和最小值。

由于目标用户在日常中输入的语音信息，会因为心情、健康状态等因素的影响，使得在同一语音特征上的特征值的差距可以能比较大，所以获取的日常语音信息可以划分为多个类别，再分别确定每个类别的日常语音对应的特征值范围。

并且，因为目标用户在相同的条件下所发出的语音，也无法保证语音的语音特征都一样，所以同一类日常语音的不同日常语音信息的同一语音特征的特征值会，存在一定程度上的差异，所以每类日常语音对应的每个指定语音特征的特征值会存在最大值和最小值。

可选地，可以先通过对比每个日常语音信息的各个指定语音特征的特征值，将日常语音信息划分为多类日常语音，然后从属于同一类日常语音的日常语音信息对应的指定语音特征的特征值中，确定出每类日常语音对应的每个指定语音特征的特征值的最大值和最小值。其中，所确定出的特征值的最大值和最小值即为对应类别的日常语音在对应的指定语音特征上的特征值范围。

具体可以是将特征值的差值在预设范围内的语音特征，确定为相似语音特征，若两个日常语音信息间的显示语音特征的数量满足要求的数量，则将两个语音信息归为同一类。以此类推，通过日常语音信息间的两两对比，最终将获取到的日常语音信息划分为多类。可选地，若一个类别下的日常语音信息的数量过长，例如只有一个，则可以将该类别下的日常语音信息以及对应的特征值删除。

当然这只是其中一种可选地的分类方式，也可以采用其他的分类方式，例如，基于每个日常语音信息的各个语音特征的特征值，通过聚类算法将日常语音信息进行分类。这都应属于本发明的保护范畴。

由于不同被挟持语音信息的特征值的差距不会太大，所以被挟持语音信息都属于同一类语音，所以可以不同进行分类。同样，针对被挟持语音对应的每个指定语音特征，确定出被挟持语音的各个指定语音特征的特征值的最大值和最小值，并将确定出的最大值和最小值，设置为相应的各个语音特征对应的特征值范围，并将各个特征值范围存储到语音库中。

可选地，本申请另一实施例中，在通过对比每个日常语音信息的各个指定语音特征的特征值，将日常语音信息划分为多类日常语音之后，还可以进一步去获取到各类语音的整体特征值，如图2所示，具体包括：

S201、分别针对每个日常语音信息以及每个被挟持语音信息，计算每个特征值乘以相应权重值的乘积的总和，得到每个日常语音信息以及每个被挟持语音信息的整体特征值。

可选地，语音特征对应的权重值的大小取决于语音特征对于语音的区分度的决定性，所以语音特征对于语音的区分度的决定性越大，则设置该语音特征的特征值所对应的权重值就越大，例如，语速特征的特征值对应的权重值比音量特征的特征值对应的权重值大。

S202、计算每类日常语音的对应日常语音信息的整体特征值的平均值，得到每类日常语音的整体特征值，以及计算所有被挟持语音信息的整体特征值的平均值，得到被挟持语音的整体特征值。

需要说明的是步骤S201和步骤S202可以在步骤S103前执行，也可以是在执行步骤S103后执行，又或者和步骤S103分别同时执行。

基于上述实施例中方法，构建得到目标用户的语音库，本申请另一实施例提供了一种基于语音识别的权限管理方法，如图3所示，包括：

S301、在目标用户请求授权时，获取目标用户的语音信息。

具体的，在用户通过语音识别请求授权时，获取目标用户的语音信息。

由于在进行语音识别时，通常是让用户读出预设文本的内容，而预设文本通常只有具有权限的用户才知道。所以可选地，在获取目标用户的语音信息后，可以先将语音信息转换为文本，并判断转换的文本中是否包含有与预设文本一致的内容，从而初步判断目标用户是否具有权限。并在断转换的文本中包含有与预设文本一致的内容时，执行步骤S302。

S302、提取目标用户的语音信息中的多个语音特征的特征值。

需要说明的是，提取的目标用户的多个语音特征与进行语音库构建时，所指定的语音特征是相同。

可选地，所提取的目标用户的多个语音特征的特征值可以先用于目标用户的身份认证，以判断目标用户是否为具有权限的用户。在目标用户通过身份认证后，才执行步骤S303，从而有效地提高授权的效率。

可选地，当预先构建的目标用户的语音库中还包括有各个语音的整体特征值时，本申请的另一实施例中，在执行步骤S303之前，如图4所示，还可以进一步包括：

S401、计算提取到的各个特征值乘以相应的权重值的乘积的总和，得到目标用户的当前语音的整体特征值。

需要说明的是，本步骤中的各个语音特征对应的权重值与构建语音库时，计算日常语音以及被挟持语音的整体特征值时，采用的各个权重值相同的。

S402、判断所有日常语音的整体特征值和被挟持语音中是否存与目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值。

需要说明的是，判断所有日常语音的整体特征值和被挟持语音中是否存与目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值，是为了能先大致的判断出目标用户的当前语音是否可能属于日常语音或者是否属于被挟持语音。所以，若判断出日常语音的整体特征值中和被挟持语音的整体特征值中存与目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值，则说明目标用户的当前语音的可能属于日常语音或者被挟持语音，所以此时执行步骤S403：分别针对目标用户对应的每类日常语音以及被挟持语音，判断落在日常语音或被挟持语音的各个对应的特征值范围内的特征值的数量是否满足预设数量，即此时执行步骤S303，以最终确定目标用户的当前语音是否属于日常语音或者是否属于被挟持语音。

在判断出所有日常语音的整体特征值和被挟持语音中不存与目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，则说明目标用户的当前语音不属于日常语音也不属于被挟持语音，没有必要再做进一步的判断，所以此时执行步骤S404：向上一级发送授权请求，即直接执行步骤S305，从而能有效地提高授权效率。

S303、分别针对目标用户对应的每类日常语音以及被挟持语音，判断落在日常语音或被挟持语音的各个对应的特征值范围内的特征值的数量是否满足预设数量。

其中，目标用户的日常语音和被挟持语音的各个特征值范围，预先基于在目标用户未知情的情况下获取到的目标用户的语音信息得到。

具体的，从语音库中查找到与目标用户对应的日常语音和被挟持语音的各个特征值范围，然后分别针对每类日常语音和被挟持语音，依次判断提取到的目标用户的各个特征值是否落在对应的语音特征的特征值范围内，以确定目标用户当前的语音是否属于某类日常语音，或者是否属于被挟持语音。

需要说明的是，若执行步骤S303判断出提取到的特征值落在某类日常语音的各个对应的特征值范围内的数量满足预设数量，则说明目标用户当前的语音信息属于为该类日常语音，所以此时执行步骤S304。即判断出落在任意一类日常语音的各个对应的特征值范围内的特征值的数量满足预设数量，则执行步骤S304。其中，预设数据量可以是所有特征值范围的数量，也可以稍微小于特征值范围的数量的值。

若判断出落在被挟持语音的各个对应的特征值范围内的特征值的数量满足预设数量，则说明目标用户当前极有可能是在被挟持情况下进行授权，所以此时执行步骤S305。若判断出落在每类日常语音和落在被挟持语音的各个对应的特征值范围内的特征值的数量都不满足预设数量，则说明目标用户当前的语音信息不属于日常语音也不属于被挟持语音，是一个全新的语音类别，所以此时用户极有可能在监守自盗。因为人在监守自盗时的所呈现的语音，与日常语音和被挟持语音是不同的，并且语音库中包括有大量的日常语音的语音特征数据和被挟持语音的语音特征数据，但没有目标用户在监守自盗时的语音特征数据，所以当判断出目标用户当前的语音不属于日常语音和被挟持语音时，说明目标用户当前的语音有很大概率为监守自盗的语音，所以为了保证安全，此时执行步骤S305。

S304、直接为目标用户授权。

由于，用户只是在正常的进行授权，所以可以直接为目标用户授权。

S305、向上一级发送授权请求。

由于，此时用户有很大概率是被挟持中，或者是在监守自盗，但是由于无法百分百确认，所以为了避免误报警，此时是先上一级系统发送授权请求。

其中，授权请求中可以包括有判断结果，例如包括有“被挟持”或“监守自盗”的判断结果。还可以包括有目标用户进行人脸识别时的场景视频，以便管理上一级系统的人员，通过场景视频确定目标用户是真的被挟持或者是否真的在监守自盗，来决定是给进行授权操作，以给目标用户授权，还是选择报警操作，以触发报警。

可选地，若确定目标用户为正常进行语音识别授权，则将目标用户当前的语音信息的各个语音特征的特征值更新到语音库中，形成建立一个类型的日常语音。

本申请另一种基于语音识别的权限管理装置，如图5所示，包括：

第一获取单元501，用于在目标用户请求授权时，获取目标用户的语音信息。

第一提取单元502，用于提取所述目标用户的语音信息中的多个语音特征的特征值。

第一判断单元503，用于分别针对目标用户对应的每类日常语音以及被挟持语音，判断落在日常语音或被挟持语音的各个对应的特征值范围内的特征值的数量是否满足预设数量。

授权单元504，用于在第一判断单元503判断出落在任意一类日常语音的各个对应的特征值范围内的特征值的数量满足预设数量时，直接为目标用户授权。

上报单元505，用于在第一判断单元503判断出落在被挟持语音的各个对应的特征值范围内的特征值的数量满足预设数量，或者判断出落在每类日常语音和被挟持语音的各个对应的特征值范围内的特征值的数量都不满足预设数量时，向上一级发送授权请求。

需要说明的是，本申请实施例中的上述单元的具体工作过程可相应地参考上述方法实施例中的步骤S301～步骤S305，此处不再赘述。

可选地，本申请另一实施例中，基于语音识别的权限管理装置还包括构建单元。如图6所示，构建单元，包括：

第二获取单元601，用于获取目标用户的多个日常语音信息以及多个被挟持语音信息。

其中，日常语音信息为在目标用户未知情的情况下，获取的目标用户正常工作时输入的与预设文本对应的语音信息；被挟持语音信息为在未通知目标用户情况下，进行挟持模拟时，获得的目标用户被挟持时输入的与预设文本对应的语音信息。

第二提取单元602，用于分别从每个日常语音信息以及每个被挟持语音信息中，提取出指定语音特征的特征值。

确定单元603，用于从提取到的指定语音特征的特征值中，确定出每类日常语音对应的每个指定语音特征的特征值的最大值和最小值，以及确定出被挟持语音对应的每个指定语音特征的特征值的最大值和最小值。

需要说明的是，本申请实施例中的上述单元的具体工作过程可相应地参考上述方法实施例中的步骤S101～步骤S103，此处不再赘述。

可选地，本申请另一实施例中，确定单元603执行从提取到的指定语音特征的特征值中，确定出每类日常语音对应的每个指定语音特征的特征值的最大值和最小值时，用于：通过对比每个日常语音信息的各个指定语音特征的特征值，将日常语音信息划分为多类日常语音，以及从属于同一类日常语音的日常语音信息对应的指定语音特征的特征值中，确定出每类日常语音对应的每个指定语音特征的特征值的最大值和最小值。

需要说明的是，确定单元603在实现上述功能的时的具体工作过程可相应地参考上述方法实施例中的步骤S103的具体实施过程，此处不再赘述。

可选地，本申请另一实施例中，构建单元还包括：

第一计算单元，用于分别针对每个日常语音信息以及每个被挟持语音信息，计算每个特征值乘以相应权重值的乘积的总和，得到每个日常语音信息以及每个被挟持语音信息的整体特征值。

第二计算单元，用于计算属于同一类日常语音的日常语音信息的整体特征值的平均值，得到每类日常语音的整体特征值，以及计算所有被挟持语音信息的整体特征值的平均值，得到被挟持语音的整体特征值。

需要说明的是，本申请实施例中的上述单元的具体工作过程可相应地参考上述方法实施例中的步骤S201～步骤S202，此处不再赘述。

可选地，本申请另一实施例中，基于语音识别的权限管理装置还包括：

第三计算单元，用于计算提取到的各个特征值乘以相应的权重值的乘积的总和，得到目标用户的当前语音的整体特征值。

第二判断单元，用于判断所有日常语音的整体特征值和被挟持语音中是否存与目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值。

其中，在所述第二判断单元判断出所有所述日常语音的整体特征值和所述被挟持语音中存与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，第一判断单元503执行分别针对目标用户对应的每类日常语音以及被挟持语音，判断落在日常语音或被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量。

在所述第二判断单元判断出所有日常语音的整体特征值和被挟持语音中不存与目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，上报单元505执行所述向上一级发送授权请求。

需要说明的是，本申请实施例中的上述单元的具体工作过程可相应地参考上述方法实施例中的步骤S401～步骤S402，此处不再赘述。

本申请实施例提供的基于语音识别的权限管理装置，通过构建单元在目标用户未知情的情况下获取目标用户的语音信息，然后基于目标用户的语音信息得到目标用户的多类日常语音和被挟持语音的各个语音特征的特征值范围。在目标用户申请授权时，第一提取单元从获取到的目标用户的语音信息中，提取出多个语音特征的特征值，并由第一判断单元判断提取到的各个特征值，是否落在目标用户的日常语音或被挟持语音的各个特征值范围内。若判断出落在任意一类日常语音的各个特征值范围内的特征值的数量满足预设数量，则可以说明目标用户在正常进行语音识别，所以直接为目标用户授权。若判断出落在被挟持语音的各个特征值范围内的特征值的数量满足预设数量，则说明目标用户当前极有可能处于被挟持状态下，所以为了保证安全此时需要向上一级系统发送授权请求，以便有上一级系统在确认后授权，从而避免了出现目标用户在被挟持时进行授权的情况。同样，在判断出落在日常语音和被挟持语音的特征值范围内的特征值的数量都不满足预设数量，说明目标用户的既不是在正常进行语音识别授权，也不是被挟持下请求授权，所以有很大概率说明目标用户可能在监守自盗，所以此时需要向上一级发送授权请求，以便有上一级再次进行确认后授权，避免了出现目标用户在监守自盗时，为目标用户授权的情况。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于语音识别的权限管理方法，其特征在于，包括：

在目标用户请求授权时，获取所述目标用户的语音信息；

提取所述目标用户的语音信息中的多个语音特征的特征值；

分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；

若判断出落在所述被挟持语音的各个对应的特征值范围内的所述特征值的数量满足所述预设数量，或者判断出落在每类所述日常语音和所述被挟持语音的各个对应的特征值范围内的所述特征值的数量都不满足所述预设数量，则向上一级发送授权请求；

其中，所述目标用户的所述日常语音和所述被挟持语音的各个特征值范围的获取方法，包括：

2.根据权利要求1所述的方法，其特征在于，所述从提取到的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过对比每个所述日常语音信息的各个所述指定语音特征的特征值，将所述日常语音信息划分为多类所述日常语音之后，还包括：

分别针对每个所述日常语音信息以及每个所述被挟持语音信息，计算每个所述特征值乘以相应权重值的乘积的总和，得到每个所述日常语音信息以及每个所述被挟持语音信息的加权特征值；

计算每类所述日常语音的对应所述日常语音信息的加权特征值的平均值，得到每类所述日常语音的整体特征值，以及计算所有所述被挟持语音信息的加权特征值的平均值，得到所述被挟持语音的整体特征值。

4.根据权利要求3所述的方法，其特征在于，所述分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量之前，还包括：

判断所有类别所述日常语音的整体特征值和所述被挟持语音中的整体特征值是否存在与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值；

其中，若判断出所有类别所述日常语音的整体特征值和所述被挟持语音中的整体特征值存在与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值，则执行所述分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；

若判断出所有类别所述日常语音的整体特征值和所述被挟持语音中的整体特征值不存在与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值，则执行所述向上一级发送授权请求。

5.一种基于语音识别的权限管理装置，其特征在于，包括：

第一判断单元，用于分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；

上报单元，用于在所述第一判断单元判断出落在所述被挟持语音的各个对应的特征值范围内的所述特征值的数量满足所述预设数量，或者判断出落在每类所述日常语音和所述被挟持语音的各个对应的特征值范围内的所述特征值的数量都不满足所述预设数量时，向上一级发送授权请求；

构建单元，所述构建单元，包括：

6.根据权利要求5所述的装置，其特征在于，所述确定单元执行所述从提取到的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值时，用于：通过对比每个所述日常语音信息的各个所述指定语音特征的特征值，将所述日常语音信息划分为多类所述日常语音，以及从属于同一类所述日常语音的所述日常语音信息对应的所述指定语音特征的特征值中，确定出每类所述日常语音对应的每个所述指定语音特征的特征值的最大值和最小值。

7.根据权利要求6所述的装置，其特征在于，还包括：

第一计算单元，用于分别针对每个所述日常语音信息以及每个所述被挟持语音信息，计算每个所述特征值乘以相应权重值的乘积的总和，得到每个所述日常语音信息以及每个所述被挟持语音信息的加权特征值；

第二计算单元，用于计算每类所述日常语音的对应所述日常语音信息的加权特征值的平均值，得到每类所述日常语音的整体特征值，以及计算所有所述被挟持语音信息的加权特征值的平均值，得到所述被挟持语音的整体特征值。

8.根据权利要求7所述的装置，其特征在于，还包括：

第二判断单元，用于判断所有类别所述日常语音的整体特征值和所述被挟持语音中的整体特征值是否存在与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值；

其中，在所述第二判断单元判断出所有类别所述日常语音的整体特征值和所述被挟持语音中的整体特征值存在与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，所述第一判断单元执行所述分别针对所述目标用户对应的每类日常语音以及被挟持语音，判断落在所述日常语音或所述被挟持语音的各个对应的特征值范围内的所述特征值的数量是否满足预设数量；

在所述第二判断单元判断出所有类别所述日常语音的整体特征值和所述被挟持语音中的整体特征值不存在与所述目标用户的当前语音的整体特征值的差值小于预设阈值的整体特征值时，所述上报单元执行所述向上一级发送授权请求。