CN106100846B

CN106100846B - 声纹注册、认证方法及装置

Info

Publication number: CN106100846B
Application number: CN201610389161.3A
Authority: CN
Inventors: 吴本谷; 李超; 关勇
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2016-06-02
Filing date: 2016-06-02
Publication date: 2019-05-03
Anticipated expiration: 2036-06-02
Also published as: CN106100846A

Abstract

本发明公开了一种声纹注册、认证方法及装置。其中，方法包括：分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；融合多种类型的声纹特征，建立用户的注册声纹模型。该方法通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

Description

声纹注册、认证方法及装置

技术领域

本发明涉及语音处理技术领域，尤其涉及一种声纹注册、认证方法及装置。

背景技术

目前，为了保证用户个人信息的安全性等，很多应用首先需要认证用户的合法性。比如，用户在使用百度贴吧时，百度贴吧可根据用户输入的用户名和密码认证用户的合法性。

相关技术中，相关应用仅仅根据用户输入的用户名和密码认证用户的合法性，不能识别进行认证的用户是否是注册用户本人，当他人获取注册用户的用户名和密码后，也可被认证为合法用户，从而获取注册用户的用户信息，不能保证用户信息的安全性。

发明内容

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此，本发明的第一个目的在于提出一种声纹注册方法，该方法通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

本发明的第二个目的在于提出一种声纹认证方法。

本发明的第三个目的在于提出一种声纹注册装置。

本发明的第四个目的在于提出一种声纹认证装置。

为了实现上述目的，本发明第一方面实施例提出了一种声纹注册方法，包括：分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；融合所述多种类型的声纹特征，建立所述用户的注册声纹模型。

本发明实施例的声纹注册方法，分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，并融合多种类型的声纹特征，建立用户的注册声纹模型。该方法通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

另外，本发明实施例的声纹注册方法具有如下附加的技术特征：

在本发明的一个实施例中，所述声纹特征的类型，包括：MFCC特征、PLP特征。

在本发明的一个实施例中，所述融合所述多种类型的声纹特征，建立所述用户的注册声纹模型，包括：根据预设的与所述多种类型的声纹特征分别对应的权重信息，融合所述多种类型的声纹特征，建立所述用户的注册声纹模型。

为了实现上述目的，本发明第二方面实施例提出了一种声纹认证方法，包括以下步骤：提取与用户输入的认证语料对应的多种类型的声纹特征；融合所述多种类型的声纹特征获取与用户标识对应的认证声纹模型；将预存的所述用户的注册声纹模型与所述认证声纹模型进行匹配，根据匹配结果检测所述用户的合法性。

本发明实施例的声纹认证方法，提取与用户输入的认证语料对应的多种类型的声纹特征，并融合该多种声纹特征以获取与用户标识对应的认证声纹模型，进而将预存的用户的注册声纹模型与认证声纹模型进行匹配，并根据匹配结果检测用户的合法性。该方法通过融合多种声纹模型建立认证声纹模型认证用户的合法性，提高了认证用户的合法性的可靠性和便捷性。

另外，本发明实施例的声纹认证方法具有如下附加的技术特征：

在本发明的一个实施例中，所述将预存的所述用户标识对应的注册声纹模型与所述认证声纹模型进行匹配，根据匹配结果检测所述用户的合法性，包括：如果所述注册声纹模型与所述认证声纹模型的匹配度大于等于预设阈值，则确定所述用户合法；如果所述注册声纹模型与所述认证声纹模型的匹配度小于所述预设阈值，则确定所述用户非法。

为了实现上述目的，本发明第三面实施例提出了一种声纹注册装置，包括：第一提取模块，用于分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；建立模块，用于融合所述多种类型的声纹特征，建立所述用户的注册声纹模型。

本发明实施例的声纹注册装置，分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，并融合多种类型的声纹特征，建立用户的注册声纹模型。该装置通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

另外，本发明实施例的声纹注册装置，还具有如下附加的技术特征：

在本发明的一个实施例中，所述建立模块用于：根据预设的与所述多种类型的声纹特征分别对应的权重信息，融合所述多种类型的声纹特征，建立所述用户的注册声纹模型。

为了实现上述目的，本发明第四面实施例提出了一种声纹认证装置，包括：第二提取模块，用于提取与用户输入的认证语料对应的多种类型的声纹特征；获取模块，用于融合所述多种类型的声纹特征获取与用户标识对应的认证声纹模型；检测模块，用于将预存的所述用户的注册声纹模型与所述认证声纹模型进行匹配，根据匹配结果检测所述用户的合法性。

本发明实施例的声纹认证装置，提取与用户输入的认证语料对应的多种类型的声纹特征，并融合该多种声纹特征以获取与用户标识对应的认证声纹模型，进而将预存的用户的注册声纹模型与认证声纹模型进行匹配，并根据匹配结果检测用户的合法性。该装置通过融合多种声纹模型建立认证声纹模型认证用户的合法性，提高了认证用户的合法性的可靠性和便捷性。

另外，本发明实施例的声纹认证装置，还具有如下附加的技术特征：

在本发明的一个实施例中，所述检测模块用于：在所述注册声纹模型与所述认证声纹模型的匹配度大于等于预设阈值时，确定所述用户合法；以及在所述注册声纹模型与所述认证声纹模型的匹配度小于所述预设阈值时，确定所述用户非法。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本发明一个实施例的声纹注册方法的流程图；

图2是根据本发明一个具体实施例的注册声纹模型的处理流程图；

图3是根据本发明一个具体实施例的声纹认证方法的流程图；

图4是根据本发明一个具体实施例的认证声纹模型的处理流程图；

图5是根据本发明一个实施例的声纹注册装置的结构示意图；以及

图6是根据本发明一个实施例的声纹认证装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的声纹注册、认证方法及装置。

图1是根据本发明一个实施例的声纹注册方法的流程图。

如图1所示，该声纹注册方法可包括：

S110，分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1。

可以理解，由于在相关应用或者网页进行登录时，传统的认证用户合法性的方式，不能保证进行认证的用户是注册用户本人。例如，只要获取注册用户的用户名和密码，任何用户都可以被认证为合法用户，不利于保护用户信息的安全。

因此，为了避免上述问题，提高认证用户合法性的可靠性，保护用户信息的安全，本发明实施例的声纹注册方法，利用每个用户的声纹特征的不同，即利用用户说话时的声波频谱的不同，根据每个用户的声纹特征进行声纹注册，从而根据用户的声纹特征可准确认证用户的合法性。

优选地，在实际应用中，为了进一步提高根据声纹特征认证用户合法性的可靠性，避免在有其他噪声干扰的环境下，只使用一种声纹特征认证用户的合法性带来的性能低下的问题，本发明实施例的声纹注册方法，提取用户的多种类型的声纹特征进行融合，从而根据多种类型的声纹特征认证用户的合法性。

具体而言，在用户针对相关应用等进行注册的时候，可提示用户朗读N(N>1)句话，进而分别提取与用户输入的N句注册语料对应的多种类型的声纹特征。

其中需要说明的是，根据具体应用场景的不同，可采用多种方式提取用户输入的N句注册语料对应的多种类型的声纹特征。比如可在用户注册的应用本地，根据相关算法提取用户输入的N句注册语料对应的多种类型的声纹特征；又比如，可将用户输入的N句注册语料发送至多个相关服务器，以通过多个相关服务器提取用户输入的N句注册语料对应的多种类型的声纹特征等。

为了更加清楚的说明，如何提取用户输入的N句注册语料对应的多种类型的声纹特征，下面以通过多个相关服务器提取用户输入的N句注册语料对应的多种类型的声纹特征举例说明，说明如下：

在本示例中，提取用户输入的N句注册语料对应的多种类型的声纹特征的服务器是基于MFCC(Mel Frequency Cepstral Coefficients，梅尔频率倒谱系数)特征、PLP(Perceptual Linear Predictive，感知线性预测系数)特征的声纹服务器。

从而，上述声纹服务器在接收到用户输入的第一句到第N句语料后，分别提取用户输入的第一句到第N句语料对应的MFCC特征、PLP特征等。

S120，融合多种类型的声纹特征，建立用户的注册声纹模型。

具体地，在提取出N句注册语料对应的用户的多种类型的声纹特征后，融合多种类型的声纹特征并建立用户的注册声纹模型，以便于进一步根据该声纹模型认证用户的合法性。

具体而言，根据具体应用需求的不同，可采用多种方式融合多种类型的声纹特征以建立用户的注册声纹模型。

作为一种示例，可以计算第一句到第N句的语料对应的每个类型的声纹特征对应的声纹识别向量值(Indentify Vector,i-vector)，并将得到的第一句到第N句的语料对应的相同类型的声纹特征对应的声纹识别向量值，相加并求取平均值得到每个相同类型的声纹特征对应的i-vector平均值，比如将第一句到第N局的语料对应的a类型的声纹特征的N个i-vector相加后取平均，从而将该多个类型的声纹特征的多个i-vector平均值进行融合处理，建立用户的注册声纹模型。

作为一种示例，为了提高建立用户的注册声纹模型的效率，在融合多种类型的声纹特征时，可预先针对每个类型的声纹特征设置相关运算模型，该运算模型集成针对多个类型的声纹特征的多个算法，进而根据运算模型，对第一句到第N句的语料对应的每个类型的声纹特征分别运算。

为了更加清楚的说明如何融合多种类型的声纹特征，建立用户的注册声纹模型，下面举例进行说明，在该示例中，预先训练好针对每个类型的声纹特征的权重信息，并根据该权重信息对多种类型的声纹特征进行处理，说明如下：

在本示例中，将用户输入的第一句注册语料对应的每个类型的声纹特征乘以对应的权重值，得到每个类型的声纹特征对应的i-vector值，并对每个类型的声纹特征对应的i-vector进行融合得到第一句注册语料的i-vector值，以此类推，得到第二句到第N句用户输入的注册语料i-vector值，进而对得到的第一句到第N句用户输入的注册语料i-vector值求平均，并根据该平均后的i-vector值得到用户的注册声纹模型。

需要说明的是，建立注册声纹模型时采集的用户输入的注册语料越多，即上述N值越大，获得的注册声纹模型越稳定。

为了使得本领域的技术人员更加清楚的了解本发明实施例的声纹注册方法，下面结合图2举例说明注册声纹模型的处理流程，在该示例中，提取多种类型的声纹特征的是基于MFCC的声纹验证服务器A，以及基于PLP的声纹验证服务器B，且进行多种类型的声纹特征融合的是特征融合服务器C，说明如下：

如图2所示，当用户在客户端上输入注册语料时，A和B提取该语料的MFCC特征和PLP特征，进而C对MFCC特征和PLP特征进行融合，比如分别对MFCC特征和PLP特征乘以与其分别对应的权重信息，进而得到MFCC特征和PLP特征的i-vector值，从而对得到的该i-vector值进行融合处理，建立用户的注册声纹模型。

综上所述，本发明实施例的声纹注册方法，分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，并融合多种类型的声纹特征，建立用户的注册声纹模型。该方法通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

为了实现上述实施例，本发明还提出了一种声纹认证方法。

图3是根据本发明一个具体实施例的声纹认证方法的流程图。如图3所示，该声纹认证方法包括：

S310，提取与用户输入的认证语料对应的多种类型的声纹特征。

具体而言，在本发明的实施例中，用户在登录相关应用或者网页时，会输入相关认证语料，比如输入几句语音信息等，为了认证该用户是否是注册的用户，需要提取与用户输入的认证语料对应的多种类型的声纹特征，比如可提取该语料的MFCC特征、PLP特征等。

S320，融合多种类型的声纹特征获取与用户标识对应的认证声纹模型。

具体地，在提取用户输入的认证语料的多种类型的声纹特征后，融合多种类型的声纹特征以获取该认证用户的认证声纹模型。

其中，上述认证声纹模型与可标识注册的用户唯一性的用户标识对应，比如与注册用户的ID(Indentify，身份)对应。

需要强调的是，上述对提取用户输入的认证语料的多种类型的声纹特征进行融合处理的方式，与上述实施例描述的对提取的与用户输入的N句注册语料对应的多种类型的声纹特征，进行融合处理的方式相同，即可根据具体应用场景的不同，选择不同的融合处理方式，在此不再赘述。

S330，将预存的用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果检测用户的合法性。

具体地，根据用户标识获取预先存储的注册的用户的注册声纹模型，并将该用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果认证用户的合法性。

其中，根据具体应用需求的不同，可在不同的场景下将该用户的注册声纹模型与认证声纹模型进行匹配，并根据匹配结果认证用户的合法性。

作为一种示例，可在用户认证的相关应用本地，将该用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果认证用户的合法性。

作为一种示例，可通用将该用户的注册声纹模型与认证声纹模型上传至相关服务器，在该服务器将该用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果认证用户的合法性等。

更具体地，根据具体应用场景的不同，可采用不同的匹配方法将用户的注册声纹模型与认证声纹模型进行匹配，以认证用户的合法性。

作为一种示例，可预先针对用户的注册声纹模型与认证声纹模型设置匹配运算模型，该运算模型可根据运算结果直接输出是或否来表示用户是否为合法用户。

作为一种示例，可针对注册声纹模型与认证声纹模型设置匹配度进行打分，根据打分结果认证用户的合法性，如果分数高于一定值，则判断该用户合法，如果分数低于一定值，则判断该用户非法等。

为了更加清楚的说明如何根据匹配结果检测所述用户的合法性，下面结合附图4举例说明，在该示例中，针对注册声纹模型与认证声纹模型设置匹配度进行打分，根据打分结果认证用户的合法性，且注册声纹模型预先存储于模型服务器D中，在声纹服务器F中将该用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果认证用户的合法性说明如下：

在本示例中，预先设置一预设阈值，用于判断用户注册声纹模型与认证声纹模型的相似度。

如图4所示，从D中获取用户注册的声纹模型，在F中提取用户通过客户端E输入的认证语料对应的多种类型的声纹特征，并融合多种类型的声纹特征获取与用户标识对应的认证声纹模型,进而如图4所示，在F中将用户的注册声纹模型与认证声纹模型进行匹配，进一步地，对与用户标识对应的注册声纹模型与认证声纹模型的匹配度进行打分，如果注册声纹模型与认证声纹模型的匹配度的分值大于等于预设阈值，则认证该用户是注册用户本人，因此判断用户合法，即认证通过。

如果注册声纹模型与认证声纹模型的匹配度的分值小于预设阈值，则认证该用户不是注册用户本人，因此判断用户非法，即认证失败。

综上所述，本发明实施例的声纹认证方法，提取与用户输入的认证语料对应的多种类型的声纹特征，并融合该多种声纹特征以获取与用户标识对应的认证声纹模型，进而将预存的用户的注册声纹模型与认证声纹模型进行匹配，并根据匹配结果检测用户的合法性。该方法通过融合多种声纹模型建立认证声纹模型认证用户的合法性，提高了认证用户的合法性的可靠性和便捷性。

为了实现上述实施例，本发明还提出了一种声纹注册装置。图5是根据本发明一个实施例的声纹注册装置的结构示意图。如图5所示，该声纹注册装置包括：

第一提取模块510，用于分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1。

建立模块520，用于融合多种类型的声纹特征，建立用户的注册声纹模型。

具体而言，在用户针对相关应用等进行注册的时候，可提示用户朗读N(N>1)句话，进而第一提取模块510分别提取与用户输入的N句注册语料对应的多种类型的声纹特征。

在本发明的一个实施例中，第一提取模块510提取用户输入的N句注册语料对应的多种类型的声纹特征的服务器可以是基于MFCC特征、PLP特征的声纹服务器。

从而第一提取模块510可分别提取用户输入的第一句到第N句语料对应的MFCC特征、PLP特征等。

进一步地，在第一提取模块510提取出N句注册语料对应的用户的多种类型的声纹特征后，建立模块520融合多种类型的声纹特征并建立用户的注册声纹模型，以便于进一步根据该声纹模型对用户进行身份验证。

在本发明的一个实施例中，建立模块520根据预设的与多种类型的声纹特征分别对应的权重信息，融合多种类型的声纹特征，建立用户的注册声纹模型。

需要说明的是，本发明实施例的声纹注册装置与上述结合图1和图2描述的声纹注册方法对应，本发明实施例的声纹注册装置中未披露的细节，在此不再赘述。

综上所述，本发明实施例的声纹注册装置，分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，并融合多种类型的声纹特征，建立用户的注册声纹模型。该装置通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

为了实现上述实施例，本发明还提出了一种声纹认证装置。图6是根据本发明一个实施例的声纹认证装置的结构示意图，如图6所示，该声纹认证装置包括：

第二提取模块610，用于提取与用户输入的认证语料对应的多种类型的声纹特征。

获取模块620，用于融合多种类型的声纹特征获取与用户标识对应的认证声纹模型。

检测模块630，用于将预存的用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果检测用户的合法性。

具体而言，在本发明的实施例中，用户在登录相关应用或者网页时，会输入相关认证语料，比如输入几句语音信息等，为了认证该用户是否是注册的用户，第二提取模块610需要提取与用户输入的认证语料对应的多种类型的声纹特征，比如可提取该语料的MFCC特征、PLP特征等。

更具体地，在提取用户输入的认证语料的多种类型的声纹特征后，获取模块620可对多种类型的声纹特征值进行处理，融合多种类型的声纹特征以获取该认证用户的认证声纹模型。

其中，上述认证声纹模型与可标识注册的用户唯一性的用户标识对应，比如与注册用户的ID对应。

进一步地，检测模块630根据用户标识获预先存储的注册的用户的注册声纹模型，并将该用户的注册声纹模型与认证声纹模型进行匹配，根据匹配结果认证用户的合法性。

在本发明的一个实施例中，检测模块630在注册声纹模型与认证声纹模型的匹配度大于等于预设阈值时，确定用户合法，以及在注册声纹模型与认证声纹模型的匹配度小于预设阈值时，确定用户非法。

需要说明的是，本发明实施例的声纹认证装置与上述结合图3和图4描述的声纹认证方法对应，本发明实施例的声纹认证装置中未披露的细节在此不再赘述。

综上所述，本发明实施例的声纹认证装置，提取与用户输入的认证语料对应的多种类型的声纹特征，并融合该多种声纹特征以获取与用户标识对应的认证声纹模型，进而将预存的用户的注册声纹模型与认证声纹模型进行匹配，并根据匹配结果检测用户的合法性。该装置通过融合多种声纹模型建立认证声纹模型认证用户的合法性，提高了认证用户的合法性的可靠性和便捷性。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种声纹注册方法，其特征在于，包括以下步骤：

分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；

获取所述N句注册语料中每句注册语料对应的所述多种类型的声纹特征，根据所述每句注册语料中的每种声纹特征与对应的权重值的乘积值获取所述每句注册语料的每种声纹特征对应的声纹识别向量i-vector值，根据所述每句注册语料的各句声纹特征对应的i-vector值得到所述每句注册语料的i-vector值；

根据所述N句注册语料的i-vector值的平均值建立所述用户的注册声纹模型。

2.如权利要求1所述的方法，其特征在于，所述声纹特征的类型，包括：

MFCC特征和PLP特征。

3.一种声纹认证方法，其特征在于，包括以下步骤：

提取与用户输入的认证语料对应的多种类型的声纹特征；

根据所述认证语料的每种声纹特征与对应的权重值的乘积值，获取所述认证语料的每种声纹特征对应的声纹识别向量i-vector值，根据所述认证语料的各句声纹特征对应的i-vector值获取所述认证语料的i-vector值；

根据所述认证语料的所述i-vector值获取与用户标识对应的认证声纹模型；

将预存的所述用户的注册声纹模型与所述认证声纹模型进行匹配，根据匹配结果检测所述用户的合法性。

4.如权利要求3所述的方法，其特征在于，所述将预存的所述用户标识对应的注册声纹模型与所述认证声纹模型进行匹配，根据匹配结果检测所述用户的合法性，包括：

如果所述注册声纹模型与所述认证声纹模型的匹配度大于等于预设阈值，则确定所述用户合法；

如果所述注册声纹模型与所述认证声纹模型的匹配度小于所述预设阈值，则确定所述用户非法。

5.一种声纹注册装置，其特征在于，包括：

第一提取模块，用于分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；

建立模块，用于获取所述N句注册语料中每句注册语料对应的所述多种类型的声纹特征，根据所述每句注册语料中的每种声纹特征与对应的权重值的乘积值获取所述每句注册语料的每种声纹特征对应的声纹识别向量i-vector值，根据所述每句注册语料的各句声纹特征对应的i-vector值得到所述每句注册语料的i-vector值；所述建立模块，还用于根据所述N句注册语料的i-vector值的平均值，建立所述用户的注册声纹模型。

6.如权利要求5所述的装置，其特征在于，所述声纹特征的类型，包括：

MFCC特征和PLP特征。

7.一种声纹认证装置，其特征在于，包括：

第二提取模块，用于提取与用户输入的认证语料对应的多种类型的声纹特征；

获取模块，用于根据所述认证语料的每种声纹特征与对应的权重值的乘积值，获取所述认证语料的每种声纹特征对应的声纹识别向量i-vector值，根据所述认证语料的各句声纹特征对应的i-vector值获取所述认证语料的i-vector值，并根据所述认证语料的所述i-vector值融合所述多种类型的声纹特征获取与用户标识对应的认证声纹模型；

检测模块，用于将预存的所述用户的注册声纹模型与所述认证声纹模型进行匹配，根据匹配结果检测所述用户的合法性。

8.如权利要求7所述的装置，其特征在于，所述检测模块用于：

在所述注册声纹模型与所述认证声纹模型的匹配度大于等于预设阈值时，确定所述用户合法；

以及在所述注册声纹模型与所述认证声纹模型的匹配度小于所述预设阈值时，确定所述用户非法。