CN109994118B - 语音密码验证方法、装置、存储介质及计算机设备 - Google Patents
语音密码验证方法、装置、存储介质及计算机设备 Download PDFInfo
- Publication number
- CN109994118B CN109994118B CN201910270003.XA CN201910270003A CN109994118B CN 109994118 B CN109994118 B CN 109994118B CN 201910270003 A CN201910270003 A CN 201910270003A CN 109994118 B CN109994118 B CN 109994118B
- Authority
- CN
- China
- Prior art keywords
- information
- preset
- voice
- user
- voiceprint information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012795 verification Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 34
- 239000013598 vector Substances 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请涉及安全验证技术领域,尤其涉及一种语音密码验证方法、装置、存储介质及计算机设备。其中,语音密码验证方法,包括:接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;将所述声纹信息输入经过预先训练的识别模型中,获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联信息;根据所述相似度对所述声纹信息进行评分,获得所述声纹信息的评分值,若所述评分值超过预设阈值,则验证通过。本申请提供的方案,能够提高语音密码验证的抗干扰性,提高语音密码验证的准确性。
Description
技术领域
本申请涉及安全验证技术领域,具体而言,本申请涉及一种语音密码验证方法、装置、存储介质及计算机设备。
背景技术
随着科技的进步及智能家居概念的兴起,市面上出现了越来越多的智能产品,如扫地机器人、智能锁、智能热水器等,由于声纹具有生物特征唯一性,因此市面上出现了一些根据声纹信息进行密码验证的技术。
语音密码是采用语音段中的文本信息和说话人信息对用户信息进行双重加密的技术,拥有较好的安全性和便捷性,在金融、保险、公安、智能设备等领域都有很好的应用场景。但在目前的技术研究中,传统的语音声纹密码识别采用的声学特征主要包含文本信息和信道信息,说话人信息属于其中的弱信息,这导致密码识别过程,仍然面临着抗干扰性差等不足。
发明内容
本申请提供了一种语音密码验证方法、装置、计算机可读存储介质及计算机设备,以提高语音密码识别的抗干扰性。
本申请实施例首先提供了一种语音密码验证方法,包括:
接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;
将所述声纹信息输入经过预先训练的识别模型中,获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系;
根据所述相似度对所述声纹信息进行评分,获得所述声纹信息的评分值,若所述评分值超过预设阈值,则验证通过。
在一种实施例中,所述将所述声纹信息输入经过预先训练的识别模型中的步骤之前,还包括:
调取数据库中存储的语音样本,向每个所述语音样本中添加干扰因子,生成训练样本;其中,所述干扰因子对应多种不同的干扰类型;
提取训练样本中声纹信息的特征信息,根据所述特征信息建立声纹信息与用户身份之间的关联关系。
在一种实施例中,所述识别模型为基于识别特征的联合概率识别模型,所述联合概率识别模型的公式表示如下:
其中,mi表示扬声器si的语音样本向量,i表示扬声器数,μ是训练数据的全局平均值,ysi为mi在说话人空间中的特征表示,V表示类间空间的特征向量,xi是大小为Rx的干扰变量,εi为噪声变量,j=1,2…N为正整数,说话者的可变性被分解成对应于N个不同的干扰类型,U表示类内空间的特征向量,Wj表示特征参数。
在一种实施例中,所述解析所述语音信息获得该用户的声纹信息的步骤之前,还包括:
接收身份验证请求信息,响应于该请求信息调取数据库中的预设问题发送至用户;
接收用户发送的针对所述预设问题的语音信息,解析所述语音信息获得其中的语义信息。
在一种实施例中,若所述数据库中设置有多个预设问题,所述调取数据库中的预设问题发送至用户的步骤,包括:
随机抽取预设问题并将抽取出的预设问题发送至用户。
在一种实施例中,所述接收用户发送的针对所述预设问题的响应信息的步骤之前,还包括:
若预设时间内未接收与预设答案一致的语音信息,调取与所述预设问题关联的提示信息,并将所述提示信息发送给用户;其中,所述预设答案为预设问题关联的标准答案。
在一种实施例中,所述获得所述声纹信息的评分值的步骤,包括:
调取预设身份信息,对比所述声纹信息与所述预设身份信息之间的特征似然度;
根据获得的特征似然度对所述声纹信息进行评分,获得所述声纹信息的评分值。
进一步地,本申请实施例还提供了一种语音密码验证装置,包括:
解析模块,用于接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;
获得相似度模块,用于将所述声纹信息输入经过预先训练的识别模型中,获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系;
验证模块,用于根据所述相似度对所述声纹信息进行评分,获得所述声纹信息的评分值,若所述评分值超过预设阈值,则验证通过。
进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机指令,当所述计算机指令在计算机上运行时,使得计算机可以执行上述任一技术方案所述的语音密码验证方法的步骤。
更进一步地,本申请实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一技术方案所述的语音密码验证方法的步骤。
与现有技术相比,本申请提供的方案至少具备如下优点:
本申请实施例提供的语音密码验证方法,通过解析语音信息获得用户的声纹信息,将声纹信息输入预先训练的识别模型中,根据声纹信息与预设身份信息之间的相似度进行身份验证,若当前接收到的声纹信息与预设身份信息之间的相似度超过预设阈值,则验证通过。由于用于获得声纹信息与预设身份信息之间相似度的识别模型是由包含干扰因子的训练样本得到的,因此,识别模型在处理声纹信息时具备一定的抗干扰性,提高了声纹信息的识别准确性。
本申请实施例提供的语音密码验证方法,通过基于识别特征的联合概率识别模型进行声纹信息的识别,该算法补强了语音信息中的说话人信息,进一步提高识别模型的抗干扰性,同时也提高了识别模型的识别性能。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例提供的语音密码验证方法的实施环境图;
图2为本申请一个实施例提供的语音密码验证方法的流程示意图;
图3为本申请一个实施例提供的语音密码验证方法中进行密码验证的流程示意图;
图4为本申请一个实施例提供的建立加入干扰因子的联合概率模型的流程示意图;
图5为本申请一个实施例提供的根据所述特征似然度进行声纹信息的评分的流程示意图;
图6为本申请一种实施例提供的语音密码验证装置的结构示意图;
图7为本申请一种实施例提供的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
图1为一个实施例中提供的语音密码验证方法的实施环境图,在该实施环境中,包括用户终端、服务器端。
本实施例提供的语音密码验证方法可适用于服务器端,服务器端接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;将所述声纹信息输入经过预先训练的识别模型中,基于所述识别模型获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系;根据所述相似度对所述语音信息评分,获得所述语音信息的评分值;若所述评分值超过预设阈值,则验证通过。
需要说明的是,用户终端可为智能手机、平板电脑、笔记本电脑、台式计算机等,服务器端可以由具有处理功能的计算机设备来实现,但并不局限于此。服务器端与用户终端可以通过蓝牙、USB(Universal Serial Bus,通用串行总线)或者其他通讯连接方式进行网络连接,本申请在此不做限制。
在一个实施例中,图2为本申请实施例提供的语音密码验证方法的流程示意图,该语音密码验证方法可以应用于上述的服务器端,包括如下步骤:
步骤S210,接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;
步骤S220,将所述声纹信息输入经过预先训练的识别模型中,基于所述识别模型获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系;
步骤S230,根据所述相似度对所述语音信息评分,获得所述语音信息的评分值,若所述评分值超过预设阈值,则验证通过。
本申请实施例提供的语音密码验证方法,基于声纹信息进行身份验证,用于识别用户身份的识别模型,在训练过程中使用的训练样本包含干扰因子,因此,基于该训练样本形成的识别模型具备一定的抗干扰性能,使用该识别模型进行声纹信息的识别时,准确识别该声纹信息,提高了声纹识别的准确性及效率。
为了更清楚本申请提供的语音密码验证方案及其技术效果,接下来以多个实施例对其具体方案进行详细阐述。
在步骤S210的解析语音信息获得该用户的声纹信息的步骤之前,还可以首先进行密码验证,以提升验证方案的安全性,其流程示意图如图3所示,包括如下子步骤:
S310,接收身份验证请求信息,响应于该请求信息调取数据库中的预设问题发送至用户;
S320,接收用户发送的针对所述预设问题的语音信息,解析所述语音信息获得其中的语义信息;
S330,判断所述语义信息是否与预设答案一致;
S331,若一致,则进行步骤S210中的解析所述语音信息获得该用户的声纹信息。
其中,预设问题可以是系统设置,结合用户提供的预设答案,并建立所述预设问题与预设答案之间的关联关系,或者预设问题及对应的预设答案均由用户自定义,建立两者之间的关联关系并将预设问题、预设答案及两者之间的关联关系存储于数据库中。
预设问题可设置一个或多个,若数据库中有多个预设问题,随机抽取预设问题,并将抽取出的预设问题发送至用户。相较于单个问题或采用静态特征进行识别的方案相比,该种随机选取预设问题的方案,有利于提升密码验证的安全性。
本申请实施例提供的方案还包括:若语义信息与预设答案不一致,则验证终止。
本申请实施例提供的方案如下:接收到用户发送的身份验证请求信息,响应于该请求信息首先进入密码验证阶段,调取数据库中的预设问题,并将调取出的预设问题返回给用户,用户接收到预设问题,将该预设问题的响应信息通过语音输入模块输入,所述语音输入模块可以是麦克风;接收到用户发送的包含响应信息的语音信息,解析所述语音信息获得其中的语义信息,根据语义信息验证用户输入的语音信息是否正确,若用户输入的语义信息与预设答案不一致,则表明用户并非已存储的标准用户,验证不通过,若用户输入的语义信息与预设答案一致,表明通过当次密码验证,进一步地,可结合上述声纹验证过程进行第二道验证,以增强语音密码验证过程的安全性及准确性。
进一步地,若预设时间内未接收到与所述预设答案一致的语音信息,还可以进行如下操作以提高验证通过率:
S340,调取与所述预设问题关联的提示信息,并将所述提示信息发送给用户。
本实施例中,提示信息与预设问题相关联,预设问题的参考答案为预设答案,同样预先将预设问题与预设答案相关联,以便根据预设问题进行提示信息或预设答案的调用。
其中,所述预设答案为预设问题关联的标准答案,预设时间内未接收到与所述预设答案一致的语音信息,包括如下情形:其一,预设时间内未接收到用户发送的语音信息,其二,预设时间内并接收到用户发送的与预设答案一致的语音信息,这两种情形下,可能是用户未想起预设答案导致未曾输入语音信息,也可能是用户输入的语音信息与预设答案不匹配导致未接收到与预设答案一致的语音信息,该种情况下,本申请实施例将发送与该预设问题相关的提示信息至用户,以提高验证的成功率以及验证效率。
其中,提示信息可以设置一个,也可以设置多个,均预先与预设问题建立关联,检测到预设时间内未接收到与预设答案一致的语音信息,调取该预设问题相关联的提示信息,将所述提示信息发送至用户,若提示信息包括多个,按照提示信息的优先级排序结果,将优先级最高的提示信息发送给用户,若提示信息发送后的预设时间内仍未接收到与预设答案一致的语音信息,将优先级次高的提示信息发送给用户,按照该种方式依次将提示信息发送给用户。当然,若提示信息之间没有优先级之分,也可以随机发送提示信息给用户,有利于降低提示过程的复杂性。
进一步地,若接收到错误答案的次数超过预设阈值,则终止验证过程。其中,终止验证过程可以通过锁定验证界面,以防通过不断试错进行密码猜测的行为,以及避免这种试错行为导致的电量损耗。
判断所述语义信息是否与预设答案一致,若一致,则解析所述语音信息获得该用户的声纹信息,若不一致,则验证不通过,表明请求身份验证的用户为非法用户。
本申请实施例提供的方案,在接收到用户发送的身份验证请求信息之后,首先通过对比语音信息中的语音信息与预设答案进行验证,即通过文本信息进行密码验证,若密码验证通过,再通过声纹信息进行用户身份验证,结合上述对声纹验证方案的描述,本方案结合密码验证与身份验证,有利于提高语音密码验证的抗干扰性及安全性。
一种实施例中,在步骤S220的将所述声纹信息输入经过预先训练的识别模型中的步骤之前,还包括如下步骤:建立加入干扰因子的联合概率模型,其流程示意图如图4所示,建立过程如下:
S410,调取数据库中存储的语音样本,向每个语音样本中添加干扰因子,生成训练样本;其中,所述干扰因子对应多种不同的干扰类型;
S420,提取训练样本中声纹信息的特征信息,根据所述特征信息建立声纹信息与用户身份之间的关联关系。
其中,预先收集声纹识别过程中的干扰因子,如:噪音、多人说话等,因此,本申请实施例中的干扰类型包括多语言,麦克风类型,噪声等类型。获得用户的语音样本,分别向每个用户对应的语音样本中添加上述干扰类型,向语音样本中添加一种干扰类型,形成一个训练样本,各用户对应的训练样本数量不低于干扰类型的种类,举例阐述本方案的思路:用户对应的语音样本有N个,干扰类型有M个,则该用户对应的训练样本不低于M个。
利用上述获得的训练样本建立关联关系,提取训练样本中的特征参数,根据训练样本不断确定特征参数的权重系数,各特征参数的权重系数确定后,获得识别模型。
由于建立识别模型的训练数据中添加了干扰因子,用这些添加有干扰因子的训练数据形成的识别模型具备一定的抗干扰性,提高识别模型的抗干扰性能,进而提高识别模型的识别准确性。
上述实施例提供的语音密码验证方法能够提高语音密码验证过程的抗干扰性,但为了进一步提高语音密码验证方法的安全性,本申请提供如下方案:
在一种实施例中,用户通过麦克风输入语音信息,解析所述语音信息获得该用户的声纹信息,使用基于识别特征(I-Vector特征)的联合概率识别模型,该模型是基于概率线性预测区分分析算法PLDA(probabilistic linear discriminant analysis,PLDA)获得的,该算法具有良好的信道补偿性能,能够补强说话人信息,信道补偿算法的意义在于减少I-Vector特征中信道信息对说话人信息的干扰,进一步提高识别模型的抗干扰性,从模式识别的角度而言,本算法增大了类间的离散度并且降低类内的离散度,以此获得更高的区分性,提高了识别模型的识别性能。
本申请提供的方案,为了提高验证过程中的抗干扰性,除了在建立识别模型过程中添加干扰因子使得识别模型具备一定的抗干扰性,另一方面,本申请利用PLDA算法进行声纹信息的评分,该算法能够进行信道补偿,声纹识别采用的声学特征主要包含文本信息和信道信息,说话人信息属于其中的弱信息,本申请采用的PLDA算法补强了说话人信息,因此,能够进一步提高语音密码验证方案的抗干扰性。
本申请提供的联合概率识别模型的公式如下:
其中,mi表示扬声器si的语音样本向量,i表示扬声器数,μ是训练数据的全局平均值,ysi为mi在说话人空间中的特征表示,V表示类间空间的特征向量,xi是大小为Rx的干扰变量,εi为噪声变量,j=1,2…N为正整数,说话者的可变性被分解成对应于N个不同的干扰类型,U表示类内空间的特征向量,Wj表示特征参数。
利用训练样本集中的训练样本及EM算法,获得识别模型中各干扰因子对应的权重及PLDA模型参数。采用EM算法本质上是利用极大似然估计求解含有隐变量的概率模型参数。在每一次迭代中,在E-step先求出给定训练数据下隐变量的期望,然后在M-step将这个期望最大化,通过迭代逐渐收敛,达到局部最优值。
按照上述方案获得PLDA模型的模型参数后,计算当前获取的声纹信息与预设身份信息之间的特征似然度,当前获取的声纹信息也是待验证声纹信息,根据所述特征似然度进行声纹信息的评分,其流程示意图如图5所示,具体过程如下:
S510,调取预设身份信息,对比所述声纹信息与所述预设身份信息之间的特征似然度;
S520,根据获得的特征似然度对所述声纹信息进行评分,获得所述声纹信息的评分值。
其中,预设身份信息为预先存储的用户的身份信息,预先存储的用户的身份信息至少为一个,若本申请应用于门锁上,预设身份信息为预先存储的能够打开该门锁的用户的身份信息。调取数据库中存储的预设身份信息,分别获得当前获得的声纹信息与预设身份信息之间的特征似然度,采用期望最大化算法迭代求解,使用对数似然比计算评分值。
优选地,利用如下公式计算声纹信息的评分值:
上述公式中,η1和η2分别是两端语音的识别特征矢量,两条语音来自同一说话人的概率假设为Hs,来自不同说话人的概率为Hd,p(η1,η2|Hs)为两条语音来自同一说话人的似然函数;p(η1|Hd),p(η2|Hd)分别为η1和η2来子不同说话人的似然函数。通过计算对数似然比,就能衡量两条语音的相似程度。待验证的声纹信息与预设身份信息的相似程度与评分高低成正比:比值越高,得分越高,两条语音属于同一说话人的可能性越大;比值越低,得分越低,则两条语音属于同一说话人的可能性越小。
每个训练样本中均包含一种干扰类型,计算不同训练样本的类间距离,根据待检测样本与已存储的标准样本之间的距离进行评分,如果两个样本表示的语音的特征相同的似然度越大,则这两个样本越可能属于同一个说话人。
以上为本申请提供的语音密码验证方法的实施例,针对于该方法,下面阐述与其对应的语音密码验证装置的实施例。
本申请实施例还提供了一种语音密码验证装置,其结构示意图如图6所示,包括:解析模块610、获得相似度模块620、验证模块630,具体如下:
解析模块610,用于接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;
获得相似度模块620,用于将所述声纹信息输入经过预先训练的识别模型中,获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系;
验证模块630,用于根据所述相似度对所述声纹信息进行评分,获得所述声纹信息的评分值,若所述评分值超过预设阈值,则验证通过。
关于上述实施例中的语音密码验证装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
进一步地,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述任意一项所述的语音密码验证方法的步骤。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
更进一步地,本申请实施例还提供一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的语音密码验证方法的步骤。
图7是根据一示例性实施例示出的一种用于计算机设备700的框图。例如,计算机设备700可以被提供为一服务器。参照图7,计算机设备700包括处理组件722,其进一步包括一个或多个处理器,以及由存储器732所代表的存储器资源,用于存储可由处理组件722的执行的指令,例如应用程序。存储器732中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件722被配置为执行指令,以执行上述语音密码验证方法的步骤。
计算机设备700还可以包括一个电源组件726被配置为执行计算机设备700的电源管理,一个有线或无线网络接口750被配置为将计算机设备700连接到网络,和一个输入输出(I/O)接口758。计算机设备700可以操作基于存储在存储器732的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解的是,在本申请各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (9)
1.一种语音密码验证方法,其特征在于,包括:
接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;
将所述声纹信息输入经过预先训练的识别模型中,获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系,所述识别模型为基于识别特征的联合概率识别模型,所述联合概率识别模型的公式表示如下:
其中,mi表示扬声器si的语音样本向量,i表示扬声器数,μ是训练数据的全局平均值,ysi为mi在说话人空间中的特征表示,V表示类间空间的特征向量,xi是大小为Rx的干扰变量,εi为噪声变量,j=1,2…N为正整数,说话者的可变性被分解成对应于N个不同的干扰类型,U表示类内空间的特征向量,Wj表示特征参数;
根据所述相似度对所述声纹信息进行评分,获得所述声纹信息的评分值,若所述评分值超过预设阈值,则验证通过。
2.根据权利要求1所述的语音密码验证方法,其特征在于,所述将所述声纹信息输入经过预先训练的识别模型中的步骤之前,还包括:
调取数据库中存储的语音样本,向每个所述语音样本中添加干扰因子,生成训练样本;其中,所述干扰因子对应多种不同的干扰类型;
提取训练样本中声纹信息的特征信息,根据所述特征信息建立声纹信息与用户身份之间的关联关系。
3.根据权利要求1所述的语音密码验证方法,其特征在于,所述解析所述语音信息获得该用户的声纹信息的步骤之前,还包括:
接收身份验证请求信息,响应于该请求信息调取数据库中的预设问题发送至用户;
接收用户发送的针对所述预设问题的语音信息,解析所述语音信息获得其中的语义信息。
4.根据权利要求3所述的语音密码验证方法,其特征在于,若所述数据库中设置有多个预设问题,所述调取数据库中的预设问题发送至用户的步骤,包括:
随机抽取预设问题并将抽取出的预设问题发送至用户。
5.根据权利要求3所述的语音密码验证方法,其特征在于,所述接收用户发送的针对所述预设问题的响应信息的步骤之前,还包括:
若预设时间内未接收与预设答案一致的语音信息,调取与所述预设问题关联的提示信息,并将所述提示信息发送给用户;其中,所述预设答案为预设问题关联的标准答案。
6.根据权利要求1所述的语音密码验证方法,其特征在于,所述获得所述声纹信息的评分值的步骤,包括:
调取预设身份信息,对比所述声纹信息与所述预设身份信息之间的特征似然度;
根据获得的特征似然度对所述声纹信息进行评分,获得所述声纹信息的评分值。
7.一种语音密码验证装置,其特征在于,包括:
解析模块,用于接收用户输入的语音信息,解析所述语音信息获得该用户的声纹信息;
获得相似度模块,用于将所述声纹信息输入经过预先训练的识别模型中,获得所述声纹信息与预设身份信息之间的相似度;其中,所述识别模型是基于包含干扰因子的训练样本形成的声纹信息与用户身份之间的关联关系;
验证模块,用于根据所述相似度对所述声纹信息进行评分,获得所述声纹信息的评分值,若所述评分值超过预设阈值,则验证通过。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至6中任一项所述的语音密码验证方法的步骤。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任意一项所述的语音密码验证方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910270003.XA CN109994118B (zh) | 2019-04-04 | 2019-04-04 | 语音密码验证方法、装置、存储介质及计算机设备 |
PCT/CN2019/103048 WO2020199473A1 (zh) | 2019-04-04 | 2019-08-28 | 语音密码验证方法、装置、存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910270003.XA CN109994118B (zh) | 2019-04-04 | 2019-04-04 | 语音密码验证方法、装置、存储介质及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109994118A CN109994118A (zh) | 2019-07-09 |
CN109994118B true CN109994118B (zh) | 2022-10-11 |
Family
ID=67132399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910270003.XA Active CN109994118B (zh) | 2019-04-04 | 2019-04-04 | 语音密码验证方法、装置、存储介质及计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109994118B (zh) |
WO (1) | WO2020199473A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109994118B (zh) * | 2019-04-04 | 2022-10-11 | 平安科技(深圳)有限公司 | 语音密码验证方法、装置、存储介质及计算机设备 |
CN111784899A (zh) * | 2020-06-17 | 2020-10-16 | 深圳南亿科技股份有限公司 | 一种楼宇对讲系统及其门禁控制方法 |
CN111816191A (zh) * | 2020-07-08 | 2020-10-23 | 珠海格力电器股份有限公司 | 语音处理方法、装置、系统及存储介质 |
CN112565242B (zh) * | 2020-12-02 | 2023-04-07 | 携程计算机技术(上海)有限公司 | 基于声纹识别的远程授权方法、系统、设备及存储介质 |
CN113593581B (zh) * | 2021-07-12 | 2024-04-19 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274906A (zh) * | 2017-06-28 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 语音信息处理方法、装置、终端及存储介质 |
CN108417216A (zh) * | 2018-03-15 | 2018-08-17 | 深圳市声扬科技有限公司 | 语音验证方法、装置、计算机设备和存储介质 |
CN108768654A (zh) * | 2018-04-09 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于声纹识别的身份验证方法、服务器及存储介质 |
CN108806695A (zh) * | 2018-04-17 | 2018-11-13 | 平安科技(深圳)有限公司 | 自更新的反欺诈方法、装置、计算机设备和存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201301261A (zh) * | 2011-06-27 | 2013-01-01 | Hon Hai Prec Ind Co Ltd | 身份認證系統及方法 |
CA3117645C (en) * | 2016-09-19 | 2023-01-03 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
CN108766444B (zh) * | 2018-04-09 | 2020-11-03 | 平安科技(深圳)有限公司 | 用户身份验证方法、服务器及存储介质 |
CN108989349B (zh) * | 2018-08-31 | 2022-11-29 | 平安科技(深圳)有限公司 | 用户账号解锁方法、装置、计算机设备及存储介质 |
CN109243465A (zh) * | 2018-12-06 | 2019-01-18 | 平安科技(深圳)有限公司 | 声纹认证方法、装置、计算机设备以及存储介质 |
CN109994118B (zh) * | 2019-04-04 | 2022-10-11 | 平安科技(深圳)有限公司 | 语音密码验证方法、装置、存储介质及计算机设备 |
-
2019
- 2019-04-04 CN CN201910270003.XA patent/CN109994118B/zh active Active
- 2019-08-28 WO PCT/CN2019/103048 patent/WO2020199473A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274906A (zh) * | 2017-06-28 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 语音信息处理方法、装置、终端及存储介质 |
CN108417216A (zh) * | 2018-03-15 | 2018-08-17 | 深圳市声扬科技有限公司 | 语音验证方法、装置、计算机设备和存储介质 |
CN108768654A (zh) * | 2018-04-09 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于声纹识别的身份验证方法、服务器及存储介质 |
CN108806695A (zh) * | 2018-04-17 | 2018-11-13 | 平安科技(深圳)有限公司 | 自更新的反欺诈方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109994118A (zh) | 2019-07-09 |
WO2020199473A1 (zh) | 2020-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109994118B (zh) | 语音密码验证方法、装置、存储介质及计算机设备 | |
US11508381B2 (en) | Voiceprint recognition method, model training method, and server | |
CN105702263B (zh) | 语音重放检测方法和装置 | |
WO2018166187A1 (zh) | 服务器、身份验证方法、系统及计算机可读存储介质 | |
US7404087B2 (en) | System and method for providing improved claimant authentication | |
US20150199960A1 (en) | I-Vector Based Clustering Training Data in Speech Recognition | |
CN107886957A (zh) | 一种结合声纹识别的语音唤醒方法及装置 | |
CN109360572B (zh) | 通话分离方法、装置、计算机设备及存储介质 | |
JP2006526174A (ja) | ローカルモデルを用いた話者認識 | |
Ren et al. | Secure smart home: A voiceprint and internet based authentication system for remote accessing | |
EP3373177B1 (en) | Methods and systems for determining user liveness | |
CN110166424A (zh) | 面向物联网服务隐私保护声纹识别方法及系统、移动终端 | |
WO2022083969A1 (en) | Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium | |
CN109150538B (zh) | 一种指纹与声纹融合身份认证方法 | |
CN111104852A (zh) | 一种基于启发式高斯云变换的人脸识别技术 | |
Sholokhov et al. | Voice biometrics security: Extrapolating false alarm rate via hierarchical Bayesian modeling of speaker verification scores | |
CN111613230A (zh) | 声纹验证方法、装置、设备及存储介质 | |
US8954327B2 (en) | Voice data analyzing device, voice data analyzing method, and voice data analyzing program | |
Hu et al. | Semi-supervised learning based on GAN with mean and variance feature matching | |
CN108550368B (zh) | 一种语音数据的处理方法 | |
CN108416592B (zh) | 一种高速语音识别方法 | |
CN116437355A (zh) | 基于射频指纹的无线设备身份认证方法及其装置 | |
CN105575385A (zh) | 语音密码设置系统及方法、语音密码验证系统及方法 | |
CN110688972B (zh) | 用于提升人脸生成性能的系统以及方法 | |
Haeb-Umbach | Automatic generation of phonetic regression class trees for MLLR adaptation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |