CN110265037A - 身份验证方法、装置、电子设备及计算机可读存储介质 - Google Patents

身份验证方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110265037A
CN110265037A CN201910511980.4A CN201910511980A CN110265037A CN 110265037 A CN110265037 A CN 110265037A CN 201910511980 A CN201910511980 A CN 201910511980A CN 110265037 A CN110265037 A CN 110265037A
Authority
CN
China
Prior art keywords
voice messaging
card number
identification card
user
vocal print
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910511980.4A
Other languages
English (en)
Other versions
CN110265037B (zh
Inventor
张靖友
赖勇铨
李美玲
王靓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN201910511980.4A priority Critical patent/CN110265037B/zh
Publication of CN110265037A publication Critical patent/CN110265037A/zh
Application granted granted Critical
Publication of CN110265037B publication Critical patent/CN110265037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0815Network architectures or network communication protocols for network security for authentication of entities providing single-sign-on or federations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种身份验证方法、装置、电子设备及计算机可读存储介质,应用于语音技术领域,其中该方法包括:获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,即当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。

Description

身份验证方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及语音技术领域,具体而言,本申请涉及一种身份验证方法、装置、电子设备及计算机可读存储介质。
背景技术
基于便利用户办理业务的考虑,金融、通信等服务行业提供了用户打电话给客服,待用户的身份验证通过后即可办理与自己相关业务的服务,而如何实现用户身份的验证成为了一个问题。
目前,用户身份的验证是客服通过人工校验的方式实现的,即客服询问用户关于用户的一系列身份相关信息(如身份证号、预留手机号、预留地址等),或者,向用户预留的手机号发送验证码,用户需要向客服反馈收到的验证码,继而确定用户的身份验证是否通过。然而,根据现有的通过人工校验的方式,存在无法避免其他人冒用用户的身份办理相关业务的问题(如其他人通过一定方法获取客服发送的验证码,从而通过身份验证,并冒用用户身份办理相关业务),以及存在程序繁琐、耗时的问题。
发明内容
本申请提供了一种身份验证方法、装置、电子设备及计算机可读存储介质,用于提升用户身份验证的安全性以及验证效率,本申请采用的技术方案如下:
第一方面,提供了一种身份验证方法,该方法包括,
获取用户朗读身份证号的第一语音信息;
通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号;
当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
基于相似度计算结果信息确定用户的身份验证结果。
第二方面,提供了一种登录验证装置,该装置包括,
获取模块,用于获取用户朗读身份证号的第一语音信息;
识别确定模块,用于通过语音识别方法识别确定所述获取模块获取的所述第一语音信息对应的身份证号,并查询确定数据库中是否包含所述第一语音信息对应的身份证号;
计算模块,用于当数据库中包含所述第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的所述第一语音信息的第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
确定模块,用于基于所述计算模块计算的相似度计算结果信息确定所述用户的身份验证结果。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面所示的身份验证方法。
第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面所示的身份验证方法。
本申请提供了一种身份验证方法、装置、电子设备及计算机可读存储介质,与现有技术通过客服人工对用户身份进行验证相比,本申请通过获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,避免需要进行一系列的身份相关信息的问答,或避免用户需要查看并向客服提供手机收到的验证码,从而提升了用户身份验证的效率,此外,当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的一种身份验证方法的流程示意图;
图2为本申请实施例的一种身份验证装置的结构示意图;
图3为本申请实施例的另一种身份验证装置的结构示意图;
图4为本申请实施例的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,各实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供了一种身份验证方法,如图1所示,该方法可以包括以下步骤:
步骤S101,获取用户朗读身份证号的第一语音信息;
示例性的,在用户向客服打电话办理业务的场景中,可以通过相应的客户系统获取用户通过手机等通信设备发送的第一语音信息,其中,该第一语音信息的获取可以是实时进行的。
步骤S102,通过语音识别方法识别确定所述第一语音信息对应的身份证号,并查询确定数据库中是否包含所述第一语音信息对应的身份证号;
具体地,可以通过相应的语音识别方法对所述第一语音信息进行识别,得到对应的身份证号,也可以是通过相应的语音识别方法对所述第一语音信息进行识别得到对应的文本,并从得到的对应的文本中提取得到相应的身份证号;
具体地,基于得到的身份证号查询数据库,并确定数据库中是否包含该身份证号,即确定该身份证号对应的用户是否为注册用户。
步骤S103,当数据库中包含所述第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的所述第一语音信息的第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
具体地,通过预训练的声纹提取模型提取第一声纹特征的步骤,可以是在查询确定数据库中是否包含所述第一语音信息对应的身份证号之前进行,也可以是在查询确定数据库中是否包含所述第一语音信息对应的身份证号之后进行;
具体地,当数据库中包含所述第一语音信息对应的身份证号时,计算通过第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,其中,该相似度计算可以是通过计算第一声纹特征与第二声纹特征之间的欧式距离或余弦距离得到的。
步骤S104,基于相似度计算结果信息确定所述用户的身份验证结果。
具体地,当相似度计算结果小于一定阈值时,则用户的身份验证结果为验证成功,当相似度计算结果大于或等于一定阈值时,则用户的身份验证结果为验证失败;
示例性的,当第一声纹特征与第二声纹特征之间的欧式距离或余弦距离小于1时,则用户的身份验证通过,当第一声纹特征与第二声纹特征之间的欧式距离或余弦距离大于或等于1时,则用户身份验证失败。
本申请实施例提供了一种身份验证方法,与现有技术通过客服人工对用户身份进行验证相比,本申请实施例通过获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,避免需要进行一系列的身份相关信息的问答,或避免用户需要查看并向客服提供手机收到的验证码,从而提升了用户身份验证的效率,此外,当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。
本申请实施例提供了一种可能的实现方式,具体地,步骤S102包括:
步骤S1021(图中未示出):提取所述第一语音信息的声学特征;
具体地,通过相应的声学特征提取方法提取第一语音信息的声学特征;其中,该声学特征提取方法可以是传统的声学特征提取方法,也可以是基于深度神经网络的声学特征提取方法;其中,该声学特征可以是梅尔倒谱系数(Mel-scaleFrequency CepstralCoefficients,MFCC),也可以是提取的其他声学特征,此处不做限定。
步骤S1022(图中未示出):将所述声学特征输入至预训练的语音识别模型的长短时记忆网络得到所述第一语音信息对应的身份证号。
具体地,将提取到的声学特征输入至预训练的语音识别模型的长短时记忆网络(Long Short Term Memory Network,LSTM),得到第一语音信息对应的身份证号;其中,长短时记忆网络是一种改进之后的循环网络,可以解决RNN无法处理长距离依赖的问题。
对于本申请实施例,通过预训练的语音识别模型得到第一语音信息对应的身份证号,解决了第一语音信息的识别问题。
本申请实施例提供了一种可能的实现方式,具体地,步骤S103包括:
步骤S1031(图中未示出),对所述第一语音信息进行标准化处理以及加窗、短时傅里叶变换处理,得到所述第一语音信息对应的声谱图;
具体地,可以对第一语音信息进行标准化处理,示例性地,用户的第一语音信息(声音信号)通过手机麦克风后转换成电子信息,最后通过16K或者更高的采样率采样,输出一串经过16位量化的数字信号;由于录音设置不同,输出的语音数字信号可能是双声道,即包含两路相近的数字序列,此时取其中一路作为声纹识别的信号;当采样率不是16K时,通过重采样或者插值的方式把信号转换成16K,当量化的信号不是16位整型时,通过线性映射的方式转换成16位量化。
具体地,标准化处理后的第一语音信息转换为一串数字信号(数组),可通过滑动窗口每隔一段间隔(如0.025秒)对该数组取一块数据(如512长度,对应512/16K=0.032秒)进行快速傅立叶变换(Fast fourier transform,FFT)变换,将第一语音信息的每个时间间隔计算完FFT后得到的复数信号的绝对值,作为图像的一列按时间顺序排列,即得到第一音频数据对应的声谱图;其中,进行FFT变换前可以对拟变换的信号段加窗处理(即与一个窗口函数相乘,以强调该信号段的中间部分,降低FFT变换的边缘效应)。
具体地,还可以对声谱图进行截断和归一化处理,根据采样定律,16K采样后的声音信号包含了最高频率为8K的原始声音信号,对声谱图先进行截断处理,取中间频率部分(比如从250Hz至7KHz部分)。然后对保留部分进行如下归一化处理:对于每一个频率成份(即声谱图中的每一行),计算出所有时间点的平均值和方差;将每一个频率成份对应的数组减去第1步计算出的该频率的平均值并除以该频率的方差,从而可以去除对人声特征关系不大的频率成份,同时让时间段内的频率成份内的数据符合均值为0方差为1的分布,即对声图谱进行白化(whitening)处理。通常的做法是对每个时间段的信号进行白化处理,而本方案是对每个频率分别进行白化处理。实验证明,这样做更适合声音信号,对噪声更加不敏感。
步骤S1032(图中未示出),通过所述预训练的声纹提取模型的多层卷积网络提取得到所述声谱图的多个特征图,并对得到的所述多个特征图按时间方向求平均,得到固定长度的特征向量;
具体地,用户说话的声音时长是不固定的,即便对于同一句话也是如此,如对于“您好”,用户可以按正常语速说完,也可以将“您”拖很长的音,然后说“好”;与通常的做法从不定长的语音中提取若干个定长的片段输入至深度网络中,然后取特征的平均值进行计算相比,示例性的,本申请可以对第一语音信息的整体进行声谱图的计算与声谱图归一化处理,然后输入至卷积神经网络,经过一系列的卷积处理操作,得到一组特征图,然后将得到的该一组特征图按时间方向计算平均值,得到固定长度的特征向量;其中,该固定长度的特征向量对输入的声谱图长度具有不变性,也即是说对音频的长度具有不变性。
步骤S1033(图中未示出),对得到的所述固定长度的特征向量进行中心化与长度归一化处理,得到所述第一语音信息的第一声纹特征。
具体地,对固定长度的特征向量减去所有训练样本对应特征的均值,从而把所有样本的特征中心移至坐标原点;然后对中心化处理后的特征进行长度归一化,从而得到第一语音信息的声纹特征,其中,该长度归一化可以是L2范数归一化,也可以是能够实现本功能的其他处理;其中,结合中心化和长度归一化两步操作,使得第一音频数据的特征点分布在高维空间的单位球的球面上。
对于本申请实施例,通过预训练的神经网络模型的多层卷积网络,提取得到第一语音信息对应的声谱图的固定长度的特征向量,并对该固定长度的特征向量进行中心化和长度归一化处理,得到第一语音信息对应的声纹特征,从而解决了第一语音信息的声纹特征的提取问题。
本申请实施例提供了一种可能的实现方式,进一步地,该方法还包括:
步骤S105(图中未示出),当数据库中未包含所述第一语音信息对应的身份证号时,提示所述用户进行身份注册。
具体地,当数据库中未包含第一语音信息对应的身份证号时,说明该用户未进行身份注册,可以提示用户进行身份注册。
对于本申请实施例,当数据库中未包含第一语音信息对应的身份证号时,提示用户进行身份注,以进行后续的业务办理。
本申请实施例提供了一种可能的实现方式,进一步地,当数据库中包含所述第一语音信息对应的身份证号时,该方法还包括:
步骤S106(图中未示出),查询数据库确定所述第一语音信息对应的身份证号是否关联存储有所述第二声纹特征;
步骤S107(图中未示出),当数据库中所述第一语音信息对应的身份证号未关联存储有所述第二声纹特征,提示所述用户进行声纹注册。
具体地,查询数据库中第一语音信息对应的身份证号是否关联存储有第二身份特征,当数据库中未关联存储有第二身份特征时,说明该注册用户未进行声纹注册,提示用户进行声纹注册。
对于本申请实施例,当第一语音信息对应的身份证号未关联存储有第二身份特征,提示用户进行声纹注册,为后续验证用户身份提供了基础。
本申请实施例提供了一种可能的实现方式,进一步地,该方法还包括:
步骤S108(图中未示出),采集所述用户朗读身份证号的第二语音信息;
步骤S109(图中未示出),通过预训练的声纹提取模型提取所述第二语音信息的第二声纹特征,并将所述第二声纹特征与所述用户的身份证号进行关联存储。
具体地,接收用户朗读身份证号的第二语音信息,其中,该第二语音信息的采集可以是用户在相应的服务场所进行的,也可以是通过电话进行的;
具体地,通过预训练的声纹提取模型提取所述第二语音的第二声纹特征,并将所述第二声纹特征与用户的身份证号进行关联存储,以在对用户身份验证时查询得到比对的声纹特征。
对于本申请实施例,解决了进行用户身份验证时用于比对的声纹特征来源问题,为后续用户身份验证提供了基础。
本申请实施例提供了一种可能的实现方式,步骤S101之前包括:
步骤S110(图中未示出),提示所述用户朗读身份证号。
示例性的,在用户打电话办理业务的场景中,相应的服务系统提示用户朗读身份证号,并获取用户朗读身份证号的语音信息,以用于用户身份验证。
对于本申请实施例,提示用户朗读身份证号,从而能针对性的获取用户朗读身份证号的语音信息,避免获取无用的语音信息,从而减少了服务系统的数据处理量。
图2为本申请实施例提供的一种身份验证装置,该装置20包括:获取模块201、识别确定模块202、计算模块203以及确定模块204,其中,
获取模块201,用于获取用户朗读身份证号的第一语音信息;
识别确定模块202,用于通过语音识别方法识别确定所述获取模块201获取的所述第一语音信息对应的身份证号,并查询确定数据库中是否包含所述第一语音信息对应的身份证号;
计算模块203,用于当数据库中包含所述第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的所述第一语音信息的第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
确定模块204,用于基于所述计算模块203计算的相似度计算结果信息确定所述用户的身份验证结果。
本申请实施例提供了一种身份验证装置,与现有技术通过客服人工对用户身份进行验证相比,本申请实施例通过获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,避免需要进行一系列的身份相关信息的问答,或避免用户需要查看并向客服提供手机收到的验证码,从而提升了用户身份验证的效率,此外,当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。
本实施例的身份验证装置可执行本申请上述实施例中提供的一种身份验证方法,其实现原理相类似,此处不再赘述。
如图3所示,本申请实施例提供了另一种身份验证装置,该装置30包括:获取模块301、识别确定模块302、计算模块303以及确定模块304,其中,
获取模块301,用于获取用户朗读身份证号的第一语音信息;
其中,图3中的获取模块301与图2中的获取模块201的功能相同或者相似。
识别确定模块302,用于通过语音识别方法识别确定所述获取模块301获取的所述第一语音信息对应的身份证号,并查询确定数据库中是否包含所述第一语音信息对应的身份证号;
其中,图3中的识别确定模块302与图2中的识别确定模块202的功能相同或者相似。
计算模块303,用于当数据库中包含所述第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的所述第一语音信息的第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
其中,图3中的计算模块303与图2中的计算模块203的功能相同或者相似。
确定模块304,用于基于所述计算模块303计算的相似度计算结果信息确定所述用户的身份验证结果。
其中,图3中的确定模块304与图2中的确定模块204的功能相同或者相似。
本申请实施例提供了一种可能的实现方式,具体地,所述识别确定模块302包括:
第一提取单元3021,用于提取所述第一语音信息的声学特征;
输入单元3022,用于将所述第一提取单元3021提取得到的所述声学特征输入至预训练的语音识别模型的长短时记忆网络得到所述第一语音信息对应的身份证号。
对于本申请实施例,通过预训练的语音识别模型得到第一语音信息对应的身份证号,解决了第一语音信息的识别问题。
本申请实施例提供了一种可能的实现方式,具体地,所述计算模块303包括:
第一处理单元3031,用于对所述第一语音信息进行标准化处理以及加窗、短时傅里叶变换处理,得到所述第一语音信息对应的声谱图;
第二提取单元3032,用于通过所述预训练的声纹提取模型的多层卷积网络提取得到所述第一处理单元处理得到的所述声谱图的多个特征图,并对得到的所述多个特征图按时间方向求平均,得到固定长度的特征向量;
第二处理单元3033,用于对所述第二提取单元得到的所述固定长度的特征向量进行中心化与长度归一化处理,得到所述第一语音信息的第一声纹特征。
对于本申请实施例,通过预训练的神经网络模型的多层卷积网络,提取得到第一语音信息对应的声谱图的固定长度的特征向量,并对该固定长度的特征向量进行中心化和长度归一化处理,得到第一语音信息对应的声纹特征,从而解决了第一语音信息的声纹特征的提取问题。
本申请实施例提供了一种可能的实现方式,进一步地,该装置30还包括:
第一提示模块305,用于当数据库中未包含所述第一语音信息对应的身份证号时,提示所述用户进行身份注册。
对于本申请实施例,当数据库中未包含第一语音信息对应的身份证号时,提示用户进行身份注,以进行后续的业务办理。
本申请实施例提供了一种可能的实现方式,进一步地,该装置30还包括:
查询模块306,用于查询数据库确定所述第一语音信息对应的身份证号是否关联存储有所述第二声纹特征;
第二提示模块307,用于当数据库中所述第一语音信息对应的身份证号未关联存储有所述第二声纹特征,提示所述用户进行声纹注册。
具体地,查询数据库中第一语音信息对应的身份证号是否关联存储有第二身份特征,当数据库中未关联存储有第二身份特征时,说明该注册用户未进行声纹注册,提示用户进行声纹注册。
本申请实施例提供了一种可能的实现方式,进一步地,该装置30还包括:
接收模块308,用于采集所述用户朗读身份证号的第二语音信息;
提取模块309,用于通过预训练的声纹提取模型提取所述接收模块308接收的所述第二语音信息的第二声纹特征,并将所述第二声纹特征与所述用户的身份证号进行关联存储。
对于本申请实施例,解决了进行用户身份验证时用于比对的声纹特征来源问题,为后续用户身份验证提供了基础。
本申请实施例提供了一种可能的实现方式,进一步地,该装置30还包括:
第三提示模块310,用于提示所述用户朗读身份证号。
对于本申请实施例,提示用户朗读身份证号,从而能针对性的获取用户朗读身份证号的语音信息,避免获取无用的语音信息,从而减少了服务系统的数据处理量。
本申请实施例提供了一种身份验证装置,与现有技术通过客服人工对用户身份进行验证相比,本申请实施例通过获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,避免需要进行一系列的身份相关信息的问答,或避免用户需要查看并向客服提供手机收到的验证码,从而提升了用户身份验证的效率,此外,当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。
本申请实施例提供了一种身份验证装置,适用于上述实施例所示的方法,在此不再赘述。
本申请实施例提供了一种电子设备,如图4所示,图4所示的电子设备40包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。进一步地,电子设备40还可以包括收发器4004。需要说明的是,实际应用中收发器4004不限于一个,该电子设备400的结构并不构成对本申请实施例的限定。其中,处理器4001应用于本申请实施例中,用于实现图2或图3所示的获取模块、识别确定模块、计算模块以及确定的功能,以及图3所示的第一提示模块305、查询模块306、第二提示模块307、接收模块308、提取模块309以及第三提示模块310。收发器4004包括接收机和发射机。
处理器4001可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI总线或EISA总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003用于存储执行本申请方案的应用程序代码,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现图2或图3所示实施例提供的身份验证装置的功能。
本申请实施例提供了一种电子设备,与现有技术通过客服人工对用户身份进行验证相比,本申请实施例通过获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,避免需要进行一系列的身份相关信息的问答,或避免用户需要查看并向客服提供手机收到的验证码,从而提升了用户身份验证的效率,此外,当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。
本申请实施例提供了一种电子设备适用于上述方法实施例。在此不再赘述。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例中所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术通过客服人工对用户身份进行验证相比,本申请实施例通过获取用户朗读身份证号的第一语音信息,然后通过语音识别方法识别确定第一语音信息对应的身份证号,并查询确定数据库中是否包含第一语音信息对应的身份证号,继而当数据库中包含第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的第一语音信息的第一声纹特征与预存储的第一语音信息对应的身份证号关联存储的第二声纹特征的相似度,并基于相似度计算结果信息确定用户的身份验证结果,避免需要进行一系列的身份相关信息的问答,或避免用户需要查看并向客服提供手机收到的验证码,从而提升了用户身份验证的效率,此外,当数据库中包含用户的第一语音信息对应的身份证号时,进一步对用户的声纹特征进行匹配验证,从而提升了用户身份验证的安全性。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种身份验证方法,其特征在于,包括:
获取用户朗读身份证号的第一语音信息;
通过语音识别方法识别确定所述第一语音信息对应的身份证号,并查询确定数据库中是否包含所述第一语音信息对应的身份证号;
当数据库中包含所述第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的所述第一语音信息的第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
基于相似度计算结果信息确定所述用户的身份验证结果。
2.根据权利要求1所述的方法,其特征在于,所述通过语音识别方法识别确定所述第一语音信息对应的身份证号,包括:
提取所述第一语音信息的声学特征;
将所述声学特征输入至预训练的语音识别模型的长短时记忆网络得到所述第一语音信息对应的身份证号。
3.根据权利要求1所述的方法,其特征在于,通过预训练的声纹提取模型提取所述第一语音信息的第一声纹特征,包括:
对所述第一语音信息进行标准化处理以及加窗、短时傅里叶变换处理,得到所述第一语音信息对应的声谱图;
通过所述预训练的声纹提取模型的多层卷积网络提取得到所述声谱图的多个特征图,并对得到的所述多个特征图按时间方向求平均,得到固定长度的特征向量;
对得到的所述固定长度的特征向量进行中心化与长度归一化处理,得到所述第一语音信息的第一声纹特征。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
当数据库中未包含所述第一语音信息对应的身份证号时,提示所述用户进行身份注册。
5.根据权利要求1所述的方法,其特征在于,当数据库中包含所述第一语音信息对应的身份证号时,该方法还包括:
查询数据库确定所述第一语音信息对应的身份证号是否关联存储有所述第二声纹特征;
当数据库中所述第一语音信息对应的身份证号未关联存储有所述第二声纹特征,提示所述用户进行声纹注册。
6.根据权利要求1-5所述的方法,其特征在于,该方法还包括:
采集所述用户朗读身份证号的第二语音信息;
通过预训练的声纹提取模型提取所述第二语音信息的第二声纹特征,并将所述第二声纹特征与所述用户的身份证号进行关联存储。
7.根据权利要求1所述的方法,其特征在于,所述获取用户朗读身份证号的第一语音信息,之前包括:
提示所述用户朗读身份证号。
8.一种登录验证装置,其特征在于,包括:
获取模块,用于获取用户朗读身份证号的第一语音信息;
识别确定模块,用于通过语音识别方法识别确定所述获取模块获取的所述第一语音信息对应的身份证号,并查询确定数据库中是否包含所述第一语音信息对应的身份证号;
计算模块,用于当数据库中包含所述第一语音信息对应的身份证号时,计算通过预训练的声纹提取模型提取到的所述第一语音信息的第一声纹特征与预存储的所述第一语音信息对应的身份证号关联存储的第二声纹特征的相似度;
确定模块,用于基于所述计算模块计算的相似度计算结果信息确定所述用户的身份验证结果。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至7任一项所述的身份验证方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至7中任一项所述的身份验证方法。
CN201910511980.4A 2019-06-13 2019-06-13 身份验证方法、装置、电子设备及计算机可读存储介质 Active CN110265037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910511980.4A CN110265037B (zh) 2019-06-13 2019-06-13 身份验证方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910511980.4A CN110265037B (zh) 2019-06-13 2019-06-13 身份验证方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110265037A true CN110265037A (zh) 2019-09-20
CN110265037B CN110265037B (zh) 2022-09-30

Family

ID=67918164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910511980.4A Active CN110265037B (zh) 2019-06-13 2019-06-13 身份验证方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110265037B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110718228A (zh) * 2019-10-22 2020-01-21 中信银行股份有限公司 语音分离方法、装置、电子设备及计算机可读存储介质
CN110851808A (zh) * 2019-10-31 2020-02-28 中国建设银行股份有限公司 身份认证方法、装置、电子设备及计算机可读存储介质
CN111090846A (zh) * 2019-12-06 2020-05-01 中信银行股份有限公司 登录认证方法、装置、电子设备及计算机可读存储介质
CN111160928A (zh) * 2019-12-16 2020-05-15 深圳前海微众银行股份有限公司 一种验证身份的方法及装置
CN111429920A (zh) * 2020-03-30 2020-07-17 北京奇艺世纪科技有限公司 用户区分方法、用户行为库确定方法、装置及设备
CN111639936A (zh) * 2020-05-24 2020-09-08 中信银行股份有限公司 交易信息的获取方法、装置、电子设备及可读存储介质
CN112487381A (zh) * 2020-11-13 2021-03-12 中信银行股份有限公司 身份认证方法、装置、电子设备及可读存储介质
CN113114755A (zh) * 2021-04-08 2021-07-13 平安科技(深圳)有限公司 设备间平滑切换方法、装置、电子设备及存储介质
CN113393318A (zh) * 2021-06-10 2021-09-14 中国工商银行股份有限公司 银行卡申请风控方法、装置、电子设备和介质
WO2022007497A1 (zh) * 2020-07-08 2022-01-13 珠海格力电器股份有限公司 语音处理方法、装置、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180039888A1 (en) * 2016-08-08 2018-02-08 Interactive Intelligence Group, Inc. System and method for speaker change detection
CN107993071A (zh) * 2017-11-21 2018-05-04 平安科技(深圳)有限公司 电子装置、基于声纹的身份验证方法及存储介质
CN109450850A (zh) * 2018-09-26 2019-03-08 深圳壹账通智能科技有限公司 身份验证方法、装置、计算机设备和存储介质
CN109473108A (zh) * 2018-12-15 2019-03-15 深圳壹账通智能科技有限公司 基于声纹识别的身份验证方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180039888A1 (en) * 2016-08-08 2018-02-08 Interactive Intelligence Group, Inc. System and method for speaker change detection
CN107993071A (zh) * 2017-11-21 2018-05-04 平安科技(深圳)有限公司 电子装置、基于声纹的身份验证方法及存储介质
CN109450850A (zh) * 2018-09-26 2019-03-08 深圳壹账通智能科技有限公司 身份验证方法、装置、计算机设备和存储介质
CN109473108A (zh) * 2018-12-15 2019-03-15 深圳壹账通智能科技有限公司 基于声纹识别的身份验证方法、装置、设备及存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110718228A (zh) * 2019-10-22 2020-01-21 中信银行股份有限公司 语音分离方法、装置、电子设备及计算机可读存储介质
CN110851808A (zh) * 2019-10-31 2020-02-28 中国建设银行股份有限公司 身份认证方法、装置、电子设备及计算机可读存储介质
CN111090846A (zh) * 2019-12-06 2020-05-01 中信银行股份有限公司 登录认证方法、装置、电子设备及计算机可读存储介质
CN111160928A (zh) * 2019-12-16 2020-05-15 深圳前海微众银行股份有限公司 一种验证身份的方法及装置
CN111429920A (zh) * 2020-03-30 2020-07-17 北京奇艺世纪科技有限公司 用户区分方法、用户行为库确定方法、装置及设备
CN111429920B (zh) * 2020-03-30 2024-01-23 北京奇艺世纪科技有限公司 用户区分方法、用户行为库确定方法、装置及设备
CN111639936A (zh) * 2020-05-24 2020-09-08 中信银行股份有限公司 交易信息的获取方法、装置、电子设备及可读存储介质
CN111639936B (zh) * 2020-05-24 2023-08-25 中信银行股份有限公司 交易信息的获取方法、装置、电子设备及可读存储介质
WO2022007497A1 (zh) * 2020-07-08 2022-01-13 珠海格力电器股份有限公司 语音处理方法、装置、系统及存储介质
CN112487381A (zh) * 2020-11-13 2021-03-12 中信银行股份有限公司 身份认证方法、装置、电子设备及可读存储介质
CN113114755A (zh) * 2021-04-08 2021-07-13 平安科技(深圳)有限公司 设备间平滑切换方法、装置、电子设备及存储介质
CN113393318A (zh) * 2021-06-10 2021-09-14 中国工商银行股份有限公司 银行卡申请风控方法、装置、电子设备和介质

Also Published As

Publication number Publication date
CN110265037B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN110265037A (zh) 身份验证方法、装置、电子设备及计算机可读存储介质
CN106847292B (zh) 声纹识别方法及装置
AU2021277642B2 (en) Method and apparatus for detecting spoofing conditions
CN106683680B (zh) 说话人识别方法及装置、计算机设备及计算机可读介质
CN106373575B (zh) 一种用户声纹模型构建方法、装置及系统
KR100636317B1 (ko) 분산 음성 인식 시스템 및 그 방법
US6038528A (en) Robust speech processing with affine transform replicated data
CN109429523A (zh) 说话者确认方法、装置及系统
JP2016080916A (ja) 話者交替検出装置、話者交替検出方法及び話者交替検出用コンピュータプログラム
WO2006013555A2 (en) Method and system for verifying and enabling user access based on voice parameters
CN110634492B (zh) 登录验证方法、装置、电子设备及计算机可读存储介质
CN110570853A (zh) 基于语音数据的意图识别方法和装置
EP3989217A1 (en) Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium
CN109448732B (zh) 一种数字串语音处理方法及装置
CN112328994A (zh) 声纹数据处理方法、装置、电子设备和存储介质
CN105679323B (zh) 一种号码发现方法及系统
CN110111798A (zh) 一种识别说话人的方法及终端
CN111640423B (zh) 一种词边界估计方法、装置及电子设备
Saleema et al. Voice biometrics: the promising future of authentication in the internet of things
CN112992155B (zh) 一种基于残差神经网络的远场语音说话人识别方法及装置
Mohamed et al. An Overview of the Development of Speaker Recognition Techniques for Various Applications.
Mishra A vector quantization approach to speaker recognition
Pawade et al. Voice Based Authentication Using Mel-Frequency Cepstral Coefficients and Gaussian Mixture Model
CN113689863B (zh) 一种声纹特征提取方法、装置、设备及存储介质
CN116631406B (zh) 基于声学特征生成的身份特征提取方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant