CN109584886A - 基于声纹识别的身份认证方法、装置、设备及存储介质 - Google Patents

基于声纹识别的身份认证方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109584886A
CN109584886A CN201811475745.8A CN201811475745A CN109584886A CN 109584886 A CN109584886 A CN 109584886A CN 201811475745 A CN201811475745 A CN 201811475745A CN 109584886 A CN109584886 A CN 109584886A
Authority
CN
China
Prior art keywords
identifier
identification
target
vector
identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811475745.8A
Other languages
English (en)
Other versions
CN109584886B (zh
Inventor
方昕
刘俊华
魏思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201811475745.8A priority Critical patent/CN109584886B/zh
Publication of CN109584886A publication Critical patent/CN109584886A/zh
Application granted granted Critical
Publication of CN109584886B publication Critical patent/CN109584886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0876Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提供了一种基于声纹识别的身份认证方法、装置、设备及存储介质,方法包括:获取目标标识的关联标识信息,目标标识的关联标识信息至少包括:在预设时间段内,与目标标识直接或间接产生联系的标识组成的目标标识集合;基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量;基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息。本申请在基于目标标识对应的声纹矢量确定目标标识对应的用户身份信息时,用能够表征目标标识的关联标识信息的标识度量矢量进行辅助,能够较准确确定出目标标识对应的用户身份信息,用户体验较好。

Description

基于声纹识别的身份认证方法、装置、设备及存储介质
技术领域
本申请涉及身份认证技术领域,尤其涉及一种基于声纹识别的身份认证方法、装置、设备及存储介质。
背景技术
在很多基于用户标识的场景下,例如,基于电话号码的通话、基于qq号的通话、基于微信号的通话等,由于很多标识的注册身份信息存在遗漏,或者,标识的注册身份信息与标识实际使用者的身份信息不一致,导致标识使用者的身份信息无法通过注册信息获得,为了确定标识对应的用户身份信息,对基于标识的通话语音采用基于声纹识别的身份识别方法识别标识对应的用户身份信息是一种普遍的身份认证方法。
比如,在司法判案中,检察机关已知某一犯罪嫌疑人当前使用的电话号码,获取了当前使用的电话号码的通话语音,但此嫌疑人可能使用过多个电话号码,这多个电话号码可能没有注册信息,或者电话号码是用别人的身份注册的,在这种情况下,通常会基于该犯罪嫌疑人当前使用号码的通话语音的声纹信息到语音库中去寻找同一个人的语音信息。
在现有的基于声纹识别的身份认证方案中,由于用于识别用户身份的声纹矢量是从用户的通话语音中提取的,而用户的通话语音可能存在环境噪声,并且用户本身的声音会随着时间慢慢变化,这些因素导致现有技术中基于声纹识别的身份认证方法效果较差。
发明内容
有鉴于此,本申请提供了一种基于声纹识别的身份认证方法、装置、设备及存储介质,用以提供一种效果较好的身份认证方案,该方案如下:
一种基于声纹识别的身份认证方法,包括:
获取目标标识的关联标识信息,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
可选的,所述目标标识集合包括:第一标识集合和/或第二标识集合,其中,所述第一标识集合为所述目标标识为发起联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合,所述第二标识集合为所述目标标识作为被联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合;
所述目标标识的关联标识信息还包括:所述目标标识集合中的每个标识对应的属性信息,任一标识对应的属性信息为该标识与所述目标标识直接或间接产生联系时,该标识对应的属性信息。
可选的,所述基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量,包括:
确定所述第一标识集合中的每个标识对应的标识度量矢量,并获取所述第一标识集合中的每个标识对应的联系次数,通过所述第一标识集合中的每个标识对应的标识度量矢量和联系次数,确定所述目标标识对应的第一度量矢量;
和/或,确定所述第二标识集合中的每个标识对应的标识度量矢量,并获取所述第二标识集合中的每个标识对应的联系次数,通过所述第二标识集合中的每个标识对应的标识度量矢量和联系次数,确定所述目标标识对应的第二度量矢量;
将所述第一度量矢量,或者,所述第二度量矢量,或者,所述第一度量矢量和所述第二度量矢量拼接后的矢量,作为所述目标标识对应的标识度量矢量。
可选的,确定所述第一标识集合和/或所述第二标识集合中的每个标识对应的标识度量矢量,包括:
针对所述第一标识集合和/或所述第二标识集合中的每个标识:
确定该标识对应的标识矢量,作为该标识对应的标识度量矢量;
或者,
确定该标识对应的标识矢量;
基于该标识对应的联系次数,以及,该标识与所述目标标识每次直接或间接产生联系时,该标识对应的属性信息,确定该标识对应的属性矢量;
将该标识对应的属性矢量与该标识对应的标识矢量拼接,拼接后的矢量作为该标识对应的标识度量矢量。
可选的,任一标识对应的属性信息至少包括:该标识与所述目标标识直接或间接产生联系时,该标识对应的联系时间和/或联系地点;
所述基于该标识对应的联系次数,以及,该标识与所述目标标识每次直接或间接产生联系时,该标识对应的属性信息,确定该标识对应的属性矢量包括:
将该标识与所述目标标识每次直接或间接产生联系时,该标识对应的联系时间转换为时间矢量,获得至少一个时间矢量,和/或,将该标识与所述目标标识每次直接或间接产生联系时,该标识对应的联系地点转换为地点矢量,获得至少一个地点矢量;
计算所述至少一个时间矢量的平均值作为该标识对应的时间矢量,和/或,计算所述至少一个地点矢量的平均值作为该标识对应的地点矢量。
可选的,所述确定该标识对应的标识矢量,包括:
基于该标识本身的内容将该标识转换为唯一能够表征该标识的矢量,作为该标识对应的标识矢量;
或者,基于预先确定的矢量转换矩阵将该标识转换为矢量,作为该标识对应的标识矢量。
可选的,预先确定所述矢量转换矩阵的过程包括:
获取同一标识在组成所述预设时段的两个不同时段分别对应的标识度量矢量作为正样本,并获取两个不同标识在所述预设时段分别对应的标识度量矢量作为负样本,其中,一标识对应的标识度量矢量基于与该标识直接或间接产生联系的标识和初始矢量转换矩阵确定;
利用所述正样本和所述负样本,基于预设的损失函数,训练矢量转换矩阵,以使同一标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量差别逐渐减小,两个不同标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量的差别逐渐增大。
可选的,所述基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息,包括:
基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识与标识库中各个待比对标识的身份相似度;
将与所述目标标识的身份相似度最高的待比对标识对应的用户身份信息,确定为所述目标标识对应的用户身份信息。
可选的,所述基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识与标识库中各个待比对标识的身份相似度,包括:
对于所述标识库中的每个待比对标识:
基于所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的第一身份相似度;
基于所述目标标识和该待比对标识分别对应的声纹矢量,确定所述目标标识与该待比对标识的第二身份相似度;
通过所述第一相似度和所述第二相似度,确定所述目标标识与该待比对标识最终的身份相似度;
以得到所述目标标识与所述标识库中各个待比对标识的身份相似度。
可选的,所述通过所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的第一身份相似度,包括:
获取所述目标标识和该待比对标识分别拥有的通信群的个数,以及,所述目标标识和该待比对标识共有的通信群的个数;
通过所述目标标识和该待比对标识分别拥有的通信群的个数,以及,所述目标标识和该待比对标识共有的通信群的个数,确定相似度权重;
通过所述目标标识和该待比对标识分别对应的标识度量矢量和所述相似度权重,确定所述目标标识与该待比对标识的第一身份相似度。
可选的,所述基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息,包括:
基于所述目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合;
至少基于所述目标标识对应的声纹矢量,从所述候选标识集合中确定出与所述目标标识的身份相似度最高的标识;
将与所述目标标识的身份相似度最高的标识对应的用户身份信息,确定为所述目标标识对应的用户身份信息。
可选的,所述基于所述目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合,包括:
对于所述标识库中的每个待比对标识,通过所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的身份相似度,以得到所述目标标识与所述标识库中各个待比对标识的身份相似度;
将所述目标标识与所述标识库中各个待比对标识的身份相似度中,与所述目标标识的身份相似度大于或等于预设相似度阈值的标识组成所述候选标识集合。
一种基于声纹识别的身份认证方法,包括:信息获取模块、矢量确定模块和身份识别模块;
所述信息获取模块,用于获取目标标识的关联标识信息,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
所述矢量确定模块,用于基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
所述身份识别模块,用于基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
可选的,所述信息获取模块获取的所述目标标识集包括:第一标识集合和/或第二标识集合,其中,所述第一标识集合为所述目标标识为发起联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合,所述第二标识集合为所述目标标识为被联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合;
所述信息获取模块获取的所述目标标识的关联标识信息还包括:所述目标标识集合中的每个标识对应的属性信息,任一标识对应的属性信息为该标识与所述目标标识直接或间接产生联系时,该标识对应的属性信息。
一种基于声纹识别的身份认证设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现所述基于声纹识别的身份认证方法的各个步骤。
一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述基于声纹识别的身份认证方法的各个步骤。
从上述的技术方案可以看出,本申请提供的基于声纹识别的身份认证方法、装置、设备及存储介质,首先获取目标标识的关联标识信息,然后基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量,最后,基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息。鉴于同一用户的不同标识的关联标识信息相似,以及,相似标识在矢量空间具有相似性,本申请用能够表征目标标识关联标识信息的标识度量矢量辅助声纹矢量确定目标标识对应的用户身份信息,这种方式能够较准确确定出目标标识对应的用户身份信息,用户体验较好。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的基于声纹识别的身份认证方法的流程示意图;
图2为本申请实施例提供的目标标识与其它标识直接或间接产生联系的一示例的示意图;
图3a和图3b分别为主叫通联关系网络图和主叫通联关系网络图的一示例的示意图;
图4为本申请实施例提供的基于声纹识别的身份认证方法中,基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量的流程示意图;
图5a和图5b为本申请实施例提供的目标标识为主叫标识时与其它标识产生联系的一示例的示意图以及目标标识为被叫标识时与其它标识产生联系的一示例的示意图;
图6为本申请实施例提供的基于声纹识别的身份认证方法中,确定矢量转换矩阵的流程示意图;
图7为本申请实施例提供的基于声纹识别的身份认证方法中,基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息的一种可能的实现方式的流程示意图;
图8为本申请实施例提供的基于声纹识别的身份认证方法中,基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息的另一种可能的实现方式的流程示意图;
图9为本申请实施例提供的基于声纹识别的身份认证装置的结构示意图;
图10为本申请实施例提供的基于声纹识别的身份认证设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
由于现有的基于声纹识别的身份认证方法是基于声纹矢量进行的,因此,若要获得较好的身份识别效果,就需要获得能够较好的表征说话人信息的特征矢量,因此,现有的研究都集中在如何建立更加准确的概率统计模型来表征说话人信息,比如基于高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)的身份认证方法、基于全差异(Total Variability,TV)模型的身份认证方法以及基于深度神经网络模型的身份认证方法等,这些方法都是利用大量说话人的语音来训练表征说话人信息的特征矢量,例如在GMM-UBM模型的身份认证方法中,会抽取均值超向量来作为表征说话人信息的特征矢量,在基于TV模型的身份认证方法中,会抽取Ivector作为表征说话人信息的特征矢量,在基于深度神经网络模型的身份认证方法中,会抽取某一层网络的线性输出作为表征说话人信息的特征矢量。
发明人在实现本发明创造的过程中发现,无论上述的哪种方案,其关注点均在如何获得能够较好表征说明话人信息的特征矢量上,即目标的方案关注点比较局限,而实际上,还可利用一些其它信息辅助声纹实现身份认证,有鉴于此,本案发明人进行了深入研究,最终提出了一种效果较好的、基于声纹识别的身份认证方案,接下来通过下述实施例对本申请提供的基于声纹识别的身份认证方法进行介绍。
请参阅图1,示出了本申请实施例提供的基于声纹识别的身份认证方法的流程示意图,该方法可以包括:
步骤S101:获取目标标识的关联标识信息。
其中,目标标识可以为基于其能够与其它标识产生联系的标识,比如电话号码、微信号、QQ号等。
本实施例中,目标标识的关联标识信息至少可以包括:在预设时间段内,与目标标识直接或间接产生联系的标识组成的目标标识集合。
示例性的,目标标识为电话号码D,请参阅图2,示出了在两周内与电话号码D直接或间接产生联系的电话号码,从图2可以看出,电话号码A、B、C对应的用户与电话号码D对应的用户进行了通话,电话号码E对应的用户与电话号码A对应的用户进行了通话,电话号码F、G对应的用户与电话号码B对应的用户进行了通话、电话号码H对应的用户与电话号码C对应的用户进行了通话,则电话号码A、B、C为与电话号码D直接产生联系的电话号码,电话号码E、F、G、H为与电话号码D间接产生联系的电话号码,则,目标标识集合可以为{A,B,C},也可以为{E,F、G,H}。
优选的,目标标识的关联标识信息还可以包括:目标标识集合中每个标识对应的属性信息。任一标识对应的属性信息为该标识与目标标识直接或间接产生联系时,该标识对应的属性信息。
可选的,目标标识集合中任一标识对应的属性信息可以包括:该标识与目标标识之间直接或间接产生联系时的联系时间(该联系时间可以为产生联系的开始时间)和/或联系地点(该联系地点可以为该标识对应的用户所处的地点),任一标识与目标标识之间直接或间接产生联系时的联系时间作为该标识对应的联系时间,任一标识与目标标识之间直接或间接产生联系时的联系地点作为该标识对应的联系地点。
示例性的,标识为电话号码,目标标识为电话号码A,假设电话号码A与电话号码B之间产生了联系,即电话号码A对应的用户与电话号码B对应的用户进行了通话,则电话号码B对应的用户与电话号码A对应的用户进行通话的开始时间为电话号码B对应的联系时间,电话号码B对应的用户与电话号码A对应的用户进行通话时,电话号码B对应的用户所在的地点为电话号码B对应的联系地点。
需要说明的是,本实施例并不限定任一标识对应的属性信息为该标识与目标标识之间直接或间接产生联系时的联系时间和/或联系地点,还可以为其它,比如,标识为微信号、QQ号等,属性信息还可以为聊天时使用的表情等信息。
步骤S102:基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量。
其中,目标标识对应的标识度量矢量用于表征目标标识的关联标识信息。
基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量可参见后续实施例的说明。
步骤S103:基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息。
可以理解的是,同一用户的不同标识的关联标识信息差别不大,比如,在电话场景下,一用户换了电话号码后,与更换前的电话号码相比,更换后的电话号码的主叫号码与联系频次、被叫号码与联系频次并没有发生太大的变化,再比如,在微信场景下,一用户换了微信号之后,与之联系的微信号与联系频次往往也不会发生太大的变化。基于此,本实施例采用用于表征目标标识的关联标识信息的标识度量矢量辅助声纹矢量进行身份认证。
本申请实施例提供的基于声纹识别的身份认证方法,首先获取目标标识的关联标识信息,然后基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量,最后,基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息。鉴于同一用户的不同标识的关联标识信息相似,以及,相似标识在矢量空间具备相似性,本申请实施例用能够表征目标标识关联标识信息的标识度量矢量辅助声纹矢量确定目标标识对应的用户身份信息,这种方式能够较准确确定出目标标识对应的用户身份信息,用户体验较好。
在本申请的另一实施例中,对上述实施例中的“步骤S102:基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量”进行介绍。
可以理解的是,目标标识与其它标识产生联系包括两个情况,一种情况为,目标标识为发起联系的标识,即目标标识与其它标识产生的联系由目标标识发起,另一种情况为,目标标识为被联系的标识,即其它标识向目标标识发起联系,有鉴于此,本实施例中,目标标识集合可以包括第一标识集合和/或第二标识集合。其中,第一标识集合为目标标识为发起联系的标识时,与目标标识直接或间接产生联系的标识组成的集合,第二标识集合为目标标识为被联系的标识时,与目标标识直接或间接产生联系的标识组成的集合。
在一种可能的实现方式中,目标标识的关联标识信息可从标识的通联关系网络图中获取。示例性的,标识为电话号码,则可从电话系统获取通联关系网络图,通联关系网络图通常包括主叫通联关系网络图和被叫通联关系网络图,则目标标识的第一标识集合中的标识可从主叫通联关系网络图中获取,目标标识的第二标识集合中的标识可从被叫通联关系网络图中获取,主叫通联关系网络图如图3a所示,被叫通联关系网络图如图3b所示。
请参阅图4,示出了基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量的实现过程的流程示意图,可以包括:
步骤S401:基于目标标识对应的第一标识集合,确定目标标识对应的第一度量矢量,和/或,基于目标标识对应的第二标识集合,确定目标标识对应的第二度量矢量。
其中,基于目标标识对应的第一标识集合,确定目标标识对应的第一度量矢量的过程可以包括:确定目标标识对应的第一标识集合中的每个标识对应的标识度量矢量,并获取目标标识对应的第一标识集合中的每个标识对应的联系次数,通过目标标识对应的第一标识集合中的每个标识对应的标识度量矢量和联系次数,确定目标标识对应的第一度量矢量。
在一种可能的实现方式中,可将目标标识对应的第一标识集合中的每个标识对应的联系次数归一化,获得每个标识对应的归一化频次,然后,基于每个标识对应的标识度量矢量和归一化频次,通过下式确定目标标识对应的第一度量矢量:
其中,E1为目标标识对应的第一度量矢量,J为目标标识对应的第一标识集合中标识的总数量,Nj为第一标识集合中第j个标识对应的归一化频次,Vj为第一标识集合中第j个标识对应的标识度量矢量。
同样的,基于目标标识对应的第二标识集合,确定目标标识对应的第二度量矢量包括:确定目标标识对应的第二标识集合中的每个标识对应的标识度量矢量,并获取目标标识对应的第二标识集合中的每个标识对应的联系次数,通过目标标识对应的第二标识集合中的每个标识对应的标识度量矢量和联系次数,确定目标标识对应的第二度量矢量。
同样的,可将目标标识对应的第二标识集合中的每个标识对应的联系次数归一化,获得每个标识对应的归一化频次,然后,基于每个标识对应的标识度量矢量和归一化频次,通过下式确定目标标识对应的第二度量矢量:
其中,E2为目标标识对应的第二度量矢量,K为目标标识对应的第二标识集合中标识的总数量,Nk为第二标识集合中第k个标识对应的归一化频次,Vk为第二标识集合中第k个标识对应的标识度量矢量。
步骤S402:将目标标识对应的第一度量矢量,或者,目标标识对应的第二度量矢量,或者,目标标识对应的第一度量矢量与目标标识对应的第二度量矢量拼接后得到的矢量,作为目标标识对应的标识度量矢量。
需要说明的是,目标标识集合存在三种情况:其一,只包括目标标识对应的第一标识集合,此时,将目标标识对应的第一度量矢量作为目标标识对应的标识度量矢量;其二,只包括目标标识对应的第二标识集合,此时,将目标标识对应的第二度量矢量作为目标标识对应的标识度量矢量,其三,既包括目标标识对应的第一标识集合,又包括目标标识对应的第二标识集合,此时,可只将目标标识对应的第一度量矢量作为目标标识对应的标识度量矢量,也可只将目标标识对应的第二度量矢量作为目标标识对应的标识度量矢量,优选为将目标标识对应的第一度量矢量与目标标识对应的第二度量矢量拼接后的矢量作为目标标识对应的标识度量矢量。
下面以标识为电话号码为例,通过一示例对确定目标标识对应的主叫度量矢量进行说明。
请参阅图5,示出了目标电话号码D在一周内与其它电话号码产生联系的示意图,图5a示出了目标电话号码D在一周内作为主叫号码时的联系情况,从图5a可以看出,目标电话号码D对应的主叫号码集合(即上述的第一标识集合)为{A,F,G},并且,电话号码A对应的联系次数为2(即电话号码D向电话号码A发起2次联系),电话号码F对应的联系次数为2(即电话号码D向电话号码F发起2次联系),电话号码G对应的联系次数为1(即电话号码D向电话号码G发起了1次联系),则确定电话号码D对应的主叫度量矢量(即上述的第一度量矢量)的过程包括:
首先,确定电话号码A、F、G分别对应的号码度量矢量,依次分别记为VA、VF、VG;其次,基于电话号码A、F、G分别对应的联系次数对各个联系次数归一化,获得电话号码A、F、G依次分别对应的归一化频次2/5、2/5、1/5;最后,基于上式(1)确定电话号码D对应的主叫度量矢量ED1=(2/5)*VA+(2/5)*VF+(1/5)*VG
图5b示出了目标电话号码D在一周内作为被叫号码时的联系情况,图5b示出了目标电话号码D在一周内作为被叫号码时的联系情况,从图5b可以看出,目标电话号码D对应的被叫号码集合(即上述的第二标识集合)为{A,B,C},并且,电话号码A对应的联系次数为3(即电话号码A向电话号码D发起3次联系),电话号码F对应的联系次数为2(即电话号码F向电话号码D发起2次联系),电话号码G对应的联系次数为1(即电话号码G向电话号码D发起1次联系),则确定电话号码D对应的被叫度量矢量(即上述的第二度量矢量)的过程包括:
首先,确定电话号码A、B、C分别对应的号码度量矢量,依次分别记为VA、VB、VC;其次,基于电话号码A、B、C分别对应的联系次数对各个联系次数归一化,获得电话号码A、B、C依次分别对应的归一化频次1/2、1/3、1/6;最后,基于上式(2)确定电话号码D对应的被叫度量矢量ED2=(1/2)*VA+(1/3)*VB+(1/6)*VC
在确定出电话号码D对应的主叫度量矢量ED1和电话号码D对应的被叫度量矢量ED2后,优选为,将ED1与ED2进行拼接,得到[ED1,ED2],将[ED1,ED2]作为电话号码D对应的标识度量矢量。
在上述确定目标标识对应的标识度量矢量时,需要确定目标标识对应的第一标识集合和/或第二标识集合中每个标识对应的标识度量矢量,以下对确定第一标识集合和/或第二标识集合中每个标识对应的标识度量矢量进行介绍。
确定第一标识集合和/或第二标识集合中每个标识对应的标识度量矢量的实现方式有多种:
在一种可能的实现方式中,确定第一标识集合和/或第二标识集合中每个标识对应的标识度量矢量的过程可以包括:针对第一标识集合和/或第二标识集合中的每个标识,确定该标识对应的标识矢量,作为该标识对应的标识度量矢量,以得到第一标识集合和/或第二标识集合中各个标识分别对应的标识度量矢量。
在另一种可能的实现方式中,确定第一标识集合和/或第二标识集合中每个标识对应的标识度量矢量的过程可以包括:针对第一标识集合和/或第二标识集合中的每个标识,确定该标识对应的标识矢量,基于该标识对应的联系次数以及该标识与目标标识之间每次直接或间接产生联系时,该目标标识对应的属性信息,确定该标识对应的属性矢量,将该标识对应的标识矢量与该标识对应的属性矢量拼接,拼接后的矢量作为该标识对应的标识度量矢量,以得到第一标识集合和/或第二标识集合中各个标识分别对应的标识度量矢量。
其中,基于该标识对应的联系次数以及该标识与目标标识之间每次直接或间接产生联系时,该目标标识对应的属性信息,确定该标识对应的属性矢量的过程包括:若联系次数为一次,则将该标识与目标标识之间直接或间接产生联系时,该标识对应的属性信息转换为属性矢量作为该标识对应的属性矢量;若联系次数为多次,则将该标识与目标标识之间每次直接或间接产生联系时,该标识对应的属性信息转换为属性矢量,获得多个属性矢量,将多个属性矢量的平均值确定该标识对应的属性矢量。
示例性的,任一标识对应的属性信息包括:该标识与目标标识每次直接或间接产生联系时,该目标标识对应的联系时间和/或联系地点,则确定第一标识集合和/或第二标识集合中每个标识对应的标识度量矢量的过程可以包括:针对第一标识集合和/或第二标识集合中的每个标识,确定该标识对应的标识矢量,基于该标识对应的联系次数以及目标标识与该标识之间每次直接或间接产生联系时的联系时间和/或联系地点,确定该标识对应的时间矢量和/或地点矢量,将该标识对应的标识矢量与该标识对应的时间矢量和/或地点矢量拼接,拼接后的矢量作为该标识对应的标识度量矢量,以得到第一标识集合和/或第二标识集合中各个标识分别对应的标识度量矢量。
其中,基于该标识对应的联系次数以及该标识与目标标识之间每次直接或间接产生联系时的联系时间和/或联系地点,确定该标识对应的时间矢量和/或地点矢量,包括:若联系次数为一次,则将该标识与目标标识之间直接或间接产生联系时的联系时间转换为时间矢量,作为该标识对应的时间矢量,和/或,将该标识与目标标识之间直接或间接产生联系时的联系地点转换为地点矢量,作为该标识对应的地点矢量;若联系次数为多次,则将该标识与目标标识之间每次直接或间接产生联系时的联系时间转换为时间矢量,获得多个时间矢量,将多个时间矢量的平均值确定该标识对应的时间矢量,和/或,将该标识与目标标识之间每次直接或间接产生联系时的联系时间转换为地点矢量,获得多个地点矢量,将多个地点矢量的平均值确定该标识对应的地点矢量。
以下对确定第一标识集合和/或第二标识集合中任一标识对应的标识矢量的过程进行介绍。
确定第一标识集合和/或第二标识集合中任一标识对应的标识矢量的实现方式有多种,在一种可能的实现方式中,可基于该标识本身的内容将该标识转换为唯一能够表征该标识的矢量,作为该标识对应的标识矢量。
可选的,可基于该标识本身的内容将该标识转换为由0和1组成的矢量作为唯一能够表征该标识的标识矢量,示例性的,标识为手机号码,手机号通常为11位的数字,则可将手机号转换为11×10的矩阵,比如,手机号为13812345678,则该手机号可通过如下矩阵表征:
需要说明的是,也可采用同样的原理将微信号、QQ号等其它标识转换为标识矢量。
在另一种可能的实现方式中,确定一标识对应的标识矢量的过程可以包括:基于预先确定的矢量转换矩阵将该标识转换为矢量,作为该标识对应的标识矢量。具体地,可先将该标识转换为one-hot矢量,然后将one-hot矢量与预先确定的矢量转换矩阵相乘,获得该标识对应的标识矢量。
需要说明的是,基于预先确定的矢量转换矩阵确定一标识对应的标识矢量的关键在于,确定出矢量转换矩阵。请参阅图6,示出了确定矢量转换矩阵的过程的流程示意图,可以包括:
步骤S601:获取同一标识在组成预设时段的两个不同时段分别对应的标识度量矢量作为正样本,并获取两个不同标识在预设时段分别对应的标识度量矢量作为负样本。
其中,一标识对应的标识度量矢量基于与该标识直接或间接产生联系的标识组成标识集合和矢量转换矩阵确定,矢量转换矩阵的初始值可随机设定,每次训练迭代时采用的标识度量矢量基于前一次训练迭代获得的矢量转换矩阵确定。
具体地,确定一标识对应的标识度量矢量的过程可以包括:基于该标识对应的第一标识集合,确定该标识对应的第一度量矢量,和/或,基于该标识对应的第二标识集合,确定该标识对应的第二度量矢量;将该标识对应的第一度量矢量,或者,该对应的第二度量矢量,或者,该标识对应的第一度量矢量与第二度量矢量拼接后得到的矢量作为该标识对应的标识度量矢量。
需要说明的是,确定一标识对应的第一度量矢量和第二度量矢量的过程可参见上述确定目标标识对应的第一度量矢量和第二度量矢量的过程,本实施例在此不作赘述,需要注意的是,在确定一标识对应的第一标识集合和/或第二标识集合时,需要确定第一标识集合和/或第二标识集合中每个标识对应的标识矢量,对于一标识对应的标识矢量,本实施例基于矢量转换矩阵确定,即,对于任一标识,先将该标识转换为one-hot矢量,然后将one-hot矢量与矢量转换矩阵相乘,获得该标识对应的标识矢量。
步骤S602:利用正样本和负样本,基于预设的损失函数,训练矢量转换矩阵。
矢量转换矩阵的训练目标为:使同一标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量差别逐渐减小,两个不同标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量的差别逐渐增大。
在本实施例中,可基于如下的损失函数来训练度量矩阵:
其中,Ea与正样本,具体为同一标识a在组成预设时段的两个不同时段分别对应的标识度量矢量,比如,预设时段为两周,则Ea为标识a在第一周对应的标识度量矢量,为标识a在第二周对应的标识度量矢量,Ea与为负样本,具体为两个不同标识a和b在预设时段分别对应的标识度量矢量,比如,Ea为标识a在两周内对应的标识度量矢量,为标识a在相同两周内对应的标识度量矢量。
通过训练得到矢量转换矩阵后,对于第一标识集合和/或第二标识集合中的任一标识,可基于矢量矩阵转换矩阵将该标识转换为矢量作为该标识对应的标识矢量。需要说明的是,在确定第一标识集合和/或第二标识集合中任一标识对应的标识度量矢量时,先基于矢量矩阵转换确定该标识对应的标识矢量(即将该标识的one-hot矢量与矢量矩阵转换相乘),然后将该标识对应的标识矢量与该标识对应的时间矢量和/或地点矢量进行拼接,拼接后的矢量作为该标识对应的标识度量矢量,本实施例并不限于此,在另一种可能的实现方式中,可先将该标识的one-hot矢量与该标识对应的时间矢量和/或地点矢量进行拼接,获得拼接后的矢量,然后将拼接后的矢量与矢量转换矩阵相乘,获得的矢量作为该标识对应的标识度量矢量,当然,训练矢量转换矩阵时,也采用同样的方法确定作为训练样本的标识度量矢量。
以下对确定第一标识集合和/或第二标识集合中任一标识对应的时间矢量的过程进行介绍。
需要说明的是,在确定一标识对应的时间矢量时,假设预设时间段内包括P个时间点,则可将P个时间点设置为一个P维矢量作为时间矢量,每个时间点对应时间矢量中的一个维度。
假设目标标识D与一标识A之间产生1次联系,则根据产生联系时的联系时间生成一个P维矢量,作为标识A对应的时间矢量,假设产生联系时的联系时间为时间点Q,则P维时间矢量中,时间点Q对应的维度可设置为1,其它维度可设置为0。比如,预设时段为一天24个小时,每个小时为一个时间点,可将24个时间点设置为一个24维矢量,假设目标标识D与标识A产生联系时的联系时间为10点,则可将24维矢量中10点对应的维度设置为1,其它维度设置为0。
当然,还存在目标标识D与一标识A之间产生了M(M大于1)次联系事件的情况,此时,标识A对应的联系时间信息为M个,则针对每个联系时间均生成一时间矢量,可获得M个时间矢量,而标识A对应的时间矢量可以为M个时间矢量的均值。
以下对确定第一标识集合和/或第二标识集合中任一标识对应的地点矢量的过程进行介绍。
在确定一标识对应的地点矢量时,假设预设范围内包括N个地点,则可将N个地点设置为一个N维矢量,每个地点对应N维矢量中的一个维度。
假设一标识A与目标标识D发生了1次联系事件,则根据发生联系事件时,标识A对应的联系地点生成一个N维矢量作为标识A对应的地点矢量,假设标识A与目标标识D产生联系时,标识A对应的联系地点为Y,则N维矢量中,可将联系地点Y对应的维度设置为1,其它维度设置为0。比如,全国范围内包括334个城市,可将每个城市作为一个联系地点,则可设置一个334维矢量,假设发生联系事件时,标识A对应的联系地点为北京,则可将334维矢量中,北京对应的维度设置为1,其它维度设置为0。
当然,还存在标识A与目标标识D之间发生了M(M大于1)次联系事件的情况,此时,标识A对应的联系地点为M个,则针对每个联系地点均生成一个N维地点矢量,则可获得M个N维地点矢量,而标识A对应的地点矢量可以为M个N维地点矢量的均值。
在本申请的另一实施例中,对上述实施例中的“步骤S103:基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息”进行介绍。
基于目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息的实现过程有多种,请参阅图7,示出了一种可能的实现方式的流程示意图,可以包括:
步骤S701:基于目标标识对应的声纹矢量和标识度量矢量,以及,标识库中各个待比对标识对应的声纹矢量和标识度量矢量,确定目标标识与标识库中各个待比对标识的身份相似度。
具体的,对于标识库中的每个待比对标识:通过目标标识对应的标识度量矢量和该待比对标识对应的标识度量矢量,确定目标标识与该待比对标识对应的第一身份相似度;通过目标标识对应的声纹信息和该待比对标识对应的声纹矢量,确定目标标识与该待比对标识的第二身份相似度;基于目标标识与该待比对标识的第一身份相似度和第二身份相似度,确定目标标识与该待比对标识的最终身份相似度。
其中,基于目标标识与该待比对标识的第一身份相似度和第二身份相似度,确定目标标识与该待比对标识的最终身份相似度的实现方式有多种,在一种可能的实现方式中,可将目标标识与该待比对标识的第一身份相似度和第二身份相似度直接求和,求和结果作为目标标识与该待比对标识的最终身份相似度。在另一种可能的实现方式中,可分别为第一身份相似度和第二身份相似度设定权重,即将目标标识与该待比对标识的第一身份相似度和第二身份相似度分别加权后再求和,加权再求和得到的结果作为目标标识与该待比对标识的最终身份相似度,即:
其中,S1和S2依次为目标标识与该待比对标识对应的第一身份相似度和第二身份相似度,ω1为S1的权重,ω2为S2的权重,ω1和ω2可基于经验设定,且ω12=1,S即为目标标识与该待比对标识的最终身份相似度。
在某些情况下,标识可能拥有通信群,比如,某微信号可能有一个或多个微信群,基于此,本实施例可结合标识所拥有的通信群的数量,确定目标标识与该待比对标识的第一身份相似度。
具体的,对于标识库中的每个待比对标识:首先,获取目标标识和该待比对标识分别拥有的通信群的个数,以及,目标标识和该待比对标识共有的通信群的个数;然后,通过目标标识和该待比对标识分别拥有的通信群的个数,以及,目标标识和该待比对标识共有的通信群的个数,确定相似度权重;最后,通过目标标识和该待比对标识分别对应的标识度量矢量和相似度权重,确定目标标识与该待比对标识的第一身份相似度。
假设目标标识为IDX,待比对标识为IDY,目标标识IDX对应的标识度量矢量为X,待比对标识IDY对应的标识度量矢量为Y,目标标识IDX拥有NX个通信群,待比对标识IDY拥有NY个通信群,目标标识IDX和待比对标识IDY共有的微信群(IDX和IDY拥有的相同的通信群)为Nz个,则目标标识IDX与待比对标识IDY的第一身份相似度S1为:
其中,为相似度权重,<>表示内积,||表示矢量的模。
步骤S702:将与目标标识的身份相似度最大的待比对标识对应的用户身份,确定为目标标识对应的用户身份信息。
在获得目标标识与标识库中各个待比对标识的身份相似度后,从这些相似度中确定出最大相似度,最大相似度对应的标识所对应的用户身份信息即为目标标识对应的用户身份信息。
请参阅图8,示出了基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息的另一种可能的实现方式的流程示意图,可以包括:
步骤S801:基于目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合。
具体的,基于目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合的过程可以包括:对于标识库中的每个待比对标识,通过目标标识对应的标识度量数量和该待比对标识对应的标识度量矢量,确定目标标识与该待比对标识的身份相似度,以得到目标标识分别与标识库中各个待比对标识的身份相似度;将与目标标识的身份相似度大于或等于预设相似度阈值的标识组成的集合确定为候选标识集合。
步骤S802:至少基于目标标识对应的声纹矢量,从候选标识集合中确定出与目标标识的身份相似度最高的标识。
至少基于目标标识对应的声纹矢量,从候选标识集合中确定出与目标标识的身份相似度最高的标识的实现方式有多种,在一种可能的实现方式中,对于候选标识集合中的每个候选标识,通过目标标识对应的声纹矢量和该候选标识对应的声纹矢量,确定目标标识与该候选标识的身份相似度,以得到目标标识与各个候选标识的身份相似度,从目标标识与各个候选标识的身份相似度中确定出最大的身份相似度,将最大的身份相似度对应的候选标识确定为与目标标识的身份相似度最高的标识。
在另一种可能的实现方式中,对于候选标识集合中的每个候选标识,首先通过目标标识对应的标识度量矢量和该候选标识对应的标识度量矢量,确定目标标识与该候选标识的第一身份相似度,然后通过目标标识对应的声纹矢量和该候选标识对应的声纹矢量,确定目标标识与该候选标识的第二身份相似度,最后通过目标标识与该候选标识的第一身份相似度和第二相似度确定目标标识与该候选标识最终的身份相似度,以得到目标标识与候选标识集合中各个候选标识的身份相似度,从目标标识与候选标识集合中各个候选标识的身份相似度中确定出最大的身份相似度,将最大的身份相似度对应的候选标识确定为与目标标识的身份相似度最高的标识。
步骤S803:将与目标标识的身份相似度最高的标识对应的用户身份信息,确定为目标标识对应的用户身份信息。
需要说明的是,在基于两个标识分别对应的声纹矢量确定两个标识的身份相似度时,可以但不限定为基于两个标识分别对应的声纹矢量采用余弦距离确定两个标识的身份相似度,同样地,在基于两个标识分别对应的标识度量矢量确定两个标识的身份相似度时,可以但不限定为基于两个标识分别对应的标识度量矢量采用余弦距离确定两个标识的身份相似度。
鉴于同一用户的不同标识的关联标识信息相似,以及,相似标识在矢量空间具备相似性,本申请实施例用能够表征目标标识关联标识信息的标识度量矢量辅助声纹矢量确定目标标识对应的用户身份信息,这种方式能够较准确确定出目标标识对应的用户身份信息,用户体验较好。
本申请实施例还提供了一种基于声纹识别的身份认证装置,下面对本申请实施例提供的基于声纹识别的身份认证装置进行描述,下文描述的基于声纹识别的身份认证装置与上文描述的基于声纹识别的身份认证方法可相互对应参照。
请参阅图9,示出了本申请实施例提供的一种基于声纹识别的身份认证装置的结构示意图,如图9所示,该装置可以包括:信息获取模块901、矢量确定模块902和身份确定模块903。
信息获取模块901,用于获取目标标识的关联标识信息。
其中,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
矢量确定模块902,用于基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
身份识别模块903,用于基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
鉴于同一用户的不同标识的关联标识信息相似,以及,相似标识在矢量空间具备相似性,本申请实施例提供的基于声纹识别的身份认证装置,用能够表征目标标识关联标识信息的标识度量矢量辅助声纹矢量确定目标标识对应的用户身份信息,这种方式能够较准确确定出目标标识对应的用户身份信息,用户体验较好。
在一种可能的实现方式中,上述实施例提供的基于声纹识别的身份认证装置中,信息获取模块901获取的关联标识信息中的目标标识集合包括:第一标识集合和/或第二标识集合,其中,所述第一标识集合为所述目标标识为发起联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合,所述第二标识集合为所述目标标识作为被联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合。
所述目标标识的关联标识信息还包括:所述目标标识集合中的每个标识对应的属性信息,任一标识对应的属性信息为该标识与所述目标标识直接或间接产生联系时,该标识对应的属性信息。
可选的,信息获取模块901获取的关联标识信息还包括:所述目标标识集合中的每个标识对应的属性信息,任一标识对应的属性信息为该标识与所述目标标识直接或间接产生联系时,该标识对应的属性信息。
在一种可能的实现方式中,上述实施例提供的基于声纹识别的身份认证装置中,矢量确定模块902,包括:第一度量矢量确定子模块和/或第二度量矢量确定子模块,以及标识度量矢量确定子模块。
第一度量矢量确定子模块,用于确定所述第一标识集合中的每个标识对应的标识度量矢量,并获取所述第一标识集合中的每个标识对应的联系次数,通过所述第一标识集合中的每个标识对应的标识度量矢量和联系次数,确定所述目标标识对应的第一度量矢量。
第二度量矢量确定子模块,用于确定所述第二标识集合中的每个标识对应的标识度量矢量,并获取所述第二标识集合中的每个标识对应的联系次数,通过所述第二标识集合中的每个标识对应的标识度量矢量和联系次数,确定所述目标标识对应的第二度量矢量;
标识度量矢量确定子模块,用于将所述第一度量矢量,或者,所述第二度量矢量,或者,所述第一度量矢量和所述第二度量矢量拼接后的矢量,作为所述目标标识对应的标识度量矢量。
在一种可能的实现方式中,矢量确定模块902在确定所述第一标识集合或所述第二标识集合中的每个标识对应的标识度量矢量时,具体用于针对所述第一标识集合或所述第二标识集合中的每个标识:确定该标识对应的标识矢量,作为该标识对应的标识度量矢量;或者,确定该标识对应的标识矢量;基于该标识对应的联系次数,以及,该标识与所述目标标识每次直接或间接产生联系的属性信息,确定该标识对应的属性矢量;将该标识对应的属性矢量与该标识对应的标识矢量拼接,拼接后的矢量作为该标识对应的标识度量矢量。
可选的,任一标识对应的属性信息至少包括:该标识与所述目标标识直接或间接产生联系时,该标识对应的联系时间和/或联系地点。
则矢量确定模块902在基于该标识对应的联系次数,以及,该标识与所述目标标识每次直接或间接产生联系时,该标识对应的属性信息,确定该标识对应的属性矢量时,具体用于:将该标识与所述目标标识每次直接或间接产生联系时,该标识对应的联系时间转换为时间矢量,获得至少一个时间矢量,和/或,将该标识与所述目标标识每次直接或间接产生联系时,该标识对应的联系地点转换为地点矢量,获得至少一个地点矢量;计算所述至少一个时间矢量的平均值作为该标识对应的时间矢量,和/或,计算所述至少一个地点矢量的平均值作为该标识对应的地点矢量。
在一种可能的实现方式中,矢量确定模块902在确定该标识对应的标识矢量时,具体用于基于该标识本身的内容将该标识转换为唯一能够表征该标识的矢量,作为该标识对应的标识矢量;或者,基于预先确定的矢量转换矩阵将该标识转换为矢量,作为该标识对应的标识矢量。
在一种可能的实现方式中,上述实施例提供的基于声纹识别的身份认证装置还可以包括:矢量转换矩阵确定模块。
所述矢量转换矩阵确定模块包括:获取子模块和训练子模块。
所述获取子模块,用于获取同一标识在组成所述预设时段的两个不同时段分别对应的标识度量矢量作为正样本,并获取两个不同标识在所述预设时段分别对应的标识度量矢量作为负样本。
其中,一标识对应的标识度量矢量基于与该标识直接或间接产生联系的标识和初始矢量转换矩阵确定。
所述训练子模块,用于利用所述正样本和所述负样本,基于预设的损失函数,训练矢量转换矩阵,以使同一标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量差别逐渐减小,两个不同标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量的差别逐渐增大。
在一种可能的实现方式中,上述实施例提供的基于声纹识别的身份认证装置中,身份识别模块903可以包括:身份相似度确定子模块和用户身份确定子模块。
所述身份相似度确定子模块,用于基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识与标识库中各个待比对标识的身份相似度。
所述用户身份确定子模块,用于将与所述目标标识的身份相似度最高的待比对标识对应的用户身份信息,确定为所述目标标识对应的用户身份信息。
在一种可能的实现方式中,所述身份相似度确定子模块,具体用于对于所述标识库中的每个待比对标识:
基于所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的第一身份相似度;基于所述目标标识和该待比对标识分别对应的声纹矢量,确定所述目标标识与该待比对标识的第二身份相似度;通过所述第一相似度和所述第二相似度,确定所述目标标识与该待比对标识最终的身份相似度;以得到所述目标标识与所述标识库中各个待比对标识的身份相似度。
在一种可能的实现方式中,所述身份相似度确定子模块,在通过所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的第一身份相似度时,具体用于:获取所述目标标识和该待比对标识分别拥有的通信群的个数,以及,所述目标标识和该待比对标识共有的通信群的个数;通过所述目标标识和该待比对标识分别拥有的通信群的个数,以及,所述目标标识和该待比对标识共有的通信群的个数,确定相似度权重;通过所述目标标识和该待比对标识分别对应的标识度量矢量和所述相似度权重,确定所述目标标识与该待比对标识的第一身份相似度。
在另一种可能的实现方式中,上述实施例提供的基于声纹识别的身份认证装置中,身份识别模块903可以包括:标识筛选子模块、标识确定子模块和用户身份确定子模块。
所述标识筛选子模块,用于基于所述目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合。
所述标识确定子模块,用于至少基于所述目标标识对应的声纹矢量,从所述候选标识集合中确定出与所述目标标识的身份相似度最高的标识。
所述用户身份确定子模块,用于将与所述目标标识的身份相似度最高的标识对应的用户身份信息,确定为所述目标标识对应的用户身份信息。
在一种可能的实现方式中,所述标识筛选子模块,具体用于对于所述标识库中的每个待比对标识,通过所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的身份相似度,以得到所述目标标识与所述标识库中各个待比对标识的身份相似度;将所述目标标识与所述标识库中各个待比对标识的身份相似度中,与所述目标标识的身份相似度大于或等于预设相似度阈值的标识组成所述候选标识集合。
本申请实施例还提供了一种基于声纹识别的身份认证设备,请参阅图10,示出了该基于声纹识别的身份认证设备的结构示意图,该设备可以包括:至少一个处理器1001,至少一个通信接口1002,至少一个存储器1003和至少一个通信总线1004;
在本申请实施例中,处理器1001、通信接口1002、存储器1003、通信总线1004的数量为至少一个,且处理器1001、通信接口1002、存储器1003通过通信总线1004完成相互间的通信;
处理器1001可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成本发明实施例的一个或多个集成电路等;
存储器1003可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取目标标识的关联标识信息,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取目标标识的关联标识信息,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种基于声纹识别的身份认证方法,其特征在于,包括:
获取目标标识的关联标识信息,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
2.根据权利要求1所述的基于声纹识别的身份认证方法,其特征在于,所述目标标识集合包括:第一标识集合和/或第二标识集合,其中,所述第一标识集合为所述目标标识为发起联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合,所述第二标识集合为所述目标标识为被联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合;
所述目标标识的关联标识信息还包括:所述目标标识集合中的每个标识对应的属性信息,任一标识对应的属性信息为该标识与所述目标标识直接或间接产生联系时,该标识对应的属性信息。
3.根据权利要求2所述的基于声纹识别的身份认证方法,其特征在于,所述基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量,包括:
确定所述第一标识集合中的每个标识对应的标识度量矢量,并获取所述第一标识集合中的每个标识对应的联系次数,通过所述第一标识集合中的每个标识对应的标识度量矢量和联系次数,确定所述目标标识对应的第一度量矢量;
和/或,确定所述第二标识集合中的每个标识对应的标识度量矢量,并获取所述第二标识集合中的每个标识对应的联系次数,通过所述第二标识集合中的每个标识对应的标识度量矢量和联系次数,确定所述目标标识对应的第二度量矢量;
将所述第一度量矢量,或者,所述第二度量矢量,或者,所述第一度量矢量和所述第二度量矢量拼接后的矢量,作为所述目标标识对应的标识度量矢量。
4.根据权利要求3所述的基于声纹识别的身份认证方法,其特征在于,确定所述第一标识集合和/或所述第二标识集合中的每个标识对应的标识度量矢量,包括:
针对所述第一标识集合和/或所述第二标识集合中的每个标识:
确定该标识对应的标识矢量,作为该标识对应的标识度量矢量;
或者,
确定该标识对应的标识矢量;
基于该标识对应的联系次数,以及,该标识与所述目标标识每次直接或间接产生联系时,该标识对应的属性信息,确定该标识对应的属性矢量;
将该标识对应的属性矢量与该标识对应的标识矢量拼接,拼接后的矢量作为该标识对应的标识度量矢量。
5.根据权利要求4所述的基于声纹识别的身份认证方法,其特征在于,任一标识对应的属性信息至少包括:该标识与所述目标标识直接或间接产生联系时,该标识对应的联系时间和/或联系地点;
所述基于该标识对应的联系次数,以及,该标识与所述目标标识每次直接或间接产生联系时,该标识对应的属性信息,确定该标识对应的属性矢量包括:
将该标识与所述目标标识每次直接或间接产生联系时,该标识对应的联系时间转换为时间矢量,获得至少一个时间矢量,和/或,将该标识与所述目标标识每次直接或间接产生联系时,该标识对应的联系地点转换为地点矢量,获得至少一个地点矢量;
计算所述至少一个时间矢量的平均值作为该标识对应的时间矢量,和/或,计算所述至少一个地点矢量的平均值作为该标识对应的地点矢量。
6.根据权利要求4所述的基于声纹识别的身份认证方法,其特征在于,所述确定该标识对应的标识矢量,包括:
基于该标识本身的内容将该标识转换为唯一能够表征该标识的矢量,作为该标识对应的标识矢量;
或者,基于预先确定的矢量转换矩阵将该标识转换为矢量,作为该标识对应的标识矢量。
7.根据权利要求6所述的基于声纹识别的身份认证方法,其特征在于,预先确定所述矢量转换矩阵的过程包括:
获取同一标识在组成所述预设时段的两个不同时段分别对应的标识度量矢量作为正样本,并获取两个不同标识在所述预设时段分别对应的标识度量矢量作为负样本,其中,一标识对应的标识度量矢量基于与该标识直接或间接产生联系的标识和初始矢量转换矩阵确定;
利用所述正样本和所述负样本,基于预设的损失函数,训练矢量转换矩阵,以使同一标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量差别逐渐减小,两个不同标识基于训练得到的矢量转换矩阵确定的两个标识度量矢量的差别逐渐增大。
8.根据权利要求1~7中任意一项所述的基于声纹识别的身份认证方法,其特征在于,所述基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息,包括:
基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识与标识库中各个待比对标识的身份相似度;
将与所述目标标识的身份相似度最高的待比对标识对应的用户身份信息,确定为所述目标标识对应的用户身份信息。
9.根据权利要求8所述的基于声纹识别的身份认证方法,其特征在于,所述基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识与标识库中各个待比对标识的身份相似度,包括:
对于所述标识库中的每个待比对标识:
基于所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的第一身份相似度;
基于所述目标标识和该待比对标识分别对应的声纹矢量,确定所述目标标识与该待比对标识的第二身份相似度;
通过所述第一相似度和所述第二相似度,确定所述目标标识与该待比对标识最终的身份相似度;
以得到所述目标标识与所述标识库中各个待比对标识的身份相似度。
10.根据权利要求9所述的基于声纹识别的身份认证方法,其特征在于,所述通过所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的第一身份相似度,包括:
获取所述目标标识和该待比对标识分别拥有的通信群的个数,以及,所述目标标识和该待比对标识共有的通信群的个数;
通过所述目标标识和该待比对标识分别拥有的通信群的个数,以及,所述目标标识和该待比对标识共有的通信群的个数,确定相似度权重;
通过所述目标标识和该待比对标识分别对应的标识度量矢量和所述相似度权重,确定所述目标标识与该待比对标识的第一身份相似度。
11.根据权利要求1~7中任意一项所述的基于声纹识别的身份认证方法,其特征在于,所述基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息,包括:
基于所述目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合;
至少基于所述目标标识对应的声纹矢量,从所述候选标识集合中确定出与所述目标标识的身份相似度最高的标识;
将与所述目标标识的身份相似度最高的标识对应的用户身份信息,确定为所述目标标识对应的用户身份信息。
12.根据权利要求11所述的基于声纹识别的身份认证方法,其特征在于,所述基于所述目标标识对应的标识度量矢量,从标识库中筛选出候选标识,组成候选标识集合,包括:
对于所述标识库中的每个待比对标识,通过所述目标标识和该待比对标识分别对应的标识度量矢量,确定所述目标标识与该待比对标识的身份相似度,以得到所述目标标识与所述标识库中各个待比对标识的身份相似度;
将所述目标标识与所述标识库中各个待比对标识的身份相似度中,与所述目标标识的身份相似度大于或等于预设相似度阈值的标识组成所述候选标识集合。
13.一种基于声纹识别的身份认证装置,其特征在于,包括:信息获取模块、矢量确定模块和身份识别模块;
所述信息获取模块,用于获取目标标识的关联标识信息,所述目标标识的关联标识信息至少包括:在预设时间段内,与所述目标标识直接或间接产生联系的标识组成的目标标识集合;
所述矢量确定模块,用于基于所述目标标识的关联标识信息,确定所述目标标识对应的标识度量矢量;
所述身份识别模块,用于基于所述目标标识对应的声纹矢量和标识度量矢量,确定所述目标标识对应的用户身份信息。
14.根据权利要求13所述的基于声纹识别的身份认证装置,其特征在于,所述信息获取模块获取的所述目标标识集包括:第一标识集合和/或第二标识集合,其中,所述第一标识集合为所述目标标识为发起联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合,所述第二标识集合为所述目标标识为被联系的标识时,与所述目标标识直接或间接产生联系的标识组成的集合;
所述信息获取模块获取的所述目标标识的关联标识信息还包括:所述目标标识集合中的每个标识对应的属性信息,任一标识对应的属性信息为该标识与所述目标标识直接或间接产生联系时,该标识对应的属性信息。
15.一种基于声纹识别的身份认证设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~12中任一项所述的基于声纹识别的身份认证方法的各个步骤。
16.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~12中任一项所述的基于声纹识别的身份认证方法的各个步骤。
CN201811475745.8A 2018-12-04 2018-12-04 基于声纹识别的身份认证方法、装置、设备及存储介质 Active CN109584886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811475745.8A CN109584886B (zh) 2018-12-04 2018-12-04 基于声纹识别的身份认证方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811475745.8A CN109584886B (zh) 2018-12-04 2018-12-04 基于声纹识别的身份认证方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109584886A true CN109584886A (zh) 2019-04-05
CN109584886B CN109584886B (zh) 2023-01-17

Family

ID=65926167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811475745.8A Active CN109584886B (zh) 2018-12-04 2018-12-04 基于声纹识别的身份认证方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109584886B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111554270A (zh) * 2020-04-29 2020-08-18 北京声智科技有限公司 训练样本筛选方法及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160036800A1 (en) * 2013-04-15 2016-02-04 Visa Europe Limited Method and system for creating a unique identifier
CN105679323A (zh) * 2015-12-24 2016-06-15 讯飞智元信息科技有限公司 一种号码发现方法及系统
CN107958669A (zh) * 2017-11-28 2018-04-24 国网电子商务有限公司 一种声纹识别的方法及装置
CN108429619A (zh) * 2018-01-18 2018-08-21 北京捷通华声科技股份有限公司 身份认证方法和系统
CN108718323A (zh) * 2018-06-29 2018-10-30 北京东方英卡数字信息技术有限公司 一种身份认证方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160036800A1 (en) * 2013-04-15 2016-02-04 Visa Europe Limited Method and system for creating a unique identifier
CN105679323A (zh) * 2015-12-24 2016-06-15 讯飞智元信息科技有限公司 一种号码发现方法及系统
CN107958669A (zh) * 2017-11-28 2018-04-24 国网电子商务有限公司 一种声纹识别的方法及装置
CN108429619A (zh) * 2018-01-18 2018-08-21 北京捷通华声科技股份有限公司 身份认证方法和系统
CN108718323A (zh) * 2018-06-29 2018-10-30 北京东方英卡数字信息技术有限公司 一种身份认证方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111554270A (zh) * 2020-04-29 2020-08-18 北京声智科技有限公司 训练样本筛选方法及电子设备
CN111554270B (zh) * 2020-04-29 2023-04-18 北京声智科技有限公司 训练样本筛选方法及电子设备

Also Published As

Publication number Publication date
CN109584886B (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
RU2738325C2 (ru) Способ и устройство аутентификации личности
CN110570869B (zh) 一种声纹识别方法、装置、设备及存储介质
CN110265037B (zh) 身份验证方法、装置、电子设备及计算机可读存储介质
CN109410956B (zh) 一种音频数据的对象识别方法、装置、设备及存储介质
CN107958669B (zh) 一种声纹识别的方法及装置
CN111599346B (zh) 一种说话人聚类方法、装置、设备及存储介质
CN109448732B (zh) 一种数字串语音处理方法及装置
CN105931642B (zh) 语音识别方法、设备及系统
CN111312286A (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN109002784B (zh) 街景识别方法和系统
CN111508505B (zh) 一种说话人识别方法、装置、设备及存储介质
CN110164417B (zh) 一种语种向量获得、语种识别的方法和相关装置
KR101496876B1 (ko) 휴대 단말기의 소리 인식 방법 및 장치
CN113051384B (zh) 基于对话的用户画像抽取方法及相关装置
CN112487381A (zh) 身份认证方法、装置、电子设备及可读存储介质
CN111611358A (zh) 信息交互方法、装置、电子设备及存储介质
CN109584886B (zh) 基于声纹识别的身份认证方法、装置、设备及存储介质
CN114242047B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN111223487A (zh) 一种信息处理方法及电子设备
CN114240342A (zh) 一种会议控制的方法和装置
CN107729737A (zh) 一种身份信息的获取方法及穿戴设备
CN113468306B (zh) 语音对话方法、装置、电子设备及存储介质
CN115910022A (zh) 一种说话人相关防语音合成攻击方法和系统
CN102308307B (zh) 用于模式发现和识别的方法
CN114491467A (zh) 一种身份认证方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant