CN111444377A - 一种声纹识别的认证方法和装置以及设备 - Google Patents
一种声纹识别的认证方法和装置以及设备 Download PDFInfo
- Publication number
- CN111444377A CN111444377A CN202010293634.6A CN202010293634A CN111444377A CN 111444377 A CN111444377 A CN 111444377A CN 202010293634 A CN202010293634 A CN 202010293634A CN 111444377 A CN111444377 A CN 111444377A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- user
- features
- voiceprint feature
- common
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种声纹识别的认证方法和装置以及设备。其中,所述方法包括:采集至少一个用户的语音数据和个人特征,对该语音数据进行声纹特征提取,根据该个人特征和声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序,根据待测声纹特征对应的用户的个人特征,从该经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户,对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证。通过上述方式,能够实现提高声纹识别的认证效率。
Description
技术领域
本发明涉及声纹技术领域,尤其涉及一种声纹识别的认证方法和装置以及设备。
背景技术
声纹是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,每个人的声纹各不相同,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不同。
声纹识别,是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。
现有的声纹识别的认证方案,一般是采集至少一个用户的语音数据,并对每个用户的语音数据进行声纹特征提取,并根据该提取的声纹特征构建声纹特征数据库,之后,获取任意一个用户的语音数据作为待测语音,对该待测语音进行声纹特征提取,将该提取的声纹特征与该声纹特征数据库中的所有声纹特征进行相似度比较,比较出相似度最高的声纹特征所对应的用户,为该待测语音数据所对应的用户为待认证用户,以及对该声纹特征数据库中的该待认证用户的声纹特征进行认证。
但是,发明人发现现有技术中至少存在如下问题:
现有的声纹识别的认证方案,在声纹识别的认证过程中,由于需要将提取的声纹特征与声纹特征数据库中的所有声纹特征进行相似度比较,该相似度比较过程耗时较长,导致声纹识别的认证效率一般。
发明内容
有鉴于此,本发明的目的在于提出一种声纹识别的认证方法和装置以及设备,能够实现提高声纹识别的认证效率。
根据本发明的一个方面,提供一种声纹识别的认证方法,包括:采集至少一个用户的语音数据和个人特征;其中,所述个人特征包括性别和/或年龄和/或民族和/或籍贯;对所述采集的每个用户的语音数据进行声纹特征提取;根据所述个人特征和所述声纹特征,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库;对所述构建的声纹特征数据库按共性特征的数量进行优先级排序;根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户;对所述经优先级排序后的声纹特征数据库中的所述待认证用户的声纹特征进行认证。
其中,所述根据所述个人特征和所述声纹特征,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库,包括:根据所述个人特征和所述声纹特征,筛选出关联所述个人特征的共性特征的声纹特征数据的集合,根据所述筛选出的声纹特征数据的集合,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库。
其中,所述对所述构建的声纹特征数据库按共性特征的数量进行优先级排序,包括:基于所述至少一个共性特征中的共性特征的出现频率,对含有关联所述出现频率的共性特征的声纹特征数据库子集进行排序,根据所述排序后的含有关联所述出现频率的共性特征的声纹特征数据库,对所述构建的声纹特征数据库按共性特征的数量进行优先级排序。
其中,所述根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户,包括:根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的最多共性特征的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户。
其中,在所述对所述经优先级排序后的声纹特征数据库中的所述待认证用户的声纹特征进行认证之后,还包括:通过所述经认证后的声纹特征来进行所述用户在应用平台的注册。
根据本发明的另一个方面,提供一种声纹识别的认证装置,包括:采集模块、提取模块、构建模块、排序模块、识别模块和认证模块;所述采集模块,用于采集至少一个用户的语音数据和个人特征;其中,所述个人特征包括性别和/或年龄和/或民族和/或籍贯;所述提取模块,用于对所述采集的每个用户的语音数据进行声纹特征提取;所述构建模块,用于根据所述个人特征和所述声纹特征,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库;所述排序模块,用于对所述构建的声纹特征数据库按共性特征的数量进行优先级排序;所述识别模块,用于根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户;所述认证模块,用于对所述经优先级排序后的声纹特征数据库中的所述待认证用户的声纹特征进行认证。
其中,所述构建模块,具体用于:根据所述个人特征和所述声纹特征,筛选出关联所述个人特征的共性特征的声纹特征数据的集合,根据所述筛选出的声纹特征数据的集合,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库。
其中,所述排序模块,具体用于:基于所述至少一个共性特征中的共性特征的出现频率,对含有关联所述出现频率的共性特征的声纹特征数据库子集进行排序,根据所述排序后的含有关联所述出现频率的共性特征的声纹特征数据库,对所述构建的声纹特征数据库按共性特征的数量进行优先级排序。
其中,所述识别模块,具体用于:根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的最多共性特征的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户。
其中,所述声纹识别的认证装置,还包括:注册模块;所述注册模块,用于通过所述经认证后的声纹特征来进行所述用户在应用平台的注册。
根据本发明的又一个方面,提供一种声纹识别的认证设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的声纹识别的认证方法。
根据本发明的再一个方面,提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的声纹识别的认证方法。
可以发现,以上方案,可以采集至少一个用户的语音数据和个人特征,其中,该个人特征包括性别和/或年龄和/或民族和/或籍贯等,和可以对该采集的每个用户的语音数据进行声纹特征提取,和可以根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库,其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,和可以对该构建的声纹特征数据库按共性特征的数量进行优先级排序,以及可以根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户,其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,以及可以对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证,能够实现缩短待测声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够实现提高声纹识别的认证效率。
进一步的,以上方案,可以根据该个人特征和该声纹特征,筛选出关联该个人特征的共性特征的声纹特征数据的集合,根据该筛选出的声纹特征数据的集合,构建关联该个人特征的至少一个共性特征的声纹特征数据库,其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,这样的好处是能够实现通过构建关联该个人特征的至少一个共性特征的声纹特征数据库,能够缩短需识别的声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够提高声纹识别的认证效率。
进一步的,以上方案,可以基于该至少一个共性特征中的共性特征的出现频率,对含有关联该出现频率的共性特征的声纹特征数据库子集进行排序,根据该排序后的含有关联该出现频率的共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序,这样的好处是能够实现使该经优先级排序后的该构建的声纹特征数据库更能匹配用户的个人特征的共性特征,能够便于进一步缩短待测声纹特征与相应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够便于进一步实现提高声纹识别的认证效率。
进一步的,以上方案,可以根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的最多共性特征的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,这样的好处是由于通过关联该用户的个人特征的最多共性特征的声纹特征数据库来进行声纹特征的相似度比较,能够将待测声纹特征与对应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时缩小到最短,进而能够进一步提高声纹识别的认证效率。
进一步的,以上方案,可以通过该经认证后的声纹特征来进行该用户在应用平台的注册,这样的好处是能够实现在该用户登录应用平台时,能够通过该经认证后的声纹特征的唯一性确认进行登录的用户是否是该用户本人,能够保障该用户在应用平台上的用户信息的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明声纹识别的认证方法一实施例的流程示意图;
图2是本发明声纹识别的认证方法另一实施例的流程示意图;
图3是本发明声纹识别的认证装置一实施例的结构示意图;
图4是本发明声纹识别的认证装置另一实施例的结构示意图;
图5是本发明声纹识别的认证设备一实施例的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明作进一步的详细描述。特别指出的是,以下实施例仅用于说明本发明,但不对本发明的范围进行限定。同样的,以下实施例仅为本发明的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种声纹识别的认证方法,能够实现提高声纹识别的认证效率。
请参见图1,图1是本发明声纹识别的认证方法一实施例的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括如下步骤:
S101:采集至少一个用户的语音数据和个人特征;其中,该个人特征包括性别和/或年龄和/或民族和/或籍贯等。
在本实施例中,可以一次性采集多个用户的语音数据,也可以分多次采集多个用户的语音数据,还可以逐一逐个用户的采集用户的语音数据等,本发明不加以限定。
在本实施例中,可以是采集同一用户的多个语音数据,也可以是采集同一用户的单个语音数据,还可以是采集多个用户的多个语音数据等,本发明不加以限定。
S102:对该采集的每个用户的语音数据进行声纹特征提取。
在本实施例中,可以一次性对该采集的每个用户的语音数据进行声纹特征提取,也可以分多次对该采集的每个用户的语音数据进行声纹特征提取,还可以逐一逐个用户的对该采集的每个用户的语音数据进行声纹特征提取等,本发明不加以限定。
S103:根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库;其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库。
其中,该根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库;其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,可以包括:
根据该个人特征和该声纹特征,筛选出关联该个人特征的共性特征的声纹特征数据的集合,根据该筛选出的声纹特征数据的集合,构建关联该个人特征的至少一个共性特征的声纹特征数据库;其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,这样的好处是能够实现通过构建关联该个人特征的至少一个共性特征的声纹特征数据库,能够缩短需识别的声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够提高声纹识别的认证效率。
S104:对该构建的声纹特征数据库按共性特征的数量进行优先级排序。
其中,该对该构建的声纹特征数据库按共性特征的数量进行优先级排序,可以包括:
基于该至少一个共性特征中的共性特征的出现频率,对含有关联该出现频率的共性特征的声纹特征数据库子集进行排序,根据该排序后的含有关联该出现频率的共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序,这样的好处是能够实现使该经优先级排序后的该构建的声纹特征数据库更能匹配用户的个人特征的共性特征,能够便于进一步缩短待测声纹特征与相应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够便于进一步实现提高声纹识别的认证效率。
S105:根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户。
其中,该根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,可以包括:
根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的最多共性特征的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,这样的好处是由于通过关联该用户的个人特征的最多共性特征的声纹特征数据库来进行声纹特征的相似度比较,能够将待测声纹特征与对应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时缩小到最短,进而能够进一步提高声纹识别的认证效率。
S106:对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证。
其中,在该对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证之后,还可以包括:
通过该经认证后的声纹特征来进行该用户在应用平台的注册,这样的好处是能够实现在该用户登录应用平台时,能够通过该经认证后的声纹特征的唯一性确认进行登录的用户是否是该用户本人,能够保障该用户在应用平台上的用户信息的安全性。
可以发现,在本实施例中,可以采集至少一个用户的语音数据和个人特征,其中,该个人特征包括性别和/或年龄和/或民族和/或籍贯等,和可以对该采集的每个用户的语音数据进行声纹特征提取,和可以根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库,其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,和可以对该构建的声纹特征数据库按共性特征的数量进行优先级排序,和可以根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户,其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,以及可以对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证,能够实现缩短待测声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够实现提高声纹识别的认证效率。
进一步的,在本实施例中,可以根据该个人特征和该声纹特征,筛选出关联该个人特征的共性特征的声纹特征数据的集合,根据该筛选出的声纹特征数据的集合,构建关联该个人特征的至少一个共性特征的声纹特征数据库,其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,这样的好处是能够实现通过构建关联该个人特征的至少一个共性特征的声纹特征数据库,能够缩短需识别的声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够提高声纹识别的认证效率。
进一步的,在本实施例中,可以基于该至少一个共性特征中的共性特征的出现频率,对含有关联该出现频率的共性特征的声纹特征数据库子集进行排序,根据该排序后的含有关联该出现频率的共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序,这样的好处是能够实现使该经优先级排序后的该构建的声纹特征数据库更能匹配用户的个人特征的共性特征,能够便于进一步缩短待测声纹特征与相应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够便于进一步实现提高声纹识别的认证效率。
进一步的,在本实施例中,可以根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的最多共性特征的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,这样的好处是由于通过关联该用户的个人特征的最多共性特征的声纹特征数据库来进行声纹特征的相似度比较,能够将待测声纹特征与对应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时缩小到最短,进而能够进一步提高声纹识别的认证效率。
请参见图2,图2是本发明声纹识别的认证方法另一实施例的流程示意图。本实施例中,该方法包括以下步骤:
S201:采集至少一个用户的语音数据和个人特征;其中,该个人特征包括性别和/或年龄和/或民族和/或籍贯等。
可如上S101所述,在此不作赘述。
S202:对该采集的每个用户的语音数据进行声纹特征提取。
可如上S102所述,在此不作赘述。
S203:根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库;其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库。
可如上S103所述,在此不作赘述。
S204:对该构建的声纹特征数据库按共性特征的数量进行优先级排序。
可如上S104所述,在此不作赘述。
S205:根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户。
可如上S105所述,在此不作赘述。
S206:对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证。
S207:通过该经认证后的声纹特征来进行该用户在应用平台的注册。
可以发现,在本实施例中,可以通过该经认证后的声纹特征来进行该用户在应用平台的注册,这样的好处是能够实现在该用户登录应用平台时,能够通过该经认证后的声纹特征的唯一性确认进行登录的用户是否是该用户本人,能够保障该用户在应用平台上的用户信息的安全性。
本发明还提供一种声纹识别的认证装置,能够实现提高声纹识别的认证效率。
请参见图3,图3是本发明声纹识别的认证装置一实施例的结构示意图。本实施例中,该声纹识别的认证装置30包括采集模块31、提取模块32、构建模块33、排序模块34、识别模块35和认证模块36。
该采集模块31,用于采集至少一个用户的语音数据和个人特征;其中,该个人特征包括性别和/或年龄和/或民族和/或籍贯等。
该提取模块32,用于对该采集的每个用户的语音数据进行声纹特征提取。
该构建模块33,用于根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库;其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库。
该排序模块34,用于对该构建的声纹特征数据库按共性特征的数量进行优先级排序。
该识别模块35,用于根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户。
该认证模块36,用于对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证。
可选地,该构建模块33,可以具体用于:
根据该个人特征和该声纹特征,筛选出关联该个人特征的共性特征的声纹特征数据的集合,根据该筛选出的声纹特征数据的集合,构建关联该个人特征的至少一个共性特征的声纹特征数据库;其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库。
可选地,该排序模块34,可以具体用于:
基于该至少一个共性特征中的共性特征的出现频率,对含有关联该出现频率的共性特征的声纹特征数据库子集进行排序,根据该排序后的含有关联该出现频率的共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序。
可选地,该识别模块35,可以具体用于:
根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的最多共性特征的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户。
请参见图4,图4是本发明声纹识别的认证装置另一实施例的结构示意图。区别于上一实施例,本实施例所述声纹识别的认证装置40还包括注册模块41。
该注册模块41,用于通过该经认证后的声纹特征来进行该用户在应用平台的注册。
该声纹识别的认证装置30/40的各个单元模块可分别执行上述方法实施例中对应步骤,故在此不对各单元模块进行赘述,详细请参见以上对应步骤的说明。
本发明又提供一种声纹识别的认证设备,如图5所示,包括:至少一个处理器51;以及,与至少一个处理器51通信连接的存储器52;其中,存储器52存储有可被至少一个处理器51执行的指令,指令被至少一个处理器51执行,以使至少一个处理器51能够执行上述的声纹识别的认证方法。
其中,存储器52和处理器51采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器51和存储器52的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器51处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器51。
处理器51负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器52可以被用于存储处理器51在执行操作时所使用的数据。
本发明再提供一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
可以发现,以上方案,可以采集至少一个用户的语音数据和个人特征,其中,该个人特征包括性别和/或年龄和/或民族和/或籍贯等,和可以对该采集的每个用户的语音数据进行声纹特征提取,和可以根据该个人特征和该声纹特征,构建关联该个人特征的至少一个共性特征的声纹特征数据库,其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,和可以对该构建的声纹特征数据库按共性特征的数量进行优先级排序,和可以根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户,其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,以及可以对该经优先级排序后的声纹特征数据库中的该待认证用户的声纹特征进行认证,能够实现缩短待测声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够实现提高声纹识别的认证效率。
进一步的,以上方案,可以根据该个人特征和该声纹特征,筛选出关联该个人特征的共性特征的声纹特征数据的集合,根据该筛选出的声纹特征数据的集合,构建关联该个人特征的至少一个共性特征的声纹特征数据库,其中,该共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯等的声纹特征数据库,这样的好处是能够实现通过构建关联该个人特征的至少一个共性特征的声纹特征数据库,能够缩短需识别的声纹特征与声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够提高声纹识别的认证效率。
进一步的,以上方案,可以基于该至少一个共性特征中的共性特征的出现频率,对含有关联该出现频率的共性特征的声纹特征数据库子集进行排序,根据该排序后的含有关联该出现频率的共性特征的声纹特征数据库,对该构建的声纹特征数据库按共性特征的数量进行优先级排序,这样的好处是能够实现使该经优先级排序后的该构建的声纹特征数据库更能匹配用户的个人特征的共性特征,能够便于进一步缩短待测声纹特征与相应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时,进而能够便于进一步实现提高声纹识别的认证效率。
进一步的,以上方案,可以根据待测声纹特征对应的用户的个人特征,从关联该用户的个人特征的最多共性特征的声纹特征数据库中,识别出与该待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,该待测声纹特征对应的用户为该标记后的声纹特征数据库中的用户,这样的好处是由于通过关联该用户的个人特征的最多共性特征的声纹特征数据库来进行声纹特征的相似度比较,能够将待测声纹特征与对应的声纹特征数据库中的声纹特征进行相似度比较过程的耗时缩小到最短,进而能够进一步提高声纹识别的认证效率。
进一步的,以上方案,可以通过该经认证后的声纹特征来进行该用户在应用平台的注册,这样的好处是能够实现在该用户登录应用平台时,能够通过该经认证后的声纹特征的唯一性确认进行登录的用户是否是该用户本人,能够保障该用户在应用平台上的用户信息的安全性。
在本发明所提供的几个实施方式中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的部分实施例,并非因此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效装置或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种声纹识别的认证方法,其特征在于,包括:
采集至少一个用户的语音数据和个人特征;其中,所述个人特征包括性别和/或年龄和/或民族和/或籍贯;
对所述采集的每个用户的语音数据进行声纹特征提取;
根据所述个人特征和所述声纹特征,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库;
对所述构建的声纹特征数据库按共性特征的数量进行优先级排序;
根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户;
对所述经优先级排序后的声纹特征数据库中的所述待认证用户的声纹特征进行认证。
2.如权利要求1所述的声纹识别的认证方法,其特征在于,所述根据所述个人特征和所述声纹特征,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库,包括:
根据所述个人特征和所述声纹特征,筛选出关联所述个人特征的共性特征的声纹特征数据的集合,根据所述筛选出的声纹特征数据的集合,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库。
3.如权利要求1所述的声纹识别的认证方法,其特征在于,所述对所述构建的声纹特征数据库按共性特征的数量进行优先级排序,包括:
基于所述至少一个共性特征中的共性特征的出现频率,对含有关联所述出现频率的共性特征的声纹特征数据库子集进行排序,根据所述排序后的含有关联所述出现频率的共性特征的声纹特征数据库,对所述构建的声纹特征数据库按共性特征的数量进行优先级排序。
4.如权利要求1所述的声纹识别的认证方法,其特征在于,所述根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户,包括:
根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的最多共性特征的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户。
5.如权利要求1所述的声纹识别的认证方法,其特征在于,在所述对所述经优先级排序后的声纹特征数据库中的所述待认证用户的声纹特征进行认证之后,还包括:
通过所述经认证后的声纹特征来进行所述用户在应用平台的注册。
6.一种声纹识别的认证装置,其特征在于,包括:
采集模块、提取模块、构建模块、排序模块、识别模块和认证模块;
所述采集模块,用于采集至少一个用户的语音数据和个人特征;其中,所述个人特征包括性别和/或年龄和/或民族和/或籍贯;
所述提取模块,用于对所述采集的每个用户的语音数据进行声纹特征提取;
所述构建模块,用于根据所述个人特征和所述声纹特征,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库;
所述排序模块,用于对所述构建的声纹特征数据库按共性特征的数量进行优先级排序;
所述识别模块,用于根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的至少一个共性特征且经优先级排序后的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户;
所述认证模块,用于对所述经优先级排序后的声纹特征数据库中的所述待认证用户的声纹特征进行认证。
7.如权利要求6所述的声纹识别的认证装置,其特征在于,所述构建模块,具体用于:
根据所述个人特征和所述声纹特征,筛选出关联所述个人特征的共性特征的声纹特征数据的集合,根据所述筛选出的声纹特征数据的集合,构建关联所述个人特征的至少一个共性特征的声纹特征数据库;其中,所述共性特征的声纹特征数据库包括相同性别和/或相同年龄和/或相同民族和/或相同籍贯的声纹特征数据库。
8.如权利要求6所述的声纹识别的认证装置,其特征在于,所述排序模块,具体用于:
基于所述至少一个共性特征中的共性特征的出现频率,对含有关联所述出现频率的共性特征的声纹特征数据库子集进行排序,根据所述排序后的含有关联所述出现频率的共性特征的声纹特征数据库,对所述构建的声纹特征数据库按共性特征的数量进行优先级排序。
9.如权利要求6所述的声纹识别的认证装置,其特征在于,所述识别模块,具体用于:
根据待测声纹特征对应的用户的个人特征,从关联所述用户的个人特征的最多共性特征的声纹特征数据库中,识别出与所述待测声纹特征相似度最高的声纹特征对应的用户为待认证用户;其中,所述待测声纹特征对应的用户为所述标记后的声纹特征数据库中的用户。
10.如权利要求6所述的声纹识别的认证装置,其特征在于,所述声纹识别的认证装置,还包括:
注册模块;
所述注册模块,用于通过所述经认证后的声纹特征来进行所述用户在应用平台的注册。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010293634.6A CN111444377A (zh) | 2020-04-15 | 2020-04-15 | 一种声纹识别的认证方法和装置以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010293634.6A CN111444377A (zh) | 2020-04-15 | 2020-04-15 | 一种声纹识别的认证方法和装置以及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111444377A true CN111444377A (zh) | 2020-07-24 |
Family
ID=71653158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010293634.6A Pending CN111444377A (zh) | 2020-04-15 | 2020-04-15 | 一种声纹识别的认证方法和装置以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111444377A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113366567A (zh) * | 2021-05-08 | 2021-09-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种声纹识别方法、歌手认证方法、电子设备及存储介质 |
CN113921016A (zh) * | 2021-10-15 | 2022-01-11 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、装置、电子设备以及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1858733A (zh) * | 2005-11-01 | 2006-11-08 | 华为技术有限公司 | 信息检索系统和检索方法 |
US20140237576A1 (en) * | 2013-01-29 | 2014-08-21 | Tencent Technology (Shenzhen) Company Limited | User authentication method and apparatus based on audio and video data |
CN109036436A (zh) * | 2018-09-18 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种声纹数据库建立方法、声纹识别方法、装置及系统 |
CN109948718A (zh) * | 2019-03-26 | 2019-06-28 | 广州国音智能科技有限公司 | 一种基于多算法融合的系统及方法 |
CN110113635A (zh) * | 2019-04-25 | 2019-08-09 | 广州智伴人工智能科技有限公司 | 一种自动播放推送消息的方法及系统 |
CN110956966A (zh) * | 2019-11-01 | 2020-04-03 | 平安科技(深圳)有限公司 | 声纹认证方法、装置、介质及电子设备 |
-
2020
- 2020-04-15 CN CN202010293634.6A patent/CN111444377A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1858733A (zh) * | 2005-11-01 | 2006-11-08 | 华为技术有限公司 | 信息检索系统和检索方法 |
US20140237576A1 (en) * | 2013-01-29 | 2014-08-21 | Tencent Technology (Shenzhen) Company Limited | User authentication method and apparatus based on audio and video data |
CN109036436A (zh) * | 2018-09-18 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种声纹数据库建立方法、声纹识别方法、装置及系统 |
CN109948718A (zh) * | 2019-03-26 | 2019-06-28 | 广州国音智能科技有限公司 | 一种基于多算法融合的系统及方法 |
CN110113635A (zh) * | 2019-04-25 | 2019-08-09 | 广州智伴人工智能科技有限公司 | 一种自动播放推送消息的方法及系统 |
CN110956966A (zh) * | 2019-11-01 | 2020-04-03 | 平安科技(深圳)有限公司 | 声纹认证方法、装置、介质及电子设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113366567A (zh) * | 2021-05-08 | 2021-09-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种声纹识别方法、歌手认证方法、电子设备及存储介质 |
CN113366567B (zh) * | 2021-05-08 | 2024-06-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种声纹识别方法、歌手认证方法、电子设备及存储介质 |
CN113921016A (zh) * | 2021-10-15 | 2022-01-11 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、装置、电子设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106782564B (zh) | 用于处理语音数据的方法和装置 | |
US10832686B2 (en) | Method and apparatus for pushing information | |
CN111709004B (zh) | 一种身份认证方法、装置、电子设备及可读存储介质 | |
CN101467204B (zh) | 用于生物计量声纹认证的方法和系统 | |
CN113168836A (zh) | 计算机系统、语音识别方法以及程序 | |
CN108429619A (zh) | 身份认证方法和系统 | |
CN110634472B (zh) | 一种语音识别方法、服务器及计算机可读存储介质 | |
CN104104664A (zh) | 对验证码进行验证的方法、服务器、客户端和系统 | |
US20170178632A1 (en) | Multi-user unlocking method and apparatus | |
CN110648671A (zh) | 声纹模型重建方法、终端、装置及可读存储介质 | |
CN107766868A (zh) | 一种分类器训练方法及装置 | |
CN111444377A (zh) | 一种声纹识别的认证方法和装置以及设备 | |
CN107346568A (zh) | 一种门禁系统的认证方法和装置 | |
CN105205367B (zh) | 信息处理方法以及电子设备 | |
CN112487381A (zh) | 身份认证方法、装置、电子设备及可读存储介质 | |
Beigi | Challenges of LargeScale Speaker Recognition | |
JP2001514768A (ja) | 話者証明システム | |
JP2020173381A (ja) | 話者認識方法、話者認識装置、話者認識プログラム、データベース作成方法、データベース作成装置、及びデータベース作成プログラム | |
CN111326163B (zh) | 一种声纹识别方法和装置以及设备 | |
CN111477234A (zh) | 一种声纹数据注册方法和装置以及设备 | |
CN111312258A (zh) | 用户的身份认证方法、装置、服务器及存储介质 | |
CN111415669B (zh) | 一种声纹模型构建方法和装置以及设备 | |
CN109671437B (zh) | 一种音频处理方法、音频处理装置及终端设备 | |
CN111444375A (zh) | 一种声纹识别的验证方法和装置以及设备 | |
CN111128234B (zh) | 一种拼接语音的识别检测方法和装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200724 |
|
RJ01 | Rejection of invention patent application after publication |