CN111081258B - 一种声纹模型管理方法、系统、存储介质及装置 - Google Patents
一种声纹模型管理方法、系统、存储介质及装置 Download PDFInfo
- Publication number
- CN111081258B CN111081258B CN201911079140.1A CN201911079140A CN111081258B CN 111081258 B CN111081258 B CN 111081258B CN 201911079140 A CN201911079140 A CN 201911079140A CN 111081258 B CN111081258 B CN 111081258B
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- voiceprint model
- registered
- fragment
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims abstract description 61
- 239000012634 fragment Substances 0.000 claims abstract description 177
- 230000004044 response Effects 0.000 claims abstract description 91
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000013467 fragmentation Methods 0.000 claims abstract description 8
- 238000006062 fragmentation reaction Methods 0.000 claims abstract description 8
- 238000005192 partition Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种声纹模型管理方法、系统、存储介质及装置,该方法包括:当接收到声纹注册请求时,获取待注册的声纹模型;根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片;将所述待注册的声纹模型转发至所述注册响应分片中进行注册;基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。本发明通过采用分片技术,将声纹模型注册于引擎内存的分片中,并基于预设的一致性协议将该声纹模型同步到该分片的其它副本当中,这样就可以通过添加机器数量来满足数据规模的增长,而无需升级机器配置,并且通过预设的一致性协议来保证分片及其副本之间数据的高度一致性和可用性。
Description
技术领域
本发明属于声纹技术领域,尤其涉及一种声纹模型管理方法、系统、存储介质及装置。
背景技术
声纹识别属于生物识别技术的一种,也称为说话人识别,有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。声纹识别就是把声信号转换成电信号,再用计算机进行识别。
声纹识别的前提是需要预先注册大量的声纹模型,这些注册的声纹模型一般存储于声纹引擎的内存当中,在进行声纹识别时,将实际采集的声纹与存储的声纹模型进行比对认证,从而达到声纹识别的功能。
现有技术当中,目前对声纹模型的管理方案为:在引擎内存中直接存储声纹模型,并且引擎使用多实例部署,以分摊请求压力和满足高可用。由于每个声纹引擎的内存中都全量保存了所有的声纹模型,当数据规模增大时,需要升级机器配置。同时,当某一引擎实例中注册了一个新的声纹模型,会将其发送到redis,同时通知其他引擎实例到redis中读取,这种方式会使各个引擎实例中的数据很难保证一致性。
发明内容
本发明实施例的目的在于提供一种声纹模型管理方法、系统、存储介质及装置,旨在解决现有各实例的声纹数据很难保证一致性的技术问题
本发明实施例是这样实现的,一种声纹模型管理方法,所述方法包括:
当接收到声纹注册请求时,获取待注册的声纹模型;
根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片;
将所述待注册的声纹模型转发至所述注册响应分片中进行注册;
基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
更进一步的,根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片的步骤包括:
根据所述待注册的声纹模型的唯一标识,查询声纹库中是否存在与所述唯一标识对应的分片;
当查询结果为是,则将查询到的分片确定为所述注册响应分片;
当查询结果为否,则创建一个新的空分片作为所述注册响应分片。
更进一步的,所述声纹模型管理方法还包括:
判断声纹库中是否存在数据量超出阈值的分片;
当判断结果为是,则将所述数据量超出阈值的分片按预设规则进行拆分,并基于所述预设的一致性协议,对所述数据量超出阈值的分片的其它副本按相同的拆分结果进行同步拆分。
更进一步的,所述将数据量超出阈值的分片按预设规则进行拆分的步骤包括:
创建一新的空分片,将所述数据量超出阈值的分片中注册的预设数量的声纹模型移入创建的空分片中。
更进一步的,所述声纹模型管理方法还包括:
当接收到声纹认证请求时,获取认证访问的声纹模型;
根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片;
从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型。
更进一步的,在所述根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片的步骤之后,还包括:
判断所述认证响应分片当前是否处于预设节点;
当判断结果为是,则等待所述认证响应分片完成当前节点后,再执行所述从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型的步骤。
更进一步的,在所述基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册的步骤之后,还包括:
当接收到预设数量个成功注册的反馈时,以注册成功为返回结果响应所述声纹注册请求。
此外,本发明实施例还提出一种声纹模型管理系统,所述系统包括:
注册请求模块,用于当接收到声纹注册请求时,获取待注册的声纹模型;
分片确认模块,用于根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片;
注册响应模块,用于将所述待注册的声纹模型转发至所述注册响应分片中进行注册;
数据同步模块,用于基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
此外,本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的声纹模型管理方法。
此外,本发明实施例还提出一种声纹模型管理装置,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的声纹模型管理方法。
与现有技术相比:本发明实施例提供的声纹模型管理方法,通过采用分片技术,将声纹模型注册于引擎内存的分片中,并基于预设的一致性协议将该声纹模型同步到该分片的其它副本当中,这样就可以通过添加机器数量来满足数据规模的增长,而无需升级机器配置,并且通过预设的一致性协议来保证分片及其副本之间数据的高度一致性和可用性。
附图说明
图1是本发明实施例当中提供的声纹模型管理系统的结构图;
图2是本发明实施例一提供的声纹模型管理方法的流程示意图;
图3是本发明实施例二提供的声纹模型管理方法的流程示意图;
图4是本发明实施例三提供的声纹模型管理系统的模块示意图;
图5是本发明实施例四提供的声纹模型管理装置的模块示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明针对现有声纹模型直接存储于引擎内存中,且引擎使用多实例部署,当数据规模增大时,需要升级机器配置,并且各个引擎实例中的数据很难保证一致性的技术问题,提出一种声纹模型管理方法、系统、存储介质及声纹模型管理装置,以通过分片技术,将声纹模型注册于引擎内存的分片及其副本中,达到避免升级机器配置的目的,并且通过预设的一致性协议来保证分片及其副本之间的数据一致性。
请参阅图1,以下各实施例均可应用在图1示出的声纹模型管理系统中,图1示出的声纹模型管理系统包括Proxy(代理)组件、PD(Placement Driver,安置驱动)组件、及若干计算引擎,Proxy组件和PD组件分别与每个计算引擎通讯连接,且Proxy组件与PD组件通讯连接。计算引擎内设有声纹库,声纹库处于计算引擎的内存中,声纹库按照range进行分片,使计算引擎内设有若干分片,如图1中的分片1、分片2和分片3,每个计算引擎内的分片在其它计算引擎内均存在副本,如图1中各个计算引擎内均包含分片1,分片与其副本之间可通过Multi-Raft(即Raft协议,一致性协议当中的一种)来保证数据一致性。PD组件用于管理和调度分片、监测每个分片及其副本之间的预设的一致性协议的leader信息、和提供数据的分片信息查询接口,Proxy组件则用于对外提供声纹引擎的接口。
需要指出的是,图1示出的结构并不构成对声纹模型管理系统的限定,在其它实施例当中,该系统可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
实施例一
请参阅图2,是本发明实施例一提供的声纹模型管理方法的流程示意图,包括步骤S01至步骤S04:
步骤S01,当接收到声纹注册请求时,获取待注册的声纹模型。
在具体实施时,可通过Proxy组件来接收声纹注册和声纹认证请求,并从声纹注册请求中获取出声纹模型,以得到待注册的声纹模型。其中,待注册的声纹模型为对当前注册声纹的用户的语音进行声纹提取所创建的声纹模型。
步骤S02,根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片。
需要说明的是,在具体的声纹业务服务中,声纹模型由(voice_group_id,voice_print_id)这一元组来唯一标识,拥有同一个voice_group_id的声纹模型都属于同一声纹库。一个声纹库可以看做是一个kv存储库,voice_print_id作为key,声纹模型作为value。把声纹库按照range进行分片,每个分片由(voice_group_id,start_key)来标识。
基于此,根据待注册的声纹模型的voice_group_id,即可确定具有相同voice_group_id标识的分片作为注册响应分片,待注册的声纹模型将在确定的注册响应分片中进行注册,以存储于该注册响应分片中。另外,在具体实施时,可通过查询声纹库中是否存在具有相同voice_group_id标识的分片,若查询到存在,则直接确定查询到的已有分片作为注册响应分片,若未查询到,则代表当前声纹组还没有创建,则可以通过PD组件在声纹引擎实例中创建一个空的分片,也就是创建一个raft group,并将新创建的空分片确定为注册响应分片,同时新创建的空分片采用待注册的声纹模型的voice_group_id进行标识。
步骤S03,将所述待注册的声纹模型转发至所述注册响应分片中进行注册。
步骤S04,基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
其中,所述预设的一致性协议可以为Raft协议。可以理解的,将声纹模型同步到其它分片副本中的目的在于:一方面使同一声纹模型多实例部署,这样在某一计算引擎受损,可从其它计算引擎中读取声纹模型,保证数据的高可用性;另一方面也可以将在一次请求的计算分摊到多个实例中并发执行,加快计算速度。具体的同步方式可以为:分片通过PD组件将其当前注册的声纹模型发送给与其相关的其它副本,或者分片也可以直接将当前注册的声纹模型发送给与其相关的其它副本中,具体基于所述预设的一致性协议来实现。
此外,在具体实施时,当注册响应分片及其副本中全部注册成功或多数注册成功时,返回注册成功,以响应声纹注册请求。
综上,本实施例当中的声纹模型管理方法,通过采用分片技术,将声纹模型注册于引擎内存的分片中,并基于预设的一致性协议将该声纹模型同步到该分片的其它副本当中,这样就可以通过添加机器数量来满足数据规模的增长,而无需升级机器配置,并且通过预设的一致性协议来保证分片及其副本之间数据的高度一致性和可用性。
实施例二
请参阅图3,是本发明实施例二提供的一种声纹模型管理方法的流程示意图,可应用于声纹模型管理装置当中,所述声纹模型管理装置可由软件和/或硬件来实现,所述方法包括步骤S11至步骤S15。
步骤S11,当接收到声纹注册请求时,获取待注册的声纹模型。
步骤S12,根据所述待注册的声纹模型的唯一标识,查询声纹库中是否存在与所述唯一标识对应的分片。
其中,所述待注册的声纹模型的唯一标识为(voice_group_id,voice_print_id),分片的标识为(voice_group_id,start_key),则在具体实施时,可查询声纹库中是否存在voice_group_id与待注册的声纹模型相同的分片,若查询到存在,则代表声纹库中存在与待注册的声纹模型的唯一标识对应的分片,依次执行步骤S13、及步骤S15-步骤S17;若查询到不存在,则代表声纹库中不存在与待注册的声纹模型的唯一标识对应的分片,依次执行步骤S14-步骤S17。
步骤S13,将查询到的分片确定为所述注册响应分片。
步骤S14,创建一个新的空分片作为所述注册响应分片。
在具体实施时,可以通过PD组件在声纹引擎实例中创建一个空的分片,也就是创建一个raft group,并将新创建的空分片确定为注册响应分片,同时新创建的空分片采用待注册的声纹模型的voice_group_id进行标识。
步骤S15,将所述待注册的声纹模型转发至所述注册响应分片中进行注册。
步骤S16,基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
其中,所述预设的一致性协议可以为Raft协议。
步骤S17,当接收到预设数量个成功注册的反馈时,以注册成功为返回结果响应所述声纹注册请求。
其中,所述预设数量大于2,即注册响应分片及其副本中至少有两个反馈注册成功时,则以注册成功为返回结果响应所述声纹注册请求。在具体实施时,可以对每个分片设定注册反馈机制,使分片在注册声纹模型时,可将最终的注册结果(注册成功或注册失败)反馈给PD组件,以通过PD组件掌握当前注册声纹模型的注册状态。
进一步地,所述声纹模型管理方法还可以包括:
当接收到声纹认证请求时,获取认证访问的声纹模型;
根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片;
从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型。
针对声纹认证情形:在具体实施时,可通过Proxy组件来接收声纹认证请求,并从声纹认证请求中获取要访问的声纹模型,以得到认证访问的声纹模型,根据认证访问的声纹模型的唯一标识,确定认证访问的声纹模型具体存储在哪一个分片中(确定方式与上述注册时确定注册响应分片的方式相同,在此不再赘述),即确定出认证响应分片,然后从该认证响应分片及其它副本中,读取所述认证访问的声纹模型。
进一步地,在本实施例当中,在所述根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片的步骤之后,还包括:
判断所述认证响应分片当前是否处于预设节点;
当判断结果为是,则等待所述认证响应分片完成当前节点后,再执行所述从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型的步骤。
当判断结果为否,则直接执行所述从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型的步骤。
其中,所述预设节点为follower节点。需要说明的是,Leader为所有请求的处理者,Leader副本接受client的更新请求,本地处理后再同步至多个其他副本;follower为请求的被动更新者,从Leader接受更新请求,然后写入本地日志文件。当认证响应分片处于follower节点,则代表认证响应分片当前处于数据同步更新中。
具体地,当用户请求声纹认证时,Proxy组件先向PD组件查询该请求需要访问的分片(即认证响应分片)所在的节点信息,接着proxy组件为每个分片选择一个节点发起请求,如果请求的节点是分片的follower节点,则应该等到leader的数据同步过来之后再处理请求,保证声纹认证的可靠性;声纹引擎收到proxy组件的请求之后,直接读取本地的声纹模型进行计算,然后返回计算结果;proxy组件收到各个引擎实例的返回之后,在进行汇总得到最终结果返回给用户。
此外,在本发明一些可选实施例当中,所述声纹模型管理方法还可以包括:
判断声纹库中是否存在数据量超出阈值的分片;
当判断结果为是,则将所述数据量超出阈值的分片按预设规则进行拆分,并基于所述预设的一致性协议,对所述数据量超出阈值的分片的其它副本按相同的拆分结果进行同步拆分。
其中,所述阈值可以为任意设定值,如64M,当分片的数据量超出阈值,则判定该分片过大,则对该分片进行拆分,以差分出多个小分片,并基于预设的一致性协议,对数据量超出阈值的分片的其它副本按相同的拆分结果进行同步拆分,以保证各副本之间数据的一致性。
具体地,所述将数据量超出阈值的分片按预设规则进行拆分的步骤包括:
创建一新的空分片,将所述数据量超出阈值的分片中注册的预设数量的声纹模型移入创建的空分片中。
即,在本实施例当中,所述预设规则为将数据量超出阈值的分片分裂成两个小分片,然后为新生成的小分片再创建一个raft group,并将数据量超出阈值的分片中注册的预设数量(如一半)的声纹模型移入创建的空分片中。
实施例三
本发明另一方面还提出一种声纹模型管理系统,请参阅图4,是本发明实施例三提供的一种声纹模型管理系统的模块示意图,所述声纹模型管理系统包括:
注册请求模块11,用于当接收到声纹注册请求时,获取待注册的声纹模型;
分片确认模块12,用于根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片;
注册响应模块13,用于将所述待注册的声纹模型转发至所述注册响应分片中进行注册;
数据同步模块14,用于基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
在具体实施时,可通过Proxy组件来接收声纹注册和声纹认证请求,并从声纹注册请求中获取出声纹模型,以得到待注册的声纹模型。其中,待注册的声纹模型为对当前注册声纹的用户的语音进行声纹提取所创建的声纹模型。
需要说明的是,在具体的声纹业务服务中,声纹模型由(voice_group_id,voice_print_id)这一元组来唯一标识,拥有同一个voice_group_id的声纹模型都属于同一声纹库。一个声纹库可以看做是一个kv存储库,voice_print_id作为key,声纹模型作为value。把声纹库按照range进行分片,每个分片由(voice_group_id,start_key)来标识。
基于此,根据待注册的声纹模型的voice_group_id,即可确定具有相同voice_group_id标识的分片作为注册响应分片,待注册的声纹模型将在确定的注册响应分片中进行注册,以存储于该注册响应分片中。另外,在具体实施时,可通过查询声纹库中是否存在具有相同voice_group_id标识的分片,若查询到存在,则直接确定查询到的已有分片作为注册响应分片,若未查询到,则代表当前声纹组还没有创建,则可以通过PD组件在声纹引擎实例中创建一个空的分片,也就是创建一个raft group,并将新创建的空分片确定为注册响应分片,同时新创建的空分片采用待注册的声纹模型的voice_group_id进行标识。
其中,所述预设的一致性协议可以为Raft协议。可以理解的,将声纹模型同步到其它分片副本中的目的在于:一方面使同一声纹模型多实例部署,这样在某一计算引擎受损,可从其它计算引擎中读取声纹模型,保证数据的高可用性;另一方面也可以将在一次请求的计算分摊到多个实例中并发执行,加快计算速度。具体的同步方式可以为:分片通过PD组件将其当前注册的声纹模型发送给与其相关的其它副本,或者分片也可以直接将当前注册的声纹模型发送给与其相关的其它副本中,具体基于所述预设的一致性协议来实现。
此外,在具体实施时,当注册响应分片及其副本中全部注册成功或多数注册成功时,返回注册成功,以响应声纹注册请求。
综上,本实施例当中的声纹模型管理系统,通过采用分片技术,将声纹模型注册于引擎内存的分片中,并基于预设的一致性协议将该声纹模型同步到该分片的其它副本当中,这样就可以通过添加机器数量来满足数据规模的增长,而无需升级机器配置,并且通过预设的一致性协议来保证分片及其副本之间数据的高度一致性和可用性。
进一步地,在本发明一些可选实施例当中,所述分片确认模块12包括:
查询单元,用于根据所述待注册的声纹模型的唯一标识,查询声纹库中是否存在与所述唯一标识对应的分片;
第一处理单元,用于当查询单元的查询结果为是,则将查询到的分片确定为所述注册响应分片;
第二处理单元,用于当查询单元的查询结果为否,则创建一个新的空分片作为所述注册响应分片。
进一步地,在本发明一些可选实施例当中,所述声纹模型管理系统还包括:
分片判定模块,用于判断声纹库中是否存在数据量超出阈值的分片;
分片拆分模块,用于当分片判定模块的判断结果为是,则将所述数据量超出阈值的分片按预设规则进行拆分,并基于所述预设的一致性协议,对所述数据量超出阈值的分片的其它副本按相同的拆分结果进行同步拆分。
进一步地,在本发明一些可选实施例当中,所述分片拆分模块包括:
分片拆分单元,用于创建一新的空分片,将所述数据量超出阈值的分片中注册的预设数量的声纹模型移入创建的空分片中。
进一步地,在本发明一些可选实施例当中,所述声纹模型管理系统还包括:
认证清扫模块,用于当接收到声纹认证请求时,获取认证访问的声纹模型;
认证确认模块,用于根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片;
模型读取模块,用于从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型。
进一步地,在本发明一些可选实施例当中,所述声纹模型管理系统还包括:
节点判断模块,用于判断所述认证响应分片当前是否处于预设节点;
当节点判断模块的判断结果为是时,等待所述认证响应分片完成当前节点后,模型读取模块再从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型。
进一步地,在本发明一些可选实施例当中,所述声纹模型管理系统还包括:
注册反馈模块,用于当接收到预设数量个成功注册的反馈时,以注册成功为返回结果响应所述声纹注册请求。
上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
实施例四
本发明另一方面还提出一种声纹模型管理装置,请参阅图5,所示为本发明第四实施例当中的声纹模型管理装置的模块结构图,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,所述处理器执行所述程序时实现如上述的声纹模型管理方法。
具体地,声纹模型管理装置可以为计算机。所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据。
其中,存储器20至少包括一种类别的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是装置的内部存储单元,例如该装置的硬盘。存储器20在另一些实施例中也可以是装置的外部存储设备,例如装置上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器20还可以既包括装置的内部存储单元也包括外部存储设备。存储器20不仅可以用于存储安装于装置的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
可选地,该声纹模型管理装置还可以包括用户接口、网络接口、通信总线等,用户接口可以包括显示器(Display)、输入单元比如遥控器、实体按键等,可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在装置中处理的信息以及用于显示可视化的用户界面。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置与其他电子设备之间建立通信连接。通信总线用于实现这些组件之间的连接通信。
需要指出的是,图5示出的结构并不构成对装置的限定,在其它实施例当中,该装置可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
综上,本实施例当中的声纹模型管理装置,通过采用分片技术,将声纹模型注册于引擎内存的分片中,并基于预设的一致性协议将该声纹模型同步到该分片的其它副本当中,这样就可以通过添加机器数量来满足数据规模的增长,而无需升级机器配置,并且通过预设的一致性协议来保证分片及其副本之间数据的高度一致性和可用性。
本实施例还提供了一种计算机可读存储介质,其上存储有上述声纹模型管理装置中所使用的计算机程序30,该程序在被处理器执行时实现上述的声纹模型管理方法。
其中,所述的存储介质可以为但不限于ROM/RAM、磁碟、光盘等。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种声纹模型管理方法,其特征在于,所述方法包括:
当接收到声纹注册请求时,获取待注册的声纹模型;
根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片;
所述待注册的声纹模型的唯一标识采用(voice_group_id,voice_print_id)这一元组表示,其中,voice_print_id为每个声纹库的唯一标识,voice_print_id为每个声纹模型的唯一标识;
将所述待注册的声纹模型转发至所述注册响应分片中进行注册;
基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
2.如权利要求1所述的声纹模型管理方法,其特征在于,根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片的步骤包括:
根据所述待注册的声纹模型的唯一标识,查询声纹库中是否存在与所述唯一标识对应的分片;
当查询结果为是,则将查询到的分片确定为所述注册响应分片;
当查询结果为否,则创建一个新的空分片作为所述注册响应分片。
3.如权利要求1所述的声纹模型管理方法,其特征在于,还包括:
判断声纹库中是否存在数据量超出阈值的分片;
当判断结果为是,则将所述数据量超出阈值的分片按预设规则进行拆分,并基于所述预设的一致性协议,对所述数据量超出阈值的分片的其它副本按相同的拆分结果进行同步拆分。
4.如权利要求3所述的声纹模型管理方法,其特征在于,所述将数据量超出阈值的分片按预设规则进行拆分的步骤包括:
创建一新的空分片,将所述数据量超出阈值的分片中注册的预设数量的声纹模型移入创建的空分片中。
5.如权利要求1所述的声纹模型管理方法,其特征在于,还包括:
当接收到声纹认证请求时,获取认证访问的声纹模型;
根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片;
从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型。
6.如权利要求5所述的声纹模型管理方法,其特征在于,在所述根据所述认证访问的声纹模型的唯一标识,确定存储所述认证访问的声纹模型的认证响应分片的步骤之后,还包括:
判断所述认证响应分片当前是否处于预设节点;
当判断结果为是,则等待所述认证响应分片完成当前节点后,再执行所述从所述认证响应分片及所述认证响应分片的其它副本中,读取所述认证访问的声纹模型的步骤。
7.如权利要求1所述的声纹模型管理方法,其特征在于,在所述基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册的步骤之后,还包括:
当接收到预设数量个成功注册的反馈时,以注册成功为返回结果响应所述声纹注册请求。
8.一种声纹模型管理系统,其特征在于,所述系统包括:
注册请求模块,用于当接收到声纹注册请求时,获取待注册的声纹模型;
分片确认模块,用于根据所述待注册的声纹模型的唯一标识,确定所述待注册的声纹模型对应的注册响应分片;所述待注册的声纹模型的唯一标识采用(voice_group_id,voice_print_id)这一元组表示,其中,voice_print_id为每个声纹库的唯一标识,voice_print_id为每个声纹模型的唯一标识;
注册响应模块,用于将所述待注册的声纹模型转发至所述注册响应分片中进行注册;
数据同步模块,用于基于预设的一致性协议,将所述待注册的声纹模型同步到所述注册响应分片的其它副本中进行注册。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一所述的声纹模型管理方法。
10.一种声纹模型管理装置,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一所述的声纹模型管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911079140.1A CN111081258B (zh) | 2019-11-07 | 2019-11-07 | 一种声纹模型管理方法、系统、存储介质及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911079140.1A CN111081258B (zh) | 2019-11-07 | 2019-11-07 | 一种声纹模型管理方法、系统、存储介质及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111081258A CN111081258A (zh) | 2020-04-28 |
CN111081258B true CN111081258B (zh) | 2022-12-06 |
Family
ID=70310708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911079140.1A Active CN111081258B (zh) | 2019-11-07 | 2019-11-07 | 一种声纹模型管理方法、系统、存储介质及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111081258B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112820302B (zh) * | 2021-01-28 | 2024-04-12 | Oppo广东移动通信有限公司 | 声纹识别方法、装置、电子设备和可读存储介质 |
CN113407768B (zh) * | 2021-06-24 | 2024-02-02 | 深圳市声扬科技有限公司 | 声纹检索方法、装置、系统、服务器及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778917A (zh) * | 2014-01-10 | 2014-05-07 | 厦门快商通信息技术有限公司 | 一种在电话满意度调查中检测身份冒充的系统与方法 |
CN104184587A (zh) * | 2014-08-08 | 2014-12-03 | 腾讯科技(深圳)有限公司 | 声纹生成方法、服务器、客户端及系统 |
CN104731927A (zh) * | 2015-03-27 | 2015-06-24 | 努比亚技术有限公司 | 录音文件分类方法和系统 |
CN106209786A (zh) * | 2016-06-27 | 2016-12-07 | 四川阿泰因机器人智能装备有限公司 | 一种大数据并行化声纹认证方法 |
CN107492379A (zh) * | 2017-06-30 | 2017-12-19 | 百度在线网络技术(北京)有限公司 | 一种声纹创建与注册方法及装置 |
CN108597525A (zh) * | 2018-04-25 | 2018-09-28 | 四川远鉴科技有限公司 | 语音声纹建模方法及装置 |
US10346297B1 (en) * | 2016-03-31 | 2019-07-09 | EMC IP Holding Company LLC | Method and system for cloud based distributed garbage collection of a deduplicated datasets |
CN110059061A (zh) * | 2019-03-22 | 2019-07-26 | 厦门快商通信息咨询有限公司 | 一种声纹数据的备份方法及备份装置及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7730520B2 (en) * | 2006-05-31 | 2010-06-01 | Telcordia Technologies, Inc. | Automated adaptive method for identity verification with performance guarantees |
-
2019
- 2019-11-07 CN CN201911079140.1A patent/CN111081258B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778917A (zh) * | 2014-01-10 | 2014-05-07 | 厦门快商通信息技术有限公司 | 一种在电话满意度调查中检测身份冒充的系统与方法 |
CN104184587A (zh) * | 2014-08-08 | 2014-12-03 | 腾讯科技(深圳)有限公司 | 声纹生成方法、服务器、客户端及系统 |
CN104731927A (zh) * | 2015-03-27 | 2015-06-24 | 努比亚技术有限公司 | 录音文件分类方法和系统 |
US10346297B1 (en) * | 2016-03-31 | 2019-07-09 | EMC IP Holding Company LLC | Method and system for cloud based distributed garbage collection of a deduplicated datasets |
CN106209786A (zh) * | 2016-06-27 | 2016-12-07 | 四川阿泰因机器人智能装备有限公司 | 一种大数据并行化声纹认证方法 |
CN107492379A (zh) * | 2017-06-30 | 2017-12-19 | 百度在线网络技术(北京)有限公司 | 一种声纹创建与注册方法及装置 |
CN108597525A (zh) * | 2018-04-25 | 2018-09-28 | 四川远鉴科技有限公司 | 语音声纹建模方法及装置 |
CN110059061A (zh) * | 2019-03-22 | 2019-07-26 | 厦门快商通信息咨询有限公司 | 一种声纹数据的备份方法及备份装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
Secure Electronic Ticketing System based on Consortium Blockchain;Xuelian Li,等;《KSII TRANSACTIONS ON INTERNET AND INFORMATION SYSTEMS》;20191031;第5219-5243页 * |
分布式数据库中数据复制及数据分片的应用;姚梅;《据库与信息管理》;20111231;第7卷(第36期);第9328-9329页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111081258A (zh) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017049764A1 (zh) | 数据读写方法及分布式存储系统 | |
CN108683668B (zh) | 内容分发网络中的资源校验方法、装置、存储介质及设备 | |
US20180077157A1 (en) | Method and system for identifying user information in social network | |
CN110247984B (zh) | 业务处理方法、装置及存储介质 | |
US10901621B2 (en) | Dual-level storage device reservation | |
CN108762898B (zh) | 一种线程接口的管理方法、终端设备及计算机可读存储介质 | |
US10055475B2 (en) | Authentication system, synchronization method, and authentication apparatus | |
CN111081258B (zh) | 一种声纹模型管理方法、系统、存储介质及装置 | |
CN110389859B (zh) | 用于复制数据块的方法、设备和计算机程序产品 | |
CN111125170A (zh) | 一种微服务的跨服务数据获取方法、装置及微服务设备 | |
WO2021114025A1 (zh) | 增量数据确定方法、确定装置、服务器及终端设备 | |
CN111737564A (zh) | 一种信息查询方法、装置、设备及介质 | |
CN111651424B (zh) | 一种数据处理方法、装置、数据节点及存储介质 | |
US8266178B2 (en) | Management apparatus, information processing apparatus, and method therefor | |
CN109327499B (zh) | 业务接口的管理方法及装置、存储介质、终端 | |
CN112527900B (zh) | 一种数据库读多副本一致性的方法、装置、设备及介质 | |
WO2021169811A1 (zh) | 特效生成方法、装置、系统、设备和存储介质 | |
CN112596956B (zh) | 一种文件系统管理方法、装置及相关组件 | |
CN114003629A (zh) | 一种高效预编译型缓存数据管理方法、装置、设备和介质 | |
CN113626509A (zh) | 数据接入方法、装置、电子设备及可读存储介质 | |
KR101846778B1 (ko) | Id 확인 서비스 방법 및 이를 적용한 m2m 시스템 | |
CN110798358B (zh) | 分布式服务标识方法、装置、计算机可读介质及电子设备 | |
CN112328272B (zh) | 算法升级方法、装置、设备及存储介质 | |
CN111221556B (zh) | 一种远程升级rsu镜像方法及系统 | |
CN114254042A (zh) | 读写分离数据库集群系统的访问方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |