CN113570754A - 声纹锁控制方法、装置、电子设备 - Google Patents
声纹锁控制方法、装置、电子设备 Download PDFInfo
- Publication number
- CN113570754A CN113570754A CN202110747765.1A CN202110747765A CN113570754A CN 113570754 A CN113570754 A CN 113570754A CN 202110747765 A CN202110747765 A CN 202110747765A CN 113570754 A CN113570754 A CN 113570754A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- registered
- information
- matching
- voiceprint information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000008447 perception Effects 0.000 claims abstract description 75
- 230000004044 response Effects 0.000 claims abstract description 36
- 239000012634 fragment Substances 0.000 claims description 59
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 241000207961 Sesamum Species 0.000 description 62
- 235000003434 Sesamum indicum Nutrition 0.000 description 62
- 239000002131 composite material Substances 0.000 description 14
- 230000008569 process Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/00174—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys
- G07C9/00563—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys using personal physical data of the operator, e.g. finger prints, retinal images, voicepatterns
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Telephone Function (AREA)
- Lock And Its Accessories (AREA)
Abstract
本申请公开了一种声纹锁控制方法,属于安防领域,有助于提升声纹锁的安全性。所述方法包括:向用户输出声纹锁中存储的声纹匹配对象的感知信息;响应于声纹锁采集到针对感知信息的反馈语音,确定反馈语音中的待识别声纹信息;将待识别声纹信息与声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,得到匹配结果;响应于匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于待识别声纹信息对注册声纹信息库的更新操作,和/或,执行声纹锁的开锁控制操作。本方法在声纹匹配成功后,基于当前匹配成功的待识别声纹信息更新注册声纹信息库,丰富了注册声纹信息,有效提升了声纹锁的安全性。
Description
技术领域
本申请实施例涉及安防领域,特别是涉及一种声纹锁控制方法、装置、声纹锁及计算机可读存储介质。
背景技术
作为生物特征识别技术的一个分支,声纹识别技术发展迅速。从考勤到智能门禁,再到智能支付,声纹识别技术得到越来越广泛的应用。现有技术中的声纹识别应用,首先需要建立用户的声纹特征库,然后,在声纹识别阶段,通过采集用户输入的语音,并提取其中的声纹特征,之后,将提取的声纹特征与预先建立的声纹特征库中的声纹特征进行声纹特征比对,从而确定身份识别是否通过。而声纹特征库的建立直接影响声纹识别的效率,如果声纹特征库中存储的用户声纹数量过少,会导致声纹锁安全性降低;采集大量声纹信息建立声纹特征库,又会降低建立声纹特征库的效率。而声纹锁作为一种弱交互的声纹识别应用,为了提升用户使用的便捷性和提升用户体验,往往仅采集有限数量的声纹信息构建声纹特征库,这将给声纹应用带来安全隐患。
发明内容
本申请实施例提供一种声纹锁控制方法,有助于提升声纹锁的安全性。
第一方面,本申请实施例提供了一种声纹锁控制方法,包括:
向用户输出声纹锁中存储的声纹匹配对象的感知信息;
响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;
将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,和/或,执行所述声纹锁的开锁控制操作。
第二方面,本申请实施例提供了一种声纹锁控制装置,包括:
采集信息引导模块,用于向用户输出声纹锁中存储的声纹匹配对象的感知信息;
声纹信息采集模块,用于响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;
声纹匹配模块,用于将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;
注册声纹信息库更新模块,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作;以及,
声纹锁控制模块,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行所述声纹锁的开锁控制操作。
第三方面,本申请实施例提供了一种声纹锁,包括:主控装置,分别与所述主控装置通信连接的语音采集装置、存储器、锁具执行机构、感知信息输出装置,其中,
所述存储器,用于存储字典库和注册声纹信息库,其中,所述注册声纹信息库中存储有:声纹匹配对象,以及所述相应声纹匹配对应的注册声纹信息;
所述感知信息输出装置,用于根据所述主控装置的控制,输出呈现指定声纹匹配对象的感知信息,其中,所述输出呈现指定声纹匹配对象的感知信息,包括:显示指定声纹匹配对象的文本;和/或,播放指定声纹匹配对象的朗读语音;
所述语音采集装置,用于根据所述主控装置的控制采集用户针对所述感知信息的反馈语音,并将采集的所述反馈语音发送至所述主控装置;
所述主控装置,还用于确定所述反馈语音中的待识别声纹信息,并将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,以及,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作;和/或,执行所述声纹锁的开锁控制操作。
第四方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的声纹锁控制方法。
第五方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的声纹锁控制方法的步骤。
本申请实施例公开的声纹锁控制方法,通过向用户输出声纹锁中存储的声纹匹配对象的感知信息;响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,以及,执行所述声纹锁的开锁控制操作,有效提升了声纹锁的安全性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是本申请实施例一的声纹锁控制方法流程图之一;
图2是本申请实施例一的声纹锁结构示意图之一;
图3是本申请实施例一的声纹锁结构示意图之二;
图4是本申请实施例一的声纹锁控制方法流程图之二;
图5是本申请实施例二声纹锁控制方法流程图;
图6是本申请实施例三声纹锁控制方法流程图;
图7是本申请实施例四的声纹锁控制装置结构示意图之一;
图8是本申请实施例四的声纹锁控制装置结构示意图之二;
图9是本申请实施例五的声纹锁控制装置结构示意图;
图10是本申请实施例六的声纹锁控制装置结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本申请实施例公开的一种声纹锁控制方法,如图1所示,所述方法包括:步骤110至步骤140。
步骤110,向用户输出声纹锁中存储的声纹匹配对象的感知信息。
本申请实施例中所述的声纹锁控制方法应用于如图2所示的声纹锁中,参见图2,所述声纹锁包括:主控装置210,分别与所述主控装置210通信连接的语音采集装置220、存储器230、锁具执行机构240和感知信息输出装置250。
本申请的一些实施例中,所述主控装置210可以为带有存储空间的处理器,参见图3,所述存储器230内置于所述主控装置210中。
下面,结合声纹锁控制方法的具体实施方案,说明声纹锁的各个组成部分的作用。
本申请实施例中所述的声纹匹配对象可以为字符、词语或句子。
本申请的一些实施例中,所述声纹锁中预先存储有字典库,所述字典库存储在所述存储器230中,所述字典库中可以包括字符、词语、句子、音乐片段中一种或多种形式的声纹匹配对象。所述字典库中存储的声纹匹配对象(例如,字符、词语、句子、音乐片段)可以用来在声纹注册阶段作为需要注册声纹信息的声纹匹配对象输出给用户,也可以用来在声纹认证阶段作为提示用户需要进行声纹认证的声纹匹配对象输出给用户。
在声纹锁开始使用时,需要首先进行声纹注册。如图4所示,向用户输出声纹锁中存储的声纹匹配对象的感知信息之前,还包括:步骤100。
步骤100,注册声纹信息。
用户进行声纹注册时生成的一条或多条注册声纹信息将存储在注册声纹信息库中,所述注册声纹信息库存储在声纹锁中,具体的,所述注册声纹信息库存储在所述存储器230中。例如,在声纹锁开始使用时,主控装置210随机从字典库中选择一个声纹匹配对象,通过感知信息输出装置250输出感知信息,感知信息的输出至少包含三种方式,包括通过感知信息输出装置250显示选择的声纹匹配对象的文本内容,或播放选择的声纹匹配对象的语音,或显示选择的声纹匹配对象的文本内容并播放对应的语音,并提示用户针对该选择的声纹匹配对象注册声纹信息;然后,主控装置210控制所述语音采集装置220采集用户针对所述感知信息的反馈语音,并提取所述反馈语音中的声纹特征,作为选择的所述声纹匹配对象的注册声纹信息,然后,将选择的声纹匹配对象和提取得到的注册声纹信息对应存储在注册声纹信息库中。
本申请的一些实施例中,注册声纹信息库中存储的每条注册声纹信息对应一个不同的声纹匹配对象,所述声纹匹配对象可以为单个字符、单个词语、完整的句子或者音乐片段。例如,本申请的一些实施例中,注册声纹信息库中存储的每条注册声纹信息分别对应一个不同的字符。又例如,本申请的一些实施例中,注册声纹信息库中存储的每条注册声纹信息分别对应一个不同的词语,或者对应一个不同的句子,或者对应一段音乐片段(纯旋律音乐或带有歌词的音乐)。再例如,本申请的一些实施例中,注册声纹信息库中存储的注册声纹信息有的对应字符,有的对应词语,有的对应音乐片段,其中,不同注册声纹信息对应的声纹匹配对象各不相同。
声纹锁存储的注册声纹信息库中的每条注册声纹信息和与其对应的声纹匹配对象关联存储。注册声纹信息库中存储的声纹匹配对象,用于在声纹认证阶段作为提示用户需要进行声纹认证的声纹匹配对象输出给用户。
本申请实施例中所述的声纹匹配对象可以存储在字典库中,也可以存储在注册声纹信息库中,也可以为存储在字典库中的声纹匹配对象和存储在注册声纹信息库中的声纹匹配对象组合而成的声纹匹配对象。例如,声纹匹配对象可以为存储在字典库中的词语,还可以为存储在注册声纹信息库中的字符或词语,还可以为存储在注册声纹信息库中的词语和存储在字典库中的词语组合而成的词语或句子。
在声纹锁使用过程中,声纹锁首先向用户输出需要进行声纹认证的声纹匹配对象的感知信息,之后,进一步采集用户针对该声纹匹配对象输入的待识别声纹信息。其中,所述声纹匹配对象的感知信息输出方式包括显示文本、朗读语音,和/或,播放音乐片段。本申请的一些实施例中,所述感知信息输出装置250用于输出所述声纹匹配对象的感知信息,所述语音采集装置220用于采集用户针对该声纹匹配对象输入的反馈语音,便于从采集的反馈语音中提取待识别声纹信息。
所述主控装置210用于控制所述感知信息输出装置250向用户输出声纹锁中存储的声纹匹配对象的感知信息。
本申请的一些实施例中,向用户输出声纹锁中存储的声纹匹配对象的感知信息,包括:向用户展示声纹锁中存储的声纹匹配对象的文本、向用户播放声纹锁中存储的声纹匹配对象的朗读语音,和/或,向用户播放声纹锁中存储的声纹匹配对象的音乐片段。例如,声纹锁从字典库中任意读取一个声纹匹配对象,并向用户显示该声纹匹配对象的文本,同时,播放该声纹匹配对象的朗读语音,以提示用户通过朗读的方式输入与该声纹匹配对象对应的待识别声纹信息。又例如,声纹锁从注册声纹信息库中任意选择一个声纹匹配对象,并显示该声纹匹配对象的文本,以提示用户通过朗读文本内容的方式输入与该声纹匹配对象对应的待识别声纹信息。
其中,所述声纹匹配对象的朗读语音可以为字典库中预先存储的该声纹匹配对象的朗读语音,也可以为通过声纹锁中内置的文本转语音模块根据所述声纹匹配对象的文本转换得到的朗读语音。本申请实施例中,对声纹匹配对象的朗读语音的获取方式不做限定。
步骤120,响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息。
在输出当前待识别的声纹匹配对象的感知信息之后,所述主控装置210还用于响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息。
例如,在声纹锁展示待识别声纹匹配对象“芝麻”并播放其朗读语音之后,所述主控装置210控制所述语音采集装置220采集用户针对声纹匹配对象“芝麻”的反馈语音。当用户朗读“zhima”时,所述语音采集装置220将采集到“zhima”的音频数据(即反馈语音),并发送给所述主控装置210。之后,所述主控装置210接收到“zhima”的音频数据之后,通过声纹提取算法确定所述反馈语音中的待识别声纹信息。
本申请的实施例中,所述主控装置210还可以采用现有技术中的其他技术手段确定反馈语音中的待识别声纹信息,本申请对从反馈语音中确定所述反馈语音中的待识别声纹信息的具体实施方式不做限定。
步骤130,将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
在确定了用户针对当前声纹匹配对象输入的待识别声纹信息之后,所述主控装置210,还用于将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
本申请的一些实施例中,可以采用多种声纹匹配手段对待识别声纹信息与已经注册的声纹信息进行声纹匹配。下面分别举例说明。
第一种方案,对待识别声纹信息进行整体匹配。
在对待识别声纹信息进行整体匹配时,根据反馈语音针对的当前声纹匹配对象是否已经注册对应的声纹信息,采用不同策略选择注册声纹信息库中存储的注册声纹信息,用于与所述待识别声纹信息进行匹配。下面对反馈语音针对的当前声纹匹配对象已经注册对应的声纹信息,和未注册对应的声纹信息两种情况下的整体匹配方案分别举例说明。
本申请的一些实施例中,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,包括:响应于所述声纹锁中存储的注册声纹信息库中有与所述声纹匹配对象对应的注册声纹信息,将所述待识别声纹信息与所述注册声纹信息库中与所述声纹匹配对象对应的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
以声纹锁中已经注册了声纹匹配对象“芝麻”的注册声纹信息为例,举例说明一轮整体匹配方案。当声纹锁输出声纹匹配对象“芝麻”文本之后,所述主控装置210控制所述语音采集装置220采集用户针对声纹匹配对象“芝麻”的反馈语音,并提取反馈语音中的声纹信息,作为待识别声纹信息。接下来,所述主控装置210判断声纹匹配对象“芝麻”是否已经注册了声纹信息。本申请的一些实施例中,可以通过将声纹匹配对象“芝麻”与所述声纹锁的注册声纹信息库中存储的注册声纹信息对应的声纹匹配对象进行一一比对,确定声纹匹配对象“芝麻”是否已经注册了声纹信息。若比对成功,则可以认为声纹匹配对象“芝麻”已经注册了声纹信息,否则,可以认为声纹匹配对象“芝麻”未注册声纹信息。本申请的另一些实施例中,在注册阶段,声纹锁可以对已经注册了注册声纹信息的声纹匹配对象进行标记,相应的,在声纹匹配阶段,可以根据所述标记,确定该声纹匹配对象是否已经注册了声纹信息。
在确定声纹匹配对象“芝麻”已经注册了声纹信息之后,进一步获取声纹匹配对象“芝麻”在注册声纹信息库中对应存储的注册声纹信息,并将获取的声纹匹配对象“芝麻”在注册声纹信息库中对应存储的注册声纹信息与当前采集的待识别声纹信息进行声纹匹配,确定声纹匹配结果。
本申请的一些实施例中,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,包括:响应于所述声纹锁中存储的注册声纹信息库中没有与所述声纹匹配对象对应的注册声纹信息,将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中任意一条或多条注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
以声纹锁中未注册的声纹匹配对象“苹果”的注册声纹信息为例,举例说明一轮整体匹配方案。当声纹锁输出声纹匹配对象“苹果”文本之后,所述主控装置210控制所述语音采集装置220采集用户针对声纹匹配对象“苹果”的反馈语音,并提取反馈语音中的声纹信息,作为待识别声纹信息。接下来,所述主控装置210判断声纹匹配对象“苹果”是否已经注册了声纹信息。本申请的一些实施例中,可以通过将声纹匹配对象“苹果”与所述声纹锁的注册声纹信息库中存储的注册声纹信息对应的声纹匹配对象进行一一比对,确定声纹匹配对象“苹果”是否已经注册了声纹信息。若比对成功,则可以认为声纹匹配对象“苹果”已经注册了声纹信息,否则,可以认为声纹匹配对象“苹果”未注册声纹信息。本申请的另一些实施例中,在注册阶段,声纹锁可以对已经注册了注册声纹信息的声纹匹配对象进行标记,相应的,在声纹匹配阶段,可以根据所述标记,确定该声纹匹配对象是否已经注册了声纹信息。
在确定声纹匹配对象“苹果”未注册声纹信息之后,进一步获取注册声纹信息库中存储的任意一条注册声纹信息,并将获取的注册声纹信息与当前采集的待识别声纹信息进行声纹匹配,确定声纹匹配结果。
本申请的一些实施例中,可以通过计算注册声纹信息与待识别声纹信息的相似度的方式,确定声纹匹配结果。例如,若注册声纹信息与待识别声纹信息的相似度大于预设相似度阈值,则可以认为注册声纹信息与待识别声纹信息匹配成功,否则,认为注册声纹信息与待识别声纹信息匹配失败。
本申请的一些实施例中,对于声纹匹配对象是否已经注册声纹信息的不同情况,可以设置不同的相似度阈值,以降低声纹信息对应的文本内容对声纹信息相似度计算的影响。例如,当声纹匹配对象已经注册声纹信息时,待识别声纹信息与该声纹匹配对象对应的注册声纹信息进行相似度比对,则可以设置所述预设相似度阈值为第一阈值;当声纹匹配对象未注册声纹信息时,待识别声纹信息与任意一条注册声纹信息进行相似度比对,则可以设置所述预设相似度阈值为第二阈值,其中,第一阈值大于第二阈值。
本申请的一些实施例中,注册声纹信息库中的注册声纹信息包括原始注册阶段存储的注册声纹信息,还可以包括声纹认证阶段通过对注册声纹信息库进行更新维护时存储的注册声纹信息。
第二种方案,对待识别声纹信息进行分段匹配。
本申请的一些实施例中,在声纹认证阶段,声纹锁输出的声纹匹配对象还可以为字典库中的未注册声纹信息的多个声纹匹配对象组合而成的声纹匹配对象(例如,对于字典库中没有注册过声纹信息的声纹匹配对象“清”和“路”,可以组合为声纹匹配对象“清路”),或者为字典库中的未注册声纹信息的一个或多个声纹匹配对象与注册声纹信息库中存储的一个或多个声纹匹配对象组合而成的声纹匹配对象(例如,对于字典库中没有注册过声纹信息的声纹匹配对象“清”和注册声纹信息库中存储的声纹匹配对象“芝麻”,可以组合为声纹匹配对象“清芝麻”),又或者为注册声纹信息库中存储的一个或多个声纹匹配对象组合而成的声纹匹配对象(例如,对于注册声纹信息库中存储的声纹匹配对象“芝麻”和“橘子”,可以组合为声纹匹配对象“芝麻橘子”)。
针对于可以组合声纹匹配对象生成复合的声纹匹配对象的场景,本申请的一些实施例中,可以对待识别声纹信息进行分段匹配。组合至少两个声纹匹配对象生成复合的声纹匹配对象,用于声纹认证阶段进行声纹认证,随机组合生成声纹匹配对象,可以提升声纹锁的安全性。进一步的,分别从字典库中选择未注册声纹信息的声纹匹配对象和注册声纹信息库中选择声纹匹配对象组合生成复合的声纹匹配对象,还可以实现静默更新注册声纹信息库,从而进一步提升声纹锁的安全性。
下面以分别从字典库中选择未注册声纹信息的声纹匹配对象和注册声纹信息库中选择已注册的声纹匹配对象组合生成复合的声纹匹配对象,进行声纹认证为例,说明对待识别声纹信息进行分段识别的具体技术方案。本申请的实施例中,为了使描述更清楚,将注册声纹信息库中已注册声纹信息的声纹匹配对象称为“第一声纹匹配对象”,将字典库中未注册声纹信息的声纹匹配对象称为“第二声纹匹配对象”。其中,优选的,所述第一声纹匹配对象和所述第二声纹匹配对象为基本声纹匹配单元,例如,所述第一声纹匹配对象和所述第二声纹匹配对象为单个字符或单个词语。
本申请的一些实施例中,所述声纹匹配对象根据所述注册声纹信息库中存储的已注册声纹信息的第一声纹匹配对象,以及,所述声纹锁中存储的字典库内的第二声纹匹配对象组合生成,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,包括:确定所述待识别声纹信息中分别与各所述第一声纹匹配对象和各所述第二声纹匹配对象对应的待识别声纹信息片段;将各所述第一声纹匹配对象对应的待识别声纹信息片段与相应的注册声纹信息进行声纹匹配,以及,将各所述第二声纹匹配对象对应的待识别声纹信息片段与所述注册声纹信息库中选定的注册声纹信息进行声纹匹配,确定所述待识别声纹信息与所述声纹匹配对象(即第一声纹匹配对象、第二声纹匹配对象)的声纹匹配结果。本申请的一些实施例中,所述选定的注册声纹信息包括:随机选择的一条注册声纹信息、与所述第二声纹匹配对象字符距离最近的所述第一声纹匹配对象对应的注册声纹信息。
本申请的一些实施例中,在生成输出给用户的复合声纹匹配对象时,主控装置210可以同时记录组成该复合声纹匹配对象的第一声纹匹配对象和第二声纹匹配对象。之后,在提取待识别声纹信息时,可以同时对用于提取待识别声纹信息的反馈语音进行语音识别,得到字符序列,并进一步根据字符序列与第一声纹匹配对象和第二声纹匹配对象的字符匹配结果,对待识别声纹信息进行切分,确定该复合声纹匹配对象中包括的各第一声纹匹配对象和各第二声纹匹配对象各自对应的待识别声纹信息片段。以声纹匹配对象由字典库中没有注册过声纹信息的第二声纹匹配对象“清”和注册声纹信息库中存储的第一声纹匹配对象“芝麻”组合而成为例,待识别声纹信息将切分为与第二声纹匹配对象“清”对应的一个待识别声纹信息片段(下文中记为F1),以及,与第一声纹匹配对象“芝麻”对应的一个待识别声纹信息片段(下文中记为F2)。
接下来,分别确定与切分得到的每个待识别声纹信息片段进行声纹匹配的注册声纹信息。
本申请的一些实施例中,对于每个与第一声纹匹配对象(如前述“芝麻”)对应的待识别声纹信息片段(如前述待识别声纹信息片段F2),将该待识别声纹信息片段(如F2)与对应第一声纹匹配对象(如“芝麻”)在注册声纹信息库中对应存储的注册声纹信息进行声纹匹配,确定该待识别声纹信息片段对应的声纹匹配结果。
本申请的一些实施例中,对于每个与第二声纹匹配对象(如前述“清”)对应的待识别声纹信息片段(如前述待识别声纹信息片段F1),可以将该待识别声纹信息片段(如F1)与注册声纹信息库中存储的任意一条注册声纹信息进行声纹匹配,确定该待识别声纹信息片段对应的声纹匹配结果。优选的,可以将该待识别声纹信息片段(如F1)与第一声纹匹配对象(如“芝麻”)在注册声纹信息库中对应存储的注册声纹信息进行声纹匹配,确定该待识别声纹信息片段对应的声纹匹配结果。
由于用户在输入一段完整的语音时,语音中的字符读音具有连续性,因此,对于与第二声纹匹配对象对应的待识别声纹信息片段,采用与第二声纹匹配对象字符距离最近的第一声纹匹配对象对应的注册声纹信息进行声纹匹配,可以提升声纹认证匹配准确度。
本申请的一些实施例中,还可以对组成复合声纹匹配对象的第一声纹匹配对象的信息和第二声纹匹配对象的信息分别输出,使得用户可以分别输入针对第一声纹匹配对象的信息的反馈语音,以及针对第二声纹匹配对象的反馈语音,这样,主控装置210可以直接获取第一声纹匹配对象对应的待识别声纹信息片段,以及,第二声纹匹配对象对应的待识别声纹信息片段。
当以从字典库中选择未注册声纹信息的声纹匹配对象组合生成复杂的声纹匹配对象,进行声纹认证,或者,以注册声纹信息库中选择声纹匹配对象组合生成复杂的声纹匹配对象,进行声纹认证时,所述待识别声纹信息中仅切分出与各第一声纹匹配对象对应的待识别声纹信息片段,或者,仅切分出与各第二声纹匹配对象对应的待识别声纹信息片段。对每个待识别声纹信息片段进行声纹匹配的具体实施方式参见前文描述,此处不再赘述。
本申请的一些实施例中,第一声纹匹配对象对应的注册声纹信息与相应待识别声纹信息片段分别进行声纹匹配后确定的匹配度大于第一匹配度阈值,则认为第一声纹匹配对象对应的待识别声纹信息片段声纹匹配成功;第二声纹匹配对象对应的注册声纹信息与相应待识别声纹信息片段分别进行声纹匹配后确定的匹配度大于第二匹配度阈值,则认为第二声纹匹配对象对应的待识别声纹信息片段声纹匹配成功,其中,第一匹配度阈值大于第二匹配度阈值。
本申请的一些实施例中,只有组合生成复合声纹匹配对象的每个第一声纹匹配对象和第二声纹匹配对象对应的待识别声纹信息片段均匹配成功,才认为待识别声纹信息匹配成功。如果组合生成复合声纹匹配对象的某个第一声纹匹配对象或某个第二声纹匹配对象对应的待识别声纹信息片段匹配失败,则认为整个待识别声纹信息匹配不成功。
本申请的另一些实施例中,还可以在组合生成复合声纹匹配对象的每个第一声纹匹配对象对应的待识别声纹信息片段均匹配成功时,即认为待识别声纹信息匹配成功。
步骤140,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,以及,执行所述声纹锁的开锁控制操作。
经过前述步骤对用户的待识别声纹信息进行声纹匹配之后,如果匹配成功,所述主控装置210将控制锁具执行机构240开启门锁,如果匹配失败则不开启门锁。
同时,如果待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,所述主控装置210还将执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作。
本申请的一些实施例中,所述响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,包括:响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,将所述待识别声纹信息作为与所述声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。例如,在待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功之后,主控装置210首先判断输出给用户的所述声纹匹配对象是否存在对应的注册声纹信息,如果所述声纹匹配对象在注册声纹信息库中没有存储对应的注册声纹信息,则通过当前待识别声纹信息更新所述注册声纹信息库;如果所述声纹匹配对象在注册声纹信息库中存储有对应的注册声纹信息,则不通过当前待识别声纹信息更新所述注册声纹信息库,即无需对所述注册声纹信息库进行操作。
本申请的一些实施例中,在通过当前待识别声纹信息更新所述注册声纹信息库时,如果所述声纹锁中存储的注册声纹信息库中已存储注册声纹信息数量大于或等于预设数量阈值,则通过当前待识别声纹信息更新维护所述注册声纹信息库。例如,按照预设规则删除一组声纹匹配对象与注册声纹信息的对应关系数据,之后,将当前与该声纹匹配对象匹配成功的待识别声纹信息作为该声纹匹配对象对应的注册声纹信息,与该声纹匹配对象对应存储至所述注册声纹信息库中。
本申请的另一些实施例中,在通过当前待识别声纹信息更新所述注册声纹信息库时,如果所述声纹锁中存储的注册声纹信息库中已存储注册声纹信息数量小于预设数量阈值,则直接将当前与该声纹匹配对象匹配成功的待识别声纹信息作为该声纹匹配对象对应的注册声纹信息,与该声纹匹配对象对应存储至所述注册声纹信息库中。
其中,所述预设数量阈值根据所述声纹锁中注册声纹信息库的存储容量确定。
本申请的一些实施例中,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,包括:响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,将各所述第二声纹匹配对象对应的待匹配声纹信息片段作为与各所述第二声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
例如,当声纹匹配对象是由第一声纹匹配对象和/或第二声纹匹配对象组成的复合声纹匹配对象时,仅基于第二声纹匹配对象对应的待识别声纹信息片段,更新注册声纹信息库。仍以前述复合声纹匹配对象“清芝麻”为例,当第一声纹匹配对象“芝麻”对应的待识别声纹信息片段F2和第二声纹匹配对象“清”对应的待识别声纹信息片段F1均匹配成功之后,或者,当第一声纹匹配对象“芝麻”对应的待识别声纹信息片段F2匹配成功之后,确定针对声纹匹配对象“清芝麻”的待识别声纹信息匹配成功,此时,主控装置210将第二声纹匹配对象“清”对应的待识别声纹信息片段F1,作为第二声纹匹配对象“清”的注册声纹信息,并将第二声纹匹配对象“清”和待识别声纹信息片段F1直接对应存储在所述声纹锁中的注册声纹信息库中,或者,按照预设规则删除一组声纹匹配对象与注册声纹信息的对应关系数据,之后,将待识别声纹信息片段F1作为第二声纹匹配对象对应的注册声纹信息,与第二声纹匹配对象对应存储至所述注册声纹信息库中。
本申请的一些实施例中,为了进一步提升声纹认证的安全性,可以在注册阶段,将声纹匹配对象拆分为独立的声纹匹配单元,便于在声纹认证阶段灵活组合生成多种复合的声纹匹配对象。其中,所述注册阶段,进一步包括:向用户输出声纹锁的字典库中存储的待注册声纹匹配对象的感知信息;采集用户针对所述待注册声纹匹配对象的感知信息的注册语音,并确定所述注册语音对应的注册声纹信息;对所述待注册声纹匹配对象进行拆分处理,确定组成所述待注册声纹匹配对象的各独立的声纹匹配对象;分别确定所述注册声纹信息中与每个所述独立的声纹匹配对象对应的注册声纹信息片段,之后,将各所述注册声纹信息片段作为相应独立的声纹匹配对象的注册声纹信息存储至所述声纹锁的注册声纹信息库中。
下面以原始注册的声纹匹配对象“芝麻”对应的注册声纹信息为例,阐述声纹注册过程。
首先,主控装置210随机从字典库中选择声纹匹配对象“芝麻”作为待注册声纹匹配对象,并通过感知信息输出装置250显示待注册声纹匹配对象“芝麻”的文本内容,和/或,播放所述待注册声纹匹配对象“芝麻”的朗读语音,以输出所述待注册声纹匹配对象“芝麻”的感知信息;之后,提示用户针对该待注册声纹匹配对象“芝麻”注册声纹信息;然后,主控装置210控制所述语音采集装置220采集用户针对所述感知信息的反馈语音作为注册语音。在采集到用户针对声纹锁呈现的“芝麻”的注册语音之后,提取所述注册语音中的声纹特征,作为注册语音对应的注册声纹信息,即作为声纹匹配对象“芝麻”的注册声纹信息。
本申请的实施例中,区分于声纹认证阶段的静默声纹注册过程,此处所述的声纹注册过程不需要将采集的声纹特征与注册声纹信息库中存储的注册声纹信息进行比对,因此,将不需要将采集的声纹特征与注册声纹信息库中存储的注册声纹信息进行比对的声纹注册过程称为原始注册过程。
进一步的,主控装置210对所述待注册声纹匹配对象“芝麻”按照预设规则(如按照单字符拆分)进行拆分处理,确定组成所述待注册声纹匹配对象“芝麻”的两个独立的声纹匹配对象“芝”和“麻”,之后,进一步对注册语音对应的注册声纹信息进行拆分,确定所述注册声纹信息中与拆分得到的独立的声纹匹配对象“芝”和“麻”分别对应的注册声纹信息片段;然后,主控装置210将拆分得到的独立的声纹匹配对象“芝”和对应的注册声纹信息片段对应存储至注册声纹信息库中,将拆分得到的独立的声纹匹配对象“麻”和对应的注册声纹信息片段对应存储至注册声纹信息库中,共生成两条注册声纹数据。
本申请的一些实施例中,所述独立的声纹匹配对象可以仅包括:单个字符,也可以既包括单个字符又包括词语。例如,当对字典库中的声纹匹配对象“我回来了”进行声纹注册时,可以将用户注册语音中提取的注册声纹信息拆分为“我”、“回来”、“了”三个独立的声纹匹配对象各自对应的注册声纹信息片段,存储为注册声纹信息库中的三个独立的声纹匹配对象的注册声纹信息。
本申请实施例公开的声纹锁控制方法,通过向用户输出声纹锁中存储的声纹匹配对象的感知信息;响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,以及,执行所述声纹锁的开锁控制操作,有效提升了声纹锁的安全性。
本申请实施例公开的声纹锁控制方法,通过在声纹匹配成功后,基于当前匹配成功的待识别声纹信息更新声纹锁中的注册声纹信息库,丰富了注册声纹信息库中的注册声纹信息,以及,实现了动态更新注册声纹信息库中的注册声纹信息,有效提升了声纹锁的安全性。进一步的,通过仅基于与未注册过声纹信息的声纹匹配对象的待识别声纹信息,对声纹锁中的注册声纹信息库进行更新,可以保证注册声纹信息库中的注册声纹信息的多样性,从而进一步提升声纹锁的安全性。
实施例二
参见图5,本申请实施例公开的一种声纹锁控制方法,应用于如图2和图3所示的声纹锁,所述方法还包括语音识别步骤。如图5所示,所述方法包括:步骤510至步骤580。
步骤510,向用户输出声纹锁中存储的声纹匹配对象的感知信息。
向用户输出声纹锁中存储的声纹匹配对象的感知信息的具体实施方式参见实施例一,本实施例中不再赘述。
步骤520,响应于声纹锁采集到针对所述感知信息的反馈语音,对所述反馈语音进行语音识别,确定所述反馈语音对应的语音识别结果。
所述声纹锁的主控装置210在接收到所述语音采集装置220采集的针对所述感知信息的反馈语音之后,首先对所述反馈语音进行语音识别,确定所述反馈语音对应的语音识别结果,即确定用户朗读的文本内容。
对所述反馈语音进行语音识别,确定所述反馈语音对应的语音识别结果的具体实施方式,参照现有技术中的语音识别方法,本申请对反馈语音的语音识别方法不做限定。
步骤530,将所述反馈语音对应的语音识别结果与所述声纹锁中存储的注册声纹信息库中所述声纹匹配对象的注册声纹信息对应的语音识别结果进行文本匹配。
本申请的一些实施例中,在如实施例一中所述的用户注册声纹信息的阶段,声纹锁还可以同时对注册语音进行语音识别,并将注册语音的语音识别结果、注册语音对应的注册声纹信息,以及,注册语音针对的声纹匹配对象三种数据对应存储在注册声纹信息库中。
例如,在声纹注册阶段,主控装置210随机从字典库中选择声纹匹配对象“芝麻”作为待注册声纹匹配对象,并通过感知信息输出装置250显示待注册声纹匹配对象“芝麻”的文本内容,和/或,播放所述待注册声纹匹配对象的朗读语音,以输出所述待注册声纹匹配对象的感知信息;之后,提示用户针对该待注册声纹匹配对象“芝麻”注册声纹信息;然后,主控装置210控制所述语音采集装置220采集用户针对所述感知信息的反馈语音作为注册语音。在采集到用户针对声纹锁显示的“芝麻”的注册语音之后,提取所述注册语音中的声纹特征,作为注册语音对应的注册声纹信息,即作为声纹匹配对象“芝麻”的注册声纹信息,同时,主控装置210对所述注册语音进行语音识别,确定注册语音对应的语音识别结果—文本“芝麻”,并将当前注册的声纹匹配对象(即词语“芝麻”)、注册语音对应的语音识别结果(即文本“芝麻”),以及注册语音对应的注册声纹信息关联地存储在注册声纹信息库中。
本申请的一些实施例中,所述声纹匹配对象的注册声纹信息对应的语音识别结果为用户针对所述声纹匹配对象的自定义注册文本。例如,在声纹注册阶段,当声纹锁输出待注册声纹信息的声纹匹配对象的感知信息时,用户可以自定义对应该声纹匹配对象的语音识别结果,以提升声纹锁的安全性。例如,当感知信息输出装置250显示待注册声纹匹配对象“芝麻”的文本内容,和/或,播放所述待注册声纹匹配对象的朗读语音,以输出所述待注册声纹匹配对象的感知信息;之后,提示用户针对该待注册声纹匹配对象“芝麻”注册声纹信息,用户可以朗读“kaimen”,即文本“开门”的读音,作为注册语音。这样,声纹锁中将存储声纹匹配对象(即词语“芝麻”)、注册语音对应的语音识别结果(即文本“开门”),以及注册语音对应的注册声纹信息(即用户朗读“kaimen”的语音中提取的声纹特征)关联地存储在注册声纹信息库中。
在声纹认证阶段,当主控装置210接收到语音采集装置220采集到针对所述感知信息(如显示的声纹匹配对象“芝麻”的文本内容)的反馈语音(如文本“开门”的读音)之后,对所述反馈语音进行语音识别,确定所述反馈语音对应的语音识别结果(如识别得到的语音识别结果为文本“开门”),之后,主控装置210将所述反馈语音对应的语音识别结果与所述声纹锁中存储的注册声纹信息库中声纹匹配对象“芝麻”的注册声纹信息对应的语音识别结果(如前述文本“开门”)进行文本匹配。
步骤540,确定所述反馈语音对应的语音识别结果与所述声纹匹配对象的注册声纹信息对应的语音识别结果是否匹配成功,若是,执行步骤550,否则,跳转至步骤580。
本申请的一些实施例中,响应于进行文本匹配得到的结果指示所述反馈语音对应的语音识别结果与所述声纹匹配对象的注册声纹信息对应的语音识别结果匹配成功,执行所述确定所述反馈语音中的待识别声纹信息的步骤;否则,结束当前声纹解锁流程。例如,若注册阶段,用户针对声纹匹配对象“芝麻”输入的注册语音为自定义的文本“开门”的读音,在声纹认证阶段,若用户针对声纹匹配对象“芝麻”依然朗读“开门”,则语音识别成功,若用户针对声纹匹配对象“芝麻”朗读为“芝麻”,则认为语音识别失败。
若语音识别成功,则继续后续的声纹认证步骤,否则,结束当前声纹认证流程。
步骤550,确定所述反馈语音中的待识别声纹信息。
确定所述反馈语音中的待识别声纹信息的具体实施方式参见实施例一,本实施例不再赘述。
步骤560,将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果的具体实施方式参见实施例一,本实施例不再赘述。
步骤570,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,和/或,执行所述声纹锁的开锁控制操作。
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,和/或,执行所述声纹锁的开锁控制操作的具体实施方式参见实施例一,本实施例不再赘述。
步骤580,结束当前声纹解锁流程。
本申请实施例公开的声纹锁控制方法,通过在声纹认证之前增加语音识别步骤,使得用户可以通过在声纹注册阶段自定义声纹匹配对象对应的语音识别文本,从而增强声纹锁的抗攻击能力,提升声纹锁的安全性。
实施例三
参见图6,本申请实施例公开的一种声纹锁控制方法,应用于如图2和图3所示的声纹锁,所述包括:步骤610至步骤670。
步骤610,向用户输出声纹锁中存储的声纹匹配对象的感知信息。
本申请的一些实施例中,所述声纹匹配对象选自于所述声纹锁中存储的注册声纹信息库中的注册声纹信息对应的声纹匹配对象。例如,主控装置210从声纹锁存储的注册声纹信息库中随机选择一个声纹匹配对象作为当前待匹配的声纹匹配对象,并通过感知信息输出装置250输出当前待匹配的声纹匹配对象的感知信息。
声纹锁输出指定声纹匹配对象的感知信息的具体实施方式参见实施例一,本实施例中不再赘述。
步骤620,响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息。
响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息的具体实施方式参见实施例一,本实施例中不再赘述。
步骤630,将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果的具体实施方式参见实施例一,本实施例中不再赘述。
步骤640,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,向所述用户输出字典内未注册声纹匹配对象的感知信息。
在本实施例中,当所述声纹匹配对象选自于所述声纹锁中存储的注册声纹信息库中的注册声纹信息对应的声纹匹配对象时,还需要进行一轮声纹认证,即该认证阶段需进行两轮声纹认证,以便在声纹认证同时对声纹锁中的注册声纹信息库进行更新维护,以提升声纹锁的安全性。
其中,所述字典内未注册声纹匹配对象选自于所述声纹锁中存储的字典库中且在所述注册声纹信息库中没有对应注册声纹信息的任意一声纹匹配对象。
确定字典内未注册声纹匹配对象之后,主控装置210通过感知信息输出装置250输出字典内未注册声纹匹配对象的感知信息。
步骤650,响应于声纹锁采集到针对所述字典内未注册声纹匹配对象的感知信息的第一反馈语音,确定所述第一反馈语音中的第一待识别声纹信息。
之后,主控装置210通过语音采集装置220采集针对字典内未注册声纹匹配对象的感知信息,确定所述反馈语音,本实施例中即为“第一反馈语音”,并进一步确定第一反馈语音中声纹信息,记为“第一待识别声纹信息”。
步骤660,将所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息进行声纹匹配,确定当前进行声纹匹配得到的匹配结果。
其中,所述当前匹配成功的所述注册声纹信息为:与所述待识别声纹信息匹配成功的所述注册声纹信息库中的注册声纹信息。之后,将所述第一待识别声纹信息与步骤630中用于进行声纹匹配的所述注册声纹信息进行声纹匹配,确定当前进行声纹匹配得到的匹配结果。即在该认证阶段的两轮声纹认证中,第一轮声纹认证的待识别声纹信息与所述注册声纹信息库中的注册声纹信息已匹配成功(如步骤630、640),将第二轮声纹认证中的字典内未注册声纹匹配对象的第一待识别声纹信息与第一轮声纹认证中匹配成功的注册声纹信息进行声纹匹配,并得到匹配结果。
步骤670,响应于当前进行声纹匹配得到的所述匹配结果指示所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息匹配成功,将所述第一待识别声纹信息作为与所述字典内未注册声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
在第二轮声纹认证通过后,根据第二轮的声纹认证结果执行注册声纹信息的更新维护。即响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,包括:响应于当前进行声纹匹配得到的所述匹配结果指示所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息匹配成功,将所述第一待识别声纹信息作为与所述字典内未注册声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
例如,主控装置210首先从注册声纹信息库中选择声纹匹配对象“芝麻”,并将声纹匹配对象“芝麻”的感知信息输出给用户,启动第一轮声纹认证。在获取到用户针对声纹匹配对象“芝麻”的反馈语音,并确定反馈语音中的待识别声纹信息(为了描述更清楚,记为“T1”)之后,将待识别声纹信息T1与注册声纹信息库中声纹匹配对象“芝麻”对应的注册声纹信息(为了描述更清楚,记为“R1”)进行声纹匹配。
对声纹匹配对象“芝麻”进行声纹匹配成功之后,主控装置210再从字典库中选择一个声纹匹配对象“苹果”(声纹匹配对象“苹果”没有存储在注册声纹信息库中,即声纹匹配对象“苹果”未注册过声纹信息),并将声纹匹配对象“苹果”的感知信息输出给用户,启动第二轮声纹认证。在获取到用户针对声纹匹配对象“苹果”的反馈语音,并确定反馈语音中的待识别声纹信息(为了描述更清楚,记为“T2”),之后,将待识别声纹信息T2与注册声纹信息库中声纹匹配对象“芝麻”对应的注册声纹信息R1进行声纹匹配,并确定声纹匹配结果。
若待识别声纹信息T2与注册声纹信息库中声纹匹配对象“芝麻”对应的注册声纹信息R1匹配成功,则将待识别声纹信息T2作为与声纹匹配对象“苹果”对应的注册声纹信息,直接存储在所述注册声纹信息库中。若注册声纹信息库中存储的注册声纹信息数量大于预设数量阈值,则按照预设策略删除一条原有的注册声纹信息。
本申请实施例公开的声纹锁控制方法,通过设置两轮声纹认证,第一轮声纹认证针对已经注册了声纹信息的声纹匹配对象,第二轮声纹认证针对未注册声纹信息的声纹匹配对象,并且两轮声纹匹配与注册声纹信息库中的同一条注册声纹信息进行匹配,使得在第二轮声纹认证通过后,可以对未注册声纹信息的声纹匹配对象静默注册声纹信息,动态更新声纹锁中存储的注册声纹信息库,以提升声纹锁的安全性。
实施例四
参考图7,本申请实施例公开的一种声纹锁控制装置,所述装置包括:
采集信息引导模块710,用于向用户输出声纹锁中存储的声纹匹配对象的感知信息;
声纹信息采集模块720,用于响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;
声纹匹配模块730,用于将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;
注册声纹信息库更新模块740,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作;和/或,
声纹锁控制模块750,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行所述声纹锁的开锁控制操作。
本申请的一些实施例中,向用户输出声纹锁中存储的声纹匹配对象的感知信息,包括:向用户展示声纹锁中存储的声纹匹配对象的文本,和/或,向用户播放声纹锁中存储的声纹匹配对象的朗读语音。
本申请的一些实施例中,所述声纹匹配模块730,进一步用于:
响应于所述声纹锁中存储的注册声纹信息库中有与所述声纹匹配对象对应的注册声纹信息,将所述待识别声纹信息与所述注册声纹信息库中与所述声纹匹配对象对应的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
本申请的另一些实施例中,所述声纹匹配模块730,进一步用于:
响应于所述声纹锁中存储的注册声纹信息库中没有与所述声纹匹配对象对应的注册声纹信息,将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中任意一条或多条注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
相应的,本申请的一些实施例中,所述注册声纹信息库更新模块740,进一步用于:
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,将所述待识别声纹信息作为与所述声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
本申请的一些实施例中,所述声纹匹配对象根据所述注册声纹信息库中存储的已注册声纹信息的第一声纹匹配对象,以及,所述声纹锁中存储的字典库内第二声纹匹配对象组合生成,所述声纹匹配模块730,进一步用于:
确定所述待识别声纹信息中分别与各所述第一声纹匹配对象和各所述第二声纹匹配对象对应的待识别声纹信息片段;以及,
将各所述第一声纹匹配对象对应的待识别声纹信息片段与相应的注册声纹信息进行声纹匹配,以及,将各所述第二声纹匹配对象对应的待识别声纹信息片段与所述注册声纹信息库中选定的注册声纹信息进行声纹匹配,确定所述待识别声纹信息与所述声纹匹配对象的声纹匹配结果。
本申请的一些实施例中,所述选定注册声纹信息包括:随机选择的一条注册声纹信息、与所述第二声纹匹配对象字符距离最近的所述第一声纹匹配对象对应的注册声纹信息。
相应的,所述注册声纹信息库更新模块740,进一步用于:
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,将各所述第二声纹匹配对象对应的待匹配声纹信息片段作为与各所述第二声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
参见图8,本申请的一些实施例中,所述装置还包括:声纹注册模块700,进一步用于:
向用户输出声纹锁的字典库中存储的待注册声纹匹配对象的感知信息;
采集用户针对所述待注册声纹匹配对象的感知信息的注册语音,并确定所述注册语音对应的注册声纹信息;
对所述待注册声纹匹配对象进行拆分处理,确定组成所述待注册声纹匹配对象的各独立的声纹匹配对象;
分别确定所述注册声纹信息中与每个所述独立的声纹匹配对象对应的注册声纹信息片段,之后,将各所述注册声纹信息片段作为相应独立的声纹匹配对象的注册声纹信息存储至所述声纹锁中存储的注册声纹信息库中。
本申请的另一些实施例中,所述声纹注册模块700,进一步用于:
向用户输出声纹锁的字典库中存储的待注册声纹匹配对象的感知信息;
采集用户针对所述待注册声纹匹配对象的感知信息的注册语音,并确定所述注册语音对应的注册声纹信息;以及,
将所述注册声纹信息作为所述待注册声纹匹配对象的注册声纹信息存储至所述声纹锁中存储的注册声纹信息库中。
本申请实施例公开的声纹锁控制装置,通过向用户输出声纹锁中存储的声纹匹配对象的感知信息;响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,和/或,执行所述声纹锁的开锁控制操作,有效提升了声纹锁的安全性。
本申请实施例公开的声纹锁控制装置,通过在声纹匹配成功后,基于当前匹配成功的待识别声纹信息更新声纹锁中的注册声纹信息库,丰富注册声纹信息库中的注册声纹信息,以及,实现了动态更新注册声纹信息库中的注册声纹信息,有效提升了声纹锁的安全性。进一步的,通过仅基于与未注册过声纹信息的声纹匹配对象的待识别声纹信息,对声纹锁中的注册声纹信息库进行更新,可以保证注册声纹信息库中的注册声纹信息的多样性,从而进一步提升声纹锁的安全性。
实施例五
参见图9,基于实施例四,所述声纹匹配对象选自于所述声纹锁中存储的注册声纹信息库中的注册声纹信息对应的声纹匹配对象,本申请的又一些实施例中,公开了一种声纹锁控制装置,与实施例四中所述的声纹锁控制装置区别在于,所述装置还包括:第二轮采集信息引导模块760、第二轮声纹信息采集模块770,以及,第二轮声纹匹配模块780。其中,
所述第二轮采集信息引导模块760,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,向所述用户输出字典内未注册声纹匹配对象的感知信息,其中,所述字典内未注册声纹匹配对象选自于所述声纹锁中存储的字典库中且在所述注册声纹信息库中没有对应注册声纹信息的任意一声纹匹配对象;
所述第二轮声纹信息采集模块770,用于响应于声纹锁采集到针对所述字典内未注册声纹匹配对象的感知信息的第一反馈语音,确定所述第一反馈语音中的第一待识别声纹信息;
所述第二轮声纹匹配模块780,用于将所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息进行声纹匹配,确定当前进行声纹匹配得到的匹配结果,其中,所述当前匹配成功的所述注册声纹信息为:与所述待识别声纹信息匹配成功的所述注册声纹信息库中的注册声纹信息。
相应的,所述注册声纹信息库更新模块740,进一步用于:
响应于当前进行声纹匹配得到的所述匹配结果指示所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息匹配成功,将所述第一待识别声纹信息作为与所述字典内未注册声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
本申请实施例公开的声纹锁控制装置,通过设置两轮声纹认证,第一轮声纹认证针对已经注册了声纹信息的声纹匹配对象,第二轮声纹认证针对未注册声纹信息的声纹匹配对象,并且两轮声纹匹配与注册声纹信息库中的同一条注册声纹信息进行匹配,使得在第二轮声纹认证通过后,可以对未注册声纹信息的声纹匹配对象静默注册声纹信息,动态更新声纹锁中存储的注册声纹信息库,以提升声纹锁的安全性。
实施例六
参见图10,基于实施例四,本申请的又一些实施例中,公开了一种声纹锁控制装置,与实施例四中所述的声纹锁控制装置区别在于,所述装置还包括:语音识别模块790。
所述语音识别模块790,用于对所述反馈语音进行语音识别,确定所述反馈语音对应的语音识别结果;以及,将所述反馈语音对应的语音识别结果与所述声纹锁中存储的注册声纹信息库中所述声纹匹配对象的注册声纹信息对应的语音识别结果进行文本匹配;
所述语音识别模块790,还用于响应于进行文本匹配得到的结果指示所述反馈语音对应的语音识别结果与所述声纹匹配对象的注册声纹信息对应的语音识别结果匹配成功,跳转至调用所述声纹匹配模块730;否则,结束当前声纹解锁流程;
其中,所述声纹匹配对象的注册声纹信息对应的语音识别结果为用户针对所述声纹匹配对象的自定义注册文本。
相应的,所述声纹注册模块700还用于,对注册语音进行语音识别,并将注册语音的语音识别结果、注册语音对应的注册声纹信息,以及,注册语音针对的声纹匹配对象三种数据对应存储在注册声纹信息库中。
本申请实施例公开的声纹锁控制装置,通过在声纹认证之前增加语音识别步骤,使得用户可以通过在声纹注册阶段自定义声纹匹配对象对应的语音识别文本,从而增强声纹锁的抗攻击能力,提升声纹锁的安全性。
相应的,本申请实施例公开的一种声纹锁,所述声纹锁的结构如图2和图3所示,具体的,所述声纹锁包括:主控装置210,分别与所述主控装置通信连接的语音采集装置220、存储器230、锁具执行机构240、感知信息输出装置250,其中,
所述存储器230,用于存储字典库和注册声纹信息库,其中,所述注册声纹信息库中存储有:声纹匹配对象,以及所述相应声纹匹配对应的注册声纹信息;
所述感知信息输出装置250,用于根据所述主控装置的控制,输出呈现指定声纹匹配对象的感知信息,其中,所述输出呈现指定声纹匹配对象的感知信息,包括:显示指定声纹匹配对象的文本;和/或,播放指定声纹匹配对象的朗读语音;
所述语音采集装置220,用于根据所述主控装置的控制采集用户针对所述感知信息的反馈语音,并将采集的所述反馈语音发送至所述主控装置;
所述主控装置210,还用于确定所述反馈语音中的待识别声纹信息,并将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,以及,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作;和/或,执行所述声纹锁的开锁控制操作。
所述确定所述反馈语音中的待识别声纹信息,并将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,以及,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作的具体实施方式,参见实施例一至实施例三中的相关描述,此处不再赘述。
相应的,本申请还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一所述的声纹锁控制方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。
本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一至实施例三中任意一实施例所述的声纹锁控制方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种声纹锁控制方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着,结合实施例描述的特定特征、结构或者特性包括在本申请的至少一个实施例中。此外,请注意,这里“在一个实施例中”的词语例子不一定全指同一个实施例。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种声纹锁控制方法,其特征在于,包括:
向用户输出声纹锁中存储的声纹匹配对象的感知信息;
响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;
将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,和/或,执行所述声纹锁的开锁控制操作。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果的步骤,包括:
响应于所述声纹锁中存储的注册声纹信息库中有与所述声纹匹配对象对应的注册声纹信息,将所述待识别声纹信息与所述注册声纹信息库中与所述声纹匹配对象对应的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
3.根据权利要求1所述的方法,其特征在于,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果的步骤,包括:
响应于所述声纹锁中存储的注册声纹信息库中没有与所述声纹匹配对象对应的注册声纹信息,将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中任意一条或多条注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果。
4.根据权利要求3所述的方法,其特征在于,所述响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作,包括:
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,将所述待识别声纹信息作为与所述声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
5.根据权利要求1所述的方法,其特征在于,所述声纹匹配对象选自于所述声纹锁中存储的注册声纹信息库中的注册声纹信息对应的声纹匹配对象,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果的步骤之后,还包括:
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,向所述用户输出字典内未注册声纹匹配对象的感知信息,其中,所述字典内未注册声纹匹配对象选自于所述声纹锁中存储的字典库中且在所述注册声纹信息库中没有对应注册声纹信息的任意一声纹匹配对象;
响应于声纹锁采集到针对所述字典内未注册声纹匹配对象的感知信息的第一反馈语音,确定所述第一反馈语音中的第一待识别声纹信息;
将所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息进行声纹匹配,确定当前进行声纹匹配得到的匹配结果,其中,所述当前匹配成功的所述注册声纹信息为:与所述待识别声纹信息匹配成功的所述注册声纹信息库中的注册声纹信息;
所述响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作的步骤,包括:
响应于当前进行声纹匹配得到的所述匹配结果指示所述第一待识别声纹信息与当前匹配成功的所述注册声纹信息匹配成功,将所述第一待识别声纹信息作为与所述字典内未注册声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
6.根据权利要求1所述的方法,其特征在于,所述声纹匹配对象根据所述注册声纹信息库中存储的已注册声纹信息的第一声纹匹配对象,以及,所述声纹锁中存储的字典库内第二声纹匹配对象组合生成,所述将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果的步骤,包括:
确定所述待识别声纹信息中分别与各所述第一声纹匹配对象和各所述第二声纹匹配对象对应的待识别声纹信息片段;
将各所述第一声纹匹配对象对应的待识别声纹信息片段与相应的注册声纹信息进行声纹匹配,以及,将各所述第二声纹匹配对象对应的待识别声纹信息片段与所述注册声纹信息库中选定的注册声纹信息进行声纹匹配,确定所述待识别声纹信息与所述声纹匹配对象的声纹匹配结果。
7.根据权利要求6所述的方法,其特征在于,所述选定注册声纹信息包括:随机选择的一条注册声纹信息、与所述第二声纹匹配对象字符距离最近的所述第一声纹匹配对象对应的注册声纹信息。
8.根据权利要求6所述的方法,其特征在于,所述响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作的步骤,包括:
响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,将各所述第二声纹匹配对象对应的待匹配声纹信息片段作为与各所述第二声纹匹配对象对应的注册声纹信息,存储在所述注册声纹信息库中或对所述注册声纹信息库中的注册声纹信息进行更新维护。
9.根据权利要求1所述的方法,其特征在于,所述向用户输出声纹锁中存储的声纹匹配对象的感知信息的步骤之前,还包括:
向用户输出声纹锁的字典库中存储的待注册声纹匹配对象的感知信息;
采集用户针对所述待注册声纹匹配对象的感知信息的注册语音,并确定所述注册语音对应的注册声纹信息;
对所述待注册声纹匹配对象进行拆分处理,确定组成所述待注册声纹匹配对象的各独立的声纹匹配对象;
分别确定所述注册声纹信息中与每个所述独立的声纹匹配对象对应的注册声纹信息片段,之后,将各所述注册声纹信息片段作为相应独立的声纹匹配对象的注册声纹信息存储至所述声纹锁中存储的注册声纹信息库中。
10.根据权利要求1至9任一项所述的方法,其特征在于,所述确定所述反馈语音中的待识别声纹信息之前,还包括:
对所述反馈语音进行语音识别,确定所述反馈语音对应的语音识别结果;
将所述反馈语音对应的语音识别结果与所述声纹锁中存储的注册声纹信息库中所述声纹匹配对象的注册声纹信息对应的语音识别结果进行文本匹配;
响应于进行文本匹配得到的结果指示所述反馈语音对应的语音识别结果与所述声纹匹配对象的注册声纹信息对应的语音识别结果匹配成功,执行所述确定所述反馈语音中的待识别声纹信息的步骤;否则,结束当前声纹解锁流程;
其中,所述声纹匹配对象的注册声纹信息对应的语音识别结果为用户针对所述声纹匹配对象的自定义注册文本。
11.一种声纹锁控制装置,其特征在于,包括:
采集信息引导模块,用于向用户输出声纹锁中存储的声纹匹配对象的感知信息;
声纹信息采集模块,用于响应于声纹锁采集到针对所述感知信息的反馈语音,确定所述反馈语音中的待识别声纹信息;
声纹匹配模块,用于将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果;
注册声纹信息库更新模块,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作;和/或,
声纹锁控制模块,用于响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行所述声纹锁的开锁控制操作。
12.一种声纹锁,其特征在于,包括:主控装置,分别与所述主控装置通信连接的语音采集装置、存储器、锁具执行机构、感知信息输出装置,其中,
所述存储器,用于存储字典库和注册声纹信息库,其中,所述注册声纹信息库中存储有:声纹匹配对象,以及所述相应声纹匹配对应的注册声纹信息;
所述感知信息输出装置,用于根据所述主控装置的控制,输出呈现指定声纹匹配对象的感知信息,其中,所述输出呈现指定声纹匹配对象的感知信息,包括:显示指定声纹匹配对象的文本;和/或,播放指定声纹匹配对象的朗读语音;
所述语音采集装置,用于根据所述主控装置的控制采集用户针对所述感知信息的反馈语音,并将采集的所述反馈语音发送至所述主控装置;
所述主控装置,还用于确定所述反馈语音中的待识别声纹信息,并将所述待识别声纹信息与所述声纹锁中存储的注册声纹信息库中的注册声纹信息进行声纹匹配,确定所述进行声纹匹配得到的匹配结果,以及,响应于所述匹配结果指示所述待识别声纹信息与所述注册声纹信息库中的注册声纹信息匹配成功,执行基于所述待识别声纹信息对所述注册声纹信息库的更新操作;和/或,执行所述声纹锁的开锁控制操作。
13.根据权利要求12所述的声纹锁,其特征在于,所述存储器内置于所述主控装置中。
14.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的程序代码,其特征在于,所述处理器执行所述程序代码时实现权利要求1至10任意一项所述的声纹锁控制方法。
15.一种计算机可读存储介质,其上存储有程序代码,其特征在于,该程序代码被处理器执行时实现权利要求1至10任意一项所述的声纹锁控制方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110747765.1A CN113570754B (zh) | 2021-07-01 | 2021-07-01 | 声纹锁控制方法、装置、电子设备 |
PCT/CN2022/100787 WO2023274028A1 (zh) | 2021-07-01 | 2022-06-23 | 声纹锁控制方法、装置、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110747765.1A CN113570754B (zh) | 2021-07-01 | 2021-07-01 | 声纹锁控制方法、装置、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113570754A true CN113570754A (zh) | 2021-10-29 |
CN113570754B CN113570754B (zh) | 2022-04-29 |
Family
ID=78163421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110747765.1A Active CN113570754B (zh) | 2021-07-01 | 2021-07-01 | 声纹锁控制方法、装置、电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113570754B (zh) |
WO (1) | WO2023274028A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023274028A1 (zh) * | 2021-07-01 | 2023-01-05 | 汉王科技股份有限公司 | 声纹锁控制方法、装置、电子设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013289660A1 (en) * | 2012-07-09 | 2014-10-30 | Huawei Device Co., Ltd. | Method for updating voiceprint feature model and terminal |
CN106098068A (zh) * | 2016-06-12 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法和装置 |
CN106506524A (zh) * | 2016-11-30 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 用于验证用户的方法和装置 |
CN106782572A (zh) * | 2017-01-22 | 2017-05-31 | 清华大学 | 语音密码的认证方法及系统 |
CN106920303A (zh) * | 2017-01-21 | 2017-07-04 | 云丁网络技术(北京)有限公司 | 一种基于语音识别的开锁方法及其智能门锁系统 |
CN107610709A (zh) * | 2017-08-01 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 一种训练声纹识别模型的方法及系统 |
WO2020007495A1 (en) * | 2018-07-06 | 2020-01-09 | Veridas Digital Authentication Solutions, S.L. | Authenticating a user |
CN111091837A (zh) * | 2019-12-27 | 2020-05-01 | 中国人民解放军陆军工程大学 | 一种基于在线学习的时变声纹认证方法及系统 |
CN111341326A (zh) * | 2020-02-18 | 2020-06-26 | RealMe重庆移动通信有限公司 | 语音处理方法及相关产品 |
CN112309406A (zh) * | 2020-09-21 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | 声纹注册方法、装置和计算机可读存储介质 |
CN112863009A (zh) * | 2019-11-08 | 2021-05-28 | 北京声智科技有限公司 | 门锁控制方法、装置、设备及计算机存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180632A (zh) * | 2017-06-19 | 2017-09-19 | 微鲸科技有限公司 | 语音控制方法、装置及可读存储介质 |
CN111599074A (zh) * | 2020-06-09 | 2020-08-28 | 苏州思必驰信息科技有限公司 | 楼宇门禁的注册方法、使用方法及装置 |
CN113570754B (zh) * | 2021-07-01 | 2022-04-29 | 汉王科技股份有限公司 | 声纹锁控制方法、装置、电子设备 |
-
2021
- 2021-07-01 CN CN202110747765.1A patent/CN113570754B/zh active Active
-
2022
- 2022-06-23 WO PCT/CN2022/100787 patent/WO2023274028A1/zh active Application Filing
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013289660A1 (en) * | 2012-07-09 | 2014-10-30 | Huawei Device Co., Ltd. | Method for updating voiceprint feature model and terminal |
CN106098068A (zh) * | 2016-06-12 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法和装置 |
CN106506524A (zh) * | 2016-11-30 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 用于验证用户的方法和装置 |
CN106920303A (zh) * | 2017-01-21 | 2017-07-04 | 云丁网络技术(北京)有限公司 | 一种基于语音识别的开锁方法及其智能门锁系统 |
CN106782572A (zh) * | 2017-01-22 | 2017-05-31 | 清华大学 | 语音密码的认证方法及系统 |
CN107610709A (zh) * | 2017-08-01 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 一种训练声纹识别模型的方法及系统 |
WO2020007495A1 (en) * | 2018-07-06 | 2020-01-09 | Veridas Digital Authentication Solutions, S.L. | Authenticating a user |
CN112863009A (zh) * | 2019-11-08 | 2021-05-28 | 北京声智科技有限公司 | 门锁控制方法、装置、设备及计算机存储介质 |
CN111091837A (zh) * | 2019-12-27 | 2020-05-01 | 中国人民解放军陆军工程大学 | 一种基于在线学习的时变声纹认证方法及系统 |
CN111341326A (zh) * | 2020-02-18 | 2020-06-26 | RealMe重庆移动通信有限公司 | 语音处理方法及相关产品 |
CN112309406A (zh) * | 2020-09-21 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | 声纹注册方法、装置和计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023274028A1 (zh) * | 2021-07-01 | 2023-01-05 | 汉王科技股份有限公司 | 声纹锁控制方法、装置、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2023274028A1 (zh) | 2023-01-05 |
CN113570754B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10593334B2 (en) | Method and apparatus for generating voiceprint information comprised of reference pieces each used for authentication | |
EP3109858B1 (en) | Voiceprint authentication method and apparatus | |
CN107274916B (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
CN104821934A (zh) | 基于人工智能的声纹登录方法和装置 | |
CN110347872B (zh) | 视频封面图像提取方法及装置、存储介质及电子设备 | |
CN103559880B (zh) | 语音输入系统和方法 | |
CN107221333A (zh) | 一种身份认证的方法和装置 | |
JP2002533789A (ja) | 自動音声認識システムにおけるnベストリストに用いる知識ベース戦略 | |
CN111883140A (zh) | 基于知识图谱和声纹识别的认证方法、装置、设备及介质 | |
CN111091837A (zh) | 一种基于在线学习的时变声纹认证方法及系统 | |
CN113570754B (zh) | 声纹锁控制方法、装置、电子设备 | |
CN113766314A (zh) | 视频切分方法、装置、设备、系统及存储介质 | |
CN109308578A (zh) | 一种企业大数据分析系统及方法 | |
CN113282788A (zh) | 基于神经网络技术的视频配乐推荐方法、装置以及设备 | |
CN111046217B (zh) | 组合歌曲生成方法、装置、设备以及存储介质 | |
CN112351047B (zh) | 基于双引擎的声纹身份认证方法、装置、设备及存储介质 | |
CN109087647B (zh) | 声纹识别处理方法、装置、电子设备及存储介质 | |
KR101181060B1 (ko) | 음성 인식 시스템 및 이를 이용한 화자 인증 방법 | |
CN115512692B (zh) | 语音识别方法、装置、设备及存储介质 | |
CN113628637A (zh) | 一种音频识别方法、装置、设备及存储介质 | |
CN111785280A (zh) | 身份认证方法和装置、存储介质和电子设备 | |
KR101925253B1 (ko) | 문맥 독립형 화자확인 장치 및 이를 이용한 화자확인 방법 | |
JP2000181490A (ja) | 利用者照合方法および利用者照合装置 | |
JP3322491B2 (ja) | 音声認識装置 | |
CN112202774B (zh) | 一种应用程序登录方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |