CN115100776B - 一种基于语音识别的门禁认证方法、系统及存储介质 - Google Patents
一种基于语音识别的门禁认证方法、系统及存储介质 Download PDFInfo
- Publication number
- CN115100776B CN115100776B CN202210597279.0A CN202210597279A CN115100776B CN 115100776 B CN115100776 B CN 115100776B CN 202210597279 A CN202210597279 A CN 202210597279A CN 115100776 B CN115100776 B CN 115100776B
- Authority
- CN
- China
- Prior art keywords
- user
- authentication
- voice
- answer
- identity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000002159 abnormal effect Effects 0.000 claims abstract description 18
- 230000005856 abnormality Effects 0.000 claims abstract description 14
- 238000012795 verification Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 3
- 241000700605 Viruses Species 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000009977 dual effect Effects 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/30—Individual registration on entry or exit not involving the use of a pass
- G07C9/32—Individual registration on entry or exit not involving the use of a pass in combination with an identity check
- G07C9/37—Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Lock And Its Accessories (AREA)
Abstract
本发明公开了一种基于语音识别的门禁认证方法、系统及存储介质,包括以下步骤:步骤a.获取用户开门申请及用户身份信息;步骤b.基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户;步骤c.获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;步骤d.将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请。通过语音识别与声纹识别,避免病毒传播风险;通过身份认证和声纹认证的双重认证,仅需将用户语音与满足身份认证的声纹信息进行一对一的匹配,极大的提高了验证效率。
Description
技术领域
本发明涉及语音识别技术领域,特别是一种基于语音识别的门禁认证方法及其应用该方法的基于语音识别的门禁认证方法、系统及计算机可读存储介质。
背景技术
对于门禁识别也存在一定考验,特别是面部识别的认证方式,由于口罩使得人脸识别变得不可行,若摘口罩进行识别则会存在严重的安全隐患。目前,较为普遍应用的门禁认证方式例如:指纹识别、面部识别、门禁卡识别等认证方式都存在直接或间接接触的安全隐患。
相反,无接触的语音识别门禁系统则越来越受到消费者的喜爱。但是,现有技术的语音识别需要将用户语音与数据库中的大量语音进行匹配认证,计算量较大,用户等待时间较长,且准确率较低,导致用户体验不好。
发明内容
本发明的主要目的在于提供了一种基于语音识别的门禁认证方法、系统及存储介质,旨在解决现有的门禁认证方式都存在间接接触的安全隐患的技术问题。
为实现上述目的,本发明提供了一种基于语音识别的门禁认证方法,其包括以下步骤:步骤a.获取用户开门申请及用户身份信息;步骤b.基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户;步骤c.获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;步骤d.将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请。
可选的,用户进行身份注册时,提供用户身份信息;用户身份信息具有唯一标识性。
可选的,用户进行身份注册至少包括如下步骤:获取用户身份信息、多组认证问题及答案语音;将多组答案语音进行拼接后,输入声纹识别模型;基于拼接答案语音,提取该用户声纹特征,并存储用户信息;用户信息用于用户身份认证,用户信息包括:用户身份信息、用户声纹特征与用户认证问题及答案。
可选的,认证问题至少包括用户预设认证问题、系统默认认证问题其中一种;所述用户预设认证问题为,用户进行身份注册时,自行设置的认证问题;所述系统默认认证问题为,从系统问答库中随机抽取的认证问题。
可选的,所述步骤c,获取用户回答语音,判断用户身份信息是否存在异常;具体包括如下步骤:c1.获取噪音阈值β、用户回答语音,并将用户回答语音进行分帧处理,得到N段第一回答语音;c2.将N段第一回答语音分别输入有效语音模型,根据噪音阈值β,遍历N段第一回答语音,判断每段第一回答语音中是否包括噪音;若包括,则对第一回答语音进行分离处理,得到有效语音,若不包括,则直接保存第一回答语音,并进行依次拼接,得到有效语音;c3.将有效语音转换为文字,并与认证问题的标准答案进行比对,若一致,则判断用户身份信息正常,并获取有效语音;若不一致,则判断用户身份信息异常,并将异常信息推送至用户。
可选的,有效语音模型经过二分类模型训练,训练样本包括噪音样本与非噪音样本。
可选的,步骤c2中,分离处理具体包括如下步骤:c20.获取包括噪音的第一回答语音帧,并将其设置为静音帧;c21.将静音帧进行分离后,得到M 段第二回答语音;其中,M≤N;c22.将M段第二回答语音依次进行拼接,得到有效语音。
可选的,所述步骤d中,将有效语音输入声纹识别模型,并提取声纹特征进行身份认证,具体包括如下步骤:d1.将有效语音输入声纹识别模型,并提取声纹特征;d2.基于声纹特征,进行特征打分;d3.获取特征打分分值以及识别阈值θ,并将获取特征打分分值与识别阈值θ进行比较,若特征打分分值大于识别阈值θ,判断为身份认证成功,则通过用户开门申请,否则,判断为身份认证失败,则拒绝用户开门申请。
与所述基于语音识别的门禁认证方法相对应的,本发明提供一种基于语音识别的门禁认证系统,其包括:信息获取模块,用于获取用户开门申请及用户身份信息;身份信息校验模块,用于基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户,并获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;身份认证模块,用于将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请;身份注册模块,用于获取用户身份信息、多组认证问题及答案语音;将多组答案语音进行拼接后,输入声纹识别模型;基于拼接答案语音,提取该用户声纹特征,并存储用户信息;用户信息用于用户身份认证,用户信息包括:用户身份信息、用户声纹特征与用户认证问题及答案。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于语音识别的门禁认证程序,所述基于语音识别的门禁认证程序被处理器执行时实现如上文所述的基于语音识别的门禁认证方法的步骤。
本发明的有益效果是:
(1)通过语音识别与声纹识别,实现份信息校验与身份认证,避免直接或间接接触产生病毒传播风险,能够安全地进行门禁开锁,并且可以远程操作,更加便利;通过身份认证和声纹认证的双重认证,获取用户身份信息,进行身份信息校验与身份认证时,实现1:1身份信息校验与身份认证,不仅提高了准确率,而且仅需将用户语音与满足身份认证的数据库声纹信息进行一对一的匹配,极大的提高了验证效率;进一步地,缩短了数据比对、计算过程,提高了用户体验;
(2)用户进行身份注册时,通过将多组答案语音进行拼接,保证有足够长的答案语音进行注册,提高了声纹识别模型的性能;
(3)通过噪声阈值进行噪声检测,并基于检测结果进行分离处理,能够将用户回答语音转换为有效语音,避免无效或错误语音信息影响,提高声纹识别的准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明基于语音识别的门禁认证方法的流程简图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明的一种基于语音识别的门禁认证方法,其包括以下步骤:步骤a.获取用户开门申请及用户身份信息;步骤b.基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户;步骤c.获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;步骤d.将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请。
本申请通过语音识别与声纹识别,实现份信息校验与身份认证,避免直接或间接接触产生病毒传播风险,能够安全地进行门禁开锁,并且可以远程操作,更加便利;通过身份认证和声纹认证的双重认证,获取用户身份信息,进行身份信息校验与身份认证时,实现1:1身份信息校验与身份认证,不仅提高了准确率,而且仅需将用户语音与满足身份认证的数据库声纹信息进行一对一的匹配,极大的提高了验证效率;进一步地,缩短了数据比对、计算过程,提高了用户体验。
在本实施例中,步骤a.获取用户开门申请及用户身份信息,具体可通过以下方式实现。需要注意的是,以下两种方式中的实现方式,还可以根据实际应用需要进行组合。
方式一:分别获取用户开门申请、用户身份信息。具体而言,用户根据第一预设唤醒方式唤醒门禁系统,并发起开门申请。需要说明的是,在本方式中,用户唤醒门禁系统为现场唤醒或远程操作唤醒,远程操作时,用户通过移动终端进行远程操作唤醒门禁系统。用户唤醒门禁系统并发起开门申请后,门禁系统识别并获取用户开门申请后,下发用户身份信息获取通知,用户接收并根据该通知上传本人身份信息。其中,第一预设唤醒方式为通过第一预设语音口令唤醒门禁系统;用户上传本人身份信息为,通过手动输入身份信息或语音输入身份信息。需要说明的是,此处所述手动输入身份信息并非手动在门禁系统上输入,而是用户通过移动终端与门禁系统的通讯连接,直接在移动终端上输入身份信息,与门禁系统并不产生直接或间接的接触。优选的,移动终端为手机。
方式二:同时获取用户开门申请、用户身份信息。具体而言,用户根据第二预设唤醒方式唤醒门禁系统,门禁系统下发用户开门申请、用户身份信息获取通知,用户根据该通知发起开门申请及上传本人身份信息。类似的,在本方式中,用户唤醒门禁系统为现场唤醒或远程操作唤醒,远程操作时,用户通过移动终端进行远程操作唤醒门禁系统。优选的,移动终端为手机。第二预设唤醒方式为通过第二预设语音口令唤醒门禁系统。门禁系统被唤醒后,下发用户开门申请、用户身份信息获取通知,用户通过语音输入,发起开门申请及上传本人身份信息。例如,用户可以直接说:“请开门(发起开门申请),我是XXX(本人身份信息)。”需要说明的是,此处仅作为举例说明,具体用户语音输入包括哪些文字内容,本申请不做具体限定,用户语音输入可以体现开门申请以及用户身份信息即可。
在本实施例中,用户进行身份注册时,提供用户身份信息;用户身份信息具有唯一标识性。具体而言,用户进行身份注册至少包括如下步骤:获取用户身份信息、多组认证问题及答案语音;将多组答案语音进行拼接后,输入声纹识别模型;基于拼接答案语音,提取该用户声纹特征,并存储用户信息;用户信息用于用户身份认证,用户信息包括:用户身份信息、用户声纹特征与用户认证问题及答案。
本申请通过用户进行身份注册时,通过将多组答案语音进行拼接,保证有足够长的答案语音进行注册,提高了声纹识别模型的性能。
优选的,单个用户信息组织格式如下:
<Id,[(Quesetion1,Answer1),(Quesetion2,Answer2)...],Embedding>;
其中,Id为用户身份信息,[(Quesetion1,Answer1),(Quesetion2,Answe r2)...]为用户认证问题及答案,Embedding为用户声纹特征。
优选的,认证问题至少包括用户预设认证问题、系统默认认证问题其中一种;所述用户预设认证问题为,用户进行身份注册时,自行设置的认证问题;所述系统默认认证问题为,从系统问答库中随机抽取的认证问题。
在本实施例中,所述步骤c,获取用户回答语音,判断用户身份信息是否存在异常;具体包括如下步骤:
c1.获取噪音阈值β、用户回答语音,并将用户回答语音进行分帧处理,得到N段第一回答语音;
c2.将N段第一回答语音分别输入有效语音模型,根据噪音阈值β,遍历 N段第一回答语音,判断每段第一回答语音中是否包括噪音;若包括,则对第一回答语音进行分离处理,得到有效语音,若不包括,则直接保存第一回答语音,并进行依次拼接,得到有效语音;
c3.将有效语音转换为文字,并与认证问题的标准答案进行比对,若一致,则判断用户身份信息正常,并获取有效语音;若不一致,则判断用户身份信息异常,并将异常信息推送至用户。
在本实施例中,有效语音模型经过二分类模型训练,训练样本包括噪音样本与非噪音样本。主要针对手机使用场景下的无效语音的识别,噪音样本为车辆鸣笛声、鸟叫、知了叫等,非噪音样本为正常手机对话声音,基于以上样本进行二分类模型训练,使模型具备区分噪声和正常语音的能力。
在本实施例中,步骤c2中,分离处理具体包括如下步骤:c20.获取包括噪音的第一回答语音帧,并将其设置为静音帧;c21.将静音帧进行分离后,得到M段第二回答语音;其中,M≤N;c22.将M段第二回答语音依次进行拼接,得到有效语音。
本申请通过噪声阈值进行噪声检测,并基于检测结果进行分离处理,能够将用户回答语音转换为有效语音,避免无效或错误语音信息影响,提高声纹识别的准确性。
在本实施例中,所述步骤d中,将有效语音输入声纹识别模型,并提取声纹特征进行身份认证,具体包括如下步骤:d1.将有效语音输入声纹识别模型,并提取声纹特征;d2.基于声纹特征,进行特征打分;d3.获取特征打分分值以及识别阈值θ,并将获取特征打分分值与识别阈值θ进行比较,若特征打分分值大于识别阈值θ,判断为身份认证成功,则通过用户开门申请,否则,判断为身份认证失败,则拒绝用户开门申请。
与所述基于语音识别的门禁认证方法相对应的,本发明提供一种基于语音识别的门禁认证系统,其包括:信息获取模块,用于获取用户开门申请及用户身份信息;身份信息校验模块,用于基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户,并获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;身份认证模块,用于将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请;身份注册模块,用于获取用户身份信息、多组认证问题及答案语音;将多组答案语音进行拼接后,输入声纹识别模型;基于拼接答案语音,提取该用户声纹特征,并存储用户信息;用户信息用于用户身份认证,用户信息包括:用户身份信息、用户声纹特征与用户认证问题及答案。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于语音识别的门禁认证程序,所述基于语音识别的门禁认证程序被处理器执行时实现如上文所述的基于语音识别的门禁认证方法的步骤。
该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现图1所示的基于语音识别的门禁认证方法。所述计算机可读存储介质可以是只读存储器,磁盘或光盘等。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例、设备实施例及存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (8)
1.一种基于语音识别的门禁认证方法,其特征在于,包括以下步骤:
步骤a.获取用户开门申请及用户身份信息;
步骤b.基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户;
步骤c.获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;
步骤d.将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请;
所述步骤c,获取用户回答语音,判断用户身份信息是否存在异常;具体包括如下步骤:
c1.获取噪音阈值β、用户回答语音,并将用户回答语音进行分帧处理,得到N段第一回答语音;
c2.将N段第一回答语音分别输入有效语音模型,根据噪音阈值β,遍历N段第一回答语音,判断每段第一回答语音中是否包括噪音;若包括,则对第一回答语音进行分离处理,得到有效语音,若不包括,则直接保存第一回答语音,并进行依次拼接,得到有效语音;
c3.将有效语音转换为文字,并与认证问题的标准答案进行比对,若一致,则判断用户身份信息正常,并获取有效语音;若不一致,则判断用户身份信息异常,并将异常信息推送至用户;
所述步骤d中,将有效语音输入声纹识别模型,并提取声纹特征进行身份认证,具体包括如下步骤:
d1.将有效语音输入声纹识别模型,并提取声纹特征;
d2.基于声纹特征,进行特征打分;
d3.获取特征打分分值以及识别阈值θ,并将获取特征打分分值与识别阈值θ进行比较,若特征打分分值大于识别阈值θ,判断为身份认证成功,则通过用户开门申请,否则,判断为身份认证失败,则拒绝用户开门申请。
2.根据权利要求1所述的一种基于语音识别的门禁认证方法,其特征在于:用户进行身份注册时,提供用户身份信息;用户身份信息具有唯一标识性。
3.根据权利要求2所述的一种基于语音识别的门禁认证方法,其特征在于:用户进行身份注册至少包括如下步骤:
获取用户身份信息、多组认证问题及答案语音;
将多组答案语音进行拼接后,输入声纹识别模型;
基于拼接答案语音,提取该用户声纹特征,并存储用户信息;用户信息用于用户身份认证,用户信息包括:用户身份信息、用户声纹特征与用户认证问题及答案。
4.根据权利要求3所述的一种基于语音识别的门禁认证方法,其特征在于:认证问题至少包括用户预设认证问题、系统默认认证问题其中一种;
所述用户预设认证问题为,用户进行身份注册时,自行设置的认证问题;
所述系统默认认证问题为,从系统问答库中随机抽取的认证问题。
5.根据权利要求1所述的一种基于语音识别的门禁认证方法,其特征在于:有效语音模型经过二分类模型训练,训练样本包括噪音样本与非噪音样本。
6.根据权利要求1所述的一种基于语音识别的门禁认证方法,其特征在于:步骤c2中,分离处理具体包括如下步骤:
c20.获取包括噪音的第一回答语音帧,并将其设置为静音帧;
c21.将静音帧进行分离后,得到M段第二回答语音;其中,M≤N;
c22.将M段第二回答语音依次进行拼接,得到有效语音。
7.一种基于语音识别的门禁认证系统,其特征在于,包括:
信息获取模块,用于获取用户开门申请及用户身份信息;
身份信息校验模块,用于基于用户身份信息,抽取与用户身份信息相对应的认证问题并推送至用户,并获取用户回答语音,判断用户身份信息是否存在异常;若用户身份信息正常,则获取有效语音;若存在异常,则将异常信息推送至用户;具体包括如下步骤:c1.获取噪音阈值β、用户回答语音,并将用户回答语音进行分帧处理,得到N段第一回答语音;c2.将N段第一回答语音分别输入有效语音模型,根据噪音阈值β,遍历N段第一回答语音,判断每段第一回答语音中是否包括噪音;若包括,则对第一回答语音进行分离处理,得到有效语音,若不包括,则直接保存第一回答语音,并进行依次拼接,得到有效语音;c3.将有效语音转换为文字,并与认证问题的标准答案进行比对,若一致,则判断用户身份信息正常,并获取有效语音;若不一致,则判断用户身份信息异常,并将异常信息推送至用户;
身份认证模块,用于将有效语音输入声纹识别模型,并提取声纹特征进行身份认证;若身份认证成功,则通过用户开门申请,若身份认证失败,则拒绝用户开门申请;具体包括如下步骤:d1.将有效语音输入声纹识别模型,并提取声纹特征;d2.基于声纹特征,进行特征打分;d3.获取特征打分分值以及识别阈值θ,并将获取特征打分分值与识别阈值θ进行比较,若特征打分分值大于识别阈值θ,判断为身份认证成功,则通过用户开门申请,否则,判断为身份认证失败,则拒绝用户开门申请;
身份注册模块,用于获取用户身份信息、多组认证问题及答案语音;将多组答案语音进行拼接后,输入声纹识别模型;基于拼接答案语音,提取该用户声纹特征,并存储用户信息;用户信息用于用户身份认证,用户信息包括:用户身份信息、用户声纹特征与用户认证问题及答案。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于语音识别的门禁认证程序,所述基于语音识别的门禁认证程序被处理器执行时实现如权利要求1至6任一项所述的基于语音识别的门禁认证方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210597279.0A CN115100776B (zh) | 2022-05-30 | 2022-05-30 | 一种基于语音识别的门禁认证方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210597279.0A CN115100776B (zh) | 2022-05-30 | 2022-05-30 | 一种基于语音识别的门禁认证方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115100776A CN115100776A (zh) | 2022-09-23 |
CN115100776B true CN115100776B (zh) | 2023-12-26 |
Family
ID=83288937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210597279.0A Active CN115100776B (zh) | 2022-05-30 | 2022-05-30 | 一种基于语音识别的门禁认证方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115100776B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737634A (zh) * | 2012-05-29 | 2012-10-17 | 百度在线网络技术(北京)有限公司 | 一种基于语音的认证方法及装置 |
CN103391201A (zh) * | 2013-08-05 | 2013-11-13 | 公安部第三研究所 | 基于声纹识别实现智能卡身份验证的系统及方法 |
CN103679885A (zh) * | 2013-12-02 | 2014-03-26 | 大连智慧城科技有限公司 | 基于移动终端的门禁身份识别系统和方法 |
CN106375336A (zh) * | 2016-09-28 | 2017-02-01 | 北京金山安全软件有限公司 | 登录信息存储、提供方法及装置 |
RU2638775C2 (ru) * | 2013-03-18 | 2017-12-15 | Общество с ограниченной ответственностью "ЦРТ-инновации" | Система контроля и управления доступом на базе биометрических технологий аутентификации личности по голосу и по лицу |
CN108053822A (zh) * | 2017-11-03 | 2018-05-18 | 深圳和而泰智能控制股份有限公司 | 一种语音信号处理方法、装置、终端设备及介质 |
WO2018095167A1 (zh) * | 2016-11-22 | 2018-05-31 | 北京京东尚科信息技术有限公司 | 声纹识别方法和声纹识别系统 |
CN109273009A (zh) * | 2018-08-02 | 2019-01-25 | 平安科技(深圳)有限公司 | 门禁控制方法、装置、计算机设备和存储介质 |
CN109473108A (zh) * | 2018-12-15 | 2019-03-15 | 深圳壹账通智能科技有限公司 | 基于声纹识别的身份验证方法、装置、设备及存储介质 |
CN110827453A (zh) * | 2019-11-18 | 2020-02-21 | 成都启英泰伦科技有限公司 | 一种指纹声纹双重认证方法及认证系统 |
CN111508498A (zh) * | 2020-04-09 | 2020-08-07 | 携程计算机技术(上海)有限公司 | 对话式语音识别方法、系统、电子设备和存储介质 |
CN112259106A (zh) * | 2020-10-20 | 2021-01-22 | 网易(杭州)网络有限公司 | 声纹识别方法、装置、存储介质及计算机设备 |
-
2022
- 2022-05-30 CN CN202210597279.0A patent/CN115100776B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737634A (zh) * | 2012-05-29 | 2012-10-17 | 百度在线网络技术(北京)有限公司 | 一种基于语音的认证方法及装置 |
RU2638775C2 (ru) * | 2013-03-18 | 2017-12-15 | Общество с ограниченной ответственностью "ЦРТ-инновации" | Система контроля и управления доступом на базе биометрических технологий аутентификации личности по голосу и по лицу |
CN103391201A (zh) * | 2013-08-05 | 2013-11-13 | 公安部第三研究所 | 基于声纹识别实现智能卡身份验证的系统及方法 |
CN103679885A (zh) * | 2013-12-02 | 2014-03-26 | 大连智慧城科技有限公司 | 基于移动终端的门禁身份识别系统和方法 |
CN106375336A (zh) * | 2016-09-28 | 2017-02-01 | 北京金山安全软件有限公司 | 登录信息存储、提供方法及装置 |
WO2018095167A1 (zh) * | 2016-11-22 | 2018-05-31 | 北京京东尚科信息技术有限公司 | 声纹识别方法和声纹识别系统 |
CN108053822A (zh) * | 2017-11-03 | 2018-05-18 | 深圳和而泰智能控制股份有限公司 | 一种语音信号处理方法、装置、终端设备及介质 |
CN109273009A (zh) * | 2018-08-02 | 2019-01-25 | 平安科技(深圳)有限公司 | 门禁控制方法、装置、计算机设备和存储介质 |
CN109473108A (zh) * | 2018-12-15 | 2019-03-15 | 深圳壹账通智能科技有限公司 | 基于声纹识别的身份验证方法、装置、设备及存储介质 |
CN110827453A (zh) * | 2019-11-18 | 2020-02-21 | 成都启英泰伦科技有限公司 | 一种指纹声纹双重认证方法及认证系统 |
CN111508498A (zh) * | 2020-04-09 | 2020-08-07 | 携程计算机技术(上海)有限公司 | 对话式语音识别方法、系统、电子设备和存储介质 |
CN112259106A (zh) * | 2020-10-20 | 2021-01-22 | 网易(杭州)网络有限公司 | 声纹识别方法、装置、存储介质及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115100776A (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3327720B1 (en) | User voiceprint model construction method and apparatus | |
US10733978B2 (en) | Operating method for voice function and electronic device supporting the same | |
JP6394709B2 (ja) | 話者識別装置および話者識別用の登録音声の特徴量登録方法 | |
CN113327609B (zh) | 用于语音识别的方法和装置 | |
CN109448725A (zh) | 一种语音交互设备唤醒方法、装置、设备及存储介质 | |
US10529340B2 (en) | Voiceprint registration method, server and storage medium | |
US20030182119A1 (en) | Speaker authentication system and method | |
CN105632487B (zh) | 一种语音识别方法和装置 | |
US9014347B2 (en) | Voice print tagging of interactive voice response sessions | |
CN110718225A (zh) | 一种语音控制方法、终端以及存储介质 | |
CN111081256A (zh) | 数字串声纹密码验证方法及系统 | |
CN116013324A (zh) | 基于声纹识别的机器人语音控制权限管理方法 | |
CN115100776B (zh) | 一种基于语音识别的门禁认证方法、系统及存储介质 | |
CN113241080A (zh) | 自动注册声纹识别方法和装置 | |
CN109273012A (zh) | 一种基于说话人识别和数字语音识别的身份认证方法 | |
CN115376522B (zh) | 空调器的声纹控制方法、空调器及可读存储介质 | |
CN110288996A (zh) | 一种语音识别装置和语音识别方法 | |
US20230215440A1 (en) | System and method for speaker verification | |
CN111785280B (zh) | 身份认证方法和装置、存储介质和电子设备 | |
CN110853674A (zh) | 文本核对方法、设备以及计算机可读存储介质 | |
US8254530B2 (en) | Authenticating personal identification number (PIN) users | |
CN112530441A (zh) | 合法用户的验证方法、装置、计算机设备和存储介质 | |
CN108491183B (zh) | 一种信息处理方法和电子设备 | |
JP2000099090A (ja) | 記号列を用いた話者認識方法 | |
CN112652303A (zh) | 一种本地引擎语音识别及交互方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |