CN108376215A - 一种身份认证方法 - Google Patents

一种身份认证方法 Download PDF

Info

Publication number
CN108376215A
CN108376215A CN201810028846.4A CN201810028846A CN108376215A CN 108376215 A CN108376215 A CN 108376215A CN 201810028846 A CN201810028846 A CN 201810028846A CN 108376215 A CN108376215 A CN 108376215A
Authority
CN
China
Prior art keywords
iris
voice
similarity
recognition result
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810028846.4A
Other languages
English (en)
Inventor
武星
戴书吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201810028846.4A priority Critical patent/CN108376215A/zh
Publication of CN108376215A publication Critical patent/CN108376215A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/197Matching; Classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Ophthalmology & Optometry (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提出一种身份认证方法,基于虹膜识别与语音识别。虹膜识别部分包括图像捕捉,虹膜信息检测,虹膜特征提取,虹膜相似度计算,以及虹膜识别结果获取。语音识别包括语音采集,语音信号分割与转换,语音特征提取,语音相似度计算和语音识别结果获取。综合识别部分将虹膜相似度与识别结果,语音相似度与识别结果输入到由卷积神经网络构建的分类器中进行最终的身份认证。本发明采用了虹膜和语音两种生物特征,并通过卷积神经网络得出身份识别结果,利用两种生物特征信息进行身份认证的优点在于可以避免单一生物特征的不全面性,提高容错性和认证结果的可靠性,使其具有更广泛的安全性和适应性。

Description

一种身份认证方法
技术领域
本发明涉及身份识别技术领域,特别是一种身份认证方法。
背景技术
随着计算机技术的发展,在某些对身份认证要求较高的应用领域,如安防、金融机构等,都需要可靠、高效的身份认证方法与系统,因此近年来生物特征识别技术得到了广泛应用。
生物特征识别技术是指通过计算机利用人类自身生理或行为特征进行身份认定的一种技术,它以人体惟一的、可靠的、稳定的生理特征,如指纹、虹膜、脸部、掌纹等或行为特征,如话音、击键、步态、签名等为依据,采用计算机强大的计算功能和网络技术进行图像处理和模式识别,用以鉴别人的身份。该技术具有很好的安全性、可靠性和有效性,与传统的身份确认手段相比,不依赖各种人造的和附加的物品来证明人的自身,而用来证明自身的恰恰是人本身。因此,它不会丢失、不会遗忘,很难伪造和假冒,是一种方便安全的保安手段。近几年来,全球的生物特征识别技术正从研究阶段逐步转向应用阶段。这些系统很好地解决了传统安全保护方式存在的隐患,提供了相对方便、快速、准确的身份识别方法。但是每种生物特征识别都有其适用的范围,故这些系统也存在着各自的缺点。
发明内容
本发明的目的在于克服现有技术的不足,提供一种身份认证方法,采用虹膜与语音两种生物特征相结合的方法,通过两种生物特征识别可以大大提高身份认证的可靠程度,具有更高的识别精度。
为达到上述目的,本发明的构思是:
本方法包括虹膜识别,语音识别,以及综合虹膜识别与语音识别结果与相似度进行最终身份认证的综合识别部分。所述虹膜识别进一步包括图像捕捉,虹膜信息检测,虹膜特征提取,虹膜相似度计算,和虹膜识别结果获取。虹膜相似度与识别结果都作为综合识别的输入信息,用于综合识别身份。所述语音特征识别进一步包括语音采集,语音信号分割与转换,语音特征提取,语音相似度计算,以及语音识别结果获取。同样语音相似度与语音识别结果也作为综合识别的输入,用于综合识别身份。综合识别部分将虹膜相似度与识别结果,语音相似度与识别结果输入到由卷积神经网络构建的分类器中进行身份识别,判断认证是否成功。
根据上述构思,本发明采用的技术方案是:
一种身份认证方法,基于虹膜识别与语音识别,具体步骤如下:
1)用户信息获取:用户的待验证信息包括通过虹膜采集摄像头获取用户的虹膜图像信息,以及通过语音获取设备获取用户的语音信息;
2)虹膜相似度计算与虹膜识别结果获取:对获取到的虹膜图像先进行预处理,然后进行图像分割,得到虹膜部分,再对其进行光照和大小归一化,利用Gabor小波变换进行虹膜特征提取,得到相应虹膜的特征向量,使用支持向量机的方法将该特征向量与数据库中收录的虹膜进行比较,计算相似度,寻找最相似的虹膜,作为虹膜识别结果;
3)语音相似度计算与语音识别结果获取:采用预置的语音识别指令对得到的语音进行识别并获取相似度;对采集到的语音信息进行声音信号的分割,采用Mel频率倒谱系数方法提取语音特征向量,使用支持向量机的方法在语音数据库中寻找最佳拟合,计算相似度,获取语音识别结果;
4)综合识别:将虹膜相似度以及识别结果、语音相似度及识别结果作为综合识别部分中分类器的输入,其中分类器由卷积神经网络构建,并在训练集上事先完成训练,如果分类器的输出结果在经验值的误差范围内,则身份认证成功,否则身份认证失败。
与现有技术相比,本发明具有如下的优点:
本发明采用了虹膜和语音两种生物特征,并通过深度卷积网络得出综合识别结果。利用两种生物特征信息进行身份识别的优点在于可以避免单一生物特征的不全面性,提高容错性和认证结果的可靠性,使其具有更广泛的安全性和适应性。
附图说明
图1为本发明身份认证方法流程框图。
图2为本发明综合识别部分中分类器的卷积神经网络结构。
具体实施方式
下面结合附图,对本发明的具体实施例做进一步的说明。
如图1所示,一种身份认证方法,基于虹膜识别与语音识别,具体步骤如下:
1)用户信息获取:用户的待验证信息包括通过虹膜采集摄像头获取用户的虹膜图像信息,以及通过语音获取设备获取用户的语音信息;
2)虹膜相似度计算与虹膜识别结果获取:对获取到的虹膜图像先进行预处理,然后进行图像分割,得到虹膜部分,再对其进行光照和大小归一化,利用Gabor小波变换进行虹膜特征提取,得到相应虹膜的特征向量,使用支持向量机的方法将该特征向量与数据库中收录的虹膜进行比较,计算相似度,寻找最相似的虹膜,作为虹膜识别结果;
3)语音相似度计算与语音识别结果获取:采用预置的语音识别指令对得到的语音进行识别并获取相似度;对采集到的语音信息进行声音信号的分割,采用Mel频率倒谱系数方法提取语音特征向量,使用支持向量机的方法在语音数据库中寻找最佳拟合,计算相似度,获取语音识别结果;
4)综合识别:将虹膜相似度以及识别结果、语音相似度及识别结果作为综合识别部分中分类器的输入,其中分类器由卷积神经网络构建,并在训练集上事先完成训练,如果分类器的输出结果在经验值的误差范围内,则身份认证成功,否则身份认证失败。
一个具体实施例详述如下:
一种基于虹膜识别和语音识别的身份认证方法,如图1所示,包括以下步骤:
S01:获取用户虹膜图像。
S02:获取用户语音信息。
S03:调用虹膜识别模块对获取的用户虹膜图像进行特征提取,根据获取到的特征进行虹膜识别,获得虹膜识别结果与虹膜相似度。其中虹膜特征提取采用Gabor小波变换。尺寸M×N的虹膜图像f(x,y)的Gabor小波变换为:
其中,s,t是滤波器掩模尺寸变量,x,y指图像像素坐标,p,q分别表示小波变换的尺度和方向。的复共轭,是Gabor小波变换函数a是尺度因子,且a>1。参数x',y'分别表示为
虹膜特征向量为:
TFC=[μ0,00,00,10,1,…,μP-1,Q-1P-1,Q-1],
其中
分别是均值和标准差。其中表示尺度为p,方向为q的能量信息。
S04:调用语音识别模块对获取的语音信息进行特征提取,根据获取到的特征向量进行语音识别,获得语音识别结果与语音相似度。语音特征采用Mel频率倒谱系数(MFCC)方法来提取。MFCC计算公式如下:
其中,p指Mel频率滤波器个数,mi是语音的离散频谱进行滤波处理之后得到的系数。
S05:调用虹膜与语音综合识别模块,对上述步骤已经获取到的虹膜识别结果与虹膜相似度,语音识别结果与语音相似度进行综合识别,计算识别结果。综合识别模块中的分类器由卷积神经网络构成。卷积神经网络结构如附图2所示。网络由三层卷积层,三层池化层,一层全连接层组成,最后判断softmax分类器的输出值是否在经验误差内,如果在在误差内则识别成功,否则识别失败。
S06:根据综合识别获取的识别结果判断身份认证是否成功。
对于上述步骤S01和步骤S02的顺序可以随意调换,虹膜图像和语音信息的获取没有先后顺序,依据用户个人喜好即可。在获取用户虹膜图像和用户语音信息时,预设的流程会通过声音与交互界面提示用户提供虹膜图像和语音信息。首先用户界面会给出需要获取的信息项,由用户自主选择提供的信息类别后,通过语音提示用户眼睛对准虹膜图像获取装置或者是提示用户读出语音或界面提示的文字,以便语音获取装置获取用户语音信息。另外也会通过语音来提示用户提供信息是否完整,是否正确。在获取人脸图像和用户语音信息时,本发明自动在限定时间内获取3次虹膜图像,语音信息方面本发明也自动给用户提供3段需要用户读的短文本。
由上述步骤S01与步骤S02所述虹膜图像与语音信息的获取的顺序可以任意调换,因此上述步骤S03和步骤S04的顺序也可以任意调换,本发明对此不做限定。在执行了步骤S01之后,即获取了用户虹膜图像后,本发明自动执行步骤S03;在执行了步骤S02之后,即获取了用户语音信息之后,本发明自动执行步骤S04。需要指出的是,步骤S05,S06必须在上述步骤S01,S02,S03和S04之后进行。
上述步骤S05,根据步骤S03获得的虹膜识别结果与虹膜相似度,步骤S04获得语音识别结果与语音相似度,计算识别结果,并在上述步骤S06中根据计算的识别结果与经验值的误差范围判断用户身份是否认证成功。其中,在上述S05中将虹膜识别结果及其相似度、语音识别结果及其相似度作为分类器的输入,在训练集上建立并训练基于卷积神经网络的分类器。分类器的网络结构如附图2所示。在实际识别过程中,将步骤S03和步骤S04得到的识别结果与对于相似度输入分类器,输出结果在步骤S06中与经验值进行比较,若误差在合理范围内,则身份认证成功,否则认证失败。
通过本发明提供的身份认证方法,采用基于语音识别与虹膜识别,保证了身份认证的准确性与安全性。

Claims (1)

1.一种身份认证方法,基于虹膜识别与语音识别,其特征在于,具体步骤如下:
1)用户信息获取:用户的待验证信息包括通过虹膜采集摄像头获取用户的虹膜图像信息,以及通过语音获取设备获取用户的语音信息;
2)虹膜相似度计算与虹膜识别结果获取:对获取到的虹膜图像先进行预处理,然后进行图像分割,得到虹膜部分,再对其进行光照和大小归一化,利用Gabor小波变换进行虹膜特征提取,得到相应虹膜的特征向量,使用支持向量机的方法将该特征向量与数据库中收录的虹膜进行比较,计算相似度,寻找最相似的虹膜,作为虹膜识别结果;
3)语音相似度计算与语音识别结果获取:采用预置的语音识别指令对得到的语音进行识别并获取相似度;对采集到的语音信息进行声音信号的分割,采用Mel频率倒谱系数方法提取语音特征向量,使用支持向量机的方法在语音数据库中寻找最佳拟合,计算相似度,获取语音识别结果;
4)综合识别:将虹膜相似度以及识别结果、语音相似度及识别结果作为综合识别部分中分类器的输入,其中分类器由卷积神经网络构建,并在训练集上事先完成训练,如果分类器的输出结果在经验值的误差范围内,则身份认证成功,否则身份认证失败。
CN201810028846.4A 2018-01-12 2018-01-12 一种身份认证方法 Pending CN108376215A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810028846.4A CN108376215A (zh) 2018-01-12 2018-01-12 一种身份认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810028846.4A CN108376215A (zh) 2018-01-12 2018-01-12 一种身份认证方法

Publications (1)

Publication Number Publication Date
CN108376215A true CN108376215A (zh) 2018-08-07

Family

ID=63015582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810028846.4A Pending CN108376215A (zh) 2018-01-12 2018-01-12 一种身份认证方法

Country Status (1)

Country Link
CN (1) CN108376215A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461447A (zh) * 2018-09-30 2019-03-12 厦门快商通信息技术有限公司 一种基于深度学习的端到端说话人分割方法及系统
CN109583387A (zh) * 2018-11-30 2019-04-05 龙马智芯(珠海横琴)科技有限公司 身份认证方法及装置
CN110797034A (zh) * 2019-09-23 2020-02-14 重庆特斯联智慧科技股份有限公司 一种用于老人及病患照料的自动语音视频识别对讲系统
CN111824879A (zh) * 2020-07-02 2020-10-27 南京安杰信息科技有限公司 智能语音无接触梯控方法、系统及存储介质
CN112348527A (zh) * 2020-11-17 2021-02-09 上海桂垚信息科技有限公司 一种基于语音识别在银行交易系统中的身份认证方法
CN115865527A (zh) * 2023-02-20 2023-03-28 深圳鼎智通讯有限公司 一种用于pos机的防攻击方法及系统
CN116052313A (zh) * 2023-02-10 2023-05-02 北京中超伟业信息安全技术股份有限公司 一种智能保密柜控制方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1423227A (zh) * 2001-12-05 2003-06-11 南宫钟 一种具有虹膜识别功能的身份确认方法及装置
CN201628970U (zh) * 2010-04-20 2010-11-10 北京森博克智能科技有限公司 基于多生物特征和rfid的嵌入式多模态身份认证便携终端
CN105447371A (zh) * 2015-12-29 2016-03-30 深圳市亚略特生物识别科技有限公司 生物身份识别验证终端及电子系统
CN106203298A (zh) * 2016-06-30 2016-12-07 北京集创北方科技股份有限公司 生物特征识别方法及装置
CN106295547A (zh) * 2016-08-05 2017-01-04 深圳市商汤科技有限公司 一种图像比对方法及图像比对装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1423227A (zh) * 2001-12-05 2003-06-11 南宫钟 一种具有虹膜识别功能的身份确认方法及装置
CN201628970U (zh) * 2010-04-20 2010-11-10 北京森博克智能科技有限公司 基于多生物特征和rfid的嵌入式多模态身份认证便携终端
CN105447371A (zh) * 2015-12-29 2016-03-30 深圳市亚略特生物识别科技有限公司 生物身份识别验证终端及电子系统
CN106203298A (zh) * 2016-06-30 2016-12-07 北京集创北方科技股份有限公司 生物特征识别方法及装置
CN106295547A (zh) * 2016-08-05 2017-01-04 深圳市商汤科技有限公司 一种图像比对方法及图像比对装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461447A (zh) * 2018-09-30 2019-03-12 厦门快商通信息技术有限公司 一种基于深度学习的端到端说话人分割方法及系统
CN109461447B (zh) * 2018-09-30 2023-08-18 厦门快商通信息技术有限公司 一种基于深度学习的端到端说话人分割方法及系统
CN109583387A (zh) * 2018-11-30 2019-04-05 龙马智芯(珠海横琴)科技有限公司 身份认证方法及装置
CN110797034A (zh) * 2019-09-23 2020-02-14 重庆特斯联智慧科技股份有限公司 一种用于老人及病患照料的自动语音视频识别对讲系统
CN111824879A (zh) * 2020-07-02 2020-10-27 南京安杰信息科技有限公司 智能语音无接触梯控方法、系统及存储介质
CN111824879B (zh) * 2020-07-02 2021-03-30 南京安杰信息科技有限公司 智能语音无接触梯控方法、系统及存储介质
CN112348527A (zh) * 2020-11-17 2021-02-09 上海桂垚信息科技有限公司 一种基于语音识别在银行交易系统中的身份认证方法
CN116052313A (zh) * 2023-02-10 2023-05-02 北京中超伟业信息安全技术股份有限公司 一种智能保密柜控制方法、装置、设备及存储介质
CN116052313B (zh) * 2023-02-10 2024-02-23 北京中超伟业信息安全技术股份有限公司 一种智能保密柜控制方法、装置、设备及存储介质
CN115865527A (zh) * 2023-02-20 2023-03-28 深圳鼎智通讯有限公司 一种用于pos机的防攻击方法及系统

Similar Documents

Publication Publication Date Title
CN108376215A (zh) 一种身份认证方法
CN104361276B (zh) 一种多模态生物特征身份认证方法及系统
Kim et al. Person authentication using face, teeth and voice modalities for mobile device security
Sahoo et al. Multimodal biometric person authentication: A review
CN102332093B (zh) 一种掌纹和人脸融合识别的身份认证方法及装置
CN104200146A (zh) 一种结合视频人脸和数字唇动密码的身份验证方法
Fallah et al. A new online signature verification system based on combining Mellin transform, MFCC and neural network
CN106709402A (zh) 基于音型像特征的真人活体身份验证方法
Lien et al. Challenges and opportunities of biometric user authentication in the age of iot: A survey
JP2008123521A (ja) 拡張されたガボールウェーブレット特徴を利用したフェース認識方法及び装置
Fierrez-Aguilar et al. Kernel-based multimodal biometric verification using quality signals
CN104239766A (zh) 基于视频和音频的核电站用身份认证方法和系统
Saeed New directions in behavioral biometrics
CN109446948A (zh) 一种基于Android平台的人脸和语音多生物特征融合认证方法
Ghosh et al. Symptoms-based biometric pattern detection and recognition
Memon et al. Audio-visual biometric authentication for secured access into personal devices
Stylianou et al. GMM-based multimodal biometric verification
Iwasokun et al. Multi-modal biometrics: applications, strategies and operations
CN110738985A (zh) 基于语音信号的跨模态生物特征识别方法及系统
Bigun et al. Combining biometric evidence for person authentication
Allano et al. Nonintrusive multibiometrics on a mobile device: a comparison of fusion techniques
JPH10261083A (ja) 個人同定装置及び個人同定方法
Beukes Hand vein-based biometric authentication with limited training samples
Shenai et al. Fast biometric authentication system based on audio-visual fusion
Raoof Security of iris recognition and voice recognition techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180807

RJ01 Rejection of invention patent application after publication