CN113886792A - 一种声纹识别和人脸识别相结合的印控仪应用方法和系统 - Google Patents
一种声纹识别和人脸识别相结合的印控仪应用方法和系统 Download PDFInfo
- Publication number
- CN113886792A CN113886792A CN202111476274.4A CN202111476274A CN113886792A CN 113886792 A CN113886792 A CN 113886792A CN 202111476274 A CN202111476274 A CN 202111476274A CN 113886792 A CN113886792 A CN 113886792A
- Authority
- CN
- China
- Prior art keywords
- control instrument
- face image
- user
- print control
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000001514 detection method Methods 0.000 claims abstract description 32
- 238000007639 printing Methods 0.000 claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000013139 quantization Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明提出了一种声纹识别和人脸识别相结合的印控仪应用方法和系统,涉及印章安全性使用领域。该方法包括获取印控仪权限人的音频模板和人脸图像模板;当印控仪使用者使用印控仪时,采集使用者的音频进行音频认证;认证后采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度。利用声纹识别和人脸识别相结合的策略,提升了印控仪使用者的身份识别精度,增加了印控仪的安全系数;所使用的方法较为经典和简易,不需要消耗较多的计算资源,可以体现较好的实时性。
Description
技术领域
本发明涉及印章安全性使用技术领域,具体而言,涉及一种声纹识别和人脸识别相结合的印控仪应用方法和系统。
背景技术
随着科技的进步,机器盖章方式已经越来越多地取代了人工盖章方式,印控仪能在精准盖章的同时最大限度地降低人力资源消耗。同时,由于机器盖章往往需要对重要合同、法律文件等进行盖章,机器盖章的安全性受到了越来越广泛的关注。
目前,很多科研机构、技术公司利用印章使用人脸识别技术来提升机器盖章的安全性,市面上很多印控仪也使用了该方法。然而,该方法仍然存在一定的误差,不能够非常精准地对印控仪使用者的身份进行识别,完成安全系数较高的盖章。虽然现有技术中公开的身份识别方法包括:公布号为CN111723679A的一种基于深度迁移学习的人脸和声纹认证系统及方法,使用时,通过核心算法层对人脸和声纹进行识别,核心算法层包括数据预处理算法、用户活体检测算法验证、深度卷积神经网络模型的构建、迁移学习算法的融合、卷积神经网络模型的训练、卷积神经网络的模型集成算法这六大模块,识别较为复杂,消耗较多的计算资源,容易产生延时。公布号为CN110837821A的基于生物特征的身份识别的方法、设备及电子系统,通过将采集的用户的生物特征图像(脸、指纹、虹膜、视网膜、指静脉、声纹特征之一或其组合)与模板库中所有的预设生物特征模板逐一进行相似度匹配,当用户的生物特征图像与模板库其中一个预设生物特征模板的相似度超过预设阈值时,判断当前用户的生物特征图像匹配成功,否则判定为匹配失败。只要相似度匹配成功一个就匹配成功,容易产生误识别,例如声纹识别中,一方面声纹存在噪声,容易出现识别失败,另一方面声纹容易被模仿,从而产生误识别。同理,公布号为CN111312259A的一种声纹识别方法、系统、移动终端及存储介质,公布号为CN101055718A的一种基于矢量化的声纹识别方法,都是只通过声纹进行识别,容易产生识别失败以及误识别;公布号为CN111914920A的一种基于稀疏编码的相似性图像检索方法及系统,只通过图像识别,过于单一,公布号为CN104834849B的基于声纹识别和人脸识别的双因素身份认证方法及系统,虽然通过声纹识别和人脸识别进行身份验证,但识别方式只是简单的采集人脸和声纹进行相似度匹配,其匹配的精度有待提高,因此,如何对印控仪使用者身份进行精确识别,确保盖章的安全性是一个非常有意义且亟待解决的问题。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种声纹识别和人脸识别相结合的印控仪应用方法和系统,以对印控仪使用者身份进行精确识别。
本发明的实施例是这样实现的:
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种声纹识别和人脸识别相结合的印控仪应用方法,包括:
S1:对印控仪权限人的声音进行前期采集,挑选出一段音频作为音频模板;
S2:对印控仪权限人的人脸图像进行采集,挑选出一张代表性的图像作为人脸图像模板;
S3:当印控仪使用者使用印控仪时,采集使用者的音频,利用小波去噪的方法对音频进行去噪得到待认证音频;
S4:利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音,如果是继续进行下一步;如果不是发出禁止使用印控仪的指令;
S5:采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;
S6:利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度;
S7:若S5、S6两步骤中的相似度均大于等于第一预设值,认定使用者为真实印控仪权限人,否则认定使用者为印控仪冒用者。
基于第一方面,在本发明的一些实施例中,所述采集使用者的音频的方法包括:
采集使用者发出的1-30秒的音频。
基于第一方面,在本发明的一些实施例中,利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音的步骤包括:
通过聚类、量化的方法生成码本,识别时对测试数据进行量化编码,以失真度的大小作为判决的标准。
基于第一方面,在本发明的一些实施例中,S5中计算相似度的方法包括:
利用欧氏距离相似度计算方法计算相似度。
基于第一方面,在本发明的一些实施例中,所述挑选出一张代表性的图像作为人脸图像模板的方法包括:
通过峰值信噪比计算和显著性检测方法挑选人脸图像模板,如果峰值信噪大于第二预设值且显著性不低于预设范围,认定为人脸图像模板。
基于第一方面,在本发明的一些实施例中,所述显著性不低于预设范围包括:
显著性区域不低于整个图像区域的1/3。
基于第一方面,在本发明的一些实施例中,显著性检测方法采用AC显著性检测算法。
第二方面,本发明实施例提供一种声纹识别和人脸识别相结合的印控仪应用系统,包括:
音频制作模块:用于对印控仪权限人的声音进行前期采集,挑选出一段音频作为音频模板;
人脸图像制作模块:用于对印控仪权限人的人脸图像进行采集,挑选出一张代表性的图像作为人脸图像模板;
音频采集模块:用于当印控仪使用者使用印控仪时,采集使用者的音频,利用小波去噪的方法对音频进行去噪得到待认证音频;
判断音频模块:用于利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音,如果是继续进行下一步;如果不是发出禁止使用印控仪的指令;
第一相似度计算模块:用于采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;
第二相似度计算模块:用于利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度;
判断模块:用于若第一相似度计算模块、第二相似度计算模块中的相似度均大于等于第一预设值,认定使用者为真实印控仪权限人,否则认定使用者为印控仪冒用者。
第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器、至少一个存储器和数据总线;其中:
所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行所述的方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使计算机执行所述的方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
利用声纹识别和人脸识别相结合的策略,提升了印控仪使用者的身份识别精度,增加了印控仪的安全系数;
所使用的方法较为经典和简易,不需要消耗较多的计算资源,可以体现较好的实时性(基本不需要延时识别)。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明一种声纹识别和人脸识别相结合的印控仪应用方法一实施例的流程示意图;
图2为本发明一种声纹识别和人脸识别相结合的印控仪应用系统一实施例的结构框图;
图3为本发明一种电子设备的结构框图。
图标:1、音频制作模块;2、人脸图像制作模块;3、音频采集模块;4、判断音频模块;5、第一相似度计算模块;6、第二相似度计算模块;7、判断模块;9、处理器;10、存储器;11、数据总线。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请所提供的实施例中,应该理解到,所揭露的方法和系统,也可以通过其它的方式实现。系统实施例仅仅是示意性的,例如,附图中的框图显示了根据本申请的多个实施例的系统和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备,可以是个人计算机,服务器,或者网络设备等,执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
实施例
请参照图1,第一方面,本发明实施例提供一种声纹识别和人脸识别相结合的印控仪应用方法,包括:
S1:对印控仪权限人的声音进行前期采集,挑选出一段音频作为音频模板;
该步骤中,印控仪权限人为有使用印控仪权限的人,例如法定代表人、公司的某高管等等。通过采集多段印控仪权限人的声音,从中挑选高质量的一段音频作为音频模板,例如挑选一段没有杂音、咬字清晰的一段语音作为音频模板,声音可以是统一的话术,例如“打开印控仪”等话术。
S2:对印控仪权限人的人脸图像进行采集,挑选出一张代表性的图像作为人脸图像模板;
该步骤中,预先采集印控仪权限人的人脸图像,从中挑选出一张最具代表性的图像作为人脸图像模板,挑选的方法包括通过峰值信噪比计算和显著性检测方法挑选人脸图像模板,如果峰值信噪大于第二预设值且显著性不低于预设范围,认定为人脸图像模板。第二预设值和预设范围可根据实际情况进行设定,既通过峰值信噪比计算和显著性检测方法挑选人脸图像模板,如果峰值信噪比较高且显著性非常明显(通常情况下显著性区域不低于整个图像的1/3),认定为人脸图像模板,示例性的,显著性检测方法采用AC显著性检测算法。
S3:当印控仪使用者使用印控仪时,采集使用者的音频,利用小波去噪的方法对音频进行去噪得到待认证音频;
该步骤中,当印控仪使用者使用印控仪时,需要先进行音频认证,因为音频认证相较于图片认证其操作更为简单快捷,且认证时间较短(声音认证只需要靠近印控仪讲话即可,而图像认证需要正对摄像头,且需要与摄像头保持合适距离),可以先通过音频认证排除印控仪冒用者。考虑到若冒用者的声音有极小概率与印控仪使用者的声音很相似,可以通过模仿印控仪使用者的声音进行认证,因此,当通过申请认证之后还需要进行图像认证。
S4:利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音,如果是继续进行下一步;如果不是发出禁止使用印控仪的指令;
矢量量化方法,即vector quantization,其具体定义为:将一个向量空间中的点用其中的一个有限子集来进行编码的过程。该步骤中,通过对待认证音频进行聚类、量化生成码本,识别时对测试数据进行量化编码,以失真度的大小作为判决的标准。需要说明的是,矢量量化方法也比较多,可以任选一种,不影响结果,其都在本发明的保护范围之内。
S5:采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;
该步骤中和步骤S6不分先后顺序,当印控仪使用者通过音频认证后再进行人脸图像认证,使用时,通过采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度。稀疏编码方法很多,本领域技术人员可以任选一种即可实现。
S6:利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度;
该步骤中和步骤S5不分先后顺序,当印控仪使用者通过音频认证后进行人脸图像认证,使用时,利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度。
S7:若S5、S6两步骤中的相似度均大于等于第一预设值 ,认定使用者为真实印控仪权限人,否则认定使用者为印控仪冒用者。
该步骤中,第一预设值跟根据实现情况进行设置,在此不作过多阐述。当S5、S6两步骤中的相似度均大于等于第一预设值才能认定使用者为真实印控仪权限人。本步骤中利用稀疏编码以及显著性检测方法对印控仪使用者身份进行精确识别。当S5、S6两步骤中的相似度有一个小于第一预设值,则认为当前使用者与预设的人脸图像差别较大,认定使用者为印控仪冒用者,控仪冒用者没有权限使用印控仪。
本发明申请用声纹识别和人脸识别相结合的策略,相比于传统的表征方法,稀疏编码方法可以更加精准、有效地对图像进行表征,表征准确了计算相似度也就会准确了,同时后面的相似度计算过程中也会相对简便一些。利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,显著性区域往往包含更多的人脸特征,所以单独对显著性区域做一次检测和表征。不仅整个人脸图像和模板图像相似度很高,而且二者显著性区域相似度也很高,更能说明匹配的准确率,用更加严格的尺度取评价结果,更能说明是一个人,结果会更加精准。
本发明实施例提供一种声纹识别和人脸识别相结合的印控仪应用方法,利用声纹识别和人脸识别相结合的策略,提升了印控仪使用者的身份识别精度,增加了印控仪的安全系数;
所使用的方法较为经典和简易,不需要消耗较多的计算资源,可以体现较好的实时性(基本不需要延时识别)。
基于第一方面,在本发明的一些实施例中,所述采集使用者的音频的方法包括:
采集使用者发出的1-30秒的音频。音频时间不限于1-30秒,可根据实际情况进行选择。
示例性的,S5中计算相似度的方法包括:利用欧氏距离相似度计算方法计算相似度。
示例性的,显著性检测方法采用AC显著性检测算法。
请参照图2,第二方面,本发明实施例提供一种声纹识别和人脸识别相结合的印控仪应用系统,包括:
音频制作模块1:用于对印控仪权限人的声音进行前期采集,挑选出一段音频作为音频模板;
人脸图像制作模块2:用于对印控仪权限人的人脸图像进行采集,挑选出一张代表性的图像作为人脸图像模板;
音频采集模块3:用于当印控仪使用者使用印控仪时,采集使用者的音频,利用小波去噪的方法对音频进行去噪得到待认证音频;
判断音频模块4:用于利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音,如果是继续进行下一步;如果不是发出禁止使用印控仪的指令;
第一相似度计算模块5:用于采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;
第二相似度计算模块6:用于利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度;
判断模块7:用于若第一相似度计算模块5、第二相似度计算模块6中的相似度均大于等于第一预设值,认定使用者为真实印控仪权限人,否则认定使用者为印控仪冒用者。
请参照图3,第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器9、至少一个存储器10和数据总线11;其中:
所述处理器9与所述存储器10通过所述数据总线11完成相互间的通信;所述存储器10存储有可被所述处理器9执行的程序指令,所述处理器9调用所述程序指令以执行所述的方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使计算机执行所述的方法。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,包括:
S1:对印控仪权限人的声音进行前期采集,挑选出一段音频作为音频模板;
S2:对印控仪权限人的人脸图像进行采集,挑选出一张代表性的图像作为人脸图像模板;
S3:当印控仪使用者使用印控仪时,采集使用者的音频,利用小波去噪的方法对音频进行去噪得到待认证音频;
S4:利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音,如果是继续进行下一步;如果不是发出禁止使用印控仪的指令;
S5:采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;
S6:利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度;
S7:若S5、S6两步骤中的相似度均大于等于第一预设值,认定使用者为真实印控仪权限人,否则认定使用者为印控仪冒用者。
2.根据权利要求1所述的一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,所述采集使用者的音频的方法包括:
采集使用者发出的1-30秒的音频。
3.根据权利要求1所述的一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音的步骤包括:
通过聚类、量化的方法生成码本,识别时对测试数据进行量化编码,以失真度的大小作为判决的标准。
4.根据权利要求1所述的一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,S5中计算相似度的方法包括:
利用欧氏距离相似度计算方法计算相似度。
5.根据权利要求1所述的一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,所述挑选出一张代表性的图像作为人脸图像模板的方法包括:
通过峰值信噪比计算和显著性检测方法挑选人脸图像模板,如果峰值信噪大于第二预设值且显著性不低于预设范围,认定为人脸图像模板。
6.根据权利要求5所述的一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,所述显著性不低于预设范围包括:
显著性区域不低于整个图像区域的1/3。
7.根据权利要求5所述的一种声纹识别和人脸识别相结合的印控仪应用方法,其特征在于,显著性检测方法采用AC显著性检测算法。
8.一种声纹识别和人脸识别相结合的印控仪应用系统,其特征在于,包括:
音频制作模块:用于对印控仪权限人的声音进行前期采集,挑选出一段音频作为音频模板;
人脸图像制作模块:用于对印控仪权限人的人脸图像进行采集,挑选出一张代表性的图像作为人脸图像模板;
音频采集模块:用于当印控仪使用者使用印控仪时,采集使用者的音频,利用小波去噪的方法对音频进行去噪得到待认证音频;
判断音频模块:用于利用矢量量化方法判断待认证音频是否为真实印控仪权限人的声音,如果是继续进行下一步;如果不是发出禁止使用印控仪的指令;
第一相似度计算模块:用于采集印控仪使用者的人脸图像,利用稀疏编码对该图像和人脸图像模板进行表征,计算使用者的人脸图像与人脸图像模板的相似度;
第二相似度计算模块:用于利用显著性检测方法对使用者的人脸图像和人脸图像模板进行显著性检测,对显著性区域进行稀疏编码表征,计算二者显著性区域的相似度;
判断模块:用于若第一相似度计算模块、第二相似度计算模块中的相似度均大于等于第一预设值,认定使用者为真实印控仪权限人,否则认定使用者为印控仪冒用者。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器和数据总线;其中:
所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1至7任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使计算机执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111476274.4A CN113886792A (zh) | 2021-12-06 | 2021-12-06 | 一种声纹识别和人脸识别相结合的印控仪应用方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111476274.4A CN113886792A (zh) | 2021-12-06 | 2021-12-06 | 一种声纹识别和人脸识别相结合的印控仪应用方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113886792A true CN113886792A (zh) | 2022-01-04 |
Family
ID=79016336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111476274.4A Pending CN113886792A (zh) | 2021-12-06 | 2021-12-06 | 一种声纹识别和人脸识别相结合的印控仪应用方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113886792A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114238692A (zh) * | 2022-02-23 | 2022-03-25 | 北京嘉沐安科技有限公司 | 一种面向网络直播的视频大数据精准检索方法及系统 |
CN115131110A (zh) * | 2022-08-30 | 2022-09-30 | 北京海上升科技有限公司 | 一种基于区块链的智慧交通共享汽车智能应用方法及系统 |
CN115311477A (zh) * | 2022-08-09 | 2022-11-08 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115830693A (zh) * | 2023-02-15 | 2023-03-21 | 北京惠朗时代科技有限公司 | 基于人工智能的电子印章视频交互式安全审批方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101262524A (zh) * | 2008-04-23 | 2008-09-10 | 沈阳东软软件股份有限公司 | 垃圾语音过滤的方法及系统 |
CN103218763A (zh) * | 2013-03-26 | 2013-07-24 | 陈秀成 | 一种高可信度的远程在线面试的方法与系统 |
CN103794207A (zh) * | 2012-10-29 | 2014-05-14 | 西安远声电子科技有限公司 | 一种双模语音身份识别方法 |
CN109159557A (zh) * | 2018-08-01 | 2019-01-08 | 福州智闽科技有限公司 | 一种带扫描的物联网印控仪实现方法及装置 |
CN109255299A (zh) * | 2018-08-13 | 2019-01-22 | 北京市商汤科技开发有限公司 | 身份认证方法和装置、电子设备和存储介质 |
CN111611568A (zh) * | 2020-05-20 | 2020-09-01 | 浩云科技股份有限公司 | 一种人脸声纹复核终端及其身份认证方法 |
CN112584238A (zh) * | 2020-12-09 | 2021-03-30 | 深圳创维-Rgb电子有限公司 | 影视资源匹配方法、装置及智能电视 |
CN113269903A (zh) * | 2021-05-24 | 2021-08-17 | 上海应用技术大学 | 人脸识别课堂考勤系统 |
-
2021
- 2021-12-06 CN CN202111476274.4A patent/CN113886792A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101262524A (zh) * | 2008-04-23 | 2008-09-10 | 沈阳东软软件股份有限公司 | 垃圾语音过滤的方法及系统 |
CN103794207A (zh) * | 2012-10-29 | 2014-05-14 | 西安远声电子科技有限公司 | 一种双模语音身份识别方法 |
CN103218763A (zh) * | 2013-03-26 | 2013-07-24 | 陈秀成 | 一种高可信度的远程在线面试的方法与系统 |
CN109159557A (zh) * | 2018-08-01 | 2019-01-08 | 福州智闽科技有限公司 | 一种带扫描的物联网印控仪实现方法及装置 |
CN109255299A (zh) * | 2018-08-13 | 2019-01-22 | 北京市商汤科技开发有限公司 | 身份认证方法和装置、电子设备和存储介质 |
CN111611568A (zh) * | 2020-05-20 | 2020-09-01 | 浩云科技股份有限公司 | 一种人脸声纹复核终端及其身份认证方法 |
CN112584238A (zh) * | 2020-12-09 | 2021-03-30 | 深圳创维-Rgb电子有限公司 | 影视资源匹配方法、装置及智能电视 |
CN113269903A (zh) * | 2021-05-24 | 2021-08-17 | 上海应用技术大学 | 人脸识别课堂考勤系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114238692A (zh) * | 2022-02-23 | 2022-03-25 | 北京嘉沐安科技有限公司 | 一种面向网络直播的视频大数据精准检索方法及系统 |
CN115311477A (zh) * | 2022-08-09 | 2022-11-08 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115311477B (zh) * | 2022-08-09 | 2024-01-16 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115131110A (zh) * | 2022-08-30 | 2022-09-30 | 北京海上升科技有限公司 | 一种基于区块链的智慧交通共享汽车智能应用方法及系统 |
CN115131110B (zh) * | 2022-08-30 | 2023-12-05 | 北京海上升科技有限公司 | 一种基于区块链的智慧交通共享汽车智能应用方法及系统 |
CN115830693A (zh) * | 2023-02-15 | 2023-03-21 | 北京惠朗时代科技有限公司 | 基于人工智能的电子印章视频交互式安全审批方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113886792A (zh) | 一种声纹识别和人脸识别相结合的印控仪应用方法和系统 | |
CN110457432B (zh) | 面试评分方法、装置、设备及存储介质 | |
Kim et al. | Person authentication using face, teeth and voice modalities for mobile device security | |
WO2019210796A1 (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN108429619A (zh) | 身份认证方法和系统 | |
Fallah et al. | A new online signature verification system based on combining Mellin transform, MFCC and neural network | |
CN104200146A (zh) | 一种结合视频人脸和数字唇动密码的身份验证方法 | |
CN109658921B (zh) | 一种语音信号处理方法、设备及计算机可读存储介质 | |
CN112507311A (zh) | 一种基于多模态特征融合的高安全性身份验证方法 | |
CN109448732B (zh) | 一种数字串语音处理方法及装置 | |
CN115662444B (zh) | 基于人工智能的电子印章语音交互式应用方法及系统 | |
CN117059092B (zh) | 基于区块链的智慧医疗交互式智能分诊方法及系统 | |
Alharbi et al. | Face-voice based multimodal biometric authentication system via FaceNet and GMM | |
CN115862641B (zh) | 基于区块链的印控仪智能启动和安全应用方法及系统 | |
CN113241081A (zh) | 一种基于梯度反转层的远场说话人认证方法及系统 | |
CN116883900A (zh) | 一种基于多维生物特征的视频真伪鉴别方法和系统 | |
CN112347788A (zh) | 语料处理方法、装置及存储介质 | |
Chuchra et al. | A deep learning approach for splicing detection in digital audios | |
Kartik et al. | Multimodal biometric person authentication system using speech and signature features | |
CN111883141B (zh) | 一种文本半相关的声纹识别方法及系统 | |
CN113838469A (zh) | 一种身份识别方法、系统及存储介质 | |
Shenai et al. | Fast biometric authentication system based on audio-visual fusion | |
Guerra-Casanova et al. | A robustness verification system for mobile phone authentication based on gestures using Linear Discriminant Analysis | |
CN117496394B (zh) | 基于图像和语音多模态融合的伪造视频检测方法及装置 | |
CN116994590B (zh) | 一种深度伪造音频鉴别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220104 |
|
RJ01 | Rejection of invention patent application after publication |