CN107452166B - 一种基于声纹识别的图书馆借书方法及装置 - Google Patents
一种基于声纹识别的图书馆借书方法及装置 Download PDFInfo
- Publication number
- CN107452166B CN107452166B CN201710499321.4A CN201710499321A CN107452166B CN 107452166 B CN107452166 B CN 107452166B CN 201710499321 A CN201710499321 A CN 201710499321A CN 107452166 B CN107452166 B CN 107452166B
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- user
- information
- book
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000009191 jumping Effects 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 11
- 238000009432 framing Methods 0.000 claims description 8
- 238000009413 insulation Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 12
- 210000000554 iris Anatomy 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000000513 principal component analysis Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000012780 transparent material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07G—REGISTERING THE RECEIPT OF CASH, VALUABLES, OR TOKENS
- G07G1/00—Cash registers
- G07G1/12—Cash registers electronically operated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Collating Specific Patterns (AREA)
Abstract
一种基于声纹识别的图书馆借书方法,其包括如下步骤:S1、预先采集用户声纹,作为对比声纹信息存储在服务器的声纹库中;S2、在用户取得图书后,再次采集用户声纹,并将本次采集的用户声纹发送到服务器;S3、云端服务器对再次采集的用户声纹与声纹库中对比声纹信息进行对比;在对比成功后跳转到步骤S4;S4、通过对比声纹信息确定用户身份信息,采集图书信息,将用户身份信息与图书信息进行绑定完成图书借阅。本发明还提供一种基于声纹识别的图书馆借书装置。
Description
技术领域
本发明涉及图书馆信息管理技术领域,特别涉及一种基于声纹识别的图 书馆借书方法及装置。
背景技术
目前,学校图书馆使用的借书还书终端机普遍是基于非接触式ic刷卡形 式,其由IC卡、条形码扫描仪、读卡器、数据库管理软件组成,用户在借 书还书时出示IC卡,但IC卡需随身携带,且易受温度、碰撞的影响。正是如此,其存在IC卡易丢失、易损坏的缺点。
随着信息技术与模式识别技术的发展,模式识别技术也应用到身份认证 之中。
目前已提出有三种图书馆借书装置的方案,一种是基于指纹识别的学校 图书馆借书装置,其由服务器、条形码扫描仪、带有指纹识别功能的终端机 组成。图书馆管理员预先将学生指纹采集,通过指纹提取软件提取特征点并 储存在服务器或终端机。在学生借书时,学生将所借书上标记的条形码经由 条形码扫描仪扫描确认,终端机采集学生指纹,通过服务器或PC机内置指 纹识别程序,与事先储存的指纹库里的指纹进行对比,确认为学生本人后, 数据管理软件将图书信息添加到学生已借书目录中,消磁器将书中磁条消磁,学生安全地通过门禁。此装置以生物特征代替IC卡,不需要携带任何 证件,解决了IC卡借书装置中IC必须随身携带所引发的问题。
但其缺点也很突出,首先,由于手是最常使用的部位,所以手指较容易 被割伤、沾有杂质(水、污渍)或磨损,以至于导致识别不出或错误识别指 纹。其次,指纹识别采用接触式采集方式,在学生多次使用指纹采集装置 后,采集装置会有磨损的情况发生,这也会导致识别精度的下降。
另一种是基于人脸识别的学校图书馆借书装置,其由服务器、条形码扫 描仪、消磁和磁化器、带有人脸识别功能的终端机、数据库管理软件组成, 图书馆管理方事先将学生人脸采集,提取特征点并储存在服务器或终端机。 其借书具体流程与指纹式图书馆借书装置相似,此装置以非接触式的人脸特征代替指纹,人脸相比于指纹,不易出现损伤情况,解决了指纹易损伤和覆 盖杂质的情况。但其仍有不足,主要为识别精度不准,受光线、学生是否佩 戴眼镜、发型、脸部表情、头部姿势等因素影响较大,无法准确识别学生身 份,这就失去的身份认证的意义。
还有一种是基于虹膜识别的学校图书馆借书装置,其由服务器、条形码 扫描仪、消磁和磁化器、带有虹膜识别功能的终端机、数据库管理软件组成, 与基于人脸识别的图书馆借书装置类似,图书管理员采集学生虹膜照片,虹 膜识别软件提取虹膜特征点并储存到虹膜库里,学生借书时,终端机采集学 生虹膜并与虹膜库里数据对比识别,确认学生身份后,数据库管理软件将学生信息与图书信息绑定,完成借书。虹膜识别相比人脸识别受环境因素影响 小,识别更为精准。但是红膜识别设备昂贵的价格却是使其不能商用化。
现有技术方案存在的问题和缺点:IC卡易丢失和损坏、指纹识别与身份 识别精度低、虹膜识别设备昂贵。
发明内容
有鉴于此,本发明提出一种基于声纹识别的图书馆借书方法及装置。
一种基于声纹识别的图书馆借书方法,其包括如下步骤:
S1、预先采集用户声纹,作为对比声纹信息存储在服务器的声纹库中;
S2、在用户取得图书后,再次采集用户声纹,并将本次采集的用户声纹 发送到服务器;
S3、云端服务器对再次采集的用户声纹与声纹库中对比声纹信息进行对 比;在对比成功后跳转到步骤S4;
S4、通过对比声纹信息确定用户身份信息,采集图书信息,将用户身份 信息与图书信息进行绑定完成图书借阅。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S1包括如下步骤:
S11、预先采集用户声纹以及身份信息;
S12、提取采集的用户声纹的特征信息;
S13、将提取的用户声纹的特征信息与身份信息存储在同一链表下,并 上传至服务器;在服务器中将所有用户的链表连接在一起获得包含对比声纹 信息的声纹库。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S12中提取采集的用户声纹的特征信息包括:
将采集的用户声纹进行快速傅里叶变换,实现从时域到频域的变换得到 频谱图;
对变换后得到的频谱图进行分帧处理;
对分帧处理后每一帧进行二维DCT变换;
将进行二维DCT变换后的每一帧信号串联;
对串联的信号进行PCA降维处理得到语音特征向量形式的用户声纹的 特征信息。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S2还包括:
在用户取得图书后,再次采集用户声纹时,通过预设的播放特殊背景噪 声对用户声纹信息进行加密,所述特殊背景噪声通过用户声纹信号与时间噪 声信号卷积形成,时间噪声与时间呈非线性关系。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S3中云端服务器对再次采集的用户声纹与声纹库中对比声纹 信息进行对比之前还包括:
利用分频方法将用户声纹信号分离或通过获取预设的特殊背景噪声信 号特性将人声信号分离。
本发明还提供一种基于声纹识别的图书馆借书装置,其包括:声音采集 器、图书标签扫描器、触屏显示器、语音提示器、自助借书控制台、互联网 接口、自助借书主机、透明隔音仓;
声纹采集器、图书标签扫描器、触屏显示器、语音提示器、互联网接 口分别与自助借书主机电连接;
自助借书主机设置在自助借书控制台内;触屏显示器位于自助借书控制 台上方;声纹采集器、图书标签扫描器设置在自助借书控制台内;所述透明 隔音仓设置在自助借书主机外;
所述声纹采集器用于用于采集用户声纹,并将其发送到自助借书主机;
所述图书标签扫描器用于扫描图书信息,并将其发送到自助借书主机;
所述触屏显示屏用于获取用户的操作信息,将其发送到自助借书机;
所述语音提示器用于播放特殊背景噪声,并发送到自助借书主机;还用 于在图书借阅完成后播放提示信息;
所述自助借书主机用于接收声纹采集器采集的用户声纹以及语音提示 器播放的特殊背景噪声,并将用户声纹及特殊背景噪声进行处理后通过互联 网接口发送到服务器进行对比,并获取声纹对比结果;用于接收图书标签扫 描器扫描的图书信息,将声纹对比结果与图书信息进行绑定后发送到服务 器,并将语音提示器发送播放提示信息的指令;
所述互联网接口用于将将经过处理后用户声纹及特殊背景噪声信号发 送到服务器;用于接收服务器发送的声纹对比结果;还用于将绑定后的声纹 对比结果与图书信息发送到服务器。
在本发明所述的基于声纹识别的图书馆借书装置中,
所述自助借书主机包括产生控制信号电路、卷积电路、滤波电路以及 CPU;所述卷积电路分别与滤波电路、产生控制信号电路、CPU电连接;滤 波电路与声纹采集器电连接;
所述产生控制信号电路用于产生控制信号并发送到卷积电路;卷积电路 用于将用户声纹信号和控制信号进行卷积得到特殊背景噪声信号,并发送到 滤波电路;滤波电路用于对采集得到的用户声纹及特殊背景噪声信号的混合 信号进行过滤,得到用户声纹。
实施本发明提供的基于声纹识别的图书馆借书方法及装置统与现有技 术相比具有以下有益效果:所述声纹识别技术属于生物识别,相比于非接触 式IC数卡技术具有安全性高、方便快捷的优点,无需担心IC卡遗失和损坏。所述声纹识别技术可以进行通过电话进行远程认证,对于学生来说更加方 便,而且用户接受度高,去掉繁杂的认证过程。所述声纹识别技术是一项根 据语音波形反映说话人生理和行为特征的语音参数,相比于指纹识别技术和 人脸识别技术,无需担心环境因素、指纹变化和人脸变化的因素,具有更准 确识别精度。虹膜识别虽为一种稳定、可靠的身份识别技术,但其所需的识 别设备昂贵,普通图书馆根本无法承担这样的费用,识别时要将眼睛凑到识别孔上,而声纹识别设备仅需麦克风采集数据,造价低廉、采集也极为方便, 是一种更为经济、简便的身份识别方式。加密方法中将人声信号与时间噪声 信号卷积后再作为特殊背景噪声,而非直接将时间噪声信号作为特殊背景噪 声,这样产生的有益效果是进一步加强该装置的安全可靠性。
附图说明
图1为本发明较佳实例提供的自助借书控制台的结构图;
图2为本发明较佳实例提供的透明隔音仓的结构图;
图3为本发明较佳实例提供的自助借书终端与服务器通信的交互示意 图;
图4为本发明较佳实例提供的图书馆自助借书装置内部电路连接示意 图;
图5为本发明较佳实例提供的声音信号处理的结构示意图;
图6为本发明较佳实例提供的声音信号处理流程示意图;
图7为本发明较佳实例提供的产生以及滤掉背景噪声的方法流程示意 图;
图8为本发明较佳实例提供的实现FRTT的流程图。
具体实施方式
如图1-8所示,本发明提供一种基于声纹识别的图书馆借书装置,其包 括:声纹采集器1、图书标签扫描器2、触屏显示器3、语音提示器4、自助 借书控制台5、互联网接口6、自助借书主机7、透明隔音仓8;
声纹采集器1、图书标签扫描器2、触屏显示器3、语音提示器4、互 联网接口6分别与自助借书主机7电连接;可选地,声纹采集器1、语音提 示器4和自助借书主机7通过电路进行串行连接,实现反窃听功能。
自助借书主机7设置在自助借书控制台5内;触屏显示器3位于自助借 书控制台5上方;声纹采集器1、图书标签扫描器2设置在自助借书控制台 5内;所述透明隔音仓8设置在自助借书主机7外。
可选地,声纹采集器1嵌入在自助借书控制台5内部,外部由网状物(附 图中未示出)贴合,确保声纹采集器1既可清楚地采集声纹,又能保护声纹 采集器1不受外力损伤。
可选地,所述图书标签扫描器2固定在自助借书控制台5内部,与自助 借书控制台5外壳留有5cm距离,再由透明材质(附图中未示出)将口封装。
所述声纹采集器1用于用于采集用户声纹,并将其发送到自助借书主机 7;
所述图书标签扫描器2用于扫描图书信息,并将其发送到自助借书主机 7;
所述触屏显示屏用于获取用户的操作信息,将其发送到自助借书机;
所述语音提示器4用于播放特殊背景噪声,并发送到自助借书主机7; 还用于在图书借阅完成后播放提示信息;
所述自助借书主机7用于接收声纹采集器1采集的用户声纹以及语音提 示器4播放的特殊背景噪声,并将用户声纹及特殊背景噪声进行处理后通过 互联网接口6发送到服务器进行对比,并获取声纹对比结果;用于接收图书 标签扫描器2扫描的图书信息,将声纹对比结果与图书信息进行绑定后发送 到服务器,并将语音提示器4发送播放提示信息的指令;
所述互联网接口6用于将将经过处理后用户声纹及特殊背景噪声信号发 送到服务器;用于接收服务器发送的声纹对比结果;还用于将绑定后的声纹 对比结果与图书信息发送到服务器。
在本发明所述的基于声纹识别的图书馆借书装置中,
所述自助借书主机7包括产生控制信号电路、卷积电路、滤波电路以及 CPU;所述卷积电路分别与滤波电路、产生控制信号电路、CPU电连接;滤波 电路与声纹采集器1电连接;
所述产生控制信号电路用于产生控制信号并发送到卷积电路;卷积电路 用于将用户声纹信号和控制信号进行卷积得到特殊背景噪声信号,并发送到 滤波电路;滤波电路用于对采集得到的用户声纹及特殊背景噪声信号的混合 信号进行过滤,得到用户声纹。将人声与背景噪声卷积成混合信号,传输至 主机再解密为人声,而背景噪声信号与时间成非线性关系,混合信号无法被外人分离,从而达到加密功能。
本发明实施例装置能够将声纹信息与学生信息相关联,再与书籍信息绑 定,从而构成一个学生所借图书的数据库。
所述声纹识别式图书馆自助借书装置具体实施方案如下:
(1)学生选择所想借的书籍,打开透明隔音仓8,拿着书到自助借书控 制台5面前。
(2)学生说出自己的名字,语音提示器4播放特殊背景噪声,声纹采 集器1将声音采集,并传送到自助借书主机7。
(3)自助借书主机7将接受的声音数据进行声音加密处理,去掉杂音, 提取声纹特征点,再经由互联网接口6将处理后的声纹的特征点数据传输至服务器端。
(4)服务器端的声纹识别程序将接受的声纹的特征点数据与已储存的 声纹数据库里的数据进行对比,确认学生身份。
(5)服务器端将识别的身份发送回自助借书主机7,语音提示器4语音 提示“欢迎学生,请将所借书籍的标签置于图书标签扫描器2上”
(6)图书标签扫描器2识别书籍信息并传输至自助借书主机7,自助借 书主机7将书籍信息与学生信息绑定发送至服务器端。
(7)语音提示器4提示“借书完成,请携带好书籍与您的个人物品”, 学生拿着书籍安全通过图书馆门禁。
本发明实施例的基于声纹识别的图书馆借书装置要求周围环境足够安 静,学生在隔音仓中可以满足这种声纹识别需求,由于学生声纹数据库大、 PC主机运算能力有限,自助借书主机7无法快速进行声纹识别,所以自助借 书装置只是将声纹进行采集和预处理,声纹识别则由服务器端上的声纹识别 程序处理,这样提高了反应速度,进一步节约主机成本。
一种基于声纹识别的图书馆借书方法,其包括如下步骤:
S1、预先采集用户声纹,作为对比声纹信息存储在服务器的声纹库中;
S2、在用户取得图书后,再次采集用户声纹,并将本次采集的用户声纹 发送到服务器;
S3、云端服务器对再次采集的用户声纹与声纹库中对比声纹信息进行对 比;在对比成功后跳转到步骤S4;
S4、通过对比声纹信息确定用户身份信息,采集图书信息,将用户身份 信息与图书信息进行绑定完成图书借阅。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S1包括如下步骤:
S11、预先采集用户声纹以及身份信息;
S12、提取采集的用户声纹的特征信息;
S13、将提取的用户声纹的特征信息与身份信息存储在同一链表下,并 上传至服务器;在服务器中将所有用户的链表连接在一起获得包含对比声纹 信息的声纹库。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S12中提取采集的用户声纹的特征信息包括:
将采集的用户声纹进行快速傅里叶变换,实现从时域到频域的变换得到 频谱图;
对变换后得到的频谱图进行分帧处理;
对分帧处理后每一帧进行二维DCT变换;
将进行二维DCT变换后的每一帧信号串联;
对串联的信号进行PCA降维处理得到语音特征向量形式的用户声纹的特 征信息。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S2还包括:
在用户取得图书后,再次采集用户声纹时,通过预设的播放特殊背景噪 声对用户声纹信息进行加密,所述特殊背景噪声通过用户声纹信号与时间噪 声信号卷积形成,时间噪声与时间呈非线性关系。
在本发明所述的基于声纹识别的图书馆借书方法中,
所述步骤S3中云端服务器对再次采集的用户声纹与声纹库中对比声纹 信息进行对比之前还包括:
利用分频方法将用户声纹信号分离或通过获取预设的特殊背景噪声信 号特性将人声信号分离。
其中,声纹匹配的技术分为两步,第一步从语音中提取声纹,第二步将 声纹进行匹配操作。本发明提供一种新颖的多分辨率时频特征(FRTT)提取 方法,通过在时间频谱图矩阵上进行多尺度的二维离散余弦变换,然后选择 并结合最终的多尺度变换元素,该方法可以更好地利用多分辨率时频信息。 而声纹匹配则是将这些平均值与声纹库里的数据进行对比。
梅尔频率倒谱系数(MFCC)是传统特征提取方法,它通过对语音信号进 行预加重、分帧、加窗、FFT变换、取绝对值、Mel滤波、取对数、DCT离散 余弦变换等一系列操作提取特征向量,它具有一些缺点,即使在通常情况下, 它简单有效。MFCC的主要缺点之一是将增量和加速度特征附加到基本特征, 这不是提取帧之间的时间信息的好方法,因为它将相关性引入到特征向量中。这对后端分类是不利的。后来,为了提高MFCC方法的准确度,基于MFCC的时频倒谱(TFC)特征也被提出来,其通过在倒谱矩阵上执行特征向量的 去相关的时间离散余弦变换(DCT)而获得。为了提高识别的精确性,通常 会以不同的尺度挖掘语音频谱图,整合来自多分辨率观察的信息。然而,TFC 方法是一种固定的单分辨率分析,并没有在多分辨率分析中有效地使用信息。基于以上考虑,本实施例中提出的多分辨率时频特征(MRTT)提取方法。 首先,语音的谱图被不同的尺度划分为多分辨率块。然后是二维DCT,我们 在每个分辨率下选择主要成分。最后,通过堆叠多分辨率分析的所有选择 的成分,并进行PCA来获得MRTT特征,以减小尺寸和冗余度。目前,已有 提出来的多分辨率特征提取方法,但它们使用多帧长度和帧率来提取特征或 在特征提取中使用小波变。MRTT明显不同于这些方法。多分辨率时频(MRTF)特征提取如下:
MFTT方法直接在频谱图矩阵中完成操作,类似于图像处理中的压缩任 务,其中二维DCT用于去相关并降低维数,使用多分辨率时频窗口功能后。
假设i是X
M是上下文宽度,为了简单起见,省略了i的下标。将矩阵分解成不同 尺度的多分辨率子矩阵,如A′1,A′2,...,A′R,其中R是刻度数。作为一 个例子,通过2*2窗口函数的2*2块操作,B′可以是
TFBW表示频谱图矩阵上的时间频率块窗口功能操作。
通过类似的块操作,我们可以获得不同的缩放多分辨率矩阵。接下来 对于每个Aj′,做二维DCT得到
Yj′=zigzag(Cj vAj′Cj h) (3)
其中Cj v和Cj k分别是A′j的垂直和水平DCT变换矩阵。之后,通过连接每 个Yj′向量获得一个向量
然后,利用主成分分析(PCA)来减小尺寸和尺寸之间的元素的解相关。
具体步骤是:
将语音信号进行快速傅里叶(FFT)变换,实现从时域到频域的变换
2.对变换后的频谱图进行分帧处理
3.每一帧进行二维DCT变换
其中,f(i,j)为频谱信号,
4.然后将进行二维DCT变换后的每一帧信号串联
5.再进行PCA降维处理得到语音特征向量
该装置特殊于反窃听功能,声纹采集器1具有人声检测功能,声纹采集 器1一旦检测到人的声音,便通过自助借书主机7发送特殊背景噪声信号到语音提示器4,语音提示器4播放特殊背景噪声,而且特殊背景噪声信号是 由人声信号与时间噪声信号卷积而成,其中时间噪声与时间成非线性关系。 此时,声纹采集器1开始采集声音,由于已知特殊背景噪声的频段和特性,自助借书主机7将采集的声音进行滤波处理,滤掉特殊背景噪声,恢复人的声音信号。而他人的窃听装置收集的声音是包含特殊背景噪声和人声的声 音,若他人将此录音在借书装置前播放,由于每次播放的背景噪声不同,声 纹采集器1采集到的声音则有上次的背景噪声、这次的背景噪声和人声,经过滤波处理后,声音仍然包含背景噪声和人声,并不能通过声纹识别匹配, 以达到反窃听功能。
声音加密(处理声音信号)原理如下:设人声的波形信号为f(t),控制 信号的波形信号为h(t),且h(t)的频率略大于f(t),混合信号为y(t),其 中控制信号的波形幅值是与时间t成非线性关系。人声的信号与噪声的信号 输入到主机,f(t)与h(t)信号经过主机的二维卷积电路,进行卷积处理,得到混合信号y(t):
f(t)*h(t)=y(t) (5)
解密方法:
f(t)、h(t)y(t)与通过拉普拉斯变换
可得:Y(s)=F(s)H(s) (7)
即F(s)=Y(s)/H(s) (8)
F(s)再通过拉普拉斯反变换,求得
在人说话时,自助借书主机7将信号y(t)放大,通过语音提示器4播放 出来,这样外界录得的声音便是人声和背景噪声的混合声音。
要想将人声与背景噪声分离开来有两种方法,第一种是利用分频方法将 人声信号分离出来,第二种是获取背景噪声信号特性将人声信号分离出来。
对于第一种方法,人能发出的声音频率大概为85HZ-1100HZ,由于信号 h(t)的频率略大于信号f(t),且两个信号卷积后的频率为两信号中较小频 率,所以y(t)在频率上与f(t)交叉,无法使用分频方法将人声信号f(t)分 离出来。
对于第二种方法,实时f(t)与h(t)卷积即将f(t)与h(t)频段重叠在一 起,无法使用分频方法将两个信号分离,除非已知h(t)和录得的混合声音, 才有可能利用公式将f(t)从混合声音的信号y(t)中分离出来。而由于噪声 信号h(t)是与时间t呈非线性关系、时间t具有唯一性且一直变化,所以 h(t)具有时间唯一性,即y(t)不可能被他人在不同时间利用,去破解声纹识别,从而达到声音加密的功能。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技 术构思做出其它各种相应的改变与变形,而所有这些改变与变形都应属于本 发明权利要求的保护范围。
Claims (3)
1.一种基于声纹识别的图书馆借书方法,其特征在于,其包括如下步骤:
S1、预先采集用户声纹,作为对比声纹信息存储在服务器的声纹库中;
S2、在用户取得图书后,再次采集用户声纹,并将本次采集的用户声纹发送到服务器;
S3、云端服务器对再次采集的用户声纹与声纹库中对比声纹信息进行对比;在对比成功后跳转到步骤 S4;
S4、通过对比声纹信息确定用户身份信息,采集图书信息,将用户身份信息与图书信息进行绑定完成图书借阅,所述步骤 S1 包括如下步骤:
S11、预先采集用户声纹以及身份信息;
S12、提取采集的用户声纹的特征信息;
S13、将提取的用户声纹的特征信息与身份信息存储在同一链表下,并上传至服务器;在服务器中将所有用户的链表连接在一起获得包含对比声纹信息的声纹库,所述步骤S12中提取采集的用户声纹的特征信息包括:将采集的用户声纹进行快速傅里叶变换,实现从时域到频域的变换得到频谱图;对变换后得到的频谱图进行分帧处理;对分帧处理后每一帧进行二维 DCT 变换;将进行二维 DCT 变换后的每一帧信号串联;对串联的信号进行PCA降维处理得到语音特征向量形式的用户声纹的特征信息,所述步骤S2还包括:在用户取得图书后,再次采集用户声纹时,通过预设的播放特殊背景噪声对用户声纹信息进行加密,所述特殊背景噪声通过用户声纹信号与时间噪声信号卷积形成,时间噪声与时间呈非线性关系,所述步骤S3中云端服务器对再次采集的用户声纹与声纹库中对比声纹信息进行对比之前还包括:利用分频方法将用户声纹信号分离或通过获取预设的特殊背景噪声信号特性将人声信号分离。
2.一种基于如权利要求1所述的基于声纹识别的图书馆借书方法的图书馆借书装置,其特征在于,其包括:声音采集器、图书标签扫描器、触屏显示器、语音提示器、自助借书控制台、互联网接口、自助借书主机、透明隔音仓;声纹采集器、图书标签扫描器、触屏显示器、语音提示器、互联网接口分别与自助借书主机电连接;自助借书主机设置在自助借书控制台内;触屏显示器位于自助借书控制 台上方; 声纹采集器、图书标签扫描器设置在自助借书控制台内;所述透明隔音仓设置在自助借书主机外;所述声纹采集器用于用于采集用户声纹,并将其发送到自助借书主机;所述图书标签扫描器用于扫描图书信息,并将其发送到自助借书主机;所述触屏显示器用于获取用户的操作信息,将其发送到自助借书机;所述语音提示器用于播放特殊背景噪声,并发送到自助借书主机;还用于在图书借阅完成后播放提示信息;所述自助借书主机用于接收声纹采集器采集的用户声纹以及语音提示器播放的特殊背景噪声,并将用户声纹及特殊背景噪声进行处理后通过互联网接口发送到服务器进行对比,并获取声纹对比结果;用于接收图书标签扫 描器扫描的图书信息,将声纹对比结果与图书信息进行绑定后发送到服务器,并将语音提示器发送播放提示信息的指令;所述互联网接口用于将将经过处理后用户声纹及特殊背景噪声信号发送到服务器;用于接收服务器发送的声纹对比结果;还用于将绑定后的声纹对比结果与图书信息发送到服务器。
3.如权利要求2所述的图书馆借书装置,其特征在于,所述自助借书主机包括产生控制信号电路、卷积电路、滤波电路以及CPU;所述卷积电路分别与滤波电路、产生控制信号电路、CPU电连接;滤波电路与声纹采集器电连接;所述产生控制信号电路用于产生控制信号并发送到卷积电路;卷积电路用于将用户声纹信号和控制信号进行卷积得到特殊背景噪声信号,并发送到滤波电路;滤波电路用于对采集得到的用户声纹及特殊背景噪声信号的混合信号进行过滤,得到用户声纹。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710499321.4A CN107452166B (zh) | 2017-06-27 | 2017-06-27 | 一种基于声纹识别的图书馆借书方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710499321.4A CN107452166B (zh) | 2017-06-27 | 2017-06-27 | 一种基于声纹识别的图书馆借书方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107452166A CN107452166A (zh) | 2017-12-08 |
CN107452166B true CN107452166B (zh) | 2023-08-22 |
Family
ID=60487085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710499321.4A Active CN107452166B (zh) | 2017-06-27 | 2017-06-27 | 一种基于声纹识别的图书馆借书方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107452166B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108281146B (zh) * | 2017-12-29 | 2020-11-13 | 歌尔科技有限公司 | 一种短语音说话人识别方法和装置 |
CN108898056B (zh) * | 2018-05-25 | 2020-11-27 | 中国电子科技集团公司第二十八研究所 | 一种消防单兵装备与人员快速匹配系统 |
CN108831157A (zh) * | 2018-07-27 | 2018-11-16 | 中山火炬高新企业孵化器有限公司 | 一种基于智能机器人的园区安防布控管理系统 |
CN110010130A (zh) * | 2019-04-03 | 2019-07-12 | 安徽阔声科技有限公司 | 一种面向参会者同步语音转写文字的智能方法 |
CN114550316B (zh) * | 2022-04-27 | 2022-08-05 | 广州商景网络科技有限公司 | 一站式可信生物特征数据采集终端设备及采集、共享方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11154998A (ja) * | 1997-11-19 | 1999-06-08 | Nec Commun Syst Ltd | 通話機能装置とその話者音声抽出・送話方法 |
CN1366263A (zh) * | 2001-01-18 | 2002-08-28 | E标记公司 | 电子交易系统及其方法 |
EP1760566A1 (en) * | 2005-08-29 | 2007-03-07 | Top Digital Co., Ltd. | Voiceprint-lock system for electronic data |
CN101167080A (zh) * | 2005-03-23 | 2008-04-23 | 株式会社Ihc | 验证系统 |
CN202049525U (zh) * | 2011-05-23 | 2011-11-23 | 郑州单点科技软件有限公司 | 一种自助借书还书管理系统 |
KR20120072906A (ko) * | 2010-12-24 | 2012-07-04 | 주식회사 케이티 | 복수 개의 인증수단을 결합한 인증 요청 방법 및 인증 수행 방법 |
CN102820972A (zh) * | 2012-08-17 | 2012-12-12 | 刘欣 | 一种基于声波的认证方法 |
US8499342B1 (en) * | 2008-09-09 | 2013-07-30 | At&T Intellectual Property I, L.P. | Systems and methods for using voiceprints to generate passwords on mobile devices |
CN106530530A (zh) * | 2016-11-30 | 2017-03-22 | 桂林市逸仙中学 | 一种基于指纹识别的学校图书馆借书控制系统 |
CN207097158U (zh) * | 2017-06-27 | 2018-03-13 | 长江大学 | 一种基于声纹识别的图书馆借书装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110320201A1 (en) * | 2010-06-24 | 2011-12-29 | Kaufman John D | Sound verification system using templates |
US20140359736A1 (en) * | 2013-05-31 | 2014-12-04 | Deviceauthority, Inc. | Dynamic voiceprint authentication |
-
2017
- 2017-06-27 CN CN201710499321.4A patent/CN107452166B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11154998A (ja) * | 1997-11-19 | 1999-06-08 | Nec Commun Syst Ltd | 通話機能装置とその話者音声抽出・送話方法 |
CN1366263A (zh) * | 2001-01-18 | 2002-08-28 | E标记公司 | 电子交易系统及其方法 |
CN101167080A (zh) * | 2005-03-23 | 2008-04-23 | 株式会社Ihc | 验证系统 |
EP1760566A1 (en) * | 2005-08-29 | 2007-03-07 | Top Digital Co., Ltd. | Voiceprint-lock system for electronic data |
US8499342B1 (en) * | 2008-09-09 | 2013-07-30 | At&T Intellectual Property I, L.P. | Systems and methods for using voiceprints to generate passwords on mobile devices |
KR20120072906A (ko) * | 2010-12-24 | 2012-07-04 | 주식회사 케이티 | 복수 개의 인증수단을 결합한 인증 요청 방법 및 인증 수행 방법 |
CN202049525U (zh) * | 2011-05-23 | 2011-11-23 | 郑州单点科技软件有限公司 | 一种自助借书还书管理系统 |
CN102820972A (zh) * | 2012-08-17 | 2012-12-12 | 刘欣 | 一种基于声波的认证方法 |
CN106530530A (zh) * | 2016-11-30 | 2017-03-22 | 桂林市逸仙中学 | 一种基于指纹识别的学校图书馆借书控制系统 |
CN207097158U (zh) * | 2017-06-27 | 2018-03-13 | 长江大学 | 一种基于声纹识别的图书馆借书装置 |
Non-Patent Citations (1)
Title |
---|
声纹识别在虚拟仪器平台的实现;王会清;张涛;周帆;;武汉工程大学学报(12);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107452166A (zh) | 2017-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107452166B (zh) | 一种基于声纹识别的图书馆借书方法及装置 | |
CN108039176B (zh) | 一种防录音攻击的声纹认证方法、装置及门禁系统 | |
Kim et al. | Multimodal biometric authentication using teeth image and voice in mobile environment | |
Sequeira et al. | MobBIO: A multimodal database captured with a portable handheld device | |
Gomez-Barrero et al. | Biometrics in the era of COVID-19: challenges and opportunities | |
Frischholz et al. | BiolD: a multimodal biometric identification system | |
CN106778179B (zh) | 一种基于超声波唇语识别的身份认证方法 | |
Kobayashi et al. | Rotation invariant feature extraction from 3-D acceleration signals | |
Majekodunmi et al. | A review of the fingerprint, speaker recognition, face recognition and iris recognition based biometric identification technologies | |
Mahto et al. | Ear acoustic biometrics using inaudible signals and its application to continuous user authentication | |
CN109829691B (zh) | 基于位置和深度学习多重生物特征的c/s打卡方法和装置 | |
Sharma et al. | Multi-Modality Biometric Assisted Smart Card Based Ration Distribution System | |
CN106980836A (zh) | 身份验证方法及装置 | |
Sellahewa et al. | Wavelet-based face verification for constrained platforms | |
Mayrhofer et al. | Towards usable authentication on mobile phones: An evaluation of speaker and face recognition on off-the-shelf handsets | |
CN114242075A (zh) | 基于人脸和声纹的身份认证方法、装置以及设备 | |
CN112769872B (zh) | 一种基于音频及视频特征融合的会议系统接入方法及系统 | |
CN201903889U (zh) | 手指静脉识别终端 | |
Ambeth Kumar et al. | Footprint Based Recognition System | |
Alam | On the use of fisher vector encoding for voice spoofing detection | |
CN113918912A (zh) | 一种基于脑纹识别的身份认证方法、系统、设备及介质 | |
CN112767945A (zh) | 基于声纹的录音控制方法、系统、电子设备及存储介质 | |
CN207097158U (zh) | 一种基于声纹识别的图书馆借书装置 | |
SulaimanAlshebli et al. | The Cyber Security Biometric Authentication based on Liveness Face-Iris Images and Deep Learning Classifier | |
CN220983921U (zh) | 一种基于人脸和声纹的识别装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |