CN104490570A - 一种面向盲人的嵌入式声纹识别与发现系统 - Google Patents

一种面向盲人的嵌入式声纹识别与发现系统 Download PDF

Info

Publication number
CN104490570A
CN104490570A CN201410844914.6A CN201410844914A CN104490570A CN 104490570 A CN104490570 A CN 104490570A CN 201410844914 A CN201410844914 A CN 201410844914A CN 104490570 A CN104490570 A CN 104490570A
Authority
CN
China
Prior art keywords
module
voiceprint
user
wireless
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410844914.6A
Other languages
English (en)
Other versions
CN104490570B (zh
Inventor
赵峰
于洋
陈宏滨
余凯
刘军辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201410844914.6A priority Critical patent/CN104490570B/zh
Publication of CN104490570A publication Critical patent/CN104490570A/zh
Application granted granted Critical
Publication of CN104490570B publication Critical patent/CN104490570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种面向盲人的嵌入式声纹识别与发现系统,其特征是:由主控模块和分别与主控模块相连的存储模块、外围控制模块、语音采集模块、音频输出模块、无线模块、处理模块组成。本系统采用嵌入式技术,携带方便,节能高效,可以帮助盲人用户识别对方说话人,发现周围的已知联系人,添加新的好友。方便了盲人用户的生活,增加了生活的乐趣。

Description

一种面向盲人的嵌入式声纹识别与发现系统
技术领域
本发明涉及盲人应用设备,具体是一种面向盲人的嵌入式声纹识别与发现系统。
背景技术
声纹识别,生物识别技术的一种,又称为说话人识别。相比于其他的生物识别技术,声纹识别有以下优点:声纹特征获取方便,不需要刻意完成,使用者的接受度较高;获取设备的成本较低,一般只需要麦克风即可,不易损坏,维护方便;适合远程登录,仅需麦克风即可通过网络进行远程识别;算法复杂度低,设备负担小;通过语意加声纹,可以达到很高的安全性。
近距离无线通信技术近些年取得了飞速的发展,各种协议在生活中承担了不同的作用,比如ZigBee技术,功耗低,成本低,时延短,网络容量大,可靠安全。适合数据量不大的情况下的近距离无线通信。
盲人朋友因为失去了视觉信息的采集途径,很大程度上要依靠听觉来弥补,相对于其他感官,听觉记忆数据量小,需要依靠多次训练才能形成稳定的记忆。现有的面向盲人的应用设备,多集中于单一的探测障碍物,几乎没有涉及为盲人提供说话人识别能力这一方向,忽视了这一重要的应用场景;同时在结合无线技术应用方面也很欠缺,不能起到很好的互动效果。
发明内容
本发明的目的在于提供一种面向盲人的嵌入式声纹识别与发现系统,用于帮助盲人用户强化听觉记忆的可靠性,方便快捷的辅助他们识别说话人,发现周围的友人。
实现本发明目的的技术方案是:
一种面向盲人的嵌入式声纹识别与发现系统,由主控模块和分别与主控模块相连的存储模块、外围控制模块、语音采集模块、音频输出模块、无线模块、处理模块组成。其中:
语音采集模块由麦克风阵列组成,负责语音信号的采集,并送处理单元处理;
主控模块负责整个系统的时序控制,包括控制语音采集,语音处理,无线收发,外围控制处理,语音输出等,跟各单元相连,可由高性能单片机承担;
处理模块负责进行语音信号的数字处理,包括模数和数模转换,预处理,特征提取,模式匹配等,可由高性能DSP芯片承担;
存储模块负责存储用户的声纹信息库以及名称等相关信息;
外围控制模块由键盘输入各种控制信号到主控模块,比如确认,取消等;
无线模块用来收发信息,送给处理模块进行处理;
音频输出模块由主控单元控制,负责输出相应的提示信息给用户。
本发明一种面向盲人的嵌入式声纹识别与发现系统的工作步骤是:
盲人用户利用系统的麦克风采集说话人的语音信息,进行预处理,提取特征参数,进行匹配;
若匹配成功,则告知盲人用户,该说话人的名称以及简略备注;若匹配不成功,则告知盲人用户,选择是否将该联系人加入通信录;
开启无线发现模式时,接收到对方的声纹信息进行匹配,若匹配成功,则通知用户,该联系人就在附近;若匹配不成功,则可选是否添加该网络联系人到通信录。
本发明的优点是:本发明为盲人用户提供了一种有效的听觉记忆增强方案,在方便便捷的前提下,可以帮助盲人用户在接触到新的联系人时,可以方便的将其加入自己的通信录,在第二次接触该联系人时,可以帮助他方便的识别出该联系人,增强听觉记忆的可靠性;同时,本设计提供了麦克风阵列语音增强和语音分离功能,抗噪性较好,并可以区分多个说话人,提高了在复杂环境下的识别能力,为盲人生活带来方便;进一步的,本方案提供了无线模块,可以帮助盲人用户在未知的前提下发现周围近距离的持有同设备的联系人,还可以发现陌生设备持有人,可选择加为好友关系,增加了盲人用户生活的乐趣。
附图说明
图1是系统组成框图;
图2是系统功能框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。下面结合附图进一步说明本发明的技术解决方案。
如图1所示,一种面向盲人的嵌入式声纹识别与发现系统,由主控模块和分别与主控模块相连的存储模块、外围控制模块、语音采集模块、音频输出模块、无线模块、处理模块组成。其中:
语音采集单元:采用麦克风阵列,采集语音信息,可以有效的进行语音增强与语音分离,将采集的信息传输给主控单元。
主控单元:可由高性能单片机承担,与各个单元连接,负责系统的控制与各部分的调度合作,实现系统的各项功能,如采集语音信息,进行语音信息数字处理,存储信息,接受外部控制信号,无线收发信息,输出音频提示信息等。
处理单元:可由高效数字信号处理器承担,接受主控单元传来的控制信号和数据信息,进行算法执行,处理数据,并将结果回传给主控单元。
存储单元:可由若干种存储介质构成,如用EEROM存储系统配置信息,用Flash存储数据信息。与主控单元相连。
外围控制单元:由若干按键组成,向主控单元输入用户控制信息,完成相关操作。
无线单元:由无线收发器构成,如ZigBee模块等,与相同设备建立无线连接,传输数据,并与主控单元相连,输入或输出数据。
音频输出单元:将主控单元送来的信息通过扬声器输出,给用户提供相应的语音提示音。
如图2所示,本系统实现的具体功能步骤如下:
用户开启设备,进入采集声纹信息,利用麦克风阵列进行语音增强和语音分离。
分别提取相应的声纹特性,利用多个参数提高识别的准确率。
采用相关算法将声纹特征与模板库进行匹配,利用多层算法,由简到繁,由广到细,提高识别精度的同时减少识别的时间。
若匹配成功,则系统输出音频提示用户该说话人的名字以及备注;
若匹配不成功,则系统询问用户是否将该说人加入本地通信录,用户通过按键输入是还是否。
若用户输入是,则进一步采集该说话人一定的声纹信息,训练成模板,存入本地存储。并寻求用户命名该说话人,此时,用户可在提示下,读出该名称,采用录音给该说话人命名。
当用户开启无线发现模式时,通过无线模块和其他设备建立连接。
用户可选择是否发送自己的声纹信息给对方,或者是否接受对方的声纹信息。
若选择接受,会将收到的声纹信息和本地声纹库进行比对。
若匹配成功,则告知用户该联系人在附近,并会询问是否通知对方,在获得许可后,会发送一个通知信息给对方;
若匹配不成功,则询问用户是否添加该联系人到本地,若用户确认,则发出附带备注的请求,对方若确认,则对方会发送进一步的声纹信息以便在本地建立模板入库,同时本机也会发送进一步的声纹信息以便在对方本地建立模板入库。建立好友关系。
上述过程被拒绝将会终止识别过程。本机发送的情况等同于上面实例中的对方用户,不再赘述。

Claims (9)

1.一种面向盲人的嵌入式声纹识别与发现系统,其特征是:由主控模块和分别与主控模块相连的存储模块、外围控制模块、语音采集模块、音频输出模块、无线模块、处理模块组成。
2.根据权利要求1所述的系统,其特征是:所述语音采集模块由麦克风阵列组成,负责语音信号的采集,并送处理单元处理。
3.根据权利要求1所述的系统,其特征是:主控模块负责整个系统的时序控制,包括控制语音采集,语音处理,无线收发,外围控制处理,语音输出,跟各单元相连,由高性能单片机承担。
4.根据权利要求1所述的系统,其特征是:处理模块负责进行语音信号的数字处理,包括模数和数模转换,预处理,特征提取,模式匹配,由高性能DSP芯片承担。
5.根据权利要求1所述的系统,其特征是:无线模块用来收发信息,采用自组网方便的低功耗近距离无线技术,送给处理模块进行处理。
6.根据权利要求5所述的系统,其特征是:所述低功耗近距离无线技术为蓝牙或ZigBee。
7.根据权利要求1所述的系统,其特征是:操作步骤如下:
A. 盲人用户利用系统的麦克风采集说话人的语音信息,提取特征参数;
B. 将采集的特征参数利用高效算法与系统存储的模型库进行匹配;
C. 利用无线模块发射和接收声纹信息,与本地模型库进行匹配。
8.根据权利要求1所述的系统,其特征是:系统的匹配过程是:
将采集的到声纹信息与本地存储的模板库进行匹配,若匹配成功,则告知盲人用户,该说话人的名称以及简略备注;
若匹配不成功,则告知盲人用户,是否建立新的联系人,若用户回答为是,则将该声纹信息按系统的算法训练成模板,存储到本地声纹库中,此时可能需要进一步采集该说话人的语音信息,以完成训练的要求。
9.根据权利要求1所述的系统,其特征是:本系统的无线发现过程是:
开启模式时,利用短距离无线技术建立距离范围内用户间的连接,用户可选择是否与连接用户发送自己的信息,包括自己的声纹信息和名称,同时可以选择是否接受对方的识别信息;
当接收到对方的声纹信息后,将该信息和本地的声纹库进行匹配,若匹配成功,则通知用户,该联系人就在附近,并询问是否通知对方;
若匹配不成功,则询问是否添加该网络联系人到本地,若同意添加,则向该用户发出请求,对方如果同意添加,则进一步发送足以训练出模板的声纹信息给本机,同时本机也发送相应的信息给对方,双方同时更新模板库,建立好友关系。
CN201410844914.6A 2014-12-31 2014-12-31 一种面向盲人的嵌入式声纹识别与发现系统 Active CN104490570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410844914.6A CN104490570B (zh) 2014-12-31 2014-12-31 一种面向盲人的嵌入式声纹识别与发现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410844914.6A CN104490570B (zh) 2014-12-31 2014-12-31 一种面向盲人的嵌入式声纹识别与发现系统

Publications (2)

Publication Number Publication Date
CN104490570A true CN104490570A (zh) 2015-04-08
CN104490570B CN104490570B (zh) 2017-05-17

Family

ID=52932093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410844914.6A Active CN104490570B (zh) 2014-12-31 2014-12-31 一种面向盲人的嵌入式声纹识别与发现系统

Country Status (1)

Country Link
CN (1) CN104490570B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834531A (zh) * 2015-05-29 2015-08-12 中山大学 一种盲人计算机的命令匹配系统及其实现方法
CN104873062A (zh) * 2015-05-29 2015-09-02 王旭昂 一种具有语音控制功能的水杯
CN109616123A (zh) * 2018-11-21 2019-04-12 安徽云融信息技术有限公司 基于大数据的视障人士用浏览器语音交互方法及装置
CN111667840A (zh) * 2020-06-11 2020-09-15 刘娴 基于声纹识别的机器人知识图谱节点更新方法
CN112133314A (zh) * 2020-09-24 2020-12-25 深圳前海微众银行股份有限公司 声纹密码的设置和验证的方法、装置、设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266633B1 (en) * 1998-12-22 2001-07-24 Itt Manufacturing Enterprises Noise suppression and channel equalization preprocessor for speech and speaker recognizers: method and apparatus
CN1462366A (zh) * 2001-05-10 2003-12-17 皇家菲利浦电子有限公司 说话人声音的后台学习
CN1819524A (zh) * 2005-11-29 2006-08-16 上海奥达光电子科技有限公司 全球自动导游讲解系统
CN1877697A (zh) * 2006-07-25 2006-12-13 北京理工大学 一种基于分布式结构的说话人确认方法
US20080255854A1 (en) * 2005-03-18 2008-10-16 International Business Machines Corporation System and method using blind change detection for audio segmentation
CN203179513U (zh) * 2013-04-12 2013-09-04 代方远 一种声纹识别仪
CN104055655A (zh) * 2013-12-25 2014-09-24 苏州天鸣信息科技有限公司 一种语音提示装置组合

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266633B1 (en) * 1998-12-22 2001-07-24 Itt Manufacturing Enterprises Noise suppression and channel equalization preprocessor for speech and speaker recognizers: method and apparatus
CN1462366A (zh) * 2001-05-10 2003-12-17 皇家菲利浦电子有限公司 说话人声音的后台学习
JP4369132B2 (ja) * 2001-05-10 2009-11-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話者音声のバックグランド学習
US20080255854A1 (en) * 2005-03-18 2008-10-16 International Business Machines Corporation System and method using blind change detection for audio segmentation
CN1819524A (zh) * 2005-11-29 2006-08-16 上海奥达光电子科技有限公司 全球自动导游讲解系统
CN1877697A (zh) * 2006-07-25 2006-12-13 北京理工大学 一种基于分布式结构的说话人确认方法
CN203179513U (zh) * 2013-04-12 2013-09-04 代方远 一种声纹识别仪
CN104055655A (zh) * 2013-12-25 2014-09-24 苏州天鸣信息科技有限公司 一种语音提示装置组合

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834531A (zh) * 2015-05-29 2015-08-12 中山大学 一种盲人计算机的命令匹配系统及其实现方法
CN104873062A (zh) * 2015-05-29 2015-09-02 王旭昂 一种具有语音控制功能的水杯
CN109616123A (zh) * 2018-11-21 2019-04-12 安徽云融信息技术有限公司 基于大数据的视障人士用浏览器语音交互方法及装置
CN111667840A (zh) * 2020-06-11 2020-09-15 刘娴 基于声纹识别的机器人知识图谱节点更新方法
CN112133314A (zh) * 2020-09-24 2020-12-25 深圳前海微众银行股份有限公司 声纹密码的设置和验证的方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN104490570B (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN107003969B (zh) 用于使用电子附件连接的连接属性促进定位附件的主设备
CN104490570B (zh) 一种面向盲人的嵌入式声纹识别与发现系统
CN103888581B (zh) 一种通信终端及其记录通话信息的方法
US11043086B1 (en) Voice-coded finder and radiotag tracker
US10630826B2 (en) Information processing device
CN104702783B (zh) 基于语音信号的物品寻找方法及自动应答系统
CN106782519A (zh) 一种机器人
CN109696833A (zh) 一种智能家居控制方法、可穿戴设备和音箱设备
CN110070863A (zh) 一种语音控制方法及装置
CN109871238A (zh) 语音交互方法、装置和存储介质
CN109637542A (zh) 一种语音外呼系统
CN105580071A (zh) 用于训练声音识别模型数据库的方法和装置
CN113470634A (zh) 语音交互设备的控制方法、服务器及语音交互设备
CN106131748A (zh) 一种具有红外感应识别的智能音响
CN107945799A (zh) 一种多功能语音交互智能机器
CN102333387A (zh) 基于盲文编码和振动感知的听力障碍者通信方法及装置
CN105704839A (zh) 一种蓝牙连接方法和装置
CN209606794U (zh) 一种可穿戴设备、音箱设备和智能家居控制系统
CN208623896U (zh) 智能音箱
CN110556131A (zh) 一种语音活动检测设备及方法
CN203492205U (zh) 一种具有组网功能的智能开关
CN103188633A (zh) 车载通讯系统
CN207219024U (zh) 一种遥控无线麦连接控制系统
CN112669844A (zh) 通过语音贴控制设备的方法、设备控制方法及装置
US20150172824A1 (en) Wearable communication device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150408

Assignee: Guangxi Taijiexin Technology Co.,Ltd.

Assignor: GUILIN University OF ELECTRONIC TECHNOLOGY

Contract record no.: X2023980044263

Denomination of invention: An Embedded Voiceprint Recognition and Discovery System for Blind People

Granted publication date: 20170517

License type: Common License

Record date: 20231025