CN109598514A - 一种带有声纹保护的智能音箱 - Google Patents

一种带有声纹保护的智能音箱 Download PDF

Info

Publication number
CN109598514A
CN109598514A CN201811415489.3A CN201811415489A CN109598514A CN 109598514 A CN109598514 A CN 109598514A CN 201811415489 A CN201811415489 A CN 201811415489A CN 109598514 A CN109598514 A CN 109598514A
Authority
CN
China
Prior art keywords
vocal print
intelligent sound
speaker
sound box
acoustic feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811415489.3A
Other languages
English (en)
Inventor
朱俊岗
朱峰
朱俊岭
余建美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing IoT Sensor Technology Co Ltd
Original Assignee
Nanjing IoT Sensor Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing IoT Sensor Technology Co Ltd filed Critical Nanjing IoT Sensor Technology Co Ltd
Publication of CN109598514A publication Critical patent/CN109598514A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种带有声纹保护的智能音箱,包括云平台、网关以及智能音箱,所述智能音箱与云平台通过网关进行数据双向传输,所述智能音箱设置有内置麦克风、控制器MCU、喇叭、声纹传感器以及无线通信模块,所述声纹拾取器与控制器MCU相连接,所述内置麦克风的输出端与控制器MCU的输入端电性连接,所述控制器MCU的输出端与喇叭的输入端电性连接,所述喇叭的输出端设置在智能音响的下部,所述控制器MCU通过无线通信模块与网关相连接,所述声纹校验装置与控制器MCU相连接。本发明解决现有技术中的智能音箱对声纹没有加密处理,声纹暴露在公众云上的声纹存在严重的支付安全的问题。

Description

一种带有声纹保护的智能音箱
技术领域
本发明涉及声纹处理领域,具体是一种带有声纹保护的智能音箱。
背景技术
音箱指可将音频信号变换为声音的一种设备。通俗的讲就是指音箱主机箱体或低音炮箱体内自带功率放大器,对音频信号进行放大处理后由音箱本身回放出声音,使其声音变大。音箱是整个音箱系统的终端,其作用是把音频电能转换成相应的声能,并把它辐射到空间去。智能音箱在交互方面有很大的提升,可实现智能交互,订餐,订外卖等,对声纹的保护随意登记上传没有保护,泄密情况受到较大音响。
发明内容
本发明的目的在于提供一种带有声纹保护的智能音箱,以解决现有技术中的智能音箱对声纹没有加密处理,声纹暴露在公众云上的声纹存在严重的支付安全的问题。
为实现上述目的,本发明提供如下技术方案:
一种带有声纹保护的智能音箱,包括云平台、网关以及智能音箱,所述智能音箱与云平台通过网关进行数据双向传输,所述智能音箱设置有内置麦克风、控制器MCU、喇叭、声纹传感器以及无线通信模块,所述声纹拾取器与控制器MCU相连接,所述内置麦克风的输出端与控制器MCU的输入端电性连接,所述控制器MCU的输出端与喇叭的输入端电性连接,所述喇叭的输出端设置在智能音响的下部,所述控制器MCU通过无线通信模块与网关相连接,所述声纹校验装置与控制器MCU相连接。
进一步地,所述声纹校验装置用于录制声纹信息和二次验证使用声纹支付请求,对声纹进行私有。
进一步地,所述声纹校验装置还包括:语音注册单元,用于接收注册指令和注册音频数据,根据注册指令判断注册音频数据音箱是否符合预置语音质量标准的要求,如是,则触发提取存档单元;
支付时,如否,则触发模糊销档单元;
提取存档单元,用于提取注册音频数据中的注册声学特征,将注册声学特征存入声纹音箱数据库中作为预置声学特征。
模糊销档单元,用于擦写声纹以及变声留言,消除声纹记录。
本发明还提供了一种带有声纹保护的智能音箱的工作方法,包括如下步骤:
S1:接收支付指令,根据支付指令获取缓存区中预置时间段内的实时监听的实时音频音箱数据;
S2:提取实时音频数据中的实时声学特征,将实时声学特征与声纹数据库中的预置声音箱学特征进行匹配获取匹配分数,判断匹配分数是否大于预提取实时音频数据中的实时声学特征,将实时声学特征与声纹数据库中音箱的预置声学特征进行匹配获取匹配分数,判断匹配分数是否大于预置阈值,若是,则执行支音箱付操作,若否,则执行步骤S3;
S3:声纹验证失败,提示操作用户输入支付密码。
进一步地,步骤S2具体包括:对实时音频数据进行端点检测,获取实时音频数据中的说话人音频数据;
对说话人音频数据进行去噪处理,对去噪后的说话人音频数据进行特征提取,获音箱取说话人音频数据中的实时声学特征;
将实时声学特征与声纹数据库中的预置声学特征进行匹配获取匹配分数,判断匹音箱配分数是否大于预置阈值,若是,则执行支付操作,若否,则执行步骤S3。
进一步地,当用户语音录入声纹指令时,模糊销档单元对声纹根据用户的指令擦写公共云上记录的声纹信息;多次上传声纹指令进行覆盖原有正确的声纹。
与现有技术相比,本发明的有益效果是:本发明采用声音校验装置对声纹有选择的筛选,对声纹实现提档和/或销档操作,实现声纹保护,提高保护声纹的效果。
附图说明
图1为本发明的设备连接关系示意图;
图2为本发明的智能音箱内部结构图;
图3为本发明的声纹校验装置的内部结构图;
图中:1、智能音箱;2、喇叭;3、麦克风;4、呼吸提示灯。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,一种带有声纹保护的智能音箱,包括云平台、网关以及智能音箱,所述智能音箱与云平台通过网关进行数据双向传输,所述智能音箱设置有内置麦克风、控制器MCU、喇叭、声纹传感器以及无线通信模块,所述声纹拾取器与控制器MCU相连接,所述内置麦克风的输出端与控制器MCU的输入端电性连接,所述控制器MCU的输出端与喇叭的输入端电性连接,所述喇叭的输出端设置在智能音响的下部,所述控制器MCU通过无线通信模块与网关相连接,所述声纹校验装置与控制器MCU相连接。
所述声纹校验装置用于录制声纹信息和二次验证使用声纹支付请求,对声纹进行私有。
所述声纹校验装置还包括:语音注册单元,用于接收注册指令和注册音频数据,根据注册指令判断注册音频数据音箱是否符合预置语音质量标准的要求,如是,则触发提取存档单元;
支付时,如否,则触发模糊销档单元;
提取存档单元,用于提取注册音频数据中的注册声学特征,将注册声学特征存入声纹音箱数据库中作为预置声学特征;
模糊销档单元,用于擦写声纹以及变声留言,消除声纹记录。
本实施例还提供了一种带有声纹保护的智能音箱的工作方法,其特征在于,包括如下步骤:
S1:接收支付指令,根据支付指令获取缓存区中预置时间段内的实时监听的实时音频音箱数据;
S2:提取实时音频数据中的实时声学特征,将实时声学特征与声纹数据库中的预置声音箱学特征进行匹配获取匹配分数,判断匹配分数是否大于预提取实时音频数据中的实时声学特征,将实时声学特征与声纹数据库中音箱的预置声学特征进行匹配获取匹配分数,判断匹配分数是否大于预置阈值,若是,则执行支音箱付操作,若否,则执行步骤S3;
S3:声纹验证失败,提示操作用户输入支付密码。
步骤S2具体包括:对实时音频数据进行端点检测,获取实时音频数据中的说话人音频数据;
对说话人音频数据进行去噪处理,对去噪后的说话人音频数据进行特征提取,获音箱取说话人音频数据中的实时声学特征;
将实时声学特征与声纹数据库中的预置声学特征进行匹配获取匹配分数,判断匹音箱配分数是否大于预置阈值,若是,则执行支付操作,若否,则执行步骤S3。
当用户语音录入声纹指令时,模糊销档单元对声纹根据用户的指令擦写公共云上记录的声纹信息;多次上传声纹指令进行覆盖原有正确的声纹。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (6)

1.一种带有声纹保护的智能音箱,包括云平台、网关以及智能音箱,其特征在于:所述智能音箱与云平台通过网关进行数据双向传输,所述智能音箱设置有内置麦克风、控制器MCU、喇叭、声纹传感器以及无线通信模块,所述声纹拾取器与控制器MCU相连接,所述内置麦克风的输出端与控制器MCU的输入端电性连接,所述控制器MCU的输出端与喇叭的输入端电性连接,所述喇叭的输出端设置在智能音响的下部,所述控制器MCU通过无线通信模块与网关相连接,所述声纹校验装置与控制器MCU相连接。
2.根据权利要求1所述的一种带有声纹保护的智能音箱,其特征在于:所述声纹校验装置用于录制声纹信息和二次验证使用声纹支付请求,对声纹进行私有。
3.根据权利要求1所述的一种带有声纹保护的智能音箱,其特征在于,所述声纹校验装置还包括:语音注册单元,用于接收注册指令和注册音频数据,根据注册指令判断注册音频数据音箱是否符合预置语音质量标准的要求,如是,则触发提取存档单元;
支付时,如否,则触发模糊销档单元;
提取存档单元,用于提取注册音频数据中的注册声学特征,将注册声学特征存入声纹音箱数据库中作为预置声学特征;
模糊销档单元,用于擦写声纹以及变声留言,消除声纹记录。
4.根据权利要求1-3所述的一种带有声纹保护的智能音箱的工作方法,其特征在于,包括如下步骤:
S1:接收支付指令,根据支付指令获取缓存区中预置时间段内的实时监听的实时音频音箱数据;
S2:提取实时音频数据中的实时声学特征,将实时声学特征与声纹数据库中的预置声音箱学特征进行匹配获取匹配分数,判断匹配分数是否大于预提取实时音频数据中的实时声学特征,将实时声学特征与声纹数据库中音箱的预置声学特征进行匹配获取匹配分数,判断匹配分数是否大于预置阈值,若是,则执行支音箱付操作,若否,则执行步骤S3;
S3:声纹验证失败,提示操作用户输入支付密码。
5.根据权利要求4所述的一种带有声纹保护的智能音箱的工作方法,其特征在于,步骤S2具体包括:对实时音频数据进行端点检测,获取实时音频数据中的说话人音频数据;
对说话人音频数据进行去噪处理,对去噪后的说话人音频数据进行特征提取,获音箱取说话人音频数据中的实时声学特征;
将实时声学特征与声纹数据库中的预置声学特征进行匹配获取匹配分数,判断匹音箱配分数是否大于预置阈值,若是,则执行支付操作,若否,则执行步骤S3。
6.根据权利要求4所述的一种带有声纹保护的智能音箱的工作方法,其特征在于:当用户语音录入声纹指令时,模糊销档单元对声纹根据用户的指令擦写公共云上记录的声纹信息;多次上传声纹指令进行覆盖原有正确的声纹。
CN201811415489.3A 2018-07-26 2018-11-26 一种带有声纹保护的智能音箱 Pending CN109598514A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018108362564 2018-07-26
CN201810836256 2018-07-26

Publications (1)

Publication Number Publication Date
CN109598514A true CN109598514A (zh) 2019-04-09

Family

ID=65960348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811415489.3A Pending CN109598514A (zh) 2018-07-26 2018-11-26 一种带有声纹保护的智能音箱

Country Status (1)

Country Link
CN (1) CN109598514A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400151A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 应用于服务器的语音支付方法、装置、计算设备以及介质
CN110570872A (zh) * 2019-07-15 2019-12-13 云知声智能科技股份有限公司 一种信息反馈的方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104283964A (zh) * 2014-10-22 2015-01-14 国网上海市电力公司 电力客户智能交互终端系统
CN104680375A (zh) * 2015-02-28 2015-06-03 优化科技(苏州)有限公司 电子支付真人活体身份验证系统
CN104796446A (zh) * 2014-01-21 2015-07-22 腾讯科技(深圳)有限公司 一种基于音频技术的数据传输方法、装置及系统
CN105991593A (zh) * 2015-02-15 2016-10-05 阿里巴巴集团控股有限公司 一种识别用户风险的方法及装置
CN205787647U (zh) * 2016-05-18 2016-12-07 深圳市三诺声智联股份有限公司 一种智能语音闹钟
CN206097120U (zh) * 2016-06-14 2017-04-12 南京伍安信息科技有限公司 一种具有自毁功能的声音认证安全Key盘
CN107274173A (zh) * 2017-05-11 2017-10-20 吴世贵 一种声波支付方法
CN107871236A (zh) * 2017-12-26 2018-04-03 广州势必可赢网络科技有限公司 一种电子设备声纹支付方法及装置
CN108877790A (zh) * 2018-05-21 2018-11-23 江西午诺科技有限公司 音箱控制方法、装置、可读存储介质及移动终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104796446A (zh) * 2014-01-21 2015-07-22 腾讯科技(深圳)有限公司 一种基于音频技术的数据传输方法、装置及系统
CN104283964A (zh) * 2014-10-22 2015-01-14 国网上海市电力公司 电力客户智能交互终端系统
CN105991593A (zh) * 2015-02-15 2016-10-05 阿里巴巴集团控股有限公司 一种识别用户风险的方法及装置
CN104680375A (zh) * 2015-02-28 2015-06-03 优化科技(苏州)有限公司 电子支付真人活体身份验证系统
CN205787647U (zh) * 2016-05-18 2016-12-07 深圳市三诺声智联股份有限公司 一种智能语音闹钟
CN206097120U (zh) * 2016-06-14 2017-04-12 南京伍安信息科技有限公司 一种具有自毁功能的声音认证安全Key盘
CN107274173A (zh) * 2017-05-11 2017-10-20 吴世贵 一种声波支付方法
CN107871236A (zh) * 2017-12-26 2018-04-03 广州势必可赢网络科技有限公司 一种电子设备声纹支付方法及装置
CN108877790A (zh) * 2018-05-21 2018-11-23 江西午诺科技有限公司 音箱控制方法、装置、可读存储介质及移动终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570872A (zh) * 2019-07-15 2019-12-13 云知声智能科技股份有限公司 一种信息反馈的方法及系统
CN110400151A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 应用于服务器的语音支付方法、装置、计算设备以及介质

Similar Documents

Publication Publication Date Title
CN101150788B (zh) 自检式无线广播终端系统及其监控处理器
CN105512348B (zh) 用于处理视频和相关音频的方法和装置及检索方法和装置
CN204390737U (zh) 一种家庭语音处理系统
CN103021409B (zh) 一种语音启动拍照系统
WO2019137066A1 (zh) 电器控制方法及装置
US20190156002A1 (en) Authentication method, terminal and computer storage medium based on voiceprint characteristic
CN104680375A (zh) 电子支付真人活体身份验证系统
CN108681440A (zh) 一种智能设备音量控制方法及系统
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
CN108010531A (zh) 一种可视智能问询方法及系统
CN103390305B (zh) 文本提示型声纹门禁系统
CN105376515B (zh) 用于视频通讯的通讯信息的呈现方法、装置及系统
CN103106717A (zh) 基于声纹识别的智能仓库声控门卫系统及其身份认证方法
US20230377602A1 (en) Health-related information generation and storage
CN104766608A (zh) 一种语音控制方法及装置
CN109034827A (zh) 支付方法、装置、穿戴式设备及存储介质
CN205900093U (zh) 降噪装置及虚拟现实设备
CN109598514A (zh) 一种带有声纹保护的智能音箱
CN110097875A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
WO2014173325A1 (zh) 喉音识别方法及装置
CN109215634A (zh) 一种多词语音控制通断装置的方法及其系统
CN104754112A (zh) 用户信息获取方法及移动终端
CN110111776A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN112925235A (zh) 交互时的声源定位方法、设备和计算机可读存储介质
CN111881751A (zh) 一种电气操作票单兵智能监护系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409