CN103956164A - 一种声音唤醒方法及系统 - Google Patents

一种声音唤醒方法及系统 Download PDF

Info

Publication number
CN103956164A
CN103956164A CN201410211795.0A CN201410211795A CN103956164A CN 103956164 A CN103956164 A CN 103956164A CN 201410211795 A CN201410211795 A CN 201410211795A CN 103956164 A CN103956164 A CN 103956164A
Authority
CN
China
Prior art keywords
external sound
sound
module
audio frequency
frequency characteristics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410211795.0A
Other languages
English (en)
Inventor
王艳龙
陈楠昕
俞凯
周伟达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
AI Speech Ltd
Suzhou Speech Information Technology Co Ltd
Original Assignee
Shanghai Jiaotong University
Suzhou Speech Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, Suzhou Speech Information Technology Co Ltd filed Critical Shanghai Jiaotong University
Priority to CN201410211795.0A priority Critical patent/CN103956164A/zh
Publication of CN103956164A publication Critical patent/CN103956164A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种声音唤醒方法及系统,属于声音识别技术领域。该方法包括当检测到外界声音时,启动声音唤醒系统;采集外界声音,提取该外界声音的音频特征;当预设规则库中包含该外界声音的音频特征时,传递预设声音出现信号,该预设规则库包含多个人体声音特征;统计预设时间内该外界声音出现次数,并根据所统计的次数执行相应的指令。本发明使得声音识别系统高效、准确、省电,且灵活运用。

Description

一种声音唤醒方法及系统
技术领域
本发明涉及声音识别技术领域,特别涉及一种声音唤醒方法及系统。
背景技术
近些年来,随着语音识别技术的快速发展,唤醒技术在诸多语音系统中得到了应用,例如:车载导航、手机语音助手等。传统的语音唤醒技术需要耗费电量做声音方面的大量计算,或是通过按钮等方法控制,在远程控制等复杂环境中难以腾出手来操作,具有诸多不便。而此类产品在现实生活中又具有诸多应用,例如楼道中的声控灯、声控解锁等。这类产品其中一些能做到省电,却容易受到外界环境干扰,例如楼道中的声控灯会因为楼上或楼下声音的干扰而自动开启,在实际生活中效果不佳。又例如通过对用户的一些特殊语句进行识别(例如“开始”等等)来唤醒系统,但是对于这类语句的识别复杂度较高,需要提取高阶特征,做复杂训练,构造声学模型,计算量较大,使得耗电量上升,在很多条件下难以推广使用。考虑到一个好的唤醒模块能够使整个语音系统在大部分时间处于伪待机状态,即除了唤醒模块其他模块关闭,改进现有技术对整个语音系统有较大意义。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种声音唤醒系统及方法。所述技术方案如下:
一方面,提供了一种声音唤醒方法,所述方法包括:
当检测到外界声音时,启动声音唤醒系统;
采集外界声音,提取所述外界声音的音频特征;
当预设规则库中包含所述外界声音的音频特征时,传递预设声音出现信号,所述预设规则库包含多个人体声音特征;
统计预设时间内所述外界声音出现次数,并根据所统计的次数执行相应的指令。
另一方面,提供了一种声音唤醒系统,所述系统包括:预处理模块、音频输入模块、特征提取模块、音频分析模块、解码模块;其中,
所述预处理模块用于当检测到外界声音时,启动所述音频输入模块、所述特征提取模块、所述音频分析模块及所述解码模块;
所述音频输入模块用于采集外界声音;
所述特征提取模块用于提取外界声音的音频特征;
所述音频分析模块,用于当预设规则库中包含所述外界声音的音频特征时,传递预设声音出现信号,所述预设规则库包含多个人体声音特征;
所述解码模块用于统计预设时间内所述外界声音出现次数,并根据所统计的次数执行相应的指令。
本发明实施例提供的技术方案带来的有益效果是:
通过检测外界声音,当外界声音非静音时,启动声音唤醒系统,当判断外界声音为预设声音时,根据预设声音出现的次数执行相应指令,使得该声音唤醒系统具有较好的鲁棒性,根据预设声音执行相应指令,准确率较高,资源消耗相对较低节,省电源消耗。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的声音唤醒方法流程图;
图2是本发明实施例提供的声音唤醒系统结构示意图;
图3是本发明实施例提供的声音唤醒方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的声音唤醒方法流程图。参见图1,该实施例包括
101、当检测到外界声音时,启动声音唤醒系统;
在本发明实施例中,可以采用声音强度检测器检测外界声音,当检测到外界声音时,启动声音唤醒系统,当未检测到外界声音时,不启动声音唤醒系统。也即是在附近无人时,不启动声音唤醒系统,待有人时,才启动声音唤醒系统,可以大大减少电量的消耗。
102、采集外界声音,并对所采集的外界声音进行端点检测,确定所采集的外界声音是否静音;
在本发明实施例中,采集外界声音,并用所采集的外界声音最为简单的特征如音量、频率、音高等进行端点检测,排除静音等情况。
103、当所采集的外界声音非静音时,对该外界声音进行短时快速傅里叶变化,提取该外界声音的音频特征;
104、当预设规则库中包含该外界声音的音频特征时,传递预设声音出现信号,该预设规则库包含多个人体声音特征;
其中,该人体声音可以为掌声、口哨声、咳嗽声等具有人类自身特征的声音。使得在复杂的噪声环境下,声音唤醒系统具有较好的鲁棒性,对于不同用户普适性较好,不受口音影响,简单好用,且准确率高,资源消耗相对较低。
在本发明实施例中,判断该预设规则库中是否包含所述外界声音的音频特征,如果该预设规则库中包含所述外界声音的音频特征时,传递预设声音出现信号,如果该预设规则库中未包含所述外界声音的音频特征时,不传递预设声音出现信号。
需要说明的是,本发明实施例采用预设声音进行唤醒,在本发明的另一实施例中,也可以使用其他音频特征做打击声音唤醒,使用时域特征做口哨声的音频检测等唤醒方式,本发明实施例不作具体限定。
105、统计预设时间内预设声音出现的次数,并根据所统计的预设声音出现的次数,执行相应的指令。
在本发明实施例中,统计预设时间内预设声音出现的次数,按照预设声音出现的次数执行预设定义的指令,例如,出现一次预设声音,开启声音识别模块,出现两次预设声音,关闭声音控制等。
需要说明的是,该声音唤醒方法可以在软件系统中实现,也可以集成到硬件中实现,本发明实施例不作具体限定。
本发明实施例提供的方法,通过检测外界声音,当外界声音非静音时,启动声音唤醒系统,当判断外界声音为预设声音时,根据预设声音出现的次数执行相应指令,使得该声音唤醒系统具有较好的鲁棒性,根据预设声音执行相应指令,准确率较高,资源消耗相对较低节省电源消耗。
图2是本发明实施例提供的声音唤醒系统结构图。参见图2,该系统包括预处理模块201、音频输入模块202、特征提取模块203、音频分析模块204、解码模块205;其中,
所述预处理模块201用于当检测到外界声音时,启动所述音频输入模块、所述特征提取模块、所述音频分析模块及所述解码模块;所述预处理模块201与所述音频输入模块连接,所述音频输入模块202用于采集外界声音;所述音频输入模块202与所述特征提取模块203连接,所述特征提取模块203用于提取所述外界声音的音频特征;所述特征提取模块203与所述音频分析模块204连接,所述音频分析模块204,用于当预设规则库中包含所述外界声音的音频特征时,传递预设声音出现信号,所述预设规则库包含多个人体声音特征;所述音频分析模块204与所述解码模块205连接,所述解码模块205用于统计预设时间内所述外界声音出现次数,并根据所统计的次数执行相应的指令。
可选地,所述音频特征提取模块203还用于采集外界声音,并对所采集的外界声音进行端点检测,确定所采集的外界声音是否静音;
当所采集的外界声音非静音时,对所述外界声音进行短时快速傅里叶变化,提取所述外界声音的音频特征。
可选地,所述预处理模块201还用于当未检测到外界声音时,不启动所述音频输入模块、所述特征提取模块、所述音频分析模块及所述解码模块。
可选地,所述系统还包括人体动作声音库,所述人体动作声音库用于对应存储预设声音的次数与指令。
可选地,所述系统应用于智能移动手机设备、智能手机应用、车载设备、车载应用、家居设备和可穿戴设备。
本发明实施例提供的装置,通过检测外界声音,当外界声音非静音时,启动声音唤醒系统,当判断外界声音为预设声音时,根据预设声音出现的次数执行相应指令,使得该声音唤醒系统具有较好的鲁棒性,根据预设声音执行相应指令,准确率较高,资源消耗相对较低节省电源消耗。
图3是本发明实施例提供的声音唤醒方法流程图,在图3中预处理模块检测到外界声音时,发送启动信号,启动声音唤醒系统,音频输入模块采集外界声音,当外界声音是静音时,不继续启动后续模块,如果外界声音是非静音的,则提取外界声音特征,分析该外界声音是否为预设声音。如果该外界声音不是预设声音,则该预处理模块继续检测外界声音,如该外界声音是预设声音,则发送预设声音出现的信号。该解码模块统计预设声音在预设时间内出现的次数,查询预设声音出现次数对应的指令,与声音交互系统进行交互,当未查询到预设声音出现次数对应的指令时,确定为无效指令,该预处理模块继续检测外界声音。
在智能家居,智能手机,车载,穿戴设备中,集成本发明所述的软件系统模块,检测人体动作声音后,直接进行命令动作或者进行后续的声音交互。
在智能家居,智能手机,车载,穿戴设备中,通过硬件模块集成本发明所述模块,检测人体动作声音后,直接进行命令动作或者进行后续的声音交互。
例如:
用户:(拍手一下)
智能设备:您好
用户:把电视打开。
又例如:
用户:(拍手两下)
智能设备:(自动开机)。
需要说明的是:上述实施例提供的声音唤醒系统在声音唤醒时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的声音唤醒系统与声音唤醒方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种声音唤醒方法,其特征在于,所述方法包括:
当检测到外界声音时,启动声音唤醒系统;
采集外界声音,提取所述外界声音的音频特征;
当预设规则库中包含所述外界声音的音频特征时,传递预设声音出现信号,所述预设规则库包含多个人体声音特征;
统计预设时间内所述外界声音出现次数,并根据所统计的次数执行相应的指令。
2.根据权利要求1所述的方法,其特征在于,采集外界声音,提取所述外界声音的音频特征包括:
采集外界声音,并对所采集的外界声音进行端点检测,确定所采集的外界声音是否静音;
当所采集的外界声音非静音时,对所述外界声音进行短时快速傅里叶变化,提取所述外界声音的音频特征。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当未检测到外界声音时,不启动声音唤醒系统。
4.根据权利要求1所述的方法,其特征在于,所述方法应用于智能移动手机设备、智能手机应用、车载设备、车载应用、家居设备和可穿戴设备。
5.一种声音唤醒系统,其特征在于,所述系统包括预处理模块、音频输入模块、特征提取模块、音频分析模块、解码模块;其中,
所述预处理模块用于当检测到外界声音时,启动所述音频输入模块、所述特征提取模块、所述音频分析模块及所述解码模块;
所述音频输入模块用于采集外界声音;
所述特征提取模块用于提取外界声音的音频特征;
所述音频分析模块,用于当预设规则库中包含所述外界声音的音频特征时,传递预设声音出现信号,所述预设规则库包含多个人体声音特征;
所述解码模块用于统计预设时间内所述外界声音出现次数,并根据所统计的次数执行相应的指令。
6.根据权利要求5所述的系统,其特征在于,所述音频特征提取模块还用于采集外界声音,并对所采集的外界声音进行端点检测,确定所采集的外界声音是否静音;
当所采集的外界声音非静音时,对所述外界声音进行短时快速傅里叶变化,提取所述外界声音的音频特征。
7.根据权利要求5所述的系统,其特征在于,所述预处理模块还用于当未检测到外界声音时,不启动所述音频输入模块、所述特征提取模块、所述音频分析模块及所述解码模。
8.根据权利要求5所述的系统,其特征在于,所述系统应用于智能移动手机设备、智能手机应用、车载设备、车载应用、家居设备和可穿戴设备。
CN201410211795.0A 2014-05-20 2014-05-20 一种声音唤醒方法及系统 Pending CN103956164A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410211795.0A CN103956164A (zh) 2014-05-20 2014-05-20 一种声音唤醒方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410211795.0A CN103956164A (zh) 2014-05-20 2014-05-20 一种声音唤醒方法及系统

Publications (1)

Publication Number Publication Date
CN103956164A true CN103956164A (zh) 2014-07-30

Family

ID=51333430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410211795.0A Pending CN103956164A (zh) 2014-05-20 2014-05-20 一种声音唤醒方法及系统

Country Status (1)

Country Link
CN (1) CN103956164A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096939A (zh) * 2015-07-08 2015-11-25 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN105501121A (zh) * 2016-01-08 2016-04-20 北京乐驾科技有限公司 一种智能唤醒方法及系统
CN105575220A (zh) * 2016-03-22 2016-05-11 深圳视感文化科技有限公司 一种交互式弦乐器教学系统
CN105718019A (zh) * 2014-12-01 2016-06-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN106098059A (zh) * 2016-06-23 2016-11-09 上海交通大学 可定制语音唤醒方法及系统
CN106814788A (zh) * 2015-12-01 2017-06-09 马维尔国际贸易有限公司 用于激活电路的装置和方法
CN107170455A (zh) * 2017-05-31 2017-09-15 靖西市秀美边城农业科技有限公司 一种简单语音识别装置
CN110070863A (zh) * 2019-03-11 2019-07-30 华为技术有限公司 一种语音控制方法及装置
CN110428835A (zh) * 2019-08-22 2019-11-08 深圳市优必选科技股份有限公司 一种语音设备的调节方法、装置、存储介质及语音设备
CN111161714A (zh) * 2019-12-25 2020-05-15 联想(北京)有限公司 一种语音信息处理方法、电子设备及存储介质
WO2020140840A1 (zh) * 2019-01-04 2020-07-09 优奈柯恩(北京)科技有限公司 用于唤醒可穿戴设备的方法及装置
CN114822521A (zh) * 2022-04-15 2022-07-29 广州易而达科技股份有限公司 一种音箱的唤醒方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201063914Y (zh) * 2007-06-29 2008-05-21 万音达科技有限公司 智能语音控制灯
CN102346430A (zh) * 2010-07-30 2012-02-08 鸿富锦精密工业(深圳)有限公司 具遥控功能的便携式电子装置
CN102436345A (zh) * 2011-10-31 2012-05-02 广州市动景计算机科技有限公司 一种移动设备界面操作控制的方法及实现装置
CN102890557A (zh) * 2011-07-19 2013-01-23 杜比实验室特许公司 用于响应于麦克风输出的触摸手势检测的方法和系统
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN103677198A (zh) * 2012-09-03 2014-03-26 联想(北京)有限公司 一种电子设备控制方法及电子设备
CN103680501A (zh) * 2013-12-23 2014-03-26 惠州Tcl移动通信有限公司 根据声音变化规律进行手势识别的方法、系统及手机

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201063914Y (zh) * 2007-06-29 2008-05-21 万音达科技有限公司 智能语音控制灯
CN102346430A (zh) * 2010-07-30 2012-02-08 鸿富锦精密工业(深圳)有限公司 具遥控功能的便携式电子装置
CN102890557A (zh) * 2011-07-19 2013-01-23 杜比实验室特许公司 用于响应于麦克风输出的触摸手势检测的方法和系统
CN102436345A (zh) * 2011-10-31 2012-05-02 广州市动景计算机科技有限公司 一种移动设备界面操作控制的方法及实现装置
CN103677198A (zh) * 2012-09-03 2014-03-26 联想(北京)有限公司 一种电子设备控制方法及电子设备
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN103680501A (zh) * 2013-12-23 2014-03-26 惠州Tcl移动通信有限公司 根据声音变化规律进行手势识别的方法、系统及手机

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718019A (zh) * 2014-12-01 2016-06-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN105096939A (zh) * 2015-07-08 2015-11-25 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN106814788A (zh) * 2015-12-01 2017-06-09 马维尔国际贸易有限公司 用于激活电路的装置和方法
CN105501121B (zh) * 2016-01-08 2018-08-03 北京乐驾科技有限公司 一种智能唤醒方法及系统
CN105501121A (zh) * 2016-01-08 2016-04-20 北京乐驾科技有限公司 一种智能唤醒方法及系统
CN105575220A (zh) * 2016-03-22 2016-05-11 深圳视感文化科技有限公司 一种交互式弦乐器教学系统
CN106098059B (zh) * 2016-06-23 2019-06-18 上海交通大学 可定制语音唤醒方法及系统
CN106098059A (zh) * 2016-06-23 2016-11-09 上海交通大学 可定制语音唤醒方法及系统
CN107170455A (zh) * 2017-05-31 2017-09-15 靖西市秀美边城农业科技有限公司 一种简单语音识别装置
WO2020140840A1 (zh) * 2019-01-04 2020-07-09 优奈柯恩(北京)科技有限公司 用于唤醒可穿戴设备的方法及装置
CN110070863A (zh) * 2019-03-11 2019-07-30 华为技术有限公司 一种语音控制方法及装置
CN110428835A (zh) * 2019-08-22 2019-11-08 深圳市优必选科技股份有限公司 一种语音设备的调节方法、装置、存储介质及语音设备
CN110428835B (zh) * 2019-08-22 2022-09-23 深圳市优必选科技股份有限公司 一种语音设备的调节方法、装置、存储介质及语音设备
CN111161714A (zh) * 2019-12-25 2020-05-15 联想(北京)有限公司 一种语音信息处理方法、电子设备及存储介质
CN114822521A (zh) * 2022-04-15 2022-07-29 广州易而达科技股份有限公司 一种音箱的唤醒方法、装置、设备及存储介质
CN114822521B (zh) * 2022-04-15 2023-07-11 广州易而达科技股份有限公司 一种音箱的唤醒方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN103956164A (zh) 一种声音唤醒方法及系统
CN204390737U (zh) 一种家庭语音处理系统
CN104867495B (zh) 声音辨识设备及其操作方法
CN107767863A (zh) 语音唤醒方法、系统及智能终端
CN105704298A (zh) 声音唤醒侦测装置与方法
CN204791954U (zh) 一种家居智能机器人的语音交互系统
CN103729193A (zh) 一种人机交互方法及装置
CN101452290B (zh) 基于语音识别和无线传感网的智能家电控制系统
CN103745723A (zh) 一种音频信号识别方法及装置
CN203882609U (zh) 基于语音激活检测的唤醒装置
CN105182763A (zh) 一种基于语音识别的智能遥控器及实现方法
CN104503321A (zh) 一种适用于体感或声音控制的超低功耗无线智能控制系统
CN102023604A (zh) 一种输电线路智能防外力破坏在线监测系统
CN205232214U (zh) 一种具有实时语音记录与提醒功能的可穿戴智能设备
CN104657104A (zh) 一种面向pc的嵌入式非特定语音沟通系统
CN104361887A (zh) 行车噪声环境下的快速声学事件检测系统
CN110970020A (zh) 一种利用声纹提取有效语音信号的方法
CN104952446A (zh) 基于语音交互的数字楼盘展示系统
CN204856459U (zh) 可识别声源位置的关键词语音唤醒系统及移动终端
CN102693721A (zh) 简易语音性别检测装置及方法
CN204945699U (zh) 一种具有红外感应识别的智能音响
CN111179924B (zh) 一种基于模式切换的唤醒性能优化的方法及系统
CN105430155A (zh) 穿戴设备及其基于语音信号的控制方法
CN203167204U (zh) 一种声控话筒
CN204013463U (zh) 一种单火线供电非特定人声识别的开关电路

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140730