WO2018095035A1

WO2018095035A1 - 耳机及其语音识别方法

Info

Publication number: WO2018095035A1
Application number: PCT/CN2017/090776
Authority: WO
Inventors: 赵燕鹏; 谢萍
Original assignee: 歌尔股份有限公司
Priority date: 2016-11-24
Filing date: 2017-06-29
Publication date: 2018-05-31
Also published as: CN106601272A; CN106601272B

Abstract

一种耳机及其语音识别方法，其中的耳机语音识别方法包括：信号采集模块采集环境中的环境声音信号，并将所采集到的环境声音信号传递至信号处理模块进行判断识别（S110）；信号处理模块接收环境声音信号并判断环境声音信号是否为非持续性环境噪声信号（S120），当环境声音信号为非持续性环境噪声信号时，进一步判断环境声音信号是否为目标信号（S130），当环境声音信号为目标信号时，信号处理模块控制当前播放信号关闭，并将目标信号放大经耳机的发声单元发出（S140）。能够在用户佩戴耳机听音的同时，获取外界环境中有用的声音信号。

Description

耳机及其语音识别方法

技术领域

本发明涉及声学技术领域，更为具体地，涉及一种耳机及其语音识别方法。

背景技术

随着高品质智能手机、Pad等便携式电子产品的广泛应用，人们对可与其配合应用的耳机的要求也越来越高，在要求其体形小巧的同时，还要求其具备能够逼真再现各种音效的高保真音质性能。此外，无论上述何种电子产品，为了让使用者在不干扰旁人的状况下聆听电子产品所提供的声音信号，耳机已经成为各电子产品的必要配件，此外耳机也提供了聆听者较佳的声音传输，使聆听者能清楚的听到及了解声音内容。

但是，大部分用户都有一边佩戴耳机听音乐，一边工作、运动或者进行其他活动的习惯。由于耳机的主动降噪或者被动降噪效果较好，当有用的外部语音信号出现时，例如同事呼喊耳机佩戴者，或者运动时周围路人提醒安全信息等，耳机佩戴者往往不能马上听到这些信息，从而导致信息沟通不畅，甚或由于接听不到关键信息而导致意外事故发生。

现有技术中，部分耳机产品会通过存储部分关键词对相应情况下的有用语音信号进行接收并提醒；但是，这种方案存在的主要缺点有：需要设置储存模块或者存储库等存储装置对关键词进行预设保存；另外，关键词的存储有限，无法满足实际的应用需求，算法复杂、成本较高。

发明内容

鉴于上述问题，本发明的目的是提供一种耳机及其语音识别方法，以解决目前用户在佩戴耳机过程中，无法接收环境中的声音信号，造成沟通不畅，甚至意外事故的发生等问题。

根据本发明的一个方面，提供一种耳机语音识别方法，在耳机内设置有拾取声音信号的信号采集模块，语音识别方法包括：信号采集模块采集环境声音信号，并将所采集到的环境声音信号传递至信号处理模块进行判断识别；信号处理模块接收环境声音信号并判断环境声音信号是否为非持续性环境噪声信号，当环境声音信号为非持续性环境噪声信号时，进一步判断环境声音信号是否为目标信号，当环境声音信号为目标信号时，信号处理模块控制当前播放信号关闭，并将目标信号放大经耳机的发声单元发出；其中，非持续性环境噪声信号指的是，在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号；或者，和当前持续性环境噪声信号有较大区别的声音信号；信号特征包括频率、幅度和能量。

此外，优选的方案是，在判断所述环境声音信号是否为非持续性环境噪声信号的过程中，当环境声音信号为持续性环境噪声信号时，不进行预警处理并结束对环境声音信号的语音识别。

此外，优选的方案是，在判断环境声音信号是否为目标信号的过程中，当确认环境声音信号不是目标信号时，不进行预警处理并结束对环境声音信号的语音识别。

此外，优选的方案是，目标信号为间断性的重复信号，在判断所述环境声音信号是否为目标信号的过程中，当第一次接收到环境声音信号时，所述信号处理模块识别该环境声音信号，当再次接收到第一次接收的环境声音信号的重复信号时，所述信号处理模块识别出重复信号作为目标信号。

此外，优选的方案是，在信号处理模块控制当前播放信号关闭的过程中，信号处理模块同时关闭耳机的降噪功能。

此外，优选的方案是，信号处理模块为CPU、MPU或者DSP芯片。

此外，优选的方案是，信号采集模块为单颗麦克风或者麦克风阵列。

根据本发明的另一方面，提供一种耳机，其特征在于，包括：信号采集模块，用于采集周围环境中的环境声音信号；信号处理模块，用于接收环境声音信号并判断所述环境声音信号是否为非持续性环境噪声信号，当所述环境声音信号为非持续性环境噪声信号时，进一步判断环境声音信号是否为目标信号；当环境声音信号为目标信号时，控制当前播放信号关闭，将目标信号放大并经耳机的发声单元发出，其中，所述非持续性环境噪声信号指的是，在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号；或者，和当前持续性环境噪声信号有较大区别的声音信号；所述信号特征包括频率、幅度和能量。

此外，优选的方案是，在所述信号处理模块判断所述环境声音信号是否为非持续性环境噪声信号的过程中，当所述环境声音信号为持续性环境噪声信号时，不进行预警处理并结束对环境声音信号的语音识别。并且，在所述信号处理模块判断所述环境声音信号是否为目标信号的过程中，当所述环境声音信号不是目标信号时，不进行预警处理并结束对环境声音信号的语音识别。

此外，优选的方案是，所述目标信号为间断性的重复信号，在所述信号处理模块判断所述环境声音信号是否为目标信号的过程中，当第一次接收到环境声音信号时，所述信号处理模块识别该环境声音信号，当再次接收到第一次接收的环境声音信号的重复信号时，所述信号处理模块识别出重复信号作为目标信号。

利用上述根据本发明的耳机及其语音识别方法，在耳机正常使用过程中，能够同时采集外界环境中的声音信号，并对环境声音信号进行实时处理，获取目标信号；然后，关闭耳机当前播放内容，将符合要求的目标信号放大并经耳机发出，使用户无需摘除耳机即可清晰听到外界信号。

为了实现上述以及相关目的，本发明的一个或多个方面包括后面将详细说明的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而，这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外，本发明旨在包括所有这些方面以及它们的等同物。

附图说明

通过参考以下结合附图的说明，并且随着对本发明的更全面理解，本发明的其它目的及结果将更加明白及易于理解。在附图中：

图1为根据本发明实施例的耳机语音识别方法流程图一；

图2为根据本发明实施例的耳机语音识别方法流程图二。

在所有附图中相同的标号指示相似或相应的特征或功能。

具体实施方式

在下面的描述中，出于说明的目的，为了提供对一个或多个实施例的全面理解，阐述了许多具体细节。然而，很明显，也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中，为了便于描述一个或多个实施例，公知的结构和设备以方框图的形式示出。

为详细描述本发明实施例的耳机及其语音识别方法，以下将结合附图对本发明的具体实施例进行详细描述。

图1示出了根据本发明实施例的耳机语音识别方法流程。

如图1所示，本发明实施例的耳机语音识别方法，首先要在耳机内设置用于拾取声音信号的信号采集模块，耳机语音识别方法包括：

S110：信号采集模块采集环境中的环境声音信号，并将所采集到的环境声音信号传递至信号处理模块进行判断识别。

S120：信号处理模块接收环境声音信号并判断环境声音信号是否为非持续性环境噪声信号。

其中，当信号处理模块判断环境声音信号为非持续性环境噪声信号时，执行步骤S130：否则，执行步骤S150。

S130：确认环境声音信号为非持续性环境噪声信号后，进一步判断该环境声音信号是否为目标信号；当环境声音信号为目标信号时，执行步骤S140；否则，执行步骤S150。

S140：信号处理模块控制当前耳机播放信号关闭，并将目标信号进行放大，放大后的目标信号经耳机的发声单元发出，并被用户拾取。

S150：不进行预警处理，并结束对当前环境声音信号的语音识别。

在S150中，结束对当前环境声音信号的语音识别并不是指就此停止语音识别。实际上，环境声音信号的语音识别应持续或间隔进行。

可知，本发明实施例的目标信号是非持续性环境噪声信号，从而将环境中持续性噪声信号与目标信号进行区分，确认最终的目标信号再传输至人耳内。其中，非持续性环境噪声信号指的是在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号；或者，和当前持续性环境噪声信号有较大区别的声音信号，其中的信号特征包括频率、幅度或者能量等。此外，也可根据环境噪声信号的波形特征区别其是否为持续性环境噪声信号或者非持续性环境噪声信号；其中，波形特征参数包括：幅值、相位、频率谱、能量谱、持续时间、上升时间等。

在本发明的一个具体实施方式中，信号处理模块确认最终的目标信号后，需要将目标信号传输至用户人耳，使用户在免摘除耳机的情况下，接收外界环境中的声音信号。因此，信号处理模块会关闭耳机当前播放信号，当耳机具备降噪等功能时，会同时关闭该降噪功能等，以确保目标信号能够清晰、准确的被用户拾取。

具体地，图2示出了根据本发明实施例的耳机语音识别方法的详细流程。如图2所示，本发明实施例的耳机语音识别方法，包括如下所示步骤：

S210：通过耳机内置的麦克风采集用户周围环境中的声音信号作为环境声音信号。

S220：将麦克风采集到的环境声音信号传输至信号处理模块，信号处理模块对环境声音信号进行识别判断。

S230：信号处理模块识别出环境声音信号为环境中的持续性噪声信号后，执行步骤S270，不进行预警处理，并结束对当前环境声音信号的语音识别。

S240：信号处理模块识别出环境声音信号为非持续性环境噪声信号后，需进一步对环境声音信号进行是否为目标信号进行判断。

S250：环境声音信号为非持续性环境噪声信号，但同时为非重复信号，可确认当前环境声音信号不是目标信号，并执行步骤S270，不进行预警处理，并结束对当前环境声音信号的语音识别。

S260：环境声音信号为非持续性环境噪声信号，同时为重复信号，则确认当前环境声音信号为目标信号，并执行步骤S280。

S280：信号处理模块关闭当前耳机的播放信号，将目标信号放大并经过耳机的发声单元发出，确保用户拾取到外界间断性的重复信号。

可知，本发明实施例的目标信号为间断性的重复信号，在判断所述环境声音信号是否为目标信号的过程中，当第一次接收到环境声音信号时，所述信号处理模块识别该环境声音信号，当再次接收到第一次接收的环境声音信号的重复信号时，所述信号处理模块识别出重复信号作为目标信号。

作为示例，目标信号可以为外界重复的应激人声(例如，呼喊信号、名字信号)、报警信号(例如，喇叭信号、鸣笛信号)、危险动物声音信号等等。

具体地，对外界具备目标特性的信号，比如重复的名字，外界出现某人名字时，其第一声名字信号就传递至信号处理模块进行处理识别，在第二声传递至信号处理模块后，即可识别出是具有目标特性的声信号，此时，信号处理模块会将原先在播放的声音信号关闭，同时将麦克风接收到的名字信号放大后经发音单元发送到人耳。

与上述耳机语音识别方法相对应，本发明还提供一种耳机装置，利用耳机语音识别方法对外界环境中的目标信号进行及时拾取并发出提醒，确保用户能够在佩戴耳机听音的同时，捕捉外界中的有用目标信息。

具体地，耳机包括信号采集模块，用于采集周围环境中的环境声音信号；信号处理模块，用于接收环境声音信号并判断所述环境声音信号是否为非持续性环境噪声信号，当所述环境声音信号为非持续性环境噪声信号时，进一步判断环境声音信号是否为目标信号；当环境声音信号为目标信号时，控制当前播放信号关闭，并将目标信号放大并经耳机的发声单元发出，其中，所述非持续性环境噪声信号指的是，在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号；或者，和当前持续性环境噪声信号有较大区别的声音信号；所述信号特征包括频率、幅度和能量。

其中，在所述信号处理模块判断所述环境声音信号是否为非持续性环境噪声信号的过程中，当所述环境声音信号为持续性环境噪声信号时，不进行预警处理并结束对环境声音信号的语音识别。并且，在所述信号处理模块判断环境声音信号是否为目标信号时，当环境声音信号不是目标信号时，不进行预警处理并结束对环境声音信号的语音识别。确认目标信号后，信号处理模块会控制当前耳机播放信号关闭，并将目标信号进行放大，放大后的目标信号经耳机的发声单元发送至人耳。

可知，本发明实施例的目标信号为间断性的重复信号，在判断所述环境声音信号是否为目标信号的过程中，当第一次接收到环境声音信号时，所述信号处理模块识别该环境声音信号，当再次接收到第一次接收的环境声音信号的重复信号时，所述信号处理模块识别出重复信号作为目标信号。另外，在本发明实施例的耳机语音识别方法中，信号采集模块可以为单颗麦克风或者两颗以上的麦克风阵列；信号处理模块可以为CPU(Central Processing Unit，中央处理器)、MPU(Microprocessor Unit，微处理器)、DSP(Digital signal processor，数字信号处理)芯片或者具有存储功能的控制芯片等，用于实现语音识别的算法可以存在控制芯片内，用户在佩戴耳机时，保证环境中间断性的重复信号可被人耳清晰的捕捉到。

通过上述实施方式可以看出，本发明提供的耳机及其语音识别方法，能够识别出具有目标特性的环境信号并放大输出，可简化语音识别的算法，及时对环境中的信号进行捕捉，提醒或者预警用户获取有用信息或者规避危险，满足用户多样性的耳机需求。

如上参照附图以示例的方式描述根据本发明的耳机及其语音识别方法。但是，本领域技术人员应当理解，对于上述本发明所提出的耳机及其语音识别方法，还可以在不脱离本发明内容的基础上做出各种改进。因此，本发明的保护范围应当由所附的权利要求书的内容确定。

Claims

一种耳机语音识别方法，其特征在于，在所述耳机内设置有拾取声音信号的信号采集模块，所述语音识别方法包括：

所述信号采集模块采集环境中的环境声音信号，并将所采集到的环境声音信号传递至信号处理模块进行判断识别；

所述信号处理模块接收所述环境声音信号并判断所述环境声音信号是否为非持续性环境噪声信号，当所述环境声音信号为非持续性环境噪声信号时，进一步判断所述环境声音信号是否为目标信号，当所述环境声音信号为目标信号时，所述信号处理模块控制当前播放信号关闭，并将所述目标信号放大经耳机的发声单元发出；其中，

所述非持续性环境噪声信号指的是，在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号；或者，和当前持续性环境噪声信号有较大区别的声音信号；所述信号特征包括频率、幅度和能量。
如权利要求1所述的耳机语音识别方法，其特征在于，

在判断所述环境声音信号是否为非持续性环境噪声信号的过程中，当所述环境声音信号为持续性环境噪声信号时，不进行预警处理并结束对所述环境声音信号的语音识别。
如权利要求1所述的耳机语音识别方法，其特征在于，在判断所述环境声音信号是否为目标信号的过程中，

当所述环境声音信号不是目标信号时，不进行预警处理并结束对所述环境声音信号的语音识别。
如权利要求1所述的耳机语音识别方法，其特征在于，

所述目标信号为间断性的重复信号，在判断所述环境声音信号是否为目标信号的过程中，当第一次接收到环境声音信号时，所述信号处理模块识别该环境声音信号，当再次接收到第一次接收的环境声音信号的重复信号时，所述信号处理模块识别出重复信号作为目标信号。
如权利要求1所述的耳机语音识别方法，其特征在于，在所述信号处理模块控制当前播放信号关闭的过程中，

所述信号处理模块同时关闭所述耳机的降噪功能。
一种耳机，其特征在于，包括：

信号采集模块，用于采集周围环境中的环境声音信号；

信号处理模块，用于接收所述环境声音信号并判断所述环境声音信号是否为非持续性环境噪声信号，当所述环境声音信号为非持续性环境噪声信号时，进一步判断所述环境声音信号是否为目标信号；当所述环境声音信号为目标信号时，控制当前播放信号关闭，将所述目标信号放大并经耳机的发声单元发出，其中，所述非持续性环境噪声信号指的是，在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号；或者，和当前持续性环境噪声信号有较大区别的声音信号；所述信号特征包括频率、幅度和能量。
如权利要求6所述的耳机，其特征在于，

在所述信号处理模块判断所述环境声音信号是否为非持续性环境噪声信号的过程中，当所述环境声音信号为持续性环境噪声信号时，不进行预警处理并结束对所述环境声音信号的语音识别，

并且，在所述信号处理模块判断所述环境声音信号是否为目标信号的过程中，当所述环境声音信号不是目标信号时，不进行预警处理并结束对所述环境声音信号的语音识别。
如权利要求6所述的耳机，其特征在于，所述目标信号为间断性的重复信号，在所述信号处理模块判断所述环境声音信号是否为目标信号的过程中，当第一次接收到环境声音信号时，所述信号处理模块识别该环境声音信号，当再次接收到第一次接收的环境声音信号的重复信号时，所述信号处理模块识别出重复信号作为目标信号。
如权利要求6所述的耳机，其特征在于，

所述信号处理模块为CPU、MPU或者DSP芯片。
如权利要求6所述的耳机，其特征在于，

所述信号采集模块为单颗麦克风或者麦克风阵列。