CN109920433A - 嘈杂环境下电子设备的语音唤醒方法 - Google Patents

嘈杂环境下电子设备的语音唤醒方法 Download PDF

Info

Publication number
CN109920433A
CN109920433A CN201910208530.8A CN201910208530A CN109920433A CN 109920433 A CN109920433 A CN 109920433A CN 201910208530 A CN201910208530 A CN 201910208530A CN 109920433 A CN109920433 A CN 109920433A
Authority
CN
China
Prior art keywords
angle
wake
setting
recording
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910208530.8A
Other languages
English (en)
Other versions
CN109920433B (zh
Inventor
朱建强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hua Zhen Electronic Technology Co Ltd
Original Assignee
Shanghai Hua Zhen Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hua Zhen Electronic Technology Co Ltd filed Critical Shanghai Hua Zhen Electronic Technology Co Ltd
Priority to CN201910208530.8A priority Critical patent/CN109920433B/zh
Publication of CN109920433A publication Critical patent/CN109920433A/zh
Application granted granted Critical
Publication of CN109920433B publication Critical patent/CN109920433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种嘈杂环境下电子设备的语音唤醒方法,利用带有n组语音输入组件的电子设备,包括录音步骤、录音处理步骤、唤醒判断步骤以及语音识别步骤;唤醒判断步骤具体是指根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别步骤,若唤醒参数不属于设定唤醒集合,则返回录音步骤。其中,第二信号为录音处理步骤得到的经过预处理的声音信号,n为不小于2的整数;本发明具有步骤简便、计算量小、唤醒率高的优点,能够解决嘈杂环境下、或者多人说话时语音唤醒率过低的问题,以及双麦声源定位角度不够准确问题。

Description

嘈杂环境下电子设备的语音唤醒方法
技术领域
本发明涉及语音识别技术领域,具体地,涉及一种嘈杂环境下电子设备的语音唤醒方法,尤其涉及一种提高双麦克风阵列设备在嘈杂环境下语音唤醒率的方法。
背景技术
语音唤醒是指用户通过说出唤醒词来唤醒电子设备,使电子设备进入到等待语音指令的状态。比如语音唤醒应用于家电上,这样用户不需要手动操作即可控制家电了。
目前双麦阵列的语音智能家电,语音唤醒是这样实现的,待唤醒时,180度拾音,不做波束形成,用户说唤醒词后,通过双麦麦阵计算出说话者角度,然后对此角度做增强波束计算,对波束内的声音做语音增强,并对波束以外的声音进行抑制,再将增强波束计算后的录音送到语音识别引擎计算,语音识别后,释放波束角度,等待再次唤醒。例如专利文献CN108389587A公开的一种基于语音唤醒技术的语音增强器,包括由两个以上麦克风组成的麦克风阵列、用于将所述麦克风阵列拾取的语音进行信号放大处理的放大模块、用于将所述放大后的语音信号进行取样处理的动态信号取样模块;还包括用于将动态信号取样的语音信号进行设定音框的线性差异处理模块、用于将经过线性差异处理后的语音信号进行滤波处理的自适应滤波模块、用于增强滤波后的语音信号的语音增强模块、用于确定音源位置的TDOA计算模块及网络通信模块。
此方法虽然可以对唤醒后的录音做波束降噪,但是待唤醒时由于释放了波束角度,并没有做波束降噪,所以周围有一些噪音或者有人说话时,会大幅降低语音唤醒率。另外由于双麦声源定位的角度不够准确,会导致唤醒后波束降噪反而会抑制说话者的声音,语音识别计算准确率反而下降。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种嘈杂环境下电子设备的语音唤醒方法。
根据本发明提供的一种嘈杂环境下电子设备的语音唤醒方法,利用带有n组语音输入组件的电子设备,包括录音步骤、录音处理步骤、唤醒判断步骤以及语音识别步骤;
录音步骤:利用本地的语音输入组件,接收并录制设定的音频作为第一信号;
声学处理步骤:对第一信号进行声学预处理,并将声学预处理得到的结果作为第二信号;
唤醒判断步骤:根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别步骤,若唤醒参数不属于设定唤醒集合,则返回录音步骤;
语音识别步骤:将属于设定唤醒集合的唤醒参数对应的第二信号发送至语音识别模块,并按照设定的方法进行语音识别;
其中,n为不小于2的整数;所述预处理包括增强波束计算;所述增强波束计算是指在某个指定角度,形成定向拾音波束,即对指定角度的波束内的声音做语音增强,并对波束以外的声音进行抑制。
优选地,所述语音输入组件包括麦克风阵列;所述语音识别模块设置在本地和/或云端。
优选地,所述录音步骤还包括使用者角度计算子步骤;
使用者角度计算子步骤:n组语音输入组件分别采集n组录音,并将这n组录音分别记为Mi,i=1,2…n,根据Mi录音的时间差和相位差计算使用者角度A0
优选地,所述声学处理步骤还包括增强计算子步骤;
增强计算子步骤:将设定的拾音区域分为l个波束区域,并将这l个波束区域分别记为Dj,j=1,2…l,分别选取Dj范围内的中心角度值Dj′作为Dj的代表角度,n组录音Mi分别对l个波束区域代表角度Dj′做指定角度增强波束计算,得到对应于l个波束区域代表角度Dj′的l个增强信号Sj
优选地,所述唤醒判断步骤还包括唤醒识别子步骤;
唤醒识别子步骤:根据对应于l个波束区域代表角度Dj′的l个增强信号Sj,通过设定的方法分别求出l个唤醒识别计算时的识别分值Fj,取Fj的最大值Fmax作为唤醒参数,若Fmax≥F,则判断为已唤醒并进入语音识别步骤,若Fmax<F,则判断结果为未唤醒并返回录音步骤;
其中,F为设定的唤醒识别阈值。
优选地,所述语音识别步骤还包括使用者角度确定子步骤;
使用者角度确定子步骤;判断使用者角度A0是否属于Fj的最大值Fmax所对应的波束区域Djmax,如果A0∈Djmax,则输出A0作为确定的使用者角度A,否则,则将波束区域Djmax的代表角度Djmax′作为更新后确定的使用者角度A。
优选地,所述语音识别步骤还包括识别语音预优化子步骤;
识别语音预优化子步骤:将n组语音输入组件分别采集的n组录音Mi,针对确定的使用者角度A做指定角度的增强波束,得到第三信号,并将第三信号发送至语音识别模块按照设定的方法进行语音识别。
根据本发明提供的一种嘈杂环境下电子设备的语音唤醒系统,利用带有n组语音输入组件的电子设备,包括录音模块、录音处理模块、唤醒判断模块以及语音识别模块;
录音模块:利用本地的语音输入组件,接收并录制设定的音频作为第一信号;
声学处理模块:对第一信号进行声学预处理,并将声学预处理得到的结果作为第二信号;
唤醒判断模块:根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别模块,若唤醒参数不属于设定唤醒集合,则返回录音模块;
语音识别模块:将属于设定唤醒集合的唤醒参数对应的第二信号发送至语音识别模块,并按照设定的方法进行语音识别;
其中,n为不小于2的整数;所述预处理包括增强波束计算;所述增强波束计算是指在某个指定角度,形成定向拾音波束,即对指定角度的波束内的声音做语音增强,并对波束以外的声音进行抑制)。
优选地,所述语音输入组件包括麦克风阵列;所述语音识别模块设置在本地和/或云端;
所述录音模块还包括使用者角度计算子模块;
使用者角度计算子模块:n组语音输入组件分别采集n组录音,并将这n组录音分别记为Mi,i=1,2…n,根据Mi录音的时间差和相位差计算使用者角度A0
所述声学处理模块还包括增强计算子模块;
增强计算子模块:将设定的拾音区域分为l个波束区域,并将这l个波束区域分别记为Dj,j=1,2…l,分别选取Dj范围内的中心角度值D′j作为Dj的代表角度,n组录音Mi分别对l个波束区域代表角度D′j做指定角度增强波束计算,得到对应于l个波束区域代表角度D′j的l个增强信号Sj
所述唤醒判断模块还包括唤醒识别子模块;
唤醒识别子模块:根据对应于l个波束区域代表角度Dj′的l个增强信号Sj,通过设定的方法分别求出l个唤醒识别计算时的识别分值Fj,取Fj的最大值Fmax作为唤醒参数,若Fmax≥F,则判断为已唤醒并进入语音识别模块,若Fmax<F,则判断结果为未唤醒并返回录音模块;
其中,F为设定的唤醒识别阈值;
所述语音识别模块还包括使用者角度确定子模块;
使用者角度确定子模块;判断使用者角度A0是否属于Fj的最大值Fmax所对应的波束区域Djmax,如果A0∈Djmax,则输出A0作为确定的使用者角度A,否则,则将波束区域Djmax的代表角度D′jmax作为更新后确定的使用者角度A;
所述语音识别模块还包括识别语音预优化子模块;
识别语音预优化子模块:将n组语音输入组件分别采集的n组录音Mi,针对确定的使用者角度A做指定角度的增强波束,得到第三信号,并将第三信号发送至语音识别模块按照设定的方法进行语音识别。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的嘈杂环境下电子设备的语音唤醒方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
1、本发明提供的嘈杂环境下电子设备的语音唤醒方法,具有步骤简便、计算量小、唤醒率高的优点;
2、本发明提供的嘈杂环境下电子设备的语音唤醒方法,能够解决嘈杂环境下、或者多人说话时语音唤醒率过低的问题;
3、本发明提供的嘈杂环境下电子设备的语音唤醒方法,能够解决双麦声源定位角度不够准确,唤醒后波束降噪抑制说话者的声音,使得语音识别计算准确率反而下降的问题。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的嘈杂环境下电子设备的语音唤醒方法优选例的第一流程示意图;
图2为本发明提供的嘈杂环境下电子设备的语音唤醒方法优选例的波束区域分解示意图;
图3为本发明提供的嘈杂环境下电子设备的语音唤醒方法优选例的第二流程示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
根据本发明提供的一种嘈杂环境下电子设备的语音唤醒方法,利用带有n组语音输入组件的电子设备,包括录音步骤、录音处理步骤、唤醒判断步骤以及语音识别步骤;
录音步骤:利用本地的语音输入组件,接收并录制设定的音频作为第一信号;
声学处理步骤:对第一信号进行声学预处理,并将声学预处理得到的结果作为第二信号;
唤醒判断步骤:根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别步骤,若唤醒参数不属于设定唤醒集合,则返回录音步骤;
语音识别步骤:将属于设定唤醒集合的唤醒参数对应的第二信号发送至语音识别模块,并按照设定的方法进行语音识别;
其中,n为不小于2的整数;所述预处理包括增强波束计算;所述增强波束计算是指在某个指定角度,形成定向拾音波束,即对指定角度的波束内的声音做语音增强,并对波束以外的声音进行抑制。
具体地,所述语音输入组件包括麦克风阵列;所述语音识别模块设置在本地和/或云端。所述录音步骤还包括使用者角度计算子步骤;
使用者角度计算子步骤:n组语音输入组件分别采集n组录音,并将这n组录音分别记为Mi,i=1,2…n,根据Mi录音的时间差和相位差计算使用者角度A0
所述声学处理步骤还包括增强计算子步骤;
增强计算子步骤:将设定的拾音区域分为l个波束区域,并将这l个波束区域分别记为Dj,j=1,2…l,分别选取Dj范围内的中心角度值Dj′作为Dj的代表角度,n组录音Mi分别对l个波束区域代表角度Dj′做指定角度增强波束计算,得到对应于l个波束区域代表角度Dj′的l个增强信号Sj
所述唤醒判断步骤还包括唤醒识别子步骤;
唤醒识别子步骤:根据对应于l个波束区域代表角度Dj′的l个增强信号Sj,通过设定的方法分别求出l个唤醒识别计算时的识别分值Fj,取Fj的最大值Fmax作为唤醒参数,若Fmax≥F,则判断为已唤醒并进入语音识别步骤,若Fmax<F,则判断结果为未唤醒并返回录音步骤;
其中,F为设定的唤醒识别阈值。
所述语音识别步骤还包括使用者角度确定子步骤;
使用者角度确定子步骤;判断使用者角度A0是否属于Fj的最大值Fmax所对应的波束区域Djmax,如果A0∈Djmax,则输出A0作为确定的使用者角度A,否则,则将波束区域Djmax的代表角度Djmax′作为更新后确定的使用者角度A。
更具体地,所述语音识别步骤还包括识别语音预优化子步骤;
识别语音预优化子步骤:将n组语音输入组件分别采集的n组录音Mi,针对确定的使用者角度A做指定角度的增强波束,得到第三信号,并将第三信号发送至语音识别模块按照设定的方法进行语音识别。
根据本发明提供的一种嘈杂环境下电子设备的语音唤醒系统,利用带有n组语音输入组件的电子设备,包括录音模块、录音处理模块、唤醒判断模块以及语音识别模块;
录音模块:利用本地的语音输入组件,接收并录制设定的音频作为第一信号;
声学处理模块:对第一信号进行声学预处理,并将声学预处理得到的结果作为第二信号;
唤醒判断模块:根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别模块,若唤醒参数不属于设定唤醒集合,则返回录音模块;
语音识别模块:将属于设定唤醒集合的唤醒参数对应的第二信号发送至语音识别模块,并按照设定的方法进行语音识别;
其中,n为不小于2的整数;所述预处理包括增强波束计算;所述增强波束计算是指在某个指定角度,形成定向拾音波束,即对指定角度的波束内的声音做语音增强,并对波束以外的声音进行抑制)。
所述语音输入组件包括麦克风阵列;所述语音识别模块设置在本地和/或云端;
所述录音模块还包括使用者角度计算子模块;
使用者角度计算子模块:n组语音输入组件分别采集n组录音,并将这n组录音分别记为Mi,i=1,2…n,根据Mi录音的时间差和相位差计算使用者角度A0
所述声学处理模块还包括增强计算子模块;
增强计算子模块:将设定的拾音区域分为l个波束区域,并将这l个波束区域分别记为Dj,j=1,2…l,分别选取Dj范围内的中心角度值D′j作为Dj的代表角度,n组录音Mi分别对l个波束区域代表角度D′j做指定角度增强波束计算,得到对应于l个波束区域代表角度D′j的l个增强信号Sj
所述唤醒判断模块还包括唤醒识别子模块;
唤醒识别子模块:根据对应于l个波束区域代表角度Dj′的l个增强信号Sj,通过设定的方法分别求出l个唤醒识别计算时的识别分值Fj,取Fj的最大值Fmax作为唤醒参数,若Fmax≥F,则判断为已唤醒并进入语音识别模块,若Fmax<F,则判断结果为未唤醒并返回录音模块;
其中,F为设定的唤醒识别阈值;
所述语音识别模块还包括使用者角度确定子模块;
使用者角度确定子模块;判断使用者角度A0是否属于Fj的最大值Fmax所对应的波束区域Djmax,如果A0∈Djmax,则输出A0作为确定的使用者角度A,否则,则将波束区域Djmax的代表角度D′jmax作为更新后确定的使用者角度A;
所述语音识别模块还包括识别语音预优化子模块;
识别语音预优化子模块:将n组语音输入组件分别采集的n组录音Mi,针对确定的使用者角度A做指定角度的增强波束,得到第三信号,并将第三信号发送至语音识别模块按照设定的方法进行语音识别。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的嘈杂环境下电子设备的语音唤醒方法的步骤。
进一步地,本发明的优选例涉及到语音处理领域,针对上述语音唤醒时出现的两个问题,在待唤醒时的语音唤醒的录音也做波束降噪,同时修正双麦声源定位时角度不准,从而大幅提高双麦克风阵列设备在嘈杂环境下的语音唤醒率。本发明优选例的技术方案中,双麦麦阵180度拾音,180度分为三个波束区域,分别为波束区域D1、D2、D3,每个拾音波束区域对应60°的范围。指定角度增强波束是指在某个指定角度,形成定向拾音波束,对波束内的声音做语音增强,并对波束以外的声音进行抑制,可以大幅提升远场拾音质量,抑制周围的噪音。
更进一步地,本发明的优选例技术方案包括如下步骤:
1、将双麦180度拾音区域,分为3个波束区域(如图2所示,对应的角度范围:D1为0~60度,D2为60~120度,D3为120~180度),将3个波束中心角度(即30度、90度、150度)分别作为D1、D2、D3对应的代表角度D1′、D2′、D3′。
2、说话者说出语音唤醒词时,双麦阵列计算出说话者角度A0,并将两路录音分别去做3个波束中心角度(30度、90度、150度)的增强波束计算,输出的3个增强信号S1、S2以及S3,再送到语音唤醒引擎计算,输出3个唤醒识别分值F1、F2、F3,取出最高的那个唤醒识别分值Fmax
3、如果最高唤醒识别分值大于等于唤醒识别阈值,则判为唤醒,如果此最高唤醒识别分值低于唤醒识别阈值,则判为未唤醒。判为唤醒时。如果说话者角度A0在此唤醒识别分值对应的波束区域的角度范围内,则输出A0角度,如果A0不在此唤醒识别分值对应的波束区域的角度范围内,则输出唤醒识别分值对应的波束中心角度。
4、双麦的两路录音对输出的角度做增强波束计算,将处理后的录音送到语音识别引擎计算。语音识别计算后,再释放波束角度,进入待唤醒状态。
上述第2点,比如说话者在波束区域D2,周围噪音或者有人说话在波束区域D1,说话者的唤醒录音做说话者所在波束区域D2中心角度(90度)的增加波束计算后,周围噪音基本可以被抑制,说话者的声音会被增强,在唤醒识别计算中,唤醒识别分值肯定是三个增加波束计算后录音中最高的,确保能被唤醒。
如果双麦麦阵做声源定位时的说话者角度A0不够准确,比如说话者在波束区域D2,声源定位到波束区域D1,在上述第3点,说话者角度A0不在唤醒识别分值对应的波束区域的角度范围(60~120度)内,系统会舍弃掉A0角度,输出说话者所在波束区域D2中心角度90度。
在本申请的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种嘈杂环境下电子设备的语音唤醒方法,其特征在于,利用带有n组语音输入组件的电子设备,包括录音步骤、录音处理步骤、唤醒判断步骤以及语音识别步骤;
录音步骤:利用本地的语音输入组件,接收并录制设定的音频作为第一信号;
声学处理步骤:对第一信号进行声学预处理,并将声学预处理得到的结果作为第二信号;
唤醒判断步骤:根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别步骤,若唤醒参数不属于设定唤醒集合,则返回录音步骤;
语音识别步骤:将属于设定唤醒集合的唤醒参数对应的第二信号发送至语音识别模块,并按照设定的方法进行语音识别;
其中,n为不小于2的整数;所述预处理包括增强波束计算;所述增强波束计算是指在某个指定角度,形成定向拾音波束,即对指定角度的波束内的声音做语音增强,并对波束以外的声音进行抑制。
2.根据权利要求1所述的嘈杂环境下电子设备的语音唤醒方法,其特征在于,所述语音输入组件包括麦克风阵列;所述语音识别模块设置在本地和/或云端。
3.根据权利要求1所述的嘈杂环境下电子设备的语音唤醒方法,其特征在于,所述录音步骤还包括使用者角度计算子步骤;
使用者角度计算子步骤:n组语音输入组件分别采集n组录音,并将这n组录音分别记为Mi,i=1,2…n,根据Mi录音的时间差和相位差计算使用者角度A0
4.根据权利要求3所述的嘈杂环境下电子设备的语音唤醒方法,其特征在于,所述声学处理步骤还包括增强计算子步骤;
增强计算子步骤:将设定的拾音区域分为l个波束区域,并将这l个波束区域分别记为Dj,j=1,2…l,分别选取Dj范围内的中心角度值Dj′作为Dj的代表角度,n组录音Mi分别对l个波束区域代表角度Dj′做指定角度增强波束计算,得到对应于l个波束区域代表角度Dj′的l个增强信号Sj
5.根据权利要求4所述的嘈杂环境下电子设备的语音唤醒方法,其特征在于,所述唤醒判断步骤还包括唤醒识别子步骤;
唤醒识别子步骤:根据对应于l个波束区域代表角度Dj′的l个增强信号Sj,通过设定的方法分别求出l个唤醒识别计算时的识别分值Fj,取Fj的最大值Fmax作为唤醒参数,若Fmax≥F,则判断为已唤醒并进入语音识别步骤,若Fmax<F,则判断结果为未唤醒并返回录音步骤;
其中,F为设定的唤醒识别阈值。
6.根据权利要求5所述的嘈杂环境下电子设备的语音唤醒方法,其特征在于,所述语音识别步骤还包括使用者角度确定子步骤;
使用者角度确定子步骤;判断使用者角度A0是否属于Fj的最大值Fmax所对应的波束区域Djmax,如果A0∈Djmax,则输出A0作为确定的使用者角度A,否则,则将波束区域Djmax的代表角度Djmax′作为更新后确定的使用者角度A。
7.根据权利要求6所述的嘈杂环境下电子设备的语音唤醒方法,其特征在于,所述语音识别步骤还包括识别语音预优化子步骤;
识别语音预优化子步骤:将n组语音输入组件分别采集的n组录音Mi,针对确定的使用者角度A做指定角度的增强波束,得到第三信号,并将第三信号发送至语音识别模块按照设定的方法进行语音识别。
8.一种嘈杂环境下电子设备的语音唤醒系统,其特征在于,利用带有n组语音输入组件的电子设备,包括录音模块、录音处理模块、唤醒判断模块以及语音识别模块;
录音模块:利用本地的语音输入组件,接收并录制设定的音频作为第一信号;
声学处理模块:对第一信号进行声学预处理,并将声学预处理得到的结果作为第二信号;
唤醒判断模块:根据第二信号按照设定的方法计算唤醒参数,并判断唤醒参数是否属于设定唤醒集合,若唤醒参数属于设定唤醒集合,则进入语音识别模块,若唤醒参数不属于设定唤醒集合,则返回录音模块;
语音识别模块:将属于设定唤醒集合的唤醒参数对应的第二信号发送至语音识别模块,并按照设定的方法进行语音识别;
其中,n为不小于2的整数;所述预处理包括增强波束计算;所述增强波束计算是指在某个指定角度,形成定向拾音波束,即对指定角度的波束内的声音做语音增强,并对波束以外的声音进行抑制)。
9.根据权利要求8所述的嘈杂环境下电子设备的语音唤醒系统,其特征在于,所述语音输入组件包括麦克风阵列;所述语音识别模块设置在本地和/或云端;
所述录音模块还包括使用者角度计算子模块;
使用者角度计算子模块:n组语音输入组件分别采集n组录音,并将这n组录音分别记为Mi,i=1,2…n,根据Mi录音的时间差和相位差计算使用者角度A0
所述声学处理模块还包括增强计算子模块;
增强计算子模块:将设定的拾音区域分为l个波束区域,并将这l个波束区域分别记为Dj,j=1,2…l,分别选取Dj范围内的中心角度值D′j作为Dj的代表角度,n组录音Mi分别对l个波束区域代表角度D′j做指定角度增强波束计算,得到对应于l个波束区域代表角度D′j的l个增强信号Sj
所述唤醒判断模块还包括唤醒识别子模块;
唤醒识别子模块:根据对应于l个波束区域代表角度Dj′的l个增强信号Sj,通过设定的方法分别求出l个唤醒识别计算时的识别分值Fj,取Fj的最大值Fmax作为唤醒参数,若Fmax≥F,则判断为已唤醒并进入语音识别模块,若Fmax<F,则判断结果为未唤醒并返回录音模块;
其中,F为设定的唤醒识别阈值;
所述语音识别模块还包括使用者角度确定子模块;
使用者角度确定子模块;判断使用者角度A0是否属于Fj的最大值Fmax所对应的波束区域Djmax,如果A0∈Djmax,则输出A0作为确定的使用者角度A,否则,则将波束区域Djmax的代表角度D′jmax作为更新后确定的使用者角度A;
所述语音识别模块还包括识别语音预优化子模块;
识别语音预优化子模块:将n组语音输入组件分别采集的n组录音Mi,针对确定的使用者角度A做指定角度的增强波束,得到第三信号,并将第三信号发送至语音识别模块按照设定的方法进行语音识别。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的嘈杂环境下电子设备的语音唤醒方法的步骤。
CN201910208530.8A 2019-03-19 2019-03-19 嘈杂环境下电子设备的语音唤醒方法 Active CN109920433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910208530.8A CN109920433B (zh) 2019-03-19 2019-03-19 嘈杂环境下电子设备的语音唤醒方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910208530.8A CN109920433B (zh) 2019-03-19 2019-03-19 嘈杂环境下电子设备的语音唤醒方法

Publications (2)

Publication Number Publication Date
CN109920433A true CN109920433A (zh) 2019-06-21
CN109920433B CN109920433B (zh) 2021-08-20

Family

ID=66965641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910208530.8A Active CN109920433B (zh) 2019-03-19 2019-03-19 嘈杂环境下电子设备的语音唤醒方法

Country Status (1)

Country Link
CN (1) CN109920433B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110364176A (zh) * 2019-08-21 2019-10-22 百度在线网络技术(北京)有限公司 语音信号处理方法及装置
WO2021008000A1 (zh) * 2019-07-12 2021-01-21 大象声科(深圳)科技有限公司 语音唤醒方法、装置及电子设备、存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN105763956A (zh) * 2014-12-15 2016-07-13 华为终端(东莞)有限公司 视频聊天中录音的方法和终端
US20160275960A1 (en) * 2015-03-19 2016-09-22 Airoha Technology Corp. Voice enhancement method
CN106611600A (zh) * 2016-12-02 2017-05-03 广州音书科技有限公司 用于远场拾音及移动充电的音频处理装置及系统
CN106782519A (zh) * 2016-12-23 2017-05-31 深圳先进技术研究院 一种机器人
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN108122563A (zh) * 2017-12-19 2018-06-05 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN108447479A (zh) * 2018-02-02 2018-08-24 上海大学 嘈杂工况环境的机器人语音控制系统
CN108831457A (zh) * 2018-05-28 2018-11-16 深圳亿维锐创科技股份有限公司 一种基于音频控制的智能化手术室系统实现方法
CN108962272A (zh) * 2018-06-21 2018-12-07 湖南优浪语音科技有限公司 拾音方法和系统
CN109272989A (zh) * 2018-08-29 2019-01-25 北京京东尚科信息技术有限公司 语音唤醒方法、装置和计算机可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN105763956A (zh) * 2014-12-15 2016-07-13 华为终端(东莞)有限公司 视频聊天中录音的方法和终端
US20160275960A1 (en) * 2015-03-19 2016-09-22 Airoha Technology Corp. Voice enhancement method
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106611600A (zh) * 2016-12-02 2017-05-03 广州音书科技有限公司 用于远场拾音及移动充电的音频处理装置及系统
CN106782519A (zh) * 2016-12-23 2017-05-31 深圳先进技术研究院 一种机器人
CN106782585A (zh) * 2017-01-26 2017-05-31 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
CN108122563A (zh) * 2017-12-19 2018-06-05 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN108447479A (zh) * 2018-02-02 2018-08-24 上海大学 嘈杂工况环境的机器人语音控制系统
CN108831457A (zh) * 2018-05-28 2018-11-16 深圳亿维锐创科技股份有限公司 一种基于音频控制的智能化手术室系统实现方法
CN108962272A (zh) * 2018-06-21 2018-12-07 湖南优浪语音科技有限公司 拾音方法和系统
CN109272989A (zh) * 2018-08-29 2019-01-25 北京京东尚科信息技术有限公司 语音唤醒方法、装置和计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021008000A1 (zh) * 2019-07-12 2021-01-21 大象声科(深圳)科技有限公司 语音唤醒方法、装置及电子设备、存储介质
CN110364176A (zh) * 2019-08-21 2019-10-22 百度在线网络技术(北京)有限公司 语音信号处理方法及装置

Also Published As

Publication number Publication date
CN109920433B (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN110503969B (zh) 一种音频数据处理方法、装置及存储介质
WO2021139327A1 (zh) 一种音频信号处理方法、模型训练方法以及相关装置
CN105009204B (zh) 语音识别功率管理
US9685161B2 (en) Method for updating voiceprint feature model and terminal
CN110211599B (zh) 应用唤醒方法、装置、存储介质及电子设备
US20180174574A1 (en) Methods and systems for reducing false alarms in keyword detection
CN107464565A (zh) 一种远场语音唤醒方法及设备
CN112532266A (zh) 智能头盔及智能头盔的语音交互控制方法
US11308946B2 (en) Methods and apparatus for ASR with embedded noise reduction
US11195518B2 (en) Hearing device user communicating with a wireless communication device
CN110364156A (zh) 语音交互方法、系统、终端及可读存储介质
US20180158462A1 (en) Speaker identification
CN108235208A (zh) 用于运行助听器设备的方法
CN110992967A (zh) 一种语音信号处理方法、装置、助听器及存储介质
CN109920433A (zh) 嘈杂环境下电子设备的语音唤醒方法
TW202322107A (zh) 降噪處理方法
CN114944153A (zh) 一种物联网终端增强唤醒方法、装置及存储介质
CN117642815A (zh) 使用协作网络的噪声抑制
CN113066488B (zh) 语音唤醒智能控制方法、装置、电子设备及存储介质
CN109427336B (zh) 语音对象识别方法及装置
KR102308022B1 (ko) 호출음 인식장치 및 호출음 인식방법
CN111048096B (zh) 一种语音信号处理方法、装置及终端
CN112509556B (zh) 一种语音唤醒方法及装置
CN114333017A (zh) 一种动态拾音方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant