CN110600060B

CN110600060B - 一种硬件音频主动探测hvad系统

Info

Publication number: CN110600060B
Application number: CN201910924900.8A
Authority: CN
Inventors: 海明
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2019-09-27
Filing date: 2019-09-27
Publication date: 2021-10-22
Anticipated expiration: 2039-09-27
Also published as: CN110600060A

Abstract

本发明提供了一种硬件音频主动探测HVAD系统，该硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块；其中，该PDM采集模块用于采集若干路PDM麦克风信号；该I2S_TOP采集模块用于采集若干路I2S麦克风信号；该麦克风能量检测模块用于对若干路PDM麦克风信号和/或若干路I2S麦克风信号分别执行适应性能量检测处理；该音频识别模块用于根据该能量检测处理的结果，对当前声音信号进行音频辨识处理；该中控模块用于根据音频辨识处理对目标硬件执行适应性的触发操作。

Description

一种硬件音频主动探测HVAD系统

技术领域

本发明涉及语音识别的技术领域，特别涉及一种硬件音频主动探测HVAD系统。

背景技术

为了降低功耗和减少内存运行占用率，现有的智能电子设备都会在预设时间内接收不到操作信号的情况下自动进入休眠待机状态，从而有效地避免智能电子设备长时间持续运作而造成系统响应速度下降的问题。为了便于用户能够快速地将智能电子设备从休眠待机状态唤醒恢复至正常工作状态，该智能电子设备都具备语音唤醒功能，该语音唤醒功能允许该智能电子设备在接收到外界预设语音指令后，触发唤醒其中的CPU，从而便于用户在不需要物理接触操作的情况下也能够快速地唤醒智能电子设备。目前而言，该智能电子设备都是通过判断来自外界的语音指令在持续时间和/或振幅是否满足预设条件的情况下来执行相应的触发唤醒操作，其并不能准确地判断该来自外界的语音信号是否为有效的音频信号，这容易导致智能电子设备出现误触发唤醒的情况。可见，现有技术急需一种能够快速地和准确地判断外界语音信号有效性的语音探测与唤醒系统。

发明内容

针对现有技术存在的缺陷，本发明提供一种硬件音频主动探测(Hardware VoiceActivity Detection)HVAD系统，该硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块；其中，该PDM采集模块用于采集若干路PDM麦克风信号；该I2S_TOP采集模块用于采集若干路I2S麦克风信号；该麦克风能量检测模块用于对若干路PDM麦克风信号和/或若干路I2S麦克风信号分别执行适应性能量检测处理；该音频识别模块用于根据该能量检测处理的结果，对当前声音信号进行音频辨识处理；该中控模块用于根据音频辨识处理对目标硬件执行适应性的触发操作。可见，该硬件音频主动探测HVAD系统有别于现有技术的仅仅以语音信号的持续时间和振幅作为目标硬件是否进行语音唤醒操作的依据，其通过在语音信号幅度、语音信号周期和语音信号能量累积这三个不同维度上对来自外界的语音信号进行判断处理，以此确定该来自外界的语音信号是否属于有效的唤醒语音信号，从而避免单纯根据语音信号的持续时间和振幅作为语音唤醒操作先决条件而导致的误操作，该硬件音频主动探测HVAD系统能够更进一步地提高硬件语音唤醒的准确性和迅速性。

本发明提供一种硬件音频主动探测HVAD系统，其特征在于：

所述硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块；其中，

所述PDM采集模块用于采集若干路PDM麦克风信号；

所述I2S_TOP采集模块用于采集若干路I2S麦克风信号；

所述麦克风能量检测模块用于对所述若干路PDM麦克风信号和/或所述若干路I2S麦克风信号分别执行适应性能量检测处理；

所述音频识别模块用于根据所述能量检测处理的结果，对当前声音信号进行音频辨识处理；

所述中控模块用于根据所述音频辨识处理对目标硬件执行适应性的触发操作；

优选地，所述PDM采集模块包括若干PDM麦克风子模块、PDM麦克风控制子模块和I2S接口子模块；其中

所述若干PDM麦克风子模块用于分别采集得到所述若干路PDM麦克风信号；

所述PDM麦克风控制子模块用于控制所述若干PDM麦克风子模块中的每一个各自的信号采集状态；

所述I2S接口子模块用于实现所述PDM采集模块与所述I2S_TOP采集模块之间的若干不同Ch通道信号的传送；

优选地，所述I2S_TOP采集模块包括若干I2S麦克风子模块、I2S麦克风控制子模块和若干Ch通道子模块；其中，

所述若干I2S麦克风子模块用于分别采集得到所述若干路I2S麦克风信号；

所述I2S麦克风控制子模块用于控制所述若干I2S麦克风子模块中的每一个各自的信号采集状态；

所述若干Ch通道子模块中的每一个用于与所述PDM采集模块中相应的I2S接口子模块进行连接，以此实现若干不同Ch通道信号从所述PDM采集模块传送至所述I2S_TOP采集模块；

优选地，所述硬件音频主动探测HVAD系统还包括CFG模块；

所述CFG模块包括系统配置子模块、寄存器子模块和APB总线接口子模块；其中，

所述系统配置子模块用于提供关于所述HVAD系统若干不同功能配置操作；

所述寄存器子模块用于提供所述HVAD系统运行过程中的若干不同数据寄存操作；

所述APB总线接口子模块用于提供所述CFG模块与所述I2S_TOP采集模块之间的总线数据传输；

优选地，所述麦克风能量检测模块包括第一维度信号判断子模块、第二维度信号判断子模块和第三维度信号判断子模块；其中，

所述第一维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号幅度的第一判断处理；

所述第二维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号周期的第二判断处理；

所述第三维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号能量累积的第三判断处理；

优选地，所述第一维度信号判断子模块包括信号幅度提取单元、幅度比较单元和第一判断信号生成单元；并且，

所述第一维度信号判断子模块执行关于信号幅度的所述第一判断处理具体包括，

步骤(A1)，通过所述信号幅度提取单元获取所述PDM麦克风信号和/或所述I2S麦克风信号各自对应的PDM信号幅度和/或I2S信号幅度；

步骤(A2)，通过所述幅度比较单元将所述PDM信号幅度和/或所述I2S信号幅度与预设幅度阈值进行幅度比较处理；

步骤(A3)，若所述PDM信号幅度大于所述预设幅度阈值和/或所述I2S信号幅度大于所述预设幅度阈值，则所述第一判断信号生成单元生成幅度有效指示信号，否则，所述第一判断信号生成单元生成幅度无效指示信号；

优选地，所述第二维度信号判断子模块包括信号周期提取单元，周期比较单元和第二判断信号生成单元；并且，

所述第二维度信号判断子模块执行关于信号周期的第二判断处理具体包括，

步骤(B1)，通过所述信号周期提取单元获取所述PDM麦克风信号和/或所述I2S麦克风信号各自的信号连续大于零和信号连续小于零的采样点个数，其中，获取所述采样点个数是通过下面逻辑运算过程来实现的

if(p(n-1)＝＝p(n))

Num(n)＝Num(n-1)+1；

else

{

T＝Num(n)；

Num(n)＝0；

}

在上述逻辑运算过程中，p(n)表示第n个采样点的正负极性，p(n-1)表示第n-1个采样点的正负极性，Num(n)表示第n个采样点和该第n个采样点之前的采样点形成的信号连续大于零和信号连续小于零的采样点个数，T表示所述信号周期；

步骤(B2)，通过所述周期比较单元将所述PDM麦克风信号和/或所述I2S麦克风信号各自采样点个数与预设采样点阈值范围进行比较处理；

步骤(B3)，若所述PDM麦克风信号的采样点个数和/或所述I2S麦克风信号的采样点个数位于所述预设采样点阈值范围中，则所述第二判断信号生成单元生成周期有效指示信号，否则，所述第二判断信号生成单元生成周期无效指示信号；

优选地，所述第三维度信号判断子模块包括输入能量检测单元、能量累积计算单元和第三判断信号生成单元；并且，

所述第三维度信号判断子模块执行关于信号能量累积的第三判断处理具体包括，

步骤(C1)，所述输入能量检测单元通过计数方式来确定输入能量的有效性，若所述输入能量同时满足所述幅度有效指示信号和所述周期有效指示信号对应的条件，则将所述输入能量对应的次数进行加1处理，若所述输入能量对应的定时检测结果超出预设定时长度，则将所述输入能量对应的次数进行减1处理；

步骤(C2)，所述能量累积计算单元根据对所述输入能量对应次数进行的所有加1处理和减1处理，得到所述PDM麦克风信号和/或所述I2S麦克风信号各自对应的能量实际累积值；

步骤(C3)，所述第三判断信号生成单元在所述能量实际累积值超过预设能量累积阈值时，生成能量有效指示信号，以及在所述能量实际累积值不超过预设能量累积阈值时，生成能量无效指示信号；

优选地，所述音频识别模块包括能量检测信号接收单元和辨识结果生成单元；其中，

所述能量检测信号接收单元用于接收所述能量有效指示信号或者所述能量无效指示信号；

所述辨识结果生成单元用于在接收到所述能量有效指示信号时将当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为音频信号，或者在接收到所述能量无效指示信号时将当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为非音频信号；

或者，

所述中控模块用于在所述音频辨识处理指示当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为音频信号时，对所述目标硬件执行唤醒操作；

所述中控模块还用于在所述音频辨识处理指示当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为非音频信号时，维持所述目标硬件当前工作状态。

相比于现有技术，该硬件音频主动探测HVAD系统有别于现有技术的仅仅以语音信号的持续时间和振幅作为目标硬件是否进行语音唤醒操作的依据，其通过在语音信号幅度、语音信号周期和语音信号能量累积这三个不同维度上对来自外界的语音信号进行判断处理，以此确定该来自外界的语音信号是否属于有效的唤醒语音信号，从而避免单纯根据语音信号的持续时间和振幅作为语音唤醒操作先决条件而导致的误操作，该硬件音频主动探测HVAD系统能够更进一步地提高硬件语音唤醒的准确性和迅速性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种硬件音频主动探测HVAD系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的一种硬件音频主动探测HVAD系统的结构示意图。该硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块；其中，

该PDM采集模块用于采集若干路PDM麦克风信号；

该I2S_TOP采集模块用于采集若干路I2S麦克风信号；

该麦克风能量检测模块用于对该若干路PDM麦克风信号和/或该若干路I2S麦克风信号分别执行适应性能量检测处理；

该音频识别模块用于根据该能量检测处理的结果，对当前声音信号进行音频辨识处理；

该中控模块用于根据该音频辨识处理对目标硬件执行适应性的触发操作。

优选地，该PDM采集模块包括若干PDM麦克风子模块、PDM麦克风控制子模块和I2S接口子模块；

优选地，该若干PDM麦克风子模块用于分别采集得到该若干路PDM麦克风信号；

优选地，该PDM麦克风控制子模块用于控制该若干PDM麦克风子模块中的每一个各自的信号采集状态；

优选地，该I2S接口子模块用于实现该PDM采集模块与该I2S_TOP采集模块之间的若干不同Ch通道信号的传送；

优选地，该I2S_TOP采集模块包括若干I2S麦克风子模块、I2S麦克风控制子模块和若干Ch通道子模块；

优选地，该若干I2S麦克风子模块用于分别采集得到该若干路I2S麦克风信号；

优选地，该I2S麦克风控制子模块用于控制该若干I2S麦克风子模块中的每一个各自的信号采集状态；

优选地，该若干Ch通道子模块中的每一个用于与该PDM采集模块中相应的I2S接口子模块进行连接，以此实现若干不同Ch通道信号从该PDM采集模块传送至该I2S_TOP采集模块；

优选地，该硬件音频主动探测HVAD系统还包括CFG模块；

优选地，该CFG模块包括系统配置子模块、寄存器子模块和APB总线接口子模块；

优选地，该系统配置子模块用于提供关于该HVAD系统若干不同功能配置操作；

优选地，该寄存器子模块用于提供该HVAD系统运行过程中的若干不同数据寄存操作；

优选地，该APB总线接口子模块用于提供该CFG模块与该I2S_TOP采集模块之间的总线数据传输；

优选地，该麦克风能量检测模块包括第一维度信号判断子模块、第二维度信号判断子模块和第三维度信号判断子模块；

优选地，该第一维度信号判断子模块用于对该PDM麦克风信号和/或该I2S麦克风信号进行关于信号幅度的第一判断处理；

优选地，该第二维度信号判断子模块用于对该PDM麦克风信号和/或该I2S麦克风信号进行关于信号周期的第二判断处理；

优选地，该第三维度信号判断子模块用于对该PDM麦克风信号和/或该I2S麦克风信号进行关于信号能量累积的第三判断处理；

优选地，该第一维度信号判断子模块包括信号幅度提取单元、幅度比较单元和第一判断信号生成单元；

优选地，该第一维度信号判断子模块执行关于信号幅度的该第一判断处理具体包括，

步骤(A1)，通过该信号幅度提取单元获取该PDM麦克风信号和/或该I2S麦克风信号各自对应的PDM信号幅度和/或I2S信号幅度；

步骤(A2)，通过该幅度比较单元将该PDM信号幅度和/或该I2S信号幅度与预设幅度阈值进行幅度比较处理；

步骤(A3)，若该PDM信号幅度大于该预设幅度阈值和/或该I2S信号幅度大于该预设幅度阈值，则该第一判断信号生成单元生成幅度有效指示信号，否则，该第一判断信号生成单元生成幅度无效指示信号；

优选地，该第二维度信号判断子模块包括信号周期提取单元，周期比较单元和第二判断信号生成单元；并且，

该第二维度信号判断子模块执行关于信号周期的第二判断处理具体包括，步骤(B1)，通过该信号周期提取单元获取该PDM麦克风信号和/或该I2S麦克风信号各自的信号连续大于零和信号连续小于零的采样点个数，其中，获取该采样点个数是通过下面逻辑运算过程来实现的if(p(n-1)＝＝p(n))

Num(n)＝Num(n-1)+1；

else

{

T＝Num(n)；

Num(n)＝0；

}

在上述逻辑运算过程中，p(n)表示第n个采样点的正负极性，p(n-1)表示第n-1个采样点的正负极性，Num(n)表示第n个采样点和该第n个采样点之前的采样点形成的信号连续大于零和信号连续小于零的采样点个数，T表示该信号周期；

步骤(B2)，通过该周期比较单元将该PDM麦克风信号和/或该I2S麦克风信号各自采样点个数与预设采样点阈值范围进行比较处理；

步骤(B3)，若该PDM麦克风信号的采样点个数和/或该I2S麦克风信号的采样点个数位于该预设采样点阈值范围中，则该第二判断信号生成单元生成周期有效指示信号，否则，该第二判断信号生成单元生成周期无效指示信号；

优选地，该第三维度信号判断子模块包括输入能量检测单元、能量累积计算单元和第三判断信号生成单元；并且，

该第三维度信号判断子模块执行关于信号能量累积的第三判断处理具体包括，

步骤(C1)，该输入能量检测单元通过计数方式来确定输入能量的有效性，若该输入能量同时满足该幅度有效指示信号和该周期有效指示信号对应的条件，则将该输入能量对应的次数进行加1处理，若该输入能量对应的定时检测结果超出预设定时长度，则将该输入能量对应的次数进行减1处理；

步骤(C2)，该能量累积计算单元根据对该输入能量对应次数进行的所有加1处理和减1处理，得到该PDM麦克风信号和/或该I2S麦克风信号各自对应的能量实际累积值；

步骤(C3)，该第三判断信号生成单元在该能量实际累积值超过预设能量累积阈值时，生成能量有效指示信号，以及在该能量实际累积值不超过预设能量累积阈值时，生成能量无效指示信号；

优选地，该音频识别模块包括能量检测信号接收单元和辨识结果生成单元；

优选地，该能量检测信号接收单元用于接收该能量有效指示信号或者该能量无效指示信号；

优选地，该辨识结果生成单元用于在接收到该能量有效指示信号时将当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为音频信号，或者在接收到该能量无效指示信号时将当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为非音频信号；

优选地，该中控模块用于在该音频辨识处理指示当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为音频信号时，对该目标硬件执行唤醒操作；

优选地，该中控模块还用于在该音频辨识处理指示当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为非音频信号时，维持该目标硬件当前工作状态。

从上述实施例可以看出，该硬件音频主动探测HVAD系统有别于现有技术的仅仅以语音信号的持续时间和振幅作为目标硬件是否进行语音唤醒操作的依据，其通过在语音信号幅度、语音信号周期和语音信号能量累积这三个不同维度上对来自外界的语音信号进行判断处理，以此确定该来自外界的语音信号是否属于有效的唤醒语音信号，从而避免单纯根据语音信号的持续时间和振幅作为语音唤醒操作先决条件而导致的误操作，该硬件音频主动探测HVAD系统能够更进一步地提高硬件语音唤醒的准确性和迅速性。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种硬件音频主动探测HVAD系统，其特征在于：

所述硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块；其中，所述PDM采集模块用于采集若干路PDM麦克风信号；

所述I2S_TOP采集模块用于采集若干路I2S麦克风信号；

所述麦克风能量检测模块包括第一维度信号判断子模块、第二维度信号判断子模块和第三维度信号判断子模块；其中，

所述第一维度信号判断子模块包括信号幅度提取单元、幅度比较单元和第一判断信号生成单元；并且，

所述第二维度信号判断子模块包括信号周期提取单元，周期比较单元和第二判断信号生成单元；并且，

if(p(n-1)＝＝p(n))

Num(n)＝Num(n-1)+1；

else

{

T＝Num(n)；

Num(n)＝0；

}

所述第三维度信号判断子模块包括输入能量检测单元、能量累积计算单元和第三判断信号生成单元；并且，

步骤(C3)，所述第三判断信号生成单元在所述能量实际累积值超过预设能量累积阈值时，生成能量有效指示信号，以及在所述能量实际累积值不超过预设能量累积阈值时，生成能量无效指示信号。

2.如权利要求1所述的硬件音频主动探测HVAD系统，其特在于：

所述PDM采集模块包括若干PDM麦克风子模块、PDM麦克风控制子模块和I2S接口子模块；其中

所述I2S接口子模块用于实现所述PDM采集模块与所述I2S_TOP采集模块之间的若干不同Ch通道信号的传送。

3.如权利要求1或2所述的硬件音频主动探测HVAD系统，其特征在于：

所述I2S_TOP采集模块包括若干I2S麦克风子模块、I2S麦克风控制子模块和若干Ch通道子模块；其中，

所述若干Ch通道子模块中的每一个用于与所述PDM采集模块中相应的I2S接口子模块进行连接，以此实现若干不同Ch通道信号从所述PDM采集模块传送至所述I2S_TOP采集模块。

4.如权利要求1所述的硬件音频主动探测HVAD系统，其特征在于：

所述硬件音频主动探测HVAD系统还包括CFG模块；

所述APB总线接口子模块用于提供所述CFG模块与所述I2S_TOP采集模块之间的总线数据传输。

5.如权利要求1所述的硬件音频主动探测HVAD系统，其特征在于：

所述音频识别模块包括能量检测信号接收单元和辨识结果生成单元；其中，

或者，