CN110600060B - 一种硬件音频主动探测hvad系统 - Google Patents
一种硬件音频主动探测hvad系统 Download PDFInfo
- Publication number
- CN110600060B CN110600060B CN201910924900.8A CN201910924900A CN110600060B CN 110600060 B CN110600060 B CN 110600060B CN 201910924900 A CN201910924900 A CN 201910924900A CN 110600060 B CN110600060 B CN 110600060B
- Authority
- CN
- China
- Prior art keywords
- signal
- microphone
- pdm
- module
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 55
- 230000005236 sound signal Effects 0.000 claims abstract description 18
- 230000003044 adaptive effect Effects 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims description 39
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 24
- 238000000034 method Methods 0.000 claims description 22
- 238000009825 accumulation Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供了一种硬件音频主动探测HVAD系统,该硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块;其中,该PDM采集模块用于采集若干路PDM麦克风信号;该I2S_TOP采集模块用于采集若干路I2S麦克风信号;该麦克风能量检测模块用于对若干路PDM麦克风信号和/或若干路I2S麦克风信号分别执行适应性能量检测处理;该音频识别模块用于根据该能量检测处理的结果,对当前声音信号进行音频辨识处理;该中控模块用于根据音频辨识处理对目标硬件执行适应性的触发操作。
Description
技术领域
本发明涉及语音识别的技术领域,特别涉及一种硬件音频主动探测HVAD系统。
背景技术
为了降低功耗和减少内存运行占用率,现有的智能电子设备都会在预设时间内接收不到操作信号的情况下自动进入休眠待机状态,从而有效地避免智能电子设备长时间持续运作而造成系统响应速度下降的问题。为了便于用户能够快速地将智能电子设备从休眠待机状态唤醒恢复至正常工作状态,该智能电子设备都具备语音唤醒功能,该语音唤醒功能允许该智能电子设备在接收到外界预设语音指令后,触发唤醒其中的CPU,从而便于用户在不需要物理接触操作的情况下也能够快速地唤醒智能电子设备。目前而言,该智能电子设备都是通过判断来自外界的语音指令在持续时间和/或振幅是否满足预设条件的情况下来执行相应的触发唤醒操作,其并不能准确地判断该来自外界的语音信号是否为有效的音频信号,这容易导致智能电子设备出现误触发唤醒的情况。可见,现有技术急需一种能够快速地和准确地判断外界语音信号有效性的语音探测与唤醒系统。
发明内容
针对现有技术存在的缺陷,本发明提供一种硬件音频主动探测(Hardware VoiceActivity Detection)HVAD系统,该硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块;其中,该PDM采集模块用于采集若干路PDM麦克风信号;该I2S_TOP采集模块用于采集若干路I2S麦克风信号;该麦克风能量检测模块用于对若干路PDM麦克风信号和/或若干路I2S麦克风信号分别执行适应性能量检测处理;该音频识别模块用于根据该能量检测处理的结果,对当前声音信号进行音频辨识处理;该中控模块用于根据音频辨识处理对目标硬件执行适应性的触发操作。可见,该硬件音频主动探测HVAD系统有别于现有技术的仅仅以语音信号的持续时间和振幅作为目标硬件是否进行语音唤醒操作的依据,其通过在语音信号幅度、语音信号周期和语音信号能量累积这三个不同维度上对来自外界的语音信号进行判断处理,以此确定该来自外界的语音信号是否属于有效的唤醒语音信号,从而避免单纯根据语音信号的持续时间和振幅作为语音唤醒操作先决条件而导致的误操作,该硬件音频主动探测HVAD系统能够更进一步地提高硬件语音唤醒的准确性和迅速性。
本发明提供一种硬件音频主动探测HVAD系统,其特征在于:
所述硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块;其中,
所述PDM采集模块用于采集若干路PDM麦克风信号;
所述I2S_TOP采集模块用于采集若干路I2S麦克风信号;
所述麦克风能量检测模块用于对所述若干路PDM麦克风信号和/或所述若干路I2S麦克风信号分别执行适应性能量检测处理;
所述音频识别模块用于根据所述能量检测处理的结果,对当前声音信号进行音频辨识处理;
所述中控模块用于根据所述音频辨识处理对目标硬件执行适应性的触发操作;
优选地,所述PDM采集模块包括若干PDM麦克风子模块、PDM麦克风控制子模块和I2S接口子模块;其中
所述若干PDM麦克风子模块用于分别采集得到所述若干路PDM麦克风信号;
所述PDM麦克风控制子模块用于控制所述若干PDM麦克风子模块中的每一个各自的信号采集状态;
所述I2S接口子模块用于实现所述PDM采集模块与所述I2S_TOP采集模块之间的若干不同Ch通道信号的传送;
优选地,所述I2S_TOP采集模块包括若干I2S麦克风子模块、I2S麦克风控制子模块和若干Ch通道子模块;其中,
所述若干I2S麦克风子模块用于分别采集得到所述若干路I2S麦克风信号;
所述I2S麦克风控制子模块用于控制所述若干I2S麦克风子模块中的每一个各自的信号采集状态;
所述若干Ch通道子模块中的每一个用于与所述PDM采集模块中相应的I2S接口子模块进行连接,以此实现若干不同Ch通道信号从所述PDM采集模块传送至所述I2S_TOP采集模块;
优选地,所述硬件音频主动探测HVAD系统还包括CFG模块;
所述CFG模块包括系统配置子模块、寄存器子模块和APB总线接口子模块;其中,
所述系统配置子模块用于提供关于所述HVAD系统若干不同功能配置操作;
所述寄存器子模块用于提供所述HVAD系统运行过程中的若干不同数据寄存操作;
所述APB总线接口子模块用于提供所述CFG模块与所述I2S_TOP采集模块之间的总线数据传输;
优选地,所述麦克风能量检测模块包括第一维度信号判断子模块、第二维度信号判断子模块和第三维度信号判断子模块;其中,
所述第一维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号幅度的第一判断处理;
所述第二维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号周期的第二判断处理;
所述第三维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号能量累积的第三判断处理;
优选地,所述第一维度信号判断子模块包括信号幅度提取单元、幅度比较单元和第一判断信号生成单元;并且,
所述第一维度信号判断子模块执行关于信号幅度的所述第一判断处理具体包括,
步骤(A1),通过所述信号幅度提取单元获取所述PDM麦克风信号和/或所述I2S麦克风信号各自对应的PDM信号幅度和/或I2S信号幅度;
步骤(A2),通过所述幅度比较单元将所述PDM信号幅度和/或所述I2S信号幅度与预设幅度阈值进行幅度比较处理;
步骤(A3),若所述PDM信号幅度大于所述预设幅度阈值和/或所述I2S信号幅度大于所述预设幅度阈值,则所述第一判断信号生成单元生成幅度有效指示信号,否则,所述第一判断信号生成单元生成幅度无效指示信号;
优选地,所述第二维度信号判断子模块包括信号周期提取单元,周期比较单元和第二判断信号生成单元;并且,
所述第二维度信号判断子模块执行关于信号周期的第二判断处理具体包括,
步骤(B1),通过所述信号周期提取单元获取所述PDM麦克风信号和/或所述I2S麦克风信号各自的信号连续大于零和信号连续小于零的采样点个数,其中,获取所述采样点个数是通过下面逻辑运算过程来实现的
if(p(n-1)==p(n))
Num(n)=Num(n-1)+1;
else
{
T=Num(n);
Num(n)=0;
}
在上述逻辑运算过程中,p(n)表示第n个采样点的正负极性,p(n-1)表示第n-1个采样点的正负极性,Num(n)表示第n个采样点和该第n个采样点之前的采样点形成的信号连续大于零和信号连续小于零的采样点个数,T表示所述信号周期;
步骤(B2),通过所述周期比较单元将所述PDM麦克风信号和/或所述I2S麦克风信号各自采样点个数与预设采样点阈值范围进行比较处理;
步骤(B3),若所述PDM麦克风信号的采样点个数和/或所述I2S麦克风信号的采样点个数位于所述预设采样点阈值范围中,则所述第二判断信号生成单元生成周期有效指示信号,否则,所述第二判断信号生成单元生成周期无效指示信号;
优选地,所述第三维度信号判断子模块包括输入能量检测单元、能量累积计算单元和第三判断信号生成单元;并且,
所述第三维度信号判断子模块执行关于信号能量累积的第三判断处理具体包括,
步骤(C1),所述输入能量检测单元通过计数方式来确定输入能量的有效性,若所述输入能量同时满足所述幅度有效指示信号和所述周期有效指示信号对应的条件,则将所述输入能量对应的次数进行加1处理,若所述输入能量对应的定时检测结果超出预设定时长度,则将所述输入能量对应的次数进行减1处理;
步骤(C2),所述能量累积计算单元根据对所述输入能量对应次数进行的所有加1处理和减1处理,得到所述PDM麦克风信号和/或所述I2S麦克风信号各自对应的能量实际累积值;
步骤(C3),所述第三判断信号生成单元在所述能量实际累积值超过预设能量累积阈值时,生成能量有效指示信号,以及在所述能量实际累积值不超过预设能量累积阈值时,生成能量无效指示信号;
优选地,所述音频识别模块包括能量检测信号接收单元和辨识结果生成单元;其中,
所述能量检测信号接收单元用于接收所述能量有效指示信号或者所述能量无效指示信号;
所述辨识结果生成单元用于在接收到所述能量有效指示信号时将当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为音频信号,或者在接收到所述能量无效指示信号时将当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为非音频信号;
或者,
所述中控模块用于在所述音频辨识处理指示当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为音频信号时,对所述目标硬件执行唤醒操作;
所述中控模块还用于在所述音频辨识处理指示当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为非音频信号时,维持所述目标硬件当前工作状态。
相比于现有技术,该硬件音频主动探测HVAD系统有别于现有技术的仅仅以语音信号的持续时间和振幅作为目标硬件是否进行语音唤醒操作的依据,其通过在语音信号幅度、语音信号周期和语音信号能量累积这三个不同维度上对来自外界的语音信号进行判断处理,以此确定该来自外界的语音信号是否属于有效的唤醒语音信号,从而避免单纯根据语音信号的持续时间和振幅作为语音唤醒操作先决条件而导致的误操作,该硬件音频主动探测HVAD系统能够更进一步地提高硬件语音唤醒的准确性和迅速性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种硬件音频主动探测HVAD系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的一种硬件音频主动探测HVAD系统的结构示意图。该硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块;其中,
该PDM采集模块用于采集若干路PDM麦克风信号;
该I2S_TOP采集模块用于采集若干路I2S麦克风信号;
该麦克风能量检测模块用于对该若干路PDM麦克风信号和/或该若干路I2S麦克风信号分别执行适应性能量检测处理;
该音频识别模块用于根据该能量检测处理的结果,对当前声音信号进行音频辨识处理;
该中控模块用于根据该音频辨识处理对目标硬件执行适应性的触发操作。
优选地,该PDM采集模块包括若干PDM麦克风子模块、PDM麦克风控制子模块和I2S接口子模块;
优选地,该若干PDM麦克风子模块用于分别采集得到该若干路PDM麦克风信号;
优选地,该PDM麦克风控制子模块用于控制该若干PDM麦克风子模块中的每一个各自的信号采集状态;
优选地,该I2S接口子模块用于实现该PDM采集模块与该I2S_TOP采集模块之间的若干不同Ch通道信号的传送;
优选地,该I2S_TOP采集模块包括若干I2S麦克风子模块、I2S麦克风控制子模块和若干Ch通道子模块;
优选地,该若干I2S麦克风子模块用于分别采集得到该若干路I2S麦克风信号;
优选地,该I2S麦克风控制子模块用于控制该若干I2S麦克风子模块中的每一个各自的信号采集状态;
优选地,该若干Ch通道子模块中的每一个用于与该PDM采集模块中相应的I2S接口子模块进行连接,以此实现若干不同Ch通道信号从该PDM采集模块传送至该I2S_TOP采集模块;
优选地,该硬件音频主动探测HVAD系统还包括CFG模块;
优选地,该CFG模块包括系统配置子模块、寄存器子模块和APB总线接口子模块;
优选地,该系统配置子模块用于提供关于该HVAD系统若干不同功能配置操作;
优选地,该寄存器子模块用于提供该HVAD系统运行过程中的若干不同数据寄存操作;
优选地,该APB总线接口子模块用于提供该CFG模块与该I2S_TOP采集模块之间的总线数据传输;
优选地,该麦克风能量检测模块包括第一维度信号判断子模块、第二维度信号判断子模块和第三维度信号判断子模块;
优选地,该第一维度信号判断子模块用于对该PDM麦克风信号和/或该I2S麦克风信号进行关于信号幅度的第一判断处理;
优选地,该第二维度信号判断子模块用于对该PDM麦克风信号和/或该I2S麦克风信号进行关于信号周期的第二判断处理;
优选地,该第三维度信号判断子模块用于对该PDM麦克风信号和/或该I2S麦克风信号进行关于信号能量累积的第三判断处理;
优选地,该第一维度信号判断子模块包括信号幅度提取单元、幅度比较单元和第一判断信号生成单元;
优选地,该第一维度信号判断子模块执行关于信号幅度的该第一判断处理具体包括,
步骤(A1),通过该信号幅度提取单元获取该PDM麦克风信号和/或该I2S麦克风信号各自对应的PDM信号幅度和/或I2S信号幅度;
步骤(A2),通过该幅度比较单元将该PDM信号幅度和/或该I2S信号幅度与预设幅度阈值进行幅度比较处理;
步骤(A3),若该PDM信号幅度大于该预设幅度阈值和/或该I2S信号幅度大于该预设幅度阈值,则该第一判断信号生成单元生成幅度有效指示信号,否则,该第一判断信号生成单元生成幅度无效指示信号;
优选地,该第二维度信号判断子模块包括信号周期提取单元,周期比较单元和第二判断信号生成单元;并且,
该第二维度信号判断子模块执行关于信号周期的第二判断处理具体包括,步骤(B1),通过该信号周期提取单元获取该PDM麦克风信号和/或该I2S麦克风信号各自的信号连续大于零和信号连续小于零的采样点个数,其中,获取该采样点个数是通过下面逻辑运算过程来实现的if(p(n-1)==p(n))
Num(n)=Num(n-1)+1;
else
{
T=Num(n);
Num(n)=0;
}
在上述逻辑运算过程中,p(n)表示第n个采样点的正负极性,p(n-1)表示第n-1个采样点的正负极性,Num(n)表示第n个采样点和该第n个采样点之前的采样点形成的信号连续大于零和信号连续小于零的采样点个数,T表示该信号周期;
步骤(B2),通过该周期比较单元将该PDM麦克风信号和/或该I2S麦克风信号各自采样点个数与预设采样点阈值范围进行比较处理;
步骤(B3),若该PDM麦克风信号的采样点个数和/或该I2S麦克风信号的采样点个数位于该预设采样点阈值范围中,则该第二判断信号生成单元生成周期有效指示信号,否则,该第二判断信号生成单元生成周期无效指示信号;
优选地,该第三维度信号判断子模块包括输入能量检测单元、能量累积计算单元和第三判断信号生成单元;并且,
该第三维度信号判断子模块执行关于信号能量累积的第三判断处理具体包括,
步骤(C1),该输入能量检测单元通过计数方式来确定输入能量的有效性,若该输入能量同时满足该幅度有效指示信号和该周期有效指示信号对应的条件,则将该输入能量对应的次数进行加1处理,若该输入能量对应的定时检测结果超出预设定时长度,则将该输入能量对应的次数进行减1处理;
步骤(C2),该能量累积计算单元根据对该输入能量对应次数进行的所有加1处理和减1处理,得到该PDM麦克风信号和/或该I2S麦克风信号各自对应的能量实际累积值;
步骤(C3),该第三判断信号生成单元在该能量实际累积值超过预设能量累积阈值时,生成能量有效指示信号,以及在该能量实际累积值不超过预设能量累积阈值时,生成能量无效指示信号;
优选地,该音频识别模块包括能量检测信号接收单元和辨识结果生成单元;
优选地,该能量检测信号接收单元用于接收该能量有效指示信号或者该能量无效指示信号;
优选地,该辨识结果生成单元用于在接收到该能量有效指示信号时将当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为音频信号,或者在接收到该能量无效指示信号时将当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为非音频信号;
优选地,该中控模块用于在该音频辨识处理指示当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为音频信号时,对该目标硬件执行唤醒操作;
优选地,该中控模块还用于在该音频辨识处理指示当前对应的该PDM麦克风信号或该I2S麦克风信号辨识为非音频信号时,维持该目标硬件当前工作状态。
从上述实施例可以看出,该硬件音频主动探测HVAD系统有别于现有技术的仅仅以语音信号的持续时间和振幅作为目标硬件是否进行语音唤醒操作的依据,其通过在语音信号幅度、语音信号周期和语音信号能量累积这三个不同维度上对来自外界的语音信号进行判断处理,以此确定该来自外界的语音信号是否属于有效的唤醒语音信号,从而避免单纯根据语音信号的持续时间和振幅作为语音唤醒操作先决条件而导致的误操作,该硬件音频主动探测HVAD系统能够更进一步地提高硬件语音唤醒的准确性和迅速性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (5)
1.一种硬件音频主动探测HVAD系统,其特征在于:
所述硬件音频主动探测HVAD系统包括PDM采集模块、I2S_TOP采集模块、麦克风能量检测模块、音频识别模块和中控模块;其中,所述PDM采集模块用于采集若干路PDM麦克风信号;
所述I2S_TOP采集模块用于采集若干路I2S麦克风信号;
所述麦克风能量检测模块用于对所述若干路PDM麦克风信号和/或所述若干路I2S麦克风信号分别执行适应性能量检测处理;
所述音频识别模块用于根据所述能量检测处理的结果,对当前声音信号进行音频辨识处理;
所述中控模块用于根据所述音频辨识处理对目标硬件执行适应性的触发操作;
所述麦克风能量检测模块包括第一维度信号判断子模块、第二维度信号判断子模块和第三维度信号判断子模块;其中,
所述第一维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号幅度的第一判断处理;
所述第二维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号周期的第二判断处理;
所述第三维度信号判断子模块用于对所述PDM麦克风信号和/或所述I2S麦克风信号进行关于信号能量累积的第三判断处理;
所述第一维度信号判断子模块包括信号幅度提取单元、幅度比较单元和第一判断信号生成单元;并且,
所述第一维度信号判断子模块执行关于信号幅度的所述第一判断处理具体包括,
步骤(A1),通过所述信号幅度提取单元获取所述PDM麦克风信号和/或所述I2S麦克风信号各自对应的PDM信号幅度和/或I2S信号幅度;
步骤(A2),通过所述幅度比较单元将所述PDM信号幅度和/或所述I2S信号幅度与预设幅度阈值进行幅度比较处理;
步骤(A3),若所述PDM信号幅度大于所述预设幅度阈值和/或所述I2S信号幅度大于所述预设幅度阈值,则所述第一判断信号生成单元生成幅度有效指示信号,否则,所述第一判断信号生成单元生成幅度无效指示信号;
所述第二维度信号判断子模块包括信号周期提取单元,周期比较单元和第二判断信号生成单元;并且,
所述第二维度信号判断子模块执行关于信号周期的第二判断处理具体包括,
步骤(B1),通过所述信号周期提取单元获取所述PDM麦克风信号和/或所述I2S麦克风信号各自的信号连续大于零和信号连续小于零的采样点个数,其中,获取所述采样点个数是通过下面逻辑运算过程来实现的
if(p(n-1)==p(n))
Num(n)=Num(n-1)+1;
else
{
T=Num(n);
Num(n)=0;
}
在上述逻辑运算过程中,p(n)表示第n个采样点的正负极性,p(n-1)表示第n-1个采样点的正负极性,Num(n)表示第n个采样点和该第n个采样点之前的采样点形成的信号连续大于零和信号连续小于零的采样点个数,T表示所述信号周期;
步骤(B2),通过所述周期比较单元将所述PDM麦克风信号和/或所述I2S麦克风信号各自采样点个数与预设采样点阈值范围进行比较处理;
步骤(B3),若所述PDM麦克风信号的采样点个数和/或所述I2S麦克风信号的采样点个数位于所述预设采样点阈值范围中,则所述第二判断信号生成单元生成周期有效指示信号,否则,所述第二判断信号生成单元生成周期无效指示信号;
所述第三维度信号判断子模块包括输入能量检测单元、能量累积计算单元和第三判断信号生成单元;并且,
所述第三维度信号判断子模块执行关于信号能量累积的第三判断处理具体包括,
步骤(C1),所述输入能量检测单元通过计数方式来确定输入能量的有效性,若所述输入能量同时满足所述幅度有效指示信号和所述周期有效指示信号对应的条件,则将所述输入能量对应的次数进行加1处理,若所述输入能量对应的定时检测结果超出预设定时长度,则将所述输入能量对应的次数进行减1处理;
步骤(C2),所述能量累积计算单元根据对所述输入能量对应次数进行的所有加1处理和减1处理,得到所述PDM麦克风信号和/或所述I2S麦克风信号各自对应的能量实际累积值;
步骤(C3),所述第三判断信号生成单元在所述能量实际累积值超过预设能量累积阈值时,生成能量有效指示信号,以及在所述能量实际累积值不超过预设能量累积阈值时,生成能量无效指示信号。
2.如权利要求1所述的硬件音频主动探测HVAD系统,其特在于:
所述PDM采集模块包括若干PDM麦克风子模块、PDM麦克风控制子模块和I2S接口子模块;其中
所述若干PDM麦克风子模块用于分别采集得到所述若干路PDM麦克风信号;
所述PDM麦克风控制子模块用于控制所述若干PDM麦克风子模块中的每一个各自的信号采集状态;
所述I2S接口子模块用于实现所述PDM采集模块与所述I2S_TOP采集模块之间的若干不同Ch通道信号的传送。
3.如权利要求1或2所述的硬件音频主动探测HVAD系统,其特征在于:
所述I2S_TOP采集模块包括若干I2S麦克风子模块、I2S麦克风控制子模块和若干Ch通道子模块;其中,
所述若干I2S麦克风子模块用于分别采集得到所述若干路I2S麦克风信号;
所述I2S麦克风控制子模块用于控制所述若干I2S麦克风子模块中的每一个各自的信号采集状态;
所述若干Ch通道子模块中的每一个用于与所述PDM采集模块中相应的I2S接口子模块进行连接,以此实现若干不同Ch通道信号从所述PDM采集模块传送至所述I2S_TOP采集模块。
4.如权利要求1所述的硬件音频主动探测HVAD系统,其特征在于:
所述硬件音频主动探测HVAD系统还包括CFG模块;
所述CFG模块包括系统配置子模块、寄存器子模块和APB总线接口子模块;其中,
所述系统配置子模块用于提供关于所述HVAD系统若干不同功能配置操作;
所述寄存器子模块用于提供所述HVAD系统运行过程中的若干不同数据寄存操作;
所述APB总线接口子模块用于提供所述CFG模块与所述I2S_TOP采集模块之间的总线数据传输。
5.如权利要求1所述的硬件音频主动探测HVAD系统,其特征在于:
所述音频识别模块包括能量检测信号接收单元和辨识结果生成单元;其中,
所述能量检测信号接收单元用于接收所述能量有效指示信号或者所述能量无效指示信号;
所述辨识结果生成单元用于在接收到所述能量有效指示信号时将当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为音频信号,或者在接收到所述能量无效指示信号时将当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为非音频信号;
或者,
所述中控模块用于在所述音频辨识处理指示当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为音频信号时,对所述目标硬件执行唤醒操作;
所述中控模块还用于在所述音频辨识处理指示当前对应的所述PDM麦克风信号或所述I2S麦克风信号辨识为非音频信号时,维持所述目标硬件当前工作状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910924900.8A CN110600060B (zh) | 2019-09-27 | 2019-09-27 | 一种硬件音频主动探测hvad系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910924900.8A CN110600060B (zh) | 2019-09-27 | 2019-09-27 | 一种硬件音频主动探测hvad系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110600060A CN110600060A (zh) | 2019-12-20 |
CN110600060B true CN110600060B (zh) | 2021-10-22 |
Family
ID=68864224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910924900.8A Active CN110600060B (zh) | 2019-09-27 | 2019-09-27 | 一种硬件音频主动探测hvad系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110600060B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708642B (zh) * | 2022-05-24 | 2022-11-18 | 成都锦城学院 | 商务英语仿真实训装置、系统、方法及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1518366A (zh) * | 2003-01-15 | 2004-08-04 | 康奈科技股份有限公司 | 一种使用数字信号处理检测音频信号的方法 |
CN101046955A (zh) * | 2006-04-24 | 2007-10-03 | 华为技术有限公司 | 一种pcm码流语音检测方法 |
CN101841587A (zh) * | 2009-03-20 | 2010-09-22 | 联芯科技有限公司 | 信号音检测方法和装置以及移动终端噪声抑制方法 |
EP2843659A1 (en) * | 2012-05-18 | 2015-03-04 | Huawei Technologies Co., Ltd | Method and apparatus for detecting correctness of pitch period |
CN105261376A (zh) * | 2015-09-08 | 2016-01-20 | 湖南国科微电子股份有限公司 | 一种数字音频系统的语音信号检测方法 |
CN105830463A (zh) * | 2013-10-29 | 2016-08-03 | 美商楼氏电子有限公司 | Vad检测设备和操作该vad检测设备的方法 |
CN107948905A (zh) * | 2017-12-29 | 2018-04-20 | 歌尔科技有限公司 | 一种智能音箱和麦克风阵列测试系统 |
CN108597498A (zh) * | 2018-04-10 | 2018-09-28 | 广州势必可赢网络科技有限公司 | 一种多麦克风语音采集方法及装置 |
CN108694959A (zh) * | 2017-04-05 | 2018-10-23 | 安华高科技通用Ip(新加坡)公司 | 语音能量检测 |
CN109243497A (zh) * | 2018-11-02 | 2019-01-18 | 钟祥博谦信息科技有限公司 | 语音唤醒的控制方法及装置 |
CN109473092A (zh) * | 2018-12-03 | 2019-03-15 | 珠海格力电器股份有限公司 | 一种语音端点检测方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4950930B2 (ja) * | 2008-04-03 | 2012-06-13 | 株式会社東芝 | 音声/非音声を判定する装置、方法およびプログラム |
CN106409310B (zh) * | 2013-08-06 | 2019-11-19 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
-
2019
- 2019-09-27 CN CN201910924900.8A patent/CN110600060B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1518366A (zh) * | 2003-01-15 | 2004-08-04 | 康奈科技股份有限公司 | 一种使用数字信号处理检测音频信号的方法 |
CN101046955A (zh) * | 2006-04-24 | 2007-10-03 | 华为技术有限公司 | 一种pcm码流语音检测方法 |
CN101841587A (zh) * | 2009-03-20 | 2010-09-22 | 联芯科技有限公司 | 信号音检测方法和装置以及移动终端噪声抑制方法 |
EP2843659A1 (en) * | 2012-05-18 | 2015-03-04 | Huawei Technologies Co., Ltd | Method and apparatus for detecting correctness of pitch period |
CN105830463A (zh) * | 2013-10-29 | 2016-08-03 | 美商楼氏电子有限公司 | Vad检测设备和操作该vad检测设备的方法 |
CN105261376A (zh) * | 2015-09-08 | 2016-01-20 | 湖南国科微电子股份有限公司 | 一种数字音频系统的语音信号检测方法 |
CN108694959A (zh) * | 2017-04-05 | 2018-10-23 | 安华高科技通用Ip(新加坡)公司 | 语音能量检测 |
CN107948905A (zh) * | 2017-12-29 | 2018-04-20 | 歌尔科技有限公司 | 一种智能音箱和麦克风阵列测试系统 |
CN108597498A (zh) * | 2018-04-10 | 2018-09-28 | 广州势必可赢网络科技有限公司 | 一种多麦克风语音采集方法及装置 |
CN109243497A (zh) * | 2018-11-02 | 2019-01-18 | 钟祥博谦信息科技有限公司 | 语音唤醒的控制方法及装置 |
CN109473092A (zh) * | 2018-12-03 | 2019-03-15 | 珠海格力电器股份有限公司 | 一种语音端点检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
Improving single frequency filtering based Voice Activity Detection (VAD) using spectral subtraction based noise cancellation;M. Tejus Adiga;《2016 International Conference on Signal Processing, Communication, Power and Embedded System (SCOPES)》;20170626;全文 * |
低信噪比条件下的语音信号检测;郑丹丹;《中国优秀硕士学位论文全文数据库》;20180215(第2期);I136-393 * |
Also Published As
Publication number | Publication date |
---|---|
CN110600060A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3522153B1 (en) | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor | |
US8972252B2 (en) | Signal processing apparatus having voice activity detection unit and related signal processing methods | |
CN104516296B (zh) | 一种基于外设模块的微控制器系统的唤醒方法及外设模块 | |
WO2020244257A1 (zh) | 语音唤醒方法、系统、电子设备及计算机可读存储介质 | |
CN102999291A (zh) | 待机状态下触摸唤醒移动终端的方法 | |
CN105955444A (zh) | 对齐唤醒方法及装置 | |
CN107102713A (zh) | 一种降低功耗的方法及装置 | |
CN110600060B (zh) | 一种硬件音频主动探测hvad系统 | |
CN109697981B (zh) | 一种语音交互方法、装置、设备及存储介质 | |
CN103617801A (zh) | 语音检测方法、装置及电子设备 | |
CN113920988B (zh) | 语音唤醒方法、装置及可读存储介质 | |
CN103543814A (zh) | 信号处理装置以及信号处理方法 | |
CN106662970A (zh) | 一种设置指纹识别器中断阈值的方法、装置和终端设备 | |
CN111192590A (zh) | 语音唤醒方法、装置、设备及存储介质 | |
CN111028831B (zh) | 一种语音唤醒方法及装置 | |
CN110956968A (zh) | 语音唤醒以及触发语音唤醒功能的方法及装置、终端设备 | |
CN111179924B (zh) | 一种基于模式切换的唤醒性能优化的方法及系统 | |
CN104184449A (zh) | 电容式触控装置、方法与系统 | |
CN109065037A (zh) | 一种基于语音交互的音频流控制方法 | |
CN110581770A (zh) | 通信设备及通信设备唤醒方法 | |
CN109302527A (zh) | 终端防误触方法、终端以及计算机可读存储介质 | |
CN211509272U (zh) | 一种充电盒 | |
CN109462882A (zh) | 终端的控制方法、装置和终端 | |
CN210225432U (zh) | 通信设备 | |
CN108536413B (zh) | 一种音频数据采集方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |