CN112885339A - 语音唤醒系统及语音识别系统 - Google Patents
语音唤醒系统及语音识别系统 Download PDFInfo
- Publication number
- CN112885339A CN112885339A CN201911113959.5A CN201911113959A CN112885339A CN 112885339 A CN112885339 A CN 112885339A CN 201911113959 A CN201911113959 A CN 201911113959A CN 112885339 A CN112885339 A CN 112885339A
- Authority
- CN
- China
- Prior art keywords
- signal
- voice
- sound signal
- analog
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims abstract description 209
- 230000005236 sound signal Effects 0.000 claims abstract description 156
- 238000006243 chemical reaction Methods 0.000 claims abstract description 48
- 230000000694 effects Effects 0.000 claims abstract description 33
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims abstract description 17
- 239000003990 capacitor Substances 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 26
- 238000000034 method Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Abstract
本发明实施例提供了一种语音唤醒系统及语音识别系统。语音活动检测模块中包括模拟信号检测电路和唤醒信号产生模块,通过模拟信号检测电路可以对接收到的输入声音信号进行检测以确定输入声音信号是否为语音信号,再由唤醒信号产生模块在确定输入声音信号为语音信号的情况下产生唤醒信号,进而模数转换模块和关键词检测模块在接收到唤醒信号时启动。由于两个模块在未接收唤醒信号时,一直处于休眠状态,功率消耗很低。进一步,由于语音活动检测模块可以直接对模拟的输入声音信号进行检测,不需要采用高精度的模数转换电路转换成数字信号,而唤醒信号产生模块只需要采用低精度的模数转换电路,相比于高精度的模数转换电路,功率消耗很低。
Description
【技术领域】
本发明涉及语音识别技术领域,尤其涉及一种语音唤醒系统及语音识别系统。
【背景技术】
现在许多终端都具备了语音唤醒功能,例如机器人、可穿戴设备、智能家居、车载设备等。语音活动检测(Voice Activity Detection,简称VAD)技术是实现语音唤醒功能的关键技术之一,利用VAD可以从原始语音数据中准确的定位出语音的起止点,把静音和噪声作为干扰信号从原始语音数据中去除。
现有的VAD系统需要利用模数转换器(A/D)将模拟语音信号转换成数字语音信号,然后对数字语音信号进行VAD。因此,模数转换器(A/D)需要长时间处于开启状态,而且需要采用高精度的模数转换器(A/D),导致功耗很大。
【发明内容】
有鉴于此,本发明实施例提供了一种语音唤醒系统及语音识别系统,用以解决现有技术中采用高精度的A/D将模拟信号转换成数字信号后再进行VAD,从而导致终端功耗很大的技术问题。
一方面,本发明实施例提供了一种语音唤醒系统,包括:第一语音活动检测模块、模数转换模块和关键词检测模块至少一个待唤醒模块;其中,所述第一语音活动检测模块包括:模拟信号检测电路和唤醒信号产生模块;其中,所述模拟信号检测电路,用于对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号;所述唤醒信号产生模块,用于在所述模拟信号检测电路确定所述输入声音信号为语音信号的情况下产生唤醒信号;所述模数转换模块和所述关键词检测模块在接收到所述唤醒信号时启动以进入工作状态;其中,所述模数转换模块,用于在进入工作状态后将所述输入声音信号转换成数字声音信号,并将所述数字声音信号传输至所述关键词检测模块;所述关键词检测模块,用于在进入工作状态后对接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
可选的,语音唤醒系统还包括连接于所述模数转换模块和所述关键词检测模块之间的输入声音信号缓存模块;所述输入声音信号缓存模块,用于存储所述关键词检测模块进入工作状态之前所述模数转换模块输出的数字声音信号;所述关键词检测模块,还用于在进入工作状态后对从所述模数转换模块和所述输入声音信号缓存模块接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
可选的,语音唤醒系统还包括连接于所述输入声音信号缓存模块与连接的所述关键词检测模块之间的第二语音活动检测模块;所述第二语音活动检测模块,用于对所述输入声音信号缓存模块存储的数字声音信号进行检测以确定所述数字声音信号是否包含语音信号,并在所述数字声音信号包含语音信号的情况下,指示所述关键词检测模块启动以进入工作状态;所述关键词检测模块,还用于在进入工作状态后对从所述输入声音信号缓存模块接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
可选的,所述模拟信号检测电路采用如下任一种方式或结合如下多种方式对接收到的输入声音信号进行检测;1)采用基于短时能量的检测方式;2)采用信号峰值检测的检测方式;3)采用信号过零检测的检测方式。
可选的,所述模拟信号检测电路采用基于短时能量的检测方式对接收到的输入声音信号进行检测;所述模拟信号检测电路包括:整流电路、RC积分电路以及比较电路;其中,所述整流电路,用于将接收到所述输入声音信号进行整流以输出整流声音信号;所述RC积分电路,用于将所述整流声音信号在电容上进行积分以得到所述整流声音信号的积分电压;所述比较电路,用于比较所述积分电压与第一参考电压以确定接收到的所述输入声音信号的平均能量是否大于预设门限,若所述输入声音信号的平均能量大于所述预设门限,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
可选的,所述模拟信号检测电路采用信号峰值检测的检测方式对接收到的输入声音信号进行检测;所述模拟信号检测电路包括信号峰值检测电路;所述信号峰值检测电路用于从所述输入声音信号中提取信号波形峰值,若所述信号波形峰值大于预设峰值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
可选的,所述模拟信号检测电路采用信号过零检测的检测方式对接收到的输入声音信号进行检测;所述模拟信号检测电路包括信号过零检测电路;所述信号过零检测电路用于记录在预设时间段内采集的所述输入声音信号的电压大于第二参考电压的次数,若所述次数大于预设次数阈值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
可选的,所述待唤醒模块在未接收到所述唤醒信号产生模块产生的所述唤醒信号时处于休眠状态。
另一方面,基于上述语音唤醒系统,本发明实施例还提供了一种语音识别系统,包括上述语音唤醒系统。
与现有技术相比,本技术方案至少具有如下有益效果:
根据本发明实施例提供的语音唤醒系统,在第一语音活动检测模块中包括模拟信号检测电路和唤醒信号产生模块,通过模拟信号检测电路可以对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号,再由唤醒信号产生模块在模拟信号检测电路确定输入声音信号为语音信号的情况下产生唤醒信号,进而模数转换模块和关键词检测模块在接收到唤醒信号时启动,通过模数转换模块将输入声音信号转换成数字声音信号,再经由关键词检测模块对接收到的数字声音信号进行检测,以确定数字声音信号中包含的关键词。由于模数转换模块和关键词检测模块在未接收唤醒信号时,一直处于休眠状态,因此功率消耗很低。
进一步,由于语音活动检测模块可以直接对模拟的输入声音信号进行检测,不需要采用高精度的模数转换电路将模拟的输入声音信号转换成数字信号,而唤醒信号产生模块只需要采用低精度的模数转换电路,相比于高精度的模数转换电路,功率消耗很低。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的语音唤醒系统的一个具体实施例的结构示意图;
图2是本发明实施例提供的语音唤醒系统的另一个具体实施例的结构示意图;
图3是本发明实施例提供的语音唤醒系统的又一个具体实施例的结构示意图;
图4是图1所示的语音唤醒系统中模拟信号检测电路的一种具体实施例的电路示意图;
图5A是图1所示的语音唤醒系统中模拟信号检测电路的另一种具体实施例的电路示意图;
图5B是基于图5A所示的模拟信号检测电路的一种唤醒信号产生模块的电路示意图;
图6A是图1所示的语音唤醒系统中模拟信号检测电路的又一种具体实施例的电路示意图;
图6B是基于图6A所示的模拟信号检测电路的一种唤醒信号产生模块的电路示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1是本发明实施例提供的语音唤醒系统的一个具体实施例的结构示意图。
参考图1,所述语音唤醒系统1包括第一语音活动检测模块11和模数转换模块12以及关键词检测(Spoken Keyword Spotting)模块13。在本实施例中,由于所述语音唤醒系统1在工作状态下会不断地接收到外部的输入声音信号,接收到的输入声音信号包括噪声信号和有效的语音信号。其中,所述输入声音信号为模拟信号。所述语音唤醒系统1通过所述第一语音活动检测模块11对接收到的输入声音信号进行检测,以识别所述输入声音信号是否为语音信号。
与现有技术不同,本实施例中,所述第一语音活动检测模块11包括模拟信号检测电路111和唤醒信号产生模块112。其中,所述模拟信号检测电路111用于对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号。由于所述模拟信号检测电路111可以直接对模拟信号进行检测,因此所述语音唤醒系统1接收到输入声音信号后不需要将其转换为数字信号。
所述唤醒信号产生模块112用于在所述模拟信号检测电路111确定所述输入声音信号为语音信号的情况下产生唤醒信号。由于所述唤醒信号产生模块112只需要将所述模拟信号检测电路111产生的检测结果信号(模拟信号)转换成唤醒信号(数字信号),例如,若所述模拟信号检测电路111确定所述输入声音信号为语音信号,则产生一个高电平信号作为唤醒信号,这样当所述模数转换模块12和关键词检测模块13接收到该高电平信号时即启动进入工作状态。所述模数转换模块12和关键词检测模块13在未接收到所述唤醒信号产生模块112产生的所述唤醒信号时,处于休眠状态。
因此,所述唤醒信号产生模块112的数据处理量很小,可以采用低精度的模数转换电路,相比于高精度的模数转换电路,其功率消耗很小。
本实施例中,所述语音唤醒系统1在确定接收到的输入声音信号为语音信号时,需要进一步检测语音信号中的关键词,以识别出所述语音信号的内容,从而执行相应的操作。
具体地,当所述模数转换模块12和所述关键词检测模块13接收到唤醒信号以进入工作状态时,所述模数转换模块12可以是一个高精度的模数转换电路,用于在进入工作状态后将所述输入声音信号转换成数字声音信号,并将所述数字声音信号传输至所述关键词检测模块13。所述关键词检测模块13用于在进入工作状态后对接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
所述模拟信号检测电路111可以采用多种不同的信号检测方法对输入的声音信号进行检测,在下文的实施例中将详细描述所述模拟信号检测电路111的不同检测方式。
需要说明的是,图1所示的语音唤醒系统1中示意了一个待唤醒的模块包括模数转换模块12和关键词检测模块13,在实际应用中,所述语音唤醒系统1可以包括其他待唤醒的模块。
图2是本发明实施例提供的语音唤醒系统的另一个具体实施例的结构示意图。参考图2,所述语音唤醒系统2包括第一语音活动检测模块21和模数转换模块22、关键词检测模块23以及输入声音信号缓存模块24。其中,所述第一语音活动检测模块21包括模拟信号检测电路211和唤醒信号产生模块212。其中,所述模拟信号检测电路211用于对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号。由于所述模拟信号检测电路211可以直接对模拟信号进行检测,因此所述语音唤醒系统2接收到输入声音信号后不需要将其转换为数字信号。
与上述图1所述的实施例不同,本实施例中,所述语音唤醒系统2还包括连接于所述模数转换模块22和所述关键词检测模块23之间的输入声音信号缓存模块24。所述输入声音信号缓存模块24用于存储所述关键词检测模块23进入工作状态之前所述模数转换模块23输出的数字声音信号。
发明人考虑,在实际应用中,由于模拟信号检测电路211对输入声音信号的检测过程需要一定时间,并且当检测到输入声音信号为语音信号时产生唤醒信号并唤醒所述模数转换模块22和所述关键词检测模块23也需要一定时间,因此当所述关键词检测模块23启动进入工作状态时,可能会遗漏部分输入声音信号。因此,在本实施例中,利用所述输入声音信号缓存模块24缓存所述关键词检测模块23启动进入工作状态之前所述模数转换模块23输出的数字声音信号,从而使所述关键词检测模块23在进入工作状态后,可以从所述输入声音信号缓存模块24接收到的所述数字声音信号(包括所述关键词检测模块23进入工作状态之前和进入工作状态之后的数字声音信号)进行检测,以确定所述数字声音信号中包含的关键词。
图3是本发明实施例提供的语音唤醒系统的又一个具体实施例的结构示意图。参考图3,所述语音唤醒系统3包括第一语音活动检测模块31和模数转换模块32、关键词检测模块33、输入声音信号缓存模块34以及第二语音活动检测模块35。其中,所述第一语音活动检测模块31包括模拟信号检测电路311和唤醒信号产生模块312。其中,所述模拟信号检测电路311用于对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号。由于所述模拟信号检测电路311可以直接对模拟信号进行检测,因此所述语音唤醒系统3接收到输入声音信号后不需要将其转换为数字信号。
与上述图2所述的实施例不同,本实施例中,所述语音唤醒系统3还包括连接于所述输入声音信号缓存模块34与连接的所述关键词检测模块33之间的第二语音活动检测模块35。其中,所述第二语音活动检测模块35用于对所述输入声音信号缓存模块34存储的数字声音信号进行检测以确定所述数字声音信号是否包含语音信号,并在所述数字声音信号包含语音信号的情况下,指示所述关键词检测模块33启动以进入工作状态。
其中,所述第二语音活动检测模块35不同于所述第一语音活动检测模块31,所述第一语音活动检测模块31是对模拟信号(即所述输入声音信号)进行检测,而所述第二语音活动检测模块35是对数字信号(即模数转换模块32输出的所述数字声音信号)进行检测。
因此,本实施例中,利用所述第二语音活动检测模块35对所述模数转换模块32输出的所述数字声音信号进行检测以识别其中是否包含语音信号,只有当检测到所述数字声音信号中包含语音信号时,指示所述关键词检测模块33启动以进入工作状态。进而所述关键词检测模块33在进入工作状态后对从所述输入声音信号缓存模块34接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
可以看出,在这种情形下,当所述关键词检测模块33接收到所述第一语音活动检测模块31发出的唤醒信号以进入工作状态后,由于所述语音唤醒系统3后续接收到的输入声音信号不一定持续包含语音信号,因此进一步利用所述第二语音活动检测模块35对所述模数转换模块32输出的所述数字声音信号进行检测以识别其中是否包含语音信号,并在所述数字声音信号包含语音信号的情况下,指示所述关键词检测模块33启动以进入工作状态。这样可以进一步节省所述关键词检测模块33的功耗。
在本发明实施例中,模拟信号检测电路可以采用如下任一种方式或结合如下多种方式对接收到的输入声音信号进行检测,包括:1)采用基于短时能量的检测方式;2)采用信号峰值检测的检测方式;以及3)采用信号过零检测的检测方式。
需要说明的是,模拟信号检测电路可以采用其中任一种方式对接收到的输入声音信号进行检测,但是单一的检测方式往往检测精度不高,因此在实际应用中,可以采用多种方式相结合(例如,结合基于短时能量的检测方式和采用信号过零检测的检测方式)来对接收到的输入声音信号进行检测,这样可以有效提高检测精度。
下面将分别针对这三种检测方式详细描述模拟信号检测电路的电路实现方式。
图4是图1所示的语音唤醒系统中模拟信号检测电路的一种具体实施例的电路示意图。参考图4,所述模拟信号检测电路41包括:整流电路411、RC积分电路412以及比较电路413。
在本实施例中,所述模拟信号检测电路41采用基于短时能量(Short TimeEnergy,简称STE)的检测方式。本领域技术人员理解,语音信号是随时间变化的非平稳随机过程,因此对于语音信号的分析一般都是短时分析。这是因为语音信号虽然是时变的但是具有短时相关性,因此,语音信号的状态是不会发生突变,语音信号在短时间内语音信号的特性基本不变,即语音信号的短时平稳性。因此,采用基于STE对输入声音信号进行检测可以识别出当前接收到输入声音信号是否为语音信号。
具体来说,所述整流电路411,用于将接收到所述输入声音信号进行整流以输出整流声音信号。由于输入声音信号存在正方向与负方向的分量,因此利用所述整流电路411对输入声音信号取绝对值,即输入声音信号的负方向分量均变为了正方向分量,但负方向分量的幅度值维持不变,因此输入声音信号经过所述整流电路411后输出的整流声音信号为单方向(都为正方向)分量的信号。在实际应用中,所述整流电路411在对输入声音信号进行整流后,还可以进一步放大输出整流声音信号,从而放宽后级所述比较电路413的精度。
所述整流电路411输出的整流声音信号经过所述RC积分电路412对所述整流声音信号在电容上进行积分,以得到所述整流声音信号的积分电压。然后,再通过所述比较电路413比较所述积分电压与第一参考电压以确定接收到的所述输入声音信号的平均能量是否大于预设门限。其中,所述第一参考电压和预设门限可以根据不同的语音唤醒系统的应用场景来设定。由于语音信号的平均能量明显高于静音或者噪音的平均能量,因此通过分析一段时间内接收到的输入声音信号的短时能量可以识别输入声音信号是否为语音信号,即若所述输入声音信号的平均能量大于所述预设门限,则所述模拟信号检测电路21确定所述输入声音信号为语音信号。
需要说明的是,本实施例中,所述整流电路411、所述RC积分电路412以及所述比较电路413可以有多种不同的电路实现方式,在此不一一列举,本领域技术人员可以根据实际应用场景设计不同的整流电路、RC积分电路以及比较电路的具体电路结构,在此不再赘述。
图5A是图1所示的语音唤醒系统中模拟信号检测电路的另一种具体实施例的电路示意图。
在本实施例中,所述模拟信号检测电路采用信号峰值检测(Peak Detector)的方式。参考图5A,所述模拟信号检测电路包括信号峰值检测电路51,所述信号峰值检测电路51用于从所述输入声音信号中提取信号波形峰值,若所述信号波形峰值大于预设峰值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
具体来说,所述信号峰值检测电路51包括:比较器511、NMOS晶体管512、电容513以及恒流源514。其中,所述比较器511的正相输入端接收输入声音信号的电压Vin、所述比较器511的反相输入端接收所述电容513存储的电压Vc,所述比较器511的输出端连接至所述NMOS晶体管512的栅极。所述NMOS晶体管512的第一极(源极或漏极)连接至稳压Vcc,所述NMOS晶体管512的第二极(漏极或源极)连接至所述电容513的一端,所述电容513的另一端接地。所述恒流源514的一端连接至所述NMOS晶体管512的第二极(漏极或源极),所述恒流源514的另一端接地。
所述比较器511比较所述输入声音信号的电压Vin与所述电容513存储的电压Vc。当所述输入声音信号的电压Vin大于所述电容513存储的电压Vc时,所述比较器511的输出端输出高电平信号至所述NMOS晶体管312的栅极,以使所述NMOS晶体管512导通,所述NMOS晶体管的源漏极产生的电流使得所述电容513的电压Vc跟随所述输入声音信号的电压Vin;而当所述输入声音信号的电压Vin小于所述电容513存储的电压Vc,所述比较器511的输出端输出低电平信号至所述NMOS晶体管512的栅极,以使所述NMOS晶体管512截止,此时所述电容513会被所述恒流源514放电,而所述恒流源514的电流Ib较小,不会引起快速变化,因此可以从所述输入声音信号中提取信号波形峰值Vpeak。
由于语音信号的信号波形峰值明显高于静音或者噪音的信号波形峰值,因此通过检测输入声音信号的信号波形峰值可以判断是否为语音信号,若所述信号波形峰值大于预设峰值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。其中,所述预设峰值可以根据不同的语音唤醒系统的应用场景来设定。
需要说明的是,图5A仅是示意图,在实际应用中,信号峰值检测电路的电路实现方式不限于图5A所示的电路结构示意图,本领域技术人员可以根据不同的应用场景设计其他不同的信号峰值检测电路,在此不再赘述。
基于图5A所示的模拟信号检测电路,本实施例还提供了一种唤醒信号产生模块的一个具体实施例的电路示意图。
图5B是基于图5A所示的模拟信号检测电路的一种唤醒信号产生模块的电路示意图。
结合参考图5A和图5B,所述唤醒信号产生模块52包括比较器521,所述比较器521的正相输入端接收由图5A所示的模拟信号检测电路从所述输入声音信号中提取的信号波形峰值Vpeak、所述比较器511的反相输入端输入信号波形峰值的预设峰值阈值Vth,通过比较输入声音信号的信号波形峰值Vpeak与预设峰值阈值Vth,当Vpeak>Vth,则所述比较器521的输出端输出唤醒信号。
需要说明的是,图5B仅是示意图,在实际应用中,唤醒信号产生模块的电路实现方式不限于图5B所示的电路结构示意图,本领域技术人员可以根据不同的应用场景设计其他不同的唤醒信号产生模块,在此不再赘述。
图6A是图1所示的语音唤醒系统中模拟信号检测电路的又一种具体实施例的电路示意图。
在本实施例中,所述模拟信号检测电路采用信号过零检测(Cross ZeroDetector)的方式。参考图6A,所述模拟信号检测电路包括所述信号过零检测电路61,所述信号过零检测电路61用于记录在预设时间段内采集的所述输入声音信号的电压大于第二参考电压(例如,所述第二参考电压为零)的次数,若所述次数大于预设次数阈值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
具体来说,所述信号过零检测电路61包括:迟滞比较器611、计数器612。其中,所述迟滞比较器611为带时钟的迟滞比较器,所述迟滞比较器611的正相输入端接收所述输入声音信号的电压Vin、所述比较器611的反相输入端接收一个预设的参考电压(即所述第二参考电压),所述比较器611的输出端输出信号Vout,且所述输出信号Vout传输至所述计数器612。若在所述时钟的上升沿时刻,所述输入声音信号的电压Vin大于所述第二参考电压,则所述比较器611的输出端输出信号Vout为1;反之,若在所述时钟的上升沿时刻,所述输入声音信号的电压Vin小于所述第二参考电压,则所述比较器611的输出端输出信号Vout为0。所述输出信号Vout传输至所述计数器612,通过所述计数器612可以统计在一段预设时间内所述比较器611的输出端输出信号Vout为1的次数,即所述输入声音信号的电压过零的次数,若所述次数大于预设次数阈值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。其中,所述预设次数阈值可以根据不同的语音唤醒系统的应用场景来设定。
需要说明的是,图6A仅是示意图,在实际应用中,信号过零检测电路的电路实现方式不限于图6所示的电路结构示意图,本领域技术人员可以根据不同的应用场景设计其他不同的信号过零检测电路,在此不再赘述。
基于图6A所示的模拟信号检测电路,本实施例还提供了一种唤醒信号产生模块的一个具体实施例的电路示意图。
图6B是基于图6A所示的模拟信号检测电路的一种唤醒信号产生模块的电路示意图。
结合参考图6A和图6B,所述唤醒信号产生模块62包括数值比较器621,所述数值比较器621的一个输入端接收由图6A所示的模拟信号检测电路中所述计数器612统计的在一段预设时间内所述比较器611的输出端输出信号Vout为1的次数数值;所述数值比较器621的另一个输入端输入预设次数阈值,所述数值比较器621通过比较由计数器612输出的次数数值与预设次数阈值之间的大小关系,当计数器612输出的次数数值>预设次数阈值,则所述数值比较器621的输出端输出唤醒信号。
需要说明的是,图5B仅是示意图,在实际应用中,唤醒信号产生模块的电路实现方式不限于图5B所示的电路结构示意图,本领域技术人员可以根据不同的应用场景设计其他不同的唤醒信号产生模块,在此不再赘述。
在其他实施例中,所述模拟信号检测电路还可以采用其他检测方式来实现(例如信号波形幅度检测等),在此不再一一列举。进一步,所述模拟信号检测电路还可以采用模拟电路神经网络来实现,根据实际应用中的不同场景训练该模拟电路神经网络,以使训练完成后的模拟电路神经网络可以对输入声音信号进行检测。
本发明实施例还提供了一种语音识别系统。所述语音识别系统包括上述实施例中所述的语音唤醒系统。在所述语音唤醒系统识别到麦克风输入的音频信号为语音信号时,唤醒所述语音唤醒系统中的模数转换模块和关键词检测模块以及语音识别系统中的其他需要唤醒的处于休眠状态的模块,以使所述语音识别系统进入工作状态。
综上所述,采用本技术方案提供的语音唤醒系统,在第一语音活动检测模块中包括模拟信号检测电路和唤醒信号产生模块,通过模拟信号检测电路可以对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号,再由唤醒信号产生模块在模拟信号检测电路确定输入声音信号为语音信号的情况下产生唤醒信号,进而模数转换模块和关键词检测模块待唤醒模块在接收到唤醒信号时启动,通过模数转换模块将输入声音信号转换成数字声音信号,再经由关键词检测模块对接收到的数字声音信号进行检测,以确定数字声音信号中包含的关键词。由于模数转换模块和关键词检测模块待唤醒模块(例如主模数转换电路)在未接收唤醒信号时,一直处于休眠状态,因此功率消耗很低。
进一步,由于语音活动检测模块可以直接对模拟的输入声音信号进行检测,不需要采用高精度的模数转换电路将模拟的输入声音信号转换成数字信号,而唤醒信号产生模块只需要采用低精度的模数转换电路,相比于高精度的模数转换电路,功率消耗很低。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (9)
1.一种语音唤醒系统,其特征在于,包括:
第一语音活动检测模块、模数转换模块和关键词检测模块;其中,
所述第一语音活动检测模块包括:模拟信号检测电路和唤醒信号产生模块;其中,所述模拟信号检测电路,用于对接收到的输入声音信号进行检测以确定所述输入声音信号是否为语音信号;所述唤醒信号产生模块,用于在所述模拟信号检测电路确定所述输入声音信号为语音信号的情况下产生唤醒信号;
所述模数转换模块和所述关键词检测模块在接收到所述唤醒信号时启动以进入工作状态;其中,
所述模数转换模块,用于在进入工作状态后将所述输入声音信号转换成数字声音信号,并将所述数字声音信号传输至所述关键词检测模块;
所述关键词检测模块,用于在进入工作状态后对接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
2.如权利要求1所述的语音唤醒系统,其特征在于,还包括连接于所述模数转换模块和所述关键词检测模块之间的输入声音信号缓存模块;
所述输入声音信号缓存模块,用于存储所述关键词检测模块进入工作状态之前所述模数转换模块输出的数字声音信号;
所述关键词检测模块,还用于在进入工作状态后对从所述输入声音信号缓存模块接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
3.如权利要求2所述的语音唤醒系统,其特征在于,还包括连接于所述输入声音信号缓存模块与连接的所述关键词检测模块之间的第二语音活动检测模块;
所述第二语音活动检测模块,用于对所述输入声音信号缓存模块存储的数字声音信号进行检测以确定所述数字声音信号是否包含语音信号,并在所述数字声音信号包含语音信号的情况下,指示所述关键词检测模块启动以进入工作状态;
所述关键词检测模块,还用于在进入工作状态后对从所述输入声音信号缓存模块接收到的所述数字声音信号进行检测,以确定所述数字声音信号中包含的关键词。
4.如权利要求1所述的语音唤醒系统,其特征在于,所述模拟信号检测电路采用如下任一种方式或结合如下多种方式对接收到的输入声音信号进行检测;
1)采用基于短时能量的检测方式;
2)采用信号峰值检测的检测方式;
3)采用信号过零检测的检测方式。
5.如权利要求4所述的语音唤醒系统,其特征在于,所述模拟信号检测电路采用基于短时能量的检测方式对接收到的输入声音信号进行检测;所述模拟信号检测电路包括:整流电路、RC积分电路以及比较电路;其中,
所述整流电路,用于将接收到所述输入声音信号进行整流以输出整流声音信号;
所述RC积分电路,用于将所述整流声音信号在电容上进行积分以得到所述整流声音信号的积分电压;
所述比较电路,用于比较所述积分电压与第一参考电压以确定接收到的所述输入声音信号的平均能量是否大于预设门限,若所述输入声音信号的平均能量大于所述预设门限,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
6.如权利要求4所述的语音唤醒系统,其特征在于,所述模拟信号检测电路采用信号峰值检测的检测方式对接收到的输入声音信号进行检测;所述模拟信号检测电路包括信号峰值检测电路;
所述信号峰值检测电路用于从所述输入声音信号中提取信号波形峰值,若所述信号波形峰值大于预设峰值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
7.如权利要求4所述的语音唤醒系统,其特征在于,所述模拟信号检测电路采用信号过零检测的检测方式对接收到的输入声音信号进行检测;所述模拟信号检测电路包括信号过零检测电路;
所述信号过零检测电路用于记录在预设时间段内采集的所述输入声音信号的电压大于第二参考电压的次数,若所述次数大于预设次数阈值,则所述模拟信号检测电路确定所述输入声音信号为语音信号。
8.如权利要求1所述的语音唤醒系统,其特征在于,所述待唤醒模块在未接收到所述唤醒信号产生模块产生的所述唤醒信号时处于休眠状态。
9.一种语音识别系统,其特征在于,包括权利要求1~8中任一项所述的语音唤醒系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911113959.5A CN112885339A (zh) | 2019-11-14 | 2019-11-14 | 语音唤醒系统及语音识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911113959.5A CN112885339A (zh) | 2019-11-14 | 2019-11-14 | 语音唤醒系统及语音识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112885339A true CN112885339A (zh) | 2021-06-01 |
Family
ID=76038248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911113959.5A Pending CN112885339A (zh) | 2019-11-14 | 2019-11-14 | 语音唤醒系统及语音识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112885339A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114512127A (zh) * | 2022-01-29 | 2022-05-17 | 深圳市九天睿芯科技有限公司 | 语音控制方法、装置、设备、介质及智能语音采集系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424343A (zh) * | 2013-09-11 | 2015-03-18 | 中兴通讯股份有限公司 | 一种信息查询方法及终端设备 |
CN104464737A (zh) * | 2013-09-12 | 2015-03-25 | 联发科技股份有限公司 | 声音验证系统和声音验证方法 |
CN105430543A (zh) * | 2016-01-07 | 2016-03-23 | 歌尔声学股份有限公司 | 数字麦克风和电子设备 |
CN105632491A (zh) * | 2014-11-26 | 2016-06-01 | 三星电子株式会社 | 用于语音识别的方法和电子装置 |
CN205408096U (zh) * | 2016-01-07 | 2016-07-27 | 歌尔声学股份有限公司 | 数字麦克风和电子设备 |
CN108877802A (zh) * | 2018-05-29 | 2018-11-23 | 康佳集团股份有限公司 | 一种集成语音唤醒功能的电路、电视和语音控制方法 |
CN110335603A (zh) * | 2019-07-12 | 2019-10-15 | 四川长虹电器股份有限公司 | 应用于电视场景的多模态交互方法 |
CN110364143A (zh) * | 2019-08-14 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置及其智能电子设备 |
-
2019
- 2019-11-14 CN CN201911113959.5A patent/CN112885339A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424343A (zh) * | 2013-09-11 | 2015-03-18 | 中兴通讯股份有限公司 | 一种信息查询方法及终端设备 |
CN104464737A (zh) * | 2013-09-12 | 2015-03-25 | 联发科技股份有限公司 | 声音验证系统和声音验证方法 |
CN105632491A (zh) * | 2014-11-26 | 2016-06-01 | 三星电子株式会社 | 用于语音识别的方法和电子装置 |
CN105430543A (zh) * | 2016-01-07 | 2016-03-23 | 歌尔声学股份有限公司 | 数字麦克风和电子设备 |
CN205408096U (zh) * | 2016-01-07 | 2016-07-27 | 歌尔声学股份有限公司 | 数字麦克风和电子设备 |
CN108877802A (zh) * | 2018-05-29 | 2018-11-23 | 康佳集团股份有限公司 | 一种集成语音唤醒功能的电路、电视和语音控制方法 |
CN110335603A (zh) * | 2019-07-12 | 2019-10-15 | 四川长虹电器股份有限公司 | 应用于电视场景的多模态交互方法 |
CN110364143A (zh) * | 2019-08-14 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置及其智能电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114512127A (zh) * | 2022-01-29 | 2022-05-17 | 深圳市九天睿芯科技有限公司 | 语音控制方法、装置、设备、介质及智能语音采集系统 |
CN114512127B (zh) * | 2022-01-29 | 2023-12-26 | 深圳市九天睿芯科技有限公司 | 语音控制方法、装置、设备、介质及智能语音采集系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10535365B2 (en) | Analog voice activity detection | |
CN104867495B (zh) | 声音辨识设备及其操作方法 | |
US9775113B2 (en) | Voice wakeup detecting device with digital microphone and associated method | |
US10867611B2 (en) | User programmable voice command recognition based on sparse features | |
KR102335717B1 (ko) | 음성 제어 시스템 및 그 웨이크업 방법, 웨이크업 장치 및 가전제품, 코프로세서 | |
US9721560B2 (en) | Cloud based adaptive learning for distributed sensors | |
CN110364143B (zh) | 语音唤醒方法、装置及其智能电子设备 | |
US9779725B2 (en) | Voice wakeup detecting device and method | |
CN110244833B (zh) | 麦克风组件 | |
US9785706B2 (en) | Acoustic sound signature detection based on sparse features | |
US9466288B2 (en) | Comparing differential ZC count to database to detect expected sound | |
US10573305B2 (en) | Voice control system and method thereof | |
US9349386B2 (en) | System and method for processor wake-up based on sensor data | |
US9838810B2 (en) | Low power audio detection | |
US20150066498A1 (en) | Analog to Information Sound Signature Detection | |
Giraldo et al. | 18μW SoC for near-microphone keyword spotting and speaker verification | |
CN103021411A (zh) | 语音控制装置和语音控制方法 | |
CN109272991B (zh) | 语音交互的方法、装置、设备和计算机可读存储介质 | |
US20140067388A1 (en) | Robust voice activity detection in adverse environments | |
KR20140106656A (ko) | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 | |
CN110022155B (zh) | 一种采样阈值随输入信号变化的异步过电平采样模数转换器 | |
CN112951243A (zh) | 语音唤醒方法、装置、芯片、电子设备及存储介质 | |
CN112885339A (zh) | 语音唤醒系统及语音识别系统 | |
CN104112453A (zh) | 一种音频预处理系统 | |
WO2018152034A1 (en) | Voice activity detector and methods therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210601 |
|
RJ01 | Rejection of invention patent application after publication |