CN204856459U

CN204856459U - 可识别声源位置的关键词语音唤醒系统及移动终端

Info

Publication number: CN204856459U
Application number: CN201520243575.6U
Authority: CN
Inventors: 叶菁华
Original assignee: Yutaixin Microelectronics Technology Shanghai Co Ltd; Zilltek Technology Corp
Current assignee: Yutaixin Microelectronics Technology Shanghai Co Ltd; Zilltek Technology Corp
Priority date: 2015-04-20
Filing date: 2015-04-20
Publication date: 2015-12-09
Anticipated expiration: 2025-04-20

Abstract

本实用新型涉及一种语音信号处理技术领域，尤其涉及一种可识别声源位置的关键词语音唤醒系统及方法及移动终端。包括：采集单元，包括第一采集器和第二采集器，第一采集器与第二采集器之间设置一预定间隙；延时单元，设置一预定延时，用以接收第一采集信号，并对第一采集信号做延时处理形成第一延迟信号输出；计算单元，用以分别接收第二采集信号和第一延时信号，对第二采集信号和第一延时信号进行计算形成一计算结果输出；控制单元，用以接收计算单元输出的计算结果，于第二采集信号匹配一预定的关键词唤醒指令的状态下，结合计算结果形成一控制信号输出；唤醒单元，用以于控制信号的作用下唤醒移动终端。

Description

可识别声源位置的关键词语音唤醒系统及移动终端

技术领域

本实用新型涉及一种语音信号处理技术领域，尤其涉及一种可识别声源位置的关键词语音唤醒系统及移动终端。

背景技术

人类语音交流过程中所采用的词通常是声带振动产生的元音搭配该振动在喉、舌、唇、颚、口腔内的气流形成的辅音相结合形成的，即元音会产生能量，辅音仅为气声，大部分有实质含义的词均先以辅音开始，而以元音开始的词大多为语气助词，如“啊”、“哦”“嗯”……等词都是以元音开始的词。

现有的移动终端中，唤醒系统主要有手动唤醒系统，即常用的通过开始启动按键激活移动终端；此种方式，长期使用，容易造成按键的失灵，同时功耗较大；动作唤醒系统，即在移动终端内设置有加速度传感器，加速度传感器检测是否存在有加速度(例如移动平躺放置的移动终端即存在一个加速度)产生，于加速度满足预定条件时，激活移动终端，此种方式需要搭配一个加速度传感器，成本较高，且加速度传感器功耗较大；例如挥动移动终端即可激活移动终端；语音唤醒系统，语音唤醒系统检测人类语音的活性，即只要检测到任意元音或者辅音，都可以激活处于待机状态中的移动终端，采用语音唤醒系统，功耗较低，且成本较低，但是此种语音唤醒系统只在听到人类语音信息即可激活，容易出现误操作，任意人均可激活移动终端，在人数较多的场合，移动终端一直处于工作状态，功耗较大，激活准确率低。现有的语音唤醒还存在一缺陷，即移动终端处于反扣状态(即屏幕发光方向没有障碍物)，因用户无意发出的语音指令，也可导致移动终端被唤醒，而此种状态下的唤醒不具有实质性的意义，导致电能或者功耗被浪费。

实用新型内容

针对现有技术的不足，本实用新型提供一种功耗低、激活准确率高、误操作低的一种可识别声源位置的关键词语音唤醒系统及移动终端。

一种可识别声源位置的关键词语音唤醒系统，其中：包括：

一采集单元，包括第一采集器和第二采集器，所述第一采集器与所述第二采集器之间设置一预定间隙，所述第一采集器和所述第二采集器用以于当前所处环境中的声音信号达到预定幅度时分别采集所述声音信号，并分别形成第一采集信号和第二采集信号输出；

一延时单元，设置一预定延时，用以接收所述第一采集信号，并对所述第一采集信号做延时处理形成第一延迟信号输出；

一计算单元，用以分别接收所述第二采集信号和所述第一延时信号，对所述第二采集信号和所述第一延时信号进行计算形成一计算结果输出；

一控制单元，用以接收所述计算单元输出的所述计算结果，于所述第二采集信号匹配一预定的关键词唤醒指令的状态下，结合所述计算结果形成一控制信号输出；

一唤醒单元，用以于所述控制信号的作用下唤醒移动终端。

上述的可识别声源位置关键词语音唤醒系统，其中：所述控制单元包括一判断单元，用以接收所述计算结果，

于所述计算结果不为零的状态，判断所述声源位于所述移动终端屏幕的发光方向；

于所述计算结果为零的状态，判断所述声源位于所述移动终端的所述发光方向的任意侧或背面；

所述控制单元于所述声源位于所述移动终端屏幕的发光方向的状态下，发出允许激活所述移动终端的控制信号。

上述的可识别声源位置关键词语音唤醒系统，其中：所述预定延时匹配所述第一采集器与所述第二采集器之间的预定间距。

上述的可识别声源位置关键词语音唤醒系统，其中：还包括一非挥发存储单元，连接所述控制单元，用以存储预定的所述关键词唤醒指令。

上述的可识别声源位置关键词语音唤醒系统，其中：还包括一训练单元，连接于所述采集单元与所述非挥发存储单元之间，用以于所述移动终端运行于一训练模式下，所述采集单元用以接收用户发出的复数个语音唤醒指令，并根据复数个所述语音唤醒指令形成预设的所述关键词唤醒指令，并输出至所述非挥发存储单元存储。

上述的可识别声源位置关键词语音唤醒系统，其中：所述训练单元包括

一积分单元，连接所述第二采集器，用以对预设的所述关键词唤醒指令进行积分计算预设的所述关键词唤醒指令的标准能量信息、标准幅值信息；

一计时单元，连接所述采集单元，用以计算预设的所述关键词唤醒指令的标准时间信息。

上述的可识别声源位置关键词语音唤醒系统，其中：所述预设的关键词唤醒指令至少包括标准能量信息、标准幅值信息、标准时间信息，

所述判断单元于所述采集信号至少匹配所述标准能量信息、和所述标准幅值信息、和所述标准时间信息时输出所述判断结果为允许激活所述移动终端。

上述的可识别声源位置关键词语音唤醒系统，其中：所述训练模式由所述移动终端的控制单元控制形成。

一种移动终端，其中：包括上述任一项所述的关键词语音唤醒系统，所述关键词语音唤醒系统设置于所述移动终端内，用以于接收到一包含有预定的所述关键词的语音信号后，将所述移动终端的运行模式从待机模式切换至工作模式。

与现有技术相比，本实用新型的优点是：

本实用新型预设有关键词唤醒指令，关键词唤醒指令可根据用户的喜好自行设置，通过声音幅度结合采集单元的时延判断声源位置，控制单元根据声源位置输出控制信号以激活移动终端。有效避免了用户在无法使用移动终端的状态下误激活移动终端，进一步降低了移动终端的功耗。

附图说明

图1为本实用新型关键词语音唤醒系统的结构示意图。

具体实施方式

下面结合附图和具体实施例对本实用新型作进一步说明，但不作为本实用新型的限定。

下面将结合本实用新型实施例中的附图，对本实用新型实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本实用新型一部分实施例，而不是全部的实施例。基于本实用新型中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本实用新型保护的范围。

需要说明的是，在不冲突的情况下，本实用新型中的实施例及实施例中的特征可以相互组合。

如图1所示，一种可识别声源位置的关键词语音唤醒系统，其特征在于：包括：

一采集单元，包括第一采集器和第二采集器，所述第一采集器与所述第二采集器设置一预定间隙，所述第一采集器和所述第二采集器用以于当前所处环境中的声音信号达到预定幅度时分别采集所述声音信号，并分别形成第一采集信号和第二采集信号输出；该预定幅值通常为用户正对移动终端时的声音幅度，因为当移动终端的屏幕背对用户时，即使激活移动终端，用户也无法使用。

一唤醒单元，用以于所述控制信号的作用下唤醒所述移动终端。

一种关键词语音唤醒系统的工作原理：所述第一采集器采集当前所处环境中的声音信号形成第一采集信号输出至所述时延单元，所述第二采集器采集当前所处环境中的声音信号形成第二采集信号输出至所述计算单元；所述时延单元对所述第一采集信号做延时处理形成第一延迟信号输出至所述计算单元，所述计算单元根据所述对所述第二采集信号和所述第一延时信号进行计算形成一计算结果输出；控制单元接收所述计算单元输出的所述计算结果，于所述第二采集信号匹配一预定的关键词唤醒指令的状态下，结合所述计算结果形成一控制信号输出，唤醒单元于所述控制信号的作用下唤醒所述移动终端，其中，计算结果包括两种状态，一种为零状态，即第一延时信号与第二采集信号完全相同，则此时可以判断为所述声源位于所述移动终端的侧面，(此处强调一下，也可以将第二采集器连接延时单元，对第二采集信号多延时处理，原理同上。)，因延时单元的预定延时匹配第一采集器和第二采集器之间的预定间隙，预定延时通常设定为预定间隙与声音传播速度的比值。

假设，第一采集器先采集到声音信号形成第一信号，第二采集器在后采集到声音信号形成第二信号，此时第一信号波形与第二信号波形之间存在一个实际时延，通过时延单元对第一信号进行一预定时刻的时延处理，经过该时延处理形成的第一延时信号与第二信号波形相同，计算单元对第一时延信号与第二信号做减法处理。当计算结果为零时，则第一信号与第二信号的实际时延等于预定时间，则说明声源位置为靠近第一采集器的一侧，且不在第一采集器和第二采集器中间。当计算结果不为零时，则第一信号与第二信号的实际时延不等于预定时间，则说明声源位置为靠近位于第一采集器和第二采集器中间。

另外，预定幅值通常可由用户自行设定，也可以人类语音的基本音量作为预定的幅值，此处不做限定。当声音信号达到预定幅值时进行信号的采集，有效避免的采集的误采集，例如在声音信号过低、或者过高的情况下，采集单元不采集该信号，通常声音过低状态下，移动终端的屏幕可能处于背对用户，移动终端不能被启动。但若是用户不能正常发出语音状态下(例如在开会过程中)，可以通过其他方式激动移动终端，例如常用的按键激活移动终端，或者指纹激活移动终端。即移动终端可以采用多种启动方式相互配合以激活移动终端。

采用上述方法，通过声音幅度结合采集单元的时延判断声源位置，控制单元根据声源位置输出控制信号以激活移动终端。有效避免了用户在无法使用移动终端的状态下误激活移动终端，进一步降低了移动终端的功耗。

作为进一步优选实施方案，上述的可识别声源位置的关键词语音唤醒系统，所述控制单元包括一判断单元，用以接收所述计算结果，于所述计算结果不为零的状态，判断所述声源位于所述移动终端屏幕的发光方向；于所述计算结果为零的状态，判断所述声源位于所述移动终端的所述发光方向的任意侧或背面；所述控制单元于所述声源位于所述移动终端屏幕的发光方向的状态下，发出允许激活所述移动终端的控制信号。

作为进一步优选实施方案，上述的可识别声源位置的关键词语音唤醒系统，其中：还包括一非挥发存储单元，连接所述判断单元，用以存储预设的所述关键词唤醒指令。非挥发存储单元即在掉电的状态下，关键词唤醒指令不易丢失。非挥发存储单元可为MTP存储单元(可多次编程逻辑存储单元)，OTP存储单元(OneTimeProgramming，一次性可编程)、EEPROM(ElectricallyErasableProgrammableRead-OnlyMemory带电可擦可编程只读存储器)存储单元、Flash(FlashMemory闪存)。本实用新型预设有关键词唤醒指令，关键词唤醒指令可根据用户的喜好自行设置，例如设置一个“小明”，当采集单元采集的信号为“明明”、“小红”时，移动终端均不能被激活，仅仅只有在采集到“小明”时会被激活。采用此种方式，移动终端仅仅能被特定的关键词激活，在未被激活的状态下均处于待机模式，功耗较低，且有效提高了移动终端激活的准确率，大大降低了误操作率。

作为进一步优选实施方案，上述的可识别声源位置的关键词语音唤醒系统，其中：还包括一训练单元，连接于所述采集单元与所述非挥发存储单元之间，用以于所述移动终端运行于一训练模式下，用以接收用户发出的复数个语音唤醒指令，并根据复数个所述语音唤醒指令形成预设的所述关键词唤醒指令，并输出至所述非挥发存储单元存储。训练单元主要用以设置关键词唤醒指令，用户在训练模式下，发出十次“小明”，训练单元接收十次“小明”，根据十次“小明”的语音信息，对关键词进行修正，以形成关键词唤醒指令。因为人类每次语音信息的幅度、时间、发音的能量都不相同，所以增加一个训练单元，用以形成关键词唤醒指令，该关键词唤醒指令是对用户发出的关键词进行训练并修正，允许用户在发出的关键词出现了部分偏差的状态下，仍然可以激活移动终端。

作为进一步优选实施方案，上述的可识别声源位置的关键词语音唤醒系统，其中：所述训练单元包括

一积分单元，连接所述第二采集器，用以对预设的所述关键词唤醒指令进行积分计算预设的所述关键词唤醒指令的标准能量信息、标准幅值信息；进一步地，所述积分单元为傅里叶变换单元，用以对预设的所述关键词唤醒指令进行傅里叶变换获取预设的所述关键词唤醒指令的标准能量信息、标准幅值信息。先对语音信号进行分段，对每段内的信号进行频域变换，对频域变换内的能量信息进行频域计算获取其标准的能量信息以及标准幅值信息。

作为进一步优选实施方案，上述的可识别声源位置的关键词语音唤醒系统，其中：所述预设的关键词唤醒指令至少包括标准能量信息、标准幅值信息、标准时间信息，所述判断单元于所述采集信号至少匹配所述标准能量信息、和所述标准幅值信息、和所述标准时间信息时输出的所述判断结果为允许激活所述移动终端。所述判断单元中可以包含若干个比较器，用以分别第二采集信号的能量信息、幅值信息、时间信息。

作为进一步优选实施方案，上述的可识别声源位置的关键词语音唤醒系统，其中：所述训练模式由所述移动终端的控制单元控制形成。训练模式通常有移动终端的控制单元控制，当处于训练模式下，采集单元仅仅与训练单元连接，即采集单元采集的语音信号仅传输至训练单元。

一种移动终端，其中：包括上述任一项所述的可识别声源位置的关键词语音唤醒系统，所述关键词语音唤醒系统设置于所述移动终端内，用以于接收到一包含有预定的所述关键词的语音信号后，将所述移动终端的运行模式从待机模式切换至工作模式。

以上所述仅为本实用新型较佳的实施例，并非因此限制本实用新型的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本实用新型说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本实用新型的保护范围内。

Claims

1.一种可识别声源位置的关键词语音唤醒系统，其特征在于：包括：

一唤醒单元，用以于所述控制信号的作用下唤醒移动终端。

2.根据权利要求1所述的可识别声源位置的关键词语音唤醒系统，其特征在于：所述控制单元包括一判断单元，用以接收所述计算结果，

3.根据权利要求1所述的可识别声源位置的关键词语音唤醒系统，其特征在于：所述预定延时匹配所述第一采集器与所述第二采集器之间的预定间距。

4.根据权利要求1所述的可识别声源位置的关键词语音唤醒系统，其特征在于：还包括一非挥发存储单元，连接所述控制单元，用以存储预定的所述关键词唤醒指令。

5.根据权利要求4所述的可识别声源位置的关键词语音唤醒系统，其特征在于：还包括一训练单元，连接于所述采集单元与所述非挥发存储单元之间，用以于所述移动终端运行于一训练模式下，所述采集单元用以接收用户发出的复数个语音唤醒指令，并根据复数个所述语音唤醒指令形成预设的所述关键词唤醒指令，并输出至所述非挥发存储单元存储。

6.根据权利要求5所述的可识别声源位置的关键词语音唤醒系统，其特征在于：所述训练单元包括

7.根据权利要求2所述的可识别声源位置的关键词语音唤醒系统，其特征在于：预定的所述关键词唤醒指令至少包括标准能量信息、标准幅值信息、标准时间信息，

8.根据权利要求5所述的可识别声源位置的关键词语音唤醒系统，其特征在于：所述训练模式由所述移动终端的控制单元控制形成。

9.一种移动终端，其特征在于：包括上述权利要求1～8任一项所述的可识别声源位置的关键词语音唤醒系统，所述关键词语音唤醒系统设置于所述移动终端内，用以于接收到一包含有预定的所述关键词的语音信号后，将所述移动终端的运行模式从待机模式切换至工作模式。