CN110148407A

CN110148407A - 用于智能手环的语音控制方法

Info

Publication number: CN110148407A
Application number: CN201910433408.0A
Authority: CN
Inventors: 李雄飞; 李晓芳; 黄明新
Original assignee: Shenzhen Still Interconnect Technology Co Ltd
Current assignee: Shenzhen Still Interconnect Technology Co Ltd
Priority date: 2019-05-23
Filing date: 2019-05-23
Publication date: 2019-08-20

Abstract

本发明涉及智能手环技术领域，具体地说，涉及一种用于智能手环的语音控制方法，其包括以下步骤：手势触发语音模式；语音采集；语音转换；判断当前状态是否为蓝牙连接状态；将音频数据通过蓝牙服务特性传输给手机APP，进行解压缩算法转换成标准的音频数据，语音动作识别动作及结果，再将控制信号通过蓝牙广播发送给灯控接收端执行相应的灯控动作；通过本地的语音库识别相应的控制指令，然后通过蓝牙广播发送给灯控接收端执行相应的灯控动作。本发明通过语音解析压缩与解压缩算法，实现手环可与app语音交互，控制设备，蓝牙无论在连接状态和未连接状态都可以实现语音控制。

Description

用于智能手环的语音控制方法

技术领域

本发明涉及智能手环技术领域，具体地说，涉及一种用于智能手环的语音控制方法。

背景技术

随着人工智能的快速发展，语音控制技术也取得了巨大进步，再次点燃了巨头们发展智能家居的热情。预计到2021年，基于人工智能的语音控制技术有望渗透4000万户家庭。

随着当前智能穿戴设备的发展和普及，智能穿戴设备的年增长与日俱增，智能穿戴设备中，智能手环的普及率是最高的。几乎人人都佩戴有智能手环或者手表智能穿戴设备，智能手环的发展普及，即将改变我们的生活方式。

语音是人类交流最自然、最方便的手段，因而也必然成为人机交互最自然、最方便的手段之一。

对于智能家居，语音控制、语音输入则将是比手指更加灵活、高效、富有趣味性的人机交互方式，就像众多科幻电影中曾经多次描述的那样，语音操控未来注定会成为智能家居产品实现人机交流的主导。通过标配的蓝牙BLE无线通信技术与家庭智能家居套件联动控制，通过手环语音控制灯光软启、调光、亮度记忆、场景记忆等智能化操作和管理，随身携带语音控制设备，随时随地的控制智能家居设备。它的定位更符合家庭中的语音交互场景，也因为有了语音交互，智能手环[手表]无处不在的监控人体健康同时，也可以提供无处不在的语音控制入口，给智能家居提供更多的想象空间。可以说语音技术已经融入我们的身体，成为一种本能，它是最优的表达方式，自然语言回答代表未来智能家居产品的终极形式。

传统的蓝牙广播灯控系统基本上都是通过遥控器或者手机APP进行操作控制，加入智能手环(手表设备)语音控制接口，带来的将是极富趣味性与想象力的家居生活，也可以摆脱传统的遥控器控制方式。

目前语音控制技术基本集成于智能手机、siri、智能音箱等等，一、目前市场上应用于2.4G广播灯还无法接入这些平台；二、如果对接智能语音平台硬件成本较高；三、离开智能音箱控制范围，无法随时随地控制灯控设备。

发明内容

本发明的内容是提供一种用于智能手环的语音控制方法，其能够克服现有技术的某种或某些缺陷。

根据本发明的一种用于智能手环的语音控制方法，其包括以下步骤：

一、手势触发语音模式；

二、语音采集：长按语音键通过麦克风采集语音信号；

三、语音转换：通过语音数模转换、压缩算法将语音信号转换成数字信号；

四、判断当前状态是否为蓝牙连接状态，若是，进行第五步，若否，进行第六步；

五、将音频数据通过蓝牙服务特性传输给手机APP，进行解压缩算法转换成标准的音频数据，语音动作识别动作及结果，再将控制信号通过蓝牙广播发送给灯控接收端执行相应的灯控动作；

六、通过本地的语音库识别相应的控制指令，然后通过蓝牙广播发送给灯控接收端执行相应的灯控动作。

作为优选，压缩算法为：压缩后的数据内存的前两个bytes存predict；第三个byte存predict_idx；第4个byte为当前adpcm格式的audio数据的有效数据量，也就是124；后面的124个bytes由496bytes的原声数据1/4压缩而来；解压缩算法为：从前两个bytes读到的数据为predict，第三个byte为predict_idx，第4个为audio数据有效长度124，后面的124bytes对应转换为496bytes pcm格式audio数据。

作为优选，步骤二中的采样率为16K*16bit，每秒钟16K个sample，每ms 16个sample，即每ms 16*16bit＝32byte。每15.5ms产生15.5*16＝248个sample，共496bytes的原声数据。

作为优选，语音数模转换的方法为：麦克风采样出来的原声数据为pcm格式，采用pcm to adpcm算法将其压缩为adpcm格式，压缩率为25％，master端收到的adpcm格式数据解压缩还原为pcm格式。

作为优选，pcm to adpcm算法为：将原声数据1/4压缩为124bytes，同时加上4个bytes的头信息，得到128bytes的数据；128bytes的数据，在L2cap层上发送给master，会分成5个packet上进行。

作为优选，步骤二中，还包括语音数据压缩，其方法为：每一笔adpcm压缩数据量为248个sample，496个bytes；麦克风一直在进行采样并把处理过的pcm格式数据放到事先设置好的buffer_mic，将这个buffer_mic设置为能够存储2笔压缩数据，也就是496个sample，以实现数据的缓冲和保存；使用16K采样，496个sample为992个bytes，TL_MIC_BUFFER_SIZE为992。

作为优选，buffer_mic的填充方法为：麦克风采样的数据按照16K的速度匀速放入从buffer_mic地址开始的内存，向后移动，并且最大长度为992，到达最大长度后，重新回到buffer_mic地址开始放数据；这个过程不对内存上的数据进行任何是否已经被读走的判断，直接覆盖老的数据；向RAM放数据的过程中，维护一个用于记录当前最新的audio数据已经到RAM的哪个地址的写指针。

对于智能家居，语音控制、语音输入则将是比手指更加灵活、高效、富有趣味性的人机交互方式，就像众多科幻电影中曾经多次描述的那样，语音操控未来注定会成为智能家居产品实现人机交流的主导。当前智能穿戴设备的发展和普及，智能穿戴设备的年增长与日俱增，智能穿戴设备中，智能手环的普及率是最高的。几乎人人都佩戴有智能手环或者手表智能穿戴设备，智能手环与语音完美结合的设备的发展普及，即将改变我们的生活方式，可以无缝对接人机交互，随时随地即可控制灯控设备。智能手环集成语音控制，在无较大成本的增加上，提升到不仅仅是质量，更重要的是用户产品体验，及与智能家居应用场景的无缝连接。

本发明通过语音控制的方式控制灯光系统，以便与手环或手表相兼容；通过语音控制集成与智能穿戴产品应用之上；通过语音解析压缩与解压缩算法，实现手环可与app语音交互，控制设备；本发明的手环蓝牙无论在连接状态和未连接状态都可以实现语音控制。

附图说明

图1为实施例1中一种用于智能手环的语音控制方法的流程图；

图2为实施例1中压缩算法的示意图；

图3为实施例1中语音数据压缩处理的示意图；

图4为实施例1中经过语音数模转换处理后抓到的数据的示意图；

图5为实施例1中音频MIC硬件设计电路的电路图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。应当理解的是，实施例仅仅是对本发明进行解释而并非限定。

实施例1

如图1所示，本实施例提供了一种用于智能手环的语音控制方法，其包括以下步骤：

一、手势触发语音模式；

二、语音采集：长按语音键通过麦克风采集语音信号；

本实施例中，如图2所示，压缩算法为：压缩后的数据内存的前两个bytes存predict；第三个byte存predict_idx；第4个byte为当前adpcm格式的audio数据的有效数据量，也就是124；后面的124个bytes由496bytes的原声数据1/4压缩而来；解压缩算法为：从前两个bytes读到的数据为predict，第三个byte为predict_idx，第4个为audio数据有效长度124，后面的124bytes对应转换为496bytes pcm格式audio数据。

本实施例中，步骤二中的采样率为16K*16bit，每秒钟16K个sample，每ms 16个sample，即每ms 16*16bit＝32byte；每15.5ms产生15.5*16＝248个sample，共496bytes的原声数据。

本实施例中，语音数模转换的方法为：麦克风采样出来的原声数据为pcm格式，采用pcm to adpcm算法将其压缩为adpcm格式，压缩率为25％，master端收到的adpcm格式数据解压缩还原为pcm格式。

本实施例中，pcm to adpcm算法为：将原声数据1/4压缩为124bytes，同时加上4个bytes的头信息，得到128bytes的数据；128bytes的数据，在L2cap层上发送给master，会分成5个packet上进行。因为每个包最大长度是27，第一个包必须带7个bytes的l2cap的说明信息：l2caplen:2bytes，chanid：2bytes，opcode：1byte，AttHandle：2bytes；图4为空中抓到的RF数据，可以看到第一个包中有7个额外的信息，后面紧跟20bytes的audio数据，后面的包27bytes全是audio数据。第一个包只放20bytes的audio数据，后面4个包由于是分包，不需要再带l2cap说明信息，每个包可以放27个bytes：20+27*4＝128bytes。这里audio数据属于128byte的长包在slave端进行了分包处理，如果希望peerdevice(对端设备)收到这些包后能够重新拼装成功，就一定要通过Exchange MTU size确定对方peer device的最大ClientRxMTU，只有当ClientRxMTU大于等于128时，slave端的这个128byte长包才能被peerdevice正确处理。

本实施例中，如图3所示，步骤二中，还包括语音数据压缩，其方法为：每一笔adpcm压缩数据量为248个sample，496个bytes；麦克风一直在进行采样并把处理过的pcm格式数据放到事先设置好的buffer_mic，将这个buffer_mic设置为能够存储2笔压缩数据，也就是496个sample，以实现数据的缓冲和保存；使用16K采样，496个sample为992个bytes，TL_MIC_BUFFER_SIZE为992。

本实施例中，buffer_mic的填充方法为：麦克风采样的数据按照16K的速度匀速放入从buffer_mic地址开始的内存，向后移动，并且最大长度为992，到达最大长度后，重新回到buffer_mic地址开始放数据；这个过程不对内存上的数据进行任何是否已经被读走的判断，直接覆盖老的数据；向RAM放数据的过程中，维护一个用于记录当前最新的audio数据已经到RAM的哪个地址的写指针。

如图5所示，为音频MIC硬件设计电路，语音开始时，PC6 AMIC BIAS需要输出高电平来驱动语音，语音结束后，AMICBIAS需要关闭，防止进入低功耗时漏电。Amic需要使用Telink 8267(825x)内部的多个模拟电路模块，包括PGA、ADC、filter等，对原始的Audio信号进行采样后处理，最终转化为数字信号传输到MCU。

本实施例通过语音控制的方式控制灯光系统，以便与手环或手表相兼容；通过语音控制集成与智能穿戴产品应用之上；通过语音解析压缩与解压缩算法，实现手环可与app语音交互，控制设备；本发明的手环蓝牙无论在连接状态和未连接状态都可以实现语音控制。

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.用于智能手环的语音控制方法，其特征在于：包括以下步骤：

一、手势触发语音模式；

二、语音采集：长按语音键通过麦克风采集语音信号；

2.根据权利要求1所述的用于智能手环的语音控制方法，其特征在于：压缩算法为：压缩后的数据内存的前两个bytes存predict；第三个byte存predict_idx；第4个byte为当前adpcm格式的audio数据的有效数据量，也就是124；后面的124个bytes由496bytes的原声数据1/4压缩而来；解压缩算法为：从前两个bytes读到的数据为predict，第三个byte为predict_idx，第4个为audio数据有效长度124，后面的124bytes对应转换为496bytes pcm格式audio数据。

3.根据权利要求2所述的用于智能手环的语音控制方法，其特征在于：步骤二中的采样率为16K*16bit，每秒钟16K个sample，每ms16个sample，即每ms16*16bit＝32byte；每15.5ms产生15.5*16＝248个sample，共496bytes的原声数据。

4.根据权利要求3所述的用于智能手环的语音控制方法，其特征在于：语音数模转换的方法为：麦克风采样出来的原声数据为pcm格式，采用pcm to adpcm算法将其压缩为adpcm格式，压缩率为25％，master端收到的adpcm格式数据解压缩还原为pcm格式。

5.根据权利要求4所述的用于智能手环的语音控制方法，其特征在于：pcm to adpcm算法为：将原声数据1/4压缩为124bytes，同时加上4个bytes的头信息，得到128bytes的数据；128bytes的数据，在L2cap层上发送给master，会分成5个packet上进行。

6.根据权利要求5所述的用于智能手环的语音控制方法，其特征在于：步骤二中，还包括语音数据压缩，其方法为：每一笔adpcm压缩数据量为248个sample，496个bytes；麦克风一直在进行采样并把处理过的pcm格式数据放到预设的buffer_mic，将这个buffer_mic设置为能够存储2笔压缩数据，也就是496个sample，以实现数据的缓冲和保存；使用16K采样，496个sample为992个bytes，TL_MIC_BUFFER_SIZE为992。

7.根据权利要求6所述的用于智能手环的语音控制方法，其特征在于：buffer_mic的填充方法为：麦克风采样的数据按照16K的速度匀速放入从buffer_mic地址开始的内存，向后移动，并且最大长度为992，到达最大长度后，重新回到buffer_mic地址开始放数据；这个过程不对内存上的数据进行任何是否已经被读走的判断，直接覆盖老的数据；向RAM放数据的过程中，维护一个用于记录当前最新的audio数据已经到RAM的哪个地址的写指针。