WO2020192231A1

WO2020192231A1 - 一种基于表面肌电唇语识别的辅助沟通系统

Info

Publication number: WO2020192231A1
Application number: PCT/CN2019/130814
Authority: WO
Inventors: 陈世雄; 朱明星; 王小晨; 李光林; 杨子建; 汪鑫
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2019-03-25
Filing date: 2019-12-31
Publication date: 2020-10-01
Also published as: CN110059575A; US20210217419A1

Abstract

一种基于表面肌电唇语识别的辅助沟通系统，包括：训练子系统，用于通过高密度阵列式电极采集唇语动作过程中的面颈部肌电信号，通过信号预处理算法提高信号质量，通过分类算法对唇语动作类型进行分类，通过通道选择算法选取最优电极个数和最优位置，并建立肌电信号与唇语信息之间的最优匹配模板，上传至网络终端存储；检测子系统，用于基于所述训练子系统选取的最优电极个数和位置，采集最优位置处唇语动作过程中的肌电信号，调用最优匹配模板，对肌电信号进行分类解码，识别唇语信息，并转化成对应的语音和图像信息，实时显示出来，实现唇语识别，从而大大提高了唇语识别的准确率。

Description

一种基于表面肌电唇语识别的辅助沟通系统

技术领域

本发明属于语音识别辅助沟通技术领域，尤其涉及一种基于表面肌电唇语识别的辅助沟通系统。

背景技术

语言是人类特有的表达情感、传递信息、参与社会交往的重要能力，发音是语言表达的基础。发音是一个非常复杂的神经中枢系统控制肌肉协同运动的过程，是多个器官、多个肌群相互配合、相互协作的结果。在发音时，面部肌肉和颈部肌肉会相应地进行运动，发不同的音，对应的面颈部肌肉运动模式也不同。因此，可以通过采集面颈部的表面肌肉电信号，通过特征提取、分类，将不同的发音和不同的肌群电生理变化对应起来，从而识别发音信息，进而辅助患者与他人沟通。

根据2006年全国第二次残疾人抽样调查结果，我国有8296万残疾人，其中有127万唇语残疾人口，占总人口数的1.53%。发声障碍严重降低他们的生活质量，影响他们的日常生活交流，造成沟通的不便，对他们的家庭和社会来说都是沉重的负担。而发音障碍的诊断及治疗在临床上仍不够成熟，他们迫切需要辅助沟通产品来帮助他们表达、交流。

表面肌电信号是肌肉系统进行随意性和非随意性活动时产生的生物电变化经表面电极引导、放大、显示和记录所获得的一维电压时间序列信号，反映了运动神经元的生物电活动形成于众多外周运动单位电位在时间和空间上的总和，与肌肉活动情况有较大的关联，在一定程度上可以体现相关肌肉的活动水平，因此，通过对表面肌电进行分析可以观察到相关肌肉的运动情况。表面肌电作为一种客观量化的手段，具有无创、操作简单、成本较低和能提供定量定性分析等优点，因此被广泛应用于医学研究、人机交互等领域。

近年来，已经有一些研究使用肌电进行语音识别辅助沟通，但现有技术中肌电采集往往仅使用少数几个电极放置在已知的几块发音肌肉上，电极的个数和位置均是人为主观选取，所选取的电极个数和通道数不一定是最优方案，存在一定的局限性，唇语识别准确率较低。

技术问题

有鉴于此，本发明实施例为发音困难但可以用口形、唇语表达的患者提供了一种基于表面肌电唇语识别的辅助沟通系统，以解决现有技术中，通过人为主观选取电极的个数和位置，难以得到最优方案，语音信号识别准确率较低的问题。

技术解决方案

本发明实施例提供的一种基于表面肌电唇语识别的辅助沟通系统，可以包括：

训练子系统，用于通过高密度阵列式电极采集唇语动作过程中的面颈部肌电信号，通过信号预处理算法提高信号质量，通过分类算法对唇语动作类型进行分类，通过通道选择算法选取最优电极个数和最优位置，并建立肌电信号与唇语信息之间的最优匹配模板，上传至网络终端存储；

检测子系统，用于基于所述训练子系统选取的最优电极个数和位置，采集最优位置处唇语动作过程中的肌电信号，调用最优匹配模板，对肌电信号进行分类解码，识别唇语信息，并转化成对应的语音和图像信息，实时显示出来，实现唇语识别。

进一步地，所述训练子系统可以包括训练子系统下位机和训练子系统上位机，所述训练子系统下位机可以包括：

高密度阵列式电极，用于通过粘贴在面颈部发音肌群上来获取使用者唇语过程中发音肌群的高密度肌电信号；

肌电采集模块，用于对高密度阵列电极采集到的信号进行放大、滤波、模数转换，并传输到训练子系统上位机。

进一步地，所述训练子系统上位机可以包括用户交互模块和信号分类、校正匹配反馈训练模块，所述用户交互模块可以包括：

肌电信号显示子模块，用于实时显示采集的肌电信号；

唇语训练场景显示子模块，用于提供唇语场景图片和文字；

通道选择定位图表显示子模块，用于提供电极在面部和颈部的位置分布情况。

进一步地，所述信号分类、校正匹配反馈训练模块可以包括：

信号处理子模块，用于采用滤波器滤除工频干扰和基线漂移，利用小波变换、模板匹配算法滤除肌电信号中的干扰噪声；

分类子模块，用于提取与指定短句的发音相关的肌电信号，提取特征值，建立肌电信号与所述指定短句之间的对应关系，基于肌电信息对采集的唇语内容进行分类；

通道选取子模块，用于选取最优匹配模板，建立个人训练集，并传输到网络终端。

进一步地，所述检测子系统可以包括检测子系统下位机和检测子系统上位机，所述检测子系统下位机可以包括：

贴片式柔性电极，用于采集最优位置处唇语动作过程中的肌电信号；

无线肌电采集模块，用于将贴片式柔性电极采集的肌电信息，通过无线传输到检测子系统上位机。

进一步地，所述检测子系统上位机可以包括：

个人训练集下载模块，用于通过连接网络，从训练子系统网络共享端口，调用个人训练集，并存储于APP客户端；

唇语信息识别解码模块，用于对信号进行降噪滤波处理，并对肌电信号与个人训练集进行特征匹配，通过采用分类算法，解码唇语信息，识别出唇语内容，将分类结果所对应的唇语内容转换成文字信息，并转换成语音和图片进行实时传输显示；

APP显示交互模块，用于进行通道选取最优数据集显示、电极位置实时显示、肌电信号实时显示、分类结果实时显示和/或语音图片翻译显示。

进一步地，所述唇语信息识别解码模块还用于将识别结果传送给系统设置的紧急联系人。

进一步地，所述高密度阵列式电极可以包括130个单电极，且各个单电极之间以中心间距1厘米的高密度形式排列。

进一步地，所述训练子系统下位机还可以包括电极放置孔板。

进一步地，所述肌电采集模块可以包括微控制器、模数转换器、独立同步时钟、前置信号滤波放大器和低噪声电源。

有益效果

本发明实施例与现有技术相比存在的有益效果是：本发明实施例使用训练子系统通过高密度阵列式电极采集唇语动作过程中的面颈部肌电信号，通过信号预处理算法提高信号质量，通过分类算法对唇语动作类型进行分类，通过通道选择算法选取最优电极个数和最优位置，并建立肌电信号与唇语信息之间的最优匹配模板，上传至网络终端存储。在此基础上，使用检测子系统基于所述训练子系统选取的最优电极个数和位置，采集最优位置处唇语动作过程中的肌电信号，调用最优匹配模板，对肌电信号进行分类解码，识别唇语信息，并转化成对应的语音和图像信息，实时显示出来，实现唇语识别。通过这种先全面、后局部的策略，采用高密度阵列式电极实时、完整地获取发音过程中的肌电信号，经过处理、分析，筛选出肌肉活动中对唇语动作贡献最大的电极，并确定最优电极个数和电极位置，实现客观定位唇语识别电极选取，从而大大提高了唇语识别的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种基于表面肌电唇语识别的辅助沟通系统的结构框图。

本发明的实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1示出了本发明实施例提供的一种基于表面肌电唇语识别的辅助沟通系统的结构框图，为了便于说明，仅示出了与本实施例相关的部分。

请参阅图1，本发明实施例中提供的一种基于表面肌电唇语识别的辅助沟通系统可以包括训练子系统和检测子系统。

所述训练子系统，用于通过高密度阵列式电极采集唇语动作过程中的面颈部肌电信号，通过信号预处理算法提高信号质量，通过分类算法对唇语动作类型进行分类，通过通道选择算法选取最优电极个数和最优位置，并建立肌电信号与唇语信息之间的最优匹配模板，上传至网络终端存储。

所述检测子系统，用于基于所述训练子系统选取的最优电极个数和位置，采集最优位置处唇语动作过程中的肌电信号，调用最优匹配模板，对肌电信号进行分类解码，识别唇语信息，并转化成对应的语音和图像信息，实时显示出来，实现唇语识别。

所述训练子系统可以包括下位机和上位机两部分，即训练子系统下位机和训练子系统上位机。

所述训练子系统下位机可以包括高密度阵列式电极和肌电采集模块。

所述高密度阵列式电极，用于通过粘贴在面颈部发音肌群上来获取使用者唇语过程中发音肌群的高密度肌电信号。之所以需要首先通过所述高密度阵列式电极来获取肌电信号，是由于个人习惯、发音方式不尽相同，每个人发音用力部位并不完全一样，发音过程的肌肉活动有一定差别，肌肉活动特性位置也是不同的，对不同的人在相同的几块肌肉位置放置电极是非常不合理的，因此，在本实施例中首先通过所述高密度阵列式电极来采集全面的肌电信号。

所述高密度阵列式电极可以由众多的单电极组成，具体的单电极数目以及各个单电极之间的间距均可以根据使用者面颈部尺寸实现个性化定制，以保证可以采集全面的发音肌群肌电信号为准。优选地，所述高密度阵列式电极可以包括130个单电极，且各个单电极之间以中心间距1cm的高密度形式排列。

所述肌电采集模块可以为130通道的肌电采集模块，包括微控制器（Micro Controller Unit，MCU）、模数转换器、独立同步时钟、前置信号滤波放大器和低噪声电源，用于对高密度阵列电极采集到的信号进行放大、滤波、模数转换，并通过USB或者其它传输途径传输到训练子系统上位机。

优选地，所述训练子系统下位机还可以包括电极放置孔板，每个孔板中设置相应的电极孔位，其中孔间距在1cm左右，以确保电极距离足够小。孔板分为4种规格：20孔，25孔，40孔，48孔，分别可以同时放置20、25、40、48个电极，减少工作量，操作起来更方便。

所述训练子系统上位机可以为台式机、笔记本电脑、平板电脑等设备，包括用户交互模块和信号分类、校正匹配反馈训练模块。

所述用户交互模块可以包括肌电信号显示子模块、唇语训练场景显示子模块和通道选择定位图表显示子模块。

所述肌电信号显示子模块，用于实时显示采集的肌电信号，同时提供了单通道信号选择功能，可以实时观测所有通道信号质量，确保信号的可靠性。

所述唇语训练场景显示子模块，用于提供日常生活需要的唇语场景图片和文字为用户提供个性化训练集，通过固定的场景模式训练，采集肌电信号并存储，作为唇语分析肌电数据库。另外该子模块还提供了如：“再读一遍”、“下一场景”等任务提示，为重复训练以及下一步操作提供友好交互。

所述通道选择定位图表显示子模块，用于提供电极在面部和颈部的位置分布情况，通过训练分类，实时显示所选取的有效通道的个数和具体位置。

所述信号分类、校正匹配反馈训练模块可以包括信号处理子模块、分类子模块和通道选取子模块。

所述信号处理子模块，用于采用IIR带通滤波器以及基于优化算法的滤波器初步滤除工频干扰和基线漂移，然后利用小波变换、模板匹配算法等算法进一步滤除肌电信号中的伪迹、心电等干扰噪声，对信号进行预处理，提高信号质量和可靠性。

所述分类子模块，用于对信号进行归一化、盲源分离等算法处理，以提取与指定短句的发音相关的肌电信号，提取特征值，利用线性分类器、神经网络和支持向量机技术，建立肌电信号与所述指定短句之间的对应关系，基于肌电信息对所采集的唇语内容进行分类。

所述通道选取子模块，用于经过多次校正匹配，选取出最少通道个数和最优分类精度的肌电模板，将肌电信号与唇语信息的最优匹配模板存储保存，建立个人训练集，并将该最优模块数据集传输到网络终端。

由于个人习惯、发音方式不尽相同，每个人发音用力部位并不完全一样，发音过程的肌肉活动有一定差别，肌肉活动特性位置也是不同的。因此要准确识别唇语信息，有必要对使用者进行多次发音训练，建立个人训练集，存储肌电信号与指定短句之间的对应关系，并确定个性化的电极最优解。

所述检测子系统可以包括下位机和上位机两部分，即检测子系统下位机和检测子系统上位机。

所述检测子系统下位机包括贴片式柔性电极和无线肌电采集模块。

所述贴片式柔性电极，用于采集最优位置处唇语动作过程中的肌电信号。现有的肌电电极硬板电极，与皮肤贴合程度有限，皮肤的拉扯形变容易给所肌电数据带来较大的噪声干扰，而所述贴片式柔性电极包含若干个柔性材料做成的FPC软板单电极，形成可弯曲、与皮肤紧密结合的定制柔性电极片，具体的单电极数目可以根据实际情况进行设置，优选地，可以将其设置为8个。用户根据训练子系统计算结果选取所需要使用的柔性电极个数以及电极在面颈部的放置位置，个性化程度高，与皮肤紧密贴合，跟随皮肤微形变，获取的肌电信息更稳定、可靠。

所述无线肌电采集模块集成了8通道肌电采集与无线传输功能，其中采用了集成WIFI功能的微控制器、前置放大电路、模数转换电路等，用于将贴片式柔性电极采集的肌电信息，通过WIFI等无线传输到检测子系统上位机。无线传输比传统有线电极更方便，佩戴简单、减少有线电极导线之间的缠绕带来的影响。WIFI传输不丢失数据，保证了数据的完整性。多路肌电信息同时无线传输，弥补了传统方法中电极通道少信息不全的缺陷。

所述检测子系统上位机可以为手机、平板电脑等设备，包括个人训练集下载模块、唇语信息识别解码模块和APP显示交互模块。

所述个人训练集下载模块，用于通过连接网络，从训练子系统网络共享端口，调用个人训练集，并存储于APP客户端。

所述唇语信息识别解码模块包括了数据预处理、肌电在线分类、分类结果语音转换等功能模块，用于采用IIR滤波器、小波变换等对信号进行降噪滤波处理，并对肌电信号与个人训练集进行特征匹配，通过采用分类算法，解码唇语信息，识别出唇语内容，将分类结果所对应的唇语内容转换成文字信息，通过处理调用语音和图片模板，转换成语音和图片进行实时传输显示，还用于将识别结果通过APP传送给系统设置的紧急联系人。

目前的辅助沟通系统大都需要沟通者与患者面对面，或者保持较近位置。但日常生活中，患者在很多一个人的场合也需要与他人进行交流，例如：独自在家要寻求帮助。本实施例借助无线发送技术，识别出患者的唇语信息后，一方面将唇语识别结果通过APP转换成语音和图片播放展示出来；另一方面通过用户链接，自动发送到设置好的紧急联系人手机APP上，使他人能够即时、远程地获得患者的唇语信息。

所述APP显示交互模块，用于进行通道选取最优数据集显示、电极位置实时显示、肌电信号实时显示、分类结果实时显示和/或语音图片翻译显示。

以上内容均是针对面颈部发音肌群的肌电信息进行采集分析，除此之外，其他部位与发音功能相关的肌肉，如腹部，同样包含了一定的发音运动信息，也可作为本实施例的肌电信息来源，进行发音信息识别。

本实施例的核心内容为基于高密度肌电的唇语识别，唇语识别不仅可以用于发音障碍人士，还可以推广到其他不便发音或噪音较强场合，如：水下作业，嘈杂工厂等，具有巨大的发展空间。

综上所述，本发明实施例使用训练子系统通过高密度阵列式电极采集唇语动作过程中的面颈部肌电信号，通过信号预处理算法提高信号质量，通过分类算法对唇语动作类型进行分类，通过通道选择算法选取最优电极个数和最优位置，并建立肌电信号与唇语信息之间的最优匹配模板，上传至网络终端存储。在此基础上，使用检测子系统基于所述训练子系统选取的最优电极个数和位置，采集最优位置处唇语动作过程中的肌电信号，调用最优匹配模板，对肌电信号进行分类解码，识别唇语信息，并转化成对应的语音和图像信息，实时显示出来，实现唇语识别。通过这种先全面、后局部的策略，采用高密度阵列式电极实时、完整地获取发音过程中的肌电信号，经过处理、分析，筛选出肌肉活动中对唇语动作贡献最大的电极，并确定最优电极个数和电极位置，实现客观定位唇语识别电极选取，从而大大提高了唇语识别的准确率。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能系统、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能系统、模块完成，以完成以上描述的全部或者部分功能。实施例中的各功能系统、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能系统、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

一种基于表面肌电唇语识别的辅助沟通系统，其特征在于，包括：

训练子系统，用于通过高密度阵列式电极采集唇语动作过程中的面颈部肌电信号，通过信号预处理算法提高信号质量，通过分类算法对唇语动作类型进行分类，通过通道选择算法选取最优电极个数和最优位置，并建立肌电信号与唇语信息之间的最优匹配模板，上传至网络终端存储；

检测子系统，用于基于所述训练子系统选取的最优电极个数和位置，采集最优位置处唇语动作过程中的肌电信号，调用最优匹配模板，对肌电信号进行分类解码，识别唇语信息，并转化成对应的语音和图像信息，实时显示出来，实现唇语识别。
根据权利要求1所述的系统，其特征在于，所述训练子系统包括训练子系统下位机和训练子系统上位机，所述训练子系统下位机包括：

高密度阵列式电极，用于通过粘贴在面颈部发音肌群上来获取使用者唇语过程中发音肌群的高密度肌电信号；

肌电采集模块，用于对高密度阵列电极采集到的信号进行放大、滤波、模数转换，并传输到训练子系统上位机。
根据权利要求2所述的系统，其特征在于，所述训练子系统上位机包括用户交互模块和信号分类、校正匹配反馈训练模块，所述用户交互模块包括：

肌电信号显示子模块，用于实时显示采集的肌电信号；

唇语训练场景显示子模块，用于提供唇语场景图片和文字；

通道选择定位图表显示子模块，用于提供电极在面部和颈部的位置分布情况。
根据权利要求3所述的系统，其特征在于，所述信号分类、校正匹配反馈训练模块包括：

信号处理子模块，用于采用滤波器滤除工频干扰和基线漂移，利用小波变换、模板匹配算法滤除肌电信号中的干扰噪声；

分类子模块，用于提取与指定短句的发音相关的肌电信号，提取特征值，建立肌电信号与所述指定短句之间的对应关系，基于肌电信息对采集的唇语内容进行分类；

通道选取子模块，用于选取最优匹配模板，建立个人训练集，并传输到网络终端。
根据权利要求1所述的系统，其特征在于，所述检测子系统包括检测子系统下位机和检测子系统上位机，所述检测子系统下位机包括：

贴片式柔性电极，用于采集最优位置处唇语动作过程中的肌电信号；

无线肌电采集模块，用于将贴片式柔性电极采集的肌电信息，通过无线传输到检测子系统上位机。
根据权利要求5所述的系统，其特征在于，所述检测子系统上位机包括：

个人训练集下载模块，用于通过连接网络，从训练子系统网络共享端口，调用个人训练集，并存储于APP客户端；

唇语信息识别解码模块，用于对信号进行降噪滤波处理，并对肌电信号与个人训练集进行特征匹配，通过采用分类算法，解码唇语信息，识别出唇语内容，将分类结果所对应的唇语内容转换成文字信息，并转换成语音和图片进行实时传输显示；

APP显示交互模块，用于进行通道选取最优数据集显示、电极位置实时显示、肌电信号实时显示、分类结果实时显示和/或语音图片翻译显示。
根据权利要求6所述的系统，其特征在于，所述唇语信息识别解码模块还用于将识别结果传送给系统设置的紧急联系人。
根据权利要求1所述的系统，其特征在于，所述高密度阵列式电极包括130个单电极，且各个单电极之间以中心间距1厘米的高密度形式排列。
根据权利要求2所述的系统，其特征在于，所述训练子系统下位机还包括电极放置孔板。
根据权利要求2所述的系统，其特征在于，所述肌电采集模块包括微控制器、模数转换器、独立同步时钟、前置信号滤波放大器和低噪声电源。