CN109885173A - 一种无声交互方法和电子设备 - Google Patents

一种无声交互方法和电子设备 Download PDF

Info

Publication number
CN109885173A
CN109885173A CN201910146647.8A CN201910146647A CN109885173A CN 109885173 A CN109885173 A CN 109885173A CN 201910146647 A CN201910146647 A CN 201910146647A CN 109885173 A CN109885173 A CN 109885173A
Authority
CN
China
Prior art keywords
signal
electromyography signal
electromyography
voice
noiseless
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910146647.8A
Other languages
English (en)
Inventor
陈海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deep Blue Technology Shanghai Co Ltd
Original Assignee
Deep Blue Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deep Blue Technology Shanghai Co Ltd filed Critical Deep Blue Technology Shanghai Co Ltd
Publication of CN109885173A publication Critical patent/CN109885173A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明实施例涉及通信技术领域,公开了一种无声交互方法和电子设备。本发明中,无声交互方法包括:获取嘴部预设位置的第一肌电信号;根据所述第一肌电信号获得语音信息。使得无需用户进行额外的手部操作,就可以快速有效的获得无声交互过程中的有效信息。

Description

一种无声交互方法和电子设备
技术领域
本发明实施例涉及通信技术领域,特别涉及一种无声交互方法和电子设备。
背景技术
无声交互常见于聋哑人群,他们不能够发出声音,只能通过手语或者其他辅助设备进行交流。随着现代科技的发展,无声交互由于其良好的私密性、不易受外界干扰、方便等特点,需求越来越大。
发明人发现现有技术中至少存在如下问题:通过手语进行交流,虽然不需要其他辅助设备,但这种方式需要对话双方学会手语表达,因此交流需要耗费比较大的成本,并且信息传输效率也比较低,因此现有技术中还没有一种快速有效的方式,获取无声交互过程中的有效信息。
发明内容
本发明实施方式的目的在于提供一种无声交互方法和电子设备,无需用户进行额外的手部操作,就可以快速有效的获得无声交互过程中的有效信息。
为解决上述技术问题,本发明的实施方式提供了一种无声交互方法和电子设备,包括:获取嘴部预设位置的第一肌电信号;根据第一肌电信号获得语音信息。
本发明的实施方式还提供了一种电子设备,包括:信号采集模块,以及与信号采集模块连接的语音获取模块,信号采集模块,用于获取嘴部预设位置的第一肌电信号;语音获取模块,用于根据第一肌电信号获得语音信息。
本发明实施方式相对于现有技术而言,通过获取嘴部预设位置的第一肌电信号,并根据第一肌电信号就可以获得语音信息,从而使用户无需发出声音的情况下,就可以还原出用户想要表达的说话内容,提高了用户无声交互的体验效果。
另外,根据第一肌电信号获得语音信息之后,还包括:将语音信息进行播放。
另外,根据第一肌电信号获得语音信息,具体包括:从第一肌电信号中提取出发生信号波动的第二肌电信号;通过神经网络模型确定出第二肌电信号所对应的文字信息;对文字信息进行语音合成,获得与文字信息所对应的语音信息。
另外,通过神经网络模型确定出第二肌电信号所对应的文字信息之前,还包括:通过样本肌电信号对神经网络模型进行训练,获得神经网络模型的参数;根据参数确定出神经网络模型,其中,样本肌电信号的个数至少为两个,并且每一个样本肌电信号所对应的文字信息已知。该实现中,在通过神经网络模型确定出第二肌电信号所对应的文字信息之前通过对神经网络模型进行确定,可以使所获得的文字信息更加准确。
另外,从第一肌电信号中提取出发生信号波动的第二肌电信号之前,还包括:对第一肌电信号进行去噪处理,获得去噪后的肌电信号;从第一肌电信号中提取出发生信号波动的第二肌电信号,包括:从去噪后的肌电信号中提取出发生信号波动的第二肌电信号。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本申请第一实施例中无声交互方法的流程图;
图2是本申请第一实施例中嘴部预设位置的示意图;
图3是本申请第二实施例中无声交互方法的流程图;
图4是本申请第三实施例中电子设备的结构示意图;
图5是本申请第四实施例中电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种无声交互方法,应用于电子设备。具体流程如图1所示,包括以下步骤:
步骤101,获取嘴部预设位置的第一肌电信号。
具体的说,如图2所示,为本申请中嘴部预设位置的示意图,包括:降下唇肌、降口角肌、颏肌、下颌舌骨肌、甲状舌骨肌等,当然本实施方式中仅是进行示例性说明。嘴部预设位置是与发声最紧密相关的关键位置,用户在默读时,口周和舌附近的肌肉会有轻微抖动,这些肌肉活动的电信号会被电子设备捕获。
需要说明的是,本申请实施方式中还可以通过电子设备上所设置的信号采集结构来获取第一肌电信号,并且本实施方式中的信号采集结构可以由电极和信号处理电路构成,并且本实施方式中电极的数目可以为多个,通过将多个电极分别放置在嘴部预设位置中的不同部位获取原始信息,并通过信号处理电路对原始信息进行放大处理和数模转换处理,从而通过采集结构获得嘴部预设位置的第一肌电信号。
步骤102,根据第一肌电信号获得语音信息。
具体的说,从第一肌电信号中提取出发生信号波动的第二肌电信号,通过神经网络模型确定出第二肌电信号所对应的文字信息,对文字信息进行语音合成,获得与文字信息所对应的语音信息。
需要说明的是,在从第一肌电信号中提取出发生信号波动的第二肌电信号之前,还需要对第一肌电信号进行去噪处理,获得去噪后的肌电信号。具体实现方式为首先经过降采样,将采样频率降低到500Hz,然后进行滤波,滤波范围为0.1-250Hz,过滤掉外部的噪声以及工频干扰。由于所获取的第一肌电信号是在预设时间范围内所获取的,在预设时间范围内只有用户开始默读时(此时并没有发出声音)的信号会出现波动,而此时出现波动的信号才是所需要的有效信号,因此在对第一肌电信号进行去噪处理获得去噪后的肌电信号后,需要从去噪后的肌电信号中提取出发生信号波动的第二肌电信号。例如,可以采用信号突变检测累积和算法对去噪后的肌信号进行处理,获得第二肌电信号,信号突变累积和算法是一种序贯分析法,用以在某个相对稳定的数据序列中,检测出开始发生异常的数据点,所谓异常的数据点,比如说,从该点开始整个数列的平均值或者均方差开始发生改变,进而影响到整组数据的稳定。当然,本实施方式中仅是以信号突变检测累积和算法为例进行的说明,对于其它类型的算法只要能够获取到包含有效信息的第二肌电信号都是在本申请的保护范围内,因此本申请实施方式中并不对其进行限定。
具体的说,在本实施方式中,在获取到第二肌电信号后,可以通过神经网络模型确定出第二肌电信号所对应的文字信息,并通过对文字信息进行语音合成,获得文字信息所对应的语音信息。本实施方式中的神经网络模型包括卷积神经网络模型,卷积神经网络中肌电信号与文字信息的对应参数是已知的,通过将第二肌电信号输入卷积神经网络模型就可以获得所对应的文字信息。语音合成技术能够将任意文字信息实时转换为语音信息,并且语音合成技术涉及声学、语言学、数字信号处理和计算机科学等多个学科技术,由于语音合成技术并不是本申请的重点,因此本实施方式中不再对其进行赘述。
需要说明的是,在本申请实施方式中,在通过神经网络模型确定出第二肌电信号所对应的文字信息之前,还需要通过样本肌电信号对神经网络模型进行训练,获得神经网络模型的参数,并根据参数确定出神经网络模型,样本肌电信号的个数至少为两个,并且每一个样本肌电信号所对应的文字信息已知。通过样本肌电信号对神经网络模型进行训练,可以使所获得的神经网络模型的参数更加准确,从而提高了所获得的第二肌电信号所对应的文字信息的准确性。
与现有技术相比,本实施方式提供的无声交互方法,通过获取嘴部预设位置的第一肌电信号,并根据第一肌电信号就可以获得语音信息,从而使用户无需发出声音的情况下,就可以还原出用户想要表达的说话内容,提高了用户无声交互的体验效果。
本发明的第二实施方式涉及一种无声交互方法。本实施例在第一实施例的基础上做了进一步改进,具体改进之处为:在根据第一肌电信号获得语音信息之后增加了将语音信息进行播放的步骤。本实施例中的无声交互方法的流程如图3所示。具体的说,在本实施例中,包括步骤201至步骤203,其中步骤201至步骤202与第一实施方式中的步骤101至步骤102大致相同,此处不再赘述,下面主要介绍不同之处,未在本实施方式中详尽描述的技术细节,可参见第一实施例所提供的无声交互方法,此处不再赘述。
在步骤201至步骤202之后,执行步骤203。
在步骤203中,将语音信息进行播放。
具体的说,本实施方式中在获得语音信息之后,将所获得的语音信息可以通过播放装置进行播放,使进行无声交互的对象可以清楚的收听到用户所要表达的信息,从而进一步提高了交流双方进行无声交互的有效性。
需要说明的是,本实施方式中具体可以采用播放设备,如喇叭等将语音信息进行播放,当时本实施方式中仅是以喇叭为例进行说明,对于其它能够实现语音播放的设备,都是在本申请的保护范围内。
与现有技术相比,本实施方式提供的无声交互方法,通过获取嘴部预设位置的第一肌电信号,并根据第一肌电信号就可以获得语音信息,从而使用户无需发出声音的情况下,就可以还原出用户想要表达的说话内容,提高了用户无声交互的体验效果。并且通过将语音信息进行播放可以进一步提高交流双方进行无声交互的有效性。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种电子设备,具体结构如图4所示。
如图4所示,包括:信号采集模块11和语音获取模块12,并且语音获取模块包括信号预处理模块121和语音获取子模块122。
其中,信号采集模块11用于获取嘴部预设位置的第一肌电信号,并且本实施方式中的信号采集模块具体可以是由电极和信号处理电路所构成的信号采集结构,其中电极的数量可以为多个,通过多个电极分别放置在嘴部预设位置中的不同部位,从而获得第一肌电信号。
语音获取模块12,用于根据第一肌电信号获得语音信息,并且其中的信号预处理模块121用于从第一肌电信号中提取出发生信号波动的第二肌电信号,语音获取子模块122用于通过神经网络模型确定出第二肌电信号所对应的文字信息,对文字信息进行语音合成,获得与文字信息所对应的语音信息。
需要说明的是,本实施方式中的信号预处理模块121结构具体用于对第一肌电信号进行去噪处理,获得去噪后的肌电信号,然后从去噪后的肌电信号中提取出发生信号波动的第二肌电信号,而语音获取子模块122具体为处理器。
需要说明的是,本实施方式中的信号采集模块11和语音获取模块12之间可以通过无线传输方式进行数据传输,无线传输方式包括蓝牙或WIFI,当然本实施方式中仅是举例进行说明,只要能够实现信号预处理模块121与语音获取子模块122之间的信号传输,其它的传输方式也是在本申请的保护范围内,本申请实施方式中并不对其进行限定。
不难发现,本实施方式为与第一实施方式相对应的装置实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
本发明第四实施方式涉及一种电子设备。该实施方式与第三实施方式大致相同,具体结构如图5所示。其中,主要改进之处在于:第四实施方式在第三实施方式的基础上增加了播放模块13。
其中,信号采集模块11用于获取嘴部预设位置的第一肌电信号,并且本实施方式中的信号采集模块具体可以是由电极和信号处理电路所构成的信号采集结构,其中电极的数量可以为多个,通过多个电极分别放置在嘴部预设位置中的不同部位,从而获得第一肌电信号。
语音获取模块12,用于根据第一肌电信号获得语音信息,并且其中的信号预处理模块121用于从第一肌电信号中提取出发生信号波动的第二肌电信号,语音获取子模块122用于通过神经网络模型确定出所述第二肌电信号所对应的文字信息,对所述文字信息进行语音合成,获得与所述文字信息所对应的所述语音信息。
播放模块13,用于将语音信息进行播放。本实施方式中具体可以采用播放设备,如喇叭等将语音信息进行播放,当时本实施方式中仅是以喇叭为例进行说明,对于其它能够实现语音播放的设备,都是在本申请的保护范围内的本申请实施方式中并不对其进行限定。
不难发现,本实施方式为与第二实施方式相对应的装置实施例,本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第二实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种无声交互方法,其特征在于,应用于电子设备,包括:
获取嘴部预设位置的第一肌电信号;
根据所述第一肌电信号获得语音信息。
2.根据权利要求1所述的无声交互方法,其特征在于,所述根据所述第一肌电信号获得语音信息之后,还包括:
将所述语音信息进行播放。
3.根据权利要求2所述的无声交互方法,其特征在于,所述根据所述第一肌电信号获得语音信息,具体包括:
从所述第一肌电信号中提取出发生信号波动的第二肌电信号;
通过神经网络模型确定出所述第二肌电信号所对应的文字信息;
对所述文字信息进行语音合成,获得与所述文字信息所对应的所述语音信息。
4.根据权利要求3所述的无声交互方法,其特征在于,所述通过神经网络模型确定出所述第二肌电信号所对应的文字信息之前,还包括:
通过样本肌电信号对所述神经网络模型进行训练,获得所述神经网络模型的参数;
根据所述参数确定出所述神经网络模型,其中,所述样本肌电信号的个数至少为两个,并且每一个所述样本肌电信号所对应的文字信息已知。
5.根据权利要求4所述的无声交互方法,其特征在于,所述从所述第一肌电信号中提取出发生信号波动的第二肌电信号之前,还包括:
对所述第一肌电信号进行去噪处理,获得去噪后的肌电信号;
所述从所述第一肌电信号中提取出发生信号波动的第二肌电信号,包括:从所述去噪后的肌电信号中提取出发生信号波动的第二肌电信号。
6.一种电子设备,其特征在于,包括:信号采集模块,以及与所述信号采集模块连接的语音获取模块,
所述信号采集模块,用于获取嘴部预设位置的第一肌电信号;
所述语音获取模块,用于根据所述第一肌电信号获得语音信息。
7.根据权利要求6所述的电子设备,其特征在于,所述语音获取模块包括:信号预处理模块和语音获取子模块,
所述信号预处理模块,用于从所述第一肌电信号中提取出发生信号波动的第二肌电信号;
所述语音获取子模块,用于通过神经网络模型确定出所述第二肌电信号所对应的文字信息,对所述文字信息进行语音合成,获得与所述文字信息所对应的所述语音信息。
8.根据权利要求7所述的电子设备,其特征在于,所述信号采集模块和所述语音获取模块采用无线传输方式进行连接,其中,所述无线传输方式包括蓝牙传输方式。
9.根据权利要求6所述的无声交互系统,其特征在于,所述电子设备还包括与所述语音获取模块连接的播放模块,
所述播放模块,用于获取所述语音信息并将所述语音信息进行播放。
10.根据权利要求6所述的电子设备,其特征在于,所述信号预处理模块与所述语音获取模块采用无线传输方式进行连接,其中,所述无线传输方式包括蓝牙传输或无线保真传输。
CN201910146647.8A 2018-12-29 2019-02-27 一种无声交互方法和电子设备 Pending CN109885173A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018116407980 2018-12-29
CN201811640798 2018-12-29

Publications (1)

Publication Number Publication Date
CN109885173A true CN109885173A (zh) 2019-06-14

Family

ID=66929736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910146647.8A Pending CN109885173A (zh) 2018-12-29 2019-02-27 一种无声交互方法和电子设备

Country Status (1)

Country Link
CN (1) CN109885173A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110444189A (zh) * 2019-06-18 2019-11-12 中国人民解放军军事科学院国防科技创新研究院 一种缄默通信方法、系统和存储介质
CN114917544A (zh) * 2022-05-13 2022-08-19 上海交通大学医学院附属第九人民医院 可视化的辅助口轮匝肌功能训练的方法与设备
CN115857706A (zh) * 2023-03-03 2023-03-28 浙江强脑科技有限公司 基于面部肌肉状态的文字输入方法、装置及终端设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102169690A (zh) * 2011-04-08 2011-08-31 哈尔滨理工大学 基于表面肌电信号的语音信号识别系统和识别方法
CN102999154A (zh) * 2011-09-09 2013-03-27 中国科学院声学研究所 一种基于肌电信号的辅助发声方法及装置
CN103294199A (zh) * 2013-06-09 2013-09-11 华东理工大学 一种基于脸部肌音信号的无声信息识别系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102169690A (zh) * 2011-04-08 2011-08-31 哈尔滨理工大学 基于表面肌电信号的语音信号识别系统和识别方法
CN102999154A (zh) * 2011-09-09 2013-03-27 中国科学院声学研究所 一种基于肌电信号的辅助发声方法及装置
CN103294199A (zh) * 2013-06-09 2013-09-11 华东理工大学 一种基于脸部肌音信号的无声信息识别系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
帕拉休拉曼 等: "《神经人因学》", 31 March 2012, 南京:东南大学出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110444189A (zh) * 2019-06-18 2019-11-12 中国人民解放军军事科学院国防科技创新研究院 一种缄默通信方法、系统和存储介质
CN114917544A (zh) * 2022-05-13 2022-08-19 上海交通大学医学院附属第九人民医院 可视化的辅助口轮匝肌功能训练的方法与设备
CN114917544B (zh) * 2022-05-13 2023-09-22 上海交通大学医学院附属第九人民医院 可视化的辅助口轮匝肌功能训练的方法与设备
CN115857706A (zh) * 2023-03-03 2023-03-28 浙江强脑科技有限公司 基于面部肌肉状态的文字输入方法、装置及终端设备

Similar Documents

Publication Publication Date Title
Li et al. Two heads are better than one: A two-stage complex spectral mapping approach for monaural speech enhancement
CN109885173A (zh) 一种无声交互方法和电子设备
CA3168906A1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
Lin et al. Speech enhancement using multi-stage self-attentive temporal convolutional networks
CN110718235B (zh) 异常声音检测的方法、电子设备及存储介质
EP4099709A1 (en) Data processing method and apparatus, device, and readable storage medium
Gabor Communication theory and cybernetics
CN104159177A (zh) 一种基于屏幕录制的音频录制系统及方法
CN110505332A (zh) 一种降噪方法、装置、移动终端及存储介质
CN109817233A (zh) 基于层次注意力网络模型的语音流隐写分析方法及系统
CN106098078A (zh) 一种可过滤扬声器噪音的语音识别方法及其系统
CN110136709A (zh) 语音识别方法及基于语音识别的视频会议系统
Ephraim et al. Bivariate Markov processes and their estimation
CN115602165B (zh) 基于金融系统的数字员工智能系统
US20170287489A1 (en) Synthetic oversampling to enhance speaker identification or verification
Magsi et al. Analysis of signal noise reduction by using filters
CN111107284B (zh) 一种视频字幕实时生成系统及生成方法
CN114187922A (zh) 一种音频检测方法、装置及终端设备
CN115841821A (zh) 一种基于人类语音结构的语音干扰噪声设计方法
WO2006014920A2 (en) Cue-aware privacy filter for participants in persistent communications
CN111369968A (zh) 声音复制方法、装置、可读介质及电子设备
CN117037840A (zh) 异响源识别方法、装置、设备及可读存储介质
JP2006227330A (ja) 音響信号に対する情報の埋め込み装置・方法、音響信号からの情報の抽出装置・方法
Li et al. A biologically inspired attention network for EEG-based auditory attention detection
CN115333879B (zh) 一种远程会议方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614