CN116631456A

CN116631456A - 一种声控通讯处理方法、耳机、存储介质及计算机

Info

Publication number: CN116631456A
Application number: CN202310897008.1A
Authority: CN
Inventors: 黄昱田; 朱孟; 邓旭东; 秦美平; 曾利群; 王智坤
Original assignee: Jiangxi Hongsheng Technology Co ltd
Current assignee: Jiangxi Hongsheng Technology Co ltd
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-08-22

Abstract

本发明提供一种声控通讯处理方法、耳机、存储介质及计算机，应用于第一通讯设备，所述方法包括：自主接收外界环境声音信号；对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；若是，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。解决了现有技术中采用的通讯方式操作繁琐的技术问题。

Description

一种声控通讯处理方法、耳机、存储介质及计算机

技术领域

本发明涉及通讯技术领域，特别涉及一种声控通讯处理方法、耳机、存储介质及计算机。

背景技术

随着科技的进步，电子通讯成了生活重要的一部分，比如说手机、智能手表的普及。但随着信息安全知识的提升，各方面对于信息的保密性也逐渐加强，在一些特殊地区为了信息安全性都使用局域网，在此过程中要保持通讯使用一些便捷携带电子产品辅助通信，如对讲机、蓝牙智能通讯器等，但目前此类产品均要人工操作才能触发通讯。对于一些需要释放双手的工作人员，此类通讯设备就显得较为繁杂。

发明内容

基于此，本发明的目的是提供一种声控通讯处理方法、耳机、存储介质及计算机，用于解决现有技术中采用的通讯方式操作繁琐的技术问题。

本发明一方面提出一种声控通讯处理方法，应用于第一通讯设备，所述方法包括：

自主接收外界环境声音信号；

对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；

将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；

计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；

若是，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。

优选地，所述自主接收外界环境声音信号的步骤之前，所述方法还包括：

判断通讯设备是否启动语音接收功能；

若是，则执行所述自主接收外界环境声音信号的步骤。

优选地，所述将所述语音信号发送至第二通讯设备的步骤之后，所述方法包括：

判断当所述语音信号到达所述第二通讯设备时，在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号；

若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号，则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接；

若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号，则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。

优选地，所述将所述语音信号进行分段处理以得到多个语音信号节段的步骤之前所述方法还包括：

根据所述语音信号的语调、振幅、频率及声线，判断所述语音信号是否来源于特定用户；

若所述语音信号来源于特定用户，则执行将所述语音信号进行分段处理以得到多个语音信号节段的步骤。

优选地，所述将所述语音信号发送至第二通讯设备的步骤具体包括：

通过A/D转换器对所述语音信号处理得到数字语音，将所述数字语音发送至所述第二通讯设备。

本发明另一方面提出一种耳机，包括声控通讯处理系统，所述声控通讯处理系统包括：

语音接收模块，用于自主接收外界环境声音信号；

过滤模块，用于对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；

处理模块，用于将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；

判断模块，用于计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；

通讯模块，用于若所述平均幅值大于或等于预设的声控阈值，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。

优选地，所述声控通讯处理系统还包括：

功能识别模块，用于判断通讯设备是否启动语音接收功能；

所述功能识别模块，用于当通讯设备启动语音接收功能时，自主接收外界环境声音信号。

优选地，所述声控通讯处理系统还包括：

判断单元，用于判断当所述语音信号到达所述第二通讯设备时，在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号；

第一执行单元，用于若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号，则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接；

第二执行单元，用于若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号，则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。

优选地，所述声控通讯处理系统还包括：

分析单元，用于根据所述语音信号的语调、振幅、频率及声线，判断所述语音信号是否来源于特定用户；

所述分析单元，用于当所述语音信号来源于特定用户时，将所述语音信号进行分段处理以得到多个语音信号节段。

本发明另一方面还提出一种存储介质，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述技术方案中所述的声控通讯处理方法。

本发明另一方面还提出一种计算机，其上存储有计算机程序，该程序被处理器执行时实现上述技术方案中所述的声控通讯处理方法。

与现有技术相比：通过主动获取外界环境中的声音信号，并从该声音信号中提取出人为发出的语音信号，当该语音信号的幅值大于预设的声控阈值时，则自动将语音信号发送至局域网另一端的通讯设备上，无需人为手动触发通讯，解放了双手，解决了现有技术中采用的通讯方式操作繁琐的技术问题。

附图说明

本发明的上述与/或附加的方面与优点从结合下面附图对实施例的描述中将变得明显与容易理解，其中：

图1为本发明第一实施例中声控通讯处理方法的流程图；

图2为本发明第二实施例中声控通讯处理方法的流程图；

图3为本发明第二实施例中语音信号提取的流程图；

图4为本发明第二实施例中语音信号发送的流程图；

图5为本发明第二实施例中对通讯状态处理方式的流程图；

图6为本发明第三实施例中声控通讯处理系统的结构框图；

附图标号说明：

语音接收模块10、过滤模块20、处理模块30、判断模块40、通讯模块50；

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的多实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是，当元件被称为“固设于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及／或”包括一个或多个相关的所列项目的任意的和所有的组合。

实施例一

请参阅图1，所示为本发明中的声控通讯处理方法，应用于第一通讯设备，该第一通讯设备具体为耳机，所述方法具体包括步骤S101至步骤S105。

步骤S101，自主接收外界环境声音信号；

具体地，由耳机上设置的麦克风来获取外界环境中的声音信号，该外界环境声音信号包括人为发出的语音信号以及外界环境中存在的噪音信号。

步骤S102，对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；

具体地，可根据用户特有的音频范围来过滤噪音，例如，读取一段标准语句之后，每一个字都会有一音频值，假如第一个字音频值为30HZ，适当放宽音频范围记为29HZ-31HZ，第二个字音频值为31HZ，则记为30HZ-32HZ，以此类推，最终确定使用者音频范围为：29HZ-32HZ，只要不在该范围内的音频一律进行过滤，只保留该音频范围内的声音。

步骤S103，将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；

具体地，采用短时分析技术，将语音信号分段进行处理，每一段称为1帧，其中帧长为10~30ms，常见为20ms。帧移为0~1/2帧，帧与帧之间平滑过渡，为了减小语音帧的截断效应，对每个语音信号节段加窗处理；

为了便于理解，假设波形的时域信号为S_n，将时域信号分成无数个帧来处理，T为帧移时间，N为帧长，对应的时间分别为0，T，2T……

则第m帧时域信号为：

S_n(m)=S(n+m)W(m)，n=0，0≤m≤N-1；

W(m)为汉明窗表达式：

。

步骤S104，计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；

具体地，平均幅值可以理解为声音的大小，通过判断声音的大小来确定是否发送语音。实际应用中，声控阈值设定的等级越高，需要越大的音量才能发射，反之，等级越低，小的声音就能发射，因此，用户可根据自己的使用环境而设置声控阈值，避免在低分贝的环境中，由于声控阈值的等级过高而需要较大的声音才能触发通讯，或是在高分贝的环境中，由于声控阈值的等级过低而导致容易受到环境噪声干扰而误发射。

步骤S105，若是，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。

可以理解地，当第N帧信号的平均幅度大于所设置的能量阈值时，即平均幅度A_n大于声控阈值时，语音信号通过A/D转换器转换为数字语音后由无线发射模块向局域网另一端的用户发送，反之则不发送。

其中，平均幅度的计算公式为：

；

A_n表示第N帧信号的平均幅度。

综上，本发明上述实施例当中的声控通讯处理方法，通过主动获取外界环境中的声音信号，并从该声音信号中提取出人为发出的语音信号，当该语音信号的幅值大于预设的声控阈值时，则自动将语音信号发送至局域网另一端的通讯设备上，无需人为手动触发通讯，解放了双手，解决了现有技术中采用的通讯方式操作繁琐的技术问题。

实施例二

具体参阅图2，本发明第二实施例中的声控通讯处理方法，应用于第一通讯设备，该第一通讯设备具体为耳机，所述方法具体包括步骤S11至步骤S15。

步骤S11，自主接收外界环境声音信号；

步骤S12，对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；

步骤S13，将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；

具体地，可参阅图3，采用短时分析技术，将语音信号分段进行处理，每一段称为1帧，其中帧长为10~30ms，常见为20ms。帧移为0~1/2帧，帧与帧之间平滑过渡，为了减小语音帧的截断效应，对每个语音信号节段加窗处理；

则第m帧时域信号为：

S_n(m)=S(n+m)W(m)，n=0，0≤m≤N-1；

W(m)为汉明窗表达式：

。

步骤S14，计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；

步骤S15，若是，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。

其中，平均幅度的计算公式为：

；

A_n表示第N帧信号的平均幅度。

进一步地，所述自主接收外界环境声音信号的步骤之前，所述方法还包括：

判断通讯设备是否启动语音接收功能；

若是，则执行所述自主接收外界环境声音信号的步骤。

可以理解地，当用户开启耳机的语音接收功能后，耳机才开启自主接收外界环境声音信号，否则耳机仅用于播放声音。

进一步地，所述将所述语音信号发送至第二通讯设备的步骤之后，所述方法包括：

具体可参阅图5，在实际应用中，我们为了确保语音信号可以实时输出，通过设定一个时间阈值来提升用户之间的沟通的流畅性，即，当语音信号到达相对用户的通讯设备后，开始分析，当在预设的时间间隔内接收到了来自相对用户所发送的语音信号，则保持设备之间的通讯连接，反之，若在预设的时间间隔内没有收到来自相对用户所发送的语音信号则断开通讯连接，断开通讯连接后的耳机自动进入待机节能模式，以降低耳机的功耗提升续航。本实施例中预设时间间隔设定为4秒延迟，但不局限于此，具体可根据用户的使用习惯进行设定。

进一步地，所述将所述语音信号进行分段处理以得到多个语音信号节段的步骤之前所述方法还包括：

可以理解地，通过识别该语音信号是否是人类语音、甚至可以识别是否为合法用户、默认用户和/或特定用户(男、女、老、幼、主人、设备常用用户等等)的声音；如果是其他的声音(即否)则可以不必编码、传送，避免发送非本人发出的语音，提升语音传输的有效性。

进一步地，所述将所述语音信号发送至第二通讯设备的步骤具体包括：

具体参阅图4，实际应用中，当计算出所述平均幅值大于或等于预设的声控阈值时，通过A/D转换器将语音信号转换为数字语音，然后将所述数字语音通过局域网发送至相对用户的通讯设备上。

实施例三

本发明另一方面还提供一种耳机，包括声控通讯处理系统，请查阅图6，所示为本发明第三实施例中的声控通讯处理系统，所述声控通讯处理系统包括：

语音接收模块10，用于自主接收外界环境声音信号；

过滤模块20，用于对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；

处理模块30，用于将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；

判断模块40，用于计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；

通讯模块50，用于若所述平均幅值大于或等于预设的声控阈值，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。

进一步地，所述声控通讯处理系统还包括：

功能识别模块，用于判断通讯设备是否启动语音接收功能；

进一步地，所述声控通讯处理系统还包括：

实施例四

本发明还提出一种可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述的声控通讯处理方法。

本发明还提出一种服务器，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述的声控通讯处理方法。

本领域技术人员可以理解，在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置），便携式计算机盘盒（磁装置），随机存取存储器（RAM），只读存储器（ROM），可擦除可编辑只读存储器（EPROM或闪速存储器），光纤装置，以及便携式光盘只读存储器（CDROM）。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或它们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种声控通讯处理方法，其特征在于，应用于第一通讯设备，所述方法包括：

自主接收外界环境声音信号；

2.根据权利要求1所述的声控通讯处理方法，其特征在于，所述自主接收外界环境声音信号的步骤之前，所述方法还包括：

判断通讯设备是否启动语音接收功能；

若是，则执行所述自主接收外界环境声音信号的步骤。

3.根据权利要求1所述的声控通讯处理方法，其特征在于，所述将所述语音信号发送至第二通讯设备的步骤之后，所述方法包括：

4.根据权利要求1所述的声控通讯处理方法，其特征在于，所述将所述语音信号进行分段处理以得到多个语音信号节段的步骤之前所述方法还包括：

5.根据权利要求1所述的声控通讯处理方法，其特征在于，所述将所述语音信号发送至第二通讯设备的步骤具体包括：

6.一种耳机，包括声控通讯处理系统，其特征在于，应用于第一通讯设备，所述声控通讯处理系统包括：

语音接收模块，用于自主接收外界环境声音信号；

7.根据权利要求6所述的耳机，其特征在于，所述声控通讯处理系统还包括：

功能识别模块，用于判断通讯设备是否启动语音接收功能；

8.根据权利要求6所述的耳机，其特征在于，所述声控通讯处理系统还包括：

9.一种存储介质，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1-5中任一项所述的声控通讯处理方法。

10.一种计算机，其上存储有计算机程序，该程序被处理器执行时实现上述权利要求1-5中任一项所述的声控通讯处理方法。