CN116631456A - 一种声控通讯处理方法、耳机、存储介质及计算机 - Google Patents
一种声控通讯处理方法、耳机、存储介质及计算机 Download PDFInfo
- Publication number
- CN116631456A CN116631456A CN202310897008.1A CN202310897008A CN116631456A CN 116631456 A CN116631456 A CN 116631456A CN 202310897008 A CN202310897008 A CN 202310897008A CN 116631456 A CN116631456 A CN 116631456A
- Authority
- CN
- China
- Prior art keywords
- voice
- voice signal
- communication
- communication equipment
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 181
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 230000005236 sound signal Effects 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000009432 framing Methods 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 7
- 230000007613 environmental effect Effects 0.000 description 5
- 230000037433 frameshift Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2801—Broadband local area networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
Abstract
本发明提供一种声控通讯处理方法、耳机、存储介质及计算机,应用于第一通讯设备,所述方法包括:自主接收外界环境声音信号;对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;若是,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。解决了现有技术中采用的通讯方式操作繁琐的技术问题。
Description
技术领域
本发明涉及通讯技术领域,特别涉及一种声控通讯处理方法、耳机、存储介质及计算机。
背景技术
随着科技的进步,电子通讯成了生活重要的一部分,比如说手机、智能手表的普及。但随着信息安全知识的提升,各方面对于信息的保密性也逐渐加强,在一些特殊地区为了信息安全性都使用局域网,在此过程中要保持通讯使用一些便捷携带电子产品辅助通信,如对讲机、蓝牙智能通讯器等,但目前此类产品均要人工操作才能触发通讯。对于一些需要释放双手的工作人员,此类通讯设备就显得较为繁杂。
发明内容
基于此,本发明的目的是提供一种声控通讯处理方法、耳机、存储介质及计算机,用于解决现有技术中采用的通讯方式操作繁琐的技术问题。
本发明一方面提出一种声控通讯处理方法,应用于第一通讯设备,所述方法包括:
自主接收外界环境声音信号;
对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
若是,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
优选地,所述自主接收外界环境声音信号的步骤之前,所述方法还包括:
判断通讯设备是否启动语音接收功能;
若是,则执行所述自主接收外界环境声音信号的步骤。
优选地,所述将所述语音信号发送至第二通讯设备的步骤之后,所述方法包括:
判断当所述语音信号到达所述第二通讯设备时,在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号;
若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号,则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接;
若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号,则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。
优选地,所述将所述语音信号进行分段处理以得到多个语音信号节段的步骤之前所述方法还包括:
根据所述语音信号的语调、振幅、频率及声线,判断所述语音信号是否来源于特定用户;
若所述语音信号来源于特定用户,则执行将所述语音信号进行分段处理以得到多个语音信号节段的步骤。
优选地,所述将所述语音信号发送至第二通讯设备的步骤具体包括:
通过A/D转换器对所述语音信号处理得到数字语音,将所述数字语音发送至所述第二通讯设备。
本发明另一方面提出一种耳机,包括声控通讯处理系统,所述声控通讯处理系统包括:
语音接收模块,用于自主接收外界环境声音信号;
过滤模块,用于对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
处理模块,用于将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
判断模块,用于计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
通讯模块,用于若所述平均幅值大于或等于预设的声控阈值,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
优选地,所述声控通讯处理系统还包括:
功能识别模块,用于判断通讯设备是否启动语音接收功能;
所述功能识别模块,用于当通讯设备启动语音接收功能时,自主接收外界环境声音信号。
优选地,所述声控通讯处理系统还包括:
判断单元,用于判断当所述语音信号到达所述第二通讯设备时,在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号;
第一执行单元,用于若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号,则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接;
第二执行单元,用于若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号,则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。
优选地,所述声控通讯处理系统还包括:
分析单元,用于根据所述语音信号的语调、振幅、频率及声线,判断所述语音信号是否来源于特定用户;
所述分析单元,用于当所述语音信号来源于特定用户时,将所述语音信号进行分段处理以得到多个语音信号节段。
本发明另一方面还提出一种存储介质,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述技术方案中所述的声控通讯处理方法。
本发明另一方面还提出一种计算机,其上存储有计算机程序,该程序被处理器执行时实现上述技术方案中所述的声控通讯处理方法。
与现有技术相比:通过主动获取外界环境中的声音信号,并从该声音信号中提取出人为发出的语音信号,当该语音信号的幅值大于预设的声控阈值时,则自动将语音信号发送至局域网另一端的通讯设备上,无需人为手动触发通讯,解放了双手,解决了现有技术中采用的通讯方式操作繁琐的技术问题。
附图说明
本发明的上述与/或附加的方面与优点从结合下面附图对实施例的描述中将变得明显与容易理解,其中:
图1为本发明第一实施例中声控通讯处理方法的流程图;
图2为本发明第二实施例中声控通讯处理方法的流程图;
图3为本发明第二实施例中语音信号提取的流程图;
图4为本发明第二实施例中语音信号发送的流程图;
图5为本发明第二实施例中对通讯状态处理方式的流程图;
图6为本发明第三实施例中声控通讯处理系统的结构框图;
附图标号说明:
语音接收模块10、过滤模块20、处理模块30、判断模块40、通讯模块50;
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的多实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,所示为本发明中的声控通讯处理方法,应用于第一通讯设备,该第一通讯设备具体为耳机,所述方法具体包括步骤S101至步骤S105。
步骤S101,自主接收外界环境声音信号;
具体地,由耳机上设置的麦克风来获取外界环境中的声音信号,该外界环境声音信号包括人为发出的语音信号以及外界环境中存在的噪音信号。
步骤S102,对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
具体地,可根据用户特有的音频范围来过滤噪音,例如,读取一段标准语句之后,每一个字都会有一音频值,假如第一个字音频值为30HZ,适当放宽音频范围记为29HZ-31HZ,第二个字音频值为31HZ,则记为30HZ-32HZ,以此类推,最终确定使用者音频范围为:29HZ-32HZ,只要不在该范围内的音频一律进行过滤,只保留该音频范围内的声音。
步骤S103,将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
具体地,采用短时分析技术,将语音信号分段进行处理,每一段称为1帧,其中帧长为10~30ms,常见为20ms。帧移为0~1/2帧,帧与帧之间平滑过渡,为了减小语音帧的截断效应,对每个语音信号节段加窗处理;
为了便于理解,假设波形的时域信号为Sn,将时域信号分成无数个帧来处理,T为帧移时间,N为帧长,对应的时间分别为0,T,2T……
则第m帧时域信号为:
Sn(m)=S(n+m)W(m),n=0,0≤m≤N-1;
W(m)为汉明窗表达式:
。
步骤S104,计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
具体地,平均幅值可以理解为声音的大小,通过判断声音的大小来确定是否发送语音。实际应用中,声控阈值设定的等级越高,需要越大的音量才能发射,反之,等级越低,小的声音就能发射,因此,用户可根据自己的使用环境而设置声控阈值,避免在低分贝的环境中,由于声控阈值的等级过高而需要较大的声音才能触发通讯,或是在高分贝的环境中,由于声控阈值的等级过低而导致容易受到环境噪声干扰而误发射。
步骤S105,若是,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
可以理解地,当第N帧信号的平均幅度大于所设置的能量阈值时,即平均幅度An大于声控阈值时,语音信号通过A/D转换器转换为数字语音后由无线发射模块向局域网另一端的用户发送,反之则不发送。
其中,平均幅度的计算公式为:
;
An表示第N帧信号的平均幅度。
综上,本发明上述实施例当中的声控通讯处理方法,通过主动获取外界环境中的声音信号,并从该声音信号中提取出人为发出的语音信号,当该语音信号的幅值大于预设的声控阈值时,则自动将语音信号发送至局域网另一端的通讯设备上,无需人为手动触发通讯,解放了双手,解决了现有技术中采用的通讯方式操作繁琐的技术问题。
实施例二
具体参阅图2,本发明第二实施例中的声控通讯处理方法,应用于第一通讯设备,该第一通讯设备具体为耳机,所述方法具体包括步骤S11至步骤S15。
步骤S11,自主接收外界环境声音信号;
具体地,由耳机上设置的麦克风来获取外界环境中的声音信号,该外界环境声音信号包括人为发出的语音信号以及外界环境中存在的噪音信号。
步骤S12,对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
具体地,可根据用户特有的音频范围来过滤噪音,例如,读取一段标准语句之后,每一个字都会有一音频值,假如第一个字音频值为30HZ,适当放宽音频范围记为29HZ-31HZ,第二个字音频值为31HZ,则记为30HZ-32HZ,以此类推,最终确定使用者音频范围为:29HZ-32HZ,只要不在该范围内的音频一律进行过滤,只保留该音频范围内的声音。
步骤S13,将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
具体地,可参阅图3,采用短时分析技术,将语音信号分段进行处理,每一段称为1帧,其中帧长为10~30ms,常见为20ms。帧移为0~1/2帧,帧与帧之间平滑过渡,为了减小语音帧的截断效应,对每个语音信号节段加窗处理;
为了便于理解,假设波形的时域信号为Sn,将时域信号分成无数个帧来处理,T为帧移时间,N为帧长,对应的时间分别为0,T,2T……
则第m帧时域信号为:
Sn(m)=S(n+m)W(m),n=0,0≤m≤N-1;
W(m)为汉明窗表达式:
。
步骤S14,计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
具体地,平均幅值可以理解为声音的大小,通过判断声音的大小来确定是否发送语音。实际应用中,声控阈值设定的等级越高,需要越大的音量才能发射,反之,等级越低,小的声音就能发射,因此,用户可根据自己的使用环境而设置声控阈值,避免在低分贝的环境中,由于声控阈值的等级过高而需要较大的声音才能触发通讯,或是在高分贝的环境中,由于声控阈值的等级过低而导致容易受到环境噪声干扰而误发射。
步骤S15,若是,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
可以理解地,当第N帧信号的平均幅度大于所设置的能量阈值时,即平均幅度An大于声控阈值时,语音信号通过A/D转换器转换为数字语音后由无线发射模块向局域网另一端的用户发送,反之则不发送。
其中,平均幅度的计算公式为:
;
An表示第N帧信号的平均幅度。
进一步地,所述自主接收外界环境声音信号的步骤之前,所述方法还包括:
判断通讯设备是否启动语音接收功能;
若是,则执行所述自主接收外界环境声音信号的步骤。
可以理解地,当用户开启耳机的语音接收功能后,耳机才开启自主接收外界环境声音信号,否则耳机仅用于播放声音。
进一步地,所述将所述语音信号发送至第二通讯设备的步骤之后,所述方法包括:
判断当所述语音信号到达所述第二通讯设备时,在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号;
若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号,则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接;
若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号,则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。
具体可参阅图5,在实际应用中,我们为了确保语音信号可以实时输出,通过设定一个时间阈值来提升用户之间的沟通的流畅性,即,当语音信号到达相对用户的通讯设备后,开始分析,当在预设的时间间隔内接收到了来自相对用户所发送的语音信号,则保持设备之间的通讯连接,反之,若在预设的时间间隔内没有收到来自相对用户所发送的语音信号则断开通讯连接,断开通讯连接后的耳机自动进入待机节能模式,以降低耳机的功耗提升续航。本实施例中预设时间间隔设定为4秒延迟,但不局限于此,具体可根据用户的使用习惯进行设定。
进一步地,所述将所述语音信号进行分段处理以得到多个语音信号节段的步骤之前所述方法还包括:
根据所述语音信号的语调、振幅、频率及声线,判断所述语音信号是否来源于特定用户;
若所述语音信号来源于特定用户,则执行将所述语音信号进行分段处理以得到多个语音信号节段的步骤。
可以理解地,通过识别该语音信号是否是人类语音、甚至可以识别是否为合法用户、默认用户和/或特定用户(男、女、老、幼、主人、设备常用用户等等)的声音;如果是其他的声音(即否)则可以不必编码、传送,避免发送非本人发出的语音,提升语音传输的有效性。
进一步地,所述将所述语音信号发送至第二通讯设备的步骤具体包括:
通过A/D转换器对所述语音信号处理得到数字语音,将所述数字语音发送至所述第二通讯设备。
具体参阅图4,实际应用中,当计算出所述平均幅值大于或等于预设的声控阈值时,通过A/D转换器将语音信号转换为数字语音,然后将所述数字语音通过局域网发送至相对用户的通讯设备上。
综上,本发明上述实施例当中的声控通讯处理方法,通过主动获取外界环境中的声音信号,并从该声音信号中提取出人为发出的语音信号,当该语音信号的幅值大于预设的声控阈值时,则自动将语音信号发送至局域网另一端的通讯设备上,无需人为手动触发通讯,解放了双手,解决了现有技术中采用的通讯方式操作繁琐的技术问题。
实施例三
本发明另一方面还提供一种耳机,包括声控通讯处理系统,请查阅图6,所示为本发明第三实施例中的声控通讯处理系统,所述声控通讯处理系统包括:
语音接收模块10,用于自主接收外界环境声音信号;
过滤模块20,用于对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
处理模块30,用于将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
判断模块40,用于计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
通讯模块50,用于若所述平均幅值大于或等于预设的声控阈值,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
进一步地,所述声控通讯处理系统还包括:
功能识别模块,用于判断通讯设备是否启动语音接收功能;
所述功能识别模块,用于当通讯设备启动语音接收功能时,自主接收外界环境声音信号。
进一步地,所述声控通讯处理系统还包括:
判断单元,用于判断当所述语音信号到达所述第二通讯设备时,在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号;
第一执行单元,用于若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号,则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接;
第二执行单元,用于若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号,则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。
进一步地,所述声控通讯处理系统还包括:
分析单元,用于根据所述语音信号的语调、振幅、频率及声线,判断所述语音信号是否来源于特定用户;
所述分析单元,用于当所述语音信号来源于特定用户时,将所述语音信号进行分段处理以得到多个语音信号节段。
综上,本发明上述实施例当中的声控通讯处理方法,通过主动获取外界环境中的声音信号,并从该声音信号中提取出人为发出的语音信号,当该语音信号的幅值大于预设的声控阈值时,则自动将语音信号发送至局域网另一端的通讯设备上,无需人为手动触发通讯,解放了双手,解决了现有技术中采用的通讯方式操作繁琐的技术问题。
实施例四
本发明还提出一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的声控通讯处理方法。
本发明还提出一种服务器,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的声控通讯处理方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种声控通讯处理方法,其特征在于,应用于第一通讯设备,所述方法包括:
自主接收外界环境声音信号;
对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
若是,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
2.根据权利要求1所述的声控通讯处理方法,其特征在于,所述自主接收外界环境声音信号的步骤之前,所述方法还包括:
判断通讯设备是否启动语音接收功能;
若是,则执行所述自主接收外界环境声音信号的步骤。
3.根据权利要求1所述的声控通讯处理方法,其特征在于,所述将所述语音信号发送至第二通讯设备的步骤之后,所述方法包括:
判断当所述语音信号到达所述第二通讯设备时,在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号;
若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号,则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接;
若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号,则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。
4.根据权利要求1所述的声控通讯处理方法,其特征在于,所述将所述语音信号进行分段处理以得到多个语音信号节段的步骤之前所述方法还包括:
根据所述语音信号的语调、振幅、频率及声线,判断所述语音信号是否来源于特定用户;
若所述语音信号来源于特定用户,则执行将所述语音信号进行分段处理以得到多个语音信号节段的步骤。
5.根据权利要求1所述的声控通讯处理方法,其特征在于,所述将所述语音信号发送至第二通讯设备的步骤具体包括:
通过A/D转换器对所述语音信号处理得到数字语音,将所述数字语音发送至所述第二通讯设备。
6.一种耳机,包括声控通讯处理系统,其特征在于,应用于第一通讯设备,所述声控通讯处理系统包括:
语音接收模块,用于自主接收外界环境声音信号;
过滤模块,用于对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;
处理模块,用于将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;
判断模块,用于计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;
通讯模块,用于若所述平均幅值大于或等于预设的声控阈值,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。
7.根据权利要求6所述的耳机,其特征在于,所述声控通讯处理系统还包括:
功能识别模块,用于判断通讯设备是否启动语音接收功能;
所述功能识别模块,用于当通讯设备启动语音接收功能时,自主接收外界环境声音信号。
8.根据权利要求6所述的耳机,其特征在于,所述声控通讯处理系统还包括:
判断单元,用于判断当所述语音信号到达所述第二通讯设备时,在预设时间间隔内是否接收到所述第二通讯设备所发出的语音信号;
第一执行单元,用于若在预设时间间隔内接收到了所述第二通讯设备所发出的语音信号,则保持所述第一通讯设备与所述第二通讯设备之间的通讯连接;
第二执行单元,用于若在预设时间间隔内未接收到所述第二通讯设备所发出的语音信号,则断开所述第一通讯设备与所述第二通讯设备之间的通讯连接。
9.一种存储介质,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-5中任一项所述的声控通讯处理方法。
10.一种计算机,其上存储有计算机程序,该程序被处理器执行时实现上述权利要求1-5中任一项所述的声控通讯处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310897008.1A CN116631456A (zh) | 2023-07-21 | 2023-07-21 | 一种声控通讯处理方法、耳机、存储介质及计算机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310897008.1A CN116631456A (zh) | 2023-07-21 | 2023-07-21 | 一种声控通讯处理方法、耳机、存储介质及计算机 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116631456A true CN116631456A (zh) | 2023-08-22 |
Family
ID=87613760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310897008.1A Pending CN116631456A (zh) | 2023-07-21 | 2023-07-21 | 一种声控通讯处理方法、耳机、存储介质及计算机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116631456A (zh) |
Citations (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11187239A (ja) * | 1997-12-22 | 1999-07-09 | Canon Inc | 通信装置 |
JP2001103169A (ja) * | 1999-09-28 | 2001-04-13 | Matsushita Electric Ind Co Ltd | 転送機能付きインターホン装置 |
US20060035635A1 (en) * | 2004-08-16 | 2006-02-16 | Funai Electric Co., Ltd. | Intercom system |
CN102104473A (zh) * | 2011-01-12 | 2011-06-22 | 海能达通信股份有限公司 | 一种单工终端与双工终端通话的方法及系统 |
CN103024681A (zh) * | 2011-09-20 | 2013-04-03 | 佳都新太科技股份有限公司 | 一种高效的按键通话方法 |
CN103270702A (zh) * | 2010-10-27 | 2013-08-28 | 惠普发展公司,有限责任合伙企业 | 用于在通信会话中启用音频发送的系统、方法和装置 |
CN103489451A (zh) * | 2012-06-13 | 2014-01-01 | 百度在线网络技术(北京)有限公司 | 移动终端的语音处理方法及移动终端 |
US20140081631A1 (en) * | 2010-10-04 | 2014-03-20 | Manli Zhu | Wearable Communication System With Noise Cancellation |
CN103957310A (zh) * | 2014-04-02 | 2014-07-30 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US20150215449A1 (en) * | 2014-01-29 | 2015-07-30 | Biglobe Inc. | Incoming call management device, management server, telephone terminal, controller, communication system, incoming call control method and program |
CN105405452A (zh) * | 2015-11-13 | 2016-03-16 | 苏州集联微电子科技有限公司 | 一种无线对讲机数字软静音方法 |
CN105721656A (zh) * | 2016-03-17 | 2016-06-29 | 北京小米移动软件有限公司 | 背景噪声生成方法及装置 |
CN205864519U (zh) * | 2016-07-15 | 2017-01-04 | 深圳普罗迪通信有限公司 | Vox双mic校准优化电路 |
CN106470224A (zh) * | 2015-08-18 | 2017-03-01 | 中兴通讯股份有限公司 | 智能设备的控制方法及装置 |
CN106816155A (zh) * | 2016-12-23 | 2017-06-09 | 维沃移动通信有限公司 | 一种提升语音传输信噪比的方法及装置 |
CN108270922A (zh) * | 2018-01-19 | 2018-07-10 | 西安蜂语信息科技有限公司 | 语音处理方法及装置 |
CN109859757A (zh) * | 2019-03-19 | 2019-06-07 | 百度在线网络技术(北京)有限公司 | 一种语音设备控制方法、装置和终端 |
US20200150919A1 (en) * | 2018-11-13 | 2020-05-14 | Synervoz Communications Inc. | Systems and methods for contextual audio detection and communication mode transactions |
CN111292758A (zh) * | 2019-03-12 | 2020-06-16 | 展讯通信(上海)有限公司 | 语音活动检测方法及装置、可读存储介质 |
CN212649692U (zh) * | 2020-09-11 | 2021-03-02 | 泉州市创新电子科技有限公司 | 一种vox智能声控模块 |
CN214125328U (zh) * | 2020-07-13 | 2021-09-03 | 杭州慧点物联科技有限公司 | 一种用于无线集群网关与宽带通信系统互联互通的窄带通信系统设备 |
CN113596694A (zh) * | 2021-06-07 | 2021-11-02 | 杭州纳奇思科技有限公司 | 一种基于无线移动通信的声纹采集测试装置及测试方法 |
CN114067821A (zh) * | 2020-08-03 | 2022-02-18 | 阿里巴巴集团控股有限公司 | 语音处理方法、装置、设备和存储介质 |
CN115086825A (zh) * | 2022-06-14 | 2022-09-20 | 冯长春 | 一种提高阅读及听力效果的方法及耳机 |
CN217546276U (zh) * | 2022-05-24 | 2022-10-04 | 深圳市华珍科技有限公司 | 便携式收发器和音频处理系统 |
JP7179128B1 (ja) * | 2021-07-06 | 2022-11-28 | アルインコ株式会社 | 無線通信装置及び無線通信システム |
CN115831155A (zh) * | 2021-09-16 | 2023-03-21 | 腾讯科技(深圳)有限公司 | 音频信号的处理方法、装置、电子设备及存储介质 |
CN116208956A (zh) * | 2022-12-30 | 2023-06-02 | 上海数果科技有限公司 | 一种对讲终端的登录方法、装置、电子设备及介质 |
-
2023
- 2023-07-21 CN CN202310897008.1A patent/CN116631456A/zh active Pending
Patent Citations (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11187239A (ja) * | 1997-12-22 | 1999-07-09 | Canon Inc | 通信装置 |
JP2001103169A (ja) * | 1999-09-28 | 2001-04-13 | Matsushita Electric Ind Co Ltd | 転送機能付きインターホン装置 |
US20060035635A1 (en) * | 2004-08-16 | 2006-02-16 | Funai Electric Co., Ltd. | Intercom system |
US20140081631A1 (en) * | 2010-10-04 | 2014-03-20 | Manli Zhu | Wearable Communication System With Noise Cancellation |
CN103270702A (zh) * | 2010-10-27 | 2013-08-28 | 惠普发展公司,有限责任合伙企业 | 用于在通信会话中启用音频发送的系统、方法和装置 |
CN102104473A (zh) * | 2011-01-12 | 2011-06-22 | 海能达通信股份有限公司 | 一种单工终端与双工终端通话的方法及系统 |
CN103024681A (zh) * | 2011-09-20 | 2013-04-03 | 佳都新太科技股份有限公司 | 一种高效的按键通话方法 |
CN103489451A (zh) * | 2012-06-13 | 2014-01-01 | 百度在线网络技术(北京)有限公司 | 移动终端的语音处理方法及移动终端 |
US20150215449A1 (en) * | 2014-01-29 | 2015-07-30 | Biglobe Inc. | Incoming call management device, management server, telephone terminal, controller, communication system, incoming call control method and program |
CN103957310A (zh) * | 2014-04-02 | 2014-07-30 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106470224A (zh) * | 2015-08-18 | 2017-03-01 | 中兴通讯股份有限公司 | 智能设备的控制方法及装置 |
CN105405452A (zh) * | 2015-11-13 | 2016-03-16 | 苏州集联微电子科技有限公司 | 一种无线对讲机数字软静音方法 |
CN105721656A (zh) * | 2016-03-17 | 2016-06-29 | 北京小米移动软件有限公司 | 背景噪声生成方法及装置 |
CN205864519U (zh) * | 2016-07-15 | 2017-01-04 | 深圳普罗迪通信有限公司 | Vox双mic校准优化电路 |
CN106816155A (zh) * | 2016-12-23 | 2017-06-09 | 维沃移动通信有限公司 | 一种提升语音传输信噪比的方法及装置 |
CN108270922A (zh) * | 2018-01-19 | 2018-07-10 | 西安蜂语信息科技有限公司 | 语音处理方法及装置 |
US20200150919A1 (en) * | 2018-11-13 | 2020-05-14 | Synervoz Communications Inc. | Systems and methods for contextual audio detection and communication mode transactions |
CN111292758A (zh) * | 2019-03-12 | 2020-06-16 | 展讯通信(上海)有限公司 | 语音活动检测方法及装置、可读存储介质 |
CN109859757A (zh) * | 2019-03-19 | 2019-06-07 | 百度在线网络技术(北京)有限公司 | 一种语音设备控制方法、装置和终端 |
CN214125328U (zh) * | 2020-07-13 | 2021-09-03 | 杭州慧点物联科技有限公司 | 一种用于无线集群网关与宽带通信系统互联互通的窄带通信系统设备 |
CN114067821A (zh) * | 2020-08-03 | 2022-02-18 | 阿里巴巴集团控股有限公司 | 语音处理方法、装置、设备和存储介质 |
CN212649692U (zh) * | 2020-09-11 | 2021-03-02 | 泉州市创新电子科技有限公司 | 一种vox智能声控模块 |
CN113596694A (zh) * | 2021-06-07 | 2021-11-02 | 杭州纳奇思科技有限公司 | 一种基于无线移动通信的声纹采集测试装置及测试方法 |
JP7179128B1 (ja) * | 2021-07-06 | 2022-11-28 | アルインコ株式会社 | 無線通信装置及び無線通信システム |
CN115831155A (zh) * | 2021-09-16 | 2023-03-21 | 腾讯科技(深圳)有限公司 | 音频信号的处理方法、装置、电子设备及存储介质 |
CN217546276U (zh) * | 2022-05-24 | 2022-10-04 | 深圳市华珍科技有限公司 | 便携式收发器和音频处理系统 |
CN115086825A (zh) * | 2022-06-14 | 2022-09-20 | 冯长春 | 一种提高阅读及听力效果的方法及耳机 |
CN116208956A (zh) * | 2022-12-30 | 2023-06-02 | 上海数果科技有限公司 | 一种对讲终端的登录方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150281853A1 (en) | Systems and methods for enhancing targeted audibility | |
CN107995360B (zh) | 通话处理方法及相关产品 | |
US20180130454A1 (en) | Noise control method and device | |
US9923535B2 (en) | Noise control method and device | |
WO2014117722A1 (zh) | 语音处理方法、装置及终端设备 | |
JP2004527006A (ja) | 分散型音声認識システムにおける音声アクティブな状態を送信するためのシステム及び方法 | |
CN108198569A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
CN110827858B (zh) | 语音端点检测方法及系统 | |
CN109361995B (zh) | 一种电器设备的音量调节方法、装置、电器设备和介质 | |
CN109104616B (zh) | 一种直播间的语音连麦方法及客户端 | |
CN111128166B (zh) | 连续唤醒识别功能的优化方法和装置 | |
CN107978320A (zh) | 一种通话调整方法、装置、设备及介质 | |
CN115482830B (zh) | 语音增强方法及相关设备 | |
CN105744084A (zh) | 移动终端及提升移动终端通话音质的方法 | |
CN110503968A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
CN110931027A (zh) | 音频处理方法、装置、电子设备及计算机可读存储介质 | |
CN111199751B (zh) | 一种麦克风的屏蔽方法、装置和电子设备 | |
CN117480554A (zh) | 语音增强方法及相关设备 | |
CN110191397B (zh) | 一种降噪方法及蓝牙耳机 | |
KR100664271B1 (ko) | 음원분리가 가능한 휴대용 단말기 및 그 방법 | |
CN110232909A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
CN113113038B (zh) | 回声消除方法、装置及电子设备 | |
CN117711420B (zh) | 目标人声提取方法、电子设备及存储介质 | |
CN114420146A (zh) | 音频数据处理方法、装置、电子设备和存储介质 | |
CN104851423A (zh) | 一种声音信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230822 |
|
RJ01 | Rejection of invention patent application after publication |