CN116453540B - 水下蛙人语音通信质量增强处理方法 - Google Patents
水下蛙人语音通信质量增强处理方法 Download PDFInfo
- Publication number
- CN116453540B CN116453540B CN202310708183.1A CN202310708183A CN116453540B CN 116453540 B CN116453540 B CN 116453540B CN 202310708183 A CN202310708183 A CN 202310708183A CN 116453540 B CN116453540 B CN 116453540B
- Authority
- CN
- China
- Prior art keywords
- voice
- communication
- quality
- channel
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006854 communication Effects 0.000 title claims abstract description 183
- 238000004891 communication Methods 0.000 title claims abstract description 183
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 230000005540 biological transmission Effects 0.000 claims abstract description 73
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000008451 emotion Effects 0.000 claims description 14
- 238000012544 monitoring process Methods 0.000 claims description 12
- 238000013441 quality evaluation Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 7
- 230000007175 bidirectional communication Effects 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 238000012423 maintenance Methods 0.000 description 7
- 230000002996 emotional effect Effects 0.000 description 3
- 230000009189 diving Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
- G10L2021/03643—Diver speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了水下蛙人语音通信质量增强处理方法,涉及语音通信技术领域,基于AI语音训练模型获取语音通信包,其中,所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征,建立语音通信包身份信息,根据语音通信包身份信息端设立语音采集端;所述语音通信包引入语音识别中,构建AI语音识别处理模型,获取语音采集端的语音,得到语音信息;搭建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端,获取所述通信传输通道,确定通信的所述语音采集端。本发明能够通过音色特征、咬字特征与音调特征判断目标人员的身份,在保证传输不存在杂音的同时,也做到真实的语音交流。
Description
技术领域
本发明涉及语音通信技术领域,具体涉及水下蛙人语音通信质量增强处理方法。
背景技术
为了对水下进行探索和工作,人员需要佩戴上专业的潜水设备进行下水,通常下水工作和探索的人员为多人行动,被称为水下蛙人,在工作的过程中需要人员之间进行工作配合,由于潜水设备的覆盖,直接交流存在困难,因此,语音通信被投入到水下蛙人工作领域中进行使用;而现有的语音通信在水中工作时,难以全面的过滤掉水流的声音杂质,且在水中进行传输的过程中由于传输信号的问题也会影响到语音质量,因此知道接听者难以听到清晰的语音,导致交流存在一定的障碍,影响水下蛙人在水中的作业。
发明内容
本发明的目的是提供水下蛙人语音通信质量增强处理方法,以解决背景技术中不足。
为了实现上述目的,本发明提供如下技术方案:水下蛙人语音通信质量增强处理方法,基于AI语音训练模型获取语音通信包,其中,所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征,建立语音通信包身份信息,根据语音通信包身份信息端设立语音采集端;
所述语音通信包引入语音识别中,构建AI语音识别处理模型,获取语音采集端的语音,得到语音信息;
搭建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端;
获取所述通信传输通道,确定通信的所述语音采集端,锁定确定通信的所述语音采集端之间的通信传输通道,得到专属通道;
获取所述语音信息,并将所述语音信息通过专属通道传输,得到传输语音;
监测所述传输语音,评估传输语音质量,得到语音质量等级;
制定语音质量增强项,根据语音质量特征对应启用语音质量增强项。
在一个优选的实施方式中,所述基于AI语音训练模型获取语音通信包的步骤,包括:
制定情绪文字,其中,情绪文字包括有多组不同情绪的文字句;
目标人员通过带有不同的情绪阅读所述文字句,得到多组目标人员声音信息;
将所述多组目标人员声音信息逐一投入到AI语音训练模型中进行深度学习训练,得到语音通信包。
在一个优选的实施方式中,所述建立语音通信包身份信息的步骤,包括:
获取目标人员的身份信息,绑定所述语音通信包与目标人员的身份信息,得到语音通信包身份信息;
将储存的多组目标人员声音信息绑定到语音通信包身份信息中。
在一个优选的实施方式中,所述语音通信包引入语音识别中,构建AI语音识别处理模型,获取语音采集端的语音,得到语音信息的步骤,包括:
获取语音通信包,提取语音通信包中的语音特征;
构建语音识别通道,其中,语音识别通道用于语音转化文字,将语音特征引入语音识别通道中,获得语音数据;
基于文字识别转化机械语音并与语音特征整合,构建AI语音识别处理模型;
根据语音采集端获取目标人员语音,通过AI语音识别处理模型得到语音信息。
在一个优选的实施方式中,所述搭建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端的步骤,包括:
构建信号网,在信号网中设立通信平台;
获取多个所述语音采集端与通信平台之间双向通信互联;
在通信平台中根据语音采集端的数量两两之间设定通信通道,得到通信传输通道;
通过所述通信传输通道互联所述语音采集端。
在一个优选的实施方式中,所述构建信号网的步骤,包括:
获取目标人员数量,对应目标人员携带信号产生设备;
根据信号产生设备的信号铺设距离,监测信号产生设备之间的距离,得到距离值;
若距离值超出信号铺设距离双倍距离时,立即报警;通过监测信号产生设备之间的信号铺设,得到信号网。
在一个优选的实施方式中,所述锁定确定通信的所述语音采集端之间的通信传输通道,得到专属通道的步骤,包括:
选择确定通信的语音采集端,对应所述确定通信的语音采集端之间的确定通信通道;
在通信平台中选择并锁定确定通信通道,其中一个所述确定通信的语音采集端的语音信息通过锁定的通信通道传输至其他所述确定通信的语音采集端,得到专属通道。
在一个优选的实施方式中,所述监测所述传输语音,评估传输语音质量,得到语音质量等级的步骤,包括:
获取所述专属通道中的传输语音,分析所述专属通道中的传输语音特征,对比专属通道中的传输语音特征与语音信息中的语音特征,得到第一特征;
建立语音质量评估项,其中,语音质量评估项包括有音量、音色、音调,语音质量等级分别为优等、中等与差等;
将所述第一特征对应到语音质量评估项中,得到评估指数;
根据语音质量等级设定管理阈值,管理阈值分别为优等阈值、中等阈值与差等阈值。
在一个优选的实施方式中,所述制定语音质量增强项,根据语音质量特征对应启用语音质量增强项的步骤,包括:
获取通信传输通道,在通信传输通道中设定音量、音色与音调维护器;
获取语音质量等级,根据语音质量等级对应启用语音质量增强项对专属通道中的语音信息。
在上述技术方案中,本发明提供的技术效果和优点:
1、本发明通过通过语音采集,获取到目标人员的语音信息,得到准确的语音信息,进而通过AI语音训练模型生成获取到的目标人员的语音信息,进而AI语音训练模型生成获取到的目标人员的语音信息进行传输,由语音信息接受的目标人员所听到,听到的为虚拟语音,能够通过音色特征、咬字特征与音调特征判断目标人员的身份,在保证传输不存在杂音的同时,也做到真实的语音交流;
2、本发明在语音质量等级分别为中等时,选择差异度最大的语音特征进行维护增强,提高语音通讯质量,在语音质量等级分别为差等时,选择所有的语音特征进行维护增强,提高语音通讯质量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1,请参阅图1所示,本实施例所述水下蛙人语音通信质量增强处理方法,包括以下的步骤;
S1、基于AI语音训练模型获取语音通信包,其中,所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征,建立语音通信包身份信息,根据语音通信包身份信息端设立语音采集端;
在一个实施例中,所述基于AI语音训练模型获取语音通信包的步骤,包括:
S11、制定情绪文字,其中,情绪文字包括有多组不同情绪的文字句;
S12、目标人员通过带有不同的情绪阅读所述文字句,得到多组目标人员声音信息;
S13、将所述多组目标人员声音信息逐一投入到AI语音训练模型中进行深度学习训练,得到语音通信包;
如上述的步骤S11-S13所述,通过采集音色特征、咬字特征与音调特征,将多组目标人员声音信息进行数据储存,能够获取目标人员的语音通信包,通过语音通信包,通过情绪文字能够分辨目标人员的语言特征,通过多组目标人员声音信息,能够得到准确的目标人员的语言特征,可使语音通信包信息更加的接近目标人员的语言;
目前设备多数还是采用语音的直接采集,并通过噪声过滤提供对语音采集的准确度和清洗度,提高语音通信质量,本申请通过语音采集,获取到目标人员的语音信息,得到准确的语音信息,进而通过AI语音训练模型生成获取到的目标人员的语音信息,进而AI语音训练模型生成获取到的目标人员的语音信息进行传输,由语音信息接受的目标人员所听到,听到的为虚拟语音,能够通过音色特征、咬字特征与音调特征判断目标人员的身份,在保证传输不存在杂音的同时,也做到真实的语音交流,每听到目标人员在使用过程中声音,将一个字作为识别点,一个字一个字的进行AI模拟,实时对一个字组成的语句进行顺次识别模拟并传输出去,能够保证传输信号的实时性;
在一个实施例中,所述建立语音通信包身份信息的步骤,包括:
S14、获取目标人员的身份信息,绑定所述语音通信包与目标人员的身份信息,得到语音通信包身份信息;
其中,目标人员的身份信息包括有姓名、年龄、联系方式以及工作职位,将储存的多组目标人员声音信息绑定到语音通信包身份信息中;
S2、所述语音通信包引入语音识别中,构建AI语音识别处理模型,获取语音采集端的语音,得到语音信息;
在一个实施例中,所述语音通信包引入语音识别中,构建AI语音识别处理模型,获取语音采集端的语音,得到语音信息的步骤,包括:
S21、获取语音通信包,提取语音通信包中的语音特征;
S22、构建语音识别通道,其中,语音识别通道用于语音转化文字,将语音特征引入语音识别通道中,获得语音数据;
S23、基于文字识别转化机械语音并与语音特征整合,构建AI语音识别处理模型;
S24、根据语音采集端获取目标人员语音,通过AI语音识别处理模型得到语音信息;
如上述的步骤S21-S24所述,语音特征与语音识别通道作为独立的信息,语音识别分为语音进口和语音出口,语音进口与语音采集识别语音转化为文字信息,之后将文字信息转化为无情绪的机械音,将语音特征作为因素附加在机械音中,通过AI语音识别处理模型的整合由语音出口输出,且AI语音识别处理模型与语音特征均位于语音识别通道的中,在实际中的使用为,在目标人员发声说话时例如说“你好”,实时通过语音识别通道的语音进口将语音以电信号形式转化为文字“你好”,并将文字转化为以电信号的形式得到无情绪的机械音“你好”,之后将目标人员的语音特征附加在无情绪的机械音中,通过AI语音识别处理模型整合得到有情绪起伏的“你好”,最后通过语音识别通道的语音出口输出,得到语音数据;
S3、搭建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端;
在一个实施例中,所述搭建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端的步骤,包括:
S31、构建信号网,在信号网中设立通信平台;
S32、获取多个所述语音采集端与通信平台之间双向通信互联;
S33、在通信平台中根据语音采集端的数量两两之间设定通信通道,得到通信传输通道;
S34、通过所述通信传输通道互联所述语音采集端;
构建信号网的步骤,包括:
S35、获取目标人员数量,对应目标人员携带信号产生设备;
S36、根据信号产生设备的信号铺设距离,监测信号产生设备之间的距离,得到距离值;
S37、若距离值超出信号铺设距离双倍距离时,立即报警;通过监测信号产生设备之间的信号铺设,得到信号网;
如上述的步骤S31-S37所述,水下蛙人在下水作业前,需要随身佩戴一个信号产生设备,多个信号产生设备共同在水中搭建一个信号网,在信号的中,目标人员的通信设备能够通过信号网进行通信连接,该操作不仅仅能够用于语音的通信传输,也能够用于其他通信设备的通信传输,另外,在水中搭建的信号网与外界存在信号网的接触重叠时,也能够通过信号网使目标人员与外界的人员通信连接,最后,由于在深水中的信号较差,而现有设备中信号产生装置存在覆盖范围,因此目标人员在超出信号产生装置之间的重合以及接触范围后,很可能与其他的目标人员存在断联,同意发生意外,因此,需要对信号产生设备的信号覆盖范围进行监测,在超出信号产生覆盖范围之后,需要进行提醒,目标人员可返回,重新使自身携带的信号产生设备与其他目标人员的信号产生设备再次连接,保证目标人员之间能够时钟处在互联的范围中,保障了人员的安全;
S4、获取所述通信传输通道,确定通信的所述语音采集端,锁定确定通信的所述语音采集端之间的通信传输通道,得到专属通道;
在一个实施例中,所述锁定确定通信的所述语音采集端之间的通信传输通道,得到专属通道的步骤,包括:
S41、选择确定通信的语音采集端,对应所述确定通信的语音采集端之间的确定通信通道;
S42、在通信平台中选择并锁定确定通信通道,其中一个所述确定通信的语音采集端的语音信息通过锁定的通信通道传输至其他所述确定通信的语音采集端,得到专属通道;
如上述的步骤S41与S42所述,在实际使用时,任意语音采集端的目标人员在下水前需要选择确定通信的其他语音采集端,将自己与其他确定通信的语音采集端建立为一个沟通群组,即通过通信平台将确定通信的语音采集端之间的通信通道全部双向打开,在语音采集端产生AI模拟语音,通信通道仅作为AI模拟语音的传输通道,将多个语音采集端之间联合实现互通,得到专属通道,能够不被其他通信通道所影响,能够锁定通信通道,减少对语音传输质量的影响,同时也能够保证有效的沟通;
S5、获取所述语音信息,并将所述语音信息通过专属通道传输,得到传输语音;
S6、监测所述传输语音,评估传输语音质量,得到语音质量等级;
在一个实施例中,所述监测所述传输语音,评估传输语音质量,得到语音质量等级的步骤,包括:
S61、获取所述专属通道中的传输语音,分析所述专属通道中的传输语音特征,对比专属通道中的传输语音特征与语音信息中的语音特征,得到第一特征;
S62、建立语音质量评估项,其中,语音质量评估项包括有音量、音色、音调,语音质量等级分别为优等、中等与差等;
S63、将所述第一特征对应到语音质量评估项中,得到评估指数,其公式为:
其中,为评估指数,/>、/>与/>分别为专属通道中的音量、音色、音调;/>、与/>分别为语音信息中的音量、音色、音调,/>为评价权重系数,需要说明的是,的数值越大,/>的数值越大,即代表传输过程中的语音质量越差;
S64、根据语音质量等级设定管理阈值,管理阈值分别为优等阈值、中等阈值与差等阈值;
将对应到管理阈值中得到语音质量等级;
如上述步骤S61-S64所述,在生成语音信息之后,需要通过专属通道对语音信息进行传输,在传输的过程中会因为信号以及专属通道的不稳定问题影响语音信息的语音特征发生变化,因此,需要对语音特征进行监测,评估在专属通道中语音信息的质量情况,在语音信息为优等时,不需要进行语音质量的维护提高;在语音信息为中等时,对影响语音清晰度的方面进行维护增强,比如在音调方面,在语音信息为差等时,需要在音量、音色、音调上均进行增强;能够对语音质量进行评估,得到语音是否需要进行增强处理的判断,在得到过程中能够了解/>的分别的数值大小,进而能够对应通过语音质量增强项对音量、音色、音调进行维护启用;
S7、制定语音质量增强项,根据语音质量特征对应启用语音质量增强项;
在一个实施例中,所述制定语音质量增强项,根据语音质量特征对应启用语音质量增强项的步骤,包括:
S71、获取通信传输通道,在通信传输通道中设定音量、音色与音调维护器;
S72、获取语音质量等级,根据语音质量等级对应启用语音质量增强项对专属通道中的语音信息;
如上述步骤S71与S72所述,其中,语音质量增强项,通过获取语音信息中的语音特征数据,并根据语音质量特征中的分别的数值大小,进而能够对应通过语音质量增强项对音量、音色、音调进行维护启用,例如,/>等于10分贝,/>等于2,代表专属通道中的音色与语音信息中的音色的差异数值,整体差异数值为10,/>等于专属通道中的音调与语音信息中的音调波动线图的贴合差异度,整体差异数值为10,在语音质量等级分别为中等时,选择差异度最大的语音特征进行维护增强,提高语音通讯质量,在语音质量等级分别为差等时,选择所有的语音特征进行维护增强,提高语音通讯质量;
能够大大提高对通讯语音质量的维护作用,且能够根据等级进行针对性的语音特征的增强,能够保证收听者在水中也能够清晰的听到语音。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (8)
1.水下蛙人语音通信质量增强处理方法,其特征在于,包括:
基于AI语音训练模型获取语音通信包,其中,所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征,建立语音通信包身份信息,根据语音通信包身份信息端设立语音采集端;
所述语音通信包引入语音识别通道中,构建AI语音识别处理模型,得到语音信息步骤,包括:
获取语音通信包,提取语音通信包中的语音特征;
构建语音识别通道,其中,语音识别通道用于语音转化文字,将语音特征引入语音识别通道中,获得语音数据;
基于文字识别转化机械语音并与语音特征整合,构建AI语音识别处理模型;
根据语音采集端获取目标人员语音,通过AI语音识别处理模型得到语音信息;
搭建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端;
获取所述通信传输通道,确定通信的所述语音采集端,锁定确定通信的所述语音采集端之间的通信传输通道,得到专属通道;
获取所述语音信息,并将所述语音信息通过专属通道传输,得到传输语音;
监测所述传输语音,评估传输语音质量,得到语音质量等级;
制定语音质量增强项,根据语音质量特征对应启用语音质量增强项。
2.根据权利要求1所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述基于AI语音训练模型获取语音通信包步骤,包括:
制定情绪文字,其中,情绪文字包括有多组不同情绪的文字句;
目标人员通过带有不同的情绪阅读所述文字句,得到多组目标人员声音信息;
将所述多组目标人员声音信息逐一投入到AI语音训练模型中进行深度学习训练,得到语音通信包。
3.根据权利要求2所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述建立语音通信包身份信息步骤,包括:
获取目标人员的身份信息,绑定所述语音通信包与目标人员的身份信息,得到语音通信包身份信息;
将储存的多组目标人员声音信息绑定到语音通信包身份信息中。
4.根据权利要求1所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述构建所述语音通信包的通信传输通道,通过所述通信传输通道互联所述语音采集端步骤,包括:
构建信号网,在信号网中设立通信平台;
获取多个所述语音采集端与通信平台之间双向通信互联;
在通信平台中根据语音采集端的数量两两之间设定通信通道,得到通信传输通道;
通过所述通信传输通道互联所述语音采集端。
5.根据权利要求4所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述构建信号网步骤,包括:
获取目标人员数量,对应目标人员携带信号产生设备;
根据信号产生设备的信号铺设距离,监测信号产生设备之间的距离,得到距离值;
若距离值超出信号铺设距离双倍距离时,立即报警;通过监测信号产生设备之间的信号铺设,得到信号网。
6.根据权利要求1所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述锁定确定通信的所述语音采集端之间的通信传输通道,得到专属通道步骤,包括:
选择确定通信的语音采集端,对应所述确定通信的语音采集端之间的确定通信通道;
在通信平台中选择并锁定确定通信通道,其中一个所述确定通信的语音采集端的语音信息通过锁定的通信通道传输至其他所述确定通信的语音采集端,得到专属通道。
7.根据权利要求1所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述监测所述传输语音,评估传输语音质量,得到语音质量等级步骤,包括:
获取所述专属通道中的传输语音,分析所述专属通道中的传输语音特征,对比专属通道中的传输语音特征与语音信息中的语音特征,得到第一特征;
建立语音质量评估项,其中,语音质量评估项包括有音量、音色、音调,语音质量等级分别为优等、中等与差等;
将所述第一特征对应到语音质量评估项中,得到评估指数;
根据语音质量等级设定管理阈值,管理阈值分别为优等阈值、中等阈值与差等阈值。
8.根据权利要求1所述的水下蛙人语音通信质量增强处理方法,其特征在于:所述制定语音质量增强项,根据语音质量特征对应启用语音质量增强项步骤,包括:
获取通信传输通道,在通信传输通道中设定音量、音色与音调维护器;
获取语音质量等级,根据语音质量等级对应启用语音质量增强项对专属通道中的语音信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310708183.1A CN116453540B (zh) | 2023-06-15 | 2023-06-15 | 水下蛙人语音通信质量增强处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310708183.1A CN116453540B (zh) | 2023-06-15 | 2023-06-15 | 水下蛙人语音通信质量增强处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116453540A CN116453540A (zh) | 2023-07-18 |
CN116453540B true CN116453540B (zh) | 2023-08-29 |
Family
ID=87130614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310708183.1A Active CN116453540B (zh) | 2023-06-15 | 2023-06-15 | 水下蛙人语音通信质量增强处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116453540B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102034480A (zh) * | 2010-12-16 | 2011-04-27 | 厦门大学 | 一种水下数字语音的通信方法 |
CN106409283A (zh) * | 2016-08-31 | 2017-02-15 | 上海交通大学 | 基于音频的人机混合交互系统及方法 |
CN110083110A (zh) * | 2019-01-23 | 2019-08-02 | 艾肯特公司 | 基于自然智能的端到端控制方法和控制系统 |
CN111028825A (zh) * | 2020-01-09 | 2020-04-17 | 哈尔滨工程大学 | 基于离线语音识别与合成的水声数字语音通信装置及方法 |
US11128636B1 (en) * | 2020-05-13 | 2021-09-21 | Science House LLC | Systems, methods, and apparatus for enhanced headsets |
-
2023
- 2023-06-15 CN CN202310708183.1A patent/CN116453540B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102034480A (zh) * | 2010-12-16 | 2011-04-27 | 厦门大学 | 一种水下数字语音的通信方法 |
CN106409283A (zh) * | 2016-08-31 | 2017-02-15 | 上海交通大学 | 基于音频的人机混合交互系统及方法 |
CN110083110A (zh) * | 2019-01-23 | 2019-08-02 | 艾肯特公司 | 基于自然智能的端到端控制方法和控制系统 |
CN111028825A (zh) * | 2020-01-09 | 2020-04-17 | 哈尔滨工程大学 | 基于离线语音识别与合成的水声数字语音通信装置及方法 |
US11128636B1 (en) * | 2020-05-13 | 2021-09-21 | Science House LLC | Systems, methods, and apparatus for enhanced headsets |
Non-Patent Citations (1)
Title |
---|
水声通信中低码速率语音编码算法的研究;肖东等;声学学报;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116453540A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101843119B (zh) | 助听器 | |
DE69527939T2 (de) | Schaltung zur Signalunterscheidung | |
CN106161209B (zh) | 一种基于深度自学习的垃圾短信过滤方法及系统 | |
US6564181B2 (en) | Method and system for measurement of speech distortion from samples of telephonic voice signals | |
SE469007B (sv) | Anordning vid mobila telesystem foer att moejliggoera jaemfoerelser av subjektiv samtalskvalite | |
CN104410973B (zh) | 一种播放录音的诈骗电话识别方法和系统 | |
CN112818316B (zh) | 基于声纹的身份识别及应用方法、装置与设备 | |
CN114338623B (zh) | 音频的处理方法、装置、设备及介质 | |
CN112738338B (zh) | 基于深度学习的电话识别方法、装置、设备及介质 | |
CN116453540B (zh) | 水下蛙人语音通信质量增强处理方法 | |
CN105529037A (zh) | 通信设备语音质量评价测试系统及测试方法 | |
CN109902712A (zh) | 基于无人机巡检的输电线路驱鸟方法 | |
DE60132196T2 (de) | Testsignalisierung | |
CN114444096B (zh) | 一种基于数据分析的网络数据储存加密检测系统 | |
CN116597856B (zh) | 基于蛙人对讲的语音质量增强方法 | |
CN103405234B (zh) | 基于主频模拟调整技术的听觉障碍多维测量系统及其方法 | |
CN111161759B (zh) | 音频质量评价方法、装置、电子设备及计算机存储介质 | |
CN116156439B (zh) | 智能穿戴电子对讲交互系统 | |
Heute et al. | Integral and diagnostic speech-quality measurement: State of the art, problems, and new approaches | |
Lahaie et al. | Influence of audio bandwidth on speech emotion recognition by human subjects | |
Daumer et al. | Subjective quality of several 9.6-32 Kb/s speech coders | |
BRACHMAŃSKI | Automation of subjective measurements of speech intelligibility in analogue telecommunication channels | |
JP2019175382A (ja) | 情報処理装置 | |
CN116206620B (zh) | 训练场景的语音通信干扰效果评估方法及其装置 | |
CN117411969B (zh) | 一种非标语料的用户感知评测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |