CN116453540B

CN116453540B - 水下蛙人语音通信质量增强处理方法

Info

Publication number: CN116453540B
Application number: CN202310708183.1A
Authority: CN
Inventors: 王涛; 王世豪
Original assignee: Shandong Benin Electronic Technology Development Co ltd
Current assignee: Shandong Benin Electronic Technology Development Co ltd
Priority date: 2023-06-15
Filing date: 2023-06-15
Publication date: 2023-08-29
Anticipated expiration: 2043-06-15
Also published as: CN116453540A

Abstract

本发明公开了水下蛙人语音通信质量增强处理方法，涉及语音通信技术领域，基于AI语音训练模型获取语音通信包，其中，所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征，建立语音通信包身份信息，根据语音通信包身份信息端设立语音采集端；所述语音通信包引入语音识别中，构建AI语音识别处理模型，获取语音采集端的语音，得到语音信息；搭建所述语音通信包的通信传输通道，通过所述通信传输通道互联所述语音采集端，获取所述通信传输通道，确定通信的所述语音采集端。本发明能够通过音色特征、咬字特征与音调特征判断目标人员的身份，在保证传输不存在杂音的同时，也做到真实的语音交流。

Description

水下蛙人语音通信质量增强处理方法

技术领域

本发明涉及语音通信技术领域，具体涉及水下蛙人语音通信质量增强处理方法。

背景技术

为了对水下进行探索和工作，人员需要佩戴上专业的潜水设备进行下水，通常下水工作和探索的人员为多人行动，被称为水下蛙人，在工作的过程中需要人员之间进行工作配合，由于潜水设备的覆盖，直接交流存在困难，因此，语音通信被投入到水下蛙人工作领域中进行使用；而现有的语音通信在水中工作时，难以全面的过滤掉水流的声音杂质，且在水中进行传输的过程中由于传输信号的问题也会影响到语音质量，因此知道接听者难以听到清晰的语音，导致交流存在一定的障碍，影响水下蛙人在水中的作业。

发明内容

本发明的目的是提供水下蛙人语音通信质量增强处理方法，以解决背景技术中不足。

为了实现上述目的，本发明提供如下技术方案：水下蛙人语音通信质量增强处理方法，基于AI语音训练模型获取语音通信包，其中，所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征，建立语音通信包身份信息，根据语音通信包身份信息端设立语音采集端；

所述语音通信包引入语音识别中，构建AI语音识别处理模型，获取语音采集端的语音，得到语音信息；

搭建所述语音通信包的通信传输通道，通过所述通信传输通道互联所述语音采集端；

获取所述通信传输通道，确定通信的所述语音采集端，锁定确定通信的所述语音采集端之间的通信传输通道，得到专属通道；

获取所述语音信息，并将所述语音信息通过专属通道传输，得到传输语音；

监测所述传输语音，评估传输语音质量，得到语音质量等级；

制定语音质量增强项，根据语音质量特征对应启用语音质量增强项。

在一个优选的实施方式中，所述基于AI语音训练模型获取语音通信包的步骤，包括：

制定情绪文字，其中，情绪文字包括有多组不同情绪的文字句；

目标人员通过带有不同的情绪阅读所述文字句，得到多组目标人员声音信息；

将所述多组目标人员声音信息逐一投入到AI语音训练模型中进行深度学习训练，得到语音通信包。

在一个优选的实施方式中，所述建立语音通信包身份信息的步骤，包括：

获取目标人员的身份信息，绑定所述语音通信包与目标人员的身份信息，得到语音通信包身份信息；

将储存的多组目标人员声音信息绑定到语音通信包身份信息中。

在一个优选的实施方式中，所述语音通信包引入语音识别中，构建AI语音识别处理模型，获取语音采集端的语音，得到语音信息的步骤，包括：

获取语音通信包，提取语音通信包中的语音特征；

构建语音识别通道，其中，语音识别通道用于语音转化文字，将语音特征引入语音识别通道中，获得语音数据；

基于文字识别转化机械语音并与语音特征整合，构建AI语音识别处理模型；

根据语音采集端获取目标人员语音，通过AI语音识别处理模型得到语音信息。

在一个优选的实施方式中，所述搭建所述语音通信包的通信传输通道，通过所述通信传输通道互联所述语音采集端的步骤，包括：

构建信号网，在信号网中设立通信平台；

获取多个所述语音采集端与通信平台之间双向通信互联；

在通信平台中根据语音采集端的数量两两之间设定通信通道，得到通信传输通道；

通过所述通信传输通道互联所述语音采集端。

在一个优选的实施方式中，所述构建信号网的步骤，包括：

获取目标人员数量，对应目标人员携带信号产生设备；

根据信号产生设备的信号铺设距离，监测信号产生设备之间的距离，得到距离值；

若距离值超出信号铺设距离双倍距离时，立即报警；通过监测信号产生设备之间的信号铺设，得到信号网。

在一个优选的实施方式中，所述锁定确定通信的所述语音采集端之间的通信传输通道，得到专属通道的步骤，包括：

选择确定通信的语音采集端，对应所述确定通信的语音采集端之间的确定通信通道；

在通信平台中选择并锁定确定通信通道，其中一个所述确定通信的语音采集端的语音信息通过锁定的通信通道传输至其他所述确定通信的语音采集端，得到专属通道。

在一个优选的实施方式中，所述监测所述传输语音，评估传输语音质量，得到语音质量等级的步骤，包括：

获取所述专属通道中的传输语音，分析所述专属通道中的传输语音特征，对比专属通道中的传输语音特征与语音信息中的语音特征，得到第一特征；

建立语音质量评估项，其中，语音质量评估项包括有音量、音色、音调，语音质量等级分别为优等、中等与差等；

将所述第一特征对应到语音质量评估项中，得到评估指数；

根据语音质量等级设定管理阈值，管理阈值分别为优等阈值、中等阈值与差等阈值。

在一个优选的实施方式中，所述制定语音质量增强项，根据语音质量特征对应启用语音质量增强项的步骤，包括：

获取通信传输通道，在通信传输通道中设定音量、音色与音调维护器；

获取语音质量等级，根据语音质量等级对应启用语音质量增强项对专属通道中的语音信息。

在上述技术方案中，本发明提供的技术效果和优点：

1、本发明通过通过语音采集，获取到目标人员的语音信息，得到准确的语音信息，进而通过AI语音训练模型生成获取到的目标人员的语音信息，进而AI语音训练模型生成获取到的目标人员的语音信息进行传输，由语音信息接受的目标人员所听到，听到的为虚拟语音，能够通过音色特征、咬字特征与音调特征判断目标人员的身份，在保证传输不存在杂音的同时，也做到真实的语音交流；

2、本发明在语音质量等级分别为中等时，选择差异度最大的语音特征进行维护增强，提高语音通讯质量，在语音质量等级分别为差等时，选择所有的语音特征进行维护增强，提高语音通讯质量。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1，请参阅图1所示，本实施例所述水下蛙人语音通信质量增强处理方法，包括以下的步骤；

S1、基于AI语音训练模型获取语音通信包，其中，所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征，建立语音通信包身份信息，根据语音通信包身份信息端设立语音采集端；

在一个实施例中，所述基于AI语音训练模型获取语音通信包的步骤，包括：

S11、制定情绪文字，其中，情绪文字包括有多组不同情绪的文字句；

S12、目标人员通过带有不同的情绪阅读所述文字句，得到多组目标人员声音信息；

S13、将所述多组目标人员声音信息逐一投入到AI语音训练模型中进行深度学习训练，得到语音通信包；

如上述的步骤S11-S13所述，通过采集音色特征、咬字特征与音调特征，将多组目标人员声音信息进行数据储存，能够获取目标人员的语音通信包，通过语音通信包，通过情绪文字能够分辨目标人员的语言特征，通过多组目标人员声音信息，能够得到准确的目标人员的语言特征，可使语音通信包信息更加的接近目标人员的语言；

目前设备多数还是采用语音的直接采集，并通过噪声过滤提供对语音采集的准确度和清洗度，提高语音通信质量，本申请通过语音采集，获取到目标人员的语音信息，得到准确的语音信息，进而通过AI语音训练模型生成获取到的目标人员的语音信息，进而AI语音训练模型生成获取到的目标人员的语音信息进行传输，由语音信息接受的目标人员所听到，听到的为虚拟语音，能够通过音色特征、咬字特征与音调特征判断目标人员的身份，在保证传输不存在杂音的同时，也做到真实的语音交流，每听到目标人员在使用过程中声音，将一个字作为识别点，一个字一个字的进行AI模拟，实时对一个字组成的语句进行顺次识别模拟并传输出去，能够保证传输信号的实时性；

在一个实施例中，所述建立语音通信包身份信息的步骤，包括：

S14、获取目标人员的身份信息，绑定所述语音通信包与目标人员的身份信息，得到语音通信包身份信息；

其中，目标人员的身份信息包括有姓名、年龄、联系方式以及工作职位，将储存的多组目标人员声音信息绑定到语音通信包身份信息中；

S2、所述语音通信包引入语音识别中，构建AI语音识别处理模型，获取语音采集端的语音，得到语音信息；

在一个实施例中，所述语音通信包引入语音识别中，构建AI语音识别处理模型，获取语音采集端的语音，得到语音信息的步骤，包括：

S21、获取语音通信包，提取语音通信包中的语音特征；

S22、构建语音识别通道，其中，语音识别通道用于语音转化文字，将语音特征引入语音识别通道中，获得语音数据；

S23、基于文字识别转化机械语音并与语音特征整合，构建AI语音识别处理模型；

S24、根据语音采集端获取目标人员语音，通过AI语音识别处理模型得到语音信息；

如上述的步骤S21-S24所述，语音特征与语音识别通道作为独立的信息，语音识别分为语音进口和语音出口，语音进口与语音采集识别语音转化为文字信息，之后将文字信息转化为无情绪的机械音，将语音特征作为因素附加在机械音中，通过AI语音识别处理模型的整合由语音出口输出，且AI语音识别处理模型与语音特征均位于语音识别通道的中，在实际中的使用为，在目标人员发声说话时例如说“你好”，实时通过语音识别通道的语音进口将语音以电信号形式转化为文字“你好”，并将文字转化为以电信号的形式得到无情绪的机械音“你好”，之后将目标人员的语音特征附加在无情绪的机械音中，通过AI语音识别处理模型整合得到有情绪起伏的“你好”，最后通过语音识别通道的语音出口输出，得到语音数据；

S3、搭建所述语音通信包的通信传输通道，通过所述通信传输通道互联所述语音采集端；

在一个实施例中，所述搭建所述语音通信包的通信传输通道，通过所述通信传输通道互联所述语音采集端的步骤，包括：

S31、构建信号网，在信号网中设立通信平台；

S32、获取多个所述语音采集端与通信平台之间双向通信互联；

S33、在通信平台中根据语音采集端的数量两两之间设定通信通道，得到通信传输通道；

S34、通过所述通信传输通道互联所述语音采集端；

构建信号网的步骤，包括：

S35、获取目标人员数量，对应目标人员携带信号产生设备；

S36、根据信号产生设备的信号铺设距离，监测信号产生设备之间的距离，得到距离值；

S37、若距离值超出信号铺设距离双倍距离时，立即报警；通过监测信号产生设备之间的信号铺设，得到信号网；

如上述的步骤S31-S37所述，水下蛙人在下水作业前，需要随身佩戴一个信号产生设备，多个信号产生设备共同在水中搭建一个信号网，在信号的中，目标人员的通信设备能够通过信号网进行通信连接，该操作不仅仅能够用于语音的通信传输，也能够用于其他通信设备的通信传输，另外，在水中搭建的信号网与外界存在信号网的接触重叠时，也能够通过信号网使目标人员与外界的人员通信连接，最后，由于在深水中的信号较差，而现有设备中信号产生装置存在覆盖范围，因此目标人员在超出信号产生装置之间的重合以及接触范围后，很可能与其他的目标人员存在断联，同意发生意外，因此，需要对信号产生设备的信号覆盖范围进行监测，在超出信号产生覆盖范围之后，需要进行提醒，目标人员可返回，重新使自身携带的信号产生设备与其他目标人员的信号产生设备再次连接，保证目标人员之间能够时钟处在互联的范围中，保障了人员的安全；

S4、获取所述通信传输通道，确定通信的所述语音采集端，锁定确定通信的所述语音采集端之间的通信传输通道，得到专属通道；

在一个实施例中，所述锁定确定通信的所述语音采集端之间的通信传输通道，得到专属通道的步骤，包括：

S41、选择确定通信的语音采集端，对应所述确定通信的语音采集端之间的确定通信通道；

S42、在通信平台中选择并锁定确定通信通道，其中一个所述确定通信的语音采集端的语音信息通过锁定的通信通道传输至其他所述确定通信的语音采集端，得到专属通道；

如上述的步骤S41与S42所述，在实际使用时，任意语音采集端的目标人员在下水前需要选择确定通信的其他语音采集端，将自己与其他确定通信的语音采集端建立为一个沟通群组，即通过通信平台将确定通信的语音采集端之间的通信通道全部双向打开，在语音采集端产生AI模拟语音，通信通道仅作为AI模拟语音的传输通道，将多个语音采集端之间联合实现互通，得到专属通道，能够不被其他通信通道所影响，能够锁定通信通道，减少对语音传输质量的影响，同时也能够保证有效的沟通；

S5、获取所述语音信息，并将所述语音信息通过专属通道传输，得到传输语音；

S6、监测所述传输语音，评估传输语音质量，得到语音质量等级；

在一个实施例中，所述监测所述传输语音，评估传输语音质量，得到语音质量等级的步骤，包括：

S61、获取所述专属通道中的传输语音，分析所述专属通道中的传输语音特征，对比专属通道中的传输语音特征与语音信息中的语音特征，得到第一特征；

S62、建立语音质量评估项，其中，语音质量评估项包括有音量、音色、音调，语音质量等级分别为优等、中等与差等；

S63、将所述第一特征对应到语音质量评估项中，得到评估指数，其公式为：

其中，为评估指数，/>、/>与/>分别为专属通道中的音量、音色、音调；/>、与/>分别为语音信息中的音量、音色、音调，/>为评价权重系数，需要说明的是，的数值越大，/>的数值越大，即代表传输过程中的语音质量越差；

S64、根据语音质量等级设定管理阈值，管理阈值分别为优等阈值、中等阈值与差等阈值；

将对应到管理阈值中得到语音质量等级；

如上述步骤S61-S64所述，在生成语音信息之后，需要通过专属通道对语音信息进行传输，在传输的过程中会因为信号以及专属通道的不稳定问题影响语音信息的语音特征发生变化，因此，需要对语音特征进行监测，评估在专属通道中语音信息的质量情况，在语音信息为优等时，不需要进行语音质量的维护提高；在语音信息为中等时，对影响语音清晰度的方面进行维护增强，比如在音调方面，在语音信息为差等时，需要在音量、音色、音调上均进行增强；能够对语音质量进行评估，得到语音是否需要进行增强处理的判断，在得到过程中能够了解/>的分别的数值大小，进而能够对应通过语音质量增强项对音量、音色、音调进行维护启用；

S7、制定语音质量增强项，根据语音质量特征对应启用语音质量增强项；

在一个实施例中，所述制定语音质量增强项，根据语音质量特征对应启用语音质量增强项的步骤，包括：

S71、获取通信传输通道，在通信传输通道中设定音量、音色与音调维护器；

S72、获取语音质量等级，根据语音质量等级对应启用语音质量增强项对专属通道中的语音信息；

如上述步骤S71与S72所述，其中，语音质量增强项，通过获取语音信息中的语音特征数据，并根据语音质量特征中的分别的数值大小，进而能够对应通过语音质量增强项对音量、音色、音调进行维护启用，例如，/>等于10分贝，/>等于2，代表专属通道中的音色与语音信息中的音色的差异数值，整体差异数值为10，/>等于专属通道中的音调与语音信息中的音调波动线图的贴合差异度，整体差异数值为10，在语音质量等级分别为中等时，选择差异度最大的语音特征进行维护增强，提高语音通讯质量，在语音质量等级分别为差等时，选择所有的语音特征进行维护增强，提高语音通讯质量；

能够大大提高对通讯语音质量的维护作用，且能够根据等级进行针对性的语音特征的增强，能够保证收听者在水中也能够清晰的听到语音。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.水下蛙人语音通信质量增强处理方法，其特征在于，包括：

基于AI语音训练模型获取语音通信包，其中，所述语音通信包包括音色特征、咬字特征与音调特征作为语音特征，建立语音通信包身份信息，根据语音通信包身份信息端设立语音采集端；

所述语音通信包引入语音识别通道中，构建AI语音识别处理模型，得到语音信息步骤，包括：

获取语音通信包，提取语音通信包中的语音特征；

根据语音采集端获取目标人员语音，通过AI语音识别处理模型得到语音信息；

2.根据权利要求1所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述基于AI语音训练模型获取语音通信包步骤，包括：

3.根据权利要求2所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述建立语音通信包身份信息步骤，包括：

4.根据权利要求1所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述构建所述语音通信包的通信传输通道，通过所述通信传输通道互联所述语音采集端步骤，包括：

构建信号网，在信号网中设立通信平台；

获取多个所述语音采集端与通信平台之间双向通信互联；

通过所述通信传输通道互联所述语音采集端。

5.根据权利要求4所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述构建信号网步骤，包括：

获取目标人员数量，对应目标人员携带信号产生设备；

6.根据权利要求1所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述锁定确定通信的所述语音采集端之间的通信传输通道，得到专属通道步骤，包括：

7.根据权利要求1所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述监测所述传输语音，评估传输语音质量，得到语音质量等级步骤，包括：

将所述第一特征对应到语音质量评估项中，得到评估指数；

8.根据权利要求1所述的水下蛙人语音通信质量增强处理方法，其特征在于：所述制定语音质量增强项，根据语音质量特征对应启用语音质量增强项步骤，包括：