CN117915229A

CN117915229A - 基于无线通信的多场景麦克风音频数据监管系统及方法

Info

Publication number: CN117915229A
Application number: CN202410071738.0A
Authority: CN
Inventors: 吴伟彦
Original assignee: Enping Aimeisi Technology Co ltd
Current assignee: Enping Aimeisi Technology Co ltd
Priority date: 2024-01-18
Filing date: 2024-01-18
Publication date: 2024-04-19

Abstract

本发明公开了基于无线通信的多场景麦克风音频数据监管系统及方法，属于音频处理技术领域。系统包括数据采集模块、设备调试模块、音频优化模块和信号转换模块；数据采集模块用于采集音频特征日志和感应模组信息，根据感应模组采集麦克风周边的实体距离和音频；设备调试模块通过麦克风周边的实体距离来判断环境，识别音频是否包含语音信号，分析包含语音信号的音频信噪比来找到接入模组；音频优化模块用于提高接入模组所采集音频的信噪比，并与音频特征日志中的每条特征记录分别进行相似度计算，根据计算结果调整不同接入模组采集音频的音量；信号转换模块将处理完成后的音频信息自动转换为无线电频率信号，通过无线电波的传播方式进行传输。

Description

基于无线通信的多场景麦克风音频数据监管系统及方法

技术领域

本发明涉及音频处理技术领域，具体为基于无线通信的多场景麦克风音频数据监管系统及方法。

背景技术

随着通讯技术的发展和普及，人们对语音识别、语音通话等技术的需求也越来越高，而这些技术都需要高质量的声音输入。因此，研究如何改善麦克风各种场合的录音效果，对于提高通讯技术的性能和用户体验具有重要意义。

现阶段，人们在各类场合中都会用到麦克风，麦克风最主要的目的是采集人的声音而并非环境的噪音。故现有技术通常使用固定指向麦克风来实现降噪优化，尽量避免录入其他方向的噪音。这种方法存在一定弊端，例如：1、固定指向麦克风在使用前需要手动校准，使声源正对麦克风内的振膜，但仍然会由于校准方向不对或者声源的频繁移动导致降噪效果不佳。2、固定指向麦克风无法根据实际情况满足不同方向多人声的录制，不能根据多场景灵活切换不同指向性不够智能化。3、麦克风在使用过程中对距离要求高，距离近的采集声音过大容易惊吓到他人，而距离远的采集声音过小让人听不清，不能对音量进行智能调整。所以，现阶段需要一种更加高效、智能化的麦克风音频数据监管技术方案来解决上述问题。

发明内容

本发明的目的在于提供基于无线通信的多场景麦克风音频数据监管系统及方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：基于无线通信的多场景麦克风音频数据监管方法，该方法包括以下步骤：

S100、采集麦克风的音频特征日志和感应模组信息，通过安装在麦克风内部各个方向的感应模组采集麦克风周边的实体距离和音频。

S200、通过麦克风周边的实体距离判断当前所处环境，识别音频是否包含语音信号，根据包含语音信号的音频信噪比来找到接入模组，获取接入模组所采集的音频。

S300、提高每个接入模组采集音频的信噪比，并与音频特征日志中的每条特征记录分别进行相似度计算，根据计算结果调整不同接入模组采集音频的音量。

S400、记录接入模组采集音频的特征信息，并将处理完成后的音频信息自动转换为无线电频率信号，通过无线电波的传播方式进行传输。

在S100中，音频特征日志是指麦克风开启后的本次使用时长以及每次采集音频的特征记录，每条特征记录包括音频特征和传声时长，传声时长是指该音频特征对应实体使用麦克风的时长。感应模组是指由距离传感器和振膜组合而成的功能组件，感应模组信息包括标识符和位置坐标，位置坐标是指感应模组安装在麦克风内部的具体位置。实体距离是指麦克风周边实体与麦克风之间的距离，音频是指麦克风周边来自各个方向实体的声音，通过麦克风内部各方向上均匀分布的感应模组采集，每个感应模组朝向不同方向。

感应模组的分布位置根据麦克风的形状来决定，麦克风为圆柱形时，感应模组均匀分布在圆柱形内部各个方向；麦克风为球形时，感应模组均匀分布在球形内部各个方向。

在S200中，具体步骤如下：

S201、获取麦克风内部所有感应模组采集的实体距离，判断是否都大于或等于距离阈值，结果为是则不做处理，结果为否则标记实体距离小于距离阈值的感应模组。分析每个标记感应模组与其他标记感应模组的位置坐标是否存在相邻关系，对这些标记感应模组进行分类，将存在相邻关系的标记感应模组划分为同类。

距离阈值由工作人员事先设定，具体取值参考使用麦克风讲话时人与麦克风之间的距离以及所采用距离感应器的检测精度。取值需要符合实际情况，过大容易造成误识别，过小则可能无法感应到使用者。

感应模组均匀分布在麦克风内部，各感应模组之间呈现二维分布，位置坐标也同样使用(x,y)依次表示，通过位置坐标x或y参数是否连续即可判断感应模组之间是否存在相邻关系。相邻关系是指两个位置连续的标记感应模组之间的关系，它们之间不存在其他感应模组。

S202、所有标记感应模组都完成分类后，按照划分类的数量为每类标记感应模组分别建立一个实体集合，将标记感应模组的标识符放入对应实体集合中。获取各标记感应模组采集的音频，采用VAD语音检测技术判断音频中是否包含语音信号，结果为是则不做处理，结果为否则将对应标记感应模组的标识符从对应实体集合中删除，并删除无任何标识符的实体集合。

先去除不发声的实体，再筛选出包含语音的实体，筛选完成后的每个实体集合代表一个声源。

S203、分析实体集合中各标识符所对应标记感应模组采集的音频，再次使用VAD语音检测技术将音频中语音信号与背景噪声信号区分开，并计算音频的信噪比，每个实体集合选择信噪比最高的音频所对应的标记感应模组作为接入模组，建立一个声源集合，将所有接入模组的标识符都放入声源集合中。

不同感应模组由于方向不同，即使是接收到同一个声源传播过来的音频也会存在不同信噪比。选择信噪比最高的音频所对应的感应模组作为接入模组，不仅可以减轻后续音频优化的计算压力，同时也是选择了离声源近且方向合适的感应模组。

在S300中，具体步骤如下：

S301、获取声源集合中每个标识符对应接入模组采集的音频，使用谱减法技术对音频的频谱进行分析，将噪声频谱从中减去来提高每个接入模组采集音频的信噪比。

S302、设定一个最佳录制距离d_sta，提取每个接入模组采集的音频特征信息，将特征信息与音频特征日志中每条特征记录分别进行相似度计算，判断是否存在与接入模组的音频特征信息相似度大于或等于相似度阈值的特征记录，不存在则将对应接入模组作为次要使用模组并进入S303步骤，存在则将对应接入模组作为主要使用模组并进入S304步骤。

相似度阈值由工作人员事先设定，取值参考不同人员的音频特征之间的最大相似度，根据相似度阈值能够区分不同人员的音频特征。

S303、获取次要使用模组采集的实体距离和音频音量值，代入公式中计算次要使用模组调整后的音量值，公式如下：

YL_c＝YLS_base+(α×YLS_base)×(d-d_sta)

式中，YL_c为次要使用模组调整后的音量值，YLS_base为音频音量值，α为常数，d为实体距离。

S304、将相似度大于相似度阈值特征记录的传声时长作为对应主要使用模组的传声时长，并获取主要使用模组采集的实体距离和音频音量值，以及音频特征日志中保存的本次使用时长，代入公式中计算主要使用模组调整后的音量值，公式如下：

式中，YL_z为主要使用模组调整后的音量值，T_sum为本次使用时长，tc为传声时长。

根据实体距离与最佳录制距离差距实现音量调整，避免距离远实体的音量过小距离近的实体音量过大情况发生。同时在此基础上，采用传声时长作为影响参数能够提高麦克风主要使用者和次要使用者之间的音量差异化，使得音量调试更加智能化。

在S400中，当接入模组采集的音频特征信息与音频特征日志中任意一条特征记录的相似度都小于相似度阈值时，将该音频特征信息作为新的特征记录进行保存并实时更新传声时长；处理完成后的音频信息自动转换为无线电频率信号，通过无线电波的传播方式进行传输。

基于无线通信的多场景麦克风音频数据监管系统，该系统包括数据采集模块、设备调试模块、音频优化模块和信号转换模块。

数据采集模块用于采集音频特征日志和感应模组信息，根据感应模组采集麦克风周边的实体距离和音频。设备调试模块通过麦克风周边的实体距离判断环境，识别音频是否包含语音信号，分析包含语音信号的音频信噪比找到接入模组。音频优化模块用于提高接入模组所采集音频的信噪比，并与音频特征日志中的每条特征记录分别进行相似度计算，根据计算结果调整不同接入模组采集音频的音量。信号转换模块将处理完成后的音频信息自动转换为无线电频率信号，通过无线电波的传播方式进行传输。

数据采集模块包括感应信息采集单元、模组信息采集单元和特征日志采集单元。

感应信息采集单元通过麦克风内部各方向上均匀分布的感应模组实时采集麦克风周边的实体距离和音频。实体距离是指麦克风周边实体与麦克风之间的距离，音频是指麦克风周边来自各个方向实体的声音。

模组信息采集单元用于采集每个感应模组的标识符和位置坐标。感应模组是指由距离传感器和振膜组合而成的功能组件，标识符用于区分不同感应模组，位置坐标是指感应模组安装在麦克风内部的具体位置。

特征日志采集单元用于采集麦克风开启后的本次使用时长以及每次采集音频的特征记录，每条特征记录包括音频特征和传声时长，传声时长是指该音频特征对应实体使用麦克风的时长，本次使用时长实时更新。

设备调试模块包括音频分析单元和模组选择单元。

音频分析单元用于分析麦克风当前所处环境以及音频是否包含语音信号。首先，判断所有感应模组采集的实体距离是否都大于或等于距离阈值，结果为是则表示周边无人不做处理，结果为否则标记实体距离小于距离阈值的感应模组。其次，分析每个标记感应模组与其他标记感应模组的位置坐标是否存在相邻关系，将存在相邻关系的标记感应模组的标识符放入同一个实体集合中。最后，采用VAD语音检测技术分别判断每个标记感应模组采集的音频是否包含语音信号，将不包含语言信号音频对应标记感应模组的标识符从对应实体集合中删除。

模组选择单元用于选择接入模组。使用VAD语音检测技术分析实体集合中每个标识符所对应标记感应模组采集的音频，将音频中语音信号与背景噪声信号区分开并计算信噪比，选择每个实体集合中信噪比最高的音频所对应的标记感应模组作为接入模组，建立一个声源集合，将所有接入模组的标识符都放入声源集合中。

音频优化模块包括音质优化单元和音量调整单元。

音质优化单元用于优化每个接入模组采集音频的音质，使用谱减法技术对音频的频谱进行分析，将噪声频谱从中减去来提高每个接入模组采集音频的信噪比。

音量调整单元用于调整不同接入模组采集音频的输出音量。

首先，设定一个最佳录制距离d_sta，获取各接入模组采集的实体距离d和音频音量值YLS_base，并提取每个接入模组采集的音频特征信息，将每条特征信息分别与音频特征日志中所有特征记录进行相似度计算。其次，判断是否存在与接入模组的音频特征信息相似度大于或等于相似度阈值的特征记录，不存在则将对应接入模组作为次要使用模组，存在则将对应接入模组作为主要使用模组。最后，将次要使用模组采集的实体距离和音频音量值代入公式：YLS_base+(α×YLS_base)×(d-d_sta)中，计算次要使用模组调整后的音量值，其中α为常数；将相似度大于相似度阈值特征记录的传声时长作为对应主要使用模组的传声时长tc，并获取主要使用模组采集的实体距离和音频音量值，以及音频特征日志中保存的本次使用时长T_sum，代入公式：中，计算主要使用模组调整后的音量值。

信号转换模块先将相似度小于相似度阈值的音频特征信息作为新的特征记录保存并实时更新传声时长。再将处理完成后的音频信息转换为无线电频率信号，通过无线电波的传播方式进行传输。

相似度大于或等于相似度阈值的音频特征信息不作为新的特征记录保存，只是实时更新对应特征记录的传声时长。

与现有技术相比，本发明所达到的有益效果是：

1、精准性采集：本申请通过麦克风内部各感应模组采集数据分析判断实体数量，分析音频是否包含语音信号来判断实体是否为人，根据包含语音信号音频的信噪比高低来选择接入模组，每个接入模组位置代表各声源最佳音频采集位置，在硬件上精准把控了音频质量，相比于传统固定指向型麦克风声源采集位置更具精准性。

2、智能化调试：本申请通过谱减法技术对接入模组的音频进行优化提高信噪比，针对传统麦克风音量近高远低差距大的弊端提出了新的改进方法，根据不同的实体距离进行音量的调试，且在此基础上将传声时长作为影响参数，针对麦克风的主要使用者和次要使用者采用音量的差异性进行体现，相比于传统技术的音量调节更加智能化。

综上所述，本发明相比于传统技术具有精准性采集和智能化调试的优势，能够提高麦克风录制效率和精准性。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明基于无线通信的多场景麦克风音频数据监管方法的流程示意图；

图2是本发明基于无线通信的多场景麦克风音频数据监管系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供基于无线通信的多场景麦克风音频数据监管方法，该方法包括以下步骤：

在S200中，具体步骤如下：

在S300中，具体步骤如下：

YL_c＝YLS_base+(α×YLS_base)×(d-d_sta)

请参阅图2，本发明提供基于无线通信的多场景麦克风音频数据监管系统，该系统包括数据采集模块、设备调试模块、音频优化模块和信号转换模块。

设备调试模块包括音频分析单元和模组选择单元。

音频优化模块包括音质优化单元和音量调整单元。

音量调整单元用于调整不同接入模组采集音频的输出音量。

实施例一：

假设麦克风存在A和B一共两个接入模组，音频特征日志不存在与A或B接入模组采集的音频特征信息相似度大于或等于相似度阈值的特征记录；A或B接入模组采集的实体距离分别为10cm和20cm，它们采集的音频音量值分别为60dB和40dB，常数为0.02，最佳录制距离为15cm，带入公式分别计算A和B调整后的音量值：

A调整后的音量值：60+(0.02×60)×(10-15)＝56dB；

B调整后的音量值：40+(0.02×40)×(20-15)＝44dB。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于无线通信的多场景麦克风音频数据监管方法，其特征在于：该方法包括以下步骤：

S100、采集麦克风的音频特征日志和感应模组信息，通过安装在麦克风内部各个方向的感应模组采集麦克风周边的实体距离和音频；

S200、通过麦克风周边的实体距离判断当前所处环境，识别音频是否包含语音信号，根据包含语音信号的音频信噪比来找到接入模组，获取接入模组所采集的音频；

S300、提高每个接入模组采集音频的信噪比，并与音频特征日志中的每条特征记录分别进行相似度计算，根据计算结果调整不同接入模组采集音频的音量；

2.根据权利要求1所述的基于无线通信的多场景麦克风音频数据监管方法，其特征在于：在S100中，音频特征日志是指麦克风开启后的本次使用时长以及每次采集音频的特征记录，每条特征记录包括音频特征和传声时长，传声时长是指该音频特征对应实体使用麦克风的时长；感应模组是指由距离传感器和振膜组合而成的功能组件，感应模组信息包括标识符和位置坐标，位置坐标是指感应模组安装在麦克风内部的具体位置；实体距离是指麦克风周边实体与麦克风之间的距离，音频是指麦克风周边来自各个方向实体的声音，通过麦克风内部各方向上均匀分布的感应模组采集，每个感应模组朝向不同方向。

3.根据权利要求2所述的基于无线通信的多场景麦克风音频数据监管方法，其特征在于：在S200中，具体步骤如下：

S201、获取麦克风内部所有感应模组采集的实体距离，判断是否都大于或等于距离阈值，结果为是则不做处理，结果为否则标记实体距离小于距离阈值的感应模组；分析每个标记感应模组与其他标记感应模组的位置坐标是否存在相邻关系，对这些标记感应模组进行分类，将存在相邻关系的标记感应模组划分为同类；

S202、所有标记感应模组都完成分类后，按照划分类的数量为每类标记感应模组分别建立一个实体集合，将标记感应模组的标识符放入对应实体集合中；获取各标记感应模组采集的音频，采用VAD语音检测技术判断音频中是否包含语音信号，结果为是则不做处理，结果为否则将对应标记感应模组的标识符从对应实体集合中删除，并删除无任何标识符的实体集合；

4.根据权利要求3所述的基于无线通信的多场景麦克风音频数据监管方法，其特征在于：在S300中，具体步骤如下：

S301、获取声源集合中每个标识符对应接入模组采集的音频，使用谱减法技术对音频的频谱进行分析，将噪声频谱从中减去来提高每个接入模组采集音频的信噪比；

S302、设定一个最佳录制距离d_sta，提取每个接入模组采集的音频特征信息，将特征信息与音频特征日志中每条特征记录分别进行相似度计算，判断是否存在与接入模组的音频特征信息相似度大于或等于相似度阈值的特征记录，不存在则将对应接入模组作为次要使用模组并进入S303步骤，存在则将对应接入模组作为主要使用模组并进入S304步骤；

YL_c＝YLS_base+(α×YLS_base)×(d-d_sta)

式中，YL_c为次要使用模组调整后的音量值，YLS_base为音频音量值，α为常数，d为实体距离；

5.根据权利要求4所述的基于无线通信的多场景麦克风音频数据监管方法，其特征在于：在S400中，当接入模组采集的音频特征信息与音频特征日志中任意一条特征记录的相似度都小于相似度阈值时，将该音频特征信息作为新的特征记录进行保存并实时更新传声时长；处理完成后的音频信息自动转换为无线电频率信号，通过无线电波的传播方式进行传输。

6.基于无线通信的多场景麦克风音频数据监管系统，其特征在于：该系统包括数据采集模块、设备调试模块、音频优化模块和信号转换模块；

数据采集模块用于采集音频特征日志和感应模组信息，根据感应模组采集麦克风周边的实体距离和音频；设备调试模块通过麦克风周边的实体距离判断环境，识别音频是否包含语音信号，分析包含语音信号的音频信噪比找到接入模组；音频优化模块用于提高接入模组所采集音频的信噪比，并与音频特征日志中的每条特征记录分别进行相似度计算，根据计算结果调整不同接入模组采集音频的音量；信号转换模块将处理完成后的音频信息自动转换为无线电频率信号，通过无线电波的传播方式进行传输。

7.根据权利要求6所述的基于无线通信的多场景麦克风音频数据监管系统，其特征在于：数据采集模块包括感应信息采集单元、模组信息采集单元和特征日志采集单元；

感应信息采集单元通过麦克风内部各方向上均匀分布的感应模组实时采集麦克风周边的实体距离和音频；实体距离是指麦克风周边实体与麦克风之间的距离，音频是指麦克风周边来自各个方向实体的声音；

模组信息采集单元用于采集每个感应模组的标识符和位置坐标；感应模组是指由距离传感器和振膜组合而成的功能组件，标识符用于区分不同感应模组，位置坐标是指感应模组安装在麦克风内部的具体位置；

8.根据权利要求7所述的基于无线通信的多场景麦克风音频数据监管系统，其特征在于：设备调试模块包括音频分析单元和模组选择单元；

音频分析单元用于分析麦克风当前所处环境以及音频是否包含语音信号；首先，判断所有感应模组采集的实体距离是否都大于或等于距离阈值，结果为是则表示周边无人不做处理，结果为否则标记实体距离小于距离阈值的感应模组；其次，分析每个标记感应模组与其他标记感应模组的位置坐标是否存在相邻关系，将存在相邻关系的标记感应模组的标识符放入同一个实体集合中；最后，采用VAD语音检测技术分别判断每个标记感应模组采集的音频是否包含语音信号，将不包含语言信号音频对应标记感应模组的标识符从对应实体集合中删除；

模组选择单元用于选择接入模组；使用VAD语音检测技术分析实体集合中每个标识符所对应标记感应模组采集的音频，将音频中语音信号与背景噪声信号区分开并计算信噪比，选择每个实体集合中信噪比最高的音频所对应的标记感应模组作为接入模组，建立一个声源集合，将所有接入模组的标识符都放入声源集合中。

9.根据权利要求8所述的基于无线通信的多场景麦克风音频数据监管系统，其特征在于：音频优化模块包括音质优化单元和音量调整单元；

音质优化单元用于优化每个接入模组采集音频的音质，使用谱减法技术对音频的频谱进行分析，将噪声频谱从中减去来提高每个接入模组采集音频的信噪比；

音量调整单元用于调整不同接入模组采集音频的输出音量；

首先，设定一个最佳录制距离d_sta，获取各接入模组采集的实体距离d和音频音量值YLS_base，并提取每个接入模组采集的音频特征信息，将每条特征信息分别与音频特征日志中所有特征记录进行相似度计算；其次，判断是否存在与接入模组的音频特征信息相似度大于或等于相似度阈值的特征记录，不存在则将对应接入模组作为次要使用模组，存在则将对应接入模组作为主要使用模组；最后，将次要使用模组采集的实体距离和音频音量值代入公式：YLS_base+(α×YLS_base)×(d-d_sta)中，计算次要使用模组调整后的音量值，其中α为常数；将相似度大于相似度阈值特征记录的传声时长作为对应主要使用模组的传声时长tc，并获取主要使用模组采集的实体距离和音频音量值，以及音频特征日志中保存的本次使用时长T_sum，代入公式：中，计算主要使用模组调整后的音量值。

10.根据权利要求9所述的基于无线通信的多场景麦克风音频数据监管系统，其特征在于：信号转换模块先将相似度小于相似度阈值的音频特征信息作为新的特征记录保存并实时更新传声时长；再将处理完成后的音频信息转换为无线电频率信号，通过无线电波的传播方式进行传输。