CN115579015A

CN115579015A - 一种大数据的音频数据采集管理系统及方法

Info

Publication number: CN115579015A
Application number: CN202211162087.3A
Authority: CN
Inventors: 吴金伦; 余永贵; 董瑾
Original assignee: Enping Baoxun Intelligent Technology Co ltd
Current assignee: Enping Baoxun Intelligent Technology Co ltd
Priority date: 2022-09-23
Filing date: 2022-09-23
Publication date: 2023-01-06
Anticipated expiration: 2042-09-23
Also published as: CN115579015B

Abstract

本发明公开了一种大数据的音频数据采集管理系统及方法，属于音频数据处理技术领域。本发明包括以下步骤：S10：对多个麦克风中的音频数据进行采集，基于音频数据的采集时间、采集量和音频连续性，对采集的麦克风音频数据进行匹配处理；S20：基于S10中的匹配结果，对音频数据中的回声进行消除处理；S30：对S20中处理后的音频数据进行失真处理；S40：基于S30的处理结果，对音频数据进行混音操作，本发明可实现对麦克分音频数据中的回声进行精准消除，进一步提高了系统的使用效果，以及避免音频数据在经过回声消除处理后，得到的音频数据与原音频数据不符，进一步提高了系统对音频数据的处理精度。

Description

一种大数据的音频数据采集管理系统及方法

技术领域

本发明涉及音频数据处理技术领域，具体为一种大数据的音频数据采集管理系统及方法。

背景技术

音频处理是我们在使用很多大型电子设备时所要经常用到的音频处理装置，它能够帮助我们控制音乐或配乐，使其在不同场景中产生不同的声音效果，增加音乐或配乐的震撼力，同时能够控制现场的很多音频功能。

现有的音频处理系统在对音频数据进行处理时，混音后的音频输出噪音较大，进而降低了系统的使用范围，且在混音过程中，通常采用单一的方法对音频数据进行处理，从而导致处理后的混音质量参差不齐，以及系统在作用时，无法实现对说话麦克风和未说话麦克风的区别处理，导致系统在对麦克风音频进行采集时，采集音频中存在回音音频，降低了系统的使用效果。

发明内容

本发明的目的在于提供一种大数据的音频数据采集管理系统及方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种大数据的音频数据采集管理方法，所述方法包括以下步骤：

S10：对多个麦克风中的音频数据进行采集，基于音频数据的采集时间、采集量和音频连续性，对采集的麦克风音频数据进行匹配处理；

S20：基于S10中的匹配结果，对音频数据中的回声进行消除处理；

S30：对S20中处理后的音频数据进行失真处理；

S40：基于S30的处理结果，对音频数据进行混音操作。

进一步的，所述S10包括：

S101：将采集的麦克风音频与数据库中的音频进行对比，根据对比结果，对音频所属者发出音频时的音频连续性和音频间隔时间进行获取；

S102：基于S101中的获取信息，结合多个麦克风音频数据的采集时间和采集量，对正在使用中的麦克风进行确定，具体的确定方法为：

①.判断多个麦克风的音频数据采集时间是否一致，若采集时间一致，则将采集的音频数据按照麦克风编号进行存储，若采集时间不一致，则将采集时间异与标准采集时间的麦克风音频数据进行剔除，之后，再将剔除处理后的剩余音频数据按照麦克风编号进行存储；

②.根据多个麦克风音频数据的采集量，对上述存储的音频数据进行筛选，若麦克风音频数据的采集量≤α*maxW，则将对应麦克风的音频数据筛选出，若麦克风音频数据的采集量>α*maxW，则将对应麦克风的音频数据进行保留，其中，0≤α≤0.4，W表示单个麦克风的音频数据采集量；

③.基于上述保留的音频数据，构建数学模型对正在使用中的麦克风进行确定，具体的数学模型Q为：

其中，i＝1,2,…,n表示单个麦克风中的音频数据对应的编号，n表示i所能取到的最大值，a_i表示编号为i的音频数据对应的数据值，

表示对音频数据值为零的数量进行计算，α表示获取的音频连续值，j＝1,2,…,m<n表示音频数据值为零时对应的音频数据编号，m表示j所能取到的最大值，T_j表示编号为j的麦克风音频数据对应的停顿时间，t表示获取的音频间隔时间，当Q＝0时，表示该音频数据属于麦克风使用者，当Q≠0时，表示该音频数据不属于麦克风使用者。

进一步的，所述S20包括：

S201：基于S10中确定的麦克风使用情况，对麦克风使用者的音频数据进行获取，将获取的音频数据与数据库中对应使用者的音频数据进行对比，对音频数据中的回声位置进行确定；

S202：利用上述确定的回声位置上的音频数据，结合麦克风与麦克风音箱之间的距离，对各位置上存在的回声比例进行计算，具体的计算公式E为：

其中，u＝1,2,…,q表示上述确定的回声位置对应的编号，q表示u所能取到的最大值，a_u表示音频数据在编号为u的位置对应的数据值，

表示麦克风使用者的音频数据在编号为u的位置对应的数据值，p＝1,2,…,h表示除正在使用中的麦克风外剩余麦克风对应的编号，h表示p所能取到的最大值，(x_p，y_p)表示编号为p的麦克风相对于麦克风音箱的位置坐标，

表示正在使用中的麦克风相对于麦克风音箱的位置坐标，

表示对编号为p的麦克风与正在使用中的麦克风之间的距离进行计算，

表示正在使用中的麦克风音频在空气中传输一米时衰减的数据值；

S203：根据S202中的计算结果，对正在使用中的麦克风降噪增益值进行确定，对麦克风音频数据中的回声进行消除。

进一步的，所述S30包括：

S301：基于S203中确定的降噪增益值对麦克风音频数据的失真度进行计算，具体的计算公式F为：

其中，D表示麦克风降噪增益值的取值范围，k表示降噪增益值与音频数据失真量之间的关系系数，F表示麦克风音频数据的失真度；

S302：将S301中计算的失真度与设定阈值进行对比，若F≤设定阈值，则无需对麦克风音频数据进行处理，若F>设定阈值，则根据音频数据的连续性，对对应麦克风音频数据失真前的数据值进行预测；

S303：将S302中预测的对应麦克风音频数据失真前的数据值与数据库中的音频数据数据值进行匹配，基于匹配结果，结合S301中计算的失真度，对失真的音频数据进行复原。

进一步的，所述S40包括：

S401：重复S10、S20和S30的步骤，对除正在使用中的麦克风外剩余麦克风的音频数据进行处理；

S402：将S401中获取的音频数据，与S303中复原的音频数据进行混音处理。

一种大数据的音频数据采集管理系统，所述系统包括：音频数据匹配处理模块、回声消除模块、失真处理模块和混音处理模块；

所述音频数据匹配处理模块用于对多个麦克风中的音频数据进行采集，基于音频数据的采集时间、采集量和音频连续性，对采集的麦克风音频数据进行匹配处理，并将匹配处理结果传输至回声消除模块；

所述回声消除模块用于对音频数据匹配处理模块传输的麦克风音频数据匹配结果进行接收，基于接收内容，对音频数据中各回声位置上的回声比例进行计算，基于计算结果对麦克风的降噪增益值进行确定，根据确定结果对麦克风音频数据中的回声进行消除处理，并将回声消除处理后的音频数据和确定的麦克风降噪增益值传输至失真处理模块；

所述失真处理模块用于对回声消除模块传输的回声消除处理后的音频数据和确定的麦克风降噪增益值进行接收，基于接收内容，对麦克风音频数据的失真度进行计算，基于计算结果对音频数据进行失真处理，并将失真处理后的音频数据传输至混音处理模块；

所述混音处理模块用于对失真处理模块传输的音频数据进行接收，再次利用音频数据匹配处理模块、回声消除模块和失真处理模块，对除正在使用中的麦克风外剩余麦克风的音频数据进行处理，处理结束后，对各麦克风复原后的音频数据进行混音处理。

进一步的，所述音频数据匹配处理模块包括信息获取单元、音频数据筛选单元和麦克风使用情况确定单元；

所述信息获取单元对麦克风音频进行采集，将采集的麦克风音频与数据库中的音频进行对比，根据对比结果，对音频所属者发出音频时的音频连续性和音频间隔时间进行获取，并将获取信息传输至音频数据筛选单元；

所述音频数据筛选单元对信息获取单元传输的获取信息进行接收，音频数据筛选单元对多个麦克风的音频采集时间是否一致进行判断，根据判断结果对获取信息进行初步筛选，根据多个麦克风音频数据的采集量，对初步筛选后的获取信息进行二次筛选，并将二次筛选结果传输至麦克风使用情况确定单元；

所述麦克风使用情况确定单元对音频数据筛选单元传输的二次筛选结果进行接收，基于接收内容，构建数学模型

对正在使用中的麦克风进行确定，并将确定结果传输至回声消除模块。

进一步的，所述回声消除模块包括位置确定单元、回声比例计算单元和回声消除单元；

所述位置确定单元对麦克风使用情况确定单元传输的麦克风使用情况进行接收，基于接收内容，对麦克风使用者的音频数据进行获取，将获取的音频数据与数据库中对应使用者的音频数据进行对比，对音频数据中的回声位置进行确定，并将确定的回声位置传输至回声比例计算单元；

所述回声比例计算单元对位置确定单元传输的回声位置进行接收，基于确定的回声位置上的音频数据，结合麦克风与麦克风音箱之间的距离，利用公式

对各位置上存在的回声比例进行计算，并将计算结果传输至回声消除单元；

所述回声消除单元对回声比例计算单元传输的计算结果进行接收，基于接收信息，对正在使用中的麦克风降噪增益值进行确定，对麦克风音频数据中的回声进行消除，并将确定的麦克风降噪增益值和回声消除处理后的音频数据传输至失真处理模块。

进一步的，所述失真处理模块包括失真度计算单元、预测单元和失真处理单元；

所述失真度计算单元对回声消除单元传输的确定的麦克风降噪增益值进行接收，基于接收内容，利用公式

对麦克风音频数据的失真度进行计算，并将计算结果传输至预测单元和失真处理单元；

所述预测单元对失真度计算单元传输的计算结果和回声消除单元传输的回声消除处理后的音频数据进行接收，将接收的计算结果与设定阈值进行对比，根据对比结果，以及音频数据的连续性，对对应麦克风音频数据失真前的数据值进行预测，并将预测结果传输至失真处理单元；

所述失真处理单元对预测单元传输的预测结果和失真度计算单元传输的计算结果进行接收，将接收的预测结果与数据库中的音频数据数据值进行匹配，基于匹配结果，结合接收的失真度计算结果，对失真的音频数据进行复原，并将失真复原后的音频数据传输至混音处理模块。

进一步的，所述系统通过数字音频矩阵处理器实现上述功能，所述数字音频矩阵处理器前面板依次设置有输入电平指示灯、电平数值显示屏、输出电平指示灯、状态指示灯和录播功能键，所述数字音频矩阵处理器后面板依次设置有电源插口、电源开关、以太网接口、恢复出厂配置按钮、通讯端口、模拟音频输入接口和模拟音频输出接口。

与现有技术相比，本发明所达到的有益效果是：

1.本发明通过将采集的麦克风音频与数据库中的音频进行匹配，对音频所属者发出音频时的音频连续性和音频间隔时间进行获取，基于获取信息，对采集的麦克风音频数据进行筛选，筛选后，通过构建数学模型对正在使用中的麦克风进行确定，基于确定的麦克风，有利于对其余麦克风中存在的相同音频数据进行确定，进而对麦克风中存在的回声进行确定，有利于提高系统对音频数据的处理效果。

2.本发明通过对麦克风音频数据上的回声位置进行确定，确定后，通过对各位置上存在的回声比例进行计算，基于计算结果对麦克风的降噪增益值进行确定，可实现对麦克分音频数据中的回声进行精准消除，进一步提高了系统的使用效果。

3.本发明根据确定的麦克分降噪增益值对麦克风音频数据的失真度进行计算，结合音频数据对应的连续性，对对应麦克风音频数据失真前的数据值进行预测，基于预测值和计算的失真度，对失真的音频数据进行复原，避免音频数据在经过回声消除处理后，得到的音频数据与原音频数据不符，进一步提高了系统对音频数据的处理精度。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明一种大数据的音频数据采集管理系统及方法的工作流程示意图；

图2是本发明一种大数据的音频数据采集管理系统及方法的工作原理结构结构示意图；

图3是本发明一种大数据的音频数据采集管理系统及方法的数字音频矩阵处理器前面板结构示意图；

图4是本发明一种大数据的音频数据采集管理系统及方法的数字音频矩阵处理器后面板结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1、图2、图3和图4，本发明提供技术方案：一种大数据的音频数据采集管理方法，方法包括以下步骤：

S10包括：

表示对音频数据值为零的数量进行计算，α表示获取的音频连续值，j＝1,2,…,m<n表示音频数据值为零时对应的音频数据编号，m表示j所能取到的最大值，T_j表示编号为j的麦克风音频数据对应的停顿时间，t表示获取的音频间隔时间，当Q＝0时，表示该音频数据属于麦克风使用者，当Q≠0时，表示该音频数据不属于麦克风使用者；

S20包括：

表示正在使用中的麦克风相对于麦克风音箱的位置坐标，

S203：根据S202中的计算结果，对正在使用中的麦克风降噪增益值进行确定，对麦克风音频数据中的回声进行消除；

S30：对S20中处理后的音频数据进行失真处理；

S30包括：

S303：将S302中预测的对应麦克风音频数据失真前的数据值与数据库中的音频数据数据值进行匹配，基于匹配结果，结合S301中计算的失真度，对失真的音频数据进行复原；

S40：基于S30的处理结果，对音频数据进行混音操作；

S40包括：

一种大数据的音频数据采集管理系统，系统包括：音频数据匹配处理模块、回声消除模块、失真处理模块和混音处理模块；

音频数据匹配处理模块用于对多个麦克风中的音频数据进行采集，基于音频数据的采集时间、采集量和音频连续性，对采集的麦克风音频数据进行匹配处理，并将匹配处理结果传输至回声消除模块；

音频数据匹配处理模块包括信息获取单元、音频数据筛选单元和麦克风使用情况确定单元；

信息获取单元对麦克风音频进行采集，将采集的麦克风音频与数据库中的音频进行对比，根据对比结果，对音频所属者发出音频时的音频连续性和音频间隔时间进行获取，并将获取信息传输至音频数据筛选单元；

音频数据筛选单元对信息获取单元传输的获取信息进行接收，音频数据筛选单元对多个麦克风的音频采集时间是否一致进行判断，根据判断结果对获取信息进行初步筛选，根据多个麦克风音频数据的采集量，对初步筛选后的获取信息进行二次筛选，并将二次筛选结果传输至麦克风使用情况确定单元；

麦克风使用情况确定单元对音频数据筛选单元传输的二次筛选结果进行接收，基于接收内容，构建数学模型

对正在使用中的麦克风进行确定，并将确定结果传输至回声消除模块；

回声消除模块用于对音频数据匹配处理模块传输的麦克风音频数据匹配结果进行接收，基于接收内容，对音频数据中各回声位置上的回声比例进行计算，基于计算结果对麦克风的降噪增益值进行确定，根据确定结果对麦克风音频数据中的回声进行消除处理，并将回声消除处理后的音频数据和确定的麦克风降噪增益值传输至失真处理模块；

回声消除模块包括位置确定单元、回声比例计算单元和回声消除单元；

位置确定单元对麦克风使用情况确定单元传输的麦克风使用情况进行接收，基于接收内容，对麦克风使用者的音频数据进行获取，将获取的音频数据与数据库中对应使用者的音频数据进行对比，对音频数据中的回声位置进行确定，并将确定的回声位置传输至回声比例计算单元；

回声比例计算单元对位置确定单元传输的回声位置进行接收，基于确定的回声位置上的音频数据，结合麦克风与麦克风音箱之间的距离，利用公式

回声消除单元对回声比例计算单元传输的计算结果进行接收，基于接收信息，对正在使用中的麦克风降噪增益值进行确定，对麦克风音频数据中的回声进行消除，并将确定的麦克风降噪增益值和回声消除处理后的音频数据传输至失真处理模块；

失真处理模块用于对回声消除模块传输的回声消除处理后的音频数据和确定的麦克风降噪增益值进行接收，基于接收内容，对麦克风音频数据的失真度进行计算，基于计算结果对音频数据进行失真处理，并将失真处理后的音频数据传输至混音处理模块；

失真处理模块包括失真度计算单元、预测单元和失真处理单元；

失真度计算单元对回声消除单元传输的确定的麦克风降噪增益值进行接收，基于接收内容，利用公式

预测单元对失真度计算单元传输的计算结果和回声消除单元传输的回声消除处理后的音频数据进行接收，将接收的计算结果与设定阈值进行对比，根据对比结果，以及音频数据的连续性，对对应麦克风音频数据失真前的数据值进行预测，并将预测结果传输至失真处理单元；

失真处理单元对预测单元传输的预测结果和失真度计算单元传输的计算结果进行接收，将接收的预测结果与数据库中的音频数据数据值进行匹配，基于匹配结果，结合接收的失真度计算结果，对失真的音频数据进行复原，并将失真复原后的音频数据传输至混音处理模块；

混音处理模块用于对失真处理模块传输的音频数据进行接收，再次利用音频数据匹配处理模块、回声消除模块和失真处理模块，对除正在使用中的麦克风外剩余麦克风的音频数据进行处理，处理结束后，对各麦克风复原后的音频数据进行混音处理。

系统通过数字音频矩阵处理器实现上述功能，数字音频矩阵处理器前面板依次设置有输入电平指示灯、电平数值显示屏、输出电平指示灯、状态指示灯和录播功能键，数字音频矩阵处理器后面板依次设置有电源插口、电源开关、以太网接口、恢复出厂配置按钮、通讯端口、模拟音频输入接口和模拟音频输出接口。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种大数据的音频数据采集管理方法，其特征在于：所述方法包括以下步骤：

S30：对S20中处理后的音频数据进行失真处理；

S40：基于S30的处理结果，对音频数据进行混音操作。

2.根据权利要求1所述的一种大数据的音频数据采集管理方法，其特征在于：所述S10包括：

3.根据权利要求2所述的一种大数据的音频数据采集管理方法，其特征在于：所述S20包括：

表示正在使用中的麦克风相对于麦克风音箱的位置坐标，

4.根据权利要求3所述的一种大数据的音频数据采集管理方法，其特征在于：所述S30包括：

5.根据权利要求4所述的一种大数据的音频数据采集管理系统及方法，其特征在于：所述S40包括：

6.一种执行如权利要求1-5任一项所述的大数据的音频数据采集管理方法的大数据的音频数据采集管理系统，其特征在于：所述系统包括：音频数据匹配处理模块、回声消除模块、失真处理模块和混音处理模块；

7.根据权利要求6所述的一种大数据的音频数据采集管理系统，其特征在于：所述音频数据匹配处理模块包括信息获取单元、音频数据筛选单元和麦克风使用情况确定单元；

8.根据权利要求7所述的一种大数据的音频数据采集管理系统，其特征在于：所述回声消除模块包括位置确定单元、回声比例计算单元和回声消除单元；

9.根据权利要求8所述的一种大数据的音频数据采集管理系统，其特征在于：所述失真处理模块包括失真度计算单元、预测单元和失真处理单元；

10.根据权利要求9所述的一种大数据的音频数据采集管理系统，其特征在于：所述系统通过数字音频矩阵处理器实现上述功能，所述数字音频矩阵处理器前面板依次设置有输入电平指示灯、电平数值显示屏、输出电平指示灯、状态指示灯和录播功能键，所述数字音频矩阵处理器后面板依次设置有电源插口、电源开关、以太网接口、恢复出厂配置按钮、通讯端口、模拟音频输入接口和模拟音频输出接口。