CN115579015A - 一种大数据的音频数据采集管理系统及方法 - Google Patents

一种大数据的音频数据采集管理系统及方法 Download PDF

Info

Publication number
CN115579015A
CN115579015A CN202211162087.3A CN202211162087A CN115579015A CN 115579015 A CN115579015 A CN 115579015A CN 202211162087 A CN202211162087 A CN 202211162087A CN 115579015 A CN115579015 A CN 115579015A
Authority
CN
China
Prior art keywords
audio data
microphone
audio
echo
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211162087.3A
Other languages
English (en)
Other versions
CN115579015B (zh
Inventor
吴金伦
余永贵
董瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enping Baoxun Intelligent Technology Co ltd
Original Assignee
Enping Baoxun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enping Baoxun Intelligent Technology Co ltd filed Critical Enping Baoxun Intelligent Technology Co ltd
Priority to CN202211162087.3A priority Critical patent/CN115579015B/zh
Publication of CN115579015A publication Critical patent/CN115579015A/zh
Application granted granted Critical
Publication of CN115579015B publication Critical patent/CN115579015B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种大数据的音频数据采集管理系统及方法,属于音频数据处理技术领域。本发明包括以下步骤:S10:对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理;S20:基于S10中的匹配结果,对音频数据中的回声进行消除处理;S30:对S20中处理后的音频数据进行失真处理;S40:基于S30的处理结果,对音频数据进行混音操作,本发明可实现对麦克分音频数据中的回声进行精准消除,进一步提高了系统的使用效果,以及避免音频数据在经过回声消除处理后,得到的音频数据与原音频数据不符,进一步提高了系统对音频数据的处理精度。

Description

一种大数据的音频数据采集管理系统及方法
技术领域
本发明涉及音频数据处理技术领域,具体为一种大数据的音频数据采集管理系统及方法。
背景技术
音频处理是我们在使用很多大型电子设备时所要经常用到的音频处理装置,它能够帮助我们控制音乐或配乐,使其在不同场景中产生不同的声音效果,增加音乐或配乐的震撼力,同时能够控制现场的很多音频功能。
现有的音频处理系统在对音频数据进行处理时,混音后的音频输出噪音较大,进而降低了系统的使用范围,且在混音过程中,通常采用单一的方法对音频数据进行处理,从而导致处理后的混音质量参差不齐,以及系统在作用时,无法实现对说话麦克风和未说话麦克风的区别处理,导致系统在对麦克风音频进行采集时,采集音频中存在回音音频,降低了系统的使用效果。
发明内容
本发明的目的在于提供一种大数据的音频数据采集管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种大数据的音频数据采集管理方法,所述方法包括以下步骤:
S10:对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理;
S20:基于S10中的匹配结果,对音频数据中的回声进行消除处理;
S30:对S20中处理后的音频数据进行失真处理;
S40:基于S30的处理结果,对音频数据进行混音操作。
进一步的,所述S10包括:
S101:将采集的麦克风音频与数据库中的音频进行对比,根据对比结果,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取;
S102:基于S101中的获取信息,结合多个麦克风音频数据的采集时间和采集量,对正在使用中的麦克风进行确定,具体的确定方法为:
①.判断多个麦克风的音频数据采集时间是否一致,若采集时间一致,则将采集的音频数据按照麦克风编号进行存储,若采集时间不一致,则将采集时间异与标准采集时间的麦克风音频数据进行剔除,之后,再将剔除处理后的剩余音频数据按照麦克风编号进行存储;
②.根据多个麦克风音频数据的采集量,对上述存储的音频数据进行筛选,若麦克风音频数据的采集量≤α*maxW,则将对应麦克风的音频数据筛选出,若麦克风音频数据的采集量>α*maxW,则将对应麦克风的音频数据进行保留,其中,0≤α≤0.4,W表示单个麦克风的音频数据采集量;
③.基于上述保留的音频数据,构建数学模型对正在使用中的麦克风进行确定,具体的数学模型Q为:
Figure BDA0003860091710000021
其中,i=1,2,…,n表示单个麦克风中的音频数据对应的编号,n表示i所能取到的最大值,ai表示编号为i的音频数据对应的数据值,
Figure BDA0003860091710000022
表示对音频数据值为零的数量进行计算,α表示获取的音频连续值,j=1,2,…,m<n表示音频数据值为零时对应的音频数据编号,m表示j所能取到的最大值,Tj表示编号为j的麦克风音频数据对应的停顿时间,t表示获取的音频间隔时间,当Q=0时,表示该音频数据属于麦克风使用者,当Q≠0时,表示该音频数据不属于麦克风使用者。
进一步的,所述S20包括:
S201:基于S10中确定的麦克风使用情况,对麦克风使用者的音频数据进行获取,将获取的音频数据与数据库中对应使用者的音频数据进行对比,对音频数据中的回声位置进行确定;
S202:利用上述确定的回声位置上的音频数据,结合麦克风与麦克风音箱之间的距离,对各位置上存在的回声比例进行计算,具体的计算公式E为:
Figure BDA0003860091710000023
其中,u=1,2,…,q表示上述确定的回声位置对应的编号,q表示u所能取到的最大值,au表示音频数据在编号为u的位置对应的数据值,
Figure BDA0003860091710000031
表示麦克风使用者的音频数据在编号为u的位置对应的数据值,p=1,2,…,h表示除正在使用中的麦克风外剩余麦克风对应的编号,h表示p所能取到的最大值,(xp,yp)表示编号为p的麦克风相对于麦克风音箱的位置坐标,
Figure BDA0003860091710000032
表示正在使用中的麦克风相对于麦克风音箱的位置坐标,
Figure BDA0003860091710000033
表示对编号为p的麦克风与正在使用中的麦克风之间的距离进行计算,
Figure BDA0003860091710000034
表示正在使用中的麦克风音频在空气中传输一米时衰减的数据值;
S203:根据S202中的计算结果,对正在使用中的麦克风降噪增益值进行确定,对麦克风音频数据中的回声进行消除。
进一步的,所述S30包括:
S301:基于S203中确定的降噪增益值对麦克风音频数据的失真度进行计算,具体的计算公式F为:
Figure BDA0003860091710000035
其中,D表示麦克风降噪增益值的取值范围,k表示降噪增益值与音频数据失真量之间的关系系数,F表示麦克风音频数据的失真度;
S302:将S301中计算的失真度与设定阈值进行对比,若F≤设定阈值,则无需对麦克风音频数据进行处理,若F>设定阈值,则根据音频数据的连续性,对对应麦克风音频数据失真前的数据值进行预测;
S303:将S302中预测的对应麦克风音频数据失真前的数据值与数据库中的音频数据数据值进行匹配,基于匹配结果,结合S301中计算的失真度,对失真的音频数据进行复原。
进一步的,所述S40包括:
S401:重复S10、S20和S30的步骤,对除正在使用中的麦克风外剩余麦克风的音频数据进行处理;
S402:将S401中获取的音频数据,与S303中复原的音频数据进行混音处理。
一种大数据的音频数据采集管理系统,所述系统包括:音频数据匹配处理模块、回声消除模块、失真处理模块和混音处理模块;
所述音频数据匹配处理模块用于对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理,并将匹配处理结果传输至回声消除模块;
所述回声消除模块用于对音频数据匹配处理模块传输的麦克风音频数据匹配结果进行接收,基于接收内容,对音频数据中各回声位置上的回声比例进行计算,基于计算结果对麦克风的降噪增益值进行确定,根据确定结果对麦克风音频数据中的回声进行消除处理,并将回声消除处理后的音频数据和确定的麦克风降噪增益值传输至失真处理模块;
所述失真处理模块用于对回声消除模块传输的回声消除处理后的音频数据和确定的麦克风降噪增益值进行接收,基于接收内容,对麦克风音频数据的失真度进行计算,基于计算结果对音频数据进行失真处理,并将失真处理后的音频数据传输至混音处理模块;
所述混音处理模块用于对失真处理模块传输的音频数据进行接收,再次利用音频数据匹配处理模块、回声消除模块和失真处理模块,对除正在使用中的麦克风外剩余麦克风的音频数据进行处理,处理结束后,对各麦克风复原后的音频数据进行混音处理。
进一步的,所述音频数据匹配处理模块包括信息获取单元、音频数据筛选单元和麦克风使用情况确定单元;
所述信息获取单元对麦克风音频进行采集,将采集的麦克风音频与数据库中的音频进行对比,根据对比结果,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取,并将获取信息传输至音频数据筛选单元;
所述音频数据筛选单元对信息获取单元传输的获取信息进行接收,音频数据筛选单元对多个麦克风的音频采集时间是否一致进行判断,根据判断结果对获取信息进行初步筛选,根据多个麦克风音频数据的采集量,对初步筛选后的获取信息进行二次筛选,并将二次筛选结果传输至麦克风使用情况确定单元;
所述麦克风使用情况确定单元对音频数据筛选单元传输的二次筛选结果进行接收,基于接收内容,构建数学模型
Figure BDA0003860091710000041
对正在使用中的麦克风进行确定,并将确定结果传输至回声消除模块。
进一步的,所述回声消除模块包括位置确定单元、回声比例计算单元和回声消除单元;
所述位置确定单元对麦克风使用情况确定单元传输的麦克风使用情况进行接收,基于接收内容,对麦克风使用者的音频数据进行获取,将获取的音频数据与数据库中对应使用者的音频数据进行对比,对音频数据中的回声位置进行确定,并将确定的回声位置传输至回声比例计算单元;
所述回声比例计算单元对位置确定单元传输的回声位置进行接收,基于确定的回声位置上的音频数据,结合麦克风与麦克风音箱之间的距离,利用公式
Figure BDA0003860091710000051
对各位置上存在的回声比例进行计算,并将计算结果传输至回声消除单元;
所述回声消除单元对回声比例计算单元传输的计算结果进行接收,基于接收信息,对正在使用中的麦克风降噪增益值进行确定,对麦克风音频数据中的回声进行消除,并将确定的麦克风降噪增益值和回声消除处理后的音频数据传输至失真处理模块。
进一步的,所述失真处理模块包括失真度计算单元、预测单元和失真处理单元;
所述失真度计算单元对回声消除单元传输的确定的麦克风降噪增益值进行接收,基于接收内容,利用公式
Figure BDA0003860091710000052
对麦克风音频数据的失真度进行计算,并将计算结果传输至预测单元和失真处理单元;
所述预测单元对失真度计算单元传输的计算结果和回声消除单元传输的回声消除处理后的音频数据进行接收,将接收的计算结果与设定阈值进行对比,根据对比结果,以及音频数据的连续性,对对应麦克风音频数据失真前的数据值进行预测,并将预测结果传输至失真处理单元;
所述失真处理单元对预测单元传输的预测结果和失真度计算单元传输的计算结果进行接收,将接收的预测结果与数据库中的音频数据数据值进行匹配,基于匹配结果,结合接收的失真度计算结果,对失真的音频数据进行复原,并将失真复原后的音频数据传输至混音处理模块。
进一步的,所述系统通过数字音频矩阵处理器实现上述功能,所述数字音频矩阵处理器前面板依次设置有输入电平指示灯、电平数值显示屏、输出电平指示灯、状态指示灯和录播功能键,所述数字音频矩阵处理器后面板依次设置有电源插口、电源开关、以太网接口、恢复出厂配置按钮、通讯端口、模拟音频输入接口和模拟音频输出接口。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过将采集的麦克风音频与数据库中的音频进行匹配,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取,基于获取信息,对采集的麦克风音频数据进行筛选,筛选后,通过构建数学模型对正在使用中的麦克风进行确定,基于确定的麦克风,有利于对其余麦克风中存在的相同音频数据进行确定,进而对麦克风中存在的回声进行确定,有利于提高系统对音频数据的处理效果。
2.本发明通过对麦克风音频数据上的回声位置进行确定,确定后,通过对各位置上存在的回声比例进行计算,基于计算结果对麦克风的降噪增益值进行确定,可实现对麦克分音频数据中的回声进行精准消除,进一步提高了系统的使用效果。
3.本发明根据确定的麦克分降噪增益值对麦克风音频数据的失真度进行计算,结合音频数据对应的连续性,对对应麦克风音频数据失真前的数据值进行预测,基于预测值和计算的失真度,对失真的音频数据进行复原,避免音频数据在经过回声消除处理后,得到的音频数据与原音频数据不符,进一步提高了系统对音频数据的处理精度。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种大数据的音频数据采集管理系统及方法的工作流程示意图;
图2是本发明一种大数据的音频数据采集管理系统及方法的工作原理结构结构示意图;
图3是本发明一种大数据的音频数据采集管理系统及方法的数字音频矩阵处理器前面板结构示意图;
图4是本发明一种大数据的音频数据采集管理系统及方法的数字音频矩阵处理器后面板结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1、图2、图3和图4,本发明提供技术方案:一种大数据的音频数据采集管理方法,方法包括以下步骤:
S10:对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理;
S10包括:
S101:将采集的麦克风音频与数据库中的音频进行对比,根据对比结果,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取;
S102:基于S101中的获取信息,结合多个麦克风音频数据的采集时间和采集量,对正在使用中的麦克风进行确定,具体的确定方法为:
①.判断多个麦克风的音频数据采集时间是否一致,若采集时间一致,则将采集的音频数据按照麦克风编号进行存储,若采集时间不一致,则将采集时间异与标准采集时间的麦克风音频数据进行剔除,之后,再将剔除处理后的剩余音频数据按照麦克风编号进行存储;
②.根据多个麦克风音频数据的采集量,对上述存储的音频数据进行筛选,若麦克风音频数据的采集量≤α*maxW,则将对应麦克风的音频数据筛选出,若麦克风音频数据的采集量>α*maxW,则将对应麦克风的音频数据进行保留,其中,0≤α≤0.4,W表示单个麦克风的音频数据采集量;
③.基于上述保留的音频数据,构建数学模型对正在使用中的麦克风进行确定,具体的数学模型Q为:
Figure BDA0003860091710000071
其中,i=1,2,…,n表示单个麦克风中的音频数据对应的编号,n表示i所能取到的最大值,ai表示编号为i的音频数据对应的数据值,
Figure BDA0003860091710000072
表示对音频数据值为零的数量进行计算,α表示获取的音频连续值,j=1,2,…,m<n表示音频数据值为零时对应的音频数据编号,m表示j所能取到的最大值,Tj表示编号为j的麦克风音频数据对应的停顿时间,t表示获取的音频间隔时间,当Q=0时,表示该音频数据属于麦克风使用者,当Q≠0时,表示该音频数据不属于麦克风使用者;
S20:基于S10中的匹配结果,对音频数据中的回声进行消除处理;
S20包括:
S201:基于S10中确定的麦克风使用情况,对麦克风使用者的音频数据进行获取,将获取的音频数据与数据库中对应使用者的音频数据进行对比,对音频数据中的回声位置进行确定;
S202:利用上述确定的回声位置上的音频数据,结合麦克风与麦克风音箱之间的距离,对各位置上存在的回声比例进行计算,具体的计算公式E为:
Figure BDA0003860091710000081
其中,u=1,2,…,q表示上述确定的回声位置对应的编号,q表示u所能取到的最大值,au表示音频数据在编号为u的位置对应的数据值,
Figure BDA0003860091710000082
表示麦克风使用者的音频数据在编号为u的位置对应的数据值,p=1,2,…,h表示除正在使用中的麦克风外剩余麦克风对应的编号,h表示p所能取到的最大值,(xp,yp)表示编号为p的麦克风相对于麦克风音箱的位置坐标,
Figure BDA0003860091710000083
表示正在使用中的麦克风相对于麦克风音箱的位置坐标,
Figure BDA0003860091710000084
表示对编号为p的麦克风与正在使用中的麦克风之间的距离进行计算,
Figure BDA0003860091710000085
表示正在使用中的麦克风音频在空气中传输一米时衰减的数据值;
S203:根据S202中的计算结果,对正在使用中的麦克风降噪增益值进行确定,对麦克风音频数据中的回声进行消除;
S30:对S20中处理后的音频数据进行失真处理;
S30包括:
S301:基于S203中确定的降噪增益值对麦克风音频数据的失真度进行计算,具体的计算公式F为:
Figure BDA0003860091710000086
其中,D表示麦克风降噪增益值的取值范围,k表示降噪增益值与音频数据失真量之间的关系系数,F表示麦克风音频数据的失真度;
S302:将S301中计算的失真度与设定阈值进行对比,若F≤设定阈值,则无需对麦克风音频数据进行处理,若F>设定阈值,则根据音频数据的连续性,对对应麦克风音频数据失真前的数据值进行预测;
S303:将S302中预测的对应麦克风音频数据失真前的数据值与数据库中的音频数据数据值进行匹配,基于匹配结果,结合S301中计算的失真度,对失真的音频数据进行复原;
S40:基于S30的处理结果,对音频数据进行混音操作;
S40包括:
S401:重复S10、S20和S30的步骤,对除正在使用中的麦克风外剩余麦克风的音频数据进行处理;
S402:将S401中获取的音频数据,与S303中复原的音频数据进行混音处理。
一种大数据的音频数据采集管理系统,系统包括:音频数据匹配处理模块、回声消除模块、失真处理模块和混音处理模块;
音频数据匹配处理模块用于对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理,并将匹配处理结果传输至回声消除模块;
音频数据匹配处理模块包括信息获取单元、音频数据筛选单元和麦克风使用情况确定单元;
信息获取单元对麦克风音频进行采集,将采集的麦克风音频与数据库中的音频进行对比,根据对比结果,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取,并将获取信息传输至音频数据筛选单元;
音频数据筛选单元对信息获取单元传输的获取信息进行接收,音频数据筛选单元对多个麦克风的音频采集时间是否一致进行判断,根据判断结果对获取信息进行初步筛选,根据多个麦克风音频数据的采集量,对初步筛选后的获取信息进行二次筛选,并将二次筛选结果传输至麦克风使用情况确定单元;
麦克风使用情况确定单元对音频数据筛选单元传输的二次筛选结果进行接收,基于接收内容,构建数学模型
Figure BDA0003860091710000091
对正在使用中的麦克风进行确定,并将确定结果传输至回声消除模块;
回声消除模块用于对音频数据匹配处理模块传输的麦克风音频数据匹配结果进行接收,基于接收内容,对音频数据中各回声位置上的回声比例进行计算,基于计算结果对麦克风的降噪增益值进行确定,根据确定结果对麦克风音频数据中的回声进行消除处理,并将回声消除处理后的音频数据和确定的麦克风降噪增益值传输至失真处理模块;
回声消除模块包括位置确定单元、回声比例计算单元和回声消除单元;
位置确定单元对麦克风使用情况确定单元传输的麦克风使用情况进行接收,基于接收内容,对麦克风使用者的音频数据进行获取,将获取的音频数据与数据库中对应使用者的音频数据进行对比,对音频数据中的回声位置进行确定,并将确定的回声位置传输至回声比例计算单元;
回声比例计算单元对位置确定单元传输的回声位置进行接收,基于确定的回声位置上的音频数据,结合麦克风与麦克风音箱之间的距离,利用公式
Figure BDA0003860091710000101
对各位置上存在的回声比例进行计算,并将计算结果传输至回声消除单元;
回声消除单元对回声比例计算单元传输的计算结果进行接收,基于接收信息,对正在使用中的麦克风降噪增益值进行确定,对麦克风音频数据中的回声进行消除,并将确定的麦克风降噪增益值和回声消除处理后的音频数据传输至失真处理模块;
失真处理模块用于对回声消除模块传输的回声消除处理后的音频数据和确定的麦克风降噪增益值进行接收,基于接收内容,对麦克风音频数据的失真度进行计算,基于计算结果对音频数据进行失真处理,并将失真处理后的音频数据传输至混音处理模块;
失真处理模块包括失真度计算单元、预测单元和失真处理单元;
失真度计算单元对回声消除单元传输的确定的麦克风降噪增益值进行接收,基于接收内容,利用公式
Figure BDA0003860091710000102
对麦克风音频数据的失真度进行计算,并将计算结果传输至预测单元和失真处理单元;
预测单元对失真度计算单元传输的计算结果和回声消除单元传输的回声消除处理后的音频数据进行接收,将接收的计算结果与设定阈值进行对比,根据对比结果,以及音频数据的连续性,对对应麦克风音频数据失真前的数据值进行预测,并将预测结果传输至失真处理单元;
失真处理单元对预测单元传输的预测结果和失真度计算单元传输的计算结果进行接收,将接收的预测结果与数据库中的音频数据数据值进行匹配,基于匹配结果,结合接收的失真度计算结果,对失真的音频数据进行复原,并将失真复原后的音频数据传输至混音处理模块;
混音处理模块用于对失真处理模块传输的音频数据进行接收,再次利用音频数据匹配处理模块、回声消除模块和失真处理模块,对除正在使用中的麦克风外剩余麦克风的音频数据进行处理,处理结束后,对各麦克风复原后的音频数据进行混音处理。
系统通过数字音频矩阵处理器实现上述功能,数字音频矩阵处理器前面板依次设置有输入电平指示灯、电平数值显示屏、输出电平指示灯、状态指示灯和录播功能键,数字音频矩阵处理器后面板依次设置有电源插口、电源开关、以太网接口、恢复出厂配置按钮、通讯端口、模拟音频输入接口和模拟音频输出接口。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种大数据的音频数据采集管理方法,其特征在于:所述方法包括以下步骤:
S10:对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理;
S20:基于S10中的匹配结果,对音频数据中的回声进行消除处理;
S30:对S20中处理后的音频数据进行失真处理;
S40:基于S30的处理结果,对音频数据进行混音操作。
2.根据权利要求1所述的一种大数据的音频数据采集管理方法,其特征在于:所述S10包括:
S101:将采集的麦克风音频与数据库中的音频进行对比,根据对比结果,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取;
S102:基于S101中的获取信息,结合多个麦克风音频数据的采集时间和采集量,对正在使用中的麦克风进行确定,具体的确定方法为:
①.判断多个麦克风的音频数据采集时间是否一致,若采集时间一致,则将采集的音频数据按照麦克风编号进行存储,若采集时间不一致,则将采集时间异与标准采集时间的麦克风音频数据进行剔除,之后,再将剔除处理后的剩余音频数据按照麦克风编号进行存储;
②.根据多个麦克风音频数据的采集量,对上述存储的音频数据进行筛选,若麦克风音频数据的采集量≤α*maxW,则将对应麦克风的音频数据筛选出,若麦克风音频数据的采集量>α*maxW,则将对应麦克风的音频数据进行保留,其中,0≤α≤0.4,W表示单个麦克风的音频数据采集量;
③.基于上述保留的音频数据,构建数学模型对正在使用中的麦克风进行确定,具体的数学模型Q为:
Figure FDA0003860091700000011
其中,i=1,2,…,n表示单个麦克风中的音频数据对应的编号,n表示i所能取到的最大值,ai表示编号为i的音频数据对应的数据值,
Figure FDA0003860091700000012
表示对音频数据值为零的数量进行计算,α表示获取的音频连续值,j=1,2,…,m<n表示音频数据值为零时对应的音频数据编号,m表示j所能取到的最大值,Tj表示编号为j的麦克风音频数据对应的停顿时间,t表示获取的音频间隔时间,当Q=0时,表示该音频数据属于麦克风使用者,当Q≠0时,表示该音频数据不属于麦克风使用者。
3.根据权利要求2所述的一种大数据的音频数据采集管理方法,其特征在于:所述S20包括:
S201:基于S10中确定的麦克风使用情况,对麦克风使用者的音频数据进行获取,将获取的音频数据与数据库中对应使用者的音频数据进行对比,对音频数据中的回声位置进行确定;
S202:利用上述确定的回声位置上的音频数据,结合麦克风与麦克风音箱之间的距离,对各位置上存在的回声比例进行计算,具体的计算公式E为:
Figure FDA0003860091700000021
其中,u=1,2,…,q表示上述确定的回声位置对应的编号,q表示u所能取到的最大值,au表示音频数据在编号为u的位置对应的数据值,
Figure FDA0003860091700000022
表示麦克风使用者的音频数据在编号为u的位置对应的数据值,p=1,2,…,h表示除正在使用中的麦克风外剩余麦克风对应的编号,h表示p所能取到的最大值,(xp,yp)表示编号为p的麦克风相对于麦克风音箱的位置坐标,
Figure FDA0003860091700000026
表示正在使用中的麦克风相对于麦克风音箱的位置坐标,
Figure FDA0003860091700000023
表示对编号为p的麦克风与正在使用中的麦克风之间的距离进行计算,
Figure FDA0003860091700000024
表示正在使用中的麦克风音频在空气中传输一米时衰减的数据值;
S203:根据S202中的计算结果,对正在使用中的麦克风降噪增益值进行确定,对麦克风音频数据中的回声进行消除。
4.根据权利要求3所述的一种大数据的音频数据采集管理方法,其特征在于:所述S30包括:
S301:基于S203中确定的降噪增益值对麦克风音频数据的失真度进行计算,具体的计算公式F为:
Figure FDA0003860091700000025
其中,D表示麦克风降噪增益值的取值范围,k表示降噪增益值与音频数据失真量之间的关系系数,F表示麦克风音频数据的失真度;
S302:将S301中计算的失真度与设定阈值进行对比,若F≤设定阈值,则无需对麦克风音频数据进行处理,若F>设定阈值,则根据音频数据的连续性,对对应麦克风音频数据失真前的数据值进行预测;
S303:将S302中预测的对应麦克风音频数据失真前的数据值与数据库中的音频数据数据值进行匹配,基于匹配结果,结合S301中计算的失真度,对失真的音频数据进行复原。
5.根据权利要求4所述的一种大数据的音频数据采集管理系统及方法,其特征在于:所述S40包括:
S401:重复S10、S20和S30的步骤,对除正在使用中的麦克风外剩余麦克风的音频数据进行处理;
S402:将S401中获取的音频数据,与S303中复原的音频数据进行混音处理。
6.一种执行如权利要求1-5任一项所述的大数据的音频数据采集管理方法的大数据的音频数据采集管理系统,其特征在于:所述系统包括:音频数据匹配处理模块、回声消除模块、失真处理模块和混音处理模块;
所述音频数据匹配处理模块用于对多个麦克风中的音频数据进行采集,基于音频数据的采集时间、采集量和音频连续性,对采集的麦克风音频数据进行匹配处理,并将匹配处理结果传输至回声消除模块;
所述回声消除模块用于对音频数据匹配处理模块传输的麦克风音频数据匹配结果进行接收,基于接收内容,对音频数据中各回声位置上的回声比例进行计算,基于计算结果对麦克风的降噪增益值进行确定,根据确定结果对麦克风音频数据中的回声进行消除处理,并将回声消除处理后的音频数据和确定的麦克风降噪增益值传输至失真处理模块;
所述失真处理模块用于对回声消除模块传输的回声消除处理后的音频数据和确定的麦克风降噪增益值进行接收,基于接收内容,对麦克风音频数据的失真度进行计算,基于计算结果对音频数据进行失真处理,并将失真处理后的音频数据传输至混音处理模块;
所述混音处理模块用于对失真处理模块传输的音频数据进行接收,再次利用音频数据匹配处理模块、回声消除模块和失真处理模块,对除正在使用中的麦克风外剩余麦克风的音频数据进行处理,处理结束后,对各麦克风复原后的音频数据进行混音处理。
7.根据权利要求6所述的一种大数据的音频数据采集管理系统,其特征在于:所述音频数据匹配处理模块包括信息获取单元、音频数据筛选单元和麦克风使用情况确定单元;
所述信息获取单元对麦克风音频进行采集,将采集的麦克风音频与数据库中的音频进行对比,根据对比结果,对音频所属者发出音频时的音频连续性和音频间隔时间进行获取,并将获取信息传输至音频数据筛选单元;
所述音频数据筛选单元对信息获取单元传输的获取信息进行接收,音频数据筛选单元对多个麦克风的音频采集时间是否一致进行判断,根据判断结果对获取信息进行初步筛选,根据多个麦克风音频数据的采集量,对初步筛选后的获取信息进行二次筛选,并将二次筛选结果传输至麦克风使用情况确定单元;
所述麦克风使用情况确定单元对音频数据筛选单元传输的二次筛选结果进行接收,基于接收内容,构建数学模型
Figure FDA0003860091700000041
对正在使用中的麦克风进行确定,并将确定结果传输至回声消除模块。
8.根据权利要求7所述的一种大数据的音频数据采集管理系统,其特征在于:所述回声消除模块包括位置确定单元、回声比例计算单元和回声消除单元;
所述位置确定单元对麦克风使用情况确定单元传输的麦克风使用情况进行接收,基于接收内容,对麦克风使用者的音频数据进行获取,将获取的音频数据与数据库中对应使用者的音频数据进行对比,对音频数据中的回声位置进行确定,并将确定的回声位置传输至回声比例计算单元;
所述回声比例计算单元对位置确定单元传输的回声位置进行接收,基于确定的回声位置上的音频数据,结合麦克风与麦克风音箱之间的距离,利用公式
Figure FDA0003860091700000042
对各位置上存在的回声比例进行计算,并将计算结果传输至回声消除单元;
所述回声消除单元对回声比例计算单元传输的计算结果进行接收,基于接收信息,对正在使用中的麦克风降噪增益值进行确定,对麦克风音频数据中的回声进行消除,并将确定的麦克风降噪增益值和回声消除处理后的音频数据传输至失真处理模块。
9.根据权利要求8所述的一种大数据的音频数据采集管理系统,其特征在于:所述失真处理模块包括失真度计算单元、预测单元和失真处理单元;
所述失真度计算单元对回声消除单元传输的确定的麦克风降噪增益值进行接收,基于接收内容,利用公式
Figure FDA0003860091700000051
对麦克风音频数据的失真度进行计算,并将计算结果传输至预测单元和失真处理单元;
所述预测单元对失真度计算单元传输的计算结果和回声消除单元传输的回声消除处理后的音频数据进行接收,将接收的计算结果与设定阈值进行对比,根据对比结果,以及音频数据的连续性,对对应麦克风音频数据失真前的数据值进行预测,并将预测结果传输至失真处理单元;
所述失真处理单元对预测单元传输的预测结果和失真度计算单元传输的计算结果进行接收,将接收的预测结果与数据库中的音频数据数据值进行匹配,基于匹配结果,结合接收的失真度计算结果,对失真的音频数据进行复原,并将失真复原后的音频数据传输至混音处理模块。
10.根据权利要求9所述的一种大数据的音频数据采集管理系统,其特征在于:所述系统通过数字音频矩阵处理器实现上述功能,所述数字音频矩阵处理器前面板依次设置有输入电平指示灯、电平数值显示屏、输出电平指示灯、状态指示灯和录播功能键,所述数字音频矩阵处理器后面板依次设置有电源插口、电源开关、以太网接口、恢复出厂配置按钮、通讯端口、模拟音频输入接口和模拟音频输出接口。
CN202211162087.3A 2022-09-23 2022-09-23 一种大数据的音频数据采集管理系统及方法 Active CN115579015B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211162087.3A CN115579015B (zh) 2022-09-23 2022-09-23 一种大数据的音频数据采集管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211162087.3A CN115579015B (zh) 2022-09-23 2022-09-23 一种大数据的音频数据采集管理系统及方法

Publications (2)

Publication Number Publication Date
CN115579015A true CN115579015A (zh) 2023-01-06
CN115579015B CN115579015B (zh) 2023-04-07

Family

ID=84581759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211162087.3A Active CN115579015B (zh) 2022-09-23 2022-09-23 一种大数据的音频数据采集管理系统及方法

Country Status (1)

Country Link
CN (1) CN115579015B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101133440A (zh) * 2004-11-23 2008-02-27 皇家艺术学院 用以改善声学环境的电子声音筛选和方法
CN105788582A (zh) * 2016-05-06 2016-07-20 深圳芯智汇科技有限公司 便携式卡拉ok音箱及其卡拉ok的方法
KR20170072783A (ko) * 2015-12-16 2017-06-27 한국전자통신연구원 다자간 회의 서비스에서의 채널 상태 적응형 오디오 믹싱 방법
CN107180642A (zh) * 2017-07-20 2017-09-19 北京华捷艾米科技有限公司 音频信号校正方法、装置及设备
CN113539286A (zh) * 2020-06-09 2021-10-22 深圳声临奇境人工智能有限公司 音频装置、音频系统和音频处理方法
CN113938746A (zh) * 2021-09-28 2022-01-14 广州华多网络科技有限公司 网络直播音频处理方法及其装置、设备、介质、产品
CN114974200A (zh) * 2022-07-13 2022-08-30 恩平市菲玛特电子科技有限公司 基于物联网的麦克风语音交互管理系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101133440A (zh) * 2004-11-23 2008-02-27 皇家艺术学院 用以改善声学环境的电子声音筛选和方法
KR20170072783A (ko) * 2015-12-16 2017-06-27 한국전자통신연구원 다자간 회의 서비스에서의 채널 상태 적응형 오디오 믹싱 방법
CN105788582A (zh) * 2016-05-06 2016-07-20 深圳芯智汇科技有限公司 便携式卡拉ok音箱及其卡拉ok的方法
CN107180642A (zh) * 2017-07-20 2017-09-19 北京华捷艾米科技有限公司 音频信号校正方法、装置及设备
CN113539286A (zh) * 2020-06-09 2021-10-22 深圳声临奇境人工智能有限公司 音频装置、音频系统和音频处理方法
CN113938746A (zh) * 2021-09-28 2022-01-14 广州华多网络科技有限公司 网络直播音频处理方法及其装置、设备、介质、产品
CN114974200A (zh) * 2022-07-13 2022-08-30 恩平市菲玛特电子科技有限公司 基于物联网的麦克风语音交互管理系统及方法

Also Published As

Publication number Publication date
CN115579015B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US10841432B2 (en) Echo delay tracking method and apparatus
CN111883156B (zh) 音频处理方法、装置、电子设备及存储介质
CN101087320B (zh) 声学回波消除器中检测回波路径变化的改进方法和装置
RU2420813C2 (ru) Повышение качества речи с использованием множества датчиков с помощью модели состояний речи
CN106164846A (zh) 音频信号处理
CN104158990A (zh) 用于处理音频信号的方法和音频接收电路
CN110995951B (zh) 基于双端发声检测的回声消除方法、装置及系统
CN109192214B (zh) 一种语音取号方法、存储介质和机器人
CN111583950B (zh) 一种音频处理方法、装置、电子设备及存储介质
CN111081246B (zh) 直播机器人唤醒方法、装置、电子设备及存储介质
CN102571147A (zh) 声音处理设备、方法和程序
CN109493883A (zh) 一种智能设备及其智能设备的音频时延计算方法和装置
CN111028855B (zh) 回声抑制方法、装置、设备及存储介质
CN110634496A (zh) 一种双讲检测方法、装置、计算机设备和存储介质
JP2024507916A (ja) オーディオ信号の処理方法、装置、電子機器、及びコンピュータプログラム
CN112289336A (zh) 音频信号处理方法和装置
CN115579015B (zh) 一种大数据的音频数据采集管理系统及方法
CN108540680B (zh) 讲话状态的切换方法及装置、通话系统
CN107979507A (zh) 一种数据传输方法、装置、设备及存储介质
CN106297816B (zh) 一种回声消除的非线性处理方法和装置及电子设备
CN113345459A (zh) 一种双讲状态的检测方法、装置、计算机设备及存储介质
CN110021289B (zh) 一种声音信号处理方法、装置及存储介质
CN110992975B (zh) 一种语音信号处理方法、装置及终端
CN115171703B (zh) 分布式语音唤醒方法和装置、存储介质及电子装置
CN104885437B (zh) 会议系统和用于会议系统中的语音激活的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant